数据分析与大数据处理(没有时间收集临床数据)
数据分析与大数据处理(没有时间收集临床数据)适用人群其中包括61 532张重症监护病房:成人患者为53 432例,新生儿患者为8 100例。数据跨度为2001年6月至2012年10月。包括人口统计学,生命体征,实验室测试,药物等。Nature上的一篇文献描述了该数据库形式。然后通知大家把所有病区的病例都分享公开可见,于是5个病区所有的医生都能看得见历年来5个病区所有的病例,这就是小型数据库的雏形。今天跟大家分享的是MIMIC重症监护数据库。MIMIC全称是Medical Information Mart for Intensive Care 是一个重症医学数据库。2003年,在NIH的资助下,来自贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center)、麻省理工(MIT)、牛津大学和麻省总医院(MGH)的急诊科医生、重症科医生、计算机科学专家等共同建立的一个数据库。
很多医生想通过挖掘临床数据库发表SCI,但是因时间精力有限等原因未能建立自己的专科数据库,或因一些病例数据资料过少,难以分析。不过我们身处于大数据时代,只要用心,数据的获取并不难。目前国内外已经有很多免费对外开放的大样本的临床数据库,只要通过一定的申请,就可以获得相应的数据。
而且,用临床数据库发文章最终是以论著形式发表,同样是单位认可的科研成果,无论是评职称还是毕业都能用得上!
公共数据库是如何形成的?
打个比方,科室主任发现一病区、二病区、三病区、四病区、五病区之间的数据彼此是割裂的,大家只能使用自己手头上的病例,很难形成一定规模的研究。
然后通知大家把所有病区的病例都分享公开可见,于是5个病区所有的医生都能看得见历年来5个病区所有的病例,这就是小型数据库的雏形。
今天跟大家分享的是MIMIC重症监护数据库。
MIMIC全称是Medical Information Mart for Intensive Care 是一个重症医学数据库。2003年,在NIH的资助下,来自贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center)、麻省理工(MIT)、牛津大学和麻省总医院(MGH)的急诊科医生、重症科医生、计算机科学专家等共同建立的一个数据库。
其中包括61 532张重症监护病房:成人患者为53 432例,新生儿患者为8 100例。数据跨度为2001年6月至2012年10月。包括人口统计学,生命体征,实验室测试,药物等。Nature上的一篇文献描述了该数据库形式。
适用人群
需要通过伦理考核,才可以获取访问权;通过后可免费下载。几乎覆盖所有科室的重症数据(ICU、脓毒症,心梗,新生儿,胰腺炎,还有呼吸衰竭,心脏术后,脑外术后,创伤患者等)
优点
数据价值高,十分详细,包括人口统计学、生命体征数据、实验室测试、影像数据和药物等。新版本还连接了社保数据库,记录患者的随访时间和预后结局。
医生可以根据自己的研究方向,查看公共数据库中的数据是否可以利用,具体的挖掘方式也可以对应掌握。
如何了解公共数据库可挖掘方向
自己的研究方向可不可以做数据库挖掘呢?已经有哪些方向被做过了,如何才能了解自己研究领域的基本情况呢?
以挖掘NHANES 临床数据库为例,比如想研究「阿兹海默」相关的内容,只需两步就可以了解目前的基本挖掘情况!
1:打开 PubMed 数据库,网址:https://pubmed.ncbi.nlm.nih.gov/
2:输入检索式:(NHANES[Title/Abstract]) AND(alzheimer[Title/Abstract])
看看检索结果,总共有 47篇文章,其他科室或方向只需替换关键词「alzheimer」,就可以了解基本情况和已经挖掘的方向有哪些了!
用(NHANES[Title/Abstract])这个检索式在 PubMed 数据库进行搜索,共有 8 357 个结果。
中国人发表仅 690 篇,说明这个数据库仍有很大空间尚待挖掘!
也可以用上面的方法搜搜 SEER 、MIMIC 以及其他数据库发表的文章量以及国人的发文量。
而且,不仅是PubMed数据库,其他平台的检索方法也可以按照关键词进行搜索查询,了解多个平台的发文情况,研究方向,挖掘范围!相信掌握这个方法,能够让你快速拿下N篇SCI!
有哪些值得推荐的公共数据库
公共数据库的信息就具有海量性、多方持有性、复杂性和安全性等特点。当数据库打通了数据地域、领域、时间跨度的壁垒后,基于临床、人群、基因和移动互联医疗数据库相结合的海量数据分析挖掘,将帮助科研人员获得更多、更准确的信息。共享、透明的数据来源不仅可以提高科研过程的透明度,也提高科研结果的可行度和可重复性。
SEER数据库
SEER数据库,即美国国家癌症研究所用来监测,统计流行病学和最终结果的癌症数据库, 官方网址:https://seer.cancer.gov/。
其内容包括:收录了美国约30%人口的癌症诊断、治疗和生存数据,在人群特征、病理、免疫组化、放化疗以及随访等多方面均有统计,以临床回顾性数据总结归纳。收录呼吸、消化、泌尿、生殖、血液等多系统及其它尚未明确类型的癌症统计(以肺癌,结、直肠癌,乳腺癌和前列腺癌为最全面)。
NHANES数据库
NHANES是比较知名的公共数据库,国家健康和营养检查调查 (NHANES,National Health and Nutrition Examination Survey) 是一项基于人群的横断面调查,旨在收集美国成人和儿童的健康和营养状况的信息,该调查的独特之处在于它结合了访谈和体检。该数据库包括Demog Data(人口统计学数据)、Dietary Data(饮食数据)、 Examination Data(检查数据)、Laboratory Data(实验室数据)、Questionnaire Data(问卷数据)、Limited Access Data(有限访问数据)。调查结果将用于确定主要疾病的患病率和疾病的风险因素,也是衡量身高、体重和血压等国家标准的基础。
公共数据库开展的研究具有用时周期短、速度快、研究价值高等特点,还有很多公开的数据库感兴趣的老师可以自行搜索。
【临度科研 · 公共数据库挖掘咨询服务】
专业团队
15 方案设计专家&30 统计分析专家,全程协助科研成果产出。
覆盖科室
我们有10 数据库平台资源,覆盖绝大多数科室方向,会根据您的科室及研究方向进行数据库匹配,可全程参与方向的确认与后续内容的把控!
数据真实
数据来源于国际权威数据库,原始数据打包交付。
周期可控
无需自己收集数据,研究效率极高,6-12个月可见产出。
临度科研数据库挖掘所使用到的数据库主要源于专门的科研数据开放平台,收集异源多维的健康医疗数据或科研数据,以结构化的形式存储,面向特定人群开放。目前临度数据库挖掘服务涵盖肿瘤科、呼吸科、眼科、药剂科、精神科、老年科、公共卫生等科室及领域,已帮助1000 医生通过公共数据库收获科研成果。