澳门太阳城网站-最新注册

  • 各种新的诊断模型可以分析病人数据和实时的症状来预测患者是否考虑到业主的疾病。

    各种新的诊断模型可以分析病人数据和实时的症状来预测患者是否考虑到业主的疾病。

    全屏

以及计算机如何能连接到症状的疾病?

各种新的诊断模型可以分析病人数据和实时的症状来预测患者是否考虑到业主的疾病。

该地图根据患者的数据关系这些模型需要微调的一定条件下,研究表明。


记者联系

艾比abaz要么ius
电子邮件: abbya@mit.edu
电话:617-253-2709
澳门太阳城最新网站新闻办公室

一项新研究发现线粒体“健康知识图”,其中显示的症状和疾病之间的关系,并打算与临床诊断的帮助,可以功亏一篑的某些条件和患者人群。另外,研究结果表明途径来提高其性能。

通常,健康已被临床专家手动编译知识图,但也可以是一个艰苦的这一进程。最近,研究人员尝试与从患者数据,这些自动生成知识图。 MIT的研究小组已经-一直在研究如何办好了在不同的疾病和患者群体的这样的图。

在太平洋研讨会BIOCOMPUTING 2020提交了一份文件,评估的研究人员自动生成图形健康知识基于实际包括27名万多的数据集患者近200 770种多名疾病和症状。

分析团队如何使用的各种型号的电子健康记录(EHR)的数据,医疗和治疗史的患者含的,自动“学习”疾病症状的相关性的模式。他们发现,该模型表现特别不好的疾病,具有高百分比非常旧的或年轻患者,或者男性或女性患者比例很高 - 但是,选择正确的数据在正确的模式,以及其他修饰,可以提高提高性能。

这个概念是提供指导,研究人员之间的关系有关数据集的大小,型号规格,性能和使用时电子健康档案建立卫生知识图。这可能会导致更好的工具,以协助医疗决策和患者制定或寻找疾病和症状之间的新关系的医生。

“在过去的10年中,电子病历的使用已在医院暴涨,所以有,我们希望学会矿疾病 - 这些图症状的关系数据的大量的,”第一作者艾琳说。陈,一名研究生在电气工程和计算机科学(EECS)部门。 “这是至关重要的,我们仔细研究这些图形,使它们可以被用来作为诊断工具的第一步。”

陈在加盟纸是莫妮卡阿格拉瓦尔,研究生在澳门太阳城最新网站计算机科学和人工智能实验室(CSAIL);贝斯以色列女执事医疗中心的史蒂芬弘(BIDMC);和EECS教授大卫·桑塔格,谁是CSAIL的成员,并为工程和科学的医疗机构,临床机器学习组组长。

患者和疾病

健康知识图,有上百个节点,分别代表不同的疾病和症状。边缘(线)连接病节点,如“糖尿病”,与相关症状的节点,如“过度口渴。”众所周知,谷歌推出了其在2015年自己的版本,这是手动几个医生在数百小时的策划,被认为是黄金标准。当你现在谷歌的疾病,系统会显示相关的症状。

在2017年 科学性报告 纸,桑塔格,弘,从研究人员利用相同的270.00患者在他们的研究中的其他数据 - 来自于BIDMC急诊科来了2008年至2013年间 - 打造健康知识图。他们使用了三个模型结构,生成图表,叫回归,朴素贝叶斯,和嘈杂或。使用由谷歌提供的数据,自动生成的研究人员比较了他们的知识图形健康养生与谷歌的知识图谱(ghkg)的。研究人员的图形表现非常出色。

在他们的新工作中,研究人员做了严格的分析,以确定错误,患者和特定疾病的模型表现不佳。此外,他们还尝试用增强模型随着越来越多的数据,超出了急诊室。

在一项测试中,打破了他们的数据到的疾病和症状亚群。每个模型,他们在连接线和所有可能的疾病症状的看着,而ghkg相比这一点。在纸,它们的排序结果到50自下而上和顶部进行50种疾病。低绩效的例子是多囊卵巢综合征(影响妇女),过敏性哮喘(很少见),和前列腺癌(影响主要是老年男性)。高表演者更常见的疾病和病症,如心脏心律失常和足底筋膜炎,这是组织沿着脚肿胀。

他们发现该模型是嘈杂或对错误的最强大的整体所有疾病几乎和病人。精度下降,但在所有车型的患者有许多共同发生疾病和共同发生的症状,以及患者很年轻即或85岁。对患者人群也遭受了性能与任何极高或极低百分比以上性。

本质上,研究人员推测,业绩不佳是由病人和疾病有异常预测性能,以及潜在的混杂因素不可测量引起的。老年患者,例如,往往会进入医院随着越来越多的疾病和相关症状比年轻患者。这意味着它很难为模特关联特定疾病的特异性症状,真说。 “同样的,”她补充道,“年轻的患者并没有很多很多的疾病或症状,如果他们有一种罕见的疾病或症状,但它不存在于正常的方式模型理解。”

拆分数据

研究人员还收集了更多的病人数据,并创建了不同粒度的三种不同的数据集,看看这可能会提高性能。在原始分析中使用的27万人次,全电子病历研究人员提取患者140.804历史上独一无二的,回溯十年,从各种来源周围740万总注释,如医生的笔记。

数据集中创建过程的选择影响性能模型为好。每个140400个患者历史作为一个数据点的每个的数据集的聚集体之一。另一数据集对待每个7400000个注释作为一个单独的数据点。一端创建为每一个病人“情节”,定义了一系列的往来不断,不超过30天的休息的,产生大约140万集的总计。

直观,数据集在哪里,因为整个病史的完整的病人历史记录汇总到一个数据点导致更高的精度应该是考虑。违反直觉,但是,它也引起了朴素贝叶斯模型的效果要差一些疾病。 “你假定intrapatient更多信息,更好地与机器学习模型。这些模型,但取决于你给他们的数据的粒度,“陈先生说。 “模型的使用类型可以得到不堪重负。”

正如所料,喂人口统计信息模型可以有效简单的过去。例如,可以使用模型来排除所有的信息,对于男性患者说,预测宫颈癌。某些疾病更为常见的老年患者可以在年轻患者被淘汰。

但是,在另外一个惊喜,人口信息并未提振性能最成功的模式,所以收集数据,可能是不必要的。这很重要,真说,因为编纂的数据资料和训练模式可以是昂贵和费时。然而,根据型号不同,数据的使用分数可能会提高性能卫生组织没有。

接下来,研究人员希望利用构建他们的研究结果稳健的模型在临床环境进行部署。目前,可以学习的症状和疾病,但之间的健康知识曲线关系不给从症状疾病的直接预测。 “我们希望任何预测模型以及任何医学知识图将根据压力测试和临床医生提出让机器学习可以自信地说,研究人员,‘我们相信这是一个有用的诊断工具’,”陈先生说。


主题: 研究, 计算机科学与技术, 算法, 机器学习, 健康, 卫生保健, 疾病, 医学, 学院为医学工程和科学器(IME), 计算机科学和人工智能实验室(CSAIL), Electrical Engineering & Computer Science (eecs), 工程学院

回到顶部