机器学习预测乳腺癌属于什么模型(人工智能陆遥如何用人工智能提升乳腺癌诊断准确率)
机器学习预测乳腺癌属于什么模型(人工智能陆遥如何用人工智能提升乳腺癌诊断准确率)乳腺癌有三个典型的病灶,第一个是微钙化点,第二是肿块,第三是结构扭曲。我就基于钼钯图像的微钙化智能分析来介绍一下,人工智能到底在这里干什么事儿。首先对于微钙化点,在影像上的分布是非常大的,最基本有四种空间分布,实际上临床上分布有更多的异样性。我们跟传统的医生分析做一个对比,传统的医生分析,钼钯直接是医生肉眼去看。而我们去做的话,流程比原来多得多,包括预处理,这个就包括去噪、增强,然后把微钙化分析出来,检测出来做一个聚类,最后做一个假阳性的,最后把辅助诊断结果给到医生。另外乳腺癌是早期生存率非常高,但是10个得了乳腺癌的女性中有9个就要切除全乳房,这是非常残酷的事情。其实从临床的角度来看,乳腺癌是非常容易治愈的癌症。早期的时候,患者五年的生存率非常高,能达到85%以上,临床上,乳腺的钼钯是非常有效的检查方式,但是有一个缺点就是假阳性率非常高。现在临床上早期的诊断,不同的医院影像的质量不一样,
【编者按】
2017年12月23日-24日,中国人工智能学会主办的第七届吴文俊人工智能科学技术奖颁奖典礼暨2017中国人工智能产业年会在苏州举行。中山大学数据科学与计算机学院教授陆遥在会上作了题为“医学影像数据分析及应用新生”的演讲。
陆遥在演讲中强调,他反对人机大战,他认为把计算机技术放在医生的对立面,这会限制我们的应用。他说医生和多组学的结合,对癌症未来的治疗向个性化方向发展很重要。
以下是澎湃新闻(www.thepaper.cn)整理的陆遥教授的演讲实录:
陆遥
我简单介绍人工智能在医学影像分析的应用。首先从计算机辅助诊断谈起,在30多年前,计算机辅助诊断的领域就已经创建起来,人工智能就扮演了非常重要的角色,但是对于计算机辅助诊断这个领域,在2010年左右,我个人感觉这个领域已经接近,好处就是和计算机辅助相比,十年之前开始兴起的医学影像组学这方面的研究,影像更偏临床,我就把这个历史谈一下,再说一下我们的实践。
我本人一直做乳腺癌计算机辅助的研究,实际上在中国患乳腺癌有非常高的概率,基本上全球最高,并且以每年14%的速度增长。对于诊治乳腺癌,中国有一个特别麻烦的特点,特别年轻化,西方国家很少发现二十几岁的女性患有乳腺癌,但是中国有大量的二十几岁女性乳腺癌患者。
另外乳腺癌是早期生存率非常高,但是10个得了乳腺癌的女性中有9个就要切除全乳房,这是非常残酷的事情。其实从临床的角度来看,乳腺癌是非常容易治愈的癌症。早期的时候,患者五年的生存率非常高,能达到85%以上,临床上,乳腺的钼钯是非常有效的检查方式,但是有一个缺点就是假阳性率非常高。现在临床上早期的诊断,不同的医院影像的质量不一样,同时整个工作的流程也不一样,因此临床上医生的主观性是非常强的,这就导致了对这块的诊断有很高的误诊率。相比较而言,计算机辅助具有更好的客观性、稳定性、时效性,对于医生来说,乳腺的钼钯早晨去看,下午去看,诊断结果完全不一样,但是对于计算机辅助就没有这个问题。
乳腺癌有三个典型的病灶,第一个是微钙化点,第二是肿块,第三是结构扭曲。我就基于钼钯图像的微钙化智能分析来介绍一下,人工智能到底在这里干什么事儿。首先对于微钙化点,在影像上的分布是非常大的,最基本有四种空间分布,实际上临床上分布有更多的异样性。我们跟传统的医生分析做一个对比,传统的医生分析,钼钯直接是医生肉眼去看。而我们去做的话,流程比原来多得多,包括预处理,这个就包括去噪、增强,然后把微钙化分析出来,检测出来做一个聚类,最后做一个假阳性的,最后把辅助诊断结果给到医生。
这是我们整个设计,这是训练集和测试集的分布,预处理基本上首先会得到一个乳房的区域,其他方面我们会用多尺度增强方法把这个地方去噪和增强。我们会有出事的全局阈值,对分割区域进行区域生长和自适应局部阈值,这是通过学习出来的,我们本身做了迭代分割的算法,最后把这个区域分割出来做特征的提取。
在检测方面包括两块:一块是基于规则分类器,包括物理特征和临床特征,另外一块是深度卷积神经网络的分类,潜入到卷积神经网络里面去。
这是整个模型,在聚类这块,因为微钙化点跟一般的情况不一样,这个是很多小的微钙化点构成微钙化醋。为了简化这个微钙化醋,我们做了一个聚类的方法。我们实验的结果,数据通信网络得到的准确率基本达到500之后,说明稳定性就非常好了。
我们的训练集虽然比较小,但效果还是比较好的。训练集和页面集上的结果,在页面集基本上达到96%左右。可以看出,用深度卷积神经网络之后,最后可以把假阳性的点去掉,变成一个聚类。
这是最后聚类的结果,这块有不同参数的设置,第一组参数下面可以做到95%的灵敏度下面,每个图像会有0.92,另外一种参数下面,在灵敏度可以做到100%,但是我们假阳性率会损失一点,每个图像会有一个FPs(图像画面数)。
通过这块我们也发现,现在深度学习这一方面,基本上在乳腺癌微钙化检测这一块效果非常好。但是我们也发现,当数据增加到5000个左右没有提高,最主要的原因就是因为里面有很多的弱变性太强,人的肉眼很难分辨,连机器也非常难识别出来。
接下来我谈一下影像组学,从十年前兴起,一群人把这个工作用到临床上去,根据定义,实际上从输入和输出来说,组学和早期的计算机辅助一模一样的,都是从图像到图像,都是输入图像,但是输出的就完全不一样了,所以影像组学通过高通量的做一个事情,对临床做良性的诊断包括预测和愈后分析。我跟大家分享一下这两个领域的区别。计算机辅助与影像组学有三个区别,第一是数据量发生了变化,第二是特征空间维度发生了变化,第三是研究目标发生了根本的变化。
数据量来说,传统的CAD训练是100个左右,对于影像组学基本上是1000个病例,成像模式发生了变化。传统的计算机诊断就是10个不到的空间,但是在影像组学这一块,我们先做乳腺癌的话,如果是二维就有800多个特征,如果是三维就接近1000个特征。
另外一方面,从特征来说,传统的计算机辅助诊断用的比较多的就是灰度和几何特征,但是相等影像组学更多的偏向于纹理、告阶统计,更重要的是认知这一块的特征。
第三个也是最重要的区别就是整个研究目标发生了根本性变化。传统的计算机辅助干的事情就是良性的检测,其实更偏工科,但是对于影像组学,目标发生了非常大的变化,除了良性检测之外,更多是关注风险的预测和预后风险分析,这是临床医生非常困难的痛点。
影像组学包括五个过程,第一是根据人群特征做中心数据采集。第二是做分割,我们的数量非常大,传统的交互式的分割方法完全不可用,这种分割是低交互的。对于数据库和标准化是非常难的,多中心数据的标准化是令我们非常痛苦的一点。最后的分析和预测并不是很难的事情,基本上还是传统的计算机的模型在做。
最后谈一下影像组学的实践,这是我们团队做的基于乳腺癌的风险预测的工作。现在对诊断预防乳腺癌非常重要的一点,是有一些高风险的因子存在,从临床的角度知道乳腺密度是非常重要的因子。对于高风险,妇女的定义包括几种,我们根据Gail模型(目前最精确、最权威的乳腺癌评估模型)和Claus模型(乳腺癌诊断模型)来判断,如果这个人风险打分超过大于25%,我们就认为她是高风险的妇女。BRCA1的基因变异,或者家族里面谁带有BRCA基因的话,这种情况下我们认为是高风险的妇女。
我们做的时候发现有一些高风险因子可以长期存在,没有任何变化,但是突然半年内就得了乳腺癌。因此这个模型在临床上使用的时候缺陷也是非常大的,因此我们现在针对个性化的人体做风险的模型的预测。
我们基本上用的技术还是标准的计算机视觉和机器学习技术,长期跟踪临床的风险,并且我们把这些风险做更多的个性化设计。因此在这块我们做了一些人工智能自动分类的模型,对医生的帮助还是比较大的,可以比较好地降低现在临床上的不确定性,同时成功把人工智能应用在临床的风险预测里面去。
我们做的研究478例病例,找经验丰富的放射科医生去做定性的分析和打分,再与我们人工智能的模型进行对比。我们发现他们对BI-RADS的评估和我们PD的模型相关度非常高,可以达到9.82,我们的流程基本上也包括分割、分析和组学的建模。
这是个特征提取的工作,要提取灰度、几何、纹理、频域和临床组织几个方面的特征。然后我们做了一个特征降维,最后挑出73个放射组学的特征,去做交叉检验,对模型主要是两个模型,第一个是logistic回归,第二个是随机森林,我发现效果还比较好,根本就不用什么深度学习。我们跟医生的发现的吻合度非常高,我们Kappa达到了0.92,Kappa基本上超过0.8就是高度吻合了,0.92就是完全一致了。这个是我们做的随机森林的结果,Kappa是0.93。
这是我们最后的结论,用影像特征 乳腺密度特征能达到85%的准确率,与放射科医生评估结果的关联性非常好,未来我们要做一个独立的风险预测的模型,现在我们也在进行临床实验。
最后我总结一下,计算机辅助诊断是为医学工作的,我比较反对所谓的人机大战,把计算机技术放在医生的对立面,这会限制我们的应用。我们和多组学的结合,对癌症未来的治疗向个性化方向发展很重要。
(本文根据主办方提供速记整理,张余芳整理。未经演讲者审订)