2017年4月21日,由中国人工智能学会和亿欧主办的以“大数据、AI成为传统产业的新动力”为主题的“新科技·划时代”峰会在深圳市举行。本次峰会旨在集合学会、企业、政府之力,将AI和产业融合,提升企业效率和带动产业升级。
出席此次峰会的嘉宾包括将门CEO高欣欣、丰元创投李强、奇点汽车战略合作总监高华、亿欧网副总裁由天宇、智童时刻创始人郭长琛等。
浙江大学睿医人工智能研究中心主任吴健就“医疗大数据呼之欲出”发表了演讲,以下是吴健的主要观点提炼:
1、医学人工智能的现状与展望;
2、医学人工智能的目标;
3、人工智能与大数据;
以下为吴健就“医疗大数据呼之欲出”的演讲内容整理:
感谢大家,刚才看了亿欧制作的人工智能30人,心潮澎湃。
国家对医疗大数据的人工智能有非常多的政策,去年国务院常务会议通过了《健康医疗大数据应用发展的指导意见》,国务院常务会部署了医联体,并推出了人工智能辅助诊断的技术管理规范,以及人工智能辅助诊断的临床应用指标,再有是把四个科室独立出来了,对我们来说非常好。
医疗大数据呼之欲出。
大数据的中心,去年6月份已经批准了福建省、江苏省及福州、厦门、南京、常州六个省市作为试点。
3月分发布的健康医疗数据公司,四个国企,如中国电子,国开投,联通等四个国企来建设大数据公司,成为医疗大数据的产业国家队。
国家卫计委成立多个健康医疗大数据研究院,目前正在筹建当中。
已经开始进行数据共享的试点,京津冀三地一百多家医院。
医疗领域的痛点非常多。医疗需求的入口也非常的旺盛,从院前、中、后的服务,健康诊断的,健康维护的等等非常多的需求出现,当然这个当中也已经有大量的公司在满足大家的需求。
健康医疗入口非常多,从健康管理自诊,导诊,候诊等等都已经有大量的企业在里面。
互联网医疗在去年、前年两年的发展中迭代非常快,下面到智慧医疗还有一点点的距离。
人工智能的工具日新月异,昨天有一个爆炸性的新闻,百度把自己的无人驾驶车的整套工具,以及数据全部都公开出来,无异于出了一个原子弹,数百亿美元的研究投入就砸了没有了。
人工智能工具箱Caffe2今年刚刚发布,已经不再是在大的应用上做深度学习了,而是一些小的上面也可以做轻度学习。Tensorflow,也是今年发布了。还有MXnet,也是计算非常迅速的,还有微软的工具。前面的四个都是深度学习的框架。后面的CNTK是简单的机器学习上的应用。
这样的免费工具的大量出现,使得人工智能的门槛降低得非常非常多,大家自己随便都可以来玩一下。
在这样的市场下,我给大家讲三点:医学人工智能的领先,可能的展望,以及我们自己做的工作。
去年的12月份,google发了一篇文章,几乎可以做得比医生更高的水平,拿了12.8万的数据,每个图片都有多个医生来标注,最后测试的几千张图片里面也有医生的标注,最后发现可以比真实的医生做得更好一些。
今年2月份Nature杂志上刊登了一个文章,讲斯坦福大学的皮肤癌的诊断,拿了12.9万的皮肤病的数据,其中有正常的,也有一些有疾病的数据,做了以后,人工智能的蓝线击败了大部分的职业医生。
《科学》报道人工智能在心脏病预测上的应用,讲的是在Plos one上有一篇文章,机器可以预测有没有可能在近一段时间有心脏病的产生。
另外是新建并诊疗建议及监控,做得非常好的一个工作,用了千亿级的,只有400多张的影象,但是前面用大量的其他的正常的影像或者是其他疾病影像来做曲线,也是做得非常好。
脑瘤的术中快速诊断,用了新的技术可以适时的成像,用计算机快速的诊断,看看是不是有肿瘤,肿瘤的位置、大小等等。
神经假体的精确控制,4月份的一个报道,如果有肢体不健全的,他可能是装上义肢,之前很难分辨神经上的电流有什么样的动作,现在搞了50个传感器去搜集数据,然后进行分类,看最后到底这个电池是做一个什么样的运动。
Google使用人工智能程序检测组织切片乳腺癌,以及大小是什么。
中央台报道了人工智能三剑客,讲了浙江省人民亿元对肺结核的诊断。
看过学术界的工作之后再看看工业界在玩什么?
阿里健康今年在深圳这边做云栖大会上讲阿里在做B超的诊断。百度有一个医疗大脑,今年整个部门移到了人工智能的部门里面去,在对话方面是做得比较好的。腾讯投了五个赛道各自的第一名,先面的还有好大夫,丁香园等等,把每个赛道最牛B的企业带起来了。
IBM做机器人问答,在诊断方面也做了相当大的工作,虽然最近从解约出来,但是目前在医学人工智能方面还是做得最好的企业之一,技术非常先进,是我们努力赶超的对象。
Google做了非常多的东西,健康,眼镜等等,通过眼镜可以实时监控去糖的含量。
苹果也做了大量的产品,包括手机里面有一个APP是跟北京宣武医院的合作。
梅西,是一个比较大的医联体,大量的数据来分享。
梅奥,从诊所做到研究院,非常的神奇,做一些适时的研究支持,提供更有价值的实验室服务。
凯撒医疗,是一个HMO,也做得非常好,控制成本为出发点,让病人不生病,跟病人自己的目标也是非常相近的,可以做到非常健康,形成较为连续的健康档案,有利于治疗和慢性病管理。
约翰.霍普金斯,把不同的整合到一家系统里面去。
克利夫兰诊所,做各种各样的工具。
加州大学洛杉矶分校医学中心也非常好,做了一些心率衰竭方面的指数的算法。
CVS和Walk—in,两家最大的医疗机构,可以拿到大量的用户的药方和处方,通过IBM模型做分析,让客户正好的掌握自己的健康状况。
Berg,把新药研发缩短非常多的时间。
Nuance,国内有很多,做语音识别的,麦克风也卖得非常非常好,类似这样的还可以收集大量的医生的数据,医生做手术的过程,大量的数据记录进去,都可以通过一款产品,感受特别好,对于治疗领域来说,有很多东西只要讲一下,就马上已经给你补全了。
Inovalon,这家公司也是收集了大量的医疗数据,做医疗整个环节中的优化。
UpToDate也是把大量的医疗文献进行理解,可以告诉医生有什么样的疾病,有什么样的临床路径会比较好。
Practo,医疗的管理软件,主要是帮助病人预料医生,做精准的医患品牌以匹配。
Zocdoc,也是做精准的医患匹配,也是目前美国最大的医患匹配的平台。
Patientslikeme,也是做病患的相似分析,看看哪些比较相近,拿治疗方案为自己服务。
保险公司,他可以预测哪些病人在未来三个月之内会出院,对那些潜在的入院的人群进行提醒,像心脏病衰竭的祝愿率下降到40%到50%。
SkinVision,他是比较聚焦于黑色素瘤,需要连续拍摄多张影像来判断。在国内百度也是做过类似这样的工作。
Neurotrack,看一张新、旧图片之间的视体验改变的状况。
AliveCor,中风和心率衰竭的情况。
23andme,做基因检测的公司,基于个体和家庭的基因情况进行精准的健康管理处方。
Cloudera,是一家做大数据的公司,做云计算的公司,他在这里也是做了一些医疗的,配合大型的医院,集团,预测病人入院的时间,调整资源分配。
刚才已经看到了医学人工智能大概的现状。下面是一些展望。
医学人工智能的目标是让患者更了解自己,让医生更清楚患者,让医疗过程更加准确,医疗管理更加科学,第三方服务更加丰富。
用可视化的方式做一些简单的工具,让病人可以更加了解自己,让医生更加了解病人,通过多元的数据,相似的案例,个性化治疗方案的推进,让医生更了解患者,让医疗做得更精准,医学知识图谱,进行预测等等。人工智能做辅助的诊断,让医疗管理更加的科学,进行疾病的分析,疾病预测的趋势的分析,之前Google说它可以预测感冒流行,过两年之后又说不能预测感冒流行。
第三方服务更加丰富,有一个网站开放出来以后,当年的12月份出现了两百多家服务系统,比如说保险,所以我们认为第三方服务也会层出不穷。
对于我们来说做计算机的人怎么看?基本上是以检测量化,诊断评估,干预治疗作为换讯,我们基本上都在这里面。
可以做的是医学人工智能的辅助诊疗,比如说糖尿病的监测,类似于这样的辅助医生做一些工作。
人工智能和大数据,都会有人问是不是能够替代医生,是不是以后医生要下岗,我想医生还是会持续的提供服务,我们做的人工智能的工具,大数据的工具做出来以后,给一些医生提供帮助。
还有医学上的研究,比如说医生推荐,医生到底擅长什么样的,可以看医学文献知道谁可能在这个方面更牛一些,还可以做医院的,疾病的,相关用药的知识图谱。还有是做非结构化的,文本的数据,或者是影像的数据做结构化。健康的预测,比如说拿到了大量病人的体检数据,从的实体状态来预测明年大概会变成什么样,明年的保费要增加到多少。
再做大数据监管,看看有没有异常行为,看看有没有谁是去医保骗保的,或者是做运营的,对用户进行画像,把合适的产品、合适的服务推给合适的用户,再做一些量身定制,做一些报告,辅助政策制定,比如说什么样的药应该进医保,什么样的药不能进医保。
最后是我们自己做的工作。
眼低图慢病检测云服务,从机器视觉的角度做了一下工作,并且取得了一系列的专利,最后是找到跟主动相关的系统病变,看看有没有,最后告诉你是不是可能在近三年类发生。这个服务已经放到了阿里云上。
深度学习的工具上也做了一些类似的,比如说糖尿病视网膜病变分析,跟google去年干的事情是一样的,他因为拥有更好的数据,所以他是业界做得最好的。我们也是拿到了公开数据上来做的,目前是70%左右的敏感度。
做医生擅长的,一部分是区分他的论文在哪些方面有贡献,另外是这个方向上进行排序,经过多轮迭代以后,最后可以对医生比较精确,排序也比较好,做到传统次数上的排行差不多。
甲状腺结节良恶性的预测,通过一些数据看这个结节到底是不是恶性的,恶性的程度有多大,是不是马上需要进行手术。
下面还拿到了挂号预约平台上大概三个月左右的数据,建立一个流转的过程,也可能那些病人到了C医生手里,要么被治好,要么被挂掉,这个医生是不是更牛逼。看就诊流程的预测,红色的是气温,绿色的是PM2.5,看看相关性,是不是哮喘和气温相关,还是跟空气质量更有关系。
最后做疾病知识突破,对于TOP100的疾病来看,哪个疾病生了之后还有其他疾病的伴随,过了三年之后会不会有这样那样的疾病,这个也是让病人自己玩的。
浙大睿医研究中心是希望打造一个开放的平台,开放工具与数据,给大家使用。希望有更多的人一起加入到平台中来。
医学人工智能是非常好玩的领域,希望我们共襄盛举,谢谢大家。