程序员

注册

 

发新话题 回复该主题

一次用AI死磕癌症的实验 [复制链接]

1#

“想让癌症患者活得更长久、更体面。”

作者

苏霍伊

编辑

九月

今天的故事主角,是一名41岁的“业余”程序员姜浩。

姜浩本科在南京大学物理系,硕博就读于美国密歇根大学的核工程和放射科学系,毕业后,曾在布鲁克、西门子担任影像部门研发总监。年,家住威斯康星州的他,自掏腰包,在朋友中餐厅地下室研发了一个AI检测乳腺癌平台,从数据到算法模型训练,再到硬件配置,都由他一人完成。测试阶段还曾闹出一个乌龙,引得两名FBI上门搜查,误以为这是非法*博网站。

3个月后平台建成,对乳腺癌症检测的准确率达90%,姜浩将网站发布在V2EX社区(一个主要由设计师、程序员等组成的网络社区)供大家免费试用。出于对隐私的保护,姜浩并未设置后台保留影像数据,但他看到每天来自世界各地的上百个IP访问,有不少人也曾给他留言,用这个系统检测出了乳腺肿瘤。

姜浩(coolwulf)在V2EX社区发的关于AI乳腺癌检测的帖子

“我感觉所做的一切正在起作用。”姜浩对「甲子光年」说。而这只是一个开始,今年,他又开始尝试利用AI辅助放射治疗脑癌。

事实上,AI+医疗影像不算是一个新鲜话题。

自年AlphaGo战胜李世石后,AI在科技圈掀起创业热潮,创业者尝试将AI渗透在多个行业。其中,医疗影像是最重要的领域之一,基于深度学习框架的人工智能图像感知技术,可以实现对病灶的识别与标注、靶区的自动勾画与自适应放疗以及影像三维重建。

科技公司们也瞄准了医疗影像市场。比如,年,Google研发过一套用于乳腺癌诊断的AI系统,可快速分析大量的病理组织显微图像,肿瘤检出率高达92.4%;国内AI四小龙之一的依图科技曾推出AI癌症筛查工具,用以减轻放射科医生的工作量,提高诊断能力。据报道,年,中国AI医疗影像公司有55家,占AI医疗类公司的42%。

但直到今天,AI医疗影像照进现实的进程并非坦途。烧钱、医院难认可、数据隐私问题……这个领域同样面临着和其他AI商业化落地场景相似的困境。先前的一些明星企业也开始“断臂求生”,如IBM在兜售人工智能医疗诊断先驱WatsonHealth业务;依图为谋取上市,出售医疗业务等。

对更多普通人而言,绕了一大圈,用AI干预癌症治疗依然停留在科幻故事中。AI医疗被困在十字路口。

姜浩的AI医疗检测平台并不完美,但他自建平台和落地实践的过程是一个窗口,让我们可以了解一个AI医疗影像应用是如何诞生的、它的优势和局限是什么,以及这个技术又离真实生活有多远。

以下是姜浩的自述——

1.一个“老程序员”想用代码帮助癌症患者

年,我的一位南京大学学妹被查出罹患乳腺癌。由于发现时已是晚期,短短数月后,她留下一个4岁的孩子便撒手人寰,年仅34岁。

这并不是我第一次送别同龄友人。年,另一位好友因一种罕见的癌症——软组织肉瘤去世。作为医学物理师的他,在发觉腿部有肿块后迅速做了检查。但还是为时已晚,当时癌细胞已经转移到了肺部。软组织肉瘤折磨了他整整5年。癌症“吸食”着他身上的养分,他瘦得如同枯木。在人生的最后,他需要时时在身体后侧贴着胶带,因为皮肤会脱落,有时甚至会直接露出里面的骨头。

而癌症的痛苦不仅限于肉体,更在精神。最后一次和他见面时,他强撑着力气坐起来,和我挥手致意,像安慰,也像告别,曾经神采熠熠的脸庞挂满了憔悴。到今天,他挥手的样子仍时常冲击着我。

两位友人皆因癌英年早逝,让我十分痛心。这些情绪在我心里埋下了一颗种子,我想为他们、为千千万的癌症患者做些什么。

但我能做些什么?思考许久后,我决定从“本专业”和“非专业”入手。

我的专业是医学影像。我本科毕业于南京大学的物理系,博士毕业于密歇根大学核工程和放射科学系(DepartmentofNuclearEngineeringandRadiologicalSciences)。

年,姜浩在密西根大学做助教

进入密西根大学时还有一个小插曲。最早我在申请读博时,想从事医学物理方向的研究。但很不巧,我错过了物理系的申请截止日期。当时物理系的FredBecchetti教授便建议我申请还未截止报名的核工系。博士毕业后,我进入密西根大学的放射肿瘤学系(Departmentofradiationoncology)工作了很多年。

直到21世纪初期,医院还在用感光胶片为患者拍X光片。后来,我的导师LarryAntonuk发明了医学平板探测器,医院拍X光片,只需站在平板探测器前面照一下,电脑屏幕上便可及时显示结果。目前,这个设医院都有普及。

跟着LarryAntonuk教授从事医学平板探测器研究的我,也自此与癌症的检测与治疗结下不解之缘。

但在编程方面,我觉得自己是“非专业”的,因为我并不是计算机专业的科班出身。小时候太调皮,时不时就被老师请家长。于是我父母就合计着给“坐不住”的我培养个爱好,恰好我又对计算机很感兴趣。于是,9岁时我便加入了编程的兴趣班。

记得接触的第一台电脑是苹果II型电脑,我对眼前的“大方块”好奇极了。当时的电脑系统还是Basic语言系统,也没有互联网。我学习编程全靠刊登在计算机纸质杂志上的代码,一页一页地翻看,再一行一行地敲进电脑。如果想玩会游戏,也要“自食其力”,通常花上几个小时才能玩5分钟。所以,我算是一个起步很早的“老程序员”了。

其实报考大学时,我填写的第一志愿是计算机系。虽未能如愿进入,但本科四年间我选修了许多关于编程的课程。而后到年,互联网逐步普及。当时我已出国深造,在一个叫做安娜堡的城市。那里的冬天寒冷又漫长,闲来无事的我就想捣鼓一些开源软件。我还加入了MozilaFoundation的开源项目,和一群志同道合的网友相互学习、交流。其中,我们写过的、较为人熟知的项目有K-Meleon浏览器和火狐浏览器前身Pheonix等。

思考清楚这些后,“我能做什么”便逐渐有了轮廓。

因为学妹的离世,我专门搜集了乳腺癌的多方资料做研究。来自世界卫生组织的资料让我感到震惊和心痛:乳腺癌是全球发病率最高的恶性肿瘤。而且患者越年轻,病情越凶险,也越容易复发。如果在1期、2期时能及时发现乳腺癌,5年存活率可以达到99%;如果到3期和4期才发现,此时的治疗有效率仅为10%-30%。尤其在中国国内,乳腺癌的早期发现率不足20%,通过筛查发现的比例不足5%。”

世界卫生组织国际癌症研究机构(IARC)发布的年全球癌症新增病例

而且不少乳腺癌患者是由于缺乏检测途径,耽搁了最佳救治时期。于是我脑海中诞生了一个想法,建立一个帮助人们自行筛查用乳腺癌的系统——“AI看X光片”,即AI乳腺癌检测系统。

2.FBI登门调查“地下”服务器

年,这类项目基本上还没有个人在做,一切都需要从零开始。我计划用业余时间完成这项工作,从数据到模型训练再到硬件配置,前后花了三个月左右。有时忙不过来了,我就睡在办公室里。

虽然只有我自己在做,但整体过程还算顺利。我先列了一个todolist,然后一步一个脚印地攻克掉。最开始我每天都在读论文,相关领域的文章基本读遍了。从年底和年初,我尝试过许多不同的模型,对比之后,最终定下了基于何恺明RetinaNet修改的模型。

RetinaNet是一种One-StageRCNN类型的检测网络,基本结构由一个Backbone、多个子网及NMS后处理组成。该算法源自年何恺明的论文《FocalLossforDenseObjectDetection》。这篇论文曾获得ICCV的最佳学生论文奖(BestStudentPaperAward)。

充足的数据和强大的算力,是训练一个好的的深度学习(deeplearning)模型的基础。

幸运的是,我从佛罗里达大学获得了由自美国放射学委员会认证的放射科专家标注过的胸部医疗影像,只是这些数据因为年代久远,影像资料还都是胶片翻拍的,于是我先写了个程序将它们一张一张地转为AI可用形态。通过大量标注数据训练的深度学习模型,对医学影像的理解可达到人类专家的水平。

为了可以有更充分的数据训练模型,我还曾写邮件联系巴塞罗那大学的非公开资源——乳腺癌数据集,请求使用许可。

数据到位了,接下来就要解决算力问题。但普通电脑无法满足算力所需,而在乳腺癌检测项目启动的年底,市面上几乎没有GPU云端服务,所以我决定自掏腰包购买硬件设备。

当时正值虚拟币“挖矿”大火,一块几百美元的显卡被炒到美元,而且有价无货。为了不被显卡商家的网站“ban”(禁止),亲友都被我动员了起来,我们用多张信用卡,不停地蹲点、刷新网站,最终凑齐了50张Ti显卡。为了省钱,我和朋友自己还当起了木工,将用10美金收来的木料家具改成了机箱。这些花销加起来大约有5、6万美金。我很感谢我的妻子,从做网站到后期的维护等,时常需要高额的花销,但她一直都支持我的决定。

由于家庭的电路系统无法支撑50张显卡的电力,我找到一位开中餐馆的朋友,他听了我的想法后,二话没说答应把餐厅地下室借给我放置设备。改完电路后,我长舒一口气,AI乳腺癌检测网站的上线已经万事俱备了。

只是没想到这事闹出了“大乌龙”。一次来中餐厅检查卫生的工作人员无意间看到了服务器。几天后,四名警察和两名FBI工作人员便登门“造访”,认为我们有“违法开设地下*博网站”之嫌。经过好一番解释后,我们才洗清了嫌疑。

姜浩(左一)与中餐厅朋友在自制服务器前的合影

早先在阅读资料时,我注意到,国内的一线城市并不缺乏AI检测癌症等项目的落地,相比之下,更迫切需要AI癌症检测技术的是缺乏医疗资源的偏远地区。为了方便不同圈层的人使用,我将系统的操作步骤设计得很简单——用户只需上传自己的X光片,AI便会快速给出乳腺癌病情的诊断建议。

年4月,我正式开放了AI检测乳腺癌网站,以供人们免费检测。

为了评估它的效果,我在欧洲的InBreast数据库上做了测试,准确度达到90%。年,医院等曾拿我写的系统与在国际乳腺癌检测比赛中获奖的程序做对比,让它们在相同乳腺癌影像数据库上运行,结果后者显示漏了10个阳性案例,而再使用我的系统进行测试,只漏了一个阳性案例。

在此我想和各位读者强调一下——目前影像筛查不能替代医生。我写AI乳腺癌网站的出发点是希望可以帮助用户尽早地发现癌症病灶、及时就医。但它并不能%准确地判断女性是否患有乳腺癌,具体结果还请以医生的诊断为主。

当时出于隐私保护的考虑,我并未保留后台影像数据。所以我并不清楚具体有多少人使用过。几年前相关技术还尚未普及,所以我的项目算是个启蒙。但我收到很多患者的感谢邮件,并且有用户真的用它测出了乳腺肿瘤。

AI乳腺癌检测网站也引起了业内的

分享 转发
TOP
发新话题 回复该主题