我们为什么非要搞这个AI辅助诊断
我是某省会城市一家儿童医院的副院长,分管医疗信息化这块。我们医院年门诊量大概50万人次,在本地算中等偏上规模。
说实话,动这个念头,是被现实逼的。
我们影像科和儿科门诊的压力,这几年越来越大。尤其是换季流感高发期,或者肺炎支原体流行的时候,门诊一天能看上千个孩子。放射科拍片的队伍能从走廊排到大厅,医生看片看得眼都花了。
最头疼的是夜班和周末。有经验的医生就那么几个,不可能24小时都在。年轻医生或者规培生值班,遇到复杂一点的胸片,心里就没底,经常要打电话把上级医生从家里叫过来看,大家都累。
我们算过一笔账,一个放射科主治医师,培养周期长,人力成本高。但人的精力是有限的,看片速度和质量,到后半夜肯定会下降。漏诊、误诊的风险,像一把剑悬在头上。
所以,院里几个领导一合计,觉得得找个“不会累的助手”来帮帮医生,尤其是帮帮那些经验还不足的年轻医生。AI辅助诊断,就这么被提上了日程。
一开始想的太简单,踩了不少坑
✅ 落地清单
我们最开始觉得,这玩意儿不就是个软件吗?买来装上,培训一下就能用。真开始干了,才发现根本不是那么回事。
第一坑:贪大求全,想要“万能AI”
刚开始调研,我们列了一长串需求:肺炎要能看,骨折要能筛,肠套叠要能提示,甚至连少见的心脏形态异常都希望AI能识别。跟头几家供应商聊的时候,人家拍着胸脯说“都能做”,我们还挺高兴。
后来一个在深圳搞医疗AI的朋友点醒了我:他说,儿科病种杂,体征变化快,一个能看所有病的AI,现在基本不存在。那些说全能的,要么是用的公开数据集“跑分”好看,要么就是把不同厂家的模块硬拼在一起,稳定性很差。
第二坑:只看“准确率”,不看“临床贴合度”
供应商给我们看的PPT,准确率、灵敏度、特异性都是99%往上,看着特别唬人。但我们拿了一些我们医院自己过去的疑难片子和复杂病例去测试,发现不是那么回事。
有的系统对典型的、清晰的病灶识别很准,但孩子拍片不可能每次都规规矩矩,哭闹动的、体位不好的,AI就直接报“无法识别”或者乱报。还有的系统,肺炎报得特别“敏感”,一点纹理增粗就报阳性,导致假阳性太多,反而增加了医生复核的工作量。
第三坑:忽略了数据和流程的对接
这是我们踩的最大的坑。我们天真地以为,系统买来,给它PACS系统的访问权限就行。结果实施起来才发现,我们的影像数据格式、拍摄协议(比如儿童低剂量协议)和标注习惯,和AI模型训练时用的数据差异很大。
直接导致系统“水土不服”,效果大打折扣。光是把我们几年的历史数据,按供应商要求清洗、整理、迁移,就花了大量时间和人力,项目差点搁浅。
换了思路,才找到对的路
踩了这些坑,我们暂停了项目,重新思考。我们开了一次会,核心就讨论一个问题:我们最痛的点到底是什么?最后达成共识:先解决“急诊夜班胸片筛查”这一个问题,做深做透。
想通了这点,选型思路完全变了。
我们怎么选最终这家供应商的?
-
不看炫技,看“基本功”:不再关心它能不能看一百种病,就盯着它儿童胸片肺炎筛查这一个功能。要求供应商必须用贴近我们实际场景的数据(比如包含哭闹运动伪影的片子)来做演示和测试。
-
追问数据细节和训练过程:我们会问,你的模型是用哪些医院的数据训练的?有多少是儿童医院的?数据标注是放射科医生做的,还是实习生做的?有没有针对儿童不同年龄组(比如新生儿、婴幼儿、学龄童)做差异优化?能回答清楚这些的供应商,一下子就不多了。
-
必须支持“私有化部署”和持续训练:这是我们血的教训换来的要求。数据必须留在我们医院内部服务器,不能上传云端。而且,供应商要提供工具,让我们医院的医生能对AI的误判结果进行标注,用我们自己的数据去微调模型,让它越来越“像”我们医院的医生。我们最后选的这家,是唯一一家愿意并且有能力提供这套闭环工具的。
-
看重实施团队,而不是销售团队:签合同前,我们要求与对方未来的实施项目经理和技术负责人直接开一次会。聊下来发现,对方项目经理自己就有三甲医院放射科工作背景,能听懂我们的行话和真实需求,沟通成本极低。就这一点,让我们心里踏实了一大半。
实施过程,像打一场配合战
实施不是供应商单方面的事。我们做了几件关键的事:
-
成立了联合小组:我们这边,信息科、放射科、儿科门诊、医务科都出了人。每周开一次推进会,问题不过夜。
-
分阶段上线,小步快跑:第一期,只在放射科夜班和周末岗,作为医生的“第二双眼”试点。AI出的报告,仅供医生参考,不发正式报告。用了两个月,收集了上千例反馈,和供应商一起调整了三次阈值。
-
做好医生的“心理建设”:一开始,有些老专家是抵触的,觉得AI是来“取代”他们的。我们反复强调,这是“辅助”和“工具”,特别是帮年轻医生和夜班医生“兜底”。我们还设立了“人机协同最佳案例奖”,鼓励医生发现AI的不足并反馈,让医生有参与感和主动权。
现在用起来到底怎么样?
系统上线运行快一年了,说说实实在在的效果和不足。
先说好的方面:
-
夜班医生踏实多了:这是最大的价值。现在夜班年轻医生看胸片,旁边有AI实时提示高风险区域和概率,心里有底。疑似重症肺炎、气胸这些急症,AI能第一时间标红提醒,没有再发生过漏诊延迟的情况。放射科主任说,夜班叫他会诊的电话少了至少一半。
-
报告效率有提升,但没那么神:对于典型的社区获得性肺炎,AI能自动生成结构化报告描述,医生审核修改一下就行,平均一份报告能节省1-2分钟。全天下来,大概能给每个医生省出半小时到一小时。但复杂病例,AI作用有限,主要还是靠医生。
-
成了规培生的好老师:我们把AI的提示,作为一个教学工具。让规培生先看,再看AI提示,最后听老师讲解,为什么AI这里对了,那里错了,进步很快。
再说说问题和不足:
-
对“不典型”表现依然乏力:比如一些特殊病原体感染的早期、或者有复杂基础病(先心病、免疫缺陷)孩子的肺部表现,AI容易误判或者直接“交白卷”。这部分完全依赖高年资医生。
-
流程增加了一个环节:医生从“看片-写报告”,变成了“看片-看AI提示-审核修改报告”,多了一步。虽然整体时间可能省了,但思维流程被打断了,有些医生还是觉得不习惯。
-
持续维护有成本:我们需要定期组织医生对误判病例进行标注,然后交给供应商迭代模型。这块工作需要科室协调时间,算是一种隐性管理成本。
如果重来一次,我会怎么做
走过这一遍,感触很深。如果时光倒流,我会这么干:
第一,需求收敛再收敛。 就死磕一个最痛、最高频、最标准的场景。做成功一个点,再考虑扩到第二个病种。千万别想一口吃成胖子。
第二,把数据问题摆在最前面谈。 签合同前,就要和供应商明确:数据怎么处理、怎么清洗、怎么对接。最好能让他们用我们提供的一小部分脱敏数据,先做一个效果验证(POC),用结果说话。
第三,预算要留足“隐形部分”。 别光算软件和硬件的钱。要把我们内部人员投入的时间成本、历史数据整理的成本、后期持续运营标注的成本,都考虑进去。总预算至少上浮20%。
第四,别只和销售聊,一定要和技术、实施聊。 判断一个供应商靠不靠谱,就看他愿不愿意、能不能把最懂产品和技术的人派出来和你深聊。躲躲闪闪的,基本有问题。
给想尝试的同行几句心里话
AI辅助诊断是个好东西,但绝对不是“一装上就灵”的神器。它更像一个需要精心培养和磨合的“高材生实习生”。
对于儿童医院来说,病种特殊,数据敏感,选择时更要慎之又慎。别被华丽的参数忽悠,多去关注那些“笨”问题:你的数据从哪来?怎么保证我孩子的隐私?在我这不好用怎么办?
最后说两句
这件事做下来,我们医院算是趟出了一条路。最大的收获不是上了多先进的系统,而是通过这个过程,把我们内部的流程、数据标准梳理得更清楚了,医生和信息科的合作也更紧密了。
如果你也在考虑这件事,我建议别急着满世界找供应商。先自己内部把核心痛点、想要的具体效果、能投入的资源(尤其是数据资源)想明白。可以先用“索答啦AI”这样的工具,了解一下不同技术路径的优劣和大概的成本构成,心里有本账。然后带着你的具体问题和需求,再去和供应商谈。这样,你才能从被动听推销,变成主动做选择,不容易被忽悠。
这条路不容易,但值得走。关键是要走稳,一步一个脚印。