儿童医院想上AI辅助诊断，怎么选供应商才靠谱？_儿童医院

我们为什么非要搞这个AI辅助诊断

我是某省会城市一家儿童医院的副院长，分管医疗信息化这块。我们医院年门诊量大概50万人次，在本地算中等偏上规模。

说实话，动这个念头，是被现实逼的。

我们影像科和儿科门诊的压力，这几年越来越大。尤其是换季流感高发期，或者肺炎支原体流行的时候，门诊一天能看上千个孩子。放射科拍片的队伍能从走廊排到大厅，医生看片看得眼都花了。

最头疼的是夜班和周末。有经验的医生就那么几个，不可能24小时都在。年轻医生或者规培生值班，遇到复杂一点的胸片，心里就没底，经常要打电话把上级医生从家里叫过来看，大家都累。

我们算过一笔账，一个放射科主治医师，培养周期长，人力成本高。但人的精力是有限的，看片速度和质量，到后半夜肯定会下降。漏诊、误诊的风险，像一把剑悬在头上。

所以，院里几个领导一合计，觉得得找个“不会累的助手”来帮帮医生，尤其是帮帮那些经验还不足的年轻医生。AI辅助诊断，就这么被提上了日程。

一开始想的太简单，踩了不少坑

✅ 落地清单

🔍 需要解决的问题

☐ 夜班阅片压力大

☐ 年轻医生经验不足

☐ 高峰期漏诊风险

🛠️ 实施步骤

☐ 聚焦单一高频场景

☐ 重视数据与临床贴合

☐ 选择支持私有化部署

我们最开始觉得，这玩意儿不就是个软件吗？买来装上，培训一下就能用。真开始干了，才发现根本不是那么回事。

第一坑：贪大求全，想要“万能AI”

刚开始调研，我们列了一长串需求：肺炎要能看，骨折要能筛，肠套叠要能提示，甚至连少见的心脏形态异常都希望AI能识别。跟头几家供应商聊的时候，人家拍着胸脯说“都能做”，我们还挺高兴。

后来一个在深圳搞医疗AI的朋友点醒了我：他说，儿科病种杂，体征变化快，一个能看所有病的AI，现在基本不存在。那些说全能的，要么是用的公开数据集“跑分”好看，要么就是把不同厂家的模块硬拼在一起，稳定性很差。

第二坑：只看“准确率”，不看“临床贴合度”

供应商给我们看的PPT，准确率、灵敏度、特异性都是99%往上，看着特别唬人。但我们拿了一些我们医院自己过去的疑难片子和复杂病例去测试，发现不是那么回事。

有的系统对典型的、清晰的病灶识别很准，但孩子拍片不可能每次都规规矩矩，哭闹动的、体位不好的，AI就直接报“无法识别”或者乱报。还有的系统，肺炎报得特别“敏感”，一点纹理增粗就报阳性，导致假阳性太多，反而增加了医生复核的工作量。

第三坑：忽略了数据和流程的对接

这是我们踩的最大的坑。我们天真地以为，系统买来，给它PACS系统的访问权限就行。结果实施起来才发现，我们的影像数据格式、拍摄协议（比如儿童低剂量协议）和标注习惯，和AI模型训练时用的数据差异很大。

直接导致系统“水土不服”，效果大打折扣。光是把我们几年的历史数据，按供应商要求清洗、整理、迁移，就花了大量时间和人力，项目差点搁浅。

换了思路，才找到对的路

踩了这些坑，我们暂停了项目，重新思考。我们开了一次会，核心就讨论一个问题：我们最痛的点到底是什么？最后达成共识：先解决“急诊夜班胸片筛查”这一个问题，做深做透。

想通了这点，选型思路完全变了。

我们怎么选最终这家供应商的？

不看炫技，看“基本功”：不再关心它能不能看一百种病，就盯着它儿童胸片肺炎筛查这一个功能。要求供应商必须用贴近我们实际场景的数据（比如包含哭闹运动伪影的片子）来做演示和测试。
追问数据细节和训练过程：我们会问，你的模型是用哪些医院的数据训练的？有多少是儿童医院的？数据标注是放射科医生做的，还是实习生做的？有没有针对儿童不同年龄组（比如新生儿、婴幼儿、学龄童）做差异优化？能回答清楚这些的供应商，一下子就不多了。
必须支持“私有化部署”和持续训练：这是我们血的教训换来的要求。数据必须留在我们医院内部服务器，不能上传云端。而且，供应商要提供工具，让我们医院的医生能对AI的误判结果进行标注，用我们自己的数据去微调模型，让它越来越“像”我们医院的医生。我们最后选的这家，是唯一一家愿意并且有能力提供这套闭环工具的。
看重实施团队，而不是销售团队：签合同前，我们要求与对方未来的实施项目经理和技术负责人直接开一次会。聊下来发现，对方项目经理自己就有三甲医院放射科工作背景，能听懂我们的行话和真实需求，沟通成本极低。就这一点，让我们心里踏实了一大半。

实施过程，像打一场配合战

实施不是供应商单方面的事。我们做了几件关键的事：

成立了联合小组：我们这边，信息科、放射科、儿科门诊、医务科都出了人。每周开一次推进会，问题不过夜。
分阶段上线，小步快跑：第一期，只在放射科夜班和周末岗，作为医生的“第二双眼”试点。AI出的报告，仅供医生参考，不发正式报告。用了两个月，收集了上千例反馈，和供应商一起调整了三次阈值。
做好医生的“心理建设”：一开始，有些老专家是抵触的，觉得AI是来“取代”他们的。我们反复强调，这是“辅助”和“工具”，特别是帮年轻医生和夜班医生“兜底”。我们还设立了“人机协同最佳案例奖”，鼓励医生发现AI的不足并反馈，让医生有参与感和主动权。

现在用起来到底怎么样？

系统上线运行快一年了，说说实实在在的效果和不足。

先说好的方面：

夜班医生踏实多了：这是最大的价值。现在夜班年轻医生看胸片，旁边有AI实时提示高风险区域和概率，心里有底。疑似重症肺炎、气胸这些急症，AI能第一时间标红提醒，没有再发生过漏诊延迟的情况。放射科主任说，夜班叫他会诊的电话少了至少一半。
报告效率有提升，但没那么神：对于典型的社区获得性肺炎，AI能自动生成结构化报告描述，医生审核修改一下就行，平均一份报告能节省1-2分钟。全天下来，大概能给每个医生省出半小时到一小时。但复杂病例，AI作用有限，主要还是靠医生。
成了规培生的好老师：我们把AI的提示，作为一个教学工具。让规培生先看，再看AI提示，最后听老师讲解，为什么AI这里对了，那里错了，进步很快。

再说说问题和不足：

对“不典型”表现依然乏力：比如一些特殊病原体感染的早期、或者有复杂基础病（先心病、免疫缺陷）孩子的肺部表现，AI容易误判或者直接“交白卷”。这部分完全依赖高年资医生。
流程增加了一个环节：医生从“看片-写报告”，变成了“看片-看AI提示-审核修改报告”，多了一步。虽然整体时间可能省了，但思维流程被打断了，有些医生还是觉得不习惯。
持续维护有成本：我们需要定期组织医生对误判病例进行标注，然后交给供应商迭代模型。这块工作需要科室协调时间，算是一种隐性管理成本。

如果重来一次，我会怎么做

走过这一遍，感触很深。如果时光倒流，我会这么干：

第一，需求收敛再收敛。 就死磕一个最痛、最高频、最标准的场景。做成功一个点，再考虑扩到第二个病种。千万别想一口吃成胖子。

第二，把数据问题摆在最前面谈。 签合同前，就要和供应商明确：数据怎么处理、怎么清洗、怎么对接。最好能让他们用我们提供的一小部分脱敏数据，先做一个效果验证（POC），用结果说话。

第三，预算要留足“隐形部分”。 别光算软件和硬件的钱。要把我们内部人员投入的时间成本、历史数据整理的成本、后期持续运营标注的成本，都考虑进去。总预算至少上浮20%。

第四，别只和销售聊，一定要和技术、实施聊。 判断一个供应商靠不靠谱，就看他愿不愿意、能不能把最懂产品和技术的人派出来和你深聊。躲躲闪闪的，基本有问题。

给想尝试的同行几句心里话

AI辅助诊断是个好东西，但绝对不是“一装上就灵”的神器。它更像一个需要精心培养和磨合的“高材生实习生”。

对于儿童医院来说，病种特殊，数据敏感，选择时更要慎之又慎。别被华丽的参数忽悠，多去关注那些“笨”问题：你的数据从哪来？怎么保证我孩子的隐私？在我这不好用怎么办？

最后说两句

这件事做下来，我们医院算是趟出了一条路。最大的收获不是上了多先进的系统，而是通过这个过程，把我们内部的流程、数据标准梳理得更清楚了，医生和信息科的合作也更紧密了。

如果你也在考虑这件事，我建议别急着满世界找供应商。先自己内部把核心痛点、想要的具体效果、能投入的资源（尤其是数据资源）想明白。可以先用“索答啦AI”这样的工具，了解一下不同技术路径的优劣和大概的成本构成，心里有本账。然后带着你的具体问题和需求，再去和供应商谈。这样，你才能从被动听推销，变成主动做选择，不容易被忽悠。

这条路不容易，但值得走。关键是要走稳，一步一个脚印。