据国外媒体报道,Google DeepMind 与多个机构合作,发布了一种名为 CoDoC(Complementarity-Driven Deferral to Clinical Workflow)的 AI 系统,旨在提升医疗 AI 诊断的可靠性和准确性。
该系统能够学习何时预测 AI 提供正确信息,并在需要时听从临床医生的建议。CoDoC 通过人工智能与人类的协作,探索了在医疗环境中提供最佳结果的方法。
在乳腺癌和结核病的筛查过程中,CoDoC 相对于单独依靠临床医生或 AI 基线,提高了准确性。在乳腺癌筛查方面,与英国筛查项目中的「双读仲裁」相比,CoDoC 将假阳性率降低了25%,同时减少了临床医生的工作量66%。
在结核病分类方面,与独立的人工智能和临床工作流程相比,CoDoC 将假阳性率降低了5-15%,在相同的假阴性率下取得了更好的效果。
为了提高现实世界中医疗 AI 模型的透明度和安全性,研究人员还在 GitHub 上开源了 CoDoC 的代码。该研究以「Enhancing the reliability and accuracy of AI-enabled diagnosis via complementarity-driven deferral to clinicians」为题,发表在《Nature Medicine》上。
CoDoC 的开发目标是让非机器学习专家(如医疗保健提供者)能够轻松部署和运行系统,并且只需相对较少的训练数据。该系统与任何专有的人工智能模型兼容,无需了解模型的内部工作原理或训练数据。
CoDoC 通过帮助预测性人工智能系统「知道何时不知道」来提高可靠性。它学习了预测 AI 模型与临床医生的解释相比的相对准确性,并根据预测 AI 的置信度分数进行决策。
在测试中,CoDoC 展现了其在乳腺癌和结核病诊断方面的潜力,通过与预测 AI 结合,获得了更高的准确性和效率。
然而,这项研究还存在一些局限性,例如需要增加更多的数据来训练系统,并且当前的临床实践还不允许基于人工智能的自主决策。未来,医疗保健供应商和制造商需要进一步解决这些问题,以确保负责任地开发医疗 AI 工具。
通过发布 CoDoC 系统,Google DeepMind 在提升医疗 AI 诊断可靠性和准确性方面取得了重要进展。这一研究为将人工智能与人类专业知识相结合的方法提供了新的思路,为医疗保健 AI 的发展开辟了新的可能性。
论文链接:https://www.nature.com/articles/s41591-023-02437-x%20
代码开源地址:https://github.com/deepmind/codoc
评论列表 (条)