首个医师考试满分AI诞生!超越GPT-5,医学版“谷歌”创造历史,使用量同比增长2000%!

AITNT
正文
资源拓展
首个医师考试满分AI诞生!超越GPT-5,医学版“谷歌”创造历史,使用量同比增长2000%!
2025-08-19 10:30

首个满分选手的出现,标志着AI医疗的又一个里程碑。


近日,美国初创公司OpenEvidence宣布,其开发的全新AI系统在美国医师执照考试(USMLE)中获得了100%的满分


这是史上首个获得满分的AI模型,超越了最新的GPT-5(97%)。


首个医师考试满分AI诞生!超越GPT-5,医学版“谷歌”创造历史,使用量同比增长2000%!


美国医师执照考试 (USMLE) 是所有在美国的医生都必须通过的一系列专业考试,共分为三级,旨在全面评估考生基础知识、应用技能和临床决策的能力,考核极为严格。


OpenEvidence的模型不仅能准确回答每个问题,还能提供答案背后的推理过程,并从《新英格兰医学杂志》(NEJM)等权威期刊中找到参考来源。


正是凭借这一能力,它在考试中发现了一个错误答案。随后,经由七位独立的医生审核,他们认同了AI的结论。


成立于2022年的OpenEvidence,已成为美国临床医生最主流的医学搜索引擎,其影响力覆盖全美10000多家医疗机构超过40%的美国医生每天都会使用


同时,公司通过广告获取收入,成功跑通了商业模式,预计其年度经常性收入(ARR)将达到5000万美元


今年7月,OpenEvidence获得2.1亿美元的B轮融资估值飙升至35亿美元(约合人民币251亿元)。 本轮由谷歌和凯鹏华盈共同领投,老股东红杉资本继续押注。


OpenEvidence正在重新定义一线医疗服务,它彻底改变了医生获取、评估和应用医学知识的传统模式。


01

医疗AI再升级,成为首个满分选手

2023年,OpenEvidence推出了首个在美国医师执照考试中取得90%以上分数的AI。

如今,公司的最新AI在考试中获得了满分,再次打破行业天花板。

面对全部325道题,OpenEvidence的模型均进行了准确回答,并给出了每个答案的解释,以及参考文献。


而能做到这一点,离不开公司过去半年的技术攻关,模型在推理性能上实现了显著提高。


OpenEvidence表示,其AI已经实现了“超高级医学推理”。


这意味着,模型不仅需要处理事实信息,更要深入分析这些事实背后的潜在因素,理解其深层含义,并在此基础上进行复杂推理。


正因如此,在高度考验推理决策能力、也令众多大模型头痛的Step 3(第三级别)中,OpenEvidence的表现惊艳。


首个医师考试满分AI诞生!超越GPT-5,医学版“谷歌”创造历史,使用量同比增长2000%!


尤其是,在Step 3的第125道题中,一位有长期重度吸烟史的患者计划联合使用尼古丁贴片与丁丙诺啡,需要评估该联合方案可能带来的额外风险。


标准答案是“没有增加的风险”,而OpenEvidence的AI基于FDA和美国心脏病学会的证据,认为联合疗法有增加高血压的风险。


在经过7名精神科专业医生的审核后,OpenEvidence的答案最终被证明是正确的。


这一现象揭示了AI的强大能力,尤其是在面对复杂、罕见或非常规病例时,AI可以帮助医生发现盲点,提高诊疗的安全性和准确性。


不仅如此,OpenEvidence还希望借助最新成果推动优质医学教育资源的普及,公司计划发布一系列创新的教育工具,支持医学培训和日常临床工作


未来,AI将不再仅仅是医生的工具,而是会成为他们亦师亦友的伙伴,这种更高层次的人机协作模式,将推动医疗水平的提升。


02

哈佛学霸,打造史上增长最快的医疗APP

OpenEvidence联合创始人Daniel Nadler是一名哈佛大学经济学博士,也是一位非常成功的连续创业者。


首个医师考试满分AI诞生!超越GPT-5,医学版“谷歌”创造历史,使用量同比增长2000%!


图:Daniel Nadler登上福布斯封面


2012年,Daniel Nadler创办了AI金融公司Kensho Technologies,推出了基于AI的金融智能分析平台,并迅速被高盛,摩根大通,美银美林等知名投行使用。


2018年3月,Kensho被标普全球(S&P Global)以5.5亿美元收购,创下当时华尔街最大AI公司并购纪录。


和之前的成功经验类似,Daniel Nadler再一次精准捕捉到了医疗领域的痛点。


在医学知识爆炸式增长的今天,医生们不仅要处理复杂的临床病例,还要面对海量涌现的新药、医学指南和研究论文,亟需更高效的工具来帮助决策


于是Nadler找到了牛津大学计算机博士Zachary Ziegler,共同创办了OpenEvidence,为医生群体免费提供AI驱动的专业诊断助手。


这款应用程序专为医生打造,其训练数据主要来自《新英格兰医学杂志》、《美国医学会杂志》等专业期刊以及经过同行评审的论文,从源头上减少了幻觉问题。


首个医师考试满分AI诞生!超越GPT-5,医学版“谷歌”创造历史,使用量同比增长2000%!


医生只需要输入患者的症状、检查结果和病史,OpenEvidence的AI便能迅速分析这些信息,并提供一个基于循证医学的建议。


每个诊断选项都附有详细的解释、相关的研究文献和最新的临床指南,帮助医生在短时间内获得全面且可靠的参考信息。


这种模式极大地提升了临床诊断的效率和准确性,让医生可以更专注于与患者的沟通和治疗方案的最终确定。


数据显示,在过去的一年中,OpenEvidence创造了医疗APP史上的增长神话。


2024年7月,平台每月支持的咨询量约为35.8万次。如今,平台的单日咨询量就已达到这一数字,月总咨询量更是突破850万次同比增长率高达惊人的2000%。


目前,美国已有40%的医生注册成为OpenEvidence的用户,且每月新增注册医师高达7.5万名。


公司预计,今年将有超过一亿美国人享受到由OpenEvidence赋能的医疗服务


03

医疗版谷歌,年收入3.5个亿

OpenEvidence正以一种全新的互联网商业模式,以前所未有的速度颠覆着医疗行业。


它巧妙地绕开了医疗行业固有的壁垒——繁琐的FDA审批和医院漫长复杂的采购流程。


通过直接面向医生个体,将他们视为“消费者”,OpenEvidence以卓越的产品体验赢得了医生的青睐与信任。


其商业模式并非传统的订阅制,而是效仿谷歌的广告模式。


公司首先通过提供高质量的AI工具吸引海量医生用户,并根据他们在使用过程中产生的数据和反馈,持续优化算法,提升产品价值。


在用户规模达到一定量级后,OpenEvidence开始为制药企业和医疗器械公司提供精准营销服务


面对美国每年高达300亿美元的医疗营销市场,公司提供了一种更具成本效益的全新渠道,让广告以更自然、更相关的方式触达医生,从而取代传统的药代和会议推广


首个医师考试满分AI诞生!超越GPT-5,医学版“谷歌”创造历史,使用量同比增长2000%!


凭借这一独特的模式,OpenEvidence预计年度经常性收入(ARR)将达到5000万美元,并继续保持高速增长的势头。


OpenEvidence的成功,为AI医疗树立了新的典范:不靠烧钱或强推,而是用真正好用的工具赢得医生信任,并基于庞大的用户基础完成流量变现,探索出一条可持续发展的商业模式。


文章来自于微信公众号“智药局”,作者是“子任”。



1
cursor

【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现,请参考教程进行配置。

视频教程:https://www.bilibili.com/video/BV1WTKge6E7u/

项目地址:https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file


2
AI医疗影像

【开源免费】MONAI是一个专注于医疗影像分析的深度学习框架,它可以让医院高效、准确地从医疗影像数据中提取有价值的信息,以辅助医生进行诊断和治疗。

项目地址:https://github.com/Project-MONAI/MONAI?tab=readme-ov-file

3
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

添加客服微信openai178,进AITNT官方交流群
IOS下载
安卓下载
微信群