新研究发现 OpenAI 的 o1-preview AI 模型在诊断棘手医疗案例方面优于医生

如意雨

  IT之家 12 月 25 日消息,由哈佛医学院和斯坦福大学组成的科研团队,在医学诊断领域深入评估 OpenAI 的 o1-preview 模型,发现其比人类医生更擅长诊断棘手的医疗案例。

  根据研究报告,o1-preview 正确诊断了 78.3% 的测试案例,在 70 个特定案例的对比测试中,准确率更是高达 88.6%,显著优于其前身 GPT-4 的 72.9%。

  使用医学推理质量评估标准量表 R-IDEA,o1-preview 在 80 个案例中取得了 78 个满分。相比之下,经验丰富的医生仅在 28 个案例中获得满分,住院医生则仅为 16 例。

  在 25 位专家设计的复杂案例中,o1-preview 得分高达 86%,是使用 GPT-4 的医生(41%)和使用传统工具的医生(34%)的两倍多。

  研究人员承认该测试存在局限性,部分测试案例可能包含在 o1-preview 的训练数据中,且测试主要集中于系统单独工作,并未充分考虑其与人类医生协同工作的场景;此外 o1-preview 建议的诊断测试成本高昂,在实际应用中存在局限性。

  IT之家附上参考地址

  广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

版权声明:本页面内容旨在传播知识,为用户自行发布,若有侵权等问题请及时与本网联系,我们将第一时间处理。E-mail:284563525@qq.com

相关阅读

  • 红玫瑰送多少朵好(送妈妈红玫瑰多少朵合适?)
  • 苏铁属于什么植物(苏铁属于什么植物苏铁属于被子植物,裸子)
  • 香樟苗木规格(樟树种植几年才能卖?)
  • 龙爪迎春花的特点(虎蹄迎春花与龙爪迎春的区别)
  • 莫高股份(600543)12月25日主力资金净卖出630.51万元
  • 2023 年中国太阳能热发电行业发展现状分析
  • 新研究发现 OpenAI 的 o1-preview AI 模型在诊断棘手医疗案例方面优于医生
  • 国联水产:12月24日融资买入2487.98万元,融资融券余额3.41亿元
  • 浙江众成:12月24日融资买入413.31万元,融资融券余额2.43亿元
  • 中新赛克:12月24日融资买入452.97万元,融资融券余额2.88亿元
  • 阳光玫瑰葡萄苗(阳光玫瑰葡萄苗介绍?)
  • 杀鹅用松香有毒吗(用食用松香拔毛法律允许吗?)
  • 三色堇好养吗(盆栽三色堇的养殖方法)
  • 国色天香可以形容花吗(国色天香指的是什么花名阿?)
  • 阿拉丁:12月24日融资买入236.3万元,融资融券余额1.16亿元
  • 长辈生日送什么花有意义(长辈过生日送鲜花送什么花)
  • 长城汽车:12月24日融资买入2531.42万元,融资融券余额6.32亿元
  • 洒金珊瑚怎么养(洒金珊瑚能不能放在室内养)
  • 白果树叶能降血压吗(银杏树叶可以降血压吗)
  • 郁金香能活多久(郁金香是一种多年生植物)
  • 上证综指ETF:12月24日融资买入661.89万元,融资融券余额4528.53万元
  • 光大期货:12月25日矿钢煤焦日报
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码