我国的百川智能公司搞出了一个名叫Baichuan-M3的医疗大语言模型,并且把它给开源了。这个模型在国际上做了个很有名的HealthBench评测,结果比别人都高,特别是在那个叫HealthBench Hard的项目里,也拿下了第一。这事儿让大家对人工智能怎么帮到医疗健康又多了些想法。 王小川是这家公司的老板,他说以后医疗AI的主要作用是帮患者更好地做出决定,而不是完全代替医生。他认为人工智能在外面的健康咨询、慢性病管理和医学科普方面能派上大用场。 这次发布的Baichuan-M3有两个地方做得特别好。第一个是“幻觉率”很低。就是说它给出的答案不太容易错。因为在医疗这种风险很高的领域,信息准不准直接关系到人命。团队说他们不是靠事后检查来纠错,而是把医学事实融入到模型训练里去了。 第二个是它能像医生那样跟人对话。很多时候患者讲病情并不连贯,但这个模型能自己追问细节,把乱七八糟的话变成能用来推理的东西。数据显示它在这方面比以前的模型表现都好。 现在全球科技公司都在抢着搞专业领域的AI应用,特别是医疗这块。百川智能这次发的M3是前一代产品升级来的。他们用强化学习的方法持续改进训练系统,让模型在解决复杂医学推理问题上能力更强。 这种针对具体领域难题、不断迭代优化基础模型能力的做法值得学习。百川智能这次在国际评测中拿了第一,说明咱们国家在尖端技术上坚持自主创新是有成果的。把技术的焦点放在提高医疗服务的可及性、效率和安全上,同时管好应用的边界和责任主体,这才是推动人工智能在医疗里健康发展的关键。