《科创板日报》12月28日讯(编辑 宋子(zǐ)乔) 众多专(zhuān)业学科中,医学(xué)以难度(dù)强、压力(lì)大(dà)著称,但仍有无数人接受挑战,选择迎难而上,如今,AI也跑来和医学生“抢饭碗”。
当(dāng)地时间12月27日(rì),谷歌公布了(le)一个(gè)新的医疗AI模型“Med-PaLM”。在经(jīng)历一系列考(kǎo)核后,该模型被(bèi)证实“几乎(hū)达(dá)到”了人(rén)类医生的水平。
![]()
具体来看,研究团队准备(bèi)了一个医学问题问答数据(jù)集“MultiMedQA”,涵盖医学考试、医学(xué)研究和消费者(zhě)医学问题,该“题库”收集了(le)MedQA(USMLE,美国(guó)医师执照考试题),还引(yǐn)入了他们(men)自(zì)己的新数(shù)据集HealthSearchQA,它由搜索过的健康问(wèn)题组成。
该团队(duì)又(yòu)请来一组临床医生作答(dá)。这些临床医生分布于美(měi)国和英国,在初级保健、外科、内科和儿科方面具有专业经验(yàn)。
最后,研究(jiū)人员将模型和人类医生(shēng)的(de)答案匿名(míng)后交给9名分(fèn)别来自美国(guó)、英国和印度的(de)临床医生(shēng)进行评估。
结果显(xiǎn)示,Med-PaLM在科学常识方面(miàn)的正(zhèng)确率在92%以上(shàng),在理解、检索和推理能力方面,也几乎达(dá)到(dào)了人类医生(shēng)的水平,并(bìng)在克服(fú)隐性偏见(jiàn)方面略(luè)胜一筹。
不过,该研究(jiū)负责人也表示,Med-PaLM给出的答案在整体上仍然不如(rú)临床(chuáng)医生,该模型(xíng)在(zài)实际应用前有(yǒu)待进(jìn)一步完善。
追(zhuī)根溯源,Med-PaLM是怎么(me)诞生的呢?
这里不得不提谷歌在今年发布的转换器语言模(mó)型——PaLM,该模型基于Pathways架构、拥有(yǒu)5400亿参数,是Google迄(qì)今为止(zhǐ)研发的最大规模的(de)模型,全名为Pathways Language Model。
PaLM模型在语言理解等各种(zhǒng)方面的(de)评估测试中的表(biǎo)现十(shí)分出色,甚至还在语(yǔ)言和推理类(lèi)的测评中超过了人类。
Med-PaLM正是PaLM的(de)衍生品。谷歌(gē)研究团队首先在(zài)上文提(tí)及的医学问题问答(dá)数据(jù)集“MultiMedQA”上评估了PaLM及微(wēi)调变体Flan-PaLM,然后,基于(yú)此提出了(le)指令提(tí)示x调整(zhěng),让Flan-PaLM进一步与医学接轨,进一步产生(shēng)了Med-PaLM。
值得注(zhù)意的是,AI模(mó)型的每(měi)一(yī)次(cì)突破,都预(yù)示(shì)着更聪明的机器人即将(jiāng)到来(lái)。指挥机器人干活不是什么(me)新奇的事,但要让机(jī)器人能够理(lǐ)解你的(de)命(mìng)令背后的意图,那就(jiù)要考验它的“大脑”好不好用(yòng)了。将AI模型应用到机(jī)器人身上相当于给机器人(rén)“开(kāi)智(zhì)”。
据了解,今年8月份(fèn),谷(gǔ)歌就将大型语言模型首(shǒu)次集成到机(jī)器人中,有了AI模型的加持,机器人能像人类一样响(xiǎng)应完整的命令。
谷歌(gē)研究人(rén)员就此做了(le)演示。当对机器人说:“我饿(è)了,你能给我点零(líng)食吗?”机器人在自助餐厅中搜索一番后,打开了一个抽屉,找到一袋薯片并将它(tā)拿给(gěi)研究人(rén)员。
可(kě)以预(yù)见的是,通过进一步的训练、优(yōu)化,Med-PaLM模型的回答准确率将进一步提高,基于(yú)此模型的机器人医生也有望更快出现。