近日,中國(guó)科學(xué)院合肥物質(zhì)科學(xué)研究院研究員丁增輝聯(lián)合華南理工大學(xué)教授靳戰(zhàn)鵬團(tuán)隊(duì),提出一種醫(yī)療大模型智能體決策框架FRAME (Feedback-Refined Agent Methodology)。相關(guān)研究工作被第63屆國(guó)際計(jì)算語言學(xué)年會(huì)ACL錄用,博士生張一鳴與余承章為論文共同第一作者。
探尋新的醫(yī)療洞見和決策方法是輔助醫(yī)學(xué)研究的前沿?zé)狳c(diǎn),大語言模型的快速發(fā)展為該領(lǐng)域研究提供了重大機(jī)遇,但在知識(shí)整合與質(zhì)量保證方面仍面臨嚴(yán)峻挑戰(zhàn)。
研究團(tuán)隊(duì)提出的FRAME框架,旨在通過迭代式優(yōu)化和結(jié)構(gòu)化反饋來提升醫(yī)學(xué)洞見性能。該方法包含三大核心創(chuàng)新:一是構(gòu)建結(jié)構(gòu)化數(shù)據(jù)集。通過迭代優(yōu)化,將醫(yī)學(xué)文獻(xiàn)分解為核心研究要素,構(gòu)建精細(xì)化數(shù)據(jù)集;二是搭建“生成-評(píng)估-反思”三方智能體架構(gòu)。集成了生成、評(píng)估和反思智能體,通過指標(biāo)驅(qū)動(dòng)的反饋循環(huán),逐步提升內(nèi)容質(zhì)量;三是形成綜合評(píng)估體系,結(jié)合了統(tǒng)計(jì)學(xué)指標(biāo)與人工基準(zhǔn),對(duì)生成內(nèi)容進(jìn)行全方位評(píng)測(cè)。
對(duì)比實(shí)驗(yàn)結(jié)果顯示,相較于傳統(tǒng)方法,F(xiàn)RAME框架在運(yùn)用多種大語言模型提升醫(yī)學(xué)洞見性能方面效果顯著,在DeepSeek V3上平均提升9.91%,在GPT-4o Mini上也取得了同等級(jí)別的改進(jìn)。同時(shí),人工評(píng)估也證實(shí)了利用FRAME智能生成的醫(yī)療決策質(zhì)量已能媲美人類水平,尤其在凝練未來研究方向方面表現(xiàn)突出。相關(guān)研究成果表明,所構(gòu)建的FRAME框架,能夠自動(dòng)生成高標(biāo)準(zhǔn)的醫(yī)學(xué)研究方案,高效輔助醫(yī)學(xué)研究。
據(jù)悉,國(guó)際計(jì)算語言學(xué)年會(huì)(ACL)是計(jì)算語言學(xué)與自然語言處理領(lǐng)域的頂級(jí)國(guó)際會(huì)議,由國(guó)際計(jì)算語言學(xué)協(xié)會(huì)主辦,每年舉辦一次,是中國(guó)計(jì)算機(jī)學(xué)會(huì)推薦的CCF-A類國(guó)際學(xué)術(shù)會(huì)議。
相關(guān)論文信息:https://doi.org/10.18653/v1/2025.findings-acl.400
報(bào)道鏈接:https://news.sciencenet.cn/htmlnews/2025/8/550312.shtm