科技日報(bào)南京1月13日電 (記者金鳳)13日,記者從南京農(nóng)業(yè)大學(xué)獲悉,該校主導(dǎo)研發(fā)出國內(nèi)首個(gè)面向通用農(nóng)業(yè)領(lǐng)域的開源垂直大語言模型“司農(nóng)”。
據(jù)悉,研究團(tuán)隊(duì)依托南京農(nóng)業(yè)大學(xué)學(xué)科優(yōu)勢,收集了包括動(dòng)物科學(xué)、農(nóng)業(yè)經(jīng)濟(jì)管理、農(nóng)業(yè)資源與環(huán)境、園藝學(xué)、智慧農(nóng)業(yè)、動(dòng)物醫(yī)學(xué)、植物保護(hù)、作物育種等學(xué)科數(shù)據(jù),涵蓋了近9000冊書籍、24萬余篇學(xué)術(shù)論文和近2萬份政策、標(biāo)準(zhǔn),構(gòu)建了體系相對完整的農(nóng)業(yè)基礎(chǔ)數(shù)據(jù)集。
針對大語言模型在專業(yè)領(lǐng)域應(yīng)用中常見的“幻覺問題”和知識滯后性,團(tuán)隊(duì)在模型訓(xùn)練階段,除微調(diào)傳統(tǒng)指令外,還引入了思維鏈和上下文參考等多維訓(xùn)練數(shù)據(jù),顯著提升了模型對于農(nóng)業(yè)專業(yè)知識的理解與生成能力。
針對文獻(xiàn)知識利用效率問題,研究團(tuán)隊(duì)推出多智能體檢索增強(qiáng)框架。該框架通過優(yōu)化知識庫構(gòu)建、智能查詢改寫、混合檢索等策略,使模型能夠精準(zhǔn)調(diào)用專業(yè)知識,保障了生成內(nèi)容的準(zhǔn)確性與時(shí)效性。
(責(zé)任編輯:蔡文斌)