當(dāng)AI不斷用自己生成的數(shù)據(jù)“喂養(yǎng)”自己,它就可能逐漸失去準(zhǔn)確性,最終輸出越來(lái)越多錯(cuò)誤信息,甚至“胡言亂語(yǔ)”。英國(guó)倫敦國(guó)王學(xué)院領(lǐng)導(dǎo)的研究團(tuán)隊(duì)發(fā)現(xiàn),只需在訓(xùn)練過(guò)程中加入哪怕一條來(lái)自真實(shí)世界的數(shù)據(jù),就可能有效阻止這種被稱為“模型崩塌”的現(xiàn)象。相關(guān)成果發(fā)表于新一期《物理評(píng)論快報(bào)》。
“模型崩塌”這一概念于2024年提出,指的是AI模型如果長(zhǎng)期依賴自身生成的數(shù)據(jù)進(jìn)行訓(xùn)練,模型性能會(huì)不斷退化,最終輸出失真內(nèi)容。隨著高質(zhì)量人類文本數(shù)據(jù)逐漸接近枯竭,越來(lái)越多AI系統(tǒng)開(kāi)始使用合成數(shù)據(jù)訓(xùn)練,這讓模型崩塌風(fēng)險(xiǎn)進(jìn)一步上升。
此次,團(tuán)隊(duì)通過(guò)分析一類被稱為“指數(shù)族”的統(tǒng)計(jì)模型發(fā)現(xiàn),在封閉循環(huán)訓(xùn)練(模型完全依賴自身生成數(shù)據(jù)學(xué)習(xí))中,模型崩塌幾乎不可避免。
研究顯示,解決方法異常簡(jiǎn)單:只需在訓(xùn)練過(guò)程中加入一條來(lái)自外部世界的真實(shí)數(shù)據(jù),哪怕其數(shù)量遠(yuǎn)遠(yuǎn)少于AI生成數(shù)據(jù),也足以阻止模型性能持續(xù)退化,這種作用即使在機(jī)器生成數(shù)據(jù)數(shù)量無(wú)限增加時(shí)依然有效。
過(guò)去關(guān)于模型崩塌的研究多集中在大語(yǔ)言模型等復(fù)雜系統(tǒng),由于其內(nèi)部機(jī)制難以解釋,錯(cuò)誤來(lái)源也難以追蹤,這也成為AI產(chǎn)生“幻覺(jué)”的原因之一。通過(guò)研究更簡(jiǎn)單的統(tǒng)計(jì)模型,科學(xué)家能夠從數(shù)學(xué)上解釋為何少量真實(shí)數(shù)據(jù)就能打破模型崩塌,從而為未來(lái)更復(fù)雜AI系統(tǒng)提供設(shè)計(jì)原則。
類似現(xiàn)象也存在于另一類名為“受限玻爾茲曼機(jī)”的機(jī)器學(xué)習(xí)模型中,表明這一規(guī)律可能具有更廣泛適用性。下一步,他們計(jì)劃將這一理論擴(kuò)展到神經(jīng)網(wǎng)絡(luò)等更復(fù)雜的系統(tǒng),以驗(yàn)證其在大語(yǔ)言模型中的實(shí)際效果。
友情鏈接: 政府 高新園區(qū)合作媒體
Copyright 1999-2026 中國(guó)高新網(wǎng)chinahightech.com All Rights Reserved.京ICP備14033264號(hào)-5
電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證060344號(hào)主辦單位:《中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào)》社有限責(zé)任公司