新京報(bào)訊(記者張璐)2025中關(guān)村論壇年會(huì)通用人工智能論壇3月29日舉行,會(huì)上重磅發(fā)布了北京通用人工智能研究院研究成果,全球首個(gè)通用智能人“通通”2.0升級(jí)迭代正式亮相。相較于“通通”1.0版本,“通通”2.0在語(yǔ)言、認(rèn)知、動(dòng)作、學(xué)習(xí)、情緒、交互方面實(shí)現(xiàn)了多種核心能力的升級(jí)。


3月29日,“通通”2.0在2025中關(guān)村論壇年會(huì)通用人工智能論壇上發(fā)布。新京報(bào)記者 張璐 攝


當(dāng)前,國(guó)內(nèi)外諸多大語(yǔ)言模型通過指令微調(diào)和強(qiáng)化學(xué)習(xí)下的人機(jī)價(jià)值對(duì)齊等技術(shù)手段,雖然能夠較好地完成人機(jī)多輪對(duì)話任務(wù),但此類對(duì)話更多的是圍繞用戶的需求及觀點(diǎn)進(jìn)行,本質(zhì)上缺乏自身相對(duì)連貫的價(jià)值觀、世界觀以及據(jù)此演繹出來(lái)的對(duì)話內(nèi)容。

 

“通通”2.0版本“塑造”了一個(gè)有自身價(jià)值觀、世界觀的小女孩,能夠?qū)崿F(xiàn)在理解對(duì)話目標(biāo)意圖的基礎(chǔ)上,遵循自身價(jià)值和人格,利用對(duì)話策略來(lái)引導(dǎo)對(duì)話的走向,從而達(dá)到自身目的。該版本在價(jià)值調(diào)控對(duì)話生成、消除模型幻覺、保持對(duì)話前后連貫性以及“言行一致”等方面取得突破。例如,當(dāng)媽媽要求“通通”睡覺,或者吃她不喜歡的食物時(shí),“通通”可以向媽媽耍賴,找理由磨蹭,并試圖要求媽媽給予獎(jiǎng)勵(lì),在多輪協(xié)商達(dá)成一致后才會(huì)實(shí)施對(duì)應(yīng)任務(wù)。

 

“通通”生活在高度仿真的復(fù)雜、動(dòng)態(tài)三維虛擬場(chǎng)景中,1.0版本的“通通”在任務(wù)執(zhí)行過程中,如果周圍環(huán)境在時(shí)刻發(fā)生變化,會(huì)導(dǎo)致她原本規(guī)劃的任務(wù)無(wú)法順利完成。但“通通”2.0可以實(shí)時(shí)響應(yīng)外界場(chǎng)景的變化,進(jìn)行反思和重新規(guī)劃,對(duì)已有任務(wù)進(jìn)行掛起、恢復(fù)、修改或取消等處理,同時(shí)動(dòng)態(tài)生成新的任務(wù)規(guī)劃,從而以更靈活、智能、多變的方式完成指令。

 

不僅如此,不同于當(dāng)前大語(yǔ)言模型普遍采用的離線數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)模式,“通通”在和場(chǎng)景交互(自主學(xué))及與人類的多模態(tài)對(duì)話(他人教)過程中,能動(dòng)態(tài)更新自身的知識(shí)庫(kù)、價(jià)值函數(shù)和技能,使其初步具備類人的持續(xù)反思和成長(zhǎng)能力。


例如,當(dāng)“通通”想打開空調(diào)時(shí),研究人員利用VR手多次改變遙控器位置,讓她無(wú)法輕易拿到。“通通”進(jìn)行了一系列嘗試,先是脫鞋上沙發(fā),然后再利用沙發(fā)上的靠墊,增加自身高度后最終拿到放在墻架上的遙控器;在按下遙控器,空調(diào)仍未打開時(shí),研究人員可以教導(dǎo)她“電器需要插上插頭才能使用”,“通通”在遵循教導(dǎo),成功打開空調(diào)的同時(shí),能夠更新自己的技能庫(kù),使得該項(xiàng)技能、知識(shí)被長(zhǎng)期存儲(chǔ)。

 

研究人員為“通通”打造了幼兒園、六口之家等多智能體場(chǎng)景,并在場(chǎng)景中設(shè)置了各自獨(dú)立,具備自身價(jià)值、能力、人設(shè)、狀態(tài)的多個(gè)智能體,使“通通”擁有了自己的家人和朋友。

 

在這種多智能體場(chǎng)景中,“通通”不僅需要理解周圍環(huán)境,還需要理解環(huán)境中其他智能體,識(shí)別他們的身份、性格、和自身的關(guān)系、彼此之間的關(guān)系、和物品的關(guān)系,以及當(dāng)前動(dòng)作、意圖、氣氛等,并在此基礎(chǔ)上進(jìn)行自身的任務(wù)規(guī)劃,包括發(fā)起和響應(yīng)對(duì)話,實(shí)施幫助、搗亂等復(fù)雜行為交互。

 

例如,“通通”在做任務(wù)遇到困難時(shí),能主動(dòng)開口尋求幫助,并解釋自己的困難;在和弟弟一起打掃房間時(shí),她會(huì)實(shí)時(shí)觀察弟弟,并根據(jù)弟弟的行為來(lái)調(diào)整自己的任務(wù)規(guī)劃,從而完成合作。

 

隨著“通通”的持續(xù)迭代,她的能力也在穩(wěn)步提升。目前,研究人員正利用認(rèn)知心理學(xué)定義的5-6歲兒童應(yīng)掌握的經(jīng)典任務(wù)對(duì)她進(jìn)行測(cè)試,“通通”已經(jīng)通過了多項(xiàng)綜合性強(qiáng)、復(fù)雜度高的任務(wù)考核。

 

未來(lái),“通通”將成為通用底座支撐各類垂直應(yīng)用場(chǎng)景,進(jìn)一步學(xué)習(xí)行業(yè)特定的知識(shí)和技能,形成千萬(wàn)個(gè)“通用智能人”賦能千行百業(yè),同時(shí)與具身智能機(jī)器人相結(jié)合,為智能制造、智慧城市、養(yǎng)老陪護(hù)、數(shù)字助理、家用機(jī)器人等領(lǐng)域帶來(lái)革命性變化,更好地服務(wù)居民日常生活。

 

編輯 劉夢(mèng)婕

校對(duì) 劉軍