4月13日,人形機(jī)器人半程馬拉松將在北京亦莊鳴槍開跑。當(dāng)機(jī)器人像人一起走上運(yùn)動(dòng)賽場(chǎng)、走進(jìn)工廠開啟“職業(yè)生涯”、走上舞臺(tái)開啟首秀,公眾對(duì)人形機(jī)器人的發(fā)展充滿更多期待。與此同時(shí),研究者們正加大對(duì)人形機(jī)器人情感、視覺、觸覺等領(lǐng)域的大模型研發(fā),為人形機(jī)器人走進(jìn)家庭、醫(yī)療機(jī)構(gòu)等服務(wù)場(chǎng)景提供可能。

 

讓機(jī)械臂像人一樣“溫柔”地傳遞物體

 

當(dāng)機(jī)器人能夠?qū)θ祟惖那楦凶龀稣_反饋,并給足情緒價(jià)值時(shí),人類也許會(huì)真正擁有一位新朋友。北京大學(xué)計(jì)算機(jī)學(xué)院情感與認(rèn)知智能機(jī)器人實(shí)驗(yàn)室主任、研究員王韜帶領(lǐng)團(tuán)隊(duì)成員為具身智能研發(fā)情感大模型,讓機(jī)器人對(duì)人類情感進(jìn)行正確反應(yīng)。

 

走進(jìn)實(shí)驗(yàn)室,仿佛走進(jìn)機(jī)器人的訓(xùn)練營,這里不僅有網(wǎng)紅機(jī)器人“天軼”、在蛇年春晚上大放異彩的宇樹機(jī)器人,還有實(shí)驗(yàn)室自主研發(fā)的機(jī)器人算算、小翅膀等。


北京大學(xué)計(jì)算機(jī)學(xué)院情感與認(rèn)知智能機(jī)器人實(shí)驗(yàn)室,王韜與搭載了具身智能情感大模型的機(jī)器人“算算”交流。新京報(bào)記者 王巍 攝


為了更好地訓(xùn)練機(jī)器人具備交互能力,王韜在實(shí)驗(yàn)室里設(shè)置了一間交互實(shí)驗(yàn)區(qū)。這里用綠幕圍起來,四周放置了兩組布藝沙發(fā)、一臺(tái)咖啡機(jī)和一臺(tái)洗衣機(jī),“演員”是固定在場(chǎng)地中央可移動(dòng)機(jī)器人骨架上的一條機(jī)械臂。記者嘗試隨意坐在沙發(fā)的任意區(qū)域,或者站立、蹲下,機(jī)械臂都可以將咖啡杯“溫柔”地遞到記者手上。

 

機(jī)械臂的傳遞動(dòng)作更像人的動(dòng)作,而且它能根據(jù)記者的位置遞送咖啡杯。王韜說,經(jīng)過“特訓(xùn)”,機(jī)械臂可以避免奇怪的行為和動(dòng)作,“我們希望未來走進(jìn)家庭的機(jī)器人主動(dòng)、自然地向人類傳遞東西,而不是像現(xiàn)在的很多機(jī)器人一樣,被動(dòng)地站在那里等待人類從它手中取走東西。”

 

王韜介紹,交互實(shí)驗(yàn)區(qū)有三項(xiàng)實(shí)驗(yàn)任務(wù),一是機(jī)器人與人的非接觸式交互,比如人向機(jī)器人打招呼,機(jī)器人如何回應(yīng)。二是人與機(jī)器人通過物體交互,比如遞杯子,“機(jī)器人發(fā)現(xiàn)人在什么情況下需要杯子,如何更自然地將杯子交給人;人拿到什么程度,機(jī)器人應(yīng)該放手。”

 

三是機(jī)器人與人有物理交互。舉例來說,兩個(gè)人見面握手時(shí),握手的力度、方向、高度以及手的上下晃動(dòng)都非常自然,互相能夠感受到對(duì)方的真誠。但在現(xiàn)階段,機(jī)器人與人的握手顯得“笨拙”,多為機(jī)器人將手伸到固定的高度和位置,人再伸手與其握手,但這樣的握手生硬,且機(jī)器人的握手力度是固定的。

 

“在科幻片里,機(jī)器人與人擁抱,機(jī)器人溫暖地拍一拍人的頭,現(xiàn)階段,這樣的場(chǎng)景如果發(fā)生在現(xiàn)實(shí)生活中,會(huì)非常危險(xiǎn)?!蓖蹴w解釋說,目前,機(jī)器人不知道用什么力度擁抱人類,擁抱得太輕顯得刻板、僵硬,擁抱力度過大則可能對(duì)人類造成傷害。因此,王韜和團(tuán)隊(duì)的研究方向正是通過多次訓(xùn)練,讓機(jī)器人與人的交互更具溫度和感情。

 

讓機(jī)器人擺脫遙控器

 

“算算”是王韜團(tuán)隊(duì)自主研發(fā)的一款搭載了具身智能情感大模型的機(jī)器人,它的觀察十分細(xì)致,能在與人聊天的過程中實(shí)時(shí)檢測(cè)人的表情/微表情以及心率變化,識(shí)別人的注意力情況,還能分析人的人格性格特性,提供更具針對(duì)性的情感互動(dòng)。

 

比如,當(dāng)研究人員和算算“吐槽”工作壓力大、心情焦慮時(shí),算算認(rèn)真詢問研究人員的工作情況、觀察他的各種狀態(tài),并給出暖心回應(yīng):“你近期有焦慮情緒很正常,這是身體在提醒你要多關(guān)照自己……”王韜說,讓機(jī)器人具備察言觀色的能力,需要以情感和認(rèn)知技術(shù)作為支撐?!拔覀冄邪l(fā)情感認(rèn)知技術(shù)或模型的目的,是讓機(jī)器人變得更聰明、更有情商,更好地為人服務(wù)。機(jī)器人最終需要服務(wù)人,要實(shí)現(xiàn)這一目標(biāo),情感和認(rèn)知技術(shù)無法回避?!?/p>

 

實(shí)驗(yàn)室里還有各種各樣機(jī)器人廠家提供的遙控器,它們是機(jī)器人“入營”前的標(biāo)配。“入營”訓(xùn)練后,機(jī)器人將擺脫遙控器,根據(jù)任務(wù)需求,自主、智能地移動(dòng),還可以通過“聽”或“看”跟著人走,這些都為機(jī)器人走進(jìn)家庭奠定基礎(chǔ)。

 

以“天軼”為例,“天軼”不僅能聽從指令自行移動(dòng)到指定地點(diǎn),還能進(jìn)行跟隨行動(dòng)——只見研究人員拿出印有二維碼的小旗,接收到出發(fā)指令的“天軼”會(huì)“看”著小旗前進(jìn),還能完成躲避障礙物、轉(zhuǎn)彎等動(dòng)作。不久前,研究人員還將“天軼”帶出實(shí)驗(yàn)室,在校園里溜達(dá)。“現(xiàn)在機(jī)器人還是跟著二維碼小旗,很快它就能不用看二維碼,直接跟著小旗走了。”王韜介紹。

 

不過,“天軼”也有淘氣的時(shí)候。記者采訪時(shí),“天軼”在沒收到指令也沒有標(biāo)志小旗的情況下,自顧自地在實(shí)驗(yàn)室里溜達(dá)起來,還避讓了其他機(jī)器人。見此情景,王韜笑著提醒同事:“大家檢查下原因,我們不僅要知道怎么讓機(jī)器人擺脫遙控器,也要知道它意外自主運(yùn)動(dòng)的原因?!?/p>

 

追問1:具身智能發(fā)展面臨哪些瓶頸?

 

擁有更接近人類情感、思維的人形機(jī)器人何時(shí)能走進(jìn)千家萬戶?專家學(xué)者就此分享了各自的觀點(diǎn)。

 

上海交通大學(xué)力學(xué)系副教授馬道林認(rèn)為,目前具身智能行業(yè)處于早期發(fā)展階段,“實(shí)驗(yàn)室研究已經(jīng)能夠向工程落地遷移,不過并未完備地解決工程落地面臨的全部問題。”如果以人的成長(zhǎng)來類比人形機(jī)器人的發(fā)展,馬道林認(rèn)為,現(xiàn)階段有些人形機(jī)器已經(jīng)站起來學(xué)會(huì)走,但有的走不穩(wěn),有的還不會(huì)跑,“整體來看,人形機(jī)器人還是一兩歲的小孩子?!?/p>

 

北京大學(xué)計(jì)算機(jī)學(xué)院前沿計(jì)算研究中心助理教授、研究員董豪認(rèn)為,具身智能的“大腦”已經(jīng)是中學(xué)生甚至大學(xué)生水平,“具身智能能夠用海量的互聯(lián)網(wǎng)數(shù)據(jù)來訓(xùn)練‘大腦’,但其‘小腦’訓(xùn)練不足,尚處于嬰兒時(shí)期?!?/p>

 

日前,北京人形機(jī)器人創(chuàng)新中心發(fā)布了全球首個(gè)通用具身智能平臺(tái)——慧思開物。在當(dāng)天的發(fā)布會(huì)上,創(chuàng)新中心總經(jīng)理熊友軍表示,具身智能行業(yè)發(fā)展面臨瓶頸和制約。

 

第一個(gè)瓶頸體現(xiàn)在本體性能方面。“目前有的機(jī)器人移動(dòng)能力較差,速度較慢,只適合在平地或有限的環(huán)境中運(yùn)行?!边€有的機(jī)器人可靠性和穩(wěn)定性較差。“我們經(jīng)常看到機(jī)器人可以跳舞、表演,但是要真正讓它長(zhǎng)時(shí)間可靠運(yùn)行,比如跑馬拉松,可能會(huì)面臨關(guān)節(jié)發(fā)熱、摔倒等平時(shí)想不到的問題,這些都是本體性能不完善的體現(xiàn)?!?/p>

 

第二個(gè)瓶頸是具身智能數(shù)據(jù)的缺乏,尤其是高質(zhì)量具體數(shù)據(jù)。第三個(gè)瓶頸是機(jī)器人泛化能力較低。也就是說,機(jī)器人或具身智能在單一環(huán)境、任務(wù)中有較好的表現(xiàn)力,但是若環(huán)境發(fā)生變化,比如從商業(yè)環(huán)境轉(zhuǎn)變?yōu)榧彝セ蚬I(yè)環(huán)境,機(jī)器人可能會(huì)遇上新問題。

 

針對(duì)上述問題,北京人形機(jī)器人創(chuàng)新中心推出一系列解決方案,比如發(fā)布通用機(jī)器人平臺(tái)——天工,并對(duì)架構(gòu)體系進(jìn)行多次升級(jí)迭代。在數(shù)據(jù)稀缺方面,創(chuàng)新中心發(fā)布了首個(gè)具身智能數(shù)據(jù)集方案,計(jì)劃建立人形機(jī)器人世界上規(guī)模最大、信息最稠密、最通用的高質(zhì)量具身智能數(shù)據(jù)集。

 

追問2:服務(wù)家庭,人形機(jī)器人還要具備哪些技能?

 

目前,已有越來越多的人形機(jī)器人到工廠“打工”,多臺(tái)、多場(chǎng)景、多任務(wù)的人形機(jī)器人協(xié)同實(shí)訓(xùn)展開,將推動(dòng)工業(yè)人形機(jī)器人從單機(jī)自主向群體智能進(jìn)化。工作場(chǎng)景從工廠轉(zhuǎn)向家庭,人形機(jī)器人還需邁過哪些門檻?

 

王韜認(rèn)為,目前人形機(jī)器人的運(yùn)動(dòng)、控制能力出色,最需要解決的是讓機(jī)器人了解站在它對(duì)面的人在想什么、需要什么、如何主動(dòng)自然地進(jìn)行服務(wù),這就是機(jī)器人與人的交互能力。“當(dāng)面對(duì)服務(wù)型人形機(jī)器人時(shí),我們總會(huì)希望像與人交流那樣和機(jī)器人溝通,這就要求機(jī)器人具備交互能力,了解人的想法,以便更好地服務(wù)于人?!?/p>

 

馬道林認(rèn)為,人形機(jī)器人在硬件設(shè)計(jì)方面仍有很大改進(jìn)空間,也有較大降本空間。要實(shí)現(xiàn)智能控制,需要在AI算法、訓(xùn)練AI模型方面持續(xù)發(fā)力。目前,人形機(jī)器人最基本的技能是用腿或輪子“走路”,這是它的運(yùn)動(dòng)能力?!叭绻凑瘴覀兤诖哪菢?,讓人形機(jī)器人具備完備的工作能力,它們還需要擁有一雙能夠靈巧、精細(xì)控制的手。我認(rèn)為,手上的作業(yè)能力是具身智能人形機(jī)器人落地的關(guān)鍵,也是行業(yè)發(fā)展的終極競(jìng)技場(chǎng)。”

 

熊友軍表示,人形機(jī)器人最終應(yīng)該在國民經(jīng)濟(jì)和國計(jì)民生方面發(fā)揮重要戰(zhàn)略價(jià)值。“它需要融合手、眼、腿、腦的能力,不僅可以在危險(xiǎn)、有毒、有害或者人不愿去的地方發(fā)揮價(jià)值,還需要升級(jí)人機(jī)交互、感知、意圖識(shí)別、執(zhí)行規(guī)劃等各方面的能力?!?/p>

 

追問3:未來的人形機(jī)器人什么樣?

 

多位專家學(xué)者表示,具身智能發(fā)展迅猛,現(xiàn)在的人形機(jī)器人正從蹣跚學(xué)步走向穩(wěn)步前行。在其“骨骼”、大腦、小腦更加完善的同時(shí),研究者們正同步賦予機(jī)器人像人一樣的身體機(jī)能。

 

未來的人形機(jī)器人什么樣?馬道林認(rèn)為,目前大多數(shù)人形機(jī)器人尚未具備良好的觸覺感知和觸覺控制能力,“具身智能要將AI和機(jī)器人結(jié)合起來,關(guān)鍵在于讓機(jī)器人能夠自己感受周圍的三維物理世界?!备惺苋S物理世界包括兩大感知模態(tài),即視覺和觸覺,目前絕大部分機(jī)器人僅能解決“看”的問題,對(duì)于感受周圍的物理世界還處于非常早期的階段。

 

馬道林從事具身智能的觸覺感知研究,“現(xiàn)在,我們將觸覺傳感器和觸覺感知的研究推進(jìn)到與人的感知能力相近,甚至個(gè)別指標(biāo)可以超越人的感知能力。從這個(gè)意義上講,我們的觸覺研究已經(jīng)做好讓機(jī)器人實(shí)現(xiàn)應(yīng)用的準(zhǔn)備?!?/p>

 

觸覺對(duì)于走進(jìn)家庭、醫(yī)院、養(yǎng)老院的人形機(jī)器人有多重要?舉例來說,機(jī)器人攙扶病人、老人,如果沒有靈敏的觸覺,就無法感知應(yīng)該用多大的力度,可能會(huì)用力過猛讓人受傷。再比如,人形機(jī)器人給家里各類電器插電源時(shí),需要觸覺去感知細(xì)微變化,否則很容易插不準(zhǔn),導(dǎo)致電源損壞。下一步,馬道林將研究讓機(jī)器人能靈敏地感知溫度。

 

在王韜的研究中,機(jī)器人被賦予了情感大模型,它們更加聰慧、善于觀察。它可以是傾聽者、心理療愈師;可以根據(jù)人的情緒和性格調(diào)整做事風(fēng)格,讓人更感溫暖;可以是全能的家政服務(wù)人員;還可以是商業(yè)領(lǐng)域的好助手、服務(wù)行業(yè)的好客服、安全領(lǐng)域的好專家?!皬娜祟惖钠诖齺碚f,人形機(jī)器人研發(fā)應(yīng)該從對(duì)人服務(wù)和交互角度多發(fā)力,如果我們不把對(duì)人服務(wù)和交互納入機(jī)器人訓(xùn)練大模型,最終就無法擁有真正的服務(wù)機(jī)器人?!蓖蹴w說。

 

新京報(bào)記者 吳婷婷

編輯 白爽 校對(duì) 薛京寧