T1在2025中關(guān)村論壇年會(huì)開(kāi)幕式排練上。受訪者供圖
哨聲響起,記分牌停在9:0,加速進(jìn)化人形機(jī)器人T1捧起RoboCup德國(guó)公開(kāi)賽成人組決賽冠軍獎(jiǎng)杯,程昊圓了這場(chǎng)始于清華火神隊(duì)的冠軍夢(mèng)。
RoboCup有著“機(jī)器人世界杯”之稱(chēng),清華火神隊(duì)由趙明國(guó)創(chuàng)立,參賽多年,成員來(lái)自他的機(jī)器人實(shí)驗(yàn)室。清華自動(dòng)化系出身的程昊曾是第三任隊(duì)長(zhǎng),學(xué)生時(shí)期帶領(lǐng)團(tuán)隊(duì)斬獲人形組TeenSize季軍的經(jīng)歷,既是他機(jī)器人夢(mèng)想的起點(diǎn),也成為縈繞心頭的遺憾。
畢業(yè)后的職業(yè)軌跡看似偏離初心:程昊創(chuàng)辦了“朝夕日歷”,經(jīng)歷字節(jié)跳動(dòng)收購(gòu)后出任飛書(shū)產(chǎn)品副總裁。但2023年ChatGPT3.0的技術(shù)突破讓他敏銳捕捉到關(guān)鍵拐點(diǎn),大模型的涌現(xiàn)能力與機(jī)器人運(yùn)動(dòng)控制的結(jié)合,正在重構(gòu)具身智能的底層邏輯。程昊意識(shí)到,大模型給人形機(jī)器人創(chuàng)造的機(jī)會(huì)與此前歷史上的任何時(shí)刻都不一樣。“通用AI已經(jīng)出現(xiàn),而且會(huì)發(fā)展成多模態(tài),對(duì)物理世界有感知和影響,需要新的硬件載體。”
這一嗅覺(jué)讓程昊于2023年8月創(chuàng)辦了加速進(jìn)化,并召集許多火神隊(duì)前隊(duì)員擔(dān)任研發(fā)人員,并邀請(qǐng)自己的老師趙明國(guó)擔(dān)任首席科學(xué)家加入。大約一年后,加速進(jìn)化第一個(gè)人形機(jī)器人產(chǎn)品T1“出世”,印證了他的前瞻判斷。
T1一“出生”幾乎立刻“回”到程昊熟悉的足球賽場(chǎng)上。這位生于北京、長(zhǎng)于北京的創(chuàng)業(yè)青年,決心要從踢球場(chǎng)景做起,逐步實(shí)現(xiàn)人形機(jī)器人的智能泛化。
“機(jī)器人的強(qiáng)化學(xué)習(xí)和小朋友學(xué)走路類(lèi)似,從會(huì)爬到站起來(lái)走路,從走得踉踉蹌蹌到走得穩(wěn)當(dāng),再到上斜坡、臺(tái)階,甚至蹦跳。只是在虛擬世界中,數(shù)臺(tái)機(jī)器人訓(xùn)練幾小時(shí)相當(dāng)于人類(lèi)的10年。”程昊告訴貝殼財(cái)經(jīng)記者。
“皮實(shí)”耐摔、“靈活”起身
T1二度“出征”機(jī)器人世界杯奪冠
3月,在RoboCup德國(guó)公開(kāi)賽成人組決賽中,加速進(jìn)化T1以藍(lán)色方身份迎戰(zhàn)東道主德國(guó)Sweaty。賽場(chǎng)上,一臺(tái)位于前方的T1似乎“預(yù)判”了對(duì)手的封鎖路線(xiàn),繞開(kāi)比自己高出一個(gè)頭的紅色方,先一步碰到了球,并射門(mén)得分。這場(chǎng)對(duì)決比分最終鎖定在9:0,清華火神隊(duì)零封奪冠。
程昊刷新了自己的參賽紀(jì)錄。2024年7月,約時(shí)隔14年后,他再次以清華火神隊(duì)的名義重新回到RoboCup賽場(chǎng)。與學(xué)生時(shí)代相比,程昊不再只是機(jī)器人開(kāi)發(fā)者,從實(shí)驗(yàn)室到競(jìng)技場(chǎng),他完成了認(rèn)知范式的關(guān)鍵躍遷。
2024年,T1還無(wú)法堅(jiān)持“踢”完整場(chǎng)比賽。許多機(jī)器人因?yàn)殛P(guān)節(jié)發(fā)熱而“瘸腿”、摔倒。在與其他機(jī)器人發(fā)生撞擊時(shí),甚至出現(xiàn)主控與關(guān)節(jié)間通信斷開(kāi)的情況,整臺(tái)機(jī)器人因此斷電、宕機(jī)。“壞了得馬上換一臺(tái)”,程昊為一場(chǎng)2V2比賽準(zhǔn)備了10臺(tái)機(jī)器人,最終還是敗給了冠軍美國(guó)隊(duì)。
首戰(zhàn)未問(wèn)鼎,程昊并不氣餒。“身高不夠技術(shù)湊,統(tǒng)治球場(chǎng)不是夢(mèng)!”賽后,這句話(huà)作為T(mén)1座右銘,寫(xiě)進(jìn)加速進(jìn)化微信公眾號(hào)總結(jié)文章里。
加速進(jìn)化CEO程昊接受貝殼財(cái)經(jīng)記者專(zhuān)訪。新京報(bào)貝殼財(cái)經(jīng)記者 祁明遠(yuǎn) 攝
“機(jī)器人的塑料胸殼、頭殼遇到磕碰后會(huì)開(kāi)裂。”這讓程昊很頭疼。優(yōu)化材料,繼續(xù)實(shí)驗(yàn),不下幾十次的試錯(cuò),甚至用到了10-20公斤的球,從兩米高空摔下,終于程昊在一片廢墟中找到“皮實(shí)”耐摔的材料。程昊將它們配比融入電機(jī)、減速器齒輪、軸承、支架等部件中,T1擁有了新“皮膚”。
球場(chǎng)競(jìng)技難免摩擦碰撞不斷,為了讓主控在摔跤后的高震動(dòng)狀態(tài)下依然能穩(wěn)定工作、不掉電,程昊優(yōu)化了嵌入式硬件的設(shè)計(jì),專(zhuān)門(mén)開(kāi)發(fā)了震動(dòng)和跌落測(cè)試裝備。這套裝備能夠以每秒兩次峰值力的頻率進(jìn)行撞擊,持續(xù)20個(gè)小時(shí)。“每批次關(guān)節(jié)中,我們會(huì)抽取幾個(gè)進(jìn)行測(cè)試,如果它們能在20個(gè)小時(shí)撞擊后不損壞,才算達(dá)到要求。”
機(jī)器人遭撞擊后如何迅速起身?為此,程昊不斷迭代起身算法。原先T1要花費(fèi)10秒才能起身,現(xiàn)在能做到一秒起身,成功率也從50%逼近100%。
在一次實(shí)驗(yàn)中,6臺(tái)T1彼此進(jìn)行3V3比賽,連續(xù)“踢”20場(chǎng)球下來(lái),關(guān)節(jié)大多沒(méi)有出現(xiàn)損壞,也不需要“替補(bǔ)”救場(chǎng)。實(shí)驗(yàn)過(guò)后信心滿(mǎn)滿(mǎn),T1再次“回歸”RoboCup賽場(chǎng),變得“皮實(shí)”耐摔,“靈活”起身,一舉拿下冠軍杯。
反觀大多參賽者(機(jī)器人)還是經(jīng)不起碰撞,為此,賽事還一度臨時(shí)調(diào)整規(guī)則,從允許一定撞擊改為禁止撞擊。
首登中關(guān)村論壇舞臺(tái)
原地起身、做俯臥撐技驚四座
T1于2024年8月正式揭開(kāi)面紗。程昊表示在北京市政府的支持下,這款承載尖端技術(shù)的智能設(shè)備迅速晉升為一枚“城市科技名片”——頻繁作為“門(mén)面”出席國(guó)際盛會(huì)大顯身手,還將入駐水立方等標(biāo)志性場(chǎng)館,通過(guò)高規(guī)格機(jī)器人賽事實(shí)現(xiàn)技術(shù)迭代升級(jí)。
去年10月,T1開(kāi)始量產(chǎn)出貨,并在今年3月初完成了第一百臺(tái)交付,標(biāo)志著T1正式步入產(chǎn)業(yè)化快車(chē)道。
今年3月的中關(guān)村論壇,成為其技術(shù)實(shí)力的展示舞臺(tái)。T1首次“參加”中關(guān)村論壇,加速進(jìn)化一次調(diào)度十幾臺(tái)機(jī)器聯(lián)袂登場(chǎng),一部分登上開(kāi)幕式舞臺(tái),表演俯臥撐、原地起身,另一部分站在主論壇門(mén)口迎賓,在分論壇上扮演主持人,或在展廳里踢足球,通過(guò)集群協(xié)同作業(yè)完美呈現(xiàn)人工智能的群體智慧。
從技術(shù)層面來(lái)看,T1在機(jī)器人“雙腿”上采用了強(qiáng)化學(xué)習(xí)的運(yùn)動(dòng)控制算法。數(shù)萬(wàn)臺(tái)機(jī)器人同時(shí)在仿真數(shù)據(jù)環(huán)境里訓(xùn)練,“走過(guò)”臺(tái)階、斜坡、光滑地面、粗糙路面等各類(lèi)環(huán)境。程昊告訴貝殼財(cái)經(jīng)記者,“機(jī)器人的強(qiáng)化學(xué)習(xí)和小朋友學(xué)走路類(lèi)似,從會(huì)爬到站起來(lái)走路,從走得踉踉蹌蹌到走得穩(wěn)當(dāng),再到上斜坡、臺(tái)階,甚至蹦跳。只是在虛擬世界中,數(shù)臺(tái)機(jī)器人訓(xùn)練幾小時(shí)相當(dāng)于人類(lèi)的10年。”
程昊介紹指出,機(jī)器人學(xué)習(xí)也有獎(jiǎng)懲機(jī)制,“只不過(guò)模型比較復(fù)雜”。訓(xùn)練表現(xiàn)好的結(jié)果模型才有機(jī)會(huì)部署到真機(jī)上,通過(guò)一系列算法減小從仿真到真實(shí)環(huán)境的差距。“我們現(xiàn)在的運(yùn)動(dòng)控制算法不只是控制腿,而是希望控制全身關(guān)節(jié)一起動(dòng),例如做出大力射門(mén)的動(dòng)作。這需要引入模仿學(xué)習(xí)算法,讓機(jī)器人在仿真環(huán)境里模仿火柴人,再通過(guò)強(qiáng)化學(xué)習(xí)鞏固。”
T1在2025中關(guān)村論壇年會(huì)開(kāi)幕式排練上。受訪者供圖
“從足球場(chǎng)景做起安全也相對(duì)經(jīng)濟(jì)”
具身智能大模型仍有不足但屬行業(yè)“未來(lái)”
程昊愛(ài)踢球,他的機(jī)器人也踢球。
“機(jī)器人踢足球是一個(gè)高效實(shí)驗(yàn)的場(chǎng)景。”程昊認(rèn)為,機(jī)器人踢足球需要視覺(jué)能力,除了識(shí)別自己的場(chǎng)地位置,還要識(shí)別球、球門(mén)等物品。同時(shí)也需要決策能力,判斷自己是前鋒、中場(chǎng),還是后衛(wèi),“做的事情會(huì)不同”。并且,還要隨著對(duì)方機(jī)器人的移動(dòng),不斷調(diào)整決策、打新配合。機(jī)器人踢足球還強(qiáng)調(diào)運(yùn)動(dòng)控制,對(duì)行走、轉(zhuǎn)彎、射門(mén)、起身等運(yùn)動(dòng)能力要求高。“就像足球運(yùn)動(dòng)員一樣,素質(zhì)比較綜合。”
在程昊眼中,足球與生活場(chǎng)景對(duì)一些感知、決策底層算法的要求相通,例如物體識(shí)別、跟蹤、定位,決策上的避障能力等。他認(rèn)為,“從足球場(chǎng)景做起不用太擔(dān)心安全問(wèn)題,也相對(duì)經(jīng)濟(jì)。”
“通過(guò)機(jī)器人踢足球,以點(diǎn)帶面推動(dòng)我們不停研究新的運(yùn)動(dòng)控制、感知、決策算法。”雖然程昊認(rèn)為目前的具身智能大模型還存在不足,但它屬于行業(yè)未來(lái)的方向。
程昊在北京長(zhǎng)大,清華本碩畢業(yè),創(chuàng)業(yè)、入職大廠,都沒(méi)離開(kāi)過(guò)北京。“我覺(jué)得在北京創(chuàng)業(yè)更容易做成、做大,人力、場(chǎng)地成本可能貴些,團(tuán)隊(duì)需要做出更好的收入、融資。”2024年,加速進(jìn)化拿到由中關(guān)村科學(xué)城與其他機(jī)構(gòu)共同出資的Pre-A輪融資。北京基座模型企業(yè)數(shù)量、人才密度、場(chǎng)景支持,也讓他對(duì)未來(lái)有所信心。
他比較相信馬斯克說(shuō)的人形機(jī)器人會(huì)達(dá)到百億臺(tái),同時(shí)多種機(jī)型存在,“工廠、公司有,家庭也有”,但這可能需要10年、20年。程昊記得小時(shí)候小區(qū)第一臺(tái)電腦價(jià)值一萬(wàn)元,“當(dāng)時(shí)小區(qū)一套房也是一萬(wàn)元”。
但曾與樓房等價(jià)的電腦如今已不再高不可攀,寫(xiě)字樓里響起此起彼伏的鍵盤(pán)聲,連樓下便利店都能用電腦結(jié)賬,人形機(jī)器人未來(lái)或許也能像《克拉拉與太陽(yáng)》所寫(xiě),待在街邊櫥窗里,等待喬西將自己領(lǐng)回家。
新京報(bào)貝殼財(cái)經(jīng)記者 韋英姿 張晗 編輯 陳莉 校對(duì) 薛京寧