GPT人形機(jī)器人來了！能端茶、會(huì)陪聊、善思考，教育應(yīng)用想象空間大開！

2024-03-14 11:57:16發(fā)布來源：多知網(wǎng) 作者：Penny

　　來源|多知

　　作者|Penny

　　當(dāng)機(jī)器人有了大腦會(huì)怎樣?

　　就是今天，半個(gè)硅谷都在投的明星機(jī)器人創(chuàng)業(yè)公司Figure發(fā)布了視頻，展示了與 OpenAI(ChatGPT 的制造商)首次合作的機(jī)器人Figure 01，刷爆了全網(wǎng)。

　　視頻展示了人形機(jī)器人與人進(jìn)行交互的能力，是男士磁性的聲音，機(jī)器人可以聽從人的命令;定位并交給他們一個(gè)物體，如視頻中的蘋果;描述它正在做什么并與人交談，并自行識(shí)別、計(jì)劃和執(zhí)行任務(wù)，如撿起垃圾并將碗碟放入支架。

　　Figure 的演示視頻是人形通用機(jī)器人交互方面的重大飛躍，機(jī)器人與人可以自然地交互、服從人類、可以思考人類想要什么，并且可以順利完成任務(wù)。

　　Figure創(chuàng)始人Brett Adcock表示，視頻中Figure 01展示了端到端神經(jīng)網(wǎng)絡(luò)框架下與人類的對(duì)話，沒有任何遠(yuǎn)程操作。并且，機(jī)器人的速度有了顯著的提升，開始接近人類的速度。

　　就在最近，多知曾介紹過印度喀拉拉邦KTCT高級(jí)中學(xué)的首位AI教師，Iris。她有語音助手、互動(dòng)學(xué)習(xí)、操控能力和移動(dòng)等功能，是老師的輔助工具。盡管還沒那么智能，已經(jīng)受到了當(dāng)?shù)貙W(xué)生的歡迎。

　　多模態(tài)的大模型可以說是機(jī)器人最好的載體，而教育領(lǐng)域更需要多模態(tài)的交互?？梢哉f，F(xiàn)igure的人形機(jī)器人給教育領(lǐng)域的應(yīng)用又一次打開了想象空間。

　　端茶倒水、陪聊……機(jī)器人裝上最強(qiáng)大腦

　　AI機(jī)器人迭代的速度快了起來，OpenAI投資了Figure還不到半個(gè)月，裝上“最強(qiáng)大腦”的新一代機(jī)器人就已經(jīng)誕生了。

　　這個(gè)真實(shí)的演示像幾年前在科幻電影中的場景——

　　視頻中的人類說“嘿，你現(xiàn)在看到了什么?”機(jī)器人操著一口男士磁性的美式口音回答道：“我看到桌子中央的盤子上有一個(gè)紅蘋果，還有一個(gè)放著杯子和盤子的晾衣架，你站在附近，手放在桌子上。”

　　“太好了，我可以吃點(diǎn)東西嗎?” 人類問道。

　　“當(dāng)然可以，”機(jī)器人說道，小心翼翼地伸手抓住蘋果，然后把它遞給人類。在人類沒有說明的情況下，機(jī)器人明白蘋果是它面前唯一可食用的物體。

　　視頻繼續(xù)顯示機(jī)器人撿起垃圾，將盤子和杯子放在支架上。

　　從聲音上來看，很接近人類語言，沒有機(jī)械音。從反應(yīng)速度上看，對(duì)話依然有幾十秒的延遲，但交互很自然。從動(dòng)作上看，比較連貫。

　　Brett Adcock在 X 上的一個(gè)帖子中發(fā)帖稱，“Figure 的機(jī)載攝像頭會(huì)輸入由 OpenAI 訓(xùn)練的大型視覺語言模型 (VLM)。”

　　Brett Adcock還提到，演示視頻是在正常速度下連續(xù)拍攝的，沒有人為背后操控。換句話說：該視頻沒有像之前的人形機(jī)器人演示視頻那樣加速，以展示更多的運(yùn)動(dòng)流暢性，而且也沒有人在幕后的任何部分遠(yuǎn)程控制機(jī)器人的運(yùn)動(dòng)。

　　雖然只是一個(gè)演示，已經(jīng)讓全網(wǎng)驚嘆不已，也期待成品落地。

　　“我醒了，這里有一個(gè)新的技術(shù)成果。”一個(gè)網(wǎng)友說。

　　還有人已經(jīng)打開腦洞，想到了未來的畫面：

　　“嘿，F(xiàn)igure 01，我出門一下。請(qǐng)打掃一下房子，洗洗碗，還要帶狗出去散步。我回來之前你可以看會(huì)兒《終結(jié)者2》，但別有什么瘋狂的想法，好嗎?”

　　具身智能機(jī)器人時(shí)代來臨，教育領(lǐng)域再次打開想象空間

　　Brett Adcock曾在直升飛機(jī)領(lǐng)域創(chuàng)業(yè)，并成功上市。但當(dāng)他看到生成式AI的大浪潮時(shí)，決定專注于這場新的AI機(jī)器人革命。

　　Figure公司由波士頓動(dòng)力、特斯拉、谷歌DeepMind 和 Archer Aviation 的前員工2022年創(chuàng)立，不到兩年的時(shí)間，估值超過 26 億美元，投資方可以說囊括了半個(gè)硅谷，包括英特爾的風(fēng)險(xiǎn)基金以及“木頭姐”Cathie Wood的Ark Invest、Align Ventures和Parkway Venture Capital、OpenAI、微軟以及亞馬遜等。

　　在Figure的網(wǎng)站上，Brett Adcock指出，“Figure的目標(biāo)：開發(fā)通用類人機(jī)器人，對(duì)人類產(chǎn)生積極影響，為子孫后代創(chuàng)造更美好的生活。這些機(jī)器人可以消除對(duì)不安全和不受歡迎的工作的需求，最終讓我們過上更快樂、更有目標(biāo)的生活。”

　　但Brett Adcock也提到，實(shí)現(xiàn)愿景可能需要數(shù)十年的時(shí)間。他還承諾：“我們不會(huì)將人形機(jī)器人用于軍事或國防應(yīng)用，也不會(huì)將其用于任何需要對(duì)人類造成傷害的角色。”

　　那么AI機(jī)器人可以用到哪些領(lǐng)域呢?

　　Figure稱，人形機(jī)器人將有能力創(chuàng)造和生產(chǎn)更多東西，解決嚴(yán)重的勞動(dòng)力短缺問題，并減少從事不安全工作的工人數(shù)量。

　　Figure AI希望將人類的靈巧性與尖端人工智能結(jié)合在一起，超越單一功能機(jī)器人，為制造、物流、倉儲(chǔ)和零售業(yè)提供支持。

　　而這樣具有“大腦”的機(jī)器人應(yīng)用在教育領(lǐng)域也十分匹配，不管從B端，還是C端，從學(xué)生還是老師都會(huì)受益：

　　對(duì)于低幼孩子來說，AI機(jī)器人與孩子僅僅多輪互動(dòng)交流，就是一個(gè)巨大的進(jìn)步。對(duì)于高年級(jí)的孩子來說，AI機(jī)器人輔導(dǎo)作業(yè)也指日可待。

　　對(duì)于老師來說，比如一些簡單但耗時(shí)費(fèi)力的工作，類似大范圍的學(xué)生成績分析、學(xué)生學(xué)情數(shù)據(jù)分析、口語發(fā)音矯正、大批量閱卷、課程演示等，在這些特定的場景下，機(jī)器人有著得天獨(dú)厚的技術(shù)優(yōu)勢(shì)。

　　這也是對(duì)于教師們來說幫助最大的一部分——AI機(jī)器人從教師手中接過了基礎(chǔ)性、重復(fù)性的工作，而人類老師則有更多的時(shí)間和精力投入到與孩子的情感溝通中，關(guān)注孩子的個(gè)性化需求。

　　在老師方面，印度喀拉拉邦KTCT高級(jí)中學(xué)的首位AI教師Iris已經(jīng)開了個(gè)頭。

　　當(dāng) AI 大模型崛起之后，如何走入物理世界？具身智能是一個(gè)不錯(cuò)的途徑。英偉達(dá)創(chuàng)始人黃仁勛曾預(yù)判：“具身智能將引領(lǐng)下一波人工智能浪潮。”

　　具身智能將人工智能技術(shù)與機(jī)器人實(shí)體相結(jié)合，讓“大腦”有了可支配、可感知、可交互、可行動(dòng)的“身體”，作為人類的伙伴和助手，帶來便利，也對(duì)教育領(lǐng)域產(chǎn)生更大的影響。

　　具身智能機(jī)器人正成為不少公司的必爭之地。

　　當(dāng)前，除了Figure，全球多家公司都在聚焦于人形機(jī)器人領(lǐng)域，如馬斯克的Optimus(擎天柱)，OpenAI還投資挪威機(jī)器人初創(chuàng)公司 1X Technologies AS;總部位于溫哥華的 Sanctuary AI 正在開發(fā)一款名為 Phoenix 的人形機(jī)器人;國內(nèi)還有上市公司優(yōu)必選、稚暉君的智元機(jī)器人、初創(chuàng)公司宇樹科技Unitree等。

　　與OpenAI合作后，F(xiàn)igure有了更大的野心。Brett Adcock公開表示，“我們的目標(biāo)是訓(xùn)練一個(gè)世界模型，以操作十億級(jí)別的人形機(jī)器人。”

　　毋庸置疑，在AI機(jī)器人領(lǐng)域，才剛剛起飛。

　　END

　　本文作者：Penny

商學(xué)院

Open Talk

GPT人形機(jī)器人來了！能端茶、會(huì)陪聊、善思考，教育應(yīng)用想象空間大開！

相關(guān)閱讀

商學(xué)院

Open Talk

GPT人形機(jī)器人來了！能端茶、會(huì)陪聊、善思考，教育應(yīng)用想象空間大開！

相關(guān)閱讀

GPT人形機(jī)器人來了！能端茶、會(huì)陪聊、善思考，教育應(yīng)用想象空間大開！