我的AI機(jī)器人老師何時(shí)上崗?

GPT人形機(jī)器人來了!能端茶、會(huì)陪聊、善思考,教育應(yīng)用想象空間大開!

2024-03-14 11:57:16發(fā)布     來源:多知網(wǎng)    作者:Penny  

  來源|多知

  作者|Penny

  當(dāng)機(jī)器人有了大腦會(huì)怎樣?

  就是今天,半個(gè)硅谷都在投的明星機(jī)器人創(chuàng)業(yè)公司Figure發(fā)布了視頻,展示了與 OpenAI(ChatGPT 的制造商)首次合作的機(jī)器人Figure 01,刷爆了全網(wǎng)。

  視頻展示了人形機(jī)器人與人進(jìn)行交互的能力,是男士磁性的聲音,機(jī)器人可以聽從人的命令;定位并交給他們一個(gè)物體,如視頻中的蘋果;描述它正在做什么并與人交談,并自行識(shí)別、計(jì)劃和執(zhí)行任務(wù),如撿起垃圾并將碗碟放入支架。

  Figure 的演示視頻是人形通用機(jī)器人交互方面的重大飛躍,機(jī)器人與人可以自然地交互、服從人類、可以思考人類想要什么,并且可以順利完成任務(wù)。

  Figure創(chuàng)始人Brett Adcock表示,視頻中Figure 01展示了端到端神經(jīng)網(wǎng)絡(luò)框架下與人類的對(duì)話,沒有任何遠(yuǎn)程操作。并且,機(jī)器人的速度有了顯著的提升,開始接近人類的速度。

  就在最近,多知曾介紹過印度喀拉拉邦KTCT高級(jí)中學(xué)的首位AI教師,Iris。她有語音助手、互動(dòng)學(xué)習(xí)、操控能力和移動(dòng)等功能,是老師的輔助工具。盡管還沒那么智能,已經(jīng)受到了當(dāng)?shù)貙W(xué)生的歡迎。

  多模態(tài)的大模型可以說是機(jī)器人最好的載體,而教育領(lǐng)域更需要多模態(tài)的交互??梢哉f,F(xiàn)igure的人形機(jī)器人給教育領(lǐng)域的應(yīng)用又一次打開了想象空間。

  01

  端茶倒水、陪聊……機(jī)器人裝上最強(qiáng)大腦

  AI機(jī)器人迭代的速度快了起來,OpenAI投資了Figure還不到半個(gè)月,裝上“最強(qiáng)大腦”的新一代機(jī)器人就已經(jīng)誕生了。

  這個(gè)真實(shí)的演示像幾年前在科幻電影中的場景——

  視頻中的人類說“嘿,你現(xiàn)在看到了什么?”機(jī)器人操著一口男士磁性的美式口音回答道:“我看到桌子中央的盤子上有一個(gè)紅蘋果,還有一個(gè)放著杯子和盤子的晾衣架,你站在附近,手放在桌子上。”

  “太好了,我可以吃點(diǎn)東西嗎?” 人類問道。

  

  “當(dāng)然可以,”機(jī)器人說道,小心翼翼地伸手抓住蘋果,然后把它遞給人類。在人類沒有說明的情況下,機(jī)器人明白蘋果是它面前唯一可食用的物體。

  視頻繼續(xù)顯示機(jī)器人撿起垃圾,將盤子和杯子放在支架上。

  

  從聲音上來看,很接近人類語言,沒有機(jī)械音。從反應(yīng)速度上看,對(duì)話依然有幾十秒的延遲,但交互很自然。從動(dòng)作上看,比較連貫。

  Brett Adcock在 X 上的一個(gè)帖子中發(fā)帖稱,“Figure 的機(jī)載攝像頭會(huì)輸入由 OpenAI 訓(xùn)練的大型視覺語言模型 (VLM)。”

  Brett Adcock還提到,演示視頻是在正常速度下連續(xù)拍攝的,沒有人為背后操控。換句話說:該視頻沒有像之前的人形機(jī)器人演示視頻那樣加速,以展示更多的運(yùn)動(dòng)流暢性,而且也沒有人在幕后的任何部分遠(yuǎn)程控制機(jī)器人的運(yùn)動(dòng)。

  雖然只是一個(gè)演示,已經(jīng)讓全網(wǎng)驚嘆不已,也期待成品落地。

  

  “我醒了,這里有一個(gè)新的技術(shù)成果。”一個(gè)網(wǎng)友說。

  還有人已經(jīng)打開腦洞,想到了未來的畫面:

  

  “嘿,F(xiàn)igure 01,我出門一下。請(qǐng)打掃一下房子,洗洗碗,還要帶狗出去散步。我回來之前你可以看會(huì)兒《終結(jié)者2》,但別有什么瘋狂的想法,好嗎?”

  02

  具身智能機(jī)器人時(shí)代來臨,教育領(lǐng)域再次打開想象空間

  Brett Adcock曾在直升飛機(jī)領(lǐng)域創(chuàng)業(yè),并成功上市。但當(dāng)他看到生成式AI的大浪潮時(shí),決定專注于這場新的AI機(jī)器人革命。

  Figure公司由波士頓動(dòng)力、特斯拉、谷歌DeepMind 和 Archer Aviation 的前員工2022年創(chuàng)立,不到兩年的時(shí)間,估值超過 26 億美元,投資方可以說囊括了半個(gè)硅谷,包括英特爾的風(fēng)險(xiǎn)基金以及“木頭姐”Cathie Wood的Ark Invest、Align Ventures和Parkway Venture Capital、OpenAI、微軟以及亞馬遜等。

  在Figure的網(wǎng)站上,Brett Adcock指出,“Figure的目標(biāo):開發(fā)通用類人機(jī)器人,對(duì)人類產(chǎn)生積極影響,為子孫后代創(chuàng)造更美好的生活。這些機(jī)器人可以消除對(duì)不安全和不受歡迎的工作的需求,最終讓我們過上更快樂、更有目標(biāo)的生活。”

  但Brett Adcock也提到,實(shí)現(xiàn)愿景可能需要數(shù)十年的時(shí)間。他還承諾:“我們不會(huì)將人形機(jī)器人用于軍事或國防應(yīng)用,也不會(huì)將其用于任何需要對(duì)人類造成傷害的角色。”

  那么AI機(jī)器人可以用到哪些領(lǐng)域呢?

  Figure稱,人形機(jī)器人將有能力創(chuàng)造和生產(chǎn)更多東西,解決嚴(yán)重的勞動(dòng)力短缺問題,并減少從事不安全工作的工人數(shù)量。

  Figure AI希望將人類的靈巧性與尖端人工智能結(jié)合在一起,超越單一功能機(jī)器人,為制造、物流、倉儲(chǔ)和零售業(yè)提供支持。

  而這樣具有“大腦”的機(jī)器人應(yīng)用在教育領(lǐng)域也十分匹配,不管從B端,還是C端,從學(xué)生還是老師都會(huì)受益:

  對(duì)于低幼孩子來說,AI機(jī)器人與孩子僅僅多輪互動(dòng)交流,就是一個(gè)巨大的進(jìn)步。對(duì)于高年級(jí)的孩子來說,AI機(jī)器人輔導(dǎo)作業(yè)也指日可待。

  對(duì)于老師來說,比如一些簡單但耗時(shí)費(fèi)力的工作,類似大范圍的學(xué)生成績分析、學(xué)生學(xué)情數(shù)據(jù)分析、口語發(fā)音矯正、大批量閱卷、課程演示等,在這些特定的場景下,機(jī)器人有著得天獨(dú)厚的技術(shù)優(yōu)勢(shì)。

  這也是對(duì)于教師們來說幫助最大的一部分——AI機(jī)器人從教師手中接過了基礎(chǔ)性、重復(fù)性的工作,而人類老師則有更多的時(shí)間和精力投入到與孩子的情感溝通中,關(guān)注孩子的個(gè)性化需求。

  在老師方面,印度喀拉拉邦KTCT高級(jí)中學(xué)的首位AI教師Iris已經(jīng)開了個(gè)頭。

  

  當(dāng) AI 大模型崛起之后,如何走入物理世界?具身智能是一個(gè)不錯(cuò)的途徑。英偉達(dá)創(chuàng)始人黃仁勛曾預(yù)判:“具身智能將引領(lǐng)下一波人工智能浪潮。”

  具身智能將人工智能技術(shù)與機(jī)器人實(shí)體相結(jié)合,讓“大腦”有了可支配、可感知、可交互、可行動(dòng)的“身體”,作為人類的伙伴和助手,帶來便利,也對(duì)教育領(lǐng)域產(chǎn)生更大的影響。

  具身智能機(jī)器人正成為不少公司的必爭之地。

  當(dāng)前,除了Figure,全球多家公司都在聚焦于人形機(jī)器人領(lǐng)域,如馬斯克的Optimus(擎天柱),OpenAI還投資挪威機(jī)器人初創(chuàng)公司 1X Technologies AS;總部位于溫哥華的 Sanctuary AI 正在開發(fā)一款名為 Phoenix 的人形機(jī)器人;國內(nèi)還有上市公司優(yōu)必選、稚暉君的智元機(jī)器人、初創(chuàng)公司宇樹科技Unitree等。

  與OpenAI合作后,F(xiàn)igure有了更大的野心。Brett Adcock公開表示,“我們的目標(biāo)是訓(xùn)練一個(gè)世界模型,以操作十億級(jí)別的人形機(jī)器人。”

  毋庸置疑,在AI機(jī)器人領(lǐng)域,才剛剛起飛。

  END

  本文作者:Penny