過去22個月,AI發(fā)展速度超過任何歷史時期,但我們依然還處于AGI變革的早期。

吳泳銘:AI最大的想象力不在手機屏幕,而是改變物理世界

2024-09-19 15:28:59發(fā)布     來源:阿里云    作者:阿里云  

  多知9月19日消息,阿里巴巴集團CEO、阿里云智能集團董事長兼CEO吳泳銘在2024云棲大會上發(fā)表主題演講。他認為過去22個月,AI發(fā)展速度超過任何歷史時期,但我們依然還處于AGI變革的早期。生成式AI最大的想象力,絕不是在手機屏幕上做一兩個新的超級app,而是接管數(shù)字世界,改變物理世界。

  以下為演講全文:

  歡迎來到2024云棲大會。在剛剛過去的夏天,阿里云全面支撐巴黎奧運會實現(xiàn)了歷史性突破,云計算首次超越衛(wèi)星,成為奧運主要轉播方式。AI也首次廣泛應用于奧運會。今天,云棲大會的焦點也是AI。我主要分享三點內容:

  第一,過去22個月,AI發(fā)展的速度超過任何歷史時期,但我們現(xiàn)在依然還處于AGI變革的早期階段。

  大模型技術快速迭代,技術可用性大幅提升。大模型已經具備了文本、語音、視覺的多模態(tài)能力,能夠開始完成復雜指令。去年,大模型還只能幫助程序員寫簡單的代碼,今天已經能直接理解需求,完成復雜的編程任務。去年,大模型的數(shù)學能力還只有中學生水平,今天已達到國際奧賽金牌水平,并在物理、化學、生物等多方面學科接近博士水平。

  同時,模型推理成本指數(shù)級下降,已經遠遠超過摩爾定律。一年來,通義千問API在阿里云百煉上的調用價格下降了97%,百萬Tokens調用花費最低已經降到了5毛錢。推理成本是應用爆發(fā)的關鍵問題,阿里云會努力把成本繼續(xù)降下去。

  開源生態(tài)蓬勃發(fā)展。今年6月,通義千問開源Qwen2,迅速登頂Huggingface的全球開源模型排行榜。在Huggingface上,Qwen的原生和衍生模型接近5萬個,排名全球第二。阿里云魔搭社區(qū)上有超過1萬個模型、服務了超過690萬開發(fā)者。

  這一切才剛剛開始,要實現(xiàn)真正的AGI,下一代模型需要具備更大規(guī)模、更通用、更泛化的知識體系,同時也將具備更復雜更多層次的邏輯推理能力。全世界先進模型競爭的投入門檻,將達到數(shù)十億、數(shù)百億美金的級別。AI具備創(chuàng)造能力、幫助人類解決復雜問題的路徑清晰可見,也打開了AI在各行業(yè)場景中廣泛應用的可能性。

  第二,AI最大的想象力不在手機屏幕,而是接管數(shù)字世界,改變物理世界。

  今天很多行業(yè)內人士一直在想AI最大的應用是什么,可能一直在想手機上有什么AI時代創(chuàng)新的超級APP。但我們認為AI最大的想象力絕對不是在手機屏幕上,AI最大的想象力是在通過滲透數(shù)字世界、接管數(shù)字世界,并改變物理世界,這才是AI最大的想象力。

  我們不能只停在移動互聯(lián)網(wǎng)的視角看未來。生成式AI最大的想象力,絕不是在手機屏幕上做一兩個新的超級app,而是接管數(shù)字世界,改變物理世界。

  過去三十年,互聯(lián)網(wǎng)浪潮的本質是連接,互聯(lián)網(wǎng)連接了人、信息、商業(yè)和工廠,通過連接提高了世界的協(xié)作效率,創(chuàng)造了巨大的價值,改變了人們的生活方式。但生成式AI是通過生產力的供給創(chuàng)造了新的價值,從而為世界創(chuàng)造了更大的內在價值,也就是總體提高了整個世界的生產力水平。這種價值創(chuàng)造,可能是移動互聯(lián)網(wǎng)連接價值的十倍、幾十倍。

  我們認為生成式AI將逐漸滲透數(shù)字世界,并接管數(shù)字世界,物理世界的大部分事物都會具備AI能力,形成下一代的具備AI能力的全新產品,并與云端AI驅動的數(shù)字世界連接產生協(xié)同效應。

  很長一段時間,AI的焦點主要集中在模擬人類的感知能力,比如自然語言理解、語音識別、視覺識別。但是生成式AI的崛起,帶來了質的飛躍,AI不再僅僅局限于感知,而是首次展現(xiàn)了思考推理和創(chuàng)造的力量。

  生成式AI讓世界有了一個統(tǒng)一的語言——Token。它可以是任何文字、代碼、圖像、視頻、聲音,或者是人類千百年來的思考。AI模型可以通過對物理世界數(shù)據(jù)的Token化,理解真實世界的方方面面,比如人類行走、奔跑、駕駛車輛、使用工具,繪畫、作曲、寫作、表達、教學、編程的技巧,甚至是開公司創(chuàng)業(yè)。理解之后,AI就可以模仿人類去執(zhí)行物理世界的任務。這將帶來新的產業(yè)革命。

  我們看到,汽車行業(yè)正在發(fā)生這樣的變革。之前的自動駕駛技術,是靠人來寫算法規(guī)則,幾十萬行代碼,仍然無法窮盡所有的駕駛場景。采用“端到端”的大模型技術訓練后,AI模型直接學習海量人類駕駛視覺數(shù)據(jù),讓汽車具備了超越大部分司機的駕駛能力。

  機器人將是下一個迎來巨變的行業(yè)。未來,所有能移動的物體都會變成智能機器人。它可以是工廠里的機械臂、工地里的起重機、倉庫里的搬運工、救火現(xiàn)場的消防員、包括家庭里的寵物狗、保姆、助理。

  未來,工廠里會有很多機器人,在AI大模型的指揮下,生產機器人?,F(xiàn)在每個城市家庭里有一輛或者兩輛車,未來每個家庭可能會有兩三個機器人,幫助人們提升生活當中的效率。

  可以想見,AI驅動的數(shù)字世界連接著具備AI能力的物理世界,將會大幅提升整個世界的生產力,對物理世界的運行效率產生革命性的影響。

  第三,AI計算正在加速演進,成為計算體系的主導。

  無論是我們看到端側的計算,還是云端的世界,這都是一個非常明顯的趨勢。生成式AI對數(shù)字世界和物理世界的重構,將帶來計算架構的根本性變化。過去幾十年,CPU主導的計算體系,正在加速向GPU主導的AI計算體系轉移。未來幾乎所有的軟硬件都會具備推理能力,它們的計算內核將變成GPU AI算力為主、CPU傳統(tǒng)計算為輔的計算模式。

  我們看到,在新增算力市場上,超過50%的新需求由AI驅動產生,AI算力需求已經占據(jù)主流地位。這一趨勢還會持續(xù)擴大。過去一年,阿里云投資新建了大量的AI算力,但還是遠遠不能滿足客戶的旺盛需求。

  今天我們接觸到的所有客戶、所有開發(fā)者、所有CTO,幾乎都在用AI重構自己的產品。大量新增需求正在由GPU算力驅動,大量存量應用也在用GPU重新改寫。在汽車、生物醫(yī)藥、工業(yè)仿真、氣象預測、教育、企業(yè)軟件、移動APP、游戲等行業(yè),AI計算正在加速滲透。在各行各業(yè),看不見的新產業(yè)革命正在悄然演進。

  所有行業(yè),都需要性能更強、規(guī)模更大、更適應AI需求的基礎設施。

  阿里云正在以前所未有的強度投入AI技術研發(fā)和基礎設施建設。我們的單網(wǎng)絡集群已拓展至十萬卡級別,正在從芯片、服務器、網(wǎng)絡、存儲到散熱、供電、數(shù)據(jù)中心等方方面面,重新打造面向未來的AI先進基礎設施。

  從歷史經驗來看,人們對新技術革命,往往對短期高估,又對長期低估。因為在新技術應用早期,滲透率還比較低,人們經驗沒有發(fā)生過此類事件,大部分人的本能會產生懷疑,這很正常。但新技術革命會在人們的懷疑中成長,讓很多人在遲疑中錯過。

  站在AI時代浪潮的開端,我感到無比興奮。今天,我們請到大模型、自動駕駛和機器人三個領域的企業(yè)家和科學家。他們正在飛奔著用AI重構我們的世界,期待他們的精彩分享。

  謝謝大家。希望大家度過一個充實、愉快的云棲。