“大模型是教育未來發(fā)展的最大變量。”

深度|對話猿力科技CTO楊元祖:大模型為教育解決方案帶來“第三種可能”

2024-05-21 10:35:39發(fā)布     來源:多知    作者:王上  

  來源|多知

  作者|王上

  “大模型對我們來講是‘技術(shù)’,不是‘產(chǎn)品’,它應(yīng)該在產(chǎn)品中發(fā)揮價(jià)值。”猿力科技聯(lián)合創(chuàng)始人、CTO楊元祖在與多知對話時(shí)反復(fù)如是強(qiáng)調(diào)。

  2023年11月,猿力科技自研大模型落地教育應(yīng)用“海豚AI學(xué)”,其中,小學(xué)數(shù)學(xué)練習(xí)解析環(huán)節(jié)的“小白老師”蘇格拉底式答疑陸續(xù)開啟公測,這款產(chǎn)品被猿力科技視為“新一代智能學(xué)習(xí)產(chǎn)品”——這個(gè)分量并不輕。

  猿力科技于2014年成立了AI Lab,旗下產(chǎn)品猿題庫、小猿口算及小猿搜題等都是以AI Lab為基底發(fā)展而來。近日,北京猿力科技有限公司“看云”生成式人工智能備案成功。猿力科技正全面擁抱生成式AI,大模型正進(jìn)入到各個(gè)業(yè)務(wù)/產(chǎn)品線、各個(gè)環(huán)節(jié),但它并不明顯,而是隱藏在產(chǎn)品的交互背后。從產(chǎn)品角度來看,大模型可能體現(xiàn)在某個(gè)功能、某個(gè)場景、某個(gè)環(huán)節(jié),甚至是服務(wù)的過程中。

  對于大模型的應(yīng)用,楊元祖提到,“從AI原生角度去出發(fā)去打造一個(gè)產(chǎn)品,就像拿個(gè)錘子去找釘子,不一定是靠譜的。猿力科技的做法一直是從用戶場景出發(fā),看自己的‘工具集’如何去滿足用戶。”這種思考方式更像是“讓釘子去找錘子”。

  在楊元祖看來,做大模型應(yīng)用,最困難的是找到一個(gè)對用戶有價(jià)值且大模型可以實(shí)現(xiàn)的場景。為此,猿力科技還組建了一個(gè)“預(yù)研團(tuán)隊(duì)”,這是猿力科技落地大模型應(yīng)用的一個(gè)探路先鋒隊(duì)。

  人工智能的進(jìn)展,從電影劇情照進(jìn)了現(xiàn)實(shí)。體現(xiàn)在企業(yè)日常經(jīng)營、產(chǎn)品迭代中,更多是涓涓細(xì)流式的探索與積累。

  楊元祖認(rèn)為,猿力科技這些年的發(fā)展節(jié)點(diǎn)不是“做出一個(gè)產(chǎn)品”,而是“做出一個(gè)決策”。大模型就是這樣的一個(gè)關(guān)鍵決策,但它并非靈光一現(xiàn)的結(jié)果,而是經(jīng)過長期關(guān)注、來回認(rèn)知、不斷驗(yàn)證的過程。

  他說,大模型是教育解決方案接下來改進(jìn)的最大變量。假設(shè)沒有大模型,猿力科技也會(huì)一直迭代產(chǎn)品,但這是相對漸進(jìn)的過程。而大模型這個(gè)變量給了猿力科技一次重塑教育產(chǎn)品的機(jī)會(huì)。

  楊元祖認(rèn)為,做完多模態(tài)大模型的拼圖就完整了,多模態(tài)對教育領(lǐng)域的重要性遠(yuǎn)超其他領(lǐng)域,猿力科技對多模態(tài)的期待和投入非常大。

  這次對話反映了一家頭部教育科技公司探索大模型之于教育改革的真實(shí)狀態(tài),其中“做出決策”至關(guān)重要,而產(chǎn)品則是決策的結(jié)果,創(chuàng)新往往孕育于日常耕耘之中。

  以下為訪談內(nèi)容(經(jīng)多知編輯):

  01

  大模型“上限很高,成本可控”,教育領(lǐng)域會(huì)有無限的應(yīng)用場景

  多知:猿力科技是什么時(shí)候決定要做大模型的?

  楊元祖:它可能不是一個(gè)準(zhǔn)確的時(shí)間節(jié)點(diǎn),大模型這件事情并不是ChatGPT發(fā)布那一刻我們靈光一現(xiàn),然后下重注,并不是。

  預(yù)訓(xùn)練、GPT很早就有,我們很早便在關(guān)注Transformer的架構(gòu)對于教育的影響,一開始我們發(fā)現(xiàn)大模型渲染成本特別高,但它的效果可能還比不上我們原有自研的一些模型,所以是一直保持關(guān)注的過程。

  來來回回,有過反復(fù),甚至有過懷疑。最初大家對于大模型背后技術(shù)的預(yù)見還比較模糊,沒有認(rèn)為這就是將來的希望。全世界就OpenAI一家是在2017年 Transformer 架構(gòu)論文發(fā)布時(shí)就篤定這是未來,且下了重注。

  在ChatGPT發(fā)布之后,我們逐步地去挖掘它能被用來做什么,也越來越感覺到它令人震撼。但也沒有認(rèn)為應(yīng)該馬上去自研大模型。

  首先這東西要怎么應(yīng)用,大家并不知道。沒有人能在第一時(shí)間判斷它一定能用到我們的應(yīng)用當(dāng)中去,所以開端沒有那么戲劇化。這是一個(gè)慢慢理解的過程,慢慢有更多的信息攝入,包括各種觀點(diǎn)爭鳴。

  GPT-4的發(fā)布是一個(gè)完全不同的節(jié)點(diǎn),因?yàn)樗暗腉PT-3.5是有質(zhì)的差異,這個(gè)事情帶來的變化比想象的要大得多。所以這時(shí)候我們才會(huì)考慮要自研一個(gè)大模型。

  多知:最后為什么做出了自研大模型的決策?

  楊元祖:最初大家面臨的問題是大模型成本非常非常高,可能數(shù)億美元。所以就會(huì)面臨一個(gè)決策,“大模型是值得我們公司去投入的嗎?還是它就應(yīng)該是微軟、Google,國內(nèi)像百度、阿里、騰訊這樣的公司去投入的?”這是需要回答的問題。

  隨著接觸的信息越來越多,我們發(fā)現(xiàn)其實(shí)成本沒有那么夸張。我們計(jì)算到底需要多少數(shù)據(jù)量,需要多少運(yùn)算量,需要多少錢,最終算出來后才明白大家把這個(gè)事情神化了,其實(shí)并不需要特別夸張的資金投入。它就是一個(gè)慢慢地不斷來回反復(fù)的過程。

  但是最終決策肯定不能夠等到(大模型的一切都)完全清晰,那就太晚了。整體上粗略計(jì)算要花多少錢,我們覺得是可接受的,所以就開始做了??梢哉f,它的上限無限高,下限就是這個(gè)成本。

  多知:成本大致是怎樣的?

  楊元祖:我們大概有幾百臺(tái)機(jī)器,資金投入是動(dòng)態(tài)變化的。總之,上限很高,成本可控。我們當(dāng)時(shí)的判斷是大模型會(huì)給教育帶來巨大的不同,這是一個(gè)最直接的判斷。

  然后準(zhǔn)備團(tuán)隊(duì),購買機(jī)器。到底怎樣產(chǎn)品化,這是后續(xù)的工作。

  多知:團(tuán)隊(duì)希望看云大模型主要解決哪些問題?

  楊元祖大模型能力還是希望它更通用,只是說我們的大模型能更加符合教育領(lǐng)域,比如說更會(huì)做題,更擅長以一個(gè)老師的方式來掌握知識(shí)點(diǎn)。也就是說通用的大模型可能對于語言的理解能力是很強(qiáng)的,但它對語言的理解能力是一個(gè)普通人的理解能力,它不是一個(gè)語文老師的理解能力。普通人和語文老師看待同一句話、同一句語言的視角不一樣,這是兩者的差異。

  比如我們要訓(xùn)練的“辨識(shí)”這一類的能力,要比通用大模型要好。它可能用在哪呢?比如作文批改。

  接下來還有更多應(yīng)用場景,這就是大模型吸引人的地方,它有無限的應(yīng)用場景。我們希望它把教育的能力學(xué)會(huì)了之后,能重塑更多的教育場景。

  多知:海豚AI學(xué)背后應(yīng)用了哪些技術(shù)?

  楊元祖:我們認(rèn)為AI技術(shù)都應(yīng)該是為我們所用的,而不是特別強(qiáng)調(diào)采用的是哪一種技術(shù)。比如RAG (搜索增強(qiáng))、檢索增強(qiáng)或者預(yù)訓(xùn)練,這些我們都會(huì)用。不管叫“垂直大模型”還是叫“教育大模型”,只要它叫“大模型”,就具備一定的通用能力,這是它最大的特點(diǎn)。區(qū)別只是我們自己訓(xùn)練的大模型在通用能力上或許無法達(dá)到全球頂尖水平。

  但是我們在教育方面的能力上能夠達(dá)到甚至超過GPT-4,然后在教育相關(guān)的具體任務(wù)上,比通用大模型好,同時(shí),我們的通用能力能夠達(dá)到過關(guān)的水平,這是我們的目標(biāo)。

  假設(shè)我們一開始就想要做一個(gè)比GPT-4通用能力還要好的大模型,我覺得大概率是做不出來的,這不是我們這樣的公司應(yīng)該去投入的地方。

  

  (海豚AI學(xué)界面)

  多知:自研大模型在教育能力上能達(dá)到甚至超過通用大模型,是因?yàn)樵沉萍紦碛懈嘟逃惖臄?shù)據(jù)嗎?

  楊元祖:對,這是非常明顯的,或者說這是非常直接的,就是因?yàn)橛懈嗟臄?shù)據(jù),比如題目的數(shù)據(jù),老師講課的數(shù)據(jù),老師怎樣去拆解一道題目的數(shù)據(jù)等,都可以用來做訓(xùn)練,所以能夠在教育這件事上做得更好,這也是通用大模型很難一下子能搞定的事情。

  02

  生成式AI為教育解決方案開辟了第三種可能:“創(chuàng)造一套可交互的內(nèi)容”

  多知:教育領(lǐng)域,生成式AI 最早被應(yīng)用在了英語科目上,現(xiàn)在各個(gè)科目落地情況如何呢?

  楊元祖:為什么會(huì)最先應(yīng)用到英語上,是因?yàn)榇竽P陀行┦虑槭撬瞄L的,有些事情是它不擅長的。它擅長自然語言的理解,自然語言的交流交互,它可能不太擅長計(jì)算和推理。

  我們在研究大模型應(yīng)用場景的時(shí)候,一個(gè)思路是:要尋找一個(gè)對用戶有價(jià)值的場景,并且要發(fā)揮大模型擅長的能力,規(guī)避大模型不擅長的能力。那很顯然,英語口語對話是一個(gè)大模型天然擅長的能力。

  大模型擅長自然語言溝通,單單是這一點(diǎn)可能就適合所有科目,只要不讓它從頭到尾做一道題,而是把答案給它,讓它給講一遍,它都能做到。

  我們要把它最擅長的能力發(fā)揮到極致,不擅長的暫且規(guī)避一下。

  多知:告訴大模型答案,讓它發(fā)揮講解的能力,可以解決做數(shù)學(xué)題的幻覺問題嗎?

  楊元祖:其實(shí)做大模型的一直都非常關(guān)心,甚至整個(gè)研究領(lǐng)域都特別關(guān)心大模型數(shù)學(xué)題目能不能做對。首先大模型不會(huì)100%做對,跟人一樣,人也不會(huì)100%做對,但大模型跟人還是有差距。

  大模型的能力會(huì)越來越高,但我認(rèn)為,接下來一段時(shí)間內(nèi)它不可能達(dá)到一名真正老師的水平。但要把它落地到產(chǎn)品中去的時(shí)候,我們會(huì)去刻意地幫它“降級”,即我們給它答案,這樣對它邏輯推理的要求就會(huì)降低很多。

  我們給它答案它就會(huì)了,讓它只負(fù)責(zé)講,照著答案講。它并不是照本宣科讀一遍。我們甚至?xí)樦竽P偷?ldquo;脾氣”把答案告訴它,那它可能有更深的理解,可能用它自己的語言來表達(dá)。

  用這種方式就可以去規(guī)避它在準(zhǔn)確率方面的限制,但并不是說我們就不依賴它的準(zhǔn)確率。這背后比如我們要給它答案,那答案怎么出來呢? AI 能解決 90% 的問題(即給出正確答案),10% 的問題是人在幫助它解決,整個(gè)鏈路就變成了【我們要非常精確的答案】,需要【提前準(zhǔn)備好答案】,那【AI可以輔助我們提前準(zhǔn)備好答案】,然后【知道正確答案的大模型,把題目講解明白】,是這樣的一個(gè)邏輯。

  多知:猿力科技原有的產(chǎn)品加入大模型之后會(huì)有什么樣的改變?可以舉一兩個(gè)例子嗎?

  楊元祖:我舉幾個(gè)例子,比如斑馬App中“斑馬閱讀”這個(gè)產(chǎn)品,孩子閱讀完一篇文章之后,系統(tǒng)會(huì)向孩子提一個(gè)問題,比如“曹操為什么會(huì)感到很失望?”在大模型出現(xiàn)以前,讓機(jī)器來評估孩子的回答是很難的。

  現(xiàn)在,大模型可以多輪交互了,系統(tǒng)問一個(gè)問題,小朋友回答后,系統(tǒng)還能進(jìn)一步引導(dǎo)他。這是一個(gè)非常小的場景,甚至不是核心的場景,但是用戶體驗(yàn)發(fā)生了質(zhì)的變化。

  我再舉一個(gè)例子,比如大班課模式相比于1對1 模式,老師并不能關(guān)注所有的學(xué)生。但是, AI 在這件事情上又帶來了新的可能性,大班課能夠去支撐一個(gè)名師,同時(shí)AI可以實(shí)現(xiàn)關(guān)注所有的學(xué)生,這是大模型給原有產(chǎn)品在體驗(yàn)方面帶來質(zhì)的變化。

  在線大班課解決了一些教育資源不均衡的問題,但沒有解決個(gè)性化教育的問題。當(dāng)時(shí)不做1對1,本質(zhì)是因?yàn)闆]有那么多好老師,而AI有可能解決這個(gè)本質(zhì)矛盾。

  大模型讓我們第一次有了解決本質(zhì)矛盾的辦法,這也是我們努力的方向,但不是說現(xiàn)在開發(fā)一個(gè)產(chǎn)品就解決了,還很遠(yuǎn)。

  多知:雙師大班課原來是由輔導(dǎo)老師去關(guān)注所有學(xué)生吧?

  楊元祖:輔導(dǎo)老師也不可能實(shí)時(shí)關(guān)注所有人。老師問學(xué)生一個(gè)問題(指主觀題),孩子用語音直接回答,系統(tǒng)是沒有辦法給反饋的,而大模型第一次給了我們這樣的一個(gè)機(jī)會(huì),可以給所有學(xué)生反饋。

  我們會(huì)發(fā)現(xiàn)“工具集”更加豐富了,這個(gè)“工具集”使得我們重新去思考教育解決方案有什么樣的提升空間。

  多知:可以理解為這個(gè)工具集更豐富了之后,以前產(chǎn)品的各個(gè)環(huán)節(jié)都可以用大模型重新做一遍?

  楊元祖:是這樣的。

  多知:這意味著不一定非得是一個(gè)原生的AI應(yīng)用才是教育領(lǐng)域該做的?

  楊元祖:我認(rèn)為AI Native或者AI原生,從這個(gè)角度去出發(fā)去打造一個(gè)產(chǎn)品,就像拿個(gè)錘子去找釘子,反而不一定是靠譜的。

  我們公司一直以來的一個(gè)做法是從用戶場景出發(fā)。不是因?yàn)槲覀冇辛艘粋€(gè)大模型,所以,就讓大模型去上課。相反,我們希望“上課場景”在大模型下能夠做得更好。因?yàn)楣ぞ呒呢S富和進(jìn)步,使得我們第一次有機(jī)會(huì)可以以新的方式來提供服務(wù)。

  從這個(gè)邏輯來看它有可能是原有的場景,在體驗(yàn)方面得到了極大的提升,也有可能是原來不可能的場景,現(xiàn)在又有了新的機(jī)會(huì)。從來都應(yīng)該是從用戶需求出發(fā)往回找工具,然后再來用。

  多知:像海豚AI學(xué)屬于有了一個(gè)場景,有了用戶的需求,剛好可以結(jié)合AI老師答疑?

  楊元祖:是的。我們來思考一個(gè)教育的產(chǎn)品或者教育的解決方式,一般可分為兩種解決方案:一種是靜態(tài)的視頻內(nèi)容,加上一定的規(guī)劃;另外一種是有真人老師交互的,老師可以做很多事情,比如答疑等。

  海豚AI學(xué)剛剛開始做的時(shí)候,我們認(rèn)為可能是第一個(gè)方向。但是大模型的發(fā)展使得我們有了一個(gè)新的機(jī)會(huì),我們發(fā)現(xiàn)在這兩個(gè)形式之間可能存在另外一個(gè)機(jī)會(huì),即它不一定是靜態(tài)的內(nèi)容,它可以是一個(gè)可交互的視頻內(nèi)容,那能不能把靜態(tài)內(nèi)容、產(chǎn)品形態(tài)做一次更迭?

  理論上用戶是需要交互、需要實(shí)時(shí)反饋的,因?yàn)檫@件事情是人們學(xué)習(xí)過程中必然需要的。所以這時(shí)候我們想,能不能不通過真人老師來滿足這個(gè)需求,而是通過 AI 老師來滿足?

  因此,海豚AI學(xué)更遠(yuǎn)大的目標(biāo),是希望創(chuàng)造一套可交互的內(nèi)容,它是教育領(lǐng)域的第三種解決方案。

  目前海豚AI學(xué)已經(jīng)發(fā)布的幾個(gè)場景,比如AI答疑,它是一個(gè)很強(qiáng)的場景,原來靜態(tài)的視頻資源解決不了答疑的問題,只能去找輔導(dǎo)老師,而現(xiàn)在AI能做到,比如看一個(gè)視頻的時(shí)候,老師講到這一句話學(xué)生沒聽懂,以前學(xué)生是去問輔導(dǎo)老師,但現(xiàn)在可以在視頻旁邊加個(gè)按鈕,學(xué)生可以直接點(diǎn)擊提問,然后AI直接答疑。

  

  (海豚AI學(xué)App中的“AI答疑”功能)

  未來,海豚AI學(xué)肯定會(huì)越來越AI,越來越可交互化。

  多知:用戶對海豚AI學(xué)的反饋是什么樣的?

  楊元祖:整體來說用戶對海豚AI學(xué)的認(rèn)可度是超過預(yù)期的,我沒有具體的數(shù)據(jù)和指標(biāo),這是一個(gè)比較感性的維度。超預(yù)期是因?yàn)楫吘乖瓉頉]有辦法解決,現(xiàn)在能有一個(gè)辦法解決,哪怕這個(gè)準(zhǔn)確率還沒有到完美的狀態(tài),但它是一個(gè)從無到有的過程,這是一個(gè)非常顯式的增量。

  多知:我們發(fā)現(xiàn)斑馬正在內(nèi)測一個(gè)AI英語口語對練的功能“Hi, Zerd”,其背后是不是有游戲引擎?因?yàn)樵诔霈F(xiàn)一些詞語時(shí),屏幕中會(huì)彈出相應(yīng)的動(dòng)畫形象。

  楊元祖:是的,其實(shí)我們猿輔導(dǎo)很早就探索過這個(gè)事情,不是AI,而是內(nèi)容角度。好多年前,大家都說老師在線上課的內(nèi)容,要么用視頻,要么是靜態(tài)的PPT。但我們當(dāng)時(shí)的看法就覺得還有其他的方法,就是一個(gè)小游戲。老師在帶著你玩一個(gè)RPG(角色扮演)游戲,它是一步步往前闖關(guān),是老師控制。

  所以我們可能一開始就是覺得內(nèi)容不一定是只有視頻和課件,它應(yīng)該還有非常多的游戲,我們叫互動(dòng)課件。

  我們怎么樣批量生產(chǎn)那么多的小游戲作為上課的內(nèi)容?這其實(shí)是挺難的一件事。為此,我們曾經(jīng)還花很長時(shí)間去構(gòu)建小游戲的生產(chǎn)流程,但這需要很多研發(fā)工程師,成本太高了。

  而現(xiàn)在,在 AI 時(shí)代又有可能。如果是視頻,AI沒辦法去做,因?yàn)橐曨l點(diǎn)“暫停”體驗(yàn)太差了。但如果是游戲的話,就變成像AI一步步帶著學(xué)生往前闖關(guān),走這條路,走那條路。所以在 AI 時(shí)代這個(gè)技術(shù)的基礎(chǔ)又有價(jià)值了,這個(gè)小游戲以前是老師帶著往前闖關(guān),那未來也可以由 AI 帶著往前闖關(guān)。

  多知:除了海豚AI學(xué)、斑馬,還有哪些產(chǎn)品應(yīng)用了大模型?

  楊元祖:我們大部分的產(chǎn)品都用了大模型技術(shù)。只是它會(huì)隱藏在交互的后面,而不是說就突然多了一個(gè)聊天框,就可以聊天了。大模型對我們來講是“技術(shù)”,不是“產(chǎn)品”,它應(yīng)該在產(chǎn)品中發(fā)揮價(jià)值。

  03

  AI引發(fā)新的協(xié)作方式,猿力科技組建“預(yù)研團(tuán)隊(duì)”

  多知:大模型應(yīng)用在教育場景的難點(diǎn)在哪里?

  楊元祖:任何一個(gè)大模型的應(yīng)用都會(huì)面臨有幻覺、準(zhǔn)確率不高等問題,這些改變是困難的,比如準(zhǔn)確率可以從百分之七十八十提高到百分之九十。但這些都不是最困難的,最困難的是找到一個(gè)對用戶有價(jià)值且大模型可以實(shí)現(xiàn)的場景。

  這件事情第一次被分到了兩個(gè)人身上,以前技術(shù)要做什么事情,產(chǎn)品經(jīng)理去了解用戶的需求,然后把用戶場景給抽象出來,產(chǎn)品經(jīng)理能夠判斷這東西能不能做?,F(xiàn)在我們第一次面對這樣的困境——懂大模型的技術(shù)人員不知道這件事情對用戶有沒有價(jià)值,懂用戶的產(chǎn)品經(jīng)理認(rèn)為這件事情有可能有價(jià)值,但是他沒有辦法判斷大模型能不能實(shí)現(xiàn)。

  這對于整個(gè)產(chǎn)品研發(fā)的團(tuán)隊(duì)來說是一個(gè)巨大的挑戰(zhàn)。

  多知:那猿力科技是怎么解決的呢?

  楊元祖:我們覺得這是很難的,它唯一的解決方式,就是得把兩個(gè)團(tuán)隊(duì)拉得更近。因?yàn)槟阕寖蓚€(gè)團(tuán)隊(duì)一塊來思考一個(gè)問題,其實(shí)是非常難的事情。拉得更近意味著需要讓產(chǎn)品經(jīng)理來更多地去明白、去理解、去擁抱、去探索這個(gè)事情到底是否可行,同時(shí),研發(fā)團(tuán)隊(duì)也需要更多地參與用戶側(cè),到底對哪些場景、哪個(gè)技術(shù)再往前推一點(diǎn)點(diǎn),有可能對用戶產(chǎn)生很大的價(jià)值。這件事情有可能需要長期的溝通合作。

  這里面還有另外一個(gè)更大的問題,比如產(chǎn)研只能模糊地判斷它有可能實(shí)現(xiàn),有可能對用戶有價(jià)值,因?yàn)樗麑τ脩粲袥]有價(jià)值這件事情也取決于實(shí)現(xiàn)的程度。比如準(zhǔn)確率90%肯定有價(jià)值,80%就沒有價(jià)值。所以永遠(yuǎn)都看得是模糊的。

  此前,至少我們公司成立那么多年來,我們大部分做的事情都是確定的,大部分產(chǎn)品研發(fā)都是確定的。什么叫確定?比如,我們要做一個(gè)小猿口算就需要拍照識(shí)別,大部分情況我們都能判斷它技術(shù)是可達(dá)的。只是我們需要花時(shí)間,花三個(gè)月、六個(gè)月去做,大部分都是確定的。

  但現(xiàn)在,我們發(fā)現(xiàn)目標(biāo)都不一定是確定的,因?yàn)檫@個(gè)東西它有可能怎么做都不行,也有可能怎么做都達(dá)不到用戶可用的狀態(tài),所以“模糊”對一個(gè)公司來講是一個(gè)很大的問題。

  那我們怎么解決呢?說大家得擁抱不確定性,但這個(gè)事情是比較虛的,需要團(tuán)隊(duì)的學(xué)習(xí)和適應(yīng)。落到實(shí)處那我們還要去組建一個(gè)新的團(tuán)隊(duì),這個(gè)新的團(tuán)隊(duì)是構(gòu)建在產(chǎn)品團(tuán)隊(duì)和技術(shù)團(tuán)隊(duì)之間,他們?nèi)プ黾夹g(shù)的預(yù)研。

  這個(gè)團(tuán)隊(duì)不是做技術(shù)的研究,也不是產(chǎn)品經(jīng)理去定義然后交給技術(shù)團(tuán)隊(duì)去開發(fā)。而是團(tuán)隊(duì)認(rèn)為這個(gè)場景可能是有價(jià)值的,那能不能把它做出來看一看,一方面判斷技術(shù)是可行的,一方面再去判斷對用戶是有價(jià)值的,會(huì)有一個(gè)中間狀態(tài)。

  多知:現(xiàn)在猿力科技已經(jīng)有這樣一個(gè)“預(yù)研”團(tuán)隊(duì)了?

  楊元祖:已經(jīng)有了,很小的團(tuán)隊(duì),我們在嘗試一種新的協(xié)作方式。

  多知:看起來這是大模型和教育應(yīng)用場景結(jié)合的新產(chǎn)物,改變了組織形態(tài)。

  楊元祖:是的,我不知道有多少人意識(shí)到這個(gè)問題對于事情的影響面,但我認(rèn)為,這非常影響大模型怎么跟具體的應(yīng)用結(jié)合起來往前推進(jìn)。

  多知:對教育領(lǐng)域來說,哪些場景不需要“預(yù)研”?哪些場景需要?

  楊元祖:比如口語陪練我會(huì)認(rèn)為兩端的不確定性都偏小。

  AI外教也是一個(gè)可以探索的方向,我們也會(huì)做技術(shù)的預(yù)研,我們會(huì)去看到它到底能做到什么程度。但我個(gè)人會(huì)比較樂觀,因?yàn)槲視?huì)覺得確實(shí)有可能能夠給孩子上課,但肯定不會(huì)是那么短時(shí)間內(nèi)馬上包裝一下就能出來的,完全不是這樣的。像Call Annie 類似產(chǎn)品不構(gòu)成“課”,要變成“課”還有非常多的事情要做。

  還有一些場景它其實(shí)兩端都不確定,即“對用戶有沒有價(jià)值”是不確定的,“對技術(shù)能不能實(shí)現(xiàn)”也是不確定的,那這個(gè)事情就需要預(yù)研。

  多知:預(yù)研團(tuán)隊(duì)是不是具備兩者的能力,就是產(chǎn)品經(jīng)理中懂技術(shù)的,技術(shù)中懂產(chǎn)品的?

  楊元祖:對,但是,并不一定是一個(gè)人需要懂兩個(gè)方面,而是這個(gè)團(tuán)隊(duì)的協(xié)作方式是偏向兩者的。原來大部分的產(chǎn)品工程團(tuán)隊(duì)和研究團(tuán)隊(duì)是“線性”協(xié)作,但預(yù)研團(tuán)隊(duì)則是每天的工作都在一起的。

  04

  “大模型是教育未來發(fā)展的最大變量”

  多知:聽說過“猿輔導(dǎo)本質(zhì)上是一個(gè)AI公司”,您怎么看?

  楊元祖:總體來說,我們很多的產(chǎn)品、很多的場景都是因?yàn)橛?nbsp;AI 技術(shù)才有可能去構(gòu)建,我們整個(gè)未來的發(fā)展也是寄托在 AI 等級越來越強(qiáng)的基礎(chǔ)之上。

  多知:“很多產(chǎn)品都是因?yàn)橛?nbsp;AI 才可能做”,包括哪些產(chǎn)品?

  楊元祖:包括猿題庫、小猿搜題、小猿口算,這些最核心的場景就是AI識(shí)別批改,整個(gè)產(chǎn)品的主流程都基于AI的基礎(chǔ)之上的;再如斑馬App、海豚AI學(xué),核心的能力都是 AI 賦予的。

  

  (猿輔導(dǎo)英語課程口語評測“配音小達(dá)人”板塊于2021年上線)

  多知:從猿力科技10余年的發(fā)展歷程來說,在技術(shù)上有哪些重要的發(fā)展節(jié)點(diǎn)?

  楊元祖:我們從 2012 年開始做猿題庫,一開始我們希望能“用科技改變教育”,一開始這就是我們的 Slogan 。事實(shí)上,我們的思考方式和做事方式并不是我們有哪些技術(shù),我們掌握了哪些技術(shù),然后去看這些技術(shù)怎么樣去改變教育,不是這樣的。

  我們經(jīng)常是這樣地思考問題,永遠(yuǎn)是從需求出發(fā),然后看我們工具集里面有哪些技術(shù)解決用戶的需求。這個(gè)技術(shù)不限于我們自身,甚至是全世界,很多時(shí)候技術(shù)可以直接拿來用。比如說直播、互聯(lián)網(wǎng)或者是基礎(chǔ)設(shè)施的發(fā)展,它其實(shí)都在一定程度上是我們直接拿過來用,然后用戶的這個(gè)需求就被滿足了,用戶就受益了。

  同樣也會(huì)出現(xiàn)理論上這個(gè)事情是可行的,但是還沒有一個(gè)現(xiàn)成的技術(shù)能直接被我們使用,所以我們需要在這上面去做額外的投入,我們需要去把我們認(rèn)為可行的東西真正地落實(shí)。

  從這個(gè)角度來看,我們確實(shí)會(huì)碰到好幾個(gè)時(shí)間節(jié)點(diǎn)。

  舉個(gè)簡單的例子,2012年我們開始做題庫的時(shí)候就設(shè)定了是自適應(yīng)學(xué)習(xí),有一個(gè)推題功能,那“推題”這件事情其實(shí)有一些現(xiàn)成的研究結(jié)論是可以為我們所用的,比如項(xiàng)目反應(yīng)理論等一些教育質(zhì)量相關(guān)的技術(shù)可以用。但我們最初發(fā)現(xiàn)效果并不好,后來才發(fā)現(xiàn)深度學(xué)習(xí)有可能在這上面是有用的。

  我認(rèn)為關(guān)鍵的是我們做了一個(gè)決策開始做這件事情,然后去籌備團(tuán)隊(duì),正式成立AI Lab。

  所以,真正的節(jié)點(diǎn)不是做一個(gè)產(chǎn)品出來,而是說做出一個(gè)決策。這件事情值得我們?nèi)ネ度?,值得我們?nèi)ヌ剿?,因?yàn)樗皇且粋€(gè)現(xiàn)成的技術(shù),而是一個(gè)我們需要去探索,而且假設(shè)我們不去做,其他沒有人會(huì)去做。

  AI Lab之后的發(fā)展可能是連續(xù)的,它不是一個(gè)節(jié)點(diǎn),可能是成果的展現(xiàn)。因?yàn)锳I Lab 建立起來,我們開始做題目推薦,慢慢地我們原有的產(chǎn)品場景里面從視覺、語音、閱讀理解等方面能夠得到應(yīng)用,慢慢這個(gè)事情就很順了。

  對于用戶來講是非常重要的場景,但是現(xiàn)有技術(shù)并不能立即實(shí)現(xiàn),那我們就會(huì)做出關(guān)鍵的決策。

  到后來,我們要開始做大模型這件事情也是一個(gè)非常重要決策。

  多知:大模型或者生成式AI在猿力科技的戰(zhàn)略地位是怎樣的?

  楊元祖:大模型肯定是教育解決方案接下來改進(jìn)的最大的變量。假設(shè)沒有大模型,我們也會(huì)一直迭代我們的產(chǎn)品,但相對來說是比較漸進(jìn)的。但大模型理論上來說帶來了全新的變量,使得我們可以重新審視教育解決方案,從這個(gè)角度說再怎么重視都不為過。

  但是,并不是說大家天天要討論大模型,有什么好討論的?最需要的是一個(gè)組織的擁抱,是大家去做這方面的學(xué)習(xí),以及資金的投入。 最核心的問題還是我們怎樣去探索落地速度更快。

  多知:速度是不是非常關(guān)鍵?

  楊元祖:既關(guān)鍵也沒有那么關(guān)鍵。關(guān)鍵的意思是不能完全不去看它,但是,也不是越快越好的,很多時(shí)候是需要找到對用戶最有價(jià)值的時(shí)間節(jié)點(diǎn),并不是越早推出越好。有可能越早技術(shù)還不成熟,反而會(huì)消耗用戶的熱情,所以就是一直得做,并不是為了追求速度而追求速度。

  AI 所帶來的機(jī)會(huì)是非常革命性的,但是真的是剛剛起步,AI對教育的改變也是剛剛起步。

  多知:很多觀點(diǎn)認(rèn)為教育將是生成式AI最大的落地場景之一,您怎么看?

  楊元祖:對于我們來說,一方面,我們公司本身應(yīng)該就是教育是最大的業(yè)務(wù)板塊,教育是我們最核心的業(yè)務(wù),這個(gè)是毫無疑問的。另一方面,我們確實(shí)從大模型所帶來的變化來判斷,教育也應(yīng)該是最大的。現(xiàn)在的大模型所具備的能力,哪怕是當(dāng)前的能力,它已經(jīng)可能帶動(dòng)巨大的變化。

  哪怕我們不去依賴它的邏輯推理能力,就單單說自然語言溝通的能力,這件事情本身就是一個(gè)巨大的變更。比如,我們在原來教育的場景上做了 10 多年,但都不具備人機(jī)的自然語言交互能力,并不是用戶沒有需求,而是供給端不具備這個(gè)能力。

  對于大模型的能力我們還在挖掘中,還沒有完完全全的落地,也沒有完完全全把這件事情做好,它已經(jīng)能夠帶來巨大的變化了。

  目前大模型對于教育行業(yè)的改變還非常初期,甚至不是在等待說這個(gè)技術(shù)再一次提升,使得產(chǎn)品還有更多功能,而是怎么把它用好這件事情還是在非常初期的階段。

  因?yàn)橛煤貌蝗菀?,就是相?dāng)于以往的技術(shù)就一直就有的,但是要把它做出一個(gè)好的產(chǎn)品出來,這個(gè)過程本身是需要一定時(shí)間的。

  多知:猿力科技對生成式AI方面還有哪些規(guī)劃嗎?

  楊元祖:多模態(tài),我覺得這個(gè)是繞不過去的。今年的OpenAI或者是說整個(gè)業(yè)界的研究人員都認(rèn)為多模態(tài)是今年的重點(diǎn)。我會(huì)覺得多模態(tài)搞完之后大模型的拼圖就完整了。

  教育對于原生多模態(tài)的需求會(huì)遠(yuǎn)大于其他領(lǐng)域。

  我舉一個(gè)例子,就是自然語言的交流這件事情,原來是把自然語言轉(zhuǎn)換成文字,文字再教給大模型去。但它丟失了非常多的語調(diào)信息。這件事情有可能在其他場景里,都不是那么重要。就比如說在工作場景,書面的信息就夠了。但是在教育場景里面這個(gè)信息非常重要,有可能比所有其他領(lǐng)域都要重要,所以我們對這件事情的預(yù)期和對這件事情的投入是非常大的。

  比如說多音字的問題,“正月”是讀“zhēng yuè”,還是“zhèngyuè”,讀出來很關(guān)鍵。還有比如學(xué)生問“答案是 5 嗎?”他語速稍微慢一點(diǎn),它都不能識(shí)別,不一樣的語速就可能是不一樣的信息。所以多模態(tài)對教育來說非常重要。

  多知:在教育領(lǐng)域,AI是新進(jìn)入者的機(jī)會(huì)嗎?

  楊元祖:我不確定,有一種說法,就是 AI 這一波機(jī)會(huì)其實(shí)更多的是給原有的玩家更好的工具,而不是給新進(jìn)入者顛覆的機(jī)會(huì),是因?yàn)榇_實(shí)它還得依賴原來的東西才能更好。所以它好像更多的還是原有玩家提升的機(jī)會(huì),如果你不提升就落后了,對于一個(gè)新進(jìn)入者,可能并沒有那么友好。這是一種觀點(diǎn),我比較偏向這個(gè)觀點(diǎn)。

  但也有一些人說,對創(chuàng)業(yè)的公司,新進(jìn)入的公司可能有一個(gè)顛覆老選手的機(jī)會(huì)。這是另外一種觀點(diǎn)。

  在我看來,人和資金并不一定是最重要的,重要的是場景。假設(shè)說 AI native,單單很小的一個(gè)場景就解決了所有問題,而原來那個(gè)場景又笨又重,這種情況下有可能會(huì)被顛覆。但如果這個(gè)場景能使得原有的體驗(yàn)做得更好,那原有的參與者做更適合。因?yàn)樾氯刖终咭言心遣糠挚紤]進(jìn)來,進(jìn)而才能再做優(yōu)化。

  END

  本文作者:王上