子曰-o1已在網(wǎng)易有道旗下的AI全科學(xué)習(xí)助手“有道小P”中落地應(yīng)用。
多知1月22日消息,網(wǎng)易有道公眾號官宣,其正式推出國內(nèi)首個(gè)輸出分步式講解的推理模型“子曰-o1”。作為14B輕量級單模型,子曰-o1支持在消費(fèi)級顯卡上進(jìn)行部署,采用思維鏈技術(shù),能夠提供細(xì)致解題過程,以強(qiáng)邏輯和推理能力,實(shí)現(xiàn)更高的解題準(zhǔn)確性,并提供中文邏輯推理。
子曰-o1已正式對外開源。
據(jù)介紹,子曰-o1開源模型目前選擇了較小參數(shù)規(guī)模的基礎(chǔ)模型,能夠進(jìn)行單卡部署并具備更強(qiáng)的數(shù)學(xué)能力。在此基礎(chǔ)上,子曰-o1開源模型進(jìn)一步實(shí)現(xiàn)了輕量化,能夠在消費(fèi)級顯卡上運(yùn)行,并且提供與云端部署質(zhì)量相一致的模型質(zhì)量。
同時(shí),子曰-o1采用思維鏈技術(shù),推出了輸出分步式講題的思維鏈模型,以14B小參數(shù)規(guī)??蓮?fù)現(xiàn)OpenAI o1的單模型推理能力。據(jù)悉,子曰-o1在解題時(shí)會形成較長的思維鏈條,使其運(yùn)行思路更接近于人類的思考方式,通過“自言自語”、自行糾錯(cuò)的方式,提供分步解題過程及最終結(jié)果。作為教育垂類模型,子曰-o1的這一特性也與教育應(yīng)用產(chǎn)品更為適配。
面向教育領(lǐng)域應(yīng)用,子曰-o1在長思維鏈所實(shí)現(xiàn)的高準(zhǔn)確度上,進(jìn)一步從數(shù)據(jù)篩選、訓(xùn)練指令等方面優(yōu)化。通過應(yīng)用有道自研的自動化評估方式,子曰-o1不僅對最終答案的正確性進(jìn)行評估,同時(shí)還覆蓋了整個(gè)講解過程,確保學(xué)習(xí)數(shù)據(jù)的高質(zhì)量。
當(dāng)前,子曰-o1已在網(wǎng)易有道旗下的AI全科學(xué)習(xí)助手“有道小P”中落地應(yīng)用。