可以展示教科書中的數(shù)學問題并要求分步解決方案。
多知12月14日消息,本周四,是在OpenAI 為期 12 天的盛會的第六天,該公司在直播中表示,其為 ChatGPT 開發(fā)的類似人類的對話功能“ChatGPT Advanced Voice (高級語音模式)”正在實現(xiàn)視覺化,Advanced Voice由OpenAI的多模態(tài)模型GPT-4o支持。這意味著OpenAI 終于發(fā)布了近七個月前演示的ChatGPT實時視頻功能,但目前不是向全部用戶開放。
同時,OpenAI宣布,整個 12 月,ChatGPT Advanced Voice 都會獲得新的圣誕老人“Ho Ho Ho”的聲音。第一次使用時,OpenAI 甚至會將用戶的 Advanced Voice 消息重置為零,以便用戶可以通話更長時間。
使用 ChatGPT 應用,訂閱ChatGPT Plus、Team或Pro 的用戶可以將手機對準物體,ChatGPT 會近乎實時地做出響應。
帶視覺的ChatGPT Advanced Voice還可以通過屏幕共享了解設備屏幕上的內(nèi)容。例如,展示案例中給咖啡壺拍照讓ChatGPT教授如何制作手沖咖啡。用戶還可以上傳植物的照片并詢問養(yǎng)護技巧,或者展示教科書中的數(shù)學問題并要求分步解決方案。
今年5月,OpenAI在推出GPT-4o時演示了語音模式Voice Mode。可以說,這種多模態(tài)的交互方式非常適合教育場景,當時,OpenAI展示這項功能時就邀請了Salman Khan讓GPT-4o輔導兒子Imran學習數(shù)學的視頻,GPT-4o會聽會說會看。
要使用視覺進入ChatGPT Advanced Voice,點擊 ChatGPT 聊天欄旁邊的語音圖標,然后點擊左下角的視頻圖標,即可開始視頻。要共享屏幕,點擊三點菜單并選擇“共享屏幕”。
ChatGPT Advanced Voice支持50多種語言,展現(xiàn)AI陪伴工具體驗感提升,為AI教育工具示范。
不過,OpenAI 表示,帶視覺的高級語音模式本周四開始推出,并于下周結(jié)束。但并非所有用戶都能獲得訪問權(quán)限。
此外,OpenAI 表示,ChatGPT Enterprise 和 Edu 用戶要到明年 1 月才能獲得該功能,而且對于歐盟、瑞士、冰島、挪威等ChatGPT 用戶,它還沒有時間表。
除了帶視覺的高級語音模式外,OpenAI 周四還推出了節(jié)日“圣誕老人模式”,該模式將圣誕老人的聲音作為 ChatGPT 中的預設語音添加。用戶可以通過點擊或單擊 ChatGPT 應用中提示欄旁邊的雪花圖標來找到它。
在OpenAI 為期 12 天的盛會已經(jīng)進行了7天,很多預覽產(chǎn)品已經(jīng)正式推出,包括視頻模型Sora、ChatGPT o1模型等。