數(shù)千人的真實(shí)聊天記錄。
多知8月6日消息,《華盛頓郵報》針對聊天工具的聊天對話總結(jié)出了人們用AI聊天機(jī)器人都做什么,根據(jù) WildChat 中的近 40000 次英文對話可以分析得出,有關(guān)家庭作業(yè)輔導(dǎo)請求超過六分之一,是人們用AI聊天機(jī)器人位居第二的需求。
《華盛頓郵報》提到,數(shù)千人使用聊天機(jī)器人的偏好是:21% 的人使用聊天機(jī)器人進(jìn)行創(chuàng)意寫作,18% 的人使用聊天機(jī)器人進(jìn)行家庭作業(yè)輔導(dǎo),17% 的人使用聊天機(jī)器人進(jìn)行搜索,15% 的人使用聊天機(jī)器人進(jìn)行工作,7% 的人使用聊天機(jī)器人進(jìn)行編碼……
在有關(guān)家庭作業(yè)的請求中,基本是要求AI聊天機(jī)器人給出答案,而聊天機(jī)器人通常會滿足要求。這個問題一直令人擔(dān)憂。
多知觀察到,當(dāng)前,在教育科技企業(yè)有一個共識是:通用大模型喜歡直接給答案,而教育大模型則希望步步引導(dǎo),不要直接給答案。
這份調(diào)研是《華盛頓郵報》查看了研究數(shù)據(jù)集 WildChat 中的近 20 萬條英語對話,其中包括兩個基于與 ChatGPT 相同底層技術(shù)構(gòu)建的 AI 聊天機(jī)器人的消息。這些對話構(gòu)成了現(xiàn)實(shí)世界中最大的人機(jī)交互公共數(shù)據(jù)庫之一。研究人員表示,這些對話在很大程度上代表了人們?nèi)绾问褂昧奶鞕C(jī)器人,例如 ChatGPT。
Allen人工智能研究所的博士后Yuntian Deng表示:“這項(xiàng)研究的最大動機(jī)是,這全部是真實(shí)的用戶互動的數(shù)據(jù),而不是在實(shí)驗(yàn)室中進(jìn)行的互動。”
《華盛頓郵報》最終分析包括了與 WildChat 的近 40000 次對話,重點(diǎn)關(guān)注每個用戶每天提交的第一個提示,這項(xiàng)研究得到了用戶的授權(quán)。
《華盛頓郵報》的分類是基于對 458 篇此類對話的隨機(jī)抽樣,其中有一些問題是交叉的,不過,《華盛頓郵報》記者均手動進(jìn)行了分類,抽樣誤差幅度約為 5%。
以下是《華盛頓郵報》了解到的數(shù)千人如何使用聊天機(jī)器人的信息:
《華盛頓郵報》在抽查的對話記錄中,五分之一的請求涉及要求機(jī)器人幫助撰寫同人小說、電影劇本、笑話或詩歌,或參與角色扮演。人們還使用聊天機(jī)器人來幫助命名企業(yè)、創(chuàng)造書中人物和撰寫對話。
有超過六分之一的對話是學(xué)生尋求家庭作業(yè)幫助。有些人像導(dǎo)師一樣接近機(jī)器人,希望更好地理解某個學(xué)科領(lǐng)域。其他人則從在線課件軟件中復(fù)制粘貼多項(xiàng)選擇題,并要求機(jī)器人給出正確答案,而機(jī)器人通常會滿足要求。
聊天機(jī)器人通常使用公開數(shù)據(jù)進(jìn)行訓(xùn)練,這些數(shù)據(jù)包括在線文章、教科書或歷史著作。這使得它們成為希望總結(jié)歷史文本和回答地理問題的學(xué)生的選擇。但這種做法也存在風(fēng)險。聊天機(jī)器人實(shí)際上并不理解它們在說什么;它們只是在模仿人類的語言,而且它們還會產(chǎn)生幻覺和捏造信息。
教育工作者一直在努力應(yīng)對人工智能學(xué)習(xí)的突然涌入。一些大學(xué)使用人工智能文本檢測器來嘗試捕捉學(xué)生作業(yè)中生成的一些信息,但這些系統(tǒng)并不完善,有時會冤枉無辜的學(xué)生。
大約 5% 的對話是人們詢問個人問題,例如調(diào)情的建議或者一些情感問題。很多人把聊天機(jī)器人當(dāng)成了免費(fèi)的建議者。
WildChat 的對話中很大一部分涉及計算機(jī)編碼。約有 7% 的對話請求幫助編寫、調(diào)試或理解計算機(jī)代碼。另外 1% 被歸類為家庭作業(yè)幫助,但涉及編碼作業(yè)的問題。
大約 15% 的對話似乎與工作有關(guān),包括撰寫演示文稿、自動執(zhí)行電子商務(wù)任務(wù)或起草電子郵件等。
除了那些尋求在線助手的人之外,另外 2% 的對話尋求幫助找工作、尋求幫助寫簡歷或求職信、或準(zhǔn)備面試。
根據(jù)《華盛頓郵報》的分析,大多數(shù)人只使用過 WildChat 的機(jī)器人一次。但有少數(shù)超級用戶幾乎每天都與機(jī)器人聊天。一名用戶在 201 天內(nèi)與機(jī)器人進(jìn)行了 13213 次對話。另一名用戶在 350 天內(nèi)與機(jī)器人進(jìn)行了 5960 次對話——幾乎是 每一天都活躍在WildChat。
值得注意的是,在與倆天機(jī)器人聊天有很大的信息安全問題?!度A盛頓郵報》在WildChat 中的 5000 次對話,發(fā)現(xiàn)了用戶的全名、雇主名稱和其他個人信息。研究員認(rèn)為,人類很容易被哄騙而信任聊天機(jī)器人。