科技日?qǐng)?bào)北京3月3日電 (記者劉霞)美國阿肯色大學(xué)科學(xué)家開展了一項(xiàng)最新研究,讓151名人類參與者與人工智能(AI)工具ChatGPT-4在3項(xiàng)測(cè)試中進(jìn)行對(duì)決,以評(píng)估二者的發(fā)散思維。結(jié)果顯示,AI的表現(xiàn)優(yōu)于人類。相關(guān)論文發(fā)表于最新一期《科學(xué)報(bào)告》雜志。
發(fā)散思維是創(chuàng)造性思維的衡量指標(biāo),其特點(diǎn)是能對(duì)沒有預(yù)期解決方案的問題提出獨(dú)特的答案。在最新研究中,GPT-4提供了比人類參與者更新穎、更精細(xì)的答案。
最新研究使用的3項(xiàng)測(cè)試分別是“替代用途任務(wù)”“結(jié)果任務(wù)”及“發(fā)散聯(lián)想任務(wù)”。“替代用途任務(wù)”要求參與者針對(duì)繩索或叉子等日常物品,提出創(chuàng)造性用途;“結(jié)果任務(wù)”要求參與者想象假設(shè)情況的可能結(jié)果,如人類不再需要睡眠會(huì)怎么辦;“發(fā)散聯(lián)想任務(wù)”則要求參與者提供10個(gè)語義上盡可能遙遠(yuǎn)的名詞。“狗”和“貓”之間的語義距離不大,而“貓”和“本體論”等詞之間的語義距離很大。
研究團(tuán)隊(duì)對(duì)人類和AI工具回答問題的數(shù)量、長度和單詞間的語義差異進(jìn)行了評(píng)估。結(jié)果發(fā)現(xiàn),在每一項(xiàng)發(fā)散性思維任務(wù)上,GPT-4提供的答案都比人類提供的答案更具獨(dú)創(chuàng)性,且更精確。換言之,在一整套發(fā)散性思維任務(wù)中,GPT-4都表現(xiàn)出了更高的創(chuàng)造力。
研究負(fù)責(zé)人之一、阿肯色大學(xué)心理學(xué)博士生肯特·休伯特表示,最新研究也有一些需要注意的地方,如研究中使用的指標(biāo)都是對(duì)創(chuàng)造潛力的衡量,但參與創(chuàng)造性活動(dòng)或獲得成就是衡量創(chuàng)造能力的另一個(gè)方面。此外,AI依賴人類用戶的幫助,除非得到提示,否則AI的創(chuàng)造力一直處于停滯狀態(tài)。
盡管如此,研究團(tuán)隊(duì)強(qiáng)調(diào),大型語言模型正在迅速發(fā)展,并以前所未有的方式超越人類。它們能否取代人類的創(chuàng)造力還有待觀察。但不管怎樣,讓AI作為靈感工具,為人類的創(chuàng)造性活動(dòng)提供幫助已是指日可待。
【關(guān)閉】