新華社舊金山6月3日電 硅谷手記|AI抄襲背后的硅谷“不光彩文化”
新華社記者吳曉凌 黃堃
“‘作假,直至成功’,這是硅谷不光彩的文化?!泵绹固垢4髮W(xué)人工智能實驗室主任克里斯托弗·曼寧3日就該校某些研究人員抄襲中國清華大學(xué)等機(jī)構(gòu)成果的行為這樣評論說。他在社交媒體上還指出,該研究團(tuán)隊?wèi)?yīng)該深刻認(rèn)識自己的錯誤。
圖為2024年5月30日,在瑞士日內(nèi)瓦舉行的2024年“人工智能造福人類全球峰會” 上,參會者和中國移動開發(fā)的AI機(jī)器人下棋。(新華社記者連漪攝)
5月29日,斯坦福大學(xué)一個研究團(tuán)隊發(fā)布名為Llama3-V的大模型,聲稱只要500美元的預(yù)訓(xùn)練成本,就能用它獲得比肩GPT-4V等著名大模型的效果。這一消息在社交媒體和人工智能學(xué)術(shù)界被廣泛轉(zhuǎn)發(fā)。
但業(yè)內(nèi)人士很快發(fā)現(xiàn),該大模型涉嫌抄襲清華大學(xué)等機(jī)構(gòu)發(fā)布的 MiniCPM-Llama3-V 2.5大模型。它們都是基于開源的Llama3大模型,但清華團(tuán)隊進(jìn)行了獨特的訓(xùn)練,包括利用“清華簡”(清華大學(xué)收藏的一批戰(zhàn)國竹簡)訓(xùn)練它識別古代中國文字的能力。測試顯示,斯坦福大學(xué)這個團(tuán)隊發(fā)布的大模型居然也能識別“清華簡”。
“已經(jīng)比較確信,斯坦福這個團(tuán)隊‘套殼’了我們的大模型研究成果?!鼻迦A大學(xué)計算機(jī)系長聘副教授劉知遠(yuǎn)對新華社記者說。
“我們從‘清華簡’逐字掃描并標(biāo)注的數(shù)據(jù)集從未公開,而Llama3-V展現(xiàn)出了一模一樣的識別‘清華簡’能力,連做錯的樣例都一樣?!眲⒅h(yuǎn)是清華這個大模型團(tuán)隊成員。他介紹說,在質(zhì)疑聲發(fā)酵后,對方已經(jīng)在網(wǎng)上刪除了此前發(fā)布的數(shù)據(jù)庫和宣傳文章,“從證據(jù)和對方反應(yīng)來看,抄襲性質(zhì)已比較確定”。
曼寧發(fā)聲批評后,斯坦福該團(tuán)隊的兩名成員夏爾馬和加格也在社交媒體上正式道歉,并表示要完全撤下Llama3-V模型。
在當(dāng)前的人工智能熱潮中,這個事件引發(fā)廣泛關(guān)注。有觀點認(rèn)為美國的人工智能全面領(lǐng)先,但該事件說明,雖然美國科技仍然整體領(lǐng)先,但遠(yuǎn)非全能,也不應(yīng)迷信美國單方宣布的“重大成果”。
斯坦福大學(xué)所處的硅谷地區(qū)被認(rèn)為是美國科技創(chuàng)新的重鎮(zhèn),既孕育了許多先進(jìn)技術(shù),也有“作假,直至成功”等被津津樂道的負(fù)面文化。
比如,從斯坦福大學(xué)退學(xué)創(chuàng)業(yè)的伊麗莎白·霍姆斯曾吹噓有顛覆性檢測技術(shù)可“抽指血查癌癥”,一度成為全球聞名的科技創(chuàng)業(yè)明星,但后來被發(fā)現(xiàn)造假并因欺詐投資者罪名獲刑。放眼整個美國科技領(lǐng)域,近年來波音客機(jī)事故頻發(fā)等暴露了更多、更大的問題。
在人工智能領(lǐng)域,前段時間還有個“著名”事件,在用中文問谷歌人工智能模型“雙子座”Pro版(Gemini Pro)它是誰時,它會回答自己是“文心一言”,這個問題很快被谷歌消除。業(yè)界人士認(rèn)為,其原因可能是谷歌在訓(xùn)練大模型的中文時“參考”了中國百度公司的大模型“文心一言”相關(guān)數(shù)據(jù)。
可見,中國科技近年來快速發(fā)展,一些獨特的優(yōu)勢越來越引人注目,被美國同行“參考”甚至抄襲。
“中國人工智能研究的國際影響力越來越大”,劉知遠(yuǎn)說,“這次抄襲事件也從側(cè)面反映了我們的創(chuàng)新成果正在受到國際關(guān)注”。他說,從橫向來看,中國研究與國際頂尖成果仍有顯著差距,但從縱向來看,中國已快速成長為人工智能科技創(chuàng)新的重要推動者。
信息網(wǎng)絡(luò)傳播視聽節(jié)目許可證:120330032
中華人民共和國互聯(lián)網(wǎng)新聞信息服務(wù)許可證:45120170002
中華人民共和國互聯(lián)網(wǎng)出版許可證 (署)網(wǎng)出證(桂)字第020號
廣播電視節(jié)目制作經(jīng)營許可證編號:(桂)字第0230號
網(wǎng)警備案號:45010302000253
桂ICP備11003557 南寧新聞網(wǎng)版權(quán)所有
舉報電話:0771—5530647 郵箱:mail@nnnews.net
登錄南寧云賬號×
登錄
還沒賬號?立即注冊
點擊頭像快速登錄
請輸入驗證碼