新華社舊金山6月3日電 硅谷手記|AI抄襲背后的硅谷“不光彩文化”
新華社記者吳曉凌 黃堃
“‘作假,直至成功’,這是硅谷不光彩的文化。”美國(guó)斯坦福大學(xué)人工智能實(shí)驗(yàn)室主任克里斯托弗·曼寧3日就該校某些研究人員抄襲中國(guó)清華大學(xué)等機(jī)構(gòu)成果的行為這樣評(píng)論說。他在社交媒體上還指出,該研究團(tuán)隊(duì)?wèi)?yīng)該深刻認(rèn)識(shí)自己的錯(cuò)誤。
圖為2024年5月30日,在瑞士日內(nèi)瓦舉行的2024年“人工智能造福人類全球峰會(huì)” 上,參會(huì)者和中國(guó)移動(dòng)開發(fā)的AI機(jī)器人下棋。(新華社記者連漪攝)
5月29日,斯坦福大學(xué)一個(gè)研究團(tuán)隊(duì)發(fā)布名為L(zhǎng)lama3-V的大模型,聲稱只要500美元的預(yù)訓(xùn)練成本,就能用它獲得比肩GPT-4V等著名大模型的效果。這一消息在社交媒體和人工智能學(xué)術(shù)界被廣泛轉(zhuǎn)發(fā)。
但業(yè)內(nèi)人士很快發(fā)現(xiàn),該大模型涉嫌抄襲清華大學(xué)等機(jī)構(gòu)發(fā)布的 MiniCPM-Llama3-V 2.5大模型。它們都是基于開源的Llama3大模型,但清華團(tuán)隊(duì)進(jìn)行了獨(dú)特的訓(xùn)練,包括利用“清華簡(jiǎn)”(清華大學(xué)收藏的一批戰(zhàn)國(guó)竹簡(jiǎn))訓(xùn)練它識(shí)別古代中國(guó)文字的能力。測(cè)試顯示,斯坦福大學(xué)這個(gè)團(tuán)隊(duì)發(fā)布的大模型居然也能識(shí)別“清華簡(jiǎn)”。
“已經(jīng)比較確信,斯坦福這個(gè)團(tuán)隊(duì)‘套殼’了我們的大模型研究成果?!鼻迦A大學(xué)計(jì)算機(jī)系長(zhǎng)聘副教授劉知遠(yuǎn)對(duì)新華社記者說。
“我們從‘清華簡(jiǎn)’逐字掃描并標(biāo)注的數(shù)據(jù)集從未公開,而Llama3-V展現(xiàn)出了一模一樣的識(shí)別‘清華簡(jiǎn)’能力,連做錯(cuò)的樣例都一樣?!眲⒅h(yuǎn)是清華這個(gè)大模型團(tuán)隊(duì)成員。他介紹說,在質(zhì)疑聲發(fā)酵后,對(duì)方已經(jīng)在網(wǎng)上刪除了此前發(fā)布的數(shù)據(jù)庫(kù)和宣傳文章,“從證據(jù)和對(duì)方反應(yīng)來看,抄襲性質(zhì)已比較確定”。
曼寧發(fā)聲批評(píng)后,斯坦福該團(tuán)隊(duì)的兩名成員夏爾馬和加格也在社交媒體上正式道歉,并表示要完全撤下Llama3-V模型。
在當(dāng)前的人工智能熱潮中,這個(gè)事件引發(fā)廣泛關(guān)注。有觀點(diǎn)認(rèn)為美國(guó)的人工智能全面領(lǐng)先,但該事件說明,雖然美國(guó)科技仍然整體領(lǐng)先,但遠(yuǎn)非全能,也不應(yīng)迷信美國(guó)單方宣布的“重大成果”。
斯坦福大學(xué)所處的硅谷地區(qū)被認(rèn)為是美國(guó)科技創(chuàng)新的重鎮(zhèn),既孕育了許多先進(jìn)技術(shù),也有“作假,直至成功”等被津津樂道的負(fù)面文化。
比如,從斯坦福大學(xué)退學(xué)創(chuàng)業(yè)的伊麗莎白·霍姆斯曾吹噓有顛覆性檢測(cè)技術(shù)可“抽指血查癌癥”,一度成為全球聞名的科技創(chuàng)業(yè)明星,但后來被發(fā)現(xiàn)造假并因欺詐投資者罪名獲刑。放眼整個(gè)美國(guó)科技領(lǐng)域,近年來波音客機(jī)事故頻發(fā)等暴露了更多、更大的問題。
在人工智能領(lǐng)域,前段時(shí)間還有個(gè)“著名”事件,在用中文問谷歌人工智能模型“雙子座”Pro版(Gemini Pro)它是誰時(shí),它會(huì)回答自己是“文心一言”,這個(gè)問題很快被谷歌消除。業(yè)界人士認(rèn)為,其原因可能是谷歌在訓(xùn)練大模型的中文時(shí)“參考”了中國(guó)百度公司的大模型“文心一言”相關(guān)數(shù)據(jù)。
可見,中國(guó)科技近年來快速發(fā)展,一些獨(dú)特的優(yōu)勢(shì)越來越引人注目,被美國(guó)同行“參考”甚至抄襲。
“中國(guó)人工智能研究的國(guó)際影響力越來越大”,劉知遠(yuǎn)說,“這次抄襲事件也從側(cè)面反映了我們的創(chuàng)新成果正在受到國(guó)際關(guān)注”。他說,從橫向來看,中國(guó)研究與國(guó)際頂尖成果仍有顯著差距,但從縱向來看,中國(guó)已快速成長(zhǎng)為人工智能科技創(chuàng)新的重要推動(dòng)者。
信息網(wǎng)絡(luò)傳播視聽節(jié)目許可證:120330032
中華人民共和國(guó)互聯(lián)網(wǎng)新聞信息服務(wù)許可證:45120170002
中華人民共和國(guó)互聯(lián)網(wǎng)出版許可證 (署)網(wǎng)出證(桂)字第020號(hào)
廣播電視節(jié)目制作經(jīng)營(yíng)許可證編號(hào):(桂)字第0230號(hào)
網(wǎng)警備案號(hào):45010302000253
桂ICP備11003557 南寧新聞網(wǎng)版權(quán)所有
舉報(bào)電話:0771—5530647 郵箱:mail@nnnews.net
登錄南寧云賬號(hào)
登錄
還沒賬號(hào)?立即注冊(cè)
點(diǎn)擊頭像快速登錄
請(qǐng)輸入驗(yàn)證碼