斯坦福抄襲清華 世界一流大學(xué)實(shí)錘了
最近 AI 圈里又鬧出一個(gè)大新聞,斯坦實(shí)錘《 斯坦福團(tuán)隊(duì)抄襲中國(guó) AI !福抄 》
估計(jì)剛看到這個(gè)標(biāo)題,襲清很多人跟世超一樣都蒙了。華世???是界流不是看花眼了?
哪個(gè)斯坦福?確定沒(méi)搞反?
您猜怎么著,這還真就是大學(xué) QS 排名前五的那個(gè)美國(guó)斯坦福。
別說(shuō)國(guó)內(nèi)網(wǎng)友,斯坦實(shí)錘業(yè)內(nèi)大佬也繃不住,福抄直呼時(shí)代變了。襲清
確切的華世說(shuō),應(yīng)該是界流斯坦福的一個(gè)本科生團(tuán)隊(duì),抄了清華博士創(chuàng)業(yè)公司的大學(xué)產(chǎn)品,也就是斯坦實(shí)錘面壁智能的開(kāi)源模型:MiniCPM-Llama3-V 2.5 小鋼炮。
事兒要從 5 月 29 號(hào)說(shuō)起。福抄
這天有兩個(gè)斯坦福的襲清印度年輕人,一個(gè)還跟佛祖( Siddharth 悉達(dá)多 )同名,在在世界上最大 ai 開(kāi)源社區(qū)—— HuggingFace 上發(fā)布了他們的大模型 Llama-3-V 。
看著他們光鮮亮麗的實(shí)習(xí)簡(jiǎn)歷,又是特斯拉又是 SpaceX 的,很快,網(wǎng)友們就把這個(gè)號(hào)稱(chēng) “500 刀就能練成比肩 GPT-4V 、 Gemini Ultra” 的后起之秀,頂上了 HuggingFace 首頁(yè),推文瀏覽量也超過(guò) 30 萬(wàn)。
剛開(kāi)始可能還有人覺(jué)著:我大美利堅(jiān)江山代有才人出啊,你看看,本科生就能做出比肩大廠的成績(jī),什么叫世界一流啊~
很快,一些眼尖的業(yè)內(nèi)人士發(fā)現(xiàn)不對(duì)勁了,你這玩意怎么看著跟 21 號(hào)那個(gè) MiniCPM 小鋼炮差不多,不會(huì)是抄的吧,咋不標(biāo)注來(lái)源?
之所以人家一眼丁真鑒定為抄,主要是它宣稱(chēng)的體積小、性能強(qiáng)、多模態(tài)的特點(diǎn),很難不讓人把它和清華的 MiniCPM 對(duì)比。
但他又申明自己是原創(chuàng)的,沒(méi)引用人家 MiniCPM 。
不過(guò)面對(duì)別人的指責(zé),這大學(xué)生團(tuán)隊(duì)還嘴硬,說(shuō) MiniCPM 是引用了 LLaVA-UHD 的,我們也引的這個(gè),讀書(shū)人的事,那能叫抄嗎?真是裝糊涂的天才。
問(wèn)題是 MiniCPM 和 LLaVA-UHD 原來(lái)的樣子早就不一樣了,而你這個(gè) Llama3-V 的長(zhǎng)相跟 LLaVA-UHD 不能說(shuō)一模一樣,至少是毫不相關(guān),但是跟人家小鋼炮就像一個(gè)媽生的。
等放一塊兒仔細(xì)一瞅,好家伙,模型結(jié)構(gòu)跟人家像也就算了,配置文件怎么都一模一樣。
再一看代碼,除了加點(diǎn)格式化,改了幾個(gè)變量名,別的都毫無(wú)區(qū)別,甚至人家清華專(zhuān)門(mén)定義的特殊符號(hào),你這代碼里都沒(méi)變過(guò)。
更搞笑的是,有網(wǎng)友發(fā)現(xiàn)運(yùn)行 Llama3-V 時(shí),用斯坦福團(tuán)隊(duì)提供的權(quán)重文件(神經(jīng)網(wǎng)絡(luò)微調(diào)用的參數(shù) )是跑不起來(lái)的,但如果把其中的變量名改為 MiniCPM-Llama3-V 2.5 的,就會(huì)絲滑啟動(dòng)。
都錘成這樣了,印度老哥還是始終咬死不認(rèn)。
很快,收到消息的面壁智能官方也下場(chǎng)開(kāi)錘,表示 Llama3-V 項(xiàng)目的作者并不完全理解 MiniCPM-Llama3-V 2.5 的架構(gòu),甚至也不理解他們自己的代碼。
換句話(huà)說(shuō),還挺陰陽(yáng)的, “ 你抄都沒(méi)抄明白啊。 ”
除此之外,面壁團(tuán)隊(duì)還甩出一個(gè)雷神之錘的證據(jù), Llama3-V 居然可以識(shí)別清華簡(jiǎn)!
清華簡(jiǎn)是清華校友捐贈(zèng)的重要文物,這些埋藏于戰(zhàn)國(guó)時(shí)代的竹簡(jiǎn)躲過(guò)了秦始皇焚書(shū),保存著包括古本《尚書(shū)》、先秦史料、醫(yī)方哲學(xué)等極其珍貴的原始檔案,簡(jiǎn)單來(lái)說(shuō)就是上古版《永樂(lè)大典》。
清華簡(jiǎn)識(shí)別其實(shí)是 MiniCPM-Llama3-V 2.5 研發(fā)時(shí)內(nèi)置的彩蛋,所有訓(xùn)練識(shí)別的數(shù)據(jù),都是面壁智能和清華大學(xué)合作,一個(gè)字一個(gè)字掃描標(biāo)注的,從未公開(kāi)。這些完全私有的數(shù)據(jù)斯坦福團(tuán)隊(duì)不可能拿到,但是兩個(gè)模型卻都能實(shí)現(xiàn)識(shí)別,甚至犯錯(cuò)的地方都一模一樣。
到這,可以說(shuō)他們抄襲是百分百,板上釘釘?shù)氖铝?。鼓破萬(wàn)人捶,面對(duì)全世界網(wǎng)友的唾沫星子,這倆印度哥們?cè)趺醋龅哪兀?/p>
答,刪庫(kù)跑路!
他們馬上刪掉了 HuggingFace 上的 Llama3-V 模型,并表示: “ 非常感謝那些在評(píng)論中指出與之前研究相似之處的人。我們意識(shí)到我們的架構(gòu)非常類(lèi)似于 OpenBMB 的 MiniCPM-Llama3-V 2.5 ,他們?cè)趯?shí)現(xiàn)上比我們搶先一步。我們已經(jīng)刪除了關(guān)于作者的原始模型。 ”
不是,過(guò)分了啊,還要點(diǎn)臉不?
然后他們又光速滑跪道歉甩鍋三連,說(shuō)我們哥倆只是宣傳推廣的,代碼都是外包給另一個(gè)南加州大學(xué)老哥干的,冤枉?。?/p>
但事已經(jīng)鬧大了,丟面兒的斯坦福大學(xué)官方也急忙下場(chǎng),他們的人工智能實(shí)驗(yàn)室主任,谷歌 Deepmind 的研究員 Christopher David Manning 直接發(fā)文開(kāi)噴, “ 典型的不承認(rèn)自己錯(cuò)誤! ”
并對(duì) MiniCPM 這一中國(guó)開(kāi)源模型表示贊揚(yáng)。
而被抄的面壁智能聯(lián)合創(chuàng)始人劉知遠(yuǎn),則對(duì)他們喊話(huà):“團(tuán)隊(duì)三人中的兩位也只是斯坦福大學(xué)本科生,未來(lái)還有很長(zhǎng)的路,如果知錯(cuò)能改,善莫大焉。”
面壁 CEO 李大海也詼諧回應(yīng)道: “ 我們對(duì)這件事深表遺憾。一方面感慨這也是一種受到國(guó)際團(tuán)隊(duì)認(rèn)可的方式,另一方面呼吁大家共建開(kāi)放、合作、有信任的社區(qū)環(huán)境。 ”
“ 我們希望團(tuán)隊(duì)的好工作被更多人關(guān)注與認(rèn)可,但不是以這種方式。 ”
話(huà)雖這么說(shuō),但這次的事確實(shí)也讓大家注意到,國(guó)產(chǎn) AI 好像也不是刻板印象中那樣了。
連開(kāi)頭的大佬, Hugging Face 的負(fù)責(zé)人 Omar Sanseviero 也表示,
“ 社區(qū)一直忽視了中國(guó)機(jī)器學(xué)習(xí)生態(tài)系統(tǒng)的工作。他們正在用有趣的大語(yǔ)言模型、視覺(jué)大模型、音頻和擴(kuò)散模型做一些令人驚奇的事情。 ”
并提到鵝廠混元大模型,和最近爆火的 ChatTTS
拿這次的主角面壁智能來(lái)說(shuō),雖然各大廠商( 上個(gè)月谷歌安卓 15 ,過(guò)幾天蘋(píng)果 iOS18 )都在布局移動(dòng)端大模型,但經(jīng)過(guò)此次事件,大家發(fā)現(xiàn)這家中國(guó)公司,在這個(gè)賽道上也十分出色。
MiniCPM 不但體量小,只用 2.4B 的數(shù)據(jù)規(guī)模就能達(dá)到數(shù)倍于它的模型能力,不僅支持安卓系統(tǒng),還支持鴻蒙,推理做題都毫不遜色。
視覺(jué)識(shí)別能力也相當(dāng)不錯(cuò),特別是中文圖像場(chǎng)景下,表現(xiàn)比 ChatGPT-4V 更好。
除此之外,面壁官方還在今天中午官宣,「小鋼炮」MiniCPM 決定免費(fèi)公開(kāi)!對(duì)學(xué)術(shù)研究完全開(kāi)放,企業(yè)和個(gè)人只需填寫(xiě)問(wèn)卷登記后就允許商用。
什么叫格局啊~( 戰(zhàn)術(shù)后仰 )
世超覺(jué)得,網(wǎng)友們確實(shí)也應(yīng)該改變一些成見(jiàn)。許多人以前都認(rèn)為,國(guó)產(chǎn) AI 都是套殼 ChatGPT , 這不行那不行,感謝 XXX 開(kāi)源。
然而就像劉知遠(yuǎn)說(shuō)的,盡管面對(duì)國(guó)際領(lǐng)先模型仍有差距,但中國(guó)大模型已經(jīng)從以前的 nobody ,成長(zhǎng)為了 AI 領(lǐng)取的關(guān)鍵推動(dòng)者之一。
至于這兩個(gè)年輕人,希望你們耗子尾汁,不要再耍這樣的小聰明。