盗墓笔记第二季,懒人听书,好看的小说完本推荐

斯坦福抄襲清華，世界一流大學(xué)實(shí)錘了

來源：千龍網(wǎng) 作者：黑龍江時(shí)間：2025-03-15 09:43:55

最近 AI 圈里又鬧出一個(gè)大新聞，斯坦實(shí)錘《斯坦福團(tuán)隊(duì)抄襲中國 AI！福抄?》

估計(jì)剛看到這個(gè)標(biāo)題，襲清很多人跟世超一樣都蒙了。華世啊？是界流不是看花眼了？

哪個(gè)斯坦福？確定沒搞反？

您猜怎么著，這還真就是大學(xué) QS 排名前五的那個(gè)美國斯坦福。

別說國內(nèi)網(wǎng)友，斯坦實(shí)錘業(yè)內(nèi)大佬也繃不住，福抄直呼時(shí)代變了。襲清

確切的華世說，應(yīng)該是界流斯坦福的一個(gè)本科生團(tuán)隊(duì)，抄了清華博士創(chuàng)業(yè)公司的大學(xué)產(chǎn)品，也就是斯坦實(shí)錘面壁智能的開源模型：MiniCPM-Llama3-V 2.5小鋼炮。

事兒要從 5 月 29 號說起。福抄

這天有兩個(gè)斯坦福的襲清印度年輕人，在世界上最大 ai 開源社區(qū)——HuggingFace上發(fā)布了他們的大模型 Llama-3-V 。

看著他們光鮮亮麗的實(shí)習(xí)簡歷，又是特斯拉又是 SpaceX 的，很快，網(wǎng)友們就把這個(gè)號稱?“500?刀就能練成比肩 GPT-4V 、 Gemini Ultra”?的后起之秀，頂上了 HuggingFace首頁，推文瀏覽量也超過 30?萬。

剛開始可能還有人覺著：我大美利堅(jiān)江山代有才人出啊，你看看，本科生就能做出比肩大廠的成績，什么叫世界一流啊～

很快，一些眼尖的業(yè)內(nèi)人士發(fā)現(xiàn)不對勁了，你這玩意怎么看著跟21號那個(gè) MiniCPM 小鋼炮差不多，不會是抄的吧，咋不標(biāo)注來源？

之所以人家一眼丁真鑒定為抄，主要是它宣稱的體積小、性能強(qiáng)、多模態(tài)的特點(diǎn)，很難不讓人把它和清華的 MiniCPM 對比。

但他又申明自己是原創(chuàng)的，沒引用人家 MiniCPM 。

不過面對別人的指責(zé)，這大學(xué)生團(tuán)隊(duì)還嘴硬，說 MiniCPM 是引用了 LLaVA-UHD 的，我們也引的這個(gè)，讀書人的事，那能叫抄嗎？真是裝糊涂的天才。

問題是 MiniCPM 和 LLaVA-UHD 原來的樣子早就不一樣了，而你這個(gè) Llama3-V 的長相跟 LLaVA-UHD不能說一模一樣，至少是毫不相關(guān)，但是跟人家小鋼炮就像一個(gè)媽生的。

等放一塊兒仔細(xì)一瞅，好家伙，模型結(jié)構(gòu)跟人家像也就算了，配置文件怎么都一模一樣。

再一看代碼，除了加點(diǎn)格式化，改了幾個(gè)變量名，別的都毫無區(qū)別，甚至人家清華專門定義的特殊符號，你這代碼里都沒變過。

更搞笑的是，有網(wǎng)友發(fā)現(xiàn)運(yùn)行 Llama3-V 時(shí)，用斯坦福團(tuán)隊(duì)提供的權(quán)重文件（神經(jīng)網(wǎng)絡(luò)微調(diào)用的參數(shù)?）是跑不起來的，但如果把其中的變量名改為 MiniCPM-Llama3-V 2.5 的，就會絲滑啟動。

都錘成這樣了，印度老哥還是始終咬死不認(rèn)。

很快，收到消息的面壁智能官方也下場開錘，表示 Llama3-V 項(xiàng)目的作者并不完全理解 MiniCPM-Llama3-V 2.5 的架構(gòu)，甚至也不理解他們自己的代碼。

換句話說，還挺陰陽的，?“你抄都沒抄明白啊?！?/p>

除此之外，面壁團(tuán)隊(duì)還甩出一個(gè)雷神之錘的證據(jù)， Llama3-V 居然可以識別清華簡！

清華簡是清華校友捐贈的重要文物，這些埋藏于戰(zhàn)國時(shí)代的竹簡躲過了秦始皇焚書，保存著包括古本《尚書》、先秦史料、醫(yī)方哲學(xué)等極其珍貴的原始檔案，簡單來說就是上古版《永樂大典》。

清華簡識別其實(shí)是 MiniCPM-Llama3-V 2.5 研發(fā)時(shí)內(nèi)置的彩蛋，所有訓(xùn)練識別的數(shù)據(jù)，都是面壁智能和清華大學(xué)合作，一個(gè)字一個(gè)字掃描標(biāo)注的，從未公開。這些完全私有的數(shù)據(jù)斯坦福團(tuán)隊(duì)不可能拿到，但是兩個(gè)模型卻都能實(shí)現(xiàn)識別，甚至犯錯(cuò)的地方都一模一樣。

到這，可以說他們抄襲是百分百，板上釘釘?shù)氖铝?。鼓破萬人捶，面對全世界網(wǎng)友的唾沫星子，這倆印度哥們怎么做的呢？

答，刪庫跑路！

他們馬上刪掉了 HuggingFace 上的 Llama3-V 模型，并表示：?“?非常感謝那些在評論中指出與之前研究相似之處的人。我們意識到我們的架構(gòu)非常類似于OpenBMB 的 MiniCPM-Llama3-V 2.5 ，他們在實(shí)現(xiàn)上比我們搶先一步。我們已經(jīng)刪除了關(guān)于作者的原始模型。?”

不是，過分了啊，還要點(diǎn)臉不？

然后他們又光速滑跪道歉甩鍋三連，說我們哥倆只是宣傳推廣的，代碼都是外包給另一個(gè)南加州大學(xué)老哥干的，冤枉??！

但事已經(jīng)鬧大了，丟面兒的斯坦福大學(xué)官方也急忙下場，他們的人工智能實(shí)驗(yàn)室主任，谷歌 Deepmind 的研究員 Christopher David Manning 直接發(fā)文開噴，?“?典型的不承認(rèn)自己錯(cuò)誤！?”

并對 MiniCPM 這一中國開源模型表示贊揚(yáng)。

而被抄的面壁智能聯(lián)合創(chuàng)始人劉知遠(yuǎn)，則對他們喊話：“團(tuán)隊(duì)三人中的兩位也只是斯坦福大學(xué)本科生，未來還有很長的路，如果知錯(cuò)能改，善莫大焉。”

面壁 CEO 李大海也詼諧回應(yīng)道：?“?我們對這件事深表遺憾。一方面感慨這也是一種受到國際團(tuán)隊(duì)認(rèn)可的方式，另一方面呼吁大家共建開放、合作、有信任的社區(qū)環(huán)境。?”

“?我們希望團(tuán)隊(duì)的好工作被更多人關(guān)注與認(rèn)可，但不是以這種方式?！?/p>

話雖這么說，但這次的事確實(shí)也讓大家注意到，國產(chǎn) AI 好像也不是刻板印象中那樣了。

連開頭的大佬，?Hugging Face?的負(fù)責(zé)人?Omar Sanseviero?也表示，

“?社區(qū)一直忽視了中國機(jī)器學(xué)習(xí)生態(tài)系統(tǒng)的工作。他們正在用有趣的大語言模型、視覺大模型、音頻和擴(kuò)散模型做一些令人驚奇的事情。?”

并提到鵝廠混元大模型，和最近爆火的?ChatTTS

拿這次的主角面壁智能來說，雖然各大廠商（?上個(gè)月谷歌安卓 15 ，過幾天蘋果 iOS18 ）都在布局移動端大模型，但經(jīng)過此次事件，大家發(fā)現(xiàn)這家中國公司，在這個(gè)賽道上也十分出色。

MiniCPM 不但體量小，只用 2.4B 的數(shù)據(jù)規(guī)模就能達(dá)到數(shù)倍于它的模型能力，不僅支持安卓系統(tǒng)，還支持鴻蒙，推理做題都毫不遜色。

視覺識別能力也相當(dāng)不錯(cuò)，特別是中文圖像場景下，表現(xiàn)比 ChatGPT-4V 更好。

除此之外，面壁官方還在今天中午官宣，「小鋼炮」MiniCPM 決定免費(fèi)公開！對學(xué)術(shù)研究完全開放，企業(yè)和個(gè)人只需填寫問卷登記后就允許商用。

什么叫格局啊～（?戰(zhàn)術(shù)后仰?）

世超覺得，網(wǎng)友們確實(shí)也應(yīng)該改變一些成見。許多人以前都認(rèn)為，國產(chǎn) AI 都是套殼 ChatGPT , 這不行那不行，感謝 XXX 開源。

然而就像劉知遠(yuǎn)說的，盡管面對國際領(lǐng)先模型仍有差距，但中國大模型已經(jīng)從以前的 nobody ，成長為了 AI 領(lǐng)域的關(guān)鍵推動者之一。

至于這兩個(gè)年輕人，希望你們耗子尾汁，不要再耍這樣的小聰明。

導(dǎo)航

斯坦福抄襲清華，世界一流大學(xué)實(shí)錘了

相關(guān)新聞

國內(nèi)新聞

圖片精選

國際新聞

全網(wǎng)熱點(diǎn)