阿里Qwen-2成全球開(kāi)源大模型排行榜第一

發(fā)布時(shí)間：2024-6-27 15:30 發(fā)布者：eechina

來(lái)源：快科技

全球知名的開(kāi)源平臺Hugging Face的聯(lián)合創(chuàng )始人兼首席執行官Clem在社交平臺激動(dòng)宣布，阿里巴巴最新開(kāi)源的Qwen2-72B指令微調版本在開(kāi)源模型排行榜上榮登榜首。

為了打造一個(gè)更為公正和準確的開(kāi)源大模型排名，Clem及其團隊利用300塊H100高性能硬件，對全球100多個(gè)主流開(kāi)源大模型，包括Qwen2、Llama-3、Mixtral、Phi-3等，在BBH、MUSR、MMLU-PRO、GPQA等嚴格的基準測試集上進(jìn)行了全面而深入的評估。

這次重新評估的初衷在于，許多開(kāi)發(fā)者過(guò)于追求排行榜的名次，導致在模型訓練過(guò)程中過(guò)度依賴(lài)評估集數據，并且過(guò)去的評估標準對于模型而言顯得過(guò)于簡(jiǎn)單。因此，本次評估提高了難度標準，以檢驗這些模型在更高挑戰下的真實(shí)性能。

令人矚目的是，阿里巴巴開(kāi)源的Qwen-2 72B模型在激烈競爭中脫穎而出，不僅超越了科技巨頭Meta的Llama-3，還超越了法國知名大模型平臺Mistralai的Mixtral，成為了新的行業(yè)領(lǐng)軍者。這一成績(jì)充分展示了中國在全球開(kāi)源大模型領(lǐng)域的領(lǐng)導地位。

針對這一排名結果，Stability AI的研究總監、早年在19歲便獲得博士學(xué)位的Tanishq表示，他早前就預測中國在開(kāi)源大模型領(lǐng)域具有強大的競爭力。除了Qwen2，還有零一萬(wàn)物、InternLM、Deepsseek等眾多優(yōu)秀的中國開(kāi)源模型，都在國際舞臺上嶄露頭角。

Tanishq進(jìn)一步強調，任何關(guān)于中國在開(kāi)源大模型領(lǐng)域落后的觀(guān)點(diǎn)都是站不住腳的。相反，中國在這一領(lǐng)域正逐漸展現出領(lǐng)導者的姿態(tài)，引領(lǐng)著(zhù)全球開(kāi)源模型的發(fā)展潮流。

本文地址：http://selenalain.com/thread-861984-1-1.html 【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布，目的在于傳遞和分享信息，并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責；文章版權歸原作者及原出處所有，如涉及作品內容、版權和其它問(wèn)題，我們將根據著(zhù)作權人的要求，第一時(shí)間更正或刪除。

網(wǎng)友評論

貿澤電子有獎問(wèn)答視頻，答對領(lǐng)10元微信紅包

阿里Qwen-2成全球開(kāi)源大模型排行榜第一

相關(guān)文章

網(wǎng)友評論

廠(chǎng)商推薦

相關(guān)視頻