虎博TigerBot-13B中文能力超Llama-2 49% 領(lǐng)先國內外主流開(kāi)源模型

發(fā)布時(shí)間：2023-8-10 17:20 發(fā)布者：科技新思路

近日，虎博科技發(fā)布開(kāi)源大模型TigerBot-13B，此模型在Llama-2的基礎上以虎博積累的技術(shù)和數據繼續訓練，不但保持了Llama-2出色的英文能力，更是在中文能力填補了Llama-2的不足，各項主流中文任務(wù)中超過(guò)Llama-2 的49%，在開(kāi)源同類(lèi)模型中具有競爭力�；⒉┑睦碚摵蛯�(shí)驗探索表明，TigerBot的訓練方法，計算效率和數據達到世界上SOTA水平，本著(zhù)open innovation的精神，虎博科技將這些成果分享給大模型社區，繼續開(kāi)源和免費商用TigerBot-13B大模型。

本次發(fā)布包括以下三點(diǎn)：

TigerBot-13B-base: 基于Llama-2-13B繼續預訓練300B tokens，擴充了中文詞表到60K vocabulary, 并采用holistic training在預訓練中直接使模型具有9成的指令完成能力。在主流英文基準測試中超過(guò)Llama-2-13B-base的7%，在中文測試中綜合能力超過(guò)Llama-2-13B-base的49%，在國內主流開(kāi)源基座模型中處于領(lǐng)先位置。

TigerBot-13B-chat: 基于TigerBot-13B-base用5M指令數據微調，并采用rejection sampling fine-tune對齊人類(lèi)需求。在主流英文基準測試中達到Llama-2-13B-chat的 101%，在中文測試中綜合能力超過(guò)Llama-2-13B-chat的47%，在國內主流開(kāi)源模型中亦處于領(lǐng)先位置。

TigerBot-API: chat和summarization api 將自動(dòng)升級到TigerBot-13B-chat，對科研教育用戶(hù)免費，對商用開(kāi)發(fā)者保持價(jià)格不變。

本文地址：http://selenalain.com/thread-834575-1-1.html 【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布，目的在于傳遞和分享信息，并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責；文章版權歸原作者及原出處所有，如涉及作品內容、版權和其它問(wèn)題，我們將根據著(zhù)作權人的要求，第一時(shí)間更正或刪除。

網(wǎng)友評論

貿澤電子有獎問(wèn)答視頻，答對領(lǐng)10元微信紅包

廠(chǎng)商推薦

關(guān)于我們 - 服務(wù)條款 - 使用指南 - 站點(diǎn)地圖 - 友情鏈接 - 聯(lián)系我們
電子工程網(wǎng) © 版權所有京ICP備16069177號 | 京公網(wǎng)安備11010502021702

快速回復 返回頂部 返回列表

午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页