快訊

    輝達H100助陣!鴻海研究院推第一版繁體中文大型語言模型

    2025-03-10 10:28 / 作者 陳俐妏
    鴻海研究院。資料照
    鴻海研究院今日宣布,推出首款繁體中文AI大型語言模型(LLM),內部開發代碼FoxBrain,此模型以優異的運算成本,於四週內完成訓練。FoxBrain模型原為內部應用而設計,涵蓋數據分析、決策輔助、文書協作、數學、推理解題與代碼生成等功能,後續將對外開源分享。FoxBrain作為鴻海研究院AI推理LLM模型訓練成果,不僅展現了強大的理解與推理能力,還能針對台灣使用者的語言風格進行優化,並在數學與邏輯推理測試中表現出色。


    FoxBrain使用 120 張輝達NVIDIA H100 GPU 訓練,總計算力花費2688 GPU days。透過自主技術,建立24類主題的資料增強方式與品質評估方法,生成98B tokens高品質中文預訓練資料,上下文處理長度 128 K token,採用多節點平行訓練架構,確保高效能與穩定性。採用 Meta Llama3.1 為基礎架構,擁有 70B 參數,在 TMMLU+ 測試資料集,大多數的領域優於國內相同規模的Llama-3-Taiwan-70B。

    在模型訓練過程中,NVIDIA公司提供 Taipei-1 超級電腦的支持以及技術諮詢,使鴻海研究院透過使用NeMo順利完成模型訓練。FoxBrain不僅是鴻海AI研發的重大突破,也為台灣AI 產業發展樹立了新的標竿。將在更多場景中發揮影響力,推動企業數智化轉型與全球產業升級。

    鴻海未來將透過導入 AI 大型語言模型,優化智慧製造、智慧電動車、智慧城市等三大平台的數據分析效率,讓FoxBrain成為驅動智慧應用升級的重要引擎,進一步提升公司營運效益。
    陳俐妏 收藏文章

    本網站使用Cookie以便為您提供更優質的使用體驗,若您點擊下方“同意”或繼續瀏覽本網站,即表示您同意我們的Cookie政策,欲瞭解更多資訊請見