輝達H100助陣！鴻海研究院推第一版繁體中文大型語言模型

2025-03-10 10:28 / 作者陳俐妏

鴻海研究院。資料照

鴻海研究院今日宣布，推出首款繁體中文AI大型語言模型（LLM），內部開發代碼FoxBrain，此模型以優異的運算成本，於四週內完成訓練。FoxBrain模型原為內部應用而設計，涵蓋數據分析、決策輔助、文書協作、數學、推理解題與代碼生成等功能，後續將對外開源分享。FoxBrain作為鴻海研究院AI推理LLM模型訓練成果，不僅展現了強大的理解與推理能力，還能針對台灣使用者的語言風格進行優化，並在數學與邏輯推理測試中表現出色。

FoxBrain使用 120 張輝達NVIDIA H100 GPU 訓練，總計算力花費2688 GPU days。透過自主技術，建立24類主題的資料增強方式與品質評估方法，生成98B tokens高品質中文預訓練資料，上下文處理長度 128 K token，採用多節點平行訓練架構，確保高效能與穩定性。採用 Meta Llama3.1 為基礎架構，擁有 70B 參數，在 TMMLU+ 測試資料集，大多數的領域優於國內相同規模的Llama-3-Taiwan-70B。

在模型訓練過程中，NVIDIA公司提供 Taipei-1 超級電腦的支持以及技術諮詢，使鴻海研究院透過使用NeMo順利完成模型訓練。FoxBrain不僅是鴻海AI研發的重大突破，也為台灣AI 產業發展樹立了新的標竿。將在更多場景中發揮影響力，推動企業數智化轉型與全球產業升級。

鴻海未來將透過導入 AI 大型語言模型，優化智慧製造、智慧電動車、智慧城市等三大平台的數據分析效率，讓FoxBrain成為驅動智慧應用升級的重要引擎，進一步提升公司營運效益。

#鴻海研究院 #繁體中文 #大型語言模型 #輝達 #H100

陳俐妏收藏文章

輝達H100助陣！鴻海研究院推第一版繁體中文大型語言模型

更多太報報導