快訊

    AIEC首度公布語言模型評測結果 突顯建置本土化語料重要性

    2025-10-03 12:49 / 作者 戴嘉芬
    AIEC評測中心發布語言模型基準評測結果。圖為資安院副院長龔化中(右)、工研院組長王邦傑。
    由資安院、工研院人員共組的 AI 產品與系統評測中心(AIEC)今日(10/3)首次公布語言模型基準評測結果,此次評測納入「台灣價值觀」作為指標,符合國際 AI 主權發展趨勢,亦突顯推動本土化語料建置之重要性。

    本次評測依語言模型規模進行系統性檢測國內外模型表現,除採用「高中學測國文科」及「高中學測社會科」指標外,更納入「台灣價值觀」評測指標,以符合國際 AI 主權發展趨勢,並作為未來建構在地模型或調校國際模型的重要基準。

    本次共評測 42 項語言模型,可以觀察到由國內開發的 TAIDE(Gemma-3-TAIDE-12b)在小模型(13b 以下)中表現名列前茅,比所使用之原基礎模型 Google(Gemma-3-12b-it)表現更佳,展現台灣 AI 研發實力。在大模型中(13b 以上),則以OpenAI GPT-5 整體表現最佳,其中Google Gemini 2.5 Flash 在「台灣價值觀」的評測上表現優異,顯示其對台灣主流價值觀具備較高的理解與對應能力。另外也觀察到,部分中國語言模型在「台灣價值觀」評測項目也表現不錯,研判可能其模型所使用的「蒸餾技術」,係以歐美基礎模型的輸出作為訓練資料。

    整體而言,部分歐美語言模型如果沒有使用到台灣繁體中文語料進行訓練,在「台灣價值觀」的評測上表現較差,此突顯推動本土化語料建置之重要性。數位發展部積極推動台灣主權 AI 語料庫,提供具在地語境與本土價值的繁體中文資料,作為語言模型訓練的重要基礎,確保 AI 發展符合臺灣社會價值與語言文化。AIEC 並將廣泛徵求各界專家提供評測題目,經審查後,將有機會納入未來的評測題庫。

    AIEC 未來將針對不同產品、系統與應用領域,持續推動國內自行研發AI 評測工具,同時對接國際評測方法、規範或標準,強化我國 AI 產品的市場適用性與全球化發展,以實現安全、穩健與可信賴的AI 評測體系。

    戴嘉芬 收藏文章

    本網站使用Cookie以便為您提供更優質的使用體驗,若您點擊下方“同意”或繼續瀏覽本網站,即表示您同意我們的Cookie政策,欲瞭解更多資訊請見