台灣大哥大舉辦「myVoca」AI語音模型發表會,資訊長蔡祈岩致詞。業者提供
台灣大哥大今(3/12)攜手合作夥伴長問科技,共同發表國內首款支援中、台、英、客語混合辨識的最新ASR模型「myVoca」,具備更節省、更精準、更快速的三大核心優勢,也是最懂台灣語的多語混合辨識模型。
台灣大哥大資訊長蔡祈岩表示,「myVoca」語音辨識模型的問世,不僅是技術的升級,更象徵台灣在AI語音辨識技術的突破。以前國內語音辨識相關軟體都使用OpenAI Whisper模型進行微調,而「myVoca」是少數在台灣本地訓練出來的模型。
他進一步指出,與Wisper相比,myVoca能節省88%算力,而且它的反應速度很快,在使用者講完話的當下,就能馬上回應,不需要等待。加上它的準確度很高,能針對不同產業提供的語料去訓練,對台灣軟體產業是一大里程碑,能藉由此模型進軍國際,業界共同攜手打世界盃。
「myVoca」模型運作結合台灣大哥大與長問科技雙方優勢,台灣大哥大以電信天賦,將通用語料擴增,有效提升辨識準度、啟動特定產業(如醫療)語料蒐集與建置,並執行語料清洗、分類、標註,以及音檔品質與資料體檢。
蔡祈岩表示,台灣大從架構面著手,優化推論效率與延遲控制,並強化專屬語料的擴訓能力;同時透過在地語料賦能,針對台灣特有的跨語言現象、產業術語及多樣聲學特徵)進行精準訓練,確保模型能真正貼近台灣語音習慣、產業用語與真實場域。
長問科技則專注於ASR模型架構設計、訓練流程與演算法調整,透過雙方攜手合作,「myVoca」所需算力僅需1/8,硬體成本顯著降低88%1,經客製化調教後模型正確率最高可達97%2;同時實現辨識速度零時差,開口1秒內即可完成即時轉錄3,反應速度提升6倍。未來將全面導入金融、醫療、製造及智慧政府等應用場景,賦能企業AI降本增效。
為推動ASR技術的產業落地,台灣大哥大將號召資服業者、系統整合商及硬體設備商等夥伴共築ASR生態系,目前逾30家橫跨政府、醫療、金融、交通、零售、製造等領域夥伴響應,預計今年營收規模將成長三倍,全面深耕金融、醫療、製造及智慧政府等應用場景。