Google去年推出第6代TPU–Trillium,現已開放給全球客戶使用。業者提供
Google去年5月在I/O開發者大會發表第6代TPU「Trillium」,並於同年12月中旬宣布開放給所有Google Cloud客戶使用,Trillium專為大型AI模型而生,是Google迄今為止效能最佳的TPU。
Google Cloud產品群經理Mohan Pichika於今日(1/15)舉辦的媒體說明會指出,TPU是Google專為類神經網路設計的機器學習加速器,是驅動AI的引擎。它與CPU為了通用目的而設計之用途不同,TPU是為了專門目的而設計,具備矩陣乘法計算能力,是用來加速AI訓練和推論工作的利器。
他進一步說明,相較前代TPU,Trillium的訓練效能提升至4倍以上,推論處理量則增加至3倍,能源效率大大提升67%,而晶片尖峰效能較前代提升4.7倍,另在HBM(高頻寬記憶體)容量亦提升了1倍,晶片間互連網路頻寬同步提升1倍。
Mohan Pichika指出,Google使用 Trillium TPU 來訓練新的 Gemini 2.0,它是Google至今最強大的AI模型。訓練Gemini 2.0需要大量的資料和運算,而Trillium擁有近線性擴充能力(near-linear scaling capabilities),能讓AI模型高效且精準的分配工作負載,大幅提高訓練速度。
Google發現,為了因應龐大的AI需求,必須要有高速的硬體運算能力。Google首席科學家Jeff Dean曾進行一項實驗,假設有1億使用者,每天使用新的語音功能3分鐘,大概需要多少算力?結果發現當時資料中心的算力必須加倍才能支應需求,這是Google研發TPU的緣起。
Mohan Pichika提到,Google TPU以及AI Hypercomputer(整合式超級運算架構)在世界各地都有不同的產業或組織在使用,幫助他們處理各種龐大運算;包括生成式AI領域的獨角獸有90%都使用Google Cloud解決方案,例如拜耳(Bayer)、deep genomics皆使用TPU來加速新藥研發,此外還有Midjourney、essential AI、AssemblyAI 等業者或單位,也都運用TPU進行大型語言模型的訓練和服務。
媒體問到,Google對於通用型晶片的看法,是否有計畫投入自研CPU?Mohan Pichika則表示,Google提供很多選擇,有各種算力的解決方案,讓客戶依需求最佳化。Google Cloud同時也有自研GPU,且與其他GPU夥伴合作;另包括Intel、AMD甚至Arm架構的CPU,也能應用在推論算力,皆為Google Cloud合作夥伴。目前Google Cloud針對一般運算領域已研發設計出一款CPU,它的型號為「C4A」,採用Arm架構。
外傳Trillium TPU採用台積電3至4奈米製程,Mohan Pichika則表示,他無法分享Trillium採用多少奈米的製程資訊,僅強調
台灣半導體產業在生成式AI發展領域擁有強大的能量,與Google也是良好夥伴,Google會持續與台灣晶圓代工及其他半導體產業夥伴合作,但具體有哪些合作業者等細節,則無法進一步對外說明。
媒體也問到,輝達在今年CES電子展推出Arm架構的GB10超級電腦晶片,Google是否也會啟動類似計畫?對此,Mohan Pichika則明確表示「不會」,他提到今年CES有很多很好的科技新進展,但
Google並非是一家以晶片為主的公司,所做一切是為了符合客戶需求,並且以最好科技滿足客戶需求。