ChatGPT開發商OpenAI執行長奧特曼1月18日在瑞士出席世界經濟論壇。路透社
人工智慧(AI)領頭羊OpenAI宣布,在語音工具研究已有初步成果,可以模擬人聲閱讀文字。這項進展為AI應用又推進一步,然而也再度引發「深偽」風險的疑慮,因此OpenAI決定縮小開放技術的規模。
彭博新聞今天(03/30)報導,OpenAI發言人表示,已和10家開發商分享這項小規模研究的初步成果。這個語音模型名為「聲音引擎」(Voice Engine),能將文字轉為聲音。
OpenAI本月初曾向媒體表示,根據來自股東、政策人士、產業專家、教育界及創作者的回饋,決定不擴大發表這項新模型,將分享的開發商數量由100家縮減為10家,同時要求採用這項技術的開發商遵守使用政策,包括必須取得聲音來源者的本人同意。
OpenAI昨天在官方部落格發文指出:「我們了解到,生成模擬人聲的語音存在重大風險,尤其在大選之年更是優先考慮因素。我們正與來自政府、媒體、娛樂事業、教育、公民社會等等的美國及國際夥伴交流,確保我們在開發之餘能納入他們的回饋。」
此前已有AI技術被用於假造聲音及影像的例子,包括流行天后泰勒絲和美國總統拜登都是受害者。
不同於之前的AI應用技術,「聲音引擎」具有生成個人化聲音並產出演說的能力,甚至能創造特殊的抑揚頓挫與口音,與人聲幾無二致;只需要輸入一個人的15秒音檔,就能生成新的AI語音。
受邀參加演示會的彭博新聞記者,在現場聽了一段OpenAI執行長阿特曼(Sam Altman)的演說,聲音與阿特曼本人如出一轍,但完全是AI生成。
OpenAI產品主管哈里斯(Jeff Harris)說:「如果你有正確的語音設定,基本上就會產生與人類相同的聲音,這是一項頗令人注目的技術品質。」
不過哈里斯也表示:「關於真的要正確模擬人類演說方面,這顯然也有很大的安全顧慮。」
採用OpenAI「聲音引擎」技術的夥伴之一,包括「諾曼普林斯神經科學研究所」(Norman Prince Neurosciences Institute ),所方將這項技術應用於非營利醫療計畫「人類壽命」(Lifespan),幫助病患復健,恢復自己的聲音。
研究所指出,一名因罹患腦瘤而失去語言能力的年輕女病患,就透過這項技術,使用她罹病前、就學時的一個語音作業檔,模擬她的說話與聲音。