OpenAI開發新人類語音模擬工具　因深偽疑慮縮小開放規模

2024-03-30 22:20 / 作者莊蕙嘉

ChatGPT開發商OpenAI執行長奧特曼1月18日在瑞士出席世界經濟論壇。路透社

人工智慧（AI）領頭羊OpenAI宣布，在語音工具研究已有初步成果，可以模擬人聲閱讀文字。這項進展為AI應用又推進一步，然而也再度引發「深偽」風險的疑慮，因此OpenAI決定縮小開放技術的規模。

彭博新聞今天（03/30）報導，OpenAI發言人表示，已和10家開發商分享這項小規模研究的初步成果。這個語音模型名為「聲音引擎」（Voice Engine），能將文字轉為聲音。

OpenAI本月初曾向媒體表示，根據來自股東、政策人士、產業專家、教育界及創作者的回饋，決定不擴大發表這項新模型，將分享的開發商數量由100家縮減為10家，同時要求採用這項技術的開發商遵守使用政策，包括必須取得聲音來源者的本人同意。

OpenAI昨天在官方部落格發文指出：「我們了解到，生成模擬人聲的語音存在重大風險，尤其在大選之年更是優先考慮因素。我們正與來自政府、媒體、娛樂事業、教育、公民社會等等的美國及國際夥伴交流，確保我們在開發之餘能納入他們的回饋。」

此前已有AI技術被用於假造聲音及影像的例子，包括流行天后泰勒絲和美國總統拜登都是受害者。

不同於之前的AI應用技術，「聲音引擎」具有生成個人化聲音並產出演說的能力，甚至能創造特殊的抑揚頓挫與口音，與人聲幾無二致；只需要輸入一個人的15秒音檔，就能生成新的AI語音。

受邀參加演示會的彭博新聞記者，在現場聽了一段OpenAI執行長阿特曼（Sam Altman）的演說，聲音與阿特曼本人如出一轍，但完全是AI生成。

OpenAI產品主管哈里斯（Jeff Harris）說：「如果你有正確的語音設定，基本上就會產生與人類相同的聲音，這是一項頗令人注目的技術品質。」

不過哈里斯也表示：「關於真的要正確模擬人類演說方面，這顯然也有很大的安全顧慮。」

採用OpenAI「聲音引擎」技術的夥伴之一，包括「諾曼普林斯神經科學研究所」（Norman Prince Neurosciences Institute ），所方將這項技術應用於非營利醫療計畫「人類壽命」（Lifespan），幫助病患復健，恢復自己的聲音。

研究所指出，一名因罹患腦瘤而失去語言能力的年輕女病患，就透過這項技術，使用她罹病前、就學時的一個語音作業檔，模擬她的說話與聲音。

#OpenAI #語音模擬 #深偽 #模擬人聲 #聲音引擎 #Voice Engine

莊蕙嘉收藏文章

OpenAI開發新人類語音模擬工具 因深偽疑慮縮小開放規模

更多太報報導

OpenAI開發新人類語音模擬工具　因深偽疑慮縮小開放規模