隨著該公司推出全新的人工智慧口譯工具,Teams 用戶很快將能夠使用其聲音的克隆版本即時說話和翻譯對話。
年會上宣布微軟點燃會議並報告TechCrunch,新功能允許用戶創建其聲音的數位副本,然後可用於將其語音翻譯成各種語言。 「想像一下,能夠像您一樣使用不同的語言。Teams 中的口譯員在會議期間提供實時語音到語音翻譯,您可以選擇讓它模擬您的說話聲音,以獲得更加個性化和引人入勝的體驗,”微軟首席行銷長賈里德·斯帕塔羅(Jared Spataro)在與該出版物分享的部落格文章中寫道。
此功能僅適用於 Microsoft365 訂閱者,並且最初將推出英語、法語、德語、義大利語、日語、韓語、葡萄牙語、普通話和西班牙語版本。
可混搭光速
微軟的口譯員有潛力讓更多非英語使用者更容易進行遠距工作和數位社交業務,儘管它還不如現場人工翻譯那麼活躍。除了其明確的應用之外,該工具還引發了更多有關安全和技術偏見的問題。
最近的一個學習發現流行的人工智慧轉錄工具 Whisper(也用於微軟的雲端運算程式)充斥著幻覺,包括在翻譯醫療領域的患者資訊時發明內容或短語。對於患有失語症等言語障礙的患者尤其如此。之前炒作的宣傳其實時翻譯能力,結果卻是不一致的人工翻譯的數位替代方案。在解決Teams Interpreter 的類似問題時,微軟向TechCrunch 表示:「Interpreter 的設計目的是盡可能忠實地複製發言者的信息,而不添加假設或無關信息。只有當用戶在會議期間通過通知或在會議期間透過通知表示同意時,才能啟用語音模擬。
該技術可能會對可訪問性領域產生巨大影響,值得注意的數字包括美國眾議員詹妮弗·韋克斯頓擴大個人化高科技語音克隆對言語異常者的使用。但這也引發了人們對未經同意的深度造假用途以及該技術可能成為詐騙者武器庫中的工具的擔憂。強大的人工智慧語音克隆技術——據報微軟的令人印象深刻地像人類——引起了微軟自己執行長的道德擔憂呼籲加強護欄以及面對越來越多的名人深度假貨的人工智慧治理。
儘管如此,在人工智慧熱潮的推動下,圍繞語音克隆的熱潮在行業創新者中不斷升溫,增加了先前對人工智慧語音到文字翻譯的投資。去年,蘋果宣布功能,一種機器學習工具,可建立使用者語音的合成版本,可用於即時文字轉語音轉換的情況,例如 FaceTime,並被宣傳為可存取性。微軟推出了自己的個人聲音大約在同一時間推出該功能,由 Azure AI 提供支持,並提供 90 種語言版本。