随着该公司推出全新的人工智能口译工具,Teams 用户很快将能够使用其声音的克隆版本实时说话和翻译对话。
年会上宣布微软点燃会议并报告TechCrunch,新功能允许用户创建其声音的数字副本,然后可用于将其语音翻译成各种语言。 “想象一下,能够像您一样使用不同的语言。Teams 中的口译员在会议期间提供实时语音到语音翻译,您可以选择让它模拟您的说话声音,以获得更加个性化和引人入胜的体验,”微软首席营销官贾里德·斯帕塔罗(Jared Spataro)在与该出版物分享的博客文章中写道。
该功能仅适用于 Microsoft365 订阅者,并且最初将推出英语、法语、德语、意大利语、日语、韩语、葡萄牙语、普通话和西班牙语版本。
可混搭光速
微软的口译员有潜力让更多非英语使用者更容易地进行远程工作和数字社交业务,尽管它还不如现场人工翻译那么活跃。除了其明确的应用之外,该工具还引发了更多有关安全和技术偏见的问题。
最近的一个学习发现流行的人工智能转录工具 Whisper(也用于微软的云计算程序)充斥着幻觉,包括在翻译医疗领域的患者信息时发明内容或短语。对于患有失语症等言语障碍的患者尤其如此。之前炒作的宣传其实时翻译能力,结果却是不一致的人工翻译的数字替代方案。在解决 Teams Interpreter 的类似问题时,微软向 TechCrunch 表示:“Interpreter 的设计目的是尽可能忠实地复制发言者的信息,而不添加假设或无关信息。只有当用户在会议期间通过通知或在会议期间通过通知表示同意时,才能启用语音模拟。”在设置中启用“语音模拟同意”。”
该技术可能会对可访问性领域产生巨大影响,值得注意的数字包括美国众议员詹妮弗·韦克斯顿扩大个性化高科技语音克隆对言语异常者的使用。但这也引发了人们对未经同意的深度造假用途以及该技术可能成为诈骗者武器库中的工具的担忧。强大的人工智能语音克隆技术——据报道微软的令人印象深刻地像人类——引起了微软自己首席执行官的道德担忧呼吁加强护栏以及面对越来越多的名人深度假货的人工智能治理。
尽管如此,在人工智能热潮的推动下,围绕语音克隆的热潮在行业创新者中不断升温,增加了之前对人工智能语音到文本翻译的投资。去年,苹果公司宣布功能,一种机器学习工具,可创建用户语音的合成版本,可用于实时文本到语音转换的情况,例如 FaceTime,并被宣传为可访问性。微软推出了自己的个人声音大约在同一时间推出该功能,由 Azure AI 提供支持,并提供 90 种语言版本。