微软在2024年Ignite开发者大会上推出了Microsoft Teams的新功能:Interpreter,这是一种允许实时“语音到语音”翻译的工具,并模拟讲话者的声音至多达九种语言。自2025年初,用户将能够以英语、法语、德语、意大利语、日语、韩语、葡萄牙语、普通话和西班牙语召开会议,而他们的声音将被准确地再现。
“想象一下,您可以用另一种语言听起来像自己一样,”微软首席营销官贾里德·斯帕塔罗在一篇博客文章中写道。“Teams中的翻译代理通过模拟您的声音,提供更个性化和真实的实时翻译。”
该功能仅面向 Microsoft 365 的订阅用户,并且需要用户同意。根据微软的说法,不会存储任何生物特征数据,并且可以在 Teams 设置中禁用该工具。微软的一位发言人解释道:“Interpreter 旨在尽可能准确地复制演讲者的信息,而不添加额外的假设或信息。”
然而,这项技术存在潜在风险。操控声音和面部的深度伪造技术如今已广泛普及,并已被用于欺诈尝试。在今年一起知名案件中,网络罪犯成功模拟了一个十分逼真的Teams会议,骗取了2500万美元。尽管Interpreter的使用范围有限,这些风险也让微软的新功能成为关注的焦点。
微软与其他公司一道推出了基于人工智能的语言技术解决方案。例如,Meta正在为Instagram Reels测试翻译工具,而ElevenLabs等初创公司正在开发多语言语音合成平台。根据Markets and Markets的预测,自然语言处理技术市场(包括翻译服务在内)到2026年可能达到351亿美元。
然而,使用人工智能翻译仍然存在争议。 在细微差别、文化背景和惯用语的准确性方面,人类翻译仍优于算法。 然而,对许多公司而言,成本优势重于劣势。
尽管翻译器可能改善企业的全球合作,但该功能引发了有关安全性和滥用的问题。不充分的监管可能会给恶意行为者提供利用伪造录音操纵翻译的机会。
微软尚未就安全机制发表评论,但未来几个月可能会提供更多细节。业内观察者将密切关注微软如何防止其新技术的滥用。