OpenAI 今天表示,它已开始向少数付费 ChatGPT 用户推出高级语音模式,使他们能够测试更自然、实时的对话。
高级语音模式允许 ChatGPT 提供可中断的实时响应,此外它还能够感知和响应幽默、讽刺等内容。新模型不需要像当前的 ChatGPT 语音那样将语音转换为文本,然后再转换回来,从而降低交互延迟。
OpenAI 早在 5 月份就展示了高级语音模式,展示了一种名为 Sky 的人工智能语音,听起来与斯嘉丽·约翰逊非常相似。该声音是在未经约翰逊许可的情况下创建和使用的,她最终就这一情况发表了一份声明。她表示,她拒绝了 OpenAI 首席执行官 Sam Altman 的多次邀请,后者希望 Johansson 成为 ChatGPT 的代言人。她说,奥特曼创造的声音听起来与她自己的声音“出奇地相似”,她对此感到“震惊、愤怒和难以置信”。 OpenAI 声称 Sky 的声音并非有意模仿约翰逊的声音,但在她聘请法律顾问后将其删除。
OpenAI 表示,自从演示高级语音模式以来,它一直致力于提高语音对话的安全性和质量。高级语音模式以四种预设声音说话,旨在阻止与这些声音不同的输出,防止其模仿名人的声音。 OpenAI 还“实施了护栏”来阻止对暴力或版权内容的请求,早期测试将用于在更广泛的发布之前改进该功能。
被授予高级语音模式访问权限的用户将收到一封包含说明的电子邮件,OpenAI 计划滚动添加更多人员。 Plus 上的每个人都可以在秋季使用高级语音模式。
免责声明
部分内容(图片、文章)翻译/转载自国内外资讯/自媒体平台。文中内容不代表本站立场,如有侵权或其它,请联系 macmao.com@gmail.com,我们会第一时间配合删除。(转载请注明来源自:www.macmao.com)