ChatGPT 的高级语音模式可能会获得新的“实时摄像头”功能

据一些目光敏锐的侦探称,ChatGPT 备受期待的视觉功能可能很快就会推出。

安卓权威在高级中发现了一些代码行最新 ChatGPT v1.2024.317 beta 版本的一部分,指向所谓的“实时摄像头”。该代码似乎是在警告用户不要使用实时摄像头“进行实时导航或可能影响您的健康或安全的决策”。

代码中的另一行似乎给出了视觉功能的说明,“点击相机图标让 ChatGPT 查看并谈论您周围的环境。”

可混搭光速

ChatGPT 不断发展的功能:视觉、语音等

ChatGPT 可视化处理信息的能力是此次展会上首次亮相的一大特色去年5月,推出。该活动的演示展示了 GPT-4o 如何使用移动或桌面相机来识别主题并记住有关视觉效果的细节。一个特定的演示采用 GPT-4o 识别一只正在玩网球的狗,并记住它的名字是“Bowser”。

自从 OpenAI 活动以及随后对一些幸运的 alpha 测试者的早期访问以来,关于具有视觉功能的 GPT-4o 的讨论并不多。与此同时,OpenAI 发布了9 月份向 ChatGPT Plus 和 Team 用户开放。

如果 ChatGPT 的视觉模式如代码所示即将推出,用户很快就能测试去年春天推出的新 GPT-4o 功能的两个组件。

推文可能已被删除

OpenAI 最近很忙,尽管有报道称收益递减与未来的模型。上个月,它推出了,它将人工智能模型连接到网络,提供实时信息。这也是开发某种能够代表用户执行多步骤任务的代理,例如编写代码和浏览网页,可能会在一月份发布。