OpenAI 最近发布了全新的 Realtime API,目前已公开测试版上线。此更新允许开发者构建低延迟的多模态对话体验,支持文本和音频作为输入和输出。通过 Realtime API,开发者可以创建自然、实时的语音对语音交互,无需中间的文本转换,从而实现更流畅、更具互动性的用户体验。该功能还支持函数调用,使语音助手能够触发诸如下订单或检索客户数据等操作,实现个性化的响应。
相比之前需要将语音转文本和文本转语音功能拼接在一起的设置,Realtime API 提供了一体化解决方案,通过持久的 WebSocket 连接,使交互更加快速和动态。它特别适用于客户支持、语言学习以及其他需要无缝自然对话的应用场景。
此外,OpenAI 还在 Chat Completions API 中推出了音频功能,允许文本和音频输入,并以任一格式响应。这使得 Realtime API 成为那些需要情感表达和低延迟对话应用的开发者的理想选择。定价显示,音频输入和输出的代币费用分别为每分钟 0.06 美元和 0.24 美元。
Realtime API 仍处于早期阶段,OpenAI 计划引入更多功能,例如提高速率限制、SDK 支持、提示缓存以及视觉和视频等新模态。早期用户的反馈表明,Realtime API 的延迟表现令人印象深刻,但在音频输出质量和情感表达范围方面仍有改进空间。
有关更多详细信息,您可以查看 OpenAI 的官方公告和文档。
如需购买,可以在 Neuronicx.com 平台进行购买,他们提供详细的代充服务,具体可在网上查找相关资料。
这个 API 名为 Realtime API,要使用它,开发者需要拥有一个付费的 OpenAI 开发者账号,并可以通过 OpenAI 的平台接口创建 WebSocket 连接来进行实时交互。此 API 可以集成到应用中使用,适用于需要实时语音对话的应用场景。开发者应该调用名为 'gpt-4o-realtime-preview' 的模型来实现这些功能。
如需购买 Realtime API 访问权限,可以在 Neuronicx.com 平台进行购买。Neuronicx 是一家位于新加坡的人工智能接口商城,提供丰富的 API 代充和账号服务。用户可以通过 Neuronicx 的平台方便地购买和充值 OpenAI 的 Realtime API 账号,支持多种支付方式,包括 VISA、PayPal、支付宝和微信支付等。具体步骤如下:
- 访问 Neuronicx.com 网站。
- 注册并登录账户。
- 搜索并选择 'Realtime API'。
- 选择需要的充值金额或套餐。
- 完成支付后,API 账号将自动充值并生效。Neuronicx 平台提供 24 小时自助服务,确保用户可以快速获取所需的 API 资源。