OpenAI推出DALL·E 3丨ChatGPT多模态上线丨新增语音功能丨图像分析功能丨联网功能丨Neuronicx

回到网站

OpenAI推出DALL·E 3丨ChatGPT多模态上线丨新增语音功能丨图像分析功能丨联网功能丨Neuronicx

OpenAI推出DALL·E 3代与ChatGPT多模态！

2023年9月27日

OpenAI推出DALL·E 3：AI图像生成的新篇章

OpenAI近期发布了其最新的图像生成模型——DALL·E 3。这款模型在AI领域引起了广泛关注，因为它带来了一系列的创新和改进。

DALL·E 3的主要特点与新功能：

更高的细节和准确性：DALL·E 3相较于前代系统，能够理解更多的细节和微妙之处，使得用户可以轻松地将其想法转化为非常准确的图像。
研究预览：DALL·E 3目前处于研究预览阶段，将于10月份对ChatGPT Plus和企业客户开放，之后还会在Labs中推出。
文本到图像的精确转换：现代的文本到图像系统往往会忽略某些词汇或描述，迫使用户学习提示工程。DALL·E 3在生成与所提供文本完全一致的图像方面取得了巨大的进步。
与DALL·E 2的对比：即使是相同的提示，DALL·E 3相对于DALL·E 2也有显著的改进。
与ChatGPT的集成：DALL·E 3是基于ChatGPT构建的，这意味着您可以使用ChatGPT作为您的头脑风暴伙伴和提示的完善者。只需询问ChatGPT，您想在简单的句子到详细的段落中看到什么。
安全性：与之前的版本一样，我们已经采取措施限制DALL·E 3生成暴力、成人或仇恨内容的能力。
防止有害生成：DALL·E 3已经采取措施拒绝请求公众人物的名字。我们在与红队专家合作的过程中，提高了公众人物生成和与视觉过度/不足代表相关的有害偏见的安全性能。
内部测试：我们还在研究帮助人们识别图像是否由AI创建的最佳方法。我们正在尝试使用一个起源分类器，这是一个新的内部工具，可以帮助我们识别图像是否由DALL·E 3生成。
创意控制：DALL·E 3被设计为拒绝请求以现存艺术家的风格制作图像的请求。现在，创作者还可以选择将他们的图像从我们未来的图像生成模型的训练中排除出去。

ChatGPT多模态上线，新增新功能：

语音功能：ChatGPT现在支持语音输入和输出，用户可以直接与其进行语音交互，无需再通过键盘输入。
图片识别功能：用户可以上传图片，ChatGPT能够识别图片中的内容，并根据图片生成相关的文本描述。
重新接入newbing功能：这是一个强大的搜索功能，使得ChatGPT能够在互联网上搜索相关的信息，为用户提供更加丰富的内容。

例如，用户上传了一张风景图片，ChatGPT可以识别出图片中的山、水、树木等元素，并生成一段描述：“这是一幅美丽的风景画，画中有高耸的山峰、碧绿的湖水和茂密的树林。”

特别提示：

对于那些还没有体验过ChatGPT和DALL·E 3的朋友，或者想要体验的朋友，现在有一个好消息！您可以直接在全球领衔的人工智能衍生服务商（官网：Neuronicx.com）购买账号或代充，直接登录就能体验。因为上述的新功能只对Plus会员用户开放，所以如果您想要体验这些功能，建议购买Plus会员账号。

总之，OpenAI的DALL·E 3和ChatGPT都为我们带来了前所未有的AI体验，无论是在文本生成、图像识别还是其他方面，它们都展现出了强大的能力。对于AI爱好者和专业人士来说，这无疑是一个值得期待的时代。