Openai在Chatgpt和Sora中宣布本地图像生成

Openai希望使Chatgpt中的图像生成更容易，更有用。图片来源：OpenAI

Openai在本地形象生成和。

在首席执行官领导的直播中除了OpenAI团队的成员外，该公司还演示了由GPT-4O模型驱动的图像生成中的新功能。

以前，图像生成依赖Openai的Dall-E文本对图像模型。现在，GPT-4O处理图像生成，这意味着它具有世界知识和上下文理解，可以更加接缝和对话生成图像。该模型的响应将了解上下文提示，而无需特别引用图像，可以遵循提示以重申生成的图像，并且OpenAI表示在呈现文本方面更好。

文本渲染看起来更好。图片来源：OpenAI

随着Chatgpt中的图像产生，Openai的目标是使其更有用，而不仅仅是新颖性。这意味着它可以生成图表，信息图表，徽标，社交媒体帖子和其他图形。在Sora中，现在有一个新部分用于生成图像（视频之外），就像Midjourney界面一样。

可混合的轻速速度

在直播中，阿尔特曼说，该模型倾向于“创意自由”，说：“我们想要的是，如果您不希望模型，那么模型就不要冒犯，但是如果您希望它在理性之内，请真正让人们创造他们想要的东西。”

奥特曼似乎试图在一个X帖子，说：“我们要目标的是，该工具不能创造进攻性的东西，除非您希望它能在这种情况下进行。正如我们在模型规格中所谈论的那样，我们认为将这种知识自由和控制权放在用户手中是正确的事情，但是我们将观察到它是如何进行和倾听社会的。”

该推文目前不可用。它可能正在加载或已删除。

如果这对您来说也不是完全有意义的，Openai对违反其内容政策的图像的立场“例如儿童性虐待材料和性侵害”，仍然一样。

根据随附的博客文章，所有图像均具有C2PA元数据，该文章提供了无形的水印，以详细介绍图像的出处。

今天可以在聊天体验中为Chatgpt Plus，Pro，Team和Free用户提供chatgpt的本地图像生成，并且很快将向Enterprise和EDU用户访问。

Cecily是Mashable的技术记者，涵盖了AI，Apple和新兴技术趋势。在哥伦比亚新闻学院获得硕士学位之前，她花了数年的时间与不合理的集团和B实验室的初创企业和社会影响业务合作。在此之前，她共同创立了一家针对南美，欧洲和亚洲新兴企业家枢纽的初创咨询业务。您可以在Twitter上找到她@cecily_mauran。

这些新闻通讯可能包含广告，交易或会员链接。通过单击订阅，您确认自己是16岁，并同意我们的使用条款和隐私政策。

Also Read

青少年感到精疲力竭。社交媒体会让情况变得更糟。

斯蒂芬·科尔伯特（Stephen Colbert）对埃隆·马斯克（Elon Musk

NYT Strands提示，3月9日的答案

NYT迷你填字游戏答案，提示2025年3月11日

《胡桃夹子》评论：本·斯蒂勒瞄准“巴克叔叔”但未能如愿

苹果 iPhone 14 Plus 评测：为了电池寿命而买