Openai希望使Chatgpt中的图像生成更容易,更有用。 图片来源:OpenAI
Openai在本地形象生成和。
在首席执行官领导的直播中除了OpenAI团队的成员外,该公司还演示了由GPT-4O模型驱动的图像生成中的新功能。
以前,图像生成依赖Openai的Dall-E文本对图像模型。现在,GPT-4O处理图像生成,这意味着它具有世界知识和上下文理解,可以更加接缝和对话生成图像。该模型的响应将了解上下文提示,而无需特别引用图像,可以遵循提示以重申生成的图像,并且OpenAI表示在呈现文本方面更好。
文本渲染看起来更好。 图片来源:OpenAI
随着Chatgpt中的图像产生,Openai的目标是使其更有用,而不仅仅是新颖性。这意味着它可以生成图表,信息图表,徽标,社交媒体帖子和其他图形。在Sora中,现在有一个新部分用于生成图像(视频之外),就像Midjourney界面一样。
可混合的轻速速度
在直播中,阿尔特曼说,该模型倾向于“创意自由”,说:“我们想要的是,如果您不希望模型,那么模型就不要冒犯,但是如果您希望它在理性之内,请真正让人们创造他们想要的东西。”
奥特曼似乎试图在一个X帖子,说:“我们要目标的是,该工具不能创造进攻性的东西,除非您希望它能在这种情况下进行。正如我们在模型规格中所谈论的那样,我们认为将这种知识自由和控制权放在用户手中是正确的事情,但是我们将观察到它是如何进行和倾听社会的。”
该推文目前不可用。它可能正在加载或已删除。
如果这对您来说也不是完全有意义的,Openai对违反其内容政策的图像的立场“例如儿童性虐待材料和性侵害”,仍然一样。
根据随附的博客文章,所有图像均具有C2PA元数据,该文章提供了无形的水印,以详细介绍图像的出处。
今天可以在聊天体验中为Chatgpt Plus,Pro,Team和Free用户提供chatgpt的本地图像生成,并且很快将向Enterprise和EDU用户访问。
Cecily是Mashable的技术记者,涵盖了AI,Apple和新兴技术趋势。在哥伦比亚新闻学院获得硕士学位之前,她花了数年的时间与不合理的集团和B实验室的初创企业和社会影响业务合作。在此之前,她共同创立了一家针对南美,欧洲和亚洲新兴企业家枢纽的初创咨询业务。您可以在Twitter上找到她@cecily_mauran。