首页 > Ai资讯 > Ai产品

OpenAI GPT-4o模型推出重大更新：为ChatGPT增加了图像生成和编辑功能

映技派于2025-03-26发布在Ai产品

Openai于2025年3月25日正式宣布在GPT-4o模型中集成图像编辑和视觉生成功能，用户可以通过对话式来生成图像、修改现有视觉内容，甚至设计复杂的材料，如图表、菜单和地图等。

OpenAI GPT-4o模型推出重大更新：为ChatGPT增加了图像生成和编辑功能.webp

功能特点：

实时迭代：用户可以实时迭代图像请求，例如要求生成“城市中的蜗牛”，然后通过改变背景或添加配饰来细化场景。
复杂指令处理：该系统能够处理更复杂的图像构图指令。
文本渲染改进：GPT-4o在图像中渲染清晰且结构化的文本方面有了显著提升，使其能够更好地生成信息图表、图表、标志等专业视觉内容。
“修复”功能：用户可以对现有图像进行“修复”，编辑前景和背景元素，即使照片中有人物也适用。

性能与速度

虽然GPT-4o处理图像请求的速度比其前身DALL·E 3慢，但生成的图像更准确、更详细。图像生成可能需要长达一分钟的时间。

数据训练

OpenAI表示，GPT-4o的图像能力训练使用了“公开可用的数据”，以及来自合作伙伴（如Shutterstock）的专有内容。

技术改进

多模态生成：GPT-4o的图像生成器与文本生成器集成在同一模型中，能够更好地结合文本和图像。
自回归生成方式：与DALL-E 3等扩散模型不同，GPT-4o采用自回归方式，从左到右、从上到下逐步生成图像，这可能是其文本渲染和对象绑定能力更强的原因。

这个功能更新现在对OpenAI每月200美元的Pro计划订阅用户开放，然后扩展到免费和Plus层级用户，还有就是通过OpenAI API的开发者。

详细情况：https://openai.com/index/introducing-4o-image-generation/

OpenAI推出的GPT-4o图像生成有哪些功能特点？

Gemini 2.5 Pro与Gemini 2.5相比较，有哪些提升？

如何用OpenAI的GPT-4o来制作属于自己的表情

如何用OpenAI的GPT-4o来制作属于自己的表情

2025-03-28

OpenAI推出的GPT-4o图像生成有哪些功能特点

OpenAI推出的GPT-4o图像生成有哪些功能特点

2025-03-26

OpenAI语音模型GPT-4o-transcrib

OpenAI语音模型GPT-4o-transcrib

2025-03-21

OpenAI 发布了三款全新语音模型，包括两款语音转

OpenAI 发布了三款全新语音模型，包括两款语音转

2025-03-21

Open-Sora 2.0 和 OpenAI Sor

Open-Sora 2.0 和 OpenAI Sor

2025-03-17

CUA Browser: 基于Browserbase

CUA Browser: 基于Browserbase

2025-03-12

最新工具

AutoGLM沉思

智谱推出的一款集深度研究与实际操作能力于一体的AI Agent产...

JustAI

一款AI文案写作与营销工具，能生成多场景文案，包括小红书笔记、抖...

巧文书

原通答AI，一款专为企业打造的AI智能写标书工具，通过AI大模型...

Ai2 Paper Finder

一款由艾伦AI研究所发布的基于LLM的文献搜索系统，Ai2 Pa...

Vivago AI

北京智象未来科技有限公司面向全球市场推出的一款综合性在线 AI ...

Ghibli AI

一款专门用于生成吉卜力风格的AI图像生成器，能够根据用户的文本描...

快出题

金数据旗下的一款AI驱动的在线考试软件，能够快速生成题库并自动组...

BotSharp

一个基于.NET开发的开源AI多智能体应用开发框架，它可以快速将...

Seede AI

一款简单易用的AI驱动设计工具，只需输入文字描述或上传参考图片，...

Colors

一个开源的学术期刊配色推荐器，收集整理了众多高质量论文插图的配色...

用户登录