Whisk:Google推出的新的“以图生图”图像生成工具

Google推出了一款名为Whisk的全新ai图像生成工具,这个工具使用户不需要提示词,只需提供图像即可帮你混合出各种风格的图像。不需要使用传统的文本提示。Whisk由Google Labs开发,结合了Gemini和Imagen 3模型,能快速将多张照片的风格组合成新的风格图像输出,生成成新的图片。

比如我们提供一张人物的、一张场景的和一个风格的图片,它就能把人物和场景风格自由组合在一起,生成这种风格的新场景人物照片。

Whisk体验地址:https://labs.google/fx/tools/whisk/unsupported-country

Whisk.webp

Whisk的主要功能和特点:

  • 以图生图功能:Whisk的最大亮点在于它允许用户直接上传图像,生成新的图像,而不需要书写复杂的文本提示。

  • 多图上传与风格融合:用户可以上传多张图片来定义生成图像的主题、场景和艺术风格。这种多维度的输入方式允许用户将各类元素融合在一起,创造出新的图像作品。

  • 采用先进的AI模型:Whisk利用了Google的Gemini和Imagen 3模型,这些模型增强了图像生成的质量和速度,使得生成的图像更加细腻和富有创意。

  • 自动生成的文字提示:在生成新的图像后,Whisk还能够自动生成与之相关的文字提示。

Whisk还支持用户在创作过程中直接生成图像并进行快速修改。这意味着用户不仅可以上传图像,还可以通过添加描述性的文本来调整生成的图像,这一点增加了创作的灵活性和多样性。

此外,谷歌明确指出,Whisk其目的是快速的视觉探索,而非精细编辑。因此,生成的图像可能有时不尽如人意,这也是谷歌提供用户编辑底层提示以优化结果的原因之一。

Whisk已开放在更多国家使用,现在可以在超过 100 个国家使用,Whisk之前仅在美国地区提供试用,其他地区的用户可以等等。

收藏
最新工具
MGX
MGX

MetaGPT推出的全球首个模拟人类软件工作流程的多智能体开发平...

配音神器PRO
配音神器PRO

一款功能强大的配音软件,提供调整语速、插入停顿、检测敏感词、调节...

匡优Excel
匡优Excel

一个将AI与数据分析完美结合的Excel 分析工具。通过自然语言...

PhotoG
PhotoG

专为电商卖家打造的AI商拍工具。PhotoG可以轻松制作出专业级...

Phantom
Phantom

字节跳动基于跨模态对齐的主体一致性视频生成系统,Phantoms...

字体秀FontShow
字体秀FontShow

一款便捷的本地字体批量预览对比工具,支持个性化文案输入、多字体批...

Step-Video-T2V
Step-Video-T2V

一个由阶跃星辰与吉利汽车合作开源的先进文本到视频生成模型。支持中...

Step-Audio
Step-Audio

由阶跃星辰与吉利汽车集团联合研发的一个开源的集成语音识别、语义理...

SkyReels-V1
SkyReels-V1

中国首个面向AI短剧创作的视频生成模型,能够实现影视级人物微表情...

MakeAnything
MakeAnything

一个基于扩散变换器的序列生成模型,通过其强大的生成能力,生成一致...