Whisk:Google推出的新的“以图生图”图像生成工具
Google推出了一款名为Whisk的全新ai图像生成工具,这个工具使用户不需要提示词,只需提供图像即可帮你混合出各种风格的图像。不需要使用传统的文本提示。Whisk由Google Labs开发,结合了Gemini和Imagen 3模型,能快速将多张照片的风格组合成新的风格图像输出,生成成新的图片。
比如我们提供一张人物的、一张场景的和一个风格的图片,它就能把人物和场景风格自由组合在一起,生成这种风格的新场景人物照片。
Whisk体验地址:https://labs.google/fx/tools/whisk/unsupported-country
Whisk的主要功能和特点:
以图生图功能:Whisk的最大亮点在于它允许用户直接上传图像,生成新的图像,而不需要书写复杂的文本提示。
多图上传与风格融合:用户可以上传多张图片来定义生成图像的主题、场景和艺术风格。这种多维度的输入方式允许用户将各类元素融合在一起,创造出新的图像作品。
采用先进的AI模型:Whisk利用了Google的Gemini和Imagen 3模型,这些模型增强了图像生成的质量和速度,使得生成的图像更加细腻和富有创意。
自动生成的文字提示:在生成新的图像后,Whisk还能够自动生成与之相关的文字提示。
Whisk还支持用户在创作过程中直接生成图像并进行快速修改。这意味着用户不仅可以上传图像,还可以通过添加描述性的文本来调整生成的图像,这一点增加了创作的灵活性和多样性。
此外,谷歌明确指出,Whisk其目的是快速的视觉探索,而非精细编辑。因此,生成的图像可能有时不尽如人意,这也是谷歌提供用户编辑底层提示以优化结果的原因之一。
Whisk已开放在更多国家使用,现在可以在超过 100 个国家使用,Whisk之前仅在美国地区提供试用,其他地区的用户可以等等。