谷歌推创新AI图片工具Whisk:可上传多张图片，将主体、场景、风格融合

来源：互联网· 2024-12-17 10:24:59

谷歌实验室近日在美国推出了最新的生成式人工智能实验工具 Whisk。与传统的图像生成工具主要依赖文本提示不同，Whisk 着重使用图像作为输入方法，允许用户更直观地创造艺术作品。

用户可以直接上传图片至 Whisk，或者在该工具内生成图片，指定主题、场景和风格等元素。Whisk 系统支持用户混合和匹配这些组件，并可根据需要使用附加的文本提示进行微调。

值得注意的是，在后台，谷歌的语言模型（可能是最近发布的 Gemini2.0Flash）会自动生成输入图像的详细描述。这些描述将输入到谷歌最新的图像生成模型 Imagen3中，从而捕捉主体的本质特征，而不是创造出完全相同的复制品。

AIbase进行了多次测试，上传了左侧的三张图片，就可以融合生成右侧的结果，效果还不错，可玩性很高。如下：

然而，由于 Whisk 仅提取每个源图像中的少数关键元素，谷歌提醒用户生成的图像结果可能与预期有所不同。例如，生成的图像可能在高度、体重、发型或肤色上与原图存在差异。

对此，谷歌表示，这些细节往往对项目的成败至关重要，因此允许用户查看和编辑驱动图像生成过程的文本提示。

早期测试者，包括一些艺术家和创意专业人士，表示 Whisk 更像是一种新的创意工具，而不是传统的图像编辑器。谷歌希望该工具能帮助用户快速进行视觉头脑风暴，而不是精确编辑，让用户在保存喜爱的作品之前，可以迅速生成和筛选多个选项。

经初步测试，虽然 Whisk 使用起来十分愉快，但每生成一张新图像需要等待几秒钟。这些延迟可能是由于高流量造成的，用户们纷纷涌入体验这一新工具。

目前，Whisk 仅对美国用户开放，用户可以在 labs.google/whisk 免费尝试并分享反馈。至于其他国家的用户，则暂时无法访问这一工具。

Whisk 隶属于谷歌实验室，这是谷歌测试其 AI 项目的试验场，包括 Gemini、Imagen 以及最新的视频模型 Veo2等。虽然大多数项目仍处于实验阶段，但一些成功的项目，如最近正式发布的 AI 助手 NotebookLM，则会转变为完整产品。

专业AI论文写作一键生成万字论文只需5分钟

文章来源: https://cy211.cn/aizixun/5052.html Chat AI人工智能机器人在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑，如存在版权问题请发送邮件至398879136@qq.com，我们会在3个工作日内处理。非原创标注的文章，观点仅代表作者本人，不代表本站立场。

上一篇苹果AR智能眼镜仍在研发中，预计需时3-5年才能面世

下一篇智谱完成新一轮30亿元融资，2024年商业化收入增长超过10

相关推荐

腾讯混元发布 HyOCR-1.5：仅 1B 参数推理提速 6.37 倍

　近日，轻量化端到端 OCR 专家模型 HyOCR-1.5正式发布，通过一系列技术革新，在保持轻量化架构的同时，实现了性能与效率的显著跃升。作为该领域的首个全栈开 ...

从英伟达千亿营收看2026年AI创业新逻辑：算力格局大变

　大家好，我是黄新伟，深圳市星远创业科技有限公司创始人、AI创业之家主理人，深耕全域网络营销20年，长期陪伴实体老板、单人AI创业者、中小企业踩准每一轮数字红利。 ...

哈啰试水AI校园社交，推出精准交友产品“Match”

　据读佳消息，7月13日，哈啰在高校社交赛道祭出新动作，推出一款专为大学生打造的AI精准交友产品“Match”。该产品目前已在上海多所高校试点冷启动一个多月，吸引 ...

字节跳动 Seedance2.5模型将于7月16日全量开放 API

MiniMax完成160亿港元新一轮融资，创始人闫俊杰宣布零薪酬直至实现AGI

　MiniMax正式宣布完成新一轮160亿港元融资。根据公告，公司拟将募集资金净额的80%投入AI基础设施及模型研究与开发，进一步夯实技术底座。同日，MiniMa ...

Kimi联合美国运通与农业银行正式发行首张AI原生信用卡

　据每日经济新闻报道，7月10日，全球首张AI原生信用卡——“Kimi信用卡”正式对外发行。该项目由Kimi、美国运通与中国农业银行联合打造，自今年4月开始筹备， ...

AI创业之家

GEO优化

AI长篇写作

AI生成思维导图

轻创AI用户注册

谷歌推创新AI图片工具Whisk:可上传多张图片，将主体、场景、风格融合

AI智能对话

智能聊天对话，秒回答

AI模型创作

它无所不知，无所不能

GEO优化

抢占AI搜索榜首

服务热线

13826579603

AI创业之家

GEO优化

AI长篇写作

AI生成思维导图

轻创AI用户注册

​谷歌推创新AI图片工具Whisk:可上传多张图片，将主体、场景、风格融合

AI智能对话

智能聊天对话，秒回答

AI模型创作

它无所不知，无所不能

GEO优化

抢占AI搜索榜首

服务热线

13826579603

谷歌推创新AI图片工具Whisk:可上传多张图片，将主体、场景、风格融合