AI创业日报：支付宝推AI创意生成平台；谷歌王炸推理模型Gemini2.0 Flash Thinking；Runway支持插入中间帧；OpenAI准备o3推理模型

来源：AI创业之家· 2024-12-20 16:19:29

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

1、谷歌发布王炸推理模型Gemini2.0Flash Thinking，挑战 OpenAI o1

谷歌近期推出的Gemini2.0Flash Thinking模型在多模态推理领域展现出强大的能力，支持32，000个输入标记和8，000个输出标记，极大提升了处理复杂问题的效率。该模型通过透明的逐步推理方式解决了AI“黑箱”问题，增强了用户对模型决策过程的理解。

2、支付宝面向商家营销推出AI创意生成平台，已累计生成8700万张AI素材

支付宝最近推出了名为“蚂上有创意”的AI创意生成平台，专为商家和设计师提供快速生成创意素材和智能分析的服务。该平台不仅免费开放了大量营销图片素材，还通过AI技术支持快速生成海报、视频等内容，并提供创意洞察服务，帮助商家提升营销效果。

3、Runway更新重磅功能: 支持插入中间帧控制视频生成

Runway平台最近推出了一项重要更新，允许用户在视频生成过程中插入中间帧。这一功能的推出满足了许多用户的期待，使得视频制作的创作自由度和灵活性大大增强。用户不仅可以上传首尾帧，还可以通过添加中间帧来丰富视频内容，提升画面的协调性和流畅度。

4、电商产品试穿神器!Krea AI新功能:几秒钟将真实产品添加到任何图像中

Krea AI最近推出了令人兴奋的新功能——自定义训练，允许用户在几秒钟内将真实产品添加到任何图像中。该功能通过简单的涂抹和选择商品图，实现了产品与图像的无缝融合，极大提升了设计和创作的效率。用户可以轻松替换模特的配件和服装，甚至进行logo的替换。

5、跳过o2!OpenAI 或计划推出新一代 “o3” 推理模型

OpenAI 正在研发新一代推理模型“o3”，旨在提升用户提问时的回应质量，使其更加深思熟虑和逻辑严谨。由于与英国电信公司O2的商标冲突，OpenAI选择跳过“o2”直接命名为“o3”。此举不仅反映了公司在品牌命名上的谨慎态度，也标志着OpenAI在应对产品更新放缓及市场竞争加剧方面的重要战略调整。

6、闪速!ElevenLabs推Flash语音对话模型:仅75毫秒延迟支持32种语言

ElevenLabs近期推出了其最新的人声合成模型Flash，声称这是迄今为止最快的文本转语音解决方案，生成语音的延迟仅为75毫秒，特别适合低延迟的对话式语音助手。Flash模型分为两个版本，其中Flash v2仅支持英语，而Flash v2.5则支持32种语言。尽管在音质和情感深度上稍逊于Turbo模型，但Flash在盲测中表现优异，成为速度最快的选择。

7、ChatGPT桌面端新增应用协作功能 Mac用户轻松读取应用内容

OpenAI最近推出了ChatGPT桌面应用程序的重要更新，其中新增的“与应用协作”功能使得ChatGPT能够直接读取多种应用程序的内容，如终端、IDE和文本编辑器。这一更新极大地提升了开发者和创作者的工作效率，支持的应用程序包括Apple Notes、Notion、VS Code等。

8、AI编程助手Cursor再获融资1亿美元，估值飙升至26亿美元

Anysphere 公司开发的 AI 编程助手 Cursor 在短短四个月内完成了1亿美元的 B 轮融资，估值飙升至26亿美元。这一轮融资由 Thrive Capital 领投，Andreessen Horowitz 参与但未主导。Cursor 的市场竞争虽激烈，但其受欢迎程度明显高于竞争对手，年收入在短时间内从400万美元增长至4800万美元。

9、GPT之父离职震动AI圈:OpenAI传奇研究员Radford转向独立研究

OpenAI的核心研究员Alec Radford宣布离职，转向独立研究，引发AI领域的广泛关注。他是GPT系列的首席设计师，曾在AI领域做出重要贡献，包括提出基于Transformer的语言模型生成预训练方法。Radford的离职标志着AI人才流动的挑战，同时也可能预示着独立研究者在AI技术创新中将发挥越来越重要的作用。

10、闪极推出国内首款999元AI眼镜:30g重量挑战可穿戴新赛道

闪极科技于12月19日发布了国内首款量产AI眼镜——闪极AI「拍拍镜」，起售价999元，预计于2025年1月15日开始发货。这款眼镜以经典黑框设计为主，重量仅50g，实际佩戴感受约30g。搭载索尼1600万像素摄像头及瑞声科技Hi-Fi扬声器，支持多种AI功能，未来还将通过在线升级增加更多功能。

11、Stable Diffusion3.5Large正式上线亚马逊 Bedrock平台

在AWS re:Invent大会上，Stable Diffusion3.5Large（SD3.5Large）正式在亚马逊Bedrock平台上线，旨在为开发者提供一个安全、便捷的生成式人工智能应用开发环境。该模型在文本到图像生成方面表现卓越，支持多样化的视觉风格，并能准确响应用户的输入。

12、14万亿token训练量加持:Falcon3挑战主流开源AI模型

阿布扎比技术创新研究院（TII）发布的新一代开源AI模型Falcon3，凭借14万亿token的训练量和优化的架构设计，在消费级硬件上表现出色，创下新纪录。与前代产品相比，Falcon3的训练规模翻倍，展现出强劲的竞争力，尤其是在与其他主流开源模型的基准测试中表现优异。

专业AI论文写作一键生成万字论文只需5分钟

文章来源: https://www.cy211.cn/airibao/5177.html Chat AI人工智能机器人在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑，如存在版权问题请发送邮件至398879136@qq.com，我们会在3个工作日内处理。非原创标注的文章，观点仅代表作者本人，不代表本站立场。

上一篇 AI创业日报：苹果或与腾讯、字节洽谈AI合作；可灵1.6版本

下一篇 AI创业日报：百川智能金融大模型发布；ChatGPT新增跨对

相关推荐