AI日报:字节重磅推出豆包视觉理解模型;AI“魔改”宠物跳舞爆火;OpenAI开放满血o1模型API;即梦AI上线海报生成功能

来源:AI创业之家· 2024-12-18 16:14:49

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

1、字节推出豆包视觉推理大模型:价格低至0.003元/千token

在火山引擎FORCE原动力大会上,火山引擎总裁谭待发布了豆包视觉理解大模型,该模型通过结合文本和图像信息,展现出卓越的内容识别和推理能力。新模型的价格大幅降低,使得企业用户在智能化转型中更具信心。豆包大模型的日均tokens使用量已超过4万亿,显示出强大的市场需求和应用潜力。

image.png

2、OpenAI开放满血o1模型API:成本降低60% 新增高级视觉处理能力

在为期12个工作日的连续直播活动中,OpenAI在第9天面向开发者发布了o1模型的API,并宣布对实时API进行重大升级,支持WebRTC技术。自发布日起,OpenAI将向API使用等级5级的开发者提供o1API的访问权限。此次更新的o1模型API相较于之前的预览版本,在思考成本上实现了60%的降低,并新增了高级视觉处理能力。同时,GPT-4o在音频处理上的成本也减少了60%,而mini版本的价格也大幅下降了10倍。

3、Ideogram推出批量图像生成工具:告别繁琐操作,大规模创意图像一键生成

AI图像生成平台Ideogram近期推出了一项批量图像生成工具,旨在通过上传表格文件简化图像生成流程。用户可以在CSV文件中预先填写提示词和设置,Ideogram将根据这些信息自动生成图像。这一创新大幅提高了专业设计师和创意人士的工作效率,减少了逐条输入的繁琐操作。该功能目前仅对Ideogram Pro用户开放,展现了AI在设计领域的巨大潜力和智能化的创作方式。

image.png

4、即梦AI上线海报生成功能 可一键将静态海报变为动态海报

即梦AI在2024年12月18日的火山引擎FORCE大会上推出了全新的海报生成功能。这项技术的发布标志着图像生成领域的一次重要进步。用户只需输入一句简单的描述,系统便能快速生成创意海报,大幅简化了传统设计所需的时间与技能要求。此外,新增的动态海报生成功能为内容创作者提供了更丰富的展示方式,尤其适合社交媒体和广告使用,能够有效吸引观众注意力,提升营销效果。

image.png

5、扣子1.5版正式推出:支持多模态能力 可第一时间体验豆包新模型

扣子Coze在火山引擎FORCE原动力大会上推出了全新版本的扣子1.5,标志着在AI应用开发领域的重要进展。此版本支持GUI搭建界面,用户可轻松创建和发布多种应用形式,极大地降低了开发门槛。同时,扣子1.5增强了多模态能力,支持最新的豆包大模型,提供丰富的模板和解决方案,助力开发者提升效率,已吸引了超过100万活跃开发者。

image.png

6、字节跳动:豆包视频生成模型将于2025年1月正式对外开放服务

在2024火山引擎FORCE原动力大会·冬上,火山引擎展示了豆包大模型家族的全新升级,日均tokens使用量超4万亿,增长显著。大会推出了视觉理解模型及多个模型的升级,提升了豆包通用模型pro的综合任务处理能力。此外,火山引擎发布了支持AIGC创作的veOmniverse+豆包·3D生成模型,并宣布豆包·视频生成模型将于2025年1月正式对外开放服务,标志着大模型技术的深入发展。

7、字节跳动火山引擎全域AI搜索发布:支持多模态搜索

在2024火山引擎FORCE原动力大会·冬上,字节跳动推出了全域AI搜索服务,旨在通过整合多种信息和需求,提升企业的推荐精准度和信息发现能力。该服务依托强大的A1搜推引擎,支持多模态理解,能够快速处理海量内容并提供实时热点答案,增强用户体验。同时,火山引擎还推出了大模型记忆方案,助力客户构建高效的记忆系统,这是大模型发展的重要方向。

8、微信上线“作者朗读音色”新能力

微信平台推出的“作者朗读音色”功能,允许公众号作者用个性化语音为文章配音,提升了阅读体验的互动性和个性化。作者需下载“订阅号助手”APP录制语音,复刻个人语气和情感,并可在公众号中应用。此功能目前处于灰度测试阶段,尚未全面开放,微信鼓励创作者耐心等待。此举标志着微信在提升用户体验和满足创作者需求方面的重要进展,预计将丰富公众号内容表现形式。

9、英伟达发布生成式AI超级电脑:仅249美元 性能提升1.7倍

英伟达推出的Jetson Orin Nano Super是一款面向开发者的生成式人工智能超级电脑,定价249美元,性能提升显著,适用于多种AI应用场景。该设备在生成式AI性能上提升了1.7倍,并且在内存带宽和运算能力方面也有显著进步。黄仁勋强调,该设备以更低的成本为开发者提供卓越的运算性能,展现出在智慧城市、农业及机器人开发等领域的广泛应用潜力,标志着AI技术的普及与应用迈出了重要一步。

10、OpenAI表态:暂未计划推出 Sora API,视频生成需求超预期

OpenAI最近宣布,暂时没有推出其视频生成模型Sora的API计划,原因在于用户需求远超预期。Sora能够根据文本或图像生成逼真视频,但由于申请用户激增,OpenAI不得不暂停新用户注册。CEO山姆·阿尔特曼对此表示歉意,并强调解决这一问题需要时间。与此同时,竞争对手谷歌和AWS已推出各自的视频生成API,OpenAI面临着市场压力,未来的策略备受关注。

11、AI“魔改”宠物跳舞爆红网络:猎奇、荒诞成流量密码

近期,AI生成的宠物跳舞视频在抖音上引发热潮,展现出荒诞与搞笑的完美结合。这些视频中的猫狗们瞬间化身舞蹈高手,带来了强烈的视觉冲击和戏剧性。尽管部分观众对这种奇特的视觉体验感到不适,但它们无疑挑战了我们对动物形象的固有认知,展示了AI技术的无限可能性与创意。

12、不需要喂食也能陪伴你 AI宠物Moflin在小红书走红

Moflin是一款新型AI宠物,因其可爱的外形和情感互动特性在小红书上迅速走红。用户通过视频分享与Moflin的互动体验,吸引了众多网友的关注。尽管Moflin无法替代真实宠物,但其提供的情感陪伴满足了现代人的需求,成为一种新的消费趋势。Moflin的情感模拟和个性化互动使其在市场上具备了巨大的溢价空间,成为一种新型的情感陪伴产品。

image.png

13、波士顿动力裁员5%,因资金压力急需转型

波士顿动力公司近期宣布裁员5%,约45名员工受到影响,几乎涵盖所有部门。公司面临严峻的财务压力,尽管其机器人产品如Spot和Atlas在市场上受到关注,但商业发展未达预期。CEO罗伯特・普莱尔指出,资金消耗速度超过收入增长,迫切需要优化运营以实现可持续发展。在竞争激烈的市场环境中,波士顿动力需应对特斯拉等公司的压力,转型成为当务之急。

14、数百名OpenAI员工即将通过私人股票出售获得1000万美元巨额收益

最近,OpenAI宣布将为软银进行16亿美元的股票回购,数百名现任及前任员工将有机会通过这一交易获得高达1000万美元的收益。这一消息引发了广泛关注,尤其是对于那些早期加入公司的员工而言,他们可能会实现财务自由。此次股票出售不仅激励了员工,也加强了公司与投资者之间的信任关系,显示出OpenAI作为创新型公司的潜力与价值。


[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑,如存在版权问题请发送邮件至398879136@qq.com,我们会在3个工作日内处理。非原创标注的文章,观点仅代表作者本人,不代表本站立场。