立即注册

文章发布

首页 > AI创业日报

今日推荐

AI原创论文写作

毕业论文、学术论文写作

AI长篇写作

写小说、写论文等

AI生成思维导图

一键快速生成思维导图

轻创AI用户注册

免费获取体验账号

AI日报：Kimi发布多模态图片理解模型API；周鸿祎参演AI短剧开拍；MiniMax-01系列模型开源；星火同传语音大模型发布

来源：AI创业之家· 2025-01-15 16:28:46

欢迎来到【AI创业日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

1、月之暗面Kimi多模态图片理解模型 API 发布

2025年1月15日，北京月之暗面科技有限公司正式发布了全新多模态图片理解模型moonshot-v1-vision-preview，该模型在原有moonshot-v1系列的基础上进一步增强了多模态能力，旨在帮助Kimi更好地理解世界。该Vision模型具备卓越的图像识别能力，能够识别复杂细节并区分相似对象，表现出色，尤其在OCR文字识别和图像理解方面，超越传统软件的准确性。

2、MiniMax开源MiniMax-01全新系列模型

MiniMax于2025年1月15日发布了其全新开源系列模型MiniMax-01，包含基础语言模型MiniMax-Text-01和视觉多模态模型MiniMax-VL-01。该系列通过创新的线性注意力机制和超大参数量，实现了高效的长文本处理，性能与国际顶尖模型相当。

3、周鸿祎参演 AI 短剧开拍，AI做特效、AI硬件齐上阵

360集团创始人周鸿祎宣布参与拍摄国内首部AI短剧，该剧将在西安开机，计划于春节期间上线。短剧以穿越为主题，预计60集，旨在传递正能量并避免狗血剧情。周鸿祎希望通过短剧展示AI技术，促进其在日常生活中的普及，同时推动360的纳米AI搜索产品的发展。

4、阿里巴巴达摩院推出电商场景多模态大模型Valley2

阿里巴巴达摩院推出的Valley2是一款多模态大型语言模型，专为电商场景设计，旨在提升各领域的性能并拓展应用边界。该模型结合了先进的视觉编码器和创新的处理模块，展现了在多个基准测试中的卓越表现，标志着多模态语言模型的重大进展。

5、ChatGPT智能体来了!上线“Tasks”功能:智能处理提醒和待办事项

OpenAI最近推出了ChatGPT的新功能“任务”，允许用户安排未来的操作和提醒，使其更像传统数字助理。该功能现已向Plus、Team和Pro订阅用户推送，用户可以简单地输入任务及时间，ChatGPT将处理这些需求。尽管目前仅限于付费用户。

6、小型文本转语音模型Kokoro-TTS，曾拿下TTS排行榜第一

Kokoro是一款新发布的语音合成模型，具有8200万参数，迅速在TTS领域崭露头角。其在Hugging Face平台上发布后，凭借仅用不到100小时的音频数据，便在排行榜上夺得第一，展现了超高的性价比。尽管目前存在声音克隆的局限性，但其训练过程的合规性和高效性为未来的发展奠定了基础。

7、Topview AI推全球首个支持生成手拿产品的数字人Product Avatar

Topview AI推出的“Product Avatar”数字人解决方案为电商行业带来了革命性的变化。商家只需上传产品图片，AI便能生成手持产品的数字人并进行口播讲解，极大地节省了拍摄时间和成本。该产品还支持多种语言和个性化定制，标志着电商营销进入AI驱动的新阶段。

8、英伟达400万美投资 MetAI 几分钟将CAD文件转为3D世界

Nvidia最近对初创公司MetAI进行了400万美元的种子轮融资，旨在推动AI数字双胞胎技术的发展。MetAI专注于利用AI和3D技术迅速将CAD文件转换为功能性3D环境，大幅缩短数字双胞胎的创建时间。该公司计划在2025年将总部迁至美国，并扩大研发团队，以满足日益增长的市场需求。

9、讯飞星火4.0Turbo七大核心能力升级:数学、代码能力超GPT-4o

讯飞星火4.0Turbo的全面升级标志着科大讯飞在人工智能领域的又一重大突破。此次升级不仅在文本生成、语言理解等七大核心能力上实现了显著提升，更在数学和代码能力方面超越了GPT-4o，尤其是在复杂数学问题的处理上展现出更强的能力。

10、Gemini AI 实现视觉处理新突破:实时视频与静态图像同步分析

谷歌的Gemini AI最近在视觉处理领域取得了重要突破，能够同时处理实时视频和静态图像。这项技术通过实验性应用AnyChat展示，标志着人工智能在多流处理方面的进步。开发者可以利用Gemini的架构创建自定义平台，应用于教育、艺术等多个领域，展现出广泛的应用潜力。

11、科大讯飞星火同传语音大模型发布:达到人类专家译员水平

科大讯飞今日发布了星火同传语音大模型，标志着国内首个具备端到端语音同传能力的大模型的问世。这一技术的推出，显著提升了翻译的流畅性和准确性，尤其在国际交流场合中表现出色。该模型支持多种语言的即时翻译，响应时间缩短至5秒以内，达到人类专家的翻译水平，预示着未来国际交流的便捷与高效。

12、OpenBMB发布多模态模型MiniCPM-o2.6手机也能进行视觉和语音处理

OpenBMB推出的MiniCPM-o2.6是一款具有80亿参数的多模态模型，旨在解决高计算资源需求与边缘设备兼容性之间的挑战。该模型在视觉、语音和语言处理方面表现出色，能够高效运行于智能手机和平板电脑上。通过模块化设计，MiniCPM-o2.6集成了多种强大组件，支持实时处理和多语言功能。

专业AI论文写作一键生成万字论文只需5分钟

文章来源: https://www.cy211.cn/airibao/5544.html Chat AI人工智能机器人在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑，如存在版权问题请发送邮件至398879136@qq.com，我们会在3个工作日内处理。非原创标注的文章，观点仅代表作者本人，不代表本站立场。

上一篇 AI创业日报：1秒出图！英伟达开源文生图模型Sana；Ope

下一篇 AI创业日报：智谱Realtime、4V、Air新模型发布；

相关推荐

AI日报：阿里开源文生视频模型万相2.1；幻方量化回应DeepSeek-R2模型提前发布；百度“秒哒

　欢迎来到【AI创业日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。1、通 ...

AI创业日报：全球首个混合推理模型Claude 3.7 Sonnet发布；阿里开源推理模型QwQ；D

　欢迎来到【AI创业日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。1、A ...

AI创业日报：DeepSeek开源大模型加速器FlashMLA；海螺AI推I2V-01-Direct

　欢迎来到【AI创业日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。1、D ...

AI创业日报：给力！DeepSeek下周将开源五个项目；阿里通义万相将开源视频生成模型WanX 2.

　欢迎来到【AI创业日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。1、超 ...

AI创业日报：腾讯深度思考模型“混元T1”全面开放；字节跳动全新视频生成工具Phantom；苹果智能

　欢迎来到【AI创业日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。1、腾 ...

AI创业日报：DeepSeek推出NSA技术；小红书打击黑灰产用AIGC大模型矩阵养号；月之暗面Ki

　欢迎来到【AI创业日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。1、月 ...