ChatGPT重磅升级：可以看图、听声音、说话啦！

来源：网络· 2023-09-26 09:25:16

美东时间9月25日，OpenAI在官网宣布，对ChatGPT进行重磅升级实现看图、听声音、输出语音内容三大功能。

早在今年3月OpenAI发布GPT-4模型时，就展示过看图的功能，但由于安全、功能不完善等原因一直没有开放。现在不仅开放了看图，连识别声音也来了，这是OpenAI实现AGI（通用人工智能）战略重要技术环节。

OpenAI表示，在接下来的两周内，向Plus和企业版用户提供看、听、说功能。语音功能将在 iOS 和 Android上使用，图片识别全平台可以使用。

微信图片_20230809104207.jpg

用语音与ChatGPT交流

ChatGPT新的语音功能由一个文本到语音模型提供支持，能够仅通过文字和几秒钟的样本语音生成类似人类的音频。

OpenAI与专业的配音演员合作，创建了5种合成语音，同时使用了自研开源语音识别系统 Whisper，将用户的语音转录成文本。

简单来说，以后用户想将文本直接生成语音，可以在ChatGPT中完成了。

例如，让ChatGPT听一段小猫咪的文本故事，然后选择人类语音便可以一键完成转录。完成后，用户可以下载这段语音。

story-juniper，AIGC开放社区，34秒

微信图片_20230809104207.jpg

可以向ChatGPT提问图片

用户可以向ChatGPT展示一张或多张图片，提问相关的问题。例如，发送一张坏掉的烧烤炉图片，然后询问无法启动原因;拍摄一张冰箱中的食材，询问多种菜品制作方案。

如果用户只想询问图片中的部分内容，可以通过移动端的绘图功能将其框起来进行发问。

ChatGPT的图片理解功能由 GPT-3.5和GPT-4提供技术支持，可理解的图片类型包括照片、屏幕截图或包含文本的图片等。

提供安全的AI服务

OpenAI表示，其目标是构建既安全又有益的AGI（通用人工智能）。所以，ChatGPT的功能正在逐步推出。这样做的好处是，可以让OpenAI有时间进行改进，逐步完善安全漏洞、风险。

特别是新的语音技术，可以在几秒内就能生成真实的合成声音，这可能会为诈骗者提供了便利条件，所以，这种安全的研发策略对于涉及语音和视觉的高级模型非常重要。

目前，Spotify已经使用ChatGPT的语音功能，开发一款语音翻译助手，可以将博主的声音自动翻译成其他语言，扩大用户群体。而Be My Eyes将ChatGPT的看图功能，植入在应用中，为盲人和弱视群体提供服务。

您可能关注: ChatGPT AI工具 AI语音 AI声音

专业AI论文写作一键生成万字论文只需5分钟

文章来源: https://cy211.cn/aizixun/589.html Chat AI人工智能机器人在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑，如存在版权问题请发送邮件至398879136@qq.com，我们会在3个工作日内处理。非原创标注的文章，观点仅代表作者本人，不代表本站立场。

上一篇秒杀Midjourney！Genmo AI可3秒作画成图并且

下一篇人工智能最新前沿技术有哪些

相关推荐

黄新伟深度拆解：什么是 AI 智能体（AI Agent），读懂下一代自主 AI 商业逻辑

　我是黄新伟，AI创业之家创始人，深耕全域AI流量与商业落地二十余年。最近很多做企业运营、AI创业、线上布局的老板都在问：AI智能体、LLM智能体到底是什么？它和 ...

AI办公新动作：Claude Cowork 移动端与网页版正式上线

　在人工智能辅助办公的赛道上，Anthropic 再次迈出关键一步。近日，该公司正式面向 Max 订阅用户推出了 Claude Cowork 的网页版及移动端应用 ...

AI巨头发出警告：AI系统正迅速进步，它们可能很快能够自我改进

　美国人工智能公司Anthropic呼吁全球顶级AI实验室考虑放缓开发步伐，理由是AI系统正以如此迅猛的速度进步，以至于它们可能很快能够在无需人工干预的情况下自我 ...

别只会单点用AI！真正的高手，都在玩「思维飞轮」

　很多人用AI，永远停留在「遇到问题问一句拿答案关掉」的点状模式。看似高效，实则每次从零开始，能力原地打转，永远被AI牵着走。真正会用AI的人，早已跳出「工具思维 ...

用AI来管公司，Moka推出三款AI HR工具

　Moka为AI人力资源软件服务商，早期从智能化招聘管理系统起步，后逐步扩展至更完整的HR管理系统。5月，Moka上线了招聘Eva、人事Eva和BPEva三款AI ...

AI创业之家带你吃透60个核心术语，零基础入门不踩坑

　很多刚接触AI的朋友，都卡在同一个痛点：术语看不懂、英文记不住、概念分不清。看教程像看天书，用工具一脸茫然，想入门却处处碰壁。今天，AI创业之家整理了60个AI ...

AI创业之家

GEO优化

AI长篇写作

AI生成思维导图

轻创AI用户注册

ChatGPT重磅升级：可以看图、听声音、说话啦！

AI智能对话

智能聊天对话，秒回答

AI模型创作

它无所不知，无所不能

GEO优化

抢占AI搜索榜首

服务热线

13826579603