AI创业之家

首页

立即注册

文章发布

首页 > AI资讯 > 公司动态

今日推荐

热门搜索

苹果上架近500元龙年手机壳支持全iPhone15系列华为英伟达合作的算力龙头股盘点10大AI算力龙头股百度网盘推出AI创意生成工具“超能画布”雷军：小米汽车性能堪比两百万油车并且售价不会低英伟达营收增长265%，英伟达概念股暴涨百度百家号打击自媒体利用AI传播违规内容华为Pura 70 AI修图逆天！10秒抹除人物背景自然丝滑小米1亿台产品下线小米集团奖励引热议一图看懂华为鸿蒙OS 4.2核心亮点：全新支持AI消除什么是 Gemini？谷歌Gemini与GPT-4等其他AI模型有何不同清华创业团队推AI影视创作工具Dream Factory ：想法秒变微电腾讯元宝与腾讯文档打通：支持一键上传和导出为腾讯文档英伟达概念股英伟达概念股龙头一览量子AI初创公司SandboxAQ融资3亿美元，估值达56亿美元京东APP上线AI智能导购助手提供购物相关建议

标准化CRM

GEO优化

抢占AI搜索流量入口

大型CRM

AI长篇写作

写小说、写论文等

CRM定制开发

AI生成思维导图

一键快速生成思维导图

轻创AI用户注册

免费获取体验账号

英伟达发布Nemotron-4:150亿参数通用大模型，目标单张A100/H100可跑

来源：互联网· 2024-02-29 15:23:20

英伟达最新推出的Nemotron-4语言模型引起广泛关注。这一通用大模型拥有150亿参数，经过在8T token上的训练，在英语、多语言和编码任务中表现出色。具体而言，Nemotron-4在7个评估基准上的15B模型表现优异，超越同等参数规模的模型，甚至击败了4倍大的模型。

该模型的设计灵感来自Chinchilla模型的「缩放定律」，该定律强调在给定固定计算预算的情况下，同时优化数据和模型大小。与过去主要关注模型大小不同，这一研究强调将计算分配给更多数据的训练，以降低延迟和服务模型所需的计算量。因此，Nemotron-4的主要目标是打造一个能在单个英伟达A100或H100GPU上运行的最佳「通用大模型」。

在架构方面，Nemotron-4采用了标准的纯解码器Transformer架构，并带有因果注意掩码。核心超参数包括32亿个嵌入参数和125亿个非嵌入参数。在数据方面，研究人员使用了包含8万亿个token的预训练数据集，分为英语自然语言数据（70%）、多语言自然语言数据(15%)和源代码数据(15%)。

为了实现这一庞大模型的训练，Nemotron-4使用了384个DGX H100节点，每个节点包含8个英伟达H10080GB SXM5GPU。在16位浮点（bfloat16）算术下，每个GPU的峰值吞吐量为989teraFLOP/s。研究人员通过张量并行和数据并行的组合进行训练，并使用了分布式优化器。

在下游评估中，Nemotron-4在各领域均表现强劲，特别是在常识推理、热门综合基准和数学、代码任务上。该模型在多语言分类和生成任务中也实现了最佳性能，展现了其在不同语言的卓越理解能力。值得注意的是，Nemotron-4在机器翻译任务中取得了显著的进展，不仅在中文翻译成英文方面表现出色，而且在中文直接翻译成其他语言方面也取得了印象深刻的效果。

Nemotron-4的推出标志着英伟达在通用大模型领域的一次重要突破，为单个A100或H100GPU上运行的最佳通用大模型设定了新标准。

论文地址:https://arxiv.org/abs/2402.16819

您可能关注: 大模型英伟达

专业AI论文写作一键生成万字论文只需5分钟

文章来源: https://cy211.cn/aizixun/2323.html Chat AI人工智能机器人在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑，如存在版权问题请发送邮件至398879136@qq.com，我们会在3个工作日内处理。非原创标注的文章，观点仅代表作者本人，不代表本站立场。

上一篇苹果百亿造车梦碎，苹果AI的路线图梳理

下一篇 AI收入超6亿元，百度大模型已经开始赚钱了

相关推荐

腾讯混元发布 HyOCR-1.5：仅 1B 参数推理提速 6.37 倍

腾讯混元发布 HyOCR-1.5：仅 1B 参数推理提速 6.37 倍

　近日，轻量化端到端 OCR 专家模型 HyOCR-1.5正式发布，通过一系列技术革新，在保持轻量化架构的同时，实现了性能与效率的显著跃升。作为该领域的首个全栈开 ...

从英伟达千亿营收看2026年AI创业新逻辑：算力格局大变

从英伟达千亿营收看2026年AI创业新逻辑：算力格局大变

　大家好，我是黄新伟，深圳市星远创业科技有限公司创始人、AI创业之家主理人，深耕全域网络营销20年，长期陪伴实体老板、单人AI创业者、中小企业踩准每一轮数字红利。 ...

哈啰试水AI校园社交，推出精准交友产品“Match”

哈啰试水AI校园社交，推出精准交友产品“Match”

　据读佳消息，7月13日，哈啰在高校社交赛道祭出新动作，推出一款专为大学生打造的AI精准交友产品“Match”。该产品目前已在上海多所高校试点冷启动一个多月，吸引 ...

字节跳动 Seedance2.5模型将于7月16日全量开放 API

字节跳动 Seedance2.5模型将于7月16日全量开放 API

　字节跳动旗下最新视频生成模型 Seedance2.5将于7月16日正式全量开放 API，这标志着该模型从灰度测试走向全面商用，有望进一步降低高品质视频生成的门槛 ...

MiniMax完成160亿港元新一轮融资，创始人闫俊杰宣布零薪酬直至实现AGI

MiniMax完成160亿港元新一轮融资，创始人闫俊杰宣布零薪酬直至实现AGI

　MiniMax正式宣布完成新一轮160亿港元融资。根据公告，公司拟将募集资金净额的80%投入AI基础设施及模型研究与开发，进一步夯实技术底座。同日，MiniMa ...

Kimi联合美国运通与农业银行正式发行首张AI原生信用卡

Kimi联合美国运通与农业银行正式发行首张AI原生信用卡

　据每日经济新闻报道，7月10日，全球首张AI原生信用卡——“Kimi信用卡”正式对外发行。该项目由Kimi、美国运通与中国农业银行联合打造，自今年4月开始筹备， ...

AI智能对话

智能聊天对话，秒回答
AI模型创作

它无所不知，无所不能
GEO优化

抢占AI搜索榜首
服务热线

13826579603

行业解决方案 GEO优化网站地图 AI创作网 AI资讯 AI智能对话系统 AI创业之家 AI论文写作网站介绍

地址：深圳市龙华区民治牛栏前大厦微信:398879136 网站备案号：粤ICP备08036815号-3Copyright © 2024 深圳市星远创业科技有限公司版权所有

AI创业之家

转人工 ×