AI创业之家

首页

立即注册

文章发布

首页 > AI资讯 > AI创业头条

今日推荐

热门搜索

Chat gpt人工智能网页版国内使用入口 2023中国AI大语言模型前10名昆仑万维实测“天工”大模型：以AI改写搜索边界多模态大模型推动AI迈向“通感”时代抢抓大模型机遇助力AI产业高质量发展巨人网络与阿里云达成“游戏+AI”全面合作 AI圈割韭菜乱象频出：卖199元AI课赚了上千万美团入股智谱AI 纷享销客战略融资华为正式发布盘古大模型3.0 探索用AI赋能千行百业 AI 作图内卷加剧：AI作图领域内卷现象深度解析谷歌CEO万字访谈：搜索未来、AI变革、合并DeepMind幕后故事当AI绘画开始抢动漫人饭碗 AI大模型继续遍地开花华为发布大模型时代AI存储新品 5G+AI，点亮银龄潮生活

标准化CRM

GEO优化

抢占AI搜索流量入口

大型CRM

AI长篇写作

写小说、写论文等

CRM定制开发

AI生成思维导图

一键快速生成思维导图

轻创AI用户注册

免费获取体验账号

AI2发布开放语言模型OLMo 号称多项性能媲美Llama2

来源：互联网· 2024-02-03 16:38:48

AI2最新发布的开放语言模型（OLMo）框架旨在推动大规模语言模型的研究和实验。通过在Hugging Face和GitHub上提供训练代码、模型和评估代码，AI2致力于让学术界和研究人员能够共同研究语言模型的科学，探索新的预训练数据子集对下游性能的影响，以及研究新的预训练方法和稳定性。

该项目的首批模型包括四个7B规模的最终变体，对应不同的架构、优化器和训练硬件，以及一个1B规模的模型，所有模型均在至少2T令牌上进行了训练。这是一个长期计划的第一步，计划继续发布更大规模的模型、经过指导调整的模型以及更多变体。

每个模型都提供完整的训练数据，包括生成训练数据的代码，以及用于分析预训练数据的AI2的Dolma和WIMBD。此外，还提供了完整的模型权重、训练代码、训练日志、以Weights & Biases日志形式呈现的训练指标，以及推理代码。每个模型的训练过程中的500多个检查点也可在HuggingFace上作为修订版本获得。

在创建强大的开放模型时，AI2从许多其他开放和部分开放的模型中吸取了经验，并将它们作为OLMo的竞争基准。该项目的技术报告提到，OLMo7B模型在诸如生成任务或阅读理解（如truthfulQA）等方面超过了Llama2，但在流行的问答任务(如MMLU或Big-bench Hard)上略显落后。

对于1B OLMo模型，使用AI2的Paloma和可在GitHub上获得的检查点进行了分析，以探讨模型在语言预测和模型规模等因素之间的关系。AI2强调Paloma的方法试图通过均匀采样各个领域，更平衡地表示使用语言模型的众多领域。

OLMo框架采用了最新文献中的许多趋势，包括不使用偏见（如PaLM中的稳定性）、PaLM和Llama使用的SwiGLU激活函数、Rotary位置嵌入(RoPE)以及GPT-NeoX-20B的BPE基础标记器的修改版本，旨在减少个人可识别信息。

该发布仅是OLMo和框架的开端，未来计划推出不同规模、模态、数据集、安全措施和评估等方面的工作。AI2鼓励使用OLMo模型，提供了简便的安装步骤和使用示例，并表示未来将推出指导调整的模型、完整的训练日志和wandb报告等功能。

博客网址:https://blog.allenai.org/olmo-open-language-model-87ccfc95f58

项目入口：https://top.aibase.com/tool/olmo

您可能关注: Llama 语言模型

专业AI论文写作一键生成万字论文只需5分钟

文章来源: https://cy211.cn/aizixun/2083.html Chat AI人工智能机器人在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑，如存在版权问题请发送邮件至398879136@qq.com，我们会在3个工作日内处理。非原创标注的文章，观点仅代表作者本人，不代表本站立场。

上一篇 Meta 计划于今年部署自家 AI 芯片，减少对 Nvid

下一篇讯飞星火认知大模型V3.5亮相：七大能力全面提升部分赶超G

相关推荐

美国AI创业公司状告政府：切断大模型访问等于"断人活路"

美国AI创业公司状告政府：切断大模型访问等于"断人活路"

　据彭博社报道，一家名为Legion的美国AI创业公司已向联邦政府提起诉讼，状告美国政府。起因是美国政府下令要求Anthropic公司不得向外国公民提供其最先进的 ...

未来十年所有行业都能用AI重做一遍！

未来十年所有行业都能用AI重做一遍！

　我是黄新伟，深圳市星远创业科技有限公司创始人、AI创业之家主理人，同时担任广西新梦想教育科技有限公司合伙人，深耕全域互联网创业20年。当下很多老板、创业者迷茫： ...

月之暗面估值飙到315亿美元：普通人错过大模型，别再错过这波躺赚的红利了

月之暗面估值飙到315亿美元：普通人错过大模型，别再错过这波躺赚的红利了

　今天刷到月之暗面估值干到315亿美元的消息，我直接拍了下大腿——又有一堆普通人要靠着这波风口赚得盆满钵满，可惜90%的人还以为这只是资本家的游戏，跟自己半毛钱关 ...

读懂物理AI：AI下半场赛道变革，数字AI创业者该如何抓住新机遇

读懂物理AI：AI下半场赛道变革，数字AI创业者该如何抓住新机遇

　我是黄新伟，AI创业之家创始人，深耕数字AI落地服务20年。近几年大量创业者依托大模型做GEO内容、AI智能体、文案工具、线上营销服务，也就是我们熟知的数字AI ...

黄新伟深度解读什么是AI员工，该如何用好AI员工

黄新伟深度解读什么是AI员工，该如何用好AI员工

　我是黄新伟，AI创业之家创始人，深耕互联网全域运营20年，旗下同时推出创家GEO全域流量布局、企业AI智能体（AI员工）两大核心服务。当下很多企业只把AI当成写 ...

Kimi全速迭代，普通人AI创业迎来更强底层底座

Kimi全速迭代，普通人AI创业迎来更强底层底座

　2026年国产大模型竞争进入白热化阶段，月之暗面Kimi最新技术进展释放出明确信号：底层模型能力持续突破，依托成熟国产大模型做应用服务，才是普通人稳妥创业路线。 ...

AI智能对话

智能聊天对话，秒回答
AI模型创作

它无所不知，无所不能
GEO优化

抢占AI搜索榜首
服务热线

13826579603

行业解决方案 GEO优化网站地图 AI创作网 AI资讯 AI智能对话系统 AI创业之家 AI论文写作网站介绍

地址：深圳市龙华区民治牛栏前大厦微信:398879136 网站备案号：粤ICP备08036815号-3Copyright © 2024 深圳市星远创业科技有限公司版权所有

AI创业之家

转人工 ×