AI创业之家

首页

立即注册

免费试用

首页 > AI资讯 > 公司动态

今日推荐

热门搜索

苹果上架近500元龙年手机壳支持全iPhone15系列百度网盘推出AI创意生成工具“超能画布”华为英伟达合作的算力龙头股盘点10大AI算力龙头股雷军：小米汽车性能堪比两百万油车并且售价不会低英伟达营收增长265%，英伟达概念股暴涨小米1亿台产品下线小米集团奖励引热议百度百家号打击自媒体利用AI传播违规内容什么是 Gemini？谷歌Gemini与GPT-4等其他AI模型有何不同清华创业团队推AI影视创作工具Dream Factory ：想法秒变微电一图看懂华为鸿蒙OS 4.2核心亮点：全新支持AI消除英伟达概念股英伟达概念股龙头一览京东APP上线AI智能导购助手提供购物相关建议腾讯元宝与腾讯文档打通：支持一键上传和导出为腾讯文档华人创业者推出AI视频生成工具Haiper，已融资千万美元华为回应Pura 70一键消除衣服；自研大模型漏洞后续会优化

标准化CRM

AI原创论文写作

毕业论文、学术论文写作

大型CRM

AI长篇写作

写小说、写论文等

CRM定制开发

AI生成思维导图

一键快速生成思维导图

轻创AI用户注册

免费获取体验账号

字节推1.58位量化FLUX模型内存减少7.7倍，性能不减反增！

来源：互联网· 2024-12-31 16:06:22

人工智能（AI）驱动的文本到图像(T2I)生成模型，如DALLE3、Adobe Firefly3等，展现出卓越的生成能力，在现实应用中潜力无限。然而，这些模型通常拥有数十亿的参数，对内存要求极高，这给在移动设备等资源受限的平台上部署带来了巨大挑战。

为了解决这些难题，ByteDance和POSTECH的研究人员探索了对T2I模型进行极低位量化的技术。在众多先进模型中，FLUX.1-dev因其公开可用性和出色的性能成为研究目标。

研究人员通过一种名为1.58位量化的方法，对FLUX模型中的视觉转换器权重进行压缩，使其仅采用 {-1，0， +1} 三个数值。这种量化方法无需访问图像数据，仅依靠FLUX.1-dev模型的自监督即可完成。与BitNet b1.58方法不同，该方法不是从头训练大型语言模型，而是作为一种针对T2I模型的后训练量化解决方案。

通过这种方法，模型存储空间减少了7.7倍，因为1.58位权重使用2位有符号整数存储，实现了从16位精度的压缩。为了进一步提高推理效率，研究人员还开发了一个为低位计算优化的定制内核。该内核使推理内存使用量减少了超过5.1倍，并提高了推理延迟。

在GenEval和T2I Compbench基准测试中的评估表明，1.58位FLUX在保持与全精度FLUX模型相当的生成质量的同时，显著提高了计算效率。

具体来说，研究人员将FLUX模型中99.5%的视觉转换器参数（总计119亿）量化为1.58位，从而大幅降低了存储需求。

实验结果表明，1.58位FLUX在T2I CompBench和GenEval数据集上的性能与原始FLUX模型相当。在推理速度方面，1.58位FLUX在低性能GPU(如L20和A10)上表现出更显著的改进。

总而言之，1.58位FLUX的出现，标志着在使高质量T2I模型能够在内存和延迟受限的设备上实际部署方面迈出了重要一步。

尽管1.58位FLUX在速度改进和高分辨率图像细节渲染方面仍存在一些局限性，但其在提高模型效率和降低资源消耗方面的巨大潜力，有望为未来的研究提供新的思路。

主要改进总结:

模型压缩: 模型存储空间减少了7.7倍。

内存优化: 推理内存使用量减少了5.1倍以上。

性能保持: 在GenEval和T2I Compbench基准测试中，1.58位FLUX保持了与全精度FLUX模型相当的性能。

无需图像数据: 量化过程无需访问任何图像数据，仅依赖模型自身的自监督。

定制内核: 采用了为低位计算优化的定制内核，提升了推理效率。

专业AI论文写作一键生成万字论文只需5分钟

文章来源: https://www.cy211.cn/aizixun/5359.html Chat AI人工智能机器人在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑，如存在版权问题请发送邮件至398879136@qq.com，我们会在3个工作日内处理。非原创标注的文章，观点仅代表作者本人，不代表本站立场。

上一篇通义发布2024年轻人AI使用趋势报告：85、90后关注AI

下一篇阿里云再度降价：Qwen-VL大模型全面降价1元可处理600

相关推荐

阿里千问APP公测版上线，免费开放，全面对标ChatGPT

阿里千问APP公测版上线，免费开放，全面对标ChatGPT

　11月17日，界面新闻从阿里巴巴官方微信号获悉，阿里正式官宣：个人AI助手千问APP开启公测。根据官方介绍，这一应用基于全球第一开源模型通义千问Qwen打造，免 ...

阿里千问APP公测，与ChatGPT展开全面竞争

阿里千问APP公测，与ChatGPT展开全面竞争

　11月17日，阿里巴巴正式宣布“千问”项目，全力进军AI to C市场。当天，千问APP公测版上线，基于全球性能第一的开源模型Qwen3，凭借免费，以及与各类生 ...

AI生态效应加速释放腾讯Q3经营利润同比增长18%至726亿元

AI生态效应加速释放腾讯Q3经营利润同比增长18%至726亿元

　11月13日消息，腾讯控股在港交所发布三季度财报，报告期内实现营收1928.7亿元，同比增长15%；经营利润（Non-IFRS）725.7亿元，同比增长18%， ...

放弃华为云，全力押注芯片，才是华为最现实的选择

放弃华为云，全力押注芯片，才是华为最现实的选择

　华为云，正走到一个需要重新评估方向与节奏的关键时点。在过去半年里，华为云经历了一次罕见的动荡：模型风波未平，高管接连被降级；营收增速放缓，组织频繁调整。这些变化 ...

“通义”App更名为“千问”：定位为阿里最强大模型官方AI助手

“通义”App更名为“千问”：定位为阿里最强大模型官方AI助手

　11月14日，阿里巴巴旗下人工智能应用“通义”App迎来重大品牌升级，正式更名为“千问”。腾讯科技经实测发现，目前千问App已正式上线苹果App Store，并 ...

GPT-5.1 更新助力开发者实现速度与成本双重提升

GPT-5.1 更新助力开发者实现速度与成本双重提升

　近日，OpenAI 发布了 GPT-5.1更新，进一步提升了其大型语言模型的性能。自从今年八月推出 GPT-5以来，开发者们期待的速度和成本效益终于在这一版本中 ...

AI智能对话

智能聊天对话，AI秒回答
AI模型创作

它无所不知，无所不能
AI绘画

只需一句话，生成精美画作
轻创AI咨询热线

13826579603

行业解决方案 AI论文生成网站地图 AI创作网 AI资讯 AI智能对话系统 AI创业之家 AI论文写作 AI智能知识库

©2023专业AI智能生成工具支持私有化支持定制

地址：深圳市龙华区民治牛栏前大厦微信:398879136 网站备案号：粤ICP备08036815号-3Copyright © 2024 深圳市星远创业科技有限公司版权所有