据媒体报道,字节跳动正在开发两款专门用于人工智能领域的GPU,并计划到2026年实现大规模量产。据悉,这两款AI GPU将由台积电负责制造,这将有助于字节跳动降低对英伟达的依赖,并且符合美国的出口管控法规。
目前,这两款GPU正处于设计阶段,一款专为AI训练设计,另一款则用于AI推理。预计它们将采用台积电的先进制程技术N4或N5生产,与英伟达的Blackwell系列制程技术相似。字节跳动期望在2026年实现这些GPU的大规模生产及部署。
今年,字节跳动已经投入超过20亿美元购买超过20万台英伟达H20 GPU,单价约为10000美元,其中许多订单尚未交付。由于市场上英伟达GPU供不应求且价格高昂,字节跳动决定开发自家的人工智能硬件。
英伟达为了应对去年美国实施的出口管控政策,为中国市场特别设计了DGX H20等产品。尽管HGX H20的性能相比英伟达的高端H100有所削减,但它仍然配备了96GB的HBM3内存、最高4TB/s的内存带宽和8路GPU互联能力,因此在实际应用中仍然受到企业客户的青睐。尽管字节跳动的新GPU可能会受到美国出口管制的限制,无法在性能上超越HGX H20,但其成本将大幅降低。
字节跳动在自主开发AI GPU方面面临的最大挑战是,公司目前依赖英伟达的CUDA及相应软件栈进行AI训练和推理。如果转向自家GPU,字节跳动将需要开发新的软件平台,并确保软件与硬件的兼容性。
[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑,如存在版权问题请发送邮件至398879136@qq.com,我们会在3个工作日内处理。非原创标注的文章,观点仅代表作者本人,不代表本站立场。