人工智能的本质是多源大数据模型训练,使计算机具备部分或超出人类的已有能力的技术集成。
在计算机世界,一切信息可以通过数据来表示,包括语音数据、文本数据、图像数据、压力数据、温度数据等等,人工智能就是通过海量数据对计算机进行驯化,来实现计算机模仿,具备或超出人的能力。
因此,海量数据的采集、清洗、存储、标注、处理、传播成为关键,人工智能的发展需要高水平算法和算力作为支撑,反映在对高端人才、芯片和数据传输网络的强依赖性。
算法、算力、数据是人工智能的三要求:
- 基础层提供算力支持,即硬件部分;
- 技术层提供通用技术平台做算法开发,驯化海量数据,即软件部分;
- 应用层体现不同场景下大数据驯化所体现的价值。
在数据、算力和算法的共同推动下,全球人工智能产业相关技术实现快速发展,下游应用不断丰富。
其中,算力代表了对数据的处理能力,是数字化技术持续发展的衡量标准,也是数字经济时代的核心生产力。
接下来以人工智能计算中心建设 1000P 的算力为例,深度了解人工智能的算力。
怎么理解 1000P ?
P 是一个数量级,10 的 15 次方,1000P 就是 100亿亿,1000PFlops 算力就意味着每秒有 100 亿亿次的浮点运算能力。
AI 算力单位:量级单位+每秒运算次数+数据类型
用来描述参与运算的数据类型,同时也表达了数据精度:
- INT8 8位 整数型数据 常适用于深度学习模型的推理运算
- FP16 16位 浮点型数据 常适用于深度学习模型的训练运算
- FP32 32位 浮点型数据 主要应用于高性能计算(比如科学计算)
一个 Atlas 800 组成的 AI 算力集群,以 1000P 算力为例,一个时钟周期可以进行“100亿亿”次计算。
那 1000P 的算力到底有多强?
- 相当于 50 万台 PC 电脑
- 以对 20 万颗星体的数据探索为例,传统方式需要一个有经验的科学家用 169 天才能完成,现在只需要 10.02 秒
- 在 26.9 秒时间内,学习 1200 万张照片,形成一个模型,用于图像识别
通用计算和 AI 计算,“分工”不同,共建多样性计算
| 通用计算
以 CPU 提供算力。适合复杂逻辑运算,比如大多数通用软件。70% 以上晶体管用于构建 Cache 和控制单元,计算核心从几个到几十个。
通用应用:办公、数据库、数值计算(气象预测、流体仿真、电磁仿真)等
| AI 计算
以 GPU 或 NPU 提供算力。适合逻辑简单,计算密集型高的并发任务。70% 以上晶体管用于构建计算单元,计算核心几千或上万个。
特定应用:图像识别(人脸识别、车牌识别、动作识别、物品检测、周界检测等)、自然语言处理(机器翻译、语音识别、文本生成、情感分析等)、搜索推荐、辅助驾驶、趋势预测等。
GPU:Graphics Processing Unit,图像处理单元,主要用于图像加速和渲染
NPU:Neural Network Processing Unit,神经网络处理单元
人工智能 1000P 并非超算意义上的 “1000P”
以高性能计算为例,TOP500 榜单,入围的超级计算机都要进行一项名为 LINPACK 的测试,以考察平台的双精度浮点计算能力。
以人工智能为例,人工智能运行的测试程序叫做 Resnet-50,而其成绩则是基于半精度浮点环境获得的,只考察平台的半精度能力。
总结:人工智能计算,只是高性能计算的一个分支,是针对神经网络,深度学习等,针对特定领域、特定场景产生的应用需求。高性能计算都是科研应用的基础,它能“算天算地算人”,几乎所有的应用都可以通过高性能计算来实现。双精度和半精度的区别,双精度是 64 位,单精度是 32 位,半精度是 16 位。
[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑,如存在版权问题请发送邮件至398879136@qq.com,我们会在3个工作日内处理。非原创标注的文章,观点仅代表作者本人,不代表本站立场。