人工智能显著的溢出效应加快推进了新一轮科技革命,也带动了其他技术的进步。随着产业应用的深 入、场景复杂度提升,随之而来的是数据的爆发式增长、算法的飞速更新迭代、算力的消耗指数上升, 这些都对人工智能的发展提出新的要求。
]大模型发端及内涵
随着人工智能赋能实体经济进入深水区,企业通常面临数据资源有限、算力投资难度大、高水平人才 稀缺的发展瓶颈。大模型作为解决上述问题的最优路径之一,可极大降低企业的技术门槛和开发成 本。 IDC定义下的AI大模型是基于海量多源数据打造的预训练模型,是对原有算法模型的技术升级和产品 迭代,用户可通过开源或开放API/工具等形式进行模型零样本/小样本数据学习,以实现更优的识别、 理解、决策、生成效果和更低成本的开发部署方案。大模型的核心作用是突破数据标注的困境,通过学 习海量无标注的数据来做预训练,拓展整体模型前期学习的广度和深度,以此提升大模型的知识水 平,从而低成本、高适应性地赋能大模型在后续下游任务中的应用。在实践中,预训练大模型在基于海 量数据的自监督学习阶段完成了“通识”教育,再借助“预训练+精调”等模式,在共享参数的情况下,根 据具体应用场景的特性,用少量数据进行相应微调,即可高水平完成任务。