全国政协委员、中国信通院院长余晓晖在3月7日全国政协十四届三次会议第二次全体会议后接受记者采访时表示,大模型赋能制造业发展需要高质量数据集的支撑,要发挥中国制造业体系完备和场景丰富的优势,推动制造业企业与人工智能企业合作,沉淀积累高价值场景数据,构建制造业数据资源体系。通过将高质量行业数据集与大模型相结合,推动大模型在制造业赋能应用。
全国政协委员、中国信通院院长余晓晖在3月7日全国政协十四届三次会议第二次全体会议后接受记者采访时表示,大模型赋能制造业发展需要高质量数据集的支撑,要发挥中国制造业体系完备和场景丰富的优势,推动制造业企业与人工智能企业合作,沉淀积累高价值场景数据,构建制造业数据资源体系。通过将高质量行业数据集与大模型相结合,推动大模型在制造业赋能应用。
随着以大模型为代表的人工智能技术突破,人工智能在制造业领域的应用已成为一个极具战略意义的发展方向。余晓晖指出,当前,小模型在工业领域的应用相对更为广泛,且已形成较多的应用模式。这包括传统的专家系统、机器学习以及最近几年的深度学习等,它们在工业自动化、质量检测、生产优化等诸多环节中发挥着重要作用。相比之下,大模型进入制造业仍处于早期的阶段。从全球范围来看,这一领域的发展仍处于初步探索时期,尚未形成成熟的产业生态和大规模应用格局。
他认为,如果大模型技术进入制造业,其首要任务是与具体的工业场景紧密结合,并与工业数据相互融合。相比于娱乐消费领域,制造业对大模型的性能提出了十分严格的要求,例如实时性、准确性、可靠性等。这也要求大模型在实际应用中不能出现幻觉。因此,在大模型进入制造业的过程中,必须克服其可能出现的幻觉问题,并与应用场景的需求有效配合。
余晓晖进一步指出,数据是当前大模型智能和推理能力的核心基础。大模型的能力依赖于从数据中学习,而目前大模型训练所用数据来源主要集中在互联网等领域。制造业具有独特的行业特征,其业务流程、工艺机理和业务逻辑往往高度复杂且具有很深的专业性。这种复杂性和专业性意味着仅依靠现有的互联网数据,大模型难以充分理解和适应制造业的高价值场景,尤其是在那些行业门槛高、机理模型深度复杂的领域。
因此,要推动大模型在制造业中的应用赋能,必须要解决数据问题。具体而言,需要在制造场景中积累和沉淀高质量的数据,形成高质量数据集。通过将高质量数据集与大模型相结合,推动大模型在制造业赋能应用。
余晓晖表示,中国拥有全球最为完备的制造体系,涵盖了从原材料加工到高端装备制造的全产业链条,这其中蕴藏的数据极具挖掘潜力。将丰富多样的制造场景与海量的工业数据相结合,不仅能够有力推动中国制造业的智能化升级,也将为大模型的发展演进提供极为重要的支撑。
余晓晖指出,数据集存在于各个企业行业,需要制造业企业与人工智能企业形成联合体,加强数据同享,共同挖掘数据价值,并把数据和场景融合起来,将数据沉淀、积累形成一个围绕重点高价值场景的数据集,进而形成制造业行业的数据资源体系。更好赋能制造业数字化转型发展。