2025中国发展高层论坛|刘烈宏谈人工智能:高质量数据是应用底座 将印发数据产权制度和培育全国一体化数据市场文件

2025年03月25日 20:37   21世纪经济报道 21财经APP   缴翼飞

21世纪经济报道记者 缴翼飞 北京报道

3月24日,在中国发展高层论坛2025年年会的人工智能普惠包容发展专题研讨会上,国家数据局党组书记、局长刘烈宏表示,以DeepSeek R1为代表的开源大模型,推动了人工智能技术在全球的普遍应用,中国在人工智能领域取得的成果得益于国家“人工智能+”行动,也离不开数据要素的有效开发利用。

图:国家数据局党组书记、局长刘烈宏(缴翼飞/摄)

他指出,国家数据局将2025年明确为数据工作的改革攻坚年,将制定印发数据产权制度和培育全国一体化数据市场的文件,加快推进数据基础制度的建设,组织开展数字中国、数字经济、数据要素综合试验区的建设。同时,深化公共数据资源的开发,利用“1+3”政策体系,强化公共数据资源的登记管理,规范公共数据资源授权运营的实施和建立授权运营价格形成的机制。

算法、算力、数据技术交替突破

刘烈宏指出,算法、算力、数据的持续演进升级,是支撑人工智能发展的创新三角,算法、算力、数据是人工智能发展的三个基本要素,这三者相互独立又深度协同,共同按照规模定律,推动人工智能的迭代发展。

2020年,英伟达的A1版等AI芯片,促进了算力实现大幅提升,推动基于Transformer架构的生成式AI快速的发展,同时在为数据清洗、标注与合成技术的创新形成了“算力先行、算法与数据追赶”的格局。

而到了2022年,ChatGPT的发布标志着深层次AI算法取得重大突破。这一突破推动了专用AI芯片的研发以及分布式计算架构的优化,同时催生了对大规模高质量数据的需求,形成了“算法引领、算力与数据跟进”的动态平衡。

今年,DeepSeek R1、 OpenAI-o3使用思维链数据引领了这一轮人工智能的发展。

“总的来看,三大要素以非对称的节奏交替突破,任一要素的突破都会推动人工智能的发展,并倒逼其他两个要素链式升级,从而实现人工智能技术螺旋式的上升。”刘烈宏说。

在他看来,可持续的高质量数据供给是人工智能发展的不竭动力。数据是人工智能技术发展的基础燃料,而高质量数据更是训练高效人工智能模型的关键。大模型的精准预测能力与泛化能力,离不开海量、多样且标注准确的高质量数据集。数据资源的开发利用,为人工智能提供了规模化、标准化的训练数据,推动了算法的迭代以及场景的创新。例如,DeepSeek V3、GPT-4o等主流基座模型在训练阶段,都使用了经过严格清洗、加工和标注的约15万亿token。

刘烈宏强调,高质量数据作为人工智能应用的底座,在数据与智能驱动的新范式变革加速演进中愈发凸显基础性和战略性。同时,人工智能发展也面临互联网上的通用语料资源即将耗尽的问题。针对多模态行业知识类、思维链等数据的开发利用,将对人工智能纵深发展起到关键作用。

与此同时,行业应用和典型场景的落地,是推动人工智能进化普及的关键一环。“人工智能+”已经连续两年写入了政府工作报告之中。

刘烈宏指出,随着DeepSeek R1等大模型的开源,使得人工智能应用的门槛进一步降低。在行业数字化、智能化发展客观需求的牵引下,行业应用正在成为人工智能发挥价值的必然选择。

“我国的工业门类全,应用场景多,制造业、医疗、金融等领域积累了大量的高价值数据,可用于大模型的开发和行业应用,这为我国人工智能产业发展提供了广阔的增长空间,也是我国发展人工智能的一个比较优势。”他说。

据国家数据局调查,截至2025年2月,DeepSeek相关的应用,已经渗透到了政府、通信、汽车、能源、金融、科技等多个领域并取得初步成效。

刘烈宏指出,未来基于我国海量数据资源和丰富应用场景的优势,国家数据局将加快推动数据要素和人工智能的产业赋能、终端应用和产品培育,不仅使中小企业能够以轻资产的模式接入数据要素市场,形成“大企业搭台,小企业唱戏”的协同生态,而且将有效推动传统产业、战略性新兴产业、未来产业蓬勃发展,不断催生新业态、新模式,为经济社会高质量发展注入持久的动能。

2025年为数据工作改革攻坚年

“中国在人工智能领域取得的成果得益于国家‘人工智能+’行动,也离不开数据要素的有效开发利用。”刘烈宏表示,国家数据局将2025年明确为数据工作的改革攻坚年,将积极推动高质量数据集的建设,持续增加数据供给,推动“人工智能+”行动赋能千行百业,打造包容开放的创新环境。

一是持续推进基础制度的供给,统筹开展数据领域规划编制工作,加快形成数据领域的规划体系,制定印发数据产权制度和培育全国一体化数据市场的文件,加快推进数据基础制度的建设,组织开展数字中国、数字经济、数据要素综合试验区的建设,因地制宜开展先行先试,为数据要素价值释放积累实践经验,健全完善数据治理、数据安全等制度,更好保障人工智能安全发展。

二是持续推进高质量数据供给,深化公共数据资源的开发,利用“1+3”政策体系,强化公共数据资源的登记管理,规范公共数据资源授权运营的实施和建立授权运营价格形成的机制,积极引导做好高质量数据集的建设工作。“人工智能+”行动到哪里,高质量数据集的建设和推广就要到哪里。同时,以规模化场景应用和高质量数据集建设等实际需求,进一步推动我国数据标注产业的高质量发展,为人工智能技术创新和产业应用提供坚实的数据基础。

三是持续推进数据基础设施的建设,深层次人工智能的快速发展,对算力和数据流动力提出了更高更迫切的需求。国家数据局将系统地推进全国一体化算力网的建设,创新算力电力协同的机制,推动算力设施一体化、集约化绿色化的发展。将加快国家数据基础设施建设,构建国家数据基础设施的主体架构,推动区域、行业数据基础设施的互联互通,推动数场、可信数据空间等在数据流通利用基础设施中的应用,为数据流通利用打造安全可信的基础设施。

四是持续推进数据领域的国际合作深化。推进数据领域高水平开放,加强与重点国家和地区的多双边合作,为中外数字企业发展创造良好的环境,既支持鼓励中国企业,特别是中国数字企业品牌出海、质量出海,为世界各国提供数字化转型好的方案和经验,也坚持为在华企业务实解决问题提供高质量服务。同时,也将积极参与并持续推动人工智能安全治理,加强国际的合作和对话,为全球治理体系完善提供新的动力。

“人工智能的星辰大海需要数据的江河的奔腾,让数据活起来、动起来、用起来就能催生新的产业、新的模式、新的动能,让我们以高质量数据点燃人工智能创新发展的新引擎。”刘烈宏说。

关注我们