“十五五”时期加快推动我国人工智能体系化创新的实施路径
2026-01-21 11:31:00
字号:大 中 小
摘要
当前,以“算力、数据、模型”为内核的人工智能体系化创新已逐步成为新时代人工智能技术发展的核心竞争力,也是我国在“十五五”时期推动人工智能跃升、深入实施“人工智能+”行动的前提与关键。为推动人工智能体系化创新,关键在于构建开放包容的协同创新体系,实现创新资源的优化配置。建议充分发挥各类主体优势,强化算力、数据、模型等创新要素供给,把握人才需求变化,构建更高水平、更加开放、更多样性的创新环境,助力“人工智能+”在科学、制造等领域的深入实施。
《中国共产党第二十届中央委员会第四次全体会议公报》明确提出,加快高水平科技自立自强,引领发展新质生产力。当前,人工智能正以前所未有的速度赋能新质生产力发展。“计算密集、数据驱动、基于模型”已成为人工智能的最本质特征,各级政府最新出台的人工智能创新发展政策,如国务院《关于深入实施“人工智能+”行动的意见》、浙江省《关于支持人工智能创新发展若干措施》、上海市《进一步扩大人工智能应用的若干措施》等,均将算力、数据、模型综合能力建设作为核心任务。牢牢把握算力、数据、模型体系化创新这一技术坐标,构建开放包容的协同创新体系,找准推动人工智能创新突破的关键路径,是我国在“十五五”时期锚定战略支点、抢占发展主动的前提与关键。
一、算力、数据、模型体系化创新
是新时代人工智能发展的核心竞争力
当前,在以大语言模型为代表的新一代人工智能技术范式下,算力、数据、模型已不再是独立发展的技术单元,而演变为相互依存、互为驱动的有机整体,构成了人工智能发展的底层逻辑。通过系统性创新实现三者间的协同效应,形成“1+1+1>3”的叠加优势,进而构建相互驱动、加速迭代的正向循环机制,这便是人工智能体系化创新。这种体系化思维突破了传统单点技术的局限,强调从全局视角优化资源配置、技术路径和创新生态,已成为决定人工智能竞争胜负的关键。
(一)技术发展规律的内在要求
从技术发展规律来看,算力、数据、模型三者之间深层次的相互依赖关系,决定了体系化创新是人工智能实现突破的必然路径。
第一,基础模型已成为数据价值的转化枢纽。自2017年以来,人工智能技术逐渐收敛到生成式预训练模型,从ChatGPT的诞生到推理模型o1、DeepSeek R1的推出,基础模型已从对话工具演进为解决科学问题的通用语言和方法论,成为推动科技革命的关键力量。
第二,数据是提升模型推理性能的核心原料。大语言模型对数据资源的直接利用需要深度加工,也称为“脱壳化(Tokenization)”。这一过程为数据价值计量提供了统一计量单位“拓克”(Token),为数据要素价值化奠定基础。当前基础模型训练数据规模已达万亿Token级别,例如DeepSeek-V3训练数据规模达14.8万亿Token。数据通过“脱壳化”处理为模型训练和推理提供“养料”,其规模与质量更是模型突破性能瓶颈、实现能力迭代的关键。
第三,算力是模型迭代和数据利用的承载底座。算力不仅为数据的存储、清洗、标注提供硬件支撑,更为模型的训练、推理与迭代提供计算动力。2020至2025年间,模型训练的算力需求增长了近1000倍,GPT-4等模型的训练基本需要万卡集群支撑。
算力、数据、模型三者相互依存的关系表明,任何单一要素的进步都难以独立推动人工智能技术跨越式发展。只有通过体系化创新,才能打通数据价值转化、模型性能提升和算力资源优化的全链条,形成技术演进加速器效应。
(二)国际竞争格局下的战略选择
从国际发展趋势来看,人工智能体系化能力竞争已成为全球人工智能领域的主战场。开源生态正在重塑全球科技竞争格局。2025年初,DeepSeek R1基于MIT协议开源6700亿参数权重,打破了OpenAI等美国公司闭源模式所建立的资本与资源壁垒。2025年7月,美国政府在《赢得竞赛:美国人工智能行动计划》中提出,鼓励开源和开放权重人工智能,计划提升私营部门算力、数据、模型资源的开放水平,凸显出人工智能体系化能力的战略价值。
从资源约束角度来看,体系化创新需求凸显,成为必然选择。据人工智能研究机构Epoch AI预测,互联网上的高质量文本数据将于2028年耗尽,全球AI行业面临“数据墙”挑战。同时,全球算力资源分布极不均匀,谷歌持有100万至150万张GPU,而斯坦福大学研究小组仅有68张,高昂的计算成本正将研究人员排除在外。在此背景下,通过算法创新挖掘数据价值、提升计算效率;通过开源开放推动要素流通、降低应用门槛,成为破解资源困境的现实路径。
二、推动人工智能体系化创新的关键
是构建开放包容的协同创新体系
人工智能体系化创新涉及算力、数据、模型的资源整合与协同创新,是一项跨领域、高投入、大协作的系统工程,其规模化与复杂度并非任何政府、企业或高校科研院所能单独应对。唯有构建起有共同目标、风险共担、利益共享、运转高效的协同创新体系,才能实现人工智能创新的系统突破,提升产业链整体竞争力和韧性。
(一)创新资源的高效组织与优化配置是基础
人工智能的创新离不开算力、数据等创新资源的高效组织与优化配置。ChatGPT、Gemini和DeepSeek等大模型诞生的背后都有一整套高效组织的体系化资源作为支撑。以ChatGPT为例,在过去数年里,微软持续投资130亿美元支持OpenAI的技术创新,提供了上万张英伟达A100芯片打造的计算平台,Bing搜索、GitHub社区等数据资源,微软旗下全线产品等丰富应用场景,帮助OpenAI实现更快的产品迭代。
当前,我国算力、数据、模型等创新资源供给能力不断增强。截至2025年6月,我国智算规模达788 EFlops;备案登记的生成式人工智能模型达672项;数据方面,2024年我国数据生产总量达41.06ZB,占全球数据总量的26.67%。然而,从国家层面看,上述创新资源仍处于相互分割的状态,算力通常被科技巨头所掌握,数据则分散在各个企业、政府机构、科研院所中,组织化、协同化不足等问题较为突出。如某大学2022年至今共采购英伟达A100 GPU 28台、A800 GPU 9台、4090显卡12台、3090显卡12台;然而这些GPU的采购需求来自不同课题组,导致GPU即便产权属于这所大学,但实际操作多为单一课题组管控,很难实现资源的统一组织和调用。这种资源分散割裂现象是限制人工智能体系化创新的重要瓶颈,亟需通过体制机制创新设计,推动算力、数据、模型等创新资源的融通配置。
(二)优势互补的协同创新体系是必然选择
要真正激发各类创新主体的活力,实现人工智能体系化创新,必须以体制机制创新推进各类机构间的优势互补,充分发挥企业作为创新引擎、政府作为导航舵手、非营利机构/学术界作为补充平衡器的作用。任何一方都无法单独应对人工智能带来的巨大变革。企业可能过于追求商业利益而忽视风险和社会影响;政府或因缺乏技术敏捷性或过度监管而抑制创新;非营利机构可能因缺乏资源而无法落地。唯有三方形成紧密协作、相互制衡、良性互动的生态系统,才能最大程度释放人工智能的潜力。
一直以来,我国高度重视以政企学研协同创新来推动人工智能在多领域的创新应用。中国信通院数据显示,截至2025年9月,我国人工智能企业超5300家,在全球占比约15%。这种初创企业不断涌现的良好发展局面是我国构建企业主导的产学研用创新体系的重要基础。同时,政府也在通过政策支持、资源整合,为科技创新和产业创新的融合保驾护航。例如,上海通过创新设立人工智能知识产权保护专业委员会,不断健全人工智能领域知识产权保护机制,从而帮助更多企业快速响应市场需求,成为原创技术的“策源地”。通过打造“政府引导方向、企业主导创新、协会协同资源、学界支撑研发”的政企学研协同模式,有望为我国人工智能体系化创新提供良好生态环境。
(三)开源开放的创新协作生态是关键战略
人工智能时代的开源已从开源层面的共享,延伸至科学研究过程、科学数据、科学基础设施等科技创新资源的全面开放。这种开源开放的科研方式,正在重塑科研协作范式,推动创新要素的跨界流动与高效重组,成为人工智能创新发展的重要引擎。在全球化遭遇逆流、科技竞争日益激烈的背景下,唯有坚持开放协作,才能最大程度地释放人工智能的潜能。
我国一直是人工智能开源领域的重要贡献者和实践者。中国工业和信息化部数据显示,截至2024年底,中国软件开发者数量突破940万,开源参与者数量排名全球第二。自2023以来,阿里通义共开源300多个模型,全球下载量突破6亿次,衍生模型突破17万个,位居全球第一。2025年2月,DeepSeek的开源更是成为中国开源模式的重要里程碑。2025年7月,在工业和信息化部的推动下,中国—金砖国家人工智能发展与合作中心联合10家国内顶尖开源社区发布了《国际人工智能开源合作倡议》。上述探索表明,我国的开源战略不仅是技术上的革新,更是对全球合作新模式的积极探索和实践。通过构建开源开放的创新协作生态,有助于汇聚多方力量,共同面对人工智能技术挑战,为全球共享智能化发展红利贡献中国智慧。
三、“十五五”时期加快推动
我国人工智能体系化创新的若干建议
在深入实施“人工智能+”行动的背景下,“十五五”时期,为加快推动我国建成具有全球影响力的人工智能创新高地,亟需构建各类主体优势互补的人工智能产学研用协同创新体系,强化创新资源的优化配置,推动算力、数据、模型体系化创新,同时做好“人工智能+”行动在重点领域的深入实施。
(一)发挥各类主体优势,构建人工智能产学研用协同创新体系
人工智能的创新高度复杂,涉及多学科的交叉融合,单一机构难以包打天下。为此,应着力构建多元主体协同、跨界融合的创新体系。一是打破高校、科研院所、企业间体制机制壁垒,按照任务需求,精准识别并整合在技术链、资源链、产业链各环节具有独特优势的创新主体。二是充分发挥顶尖高校在基础研究中的原始创新能力、行业龙头企业在工程化和应用场景落地中的引领作用,以及专业机构在测试验证、标准制定等方面的支撑能力,推动优势互补、深度协同。三是以龙头实验室为核心,组建各类优势主体紧密协同、优势互补的“创新联合体”。通过建立共商、共建、共享、共发展的协同机制,推动各类创新主体,围绕人工智能体系化创新这一共同目标,建立紧密的协同创新机制和利益共享机制,促进科技创新资源的高效配置,推动科技创新与产业创新深度融合,不断提升我国人工智能体系化创新能力。
(二)聚力核心技术攻关,强化算力、数据、模型等创新要素供给
一是加大对“开源基础模型”创新发展的支持力度。加强人工智能基础模型的高质量供给,巩固提升我国在基础模型领域的优势地位。同时,面向重点行业和应用场景,有组织地打造高质量、高价值的领域模型,使之成为建设人工智能创新高地的坚实支撑。二是加快建设高性能、高密度、高效能的国产十万卡级智算集群。提升智能算力跨区域配置效率,建立多方参与、层次分明的算力资源协调与供需匹配机制,推动跨区域智算资源共享,实现算力普惠供给。三是以模型为核心推动数据要素价值释放。依托融合算力、数据、模型为一体的人工智能开放创新基础设施,面向更多中小企业和研究人员提供规模化、体系化的公共算力与数据服务,降低社会各界利用人工智能开展创新的资源门槛,激发全社会人工智能创新活力。
(三)做好创新资源配置,形成更高水平、更加开放、更多样性的开放创新环境
一是充分发挥我国在开源文化、开源平台、开源资源方面的基础和优势,鼓励和支持各类创新主体打造面向全球的人工智能科技公共产品,推动中国技术和中国方案惠及更多国家和地区,助力全球可持续发展目标实现,为构建人工智能时代的全球命运共同体,贡献中国智慧。二是依托国际大科学计划等重要创新平台,做好创新资源的国际、国内配置。吸引全球优质科技资源和高层次创新人才参与我国人工智能创新活动,鼓励各类创新主体积极参与全球层面的人工智能科技合作,深度融入全球科技创新网络,形成更高水平、更具多样性的开放创新生态,持续提升我国人工智能创新的国际影响力与竞争力。
(四)把握人才需求变化,打造实训牵引的创新人才培养模式
未来的人工智能竞争,归根结底是人才的竞争。为抢占发展先机,必须准确把握新时代下人工智能人才需求的新特征,构建以真实问题、实训环境、实效成果为牵引的创新型人才培养新范式。一方面,精准洞察复合型人才需求,持续优化培养目标。建立由教育界、产业界和科研机构共同参与的人才需求动态监测与预测机制。定期发布《人工智能人才能力素质模型与需求白皮书》,指导高校和职业院校及时调整专业布局、课程体系和能力标准,从源头上实现人才培养与产业需求的精准对接、同频共振。另一方面,构建产学研用深度融合的实训平台与生态。高校可联合龙头企业、重点实验室共建“人工智能产业学院”“未来技术实验室”等高水平实训基地,推动教育链、人才链与产业链、创新链有机衔接。鼓励企业主动提供前沿课题、真实数据集、算力资源及导师资源,将课程学习转化为一系列连贯的、有挑战性的项目任务,引导学生在真实的研发场景中提升创新思维与工程能力,培养一批具备系统思维和实践能力的高层次人工智能创新人才。
(五)强化产业深度赋能,推动“人工智能+”行动在科学、制造等领域深入实施
一是紧抓“人工智能+科学”范式变革,助力科技强国建设。以科学基础模型为突破口,优化面向科学研究的人工智能要素供给,推动我国科技创新能级跻身世界领先水平。二是以工业智能化为抓手,打造高端制造业发展新格局。以工业智能体为牵引,带动工业数据集、工业大模型的协同创新与迭代升级,推动工业智能体在研发设计、生产自主化、供应链管理等全流程深度嵌入。三是以“人工智能+”行动赋能未来产业培育,完善现代化产业体系。围绕未来信息、未来材料、未来能源、未来空间和未来健康等领域超前布局,引导各地立足产业基础和资源禀赋,科学规划、错位发展,探索形成具有区域优势和国际竞争力的“人工智能+”未来产业特色发展新路径。
(《新华智库研究》2025年第6期“智库报告”栏目(总第10期,之江实验室研究专员、助理研究员 李亚玲;之江实验室高级研究专员、助理研究员 陈文轩;之江实验室发展战略与合作中心副主任、副研究员 孙韶阳)