【好评中国】高质量数据集赋能行业高质量发展
当前,我国数字经济进入快速发展新阶段,数据作为新型生产要素,已成为推动经济社会高质量发展的核心驱动力。截至9月底,我国已建成高质量数据集总量超500PB(拍字节,计算机存储容量单位);7个数据标注基地引进和培育标注企业362家,标注从业人员达8.5万人,带动数据标注相关产值163亿元。
高质量数据集,简单来说,就是高价值、高密度、标准化的数据。高质量数据集是数智创新的关键资源。500PB的数据规模,相当于数百万个大型图书馆的藏书信息。然而,其战略价值远不止于“海量”,关键在于“高质量”。高质量数据集建设的重要性日益凸显,大力推进数据集高质量建设,才能更好赋能行业高质量发展。
用高质量数据集训练出更先进的人工智能大模型。数据是大模型能力进步的重要要素。数据之于大模型,犹如石油之于汽车。原油需经复杂过程炼化成汽油才能供汽车使用,同理,海量原始数据也需经过“炼化”形成高质量数据集,才能助力大模型的精准跃升。高质量数据集是决定大模型质量的关键因素。当前大模型技术发展迅猛,在算法趋同、算力普惠的竞争环境中,用好高质量数据集,才能提升大模型的聪明程度、智商水平和差异化优势。
用高质量数据集加速推进产业智能化。数据作为新型生产要素,是数字化、网络化、智能化的基础。当前,高质量数据集已成为推动“人工智能+”行动的有力支撑。在“人工智能+医疗”领域,高质量的医学影像与病例数据,正训练出能辅助早期诊断的人工智能医生;在“人工智能+智能制造”领域,高质量的设备运行与工艺参数数据集,带来生产效率与产品质量的双重飞跃;在“人工智能+农业”领域,有的种植企业通过数据赋能施肥环节,综合提升产量5.5%,有的养殖企业实现海洋牧场海洋生物资源总量增加5.3倍。从农业到工业,高质量数据集正加快释放出千姿百态的乘数效应,产业数智化转型让各行各业迎来了“点数成金”的机会。
用高质量数据集促进科研范式变革。科学数据是国家科技创新发展的重要基础性战略资源,是信息时代传播速度最快、影响面最宽、开发利用潜力最大的科技资源。当代科学技术发展呈现出明显的大科学、定量化研究特点,科技创新越来越依赖大量、系统、高可信度的科学数据。2004年起,我国先后在基础科学、农业、林业、海洋、气象、地震、地球系统科学、人口与健康8个领域支持建成了国家科技资源共享服务平台,初步形成了一批资源优势明显的科学数据中心。海量科学数据对生命科学、天文学、空间科学、地球科学、物理学等多个学科领域的科研活动都能带来深刻影响,要瞄准科学研究、科学创新,充分发挥高质量科学数据集的重要作用,促进科学研究方法发生重要变革,帮助科学家发现新规律、推动原始创新。
当前,新一轮科技革命和产业变革深入发展,凝心聚力推进数据集高质量建设,激发数据要素创新潜能,努力抢占数字经济未来发展制高点,将为新质生产力培育、推动我国经济高质量发展带来更多惊喜。(向秋)
- 2025-12-10以奋斗之姿 共谱“十五五”新章
- 2025-12-10在基层沃土中淬炼青春
- 2025-12-10要为人民群众“帮好忙”
- 2025-12-10【光明论坛】制度创新护航生态环境持续改善
西北角
中国甘肃网微信
微博甘肃
学习强国
今日头条号










