高质量的数据集和AI引起共鸣,成为数据流通的“
作者:bet356亚洲版本体育日期:2025/09/03 浏览:
中国新闻服务部,北京,9月2日(Wu Tao Reporter),当人工智能浪潮席卷了世界,其背后的“燃料”时,数据正成为竞争的战略资源。但是,并非所有数据都可以加速AI的发展。将“大数据”转换为“高质量数据集”。
什么是高质量数据集?
2024年12月,国家发展与改革委员会,国家数据办公室和其他部门发布了“促进高质量数据行业的指南”。这清楚地提出了首次提出“高质量数据集”的概念,并清楚地提出了“主动开发服务”,以支持公司并在人工智能应用程序中进行创新,开发高质量的数据集并开发新的商业格式,例如新的业务格式提供服务。
最近发布的建立高质量数据集的指南表明,数据需求已将“累积级别”变为由于大规模参数的指数增长和多模式能力的扩展,“数量和质量”。
根据官方数据,截至2025年6月,全国已建立了35,000多个高质量数据集,总计超过400%。数据贸易机构列出了3,364个高质量数据集,例如贸易分销中的关键产品,累计交易量接近40亿元和246%。
在最近的论坛中,中国信息与通信学院主任Yu Xiaohui说,环顾世界各地,有很多私人领域数据。方案,行业和政府可以发布数据的这一部分。这是形成高质量数据集的非常重要的地址。
高质量的数据集和IA开发彼此补充
AI大型模型培训使用大数据,因此市场始终认为将来没有可用的数据。或者,您必须使用许多合成数据。在这种情况下,毫无疑问,高质量的数据集将成为数据分布的“硬币”。
Tsinghua大学数字政府和政府研究所的院长。 Zhang Xiaojin教授说,无论人工智能模型到哪里,高质量的数据集去哪里,当高质量数据集的何时到达,当人工智能是互补的以及两个车轮上的牵引模式时。
中国工程学院的学者吴申恩说,数据的结构质量和安全性是开发大型模型的救生员。有必要改善层次结构和分类的数据安全系统,在整个过程中加强技术保护方法,并创建基本的技术能力以避免操纵。通过构建数据集,模型必须积极整合到优秀的中国传统文化中,以避免成为自私的工具。
构造N现在正在如火如荼地进行。该党小组秘书兼市政政府管理局局长Zhou Jianming和数据管理公司已发布文件,以在国家数据办公室的官方网站上分享。深圳将公共数据资源的批准运营与对创建可靠数据空间的调查相结合,以支持ALTA质量的综合公共和业务数据应用程序。它已经在信用报告,金融,气象,商业因素和主张领域实施了试点项目,取得了良好的成果。 (多于)
(编辑:杨XI,陈·简)
遵循官方帐户:人们的每日财务
分享以向更多人展示
相关文章