河北省数据和政务服务局
关于公开征集一批高质量数据集的
公 告
为深入贯彻落实国家数据局关于高质量数据集建设有关工作部署,加快构建本省高质量数据集开发利用体系,进一步发挥数据要素对“人工智能+”的赋能作用,河北省数据和政务服务局拟面向社会公开征集一批河北省高质量数据集,有关事项通知如下。
一、征集要求
(一)征集范围。重点围绕我省八大主导产业(现代化钢铁产业、绿色化工产业、生物医药产业、电子信息产业、新能源和智能网联汽车产业、机器人产业、空天信息和卫星互联网产业、数字产业)和107个重点特色产业集群,覆盖领域包括但不限于科学研究、工业制造、农业农村、智慧能源、交通运输、金融服务、医疗卫生、教育教学、商贸流通、人力资源、文化旅游、应急管理、气象服务、绿色低碳、公共安全、城市治理等重点行业领域,以及低空经济、智慧驾驶、具身智能、智慧海洋、生物制造等创新领域。
(二)数据集要求。
1.数据质量。数据集至少聚焦1个行业,汇聚跨区域、跨层级、跨机构的行业数据资源,可直接用于开发和训练人工智能模型,能有效提升模型性能。数据集规模需达到一定量级,不低于50GB(非结构化数据)或10万行(结构化数据)。数据模态包括结构化数据、文本、图形图像、音频、视频等。
2.应用推广。数据集原则上至少应有1个实际已落地的应用场景,具备较强的推广价值;暂未落地的,应有较为明确的潜在应用场景。同时应具备一定先进性、创新性、示范性和定期更新机制。数据集为已建或在建的项目均可申报。
3.安全合规。数据集应符合国家数据安全与合规相关要求,不涉及个人隐私、商业秘密和国家秘密等。同时数据集持有单位应有明确的数据权属,流通和开发利用后可较为清晰地界定加工使用权、产品收益权,无产权纠纷。
(三)申报主体要求。申报单位应为在河北省内注册的独立法人单位,包括政府部门、企事业单位、科研院所、行业协会等。申报单位近三年经营状况良好,在信用、质量、安全等方面无不良记录。涉及多家单位的,可结合实际情况联合申报。
二、征集程序
(一)组织申报。请申报单位认真对照通知要求,填写《河北省高质量数据集申报书》(附件1),以“单位名称+高质量数据集”命名报送属地数据主管部门,申报单位涉及多个申报案例的,每个案例提交一份申报书。同时将电子版及纸质申报材料(一式三份)按属地报送所属市数据主管部门。
(二)审核推荐。各市数据主管部门要组织好征集工作,对申报单位报送的相关资料按照征集要求开展初审,严格把关,提高案例质量,确保案例合规、真实,材料完整、可公开。各市数据主管部门择优推荐,每个单位推荐不超过10个案例,需明确推荐顺序并填报《河北省高质量数据集申报汇总表》(附件2),盖章后连同申报单位相关纸质资料(含电子版)于10月24日前报送至河北省数据和政务服务局,电子版以“单位名称+高质量数据集汇总表”命名发送至邮箱。
(三)遴选推广。河北省数据和政务服务局将组织行业领域专家开展申报评审,遴选形成河北省高质量数据集名录,以适当方式向社会公开发布。对于存在交易需求的数据集,将依托数据交易平台进行产品化展示,以促进数据要素高效流通与合理利用。对于符合国家要求的数据集,择优推荐至国家数据局,争取国家层面政策支持,充分释放典型示范作用。
三、联系方式
联系人及电话:冯俊超,0311-66635597
邮箱:fengjunchao@hbzwfw.gov.cn
联系地址:河北省数据和政务服务局主楼824办公室(河北省石家庄市新华区石清路9号,邮编050000)
附件:1.河北省高质量数据集申报书
2.河北省高质量数据集申报汇总表
河北省数据和政务服务局
2025年9月26日