安徽:已向人工智能企业开放公开政策文件1671份——开放优质公共数据 赋能大模型攻关
数据流通公开不畅、高质量数据集缺乏,将制约大模型训练迭代质量和效率;算力不足,将影响大模型的训练速度和精准度。按照《安徽省通用人工智能创新发展三年行动计划(2023—2025年)》分工,安徽省数据资源管理局主要负责数据组和算力组相关工作。
“我们实施优质数据开放,赋能大模型攻关。”安徽省数据资源管理局副局长钱海介绍,该局会同省新闻出版局、省档案馆、省地方志研究院等各有关单位,组建了数据专项工作组。9月中旬,召开工作组第一次协调推进会,邀请省通用人工智能产业代表参加,细化明确数据需求,确定数据开放方式和时间节点。
“目前,我们已向有关人工智能企业开放公开政策文件1671份、全省政务服务办事指南5393份、安徽政务服务网咨询回复文本(已脱敏)15795条、安徽统计年鉴及调查年鉴(2020—2022)4.3万条、电子图书6000册,有力支撑了我省认知智能大模型训练。”钱海说。
芜湖市为全国“东数西算”十个国家数据中心集群之一。今年初以来,安徽省数据资源管理局联合省科技厅、省发展改革委等六部门,按照国家“东数西算”工程部署要求,加快芜湖数据中心集群建设,实现对大规模算力的集中部署。9月1日,长三角(芜湖)智算中心发布会召开,芜湖市政府与中国电信安徽公司就长三角(芜湖)智算中心建设运营工作签订合作协议;9月26日,芜湖集群(润六尺)智算中心1000P算力正式交付,成为我省首个投入使用的千P级智算中心。
“下一步,我们将扎实推动三年行动计划工作任务落地落细。” 钱海介绍,该局将统筹数据组各成员单位,持续做好优质公共数据开放,今年底前重点完成省市县区一轮、二轮志书及安徽年鉴(1984—2022)等地方志数据、馆藏开放档案数据的开放。同时,加快出台关于推进长三角枢纽节点芜湖数据中心集群建设的若干举措,高质量建设芜湖数据中心集群,优化我省算力基础设施空间布局和供给结构,加快打造全省算力统筹调度平台,提升算力整体调配和利用能力。