广东发文明确政务大模型发展路线图,提出打造“数据特区”引进境外高质量数据
根据《方案》总体要求,政务大模型体系于2024年底基本健全。此外,广东还将探索认定一批机构经授权在可信场所进行模型训练,提供基础数据集对大模型进行初始训练,并探索打造粤港澳大湾区“数据特区”,率先在人工智能创新场景先行先试。这些举措的落地,将有望为先行先试地区吸引更多的数据业务相关企业落户。
理清公共数据、融合行业数据,强化数据供给
《方案》中提到的公共数据资源普查,已于2021年7月完成了首轮全面普查,在推动实现全省政务信息系统和公共数据资源“一本账”管理的同时,全省可共享资源目录数实现翻番,累计汇聚政务数据285亿条,使数据质量和数据共享效率大幅提高。
彼时,广东省政务服务数据管理局局长杨鹏飞表示,在国内率先开展政务信息化能力和公共数据资源普查工作,是广东深化数字政府改革的重要举措,也为优化营商环境、发展数字经济,加快数据要素市场化配置改革打下了坚实基础。
在此基础上,《方案》规划开展第二轮公共数据资源普查,并对该轮普查提出了面向人工智能场景应用的要求。其中明确,通过普查要汇聚文本、图像、视频、音频等多模态中文数据,建设高质量中文语料库,并建立中文数据目录分类分级管理机制。
除了公共数据,在行业数据方面,《方案》提出要打造公共性、公益性数据共享空间,构建面向行业的高质量中文语料数据库,并鼓励在金融、教育、医疗、智能制造等行业创新联合训练场景,促进跨领域、跨行业数据融合。
公共数据和行业数据的汇聚为模型训练提供了坚实的基础。根据《方案》的安排,政府部门将联合头部企业共同组建数字政府通用人工智能联合实验室,推动政务大模型标准体系与建设规范的制定,以及开展政务大模型技术验证和应用研究。此外,还将提供基础数据集对大模型进行初始训练,基于行业数据集开展政务行业大模型训练,并围绕政务服务、区域治理、民生实事、乡村振兴等领域的人工智能应用需求,探索认定一批机构经授权在可信场所进行模型训练。
场景牵引破除堵点,先行先试探索“数据特区”
面向实际应用,是《方案》的另一显著特征。其中提到:到2024年底,各领域场景应用日益丰富;到2025年底,数字政府领域通用人工智能应用实现可持续发展。
具体而言,一方面是面向广大企业群众,提供更高效的政务服务;另一方面是支撑政府治理创新和运行管理,辅助决策提升管理水平。此外,还要积极探索通用人工智能在教育、医疗、交通、金融等行业领域的产业应用,常态化发布人工智能场景清单;创新大模型涉农场景应用,精准助力农村产业发展和“数字乡村”建设。
场景牵引是政务大模型发展的关键举措。在2023年7月,北京发布了全国首个政务服务大模型场景需求,包括政务咨询、政府网站智能问答、智能搜索、精准化政策服务、市民热线智能受理、智能派单、交互式智能政务办事等。同年,深圳福田区、龙华区以及广州白云区等地也在区级范围内先行先试,接连上线政务大模型,实现智慧城市管理和便民服务。
不过,类似于《方案》这样通过文件形式,对打造政务大模型这一新型数字政府基础设施进行全盘性、引领性的布局,全国鲜有。这对破除此前实践中遇到的难点、堵点,具有重要的推动作用。
例如,《方案》提出要发挥横琴粤澳深度合作区、深圳前海和河套、广州南沙等地区改革先行地制度优势,探索打造粤港澳大湾区“数据特区”,率先在人工智能创新场景先行先试。去年11月发布的《“数字湾区”建设三年行动方案》已对推动粤港澳政务服务一体化、依托“湾事通”平台提升湾区居民公共服务便捷性等工作进行了部署。《方案》再次强调,要探索数据跨境双向流通机制,着力打通业务链条、数据共享、数据流通堵点,建立湾区范围内数据流通规则体系和运营机制,将成为促进“数字湾区”数据流通的关键举措。
在政务通用人工智能这一垂直领域,“数据特区”蕴含着更大的商业意义。《方案》特别提出“数据特区”可以引进境外高质量数据,建立样本数据融合训练机制,并依托湾区企业整合资源,共建、共享、共治、共营数据可信流通基础设施,提供存储、共享、交换、训练、加工、交易等服务。这意味着,“数据特区”有望为企业提供更为便捷的数据跨境流通机制,帮助提高企业运营效率;也有望为先行先试地区吸引更多的数据业务相关企业落户。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。