北京针对算力、数据、算法、应用、监管等产业发展核心要素及关键环节的难点、堵点,提出了具体举措,五个维度协同发力。
从某种程度上讲,北京在发展人工智能方面如何制定和推行政策,具有全国示范效应。“中国正加快通过强化国家支持来培育本土的人工智能先驱”,而“首都率先制定新兴产业政策的情况并不少见”。
最近,北京、上海、深圳、成都等地陆续出台一系列鼓励人工智能发展的政策文件,其中,政策密度最大、最引人关注的北京,在12天内连续公布了3个相关文件:5月19日,发布《北京市通用人工智能产业创新伙伴计划》(下称《伙伴计划》);5月30日,印发《北京市促进通用人工智能创新发展的若干措施》(下称《若干措施》);5月30日,印发《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》(下称《实施方案》)。
仔细梳理这些文件可以发现,北京针对算力、数据、算法、应用、监管等产业发展核心要素及关键环节的难点、堵点,提出了具体举措,五个维度协同发力。
“《实施方案》是一个战略层面的文件,《伙伴计划》是关于创新伙伴和价值联盟方面的专门文件,属于策略层面,《若干措施》是提出若干有操作性的运作措施。这几个文件,有战略,有策略,有运作实施,相辅相成,抓住了时代的趋势和重点。”法国里昂商学院人工智能管理学院(AIM)院长、全球商业智能中心(BIC)主任龚业明对澎湃科技(www.thepaper.cn)分析道。
根据IDC《2022-2023中国人工智能计算力发展评估报告》,北京位居2022年中国人工智能城市排行榜首位。截至2022年11月,北京在17个人工智能相关领域领跑全国。根据中国科学技术信息研究所今年5月28日发布的《中国人工智能大模型地图研究报告》,目前中国10亿参数规模以上的大模型至少已发布79个,北京占38个,位居第一。
从某种程度上讲,北京在发展人工智能方面如何制定和推行政策,具有全国示范效应。美国科技媒体TechCrunch近日评价北京的措施称,“中国正加快通过强化国家支持来培育本土的人工智能先驱”,而“首都率先制定新兴产业政策的情况并不少见”。
算力资源统筹供给,加强国产芯片
算力是训练大语言模型(LLM)的基础要素,大语言模型的发展也给算力带来巨大挑战。近期AI芯片“领导者”英伟达公司的市值飙升,可反映进入ChatGPT时代后市场对算力重要性的预期。“目前,算力是通用人工智能创新比较紧迫需要处理和提高的一个要素。”龚业明表示。
在算力方面,《若干措施》第一条即提出“提升算力资源统筹供给能力”。一方面组织商业算力满足紧迫需求:实施算力伙伴计划,与云厂商加强合作,提供多元化优质普惠算力;另一方面,推动新增算力基础设施建设:加快推动海淀区、朝阳区建设北京人工智能公共算力中心、北京数字经济算力中心等项目建设,形成规模化先进算力供给能力;此外,建设统一的多云算力调度平台,实现异构算力环境统一管理、统一运营,提高环京地区算力一体化调度能力。
其中,“规模化先进算力供给”值得注意,IDC中国研究总监卢言霞对澎湃科技表示,下一代AI的发展需要规模化先进算力的支撑,尤其是大模型的预训练、生成式AI的研发。
目前,全国有超过30个城市正在建设或提出建设智算中心。据浙商证券预测,“十四五”期间,对智算中心的投资可带动人工智能核心产业增长约2.9-3.4倍,未来几年中国智能算力规模年复合增长率将超过50%,智能算力取代基础算力成为算力结构最主要构成,智能算力成为增长驱动力。
不过卢言霞提醒道,需要注意的是,建设了这些算力,要考虑将来利用率到底如何,不要沦为沉没成本。此外,在未来几年,最值得重视的是如何提高计算能效,数据中心发展到如今的规模和体量,能耗将成为未来制约发展的重要因素。
在算力的硬件承载芯片方面,龚业明指出,高端人工智能芯片及相关设备成本较高,获取有一定困难,这是发展通用人工智能的一大短板。
对于芯片,《实施方案》着重强调了“国产”二字。该文件提出的工作目标是:“国产人工智能芯片和深度学习框架等基础软硬件产品市场占比显著提升,算力芯片等基本实现自主可控。国产硬件比例显著提高,全面兼容国产深度学习框架。”在主要任务方面,该文件提出:积极引导大模型研发企业应用国产人工智能芯片,加快提升人工智能算力供给的国产化率;加强国产芯片部署应用,推动自主可控软硬件算力生态建设;组建全栈国产化人工智能创新联合体,研发全栈国产化的生成式大模型,逐步形成自主可控的人工智能技术体系和产业生态。
对于芯片的具体研发方向,《实施方案》指出:面向人工智能云端分布式训练需求,开展通用高算力训练芯片研发;面向边缘端应用场景的低功耗需求,研制多模态智能传感芯片、自主智能决策执行芯片、高能效边缘端异构智能芯片;面向创新型芯片架构,探索可重构、存算一体、类脑计算、Chiplet等创新架构路线。
浙商证券解读称,预计未来北京的算力中心建设有望提速,国产芯片将得到优先支持,中科系、华为系算力硬件供应商有望深度获益。
建设高质量预训练中文语料库
“算力成本确实是当前推广大模型、生成式AI的主要挑战之一。但算力不是唯一挑战,数据资源、高端人才都是挑战,需要开放数据、培育产业人才等一系列配套措施。”卢言霞说。
在数据方面,北京系列文件的核心思路在于构建安全合规的开放基础训练数据集,建设高质量的预训练中文语料库。
数据是中文大型语言模型发展过程中的一项重要瓶颈。粤港澳大湾区数字经济研究院认知计算与自然语言中心文本生成算法团队负责人王昊曾对澎湃科技表示,“相较于英文数据,中文数据的开源程度较低,导致中文数据集的规模相对较校此外,英文作为科研主流语言,在学术界和工业界中得到广泛应用,积累了大量高质量的语料数据,这为英文自然语言处理的研究提供了极大的优势。”
在构建高质量数据集方面,《若干措施》提出三个具体施行方向。一是组织有关机构整合、清洗中文预训练数据,形成安全合规的开放基础训练数据集。探索推进公共数据专区授权运营,推动公共数据与市场化数据平台对接;二是谋划建设数据训练基地,提升数据标注库规模和质量,探索基于数据贡献、模型应用的商业化场景合作;三是建设数据集精细化标注众包服务平台,鼓励专业人员参与标注,研究平台激励机制。
《实施方案》则强调,要加强公共数据开放共享。“聚焦城市大脑、智慧政务、智慧民生服务等领域,动态更新公共数据开放计划,完善金融、交通、空间等各类公共数据专区建设。”
上海赛博网络安全产业创新研究高级研究员周雪静对澎湃科技表示,当前大模型的训练数据来源可以分为两类,一是网络数据,二是合成数据(Synthetic Data)。
网络数据的来源包括:采集物理世界的个人信息形成网络数据、直接采集互联网上的数据以及数据交易。通常来说,网络数据的收集、清洗、处理时间和金钱成本较高。
合成数据的处理则更加高效、廉价,可重复利用。以人脸数据为例,如果将一个自然人所能提供的人脸数据设为1,那么通过合成、编辑等功能,将基础的人脸数据进行调整(五官或表情),可以实现10或者100个人脸数据,大大降低训练数据的成本和获取难度。合成数据也需进行个人信息保护,根据《互联网信息服务深度合成管理规定》,在使用生物识别信息编辑功能前,应依法告知被编辑的个人,并取得其单独同意。
发展面向通用人工智能的基础理论体系
得益于模型泛化能力强、长尾数据依赖性低和下游模型使用效率的提升,大模型被认为具备了“通用智能”的雏形。
《实施方案》显示,北京计划发展面向新一代人工智能的基础理论框架体系,围绕人工智能数学机理、大数据智能、多模态智能、决策智能、类脑智能、科学智能、具身智能等方向开展研究布局。
《若干措施》明确提出,探索通用智能体、具身智能和类脑智能等通用人工智能新路径。支持价值与因果驱动的通用智能体研究,打造统一理论框架体系、评级标准及测试平台,研发操作系统和编程语言,推动通用智能体底层技术架构应用。推动具身智能系统研究及应用,突破机器人在开放环境、泛化场景、连续任务等复杂条件下的感知、认知、决策技术。支持探索类脑智能,研究大脑神经元的连接模式、编码机制、信息处理等核心技术,启发新型人工神经网络模型建模和训练方法。
其中,文件提及的“具身智能”,是指有身体并支持物理交互的智能体,如家用服务机器人、无人车等。最近,这个概念被英伟达创始人兼CEO黄仁勋带火,5月中旬,他在2023年ITF世界大会演讲中表示,“下一波人工智能浪潮,将是一种被称为具身人工智能的新型人工智能,即能够理解、推理并与物理世界互动的智能系统。”
值得注意的是,《若干措施》还提出,鼓励第三方非盈利机构构建多模态多维度的基础模型评测基准及评测方法;研究人工智能辅助的模型评测算法,开发包括通用性、高效性、智能性、鲁棒性在内的多维度基础模型评测工具集;建设大模型评测开放服务平台,建立公平高效的自适应评测体系,根据不同目标和任务,实现大模型自动适配评测。
自ChatGPT爆火之后,国内大模型经历了一个“狂飙”的春天。中国科学技术信息研究所所长赵志耘5月28日表示,据不完全统计,到目前为止中国10亿参数规模以上的大模型已发布79个,14个省市/地区都在开展大模型研发。面对“百花齐放”的局面,如何评测大模型已被政策提上日程。澎湃科技从多位知情人士处获知,目前北京、上海多个重点人工智能实验室都在集中完成测评工作。
就在6月3日,认知智能全国重点实验室、中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同发布了《通用认知智能大模型评测体系》,旨在形成一套覆盖多任务的大模型能力客观评测体系,引导中国认知大模型技术和产业健康发展。
聚焦六大场景
在大模型的能力加持下,以文生图和虚拟数字人等AIGC(人工智能生成内容)类应用将快速进入到商业化阶段。
《若干措施》提出推动通用人工智能技术创新场景应用,重点列举了政务服务、医疗、科学研究、金融、自动驾驶、城市治理六大场景。
《实施方案》则强调,要依托北京优势场景资源,加快资本、技术、数据、算力、人才等要素汇聚,打造形成一批可复制、可推广的标杆型示范应用场景,促进人工智能创新链产业链资金链人才链深度融合。另外,支持人工智能赋能智慧城市建设,支持海淀区建设城市大脑2.0,推动北京市高级别自动驾驶示范区3.0等项目顺利实施。
《伙伴计划》提到了一些更具体的场景。“围绕首都之窗智能问答、在线导办等场景,依托私有化部署的算力集群资源,逐步开展政务服务行业专有模型训练、精调、剪枝、蒸馏等工作,赋能‘12345接诉即办’辅助场景。”“聚焦本市虚拟数字人、数字医疗、电商零售等创新活跃的数据优势领域,加快推进大模型商业化落地应用,加速文字创造、人机交互、教育、影音等场景落地应用。”
我认为目前应该还是发展专用人工智能的时间,即使是ChatGPT或GPT(生成式预训练Transformer模型),要真正产业化落地,还是需要面向场景去打磨。”卢言霞说。
IDC认为,未来五年,随着人机交互、机器学习、计算机视觉、语音识别技术达到更为成熟的阶段,人工智能应用的发展趋势包括,以知识为主要生产工具的创作型工作(如文字、视频、图像和音频创作,软件开发,IP孵化等)将实现更大程度的智能化;行业企业将拓展数字孪生与人工智能技术的融合应用,推进能源电力、制造、建筑等行业发展,构建虚拟工厂、数字孪生电网、数字孪生城市,加强数字与现实世界的连接,优化流程,实现全域管理,决策智能。
营造包容审慎的监管环境
在监管方面,两份文件都提及“包容审慎”。
周雪静对澎湃科技表示,监管层面的“包容审慎”分为“包容”和“审慎”两个维度。包容是对于现阶段国内通用人工智能的创新、发展予以鼓励,通过建立试点(示范区、试验区)的方式给予企业试错的机会,进而加快形成一批标杆示范案例,为整个产业的发展加速。而审慎则是从安全合规的角度出发,考虑的是对于发展过程中出现的网络安全、数据安全以及其他新型风险对国家、社会和个人带来的影响,因此需要对市场进行及时的监管干预。
“本质上,包容审慎是一种灵活的、分类分级的监管策略,尤其在大模型、AIGC等新兴技术和新产业发展的前期阶段,能够更好地降低企业试错成本和合规成本,鼓励我国人工智能创新发展。”周雪静说。
如何营造包容审慎的监管环境?《若干措施》主要包括四点:
第一,持续推动监管政策和监管流程创新,鼓励创新主体采用安全可信的软件、工具、计算和数据资源,开展人工智能算法、框架等基础技术的自主创新、推广应用、国际合作;第二,建立常态化服务和指导机制,对具有舆论属性或社会动员能力的人工智能相关互联网信息服务,开展常态化联系服务,指导创新主体引入技术工具进行安全检测、按规定申报安全评估、履行算法备案等程序;第三,加强网络服务安全防护和个人数据保护;第四,持续加强科技伦理治理。
事实上,生成式人工智能的迅猛发展已经引发全球多个国家和地区的监管动作。在OpenAI、谷歌等科技巨头的推动下,美国政府与国会已展开探讨。在监管方面走在前面的欧盟,其《人工智能法案》已接近走完立法程序。
欧盟白皮书《面向卓越和信任的人工智能发展之道》提供了一个值得参照的思路,即开展“以风险等级为基础”的监管路径,强制性规定原则上只适用于高风险人工智能活动,确保监管干预具有适用性和针对性。此外,实施多方参与监管治理,由会员国指定的认证机构对人工智能系统进行独立审查和评估。
在执行层面,周雪静分析,从目前人工智能的监管部门来看,我国呈现多头监管的现状,有关部门包括国家市场监督管理总局、国家互联网信息办公室、工业和信息化部、科技部等。在法律法规层面,一方面是通过专门性综合性立法对网络运营者在使用人工智能技术的义务和责任进行规范,另一方面则是切实聚焦到人工智能领域的算法、模型、技术,进行具体规范。
人才高地与政府投资基金
除了算力、数据、算法、应用、监管五个维度,北京系列文件还在人才、创新等方面提出了具体措施。
《实施方案》明确目标:建设一批具有世界级影响力的人工智能科研机构,引进培育国际一流创新人才团队,国际引才取得新突破。高水平学者数量超万人,国内占比保持领先。
主要任务则包括,推动建设人工智能领域人才高地。“探索实施海外人才来京落地即支持政策,着力引进、培养一批具有世界影响力的顶尖人才、青年人才。”“充分发挥高等学校、科研院所、新型研发机构和企业的作用,引进各层级科学家、产业和工程技术人才。”
作为中国人工智能领域最重要的研究机构之一,北京智源人工智能研究院近来获得了前所未有的关注。微软总裁布拉德史密斯(Brad Smith)4月曾在谈及微软和ChatGPT的竞争对手时称,“我们看到3个处于绝对前沿的机构,一个是OpenAI和微软,第二个是谷歌,第三个是北京智源人工智能研究院。”
北京智源人工智能研究院成立于2018年12月,定位“新型研发机构”,提出了一套“智源模式”,即建立自由探索与目标导向相结合的科研管理机制,以小同行视角遴选支持智源学者自由探索,以“集中力量办大事”的科研组织模式推动“悟道”大模型等重大科研任务的实施。2021年,智源研究院发布了当时全球规模最大、性能最强的智能模型“悟道2.0”,参数量达到1.75万亿(GPT-3.5的十倍)。今年5月28日,北京智源人工智能研究院在2023中关村论坛平行论坛上推出通用分割模型SegGPT(Segment Everything In Contex)。
除了国际一流的研究机构,企业的创新环境也尤为重要。《实施方案》提出目标:人工智能领军企业科研投入持续增加,初创企业数量不断增长,企业总数保持国内领先,新培育独角兽企业5-10家。
主要任务则包括,发挥政府投资基金引导作用,支持长期资本、耐心资本面向人工智能芯片、框架和核心算法开展早期硬科技投资。持续做好人工智能企业挂牌上市培育工作。
《实施方案》指出,要加强人工智能企业梯度培育。“加大对创新型中小企业的培育力度,将有潜力成为独角兽的企业提前纳入培育体系。”“推动一批国际知名研究机构、跨国企业、国内领军企业在京建设创新业务实体。”“落实市区两级企业服务包、服务管家机制,对人工智能领域有潜力的创新企业,可适当放宽纳入服务包的标准,提高服务覆盖面。”
与北京的政策类似,日前发布的《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024年)》提出,深圳将发挥政府投资引导基金作用,统筹整合基金资源,形成规模1000亿元的人工智能基金群。几乎在同一时间,《上海市加大力度支持民间投资发展若干政策措施》发布,将通过“基金招商”的模式,聚力招引“三大先导产业”,人工智能就是“三大先导产业”之一。