经济导报记者 刘勇
在5月28日举办的中关村论坛人工智能大模型发展分论坛上,由中国科学技术信息研究所、科技部新一代人工智能发展研究中心联合相关研究机构编写的《中国人工智能大模型地图研究报告》(下称《报告》)正式发布。
《报告》显示,对全球大模型技术发展脉络进行梳理发现,自谷歌2017年发布的Transformer网络结构以来,仅用五年多时间全球已迅速成长出庞大的大模型技术群,衍生出涵盖各种技术架构、各种模态、各种场景的大模型家族。
《报告》分析发现,美国谷歌、OpenAI等机构不断引领大模型技术前沿。欧洲、俄罗斯、以色列、韩国等国地越来越多的研发团队也在投入大模型的研发。从全球已发布的大模型分布来看,中国和美国大幅领先,超过全球总数的80%,美国在大模型数量方面始终居全球最高。
中国自2020年进入大模型快速发展期,目前与美国保持同步增长态势。在自然语言处理、机器视觉和多模态等各技术分支上均在同步跟进、迅速发展,涌现出盘古、悟道、文心一言、通义千问、星火认知等一批具有行业影响力的预训练大模型,形成了紧跟世界前沿的大模型技术群。
报告基于公开信息梳理分析了中国已发布的79个大模型,分析结果显示,目前中国在14个省市/地区均有团队在开展大模型研发,北京、广东两地最多,地域集中度相对较高。从领域分布来看,自然语言处理仍是目前大模型研发最为活跃的重点领域,其次是多模态领域,在计算机视觉和智能语音等领域的大模型还较少。国内大学、科研机构、企业等不同创新主体都在积极参与大模型研发,学术界与产业界之间的联合开发相对较少。
报告通过调研全国范围内的算力基础设施分布情况发现,北京、广东、浙江、上海等地的大模型数量最多,同时这4个地方也是近三年人工智能服务器采购数量最高的地区,表现出非常明显的强相关性,为大模型研发应用提供了重要支撑。同时,各地也在通过提供公共算力方式补充快速增长的人工智能算力需求,为大模型研发提供更多算力支撑。
从模型影响力方面看,清华大学与阿里和百度联合开发的CogView模型论文引用数最高,华为的FILIP、百度的ERNIE3.0以及阿里的M6-OFA引用数也位居国内前列,在大模型领域形成了较好的学术影响力,但与国外领先大模型的学术影响力相比差距仍然较大。