（已压缩）赛迪译丛2024年第42期（总第668期）：2024年人工智能全景报告-加水印

- 1 -2024 年 12 月 16 日第 42 期总第 668 期2024 年人工智能全景报告【译者按】今年 10 月，英国风投公司 Air Street Capital 发布第七版《人工智能全景报告》。人工智能正迅速成为全球经济发展的关键驱动力，系统评估人工智能行业现状和未来趋势尤为重要。报告全面审视了人工智能在研究、产业、政治和安全四方面的最新进展，揭示了包括多模态基础模型突破学科局限、龙头企业与初创企业并行加速发展、人工智能监管立法持续提速、企业关注点从安全主义转向加速发展等重大趋势。同时，报告对未来 12 个月全球人工智能发展作出了前瞻性预测。赛迪智库未来产业研究中心对该报告进行了编译，期望对我国有关部门有所帮助。【关键词】人工智能研究产业政治安全预测- 2 -人工智能是一个涉及多学科的科学与工程领域。本报告认为，在这个日益数字化、由数据驱动的社会，人工智能将成为推动技术进步的倍增器。本报告围绕以下几方面进行讨论：研究：技术突破及其能力。产业：人工智能的商业应用领域及其商业影响。政治：人工智能的监管、经济影响以及不断演变的人工智能地缘政治。安全：确定并减轻未来高性能人工智能系统可能带来的灾难性风险。预测：未来 12 个月可能会发生的事。一、概述（一）研究前沿实验室的表现趋于一致，但因为规划和推理已成为主要前沿领域，因此 OpenAI 公司在推出 o1 大型语言模型后仍保持领先优势。随着多模态研究深入到数学、生物学、基因组学、物理科学和神经科学领域，基础模型展现出了突破语言局限的能力。美国的制裁未能阻止中国的大型语言模型在社会各界排行榜上的飙升。（二）产业- 3 -英伟达（NVIDIA）仍是全球最具实力的公司，跻身市值 3万亿美元企业之列。监管机构正在对生成式人工智能领域的权力集中问题展开调查。更为成熟的生成式人工智能企业已实现数十亿美元的营收，初创企业也开始在视频和音频生成等领域崭露头角。尽管这些企业的发展已开始从模型研发迈向产品落地，但有关定价和可持续性的长期问题仍未解决。在公共市场牛市的推动下，人工智能企业的市值达到 9 万亿美元，同时私营企业的投资也在健康增长。（三）政治在全球治理停滞不前背景下，国家和地区层级的人工智能监管却在不断推进，美国和欧盟都通过了相关立法，但这些立法颇具争议。计算需求的实际情况迫使大型科技企业不得不考虑在规模扩张方面面临的现实物理限制以及它们自身的排放目标。与此同时，各国政府在能力建设方面的尝试仍然滞后。人工智能对选举、就业以及一系列其他敏感领域可能产生的影响目前还尚未显现。（四）安全企业的关注点正在从安全向加速发展转变，之前还在警告人类即将灭绝的企业，现在却在大力提高销售额，推广消费类应用程序。世界各国政府纷纷效仿英国，构建提升人工智能安全的国- 4 -家能力，成立相关机构，研究关键国家基础设施在人工智能方面存在的潜在漏洞。每一项人工智能发起的攻击都以失败告终，但让研究人员更加担忧的却是更为复杂、长期的攻击。二、研究（一）OpenAI 独霸一方的局面宣告结束，“草莓”（Strawberry）的问世，将在扩展推理计算方面加倍发力这一年的大部分时间，各项基准测试和社会各界排行榜都显示 GPT-4 与“其他最优模型”之间存在巨大差距。然而，Claude 3.5Sonnet、Gemini 1.5 和 Grok 2 等模型几乎消除了这一差距，如今各模型的表现开始趋于一致。OpenAI 团队显然很早就察觉到了推理计算的潜力，在其他实验室发表有关该技术的论文几周后，OpenAI 的 o1 就问世了。（二）尽管屡受制裁，中国的大型语言模型仍榜上有名深度求索、零一万物、智谱和阿里巴巴所研发的模型在大型模型系统机构排行榜上取得了优异名次，尤其在数学和编程方面展现出了令人瞩目的成果。例如，深度求索率先采用多头潜在注意力1等技术，降低推理过程中的内存需求，并且还研发了一种增1多头潜在注意力（Multi-head Latent Attention, MLA）是一种在自然语言处理和其他序列数据处理任务中使用的注意力机制。它是多头注意力（Multi-head Attention, MHA）的一种变体，通过低秩压缩键（Key）和值（Value）来减少 KV 缓存的大小，从而提高推理效率。- 5 -强型混合专家（MoE）2架构。零一万物对架构创新关注较少，致力于构建强大的中文数据集，以弥补其在常用数据存储库中相关数据相对匮乏的不足。（三）中国的开源项目赢得了全球粉丝为推动国际上的采用和评估，中国的实验室已成为热情的开源贡献者。有几款模型已在个别子领域中崭露头角，成为强有力的竞争者。例如，深度求索的 Deepseek-Coder-V2 已成为编程任务中最受欢迎的工具之一，具有速度、轻便、准确等优点。阿里巴巴发布 Qwen-2 系列芯片，其出色的视觉识别技术震撼业界，不仅在极具考验的光学字符识别（OCR）任务中展现出非凡实力，还能深度解析纷繁精妙的艺术作品。（四）人工智能亦可获得诺贝尔奖瑞典皇家科学院将诺贝尔奖授予深度学习领域的先驱者，表明人工智能作为一门学科以及加速科学发展的工具，已经发展成熟。（五）AlphaFold 3：超越蛋白质及其与其他生物分子的相互作用DeepMind 和同构实验室发布了 AlphaFold 3 模型，它是2 增强型混合专家（MoE）是一种深度学习模型，它通过将多个专业化的子模型（即“专家”）组合起来，形成一个整体模型。每个“专家”都在其擅长的领域内做出贡献，而决定哪个“专家”参与解答特定问题的，是一个称为“门控网络”的机制。- 6 -AlphaFold 2 的后续版，如今已能够模拟小分子药物、脱氧核糖核酸（DNA）、核糖核酸（RNA）以及抗体与蛋白质靶点的相互作用机制。（六）AlphaProteo：DeepMind 公司展示了新的实验生物学能力DeepMind 公司的神秘蛋白质设计团队终于凭借其首个模型AlphaProteo“走出幕后”。这是一个生成式模型，能够设计出亲和力提高 3 到 300 倍的亚纳摩尔级蛋白质结合剂。（七）学习设计人类基因组编辑器的语言模型之前介绍了如何使用在大量多样的天然蛋白质序列数据集上预先训练的大型语言模型（如 ProGen2）来设计与天然蛋白质序列完全不同的功能蛋白质。现在，Profluent 在 CRISPR-Cas 图谱上对 ProGen2 进行了微调，以生成具有新序列的功能基因组编辑器，且这些编辑器首次被证明可在体外对人类细胞的 DNA 进行编辑。（八）人工智能基础模型：通过功能性磁共振成像了解大脑活动深度学习最初受到神经科学的启发，如今正应用于对大脑本身进行建模。“大脑语言模型”（BrainLM）是一个基于 6700 小时- 7 -人类大脑活动记录构建的基础模型，这些记录是通过功能性磁共振成像生成的，该技术可检测血氧含量的变化。该模型学会了重建被掩盖的时空大脑活动序列，且能够泛化到未见过的数据分布。可通过微调该模型来预测临床变量，例如年龄、神经质程度、创伤后应激障碍（PTSD）以及焦虑症评分等，其效果要优于图卷积模型或长短期记忆网络（LSTM）模型。（九）各科学领域的基础模型：大气领域传统的大气模拟方法，如数值天

立即下载

信息科技

2024-12-30

24页

1.26M

（已压缩）赛迪译丛2024年第42期（总第668期）：2024年人工智能全景报告-加水印，点击即可下载。报告格式为PDF，大小1.26M，页数24页，欢迎下载。

本报告共24页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

本报告共24页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

水滴研报所有报告均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

（已压缩）赛迪译丛2024年第42期（总第668期）：2024年人工智能全景报告-加水印

关于我们

联系我们

（已压缩）赛迪译丛2024年第42期（总第668期）：2024年人工智能全景报告-加水印

关于我们

联系我们

小程序

公众号