《赛迪译丛:2024年人工智能全景报告(24页).pdf》由会员分享,可在线阅读,更多相关《赛迪译丛:2024年人工智能全景报告(24页).pdf(24页珍藏版)》请在薪酬报告网上搜索。
1、-1-2024 年年 12 月月 16 日第日第42期总第期总第 668 期期2024年人工智能全景报告年人工智能全景报告【译者按】【译者按】今年 10 月,英国风投公司 Air Street Capital 发布第七版 人工智能全景报告。人工智能正迅速成为全球经济发展的关键驱动力,系统评估人工智能行业现状和未来趋势尤为重要。报告全面审视了人工智能在研究、产业、政治和安全四方面的最新进展,揭示了包括多模态基础模型突破学科局限、龙头企业与初创企业并行加速发展、人工智能监管立法持续提速、企业关注点从安全主义转向加速发展等重大趋势。同时,报告对未来 12 个月全球人工智能发展作出了前瞻性预测。赛迪智
2、库未来产业研究中心对该报告进行了编译,期望对我国有关部门有所帮助。【关键词】人工智能研究产业政治安全预测【关键词】人工智能研究产业政治安全预测-2-人工智能是一个涉及多学科的科学与工程领域。本报告认为,在这个日益数字化、由数据驱动的社会,人工智能将成为推动技术进步的倍增器。本报告围绕以下几方面进行讨论:研究:研究:技术突破及其能力。产业:产业:人工智能的商业应用领域及其商业影响。政治:政治:人工智能的监管、经济影响以及不断演变的人工智能地缘政治。安全:安全:确定并减轻未来高性能人工智能系统可能带来的灾难性风险。预测:预测:未来 12 个月可能会发生的事。一、概述(一)研究一、概述(一)研究前沿
3、实验室的表现趋于一致,但因为规划和推理已成为主要前沿领域,因此 OpenAI 公司在推出 o1 大型语言模型后仍保持领先优势。随着多模态研究深入到数学、生物学、基因组学、物理科学和神经科学领域,基础模型展现出了突破语言局限的能力。美国的制裁未能阻止中国的大型语言模型在社会各界排行榜上的飙升。(二)产业(二)产业-3-英伟达(NVIDIA)仍是全球最具实力的公司,跻身市值 3万亿美元企业之列。监管机构正在对生成式人工智能领域的权力集中问题展开调查。更为成熟的生成式人工智能企业已实现数十亿美元的营收,初创企业也开始在视频和音频生成等领域崭露头角。尽管这些企业的发展已开始从模型研发迈向产品落地,但有
4、关定价和可持续性的长期问题仍未解决。在公共市场牛市的推动下,人工智能企业的市值达到 9 万亿美元,同时私营企业的投资也在健康增长。(三)政治(三)政治在全球治理停滞不前背景下,国家和地区层级的人工智能监管却在不断推进,美国和欧盟都通过了相关立法,但这些立法颇具争议。计算需求的实际情况迫使大型科技企业不得不考虑在规模扩张方面面临的现实物理限制以及它们自身的排放目标。与此同时,各国政府在能力建设方面的尝试仍然滞后。人工智能对选举、就业以及一系列其他敏感领域可能产生的影响目前还尚未显现。(四)安全(四)安全企业的关注点正在从安全向加速发展转变,之前还在警告人类即将灭绝的企业,现在却在大力提高销售额,
5、推广消费类应用程序。世界各国政府纷纷效仿英国,构建提升人工智能安全的国-4-家能力,成立相关机构,研究关键国家基础设施在人工智能方面存在的潜在漏洞。每一项人工智能发起的攻击都以失败告终,但让研究人员更加担忧的却是更为复杂、长期的攻击。二、研究(一)二、研究(一)OpenAI 独霸一方的局面宣告结束,独霸一方的局面宣告结束,“草莓草莓”(Strawberry)的问世,将在扩展推理计算方面加倍发力)的问世,将在扩展推理计算方面加倍发力这一年的大部分时间,各项基准测试和社会各界排行榜都显示 GPT-4 与“其他最优模型”之间存在巨大差距。然而,Claude 3.5Sonnet、Gemini 1.5
6、和 Grok 2 等模型几乎消除了这一差距,如今各模型的表现开始趋于一致。OpenAI 团队显然很早就察觉到了推理计算的潜力,在其他实验室发表有关该技术的论文几周后,OpenAI 的 o1 就问世了。(二)尽管屡受制裁,中国的大型语言模型仍榜上有名(二)尽管屡受制裁,中国的大型语言模型仍榜上有名深度求索、零一万物、智谱和阿里巴巴所研发的模型在大型模型系统机构排行榜上取得了优异名次,尤其在数学和编程方面展现出了令人瞩目的成果。例如,深度求索率先采用多头潜在注意力1等技术,降低推理过程中的内存需求,并且还研发了一种增1多头潜在注意力(Multi-head Latent Attention,MLA)
7、是一种在自然语言处理和其他序列数据处理任务中使用的注意力机制。它是多头注意力(Multi-head Attention,MHA)的一种变体,通过低秩压缩键(Key)和值(Value)来减少 KV 缓存的大小,从而提高推理效率。-5-强型混合专家(MoE)2架构。零一万物对架构创新关注较少,致力于构建强大的中文数据集,以弥补其在常用数据存储库中相关数据相对匮乏的不足。(三)中国的开源项目赢得了全球粉丝(三)中国的开源项目赢得了全球粉丝为推动国际上的采用和评估,中国的实验室已成为热情的开源贡献者。有几款模型已在个别子领域中崭露头角,成为强有力的竞争者。例如,深度求索的 Deepseek-Coder
8、-V2 已成为编程任务中最受欢迎的工具之一,具有速度、轻便、准确等优点。阿里巴巴发布 Qwen-2 系列芯片,其出色的视觉识别技术震撼业界,不仅在极具考验的光学字符识别(OCR)任务中展现出非凡实力,还能深度解析纷繁精妙的艺术作品。(四)人工智能亦可获得诺贝尔奖(四)人工智能亦可获得诺贝尔奖瑞典皇家科学院将诺贝尔奖授予深度学习领域的先驱者,表明人工智能作为一门学科以及加速科学发展的工具,已经发展成熟。(五)(五)AlphaFold 3:超越蛋白质及其与其他生物分子的相互作用:超越蛋白质及其与其他生物分子的相互作用DeepMind 和同构实验室发布了 AlphaFold 3 模型,它是2增强型混
9、合专家(MoE)是一种深度学习模型,它通过将多个专业化的子模型(即“专家”)组合起来,形成一个整体模型。每个“专家”都在其擅长的领域内做出贡献,而决定哪个“专家”参与解答特定问题的,是一个称为“门控网络”的机制。-6-AlphaFold 2 的后续版,如今已能够模拟小分子药物、脱氧核糖核酸(DNA)、核糖核酸(RNA)以及抗体与蛋白质靶点的相互作用机制。(六)(六)AlphaProteo:DeepMind 公司展示了新的实验生物学能力公司展示了新的实验生物学能力DeepMind 公司的神秘蛋白质设计团队终于凭借其首个模型AlphaProteo“走出幕后”。这是一个生成式模型,能够设计出亲和力提
10、高 3 到 300 倍的亚纳摩尔级蛋白质结合剂。(七)学习设计人类基因组编辑器的语言模型(七)学习设计人类基因组编辑器的语言模型之前介绍了如何使用在大量多样的天然蛋白质序列数据集上预先训练的大型语言模型(如 ProGen2)来设计与天然蛋白质序列完全不同的功能蛋白质。现在,Profluent 在 CRISPR-Cas 图谱上对 ProGen2 进行了微调,以生成具有新序列的功能基因组编辑器,且这些编辑器首次被证明可在体外对人类细胞的 DNA 进行编辑。(八)人工智能基础模型:通过功能性磁共振成像了解大脑活动(八)人工智能基础模型:通过功能性磁共振成像了解大脑活动深度学习最初受到神经科学的启发,
11、如今正应用于对大脑本身进行建模。“大脑语言模型”(BrainLM)是一个基于 6700 小时-7-人类大脑活动记录构建的基础模型,这些记录是通过功能性磁共振成像生成的,该技术可检测血氧含量的变化。该模型学会了重建被掩盖的时空大脑活动序列,且能够泛化到未见过的数据分布。可通过微调该模型来预测临床变量,例如年龄、神经质程度、创伤后应激障碍(PTSD)以及焦虑症评分等,其效果要优于图卷积模型或长短期记忆网络(LSTM)模型。(九)各科学领域的基础模型:大气领域(九)各科学领域的基础模型:大气领域传统的大气模拟方法,如数值天气预报,成本高昂,且无法利用各种稀缺的大气数据模态。但基础模型在这些方面的表现
12、却很好。微软的研究人员创建了基础模型 Aurora,能够针对诸多大气预报问题进行预测,比如全球空气污染和高分辨率中期天气模式等问题。它还能通过利用通用的已习得大气动力学表征来适应新任务。(十)心智的基础模型:重建看到的事物(十)心智的基础模型:重建看到的事物MindEye2 是一种生成式模型,能够将功能性磁共振成像活动映射到丰富的对比语言-图像预训练(CLIP)空间,然后利用经过微调的 Stable Diffusion XL 模型从该空间重建个体所看到的图像。该模型在自然场景数据集上进行训练,这是一个基于 8 名受试者构建的功能性磁共振成像数据集,在这些受试者观看来自COCO 数据集扫描会话的
13、数百种丰富的自然场景刺激物时(每次-8-扫描观看时长为 3 秒),对其大脑反应进行 30 至 40 小时的捕捉。(十一)程序搜索在数学领域获得新发现(十一)程序搜索在数学领域获得新发现结合大型语言模型和进化算法,“趣味搜索”(FunSearch)利用大型语言模型生成和修改程序,并能通过对求解质量打分实现功能进化。趣味搜索通过搜索程序而非直接的解决方案,发现复杂对象或策略的简洁且可解释的表述形式。肖莱认为,这种形式的程序搜索是最有可能解决抽象和推理挑战的途径之一。谷歌DeepMind 团队将其应用于极值组合学中的帽集问题以及在线装箱问题。在这两个案例中,趣味搜索都发现了超越人类设计方法的新颖解决
14、方案。(十二)基础模型能否让大规模训练强化学习智能体变得更容易?(十二)基础模型能否让大规模训练强化学习智能体变得更容易?训练强化学习智能体的一大瓶颈是训练数据的短缺。诸如转换已有环境或手动构建环境这类标准方法都需要耗费大量人力,且无法实现规模化。帝国理工学院和英属哥伦比亚大学的OMNI-EPIC 项目利用大型语言模型创建了理论上无穷无尽的强化学习任务和环境流,以帮助智能体基于先前学到的技能进一步发展。该系统会生成可执行的 Python 代码,这些代码能够为每个任务实现模拟环境和奖励函数,且会利用模型评估新任务是否足够新颖和复杂。-9-(十三)人工智能研究领域的全球力量平衡并未改变,但学术界有
15、所获益(十三)人工智能研究领域的全球力量平衡并未改变,但学术界有所获益随着人工智能成为新竞争战场,大型科技企业开始对研发工作的更多细节秘而不宣。自本报告开始发布以来,前沿实验室首次大幅削减成果发表数量,而学术界也参与其中(见图 1)。元宇宙人工智能出版物数量的同比变化人工智能出版物数量的同比变化微软阿里巴巴腾讯谷歌华为IBM麻省理工学院米迪亚研究清华大学牛津大学加利福尼亚大学伯克利分校图 1:人工智能出版物数量的同比变化三、产业(一)英伟达成为全球最具实力的公司,不断提出更具雄心的目标三、产业(一)英伟达成为全球最具实力的公司,不断提出更具雄心的目标随着用于支持对算力要求极高的生成式人工智能工
16、作负载的硬件需求不断增长,各大实验室都需要依靠英伟达提供的硬件。-10-其市值在 6 月达到 3 万亿美元,成为继微软和苹果之后第三家达到这一里程碑的美国公司。其第二季度财报业绩依然亮眼,地位依然坚不可摧。英伟达已经在其新款 Blackwell 系列图形处理器上获得了大量预订单,并且正在积极争取政府方面的订单。(二)老牌竞争对手未能缩小差距(二)老牌竞争对手未能缩小差距超威半导体和英特尔已经开始投资建设软件生态系统,超威半导体公司已经利用 ROCm 平台大力向开源各界推广。然而,他们尚未开发出能与英伟达网络解决方案产品组合相媲美的有竞争力的替代方案。超威半导体希望其 49 亿美元收购服务器制造
17、商 ZT 系统公司(ZT Systems)的计划能改变这一局面。与此同时,英特尔的硬件销售额出现了下滑。除非出现监管干预、研究范式转变或供应受限等情况,否则英伟达的地位似乎坚不可摧。(三)购买英伟达的股票要比投资那些与英伟达竞争的初创企业好得多(三)购买英伟达的股票要比投资那些与英伟达竞争的初创企业好得多对自 2016 年以来对人工智能芯片领域竞争对手投资的 60 亿美元进行分析和设想,如果投资者当时按当日股价购入等值的英伟达股票,情况会怎样?答案是:若买入英伟达股票,那 60 亿美元如今价值将是 1200 亿美元(涨 20 倍),而投入初创企业如今的价值仅 310 亿美元(仅涨 5 倍)。-
18、11-(四)并非所有人都认为英伟达只会越来越好(四)并非所有人都认为英伟达只会越来越好有一小部分直言不讳的分析师和评论员并不信服。他们指出图形处理器稀缺状况已有所缓解,目前只有少数几家公司能从人工智能产品中获得可靠营收,而且大型科技企业的基础设施建设规模也不太可能大到足以支撑英伟达目前的估值。市场目前对这些声音置若罔闻,似乎更倾向于认同特斯拉早期投资者詹姆斯安德森的观点,即英伟达在十年内市值可能达到“数万亿美元”。(五)但初创企业的收入在哪里?利润又在哪里?(五)但初创企业的收入在哪里?利润又在哪里?许多从事生成式人工智能的热门初创企业正在以创纪录的、通常是三位数的营收倍数进行融资。虽然这可能
19、表明投资者对未来回报有信心,但这也设定了一个很高的门槛,因为这些企业中的很多目前还没有明确的盈利途径。然而,并非所有的企业都是如此,最大模型提供商的营收已开始增长。OpenAI 有望在一年内实现营收增长两倍,但训练、推理及人员成本意味着亏损仍在持续增加。他们并非唯一一家在寻求实现良性经济运作的领军企业。(六)或许收入和利润两者都不重要:要恢复股价只需要一种氛围(六)或许收入和利润两者都不重要:要恢复股价只需要一种氛围元宇宙公司通过放弃在元宇宙领域的大量投资,凭借“羊驼”模型大力转向开源人工智能领域,在公共市场引发了令人难以置信的氛围转变。可以说,马克扎克伯格实际上已成为开源人工智-12-能救世
20、主,与 OpenAI、Anthropic 和谷歌 DeepMind 形成对抗之势。(七)顶级质量的模型,即(七)顶级质量的模型,即 OpenAI 的的 o1 模型,在价格和延迟方面都有明显溢价模型,在价格和延迟方面都有明显溢价随着模型种类日益丰富,开发者们正在根据工作需求(以及自身预算)选择合适工具。(八)模型费用持续下降(八)模型费用持续下降服务成本曾经一度被认为高得令人望而却步,但如今强大模型的推理服务成本正在下降(见图 2)。下降下降100倍倍下降下降60倍倍图 2:OpenAI 和 Anthropic 的模型费用(九)谷歌(九)谷歌 Gemini 推出了一个强大的模型系列,定价极具竞争
21、力推出了一个强大的模型系列,定价极具竞争力Gemini 1.5 Pro 和 1.5 Flash 的价格在推出几个月后就下降了-13-64%至 86%,但性能依然强劲,例如 Flash-8B 比 1.5 Flash 便宜50%,但在许多基准测试中的表现却不相上下。(十)人工智能实验室从构建模型转向设计产品(十)人工智能实验室从构建模型转向设计产品像苹果、谷歌或抖音等成功的科技公司都是以产品为先,而不是简单地构建基础技术和 API。随着基础模型性能趋于接近,OpenAI、Anthropic 和元宇宙公司显然都在更深入地思考其“产品”应该呈现出怎样的外观和使用体验,不管是 Anthropic 公司“
22、Claude”的相关成果、OpenAI 的高级语音功能,还是元宇宙公司的硬件合作项目以及对口型工具。仅构建出优秀的模型是不够的。(十一)监管机构对关键的生成式人工智能参与者之间的关系进行详尽审查,导致伪收购作为一种退出策略兴起(十一)监管机构对关键的生成式人工智能参与者之间的关系进行详尽审查,导致伪收购作为一种退出策略兴起鉴于高昂的计算成本,模型构建者越来越依赖与老牌大型科技企业合作。反垄断监管机构担心这会让现有企业的地位更加不可动摇。监管行动在塑造市场方面作用有限,经济因素更具决定性。鉴于众多“其他企业”的性能趋于相近,且这些企业高昂的资本性支出需求,整合也就不足为奇了。鉴于存在监管障碍,伪
23、收购开始兴起,即大型科技企业:聘用初创企业的创始人和大部分团队成员;该初创企业退出模型构建领域,转而专注于其企业服务业务;通过许可协议向投资者支付款项。监管机构已经发现了这一问题,大西洋两岸的监管机构都已在这方面开始详尽审查。-14-(十二)文本转语音正在蓬勃发展(十二)文本转语音正在蓬勃发展文本转语音领域市场领导者ElevenLabs在今年年初达到独角兽级别,估值达 11 亿美元。由于各大实验室对该领域涉足有限,因此 ElevenLabs 得以独占鳌头。(十三)语音识别在商业领域站稳了脚跟(十三)语音识别在商业领域站稳了脚跟虽然文本转语音因“效果惊艳”而备受关注,但语音识别却可能被用于实现日
24、常任务的自动化规模处理。投资者开始看到语音识别在规模化发展方面的潜力。(十四)视频生成领域的竞争正趋于白热化(十四)视频生成领域的竞争正趋于白热化Runway、Pika、Luma 和 OpenAI 等众多参与者正在大规模扩大其数据收集和模型训练实验的规模,以期在文本到视频生成方面提高生成质量和稳定性,此外还致力于生成更长的视频片段。(十五)人工智能投资在各个地区都大幅增长(十五)人工智能投资在各个地区都大幅增长在 xAI 和 OpenAI(60 亿美元融资)等通用人工智能巨额融资的推动下,美国私募市场继续保持领先地位,对人工智能企业的总投资已接近 1000 亿美元(见图 3)。-15-欧盟27
25、国+挪威、瑞士英国美国中国图 3:人工智能投资情况(十六)在上市公司的推动下,人工智能企业的市值达到近(十六)在上市公司的推动下,人工智能企业的市值达到近9 万亿美元万亿美元虽然私营公司的估值一直在稳步攀升,但少数几家上市公司却像 Atlas 一样撑起了整个市场。仅上市公司目前的价值就超过了 2023 年的整个市场价值(见图 4)。私营公司上市公司图 4:上市公司和私营公司市值-16-四、政治(一)美国通过行政命令引入有限的前沿模型规则,各州则推行各自更具争议性的规则四、政治(一)美国通过行政命令引入有限的前沿模型规则,各州则推行各自更具争议性的规则在2023年7月获得大型实验室自愿遵守相关模
26、型发展规定的承诺之后,白宫决定将之前这些实验室自愿表示要遵守的内容变成具有强制约束力的规定,当年 10 月,拜登签署了一项关于前沿模型监管的行政命令。由于在更广泛的联邦人工智能监管方面达成两党共识的可能性微乎其微,各州都在推行各自的人工智能法规,其中最引人注目的是加利福尼亚州的 SB 1047。(二)经过最后一刻的疯狂游说,欧盟人工智能法案最终正式成为法律(二)经过最后一刻的疯狂游说,欧盟人工智能法案最终正式成为法律今年 3 月,在法国和德国开展了一场集中的影响活动以弱化某些条款之后,欧洲议会通过了人工智能法案。然而,关于该法案的实施问题仍未得到解释。(三)英国正缓慢朝着制定前沿模型相关立法的
27、方向推进(三)英国正缓慢朝着制定前沿模型相关立法的方向推进英国新工党政府已发出信号,表示打算摒弃其前任仅通过现有立法来监管人工智能的做法,不过这种转变较为微妙。(四)中国的人工智能监管进入执法时代(四)中国的人工智能监管进入执法时代中国是首个开始制定生成式人工智能监管措施的国家,从-17-2022 年起就出台了全面的(最初是相关企业自愿遵循的)指导方针。如今,中国的审查机构也开始介入。(五)日本对人工智能的态度很热衷吗?(五)日本对人工智能的态度很热衷吗?出于政治和文化等多种原因,从历史上看,日本对于风险投资和人工智能初创企业一直是一个不温不火的市场。而如今,日本政府突然热衷于在这方面分得一杯
28、羹。(六)公共计算方面的努力与私人计算方面的努力相比相形见绌(六)公共计算方面的努力与私人计算方面的努力相比相形见绌英国、美国和欧盟都开始加大其公共计算服务的力度,为研究人员和初创企业提供补贴,使其能够使用昂贵的硬件设备。但相关举措仍处于试验性阶段。(七)不断增长的计算能耗危及大型科技企业的净零排放承诺,能源基础设施也开始不堪重负(七)不断增长的计算能耗危及大型科技企业的净零排放承诺,能源基础设施也开始不堪重负大型科技企业已签署了一系列到 2030 年的气候承诺,微软甚至承诺实现碳负排放。但人工智能的能耗却意味着他们目前正朝着错误的方向发展。人工智能面临的环境挑战与一个在规模化过程中常常被遗忘
29、的阻碍因素密切相关,那就是现实世界的物理制约。-18-(八)以人工智能为先的国防领域竞争对手实现了规模扩张,是例外吗?(八)以人工智能为先的国防领域竞争对手实现了规模扩张,是例外吗?自去年的报告发布以来,已经开始有一些重大合同被授予国防领域的挑战企业,但由于中标数量仍然较少,现在就说一个新的生态系统正在形成为时尚早。(九)关于人工智能经济影响的争论更加激烈(九)关于人工智能经济影响的争论更加激烈2023 年,人们就不同行业在多大程度上受到人工智能的影响展开了讨论。虽然一些机构(如国际货币基金组织)仍在发布相关研究成果,但相关争论已开始转向人工智能更广泛的经济影响方面。(十)虚假信息研究发展迅速
30、,但有关人工智能有效性的证据依然匮乏(十)虚假信息研究发展迅速,但有关人工智能有效性的证据依然匮乏由于今日俄罗斯电视台与西方受众直接沟通的能力受到限制,被发现通过一款名 Meliorator 的工具运营着一个由 1000个虚假X账号组成的网络。另外也有迹象表明,与俄罗斯政府有关联的人员在以色列-哈马斯冲突期间使用虚假图片挑起争议。但几乎没有证据表明这类材料被少数人以外的更多人浏览或相信。五、安全五、安全-19-(一)从安全主义到加速主义:一种重大的氛围转变已经发生(一)从安全主义到加速主义:一种重大的氛围转变已经发生从美国国会举行听证会以及为推动(关乎人类存亡的)人工智能安全议程而进行全球巡回
31、宣传的时期开始,领先的前沿模型企业正在加速向消费者推广人工智能产品。(二)英国创建了世界上首家人工智能安全研究所,美国随即效仿(二)英国创建了世界上首家人工智能安全研究所,美国随即效仿在“布莱切利峰会”召开之际,英国宣布其前沿人工智能特别工作组将由人工智能安全研究所(AISI)取代,这是世界上首家人工智能安全研究所。美国、日本和加拿大也纷纷跟进,但工作力度有限。(三)各国政府急于填补关键国家基础设施中的漏洞(三)各国政府急于填补关键国家基础设施中的漏洞除内部加深对模型能力的理解外,英国也正在成为增强防御能力方面的主要引领者。通过其高级研究与发明局(ARIA),投入 5900 万英镑研发一种“把
32、关系统”,旨在了解并降低能源、医疗保健和电信等关键领域人工智能带来的风险。据报道,政府还计划设立“人工智能安全研究实验室”,旨在汇集政府各部门关于英国对手利用人工智能进行攻击方面的知识。美国能源部一直在利用其内部测试平台来评估人工智能可能对关键基础设施和能源-20-安全构成的风险。国防部和国土安全部也一直专注于解决国家安全及民用目的的政府网络中的漏洞问题。(四)随着攻击面的扩大,开发人员加大了对破解限制的研究力度,但仍跟不上攻击者的步伐(四)随着攻击面的扩大,开发人员加大了对破解限制的研究力度,但仍跟不上攻击者的步伐新的功能带来新的漏洞。现有机构和专业实验室已加大了对破解限制的研究力度,设计潜
33、在的修复方案,并创建了首批攻击者测试基准。(五)如果无法阻止攻击,就正视这一现实(五)如果无法阻止攻击,就正视这一现实设想各种潜在攻击手段对模型进行攻击者测试颇具挑战性。各实验室越来越多地使用大型语言模型来扩大查找和修复漏洞的流程,包括元宇宙公司的两个团队也是如此。(六)面临对抗性攻击的不仅仅是基础模型(六)面临对抗性攻击的不仅仅是基础模型为提高图像分类器对对抗性攻击的稳健性,谷歌 DeepMind的一个团队从生物视觉系统中汲取了灵感,特别是微扫视(微小、无意识的眼球运动)概念。(七)除破解限制外,还应关注更隐蔽的攻击(七)除破解限制外,还应关注更隐蔽的攻击破解限制往往是安全挑战呈现给公众的一
34、面,但潜在的攻击面要广泛得多,涵盖了从训练到偏好数据,再到微调的方方面面。六、预测六、预测-21-对未来 12 个月全球人工智能发展作出十大预测:一是某主权国家对美国一家大型人工智能实验室投资超过100 亿美元,引发国家安全审查;二是一个完全由毫无编程能力的人创建的应用程序或网站将走红,例如进入苹果应用商店前 100 名;三是在相关案件开始进入审判阶段后,前沿实验室对数据收集工作进行了重要变革;四是在立法者担心监管过度时,欧盟人工智能法案的早期实施结果比预期的要宽松;五是 OpenAI 公司 o1 的一个开源替代方案在一系列推理基准测试中超越了 OpenAI 公司的 o1;六是竞争对手未能对英
35、伟达的市场地位造成任何实质性的冲击;七是由于各企业难以实现产品与市场的契合,人形机器人领域的投资水平将会逐渐下降;八是苹果公司在设备端研究取得的出色成果加速了个人设备端人工智能化的发展势头;九是一篇由人工智能科学家生成的研究论文在一个重要的机器学习会议或研讨会上被接受;十是一款与基于生成式人工智能元素进行互动的电子游戏将-22-取得突破性进展。译自:State of AI Report 2024,October 2024 by Air Street Capital译文作者:工业和信息化部赛迪研究院胡靖阳联系方式:18611600730电子邮件:-24-编 辑 部:工业和信息化部赛迪研究院通讯地址:北京市海淀区紫竹院路 66 号赛迪大厦 15 层国际合作处邮政编码:100048联 系 人:袁素雅联系电话:(010)8855968413263204219传真:(010)88558833网址:电子邮件:报:部领导送:部机关各司局,各地方工业和信息化主管部门,相关部门及研究单位,相关行业协会报:部领导送:部机关各司局,各地方工业和信息化主管部门,相关部门及研究单位,相关行业协会