《量子位智库:2024年度AI十大趋势报告(98页).pdf》由会员分享,可在线阅读,更多相关《量子位智库:2024年度AI十大趋势报告(98页).pdf(98页珍藏版)》请在薪酬报告网上搜索。
1、序言从今年起,量位智库做了个改变在过往三年连续围绕整个前沿科技来提供年度科技趋势参考后,今年聚焦在了AI。过去,AI是前沿科技主轴上的核技术。现如今,AI正在吞噬整个世界、整个产业、全部赛道。没错,AI已经完全成为了科技发展主旋律。尽管有诸多类,如开始类互联命,到后来类电(第次业)命,再到现如今最宏的种说法是:第次地球明命。所以不论如何,可AI正在展开的冲击、带来的影响是如何全深刻,甚度被以科幻的式谈论它。AI当然不是科幻,AI先是科学,其次是项程,最后正在变成种业。这就意味着AI不仅可以观测、可以学习,还能预测或者更准确来说,我们就是站在新进展新信息的最前沿,站在产学研交汇地带,把正在从学术
2、研究进产业变程序的技术向,总结并举例说明呈现给所有。在今年,我们还通过更具规模的数据统计,在AI应的创新创业和投资,也提供了结论性参考,希望对整个产业提供第三视下的助益。总之,希望这份年度趋势报告,能够对你在岁末年初了解时代技术进展提供最直接的帮助。处技术航海时代,即便你未能出海探索,也希望你能感知到潮涌动的向。量位智库总裁科技合作伙伴*以上排名先后顺序目录2024年度AI趋势PART 1技术篇趋势 模型创新:架构优化加速涌现,融合迭代势所趋趋势 Scaling Law泛化:推理能成皇冠明珠,倒逼计算和数据变趋势三 AGI探索:视频成点燃世界模型,空间智能统虚拟和现实/02/10/16趋势四
3、AI应格局:第轮洗牌结束,聚焦20赛道5场景趋势五 AI应竞争:多领域竞速运营于技术,AI助兵家必争趋势六 AI应增:AI+X赋能类产品快上,原AI爆款难求趋势七 AI产品趋势:多模态上,Agent席卷切,度个性化呼之欲出PART 2产品篇/25/35/45/50结语趋势 AI智变千百业:左变产,右重塑业态趋势九 AI业渗透率:数据基础决定初速度,需求成为加速度趋势 AI创投:投融资太效应明显,国家队出频率提升千百业AI优秀落地案推荐PART 3业篇/54/75/78/8701TECHNOLOGY?1.架构层创新助解决算瓶颈现实问题2.创新混合架构挑战Transformer垄断技术原理1.路径
4、:循环神经络及其变种(以RWKV为代表)2.路径:状态空间模型(以Mamba为代表)3.路径三:层次化卷积模型(以UniRepLKNet为代表)4.路径四:多尺度保持机制模型(以RetNet为代表)5.路径五:液体神经络模型(以LFM为代表)?Scaling LawScaling Law?技术原理1.AI模型的性能强烈依赖于规模2.全新的Scaling Law?AGIAGI?技术原理1.视频成:从扩散模型出发2.世界模型:从动驾驶领域到整个世界3.具智能:回到现实世界,回到产业链4.空间智能:连结具智能与空间计算/02/02/03/05/06/07/08/10/13/16/19/20/22?0
5、21.架构层创新助解决算瓶颈现实问题Transformer架构是前应最泛的主流模型架构,注意机制(Self-Attention,SA)则是Transformer架构的核它允许模型进并计算,在序列中线性地直接捕捉任意两个位置之间的关联权重,幅提模型能上限。但另,这也使模型的算需求、计算复杂性和消耗资源成本都随参数增加呈指数级增,在规模任务中快速触达天花板。图:Transformer模型架构,歌、多伦多学2024年以来,随着模型参数量的速规模化以及训练与部署的深落地,Transformer架构的上述弊端愈发显著,成为助推全球性算紧缺的重要因素,也为模型的端侧落地提出了挑战。为寻求突破,对模型架构的
6、创新性探索逐渐成为不容忽视的趋势。2.创新混合架构挑战Transformer垄断2017年Attention Is All You Need出世提出Transformer架构以来,7年已过。AI业对Transformer的路径依赖引发了越来越多的“过时”争论,体现出渐迫切的架构创新需求。2023年以来,RWKV和Mamba引起热议,多种新架构加速涌现,世界范围内的学者从多个向努,试图在保留Transformer架构优势的基础上创新性引其他架构特点,解决算开销问题,Transformer的绝对统治地位得到挑战,兼采众家之的混合模型(Hybrid)已成未来趋势。模 型 创 新01若能突破Trans
7、former在算和数据需求的限制,新架构有望在然语处理和计算机视觉领域引发新轮技术新。明势创投Transformer架构、Next-Token Prediction和Scaling Law是当前模型的算法基,但这些领域也越来越需要新的突破,以构建强且效的新代基础模型。强意味着卓越的性能、泛化能和抵抗幻觉能;效则指低成本、效率和低能耗。只有具备这两特质,智能才能真正成为和电样的基础设施。微软亚洲研究院这些新兴模型架构不仅在性能上可以与Transformer模型竞争,还在内存效率和可扩展性上展现出优势。梅花创投杨颜媛表,部分新架构更易于进并计算,能够充分利现代硬件的并计算能,提训练和推理的速度。它
8、们的出现,为AI领域带来了新的活,也为未来的研究和应开辟了新的可能性。随着这些模型的不断发展和优化,我们有理由相信,模型创新架构将在AI未来发展中扮演越来越重要的。?031.路径:循环神经络及其变种(以RWKV为代表)循环神经络(RNN)通过循环式处理序列数据,能够对过去的输保留记忆,但存在难以并化的问题,Transformer架构的诞最早就是为弥补这缺陷。但仍有很多学者认为,RNN的潜还远未达到天花板,在Transformer架构越来越受到诟病的今天,RNN凭借其独特优势再度获得了越来越多学者的探索创新。模 型 创 新01Hyena Hierarchy2023.04Michael Poli,
9、Stefano Massaroli,Eric Nguyen,Daniel Y.Fu,Tri Dao,Stephen Baccus,Yoshua Bengio,Stefano Ermon,Christopher RStanford University,Mila and Universit de MontralRWKV2023.05Bo Peng,Eric Alcaide,Quentin Anthony等RWKV元始智能RetNet2023.07Yutao Sun,Li Dong,Shaohan Huang,Shuming Ma,Yuqing Xia,Jilong Xue,Jianyong Wa
10、ng,Furu Wei微软亚洲研究院KAN2024.04Ziming Liu,Yixuan Wang,Sachin Vaidya,Fabian Ruehle,James Halverson,Marin Soljacic,Thomas Y.Hou,Max TegmarkMIT,Caltech,Northeastern University,IAIFITimeMixer2024.05Shiyu Wang,Haixu Wu,Xiaoming Shi,Tengge Hu,Huakun Luo,Lintao Ma,James Y.Zhang,Jun Zhou蚂蚁集团,清华学Mamba-22024.05A
11、lbert Gu,Tri Dao普林斯顿、卡内基梅隆学Falcon Mamba2024.08Jingwei Zuo,Maksim Velikanov,Rhaiem,Ilyas Chahed,Younes Belkada,Guillaume Kunsch阿布扎Technology Innovation Institute(TII)LFM2024.09Ramin Hasani,Mathias Lechner,Alexander Amini,Daniela RusLiquid AI前这路径的架构创新主要使循环神经络(RNN)替代注意机制,通过循环式处理序列数据,使模型对过去的输保留记忆。04RWKV
12、联想记忆法区别于Transformer的Query-Key-Value参数,RWKV架构由四个重要参数组成:R、W、K、V,除了可训练的权重参数w(Weight),RWKV还使r(Receptance)参数来控制对信息的接受程度。RWKV与Transformer架构的本质区别在于背后的记忆机制,与Transofrmer的内存寻址机制相,RWKV更像是种联想记忆法。模 型 创 新01?我相信RNN是正确的,但现在的RNN远远没有做到它真正的平,它的上限其实是常的,现在我们还远远没有到那个地步,还有很多空间。因为RNN更接近脑和宇宙的运作式。例如,在物理上,宇宙的下状态只与上状态有关,这是所谓的l
13、ocality和causality,量场论遵循这原则。彭博,RWKV作者RWKV(Recurrent Weighted Key-Value)模型核思想是将RNN的循环结构与Transformer的并计算能相结合,在实现效推理、节省存储开销的同时保持模型的性能。这使得RWKV可以“像Transformer样”进并训练,同时在推理阶段可以以递归形式进解码,“像RNN样”推理。Token Shift:token shift在时间混合计算中,通过对当前和前输的线性组合进线性投影,成于时间混合的向量;在通道混合计算中,也采类似的法成通道混合输向量WKV运算符:WKV运算符利时间衰减因对权重进更新,使得每
14、个时间步的输出依赖于之前所有时间步的信息,从保留了RNN的记忆能,这种设计使得RWKV模型在保持较低计算复杂度的同时,能有效捕捉序列数据中的期依赖关系(1)RWKV核思想(2)RWKV的创新点Transformer=Addressing Memory 寻址记忆:RWKV=Associative Memory 联想记忆:05图:RWKV内部架构图,彭博等RWKV提出以来已经经历了多次版本迭代,最新版本RWKV-7预览版已在今年9正式发布。(3)RWKV的发展与应2023年12,Mamba架构次被提出,引了选择性状态空间模型,实现了对输数据的有选择性处理。这种选择机制使得模型能够根据当前输的tok
15、en决定哪些信息是重要的,忽略不相关的信息,提升模型处理序列的能和推理吞吐量,达到Transformer模型的五倍。2.路径:状态空间模型(以Mamba为代表)状态空间模型可以看作是循环神经络(RNN)和卷积神经络(CNN)的融合,由其发展来的结构化的状态空间序列模型(SSM)是另颇具潜的模型创新架构代表。这类模型利状态空间处理序列问题,通过循环或卷积运算实现效计算,使得计算开销与序列度呈线性或近线性关系,从显著降低计算成本。(1)Mamba次提出 模 型 创 新01输出控:RWKV通过在时间混合和通道混合块中使sigmoid函数对接收向量进控,控制信息的流动和记忆更新,确保在每个时间步只传递
16、和处理相关信息,从减少梯度消失和爆炸问题,增强了模型的稳定性和训练效率Mamba的核在于其硬件感知算法,利现代硬件(如GPU)的内存层次结构,通过扫描卷积计算模型,减少不同级别GPU内存间的IO访问,提计算效率。此外,Mamba简化了深度序列模型设计,需注意机制或多层感知器(MLP)块,使模型更加简洁。图:选择性状态空间模型(Selective State Space Model),卡内基梅隆、普林斯顿学(2)Mamba核思想硬件友好设计:Mamba-2的另个重要贡献是其对硬件友好的设计,允许使更的状态维度,提训练速度。在处理需要更状态容量的任务,如多查询关联回忆(MQAR)任务时,Mamba
17、-2显出Mamba-1显著的性能提升混合模型的探索:Mamba-2还探索了将注意层与SSM层结合的混合模型,发现适量的注意层可以进步提升模型性能(4)Mamba-2创新点06今年5,Mamba-2发布,提出了状态空间对偶(SSD)框架,揭了状态空间模型与结构化掩码注意之间的联系。Mamba-2的核层通过引新的SSD算法,在训练效率上提升了2-8倍,同时保持了与Transformer在语建模的相似平竞争。(3)Mamba-2核思想图:(结构化状态空间对偶性)结构化矩阵阐明状态空间模型和注意之间的关系,普林斯顿、卡内基梅隆学 模 型 创 新01UniRepLKNet采核CNN,能够处理多种模态数据
18、,如图像、频、时序预测等。该模型提出了“局部结构设计、重参数化、核选择和随深度拓展添加核”四条指导原则来设计核CNN架构,并采硬件感知的并算法,在图像识别任务中实现领先性能,并在频、视频、点云和时间序列等多模态任务中也取得了显著的结果。UniRepLKNet的优势在于充分利核卷积神经络的特点,通过创新的架构设计,有效地解决了感受野、特征抽象层次以及模型深度表能等核问题。3.路径三:层次化卷积模型(以UniRepLKNet为代表)层次化卷积模型,以UniRepLKNet为代表,是种卷积架构,其核在于使与输序列度相当或接近的滤波器(核)来捕捉序列数据中的距离依赖关系。这种设计使得模型在处理输时能够
19、考虑到更远的历史信息,有效处理序列问题。(1)UniRepLKNet创新点图:UniRepLKNet的架构设计,腾讯AI Lab、港中学07核卷积的独特优势在于不依赖深度堆叠即可获得感受野,避免了深度增加带来的边际递减问题。UniRepLKNet提出了种膨胀重参数块(Dilated Reparam Block),即通过使多个膨胀核卷积层来增强个核卷积层,从在不增加推理成本的情况下提性能,该块的公式如下:膨胀重参数块使膨胀的核卷积层来增强膨胀的核层。这样的膨胀层相当于具有更稀疏核的膨胀卷积层,因此整个块可以等效地转换为单个核卷积。(2)核卷积的优势图:扩张重参数块转化为转换为单个核卷积,腾讯AI
20、 Lab、港中学 模 型 创 新01图:Retnet突破不可能三,微软亚洲研究院4.路径四:多尺度保持机制模型(以RetNet为代表)多尺度保持机制模型(Retentive Network,Retnet)由微软亚洲研究院提出,克服传统Transformer架构在效率和性能上的局限性。RetNet的设计突破了所谓的“不可能三”,在保持训练并性的同时,实现了低成本部署以及良好性能。作为全新的神经络架构,RetNet同时实现了良好的扩展结果、并训练、低成本部署和效推理。这些特性将使RetNet有可能成为继Transformer之后语模型基础络架构的有继承者。福如,微软亚洲研究院全球研究合伙RetNe
21、t作为全新的神经络架构,使多尺度保持(Retention)机制替代了标准的注意机制。与标准注意机制相,保持机制有以下特点:引位置相关的指数衰减项取代softmax:这改进简化了计算过程,并使得前步信息以衰减的形式得以保留,从在降低计算复杂度的同时,保留了序列中的重要信息引复数空间表达位置信息:这法取代了传统的绝对或相对位置编码,使得模型更容易转换为递归形式,增强了模型对序列中元素之间相对位置的感知能(1)RetNet创新点08图:RetNet的双重表,微软亚洲研究院 模 型 创 新01使多尺度的衰减率:保持机制采了多尺度的衰减率,使RetNet能够更灵活地处理不同度的序列,提升了模型对序列数据
22、的适应性和表达能利GroupNorm的缩放不变性提Retention层的数值精度:这特性使得在GroupNorm中乘以个标量值不会影响输出和反向梯度,从在保持模型性能的同时,提了计算的稳定性和效率并:并表使RetNet可以像Transformer样效地利GPU进并训练递归:递归表征实现了O(1)1的推理复杂度,降低了内存占和延迟分块递归:即并表和递归表的混合形式,将输序列划分为块,在块内按照并表进计算,在块间遵循递归表。分块递归表征则能够效处理序列数据RetNet的实验结果表明,它在语建模任务上达到了与Transformer相当的性能,同时在推理速度和内存占显著优于Transformer。(2
23、)序列表形式5.路径五:液体神经络模型(以LFM为代表)液体神经络模型LFM,由MIT系初创公司Liquid AI团队发布,是基于液体神经络(Liquid Neural Networks,LNN)架构的新型神经络设计。受物神经系统启发,LNN通过使更少的神经元和创新的数学公式,实现了与传统深度学习模型相相同甚更优的性能。(1)LFM创新点效内存使:LFM的核优势在于其效的内存使和强的推理能,这使得它在处理量顺序数据时表现出。与传统的基于Transformer的模型相,LFM在处理输时内存使量显著减少,这是因为LFM能够更有效地利上下度,KV缓存不随序列度增加线性增多模态能:LFM模型能够处理包
24、括视频、频、本、时间序列和信号在内的多种类型的数据适应能:LFM还具有适应能,可以根据特定的硬件平台或参数要求进动优化1 O(N)表第N步的推理复杂度09这些加速涌现的创新架构多是在不同程度保留Transformer架构优势基础上,结合循环神经络(RNN)、状态空间序列模型(SSM)、卷积模型(CNN)以及液体神经络(LNN)等思想所做出的创新发展,这使得不同架构之间的界限越来越模糊,呈现出益明显的混合(Hybrid)趋势,更多性能领先的创新架构具备“博采众家之”的特点。同时,前多数创新架构虽然能够在些规模性能测试中实现与传统Tranformer架构同等甚更优越的性能,但在实际应层,仍然有待业
25、界通过多个超参数模型作进步验证。图:LFM在MMLU-pro的测试集成绩对,Liquid AI 模 型 创 新01结构化操作单元:这些单元是模型的基本组成部分,属于个全新的设计空间。LFM的设计允许模型在扩展、推理、对和模型分析进优化。?Scaling LawScaling Law?10Scaling Law泛化022020年,伴随着GPT-3问世,第代Scaling Law指引我们在参数量、数据集和计算量之间寻找模型性能的最优解;2024年,拥有强推理能的o1让我们对模型的要求从迅速成与训练结果,转向在推理过程中进更深度的思考。最初,我们对Scaling law的关注局限于对参数量的思考,甚
26、引发了对其失效的担忧;但全新的scaling law从狭窄具体的指代衍到宽泛的概念,并引发了我们对万卡集群、合成数据和计算资源最优分配的多重关注。我们对Scaling Law及其泛化在当前AI时代下的关注可被归纳为以下点:参数量与计算量膨胀下,带动万卡集群以及性能络的建设和发展。数据耗尽危机中,合理善合成数据成为较优选择。新时代的Scaling Law出现,模型的发展将追求更的推理能,资源向Post-training和推理算倾斜。?我们将从影响两个模型时代的两条Scaling Law出发来探讨这个问题:1.AI模型的性能强烈依赖于规模,主要和参数量N、数据集D和训练计算量C有关AI模型领域的S
27、caling Law正式被提出要追溯到2020年,OpenAI在论Scaling Laws for Neural Language Models中总结到,他们发现损失函数(loss)随着模型、数据集和训练使的计算量呈幂律变化。模型的性能在定范围内受其他超参数(如depth、width)的影响很少。图:损失函数与训练计算量、参数量和数据集的幂律关系,OpenAI在Transformer模型中,Scaling Law的数学表通常为:Performance:模型性能(误差率、准确率等)C:计算量N:模型规模(参数量、数据量等):标度指标(性能随规模变化的表现)(1)Parameters&Comput
28、e:万卡集群及性能络建设的必要性2020年惊艳亮相的GPT-3是个175B参数的模型,今天我们讨论的模型参数量已经是万亿级别。EPOCH AI维护11图:2010-2024前沿AI模型训练计算量年增,EPOCH AI横轴:Publication data纵轴:Training compute(FLOP)例如GPT-4需要使2.5万张英伟达A100 GPU,并训练100天的左右时间,在此期间要处理13万亿个token,并且涉及约1.76万亿个参数。可以预的是为了追求更极致的性能和解决更多问题,在参数量的增加和计算需求的增下,万卡集群及性能络的建设是必要的。万卡集群:由万张及以上的加速卡(如GPU
29、、TPU或其他专AI加速芯)组成的性能计算系统性能络:络需要持带宽、低延迟的数据传输,确保集群中的计算节点能够效地通信和协作中国联通研究院夏璠表,性能络基础设施对于持规模AI应关重要。随着数据量的增加和AI应的扩展,对络带宽和延迟的要求也越来越。这种集群将充分整合性能GPU计算、性能RDMA络、性能并件存储、智算平台等关键技术,将底层基础设施整合成为台超级计算机,以千亿级甚万亿级参数规模的模型训练。中国万卡集群进展:运营商中国电信天翼云上海临港国产万卡算池中国移动呼和浩特万卡智算中中国联通上海临港国际云数据中企业腾讯算集群HCC、性能络星脉字节跳动12288卡Ampere架构训练集群百度万卡A
30、I集群阿巴巴阿云10万卡量级集群商汤SenseCore商汤装置蚂蚁集团万卡异构算集群全球数据中络市场预计将在未来五年内以约 10%的年复合增率增。明势创投着个从20世纪50年代就开始监测AI和机器学习模型的数据库,他们发现从2010年到2024年5,于训练模型的计算量每年增4-5倍,过去10年间语模型的性能提升中约有三分之是由于模型规模的增加。Scaling Law泛化02(2)Dataset:合成数据是数据危机的解药吗?同样,在Scaling Law中数据集的规模和表现也会改变模型的性能。现有的开源模型在法、架构层开源的同时,乎很少涉及到训练数据集的公开。图:公开本和数据使量的预测,EPOC
31、H AI还值得我们关注的个问题是,数据的质量也许数量更为重要。例如Apple在研发模型时采了常规的3阶段预训练法,在核预训练后降低络爬取的低质量数据权重。国内在意识到质量数据集的重要性后,多次发布对建设有质量数据集的指导意。图:合成数据成法,Amazon合成数据(Synthetic data)则是我们从AI1.0时代就开始寻找的破解之道,在具智能和动驾驶等前沿领域得到过部分运,如今已被泛引模型的训练之中。合成数据是指通过算法或模型成的为数据,模拟真实数据的统计特性和分布,但不包含任何真实信息。实际训练中,我们通常会选择部分或全部地使合成数据。明势创投表,合成数据的应突破了传统的数据获取和使式,
32、为解决数据匮乏和隐私问题提供了创新思路,具有较的创新性和颠覆性。企业华为昇腾AI万卡集群科讯星号超万卡集群算平台尽管万卡集群必然会强调对加速卡的需求,我们在技术上关注的却应该是集群的互联。从千卡到万卡,单卡性能下降8%左右,前全球范围内已经有企业开始追求10万卡以上的集群规模,在万卡到10万卡的难关中,如何能保持集群的线性度、稳定性,同时保证调度的效率,是下步所有AI玩家将持续关注的重点。我们必须要意识到个问题,也许有天我们会耗尽现有的数据。有估计称现有类公开本存量约为300万亿个token。按照预测,语模型有可能在2026年-2032年之间耗尽这存量。如果过度训练,这时间点将会再度提前。Sc
33、aling Law泛化021213但合成数据是否是应对数据危机的最佳解药仍值得商榷。先,真实数据永远存在相当多的离群值和异常值,合成数据成算法很少能重现它们。其次,合成数据的引可能导致模型在训练过程中出现过拟合,从影响其在现实世界中的表现。2024年发表在Nature上的篇研究AI models collapse when trained on recursively generated data提到他们所完成的次实验,使合成数据9次迭代后就会让模型原地崩溃。更吸引眼球的结果来Dohmatob,Elvis等的实验结果Strong Model Collapse,他们发现即使合成数据仅仅占到总数据
34、集的最部分,甚是1%的例,仍然可能导致模型崩溃。前成和使合成数据的法在不同模型中都处在探索阶段,我们将持续关注这议题的最终结果。2.全新的Scaling Law,赋予模型的推理时间越多,模型的推理能越强来到2024年,OpenAI有关o1模型的论On The Planning Abilities of OpenAIs o1 Models:Feasibility,Optimality,and Generalizability提出了条全新的Scaling Law:你赋予模型的推理时间越多,模型的推理能就越强。尽管没有披露具体的训练法,但其原理是基于强化学习的内化思维链学习,通过思维链式的问题拆解,
35、使得模型可以不断验证和纠错。图:o1在新Scaling Law下的推理表现,OpenAI(1)语模型推理增强(思维链-思维树-思维图)这年,我们确实观测到规模的增加带来了基本的推理能,但这种推理的效果是相对有限的,o1所完成的,是让模型在作答前进“停下来思考”,这过程需要更多的计算资源,因此被称为“推理时计算”。停下来思考这状态的实现,正是我们直想教会模型的模式,即更直接地进推理。当AI拥有更强的推理能,不仅意味着在编码、搜索等任务上能够帮助解决更多问题,也会在数学、物、化学等基础科学领域,帮助实现突破性的发现。榕创投统计分布:分析真实数据以确定其潜在的统计分布,例如正态分布、指数分布或卡分布
36、。然后从这些已识别分布中成合成样本,以创建在统计学上与原始数据集相似的数据集基于模型:训练机器学习模型以理解和复制真实数据的特征深度学习:使深度学习的式成质量的合成数据集。这些法通常于更复杂的数据类型,例如图像或时间序列数据合成数据的成法:Scaling Law泛化0214语模型的推理能通常涉及到种不同的技术或概念,包括思维链(Chain of Thought,CoT)、思维树(Treeof Thought,ToT)和思维图(Map of Thought,MoT)。思维链(Chain of Thought,CoT):模仿了类解决问题时的思维过程,即先分析问题,然后逐步推理,最后得出结论思维树(
37、Tree of Thought,ToT):更为结构化的推理法,它将问题分解为多个分,每个分代表个可能的推理路径或假设思维图(Map of Thought,MoT):视觉化具,来表不同概念、事实和推理步骤之间的联系(2)后训练(Post-training)的转变从前的预训练遵循个已经被深刻理解的法则:你在预训练模型上投的计算资源和数据越多,它的表现就越好。但新的Scaling LawPost-training Scaling Law的出现已经引发业对于算分配、后训练能的重新思考。后训练通常包括微调(Fine-tuning)和对(Alignment)。新的模型想要提升能,除了在预训练阶段,还可以在
38、后训练阶段,通过提升强化学习(Reinforcement Learning)训练的探索时间和增加模型推理的思考时间来实现性能的提升。o1激发了当前时代的模型开发者对提升模型数学和推理能的兴趣,这很程度上就意味着扩后训练的规模。最近的研究使了不同的法把结果的奖励信号传递到模型的各个推理过程中:o1幅度增强了模型的逻辑推理能,使模型从系统1提升到系统2,幅度加速AI Agent落地可能性。王晟,英诺天使基合伙问答格式 Q&A format本阶段 Long-context stage继续预训练 Continued pre-training质量阶段 High-quality stage知识蒸馏 Kno
39、wledge distillation监督微调 Supervised finetuning(SFT)基于类反馈的强化学习 Reinforcement learning with human feedback(RLHF)直接偏好优化 Direct preference optimization(DPO)在线/离线(处理)Online/offline知识蒸馏 Knowledge distillation图:后训练的重增加数据集D Datasetataset预处理P Preprocessingreprocessing预训练P Prere-trainingtraining后训练P Postost-tr
40、ainingtraining优化O OptimizationptimizationScaling Law泛化02以o1为代表的Inference scaling law使得模型推理能幅提升,在GPQA这样的类专家benchmark上已经超过类PhD平。推理能幅提升可以显著减少幻觉,提Agent类物的能。戴森,真格基管理合伙15(3)推理算vs训练算?随着我们对模型推理能的更追求,和对后训练阶段的更多投,未来有可能推理端的算将会超过训练端。尽管当前推理算还没有超过训练算,但推理成本已经超过了训练成本。毕竟训练成本是次性成本,推理需求将随着模型复杂度、数量和每查询次数的增加继续增。明势创投表,在规
41、模部署AI服务的背景下,推理成本成为主要开来源,市场对降低推理成本的需求强烈。值得提的是,Scaling Law并是严格的然法则,是类基于经验观察得出的趋势性规律,它的价值往往在对未来提供向性的指导。新旧Scaling Law的应和泛化将调整我们对资源配置和技术重的看法,并创新出更为强的新代AI和模型。如今,我们意识到RLHF起的作远超已经IFT(Instruction Fine-Tuning),需要将更多的预算放在后训练阶段上。模仿学习+强化学习成为典型AI模型发展路径范式。本质上是数据的稀缺与否及质量低的问题,数据多就优先模仿学习,数据少就优先强化学习(可我产数据),最终是综合两种类型的算
42、法技术以产更强的能。陈,峰瑞资本合伙拒绝采样似乎已成为后训练阶段的常做法,但现阶段并没有在选择DPO或RLHF达成共识。然强化学习的思路贯穿始终,Meta仍为Llama的后训练开发了奖励模型。Llama 3.1Post-training:SFT+拒绝采样+DPOMeta AI认为RL算法(如带有PPO的RLHF)稳定性差、扩展难度,但他们在DPO后仍开发了奖励模型,并将模型平均技术在每轮训练中都作于奖励模型、SFT和DPOQwen22阶段后训练法:SFT,提模型在预设场景中的响应准确性;DPO,使模型与类偏好保持致(他们称这环节为RLHF)Qwen2的Alignment也分为2部分:DPO(离
43、线)+拒绝采样(在线)Scaling Law泛化02Apple Intelligence FoundationPost-training:SFT+RLHF其中,Apple为RLHF阶段引两种新法:与iTeC起进拒绝采样微调,的是训练、优化奖励模型;镜像下降与RLHF结合,这被认为是PPO(近端策略优化)更有效的法Gemma 2Post-training:SFT+RLHF其中,其中他们于RLHF的模型标模型倍,使WARP(Weight Averaging for Reward Prediction)对标模型进平均0316?AGIAGI?1.视频成:从扩散模型出发扩散模型前已经在图像成、图像超分辨
44、率和图像编辑等任务中取得了显著成果,并逐渐取代了基于成对抗络(GAN)和变分编码器(VAE)的法,在视频合成任务中展现出巨潜,成为前视频成的主流技术路径。扩散模型(Diffussion Model)是类概率成模型,主要通过学习逆向过程来成数据。图:A Survey on Video Diffusion Models,上海市智能视觉计算协同创新中、复旦学(1)DiT模型Sora的热激发了国内外许多模型在视频成领域的应,产出了在影视、营销等业具有可落地商业价值的AI应;“个视频模型”之争也引发了动驾驶领域基于优势,对世界模型的研究和探索;能够带来更好的动驾驶体验的世界模型,事实上也能够作于机器领域
45、;引发诸多讨论的空间智能概念,与我们直探索的空间计算、具智能密不可分在AI改变我们的活、真正触摸复杂世界的过程中,类也从未停对AGI的探索。本轮视频成热潮中,最受瞩的是将Transformer架构引到扩散模型中的DiT(Diffusion Transformer)模型,极强地提了图像成的质量。DiT的核思想是利Transformer的强建模能,替换传统扩散模型中常的U-Net结构,从在潜在空间上操作,成质量的图像。其图像成流程是基于种混合的法,使卷积VAEs和基于Transformer的DDPM(Denoising Diffusion Probabilistic Models),重点是训练图像
46、的DDPM,特别是图像的空间表。A G I 探 索17图:Scalable Diffusion Models with Transformers,UC Berkeley、New York UniversityDiT的技术原理基于以下个关键点:扩散模型DiT建在扩散模型的基础上,这是种成模型,通过模拟个从数据分布到噪声分布的逐步过程,学习逆向过程来成数据。在DiT中,这个逆向过程由Transformer来实现Transformer架构Transformer以其注意机制闻名,能够捕捉序列数据中的距离依赖关系。在DiT中,图像被分割成多个patches,这些补丁被嵌到个序列中,然后通过Transfo
47、rmer块进处理潜在补丁DiT不是直接在像素空间上操作,是在潜在空间上操作。这是通过将图像编码到个较低维度的潜在表来实现的,这个表被分割成多个补丁,每个补丁作为个序列元素输到Transformer中条件成DiT持条件成,这意味着它可以在成过程中使额外的信息,如类别标签。这些条件信息被嵌到Transformer的输序列中,以引导成过程可扩展性DiT的设计允许其通过增加模型的深度、宽度或输补丁的数量来扩展。这种可扩展性使得DiT能够通过增加计算资源来提成图像的质量训练效率DiT在训练过程中表现出了效率。由于Transformer的并化能,DiT可以利现代硬件(如TPU)进效训练03A G I 探
48、索18DiT的提出,不仅推动了成模型技术的发展,也为未来的研究提供了新的向。随着研究的深,DiT或其变体已经被应于视频成,以及艺术创作、游戏开发和虚拟现实等领域。随着模型规模的增加和训练技术的改进,DiT有望在未来实现更加惊的成效果。在视频成领域,除了DiT之外,还有其他种混合架构取得了显著的进展。这些架构结合了不同的模型特性,以提视频成的质量和效率。(2)其他混合架构模型创新Transformer+3D卷积络些研究作探索了将Transformer与3D卷积络结合的架构。3D卷积络擅捕捉视频的时空特征,Transformer能够处理距离依赖关系。这种混合架构能够同时利两者的优势,提视频成的连贯
49、性和真实感回归模型+Transformer回归模型如PixelRNN或PixelCNN在像素级别上成数据,Transformer则能够处理序列数据。将两者结合可以成质量的视频内容,同时保持对距离依赖的有效建模VAE+扩散模型在DiT的基础上,学者们进步探索了将变分编码器与扩散模型结合的架构。这种混合模型先使VAE将分辨率的视频编码到低维潜在空间,然后在潜在空间上应扩散模型进成,从在保持成质量的同时减少计算成本GAN+扩散模型GAN在图像成领域取得了巨成功,扩散模型则在样本质量上展现出了优势。将两者结合的混合架构旨在结合GAN的稳定性和扩散模型的质量样本成能TimeSformerTimeSfor
50、mer是种专为视频理解任务设计的Transformer架构,它通过将时间维度融到标准的Transformer架构中,有效地处理视频数据。这种架构可以于视频成任务,成具有时空致性的内容交叉注意机制在Transformer架构中引交叉注意机制,可以使模型在成视频时更好地利额外的上下信息,如本描述或对象标签,从成与这些上下信息更加致的视频内容这些混合架构的共同标是在保持视频成质量的同时,提模型的计算效率和灵活性。随着研究的不断深,我们可以预未来将会出现更多创新的混合架构。我们再次回到引爆视频成热潮的模型Sora。OpenAI在介绍中称Sora是“World Simulator”,在Sora上线的第时
51、间埃隆斯克即表,Tesla约在年前即能成符合物理学的有关真实世界的模型(Real-world video generation with accurate physics),这讨论将世界模型(World Model)的概念引众视线。03A G I 探 索图:世界模型的基本框架19Sora模拟真实世界物理状态OpenAIOpenAISora通过结合扩散模型与Transformer模型,能够模拟真实世界中的、动物和环境。这种能使其在本到视频(T2V)领域中独树帜,能够根据本提成逼真的视频内容。时间度与时序致性:Sora能够成达60秒的视频,且在维持视频内容的时间连续性和逻辑致性表现出,这在以往的视
52、频模型中是难以实现的。真实世界物理状态模拟:Sora展了系列引注的涌现能,这些为不是预设的规则,是模型通过学习量数据后然涌现的能。2.世界模型:从动驾驶领域到整个世界AI在现实世界的应正在从虚拟世界逐渐扩散物理世界。2024年谈到世界模型更多是在智能驾驶领域,本年度国内领先的量产智能驾驶玩家蔚来、理想等都提出了有关世界模型的设想和布局。论Recurrent World Models Facilitate Policy Evolution(David Ha,Jrgen Schmidhuber,2018)可以帮助我们理解什么是世界模型:(1)世界模型(World Model)图中的Vision M
53、odel(V)将维观测转为低维向量,Memory RNN(M)是序列预测下个时刻的表征,在这样基本的序列预测中增加个输action,让数据分布由变化。事实上,世界模型反映了久以来许多AI研究员对model-based RL作的奈和期待:模型不够准确,那么完全在模型训练的强化学习效果就不好;如果能获得准确的世界模型,就能在世界模型中反复试错,找到现实的最优决策。由此,我们可以从需求出发来定义世界模型:完全地理解这个世界就是世界模型要的事。任少卿,蔚来智能驾驶副总裁03A G I 探 索20正如为何特斯拉会在年前就开始布局有关真实世界模型的相关作,对数据中没有过的决策,使世界模型推理出决策成果这要
54、点,和动驾驶领域实现L5的标息息相关。当前,世界模型向上的作正泛地采动驾驶领域的数据和场景进实验。(2)前在世界模型向上的作RenderWorld仅持视觉的端到端动驾驶框架,它使基于监督斯的Img2Occ模块成3D占标签,然后通过AM-VAE对标签进编码,并使世界模型进预测和规划。RenderWorld采斯散射来表3D场景和渲染2D图像,与基于NeRF的法相,提了分割精度并降低了GPU内存消耗Drive OccWorld以视觉为中的4D预测世界模型应于动驾驶的端到端规划BEVWorld将多模态传感器输标记为统紧凑的瞰图(BEV)潜在空间以进环境建模的新法。世界模型由两部分组成:多模态标记器和潜
55、在BEV序列扩散模型LAW使LAtent World model,根据预测的为和当前框架的潜在特征来预测未来的潜在特征OccLLaMA类似VQVAE的场景标记器,增强了LLM,特别是LLaMA,以对统词汇表执下个token/场景预测,从完成动驾驶中的多项任务DriveDreamer-2它基于前作(DriveDreamer)的框架,结合了个型语模型来成定义的驾驶视频WorldDreamer培养对般世界物理和运动的全理解,从显著增强视频成的能;WorldDreamer从型语模型的成功中汲取灵感,将世界建模定义为监督的视觉序列建模挑战3.具智能:回到现实世界,回到产业链早期的世界模型很多出现在机器领
56、域,任少卿提到“动驾驶是泛机器领域/世界模型的框架也能做机器”。具智能是指种基于物理体进感知和动的智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现动,从产智能为和适应性。Sim2Real(simulation to reality)和在真实世界中采集具交互的数据并学习是研究具智能的两条思路。清华智能产业研究院(AIR)表:将真实环境数字化和仿真器模拟的为学习结合起来,形成Real2Sim2Real(RSR)的闭环连接,能更有效地利交互数据和真实环境的反馈,加速智能系统的实际部署与落地。与去年相,许多具智能玩家在2024年都推出了的款形机器,但更多玩家开始关注机器在具体产业链
57、03A G I 探 索21上能有什么样的位置和发展空间。这不仅意味着与过去年相,形机器的概念变得分可触及,同时也表明具智能这领域,正在转向对当前类来说更有价值的落地和应。项明显特征是,在完成了、避障等基本功能后,具智能玩家纷纷开始研发灵巧,逐个攻克具智能难题:腾讯Robotics X实验室公布了研机器灵巧TRX-Hand,拥有8个可独控制关节,重仅1.16千克,最持续指尖可达15星动纪元XHand灵巧具有12个主动由度,采全驱动案,能够实现多向的运动,从模仿类部的精细操作灵巧Linker Hand以其20个主动由度的合理配置,被业界专家泛认为是具智能研究的优选案,平衡了研究需求与成本效益银河通
58、拥有灵巧解耦关节和灵巧线性驱动式专利傲意科技灵巧ROHand具有11个运动关节和6个主动由度帕西尼感知科技开发了市场上款融合多维触觉与AI视觉双模态能的四指仿灵巧DexH13 GEN2,具有1956颗专业级ITPU多维触觉传感器和800万清AI眼相机智元机器推出了由度五指灵巧,包含19个由度,集成基于MEMS原理的触觉感知和视触觉感知技术视频成、世界模型与机器集群1X1XNEO:专为家庭使设计的双形机器,1X基于视频成和动驾驶世界模型领域的进展,训练出了个世界模型,作为其机器的虚拟模拟器。模型可以理解接触到的物理世界并成保真视频,使机器可以在的神经空间中执规划、评估和模拟操作。EVE:轮式机器
59、,2020 年即取得商业化进展,为美国商业场所提供安保服务。1X强调其机器集群协作,展了个通过简单的语命令指挥多个机器执系列动作的能。1X Technologies,2014年于挪威成,专注于开发和产能够模仿类为的机器,以增加全球的类劳动。03A G I 探 索224.空间智能:连结具智能与空间计算在经历了整年有关具智能概念、投融资的热潮后,与其相关不完全相似的空间智能概念被李提起。空间计算是项将物理世界与数字内容融合的技术体系,根据其涉及的不同层次,可以分为基础设施层、数据层和交互层:(1)空间计算基建层:持空间计算的硬件和络基础设备:苹果的Vision Pro提供了性能的AR显、光学传感器
60、以及精准的跟踪功能,配备先进摄像头和处理器络:速度、低延迟的5G和Wi-Fi 6E络正加速实时交互的实现,尤其适于移动设备和协作应;歌云等云服务商正在开发“边缘AI”基础设施,将AI模型更贴近,从减少延迟、提升空间计算应的实时能空间智能是指机器在三维空间和时间中感知、推理和动的能,帮助它理解事物在三维空间中的位置及交互式。李在彻底理解空间智能之前,我们可以回顾在2023年度报告中提及的重要科技趋势空间计算:Apple Vision Pro空间计算从概念到现实AppleApple然输式:Vision Pro 采了种称为“然输”的交互模型,这种模型使眼睛和的组合进输,只需看着标并点击指即可进交互。
61、空间操作系统 visionOS:Vision Pro 搭载了苹果款为空间计算所打造的操作系统 visionOS,它包括了全新的实时执引擎、动态注视点渲染管线以及对原空间体验的持。Apple Vision Pro作为苹果公司推出的款空间计算设备,实现了数字内容缝融现实世界,通过其命性的产品设计和技术创新,开启了空间计算的新时代。03A G I 探 索(2)操作系统:空间智能苹果发布的Vision Pro就是个典型的空间计算设备。李认为,与其不同的是,空间智能将成为增强现实和虚拟现实的操作系统。通过成完整可交互的三维世界,真正解锁机器在三维世界中的智能能。同时,具备三维感知、推理和动能的机器能彻底
62、改变我们与世界的交互式。毫疑问,空间智能的野正在于将空间计算操控虚拟世界的本领和具智能触达现实世界的能结合起来,这将涉及到量的数据处理、模型训练以及如何在现实场景有效地部署这些技术。最终,从视频成到世界模型、从具智能到空间智能,我们始终都在追寻个问题AGI,极致的AI,极致的通,虚拟与真实世界的合为。数据层:负责空间数据的收集、处理和管理空间映射和计算机视觉:实时映射和物理环境的解读,使应程序能够将虚拟物体置于物理空间中数字孪:通过集成物理模型、传感器更新、运历史等数据,在虚拟空间中完成映射交互层:直观地与虚拟和物理世界互动沉浸技术(XR):主要包括增强现实(AR)、虚拟现实(VR)和混合现实
63、(MR),他们前仍是空间计算概念落地的核技术,AR将数字元素叠加在现实世界中,VR创建完全虚拟的空间,MR则是两者的混合;前具体相关产品存在视频透视(VST)和光学透视(OST)两种技术路径触觉反馈和感官界:设备的触觉反馈增加了沉浸感,混合现实头戴设备和触感套能在虚拟环境中创造度真实的互动语和势识别:得益于AI的持,这些技术允许需动即可控制数字元素03A G I 探 索23RokidGlassesAI+AR缝融合现实世界RokidRokid2024年1118,Rokid联名暴眼镜推出消费级AI+AR眼镜Rokid Glasses。AI+AR全新交互式:Rokid Glasses基于衍射光波导成
64、像技术实现AR效果,同时深度整合阿巴巴旗下通义千问模型AI能,融合AI+AR技术,可以通过语和视觉交互实现物体识别、实时翻译、定位导航、购物付多种任务,缝融合现实世界。硬件“减负满配”:Rokid Glasses将主板、电池等核组件集成于框架之中,重量仅49g,提升舒适度及便携性。同时配备颗1200万像素专业级摄像头,搭载了第代骁AR1平台,配合2GB RAM+32GB ROM存储组合。02P R O D U C T?AIAI?2020?5 5?()20+细分赛道()五使场景?AIAI?AIAI?()APP端数据分析()Web端数据分析(三)量位智库AI100?AIAI?AI+XAI+X?AI
65、AI?()办公软件类AI+X产品()内容平台类AI+X产品?AIAI?AgentAgent?()多模态()Agent化(三)度个性化1.综合AI1002.原AI100/25/32/35/39/42/43/44/46/48/50/51/52AI?A IA I?办公提效-A I 写 作-A I P P T-A I 总 结-A I 图 彩云梦腾讯涌阿悉语笔杆论创意喵AI写作万能写作师创作星AI智能写FRIDAYGiiso写作机器星助句忧万彩AI多种草AI讯公智能写作讯绘VERSE红书智能创作状元AIPaperPass百度作家平台66论易撰5118SEO写作夸克CueMe媒帮派伪原创果写作蛙蛙写作co
66、pydoneAI写作树熊写作思助AI写作宝字游侠光速写作秘塔写作猫笔灵AI写作讯写作摆平AI论爱改写新华妙笔公写作AI新媒体章AiPPTiSlideChatPPT格PPT轻办公adAI万兴智演歌者PPT秒出PPTGaiPPT美图LivePPT博思AI PPT当秀Mindshow塔猫PPT彩漩PPTProcessOn 亿图脑图AIGitMind思乎TreeMind树图Mapify亿图图AI知犀AIAmyMindBibiGPT星档问答司阅SmartRead有道速读会记天壤万卷知我AI包阅AIFeelRead阅会读ReadFlowAI课代表ReportifyCuboxReadPaper讯听听脑-A
67、I 代 码快码CodeGeeX包MarsCode驭码Code Rider星码代码浣熊通义灵码CodeFuseAI XCoder创意成-A I 设 计-A I 图-A I 视 频-A I 图 像 编 辑-A I 频-A I 乐标智AI logo135 AI排版抖即创U钙即时AI京东羚珑创客贴易可图AI神采AI易设计坊百度云念Motiff妙多暗壳AIiMuse.ai优势智设阿班千图设计室万相营造AI LOGO灵图AI腾讯设计开放平台匠紫设计包装设计艾绘绘本设计奇布塔绘本设计千设计助造物云AI云图AI库AI云字体家Canva可画稿定AI墨AI莫设计AI摹客AIPixso AI美图设计室图怪兽标智客A
68、I logo美间AI阿堆友简拼界版图商汤秒画绘AITiamat海艺AI6penHiDream.aiMewX AIA1.art设画宇宙VoxCraft造梦记数画360鸿图StartAI意间AIAnyPaint万兴爱画AI闪绘链云版图摩笔良灵动限猫社区LibLib AI即梦AIMeshy限画格吐司AI绘画WHEE奇域AI通义万相触AI绘画TRIPO神采AIFotor你我当年照修复佐糖360智图像素蛋糕AI改图凡科AI改图象寄百度盘AI修图图可丽咻图AI美图云修花图像ProKnockOutPiczooReminiPhoto Retouch照修复炫图AI Touch Retouch开修图Sih.ai咔
69、哒FP Video画质2xInstasize AIPicHeroMorph StudioVega AI智谱清影快可灵Etna模视频炫变换脸FusionX引擎SkyReelsPixWeaver寻光HiDream.aiBoolvideo剪辑万兴喵影Clipfly帧妙创艺映AI巨禄腾讯智影度加创作具星绘镜MOKIFancyTech梦Q.AI极虎漫剪即梦AI6pen起剪知作Vidu开拍Pixverse闪剪AI视频DreamFace魔坊饼AI变声逗哥配录咖可智能讯智作蓝藻AI悦配剪芊芊妙猫头昆仑疯字节海绵乐腾讯TME Studio给BGM猫ACE Studio易天歌歌AI写歌Muse AI控和弦派创岛易
70、X Studio休闲娱乐-AI陪 伴X Eva星野我在AI叨叨猫箱WoW筑梦岛冒泡鸭 Cos Love 造梦次元 捏TA彩云梦 异世界回响 逗逗闪令预塔塔络希侃星球船顺唠唠蕉蝶境伙伴鸭纸机悬河AI扮演 有象冰岛AiU 虚拟友林间聊愈室DD星球独响Cos AIQuin聊会天喵悦流轻偶AI乌托邦Me.bot商量拟模型通义星尘模型百川模型AnyDoor毒霸姬-AI相 机脸猫灵动AI超能画布摹仙绘蛙WeShop唯象K电商图超会AI图应AIPhotoStudio AI绘创AIPaiE象剪同款星绘脸趣Faceplay秀脸美图证件照快剪辑最美证件照趣拍AI换脸秀美间AI创意商拍悦颜相机乐拍StyleArt相
71、机千颜妙鸭相机必拍常活-AI教 育包爱学 斑AI学 海豚AI学 快问 AITalk AI练语AI外教 有道PEF Hello Hi Echo-AI健 康天天跳绳胃之书讯晓医-其 他宝同花顺问财光综合类具-多 功 能 综 合 平 台-AI搜 索万知讯智WPS AI画桌灵办AI悟空妙办画板简单AIfabrie360AI浏览器effie博思板boardmix腾讯档橙篇360苏打办公百度库息流FlowUs夸克有道云笔记Notion AI印象笔记Monica AI-AI Ag ent扣Coze智能体平台斑头雁BetterYeah腾讯元器智谱清智能体中Gnomic百宝箱讯星智能体中Link.aiInsid
72、erXSkyAgents实在AgentMetaGPT-AI智 能 助 紫东太初AI BoxMChatAI聚天书AI畅问AI蓝千询包AI天AI智谱清讯星阿通义deepseek海螺AI 腾讯元宝百应跃问晓象Sensechat问百度AI助360 AI助创脑AI聊天Kimi智能助AI Mate Pro360智脑妙AILuca元象模型道海鲸AI灵助WPS灵犀万能in船流知我AI简单搜索得理法搜C知道博查AI搜索开搜AIAMinerMetaLaw流Brainstorm快找找问问宇宙MikuSeekAll.aiLepton SearchSuppr超能献寻隐懂法猫秘塔AI搜索纳搜索GensparkThinkA
73、nyFelo知乎直答Devv.ai-AI开 发 平 台Dify魔搭社区华为ModelArts腾讯AI开放平台智谱开放平台壁ChatDev讯开放平台CoLingo开搭QAnythingAI?-AI PC宏碁荣耀机械命华为联想华硕-AI 机VIVO华为荣耀魅族OPPO-AI 机包Ola FriendiFLYBUDSAIxFU(爱富)-AI眼 镜度AI眼镜Meta Lens Chat华为智能眼镜2界环AI频眼镜MIJIA智能频眼镜Rokid AR Lite-AI硬 件 新 物 种Rabbit R1统计截2024年1031虚拟男友ChatBird?AIAI?2020?5 5?25基于对全国现有AI产品
74、(包含Web端和APP端)的梳理总结,我们在国内共统计到了千余款产品。为了更好地从数据维度观察国内产品的现状,我们结合产品具体功能、使体验、运营状况和数据等因素,从中选取了四百余款具有代表意义的产品进进步统计研究。这400款产品全覆盖了20余个细分赛道和五场景,全渗透个产、休闲娱乐和常活等多维度。?20+20+?第梯队AI智能助(34款)、AI写作(34款)、AI图(33款)、AI视频(32款)AI设计(23款)、AI陪伴(23款)第梯队AI修图(22款)、综合类套件(21款)AI搜索(19款)、AI相机(19款)、AI乐/效(17款)、AI开发平台(15款)第三梯队AI Agent(12款)
75、、AI教育(10款)、AI总结(11款)AI PPT(8款)、AI图(7款)、AI代码(7款)、AI翻译(5款)具体包含AI智能助、AI陪伴、AI相机、AI写作、综合类套件、AI修图、AI视频、AI教育、AI乐/效、AI设计、AI图、AI搜索、AI图、AI总结和AI翻译共计20个赛道。根据产品数量可以分为三梯队。由于Web端和APP端适于不同场景,在两种使形态下的产品赛道数量分布有所差异。在APP端的166款产品中,产品数量最多的赛道依次为AI智能助、AI陪伴、AI相机、AI写作和综合类套件。在Web端的230款产品中,产品数量最多的赛道则依次为AI智能助、AI写作、AI视频和综合类套件。AI
76、智能助 15%共23款AI陪伴 12%共19款AI相机 10%共16款AI写作 9%共14款综合类套件 9%共13款AI修图 8%AI视频 6%AI教育 6%AI乐/效 6%AI设计 4%AI图 4%AI搜索 4%AI图 2%AI总结 2%AI翻译AI运动.?AI APPAI APP?注:量位智库出品并保有最终解释权。产品统计截2024.10,经筛选后共计166款观测产品04A I 应 格 局261.AI智能助梯队明显划分,包断层领先AI智能助是前表现最突出的AI原类产品,也是国内模型研商技术实最直观的体现。前各产品间的功能差异较,普遍包含对话交互、AI搜索、AI写作、数据分析等功能。在收费,
77、尚未形成明确的收费模式和付费意愿。仅有明确进会员收费,Kimi智能助则是打赏式收费,智谱清和天AI分别针对视频及乐成功能进收费。从APP端来看,2024年5成为关键分岭,各家模型商的AI智能助登场完毕,产品间开始明显分化,形成了“1+1+6”的格局。第名包在规模、增、活跃、留存等各项数据上均断层式领先,今仍保持着全加速增,也在9成为国内个总下载过亿的原AI产品。24年10,包累计下载量超1.4亿,当新增下载量超2000万。Kimi智能助虽然位居次席,但市场领导地位同样明显。第三梯队的6则指:、智谱清、讯星、天AI、阿通义、腾讯元宝和海螺AI。在Web端,头部产品为Kimi智能助和,访问量均超过
78、2000万。包和阿通义访问量则超过1000万。从2024年5-10的规模数据来看,AI智能助在Web端已经出现了明显的梯队划分:以下是对各代表赛道的详细分析:?AIAI分?分?WebWeb?注:量位智库出品并保有最终解释权。产品统计截2024.10,经筛选后共计230款观测产品AI智能助 11%共25款综合类套件 8%共19款AI设计 10%共22款AI图 13%共29款AI写作 11%共25款AI视频 10%共23款AI搜索 7%16款AI Agent 5%12款AI修图 5%AI乐/效 4%AI PPT 8款AI总结 8款AI代码 6款AI图 6款AI相机 3款AI开发平台AI陪伴AI翻译
79、AI数据快速增Kimi智能助 包 海螺AI 跃问平稳增阿通义 智谱清 腾讯元宝基本持平百应04A I 应 格 局27总体来看,我国的AI智能助与海外仍有相当距离,对标产品ChatGPT在Web端的访问量超36亿,Gemini访问量超2亿,Claude数据超8000万,差距超过5倍。2.AI搜索多渠道共同发国内头部产品为秘塔AI搜索和知乎直答,总访问量分别超过600万和300万,均推出了简洁、深、研究、专业等多种搜索模式,并持通过上传件构造个性化搜索引擎。此外,天AI等AI智能助也普遍提供AI搜索功能。国外典型对标产品Yandex访问量过亿,Perplexity访问量超9000万。04A I 应
80、 格 局图:Kimi智能助(左)和包(右)的Web端界图:(左)和阿通义(右)的Web端界图:秘塔AI搜索(左)和知乎直答(右)的Web端界28从具体产品定位上可以分为AI加强搜索、原类AI搜索和业务类AI搜索。3.AI陪伴增乏,Killer APP前景不明从功能来看,量位智库按照使者和AI智能体的交互强度,将AI陪伴产品分为轻交互、中交互和强交互产品。所有产品基本均有扮演的成分。轻交互产品以理疗愈和AI记软件为代表,如林间聊愈室和光。玩家在交流中起绝对主导作,时间和精投相对较少,AI智能体的回应不会出现过多“惊喜”中交互产品更类似于游戏,提供特定的游玩体验,主要对应互动说和智能体社区。玩家和
81、AI智能体共同影响剧情向,包括多智能体群聊对话和说展开两种形式。玩家会集中性投时间游玩,代表性产品包括冰岛、冒泡鸭、有象等强交互产品以虚拟恋为代表,玩家和AI智能体会持续频聊天,个别软件甚可以提供叫起床等常服务。此类产品是前活跃粘性最好的部分AI加强搜索在原有搜索引擎、浏览器等互联产品的基础上,叠加AI功能后衍出的新代产品。代表包括:纳搜索、夸克浏览器、简单搜索等原AI搜索以AI搜索为产品核的AI原产品。代表包括:秘塔AI搜索、ThinkAny、GenSpark、开搜AI等。也有MetaLaw、Devv.ai和C知道等针对特定领域的垂直AI搜索具业务AI搜索在内容平台类原有业务上,叠加AI搜索
82、功能的产品。代表包括:知乎直答、bilibli AI搜索助、红书的达芬奇/搜搜薯等。这种结合不仅增强了平台作为搜索引擎的功能性,也提升了在特定内容平台的使体验AI陪伴也是众多公司布局AI原应的重要选择。包含冰科技、线球科技、Minimax、阶跃星、有零科技在内的20家AIGC公司共推出了21款产品。由于AI陪伴产品在功能上和扮演游戏、剧、社交,乃理咨询等业务深度重合,许多垂直赛道玩家,例如顺科技、晓悟智能、阅集团、Soul、纪源等也纷纷进这领域。04A I 应 格 局图:星野、X Eva、彩云梦、光(从左到右)的APP界29国内产品在新增速度和活跃等数据上普遍下滑。全球范围内,Characte
83、r AI、Janitor AI、Crushon、Talkie的热度持续已超过年。其中,Character AI端MAU可上亿,APP端MAU则超过两千万,国内MAU最的星野在APP端数据仅约为其分之,这数据表现在国外勉强进前。经过和海外产品的深对,量位智库认为关键在于国内产品缺乏对深度情感链接的探索。Character AI、Replika等海外产品更注重个性化和深度情感交流,追求具有独格和复杂情感反应的AI形象。国内市场则更倾向于短期的趣味性互动或娱乐化的陪伴功能,产品满的需求过于浅层,同类产品间可替代性强,难以让深探索。5.AI+图像普遍得到需求验证AI+图像可以具体分为AI图、AI设计、
84、AI相机、AI修图四个细分领域,前在B、C两端普遍得到明确的需求验证。在Web端,AI视觉设计成为最受欢迎的细分赛道,AI绘画和AI修图紧随其后。在APP端,AI相机的数据压AI陪伴,成为2C AIGC产品中的热类。AI视觉设计类产品分为两类,类为平设计相关,具体包含海报、设计概念图等,代表产品包括稿定AI、美图设计室和图怪兽。另类则是进步功能细分的产品,包括主打图排版设计的135AI排版助和主打UI设计的即时AI。Logo设计表现突出,选产品包括标智logo、标智客AI Logo和U钙。4.AI写作成为标配AI功能在功能上,AI写作多提供“键式成+深度AI编辑”的综合式。在键成时,使者提供主
85、题或关键信息后,AI可以根据模板直接产出整段字。深度AI编辑功能则更类似Copilot,能够在成过程中提供本润、续写扩写、校阅勘误、格转化、灵感激发、降重伪原创等辅助功能。前,AI写作已经成为产类具的标配AI功能。百度库、WPS AI、博思Boardmix等综合类具均将AI写作结合作流。此外,AI助类具也均能满轻量级的常写作场景,例如撰写周报、起草发稿等。许多垂直赛道的产品,例如游戏+AI、营销+AI,甚特定赛道的综合性商,也会基于业务特和数据中台,提供相关的AI写作服务。04A I 应 格 局图:光速写作(左)和WPS AI(右)在Web端的AI写作界30AI图产品多结合了AI抠图、清晰度提
86、升等AI修图功能,站式提供可素材,前2D平图/多视图和3D成模型领域均有代表产品出现。代表产品包括Liblib AI、Meshy、即梦AI、限画、格、神采Prome AI、WHEE和奇域AI等。AI修图在Web端可分为素材处理和批量修图两类。利AI进抠图、提分辨率,进快速预处理素材已经成为业内技巧,代表产品有佐糖、Fotor和AI改图。批量修图在会议跟拍和像摄影中基本成为业标配。代表产品有像素蛋糕、百度盘AI修图、美图云秀。在APP端,画质提升和智能抠图成为主流功能。美图秀秀、醒图、Wink等头部修图产品均已规模深度植AI修图功能。AI相机在Web端和APP端呈现出了明显差异。Web端主要为电
87、商2B的AI商拍,具体包括虚拟模特和虚拟商品图。使者可以将底商品图或台图进上传,产品会根据所需的模特姿势、背景氛围等成可直接使的商品详情图。代表产品包括美间AI创意商拍、Weshop唯象妙境、绘蛙等。APP端以妙鸭相机类2C娱乐向的像摄影产品为代表。6.AI视频直接成视频仍待发受技术进步的影响,字/图直接成视频在技术和创业领域已经成为热,但由于产品落地具有定的滞后性,预计2025年将出现相对破圈的产品。前来看,AI视频产品在Web端可以分为以下种类型:直接基于提词成视频:包括可灵AI、PixVerse、智谱清影、即梦AI、Morph Studio、Video Studio等基于AI的视频编辑软
88、件:包括视频翻译、本剪视频、像智能修图、添加滤镜、画质修复等功能,代表产品有万兴喵影、开拍等04A I 应 格 局图:稿定AI、佐糖、LibLib AI 和超能画布的Web端使界动智能切:通过动成分镜、配图、配等,将视频变为切短视频,主要应在电商和影视领域拼接式视频智能成:由字成视频/图像后拼接为视频,在应上常于AI短剧在APP端则可以分为以下三类:AI相机:持对不同格的视频模版进换脸,包括快剪辑、美趣AI、AI换脸等内嵌有AI功能的视频编辑具:包括剪映、快影、Wink、度加剪辑、Videoleap等套壳类视频产品04A I 应 格 局31图:可灵模型(左)和即梦AI(右)的Web端使界?根据
89、使场景,所有产品可以划分为五类:全使场景、作提效、创意成、休闲娱乐和常活。各使场景对应的产品数量分别为65款、105款、125款、43款和24款,在Web端和APP端的具体分布如下:注:量位智库出品并保有最终解释权。产品统计截2024.10,经筛选后共计166款观测产品?AI APPAI APP?全使场景共32款,23%办公提效共32款,23%休闲娱乐共38款,27%创意成共39款,27%常活共22款,13%.AI智能助、AI Agent、AI笔记等.AI陪伴、AI相机、AI K歌等.AI图、AI视频、AI设计、AI数字等.AI健康、AI教育等.AI写作、AI PPT、AI总结等?AIAI分?
90、分?WebWeb?注:量位智库出品并保有最终解释权。产品统计截2024.10,经筛选后共计230款观测产品全使场景共40款,17%办公提效共89款,39%休闲娱乐,共4款7%创意成共40款,17%AI浏览器、AI智能助、AI Agent、AI搜索等办公类套件、AI写作、AI PPT、AI总结等AI视频、AI图、AI视觉设计、AI乐等.3204A I 应 格 局.331.全使场景重在整体效率提升主要涵盖多功能综合平台、AI智能助和AI Agent。这类具通常度集成,普遍涵盖AI写作、AI总结等功能,能够为特定场景站式解决案。相对于专注单场景的其他产品,这类综合性产品能够实现不同功能和服务的缝对接
91、,更强调跨场景跨平台协同和任务串联带来的整体效率提升。未来演变向可能包含:基于特定任务的主决策能、平台间互通配合、Agent化2.办公提效整体数据表现最优具体包括AI搜索、AI PPT、AI 总结、AI写作、AI图、AI 代码、AI配、AI相机中商业拍摄部分。从数据来看,办公提效类产品整体的数据表现突出,量位智库认为,具体涉及以下原因:效率提升可量化、易平衡价值与服务成本、使场景泛且频,且产品在AI向的可扩展性强,升级空间。未来的发展重点包括:低成本提升输出内容的专业度:提词优化系统、结合垂直领域专家知识、加验证环节现有具与作流集成:提升常具集成度减少学习成本:尽可能做到即插即在五类场景中,由
92、于解决的需求更为明确和迫切,办公提效类具在商业变现、产品数量、功能效果和市场普及上均有更好的表现。以下是针对各使场景的具体分析:04A I 应 格 局Sonnet 3.5和OpenAI o1为代表的新代模型幅提了AI Coding能,在SWE-bench上可以获得50%的得分,预计在1-2年内可以获得90%以上的得分,意味着部分类的编程任务即将可以被AI解决。戴森,真格基管理合伙3.创意成2025年有望显著突破具体包括AI设计、AI图、AI图像编辑、AI视频、AI乐等赛道。随着技术的持续进步,内容成质量有望获得极为显著的提升。可以预,创意成类产品将成为2025年增最快的类产品,其中,AI视频成
93、以及AI设计领域中的3D和精细成潜巨。预计未来的发展重点包括:解决技术瓶颈:成质量与稳定性:质量内容的致性输出,需要对创作过程有细粒度控制创意表达的可控性:难以精确把控创意向训练数据的版权限制:优质训练素材获取受限成结果难以精细调整达到商变现地步解决变现瓶颈,寻求订阅制收费之外的变现式,基于成内容量收费或许是突破思路通过优化UI和作设计,降低学习和迁移成本34预计未来的发展重点包括:情感交互的深度与然度,如情感识别和共鸣能、多模态的情感表达的多样性个性化定制能,了解偏好,进场景感知隐私问题保护内容的丰富性和新鲜性,设计更为丰富和专业的底层机制5.常活多是在原有常软件的基础上通过要素识别和个性化
94、计划制定来提升体验。具体包含AI健康、AI教育、AI运动、AI记等。预估未来健康、运动和教育将成为重点发展赛道,原有相关互联产品,如Keep等,将结合场景经验普遍引AI功能。04A I 应 格 局4.休闲娱乐合规挑战突出指通过提供实时互动类内容和直接可消费内容等,提供情绪价值的产品。在赛道上主要对应2C侧的AI相机和AI陪伴。在产品中强调趣味性、情绪价值和社交属性,对技术上的情感计算能、个性化算法、实时交互性能提出了更要求,同时也对内容态在内的运营有更要求。前存在的问题是产品缺乏本质化差异,同时监管导致内容创作由度有限,易失去新鲜感。?AIAI?AIAI?35为了客观还原国内AI产品的现状,针
95、对筛选出的400款代表性产品,我们从规模、新增速度、活跃和粘性四度进了数据统计,横向对和进步分析。整体来看,APP端和Web端均尚未出现互联时代的破圈级产品,和海外的同类型产品相差距在5倍以上。,国内对模型的监管要求在定程度上限制了产品表现,导致最终使体验不佳。另,国内付费尚未形成闭环。缺乏差异化场景带来的同质化竞争进步降低了付费意愿,限制初创公司投与开发,形成了恶性闭环。?APPAPP?1.规模 2024年1-10累计下载截2024年10,共56款产品的新增下载量超过百万。TOP 100的2024年累计规模槛约27万。共两款产品数据过亿,分别为夸克(接近2.7亿)和包(接近1.4亿)。夸克此
96、前属于浏览器品类,2024年前开始强调的智能搜索功能,2024年中旬开始把AI搜索作为核功能,2024年10正式定位为AI全能智能助,前在AI主打AI搜索、AI写作和AI拍题三功能。在定位上,AI功能已优先于其早先盘+扫描+浏览器的主要业务。根据下载量变化来看,夸克在2023年中期开始下载量有所下降,但从次年3开始下载量有显著增,并在2024年中旬度达到峰值。结合其宣发来看,我们认为AI功能的全深度结合是夸克今年再增的核推动因素。包AI由字节跳动发布,从今年5开始在各指标上持续速增,前已经在AI智能助赛道形成断层式领先,并在9成为国内个下载量过亿的AI原应,是名副其实的国级AI应。共8款产品今
97、年累计新增下载量超过千万。依次为超过5000万的Kimi智能助和百度库。2000万量级的WPSOffice,以及1000万级别的天AI、星野、腾讯档和阿通义。此外,可画Canva的今年新增下载量已接近千万。总体来看,AI能正在全渗透APP端的各类场景和应,字节跳动的APP战略进展顺利。但杀级场景的缺乏依旧是我国AI APP的未解难题,前还没有产品能够拿出全维度的亮眼表现。由于在市场认知、使习惯、场景拓展等有先天优势,AI+X类产品的数据优势明显。AI原应由以包、Kimi智能助、和智谱清为代表的AI智能助领跑,随后为星野、猫箱等AI陪伴产品和包爱学、斑AI学等AI教育产品。曾被寄予厚望的AI陪伴
98、和AI搜索赛道整体不达预期。但由于APP端在使场景(活化的碎化场景)、可数据(机带的GPS数据、摄像头提供的图像数据等)、使时(全天候互动)相对于Web端和PC端有明显优势,我们依旧认为AI APP未来更有可能出现质变性的增。除机外,智能环、智能家居等其他物联设备也有望在AI APP端发挥重作。05A I 应 竞 争36图:夸克和包的APP界规模榜单2.新增 2024年10新增下载共有14款产品下载量超过百万,TOP 10的槛约140万。千万级以上梯队包含3款产品,分别为夸克(超2400万),包(超2200万)和Kimi智能助(超1400万)。百万到千万级梯队包含11款产品,依次为百度库(超5
99、00万),WPS AI(约270万),猫箱、腾讯档、均在140-200万区间,随后数据下滑120万。来美图公司主打AI视频编辑的开拍即将达到百万。值得注意的是,在新增速度超过百万级的14款产品中,来字节跳动的产品就占据了4款,分别是包、猫箱、星绘和包爱学,分别在AI智能助、AI陪伴、AI图和AI教育中成为了新增速度TOP 1。在后三个赛道中,字节跳动的代表产品在发布时间上均不占据先发优势。1夸克夸克综合类套件2包字节跳动AI智能助3Kimi智能助之暗AI智能助4百度库百度综合类套件5WPS OfficeWPS综合类套件6天AI昆仑万维AI智能助7星野MInimaxAI陪伴8百度AI智能助9腾讯
100、档腾讯综合类套件10通义阿巴巴AI智能助11Canva可画咖信息AI设计12X Eva冰公司AI陪伴13讯星科讯AI智能助14智谱清智谱华章AI智能助15斑AI学猿科技AI教育16猫箱字节跳动AI陪伴17天天跳绳微芒科技AI运动18星绘字节跳动AI图19脸猫闻有你科技AI相机20美图证件照美图AI相机?AI APPAI APP2亿1亿5000万2000万1000万700万500万05A I 应 竞 争373.活跃 2024年10DAU仅夸克1款产品平均活超千万,超过2600万。百万级梯队共4款,包括超760万的包AI、超330万的Kimi智能助、超170万的天天跳绳和超130万的。随后数据下跌
101、50万量级,10-50万共包含23款。TOP 10的数据槛约35万。平均活数据在30万以上的产品包括斑AI学、天AI、星野、X Eva、智谱清、有道云笔记、猫箱和阿通义。AI智能助和AI陪伴两个细分品类的头部产品有明显的整体数据优势。整体来看,AI相机的整体数据同样较为突出。活跃榜单1WPS OfficeWPS综合类套件2夸克夸克综合类套件3包字节跳动AI智能助4Kimi智能助之暗AI智能助5天天跳绳微芒科技AI运动6百度AI智能助7百度库百度综合类套件8斑AI学猿科技AI教育9天AI肯仑万维AI智能助10星野MInimaxAI陪伴11X Eva冰公司AI陪伴12智谱清智谱华章AI智能助13有
102、道云笔记易综合类套件14猫箱字节跳动AI陪伴15通义阿巴巴AI智能助16讯星科讯AI智能助17漫画相机Boniu TechAI相机18简单搜索百度AI搜索19腾讯元宝腾讯AI智能助20稿定设计稿定科技AI设计新增速度榜单1夸克夸克综合类套件2包字节跳动AI智能助3Kimi智能助之暗AI智能助4百度库百度综合类套件5WPS OfficeWPS综合类套件6猫箱字节跳动AI陪伴7腾讯档腾讯综合类套件8智谱清智谱华章AI智能助9百度AI智能助10天天跳绳微芒科技AI运动11Canva可画咖信息AI设计12星绘字节跳动AI图13包爱学字节跳动AI教育14星野MInimaxAI陪伴15开拍美图AI视频16
103、即梦AI字节跳动AI图17讯星科讯AI智能助18天AI肯仑万维AI智能助19通义阿巴巴AI智能助20腾讯元宝腾讯AI智能助2000万1000万500万200万100万70万3000万2000万700万300万100万50万30万20万05A I 应 竞 争384.粘性 2024年10三/七留存率第名夸克的三留存率超过40%,七留存率接近30%。第名是起源于AI语记账的AI陪伴产品叨叨,三留存率超过30%,七留存率接近20%。另外有13款产品的三留存率超过20%,包AI和Kimi智能助数据超过25%,其他产品数据差异,具体包括腾讯档、智谱清、包爱学、星野、斑AI学、天AI、腾讯元宝、通义、讯星和
104、猫箱。TOP 100的三留存率数据槛约10%,较不理想。仅35款产品的七新增留存率达到了10%,3款产品的数据约20%。粘性榜单05A I 应 竞 争1夸克夸克综合类套件2叨叨古红蓝AI陪伴3包字节跳动AI智能助4Kimi智能助之暗AI智能助5百度库百度综合类套件6腾讯档腾讯综合类套件7智谱清智谱华章AI智能助8百度AI智能助9包爱学字节跳动AI教育10星野MInimaxAI陪伴11斑AI学猿科技AI教育12天AI肯仑万维AI智能助40%30%25%22%13腾讯元宝腾讯AI智能助14通义阿巴巴AI智能助15讯星科讯AI智能助16猫箱字节跳动AI陪伴17光速写作好课帮助AI写作18天天跳绳微芒
105、科技AI运动19讯听科讯AI总结20Naver PapagoNaver CorpAI翻译20%18%按照Facebook提出的“40-20-10”法则,也即优秀产品需要达到次留存率40%,7留存率20%,30留存率10%来看,前我国AI APP的粘性仍显不。尽管需要结合应所在的具体业去考虑,但前可以看到即便在主打常频次交互的AI智能助、AI陪伴和AI教育领域,距离这标准也有较差异。39?WebWeb?在观察了各赛道头部产品2024年各访问量的变化后,量位智库遗憾地发现,除AI智能助赛道外,其他所有赛道均基本处于停滞状态,在AI搜索、AI写作、AI图等赛道中,甚出现了头部产品数据下滑、或是下滑后
106、仍未恢复峰值的情况,多款明星产品的数据和宣传度严重不符。值得关注的逆增产品包括:三款AI智能助Kimi智能助、包、海螺AI,AI搜索知乎直答、AI设计美图设计室和Pixso AI等产品原型设计产品、AI图/视频产品即梦Dreamina,3D模型成产品Meshy和Tripo AI。1.规模 2024年10总访问量千万级产品总共7款,包括3款多功能套件和4款AI智能助。全球访问量超过千万的Web端AI产品共67款,国内占约10%。定位为AI智能助的夸克总访问量超7000万,该数据平在全球范围内可进TOP 10。全球范围内第名ChatGPT的访问量超过35亿,Bing的访问量超过18亿。第、三名均为
107、办公类产品,分别是约3600万的腾讯档和约2800万的百度库。AI原产品中的第名为Kimi智能助,访问量同样约2800万,前定位为会推理解析,能深度思考的AI助,并推出了有更强复杂问题推理能的探索版本。后续三位同样为AI智能助,依次为,包和通义。总访问量超过百万的共计40款产品,TOP 10的槛约400万。TOP 100的槛约10万。全球AI产品Web端的TOP 100槛约600万,差距6倍。1夸克夸克综合类套件2腾讯档腾讯综合类套件3百度库百度综合类套件4Kimi智能助之暗AI智能助5百度AI智能助6包字节跳动AI智能助7通义阿巴巴AI智能助8Vidu数科技AI视频9秘塔AI搜索秘塔科技AI
108、搜索10海螺AIMInimaxAI智能助11FlowUs AI息流 云上绿洲 综合类套件12TME Studio腾讯AI乐13百度AI助百度AI智能助14有道云笔记易综合类套件15智谱清智谱华章AI智能助16知乎直答知乎AI搜索17AI新媒体章夸克AI写作18PixVerse爱诗科技AI视频19Canva可画咖信息AI设计20苏打办公360集合站?AI WebAI Web?分?分?规模榜单7000万3000万2000万1000万600万400万300万05A I 应 竞 争402.规模 2024年5-10总访问量共计21款产品过去半年总访问量超过千万。4款产品总访问量过亿,包括夸克3.7亿,百
109、度库约1.9亿,Kimi智能助约1.4亿,约1.1亿。超过千万的21款产品中,具体包括9款AI智能助(Kimi、包、通义、智谱清、天、讯星、百度AI助、海螺AI),4款多功能套件(夸克、百度库、腾讯档、Notion),2款AI搜索(秘塔搜索和知乎直答)。3.活跃 2024年10独访客数独访客数即当访问该站的数量,可视作该站当的MAU,于衡量产品的活跃程度。共三款产品的独访客数超过千万,分别是夸克、Notion和百度库。全球共计26款产品活超过千万,中国占约11%,活跃表现略逊于规模。夸克独访客数超2500万,Notion超1800万,百度库则超过1300万。总共19款产品的独访客数超过百万。其
110、中包括6款综合类套件,6款智能助和2款AI搜索占据和第9位和第11位。另外还有Pixverse、新媒体章、即时设计、可画Canva。TOP 100的数据槛是230万,全球AI产品TOP 100的数据槛超200万。根据使场景来看,创意成类产品的整体排位都较靠后。全使场景、作提效和娱乐场景则表现更优。4.粘性 平均访问次数共14款产品均每访问超过5次,第名是新代思维导图树图treemind,单访问超过8次。AI智能助阿通义和成原型图的摹客Mockplus数据超过7次。TOP 10基本为AI智能助和AI产品设计,TOP 50约均访问3次。1夸克夸克综合类套件2NotionNotion综合类套件3百度
111、库百度综合类套件4腾讯档腾讯综合类套件5Kimi智能助之暗AI智能助6百度AI智能助7包字节跳动AI智能助8TME Studio腾讯AI乐9Vidu数科技AI视频10知乎直答知乎AI搜索11百度AI助百度AI智能助12秘塔AI搜索秘塔科技AI搜索13PixVerse爱诗科技AI视频14海螺AIMInimaxAI智能助15FlowUs AI息流云上绿洲综合类套件16通义阿巴巴AI智能助17AI新媒体章夸克AI写作18Canva可画咖信息AI设计19有道云笔记易综合类套件20苏打办公360集合站活跃榜单2500万1500万1000万500万350万200万150万100万05A I 应 竞 争41
112、5.使深度单次使时13款产品平均访问时超过10分钟,AI图占据重较。前两名都和营销相关,平均访问时约20分种。第名可成商品图的绘AI平均访问时查过20分钟,第名AIGC营销平台绘蛙可以提供商品图和种草图。AI图中包括绘AI、WHEE(WHEE-专业设计师都在的AI图具)、悠船(企业级图桌具)、LibLib AI 和图怪兽。粘性榜单1Treemind树图 聚塔络AI图2通义阿巴巴AI智能助3摹客MockplusAI设计4莫设计创作美好AI设计5创脑词遇络AI智能助6DeepSeekDeepSeekAI智能助7Kimi智能助之暗AI智能助8墨AI万兴科技AI设计9百度作家平台百度AI写作10Fel
113、o.aiFeloAI搜索11腾讯档腾讯综合类套件12腾讯元宝腾讯AI智能助13百度AI智能助14字游侠铭锦轩科技AI写作15同花顺问财同花顺AI智能助16智谱清智谱华章AI智能助17devv.ai深宇识职能AI搜索18天AI肯仑万维AI智能助19GensparkMainfunkAI搜索20奇域AI红书AI图8次7次6次5次4.5次使深度榜单1绘AI绘科技AI图2绘蛙腾讯综合类套件35118 SEO写作百度综合类套件4百宝箱蚂蚁集团AI Agent5创脑词遇络AI智能助6WHEE美图AI图7通义星阿巴巴AI陪伴8莫设计创作美好AI设计9LibLib AI奇点星宇AI图10图怪兽遇图络AI设计11
114、摹客MockplusAI设计12度加创作具百度AI视频13NotionNotion综合类套件14扣Coze字节跳动AI Agent15GhostCut招鲤科技AI视频16Motiff妙多猿辅导AI设计17象寄AI象寄科技AI图像编辑18字游侠铭锦轩科技AI写作19BetterYeah斑头雁科技AI Agent20云界AI互联AI图20分钟18分钟15分钟13分钟10分钟9分钟8分钟05A I 应 竞 争42?AI 100AI 100AI 100是量位智库推出的AI产品和应流向标集合,旨在结合产品功能、落地数据、体验和未来潜,提供AI技术驱动下,产品创新和变的第三参考。量位智库将AI 100分为
115、综合类和原类,前者同时包含“AI+X”和“AI原”两类AI产品,旨在给出完整综合的产品能描述,后者则专注于AI原类应。AI 100的评测体系,涵盖了成能、变落地、体验、市场表现四级指标,包括超20个级指标,全涵盖了技术、商业等产品评价维度,同时包含不同区间的下载总量、新增下载、活跃数、留存率等定量数据,以及评价、底层技术、功能评测等定性评分,以真实数据为基础,结合体验和市场前景,全客观评估AI产品实。1.综合AI 100Web端产品TOP 100的总访问量槛约10万,MAU槛约8万,平均访问时不到2分钟,平均访问次数不到2次。APP端产品TOP 100新增下载槛约5万,活8000,三留存率不到
116、15%。综合AI 100的功能和场景分布分别如下图。按照产品性质分类,则包括71个AI原产品和29个AI+X产品。但AI+X产品整体的数据表现更加突出。?AI 100AI 100?AI 100AI 100?2.原AI 100原AI 100的不同功能占和综合AI 100出现了明显差异。AI智能助,AI搜索和AI陪伴是三个领跑赛道,分别有14款、6款和10款产品围,后两者的数据表现较为般。多功能套件和AI设计的产品数量锐减,证明这两个赛道前仍主要依托AI+X产品进落地。?AI 100AI 100?AI 100AI 100?05A I 应 竞 争43AI Agent扣Coze百度AgentBuild
117、erAI 陪伴猫箱星野X Eva筑梦岛冒泡鸭我在AIWoW叨叨AI 设计标智客AI LogoCanva可画摹客美图设计室墨AI稿定AIMasterGO AI 莫设计Pixso AI堆友D.DesignAI 智能助智谱清天AI腾讯元宝同花顺问财DeepSeek跃问百应海螺AI包Kimi智能助讯星阿通义宝AI 图格LilibAIMeshy即梦AITRIPO吐司AI绘画神采PromeAIWHEE奇域AIAI PPTAiPPTAI 教育包爱学斑AI学海豚AI学AI 视频开拍度加创作具闪剪快剪辑ViduPixVerse万兴喵影可灵AIMorphStudioAI 写作AI 修图AI 乐/效AI新媒体章光速
118、写作笔灵AI新华妙笔AI公写作你我当年AI照修复佐糖FotorAI乐学园给TME StudioAI 翻译AI 开发平台DifyNaver Papago-AI 翻译有道AI翻译AI 总结AI 运动天天跳绳讯听Readpaper包阅AI代码成包MarsCodeCodeGeeXAI 搜索知乎直答GenSparkFelo.aidevv.ai秘塔AI搜索AI 图ProcessOn亿图脑图AITreemind树图GitMind思乎多功能套件夸克百度库WPS Office腾讯档FlowUs AI 息流360AI浏览器博思板Boardmix橙篇讯智悟空AI 相机星绘超能画布 脸猫脸趣剪同款Faceplay秀脸
119、妙鸭相机?AI 100AI 10020242024?100100?AIGCAIGC分?分?05A I 应 竞 争44?AI 100AI 10020242024?100100?AIGCAIGC分?分?AI 翻译有道翻译彩云译AI Agent扣Coze百度AgentBuilder腾讯元器百宝箱AI PPTAiPPT博思AIPPTChatPPTAI 设计Dify堆友D.DesignAI 陪伴AI 图Tripo格吐司AI绘画神采PromeAI星绘Meshy即梦AI漫画相机LilibAIWHEE奇域AIAI 相机剪同款超能画布 脸猫脸趣Faceplay秀脸妙鸭相机绘蛙美影AI 视频Vidu可灵AI开拍M
120、orph Studio快剪辑PixVerse梦闪剪SkyreelsAI 搜索知乎直答GenSparkFelo.aidevv.ai秘塔AI搜索开搜AIAI 教育包爱学海豚AI学TalkAI练语智能语师AI 乐/效TME Studio给快歌易天魔坊AI 修图你我当年AI照修复佐糖像素蛋糕AI 智能助包DeepSeekKimi智能助同花顺问财智谱清跃问百应讯星海螺AI天AI宝阿通义万知腾讯元宝彩云梦AI 总结Readpaper包阅AIBibiGPT代码成包MarsCodeCodeGeeX快码多功能套件橙篇讯智悟空其他Lovekey键盘AI 写作AI新媒体章新华妙笔AI公写作笔灵AI腾讯涌effdit
121、写作讯写作05A I 应 竞 争冒泡鸭我在AI猫箱WoW星野叨叨X Eva逗逗游戏伙伴筑梦岛预塔塔ChatBird?AIAI?AI+XAI+X?AIAI?45按照产品属性,量位智库将AI产品划分为以AI为底层设计逻辑的AI原类产品、在原有互联产品上深度嵌AI功能的AI+X产品、基于外接API微创新的套壳类产品和将多个产品/模型API集中拼凑的集合站类产品。在AI+X产品中,AI体现为在已有产品上叠加AIGC能,在业务和变现上都不以AIGC为核,AIGC于优化核体验。前,各类的头部互联产品均在向该向靠拢,依靠成式AI进步提升的基础与价值。从数据来看,由于和业务流程融合的更为紧密、需求识别明确等原