
百度 AI,要靠 Killer App 赚钱

24Q1 财报会议上,百度集团透露了公司 AI 业务的最新进展。
本文作者:张逸凡
编辑:申思琦
来源:硬 AI
百度,一家在 PC 时代崭露头角的科技巨头,面临了在移动互联网时代的挑战和竞争,似乎未能完全抓住时代的机遇,相比于其他科技公司在这一阶段的快速发展,百度显得有些落后。
随着时间进入人工智能(AI)时代,百度希望能够借此机会弥补过去在移动互联网时代的失地,重新确立自己在技术领域的领导地位。
在刚刚结束的百度最新财报会上,公司透露了 AI 业务的最新进展:
• AI 云服务营收同比增长 12%;
• 百度搜索 11% 内容由 AI 生成;
• 大模型 API 调用量激增:近五个月,从 5000 万增长至 2 亿;
• AI 模型性能大幅优化:训练效率提高到 5.1 倍,推理成本降低到百分之一;
百度董事长兼首席执行官李彦宏在电话会中表示,公司正在从以互联网为中心转向人工智能优先,推进用文心大模型重构 To C 和 To B 业务。目前,文心大模型日均处理 Tokens 文本约 2500 亿,日均调用量 2 亿次。
李彦宏特别强调:搜索最有可能成为 AI 时代的 “杀手级” 应用(killer app),而百度搜索的 AI 重构工作仍处于早期阶段。
此外,百度 CFO 罗戎称,在未来几个季度,百度将继续支持 AI 业务高质量增长。公司认为,随着中国生成式 AI 的新时代展开,将为百度带来更多机遇。
一、“All in AI” —— 百度的新机遇?
为了实现李彦宏 “以互联网为中心转向人工智能优先” 这一目标,百度正大力投资于 AI 技术的研发和应用,特别是在自动驾驶、深度学习、自然语言处理等领域。
百度正试图抢回在移动互联网时代失去的阵地。
• PC 时代,凭借着独特的搜索引擎技术,百度成为了国内的搜索龙头;
• 移动互联网时代,用户流量从 PC 端转移到移动端,公司虽多方位布局,但相较于腾讯/阿里仍显逊色;
• 在推荐算法时代,又大幅落后于字节信息去中心化模式;
• 迈入 AI 时代,百度基于其在 AI 领域拥有的深厚积累,希望能够在此浪潮中突围;
AI 效果在财报中已逐渐突出,今年一季度智能云业务的收入达到 47 亿元,同比增长 12%,来自生成式人工智能和基础模型的收入占智能云业务收入的 6.9%。
二、AI 云服务,从芯片到平台
2016 年,百度 CEO 李彦宏提出 “AI+ 云 + 大数据” 的云服务战略。
此后,百度智能云构建了 “芯片—框架—模型—MaaS 平台” 的全栈式 AI 基础设施,这一基础设施支持从数据存储到模型训练、部署、运行的全链路 AI 服务。
值得一提的是,百度飞桨平台已经兼容了 50 多种不同芯片,许多是本土设计的,开发者社区已经增长至 1300 万。
这种 AI 基础设施布局模式,也让百度在受制外部环境情况下,更好的匹配国内 AI 云需求。李彦宏认为,这种模式使得百度能够将不太先进的芯片用于高度有效的模型训练和推理。
李彦宏在电话会中称,百度把来自不同供应商的 GPU 集成到统一的计算集群中,以训练大语言模型,“我们的平台在 GPU 集群上展示了非常高的效率,该集群由成百上千的 GPU 组成,这是在进口 GPU 受到限制的背景下取得的重要突破。”
1)自主研发芯片
公司自主研发了 AI 芯片(昆仑)和语音交互芯片(鸿鹄),用于优化语音、自然语言处理、图像等 AI 技术,并支持公司的深度学习框架。
芯片最新进展:
• AI 芯片:迭代到昆仑 2,相比昆仑 1 代性能提升了 2-3 倍,提供 128TFLOPS 算力,内存带宽 512GB/s;
• 语音交互芯片:迭代到鸿鹄 900,较上一代鸿鹄 818 芯片,CPU 性能提升 200%,GPU 提升 160%,搭载于华为智慧屏 V5 Pro;
2)深度学习框架 —— Paddle Paddle
Paddle Paddle 是百度基于 BERT 自研的深度学习框架,集成了深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件。
该框架服务企业遍布能源、金融、工业、医疗、农业等多个行业。例如,连心医疗基于 PaddlePaddle 平台开发的 “基于 CT 影像的肺炎筛查与病情预评估 AI 系统” 已在湖南郴州湘南学院附属医院投入使用。
Paddle Paddle 采用了开源的形式,方便百度更好的建立自己的 AI 生态圈。
根据公司披露的信息:
• 截至 2024 年 4 月中旬,PaddlePaddle 开发者社区已经拥有了 1300 万名成员;
• 截至 2023 年底, PaddlePaddle 为 23.5 万家企业提供服务,开发社区已经创建了 86 万个模型;
此外,数据显示,Paddle Paddle 在 Github 使用人数、贡献者人数和技术迭代速度上,仅次于海外一线平台 Pytorch 和 TensorFlow。
3)AI 大模型 —— 文心系列模型(Ernie)
基于强大的基础模型(Paddle Paddle),百度研发了文心系列模型 Ernie(有趣小故事:文心一言的英文名为 “Ernie”, 源于美国儿童节目《芝麻街》中的角色的名字,而节目中 Ernie 的好朋友正是 Bert,Bert 是谷歌 2018 年发布的 AI 模型)。
目前迭代至文心 4.0,参数规模可能超 1 万亿,约为文心 3.5 的 4-5 倍。
根据公司披露,截至今年 4 月,文心模型每天处理的 API 调用约为 2 亿次,远超去年 12 月的约 5000 万次调用,表明百度文心模型正被越来越多的人所采用,并预示着未来模型推理具备强劲的收入潜力。
此外,为了让模型更具性价比,公司通过独有的四层人工智能架构和强大的端到端优化能力,不断提高模型的效率。与 3 月 23 日的版本相比,文心模型的训练效率提高到 5.1 倍,推理成本降低到百分之一。
4)MaaS(AI 开发云平台)
为了让开发者更简单的开发 AI 模型,百度在云平台上提供了三套工具:
• AppBuilder 和 ModelBuilder:供企业和个人开发者开发应用程序和搭建模型;
• AgentBuilder:可以轻松创建一个 AI Agent;
盈利方面,百度从 2022 开始将业务重点放在提升 AI 智能云业务的利润率上,废除了低质量业务,同时致力于为不同行业的客户定制标准化 AI 解决方案。
24Q1 的业绩会上,公司表示,智能云收入增长主要由生成式 AI 和模型训练驱动。目前,大部分收入来自模型训练,但来自模型推理的收入增长很快。
展望未来,百度认为模型推理是最重要的长期机遇之一,也是未来人工智能云收入的主要增长动力。
三、“AI+” 业务赋能
AI 技术在百度内部广泛应用于搜索引擎、信息流推荐、百度翻译等多个领域。在电话会中,李彦宏对未来 AI 赋能搜索支柱业务信心更足,认为搜索是 AI 时代最可能成为杀手级应用的产品:“AI 搜索能使用户能够做到以前做不到的事,并且百度暂时还没打算对这部分收费。”
去年第二季度开始,百度就已经使用文心一言重建百度搜索,现在越来越多的搜索结果是文心一言以不同格式如文本、图像、第三方链接等组合而成的。
在模型构建上,百度使用了 3 种轻质模型和 2 种针对特定任务的模型,并且搭配专家混合模型,用来给大模型分配任务,在性能和成本上找到了更好的平衡。
从数据上看,AI 确实正在提升百度各个业务的效率:
1)AI+ 百度搜索:截至 24Q1,百度搜索有 11% 的内容由 AI 生成,同时,AI 搜索推动了广告收入的增长;
2)AI+ 百度文库:通过引入生成式 AI 功能,吸引了 18% 的新付费用户。这些功能包括内容总结、创作、扩展以及将灵感一键转化为 Powerpoint 等。24Q1 百度文库付费用户数量实现了两位数的同比增长。
3)AI+ 百度地图:引入了 “AI 向导” 功能,在理解用户需求的基础上,智能调用众多地图功能及服务,快捷准确地给出解决方案;
4)AI+ 百度网盘:推出了基于文心大模型的智能助理 “云一朵”,帮助用户实现一句话快速搜索文件和视频、总结知识、翻译文档、甚至进行内容创作的功能。 截至 23Q3“云一朵” 的用户已达到 2000 万。
四、终端厂商合作 AI 手机/AI PC
AI 除了对内提升效率,本季度百度也进一步扩大了对外合作。
根据公司披露,上季度,公司已与三星中国、荣耀等手机厂商达成合作。本季度,合作扩展到更多领先智能手机厂商,包括 Oppo、VIVO 和小米。
业务范围也从智能手机扩展到 PC 和电动汽车领域,进一步扩大了百度的 AI 生态圈。联想正利用 Ernie API 为其默认浏览器中的 AI 助手提供支持,蔚来汽车开始使用 Ernie API 增强车内体验。
此外,公司吸引了许多新客户,包括携程、高途、招聘、作业帮和新加坡旅游局,通过 AI 技术,帮助他们重构所有面向消费者的产品,以提供更好的用户体验。
五、对外投资
除了自主研发,百度也通过对外投资来不断扩展自家的 AI 生态,覆盖了芯片 - 模型 - 模型应用三大环节。但很明显,与阿里不同,百度的对外投资更偏向于上下两端。
这个原因也不难理解,因为百度未来将依靠搜索这类应用端支撑收入,完成商业模式闭环的。
最有代表性的一个证明来自李彦宏对大模型开源还是闭源的判断:“大模型开源意义不大,闭源才能走通商业模式,是能够赚到钱的,能够赚到钱才能聚集算力、聚集人才。”
“闭源在成本上反而是有优势的,只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定更快”,这也是与阿里云不同的商业模式的思考。
所以,按照百度的思路,未来的路已经比较清晰,但 AI 时代的竞争显然会比 PC 时代更加激烈。
