SemiAnalysis CEO:模型 “近兩年最大能力躍遷”,供應鏈 “極度短缺”,民憤正在積累

華爾街見聞
2026.04.24 08:57

Patel 指出,Anthropic 新模型 Mythos 實現” 近兩年最大能力躍遷”,僅兩個月從 L4 跨越至 L6 工程師水平,” 執行成本極度廉價”。需求爆炸導致供應鏈全線告急:DRAM 價格或翻 2 至 3 倍,台積電 2028 年資本支出或達千億美元,CPU 嚴重短缺。在技術的狂飆突進和資本的瘋狂盛宴之外,美國社會公眾牴觸情緒正成為不可忽視的宏觀變量。

AI模型迎来“近两年最大能力跃迁”,供应链全线告急,美国民愤情绪一触即发——这是SemiAnalysis创始人Dylan Patel在最新访谈中给出了对当下AI革命最直白、最辛辣的判断。

4月23日,知名半导体及AI行业研究机构SemiAnalysis首席执行官(CEO)Dylan Patel在一场深度访谈中,详细拆解了当前AI行业的供需动态、代际技术突破以及潜在的社会宏观影响。

Patel的公司SemiAnalysis是华尔街和科技投资圈高度关注的AI基础设施独立研究机构,其客户覆盖顶级对冲基金和科技企业。他在访谈中以自身公司的AI使用数据为切入口,引出了对整个AI产业供需格局的深度研判。

他透露,SemiAnalysis去年的AI支出仅为数万美元,但由于员工(甚至是非技术人员)开始疯狂使用Claude等AI工具进行代码编写和数据分析,今年的年化Token支出已经飙升至700万美元。

他指出,Anthropic等头部机构的新模型实现了“近两年最大能力跃迁”,仅用两月便从L4跨越至L6级工程师水平,让“执行变得极其廉价”。然而,这也导致硬件供应链面临“极度短缺”,DRAM价格或将翻两至三倍,台积电2028年资本支出有望触及千亿美元。

值得警惕的是,随着技术向经济系统渗透,底层失业焦虑加剧,预计三个月内美国或爆发针对AI的大规模抗议,公众抵触情绪正成为不可忽视的宏观变量。

模型“近两年最大能力跃迁”

驱动这场Token消耗狂潮的核心,是前沿模型能力的爆炸式增长。

在访谈中,Patel特别提到了Anthropic未公开发布的神秘新模型(代号Mythos)以及最新版的Opus。他指出,随着Scaling Laws(缩放定律)的持续生效,模型的迭代速度正在从过去的六个月大幅压缩至两个月。

“Mythos可能是近两年来模型能力的最大跨越。”Patel强调,“Anthropic最初的目标是在2025年底前让模型达到L4级软件工程师的水平,他们在Opus 4.6上基本实现了这一点。但如果你看Mythos的基准测试,它已经达到了L6级工程师(资深专家)的水平。从L4到L6,他们仅仅用了两个月。”

这种能力的跃迁正在从根本上改变商业世界的运行逻辑。过去,市场的法则是“想法很廉价,执行极其困难”;但在新一代模型的加持下,这一逻辑被彻底重写:

“现在想法廉价且丰富,而执行变得非常容易。因此,只有真正好的想法,才能证明在极其廉价的执行上花费资金是合理的。”

Mythos的出现还验证了一个关键命题:Scaling Laws仍然有效。Patel明确表示,Mythos是一个"materially larger model"(明显更大规模的模型),训练规模等效于10万块Blackwell芯片,且"所有迹象都表明,往模型里砸更多算力,模型就会变得更强"的趋势线依然成立。

供应链“极度短缺”

极端的模型算力需求直接导致了物理世界供应链的全面告急。

Patel指出,尽管云服务商和芯片制造商正在疯狂扩产,但供给侧几乎在每一个节点上都处于“极度短缺”状态,且全产业链的利润率正在不可逆转地扩张。

“随着需求飙升,供应端所有东西的价格都在上涨。”他打破了市场关于GPU使用寿命较短的固有认知:“有人认为GPU的使用寿命不到5年,这完全是胡说八道。现在有3到4年机龄的Hopper集群正在续签未来三四年的合同。有效寿命显然不是5年,甚至可能是7到8年。”

在更广泛的半导体供应链中,短缺现象同样令人咋舌。Patel重点提示了存储芯片和晶圆代工环节的惊人预期:

  • 首先是存储芯片:“真正的增量供应(incremental supply)在2028年之前都不会到来。DRAM的价格将从现在起翻倍甚至翻三倍,因为他们必须通过更高的定价来摧毁部分需求(demand destruction),资本主义经济不搞配给制。”

  • 其次是代工与设备:“人们没有关注到台积电未来的资本支出。到了2028年,台积电的资本支出可能会达到1000亿美元。人们觉得这很疯狂,但这绝对是一个真实的可能性。”

此外,Patel特别强调了两个容易被忽视的瓶颈:

CPU:被严重低估。原因有二:一是强化学习(RL)训练环境完全运行在CPU上,而非GPU;二是AI生成的代码和内容最终都要部署到基于CPU的服务器上运行。"CPU完全售罄,需求在暴增。"

PCB铜箔、玻璃纤维、激光器等小众上游材料:同样供应极度紧张,订单预付款现象普遍,即便毛利率未必大涨,投入资本回报率(ROIC)正在显著提升。

Patel的整体判断是:"经济价值最好的模型所能创造的价值,正在以比我们实际供应Token能力更快的速度增长。这个缺口会持续扩大,模型厂商的利润率会持续扩张,直到硬件供应链里的人也开始说,'等等,为什么我们不把自己的利润也拉上去'。"

美国民愤情绪正在积累

在技术的狂飙突进和资本的疯狂盛宴之外,Patel对AI引发的美国社会情绪发出了极其严厉的预警。

他指出,随着企业利用AI大幅提高效率并可能随之裁员,美国普通大众对AI的敌意正在迅速逼近临界点。

“我认为三个月内,就会出现针对大模型公司的大规模抗议活动。”Patel在访谈中直言不讳。他列举了近期的极端事件:

“Sam Altman的房子在两周内两次被人投掷燃烧 瓶,而新闻评论区里人们竟然在欢呼,这仅仅是个开始。AI现在比政客还要不受欢迎。”

他将这种公众愤怒部分归咎于美国AI公司高管的公关策略失误。他认为,美国头部AI公司的掌舵者(如Sam Altman和Dario Amodei)在面向公众时缺乏魅力,且过于热衷于谈论AI将如何“改变整个世界”和“自动化所有工作”。

“他们需要停止不断谈论未来的能力将如何改变世界,因为普通人与此毫无联系,这只会让他们对这种能力感到恐惧。他们必须开始展示AI能带来的令人振奋的现实用例。”

访谈文字实录译文(由AI辅助翻译)

注:Dylan Patel,半导体研究机构SemiAnalysis首席执行官

主持人Patrick O'Shaughnessy,风险投资公司Positive Sum首席执行官

Dylan Patel:

过去,执行非常重要,因为执行非常困难,而想法则很廉价。现在想法既廉价又充裕,但执行变得非常容易。所以真正重要的,只有那些好想法,才是能够证明在超级廉价的执行上花费是值得的。

主持人:

你跟我讲过一个令人难以置信的故事,关于你自己团队对token的使用今年发生了多么巨大的变化。是的,零售,讲讲那个故事,以及它在教你关于这个世界正在发生什么。

Dylan Patel:

去年,我们以为自己是AI的重度用户。每个人都在用ChatGPT,每个人都在用Claude,每个人都有,你知道,我为公司里任何人提供他们想要的订阅,花费大概在几万美元的量级。今年,花费就直线飙升了。这真的是从去年十二月底Opus推出开始的,其中包括Doug,他是总裁,Douglas。他非常像是在领头冲锋,意义在于像他这样的非技术人员在用AI写代码。所以他基本上慢慢地把整个公司都带进来了。我认为他一直是这方面的领头人。显然,工程师们无论如何都在用,但一月份的花费就开始拐点向上,然后不断飙升、飙升、飙升、飙升。我们签了,你知道,与Anthropic的企业合同,现在已经到了这个地步——我想我上次和你说的时候,花费是500万,对吧?现在实际上是700万的花费。

主持人:

那是上周的事,顺便说一句。

Dylan Patel:

其中很大一部分就是使用量,对吧?真正的情况是,你知道,那些以前从未写过代码的人,现在在用Claude Code,有时一天花几千美元,遍布整个公司。我们现在每年在Claude Code上花700万美元。按照目前的速度,而我们的薪资支出大约在2500万美元左右。所以,你知道,我们在Claude Code上的花费占薪资的比例超过了25%。如果这个轨迹持续下去,那么,你知道,到今年年底,我们在Claude Code上的花费将超过薪资总额的100%,这有点令人恐惧。

Dylan Patel:

幸运的是,我不必在人和AI之间做选择,因为我们公司增长非常快。情况更像是,好吧,我不需要那么快地招人,我可以在AI上花更多钱,而且它确实有效,我们只是增长得更快了。但我认为其他人将开始面对这样一个现实:如果这个人能用Claude Code完成五到十到十五个人的工作,那么突然之间,我或许应该裁员了。

Dylan Patel:

但就目前而言,我认为使用场景非常广泛。举个例子,我们在俄勒冈州有一个逆向工程实验室,我们已经建了一年半了。我们有一堆,你知道,高级显微镜、扫描电子显微镜。这整个实验室的目的是对芯片进行逆向工程。你从中提取架构,获取他们用于制造的材料。这是我们出售的一些数据。分析这些数据是一个非常缓慢的过程。然而,团队里的一个人,他用几千美元的Claude token,就能够创建这个应用程序——它是GPU加速的,运行在我们在Core Weave的一台服务器上。每当我们发给它一张图像,它就能拍下芯片的照片,并叠加标注出每一种材料在哪里。哦,这部分是铜。哦,栅极的这部分是钽。栅极的这部分是锗。栅极的这部分是钴。这样你就可以非常快速地对芯片的整个堆叠结构进行有限元分析。带有仪表盘图形界面,可视化。一切都有了。就花了几千美元的token。

Dylan Patel:

这个人之前在英特尔工作过,他说那曾经是整个团队的工作,负责构建和维护那个系统。现在把这个乘以整个公司的规模。太疯狂了。

Dylan Patel:

另一个我认为非常有趣的例子是Malcolm。他之前是一家大型银行的经济学家。那家银行的经济学家部门大概有一两百人。他构建的东西是有史以来最令人难以置信的。他把各种不同的数据都接入进来,你知道,Fred数据以及所有其他数据,对不起,就业报告以及来自各种API的其他数据。我们与一些机构签了几份合同,获得API来访问数据,把所有数据都整合进来,开始跑回归,开始研究各种经济变革从通缩、通胀角度对经济的影响。美国劳工统计局,整个劳工统计局有整整一套大约2000个任务的清单。所以他用AI对这些任务进行了分析——哪些可以由AI完成,哪些不能,并按照一个评分标准对它们进行评级,你知道,大约3%的任务现在可以由AI完成。所以他创建了这样一个指标,你可以用它来衡量哪些事情可以由AI完成,以及能够用AI完成这些事情的巨大通缩效应是什么——也就是说,产出可以上升。他把它叫做"幽灵GDP"。幽灵GDP。产出可以上升,但因为成本下降得如此之多,理论上GDP实际上会萎缩。所以他创建了这整套分析,以及一个全新的语言模型基准测试——不是跨2000封不同的电子邮件,而是……对吧?

主持人:

这全都是他一个人做的?

Dylan Patel:

这全都是他一个人做的。他说,兄弟,这本来需要一个200人的经济学家团队花一年时间来完成。他就像是,他完全沉迷于Claude了。他说,一切都变了。

主持人:

作为一个企业主,你如何看待从接近零到25%、并加速向某个百分比迈进的这个过程——占总支出的比例?我明白。到什么程度你会说,好吧,我需要踩刹车,谨慎考虑我们的花费。也许我们不需要花在最贵的——今天刚发布的Opus 4.7上。也许我可以退回到一个稍微便宜一点的版本。

Dylan Patel:

归根结底,我是做信息行业的,对吧?就是,你知道,我们出售分析,做咨询,创建数据集。我不明白为什么这不会在相当快的速度上被完全商品化。如果我不能持续改进我最初作为数据集出售的核心产品,那就会发生这种情况。实际上,确实是这样,你知道,现在有更多的人在尝试做同样的事情。我们让它不断变得更好、更详细。因此,它仍然有市场。但我们在2023年做事的方式与现在其他人做的方式并没有太大不同。如果我不提高标准,我就会被商品化。如果我移动得不够快,我也会失去优势。所以问题是,是的,AI会将事物商品化,就像它将软件商品化一样。那些能够快速行动、保住客户、持续提供出色服务并持续改进的人,业务不会萎缩,反而会增长得更快。那些固守现状、什么都不做的老牌企业,将会失败。所以这有点像生死存亡的问题——如果我不采用AI,别人会,而他们将会打败我。

Dylan Patel:

另一个简单的例子是能源领域。所以我们有几位能源分析师,大概一年了,我们一直在尝试建立这个能源模型。这非常复杂。能源数据服务市场大概有9亿美元的规模。所以显然是一个我试图打入的巨大市场。但是,你知道,尽管团队里有多人花了一年时间,我们真的没能打入能源数据服务业务。然后"Claude Code狂热症"击中了半导体分析公司负责数据中心、能源和工业业务的Jeremy。突然之间,在三周内,他花了很多。他每天花大约6000美元。这是一个疯狂的数字。但他抓取了美国每一座发电厂、每一条超过特定电压的输电线路,并创建了对整个美国电网的完整映射,以及大量需求来源,所有数据都来自各种公开数据源。我们展示了它,它有一个仪表盘,你可以查看和检查。你可以看到美国所有微区域的电力短缺和盈余,以及所有这些细节。

Dylan Patel:

在几周内就建成了。我们开始向一些购买我们数据中心数据集的客户展示,但也向一些能源交易员展示,他们看到后说,哇,这花了你多长时间?这真的很好。这比XYZ公司的产品还要好。然后我们深入挖掘。XYZ公司有100个人,已经在这上面工作了十年。显然,我们的产品没有那么完善、那么健壮,但在某些方面它确实更好。我要去商品化这些能源服务公司、数据服务公司——谁又会来商品化我,如果我移动得不够快的话?所以从企业主的角度来看,问题是,是的,我花了很多,但这些花费给我带来了什么?它带来了更多收入吗?

主持人:

你是否担心,在极端情况下,那些掌控资本、投资资本的人——他们通常雇用你来做你所做的事情——会说,好吧,我们也有分析师,他们对这方面非常了解。就像,我们自己来建这个。就像,如果它变得那么容易,到什么程度它就会全部被吸纳进那些投资公司——他们因为在数据或洞见上拥有最大的杠杆而最能从中获益。

Dylan Patel:

首先,任何信息服务业务,显然,我从信息中产生的价值远不如我的客户从这些信息中产生的价值。因为如果我以1美元的价格卖给你信息,你之所以愿意花1美元购买,是因为你知道这些信息能帮助你做出决策,让你赚到超过1美元的收益。因此,你有,你有套利空间,你从这些信息中赚到的钱比我从信息本身赚到的更多。

Dylan Patel:

投资基金,这些投资基金都有自己的信息服务,你知道,尤其是像那些超级顶级的,比如Jane Street和Citadel。他们对自己的数据非常精细。然而,这类机构也从我们这里购买数据,并且持续这样做,持续与我们共同成长,因为我认为就是有某种难以言说的特质,对吧?我们行动更快,我们更灵活,我们是一个专注于某一特定领域的小团队。AI基础设施,以及它带来的巨大变革,还有AI和tokenomics以及所有这些事情。我们真的看到了它的走向。所以我们行动更快,建设更快。

Dylan Patel:

我认为投资专业人士只会,你知道,是的,他们会尝试自己建一些我们做的东西,但更有可能的是,他们只会直接从我们这里购买数据。对他们来说,从我们这里购买数据,然后在此基础上构建,比自己从头开始建要便宜。但最终,有些人可能会尝试自己建。

主持人:

我感觉每次和你谈话,我一直在深入探讨的就是token的供需关系。这是我现在觉得世界上最有趣的事情。这段经历教会了你关于需求方面什么?它是否改变了你对这个等式需求侧的看法,只是直观地感受到了它本身?

Dylan Patel:

如果我们退后一步,从宏观角度来看,对吧?Anthropic已经从9亿美元的年经常性收入增长到了什么,他们现在大概在350亿到400亿,等这期节目播出时可能到400亿到450亿的年经常性收入了。他们的算力并没有增长到同等程度。如果你做计算,并假设他们没有削减研发算力——他们显然没有削减,他们发布了Mythos,他们有Opus 4.7,所以他们显然没有削减研究算力支出。所以最终,他们所做的是,即使你假设他们获得的所有增量算力都用于了推理,他们的毛利率也已经超过了72%的底线。实际上,他们获得的一些增量算力可能用于了研发。毛利率可能高于72%。需要说清楚的是,在年初,有人泄露了——是他们的某个融资方,他们的部分融资相关信息被泄露了。某人泄露了,大概30几个百分点的毛利率。这样一家企业,在哪里能实现这样的利润率增长?原理就在这里,对吧?他们的需求如此之高,他们能够削减使用限制、速率限制,所有这些东西。真正重要的是拥有一个Anthropic客户代表,与他们签订企业合同,并获得你所需要的速率限制提升,因为否则token最终是极度供不应求的,谁能付得起钱,谁就能得到。

Dylan Patel:

Anthropic也面临同样的问题,对吧?我的意思是,不是问题,这只是资本主义运作方式的现实。是的。人们在向他们发送价值400亿美元年经常性收入的token,但这些token产生的价值远远超过400亿美元。不同的企业每个token产生的价值不同,但随着我们变得越来越智能,真正重要的是获得这些最智能的token,并将它们用于某些事情上。你作为一个人,决定如何最好地利用这些token来发展业务、创造价值。因为很多人都想要token并生成token。但旧金山那家用Claude来生成他们软件产品的糟糕SaaS初创公司,不一定真的在创造大量价值,因此他们很快就会被token市场淘汰出局。

主持人:

你对此感到惊讶吗?我今天刚刚有过这样的经历——在来这里的飞机上,我在某件事上被严重限速了。我看到4.7发布了,我立刻想要的就是那一秒就能用上4.7。而且,我根本无法想象再用4.6了。既然4.7已经出来了。在过去这么多周里,我对4.6一直非常满意。太神奇了。你是否对人们如此坚持要用最贵的、最前沿的东西感到惊讶——程度之深令人咋舌。

Dylan Patel:

毫无疑问,过去一个半月里我最有趣的记忆之一,就是我和Buddy还有Leopold跪在一位Anthropic联合创始人面前,恳求他给我们访问Mythos的权限,然后假装它不存在——因为我们知道它存在。我们说,请给我们访问权限。他说,我不知道你在说什么。

主持人:

你对那个速率卡或者评估卡发布时是什么反应?

Dylan Patel:

在湾区就有传言。每个人,你知道,我们有点像是知道它应该会非常好。但如果你只看基准测试,而且显然基准测试会随时间变化,Mythos可能是两年来模型能力最大的一次跃升。我认为这是一个非常重要的细节,你知道,它好到他们都不想发布——尽管他们已经向那些他们为Cyber安全做了选择性发布的人宣布了价格,token成本大概是5到10倍。他们就是不想发布它,因为他们担心对世界的影响。他们发布给我们的是较差的版本Opus 4.7。他们在模型卡里明确说了,嘿,我们实际上是有意让它在网络安全方面变得更差的。如果你读到这个,不管你是谁,如果你有足够的资本,你应该去搞一个企业级Cloud、企业级Anthropic订阅,在那里你按token付费,而不是用这些订阅制,因为那样你就不会被频繁限速,然后你必须,你需要想清楚如何将这些token用于最高价值的任务并从中赚钱。因为最终,你现在做的事情,也许一年后或两年后,这个业务实际上就是套利token,对吧?这些token非常强大,但让我们搞清楚把它们指向什么方向。然后三四年后,模型将会知道,你知道,如何使用这些token以及如何创造最大价值。你知道,你可以回顾性地看,选择任何一个基准测试。

Dylan Patel:

达到某个能力层级的成本,过去要花X,现在只需要X的百分之一或千分之一。Deep Seek为例,在GPT-4上,成本是原来的六百分之一。从那以后,GPT-4级别模型的成本进一步下降了。当然,没有人再在乎GPT-4级别的模型了。他们想要的是前沿模型,因为前沿模型让他们能够创造出具有经济价值的东西。但GPT-4级别的模型仍然可以用在一些场景中。人们在一些小型用例中使用它们。只是成本下降得太快了。真正驱动需求的不是成本,而是所有这些新的使用场景。是的。目前的4.6 Opus或4.7 Opus,对于你的这些模型。一年后,同等质量模型的花费可能大概是7万美元。我打赌它会便宜100倍。但这无关紧要,因为我将会使用一个好得多、好得多、好得多的模型,它能做好得多的事情。所以Anthropic的Mythos作为模型来说更贵,但完成同样的事情花费的token要少得多。因此,在大多数任务中,它实际上比4.6 Opus更便宜,因为它的效率要高得多。尽管每个单独的token更聪明。

主持人:

我上次见到你时,Mythos可能刚出来一天左右,或者卡刚出来,你说了一些话,大意是它实际上让你感到有点害怕,它太好了。你是什么意思?

Dylan Patel:

Anthropic在2025年的整体目标,甚至在2024年的很大一部分时间里,他们说,嘿,到2025年底,我们需要在我们的模型里实现L4级别的软件工程师。他们基本上通过4.6 Opus实现了这一目标。他们没有说的是,你知道,而且,如果你看Mythos,如果你比较基准测试,它就像是一个L6工程师。所以L4是相当新的。L6是相当有经验的。我认为Anthropic说这个模型在内部是二月份就可用了。所以在两个月内,他们从L4工程师进步到了L6工程师。

Dylan Patel:

接下来是什么?你知道,当你思考模型进展时,它只会加速。Anthropic的发布节奏压缩了,OpenAI的发布节奏也压缩了。为什么?因为这些模型,通常来说,要制造一个更好的模型,你需要几样东西,对吧?你需要惊人的算力。算力非常昂贵,它有一个时间尺度,我们,你知道,我们追踪它,它就像是,你知道,它在增长,但就像是,你知道,对于接下来的,你知道,短期内,它就像是已经板上钉钉了,就是你已经签署的那些合同。会有延误和变动,你也许能多找到一点,但总体来说是相当板上钉钉的。有那些惊人的研究人员,人们为他们支付数千万美元。

Dylan Patel:

最后,还有执行实施。历史上,这一直非常困难。如果我有一个想法,现在我必须去实施。实施是困难的。现在想法有了,实施变得非常容易了。它很贵,但非常容易。那么,如何决定实施哪些想法呢?事实证明,如果你的实施现在变得如此容易,你就可以实施更多的想法,在跑步机上越跑越快,无论是AI模型研究,还是其他什么。所以现在你的模型发布节奏从之前的六个月压缩到了两个月,或者……

Dylan Patel:

嘿,我想把美国所有的发电厂和所有输电线路都纳入进来,建模,跑回归,看看微观层面的供需关系。我也可以做到这一点。

Dylan Patel:

想法是廉价的。你知道,哪个想法有意义,哪个想法值得你在token上花费那些资本,因为执行实施已经到位了。这就是,这就是,我认为这是关键的学习。如果执行实施成本继续下降,而它们确实在下降,我们甚至还没有Mythos呢。距离Opus 4.7发布才过了几个小时。但你知道,我的团队内部对此相当兴奋。现在降临到世界上的是什么,是经济运作方式的彻底重组。过去,执行非常重要,因为执行非常困难,而想法则很廉价。现在想法既廉价又充裕,但执行变得非常容易。所以真正重要的——那些毫无价值的想法,以及那些能够证明在超级廉价的执行上花费是值得的想法。

主持人:

所以你真的感到害怕,还是说,它只是引入了一种难以应对的不确定性?

Dylan Patel:

不确定性是存在的,但我确实认为这在某种程度上引发了一些恐惧——关于社会如何重组自身?在一个世界里,你实施某件事的能力实际上并不那么重要,你为AI选择正确想法去实施的能力,以及你销售那个想法或销售AI所实施的东西的能力,才是重要的;你聚集资本的能力,才是重要的。回到之前那个观点,拥有最新的模型始终非常重要——谁将能够获得最新的模型?

Dylan Patel:

Anthropic的那个项目。我知道它不叫earwig,但我通过叫它earwig来逗Anthropic的人——glasswig,Anthropic earwig,你知道,他们只向某些公司发布Mythos用于网络安全——这只会是一种持续下去的趋势。模型的广泛部署范围将越来越窄。我知道OpenAI和Anthropic以及所有这些人都在说,我们想要让每个人都能用上出色的AI。AI非常昂贵。谁来为这万亿美元的基础设施买单?那些有钱、能用AI构建有用东西的人,而且你不希望人们蒸馏你的模型。所以你不广泛发布,而是向越来越少的客户群体发布。那些客户现在也在争夺token。除非Anthropic,你知道,他们可以把Opus的定价翻倍,我会继续付,我打赌大多数用户也会继续付。我打赌那也解决不了他们巨大的容量问题。所以问题就变成了,这个循环在哪里结束——token的使用,以及因此这些token带来的好处,在这些token之上产生的额外价值,将汇聚于越来越少的公司之中。

Dylan Patel:

我还没有Mythos。你知道,关于Mythos,顶级银行现在只把它用于网络安全。但在某个时刻,我可以设想这样一个世界:嘿,也许因为我有一个Anthropic企业合同,而且因为Anthropic的人有点喜欢我,他们愿意给我们稍微早一点的访问权限,或者稍微高一点的速率限制,或者某个模型的什么东西。我希望这就是会发生的事情。然后我的竞争对手,不管是谁,没有这个,我就能碾压他们。有些人,比如Ken Griffin和Citadel,他们人脉超广、资金雄厚,他就像是,他直接去签,你知道,谁知道呢?他去和OpenAI或Anthropic签了一份合同,大概是这样的:是的,我要获得你们模型的访问权限,我每年会购买价值100亿美元的token。所以每当你发布模型,你知道,我会花掉前100亿的token,然后其他人才能在那之后获得这个模型。那就是说,好吧,那会怎样呢?好吧,现在他将要在市场上碾压所有人。这只是一个例子。可能是网络安全,就像Anthropic担心的那样,哦,现在我可以入侵别人了。也可能是像我这样的信息服务业务,我碾压了别人。我认为,你知道,它的基础如此广泛。我们不知道这些模型能做什么,Anthropic也不知道这些模型能做什么。没有人知道这些模型能做什么。这取决于最终用户去弄清楚他们可以在哪里利用这些token,看看他们能构建什么、能想象什么——这对人类来说是极其富有成效和令人振奋的。但是,资源的集中和对它的使用会发生什么呢?

主持人:

可以这么说,目前机器人或机器人技术消耗的token相对于其他一切来说几乎是零。你怎么看——如果这像是一条可能开始棘轮式上升的第二需求曲线?就在离这里一英里之内,每天都有新的初创公司在尝试在机器人领域构建有趣的东西。所以有这个……

Dylan Patel:

有一个"纯软件奇点"的概念,就是说这个世界有。你知道,AI奇点,但只在软件领域。那么世界上其他的部分呢?世界的绝大多数是物理的。你可以看到世界围绕硬件而非软件来运转。这实际上就是为什么我认为纯软件奇点只是一个小插曲,而不是说,你知道,我们不会得到其他一切,因为一方面软件太容易了。是什么让机器人真的很难?就是给微控制器和执行器编程,控制所有这些东西,现在非常困难。

Dylan Patel:

关于AI模型,有趣的是,它们在学习上实际上是非常低效的。只是我们能够给它们提供如此大量的数据,以至于它们能够学习并在某些方面超越我们。机器人,目前,机器人模型,VLA——视觉语言动作模型,现在非常流行,可能不会是最终能够规模化的东西,因为它们在数据上效率低下,而且我们无法足够快地为它们扩充数据。将会有某种方式来大规模预训练机器人模型,就像人类在一生中看到所有这些数据一样。有趣的是,人类,我们之所以如此厉害,是因为我们的样本效率很高。一个例子,两个例子,我们就学会了。所以把这个应用到机器人上……

Dylan Patel:

所以一旦你有了这个纯软件奇点,执行实施的成本超级低廉,任何人都可以开始构建这些模型。人们可以开始构建模型,让机器人现在真正变得有用。所以我认为在未来六到十八个月内,我们将开始看到机器人领域真正的突破,实现少样本学习——也就是说,有一个预训练的机器人模型,现在有一个你雇用了或购买了或随便什么的机器人。你展示了几个例子,它就能做到了。你告诉它把这两样东西叠起来,或者你告诉它,嘿,这实际上可以完美地保持平衡,你知道,它就开始做这些事情了。

主持人:

单样本学习。

Dylan Patel:

不,相信我,我打翻了很多东西。所以我认为机器人将会,而且现在就能实现少样本学习。你知道,现在有很多公司在做机器人,用于广告或者简单任务之类的。但它会变得非常细分,比如专门用于折叠衣物的机器人,但会越来越细分,比如专门用于擦黑板的机器人。它可以是一种租赁服务,或者,你知道,会有一个模型包,你下载到你的标准机器人上,然后它就能做那件事,对吧?你按使用量付费,不管怎样,物理领域将会有一次巨大的爆炸性加速,以及相应的通缩效应。但是,而且,所以这最终将使token需求持续疯狂增长。我个人不认为token需求会放缓。

主持人:

你有没有根据 Mythos 的结果以及它的构建方式学到关于这个世界的其他东西?比如说,如果你拆解规模定律的各个组成部分,你知道,比如说……

Dylan Patel:

这是一个在规模上明显大于之前模型的模型。所以是的,它是一个大得多的模型。现在,它是否是,它在什么芯片上训练的其实并不重要。重要的是规模。显然,你知道,10万块 Blackwell 相当于数十万块上一代芯片。TPU 和 Trainium 有各自不同的发布节奏,并不完全是一比一的镜像关系。但归根结底,是的,Mythos 是一个规模显著更大的模型。它证明了规模定律仍然有效。关于它的一切都表明,模型的趋势线仍在延续——向模型投入更多算力会使模型变得更好。而且在整个过程中,不仅仅是向模型投入更多算力使其变得更好,我们同时也在获得这些算力效率上的提升,也就是说,你知道,实验室花费的所有这些研究算力实际上正在转化为——如果我想要某个能力水平的模型,每6个月,或者每两个月,那个成本都在大幅下降。但如果我大规模地扩展它,我同时也能获得巨大的能力飞跃。

Dylan Patel:

所以是的,这证明了这一切仍在发生。谷歌和 Anthropic 在训练侧并不是 GPU 的重度用户,但是,OpenAI,他们将开始推出新一类的模型。我认为他们正在采取一种更合理、更有原则的方式,以小步骤进行扩展。Anthropic 则真的进行了一次巨大的跃进。我们将在这一年里看到越来越好的模型。而且发布节奏只会越来越快。

主持人:

在整个对话中,我们几乎没有提到 OpenAI,这在以前会显得非常奇怪。

Dylan Patel:

所以这是有趣的地方。所有人都在说,好吧,所以 Anthropic 刚刚赢了,对吧?你知道,他们在二月份就有了 Mythos。他们从来没有发布它,因为他们觉得没有必要。他们已经供不应求了。收入已经每月新增100亿美元了。然后今天你还有 Opus 4.7,这一切都发生在 OpenAI 所谓的 GPT 发布之前,你知道,媒体如 The Information 等已经报道过这件事。所以很明显,Anthropic 处于领先地位,对吧?而 OpenAI 已经完了。

Dylan Patel:

有趣的是,因为 Anthropic 在算力上有如此大的限制,他们只能以那么快的速度增长算力。从某种程度上来说,你知道,Dario 以前常常吹嘘说 OpenAI 在算力上过于激进,而 Anthropic 在扩展上更为明智,但现在 Anthropic 的态度是,我们应该,我希望我们有更多的算力。OpenAI 能够完全正常地支付账单。事实上,他们筹集了大量资金来获得额外的算力,除了他们从 Oracle、CoreWeave、Softbank 以及所有这些人,还有微软那里购买的不负责任水平的算力之外,你知道,比如 Trainium,现在他们也从 Amazon(Anthropic)那里获得 Trainium。所以他们在算力上做了这种……疯狂的事情,而且他们知道,不,他们也知道他们需要更多。

Dylan Patel:

但有趣的是,如果你说 Opus 4.6,你知道,让我们忽略模型随时间变好这件事。让我们只看这项技术的扩散。你和我可能会在第一天就立刻使用这个模型。但其他企业需要时间,人们需要时间来学习,而那种"哦,AI 顿悟时刻"的火花并不会同时击中所有人。所以到今年年底,假设一个纯粹的 Opus 4.6 模型,整个经济体会在上面花费1000亿美元。我认为这并不是不合理的。现在的花费已经是400亿了。

主持人:

那就像是线性外推。

Dylan Patel:

这是线性外推,不是指数级的。要达到指数级,你需要更好的模型。Anthropic 没有足够的算力来做到这一点。所以,大概 OpenAI 和谷歌也会很快达到那个层级。下一个达到那个层级的人,当然,Anthropic 可能可以收取70%以上的毛利率,但如果 OpenAI 下一个达到,他们收取50%的毛利率。他们仍然能获得所有这些增量需求。而且可能他们也没有足够的算力来服务所有用户。所以当然,也许 Mythos 是一个如果世界有足够算力可以产生5000亿美元收入的模型,或者某种疯狂的数字,对这些 token 的需求如此之大,而供给又如此有限。

Dylan Patel:

算力上的限制,你知道,我们从 H100 价格飙升以及这些 GPU 的使用寿命不断延长中看到了这一点。很明显,即使是二线实验室也会把 token 卖光,更不用说一线实验室了。一线实验室会有更好的利润率,但二线实验室也会卖光,而且可能三线实验室也会接近卖光。最好的模型能够提供的经济价值增长速度,超过了我们通过基础设施实际向人们提供这些 token 的能力。所以这个差距将继续扩大,模型实验室将继续拥有不断扩张的利润率,直到硬件供应链、基础设施供应链中的人们开始说,等等,不对,我为什么不直接大幅提高我的利润率呢?

主持人:

所以可以说,我认为今天的评估,或者说你对需求侧的评估,在你自己这个具体例子——Semi Analysis 这里——是完全爆炸性的,但更广泛地说,当人们陷入你所说的 AI 顿悟时刻,当人们陷入这种体验,意识到自己能做什么,而实施难度完全消失的时候。我自己也确实感受到了,你知道,我自己的 token 消耗在短短几周内就已经绝对突破天际了。所以这感觉是一个相当准确的评估。关于需求侧,我们还遗漏了什么吗?

Dylan Patel:

如果你不使用更多的 token,你将永远无法逃脱永久底层阶级。

主持人:

请展开说说。

Dylan Patel:

所以,要么你使用更多的 token,并且产生超出使用这些 token 本身经济价值的经济价值。很多人在用无聊、懒惰的方式做这件事。哦,我猜我每天只工作1小时,而不是8小时。然后让 AI 来做我大部分的工作。那是无聊的方式。酷的方式是,我仍然每天工作8小时,然后我还额外完成8份工作,也许我能赚到5倍的钱,也许不能。你不能用一份工作来做到这一点。显然,有些人有多份工作。有些人喜欢创业,开始卖东西,在所有人都开始使用之前、在它还没有成为基本功能之前,从这个 AI 中获取那些经济价值,因为如果你不使用更多的 token 并从中产生价值,它仍然不是基本功能。并且要捕获那个价值。

Dylan Patel:

这里有三个不同的问题。使用更多的 token,从这些 token 中产生价值,以及从你用这些 token 创造的价值中捕获价值。如果你不做这三件事,你将永远无法逃脱永久底层阶级,也就是说,随着模型能力继续飙升,以及资源集中化可能发生的情况。

主持人:

好的,让我们来谈谈供给侧。发生了什么?你会如何描述前沿的变化,或者在供应整个堆栈方面,随着需求曲线爆炸性增长,服务所有这些 token 所需的一切正在发生什么变化?

Dylan Patel:

随着需求飙升,供给侧的一切价格都在上涨,无论是 GPU,它们的价格都在上涨。此外,它们的使用寿命也在延长。

主持人:

H100 的价格看起来是这样的(向上)?

Dylan Patel:

是的,正是。有些人认为 GPU 的使用寿命不到5年。完全是无稽之谈。现在有些集群,3到4年前的 Hopper 集群正在续签3到4年的合同。有些 A100 集群正在续签几年的合同。所以使用寿命显然不是5年。也许甚至是7到8年,可以这么说。我们还不知道。等 Hopper 到那个时候我们再看,但显然不是5年。所以使用寿命在延长,而且续签时的价格也在上涨。所以实际上,一个集群的毛利率不是35%,而是超过了这个数字。所以云层的利润率在扩张。硬件层的利润率非常健康,你知道,Nvidia 仍然收取75%或其他某个百分比的毛利率。当我们向下移动堆栈时,内存,显然那里的利润率已经飙升。像光学和逻辑这样的地方,有大量预付款,利润率正在缓慢增长。更多的是那些像 Nvidia 一样制造芯片的公司。

Dylan Patel:

支付巨额预付款。所以它影响了资本成本或现金流的时机,即使毛利率没有提高,投资资本回报率也在上升。你在整个供应链中都能看到这一点。你看到 ASML 已经完全卖光了,他们需要 Carl Zeiss(蔡司)更快地扩张。在整个链条上,每个人要么卖光了利润率在上升,要么在收取预付款,这提高了投资资本回报率,因为投资资本更低了。所以这就像是贯穿任何部分的一致趋势。甚至像,你知道,一块 PCB,制造 PCB 需要铜箔,那种铜箔已经卖光了,人们正在为它支付预付款。就像任何有点生命力的东西,只要它卖光了,人们就会争先恐后地获取更多的增量供应,并争夺未来几年的供应。

主持人:

你认为最重要的瓶颈是什么?通常在经济历史上,当出现这种需求时,供给会重新调整并迅速增长以满足需求。在这个时刻,供给似乎几乎不可能跟上。你知道,这是著名的"最后的话",历史上每次短缺之后都会出现过剩。但在整个供给侧,哪些瓶颈对你来说是最有趣的?

Dylan Patel:

供应链通常反应非常快。一个独特的地方是,我们的供应链现在比以往任何时候都更加复杂,我们正在构建的东西也比以往任何时候都更加复杂。因此,交货期更长了。并不是说我们在其他行业没有见过18个月的长交货期,只是建立增量供应以前不需要数年时间。

Dylan Patel:

内存就是这种情况,对吧?内存每年只能以低两位数的百分比增长产能,对吧?每年20%、30%,NAND 甚至更低,DRAM 稍微高一点,即使需求信号非常强烈。

Dylan Patel:

在2025年底,内存公司立即开始有所反应。除了他们决定增加的那些增量产能,加上典型的20到30%,你知道,他们可以稍微拉伸一下,但真正的增量供应要到28年才能到来,这是非常独特的一件事。即使他们想尽快建设,最早也要到2027年底、2028年初才能到来。所以结果是内存价格,你知道,已经飞涨了。你猜怎么着?它们还会再翻倍和三倍,至少 DRAM 是这样,特别是有些人说,哦,内存的故事被过度渲染了。大家都明白了。然后就是,不,你不明白。DRAM 从现在起还会翻倍或三倍,仍然是这样,因为这就是需要的产能量,他们必须从其他地方挪用产能。而在资本主义经济中,从其他地方挪用产能的唯一方法是通过更高的定价来摧毁需求。我们不是在这里实行配给制。所以最终,这就是将要发生的事情。所以利润率继续上升。

Dylan Patel:

我认为逻辑芯片也有巨大的产能问题。台积电刚刚公布了他们的财报,他们继续增加资本支出。最终,你知道,他们需要相当长的时间来建造晶圆厂。他们正在竭尽全力从每一个晶圆厂中挤出每一点产出。但最终,他们没有快速提价,因为他们是好人。这看起来像是,你知道,个位数的价格涨幅,而不是像内存公司那样三位数的价格涨幅。所以你最终会有这样一个市场,是的,台积电是一家伟大的公司,但他们真的会提取所有价值吗?我提到了铜箔、PCB 用的玻璃纤维、激光器。这些都是众所周知的利基供应链,但它们非常紧张。而最终在上游,半导体晶圆制造设备供应链是一个我仍然认为,它已经上涨了很多,但仍然非常被低估的领域。

Dylan Patel:

台积电今年的资本支出,他们说是560亿,我们自1月份以来得到的数字是574亿。我们可能会稍微上调,因为我们看到了一些他们可以获得增量资本支出的方式。但人们没有关注的是,这对明年意味着什么,对后年意味着什么?事实证明,三年后,台积电将在资本支出上花费1000亿美元。也许两年后,对吧?可能是2028年。说真的,他们可能在2028年花费1000亿美元的资本支出,而人们根本无法想象这一点。

Dylan Patel:

但这对他们的下游供应链意味着什么?你知道,像泛林研究、应用材料、ASML 这样的公司,或者更下游的供应链,比如 MKSI 和所有这些其他公司。鞭打效应会越来越猛烈。而最终这就是短缺。如果,你知道,台积电想在2028年花费1000亿美元,这是一个真实的可能性。我认为人们会觉得这太疯狂了,但这是一个真实的可能性。

主持人:

那么芯片生态系统中其他GPU完全占主导地位的领域呢?比如CPU、ASIC,或者那些既是机遇又是瓶颈的东西,不仅仅是英伟达GPU的主导地位。

Dylan Patel:

是的,我的意思是,ASIC显然正在起飞,但我会稍微转移一下话题,从AI芯片聊到这些其他的东西。我们做了一个关于FPGA的项目,结果发现每个下一代机架、AI机架里有120个FPGA。然后,那些FPGA、CPU,所有这些强化学习环境,加上你我正在生成的那些垃圾代码,现在都跑在某个Versal实例或者某个AWS实例,或者我们启动的某个存储桶上。所有这些都需要CPU。所以CPU完全供不应求,需求正在急剧攀升。

主持人:

帮大家理解一下CPU在其中扮演的角色。

Dylan Patel:

是的,所以你需要大量CPU主要有两个原因。第一个是当你做强化学习的时候,CPU非常关键。与此同等重要的是:以前你会把所有互联网上的数据扔进模型去训练,它输出一些东西。现在你训练完全世界的互联网,你把所有互联网数据放进模型,然后你把它放进这个环境里。这个环境就像是:嘿,模型,试试这个。然后它尝试各种各样的东西。最终,有一个环境来评分,判断它尝试的东西是否成功,并给它打分。这些环境可以是任何东西。

Dylan Patel:

可以是:嘿,检查一下文本输出的格式是否正确。结构化输出可以是非常简单的事情,也可以是非常复杂的事情。人们开始涉足非常复杂的事情,对吧?

Dylan Patel:

比如:嘿,我要你打开这个文件,修改它、编辑它、更新它,然后提交到这个网站。我要你打开西门子的这个物理仿真软件,编辑这个CAD模型——所以这些环境可以变得越来越复杂。而这些环境运行在CPU上,它们不运行在GPU上,也不运行在ASIC上。ASIC运行的是模型——那个从环境中接收输入数据、将其传入模型、模型生成各种不同轨迹输出的模型,也就是我认为它可以在不同情况下解决问题的各种方式。这些轨迹被评分或打分,成功的那些你用来训练,然后更新、反复迭代。所以CPU在这方面非常有用。然后,一旦你拥有了这些优秀的模型并开始部署它们,这些模型在生成代码,在生成有用的输出。这些有用的输出,并不是直接从GPU传到人类大脑的。它从GPU或ASIC传到某个你部署在某处的应用程序,而那个应用程序实际上就是跑在CPU上的。所以这是另一个需求量很大的领域,而且在很大程度上已经供不应求。

主持人:

当你持续评估并努力成为全球在供需走势方面信息最充分的人时,有哪些是你希望自己能了解的?也就是说,让你意识到自己还不知道的那些东西。

Dylan Patel:

我认为对我们以及对所有人来说最难的领域是理解"Token经济学",也就是Token的经济学。我认为我们对运行基础设施的成本、Token的成本、模型的成本、这些实验室的利润率有着非常非常深刻的洞察,但使用量和采用情况才是真正难以持续建模的,你懂的,对吧?

Dylan Patel:

我们有这些……比如我们在一月份有过疯狂的估算,在二月份也有疯狂的估算。Anthropic 把它们全都打破了。我们该如何校准这个模型?二月份的数据来源是什么?我们对三月份有疯狂的假设,然后他们又打破了,每个人都看到了100亿这个数字,然后都在想,什么,他们怎么增加了100亿的收入?谁在使用所有这些Token?他们为什么使用它们?他们用这些Token在构建什么?更重要的是,他们用这些Token构建的东西,实际上是如何扩散到经济中去的?这又产生了什么价值?因为这实际上并不是你能在任何GDP统计数据中捕捉到的东西,对吧?我使用的所有Token的价值都被转化成了更好的信息,然后我以相对低于人们过去出售信息的价格折扣出售这些信息,因此,这些信息现在正在整个经济中传播,人们正在做出更好的投资决策,或者更好的竞争决策——如果他们是半导体公司、数据中心公司或超大规模云服务商的话。

Dylan Patel:

那么,这一切的价值是多少,这对经济做了什么?从每一个主观指标来看,这显然是惊人的。但那"幽灵GDP"在哪里?"幽灵GDP"是什么?我们如何追踪真实的经济增加值?因为GDP指标并不准确,你知道,如果你要说Dylan Patel创造的GDP是多少,与我认为正在创造的价值相比,它是微不足道的。所以归根结底。

Dylan Patel:

这些Token所创造的价值是什么——不是基于简单的,你知道,连锁效应是什么,对吧?所有这些东西正在做的事情的连锁效应是什么?我认为这才是真正难以衡量的问题和挑战。我认为我们在供给侧有着非常出色的解读。我们在很多需求侧信号方面也有着非常出色的解读,但难以量化和衡量的,是这些Token正在产生的价值。

主持人:

我希望我们每三个月都能有这样一次机会,因为这变化得太快了。你认为接下来会发生什么?比如三个月后我再来,或者我们再次在旧金山相聚,你期待会发生什么?

Dylan Patel:

大规模抗议。真的吗?是的,我认为会有针对Anthropic的大规模抗议。

主持人:

最终会演变成AI实验的对立面。

Dylan Patel:

人们讨厌AI,AI的受欢迎程度低于冰淇淋,低于政客。不知道皮尤是怎么做这个调查的,但显然AI的受欢迎程度低于政客。你知道,随着Anthropic增加如此多的收入,这将开始在下游引发商业变化。人们会越来越害怕AI。他们会开始把越来越多自己的问题,以及那些全球性的、长期以来根深蒂固的问题,归咎于AI。这些问题会浮出水面并被归咎于AI。可能某些政客或某些社交媒体人士,某个网红,将能够开始利用AI来对付人们。你看看那些新闻文章的评论,Sam Paul Altman在大约两周内两次遭人向他家扔燃烧 弹。评论里的人们都在欢呼,而这仅仅是个开始。所以我认为三个月内我们会看到针对AI的大规模抗议。

主持人:

对此的制衡力量是什么?AI行业应该如何化解这一局面?

Dylan Patel:

首先,Sam Altman和Dario必须停止接受采访。他们太缺乏个人魅力了。我不知道他们在干什么。他们做的每一次采访都像是,好吧,普通人会更加讨厌你。比如Sam上塔克·卡尔森的节目,可能让所有共和党人都讨厌OpenAI。Dario也一样。他们完全没有魅力。我认为这是前两点。他们需要开始展示AI能做的那些振奋人心的事情。第三,他们需要停止不断谈论AI的能力将如何彻底改变整个世界,因为这样人们就会对这种能力产生恐惧,因为他们与之毫无联系。

主持人:

不知道如何使用它。

Dylan Patel:

是的,也没有任何联系。就像普通人不认识Anthropic的员工。普通人不认识OpenAI的员工。普通人不知道这些人是谁,他们的目标是什么,他们只是把这些人视为某种……像鬼鬼祟祟的小团体。就这5000个人的公司,他们要改变世界,自动化所有工作,摧毁社会。这就是他们的看法。而且,作为资助建造所有这些数据中心和发电厂的人,这些设施将污染世界,对吧?他们并不完全理解正在发生的事情。你知道,他们必须停止谈论未来将要发生的事情,而只谈论当下,谈论AI如何令人振奋。我认为这需要一次重大的重组和品牌重塑。这件事必须要做。

主持人:

我很喜欢和你一起做这件事。感谢你的时间。太棒了。

Dylan Patel:

谢谢。