Binance Square
block_fancy
343 Публикации

block_fancy

Bitcoin: A Peer-to-Peer Electronic Cash System
13 подписок(и/а)
112 подписчиков(а)
211 понравилось
Посты
·
--
Статья
См. перевод
Anthropic 为什么会长成今天这样,要从这对兄妹说起达里奥负责把模型推到前沿,丹妮拉负责把一家前沿实验室真正组织起来 如果你这两年一直在关注 AI 公司,你大概率会有一种很强烈的感觉。 OpenAI 像站在聚光灯正中央。 Google 像一个家底极厚、动作越来越快的老牌巨头。 Meta 更像一台资源充足、打法凶猛的大机器。 而 Anthropic,气质很不一样。 它不算最会制造戏剧性的那一家,却总能在最关键的时候,拿出足够强的模型、足够清晰的安全叙事、足够稳定的大客户信任。 很多人会把这家公司理解成 OpenAI 的一个强劲对手。 这当然没错。 但如果只停在这个层面,其实还是太平了。 Anthropic 为什么会长成今天这样,为什么它从创立开始就这么强调安全、可解释性、组织纪律、长期主义,甚至连它对外说话的方式,都和硅谷很多 AI 公司不太一样。 说到底,你得回到两个人身上。 一对兄妹。 达里奥·阿莫代伊,Dario Amodei。 丹妮拉·阿莫代伊,Daniela Amodei。 他们不是那种典型的硅谷创业拍档,不是一个负责技术、一个负责融资讲故事的标准配置。更准确地说,这两个人像是把同一家公司最难兼容的两种力量,硬生生捏在了一起。 一边是前沿模型能力。 另一边是安全、组织、治理和长期交付。 而 Anthropic,某种意义上,就是这对兄妹共同写出来的一家公司。 先说哥哥达里奥。 如果只看履历,他是非常标准、甚至有点过于标准的那种研究型天才路线。 他在普林斯顿读的是生物物理学博士,之后在斯坦福医学院做过博士后研究。再往后,他去了 Google Brain,又去了 OpenAI,后来做到研究副总裁。 这条路径里没有太多花活。 就是一路往最硬的研究场域里走。 但真正让他在 AI 行业里站稳位置的,不只是学历和机构名头,而是他参与塑造了过去这一轮大模型浪潮里最关键的几件事。 比如 GPT-2、GPT-3 的开发。 比如后来几乎变成行业标配的 RLHF,也就是基于人类反馈的强化学习。 再比如那套影响极大的 scaling 叙事,模型能力会怎样随着算力、数据、参数规模往上推,这件事不是行业边角料,而是后来整个 AI 投资逻辑、产品逻辑、基础设施逻辑的底层之一。 说直白一点,达里奥不是那种站在浪潮旁边点评浪潮的人。 他本来就在浪头上。 但他有意思的地方恰恰也在这里。 很多最强的研究者,在一个行业开始爆炸式增长的时候,往往更容易被能力本身吸住。模型能不能更强,训练能不能更大,系统能不能更聪明,先把这些东西做出来再说。 达里奥显然不是完全这么想的。 他很早就在公开讨论里不断把另一个问题往前推。 如果模型越来越强,那它的可控性怎么办。 它的对齐怎么办。 它的解释性怎么办。 它进入真实世界以后,风险边界怎么办。 你会发现,这不是一个单纯的技术乐观主义者的说话方式。 这更像一个离能力前沿足够近,所以比别人更早感到不安的人。 然后我们再看妹妹丹妮拉。 她的履历看上去,和很多人想象中的 AI 公司联合创始人完全不是一条路。 她在加州大学圣克鲁兹分校学的是英语文学、政治和音乐。 对,没那么“理工”。 甚至你第一眼看过去,会觉得她怎么会走到今天这里。 但恰恰是这条路径,后来让她在 Anthropic 里变得格外关键。 丹妮拉早期做过国际发展相关工作,也做过国会 staffer。再后来,她去了 Stripe,先管招聘,之后又负责风险运营。 如果你对 Stripe 早期那种公司气质有感觉,你就会知道,那不是一个只要执行力就够的地方。它非常强调系统、流程、人才密度、组织协同,还有那种把复杂问题制度化解决的能力。 这段经历,对她后来的影响其实很大。 因为再往后,她去了 OpenAI。 一开始,她管理 people 和 research engineering 团队,后来做到 VP of Safety and Policy。 这个职位名字很值得反复看。 Safety and Policy。 不是单纯的运营,也不是传统意义上的行政。 而是站在研究、组织、外部世界之间,去处理一家公司最难被简单量化、但又最决定长期走向的那部分东西。 你把这兄妹两个人放在一起看,味道就出来了。 哥哥是典型的前沿研究者,真正参与定义过这一波模型革命的人。 妹妹不是在旁边做支援,她是在组织、风控、政策、安全、团队搭建这些地方,把一家前沿实验室最容易失控、最容易失真、最容易只顾往前冲的部分,强行拉回到可以长期运行的轨道上。 这件事非常少见。 因为多数前沿科技公司,最早期最难兼得的就是这两种能力。 强研究,常常伴随组织松散。 强执行,常常压缩研究自由。 越是跑在前面的实验室,越容易把安全和治理放到“等我们先赢了再说”的后面。 Anthropic 从一开始给人的感觉就不是这样。 它像是先天就把这两个东西绑在一起了。 这不是公司后面补出来的气质。 这是创始团队,尤其是这对兄妹,把底色带进去的结果。 说到这里,很多人就会自然追问一句。 既然他们已经在 OpenAI 里做到了核心位置,为什么还要离开,为什么还要自己再做一家 Anthropic。 这件事外界讨论很多,版本也很多。 但如果把公开信息和这对兄妹的履历放在一起看,你大概能理解那个方向。 不是因为他们不懂能力竞争的重要性。 恰恰相反,是因为他们太懂了。 越懂模型能力会走到哪里的人,往往越难把安全当作公关词。 对他们来说,安全不是新闻发布会里的道德表态,也不是模型出事之后的补丁。 安全应该从研究方法、训练流程、评估框架、组织决策,到对外部署的每一层里都提前长出来。 这话听上去有点抽象。 但你回头看 Anthropic 这些年的路线,就会发现它其实非常具体。 它一直非常强调 constitutional AI,强调可解释和可控,强调系统性评估,强调在把模型推向更广泛用户之前,先把危险能力、误用边界、部署条件想得更细。 很多人觉得这些词太“稳”,不够刺激。 可说真的,今天 AI 行业最缺的,可能还真不是刺激。 而是那种能让大模型从炫技演示走向真实世界基础设施的稳定结构。 这时候你再回头看这对兄妹,会发现他们像是分别占住了这条路的两头。 达里奥负责继续把能力推上去。 丹妮拉负责确保这家公司不会在变强的过程中,内部先散掉、边界先糊掉、外部信任先掉光。 这就像你在造一台越来越强的发动机。 有的人只盯着马力。 有的人只盯着刹车。 而 Anthropic 这对兄妹比较特别的地方在于,他们像是从创办第一天开始,就知道马力和刹车必须一起造。 少一个都不行。 如果你把过去几年 AI 公司最核心的竞争拆开来看,其实已经不是简单的“谁模型更强”了。 它越来越像四件事一起比。 第一,谁能把模型训练得更强。 第二,谁能把安全和评估做得更早、更深。 第三,谁能把公司组织成一支长期打仗的队伍。 第四,谁能拿到企业、政府、开发者和资本市场的持续信任。 这四件事,任何一件单独拎出来都很难。 四件事一起成立,难度就不是线性增加,而是陡增。 所以你会发现,Anthropic 的存在不是一个偶然。 它不是一群前 OpenAI 员工出来复制一个缩小版 OpenAI。 它更像是在回答一个很锋利的问题。 如果我们从一开始,就把前沿模型能力和长期安全治理一起当成公司的骨架,会不会长出一条不同的路。 现在回头看,这条路至少已经被证明,不是空想。 Claude 能打。 企业客户买单。 资本市场认可。 政策与安全叙事也始终是它的主轴之一。 很多人会把这种成功理解为一家公司的产品成功。 但我更愿意把它理解成一种组织方法的成功。 因为模型公司走到最后,比拼的不只是论文、参数和 demo。 还比拼创始团队有没有能力,把极高的不确定性装进一个还能持续运行的结构里。 Anthropic 的兄妹组合,厉害就厉害在这儿。 他们不是一个人负责“做梦”,另一个人负责“收尾”。 他们更像是共同定义了这个梦应该怎样被建造。 一个人负责确定上限。 一个人负责确定边界。 然后这家公司就在上限和边界之间,长出了自己的形状。 当然,我们也没必要把他们写成某种完美无缺的科技英雄。 任何一家走到今天规模的前沿 AI 公司,都会面临同样尖锐的问题。 模型越来越强以后,真正的安全边界到底该怎么定义。 企业化会不会反过来影响研究理想。 资本的耐心和计算资源的消耗,能不能长期平衡。 当一家公司一边强调责任,一边又必须参与最激烈的能力竞争时,它到底能在多大程度上同时守住这两件事。 这些问题,Anthropic 没有天然免疫。 这对兄妹也不会自动拥有所有答案。 但至少到目前为止,Anthropic 给行业提供了一个很有意思的样本。 一个前沿 AI 实验室,未必只能靠单一的天才叙事往前冲。 它也可以建立在另一种更复杂的组合上。 研究强度。 组织密度。 安全自觉。 长期信任。 而这四样东西,刚好都能在达里奥和丹妮拉的履历里找到源头。 一个从普林斯顿、斯坦福、Google Brain、OpenAI 一路走来,站在模型能力最前线的人。 一个从人文教育、公共事务、Stripe、OpenAI 安全与政策一路走来,知道制度、人才、风险和外部世界怎么缠在一起的人。 这也是我觉得这对兄妹最值得写的地方。 不是因为他们履历漂亮。 硅谷漂亮履历太多了。 也不是因为他们站在 AI 这轮浪潮中心。 站在浪潮中心的人也很多。 而是因为他们身上刚好拼出了一种很少见的公司原型。 一个真正相信模型会继续变强的人。 和一个真正相信,变强这件事必须被组织、被约束、被解释、被负责的人。 这两种力量在很多公司里是对冲的。 在 Anthropic,它们至少在相当长一段时间里,是并肩的。 所以如果你问我,怎么理解 Anthropic 这家公司。 我会说,先别急着只看 Claude,也别急着只看融资和估值。 先去看这对兄妹。 看懂他们,你大概就能看懂 Anthropic 为什么会是今天这个样子。 也能看懂,接下来 AI 行业真正稀缺的,也许不只是更强的模型。 而是更强的模型,配得上更强的组织。

Anthropic 为什么会长成今天这样,要从这对兄妹说起

达里奥负责把模型推到前沿,丹妮拉负责把一家前沿实验室真正组织起来
如果你这两年一直在关注 AI 公司,你大概率会有一种很强烈的感觉。
OpenAI 像站在聚光灯正中央。
Google 像一个家底极厚、动作越来越快的老牌巨头。
Meta 更像一台资源充足、打法凶猛的大机器。
而 Anthropic,气质很不一样。
它不算最会制造戏剧性的那一家,却总能在最关键的时候,拿出足够强的模型、足够清晰的安全叙事、足够稳定的大客户信任。
很多人会把这家公司理解成 OpenAI 的一个强劲对手。
这当然没错。
但如果只停在这个层面,其实还是太平了。
Anthropic 为什么会长成今天这样,为什么它从创立开始就这么强调安全、可解释性、组织纪律、长期主义,甚至连它对外说话的方式,都和硅谷很多 AI 公司不太一样。
说到底,你得回到两个人身上。
一对兄妹。
达里奥·阿莫代伊,Dario Amodei。
丹妮拉·阿莫代伊,Daniela Amodei。
他们不是那种典型的硅谷创业拍档,不是一个负责技术、一个负责融资讲故事的标准配置。更准确地说,这两个人像是把同一家公司最难兼容的两种力量,硬生生捏在了一起。
一边是前沿模型能力。
另一边是安全、组织、治理和长期交付。
而 Anthropic,某种意义上,就是这对兄妹共同写出来的一家公司。
先说哥哥达里奥。
如果只看履历,他是非常标准、甚至有点过于标准的那种研究型天才路线。
他在普林斯顿读的是生物物理学博士,之后在斯坦福医学院做过博士后研究。再往后,他去了 Google Brain,又去了 OpenAI,后来做到研究副总裁。
这条路径里没有太多花活。
就是一路往最硬的研究场域里走。
但真正让他在 AI 行业里站稳位置的,不只是学历和机构名头,而是他参与塑造了过去这一轮大模型浪潮里最关键的几件事。
比如 GPT-2、GPT-3 的开发。
比如后来几乎变成行业标配的 RLHF,也就是基于人类反馈的强化学习。
再比如那套影响极大的 scaling 叙事,模型能力会怎样随着算力、数据、参数规模往上推,这件事不是行业边角料,而是后来整个 AI 投资逻辑、产品逻辑、基础设施逻辑的底层之一。
说直白一点,达里奥不是那种站在浪潮旁边点评浪潮的人。
他本来就在浪头上。
但他有意思的地方恰恰也在这里。
很多最强的研究者,在一个行业开始爆炸式增长的时候,往往更容易被能力本身吸住。模型能不能更强,训练能不能更大,系统能不能更聪明,先把这些东西做出来再说。
达里奥显然不是完全这么想的。
他很早就在公开讨论里不断把另一个问题往前推。
如果模型越来越强,那它的可控性怎么办。
它的对齐怎么办。
它的解释性怎么办。
它进入真实世界以后,风险边界怎么办。
你会发现,这不是一个单纯的技术乐观主义者的说话方式。
这更像一个离能力前沿足够近,所以比别人更早感到不安的人。
然后我们再看妹妹丹妮拉。
她的履历看上去,和很多人想象中的 AI 公司联合创始人完全不是一条路。
她在加州大学圣克鲁兹分校学的是英语文学、政治和音乐。
对,没那么“理工”。
甚至你第一眼看过去,会觉得她怎么会走到今天这里。
但恰恰是这条路径,后来让她在 Anthropic 里变得格外关键。
丹妮拉早期做过国际发展相关工作,也做过国会 staffer。再后来,她去了 Stripe,先管招聘,之后又负责风险运营。
如果你对 Stripe 早期那种公司气质有感觉,你就会知道,那不是一个只要执行力就够的地方。它非常强调系统、流程、人才密度、组织协同,还有那种把复杂问题制度化解决的能力。
这段经历,对她后来的影响其实很大。
因为再往后,她去了 OpenAI。
一开始,她管理 people 和 research engineering 团队,后来做到 VP of Safety and Policy。
这个职位名字很值得反复看。
Safety and Policy。
不是单纯的运营,也不是传统意义上的行政。
而是站在研究、组织、外部世界之间,去处理一家公司最难被简单量化、但又最决定长期走向的那部分东西。
你把这兄妹两个人放在一起看,味道就出来了。
哥哥是典型的前沿研究者,真正参与定义过这一波模型革命的人。
妹妹不是在旁边做支援,她是在组织、风控、政策、安全、团队搭建这些地方,把一家前沿实验室最容易失控、最容易失真、最容易只顾往前冲的部分,强行拉回到可以长期运行的轨道上。
这件事非常少见。
因为多数前沿科技公司,最早期最难兼得的就是这两种能力。
强研究,常常伴随组织松散。
强执行,常常压缩研究自由。
越是跑在前面的实验室,越容易把安全和治理放到“等我们先赢了再说”的后面。
Anthropic 从一开始给人的感觉就不是这样。
它像是先天就把这两个东西绑在一起了。
这不是公司后面补出来的气质。
这是创始团队,尤其是这对兄妹,把底色带进去的结果。
说到这里,很多人就会自然追问一句。
既然他们已经在 OpenAI 里做到了核心位置,为什么还要离开,为什么还要自己再做一家 Anthropic。
这件事外界讨论很多,版本也很多。
但如果把公开信息和这对兄妹的履历放在一起看,你大概能理解那个方向。
不是因为他们不懂能力竞争的重要性。
恰恰相反,是因为他们太懂了。
越懂模型能力会走到哪里的人,往往越难把安全当作公关词。
对他们来说,安全不是新闻发布会里的道德表态,也不是模型出事之后的补丁。
安全应该从研究方法、训练流程、评估框架、组织决策,到对外部署的每一层里都提前长出来。
这话听上去有点抽象。
但你回头看 Anthropic 这些年的路线,就会发现它其实非常具体。
它一直非常强调 constitutional AI,强调可解释和可控,强调系统性评估,强调在把模型推向更广泛用户之前,先把危险能力、误用边界、部署条件想得更细。
很多人觉得这些词太“稳”,不够刺激。
可说真的,今天 AI 行业最缺的,可能还真不是刺激。
而是那种能让大模型从炫技演示走向真实世界基础设施的稳定结构。
这时候你再回头看这对兄妹,会发现他们像是分别占住了这条路的两头。
达里奥负责继续把能力推上去。
丹妮拉负责确保这家公司不会在变强的过程中,内部先散掉、边界先糊掉、外部信任先掉光。
这就像你在造一台越来越强的发动机。
有的人只盯着马力。
有的人只盯着刹车。
而 Anthropic 这对兄妹比较特别的地方在于,他们像是从创办第一天开始,就知道马力和刹车必须一起造。
少一个都不行。
如果你把过去几年 AI 公司最核心的竞争拆开来看,其实已经不是简单的“谁模型更强”了。
它越来越像四件事一起比。
第一,谁能把模型训练得更强。
第二,谁能把安全和评估做得更早、更深。
第三,谁能把公司组织成一支长期打仗的队伍。
第四,谁能拿到企业、政府、开发者和资本市场的持续信任。
这四件事,任何一件单独拎出来都很难。
四件事一起成立,难度就不是线性增加,而是陡增。
所以你会发现,Anthropic 的存在不是一个偶然。
它不是一群前 OpenAI 员工出来复制一个缩小版 OpenAI。
它更像是在回答一个很锋利的问题。
如果我们从一开始,就把前沿模型能力和长期安全治理一起当成公司的骨架,会不会长出一条不同的路。
现在回头看,这条路至少已经被证明,不是空想。
Claude 能打。
企业客户买单。
资本市场认可。
政策与安全叙事也始终是它的主轴之一。
很多人会把这种成功理解为一家公司的产品成功。
但我更愿意把它理解成一种组织方法的成功。
因为模型公司走到最后,比拼的不只是论文、参数和 demo。
还比拼创始团队有没有能力,把极高的不确定性装进一个还能持续运行的结构里。
Anthropic 的兄妹组合,厉害就厉害在这儿。
他们不是一个人负责“做梦”,另一个人负责“收尾”。
他们更像是共同定义了这个梦应该怎样被建造。
一个人负责确定上限。
一个人负责确定边界。
然后这家公司就在上限和边界之间,长出了自己的形状。
当然,我们也没必要把他们写成某种完美无缺的科技英雄。
任何一家走到今天规模的前沿 AI 公司,都会面临同样尖锐的问题。
模型越来越强以后,真正的安全边界到底该怎么定义。
企业化会不会反过来影响研究理想。
资本的耐心和计算资源的消耗,能不能长期平衡。
当一家公司一边强调责任,一边又必须参与最激烈的能力竞争时,它到底能在多大程度上同时守住这两件事。
这些问题,Anthropic 没有天然免疫。
这对兄妹也不会自动拥有所有答案。
但至少到目前为止,Anthropic 给行业提供了一个很有意思的样本。
一个前沿 AI 实验室,未必只能靠单一的天才叙事往前冲。
它也可以建立在另一种更复杂的组合上。
研究强度。
组织密度。
安全自觉。
长期信任。
而这四样东西,刚好都能在达里奥和丹妮拉的履历里找到源头。
一个从普林斯顿、斯坦福、Google Brain、OpenAI 一路走来,站在模型能力最前线的人。
一个从人文教育、公共事务、Stripe、OpenAI 安全与政策一路走来,知道制度、人才、风险和外部世界怎么缠在一起的人。
这也是我觉得这对兄妹最值得写的地方。
不是因为他们履历漂亮。
硅谷漂亮履历太多了。
也不是因为他们站在 AI 这轮浪潮中心。
站在浪潮中心的人也很多。
而是因为他们身上刚好拼出了一种很少见的公司原型。
一个真正相信模型会继续变强的人。
和一个真正相信,变强这件事必须被组织、被约束、被解释、被负责的人。
这两种力量在很多公司里是对冲的。
在 Anthropic,它们至少在相当长一段时间里,是并肩的。
所以如果你问我,怎么理解 Anthropic 这家公司。
我会说,先别急着只看 Claude,也别急着只看融资和估值。
先去看这对兄妹。
看懂他们,你大概就能看懂 Anthropic 为什么会是今天这个样子。
也能看懂,接下来 AI 行业真正稀缺的,也许不只是更强的模型。
而是更强的模型,配得上更强的组织。
Статья
См. перевод
机器人和数字孪生被放到台前,AI 终于要从屏幕走向工厂了过去两年,AI 最像魔法的时候,往往发生在屏幕里。 你输入一句话,它写出一篇文章。你给一张图,它生成一段视频。你丢一段代码,它帮你改 bug。所有这些都很震撼,但它们大多还停留在信息世界。 GTC Taipei 这次把另一个方向推到了台前,physical AI,机器人,数字孪生,智能工厂。 这个方向没那么容易做演示。 因为物理世界不讲情面。 文字生成错了,可以重写。图片生成歪了,可以再来一张。机器人在工厂里拿错零件、撞到设备、漏检瑕疵,代价就不一样了。物理世界有重量,有摩擦,有遮挡,有噪声,有安全责任。 所以我觉得,Physical AI 是 AI 行业真正从聪明走向可靠的一道关。 NVIDIA 官方 GTC Taipei 页面把 physical AI and robotics 放在重点主题里,博客里也提到了 Isaac GR00T、Isaac Teleop、机器人训练、工厂仿真、Omniverse、Cosmos、Metropolis 等组合。你把这些词连起来看,会发现英伟达想做的不是单个机器人。 它想做一套从虚拟到现实的训练系统。 这件事为什么重要? 因为机器人最缺的不是一个会说话的大脑,而是大量可用的训练数据和可靠的场景验证。人类小孩学会拿杯子,可以摔几次、试几次。工业机器人不能这样,它需要在上线前尽量知道各种情况怎么处理。 现实世界的数据很贵。 你要搭场地,要装传感器,要安排人操作,要处理安全风险,还要把大量视频和动作数据标注出来。更麻烦的是,很多罕见故障你很难等它自然发生,但真正上线时它偏偏会发生。 数字孪生和仿真的价值就在这里。 你可以在虚拟工厂里生成场景,制造瑕疵,改变光照,模拟设备移动,训练机器人面对各种边角情况。然后再把模型拿到真实工厂里测试,真实反馈再回到仿真环境里修正。 这就是 Physical AI 的闭环。 仿真不是游戏画面。 它是机器人进入现实之前的训练场。 如果这个闭环跑通,AI 行业会打开一个比聊天机器人更大的市场。制造、物流、医疗、农业、自动驾驶、仓储、能源巡检,这些行业都有大量物理任务。它们不需要一个只会写漂亮答案的 AI,它们需要一个能看、能判断、能行动、能承担后果的系统。 这会让 AI 公司的能力结构发生变化。 以前做 AI 产品,很多团队只需要模型、前端、后端、数据。做 Physical AI,你要懂传感器、控制、仿真、机器人硬件、现场流程、安全规范。软件和硬件会重新缠在一起。 这也是为什么英伟达在这里有天然优势。 它不只是有 GPU。它有 Omniverse 做仿真,有 Isaac 做机器人开发,有 Jetson 做边缘计算,有数据中心训练,有工业合作伙伴。它可以把机器人从训练到部署的链条尽量打通。 当然,不能把这件事想得太顺。 Physical AI 的落地速度不会像聊天机器人那么快。因为它要进入工厂,进入医院,进入仓库,进入道路。每个场景都有自己的规则,每个客户都有自己的设备,每个流程都有自己的历史包袱。AI 在屏幕里犯错,用户可能笑一笑。在物理世界里犯错,企业要承担损失。 所以这个行业不会一夜爆发。 但它一旦进入,壁垒也会很高。 一个机器人系统如果真的在工厂里跑起来,它积累的不只是模型参数,还有现场数据、流程经验、设备适配、工人协作、异常处理。这些东西很难被一个新模型轻易复制。 这对 AI 行业的深远影响,是把竞争从模型 API 扩展到真实世界的操作系统。 谁能把仿真、数据、模型、机器人和现场反馈连成闭环,谁就不只是卖软件,而是在重写行业流程。制造业里一个小瑕疵检测,一个换线流程,一个搬运动作,如果被 AI 稳定优化,背后都是成本、效率和质量的变化。 很多人问 AI 下一个杀手级应用是什么。 我有时候觉得,不一定是一个消费者 App。 可能是一条更聪明的产线。 可能是一个能学习的仓库。 可能是一家医院里不再只会送药,而是能理解流程的机器人。 这些东西不会像聊天机器人那样让每个人立刻上手,但它们一旦成立,会改变产业的底层成本。 GTC Taipei 把机器人和数字孪生放到台前,其实是在提醒我们,AI 不是只会改变屏幕里的工作,也会改变现实里的工作。 屏幕里的 AI 比的是表达。 物理世界里的 AI 比的是可靠。 更深一层看,Physical AI 还会改变 AI 公司和传统行业公司的关系。 过去很多 AI 公司卖的是能力,给你一个 API,给你一个模型,剩下的事情交给客户自己想办法。可到了工厂、仓库、医院、港口,客户买的不是能力演示,而是停机时间减少了没有,良率提高了没有,安全事故下降了没有,人员培训成本降了没有。 这会逼 AI 公司从卖模型,转向卖结果。 卖结果就难了。你要懂现场,要能派工程师,要能和客户原有系统磨合,要能承认模型有边界。很多轻飘飘的 AI 叙事到这里都会掉下来,因为现实世界不接受模糊承诺。 但也正因为这样,Physical AI 一旦跑通,会形成更深的护城河。一个在真实工厂里迭代过一千次的机器人系统,背后有太多场景细节。那些细节写不进发布会 PPT,却会决定产品到底能不能活下来。 我觉得这可能是 AI 下半场最值得耐心看的地方。 不够热闹,但足够硬。 而可靠,恰恰是最贵、最慢、也最有壁垒的东西。

机器人和数字孪生被放到台前,AI 终于要从屏幕走向工厂了

过去两年,AI 最像魔法的时候,往往发生在屏幕里。
你输入一句话,它写出一篇文章。你给一张图,它生成一段视频。你丢一段代码,它帮你改 bug。所有这些都很震撼,但它们大多还停留在信息世界。
GTC Taipei 这次把另一个方向推到了台前,physical AI,机器人,数字孪生,智能工厂。
这个方向没那么容易做演示。
因为物理世界不讲情面。
文字生成错了,可以重写。图片生成歪了,可以再来一张。机器人在工厂里拿错零件、撞到设备、漏检瑕疵,代价就不一样了。物理世界有重量,有摩擦,有遮挡,有噪声,有安全责任。
所以我觉得,Physical AI 是 AI 行业真正从聪明走向可靠的一道关。
NVIDIA 官方 GTC Taipei 页面把 physical AI and robotics 放在重点主题里,博客里也提到了 Isaac GR00T、Isaac Teleop、机器人训练、工厂仿真、Omniverse、Cosmos、Metropolis 等组合。你把这些词连起来看,会发现英伟达想做的不是单个机器人。
它想做一套从虚拟到现实的训练系统。
这件事为什么重要?
因为机器人最缺的不是一个会说话的大脑,而是大量可用的训练数据和可靠的场景验证。人类小孩学会拿杯子,可以摔几次、试几次。工业机器人不能这样,它需要在上线前尽量知道各种情况怎么处理。
现实世界的数据很贵。
你要搭场地,要装传感器,要安排人操作,要处理安全风险,还要把大量视频和动作数据标注出来。更麻烦的是,很多罕见故障你很难等它自然发生,但真正上线时它偏偏会发生。
数字孪生和仿真的价值就在这里。
你可以在虚拟工厂里生成场景,制造瑕疵,改变光照,模拟设备移动,训练机器人面对各种边角情况。然后再把模型拿到真实工厂里测试,真实反馈再回到仿真环境里修正。
这就是 Physical AI 的闭环。
仿真不是游戏画面。
它是机器人进入现实之前的训练场。
如果这个闭环跑通,AI 行业会打开一个比聊天机器人更大的市场。制造、物流、医疗、农业、自动驾驶、仓储、能源巡检,这些行业都有大量物理任务。它们不需要一个只会写漂亮答案的 AI,它们需要一个能看、能判断、能行动、能承担后果的系统。
这会让 AI 公司的能力结构发生变化。
以前做 AI 产品,很多团队只需要模型、前端、后端、数据。做 Physical AI,你要懂传感器、控制、仿真、机器人硬件、现场流程、安全规范。软件和硬件会重新缠在一起。
这也是为什么英伟达在这里有天然优势。
它不只是有 GPU。它有 Omniverse 做仿真,有 Isaac 做机器人开发,有 Jetson 做边缘计算,有数据中心训练,有工业合作伙伴。它可以把机器人从训练到部署的链条尽量打通。
当然,不能把这件事想得太顺。
Physical AI 的落地速度不会像聊天机器人那么快。因为它要进入工厂,进入医院,进入仓库,进入道路。每个场景都有自己的规则,每个客户都有自己的设备,每个流程都有自己的历史包袱。AI 在屏幕里犯错,用户可能笑一笑。在物理世界里犯错,企业要承担损失。
所以这个行业不会一夜爆发。
但它一旦进入,壁垒也会很高。
一个机器人系统如果真的在工厂里跑起来,它积累的不只是模型参数,还有现场数据、流程经验、设备适配、工人协作、异常处理。这些东西很难被一个新模型轻易复制。
这对 AI 行业的深远影响,是把竞争从模型 API 扩展到真实世界的操作系统。
谁能把仿真、数据、模型、机器人和现场反馈连成闭环,谁就不只是卖软件,而是在重写行业流程。制造业里一个小瑕疵检测,一个换线流程,一个搬运动作,如果被 AI 稳定优化,背后都是成本、效率和质量的变化。
很多人问 AI 下一个杀手级应用是什么。
我有时候觉得,不一定是一个消费者 App。
可能是一条更聪明的产线。
可能是一个能学习的仓库。
可能是一家医院里不再只会送药,而是能理解流程的机器人。
这些东西不会像聊天机器人那样让每个人立刻上手,但它们一旦成立,会改变产业的底层成本。
GTC Taipei 把机器人和数字孪生放到台前,其实是在提醒我们,AI 不是只会改变屏幕里的工作,也会改变现实里的工作。
屏幕里的 AI 比的是表达。
物理世界里的 AI 比的是可靠。
更深一层看,Physical AI 还会改变 AI 公司和传统行业公司的关系。
过去很多 AI 公司卖的是能力,给你一个 API,给你一个模型,剩下的事情交给客户自己想办法。可到了工厂、仓库、医院、港口,客户买的不是能力演示,而是停机时间减少了没有,良率提高了没有,安全事故下降了没有,人员培训成本降了没有。
这会逼 AI 公司从卖模型,转向卖结果。
卖结果就难了。你要懂现场,要能派工程师,要能和客户原有系统磨合,要能承认模型有边界。很多轻飘飘的 AI 叙事到这里都会掉下来,因为现实世界不接受模糊承诺。
但也正因为这样,Physical AI 一旦跑通,会形成更深的护城河。一个在真实工厂里迭代过一千次的机器人系统,背后有太多场景细节。那些细节写不进发布会 PPT,却会决定产品到底能不能活下来。
我觉得这可能是 AI 下半场最值得耐心看的地方。
不够热闹,但足够硬。
而可靠,恰恰是最贵、最慢、也最有壁垒的东西。
Статья
См. перевод
GTC 为什么放在台北,AI 竞争正在变成供应链竞争AI PC 这几个字,过去一年多有点尴尬。 你去看电脑发布会,厂商会告诉你这是一台 AI 电脑。然后呢?多一个按键,多一个助手,多几个本地小功能。听起来都对,但很多人心里会默默问一句,我为什么要为它换机? 这不是消费者不懂 AI。 是过去很多 AI PC 没有把问题讲清楚。 GTC Taipei 上,英伟达把这个问题往前推了一步。NVIDIA 博客里提到 RTX Spark,把 Blackwell RTX GPU、Grace CPU、Windows、MediaTek 合作、本地个人 Agent 放到一起讲。最重要的不是 1 petaflop 这个数字本身,而是它把个人电脑重新定义成 Agent 的居住空间。 这句话可能比参数更重要。 过去电脑是人的工具。你打开 Photoshop,打开浏览器,打开 VS Code,打开 Excel。应用是主角,操作系统负责调度,人负责点击。 如果个人 Agent 真的成立,电脑就会变成另一种东西。它不只是等你打开应用,而是在你授权的边界里,持续理解你的文件、项目、日程、邮件、素材和工作习惯。它不只是回答问题,而是帮你把一件事从资料、执行到检查串起来。 这时候云端 AI 和本地 AI 的分工就变得很关键。 云端模型更强,更新更快,适合复杂推理和大规模能力。但个人数据、私密文件、低延迟操作、离线场景,不可能全部交给云端。一个真正好用的个人 Agent,必须知道你电脑里的东西,必须能和本地应用打交道,必须在很多微小任务上几乎没有等待。 这就是本地推理的价值。 不是为了证明电脑也能跑模型。 是为了让 Agent 能贴近人的日常。 你可以想象一个很普通的下午。你桌面上有一堆会议纪要,浏览器里开着十几个网页,微信里有人催你改方案,硬盘里还有上个月做过的一版 PPT。一个云端聊天机器人当然可以帮你写东西,但它不知道你电脑里哪些文件是最新的,不知道你刚刚改了哪一页,不知道某个客户更在意哪句话。 如果本地 Agent 能在授权下理解这些上下文,它就不只是一个问答框。 它会变成电脑的新入口。 这也是英伟达进军 Windows PC 的行业影响。AI PC 不是 PC 行业给自己找的新卖点,而是 AI 应用从云端服务走向个人工作空间的一次下沉。谁掌握这个入口,谁就有机会重新定义用户每天怎么和 AI 相处。 过去移动互联网最大的入口是手机。手机为什么厉害?不是因为它算力最强,而是因为它贴身、常开、知道你的位置和行为。AI 时代的个人电脑如果要重新重要起来,也不是靠跑分,而是靠它能不能成为个人智能体的长期容器。 这件事会影响很多行业。 对软件公司来说,应用可能要重新架构。NVIDIA 博客里提到 Adobe 为 RTX Spark 重新设计 Photoshop 和 Premiere 的 AI 与图形性能。这个细节很值得看,因为它说明 AI PC 不是硬件厂商单方面喊口号,真正的价值要通过应用重构释放出来。 如果应用不改,本地算力只是躺在那里。 如果应用改了,事情就不一样。剪辑软件可以把本地素材理解、生成、预览、渲染串起来。设计软件可以让 Agent 在你的项目文件里做建议。开发工具可以在本地代码库里理解上下文。办公软件可以把文档、表格、邮件、日程连起来。 这就是 AI PC 最真实的机会。 它不是让你多一个聊天窗口。 它是让电脑上的每个应用都变成 Agent 可以进入的工作场景。 当然,这里面也有很多难题。 本地 Agent 怎么授权?它能不能读我的文件?读到什么程度?它犯错了谁负责?它能不能自动发邮件、改文档、提交代码?如果它一直在后台运行,隐私和安全怎么保障?如果模型在本地变聪明,软件厂商和硬件厂商怎么分收益? 这些问题没有一个轻松。 但正因为难,才说明 AI PC 不是贴标签能解决的。 我自己觉得,AI PC 真正的分水岭不是第一批硬件有多强,而是接下来一两年会不会出现几个非它不可的使用场景。比如本地代码 Agent、本地视频剪辑 Agent、本地企业文档 Agent、本地设计 Agent。只要有一个场景让用户觉得,没有本地算力就明显不舒服,换机逻辑就会成立。 否则它还是营销词。 GTC Taipei 的深远影响在于,英伟达把个人电脑重新放回 AI 产业链的中心位置。过去大家觉得 AI 的未来在云里,在数据中心,在超大集群。现在它说,个人设备也要有自己的智能工厂,小一点,但离你更近。 这个判断如果成立,AI 行业会从云端 API 竞争,进入云端加本地的混合竞争。 模型公司要考虑模型如何在本地降尺寸、降延迟。软件公司要考虑应用如何开放给 Agent。硬件公司要考虑本地算力怎么被用户真正感知。操作系统公司要考虑权限、上下文、记忆和安全怎么设计。 你看,AI PC 终于不只是 PC 的事了。 它变成了个人 AI 入口之争。 以后我们买电脑,可能不再只问屏幕、续航、重量和性能。还会问,这台机器能不能放下我的个人 Agent,能不能安全地理解我的资料,能不能在我每天的工作里省掉那些反复的小动作。 那时候 AI PC 才算真正摆脱贴标签。

GTC 为什么放在台北,AI 竞争正在变成供应链竞争

AI PC 这几个字,过去一年多有点尴尬。
你去看电脑发布会,厂商会告诉你这是一台 AI 电脑。然后呢?多一个按键,多一个助手,多几个本地小功能。听起来都对,但很多人心里会默默问一句,我为什么要为它换机?
这不是消费者不懂 AI。
是过去很多 AI PC 没有把问题讲清楚。
GTC Taipei 上,英伟达把这个问题往前推了一步。NVIDIA 博客里提到 RTX Spark,把 Blackwell RTX GPU、Grace CPU、Windows、MediaTek 合作、本地个人 Agent 放到一起讲。最重要的不是 1 petaflop 这个数字本身,而是它把个人电脑重新定义成 Agent 的居住空间。
这句话可能比参数更重要。
过去电脑是人的工具。你打开 Photoshop,打开浏览器,打开 VS Code,打开 Excel。应用是主角,操作系统负责调度,人负责点击。
如果个人 Agent 真的成立,电脑就会变成另一种东西。它不只是等你打开应用,而是在你授权的边界里,持续理解你的文件、项目、日程、邮件、素材和工作习惯。它不只是回答问题,而是帮你把一件事从资料、执行到检查串起来。
这时候云端 AI 和本地 AI 的分工就变得很关键。
云端模型更强,更新更快,适合复杂推理和大规模能力。但个人数据、私密文件、低延迟操作、离线场景,不可能全部交给云端。一个真正好用的个人 Agent,必须知道你电脑里的东西,必须能和本地应用打交道,必须在很多微小任务上几乎没有等待。
这就是本地推理的价值。
不是为了证明电脑也能跑模型。
是为了让 Agent 能贴近人的日常。
你可以想象一个很普通的下午。你桌面上有一堆会议纪要,浏览器里开着十几个网页,微信里有人催你改方案,硬盘里还有上个月做过的一版 PPT。一个云端聊天机器人当然可以帮你写东西,但它不知道你电脑里哪些文件是最新的,不知道你刚刚改了哪一页,不知道某个客户更在意哪句话。
如果本地 Agent 能在授权下理解这些上下文,它就不只是一个问答框。
它会变成电脑的新入口。
这也是英伟达进军 Windows PC 的行业影响。AI PC 不是 PC 行业给自己找的新卖点,而是 AI 应用从云端服务走向个人工作空间的一次下沉。谁掌握这个入口,谁就有机会重新定义用户每天怎么和 AI 相处。
过去移动互联网最大的入口是手机。手机为什么厉害?不是因为它算力最强,而是因为它贴身、常开、知道你的位置和行为。AI 时代的个人电脑如果要重新重要起来,也不是靠跑分,而是靠它能不能成为个人智能体的长期容器。
这件事会影响很多行业。
对软件公司来说,应用可能要重新架构。NVIDIA 博客里提到 Adobe 为 RTX Spark 重新设计 Photoshop 和 Premiere 的 AI 与图形性能。这个细节很值得看,因为它说明 AI PC 不是硬件厂商单方面喊口号,真正的价值要通过应用重构释放出来。
如果应用不改,本地算力只是躺在那里。
如果应用改了,事情就不一样。剪辑软件可以把本地素材理解、生成、预览、渲染串起来。设计软件可以让 Agent 在你的项目文件里做建议。开发工具可以在本地代码库里理解上下文。办公软件可以把文档、表格、邮件、日程连起来。
这就是 AI PC 最真实的机会。
它不是让你多一个聊天窗口。
它是让电脑上的每个应用都变成 Agent 可以进入的工作场景。
当然,这里面也有很多难题。
本地 Agent 怎么授权?它能不能读我的文件?读到什么程度?它犯错了谁负责?它能不能自动发邮件、改文档、提交代码?如果它一直在后台运行,隐私和安全怎么保障?如果模型在本地变聪明,软件厂商和硬件厂商怎么分收益?
这些问题没有一个轻松。
但正因为难,才说明 AI PC 不是贴标签能解决的。
我自己觉得,AI PC 真正的分水岭不是第一批硬件有多强,而是接下来一两年会不会出现几个非它不可的使用场景。比如本地代码 Agent、本地视频剪辑 Agent、本地企业文档 Agent、本地设计 Agent。只要有一个场景让用户觉得,没有本地算力就明显不舒服,换机逻辑就会成立。
否则它还是营销词。
GTC Taipei 的深远影响在于,英伟达把个人电脑重新放回 AI 产业链的中心位置。过去大家觉得 AI 的未来在云里,在数据中心,在超大集群。现在它说,个人设备也要有自己的智能工厂,小一点,但离你更近。
这个判断如果成立,AI 行业会从云端 API 竞争,进入云端加本地的混合竞争。
模型公司要考虑模型如何在本地降尺寸、降延迟。软件公司要考虑应用如何开放给 Agent。硬件公司要考虑本地算力怎么被用户真正感知。操作系统公司要考虑权限、上下文、记忆和安全怎么设计。
你看,AI PC 终于不只是 PC 的事了。
它变成了个人 AI 入口之争。
以后我们买电脑,可能不再只问屏幕、续航、重量和性能。还会问,这台机器能不能放下我的个人 Agent,能不能安全地理解我的资料,能不能在我每天的工作里省掉那些反复的小动作。
那时候 AI PC 才算真正摆脱贴标签。
Статья
См. перевод
英伟达进军 Windows PC,AI 电脑终于要从标签变成真正的入口了AI PC 这几个字,过去一年多有点尴尬。 你去看电脑发布会,厂商会告诉你这是一台 AI 电脑。然后呢?多一个按键,多一个助手,多几个本地小功能。听起来都对,但很多人心里会默默问一句,我为什么要为它换机? 这不是消费者不懂 AI。 是过去很多 AI PC 没有把问题讲清楚。 GTC Taipei 上,英伟达把这个问题往前推了一步。NVIDIA 博客里提到 RTX Spark,把 Blackwell RTX GPU、Grace CPU、Windows、MediaTek 合作、本地个人 Agent 放到一起讲。最重要的不是 1 petaflop 这个数字本身,而是它把个人电脑重新定义成 Agent 的居住空间。 这句话可能比参数更重要。 过去电脑是人的工具。你打开 Photoshop,打开浏览器,打开 VS Code,打开 Excel。应用是主角,操作系统负责调度,人负责点击。 如果个人 Agent 真的成立,电脑就会变成另一种东西。它不只是等你打开应用,而是在你授权的边界里,持续理解你的文件、项目、日程、邮件、素材和工作习惯。它不只是回答问题,而是帮你把一件事从资料、执行到检查串起来。 这时候云端 AI 和本地 AI 的分工就变得很关键。 云端模型更强,更新更快,适合复杂推理和大规模能力。但个人数据、私密文件、低延迟操作、离线场景,不可能全部交给云端。一个真正好用的个人 Agent,必须知道你电脑里的东西,必须能和本地应用打交道,必须在很多微小任务上几乎没有等待。 这就是本地推理的价值。 不是为了证明电脑也能跑模型。 是为了让 Agent 能贴近人的日常。 你可以想象一个很普通的下午。你桌面上有一堆会议纪要,浏览器里开着十几个网页,微信里有人催你改方案,硬盘里还有上个月做过的一版 PPT。一个云端聊天机器人当然可以帮你写东西,但它不知道你电脑里哪些文件是最新的,不知道你刚刚改了哪一页,不知道某个客户更在意哪句话。 如果本地 Agent 能在授权下理解这些上下文,它就不只是一个问答框。 它会变成电脑的新入口。 这也是英伟达进军 Windows PC 的行业影响。AI PC 不是 PC 行业给自己找的新卖点,而是 AI 应用从云端服务走向个人工作空间的一次下沉。谁掌握这个入口,谁就有机会重新定义用户每天怎么和 AI 相处。 过去移动互联网最大的入口是手机。手机为什么厉害?不是因为它算力最强,而是因为它贴身、常开、知道你的位置和行为。AI 时代的个人电脑如果要重新重要起来,也不是靠跑分,而是靠它能不能成为个人智能体的长期容器。 这件事会影响很多行业。 对软件公司来说,应用可能要重新架构。NVIDIA 博客里提到 Adobe 为 RTX Spark 重新设计 Photoshop 和 Premiere 的 AI 与图形性能。这个细节很值得看,因为它说明 AI PC 不是硬件厂商单方面喊口号,真正的价值要通过应用重构释放出来。 如果应用不改,本地算力只是躺在那里。 如果应用改了,事情就不一样。剪辑软件可以把本地素材理解、生成、预览、渲染串起来。设计软件可以让 Agent 在你的项目文件里做建议。开发工具可以在本地代码库里理解上下文。办公软件可以把文档、表格、邮件、日程连起来。 这就是 AI PC 最真实的机会。 它不是让你多一个聊天窗口。 它是让电脑上的每个应用都变成 Agent 可以进入的工作场景。 当然,这里面也有很多难题。 本地 Agent 怎么授权?它能不能读我的文件?读到什么程度?它犯错了谁负责?它能不能自动发邮件、改文档、提交代码?如果它一直在后台运行,隐私和安全怎么保障?如果模型在本地变聪明,软件厂商和硬件厂商怎么分收益? 这些问题没有一个轻松。 但正因为难,才说明 AI PC 不是贴标签能解决的。 我自己觉得,AI PC 真正的分水岭不是第一批硬件有多强,而是接下来一两年会不会出现几个非它不可的使用场景。比如本地代码 Agent、本地视频剪辑 Agent、本地企业文档 Agent、本地设计 Agent。只要有一个场景让用户觉得,没有本地算力就明显不舒服,换机逻辑就会成立。 否则它还是营销词。 GTC Taipei 的深远影响在于,英伟达把个人电脑重新放回 AI 产业链的中心位置。过去大家觉得 AI 的未来在云里,在数据中心,在超大集群。现在它说,个人设备也要有自己的智能工厂,小一点,但离你更近。 这个判断如果成立,AI 行业会从云端 API 竞争,进入云端加本地的混合竞争。 模型公司要考虑模型如何在本地降尺寸、降延迟。软件公司要考虑应用如何开放给 Agent。硬件公司要考虑本地算力怎么被用户真正感知。操作系统公司要考虑权限、上下文、记忆和安全怎么设计。 你看,AI PC 终于不只是 PC 的事了。 它变成了个人 AI 入口之争。 以后我们买电脑,可能不再只问屏幕、续航、重量和性能。还会问,这台机器能不能放下我的个人 Agent,能不能安全地理解我的资料,能不能在我每天的工作里省掉那些反复的小动作。 那时候 AI PC 才算真正摆脱贴标签。

英伟达进军 Windows PC,AI 电脑终于要从标签变成真正的入口了

AI PC 这几个字,过去一年多有点尴尬。
你去看电脑发布会,厂商会告诉你这是一台 AI 电脑。然后呢?多一个按键,多一个助手,多几个本地小功能。听起来都对,但很多人心里会默默问一句,我为什么要为它换机?
这不是消费者不懂 AI。
是过去很多 AI PC 没有把问题讲清楚。
GTC Taipei 上,英伟达把这个问题往前推了一步。NVIDIA 博客里提到 RTX Spark,把 Blackwell RTX GPU、Grace CPU、Windows、MediaTek 合作、本地个人 Agent 放到一起讲。最重要的不是 1 petaflop 这个数字本身,而是它把个人电脑重新定义成 Agent 的居住空间。
这句话可能比参数更重要。
过去电脑是人的工具。你打开 Photoshop,打开浏览器,打开 VS Code,打开 Excel。应用是主角,操作系统负责调度,人负责点击。
如果个人 Agent 真的成立,电脑就会变成另一种东西。它不只是等你打开应用,而是在你授权的边界里,持续理解你的文件、项目、日程、邮件、素材和工作习惯。它不只是回答问题,而是帮你把一件事从资料、执行到检查串起来。
这时候云端 AI 和本地 AI 的分工就变得很关键。
云端模型更强,更新更快,适合复杂推理和大规模能力。但个人数据、私密文件、低延迟操作、离线场景,不可能全部交给云端。一个真正好用的个人 Agent,必须知道你电脑里的东西,必须能和本地应用打交道,必须在很多微小任务上几乎没有等待。
这就是本地推理的价值。
不是为了证明电脑也能跑模型。
是为了让 Agent 能贴近人的日常。
你可以想象一个很普通的下午。你桌面上有一堆会议纪要,浏览器里开着十几个网页,微信里有人催你改方案,硬盘里还有上个月做过的一版 PPT。一个云端聊天机器人当然可以帮你写东西,但它不知道你电脑里哪些文件是最新的,不知道你刚刚改了哪一页,不知道某个客户更在意哪句话。
如果本地 Agent 能在授权下理解这些上下文,它就不只是一个问答框。
它会变成电脑的新入口。
这也是英伟达进军 Windows PC 的行业影响。AI PC 不是 PC 行业给自己找的新卖点,而是 AI 应用从云端服务走向个人工作空间的一次下沉。谁掌握这个入口,谁就有机会重新定义用户每天怎么和 AI 相处。
过去移动互联网最大的入口是手机。手机为什么厉害?不是因为它算力最强,而是因为它贴身、常开、知道你的位置和行为。AI 时代的个人电脑如果要重新重要起来,也不是靠跑分,而是靠它能不能成为个人智能体的长期容器。
这件事会影响很多行业。
对软件公司来说,应用可能要重新架构。NVIDIA 博客里提到 Adobe 为 RTX Spark 重新设计 Photoshop 和 Premiere 的 AI 与图形性能。这个细节很值得看,因为它说明 AI PC 不是硬件厂商单方面喊口号,真正的价值要通过应用重构释放出来。
如果应用不改,本地算力只是躺在那里。
如果应用改了,事情就不一样。剪辑软件可以把本地素材理解、生成、预览、渲染串起来。设计软件可以让 Agent 在你的项目文件里做建议。开发工具可以在本地代码库里理解上下文。办公软件可以把文档、表格、邮件、日程连起来。
这就是 AI PC 最真实的机会。
它不是让你多一个聊天窗口。
它是让电脑上的每个应用都变成 Agent 可以进入的工作场景。
当然,这里面也有很多难题。
本地 Agent 怎么授权?它能不能读我的文件?读到什么程度?它犯错了谁负责?它能不能自动发邮件、改文档、提交代码?如果它一直在后台运行,隐私和安全怎么保障?如果模型在本地变聪明,软件厂商和硬件厂商怎么分收益?
这些问题没有一个轻松。
但正因为难,才说明 AI PC 不是贴标签能解决的。
我自己觉得,AI PC 真正的分水岭不是第一批硬件有多强,而是接下来一两年会不会出现几个非它不可的使用场景。比如本地代码 Agent、本地视频剪辑 Agent、本地企业文档 Agent、本地设计 Agent。只要有一个场景让用户觉得,没有本地算力就明显不舒服,换机逻辑就会成立。
否则它还是营销词。
GTC Taipei 的深远影响在于,英伟达把个人电脑重新放回 AI 产业链的中心位置。过去大家觉得 AI 的未来在云里,在数据中心,在超大集群。现在它说,个人设备也要有自己的智能工厂,小一点,但离你更近。
这个判断如果成立,AI 行业会从云端 API 竞争,进入云端加本地的混合竞争。
模型公司要考虑模型如何在本地降尺寸、降延迟。软件公司要考虑应用如何开放给 Agent。硬件公司要考虑本地算力怎么被用户真正感知。操作系统公司要考虑权限、上下文、记忆和安全怎么设计。
你看,AI PC 终于不只是 PC 的事了。
它变成了个人 AI 入口之争。
以后我们买电脑,可能不再只问屏幕、续航、重量和性能。还会问,这台机器能不能放下我的个人 Agent,能不能安全地理解我的资料,能不能在我每天的工作里省掉那些反复的小动作。
那时候 AI PC 才算真正摆脱贴标签。
Статья
См. перевод
Vera Rubin 不是一台更强的机器,而是英伟达想把 AI 工厂卖给全世界我以前看硬件发布会,最容易犯一个毛病。 看到新平台,就下意识去找参数,多少 GPU,多少带宽,多少性能提升,多少每瓦吞吐。 这当然有用。 但这次 GTC Taipei 里,Vera Rubin 更有意思的地方不在单个数字,而在英伟达把它讲成了一座工厂。 不是一台服务器。 是一座 AI 工厂。 这个说法很重要。因为工厂这个词,天然带着生产、良率、供应链、产能、单位成本。你不会只问一台机器厉不厉害,你会问整条线一天能生产多少,坏了能不能修,能耗能不能接受,零件能不能供上,生产出来的东西能不能卖掉。 AI 也开始进入这个逻辑了。 过去大家把数据中心看成成本中心,买机器,烧电,训练模型。模型训练完之后,真正的商业化还要另外说。今天英伟达在讲 token revenue,讲 AI factory,本质上是在把推理、Agent、长上下文、工具调用这些持续产生价值的工作,放进同一个生产逻辑里。 如果 token 是产品,AI 工厂就是生产 token 的工厂。 这句话听起来有点冷冰冰,但资本市场和企业采购最喜欢这种冷冰冰。因为一旦你能把 AI 产出和收入、成本、吞吐、能耗连起来,AI 就不再只是一个研发项目,它会变成企业的生产设施。 Vera Rubin 的意义也在这里。 NVIDIA 博客里提到,这个平台不是单独一个芯片,而是五机柜平台,包含 Vera Rubin NVL72 系统、Vera CPU、网络、存储、安全等组件。它还提到供应链规模比 Grace Blackwell 更大,有 150 个台湾生态伙伴,覆盖 350 多家工厂和 30 个国家。 这些数字为什么重要? 因为 AI 基建已经不是单点创新能解决的事情了。你有最强 GPU,但网络跟不上,集群就跑不满。你有模型,但存储和安全处理不顺,企业就不敢上。你能训练,但推理成本降不下来,商业化就卡住。你能做一台样机,但供应链爬不上去,客户等不到货。 所以英伟达在 GTC Taipei 做的事情,其实是把自己从芯片供应商继续往上推。 它想成为 AI 工厂的总包商。 这个词可能不够科技感,但很贴切。客户不想自己攒一套复杂系统,不想在 CPU、GPU、网络、存储、安全、机柜、冷却之间做无休止集成。客户想要的是一套能跑起来、能扩展、能交付业务结果的系统。 这会深刻改变 AI 行业的竞争格局。 以前模型公司很像互联网公司,靠算法和数据拉开差距。现在头部 AI 公司越来越像重资产工业公司,融资之后要买算力,要锁供应链,要谈云合同,要优化单位推理成本。模型能力当然还重要,但模型背后的产能越来越重要。 这也是为什么 AI 创业公司看起来越来越不像传统创业公司。 一家公司如果要训练和服务最前沿模型,就要面对电力、机房、芯片供货、集群调度、网络瓶颈、硬件折旧。听起来像什么? 像制造业。 只不过制造的不是钢铁、汽车或者手机,而是 intelligence。 这个变化会让 AI 行业出现一个很微妙的分层。最上层是能自己建设或者锁定 AI 工厂的公司,它们有资本、有客户、有长期合同。中间是依赖云和 API 做应用的公司,它们必须把模型成本管理到非常精细。再下面是大量工具型产品,如果不能进入稳定工作流,就很容易被更便宜的模型和平台功能挤压。 我不是说应用公司没机会。 恰恰相反,应用公司机会很大。 但应用公司不能再假装底层成本不存在。以前做 SaaS,服务器成本占比可控,用户增长起来之后毛利很好看。AI 应用不一样,你每自动化一步,背后都可能多一串推理、检索、工具调用和审查。产品越强,成本可能越高。听起来有点反直觉,但这就是 AI 应用商业化最麻烦的地方。 Vera Rubin 这种平台真正要解决的,是把 AI 的单位生产成本打下来,把吞吐提上去,让 AI 工厂变成可复制基础设施。 一旦这个事情跑通,AI 行业会发生两个变化。 一个变化是,基础设施公司会越来越像能源公司。客户关心的不只是你有没有最强模型,而是你能不能稳定供应算力,能不能控制成本,能不能在峰值需求时扛住,能不能让每一次推理都更便宜。 另一个变化是,企业会开始用生产系统的眼光看 AI。不是买一个创新项目试试看,而是问,哪些业务流程值得接入 AI 工厂,哪些任务能形成持续产出,哪些岗位会被 Agent 增强,哪些数据要进入生产线。 这会让很多 AI 项目的验收标准变得更残酷。 以前一个 AI demo 做得很酷,大家会说未来可期。以后老板可能会问,跑一万次要多少钱,失败率多少,延迟多少,谁负责修,能不能接入现有系统,三个月后是不是还能稳定运行。 这个问题一点都不浪漫。 但行业就是这么成熟的。 从玩具到工具,从工具到生产线,从生产线到基础设施。每一个技术浪潮最后都会走这条路。互联网如此,云计算如此,AI 也大概率如此。 GTC Taipei 这场发布会最深的影响,是它把 AI 从模型竞赛又往产业竞赛推了一步。以后我们看一家 AI 公司,不能只看它的模型是不是强,还要看它有没有产能,有没有成本优势,有没有供应链位置,有没有持续把智能生产出来的能力。 这会让竞争变得更重。 但也会让真正能解决问题的产品变得更值钱。 因为当 AI 工厂越来越强,应用层的稀缺性会从会不会调用模型,转向你知不知道该把智能放进哪条生产线。 说到底,Vera Rubin 卖的不是一堆硬件。 它卖的是 AI 工业化的想象力。

Vera Rubin 不是一台更强的机器,而是英伟达想把 AI 工厂卖给全世界

我以前看硬件发布会,最容易犯一个毛病。
看到新平台,就下意识去找参数,多少 GPU,多少带宽,多少性能提升,多少每瓦吞吐。
这当然有用。
但这次 GTC Taipei 里,Vera Rubin 更有意思的地方不在单个数字,而在英伟达把它讲成了一座工厂。
不是一台服务器。
是一座 AI 工厂。
这个说法很重要。因为工厂这个词,天然带着生产、良率、供应链、产能、单位成本。你不会只问一台机器厉不厉害,你会问整条线一天能生产多少,坏了能不能修,能耗能不能接受,零件能不能供上,生产出来的东西能不能卖掉。
AI 也开始进入这个逻辑了。
过去大家把数据中心看成成本中心,买机器,烧电,训练模型。模型训练完之后,真正的商业化还要另外说。今天英伟达在讲 token revenue,讲 AI factory,本质上是在把推理、Agent、长上下文、工具调用这些持续产生价值的工作,放进同一个生产逻辑里。
如果 token 是产品,AI 工厂就是生产 token 的工厂。
这句话听起来有点冷冰冰,但资本市场和企业采购最喜欢这种冷冰冰。因为一旦你能把 AI 产出和收入、成本、吞吐、能耗连起来,AI 就不再只是一个研发项目,它会变成企业的生产设施。
Vera Rubin 的意义也在这里。
NVIDIA 博客里提到,这个平台不是单独一个芯片,而是五机柜平台,包含 Vera Rubin NVL72 系统、Vera CPU、网络、存储、安全等组件。它还提到供应链规模比 Grace Blackwell 更大,有 150 个台湾生态伙伴,覆盖 350 多家工厂和 30 个国家。
这些数字为什么重要?
因为 AI 基建已经不是单点创新能解决的事情了。你有最强 GPU,但网络跟不上,集群就跑不满。你有模型,但存储和安全处理不顺,企业就不敢上。你能训练,但推理成本降不下来,商业化就卡住。你能做一台样机,但供应链爬不上去,客户等不到货。
所以英伟达在 GTC Taipei 做的事情,其实是把自己从芯片供应商继续往上推。
它想成为 AI 工厂的总包商。
这个词可能不够科技感,但很贴切。客户不想自己攒一套复杂系统,不想在 CPU、GPU、网络、存储、安全、机柜、冷却之间做无休止集成。客户想要的是一套能跑起来、能扩展、能交付业务结果的系统。
这会深刻改变 AI 行业的竞争格局。
以前模型公司很像互联网公司,靠算法和数据拉开差距。现在头部 AI 公司越来越像重资产工业公司,融资之后要买算力,要锁供应链,要谈云合同,要优化单位推理成本。模型能力当然还重要,但模型背后的产能越来越重要。
这也是为什么 AI 创业公司看起来越来越不像传统创业公司。
一家公司如果要训练和服务最前沿模型,就要面对电力、机房、芯片供货、集群调度、网络瓶颈、硬件折旧。听起来像什么?
像制造业。
只不过制造的不是钢铁、汽车或者手机,而是 intelligence。
这个变化会让 AI 行业出现一个很微妙的分层。最上层是能自己建设或者锁定 AI 工厂的公司,它们有资本、有客户、有长期合同。中间是依赖云和 API 做应用的公司,它们必须把模型成本管理到非常精细。再下面是大量工具型产品,如果不能进入稳定工作流,就很容易被更便宜的模型和平台功能挤压。
我不是说应用公司没机会。
恰恰相反,应用公司机会很大。
但应用公司不能再假装底层成本不存在。以前做 SaaS,服务器成本占比可控,用户增长起来之后毛利很好看。AI 应用不一样,你每自动化一步,背后都可能多一串推理、检索、工具调用和审查。产品越强,成本可能越高。听起来有点反直觉,但这就是 AI 应用商业化最麻烦的地方。
Vera Rubin 这种平台真正要解决的,是把 AI 的单位生产成本打下来,把吞吐提上去,让 AI 工厂变成可复制基础设施。
一旦这个事情跑通,AI 行业会发生两个变化。
一个变化是,基础设施公司会越来越像能源公司。客户关心的不只是你有没有最强模型,而是你能不能稳定供应算力,能不能控制成本,能不能在峰值需求时扛住,能不能让每一次推理都更便宜。
另一个变化是,企业会开始用生产系统的眼光看 AI。不是买一个创新项目试试看,而是问,哪些业务流程值得接入 AI 工厂,哪些任务能形成持续产出,哪些岗位会被 Agent 增强,哪些数据要进入生产线。
这会让很多 AI 项目的验收标准变得更残酷。
以前一个 AI demo 做得很酷,大家会说未来可期。以后老板可能会问,跑一万次要多少钱,失败率多少,延迟多少,谁负责修,能不能接入现有系统,三个月后是不是还能稳定运行。
这个问题一点都不浪漫。
但行业就是这么成熟的。
从玩具到工具,从工具到生产线,从生产线到基础设施。每一个技术浪潮最后都会走这条路。互联网如此,云计算如此,AI 也大概率如此。
GTC Taipei 这场发布会最深的影响,是它把 AI 从模型竞赛又往产业竞赛推了一步。以后我们看一家 AI 公司,不能只看它的模型是不是强,还要看它有没有产能,有没有成本优势,有没有供应链位置,有没有持续把智能生产出来的能力。
这会让竞争变得更重。
但也会让真正能解决问题的产品变得更值钱。
因为当 AI 工厂越来越强,应用层的稀缺性会从会不会调用模型,转向你知不知道该把智能放进哪条生产线。
说到底,Vera Rubin 卖的不是一堆硬件。
它卖的是 AI 工业化的想象力。
Статья
См. перевод
黄仁勋说 CPU 要给 Agent 用,AI 行业真正的转折可能在这里我看到 GTC Taipei 这场发布会里最有意思的一句话,不是某个参数涨了多少,也不是某个机柜又多厉害。 是黄仁勋讲 Vera CPU 的时候,说过去 CPU 是给人用的,未来会有 billions of agents,Agent 会非常没耐心地使用 CPU。 这句话听起来像舞台金句,但你仔细想想,有点吓人。 以前我们讨论 AI,大部分时候默认使用者是人。一个人打开 ChatGPT,问一句,等几秒,复制结果,走人。哪怕是企业里的 AI 助手,本质上还是人在发起动作。人是节奏的主人,AI 是被叫来的帮手。 但 Agent 不是这样。 Agent 一旦真的进入工作流,它不是问一句答一句。它会拆任务,会查资料,会调用工具,会跑代码,会反复检查结果,会在一个流程里等待、重试、修正、提交。它的动作不是一次请求,而是一串请求。它不是偶尔用一下算力,而是持续吃算力。 这才是 GTC Taipei 这场会最值得行业认真看的地方。 英伟达想讲的不是 AI 又聪明了。 它想讲的是,AI 有了新的使用者。 过去十年,互联网的核心用户是人,所以产品设计围绕人的注意力展开。谁能让人多停留一分钟,谁就更有价值。移动互联网最疯狂的时候,本质上是在争夺人的眼睛、手指和时间。 到了 Agent 时代,新的用户不只有人,还有一批自动运行的软件劳动力。它们不刷短视频,不看广告,不会因为界面漂亮多留一会儿。它们只关心一件事,任务能不能跑完,工具能不能调通,结果能不能验收。 所以整个 AI 行业的底层指标会变。 以前模型公司喜欢比谁更聪明,谁的 benchmark 更高,谁的多模态更炸。这个当然重要,但如果 Agent 成为真实使用者,问题会变成另一个样子,谁能让一万个 Agent 同时低成本运行,谁能让它们少等待,谁能让工具调用和数据处理不卡住,谁能让失败重试的成本降下来。 这也是为什么 NVIDIA 会把 Vera 称作给 Agent 的 CPU。 很多人看 AI 基建,只盯 GPU。因为大模型训练和推理最亮眼的部分都在 GPU 上。但 Agent 工作流里,有大量事情并不只是 GPU 的事。Python 运行时、沙盒代码执行、数据库处理、文件检索、工具编排、网络和安全,这些都在吃 CPU、内存、存储、网络。 你想想一个很朴素的场景。 一个企业让 Agent 帮销售团队整理客户线索。它要读 CRM,查邮件,生成拜访摘要,调用公司知识库,检查合规词,最后把结果写回系统。这里最贵的那一步可能不是模型输出,而是它在很多系统之间来回搬数据、调接口、等返回。 如果有一百个销售还好。 如果有十万个销售,如果每个人背后都有几个 Agent,如果这些 Agent 每天跑几轮任务,那整个公司就不是买了一个聊天机器人。 它是在养一批数字员工。 数字员工和真人员工有一个很大的区别,真人会下班,Agent 理论上不会。真人一天有效工作几个小时,Agent 可以一晚上跑掉几万个小任务。以前企业买软件,是买座席数。以后企业买 AI,可能更像买吞吐量、买延迟、买可靠性。 这时候 AI 行业的竞争就从模型层往系统层下沉。 我知道这句话听起来不如模型发布刺激,但它可能更重要。 因为模型能力一旦进入相对趋同阶段,真正决定商业化速度的,往往是运行成本和流程嵌入。一个 Agent 如果每次调用都很贵,每次跑流程都卡,每次出错都需要人擦屁股,那它就只能停留在演示视频里。演示视频很好看,老板也会点头,但到了财务那里,账就过不去。 反过来,如果 Agent 能稳定、低延迟、可审计地跑起来,哪怕它不是全世界最聪明的模型,也可能先进入企业预算。 这就是英伟达真正想抓住的地方。 它不是只卖芯片。它是在提前定义 Agent 时代的计算形态。模型公司负责让 Agent 更聪明,应用公司负责让 Agent 更好用,英伟达想负责让 Agent 能大规模活着。 活着这个词,我觉得很准确。 因为 Agent 不再是一次性回答,它是一种长期运行的状态。它要有运行时,要有安全边界,要有工具权限,要有数据通道,要有失败恢复。它像一个住在企业系统里的新物种。 说到这里,有人可能会觉得,这跟普通人有什么关系呢?我们又不买数据中心。 关系其实很大。 当 Agent 成为新的算力消费者,AI 应用的商业模式会跟着变。过去你买一个 AI 工具,可能按月付费,底层成本还可以用订阅摊掉。以后如果一个工具背后有很多 Agent 持续执行任务,厂商就必须重新设计价格。按人头收费可能不够,按任务收费可能更合理,按结果收费又会带来新的验收问题。 也就是说,AI 产品经理要开始懂成本曲线了。 你不能只问,用户想要什么功能。你还要问,这个功能背后会触发多少次模型调用,多少次工具调用,多少次数据读写,多少次失败重试。功能越自动化,成本越不再透明。 这也是很多 AI 应用今天看起来很热闹,但商业上迟迟不舒服的原因。 不是用户不需要。 是单位经济账还没有完全跑顺。 GTC Taipei 把这件事摆到了台面上。Vera CPU、Vera Rubin、AI factory、Agent runtime,这些词放在一起,其实是在讲同一个判断,AI 的下一阶段不是把一个模型接进网页,而是让一批 Agent 在企业、个人电脑和机器人系统里长期运行。 如果这个判断成立,整个行业会出现三类新机会。 一类是基础设施机会,围绕 Agent 的 CPU、网络、存储、安全、调度、可观测性都会变重要。以前大家觉得这些是后端工程的苦活,未来可能会变成 AI 时代的关键入口。 一类是应用机会,谁能把 Agent 放进真实流程,而不是做一个漂亮的聊天框,谁就更可能留下来。因为 Agent 真正的价值不是会说话,而是能把一件事从开始推到结束。 还有一类是组织机会,企业会重新设计岗位。不是所有人都要学写提示词,但很多人要学会把任务拆成 Agent 能执行、能验收、能纠错的流程。 这件事挺现实的。 AI 不会因为发布会说得漂亮就自动改变世界。Agent 也不会因为叫 Agent 就能干活。中间有大量脏活,权限、数据、流程、成本、责任,每一项都能把一个演示级产品拖回地面。 但我觉得 GTC Taipei 的价值就在这里。 它让我们看到,AI 行业正在从聪明的模型,走向能工作的系统。 如果说过去两年,大家都在问模型会不会替代人。 那么接下来更值得问的是,谁能让 Agent 真正进入工作流,谁能承担它运行时的成本和责任,谁能让它每天都能稳定地打开。 这才是新一轮 AI 竞争的起点。

黄仁勋说 CPU 要给 Agent 用,AI 行业真正的转折可能在这里

我看到 GTC Taipei 这场发布会里最有意思的一句话,不是某个参数涨了多少,也不是某个机柜又多厉害。
是黄仁勋讲 Vera CPU 的时候,说过去 CPU 是给人用的,未来会有 billions of agents,Agent 会非常没耐心地使用 CPU。
这句话听起来像舞台金句,但你仔细想想,有点吓人。
以前我们讨论 AI,大部分时候默认使用者是人。一个人打开 ChatGPT,问一句,等几秒,复制结果,走人。哪怕是企业里的 AI 助手,本质上还是人在发起动作。人是节奏的主人,AI 是被叫来的帮手。
但 Agent 不是这样。
Agent 一旦真的进入工作流,它不是问一句答一句。它会拆任务,会查资料,会调用工具,会跑代码,会反复检查结果,会在一个流程里等待、重试、修正、提交。它的动作不是一次请求,而是一串请求。它不是偶尔用一下算力,而是持续吃算力。
这才是 GTC Taipei 这场会最值得行业认真看的地方。
英伟达想讲的不是 AI 又聪明了。
它想讲的是,AI 有了新的使用者。
过去十年,互联网的核心用户是人,所以产品设计围绕人的注意力展开。谁能让人多停留一分钟,谁就更有价值。移动互联网最疯狂的时候,本质上是在争夺人的眼睛、手指和时间。
到了 Agent 时代,新的用户不只有人,还有一批自动运行的软件劳动力。它们不刷短视频,不看广告,不会因为界面漂亮多留一会儿。它们只关心一件事,任务能不能跑完,工具能不能调通,结果能不能验收。
所以整个 AI 行业的底层指标会变。
以前模型公司喜欢比谁更聪明,谁的 benchmark 更高,谁的多模态更炸。这个当然重要,但如果 Agent 成为真实使用者,问题会变成另一个样子,谁能让一万个 Agent 同时低成本运行,谁能让它们少等待,谁能让工具调用和数据处理不卡住,谁能让失败重试的成本降下来。
这也是为什么 NVIDIA 会把 Vera 称作给 Agent 的 CPU。
很多人看 AI 基建,只盯 GPU。因为大模型训练和推理最亮眼的部分都在 GPU 上。但 Agent 工作流里,有大量事情并不只是 GPU 的事。Python 运行时、沙盒代码执行、数据库处理、文件检索、工具编排、网络和安全,这些都在吃 CPU、内存、存储、网络。
你想想一个很朴素的场景。
一个企业让 Agent 帮销售团队整理客户线索。它要读 CRM,查邮件,生成拜访摘要,调用公司知识库,检查合规词,最后把结果写回系统。这里最贵的那一步可能不是模型输出,而是它在很多系统之间来回搬数据、调接口、等返回。
如果有一百个销售还好。
如果有十万个销售,如果每个人背后都有几个 Agent,如果这些 Agent 每天跑几轮任务,那整个公司就不是买了一个聊天机器人。
它是在养一批数字员工。
数字员工和真人员工有一个很大的区别,真人会下班,Agent 理论上不会。真人一天有效工作几个小时,Agent 可以一晚上跑掉几万个小任务。以前企业买软件,是买座席数。以后企业买 AI,可能更像买吞吐量、买延迟、买可靠性。
这时候 AI 行业的竞争就从模型层往系统层下沉。
我知道这句话听起来不如模型发布刺激,但它可能更重要。
因为模型能力一旦进入相对趋同阶段,真正决定商业化速度的,往往是运行成本和流程嵌入。一个 Agent 如果每次调用都很贵,每次跑流程都卡,每次出错都需要人擦屁股,那它就只能停留在演示视频里。演示视频很好看,老板也会点头,但到了财务那里,账就过不去。
反过来,如果 Agent 能稳定、低延迟、可审计地跑起来,哪怕它不是全世界最聪明的模型,也可能先进入企业预算。
这就是英伟达真正想抓住的地方。
它不是只卖芯片。它是在提前定义 Agent 时代的计算形态。模型公司负责让 Agent 更聪明,应用公司负责让 Agent 更好用,英伟达想负责让 Agent 能大规模活着。
活着这个词,我觉得很准确。
因为 Agent 不再是一次性回答,它是一种长期运行的状态。它要有运行时,要有安全边界,要有工具权限,要有数据通道,要有失败恢复。它像一个住在企业系统里的新物种。
说到这里,有人可能会觉得,这跟普通人有什么关系呢?我们又不买数据中心。
关系其实很大。
当 Agent 成为新的算力消费者,AI 应用的商业模式会跟着变。过去你买一个 AI 工具,可能按月付费,底层成本还可以用订阅摊掉。以后如果一个工具背后有很多 Agent 持续执行任务,厂商就必须重新设计价格。按人头收费可能不够,按任务收费可能更合理,按结果收费又会带来新的验收问题。
也就是说,AI 产品经理要开始懂成本曲线了。
你不能只问,用户想要什么功能。你还要问,这个功能背后会触发多少次模型调用,多少次工具调用,多少次数据读写,多少次失败重试。功能越自动化,成本越不再透明。
这也是很多 AI 应用今天看起来很热闹,但商业上迟迟不舒服的原因。
不是用户不需要。
是单位经济账还没有完全跑顺。
GTC Taipei 把这件事摆到了台面上。Vera CPU、Vera Rubin、AI factory、Agent runtime,这些词放在一起,其实是在讲同一个判断,AI 的下一阶段不是把一个模型接进网页,而是让一批 Agent 在企业、个人电脑和机器人系统里长期运行。
如果这个判断成立,整个行业会出现三类新机会。
一类是基础设施机会,围绕 Agent 的 CPU、网络、存储、安全、调度、可观测性都会变重要。以前大家觉得这些是后端工程的苦活,未来可能会变成 AI 时代的关键入口。
一类是应用机会,谁能把 Agent 放进真实流程,而不是做一个漂亮的聊天框,谁就更可能留下来。因为 Agent 真正的价值不是会说话,而是能把一件事从开始推到结束。
还有一类是组织机会,企业会重新设计岗位。不是所有人都要学写提示词,但很多人要学会把任务拆成 Agent 能执行、能验收、能纠错的流程。
这件事挺现实的。
AI 不会因为发布会说得漂亮就自动改变世界。Agent 也不会因为叫 Agent 就能干活。中间有大量脏活,权限、数据、流程、成本、责任,每一项都能把一个演示级产品拖回地面。
但我觉得 GTC Taipei 的价值就在这里。
它让我们看到,AI 行业正在从聪明的模型,走向能工作的系统。
如果说过去两年,大家都在问模型会不会替代人。
那么接下来更值得问的是,谁能让 Agent 真正进入工作流,谁能承担它运行时的成本和责任,谁能让它每天都能稳定地打开。
这才是新一轮 AI 竞争的起点。
См. перевод
2026.06.04
2026.06.04
Статья
См. перевод
便宜模型开始变强:AI 的下一场竞争不是“谁最聪明”过去聊 AI 模型,大家最爱问一个问题,谁最聪明。 谁推理更强,谁代码更好,谁数学更稳,谁多模态更惊艳。 这个问题当然重要。 但到了应用商业化阶段,它不再是唯一的问题,甚至很多时候不是最先要问的问题。 真正该问的是,够不够用,快不快,便不便宜,能不能稳定跑在你的业务里。 这就是便宜模型变强以后,AI 竞争开始发生的变化。 以前大模型像奢侈发动机。你把它装进产品里,演示效果很好,但只要用户量上来,成本就开始咬人。一次调用看起来不贵,成千上万次调用叠起来,毛利就会被吃掉。 而且很多真实任务,并不需要最聪明的模型。 客服分流、固定格式摘要、表格抽取、工单分类、标题改写、短文本翻译、知识库检索后的回答,这些任务需要的是稳定、快速、便宜、可控。 如果一个小模型能把这些事做得八九不离十,它就很有商业价值。 因为产品最终不是在比赛模型排行榜。 产品是在算一笔账。 每次用户操作花多少钱。 响应要等几秒。 出错后谁来兜底。 能不能部署到客户自己的环境。 数据能不能少出门。 这些问题,比谁在通用测试里多赢几分更接近生意。 便宜模型变强以后,AI 应用会出现一个很重要的分工。 简单任务交给小模型。 复杂判断交给大模型。 高频流程交给低成本模型。 关键节点再调用更强模型。 这听起来像技术架构,其实是商业架构。 因为它决定一个 AI 产品能不能从试用走向规模化。 很多 AI 应用死在一个地方,演示阶段没有成本压力,正式上线才发现每一次用户使用都是亏的。产品经理只看生成效果,财务看的是毛利,客户看的是稳定,用户看的是等待时间。 低成本模型的意义就在这里。 它不是替代所有强模型。 它是让 AI 从一个炫技功能,变成可以被嵌进业务流程里的日常能力。 再说延迟。 很多人低估了速度对产品的影响。 如果用户在聊天窗口里等 8 秒,他会觉得你在思考。 如果用户在办公软件里每个动作都等 8 秒,他会觉得你坏了。 AI 一旦进入工作流,就不能只看最终答案质量,还要看交互节奏。 写作助手可以慢一点。 客服助手不能慢。 实时翻译不能慢。 销售跟进建议不能每次让人等半天。 本地办公、端侧助手、移动设备上的 AI 功能,更是如此。 低延迟让 AI 从一个被动调用的工具,变成一个随手可用的界面层。 这会改变产品设计。 过去我们设计 AI 功能,常常是一个按钮,点一下,等生成。 未来更多 AI 功能会像自动补全、实时建议、即时归类、边写边改。它不再占据一个独立页面,而是贴在工作过程里。 这时候最强模型未必最合适。 最合适的模型,是那个在质量、成本、速度和可控性之间达到平衡的模型。 所以 AI 的下一场竞争,不是简单的谁最聪明。 而是谁更会调度模型。 产品里可能同时有大模型、小模型、规则系统、检索系统、缓存、人工复核。用户看不到这些东西,但它们决定产品能不能稳定交付。 这对创业团队反而是机会。 因为如果竞争只剩最强模型,中小团队没有太多话语权。 但如果竞争转向模型编排、场景理解、成本控制和产品体验,小团队就有空间。 一个垂直场景里,最有价值的不一定是最贵的模型。 可能是一个小模型,加上一套干净的数据结构,一组高质量样例,一个清楚的验收流程。 这也是为什么便宜模型变强以后,AI 应用会更像软件生意。 你要算成本。 你要做分层。 你要定义任务。 你要知道哪些错误可以接受,哪些错误必须人工复核。 你要把模型能力藏在产品背后,而不是让用户每次都面对一个万能输入框。 最后给产品团队一份清单。 第一,把功能拆成高频低风险、低频高风险、需要强推理、只需要格式处理四类。 第二,高频低风险任务优先尝试低成本模型。 第三,对用户体验敏感的场景,把延迟当成核心指标。 第四,不要只看模型单次效果,要看稳定性、失败率和返工成本。 第五,把强模型留给关键判断,不要让它处理所有重复劳动。 第六,记录每个任务的单位成本,别等用户量起来才算账。 第七,把模型选择做成产品能力,而不是临时技术决策。 便宜模型变强,不会让强模型失去价值。 它会让 AI 产品真正开始分工。 而一旦开始分工,竞争就从模型智商,转向产品基本功。

便宜模型开始变强:AI 的下一场竞争不是“谁最聪明”

过去聊 AI 模型,大家最爱问一个问题,谁最聪明。
谁推理更强,谁代码更好,谁数学更稳,谁多模态更惊艳。
这个问题当然重要。
但到了应用商业化阶段,它不再是唯一的问题,甚至很多时候不是最先要问的问题。
真正该问的是,够不够用,快不快,便不便宜,能不能稳定跑在你的业务里。
这就是便宜模型变强以后,AI 竞争开始发生的变化。
以前大模型像奢侈发动机。你把它装进产品里,演示效果很好,但只要用户量上来,成本就开始咬人。一次调用看起来不贵,成千上万次调用叠起来,毛利就会被吃掉。
而且很多真实任务,并不需要最聪明的模型。
客服分流、固定格式摘要、表格抽取、工单分类、标题改写、短文本翻译、知识库检索后的回答,这些任务需要的是稳定、快速、便宜、可控。
如果一个小模型能把这些事做得八九不离十,它就很有商业价值。
因为产品最终不是在比赛模型排行榜。
产品是在算一笔账。
每次用户操作花多少钱。
响应要等几秒。
出错后谁来兜底。
能不能部署到客户自己的环境。
数据能不能少出门。
这些问题,比谁在通用测试里多赢几分更接近生意。
便宜模型变强以后,AI 应用会出现一个很重要的分工。
简单任务交给小模型。
复杂判断交给大模型。
高频流程交给低成本模型。
关键节点再调用更强模型。
这听起来像技术架构,其实是商业架构。
因为它决定一个 AI 产品能不能从试用走向规模化。
很多 AI 应用死在一个地方,演示阶段没有成本压力,正式上线才发现每一次用户使用都是亏的。产品经理只看生成效果,财务看的是毛利,客户看的是稳定,用户看的是等待时间。
低成本模型的意义就在这里。
它不是替代所有强模型。
它是让 AI 从一个炫技功能,变成可以被嵌进业务流程里的日常能力。
再说延迟。
很多人低估了速度对产品的影响。
如果用户在聊天窗口里等 8 秒,他会觉得你在思考。
如果用户在办公软件里每个动作都等 8 秒,他会觉得你坏了。
AI 一旦进入工作流,就不能只看最终答案质量,还要看交互节奏。
写作助手可以慢一点。
客服助手不能慢。
实时翻译不能慢。
销售跟进建议不能每次让人等半天。
本地办公、端侧助手、移动设备上的 AI 功能,更是如此。
低延迟让 AI 从一个被动调用的工具,变成一个随手可用的界面层。
这会改变产品设计。
过去我们设计 AI 功能,常常是一个按钮,点一下,等生成。
未来更多 AI 功能会像自动补全、实时建议、即时归类、边写边改。它不再占据一个独立页面,而是贴在工作过程里。
这时候最强模型未必最合适。
最合适的模型,是那个在质量、成本、速度和可控性之间达到平衡的模型。
所以 AI 的下一场竞争,不是简单的谁最聪明。
而是谁更会调度模型。
产品里可能同时有大模型、小模型、规则系统、检索系统、缓存、人工复核。用户看不到这些东西,但它们决定产品能不能稳定交付。
这对创业团队反而是机会。
因为如果竞争只剩最强模型,中小团队没有太多话语权。
但如果竞争转向模型编排、场景理解、成本控制和产品体验,小团队就有空间。
一个垂直场景里,最有价值的不一定是最贵的模型。
可能是一个小模型,加上一套干净的数据结构,一组高质量样例,一个清楚的验收流程。
这也是为什么便宜模型变强以后,AI 应用会更像软件生意。
你要算成本。
你要做分层。
你要定义任务。
你要知道哪些错误可以接受,哪些错误必须人工复核。
你要把模型能力藏在产品背后,而不是让用户每次都面对一个万能输入框。
最后给产品团队一份清单。
第一,把功能拆成高频低风险、低频高风险、需要强推理、只需要格式处理四类。
第二,高频低风险任务优先尝试低成本模型。
第三,对用户体验敏感的场景,把延迟当成核心指标。
第四,不要只看模型单次效果,要看稳定性、失败率和返工成本。
第五,把强模型留给关键判断,不要让它处理所有重复劳动。
第六,记录每个任务的单位成本,别等用户量起来才算账。
第七,把模型选择做成产品能力,而不是临时技术决策。
便宜模型变强,不会让强模型失去价值。
它会让 AI 产品真正开始分工。
而一旦开始分工,竞争就从模型智商,转向产品基本功。
Проверено
Статья
См. перевод
比特币跌,NEAR 涨比特币为什么大跌?#btc #Near 第一,最大的情绪触发点是 Strategy 罕见卖出 BTC。Strategy 以前一直被市场视为“只买不卖”的比特币信仰锚,这次披露卖出 32 枚 BTC,虽然金额相对其持仓很小,但打击的是市场心理:连最强 HODL 叙事都出现裂缝,短线交易员自然先跑。 第二,现货 BTC ETF 出现资金流出,削弱了此前支撑 BTC 的主要买盘。最近报道提到,BTC 跌破 70,000 美元,同时市场关注 ETF 净流出对价格的压力;有数据称 6 月 1 日单日现货 ETF 净流出约 4.84 亿美元。 第三,地缘政治风险和宏观压力也在压制风险资产。近期中东/美伊相关风险升温,叠加市场对通胀、美元走强、降息不确定性的担忧,BTC 这种高波动资产就容易被先卖。 第四,AI 股票吸走了风险资金。有报道指出,从 2026 年 5 月 11 日以来,BTC 下跌超过 10%,而纳指却上涨并创新高,原因之一是资金被 Nvidia、Dell 等带动的 AI 股行情吸引,BTC 反而缺少新的强催化。 NEAR 为什么反而高涨? NEAR 最近吃到的是很典型的 AI + Agent 基础设施叙事。NEAR 官网现在直接把自己定位成 “Currency of Agents”,并强调 NEAR Intents、NEAR AI、私密推理、安全 Agent harness、跨链执行等模块;这正好踩在当下市场最愿意追的 AI Agent 叙事上。 第二,NEAR 有明确的技术升级预期。NEAR 5 月发布 Dynamic Resharding,称其目标包括自动扩展、支持更多 shards、服务 NEAR Intents 和 Agent 相关增长;这种“马上有升级”的节点,很容易成为短线资金炒作理由。 第三,NEAR 不是只有口号,它在强调 Intents 的真实交易量。NEAR 官网显示 NEAR Intents 已有约 190 亿美元累计成交量;其 2026 年 2 月的代币经济文章也提到 Intents 已结算 130 亿美元以上跨链交易量。这类数据让市场更容易把它归到“AI + 跨链执行 + 真实用例”的框架里。 第四,短线交易层面,NEAR 的涨也带有杠杆和动量交易色彩。有市场分析称 NEAR 在大盘走弱时仍延续上涨,且 Open Interest 出现双位数增长,说明不只是现货买入,也有不少杠杆资金在追。这个很好理解:BTC 太重,NEAR 盘子更轻,叙事一热,弹性就更大。

比特币跌,NEAR 涨

比特币为什么大跌?#btc #Near
第一,最大的情绪触发点是 Strategy 罕见卖出 BTC。Strategy 以前一直被市场视为“只买不卖”的比特币信仰锚,这次披露卖出 32 枚 BTC,虽然金额相对其持仓很小,但打击的是市场心理:连最强 HODL 叙事都出现裂缝,短线交易员自然先跑。
第二,现货 BTC ETF 出现资金流出,削弱了此前支撑 BTC 的主要买盘。最近报道提到,BTC 跌破 70,000 美元,同时市场关注 ETF 净流出对价格的压力;有数据称 6 月 1 日单日现货 ETF 净流出约 4.84 亿美元。
第三,地缘政治风险和宏观压力也在压制风险资产。近期中东/美伊相关风险升温,叠加市场对通胀、美元走强、降息不确定性的担忧,BTC 这种高波动资产就容易被先卖。
第四,AI 股票吸走了风险资金。有报道指出,从 2026 年 5 月 11 日以来,BTC 下跌超过 10%,而纳指却上涨并创新高,原因之一是资金被 Nvidia、Dell 等带动的 AI 股行情吸引,BTC 反而缺少新的强催化。
NEAR 为什么反而高涨?
NEAR 最近吃到的是很典型的 AI + Agent 基础设施叙事。NEAR 官网现在直接把自己定位成 “Currency of Agents”,并强调 NEAR Intents、NEAR AI、私密推理、安全 Agent harness、跨链执行等模块;这正好踩在当下市场最愿意追的 AI Agent 叙事上。
第二,NEAR 有明确的技术升级预期。NEAR 5 月发布 Dynamic Resharding,称其目标包括自动扩展、支持更多 shards、服务 NEAR Intents 和 Agent 相关增长;这种“马上有升级”的节点,很容易成为短线资金炒作理由。
第三,NEAR 不是只有口号,它在强调 Intents 的真实交易量。NEAR 官网显示 NEAR Intents 已有约 190 亿美元累计成交量;其 2026 年 2 月的代币经济文章也提到 Intents 已结算 130 亿美元以上跨链交易量。这类数据让市场更容易把它归到“AI + 跨链执行 + 真实用例”的框架里。
第四,短线交易层面,NEAR 的涨也带有杠杆和动量交易色彩。有市场分析称 NEAR 在大盘走弱时仍延续上涨,且 Open Interest 出现双位数增长,说明不只是现货买入,也有不少杠杆资金在追。这个很好理解:BTC 太重,NEAR 盘子更轻,叙事一热,弹性就更大。
Ультрареалистичная пейзажная фотография Европейских Доломитовых гор, драматические известняковые пики поднимаются над альпийскими лугами, золотой свет восхода, легкий утренний туман в долинах, натуральные цвета, захватывающие виды, дикие цветы на переднем плане, кинематографическая композиция, профессиональная уличная фотография, Nikon Z9, 85 мм объектив, ультрадетализированные текстуры, HDR, резкий фокус, реалистичная атмосфера, стиль National Geographic, объемный свет, фотореалистично, 8k --ar 1:1 --stylize 50 --v 7.0 评论区说说是哪几个知名画家做的
Ультрареалистичная пейзажная фотография Европейских Доломитовых гор, драматические известняковые пики поднимаются над альпийскими лугами, золотой свет восхода, легкий утренний туман в долинах, натуральные цвета, захватывающие виды, дикие цветы на переднем плане, кинематографическая композиция, профессиональная уличная фотография, Nikon Z9, 85 мм объектив, ультрадетализированные текстуры, HDR, резкий фокус, реалистичная атмосфера, стиль National Geographic, объемный свет, фотореалистично, 8k --ar 1:1 --stylize 50 --v 7.0

评论区说说是哪几个知名画家做的
См. перевод
冷知识:海马是雄性怀孕 先说结论:在海马家族里,真正负责 “怀胎” 的是爸爸。 冷在哪里:雌性海马会把卵转移到雄性的育儿袋中,雄性在袋内为胚胎调节盐分、供氧并提供保护,直到小海马出生。 为什么有意思:这不是简单的 “帮忙带娃”,而是生殖角色在演化中出现的罕见分工反转。 多知道一点:雄性海马育儿袋并不是普通口袋,它有血管和调节环境的能力,功能上很接近一个专门的胚胎孵育器。 #Haima
冷知识:海马是雄性怀孕

先说结论:在海马家族里,真正负责 “怀胎” 的是爸爸。

冷在哪里:雌性海马会把卵转移到雄性的育儿袋中,雄性在袋内为胚胎调节盐分、供氧并提供保护,直到小海马出生。

为什么有意思:这不是简单的 “帮忙带娃”,而是生殖角色在演化中出现的罕见分工反转。

多知道一点:雄性海马育儿袋并不是普通口袋,它有血管和调节环境的能力,功能上很接近一个专门的胚胎孵育器。 #Haima
Статья
См. перевод
Claude 估值逼近万亿美元:AI 创业公司到底还算“创业”吗?最近 Anthropic 的新闻,有点像把 AI 创业这个词按在桌上重新审了一遍。 一家 2021 年成立的公司,靠 Claude 站到大模型第一梯队,又在新一轮融资里把估值推到 9650 亿美元附近。这个数字已经不是普通创业公司语境里的大了,它更像一个问题。 AI 公司到底还算创业公司吗? 如果我们还用过去 SaaS 创业的眼光看它,就会觉得离谱。过去的软件公司,最迷人的地方在于轻资产,高毛利,边际成本低。先写出产品,再用增长和续费证明自己。 但大模型公司不是这样。 它们先要买算力,买人才,买数据工程,买企业客户的信任。用户还没大规模付费之前,账单已经先跑起来了。 所以 Anthropic 的估值,不只是投资人押注一个聊天机器人。它押的是一整套结构,模型能力能不能继续往前,企业客户会不会把 Claude 放进工作流,云厂商和芯片供应链能不能持续供给算力,以及资本市场愿不愿意继续相信这条路。 这就让 AI 创业变得很不像创业。 过去创业公司最重要的是快。先跑起来,边跑边修。 现在头部 AI 公司最重要的是扛。扛算力,扛研发,扛合规,扛客户迁移,扛估值背后的增长预期。 这不是小团队在车库里写代码的故事,更像电信、云计算、半导体和软件订阅混在一起的故事。 说到这里,最关键的不是估值高不高。 关键是这种估值背后,钱买的到底是什么。 第一层,钱买的是算力时间。 大模型训练和推理不是一次性开支。模型越强,客户越多,推理量越大,算力越像公司的原材料。Anthropic 融资时强调扩展计算能力,这句话听起来普通,其实很要命。 对传统软件公司来说,增长意味着服务器成本上升一点。 对大模型公司来说,增长可能意味着一轮新的算力采购、云服务承诺和芯片供给安排。 第二层,钱买的是企业入口。 Claude 真正有价值的地方,不只是能聊天,而是开始进入企业软件、客服、代码、文档、流程自动化这些场景。ServiceNow 这类企业软件伙伴,把 Claude 接进自己的产品里,等于把模型变成工作流的一部分。 这是估值能讲下去的地方。 消费级聊天有热度,但企业级合同有收入可见性。只要企业愿意把模型嵌进流程,AI 公司就不再只是卖一次调用,而是在争夺长期工作入口。 第三层,钱买的是信任。 AI 公司面对的不是普通产品风险。模型幻觉、数据安全、版权、企业合规、行业监管,每一个都可能影响采购。企业客户不是问你能不能生成,而是问你能不能被审计、能不能被追溯、能不能被采购。 所以估值越高,公司越不像创业公司。 它必须像基础设施一样稳定,又必须像创业公司一样高速增长。 这很矛盾。 也是它最危险的地方。 因为一旦资本市场把你按基础设施定价,它就会要求你有基础设施级别的需求确定性。一旦市场按软件公司定价,它又会要求你有软件公司级别的毛利和扩张效率。 AI 大模型公司夹在中间。 它们既要烧钱,又要证明不是烧钱换热闹。 既要开放给企业,又要把安全边界讲清楚。 既要追模型前沿,又要把每次推理成本压下来。 这就是为什么我觉得,Anthropic 的估值不是一个单纯的融资新闻。它更像一个行业拐点。 AI 创业的第一阶段,是证明模型能做出惊艳能力。 第二阶段,是证明这些能力能被企业稳定使用。 第三阶段,才是真正残酷的地方,要证明高估值背后的收入、毛利和基础设施投入能互相对得上。 对普通 AI 创业者来说,这件事也有启发。 不是所有团队都要走 Anthropic 这条路。 事实上,大多数团队也走不了。 头部大模型公司拼的是资本、算力、模型和企业入口。中小团队真正该拼的,是具体行业里的流程理解,是把模型变成可采购、可复用、可嵌入的产品。 如果你没有能力买下算力战争,就不要假装自己在打一场模型战争。 你要打的是场景战争。 最后留一份清单。 如果你正在做 AI 产品,先问自己五个问题。 第一,你卖的是模型能力,还是企业流程里的一个可交付结果。 第二,客户为什么要把数据和工作流放到你这里。 第三,你的成本会不会随着用户增长一起失控。 第四,你有没有能支撑采购的安全、权限、审计和合规说明。 第五,如果大模型能力继续降价,你的产品还剩下什么。 Anthropic 的万亿估值故事很壮观。 但真正值得普通创业者学习的,不是估值。 是它提醒我们,AI 时代的公司不再只是写软件。 它们在争夺工作流、算力资源和组织信任。

Claude 估值逼近万亿美元:AI 创业公司到底还算“创业”吗?

最近 Anthropic 的新闻,有点像把 AI 创业这个词按在桌上重新审了一遍。
一家 2021 年成立的公司,靠 Claude 站到大模型第一梯队,又在新一轮融资里把估值推到 9650 亿美元附近。这个数字已经不是普通创业公司语境里的大了,它更像一个问题。
AI 公司到底还算创业公司吗?
如果我们还用过去 SaaS 创业的眼光看它,就会觉得离谱。过去的软件公司,最迷人的地方在于轻资产,高毛利,边际成本低。先写出产品,再用增长和续费证明自己。
但大模型公司不是这样。
它们先要买算力,买人才,买数据工程,买企业客户的信任。用户还没大规模付费之前,账单已经先跑起来了。
所以 Anthropic 的估值,不只是投资人押注一个聊天机器人。它押的是一整套结构,模型能力能不能继续往前,企业客户会不会把 Claude 放进工作流,云厂商和芯片供应链能不能持续供给算力,以及资本市场愿不愿意继续相信这条路。
这就让 AI 创业变得很不像创业。
过去创业公司最重要的是快。先跑起来,边跑边修。
现在头部 AI 公司最重要的是扛。扛算力,扛研发,扛合规,扛客户迁移,扛估值背后的增长预期。
这不是小团队在车库里写代码的故事,更像电信、云计算、半导体和软件订阅混在一起的故事。
说到这里,最关键的不是估值高不高。
关键是这种估值背后,钱买的到底是什么。
第一层,钱买的是算力时间。
大模型训练和推理不是一次性开支。模型越强,客户越多,推理量越大,算力越像公司的原材料。Anthropic 融资时强调扩展计算能力,这句话听起来普通,其实很要命。
对传统软件公司来说,增长意味着服务器成本上升一点。
对大模型公司来说,增长可能意味着一轮新的算力采购、云服务承诺和芯片供给安排。
第二层,钱买的是企业入口。
Claude 真正有价值的地方,不只是能聊天,而是开始进入企业软件、客服、代码、文档、流程自动化这些场景。ServiceNow 这类企业软件伙伴,把 Claude 接进自己的产品里,等于把模型变成工作流的一部分。
这是估值能讲下去的地方。
消费级聊天有热度,但企业级合同有收入可见性。只要企业愿意把模型嵌进流程,AI 公司就不再只是卖一次调用,而是在争夺长期工作入口。
第三层,钱买的是信任。
AI 公司面对的不是普通产品风险。模型幻觉、数据安全、版权、企业合规、行业监管,每一个都可能影响采购。企业客户不是问你能不能生成,而是问你能不能被审计、能不能被追溯、能不能被采购。
所以估值越高,公司越不像创业公司。
它必须像基础设施一样稳定,又必须像创业公司一样高速增长。
这很矛盾。
也是它最危险的地方。
因为一旦资本市场把你按基础设施定价,它就会要求你有基础设施级别的需求确定性。一旦市场按软件公司定价,它又会要求你有软件公司级别的毛利和扩张效率。
AI 大模型公司夹在中间。
它们既要烧钱,又要证明不是烧钱换热闹。
既要开放给企业,又要把安全边界讲清楚。
既要追模型前沿,又要把每次推理成本压下来。
这就是为什么我觉得,Anthropic 的估值不是一个单纯的融资新闻。它更像一个行业拐点。
AI 创业的第一阶段,是证明模型能做出惊艳能力。
第二阶段,是证明这些能力能被企业稳定使用。
第三阶段,才是真正残酷的地方,要证明高估值背后的收入、毛利和基础设施投入能互相对得上。
对普通 AI 创业者来说,这件事也有启发。
不是所有团队都要走 Anthropic 这条路。
事实上,大多数团队也走不了。
头部大模型公司拼的是资本、算力、模型和企业入口。中小团队真正该拼的,是具体行业里的流程理解,是把模型变成可采购、可复用、可嵌入的产品。
如果你没有能力买下算力战争,就不要假装自己在打一场模型战争。
你要打的是场景战争。
最后留一份清单。
如果你正在做 AI 产品,先问自己五个问题。
第一,你卖的是模型能力,还是企业流程里的一个可交付结果。
第二,客户为什么要把数据和工作流放到你这里。
第三,你的成本会不会随着用户增长一起失控。
第四,你有没有能支撑采购的安全、权限、审计和合规说明。
第五,如果大模型能力继续降价,你的产品还剩下什么。
Anthropic 的万亿估值故事很壮观。
但真正值得普通创业者学习的,不是估值。
是它提醒我们,AI 时代的公司不再只是写软件。
它们在争夺工作流、算力资源和组织信任。
$UNI , это мусор, смотрю, как он борется.
$UNI , это мусор, смотрю, как он борется.
Золотые линии очень красивые, когда же покупатель сможет выйти из убытков? 😞
Золотые линии очень красивые, когда же покупатель сможет выйти из убытков?
😞
Анализ Хуан Ренсюня "Пятислойный торт ИИ": положение и будущие возможности Китая> Автор整理 | 11 марта 2026 года | На основе Хуан Ренсюнь 2026.03.10 Официальный блог NVIDIA Во-первых, о чем же на самом деле говорит пятислойный торт 10 марта 2026 года генеральный директор NVIDIA Хуан Ренсюнь опубликовал свою седьмую публичную статью с 2016 года. Это не обычный отраслевой обзор, а систематическая карта индустрии. Он использует метафору "пятислойного торта", чтобы заново определить суть вопроса искусственного интеллекта. Пятислойная структура, начиная с нижнего уровня, выглядит следующим образом: Энергия → Чипы → Инфраструктура → Модели → Приложения Каждое успешное приложение воздействует на все уровни, вплоть до самой нижней ступени — электростанции, которая его питает.

Анализ Хуан Ренсюня "Пятислойный торт ИИ": положение и будущие возможности Китая

> Автор整理 | 11 марта 2026 года | На основе Хуан Ренсюнь 2026.03.10 Официальный блог NVIDIA
Во-первых, о чем же на самом деле говорит пятислойный торт
10 марта 2026 года генеральный директор NVIDIA Хуан Ренсюнь опубликовал свою седьмую публичную статью с 2016 года. Это не обычный отраслевой обзор, а систематическая карта индустрии. Он использует метафору "пятислойного торта", чтобы заново определить суть вопроса искусственного интеллекта.
Пятислойная структура, начиная с нижнего уровня, выглядит следующим образом:
Энергия → Чипы → Инфраструктура → Модели → Приложения
Каждое успешное приложение воздействует на все уровни, вплоть до самой нижней ступени — электростанции, которая его питает.
Статья
Следующая точка взрыва AI × DeFi, я нацелился на $ROBOНедавно изучаю Fabric Protocol от @FabricFND, чем больше смотрю, тем больше понимаю, что этот проект делает действительно ценную вещь. О рассказах об AI Agent все уже слышали, но по-настоящему реализуемых проектов с работающими экономическими моделями очень мало. То, что делает Fabric Foundation, отличается — они создают инфраструктуру, которая действительно позволяет AI Agent работать автономно в цепочке, а $ROBO является движущей силой этой системы. Почему я считаю #ROBO перспективным? Проблема традиционных DeFi протоколов в том, что они требуют человеческого вмешательства, низкая эффективность и медленная реакция. Идея Fabric заключается в том, чтобы позволить AI Agent взять на себя эти повторяющиеся операции в цепочке — автоматическое выполнение стратегий, управление позициями, оптимизация доходности. Это не концепция, а реальная работающая инфраструктура.

Следующая точка взрыва AI × DeFi, я нацелился на $ROBO

Недавно изучаю Fabric Protocol от @FabricFND, чем больше смотрю, тем больше понимаю, что этот проект делает действительно ценную вещь.
О рассказах об AI Agent все уже слышали, но по-настоящему реализуемых проектов с работающими экономическими моделями очень мало. То, что делает Fabric Foundation, отличается — они создают инфраструктуру, которая действительно позволяет AI Agent работать автономно в цепочке, а $ROBO является движущей силой этой системы.
Почему я считаю #ROBO перспективным?
Проблема традиционных DeFi протоколов в том, что они требуют человеческого вмешательства, низкая эффективность и медленная реакция. Идея Fabric заключается в том, чтобы позволить AI Agent взять на себя эти повторяющиеся операции в цепочке — автоматическое выполнение стратегий, управление позициями, оптимизация доходности. Это не концепция, а реальная работающая инфраструктура.
Статья
Революция в экономике роботов официально началась! Как Fabric предоставляет AI роботам экономический суверенитет с помощью $ROBO?Добрый вечер, участники площади. Сегодня я хотел бы подробно поделиться с вами проектом, который мне очень нравится, который объединяет AI, роботов и блокчейн — Fabric Protocol, запущенный @FabricFND. Fabric Protocol является децентрализованным фондом инфраструктуры, нацеленным на создание экономики следующего поколения для роботов. С помощью технологий блокчейн они предоставляют автономным интеллектуальным роботам и AI-агентам идентичность на цепочке, суверенные кошельки и полную экономическую систему. Это означает, что роботы будущего больше не будут просто инструментами, а смогут независимо участвовать в экономической деятельности, выполнять задачи и получать доход как "цифровые граждане".

Революция в экономике роботов официально началась! Как Fabric предоставляет AI роботам экономический суверенитет с помощью $ROBO?

Добрый вечер, участники площади. Сегодня я хотел бы подробно поделиться с вами проектом, который мне очень нравится, который объединяет AI, роботов и блокчейн — Fabric Protocol, запущенный @FabricFND.
Fabric Protocol является децентрализованным фондом инфраструктуры, нацеленным на создание экономики следующего поколения для роботов. С помощью технологий блокчейн они предоставляют автономным интеллектуальным роботам и AI-агентам идентичность на цепочке, суверенные кошельки и полную экономическую систему. Это означает, что роботы будущего больше не будут просто инструментами, а смогут независимо участвовать в экономической деятельности, выполнять задачи и получать доход как "цифровые граждане".
$POWER Надежный обман
$POWER Надежный обман
Ждать, пока продам, а затем начнется рост, играть с ними на явных картах🐶, потерять семьдесят процентов $ALLO
Ждать, пока продам, а затем начнется рост, играть с ними на явных картах🐶, потерять семьдесят процентов $ALLO
Войдите, чтобы посмотреть больше материала
Присоединяйтесь к пользователям криптовалют по всему миру на Binance Square
⚡️ Получайте новейшую и полезную информацию о криптоактивах.
💬 Нам доверяет крупнейшая в мире криптобиржа.
👍 Получите достоверные аналитические данные от верифицированных создателей контента.
Эл. почта/номер телефона
Структура веб-страницы
Настройки cookie
Правила и условия платформы