本文经原作者授权转载,版权归原作者所有。原作者:数字生命卡兹克(@Khazix0918)。查看原文 →


今天,英伟达的NVIDIA GTC Taipei 2026,在早上11点,终于如约而至了了。

发布了很多的东西,但是有一个东西,是我觉得真正具有历史意义的,必须要单独拿出来的说的。

甚至,它让英伟达喊出了,个人电脑诞生40年以来,这次,要重新定义。

“A New Line,A New Beginning”

而这一切,都是因为一个全新的消费级芯片。

也就是传说中的,被各种爆料了很久的代号为N1X的芯片。

RTX Spark。

Article image

就是这么个小小的东西。

可以说,这是我在今年上半年最期待的一场AI大会,因为在这个时代,你几乎很难看到,几个巨头联手预热,只为这一场发布会。

Article image

PC的新时代。 可能也只有英伟达,能攒起这样的局了。

那一串奇怪的数字,正是这次老黄演讲的地点,台北流行音乐中心。

Article image

在看完今天的发布会以后,我相信没有人会不再相信这句话了。

整个上半年的AI的进展,几乎都是OpenClaw、Claude Code、Codex等等等等。

背后,全部都是云端大模型。

但是ToC端的硬件层面,几乎毫无进展。

可试问,又有谁不想真正的把大模型和Agent,部署在自己的本地端呢,低延迟、隐私保护、无需网络,不仅仅是进行推理,甚至可以微调,那种自由又安全的感觉,永远会让人迷恋。

我们需要新的硬件,也需要新的芯片,需要一些更有趣的想象。

而这一切的目光,几乎都聚焦在了这次的NVIDIA GTC Taipei 2026上。

终于,RTX Spark如约而至。

Article image

如果比较关注英伟达或者过去打游戏比较多的朋友,可能对RTX和Spark这两个独立的单词都比较熟。

RTX就是英伟达的消费级产品线,大家见的最多的,就是各种显卡,比如RTX 5080。

Spark其实同源于去年的一个面向开发者的DGX Spark,只不过这次被正式升级成了一整套英伟达全新的业务线。

于是,RTX Spark出炉了。

直播的时候看的我起鸡皮疙瘩了。

整体参数如下。

Article image

RTX Spark的底层应该是跟DGX Spark相同的GB10芯片,因为我看这次的旗舰版的参数和之前差不多。

最高1 PFLOP的FP4 AI性能,20个CPU核心、6144个GPU核心和128GB的LPDDR5X统一内存。

能直接在本地轻轻松松跑120B的模型。

这次发布会上,老黄还秀了一把未来所谓搭载RTX Spark的合作品牌方做的电脑。

Article image

你可以在一台厚度为14mm、未插电的笔记本电脑上渲染一个90GB的3D场景、编辑12K分辨率视频。

非常离谱。。。

而且,不仅有很薄但性能爆炸的全新笔记本,还有类似于Mac Mini那种功耗很低的小盒子。

Article image

所以最近联想、HP、ARM大涨啥的,不是没有原因的。

能在个人消费级的电脑里,直接用统一内存的方式,以超高速+全面CUDA生态支持,来本地跑AI大模型,这应该是整个PC领域头一遭。

而且微软会跟英伟达一起,全面重构Windows系统,让搭载RTX Spark的电脑,原生支持本地Agent的运行。

Windows生态,感觉有救了,英伟达来当救世主了。

真的,无愧于个人PC新时代这个比喻。

感觉上,明年全新的Windows系列的换机潮要来了。

我觉得要理解RTX Spark的历史意义,还是得说一个我觉得大家需要知道的东西:

就是到底啥是统一内存?它有啥用?

在过去,我们传统的电脑里,一般有两个大家所熟知的最核心的东西,一个叫CPU,一个叫GPU。

这个叫CPU,我用AI画了一张。

Article image

GPU大家肯定都很熟了,在电脑上,经常就是我们常说的显卡,比如我的这个5080。

Article image

CPU和GPU他两呢,各有各的内存,是分开的两块。

CPU用的叫系统内存(RAM),GPU用的叫显存(VRAM),两边要交换数据得通过一条通道来回搬。

而统一内存呢,大概就是把这两块合成一块,CPU和GPU共用同一个内存池,谁都能直接访问。

苹果把这套玩意搞成了自己的主流,你现在买的Mac,几乎都是统一内存了。

Article image

但是Windows生态,CPU和GPU都是不同厂家做的做的,受限于过去的生态,过去也有人搞过,但是也都拉了,也从来没有人能把这么多上下游,联合起来大搞特搞。

这么大的阵仗,英伟达是第一个。

而这个统一内存,对于跑大模型来说,真的几乎就是决定生死的差别。

上面我们也说了,传统PC的内存架构是分裂的,CPU有自己的系统内存(RAM),GPU有自己的显存(VRAM),两者之间靠一条叫PCIe的东西连起来。

Article image

比如,CPU有一块系统内存,我们按64GB RAM来算,GPU又有一块自己的显存,比如RTX5080的16GB VRAM。

你想在本地跑一个大模型,比如量化后的70B模型,可能要几十G内存,你的电脑内存看起来有64GB,但GPU真正能高速使用的只有那16GB显存。

一旦模型太大,显存放不下,就要把一部分权重放在CPU的系统内存里,GPU每次需要这部分权重,就得通过PCIe去系统内存里拿。

GPU读自己的显存,带宽大概1TB/s,非常快。

但是PCIe这条连接CPU内存和GPU的通道,像PCIe 4.0 x16单向带宽只有大概32GB/s,差了三十倍,纯龟速。

所以,你的模型还是跑不动,或者跑的很慢。

统一内存解决的主要问题就是这个。

它可以把CPU和GPU的内存变成一个共享池,比如一台机器有128GB统一内存,那么GPU就可以直接使用这个大池子里的很大一部分。那这样你跑本地大模型的时候,就不再被一张显卡的 16GB、24GB、32GB显存限制得那么死。

统一内存在消费级单机上,几乎是跑本地大模型唯一优雅的解法。

数据中心就是另一个世界了,那条路跟我们普通消费者就没啥关系了。

说到这,那我觉得,你肯定想问,那既然统一内存这么牛逼,我买Mac不就行了,Mac也有128G的统一内存的版本,我买RTX Spark干啥?

这是个非常好的问题,有一个答案还是挺重要的,那就是英伟达真正的杀手锏。

CUDA。

Article image

CUDA这个词,很多关注AI的朋友应该都听过,但它到底是什么,为什么这么重要,我觉得还是值得认真聊一下。

很多人以为CUDA就是英伟达的显卡驱动,或者只是什么GPU加速技术。

这么理解也不能说错,但它远不止于此。

CUDA是一整套的生态,最牛逼的生态。

Article image

底层,它让你能把GPU当成通用计算器来编程,除了渲染画面,还能做数学计算。

中层,是一堆被打磨了将近二十年的数学库。cuBLAS做线性代数,cuDNN做深度学习的基础运算,TensorRT做推理优化,NCCL做多卡通信,FlashAttention这类关键优化,CUDA 路线最成熟,很多新特性也会优先围绕NVIDIA GPU做适配。

还有老黄这次演讲里反复强调的CUDA-X,为所有的Agent,开放的CUDA库,能让Agent直接调用,这下更离谱了。。。

里面有一整套横跨科学计算、工程仿真、芯片设计、基因组学、通信网络、机器人和物理仿真等等的加速库。

比如cuLitho做计算光刻,cuOpt做决策优化,cuDSS做稀疏矩阵求解,AI-Q做对结构和非结构化文档做深度研,Warp做可微分物理,Parabricks做基因组学等等等等。

Article image

用老黄的话说,数学,太美妙了。

CUDA,太牛逼了。

上层,就是PyTorch、TensorFlow、JAX,几乎所有深度学习框架的GPU后端,默认且首先支持的就是CUDA。

从2006年做到现在,CUDA积累了海量的优化库、教程、代码、生态等等。你今天去看学术论文放出来的开源代码,绝大多数都是在CUDA上写和测的,你今天遇到任何深度学习的问题去搜解法,搜出来的答案也几乎都是默认假设你在用CUDA。

整个AI工程界的母语,就是CUDA。

这也是Apple一直以来的一个痛点。

它的统一内存确实牛逼,但它的GPU用的是Metal,机器学习框架是MLX。

社区里绝大部分开源模型、训练代码、微调工具,都是先在CUDA上做好的,然后才慢慢有人移植到MLX,而且推理还好说,但是训练和微调在Apple上的生态到今天还是非常薄弱。

所以你现在应该能理解,RTX Spark为什么让整个行业都在期待了。

因为在RTX Spark之前,想要CUDA和想要统一内存的能效,这两件事在PC上,是不可兼得的。

RTX Spark第一次把这以前打架的东西捏到了一起。

这是以前任何一个单一平台都给不了的组合。

这才是RTX Spark真正的最牛逼的地方,也是最大的差异化。

运行人类至今创造过的一切,外加Agent。

而基于CUDA生态,这次,像Adobe之类的,会针对RTX Spark进行全面优化。

比如Adobe直接重新为RTX Spark设计了Photoshop和Premiere的核心架构,拥有高达两倍的速度,而且,还原生支持Agent调用。

Article image

而且,这一次,英伟达和微软还要一起携手,来重塑Windows上的Agent生态,虽然这块是后面才会跟纳德拉具体直播去聊,但是也透了一点东西出来。

包括全新的Windows安全基元,能为Agent的原生构建与运行提供身份认证、隔离防护、策略管控和端到端安全能力。

还有英伟达自己的Open Shell。

Article image

一套面向Agent的Windows PC平台就能看出来了。

底层是RTX Spark提供的硬件能力。

第二层是Windows的系统,微软会把Windows往Agent时代来改。

第三层就是是安全运行环境。

也就是Windows security primitives + NVIDIA OpenShell。

可以说,未来任何一个想要在本地电脑上跑大模型的开发者或者创作者,从硬件上来说,RTX Spark的机器,几乎就是最优解。

如果你还想打游戏,那相信我,你没有别的选择了。

仅此一家,只有RTX Spark。

Article image

A New Line,A New Beginning。

这就是,个人电脑的新时代。

它,不止是为你设计的,还是为Agent所设计的。

不止兼容着过去,还带着过去。

走进了,下一个未来。