本文经原作者授权转载,版权归原作者所有。原作者:Xudong Han(@Xudong07452910)。查看原文 →


故事得从一个数字说起。

1280,000。

这是一个叫 Hermes Agent 的开源项目,在 GitHub 上 7 周攒下的 star 数。如果你没概念的话,LangChain 花了大半年才走完这段路。

我第一次看到这个项目的时候,想的跟大多数人一样,又一个 AI Agent 框架,现在这东西满天飞。但当我顺着仓库点进去看背后的团队 NousResearch,然后再顺着创始人一个个查下去的时候,我发现了一个比产品本身有意思得多的故事。

这家公司的四个联合创始人,至少三个有硬核的 web3 履历。

CEO Jeffrey Quesnelle,之前在以太坊的 MEV 基础设施项目 Eden Network 做到 Principal Engineer,写的是生产级链上代码,不是「我买过两个 NFT」那种程度。联创 Shivani Mitra,是全球第一家加密艺术博物馆 Museum of Crypto Art 的联合创始人。Head of Behavior Karan Malhotra,本人就是加密艺术家,在 fxhash 上有生成艺术系列「Diffusion Walks」,X 上的化名叫 mephisto,浮士德里那个递交契约的恶魔。

一群加密原住民,做出了 2026 年增长最快的 AI 产品。

这让我想到一个一直在脑子里转但没认真想过的问题,为什么这两年做 web3 出身的人转做 AI,好像特别容易做出点东西来?

大家聊到 NousResearch 的时候,通常就一句话,「他们是 web3 转 AI 的」。这话说对了一半,但最关键的那一半恰好被省掉了。

说真的,NousResearch 的故事比这几个字复杂得多,也精彩得多。

Article image

先说这个组织怎么来的。2022 年,一群散落在 Discord、GitHub、Twitter 上的志愿者,前物理 PhD、数学家、生物学家、软件工程师,没有公司没有融资没有办公室,凑在一起搞开源大模型微调。2023 年才正式在纽约注册成公司。

这个起源本身就很 web3 对不对。去中心化协作,匿名贡献者,社区驱动,DAO 式的松散组织。

而且他们的精神源头更有意思,是一个叫 Pygmalion AI 的项目。Pygmalion 是 LLaMA-1 时代的角色扮演模型,来自一群对 Character.AI 内容审查极度不满的用户。对,NousResearch 的祖师奶奶,是被 Character.AI 赶走的那群人。

这个出身决定了一切。一个被主流赶出来的组织,无论后来做什么,都不可能选择「向主流靠拢」。

再说四个创始人里最传奇的那个。Teknium,NousResearch 在 X 上流量最大的人,到今天没人知道他真名。2023 年最后一天,他发了条年终总结,大意是「一年前的今天,我没训过任何模型,对 AI 一无所知,Twitter 上大概只有 8 个粉丝。」

8 个粉丝。

一年之后,他做出的 OpenHermes 2.5 数据集成了开源圈无数模型微调的标准底料,被本地 LLM 的玩家们奉为圭臬。

从 8 个粉丝到开源 AI 的精神图腾,用了一年。我第一次读到这个的时候真的愣了一下。

然后是首席科学家 Bowen Peng,蒙特利尔大学出身,待过 Yoshua Bengio 的研究所。让他出名的不是正经论文,是一个 Reddit 帖子。他直接在 r/LocalLLaMA 上发了个关于位置编码插值的发现,后来变成了 YaRN 论文,ICLR 2024 收录。

这篇论文的影响力大到什么程度呢。Meta 的 Llama 长上下文用了 YaRN 的思路,Qwen2、Qwen3 全系列用了,DeepSeek 用了,Microsoft Phi3 用了。最离谱的是 OpenAI 自己的开源模型后来也被发现用了 YaRN。Teknium 当时发了条推,原文大意是「说开源只是抄闭源的人,你们脸疼吗?」

三个字,called it。怨气和胜利感都是真的。

Article image

回到「web3 转 AI」这个叙事。Karan 在一期播客里说了一句很关键的话,「Nous 创始团队是 crypto native,但我们一开始对引入区块链非常谨慎。」

这句话是理解 NousResearch 的钥匙。

很多人把他们归类为「web3 项目蹭 AI 热度」。但实际发生的事恰好反过来。他们是一群有加密血统的人,先做了一段纯 AI,做出了 Hermes 模型系列、YaRN 论文、WorldSim 这些硬成果,然后被一个具体的工程问题逼回了 web3。

这个工程问题是什么呢。训练大模型太贵了。GPU 集群太集中了。

2024 年 8 月,NousResearch 发布了一个叫 DisTrO 的东西。一句话说就是把 GPU 之间的通信量降低了 1000 到 10000 倍。以前训一个大模型,你得把所有 GPU 塞进同一个数据中心,用 InfiniBand 几十 GB/s 的带宽互联。DisTrO 之后,普通家用宽带就能让全球的 GPU 协作训练。

VentureBeat 的标题是「This could change everything」。Hacker News 直接顶到首页。

但 DisTrO 解开一个约束的同时,又创造了一个新问题。凭什么让别人把闲置 GPU 贡献出来?靠爱发电是不可持续的。

这就是 web3 终于「回流」到 AI 的那个时刻。

Karan 的原话,「我们把加密激励机制看成推动人们利用闲置算力的手段,与其说是捐赠,不如说是一笔交易。」

于是有了 Psyche Network,建在 Solana 上的去中心化训练网络。贡献 GPU 算力,链上记录贡献,获得 token 奖励。启动当晚,44 分钟内社区捐了价值 50 万美元的算力。

44 分钟。50 万美元。

你看到了吧。NousResearch 不是「从 web3 转到 AI」,是「一群 crypto native 先做了纯 AI,再被技术需求推回 web3」。顺序完全不一样。是技术问题找到了 web3 这个解法,不是 web3 信徒想找个 AI 题材来发币。

Article image

这个区别太重要了。因为它指向一个更大的现象。

我最近一直在观察 web3 和 AI 之间的人才流动。说实话我也不确定自己的观察有没有偏差,但至少在我能看到的范围里,做 web3 出身的人转做 AI,成功率好像特别高。NousResearch 是最典型的一个,但绝不是唯一的。

为什么?

我自己琢磨了一下,觉得这两个领域虽然表面上完全不同,底层基因其实高度相似。

都是开源驱动的。web3 的核心代码几乎全部开源,以太坊、Solana、所有 DeFi 协议。AI 领域现在最火的也是开源模型,Llama、Qwen、DeepSeek。一个在 web3 泡过的人,天然理解「开源不是慈善,是竞争策略」这件事。NousResearch 从第一天起就全部开源,MIT License,这种自觉就是 web3 基因。

而且不只是开源,都是社区驱动的。web3 项目能不能活,很大程度取决于社区热度。AI 开源项目也一样,GitHub stars、Discord 活跃度、HuggingFace 下载量。NousResearch 的社群运营能力,Hermes Agent 7 周 128K stars 那种引爆速度,你说纯靠技术?说真的我不信。那种把社区组织起来、让人自愿贡献代码和算力的能力,就是从 web3 带过来的。

还有一个更微妙的点。web3 的人见过太多周期了。牛市暴涨,熊市归零,今天估值十亿明天跑路,这种剧情他们看了不知道多少遍。这种在混沌中做决策、不被短期波动吓跑的能力,恰好是 AI 这种高速变化的领域最需要的。NousResearch 从 2022 年干到 2026 年,中间经历了 AI 行业无数次热点切换,他们的核心路线从来没变过,无审查、开源、去中心化。这种定力,我觉得跟 web3 练出来的周期免疫力有关。

说到这个,还得聊聊 NousResearch 在模型对齐上的立场。因为这也跟 web3 的基因直接相关。

Hermes 模型系列的核心主张是「中立对齐」。技术报告里写得非常直白,反对「先验的思想罪」和「提前的脑叶切除」,主张模型应该是「解锁的、不审查的、高度可驾驭的」。安全责任应该推到系统层面,不是模型层面。

你想想看,这跟以太坊的设计哲学是不是一模一样?协议层中立,DApp 层各自决定。基础设施不做价值判断,应用层负责合规。Quesnelle 之前在 Eden Network 做的就是 MEV 基础设施,核心理念是「让市场自己决定优先级,不要让中间人审查交易」。把这个原则平移到 LLM 上,就是 Hermes 的全部立场。

不是什么高深的理论创新。就是同一种世界观,从 web3 搬到了 AI。

Hermes 4 发布当天,Pliny the Liberator,全球最知名的 LLM 越狱者,被 TIME 评为「TIME 100 AI」的那位,立刻发推说「HERMES-4: LIBERATED」。NousResearch 不仅没回避,后来还在 Hermes Agent 文档里加了一个官方 Skill 致敬 Pliny。

官方拥抱越狱者这种事也就 Nous 干得出来。

聊完了 NousResearch 和 web3 人才流入 AI 的现象,接下来得聊一个更刺激的问题了。

AI 人才以后会不会回流 web3?

我的判断是,会。但不是大家想象的那种方式。

不会是「AI 凉了大家又回去做 web3」。而会像 NousResearch 那样,被技术需求推回去。

你想想 AI 现在面临的几个最大瓶颈。算力集中,训练一个大模型需要几千张 H100 塞在同一个数据中心里。数据垄断,最好的训练数据被几家公司锁着。模型对齐被少数公司控制,你用什么 AI,背后的价值观由 OpenAI 和 Anthropic 的安全团队替你决定。

这三个问题的解法,恰好都指向 web3 的核心技术栈。

算力集中?去中心化训练网络。DisTrO 和 Psyche 已经证明这条路走得通。Bittensor 的 Templar 子网用去中心化方式训完了一个 72B 参数的模型,70 多个全球节点,家用网络,普通 GPU。这不是 PPT,是实打实跑出来的。

数据垄断?去中心化数据市场。这个故事 web3 在 2017 年就开始讲了,只是当时没有足够大的需求方。现在 AI 对训练数据的饥渴就是那个需求方。

模型对齐被控制?NousResearch 的答案是把选择权还给用户和系统部署方。「基础设施层中立,应用层各自负责」,web3 已经实践了快十年。

所以不是 AI 人才主动「回流」web3。是 AI 在往前走的过程中,必然会撞上 web3 已经思考了很多年的问题。去中心化不再是一个意识形态口号,它变成了一个工程需求。

Article image

DeMo 论文的合著者名单里出现了 Diederik P. Kingma 的名字。就是写了 Adam 优化器的那个人,深度学习领域被引用最多的研究者之一。他出现在 NousResearch 主导的去中心化训练论文里,不是来给 web3 站台的,是因为这个问题在技术上真的成立。当主流学术圈开始认真对待去中心化训练的时候,这就不是圈内自嗨了。

那 web3 行业自己接下来应该怎么走?

坦率的讲,我觉得 NousResearch 的路径给出了一个很好的参照。不是硬蹭 AI 热度发个概念币,而是先在某个领域建立真正的技术和产品实力,然后在工程上确实需要去中心化方案的时候,自然地引入 web3 的能力。

Karan 那句话值得每个 web3 从业者好好想想,「直到 DisTrO 这一分布式训练的研究突破出现,我们才决定走链上路线。」

是技术问题找到了 web3 这个工具。不是反过来。

这个顺序决定了一切。

web3 这几年最大的病就是顺序搞反了。先想好发什么币,再找叙事包装。先决定做「去中心化的 xxx」,再找一个需求来填。crypto × AI 赛道里充斥着这种项目,白皮书写得天花乱坠,实际产品一个能用的都没有。

NousResearch 的可信度之所以远高于那些垃圾项目,就是因为每一步都是被工程现实推着走的。先有 Hermes 模型 5000 万次下载,再有 DisTrO 的技术突破,再有 Psyche 的链上协调,再有 Hermes Agent 7 周 95K stars。每一步都有硬实绩垫底。

2025 年 4 月,Paradigm 领投 5000 万美元 A 轮,估值 10 亿美元。Paradigm 是 Coinbase 联创 Fred Ehrsam 创办的加密 VC,押对过几乎所有大型 web3 项目。它把这次投资称为「自身在 AI × Web3 领域最大的一次投资」。估值用的是 token valuation,等于明牌告诉市场要发币。

但即便到这一步,NousResearch 也没急着发。截至今天,token 时间表还没公开。这种「准备好了再出手」的克制,在 crypto 圈简直是稀有动物。

所以 web3 真正需要的不是更多的概念。是更多 NousResearch 这样的组织。先做到让人无法忽视,然后在真正需要的时候把 web3 的能力用上去。

去中心化不应该是一个前缀。它应该是一个答案。对一个真实工程问题的答案。

写到这里,我又想起 Teknium 那条推文了。

8 个粉丝。

一年前什么都不会,一年后做出了被整个行业引用的东西。三年后参与创建的组织估值 10 亿美元。再后来连 OpenAI 自己的开源模型都被发现悄悄用了他们的技术。

这个故事最打动我的不是结果,是起点。

你不需要是 Stanford 的 PhD。不需要在 Google Brain 待过。不需要被 a16z 看上。你只需要找到一个你真正相信的方向,然后在公开的论坛和 Discord 频道里,一行代码一行代码地做。

NousResearch 用四年证明了一件事。

前沿 AI 不一定属于那些已经在山顶的人。

从 Discord 频道到 128K stars,从匿名个人到 10 亿美元估值,从 Pygmalion 角色扮演圈到 Paradigm 的资本盘。他们每一步都在重新定义「谁有资格做 AI」。

而 web3 和 AI 之间的那条路,从来就不是单行道。它是一个环。人才、技术、资本,从 web3 流向 AI,又从 AI 流回 web3。不是因为哪边更热,而是因为真正的问题不在乎你来自哪个圈子。

顺便说一句,我也加入了NousResearch 的Discord 频道,每个人都是可以申请加入的,我想近距离看看这个组织。

我进去之后没敢说话,先潜水。

潜了一会儿才意识到,128K stars 不是一个数字。是频道里跟我一样、被这群人某种气场打动,悄悄潜进来想看看的人。