花叔

Agent协作的Harness策略:让两个Agent互掐,比一个聪明Agent靠谱

本文经原作者授权转载,版权归原作者所有。原作者:花叔(@AlchainHust)。查看原文 → 前几天看姚顺宇在张小珺最近那期4小时访谈里说,他在Google DeepMind主要做ML Coding和Long Horizon(长程任务)。后者就是让模型能够连续干好几个小时甚至好几天才能完成的复杂活。他说的是让单个AI变得更聪明。 但同样的事情,另一条路径上也在发生。这件事现在像个隐秘的共识,所有头部大模型公司都在做。 OpenAI从去年起推了让开发者搭多AI协作的工具集,又补上了让AI跑长任务的能力。Anthropic做了两套独立的产品,一套在他们的对话产品里、一套在Claude Code里的Agent Teams,

AI最大的礼物,是让你能廉价地失败100次

本文经原作者授权转载,版权归原作者所有。原作者:花叔(@AlchainHust)。查看原文 → 一 昨天,我突然收获了一个人生少有的顿悟时刻。 一种说AI会让很多人失业,替代写代码的、替代写文案的、替代客服的,把人挤出工作。另一种说AI正在前所未有地为个体赋能,一人公司、超级个体、独立开发者,每一个普通人都拿到了过去只有大团队才能拿到的能力。 我三年前从大厂出来时,是冲着后一种叙事去的。我做的所有事都基于一个假设——AI让一个人也能边学、边做、边分享,

Claude Code发布Agent View,多任务流的ADHD患者有救了

本文经原作者授权转载,版权归原作者所有。原作者:花叔(@AlchainHust)。查看原文 → 我看了下自己过去4个月的Claude Code用量。 131亿token,606个独立会话,38个项目。活跃日日均同时开7个session。 4-20那天,单日6388条消息。 先给爱杠的朋友打个预防针。这$13,222是按Anthropic公开API价格、折算cache命中之后算出来的「等价API费用」,假设我真按API付费就要这么多。但我其实是 Max 20x档(200美元/

Markdown还是HTML?这是个蠢问题!

本文经原作者授权转载,版权归原作者所有。原作者:花叔(@AlchainHust)。查看原文 → 昨天,Claude Code团队的Thariq发了篇爆文,标题叫:HTML是新的markdown。他说他几乎不再写markdown文件了,转而让Claude Code给他生成HTML。 这篇长文在X上够火的,不到24小时就500万+阅读了,X上很多人立刻分成了两派。一派是markdown党,觉得md格式才是AI时代的源代码;另一派觉得Thariq好像发现了一个了不起的真相,HTML样式确实强多了。 国内我看也有不少科技媒体做了转发和解读。 但……我看完想说…

DeepSeek V4是怎么训练出来的?58页论文深入解读

本文经原作者授权转载,版权归原作者所有。原作者:花叔(@AlchainHust)。查看原文 → DeepSeek V4是怎么训练出来的?58页论文深入解读 劝退提醒: 1、这是一篇很长很长的文章,会深入到DeepSeek V4论文中涉及到的各种细节,如果你不感兴趣,只是想知道模型跑分的话,没必要读 2、我也没那么好的技术能力,这是花了2000万Opus4.7 tokens读完内容,并做了73页PPT之后形成的理解 3、我多少对DeepSeek有些滤镜,

Episode

00:00:00 00:00:00