本文经原作者授权转载,版权归原作者所有。原作者:花叔(@AlchainHust)。
两个月前,我把Claude Design的设计思路逆向了一遍,开源成自己的Huashu Design。
到现在这个项目16k+ star了,能帮你做网站、App原型、PPT、动画demo,甚至对现在挺火的Open Design这类项目也有启发。

不过前几天,我想给它录一期B站教学视频,结果在讲的过程中,发现这一版有个不小的问题。
我当时内置了20种设计风格,让agent随机挑,本意是要多样性。但后来发现,一些设计流程和审美上的硬要求,跟这种随机多样性其实是打架的。打架的结果是:它做出来的设计,单看每个都还不错,可大多数都收敛到了同一种长相,极简、留白、有点像Anthropic官网那个味儿。
好的设计,不该只有这一种活法。

再好的风格,人人都在用、天天见,也就腻了。
而我,最讨厌无聊!
所以这两天,我把整个skill大改了一遍,推出Huashu Design 2.0,就为了治这个「无聊、单调」的毛病。
可以高兴地告诉你:成了。
先上三个2.0做的东西,主题我故意挑得越远越好。
这是它做的日本女仆文化介绍PPT👇

这是大英博物馆中文导览App原型👇

这是它做的马来西亚旅行网站👇

三个主题八竿子打不着,视觉语言完全不一样,设计元素一个比一个丰富。
而且更重要的是,这些几乎都是我一句话、一次成型的。连里面的图,都是agent配着Huashu Design 2.0自己找齐的。我这边要做的事,少得可怜。
下面就具体讲讲,2.0到底比上一版强在哪,又是怎么把「无聊」这个病给治了的。我用v1时实打实被坑到的三个地方,一个个填。
坑一 · 它总把设计收敛成「安全极简」
这就是上面说的「无聊」的根源,也是我最受不了的一点。
你让它「做个好看的页面」,它十有八九给你一个米白底、大量留白、配一个点缀色的极简风。单看不丑,但你做十个就会发现,十个长得都差不多。
模糊需求面前,AI会自动躲进它最熟、最不会出错的那个安全角落。结果就是千篇一律。
v1那会儿我已经有「设计方向顾问」了,需求模糊时给你几个方向选。但v1给的方向还是偏安全。2.0我把这套逻辑重做了,变成三套逻辑同时跑,三套各走各的路,专门跟「安全极简」对着干。我喜欢用三个动词记它们:撞、借、请。
🎲 撞,靠运气。让它随机抽,逼它别每次都往极简那个角落躲。抽哪个不重要,重要的是打破惯性。
🏆 借,借获奖作品的手法。让agent去搜真实世界拿过奖的同类网站,把人家的手法借鉴迁移过来。不靠凭空想象,靠真实世界的最高标准锚定。
🧠 请,请大师从头想。问一句「这个需求预算无上限,请谁最合适」,然后让agent变成那位顶级设计师的脑子,从头按他的哲学做一版。

开头那个马来西亚旅行网站,最后定的只是其中一版。但它一上来甩给我的,是三版完全不同的首页,我就说了一句话,没给任何风格参考:一版暗色编辑部风,热带大图在暖黑底上炸开;一版沉浸式大图风,对标拿过Clio铜奖的Visit Faroe Islands;一版暖白杂志风,像翻开《Condé Nast Traveler》。一个暗、一个亮、一个安静,温度被刻意拉开。

最妙的是那版暗色编辑部,我自己绝不会主动选,但它惊艳到我了。
我以前以为AI设计工具的价值是帮我更快做出我本来想做的东西。用了它我才明白,真正值钱的是它给了我一版我自己根本想不到、但一眼就服的方案。当「做出来」越来越便宜,剩下唯一难的就是知道「该选哪个」。这个skill帮你做完所有预设工作,把你解放到只剩下那个最不可替代的动作:选哪一个。
好设计不是从模板库里选出来的,是从你的真实需求里长出来的。AI的活儿是帮你规避最差的那个,再并行出实物给你挑。
坑二 · 内容网站没有真图,做得再花也是空壳
v1最容易翻车的地方就在这儿:你让它做个鹦鹉科普网站,它排得漂漂亮亮,配色、字体、动效全到位,但是没有一张鹦鹉的图,全是灰色占位块。
我后来给这条总结了一句话:鹦鹉网站没有鹦鹉图,等于失败。
2.0加了一步叫图片前置。开工之前先问一个问题:图片是不是这个内容的必需品?科普、旅游这种,图就是命根子,那就先把真图取齐,再开始设计。
就拿这个鹦鹉网站来说,它先跑去Wikimedia Commons,把各种鹦鹉的真实照片、加上公共领域的古典博物版画,抓了一整批回来,再动手设计。

有了这批真图垫底,最后做出来的是这个样子,还挺匹配鹦鹉的撞色风格。
这一步看着简单,但它是「能看的demo」和「能用的成品」之间的分水岭。
坑三 · AI会一本正经地瞎编产品事实
这个坑也值得讲讲。
有次我让它给大疆Pocket 4做个发布动画。它张口就来:「Pocket 4还没发布,我们做个概念demo吧。」然后它自作主张做了一版概念剪影动画。
结果呢?Pocket 4早就发布了,就在我让它做动画的几天前,官方的Launch Film、产品渲染图全都有。它基于一个错误的事实做了一版废稿。
问题出在哪?AI会凭训练语料里的记忆,对它其实不确定的事做断言。「我记得好像还没发布」「应该是v3版本」这种句式,听着很自信,其实全是猜的。这不是设计才有的毛病,是所有AI应用的通病,但放在做设计物料上代价更直接:事实错了,画得再美都是废稿。
2.0我把「事实验证先于假设」定成了优先级最高的第0条原则,凌驾于所有流程之上。只要涉及具体产品、版本号、规格、发布状态,第一步必须先搜一遍核实,把事实写进文件,绝不靠记忆。搜不到就问你,而不是自己编一个。
后面那套新加坡招商PPT里所有关键数据,樟宜机场吞吐量、QS排名、税率,也是这么来的,每一个都先核实出处再写进去。搜一遍花10秒,返工花两小时,这账太好算了。
多说一句PPT:我反而劝你别再导成pptx
PPT这块我得专门说,因为做完这些我的态度变了。
它做deck真不挑题材。新加坡那种西装革履的招商风能做(一套12页的招商引资deck,数据全核实过),我也给一个零基础朋友做过一套「网球入门」,60页,优雅杂志感,封面就一颗网球落在草地上,完全没有PPT模板那个味儿。
但更想让你看的是它的deck形态。它产出的不是一张张静图,而是一个HTML deck:打开是一面能鸟瞰全局的概览墙,点任意一页,就全屏滑进去一页页演示,跟真正的Keynote一个手感。

说实话,这种HTML deck的观感和流畅度,已经比传统pptx好一截。所以我现在的真心建议是:能用HTML deck,就别再导成pptx了。
当然,要是你公司就认.pptx这个格式,它也能一键导出可编辑的版本。不是把每页截成图片塞进去那种假的,导出后拖进PowerPoint,双击标题光标就进去了,文字是真文字,图表是真形状。

除此之外,可点击的App原型(交付前自己跑点击测试,保证按钮点了不白屏)、动画、信息图、带解说的长视频,它都能做。
一句话概括适用场景:凡是你需要「高质量视觉产出」、又不想自己打开任何设计软件去抠的事,都可以丢给它。
它不适合做的:生产级的Web App、需要后端的动态系统、SEO网站。这些不是它的活儿。
最后
我不是设计师,我是一个让agent帮我做东西的人。
设计软件的画布、图层、工具栏,本身就预设了你是那个动手的人。而一个skill预设的是你是做决策做判断的人。这不是哪个更顺手的问题,是你在这台机器里到底扮演什么角色的区别。
2.0做的所有事,本质都是在让「拍板」这个动作更值得做更容易做。给你的三版都是真东西,不是三个一模一样的安全极简。剩下的,你只负责选哪一个。
GitHub:https://github.com/alchaincyf/huashu-design
npx skills add alchaincyf/huashu-design
它不挑环境,Codex、OpenClaw、Hermes Agent、WorkBuddy、Trae、Kimi Work,几乎你在用的所有agent里都能装能跑。装完直接说「做个网站」「做份PPT」「做个App原型」就行,需求模糊也没关系,它会给你三个方向挑。
如果你用了,欢迎在评论区告诉我哪里还不够用。下一版接着填坑。