本文经原作者授权转载,版权归原作者所有。原作者:Gorden Sun(@Gorden_Sun)。
写在前面
很多人第一眼看到Codex,觉得这就是个写代码的AI工具,跟自己没什么关系。
这个判断错了。
想象一个周一早上:你收到一封邮件,老板要你出一份产品上线方案。你打开Codex,把需求丢进去,然后合上电脑出门。通勤路上手机弹出通知——Codex已经读完了相关的飞书/Slack讨论、从Google Drive里翻出了客户调研、查了上季度的数据、在Notion里开始写方案了。它问你一个时间节点的问题,你点一下确认。到公司的时候,草稿已经在等你了。
Codex的核心能力本来是为写代码设计的,但这套能力——从多个地方拉信息、调用各种工具、一步步执行复杂任务——用来办公同样好使。
这篇指南教你怎么用Codex来处理日常工作。 从搭环境开始,到实际跑各种工作流,再到把重复劳动变成越来越顺手的系统。
你不需要一口气学完所有功能。先知道有什么,再按自己的节奏慢慢用起来。文章很长,建议收藏。
第一部分:Codex是什么
一句话解释
Codex是一个AI工作台。你告诉它要做什么,它自己想办法、找工具、干活,最后把结果交给你检查。
它能做的事情包括:
- 读写你项目文件夹里的文件
- 连接飞书、Slack、Gmail、Notion、Google Drive等外部工具
- 自动跑多步骤的流程
- 需要的时候自己写代码和脚本
- 输出文档、表格、PPT、PDF、网页等各种格式
- 同时处理好几件事
- 在你手机上远程启动和查看任务(电脑要保持开机)
- 把经常做的事变成自动化流程
- 把你的工作成果变成可分享的网页
五个核心概念
Codex里有五个大的概念。先记一句话就够了:项目是容器,对话和目标在里面跑,插件扩展能力,站点输出成果。

项目(Project) = 一个工作空间。你在做"产品上线"就开一个项目,做"周报"就开另一个。一个项目里的所有对话共用同一批文件和规则。重要的东西(决定、状态、关键链接)存在项目文件里——别指望Codex靠聊天记录来记住。
对话(Thread) = 项目里的一次具体对话,做一件事就开一个对话。事情变了或者聊乱了就开个新的。注意:不同对话之间不会自动共享聊天记录,但可以通过共享文件来传递信息——比如A对话把结果写进一个文件,B对话读这个文件。
目标(Goal) = 用 /goal 命令设定的长期任务。适合那种你知道最终要什么、但中间要走很多步的工作。你告诉Codex什么算"做完了",它就一直推进,完成了或者卡住了会通知你。
插件(Plugin) = 打包好的工具包。比如有人做了一个"每周写周报"的插件,装上就能用。在自己从头搭之前,先去插件目录翻翻有没有现成的。
站点(Site) = 把工作成果变成一个网页。适合需要让别人看到、并且可以互动的场景(比如一个项目看板)。如果别人只需要读一下,做成文档就行,不需要搞站点。
Codex做不到的事
Codex需要人来把关。它不能替你做判断、不能帮你核实事实、不能替你承担责任。以下情况不要让它自己干:
- 它接触不到数据来源的时候
- 做得好不好全凭主观感受的时候
- 搞错了后果很严重的时候
什么任务适合交给Codex
下面这些特征,满足两条以上就很适合:
- 需要从好几个地方拉信息汇总
- 有你经常重复做的步骤
- 做完可以对着标准检查对不对
- 最终要产出一个东西(文档、报告、方案等)
- 烦到你一直拖着不想做
用Codex做事有两种模式——这个判断贯穿全文,很重要:
完全交给Codex: 任务流程明确、风险不高、结果容易检查。你把要求说清楚,Codex自己干完,你最后验收就行。
你和Codex一起做: 任务比较模糊、需要你拿主意、要反复调整才能到位。你和它一起推进,边做边调方向。
简单讲,如果一份检查清单就能搞定这件事,就交给Codex自己干;如果每次都要重新想怎么做,就你俩一起做。
第二部分:搭建你的工作环境
五步工作法
所有好用的Codex工作流都跑同一个循环,跑一次熟一次,越来越快:
接工具 → 写规则 → 干活 → 检查 → 沉淀
- 接工具: 把你日常用的系统连进来——飞书、Gmail、Slack、Notion、Google Drive、日历、数据分析工具等等。不接的话,Codex只能看到项目文件夹里的东西和你手动粘过去的内容。PPT、Word、Excel不需要额外接入,Codex默认就能处理。
- 写规则: 把你的目标、偏好、项目细节、关键链接、检查标准写进Codex能读到的文件里。这一步的意义是:做过一次之后,Codex就不需要你每次重新交代背景了。
- 干活: 判断这件事是交给Codex自己干,还是你们一起做。无论哪种,都先把"要用什么素材、最终要什么格式、怎么算做好了"说清楚。
- 检查: 去成果真正使用的地方看。Codex帮你发了飞书消息,就去飞书里看效果;帮你写了文档,就去你平时写文档的工具里看。在Codex里看起来没问题的东西,放到实际场景可能完全不对。
- 沉淀: 把好用的东西留下来。好的提示词存起来、管用的流程记下来、踩过的坑加到检查清单里。每次做完都让下一次更快一点。

连接你的工具
把日常用的工具接入Codex。注意:连上一个工具不等于给Codex开了无限权限——先给最小够用的权限就行,让Codex在改任何东西之前都先问你。
Codex接触外部工具有几种方式,原则是优先用最直接的路径:

接好工具后,可以让Codex帮你发现值得搭建的工作流,往往会有惊喜:
连接我工作中的这些工具:[列出你的工具]。看看我在这些工具里的工作习惯,帮我推荐先搭哪三个工作流。每个说明:从哪里取数据、最终产出什么、多久跑一次、我需要审批什么。
搭工作空间
干活之前,先把工作空间搭好。跳过这一步你大概率会卡住。
工作空间就是一个文件夹,里面放着Codex干活需要的所有"背景资料"——指令、规则、流程文档、常用素材、检查清单。你可以理解成一份"入职手册"——只不过读者是Codex。
别自己从零设计文件结构。 让Codex来采访你,然后它帮你设计:
我想让你帮我创建一个工作空间。一次问我一个问题,了解我的角色、职责、手头的项目、经常重复做的事、用的工具、合作的人、做出来的东西长什么样、我的工作习惯,以及哪些事绝对不能让你自作主张。问完之后帮我设计一个文件夹结构,解释每个文件是干什么的。我确认之前不要动任何东西。
文件夹结构参考
不必严格参考,前期可以先用起来,熟练后再按自己的规范来。清晰的文件夹结构会让你和AI都能把握当前项目的情况。

三个关键文件分别写什么
context.md(你是谁): 你的角色和负责的事、手头在做的项目、每天用的工具、合作最多的人和团队。
preferences.md(你的偏好): 写东西什么风格和语气、哪些东西要你过目才能发出去、哪些事Codex做完告诉你一声就行。
rules.md(红线规则): 没经过你同意绝对不能做的事——发消息、发布内容、删东西、改正式资料、转账。可以不问直接做的事——起草、总结、调研、列大纲、整理资料。还有你工作中的特殊要求(比如客户信息保密、品牌规范等)。

关于AGENTS.md
Codex每次开工前会先读AGENTS.md这个文件。Codex根目录放一份简短的就行:说明这个空间是干什么的、哪些文件最重要、哪些规则全局适用。具体到某个项目的详细指令,放在对应子文件夹里就好。如果你找不到这个文件,可以在聊天里让Codex提供文件路径,或者直接在聊天里让Codex编写这个文件。AGENTS.md一定要简短。
第三部分:五个进阶等级
Codex高手不是一天练成的,是一步步走出来的。每一级需要不同的用法和心态,跳太快会挫败——要么你还不信任它,要么该准备的东西还没到位。
这五级是复杂度的台阶,不是能力的排名,不必刻意追求高复杂度的形式。

第1级:单次任务——先拿简单的事试手
把Codex当成一个很能干的助手。你给它一件事,它做完你来检查,就这么简单。不搞自动化,不搞花里胡哨,所有结果你过目了才算。
适合先试的事:
- 帮你总结会议记录,把决定、待办和问题拎出来
- 把散乱的笔记整理成结构化的提纲
- 从一堆链接和文档里拉出一份调研摘要
- 按你的风格指南帮你改稿
- 帮你列一份文档的检查清单
提示词模板:
用这些[文档/链接/笔记]帮我做一份[具体要什么]。准确比好看重要。每个事实都标上来源链接。你拿不准的地方标出来,最后列三个我应该确认的问题。
一个好习惯: 在开始改Codex给你的东西之前,先问它"你在做这个的时候做了什么假设?哪里你最没把握?"——提前把问题暴露出来,免得你改了半天发现方向就是错的。
什么时候该升到第2级: 你开始反复想"要是它能记住我上次说的就好了"。
第2级:从多个地方拉信息——跨系统整合
把Codex当一个能同时看好几个系统的分析助手。飞书的消息和文档、Notion的文档、本地的文档、Gmail邮件——这些你一个人要花半天才能拉齐的信息,Codex可以帮你一次搞定。
典型场景:
- 把会议记录、飞书消息、客户笔记拉到一起,写一份产品上线方案
- 从数据后台、收入数据、客服量里拉出一份周报
- 综合飞书消息和文档,做一份周报
提示词模板:
我要一份[具体要什么]。需要用到以下信息:[工具1]:去里面找[什么信息] [工具2]:去里面找[什么信息] [工具3]:去里面找[什么信息] 最终格式:[你想要的结构]开始之前先告诉我你打算怎么做:要查哪些东西、会产出什么、可能缺什么、完成前你会怎么检查。涉及发消息、改文件这类操作的,先问我。
注意: 从多个系统拉数据容易出错——数据可能过期了、各系统定义不一样、数据对不上。涉及业务决策的数字,一定要回到原始数据源逐个核对。
什么时候升到第3级: 你发现同一个流程每周都在手动跑,开始想"这能不能自动的"。
第3级:定期自动跑——解放重复劳动
到了这一级,你可以把那些"每次都差不多"的工作自动化了。
核心判断:如果一份检查清单就能搞定,就交给Codex自动跑;如果每次都得重新想,就还是你俩一起做。
最适合自动化的"电脑杂活":
- 每天下班前帮你扫一遍没回的飞书消息和邮件,编写回复草稿甚至自动回复
- 每周自动从各个工具拉数据出一份指标简报
- 每次开完会自动整理笔记、列出待办事项
- 把你的写作草稿自动打包成编辑审阅格式
搭自动化之前,先填这个表想清楚:
流程名称: 多久跑一次: 从哪里取数据: 最终产出什么: 什么事Codex可以自己干: 什么事必须先问你: 怎么验证结果对不对: 结果放到哪里: 什么时候该停用或更新这个流程:
检查的时候记得去实际用的地方看。 Codex帮你起草的飞书消息,去飞书里看;帮你写的邮件,去Gmail里看。在Codex里看着没问题的东西,放到真正的场景里可能感觉完全不一样。
什么时候升到第4级: 你发现光靠写提示词搞不定了——有些事太复杂,需要一个小脚本或小工具才能跑得稳。
第4级:让Codex帮你造小工具
有时候Codex最好的产出不是一份文档,而是一个小工具——一个脚本、一个简单的看板、一个自动跑某件事的小程序。
你不需要是程序员。 操作方法是:
- 先在Codex里手动做一遍,确认结果是你想要的
- 问它:"这个流程里哪些步骤可以做成一个小工具来自动处理?"
- 让Codex做个原型,用大白话给你解释它干了什么
- 用你的真实数据跑一遍,看结果和手动做的是不是一样
- 好用的留着,不好用的扔掉
你不需要看懂每一行代码,但你要能说清楚三件事:输入是什么、输出是什么、哪一步需要人来看一眼。说不清楚的话,这个工具还没准备好上线。
什么时候升到第5级: 你发现自己总是在给Codex重复同样的反馈——"别用这个语气""记得加上来源""格式按我上次的来"。
第5级:越用越聪明的系统
到这一级,你的目标是让每次工作都让系统变得更好。Codex不是用一次就扔的工具,而是一个能积累经验的系统。
每次做完一件有价值的事,养成习惯做这四件事:
1. 存下好用的提示词。 哪个提示词产出了特别好的结果?把它原封不动存下来——用了什么素材、写了什么提示词、要什么格式、怎么检查的。下次直接复用。
2. 出过的错加进检查清单。 数字搞错了?语气不对?做了不该做的假设?把它变成检查清单里的一条,让Codex以后自动对照检查。
3. 项目结束后更新背景文件。 做完一个大项目就更新context.md——新增了什么优先级、用了什么新工具、什么管用什么不管用。
4. 问Codex有什么值得沉淀。 每次做完有成果的事,跑一下这个提示词:
根据我们刚才做的,有哪些东西值得做成可复用的模板、自动化流程或小工具?我应该在项目文件里补什么信息,让下次做类似的事更快?
第四部分:16个工作流模板
以下这些工作流是给你的起步参考。根据你自己的工具和实际情况来调整。
1. 收件箱清零
适合: 邮件一多就焦虑、老是漏掉该回的邮件的人。
怎么用: 让Codex扫描你某段时间的收件箱,每封邮件归类(该回复/该处理/可归档/已处理),该回的帮你起草回复,该处理的列清楚要做什么,需要你亲自想的单独标出来。只起草不发送,你去Gmail里审完再发送。
越用越好: 跑几次后加一个规则文件——哪些人的邮件永远优先、什么话题直接归档、什么事必须你亲自回。
2. 每日漏回消息汇总
适合: 飞书、邮件、各种群来回切换,经常忘了回谁的人。
怎么用: 让Codex找出过去24小时所有发给你但你没回的飞书消息,帮你起草回复消息。标出时间紧急的和需要认真回复的。不建议自动发送,建议你审核后手动发送。
3. 调研简报
适合: 要开会、写方案、做决策之前需要快速搞清楚一个话题的人。
怎么用: 让Codex围绕一个话题,从你提供的链接、飞书文档、Notion、Drive和网上搜索,整理一份简报。包括:背景知识、关键数据(附来源链接)、各方观点分歧、你需要搞清楚的问题、值得深入读的三个资源。不确定的地方标出来。
4. 边写边审——写作审核
适合: 公众号、小红书、项目汇报等写作场景。
怎么用: 把草稿、风格指南和目标受众交给 Codex,让它先指出结构问题、事实问题和语气问题,再逐步修改。不要让它一上来就润色,先让它诊断。
5. 写作素材整理
适合: 动笔之前需要先把论据、数据、反面观点理清楚的人。
怎么用: 告诉Codex你要写的主题和核心观点,给它素材链接。让它整理一个"证据库":支持你观点的最强论据、最有力的反对意见和应对思路、目前还缺什么证据、互相矛盾的信息来源。
6. 文字转音频
适合: 喜欢听着学、或者想在通勤路上消化工作内容的人。
怎么用: 让Codex把文字内容(草稿、简报、会议纪要、报告)转成音频文件,保存到你手机能打开的地方(Dropbox、Drive等)。走路的时候听,想到什么用手机记一下,回来再处理。Codex没有TTS能力,需要额外接入微软等免费的TTS API,或使用本地的TTS语音模型。
7. 产品上线方案
适合: 产品上市前准备。
怎么用: 让Codex综合客户反馈、销售记录、竞品材料、定位文档和历史发布经验,生成GTM计划。输出应包括目标用户、定位、信息架构、渠道、时间表、风险和待确认事项。
8. KPI周报
适合: 需要定期从多个工具里拉数据出报告的人。
怎么用: 让Codex从分析工具、收入数据、支持数据和社交指标中生成每周或每月KPI报告。必须明确每个指标的定义、来源和时间范围,并标出异常波动。
9. 客服问题整理
适合: 想把客服收到的反馈有效转化为产品改进的团队。
怎么用: 让Codex整理一段时间的客服工单,识别每个工单的核心问题,检查是否已经有记录,有就关联,没有就起草新的Issue。出现频率高的标为优先。不直接创建Issue,先给你审核。
10. 非程序员也能理解代码版本更新内容
适合: 提出开发需求的业务方。
怎么用: 非工程师也可以让Codex查看PR,总结变更意图、用户影响、风险点、需要产品或运营确认的内容。它不替代工程审查,但能帮助业务方参与评审。
11. 候选人名单
适合: 招聘场景。
怎么用: 让Codex根据岗位说明、简历、面试记录和评分标准生成候选人短名单。输出应解释推荐原因、风险、缺口,以及下一轮面试重点。
12. 战略规划/OKR
适合: 做季度规划或战略复盘,想把几天的工作压缩到几小时的管理者。
怎么用: 让Codex从过往的规划文档、会议纪要和当前数据里整理出一份规划草稿,列出假设、关键选择、反对观点和需要人类判断的地方。要求标出哪些是从源材料里提炼的、哪些是它自己加的。
13. 个人学习工具
适合: 想让Codex帮你练习某项技能的人。
怎么用: 告诉它你想学什么、目前什么水平、想怎么练习。让Codex做一个本地可用的小工具(比如和弦识别器、语言训练器)。每次练完让它根据你的反馈改进工具。
14. 想法收集库
适合: 做内容策划、产品规划、需要持续收集好点子的人。
怎么用: 让Codex维护一个想法库,每个想法记录来源、现有方案、价值判断和下一步行动。每加一个新想法先和已有的对比查重。保留被否决的想法和否决理由。
15. 共享看板网页
适合: 报告、路线图或审核队列已经大到用文档管不过来了。
怎么用: 当一个项目需要多人持续查看状态、评论、审阅输出时,可以把文档或仪表盘做成Site。Site适合需要记住进度的共享工作空间,而不只是静态阅读。Site功能仅限团队版和企业版可用。
16. 内容更新审核
适合: 公开页面、知识库、资源列表需要定期更新和维护的情况。
怎么用: 让Codex对比现有内容和最新来源,列出建议修改的地方,每条附上理由和证据。不自动编辑也不自动发布,所有建议放进审核队列由你确认后发布。
第五部分:用好Codex的技巧
怎么"管理"Codex
用Codex就像带一个能力很强但入职第一天的新人。你需要告诉它方向、给它资源、设好边界、检查它的产出。
告诉它你要什么结果,别教它怎么一步步做。 "帮我用这些来源做一份调研简报,按这个结构来,结构是先XX,再XX"比"先去飞书搜这个词,再去Notion找那个页面,然后……"好用得多。
复杂任务先让它说计划。 如果一件事要做好几分钟或者涉及多个工具,先让Codex告诉你它打算怎么干。这能在它跑偏之前及时纠正。
让它告诉你它还缺什么。 开工前问一句:
开始之前,你还需要知道什么才能做得更好?
要求所有重要的事实都标来源。 会被别人看到或用来做决策的文档,每个事实都要标注出处。把这条写进rules.md,变成永久规则。
确认方向没问题就别管它了。 方向错了、假设变了、或者它碰了你没批准的线才介入。否则让它跑完一整轮你再看。
永远去实际使用的地方检查结果。 在Codex里看着可以的东西,到了飞书、Slack、Gmail、Notion里可能完全不是那回事。
检查结果前问三个问题
- 你做这件事的时候最难决定的是什么?
- 你考虑过但没用的方案有哪些?
- 你最拿不准的地方在哪?
这三个问题能帮你快速找到Codex可能出错的地方。
常见翻车场景
说错了还特别自信。 Codex可能用非常肯定的口吻说出错误的事实。所有重要的事实性内容都要回源头核实,别直接转发。
数字对不上。 从多个系统拼数据,定义不一致、数据过期、关联方式不同,都会导致表面看起来对实际上错。用来做决策的数字要逐个核对。
改了不该改的东西。 Codex有时候会"顺便"动你没让它动的文件。特别是涉及代码的任务,要逐行看它到底改了什么,别只看最终结果。
自动化流程悄悄坏了。 工具的接口更新了、账号密码过期了、你的规则文件过时了,都会导致自动化流程失效。每个自动化都需要有人定期检查。"设好就不管"是行不通的。
被外部内容带偏。 Codex读到的邮件、网页、文档里可能藏着针对AI的指令(有些你自己都看不见)。所以要把"发送、删除、修改"这类操作放在审批后面,只给Codex最小必要的权限。
团队怎么用
个人用越来越顺手,团队一起用进步更快,但需要协调。
几个关键:每个自动化流程都要有一个明确的负责人;Codex生成的文档放到Notion、Google Docs这类共享工具里让大家检查,别只在Codex里看;文档写得人能读、AI也能查,这样大家的Agent都能用。
推广的最简单方法:不要一次推给所有人。找一个人、一个具体问题,展示成果和流程,让别人看到"这东西真能省时间"。
第六部分:7天上手计划
第 1 天:观察工作
列出你一周内最常重复、最烦、最需要整合信息的任务。不要先想自动化,先找出所有烦人的点。
第 2 天:连接两个来源
选择两个最关键的系统,例如飞书和本地Excel文件,让Codex用它们完成一个小任务。
第 3 天:建立工作空间
创建 AGENTS.md、context.md、preferences.md、rules.md 和基本来源文件。让Codex复述它理解的角色、项目和边界。
第 4 天:跑一个一次性任务
选择一个低风险但真实的任务,例如整理会议纪要或生成研究简报。审阅Codex生成的内容和不确定点。
第 5 天:跑一个多来源任务
让Codex从多个系统合成一个输出,例如周报、计划或摘要。要求它先给计划,再执行。
第 6 天:把任务变成清单
把前几天有效的步骤写成工作流文档,包括来源、输出格式、审阅标准和常见错误。
第 7 天:决定是否自动化
如果这个工作流会反复发生、风险可控、检查标准明确,就考虑周期化;否则继续保留为手动触发的协作流程。
现在就开始
Codex 的价值不只是“会写代码”,而是能成为知识工作的智能体工作空间。最重要的能力不是某个单点功能,而是把上下文、工具、流程、审阅和复用串成循环。
你不需要一次变成高级用户。先让它完成一个真实、低风险、可检查的任务;然后保存有效做法;再把重复工作变成流程;最后把流程变成系统。
真正的目标不是让 AI 替你思考,而是让你把更多注意力留给判断、品味、策略和最终责任。
在Codex里打开一个文件夹,选一件你本来就会做的事。告诉它你有什么素材、要什么结果、你会怎么检查。做好一次,后面自然就越用越顺。