Codex 如何应用于办公和知识场景

本文经原作者授权转载，版权归原作者所有。原作者：Gorden Sun（@Gorden_Sun）。

写在前面

很多人第一眼看到Codex，觉得这就是个写代码的AI工具，跟自己没什么关系。

这个判断错了。

想象一个周一早上：你收到一封邮件，老板要你出一份产品上线方案。你打开Codex，把需求丢进去，然后合上电脑出门。通勤路上手机弹出通知——Codex已经读完了相关的飞书/Slack讨论、从Google Drive里翻出了客户调研、查了上季度的数据、在Notion里开始写方案了。它问你一个时间节点的问题，你点一下确认。到公司的时候，草稿已经在等你了。

Codex的核心能力本来是为写代码设计的，但这套能力——从多个地方拉信息、调用各种工具、一步步执行复杂任务——用来办公同样好使。

这篇指南教你怎么用Codex来处理日常工作。从搭环境开始，到实际跑各种工作流，再到把重复劳动变成越来越顺手的系统。

你不需要一口气学完所有功能。先知道有什么，再按自己的节奏慢慢用起来。文章很长，建议收藏。

第一部分：Codex是什么

一句话解释

Codex是一个AI工作台。你告诉它要做什么，它自己想办法、找工具、干活，最后把结果交给你检查。

它能做的事情包括：

读写你项目文件夹里的文件
连接飞书、Slack、Gmail、Notion、Google Drive等外部工具
自动跑多步骤的流程
需要的时候自己写代码和脚本
输出文档、表格、PPT、PDF、网页等各种格式
同时处理好几件事
在你手机上远程启动和查看任务（电脑要保持开机）
把经常做的事变成自动化流程
把你的工作成果变成可分享的网页

五个核心概念

Codex里有五个大的概念。先记一句话就够了：项目是容器，对话和目标在里面跑，插件扩展能力，站点输出成果。

项目（Project） = 一个工作空间。你在做"产品上线"就开一个项目，做"周报"就开另一个。一个项目里的所有对话共用同一批文件和规则。重要的东西（决定、状态、关键链接）存在项目文件里——别指望Codex靠聊天记录来记住。

对话（Thread） = 项目里的一次具体对话，做一件事就开一个对话。事情变了或者聊乱了就开个新的。注意：不同对话之间不会自动共享聊天记录，但可以通过共享文件来传递信息——比如A对话把结果写进一个文件，B对话读这个文件。

目标（Goal） = 用 /goal 命令设定的长期任务。适合那种你知道最终要什么、但中间要走很多步的工作。你告诉Codex什么算"做完了"，它就一直推进，完成了或者卡住了会通知你。

插件（Plugin） = 打包好的工具包。比如有人做了一个"每周写周报"的插件，装上就能用。在自己从头搭之前，先去插件目录翻翻有没有现成的。

站点（Site） = 把工作成果变成一个网页。适合需要让别人看到、并且可以互动的场景（比如一个项目看板）。如果别人只需要读一下，做成文档就行，不需要搞站点。

Codex做不到的事

Codex需要人来把关。它不能替你做判断、不能帮你核实事实、不能替你承担责任。以下情况不要让它自己干：

它接触不到数据来源的时候
做得好不好全凭主观感受的时候
搞错了后果很严重的时候

什么任务适合交给Codex

下面这些特征，满足两条以上就很适合：

需要从好几个地方拉信息汇总
有你经常重复做的步骤
做完可以对着标准检查对不对
最终要产出一个东西（文档、报告、方案等）
烦到你一直拖着不想做

用Codex做事有两种模式——这个判断贯穿全文，很重要：

完全交给Codex：任务流程明确、风险不高、结果容易检查。你把要求说清楚，Codex自己干完，你最后验收就行。

你和Codex一起做：任务比较模糊、需要你拿主意、要反复调整才能到位。你和它一起推进，边做边调方向。

简单讲，如果一份检查清单就能搞定这件事，就交给Codex自己干；如果每次都要重新想怎么做，就你俩一起做。

第二部分：搭建你的工作环境

五步工作法

所有好用的Codex工作流都跑同一个循环，跑一次熟一次，越来越快：

接工具 → 写规则 → 干活 → 检查 → 沉淀

接工具：把你日常用的系统连进来——飞书、Gmail、Slack、Notion、Google Drive、日历、数据分析工具等等。不接的话，Codex只能看到项目文件夹里的东西和你手动粘过去的内容。PPT、Word、Excel不需要额外接入，Codex默认就能处理。
写规则：把你的目标、偏好、项目细节、关键链接、检查标准写进Codex能读到的文件里。这一步的意义是：做过一次之后，Codex就不需要你每次重新交代背景了。
干活：判断这件事是交给Codex自己干，还是你们一起做。无论哪种，都先把"要用什么素材、最终要什么格式、怎么算做好了"说清楚。
检查：去成果真正使用的地方看。Codex帮你发了飞书消息，就去飞书里看效果；帮你写了文档，就去你平时写文档的工具里看。在Codex里看起来没问题的东西，放到实际场景可能完全不对。
沉淀：把好用的东西留下来。好的提示词存起来、管用的流程记下来、踩过的坑加到检查清单里。每次做完都让下一次更快一点。

连接你的工具

把日常用的工具接入Codex。注意：连上一个工具不等于给Codex开了无限权限——先给最小够用的权限就行，让Codex在改任何东西之前都先问你。

Codex接触外部工具有几种方式，原则是优先用最直接的路径：

接好工具后，可以让Codex帮你发现值得搭建的工作流，往往会有惊喜：

连接我工作中的这些工具：[列出你的工具]。看看我在这些工具里的工作习惯，帮我推荐先搭哪三个工作流。每个说明：从哪里取数据、最终产出什么、多久跑一次、我需要审批什么。

搭工作空间

干活之前，先把工作空间搭好。跳过这一步你大概率会卡住。

工作空间就是一个文件夹，里面放着Codex干活需要的所有"背景资料"——指令、规则、流程文档、常用素材、检查清单。你可以理解成一份"入职手册"——只不过读者是Codex。

别自己从零设计文件结构。让Codex来采访你，然后它帮你设计：

我想让你帮我创建一个工作空间。一次问我一个问题，了解我的角色、职责、手头的项目、经常重复做的事、用的工具、合作的人、做出来的东西长什么样、我的工作习惯，以及哪些事绝对不能让你自作主张。问完之后帮我设计一个文件夹结构，解释每个文件是干什么的。我确认之前不要动任何东西。

文件夹结构参考

不必严格参考，前期可以先用起来，熟练后再按自己的规范来。清晰的文件夹结构会让你和AI都能把握当前项目的情况。

三个关键文件分别写什么

context.md（你是谁）：你的角色和负责的事、手头在做的项目、每天用的工具、合作最多的人和团队。

preferences.md（你的偏好）：写东西什么风格和语气、哪些东西要你过目才能发出去、哪些事Codex做完告诉你一声就行。

rules.md（红线规则）：没经过你同意绝对不能做的事——发消息、发布内容、删东西、改正式资料、转账。可以不问直接做的事——起草、总结、调研、列大纲、整理资料。还有你工作中的特殊要求（比如客户信息保密、品牌规范等）。

关于AGENTS.md

Codex每次开工前会先读AGENTS.md这个文件。Codex根目录放一份简短的就行：说明这个空间是干什么的、哪些文件最重要、哪些规则全局适用。具体到某个项目的详细指令，放在对应子文件夹里就好。如果你找不到这个文件，可以在聊天里让Codex提供文件路径，或者直接在聊天里让Codex编写这个文件。AGENTS.md一定要简短。

第三部分：五个进阶等级

Codex高手不是一天练成的，是一步步走出来的。每一级需要不同的用法和心态，跳太快会挫败——要么你还不信任它，要么该准备的东西还没到位。

这五级是复杂度的台阶，不是能力的排名，不必刻意追求高复杂度的形式。

第1级：单次任务——先拿简单的事试手

把Codex当成一个很能干的助手。你给它一件事，它做完你来检查，就这么简单。不搞自动化，不搞花里胡哨，所有结果你过目了才算。

适合先试的事：

帮你总结会议记录，把决定、待办和问题拎出来
把散乱的笔记整理成结构化的提纲
从一堆链接和文档里拉出一份调研摘要
按你的风格指南帮你改稿
帮你列一份文档的检查清单

提示词模板：

用这些[文档/链接/笔记]帮我做一份[具体要什么]。准确比好看重要。每个事实都标上来源链接。你拿不准的地方标出来，最后列三个我应该确认的问题。

一个好习惯：在开始改Codex给你的东西之前，先问它"你在做这个的时候做了什么假设？哪里你最没把握？"——提前把问题暴露出来，免得你改了半天发现方向就是错的。

什么时候该升到第2级：你开始反复想"要是它能记住我上次说的就好了"。

第2级：从多个地方拉信息——跨系统整合

把Codex当一个能同时看好几个系统的分析助手。飞书的消息和文档、Notion的文档、本地的文档、Gmail邮件——这些你一个人要花半天才能拉齐的信息，Codex可以帮你一次搞定。

典型场景：

把会议记录、飞书消息、客户笔记拉到一起，写一份产品上线方案
从数据后台、收入数据、客服量里拉出一份周报
综合飞书消息和文档，做一份周报

提示词模板：

我要一份[具体要什么]。需要用到以下信息：[工具1]：去里面找[什么信息] [工具2]：去里面找[什么信息] [工具3]：去里面找[什么信息] 最终格式：[你想要的结构]开始之前先告诉我你打算怎么做：要查哪些东西、会产出什么、可能缺什么、完成前你会怎么检查。涉及发消息、改文件这类操作的，先问我。

注意：从多个系统拉数据容易出错——数据可能过期了、各系统定义不一样、数据对不上。涉及业务决策的数字，一定要回到原始数据源逐个核对。

什么时候升到第3级：你发现同一个流程每周都在手动跑，开始想"这能不能自动的"。

第3级：定期自动跑——解放重复劳动

到了这一级，你可以把那些"每次都差不多"的工作自动化了。

核心判断：如果一份检查清单就能搞定，就交给Codex自动跑；如果每次都得重新想，就还是你俩一起做。

最适合自动化的"电脑杂活"：

每天下班前帮你扫一遍没回的飞书消息和邮件，编写回复草稿甚至自动回复
每周自动从各个工具拉数据出一份指标简报
每次开完会自动整理笔记、列出待办事项
把你的写作草稿自动打包成编辑审阅格式

搭自动化之前，先填这个表想清楚：

流程名称：多久跑一次：从哪里取数据：最终产出什么：什么事Codex可以自己干：什么事必须先问你：怎么验证结果对不对：结果放到哪里：什么时候该停用或更新这个流程：

检查的时候记得去实际用的地方看。 Codex帮你起草的飞书消息，去飞书里看；帮你写的邮件，去Gmail里看。在Codex里看着没问题的东西，放到真正的场景里可能感觉完全不一样。

什么时候升到第4级：你发现光靠写提示词搞不定了——有些事太复杂，需要一个小脚本或小工具才能跑得稳。

第4级：让Codex帮你造小工具

有时候Codex最好的产出不是一份文档，而是一个小工具——一个脚本、一个简单的看板、一个自动跑某件事的小程序。

你不需要是程序员。操作方法是：

先在Codex里手动做一遍，确认结果是你想要的
问它："这个流程里哪些步骤可以做成一个小工具来自动处理？"
让Codex做个原型，用大白话给你解释它干了什么
用你的真实数据跑一遍，看结果和手动做的是不是一样
好用的留着，不好用的扔掉

你不需要看懂每一行代码，但你要能说清楚三件事：输入是什么、输出是什么、哪一步需要人来看一眼。说不清楚的话，这个工具还没准备好上线。

什么时候升到第5级：你发现自己总是在给Codex重复同样的反馈——"别用这个语气""记得加上来源""格式按我上次的来"。

第5级：越用越聪明的系统

到这一级，你的目标是让每次工作都让系统变得更好。Codex不是用一次就扔的工具，而是一个能积累经验的系统。

每次做完一件有价值的事，养成习惯做这四件事：

1. 存下好用的提示词。哪个提示词产出了特别好的结果？把它原封不动存下来——用了什么素材、写了什么提示词、要什么格式、怎么检查的。下次直接复用。

2. 出过的错加进检查清单。数字搞错了？语气不对？做了不该做的假设？把它变成检查清单里的一条，让Codex以后自动对照检查。

3. 项目结束后更新背景文件。做完一个大项目就更新context.md——新增了什么优先级、用了什么新工具、什么管用什么不管用。

4. 问Codex有什么值得沉淀。每次做完有成果的事，跑一下这个提示词：

根据我们刚才做的，有哪些东西值得做成可复用的模板、自动化流程或小工具？我应该在项目文件里补什么信息，让下次做类似的事更快？

第四部分：16个工作流模板

以下这些工作流是给你的起步参考。根据你自己的工具和实际情况来调整。

1. 收件箱清零

适合：邮件一多就焦虑、老是漏掉该回的邮件的人。

怎么用：让Codex扫描你某段时间的收件箱，每封邮件归类（该回复/该处理/可归档/已处理），该回的帮你起草回复，该处理的列清楚要做什么，需要你亲自想的单独标出来。只起草不发送，你去Gmail里审完再发送。

越用越好：跑几次后加一个规则文件——哪些人的邮件永远优先、什么话题直接归档、什么事必须你亲自回。

2. 每日漏回消息汇总

适合：飞书、邮件、各种群来回切换，经常忘了回谁的人。

怎么用：让Codex找出过去24小时所有发给你但你没回的飞书消息，帮你起草回复消息。标出时间紧急的和需要认真回复的。不建议自动发送，建议你审核后手动发送。

3. 调研简报

适合：要开会、写方案、做决策之前需要快速搞清楚一个话题的人。

怎么用：让Codex围绕一个话题，从你提供的链接、飞书文档、Notion、Drive和网上搜索，整理一份简报。包括：背景知识、关键数据（附来源链接）、各方观点分歧、你需要搞清楚的问题、值得深入读的三个资源。不确定的地方标出来。

4. 边写边审——写作审核

适合：公众号、小红书、项目汇报等写作场景。

怎么用：把草稿、风格指南和目标受众交给 Codex，让它先指出结构问题、事实问题和语气问题，再逐步修改。不要让它一上来就润色，先让它诊断。

5. 写作素材整理

适合：动笔之前需要先把论据、数据、反面观点理清楚的人。

怎么用：告诉Codex你要写的主题和核心观点，给它素材链接。让它整理一个"证据库"：支持你观点的最强论据、最有力的反对意见和应对思路、目前还缺什么证据、互相矛盾的信息来源。

6. 文字转音频

适合：喜欢听着学、或者想在通勤路上消化工作内容的人。

怎么用：让Codex把文字内容（草稿、简报、会议纪要、报告）转成音频文件，保存到你手机能打开的地方（Dropbox、Drive等）。走路的时候听，想到什么用手机记一下，回来再处理。Codex没有TTS能力，需要额外接入微软等免费的TTS API，或使用本地的TTS语音模型。

7. 产品上线方案

适合：产品上市前准备。

怎么用：让Codex综合客户反馈、销售记录、竞品材料、定位文档和历史发布经验，生成GTM计划。输出应包括目标用户、定位、信息架构、渠道、时间表、风险和待确认事项。

8. KPI周报

适合：需要定期从多个工具里拉数据出报告的人。

怎么用：让Codex从分析工具、收入数据、支持数据和社交指标中生成每周或每月KPI报告。必须明确每个指标的定义、来源和时间范围，并标出异常波动。

9. 客服问题整理

适合：想把客服收到的反馈有效转化为产品改进的团队。

怎么用：让Codex整理一段时间的客服工单，识别每个工单的核心问题，检查是否已经有记录，有就关联，没有就起草新的Issue。出现频率高的标为优先。不直接创建Issue，先给你审核。

10. 非程序员也能理解代码版本更新内容

适合：提出开发需求的业务方。

怎么用：非工程师也可以让Codex查看PR，总结变更意图、用户影响、风险点、需要产品或运营确认的内容。它不替代工程审查，但能帮助业务方参与评审。

11. 候选人名单

适合：招聘场景。

怎么用：让Codex根据岗位说明、简历、面试记录和评分标准生成候选人短名单。输出应解释推荐原因、风险、缺口，以及下一轮面试重点。

12. 战略规划/OKR

适合：做季度规划或战略复盘，想把几天的工作压缩到几小时的管理者。

怎么用：让Codex从过往的规划文档、会议纪要和当前数据里整理出一份规划草稿，列出假设、关键选择、反对观点和需要人类判断的地方。要求标出哪些是从源材料里提炼的、哪些是它自己加的。

13. 个人学习工具

适合：想让Codex帮你练习某项技能的人。

怎么用：告诉它你想学什么、目前什么水平、想怎么练习。让Codex做一个本地可用的小工具（比如和弦识别器、语言训练器）。每次练完让它根据你的反馈改进工具。

14. 想法收集库

适合：做内容策划、产品规划、需要持续收集好点子的人。

怎么用：让Codex维护一个想法库，每个想法记录来源、现有方案、价值判断和下一步行动。每加一个新想法先和已有的对比查重。保留被否决的想法和否决理由。

15. 共享看板网页

适合：报告、路线图或审核队列已经大到用文档管不过来了。

怎么用：当一个项目需要多人持续查看状态、评论、审阅输出时，可以把文档或仪表盘做成Site。Site适合需要记住进度的共享工作空间，而不只是静态阅读。Site功能仅限团队版和企业版可用。

16. 内容更新审核

适合：公开页面、知识库、资源列表需要定期更新和维护的情况。

怎么用：让Codex对比现有内容和最新来源，列出建议修改的地方，每条附上理由和证据。不自动编辑也不自动发布，所有建议放进审核队列由你确认后发布。

第五部分：用好Codex的技巧

怎么"管理"Codex

用Codex就像带一个能力很强但入职第一天的新人。你需要告诉它方向、给它资源、设好边界、检查它的产出。

告诉它你要什么结果，别教它怎么一步步做。 "帮我用这些来源做一份调研简报，按这个结构来，结构是先XX，再XX"比"先去飞书搜这个词，再去Notion找那个页面，然后……"好用得多。

复杂任务先让它说计划。如果一件事要做好几分钟或者涉及多个工具，先让Codex告诉你它打算怎么干。这能在它跑偏之前及时纠正。

让它告诉你它还缺什么。开工前问一句：

开始之前，你还需要知道什么才能做得更好？

要求所有重要的事实都标来源。会被别人看到或用来做决策的文档，每个事实都要标注出处。把这条写进rules.md，变成永久规则。

确认方向没问题就别管它了。方向错了、假设变了、或者它碰了你没批准的线才介入。否则让它跑完一整轮你再看。

永远去实际使用的地方检查结果。在Codex里看着可以的东西，到了飞书、Slack、Gmail、Notion里可能完全不是那回事。

检查结果前问三个问题

你做这件事的时候最难决定的是什么？
你考虑过但没用的方案有哪些？
你最拿不准的地方在哪？

这三个问题能帮你快速找到Codex可能出错的地方。

常见翻车场景

说错了还特别自信。 Codex可能用非常肯定的口吻说出错误的事实。所有重要的事实性内容都要回源头核实，别直接转发。

数字对不上。从多个系统拼数据，定义不一致、数据过期、关联方式不同，都会导致表面看起来对实际上错。用来做决策的数字要逐个核对。

改了不该改的东西。 Codex有时候会"顺便"动你没让它动的文件。特别是涉及代码的任务，要逐行看它到底改了什么，别只看最终结果。

自动化流程悄悄坏了。工具的接口更新了、账号密码过期了、你的规则文件过时了，都会导致自动化流程失效。每个自动化都需要有人定期检查。"设好就不管"是行不通的。

被外部内容带偏。 Codex读到的邮件、网页、文档里可能藏着针对AI的指令（有些你自己都看不见）。所以要把"发送、删除、修改"这类操作放在审批后面，只给Codex最小必要的权限。

团队怎么用

个人用越来越顺手，团队一起用进步更快，但需要协调。

几个关键：每个自动化流程都要有一个明确的负责人；Codex生成的文档放到Notion、Google Docs这类共享工具里让大家检查，别只在Codex里看；文档写得人能读、AI也能查，这样大家的Agent都能用。

推广的最简单方法：不要一次推给所有人。找一个人、一个具体问题，展示成果和流程，让别人看到"这东西真能省时间"。

第六部分：7天上手计划

第 1 天：观察工作

列出你一周内最常重复、最烦、最需要整合信息的任务。不要先想自动化，先找出所有烦人的点。

第 2 天：连接两个来源

选择两个最关键的系统，例如飞书和本地Excel文件，让Codex用它们完成一个小任务。

第 3 天：建立工作空间

创建 AGENTS.md、context.md、preferences.md、rules.md 和基本来源文件。让Codex复述它理解的角色、项目和边界。

第 4 天：跑一个一次性任务

选择一个低风险但真实的任务，例如整理会议纪要或生成研究简报。审阅Codex生成的内容和不确定点。

第 5 天：跑一个多来源任务

让Codex从多个系统合成一个输出，例如周报、计划或摘要。要求它先给计划，再执行。

第 6 天：把任务变成清单

把前几天有效的步骤写成工作流文档，包括来源、输出格式、审阅标准和常见错误。

第 7 天：决定是否自动化

如果这个工作流会反复发生、风险可控、检查标准明确，就考虑周期化；否则继续保留为手动触发的协作流程。

现在就开始

Codex 的价值不只是“会写代码”，而是能成为知识工作的智能体工作空间。最重要的能力不是某个单点功能，而是把上下文、工具、流程、审阅和复用串成循环。

你不需要一次变成高级用户。先让它完成一个真实、低风险、可检查的任务；然后保存有效做法；再把重复工作变成流程；最后把流程变成系统。

真正的目标不是让 AI 替你思考，而是让你把更多注意力留给判断、品味、策略和最终责任。

在Codex里打开一个文件夹，选一件你本来就会做的事。告诉它你有什么素材、要什么结果、你会怎么检查。做好一次，后面自然就越用越顺。