现代个性化技术的梦想一直是一种完美的数字助理——一位办公室主任,在你喝第一杯咖啡之前就帮你处理收件箱、安排一天的工作,并处理生活中的运营开销。对大多数人来说,这个梦想仍然存在于模糊的未来中,介于"Siri,但要好用"和科幻小说之间。

今天这个梦想已经可以实现,即使对不是程序员的人来说也是如此。我知道,因为我刚刚用 Claude Code 在36小时内搭建了这样一个系统。

关于作者的编程背景:没有。作者是一位43岁的科技传播顾问,在加利福尼亚州马林县经营个人业务。

系统实际功能

每天早上在我醒来之前,两个自动化流程在我一直开机的 Mac Studio 上运行:

  1. 日程扫描:扫描今天和明天的 Google Calendar,查找线下会议地点,使用 Google Maps API 计算真实驾驶时间,创建交通时间事件,让我知道何时出发,避免重复预订。
  2. 邮件分类>:分类昨天的邮件,识别需要处理的事项,检查任务管理器(Todoist)是否有重复项,创建带有优先级、截止日期和时长估计的归因任务。

到早上6:15,我的任务系统已经更新,无需我动手。

当我到达办公桌时,按下 Stream Deck 上标有"AM Sweep"的按钮。这会触发 Claude Code 中的命令,拉取我的任务以及日历和最近的会议记录作为上下文,然后将每个项目分类到四个类别之一:

  • 绿色:Claude 可以完全独立完成任务
  • 黄色:可以完成80%,我来收尾
  • 红色:需要我的大脑或我的存在
  • 灰色:今天无法处理

我看到完整的分类列表,调整任何看起来不对的地方,然后说"开始"。

有趣的部分来了:六个专业 AI 代理并行运行,每个都有自己的上下文窗口和限定工具访问权限:

  • 一个起草邮件(只起草,不发送)
  • 另一个在 Obsidian 中更新客户文件
  • 另一个安排会议
  • 另一个对潜在客户、话题或新闻事件进行背景研究

它们同时工作,而我专注于战略工作:写作、电话、真正需要我大脑和判断的事情。

几分钟后,我收到完成报告。标记为已完成的任务。草稿邮件在 Gmail 中等待我审核。客户笔记已更新。研究已归档。下一步已标记。

然后我按下 Stream Deck 上的第二个按钮"Time Block",执行另一个命令,将剩余的 Todoist 任务转换为时间块日历,使用上面已分配的时长估计。系统知道哪些任务需要在家、办公室还是特定地点完成。它把所有差事批处理成单次外出,按地理位置规划路线以最小化折返,使用真实 Google Maps 驾驶时间。它在正确的日子安排健身时间。它把家庭任务放在晚上孩子睡觉后的时间窗口。如果今天放不下,它会根据那天的负载推荐一个具体的未来日期。

我审查提议的日程,根据需要调整,然后说"开始"。日历事件出现。我的一天被安排好了。一分钟。

架构(不是代码)

整个系统运行在 Claude Code 上。如果你没用过:你用 plain English 描述你想要什么,Claude 编写并执行代码。使我的系统成为可能的关键能力是子代理——基本上是 Claude Code 并行启动的独立 AI 工作人员,每个都有自己的指令、工具访问权限和上下文。

但代码不是有趣的部分。有趣的部分是设计

关键洞察是弄清楚分层:每个组件必须知道其他组件存在。隔夜邮件扫描器不只是把任务转储到我的任务管理器;它用 Morning Sweep 需要正确分类的元数据来归因它们。AM Sweep 不只是分类;它组装每个子代理需要在其独立上下文窗口中完成工作的上下文包。时间块规划器不只是安排;它读取上游的所有输出并考虑它们。

这就是区分系统脚本集合的东西。每个部分都设计为供给下一个。移除任何一层,其他层仍然工作。但整体远大于部分之和:六个独立工人同时持有不同上下文,没有一个像聊天机器人那样争夺注意力或内存。

实际构建是一次对话。我编写了详细的 Markdown 文件,准确描述我希望每个部分如何表现:分类标准、语音指南、调度规则、工具权限。Claude Code 将这些 plain-English 文件读取为指令并实现它们。我通过针对真实任务列表运行系统并调整分类错误或代理做出错误判断时的情况来迭代。36小时,从开始到完成。

我完全不需要在语法层面理解代码。但我确实需要对架构有清晰的认识:什么与什么对话,每个部分负责什么,人机边界在哪里。这是系统思维,不是软件工程。

最关键的设计原则

我做出的唯一最重要的决定是对于什么保持人工处理要极其审慎。

  • 系统从不发送邮件。它起草,我审核。
  • 系统从不撰写战略简报——定义每个客户参与的核心战略文档。那些100%是我的。
  • 系统从不做定价决策、处理关系敏感通信或做战略决策。

当不确定任务是否需要我的判断时,它默认选择"准备"(为我准备好80%)而不是"派遣"(完全处理)。

这听起来显而易见,但经验告诉我并非如此。这可能是大多数人在构建此类自动化或开始思考"代理化"他们的工作时最经常犯的错误。他们要么太胆小,系统基本上是一个花哨的待办清单,实际上什么都不做;要么太激进,AI 开始发送听起来不像你的邮件并做出你没有授权的决定。

中间的狭窄地带对你的运营是特定的,找到它才是真正的工作。

我确定的框架:派遣、准备、你的、跳过。绿色任务完全处理。黄色任务准备好选项供我选择。红色任务标记为我的,附带系统能组装的任何支持上下文。灰色任务被推迟并说明原因。系统的偏见始终是让我参与任何不明确的事情。

它替代了什么

我经营一家精品咨询公司。最多五个客户,全部转介绍,没有初级员工。系统替代了本来会是一位熟练的运营人员——了解我的客户、理解我的声音、管理我的日历、处理经营专业服务公司的日常运营开销。

在此之前,那个人是……我。每天早上以30-45分钟审核邮件、更新任务、安排日程、归档笔记和做那种必要但不有价值的运营家务开始。现在这段时间是个位数分钟

时间节省:每天早上节省30-45分钟,每周五天,一年下来大约是130-195小时。这还不包括 Claude 能直接处理的任务节省的时间。

更大的胜利不是时间,而是节省的认知负荷。当我坐下来时,我的业务的运营状态已经组织好、分类好,等待决策而不是组装。我以决策模式开始一天,而不是收集模式。如果你曾经独自经营过业务,你知道这种区别不是抽象的。这是消耗你的早晨和让你专注的早晨之间的区别。

成本

我使用的是 Claude 的 Max 计划,截至本文撰写时为每月100美元。Claude Code 包含在订阅中,尽管重度使用可能会超出覆盖范围。实际上,我的大部分使用都在计划内。当超出时,超额部分微不足道,相对于生产力收益来说可笑地小。

  • 隔夜自动化使用更便宜、更快的 Sonnet 模型
  • 其他一切使用更强大的 Opus 模型逻辑
  • Google Maps API 调用远低于 Google 免费层上限
  • 托管免费,因为一切在我的 Mac Studio 上本地运行

超出我已支付订阅的总增量成本:高端情况下可能每月5-10美元

一个兼职虚拟助理做 comparable 工作的成本低端约400美元/月,高端约1,000美元/月,而且他们无法即时访问(或近即时处理)我的会议记录、邮件历史和知识库。

更大的意义

我并不是一开始就想搭建一个办公室主任。我出发是为了解决一个问题,解决它揭示了下一个问题。隔夜收件箱扫描让早晨分类变得更好。更好的分类让子代理派遣成为可能。可靠的派遣让时间块规划可行。每个部分都假设其他部分存在。36小时的工作,自我复合。

如果你在旧金山或硅谷,你可能认为每个人已经在这样做了。他们没有。走出科技泡沫,几乎没有人使用 AI 来构建他们实际业务的运营基础设施。这个差距最终会缩小,当它发生时,那些早早弄明白、培养了自动化什么和保持人工什么的直觉、学会用系统思维而不是提示工程思考的专业人士,将比那些等待有人把它打包成 SaaS 产品的人拥有巨大优势。

我不确切知道接下来会怎样。但我知道我的早晨现在很棒,这种差异不仅仅是效率。这是运营业务运营重量的重新分配,以让我把时间花在我真正想做的事情上。