What I actually did with AI this week — week two

2026.05.17 · WEEK 02

五一之后的每周课程开始,我都跟学生分享这一周我用 AI 做了什么。

接上一次「这十几天」的续集。 还是不讲教程,只讲 真实发生的事 ,和我从这些事里读出来的东西。

—— 积木船长的朋友 · 5/11 → 5/17


一、AI 第一次"自己把产品上线了"

A new line, crossed again.

上节课我跟大家说,假期里 Codex 在我屏幕上自己操作、把积木的小游戏部署上了我在阿里云的服务器中——当时我觉得已经够震撼了。

这周又往前走了一步。

我让 Codex 直接通过 computer use 把积木的游戏部署到 Cloudflare 上。整个过程:

我描述目标 → 它打开浏览器 → 配合我注册、配置、上传 → 解决报错、重试、验证 → 上线。

游戏地址: 幸存者:反攻行动 (网页体验更佳) tactical-shooter-jim.pages.dev

【这里插入截图:游戏界面 / 或直接放游戏链接卡片】

我全程 没动键盘

上次它是在我的本地终端里干活;这次它是在 云服务上 跑出来一整套部署流程。

"AI 帮我写代码" → "AI 帮我把产品上线"—— 这条线又被跨过去一次

不要拿三个月前你试过的东西,去判断现在 AI 能做什么。

Don't use last quarter's ceiling to judge today's tools.

今天能力的边界,可能下周就 不在那儿了


二、用 AI 在一上午,统筹了一个会议的团队

An entire team, briefed before lunch.

这周五学院有个会议筹备—— Sonic Futures 2026 ,6 月开。我被分到所有视觉和宣传相关的工作。

以前这种活,光是「读完会议 PDF → 拆出我负责的范围 → 拆成具体任务 → 找学生 → 一个一个分配 → 排出每天的日程」——要花一两天。

这次我做的事是:

01 PDF 丢给 Codex(Parse the brief) 02 Markdown 任务清单(Structured tasks) 03 7 个同学 / 自动每日分配(Assign to 7 students) 04 1 小时会议录音 → STT → 拆解(Audio in, schedule out)

以前一个人手动算十几天日程的活,模型几分钟做完,而且 已经集成在 Obsidian 里

同一天,我们让 Codex 调用 GPT Image2一次出十几版主视觉风格,当天就筛出定稿方向。 邀请函的中英文版第二天就交了。

AI 不再是"做创意"的工具,它接管的是"结构化的统筹工作"。

From "make creative" to "run the coordination".

把人从这种活里解放出来——去做 更需要判断的事


三、毕业答辩:AI 已经长在这届学生的作品里了

It isn't a tool anymore. It's the soil.

周二我参加了 2022 级录音艺术的 毕业答辩

我做了两件事:

第一件:评语我让 AI 写了。

每年写评语是最痛的环节。这次我 提前两天 Vibe Coding 了一个"评语生成系统" ——现场开录音,把老师在答辩现场的评价全收录进去,再把往届评语喂给大模型学习 术语与结构 ,调用 硅基流动的 API DeepSeek V3 生成评语,最终把 12 位同学的数据导出 JSON,丢给本地的 Agent,自动填入 Word

写评语这件事, 今年就这样过去了

第二件:我刻意问了一下他们毕设里 AI 的参与度。

有几个同学很坦白地说:作曲和歌词深度使用了 Suno 。有同学Vibe 了一个 Protools插件 来提高效率,有同学甚至让 Codex 在 ProTools 里完整搭了整个轨道的路由

这一届,AI 已经长在他们作品里了——不是"用了一下",是"基础设施"。

No longer a tool they tried. Infrastructure they live in.

2023 年初我们一起开始接触 ChatGPT 的那一届——四年下来,到了这个程度。

无与伦比的未来。


四、数据是核心。一个反面案例。

Don't trade your data for an internship.

这周一我去了一个企业的访企拓岗会议。对方开口提了一个合作方案:

每年给他们提供 5000 首原创音乐 用于训练 AI 模型,换几个实习岗位。

我们当时心里很清楚——

数据是核心资产,实习是边角料。这是一笔极度不对等的交换。

Data is the asset. The internship is the bait.

这件事我想说的不是"别签这种合同",而是一个 判断框架 :

在 AI 时代,搞清楚什么是 真的资产

模型谁都能调,参数谁都能下载,但你录过的声音、你拍过的素材、你写过的乐谱、你混过的音轨—— 这些不可复现的、有审美痕迹的内容 ,才是 AI 时代真正稀缺的东西。

不要轻易把它们换成几个"听起来还不错"的机会。


五、两台电脑、两个 Agent,在我面前协作

A remote agent and a local one — talking to each other.

周六晚上一个特别有意思的场景。

我们工作室在打掼蛋。 孙总 给我提了个产品改进的建议,我当场想给我做的微信小程序加一个新功能。

问题: 源代码不在我手边的 MacBook 上,在山底下家里的 Mac Studio 上。

以前我会想:算了,回家再说。 这次我没回家。

我打开 Hermes (部署在 Mac Studio 上的另一个 agent),告诉它:

"你在我的文稿文件夹里把掼蛋项目找出来,把最新版本的压缩包发过来。"

它找到了。200KB,立刻发过来。

然后我在 MacBook 上让 Claude 接着改。(这之后我才学着用的 git)

远程 · Mac Studio · Hermes — finds the asset 本地 · MacBook · Claude — writes the code

我不需要回家、不需要远程桌面、不需要 SSH—— 一个 agent 找资产,一个 agent 改代码,我只是发指令

你不再操作一台电脑,你在指挥一支由 agent 组成的小队。

You don't run a machine anymore. You command a squad.


六、AI 给我做了一面镜子,照出我自己

A second pair of eyes, with no social cost.

这周还有一件事——这件不是"我用 AI 做了什么",是 "AI 反过来给我做了什么"

我现在在 Obsidian 里养了一套系统:它读我每天的语音日记,每天早上给我推一份「简报」,里面有几个问题问我。

周五那份简报里,它给我下了一个判断:

"碰撞来找你时,你的角色更像是输出者而非共建者。"

—— 它的依据是我自己最近写的几篇日记里的若干场景:我总是“抱怨“身边没人能跟我聊 AI,但回头看,是我没给别人开口的机会——我太习惯输出,太习惯掌握节奏。

我看到这句话的时候, 安静了几秒

它是对的。

要知道一件事: AI 长期跟你打交道,它会慢慢长出一个"关于你"的模型。 这个模型有时候比你身边的人更敢直接说,因为它没有人际成本。

未来用 AI 用得深的人,会越来越多地经历"被 AI 照见"的瞬间。

It's not judging you. It's offering a second view.

要不要接受这个视角,是自己的事。 但 不要回避它 ——这恰恰是 AI 给你的、最便宜的成长机会。


七、我把"写一篇论文"做成了一条流水线

From doing the task → designing the system.

前面六段讲的都是"用 AI 做一件具体的事"。这一段不一样——这周我做的事是 用 AI 去搭"做事这件事本身"的系统

论文是我现在最卡的事。一篇稿子要走完:

找题 → 读文献 → 立假设 → 选方法 → 整理材料 → 写引言 → 写讨论 → 自审 → 投出去

每一步都很重,每一步都容易卡住。

这周我做的事,是把这整个流程 拆开、写清楚、变成一条可以让 AI 跑的流水线

STEP 01 拆成清晰阶段(Stage the workflow) STEP 02 每阶段配一个 AI 技能(Skill per stage) STEP 03 主智能体 + 子智能体(Orchestrator + sub agents)

每一个阶段写清楚四件事: 谁是主力(我 / AI / 合议)、输入是什么、输出是什么、卡在哪个点必须停下来等我决定

选题、引言、假设、方法、结果、讨论——每个阶段都封装成一个独立的"技能模块"。过去要读很多原典才能掌握的经验,现在装进了 AI 可以直接调用的技能里。

最关键的是第三步:用 sub agent 的模式去跑。审稿环节也是这样——我让一个组织智能体调用 10 个不同视角的子智能体(结构、逻辑、贡献、痕迹清理、模拟审稿……),每个子智能体只干一件事、写一份报告。

主智能体 · Orchestrator(decides, dispatches, integrates)

子智能体阵列:

  1. 结构审查
  2. 逻辑检查
  3. 贡献评估
  4. 痕迹清理
  5. 模拟审稿
  6. 文献对照
  7. 方法核验
  8. 讨论延展
  9. 语言润色
  10. 风险扫描

整套可以挂机跑 ——我去吃饭、去开会、去睡觉,回来一看, 报告齐了

A LEAP

第一层:用 AI 做一件事。

第二层:设计一套逻辑,让 AI 自己调度自己去跑完一个流程。

From "use the agent" to "design the agents".

将来做混音、剪辑、声音设计、配乐——里面都有大量「 每次都要重复一遍、每次都很费力、每次都凭手感 」的环节。

试着画一张图,把这件事拆成阶段:哪些是你必须自己拍板的(风格、版本、判断),哪些是 AI 可以做苦力的(找参考、整理素材、做校对、做审查)。

再想一步——能不能把每个阶段交给一个独立的 子 agent 去跑?

The moment you draw that diagram, you're ahead


最后 · 七天七件事

这一周里,AI 帮我把团队拆好、把会议跑顺、把儿子的游戏部署上线、把毕业评语写完、把跨设备的源代码协作跑通—— 还顺便告诉了我,我有个我自己没意识到的问题。

Day 1 AI 自己把游戏部署到 Cloudflare

computer use 全程自主操作,我没动键盘

Day 2 一上午统筹了会议的团队

PDF → 任务 → 7 个学生 → 录音转日程

Day 3 毕业答辩 · 现场用 AI 写评语

同时观察到 AI 已是这一届的基础设施

Day 4 识别出一笔不对等的数据交换

5000 首原创音乐 ≠ 几个实习岗位

Day 5 远程 + 本地双 agent 协作

Hermes 找资产 / Claude 写代码 / 我发指令

Day 6 被 AI 提醒:我太习惯输出

它从我的日记里看出了我没看出来的东西

Day 7 把"写论文"做成 sub agent 流水线

主智能体 + 10 个审稿子智能体 / 挂机跑


七天,七件事。 每件事都不是"试 AI", 是"用 AI 做完一件具体的事"。

别学 AI,去用它做事。 每做完一件,你对它边界的感觉就清晰一点。

—— 积木船长的朋友 · 2026.05.17