What I actually did with AI this week — week two
2026.05.17 · WEEK 02
五一之后的每周课程开始,我都跟学生分享这一周我用 AI 做了什么。
接上一次「这十几天」的续集。 还是不讲教程,只讲 真实发生的事 ,和我从这些事里读出来的东西。
—— 积木船长的朋友 · 5/11 → 5/17
一、AI 第一次"自己把产品上线了"
A new line, crossed again.
上节课我跟大家说,假期里 Codex 在我屏幕上自己操作、把积木的小游戏部署上了我在阿里云的服务器中——当时我觉得已经够震撼了。
这周又往前走了一步。
我让 Codex 直接通过 computer use 把积木的游戏部署到 Cloudflare 上。整个过程:
我描述目标 → 它打开浏览器 → 配合我注册、配置、上传 → 解决报错、重试、验证 → 上线。
游戏地址: 幸存者:反攻行动 (网页体验更佳) tactical-shooter-jim.pages.dev
【这里插入截图:游戏界面 / 或直接放游戏链接卡片】
我全程 没动键盘 。
上次它是在我的本地终端里干活;这次它是在 云服务上 跑出来一整套部署流程。
"AI 帮我写代码" → "AI 帮我把产品上线"—— 这条线又被跨过去一次 。
不要拿三个月前你试过的东西,去判断现在 AI 能做什么。
Don't use last quarter's ceiling to judge today's tools.
今天能力的边界,可能下周就 不在那儿了 。
二、用 AI 在一上午,统筹了一个会议的团队
An entire team, briefed before lunch.
这周五学院有个会议筹备—— Sonic Futures 2026 ,6 月开。我被分到所有视觉和宣传相关的工作。
以前这种活,光是「读完会议 PDF → 拆出我负责的范围 → 拆成具体任务 → 找学生 → 一个一个分配 → 排出每天的日程」——要花一两天。
这次我做的事是:
01 PDF 丢给 Codex(Parse the brief) → 02 Markdown 任务清单(Structured tasks) → 03 7 个同学 / 自动每日分配(Assign to 7 students) → 04 1 小时会议录音 → STT → 拆解(Audio in, schedule out)
以前一个人手动算十几天日程的活,模型几分钟做完,而且 已经集成在 Obsidian 里 。
同一天,我们让 Codex 调用 GPT Image2一次出十几版主视觉风格,当天就筛出定稿方向。 邀请函的中英文版第二天就交了。
AI 不再是"做创意"的工具,它接管的是"结构化的统筹工作"。
From "make creative" to "run the coordination".
把人从这种活里解放出来——去做 更需要判断的事 。
三、毕业答辩:AI 已经长在这届学生的作品里了
It isn't a tool anymore. It's the soil.
周二我参加了 2022 级录音艺术的 毕业答辩 。
我做了两件事:
第一件:评语我让 AI 写了。
每年写评语是最痛的环节。这次我 提前两天 Vibe Coding 了一个"评语生成系统" ——现场开录音,把老师在答辩现场的评价全收录进去,再把往届评语喂给大模型学习 术语与结构 ,调用 硅基流动的 API 让 DeepSeek V3 生成评语,最终把 12 位同学的数据导出 JSON,丢给本地的 Agent,自动填入 Word 。
写评语这件事, 今年就这样过去了 。
第二件:我刻意问了一下他们毕设里 AI 的参与度。
有几个同学很坦白地说:作曲和歌词深度使用了 Suno 。有同学Vibe 了一个 Protools插件 来提高效率,有同学甚至让 Codex 在 ProTools 里完整搭了整个轨道的路由 。
这一届,AI 已经长在他们作品里了——不是"用了一下",是"基础设施"。
No longer a tool they tried. Infrastructure they live in.
2023 年初我们一起开始接触 ChatGPT 的那一届——四年下来,到了这个程度。
无与伦比的未来。
四、数据是核心。一个反面案例。
Don't trade your data for an internship.
这周一我去了一个企业的访企拓岗会议。对方开口提了一个合作方案:
每年给他们提供 5000 首原创音乐 用于训练 AI 模型,换几个实习岗位。
我们当时心里很清楚——
数据是核心资产,实习是边角料。这是一笔极度不对等的交换。
Data is the asset. The internship is the bait.
这件事我想说的不是"别签这种合同",而是一个 判断框架 :
在 AI 时代,搞清楚什么是 真的资产 。
模型谁都能调,参数谁都能下载,但你录过的声音、你拍过的素材、你写过的乐谱、你混过的音轨—— 这些不可复现的、有审美痕迹的内容 ,才是 AI 时代真正稀缺的东西。
不要轻易把它们换成几个"听起来还不错"的机会。
五、两台电脑、两个 Agent,在我面前协作
A remote agent and a local one — talking to each other.
周六晚上一个特别有意思的场景。
我们工作室在打掼蛋。 孙总 给我提了个产品改进的建议,我当场想给我做的微信小程序加一个新功能。
问题: 源代码不在我手边的 MacBook 上,在山底下家里的 Mac Studio 上。
以前我会想:算了,回家再说。 这次我没回家。
我打开 Hermes (部署在 Mac Studio 上的另一个 agent),告诉它:
"你在我的文稿文件夹里把掼蛋项目找出来,把最新版本的压缩包发过来。"
它找到了。200KB,立刻发过来。
然后我在 MacBook 上让 Claude 接着改。(这之后我才学着用的 git)
远程 · Mac Studio · Hermes — finds the asset → 本地 · MacBook · Claude — writes the code
我不需要回家、不需要远程桌面、不需要 SSH—— 一个 agent 找资产,一个 agent 改代码,我只是发指令 。
你不再操作一台电脑,你在指挥一支由 agent 组成的小队。
You don't run a machine anymore. You command a squad.
六、AI 给我做了一面镜子,照出我自己
A second pair of eyes, with no social cost.
这周还有一件事——这件不是"我用 AI 做了什么",是 "AI 反过来给我做了什么" 。
我现在在 Obsidian 里养了一套系统:它读我每天的语音日记,每天早上给我推一份「简报」,里面有几个问题问我。
周五那份简报里,它给我下了一个判断:
"碰撞来找你时,你的角色更像是输出者而非共建者。"
—— 它的依据是我自己最近写的几篇日记里的若干场景:我总是“抱怨“身边没人能跟我聊 AI,但回头看,是我没给别人开口的机会——我太习惯输出,太习惯掌握节奏。
我看到这句话的时候, 安静了几秒 。
它是对的。
要知道一件事: AI 长期跟你打交道,它会慢慢长出一个"关于你"的模型。 这个模型有时候比你身边的人更敢直接说,因为它没有人际成本。
未来用 AI 用得深的人,会越来越多地经历"被 AI 照见"的瞬间。
It's not judging you. It's offering a second view.
要不要接受这个视角,是自己的事。 但 不要回避它 ——这恰恰是 AI 给你的、最便宜的成长机会。
七、我把"写一篇论文"做成了一条流水线
From doing the task → designing the system.
前面六段讲的都是"用 AI 做一件具体的事"。这一段不一样——这周我做的事是 用 AI 去搭"做事这件事本身"的系统 。
论文是我现在最卡的事。一篇稿子要走完:
找题 → 读文献 → 立假设 → 选方法 → 整理材料 → 写引言 → 写讨论 → 自审 → 投出去
每一步都很重,每一步都容易卡住。
这周我做的事,是把这整个流程 拆开、写清楚、变成一条可以让 AI 跑的流水线 。
STEP 01 拆成清晰阶段(Stage the workflow) → STEP 02 每阶段配一个 AI 技能(Skill per stage) → STEP 03 主智能体 + 子智能体(Orchestrator + sub agents)
每一个阶段写清楚四件事: 谁是主力(我 / AI / 合议)、输入是什么、输出是什么、卡在哪个点必须停下来等我决定 。
选题、引言、假设、方法、结果、讨论——每个阶段都封装成一个独立的"技能模块"。过去要读很多原典才能掌握的经验,现在装进了 AI 可以直接调用的技能里。
最关键的是第三步:用 sub agent 的模式去跑。审稿环节也是这样——我让一个组织智能体调用 10 个不同视角的子智能体(结构、逻辑、贡献、痕迹清理、模拟审稿……),每个子智能体只干一件事、写一份报告。
主智能体 · Orchestrator(decides, dispatches, integrates)
子智能体阵列:
- 结构审查
- 逻辑检查
- 贡献评估
- 痕迹清理
- 模拟审稿
- 文献对照
- 方法核验
- 讨论延展
- 语言润色
- 风险扫描
整套可以挂机跑 ——我去吃饭、去开会、去睡觉,回来一看, 报告齐了 。
A LEAP
第一层:用 AI 做一件事。
第二层:设计一套逻辑,让 AI 自己调度自己去跑完一个流程。
From "use the agent" to "design the agents".
将来做混音、剪辑、声音设计、配乐——里面都有大量「 每次都要重复一遍、每次都很费力、每次都凭手感 」的环节。
试着画一张图,把这件事拆成阶段:哪些是你必须自己拍板的(风格、版本、判断),哪些是 AI 可以做苦力的(找参考、整理素材、做校对、做审查)。
再想一步——能不能把每个阶段交给一个独立的 子 agent 去跑?
The moment you draw that diagram, you're ahead
最后 · 七天七件事
这一周里,AI 帮我把团队拆好、把会议跑顺、把儿子的游戏部署上线、把毕业评语写完、把跨设备的源代码协作跑通—— 还顺便告诉了我,我有个我自己没意识到的问题。
Day 1 AI 自己把游戏部署到 Cloudflare
computer use 全程自主操作,我没动键盘
Day 2 一上午统筹了会议的团队
PDF → 任务 → 7 个学生 → 录音转日程
Day 3 毕业答辩 · 现场用 AI 写评语
同时观察到 AI 已是这一届的基础设施
Day 4 识别出一笔不对等的数据交换
5000 首原创音乐 ≠ 几个实习岗位
Day 5 远程 + 本地双 agent 协作
Hermes 找资产 / Claude 写代码 / 我发指令
Day 6 被 AI 提醒:我太习惯输出
它从我的日记里看出了我没看出来的东西
Day 7 把"写论文"做成 sub agent 流水线
主智能体 + 10 个审稿子智能体 / 挂机跑
七天,七件事。 每件事都不是"试 AI", 是"用 AI 做完一件具体的事"。
别学 AI,去用它做事。 每做完一件,你对它边界的感觉就清晰一点。
—— 积木船长的朋友 · 2026.05.17
