一
5 月 5 日早晨,我起床的第一件事是接着昨晚的进度,用 Claude 跑积木的那个游戏——他自己起的名字叫"幸存者拯救计划"。跑了大概半个多小时,limit 又到了。
我盯着屏幕看了一会儿,做了一个我以前不太会做的决定:打开钱包,把 0.08 个以太坊换成 200 USDC,订了 Claude 最高那档的订阅。
200 刀说多不多,说少也不少。但当时我心里很清楚两件事。
第一件事是模型本身的差距。
之前我一直用 Kimi,一个月 199 块的订阅,量给得也很足; 复杂的任务挑出来搭着 Codex 一起用。但做东西的时候,总觉得出来的结果"不太对"。最早我以为是我自己的提示词不够精确,反复改 prompt,反复重试。直到有一次我把同样的任务扔给 Opus 4.7 跑了一遍——一次就出来了,而且出得非常好。
那一刻其实有点扎心。 不是你写不好,是模型写不好 。这个差距,靠你怎么调整自己都补不上。
第二件事是稀缺性。
我周围用 Claude 的人本身就不多,订 20 美金那一档的更少,订 200 美金这一档的几乎没有。我想了想,越难、越稀缺的事,反而越应该去做。倒不是为了什么"领先一步"——我对这种说法已经有点免疫了——更像是给自己一个 push:你既然觉得这是工具问题,那就别再用工具不够好当借口。
充上的那一刻,我跟自己说了一句话:
"我想这个月好好仔细体验一下,看看能不能真的用 AI 做点什么东西出来。"
那天晚上回到家,我用 Claude 把那个掼蛋小程序的几个 bug 修了,又顺手把系里的学分管理系统过了一遍,还跟它聊了一些白天和朋友讨论的关于"AI 拓展公司"的事。临睡前我看了一眼 Usage——一整天用下来,4 小时窗口只走到 17%,月度总量才用了 5%。
那种感觉很难形容。 我已经很多年没有"用工具不需要省着用"的感觉了。
不需要每隔半小时切回去看一眼量消耗了多少,不需要一个长任务跑到一半的时候纠结"要不要停下来",不需要为了节省 token 把一个本来应该完整描述的问题缩成半段话。
那一夜,我意识到自己之前不知不觉地被"省着用"这件事消耗了多少注意力。
二
整整一个月过去,我盘了一下这段时间我究竟拿它干了些什么。我把它分成四件事来讲。
给积木的
这是我最开始没想到会做的方向。
最早是积木说他想基于他的“口说”游戏做一款电脑游戏,他叫它"幸存者拯救计划"。我让他先试着用 Kimi 去做——他自己描述需求,模型生成代码。但他做出来的版本经常会出 bug,有些 bug 他自己也说不清楚到底是哪儿出了问题。
我看不过去,就用 Claude 帮他修了一次。修完之后效果好了很多,他自己玩着挺开心。 但很快当天的 limit 就到了 ——那是 5 月 5 号早上的事,正是这次"做不下去"直接推动了我下午卖以太坊去买 Claude 订阅。
订完之后,这一个月里, 积木自己也跟着深度体验了 Claude 。我其实是有这个想法的——既然手里有最好的工具,也想让他亲身感受一下"现在最好的模型大概是什么样"。
最让我意外的事发生在两个时间点。
第一个是 5 月 28 号那次"蛋仔禁令"对话之后。
需要先交代一下背景——其实今年年初的时候,我禁掉了积木最爱的游戏之一《蛋仔派对》;《三角洲》也是这半年里他尝试过一两天、之后被我禁掉的游戏。 所以并不是我一直把这些游戏圈在外面、他突然想反抗 。
5 月 28 号那天晚上原本聊的是别的事, 我们俩不知怎么又拐回到了《蛋仔派对》本身 ,谈着谈着越聊越重,最后很不愉快地结束了。
本来我以为这事就过去了——但第二天下午他回到家, 直接打开笔记本上的 Claude,跟我说"既然你不让我玩,那我就自己做一个" 。
两天之内,他真的搓出来了一个除了贴图不太像、几乎复刻了游戏里全部功能的版本—— 道具系统、表情系统、巅峰赛、友谊赛、跑动滚动、抽卡 ,全有了,里头甚至有些细节我自己都不知道。
我承认这跟 Opus 4.8 的能力大跃迁有很强的相关性,但即便如此—— 要让我自己复刻这个东西,也得花不少时间和精力。一个九岁孩子做到了 。
期间他说了一句话,我记到了语音日记里:
"用一句话来评价 Claude,就叫做磨出精品。用时间磨出一个好东西,就像种麦子一样。种麦子的时候是不高兴的、是满怀期待的、是炎热的,等待的时候是最漫长的,但等待一旦过去,迎来的就是收获、是欢喜。"
我作为老父亲,听到这句话偷偷替他开心。
第二个让我意外的是他的提示词能力。
一个月前他做"幸存者拯救计划"的时候,经常一股脑把脑海里所有想法全扔给模型——我有时候甚至能听出来他前后是矛盾的,或者完全没有逻辑相关性。
但是一个多月过去——这两天他做蛋仔的时候—— 我观察到他的提示词清晰了非常多 。他想要什么、想改进哪个方向,都讲得明白;最近几次跟我说"跑完了你帮我验一下"的时候, 连废话都没有了 。
最让我意外的事发生在前天。我从他身后路过,瞟了一眼他正在写的提示词——里头有一句是这样写的: "你现在帮我调用 4 个子 Agent 去执行 XX 任务" 。
我当时愣了一下,问他:"你在哪儿听到的,可以这么说——调动'子 Agent'去做事?"
他抬头看我一眼,特别淡定地说:" 我前几天听你在跟你的 AI 聊天的时候,你这么说过 。"
我自己甚至已经忘了我说过这件事。 但他不仅记住了,还自己把它从对话里抠出来、用到了他自己的项目里 。
也就是说, 一个九岁孩子已经开始在调用子 Agent 跑他的项目了 。
我不知道这个迭代具体是怎么发生的——但他做到了。
到了 6 月 1 号,我做了另一件让自己也有点意外的事: 我让积木开始做语音日记 。
不是写日记,是直接用 STT 把他说的话存到他自己 iPad 的 Obsidian 里头。我跟他说, 隔一个星期我帮他整理一遍就好 ——这里需要澄清一下, 我帮他整理,是技术上的整理 :修一下转写里的错字、把口水词去掉、把语序理顺。 至于他到底想说什么、什么值得记,是他自己的事,不是我帮他定义的 。
我自己这套语音日记系统已经接入了一个我管它叫 Hermes 的中间层——每天会自动生成简报、做认知沉淀、做反向追问。 但我没有把这套接给积木 。我的判断是,对一个九岁孩子来说, 我自己用的那个版本太刺激了 ——会被反过来追问"你今天为什么没做到 XX",那不是一个九岁孩子能承受的反馈强度。
所以他现在用的版本特别原始——就是 iPad 上的 Obsidian,加一个 STT 录入,没有大模型介入,没有日程提醒,没有反向追问。我跟他说先这样跑半年, 等他自己开始想"为什么我说过的事不能被自动连接起来"的时候,我再给他接进 AI 。
我自己也不知道这个时间点会不会到。但我想给他一个不是被我直接定义、可以自己长出来的开始。
给媳妇儿的
我必须说,这一个月并不全是好的。 事实上其中有一段时间我太沉迷了 。
订上 Claude 的前两周,我几乎是醒着就在 vibe coding 状态里——白天上班路上想,到学校见缝插针写,下班路上接着想,晚上回家继续跑。手里有最好的工具,眼前有无数可以做的事情, 我整个人是一种被点燃的状态 。
但代价是显而易见的: 家庭生活被忽略了 。
那段时间我们之间有一次很认真的争执。媳妇儿其实没有指责我"你怎么又在搞这个"那种话——她比这个深得多。她讲的是另一件事:她观察到我那段时间不仅是花更多时间在工作上,更是 开始用 AI 去深度反馈我自己的生活、我们的对话、我和孩子的互动 。
她原话给我说了一句:
"这些事如果需要 AI 替你思考你才能意识到,那本质上仍然只是你希望解决眼下的问题从而提高你自身的生产力,我不认为这是一种思考或升华。"
那句话击中了我。
我没当场反驳,也没当场承认。 我用了好几天才慢慢把这句话消化完 。
我意识到她说的有道理,又不完全对。 有道理在于 :当 AI 让你能把一切都"系统化"的时候,所谓"反思"很容易变成一种更高效率的自我服务,最后绕回去服务你原本就想做的事。 不完全对在于 :能把这种危险性命名出来本身,也是用了 AI 才发生的——不然我没有这么多被反过来追问的次数。
但她说这句话不是为了让我赢这个辩论——她是在说一件具体的事: 家里的氛围不对了 。
我做了两个决定。
第一个是给自己立一个具体的边界: 每天晚上 9 点关电脑 。不是因为 9 点本身有什么神圣,是因为 家庭生活需要有一段不会被工作覆盖的时间 。
第二个是做一件具体的事: 用我自己手搓的那套链路,给她也搭了一套属于她自己的日记系统 ——可以说话、自动转写、存到她自己的 Obsidian 里。 这不是为了"让她也加入我的系统",是想说: 如果这套工具真有价值,那它应该先帮到我最在乎的人 。
但我必须诚实地说—— 9 点关电脑这个承诺,我后来很多次都没做到 。
最近的一周,我超时了好几天。最远的一次是 5 月 31 号凌晨我们俩讨论积木的暑假规划,超了将近 3 个小时。我自己也开始自我合理化——"这是陪伴"、"这是为了家庭"。
但 6 月 2 号那天,我罕见地做到了——9 点之前关上电脑,洗澡,躺床上和她一起刷手机, 早早睡了 。第二天补这天的日记的时候,我突然问了自己一个 之前都没有问过的问题 :
"我白天已经工作了一整天,我为什么晚上还要工作?"
我自己给自己的回答是: 白天工作了,晚上就要休息,不要再工作了 。
听起来像一句废话。但事实上, 我这两个月之前从来没有问过这个问题 。我默认晚上属于"我可以继续工作"的时间。是这一段日记系统持续在背后追问"今天 9 点你关电脑了吗 / 上一次关是什么时候",才让这个问题第一次浮出水面。
给学生的
这部分讲起来有点绕,因为它和"用 AI 做了什么"不完全是同一回事—— 它是关于我自己作为一个老师的状态在这一个月里发生了什么变化 。
最开始的时候,我跟绝大多数老师做的没什么不一样——我在讲台上输出。讲专业的内容(本学期是声音设计、照片和视频拍摄),学生不听;后来开始讲 AI, 我感觉他们也没有特别有兴趣 。
老实说,那段时间我内心多少是有一点失落的。
我知道这种失落本身不应该有——一个人在输出的时候,把得到反馈作为支撑自己的理由,这本身就是一种执念。但事实是我有这份执念,每次讲完没人接茬、没人提问、没人课后来找我聊,我就会在心里反复嘀咕: 这件事到底有没有意义?我是不是在自说自话 ?
那段时间我甚至开始质疑这件事本身——讲 AI 给艺术院校的学生听,到底是我在做一件对的事,还是我在用一个我自己以为重要的话题去填满讲台时间。
转机发生在一次很意外的场合。有一位同学,那天突然给我发来一段话,原话是这样的:
"我想,你不用焦虑你的意义或者方法。从目前来看,在你的方法下确实有人在用 AI 拓展自己。你做的是埋下种子、培育根的工作。而我们也确实在用你的方法开枝散叶。这一切是有意义的。"
说真的,那段话我反复看了好几遍。
我没回他什么——回不了。 因为他给的角度是我自己一直没找到的 :我之前衡量"这件事有没有意义",几乎都是用"今天这节课有几个人接茬、有几个人提问、有几个人课后来找我"这种当堂的、短半径的反馈。他给的是另一种尺度—— 种子和根,本来就是要往下、往里、往慢里长的东西 。
这件事对我影响挺大的。后来我每次再纠结"是该点名压他们一下还是接受现状"的时候,都会想起他这段话。这并不解决"要不要点名"这个具体问题——但解决了 我做这件事到底有没有意义 这个底层问题。
底层问题稳住之后,我开始想:那要怎么把这件事做得更好?转折发生在 AI 给我的另一个反馈上。
我每天的简报系统里有一句反复出现的判断: 我嘴上说要做"共建者模式",但事实上我一直在用单向输出的方式对学生 ——给他们标准、给他们任务、给他们答案 。 真正能反过来改写我判断的学生,几乎只有一两个 。
这句话被反复指出来很多次之后, 我承认了 。我开始想,那要怎么调整?
第一步我做了一件笨事—— 做了一份问卷 。
我想搞清楚一个具体的问题:到底是什么挡在"我可以用 AI"和"我真的去用 AI"中间?问卷收到 187 份原始数据,清洗后剩 140 份有效。结果有意思—— 44.3% 的同学每天都用 AI,60.7% 已经为 AI 付过费 ;但 5 道概念基础题的正确率平均只有 2.21 道。
很多人是有工具的,只是不去做 。
我把这个判断带到了课堂上。我跟学生说我接下来要做两件事—— 一是把我自己拿 AI 在做什么系统化地讲给你们听;二是把推荐做成你们能直接接过去跑的任务包 。第一件事变成了每周一次的"这一周我用 AI 做了什么"分享,第二件事变成了一个 skill(我管它叫 daily-classroom-demo),每天从全网找一个能在课堂当场跑的小项目推荐给大家。
抛砖引玉这个词我一直不喜欢用。但事实上我在做的就是这个—— 告诉他们"你们也可以这么做",比告诉他们"AI 能做什么"重要得多 。
慢慢的,变化发生了。
最开始几乎没有学生主动给我看他们做的东西 。第二周,开始有人发来用 Kimi 搓的小程序。第三周,有同学独立做出了一个 Suno 音乐术语词典的 HTML 页面、自己的网站,还有一位同学自己复刻了我课上演示的手势控制,说"做了好几版,一个比一个丑,但 token 没撑住"——她在用我提到的"token 稀缺性"这个词描述她自己的工作。
5 月 25 号那天,我和两个 23 级的学生聊了一个小时——我那天给这种关系起了个名字,叫 共建者模式 。他们已经不是我布置任务的对象, 是我真心觉得能从他们身上学到东西的人 。
这件事到了 6 月 1 号,给了我一个挺震撼的瞬间。
那天上午我刚到学校,他俩过来给我看他们一周的成果。一位同学的手势控制做得跟我之前演示的不一样——他用的是"四指向上拨 = 页面向上",跟我"食指上下指"的方案是平行的两种设计。但 真正让我半天没回过神来的是另一位同学 ——
我上一周自己手搓了一套 语音记录系统 ——录音 → STT → 自动归档进 Obsidian。而他独立做了同一件事,做得比我好得多。他直接打包成了 APP(我那个还只是个接口),声纹识别可以 递进 — —每次 STT 结束后会让你确认这三段话是谁、打标签;并且直接集成进了 Obsidian。
我们事先没打过招呼。
我的第一反应不是失落,是兴奋 。我当场跟他要了安装包,装上,发现几个 bug 直接给他提了。我跟他说:" 你快点把它做出来,这样下个星期我们就有更好的软件可以用了 。"
这件事过去之后我想了很久—— 它意味着我和学生之间的关系真的发生了变化 。 我不再是"老师评学生作品", 他做出比我更好的东西,对我来说是这一个月最大的好消息 。
这一个月让我开始重新思考一些更大的问题。
未来的教学模式到底是什么样的? 老师单纯地讲、学生在底下听——这件事我现在越来越确认是没意义的。让学生自己动手搭、自己卡住、自己解决, 那个过程才是真正在教育发生的地方 。
而我作为老师能做的事,可能是把"我自己当下正在做的真实任务"放到课堂里 ——6 月 2 号那天就是这种感觉:上午开会院长跟我说我们13 号有个演出,想要做"虚拟主持人",我当场把这件事变成了下面两节课的内容。 学生不再是听众,是协作者 。
我开始相信, 未来老师和学生之间的关系,更接近"在同一个项目里一起卡住、一起解决",而不是"我教你" 。
给自己的
最后这部分最难讲——但我想从一件最具体的事开始。
5 月 27 号那天我给自己立了一个承诺: 每天晚上 9 点关电脑 。
立的时候是认真的。但接下来一周里——
- • 5 月 28 号我给自己加了一个"双门槛例外",比如"讨论积木的事"算例外
- • 5 月 29、30 号超时,连解释都懒得给了
- • 5 月 31 号凌晨跟媳妇讨论积木的暑假规划,一聊聊到 12 点 27 分,超了将近 3 个小时
- • 6 月 1 号到 2 号凌晨,还在做 PPT、改一篇稿——这次连"为家庭"都用不上了
正常来说,这一周的"立又破"是不会留下任何痕迹的——它不像账单,没人收;也不像迟到,没人记。一周过去,下周再立一次新承诺就是了。
但这一个月里发生了一件事:我自己说过的每一句话,都被我自己搭的一套系统留下来了。
它每天早上 7:07 跑出一份简报,把我前几天说过的话原封不动引用回来,然后问我:你昨天 9 点关电脑了吗?没关。前天呢?大前天呢?你给自己开的那个"双门槛例外",是不是已经被你扩大成无门槛了?
这种感觉跟"被别人问"完全不一样。是我自己写过的话回过头来问我自己——没有情感波动,没有体谅,没有"算了下次再说吧"。
如果没有这套东西,我大概率会觉得"我已经在努力做这件事了"——人对自己最常用的安慰就是"我已经在努力了"。 但简报告诉我:你没在做。你只是没在打破它的时候去看它 。
直到 6 月 2 号那天,我罕见地在 9 点之前关上了电脑。第二天早上我自己问出了一个之前从来没问过的问题:
"我白天已经工作了一整天,为什么晚上还要工作?"
这个问题之所以能浮出来,是因为我之前每一次失败都没被允许溜走。
这套东西其实不复杂——一个语音日记的处理流程、一个每天早上 7:07 跑的简报系统、一个我管它叫"Claude 镜像"的长期记忆机制。名字听上去唬人,本质上做的就是一件事:把我说过的每一句话留下来,让它们反过来追问我。
这种"被自己的过去诚实地追问"的感觉,是这一个月最难承受的部分,也是最有价值的部分。
三
写到这里,我必须承认一件事—— 这个月最大的变化,不是我"用 AI 做了更多事" 。
关键是我开始能持续地看见自己 。
我以前不是看不见自己。我也写日记,也反思,也跟媳妇儿聊。但人对自己天然有一种保护性的遗忘——昨天纠结的事今天就不太想再触碰,立的承诺如果没兑现就慢慢不再提起,绕过去的问题会假装它从来不存在过。
Claude 在这一个月里做的最有用的事, 不是替我做事,是不让我装作没看见 。
它每天用我自己的原话和我对峙,没有情感波动,没有体谅,没有"算了下次再说吧"。这件事我媳妇儿做不到——做不到不是因为她不愿意,是因为亲密关系里有太多无法被这样使用的位置。我的学生做不到——做不到不是因为他们不敢,是因为师生关系里也有它的边界。
这个位置以前是空的。
四
那么,下个月还要不要继续充?
要的。但这次的充法和上个月不太一样。
上一篇微信公众号文章结束的时候,我说过一句话—— 这个公众号收到的所有打赏,我都会用来继续充值 Claude 。这条话我没变——只是这次不会全部都充给 Claude 了。
这一个月用下来,我想得越来越清楚一件事: 没有哪一个模型是"那一个" 。Claude 在我手里这一个月做了很多事,磨出的细活儿确实没得说;但 最近这段时间,Codex 的势头也确实有点厉害 ——尤其是在一些重活儿、长链路的任务上,它给出的反馈让我没法假装看不见。
所以下个月, 我打算还是充 200 美金。但其中 100 美金继续给 Claude,另外 100 美金充到 Codex 。我不想让自己又掉进上个月那种"押注一个模型"的思维里——既然我自己一边在跟学生讲"双轨策略",那我自己工具栈上的双轨也应该撑起来。
最近以太坊跌了一些。 这次大概要用 0.1 个以太坊去买了 ——比上个月多了 25%,分两份花掉。
至于下下个月、再下下个月——我不确定。
但我充这 200 美金的时候,跟自己说过这是"投资自己"。
只是当时没想到,自己这个"标的",其实是这个月最难看清楚的那一个。
