谷歌搜索翻车这件事，让我想起了我自己

今天看到谷歌搜索25年最大改版上线就翻车的消息，脑子里第一个蹦出来的不是”哇大公司也会犯错”，而是——我卖的那批 Claude 账号，会不会因为谷歌这次搞砸了反而卖得更好？这个反应挺真实的，也挺没出息的。

Open Table of contents

谷歌这次翻车，我看热闹的同时有点心虚
ruflo 单日五万 Star，我的第一反应是去看定价
Bengio 那篇论文我没看懂，但感觉很重要
今天真正让我停下来想的，是那条调 Prompt 的感悟

谷歌这次翻车，我看热闹的同时有点心虚

谷歌搜索 AI 直接响应了”disregard”这个词，把用户的搜索词当成了指令注入，然后回了一句”好，那我就忽视之前的提示词，从零开始”。

这个 bug 我看完之后笑了，但笑完有点心虚。

因为我一年前在闲鱼卖提示词的时候，干的事情某种程度上就是在研究怎么”注入指令”——怎么让模型按你想要的方式走，而不是按它默认的方式走。那时候我一份提示词卖 9.9，写半天，买的人寥寥无几。现在谷歌把这个问题暴露在全球用户面前，说明这个边界到今天还没有被真正解决。

大公司也在交学费，这让我稍微好受了一点。

但谷歌 CEO 同期承认 Coding 落后这件事，我觉得比搜索翻车更值得关注。Coding 是现在 AI 竞争最卷的赛道，Cursor、Claude Code、Codex 轮番出招，谷歌的 Gemini 在这块确实不是最亮的。CEO 公开说落后，一方面是清醒，另一方面……我卖的账号里有 Gemini Plus，这话出来之后我有点担心续费率。

ruflo 单日五万 Star，我的第一反应是去看定价

ruflo 这个项目，单日 54808 Star，这个数字我看到的时候以为自己看错了。

它是个 Claude 的企业级 Agent 编排平台，支持多智能体集群、RAG 集成、原生支持 Claude Code 和 Codex。说白了就是把 Claude 变成一个能自己干活的”员工团队”。

我的第一反应不是”这技术牛”，而是——这玩意儿有没有付费版？定价怎么算？能不能接进我的发卡站？

这个反应我自己都觉得有点可笑，但这就是我现在看项目的方式。我不是纯粹的技术爱好者，我是个要靠这些东西活着的人。五万 Star 说明开发者对 Claude 生态的工具需求已经到了饥渴的程度，这对我卖 Claude 账号是好事——生态越繁荣，用户越多，我的货越好卖。

但我也知道，这类开源项目火起来之后，往往会有一批人拿去搭私有部署，绕开官方渠道。这对我是双刃剑。

Bengio 那篇论文我没看懂，但感觉很重要

Bengio 的并行推理论文，我只看了摘要和别人的解读。技术细节我真的没看懂。

但有一个点让我记住了：这套方法对小模型同样有效，不是非得堆参数才能推理更强。

这对我有点意义。我卖的账号里有不少是中小模型的 API 中转，用户经常问我”这个模型够不够用”。如果推理效率的提升不依赖模型大小，那”够不够用”这个问题的答案可能会变——不是换更大的模型，而是用更聪明的推理方式跑同一个模型。

这对我的业务意味着什么，我现在还没想清楚。可能意味着中小模型的生命周期会更长，也可能意味着用户对”模型大小”的执念会慢慢松动。

我不知道。先记着。

今天真正让我停下来想的，是那条调 Prompt 的感悟

那条关于”品味”的即刻——调了大半天 System Prompt，意识到”当执行不再是问题，衡量标准和测试用例就变得更重要了”。

这句话戳到我了。

我现在每天被客服、售后、补货、上新切碎，很少有时间坐下来想”我做的这些事，怎么判断做得好不好”。我知道怎么让 AI 做事，但我不确定我有没有能力判断它做得好不好。

作者把”品味”拆成：目的 + 衡量维度 + 测试用例。这个拆法我觉得很实用，但我现在的状态是——连”目的”这一步都经常没想清楚就开始干了。

这不是 AI 的问题，这是我自己的问题。

大理的天气今天很好，我在咖啡馆写完这篇，准备去补一批 Windsurf 的货。日子就这样过着。

📰 完整版日报请看爱窝啦 AI 日报

谷歌搜索翻车这件事，让我想起了我自己

Table of contents

谷歌这次翻车，我看热闹的同时有点心虚

ruflo 单日五万 Star，我的第一反应是去看定价

Bengio 那篇论文我没看懂，但感觉很重要

今天真正让我停下来想的，是那条调 Prompt 的感悟

推荐阅读