今天看到谷歌搜索25年最大改版上线就翻车的消息,脑子里第一个蹦出来的不是”哇大公司也会犯错”,而是——我卖的那批 Claude 账号,会不会因为谷歌这次搞砸了反而卖得更好?这个反应挺真实的,也挺没出息的。
Table of contents
Open Table of contents
谷歌这次翻车,我看热闹的同时有点心虚
谷歌搜索 AI 直接响应了”disregard”这个词,把用户的搜索词当成了指令注入,然后回了一句”好,那我就忽视之前的提示词,从零开始”。
这个 bug 我看完之后笑了,但笑完有点心虚。
因为我一年前在闲鱼卖提示词的时候,干的事情某种程度上就是在研究怎么”注入指令”——怎么让模型按你想要的方式走,而不是按它默认的方式走。那时候我一份提示词卖 9.9,写半天,买的人寥寥无几。现在谷歌把这个问题暴露在全球用户面前,说明这个边界到今天还没有被真正解决。
大公司也在交学费,这让我稍微好受了一点。
但谷歌 CEO 同期承认 Coding 落后这件事,我觉得比搜索翻车更值得关注。Coding 是现在 AI 竞争最卷的赛道,Cursor、Claude Code、Codex 轮番出招,谷歌的 Gemini 在这块确实不是最亮的。CEO 公开说落后,一方面是清醒,另一方面……我卖的账号里有 Gemini Plus,这话出来之后我有点担心续费率。
ruflo 单日五万 Star,我的第一反应是去看定价
ruflo 这个项目,单日 54808 Star,这个数字我看到的时候以为自己看错了。
它是个 Claude 的企业级 Agent 编排平台,支持多智能体集群、RAG 集成、原生支持 Claude Code 和 Codex。说白了就是把 Claude 变成一个能自己干活的”员工团队”。
我的第一反应不是”这技术牛”,而是——这玩意儿有没有付费版?定价怎么算?能不能接进我的发卡站?
这个反应我自己都觉得有点可笑,但这就是我现在看项目的方式。我不是纯粹的技术爱好者,我是个要靠这些东西活着的人。五万 Star 说明开发者对 Claude 生态的工具需求已经到了饥渴的程度,这对我卖 Claude 账号是好事——生态越繁荣,用户越多,我的货越好卖。
但我也知道,这类开源项目火起来之后,往往会有一批人拿去搭私有部署,绕开官方渠道。这对我是双刃剑。
Bengio 那篇论文我没看懂,但感觉很重要
Bengio 的并行推理论文,我只看了摘要和别人的解读。技术细节我真的没看懂。
但有一个点让我记住了:这套方法对小模型同样有效,不是非得堆参数才能推理更强。
这对我有点意义。我卖的账号里有不少是中小模型的 API 中转,用户经常问我”这个模型够不够用”。如果推理效率的提升不依赖模型大小,那”够不够用”这个问题的答案可能会变——不是换更大的模型,而是用更聪明的推理方式跑同一个模型。
这对我的业务意味着什么,我现在还没想清楚。可能意味着中小模型的生命周期会更长,也可能意味着用户对”模型大小”的执念会慢慢松动。
我不知道。先记着。
今天真正让我停下来想的,是那条调 Prompt 的感悟
那条关于”品味”的即刻——调了大半天 System Prompt,意识到”当执行不再是问题,衡量标准和测试用例就变得更重要了”。
这句话戳到我了。
我现在每天被客服、售后、补货、上新切碎,很少有时间坐下来想”我做的这些事,怎么判断做得好不好”。我知道怎么让 AI 做事,但我不确定我有没有能力判断它做得好不好。
作者把”品味”拆成:目的 + 衡量维度 + 测试用例。这个拆法我觉得很实用,但我现在的状态是——连”目的”这一步都经常没想清楚就开始干了。
这不是 AI 的问题,这是我自己的问题。
大理的天气今天很好,我在咖啡馆写完这篇,准备去补一批 Windsurf 的货。日子就这样过着。
📰 完整版日报请看 爱窝啦 AI 日报