今天看到 Taalas 那个把 Llama 直接刻进芯片的新闻,第一反应不是”哇好厉害”,而是——这不就是我卖账号的思路吗?专用比通用香。
Table of contents
Open Table of contents
专用芯片和我卖的换号器,本质上是一回事
Taalas 的逻辑是:既然你每次都跑同一个模型,干嘛还要通用 GPU 来回搬运数据?直接把权重刻死在晶体管里,速度快十倍,功耗低到离谱。代价是这芯片出厂那刻就定死了,只能跑 Llama 3.1 8B,永远。
我卖 Cursor 换号器的时候,经常有人问:为什么不直接买官方订阅?我说你算算账,官方一个月 20 刀,我这边一个月几十块人民币,功能一样。代价是什么?偶尔要换个号,没有官方那种”尊贵感”。
本质上都是同一个问题:你愿意为”通用性”和”灵活性”付多少溢价?
大部分人其实不需要那么灵活。你买 Cursor Pro 是为了写代码,不是为了收藏一个账号。你买 AI 芯片是为了跑推理,不是为了今天跑 Llama 明天跑 Mistral。

说到专用,我最近在观察一个现象
我店里卖得最好的不是”全能型”产品,而是”专用型”产品。
Claude/Gemini/Codex 三合一账号,听起来很香对吧?实际上卖得一般。反而是单独的 Cursor 换号器、单独的 ChatGPT Plus 年卡,走量最大。
我一开始不理解。后来想明白了:用户心里有明确的需求。“我就是要用 Cursor 写代码”,“我就是要用 ChatGPT 聊天”。你给他一个三合一,他反而犹豫——我真的需要这么多吗?
Taalas 那帮人肯定也想明白了这个道理。他们不做通用 AI 芯片,就做一个只能跑 Llama 8B 的专用芯片。听起来很蠢,但对于那些明确知道自己要跑什么模型的客户来说,这就是最优解。
今天日报里另一个让我有感觉的
小米开源了个机器人大模型,叫 Xiaomi-Robotics-0。47 亿参数,能实时控制机器人。
我对机器人没什么研究,但”实时”这两个字戳到我了。
之前用过一些 AI 工具,最烦的就是延迟。你说一句话,它想三秒才回应,整个节奏都断了。写代码的时候尤其明显——我打完一行,等 AI 补全,等到我都忘了自己要写什么了。
小米说他们解决了推理延迟问题。我不知道具体怎么做到的,技术细节我看不懂。但如果真的能做到”说完就动”,那机器人的体验会完全不一样。
这让我想起我自己用 Cursor 的体验。有时候它补全得很快,感觉像有个人在旁边帮你写;有时候它卡一下,那种”协作感”就没了。
随便说说最近的生意
大理这几天降温了,咖啡馆里人少了很多。我窝在住处处理订单,发现一个有意思的趋势:问 Kiro 账号的人变多了。
Kiro 是 AWS 出的 AI 编程工具,之前没什么人问。最近突然多起来,我猜是哪个博主推荐了。这种事经常发生——某个工具突然火一阵,然后又沉寂下去。
我现在的策略是:什么火就进什么货,不预判。之前预判 DeepSeek 火不了,结果打脸。预判 Claude 会断供,结果也没断。干脆不预判了,跟着市场走。
卖铲子的好处就是这个:不管谁挖到金子,都得买我的铲子。
今天没什么特别深刻的想法
看完日报,感觉今天的新闻都挺”正常”的。没有什么让我特别兴奋或者特别焦虑的。
Agent 框架又更新了,开源项目又多了几个,国产 AI 又有人做对比测评了。都是意料之中的事。
唯一让我多想了一会儿的就是那个专用芯片。不是因为技术多牛,而是因为它验证了一个我一直相信的道理:大部分时候,专注比全能更有价值。
好了,今天就这样。去泡杯茶,继续处理订单。
📰 完整版日报请��?爱窝��?AI 日报