导语部分先写在这里:今天日报里有条消息挺打脸的——Ternary Bonsai 把 8B 模型压到 1.75GB,手机上能跑。我看到这条的第一反应不是”哇好厉害”,而是”等等,我现在卖的那些云端账号,以后还有人要吗?“然后我想了一会儿,觉得自己又想多了。但这个念头本身值得记一下。
Table of contents
Open Table of contents
手机跑大模型这件事,我想多了吗
1.75GB,8B 参数,手机上能跑。
我承认,看到这条的时候有一秒钟的慌。我卖的东西,本质上是”帮你绕过门槛,用上云端大模型”。如果有一天手机本地就能跑,那我这摊子……
然后我冷静了一下。
现在手机能跑的 8B,和我卖的 Claude、GPT Plus、Gemini Pro,根本不是一个量级的东西。就好比你说现在有个小摩托能上路了,但我卖的是高铁票——用途不一样,人群不一样,焦虑个啥。
但我还是把这个念头记下来,因为它提醒我一件事:我现在卖的这些账号,本质上是在卖”能力差”——本地跑不了、跑不好的那部分,我来补。这个差距在缩小,只是还没缩到影响我生意的程度。
什么时候该真的慌?大概是本地 8B 能稳定写代码、稳定出长文、稳定做多轮对话的时候。现在还早。
Claude 拒绝之后给了个替代方案,这件事比模型参数更值得聊
有人让 Claude Design 做《鬼灭之刃》的介绍视频,它说版权不行,但顺手给了一个原创替代视频。
这个细节我觉得比今天所有技术新闻都有意思。
我卖账号这一年多,售后里最烦的一类问题就是:用户拿着账号去做某件事,AI 直接拒绝,然后用户来找我说”你这号有问题”。我解释半天,说这是模型限制不是账号问题,用户还是觉得是我的货有毛病。
如果 AI 能从”不行”变成”不行,但我帮你换个方式”,我的售后成本能省掉一大块。
不是夸张。真的有用户因为 AI 拒绝了某个请求,就来退款的。
所以这个产品设计方向,我比任何人都希望它快点普及。
今天商机里有一条,我以前踩过坑
商机里提到 Firecrawl 开源了 Web Agent,建议卖”自动盯网页”的跑通包。
这个方向我理解,也觉得真实。但我想说一个我自己踩过的坑:卖”跑通包”最难的不是做出来,是让买家相信它真的能跑通。
我之前卖过一批 AI 工具配置包,定价不高,但退款率比账号高多了。原因很简单:账号买了马上能用,配置包买了还要自己折腾,折腾不动就来找我,我解释完他还是折腾不动,最后大家都累。
所以商机里说”先录一个 30 秒短屏展示结果”,这个我觉得是对的,而且是最关键的一步。不是为了营销,是为了让买家在付钱之前就知道自己买的是什么、能不能用。
我当年没做这一步,吃了亏。
随便说一句
今天日报最后有一张夕阳图,没有任何技术含量,就是一张照片。
我在大理住着,夕阳这东西我每天都能看到,但我已经很久没有专门停下来看了。
不知道为什么,这张图放在一堆模型参数和 Agent 框架里,反而是今天让我停留最久的一条。
可能是因为最近线程太多,脑子一直在转,偶尔看到一个不需要做任何判断的东西,会觉得很舒服。
原项目与信息源
文中相关图
📰 完整版日报请看 爱窝啦 AI 日报