AI对话录#13: 每百万token 0.15美元，GPT收15美元：他说免费之后付费用户反而更多了

本期对话：@⁠Bruce⁠ Agnes AI创始人兼CEO。高中拿新加坡教育部奖学金来Raffles Institution读高中，之后UC Berkeley，在硅谷微软、LinkedIn工作，创过业，疫情后回新加坡在NUS读计算机PhD（总统奖学金）。2025年初创办SapiensAI，做了一家总部在新加坡的多模态AI模型公司——自研文本、图像、视频三套模型，三个榜单都在全球前十。 6月1日他做了一件很大胆的事：全模态API无限期免费。一周之后，每天的token调用量达到2000亿，预计月底达到1万亿——大约是OpenRouter总量的四分之一。 1. 四线城市到全球Top 10 Bruce的起点很特别。他是第一届拿到新加坡教育部奖学金来读书的学生——当时他所在的国内四线城市只选了两个人，他是其中之一。来了Raffles，参加全国数学物理化学竞赛拿金牌银牌，进了学生会。之后去Berkeley拿领导力奖学金。 "富人的聪明小孩去Stanford，穷人的聪明小孩去Berkeley。Berkeley很像一个社会——没有那么in it circle的感觉，但教育很rigorous，让没那么富裕的孩子也能在硅谷这波浪潮中成长起来。" 在硅谷微软和LinkedIn工作，创过业，疫情回到新加坡，在NUS拿了总统奖学金读博。整个在新加坡读书没交过钱，每个月还能拿到将近1万新元的补贴。他说选择回新加坡创业有感激之心，但更深层的原因是AI平权——让更广泛的人能access AI，把AI的门槛不断降低。 2. 从Agent到模型公司：被成本逼出来的去年4月我第一次认识Bruce的时候，他还在做Agent产品。后来变成了一家模型公司。这个转变是怎么发生的？他说一开始并没有想做模型。Day one做的是Agnes这个APP产品，3月设计，4月发布。6月开始训第一个模型，但当时和Gemini差距很远，没想过自研模型会在产品中广泛使用。转折点是用户量到了千万级。Agnes在东南亚很受欢迎，但用户付费能力不强，量又大。调用闭源模型的账单烧不起了。 "如果用户付费能力不强，但量很大，我们再用闭源模型来承担成本维持增长——从商业模式来说不可行。" 于是从去年下半年开始下定决心自研。一开始比较激进——每个任务做一个模型，搞了20多个。后来统一成一个MOE模型，把不同的专家模块合在一起，重点放在Agentic和Coding两个领域。到今年3月，95%以上的应用场景已经用自研模型替代。"做完之后发现我们的模型也没那么差，有些地方甚至更好。" 3. 成本是GPT的1% 这期最硬的数据： Agnes的文本模型每百万token 0.15美元。GPT和Claude的企业模型是15美元。差100倍。图片模型大约是GPT DALL-E medium的1/50。视频模型大约是Seedance旗舰模型的1/100——别人每秒一块钱人民币，Agnes每秒一分钱。按照现在每天2000亿token的调用量，如果用GPT，每天成本在数百万美元。Agnes把它降到了每天1到2万美元，一个月50万美元以下。 "虽然我们免费，但在host同量级用户的情况下，我们可能是亏损最小的。因为大部分公司为了获客也在降价，他们每单位用户的亏损已经超过了我们的成本。" 怎么做到的？核心逻辑是不训练超过200B参数的模型。现在很多公司训1T、2T甚至5T的模型。Agnes在200B以下找sweet spot——接近大模型的效果，但成本大幅下降。在此基础上做CUDA层优化、量化、图片视频跳步，进一步压缩推理成本。他们最近还发了一篇论文——Recurrent Depth Transformer，改了Transformer的架构，让单位参数的智能密度提升了约10%。 4. 免费之后付费用户反而更多了 Bruce讲了一个反直觉的现象。 "免费之前，我们按照GPT的1/100报价，已经很便宜了。但基本上没有人付费，也没有人使用。" 免费开放之后，每天新增用户的1-2%当日就付费了。逻辑是这样的：免费有一个限制——每分钟只能request 20次（RPM限制）。对个人开发者够用，但对企业和重度用户不够。用了觉得好，自然升级付费解除限制。 "98%的用户不是不付费，是慢慢都会付费。只要他量足够大。" 5. 模型市场的三层分化 Bruce把当前的模型市场分成了三层。第一层：OpenAI和Anthropic。参数最大，性能最强，价格最高。占住了最头部的、要求非常高的、愿意付费的用户。第二层：DeepSeek为代表。200B到2T之间，物美价廉。DeepSeek V4 Flash和V4 Pro基本把这个区间的价格打到了极致——其他同性能模型贴着他报价基本都在亏损。第三层：Agnes。直接免费。但性能不妥协——在部分benchmark上跑分比DeepSeek还高，在Coding和Agent两个最大场景中做到差距不大甚至部分超越。 "我的成本比他们的亏损都低，那我为什么不免费？" 他还提了一个很尖锐的判断：10%的性能差距，用户愿意付两倍的价格，但不会付10倍到100倍。"如果token变成水电煤，用户真的会为10%的差别支付100倍的金额吗？我的结论是大概率不会。" 6. 50%的美国用户还没用过AI Bruce给了几个让人意外的数据。美国市场调研：50%以上的用户还没用过任何AI模型。用过的人里，很多也只是"非常肤浅地问一个问题，每周可能就用一两天"。 OpenAI最火的产品Codex，周活只有500万，日活大约100万。"回到互联网时代，一天日活才100万，只能说完成了一轮。离数亿级的日活根本没法比。" OpenRouter是全球最大的模型聚合平台，每天4万亿token——听起来很大，但只有约40万活跃开发者。 "AI adoption没有大家想的那么快。市场格局远没有定。已经没上牌桌的确实out了，但桌上这10到20家的排序，还有巨大的变化空间。" 7. 中美之外的第三选择我问Bruce，每家AI公司都有自己的vision——OpenAI追求AGI的能力边界，Anthropic关注安全。你的vision是什么？ "AI平权、AI包容、AI中立。" 平权和包容——来自他自己的成长经历。四线城市的聪明孩子因为MOE奖学金来到了新加坡，Berkeley因为学费不贵让穷孩子也能在硅谷成长。Agnes想做的是类似的事——把AI的门槛降到让更多人能用。中立——中美对抗的大背景下，希望Agnes成为第三个选择。美国市场某种程度上是"闭塞的"——大部分企业只能选OpenAI、Anthropic、Google三家中的一家。中国市场80%用国产模型。 "除了中国和美国以外，就没有特别做得好的模型公司。这本身就是稀缺性。" 他计划年底或明年初在新交所（也可能港交所）上市，目标估值20亿美金。选新交所而不是纳斯达克——地缘考量加上AI neutrality的定位。如果做成了，这将是新加坡第一家上市的AI模型公司。 8. 训练模型不是火箭科学最后我问他：那么有限的资源和条件下，你当时为什么有信心冲模型？ "实话说做的时候没想那么多。第一要务是降低自己的成本。心里也做了假设——如果模型差一点就差一点，因为成本不可持续。没想到做完之后发现和别人差距不大，能看到差距的地方还可以在未来训练中补齐。" 他引用了OpenAI后训练负责人Yan du Bois的话：训练模型不是火箭科学，是很多手艺活结合在一起。 "无论是我们还是国内很多模型公司，真要说做出了颠覆性创新，我的感觉是不多的。但在过去一年中能把这些能力全部积累起来，在这个时间点有机会参与竞争——这个是很稀缺的。你只有这个时间点能参与竞争，才能参与部分规则的制定。" 他总结了一句话我觉得很准确：小米加步枪的成本，飞机大炮的性能。

暂无回复

暂时没有回复
来日方长敬请期待

AI出海全球

AI对话录#13: 每百万token 0.15美元，GPT收15美元：他说免费之后付费用户反而更多了

暂无回复

法律条款

关注我们