
51 浏览
本期对话:@Bruce Agnes AI创始人兼CEO。高中拿新加坡教育部奖学金来Raffles Institution读高中,之后UC Berkeley,在硅谷微软、LinkedIn工作,创过业,疫情后回新加坡在NUS读计算机PhD(总统奖学金)。2025年初创办SapiensAI,做了一家总部在新加坡的多模态AI模型公司——自研文本、图像、视频三套模型,三个榜单都在全球前十。 6月1日他做了一件很大胆的事:全模态API无限期免费。一周之后,每天的token调用量达到2000亿,预计月底达到1万亿——大约是OpenRouter总量的四分之一。 1. 四线城市到全球Top 10 Bruce的起点很特别。他是第一届拿到新加坡教育部奖学金来读书的学生——当时他所在的国内四线城市只选了两个人,他是其中之一。来了Raffles,参加全国数学物理化学竞赛拿金牌银牌,进了学生会。之后去Berkeley拿领导力奖学金。 "富人的聪明小孩去Stanford,穷人的聪明小孩去Berkeley。Berkeley很像一个社会——没有那么in it circle的感觉,但教育很rigorous,让没那么富裕的孩子也能在硅谷这波浪潮中成长起来。" 在硅谷微软和LinkedIn工作,创过业,疫情回到新加坡,在NUS拿了总统奖学金读博。整个在新加坡读书没交过钱,每个月还能拿到将近1万新元的补贴。 他说选择回新加坡创业有感激之心,但更深层的原因是AI平权——让更广泛的人能access AI,把AI的门槛不断降低。 2. 从Agent到模型公司:被成本逼出来的 去年4月我第一次认识Bruce的时候,他还在做Agent产品。后来变成了一家模型公司。这个转变是怎么发生的? 他说一开始并没有想做模型。Day one做的是Agnes这个APP产品,3月设计,4月发布。6月开始训第一个模型,但当时和Gemini差距很远,没想过自研模型会在产品中广泛使用。 转折点是用户量到了千万级。Agnes在东南亚很受欢迎,但用户付费能力不强,量又大。调用闭源模型的账单烧不起了。 "如果用户付费能力不强,但量很大,我们再用闭源模型来承担成本维持增长——从商业模式来说不可行。" 于是从去年下半年开始下定决心自研。一开始比较激进——每个任务做一个模型,搞了20多个。后来统一成一个MOE模型,把不同的专家模块合在一起,重点放在Agentic和Coding两个领域。 到今年3月,95%以上的应用场景已经用自研模型替代。"做完之后发现我们的模型也没那么差,有些地方甚至更好。" 3. 成本是GPT的1% 这期最硬的数据: Agnes的文本模型每百万token 0.15美元。GPT和Claude的企业模型是15美元。差100倍。 图片模型大约是GPT DALL-E medium的1/50。视频模型大约是Seedance旗舰模型的1/100——别人每秒一块钱人民币,Agnes每秒一分钱。 按照现在每天2000亿token的调用量,如果用GPT,每天成本在数百万美元。Agnes把它降到了每天1到2万美元,一个月50万美元以下。 "虽然我们免费,但在host同量级用户的情况下,我们可能是亏损最小的。因为大部分公司为了获客也在降价,他们每单位用户的亏损已经超过了我们的成本。" 怎么做到的?核心逻辑是不训练超过200B参数的模型。现在很多公司训1T、2T甚至5T的模型。Agnes在200B以下找sweet spot——接近大模型的效果,但成本大幅下降。在此基础上做CUDA层优化、量化、图片视频跳步,进一步压缩推理成本。 他们最近还发了一篇论文——Recurrent Depth Transformer,改了Transformer的架构,让单位参数的智能密度提升了约10%。 4. 免费之后付费用户反而更多了 Bruce讲了一个反直觉的现象。 "免费之前,我们按照GPT的1/100报价,已经很便宜了。但基本上没有人付费,也没有人使用。" 免费开放之后,每天新增用户的1-2%当日就付费了。 逻辑是这样的:免费有一个限制——每分钟只能request 20次(RPM限制)。对个人开发者够用,但对企业和重度用户不够。用了觉得好,自然升级付费解除限制。 "98%的用户不是不付费,是慢慢都会付费。只要他量足够大。" 5. 模型市场的三层分化 Bruce把当前的模型市场分成了三层。 第一层:OpenAI和Anthropic。参数最大,性能最强,价格最高。占住了最头部的、要求非常高的、愿意付费的用户。 第二层:DeepSeek为代表。200B到2T之间,物美价廉。DeepSeek V4 Flash和V4 Pro基本把这个区间的价格打到了极致——其他同性能模型贴着他报价基本都在亏损。 第三层:Agnes。直接免费。但性能不妥协——在部分benchmark上跑分比DeepSeek还高,在Coding和Agent两个最大场景中做到差距不大甚至部分超越。 "我的成本比他们的亏损都低,那我为什么不免费?" 他还提了一个很尖锐的判断:10%的性能差距,用户愿意付两倍的价格,但不会付10倍到100倍。"如果token变成水电煤,用户真的会为10%的差别支付100倍的金额吗?我的结论是大概率不会。" 6. 50%的美国用户还没用过AI Bruce给了几个让人意外的数据。 美国市场调研:50%以上的用户还没用过任何AI模型。用过的人里,很多也只是"非常肤浅地问一个问题,每周可能就用一两天"。 OpenAI最火的产品Codex,周活只有500万,日活大约100万。"回到互联网时代,一天日活才100万,只能说完成了一轮。离数亿级的日活根本没法比。" OpenRouter是全球最大的模型聚合平台,每天4万亿token——听起来很大,但只有约40万活跃开发者。 "AI adoption没有大家想的那么快。市场格局远没有定。已经没上牌桌的确实out了,但桌上这10到20家的排序,还有巨大的变化空间。" 7. 中美之外的第三选择 我问Bruce,每家AI公司都有自己的vision——OpenAI追求AGI的能力边界,Anthropic关注安全。你的vision是什么? "AI平权、AI包容、AI中立。" 平权和包容——来自他自己的成长经历。四线城市的聪明孩子因为MOE奖学金来到了新加坡,Berkeley因为学费不贵让穷孩子也能在硅谷成长。Agnes想做的是类似的事——把AI的门槛降到让更多人能用。 中立——中美对抗的大背景下,希望Agnes成为第三个选择。美国市场某种程度上是"闭塞的"——大部分企业只能选OpenAI、Anthropic、Google三家中的一家。中国市场80%用国产模型。 "除了中国和美国以外,就没有特别做得好的模型公司。这本身就是稀缺性。" 他计划年底或明年初在新交所(也可能港交所)上市,目标估值20亿美金。选新交所而不是纳斯达克——地缘考量加上AI neutrality的定位。如果做成了,这将是新加坡第一家上市的AI模型公司。 8. 训练模型不是火箭科学 最后我问他:那么有限的资源和条件下,你当时为什么有信心冲模型? "实话说做的时候没想那么多。第一要务是降低自己的成本。心里也做了假设——如果模型差一点就差一点,因为成本不可持续。没想到做完之后发现和别人差距不大,能看到差距的地方还可以在未来训练中补齐。" 他引用了OpenAI后训练负责人Yan du Bois的话:训练模型不是火箭科学,是很多手艺活结合在一起。 "无论是我们还是国内很多模型公司,真要说做出了颠覆性创新,我的感觉是不多的。但在过去一年中能把这些能力全部积累起来,在这个时间点有机会参与竞争——这个是很稀缺的。你只有这个时间点能参与竞争,才能参与部分规则的制定。" 他总结了一句话我觉得很准确:小米加步枪的成本,飞机大炮的性能。
暂时没有回复
来日方长 敬请期待
Copyright © 2026 RADHOST PTE. LTD. (UEN: 202450723N). All Rights Reserved.