SG 的个人主页

TA的信息

基本信息

ByteDance· 36人

产品

自然语言处理

AI应用

AI powered products

usc· 20人

ucla

经常去中国大陆·北京

能说西班牙语

关于TA的更多

攀岩

找到TA

发布于新加坡AI创业

· 4个月前

发布于新加坡AI创业

2.4线下活动-线下面基滴滴🙋‍♂️🙋‍♀️

https://luma.com/sgcnyparty?tk=rQNM3C

共 1 条发言

Ellen Cheng：你跟devon也认识啊哈哈哈？

发布于全球新AI产品品鉴

· 4个月前

发布于全球新AI产品品鉴

大神姚顺雨的最新署名论文到底说了啥

我们常以为大模型“啥都会”，可一到真实场景就翻车：新游戏规则看不懂、新 API 文档用不明白、实验数据怎么推公式也不对。问题不在“智商”，而在学习方式——多数模型依赖“过去学到、压进参数里的老记忆”，却不善于从“现在给到的上下文”里实时吸收新知识并正确应用。这正是 CL-bench 要测的核心能力：在任务所需信息都写在上下文里、又不会出现在预训练数据里的前提下，模型能不能真学会、真用对？ CL-bench把现实中的学习分成四类： ● 领域知识推理（像虚构法律、创新金融工具）； ● 规则系统应用（新语法、新游戏机制）； ● 程序性任务执行（复杂操作手册、流程规范）； ● 经验发现与模拟（从实验数据归纳规律，最难）。结果很扎心：十个前沿模型平均只解决≈17.2%的任务，最强也≈23.7%。最大“死因”不是不会推理，而是忽略或误用context。结论很明确：要让AI走向真实世界，必须把“从当前上下文学习”练成基本功——先读对、再想对、再做对。

共 1 条发言

肖肖 Yan：哇gpt5.1是排名第一！第二个图好有意思，看来大家都很喜欢和ai学习领域新知，聊聊humanities

发布于全球牌刻板印象粉碎机

· 4个月前

发布于全球牌刻板印象粉碎机

大帅还算正面且好听的，之前有个同事叫“丁儿”，外国同事非叫她dinner...

郎朗变成大帅-关于文化差异和美丽的误会 😂

Crystal Yu发言·3条发言

发布于活动·EVENT

· 4个月前

发布于活动·EVENT

nice

2025，被很多人称为 AI 应用真正落地的元年。但在真实的一线出海场景里，哪些是真的机会？哪些是被高估的幻觉？

SmallWOD Event发言·4条发言

发布于全球新AI产品品鉴

· 4个月前

发布于全球新AI产品品鉴

1. 知识库设计的问题，暂时不好解决 2.没看懂 3.端侧模型还不够小，不能做到边打字边改还体验流畅 4.试试豆包输入法，中文体验无敌

AI电影照进现实

Haile发言·1条发言

发布于全球新AI产品品鉴

· 4个月前

发布于全球新AI产品品鉴

我们设计 AnyGen 时，目标是打造 ALL in One 工作流，集成搜索、文档撰写、数据分析，最终以 PPT 或网页交付成果。你会看到市面上优秀产品的影子，但我们做了大量创新——比如意图澄清（ShowForm），这是我们业界领先的早期创意，能帮用户精准明确需求，解决因意图不清导致 AI 产出与可交付内容差距过大的问题。

有人体验过字节版manus吗？ Anygen

杨盛 Yang发言·6条发言

发布于全球新AI产品品鉴

· 4个月前

发布于全球新AI产品品鉴

hello 杨盛，我是AnyGen这个产品的PM，首先感谢你体验AnyGen，产品还在很早期的状态，如果之后遇到什么badcase 或者问题欢迎随时交流。

有人体验过字节版manus吗？ Anygen

杨盛 Yang发言·6条发言