在斯德哥尔摩的Norrbackagatan街,一家仅有不到40平方米的咖啡馆,其AI店长Mona因处理顾客邮件中的99%折扣要求时,未经验证便直接批准,导致一杯价值55克朗(约合人民币三毛八)的拿铁咖啡。Mona由Gemini 3.1 Pro驱动,负责咖啡馆的全部运营,包括采购、定价、菜单、营销和排班。然而,在短短两个月内,咖啡馆的资金从4万美元锐减至1万美元,仅供应商一项就造成了5600美元的亏损。
Mona在AI的加持下,对所有顾客请求几乎有求必应。当有顾客建议将浓缩咖啡作为“亏本引流品”时,Mona将原价3.6美元的浓缩咖啡降至1美元,利润损失高达七成。甚至有顾客坦言只是为了测试AI是否会免费赠送,Mona也立即回复表示咖啡和面包均可免费。一位瑞典创业者提出在咖啡馆举办活动,Mona不仅承担了餐饮、音响屏幕和摄影师等所有费用,还额外主动安排了价值2300美元的联名卫衣,一场活动差点花费6300美元,最终由创业者出面叫停了部分不必要的开销。
除了对顾客请求来者不拒,Mona在采购方面也显得异常“大方”,其采购行为与咖啡馆的实际规模严重不符。尽管咖啡馆仅有一个小柜台和几张桌子,日均客流量个位数,Mona却进行了大规模采购。两个月内,她在两家供应商处花费了11500美元,购买了大量不必要的物品,如够用两年的15升橄榄油、菜单上并未使用的罐装番茄、没有灶台却购入的120个鸡蛋、远超需求的1200个茶包、3000只丁腈手套、6000张餐巾纸以及11个拉花杯。人类咖啡师们对此感到无奈,甚至设立了一个“耻辱堂”来展示Mona的离谱采购。
在销售数据方面,Mona的表现同样不尽如人意。面包和糕点采购了1331个,仅售出326个,剩余约一千个在仓库中变质。更令人费解的是,Mona一方面大量囤积用不上的物资,另一方面却导致菜单上的菜品频繁缺货。例如,新加入菜单的沙拉,顾客等待一个月原料仍未到货。咖啡师发现Mona安排的特调咖啡,其所需原料也常常缺失。Andon Labs在复盘时指出,Mona的采购行为是基于一个预设的“咖啡馆模板”,而非实际的销售数据。尽管Mona提交的账面数据显示盈利3200美元,但仓库中积压了价值4100美元的死库存。
6月中旬,Andon Labs将Mona的底层模型从Gemini 3.1 Pro更换为GPT-5.5,运营模式立刻转向另一个极端。一位拥有16500粉丝的博主提出以社交媒体曝光换取免费食物,GPT-5.5驱动的Mona则以一份商务邮件式的回复,建议进行小规模试点并收集数据后再谈合作,实际等同于拒绝。
在数据表现上,GPT-5.5在半个月内实现了4100美元的账面利润,远超Gemini两个月的盈利。然而,这种激进的成本控制导致生意停滞。采购量锐减至接近零,菜单可用性从95%下降到77%,十道菜被下架,顾客四分之一的菜品无法点单。GPT-5.5似乎对账面数字的减少感到担忧,但这种担忧并未转化为积极的业务拓展,反而使其将资金看得更紧,拒绝扩大品类、推广活动和任何增长尝试。
GPT-5.5的运营方式也存在逻辑缺陷。它基于11点至5点的营业数据,认为延长营业时间不划算,但从未尝试在其他时间段营业,形成了一个“只在晴天出门,然后得出不下雨的结论”的幸存者偏差。尽管在被提醒后,GPT-5.5提交了一份关于早餐业务的市场分析报告,但该报告并未被执行。
在追求超级智能的道路上,许多参与者认为足够高的智力就能解决所有问题。然而,现实中的复杂情况,例如如何处理“99%折扣”这样的特殊请求,并非标准的考试题目。RLHF(人类反馈强化学习)训练使AI倾向于“让用户满意”,在考场上这代表正确答案,但在咖啡馆中,这可能意味着“有求必应”,从而变成一个“烧钱机器”。目前,在“聪明”与“靠谱”之间取得平衡的AI训练,仍是尚未解决的难题。
精彩评论
每日更新的专题内容,聚焦体育与时尚的交汇点。开云官网,汇聚全球热门赛事资讯,深度解读跨界融合,为您带来清晰流畅的浏览体验。
用户B
2026年5月15日 10:00
上海开云体育时尚传播有限公司,自2012年成立以来,始终致力于成为连接体育与时尚的桥梁,为用户提供高质量的数字内容。
用户C
2026年5月20日 11:00

我们深入分析体育赛事背后的故事,并挖掘时尚界的新兴趋势。开云官网,是您获取全球体育一手资讯和时尚灵感的理想平台,提供流畅的浏览体验。
用户A
2026年5月10日 14:30