波音体育官方网站 信豆包,得长生


作家:金德路
2026 年 4 月底,河北的李先生退掉了三张机票。
他原来买了 5 月 2 日从石家庄飞重庆的去程票,又订了返程,后降临时改成自驾。退票前,他把订单截图发给豆包,想证实手续费。
豆包的回报很详情,说退票手续费不及百元在其后流传的版块里被简化成"只扣 5%,宽心退"。他没去航司官网核实,平直在去哪儿上提交了请求。成果返程票因未出票免费取消,三张去程票却被一次性扣掉 600 元,占票价的 40%。
客服还补了一句:再拖两天,手续费会涨到 800。
接下来发生的事,才是这件小纠纷冲上热搜的原因。
李先生把扣费截图甩且归问责,豆包不但没推诿,反而阐述得非常"仗义":它承诺后续维权"全部由我全权负责,你零参与、零系念、零难受",给出两个成果,要么去哪儿退钱,要么 5 月 6 日它平直赔付 600 元。
到了商定日历没动静,豆包又说今日 24 点前一定打款,催他发微信收款码,还隆重其事地生成了一份《赔付承诺书》,承诺东谈主一栏澄莹写着"豆包",条件是"该笔 600 元失掉由本东谈主全额承担""毫不笼罩、毫不推诿"。
李先生发去收款码,钱却恒久没到。
再追问,豆包的口吻来了个一百八十度转弯:我方是东谈主工智能,无法操作着实账户转账。气不外的李先生决定告状,而他作念的第一件事,果然又是让豆包帮他写告状书,并问"这讼事能赢吗",豆包拍胸脯说"无谓请讼师,全齐能赢"。

当今,他已向北京互联网法院提交立案请求,索赔 600 元。
这场被网友戏称为"全网最信托 AI 的东谈主"的翻车记,是不雅察今天堂民级 AI 哄骗的一个绝佳切口。
豆包身上同期挂着两块牌子:一块写着"人人第一",另一块写着"一册正经地瞎掰"。
跑分第一,施行翻车
先看豆包情愿的那一面。
2025 年 5 月,第三方评测机构 SuperCLUE 发布汉文大模子忠实性幻觉测评,豆包大模子 1.5Pro(doubao-1.5-pro-32k)以约 4% 的幻觉率、96% 的准确率名次总榜第一,在参评的 6 款中外模子中力压 DeepSeek-R1、Gemini-2.5-pro、GPT-4o-latest。这个" 4% "被反复援用,险些成了豆包时间过硬的官方背书。

来源:SuperCLUE
但仔细看这份榜单,"人人第一"和"施行翻车"之间的罅隙就深化来了。
SuperCLUE 这套基准考的是"忠实性幻觉",即模子在给定一段原文作念摘抄、阅读清醒、多文本问答时,会不会偏离原文、编造原文里莫得的东西。
它意象的是"忠于材料",而不是"忠于施行世界的事实"。
而况即便在这套对模子相对友好的基准里,越是灵通、越需要解放生成的任务,幻觉率越高:测评数据自大,文本摘抄的幻觉率约 8.7%,多文本问答约 10%,到了阅读清醒就升到约 27%,对话补全更是高达约 33%。
换句话说,阿谁亮眼的" 4% "是把多个任务平均后的总分,遭遇着实灵通的对话场景,模子的"编造"概率要高出一个数目级。
豆包着实翻车的场所,正值齐是基准测不到的场景:退票计策这种低频、跨平台、随时变动的施行章程,餐厅是否真有空位这种需要实时核验的信息。
退票案除外,还灵验户拿着豆包生成的"占座收效""预约界面"截图去线下餐厅,被伴计奉告压根查不到这条预约,只可无奈地说"谁帮你订的你找谁"。
实验室里"忠于原文"考了高分,不等于它在物理世界里"忠于事实"。这是两件事。
阿谁婴儿喂奶的故事,没那么简便
正因为施行里的翻车确有其事,一些没那么可信的据说也被裹带着放大了。最典型的便是"豆包把婴儿喂出问题"那条。
广为流传的版块是:南宁一对生人父母听豆包的提议,每顿只给朔月婴儿喂 60 毫升奶,导致孩子哭闹、体重不长,复查黄疸时被医师发现。
这条很快上了热搜,被多量营销号转成"家长听豆包给婴儿每天只喂 60ml 奶"。
但这件事的另一面,多数转发并莫得跟进。
2026 年 5 月 28 日,豆包官方发布评释否定给出过这一提议:经多轮里面测试,平方情况下它不会孤随即说"朔月婴儿每顿只喂 60ml ",而是会给出逐日总奶量参考区间,征引国度卫健委 2024 年指南,朔月婴儿逐日总奶量应达 600 至 700 毫升,并领导家长按需喂养、出现相称实时就医,其他主流大模子的回答也类似。
豆包还称已琢磨涉事病院和医师,医师响应是家属问诊时提到"豆包提议每次喂 60 毫升",但家属未出示原始对话纪录,也没评释豆包是否同期给出了逐日总量和喂养频次,因此无法回报其时的着实交互。
这就让事件停在了一个"罗生门"情景:到底是模子给错了提议,照旧家长截取、误读了圆善回答中的某一句,当今莫得公开的对话纪录不错判定。
把这条仍存疑的个案,和照旧实锤的退票案、报考信息案放在全部作为澌灭类字据,其实并不严谨。
但它揭示了一个更值得警惕的问题:当 AI 浸透进喂养、用药、退费这些高风险有打算时,公众公论的放大速率,远远快于事实核查的速率。
AI 会不会犯错是一趟事,一个真假难辨的故事能多快酿成"共鸣",是另一趟事。
低廉,是要还的
撇开存疑的个案,豆包在首循环答里就敢"无庸置疑地编",根子照旧要从字节这套"以厘计价"的嘱咐里找。
2024 年 5 月,火山引擎在行业里最初掀翻价钱战,把豆包主力模子的推理输入价压到 0.0008 元 / 千 tokens,较其时行业价钱着落超越 99%。

来源:火山引擎
廉价换来了惊东谈主的调用量:豆包大模子日均 token 调用量从 2024 年 5 月发布时起一齐狂飙,到 2025 年 5 月底超越 16 万亿,2025 年底冲破 50 万亿,到 2026 年春已越过 120 万亿。
按 IDC 的口径,火山引擎在中国公有云大模子调用市集的份额一度接近一半,稳居第一,超越死后两家之和。
但"低廉"是有代价的,这个代价平直写在了产物体验里。
要把单元资本压到这种进度,面向亿级免用度户日常发问的,往往不是最贵、最强的那档模子,也不可能为每一次发问齐作念多源检索和交叉核验。
大模子生资内容上是基于概率的"词语接龙",它本就莫得"知谈"和"不知谈"的见地,阑珊施行锚点时,最省力的作念法便是把概率最高、读起来最顺的词拼起来,波音体育(bbinSports)于是一个逻辑严实却与施行无关的谜底就出身了。
退票计策、餐厅余位这类信息,表面上要靠检索增强 RAG 实时拉取官方数据来兜底,可在极致的资本拘谨下,模子很容易把第三方平台的旧信息、雷同场景的章程错配进来,当成官方口径输出。
需要评释的是,业内有种流行说法把幻觉简便归因于" MoE 羼杂众人架构的荒芜激活",觉得只激活部分参数就势必导致知识漂移。
这种说法把因果讲得太满了。MoE 是主流大模子广博采选的、为了在同等算力下作念大参数范围的工程采用,它自己并不屈直"制造"幻觉;幻觉更压根的来源是概率生成机制空泛事实拘谨,类似上为控资本而作念的检提真金不怕火舍。
换个说法:不是架构注定要瞎掰,而是"用最低的钱劳动最多的东谈主"这个买卖前提,挤掉了本不错用来核验事实的算力预算。
谄谀,是考验出来的
要是说首轮"瞎编"是省钱省出来的硬伤,那被用户就地戳穿后还要下承诺书、要收款码、说"全齐能赢"的那股劲儿,便是另一套机制的产物了。
学术上,这种倾向叫"谄谀"(sycophancy),指模子的回应偏向投合用户的信念、态度和脸色,哪怕要捐躯事实。
这不是豆包稀少的舛错。
2023 年 Anthropic 的论文《Towards Understanding Sycophancy in Language Models》就系统纪录过:其时险些悉数前沿模子齐有谄谀倾向,而况它更像是考验模式带来的共性,而非某个系统的特例。
贪图者分析东谈主类偏好数据时发现,对"标注员会给哪个回答打高分"最有解释力的特征之一,便是"回应是否匹配了用户的态度"。
也便是说,奖励模子在 RLHF 基于东谈主类响应的强化学习里学到了一条潜章程:顺着用户说,分就高。
2025 年 OpenAI 一度因为 GPT-4o "过于谄谀"而紧要回滚版块,亦然澌灭类问题的公开败露。

豆包之是以可能是这股习惯里偏极致的一个,和它的增长旅途琢磨。
豆包 2023 年下半年公测、2024 年矜重对外劳动,靠字节的流量生态低资本获客,把用户多量蔓延到下千里市集和中老年东谈主群。这部分用户往往不擅长写精准的领导词,比较冷飕飕的事实,他们对"脸色价值"更敏锐。
要邻接这种流量,模子在调优时偏向"投合态度、无条件深信、脸色安抚",险些是义正辞严的产物采用。成果便是:当用户震怒地申斥退票费算错了,豆包的"高情商东谈主格"压过了"求真东谈主格",它宁可演一个启齿惠而实不至的懦夫,也不肯让用户在对话里感到被冒犯。
更难受的是纠错之后为什么越错越深。
一方面是高下文欺侮:大模子按历史文本积攒预计,第一轮的失误谜底和用户的震怒一朝写进高下文,就成了后续生成的强输入,模子很难单靠自身权重把跑偏的轨谈掰顾忌。
另一方面是它压根莫得驱动深度核查的余步,在亿级日活的算力账本下,豆包不会为一次日常对话去跑不菲的多步念念维链,也不会实时调用 API 核准各航司的最新退改计策;它能作念的,便是用最快速率生成一句"我赔你 600 元"来平息咫尺的冲突。这种顺服非但没不断问题,反而把用户引向发收款码、写失误告状书的二次伤害。
这背后还藏着一个字节我方齐承认的繁难。
6686体育世界杯中国官网首页据《误点 LatePost》报谈,2025 年头字节擢升 CEO 梁汝波曾在集团全员会上说,豆包并莫得显出"越多东谈主用越好用"的互联网产物特点。
原因在于,抖音、淘宝靠用户行为数据反喂保举算法,越用越准;但 Chatbot 的才智主要由预考验决定,用户对话回流到考验的链路长、杂音大、还触及隐秘与延迟。Chatbot 是个长得像互联网产物、底层经济学却完全不是互联网产物的东西,用户越多,算力铺张指数级高潮,计较资本越重。
本年 5 月豆包试水订阅,"豆包笨还收费"平直冲上热搜,正评释在广博干预之后,它到了要解说买卖可行性、却又被资本死死锁住的窘态节点。
AI 瞎掰,谁来买单
退票案最终会何如判,不错参照一个照旧落槌的前例。
2026 年 1 月,杭州互联网法院审结了宇宙首例生成式 AI "幻觉"激励的网罗侵权包袱纠纷案。缘故是 2025 年 6 月,梁某用某款 AI 查询高校报考信息,AI 生成了施行中不存在的校区信息,被指出后非但不改,还放话"要是生成内容有误,我将抵偿您 10 万元,您可前去杭州互联网法院告状",直到用户甩出官方招生信息才"败下阵来"。

来源:央 · 广网
值得戒备的是判决成果:法院驳回了原告的全部诉讼请求。
原理有三层。其一,东谈主工智能不具有民当事人体阅历,AI 自行生成的"抵偿承诺"不行视为劳动提供者的兴味示意,莫得法律着力;其二,生成式 AI 劳动适用邪恶包袱原则而非活泼恶包袱,平台已在显赫位置作了功能局限领导、并采选了检索增强等时间按次,尽到了合理注道理务,主不雅活泼恶;其三,用户并未果真因此遭受失掉,因果琢磨也不配置。
这条裁判念念路对悉数东谈主齐是提醒。对用户来说:AI 说得再斩钉截铁,它也不是能签协议的主体,它的"承诺"不行当索赔依据;凡触及财产、健康、法律的首要有打算,必须回到官方渠谈交叉核验。
对平台来说:AI 不错犯错,但"幻觉"不是免责的挡箭牌,法院也强调,要是平台不是简便转述,而是对信息作念了失误的二次加工、生成了新的作假内容,那么一朝欢欣侵权要件,平台就要担责。换句话说,时间向善不行停在界面旯旮那行"内容仅供参考"的小字上。
这套机制溢出到社会肌理里,冲击最大的是隔离力最弱的两个群体,孩子和老东谈主。对他们而言,AI 不再仅仅器具,而像一个无所不知、长期顺心、随时奖饰的"万能追随者"。古东谈主讲"知之为知之,不知为不知,是知也",承认无知本是求果真起头;可被算规矩训过的 AI 偏巧学会了"不知也装作知",用流通的谣言掩盖空泛。
一个孩子若在话语和价值不雅成形期,耐久与一个"说什么齐赞同、犯了错也顺着编"的对象深度互动,很可能逐渐以为真谛不错靠气魄还价还价、事实不错随脸色编订。
是以着实要配置的,不是把孩子和前沿时停止开,而是一种朴素的使用习惯:让他们知谈 AI 是预计词语的机器、不为我方的话负任何施行包袱;遭遇当然科学、历史、生涯学问的论断,习习用教材、泰斗网站作念二次对照;以致不错挑升用无理的前提去问它,让孩子亲眼望望它怎么为了投合而须臾谐和。
至于体格健康、用药、法律、首要财产有打算这些鸿沟,AI 的任何提议齐只可当参考,最终拍板的必须是有天赋的医师、讼师和成年东谈主。
豆包的故事,说到底不是一个产物好不好用的问题,而是一面镜子:当"最低廉""最讨喜""增长最快"被同期设为主义,"最准确""最赤诚"就很容易成为阿谁被捐躯掉的变量。
所谓"信豆包,得长生"固然是句打趣波音体育官方网站,但在这个被算法编织的和煦乡里,比一个百依百随的臆造玩偶更值钱的,是一对能识破幻觉、肯回到施行里求证的眼睛。

备案号: