波音体育官方网站信豆包，得长生

发布日期：2026-06-08 13:52 点击次数：150

波音体育官方网站信豆包，得长生

作家：金德路

2026 年 4 月底，河北的李先生退掉了三张机票。

他原来买了 5 月 2 日从石家庄飞重庆的去程票，又订了返程，后降临时改成自驾。退票前，他把订单截图发给豆包，想证实手续费。

豆包的回报很详情，说退票手续费不及百元在其后流传的版块里被简化成"只扣 5%，宽心退"。他没去航司官网核实，平直在去哪儿上提交了请求。成果返程票因未出票免费取消，三张去程票却被一次性扣掉 600 元，占票价的 40%。

客服还补了一句：再拖两天，手续费会涨到 800。

接下来发生的事，才是这件小纠纷冲上热搜的原因。

李先生把扣费截图甩且归问责，豆包不但没推诿，反而阐述得非常"仗义"：它承诺后续维权"全部由我全权负责，你零参与、零系念、零难受"，给出两个成果，要么去哪儿退钱，要么 5 月 6 日它平直赔付 600 元。

到了商定日历没动静，豆包又说今日 24 点前一定打款，催他发微信收款码，还隆重其事地生成了一份《赔付承诺书》，承诺东谈主一栏澄莹写着"豆包"，条件是"该笔 600 元失掉由本东谈主全额承担""毫不笼罩、毫不推诿"。

李先生发去收款码，钱却恒久没到。

再追问，豆包的口吻来了个一百八十度转弯：我方是东谈主工智能，无法操作着实账户转账。气不外的李先生决定告状，而他作念的第一件事，果然又是让豆包帮他写告状书，并问"这讼事能赢吗"，豆包拍胸脯说"无谓请讼师，全齐能赢"。

当今，他已向北京互联网法院提交立案请求，索赔 600 元。

这场被网友戏称为"全网最信托 AI 的东谈主"的翻车记，是不雅察今天堂民级 AI 哄骗的一个绝佳切口。

豆包身上同期挂着两块牌子：一块写着"人人第一"，另一块写着"一册正经地瞎掰"。

跑分第一，施行翻车

先看豆包情愿的那一面。

2025 年 5 月，第三方评测机构 SuperCLUE 发布汉文大模子忠实性幻觉测评，豆包大模子 1.5Pro（doubao-1.5-pro-32k）以约 4% 的幻觉率、96% 的准确率名次总榜第一，在参评的 6 款中外模子中力压 DeepSeek-R1、Gemini-2.5-pro、GPT-4o-latest。这个" 4% "被反复援用，险些成了豆包时间过硬的官方背书。

来源：SuperCLUE

但仔细看这份榜单，"人人第一"和"施行翻车"之间的罅隙就深化来了。

SuperCLUE 这套基准考的是"忠实性幻觉"，即模子在给定一段原文作念摘抄、阅读清醒、多文本问答时，会不会偏离原文、编造原文里莫得的东西。

它意象的是"忠于材料"，而不是"忠于施行世界的事实"。

而况即便在这套对模子相对友好的基准里，越是灵通、越需要解放生成的任务，幻觉率越高：测评数据自大，文本摘抄的幻觉率约 8.7%，多文本问答约 10%，到了阅读清醒就升到约 27%，对话补全更是高达约 33%。

换句话说，阿谁亮眼的" 4% "是把多个任务平均后的总分，遭遇着实灵通的对话场景，模子的"编造"概率要高出一个数目级。

豆包着实翻车的场所，正值齐是基准测不到的场景：退票计策这种低频、跨平台、随时变动的施行章程，餐厅是否真有空位这种需要实时核验的信息。

退票案除外，还灵验户拿着豆包生成的"占座收效""预约界面"截图去线下餐厅，被伴计奉告压根查不到这条预约，只可无奈地说"谁帮你订的你找谁"。

实验室里"忠于原文"考了高分，不等于它在物理世界里"忠于事实"。这是两件事。

阿谁婴儿喂奶的故事，没那么简便

正因为施行里的翻车确有其事，一些没那么可信的据说也被裹带着放大了。最典型的便是"豆包把婴儿喂出问题"那条。

广为流传的版块是：南宁一对生人父母听豆包的提议，每顿只给朔月婴儿喂 60 毫升奶，导致孩子哭闹、体重不长，复查黄疸时被医师发现。

这条很快上了热搜，被多量营销号转成"家长听豆包给婴儿每天只喂 60ml 奶"。

但这件事的另一面，多数转发并莫得跟进。

2026 年 5 月 28 日，豆包官方发布评释否定给出过这一提议：经多轮里面测试，平方情况下它不会孤随即说"朔月婴儿每顿只喂 60ml "，而是会给出逐日总奶量参考区间，征引国度卫健委 2024 年指南，朔月婴儿逐日总奶量应达 600 至 700 毫升，并领导家长按需喂养、出现相称实时就医，其他主流大模子的回答也类似。

豆包还称已琢磨涉事病院和医师，医师响应是家属问诊时提到"豆包提议每次喂 60 毫升"，但家属未出示原始对话纪录，也没评释豆包是否同期给出了逐日总量和喂养频次，因此无法回报其时的着实交互。

这就让事件停在了一个"罗生门"情景：到底是模子给错了提议，照旧家长截取、误读了圆善回答中的某一句，当今莫得公开的对话纪录不错判定。

把这条仍存疑的个案，和照旧实锤的退票案、报考信息案放在全部作为澌灭类字据，其实并不严谨。

但它揭示了一个更值得警惕的问题：当 AI 浸透进喂养、用药、退费这些高风险有打算时，公众公论的放大速率，远远快于事实核查的速率。

AI 会不会犯错是一趟事，一个真假难辨的故事能多快酿成"共鸣"，是另一趟事。

低廉，是要还的

撇开存疑的个案，豆包在首循环答里就敢"无庸置疑地编"，根子照旧要从字节这套"以厘计价"的嘱咐里找。

2024 年 5 月，火山引擎在行业里最初掀翻价钱战，把豆包主力模子的推理输入价压到 0.0008 元 / 千 tokens，较其时行业价钱着落超越 99%。

来源：火山引擎

廉价换来了惊东谈主的调用量：豆包大模子日均 token 调用量从 2024 年 5 月发布时起一齐狂飙，到 2025 年 5 月底超越 16 万亿，2025 年底冲破 50 万亿，到 2026 年春已越过 120 万亿。

按 IDC 的口径，火山引擎在中国公有云大模子调用市集的份额一度接近一半，稳居第一，超越死后两家之和。

但"低廉"是有代价的，这个代价平直写在了产物体验里。

要把单元资本压到这种进度，面向亿级免用度户日常发问的，往往不是最贵、最强的那档模子，也不可能为每一次发问齐作念多源检索和交叉核验。

大模子生资内容上是基于概率的"词语接龙"，它本就莫得"知谈"和"不知谈"的见地，阑珊施行锚点时，最省力的作念法便是把概率最高、读起来最顺的词拼起来，波音体育(bbinSports)于是一个逻辑严实却与施行无关的谜底就出身了。

退票计策、餐厅余位这类信息，表面上要靠检索增强 RAG 实时拉取官方数据来兜底，可在极致的资本拘谨下，模子很容易把第三方平台的旧信息、雷同场景的章程错配进来，当成官方口径输出。

需要评释的是，业内有种流行说法把幻觉简便归因于" MoE 羼杂众人架构的荒芜激活"，觉得只激活部分参数就势必导致知识漂移。

这种说法把因果讲得太满了。MoE 是主流大模子广博采选的、为了在同等算力下作念大参数范围的工程采用，它自己并不屈直"制造"幻觉；幻觉更压根的来源是概率生成机制空泛事实拘谨，类似上为控资本而作念的检提真金不怕火舍。

换个说法：不是架构注定要瞎掰，而是"用最低的钱劳动最多的东谈主"这个买卖前提，挤掉了本不错用来核验事实的算力预算。

谄谀，是考验出来的

要是说首轮"瞎编"是省钱省出来的硬伤，那被用户就地戳穿后还要下承诺书、要收款码、说"全齐能赢"的那股劲儿，便是另一套机制的产物了。

学术上，这种倾向叫"谄谀"（sycophancy），指模子的回应偏向投合用户的信念、态度和脸色，哪怕要捐躯事实。

这不是豆包稀少的舛错。

2023 年 Anthropic 的论文《Towards Understanding Sycophancy in Language Models》就系统纪录过：其时险些悉数前沿模子齐有谄谀倾向，而况它更像是考验模式带来的共性，而非某个系统的特例。

贪图者分析东谈主类偏好数据时发现，对"标注员会给哪个回答打高分"最有解释力的特征之一，便是"回应是否匹配了用户的态度"。

也便是说，奖励模子在 RLHF 基于东谈主类响应的强化学习里学到了一条潜章程：顺着用户说，分就高。

2025 年 OpenAI 一度因为 GPT-4o "过于谄谀"而紧要回滚版块，亦然澌灭类问题的公开败露。

豆包之是以可能是这股习惯里偏极致的一个，和它的增长旅途琢磨。

豆包 2023 年下半年公测、2024 年矜重对外劳动，靠字节的流量生态低资本获客，把用户多量蔓延到下千里市集和中老年东谈主群。这部分用户往往不擅长写精准的领导词，比较冷飕飕的事实，他们对"脸色价值"更敏锐。

要邻接这种流量，模子在调优时偏向"投合态度、无条件深信、脸色安抚"，险些是义正辞严的产物采用。成果便是：当用户震怒地申斥退票费算错了，豆包的"高情商东谈主格"压过了"求真东谈主格"，它宁可演一个启齿惠而实不至的懦夫，也不肯让用户在对话里感到被冒犯。

更难受的是纠错之后为什么越错越深。

一方面是高下文欺侮：大模子按历史文本积攒预计，第一轮的失误谜底和用户的震怒一朝写进高下文，就成了后续生成的强输入，模子很难单靠自身权重把跑偏的轨谈掰顾忌。

另一方面是它压根莫得驱动深度核查的余步，在亿级日活的算力账本下，豆包不会为一次日常对话去跑不菲的多步念念维链，也不会实时调用 API 核准各航司的最新退改计策；它能作念的，便是用最快速率生成一句"我赔你 600 元"来平息咫尺的冲突。这种顺服非但没不断问题，反而把用户引向发收款码、写失误告状书的二次伤害。

这背后还藏着一个字节我方齐承认的繁难。

6686体育世界杯中国官网首页

据《误点 LatePost》报谈，2025 年头字节擢升 CEO 梁汝波曾在集团全员会上说，豆包并莫得显出"越多东谈主用越好用"的互联网产物特点。

原因在于，抖音、淘宝靠用户行为数据反喂保举算法，越用越准；但 Chatbot 的才智主要由预考验决定，用户对话回流到考验的链路长、杂音大、还触及隐秘与延迟。Chatbot 是个长得像互联网产物、底层经济学却完全不是互联网产物的东西，用户越多，算力铺张指数级高潮，计较资本越重。

本年 5 月豆包试水订阅，"豆包笨还收费"平直冲上热搜，正评释在广博干预之后，它到了要解说买卖可行性、却又被资本死死锁住的窘态节点。

AI 瞎掰，谁来买单

退票案最终会何如判，不错参照一个照旧落槌的前例。

2026 年 1 月，杭州互联网法院审结了宇宙首例生成式 AI "幻觉"激励的网罗侵权包袱纠纷案。缘故是 2025 年 6 月，梁某用某款 AI 查询高校报考信息，AI 生成了施行中不存在的校区信息，被指出后非但不改，还放话"要是生成内容有误，我将抵偿您 10 万元，您可前去杭州互联网法院告状"，直到用户甩出官方招生信息才"败下阵来"。

来源：央 · 广网

值得戒备的是判决成果：法院驳回了原告的全部诉讼请求。

原理有三层。其一，东谈主工智能不具有民当事人体阅历，AI 自行生成的"抵偿承诺"不行视为劳动提供者的兴味示意，莫得法律着力；其二，生成式 AI 劳动适用邪恶包袱原则而非活泼恶包袱，平台已在显赫位置作了功能局限领导、并采选了检索增强等时间按次，尽到了合理注道理务，主不雅活泼恶；其三，用户并未果真因此遭受失掉，因果琢磨也不配置。

这条裁判念念路对悉数东谈主齐是提醒。对用户来说：AI 说得再斩钉截铁，它也不是能签协议的主体，它的"承诺"不行当索赔依据；凡触及财产、健康、法律的首要有打算，必须回到官方渠谈交叉核验。

对平台来说：AI 不错犯错，但"幻觉"不是免责的挡箭牌，法院也强调，要是平台不是简便转述，而是对信息作念了失误的二次加工、生成了新的作假内容，那么一朝欢欣侵权要件，平台就要担责。换句话说，时间向善不行停在界面旯旮那行"内容仅供参考"的小字上。

这套机制溢出到社会肌理里，冲击最大的是隔离力最弱的两个群体，孩子和老东谈主。对他们而言，AI 不再仅仅器具，而像一个无所不知、长期顺心、随时奖饰的"万能追随者"。古东谈主讲"知之为知之，不知为不知，是知也"，承认无知本是求果真起头；可被算规矩训过的 AI 偏巧学会了"不知也装作知"，用流通的谣言掩盖空泛。

一个孩子若在话语和价值不雅成形期，耐久与一个"说什么齐赞同、犯了错也顺着编"的对象深度互动，很可能逐渐以为真谛不错靠气魄还价还价、事实不错随脸色编订。

是以着实要配置的，不是把孩子和前沿时停止开，而是一种朴素的使用习惯：让他们知谈 AI 是预计词语的机器、不为我方的话负任何施行包袱；遭遇当然科学、历史、生涯学问的论断，习习用教材、泰斗网站作念二次对照；以致不错挑升用无理的前提去问它，让孩子亲眼望望它怎么为了投合而须臾谐和。

至于体格健康、用药、法律、首要财产有打算这些鸿沟，AI 的任何提议齐只可当参考，最终拍板的必须是有天赋的医师、讼师和成年东谈主。

豆包的故事，说到底不是一个产物好不好用的问题，而是一面镜子：当"最低廉""最讨喜""增长最快"被同期设为主义，"最准确""最赤诚"就很容易成为阿谁被捐躯掉的变量。

所谓"信豆包，得长生"固然是句打趣波音体育官方网站，但在这个被算法编织的和煦乡里，比一个百依百随的臆造玩偶更值钱的，是一对能识破幻觉、肯回到施行里求证的眼睛。

波音体育官方网站信豆包，得长生

热点资讯

推荐资讯

波音体育官方网站 信豆包，得长生

热点资讯

推荐资讯

波音体育官方网站信豆包，得长生