Seeduplex 是字节跳动于 202

范樱真实

每天进步一点点。

关注

艺术+

Seeduplex 是字节跳动于 2026 年 4 月 9 日发布的原生全双工语音大模型，目前已全量上线豆包 App。它彻底改变了传统 AI 语音“你说完我再说”的对讲机模式，实现了“边听边说”的真人级交互。核心特性：为什么是“无缝对话”？ - 全双工架构：采用“听塔”与“说塔”并行工作，打破传统串行流程，支持边听边说、实时打断，端到端延迟压降至 210–320ms（接近真人反应速度）。 - 精准打断：基于语音+语义联合判断，词级打断准确率达 97.3%，你不再需要等 AI 把长段废话说完，插话即停。 - 动态判停与抗干扰：能区分“思考停顿”和“对话结束”，抢话比例下降 40%；在咖啡厅、车内等嘈杂环境下，误回复率降低约 50%。杭州生活实用场景举例你人在杭州，以下场景体验会非常明显： 1. 实时修正与打断（查攻略） - 旧模式：豆包正在念西湖游玩路线，你突然想改去灵隐寺，必须等它全部念完才能说“不对”，否则指令失效。 - Seeduplex：豆包刚说“我们可以从断桥出发…”，你直接插话“等一下，先去灵隐寺”。它立刻停止当前播报，无缝切换：“好的，那我们先调整路线去灵隐寺…” 2. 嘈杂环境抗干扰（通勤） - 场景：早高峰地铁 1 号线内，背景有报站声和人群嘈杂。 - 旧模式：AI 容易把报站声“下一站龙翔桥”误听成指令，或者因噪音无法识别。 - Seeduplex：精准抓取你的主声线，忽略背景噪音。你问“今天杭州天气如何”，即便环境吵闹，它也能稳定回答“杭州今天多云转晴，适合出行”，且不会误触发。 3. 思考不抢话（练口语/面试） - 场景：你在准备外企面试或英语口语练习。 - 旧模式：你组织语言时稍有停顿（“I think my strength is… um…”），AI 立刻抢话接茬，打断思路。 - Seeduplex：识别出“um”是思考语气而非结束信号，会安静等待 2-3 秒，直到你完整表达完再回应，像真人教练一样有分寸感。如何使用与避坑 - 入口：豆包 App 更新至最新版 → 对话页点击右上角 “打电话” 图标（目前全量免费）。 - 注意：全双工能力目前主要优化在 “桃子”音色，其他音色可能仍为半双工模式。在极嘈杂环境（如工地）若出现误打断，可临时切回半双工模式。 Seeduplex 标志着 AI 语音从“工具”向“对话伙伴”的转变，你可以在豆包上直接体验这种“打电话”般的自然感。 AI生成，（工具：夸克，腾讯元宝）配图是AI生成的，（工具：混元）

勤丰小区

2026-04-10 12:59浙江杭州

打开潮新闻参与讨论