关注
艺术+
Seeduplex 是字节跳动于 2026 年 4 月 9 日发布的原生全双工语音大模型,目前已全量上线豆包 App。它彻底改变了传统 AI 语音“你说完我再说”的对讲机模式,实现了“边听边说”的真人级交互。 核心特性:为什么是“无缝对话”? - 全双工架构:采用“听塔”与“说塔”并行工作,打破传统串行流程,支持边听边说、实时打断,端到端延迟压降至 210–320ms(接近真人反应速度)。 - 精准打断:基于语音+语义联合判断,词级打断准确率达 97.3%,你不再需要等 AI 把长段废话说完,插话即停。 - 动态判停与抗干扰:能区分“思考停顿”和“对话结束”,抢话比例下降 40%;在咖啡厅、车内等嘈杂环境下,误回复率降低约 50%。 杭州生活实用场景举例 你人在杭州,以下场景体验会非常明显: 1. 实时修正与打断(查攻略) - 旧模式:豆包正在念西湖游玩路线,你突然想改去灵隐寺,必须等它全部念完才能说“不对”,否则指令失效。 - Seeduplex:豆包刚说“我们可以从断桥出发…”,你直接插话“等一下,先去灵隐寺”。它立刻停止当前播报,无缝切换:“好的,那我们先调整路线去灵隐寺…” 2. 嘈杂环境抗干扰(通勤) - 场景:早高峰地铁 1 号线内,背景有报站声和人群嘈杂。 - 旧模式:AI 容易把报站声“下一站龙翔桥”误听成指令,或者因噪音无法识别。 - Seeduplex:精准抓取你的主声线,忽略背景噪音。你问“今天杭州天气如何”,即便环境吵闹,它也能稳定回答“杭州今天多云转晴,适合出行”,且不会误触发。 3. 思考不抢话(练口语/面试) - 场景:你在准备外企面试或英语口语练习。 - 旧模式:你组织语言时稍有停顿(“I think my strength is… um…”),AI 立刻抢话接茬,打断思路。 - Seeduplex:识别出“um”是思考语气而非结束信号,会安静等待 2-3 秒,直到你完整表达完再回应,像真人教练一样有分寸感。 如何使用与避坑 - 入口:豆包 App 更新至最新版 → 对话页点击右上角 “打电话” 图标(目前全量免费)。 - 注意:全双工能力目前主要优化在 “桃子”音色,其他音色可能仍为半双工模式。在极嘈杂环境(如工地)若出现误打断,可临时切回半双工模式。 Seeduplex 标志着 AI 语音从“工具”向“对话伙伴”的转变,你可以在豆包上直接体验这种“打电话”般的自然感。 AI生成,(工具:夸克,腾讯元宝)配图是AI生成的,(工具:混元)
勤丰小区
2026-04-10 12:59浙江杭州
打开潮新闻参与讨论
1