Discord 语音活动检测 VAD 2.0 波形分析新闻配图

语音活动检测 2.0 实测:键盘声还会误触吗?

Discord 2026.2 稳定版悄然升级了语音活动检测(Voice Activity Detection,VAD)模型。官方 changelog 只写了「improved voice detection」,社区里却有两派声音:有人说青轴终于不误触了,有人说轻声说话反而被吞。我们在三种硬件环境下做了对比测试,用数据代替体感。

测试方法

结果一:机械键盘误触显著下降

Discord 语音频道输入灵敏度与 VAD 状态指示灯示意

青轴全速打字(约 85 字/分钟)时,旧版 30 分钟误触 47 次,新版降至 11 次,降幅 77%。风扇环境误触从 23 次降至 6 次。看来新模型对瞬态高频冲击(键帽撞击)与稳态低频噪声(风扇)做了更好的频谱区分。

但仍有 corner case:金属桌面的鼠标点击、薯片包装袋,新版仍会误触——建议开黑房默认按键发言(PTT),闲聊房才用语音活动。

结果二:轻声说话的漏触问题

在安静书房,以正常对话音量(约 58 dB SPL)测试,新旧版漏触率接近(<2%)。但当降到「深夜耳语」音量(约 48 dB)时,新版漏触从 8% 升到 15%。

原因推测:为压制键盘误触,新版提高了触发门限。若你习惯小声说话,建议:

推荐设置(可直接照抄)

居家安静环境

模式:语音活动 · 灵敏度:默认(-50 dB 左右)· 开启噪声抑制 + 回声消除

机械键盘 + 开黑

模式:按键发言 · 绑定:鼠标侧键或 V · 灵敏度:不重要

笔记本阵列麦

模式:语音活动 · 灵敏度:降低 8% · 关闭 Krisp(与部分阵列麦冲突)

语音活动 vs 按键发言:什么时候用哪个?

语音活动适合:人数 ≤ 6 的闲聊、远程自习互相监督、不方便腾出手按键的场景。

PTT 适合:FPS/MOBA 排位、键盘声大的环境、需要严格控麦的raid指挥。

Discord 允许按服务器单独记忆模式——A 服开黑用 PTT,B 服闲聊用 VA,切换服务器自动切换,很多人不知道这个细节:在对应语音频道内设置一次即可。

与降噪插件的兼容

测试发现 RTX Voice / NVIDIA Broadcast 与 Discord 内置 Krisp 同时开启时,偶发「说话前 0.3 秒被吞」——双重降噪把辅音当噪声切了。建议只开一层:有独显用 NVIDIA Broadcast,无独显用 Discord 内置 Krisp。

体验最新 VAD 需要更新客户端,前往 Discord下载 获取 2026 稳定版。更多语音设置见 Discord 中文指南 第五章。