语音活动检测(Voice Activity Detection,VAD),就是检测是否有声音,常规的算法是通过声音音量和频谱特征来判断是否有声音的,但是无法区分是噪音还是人声。

VAD技术主要用于语音编码和语音识别。

  • 它可以简化语音处理。
  • 也可用于在音频会话期间去除非语音片段
  • 可以在IP电话应用中避免对静音数据包的编码和传输,节省计算时间和带宽。

webrtc中封装了声音检测算法,但是由于webrtc体量太过庞大,为了一个算法链接这么大个项目不太值得,因此将webrtc中的算法拆出为单独的库

https://github.com/helianchichi/libwvad

支持8000, 16000, 32000, 48000采样率,支持10, 20, 30 ms时长帧