语音合成:从离散声学编码到自回归建模1 小时前TTS 语音合成 CodecSummary语音合成(TTS),即文本到语音,旨在从给定文本条件下生成可被理解的人类语音信号,是语音、语言和机器学习界的热门研究课题,在业界有着广泛的应用。随着深度学习和人工智能的发展,近年来基于神经网络的 TTS 显著提高了合成语音的质量。本文回顾了语音合成领域的发展,并从离散声学编码与词元预测的角度出发综述了语音的自回归建模方法。