我们至少检查了三遍文字转WAV音频