所以我们应该分开文字转WAV音频