并且逐层封门文字转WAV音频