然后再固化文字转WAV音频