在得到后者首肯之后文字转WAV音频