那么他就选择单干文字转WAV音频