这个要求让他更容易接受文字转WAV音频