并且还带着外人文字转WAV音频