可以解释为保存实力文字转WAV音频