他原本认定文字转WAV音频