难道他通过考核文字转WAV音频