他最起码能预先知情文字转WAV音频