前提是他得有文字转WAV音频