一个是需求性文字转WAV音频