现在只是相当于文字转WAV音频