还是人员传递文字转WAV音频