而不需要他做出应答文字转WAV音频