而且拿到了话语权文字转WAV音频