所以要求是一口喝下文字转WAV音频