所以在她开口之后文字转WAV音频