整个过程当中都没有离眼文字转WAV音频