同时还关注着周围文字转WAV音频