是被允许靠近观察的文字转WAV音频