是诸多位面聚集的焦点文字转WAV音频