其存在所依靠的根据文字转WAV音频