基本上都是在山脉的附近文字转WAV音频