就是通过某个角度来观察文字转WAV音频