因为他真的知道很多种文字转WAV音频