所以他只能自己动手文字转WAV音频