他首先投入进去的文字转WAV音频