最重要的是另外三个身份文字转WAV音频