大部分都是他出的文字转WAV音频