就是要互相克制文字转WAV音频