然后就是先互相喊话文字转WAV音频