其他的人则是完全围绕在他们三个人中间文字转WAV音频