每一个成员都必须要听从文字转WAV音频