每一组负责一个区域文字转WAV音频