那么接下来要做的就是调集各方人马文字转WAV音频