所以必须针对每个部分进行调查文字转WAV音频