四和六则是比较理想的情况文字转WAV音频