主要负责得分文字转WAV音频