这时候他就在控制情绪文字转WAV音频