因为角色需要文字转WAV音频