主要是脸上面的伤情文字转WAV音频