但面部表情却能够控制住文字转WAV音频