主要是嘴巴里的牙齿文字转WAV音频