因为每个人身上的服饰文字转WAV音频