或者是人形生物文字转WAV音频