其实就是以扫盲为主文字转WAV音频