但是考虑到他们七千多万人口文字转WAV音频