幸好他们多采集了一些文字转WAV音频