吸掉了大部分的本源文字转WAV音频