就是一个初步的检查文字转WAV音频