他明显可以判断文字转WAV音频