通过其他综合方面的信息来判断文字转WAV音频