也只能是内部知晓文字转WAV音频