这补充不过是为了让她确定这个认知文字转WAV音频