看似是在争取话语权文字转WAV音频