很可能人家直接就放弃了文字转WAV音频