他显然是已经提前一步文字转WAV音频