显然那个做作就是对她说的文字转WAV音频