他们只知道执行文字转WAV音频