然后控制入口的局势文字转WAV音频