就好像舞蹈之前的预备文字转WAV音频