然后以这些召唤兽为基础文字转WAV音频