也要有相等的修士来驱动文字转WAV音频