那就根据他们的能力文字转WAV音频