最多只能算有功能的模型文字转WAV音频