总之就是为了保证未来技术不落后文字转WAV音频