最大的劣势就是需要吟唱文字转WAV音频