而这都要靠他们组织文字转WAV音频