他们按照自己的构想文字转WAV音频