两者皆重取其轻文字转WAV音频