从肖恩的描述来看文字转WAV音频