而并非是听闻文字转WAV音频