而是希望我们能控制文字转WAV音频