那是因为这并不是他本身学会的文字转WAV音频