两个人直接的就能够让他们明白文字转WAV音频