这个就是彼此之间相互配合文字转WAV音频