就是告知面前的两个人文字转WAV音频