他们知道两人该讲的话已经讲了文字转WAV音频