最后两人的观点几乎一致文字转WAV音频