看到两边的景物后文字转WAV音频