从而忽略掉山文字转WAV音频