自然是选择性的忽略掉了文字转WAV音频