然后用抹布处理中下层的空间文字转WAV音频