虽然他只是依靠着肉眼文字转WAV音频