而正对着镜头的是于思可文字转WAV音频