进行现场的拍照之后文字转WAV音频