就是一部在平均值上下的影片文字转WAV音频