也就是说明暗两处文字转WAV音频