一般为半透明色文字转WAV音频