只是用余光打量文字转WAV音频