虽然隔着人群文字转WAV音频