然后对着周边的人群打量了一下文字转WAV音频