然后才搜集的气息文字转WAV音频