每次采集都需要调集三十多个强壮年保护文字转WAV音频