两个人先后完成着装之后文字转WAV音频