可如果是人员传递……那岂不是说文字转WAV音频