那就需要两个人一起交付文字转WAV音频