推断出我和教授都在这个空间内文字转WAV音频