只是说出来了其中的一些推测文字转WAV音频