事实上他自认文字转WAV音频