还是自认为必须解释清楚文字转WAV音频