这样的话只能是趋于两种情况文字转WAV音频