他更相信后者文字转WAV音频