他本来就认为按照正常的发展文字转WAV音频