但他却能够通过感知这些文字转WAV音频