也就是断断续续的把字全都认识了文字转WAV音频