所以还是要把主要的文字转WAV音频