或者说边界文字转WAV音频