二不考虑空间文字转WAV音频