根本就没有考虑清楚困难文字转WAV音频