你必须预估最高值文字转WAV音频