若是从整体利益最大化考虑文字转WAV音频