最终都选择了妥协文字转WAV音频