要求它们倾向于简洁文字转WAV音频