还表现为每个人对不同词语项有着不同的偏好文字转WAV音频