这是一个非常令人困惑的话题,因为分类和分级两个词经常被混用。
分类和分级都是元数据,用于数据治理。
分类是基于数据集中实体的属性和特征,而分级是基于业务需求的。
根据图像,数据已分类为护照、健康记录、财务记录、工作发布等,同时这些类别被分级为中风险。
这两个术语都属于数据科学领域中的监督学习。
例如,有祖父母、父母、孩子、表兄弟姐妹、仆人、园丁、机械师、汽车油漆工等,所有这些都属于分类,但还可以进一步分级,即家庭成员和非家庭成员。
分类:
Ø祖父母
Ø父母
Ø孩子
Ø表兄弟姐妹
Ø仆人
Ø园丁
Ø机械师
Ø汽车油漆工
分级:
Ø 家庭成员(祖父母、父母、孩子、表兄弟姐妹)
Ø非家庭成员(仆人、园丁、机械师、汽车油漆工)