分类

想象一下,一个系统想要检测一篮子水果中的苹果橘子。系统可以采摘水果,提取它的一些属性(例如该水果的重量)。

假设系统有老师! 它教导系统哪些对象是苹果,哪些是橙子。这是监督分类问题的一个例子。它受到监督,因为我们已经标注了示例。它是分类,因为输出是我们对象所属的类的预测。

在这个例子中,我们考虑 3 个特征(属性/解释变量):

  1. 所选果实的重量大于 .5 克
  2. 尺寸大于 10 厘米
  3. 是颜色是红色

(0 表示否,1 表示是)

因此,为了表示一个苹果/橙色,我们有一系列(称为矢量)3 个属性(通常称为特征向量)

(例如[0,0,1]表示这个水果重量不大于 .5 克,它的大小不大于 10 厘米,它的颜色是红色)

因此,我们随机挑选 10 个水果并测量它们的特性。然后教师(人)手动将每个水果标记为 apple => [1] 或 orange => [2]

例如)老师选择一种苹果水果。这个苹果系统的表示可能是这样的: [ 1,1,1 ] => [1] ,这意味着,这个水果的重量大于 .5 克大于 10 厘米的大小3 大。这种水果的颜色是红色,最后它是一个苹果 (=> [1])

因此,对于所有 10 种水果,老师将每种水果标记为苹果[=> 1]或橙色[=> 2],系统找到了它们的属性。你猜我们有一系列的矢量(称之为矩阵)代表整个 10 个水果。