Tag-机器学习

Icontofig 's Blog // 我们的征程是星辰大海!Away From OI,Come to ICPC(查看友链请点About Me)

 2021-01-15 01:08:37 |  0 Comments  |  机器学习

Stanford CS231n ,学习笔记一:图像分类(数据驱动方法、K近邻分类器kNN)

图像在计算机中的存储形式和分类需要注意的问题

    图像在计算机中一般是一个3维的0~255的矩阵序列(分别存储R\G\B三原色信道的值)。
    在图像分类中需要注意的问题有:
* 视角、视点问题
* 照明度(曝光度、阻光度)问题
* 形态问题(变形、尺寸大小)
* 背景混淆
* 类内多样性

数据驱动方法

    我们无法像排序一样设计一个具体的算法来解决这种问题。所以我们需要像教儿童一样,给出一定数量的照片,并标签上属于哪一类,以此来设计一种机器学习的方法,来学习每一类照片的综合视觉表征(特征)。 这样的一种方法就称为数据驱动方法。数据驱动方法依赖于首先给出的数据以及其分类标签。

图像分类的步骤

    图像分类的任务就是获取一个像素序列(代表一个单个的图像),并依据我们的学习结果给图像一个标签。完整的步骤可以格式化如下:
* 输入:输入N个图片以及其标签作为训练集
* 训练/学习:使用训练集来学习/训练每一类的图像特征。这一步骤也称为训练模型。
* 评估:我们使用一个训练模型从未见过的数据集作为测试集进行分类预测,得到预测结果,并和真正的分类结果进行比较,用准确率来进行模型优劣的评估。

最近邻分类器

    最近邻分类器在实际中并不常用,目前只介绍其原理。
    最近邻分类器训练模型时,单纯的将图像的R\G\B信道的像素值进行简单的记录。在进行预测图片分类时,找出图片在像素值上的最近邻,将最近邻的分类标签作为其分类标签。
    最近邻分类器使用的近邻距离分为L1和L2两种,公式分别如下:

L1p|I1pI2p|

L2p(I1pI2p)2
Title - Artist
0:00