感知机 | ahscuml

感知机

ahscuml 8月 08, 2018

二分类的线性分类模型，输入为实例的特征向量，输出为实例的类别，取+1和-1二值。感知机对应于输入空间中将实例划分为正负两类的分离超平面，属于判别模型。
感知机的学习旨在最小化分类误差，所以引入基于误分类的误差函数，通过梯度下降法最小化误差函数求得感知机。

感知机算法学习思路：

自己通过学习《统计学习方法》，对感知机有一些浅薄的理解，整理出了以下几个问题。通过回答以下问题可以了解感知机的具体思路。

输入空间到输出空间函数($w$ 是超平面的法向量，$b$是法向量的截距)：
$$ f(x) = sign(w * x + b)$$

习得感知机模型的思路：

最容易想到损失函数就是误分类点的个数，但是这样的函数不是参数$w$与$b$的连续可导函数，不方便优化。
感知机采用的损失函数是误分类点到超平面的总距离(是参数$w$、$b$ 的可导函数)

+ 为什么是这个定义？？？

+ ！！！为啥不考虑 $\frac{1}{\| w\|}$

定理2.1(Novikoff):
前提是数据集是线性可分数据集。
- 定理表明，误分类的次数$k$是有上界的，经过有限次搜索可以找到将训练数据完全正确分开的分离超平面。
- 当训练数据集线性可分时，感知机学习算法原始形式迭代是收敛的。
- 感知机学习算法存在许多解，这些解既依赖于处置的选择，也依赖于迭代过程中误分类点的选择顺序。