统计机器学习04:感知机
感知机模型的基本概念
定义
感知机模型是一种二分类的线性分类模型,输入k维线性空间中的向量,输出一个实例的类别(正反类别分别用+1和-1来表示),可以将这个分类过程用一个函数来表示:
基于超平面的理解
可以把样本集里面的N个k维的向量看成是k维线性空间中的点,感知机的目标就是找到一个划分这个点集的超平面S,使得平面S的两侧分别是两种类型的点,后面的测试集的分类就基于测试集中数据所对应的点和超平面的位置关系来划分,在正例的一侧
基于神经元的理解
其实感知机可以看成是一种非常简单的二层神经网络,输入层的内容是k维向量的k个特征,输出层的结果就是向量的分类情况(分为+1和-1)两种,而输出层的神经元存在一个阈值
感知机模型的求解
损失函数
感知机的训练集必须要求是线性可分的,而感知机的的性能评估要考虑被误分类的点的情况,为了选择一个关于参数
基于随机梯度下降法的求解
对损失函数求梯度可以得到:
因此可以在学习的过程中,先确定一组参数的初值,并选择好学习率
在训练集中选取一组数据
如果这组数据是误分类的,也就是说
,那么就要: 回到第二步继续循环,直到训练集中没有误分类的点,结束模型的训练