快捷搜索:  汽车  科技

怎样用matlab实现主成分分析,主成分分析PCA算法介绍及matlab实现案例

怎样用matlab实现主成分分析,主成分分析PCA算法介绍及matlab实现案例2)求取协方差矩阵1)将每一列特征进行均值化处理,特征归一化,也称为数据中心平移到坐标原点因此,PCA的问题就变为:寻找一个坐标轴,使得数据在该坐标轴上面离散度最高。也就是寻找一个基使得所有数据在这个基上面的投影值的方差最大。那具体怎么做呢?科学家们已经帮我们做好了,如下步骤:设有m个样本,每个样本有n个特征,组成m行n列的矩阵

主成分分析经常被用做模型分类时特征的降维,本篇首先介绍PCA的步骤,并根据步骤撰写对应的matlab代码,最后指明使用PCA的步骤。

我们在做分类时,希望提取的特征能够最大化将数据分开,如果数据很紧密,模型就比较难将其分开,如果数据比较离散,那么就比较容易分开,换句话说,数据越离散,越容易分开。

那怎么让数据离散呢?离散又用什么指标衡量呢?

统计学的知识告诉我们,数据越离散,方差越大。

因此,PCA的问题就变为:寻找一个坐标轴,使得数据在该坐标轴上面离散度最高。也就是寻找一个基使得所有数据在这个基上面的投影值的方差最大。

那具体怎么做呢?科学家们已经帮我们做好了,如下步骤:

设有m个样本,每个样本有n个特征,组成m行n列的矩阵

1)将每一列特征进行均值化处理,特征归一化,也称为数据中心平移到坐标原点

2)求取协方差矩阵

3)求取协方差矩阵的特征值和特征向量

4)将特征向量按对应特征值大小从上到下按行排列成矩阵,取前K列组成系数矩阵

matlab代码

怎样用matlab实现主成分分析,主成分分析PCA算法介绍及matlab实现案例(1)

我们在实际应用PCA的时候需要注意保留以下几个值。

1、每个特征的均值meanValue,用于验证集和测试集的归一化

2、系数矩阵coffMatrix,用于求取转换后的训练数据,和转换后的验证数据,测试数据

3、各分量的得分scores,用以确定最终的所需要的维度。

下面借鉴matlab帮助中心的例子实现撰写以下代码:

怎样用matlab实现主成分分析,主成分分析PCA算法介绍及matlab实现案例(2)

matlab中也有自带的pca函数

[coeff score latent tsquared explained mu] = pca(x varargin);

详细的参数说明可以通过在命令行输入 doc pca查看

也可以通过matlab的帮助中心查看:https://ww2.mathworks.cn/help/stats/pca.html?requestedDomain=cn

帮助中心中有丰富的例子可以帮助理解。

猜您喜欢: