如何才能尽快学会数据分析(必须掌握的15个统计学公式)
如何才能尽快学会数据分析(必须掌握的15个统计学公式)(1) 简单几何平均法几何平均数多用于计算平均比率和平均速度。(1)简单平均式(2)加权平均式几何平均数
算数平均数
通过算术平均数,可以求出一定观察期内预测目标的时间数列的算术平均数,以作为下期预测值。
调和平均数
调和平均数又称倒数平均数,是变量倒数的算术平均数的倒数。
(1)简单平均式
(2)加权平均式
几何平均数
几何平均数多用于计算平均比率和平均速度。
(1) 简单几何平均法
(2) 加权几何平均法
众数
众数是指社会经济现象中最普遍出现的标志值。从分布角度看,众数是具有明显集中趋势的数值。
L——众数所在组下限;
U——众数所在组上限;
▲1——众数所在组次数与其下限的邻组次数之差;
▲2——众数所在组次数与其上限的邻组次数之差;
d——众数所在组组距。
中位数
中位数是指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。 在数列中出现了极端变量值的情况下,用中位数作为代表值要比用算术平均数更好,因为中位数不受极端变量值的影响。
极差
极差是指总体各单位的两个极端标志值之差。
R=最大标志值-最小标志值
四分位差
四分位差是指将各个变量值按大小顺序排列,然后将此数列分成四等份,所得第三个四分位上的值与第一个四分位上的值的差。主要用于测度顺序数据的离散程度。
Q = Q3 − Q1
其中:Q1的位置=(n 1)/4
Q3的位置=3(n 1)/4
方差/标准差
方差和标准差也是根据全部数据计算的,它反映了每个数据与其均值相比平均相差的数值,因此它能准确地反映出数据的离散程度。
设总体方差为σ2,对于未经分组整理的原始数据,方差的计算公式为:
对于分组数据,方差的计算公式为:
方差的平方根即为标准差,其相应的计算公式为:
(1) 未分组数据
(2) 分组数据
平均差
平均差是总体各单位标志对其算术平均数的离差绝对值的算术平均数。它综合反映了总体各单位标志值的变动程度。平均差越大,则表示标志变动度越大,反之则表示标志变动度越小。在资料未分组的情况下,平均差的计算公式为:
变异系数
变异系数又称“标准差率”,是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。
偏度
偏度是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。
Sk——偏度;
μ3——3阶中心矩;
σ——标准差。
在一般情形下,当统计数据为右偏分布时,Sk > 0,且Sk值越大,右偏程度越高;当统计数据为左偏分布时,Sk < 0,且Sk值越小,左偏程度越高。当统计数据为对称分布时,显然有Sk = 0。
峰度
峰度是指次数分布曲线顶峰的尖平程度,是次数分布的又一重要特征。统计上,常以正态分布曲线为标准,来观察比较某一次数分布曲线的顶端正党风尖顶或平顶以及尖平程度的大小。
综合指数
综合指数的目的在于测定由不同度量单位的许多商品或产品所组成的复杂现象总体数量方面的总动态。综合指数包括数量指标指数和质量指标指数。
数量指标指数
(1)数量指标指数
A. 以基期价格(P0)为同度量因素的销售量总指数
也称作拉斯贝尔数量指数公式
B. 以报告期价格(P1)为同度量因素的销售量总指数
也称作派许数量指数公式。
C. 以特定期价格(Pn)为同度量因素的销售量总指数
此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度
此差额说明由于数量指标的变动对价值量指标影响的绝对额。
(2) 质量指标指数
A. 以基期销售量(q0)为同度量因素的物价总指数
也称作 拉斯贝尔物价指数公式
B. 以报告期销售量(q1)为同度量因素的物价总指数
也称作 派许物价指数公式
C. 以特定期销售量(qn)为同度量因素的物价总指数
此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。
此差额说明由于质量指标的变动对价值量指标影响的绝对额。
加权平均数指数
加权的目的,是为了衡量不同商品价格(或物量)的变动对总指数造成的不同影响。加权平均数指数因权数所属时期的不同,分为基期总量加权指数和报告期总量加权指数以及固定权数加权指数。
(1)基期权数的算术平均数指数。
式中,p、q分别表示商品的价格和销售量;0、1分别表示基期和报告期;I表示总指数。
(2)固定权数的算术平均数指数。
上式中,W代表某一固定时期的权数。
加权调和平均数指数
加权调和平均数指数按采用权数形式的不同也可以分为两种:报告期权数的调和平均数指数和固定权数的调和平均数指数。
(1)报告期权数的调和平均数指数
(2)固定权数的调和平均数指数。这种加权调和平均数指数在实际工作中应用较少。
看到这里的同学,是不是很懵逼?放心好了,只要学统计学,这些公式都是绕不开的。