离散趋势的计算(离散趋势的应用)
离散趋势的计算(离散趋势的应用)方差与标准差表示数据集波动的大小,方差小,表示数据集比较集中,波动性小,方差大,表示数据集比较分散,波动性大。这两个指标能较好地反映出数据的离散程度,是应用最广泛的离散程度的测度值,实际应用中更多使用标准差。方差的原理:离散趋势在统计学中是指一组数据在某一中心值分散的程度,它反映了各个数据远离其中心点的程度,并且从另一个方面说明了集中趋势测度值的代表程度。描述数据离散程度采用的测度值,根据所依据数据类型的不同主要有极差、分位距、方差、标准差和离散系数。极差的原理:极差为一组数据的最大值与最小值之差,也称全距R。容易受极端值的影响。
内容导入:
大家好,这里是每天分析一点点。本期给大家介绍的是数据分析基础系列离散趋势的基本原理与应用,包括极差、方差与离散系数的原理与计算,再结合股票案例分析,讨论收益的稳定性,根据离散趋势指标计算结果解释原因。文章内容适合数据分析小白,内容深入浅出,案例贴合实际。下期给大家介绍描述性统计分析的应用,欢迎大家关注。
概念介绍:
离散趋势的概念:
离散趋势在统计学中是指一组数据在某一中心值分散的程度,它反映了各个数据远离其中心点的程度,并且从另一个方面说明了集中趋势测度值的代表程度。描述数据离散程度采用的测度值,根据所依据数据类型的不同主要有极差、分位距、方差、标准差和离散系数。
极差的原理:
极差为一组数据的最大值与最小值之差,也称全距R。容易受极端值的影响。
方差的原理:
方差与标准差表示数据集波动的大小,方差小,表示数据集比较集中,波动性小,方差大,表示数据集比较分散,波动性大。这两个指标能较好地反映出数据的离散程度,是应用最广泛的离散程度的测度值,实际应用中更多使用标准差。
离散系数的原理:
离散系数也称为变异系数,是一组数据的标准差与其相应的平均数之比。是测度数据离散程度的统计量,主要用于比较不同样本数据的离散程度,离散系数大,说明数据的离散程度大;离散系数小,说明数据的离散程度小。
特别提示:
1、极差描述了数据的范围,但无法描述其分布状态。且对异常值敏感。
2、标准差只能用于统一体系内的数据比较。
3、离散系数是统一的数据波动性比较参数。
计算与应用方式:
极差的计算与应用:
极差为一组数据的最大值与最小值之差。
计算公式:
极差
计算实例:假设一支股票8天的收益为10 11 12 13 14 15 16 17,现在计算这支股票的极差最大值是17,最小值是10。因此,极差=最大值-最小值=17-10=7。
极差对于数据的波动程度衡量不够准确,股票收入变成1 10 11 12 13 14 15 16 17 101。当数据出现异常的离群值,极差准确性就受到影响。此时,极差=最大值-最小值=101-10=100;但是,正常区间的数据波动性没这么大。还记得第一期去除异常值的箱体图吗,当去除异常值1和101时,极差变成17-10=7,又回到了正常水平。
方差的计算与应用:
方差是各变量值与其平均数离差平方的平均数。
方差
方差的平方根称为标准差。
标准差
计算实例:用方差与标准差计算下列股票的波动性,17 11 15 13 13 13 13 14 12 12,12,12 10 16,
import numpy as np
data=np.array([17 11 15 13 14 12 10 16])
var=np.var(data);print(var)
std=np.std(data);print(std)
#方差为5.25
#标准差为2.29129
离散系数的计算与应用:
1、离散系数的计算
是一组数据的标准差与其相应的平均数之比。
离散系数
计算实例:一个班的年龄如下:17 11 15 13 14 12 10 16,先计算平均数,再计算标准差,最终得到离散系数。
import numpy as np
data=np.array([17 11 15 13 14 12 10 16])
mean=np.var(data)
std=np.std(data)
Vs=std/mean
print(Vs)
#该数据离散系数为0.436436
为什么要有离散系数呢?是为了不同样本的波动性可比较。因为如果样本的平均值是相同的,那么我们比较方差或者标准差就能知道数据的稳定性。如果数据的平均值不同,无法通过上述比较得出结果,就需要应用离散系数。离散系数最通常的应用,对于股票的风险测量,股票的风险系数就是离散系数。
综合应用场景:
甲乙两个运动员都是中等水平,各连续打靶8次,请问哪个运动员发挥稳定?
甲乙连续打8次靶,按先后顺序记录如下:
甲运动员:[8 7 8 9 9 8 7 8]。
乙运动员:[5 6 6 7 7 10 10 10]。
通过计算,得出的离散趋势结果如下表所示:
如果计算的结果中有离散系数,我们可以直接使用离散系数进行比较,就不用看方差与标准差。通过方差、标准差、离散系数的比较,发现甲的离散趋势指标均比乙的指标小,因此,甲发挥的更加稳定。
大家对本文感兴趣的话,我们为大家准备了离散趋势的相关python代码案例,作为小礼物送给大家,更多内容,请关注海数据公众号。
本期分享到这里,我们会在每周持续更新,咱们下期再见,期待您的光临。
有什么建议,比如想了解的知识、内容中的问题、想要的资料、下次分享的内容、学习遇到的问题等,请在下方留言。如果喜欢请关注。
海数据微信小程序
海数据微信二维码