快捷搜索:  汽车  科技

离散趋势的计算(离散趋势的应用)

离散趋势的计算(离散趋势的应用)方差与标准差表示数据集波动的大小,方差小,表示数据集比较集中,波动性小,方差大,表示数据集比较分散,波动性大。这两个指标能较好地反映出数据的离散程度,是应用最广泛的离散程度的测度值,实际应用中更多使用标准差。方差的原理:离散趋势在统计学中是指一组数据在某一中心值分散的程度,它反映了各个数据远离其中心点的程度,并且从另一个方面说明了集中趋势测度值的代表程度。描述数据离散程度采用的测度值,根据所依据数据类型的不同主要有极差、分位距、方差、标准差和离散系数。极差的原理:极差为一组数据的最大值与最小值之差,也称全距R。容易受极端值的影响。

内容导入:

大家好,这里是每天分析一点点。本期给大家介绍的是数据分析基础系列离散趋势的基本原理与应用,包括极差、方差与离散系数的原理与计算,再结合股票案例分析,讨论收益的稳定性,根据离散趋势指标计算结果解释原因。文章内容适合数据分析小白,内容深入浅出,案例贴合实际。下期给大家介绍描述性统计分析的应用,欢迎大家关注。

概念介绍:

离散趋势的概念:

离散趋势在统计学中是指一组数据在某一中心值分散的程度,它反映了各个数据远离其中心点的程度,并且从另一个方面说明了集中趋势测度值的代表程度。描述数据离散程度采用的测度值,根据所依据数据类型的不同主要有极差、分位距、方差、标准差和离散系数。

极差的原理:

极差为一组数据的最大值与最小值之差,也称全距R。容易受极端值的影响。

方差的原理:

方差与标准差表示数据集波动的大小,方差小,表示数据集比较集中,波动性小,方差大,表示数据集比较分散,波动性大。这两个指标能较好地反映出数据的离散程度,是应用最广泛的离散程度的测度值,实际应用中更多使用标准差。

离散系数的原理:

离散系数也称为变异系数,是一组数据的标准差与其相应的平均数之比。是测度数据离散程度的统计量,主要用于比较不同样本数据的离散程度,离散系数大,说明数据的离散程度大;离散系数小,说明数据的离散程度小。

特别提示:

1、极差描述了数据的范围,但无法描述其分布状态。且对异常值敏感。

2、标准差只能用于统一体系内的数据比较。

3、离散系数是统一的数据波动性比较参数。

计算与应用方式:

极差的计算与应用:

极差为一组数据的最大值与最小值之差。

计算公式:

离散趋势的计算(离散趋势的应用)(1)

极差

计算实例:假设一支股票8天的收益为10 11 12 13 14 15 16 17,现在计算这支股票的极差最大值是17,最小值是10。因此,极差=最大值-最小值=17-10=7。

极差对于数据的波动程度衡量不够准确,股票收入变成1 10 11 12 13 14 15 16 17 101。当数据出现异常的离群值,极差准确性就受到影响。此时,极差=最大值-最小值=101-10=100;但是,正常区间的数据波动性没这么大。还记得第一期去除异常值的箱体图吗,当去除异常值1和101时,极差变成17-10=7,又回到了正常水平。

方差的计算与应用:

方差是各变量值与其平均数离差平方的平均数。

离散趋势的计算(离散趋势的应用)(2)

方差

方差的平方根称为标准差。

离散趋势的计算(离散趋势的应用)(3)

标准差

计算实例:用方差与标准差计算下列股票的波动性,17 11 15 13 13 13 13 14 12 12,12,12 10 16,

import numpy as np

data=np.array([17 11 15 13 14 12 10 16])

var=np.var(data);print(var)

std=np.std(data);print(std)

#方差为5.25

#标准差为2.29129

离散系数的计算与应用:

1、离散系数的计算

是一组数据的标准差与其相应的平均数之比。

离散趋势的计算(离散趋势的应用)(4)

离散系数

计算实例:一个班的年龄如下:17 11 15 13 14 12 10 16,先计算平均数,再计算标准差,最终得到离散系数。

import numpy as np

data=np.array([17 11 15 13 14 12 10 16])

mean=np.var(data)

std=np.std(data)

Vs=std/mean

print(Vs)

#该数据离散系数为0.436436

为什么要有离散系数呢?是为了不同样本的波动性可比较。因为如果样本的平均值是相同的,那么我们比较方差或者标准差就能知道数据的稳定性。如果数据的平均值不同,无法通过上述比较得出结果,就需要应用离散系数。离散系数最通常的应用,对于股票的风险测量,股票的风险系数就是离散系数。

综合应用场景:

甲乙两个运动员都是中等水平,各连续打靶8次,请问哪个运动员发挥稳定?

甲乙连续打8次靶,按先后顺序记录如下:

甲运动员:[8 7 8 9 9 8 7 8]。

乙运动员:[5 6 6 7 7 10 10 10]。

通过计算,得出的离散趋势结果如下表所示:

离散趋势的计算(离散趋势的应用)(5)

如果计算的结果中有离散系数,我们可以直接使用离散系数进行比较,就不用看方差与标准差。通过方差、标准差、离散系数的比较,发现甲的离散趋势指标均比乙的指标小,因此,甲发挥的更加稳定。

大家对本文感兴趣的话,我们为大家准备了离散趋势的相关python代码案例,作为小礼物送给大家,更多内容,请关注海数据公众号。

本期分享到这里,我们会在每周持续更新,咱们下期再见,期待您的光临。

有什么建议,比如想了解的知识、内容中的问题、想要的资料、下次分享的内容、学习遇到的问题等,请在下方留言。如果喜欢请关注。

离散趋势的计算(离散趋势的应用)(6)

海数据微信小程序

离散趋势的计算(离散趋势的应用)(7)

海数据微信二维码

猜您喜欢: