机器学习均值回归:统计概率基础之常用连续性分布及应用场景总结
机器学习均值回归:统计概率基础之常用连续性分布及应用场景总结随机误差;各种测量误差;各种产品的质量指标(如零件的长度、直径等);不少医学现象(比如人的身高、体重,同性别健康成人的红细胞数、血红蛋白含量、脉搏数等);农作物的收获量;海洋波浪的高度;金属线抗拉强度;热超声电流强度;理想气体的分子速度;某个年级某学科考试成绩;信号噪声等等。应用场景电子器件的寿命;动物的寿命;人的寿命;随机服务系统中的等候时间;电话的通话时间;服务系统的服务时间;独立随机事件发生的时间间隔,比如旅客进机场的时间间隔。概率密度函数概率密度函数
今天给大家总结一下做机器学习和数据分析时常见的连续性分布及其应用场景。
-
概率密度函数
概率密度函数
-
应用场景
电子器件的寿命;动物的寿命;人的寿命;随机服务系统中的等候时间;电话的通话时间;服务系统的服务时间;独立随机事件发生的时间间隔,比如旅客进机场的时间间隔。
正态分布-
概率密度函数
概率密度函数
-
应用场景
随机误差;各种测量误差;各种产品的质量指标(如零件的长度、直径等);不少医学现象(比如人的身高、体重,同性别健康成人的红细胞数、血红蛋白含量、脉搏数等);农作物的收获量;海洋波浪的高度;金属线抗拉强度;热超声电流强度;理想气体的分子速度;某个年级某学科考试成绩;信号噪声等等。
对数正态分布-
概率密度函数
应用场景
半导体器件的沾污、扩散 、电流密度和电压梯度等引起的器件失效;在半导体器件的寿命和加速寿命试验中应用;在分析测试中,特别是在衡量分析中的应用;电子设备维修时间的数学模型;电子元器件的可靠性变化过程;股票投资的长期收益率等等。
Weibull分布-
概率密度函数
概率密度函数
-
应用场景
机电类产品的磨损累计失效的分布形式;可靠性分析和寿命检验中应用;生产过程和运输时间关系;雷达系统中对接受到的杂波信号的分布建模;通信技术中,相对指数衰减频道模型,Weibull衰减模型对衰减频道建模有较好的拟合度;由于曲线形状与现实状况很匹配,被用来描述风速的分布;生存分析、极值理论、预测天气等中也有应用。
β分布-
概率密度函数
概率密度函数
-
应用场景
应用于可靠性研究中;在机器学习和数理统计学中有重要应用;正常人在整个睡眠时间中“异相” 睡眠所占的比例服从β分布;在给定的地点 溶解在水中的氧气达到饱和的部分服从β分布;一批商品在销售过程中 相对跌价服从 β 分布等等。
伽玛分布-
概率密度函数
概率密度函数
-
应用场景
随机变量 X 等到第 K 件事发生所需等候的时间;伽玛分布作为共轭分布出现在很多机器学习算法中;是连接其他常见分布的重要枢纽;在分析学、概率论、偏微分方程和组合数学中有重要应用。
瑞利分布-
概率密度函数
概率密度函数
-
应用场景
应用于无线网络和可靠性分析中;常用于描述平坦衰落信号接受包络或独立多径分量接受包络统计时变特征,如两个正交高斯噪声信号之和的包络服从瑞利分布。
柯西分布-
概率密度函数
概率密度函数
-
应用场景
主要应用于物理学中,用来描述受迫共振的微分方程的解;在光谱学中,用来描述被共振或者其他机制加宽的谱线形状。
均匀分布-
概率密度函数
概率密度函数
-
应用场景
在实际问题中,当我们无法区分在区间 [a b] 内取值的随机变量 X 取不同值的可能性有何不同时,我们就可以假定 X 服从 [a b] 上的均匀分布(比如: 在数值计算中,由于四舍五 入 小数点后某一位小数引入的误差;公交线路上两辆公共汽车前后通过某汽车停车站的时间,即乘客的候车时间等)。