统计分析的基本思路,统计分析方法这么多
统计分析的基本思路,统计分析方法这么多该研究进行结果分析时,率先对调查结果进行描述性统计分析,描述样本的基本概况、变量集中趋势和离散趋势,通过样本量、性别、年龄等人口学基本资料,应用频数、百分比、范围、均值、标准差、中位数等统计方法,并绘制频率分布表进行可视化(下图)。描述性统计分析是数据分析必要操作,可以帮助了解调查研究结果的基本特征。文献详细信息(图片来源:网页截图)(一) 描述性统计分析
好不容易拿到数据,却不知道如何分析,这是很多科研萌新的痛点。统计分析方法这么多,该选哪一个呢?过来人告诉你——跟着文献学。
接下来,小编就从一篇文献剖析如何选择统计分析方法——《Caregivers' confidence in performing child safety seat installations: what matters most?》[1]。
在这项研究中,75 名家长在车上安装了儿童安全座椅(CRS),并完成关于风险评估、CRS 使用、任务难度和正确安装 CRS 的信心的自我报告调查。
文章中灵活应用多项统计学方法,比如描述性分析、相关、方差分析、回归分析等,很适合展开案例学习。
文献详细信息
(图片来源:网页截图)
(一) 描述性统计分析
描述性统计分析是数据分析必要操作,可以帮助了解调查研究结果的基本特征。
该研究进行结果分析时,率先对调查结果进行描述性统计分析,描述样本的基本概况、变量集中趋势和离散趋势,通过样本量、性别、年龄等人口学基本资料,应用频数、百分比、范围、均值、标准差、中位数等统计方法,并绘制频率分布表进行可视化(下图)。
现况描述
(图片来源:参考文献 [1])
在已发表的众多文献中,尤其是题为「现状分析」、「描述性分析」、「横断面分析」时,有些会使用单一的描述性统计分析方法。
如《桂东民族地区留守儿童安全教育现状调查分析》[2],通篇只用简单的频率分布表进行数据描述。稍微复杂的频率分布,可以细分城乡别、年龄别、地区别某率,如《中国死因监测数据集》[3]。
当然,也有作者用不同类型插图丰富文章结构。
当文章侧重点不在于现状分析时,描述性统计分析方法也与其它统计方法联合应用。此时描述性分析仅对数据基础信息进行概述,为后续进一步分析作铺垫。
总而言之,描述性分析在文章应用表现为:
①现状分析/现况分析/描述性分析/横断面分析/生态学研究;
②作为了解科研数据基本信息放入文中。
描述性分析常用指标、图表及其用途汇总
(图片来源:风云)
(二) 差异性分析
差异分析的统计学方法有:T 检验、方差分析、卡方分析等参数分析方法,以及秩和检验等非参数分析方法。
该研究对「正确安装」与「错误安装」组采用 F 检验作差异性分析。F 检验也作联合假设检验,通常应用于方差齐性检验、方差分析、线性回归方程整体的显著性检验。
从分析角度而言,文章着重切入点为两组及以上的「差异」。数据库搜索「差异分析」时可以发现,大部分作者应用的是卡方分析,其他方法应用较少,也并非没有。
Omari 等 [2] 分析驾驶员使用儿童约束系统情况采用卡方分析,分析使用知识和态度的平均分数和标准偏差时采用 Mann–Whitney test 和 ANOVA。Wendy 等 [3] 比较研究组之间的结果时采用 T 检验。
进行差异分析时,可以根据比较内容选择分析方法,比如:率的比较用卡方分析、均值比较用 T 检验等。
同一份数据,不同的分析方法,数据表达形式不同。进行差异分析时,并非只能用一种差异分析方法,Omari 的文献就是最好的说明。
(三) 相关性分析
Mirman 采用 Spearman 对志愿者的信心、安装安全性、风险评估和 CRS 资源接触之间进行了相关性分析(见 Table 2),同时,还采用方差分析对 CRS 资源接触与 CRS 安装精度进行了关联性分析(见 Table 3)。
Spearson 相关性分析
(图片来源:风云)
ANOVA 相关性分析
(图片来源:参考文献 [1])
一般作相关性分析时,通常想到的统计学方法就是 Pearson、Spearman 分析。但实际上分析方法很多,可以根据数据类型进行选择。在此列举不同数据类型及推荐的统计分析方法:
图片来源:风云
(四) 回归
该研究对正确安装信心预测因子采用多元线性回归分析。
回归分析
(图片来源:参考文献 [1])
一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量更符合实际,因此,大多文献中使用的是 logistic 和多元线性回归分析。
除此之外,还有其他分析方法,在此列举一些回归分析方法:
图片来源:风云
诸多文献经验表明,多种统计学方法可以单一或联合使用。
单一使用时,如描述性统计分析作「现况描述」。联合使用时,一般作者最想论证的观点及其对应采用的统计学方法通常会放在最后分析。
如果作者采用「描述性分析 卡方分析」分析方法,题名或切入点可以为「XXX 现况及差异性分析」「XXX 与 XXX 的差异」,同理,如果作者采用「描述性分析 卡方分析 Pearson 相关」分析方法,题目可以作「XXX 与 XXX 的相关性分析」。
参考文献:
[1] Mirman JH Curry AE Zonfrillo MR Corregano LM Seifert S Arbogast KB. Caregivers' confidence in performing child safety seat installations: what matters most? Inj Prev. 2014 Jun;20(3):167-71. doi: 10.1136/injuryprev-2013-040866. Epub 2013 Aug 8. PMID: 23929904.
[2] 祁慧. 桂东民族地区留守儿童安全教育现状调查分析 [J]. 文化创新比较研究、 2021 5(15):65-68.
[3] 中国死因监测数据集(2019)[M]. 科学普及出版社 2020.
[4] Omari K Baron-Epel O Low rates of child restraint system use in cars may be due to fatalistic beliefs and other factors Transportation Research Part F: Traffic Psychology and Behaviour Volume 16 2013 Pages 53-59 ISSN 1369-8478 https://doi.org/10.1016/j.trf.2012.08.010.
[5] Shields W. C. Mcdonald E. M. Mckenzie L. Wang M. C. Walker A. R. & Gielen A. C. (2013). Using the pediatric emergency department to deliver tailored safety messages: Results of a randomized controlled trial. Pediatric emergency care 29(5) 628-634. https://doi.org/10.1097/PEC.0b013e31828e9cd2