统计学数据应用在国家层面的地位(架起生态统计学应用新)
统计学数据应用在国家层面的地位(架起生态统计学应用新)典范分析是生态学多元统计的核心分析方法,主要用于量化环境因子(解释变量)对多物种生物群落(响应变量)的决定作用。由于涉及参数较多,典范分析中对于具有多重共线性的解释变量的相对重要性评估一直困扰着生态学者。历经数年的研究赖江山在接受《中国科学报》采访时表示,“我国生态统计学领域与欧美发达国家仍有很大差距。在我国生态学整体快速发展的背景下,生态方法学研究和软件开发的相对滞后可能会影响整体的发展进程。”因此,他认为应鼓励青年科研人员积极参与生态新方法和软件的开发,为国内生态学全面发展做出贡献。赖江山为学生讲解数量生态学与R语言 受访者供图
来源:【科学网】
随着生态学进入大数据时代,先进的数据分析技术和生态统计模型成为整合生态大数据、发现有价值的生态学规律的重要“桥梁”。
但生态学家经常会在模型使用过程中遇到各种统计学方法的问题。例如典范分析中共线性解释变量的相对重要性评估就是其中之一。
对此,中国科学院植物研究所副研究员赖江山将统计学中“层次分割”理论用于解决此问题并开发R语言程序包实现。相关研究成果于今年4月发表于生态学国际期刊Methods in Ecology and Evolution(MEE)。
赖江山在接受《中国科学报》采访时表示,“我国生态统计学领域与欧美发达国家仍有很大差距。在我国生态学整体快速发展的背景下,生态方法学研究和软件开发的相对滞后可能会影响整体的发展进程。”
因此,他认为应鼓励青年科研人员积极参与生态新方法和软件的开发,为国内生态学全面发展做出贡献。
赖江山为学生讲解数量生态学与R语言 受访者供图
历经数年的研究
典范分析是生态学多元统计的核心分析方法,主要用于量化环境因子(解释变量)对多物种生物群落(响应变量)的决定作用。由于涉及参数较多,典范分析中对于具有多重共线性的解释变量的相对重要性评估一直困扰着生态学者。
自2017年起,赖江山就开始寻找解决问题的方案。为此,他查阅了很多统计学文献,在学习统计学中“层次分割”理论时,他突然想到,能否将这一理论应用于典范分析呢?
经过多年的探索和近一年的编程计算,他终于将“层次分割”与变差分解建立起了数学联系,并提出可以通过平均分配共同解释的组分与边际效应之和获得单个解释变量所分配的解释率,再通过比较单个变量解释率来评估典范分析中共线性的解释变量相对重要性。
今年4月,赖江山及合作者在MEE正式发表了这一新方法,实现该方法的R程序包rdacca.hp也于2021年1月在R语言官方网站CRAN发布。
截至目前,该程序包已被下载安装1.3万次,据谷歌学术搜索显示,已有90多篇研究论文使用rdacca.hp包做数据分析,研究涉及生态学、生物学和环境科学等多领域。
赖江山告诉记者,目前使用rdacca.hp包的绝大部分是中国作者,这得益于国内庞大的研究群体,使得新的、有用的研究方法和工具开发后能很快能得到推广应用。
“尴尬”的研究处境
在赖江山看来,近二十年来,随着国家对生态环境和生物多样性保护的重视,国内生态学研究发展迅速,不仅相关研究人员快速增加,高水平的研究论文也层出不穷,“相比之下,生态统计学领域的研究并没有太多进展。”
“MEE主要发表生态和进化领域能引起广泛兴趣或具有普遍意义的新方法和新工具。据Web of Science统计,自2010年创刊来,中国学者在MEE发表的论文仅占其发表总量的1%左右,按国家和地区排名第18位。”赖江山认为,“我国从事生态学研究的人员数量庞大,但在MEE发表文章比例却很低,这与目前庞大的研究群体极不匹配。”
究其原因,赖江山认为,一方面方法类的研究难度较大,周期也较长,特别是基础统计学方法性的研究,不仅需要阅读大量文献,还要心无旁骛地思考和坚持不懈地写代码尝试,“当前科研环境下,很多科研人员时间破碎化、片段化,难以专注于一件事情。”
他还指出,“生态统计方法类的研究往往不需要太多经费支持,不易申请到相应的课题资助,甚至还会遇到同行太少而得不到认可的尴尬。所以很多人望而却步,有兴趣也不愿涉足。但基础统计方法类的文章,哪怕是很小的创新也往往具有普遍意义。”
在赖江山看来,我国在生态学软件研发方面还相对比较落后,例如目前常用于生态学数据分析的免费开源R程序包有数千个,但由国内学者编写的R包却屈指可数。
“国内很多研究人员长期满足于使用国外软件进行数据分析,缺乏自主研发的积极性,生态统计学软件的在国内发展也受到很大限制。” 赖江山说。
摒弃“偏见”
生态学统计方法和软件开发,到底要依靠哪个领域的学者?
赖江山认为,生态学学者要摒弃对统计方法和软件开发的偏见。“很多人认为新的统计方法和软件开发不属于生态学研究的组成部分,或是觉得这不是生态学学者该做的事。”
他告诉记者,目前国内鲜有高校专门开设数量生态学或生态统计软件开发的学科,但生态统计方法开发在国外是生态学研究的重要分支,比如数量生态学就是一门独立学科,其主要任务是通过集成来自不同领域的分析方法来描述和解释生态学的多元数据结构,有时也需要发展全新的数量方法来回答生态学问题。
“如果我国高校成立专门机构开展相关领域的研究,将是难得的发展契机。”赖江山说。
但他也指出,推动该学科的发展还需要改变只重视论文,不重视软件或工具等其他类型产出的科研评价体系。
“科研管理部门也可以有所作为,像美国国家科学基金会支持结题时提交软件或工具,而不仅仅是论文与专利,让对方法学和软件开发感兴趣的青年科研人员能够坚持理想和信念,为生态统计学和软件开发贡献力量,努力缩小我国在该领域与国际先进水平的差距。”赖江山说。
相关论文信息:https://doi.org/10.1111/2041-210X.13800
本文来自【科学网】,仅代表作者观点。全国党媒信息公共平台提供信息发布传播服务。
ID:jrtt