羽毛球男单排名2023最新排名(新世纪羽毛球男单全历史等级分)
羽毛球男单排名2023最新排名(新世纪羽毛球男单全历史等级分)56.001%0.41 sTestOptimal parametersElo
一、全历史等级分(WHR)算法简介
WHR的引入,要从h2h说起。如果说,我们能凭h2h判断同期选手的优劣,那么,WHR就能用它来分析史上所有选手的强弱关系。换言之,如果你认同h2h对于判断选手实力强弱的价值,那么就可以有足够的理由相信WHR。
WHR算法的原理,简单来说,就是将每名选手在每个时间节点的等级分记为一个变量,利用这些变量建立一个函数模型(概率模型),再以带有时间信息的全部选手历史对阵记录作为输入,通过牛顿法进行多轮迭代运算,拟合出有关选手实力的最有可能实现的一组等级分组合。
可以看出,WHR算法与我们司空见惯的做法一样,本质上都是利用h2h对选手的强弱关系进行分析,甚至可以说是猜测,但数学方法的优势自然不言而喻。在严密的概率学假设下,通过对巨量数据进行充分运算,无疑可以将各种意外尤其是球风相克等因素的影响降至最低,从而实现对h2h最科学有效的利用。
另外算法也不失之灵活,较明显的优点是包含了这样一个假设:选手在邻近时间节点的等级分具有相关性(满足高斯分布),这很大程度上是符合羽毛球选手的状态变化规律的。一言以蔽之,WHR算法在实力评分方面具备足够的可信度。
二、新世纪羽毛球男单WHR排名
WHR算法的整体演算原理比较复杂,感兴趣可参考此处:全历史等级分(Whole-History Rating);全历史等级分(WHR)算法;全历史等级分(WHR)开源代码。
比赛数据的获取源自此网站:比赛数据(论坛球友提供),另外根据论坛数据帝以及维基的数据,通过特殊方法进行了有限的补充。不过整体而言,上世纪选手的比赛数据还是缺失较多,因此,虽然算法算出的是所有选手在所有时间节点的等级分,但考虑到数据失真的问题,在进行排名时,只对主要活跃于本世纪的选手进行排名。
相关参数设置按照原文献给出的最佳参数,具体可参看原文献。
Algorithm |
Time |
Training |
Test |
Optimal parameters |
Elo |
0.41 s |
56.001% |
55.121% |
k = 20 |
Glicko |
0.73 s |
56.184% |
55.522% |
σ0 = 150 Elo w2 = 20 Elo2/day |
TrueSkill |
0.40 s |
56.212% |
55.536% |
β2 = 1 σ20 = 0.5 w2 = 0.000975/game |
Bayeselo |
88.66 s |
56.216% |
55.671% |
prior = 1 |
Decayed history |
89.86 s |
56.260% |
55.698% |
prior = 1 τ = 400 days |
WHR |
252.00 s |
56.356% |
55.793% |
prior = 1.2 w2 = 14 Elo2/day |
以下是主要活跃于本世纪的男单选手的峰值全历史等级分(WHR)排名,最右边的时间表示的是这个峰值出现的年份,仅列出前20名:
姓名 |
WHR |
时间 |
林丹 |
3783 |
2011 |
李宗伟 |
3749 |
2011 |
安赛龙 |
3662 |
2022 |
谌龙 |
3613 |
2015 |
桃田贤斗 |
3608 |
2019 |
陶菲克 |
3581 |
2005 |
陈金 |
3479 |
2008 |
鲍春来 |
3473 |
2007 |
陈宏 |
3460 |
2005 |
盖德 |
3437 |
2011 |
李炫一 |
3412 |
2013 |
石宇奇 |
3398 |
2019 |
李梓嘉 |
3387 |
2022 |
杜鹏宇 |
3370 |
2013 |
索尼 |
3364 |
2007 |
夏煊泽 |
3343 |
2003 |
斯里坎特 |
3328 |
2017 |
金廷 |
3320 |
2019 |
骆建佑 |
3315 |
2021 |
孙完虎 |
3312 |
2014 |
与另一位球友算出的结果对照,可以看出,林李的分数依旧是一骑绝尘,与他们生涯胜率的级别完全相符,包括峰值出现的时间也与传统印象高度吻合。同时从数据看,2011年的李宗伟也的确拥有与巅峰林丹一战之力。
安赛龙凭着最近接连的高光表现,分数一直呈上升趋势,位在林李之下,但仍与二人存在较大差距。另外由于算法假设选手在邻近时间节点的等级分具有相关性,因此日后安赛龙跌下巅峰后,他的分数应该也会有所下降。
值得一提的是谌龙与桃田贤斗的分数差距微小,通过调整权重,甚至曾算出二人的分数几乎一致。如果仅考虑相互对战,二人巅峰期交手极有可能五五开,这也符合一部分球友的推断。
可能由于权重不同,我算出鲍春来的峰值不是出现在09年,而是在07年,不过实际上,07年与09年的差距并不大,相差不到10分。
然而依旧没有改变的是,盖德、李炫一的峰值还是分别出现在11、13年,我在这里稍作解释:盖德的情况是因为11年有段时间他只输林李谌,而李炫一的情况,应该与世纪之初比赛数据缺失有关。这二人的数据暂时保留疑问。
另外陈金峰值依旧出现在08年,而非传统印象中他个人最强的10年。他08年之所以高,我想是因为从结果上看,当年他赢了林丹三次,还赢了李宗伟。他10年并非最高,大概是受到了11年状态下滑的影响。值得注意的是,陈金08年与10年的等级分差距同样不大。
以下是部分天王级选手在个人高水平年度的大赛等级分与最高等级分对比,据此可判断这些选手的最佳状态是否出现在大赛或大赛附近:
姓名 |
时间 |
大赛WHR |
最高WHR |
陶菲克 |
2004 |
3470 |
3477 |
陶菲克 |
2005 |
3581 |
3581 |
林丹 |
2006 |
3674 |
3675 |
林丹 |
2007 |
3655 |
3664 |
林丹 |
2008 |
3689 |
3690 |
林丹 |
2009 |
3729 |
3735 |
林丹 |
2010 |
3706 |
3711 |
林丹 |
2011 |
3783 |
3783 |
林丹 |
2012 |
3736 |
3737 |
林丹 |
2013 |
3674 |
3676 |
谌龙 |
2014 |
3562 |
3570 |
谌龙 |
2015 |
3610 |
3613 |
谌龙 |
2016 |
3488 |
3490 |
安赛龙 |
2017 |
3431 |
3454 |
李宗伟 |
2011 |
3708 |
3749 |
李宗伟 |
2012 |
3669 |
3680 |
李宗伟 |
2013 |
3628 |
3630 |
李宗伟 |
2014 |
3552 |
3568 |
李宗伟 |
2015 |
3539 |
3554 |
李宗伟 |
2016 |
3527 |
3528 |
这里值得留意的是05年的陶菲克与11年的林丹,这二人当年的最高等级分都恰好出现在大赛。反而是李宗伟11年的最高等级分并非出现在世锦赛,而是出现在世锦赛前的一段时间。
下表能更直观看到部分天王级选手在大赛(决赛)对决时的等级分情况,据此可判断比赛的质量:
赛事 |
冠军WHR |
亚军WHR |
2005世锦赛 |
陶菲克3581 |
林丹3573 |
2008奥运会 |
林丹3689 |
李宗伟3531 |
2011世锦赛 |
林丹3783 |
李宗伟3708 |
2012奥运会 |
林丹3736 |
李宗伟3669 |
2013世锦赛 |
林丹3674 |
李宗伟3628 |
2014世锦赛 |
谌龙3562 |
李宗伟3552 |
2015世锦赛 |
谌龙3610 |
李宗伟3539 |
2016奥运会 |
谌龙3488 |
李宗伟3527 |
2017世锦赛 |
安赛龙3431 |
林丹3387 |
2020奥运会 |
安赛龙3638 |
谌龙3449 |
可以看出,11世锦赛决赛的确是新世纪男单的巅峰对决,质量之高可谓绝无仅有,12奥运决赛虽然堪称伟大,但整体的比赛质量比起11世锦赛还是稍逊半筹,这个通过观看比赛视频其实也可以看出来,尤其是第二局。
另外,从数据上看,14至16年的李宗伟,论综合实力已经不如13年,更明显不如11、12年。这些年虽然他一直稳定杀进大赛决赛,但这并不意味着他的实力也一直处于同一水平线。
三、全历史等级分(WHR)何去何从
作业过程中查阅了论坛球友搜集的资料,同时有赖于两位计算机专业朋友的帮助,我在编写程序方面并不是很擅长,主要负责居中协调。
全历史等级分(WHR)在羽毛球领域应用得不多,关注更是无从谈起。它看起来像是一股新鲜血液,然而在唯大赛成绩论的实力观面前,其实并没有什么冲击力。它的信徒,是极少数的。
真理往往是简单的,却又是值得深思的。其实成绩与实力之间隔了很多东西,只是没人愿意思考。羽毛球在发展,对它的认知却在倒退。不过还是抱有这样一种想法:让有价值的东西得到更多的关注。我做不到,也总有人会做到的。
来源网络:球圣