快捷搜索:  汽车  科技

dota2ti1013日赛程(DOTA2对本TI周期内赛事的赛制的深入分析)

dota2ti1013日赛程(DOTA2对本TI周期内赛事的赛制的深入分析)跟我[上个分析文章]一样,我会通过一个基于战队排名顺序的方程来计算比赛质量(略微惩罚一些并未分出所有排名的赛制,比如第7和第8并列的赛制,这是我上次并未考虑到的)。针对因赛制导致的偏差,量化的计算方式可以表述为“在所有Y>X的情况下,实力排名X的战队的最终排名高于实力排名Y的战队的发生频率的平均值”。我也稍微改了下偏差的方程,所以新的数值只是基准误差值(即越低的数值意味“越好”的赛制)。另外还加入了第二个赛制指标:“前四准确率”,意思是实力排名前四的队伍在比赛中拿到的名次也是前四的出现频率百分比。在一些赛事自行取消和V社撤销了一个Major的资格后,我们有22个已规划的DPC赛事,其中包括13个Minor和9个Major。包括已结束的DAC和近在眼前的SLI,公众已经掌握了17个赛事的信息。•  赛事组织者:希望降低成本的同时保证观众数量(现场和线上)。大部分组织者都希望能够把昂贵场

dota2ti1013日赛程(DOTA2对本TI周期内赛事的赛制的深入分析)(1)

翻译:[@BroLegend]

校对:[@Raphael_The_Great]

我在过去已经写了很多关于赛制的东西:大部分都是批评一些赛制很烂的比赛。比赛的赛制对于一个对抗类赛事或者赛季的结果有着决定性的影响,所以一个低效、不合理或者不公平的赛制会严重影响Dota2的公平对抗,在我看来这一点是显而易见的。但是这个问题的一个关键点在于,赛事的相关群体彼此并不相同,因此他们的出发点也存在差异:

•  选手/教练/战队经理:希望赛制能够证明他们的实力;但比赛场次不能太多,避免陷入打了很多场但赛事名次却没什么提升的情况。

•  赛事组织者:希望降低成本的同时保证观众数量(现场和线上)。大部分组织者都希望能够把昂贵场馆的租赁天数控制在一个合理的数量内。

•  粉丝:希望在舞台上打比赛的队伍越多越好,但不想花太多时间看比赛(淘汰赛天数不能太长,否则跟比赛就变得冗长而乏味了)。

dota2ti1013日赛程(DOTA2对本TI周期内赛事的赛制的深入分析)(2)

dota2ti1013日赛程(DOTA2对本TI周期内赛事的赛制的深入分析)(3)

那么来看看我们迄今为止关于DPC的公开信息。

在一些赛事自行取消和V社撤销了一个Major的资格后,我们有22个已规划的DPC赛事,其中包括13个Minor和9个Major。包括已结束的DAC和近在眼前的SLI,公众已经掌握了17个赛事的信息。

跟我[上个分析文章]一样,我会通过一个基于战队排名顺序的方程来计算比赛质量(略微惩罚一些并未分出所有排名的赛制,比如第7和第8并列的赛制,这是我上次并未考虑到的)。针对因赛制导致的偏差,量化的计算方式可以表述为“在所有Y>X的情况下,实力排名X的战队的最终排名高于实力排名Y的战队的发生频率的平均值”。我也稍微改了下偏差的方程,所以新的数值只是基准误差值(即越低的数值意味“越好”的赛制)。另外还加入了第二个赛制指标:“前四准确率”,意思是实力排名前四的队伍在比赛中拿到的名次也是前四的出现频率百分比。

我以线性的实力分布为输入数组,对每个DPC比赛赛制跑了10⁵次模拟。我也加入了一些基准赛制作为参照组,比如不同种类的单败淘汰。在测试中只计算了直接对抗的胜负关系,并未考虑非传递性的胜负(如A>B,B>C,C>A)。

最后,我想模拟赛制质量的另一个要素:在初始分组不利的情况下,这个赛制是否能依旧让强队取得应有的成绩。所以我在每次模拟中对每支战队建模了一个洞察值,基于战队间评分(战队-战队[i-1])乘以正态分布。这样模拟就可以体现出在分组时一支被赛事组织方低估的强队(或者高估的弱队)对结果的影响。在随机的瑞士轮里这个指数不会有什么影响,但是在单败淘汰赛里,这个指数将会对结果有很大的影响.

dota2ti1013日赛程(DOTA2对本TI周期内赛事的赛制的深入分析)(4)

意料之中的是,从误差值来看,刚刚结束的DAC采用了目前为止最好的赛制(洞察值为0或50的时候都是最佳)。而且它有九分之一的前四符合率,仅次于BO3单败赛制。但是BO3单败赛制对于合理分组的依赖性很强,如果我们将洞察误差值增加到50,那么它的前四符合率从21.2%骤降到了12.4%;又因为仅有很少的比赛场次(只有15个BO3),每场比赛的方差也极大。

TS8带来了惊喜:这是本赛季最好的9队赛制(同时它也优于所有8队伍赛制)!一部分成果归功于有9支而不是8支队伍;但同样因为每个分组里有一支强队,一支中流战队和一支弱队(在模型里对小组赛分组的描述有点过多了),这就是说如果想要小组赛最后爆冷,那么强队就要在对阵中流战队的时候翻车(基本也得要强队对阵弱队的时候翻车),因为每支队伍要打6个BO1,所以这种情况很少见。前四全对是很难实现的,但在这样的赛制下,只需要让第四强的战队能打出外卡赛就行了。

CD4.0是从数据来说本赛季最差的赛制:它只是仅仅略优于随机8队BO1单败赛制(误差率分别是洞察值0的12.06和洞察值50的12.08)。我对洞察值增加但误差值反而降低的唯一解释就是方差(10⁵次并不是很多),或者(更可能)是我自己琢磨出的分组其实很烂,而且存在一个更好的分组方式(所以一个略微调整过的/随机的分组会表现得更好一些)。

从前四符合率来说,布加勒斯特Major比较失败。部分原因归结于BO1瑞士轮小组赛的高方差。只有大约4.57%的模拟得到了正确的前四,在高洞察值下这个几率略微降到了4.53%(也说明了分组对瑞士轮的影响很小)。一个bo1单败赛制(完美分组)都有5.97%的前四符合率.

梦幻联赛第8/9赛季的赛制本身就是一个参考组的基准赛制:它就是一个标准的8队双败。16队的赛制得分更高,因为规模大的赛制更容易得高分(队伍的排名数据更多)。下面的矩阵列举了一个完美的8队单败对比4队单败;8队单败有25%的等价,而4队的只有17%。这就是说比赛排名并列情况越严重的越不容易得到高评价(经常发生在最后几名里),所以越多队伍就意味着排名并列的战队的组合方式越多。

dota2ti1013日赛程(DOTA2对本TI周期内赛事的赛制的深入分析)(5)

何去何从?

我希望在这篇文章里做的(但是后来发现需要再单独写一篇)是对不同队伍数量赛制的误差值进行归一处理。粗略地说就是规定8队单败赛制跟16队单败赛制同样“公平”(一致的分组);8队双败跟16队双败同理。通过进行不同的n队m败模拟,我们可以相对合理地将不同的赛制降维到一个基准维度(比如8队),从而使每个归一化后的赛事质量评分可以互相比较(在基准维度上)。

此外,这也可以是评测将来赛事好方法(有些即将开始的赛事使用的赛制很非常蠢),同样这也可评估赛制变化带来的影响:

•  如果ESL确实接受了意见,并且把赛程改为一个单独的16队双败,前二进入胜者组,3-6进入败者组,结果会怎么样呢?

•  如果DAC不进行突围赛而是把9-12名放到败者组,结果会怎么样呢?

•  如果没有任何赛事使用BO2小组赛中2比0完胜拿3分的赛制,结果会怎么样呢?

在这些指标上表现良好的赛制也不应该高枕无忧:他们也应该寻求更好的赛制。这里并不是在要求所有的赛制都是一样的,但是赛事方至少应该多尝试以些对参与队伍来说合理和靠谱的赛制。

因为这篇文章有着大量的代码(大约一千行) 我也许犯了些错误-[这里]是代码的github用以检查。

Cheers

~ Noxville

dota2ti1013日赛程(DOTA2对本TI周期内赛事的赛制的深入分析)(6)

猜您喜欢: