简单评测答疑：硬广我家出了一个新测评

威哥 2023-02-03 03:51:54 893

简单评测答疑：硬广我家出了一个新测评这样一套系统，能给招聘中的测评带来哪些价值呢？““测评过程中出现了这么多问题，那么有没有一套系统能解决呢？有一套系统可以改变上述的问题，与现在美国考试服务中心（ETS）在TOEFL、GRE、GMAT等考试中采用的一种能够自适应的测验技术（MST）相类似的，就是计算机自适应测验技术（Computerised Adaptive Testing），它融合了计算机技术和项目反应理论，采用了自适应抽题和用题目参数估计受测者能力水平的测评方式。它首先为受测者随机提供一个中等难度的题目。受测者每做对一题，会获得一道更难的题，反之下一题会更简单。当受测者回答完一定数量的题目，测验获得了足够的关于其能力水平的信息，程序会自动停止。

一家大型互联网公司在做校园招聘时，动辄就有上千人参加认知能力测评。其他公司的HR表示很羡慕，他们的招聘指标应该能很轻易地完成吧。但是这些被羡慕的HR却有一个苦恼：网上流传的机经（机试经验）、网上曝光的题目和应聘者间的私下交流，让前人的作答结果影响了后面的作答者，由此得到的测评结果已经远不是受测者原本的样子。

另一家金融公司，动辄以秒计算的交易世界里，时间对他们来说就像是上了发条的外星人。尤其是在争分夺秒的校招季，时间更是可贵。因此无论是从招聘效率还是作答者体验而言，HR都期望招聘更好更快地完成，而测评作为校招的核心环节，有没有可能在时间上缩短呢？

“

测评过程中出现了这么多问题，那么有没有一套系统能解决呢？

有一套系统可以改变上述的问题，与现在美国考试服务中心（ETS）在TOEFL、GRE、GMAT等考试中采用的一种能够自适应的测验技术（MST）相类似的，就是计算机自适应测验技术（Computerised Adaptive Testing），它融合了计算机技术和项目反应理论，采用了自适应抽题和用题目参数估计受测者能力水平的测评方式。它首先为受测者随机提供一个中等难度的题目。受测者每做对一题，会获得一道更难的题，反之下一题会更简单。当受测者回答完一定数量的题目，测验获得了足够的关于其能力水平的信息，程序会自动停止。

“

这样一套系统，能给招聘中的测评带来哪些价值呢？

降低了题目曝光的影响

自适应抽题的方式让受测者的作答题目全程处于动态调整中，下一题是什么取决于上一题的作答结果，不同的受测者会遇到不同的题目。由于采用参数估计的方式，受测者即使遇到了见过的题，单次作答正确，也不会对整体能力估计产生太大的影响。

作答体验更好

在测评过程中为受测者提供的题目非常接近TA的真实能力水平，题目不会过难或过容易。受测者表现的能力水平稳定时，作答时间会缩短，与传统测验相比自适应测验可以减少1/3的作答量。

测评更准

这中计分方式，不是采用卷面分，而是基于题目参数和受测者的作答模式去估计其能力水平。这种估计方式受题目难度的影响，结果更接近受测者的潜质水平。如下图中的两个受测者，按照传统计分（正确计1分，错误计0分），A和B分差为9分（100*8/12-100*7/12），而用新的方式去评估时，我们发现A和B的能力水平相差非常大，差距接近1.7个标准差（如果把标准差设定为15，差距接近26分）。

举例来说，某互联网公司要招聘一位产品经理，HR约了两位候选人，小A和小B，假设小A和小B的水平是不一样的。两人拿到的是同样一道中等难度的题目，小A顺利答对，而小B抓耳挠腮后还是答错了。系统根据两人的作答情况，评估他们的能力水平，并自动匹配下一道题。由于小A答对了第一道题，对TA的能力评定会高一点，所以第二题比第一题更难；而小B答错了第一道题，对TA的能力评定会低一点，所以第二题比第一题简单一点。以此类推，当答完一定数量的题目之后，HR就能很清晰地看出小A和小B的水平相差在哪里。

简单评测答疑：硬广我家出了一个新测评(1)