本帖最后由 公理力 于 2023-2-10 08:31 编辑
注意到有版友发帖,呼吁大家给4位评委的工作也打打分。此事当然可以有,怎奈,应者寥寥。 还有版友建议,评委们就自己工作中的遗憾和有待改进之处谈谈看法,亦未见回应。
无需多少想象力,参赛者,赛事组织者,也包括关心赛事的不少版友,应该也关注下面两个问题: 1)4位评委打分的精准度究竟如何? 2)由评委打分区间差异悬殊导致的权重失衡,对作品排名,特别是获奖等级的影响究竟有多严重?
事实上,早在赛事进行期间,darling小芳就曾专门发帖,提出了第二个问题,并恳请组织者采取必要措施。公某在被点名的情况下,也曾回应一帖,提出过改进建议。 赛事结束,小芳再次提到相关问题,并点了公某的名。现在,就通过数据统计,来分析一下上面两个问题。 重点是,数据分析是得以屏蔽任何主观影响的客观性手段,舍此,几乎没有得出明确、公正结论的方法。
(一) 评委打分准确度数据分析
该表仅限于4位评委对12篇获奖作品的打分数据进行统计分析。通过每位评委对每篇作品打分与该作品平均得分对比获得打分偏差,然后统计每位评委对12篇作品的累计总偏差,就是各位评委打分精准度指标。
从表中不难看出,如果不是打分分布区间差异过于悬殊,这是一个相当不错的结果:4位评委的精准度都相当高,按顺序为:公孙小刀,黄河编辑,马缨花,道家传人。
应该指出的是,公孙和道人两位评委的12个偏差值各自在同一方向:公孙打分无一例外都偏低(红色);而道人正相反,全部偏高(黑色)。 这个现象对打分准确度的影响是正面的。这意味着,该两评委各自的打分标准具有相当高的前后一致性。
值得注意的是,评委们对46号作品的打分。除了马花评委给出了12篇作品的个人最低分(7分),另外三位都给了全部65篇作品中个人最高分。 但由于马花的最低分偏差高达1.97(或许是看走眼了吧),导致这篇另3位评委一致认同的最佳作品,不仅无缘一等奖,二、三等奖也没份儿,仅获优秀作品奖。 从这一意外即可管窥:打分区间差异悬殊,所导致的评委间权重失衡有多严重:一位评委的影响抵消了3位评委的最高分。
而这一最低分同时也影响到黄河和道人打分精准度:这两位评委的最大偏差都出现于该作品(1.03和0.99)。
再仔细看一下马花的12个打分:5篇给了最高分(9.0),6篇给了次高分(8.5)。这与另外3位评委形成对比。 不应忽视的一个事实是,她是最早开始评论作品的,也最早开始受到质疑和批评。客观地看,这11个高分,显然是希望自己看好的作品都能获奖!这是出于缓解版友批评的目的吗?公某不猜测。
|