一个关于减少大量重复的待审答案的建议

2018年3月19日 03:07来自:lurkarot

101上的待审答案估计有几万条。以后会越来越多。roboter说这几乎无法用人力解决了。但抛弃这个普通棋友的反馈机制也不好。我提一个建议来部分解决待审答案的问题。

目前的待审答案最大的问题是重复答案太多。同一个思路的答案,有一步的版本,有五步的版本,还有二十步的版本,甚至有一百步的版本。审题者估计也不大确定哪个版本值得一审。

因此当棋友提交的答案是一个现有待审答案的前几步(“子集”),或者是它更详细的版本(“母集”)时,答案不能被提交为待审答案。提交者只能对现有的待审答案投票,选择现有待审答案是对/错/变化答案,或者是答案过短/过长。

如果答案达到对/错/变化答案的入库票数,就可以入库。相反,如果一个待审答案被确定为过短或过长,一下个录入的比它长(短)一步或两步的答案被作为新的待审答案,进入新的群众投票周期。同时删除原来的那个待审答案。被删的答案的长度可以作为有用信息加以利用。

这个机制会有两个问题。一是群众投票周期长。这个不是大问题。只要机制合理,能提炼出有用的信息就行。用统计学的术语来说,从群众反馈里筛选答案(estimator)时,consistency 比efficiency更重要。二是大量普通棋友参与投票,可能让有误答案入库。这个可以通过降低普通棋友投票权重来解决。

删除话题

[[::s.username]] 写于 [[::s.updatestr]][[::s.douname]]赢取[[s.dou]]围豆 [[::s.dou]]围豆 [[::s.dou]]围豆[[$index + 1]]楼 删除
已经删除,撤销 | 关闭