把题目按答案相似度进行聚类

2019年1月24日 04:57来自:lurkarot

记得kenny或者其他高手说过题库的质量之一是题目分类。101目前有“围棋基本技能”知识点分类,但分类很粗(比如“基础死活”),数量不大。我来提一个建议,可以用程序低成本地对题目进行初步的细微分类。

Q-26579的答案4为例。棋友应手的坐标可以表示为(0,0),(1,1),(1,2)。如果其他题目的答案中包含相似的解法,那么就可以把它们初步放到一个组里。然后可以进行更高级的分析,或者进行人工分类。

比如Q-59360Q-22289Q-88938Q-82256Q-12438的解法和Q-26579是一样的。我把它们叫作“割颈取头”。

这种分类思路的实现方法很多。比如识别特征中也可以包含电脑的走法,也可以只考虑前几步。

很难想像任何一个方法能完美地识别解法中的思想。但无论如何,这些算法能把同一解法的题目从海量题目里挑出来,放在一起,让细微尺度上的人工分类有可能性。

有了这些微尺度上的分类,我觉得可以实现的功能太多了。首先,老师在教小朋友基本技能时能随手找个五道十道题给他们练习。其次,101能提供实现微知识点上的很多增值功能。

我觉得初级中级棋友的主要任务就是把这种基本走法一个一个地练熟。要把每个走法练熟,那就得有个系统,有个计划。建立起这样的微知识点系统是提高练习效率的第一步。初中级棋友占了101用户的绝大多数,因此这个事情是很有意义的。

101目前有相似题功能。这个好像是以题目的初始布局为依据的。这些相似题过于雷同,每个聚类的题目数量太小,不具备识别知识点的功能。


更松散的“割颈取头”题目组
Q-110061
Q-12438
Q-13602
Q-13771
Q-14075
Q-15744
Q-22289
Q-26579
Q-35023
Q-44988
Q-560
Q-59360
Q-75183
Q-82256
Q-85084
Q-88938

删除话题

[[::s.username]] 写于 [[::s.updatestr]][[::s.douname]]赢取[[s.dou]]围豆 [[::s.dou]]围豆 [[::s.dou]]围豆[[$index + 1]]楼 删除
已经删除,撤销 | 关闭