avatar avatar 我的文献 基于领域本体和句框架的主观题自动阅卷算法研究 作者 苏方方 单位 广西师范大学 导师 朱新华 关键词 主观题; 问句处理; 领域本体; 指代消解; 句框架; 自然语言处理
摘要
计算机自动阅卷系统中对于客观题型(选择题、判断题、填空题等)的阅卷技术的研究目前已经非常成熟,很多大型的考试系统中都采用这种系统进行阅卷,以提高改卷的效率和缩减开支。但是,对于简答题、名词解释和论述题等主观题型的自动阅卷技术,由于其受到自然语言理解、人工智能、模式识别等理论与技术发展的限制,所以至今还仍然发展缓慢,没有实用的系统出现。计算机的运算效率高、速度快、精度高、不会疲倦,工作不受外界因素的影响,特别适用于主观题的自动批改,不仅节约了时间、提高了效率,并且也把教师从繁重的批改试卷这项工作中解脱出来。因此,研究如何利用计算机来实现主观题的自动批改具有很大的现实意义。本文从自然语言处理技术和领域本体两个方面着手解决主观题的自动阅卷。本文的主要工作包括以下几个方面:(1)领域本体的构建,本体在人和主体之间的沟通交流中提供了共享的基础,同时也方便了各个领域的系统开发人员和研究人员之间的理解。在问句参数提取模块中,如果提取的参数与本体中的某个概念匹配,就限定了问题的答题范围并且对标准答案的句框架组成起到铺垫作用。在标准(学生)答案句框架提取模块中,输入一个句框架中的每个元素,然后应用本体推理,对其进行语义扩展,之后检索出与之相关的词,与学生答案中关键词比较。在代词的消解模块中,本体库的作用类似于问句参数提取模块。通过引入本体,赋予数据清晰的语义和结构化描述,使之能够为计算机所理解,从而实现数据在语义层的互操作。为了更好地计算词语之间的相似度,在本文中建立了“数据结构”和“程序语言”两个本体。(2)主观题问句的处理,目前已有的或正在研究的主观题自动阅卷系统几乎都没有进行问句的处理。主观题自动阅卷系统可以根据从问句中提出的参数了解问句考察的知识点和标准答案中句子权重的分配。问句分析是自动问答系统中一个非常重要的组成部分,本文中也借助于问句分析来理解主观题问句。并转换为计算机能理解的方式提出关键词。只有正确理解主观题问句表达的含义以后,才能够识别问题的问点,进而在标准答案中找出关键得分点并分配较高的权重。(3)标准(学生)答案中代词消解,指代是当前的指示语与上文出现的短语(先行语)存在语义关联,指代消解的过程即是对当前指示语确定先行语的过程。即便在主观题的答案中,像其、它、这、后者、前者等这样的代词应用地也很普遍,一句话中出现了这些代词,如果不将其消解,而直接组配到句框架中,那么这个代词的含义就不太明确了,指的哪个对象也不清楚。如果标准答案或学生答案的句子框架中出现了代词,这样就无法进行句子框架的对比,即便可以也可能是错误的。(4)标准(学生)答案句框架的构建,在标准(学生)答案中,有一些句子是用来解释的,而有些句子才是关键的得分点,所以权重的分配是很重要的,关键的句框架权重势必会大些,而用来解释的句子或无关紧要的起连接作用的句子权重可以分配少一些。在6.2.1小节中本文给出了构建句框架以及给句框架分配权重的算法,即对句子进行句法分析进行事件抽取和实体关系抽取组成句框架。在以往的主观题自动阅卷系统中,都只是考虑学生答案和标准答案中的关键词或句子的相似度,没有考虑句子的权重问题。以结构化的句框架进行标准答案和学生答案的对比,没有切断句子的语义联系。(5)基于领域本体的词语相似度计算,判断一个学生答案与标准答案的相似度可以通过计算学生答案的句框架与标准答案句框架的相似度来完成,本文根据已经建立好的领域本体计算词语相似度,在此基础上,计算句框架相似度,从而得出学生分数。综上所述,本文通过主观题问句的处理提取参数、构建领域本体作为试题的学科系统知识、对标准答案和学生答案进行指代消解、构建句框架并利用领域本体对词语进行相似度计算来构建一种新的主观题自动阅卷系统。与以往的主观题自动阅卷系统相比,本系统尽可能地让计算机以理解“语义”为核心,对老师考察知识点“意图”进行分析,保持标准答案和学生答案的语义联系,评分准确率有所提高。
下载 cnki {{liketext}}
©2018 - iData {{ message }} 关闭