CN111309891B - 一种阅读机器人进行自动问答的系统及其应用方法 - Google Patents

一种阅读机器人进行自动问答的系统及其应用方法 Download PDF

Info

Publication number
CN111309891B
CN111309891B CN202010183798.3A CN202010183798A CN111309891B CN 111309891 B CN111309891 B CN 111309891B CN 202010183798 A CN202010183798 A CN 202010183798A CN 111309891 B CN111309891 B CN 111309891B
Authority
CN
China
Prior art keywords
sentence
question
sentences
paragraph
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010183798.3A
Other languages
English (en)
Other versions
CN111309891A (zh
Inventor
杨陟卓
李春转
张虎
钱揖丽
李茹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanxi University
Original Assignee
Shanxi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanxi University filed Critical Shanxi University
Priority to CN202010183798.3A priority Critical patent/CN111309891B/zh
Publication of CN111309891A publication Critical patent/CN111309891A/zh
Application granted granted Critical
Publication of CN111309891B publication Critical patent/CN111309891B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了阅读机器人进行自动问答的方法及系统,包括有题型分析模块、词语相似度匹配模块、段落主题句和作者观点句抽取模块以及答案句抽取模块,本发明首次提出根据概括性问答题特征,然后进行线性插值的方法来分析问题类型,有效地填补了仅根据问句分析问题类型的空白;本发明可以通过抽取段落主题句和作者观点句将一些与问句关键字和框架不匹配的答案候选句召回;本发明能够实现阅读理解中问答题目的智能解答,有效提高了自动问答的答题率;本发明提出的方法也可以应用在文本蕴含、自动文摘、以及复杂问题求解等自然语言处理任务中。

Description

一种阅读机器人进行自动问答的系统及其应用方法
技术领域
本发明涉及自然语言处理领域,尤其涉及阅读机器人进行自动问答的方法及系统。
背景技术
近年来问答技术研究受到了广泛的关注,目前发展比较成熟的问答系统有麻省理工大学人工智能实验室研发的Start、密歇根大学的AnswerBus、苹果公司研发的Siri和微软公司开发的Cotana。国内也推出一些以智能问答技术为核心的机器人,例如:微软的小冰、百度的小度等,但是基于阅读理解的问答研究还远远不足。
目前,主要有基于检索模型和基于深度学习两大研究方向。基于传统的统计特征的检索方法,主要借助WordNet、同义词词林等语义词典来获取与问句相似度较高的答案句,比如周艳平,李金鹏,蔡素.基于同义词词林的句子语义相似度方法及其在问答系统中的应用[J].计算机应用与软件,2019,36(8):65-68+81.提出一种基于同义词词林的句子语义相似度方法,通过对词形、词序、语义依存相似度加权结合获得句子之间的最终相似度。基于深度学习的方法,主要利用神经网络模型,对句子进行向量表示,比如DevlinJ,ChangMW,LeeK,etal.BERT:Pre-trainingofDeepBidirectionalTransformersforLanguageUnderstanding[C]//Proceedingsofthe2019ConferenceoftheNorthAmericanChapteroftheAssociationforComputationalLinguistics:HumanLanguageTechnologies,Volume1(LongandShortPapers).2019:4171-4186.该模型预先训练未标记文本的深层双向表示,只需一个额外的输出层,就可以对预先训练的BERT模型进行微调,以创建用于广泛任务(如问答和语言推理)的最新模型,而无需对特定任务的体系结构进行大量修改。
目前,基于检索模型和深度学习的方法在一般阅读理解问题上已经取得了很好的效果,但是在高考语文阅读理解题上的效果却不尽如人意,这是由于高考阅读理解问题更加复杂,需要对问题和背景材料进行深层次的语义理解和推理。此外基于深度学习的方法虽然可以自动学习特征,但是需要足够规模的数据进行训练。
发明内容
为解决现有技术的缺点和不足,提供阅读机器人进行自动问答的方法及系统,从而实现阅读理解中问答题目的智能解答,有效提高了自动问答的答题率。为实现本发明目的而提供的阅读机器人进行自动问答的方法及系统,包括有题型分析模块、词语相似度匹配模块、段落主题句和作者观点句抽取模块以及答案句抽取模块,所述题型分析模块,用于通过获取材料和问句信息,判别是否为概括型问答题;所述词语相似度匹配模块,用于获取材料各句子与问句的词语相似度匹配数;所述段落主题句和作者观点句抽取模块,用于通过识别段落主题句和作者观点句,生成与问句相关的内容要点以及作者的观点态度;所述答案句抽取模块,根据问答题类型采取不同策略抽取候选句,对候选句进行排序,最终选取排序靠前的候选句作为答案句,
应用所述一种阅读机器人进行自动问答的系统进行自动问答的系统的方法,包括有如下步骤:
第一步:获取阅读理解的背景材料与问句;
第二步:题型分析,包括有以下步骤:
S1:形式化处理,用于对问句和材料进行形式化处理;所述形式化处理,具体为:将背景材料按照所属材料、段落、句子进行形式化处理,即
Figure GDA0003532512470000031
其中di表示所属第i则材料,pj表示所属第j段落,sk表示所属第k句;对问句进行分词去停用词,得到问句关键词,即Q=<K1,K2,......,Km>,Ki表示第i个关键词;
S2:通过分析材料和问句信息,判别问题类型是否是概括型问答题,具体有如下几种方法:
方法一:通过问句类型,如果为抽象型问题,则符合概括型问答题的特征;
方法二:依据段落匹配数目:对问句与背景材料句子进行匹配,统计每段的匹配情况,如果匹配的段落数目超过预定的阈值,则符合概括型问答题的特征;
方法三:通过问句出处段句子数目:根据关键字匹配定位问句出处段,并统计该段的句子数目,如果超过预定的阈值,则符合概括型问答题的特征;
方法四:根据背景材料的段落和句子数目:若段落数或者句子数超过预定的阈值,则符合概括型问答题的特征;
方法五:将各个特征通过线性插值的方法进行计算,超过预定阈值,判断为概括型问答题,否则为其他类型问答题;
第三步:根据问题类型采取不同策略抽取候选句,具体为:如果该问答题是概括型问答题,利用词语相似度匹配、段落主题句和作者观点句的方法对材料中各句子进行加权计算,计算公式为:
S=λ1*ScoresumWord+λ2*Scoretopic+λ3*Scoreopinion
其中,λk为第k个维度的权重,k∈[1,K],且0≤λk≤1,
Figure GDA0003532512470000041
否则,利用词语相似度匹配的方法进行计算,其计算公式为:
Figure GDA0003532512470000042
然后根据各候选句的得分高低进行排序,最终选取排序的前六句作为答案句;
第四步:候选句排序,根据各候选句的得分高低进行排序;
第五步:输出排序的前六句作为答案句。
作为上述方案的进一步改进,所述词语相似度匹配具体为:对问句以及材料各句子Si进行关键词提取,然后融合Hownet和word2vec词向量,计算问句与材料各句子的词汇相似度ScoresumWord
作为上述方案的进一步改进,所述段落主题句和作者观点句的方法分别通过段落主题句抽取模块、作者观点句抽取模块实现,其中,段落主题句抽取模块,用于综合位置信息和句间语义相似性抽取段落主题句;作者观点句抽取模块,用于综合位置信息、句间语义相似性和基于提示性词的启发式规则抽取作者的观点态度句。
作为上述方案的进一步改进,所述段落主题句抽取模块需要综合位置信息和基于段落的句间语义相似性来获取,段落主题句是对段落内容的概括总结,是反映段落主旨的句子,分布在段落的开头或者结尾,
根据句子的位置信息对段落中的各句子计算公式为:
Figure GDA0003532512470000043
其中,i为句子编号,n为每段的总句数,
对于不同段落,材料的首段和尾段可以反映材料的主题,根据段落的位置对各段落的主题句的计算公式为:
Figure GDA0003532512470000051
其中,m为材料的总段落数,
基于段落的句间语义相似性:句子A的关键词为Ai,共p个,句子B的关键词为Bj,共q个,在计算句间相似度时,采用Hownet分别计算句子相似度,Ai,Bj这两个词基于Hownet的相似度为S(Ai,Bj),ai=max{S(Ai,B1),S(Ai,B2),…,S(Ai,Bq)},bj=max{S(Bj,A1),S(Bj,A2),…,S(Bj,Ap)},则基于Hownet的句子A、句子B的相似度为:
Figure GDA0003532512470000052
则基于段落的句子A语义相似性为:
Figure GDA0003532512470000053
其中,n为每段的总句数,
最终对上述两种因素进行加权,得到各个句子段落主题句计算公式:
Scoretopic=α*scoreloc+(1-α)*scoresim
其中,α表示段落主题句的权重。
作为上述方案的进一步改进,所述作者观点句表明作者在文中的观点态度,是对材料内容的总体把握,是整个篇章的主题,需要综合位置信息和基于段落的句间语义相似性和基于提示性词的启发式规则来获取:
位置信息:作者的观点分布在材料的尾段,同时根据尾段中句子的不同位置进行计算,记为scorei
句间语义相似性:为了避免只根据位置信息带来的主观性,在抽取尾段作者观点句时,进行句间语义相似度计算;
基于提示性词的启发式规则:根据句子是否包含提示性词抽取候选句,若包含scoreWord=1,否则scoreWord=0,
最后对上述三种因素进行加权,得到作者观点句计算公式:
Scoreopinion=β1*scorei+β2*scoresim+β3*scoreWord
其中,β1+β2+β3=1。
本发明的有益效果是:
与现有技术相比,本发明首次提出根据概括性问答题特征,然后进行线性插值的方法来分析问题类型,有效地填补了仅根据问句分析问题类型的空白;
本发明可以通过抽取段落主题句和作者观点句将一些与问句关键字和框架不匹配的答案候选句召回;
本发明能够实现阅读理解中问答题目的智能解答,有效提高了自动问答的答题率;
本发明提出的方法也可以应用在文本蕴含、自动文摘、以及复杂问题求解等自然语言处理任务中。
附图说明
以下结合附图对本发明的具体实施方式作进一步的详细说明,其中:
图1是本发明阅读机器人进行自动问答的系统流程图;
图2是是本发明阅读机器人进行自动问答方法的具体流程图;
图3是本发明中题型分析模块的具体流程图;
图4是本发明中词语相似度匹配模块的具体流程图;
图5是本发明中答案句抽取模块的具体流程图。
具体实施方式
如图1-图5所示,本发明提供的阅读机器人进行自动问答的方法及系统,一种阅读机器人进行自动问答的系统,包括有题型分析模块、词语相似度匹配模块、段落主题句和作者观点句抽取模块以及答案句抽取模块,所述题型分析模块,用于通过获取材料和问句信息,判别是否为概括型问答题;所述词语相似度匹配模块,用于获取材料各句子与问句的词语相似度匹配数;所述段落主题句和作者观点句抽取模块,用于通过识别段落主题句和作者观点句,生成与问句相关的内容要点以及作者的观点态度;所述答案句抽取模块,根据问答题类型采取不同策略抽取候选句,对候选句进行排序,最终选取排序靠前的候选句作为答案句,
应用所述一种阅读机器人进行自动问答的系统进行自动问答的系统的方法,包括有如下步骤:
第一步:获取阅读理解的背景材料与问句;
第二步:题型分析,包括有以下步骤:
S1:形式化处理,用于对问句和材料进行形式化处理;所述形式化处理,具体为:将背景材料按照所属材料、段落、句子进行形式化处理,即
Figure GDA0003532512470000071
其中di表示所属第i则材料,pj表示所属第j段落,sk表示所属第k句;对问句进行分词去停用词,得到问句关键词,即Q=<K1,K2,......,Km>,Ki表示第i个关键词;
S2:通过分析材料和问句信息,判别问题类型是否是概括型问答题,具体有如下几种方法:
方法一:通过问句类型,如果为抽象型问题,则符合概括型问答题的特征;
方法二:依据段落匹配数目:对问句与背景材料句子进行匹配,统计每段的匹配情况,如果匹配的段落数目超过预定的阈值,则符合概括型问答题的特征;
方法三:通过问句出处段句子数目:根据关键字匹配定位问句出处段,并统计该段的句子数目,如果超过预定的阈值,则符合概括型问答题的特征;
方法四:根据背景材料的段落和句子数目:若段落数或者句子数超过预定的阈值,则符合概括型问答题的特征;
方法五:将各个特征通过线性插值的方法进行计算,超过预定阈值,判断为概括型问答题,否则为其他类型问答题;
第三步:根据问题类型采取不同策略抽取候选句,具体为:如果该问答题是概括型问答题,利用词语相似度匹配、段落主题句和作者观点句的方法对材料中各句子进行加权计算,计算公式为:
S=λ1*ScoresumWord+λ2*Scoretopic+λ3*Scoreopinion
其中,λk为第k个维度的权重,k∈[1,K],且0≤λk≤1,
Figure GDA0003532512470000081
否则,利用词语相似度匹配的方法进行计算,其计算公式为:
Figure GDA0003532512470000082
然后根据各候选句的得分高低进行排序,最终选取排序的前六句作为答案句;
第四步:候选句排序,根据各候选句的得分高低进行排序;
第五步:输出排序的前六句作为答案句。
作为上述方案的进一步改进,所述词语相似度匹配具体为:对问句以及材料各句子Si进行关键词提取,然后融合Hownet和word2vec词向量,计算问句与材料各句子的词汇相似度ScoresumWord
作为上述方案的进一步改进,所述段落主题句和作者观点句的方法分别通过段落主题句抽取模块、作者观点句抽取模块实现,其中,段落主题句抽取模块,用于综合位置信息和句间语义相似性抽取段落主题句;作者观点句抽取模块,用于综合位置信息、句间语义相似性和基于提示性词的启发式规则抽取作者的观点态度句。
作为上述方案的进一步改进,所述段落主题句抽取模块需要综合位置信息和基于段落的句间语义相似性来获取,段落主题句是对段落内容的概括总结,是反映段落主旨的句子,分布在段落的开头或者结尾,
根据句子的位置信息对段落中的各句子计算公式为:
Figure GDA0003532512470000091
其中,i为句子编号,n为每段的总句数,
对于不同段落,材料的首段和尾段可以反映材料的主题,根据段落的位置对各段落的主题句的计算公式为:
Figure GDA0003532512470000092
其中,m为材料的总段落数,
基于段落的句间语义相似性:句子A的关键词为Ai,共p个,句子B的关键词为Bj,共q个,在计算句间相似度时,采用Hownet分别计算句子相似度,Ai,Bj这两个词基于Hownet的相似度为S(Ai,Bj),ai=max{S(Ai,B1),S(Ai,B2),…,S(Ai,Bq)},bj=max{S(Bj,A1),S(Bj,A2),…,S(Bj,Ap)},则基于Hownet的句子A、句子B的相似度为:
Figure GDA0003532512470000101
则基于段落的句子A语义相似性为:
Figure GDA0003532512470000102
其中,n为每段的总句数,
最终对上述两种因素进行加权,得到各个句子段落主题句计算公式:
Scoretopic=α*scoreloc+(1-α)*scoresim
其中,α表示段落主题句的权重。
作为上述方案的进一步改进,所述作者观点句表明作者在文中的观点态度,是对材料内容的总体把握,是整个篇章的主题,需要综合位置信息和基于段落的句间语义相似性和基于提示性词的启发式规则来获取:
位置信息:作者的观点分布在材料的尾段,同时根据尾段中句子的不同位置进行计算,记为scorei
句间语义相似性:为了避免只根据位置信息带来的主观性,在抽取尾段作者观点句时,进行句间语义相似度计算;
基于提示性词的启发式规则:根据句子是否包含提示性词抽取候选句,若包含scoreWord=1,否则scoreWord=0,提示性词示例如表1所示。
看来 由此可见 由此看来 可见 无论如何 不管怎样
综上 由上述可知 如上 总的来看 总的来说 总的说来
总之 总而言之 总体而言 首先 其次 表明
所以
表1提示性词示例
最后对上述三种因素进行加权,得到作者观点句计算公式:
Scoreopinion=β1*scorei+β2*scoresim+β3*scoreWord
其中,β1+β2+β3=1。
以上实施例不局限于该实施例自身的技术方案,实施例之间可以相互结合成新的实施例。以上实施例仅用以说明本发明的技术方案而并非对其进行限制,凡未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明技术方案的范围内。

Claims (5)

1.一种阅读机器人进行自动问答的系统,其特征在于:包括有题型分析模块、词语相似度匹配模块、段落主题句和作者观点句抽取模块以及答案句抽取模块,所述题型分析模块,用于通过获取材料和问句信息,判别是否为概括型问答题;所述词语相似度匹配模块,用于获取材料各句子与问句的词语相似度匹配数;所述段落主题句和作者观点句抽取模块,用于通过识别段落主题句和作者观点句,生成与问句相关的内容要点以及作者的观点态度;所述答案句抽取模块,根据问答题类型采取不同策略抽取候选句,对候选句进行排序,最终选取排序靠前的候选句作为答案句,
应用所述一种阅读机器人进行自动问答的系统进行自动问答的系统的方法,包括有如下步骤:
第一步:获取阅读理解的背景材料与问句;
第二步:题型分析,包括有以下步骤:
S1:形式化处理,用于对问句和材料进行形式化处理;所述形式化处理,具体为:将背景材料按照所属材料、段落、句子进行形式化处理,即
Figure FDA0003532512460000011
其中di表示所属第i则材料,pj表示所属第j段落,sk表示所属第k句;对问句进行分词去停用词,得到问句关键词,即Q=<K1,K2,......,Km>,Ki表示第i个关键词;
S2:通过分析材料和问句信息,判别问题类型是否是概括型问答题,具体有如下几种方法:
方法一:通过问句类型,如果为抽象型问题,则符合概括型问答题的特征;
方法二:依据段落匹配数目:对问句与背景材料句子进行匹配,统计每段的匹配情况,如果匹配的段落数目超过预定的阈值,则符合概括型问答题的特征;
方法三:通过问句出处段句子数目:根据关键字匹配定位问句出处段,并统计该段的句子数目,如果超过预定的阈值,则符合概括型问答题的特征;
方法四:根据背景材料的段落和句子数目:若段落数或者句子数超过预定的阈值,则符合概括型问答题的特征;
方法五:将各个特征通过线性插值的方法进行计算,超过预定阈值,判断为概括型问答题,否则为其他类型问答题;
第三步:根据问题类型采取不同策略抽取候选句,具体为:如果该问答题是概括型问答题,利用词语相似度匹配、段落主题句和作者观点句的方法对材料中各句子进行加权计算,计算公式为:
S=λ1*ScoresumWord+λ2*Scoretopic+λ3*Scoreopinion
其中,λk为第k个维度的权重,k∈[1,K],且0≤λk≤1,
Figure FDA0003532512460000021
否则,利用词语相似度匹配的方法进行计算,其计算公式为:
Figure FDA0003532512460000022
然后根据各候选句的得分高低进行排序,最终选取排序的前六句作为答案句;
第四步:候选句排序,根据各候选句的得分高低进行排序;
第五步:输出排序的前六句作为答案句。
2.一种应用权利要求1所述的阅读机器人进行自动问答的系统的方法,其特征在于:所述词语相似度匹配具体为:对问句以及材料各句子Si进行关键词提取,然后融合Hownet和word2vec词向量,计算问句与材料各句子的词汇相似度ScoresumWord
3.一种应用权利要求2所述的阅读机器人进行自动问答的系统的方法,其特征在于:所述段落主题句和作者观点句的方法分别通过段落主题句抽取模块、作者观点句抽取模块实现,其中,段落主题句抽取模块,用于综合位置信息和句间语义相似性抽取段落主题句;作者观点句抽取模块,用于综合位置信息、句间语义相似性和基于提示性词的启发式规则抽取作者的观点态度句。
4.一种应用权利要求3所述的阅读机器人进行自动问答的系统的方法,其特征在于:所述段落主题句抽取模块需要综合位置信息和基于段落的句间语义相似性来获取,段落主题句是对段落内容的概括总结,是反映段落主旨的句子,分布在段落的开头或者结尾,
根据句子的位置信息对段落中的各句子计算公式为:
Figure FDA0003532512460000031
其中,i为句子编号,n为每段的总句数,
对于不同段落,材料的首段和尾段可以反映材料的主题,根据段落的位置对各段落的主题句的计算公式为:
Figure FDA0003532512460000032
其中,m为材料的总段落数,
基于段落的句间语义相似性:句子A的关键词为Ai,共p个,句子B的关键词为Bj,共q个,在计算句间相似度时,采用Hownet分别计算句子相似度,Ai,Bj这两个词基于Hownet的相似度为S(Ai,Bj),ai=max{S(Ai,B1),S(Ai,B2),…,S(Ai,Bq)},bj=max{S(Bj,A1),S(Bj,A2),…,S(Bj,Ap)},则基于Hownet的句子A、句子B的相似度为:
Figure FDA0003532512460000041
则基于段落的句子A语义相似性为:
Figure FDA0003532512460000042
其中,n为每段的总句数,
最终对上述两种因素进行加权,得到各个句子段落主题句计算公式:
Scoretopic=α*scoreloc+(1-α)*scoresim
其中,α表示段落主题句的权重。
5.一种应用权利要求4所述的阅读机器人进行自动问答的系统的方法,其特征在于:所述作者观点句表明作者在文中的观点态度,是对材料内容的总体把握,是整个篇章的主题,需要综合位置信息和基于段落的句间语义相似性和基于提示性词的启发式规则来获取:
位置信息:作者的观点分布在材料的尾段,同时根据尾段中句子的不同位置进行计算,记为scorei
句间语义相似性:为了避免只根据位置信息带来的主观性,在抽取尾段作者观点句时,进行句间语义相似度计算;
基于提示性词的启发式规则:根据句子是否包含提示性词抽取候选句,若包含scoreWord=1,否则scoreWord=0,
最后对上述三种因素进行加权,得到作者观点句计算公式:
Scoreopinion=β1*scorei+β2*scoresim+β3*scoreWord
其中,β1+β2+β3=1。
CN202010183798.3A 2020-03-16 2020-03-16 一种阅读机器人进行自动问答的系统及其应用方法 Active CN111309891B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010183798.3A CN111309891B (zh) 2020-03-16 2020-03-16 一种阅读机器人进行自动问答的系统及其应用方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010183798.3A CN111309891B (zh) 2020-03-16 2020-03-16 一种阅读机器人进行自动问答的系统及其应用方法

Publications (2)

Publication Number Publication Date
CN111309891A CN111309891A (zh) 2020-06-19
CN111309891B true CN111309891B (zh) 2022-05-31

Family

ID=71149797

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010183798.3A Active CN111309891B (zh) 2020-03-16 2020-03-16 一种阅读机器人进行自动问答的系统及其应用方法

Country Status (1)

Country Link
CN (1) CN111309891B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111782759B (zh) * 2020-06-29 2024-04-19 数网金融有限公司 一种问答处理方法、装置及计算机可读存储介质
CN112084299B (zh) * 2020-08-05 2022-05-31 山西大学 一种基于bert语义表示的阅读理解自动问答方法
CN112163079B (zh) * 2020-09-30 2024-02-20 民生科技有限责任公司 一种基于阅读理解模型的智能对话方法及系统
CN113553402B (zh) * 2021-07-28 2022-09-20 山西大学 一种基于图神经网络的考试阅读理解自动问答方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832295A (zh) * 2017-11-08 2018-03-23 山西大学 阅读机器人的标题选择方法及系统
CN109033068A (zh) * 2018-06-14 2018-12-18 北京慧闻科技发展有限公司 基于注意力机制的用于阅读理解的方法、装置和电子设备
CN109740158A (zh) * 2018-12-29 2019-05-10 安徽省泰岳祥升软件有限公司 一种文本语义解析方法及装置
CN109948143A (zh) * 2019-01-25 2019-06-28 网经科技(苏州)有限公司 社区问答系统的答案抽取方法
CN110096698A (zh) * 2019-03-20 2019-08-06 中国地质大学(武汉) 一种考虑主题的机器阅读理解模型生成方法与系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10572595B2 (en) * 2017-04-13 2020-02-25 Baidu Usa Llc Global normalized reader systems and methods
US10997221B2 (en) * 2018-04-07 2021-05-04 Microsoft Technology Licensing, Llc Intelligent question answering using machine reading comprehension

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832295A (zh) * 2017-11-08 2018-03-23 山西大学 阅读机器人的标题选择方法及系统
CN109033068A (zh) * 2018-06-14 2018-12-18 北京慧闻科技发展有限公司 基于注意力机制的用于阅读理解的方法、装置和电子设备
CN109740158A (zh) * 2018-12-29 2019-05-10 安徽省泰岳祥升软件有限公司 一种文本语义解析方法及装置
CN109948143A (zh) * 2019-01-25 2019-06-28 网经科技(苏州)有限公司 社区问答系统的答案抽取方法
CN110096698A (zh) * 2019-03-20 2019-08-06 中国地质大学(武汉) 一种考虑主题的机器阅读理解模型生成方法与系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
An Auxiliary Scheme for Automatic Marking of Chinese Reading Comprehension;Caiyu Wang 等;《2019 10th International Conference on Information Technology in Medicine and Education (ITME)》;20200123;265-269 *
Named Entity Filters for Robust Machine Reading Comprehension;Yu-Yan Peng 等;《2018 Conference on Technologies and Applications of Artificial Intelligence (TAAI)》;20181227;181-184 *
基于CFN和篇章主题的阅读理解问答研究;李春转;《中国优秀硕士学位论文全文数据库 信息科技辑》;20211215(第12(2021)期);I138-754 *
散文阅读理解选择题解答研究;段庆龙;《中国优秀硕士学位论文全文数据库 信息科技辑》;20180315(第03(2018)期);I138-2356 *

Also Published As

Publication number Publication date
CN111309891A (zh) 2020-06-19

Similar Documents

Publication Publication Date Title
CN109213999B (zh) 一种主观题评分方法
CN111309891B (zh) 一种阅读机器人进行自动问答的系统及其应用方法
CN109190117B (zh) 一种基于词向量的短文本语义相似度计算方法
CN110427463B (zh) 搜索语句响应方法、装置及服务器和存储介质
CN104137102B (zh) 非事实型询问应答系统以及方法
CN106599032B (zh) 一种结合稀疏编码和结构感知机的文本事件抽取方法
CN108363743A (zh) 一种智能问题生成方法、装置和计算机可读存储介质
CN111326040B (zh) 语文阅读理解智能测试和智能辅导系统和方法
CN111694927B (zh) 一种基于改进词移距离算法的文档自动评阅方法
CN111858896B (zh) 一种基于深度学习的知识库问答方法
CN110705247B (zh) 基于χ2-C的文本相似度计算方法
CN111324692B (zh) 基于人工智能的主观题自动评分方法和装置
CN112966508A (zh) 一种通用自动术语提取方法
Kwankajornkiet et al. Automatic multiple-choice question generation from Thai text
CN112711666B (zh) 期货标签抽取方法及装置
CN113934814A (zh) 古诗文主观题自动评分方法
CN110059318B (zh) 基于维基百科与WordNet的论述题自动评卷方法
CN114579706A (zh) 一种基于bert神经网络和多任务学习的主观题自动评阅方法
CN114462389A (zh) 一种试卷主观题自动评分方法
Noiyoo et al. A Comparison of Machine Learning and Neural Network Algorithms for An Automated Thai Essay Quality Checking
Lee Natural Language Processing: A Textbook with Python Implementation
CN113254647A (zh) 课程质量分析方法、装置及系统
CN113011141A (zh) 佛经注解模型训练方法、佛经注解生成方法及相关设备
YIN A compression-based BiLSTM for treating teenagers’ depression chatbot
CN112579666A (zh) 智能问答系统和方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant