CN114169310B - 一种阅读理解答案生成方法及装置 - Google Patents

一种阅读理解答案生成方法及装置 Download PDF

Info

Publication number
CN114169310B
CN114169310B CN202111433842.2A CN202111433842A CN114169310B CN 114169310 B CN114169310 B CN 114169310B CN 202111433842 A CN202111433842 A CN 202111433842A CN 114169310 B CN114169310 B CN 114169310B
Authority
CN
China
Prior art keywords
answer
processed
core
segment
answer segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111433842.2A
Other languages
English (en)
Other versions
CN114169310A (zh
Inventor
请求不公布姓名
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PEOPLE'S BANK OF CHINA NATIONAL CLEARING CENTER
Original Assignee
PEOPLE'S BANK OF CHINA NATIONAL CLEARING CENTER
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PEOPLE'S BANK OF CHINA NATIONAL CLEARING CENTER filed Critical PEOPLE'S BANK OF CHINA NATIONAL CLEARING CENTER
Priority to CN202111433842.2A priority Critical patent/CN114169310B/zh
Publication of CN114169310A publication Critical patent/CN114169310A/zh
Application granted granted Critical
Publication of CN114169310B publication Critical patent/CN114169310B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种阅读理解答案生成方法及装置,所述方法包括:根据待处理问题、法规以及核心答案预测模型,获得所述待处理问题对应的核心答案片段以及所述核心答案片段所属的条款;其中,所述核心答案预测模型是预先获得的;从所述核心答案片段所属的条款中抽取与所述核心答案片段关联的条件语句;根据与所述核心答案片段关联的条件语句,获得所述待处理问题的补充答案片段;根据所述待处理问题对应的核心答案片段和补充答案片段以及所述核心答案片段关联的条件语句,获得所述待处理问题对应的最终答案。所述装置用于执行上述方法。本发明实施例提供的阅读理解答案生成方法及装置,提高了对待处理问题回答的准确性。

Description

一种阅读理解答案生成方法及装置
技术领域
本发明涉及自然语言处理技术领域,具体涉及一种阅读理解答案生成方法及装置。
背景技术
机器阅读理解是自然语言处理领域的研究热点之一。近年来,随着深度学习技术的发展,机器阅读理解受到工业界和学术界越来越广泛的关注,在文本问答、信息抽取、对话系统等各种场景中具有极强的应用价值。
现有技术中的阅读理解答案生成方法主要是找出和问题紧密关联的文本片段作为答案,例如对于输入问题“什么算旷工?”,现有阅读理解模型返回的答案通常是“未在岗期间均按旷工论处”,对于法律法规数据而言,这种答案缺少法律法规的严谨性和语义完整性,不够准确。因此,如何提出一种阅读理解答案生成方法,能够更准确地获得法规阅读理解问题的答案成为本领域需要解决的重要课题。
发明内容
针对现有技术中的问题,本发明实施例提供一种阅读理解答案生成方法及装置,能够至少部分地解决现有技术中存在的问题。
一方面,本发明提出一种阅读理解答案生成方法,包括:
根据待处理问题、法规以及核心答案预测模型,获得所述待处理问题对应的核心答案片段以及所述核心答案片段所属的条款;其中,所述核心答案预测模型是预先获得的;
从所述核心答案片段所属的条款中抽取与所述核心答案片段关联的条件语句;
根据与所述核心答案片段关联的条件语句,获得所述待处理问题的补充答案片段;
根据所述待处理问题对应的核心答案片段和补充答案片段以及所述核心答案片段关联的条件语句,获得所述待处理问题对应的最终答案。
另一方面,本发明提供一种阅读理解答案生成装置,包括:
第一获得单元,用于根据待处理问题、法规以及核心答案预测模型,获得所述待处理问题对应的核心答案片段以及所述核心答案片段所属的条款;其中,所述核心答案预测模型是预先获得的;
抽取单元,用于从所述核心答案片段所属的条款中抽取与所述核心答案片段关联的条件语句;
第二获得单元,用于根据与所述核心答案片段关联的条件语句,获得所述待处理问题的补充答案片段;
第三获得单元,用于根据所述待处理问题对应的核心答案片段和补充答案片段以及所述核心答案片段关联的条件语句,获得所述待处理问题对应的最终答案。
再一方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一实施例所述阅读理解答案生成方法的步骤。
又一方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一实施例所述阅读理解答案生成方法的步骤。
本发明实施例提供的阅读理解答案生成方法及装置,能够根据待处理问题、法规以及核心答案预测模型,获得待处理问题对应的核心答案片段以及核心答案片段所属的条款,从核心答案片段所属的条款中抽取与核心答案片段关联的条件语句,根据与核心答案片段关联的条件语句,获得待处理问题的补充答案片段,根据待处理问题对应的核心答案片段和补充答案片段以及核心答案片段关联的条件语句,获得待处理问题对应的最终答案,提高了对待处理问题回答的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明一实施例提供的阅读理解答案生成方法的流程示意图。
图2是本发明另一实施例提供的阅读理解答案生成方法的流程示意图。
图3是本发明一实施例提供的阅读理解答案生成装置的结构示意图。
图4是本发明另一实施例提供的阅读理解答案生成装置的结构示意图。
图5是本发明再一实施例提供的阅读理解答案生成装置的结构示意图。
图6是本发明又一实施例提供的阅读理解答案生成装置的结构示意图。
图7是本发明一实施例提供的电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
为了便于理解本申请提供的技术方案,下面先对本申请技术方案的相关内容进行说明。行业法规和管理条例等法规文本篇幅较长,文本陈述复杂、条款之间逻辑关系复杂,上下文之间有很强的语义约束关系,很多条款的执行都是有一定的约束和执行条件的。本发明实施例提供的阅读理解答案生成方法,在法规问题解答中找出相关语境用语约束,通过多文本片段整合,形成具有完整语义约束的最终答案,避免断章取义,以偏概全,提高了法规阅读理解问题的答案的准确性。
下面以服务器作为执行主体为例来说明本发明实施例提供的阅读理解答案生成方法的具体实现过程,可理解的是本发明实施例提供的阅读理解答案生成方法的执行主体包括但不限于服务器。
图1是本发明一实施例提供的阅读理解答案生成方法的流程示意图,如图1所示,本发明实施例提供的阅读理解答案生成方法,包括:
S101、根据待处理问题、法规以及核心答案预测模型,获得所述待处理问题对应的核心答案片段以及所述核心答案片段所属的条款;其中,所述核心答案预测模型是预先获得的;
具体地,服务器在接收到待处理问题之后,可以根据所述待处理问题、法规和核心答案预测模型,获得所述待处理问题对应的核心答案片段。所述服务器在获得所述待处理问题对应的核心答案片段之后,还可以获得所述核心答案片段所属的条款。其中,所述法规是行业法规、公司管理条例等,包括各个条款,根据实际需要进行设置,本发明实施例不做限定。所述核心答案预测模型是预先获得的。所述核心答案片段可以为一段话。
例如,对于待处理问题:“什么情况算旷工”,所述服务器根据上述待处理问题,相关法规以及核心答案预测模型,可以获得上述待处理问题对应的核心答案片段为:未在岗期间均按旷工论处。
S102、从所述核心答案片段所属的条款中抽取与所述核心答案片段关联的条件语句;
具体地,所述服务器可以通过句法分析器分析所述核心答案片段与所述核心答案片段所属的条款中每个句子之间是否存在条件约束语义关系,如果存在句子与所述核心答案片段存在条件语义关系,那么从所述核心答案片段所属的条款抽取与所述核心答案片段关联的条件语句。可理解的是,如果没能抽取到与所述核心答案片段关联的条件语句,那么流程结束。
S103、根据与所述核心答案片段关联的条件语句,获得所述待处理问题的补充答案片段;
具体地,所述服务器在获得与所述核心答案片段关联的条件语句之后,可以根据与所述核心答案片段关联的条件语句,获得所述待处理问题的补充答案片段。
例如,对于存在共指关系、语义蕴含关系等隐含关系的与所述核心答案片段关联的条件语句,可以通过隐含关系描述和对应的具体约束陈述之间的关系,获取对应的具体约束陈述作为所述待处理问题的补充答案片段。比如对于待处理问题“什么情况算旷工”对应的核心答案片段“未在岗期间均按旷工论处”,抽取与“未在岗期间均按旷工论处”关联的条件语句为:“员工有下列情况之一的”,上述条件语句存在“下列情况”这种隐含关系描述,通过共指关系抽取方法,可以获得“下列情况”对应的具体约束陈述为:“(1)超出规定的迟到、早退时间未到岗或提前离岗的;(2)未经批准擅离工作岗位的;(3)骗取、伪造、篡改、涂改休假证明的;(4)不服从公司合法的工作安排及调动,未按规定的时间到新岗位报到的”。所述服务器会获取“下列情况”对应的具体约束陈述作为“什么情况算旷工”对应的补充答案片段。
例如,对于存在外部条款的与所述核心答案片段关联的条件语句,可以通过外部条款获取外部条款对应的条款陈述作为所述待处理问题的补充答案片段。比如,对于待处理问题“违规贷款或担保的应受什么处罚”,获得对应的核心答案片段为“对负有直接责任的主管人员和其他直接责任人员,依法给予行政处分;构成犯罪的,依法追究刑事责任;造成损失的,应当承担部分或者全部赔偿责任”,抽取与上述核心答案片段关联的条件语句为“违反本法第三十条的规定提供贷款或者担保的”,上述条件语句存在第三十条,上述核心答案片段以及上述条件语句都在第四十九条,因此,第三十条为外部条款,所述服务器可以获取第三十条对应的条款陈述,作为“违规贷款或担保的应受什么处罚”对应的补充答案片段。
S104、根据所述待处理问题对应的核心答案片段和补充答案片段以及所述核心答案片段关联的条件语句,获得所述待处理问题对应的最终答案。
具体地,所述服务器在获得所述待处理问题对应补充答案陈述之后,可以将所述待处理问题对应的核心答案片段、所述待处理问题对应的补充答案片段以及所述核心答案片段关联的条件语句进行拼接,获得所述待处理问题对应的最终答案。
例如,对于待处理问题:“什么情况算旷工”。获得对应的核心答案片段为:“未在岗期间均按旷工论处”,获得上述核心答案片段关联的条件语句为:“员工有下列情况之一的”。获得上述待处理问题对应的补充答案片段为:“(1)超出规定的迟到、早退时间未到岗或提前离岗的;(2)未经批准擅离工作岗位的;(3)骗取、伪造、篡改、涂改休假证明的;(4)不服从公司合法的工作安排及调动,未按规定的时间到新岗位报到的”。所述服务器将上述待处理问题对应的核心答案片段、上述核心答案片段关联的条件语句以及补充答案片段拼接如下:
员工有下列情况之一的,未在岗期间均按旷工论处。
(1)超出规定的迟到、早退时间未到岗或提前离岗的;
(2)未经批准擅离工作岗位的;
(3)骗取、伪造、篡改、涂改休假证明的;
(4)不服从公司合法的工作安排及调动,未按规定的时间到新岗位报到的。
所述服务器将拼接的结果作为上述待处理问题的最终答案,对比上述待处理问题的最终答案和核心答案片段,明显可以看出最终答案对上述待处理问题的回答更加准确。
本发明实施例提供的阅读理解答案生成方法,能够根据待处理问题、法规以及核心答案预测模型,获得待处理问题对应的核心答案片段以及核心答案片段所属的条款,从核心答案片段所属的条款中抽取与核心答案片段关联的条件语句,根据与核心答案片段关联的条件语句,获得待处理问题的补充答案片段,根据待处理问题对应的核心答案片段和补充答案片段以及核心答案片段关联的条件语句,获得待处理问题对应的最终答案,提高了对待处理问题回答的准确性。
在上述各实施例的基础上,进一步地,所述根据与所述核心答案片段关联的条件语句,获得所述待处理问题的补充答案片段包括:
若判断获知与所述核心答案片段关联的条件语句中包括指代要素,则基于所述指代要素获取所述指代要素对应的陈述作为所述补充答案片段。
具体地,所述服务器在获得与所述核心答案片段关联的条件语句之后,会判断所述条件语句中是否包括指代要素,如果所述条件语句中包括指代要素,那么基于所述指代要素获取所述指代要素对应的陈述作为所述补充答案片段。所述指代要素包括但不限于下列情况、以下情形、下述条件等指代词,根据实际经验进行设置,本发明实施例不做限定。
例如,可以设置指代要素库,所述指代要素库包括各个指代要素。所述服务器根据所述指代要素库判断所述条件语句中是否包括指代要素库中的指代要素,如果所述条件语句中包括指代要素,那么可以将指代要素与所述核心答案片段所属的条款输入到共指关联模型中,获得所述指代要素对应的陈述。其中,共指关联模型可以通过共指关系标注训练数据以及机器学习算法训练获得,共指关联模型的具体训练过程为现有技术,此处不进行赘述。
例如,对于待处理问题“什么情况算旷工”对应的核心答案片段“未在岗期间均按旷工论处”,抽取与“未在岗期间均按旷工论处”关联的条件语句为:“员工有下列情况之一的”,上述条件语句包括指代要素“下列情况”,将“下列情况”和“下列清情况”所属的条款内容输入到共指关联模型,可以获得“下列情况”对应的陈述为:“(1)超出规定的迟到、早退时间未到岗或提前离岗的;(2)未经批准擅离工作岗位的;(3)骗取、伪造、篡改、涂改休假证明的;(4)不服从公司合法的工作安排及调动,未按规定的时间到新岗位报到的”。所述服务器会将“下列情况”对应的陈述作为“什么情况算旷工”对应的补充答案片段。
在上述各实施例的基础上,进一步地,所述根据与所述核心答案片段关联的条件语句,获得所述待处理问题的补充答案片段包括:
若判断获知与所述核心答案片段关联的条件语句中包括外部条款,则根据所述外部条款获取所述外部条款对应的条款内容作为所述补充答案片段。
具体地,所述服务器从所述核心答案片段关联的条件语句中获取条款编号,然后判断条款编号与所述核心答案片段关联的条件语句所属的条款的条款编号是否相同,如果不相同,那么可以确定与所述核心答案片段关联的条件语句中包括外部条款。所述服务器可以根据从所述核心答案片段关联的条件语句中获取的外部条款的条款编号,获取外部条款对应的条款内容作为所述待处理问题对应的补充答案片段。其中,所述法规包括的条款与条款编号一一对应。
例如,对于待处理问题“违规贷款或担保的应受什么处罚”,获得对应的核心答案片段为“对负有直接责任的主管人员和其他直接责任人员,依法给予行政处分;构成犯罪的,依法追究刑事责任;造成损失的,应当承担部分或者全部赔偿责任”,抽取与上述核心答案片段关联的条件语句为“违反本法第三十条的规定提供贷款或者担保的”,上述条件语句存在条款编号第三十条,上述核心答案片段以及上述条件语句所属条款的条款编号为第四十九条,因此,第三十条为外部条款,所述服务器可以获取第三十条对应的条款陈述,作为“违规贷款或担保的应受什么处罚”对应的补充答案片段。
在上述各实施例的基础上,进一步地,本发明实施例提供的阅读理解答案生成方法还包括:
根据所述核心答案片段、所述核心答案片段所属的条款以及文本蕴含检测模型,获得具有语义蕴含关系的语句作为所述待处理问题的补充答案片段;其中,所述文本蕴含检测模型是预先获得的。
具体地,所述服务器将所述核心答案片段和所述核心答案片段所属的条款的每个句子输入到文本蕴含检测模型中,所述文本蕴含检测模型会识别所述核心答案片段所属的条款中的各个句子与所述核心答案片段之间是否存在语义蕴含关系,与所述核心答案片段之间具有语义蕴含关系的语句作为所述待处理问题的补充答案片段。其中,所述文本蕴含检测模型是预先获得的,可以通过句子蕴含关系训练数据集和深度学习算法训练获得。
其中,文本语义蕴含关系的检测可以看成一个分类问题,给定输入的一对句子,可以根据所述文本蕴含检测模型判断两个句子之间是否有语义蕴含关系。在条款语义蕴含关系检测中,法规(领域)术语根据法规知识图谱进行语义编码和语义相似度计算。法规知识图谱由常用法律术语概念结点和法规中所定义的特定术语概念结点构成。比如,对于网银贷记业务,与网银汇兑、网络购物、贷款还款、实时代付、交易退款、慈善捐款之间存在语义蕴含关系。对于跨行参与者,与直接接入银行机构、直接接入非金融机构、代理接入银行机构之间存在语义蕴含关系。
在上述各实施例的基础上,进一步地,本发明实施例提供的阅读理解答案生成方法还包括:
若所述待处理问题的补充答案片段具有多种来源,则对多种来源的补充答案片段进行冗余处理。
具体地,可以通过与所述核心答案片段关联的条件语句中包括指代要素,获得所述待处理问题的补充答案片段,可以通过与所述核心答案片段关联的条件语句中包括外部条款,获得所述待处理问题的补充答案片段,可以根据所述核心答案片段、所述核心答案片段所属的条款以及文本蕴含检测模型获得所述待处理问题的补充答案片段。所述服务器可以通过上述不同的方式获得所述待处理问题的补充答案片段,如果所述待处理问题的补充答案片段是通过两种以及两种以上的方式获得的,那么所述待处理问题的补充答案片段具有多种来源,为了避免补充答案片段的重复,可以对多种来源的补充答案片段进行冗余处理,即将不同来源的补充答案片段分别转换为特征向量,然后进行相似度计算,获得两个不同来源的补充答案片段的相似度值,如果相似度值大于阈值,说明两个不同来源的补充答案片段重复,可以只保留其中一个补充答案片段。其中,所述阈值根据实际经验进行设置,本发明实施例不做限定。
图2是本发明另一实施例提供的阅读理解答案生成方法的流程示意图,如图2所示,在上述各实施例的基础上,进一步地,所述根据待处理问题、法规以及核心答案预测模型,获得所述待处理问题对应的核心答案片段以及所述核心答案片段所属的条款包括:
S201、分别对所述待处理问题和所述法规进行语义要素抽取,获得所述待处理问题对应的语义特征和所述法规中每个条款对应的语义特征;
具体地,所述服务器可以对所述待处理问题进行分词和词性标注,然后将经过分词和词性标注的待处理问题分别输入到命名实体识别模型和领域术语抽取模型中,获得所述待处理问题对应的语义特征。所述可以对所述法规中的各个条款进行分词和词性标注,然后将经过分词和词性标注的每个条款分别输入到所述命名实体识别模型和领域术语抽取模型中,可以获得所述法规中每个条款对应的语义特征。所述语义特征可以包括通用词、命名实体和领域术语。
其中,命名实体识别模型和领域术语抽取模型是预先训练获得的。命名实体识别模型用于识别时间、地点、人物、组织结构、金钱、数量等命名实体。领域术语抽取模型用于识别法律术语、金融领域术语等专业术语。
S202、对所述待处理问题对应的语义特征进行特征编码,获得所述待处理问题对应的语义特征表示;并对所述法规中每个条款对应的语义特征进行特征编码,获得每个条款对应的语义特征表示;
具体地,所述服务器会对所述待处理问题对应的语义特征进行特征编码,即对所述待处理问题的分词、命名实体、领域术语等词汇特征,上述词汇特征在所述待处理问题中的位置以及上述词汇特征属于所述待处理问题进行编码,获得所述待处理问题对应的语义特征表示。同理,所述服务器对所述法规中每个条款对应的语义特征进行特征编码,获得每个条款对应的语义特征表示。
S203、根据所述待处理问题对应的语义特征表示和每个条款对应的语义特征表示进行关联分析,获得所述待处理问题与每个条款的语义关联;
具体地,所述服务器可以通过注意力机制,根据所述待处理问题对应的语义特征表示和每个条款对应的语义特征表示进行关联分析,获得所述待处理问题与每个条款的语义关联。其中,对问题和条款进行关联分析的具体过程为现有技术,此处不进行赘述。
例如,通过注意力计算可以获取条款和待处理问题之间的语义关联。
S204、根据所述待处理问题与每个条款的语义关联以及所述核心答案预测模型,获得所述待处理问题对应的核心答案片段。
具体地,所述服务器将所述待处理问题与每个条款的语义关联分别输入到所述核心答案预测模型中,所述核心答案预测模型会预测核心答案片段在所属条款中的开始位置和结束位置,抽取条款中语义关联最强的一个连续文本片段作为核心答案片段。所述核心答案预测模型可以为序列预测模型或者边界预测模型,可以通过大量标注训练数据以及深度学习算法进行模型训练获得。
图3是本发明一实施例提供的阅读理解答案生成装置的结构示意图,如图3所示,本发明实施例提供的一种阅读理解答案生成装置包括第一获得单元301、抽取单元302、第二获得单元303和第三获得单元304,其中:
第一获得单元301用于根据待处理问题、法规以及核心答案预测模型,获得所述待处理问题对应的核心答案片段以及所述核心答案片段所属的条款;其中,所述核心答案预测模型是预先获得的;抽取单元302用于从所述核心答案片段所属的条款中抽取与所述核心答案片段关联的条件语句;第二获得单元303用于根据与所述核心答案片段关联的条件语句,获得所述待处理问题的补充答案片段;第三获得单元304用于根据所述待处理问题对应的核心答案片段和补充答案片段以及所述核心答案片段关联的条件语句,获得所述待处理问题对应的最终答案。
在接收到待处理问题之后,第一获得单元301可以根据所述待处理问题、法规和核心答案预测模型,获得所述待处理问题对应的核心答案片段。所述服务器在获得所述待处理问题对应的核心答案片段之后,还可以获得所述核心答案片段所属的条款。其中,所述法规是行业法规、公司管理条例等,包括各个条款,根据实际需要进行设置,本发明实施例不做限定。所述核心答案预测模型是预先获得的。所述核心答案片段可以为一段话。
抽取单元302可以通过句法分析器分析所述核心答案片段与所述核心答案片段所属的条款中每个句子之间是否存在条件约束语义关系,如果存在句子与所述核心答案片段存在条件语义关系,那么从所述核心答案片段所属的条款抽取与所述核心答案片段关联的条件语句。可理解的是,如果没能抽取到与所述核心答案片段关联的条件语句,那么流程结束。
在获得与所述核心答案片段关联的条件语句之后,第二获得单元303可以根据与所述核心答案片段关联的条件语句,获得所述待处理问题的补充答案片段。
在获得所述待处理问题对应补充答案陈述之后,第三获得单元304可以将所述待处理问题对应的核心答案片段、所述待处理问题对应的补充答案片段以及所述核心答案片段关联的条件语句进行拼接,获得所述待处理问题对应的最终答案。
本发明实施例提供的阅读理解答案生成装置,能够根据待处理问题、法规以及核心答案预测模型,获得待处理问题对应的核心答案片段以及核心答案片段所属的条款,从核心答案片段所属的条款中抽取与核心答案片段关联的条件语句,根据与核心答案片段关联的条件语句,获得待处理问题的补充答案片段,根据待处理问题对应的核心答案片段和补充答案片段以及核心答案片段关联的条件语句,获得待处理问题对应的最终答案,提高了对待处理问题回答的准确性。
在上述各实施例的基础上,进一步地,第二获得单元303具体用于:
若判断获知与所述核心答案片段关联的条件语句中包括指代要素,则基于所述指代要素获取所述指代要素对应的陈述作为所述补充答案片段。
在上述各实施例的基础上,进一步地,第二获得单元303具体用于:
若判断获知与所述核心答案片段关联的条件语句中包括外部条款,则根据所述外部条款获取所述外部条款对应的条款内容作为所述补充答案片段。
图4是本发明另一实施例提供的阅读理解答案生成装置的结构示意图,如图4所示,在上述各实施例的基础上,进一步地,本发明实施例提供的阅读理解答案生成装置还包括第四获得单元305,其中:
第四获得单元305用于根据所述核心答案片段、所述核心答案片段所属的条款以及文本蕴含检测模型,获得具有语义蕴含关系的语句作为所述待处理问题的补充答案片段;其中,所述文本蕴含检测模型是预先获得的。
图5是本发明再一实施例提供的阅读理解答案生成装置的结构示意图,如图5所示,在上述各实施例的基础上,进一步地,本发明实施例提供的阅读理解答案生成装置还包括冗余处理单元306,其中:
冗余处理单元306用于若所述待处理问题的补充答案片段具有多种来源,则对多种来源的补充答案片段进行冗余处理。
图6是本发明又一实施例提供的阅读理解答案生成装置的结构示意图,如图6所示,在上述各实施例的基础上,进一步地,第一获得单元301包括抽取子单元3011、特征编码子单元3012、关联分析子单元3013和获得子单元3014,其中:
抽取子单元3011用于分别对所述待处理问题和所述法规进行语义要素抽取,获得所述待处理问题对应的语义特征和所述法规中每个条款对应的语义特征;特征编码子单元3012用于对所述待处理问题对应的语义特征进行特征编码,获得所述待处理问题对应的语义特征表示;并对所述法规中每个条款对应的语义特征进行特征编码,获得每个条款对应的语义特征表示;关联分析子单元3013用于根据所述待处理问题对应的语义特征表示和每个条款对应的语义特征表示进行关联分析,获得所述待处理问题与每个条款的语义关联;获得子单元3014用于根据所述待处理问题与每个条款的语义关联以及所述核心答案预测模型,获得所述待处理问题对应的核心答案片段。
本发明实施例提供的装置的实施例具体可以用于执行上述各方法实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。
图7是本发明一实施例提供的电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)701、通信接口(Communications Interface)702、存储器(memory)703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信。处理器701可以调用存储器703中的逻辑指令,以执行如下方法:根据待处理问题、法规以及核心答案预测模型,获得所述待处理问题对应的核心答案片段以及所述核心答案片段所属的条款;其中,所述核心答案预测模型是预先获得的;从所述核心答案片段所属的条款中抽取与所述核心答案片段关联的条件语句;根据与所述核心答案片段关联的条件语句,获得所述待处理问题的补充答案片段;根据所述待处理问题对应的核心答案片段和补充答案片段以及所述核心答案片段关联的条件语句,获得所述待处理问题对应的最终答案。
此外,上述的存储器703中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:根据待处理问题、法规以及核心答案预测模型,获得所述待处理问题对应的核心答案片段以及所述核心答案片段所属的条款;其中,所述核心答案预测模型是预先获得的;从所述核心答案片段所属的条款中抽取与所述核心答案片段关联的条件语句;根据与所述核心答案片段关联的条件语句,获得所述待处理问题的补充答案片段;根据所述待处理问题对应的核心答案片段和补充答案片段以及所述核心答案片段关联的条件语句,获得所述待处理问题对应的最终答案。
本实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,所述计算机程序使所述计算机执行上述各方法实施例所提供的方法,例如包括:根据待处理问题、法规以及核心答案预测模型,获得所述待处理问题对应的核心答案片段以及所述核心答案片段所属的条款;其中,所述核心答案预测模型是预先获得的;从所述核心答案片段所属的条款中抽取与所述核心答案片段关联的条件语句;根据与所述核心答案片段关联的条件语句,获得所述待处理问题的补充答案片段;根据所述待处理问题对应的核心答案片段和补充答案片段以及所述核心答案片段关联的条件语句,获得所述待处理问题对应的最终答案。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在本说明书的描述中,参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种阅读理解答案生成方法,其特征在于,包括:
根据待处理问题、法规以及核心答案预测模型,获得所述待处理问题对应的核心答案片段以及所述核心答案片段所属的条款;其中,所述核心答案预测模型是预先获得的;
从所述核心答案片段所属的条款中抽取与所述核心答案片段关联的条件语句;
根据与所述核心答案片段关联的条件语句,获得所述待处理问题的补充答案片段;
根据所述待处理问题对应的核心答案片段和补充答案片段以及所述核心答案片段关联的条件语句,获得所述待处理问题对应的最终答案。
2.根据权利要求1所述的方法,其特征在于,所述根据与所述核心答案片段关联的条件语句,获得所述待处理问题的补充答案片段包括:
若判断获知与所述核心答案片段关联的条件语句中包括指代要素,则基于所述指代要素获取所述指代要素对应的陈述作为所述补充答案片段。
3.根据权利要求1所述的方法,其特征在于,所述根据与所述核心答案片段关联的条件语句,获得所述待处理问题的补充答案片段包括:
若判断获知与所述核心答案片段关联的条件语句中包括外部条款,则根据所述外部条款获取所述外部条款对应的条款内容作为所述补充答案片段。
4.根据权利要求1所述的方法,其特征在于,还包括:
根据所述核心答案片段、所述核心答案片段所属的条款以及文本蕴含检测模型,获得具有语义蕴含关系的语句作为所述待处理问题的补充答案片段;其中,所述文本蕴含检测模型是预先获得的。
5.根据权利要求1所述的方法,其特征在于,还包括:
若所述待处理问题的补充答案片段具有多种来源,则对多种来源的补充答案片段进行冗余处理。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述根据待处理问题、法规以及核心答案预测模型,获得所述待处理问题对应的核心答案片段以及所述核心答案片段所属的条款包括:
分别对所述待处理问题和所述法规进行语义要素抽取,获得所述待处理问题对应的语义特征和所述法规中每个条款对应的语义特征;
对所述待处理问题对应的语义特征进行特征编码,获得所述待处理问题对应的语义特征表示;并对所述法规中每个条款对应的语义特征进行特征编码,获得每个条款对应的语义特征表示;
根据所述待处理问题对应的语义特征表示和每个条款对应的语义特征表示进行关联分析,获得所述待处理问题与每个条款的语义关联;
根据所述待处理问题与每个条款的语义关联以及所述核心答案预测模型,获得所述待处理问题对应的核心答案片段。
7.一种阅读理解答案生成装置,其特征在于,包括:
第一获得单元,用于根据待处理问题、法规以及核心答案预测模型,获得所述待处理问题对应的核心答案片段以及所述核心答案片段所属的条款;其中,所述核心答案预测模型是预先获得的;
抽取单元,用于从所述核心答案片段所属的条款中抽取与所述核心答案片段关联的条件语句;
第二获得单元,用于根据与所述核心答案片段关联的条件语句,获得所述待处理问题的补充答案片段;
第三获得单元,用于根据所述待处理问题对应的核心答案片段和补充答案片段以及所述核心答案片段关联的条件语句,获得所述待处理问题对应的最终答案。
8.根据权利要求7所述的装置,其特征在于,所述第二获得单元具体用于:
若判断获知与所述核心答案片段关联的条件语句中包括指代要素,则基于所述指代要素获取所述指代要素对应的陈述作为所述补充答案片段。
9.根据权利要求7所述的装置,其特征在于,所述第二获得单元具体用于:
若判断获知与所述核心答案片段关联的条件语句中包括外部条款,则根据所述外部条款获取所述外部条款对应的条款内容作为所述补充答案片段。
10.根据权利要求7所述的装置,其特征在于,还包括:
第四获得单元,用于根据所述核心答案片段、所述核心答案片段所属的条款以及文本蕴含检测模型,获得具有语义蕴含关系的语句作为所述待处理问题的补充答案片段;其中,所述文本蕴含检测模型是预先获得的。
11.根据权利要求7所述的装置,其特征在于,还包括:
冗余处理单元,用于若所述待处理问题的补充答案片段具有多种来源,则对多种来源的补充答案片段进行冗余处理。
12.根据权利要求7至11任一项所述的装置,其特征在于,所述第一获得单元包括:
抽取子单元,用于分别对所述待处理问题和所述法规进行语义要素抽取,获得所述待处理问题对应的语义特征和所述法规中每个条款对应的语义特征;
特征编码子单元,用于对所述待处理问题对应的语义特征进行特征编码,获得所述待处理问题对应的语义特征表示;并对所述法规中每个条款对应的语义特征进行特征编码,获得每个条款对应的语义特征表示;
关联分析子单元,用于根据所述待处理问题对应的语义特征表示和每个条款对应的语义特征表示进行关联分析,获得所述待处理问题与每个条款的语义关联;
获得子单元,用于根据所述待处理问题与每个条款的语义关联以及所述核心答案预测模型,获得所述待处理问题对应的核心答案片段。
13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一项所述方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6任一项所述方法的步骤。
CN202111433842.2A 2021-11-29 2021-11-29 一种阅读理解答案生成方法及装置 Active CN114169310B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111433842.2A CN114169310B (zh) 2021-11-29 2021-11-29 一种阅读理解答案生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111433842.2A CN114169310B (zh) 2021-11-29 2021-11-29 一种阅读理解答案生成方法及装置

Publications (2)

Publication Number Publication Date
CN114169310A CN114169310A (zh) 2022-03-11
CN114169310B true CN114169310B (zh) 2024-06-18

Family

ID=80481576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111433842.2A Active CN114169310B (zh) 2021-11-29 2021-11-29 一种阅读理解答案生成方法及装置

Country Status (1)

Country Link
CN (1) CN114169310B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110377715A (zh) * 2019-07-23 2019-10-25 天津汇智星源信息技术有限公司 基于法律知识图谱的推理式精准智能问答方法
CN110750625A (zh) * 2018-07-04 2020-02-04 北京国双科技有限公司 司法问答方法及相关设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10990618B2 (en) * 2017-05-31 2021-04-27 Panasonic Intellectual Property Coproration Of America Computer-implemented method for question answering system
KR102600703B1 (ko) * 2019-11-08 2023-11-09 한국전자통신연구원 법령 분야 질의 응답 방법 및 장치
CN110765256B (zh) * 2019-12-24 2020-07-07 杭州实在智能科技有限公司 一种在线法律咨询自动回复的生成方法与设备
CN110765257B (zh) * 2019-12-30 2020-03-31 杭州识度科技有限公司 一种知识图谱驱动型的法律智能咨询系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110750625A (zh) * 2018-07-04 2020-02-04 北京国双科技有限公司 司法问答方法及相关设备
CN110377715A (zh) * 2019-07-23 2019-10-25 天津汇智星源信息技术有限公司 基于法律知识图谱的推理式精准智能问答方法

Also Published As

Publication number Publication date
CN114169310A (zh) 2022-03-11

Similar Documents

Publication Publication Date Title
CN111859960B (zh) 基于知识蒸馏的语义匹配方法、装置、计算机设备和介质
CN110704598A (zh) 一种语句信息的抽取方法、抽取装置及可读存储介质
CN110597964A (zh) 一种双录质检语义分析方法、装置及双录质检系统
CN113268610B (zh) 基于知识图谱的意图跳转方法、装置、设备及存储介质
CN111723569A (zh) 一种事件抽取方法、装置和计算机可读存储介质
CN109033427B (zh) 股票的筛选方法及装置、计算机设备及可读存储介质
CN111738018A (zh) 一种意图理解方法、装置、设备及存储介质
CN111782793A (zh) 智能客服处理方法和系统及设备
CN115840808A (zh) 科技项目咨询方法、装置、服务器及计算机可读存储介质
CN116680386A (zh) 基于多轮对话的答案预测方法和装置、设备、存储介质
CN116150367A (zh) 一种基于方面的情感分析方法及系统
CN115099233A (zh) 一种语义解析模型的构建方法、装置、电子设备及存储介质
CN109710756B (zh) 基于语义角色标注的文书体裁分类系统及方法
CN113011156A (zh) 审核文本的质检方法、装置、介质以及电子设备
CN114169310B (zh) 一种阅读理解答案生成方法及装置
CN116738974A (zh) 一种基于泛化因果网络的语言模型生成方法、设备及介质
CN115965030A (zh) 一种区域数据监测方法和系统
CN115859121A (zh) 文本处理模型训练方法及装置
Lee et al. Named-entity recognition using automatic construction of training data from social media messaging apps
CN116304014A (zh) 训练实体类型识别模型的方法、实体类型识别方法及装置
CN115563278A (zh) 一种句子文本的问题分类处理方法及装置
CN114842385A (zh) 学科教培视频审核方法、装置、设备及介质
CN113538002B (zh) 用于审核文本的方法和装置
CN114117047A (zh) 一种基于c4.5算法对非法语音进行分类的方法及系统
CN114282542A (zh) 网络舆情监控方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant