CN110377698B - 基于阅读理解的任务处理方法及装置、设备及可读介质 - Google Patents
基于阅读理解的任务处理方法及装置、设备及可读介质 Download PDFInfo
- Publication number
- CN110377698B CN110377698B CN201910537450.7A CN201910537450A CN110377698B CN 110377698 B CN110377698 B CN 110377698B CN 201910537450 A CN201910537450 A CN 201910537450A CN 110377698 B CN110377698 B CN 110377698B
- Authority
- CN
- China
- Prior art keywords
- option
- training
- options
- reading understanding
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于阅读理解的任务处理方法及装置、设备及可读介质。其方法包括:对于选择题任务中的多个选项中的各所述选项,分别基于题干和对应的所述选项,获取对应的基础知识;根据所述题干、各所述选项以及各所述选项对应的所述基础知识,采用预先训练的阅读理解模型,预测各所述选项作为答案的概率;根据各所述选项的概率,从所述多个选项中获取概率最大的所述选项作为所述选择题任务的答案。本发明的技术方案,由于参考了基础知识,能够有效地提高选择题任务完成的准确性。
Description
【技术领域】
本发明涉及计算机应用技术领域,尤其涉及一种基于阅读理解的任务处理方法及装置、设备及可读介质。
【背景技术】
基于自然语言理解(Natural Language Understanding;NLU)技术,可以为机器赋予人的思想,以使得机器更加人性化地执行任务。其作为是一种非常火的技术,受到各个领域的追捧研究。
现有技术中,可以通过NLU技术,实现基于阅读理解完成选择题的解答任务。例如,现有一种答题机器人,可以通过NLU技术对选择题的题干的上下文信息和每一个选项的信息进行分析,进而从多个选项中获取到一个与题干最匹配的答案。但是实际应用中,用户在处理选择题的任务时,不仅需要对题干进行阅读理解和分析,还需要结合用户自身掌握的该任务相关的基础知识,才能够从多个选项中获取到一个最佳的选项,完成任务。因而,可以发现,现有的答题机器人完成选择题的任务时,仅基于对选择题的题干的上下文信息和选项的信息进行分析,会导致任务完成的准确性较低。
【发明内容】
本发明提供了一种基于阅读理解的任务处理方法及装置、设备及可读介质,用于提高任务完成的准确性。
本发明提供一种基于阅读理解的任务处理方法,所述方法包括:
对于选择题任务中的多个选项中的各所述选项,分别基于题干和对应的所述选项,获取对应的基础知识;
根据所述题干、各所述选项以及各所述选项对应的所述基础知识,采用预先训练的阅读理解模型,预测各所述选项作为答案的概率;
根据各所述选项的概率,从所述多个选项中获取概率最大的所述选项作为所述选择题任务的答案。
本发明提供一种基于阅读理解的任务处理装置,所述装置包括:
基础知识获取模块,用于对于选择题任务中的多个选项中的各所述选项,分别基于题干和对应的所述选项,获取对应的基础知识;
预测模块,用于根据所述题干、各所述选项以及各所述选项对应的所述基础知识,采用预先训练的阅读理解模型,预测各所述选项作为答案的概率;
答案获取模块,用于根据各所述选项的概率,从所述多个选项中获取概率最大的所述选项作为所述选择题任务的答案。
本发明还提供一种计算机设备,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的基于阅读理解的任务处理方法。
本发明还提供一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的基于阅读理解的任务处理方法。
本发明的基于阅读理解的任务处理方法及装置、设备及可读介质,通过采用上述方案,对于选择题任务中的多个选项中的各选项,能够分别基于题干和对应的选项,获取对应的基础知识,然后根据题干、各选项以及各选项对应的基础知识,采用预先训练的阅读理解模型,预测各选项作为答案的概率;进而根据各选项的概率,从多个选项中获取概率最大的选项作为选择题任务的答案。本发明的技术方案,由于参考了基础知识,能够有效地提高选择题任务完成的准确性。
【附图说明】
图1为本发明的基于阅读理解的任务处理方法实施例一的流程图。
图2为本发明的基于阅读理解的任务处理方法实施例二的流程图。
图3为本发明的基于阅读理解的任务处理装置实施例一的结构图。
图4为本发明的基于阅读理解的任务处理装置实施例二的结构图。
图5为本发明的计算机设备实施例的结构图。
图6为本发明提供的一种计算机设备的示例图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
图1为本发明的基于阅读理解的任务处理方法实施例一的流程图。如图1所示,本实施例的基于阅读理解的任务处理方法,具体可以包括如下步骤:
S100、对于选择题任务中的多个选项中的各选项,分别基于题干和对应的选项,获取对应的基础知识;
本实施例的基于阅读理解的任务处理方法的执行主体为基于阅读理解的任务处理装置,该装置可以为一个独立的电子实体,或者也可以为采用软件集成的应用。该装置用于对选择题任务进行处理,以获取正确选项,因此本实施例的基于阅读理解的任务处理装置可以应用在答题机器人中,以完成选择题任务的解答。
本实施例的选择题任务中包括题干和多个选项,基于阅读理解的任务处理装置的任务就是基于题干,从多个选项中选择正确的选项。在任务处理过程中,为了拟合人的思维,本实施例中,首先需要获取每一个选项和题干对应的基础知识。需要说明的是,不同的选项结合题干获取的基础知识可能相同,也可能不同。本实施例的基础知识,可以认为是该选择题任务考察的知识点,该知识点,能够助于基于阅读理解的任务处理装置从多个选项中获取正确的选项,从而完成任务处理。
例如,本实施例的该步骤S100中,以一个选项为例,基于题干和对应的选项,获取对应的基础知识可以包括如下两种方式中的至少一种:
第一种方式:根据题干和对应的选项,从预先采集的知识库中检索出对应的背景文档;
本实施例的背景文档可以认为是该题干和对应的选项所考察的知识点。该背景文档可以为书籍中的一段文本信息;也可以为考试大纲中的知识点,等等。
另外,若将各个领域所覆盖的所有知识汇聚在同一知识库中,将会导致检索效率低下。考虑到不同领域的知识点交叉并不大,本实施例中可以按照不同领域采集不同的知识库。例如,对于某个领域的基于阅读理解的任务处理装置,处理该领域的选择题任务时,仅访问该领域的知识库即可,这样,能够提高背景文档的检索效率。例如,对于某个领域的职业考试,该领域的知识库中可以仅存储考试指南、考试大纲,或者也可以存储一些该领域的权威电子书籍等等。
本实施例中,根据题干和对应的选项,从预先采集的知识库中检索出对应的背景文档时,可以先采用NLU工具对题干和对应的选项进行解析处理,去除一些无意义的词语,获取其中的数个关键性的分词,然后以数个关键性分词为检索词,在知识库中检测与数个分词匹配度最高的背景文档。例如,若第一个背景文档中同时包括该数个分词,而第二个背景文档中仅包括数个分词中的部分,则第一个背景文档与数个分词的匹配度要高于第二个背景文档与数个分词的匹配度。或者实际应用中还可以为不同类型的分词设置不同的权重,进而基于权重计算匹配度。例如,匹配度可以表示为分词1*匹配度分值*权重+分词2*匹配度分值*权重+……分词n*匹配度分值*权重,n为数个分词的总数量,若分词与背景文档未匹配上,匹配度分值为0,若匹配上,匹配度分值为设置的满分,如1或者其他数值。或者实际应用中,还可以采用ElasticEearch(简称ES)检索的方式,从预先采集的知识库中检索出对应的背景文档,详细参考ES检索的相关方案,在此不再赘述。
第二种方式:根据题干和对应的选项,从知识图谱中获取相关的辅助信息。
本实施例的辅助信息没有背景文档全面,但也包括一些零散的知识点。这些零散的知识点也能够助于基于阅读理解的任务处理,完成选择题任务。
本实施例中,有些选择题任务仅仅基于背景文档便可以获取到相应的答案,而另一些选择题任务可能仅仅基于辅助信息便可以获取到相应的答案。而实际应用中,获取到的信息越多,任务完成的准确性就越高。因此,本实施例中,可以优选地同时获取背景文档和辅助信息,以有效地提高任务完成的准确性。
进一步可选地,本实施例中的第二种方式可以采用如下两种方式中的至少一种来获取:
A、采用NLU工具从题干和对应的选项中抽取数个分词;基于数个分词,从知识图谱中抽取相关的SPO信息;
本实施例的知识图谱,可以采用SPO三元组的形式存在。不同的领域,可以创建不同的知识图谱。例如,在医疗领域中,对应的医疗知识图谱中可以包括疾病、症状、体征、药品、检查、检验、手术、不良反应等等各种类型的实体。其中疾病可以为感冒、胃炎、呼吸系统感染等疾病的名称,具体可以为知识图谱中的主实体S。症状可以为脑袋疼、流鼻涕、打喷嚏等病人基于自己的体感描述的不舒服的装症状。而体征可以为医生基于病人描述的症状,总结的专业一点的体感特征,如头疼、流涕等等。检查可以为肠镜、胃镜、喉镜等等各种借助于医疗器械实现对病人身体的某部分进行的检查。其中检验可以为从病人的身体中采集其代谢物或者血液等等,通过一定的生化实验所进行的检验,如尿常规、血常规以及其他的血液检验、尿液检验或者粪便检验等等。手术可以为具体的手术内容,如开颅手术、开胸手术、截肢手术等等。其中症状、体征、药品、检查、检验、手术等可以为知识图谱中的属性关系P,而属性关系P具体指向的内容为客实体O。
上述以医疗领域的知识图谱为例,来描述知识图谱的结构。实际应用中,其他领域的知识图谱也可以基于领域的特色来构建,构建原理类似。总之,无论什么领域的知识图谱,都包括主实体-属性关系-客实体的三元组。
本实施例中,可以采用NLU工具从题干和对应的选项中抽取数个分词,然后可以采用知识图谱的链指技术,从数个分词中筛选出能够链指到知识图谱中的分词,即能够链指到知识图谱中的分词可以作为知识图谱中的实体。然后可以从知识图谱中获取作为实体的分词的所有相关的SPO信息,把这些都作为辅助信息。或者进一步地,抽取的数个分词中可能还包括属性关系P,此时还可以采用数个分词中的其他分词对获取的所有相关的SPO信息进行筛选,将筛选后的SPO信息作为辅助信息。也就是说,未筛选前,是基于所有的S获取的与S具有属性关系P的SPO信息,筛选后,是基于S和P获取的SPO信息。例如,某题干为“药品A的不良反应是什么?”,采用NLU工具从题干中抽取的分词可以有药品A、不良反应。选项A为“头痛”、选项B为“腹泻”、选项C为“关节痛”、选项D为血压升高,每个选项可以提取一个分词。这样,可以先利用药品A和不良反应从知识图谱中抽取相关的所有SPO信息。然后再用各个选项的分词作筛选,筛选后的SPO信息作为辅助信息。
B:采用预先训练的意图提取模型,提取题干的意图信息;基于题干的意图信息和对应的选项,从知识图谱中抽取相关的SPO信息。
本实施例中,还可以采用预先训练的意图提取模型,来提取题干的意图信息,即确定题干要考察的知识点是什么。本实施例的意图提取模型,可以从一句话中提取出数个描述这句话的意图的关键词。该意图提取模型在训练时,可以预先采集数条训练语句以及每条训练语句的真实意图;训练时,将各条训练语句输入至意图提取模型中,意图提取模型从该训练语句中提取出预测的意图,然后对比预测的意图与已知的真实意图是否一致,若不一致,调整该意图提取模型的参数,使得其预测的意图与已知的真实意图趋于一致。采用数条训练语句采用上述方式重复对意图提取模型进行训练,直到训练次数达到预设次数阈值,或者连续预设轮数的训练中预测的意图与已知的真实意图始终一致,此时,意图提取模型训练完毕,确定意图提取模型的参数,进而确定意图提取模型。
本实施例中,使用时,直接将题干输入至该意图提取模型中,该意图提取模型输出数个关键词构成的意图信息,然后采用意图信息和对应的选项,从知识图谱中抽取相关的SPO信息。其中意图信息中可以包括数个关键词,可以采用NLU工具从对应的选项中也抽取关键词,然后根据意图信息中的数个关键词和选项中的关键词一起从知识图谱中获取相关的所有SPO信息。若意图信息中的关键词和选项中的关键词都为知识图谱中的实体S,获取这些实体S的所有属性关系P相关的SPO信息。若意图信息中的关键词和选项中的关键词有些为知识图谱中的实体S,有些为知识图谱中的P,则可以参考S和P,一起获取相关的SPO信息。本实施例的抽取的SPO信息都可以作为该选择题任务的基础知识,以助于获取正确选项。
同理,利用本实施例的意图提取模型可以直接从“药品A的不良反应是什么?”中,抽取意图信息为考察“药品A的不良反应”;然后采用与上述方式A的类似方式,从知识图谱中抽取相关的SPO信息,在此不再赘述。
上述实施例仅为从知识图谱中抽取相关的SPO信息的一种实现方式,实际应用中,还可以采用其他方式来实现,在此不再一一举例赘述。
S101、根据题干、各选项以及各选项对应的基础知识,采用预先训练的阅读理解模型,预测各选项作为答案的概率;
S102、根据各选项的概率,从多个选项中获取概率最大的选项作为选择题任务的答案。
本实施例中,对于题干与每个选项的组合,都可以获取到对应的基础知识,然后结合该基础知识,采用训练好的阅读理解模型理解和分析题干以及各选项,进而预测出各选项作为答案的概率。并从多个选项中获取作为答案的概率最大的选项作为选择题任务的答案。
本实施例训练的阅读理解模型模拟了真实人的任务执行过程。真实人在做选择题任务时,不仅仅需要分析题干、和各个选项,还需要利用积累的基础知识,才能从各个选项中获取一个正确选项。因此,该阅读理解模型由于参考了基础知识,所以能够有效地提高选择正确选项的准确性,即能够有效地提高任务完成的准确性。
可选地,本实施例的阅读理解模型可以采用基于基于注意的多跳递归神经网络(Attention-based Multi-hop Recurrent Neural Network;AMRNN)模型来实现。
本实施例的基于阅读理解的任务处理方法可以分别应用在医疗领域、建筑领域、食品领域等等各种领域中,在每个领域中,预先采集该领域的知识库、创建该领域的知识图谱,训练相应的阅读理解模型,然后按照本实施例的任务处理方法,便可以实现任务处理。
本实施例的基于阅读理解的任务处理方法,通过采用上述方案,对于选择题任务中的多个选项中的各选项,能够分别基于题干和对应的选项,获取对应的基础知识,然后根据题干、各选项以及各选项对应的基础知识,采用预先训练的阅读理解模型,预测各选项作为答案的概率;进而根据各选项的概率,从多个选项中获取概率最大的选项作为选择题任务的答案。本实施例的技术方案,由于参考了基础知识,能够有效地提高选择题任务完成的准确性。
图2为本发明的基于阅读理解的任务处理方法实施例二的流程图。如图2所示,本实施例的基于阅读理解的任务处理方法,具体可以包括如下步骤:
S200、采集数条训练数据;各条训练数据对应一个训练选择题任务,训练选择题任务中包括训练题干、多个训练选项、正确选项以及训练题干和正确选项对应的基础知识;
本实施例的训练数据与上述图1所述的选择题任务的区别在于:标注了正确选项、及训练题干和正确选项对应基础知识。本实施例中,为了增加标注的正确性,可以由专家采用人工标注的方式来实现。
S201、采用数条训练数据,训练阅读理解模型。
例如,采用数条训练数据,训练阅读理解模型,具体可以包括如下步骤:
(a)对于各条训练数据,将对应的训练选择题任务中的训练题干、各选项以及基础知识,分别输入至阅读理解模型中;
(b)获取阅读理解模型分别预测的各选项作为答案的概率;
(c)根据各选项作为答案的概率,判断概率最大的选项是否为已知的正确选项;若不是,执行步骤(d);若是,执行步骤(e);
(d)调整阅读理解模型的参数,使得概率最大的选项为已知的正确选项;
(e)判断训练次数是否达到预设次数阈值,或者在连续预设次数的训练中,阅读理解模型预测的概率最大的选项是否始终与已知的正确选项一致;若是确定阅读理解模型的参数,进而确定阅读理解模型;否则返回步骤(a)继续训练。
本实施例的预设次数阈值可以根据实际需求来设置,例如可以为一百万或者几十万等具体数值,在此不做限定。本实施例的连续预设次数也可以根据实际需求来设置,例如可以为100、80或者其他数值,在此也不做限定。
本实施例中,采集的训练数据的条数可以达到百万级以上,训练数据的条数越多,训练的阅读理解模型越准确。实际应用中,按照上述方式训练时,如果训练数据足够的多,可以仅采用数条训练数据训练一轮。如果训练数据不够多,可以采用数条训练数据训练多轮。
实际应用中,本实施例的基于阅读理解的任务处理方法的执行主体可以与上述图1一致,由基于阅读理解的任务处理装置一起来实现。即由基于阅读理解的任务处理装置先对阅读理解模型进行训练,然后由基于阅读理解的任务处理装置基于训练好的阅读理解模型,采用上述图1所示实施例的技术方案,实现基于阅读理解的任务处理。
或者本实施例的基于阅读理解的任务处理方法的执行主体,也可以不同于上述图1所示实施例的执行主体,为一个独立于基于阅读理解的任务处理装置的阅读理解模型的训练装置。具体使用时,由阅读理解模型的训练装置先训练该阅读理解模型,然后基于阅读理解的任务处理装置在进行基于阅读理解的任务处理时,直接调用训练好的阅读理解模型,采用上述图1所示实施例的技术方案,实现基于阅读理解的任务处理。
本实施例的基于阅读理解的任务处理方法,训练的阅读理解模型参考了基础知识,能够使得训练后的阅读理解模型能够根据题干、各选项以及各选项对应的基础知识,获取正确的答案。因此,本实施例的技术方案,能够有助于提高选择题任务完成的准确性。
图3为本发明的基于阅读理解的任务处理装置实施例一的结构图。如图3所示,本实施例的基于阅读理解的任务处理装置,具体可以包括:
基础知识获取模块10用于对于选择题任务中的多个选项中的各选项,分别基于题干和对应的选项,获取对应的基础知识;
预测模块11用于根据题干、各选项以及基础知识获取模块10获取的各选项对应的基础知识,采用预先训练的阅读理解模型,预测各选项作为答案的概率;
答案获取模块12用于根据预测模块11预测的各选项的概率,从多个选项中获取概率最大的选项作为选择题任务的答案。
进一步可选地,基础知识获取模块10具体用于:
根据题干和对应的选项,从预先采集的知识库中检索出对应的背景文档;和/或
根据题干和对应的选项,从知识图谱中获取相关的辅助信息。
进一步可选地,基础知识获取模块10具体用于:
采用自然语音理解工具从题干和对应的选项中抽取数个分词;基于数个分词,从知识图谱中抽取相关的SPO信息;和/或
采用预先训练的意图提取模型,提取题干的意图信息;基于题干的意图信息和对应的选项,从知识图谱中抽取相关的SPO信息。
本实施例的基于阅读理解的任务处理装置,通过采用上述模块实现基于阅读理解的任务处理的实现原理以及技术效果与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
图4为本发明的基于阅读理解的任务处理装置实施例二的结构图。如图4所示,本实施例的基于阅读理解的任务处理装置,具体可以包括:
采集模块20用于采集数条训练数据,各训练数据对应一个训练选择题任务,训练选择题任务中包括训练题干、多个训练选项、正确选项以及训练题干和正确选项对应的基础知识;
训练模块21用于采用采集模块20采集的数条训练数据,训练阅读理解模型。
例如,进一步可选地,训练模块21具体用于:
对于各条训练数据,将对应的训练选择题任务中的训练题干、各选项以及基础知识,分别输入至阅读理解模型中;
获取阅读理解模型分别预测的各选项作为答案的概率;
根据各选项作为答案的概率,判断概率最大的选项是否为已知的正确选项;
若不是,调整阅读理解模型的参数,使得概率最大的选项为已知的正确选项;
按照上述方式,采用数条训练数据,重复对阅读理解模型进行训练,直到训练次数达到预设次数阈值或者在连续预设次数的训练中,阅读理解模型预测的概率最大的选项始终与已知的正确选项一致,确定阅读理解模型的参数,进而确定阅读理解模型。
本实施例的基于阅读理解的任务处理装置,可以独立存在,仅用于实现阅读理解模型的训练。也可以与上述图3中结合,形成本发明的一种可选实施例。在可选实施例中,该基于阅读理解的任务处理装置不仅用于实现阅读理解模型的训练,还用于基于训练好的阅读理解模型,实现基于阅读理解的任务处理。
本实施例的基于阅读理解的任务处理装置,通过采用上述模块实现基于阅读理解的任务处理的实现原理以及技术效果与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
图5为本发明的计算机设备实施例的结构图。如图5所示,本实施例的计算机设备,包括:一个或多个处理器30,以及存储器40,存储器40用于存储一个或多个程序,当存储器40中存储的一个或多个程序被一个或多个处理器30执行,使得一个或多个处理器30实现如上图1-图2所示实施例的基于阅读理解的任务处理方法。图5所示实施例中以包括多个处理器30为例。
例如,图6为本发明提供的一种计算机设备的示例图。图6示出了适于用来实现本发明实施方式的示例性计算机设备12a的框图。图6显示的计算机设备12a仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机设备12a以通用计算设备的形式表现。计算机设备12a的组件可以包括但不限于:一个或者多个处理器16a,系统存储器28a,连接不同系统组件(包括系统存储器28a和处理器16a)的总线18a。
总线18a表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设备12a典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12a访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28a可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30a和/或高速缓存存储器32a。计算机设备12a可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34a可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18a相连。系统存储器28a可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明上述图1-图4各实施例的功能。
具有一组(至少一个)程序模块42a的程序/实用工具40a,可以存储在例如系统存储器28a中,这样的程序模块42a包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42a通常执行本发明所描述的上述图1-图4各实施例中的功能和/或方法。
计算机设备12a也可以与一个或多个外部设备14a(例如键盘、指向设备、显示器24a等)通信,还可与一个或者多个使得用户能与该计算机设备12a交互的设备通信,和/或与使得该计算机设备12a能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22a进行。并且,计算机设备12a还可以通过网络适配器20a与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20a通过总线18a与计算机设备12a的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12a使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器16a通过运行存储在系统存储器28a中的程序,从而执行各种功能应用以及数据处理,例如实现上述实施例所示的基于阅读理解的任务处理方法。
本发明还提供一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例所示的基于阅读理解的任务处理方法。
本实施例的计算机可读介质可以包括上述图6所示实施例中的系统存储器28a中的RAM30a、和/或高速缓存存储器32a、和/或存储系统34a。
随着科技的发展,计算机程序的传播途径不再受限于有形介质,还可以直接从网络下载,或者采用其他方式获取。因此,本实施例中的计算机可读介质不仅可以包括有形的介质,还可以包括无形的介质。
本实施例的计算机可读介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (12)
1.一种基于阅读理解的任务处理方法,其特征在于,所述方法包括:
对于选择题任务中的多个选项中的各所述选项,分别基于题干和对应的所述选项,获取对应的基础知识;所述基础知识为所述选择题任务考察的知识点;其中,不同的所述选项对应的所述基础知识不同;
根据所述题干、各所述选项以及各所述选项对应的所述基础知识,采用预先训练的阅读理解模型,预测各所述选项作为答案的概率;
根据各所述选项的概率,从所述多个选项中获取概率最大的所述选项作为所述选择题任务的答案;
其中,对于选择题任务中的多个选项中的各所述选项,分别基于题干和对应的所述选项,获取对应的基础知识,包括:
根据所述题干和对应的所述选项,从预先采集的知识库中检索出对应的背景文档;
其中,根据所述题干和对应的所述选项,从预先采集的知识库中检索出对应的背景文档,包括:
采用自然语音理解工具从所述题干和对应的所述选项中进行解析处理,获取数个关键性分词;
以所述数个关键性分词为检索词,在所述知识库中检测与所述数个关键性分词匹配度最高的背景文档。
2.根据权利要求1所述的方法,其特征在于,对于选择题任务中的多个选项中的各所述选项,分别基于题干和对应的所述选项,获取对应的基础知识,还包括:
根据所述题干和对应的所述选项,从知识图谱中获取相关的辅助信息。
3.根据权利要求2所述的方法,其特征在于,根据所述题干和对应的所述选项,从知识图谱中获取相关的辅助信息,包括:
采用自然语音理解工具从所述题干和对应的所述选项中抽取数个分词;基于所述数个分词,从所述知识图谱中抽取相关的SPO信息;和/或
采用预先训练的意图提取模型,提取所述题干的意图信息;基于所述题干的意图信息和对应的所述选项,从所述知识图谱中抽取相关的SPO信息。
4.根据权利要求1所述的方法,其特征在于,根据所述题干、各所述选项以及各所述选项对应的所述基础知识,采用预先训练的阅读理解模型,预测各所述选项作为答案的概率之前,所述方法还包括:
采集数条训练数据,各所述训练数据对应一个训练选择题任务,所述训练选择题任务中包括训练题干、多个训练选项、正确选项以及所述训练题干和所述正确选项对应的基础知识;
采用所述数条训练数据,训练所述阅读理解模型。
5.根据权利要求4所述的方法,其特征在于,采用所述数条训练数据,训练所述阅读理解模型,包括:
对应各条所述训练数据,将对应的所述训练选择题任务中的所述训练题干、各所述选项以及所述基础知识,分别输入至所述阅读理解模型中;
获取所述阅读理解模型分别预测的各所述选项作为答案的概率;
根据各所述选项作为答案的概率,判断所述概率最大的所述选项是否为已知的正确选项;
若不是,调整所述阅读理解模型的参数,使得所述概率最大的所述选项为已知的正确选项;
按照上述方式,采用所述数条训练数据,重复对所述阅读理解模型进行训练,直到训练次数达到预设次数阈值或者在连续预设次数的训练中,所述阅读理解模型预测的所述概率最大的所述选项始终与已知的所述正确选项一致,确定所述阅读理解模型的参数,进而确定所述阅读理解模型。
6.一种基于阅读理解的任务处理装置,其特征在于,所述装置包括:
基础知识获取模块,用于对于选择题任务中的多个选项中的各所述选项,分别基于题干和对应的所述选项,获取对应的基础知识;所述基础知识为所述选择题任务考察的知识点;其中,不同的所述选项对应的所述基础知识不同;
预测模块,用于根据所述题干、各所述选项以及各所述选项对应的所述基础知识,采用预先训练的阅读理解模型,预测各所述选项作为答案的概率;
答案获取模块,用于根据各所述选项的概率,从所述多个选项中获取概率最大的所述选项作为所述选择题任务的答案;
所述基础知识获取模块,用于根据所述题干和对应的所述选项,从预先采集的知识库中检索出对应的背景文档;
所述基础知识获取模块,用于:
采用自然语音理解工具从所述题干和对应的所述选项中进行解析处理,获取数个关键性分词;
以所述数个关键性分词为检索词,在所述知识库中检测与所述数个关键性分词匹配度最高的背景文档。
7.根据权利要求6所述的装置,其特征在于,所述基础知识获取模块,用于:
根据所述题干和对应的所述选项,从知识图谱中获取相关的辅助信息。
8.根据权利要求7所述的装置,其特征在于,所述基础知识获取模块,用于:
采用自然语音理解工具从所述题干和对应的所述选项中抽取数个分词;基于所述数个分词,从所述知识图谱中抽取相关的SPO信息;和/或
采用预先训练的意图提取模型,提取所述题干的意图信息;基于所述题干的意图信息和对应的所述选项,从所述知识图谱中抽取相关的SPO信息。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
采集模块,用于采集数条训练数据,各所述训练数据对应一个训练选择题任务,所述训练选择题任务中包括训练题干、多个训练选项、正确选项以及所述训练题干和所述正确选项对应的基础知识;
训练模块,用于采用所述数条训练数据,训练所述阅读理解模型。
10.根据权利要求 9所述的装置,其特征在于,所述训练模块,用于:
对于各条所述训练数据,将对应的所述训练选择题任务中的所述训练题干、各所述选项以及所述基础知识,分别输入至所述阅读理解模型中;
获取所述阅读理解模型分别预测的各所述选项作为答案的概率;
根据各所述选项作为答案的概率,判断所述概率最大的所述选项是否为已知的正确选项;
若不是,调整所述阅读理解模型的参数,使得所述概率最大的所述选项为已知的正确选项;
按照上述方式,采用所述数条训练数据,重复对所述阅读理解模型进行训练,直到训练次数达到预设次数阈值或者在连续预设次数的训练中,所述阅读理解模型预测的所述概率最大的所述选项始终与已知的所述正确选项一致,确定所述阅读理解模型的参数,进而确定所述阅读理解模型。
11.一种计算机设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910537450.7A CN110377698B (zh) | 2019-06-20 | 2019-06-20 | 基于阅读理解的任务处理方法及装置、设备及可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910537450.7A CN110377698B (zh) | 2019-06-20 | 2019-06-20 | 基于阅读理解的任务处理方法及装置、设备及可读介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110377698A CN110377698A (zh) | 2019-10-25 |
CN110377698B true CN110377698B (zh) | 2022-11-01 |
Family
ID=68249052
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910537450.7A Active CN110377698B (zh) | 2019-06-20 | 2019-06-20 | 基于阅读理解的任务处理方法及装置、设备及可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110377698B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110941709B (zh) * | 2019-11-21 | 2023-11-03 | 北京妙医佳健康科技集团有限公司 | 信息筛选方法、装置、电子设备及可读存储介质 |
CN111382255B (zh) * | 2020-03-17 | 2023-08-01 | 北京百度网讯科技有限公司 | 用于问答处理的方法、装置、设备和介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109766407A (zh) * | 2018-11-28 | 2019-05-17 | 科大讯飞股份有限公司 | 数据处理方法和系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9063975B2 (en) * | 2013-03-15 | 2015-06-23 | International Business Machines Corporation | Results of question and answer systems |
-
2019
- 2019-06-20 CN CN201910537450.7A patent/CN110377698B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109766407A (zh) * | 2018-11-28 | 2019-05-17 | 科大讯飞股份有限公司 | 数据处理方法和系统 |
Non-Patent Citations (1)
Title |
---|
Hierarchical Attention Flow for Multiple-Choice Reading Comprehension;Haichao Zhu等;《The Thirty-Second AAAI Conferenceon Artificial Intelligence》;20181231;第6077-6084页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110377698A (zh) | 2019-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111316281B (zh) | 基于机器学习的自然语言情境中数值数据的语义分类方法以及系统 | |
EP3623970A1 (en) | Medical intelligent triage method and device | |
CN110459282B (zh) | 序列标注模型训练方法、电子病历处理方法及相关装置 | |
Dalianis et al. | HEALTH BANK-A Workbench for Data Science Applications in Healthcare. | |
US20210043324A1 (en) | Computer aided medical method and medical system for medical prediction | |
US20200315518A1 (en) | Apparatus for processing data for predicting dementia through machine learning, method thereof, and recording medium storing the same | |
Bullinger et al. | Developing and evaluating cross-cultural instruments from minimum requirements to optimal models | |
CN110827941B (zh) | 电子病历信息校正方法及系统 | |
Krumholz et al. | Do non-clinical factors improve prediction of readmission risk? results from the Tele-HF study | |
CN109166608A (zh) | 电子病历信息提取方法、装置和设备 | |
CN110069779B (zh) | 医疗文本的症状实体识别方法及相关装置 | |
CN108491486B (zh) | 模拟病人问诊对话方法、装置、终端设备及存储介质 | |
CN110021391B (zh) | 一种分诊方法和装置 | |
CN110459320A (zh) | 一种基于知识图谱的辅助诊疗系统 | |
US10847261B1 (en) | Methods and systems for prioritizing comprehensive diagnoses | |
CN110377698B (zh) | 基于阅读理解的任务处理方法及装置、设备及可读介质 | |
CN113571184A (zh) | 一种用于精神健康测评的对话交互设计方法及系统 | |
Lindvall et al. | Deep learning for cancer symptoms monitoring on the basis of electronic health record unstructured clinical notes | |
Preum et al. | CognitiveEMS: A cognitive assistant system for emergency medical services | |
CN111177309A (zh) | 病历数据的处理方法及装置 | |
CN112655054B (zh) | 基于端到端学习的人工智能医学症状识别系统 | |
CN117473104A (zh) | 基于慢性病管理的知识图谱搭建方法 | |
Batool et al. | Automatic extraction and mapping of discharge summary’s concepts into SNOMED CT | |
Oliver et al. | Extraction of SNOMED concepts from medical record texts. | |
Tepe et al. | Decoding medical jargon: The use of AI language models (ChatGPT-4, BARD, microsoft copilot) in radiology reports |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |