CN115292466A - 问答系统实现方法、装置、设备、介质及程序 - Google Patents
问答系统实现方法、装置、设备、介质及程序 Download PDFInfo
- Publication number
- CN115292466A CN115292466A CN202210951790.6A CN202210951790A CN115292466A CN 115292466 A CN115292466 A CN 115292466A CN 202210951790 A CN202210951790 A CN 202210951790A CN 115292466 A CN115292466 A CN 115292466A
- Authority
- CN
- China
- Prior art keywords
- sub
- question
- questions
- answer
- main
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 230000006399 behavior Effects 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims description 23
- 239000000463 material Substances 0.000 claims description 11
- 239000002994 raw material Substances 0.000 claims description 9
- 230000036962 time dependent Effects 0.000 claims description 3
- 230000003542 behavioural effect Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 20
- 238000003058 natural language processing Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000001364 causal effect Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 240000000491 Corchorus aestuans Species 0.000 description 1
- 235000011777 Corchorus aestuans Nutrition 0.000 description 1
- 235000010862 Corchorus capsularis Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开实施例提供了一种问答系统实现方法、装置、计算机设备、可读存储介质及程序,涉及计算机技术领域。该方法包括:将主问题按照时间顺序拆解成多个子问题;对多个子问题中的每个子问题查找相关文本内容;查找多个子问题中的每个子问题的判定依据;根据多个子问题中的每个子问题的相关文本内容和多个子问题中的每个子问题的判定依据确定每个子问题的答案;根据多个子问题中的每个子问题的答案和每个子问题的时间顺序确定主问题的答案。本公开实施例提供的方法,对主问题进行拆解并且考虑时间顺序,提高了问答系统的准确率和效率。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种问答系统实现方法、装置、计算机设备、可读存储介质及程序。
背景技术
目前,在实际复杂问题中往往含有时序特性,且时间的先后对问题的求解起到重要影响。现有的复杂问题求解中多考虑根据问题内容进行求解,在问题求解是没有考虑时序特性。
发明内容
本公开实施例提供了一种问答系统实现方法、装置、计算机设备、可读存储介质及程序,涉及计算机技术领域,对主问题进行拆解并且考虑时间顺序,提高了问答系统的准确率和效率。
本公开实施例提供了一种问答系统实现方法,其特征在于,包括:
将主问题按照时间顺序拆解成多个子问题;对多个子问题中的每个子问题查找相关文本内容;查找多个子问题中的每个子问题的判定依据;根据多个子问题中的每个子问题的相关文本内容和多个子问题中的每个子问题的判定依据确定每个子问题的答案;根据多个子问题中的每个子问题的答案和每个子问题的时间顺序确定主问题的答案。
在一个实施例中,方法还包括:
将原始材料中的每个主体按照时间顺序形成每个主体的行为时间链;根据每个主体的行为时间链判断每个时间点对应问题的答案;其中,对多个子问题中的每个子问题查找相关文本内容包括:根据多个子问题、每个主体的行为时间链和每个时间点对应问题的答案确定原始材料中与每个子问题对应的相关文本内容。
在一个实施例中,将主问题按照时间顺序拆解成多个子问题包括:在具有明确的时间点时,按照时间点先后拆解主问题;在不具有明确的时间点时,捕捉与时间相关的节点拆解主问题。
在一个实施例中,查找多个子问题中的每个子问题的判定依据包括:到知识库查找与多个子问题中的每个子问题对应的条文或规定。
在一个实施例中,根据多个子问题中的每个子问题的相关文本内容和多个子问题中的每个子问题的判定依据确定每个子问题的答案包括:根据多个子问题中的每个子问题对应的条文或规定对多个子问题中的每个子问题的相关文本内容进行判断以确定每个子问题的答案。
在一个实施例中,将原始材料中的每个主体按照时间顺序形成每个主体的行为时间链包括:对每个主体的每个行为按照时间顺序进行编号;按照编号顺序形成每个主体的行为时间链。
本公开实施例提供了一种问答系统实现装置,其特征在于,包括:拆解模块,用于将主问题按照时间顺序拆解成多个子问题;查找模块,用于对多个子问题中的每个子问题查找相关文本内容;查找模块,还用于查找多个子问题中的每个子问题的判定依据;确定模块,用于根据多个子问题中的每个子问题的相关文本内容和多个子问题中的每个子问题的判定依据确定每个子问题的答案;确定模块,还用于根据多个子问题中的每个子问题的答案和每个子问题的时间顺序确定主问题的答案。
本公开实施例提供了一种计算机设备,包括处理器、存储器、输入输出接口;处理器分别与存储器和输入输出接口相连,其中,输入输出接口用于接收数据及输出数据,存储器用于存储计算机程序,处理器用于调用计算机程序,以使得计算机设备执行如上实施例中任一项的方法。
本公开实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序适于由处理器加载并执行,以使得具有处理器的计算机设备执行如上实施例中任一项的方法。
本公开实施例提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上实施例中任一项的方法。
本公开上述实施例中的问答系统实现方法,将主问题按照时间顺序拆解成多个子问题,对多个子问题中的每个子问题查找相关文本内容,查找多个子问题中的每个子问题的判定依据,根据多个子问题中的每个子问题的相关文本内容和多个子问题中的每个子问题的判定依据确定每个子问题的答案,根据多个子问题中的每个子问题的答案和每个子问题的时间顺序确定主问题的答案,对主问题进行拆解并且考虑时间顺序,提高了问答系统的准确率和效率。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了可以应用本公开实施方式的问答系统实现方法的示例性系统架构的示意图;
图2是本公开实施例提供的一种问答系统实现方法的流程图;
图3示出了本公开一个实施例的问答系统实现的流程图;
图4示出了本公开一个实施例的主体行为时间链图;
图5示出了本公开一个实施例的问答系统的结构示意图;
图6示出了本公开实施例提供的一种问答系统实现方法的应用场景的示意图;
图7是本公开实施例提供的一种问答系统实现装置的结构示意图;
图8是本公开实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
在本公开实施例中,可以基于自然语言处理(Natural Language Processing,NLP)技术,将主问题按照时间顺序拆解成多个子问题;对多个子问题中的每个子问题查找相关文本内容;查找多个子问题中的每个子问题的判定依据;根据多个子问题中的每个子问题的相关文本内容和多个子问题中的每个子问题的判定依据确定每个子问题的答案;根据多个子问题中的每个子问题的答案和每个子问题的时间顺序确定主问题的答案,从而在解答主问题时考虑时间顺序因素拆解主问题,实现复杂主问题的解答。
下面首先对本公开的一些术语进行说明:
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。自然语言处理研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。自然语言处理主要应用于机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别、中文识别等方面。本申请中涉及的自然语言处理模型,可以任何常用的模型例如Transformer模型,Markov(马尔科夫模型)和CRF(条件随机场模型)等。
本公开实施例提供的方案涉及自然语言处理(Natural Language Processing,NLP)技术技术。
图1示出了可以应用本公开实施方式的问答系统实现方法的示例性系统架构100的示意图。
如图1所示,系统架构100可以包括终端101、102、103中的一种或多种,网络104和服务器105。网络104是用以在终端101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
应该理解,图1中的终端、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
终端101、102、103通过网络104与服务器105交互,可以接收或发送消息等。终端101、102、103可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、便携式计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器。例如终端103(也可以是终端101或102)向服务器105发送问答系统实现的指令,服务器105可以将主问题按照时间顺序拆解成多个子问题;对多个子问题中的每个子问题查找相关文本内容;查找多个子问题中的每个子问题的判定依据;根据多个子问题中的每个子问题的相关文本内容和多个子问题中的每个子问题的判定依据确定每个子问题的答案;根据多个子问题中的每个子问题的答案和每个子问题的时间顺序确定主问题的答案,以实现对复杂主问题的解答。
其中,终端可以是手机(如终端101)或平板电脑(如终端102),还可以是台式计算机(如终端101)等,在此不做限制。其中,终端中可以显示应用程序,该应用程序可以是问答系统实现的应用程序等。其中,图1中的终端仅为例举出的部分设备,在本公开中终端并不仅限于该图1中所例举的设备。
可以理解的是,本公开实施例中所提及的终端可以是一种用户设备,本公开实施例中的服务器包括但不限于服务器或服务器组成的集群。其中,以上所提及的终端可以是一种电子设备,包括但不限于手机、平板电脑、智能语音交互设备、智能家电、车载终端、台式电脑、笔记本电脑、掌上电脑、车载设备、增强现实/虚拟现实(Augmented Reality/Virtual Reality,AR/VR)设备、头盔显示器、智能电视、可穿戴设备、智能音箱、数码相机、摄像头及其他具备网络接入能力的移动互联网设备(mobile internet device,MID),或者火车、轮船、飞行等场景下的终端设备等。
其中,以上所提及的服务器可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、车路协同、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器,还可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统。
可选的,本公开实施例中所涉及的数据可以存储在云平台中,或者可以基于云存储技术、区块链技术对该数据进行存储,在此不做限制。
传统的问答系统中,面向复杂问题的问答不支持复杂问题的拆解,问答过程的可解释性较低;目前想要解决复杂问题只能依赖人工进行手动拆解再判定,人工成本高,处理效率低;现有的复杂问题自动化求解方法中,未考虑时间对问题结果产生的影响。
图2是本公开实施例提供的一种问答系统实现方法的流程图。本公开实施例提供的方法可以由图1实施例中的终端或服务器执行,或由终端和服务器交互执行。
如图2所示,本公开实施例提供的方法可以包括如下步骤。
在步骤S210中,将主问题按照时间顺序拆解成多个子问题。
在步骤S210中,终端或服务器将主问题按照时间顺序拆解成多个子问题。其中,主问题是所分析案例中的提出的需要解决的问题。时间顺序是指在对主问题进行拆解过程中,按照事件发生的先后顺序进行拆解。子问题是对主问题进行逻辑分析后进行分解的问题。
在步骤S220中,对多个子问题中的每个子问题查找相关文本内容。
在步骤S220中,终端或服务器对多个子问题中的每个子问题查找相关文本内容。其中,相关文本内容是原始材料中与每个子问题对应的内容。对多个子问题中的每个子问题查找相关文本内容,即是在原始材料中找到与子问题对应的原始内容,从而用于对子问题的解答。
在步骤S230中,查找多个子问题中的每个子问题的判定依据。
步骤S230中,终端或服务器查找多个子问题中的每个子问题的判定依据。终端或服务器例如从各类数据库中检索查找与子问题对应的判定信息,例如法条或者案例等,从而用于对子问题的解答和判断。
在步骤S240中,根据多个子问题中的每个子问题的相关文本内容和多个子问题中的每个子问题的判定依据确定每个子问题的答案。
在步骤S240中,终端或服务器根据多个子问题中的每个子问题的相关文本内容和多个子问题中的每个子问题的判定依据确定每个子问题的答案。在该步骤,终端或服务器可以根据多个子问题中的每个子问题对应的条文或规定对多个子问题中的每个子问题的相关文本内容进行判断以确定每个子问题的答案。
在步骤S250中,根据多个子问题中的每个子问题的答案和每个子问题的时间顺序确定主问题的答案。
在步骤S250中,终端或服务器根据多个子问题中的每个子问题的答案和每个子问题的时间顺序确定主问题的答案。
下面结合具体实例对图2中的步骤进行详细说明:
例如在案例中:上午10点,小红因无钱提出想要进行绑架以勒索钱财,小明说可以一起做。11点,小明去购买了绳子和麻袋。下午5点,小红开车载着小明到了学校附近的一个拐角等待学生放学。5点30分学生放学,学生甲经过拐角,小明下车用绳子将学生甲绑住,小红帮助小明把学生甲用麻袋套住带上了车,小红开车离开。下午6点,小明逼问学生甲父母的电话,给学生甲的父母打电话进行勒索。最终,晚上8点二人从学生甲父亲那里勒索获得5000元,小明分得3000元,小红分得2000元。
主问题:小红和小明谁是主犯?
下面对步骤S210进行详细说明:步骤S210中,终端或服务器将主问题按照时间顺序拆解成多个子问题。
图3示出了本公开一个实施例的问答系统实现的流程图。
参考图3,在步骤S210中将主问题“小红和小明谁是主犯”按照时间顺序拆解为图3中的S301子问题中的“谁先产生犯罪想法”、“谁的行为对犯罪结果有影响”、“在案件实施过程中谁更积极”和“谁是主要获利者”。
其中,在拆解主问题时,按照事件发生的具体时间线(点)进行拆分。当没有出现明确时间点时,终端或服务器的模型可以通过学习捕捉到与时间相关的节点进行拆分。
在一个实施例中,在问题拆解过程中可以引入时间链概念,采用位置编码中的绝对位置编码,模型可以根据时间先后为各个子问题打一个“位置标签”,之后再将拆解后带有标签的子问题作为输入,形成一个带有时间链的问题序列。使时间对问题的求解造成的影响通过时间链的方式得以解决。
下面对步骤S220进行详细说明:步骤S220中,终端或服务器对多个子问题中的每个子问题查找相关文本内容。其中,相关文本内容是原始材料中与每个子问题对应的内容。
图4示出了本公开一个实施例的主体行为时间链图。
步骤S220中对多个子问题中的每个子问题查找相关文本内容,可以通过图4的时间链图获得。
参考图4,可以将原始材料中的每个主体按照时间顺序形成每个主体的行为时间链。
原始材料中的每个主体的行为时间链可以通过对每个主体的每个行为按照时间顺序进行编号,然后按照编号顺序形成每个主体的行为时间链。
例如小红的时间链为:S411,10:00提出绑架;S412,17:00驾车前往事发地;S413,17:30后实施绑架;S414,20:00分得赃款2000元。
例如小明的时间链为:S431,10:00同意绑架;S432,11:00购买绳子和麻袋;S433,17:00坐车前往事发地;S434,17:30先下车实施绑架;S435,18:00进行勒索;S436,20:00分得赃款3000元。
之后,可以根据每个主体的行为时间链判断每个时间点对应问题的答案。
例如时间对应问题答案为:S421,10:00小红先提出绑架;S422,11:00小明购买作案工具;S423,17:00二人前往事发地;S424,17:30小明先实施绑架;S425,18:00小明进行勒索;S426,20:00小明分得更多赃款。
其中,步骤S220中对多个子问题中的每个子问题查找相关文本内容可以结合图4的每个主体的行为时间链和每个时间点对应问题的答案,确定原始材料中与每个子问题对应的相关文本内容。
例如图3中的S302相关文本内容:子问题“谁先产生犯罪想法”对应“上午10:00,被告人小红因无钱向被告人小明提出去绑架他人获取钱财”;子问题“谁的行为对犯罪结果有影响”对应“上午11:00,小明购买绳子和麻袋等犯罪工具”;子问题“在案件实施过程中谁更积极”对应“下午17:00,小明下车将学生甲用绳子绑住,小红帮助用麻袋套住带上车,小红开车逃离。小明从学生甲口中问得其父手机号,与其通话索要赎金5000元”;子问题“谁是主要获利者”对应“晚上20:00,犯罪后,小明分得赃款3000元,小红分得2000元”。
在一个实施例中,引入位置编码的方法,模型可以将多主体行为的信息和向量标签结合起来,形成一个新的表示输入给模型。含有向量标签的信息形成时间链,案例中的每个主体都形成各自时间链。
下面对步骤S230进行详细说明:步骤S230中,终端或服务器查找多个子问题中的每个子问题的判定依据。
其中在步骤S230中,终端或服务器可以到相关的知识库查找与多个子问题中的每个子问题对应的条文或规定。其中,知识库包括但不限于百科,论文库等知识库。
例如图3中的S303中查找的判定依据:与子问题“谁先产生犯罪想法”对应的“在实施犯罪前,提出犯意的行为人更容易被判定为主犯”;与子问题“谁的行为对犯罪结果有影响”对应的“主要考察行为人的具体行为与犯罪后果之间的因果关系,直接导致更容易判定为主犯”;与子问题“在案件实施过程中谁更积极”对应的“考察各实行犯在犯罪过程中的活跃度,活跃度较高的更容易被判定为主犯”;与子问题对应的“谁是主要获利者”对应的“案件中分赃较多的一方更容易判定为主犯”。
下面对步骤S240进行详细说明:步骤S240中,终端或服务器根据多个子问题中的每个子问题的相关文本内容和多个子问题中的每个子问题的判定依据确定每个子问题的答案。
步骤S240中可以根据多个子问题中的每个子问题对应的条文或规定对多个子问题中的每个子问题的相关文本内容进行判断以确定每个子问题的答案。例如图3中的S304中子问题的答案:根据S302的相关文本内容和S303的判定依据获得:子问题“谁先产生犯罪想法”的答案为“小红首先提出犯意”;子问题“谁的行为对犯罪结果有影响”的答案为“小明的行为直接导致了犯罪结果”;子问题“在案件实施过程中谁更积极”的答案为“在绑架过程中,小明首先实施绑架行为,并与男童家人进行联系,活跃度较高”;子问题“谁是主要获利者”的答案为“小明获得更多赃款,是主要获利者”。
下面对步骤S250进行详细说明:步骤S250中,终端或服务器根据多个子问题中的每个子问题的答案和每个子问题的时间顺序确定主问题的答案。
例如图3中的S304中子问题的答案确定主问题的答案为“小明为主犯”。其中,在拆解子问题时,因为按照时间顺序拆解,所以子问题的答案中也包括时间顺序。在确定主问题答案时,可以根据各个子问题的重要程度,给子问题赋予不同权重,然后根据权重计算主问题答案。
本申请的问答系统实现方法,将主问题按照时间顺序拆解成多个子问题,对多个子问题中的每个子问题查找相关文本内容,查找多个子问题中的每个子问题的判定依据,根据多个子问题中的每个子问题的相关文本内容和多个子问题中的每个子问题的判定依据确定每个子问题的答案,根据多个子问题中的每个子问题的答案和每个子问题的时间顺序确定主问题的答案,对主问题进行拆解并且考虑时间顺序,提高了问答系统的准确率和效率。
下面结合具体问答系统,对本申请的方法进行说明。
图5示出了本公开一个实施例的问答系统的结构示意图。
参考图5,本申请的问答系统包括:知识模块和推理模块。知识模块主要完成从数据到知识的转化过程。知识模块从非结构化、半结构化或结构化的文本中,抽取实体、属性、关系和事件,抽取实体可能具有的组成等关系,构建知识图谱;抽取事件之间存在的因果和顺承等关系,构建事理图谱。知识模块以结构化的知识库、非结构化文本和知识图谱/事理图谱的三种形式,提供对于上层检索操作的支持。
在问答过程中,推理模块接收主问题作为输入,输出为主问题的答案。
在S501中,将主问题进行拆分成带有时序特性的子问题链。例如将小红和小明的主犯问题拆分成:“谁先产生犯罪想法”、“谁的行为对犯罪结果有影响”、“在案件实施过程中谁更积极”和“谁是主要获利者”的S502子问题链。
对S502子问题链中的每个子问题S503依据图4的时间链进行S505知识校验(查找相关文本内容)。例如小红小明的实例中:子问题“谁先产生犯罪想法”对应“上午10:00,被告人小红因无钱向被告人小明提出去绑架他人获取钱财”;子问题“谁的行为对犯罪结果有影响”对应“上午11:00,小明购买绳子和麻袋等犯罪工具”;子问题“在案件实施过程中谁更积极”对应“下午17:00,小明下车将学生甲用绳子绑住,小红帮助用麻袋套住带上车,小红开车逃离。小明从学生甲口中问得其父手机号,与其通话索要赎金5000元”;子问题“谁是主要获利者”对应“晚上20:00,犯罪后,小明分得赃款3000元,小红分得2000元”。
对S502子问题链中的每个子问题S503通过S504检索知识库以获取S506判断依据。例如小红小明的实例中:与子问题“谁先产生犯罪想法”对应的“在实施犯罪前,提出犯意的行为人更容易被判定为主犯”;与子问题“谁的行为对犯罪结果有影响”对应的“主要考察行为人的具体行为与犯罪后果之间的因果关系,直接导致更容易判定为主犯”;与子问题“在案件实施过程中谁更积极”对应的“考察各实行犯在犯罪过程中的活跃度,活跃度较高的更容易被判定为主犯”;与子问题对应的“谁是主要获利者”对应的“案件中分赃较多的一方更容易判定为主犯”。
在S507中,结合多个子问题中的每个子问题的相关文本内容和多个子问题中的每个子问题的判定依据确定每个子问题的答案。例如小红小明的实例中:子问题“谁先产生犯罪想法”的答案为“小红首先提出犯意”;子问题“谁的行为对犯罪结果有影响”的答案为“小明的行为直接导致了犯罪结果”;子问题“在案件实施过程中谁更积极”的答案为“在绑架过程中,小明首先实施绑架行为,并与男童家人进行联系,活跃度较高”;子问题“谁是主要获利者”的答案为“小明获得更多赃款,是主要获利者”。
在S508中,根据多个子问题中的每个子问题的答案和每个子问题的时间顺序确定主问题的答案。例如小红小明的实例中:主问题的答案为“小明为主犯”。
图5的问答系统通过推理模块接收主问题作为输入,输出为主问题的答案,其中,通过将主问题进行拆分成带有时序特性的子问题链,依据时间链进行知识校验(查找相关文本内容),通过检索知识库以获取判断依据,根据多个子问题中的每个子问题的相关文本内容和多个子问题中的每个子问题的判定依据确定每个子问题的答案,根据多个子问题中的每个子问题的答案和每个子问题的时间顺序确定主问题的答案,问答过程的可解释性高,能够实现复杂主问题的解答,提高问答系统的准确率和效率。
下面结合具体的场景对本公开的问答系统实现方法进行具体说明。
图6示出了本公开实施例提供的一种问答系统实现方法的应用场景600的示意图。
参考图6,应用场景包括电脑终端601、服务器602和知识库603。其中,服务器可以是电脑终端601的后台服务器,也可以是单独的提供运算服务的服务器集群或云平台等,知识库可以是存储在服务器602内部的知识库,也可以是通过其他服务器或云平台等提供检索或查询服务的知识库,本公开不以此为限。
电脑终端601接收输入的例如小红和小明的案例后,可以将案例的原始材料发送至服务器602。服务器602中可以设置经过训练的自然语言处理的相关模型,相关模型可以将终端601发送的原始材料的主问题按照时间顺序拆解成多个子问题。服务器602中的相关模型可以根据原始材料,将每个主体按照时间顺序形成每个主体的行为时间链。服务器602中的相关模型可以根据成每个主体的行为时间链据判断每个时间点对应问题的答案。服务器602中的相关模型可以根据每个主体的行为时间链和每个时间点对应问题的答案,确定原始材料中与每个子问题对应的相关文本内容。服务器602可以到知识库603中查找多个子问题中的每个子问题的判定依据。服务器602的相关模型可以根据多个子问题中的每个子问题的相关文本内容和多个子问题中的每个子问题的判定依据确定每个子问题的答案。服务器603的相关模型根据多个子问题中的每个子问题的答案和每个子问题的时间顺序确定主问题的答案,然后将多个子问题、每个子问题的相关文本内容、每个子问题的判定依据、每个子问题的答案和主问题的答案返回至终端601。
图6的应用场景,电脑终端接收原始材料后,将原始材料发送至服务器,服务器将主问题按照时间顺序拆解成多个子问题,服务器对多个子问题中的每个子问题查找相关文本内容,服务器到知识库查找多个子问题中的每个子问题的判定依据,服务器根据多个子问题中的每个子问题的相关文本内容和多个子问题中的每个子问题的判定依据确定每个子问题的答案,服务器根据多个子问题中的每个子问题的答案和每个子问题的时间顺序确定主问题的答案,从而对主问题进行拆解并且考虑时间顺序,提高了问答系统的准确率和效率。
图7是本公开实施例提供的一种问答系统实现装置的结构示意图。
如图7所示,本公开实施例提供的问答系统实现装置700可以包括:
拆解模块710,用于将主问题按照时间顺序拆解成多个子问题;
查找模块720,用于对多个子问题中的每个子问题查找相关文本内容;
查找模块720,还用于查找多个子问题中的每个子问题的判定依据;
确定模块730,用于根据多个子问题中的每个子问题的相关文本内容和多个子问题中的每个子问题的判定依据确定每个子问题的答案;
确定模块730,还用于根据多个子问题中的每个子问题的答案和每个子问题的时间顺序确定主问题的答案。
本申请的问答系统实现装置,通过拆解模块将主问题按照时间顺序拆解成多个子问题;查找模块对多个子问题中的每个子问题查找相关文本内容,查找多个子问题中的每个子问题的判定依据;确定模块根据多个子问题中的每个子问题的相关文本内容和多个子问题中的每个子问题的判定依据确定每个子问题的答案,根据多个子问题中的每个子问题的答案和每个子问题的时间顺序确定主问题的答案,对主问题进行拆解并且考虑时间顺序,提高了问答系统的准确率和效率。
在一个实施例中,问答系统实现装置700可以包括:
形成模块,用于将原始材料中的每个主体按照时间顺序形成每个主体的行为时间链;确定模块730,还用于根据每个主体的行为时间链判断每个时间点对应问题的答案;查找模块720,还用于根据多个子问题、每个主体的行为时间链和每个时间点对应问题的答案确定原始材料中与每个子问题对应的相关文本内容。
在一个实施例中,查找模块720,还用于在具有明确的时间点时,按照时间点先后拆解主问题;在不具有明确的时间点时,捕捉与时间相关的节点拆解主问题。
在一个实施例中,查找模块720,还用于到知识库查找与多个子问题中的每个子问题对应的条文或规定。
在一个实施例中,确定模块730,用于根据多个子问题中的每个子问题对应的条文或规定对多个子问题中的每个子问题的相关文本内容进行判断以确定每个子问题的答案。
在一个实施例中,形成模块,用于对每个主体的每个行为按照时间顺序进行编号;按照编号顺序形成每个主体的行为时间链。
参见图8,图8是本公开实施例提供的一种计算机设备800的结构示意图。如图8所示,本公开实施例中的计算机设备可以包括:一个或多个处理器801、存储器802和输入输出接口803。该处理器801、存储器802和输入输出接口803通过总线804连接。存储器802用于存储计算机程序,该计算机程序包括程序指令,输入输出接口803用于接收数据及输出数据,如用于宿主机与计算机设备之间进行数据交互,或者用于在宿主机中的各个虚拟机之间进行数据交互;处理器801用于执行存储器802存储的程序指令。
其中,该处理器801可以执行如下操作:
将主问题按照时间顺序拆解成多个子问题;对多个子问题中的每个子问题查找相关文本内容;查找多个子问题中的每个子问题的判定依据;根据多个子问题中的每个子问题的相关文本内容和多个子问题中的每个子问题的判定依据确定每个子问题的答案;根据多个子问题中的每个子问题的答案和每个子问题的时间顺序确定主问题的答案。
在一些可行的实施方式中,该处理器801可以是中央处理单元(centralprocessing unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(digitalsignal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现成可编程门阵列(field-programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器802可以包括只读存储器和随机存取存储器,并向处理器801和输入输出接口803提供指令和数据。存储器802的一部分还可以包括非易失性随机存取存储器。例如,存储器802还可以存储设备类型的信息。
具体实现中,该计算机设备可通过其内置的各个功能模块执行如上述实施例中各个步骤所提供的实现方式,具体可参见上述实施例中各个步骤所提供的实现方式,在此不再赘述。
本公开实施例通过提供一种计算机设备,包括:处理器、输入输出接口、存储器,通过处理器获取存储器中的计算机程序,执行上述实施例中所示方法的各个步骤,进行传输操作。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序适于由该处理器加载并执行上述实施例中各个步骤所提供的方法,具体可参见上述实施例中各个步骤所提供的实现方式,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本公开所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本公开方法实施例的描述。作为示例,计算机程序可被部署为在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行。
该计算机可读存储介质可以是前述任一实施例提供的装置或者该计算机设备的内部存储单元,例如计算机设备的硬盘或内存。该计算机可读存储介质也可以是该计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(smart mediacard,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。进一步地,该计算机可读存储介质还可以既包括该计算机设备的内部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该计算机设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本公开实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中的各种可选方式中所提供的方法。
本公开实施例的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、装置、产品或设备固有的其他步骤单元。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在该说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
本公开实施例提供的方法及相关装置是参照本公开实施例提供的方法流程图和/或结构示意图来描述的,具体可由计算机程序指令实现方法流程图和/或结构示意图的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。这些计算机程序指令可提供到通用计算机、专用计算机、嵌入式处理机或其他可编程传输设备的处理器以产生一个机器,使得通过计算机或其他可编程传输设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程传输设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程传输设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或结构示意一个方框或多个方框中指定的功能的步骤。
以上所揭露的仅为本公开较佳实施例而已,当然不能以此来限定本公开之权利范围,因此依本公开权利要求所作的等同变化,仍属本公开所涵盖的范围。
Claims (10)
1.一种问答系统实现方法,其特征在于,包括:
将主问题按照时间顺序拆解成多个子问题;
对所述多个子问题中的每个子问题查找相关文本内容;
查找所述多个子问题中的每个子问题的判定依据;
根据所述多个子问题中的每个子问题的相关文本内容和所述多个子问题中的每个子问题的判定依据确定每个子问题的答案;
根据所述多个子问题中的每个子问题的答案和每个子问题的时间顺序确定所述主问题的答案。
2.根据权利要求1所述的方法,其特征在于,还包括:
将原始材料中的每个主体按照时间顺序形成每个主体的行为时间链;
根据每个主体的行为时间链判断每个时间点对应问题的答案;
其中,对所述多个子问题中的每个子问题查找相关文本内容包括:
根据所述多个子问题、每个主体的行为时间链和每个时间点对应问题的答案确定所述原始材料中与每个子问题对应的相关文本内容。
3.根据权利要求1所述的方法,其特征在于,将主问题按照时间顺序拆解成多个子问题包括:
在具有明确的时间点时,按照时间点先后拆解所述主问题;
在不具有明确的时间点时,捕捉与时间相关的节点拆解所述主问题。
4.根据权利要求1所述的方法,其特征在于,查找所述多个子问题中的每个子问题的判定依据包括:
到知识库查找与所述多个子问题中的每个子问题对应的条文或规定。
5.根据权利要求4所述的方法,其特征在于,根据所述多个子问题中的每个子问题的相关文本内容和所述多个子问题中的每个子问题的判定依据确定每个子问题的答案包括:
根据所述多个子问题中的每个子问题对应的条文或规定对所述多个子问题中的每个子问题的相关文本内容进行判断以确定每个子问题的答案。
6.根据权利要求2所述的方法,其特征在于,将原始材料中的每个主体按照时间顺序形成每个主体的行为时间链包括:
对每个主体的每个行为按照时间顺序进行编号;
按照编号顺序形成每个主体的行为时间链。
7.一种问答系统实现装置,其特征在于,包括:
拆解模块,用于将主问题按照时间顺序拆解成多个子问题;
查找模块,用于对所述多个子问题中的每个子问题查找相关文本内容;
所述查找模块,还用于查找所述多个子问题中的每个子问题的判定依据;
确定模块,用于根据所述多个子问题中的每个子问题的相关文本内容和所述多个子问题中的每个子问题的判定依据确定每个子问题的答案;
所述确定模块,还用于根据所述多个子问题中的每个子问题的答案和每个子问题的时间顺序确定所述主问题的答案。
8.计算机设备,其特征在于,包括处理器、存储器、输入输出接口;
所述处理器分别与所述存储器和所述输入输出接口相连,其中,所述输入输出接口用于接收数据及输出数据,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以使得所述计算机设备执行权利要求1-6任一项所述的方法。
9.计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于由处理器加载并执行,以使得具有所述处理器的计算机设备执行权利要求1-6任一项所述的方法。
10.计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210951790.6A CN115292466B (zh) | 2022-08-09 | 2022-08-09 | 问答系统实现方法、装置、设备、介质及程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210951790.6A CN115292466B (zh) | 2022-08-09 | 2022-08-09 | 问答系统实现方法、装置、设备、介质及程序 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115292466A true CN115292466A (zh) | 2022-11-04 |
CN115292466B CN115292466B (zh) | 2024-08-09 |
Family
ID=83828643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210951790.6A Active CN115292466B (zh) | 2022-08-09 | 2022-08-09 | 问答系统实现方法、装置、设备、介质及程序 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115292466B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116244418A (zh) * | 2023-05-11 | 2023-06-09 | 腾讯科技(深圳)有限公司 | 问题解答方法、装置、电子设备及计算机可读存储介质 |
CN116737912A (zh) * | 2023-08-15 | 2023-09-12 | 北京中关村科金技术有限公司 | 复杂问题处理方法、装置、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109145106A (zh) * | 2018-07-20 | 2019-01-04 | 吴怡 | 一种自学习式法律咨询机器人 |
CN112463941A (zh) * | 2020-12-04 | 2021-03-09 | 南京擎盾信息科技有限公司 | 基于事件链的多轮问答方法及装置 |
CN113886555A (zh) * | 2021-12-03 | 2022-01-04 | 北京大学 | 法律咨询服务方法及装置 |
-
2022
- 2022-08-09 CN CN202210951790.6A patent/CN115292466B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109145106A (zh) * | 2018-07-20 | 2019-01-04 | 吴怡 | 一种自学习式法律咨询机器人 |
CN112463941A (zh) * | 2020-12-04 | 2021-03-09 | 南京擎盾信息科技有限公司 | 基于事件链的多轮问答方法及装置 |
CN113886555A (zh) * | 2021-12-03 | 2022-01-04 | 北京大学 | 法律咨询服务方法及装置 |
Non-Patent Citations (1)
Title |
---|
徐永东等: "多文档文摘中基于时间信息的句子排序策略研究", 《中文信息学报》, no. 04, 15 July 2009 (2009-07-15), pages 27 - 33 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116244418A (zh) * | 2023-05-11 | 2023-06-09 | 腾讯科技(深圳)有限公司 | 问题解答方法、装置、电子设备及计算机可读存储介质 |
CN116244418B (zh) * | 2023-05-11 | 2023-09-01 | 腾讯科技(深圳)有限公司 | 问题解答方法、装置、电子设备及计算机可读存储介质 |
CN116737912A (zh) * | 2023-08-15 | 2023-09-12 | 北京中关村科金技术有限公司 | 复杂问题处理方法、装置、设备及介质 |
CN116737912B (zh) * | 2023-08-15 | 2023-10-20 | 北京中关村科金技术有限公司 | 复杂问题处理方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115292466B (zh) | 2024-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115292466B (zh) | 问答系统实现方法、装置、设备、介质及程序 | |
CN106383875B (zh) | 基于人工智能的人机交互方法和装置 | |
CN109034907A (zh) | 广告数据投放方法及装置、电子设备、存储介质 | |
CN106446195A (zh) | 基于人工智能的新闻推荐方法及装置 | |
US20140164296A1 (en) | Chatbot system and method with entity-relevant content from entity | |
CN114461777B (zh) | 智能问答方法、装置、设备及存储介质 | |
CN104462064A (zh) | 一种移动终端信息通讯提示输入内容的方法和系统 | |
CN113392197B (zh) | 问答推理方法、装置、存储介质及电子设备 | |
CN107526718A (zh) | 用于生成文本的方法和装置 | |
CN110727782A (zh) | 问答语料生成方法及系统 | |
CN114722174A (zh) | 提词方法和装置、电子设备及存储介质 | |
CN117539985A (zh) | 基于语言风格的问答方法和装置、电子设备及存储介质 | |
CN114676705B (zh) | 一种对话关系处理方法、计算机及可读存储介质 | |
CN111931503B (zh) | 信息抽取方法及装置、设备、计算机可读存储介质 | |
CN116701604A (zh) | 问答语料库的构建方法和装置、问答方法、设备及介质 | |
CN116975249A (zh) | 对话交互方法、装置、设备和存储介质 | |
CN116643814A (zh) | 模型库构建方法、基于模型库的模型调用方法和相关设备 | |
WO2023040545A1 (zh) | 一种数据处理方法、装置、设备、存储介质和程序产品 | |
CN116610784A (zh) | 一种保险业务场景问答推荐方法及其相关设备 | |
CN109408679A (zh) | 智能管理应用程序的方法、装置、电子设备及存储介质 | |
CN113010664B (zh) | 一种数据处理方法、装置及计算机设备 | |
CN115129849A (zh) | 题目表示的获取方法、设备以及计算机可读存储介质 | |
CN114401346A (zh) | 基于人工智能的应答方法、装置、设备及介质 | |
CN112818084B (zh) | 信息交互方法、相关装置、设备及计算机可读介质 | |
CN115169350B (zh) | 情报信息的处理方法、装置、设备、介质及程序 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |