CN110750625B - 司法问答方法及相关设备 - Google Patents
司法问答方法及相关设备 Download PDFInfo
- Publication number
- CN110750625B CN110750625B CN201810724814.8A CN201810724814A CN110750625B CN 110750625 B CN110750625 B CN 110750625B CN 201810724814 A CN201810724814 A CN 201810724814A CN 110750625 B CN110750625 B CN 110750625B
- Authority
- CN
- China
- Prior art keywords
- judicial
- question
- content
- target question
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000004458 analytical method Methods 0.000 claims abstract description 73
- 238000013145 classification model Methods 0.000 claims description 35
- 238000012545 processing Methods 0.000 claims description 28
- 238000010801 machine learning Methods 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 13
- 239000002699 waste material Substances 0.000 abstract description 3
- 238000004590 computer program Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 238000002372 labelling Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Engineering & Computer Science (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Technology Law (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种司法问答方法,该方法在获得与司法领域相关的问句后,对问句进行语义分析,从而确定出问句所针对的司法对象以及针对该司法对象所要查询的司法内容,进而在预先构建的司法知识图谱中,确定司法对象对应的节点,并在该司法对象的关联节点中,确定该待查询司法内容对应的节点,进而将所确定出的待查询司法内容对应的节点作为问句的答案。该方法可以应用在技术平台上,由技术平台分析问句并确定答案,节省人工回答成本,避免人力资源的浪费。另外,本发明还公开了司法问答的相关设备,以保证上述方法在实际中的应用及实现。
Description
技术领域
本发明涉及司法数据处理技术领域,更具体地,是司法问答方法及相关设备。
背景技术
随着法制进程的发展,人们的社会生活会涉及越来越多的司法活动,如司法案件、司法问题、司法事件等。在这些活动中,人们由于法律知识的欠缺或者其他原因,会产生一些司法问题,也迫切需要得到专业解答。
目前,对司法问题的解答方式是人工方式,即由法律专业人员提供解答内容。然而,这种方式需要耗费人力资源,人工成本较高。因此,目前需要提供一种可以由技术平台实现的方案,以根据用户的问题自动生成答案。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的司法问答方法及相关设备。
第一方面,本申请提供了一种司法问答方法,包括:
获得与司法领域相关的目标问句;
对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容;
在预先构建的司法知识图谱中,确定所述司法对象对应的节点,并在所述司法对象对应的节点的关联节点中,确定所述待查询司法内容对应的节点;
将确定的所述待查询司法内容对应的节点中的内容作为所述目标问句的答案。
第二方面,本申请提供了一种司法问答装置,包括:
问句获得模块,用于获得与司法领域相关的目标问句;
对象及待查内容确定模块,用于对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容;
节点查询模块,用于在预先构建的司法知识图谱中,确定所述司法对象对应的节点,并在所述司法对象对应的节点的关联节点中,确定所述待查询司法内容对应的节点;
答案确定模块,用于将确定的所述待查询司法内容对应的节点中的内容作为所述目标问句的答案。
第三方面,本申请提供了一种存储介质,其上存储有程序,所述程序被处理器执行时实现上述司法问答方法。
第四方面,本申请提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述司法问答方法。
借由上述技术方案,本发明提供一种司法问答方法,该方法在获得与司法领域相关的问句后,对问句进行语义分析,从而确定出问句所针对的司法对象以及针对该司法对象所要查询的司法内容,进而在预先构建的司法知识图谱中,确定司法对象对应的节点,并在该司法对象的关联节点中,确定该待查询司法内容对应的节点,进而将所确定出的待查询司法内容对应的节点作为问句的答案。该方法可以应用在技术平台上,由技术平台分析问句并确定答案,节省人工回答成本,避免人力资源的浪费。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本申请提供的司法问答方法的一个流程图;
图2示出了本申请提供的司法知识图谱的一个示例图;
图3示出了本申请提供的司法问答方法的另一个流程图;
图4示出了本申请提供的司法问答装置的一个结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
如今,在一些行业领域内问答系统是较为常见的数据系统,用户可以使用问答系统进行问题咨询,问答系统会自动生成答案返回给用户。但是,在司法领域,还未公开这样一种问答系统,可以满足用户在技术平台上进行司法问题的咨询,并由技术平台根据司法问题自动地生成解答。本申请即是为了解决这个问题。
见图1,其示出了本申请提供的一种司法问答方法的流程,具体包括步骤S101~S104。
S101:获得与司法领域相关的目标问句。
其中,用户可以向司法问答装置输入待查询问句,其中待查询问句也可以称为目标问句。或者,司法问答装置获得目标问句的方式还可以是其他,如由司法问答装置自身生成的问句,或者司法问答装置接收到的其他设备装置发送的问句。
需要说明的是,由于本申请应用在司法领域场景中,因此所获得的都是与司法领域相关的问句。与司法领域相关可以表现在各个方面,如查询的主体、客体、事件等任何一个或多个活动要素与司法领域相关即可。例如,可以查询司法流程、查询司法处理方式、查询某个主体相关的司法案件等等。
需要说明的是,问句并非指的是句子的表现形式如疑问、设问及反问,而指的是句子的表达含义,只要表达含义是想要得到反馈数据的句子,都可以认为是本步骤获得的目标问句。例如,某个句子为“北京市中级人民法院去年的审结案件”,这个句子隐含含义是查询北京市中级人民法院去年审结的案件有哪些?
S102:对目标问句进行语义分析,以确定目标问句针对的司法对象以及针对司法对象的待查询司法内容。
其中,目标问句作为一个句子,其具有特定的语义含义。通过对目标问句的语义进行分析,可以确定出目标问句中的语义角色及角色依存关系等。
可以理解的是,语义分析时现有的一种自然语言处理技术,语义分析工具包括如语言技术平台(Language Technology Platform,LTP)等,可以实现对句子中的语义角色标注以及对语义依存关系进行分析,以得到句子中各个语言单位之间的语义关联,并将语义关联以依存结果表示。使用语义依存刻画句子语义,好处在于不需要去抽象词汇本身,而是通过词汇所承受的语义框架来描述该词汇。语义依存分析的目标是跨越句子表层句法结构的束缚,直接获取深层的语义信息。
因此,通过语义分析中的语义角色标注,可以确定出目标问句中的语义角色。语义角色标注(Semantic Role Labeling,SRL)是一种浅层的语义分析技术,标注句子中某些短语为给定谓词的论元(语义角色),如施事、受事、时间和地点等。根据语义角色可以确定出目标问句所针对的司法对象,以及针对该司法对象所查询的司法内容。
例如,某个目标问句为“A律师事务的代理案件有哪些”,通过语义分析可以确定出核心主体为“A律师事务所”,它作为目标问句所针对或者所关注的司法对象,并且可以确定出与该核心主体具有属事关系的是宾语为“代理案件”,它作为针对该司法对象的待查询司法内容。
S103:在预先构建的司法知识图谱中,确定司法对象对应的节点,并在司法对象对应的节点的关联节点中,确定待查询司法内容对应的节点。
其中,司法知识图谱是一种与司法领域相关、由司法数据构建的知识图谱。知识图谱是一种语义网络,由多个表示知识要素的节点组成,且节点之间具有关联关系。需要说明的是,知识图谱中并非所有节点之间都相互之间具有关联关系,而是某一些节点所表示的知识要素之间有关联关系,那么这些节点就会存在关联关系。
在本申请的应用场景中,司法知识图谱中的知识要素为司法要素,也就是说,司法知识图谱的节点所表示的内容为司法要素,司法要素可以包括但不局限于司法实体、司法事件、司法文件、以及司法咨询建议等。其中司法文件并非局限于颁布的法律条文,还可以包括判决文件、起诉文件等司法流程中产生的文件。需要说明的是,司法知识图谱在构建过程中可以结合现有的语义分析技术,以减少人工标注方面的成本。
上一步骤即步骤S102可以确定出目标问句所针对的司法对象,司法对象是司法实体的一种,因此可以在表示司法实体的节点中,查找该司法对象对应的节点。另外,每个节点具有至少一种关联关系的关联节点,查找到司法对象对应的节点后,在该节点的关联节点中,根据待查询司法内容与该司法对象之间的关联关系的类型,来查找该待查询司法内容对应的节点。
为了便于理解上述在司法知识图谱中查找节点的过程,本申请提供一个具体示例进行说明。
见图2所示的一个司法知识图谱示例,司法知识图谱中包括自然人、事件、案件、律所、法院这四大类节点。
其中自然人节点关联有张三节点及李四节点,这些节点与自然人节点的关联关系的类型为归属类型;事件节点关联有签订租赁合同节点及拖欠租金节点,这些节点与事件节点的关联关系的类型为归属类型;案件节点关联有案件1节点,案件1为某个具体的案件,该节点与案件节点的关联关系的类型为归属类型;律所节点关联有A律师事务所节点,该节点与案件律所的关联关系的类型为归属类型;法院节点关联有北京市中级人民法院节点,该节点与法院节点之间的关联关系的类型为归属类型。
签订租赁合同节点关联有签订房屋租赁合同事件节点,该节点与签订租赁合同节点的关联关系的类型为归属类型。签订房屋租赁合同事件节点关联有张三节点及李四节点,该两个节点与签订房屋租赁合同事件节点之间的关联关系的类型为涉事主体类型。
拖欠租金节点关联有拖欠房租事件节点,该节点与拖欠租金节点的关联关系的类型为归属类型。拖欠房租事件节点关联有李四节点,该节点与拖欠房租事件节点之间的关联关系的类型为涉事主体类型。
案件1节点关联有签订房屋租赁合同事件节点,该节点与案件1节点之间的关联关系的类型为包含事件类型,该类型表示的是,该案件1中包含有一个签订房屋租赁合同事件。案件1节点还关联有A律师事务所节点,该节点与案件1节点之间的关联关系的类型为代理律所,该类型表示的是,代理案件1的律所包含A律师事务所。案件1节点还关联有拖欠房租事件节点,该节点与案件1节点之间的关联关系的类型为包含事件类型,该类型表示的是,该案件1中包含有一个拖欠房租事件。案件1节点还关联有北京市中级人民法院节点,该节点与案件1节点之间的关联关系的类型为审理法院,该类型表示的是,审理案件1的法院为北京市中级人民法院。
基于上述结构的知识图谱示例,可以进行内容查询。例如,假设步骤S103从目标问句“A律师事务的代理案件有哪些”中,确定的司法对象为“A律师事务所”,则在上述知识图谱中查询表示该司法对象的节点,假设步骤S103从目标问句“A律师事务的代理案件有哪些”中,确定的待查询司法内容为“代理案件”,进而在该节点的关联节点中,查询与该节点之间的关联关系为代理律所这种类型的节点,如图2所示,查找到的节点为案件1节点。
S104:将确定的待查询司法内容对应的节点中的内容作为目标问句的答案。
仍以上述示例为例说明,例如确定出的节点为案件1这个节点,该节点中的内容为案件1,则可以将案件1确定为目标问句“A律师事务的代理案件有哪些”的答案。
由以上技术方案可知,本申请提供了一种司法问答方法,该方法在获得与司法领域相关的问句后,对问句进行语义分析,从而确定出问句所针对的司法对象以及针对该司法对象所要查询的司法内容,进而在预先构建的司法知识图谱中,确定司法对象对应的节点,并在该司法对象的关联节点中,确定该待查询司法内容对应的节点,进而将所确定出的待查询司法内容对应的节点作为问句的答案。该方法可以应用在技术平台上,由技术平台分析问句并确定答案,节省人工回答成本,避免人力资源的浪费。
另外,在大数据时代,很多行业都在进行数据挖掘与分析,分析对象是大量的文本数据,分析内容是从文本数据中抽取数据之间的结构关系。本申请的应用场景是司法数据处理领域,涉及到的对象数据包含司法数据,如判决文书、起诉书、司法网页信息等,这些司法数据都需要进行大数据分析,得到结构化的分析结果。本申请使用了知识图谱这种结构,来表示结构化的分析结果,知识图谱可以形象直接地表示出各个节点之间的关联关系,在知识图谱中查询内容具有较高的查询效率。
以下具体说明步骤S102的实现方式,即如何对目标问句进行语义分析。
在一种实现方式中,可以包括如下步骤A1~A2。
A1:使用预先构建的问句分类模型,对目标问句的查询内容类型进行识别;其中问句分类模型是,使用机器学习算法对预先标注有查询内容类型的问句样本进行训练后得到的。
其中,可以预先构建问句分类模型,该问句分类模型是通过机器学习算法构建的,在构建之前需要对问句样本进行人工标注,标注内容为问句样本的查询内容类型。
例如,查询内容类型包括三类,分别为:实体信息查询、事件处理咨询、焦点问题。
实体信息查询这种类型的目标问句句式一般是“XXX是XXX?”、“XXX有哪些?”、“XXX在哪里?”等,例如“北京市中级人民法院审结的案件有哪些?”。
事件处理咨询这种类型的目标问句句式一般是“XXX怎么办理”、“XXX怎么办”等,例如“我被打了怎么办?”。
焦点问题这种类型的目标问句,没有固定句式,是根据调查数据得到的人们咨询频率较高的问题。例如,“离婚纠纷中,精神损害赔偿如何认定?”等。
当然,人工可以标注的查询内容类型并不局限于以上三种,还可以是其他,只要是能够区分问句之间不同的类型均可。
使用人工标注有查询内容类型的问句样本,使用机器学习算法训练后便可以得到的问句分类模型。将目标问句输入至该问句分类模型中,问句分类模型可以输出目标问句的查询内容类型。其中,机器学习算法可以包括但不局限于支持向量机(support vectormachines,SVM)、卷积神经网络、循环神经网络等。
A2:使用与查询内容类型对应的语义分析方法,对目标问句进行语义分析,以确定目标问句针对的司法对象以及针对司法对象的待查询司法内容。
其中,由于查询内容类型不同,则表示目标问句所针对的司法对象和/或针对司法对象的待查询司法内容不同,因而所使用的语义分析方法也是不同的。不同的查询内容类型对应有不同的语义分析方法,在确定目标问句的查询内容类型后,根据该对应关系,确定该目标问句所对应的语义分析方法,进而根据该语义分析方法进行语义分析。
以下结合三种具体的问句分类模型,对语义分析方式进行说明。
如图3所示,将目标问句输入至问句分类模型后,所确定出的查询内容类型包括实体信息查询、事件处理咨询、焦点问题三种。
第一,若查询内容类型为实体信息查询,则语义分析方式为:从目标问句中提取查询实体以及从目标问句中提取与查询实体具有查询关系的内容。其中,查询实体作为目标问句针对的司法对象;与查询实体具有查询关系的内容作为司法对象的待查询司法内容。
其中,目标问句中的语句成分可以包含实体成分,实体成分为问句中的某几个字表示的实体。例如,目标问句为“北京市中级人民法院的审结案件有哪些?”,提取“北京市中级人民法院”这几个字表示的实体为查询实体。另外,目标问句中也包含有与该实体成分具有关系的内容,在这些关系中查找具有查询关系的内容,仍以该示例为例,在查询这个场景中“审结案件”是与“北京市中级人民法院”具有查询关系的内容,因此可以提取“审结案件”作为待查询司法内容。
第二,若查询内容类型为事件处理咨询,则语义分析方式为:确定目标问句所描述事件的事件类别,以及获得与司法对象具有处理咨询关系的预设司法内容。其中,所描述事件的事件类别作为目标问句针对的司法对象,预设司法内容作为待查询司法内容。
其中,目标问句可以描述一个司法事件,首先确定该司法事件的类别。事件类别用于表示司法事件所涉及的法律行为的类别。例如,目标问句为“房屋租赁合同怎么签订?”,其所描述的事件为“签订房租租赁合同”,这就是该目标问句所描述事件的事件类别。
事件类别的确定方式可以是,使用预先构建的事件分类模型。具体地,将目标问句输入至预先构建的事件分类模型中,以得到目标问句所描述事件的事件类别;其中事件分类模型是,使用机器学习算法对预先标注有事件类别的文件样本进行训练后得到的。
在构建事件分类模型之前,首先需要获得文本样本,文本样本可以包括判决书、起诉书、庭审笔录、调查笔录等各种形式。确定文本样本中包含的事件,并对事件的类别进行标注。例如,某个文本样本中包含“原被告于2010年8月签订了房屋租赁合同,约定···”,可以将其事件类别标注为“签订房租租赁合同”。
需要说明的是,所标注的事件类别是用于构建事件分类模型的,所标注的事件类别有哪些,则构建的事件分类模型能够识别出的事件类别就有哪些。事件分类模型识别出的事件类别后,需要根据该事件类别,在司法知识图谱中查找该事件类别对应的节点。因此,这就要求所标注的事件类别与司法知识图谱中的事件类别是对应的,换句话说,可以根据司法知识图谱中的事件类别对文本样本进行标注,即人工判断文本样本中的事件属于司法知识图谱中的哪个事件类别,则将该事件标注为该事件类别。
标注有事件类别的文本样本,可以用来训练事件分类模型。事件分类模型训练完成后,便可以将目标问句输入至该模型中,从而得到目标问句的事件类别。事件类别可以作为目标问句所针对的司法对象。
例如,目标问句为“房租租赁合同怎么签订”,所确定出的事件类别为“签订房租租赁合同”,从而可知该目标问句所针对的司法对象为“签订房租租赁合同”。
本申请还预先设置与事件类别具有处理咨询关系的司法内容,该处理咨询关系表示的是针对该事件类别要返回的司法内容是什么,也就是说,该司法内容是针对该事件类别的答案。这些司法内容可以作为事件类别的一种关联节点,在司法知识图谱确定出事件类别节点后,在该事件类别节点的关联节点中查询这些关联节点即可。
例如,预先设置与“签订房租租赁合同”这个事件类别具有处理咨询关系的司法内容,司法内容可以包括以下中的任意一个或多个:与签订房租租赁合同相关的法律规定、与签订房租租赁合同相关的司法流程、以及与签订房租租赁合同相关的判决文书。也就是说,如果目标问句为“房租租赁合同怎么签订”,那么所查询到的答案是与签订房租租赁合同相关的法律规定、与签订房租租赁合同相关的司法流程、以及与签订房租租赁合同相关的判决文书中的任意一个。
第三,若查询内容类型为焦点问题,则语义分析方式为:在问答库中查找与目标问句满足预设相似条件的相似问句,将回答关系作为司法对象的待查询司法内容。其中将相似问句作为目标问句针对的司法对象。
其中,问答库为预先设置的,问答库可以是知识图谱中的节点,也可以是独立的数据库。问答库中包含的是与焦点问题相似的问题,或者还可以进一步包含问题的答案。因此,在将目标问句识别为焦点问题这个类型后,在问答库中查找与目标问句相似的问句,查询条件是两者是否满足相似条件。
例如,目标问句为“离婚夫妻怎么分财产?”,问答库包含的某个问句为“离婚纠纷中夫妻财产如何分割?”,经过语义识别后可以确定该问句为该目标问句的相似语句。
具体地,查找相似问句的方式可以是:识别目标问句包含的关键分词,可以将该关键分词称为第一关键分词,获得第一关键分词的转换分数以及第一关键分词对应的权重值,根据第一关键分词的转换分数与第一关键分词的权重值计算目标问句的分数;识别问答库中各个问句包含的关键分词,可以将该关键分词称为第二关键分词,获得第二关键分词的转换分数以及第二关键分词对应的权重值,根据第二关键分词的转换分数与第二关键分词对应的权重值计算问答库中每个问句的分数;在问答库的各个问句中,查找分数与目标问句的分数相差最小的问句作为该目标问句的相似问句。
需要说明的是,第一关键分词及第二关键分词可以并非包括一个,也可以包括多个。
在确定到相似问句后,可以在司法知识图谱中定位该相似问句,再在该相似问句的关联节点中,查找与相似节点具有回答关系的节点,作为目标问句的答案。需要说明的是,与相似问句具有回答关系的节点包括以下几项中的一项或多项的组合:回答内容、法律规定、相关案例。也就是说,如果一个目标问句的查询内容类型为焦点问题,则确定出的答案可以包括该焦点问题的回答内容,该焦点问题所涉及到的法律规定、该焦点问题的相关案例。
如图3所示,在每种查询内容类型的目标问句,得到司法对象及待查询司法内容后,根据司法对象及待查询内容在司法知识图谱中确定司法对象对应的节点,并在司法对象对应的节点的关联节点中,确定待查询司法内容对应的节点作为答案。
见图4,其示出了本申请提供的司法问答装置的一种结构示意。如图4所示,该装置可以具体包括:问句获得模块401、对象及待查内容确定模块402、节点查询模块403、以及答案确定模块404。
问句获得模块401,用于获得与司法领域相关的目标问句;对象及待查内容确定模块402,用于对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容;节点查询模块403,用于在预先构建的司法知识图谱中,确定所述司法对象对应的节点,并在所述司法对象对应的节点的关联节点中,确定所述待查询司法内容对应的节点;答案确定模块404,用于将确定的所述待查询司法内容对应的节点中的内容作为所述目标问句的答案。
在一个示例中,所述对象及待查内容确定模块402可以具体包括:查询内容类型识别子模块、以及语义分析子模块。
其中,查询内容类型识别子模块,用于使用预先构建的问句分类模型,对所述目标问句的查询内容类型进行识别;其中所述问句分类模型是,使用机器学习算法对预先标注有查询内容类型的问句样本进行训练后得到的。语义分析子模块,用于使用与所述查询内容类型对应的语义分析方法,对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容。
在一个示例中,所述语义分析子模块包括:实体信息查询分析单元。
实体信息查询分析单元,用于若所述目标问句的查询内容类型为实体信息查询,则从所述目标问句中提取查询实体,作为所述目标问句针对的司法对象;以及从所述目标问句中提取与所述查询实体具有查询关系的内容,作为所述司法对象的待查询司法内容。
在一个示例中,所述语义分析子模块包括:事件处理咨询分析单元。
事件处理咨询分析单元,用于若所述目标问句的查询内容类型为事件处理咨询,则确定所述目标问句所描述事件的事件类别,并将所述事件类别作为所述目标问句针对的司法对象;以及将与所述司法对象具有处理咨询关系的预设司法内容作为待查询司法内容。
在一个示例中,所述事件处理咨询分析单元用于确定所述目标问句所描述事件的事件类别,包括:
所述事件处理咨询分析单元具体用于,将所述目标问句输入至预先构建的事件分类模型中,以得到所述目标问句所描述事件的事件类别;其中所述事件分类模型是,使用机器学习算法对预先标注有事件类别的文件样本进行训练后得到的。
在一个示例中,所述语义分析子模块包括:焦点问题分析单元。
焦点问题分析单元,用于若所述目标问句的查询内容类型为焦点问题,则在预设问答库中查找与所述目标问句满足预设相似条件的相似问句,将所述相似问句作为所述目标问句针对的司法对象;以及将回答关系作为所述司法对象的待查询司法内容。
在一个示例中,所述节点查询模块用于在所述司法对象对应的节点的关联节点中,确定所述待查询司法内容对应的节点,包括:
节点查询模块,具体用于在所述相似问句的关联节点中,查找与所述相似问句具有回答关系的节点。
本发明实施例提供的司法问答装置包括处理器和存储器,上述问句获得模块401、对象及待查内容确定模块402、节点查询模块403、以及答案确定模块404等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来根据用户的司法问题自动生成答案。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述司法问答方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述司法问答方法。
本发明实施例提供了一种设备,该设备可以是服务器、PC、PAD、手机等。设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
获得与司法领域相关的目标问句;对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容;在预先构建的司法知识图谱中,确定所述司法对象对应的节点,并在所述司法对象对应的节点的关联节点中,确定所述待查询司法内容对应的节点;以及将确定的所述待查询司法内容对应的节点中的内容作为所述目标问句的答案。
可选地,所述对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容,包括:使用预先构建的问句分类模型,对所述目标问句的查询内容类型进行识别;其中所述问句分类模型是,使用机器学习算法对预先标注有查询内容类型的问句样本进行训练后得到的;使用与所述查询内容类型对应的语义分析方法,对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容。
可选地,所述使用与所述查询内容类型对应的语义分析方法,对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容,包括:若所述目标问句的查询内容类型为实体信息查询,则从所述目标问句中提取查询实体,作为所述目标问句针对的司法对象;从所述目标问句中提取与所述查询实体具有查询关系的内容,作为所述司法对象的待查询司法内容。
可选地,所述使用与所述查询内容类型对应的语义分析方法,对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容,包括:若所述目标问句的查询内容类型为事件处理咨询,则确定所述目标问句所描述事件的事件类别,并将所述事件类别作为所述目标问句针对的司法对象;将与所述司法对象具有处理咨询关系的预设司法内容作为待查询司法内容。
可选地,所述确定所述目标问句所描述事件的事件类别,包括:将所述目标问句输入至预先构建的事件分类模型中,以得到所述目标问句所描述事件的事件类别;其中所述事件分类模型是,使用机器学习算法对预先标注有事件类别的文件样本进行训练后得到的。
可选地,所述使用与所述查询内容类型对应的语义分析方法,对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容,包括:若所述目标问句的查询内容类型为焦点问题,则在预设问答库中查找与所述目标问句满足预设相似条件的相似问句,将所述相似问句作为所述目标问句针对的司法对象;将回答关系作为所述司法对象的待查询司法内容。
可选地,所述在所述司法对象对应的节点的关联节点中,确定所述待查询司法内容对应的节点,包括:在所述相似问句的关联节点中,查找与所述相似问句具有回答关系的节点。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
获得与司法领域相关的目标问句;对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容;在预先构建的司法知识图谱中,确定所述司法对象对应的节点,并在所述司法对象对应的节点的关联节点中,确定所述待查询司法内容对应的节点;以及将确定的所述待查询司法内容对应的节点中的内容作为所述目标问句的答案。
可选地,所述对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容,包括:使用预先构建的问句分类模型,对所述目标问句的查询内容类型进行识别;其中所述问句分类模型是,使用机器学习算法对预先标注有查询内容类型的问句样本进行训练后得到的;使用与所述查询内容类型对应的语义分析方法,对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容。
可选地,所述使用与所述查询内容类型对应的语义分析方法,对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容,包括:若所述目标问句的查询内容类型为实体信息查询,则从所述目标问句中提取查询实体,作为所述目标问句针对的司法对象;从所述目标问句中提取与所述查询实体具有查询关系的内容,作为所述司法对象的待查询司法内容。
可选地,所述使用与所述查询内容类型对应的语义分析方法,对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容,包括:若所述目标问句的查询内容类型为事件处理咨询,则确定所述目标问句所描述事件的事件类别,并将所述事件类别作为所述目标问句针对的司法对象;将与所述司法对象具有处理咨询关系的预设司法内容作为待查询司法内容。
可选地,所述确定所述目标问句所描述事件的事件类别,包括:将所述目标问句输入至预先构建的事件分类模型中,以得到所述目标问句所描述事件的事件类别;其中所述事件分类模型是,使用机器学习算法对预先标注有事件类别的文件样本进行训练后得到的。
可选地,所述使用与所述查询内容类型对应的语义分析方法,对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容,包括:若所述目标问句的查询内容类型为焦点问题,则在预设问答库中查找与所述目标问句满足预设相似条件的相似问句,将所述相似问句作为所述目标问句针对的司法对象;将回答关系作为所述司法对象的待查询司法内容。
可选地,所述在所述司法对象对应的节点的关联节点中,确定所述待查询司法内容对应的节点,包括:在所述相似问句的关联节点中,查找与所述相似问句具有回答关系的节点。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (7)
1.一种司法问答方法,其特征在于,包括:
获得与司法领域相关的目标问句;
使用预先构建的问句分类模型,对所述目标问句的查询内容类型进行识别;其中所述问句分类模型是,使用机器学习算法对预先标注有查询内容类型的问句样本进行训练后得到的;
使用与所述查询内容类型对应的语义分析方法,对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容,所述使用与所述查询内容类型对应的语义分析方法,对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容,包括:若所述目标问句的查询内容类型为焦点问题,则在预设问答库中查找与所述目标问句满足预设相似条件的相似问句,将所述相似问句作为所述目标问句针对的司法对象,将回答关系作为所述司法对象的待查询司法内容;
在预先构建的司法知识图谱中,确定所述司法对象对应的节点,并在所述相似问句的关联节点中,查找与所述相似问句具有回答关系的节点,所述与所述相似问句具有回答关系的节点包括以下几项中的一项或多项的组合:回答内容、法律规定和案例;
将确定的所述待查询司法内容对应的节点中的内容作为所述目标问句的答案。
2.根据权利要求1所述的司法问答方法,其特征在于,所述使用与所述查询内容类型对应的语义分析方法,对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容,包括:
若所述目标问句的查询内容类型为实体信息查询,则从所述目标问句中提取查询实体,作为所述目标问句针对的司法对象;
从所述目标问句中提取与所述查询实体具有查询关系的内容,作为所述司法对象的待查询司法内容。
3.根据权利要求1所述的司法问答方法,其特征在于,所述使用与所述查询内容类型对应的语义分析方法,对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容,包括:
若所述目标问句的查询内容类型为事件处理咨询,则确定所述目标问句所描述事件的事件类别,并将所述事件类别作为所述目标问句针对的司法对象;
将与所述司法对象具有处理咨询关系的预设司法内容作为待查询司法内容。
4.根据权利要求3所述的司法问答方法,其特征在于,所述确定所述目标问句所描述事件的事件类别,包括:
将所述目标问句输入至预先构建的事件分类模型中,以得到所述目标问句所描述事件的事件类别;其中所述事件分类模型是,使用机器学习算法对预先标注有事件类别的文件样本进行训练后得到的。
5.一种司法问答装置,其特征在于,包括:
问句获得模块,用于获得与司法领域相关的目标问句;
对象及待查内容确定模块,用于对所述目标问句进行语义分析,以确定所述目标问句针对的司法对象以及针对所述司法对象的待查询司法内容;
所述对象及待查内容确定模块,具体用于使用预先构建的问句分类模型,对所述目标问句的查询内容类型进行识别;其中所述问句分类模型是,使用机器学习算法对预先标注有查询内容类型的问句样本进行训练后得到的;若所述目标问句的查询内容类型为焦点问题,则在预设问答库中查找与所述目标问句满足预设相似条件的相似问句,将所述相似问句作为所述目标问句针对的司法对象,将回答关系作为所述司法对象的待查询司法内容;
节点查询模块,用于在预先构建的司法知识图谱中,确定所述司法对象对应的节点,并在所述相似问句的关联节点中,查找与所述相似问句具有回答关系的节点,所述与所述相似问句具有回答关系的节点包括以下几项中的一项或多项的组合:回答内容、法律规定和案例;
答案确定模块,用于将确定的所述待查询司法内容对应的节点中的内容作为所述目标问句的答案。
6.一种存储介质,其上存储有程序,其特征在于,所述程序被处理器执行时实现如权利要求1~4中任一项所述的司法问答方法。
7.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行如权利要求1~4中任一项所述的司法问答方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810724814.8A CN110750625B (zh) | 2018-07-04 | 2018-07-04 | 司法问答方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810724814.8A CN110750625B (zh) | 2018-07-04 | 2018-07-04 | 司法问答方法及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110750625A CN110750625A (zh) | 2020-02-04 |
CN110750625B true CN110750625B (zh) | 2022-05-27 |
Family
ID=69274636
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810724814.8A Active CN110750625B (zh) | 2018-07-04 | 2018-07-04 | 司法问答方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110750625B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114169310B (zh) * | 2021-11-29 | 2024-06-18 | 中国人民银行清算总中心 | 一种阅读理解答案生成方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9373086B1 (en) * | 2015-01-07 | 2016-06-21 | International Business Machines Corporation | Crowdsource reasoning process to facilitate question answering |
US9542447B1 (en) * | 2015-10-13 | 2017-01-10 | International Business Machines Corporation | Supplementing candidate answers |
CN107766483A (zh) * | 2017-10-13 | 2018-03-06 | 华中科技大学 | 一种基于知识图谱的交互式问答方法及系统 |
CN108021691A (zh) * | 2017-12-18 | 2018-05-11 | 深圳前海微众银行股份有限公司 | 答案查找方法、客服机器人以及计算机可读存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6711585B1 (en) * | 1999-06-15 | 2004-03-23 | Kanisa Inc. | System and method for implementing a knowledge management system |
CN104240164A (zh) * | 2014-09-29 | 2014-12-24 | 南京提坦信息科技有限公司 | 一种基于大数据分析的法律咨询方法及系统 |
CN105068661B (zh) * | 2015-09-07 | 2018-09-07 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
CN106503239A (zh) * | 2016-11-07 | 2017-03-15 | 上海智臻智能网络科技股份有限公司 | 一种法律信息查询的方法和装置 |
CN107122444A (zh) * | 2017-04-24 | 2017-09-01 | 北京科技大学 | 一种法律知识图谱自动构建方法 |
CN108073569B (zh) * | 2017-06-21 | 2021-08-27 | 北京华宇元典信息服务有限公司 | 一种基于多层级多维度语义理解的法律认知方法、装置和介质 |
-
2018
- 2018-07-04 CN CN201810724814.8A patent/CN110750625B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9373086B1 (en) * | 2015-01-07 | 2016-06-21 | International Business Machines Corporation | Crowdsource reasoning process to facilitate question answering |
US9542447B1 (en) * | 2015-10-13 | 2017-01-10 | International Business Machines Corporation | Supplementing candidate answers |
CN107766483A (zh) * | 2017-10-13 | 2018-03-06 | 华中科技大学 | 一种基于知识图谱的交互式问答方法及系统 |
CN108021691A (zh) * | 2017-12-18 | 2018-05-11 | 深圳前海微众银行股份有限公司 | 答案查找方法、客服机器人以及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110750625A (zh) | 2020-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Orben et al. | Crud (re) defined | |
CN110968663B (zh) | 一种问答系统的答案展示方法及装置 | |
CN109947952B (zh) | 基于英语知识图谱的检索方法、装置、设备及存储介质 | |
CN108694178B (zh) | 一种推荐司法知识的方法及装置 | |
US20150235130A1 (en) | NLP Duration and Duration Range Comparison Methodology Using Similarity Weighting | |
CN113377936A (zh) | 智能问答方法、装置及设备 | |
CN110968776B (zh) | 政策知识的推荐方法、装置存储介质及处理器 | |
CN109697231A (zh) | 一种案件文书的显示方法、系统、存储介质和处理器 | |
KR20200145299A (ko) | 온라인 면접 동영상 분석 및 소셜미디어 정보분석 기반 지능형 채용지원 플랫폼 | |
CN105653547A (zh) | 一种提取文本关键词的方法和装置 | |
Arwan et al. | Source code retrieval on stackoverflow using lda | |
Ferreira-Satler et al. | A fuzzy ontology approach to represent user profiles in e-learning environments | |
CN110750625B (zh) | 司法问答方法及相关设备 | |
Martínez-González et al. | On the evaluation of thesaurus tools compatible with the Semantic Web | |
CN111783425B (zh) | 基于句法分析模型的意图识别方法及相关装置 | |
CN117033744A (zh) | 数据查询方法、装置、存储介质以及电子设备 | |
Szabó et al. | Dynamic skill gap analysis using ontology matching | |
CN115827847A (zh) | 知识图谱构建方法、装置、电子设备和存储介质 | |
Hong et al. | An efficient tag recommendation method using topic modeling approaches | |
CN111210044B (zh) | 职业特点预测方法及装置 | |
KR20230055151A (ko) | 법률사건 정보 매칭 시스템 및 방법 | |
CN110245337B (zh) | 一种生成裁判文书中经审理查明段的方法及装置 | |
CN114691820A (zh) | 一种基于知识图谱的问答实现方法及装置 | |
Giansiracusa et al. | Tools for Truth: Fact-Checking Resources for Journalists and You | |
Mansingh et al. | The role of ontologies in developing knowledge technologies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |