CN111753071B - 基于人工智能的法律咨询交互方法及装置 - Google Patents
基于人工智能的法律咨询交互方法及装置 Download PDFInfo
- Publication number
- CN111753071B CN111753071B CN202010594186.3A CN202010594186A CN111753071B CN 111753071 B CN111753071 B CN 111753071B CN 202010594186 A CN202010594186 A CN 202010594186A CN 111753071 B CN111753071 B CN 111753071B
- Authority
- CN
- China
- Prior art keywords
- legal
- word
- words
- information
- library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于人工智能的法律咨询交互方法及装置,机器人法律类学习的方法,该基于人工智能的法律咨询交互方法包括如下步骤:获取用户端发送的法律咨询信息;对所述法律咨询信息进行预处理,提取出预设的规范词;在数据库的语言包中查找所述规范词,判断数据库的语言包中是否存在所述规范词;当数据库的语言包中存在所述规范词时,依据预设的映射关系,确定所述规范词所映射的法律条文和/或法律判例;向用户端反馈所确定的法律条文和/或法律判例。本发明能够就法律问题与用户交互,快速、准确地解答用户提出的法律问题。
Description
技术领域
本发明涉及法律咨询服务技术领域,尤其是基于人工智能的法律咨询交互方法及装置。
背景技术
随着社会文明程度的提升以及我国司法体系的逐步完善,人们的法律意识越来越强,民事诉讼案例、行政诉讼案例以及刑事诉讼案例在生活中已十分常见,人们的法律咨询需求也日益增长,这无疑给当前有限的司法资源带来了挑战,仅仅通过现有的司法资源难以及时、准确地解答用户的法律问题。
而当前人工智能获得飞速发展,语义识别技术已十分成熟,却并没有应用于法律咨询服务领域的人工智能技术,因此,有必要将人工智能技术应用于法律咨询服务领域,以快速、准确地解答用户提出的法律问题,提升用户体验。
发明内容
本发明提供一种基于人工智能的法律咨询交互方法及装置,能够就法律问题与用户交互,快速、准确地解答用户提出的法律问题。
根据本发明的第一方面,本发明提供一种基于人工智能的法律咨询交互方法,包括如下步骤:获取用户端发送的法律咨询信息;对所述法律咨询信息进行预处理,提取出预设的规范词;在数据库的语言包中查找所述规范词,判断数据库的语言包中是否存在所述规范词;当数据库的语言包中存在所述规范词时,依据预设的映射关系,确定所述规范词所映射的法律条文和/或法律判例;向用户端反馈所确定的法律条文和/或法律判例。
优选的,当数据库的语言包中不存在所述规范词时,向预设的客服端转发所述法律咨询信息;向用户端转发客服端反馈的法律解答信息,所述法律解答信息包含法律条文和/或法律判例。
优选的,所述向用户端转发客服端反馈的法律解答信息的步骤之后,还包括如下步骤:获取客服端确定的触发词以及所述触发词所对应的法律条文和/或法律判例;建立所述触发词同相应的法律条文和/或法律判例的映射关系;将所述触发词、相应的法律条文和/或法律判例以及触发词同相应的法律条文和/或法律判例的映射关系更新至数据库中。
优选的,所述对所述法律咨询信息进行预处理,提取出预设的规范词的步骤,具体包括:识别所述法律咨询信息中的断句标点符号,依据所述断句标点符号将法律咨询信息划分为多句文字,对每一句文字中的词进行交集处理,提取出交集部分,将所有提取出的交集部分进行并集处理,得到所述预设的规范词。
优选的,所述数据库的语言包中包含专业词库、近义词库、反义词库、同音词库、同义词库、近义词关联词库、反义词关联词库、同音词关联词库和同义词关联词库,所述专业词库包含若干专业词,每个专业词均对应有近义词库、反义词库、同音词库和同义词库,所述近义词关联词库对应于所述近义词库,所述反义词关联词库对应于所述反义词库,所述同音词关联词库对应于所述同音词库,所述同义词关联词库对应于所述同义词库。
优选的,所述在数据库的语言包中查找所述规范词,判断数据库的语言包中是否存在所述规范词的步骤,具体包括:在所述专业词库中查找所述规范词,当专业词库中不存在所述规范词时,从近义词库、反义词库、同音词库和同义词库中查找所述规范词,当近义词库、反义词库、同音词库和同义词库中不存在所述规范词时,从近义词关联词库、反义词关联词库、同音词关联词库和同义词关联词库中查找所述规范词。
优选的,所述语言包依据如下方法建立组合关系:建立词语直角坐标系,所述词语直角坐标系的Y轴表示组成词语的第一个字,所述词语直角坐标系的X轴表示组成词语的第二个字,词语直角坐标系的原点为原始词;Y轴上具有多个与组成原始词的第一个字相关的相关字,X轴上具有多个与组成原始词的第二个字相关的相关字,在X轴上相关字所在位置做垂直线,在Y轴上相关字所在位置做垂直线,确定X轴和Y轴上垂直线的交点,计算交点到词语直角坐标系原点的距离,依据距离确定交点所形成的词语与原始词的组合关系。
优选的,所述数据库的语言包基于自主学习进行实时更新,其学习过程如下:获取现有已公开的判例信息作为训练数据,对每个判例进行解析,确定出每个判例的案由信息、原告信息、被告信息、判决陈词和法律条陈;将案由信息导入到学习模型中,将学习模型输出的法律条陈建立为法律条陈集合{N},将法律条陈集合{N}与原判例中法官给出的法律条陈集合{M}进行比对;当集合{N}全等于集合{M}时,语言包无需更新;当集合{N}与集合{M}没有交集时,将原判例中法官给出的法律条陈集合{M}中所有的法律条陈导入学习系统中进行学习运算,逆向确定法律条陈所对应的相关词语,提高这些法律条陈的相关词语的权重值,并降低集合{N}中法律条陈所对应的相关词语的权重值;当集合{N}真包含于集合{M},将集合{M}中不属于集合{N}的法律条陈导入学习系统中,逆向确定这些法律条陈所对应的相关词语,提高这些法律条陈的相关词语的权重值;当集合{M}真包含于集合{N},将集合{N}中不属于集合{M}的法律条陈导入学习系统中,逆向确定这些法律条陈所对应的相关词语,降低这些法律条陈的相关词语的权重值;如果集合{N}与集合{M}存在交集,且集合{N}与集合{M}彼此不存在非真包含关系时,将集合{M}中不属于集合{N}的法律条陈导入学习系统中,逆向确定这些法律条陈所对应的相关词语,提高这些法律条陈的相关词语的权重值,并将集合{N}中不属于集合{M}的法律条陈导入学习系统中,逆向确定这些法律条陈所对应的相关词语,降低这些法律条陈的相关词语的权重值。
优选的,所述向用户端反馈所确定的法律条文和/或法律判例的步骤之后,还包括如下步骤:当获取到用户端发送的法律援助请求时,向预设的律师端转发所述法律援助请求;记录律师端与用户端之间的交互信息,依据所述交互信息对所述用户端的用户进行评分。
根据本发明的第二方面,本发明提供一种基于人工智能的法律咨询交互装置,包括:信息获取模块,用于获取用户端发送的法律咨询信息;词提取模块,用于对所述法律咨询信息进行预处理,提取出预设的规范词;词查找模块,用于在数据库的语言包中查找所述规范词,判断数据库的语言包中是否存在所述规范词;信息确定模块,用于当数据库的语言包中存在所述规范词时,依据预设的映射关系,确定所述规范词所映射的法律条文和/或法律判例;信息反馈模块,用于向用户端反馈所确定的法律条文和/或法律判例。
本发明具有如下技术效果:本发明基于语义识别算法识别用户发送的法律咨询信息,对法律咨询信息进行预处理后,提取出预设的规范词,并在数据库中查找规范词所映射的法律条文和/或法律判例,再将查找到的法律条文和/或法律判例发送至用户端,就可以就法律问题与用户交互,快速、准确地解答用户提出的法律问题。
附图说明
图1为本发明一种实施例的基于人工智能的法律咨询交互系统的硬件架构图;
图2为本发明一种实施例的基于人工智能的法律咨询交互方法的流程图;
图3为本发明一种实施例的语言包的架构示意图;
图4为本发明一种实施例的词语直角坐标系的结构示意图;
图5为本发明一种实施例的基于人工智能的法律咨询交互装置的结构示意图。
具体实施方式
在对本发明进行具体说明前,有必要对本发明的基于人工智能的法律咨询交互系统的硬件架构进行说明,如图1所示,本系统包括服务器1以及分别与服务器1连接的用户端2、客服端3和律师端4,当然还可包括后台端等其他终端,用户端2、客服端3和律师端4均可以是电脑、手机、平板电脑等终端设备,用户、客服人员和律师具有相应的账号,通过账号登录到系统中。服务器1具有预设的数据库,数据库中预存有语言包数据、用户信息数据、客服人员数据、律师账号数据以及相关算法等数据。
本发明实施例提供一种基于人工智能的法律咨询交互方法,该方法从服务器1一侧进行说明,如图2所示,其包括如下步骤:
S100:获取用户端发送的法律咨询信息。
用户在可通过app或者网页账号等形式登录到系统中,系统提供相应的交互界面,用户在交互界面可以输入法律咨询信息,具体的,用户可以输入文字信息、图片信息、表情信息或者语音信息,用户一般以文字输入为主,也会输入语音信息。用户输入的法律咨询信息通常是疑问式的,具体表现为希望获得解释或答案,例如“我开车在斑马线撞到人了,会有什么结果”。上述法律咨询信息由用户端2向服务器1发送,服务器1即可接收到。
S200:对所述法律咨询信息进行预处理,提取出预设的规范词。
对于用户而言,其输入的法律咨询信息通常是口语化的提问,系统对这种口语化的文字往往不容易识别,因此,需要对其进行预处理,使其符合系统的处理要求。具体的,对于语音信息,服务器1首先要将语音转换为文字,系统统一对文字信息进行处理。对于文字信息,服务器1接收到的即为文字,可将其按照预定的格式规范进行整理,去除口语化等无用的文字,保留有效的词,再从这些有效词中提取出规范词。规范词可以是一个或多个,当其具有多个时,由于用户的意思表示是指向某个特定问题的,通常多个规范词是组合使用,针对同一答案。
S300:在数据库的语言包中查找所述规范词,判断数据库的语言包中是否存在所述规范词。
数据库的语言包中包含多个规范词,数据库中还预存有规范词与法律条文的映射关系以及规范词与法律判例的映射关系以及递归算法等,通常多个规范词的组合映射到某个法律条文或法律判例,例如,“机动车”、“人行横道”和“行人”为组合的规范词。可在语言包中查找所提取出的规范词,判断语言包中是否具有该规范词。
S400:当数据库的语言包中存在所述规范词时,依据预设的映射关系,确定所述规范词所映射的法律条文和/或法律判例。
如果在语言包中查找到所提取出的规范词,则可以依据上述预设的映射关系来确定规范词所映射的法律条文和法律判例。例如,上述“驾驶车辆”、“人行横道”和“撞到行人”的规范词,其映射到《中华人民共和国道路交通安全法》的第47条,“机动车在通过人行横道的时候,应该做到减速慢行;如果在通过路段的时候有行人通过的话,应该停车让他们先行”,则该法条为用户所需的答案。同时,法律判例则为包含上述规范词的法律判例,具体包括案由信息和判决结果信息等,这些判例直接与用户的提问相关,可以向用户提供判例指导,供用户参考。
S500:向用户端反馈所确定的法律条文和/或法律判例。
对于确定出的法律条文和法律判例,可全部向用户发送,或者仅发送法律条文和法律判例中之一,一般默认是发送法律条文,用户可以进一步要求或者在系统中进行设定,则可以再向用户发送法律判例。
为了让用户更加真实地处于交互语境中,向用户反馈的信息不仅仅包含法律条文和/或法律判例,系统还需要组织语言,形成更加真实、顺畅交流的交互语句。为此,在查找出相应的法律条文和/或法律判例后,可从系统中查找匹配用户提问的语句模板,将相应的法律条文和/或法律判例融入到语句模板中,组织好语言,再向用户发送。同时,可以结合上下文语境,对原有回答的答案进行修正,形成最终的答案,解决客户提出的法律问题。
在一种实施例中,当数据库的语言包中不存在所述规范词时,说明语言包没有收录该规范词,就无法对用户的提问进行解答。此时,可转入人工服务模式,系统将向空闲的客服端3转发用户提出的法律咨询信息,由客服端3的客服人员人工对用户的提问进行解答。客服人员回答用户提问,通过客服端3发出法律解答信息,服务器1向用户端2转发客服端3反馈的法律解答信息,法律解答信息也包含法律条文和/或法律判例。
客服端3将依照预定的操作流程对用户的提问进行解答,首先,客服人员将从用户的法律咨询信息中手动提取出多个触发词,并在数据库中查找这些触发词所映射的法律条文和/或法律判例,如果能够查找到法律条文和/或法律判例,说明系统提取的规范词不准确,客服端3将查找到的法律条文和/或法律判例发送至用户端2。同时,系统将记录客服端3所查找的触发词以及该触发词同查找到的法律条文和/或法律判例的映射关系,进而将客服端3所查找的触发词以及该触发词同查找到的法律条文和/或法律判例的映射关系更新到数据库中,使系统及时更新。
当客服人员在在数据库中查找不到这些触发词所映射的法律条文和/或法律判例时,说明系统并没有建立这些新的触发词与相应法律条文和/或法律判例的映射关系,此时由客服人员根据法律知识,人工对用户的提问进行解答,其解答信息也包含包含法律条文和/或法律判例。
系统将获取客服端3确定的触发词以及所述触发词所对应的法律条文和/或法律判例,再建立所述触发词同相应的法律条文和/或法律判例的映射关系,最终将所述触发词、相应的法律条文和/或法律判例以及触发词同相应的法律条文和/或法律判例的映射关系更新至数据库中。这样,系统就存在新的触发词以及相应的法律条文和/或法律判例,这就可以是及时补充系统的不完善,保证系统可以及时更新,能够解答用户更多问题。
在一种实施例中,步骤S200具体包括:识别所述法律咨询信息中的断句标点符号,依据所述断句标点符号将法律咨询信息划分为多句文字,对每一句文字中的词进行交集处理,提取出交集部分,将所有提取出的交集部分进行并集处理,得到所述预设的规范词。
断句标点符号可以是句号、问号、感叹号等表示一句话终结的标点符号,通常一句话具有统一的要表达的中心思想,依据断句标点符号将法律咨询信息划分为多句文字,就相当于将法律咨询信息划分为多个具有独立意思表示的分段,对每一句文字中的词进行交集处理就可以剔除无用的词语,保留该句话的核心意思表示,进而保留这些交集部分的词。经过交集处理后,每一句话都保留有交集部分,再将每句话的交集部分进行并集处理,剔除重复的词,就相当于剔除了相同的意思表示,最终形成的并集部分就是用户的主要意思表示,其包含多个规范词。不管用户发送的是一段话还是多短话,都可以采用上述分句、交集、并集的处理。
在一种实施例中,如图3所示,数据库的语言包中包含专业词库、近义词库、反义词库、同音词库、同义词库、近义词关联词库、反义词关联词库、同音词关联词库和同义词关联词库。专业词库包含若干专业词,其为规范的法律用词,与用户待查的信息最为接近,处于第一级别。
专业词库中的每个专业词都有相应的近义词库、反义词库、同音词库和同义词库,近义词库包含专业词的若干近义词,反义词库包含专业词的若干反义词,同音词库包含专业词的若干同音词,同义词库包含专业词的若干同义词。近义词库、反义词库、同音词库和同义词库中词的数量可以是一个或多个,也可以是没有,例如有些中性词,其没有反义词。近义词库、反义词库、同音词库和同义词库与用户的待查信息相关,同属于第二级别。
近义词关联词库对应于所述近义词库,近义词关联词库包含多个与近义词关联的词;所述反义词关联词库对应于所述反义词库,反义词关联词库包含多个与反义词关联的词;所述同音词关联词库对应于所述同音词库,同音词关联词库包含多个与同音词关联的词;所述同义词关联词库对应于所述同义词库,同义词关联词库包含多个与同义词关联的词。上述的这种关联关系由系统提前设定,通常是间接关联但不属于近义词、反义词、同音词和同义词的那一类词语。近义词关联词库、反义词关联词库、同音词关联词库和同义词关联词库与用户的待查信息间接相关,均同属于第三级别。
在进行规范词的查找时,将依照级别的排序进行有序查找,即步骤S300具体包括:首先在所述专业词库中查找所述规范词,当专业词库中不存在所述规范词时,再从近义词库、反义词库、同音词库和同义词库中查找所述规范词,当近义词库、反义词库、同音词库和同义词库中不存在所述规范词时,最后从近义词关联词库、反义词关联词库、同音词关联词库和同义词关联词库中查找所述规范词。通过这种排序查找的方式能够更加准确地查找到解答用户提问的信息,同时,还兼顾了词库量,防止出现无法解答用户提问的情况。同时,同一级别词库中的词还具有权重值,当在同一词库查找到多个词时,依据其权重值进行排序,权重值高的,优先被查找到。
在一种实施例中,所述语言包依据如下方法建立组合关系:建立词语直角坐标系,词语直角坐标系的Y轴表示组成词语的第一个字,所述词语直角坐标系的X轴表示组成词语的第二个字,词语直角坐标系的原点为原始词,该原始词为需要建立组合关系的基础词。Y轴上具有多个与组成原始词的第一个字相关的相关字,X轴上具有多个与组成原始词的第二个字相关的相关字,这种相关性可以是同义、同音、近义和反义的关系,多个相关字依据相关程度在两个坐标轴上排序,与组成原始词的字相关性高的字,越靠近原始词。这样,在X轴和Y轴上均具有多个与与组成原始词的字相关的字,可在X轴上相关字所在位置做垂直线,在Y轴上相关字所在位置做垂直线,确定X轴和Y轴上垂直线的交点,计算交点到词语直角坐标系原点的距离,依据距离确定交点所形成的词语与原始词的组合关系,距离小于预设值的,认为具有相关性,距离大于预设值的,则没有相关性。
如图4所示,Q1和Q2分别为一个词,原点O(x0,y0)为原始词,Q1和Q2到原点的距离表示Q1处的词和Q2处的词与原始词的紧密度。原点、Q1点和x轴上的x1形成的三角形的面积表示原始词与Q1处的词之间包含的相关内容。例如,原点0为“审查”这一词,由于Y轴表示组成词语的第一个字,X轴表示组成词语的第二个字,记为原点O(查,审),Q1点可为词“核实”,记作Q1(实,核),Q2点可为词“核心”,记作Q2(心,核),则Q1所在的词显然与原始词具有更高的相关性。
上述的原始词可以是法律中的规范词,也可以其他专业词,可基于上述方法建立每个规范词的词库。
在一种实施例中,数据库的语言包基于自主学习进行实时或定时更新,例如,每天夜晚的空闲时段进行自主学习。以扩充数据库的语言包,提升解答用户提问的能力。其学习过程如下:
可利用网络爬虫技术,从一些论坛、网站等抓取公布的已公开的判例信息,或者由后台操作人员主动上传已公开的判例信息,这些判例信息将作为训练数据。系统可对每个判例进行解析,确定出每个判例的案由信息、原告信息、被告信息、判决陈词和法律条陈。再将案由信息导入到学习模型中,学习模型可依据步骤S200-S400输出相应的法律条陈,将输出的法律条陈建立为法律条陈集合{N},该案由所对应的原判例中法官给出的法律条陈为集合{M},将法律条陈集合{N}与原判例中法官给出的法律条陈集合{M}进行比对,依据对比结果对语言包进行调整。具体如下:
当集合{N}全等于集合{M}时,说明输出结果与实际结果吻合,则语言包无需更新;
当集合{N}与集合{M}没有交集时,将原判例中法官给出的法律条陈集合{M}中所有的法律条陈导入学习系统中进行学习运算。步骤S200-S400是依据相关词确定法律条陈的正向过程,学习系统将逆向确定出法律条陈的相关词语。在逆向确定法律条陈所对应的相关词语,提高这些法律条陈的相关词语的权重值,并降低集合{N}中法律条陈所对应的相关词语的权重值。被提高权重值的词语在下一次检测规范词时更容易被检索到,被降低权重值的词语在下一次检测规范词时则相对不容易被检索到;
当集合{N}真包含于集合{M},将集合{M}中不属于集合{N}的法律条陈导入学习系统中,逆向确定这些法律条陈所对应的相关词语,提高这些法律条陈的相关词语的权重值;
当集合{M}真包含于集合{N},将集合{N}中不属于集合{M}的法律条陈导入学习系统中,逆向确定这些法律条陈所对应的相关词语,降低这些法律条陈的相关词语的权重值;
如果集合{N}与集合{M}存在交集,且集合{N}与集合{M}彼此不存在非真包含关系时,将集合{M}中不属于集合{N}的法律条陈导入学习系统中,逆向确定这些法律条陈所对应的相关词语,提高这些法律条陈的相关词语的权重值,并将集合{N}中不属于集合{M}的法律条陈导入学习系统中,逆向确定这些法律条陈所对应的相关词语,降低这些法律条陈的相关词语的权重值。
同时可设定一个第一权重阈值和第二权重阈值,第一权重阈值和第二权重阈值可根据语言包的具体组成而定,本实施例设定第一权重阈值为10%,第二权重阈值为15%。当某个特征词的权重值低于第一权重阈值,设定该特征词不可被检索到或者将其从语言包中剔除,直到在以后的学习过程中,该特征词的权重值大于第二权重阈值,则再次设定该特征词可被检索或者重新将其纳入到语言包中,从而可以成为可用于回答用户提问的规范词。
在一种实施例中,步骤S500之后,还包括如下步骤:当获取到用户端发送的法律援助请求时,向预设的律师端转发所述法律援助请求;记录律师端与用户端之间的交互信息,依据所述交互信息对所述用户端的用户进行评分。
用户在查阅系统发送的法律条文和/或法律判例后,可能需要进一步的咨询服务。此时,用户可点击交互界面的“请求法律援助”按钮,用户端2将向服务器1发送法律援助请求,服务器1在接收到该法律援助请求后,可转入法律援助模式。在法律援助模式下,服务器1将接收到的法律援助请求转发至预设的律师端4,由相应的律师与客户直接交流,律师可提供更加专业的咨询服务。系统将记录律师端4与用户端2之间的交互信息,并依据交互信息对用户端2的用户进行评分。这里评分的意义在于,可以通过评分来评估用户的潜在合作价值,为线下与用户合作提供参考。
评分具体包括两种评分,第一种评分是对回答用户提问的法律条文进行评分,可预先对法律条文设定分值,不同的法律条文往往体现不同的案件严重程度,案件越严重的,分值越高。例如刑事案件的严重程度就高于民事案件,因此,刑事案件的分值更高。通过识别出交互信息中的法律条文,可计算用户的案件严重程度得分,该得分值越高,则说明用户待咨询的案件严重程度越高,其潜在价值越高。
第二部分评分为性格特征评分,可对所述交互信息中用户端2发送的信息进行语义识别,提取出语气词,依据所述语气词,确定用户的性格特征(这种性格特征的确定算法已属于现有技术,在此不作赘述),再基于性格特征与性格分值的映射关系,计算用户的性格得分。性格得分将体现为用户是否真正有诉讼的需求,用户的诉讼需求越高,性格得分也越高。最终对用户的评分为案件严重程度得分和性格得分的加权得分。
本发明实施例还提供一种基于人工智能的法律咨询交互装置,如图5所示,包括:信息获取模块100,用于获取用户端发送的法律咨询信息;词提取模块200,用于对所述法律咨询信息进行预处理,提取出预设的规范词;词查找模块300,用于在数据库的语言包中查找所述规范词,判断数据库的语言包中是否存在所述规范词;信息确定模块400,用于当数据库的语言包中存在所述规范词时,依据预设的映射关系,确定所述规范词所映射的法律条文和/或法律判例;信息反馈模块500,用于向用户端反馈所确定的法律条文和/或法律判例。
在一种实施例中,还包括客服咨询模块,用于当数据库的语言包中不存在规范词时,向预设的客服端转发所述法律咨询信息,向用户端转发客服端反馈的法律解答信息,所述法律解答信息包含法律条文和/或法律判例。
在一种实施例中,还包括数据更新模块,用于获取客服端确定的触发词以及所述触发词所对应的法律条文和/或法律判例;建立所述触发词同相应的法律条文和/或法律判例的映射关系;将所述触发词、相应的法律条文和/或法律判例以及触发词同相应的法律条文和/或法律判例的映射关系更新至数据库中。
在一种实施例中,所述词提取模块200用于识别所述法律咨询信息中的断句标点符号,依据所述断句标点符号将法律咨询信息划分为多句文字,对每一句文字中的词进行交集处理,提取出交集部分,将所有提取出的交集部分进行并集处理,得到所述预设的规范词。
在一种实施例中,数据库的语言包中包含专业词库、近义词库、反义词库、同音词库、同义词库、近义词关联词库、反义词关联词库、同音词关联词库和同义词关联词库,所述专业词库包含若干专业词,每个专业词均对应有近义词库、反义词库、同音词库和同义词库,所述近义词关联词库对应于所述近义词库,所述反义词关联词库对应于所述反义词库,所述同音词关联词库对应于所述同音词库,所述同义词关联词库对应于所述同义词库。
在一种实施例中,词查找模块300用于在所述专业词库中查找所述规范词,当专业词库中不存在所述规范词时,从近义词库、反义词库、同音词库和同义词库中查找所述规范词,当近义词库、反义词库、同音词库和同义词库中不存在所述规范词时,从近义词关联词库、反义词关联词库、同音词关联词库和同义词关联词库中查找所述规范词。
在一种实施例中,还包括关系组合模块,用于建立词语直角坐标系,所述词语直角坐标系的Y轴表示组成词语的第一个字,所述词语直角坐标系的X轴表示组成词语的第二个字,词语直角坐标系的原点为原始词;Y轴上具有多个与组成原始词的第一个字相关的相关字,X轴上具有多个与组成原始词的第二个字相关的相关字,在X轴上相关字所在位置做垂直线,在Y轴上相关字所在位置做垂直线,确定X轴和Y轴上垂直线的交点,计算交点到词语直角坐标系原点的距离,依据距离确定交点所形成的词语与原始词的组合关系。
在一种实施例中,还包括语言包更新模块,用于获取现有已公开的判例信息作为训练数据,对每个判例进行解析,确定出每个判例的案由信息、原告信息、被告信息、判决陈词和法律条陈;将案由信息导入到学习模型中,将学习模型输出的法律条陈建立为法律条陈集合{N},将法律条陈集合{N}与原判例中法官给出的法律条陈集合{M}进行比对;当集合{N}全等于集合{M}时,语言包无需更新;当集合{N}与集合{M}没有交集时,将原判例中法官给出的法律条陈集合{M}中所有的法律条陈导入学习系统中进行学习运算,逆向确定法律条陈所对应的相关词语,提高这些法律条陈的相关词语的权重值,并降低集合{N}中法律条陈所对应的相关词语的权重值;当集合{N}真包含于集合{M},将集合{M}中不属于集合{N}的法律条陈导入学习系统中,逆向确定这些法律条陈所对应的相关词语,提高这些法律条陈的相关词语的权重值;当集合{M}真包含于集合{N},将集合{N}中不属于集合{M}的法律条陈导入学习系统中,逆向确定这些法律条陈所对应的相关词语,降低这些法律条陈的相关词语的权重值;如果集合{N}与集合{M}存在交集,且集合{N}与集合{M}彼此不存在非真包含关系时,将集合{M}中不属于集合{N}的法律条陈导入学习系统中,逆向确定这些法律条陈所对应的相关词语,提高这些法律条陈的相关词语的权重值,并将集合{N}中不属于集合{M}的法律条陈导入学习系统中,逆向确定这些法律条陈所对应的相关词语,降低这些法律条陈的相关词语的权重值。
在一种实施例中,还包括用户评分模块,用于当获取到用户端发送的法律援助请求时,向预设的律师端转发所述法律援助请求;记录律师端与用户端之间的交互信息,依据所述交互信息对所述用户端的用户进行评分。
由于上述基于人工智能的法律咨询交互装置为基于人工智能的法律咨询交互方法部分对应的装置类说明,该基于人工智能的法律咨询交互装置的说明可参考上述基于人工智能的法律咨询交互方法部分的实施例,在此不做赘述。
以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换。
Claims (9)
1.一种基于人工智能的法律咨询交互方法,其特征在于,包括如下步骤:
获取用户端发送的法律咨询信息;
对所述法律咨询信息进行预处理,提取出预设的规范词;
在数据库的语言包中查找所述规范词,判断数据库的语言包中是否存在所述规范词;
当数据库的语言包中存在所述规范词时,依据预设的映射关系,确定所述规范词所映射的法律条文和/或法律判例;
向用户端反馈所确定的法律条文和/或法律判例;
所述数据库的语言包基于自主学习进行实时更新,其学习过程如下:获取现有已公开的判例信息作为训练数据,对每个判例进行解析,确定出每个判例的案由信息、原告信息、被告信息、判决陈词和法律条陈;将案由信息导入到学习模型中,将学习模型输出的法律条陈建立为法律条陈集合{N},将法律条陈集合{N}与原判例中法官给出的法律条陈集合{M}进行比对;
当集合{N}全等于集合{M}时,语言包无需更新;
当集合{N}与集合{M}没有交集时,将原判例中法官给出的法律条陈集合{M}中所有的法律条陈导入学习系统中进行学习运算,逆向确定法律条陈所对应的相关词语,提高这些法律条陈的相关词语的权重值,并降低集合{N}中法律条陈所对应的相关词语的权重值;
当集合{N}真包含于集合{M},将集合{M}中不属于集合{N}的法律条陈导入学习系统中,逆向确定这些法律条陈所对应的相关词语,提高这些法律条陈的相关词语的权重值;
当集合{M}真包含于集合{N},将集合{N}中不属于集合{M}的法律条陈导入学习系统中,逆向确定这些法律条陈所对应的相关词语,降低这些法律条陈的相关词语的权重值;
如果集合{N}与集合{M}存在交集,且集合{N}与集合{M}彼此不存在非真包含关系时,将集合{M}中不属于集合{N}的法律条陈导入学习系统中,逆向确定这些法律条陈所对应的相关词语,提高这些法律条陈的相关词语的权重值,并将集合{N}中不属于集合{M}的法律条陈导入学习系统中,逆向确定这些法律条陈所对应的相关词语,降低这些法律条陈的相关词语的权重值。
2.根据权利要求1所述的基于人工智能的法律咨询交互方法,其特征在于:
当数据库的语言包中不存在所述规范词时,向预设的客服端转发所述法律咨询信息;向用户端转发客服端反馈的法律解答信息,所述法律解答信息包含法律条文和/或法律判例。
3.根据权利要求2所述的基于人工智能的法律咨询交互方法,其特征在于,所述向用户端转发客服端反馈的法律解答信息的步骤之后,还包括如下步骤:获取客服端确定的触发词以及所述触发词所对应的法律条文和/或法律判例;建立所述触发词同相应的法律条文和/或法律判例的映射关系;将所述触发词、相应的法律条文和/或法律判例以及触发词同相应的法律条文和/或法律判例的映射关系更新至数据库中。
4.根据权利要求1所述的基于人工智能的法律咨询交互方法,其特征在于,所述对所述法律咨询信息进行预处理,提取出预设的规范词的步骤,具体包括:识别所述法律咨询信息中的断句标点符号,依据所述断句标点符号将法律咨询信息划分为多句文字,对每一句文字中的词进行交集处理,提取出交集部分,将所有提取出的交集部分进行并集处理,得到所述预设的规范词。
5.根据权利要求1所述的基于人工智能的法律咨询交互方法,其特征在于:所述数据库的语言包中包含专业词库、近义词库、反义词库、同音词库、同义词库、近义词关联词库、反义词关联词库、同音词关联词库和同义词关联词库,所述专业词库包含若干专业词,每个专业词均对应有近义词库、反义词库、同音词库和同义词库,所述近义词关联词库对应于所述近义词库,所述反义词关联词库对应于所述反义词库,所述同音词关联词库对应于所述同音词库,所述同义词关联词库对应于所述同义词库。
6.根据权利要求5所述的基于人工智能的法律咨询交互方法,其特征在于,所述在数据库的语言包中查找所述规范词,判断数据库的语言包中是否存在所述规范词的步骤,具体包括:在所述专业词库中查找所述规范词,当专业词库中不存在所述规范词时,从近义词库、反义词库、同音词库和同义词库中查找所述规范词,当近义词库、反义词库、同音词库和同义词库中不存在所述规范词时,从近义词关联词库、反义词关联词库、同音词关联词库和同义词关联词库中查找所述规范词。
7.根据权利要求5或6所述的基于人工智能的法律咨询交互方法,其特征在于,所述语言包依据如下方法建立组合关系:建立词语直角坐标系,所述词语直角坐标系的Y轴表示组成词语的第一个字,所述词语直角坐标系的X轴表示组成词语的第二个字,词语直角坐标系的原点为原始词;Y轴上具有多个与组成原始词的第一个字相关的相关字,X轴上具有多个与组成原始词的第二个字相关的相关字,在X轴上相关字所在位置做垂直线,在Y轴上相关字所在位置做垂直线,确定X轴和Y轴上垂直线的交点,计算交点到词语直角坐标系原点的距离,依据距离确定交点所形成的词语与原始词的组合关系。
8.根据权利要求1-6任一项所述的基于人工智能的法律咨询交互方法,其特征在于,所述向用户端反馈所确定的法律条文和/或法律判例的步骤之后,还包括如下步骤:当获取到用户端发送的法律援助请求时,向预设的律师端转发所述法律援助请求;记录律师端与用户端之间的交互信息,依据所述交互信息对所述用户端的用户进行评分。
9.一种基于人工智能的法律咨询交互装置,应用权利要求1-8任一项所述法律咨询交互方法,其特征在于,包括:
信息获取模块,用于获取用户端发送的法律咨询信息;
词提取模块,用于对所述法律咨询信息进行预处理,提取出预设的规范词;
词查找模块,用于在数据库的语言包中查找所述规范词,判断数据库的语言包中是否存在所述规范词;
信息确定模块,用于当数据库的语言包中存在所述规范词时,依据预设的映射关系,确定所述规范词所映射的法律条文和/或法律判例;
信息反馈模块,用于向用户端反馈所确定的法律条文和/或法律判例。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010594186.3A CN111753071B (zh) | 2020-06-28 | 2020-06-28 | 基于人工智能的法律咨询交互方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010594186.3A CN111753071B (zh) | 2020-06-28 | 2020-06-28 | 基于人工智能的法律咨询交互方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111753071A CN111753071A (zh) | 2020-10-09 |
CN111753071B true CN111753071B (zh) | 2023-09-05 |
Family
ID=72677443
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010594186.3A Active CN111753071B (zh) | 2020-06-28 | 2020-06-28 | 基于人工智能的法律咨询交互方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111753071B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113127600B (zh) * | 2021-03-23 | 2024-04-26 | 北京法集科技发展有限公司 | 一种信息检索方法、装置、电子设备和存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007004756A (ja) * | 2005-06-27 | 2007-01-11 | Kikuo Akagane | 判例自動検索 |
CN104484433A (zh) * | 2014-12-19 | 2015-04-01 | 东南大学 | 一种基于机器学习的图书本体匹配方法 |
CN106503239A (zh) * | 2016-11-07 | 2017-03-15 | 上海智臻智能网络科技股份有限公司 | 一种法律信息查询的方法和装置 |
CN109086371A (zh) * | 2018-07-20 | 2018-12-25 | 吴怡 | 一种用于法律咨询的语义网交互系统及交互方法 |
KR20190022030A (ko) * | 2017-08-25 | 2019-03-06 | 리걸테크 주식회사 | 법률 상담 서비스 제공 장치 및 방법 |
CN110738511A (zh) * | 2019-09-06 | 2020-01-31 | 苏宁金融科技(南京)有限公司 | 智能客服方法及装置 |
JP2020047209A (ja) * | 2018-09-21 | 2020-03-26 | 沖電気工業株式会社 | オントロジー処理装置およびオントロジー処理プログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7392185B2 (en) * | 1999-11-12 | 2008-06-24 | Phoenix Solutions, Inc. | Speech based learning/training system using semantic decoding |
-
2020
- 2020-06-28 CN CN202010594186.3A patent/CN111753071B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007004756A (ja) * | 2005-06-27 | 2007-01-11 | Kikuo Akagane | 判例自動検索 |
CN104484433A (zh) * | 2014-12-19 | 2015-04-01 | 东南大学 | 一种基于机器学习的图书本体匹配方法 |
CN106503239A (zh) * | 2016-11-07 | 2017-03-15 | 上海智臻智能网络科技股份有限公司 | 一种法律信息查询的方法和装置 |
KR20190022030A (ko) * | 2017-08-25 | 2019-03-06 | 리걸테크 주식회사 | 법률 상담 서비스 제공 장치 및 방법 |
CN109086371A (zh) * | 2018-07-20 | 2018-12-25 | 吴怡 | 一种用于法律咨询的语义网交互系统及交互方法 |
JP2020047209A (ja) * | 2018-09-21 | 2020-03-26 | 沖電気工業株式会社 | オントロジー処理装置およびオントロジー処理プログラム |
CN110738511A (zh) * | 2019-09-06 | 2020-01-31 | 苏宁金融科技(南京)有限公司 | 智能客服方法及装置 |
Non-Patent Citations (1)
Title |
---|
基于Android平台的法律咨询系统的设计研究;孙立平;吕云峰;;电子测试(第18期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111753071A (zh) | 2020-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110266899B (zh) | 客户意图的识别方法和客服系统 | |
CN109241258A (zh) | 一种应用税务领域的深度学习智能问答系统 | |
KR20140042994A (ko) | 가상 에이전트와의 대화 내용에서 자동으로 추출되는 개인 프로파일링 정보를 이용한 자동학습 기반의 인공지능 대화 시스템 | |
CN111666380A (zh) | 一种智能呼叫方法、装置、设备和介质 | |
US20230394247A1 (en) | Human-machine collaborative conversation interaction system and method | |
US11861316B2 (en) | Detection of relational language in human-computer conversation | |
CN109902957A (zh) | 一种数据处理方法和装置 | |
CN112508311B (zh) | 基于语音交互实现危险性预测的数据处理方法及装置 | |
CN111191450A (zh) | 语料清洗方法、语料录入设备及计算机可读存储介质 | |
CN111753071B (zh) | 基于人工智能的法律咨询交互方法及装置 | |
CN112765974A (zh) | 一种业务辅助方法、电子设备及可读存储介质 | |
CN114186040A (zh) | 一种智能机器人客服的运作方法 | |
CN111259124A (zh) | 对话管理方法、装置、系统及存储介质 | |
CN116450799B (zh) | 一种应用于交通管理服务的智能对话方法及设备 | |
CN116303951A (zh) | 对话处理方法、装置、电子设备和存储介质 | |
CN111159383A (zh) | 基于目标对象的法律意见书生成系统 | |
CN113505606B (zh) | 一种培训信息获取方法、装置、电子设备及存储介质 | |
CN115510213A (zh) | 用于作业机械的问答方法及系统、作业机械 | |
CN112506405B (zh) | 一种基于互联网监管领域的人工智能语音大屏指挥方法 | |
CN113761081A (zh) | 一种用于对企业信息进行多维度组合检索的方法及其系统 | |
CN113821625A (zh) | 基于人工智能的话术推荐方法、装置、设备及介质 | |
CN113139058A (zh) | 一种用户障碍识别方法和系统 | |
CN112951429A (zh) | 用于中小学生心理危机筛查的信息处理方法及装置 | |
CN111985248A (zh) | 一种信息交互方法以及装置 | |
KR20210000624A (ko) | 챗봇 대화 패턴 매칭 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |