发明内容
本发明意在提供能够应用于法律自助咨询的一种法律意见咨询数据库。
为达到以上目的,提供如下方案:
方案一:法律意见咨询数据库,包括法律条文存储模块、关系存储模块、问题采集存储模块、要素提取模块和案件存储模块;
所述法律条文存储模块,用来分类存储并实时更新各类法律条文以及用来区分每个法律条文的标签;
所述关系存储模块,用来存储各个分类法律条文对应的优先级,以及该法律条文与另外法律条文的关联度;用来通过标签的层级关系建立各个法律条文的对应关系;
所述问题采集存储模块,用来采集并存储咨询者的咨询问题;
所述要素提取模块,定义用来表征关键词的要素词,并根据要素词从咨询问题中提取出表征该咨询问题的关键词;
所述案件存储模块,存储有咨询模型,所述咨询模型输入咨询问题的关键词,并将该关键词与标签进行对比,找出与关键词匹配的标签,从法律条文存储模块中提取该标签对应的法律条文形成咨询答案输出反馈给咨询者。
名词解释;:
法律条文:指的是经过法律专家截取,能够直接利用到案件结果描述的完整词句。
本方案的效果及优点在于:
通过问题采集存储模块,采集并存储咨询者提出的咨询问题。通过要素提取模块,定义要素词,将咨询问题翻译成多个关键词。使咨询问题能够和法律条文一样都是用词语标注定义的。再将这些关键词与法律条文的标签进行对比匹配,自动找到该咨询问题对应的法律条文反馈给咨询者。运用此数据库,使咨询者能够通过自己的咨询问题自助获取对应的法律条文支持。
本方案能够一对一地解决咨询者提供的法律咨询服务。
进一步,还包括用户信息存储模块,所述用户信息存储模块,用来存储并更新用户信息。
通过用户存储模块存储记录用户信息,方便对咨询各类问题的人群进行统计,有助于为相关部门提供政策分析数据。
进一步,所述案件存储模块内预先存储有法律咨询意见书模板,咨询模型从法律条文存储模块中接收被提取出来的法律条文,咨询模型从问题采集存储模块中提取对应的咨询问题,在法律咨询意见书模板的基础上形成法律咨询意见书。
通过咨询问题的录入和查找到的法律条文,自动形成法律咨询意见书,以供咨询者查看阅读。法律咨询意见书作为咨询模型输出的咨询答案反馈给咨询者,使咨询者得到的咨询答案更加直观,易于被接收。
进一步,所述案件存储模块按照标签的优先级进行法律条文推送。
一个咨询问题对应多个关键词,而每个关键词对应的标签又对应多个法律条文,而每个法律条文的相同标签其优先级不同,优先推送优先级较高的法律条文,这样形成的法律意见书就会将与咨询问题最相关的法律条文放在最上面,使咨询者能够快速地看到对他而言最为重要的意见。
进一步,所述案件存储模块推送标签对应的法律条文时按照关联度等级从高到低推送关联法律条文。
大多数的普通人,在描述咨询问题的时候有可能会出现词不达意的问题,通过关联度的设置,能够在进行多轮会话之后,准确地获取咨询者需要表达的咨询问题,进而准确地反馈出对应的法律条文。
本发明还提供了一种能够进行法律咨询自助服务的法律意见咨询数据库的构建方法。
为了达到以上目的,包括如下步骤:
步骤一,通过问题采集存储模块采集并存储咨询者的咨询问题;
步骤二,要素提取模块按照存储的要素词从咨询问题中提取表征该咨询问题的关键词并统计每个关键词出现的次数;
步骤三,要素提取模块将出现最多次数的关键词作为新的要素词进行保存,形成新的要素词组;
步骤四,按照新的要素词组增加每个法律条文存储模块中标签形成新的标签组。
本方法的优点在于:
本方法构建的数据库,分类在法律条文存储模块中进行法律条文存储,而每个法律条文对应有标签组来形成检索该法律条文的索引。通过对咨询者咨询问题的采集和提取,不断形成新的要素词,使每个咨询问题能够更加准确地翻译成关键词。越来越精确化的要素词对应同步增加的标签,使一个咨询问题的关键词组能够精确地与每个法律条文的标签组进行对比,能够针对咨询问题给出精确的法律条文阐述,进而形成匹配性较高的法律意见书。有效提高法律咨询自助服务的准确性。
实施例基本如附图1所示:法律意见咨询数据库,包括法律条文存储模块、关系存储模块、问题采集存储模块、要素提取模块、语义识别模块、用户信息存储模块、案件存储模块。
法律条文存储模块,用来存储法律条文对应表,用来按照法律类别和章节进行逐层分类存储并实时更新各类法律条文;法律条文对应表中,包括多条法律条文以及对应每个法律条文的标签组,标签组包括所有用来表示该条法律条文特征的多个标签,具体包括用来表示该法律条文内容的概括词、用来表示该法律条文隶属某部法典某个章节的分类词、用来表示该法律条文在数据库中访问优先级顺序的等级词、用来表示该法律条文与其他法律条文相关性的关联词、以及能够用来表示该法律条文特征的其他词,比如用来描述该法律条文经常出现的地域、相关当事人的年龄阶段、性别等的词语。这里的法律条文,指的是有效的法律、法规、法典中的按照完整意思进行划分的法律原文句子。概括词是由法律专家在该句子提取的,表示其法律因果关系和条件关系的各个重点词语。每个法律条文中概括词之间具体是因果关系还是条件关系,由每个法律条文本身的法律意思决定。
关系存储模块,用来存储各个分类法律条文的等级词对应的优先级,以及每个法律条文与另外法律条文的关联词对应的关联等级;用来存储同一部法律、法规或者法典中,各个法律条文之间的章节关系、从属关系,建立成一个类似树状结构的关系图。用来存储不同法律、法规或者法典中,每个法律条文和另外一部法律、法规、法典中的法律条文之间的关系,形成一个类似网状结构的关系图。
问题采集存储模块,用来存储咨询者提出的咨询问题;咨询问题的采集方式有多种,可以是直接文本输入,也可以是通过语音输入或者图像输入后进行语义识别提取后再转变成文本输入。本实施例中的问题采集模块存储模块可以连接能够进行声音拾取的拾音器,或者用来进行文字信息输入的触摸屏,也连接直接或者连接能够进行声音拾取的拾音器,通过触摸屏直接将咨询问题写成文本输入发送到问题采集存储模块中,通过拾音器将咨询问题通过语音输入到现有的科大讯飞语音识别器中,科大讯飞语音识别器将语音输入转变为文本输入后发送到问题采集存储模块中。
要素提取模块,定义用来表征关键词的要素词,并根据要素词从网络输入信息中提取信息的咨询问题中提取出表征该咨询问题的关键词;并记录关键词出现的次数。要素,指的是法律专家根据法条制定的用来判断一个案件所需要的各种条件,要素词就是描述这些要素的词语,而关键词就是各个咨询问题针对每个要素词,在当前咨询问题所体现的案件中表现出来的,满足要素词的具体内容。
在要素提取模块和问题采集存储模块之间设置有类似语义网;的语义识别模块。一般而言,普通大众在提出咨询问题的时候,都非常口语化,很多词语都不专业不准确,通过语义识别模块,能够将口语化的咨询问题转化为由法律专业术语重新描述的法律词汇组成的句子。
其中,语义网识别模块中包括用来存储各个法律专业词汇的词汇存储模块;通过,语义识别模块将输入网络的词语问题采集存储模块中已经转化为文本信息的咨询问题与词汇存储模块中的法律专业词汇进行对比,将咨询问题转化成一个个用法律专业词汇表示的关键词。为了提高咨询问题法律转化的精度,在词汇存储模块中设置有同义词词库和同音词词库,每个词汇上都同样有表示优先选择顺序的属性词标记,使同一个句子中的法律专业词汇优先被提取出来成为关键词。与咨询问题中相同的同义词或者同音词,其属性词标记优先级越高的词语,越容易被选作替换咨询问题的词语。而在后面提取关键词的时候,同一个句子中的法律专业词汇其属性词的优先级越高则越容易被提取为关键词。属性词的优先级与各个词汇被选用的次数正相关,某个词汇被选用得越多,其属性优先级就越高。本实施例中,语义识别模块可以直接以语义网的形式存在。
用户信息存储模块,用来存储并更新用户信息;该用户信息,主要包括咨询者信息和当事人信息,如果咨询者和当事人是一个人,则只记录其中一个。通过收集记录用户信息,能够尽可能地记录某一具体案件的相关人员信息,进而通过该案件发生的地域、案件种类来区分不同的人群,为有关部门立法、修法以及相关政策的调整和决策提供数据支持。其中,当事人信息,至少包括年龄、性别、出生地、居住地、国籍等基本信息,这些基本信息与法律条文存储模块中各个法律条文的标签中的其他词相呼应,使利用当事人信息能够在法律条文选择上更加精准。
案件存储模块,存储有咨询模型,所述咨询模型包括多个法律咨询意见书模板以及与每个法律咨询意见书模板对应的判断模型;每个判断模型均采用决策树模型,每个判断模型均包括多个输入因素和输出因素。输入因素由多个要素词组成。输入因素中的要素词是针对咨询问题而言的。输出因素由多个预先设置的引导词组成,输出因素中的引导词是针对法律条文而言的。不同的判断模型,其输入因素和输出因素的设置内容不同。
首先,咨询模型将逐一将按照所有判断模型的要素词从语义识别模块中已经法律语言专业化的咨询问题提取关键词,当一个判断模型的所有要素词都能够从该咨询问题中提取出关键词,则选用该判断模型作为当前使用模型进行模型计算。若同时有多个判断模型都满足要求,则同时使用多个判断模型进行分别计算,得出多个咨询答案。这种情况,适合同一个案件涉及到不同法律的情况。
判断模型在计算的时候,按照该判断模型形成的决策树,从所有关键词中选出输入因素对应的关键词输入到决策树模型中,根据决策树的各个节点以及对应的次级输入因素,从剩下的关键词中依次选择对应每个节点的关键词,最后按照决策树的结构得到输出因素,将输出因素的引导词,与法律条文存储模块中各个法律条文的各个标签进行对比,找出与引导词匹配的标签,从法律条文存储模块中提取该标签对应的法律条文,作为咨询答案输出。为了使咨询者更加直观地获得专业法律咨询意见,将提取的法律条文以及采集到的输入因素和所有次级输入因素一起求并集,将所有信息都填写到法律意见咨询书的对应位置上,形成完整的法律意见咨询书。
为了保证法律意见咨询书的准确,在具体形成法律意见咨询书的时候,从问题采集存储模块和用户信息存储模块提取同一时间节点,同一咨询者的同一案件,并按照要素提取模块和案件存储模块,从法律条文模块中提取出该咨询问题对应的法律条文,整合形成法律意见咨询文件。
问题采集存储模块,为了获取完整的案件信息输入,会通过要素提取模块和关系存储模块,形成与咨询者表述内容相关的多个问题,与咨询者形成交互沟通,直至所有与咨询者描述相关联的所有问题都问完后,将咨询者的所有描述信息,形成完整的咨询问题。
具体地,当问题采集存储模块接收到咨询者的初始描述内容后,语义识别模块从中按照要素提取模块中的所有要素提取关键词,并将这些关键词直接与法律条文模块中各个法律条文的标签进行对比,在法律条文模块中寻找到对应的法律条文,并根据关系存储模块中寻找该法律条文关联度从高到低的其他法律条文,因为法律条文模块中针对每个法律条文预先设置有相应的引导问题,依次将这些引导问题反馈给咨询者,引导咨询者进行回答,使问题采集存储模块能够获得更加充分的案件信息,直至咨询者的描述内容不会再引发出新的关联法律条文,且所有关联的引导问题都询问完毕,此时问题采集存储模块收集到的所有描述内容,就是该案件的咨询问题。
在构建法律意见咨询数据库时,首先,通过法律专家将所有法律条文进行截取、拆分后分类存储到法律条纹存储模块中,并针对每一个完整解释的法律条文语句进行备注标记形成由多个标签组成的标签组,在这些标签中,至少包括表明该法律条文属于哪个法律哪个章节的分类词、表示该法律条文内容概括的概括词、表示该法律条文每个标签优先级的等级词、表示该法律条文与其他法律条文关联度的关联词,以及用来表示该法律条文出现次数或者常出现地域等其他属性的其他词。
然后,对于所有法律条文的所有标签按照法律条文的从属关系、章节关系、关联关系等进行标签关系定义,使所有标签能够形成一个从上往下的关系网。
第三,将问题采集存储模块的初始值为零,当用户端开始采集咨询者的咨询问题后,记录并存储咨询问题,提取咨询问题中的关键词,将关键词相同个数多的咨询问题进行分类存储和更新。
第四,在要素提取模块中,存储原始要素词,以及这些要素词对应的优先级和关联度,在用户端开始采集咨询问题后,从所有咨询问题中自动获取出现次数最多的要素词提高其优先级,使下次进行关键词提取的时候,优先提取该要素词对应的关键词。
第五,将用户信息存储模块的原始存储设置为零,当用户端开始工作后,按照要素提取模块中属于用户信息的要素词进行用户信息收集和更新。
第六,在案件存储模块,预先存储多个判断模型以及与判断模型一一对应的法律意见书模板,以同一时间节点,同一咨询者提出的咨询问题为基础,根据要素提取模块中的要素词提取咨询问题中的关键词,并根据选择的判断模型,将满足其输入因素的关键词输入到判断模型中,经过决策树的判断,得到输出因素。根据输出因素中的引导词,在法律条文存储模块中寻找与这些引导词相同的标签,提取这些标签对应的法律条文和咨询者咨询的咨询问题一起,作为内容填写进法律意见书模板中,形成法律意见书。
举个例子,有个咨询者向在采集端前讲述了一个关于离婚的描述,咨询者可以采用口述或者说是笔写来进行事件描述,在描述的同时,采集端将获取到的描述信息发送给问题采集模块,语义识别模块将这些描述信息划分成一个个词语,并且将这些词语同义词词库或者说同音词词库中的口语词汇进行对比,找到与之相同或者同音的口语词汇,并将该口语词汇对应的法律词汇替换掉对应的词语,若一个口语词汇对应多个法律词汇,则选择属性词优先级最高的那个法律词汇。咨询者向采集端提供的所有描述信息都逐渐被存储到问题采集存储模块中,直至采集终端终止对该案件描述信息的采集为止,同一个案件的同一个咨询者在同一个时间范围内的所有案件描述信息构成一个咨询问题。咨询问题中同一时间范围和同一咨询者以及同一案件,这些信息都是采集端在采集时利用现有技术直接得到的,比如利用直接询问咨询者的用户信息或者直接是采集端在进行通信的时候产生的物理层面上的自动计时、唯一访问用户名、IP地址等现有手段来进行定义。
在要素提取模块中,预先存储有用来定义要求的一些类别词语,如涉及法律名称、男方姓名、女方姓名、过错描述等。当咨询问题在持续采集还没有结束的时候,要素提取模块就会对经过语义识别模块翻译后的法律问题进行关键词提取,此时的法律问题因为咨询问题没有采集完毕,法律问题也没有转化完毕,都是同时进行的状态,这样有利于快速进行信息识别,也方便控制采集端采集到足够完整的案件描述信息来构成完整的咨询问题。在本例中咨询者描述的是一个关于离婚的案件,那么按照要素词法律名称对应属于该类词的集合中,很快能够将咨询者提供的案件描述信息中的“婚姻”两个字与集合中的“婚姻法”中的婚姻两个字匹配成功,使婚姻两个字能够作为该要素词对应的关键词提取出来,以此类推,也会提取出来过错描述为出轨,在采集端采集的过程中,通过已有被提取出来的关键词与法律条文存储模块中的标签进行对比,找到对应的法律条文,再通过关系模块找到与这些法律条文关联的另外的法律条文,将每个被找出的法律条文对应存储的提问问题发送给咨询者回答,其中提问问题指的是预先存储的用来在接收到咨询者的咨询问题以及相应对话后,用来向咨询者提问,以便咨询者提供更多相关信息的预设问题。使咨询者在描述案件不完善的时候,由采集端和显示端对咨询者以问题的方式进行询问。在从关系模块进行关联法律条文及问题选择的时候,按照关联度的等级从大到小进行推送。直至出现重复的法律条文和提问问题的时候,说明所有关联法律条文及对应问题已经问完,此时采集端和显示端停止就这一案件与咨询者的继续交互沟通,在问题采集存储模块中形成完整的咨询问题,进而通过语义识别模块的识别获取完整的法律问题。
要素提取模块继续从法律问题上提取关键词,直至该法律问题按照案件处理模块中所有输入因素对应的要素词提取完毕关键词为止。因为咨询模型包括多个判断模型,而每个判断模型的输入因素包含的要素词不同,一般一个咨询问题若是独立的案件,则其被提取出来的关键词只能完全满足一个判断模型的输入因素,此时这个被满足的判断模型即为该咨询问题需要使用的判断模型。如,本例中是离婚案件,那么其被提取出来的关键词基本上是与婚姻法对应的判断模型相关的词语,比如说出轨、小三、家暴、结婚、离婚等,而很少会出现杀人、放火、盗窃等其他类型法律中判断会出现的词语。
在选定判断模型后,该判定模型是预先设置了输入因素输入和次级输入因素输入,最后通过不断的选择判断按照决策树算法构建的决策树模型。比如,本例中的婚姻法的判断模型中,第一级的决策树的要素词是双方都是现役军人或者双方都不是现役军人,该要素词对应的描述词有是军人、都是军人、都不是军人等,通过对比该法律问题的所有关键词进行选择,该输入因素对应的要素词为军人,若经过对比后选择了都不是军人,则进入到下一级的运算,男方是否存在重婚,该要素词对应的描述词是重婚、两次婚等,然后案件处理模块继续在所有关键词中寻找是否有与这些描述词相同或者相近的关键词,进而进入下一级的计算。除了第一级中输入的因素我们称之为输入因素外,其他的我们都习惯性称呼为次级输入因素。每个法律类型的判断模型都是严格按照其相关法律的判断思路构建的体现法律规则的决策树模型。当最后计算完毕后,得到的结果为预先存储的某些引导词。本例中的咨询问题在经过计算后得到的引导词是“婚姻法第32条”,案件处理模块按照这个引导词与法律条文存储模块中的各个标签进行对比,找到与之匹配的法律条文,将婚姻法第32条的法律条文内容作为咨询答案的一部分反馈给咨询者。因为咨询模型中针对每个判断模型存储有法律意见书模板,法律意见书模板上的自动填充栏上设置了各个构成法律意见书的要素词,按照现有技术,自动将在判断模型判断过程中提取的要素词对应的关键词内容以及判断模型中每个决策节点后产生的结果都填充到对应的自动填充栏上,形成一个完整的离婚法律意见书。
法律意见书的生成以及案件的合理判断都依赖于咨询者提供的咨询问题的真实可靠,然而,若没有经过证明,很难识别咨询者陈述内容是否真实,而在判案过程中,都需要用证据来证明法律事实,而在这些证据当中,发票是最常用也最容易获得的证据。采集端上设置有摄像头和紫光灯,摄像头在拍摄发票时打开紫光灯,通过现有的图像对比技术,将拍摄形成的发票照片与预先存储的荧光照片进行对比,用来识别发票照片是否存在荧光,若存在荧光则证明该发票是真实的。那么该发票对应的法律事实也被认定为真实的,在此前提之下形成的法律意见书具有更加有利的证明效力。
同时,进一步证明咨询者提供的法律事实真实可靠,通过在采集端上设置的拾音器完整记录咨询者的所有咨询问题以及对应的所有描述,使咨询者能够在以后无法否认自己曾经描述的法律事实,形成一种对咨询者的约束,使咨询者能够通过自身的行为自证其描述的内容真实。采集端将拾音器录取的音频原样保存,采集端将系统在与咨询者互动中给出的所有信息转换成文本信息同步保存。这样能够通过对系统和咨询者之间的互动问答记录完整的对话,有助于在以后查询时通过对话理解咨询者表达的真实意思。同时,通过对咨询者音频的无损、原样保存,避免了后面有可能出现的造假操作,使原样保存的音频更加具有证明效力。
以上所述的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。