CN113868413A - 法律咨询报告生成方法及装置 - Google Patents

法律咨询报告生成方法及装置 Download PDF

Info

Publication number
CN113868413A
CN113868413A CN202111467349.2A CN202111467349A CN113868413A CN 113868413 A CN113868413 A CN 113868413A CN 202111467349 A CN202111467349 A CN 202111467349A CN 113868413 A CN113868413 A CN 113868413A
Authority
CN
China
Prior art keywords
legal
consultation
logical relation
report generation
sentence pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111467349.2A
Other languages
English (en)
Other versions
CN113868413B (zh
Inventor
杨晓雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202111467349.2A priority Critical patent/CN113868413B/zh
Publication of CN113868413A publication Critical patent/CN113868413A/zh
Application granted granted Critical
Publication of CN113868413B publication Critical patent/CN113868413B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Tourism & Hospitality (AREA)
  • Human Computer Interaction (AREA)
  • Technology Law (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种法律咨询报告生成方法及装置,该方法包括:获取基于用户咨询问题生成的咨询结果及对应的触发条件,所述咨询结果及对应的触发条件为采用逻辑关系句式表示的原子句,所述逻辑关系句式包括多个逻辑关系字段的值;将多个原子句拆解后的逻辑关系句式输入至法律咨询报告生成模型中,获得输出的多个子句,所述法律咨询报告生成模型是以采用逻辑关系句式表示的历史文本数据为输入,以子句为输出进行模型训练获得的;基于多个子句,获得法律咨询报告。本发明可以基于用户咨询问题动态地生成法律咨询报告,报告生成效率高,且生成的法律咨询报告更流畅。

Description

法律咨询报告生成方法及装置
技术领域
本发明涉及人工智能领域,尤其涉及一种法律咨询报告生成方法及装置。
背景技术
当前法律专业知识和服务资源供给无法满足广大民众的庞大需求,急需智能式的法律问答系统来解决现实法律服务资源紧缺的问题。
在法律问答系统中,基于用户咨询的法律问题,最终需要生成咨询报告给用户提供法律结论,因此法律咨询报告需要易读易理解的、以自然语言形式呈现。现有的法律咨询报告生成方法多是采用关键词检索,针对用户提出的问题,以关键字为搜索条件匹配相应答案然后生成报告。但由于用户的法律知识各异,同一个法律问题的表述千差万别,这导致同一个关键词可能会找到不同的答案,因此需要改进关键词匹配的方法,确定用户真正想要咨询的法律问题。
发明内容
本发明实施例提出一种法律咨询报告生成方法,用以基于用户咨询问题动态地生成法律咨询报告,报告生成效率高,且生成的法律咨询报告更流畅,该方法包括:
获取基于用户咨询问题生成的多条咨询结果及对应的触发条件,所述咨询结果及对应的触发条件为采用逻辑关系句式表示的原子句,所述逻辑关系句式包括多个逻辑关系字段的值;
将多个原子句拆解后的逻辑关系句式输入至法律咨询报告生成模型中,获得输出的多个子句,所述法律咨询报告生成模型是以采用逻辑关系句式表示的历史文本数据为输入,以子句为输出进行模型训练获得的;
基于多个子句,获得法律咨询报告。
本发明实施例提出一种法律咨询报告生成装置,用以基于用户咨询问题动态地生成法律咨询报告,报告生成效率高,且生成的法律咨询报告更流畅,该装置包括:
咨询结果获得模块,用于获取基于用户咨询问题生成的多条咨询结果及对应的触发条件,所述咨询结果及对应的触发条件为采用逻辑关系句式表示的原子句,所述逻辑关系句式包括多个逻辑关系字段的值;
子句获得模块,用于将多个原子句拆解后的逻辑关系句式输入至法律咨询报告生成模型中,获得输出的多个子句,所述法律咨询报告生成模型是以采用逻辑关系句式表示的历史文本数据为输入,以子句为输出进行模型训练获得的;
报告生成模块,用于基于多个子句,获得法律咨询报告。
本发明实施例还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述法律咨询报告生成方法。
本发明实施例还提出了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述法律咨询报告生成方法的计算机程序。
在本发明实施例中,获取基于用户咨询问题生成的多条咨询结果及对应的触发条件,所述咨询结果及对应的触发条件为采用逻辑关系句式表示的原子句,所述逻辑关系句式包括多个逻辑关系字段的值;将多个原子句拆解后的逻辑关系句式输入至法律咨询报告生成模型中,获得输出的多个子句,所述法律咨询报告生成模型是以采用逻辑关系句式表示的历史文本数据为输入,以子句为输出进行模型训练获得的;基于多个子句,获得法律咨询报告。在上述过程中,将咨询结果及对应的触发条件以子句形式输出,使输出更符合法律语言输出特点,缩小词典数量,效率高,避免了传统以token输出形成的冗余,且子句的形式使得报告更流畅;另外,所述子句是通过将多个原子句拆解后的逻辑关系句式输入至法律咨询报告生成模型中获得的,所述逻辑关系句式使得咨询结果及对应的触发条件表示更准确,法律咨询报告生成模型则大大提高了报告生成的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中法律咨询报告生成方法的流程图;
图2为本发明实施例中Encoder-Decoder模型框架的示意图;
图3为本发明实施例中改进的Transformer模型的编码器Encoder部分;
图4和图5为本发明实施例中法律咨询报告展示示意图;
图6为本发明实施例中法律咨询报告生成装置的示意图;
图7为本发明实施例中计算机设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
在本说明书的描述中,所使用的“包含”、“包括”、“具有”、“含有”等,均为开放性的用语,即意指包含但不限于。参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本申请的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
图1为本发明实施例中法律咨询报告生成方法的流程图,如图1所示,该方法包括:
步骤101,获取基于用户咨询问题生成的多条咨询结果及对应的触发条件,所述咨询结果及对应的触发条件为采用逻辑关系句式表示的原子句,所述逻辑关系句式包括多个逻辑关系字段的值;
步骤102,将多个原子句拆解后的逻辑关系句式输入至法律咨询报告生成模型中,获得输出的多个子句,所述法律咨询报告生成模型是以采用逻辑关系句式表示的历史文本数据为输入,以子句为输出进行模型训练获得的;
步骤103,基于多个子句,获得法律咨询报告。
在本发明实施例中,将咨询结果及对应的触发条件以子句形式输出,使输出更符合法律语言输出特点,缩小词典数量,效率高,避免了传统以token输出形成的冗余,且子句的形式使得报告更流畅;另外,所述子句是通过将多个原子句拆解后的逻辑关系句式输入至法律咨询报告生成模型中获得的,所述逻辑关系句式使得咨询结果及对应的触发条件表示更准确,法律咨询报告生成模型则大大提高了报告生成的效率。
在步骤101中,获取基于用户咨询问题生成的多条咨询结果及对应的触发条件,所述咨询结果及对应的触发条件为采用逻辑关系句式表示的原子句,所述逻辑关系句式包括多个逻辑关系字段的值。
需要说明的是,用户可能涉及到多个领域,具体可以划分为婚姻家庭领域、劳动用工领域等等,每个领域包括多个问题,以婚姻家庭关系领域为例,针对的问题可以归纳为婚姻问题和非婚姻问题。婚姻问题可以进一步分为婚姻关系问题、子女关系问题、财产分割问题、诉讼管辖问题等;非婚姻问题可以分为彩礼财物归属问题、重婚认定问题、同居关系认定问题等。
其中,咨询结果是基于用户咨询问题,在大量法律知识的基础上,通过不断与用户进行交互,包括多轮提问和回答,最后形成的。其中,法律知识包括法律、法规和司法解释等。触发条件包括根据用户咨询问题分析出的已知条件,还包括基于用户咨询问题在知识图谱的基础上分析获得的中间结论。也就是法律咨询报告不止包括咨询结果,也包括获得咨询结果的具体分析,而且这些分析是基于触发条件获得的。所述咨询结果及对应的触发条件为采用逻辑关系句式表示的原子句,所述逻辑关系句式包括多个逻辑关系字段的值,所述逻辑关系字段包括实体字段、属性字段和取值字段。
该逻辑关系句式可表示为:
前提条件 (实体,属性,取值);
一般情况下,前提条件可以为“非”、“是”等,在前提条件为“是”时,可以省略。
实体是人、行为、事物等现实存在,例如,婚姻家庭案件中的法律实体可以被区分为法律关系上的主体和客体等。主体可细分为妻父母、夫父母、妻、夫、子女(男、女)、法人以及单位、组织、机构等。客体可分为不动产、动产、股权和期权以及相关的非物质财富和行为等。以上这些实体是形成相对应的法律关系的主体和客体。
属性指的是实体一些性质、特点、状况、状态等方面的法定的关联或者规定,其既体现作为实体事物本身的一种自然性,也具有复杂的社会性。
取值指的是实体与属性之间的关联的真与假的状况。
例如,原子句“男方/女方患有疾病Z”可拆解为:
[男方/女方].[ 疾病Z]=1
其中,“男方/女方”为实体,“疾病Z”为属性,“1”为取值。
在步骤102中,将多个原子句拆解后的逻辑关系句式输入至法律咨询报告生成模型中,获得输出的多个子句,所述法律咨询报告生成模型是以采用逻辑关系句式表示的历史文本数据为输入,以子句为输出进行模型训练获得的。
在一实施例中,所述法律咨询报告生成模型包括编码器和解码器。
也就是,法律咨询报告生成模型采用Encoder(编码器)-Decoder(解码器)模型框架,图2为本发明实施例中Encoder-Decoder模型框架的示意图,但有别于标准的Encoder-Decoder模型框架,本发明实施例中法律咨询报告生成模型的输出并非是以token来计算,而是一个子句的ID。
相比于传统GPT算法的按照字或单词的输出,子句输出一方面可以有效降低法律咨询报告生成模型所需要训练的文本规模(一版语言模型至少需要上百兆文本进行学习),并且子句的正确性可以由人预先定义和验证,避免产生错误的报告内容。另外,在速度上也有很大的优势。这极大减小了所需要输出的词典大小,因为常见汉字的规模在3000字以上,而这里所需要用到的拆分后的子句形成的段落不超过100段,并且生成的速度在30倍以上。
假设咨询结果及对应的触发条件表示为:
Figure 51678DEST_PATH_IMAGE001
其中,
Figure 437660DEST_PATH_IMAGE002
为咨询结果或触发条件;实体
Figure 686239DEST_PATH_IMAGE003
、属性
Figure 301022DEST_PATH_IMAGE004
、取值
Figure 849815DEST_PATH_IMAGE005
为三元组。
而最后输出的子句是由专家根据现有的法律知识提前准备好的易于普通的非法律专业的用户理解的句子。这些子句可形成一个段落。
所述段落也形成一个序列:
Figure 141119DEST_PATH_IMAGE006
其中,
Figure 142573DEST_PATH_IMAGE007
为一个字符串描述。
而Encoder-Decoder模型框架的原理如下:
Figure 75894DEST_PATH_IMAGE008
在一实施例中,所述编码器采用改进的Transformer模型的编码器实现,所述改进的Transformer模型的编码器采用逻辑关系句式表示的输入代替Transformer模型的编码器的输入。发明人注意到,传统的Transformer模型应用时,为编码每个token的信息,输入为字嵌入+每个字的位置信息,可表示为:
Figure 479193DEST_PATH_IMAGE009
其中,
Figure 456246DEST_PATH_IMAGE010
为原子句
Figure 679416DEST_PATH_IMAGE011
的输入;
Figure 150849DEST_PATH_IMAGE012
为位置信息。
由于事实没有先后关系,而任意交换原子句的顺序都不会改变事实,所以有别于传统的Transformer实现,本发明实施例中,对于原子句的理解并不是一个序列,而是一个集合。因此,采用逻辑关系句式表示的输入代替Transformer模型的编码器的输入,即去掉了Transformer模型的编码器的位置信息Positional Embedding。
在一实施例中,所述逻辑关系句式表示的输入的表达式如下:
Figure 408655DEST_PATH_IMAGE013
其中,
Figure 307341DEST_PATH_IMAGE014
为原子句
Figure 283387DEST_PATH_IMAGE015
对应的输入向量表示;
Figure 43664DEST_PATH_IMAGE016
为原子句
Figure 546189DEST_PATH_IMAGE017
中的实体
Figure 553460DEST_PATH_IMAGE018
对应的输入向量表示;
Figure 16802DEST_PATH_IMAGE019
为原子句
Figure 315191DEST_PATH_IMAGE020
中的属性
Figure 282010DEST_PATH_IMAGE004
对应的输入向量表示;
Figure 788077DEST_PATH_IMAGE021
为原子句
Figure 207557DEST_PATH_IMAGE011
中的取值
Figure 824483DEST_PATH_IMAGE005
对应的输入向量表示。
这样的编码方式,既能够将所需要的原子句进行编码,又不指定具体的绝对位置信息,更有利于编码器的泛化。
图3为本发明实施例中改进的Transformer模型的编码器Encoder部分,在图3中,在逻辑关系句式表示的输入之后,经过Self-attention层,使得Encoder在对每个字进行编码时可以查看该字的前后信息,Encoder的输出会在经过一层Add&Norm层处理。同样地,Feed Forward层一会经过相应的Add&Norm层处理,之后输出归一化的词向量列表。
在一实施例中,所述解码器采用动态卷积Dynamic Convolution实现。传统的Convolution采用的是固定参数的Kernel W对输入信号进行卷积,而Dynamic Convolution通过一个线性函数,根据当前输入信号的向量Xi来构造所采用的卷积核Wc=f(Xi),从而达到更好的泛化效果。
使用动态卷积的结构,一方面其时间复杂度与生成的报告的长度为线性关系,而标准的Transformer中的解码器中的自关注Self-attention为平方关系。另一方面,动态卷积更多考虑临近的段落的关系,可以更好的捕捉临近句子的上下文,让生成的报告更为流畅。
在步骤103中,基于多个子句,获得法律咨询报告。
法律咨询报告包括多个段落,每个段落包括多个子句,其中,除了上述得到的咨询结果及对应的触发条件外,还包括其他专家提前准备好的模板,例如,报告初始段落为:
感谢您对我们的信任和支持,基于您向我们提供的信息,系统生成了如下法律建 议。
再例如,为了方便用户理解,若咨询结果的建议包括“通过诉讼方式解除双方婚姻关系”,那么还可以提供行动指南,所述行动指南包括“向哪个法院起诉”以及“离婚流程是什么样的”等等,除此之外,还可以包括用户咨询问题涉及的相关法律法规。
在一实施例中,所述方法还包括:
在咨询结果有多个时,所述法律咨询报告对每个法律咨询报告进行分页展示。
例如,用户输入的原始咨询问题如下:
你好,男的具有A1的行为,我想离婚,现有一个三周半的女儿,我想争取到孩子。
经过分析,对上述原始咨询问题进行分类,可以获得两个用户咨询问题的类别:抚养权争夺和女方请求离婚。
其中,抚养权争夺对应的咨询结果及对应的触发条件通过本发明实施例提出的方法,可获得多个子句,并形成段落,如下:
因此法院会判决由女方抚养小孩。
同样,女方请求离婚对应的咨询结果及对应的触发条件通过本发明实施例提出的方法,可获得多个子句,并形成段落,如下:
目前,您与男方无法就离婚相关事宜达成一致,因此您需要通过调解或诉讼方式 解除双方婚姻关系。
如果您选择诉讼途径,由于男方在婚姻关系存续期间存在实施行为A或行为Q、行 为W等情形,符合关于夫妻感情破裂法定情形的规定,属于有过错的一方,并且目前不存在 法定保护男方的特殊婚姻形式,因此我们认为法院大概率会支持您的诉讼请求,判决你们 双方离婚。
上述两个法律咨询报告会以分页形式展示,见图4和图5,图4和图5为本发明实施例中法律咨询报告展示示意图,两个法律咨询报告以分页形式进行展示,所述法律咨询报告除了展示用户咨询问题对应的咨询结果及对应的触发条件形成的段落,还展示了相关的行动指南和相关规定,以充分帮助用户理解。
综上所述,在本发明实施例提出的方法中,获取基于用户咨询问题生成的咨询结果及对应的触发条件,所述咨询结果及对应的触发条件为采用逻辑关系句式表示的原子句,所述逻辑关系句式包括多个逻辑关系字段的值;将多个原子句拆解后的逻辑关系句式输入至法律咨询报告生成模型中,获得输出的多个子句,所述法律咨询报告生成模型是以采用逻辑关系句式表示的历史文本数据为输入,以子句为输出进行模型训练获得的;基于多个子句,获得法律咨询报告。在上述过程中,将咨询结果及对应的触发条件以子句形式输出,使输出更符合法律语言输出特点,缩小词典数量,效率高,避免了传统以token输出形成的冗余,且子句的形式使得报告更流畅;另外,所述子句是通过将多个原子句拆解后的逻辑关系句式输入至法律咨询报告生成模型中获得的,所述逻辑关系句式使得咨询结果及对应的触发条件表示更准确,法律咨询报告生成模型则大大提高了报告生成的效率。
本发明实施例还提出一种法律咨询报告生成装置,其原理与法律咨询报告生成方法类似,这里不再赘述。
图6为本发明实施例中法律咨询报告生成装置的示意图,包括:
咨询结果获得模块601,用于获取基于用户咨询问题生成的咨询结果及对应的触发条件,所述咨询结果及对应的触发条件为采用逻辑关系句式表示的原子句,所述逻辑关系句式包括多个逻辑关系字段的值;
子句获得模块602,用于将多个原子句拆解后的逻辑关系句式输入至法律咨询报告生成模型中,获得输出的多个子句,所述法律咨询报告生成模型是以采用逻辑关系句式表示的历史文本数据为输入,以子句为输出进行模型训练获得的;
报告生成模块603,用于基于多个子句,获得法律咨询报告。
在一实施例中,所述逻辑关系字段包括实体字段、属性字段和取值字段。
在一实施例中,所述法律咨询报告生成模型包括编码器和解码器。
在一实施例中,所述编码器采用改进的Transformer模型的编码器实现,所述改进的Transformer模型的编码器采用逻辑关系句式表示的输入代替Transformer模型的编码器的输入。
在一实施例中,所述逻辑关系句式表示的输入的表达式如下:
Figure 895076DEST_PATH_IMAGE013
其中,
Figure 572045DEST_PATH_IMAGE014
为原子句
Figure 682084DEST_PATH_IMAGE015
对应的输入向量表示;
Figure 587854DEST_PATH_IMAGE016
为原子句
Figure 794845DEST_PATH_IMAGE017
中的实体
Figure 377136DEST_PATH_IMAGE018
对应的输入向量表示;
Figure 36787DEST_PATH_IMAGE019
为原子句
Figure 729937DEST_PATH_IMAGE020
中的属性
Figure 525854DEST_PATH_IMAGE004
对应的输入向量表示;
Figure 793893DEST_PATH_IMAGE021
为原子句
Figure 675262DEST_PATH_IMAGE011
中的取值
Figure 437681DEST_PATH_IMAGE005
对应的输入向量表示。
在一实施例中,所述解码器采用动态卷积实现。
在一实施例中,报告生成模块603还用于:
在用户咨询问题有多个时,所述法律咨询报告对每个用户咨询问题对应的法律咨询报告进行分页展示。
综上所述,在本发明实施例提出的装置中,咨询结果获得模块,用于获取基于用户咨询问题生成的咨询结果及对应的触发条件,所述咨询结果及对应的触发条件为采用逻辑关系句式表示的原子句,所述逻辑关系句式包括多个逻辑关系字段的值;子句获得模块,用于将多个原子句拆解后的逻辑关系句式输入至法律咨询报告生成模型中,获得输出的多个子句,所述法律咨询报告生成模型是以采用逻辑关系句式表示的历史文本数据为输入,以子句为输出进行模型训练获得的;报告生成模块,用于基于多个子句,获得法律咨询报告。在上述过程中,将咨询结果及对应的触发条件以子句形式输出,使输出更符合法律语言输出特点,缩小词典数量,避免了传统以token输出形成的冗余,效率高,且子句的形式使得报告更流畅;另外,所述子句是通过将多个原子句拆解后的逻辑关系句式输入至法律咨询报告生成模型中获得的,所述逻辑关系句式使得咨询结果及对应的触发条件表示更准确,法律咨询报告生成模型则大大提高了报告生成的效率。
本申请的实施例还提供一种计算机设备,图7为本发明实施例中计算机设备的示意图,该计算机设备能够实现上述实施例中的法律咨询报告生成方法中全部步骤,所述计算机设备具体包括如下内容:
处理器(processor) 701、存储器(memory) 702、通信接口(CommunicationsInterface) 703和通信总线704;
其中,所述处理器701、存储器702、通信接口703通过所述通信总线704完成相互间的通信;所述通信接口703用于实现服务器端设备、检测设备以及用户端设备等相关设备之间的信息传输;
所述处理器701用于调用所述存储器702中的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中的法律咨询报告生成方法中的全部步骤。
本申请的实施例还提供一种计算机可读存储介质,能够实现上述实施例中的法律咨询报告生成方法中全部步骤,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的法律咨询报告生成方法的全部步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种法律咨询报告生成方法,其特征在于,包括:
获取基于用户咨询问题生成的咨询结果及对应的触发条件,所述咨询结果及对应的触发条件为采用逻辑关系句式表示的原子句,所述逻辑关系句式包括多个逻辑关系字段的值;
将多个原子句拆解后的逻辑关系句式输入至法律咨询报告生成模型中,获得输出的多个子句,所述法律咨询报告生成模型是以采用逻辑关系句式表示的历史文本数据为输入,以子句为输出进行模型训练获得的;
基于多个子句,获得法律咨询报告。
2.如权利要求1所述的法律咨询报告生成方法,其特征在于,所述逻辑关系字段包括实体字段、属性字段和取值字段。
3.如权利要求2所述的法律咨询报告生成方法,其特征在于,所述法律咨询报告生成模型包括编码器和解码器。
4.如权利要求3所述的法律咨询报告生成方法,其特征在于,所述编码器采用改进的Transformer模型的编码器实现,所述改进的Transformer模型的编码器采用逻辑关系句式表示的输入代替Transformer模型的编码器的输入。
5.如权利要求4所述的法律咨询报告生成方法,其特征在于,所述逻辑关系句式表示的输入的表达式如下:
Figure 148210DEST_PATH_IMAGE001
其中,
Figure 72304DEST_PATH_IMAGE002
为原子句
Figure 191701DEST_PATH_IMAGE003
对应的输入向量表示;
Figure 492232DEST_PATH_IMAGE004
为原子句
Figure 528321DEST_PATH_IMAGE005
中的实体
Figure 623316DEST_PATH_IMAGE006
对应的输入向量表示;
Figure 479276DEST_PATH_IMAGE007
为原子句
Figure 583499DEST_PATH_IMAGE008
中的属性
Figure 457783DEST_PATH_IMAGE009
对应的输入向量表示;
Figure 989258DEST_PATH_IMAGE010
为原子句
Figure 332515DEST_PATH_IMAGE011
中的取值
Figure 974849DEST_PATH_IMAGE012
对应的输入向量表示。
6.如权利要求3所述的法律咨询报告生成方法,其特征在于,所述解码器采用动态卷积实现。
7.如权利要求1所述的法律咨询报告生成方法,其特征在于,还包括:
在用户咨询问题有多个时,所述法律咨询报告对每个用户咨询问题对应的法律咨询报告进行分页展示。
8.一种法律咨询报告生成装置,其特征在于,包括:
咨询结果获得模块,用于获取基于用户咨询问题生成的咨询结果及对应的触发条件,所述咨询结果及对应的触发条件为采用逻辑关系句式表示的原子句,所述逻辑关系句式包括多个逻辑关系字段的值;
子句获得模块,用于将多个原子句拆解后的逻辑关系句式输入至法律咨询报告生成模型中,获得输出的多个子句,所述法律咨询报告生成模型是以采用逻辑关系句式表示的历史文本数据为输入,以子句为输出进行模型训练获得的;
报告生成模块,用于基于多个子句,获得法律咨询报告。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至7任一项所述方法的计算机程序。
CN202111467349.2A 2021-12-03 2021-12-03 法律咨询报告生成方法及装置 Active CN113868413B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111467349.2A CN113868413B (zh) 2021-12-03 2021-12-03 法律咨询报告生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111467349.2A CN113868413B (zh) 2021-12-03 2021-12-03 法律咨询报告生成方法及装置

Publications (2)

Publication Number Publication Date
CN113868413A true CN113868413A (zh) 2021-12-31
CN113868413B CN113868413B (zh) 2022-03-18

Family

ID=78985783

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111467349.2A Active CN113868413B (zh) 2021-12-03 2021-12-03 法律咨询报告生成方法及装置

Country Status (1)

Country Link
CN (1) CN113868413B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080306784A1 (en) * 2007-06-05 2008-12-11 Vijay Rajkumar Computer-implemented methods and systems for analyzing clauses of contracts and other business documents
US20090019000A1 (en) * 2007-07-12 2009-01-15 Mitchell Jon Arends Query based rule sets
CN102073919A (zh) * 2010-11-24 2011-05-25 中南大学 一种决策问题智能分析处理方法
CN104834747A (zh) * 2015-05-25 2015-08-12 中国科学院自动化研究所 基于卷积神经网络的短文本分类方法
CN107273350A (zh) * 2017-05-16 2017-10-20 广东电网有限责任公司江门供电局 一种实现智能问答的信息处理方法及其装置
CN110321962A (zh) * 2019-07-09 2019-10-11 北京金山数字娱乐科技有限公司 一种数据处理方法及装置
CN110717009A (zh) * 2019-09-29 2020-01-21 平安直通咨询有限公司上海分公司 一种法律咨询报告的生成方法及设备
US20200134757A1 (en) * 2018-10-30 2020-04-30 International Business Machines Corporation Extracting, deriving, and using legal matter semantics to generate e-discovery queries in an e-discovery system

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080306784A1 (en) * 2007-06-05 2008-12-11 Vijay Rajkumar Computer-implemented methods and systems for analyzing clauses of contracts and other business documents
US20090019000A1 (en) * 2007-07-12 2009-01-15 Mitchell Jon Arends Query based rule sets
CN102073919A (zh) * 2010-11-24 2011-05-25 中南大学 一种决策问题智能分析处理方法
CN104834747A (zh) * 2015-05-25 2015-08-12 中国科学院自动化研究所 基于卷积神经网络的短文本分类方法
CN107273350A (zh) * 2017-05-16 2017-10-20 广东电网有限责任公司江门供电局 一种实现智能问答的信息处理方法及其装置
US20200134757A1 (en) * 2018-10-30 2020-04-30 International Business Machines Corporation Extracting, deriving, and using legal matter semantics to generate e-discovery queries in an e-discovery system
CN110321962A (zh) * 2019-07-09 2019-10-11 北京金山数字娱乐科技有限公司 一种数据处理方法及装置
CN110717009A (zh) * 2019-09-29 2020-01-21 平安直通咨询有限公司上海分公司 一种法律咨询报告的生成方法及设备

Also Published As

Publication number Publication date
CN113868413B (zh) 2022-03-18

Similar Documents

Publication Publication Date Title
US11651236B2 (en) Method for question-and-answer service, question-and-answer service system and storage medium
US20220292269A1 (en) Method and apparatus for acquiring pre-trained model
CN112131366B (zh) 训练文本分类模型及文本分类的方法、装置及存储介质
US9652719B2 (en) Authoring system for bayesian networks automatically extracted from text
US10496749B2 (en) Unified semantics-focused language processing and zero base knowledge building system
JP2022153441A (ja) モデル事前訓練方法および装置、テキスト生成方法および装置、電子機器、記憶媒体並びにコンピュータプログラム
CN110717017A (zh) 一种处理语料的方法
CN107679039A (zh) 用于确定语句意图的方法和装置
CN113127624B (zh) 问答模型的训练方法及装置
CN114565104A (zh) 语言模型的预训练方法、结果推荐方法及相关装置
CN112131881B (zh) 信息抽取方法及装置、电子设备、存储介质
WO2021082086A1 (zh) 机器阅读方法、系统、装置及存储介质
US11699034B2 (en) Hybrid artificial intelligence system for semi-automatic patent infringement analysis
CN110297893A (zh) 自然语言问答方法、装置、计算机装置及存储介质
Modi et al. Review on abstractive text summarization techniques (ATST) for single and multi documents
CN115292457A (zh) 知识问答方法、装置、计算机可读介质及电子设备
Rodrigues et al. Advanced applications of natural language processing for performing information extraction
Pan et al. A BERT-based generation model to transform medical texts to SQL queries for electronic medical records: model development and validation
CN117932022A (zh) 一种智能问答方法、装置、电子设备及存储介质
CN117271558A (zh) 语言查询模型构建方法、查询语言获取方法及相关装置
KR102088619B1 (ko) 검색 결과별 가변적 사용자 인터페이스 제공 시스템 및 방법
CN113886555B (zh) 法律咨询服务方法及装置
CN113868413B (zh) 法律咨询报告生成方法及装置
CN113869049B (zh) 基于法律咨询问题的具有法律属性的事实抽取方法及装置
US20230111052A1 (en) Self-learning annotations to generate rules to be utilized by rule-based system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant