CN113886560A - 庭审问题的推荐方法以及装置 - Google Patents

庭审问题的推荐方法以及装置 Download PDF

Info

Publication number
CN113886560A
CN113886560A CN202111005801.3A CN202111005801A CN113886560A CN 113886560 A CN113886560 A CN 113886560A CN 202111005801 A CN202111005801 A CN 202111005801A CN 113886560 A CN113886560 A CN 113886560A
Authority
CN
China
Prior art keywords
court trial
text
information
target
dialogue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111005801.3A
Other languages
English (en)
Inventor
王业相
张雅婷
刘晓钟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Damo Institute Hangzhou Technology Co Ltd
Original Assignee
Alibaba Damo Institute Hangzhou Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Damo Institute Hangzhou Technology Co Ltd filed Critical Alibaba Damo Institute Hangzhou Technology Co Ltd
Priority to CN202111005801.3A priority Critical patent/CN113886560A/zh
Publication of CN113886560A publication Critical patent/CN113886560A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Tourism & Hospitality (AREA)
  • Evolutionary Computation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Technology Law (AREA)
  • Evolutionary Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Acoustics & Sound (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Machine Translation (AREA)

Abstract

本说明书实施例提供庭审问题的推荐方法以及装置,其中所述庭审问题的推荐方法包括:确定当前庭审文本中对话信息的初始编码向量,确定所述对话信息在所述当前庭审文本中的位置信息,并结合所述位置信息确定所述对话信息的目标编码向量,获取庭审问题库中待推荐问题对应的问题编码向量,并根据所述目标编码向量以及所述问题编码向量,确定并推荐所述当前庭审文本对应的目标待推荐问题。

Description

庭审问题的推荐方法以及装置
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种庭审问题的推荐方法。
背景技术
在传统的线下审判流程和线上(互联网)审判流程中,庭审是必不可少的环节。庭审的一般形式由法官来主持庭审的过程,需要由法官提炼争议焦点,向原告和被告提问,进一步基于当事人回答的问题总结答案,最终得到相应的裁判结果,这个过程比较耗费时间和人力,导致庭审以及裁判的效率较低。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
有鉴于此,本说明书实施例提供了一种庭审问题的推荐方法。本说明书一个或者多个实施例同时涉及一种庭审问题的推荐装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种庭审问题的推荐方法,包括:
确定当前庭审文本中对话信息的初始编码向量;
确定所述对话信息在所述当前庭审文本中的位置信息,并结合所述位置信息确定所述对话信息的目标编码向量;
获取庭审问题库中待推荐问题对应的问题编码向量,并根据所述目标编码向量以及所述问题编码向量,确定并推荐所述当前庭审文本对应的目标待推荐问题。
可选地,所述确定当前庭审文本中对话信息的初始编码向量,包括:
确定当前庭审文本对应的第一文本类型信息;
将所述当前庭审文本及所述第一文本类型信息输入问题推荐模型的第一编码模块进行处理,生成所述当前庭审文本中对话信息对应的初始编码向量,其中,所述第一编码模块对所述第一文本类型信息及所述当前庭审文本中每个对话轮次的对话信息进行编码处理,生成与所述第一文本类型信息对应的初始编码向量及与每个对话轮次的对话信息对应的初始编码向量。
可选地,所述确定所述对话信息在所述当前庭审文本中的位置信息,并结合所述位置信息确定所述对话信息的目标编码向量,包括:
根据所述当前庭审文本中多个对话轮次的顺序信息,确定每个对话轮次的对话信息在所述当前庭审文本中对应的位置信息;
对所述位置信息进行编码处理,生成对应的编码向量;
将所述编码向量及所述初始编码向量输入问题推荐模型的第二编码模块进行处理,生成目标编码向量。
可选地,所述根据所述目标编码向量以及所述问题编码向量,确定并推荐所述当前庭审文本对应的目标待推荐问题,包括:
确定所述目标编码向量与所述问题编码向量的第一数量积;
根据所述第一数量积确定并推荐所述当前庭审文本对应的目标待推荐问题。
可选地,所述根据所述数量积确定并推荐所述当前庭审文本对应的目标待推荐问题,包括:
对所述数量积进行排序,生成对应的排序结果;
根据所述排序结果选择目标待推荐问题,并将所述目标待推荐问题向所述当前庭审文本中的目标对话角色进行推荐,其中,所述目标对话角色为所述当前庭审文本中包含的至少两个对话角色之一。
可选地,所述问题推荐模型通过以下方式进行训练:
获取历史庭审的对话文本,确定所述历史庭审的对话文本的第二文本类型信息,以及所述历史庭审的对话文本中每个对话轮次的对话信息在所述历史庭审的对话文本中的目标位置信息;
将所述历史庭审的对话文本、所述第二文本类型信息及所述目标位置信息输入待训练的问题推荐模型进行训练,生成所述问题推荐模型。
可选地,所述将所述历史庭审的对话文本、所述第二文本类型信息及所述目标位置信息输入待训练的问题推荐模型进行训练,生成所述问题推荐模型,包括:
将所述历史庭审的对话文本及所述第二文本类型信息输入待训练的问题推荐模型的第一编码模块进行训练,其中,所述第一编码模块对所述第二文本类型信息及所述历史庭审的对话文本中至少一轮相邻对话轮次的对话信息进行编码处理,生成与所述第二文本类型信息对应的第一编码向量及与每个对话轮次的对话信息对应的第二编码向量;
将所述第一编码向量、所述第二编码向量及所述目标位置信息对应的第三编码向量输入待训练的问题推荐模型的第二编码模块进行训练,其中,所述第二编码模块结合所述第三编码向量对所述第一编码向量及所述第二编码向量进行编码处理,生成与所述至少一轮相邻对话轮次的对话信息对应的第四编码向量;
将所述第四编码向量及与所述至少一轮相邻对话轮次中目标对话轮次的对话信息相邻的下一轮对话信息中的问题文本输入待训练的问题推荐模型的推荐模块进行训练,生成所述问题推荐模型,其中,所述推荐模块对所述问题文本进行编码处理,生成对应的第五编码向量,并通过确定所述第四编码向量与所述第五编码向量间第二数量积的方式,确定与所述历史庭审的对话文本中至少一轮相邻对话轮次的对话信息对应的待推荐问题。
可选地,所述庭审问题的推荐方法,还包括:
获取历史庭审的对话文本;
将所述历史庭审的对话文本包含的至少一轮相邻的对话信息作为样本数据,并构建与所述样本数据对应的样本标签;
通过所述样本数据及所述样本标签对所述问题推荐模型的模型参数进行调整。
可选地,所述庭审问题的推荐方法,还包括:
确定所述目标编码向量与所述第四编码向量的第三数量积;
根据所述第三数量积确定并推荐所述当前庭审文本对应的目标待推荐问题。
根据本说明书实施例的第二方面,提供了一种庭审问题的推荐装置,包括:
向量确定模块,被配置为确定当前庭审文本中对话信息的初始编码向量;
信息确定模块,被配置为确定所述对话信息在所述当前庭审文本中的位置信息,并结合所述位置信息确定所述对话信息的目标编码向量;
推荐模块,被配置为获取庭审问题库中待推荐问题对应的问题编码向量,并根据所述目标编码向量以及所述问题编码向量,确定并推荐所述当前庭审文本对应的目标待推荐问题。
根据本说明书实施例的第三方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
确定当前庭审文本中对话信息的初始编码向量;
确定所述对话信息在所述当前庭审文本中的位置信息,并结合所述位置信息确定所述对话信息的目标编码向量;
获取庭审问题库中待推荐问题对应的问题编码向量,并根据所述目标编码向量以及所述问题编码向量,确定并推荐所述当前庭审文本对应的目标待推荐问题。
根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现任意一项所述庭审问题的推荐方法的步骤。
根据本说明书实施例的第五方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述庭审问题的推荐方法的步骤。
本说明书一个实施例通过确定当前庭审文本中对话信息的初始编码向量,确定所述对话信息在所述当前庭审文本中的位置信息,并结合所述位置信息确定所述对话信息的目标编码向量,获取庭审问题库中待推荐问题对应的问题编码向量,并根据所述目标编码向量以及所述问题编码向量,确定并推荐所述当前庭审文本对应的目标待推荐问题。
本说明书实施例通过向当前庭审文本中的目标对话角色进行问题推荐,有利于提高当前庭审文本所对应项目的处理效率;另外,在项目处理过程中,先确定当前庭审文本的目标编码向量,再通过将目标编码向量与待推荐问题的问题编码向量进行匹配的方式,确定满足条件的目标待推荐问题,有利于提高庭审问题推荐结果的准确性。
附图说明
图1是本说明书一个实施例提供的一种庭审问题的推荐方法的流程图;
图2是本说明书一个实施例提供的一种问题推荐模型的示意图;
图3是本说明书一个实施例提供的一种样本集构建结果的示意图;
图4是本说明书一个实施例提供的一种庭审问题的推荐过程的示意图;
图5是本说明书一个实施例提供的一种庭审问题的推荐方法的处理过程流程图;
图6是本说明书一个实施例提供的一种庭审问题的推荐装置的结构示意图;
图7是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
Transformer:一种常用基于自注意力机制的编码结构。
在本说明书中,提供了一种庭审问题的推荐方法,本说明书同时涉及一种庭审问题的推荐装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
图1示出了根据本说明书一个实施例提供的一种庭审问题的推荐方法的流程图,具体包括以下步骤。
步骤102,确定当前庭审文本中对话信息的初始编码向量。
具体的,所述当前庭审文本基于目标项目生成,并且该当前庭审文本可以基于目标项目当前的对话数据生成,所述对话数据包括但不限于视频数据或音频数据等,所述目标项目包括但不限于信息查询项目、保险项目、贷款项目、投资项目、法律项目等,本说明书实施例以法律项目为例进行说明,信息查询项目、保险项目、贷款项目、投资项目的具体实现与法律项目的具体实现类似,参照法律项目的具体实现即可,在此不再赘述。
另外,所述对话数据中包含至少两个对话角色,所述对话数据由至少两个对话角色针对目标项目生成,或由至少两个对话角色在目标项目的处理过程中生成,并且该对话数据中包含至少两个对话角色的多个对话轮次;而一个对话轮次即至少两个对话角色进行的一轮对话。
实际应用中,若所述目标项目为法律项目,所述对话数据为当前法律庭审过程中生成的对话数据,则所述对话角色即包括但不限于参与庭审的原告、被告、原告代理律师、被告代理律师及庭审员等。
因此,在各对话角色通过线上或线下的方式参与庭审时,庭审员可收集各对话角色的对话数据,该对话数据可以是以视频或音频形式进行记录所形成的视频数据或音频数据,或者,可以是对对话角色的对话内容以图片或文字的形式进行记录所形成的图片数据或文字数据。在获取到所述对话数据后,需将其转换为文本信息,具体可通过对所述对话数据进行语音识别或语义识别的方式获得所述当前庭审文本,然后确定当前庭审文本中对话信息的初始编码向量。
具体实施时,确定当前庭审文本中对话信息的初始编码向量,具体可通过以下方式实现:
确定当前庭审文本对应的第一文本类型信息;
将所述当前庭审文本及所述第一文本类型信息输入问题推荐模型的第一编码模块进行处理,生成所述当前庭审文本中对话信息对应的初始编码向量,其中,所述第一编码模块对所述第一文本类型信息及所述当前庭审文本中每个对话轮次的对话信息进行编码处理,生成与所述第一文本类型信息对应的初始编码向量及与每个对话轮次的对话信息对应的初始编码向量。
具体的,第一文本类型信息可用于表征当前庭审文本中对话角色在目标项目下的对话意图。例如,在所述目标项目为法律项目的情况下,当前庭审文本的第一文本类型信息包括但不限于离婚纠纷、房屋租赁合同纠纷、专利侵权纠纷等;在所述目标项目为保险项目的情况下,所述当前庭审文本对应的第一文本类型信息即可以是保险咨询、申请理赔等。
在确定当前庭审文本后,可通过对当前庭审文本中的文本信息进行语义识别,以确定该当前庭审文本对应的第一文本类型信息。而在确定当前庭审文本对应的第一文本类型信息后,可将该当前庭审文本及所述第一文本类型信息输入问题推荐模型的第一编码模块进行编码处理,生成所述当前庭审文本中对话信息对应的初始编码向量。
其中,所述第一编码模块可以由Embedding层(嵌入层)、多层Transformer及最大池化层组成,将第一文本类型信息和当前庭审文本输入问题推荐模型后,先由问题推荐模型对当前庭审文本进行对话片段划分,具体可将该当前庭审文本中的每个对话轮次的对话信息划分为一个对话片段,再由第一编码模块中的Embedding层分别对第一文本类型信息和每个对话片段对应的对话信息进行编码处理,然后由多层Transformer中的编码器encoder对Embedding层输出的结果进行编码处理,再由最大池化层对Transformer层输出的编码结果进行处理,生成与第一文本类型信息对应的初始编码向量和与每个对话轮次的对话信息对应的初始编码向量。
本说明书实施例提供的一种问题推荐模型的示意图如图2所示,图2中的E代表着一种常用编码结构,由Embedding与多层Transformer组成;C代表第一文本类型信息;U1、U2、……、Uk分别代表当前庭审文本中其中一个对话轮次的对话信息。
将第一文本类型信息C和当前庭审文本输入问题推荐模型后,先由问题推荐模型对当前庭审文本进行对话片段划分,具体可将该当前庭审文本中的每个对话轮次的对话信息U1、U2、……、Uk分别作为一个对话片段,然后由编码结构E分别对第一文本类型信息C和对话信息U1、U2、……、Uk进行编码处理,再经过最大池化层(图2中的M)对编码结构E输出的结果进行处理,生成第一文本类型信息C和对话信息U1、U2、……、Uk分别对应的初始编码向量。
步骤104,确定所述对话信息在所述当前庭审文本中的位置信息,并结合所述位置信息确定所述对话信息的目标编码向量。
具体的,确定当前庭审文本中对话信息的初始编码向量后,可继续确定对话信息在当前庭审文本中的位置信息,以结合位置信息和初始编码向量确定对话信息的目标编码向量。
具体实施时,确定所述对话信息在所述当前庭审文本中的位置信息,并结合所述位置信息确定所述对话信息的目标编码向量,具体可通过以下方式实现:
根据所述当前庭审文本中多个对话轮次的顺序信息,确定每个对话轮次的对话信息在所述当前庭审文本中对应的位置信息;
对所述位置信息进行编码处理,生成对应的编码向量;
将所述编码向量及所述初始编码向量输入问题推荐模型的第二编码模块进行处理,生成目标编码向量。
具体的,所述位置信息,可用于表征对话轮次在当前庭审文本中的顺序,因此,本说明书实施例可根据当前庭审文本中不同对话轮次的顺序信息,确定每个对话轮次的对话信息在当前庭审文本中的位置信息。
例如,当前庭审文本中第一个对话轮次的对话信息,其位置信息即为1;当前庭审文本中第二个对话轮次的对话信息,其位置信息即可以为2;依此类推,第k个对话轮次的对话信息,其位置信息即为k。
如图2所示,P代表着位置编码,用于添加对话次序信息。因此,在确定各对话轮次的对话信息在当前庭审文本中的位置信息后,可对该位置信息进行编码处理,生成对应的位置编码P,然后将位置编码P以及初始编码向量输入图2中的第二编码模块进行处理,其中,第二编码模块可以由多层Transformer和最大池化层组成,由多层Transformer中的编码器encoder对位置编码P以及初始编码向量进行编码处理,再由最大池化层对Transformer层输出的编码结果进行处理,以生成与当前庭审文本对应的目标编码向量。
结合当前庭审文本中每个对话轮次的对话信息在该当前庭审文本中的位置信息对当前庭审文本进行编码处理,有利于保证编码结果的准确性。
步骤106,获取庭审问题库中待推荐问题对应的问题编码向量,并根据所述目标编码向量以及所述问题编码向量,确定并推荐所述当前庭审文本对应的目标待推荐问题。
具体的,确定当前庭审文本对应的目标编码向量后,可根据该目标编码向量从庭审问题库中筛选目标待推荐问题并进行推荐,由于庭审问题库中预先存储了多个候选问题(待推荐问题)对应的问题编码向量,因此,可从庭审问题库中获取待推荐问题对应的问题编码向量,然后根据问题编码向量及目标编码向量确定目标待推荐问题,以将该目标待推荐问题向当前庭审文本中的目标对话角色进行推荐。
具体实施时,根据所述目标编码向量以及所述问题编码向量,确定并推荐所述当前庭审文本对应的目标待推荐问题,具体可通过以下方式实现:
确定所述目标编码向量与所述问题编码向量的第一数量积;
根据所述第一数量积确定并推荐所述当前庭审文本对应的目标待推荐问题。
进一步的,根据所述第一数量积确定并推荐所述当前庭审文本对应的目标待推荐问题,包括:
对所述第一数量积进行排序,生成对应的排序结果;
根据所述排序结果选择目标待推荐问题,并将所述目标待推荐问题向所述当前庭审文本中的目标对话角色进行推荐,其中,所述目标对话角色为所述当前庭审文本中包含的至少两个对话角色之一。
具体的,在生成当前庭审文本的目标编码向量后,可通过将该目标编码向量与庭审问题库中待推荐问题的问题编码向量进行匹配来进行庭审问题推荐。具体可通过计算目标编码向量和待推荐问题的问题编码向量的第一数量积,然后根据第一数量积确定并推荐所述当前庭审文本对应的目标待推荐问题。
其中,若当前庭审文本的目标编码向量为a=[a1,a2,…,a512],庭审问题库中任意一个待推荐问题的问题编码向量为b=[b1,b2,…,b],则第一数量积即为:a·b=a1b1+a2b2+…+a512b512
计算获得目标编码向量与庭审问题库中各待推荐问题的问题编码向量的第一数量积后,可对第一数量积进行排序,并将排序结果中排序靠前的1个、2个或多个待推荐问题作为目标待推荐问题,推荐至当前庭审文本中的目标对话角色。
实际应用中,在所述目标项目为法律项目的情况下,所述目标对话角色即可以是庭审员;在所述目标项目为保险项目的情况下,所述目标对话角色即可以是保险机构的客服人员。
另外,也可从庭审问题库中获取多个待推荐问题,并将多个待推荐问题输入问题推荐模型的推荐模块进行编码处理,生成每个待推荐问题对应的问题编码向量,然后计算目标编码向量和待推荐问题的问题编码向量的第一数量积,并根据第一数量积确定并推荐所述当前庭审文本对应的目标待推荐问题。其中,推荐模块中对待推荐问题进行编码的编码结构可与前述第一编码模块的编码结构相同。
本说明书实施例通过先确定当前庭审文本的目标编码向量,再通过将目标编码向量与待推荐问题的问题编码向量进行匹配的方式,确定满足条件的目标待推荐问题,有利于提高庭审问题推荐结果的准确性。
具体实施时,所述问题推荐模型通过以下方式进行训练:
获取历史庭审的对话文本,确定所述历史庭审的对话文本的第二文本类型信息,以及所述历史庭审的对话文本中每个对话轮次的对话信息在所述历史庭审的对话文本中的目标位置信息;
将所述历史庭审的对话文本、所述第二文本类型信息及所述目标位置信息输入待训练的问题推荐模型进行训练,生成所述问题推荐模型。
进一步的,将所述历史庭审的对话文本、所述第二文本类型信息及所述目标位置信息输入待训练的问题推荐模型进行训练,生成所述问题推荐模型,具体可通过以下方式实现:
将所述历史庭审的对话文本及所述第二文本类型信息输入待训练的问题推荐模型的第一编码模块进行训练,其中,所述第一编码模块对所述第二文本类型信息及所述历史庭审的对话文本中至少一轮相邻对话轮次的对话信息进行编码处理,生成与所述第二文本类型信息对应的第一编码向量及与每个对话轮次的对话信息对应的第二编码向量;
将所述第一编码向量、所述第二编码向量及所述目标位置信息对应的第三编码向量输入待训练的问题推荐模型的第二编码模块进行训练,其中,所述第二编码模块结合所述第三编码向量对所述第一编码向量及所述第二编码向量进行编码处理,生成与所述至少一轮相邻对话轮次的对话信息对应的第四编码向量;
将所述第四编码向量及与所述至少一轮相邻对话轮次中目标对话轮次的对话信息相邻的下一轮对话信息中的问题文本输入待训练的问题推荐模型的推荐模块进行训练,生成所述问题推荐模型,其中,所述推荐模块对所述问题文本进行编码处理,生成对应的第五编码向量,并通过确定所述第四编码向量与所述第五编码向量间第二数量积的方式,确定与所述历史庭审的对话文本中至少一轮相邻对话轮次的对话信息对应的待推荐问题。
具体的,所述历史庭审的对话文本,即历史时间区间内处理目标项目所生成的对话文本;所述第二文本类型信息可用于表征历史庭审的对话文本中对话角色在目标项目下的对话意图。例如,在所述目标项目为法律项目的情况下,当前庭审文本的第一文本类型信息包括但不限于离婚纠纷、房屋租赁合同纠纷、专利侵权纠纷等。所述目标位置信息可用于表征对话轮次在历史庭审的对话文本中的顺序,因此,本说明书实施例可根据历史庭审的对话文本中不同对话轮次的顺序信息,确定每个对话轮次的对话信息在历史庭审的对话文本中的目标位置信息。
获取历史庭审的对话文本,并确定历史庭审的对话文本的第二文本类型信息,以及历史庭审的对话文本中每个对话轮次的对话信息在该历史庭审的对话文本中的目标位置信息后,即可利用历史庭审的对话文本、第二文本类型信息及所述目标位置信息进行模型训练。
本说明书实施例的问题推荐模型的训练过程与前述问题推荐过程即问题推荐模型的应用的具体实现过程类似,并且采用自监督的训练方式训练获得问题推荐模型,因此,在进行模型训练之前,需先构建训练样本集,包括训练样本和样本标签。
具体的,将历史庭审的对话文本、第二文本类型信息及目标位置信息输入待训练的问题推荐模型后,先基于历史庭审的对话文本构建训练样本,具体可将历史庭审的对话文本中至少一轮相邻对话轮次的对话信息作为训练样本;另外,在确定训练样本后,由于每个训练样本均由历史庭审的对话文本中至少一个相邻对话轮次的对话信息构成,因此,在采用自监督的方式进行模型训练的情况下,可自动并基于训练样本自动生成样本标签;其中,可将与每个训练样本中至少一轮相邻对话轮次中目标对话轮次的对话信息相邻的下一轮对话信息中的问题文本,作为该训练样本的样本标签,并且该目标对话轮次即可以是每个训练样本中处于末位的对话轮次。
本说明书实施例提供的样本集构建结果的示意图如图3所示,图3所示的历史庭审的对话文本中包含6个对话轮次,将相邻的第一、第二、第三对话轮次作为样本1,将相邻的第一、第二、第三、第四对话轮次作为样本2,将相邻的第一、第二、第三、第四、第五对话轮次作为样本3,并将与样本1中末位的第三对话轮次相邻的第四对话轮次中的问题4作为样本1的标签,将与样本2中末位的第四对话轮次相邻的第五对话轮次中的问题5作为样本2的标签,将与样本3中末位的第五对话轮次相邻的第六对话轮次中的问题6作为样本3的标签。
训练样本集构建完成后,可通过待训练的问题推荐模型中的第一编码模块对第二文本类型信息及历史庭审的对话文本中至少一轮相邻对话轮次的对话信息(每个训练样本中至少一轮对话轮次的对话信息)进行编码处理,生成与第二文本类型信息对应的第一编码向量及与训练样本中每个对话轮次的对话信息对应的第二编码向量;然后通过待训练的问题推荐模型的第二编码模块结合目标位置信息对应的第三编码向量对第一编码向量及第二编码向量进行编码处理,生成与所述训练样本中至少一轮相邻对话轮次的对话信息对应的第四编码向量;再由待训练的问题推荐模型中的推荐模块对训练样本的样本标签(问题文本)进行编码处理,生成对应的第五编码向量,并通过确定所述第四编码向量与所述第五编码向量间第二数量积的方式,确定与所述历史庭审的对话文本中至少一轮相邻对话轮次的对话信息对应的待推荐问题。
其中,第一编码模块可以由Embedding层、多层Transformer及最大池化层组成,第二编码模块可以由多层Transformer和最大池化层组成,推荐模块中对训练样本的样本标签进行编码的编码结构可与第一编码模块的编码结构相同,并且利用第一编码模块、第二编码模块、推荐模块进行处理的过程与前述实施例所述的第一编码模块、第二编码模块以及推荐模块的具体实现过程类似,在此不再赘述。
本说明书实施例利用自监督的训练方式训练获得问题推荐模型,即利用训练样本中末位对话轮次的对话信息与下一个问题之间的关系,在大量的历史庭审的对话文本中进行自监督学习,节省了大量的数据标注成本。
另外,通过前述实施方式训练获得问题推荐模型后,还可对该问题推荐模型进行优化,即对模型参数进行调整,使得模型的输出结果更加准确,具体的优化过程可通过以下方式实现:
获取历史庭审的对话文本;
将所述历史庭审的对话文本包含的至少一轮相邻的对话信息作为样本数据,并构建与所述样本数据对应的样本标签;
通过所述样本数据及所述样本标签对所述问题推荐模型的模型参数进行调整。
具体的,由于前述实施方式采用自监督的训练方式训练获得问题推荐模型,而在模型训练过程中,训练样本的样本标签由模型根据训练样本自动构建生成,因此,通过这种自监督的方式训练获得的问题推荐模型,在实际使用过程中,其输出结果的准确性可能有待提高,因此,本说明书实施例在训练获得问题推荐模型后,可先对待推荐问题进行梳理,并根据梳理后的待推荐问题,对历史庭审的对话文本中至少一个相邻对话轮次的对话信息进行少量标注,然后利用标注结果对问题推荐模型的模型参数进行微调,以使得调整后的问题推荐模型的输出结果更加准确。
实际应用中,对历史庭审的对话文本中至少一个相邻对话轮次的对话信息进行标注时,可结合专家经验来实现,具体可根据实际需求确定们再次不做任何限制。
此外,除通过将当前庭审文本与待推荐问题进行匹配以进行问题推荐外,还可将当前庭审文本与历史庭审的对话文本进行匹配以进行问题推荐,具体可通过以下方式实现:
确定所述目标编码向量与所述第四编码向量的第三数量积;
根据所述第三数量积确定并推荐所述当前庭审文本对应的目标待推荐问题。
具体的,庭审问题库中除可存储待推荐问题和/或待推荐问题的问题编码向量外,还可存储历史庭审的对话文本的文本编码向量,即第四编码向量,因此,实际应用中,在生成当前庭审文本的目标编码向量后,可通过将该目标编码向量与庭审问题库中历史庭审的对话文本的文本编码向量进行匹配来进行问题推荐。具体可通过计算目标编码向量和历史庭审的对话文本的文本编码向量的第三数量积,然后根据第三数量积确定并推荐所述当前庭审文本对应的目标待推荐问题。
其中,第三数量积的计算方式与前述第一数量积的计算方式类似,在此不再赘述。
计算获得第三数量积后,同样可对第三数量积进行排序,并从排序结果中排序靠前的1个、2个或多个历史庭审的对话文本中选择目标待推荐问题并向当前庭审文本中的目标对话角色进行推荐。
本说明书实施例通过先确定当前庭审文本的目标编码向量,并通过将目标编码向量与历史庭审的对话文本的文本编码向量进行匹配的方式,确定满足条件的目标待推荐问题,有利于提高问题推荐结果的准确性。
本说明书实施例提供的庭审问题的推荐过程的示意图如图4所示,并且图4以庭审问题的推荐方法在法律项目的应用为例进行说明,其中,庭审问题的推荐过程可分为两部分,其中一部分为模型训练过程,另一部分是模型应用过程,即问题推荐过程,模型训练过程具体包括:获取历史庭审过程生成的庭审笔录,利用庭审笔录进行模型的预训练,获得问题推荐模型;另外,训练获得问题推荐模型之后,还可对其模型参数进行调整,即利用经过梳理与标注的数据对模型进行优化,以达到模型微调的目的;而模型应用过程具体包括:获取当前庭审内容,然后将当前庭审内容以及当前庭审内容中每轮对话的位置信息输入问题推荐模型进行处理,以使得问题推荐模型结合庭审问题库中的待推荐问题,为当前庭审内容中的庭审员自动进行问题推荐,具体可计算当前庭审内容的目标编码向量与待推荐问题的问题编码向量间的内积(数量积),并对计算结果按照由大到小的顺序进行排序,然后将排序结果中的前n个待推荐问题作为目标待推荐问题并向庭审员进行推荐,庭审员可参考目标待推荐问题确定当前庭审内容之后需要进行发问的问题,以提高庭审效率。
本说明书一个实施例通过确定当前庭审文本中对话信息的初始编码向量,确定所述对话信息在所述当前庭审文本中的位置信息,并结合所述位置信息确定所述对话信息的目标编码向量,获取庭审问题库中待推荐问题对应的问题编码向量,并根据所述目标编码向量以及所述问题编码向量,确定并推荐所述当前庭审文本对应的目标待推荐问题。
本说明书实施例构建了基于Transformer的问题推荐模型对历史庭审的对话文本进行建模。在模型训练过程中,无需对数据进行标注,使用样本自动构建的方式生成海量训练数据来对模型进行预训练,使模型掌握对话信息和问题的向量化表示。在模型应用过程中,再根据当前庭审文本的向量化表示对问题进行推荐,省去了问题分类过程,同时也无需对问题进行整理与标注,从而节省了大量数据标注的成本;另外,通过向当前庭审文本中的目标对话角色进行问题推荐,有利于提高当前庭审文本所对应项目的处理效率;此外,在项目处理过程中,先确定当前庭审文本的目标编码向量,再通过将目标编码向量与待推荐问题的问题编码向量进行匹配的方式,确定满足条件的目标待推荐问题,有利于提高庭审问题推荐结果的准确性。
下述结合附图5,以本说明书提供的庭审问题的推荐方法在法律项目的应用为例,对所述庭审问题的推荐方法进行进一步说明。其中,图5示出了本说明书一个实施例提供的一种庭审问题的推荐方法的处理过程流程图,具体包括以下步骤。
步骤502,获取历史庭审内容,并确定历史庭审内容的案由信息以及历史庭审内容中每个对话轮次的对话信息在该历史庭审内容中的位置信息。
步骤504,将历史庭审内容、案由信息及位置信息输入待训练的问题推荐模型进行训练,生成问题推荐模型。
具体的,将历史庭审内容及案由信息输入待训练的问题推荐模型的第一编码模块进行训练,其中,所述第一编码模块对案由信息及所述历史庭审内容中至少一轮相邻对话轮次的对话信息进行编码处理,生成与所述案由信息对应的第一编码向量及与每个对话轮次的对话信息对应的第二编码向量;
然后将第一编码向量、第二编码向量及位置信息对应的第三编码向量输入待训练的问题推荐模型的第二编码模块进行训练,其中,第二编码模块结合第三编码向量对第一编码向量及第二编码向量进行编码处理,生成与所述至少一轮相邻对话轮次的对话信息对应的第四编码向量;
再将第四编码向量及与所述至少一轮相邻对话轮次中目标对话轮次的对话信息相邻的下一轮对话信息中的问题文本输入待训练的问题推荐模型的推荐模块进行训练,生成所述问题推荐模型,其中,所述推荐模块对问题文本进行编码处理,生成对应的第五编码向量,并通过确定所述第四编码向量与所述第五编码向量间数量积的方式,确定与历史庭审内容中至少一轮相邻对话轮次的对话信息对应的待推荐问题。
步骤506,获取当前庭审内容,并确定当前庭审内容对应的案由信息。
步骤508,将当前庭审内容及案由信息输入问题推荐模型的第一编码模块进行处理,生成所述当前庭审内容中对话信息对应的初始编码向量。
具体的,第一编码模块对所述案由信息及所述当前庭审内容中每个对话轮次的对话信息进行编码处理,生成与所述案由信息对应的初始编码向量及与每个对话轮次的对话信息对应的初始编码向量。
步骤510,根据当前庭审内容中多个对话轮次的顺序信息,确定每个对话轮次的对话信息在当前庭审内容中对应的位置信息。
步骤512,对所述位置信息进行编码处理,生成对应的编码向量。
步骤514,将所述编码向量及所述初始编码向量输入问题推荐模型的第二编码模块进行处理,生成当前庭审内容对应的目标编码向量。
步骤516,获取庭审问题库中待推荐问题对应的问题编码向量,并计算目标编码向量与问题编码向量的数量积。
步骤518,对所述数量积进行排序,生成对应的排序结果。
步骤520,根据所述排序结果选择目标待推荐问题,并将所述目标待推荐问题向当前庭审内容中的庭审员进行推荐。
本说明书实施例提供的庭审问题的推荐方法,在实际庭审过程中,可以获取当前庭审内容的目标编码向量,然后通过将目标编码向量与待推荐问题的问题编码向量进行匹配的方式,确定待推荐的目标庭审问题,并向庭审员推送该目标庭审问题,从而实现庭审过程中庭审问题推荐的目的,并有利于提升裁判效率,节约庭审时间,降低庭审成本。
与上述方法实施例相对应,本说明书还提供了庭审问题的推荐装置实施例,图6示出了本说明书一个实施例提供的一种庭审问题的推荐装置的结构示意图。如图6所示,该装置包括:
向量确定模块602,被配置为确定当前庭审文本中对话信息的初始编码向量;
信息确定模块604,被配置为确定所述对话信息在所述当前庭审文本中的位置信息,并结合所述位置信息确定所述对话信息的目标编码向量;
推荐模块606,被配置为获取庭审问题库中待推荐问题对应的问题编码向量,并根据所述目标编码向量以及所述问题编码向量,确定并推荐所述当前庭审文本对应的目标待推荐问题。
可选地,所述向量确定模块602,进一步被配置为:
确定当前庭审文本对应的第一文本类型信息;
将所述当前庭审文本及所述第一文本类型信息输入问题推荐模型的第一编码模块进行处理,生成所述当前庭审文本中对话信息对应的初始编码向量,其中,所述第一编码模块对所述第一文本类型信息及所述当前庭审文本中每个对话轮次的对话信息进行编码处理,生成与所述第一文本类型信息对应的初始编码向量及与每个对话轮次的对话信息对应的初始编码向量。
可选地,所述信息确定模块604,进一步被配置为:
根据所述当前庭审文本中多个对话轮次的顺序信息,确定每个对话轮次的对话信息在所述当前庭审文本中对应的位置信息;
对所述位置信息进行编码处理,生成对应的编码向量;
将所述编码向量及所述初始编码向量输入问题推荐模型的第二编码模块进行处理,生成目标编码向量。
可选地,所述推荐模块606,进一步被配置为:
确定所述目标编码向量与所述问题编码向量的第一数量积;
根据所述第一数量积确定并推荐所述当前庭审文本对应的目标待推荐问题。
可选地,所述推荐模块606,进一步被配置为:
对所述第一数量积进行排序,生成对应的排序结果;
根据所述排序结果选择目标待推荐问题,并将所述目标待推荐问题向所述当前庭审文本中的目标对话角色进行推荐,其中,所述目标对话角色为所述当前庭审文本中包含的至少两个对话角色之一。
可选地,所述庭审问题的推荐装置,还包括训练模块,被配置为:
获取历史庭审的对话文本,确定所述历史庭审的对话文本的第二文本类型信息,以及所述历史庭审的对话文本中每个对话轮次的对话信息在所述历史庭审的对话文本中的目标位置信息;
将所述历史庭审的对话文本、所述第二文本类型信息及所述目标位置信息输入待训练的问题推荐模型进行训练,生成所述问题推荐模型。
可选地,所述训练模块,进一步被配置为:
将所述历史庭审的对话文本及所述第二文本类型信息输入待训练的问题推荐模型的第一编码模块进行训练,其中,所述第一编码模块对所述第二文本类型信息及所述历史庭审的对话文本中至少一轮相邻对话轮次的对话信息进行编码处理,生成与所述第二文本类型信息对应的第一编码向量及与每个对话轮次的对话信息对应的第二编码向量;
将所述第一编码向量、所述第二编码向量及所述目标位置信息对应的第三编码向量输入待训练的问题推荐模型的第二编码模块进行训练,其中,所述第二编码模块结合所述第三编码向量对所述第一编码向量及所述第二编码向量进行编码处理,生成与所述至少一轮相邻对话轮次的对话信息对应的第四编码向量;
将所述第四编码向量及与所述至少一轮相邻对话轮次中目标对话轮次的对话信息相邻的下一轮对话信息中的问题文本输入待训练的问题推荐模型的推荐模块进行训练,生成所述问题推荐模型,其中,所述推荐模块对所述问题文本进行编码处理,生成对应的第五编码向量,并通过确定所述第四编码向量与所述第五编码向量间第二数量积的方式,确定与所述历史庭审的对话文本中至少一轮相邻对话轮次的对话信息对应的待推荐问题。
可选地,所述庭审问题的推荐装置,还包括调整模块,被配置为:
获取历史庭审的对话文本;
将所述历史庭审的对话文本包含的至少一轮相邻的对话信息作为样本数据,并构建与所述样本数据对应的样本标签;
通过所述样本数据及所述样本标签对所述问题推荐模型的模型参数进行调整。
可选地,所述庭审问题的推荐装置,还包括问题确定模块,被配置为:
确定所述目标编码向量与所述第四编码向量的第三数量积;
根据所述第三数量积确定并推荐所述当前庭审文本对应的目标待推荐问题。
上述为本实施例的一种庭审问题的推荐装置的示意性方案。需要说明的是,该庭审问题的推荐装置的技术方案与上述的庭审问题的推荐方法的技术方案属于同一构思,庭审问题的推荐装置的技术方案未详细描述的细节内容,均可以参见上述庭审问题的推荐方法的技术方案的描述。
图7示出了根据本说明书一个实施例提供的一种计算设备700的结构框图。该计算设备700的部件包括但不限于存储器710和处理器720。处理器720与存储器710通过总线730相连接,数据库750用于保存数据。
计算设备700还包括接入设备740,接入设备740使得计算设备700能够经由一个或多个网络760通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备740可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备700的上述部件以及图7中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图7所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备700可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备700还可以是移动式或静止式的服务器。
其中,处理器720用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述庭审问题的推荐方法的步骤。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的庭审问题的推荐方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述庭审问题的推荐方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述庭审问题的推荐方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的庭审问题的推荐方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述庭审问题的推荐方法的技术方案的描述。
本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述庭审问题的推荐方法的步骤。
上述为本实施例的一种计算机程序的示意性方案。需要说明的是,该计算机程序的技术方案与上述的庭审问题的推荐方法的技术方案属于同一构思,计算机程序的技术方案未详细描述的细节内容,均可以参见上述庭审问题的推荐方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

Claims (13)

1.一种庭审问题的推荐方法,包括:
确定当前庭审文本中对话信息的初始编码向量;
确定所述对话信息在所述当前庭审文本中的位置信息,并结合所述位置信息确定所述对话信息的目标编码向量;
获取庭审问题库中待推荐问题对应的问题编码向量,并根据所述目标编码向量以及所述问题编码向量,确定并推荐所述当前庭审文本对应的目标待推荐问题。
2.根据权利要求1所述的庭审问题的推荐方法,所述确定当前庭审文本中对话信息的初始编码向量,包括:
确定当前庭审文本对应的第一文本类型信息;
将所述当前庭审文本及所述第一文本类型信息输入问题推荐模型的第一编码模块进行处理,生成所述当前庭审文本中对话信息对应的初始编码向量,其中,所述第一编码模块对所述第一文本类型信息及所述当前庭审文本中每个对话轮次的对话信息进行编码处理,生成与所述第一文本类型信息对应的初始编码向量及与每个对话轮次的对话信息对应的初始编码向量。
3.根据权利要求2所述的庭审问题的推荐方法,所述确定所述对话信息在所述当前庭审文本中的位置信息,并结合所述位置信息确定所述对话信息的目标编码向量,包括:
根据所述当前庭审文本中多个对话轮次的顺序信息,确定每个对话轮次的对话信息在所述当前庭审文本中对应的位置信息;
对所述位置信息进行编码处理,生成对应的编码向量;
将所述编码向量及所述初始编码向量输入问题推荐模型的第二编码模块进行处理,生成目标编码向量。
4.根据权利要求1所述的庭审问题的推荐方法,所述根据所述目标编码向量以及所述问题编码向量,确定并推荐所述当前庭审文本对应的目标待推荐问题,包括:
确定所述目标编码向量与所述问题编码向量的第一数量积;
根据所述第一数量积确定并推荐所述当前庭审文本对应的目标待推荐问题。
5.根据权利要求4所述的庭审问题的推荐方法,所述根据所述第一数量积确定并推荐所述当前庭审文本对应的目标待推荐问题,包括:
对所述第一数量积进行排序,生成对应的排序结果;
根据所述排序结果选择目标待推荐问题,并将所述目标待推荐问题向所述当前庭审文本中的目标对话角色进行推荐,其中,所述目标对话角色为所述当前庭审文本中包含的至少两个对话角色之一。
6.根据权利要求2所述的庭审问题的推荐方法,所述问题推荐模型通过以下方式进行训练:
获取历史庭审的对话文本,确定所述历史庭审的对话文本的第二文本类型信息,以及所述历史庭审的对话文本中每个对话轮次的对话信息在所述历史庭审的对话文本中的目标位置信息;
将所述历史庭审的对话文本、所述第二文本类型信息及所述目标位置信息输入待训练的问题推荐模型进行训练,生成所述问题推荐模型。
7.根据权利要求6所述的庭审问题的推荐方法,所述将所述历史庭审的对话文本、所述第二文本类型信息及所述目标位置信息输入待训练的问题推荐模型进行训练,生成所述问题推荐模型,包括:
将所述历史庭审的对话文本及所述第二文本类型信息输入待训练的问题推荐模型的第一编码模块进行训练,其中,所述第一编码模块对所述第二文本类型信息及所述历史庭审的对话文本中至少一轮相邻对话轮次的对话信息进行编码处理,生成与所述第二文本类型信息对应的第一编码向量及与每个对话轮次的对话信息对应的第二编码向量;
将所述第一编码向量、所述第二编码向量及所述目标位置信息对应的第三编码向量输入待训练的问题推荐模型的第二编码模块进行训练,其中,所述第二编码模块结合所述第三编码向量对所述第一编码向量及所述第二编码向量进行编码处理,生成与所述至少一轮相邻对话轮次的对话信息对应的第四编码向量;
将所述第四编码向量及与所述至少一轮相邻对话轮次中目标对话轮次的对话信息相邻的下一轮对话信息中的问题文本输入待训练的问题推荐模型的推荐模块进行训练,生成所述问题推荐模型,其中,所述推荐模块对所述问题文本进行编码处理,生成对应的第五编码向量,并通过确定所述第四编码向量与所述第五编码向量间第二数量积的方式,确定与所述历史庭审的对话文本中至少一轮相邻对话轮次的对话信息对应的待推荐问题。
8.根据权利要求6或7所述的庭审问题的推荐方法,还包括:
获取历史庭审的对话文本;
将所述历史庭审的对话文本包含的至少一轮相邻的对话信息作为样本数据,并构建与所述样本数据对应的样本标签;
通过所述样本数据及所述样本标签对所述问题推荐模型的模型参数进行调整。
9.根据权利要求7所述的庭审问题的推荐方法,还包括:
确定所述目标编码向量与所述第四编码向量的第三数量积;
根据所述第三数量积确定并推荐所述当前庭审文本对应的目标待推荐问题。
10.一种庭审问题的推荐装置,包括:
向量确定模块,被配置为确定当前庭审文本中对话信息的初始编码向量;
信息确定模块,被配置为确定所述对话信息在所述当前庭审文本中的位置信息,并结合所述位置信息确定所述对话信息的目标编码向量;
推荐模块,被配置为获取庭审问题库中待推荐问题对应的问题编码向量,并根据所述目标编码向量以及所述问题编码向量,确定并推荐所述当前庭审文本对应的目标待推荐问题。
11.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至9任意一项所述庭审问题的推荐方法的步骤。
12.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至9任意一项所述庭审问题的推荐方法的步骤。
13.一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行权利要求1至9任意一项所述庭审问题的推荐方法的步骤。
CN202111005801.3A 2021-08-30 2021-08-30 庭审问题的推荐方法以及装置 Pending CN113886560A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111005801.3A CN113886560A (zh) 2021-08-30 2021-08-30 庭审问题的推荐方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111005801.3A CN113886560A (zh) 2021-08-30 2021-08-30 庭审问题的推荐方法以及装置

Publications (1)

Publication Number Publication Date
CN113886560A true CN113886560A (zh) 2022-01-04

Family

ID=79011753

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111005801.3A Pending CN113886560A (zh) 2021-08-30 2021-08-30 庭审问题的推荐方法以及装置

Country Status (1)

Country Link
CN (1) CN113886560A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114356860A (zh) * 2022-01-06 2022-04-15 支付宝(杭州)信息技术有限公司 对话生成方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114356860A (zh) * 2022-01-06 2022-04-15 支付宝(杭州)信息技术有限公司 对话生成方法及装置

Similar Documents

Publication Publication Date Title
CN110379409B (zh) 语音合成方法、系统、终端设备和可读存储介质
CN109858044B (zh) 语言处理方法和装置、语言处理系统的训练方法和装置
CN109710953B (zh) 一种翻译方法及装置、计算设备、存储介质和芯片
JP2022546811A (ja) 画像キャプションの方法、装置、計算機器及び記憶媒体
CN113159187B (zh) 分类模型训练方法及装置、目标文本确定方法及装置
CN112307168A (zh) 基于人工智能的问诊会话处理方法、装置和计算机设备
CN108959388A (zh) 信息生成方法及装置
CN113988086A (zh) 对话处理方法及装置
CN113743991A (zh) 生命周期价值预测方法及装置
CN115269836A (zh) 意图识别方法及装置
CN110377803B (zh) 信息处理方法以及装置
CN113538079A (zh) 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN116561270A (zh) 问答方法以及问答模型训练方法
CN115730607A (zh) 对话检测模型训练方法及装置
CN113886560A (zh) 庭审问题的推荐方法以及装置
CN116521832A (zh) 对话交互方法、装置及系统、电子设备和存储介质
CN115934904A (zh) 文本处理方法以及装置
CN115481246A (zh) 文本检测模型训练方法以及装置
CN115827831A (zh) 意图识别模型训练方法及装置
CN114638238A (zh) 一种神经网络模型的训练方法及装置
CN111079013A (zh) 一种基于推荐模型的信息推荐方法及装置
CN111078854A (zh) 问答预测模型的训练方法及装置、问答预测方法及装置
CN116089614B (zh) 文本打标方法及装置
CN113918690A (zh) 对话方法以及装置
CN115859947A (zh) 文本生成方法以及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination