CN116431779B - 法律领域faq问答的匹配方法、装置、存储介质及电子装置 - Google Patents
法律领域faq问答的匹配方法、装置、存储介质及电子装置 Download PDFInfo
- Publication number
- CN116431779B CN116431779B CN202310251225.3A CN202310251225A CN116431779B CN 116431779 B CN116431779 B CN 116431779B CN 202310251225 A CN202310251225 A CN 202310251225A CN 116431779 B CN116431779 B CN 116431779B
- Authority
- CN
- China
- Prior art keywords
- elements
- candidate
- questions
- question
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 101100481876 Danio rerio pbk gene Proteins 0.000 claims abstract description 19
- 101100481878 Mus musculus Pbk gene Proteins 0.000 claims abstract description 19
- 238000012163 sequencing technique Methods 0.000 claims abstract description 12
- 239000011159 matrix material Substances 0.000 claims description 24
- 238000013145 classification model Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 238000013077 scoring method Methods 0.000 claims description 7
- 239000012634 fragment Substances 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 4
- 238000012552 review Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000005352 clarification Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Tourism & Hospitality (AREA)
- Mathematical Physics (AREA)
- Animal Behavior & Ethology (AREA)
- Technology Law (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种法律领域FAQ问答的匹配方法、装置、存储介质及电子装置。该匹配方法包括:接收用户在终端描述的待匹配问题;采用训练好的要素识别模型,先确定所述待匹配问题的候选要素、要素概率及要素间相融度,再根据所述要素概率和要素间相融度计算每个候选要素的要素分值;按照所述要素分值给所述候选要素排序,并根据排序前topK的候选要素从预设的知识图谱中关联出备选问题;返回所述备选问题对应的答案给所述终端。本申请解决了由于用户提问时可能夹带着对问题本身不必要的要素,造成的模型匹配到与主题存在偏差的其他问题的技术问题。
Description
技术领域
本申请涉及法律FAQ问答领域,具体而言,涉及一种法律领域FAQ问答的匹配方法、装置、存储介质及电子装置。
背景技术
近年来,随着人工智能技术的发展,人机对话技术得到越来越多的关注,人机对话产品也不断涌现。其中,智能客服作为人机对话的一个典型场景表现出极大的商业潜力和很强的研究价值,各企业也争先恐后的推出自己的智能客服产品。
FAQ 问答技术作为智能客服系统最核心技术之一,在智能客服系统中发挥重要作用。通过该技术,可实现在知识库中快速找到与用户问题相匹配的问答,为用户提供满意的答案,从而极大提升客服人员效率,改善客服人员服务化水平,降低企业客服成本。
FAQ:(Frequently asked Questions),是检索式问答系统。通常情况是给定标准问题库,系统需要将用户输入的query匹配用户最想问的问题上。用户输入的query通常是短文本,标准问题库是一个封闭的集合。每个标准问题都有固定答案和标题,同时会有多个扩展问法和关键词。模型所需要解决的是给定query,找到标准问题里和用户问题最近的问题的答案。
目前FAQ 问答系统大多采用深度学习语义检索技术实现。先将用户的query输入事先训练好的深度学习模型(如lstm,CNN,bert等),得到用户query的向量化表示。再将该向量与事先计算好的所有的标准问题的向量化表示进行相似度的计算(如cos相似度), 从而选出与query相似度最高的标准问题。此处根据问题库的大小,还会会采用HNSW,Annoy等大规模向量检索技术加速最相似向量的检索过程。在此过程之后,由于句子的向量化表示可能存在信息的损失,根据需要可以将相似度最高的n个标准问题逐一与用户query同时输入交互式的语义匹配模型实现精排。最终将相似度最高的标准问题的答案返回给用户。
传统的FAQ问答本质上是通过用户问题与标准问题的匹配,并返回标准问题的答案。该种一问一答的方式存在一些缺陷,这些缺陷在法律问答领域更加凸显:用户提问时可能夹带着对问题本身不必要的要素。如法律领域中用户问法律程序相关的问题时可能会描述对回答没有影响的案件具体细节的信息。这些不必要的信息可能导致传统语义匹配模型匹配到与主题存在偏差的其他问题。
针对相关技术中由于用户提问时可能夹带着对问题本身不必要的要素,造成的模型匹配到与主题存在偏差的其他问题的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种法律领域FAQ问答的匹配方法、装置、存储介质及电子装置,以解决由于用户提问时可能夹带着对问题本身不必要的要素,造成的模型匹配到与主题存在偏差的其他问题的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种法律领域FAQ问答的匹配方法、装置、存储介质及电子装置。
根据本申请的法律领域FAQ问答的匹配方法包括:接收用户在终端描述的待匹配问题;采用训练好的要素识别模型,先确定所述待匹配问题的候选要素、要素概率及要素间相融度,再根据所述要素概率和要素间相融度计算每个候选要素的要素分值;按照所述要素分值给所述候选要素排序,并根据排序前topK的候选要素从预设的知识图谱中关联出备选问题;返回所述备选问题对应的答案给所述终端。
进一步的,所述要素识别模型为多标签分类模型或多标签分类与要素链接相结合的分类模型。
进一步的,所述知识图谱的构建包括:
获取FAQ标准问答数据;
从所述FAQ标准问答数据中提取标准问题要素、主题要素、问题类型要素、约束要素要素、要素类别要素及要素间关系;
基于标准问题要素、主题要素、问题类型要素、约束要素要素、要素类别要素及要素间关系构建知识图谱。
进一步的,采用训练好的要素识别模型,先确定所述待匹配问题的候选要素、要素概率及要素间相融度,再根据所述要素概率和要素间相融度计算每个候选要素的要素分值包括:
获取用户提问的历史提问数据;
利用已训练好的所述要素识别模型,确定所述历史提问数据的第二候选要素和第二要素概率,并基于所述第二候选要素和第二要素概率选取最优要素;
根据所述最优要素生成要素共现概率矩阵P;假定N为知识图谱中主题、问题类型、约束要素的总数量,构建NxN矩阵P,为要素/>在历史数据中出现的次数统计,/>为要素/>和/>共同出现的次数统计,计算矩阵每个节点/>的方法如下:
根据所述要素概率和要素间相融度计算每个候选要素的要素分值;假定集合E为所有识别出来的候选要素,为要素识别模型输出的概率,在计算要素/>与其他要素的相融度时,使用/>代表相融度,/>为调节相融度分支占比的超参数,/>为要素更新的方法函数;计算每个候选要素的要素分值具体如下:
进一步的,按照所述要素分值给所述候选要素排序,并根据排序前topK的候选要素从预设的知识图谱中关联出备选问题之后,返回所述备选问题对应的答案给所述终端之前还包括:
判断所述备选问题是否为一个,如果是,则返回所述备选问题对应的答案给所述终端;
判断所述备选问题是否为一个,如果不是,则给每个备选问题打分;打分方法利用要素间的共现概率矩阵P,即条件概率;假设E为所有识别出来的备选要素,/>为筛选出来的备选问题,/>为某个备选问题的缺失要素,对于每个备选问题的分值/>计算方法如下:
将打分最高的备选问题返回给所述终端。
进一步的,按照所述要素分值给所述候选要素排序,并根据排序前topK的候选要素从预设的知识图谱中关联出备选问题之后,返回所述备选问题对应的答案给所述终端之前还包括:
判断所述备选问题是否为一个,如果不是,则根据所有备选问题中缺失的要素确定一个或多个缺失要素所属要素类型;
分别计算每种要素类型在给定各个可能的相关要素后,剩余备选问题的数目的平均值;
根据剩余备选问题平均值最小的缺失要素类型关联相应的反问问题输出到终端。
进一步的,还包括:
使用指数加权平均值和当前要素识别概率值取max的操作以进行要素更新;计算方法如下:
,/>为影响每个要素的“淡忘”速度的超参数,/>为要素更新的方法函数。
为了实现上述目的,根据本申请的另一方面,提供了一种法律领域FAQ问答的匹配装置。
根据本申请的法律领域FAQ问答的匹配装置包括:接收模块,用于接收用户在终端描述的待匹配问题;识别模块,用于采用训练好的要素识别模型,先确定所述待匹配问题的候选要素、要素概率及要素间相融度,再根据所述要素概率和要素间相融度计算每个候选要素的要素分值;排序关联模块,用于按照所述要素分值给所述候选要素排序,并根据排序前topK的候选要素从预设的知识图谱中关联出备选问题;返回模块,用于返回所述备选问题对应的答案给所述终端。
为了实现上述目的,根据本申请的另一方面,提供了一种计算机可读存储介质。
根据本申请的计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述的法律领域FAQ问答的匹配方法。
为了实现上述目的,根据本申请的另一方面,提供了一种电子装置。
根据本申请的电子装置,包括:存储器和处理器,所述存储器中存储有计算机程序,其中,所述处理器被设置为运行所述计算机程序以执行所述的法律领域FAQ问答的匹配方法。
在本申请实施例中,采用法律领域FAQ问答进行匹配的方式,通过接收用户在终端描述的待匹配问题;采用训练好的要素识别模型,先确定所述待匹配问题的候选要素、要素概率及要素间相融度,再根据所述要素概率和要素间相融度计算每个候选要素的要素分值;按照所述要素分值给所述候选要素排序,并根据排序前topK的候选要素从预设的知识图谱中关联出备选问题;返回所述备选问题对应的答案给所述终端;达到了对要素打分时考虑了候选要素之间作为一个问题的相融度的目的,从而实现了有效避免了模型匹配到与主题存在偏差的其他问题的技术效果,进而解决了由于用户提问时可能夹带着对问题本身不必要的要素,造成的模型匹配到与主题存在偏差的其他问题的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的法律领域FAQ问答的匹配方法的流程示意图;
图2是根据本申请实施例的法律领域FAQ问答的匹配装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本发明及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本发明中的具体含义。
此外,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
根据本发明实施例,提供了一种法律领域FAQ问答的匹配方法,如图1所示,该方法包括如下的步骤S101至步骤S104:
步骤S101、接收用户在终端描述的待匹配问题;
具体地,可以在手机、电脑等终端设备上安装相应的应用处理软件,用户通过在该软件界面的输入栏操作可以描述相应的法律领域相关问题,描述结束后,点击确定即可将该描述的待匹配问题上传到服务器或本地大型计算机中进行相应的匹配处理。
步骤S102、采用训练好的要素识别模型,先确定所述待匹配问题的候选要素、要素概率及要素间相融度,再根据所述要素概率和要素间相融度计算每个候选要素的要素分值;
通过多标签分类模型,实体识别与实体链接模型相结合的方式实现要素的识别,即识别问题中涉及的主题,问题类型,约束要素及要素分值。
本实施例中,所述要素识别模型为多标签分类模型或多标签分类与要素链接相结合的分类模型。
对于主题,问题类型可以采用多标签0-1分类模型,判断问句是否包含某个主题或问题类型。使用Bert模型对问句进行编码,并在输出层使用全连接网络+sigmoid激活函数的得到包含该要素的概率,从而可以根据对概率的阈值筛选, 得到top K个候选实体。
根据业务和数据的分析,对于在问题中表述可能为描述性话语的要素类型(如,法律场景中案件类型的表示可能为案情的描述)也可以采用多标签0-1分类模型,方法同上。
还可以采用实体识别模型+实体链接模型实现对其他的要素类型的识别。具体来说本发明使用Bert+CRF实现命名实体识别得到可能存在实体的一个或多个mention,并各个mention经过Bert的输出向量分别取平均,得到mention的表示,将要素实体的名称输入到通过Bert编码,将Bert输出向量取平均,得到实体的表示,将实体的表示和mention的表示进行拼接,再输入到全连接层+sigmoid函数得到该要素的概率,从而可以根据对概率的阈值筛选, 得到top K个候选实体。
根据本发明实施例,优选的,采用训练好的要素识别模型,先确定所述待匹配问题的候选要素、要素概率及要素间相融度,再根据所述要素概率和要素间相融度计算每个候选要素的要素分值包括:
获取用户提问的历史提问数据;
利用已训练好的所述要素识别模型,确定所述历史提问数据的第二候选要素和第二要素概率,并基于所述第二候选要素和第二要素概率选取最优要素;
根据所述最优要素生成要素共现概率矩阵P;假定N为知识图谱中主题、问题类型、约束要素的总数量,构建NxN矩阵P,为要素/>在历史数据中出现的次数统计,/>为要素/>和/>共同出现的次数统计,计算矩阵每个节点/>的方法如下:
根据所述要素概率和要素间相融度计算每个候选要素的要素分值;假定集合E为所有识别出来的候选要素,为要素识别模型输出的概率,本发明在计算要素/>与其他要素的相融度时,使用/>代表相融度,/>为调节相融度分支占比的超参数;计算每个候选要素的要素分值具体如下:
传统实体链接模型只考虑了实体在图谱中的相融度,并未考虑实体在真实场景中的相融度。随着用户数据的积累,要素间的相融度计算可以进一步提高。本发明采用,即给定要素/>,要素/>出现的概率,代表要素间的相融度。计算/>需要使用真实的线上用户历史提问的数据,并利用已训练完成的上述要素识别模型对历史提问数据进行要素提取,该过程只根据要素识别模型输出的要素及其概率通过阈值选取最优的要素,不考虑要素间相融度的计算。
用户在描述一个问题时,可能夹带着对问题本身不必要的要素,这些不必要的话可能导致传统语义匹配模型匹配到与主题存在偏差的其他问题。因此,发明在将为每个要素进行打分时,除了考虑以上模型输出识别要素自身的概率外,还考虑每个备选要素和其他备选要素之间的相融度。从而降低不必要要素的分值。每个要素的最终得分为的给定问句要素的概率/>加上与其他所有备选要素与该要素的相融度的加权。
在计算要素间相融度时,利用线上历史数据构建要素共现概率矩阵,且在要素打分,问题推荐中融入了真实数据的概率分布,有效利用历史交互信息完成问题匹配。对要素打分时考虑了候选要素之间作为一个问题的相融度。由于用户提问时可能夹带着对问题本身不必要的要素,这些不必要的话可能导致传统语义匹配模型匹配到与主题存在偏差的其他问题。本发明通过相融度的计算拉低相关要素的分值,使其在要素匹配问题的过程中优先级排名靠后,实现避免主题的偏差。
步骤S103、按照所述要素分值给所述候选要素排序,并根据排序前topK的候选要素从预设的知识图谱中关联出备选问题;
根据备选实体及其分值,实现问题的匹配,要素澄清和问题推荐。具体地,根据要素识别模型得到的候选要素及其分值,对要素按分数由高到低进行排序,并依次查询每个候选要素在知识图谱中关联的问题,并与之前的查询结果取交集得到新的备选问题,直到取交集得到的备选问题集合为空停止,并舍弃当前要素。将上一次取交集后得到的备选问题作为最终的备选问题结果。
步骤S104、返回所述备选问题对应的答案给所述终端。
每个问题都有具有关联关系的答案,在筛选出相应的备选问题后,根据关联关系关联到相应的答案,返回到用户的终端上,用户可以通过终端查看最终输出的答案。
从以上的描述中,可以看出,本发明实现了如下技术效果:
在本申请实施例中,采用法律领域FAQ问答进行匹配的方式,通过接收用户在终端描述的待匹配问题;采用训练好的要素识别模型,先确定所述待匹配问题的候选要素、要素概率及要素间相融度,再根据所述要素概率和要素间相融度计算每个候选要素的要素分值;按照所述要素分值给所述候选要素排序,并根据排序前topK的候选要素从预设的知识图谱中关联出备选问题;返回所述备选问题对应的答案给所述终端;达到了对要素打分时考虑了候选要素之间作为一个问题的相融度的目的,从而实现了有效避免了模型匹配到与主题存在偏差的其他问题的技术效果,进而解决了由于用户提问时可能夹带着对问题本身不必要的要素,造成的模型匹配到与主题存在偏差的其他问题的技术问题。
根据本发明实施例,优选的,所述知识图谱的构建包括:
获取FAQ标准问答数据;
从所述FAQ标准问答数据中提取标准问题要素、主题要素、问题类型要素、约束要素要素、要素类别要素及要素间关系;
基于标准问题要素、主题要素、问题类型要素、约束要素要素、要素类别要素及要素间关系构建知识图谱。
基于FAQ标准问题自底向上构建知识图谱。知识图谱包含以下实体类型:
标准问题实体:表示一个待查询的标准问题(如,离婚案件要交多少诉讼费?)
主题实体:表示标准问题可能包含的主题(如,立案,立案材料,诉讼费,立案标的额,退费等)
问题类型实体:表示标准问题可能包含的问题类型(如,包括什么,如何,是否需要,什么时候,多少钱,谁承担,电话号码等)
约束要素实体:表示标准问题可能包含的其他约束要素条件(如,二审,民事,离婚案件,中院,公司案件,河北省高院等)
要素类别实体:表示不同约束要素所属的类别。为实现缺失要素的反问,根据业务知识将约束要素进行归类并构建要素类别实体(如审级,案件类型,身份,立案方式,法院级别等)。
知识图谱包含以下实体关系:
问题包含要素:表示标准问题包含的主题,问题类型,约束要素(如,标准问题实体“离婚案件要交多少诉讼费?”包含主题“诉讼费”,问题类型)
要素相关问题:表示主题,问题类型,约束要素相关的标准问题
要素属于要素类型:表示约束要素输入某要素类别(如,约束要素“二审”属于“审级”要素类别)
要素类型包含要素:表示要素类别包含的约束要素实体。
标准问题至少涉及一个主题实体,一个问题类型实体,可以有一个,多个或零个约束要素。除此之外,图谱构建过程中还存在以下限制,相同要素的两个问题不应该存在两个节点,即不存在两个问题实体包含完全相同的一组要素集合。
基于上述的要素及其关联关系,能够构建出包含约束要素、主题、问题类型、约束要素类型等实体的知识图谱。
根据本发明实施例,优选的,按照所述要素分值给所述候选要素排序,并根据排序前topK的候选要素从预设的知识图谱中关联出备选问题之后,返回所述备选问题对应的答案给所述终端之前还包括:
判断所述备选问题是否为一个,如果是,则返回所述备选问题对应的答案给所述终端;
判断所述备选问题是否为一个,如果不是,则给每个备选问题打分;打分方法利用要素间的共现概率矩阵P,即条件概率;假设E为所有识别出来的备选要素,/>为筛选出来的备选问题,/>为某个备选问题的缺失要素,对于每个备选问题的分值/>计算方法如下:
将打分最高的备选问题返回给所述终端。
当备选问题不唯一且主题或问题类型缺失情况下。本发明通过问题推荐引导用户。问题推荐将对每个备选问题进行打分,并且分数最高的备选问题进行推荐。推荐话术为事先定义的话术模板(如,请您再完整的描述一下您的问题,如<推荐问题>)。打分方法利用要素间的共现概率矩阵P,即条件概率。打分最高的备选问题返回给终端。
根据本发明实施例,优选的,按照所述要素分值给所述候选要素排序,并根据排序前topK的候选要素从预设的知识图谱中关联出备选问题之后,返回所述备选问题对应的答案给所述终端之前还包括:
判断所述备选问题是否为一个,如果不是,则根据所有备选问题中缺失的要素确定一个或多个缺失要素所属要素类型;
分别计算每种要素类型在给定各个可能的相关要素后,剩余备选问题的数目的平均值;
根据剩余备选问题平均值最小的缺失要素类型关联相应的反问问题输出到终端。
如果备选问题只有一个则直接返回这个问题的答案。如果备选问题包含多个,则根据所有备选问题中缺失的要素,确定一个或多个缺失要素所属要素类型。并分别计算每种要素类型,在给定各个可能的相关要素后,剩余备选问题的数目的平均值。取剩余备选问题最小的缺失要素类型,进行反问。各个要素类型反问话术根据业务和相关要素数量由人工事先编辑(如,请问您的案件是民事,行政,还是刑事案件?)。通过构建问题要素知识图谱,要素识别和知识图谱查询实现自动对问题缺失要素进行反问。
根据本发明实施例,优选的,还包括:
使用指数加权平均值和当前要素识别概率值取max的操作以进行要素更新;计算方法如下:
用户可能出于追问,纠正或回答反问等原因,省略完整问题的部分已在最近几次交互轮次中提及的问题要素。这就需要对历史提及的要素有记忆的能力。同时,记忆应该逐渐“淡忘”避免在要素排序中排序太高,影响新问题的匹配。除此之外,用户新提及的要素应该很快更新。对于要素的记忆本发明采用指数加权平均的方法,为影响每个要素的“淡忘”速度的超参数。该值取值范围为0-1,值越大“淡忘”速度慢,可以取不同的值也可以采用统一默认值。除此之外,在反问轮次,可以通过临时动态调整上一轮已经识别到的要素的/>值实现记忆的加强。本发明使用指数加权平均值和当前要素识别概率值取max的操作实现用户新表达的要素可以快速更新。在问题要素识别的基础上增加要素“记忆”机制,实现对用户省略的已提及的要素的记忆。实现跨轮次的问题匹配。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本发明实施例,还提供了一种用于实施上述法律领域FAQ问答的匹配方法的装置,如图2所示,该装置包括:
接收模块10,用于接收用户在终端描述的待匹配问题;
具体地,可以在手机、电脑等终端设备上安装相应的应用处理软件,用户通过在该软件界面的输入栏操作可以描述相应的法律领域相关问题,描述结束后,点击确定即可将该描述的待匹配问题上传到服务器或本地大型计算机中进行相应的匹配处理。
识别模块20,用于采用训练好的要素识别模型,先确定所述待匹配问题的候选要素、要素概率及要素间相融度,再根据所述要素概率和要素间相融度计算每个候选要素的要素分值;
通过多标签分类模型,实体识别与实体链接模型相结合的方式实现要素的识别,即识别问题中涉及的主题,问题类型,约束要素及要素分值。
本实施例中,所述要素识别模型为多标签分类模型或多标签分类与要素链接相结合的分类模型。
对于主题,问题类型可以采用多标签0-1分类模型,判断问句是否包含某个主题或问题类型。使用Bert模型对问句进行编码,并在输出层使用全连接网络+sigmoid激活函数的得到包含该要素的概率,从而可以根据对概率的阈值筛选, 得到top K个候选实体。
根据业务和数据的分析,对于在问题中表述可能为描述性话语的要素类型(如,法律场景中案件类型的表示可能为案情的描述)也可以采用多标签0-1分类模型,方法同上。
还可以采用实体识别模型+实体链接模型实现对其他的要素类型的识别。具体来说本发明使用Bert+CRF实现命名实体识别得到可能存在实体的一个或多个mention,并各个mention经过Bert的输出向量分别取平均,得到mention的表示,将要素实体的名称输入到通过Bert编码,将Bert输出向量取平均,得到实体的表示,将实体的表示和mention的表示进行拼接,再输入到全连接层+sigmoid函数得到该要素的概率,从而可以根据对概率的阈值筛选, 得到top K个候选实体。
根据本发明实施例,优选的,采用训练好的要素识别模型,先确定所述待匹配问题的候选要素、要素概率及要素间相融度,再根据所述要素概率和要素间相融度计算每个候选要素的要素分值包括:
获取用户提问的历史提问数据;
利用已训练好的所述要素识别模型,确定所述历史提问数据的第二候选要素和第二要素概率,并基于所述第二候选要素和第二要素概率选取最优要素;
根据所述最优要素生成要素共现概率矩阵P;假定N为知识图谱中主题、问题类型、约束要素的总数量,构建NxN矩阵P,为要素/>在历史数据中出现的次数统计,/>为要素/>和/>共同出现的次数统计,计算矩阵每个节点/>的方法如下:
根据所述要素概率和要素间相融度计算每个候选要素的要素分值;假定集合E为所有识别出来的候选要素,为要素识别模型输出的概率,本发明在计算要素/>与其他要素的相融度时,使用/>代表相融度,/>为调节相融度分支占比的超参数;计算每个候选要素的要素分值具体如下:
传统实体链接模型只考虑了实体在图谱中的相融度,并未考虑实体在真实场景中的相融度。随着用户数据的积累,要素间的相融度计算可以进一步提高。本发明采用,即给定要素/>,要素/>出现的概率,代表要素间的相融度。计算/>需要使用真实的线上用户历史提问的数据,并利用已训练完成的上述要素识别模型对历史提问数据进行要素提取,该过程只根据要素识别模型输出的要素及其概率通过阈值选取最优的要素,不考虑要素间相融度的计算。
用户在描述一个问题时,可能夹带着对问题本身不必要的要素,这些不必要的话可能导致传统语义匹配模型匹配到与主题存在偏差的其他问题。因此,发明在将为每个要素进行打分时,除了考虑以上模型输出识别要素自身的概率外,还考虑每个备选要素和其他备选要素之间的相融度。从而降低不必要要素的分值。每个要素的最终得分为的给定问句要素的概率/>加上与其他所有备选要素与该要素的相融度的加权。
在计算要素间相融度时,利用线上历史数据构建要素共现概率矩阵,且在要素打分,问题推荐中融入了真实数据的概率分布,有效利用历史交互信息完成问题匹配。对要素打分时考虑了候选要素之间作为一个问题的相融度。由于用户提问时可能夹带着对问题本身不必要的要素,这些不必要的话可能导致传统语义匹配模型匹配到与主题存在偏差的其他问题。本发明通过相融度的计算拉低相关要素的分值,使其在要素匹配问题的过程中优先级排名靠后,实现避免主题的偏差。
排序关联模块30,用于按照所述要素分值给所述候选要素排序,并根据排序前topK的候选要素从预设的知识图谱中关联出备选问题;
根据备选实体及其分值,实现问题的匹配,要素澄清和问题推荐。具体地,根据要素识别模型得到的候选要素及其分值,对要素按分数由高到低进行排序,并依次查询每个候选要素在知识图谱中关联的问题,并与之前的查询结果取交集得到新的备选问题,直到取交集得到的备选问题集合为空停止,并舍弃当前要素。将上一次取交集后得到的备选问题作为最终的备选问题结果。
返回模块40,用于返回所述备选问题对应的答案给所述终端。
每个问题都有具有关联关系的答案,在筛选出相应的备选问题后,根据关联关系关联到相应的答案,返回到用户的终端上,用户可以通过终端查看最终输出的答案。
从以上的描述中,可以看出,本发明实现了如下技术效果:
在本申请实施例中,采用法律领域FAQ问答进行匹配的方式,通过接收用户在终端描述的待匹配问题;采用训练好的要素识别模型,先确定所述待匹配问题的候选要素、要素概率及要素间相融度,再根据所述要素概率和要素间相融度计算每个候选要素的要素分值;按照所述要素分值给所述候选要素排序,并根据排序前topK的候选要素从预设的知识图谱中关联出备选问题;返回所述备选问题对应的答案给所述终端;达到了对要素打分时考虑了候选要素之间作为一个问题的相融度的目的,从而实现了有效避免了模型匹配到与主题存在偏差的其他问题的技术效果,进而解决了由于用户提问时可能夹带着对问题本身不必要的要素,造成的模型匹配到与主题存在偏差的其他问题的技术问题。
根据本发明实施例,优选的,所述知识图谱的构建包括:
获取FAQ标准问答数据;
从所述FAQ标准问答数据中提取标准问题要素、主题要素、问题类型要素、约束要素要素、要素类别要素及要素间关系;
基于标准问题要素、主题要素、问题类型要素、约束要素要素、要素类别要素及要素间关系构建知识图谱。
基于FAQ标准问题自底向上构建知识图谱。知识图谱包含以下实体类型:
标准问题实体:表示一个待查询的标准问题(如,离婚案件要交多少诉讼费?)
主题实体:表示标准问题可能包含的主题(如,立案,立案材料,诉讼费,立案标的额,退费等)
问题类型实体:表示标准问题可能包含的问题类型(如,包括什么,如何,是否需要,什么时候,多少钱,谁承担,电话号码等)
约束要素实体:表示标准问题可能包含的其他约束要素条件(如,二审,民事,离婚案件,中院,公司案件,河北省高院等)
要素类别实体:表示不同约束要素所属的类别。为实现缺失要素的反问,根据业务知识将约束要素进行归类并构建要素类别实体(如审级,案件类型,身份,立案方式,法院级别等)。
知识图谱包含以下实体关系:
问题包含要素:表示标准问题包含的主题,问题类型,约束要素(如,标准问题实体“离婚案件要交多少诉讼费?”包含主题“诉讼费”,问题类型)
要素相关问题:表示主题,问题类型,约束要素相关的标准问题
要素属于要素类型:表示约束要素输入某要素类别(如,约束要素“二审”属于“审级”要素类别)
要素类型包含要素:表示要素类别包含的约束要素实体。
标准问题至少涉及一个主题实体,一个问题类型实体,可以有一个,多个或零个约束要素。除此之外,图谱构建过程中还存在以下限制,相同要素的两个问题不应该存在两个节点,即不存在两个问题实体包含完全相同的一组要素集合。
基于上述的要素及其关联关系,能够构建出包含约束要素、主题、问题类型、约束要素类型等实体的知识图谱。
根据本发明实施例,优选的,按照所述要素分值给所述候选要素排序,并根据排序前topK的候选要素从预设的知识图谱中关联出备选问题之后,返回所述备选问题对应的答案给所述终端之前还包括:
判断所述备选问题是否为一个,如果是,则返回所述备选问题对应的答案给所述终端;
判断所述备选问题是否为一个,如果不是,则给每个备选问题打分;打分方法利用要素间的共现概率矩阵P,即条件概率;假设E为所有识别出来的备选要素,/>为筛选出来的备选问题,/>为某个备选问题的缺失要素,对于每个备选问题的分值/>计算方法如下:
将打分最高的备选问题返回给所述终端。
当备选问题不唯一且主题或问题类型缺失情况下。本发明通过问题推荐引导用户。问题推荐将对每个备选问题进行打分,并且分数最高的备选问题进行推荐。推荐话术为事先定义的话术模板(如,请您再完整的描述一下您的问题,如<推荐问题>)。打分方法利用要素间的共现概率矩阵P,即条件概率。打分最高的备选问题返回给终端。
根据本发明实施例,优选的,按照所述要素分值给所述候选要素排序,并根据排序前topK的候选要素从预设的知识图谱中关联出备选问题之后,返回所述备选问题对应的答案给所述终端之前还包括:
判断所述备选问题是否为一个,如果不是,则根据所有备选问题中缺失的要素确定一个或多个缺失要素所属要素类型;
分别计算每种要素类型在给定各个可能的相关要素后,剩余备选问题的数目的平均值;
根据剩余备选问题平均值最小的缺失要素类型关联相应的反问问题输出到终端。
如果备选问题只有一个则直接返回这个问题的答案。如果备选问题包含多个,则根据所有备选问题中缺失的要素,确定一个或多个缺失要素所属要素类型。并分别计算每种要素类型,在给定各个可能的相关要素后,剩余备选问题的数目的平均值。取剩余备选问题最小的缺失要素类型,进行反问。各个要素类型反问话术根据业务和相关要素数量由人工事先编辑(如,请问您的案件是民事,行政,还是刑事案件?)。通过构建问题要素知识图谱,要素识别和知识图谱查询实现自动对问题缺失要素进行反问。
根据本发明实施例,优选的,还包括:
使用指数加权平均值和当前要素识别概率值取max的操作以进行要素更新;计算方法如下:
用户可能出于追问,纠正或回答反问等原因,省略完整问题的部分已在最近几次交互轮次中提及的问题要素。这就需要对历史提及的要素有记忆的能力。同时,记忆应该逐渐“淡忘”避免在要素排序中排序太高,影响新问题的匹配。除此之外,用户新提及的要素应该很快更新。对于要素的记忆本发明采用指数加权平均的方法,为影响每个要素的“淡忘”速度的超参数。该值取值范围为0-1,值越大“淡忘”速度慢,可以取不同的值也可以采用统一默认值。除此之外,在反问轮次,可以通过临时动态调整上一轮已经识别到的要素的/>值实现记忆的加强。本发明使用指数加权平均值和当前要素识别概率值取max的操作实现用户新表达的要素可以快速更新。在问题要素识别的基础上增加要素“记忆”机制,实现对用户省略的已提及的要素的记忆。实现跨轮次的问题匹配。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (8)
1.一种法律领域FAQ问答的匹配方法,其特征在于,包括:
接收用户在终端描述的待匹配问题;
采用训练好的要素识别模型,先确定所述待匹配问题的候选要素、要素概率及要素间相融度,再根据所述要素概率和要素间相融度计算每个候选要素的要素分值;
按照所述要素分值给所述候选要素排序,并根据排序前topK的候选要素从预设的知识图谱中关联出备选问题;
返回所述备选问题对应的答案给所述终端;
采用训练好的要素识别模型,先确定所述待匹配问题的候选要素、要素概率及要素间相融度,再根据所述要素概率和要素间相融度计算每个候选要素的要素分值包括:
获取用户提问的历史提问数据;
利用已训练好的所述要素识别模型,确定所述历史提问数据的第二候选要素和第二要素概率,并基于所述第二候选要素和第二要素概率选取最优要素;
根据所述最优要素生成要素共现概率矩阵P;假定N为知识图谱中主题、问题类型、约束要素的总数量,构建NxN矩阵P,为要素/>在历史数据中出现的次数统计,/>为要素/>和/>共同出现的次数统计,计算矩阵每个节点/>的方法如下:
根据所述要素概率和要素间相融度计算每个候选要素的要素分值;假定集合E为所有识别出来的候选要素,为要素识别模型输出的概率,在计算要素/>与其他要素的相融度时,使用/>代表相融度,/>为调节相融度分支占比的超参数,/>为要素更新的方法函数;计算每个候选要素的要素分值具体如下:
按照所述要素分值给所述候选要素排序,并根据排序前topK的候选要素从预设的知识图谱中关联出备选问题之后,返回所述备选问题对应的答案给所述终端之前还包括:
判断所述备选问题是否为一个,如果是,则返回所述备选问题对应的答案给所述终端;
判断所述备选问题是否为一个,如果不是,则给每个备选问题打分;打分方法利用要素间的共现概率矩阵P,即条件概率;假设E为所有识别出来的备选要素,/>为筛选出来的备选问题,/>为某个备选问题的缺失要素,对于每个备选问题的分值/>计算方法如下:
将打分最高的备选问题返回给所述终端。
2.根据权利要求1所述的匹配方法,其特征在于,所述要素识别模型为多标签分类模型或多标签分类与要素链接相结合的分类模型。
3.根据权利要求1所述的匹配方法,其特征在于,所述知识图谱的构建包括:
获取FAQ标准问答数据;
从所述FAQ标准问答数据中提取标准问题要素、主题要素、问题类型要素、约束要素要素、要素类别要素及要素间关系;
基于标准问题要素、主题要素、问题类型要素、约束要素要素、要素类别要素及要素间关系构建知识图谱。
4.根据权利要求1所述的匹配方法,其特征在于,按照所述要素分值给所述候选要素排序,并根据排序前topK的候选要素从预设的知识图谱中关联出备选问题之后,返回所述备选问题对应的答案给所述终端之前还包括:
判断所述备选问题是否为一个,如果不是,则根据所有备选问题中缺失的要素确定一个或多个缺失要素所属要素类型;
分别计算每种要素类型在给定各个可能的相关要素后,剩余备选问题的数目的平均值;
根据剩余备选问题平均值最小的缺失要素类型关联相应的反问问题输出到终端。
5.根据权利要求1所述的匹配方法,其特征在于,还包括:
使用指数加权平均值和当前要素识别概率值取max的操作以进行要素更新;计算方法如下:
,/>为影响每个要素的“淡忘”速度的超参数,/>为要素更新的方法函数。
6.一种法律领域FAQ问答的匹配装置,其特征在于,包括:
接收模块,用于接收用户在终端描述的待匹配问题;
识别模块,用于采用训练好的要素识别模型,先确定所述待匹配问题的候选要素、要素概率及要素间相融度,再根据所述要素概率和要素间相融度计算每个候选要素的要素分值;
排序关联模块,用于按照所述要素分值给所述候选要素排序,并根据排序前topK的候选要素从预设的知识图谱中关联出备选问题;
返回模块,用于返回所述备选问题对应的答案给所述终端;
采用训练好的要素识别模型,先确定所述待匹配问题的候选要素、要素概率及要素间相融度,再根据所述要素概率和要素间相融度计算每个候选要素的要素分值包括:
获取用户提问的历史提问数据;
利用已训练好的所述要素识别模型,确定所述历史提问数据的第二候选要素和第二要素概率,并基于所述第二候选要素和第二要素概率选取最优要素;
根据所述最优要素生成要素共现概率矩阵P;假定N为知识图谱中主题、问题类型、约束要素的总数量,构建NxN矩阵P,为要素/>在历史数据中出现的次数统计,/>为要素/>和/>共同出现的次数统计,计算矩阵每个节点/>的方法如下:
根据所述要素概率和要素间相融度计算每个候选要素的要素分值;假定集合E为所有识别出来的候选要素,为要素识别模型输出的概率,在计算要素/>与其他要素的相融度时,使用/>代表相融度,/>为调节相融度分支占比的超参数,/>为要素更新的方法函数;计算每个候选要素的要素分值具体如下:
按照所述要素分值给所述候选要素排序,并根据排序前topK的候选要素从预设的知识图谱中关联出备选问题之后,返回所述备选问题对应的答案给所述终端之前还包括:
判断所述备选问题是否为一个,如果是,则返回所述备选问题对应的答案给所述终端;
判断所述备选问题是否为一个,如果不是,则给每个备选问题打分;打分方法利用要素间的共现概率矩阵P,即条件概率;假设E为所有识别出来的备选要素,/>为筛选出来的备选问题,/>为某个备选问题的缺失要素,对于每个备选问题的分值/>计算方法如下:
将打分最高的备选问题返回给所述终端。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至5中任一项所述的法律领域FAQ问答的匹配方法。
8.一种电子装置,包括:存储器和处理器,其特征在于,所述存储器中存储有计算机程序,其中,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至5中任一项所述的法律领域FAQ问答的匹配方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310251225.3A CN116431779B (zh) | 2023-03-15 | 2023-03-15 | 法律领域faq问答的匹配方法、装置、存储介质及电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310251225.3A CN116431779B (zh) | 2023-03-15 | 2023-03-15 | 法律领域faq问答的匹配方法、装置、存储介质及电子装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116431779A CN116431779A (zh) | 2023-07-14 |
CN116431779B true CN116431779B (zh) | 2023-10-03 |
Family
ID=87089876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310251225.3A Active CN116431779B (zh) | 2023-03-15 | 2023-03-15 | 法律领域faq问答的匹配方法、装置、存储介质及电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116431779B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107330071A (zh) * | 2017-06-30 | 2017-11-07 | 北京神州泰岳软件股份有限公司 | 一种法律咨询信息智能答复方法及平台 |
CN113360616A (zh) * | 2021-06-04 | 2021-09-07 | 科大讯飞股份有限公司 | 自动问答处理方法、装置、设备及存储介质 |
-
2023
- 2023-03-15 CN CN202310251225.3A patent/CN116431779B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107330071A (zh) * | 2017-06-30 | 2017-11-07 | 北京神州泰岳软件股份有限公司 | 一种法律咨询信息智能答复方法及平台 |
CN113360616A (zh) * | 2021-06-04 | 2021-09-07 | 科大讯飞股份有限公司 | 自动问答处理方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116431779A (zh) | 2023-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111444428B (zh) | 基于人工智能的信息推荐方法、装置、电子设备及存储介质 | |
CN112346567B (zh) | 基于ai的虚拟交互模型生成方法、装置及计算机设备 | |
KR102288249B1 (ko) | 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체 | |
CN109299245B (zh) | 知识点召回的方法和装置 | |
US11610064B2 (en) | Clarification of natural language requests using neural networks | |
CN111125334A (zh) | 一种基于预训练的搜索问答系统 | |
CN108885623A (zh) | 基于知识图谱的语意分析系统及方法 | |
CN108846138B (zh) | 一种融合答案信息的问题分类模型构建方法、装置和介质 | |
CN110516057B (zh) | 一种信访问题答复方法及装置 | |
CN112948534A (zh) | 一种智能人机对话的交互方法、系统和电子设备 | |
CN112527998A (zh) | 一种答复推荐方法、答复推荐装置及智能设备 | |
CN111258995A (zh) | 数据处理方法、装置、存储介质及设备 | |
Windiatmoko et al. | Developing facebook chatbot based on deep learning using rasa framework for university enquiries | |
CN112163081A (zh) | 标签确定方法、装置、介质及电子设备 | |
CN111767394A (zh) | 一种基于人工智能专家系统的摘要提取方法及装置 | |
CN111858898A (zh) | 基于人工智能的文本处理方法、装置及电子设备 | |
CN108153875B (zh) | 语料处理方法、装置、智能音箱和存储介质 | |
CN117520503A (zh) | 基于llm模型的金融客服对话生成方法、装置、设备及介质 | |
CN115618101A (zh) | 基于负反馈的流媒体内容推荐方法、装置及电子设备 | |
CN115840796A (zh) | 一种事件整合方法、装置、设备及计算机可读存储介质 | |
CN117112727A (zh) | 适用于云计算业务的大语言模型微调指令集构建方法 | |
CN116610872A (zh) | 新闻推荐模型的训练方法及装置 | |
CN116431779B (zh) | 法律领域faq问答的匹配方法、装置、存储介质及电子装置 | |
CN116701752A (zh) | 基于人工智能的新闻推荐方法、装置、电子设备及介质 | |
CN111858860A (zh) | 搜索信息处理方法及系统、服务器、计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |