CN116542817B - 一种智能数字人律师咨询方法及系统 - Google Patents

一种智能数字人律师咨询方法及系统 Download PDF

Info

Publication number
CN116542817B
CN116542817B CN202310819526.1A CN202310819526A CN116542817B CN 116542817 B CN116542817 B CN 116542817B CN 202310819526 A CN202310819526 A CN 202310819526A CN 116542817 B CN116542817 B CN 116542817B
Authority
CN
China
Prior art keywords
word
legal
words
field
word segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310819526.1A
Other languages
English (en)
Other versions
CN116542817A (zh
Inventor
李鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Fenghuo Wanjia Technology Co ltd
Original Assignee
Beijing Fenghuo Wanjia Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Fenghuo Wanjia Technology Co ltd filed Critical Beijing Fenghuo Wanjia Technology Co ltd
Priority to CN202310819526.1A priority Critical patent/CN116542817B/zh
Publication of CN116542817A publication Critical patent/CN116542817A/zh
Application granted granted Critical
Publication of CN116542817B publication Critical patent/CN116542817B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Technology Law (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开一种智能数字人律师咨询方法及系统,涉及人工智能数字人技术领域,该方法包括获取用户咨询信息;提取用户咨询信息中的关键词;关键词包括若干法务领域相关词语;将关键词与法务知识图谱中的实体进行匹配,得到关键词的扩展词集;扩展词集为由关键词以及与关键词中每一法务领域相关词语含义相近的若干法务领域相关词语组成的集合;法务知识图谱中的实体为法务领域相关词语;根据扩展词集从法务答案库中找到用户咨询信息的答案,并将答案以虚拟数字人音频形式发送给用户。本发明可为用户明确要咨询的法务领域,适用于法律知识水平不高的普通群众,并且本发明覆盖的法务领域广,可减少法务咨询企业的人力成本和经济成本。

Description

一种智能数字人律师咨询方法及系统
技术领域
本发明涉及人工智能数字人技术领域,特别是涉及一种可视化的智能数字人律师咨询方法及系统。
背景技术
目前普通人进行法务咨询需要明确自身需求,对相关咨询人员提出具体法务要求,具体流程如下:1、确定法律领域:法律领域非常广泛,包括民事、刑事、商业、劳动和知识产权等方面。2、寻找事宜的法务咨询人员:根据需要咨询的法律领域,寻找法务人员进行咨询,通过互联网、律师协会、法律服务机构等途径找到合适的法务人员。3、在咨询过程中,法务人员据问题进行分析,并给出相应的解释,询问人员需要提供与法务问题相关的文件、证据等材料。4、如果问题比较复杂,需要进行诉讼等法律程序,需要与法务人员进一步协商并制定相应的计划。
然而,在普通群众通过电话方式咨询普通律师时,普通群众一般不具备相关基础法务知识,这对法务初期的咨询造成了一定的人力资源浪费,而对一些规模不大的法务咨询企业来说,法务领域也可能无法全部精确覆盖,而在以上步骤2和3中企业在解决客户简单问题时取得的经济效益难以覆盖其人力成本,这也是法务公司运营的一大难题。
发明内容
本发明的目的是提供一种智能数字人律师咨询方法及系统。
为实现上述目的,本发明提供了如下方案:
一种智能数字人律师咨询方法,所述方法包括:
获取用户咨询信息;
提取所述用户咨询信息中的关键词;所述关键词包括若干法务领域相关词语;
将所述关键词与法务知识图谱中的实体进行匹配,得到所述关键词的扩展词集;所述扩展词集为由所述关键词以及与所述关键词中每一所述法务领域相关词语含义相近的若干法务领域相关词语组成的集合;所述法务知识图谱中的实体为法务领域相关词语;
根据所述扩展词集从法务答案库中找到所述用户咨询信息的答案,并将所述答案以虚拟数字人音频形式发送给用户。
可选的,所述提取所述用户咨询信息中的关键词,具体包括:
对所述用户咨询信息进行分词,得到分词结果;
根据所述分词结果中每一词语的命中阈值,提取所述关键词;所述命中阈值大小表征所述词语与法务领域的相关性的大小。
可选的,所述对所述用户咨询信息进行分词,得到分词结果,具体包括:
将所述用户咨询信息输入至训练好的分词模型中,得到所述分词结果;所述训练好的分词模型是以样本用户咨询信息为输入,以所述样本用户咨询信息对应的样本分词结果标签,训练得到的模型。
可选的,在所述根据所述分词结果中每一词语的命中阈值,提取所述关键词之前,还包括:确定所述分词结果中每一词语的命中阈值,具体包括:
将所述分词结果输入至训练好的阈值预测模型中,得到所述分词结果中每一词语的命中阈值;所述训练好的阈值预测模型是以样本分词结果为输入,以所述样本分词结果中每一词语的样本命中阈值为标签,训练得到的模型。
可选的,在所述将所述分词结果输入至训练好的阈值预测模型中之前,还包括:
对所述分词结果中的词语进行one hot编码处理。
可选的,在所述将所述关键词与法务知识图谱中的实体进行匹配之前,还包括:构建所述法务知识图谱,具体包括:
获取若干法务领域知识数据;
根据所述法务领域知识数据抽取多个法务领域相关词语;
将所述法务领域相关词语作为知识图谱中的实体,所有所述法务领域相关词语和法务领域相关词语之间的关系构成所述法务知识图谱;所述关系包括平行和包含。
可选的,所述方法还包括:
在根据所述扩展词集从法务答案库中无法找到所述用户咨询信息的答案时,将与所述扩展词集中法务领域相关词语相关的法典内容发送给用户。
可选的,所述方法还包括:
在将所述关键词与法务知识图谱中的实体进行匹配,无法得到所述关键词的扩展词集时,根据所述关键词从法务答案库中找到所述用户咨询信息的答案,并将答案以虚拟数字人音频形式发送给用户。
可选的,在所述将所述答案以虚拟数字人音频形式发送给用户之前,还包括:
根据所述法务答案库中的答案获取所述答案对应的声音数据;
将所述声音数据合成到数字人三维模型上,得到每一所述答案对应的虚拟数字人音频。
本发明还提供了一种智能数字人律师咨询系统,所述系统包括:
信息获取模块,用于获取用户咨询信息;
关键词提取模块,用于提取所述用户咨询信息中的关键词;所述关键词包括若干法务领域相关词语;
匹配模块,用于将所述关键词与法务知识图谱中的实体进行匹配,得到所述关键词的扩展词集;所述扩展词集为由所述关键词以及与所述关键词中每一所述法务领域相关词语含义相近的若干法务领域相关词语组成的集合;所述法务知识图谱中的实体为法务领域相关词语;
答案获取模块,用于根据所述扩展词集从法务答案库中找到所述用户咨询信息的答案,并将所述答案发送给用户。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供了一种智能数字人律师咨询方法及系统,该方法包括:获取用户咨询信息;提取用户咨询信息中的关键词;关键词包括若干法务领域相关词语;将关键词与法务知识图谱中的实体进行匹配,得到关键词的扩展词集;扩展词集为由关键词以及与关键词中每一法务领域相关词语含义相近的若干法务领域相关词语组成的集合;法务知识图谱中的实体为法务领域相关词语;根据扩展词集从法务答案库中找到用户咨询信息的答案,并将答案以虚拟数字人音频形式发送给用户。本发明能够快速地、准确地为用户提供法务咨询服务,适用于法律知识水平不高的普通群众,并且本发明覆盖的法务领域广,可减少法务咨询企业的人力成本和经济成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1提供的智能数字人律师咨询方法流程示意图;
图2为本发明实施例1提供的虚拟数字人音频生成流程示意图;
图3为本发明实施例1提供的虚拟数字人音频水印处理过程示意图;
图4为本发明实施例2提供的智能数字人律师咨询系统框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种智能数字人律师咨询方法及系统,能够快速地、准确地为用户提供法务咨询服务,适用于法律知识水平不高的普通群众,并且本发明覆盖的法务领域广,可减少法务咨询企业的人力成本和经济成本。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明提供了一种智能数字人律师咨询方法,所述方法包括:
S1:获取用户咨询信息。
S2:提取所述用户咨询信息中的关键词;所述关键词包括若干法务领域相关词语。
S3:将所述关键词与法务知识图谱中的实体进行匹配,得到所述关键词的扩展词集;所述扩展词集为由所述关键词以及与所述关键词中每一所述法务领域相关词语含义相近的若干法务领域相关词语组成的集合;所述法务知识图谱中的实体为法务领域相关词语。
S4:根据所述扩展词集从法务答案库中找到所述用户咨询信息的答案,并将所述答案以虚拟数字人音频形式发送给用户。
提取用户咨询信息中的关键词,具体包括:
对用户咨询信息进行分词,得到分词结果。
根据分词结果中每一词语的命中阈值,提取关键词;命中阈值大小表征词语与法务领域的相关性的大小。
其中,对用户咨询信息进行分词,得到分词结果,具体包括:
将用户咨询信息输入至训练好的分词模型中,得到分词结果;训练好的分词模型是以样本用户咨询信息为输入,以样本用户咨询信息对应的样本分词结果标签,训练得到的模型。
在根据分词结果中每一词语的命中阈值,提取关键词之前,还包括:确定分词结果中每一词语的命中阈值,具体包括:
将分词结果输入至训练好的阈值预测模型中,得到分词结果中每一词语的命中阈值;训练好的阈值预测模型是以样本分词结果为输入,以样本分词结果中每一词语的样本命中阈值为标签,训练得到的模型。
在将分词结果输入至训练好的阈值预测模型中之前,还包括:
对分词结果中的词语进行one hot编码处理。
具体地,在本实施例中,在提取所述用户咨询信息中的关键词之前,还包括构建NLU语义理解引擎,具体包括:
1、收集法务语料库:收集全类别的法务语料数据,可以是来自各个渠道的文本数据,渠道可为wap、app和web等。这些法务语料数据用于训练分词模型。在收集法务语料库后,还需要去除不必要的信息、没有实际含义的文本和数据噪音,即去除文本数据中的特殊字符、停用词、错误信息等,得到清洗后的文本数据。所有清洗后的文本数据构成法务语料库。
2、分词:将上述清洗后的文本数据拆分成单词或短语。分词过程需要建立分词模型,以能够从输入的自然语言文本中提取有用的信息,从而得到相关法务关键词。在本实施例中,建立分词模型可用的机器学习模型有:SVM(支持向量机)、决策树、朴素贝叶斯,还可用深度学习模型,例如循环神经网络(RNN)和卷积神经网络(CNN)。
将上述法务语料库划分成训练集和测试集,通过训练集来训练分词模型,然后通过测试集来测试模型的性能,以确定上述分词模型的准确性和性能。
经过上述过程,可得到训练好的分词模型,将用户咨询信息输入至训练好的分词模型中,即可得到分词结果。
例如,用户咨询信息为:我偷了一辆车。
其分词结果为:[我] [偷][了] [一辆][车]。
而在一些情况下,用户输入的信息形式可能为语音,在这种情况下,需要经用户的语音数据转化为可识别的文本,在本实施例中,通过具有自动语音识别(ASR)/语音合成(TTS)能力的开源或闭源语音转化引擎,如whisper、transform-xl等,将语音转化为可识别的文本。
得到分词结果后,为了得到用户咨询信息中的关键词,还需要确定分词结果中每个词语命中阈值,具体如下:
根据词列训练模型,词列编码存入数据库中,编码方法为one hot,编码后的二进制字符唯一对应一个关键词,此步骤中需要:
1.确定要编码的对象;2.确定分类变量;3.确定每个样本的特征数,将其转化为二进制向量表示。
上述编码后同时确定了数据库中分词后,词和词之间的上下文关系。具体地:
以词列的实际内容为词向量输入,以得到上下文关系的权重模型输出,以此得到词列内容阈值(每个关键词的命中阈值)。相应的,可利用NNLM构建阈值预测模型。词列中每个词w的维度为m,即,因词的输入是one hot编码,则N=m,此外n表示词w的上下文中包含的词数。输入前/>个词“/>,...,/>,/>”预测第t个词是w t 的概率,根据输入的前/>个词,在同一个词列D中一一找到它们对应的词向量,把样本分词结果,即所有词向量串联为一个维度为(/>)m的向量x作为三层神经网络(阈值预测模型)的输入,经矩阵向量计算,做softmax归一化计算,输出单个词的命中阈值。
NLU语义理解引擎即构建语义理解词列及词列含义表,其中,语义理解词列包含语气助词列、日常动名词列和专业词列,更进一步的在引擎内设定各个词列的命中阈值,命中阈值大小表征词语与法务领域的相关性的大小,命中阈值越高,与法务领域的相关性越大。其中语气助词列阈值较低,在业务流程中基本忽略不命中,而日常动名词列,专业词列设定阈值较高,在用户语句分词后NLU语义理解中命中QA概率较高。另外,专业词列包含各法务领域专业名词(法务领域相关词语),词列含义表包括所述法务领域专业名词的含义。词列及含义表在引擎中设有映射结构及从属关系,可理解为专业词列以含义表设定某相同法务领域,两个或多个专业词列中的法务专业词相互映射,为用户在咨询流程中提供相关相近领域拓展QA。
经过上述过程可得到训练好的阈值预测模型,对分词结果进行one hot编码,将one hot编码后的分词结果输入至训练好的阈值预测模型中,即可得到分词结果中每个词语的命中阈值。即分词结果为[我] [偷][了] [一辆][车],每个词语的命中阈值。
将分词结果中命中阈值高的词语作为关键词,即关键词为[偷]、[一辆]、[车],[偷]、[一辆]、[车]均为法务领域相关词语。提取到关键词后,可以通过法务知识图谱获取关键词的扩展词集,在所述将所述关键词与法务知识图谱中的实体进行匹配之前,还包括:构建所述法务知识图谱,具体包括:
获取若干法务领域知识数据。
根据所述法务领域知识数据抽取多个法务领域相关词语。
将所述法务领域相关词语作为知识图谱中的实体,所有所述法务领域相关词语和法务领域相关词语之间的关系构成所述法务知识图谱;所述关系包括平行和包含。
具体地,QA中标准问法的本体,即对QA中的法务领域知识点进行知识管理、信息抽取,上述知识图谱模型可视为上述NLU语义理解引擎中词列含义表映射结构及从属关系的基础。
需要相关法务知识的领域和范围,并定义知识图谱中包含的本体和关系。本体是具体或抽象的事物或领域,关系是连接实体的边缘。例如,刑法可以看做一个本体,与其他法务领域之间的关系可以是平行的或包含等一系列逻辑结构。法务领域知识数据可为结构化和非结构化法务数据,从结构化和非结构化法务数据源中抽取本体和关系。结构化数据可以从各类数据库或表格中获取,而非结构化数据可以从文本、图像和视频等多媒体数据中获取。在本实施例中,可以使用自然语言处理、图像处理和机器学习等技术来从非结构化数据中抽取实体和关系。
需要说明的是,在抽取本体和关系时,可能会存在歧义,例如同一个本体具有不同的名称或同一对本体之间具有多个关系。在这种情况下,需要对本体和关系进行消歧,以确保知识图谱的准确性和一致性,可以使用算法和人工标注来解决本体和关系歧义。
在抽取实体和关系,并消歧后,需要将它们组织成一个知识图谱模型。在构建好法务知识图谱后,可以使用图形数据库或图形存储系统来存储和管理知识图谱模型。
在训练NLP相关模块时,需收集所有高频法务领域法典构建一个数据库,结合知识图谱卷积神经网络模型,使用法典内容对其进行知识点标注,利用标注数据训练神经网络,使引擎具有语句分词功能,在数字人交互时,使用训练好的神经网络模型实时根据输入的文本或asr转化的文本进行QA预测或知识提取,将结果推送至咨询流程。上述卷积神经网络可视为对上述知识图谱的实施样例:
将知识图谱中的本体和关系表示为向量形式。通常使用词向量算法(如Word2Vec、GloVe等)来表示本体和关系,并将它们组合成一个张量形式,作为输入数据。
使用卷积神经网络层进行特征提取。在这一卷积神经网络层中,使用卷积核对知识图谱中的本体和关系进行卷积运算,并将其转化为新的向量表示,以捕捉本体和关系之间的复杂相互作用。
在卷积神经网络层之后添加池化层来进一步提取特征,通常使用最大池化来选择每个特征图中的最大值作为池化结果。
将池化后的特征向量输入到全连接层进行分类或回归任务。全连接层通常由多个神经元组成,每个神经元代表一个类别或一个数值输出。
根据用户需要或者具体任务,选择适合的损失函数,如交叉熵损失函数、均方误差损失函数等。使用反向传播算法来更新模型参数,以最小化损失函数。通常使用随机梯度下降等优化算法来实现反向传播。
上述关键词为[偷]、[一辆]、[车]在输入至法务知识图谱后,可得到与每一法务领域相关词语含义相近的法务领域相关词语,将其记为衍生词,例如,[偷]的衍生词可为盗窃、偷盗、偷窃等,[车]的衍生词可为新能源汽车、电动汽车、自行车等。如此,所有关键词以及关键词中每一法务领域相关词语的衍生词构成了扩展词集。
得到扩展词集后,根据其中的法务领域相关词语,从法务OA库中匹配若干个问题,然后根据匹配到的问题,从答案库中找到问题相应的答案,将匹配到的问题对应的答案发送给用户。法务OA库包括若干标准OA,即若干用户咨询问题以及每一用户咨询问题对应的答案。
在本实施例中,当根据所述扩展词集从法务答案库中无法找到所述用户咨询信息的答案时,将与所述扩展词集中法务领域相关词语相关的法典内容发送给用户。实现此功能需要提前存储所有法务领域法典合集,此法典合集内容库无需制作标准QA,只需保留完整法典内容,在标准QA无法覆盖咨询流程,即根据扩展词集在法务OA库中无法匹配到问题时,由知识图谱法务领域本体及关系(即扩展词集)提取相应知识点推送至用户咨询流程,即根据扩展词集从法务领域法典合集中提取相关的法典内容对应的虚拟数字人音频发送给用户。
在将所述关键词与法务知识图谱中的实体进行匹配,无法得到所述关键词的扩展词集时,根据所述关键词从法务答案库中找到所述用户咨询信息的答案,并将答案以虚拟数字人音频形式发送给用户,具体地:
在咨询流程获取用户的咨询信息,优先命中法务知识图谱中的法务领域本体,在不能命中本体时,从咨询流程获取可命中于词列的关键词,以此形成多轮对话的咨询流程模式以推送精准QA。其中法务领域本体为法务领域相关词语。即根据关键词从法务知识图谱中无法匹配得到与关键词中每一法务领域相关词语含义相近的法务领域相关词语时,直接根据关键词中法务领域相关词语从法务OA库中匹配若干问题,并将匹配到的问题的答案对应的虚拟数字人音频发送给用户。
在本实施例中,所述答案是以虚拟数字人音频的形式发送给用户。
在所述将所述答案以虚拟数字人音频形式发送给用户之前,还包括:
根据所述法务答案库中的答案获取所述答案对应的声音数据。
将所述声音数据合成到数字人三维模型上,得到每一所述答案对应的虚拟数字人音频。如图2所示,具体地:
首先,利用预先录制数字人音色模型对用户流程引导语句及各领域法务QA的文本内容进行模拟,以生成数字人流程引导语句及数字人QA音频。具体实施过程中,将法务OA库中梳理的法务领域标准QA输入数字人声音模型,通过TTS技术将文字转换为音频,从而得到与文本内容向对应的法务咨询QA音频。
上述数字人音色模型可用开源模型或由相关人员录制训练完成。具体的,通过录音采集目标人物QA音色声音数据,用于数字人的声音建模。构建端到端的非自回归神经网络语音合成模型,将多个非采集目标作为训练输入样本输入到非自回归神经网络语音合成模型,生成基础种子音色模型。将采集目标音色数据作为基础种子音色模型的训练输入样本,训练得到数字人音色模型。在回归神经网络tts模型的基础上,训练得到的数字人音色模型,可以合成与目标采集对象音色高度一致的音频,并具备高、中、低音等。
使用开源或自训练的数字人三维形象模型的基础上构建的深度编码 解码神经网络对上述音频进行耦合,进而通过音频转文本情感分析的渠道,使音频映射至数字人虚拟人像,使虚拟数字人产生相应的肢体与嘴部动作,生成带有动作及音频的数字人视频;上述音频情感映射可由机器学习的情感分析系统构成,基于机器学习的情感分析技术使用已标记的上述训练数据集来训练分类器,以区分积极、消极和中性文本。分类器训练完毕,可以使用分类器来对新询问流程内的音频转文本进行情感分析,还可以使用动画制作软件将情感信息转换为相应的动画效果,以便虚拟数字人能够产生与声音相关的动作。例如,当数字人听到高兴的话语时,可以制作出一组欢快的动作,当数字人听到悲伤的话语时,可以制作出一组沮丧的动作等等。将音频与数字人动态视频合并成输出,得到法务OA库中每一用户咨询问题以及答案对应的虚拟数字人音频(图2所述的资源),在将答案发送给用户时,只需将答案对应的虚拟数字人音频发送给用户。
利用上述原理还可生成一非标准QA命中通用动态视频,非标准QA命中通用动态视频相对于标准OA的虚拟数字人音频标准降低,即非标准QA命中通用动态视频无需完全对应动作与音频。
具体地,利用TTS技术将扩展词集中法务领域相关词语相关的法典内容转换为音频,然后将法典内容转换的音频合成到数字人三维形象模型上,得到法典内容对应的虚拟数字人音频(即非标准QA命中通用动态视频),需要说明的是,法典内容对应的虚拟数字人音频,其中的数字人的嘴型和动作与法典内容可以不完全对应。
其中,上述数字人三维形象模型(数字人三维模型)可由如下方式得到:
采集数据:采集相关现实世界中的形象数据。数据采集可使用3D扫描技术、摄像机拍摄或传感器等设备进行。
建立模型:采集到形象数据后,使用3D建模软件将形象数据转换为数字人三维模型。建模软件可以将采集到的形象数据进行处理,例如去除杂质、提取骨架结构等,以便将其转换为可编辑的三维模型。
模型贴图:数字人模型需要进行纹理映射,以便将现实世界中的颜色和纹理信息应用到三维模型中。在纹理映射中,一个二维的纹理图像被映射到三维模型的表面上。在这个过程中,纹理图像的每个像素都会被映射到三维模型表面的一个点上。当渲染三维模型时,纹理图像中的颜色和图案将被投射到三维模型的表面上,纹理映射通常使用UV坐标来实现。在这个过程中,三维模型表面上的每个点都会被分配一个对应的UV坐标。这些UV坐标可以用来确定纹理图像中对应的像素。通常情况下,3D软件提供了对UV坐标进行编辑的工具。
在得到虚拟数字人音频后,还需要对虚拟数字人音频进行编辑处理,包括场景、特效、插图、字幕、音效等,且对上述虚拟数字人音频进行渲染,实现视频美化。
在本实施例中,还需要对虚拟数字人音频进行校对,校对内容包含敏感词信息、广告词、辱骂词汇、敏感人物信息或者侵犯著作权、数据权属等问题。当校对后虚拟数字人音频没有上述问题,将虚拟数字人音频加密后存储。
按离散变化将虚拟数字人音频转换至频域,将水印序列嵌入到任意频段,再通过逆变换,生成含水印的虚拟数字人音频,并在找到答案后,将含水印的虚拟数字人音频输出至用户session id(会话号),如图3所示。
假定水印为M 1×M 2的二维图像bw,由于音频信号通常为一维向量,故水印信息在嵌入音频信号(虚拟数字人音频)之前,需要将二维降至一维向量w,得到的一维向量M=M 1×M 2。假定音频信号为S,长度为N,则S={S 1S 2S 3,…,S N }。由于音频信号较长,在处理中一般需要进行分段,每段长度设为N 1,故该音频信号分为K=fixN/N1)段进行处理,每段音频信号均嵌入一个水印信息。
需要说明的是,本实施例还可为用户提供对外接口,即在数字人结束咨询业务、制定具体法务援助计划等多种情况下提供转人工服务。
本发明提供的智能数字人律师咨询方法相比传统的法务咨询具有以下优势:
1.高效性:本发明可以通过快速处理大量的数据、文本和信息,提供更快速、更准确的咨询服务。相比较传统的法务咨询,数字人法务咨询可以更快地处理、分析和提取信息。
2.准确性:本发明可以通过历史咨询数据挖掘和自然语言处理等技术,对法律案例、法规、条款等进行自动化分析,提高咨询的准确性和精度。同时,本发明不受人类主观因素的影响,可以提供客观的咨询服务。
3.经济性:本发明可以通过自动化和标准化的流程,降低成本和时间成本,提高效率和利润。相比传统的法务咨询,数字人法务咨询的费用通常更加合理。
4.精细化:本发明可以通过对大量案例的学习和分析,不断改进算法和模型,提高法务领域QA的精度,这意味着数字人法务咨询可以提供更加细致深入的咨询服务。
5.范围化:本发明可以通过网络和云计算等技术接入不同接口,实现跨国、跨境的咨询服务。这不仅使得用户可以获得来自世界各地的法律专业知识和经验,提高了服务的多样性和全球化程度,且加宽了企业服务范围,加强了企业服务能力,创造更高的利润。
本发明提供的智能数字人律师咨询方法可通过部署已定制化sdk相关的硬件来完成。该系统包括程序指令及硬件基础,此系统可存储于存储介质中即广义上述存储模块,该存储模块需包含存储介质为计算机可读存储介质,且需程序指令被已部署硬件中的至少一个处理器执行,故该存储模块需计算机处理器硬件及存储介质以实现上述方法的实施流程步骤。因此,提供存储介质为计算机可读存储介质,所述存储介质为只读存储器、磁碟等各种可以存储程序代码的计算机可读存储介质。
如图4所示,本发明还提供了一种智能数字人律师咨询系统,所述系统包括:
信息获取模块T1,用于获取用户咨询信息。
关键词提取模块T2,用于提取所述用户咨询信息中的关键词;所述关键词包括若干法务领域相关词语。
匹配模块T3,用于将所述关键词与法务知识图谱中的实体进行匹配,得到所述关键词的扩展词集;所述扩展词集为由所述关键词以及与所述关键词中每一所述法务领域相关词语含义相近的若干法务领域相关词语组成的集合;所述法务知识图谱中的实体为法务领域相关词语。
答案获取模块T4,用于根据所述扩展词集从法务答案库中找到所述用户咨询信息的答案,并将所述答案以虚拟数字人音频形式发送给用户。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供了一种智能数字人律师咨询方法及系统,该方法包括:获取用户咨询信息;提取用户咨询信息中的关键词;关键词包括若干法务领域相关词语;将关键词与法务知识图谱中的实体进行匹配,得到关键词的扩展词集;扩展词集为由关键词以及与关键词中每一法务领域相关词语含义相近的若干法务领域相关词语组成的集合;法务知识图谱中的实体为法务领域相关词语;根据扩展词集从法务答案库中找到用户咨询信息的答案,并将答案发送给用户。本发明能够快速地、准确地为用户提供法务咨询服务,适用于法律知识水平不高的普通群众,并且本发明覆盖的法务领域广,可减少法务咨询企业的人力成本和经济成本。
本说明书中每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (6)

1.一种智能数字人律师咨询方法,其特征在于,所述方法包括:
获取用户咨询信息;
提取所述用户咨询信息中的关键词,具体包括:对所述用户咨询信息进行分词,得到分词结果;
根据所述分词结果中每一词语的命中阈值,提取所述关键词;所述命中阈值大小表征所述词语与法务领域的相关性的大小;所述关键词包括若干法务领域相关词语;
在所述根据所述分词结果中每一词语的命中阈值,提取所述关键词之前,还包括:确定所述分词结果中每一词语的命中阈值,具体包括:
将所述分词结果输入至训练好的阈值预测模型中,得到所述分词结果中每一词语的命中阈值;所述训练好的阈值预测模型是以样本分词结果为输入,以所述样本分词结果中每一词语的样本命中阈值为标签,训练得到的模型;
以词列的实际内容为词向量输入,以得到上下文关系的权重模型输出,以此得到每个关键词的命中阈值,相应的,利用NNLM构建阈值预测模型,词列中每个词w的维度为m,即,因词的输入是one hot编码,则N=mn表示词w的上下文中包含的词数,输入前个词“/>,...,/>,/>”预测第t个词是w t 的概率,根据输入的前/>个词,在同一个词列D中一一找到它们对应的词向量,把样本分词结果,即所有词向量串联为一个维度为(/>)m的向量x作为三层神经网络阈值预测模型的输入,经矩阵向量计算,做softmax归一化计算,输出单个词的命中阈值;
将所述关键词与法务知识图谱中的实体进行匹配,得到所述关键词的扩展词集;所述扩展词集为由所述关键词以及与所述关键词中每一所述法务领域相关词语含义相近的若干法务领域相关词语组成的集合;所述法务知识图谱中的实体为法务领域相关词语;
所述将所述关键词与法务知识图谱中的实体进行匹配之前,还包括:构建所述法务知识图谱,具体包括:
获取若干法务领域知识数据;
根据所述法务领域知识数据抽取多个法务领域相关词语;
将所述法务领域相关词语作为知识图谱中的实体,所有所述法务领域相关词语和法务领域相关词语之间的关系构成所述法务知识图谱;所述关系包括平行和包含;
根据所述扩展词集从法务答案库中找到所述用户咨询信息的答案,并将所述答案以虚拟数字人音频形式发送给用户;
所述方法还包括:
在根据所述扩展词集从法务答案库中无法找到所述用户咨询信息的答案时,将与所述扩展词集中法务领域相关词语相关的法典内容发送给用户。
2.根据权利要求1所述的智能数字人律师咨询方法,其特征在于,所述对所述用户咨询信息进行分词,得到分词结果,具体包括:
将所述用户咨询信息输入至训练好的分词模型中,得到所述分词结果;所述训练好的分词模型是以样本用户咨询信息为输入,以所述样本用户咨询信息对应的样本分词结果标签,训练得到的模型。
3.根据权利要求1所述的智能数字人律师咨询方法,其特征在于,在所述将所述分词结果输入至训练好的阈值预测模型中之前,还包括:
对所述分词结果中的词语进行one hot编码处理。
4.根据权利要求1所述的智能数字人律师咨询方法,其特征在于,所述方法还包括:
在将所述关键词与法务知识图谱中的实体进行匹配,无法得到所述关键词的扩展词集时,根据所述关键词从法务答案库中找到所述用户咨询信息的答案,并将答案以虚拟数字人音频形式发送给用户。
5.根据权利要求1所述的智能数字人律师咨询方法,其特征在于,在所述将所述答案以虚拟数字人音频形式发送给用户之前,还包括:
根据所述法务答案库中的答案获取所述答案对应的声音数据;
将所述声音数据合成到数字人三维模型上,得到每一所述答案对应的虚拟数字人音频。
6.一种智能数字人律师咨询系统,其特征在于,所述系统包括:
信息获取模块,用于获取用户咨询信息;
关键词提取模块,用于提取所述用户咨询信息中的关键词,具体包括:对所述用户咨询信息进行分词,得到分词结果;
根据所述分词结果中每一词语的命中阈值,提取所述关键词;所述命中阈值大小表征所述词语与法务领域的相关性的大小;所述关键词包括若干法务领域相关词语;
在所述根据所述分词结果中每一词语的命中阈值,提取所述关键词之前,还包括:确定所述分词结果中每一词语的命中阈值,具体包括:
将所述分词结果输入至训练好的阈值预测模型中,得到所述分词结果中每一词语的命中阈值;所述训练好的阈值预测模型是以样本分词结果为输入,以所述样本分词结果中每一词语的样本命中阈值为标签,训练得到的模型;
以词列的实际内容为词向量输入,以得到上下文关系的权重模型输出,以此得到每个关键词的命中阈值,相应的,利用NNLM构建阈值预测模型,词列中每个词w的维度为m,即,因词的输入是one hot编码,则N=mn表示词w的上下文中包含的词数,输入前个词“/>,...,/>,/>”预测第t个词是w t 的概率,根据输入的前/>个词,在同一个词列D中一一找到它们对应的词向量,把样本分词结果,即所有词向量串联为一个维度为(/>)m的向量x作为三层神经网络阈值预测模型的输入,经矩阵向量计算,做softmax归一化计算,输出单个词的命中阈值;
匹配模块,用于将所述关键词与法务知识图谱中的实体进行匹配,得到所述关键词的扩展词集;所述扩展词集为由所述关键词以及与所述关键词中每一所述法务领域相关词语含义相近的若干法务领域相关词语组成的集合;所述法务知识图谱中的实体为法务领域相关词语;所述将所述关键词与法务知识图谱中的实体进行匹配之前,还包括:构建所述法务知识图谱,具体包括:
获取若干法务领域知识数据;
根据所述法务领域知识数据抽取多个法务领域相关词语;
将所述法务领域相关词语作为知识图谱中的实体,所有所述法务领域相关词语和法务领域相关词语之间的关系构成所述法务知识图谱;所述关系包括平行和包含;
答案获取模块,用于根据所述扩展词集从法务答案库中找到所述用户咨询信息的答案,并将所述答案以虚拟数字人音频形式发送给用户;
还包括:在根据所述扩展词集从法务答案库中无法找到所述用户咨询信息的答案时,将与所述扩展词集中法务领域相关词语相关的法典内容发送给用户。
CN202310819526.1A 2023-07-06 2023-07-06 一种智能数字人律师咨询方法及系统 Active CN116542817B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310819526.1A CN116542817B (zh) 2023-07-06 2023-07-06 一种智能数字人律师咨询方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310819526.1A CN116542817B (zh) 2023-07-06 2023-07-06 一种智能数字人律师咨询方法及系统

Publications (2)

Publication Number Publication Date
CN116542817A CN116542817A (zh) 2023-08-04
CN116542817B true CN116542817B (zh) 2023-10-13

Family

ID=87454561

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310819526.1A Active CN116542817B (zh) 2023-07-06 2023-07-06 一种智能数字人律师咨询方法及系统

Country Status (1)

Country Link
CN (1) CN116542817B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117541196A (zh) * 2023-12-28 2024-02-09 江西拓世智能科技股份有限公司 基于人工智能的咨询方法、装置、电子设备及存储介质
CN117909485B (zh) * 2024-03-19 2024-05-24 武汉百智诚远科技有限公司 基于大语言模型的法律咨询智能交互方法及系统
CN118193713A (zh) * 2024-05-16 2024-06-14 北京市农林科学院 一种基于虚拟数字专家的知识问答方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107993724A (zh) * 2017-11-09 2018-05-04 易保互联医疗信息科技(北京)有限公司 一种医学智能问答数据处理的方法及装置
KR20190053981A (ko) * 2017-11-10 2019-05-21 효성아이티엑스(주) 전화 응대 장치
CN113076411A (zh) * 2021-04-26 2021-07-06 同济大学 一种基于知识图谱的医疗查询扩展方法
CN115442495A (zh) * 2022-08-19 2022-12-06 河北元识科技有限公司 一种ai演播室系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107993724A (zh) * 2017-11-09 2018-05-04 易保互联医疗信息科技(北京)有限公司 一种医学智能问答数据处理的方法及装置
KR20190053981A (ko) * 2017-11-10 2019-05-21 효성아이티엑스(주) 전화 응대 장치
CN113076411A (zh) * 2021-04-26 2021-07-06 同济大学 一种基于知识图谱的医疗查询扩展方法
CN115442495A (zh) * 2022-08-19 2022-12-06 河北元识科技有限公司 一种ai演播室系统

Also Published As

Publication number Publication date
CN116542817A (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
CN116542817B (zh) 一种智能数字人律师咨询方法及系统
CN102262634B (zh) 一种自动问答方法及系统
US11727915B1 (en) Method and terminal for generating simulated voice of virtual teacher
CN117076693A (zh) 一种数字人教师多模态大语言模型预训练学科语料库的构建方法
CN113392265A (zh) 多媒体处理方法、装置及设备
CN117851871A (zh) 一种境外互联网社交阵地多模态数据识别方法
CN116092472A (zh) 一种语音合成方法和合成系统
CN117828024A (zh) 一种插件检索方法、装置、存储介质及设备
CN116955579A (zh) 一种基于关键词知识检索的聊天回复生成方法和装置
CN117216008A (zh) 一种基于知识图谱的档案多模态智能编纂方法及系统
CN116257616A (zh) 面向音乐领域的实体关系抽取方法及系统
CN116129868A (zh) 一种结构化画本的生成方法和生成系统
CN114842301A (zh) 一种图像注释模型的半监督训练方法
CN114416993A (zh) 基于层次注意力机制的歌词情感分类方法
Eren et al. Automated Audio Captioning With Topic Modeling
CN118069812B (zh) 一种基于大模型的导览方法
CN116738359B (zh) 基于预训练模型和高分辨网络的蒙古语多模态情感分析方法
CN117453895B (zh) 一种智能客服应答方法、装置、设备及可读存储介质
CN118170919B (zh) 一种文学作品的分类方法及系统
CN117094335B (zh) 政治等效框架下外交话语情感分析与智能翻译系统及方法
CN117877517B (zh) 基于对抗神经网络的环境音生成方法、装置、设备及介质
CN117807995B (zh) 一种情绪引导的摘要生成方法、系统、装置及介质
Mei Sound to Text: Automated Audio Captioning using Deep Learning
CN117910466A (zh) 一种基于主题增强的中文社交媒体少样本立场检测方法
Chizhikov et al. Inferring Image Background from Text Description

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant