CN107609096B - 一种智能律师专家应答方法 - Google Patents
一种智能律师专家应答方法 Download PDFInfo
- Publication number
- CN107609096B CN107609096B CN201710809898.0A CN201710809898A CN107609096B CN 107609096 B CN107609096 B CN 107609096B CN 201710809898 A CN201710809898 A CN 201710809898A CN 107609096 B CN107609096 B CN 107609096B
- Authority
- CN
- China
- Prior art keywords
- information
- case
- keywords
- corpus
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于专家系统技术领域,公开了一种智能律师专家应答方法,包括:获取输入的案情信息;对所述案情信息进行分词;采用TFIDF方法提取关键词;采用余弦相似度匹配方法,基于所述关键词,将案情问题的与语料库中的案情相匹配;取余弦相似度较高的3个问题的答案输出;其中,所述语料库基于律师历史案情处理信息建立。本发明提供一种高效的律师专家系统应答方法。
Description
技术领域
本发明涉及专家系统技术领域,特别涉及一种智能律师专家应答方法。
背景技术
随着时代的发展,人们的维权意识大大提高,在生活中,人们会遇到各种各样的问题,而许多问题的解决人们只能寻求法律的帮助。提高法律,首先能够想到的便是律师,然而现实中律师的人数众多,而每一个律师又擅长不同的领域,人们接触律师的机会较少,无法判断律师的好坏,也无从知晓此律师是否适合自己的案情,为人们解决法律问题带来了极大的不便。有不少学者提出了各种律师推荐系统以及智能问答匹配的技术(参考文献高浚城创建律师信息库方法及装置,律师推荐方法、装置及系统,专利申请号:CN201610783519.0),此推荐律师的方法虽然解决了一部分问题,但是在现实生活中,很多人对该类系统的使用了解少,不易于使用,且人们了解律师的信息较少,请律师的成本较高,即使推荐了律师信息,人们仍有极大的可能无法找到律师解决问题。
发明内容
本发明提供一种智能律师专家应答方法,能够高效实现法律问题解答。
为解决上述技术问题,本发明提供了一种智能律师专家应答方法,包括:
获取输入的案情信息;
对所述案情信息进行分词;
采用TFIDF方法提取关键词;
采用余弦相似度匹配方法,基于所述关键词,将案情问题的与语料库中的案情相匹配;
取余弦相似度较高的3个问题的答案输出;
其中,所述语料库基于律师历史案情处理信息建立。
进一步地,所述方法还包括:
利用所述关键词在语料库中采用余弦相似度匹配方法进行关键词匹配,得到目标答案的候选关键词;
通过概率上下无关文法方法进行句法分析,得到目标答案的候选句型;
将所述候选关键词根据词性,填充到候选句型中,输出最终答案。
进一步地,所述对所述案情信息进行分词包括:
利用隐式马尔可夫链模型对所述案情信息进行分词。
进一步地,所述利用所述关键词在语料库中采用余弦相似度匹配方法进行关键词匹配,得到目标答案的候选关键词包括:
利用所述关键词,在语料库中采用基于语料库的词语相似度计算方法,计算所述关键词与语料库中词语所处的上下文环境是否相似,确定两个词语的语义相似度;
筛选出与输入的案情信息的所述关键词语义相似的词语,得到目标答案的候选关键词。
进一步地,所述获取输入的案情信息包括:
利用语音识别技术获取案情信息;
将语音信息转换成文本信息,作为案情信息的输入。
进一步地,所述方法还包括:模糊信息匹配;
将所述语音信息进行聚类处理;
若无识别的信息部分被归到某一聚类簇中,则在拼音集中匹配与此类簇相似的信息;
若聚类处理后,无法正确识别的信息被单独归为一类,则用人工规则进行处理。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
本申请实施例中提供的智能律师专家应答方法,充分利用律师处理案情的历史记录信息,为用户在线生成案情处理方式,极大方便了人们的生活。无需考虑寻找的律师适合不适合自己的案情,系统答案的生成不受问题领域的限制,涵盖了各种领域的问题及答案。加入语音识别技术,方便人们使用系统,使得系统更加智能化。采用基于规则与聚类的模糊信息匹配方法,有效解决了特殊情况下语音无法识别的情况,大大提高了系统的容错性。通过概率上下无关文法方法进行句法分析,消除了歧义,将问句转换,得到答句的基本结构。根据用户案情问题的复杂程度,采用不同的策略,大大保证了系统的正确率及稳定性。利用隐式马尔科夫链模型对案情问题进行分词,利用语料库的信息,计算下一个词词性的转移概率,大大提高了分词效果。
附图说明
图1为本发明实施例提供的智能律师专家应答方法的总体流程图;
图2为本发明实施例提供的基于规则与聚类的模糊信息匹配方法流程图。
具体实施方式
本申请实施例通过提供一种智能律师专家应答方法,能够高效实现法律问题解答。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细说明,应当理解本发明实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
参见图1和图2,一种智能律师专家应答方法,包括:
获取输入的案情信息;
对所述案情信息进行分词;
采用TFIDF方法提取关键词;
采用余弦相似度匹配方法,基于所述关键词,将案情问题的与语料库中的案情相匹配;
取余弦相似度较高的3个问题的答案输出;
其中,所述语料库基于律师历史案情处理信息建立。
具体来说,对输入的案情信息,首先利用隐式马尔科夫链模型进行分词。
隐式马尔科夫链模型有两个重要的集合,状态值集合为(B,M,E,S):{B:begin,M:middle,E:end,S:single}。分别代表每个状态代表的是该字在词语中的位置,B代表该字是词语中的起始字,M代表是词语中的中间字,E代表是词语中的结束字,S则代表是单字成词。观察值集合为就是输入的信息。隐式马尔科夫链模型就是要根据输入计算状态集合,例如:
用户输入:小明硕士毕业于中国科学院计算所
计算后输出的状态序列为
BE/BE/BME/BE/BME/BE/S
根据这个状态序列我们可以进行切词:
BE/BE/BME/BE/BME/BE/S
所以切词结果如下:
小明/硕士/毕业于/中国/科学院/计算/所
该模型方法只需计算状态序列,而不考虑语义信息,缩短了处理时间,大大提高了分词效率。
分词后,再采用TFIDF方法对用户输入的信息提取关键词,TFIDF方法即为选出句子中最能反应句子所属主题的词语,例如:“中国蜜蜂养殖”,该句子的关键词即为“蜜蜂”,有利于后续的答案得出。
利用分词结果,根据词的个数以及问题与语料库问题的匹配度,匹配度通过采用余弦相似度匹配方法,将案情问题的与语料库中的案情相匹配,判断用户的案情复杂程度。例如“欠钱不还怎么办”,由于其分词后词语个数少,问题简短,可以看作是简单案情;如果问题与语料库中的问题匹配度达到设置的阈值,如0.8,则可以认为是简单案情。对于用户输入的简单案情信息,直接采用余弦相似度匹配方法,将分词后的案情问题与语料库中的案情进行相似度计算,得到案情问题与语料库中的案情的相似度值,取余弦相似度最高的3个问题对应的答案,返回给用户,得到结果。
在案情复杂的情况下
所述方法还包括:
利用所述关键词在语料库中采用余弦相似度匹配方法进行关键词匹配,得到目标答案的候选关键词;
通过概率上下无关文法方法进行句法分析,得到目标答案的候选句型;
将所述候选关键词根据词性,填充到候选句型中,输出最终答案。
具体来说。
信息计算,所述利用所述关键词在语料库中采用余弦相似度匹配方法进行关键词匹配,得到目标答案的候选关键词包括:
利用所述关键词,在语料库中采用基于语料库的词语相似度计算方法,计算所述关键词与语料库中词语所处的上下文环境是否相似,确定两个词语的语义相似度;
筛选出与输入的案情信息的所述关键词语义相似的词语,得到目标答案的候选关键词。
即,对于认定为复杂的问题,则进行关键词匹配,利用提取的输入案情的关键词,在语料库中利用基于语料库的词语相似度计算方法,即通过计算两个词语所处的上下文环境是否相似,确定两个词语的语义相似度。这样通过查找与用户输入案情问题关键词语义相似的词语,得到目标答案的候选关键词。
运用上下无关文法方法对用户输入案情信息进行句法分析,得到问题的句法分析树,即得到句子的主谓宾等。用得到的句子成分组成陈述句的句式模板,作为目标答案的候选句型。
将得到的候选关键词,根据词性,填充到候选句型中,得到多个供用户选择的答案。
进一步地,所述获取输入的案情信息包括:
利用语音识别技术获取案情信息;
将语音信息转换成文本信息,作为案情信息的输入。
为了优化语音识别,所述方法还包括:模糊信息匹配;
将所述语音信息进行聚类处理;
若无识别的信息部分被归到某一聚类簇中,则在拼音集中匹配与此类簇相似的信息;
若聚类处理后,无法正确识别的信息被单独归为一类,则用人工规则进行处理。
将用户的输入在拼音集中查找,对于因吐字不清晰等原因造成的无法识别的问题,采用基于规则与聚类的模糊信息匹配方法,首先对模糊信息用聚类模型处理,聚类模型是指给定一个有N个元组或者纪录的数据集,分裂法将构造K个分组,每一个分组就代表一个聚类。将模糊信息放到拼音集中,若模糊信息部分被归到某一聚类簇中,则在聚类簇的拼音集中匹配与此类簇相似的信息;若聚类处理后,模糊信息被单独归为一类,则用人工规则进行处理。
本实施例采用的人工规则如下:
若无法识别的部分是常见短语的一部分,如“一帆风顺”,正确识别了“一帆”,而对于“风顺”无法识别,则采用关联匹配的方法,将所有与“一帆”有关的短语用来与模糊信息进行匹配,取匹配度最高的作为最终短语。
对于查找不到的,进行易混拼音的替换,例如拼音中的“ong”与“eng”音相替换,再次将其在拼音集中查找;
对于无法识别的部分,去掉音调,再次将其在拼音集中查找。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
本申请实施例中提供的智能律师专家应答方法,充分利用律师处理案情的历史记录信息,为用户在线生成案情处理方式,极大方便了人们的生活。无需考虑寻找的律师适合不适合自己的案情,系统答案的生成不受问题领域的限制,涵盖了各种领域的问题及答案。加入语音识别技术,方便人们使用系统,使得系统更加智能化。采用基于规则与聚类的模糊信息匹配方法,有效解决了特殊情况下语音无法识别的情况,大大提高了系统的容错性。通过概率上下无关文法方法进行句法分析,消除了歧义,将问句转换,得到答句的基本结构。根据用户案情问题的复杂程度,采用不同的策略,大大保证了系统的正确率及稳定性。利用隐式马尔科夫链模型对案情问题进行分词,利用语料库的信息,计算下一个词词性的转移概率,大大提高了分词效果。
最后所应说明的是,以上具体实施方式仅用以说明本发明的技术方案而非限制,尽管参照实例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (1)
1.一种智能律师专家应答方法,其特征在于,包括:
获取输入的案情信息;
对所述案情信息进行分词;
采用TFIDF方法提取关键词;
采用余弦相似度匹配方法,基于所述关键词,将案情问题的与语料库中的案情相匹配;
取余弦相似度较高的3个问题的答案输出;
其中,所述语料库基于律师历史案情处理信息建立;
所述方法还包括:
利用所述关键词,在语料库中采用余弦相似度匹配方法进行关键词匹配,得到目标答案的候选关键词;
通过概率上下无关文法方法进行句法分析,得到目标答案的候选句型;
将所述候选关键词根据词性,填充到候选句型中,输出最终答案;
所述对所述案情信息进行分词包括:
利用隐式马尔可夫链模型对所述案情信息进行分词;
所述利用所述关键词在语料库中采用余弦相似度匹配方法进行关键词匹配,得到目标答案的候选关键词包括:
利用所述关键词,在语料库中采用基于语料库的词语相似度计算方法,计算所述关键词与语料库中词语所处的上下文环境是否相似,确定两个词语的语义相似度;
筛选出与输入的案情信息的所述关键词语义相似的词语,得到目标答案的候选关键词;
所述获取输入的案情信息包括:
利用语音识别技术获取案情信息;
将语音信息转换成文本信息,作为案情信息的输入;
所述方法还包括:模糊信息匹配;
将所述语音信息进行聚类处理;
若无识别的信息部分被归到某一聚类簇中,则在拼音集中匹配与此类簇相似的信息;
若聚类处理后,无法正确识别的信息被单独归为一类,则用人工规则进行处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710809898.0A CN107609096B (zh) | 2017-09-11 | 2017-09-11 | 一种智能律师专家应答方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710809898.0A CN107609096B (zh) | 2017-09-11 | 2017-09-11 | 一种智能律师专家应答方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107609096A CN107609096A (zh) | 2018-01-19 |
CN107609096B true CN107609096B (zh) | 2020-07-10 |
Family
ID=61062231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710809898.0A Expired - Fee Related CN107609096B (zh) | 2017-09-11 | 2017-09-11 | 一种智能律师专家应答方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107609096B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109165281A (zh) * | 2018-07-20 | 2019-01-08 | 吴怡 | 一种基于语义网的多机器人终端共享式法律咨询系统 |
CN109325132A (zh) * | 2018-12-11 | 2019-02-12 | 平安科技(深圳)有限公司 | 专家知识推荐方法、装置、计算机设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104008171A (zh) * | 2014-06-03 | 2014-08-27 | 中国科学院计算技术研究所 | 一种法律数据库构建方法及法律检索服务方法 |
CN104050256A (zh) * | 2014-06-13 | 2014-09-17 | 西安蒜泥电子科技有限责任公司 | 基于主动学习的问答方法及采用该方法的问答系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160307283A1 (en) * | 2015-04-19 | 2016-10-20 | Roy S. Melzer | Document generation based on a hierarchal tree dataset |
-
2017
- 2017-09-11 CN CN201710809898.0A patent/CN107609096B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104008171A (zh) * | 2014-06-03 | 2014-08-27 | 中国科学院计算技术研究所 | 一种法律数据库构建方法及法律检索服务方法 |
CN104050256A (zh) * | 2014-06-13 | 2014-09-17 | 西安蒜泥电子科技有限责任公司 | 基于主动学习的问答方法及采用该方法的问答系统 |
Non-Patent Citations (1)
Title |
---|
基于Lucene 和LSA 的法律咨询系统;尹芝芳 等;《计算机系统应用》;20140430;第23卷(第4期);第52-54页第2-4节、图3 * |
Also Published As
Publication number | Publication date |
---|---|
CN107609096A (zh) | 2018-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108304372B (zh) | 实体提取方法和装置、计算机设备和存储介质 | |
CN104050256B (zh) | 基于主动学习的问答方法及采用该方法的问答系统 | |
CN114020862B (zh) | 一种面向煤矿安全规程的检索式智能问答系统及方法 | |
CN112069298A (zh) | 基于语义网和意图识别的人机交互方法、设备及介质 | |
CN110705296A (zh) | 一种基于机器学习和深度学习的中文自然语言处理工具系统 | |
CN112115238A (zh) | 一种基于bert和知识库的问答方法和系统 | |
CN116166782A (zh) | 一种基于深度学习的智能问答方法 | |
EP3799640A1 (en) | Semantic parsing of natural language query | |
CN111897944B (zh) | 基于语义空间共享的知识图谱问答系统 | |
CN109271524B (zh) | 知识库问答系统中的实体链接方法 | |
CN116127095A (zh) | 一种序列模型与知识图谱结合的问答方法 | |
CN113505209A (zh) | 一种面向汽车领域的智能问答系统 | |
CN112685538B (zh) | 一种结合外部知识的文本向量检索方法 | |
CN110377695B (zh) | 一种舆情主题数据聚类方法、装置及存储介质 | |
CN107562907B (zh) | 一种智能律师专家案件应答装置 | |
CN115292461B (zh) | 基于语音识别的人机交互学习方法及系统 | |
CN104199825A (zh) | 一种信息查询方法和系统 | |
CN112349294B (zh) | 语音处理方法及装置、计算机可读介质、电子设备 | |
CN113742471A (zh) | 一种普法问答系统的向量检索式对话方法 | |
CN112364132A (zh) | 基于依存句法的相似度计算模型和系统及搭建系统的方法 | |
KR101255957B1 (ko) | 개체명 태깅 방법 및 장치 | |
CN108763355B (zh) | 一种基于用户的智能机器人交互数据处理系统及方法 | |
CN116662518A (zh) | 问答方法、装置、电子设备及可读存储介质 | |
CN112632250A (zh) | 一种多文档场景下问答方法及系统 | |
CN112507089A (zh) | 一种基于知识图谱的智能问答引擎及其实现方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200710 Termination date: 20210911 |