CN110083823B - 词典表建立方法及装置、计算机装置、及存储介质 - Google Patents
词典表建立方法及装置、计算机装置、及存储介质 Download PDFInfo
- Publication number
- CN110083823B CN110083823B CN201910173520.5A CN201910173520A CN110083823B CN 110083823 B CN110083823 B CN 110083823B CN 201910173520 A CN201910173520 A CN 201910173520A CN 110083823 B CN110083823 B CN 110083823B
- Authority
- CN
- China
- Prior art keywords
- contract
- dictionary table
- target keywords
- category
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000012986 modification Methods 0.000 claims abstract description 28
- 230000004048 modification Effects 0.000 claims abstract description 28
- 238000012790 confirmation Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
Abstract
本发明提供一种词典表建立方法,包括:根据合同的类别为每个合同类别创建一个词典表;编辑与每个合同类别所对应的词典表,存储所述每个词典表;读取指定合同的文本内容,识别所述指定合同所属的合同类别;根据所述指定合同的合同类别,调取与所述指定合同的合同类别所对应的词典表,按照所调取的词典表对所述指定合同的文本内容进行切分,获得与所调取的词典表相匹配的M个目标关键词;当接收到所述修改指令时,对所述M个目标关键词中的一个或多个目标关键词进行修改;及根据修改后的所述一个或多个目标关键词更新所调取的词典表。本发明还提供实现所述词典表建立方法的装置、计算机装置、及存储介质。本发明可解决关键词提取不准确的技术问题。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种词典表建立方法及装置、计算机装置、及存储介质
背景技术
合同分为很多类别,且领域专业,目前暂无合同领域的词典表,这样对于关键词提取或自然语言分析,不具有代表性,得到的结果差异性大,准确度低,导致后续的分析建模实用价值低。
发明内容
鉴于以上内容,有必要提出一种词典表建立方法及装置、计算机装置、及存储介质,用以解决关键词提取不够准确的技术问题。
本发明的第一方面提供一种词典表建立方法,所述方法包括:
接收用户所输入的创建词典表的创建指令,当接收到创建指令时,根据合同的类别为每个合同类别创建一个词典表;
接收用户所输入的编辑词典表的编辑指令,并当接收到所述编辑命令时,编辑与每个合同类别所对应的词典表,从而在每个词典表中对应记录每类合同所涉及的关键字,存储所述每个词典表;
读取指定合同的文本内容,识别所述指定合同所属的合同类别;
根据所述指定合同的合同类别,从所存储的词典表中调取与所述指定合同的合同类别所对应的词典表,按照所调取的词典表对所述指定合同的文本内容进行切分,从而获得与所调取的词典表相匹配的M个目标关键词,其中,M为大于或等于0的整数;
提示用户确认所述M个目标关键词是否正确;
当接收到用户确认所述M个目标关键词不正确的确认信号,接收用户所输入的修改指令,并当接收到所述修改指令时,对所述M个目标关键词中的一个或多个目标关键词进行修改;及
根据修改后的所述一个或多个目标关键词更新所调取的词典表。
优选地,所述识别所述指定合同所属的合同类别包括:
读取所述指定合同的文本内容的前N个字,其中,N为大于或等于预设值的正整数;
从所述前N个字中查找与所述合同类别所对应的字词,若所述前N个字中存在与某个合同类别所对应的字词,则确定所述指定合同属于所述某个合同类别。
优选地,当M等于0且接收到用户确认所述M个目标关键词不正确的确认信号时,所述修改后的一个或多个目标关键词是指根据用户的输入所新增的关键词。
优选地,所述接收用户所输入的修改指令,并当接收到所述修改指令时,对所述M个目标关键词中的一个或多个目标关键词进行修改包括:
根据所述M个目标关键词的数目生成一个用户界面;
将所述M个目标关键词展示在所述用户界面;及
根据用户的输入修改所述M个目标关键词中的一个或多个目标关键词。
优选地,所述根据所述M个目标关键词的数目生成一个用户界面包括:
确定所述M个目标关键词的数目;及
生成所述用户界面,其中,所述用户界面的大小与所述M个目标关键词的数目成正比关系。
优选地,当M等于0时,所述用户界面的大小为预设值,当M为大于0的正整数时,所述用户界面的大小为所述预设值的M倍。
优选地,所述根据修改后的所述一个或多个目标关键词更新所调取的词典表包括:
删除修改前的所述一个或多个目标关键词;及
将修改后的所述一个或多个目标关键词存储到所调取的词典表中。
本发明第二方面提供一种计算机装置,所述计算机装置包括存储器和处理器,所述存储器用于存储至少一个指令,所述处理器用于所述至少一个指令时实现所述词典表建立方法。
本发明第三方面提供一种计算机可读存储介质,其所述计算机可读存储介质存储有至少一个指令,所述至少一个指令被处理器执行时实现所述词典表建立方法。
本发明第四方面提供一种词典表建立装置,所述装置包括:
执行模块,用于接收用户所输入的创建词典表的创建指令,当接收到创建指令时,根据合同的类别为每个合同类别创建一个词典表;
所述执行模块,还用于接收用户所输入的编辑词典表的编辑指令,并当接收到所述编辑命令时,编辑与每个合同类别所对应的词典表,从而在每个词典表中对应记录每类合同所涉及的关键字,存储所述每个词典表;
所述执行模块,还用于读取指定合同的文本内容,识别所述指定合同所属的合同类别;
所述执行模块,还用于根据所述指定合同的合同类别,从所存储的词典表中调取与所述指定合同的合同类别所对应的词典表,按照所调取的词典表对所述指定合同的文本内容进行切分,从而获得与所调取的词典表相匹配的M个目标关键词,其中,M为大于或等于0的整数;
判断模块,用于提示用户确认所述M个目标关键词是否正确;
所述执行模块,还用于当接收到用户确认所述M个目标关键词不正确的确认信号,接收用户所输入的修改指令,并当接收到所述修改指令时,对所述M个目标关键词中的一个或多个目标关键词进行修改;及
所述执行模块,还用于根据修改后的所述一个或多个目标关键词更新所调取的词典表。
本发明实施例中所述的词典表建立方法及装置、计算机装置、及存储介质,通过根据合同的类别为每个合同类别创建一个词典表;识别指定合同所属的合同类别,从所存储的词典表中调取与所述指定合同的合同类别所对应的词典表,按照所调取的词典表对所述指定合同的文本内容进行切分,从而获得与所调取的词典表相匹配的多个目标关键词,并根据用户的输入对所述多个目标关键词中的一个或多个目标关键词进行修改,以及根据修改后的所述一个或多个目标关键词更新所调取的词典表。由此本案不仅可以创建词典表还可对词典表进行更新,使得词典表更加准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明实施例一提供的词典表建立方法的流程图。
图2是本发明实施例二提供的词典表建立装置的结构图。
图3是本发明实施例三提供的计算机装置的示意图。
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
实施例一
图1是本发明实施例一提供的词典表建立方法的流程图。
在本实施例中,所述词典表建立方法可以应用于计算机装置中,对于需要进行词典表建立的计算机装置,可以直接在计算机装置上集成本发明的方法所提供的用于词典表建立的功能,或者以软件开发工具包(Software Development Kit,SDK)的形式运行在计算机装置上。
如图1所示,所述词典表建立方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
步骤S11、计算机装置接收用户所输入的创建词典表的创建指令,当接收到创建指令时,根据合同的类别为每个合同类别创建一个词典表。
本实施例中,所述合同的类别包括,但不限于,买卖合同、借款合同、赠与合同、租赁合同、技术开发合同、委托合同、保管合同、运输合同、承揽合同、仓储合同。
本实施例中,计算机装置每创建一个词典表,根据该词典表所对应的合同类别为该词典表命名。举例而言,将为合同类别为“买卖合同”所创建的词典表命名为“买卖合同词典表”,将为合同类别为“赠与合同”所创建的词典表命名为“赠与合同词典表”。
在一个实施例中,所述词典表可以是一个文本文档,例如可以是txt文档,或excel文档。
步骤S12、计算机装置接收用户所输入的编辑词典表的编辑指令,并当接收到所述编辑命令时,编辑与每个合同类别所对应的词典表,从而在每个词典表中对应记录每类合同所涉及的关键字。计算机装置还存储所述每个词典表。
本实施例中,每类合同所涉及的关键字可以是由专业人员(例如,律师)所收集的关键字。
举例而言,计算机装置接收用户所输入的编辑“买卖合同词典表”的编辑指令,并当接收到该编辑命令时,编辑所述“买卖合同词典表”,在所述“买卖合同词典表”中记录买卖合同所涉及的关键字。
再如,计算机装置接收用户所输入的编辑“赠与合同词典表”的编辑指令,并当接收到该编辑命令时,编辑所述“赠与合同词典表”,在所述“赠与合同词典表”中记录赠与合同所涉及的关键字。
步骤S13、计算机装置读取指定合同的文本内容,识别所述指定合同所属的合同类别。
在一个实施例中,所述指定合同的文本内容可以预先存储在所述计算机装置中。
本实施例中,所述识别所述指定合同所属的合同类别包括:
(a1)读取所述指定合同的文本内容的前N个字,其中,N可以为大于或等于预设值(例如7,8,或者10)的正整数;
(a2)从所述前N个字中查找与所述合同类别所对应的字词,若所述前N个字中存在与某个合同类别所对应的字词,则确定所述指定合同属于所述某个合同类别。
举例而言,假设所述N等7,所述指定合同的文本内容的前7个字为“葡萄酒买卖合同”,则可以从该前7个字中找到与合同类别为“买卖合同”所对应的字词,那么即可确定所述指定合同的合同类别为买卖合同。
步骤S14、计算机装置根据所述指定合同的合同类别,从所存储的词典表中调取与所述指定合同的合同类别所对应的词典表,按照所调取的词典表对所述指定合同的文本内容进行切分,从而获得与所调取的词典表相匹配的M个目标关键词。其中,M为大于或等于0的整数。
步骤S15、计算机装置提示用户确认所述M个目标关键词是否正确。若接收到用户确认所述M个目标关键词不正确的确认信号,执行步骤S16。
步骤S16、所述计算机装置接收用户所输入的修改指令,并当接收到所述修改指令时,对所述M个目标关键词中的一个或多个目标关键词进行修改。所述计算机装置还根据修改后的所述一个或多个目标关键词更新所调取的词典表。
需要说明的是,当M等于0且接收到用户确认所述M个目标关键词不正确的确认信号时,所述修改后的一个或多个目标关键词是指根据用户的输入所新增的关键词。
在一个实施例中,所述接收用户所输入的修改指令,并当接收到所述修改指令时,对所述M个目标关键词中的一个或多个目标关键词进行修改包括:
(b1)根据所述M个目标关键词的数目生成一个用户界面。
(b2)将所述M个目标关键词展示在所述用户界面。
(b3)根据用户的输入修改所述M个目标关键词中的一个或多个目标关键词。
在一个实施例中,所述根据所述M个目标关键词的数目生成一个用户界面包括:
(b11)确定所述M个目标关键词的数目(即确定M的值)。
(b12)生成所述用户界面,其中,所述用户界面的大小与所述M个目标关键词的数目成正比关系。
在一个实施例中,当M等于0时,所述用户界面的大小为预设值。而当M为大于0的正整数时,所述用户界面的大小即为所述预设值的M倍。
在一个实施例中,所述根据修改后的所述一个或多个目标关键词更新所调取的词典表包括:
(c1)删除修改前的所述一个或多个目标关键词。
(c2)将修改后的所述一个或多个目标关键词存储到所调取的词典表中。
举例而言,假设计算机装置所获得的多个目标关键词包括“权利”、“义务”、“中国”、“平安”,所述计算机装置根据用户所输入的修改指令将“中国”、“平安”合并修改为了“中国平安”,那么计算机装置将“中国平安”作为一个关键词,并在所述词典表中加入关键词“中国平安”,以及在所述词典表中删除关键词“中国”和“平安”。
依据上述步骤S13-S14,计算机装置可以更新修正每类合同所对应的词典表。
综上所述,本发明实施例中所述的词典表建立方法,通过根据合同的类别为每个合同类别创建一个词典表;识别指定合同所属的合同类别,从所存储的词典表中调取与所述指定合同的合同类别所对应的词典表,按照所调取的词典表对所述指定合同的文本内容进行切分,从而获得与所调取的词典表相匹配的多个目标关键词,并根据用户的输入对所述多个目标关键词中的一个或多个目标关键词进行修改,以及根据修改后的所述一个或多个目标关键词更新所调取的词典表。由此本案不仅可以创建词典表还可对词典表进行更新,使得词典表更加准确。
上述图1详细介绍了本发明的词典表建立方法,下面结合图2和图3,对实现所述词典表建立方法的软件装置的功能模块以及实现所述词典表建立方法的硬件装置架构进行介绍。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
实施例二
参阅图2所示,是本发明实施例二提供的词典表建立装置的结构图。
在一些实施例中,所述词典表建立装置30运行于计算机装置中。所述计算机装置通过网络连接了计算机装置。所述词典表建立装置30可以包括多个由程序代码段所组成的功能模块。所述词典表建立装置30中的各个程序段的程序代码可以存储于计算机装置的存储器中,并由所述至少一个处理器所执行,以实现(详见图2描述)词典表建立。
本实施例中,所述词典表建立装置30根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:执行模块301、判断模块302。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
执行模块301接收用户所输入的创建词典表的创建指令,当接收到创建指令时,根据合同的类别为每个合同类别创建一个词典表。
本实施例中,所述合同的类别包括,但不限于,买卖合同、借款合同、赠与合同、租赁合同、技术开发合同、委托合同、保管合同、运输合同、承揽合同、仓储合同。
本实施例中,执行模块301每创建一个词典表,根据该词典表所对应的合同类别为该词典表命名。举例而言,将为合同类别为“买卖合同”所创建的词典表命名为“买卖合同词典表”,将为合同类别为“赠与合同”所创建的词典表命名为“赠与合同词典表”。
在一个实施例中,所述词典表可以是一个文本文档,例如可以是txt文档,或excel文档。
执行模块301接收用户所输入的编辑词典表的编辑指令,并当接收到所述编辑命令时,编辑与每个合同类别所对应的词典表,从而在每个词典表中对应记录每类合同所涉及的关键字。执行模块301还存储所述每个词典表。
本实施例中,每类合同所涉及的关键字可以是由专业人员(例如,律师)所收集的关键字。
举例而言,执行模块301接收用户所输入的编辑“买卖合同词典表”的编辑指令,并当接收到该编辑命令时,编辑所述“买卖合同词典表”,在所述“买卖合同词典表”中记录买卖合同所涉及的关键字。
再如,执行模块301接收用户所输入的编辑“赠与合同词典表”的编辑指令,并当接收到该编辑命令时,编辑所述“赠与合同词典表”,在所述“赠与合同词典表”中记录赠与合同所涉及的关键字。
执行模块301读取指定合同的文本内容,识别所述指定合同所属的合同类别。
在一个实施例中,所述指定合同的文本内容可以预先存储在所述计算机装置中。
本实施例中,所述识别所述指定合同所属的合同类别包括:
(a1)读取所述指定合同的文本内容的前N个字,其中,N可以为大于或等于预设值(例如7,8,或者10)的正整数;
(a2)从所述前N个字中查找与所述合同类别所对应的字词,若所述前N个字中存在与某个合同类别所对应的字词,则确定所述指定合同属于所述某个合同类别。
举例而言,假设所述N等7,所述指定合同的文本内容的前7个字为“葡萄酒买卖合同”,则可以从该前7个字中找到与合同类别为“买卖合同”所对应的字词,那么即可确定所述指定合同的合同类别为买卖合同。
执行模块301根据所述指定合同的合同类别,从所存储的词典表中调取与所述指定合同的合同类别所对应的词典表,按照所调取的词典表对所述指定合同的文本内容进行切分,从而获得与所调取的词典表相匹配的M个目标关键词。其中,M为大于或等于0的整数。
判断模块302提示用户确认所述M个目标关键词是否正确。
若接收到用户确认所述M个目标关键词不正确的确认信号,执行模块301接收用户所输入的修改指令,并当接收到所述修改指令时,对所述M个目标关键词中的一个或多个目标关键词进行修改。执行模块301还根据修改后的所述一个或多个目标关键词更新所调取的词典表。
需要说明的是,当M等于0且接收到用户确认所述M个目标关键词不正确的确认信号时,所述修改后的一个或多个目标关键词是指根据用户的输入所新增的关键词。
在一个实施例中,所述接收用户所输入的修改指令,并当接收到所述修改指令时,对所述M个目标关键词中的一个或多个目标关键词进行修改包括:
(b1)根据所述M个目标关键词的数目生成一个用户界面。
(b2)将所述M个目标关键词展示在所述用户界面。
(b3)根据用户的输入修改所述M个目标关键词中的一个或多个目标关键词。
在一个实施例中,所述根据所述M个目标关键词的数目生成一个用户界面包括:
(b11)确定所述M个目标关键词的数目(即确定M的值)。
(b12)生成所述用户界面,其中,所述用户界面的大小与所述M个目标关键词的数目成正比关系。
在一个实施例中,当M等于0时,所述用户界面的大小为预设值。而当M为大于0的正整数时,所述用户界面的大小即为所述预设值的M倍。
在一个实施例中,所述根据修改后的所述一个或多个目标关键词更新所调取的词典表包括:
(c1)删除修改前的所述一个或多个目标关键词。
(c2)将修改后的所述一个或多个目标关键词存储到所调取的词典表中。
举例而言,假设执行模块301所获得的多个目标关键词包括“权利”、“义务”、“中国”、“平安”,所述执行模块301根据用户所输入的修改指令将“中国”、“平安”合并修改为了“中国平安”,那么执行模块301将“中国平安”作为一个关键词,并在所述词典表中加入关键词“中国平安”,以及在所述词典表中删除关键词“中国”和“平安”。
综上所述,本发明实施例中所述的词典表建立装置,通过根据合同的类别为每个合同类别创建一个词典表;识别指定合同所属的合同类别,从所存储的词典表中调取与所述指定合同的合同类别所对应的词典表,按照所调取的词典表对所述指定合同的文本内容进行切分,从而获得与所调取的词典表相匹配的多个目标关键词,并根据用户的输入对所述多个目标关键词中的一个或多个目标关键词进行修改,以及根据修改后的所述一个或多个目标关键词更新所调取的词典表。由此本案不仅可以创建词典表还可对词典表进行更新,使得词典表更加准确。
实施例三
参阅图3所示,为本发明实施例三提供的计算机装置的结构示意图。在本发明较佳实施例中,所述计算机装置3包括存储器31、至少一个处理器32、至少一条通信总线33。本领域技术人员应该了解,图3示出的计算机装置的结构并不构成本发明实施例的限定,既可以是总线型结构,也可以是星形结构,所述计算机装置3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
在一些实施例中,所述计算机装置3包括一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的终端,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。
需要说明的是,所述计算机装置3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
在一些实施例中,所述存储器31用于存储程序代码和各种数据,例如安装在所述计算机装置3中的词典表建立装置30,并在计算机装置3的运行过程中实现高速、自动地完成程序或数据的存取。所述存储器31包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
在一些实施例中,所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述至少一个处理器32是所述计算机装置3的控制核心(Control Unit),利用各种接口和线路连接整个计算机装置3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行计算机装置3的各种功能和处理数据,例如执行词典表建立的功能。
在一些实施例中,所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。
尽管未示出,所述计算机装置3还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述计算机装置3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令(即一个或多个指令)用以使得一台计算机装置(可以是服务器、个人电脑等)或处理器(processor)执行本发明各个实施例所述方法的部分。
在进一步的实施例中,结合图2,所述至少一个处理器32可执行所述计算机装置3的操作装置以及安装的各类应用程序(如所述的词典表建立装置30)、程序代码等,例如,上述的各个模块。
所述存储器31中存储有程序代码,且所述至少一个处理器32可调用所述存储器31中存储的程序代码以执行相关的功能。例如,图2中所述的各个模块是存储在所述存储器31中的程序代码,并由所述至少一个处理器32所执行,从而实现所述各个模块的功能以达到对计算机装置4词典表建立的目的。
在本发明的一个实施例中,所述存储器31存储一个或多个指令,所述一个或多个指令被所述至少一个处理器32所执行以实现对计算机装置4词典表建立的目的。
具体地,所述至少一个处理器32对上述一个或多个指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (8)
1.一种词典表建立方法,其特征在于,所述方法包括:
接收用户所输入的创建词典表的创建指令,当接收到创建指令时,根据合同的类别为每个合同类别创建一个词典表;
接收用户所输入的编辑词典表的编辑指令,并当接收到所述编辑命令时,编辑与每个合同类别所对应的词典表,从而在每个词典表中对应记录每类合同所涉及的关键字,存储所述每个词典表;
读取指定合同的文本内容,识别所述指定合同所属的合同类别;
根据所述指定合同的合同类别,从所存储的词典表中调取与所述指定合同的合同类别所对应的词典表,按照所调取的词典表对所述指定合同的文本内容进行切分,从而获得与所调取的词典表相匹配的M个目标关键词,其中,M为大于或等于0的整数;
提示用户确认所述M个目标关键词是否正确;
当接收到用户确认所述M个目标关键词不正确的确认信号,接收用户所输入的修改指令,并当接收到所述修改指令时,对所述M个目标关键词中的一个或多个目标关键词进行修改,包括:根据所述M个目标关键词的数目生成一个用户界面;将所述M个目标关键词展示在所述用户界面;及根据用户的输入修改所述M个目标关键词中的一个或多个目标关键词,其中,所述根据所述M个目标关键词的数目生成一个用户界面包括:确定所述M个目标关键词的数目;及生成所述用户界面,其中,所述用户界面的大小与所述M个目标关键词的数目成正比关系;及
根据修改后的所述一个或多个目标关键词更新所调取的词典表。
2.如权利要求1所述的词典表建立方法,其特征在于,所述识别所述指定合同所属的合同类别包括:
读取所述指定合同的文本内容的前N个字,其中,N为大于或等于预设值的正整数;
从所述前N个字中查找与所述合同类别所对应的字词,若所述前N个字中存在与某个合同类别所对应的字词,则确定所述指定合同属于所述某个合同类别。
3.如权利要求1所述的词典表建立方法,其特征在于,当M等于0且接收到用户确认所述M个目标关键词不正确的确认信号时,所述修改后的一个或多个目标关键词是指根据用户的输入所新增的关键词。
4.如权利要求1所述的词典表建立方法,其特征在于,当M等于0时,所述用户界面的大小为预设值,当M为大于0的正整数时,所述用户界面的大小为所述预设值的M倍。
5.如权利要求1所述的词典表建立方法,其特征在于,所述根据修改后的所述一个或多个目标关键词更新所调取的词典表包括:
删除修改前的所述一个或多个目标关键词;及
将修改后的所述一个或多个目标关键词存储到所调取的词典表中。
6.一种计算机装置,其特征在于,所述计算机装置包括存储器和处理器,所述存储器用于存储至少一个指令,所述处理器用于所述至少一个指令时实现如权利要求1至5中任意一项所述词典表建立方法。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有至少一个指令,所述至少一个指令被处理器执行时实现如权利要求1至5中任意一项所述词典表建立方法。
8.一种词典表建立装置,其特征在于,所述装置包括:
执行模块,用于接收用户所输入的创建词典表的创建指令,当接收到创建指令时,根据合同的类别为每个合同类别创建一个词典表;
所述执行模块,还用于接收用户所输入的编辑词典表的编辑指令,并当接收到所述编辑命令时,编辑与每个合同类别所对应的词典表,从而在每个词典表中对应记录每类合同所涉及的关键字,存储所述每个词典表;
所述执行模块,还用于读取指定合同的文本内容,识别所述指定合同所属的合同类别;
所述执行模块,还用于根据所述指定合同的合同类别,从所存储的词典表中调取与所述指定合同的合同类别所对应的词典表,按照所调取的词典表对所述指定合同的文本内容进行切分,从而获得与所调取的词典表相匹配的M个目标关键词,其中,M为大于或等于0的整数;
判断模块,用于提示用户确认所述M个目标关键词是否正确;
所述执行模块,还用于当接收到用户确认所述M个目标关键词不正确的确认信号,接收用户所输入的修改指令,并当接收到所述修改指令时,对所述M个目标关键词中的一个或多个目标关键词进行修改,包括:根据所述M个目标关键词的数目生成一个用户界面;将所述M个目标关键词展示在所述用户界面;及根据用户的输入修改所述M个目标关键词中的一个或多个目标关键词,其中,所述根据所述M个目标关键词的数目生成一个用户界面包括:确定所述M个目标关键词的数目;及生成所述用户界面,其中,所述用户界面的大小与所述M个目标关键词的数目成正比关系;及
所述执行模块,还用于根据修改后的所述一个或多个目标关键词更新所调取的词典表。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910173520.5A CN110083823B (zh) | 2019-03-07 | 2019-03-07 | 词典表建立方法及装置、计算机装置、及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910173520.5A CN110083823B (zh) | 2019-03-07 | 2019-03-07 | 词典表建立方法及装置、计算机装置、及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110083823A CN110083823A (zh) | 2019-08-02 |
CN110083823B true CN110083823B (zh) | 2024-03-29 |
Family
ID=67412339
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910173520.5A Active CN110083823B (zh) | 2019-03-07 | 2019-03-07 | 词典表建立方法及装置、计算机装置、及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110083823B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110659347B (zh) * | 2019-09-03 | 2023-08-18 | 平安科技(深圳)有限公司 | 关联文书确定方法、装置、计算机设备及存储介质 |
CN111753540B (zh) * | 2020-06-24 | 2023-04-07 | 云南电网有限责任公司信息中心 | 一种对于文本数据进行收集以进行自然语言处理nlp的方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106844544A (zh) * | 2016-12-30 | 2017-06-13 | 全民互联科技(天津)有限公司 | 一种合同条款风险识别方法及系统 |
JP2017187823A (ja) * | 2016-04-01 | 2017-10-12 | 前田建設工業株式会社 | 文言追記装置、文言追記方法及び文言追記プログラム |
CN107577774A (zh) * | 2017-09-08 | 2018-01-12 | 北京智诚律法科技有限公司 | 一种智能选择拟定合同律师的系统 |
CN107608958A (zh) * | 2017-09-07 | 2018-01-19 | 湖南湘君奕成信息技术有限公司 | 基于条款统一建模的合同文本风险信息挖掘方法和系统 |
CN108932340A (zh) * | 2018-07-13 | 2018-12-04 | 华融融通(北京)科技有限公司 | 一种不良资产经营领域下金融知识图谱的构建方法 |
-
2019
- 2019-03-07 CN CN201910173520.5A patent/CN110083823B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017187823A (ja) * | 2016-04-01 | 2017-10-12 | 前田建設工業株式会社 | 文言追記装置、文言追記方法及び文言追記プログラム |
CN106844544A (zh) * | 2016-12-30 | 2017-06-13 | 全民互联科技(天津)有限公司 | 一种合同条款风险识别方法及系统 |
CN107608958A (zh) * | 2017-09-07 | 2018-01-19 | 湖南湘君奕成信息技术有限公司 | 基于条款统一建模的合同文本风险信息挖掘方法和系统 |
CN107577774A (zh) * | 2017-09-08 | 2018-01-12 | 北京智诚律法科技有限公司 | 一种智能选择拟定合同律师的系统 |
CN108932340A (zh) * | 2018-07-13 | 2018-12-04 | 华融融通(北京)科技有限公司 | 一种不良资产经营领域下金融知识图谱的构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110083823A (zh) | 2019-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107885499A (zh) | 一种接口文档生成方法及终端设备 | |
CN110083823B (zh) | 词典表建立方法及装置、计算机装置、及存储介质 | |
CN113409823B (zh) | 语音情绪识别方法、装置、电子设备及存储介质 | |
CN111128323A (zh) | 医疗电子病例的标注方法、装置、设备及存储介质 | |
CN113963770A (zh) | 报告文件生成方法、装置、计算机设备及其存储介质 | |
CN110688111A (zh) | 业务流程的配置方法、装置、服务器和存储介质 | |
CN111435367A (zh) | 知识图谱的构建方法、系统、设备及存储介质 | |
CN111367890A (zh) | 一种数据迁移的方法、装置、计算机设备及可读存储介质 | |
US20120310962A1 (en) | Automated business process modeling | |
CN110069455B (zh) | 一种文件合并方法及装置 | |
CN112597034A (zh) | 测试用例的生成方法、装置及计算机可读存储介质 | |
CN111984674A (zh) | 结构化查询语言的生成方法及系统 | |
CN110334327B (zh) | 面积信息的自动生成方法、装置以及存储装置 | |
CN112069808A (zh) | 融资风控方法、装置、计算机设备及存储介质 | |
CN106897224A (zh) | 一种软件测试范围的确定方法及装置 | |
CN113901025A (zh) | 数据库管理方法、装置、设备和存储介质 | |
CN116011955A (zh) | 一种机器人流程自动化需求实现方法、装置、设备和存储介质 | |
WO2017148376A1 (zh) | 应用程序用户界面自动化测试方法、电子设备、系统及存储介质 | |
CN114549097A (zh) | 企业发票系统版本管理方法、装置、电子设备及存储介质 | |
CN109697592B (zh) | 基于环形数组的货源下架方法、系统、设备及存储介质 | |
CN112948480B (zh) | 数据抽取方法、装置、电子设备及存储介质 | |
US10726176B1 (en) | Method and apparatus for designing electrical and electronic circuits | |
US11681865B2 (en) | Annotating a log based on log documentation | |
CN113590225B (zh) | 贴图检测方法、装置、电子设备及存储介质 | |
CN113781602A (zh) | 甘特图生成方法及装置、计算机可读存储介质、电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |