CN110705252A - 技术合同判定方法、电子置、计算机设备和存储介质 - Google Patents
技术合同判定方法、电子置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN110705252A CN110705252A CN201910786252.4A CN201910786252A CN110705252A CN 110705252 A CN110705252 A CN 110705252A CN 201910786252 A CN201910786252 A CN 201910786252A CN 110705252 A CN110705252 A CN 110705252A
- Authority
- CN
- China
- Prior art keywords
- sentence
- word
- model
- contract
- rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000005516 engineering process Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims description 23
- 230000015654 memory Effects 0.000 claims description 15
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 5
- 238000003058 natural language processing Methods 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 8
- 238000011161 development Methods 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000011022 operating instruction Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Economics (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Machine Translation (AREA)
Abstract
本申请提供的一种技术合同判定方法、电子置、计算机设备和存储介质,通过将技术合同进行分句,并以句为单位采用词嵌入技术建立句词向量模型;在所述句词向量模型中选出于预设词汇表中语义相近表示特定名词的条目;根据预设规则库抽取与成果相关的所述句词模型和所述条目,对其进行规则判定以得到判定结果。本申请能够技术合同的条款要求根据规则库要求进行充分分析,并将得到的关系模型通过规则分析,大大加快了技术合同的判定过程,也节省了人工判定技术合同的成本。
Description
技术领域
本发明涉及文本处理技术领域,特别是涉及一种技术合同判定方法、电子置、计算机设备和存储介质。
背景技术
技术合同是当事人就技术开发、转让、咨询或者服务订立的确立相互之间权利和义务的合同。技术合同的标的与技术有密切联系,不同类型的技术合同有不同的技术内容。对技术合同的认定都需要具体审核人员进行,审核合同进行一定的工作量。近年来,随着信息技术与智能技术的发展,根据技术合同的自身特点,通过规则定义与匹配来快速判断技术合同是否满足要求,给出初步判定结果,从而提升判定效率,这类特定要求的技术合同的快速判定具有很强的实际意义。
发明内容
鉴于以上所述现有技术的缺点,本申请的目的在于提供一种技术合同判定方法、电子置、计算机设备和存储介质,以解决现有技术中的问题。
为实现上述目的及其他相关目的,本申请提供一种技术合同判定方法,所述方法包括:将技术合同进行分句,并以句为单位采用词嵌入技术建立句词向量模型;在所述句词向量模型中选出于预设词汇表中语义相近表示特定名词的条目;根据预设规则库抽取与成果相关的所述句词模型和所述条目,对其进行规则判定以得到判定结果。
于本申请的一实施例中,所述将技术合同进行分句,并以句为单位采用词嵌入技术建立句词向量模型,包括:对技术合同按段落进行分句,并以段落结构和句形成基本合同篇章模型;将所述合同篇章模型进行分句,并以句为单位采用词嵌入技术建立句词向量模型。
于本申请的一实施例中,所述在所述句词向量模型中选出于预设词汇表语义相近表示特定名词的条目,包括:通过语法分析器对所述句词向量模型过滤并解析句词语义;将所述句词语义与所述词汇表中语义进行比对,以找到与所述句词语义相近表示特定名词的条目。
于本申请的一实施例中,所述词汇表包括:名词、名词短语、动名词、及动名词短语中任意一种或多种组合。
于本申请的一实施例中,所述规则库中的各所述规则是基于现行技术合同认定规则制定的。
于本申请的一实施例中,所述规则库中包含多种必选规则与可选规则。
于本申请的一实施例中,所述根据预设规则库抽取与成果相关的所述句词模型和所述条目,对其进行规则判定以得到判定结果,包括:将所抽取的所述句词模型或所述条目与所述规则库中的各所述规则进行对比分析,以判断是否满足各所述规则;其中,当所述句词模型或所述条目不满足任意一所述必选规则,则判定结果为不通过。
为实现上述目的及其他相关目的,本申请提供一种电子装置,所述装置包括:预处理模块,用于将技术合同进行分句,并以句为单位采用词嵌入技术建立句词向量模型;在所述句词向量模型中选出于预设词汇表中语义相近表示特定名词的条目;判定处理模块,用于根据预设规则库抽取与成果相关的所述句词模型和所述条目,对其进行规则判定以得到判定结果。
为实现上述目的及其他相关目的,本申请提供一种计算机设备,所述设备包括:存储器、及处理器;所述存储器用于存储计算机指令;所述处理器运行计算机指令实现如上所述的方法。
为实现上述目的及其他相关目的,本申请提供一种计算机可读存储介质,存储有计算机指令,所述计算机指令被运行时执行如上所述的方法。
综上所述,本申请的一种技术合同判定方法、电子置、计算机设备和存储介质,通过将技术合同进行分句,并以句为单位采用词嵌入技术建立句词向量模型;在所述句词向量模型中选出于预设词汇表中语义相近表示特定名词的条目;根据预设规则库抽取与成果相关的所述句词模型和所述条目,对其进行规则判定以得到判定结果。
具有以下有益效果:
能够技术合同的条款要求根据规则库要求进行充分分析,并将得到的关系模型通过规则分析,大大加快了技术合同的判定过程,也节省了人工判定技术合同的成本。
附图说明
图1显示为本申请于一实施例中的技术合同判定方法的流程示意图。
图2显示为本申请于一实施例中的技术合同判定装置的模块示意图。
图3显示为本申请于一实施例中的计算机设备的结构示意图。
具体实施方式
以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
下面以附图为参考,针对本申请的实施例进行详细说明,以便本申请所属技术领域的技术人员能够容易地实施。本申请可以以多种不同形态体现,并不限定于此处说明的实施例。
为了明确说明本申请,省略与说明无关的部件,对于通篇说明书中相同或类似的构成要素,赋予了相同的参照符号。
在通篇说明书中,当说某部件与另一部件“连接”时,这不仅包括“直接连接”的情形,也包括在其中间把其它元件置于其间而“间接连接”的情形。另外,当说某种部件“包括”某种构成要素时,只要没有特别相反的记载,则并非将其它构成要素排除在外,而是意味着可以还包括其它构成要素。
当说某部件在另一部件“之上”时,这可以是直接在另一部件之上,但也可以在其之间伴随着其它部件。当对照地说某部件“直接”在另一部件“之上”时,其之间不伴随其它部件。
虽然在一些实例中术语第一、第二等在本文中用来描述各种元件,但是这些元件不应当被这些术语限制。这些术语仅用来将一个元件与另一个元件进行区分。例如,第一接口及第二接口等描述。再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、步骤、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、步骤、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能、步骤或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
此处使用的专业术语只用于言及特定实施例,并非意在限定本申请。此处使用的单数形态,只要语句未明确表示出与之相反的意义,那么还包括复数形态。在说明书中使用的“包括”的意义是把特定特性、区域、整数、步骤、作业、要素及/或成份具体化,并非排除其它特性、区域、整数、步骤、作业、要素及/或成份的存在或附加。
表示“下”、“上”等相对空间的术语可以为了更容易地说明在附图中图示的一部件相对于另一部件的关系而使用。这种术语是指,不仅是在附图中所指的意义,还包括使用中的装置的其它意义或作业。例如,如果翻转附图中的装置,曾说明为在其它部件“下”的某部件则说明为在其它部件“上”。因此,所谓“下”的示例性术语,全部包括上与下方。装置可以旋转90°或其它角度,代表相对空间的术语也据此来解释。
本申请主要针对技术合同的判定,因技术合同相较于其它合同专业度更高,内容更多,存在法规漏洞的方式更隐蔽,因此,往往需要对技术合同进行判定的人员不仅具备法律知识,还需具备相应的技术经验,因此,该类判定的人工成本更高,也更为稀缺。
本申请所涉及的技术合同包括:技术开发合同、技术转让合同、技术咨询合同和技术服务合同这4大类。
本发明的目的是提供一种技术合同判定方法、电子置、计算机设备和存储介质,通过规则定义与匹配来快速判断技术合同是否满足要求,给出初步判定结果,从而提升判定效率。
如图1所示,展示为本申请一实施例中的技术合同判定方法的流程示意图。如图所示,所述方法包括:
步骤S101:将技术合同进行分句,并以句为单位采用词嵌入技术建立句词向量模型。
于本申请一实施例中,所述步骤S101进一步包括:
A、对技术合同按段落进行分句,并以段落结构和句形成基本合同篇章模型;
B、将所述合同篇章模型进行分句,并以句为单位采用词嵌入技术建立句词模型。
于本申请中,通常一份技术合同篇幅较长,往往涉及多个章节,在本申请中首先需要将技术合同按段落进行拆分,以形成以段落为单位的基本的合同篇章模型。
然后在对合同篇章模型中各句进行拆分,各合同篇章模型内拆分后的各句之间相比于盲目的进行拆分的句子具有较强的关联性。在分句后以句为单位采用词嵌入技术建立句词向量模型。
所述词嵌入是自然语言处理(NLP)中语言模型与表征学习技术的统称。概念上而言,它是指把一个维数为所有词的数量的高维空间嵌入到一个维数低得多的连续向量空间中,每个单词或词组被映射为实数域上的向量。
词嵌入的方法包括人工神经网络、对词语同现矩阵降维、概率模型以及单词所在上下文的显式表示等。在底层输入中,使用词嵌入来表示词组的方法极大提升了NLP中语法分析器和文本情感分析等的效果。
步骤S102:在所述句词向量模型中选出于预设词汇表语义相近表示特定名词的条目。
于本申请一实施例中,所述步骤S102进一步包括:
A、通过语法分析器对所述句词向量模型过滤并解析句词语义;
B、将所述句词语义与所述词汇表中语义进行比对,以找到与所述句词语义相近表示特定名词的条目。
需要说明的是,在本申请中采用自然语言处理技术来对所述句词向量模型进行过滤和解析。具体来说,通过语法分析器。
所述自然语言处理技术(NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。自然语言处理是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。
许多不同类的机器学习算法已应用于自然语言处理任务。这些算法的输入是一大组从输入数据生成的“特征”。一些最早使用的算法,如决策树,产生硬的if-then规则类似于手写的规则,是再普通的系统体系。然而,越来越多的研究集中于统计模型,这使得基于附加实数值的权重,每个输入要素柔软,概率的决策。此类模型具有能够表达许多不同的可能的答案,而不是只有一个相对的确定性,产生更可靠的结果时,这种模型被包括作为较大系统的一个组成部分的优点。
例如,常见的自然语言处理的处理工具包括:
OpenNLP处理工具是一个基于Java机器学习工具包,用于处理自然语言文本。支持大多数常用的NLP任务,例如:标识化、句子切分、部分词性标注、名称抽取、组块、解析等。
FudanNLP处理工具主要是为中文自然语言处理而开发的工具包,也包含为实现这些任务的机器学习算法和数据集。本工具包及其包含数据集使用LGPL3.0许可证。开发语言为Java。其功能包括:1)文本分类、新闻聚类;2)中文分词、词性标注、实体名识别、关键词抽取、依存句法分析、时间短语识别;3)结构化学习、在线学习、层次分类、聚类、精确推理;
语言技术平台(Language Technology Platform,LTP)是哈工大社会计算与信息检索研究中心历时十年开发的一整套中文语言处理系统。LTP制定了基于XML的语言处理结果表示,并在此基础上提供了一整套自底向上的丰富而且高效的中文语言处理模块(包括词法、句法、语义等6项中文处理核心技术),以及基于动态链接库(Dynamic Link Library,DLL)的应用程序接口,可视化工具,并且能够以网络服务(Web Service)的形式进行使用。
语法分析器(Parser)通常是作为编译器或解释器的组件出现的,它的作用是进行语法检查、并构建由输入的单词组成的数据结构(一般是语法分析树、抽象语法树等层次化的数据结构)。语法分析器通常使用一个独立的词法分析器从输入字符流中分离出一个个的“单词”,并将单词流作为其输入。实际开发中,语法分析器可以手工编写,也可以使用工具(半)自动生成。
语法分析器的任务主要是确定是否可以以及如何从语法的起始符号推导出输入符号串(输入文本),主要可以通过两种方式完成:1)自顶向下分析,根据形式语法规则,在语法分析树的自顶向下展开中搜索输入符号串可能的最左推导。单词按从左到右的顺序依次使用。2)自底向上分析,语法分析器从现有的输入符号串开始,尝试将其根据给定的形式语法规则进行改写,最终改写为语法的起始符号。
举例来说,LALR分析器是一种规范LR分析方法的简化形式。它可以对上下无关文法进行语法分析。LALR即“Look-AheadLR”。其中,Look-Ahead为“向前看”,L代表对输入进行从左到右的检查,R代表反向构造出最右推导序列。LALR分析器可以根据一种程序设计语言的正式语法的产生式而对一段文本程序输入进行语法分析,从而在语法层面上判断输入程序是否合法。实际应用中的LALR分析器并不是由人手工写成的,而是由类似于yacc和GNUBison之类的LALR语法分析器生成工具构成。由机器自动生成的代码相比较于程序员手工的代码,拥有更好的运行效率而且减少了程序员的工作量。
于本实施例中,通过语法分析器对所述句词向量模型过滤及解析,以获得所述句词向量模型的句词语义。再通过预设词汇表中语义进行比对,以进一步找到与所述句词语义相近条目或条款,这样便于下一步对该条目是否满足规则进行判断。当然,为便于比对以及后续的判断,所述条目或条款映射为特定名词,优选地,所述特定名词不不局限于词性为名词的词汇,还包括动名词、名词短语、及动名词短语等。
相应地,于本申请一实施例中,所述词汇表包括但不限于:名词、名词短语、动名词、及动名词短语中任意一种或多种组合。
于本实施例中,所述词汇表主要包含技术合同中常见的一些特定词汇,如“合同标的”、“合同报价”、“单位名称”、“甲方”、“乙方”、“参数”等技术合同中常见名称,进一步地,可以根据技术合同中比较关键专用词,如“费用”、“期限”、“所有权”等特定词汇以确定相关含义或关联的语义内容。
步骤S103:根据预设规则库抽取与成果相关的所述句词模型和所述条目,对其进行规则判定以得到判定结果。
于本申请一实施例中,所述规则库中的各所述规则是基于现行技术合同认定规则制定的。
具体来说,所述《技术合同认定规则》为科学技术部关于印发通知。
于本申请中,文本中的技术合同认定规则包含内容繁杂,且并不能被机器或软件所直接识别或使用,因此,本申请在现行技术合同认定规则的基础上进行相应转换设置,以被机器或软件所直接识别或使用。
例如,所述规则可以设置为是对所述特定名词检测,以判定技术合同是否遗漏关键信息、或存在错误等,如单位名称、时间、金额等特定名词;或者,所述规则还可以设置为是对所述特定名词的数量及组合进行检测,以判定技术合同所约束数量是否达标或超出范围;或者,所述规则还可以设置为是对存在关联关系的所述特定名字进行检测,如判定技术合同中印章是否齐备或者印章与书写名称是否一致等;再或者,所述规则可以设置为检测是否存在必要所述特定名词,如判定技术合同中是否存在补偿措施或解释说明或违约办法。
于本申请一实施例中,所述规则库中包含多种必选规则与可选规则。因技术合同分为多种类型,并非所有规则适用各种技术合同,因此,在本申请所述规则库中设置能够通用且非常关键的必选规则,另外设置适用专用技术合同,或非普遍存在于技术合同中的可选择规则,以同时满足实用性和功能性。
于本申请一实施例中,所述步骤S103进一步包括:
将所抽取的所述句词模型或所述条目与所述规则库中的各所述规则进行对比分析,以判断是否满足各所述规则;其中,当所述句词模型或所述条目不满足任意一所述必选规则,则判定结果为不通过。
简单来说,将之前分析的所述句词模型和所述条目与规则单位进行逐一处理,并判断所有规则的通过程度,必选规则表示必须要满足规则,若不满足,该技术合同肯定不符合要求。而可选规则是否满足不得作为技术合同是否不满足的条件,在某种情况下,需要进一步进行分析。
于本实施例中,所述判定结果包括但不限于:合同类型、合规性、契合度、不确定度、存在问题类目、具体问题条款、及意见反馈中任意一种或多种组合。
简单来说,所述输出结果主要用于体现如:技术合同属于哪个类型,是否满足要求,以及存在违规或不规范的合同条款等。
举例来说,表1展示为本申请一实施例中判定结果情况。
表1 判定结果情况
本申请将技术合同的条款要求根据规则库要求进行充分分析;将得到的关系元组通过规则分析,大大加快了技术合同的认定过程。
如图2所示,展示为本申请于一实施例中的电子装置的模块示意图。如图所示,所述装置200包括:
预处理模块201,用于将技术合同进行分句,并以句为单位采用词嵌入技术建立句词向量模型;在所述句词向量模型中选出于预设词汇表中语义相近表示特定名词的条目;
判定处理模块202,用于根据预设规则库抽取与成果相关的所述句词模型和所述条目,对其进行规则判定以得到判定结果。
需要说明的是,上述装置各模块/单元之间的信息交互、执行过程等内容,由于与本申请所述方法实施例基于同一构思,其带来的技术效果与本申请方法实施例相同,具体内容可参见本申请前述所示的方法实施例中的叙述,此处不再赘述。
还需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些单元可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,判定处理模块202可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上判定处理模块202的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital signal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
如图3所示,展示为本申请于一实施例中的计算机设备的结构示意图。如图所示,所述计算机设备300包括:存储器301、及处理器302;所述存储器301用于存储计算机指令;所述处理器302运行计算机指令实现如图1所述的方法。
在一些实施例中,所述计算机设备300中的所述存储器301的数量均可以是一或多个,所述处理器302的数量均可以是一或多个,所述通信器303的数量均可以是一或多个,而图3中均以一个为例。
于本申请一实施例中,所述计算机设备300中的处理器302会按照如图1所述的步骤,将一个或多个以应用程序的进程对应的指令加载到存储器301中,并由处理器302来运行存储在存储器301中的应用程序,从而实现如图1所述的方法。
所述存储器301可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。所述存储器301存储有操作系统和操作指令、可执行模块或者数据结构,或者它们的子集,或者它们的扩展集,其中,操作指令可包括各种操作指令,用于实现各种操作。操作系统可包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
所述处理器302可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在一些具体的应用中,所述计算机设备300的各个组件通过总线系统耦合在一起,其中总线系统除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清除说明起见,在图3中将各种总线都成为总线系统。
于本申请的一实施例中,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如图1所述的方法。
所述计算机可读存储介质,本领域普通技术人员可以理解:实现上述系统及各单元功能的实施例可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述系统及各单元功能的实施例;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
综上所述,本申请提供的一种技术合同判定方法、电子置、计算机设备和存储介质,通过对所获取的技术合同进行初步分词及排列以组成有序词集;针对所述有序词集中的特定词汇进行抽取以建立词关联模型;根据词性先后关系对所述词关联模型进行多维关系标注以形成词向量模型;将所述词向量模型输入预设判定模型进行分析以得到判定结果。
本申请有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本申请的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本申请的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中包含通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本申请的权利要求所涵盖。
Claims (10)
1.一种技术合同判定方法,其特征在于,所述方法包括:
将技术合同进行分句,并以句为单位采用词嵌入技术建立句词向量模型;
在所述句词向量模型中选出于预设词汇表中语义相近表示特定名词的条目;
根据预设规则库抽取与成果相关的所述句词模型和所述条目,对其进行规则判定以得到判定结果。
2.根据权利要求1所述的方法,其特征在于,所述将技术合同进行分句,并以句为单位采用词嵌入技术建立句词向量模型,包括:
对技术合同按段落进行分句,并以段落结构和句形成基本合同篇章模型;
将所述合同篇章模型进行分句,并以句为单位采用词嵌入技术建立句词向量模型。
3.根据权利要求1所述的方法,其特征在于,所述在所述句词向量模型中选出于预设词汇表语义相近表示特定名词的条目,包括:
通过语法分析器对所述句词向量模型过滤并解析句词语义;
将所述句词语义与所述词汇表中语义进行比对,以找到与所述句词语义相近表示特定名词的条目。
4.根据权利要求1所述的方法,其特征在于,所述词汇表包括:名词、名词短语、动名词、及动名词短语中任意一种或多种组合。
5.根据权利要求1所述的方法,其特征在于,所述规则库中的各所述规则是基于现行技术合同认定规则制定的。
6.根据权利要求1所述的方法,其特征在于,所述规则库中包含多种必选规则与可选规则。
7.根据权利要求4所述的方法,其特征在于,所述根据预设规则库抽取与成果相关的所述句词模型和所述条目,对其进行规则判定以得到判定结果,包括:
将所抽取的所述句词模型或所述条目与所述规则库中的各所述规则进行对比分析,以判断是否满足各所述规则;其中,当所述句词模型或所述条目不满足任意一所述必选规则,则判定结果为不通过。
8.一种电子装置,其特征在于,所述装置包括:
预处理模块,用于将技术合同进行分句,并以句为单位采用词嵌入技术建立句词向量模型;在所述句词向量模型中选出于预设词汇表中语义相近表示特定名词的条目;
判定处理模块,用于根据预设规则库抽取与成果相关的所述句词模型和所述条目,对其进行规则判定以得到判定结果。
9.一种计算机设备,其特征在于,所述设备包括:存储器、及处理器;所述存储器用于存储计算机指令;所述处理器运行计算机指令实现如权利要求1至7中任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于,存储有计算机指令,所述计算机指令被运行时执行如权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910786252.4A CN110705252A (zh) | 2019-08-23 | 2019-08-23 | 技术合同判定方法、电子置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910786252.4A CN110705252A (zh) | 2019-08-23 | 2019-08-23 | 技术合同判定方法、电子置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110705252A true CN110705252A (zh) | 2020-01-17 |
Family
ID=69193405
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910786252.4A Pending CN110705252A (zh) | 2019-08-23 | 2019-08-23 | 技术合同判定方法、电子置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110705252A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112926312A (zh) * | 2021-02-24 | 2021-06-08 | 南通大学 | 一种技术合同认定模型创建方法及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108519972A (zh) * | 2018-03-26 | 2018-09-11 | 北京北大英华科技有限公司 | 一种合同条款的法律风险判定方法、装置及计算机设备 |
CN109447105A (zh) * | 2018-09-10 | 2019-03-08 | 平安科技(深圳)有限公司 | 合同审核方法、装置、计算机设备和存储介质 |
CN109582772A (zh) * | 2018-11-27 | 2019-04-05 | 平安科技(深圳)有限公司 | 合同信息提取方法、装置、计算机设备和存储介质 |
CN109657227A (zh) * | 2018-10-08 | 2019-04-19 | 平安科技(深圳)有限公司 | 合同可行性判定方法、设备、存储介质及装置 |
CN109726298A (zh) * | 2019-01-08 | 2019-05-07 | 上海市研发公共服务平台管理中心 | 适用于科技文献的知识图谱构建方法、系统、终端及介质 |
CN110059924A (zh) * | 2019-03-13 | 2019-07-26 | 平安城市建设科技(深圳)有限公司 | 合同条款的审查方法、装置、设备及计算机可读存储介质 |
-
2019
- 2019-08-23 CN CN201910786252.4A patent/CN110705252A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108519972A (zh) * | 2018-03-26 | 2018-09-11 | 北京北大英华科技有限公司 | 一种合同条款的法律风险判定方法、装置及计算机设备 |
CN109447105A (zh) * | 2018-09-10 | 2019-03-08 | 平安科技(深圳)有限公司 | 合同审核方法、装置、计算机设备和存储介质 |
CN109657227A (zh) * | 2018-10-08 | 2019-04-19 | 平安科技(深圳)有限公司 | 合同可行性判定方法、设备、存储介质及装置 |
CN109582772A (zh) * | 2018-11-27 | 2019-04-05 | 平安科技(深圳)有限公司 | 合同信息提取方法、装置、计算机设备和存储介质 |
CN109726298A (zh) * | 2019-01-08 | 2019-05-07 | 上海市研发公共服务平台管理中心 | 适用于科技文献的知识图谱构建方法、系统、终端及介质 |
CN110059924A (zh) * | 2019-03-13 | 2019-07-26 | 平安城市建设科技(深圳)有限公司 | 合同条款的审查方法、装置、设备及计算机可读存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112926312A (zh) * | 2021-02-24 | 2021-06-08 | 南通大学 | 一种技术合同认定模型创建方法及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Faria et al. | A domain-independent process for automatic ontology population from text | |
JP5936698B2 (ja) | 単語意味関係抽出装置 | |
CN112699665B (zh) | 一种安全报告文本的三元组抽取方法、装置及电子设备 | |
Dragoni et al. | Combining natural language processing approaches for rule extraction from legal documents | |
CN113609838B (zh) | 文档信息抽取及图谱化方法和系统 | |
CN113641833B (zh) | 服务需求匹配方法及装置 | |
CN112541337A (zh) | 一种基于递归神经网络语言模型的文档模板自动生成方法及系统 | |
CN112000802A (zh) | 基于相似度集成的软件缺陷定位方法 | |
CN112733547A (zh) | 一种利用语义依存分析的中文问句语义理解方法 | |
Adrian et al. | iDocument: using ontologies for extracting and annotating information from unstructured text | |
EP1351156A1 (en) | System and method for automatically performing functional analyses of technical texts | |
CN113157887A (zh) | 知识问答意图识别方法、装置、及计算机设备 | |
CN110705252A (zh) | 技术合同判定方法、电子置、计算机设备和存储介质 | |
CN116483314A (zh) | 一种自动化智能活动图生成方法 | |
Ko et al. | Syntactic approach to extracting key elements of work modification cause in change-order documents | |
CN114417008A (zh) | 一种面向建设工程领域的知识图谱构建方法及系统 | |
CN111897932A (zh) | 一种文本大数据的查询处理方法及系统 | |
Manrique-Losada et al. | Re-expressing business processes information from corporate documents into controlled language | |
Bhana et al. | Knowledge graph fusion for language model fine-tuning | |
QasemiZadeh | Towards technology structure mining from text by linguistics analysis | |
US12019981B2 (en) | Method and system for converting literature into a directed graph | |
US20240143334A1 (en) | Text block classification by dependency tree generation | |
Vasili et al. | A study of summarization techniques in Albanian language | |
Tran et al. | Algorithm of computing verbal relationships for generating Vietnamese paragraph of summarization from the logical expression of discourse representation structure | |
Wang et al. | Event detection based on multilingual information enhanced syntactic dependency GCN |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200117 |