CN113469479A - 合同风险预测方法和装置 - Google Patents
合同风险预测方法和装置 Download PDFInfo
- Publication number
- CN113469479A CN113469479A CN202010246086.1A CN202010246086A CN113469479A CN 113469479 A CN113469479 A CN 113469479A CN 202010246086 A CN202010246086 A CN 202010246086A CN 113469479 A CN113469479 A CN 113469479A
- Authority
- CN
- China
- Prior art keywords
- contract
- attention
- matrix
- risk prediction
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 239000013598 vector Substances 0.000 claims abstract description 206
- 230000007246 mechanism Effects 0.000 claims abstract description 60
- 238000013058 risk prediction model Methods 0.000 claims abstract description 46
- 238000012545 processing Methods 0.000 claims abstract description 28
- 230000004927 fusion Effects 0.000 claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims description 89
- 238000011176 pooling Methods 0.000 claims description 24
- 230000002452 interceptive effect Effects 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 9
- 238000003058 natural language processing Methods 0.000 claims description 8
- 230000009471 action Effects 0.000 claims description 7
- 238000012935 Averaging Methods 0.000 claims description 4
- 238000013475 authorization Methods 0.000 claims description 3
- 238000012552 review Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 239000010410 layer Substances 0.000 description 8
- 238000000605 extraction Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000002085 persistent effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012797 qualification Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 239000002355 dual-layer Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Marketing (AREA)
- Evolutionary Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Probability & Statistics with Applications (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Technology Law (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
公开了一种合同风险预测方法和装置。获取从合同文本中提取的合同内部元素。获取与合同当事方有关的合同外部元素。将合同内部元素和合同外部元素输入训练好的合同风险预测模型,得到合同风险预测结果。合同风险预测模型包括:第一注意力模块,基于注意力机制对合同内部元素进行处理,得到相应的第一特征向量;第二注意力模块,基于注意力机制对合同外部元素进行处理,得到相应的第二特征向量;融合模块,融合第一特征向量和第二特征向量,得到第三特征向量;以及分类模块,基于第三特征向量进行分类处理,得到合同风险预测结果。由此,能够基于合同文本内部信息和合同文本外部的企业信息,对合同文本中潜在的风险进行预测。
Description
技术领域
本公开涉及一种风险预测领域,特别涉及合同风险预测领域。
背景技术
合同签署之后,往往会因为一些原因导致合同未能成功履行,或者双方在合同履行过程中产生纠纷而导致法律诉讼。因此,在最终签署合同之前对潜在的合同风险进行提示是很有必要的。
一般而言,合同风险有内部风险和外部风险两大类因素。
所谓内部风险,是指合同文档本身存在的问题导致的风险。所谓外部风险,则涉及公司资质、公司经营状况、公司法律风险等合同文档外部的因素导致的风险。
目前的合同审查技术主要集中在内部风险审查。例如,主要通过字段抽取、一致性比对等自然语言处理(NLP)的规则或者算法,对合同文档本身进行形式审查和实质审查。
另一方面,外部风险审查更多地是对签署合同的对方公司的尽职调查,包括公司资质审查、公司经营状况审查、公司法律风险审查等等。
然而,对于有些风险,单纯进行合同文本的内部风险审查,或者单独进行外部风险审查,都不可能发现。例如,如果合同文档内部提供的公司法人信息和从外部信息获取的公司法人信息不匹配,那么这就是一个风险点。而这个风险不论是通过单纯的内部风险审查还是单纯的外部风险审查,都不能够发现。
因此,还需要一种能够结合内部风险审查和外部风险审查的合同风险预测方案。
发明内容
本公开要解决的一个技术问题是提供一种合同风险预测方法和装置,其能够结合合同内部信息和合同外部的企业信息来对合同风险进行预测。
根据本公开的第一个方面,提供了一种合同风险预测方法,包括:获取从合同文本中提取的合同内部元素;获取与合同当事方有关的合同外部元素;以及将合同内部元素和合同外部元素输入训练好的合同风险预测模型,得到合同风险预测结果,其中,合同风险预测模型包括:第一注意力模块,基于注意力机制对合同内部元素进行处理,得到相应的第一特征向量;第二注意力模块,基于注意力机制对合同外部元素进行处理,得到相应的第二特征向量;融合模块,融合第一特征向量和第二特征向量,得到第三特征向量;以及分类模块,基于第三特征向量进行分类处理,得到合同风险预测结果。
可选地,第一注意力模块基于注意力机制执行下述操作:将多个合同内部元素转化为对应的多个第一向量;组合多个第一向量得到第一矩阵;以及对第一矩阵进行卷积操作和池化操作,得到第一特征向量。可选地,第二注意力模块基于注意力机制执行下述操作:将多个合同外部元素转化为对应的多个第二向量;组合多个第二向量得到第二矩阵;以及对第二矩阵进行卷积操作和池化操作,得到第二特征向量。
可选地,合同风险预测模型还包括:交互注意力模块,基于交互注意力机制,结合第一矩阵和第二矩阵,得到用于第一注意力模块的第一权重向量和用于第二注意力模块的第二权重向量,其中,第一注意力模块根据第一权重向量对卷积结果进行池化操作得到第一特征向量,第二注意力模块根据第二权重向量对卷积结果进行池化操作得到第二特征向量。
可选地,第一注意力模块以多个第一向量分别为行向量,组合得到第一矩阵;第二注意力模块以多个第二向量分别为列向量,组合得到第二矩阵,第一向量和第二向量具有相同的维度;并且交互注意力模块将第一矩阵与第二矩阵相乘,得到第三矩阵,对第三矩阵按行求和得到第一权重向量,对第三矩阵按列求和得到第二权重向量。或者,可选地,第一注意力模块以多个第一向量分别为列向量,组合得到第一矩阵;第二注意力模块以多个第二向量分别为行向量,组合得到第二矩阵,第一向量和第二向量具有相同的维度;并且交互注意力模块将第二矩阵与第一矩阵相乘,得到第三矩阵,对第三矩阵按列求和得到第一权重向量,对第三矩阵按行求和得到第二权重向量。
可选地,第一权重向量的多个元素分别为多个第一向量对应的权重;并且第二权重向量的多个元素分别为多个第二向量对应的权重。
可选地,第一向量是合同内部元素的向量表示;并且/或者第二向量是合同外部元素的向量表示;并且/或者卷积操作为宽卷积操作;并且/或者池化操作为基于注意力的平均池化操作。
可选地,分类模块包括softmax层。
可选地,合同外部元素包括合同当事方的信息和/或合同当事方的关联方的信息。
可选地,合同外部元素包括通过数据授权和/或通过爬虫方式获得的合同当事方和/或关联方的信息;并且/或者合同外部元素包括合同当事方和/或关联方的下述至少一项信息:基本信息、法律诉讼相关数据、经营状况、经营风险、知识产权。
可选地,每一方的信息分别作为一个合同外部元素。
可选地,基于合同当事方和关联方的关联关系,以合同当事方为顶节点,关联方为邻节点,构成图结构,第二注意力模块基于图注意力机制对合同外部元素进行处理,得到相应的第二特征向量。
可选地,第二注意力模块基于自注意力机制,将合同当事方的信息汇总到顶节点上;并且/或者第二注意力模块基于掩码注意力机制,仅考虑合同当事方的直接关联方,将合同当事方的直接关联方的信息汇总到顶节点的一级邻节点上。
可选地,第二注意力模块基于自注意力机制,计算顶节点的注意力权重;并且/或者第二注意力模块基于掩码注意力机制,计算顶节点的一级邻节点注意力权重。
可选地,合同内部元素包括合同基本信息和/或合同内部风险特征;并且/或者合同内部元素包括人工从合同文本中抽取的元素和/或通过自然语言处理从合同文本中抽取的元素。
可选地,该方法还可以包括:使用已正常履约的合同文本和未正常履约的合同文本为训练样本,对合同风险预测模型进行训练。
可选地,合同风险预测模型用于预测合同后期被终止的风险,以先前被终止的合同文本为正样本,以正常履约完成的合同文本作为负样本。
可选地,合同风险预测模型用于预测合同后期发生法律诉讼的风险,以先前发生合同法律纠纷的合同为正样本,以正常履约完成未发生合同法律纠纷的合同作为负样本。
可选地,该方法还可以包括:从法院裁判文书网获取合同法律纠纷的裁判文书;从裁判文书中解析得到合同信息;以及基于合同信息获取对应的合同文本,作为正样本。
根据本公开的第二个方面,提供了一种合同风险预测模型训练方法,包括:获取未正常履约的合同文本,作为正样本;获取正常履约的合同文本,作为负样本;以及使用正样本和负样本对合同风险预测模型进行训练。合同风险预测模型包括:第一注意力模块,基于注意力机制对合同内部元素进行处理,得到相应的第一特征向量;第二注意力模块,基于注意力机制对合同外部元素进行处理,得到相应的第二特征向量;融合模块,融合第一特征向量和第二特征向量,得到第三特征向量;以及分类模块,基于第三特征向量进行分类处理,得到合同风险预测结果。
根据本公开的第三个方面,提供了一种合同风险预测装置,包括:第一获取装置,获取从合同文本中提取的合同内部元素;第二获取装置,获取与合同当事方有关的合同外部元素;以及风险预测装置,将合同内部元素和合同外部元素输入训练好的合同风险预测模型,得到合同风险预测结果。其中,合同风险预测模型包括:第一注意力模块,基于注意力机制对合同内部元素进行处理,得到相应的第一特征向量;第二注意力模块,基于注意力机制对合同外部元素进行处理,得到相应的第二特征向量;融合模块,融合第一特征向量和第二特征向量,得到第三特征向量;以及分类模块,基于第三特征向量进行分类处理,得到合同风险预测结果。
根据本公开的第四个方面,提供了一种计算设备,包括:处理器;以及存储器,其上存储有可执行代码,当可执行代码被处理器执行时,使处理器执行如上述第一或第二个方面所述的方法。
根据本公开的第五个方面,提供了一种非暂时性机器可读存储介质,其上存储有可执行代码,当可执行代码被电子设备的处理器执行时,使处理器执行如上述第一或第二个方面所述的方法。
由此,能够基于合同文本内部信息和合同文本外部的企业信息,对合同文本中潜在的风险进行预测。
附图说明
通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
图1示意性地示出了根据本公开的合同风险预测方案。
图2示出了根据本公开的合同风险预测方法的流程图。
图3示意性地示出了根据本公开的预测方案可以使用的合同风险预测模型的示意性框图。
图4示意性地示出了合同风险预测模型各阶段处理的数据。
图5示出了基于图结构进行处理的示意图。
图6示出了可以用于实施根据本公开的上述合同风险预测方法的合同风险预测装置。
图7示出了根据本发明一实施例可用于实现上述合同风险预测方法的计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本公开提出了一种合同风险预测方案。
图1示意性地示出了根据本公开的合同风险预测方案。
图2示出了根据本公开的合同风险预测方法的流程图。
如图1和2所示,在步骤S210,获取从合同文本110中提取的合同内部元素115。
合同内部元素115可以包括人工从合同文本110中抽取的元素。
另外,合同内部元素115也可以包括通过字段抽取、一致性比对等自然语言处理(NLP)的规则或者算法从合同文本110中抽取的元素。从文本中抽取元素的技术方案已为本领域所公知,在此不再赘述。
另外,合同内部元素115可以包括合同基本信息,也可以合同内部风险特征。
1)合同文档内部的合同基本信息:
合同文档110本身内部的合同基本信息例如可以包括签署合同的当事方(公司或个人)名称、公司法人、标的物、合同类型、生效时间、合同期限、合同金额、定金数额等等。
这些合同基本信息本身可能并不存在风险,但是可以在后面用来与外部信息做匹配,生成风险特征。
2)合同内部风险特征:
对合同内部风险特征的抽取可以包括形式审查和实质审查两方面。
这些特征是指能从合同文档110内部抽取出的风险要素。例如名称、地址等是否前后冲突,合同条款是否完善,内容是否合法,条款是否公平,合同履行方式、费用是否约定明确,违约责任(包括定金、预付款、违约金、损失赔偿等)是否明确,有无仲裁条款等等。这些风险元素可以通过字段抽取、一致性比对等自然语言处理(NLP)的规则或者算法来从合同中识别出来。
在步骤S220,获取与合同当事方有关的合同外部元素125。
合同外部元素125可以包括合同当事方的信息,也可以包括合同当事方的关联方的信息。
合同当事方是指参与合同约定签署的一方或两方,在一些情况下可以为多方。
一些情况下,可以包括参与合同约定签署的所有各方。另一些情况下,在参与合同约定签署的一方希望预测合同风险时,可以仅包括除该方之外的另一方或其他各方。
另外,在自动处理的场景下,还可以从合同文本110中识别合同当事方1,然后基于各种公开的企业信息网等数据库,识别关联方,获取当事方和各关联方的相关信息。换言之,用户只需要提供合同文本110,本公开的合同风险预测方案也可以自动识别合同当事方,基于外部信息源自动识别关联方,并自动获取当事方和关联方的各种相关信息,以作为合同外部元素。
如图1所示,可以从各种外部信息源120获取合同外部元素125。
当事方1可以具有关联方,例如关联方1、关联方2、关联方3。两方具有关联关系例如可以是指双方具有股权投资关系、子公司关系、共同高管关系。
另外,关联方还可以具有其它关联方,例如如图1所示,关联方2和3还与关联方5相关联。
这里可以将直接与当事方1相关联的关联方称为“一级关联方”,经由某关联方具有间接关联关系的关联方称为“二级关联方”、“三级关联方”……,以此类推。
这样,基于合同当事方和关联方的关联关系,可以以合同当事方为顶节点,关联方为邻节点,构成图结构。
当事方1或各关联方2、3、4等的信息例如可以包括规模、行业、执照等等。
合同外部元素125可以包括通过数据授权和/或通过爬虫方式(从各种公开的企业信息网)获得的合同当事方和/或关联方的信息。
合同外部元素125可以包括合同当事方和/或关联方各自的下述至少一项信息:
基本信息:包括公司规模、所属行业、营业执照、法人、高管、子公司等。
法律诉讼相关数据:包括被执行记录、失信记录、法院公告、政务处罚、开庭公告、司法拍卖、裁判文书纠纷等。
经营状况:包括经营许可、税务信用、信用评级、招投标信息、财报公告等
经营风险:经营异常、动产抵押、欠税公告、清算信息、股权质押、股权冻结、处罚等。
知识产权:包括商标、专利、证书、品牌、著作权、网站信息等。
在后续的数据处理中,可以将每一方的信息分别作为一个合同外部元素。
在步骤S230,将合同内部元素和合同外部元素输入训练好的合同风险预测模型130,得到合同风险预测结果。
合同风险预测模型130基于注意力机制,结合合同内部元素115和合同外部元素125,进行预测,得到合同风险预测结果140。注意力机制(Attention),通俗地说就是将注意力集中放在重要的点上,而忽略其它不重要的因素。
于是,可以在步骤S240,输出合同风险预测结果140。
合同风险预测模型130可以用于预测各种合同风险,例如可以用于预测合同后期被终止的风险,也可以用于预测合同后期发生法律诉讼的风险下面详细描述本公开的预测方案可以使用的合同风险预测模型130。
图3示意性地示出了根据本公开的预测方案可以使用的合同风险预测模型130的示意性框图。
图4示意性地示出了合同风险预测模型130各阶段处理的数据。
如图3所示,合同风险预测模型可以包括第一注意力模块310、第二注意力模块320、融合模块340和分类模块350。
合同文本的局部信息中整理出来的要素和特征之间可能存在一些内部的关联。其中一部分关联特征已经在数据准备阶段(步骤S210或之前)的“合同文档内部风险特征抽取”这个工作中进行了人工或自动预抽取。
但是,还有一些深层次的交互信息人工难以抽取完备。
因此,需要利用一个局部注意力模块(第一注意力模块)来学习合同文档内部信息的交互,让模型了解到底哪些合同文档内部特征对于风险预测是最重要的。
图4中,为了简化流程表示,没有直接使用局部注意力模块,而是直接使用了宽CNN(卷积神经网络)卷积层来进行局部交互信息的抽象表达。通过宽CNN能够将相邻的若干特征向量进行融合学习,从而获得较深层次的信息。
第一注意力模块310基于注意力机制对合同内部元素115进行处理,得到相应的第一特征向量414。
具体说来,参考图4,第一注意力模块310可以基于注意力机制执行下述操作。
将多个合同内部元素115转化为对应的多个第一向量。这里,第一向量可以作为合同内部元素的向量表示,图4中为构成矩阵410的行向量。
组合多个第一向量得到第一矩阵410。
对第一矩阵410进行卷积操作,得到卷积结果,即矩阵412。
基于矩阵412进行池化操作,得到第一特征向量414。
优选地,卷积操作可以为宽卷积操作。
优选地,池化操作为基于注意力的平均池化操作。
第一注意力模块310对合同内部元素(内部信息、局部信息)进行处理,也可以称为“局部注意力模块”,其所采用的注意力机制可以为“局部注意力机制”。
另一方面,第二注意力模块320基于注意力机制对合同外部元素125进行处理,得到相应的第二特征向量424。
具体说来,参考图4,第二注意力模块可以基于注意力机制执行下述操作。
将多个合同外部元素转化为对应的多个第二向量。这里,第二向量可以作为合同外部元素的向量表示,图4中为构成矩阵420的列向量。第一向量和第二向量可以具有相同的维度。
组合多个第二向量得到第二矩阵420。
对第二矩阵进行卷积操作,得到卷积结果,即矩阵422。
基于矩阵422进行池化操作,得到第二特征向量424。
优选地,卷积操作可以为宽卷积操作。
优选地,池化操作为基于注意力的平均池化操作。
第二注意力模块320对合同外部元素(外部信息、全局信息)进行处理,也可以称为“全局注意力模块”,其所采用的注意力机制可以为“全局注意力机制”。
另外,与合同内部元素115不同,如上文所述,基于合同当事方1和关联方(2、3、4、5)的关联关系,可以以合同当事方1为顶节点,关联方(2、3、4、5)为邻节点,构成图结构。
第二注意力模块320可以基于图注意力机制(graphattention)对合同外部元素进行处理,得到相应的第二特征向量。
如上所述,企业外部信息中也需要利用额外的全局注意力模块(第二注意力模块)来学习外部特征中的交互关系。
具体地,全局注意力模块还可以进一步细分为单个企业(当事方)内要素特征之间的自注意力机制以及企业与企业之间的图注意力机制。
企业内要素特征之间的注意力机制的工作类似于上文局部注意力机制的工作,是用来学习单个企业本身要素特征之间的交互信息的。
在图4中,也使用了卷积层来代替表示这一部分企业内局部信息的注意力。
另一方面,邻居节点(关联方)的企业信息对于当前合同纠纷风险的判断也是有帮助的,比如当前企业(当事方)的邻居节点(关联方)都是失信黑名单中的企业的话,当前合同纠纷风险的概率也会增大。
我们使用掩码注意力机制(mask attention)的方法,使得图结构可以注入到注意力机制中——只对顶点(合同当事方)的一部分邻居(关联方,最简单的是只计算一阶邻居)计算注意力权重。
在做节点信息聚集(aggregate)的过程中,一个节点的邻节点是无序的。而注意力机制刚好又非常适合做信息聚集操作。
另外,企业(当事方)本身的信息也同时通过自注意力操作一同汇总到当前企业节点上来。
图5示出了基于图结构进行处理的示意图。
第二注意力模块320可以基于自注意力机制(self attention),将合同当事方1的信息汇总到顶节点上,通过处理可以得到合同当事方1的合同外部元素的向量表示(例如,可以作为相应的第二向量或用于计算相应的第二向量)。
另一方面,第二注意力模块320可以基于掩码注意力机制(mask attention),仅考虑合同当事方1的直接关联方(2、3、4),而不考虑间接关联方(关联方5),将合同当事方1的直接关联方(2、3、4)的信息汇总到顶节点的一级邻节点上,通过处理可以得到合同当事方1的直接关联方(2、3、4)的合同外部元素的向量表示(例如,可以作为相应的第二向量或用于计算相应的第二向量)。
另外,如图3所示,为了进一步增强对合同内部元素和合同外部元素的结合分析,合同风险预测模型130还可以包括交互注意力模块330。
这样,合同文档内部以及额外企业信息之间还利用了一个交互注意力模块330,来学习合同内外部信息(元素)之间的关联。
例如,合同涉及金额一亿元(合同内部元素),而企业本身的资金只有两亿(合同外部元素),当前合同占企业资本超过了50%,这是非常危险的。
又例如,合同约定若公司累计亏损达100万元,则触发特别条款(合同内部元素),而企业的合同外部信息显示,企业当前累计亏损已达200万元(合同外部元素),企业亏损超过合同中约定的特别条款上线,存在严重风险。
再例如,一份合同涉及的标的物是奶粉(合同内部元素),而通过企业外部信息查询发现当前企业都没有食品局的许可证(合同外部元素),那么这份合同就存在很大的风险。
诸如此类的内外部信息还有很多,就需要这个交互注意力模块330来学习和预测。
具体地,在图4中,我们利用前面图注意力机制汇总过后的当前企业特征向量(第二向量)与合同文档内部向量(第一向量)进行交互注意力。
如果合同文档内部向量有6行,而企业特征向量有4列的话,中间的交互注意力矩阵(第三矩阵)430的大小就是6×4。
计算完该矩阵,需要通过如图4中的按行求和(row-wise sum)和按列求和(col-wise sum)等操作,分别为合同内部特征向量和企业外部特征向量矩阵计算两个注意力权重向量,即第一权重向量432和第二权重向量434。得到的两个权重向量中的每个元素分别代表了相应特征在做平均池化时的权重。
因此,这里不再是简单的平均池化,而是根据计算出的注意力权重向量计算。
在图4中为了简化示意,在基于注意力的平均池化(Attention-based AveragePooling)之后的列直接为1。
实际操作中可以多加几层卷积和池化层。
具体说来,如图4所示,交互注意力模块330可以基于交互注意力机制,结合第一矩阵410和第二矩阵420,得到用于第一注意力模块310的第一权重向量432和用于第二注意力模块320的第二权重向量434。
这里,可以通过将第一矩阵410和第二矩阵420相乘,得到第三矩阵430,对第三矩阵分别进行按行求和操作和按列求和操作,得到第一权重向量432和第二权重向量434。
这里,“按行求和”是指将矩阵的一行中所有元素求和,得到结果向量的一个元素。每行元素分别求和,得到结果向量的各个元素。结果向量的维度与矩阵的行数相同。
“按列求和”是指将矩阵的一列中所有元素求和,得到结果向量的一个元素。每列元素分别求和,得到结果向量的各个元素。结果向量的维度与矩阵的列数相同。
在图4所示的实施例中,第一注意力模块310以多个第一向量分别为行向量,组合得到第一矩阵410。
例如,m个合同内部元素的情况下,可以得到m个第一向量。若每个向量的维度为r,则第一矩阵410为m×r矩阵。
第二注意力模块320以多个第二向量分别为列向量,组合得到第二矩阵420。
例如,n个合同外部元素(例如,所考虑的当事方和关联方的数量为n)的情况下,可以得到n个第二向量。第一向量和第二向量可以具有相同的维度。即,每个第二向量的维度也为r,则第二矩阵420为r×n矩阵。
交互注意力模块将第一矩阵410与第二矩阵420相乘,得到第三矩阵430。第三矩阵430为m×n矩阵。
对第三矩阵430按行求和得到第一权重向量432(m维)。对第三矩阵430按列求和得到第二权重向量434(n维)。
或者,第一矩阵410和第二矩阵420的行列组合方式可以互换。
具体说来,第一注意力模块310以多个第一向量分别为列向量,组合得到第一矩阵410。
第二注意力模块320以多个第二向量分别为行向量,组合得到第二矩阵420。
交互注意力模块330将第二矩阵420与第一矩阵410相乘,得到第三矩阵430。对第三矩阵430按列求和得到第一权重向量432,对第三矩阵430按行求和得到第二权重向量434。
这里,第一权重向量432的多个元素可以分别作为多个第一向量对应的权重,第二权重向量434的多个元素可以分别作为多个第二向量对应的权重。
在上述池化操作中,第一注意力模块310可以根据第一权重向量432对卷积结果即矩阵412进行池化操作得到第一特征向量414。
同样地,第二注意力模块320可以根据第二权重向量434对卷积结果即矩阵422进行池化操作得到第二特征向量。
这样,融合模块340可以融合第一特征向量414和第二特征向量424,得到第三特征向量440。
一种融合方式是拼接第一特征向量414和第二特征向量424,得到第三特征向量440。其它各种特征融合方式同样可以应用于本公开的预测方案。
这样,将池化之后的合同内部特征(第一特征向量414)和合同外部涉及企业的特征(第二特征向量424)进行拼接等操作,得到融合的特征(Features)层。
分类模块350基于第三特征向量440进行分类处理,得到所述合同风险预测结果450。
分类模块350可以是包括softmax层。
由此,输出层可以直接通过softmax输出当前合同是否有风险(0/1)或发生风险事件的几率。
至此,已经对本公开的预测方案所使用的合同风险预测模型进行了详细的描述。
下面,进一步描述可以用于该合同风险预测模型的训练方案。
这里,可以使用已正常履约的合同文本和未正常履约的合同文本为训练样本,对所述合同风险预测模型进行训练。
首先,需要准备的是用于模型预测的正负合同样本。针对不同的风险预测类型,正负样本的准备是不一样的。
对于专业的合同服务商,可能会有较多不同公司的合同文本可以用作样本。而对于具体的公司/企业,一般来说只有本公司/企业先前签署的合同文本。
如果合同风险预测模型用于预测合同后期被终止的风险,则可以以先前被终止的合同文本为正样本,以正常履约完成的合同文本作为负样本。
如果合同风险预测模型用于预测合同后期发生法律诉讼的风险,则可以以合同当事方先前发生合同法律纠纷的合同为正样本,以合同当事方正常履约完成未发生合同法律纠纷的合同作为负样本。
可以从法院裁判文书网或其它各种法院裁判文件来源获取合同法律纠纷的裁判文书。
如果是专业的合同服务商,可以查找自己所掌握的合同文本的当事方所涉及的合同法律纠纷的裁判文书。例如,如果合同服务商为企业A、B、C提供了合同相关服务,拥有这些企业的合同文本,那么可以获取这些企业A、B、C所涉及的合同法律纠纷的裁判文书。然后,在法律或授权条款允许的前提下,以这些裁判文书所涉及的合同文本作为样本,进行分析。
对于某个企业、公司或个人,例如其自己进行合同风险预测,或者第三方专门为该企业、公司或个人进行合同风险预测,由于只拥有该企业、公司或个人本身自有的合同文本,所以可以仅获取该企业、公司或个人所涉及的合同法律纠纷的裁判文书。
在获得这些裁判文书之后,可以从裁判文书中解析得到合同信息,例如合同名称、合同编号等。
然后,基于合同信息,进行还原查找,获取对应的合同文本,作为所述正样本。
不涉及合同法律纠纷的其它合同文本可以作为负样本。
获得正负样本之后,一方面可以从样本合同文本中提取内部合同内部元素,另一方面,可以进一步获得样本合同文本的相关当事方及关联方的信息,从而获取合同外部元素。
由此,可以对合同风险预测模型进行训练,得到训练好的合同风险预测模型,以用于后期的合同风险预测。
另外,后期的合同风险预测的结果和实际是否出现相应风险的反馈信息比对,还可以进一步训练合同风险预测模型。
除了上述合同后期被终止的风险、合同后期发生法律诉讼的风险,根据同样的原理,可以对各种可能的合同风险进行预测。
相应地,可以针对各种风险,分别训练合同风险预测模型。
或者,也可以针对各种模型统一训练一个综合的合同风险预测模型,用于对各种风险均予以预测。
图6示出了可以用于实施根据本公开的上述合同风险预测方法的合同风险预测装置。
如图6所示,合同风险预测装置可以包括第一获取装置610、第二获取装置620和风险预测装置630。
第一获取装置610获取从合同文本110中提取的合同内部元素115。
第二获取装置620获取与合同当事方有关的合同外部元素125。
风险预测装置630将合同内部元素115和合同外部元素125输入训练好的合同风险预测模型130,得到合同风险预测结果450。
另外,该合同风险预测装置还可以包括输出装置640,用于输出合同风险预测结果450。
这里,合同内部元素115、合同外部元素125以及合同风险预测模型130的各种细节可以与上文参考图1至5描述的内容相同,在此不再赘述。
本公开创造性地提出了将合同原文和外部企业信息进行融合学习的方案,可以同时利用合同文档本身内部信息、企业外部信息以及关联企业信息综合判断合同纠纷风险。
在优选实施例中,提出一种有效的训练样本构造方案,通过利用裁判文书解析的方法,将合同纠纷风险预测转换为有监督二分类问题。
在优选实施例中,提出了一种多重注意力机制,能够有效提升具有外部知识库引入的情况下的文本分类准确率(本方案中为预测一段合同文本是否有风险)。可以首先利用局部注意力模块将文本本身特征进行抽象,然后利用全局注意力模块将外部知识库特征进行汇总,最后利用交互注意力模块将文本和外部知识库信息进行交叉融合。
在优选实施例中,提出先利用图注意力机制将邻居企业(关联方)的信息汇总到当前企业(合同当事方)获得关联特征之后,再与文档内部特征进行融合学习的方案,从而实现了端到端的内外部信息融合学习的方案。
针对难以明确到底哪些风险会最终导致合同终止或引起纠纷,本公开优选实施例采用了基于局部注意力机制或者宽CNN的方案,能够将相邻的若干特征向量进行融合学习,能够将导致合同纠纷的重要特征权重增强。
针对企业的关联信息很难反馈到当前合同上,导致审查信息遗漏的问题,本公开优选实施例提出利用全局图注意力的方案,首先构建企业关联图谱,然后将当前企业节点的邻居节点信息通过注意力机制的方式汇聚到当前节点,作为当前企业节点的全局信息,从而将企业本身以及关联企业信息进行的高效的融合。
针对缺乏内部信息和外部信息的关联分析的问题,本公开优选实施例中提出了一种使用交互注意力机制的方案,通过加入内外部特征交互注意力矩阵,能够自动学习什么类型的外部特征与内部特征融合方式最有价值。
图7示出了根据本发明一实施例可用于实现上述合同风险预测方法的计算设备的结构示意图。
参见图7,计算设备700包括存储器710和处理器720。
处理器720可以是一个多核的处理器,也可以包含多个处理器。在一些实施例中,处理器720可以包含一个通用的主处理器以及一个或多个特殊的协处理器,例如图形处理器(GPU)、数字信号处理器(DSP)等等。在一些实施例中,处理器720可以使用定制的电路实现,例如特定用途集成电路(ASIC,Application Specific Integrated Circuit)或者现场可编程逻辑门阵列(FPGA,Field Programmable Gate Arrays)。
存储器710可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM),和永久存储装置。其中,ROM可以存储处理器720或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器710可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器710可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM,双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等等)、磁性软盘等等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
存储器710上存储有可执行代码,当可执行代码被处理器720处理时,可以使处理器720执行上文述及的合同风险预测方法。
上文中已经参考附图详细描述了根据本发明的合同风险预测方案。
此外,根据本发明的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本发明的上述方法中限定的上述各步骤的计算机程序代码指令。
或者,本发明还可以实施为一种非暂时性机器可读存储介质(或计算机可读存储介质、或机器可读存储介质),其上存储有可执行代码(或计算机程序、或计算机指令代码),当所述可执行代码(或计算机程序、或计算机指令代码)被电子设备(或计算设备、服务器等)的处理器执行时,使所述处理器执行根据本发明的上述方法的各个步骤。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。
附图中的流程图和框图显示了根据本发明的多个实施例的系统和方法的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标记的功能也可以以不同于附图中所标记的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (22)
1.一种合同风险预测方法,包括:
获取从合同文本中提取的合同内部元素;
获取与合同当事方有关的合同外部元素;以及
将合同内部元素和合同外部元素输入训练好的合同风险预测模型,得到合同风险预测结果,其中,合同风险预测模型包括:
第一注意力模块,基于注意力机制对合同内部元素进行处理,得到相应的第一特征向量;
第二注意力模块,基于注意力机制对合同外部元素进行处理,得到相应的第二特征向量;
融合模块,融合第一特征向量和第二特征向量,得到第三特征向量;以及
分类模块,基于第三特征向量进行分类处理,得到所述合同风险预测结果。
2.根据权利要求1所述的方法,其中,
第一注意力模块基于注意力机制执行下述操作:
将多个合同内部元素转化为对应的多个第一向量;
组合多个第一向量得到第一矩阵;以及
对第一矩阵进行卷积操作和池化操作,得到第一特征向量,
并且/或者,
第二注意力模块基于注意力机制执行下述操作:
将多个合同外部元素转化为对应的多个第二向量;
组合多个第二向量得到第二矩阵;以及
对第二矩阵进行卷积操作和池化操作,得到第二特征向量。
3.根据权利要求2所述的方法,其中,所述合同风险预测模型还包括:
交互注意力模块,基于交互注意力机制,结合第一矩阵和第二矩阵,得到用于第一注意力模块的第一权重向量和用于第二注意力模块的第二权重向量,
其中,第一注意力模块根据第一权重向量对卷积结果进行池化操作得到第一特征向量,
第二注意力模块根据第二权重向量对卷积结果进行池化操作得到第二特征向量。
4.根据权利要求3所述的方法,其中,
第一注意力模块以多个第一向量分别为行向量,组合得到第一矩阵;
第二注意力模块以多个第二向量分别为列向量,组合得到第二矩阵,第一向量和第二向量具有相同的维度;并且
交互注意力模块将第一矩阵与第二矩阵相乘,得到第三矩阵,对第三矩阵按行求和得到第一权重向量,对第三矩阵按列求和得到第二权重向量,
或者,
第一注意力模块以多个第一向量分别为列向量,组合得到第一矩阵;
第二注意力模块以多个第二向量分别为行向量,组合得到第二矩阵,第一向量和第二向量具有相同的维度;并且
交互注意力模块将第二矩阵与第一矩阵相乘,得到第三矩阵,对第三矩阵按列求和得到第一权重向量,对第三矩阵按行求和得到第二权重向量。
5.根据权利要求3所述的方法,其中,
第一权重向量的多个元素分别为多个第一向量对应的权重;并且
第二权重向量的多个元素分别为多个第二向量对应的权重。
6.根据权利要求2所述的方法,其中,
第一向量是合同内部元素的向量表示;并且/或者
第二向量是合同外部元素的向量表示;并且/或者
所述卷积操作为宽卷积操作;并且/或者
所述池化操作为基于注意力的平均池化操作。
7.根据权利要求1所述的方法,其中,所述分类模块包括softmax层。
8.根据权利要求1所述的方法,其中,
合同外部元素包括合同当事方的信息和/或合同当事方的关联方的信息。
9.根据权利要求8所述的方法,其中,
合同外部元素包括通过数据授权和/或通过爬虫方式获得的合同当事方和/或关联方的信息;并且/或者
合同外部元素包括合同当事方和/或关联方的下述至少一项信息:基本信息、法律诉讼相关数据、经营状况、经营风险、知识产权。
10.根据权利要求8所述的方法,其中,
每一方的信息分别作为一个合同外部元素。
11.根据权利要求8所述的方法,其中,
基于合同当事方和关联方的关联关系,以合同当事方为顶节点,关联方为邻节点,构成图结构,
第二注意力模块基于图注意力机制对合同外部元素进行处理,得到相应的第二特征向量。
12.根据权利要求11所述的方法,其中,
第二注意力模块基于自注意力机制,将合同当事方的信息汇总到顶节点上;并且/或者
第二注意力模块基于掩码注意力机制,仅考虑合同当事方的直接关联方,将合同当事方的直接关联方的信息汇总到顶节点的一级邻节点上。
13.根据权利要求12所述的方法,其中,
第二注意力模块基于自注意力机制,计算顶节点的注意力权重;并且/或者
第二注意力模块基于掩码注意力机制,计算顶节点的一级邻节点注意力权重。
14.根据权利要求1所述的方法,其中,
合同内部元素包括合同基本信息和/或合同内部风险特征;并且/或者
合同内部元素包括人工从合同文本中抽取的元素和/或通过自然语言处理从合同文本中抽取的元素。
15.根据权利要求1至14中任何一项所述的方法,还包括:
使用已正常履约的合同文本和未正常履约的合同文本为训练样本,对所述合同风险预测模型进行训练。
16.根据权利要求15所述的方法,其中,
所述合同风险预测模型用于预测合同后期被终止的风险,以先前被终止的合同文本为正样本,以正常履约完成的合同文本作为负样本。
17.根据权利要求15所述的方法,其中,
所述合同风险预测模型用于预测合同后期发生法律诉讼的风险,以先前发生合同法律纠纷的合同为正样本,以正常履约完成未发生合同法律纠纷的合同作为负样本。
18.根据权利要求17所述的方法,还包括:
从法院裁判文书网获取合同法律纠纷的裁判文书;
从所述裁判文书中解析得到合同信息;以及
基于合同信息获取对应的合同文本,作为所述正样本。
19.一种合同风险预测模型训练方法,包括:
获取未正常履约的合同文本,作为正样本;
获取正常履约的合同文本,作为负样本;以及
使用所述正样本和负样本对合同风险预测模型进行训练,所述合同风险预测模型包括:
第一注意力模块,基于注意力机制对合同内部元素进行处理,得到相应的第一特征向量;
第二注意力模块,基于注意力机制对合同外部元素进行处理,得到相应的第二特征向量;
融合模块,融合第一特征向量和第二特征向量,得到第三特征向量;以及
分类模块,基于第三特征向量进行分类处理,得到所述合同风险预测结果。
20.一种合同风险预测装置,包括:
第一获取装置,获取从合同文本中提取的合同内部元素;
第二获取装置,获取与合同当事方有关的合同外部元素;以及
风险预测装置,将合同内部元素和合同外部元素输入训练好的合同风险预测模型,得到合同风险预测结果,其中,合同风险预测模型包括:
第一注意力模块,基于注意力机制对合同内部元素进行处理,得到相应的第一特征向量;
第二注意力模块,基于注意力机制对合同外部元素进行处理,得到相应的第二特征向量;
融合模块,融合第一特征向量和第二特征向量,得到第三特征向量;以及
分类模块,基于第三特征向量进行分类处理,得到所述合同风险预测结果。
21.一种计算设备,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1至19中任何一项所述的方法。
22.一种非暂时性机器可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1至19中任何一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010246086.1A CN113469479B (zh) | 2020-03-31 | 2020-03-31 | 合同风险预测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010246086.1A CN113469479B (zh) | 2020-03-31 | 2020-03-31 | 合同风险预测方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113469479A true CN113469479A (zh) | 2021-10-01 |
CN113469479B CN113469479B (zh) | 2024-10-18 |
Family
ID=77865704
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010246086.1A Active CN113469479B (zh) | 2020-03-31 | 2020-03-31 | 合同风险预测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113469479B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115271553A (zh) * | 2022-09-27 | 2022-11-01 | 湖南华菱电子商务有限公司 | 基于大数据的合同管理方法、装置、电子设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109241284A (zh) * | 2018-08-27 | 2019-01-18 | 中国人民解放军国防科技大学 | 一种文档分类方法及装置 |
CN109299262A (zh) * | 2018-10-09 | 2019-02-01 | 中山大学 | 一种融合多粒度信息的文本蕴含关系识别方法 |
CN109408823A (zh) * | 2018-10-31 | 2019-03-01 | 华南师范大学 | 一种基于多通道模型的特定目标情感分析方法 |
CN109885670A (zh) * | 2019-02-13 | 2019-06-14 | 北京航空航天大学 | 一种面向话题文本的交互注意力编码情感分析方法 |
CN110533322A (zh) * | 2019-08-29 | 2019-12-03 | 欧冶国际电商有限公司 | 国际贸易合同风险预警方法、装置及存储介质 |
CN110597991A (zh) * | 2019-09-10 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 文本分类方法、装置、计算机设备及存储介质 |
CN110705265A (zh) * | 2019-08-27 | 2020-01-17 | 阿里巴巴集团控股有限公司 | 合同条款风险识别方法以及装置 |
CN110826336A (zh) * | 2019-09-18 | 2020-02-21 | 华南师范大学 | 一种情感分类方法、系统、存储介质及设备 |
CN110888980A (zh) * | 2019-10-10 | 2020-03-17 | 天津大学 | 基于知识增强的注意力神经网络的隐式篇章关系识别方法 |
-
2020
- 2020-03-31 CN CN202010246086.1A patent/CN113469479B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109241284A (zh) * | 2018-08-27 | 2019-01-18 | 中国人民解放军国防科技大学 | 一种文档分类方法及装置 |
CN109299262A (zh) * | 2018-10-09 | 2019-02-01 | 中山大学 | 一种融合多粒度信息的文本蕴含关系识别方法 |
CN109408823A (zh) * | 2018-10-31 | 2019-03-01 | 华南师范大学 | 一种基于多通道模型的特定目标情感分析方法 |
CN109885670A (zh) * | 2019-02-13 | 2019-06-14 | 北京航空航天大学 | 一种面向话题文本的交互注意力编码情感分析方法 |
CN110705265A (zh) * | 2019-08-27 | 2020-01-17 | 阿里巴巴集团控股有限公司 | 合同条款风险识别方法以及装置 |
CN110533322A (zh) * | 2019-08-29 | 2019-12-03 | 欧冶国际电商有限公司 | 国际贸易合同风险预警方法、装置及存储介质 |
CN110597991A (zh) * | 2019-09-10 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 文本分类方法、装置、计算机设备及存储介质 |
CN110826336A (zh) * | 2019-09-18 | 2020-02-21 | 华南师范大学 | 一种情感分类方法、系统、存储介质及设备 |
CN110888980A (zh) * | 2019-10-10 | 2020-03-17 | 天津大学 | 基于知识增强的注意力神经网络的隐式篇章关系识别方法 |
Non-Patent Citations (2)
Title |
---|
DEHONG MA等: ""Interactive Attention Networks for Aspect-Level Sentiment Classification"", ARXIV PREPRINT ARXIV.1709.00893, pages 1 - 7 * |
韩虎等: ""用于特定目标情感分析的交互注意力网络模型"", 《计算机工程与应用》, vol. 56, no. 18, pages 104 - 110 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115271553A (zh) * | 2022-09-27 | 2022-11-01 | 湖南华菱电子商务有限公司 | 基于大数据的合同管理方法、装置、电子设备及存储介质 |
CN115271553B (zh) * | 2022-09-27 | 2023-01-20 | 湖南华菱电子商务有限公司 | 基于大数据的合同管理方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113469479B (zh) | 2024-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cohney et al. | Transactional scripts in contract stacks | |
Mehta et al. | Decentralised image sharing and copyright protection using blockchain and perceptual hashes | |
CN111008709A (zh) | 联邦学习、资料风险评估方法、装置和系统 | |
CN110781299A (zh) | 资产信息识别方法、装置、计算机设备及存储介质 | |
US10579651B1 (en) | Method, system, and program for evaluating intellectual property right | |
WO2010042936A1 (en) | Continuous measurement of the quality of data and processes used to value structured derivative information products | |
Caviggioli et al. | Corporate strategies for technology acquisition: Evidence from patent transactions | |
CN111400392A (zh) | 多源异构数据处理方法及装置 | |
WO2020063524A1 (zh) | 一种法律文书的确定方法及系统 | |
CN113626618B (zh) | 基于跨篇章事件提取的案件串联方法、装置及相关组件 | |
CN116342141A (zh) | 一种空壳企业识别方法、装置和设备 | |
CN115828242A (zh) | 基于大型异构图表示学习的安卓恶意软件检测方法 | |
CN116189215A (zh) | 自动审核方法、装置、电子设备及存储介质 | |
CN113469479B (zh) | 合同风险预测方法和装置 | |
Khati et al. | Non-fungible tokens applications: A systematic mapping review of academic research | |
Kejriwal | On using centrality to understand importance of entities in the Panama Papers | |
CN116739795A (zh) | 基于知识图谱的保险风险评估方法、装置和电子设备 | |
Kunjumon et al. | Implementing a land registration system using non-fungible tokens to represent land in the system and side-chain for data storage | |
CN110309313B (zh) | 生成事件转移图谱的方法及装置 | |
WO2021063072A1 (zh) | 甄别虚假诉讼的方法、装置、存储介质及设备 | |
CN112597390A (zh) | 基于数字金融的区块链大数据处理方法及大数据服务器 | |
Abdurakhmanova | Issues of regulation and implementation of smart contracts in national legislation | |
CN112581323A (zh) | 虚假诉讼的判断方法及装置 | |
CN112559669B (zh) | 法院观点信息结构化的方法、装置、存储介质和电子设备 | |
CN116383883B (zh) | 一种基于大数据的数据管理权限处理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |