CN114239561A - 供应关系获取方法、装置、存储介质及电子设备 - Google Patents
供应关系获取方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN114239561A CN114239561A CN202111508944.6A CN202111508944A CN114239561A CN 114239561 A CN114239561 A CN 114239561A CN 202111508944 A CN202111508944 A CN 202111508944A CN 114239561 A CN114239561 A CN 114239561A
- Authority
- CN
- China
- Prior art keywords
- party
- determining
- entity
- referee document
- identity information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 230000014509 gene expression Effects 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 19
- 210000001072 colon Anatomy 0.000 claims description 17
- 238000001914 filtration Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 description 14
- 230000006872 improvement Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000005065 mining Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000003062 neural network model Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Technology Law (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供一种供应关系获取方法、装置、存储介质及电子设备。其中,该供应关系获取方法包括:获取待处理的裁判文书,从裁判文书中确定出至少两个当事人实体,从裁判文书中确定出至少两个当事人实体各自的合同身份信息,根据所确定出的合同身份信息,确定至少两个当事人实体之间的供应关系。
Description
技术领域
本公开涉及数据处理技术领域,尤其涉及一种供应关系获取方法、装置、存储介质及电子设备。
背景技术
随着商业活动的发展,提升产业供应链现代化越来越成为加速发展现代产的体系的重要任务。基于公开的商业数据挖掘企业间的供应关系能够用于对当前供应链的风险评估和预警等方面,以此增强供应链的稳定性,提升企业运行的抗风险能力。目前市场是行业内的供应关系挖掘主要依赖企业公开的采购、销售等信息,引入深度学习模型的方式提取供应商、客户等以确定供应关系,这种传统的供应关系挖掘方法在使用时,需要获取海量的样本并对其进行人工标注,再通过标注后的样本对深度学习模型进行训练,才能保证挖掘的供应关系的可靠性,过程耗时长、成本高,不能高效快捷的实现对企业供应关系的挖掘。
发明内容
鉴于以上现有技术的缺点,本发明的目的在于提出一种供应关系获取方法、装置、存储介质及电子设备,用于高效准确地挖掘不同企业之间的供应关系。
第一方面,本公开提供一种供应关系获取方法,包括:
获取待处理的裁判文书;
从所述裁判文书中确定出至少两个当事人实体;
从所述裁判文书中确定出至少两个所述当事人实体各自的合同身份信息;
根据所确定出的合同身份信息,确定至少两个所述当事人实体之间的供应关系。
可选地,在本公开的一种实施例中,所述当事人实体包括企业实体和/或个人实体。
可选地,在本公开的一种实施例中,所述供应关系获取方法还包括:对裁判文书的案由字段进行识别,以确定所述裁判文书的案由类目;将案由类目符合预设条件的裁判文书作为待处理的裁判文书。
可选地,在本公开的一种实施例中,所述从所述裁判文书中提取出至少两个当事人实体,包括:确定所述裁判文书的当事人信息描述文本中的符合指定位置条件的文本内容;基于所确定出的文本内容确定出至少两个所述当事人实体。
可选地,在本公开的一种实施例中,所述提取所述裁判文书的当事人信息描述文本中的两个指定标点之间的文本内容,包括:针对所述裁判文书的当事人信息描述文本中的每一行文本,确定出第一个冒号之后以及第一个逗号之前的文本内容,作为当事人实体中的当事人名称信息。
可选的,在本公开的一种实施例中,所述确定所述裁判文书的当事人信息描述文本中的符合指定位置条件的文本内容,针对所述裁判文书的当事人信息描述文本中的每一行文本,确定出所述裁判文书的当事人信息描述文本中的第一个冒号之前的文本内容,作为当事人实体中的当事人身份信息。
可选地,在本公开的一种实施例中,所述确定所述裁判文书的当事人信息描述文本中的第一个冒号之前的文本内容,作为当事人实体中的当事人身份信息后,还包括:根据当事人实体中的当事人身份信息,对确定出的各个当事人实体进行过滤处理,所述过滤处理的过滤结果中只保留当事人身份信息符合预设条件的当事人实体。
可选地,在本公开的一种实施例中,所述当事人身份信息符合预设条件的当事人实体是:当事人身份信息是原告的当事人实体,以及当事人身份信息是被告的当事人实体。
可选地,在本公开的一种实施例中,所述供应关系获取方法还包括:所述合同身份信息为甲方身份或乙方身份,所述从所述裁判文书中确定出至少两个所述当事人实体各自的合同身份信息,包括:在所述裁判文书的事实描述文本中,将与甲方关键词相匹配的第一当事人实体的合同身份信息确定为甲方身份,将与乙方关键词相匹配的第二当事人实体的合同身份信息确定为乙方身份。
可选地,在本公开的一种实施例中,所述方法还包括:获取第二类正则表达式,所述第二类正则表达式是根据甲方关键词、乙方关键词以及当事人实体在裁判文书中的表述格式所确定的;
可选地,在本公开的一种实施例中,所述根据所确定出的合同身份信息,确定至少两个所述当事人实体之间的供应关系,包括:将合同身份信息为甲方身份的当事人实体确定为供应关系中的需求方,将合同身份信息为乙方身份的当事人实体确定为供应关系中的供应方,以生成两个所述当事人实体之间的供应关系。
第二方面,基于本公开第一方面所述的供应关系获取方法,本公开的实施例还提供一种供应关系获取装置,包括:
文书获取模块,用于获取待处理的裁判文书;
实体确定模块,用于从所述裁判文书中确定出至少两个当事人实体;
身份确定模块,用于从所述裁判文书中确定出至少两个所述当事人实体各自的合同身份信息;
关系确定模块,用于根据所确定出的合同身份信息,确定至少两个所述当事人实体之间的供应关系。
第三方面,本公开实施例的还提供一种存储介质,所述存储介质上存储有计算机程序,所述处理器执行所述存储介质上存储的计算机程序时,实现如本公开第一方面所述的任意一种供应关系获取方法。
第四方面,本公开实施例还提供一种电子设备,所述电子设备包括存储器以及处理器,所述存储器上用于存储计算机可执行程序,所述处理器用于运行所述计算机可执行程序以实施本公开第一方面所述的任意一种供应关系获取方法。
本公开提供一种供应关系获取方法、装置、存储介质及电子设备,该供应关系获取方法包括:获取待处理的裁判文书,从裁判文书中提取出至少两个当事人实体,从所述裁判文书中确定出至少两个所述当事人实体各自的合同身份信息,根据所确定出的合同身份信息,确定至少两个所述当事人实体之间的供应关系。对比现有技术采用公开的采购、销售信息获取供应关系而言,本公开通过裁判文书获取供应关系一方面可以扩充获取渠道,使获取到的供应信息更为全面,另一方面基于裁判文书的常有表述格式提取所需信息,实施成本较低,更为高效快捷。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的一种供应关系获取方法的工作流程图;
图2为本公开实施例提供的一份裁判文书的部分内容示意图;
图3为本公开实施例提供的另一种供应关系获取方法的工作流程图;
图4为本公开实施例提供的一份裁判文书的另一部分内容示意图;
图5为本公开实施例提供的一种供应关系获取方法的结构示意图;
图6为本公开实施例提供的一种用于进行关系获取的电子设备的硬件结构示意图。
具体实施方式
为了使本领域的人员更好地理解本公开实施例中的技术方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本公开实施例一部分实施例,而不是全部的实施例。基于本公开实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本公开实施例保护的范围。
下面结合本公开实施例附图进一步说明本公开实施例具体实现。
实施例一、
本公开实施例一提供一种供应关系获取方法,如图1所示,图1为本公开实施提供的一种供应关系获取方法的工作流程图,该供应关系获取方法包括:
S101、获取待处理的裁判文书。
具体的,在本公开的一种实施例中,裁判文书是记载人民法院审理过程和结果,它是诉讼活动结果的载体,也是人民法院确定和分配当事人实体权利义务的唯一凭证。一份结构完整、要素齐全、逻辑严谨的裁判文书,既是当事人享有权利和负担义务的凭证,也是上级人民法院监督下级人民法院民事审判活动的重要依据。
常见的裁判文书有民事裁判文书,刑事裁判文书,行政裁判文书以及其他通用诉讼文书等。在实施例的一种实现方式中,通过将裁判文书这一类特定文本作为提取企业之间供应关系的依据,不需要获取企业自主公开的采购销售等信息,有效的降低在进行企业间供应关系挖掘时这一数据处理过程中需要处理的数据量,提高了数据处理的效率,且保证了数据处理结果的准确性,避免了假信息流入数据处理过程导致确定的供应关系错误。
可选地,在本公开的一种实施例中,获取待处理的裁判文书,还可以进一步对待处理裁判文书进行筛选,将筛选后的裁判文书作为实际要进行关系获取挖掘的裁判文书。在本公开实施例实施中,能够用于包含指示企业之间的供应关系裁判文书一般多为商业纠纷类的裁判文书,例如涉及包括买卖合同纠纷、租赁合同纠纷、承揽合同纠纷、运输合同纠纷等,而例如交通事故责任纠纷、金融借贷纠纷等相关的裁判文书则不能明确的说明企业之间的供应关系,因此,在本公开实施例的具体实现场景中,也就不能将涉及这些内容的裁判文书作为本公开实施例中用于获取供应关系依据的裁判文书。因此,在本实施例中,通过对获取的待处理的裁判文书进行筛选,可以进一步降低数据处理过程需要处理的数据量,提高处理效率和最终确定的供应信息的准确性。
可选地,在本公开实施例的一种实现方式中,获取待处理的裁判文书,包括:对裁判文书的案由字段进行识别,以确定所述裁判文书的案由类目,将案由类目符合预设条件的裁判文书作为待处理的裁判文书。
在本实施例中所涉及的裁判文书中,“案由”反映案件所涉及的民事法律关系的性质,是对当事人诉争的法律关系性质进行的概括,相当于是对于每一份裁判文书及具体案件的一种总结摘要。其通常只有一句话,比如“XX合同纠纷”。在本公开实施例中,通过对案由字段进行识别,确定出该裁判文书的案由类目,能够较为快捷和准确的保证获取的裁判文书是符合预设条件如预设条件为涉及买卖合同纠纷、租赁合同纠纷、承揽合同纠纷、运输合同纠纷等案由的裁判文书,剔除如涉及责任纠纷等不能用于挖掘企业之间供应关系的裁判文书,进一步的对获取的待处理的裁判文书进行筛选,在保证筛选结果全面性、准确性和可靠性的同时,减少了挖掘供应关系过程所要处理的数据量,节省了系统的处理资源,提高了挖掘供应关系的效率。
S102、从裁判文书中确定出至少两个当事人实体。
具体地,在本申请的一种实施例中,所述当事人实体包括企业实体和/或个人实体。
在本申请实施例的一种实现方中,从所述裁判文书中提取出至少两个当事人实体,可以通过对获取的待处理裁判文书进行内容识别,从而可以简单方便的确定裁判文书中包含的企业实体和/或个人实体信息,以保证挖掘出的企业/个人之间供应关系的全面性和准确性。
可选地,在本申请的一种实施例中,所述从所述裁判文书中提取出至少两个当事人实体,包括:提取所述裁判文书的当事人信息描述文本中的符合指定位置条件的文本内容,基于所提取出的文本内容确定出至少两个所述当事人实体。
具体的,在本申请实施例的一种实现方式中,所述提取所述裁判文书的当事人信息描述文本中的符合指定位置条件的文本内容,
可选的,可以提取所述裁判文书的当事人信息描述文本中的第一个冒号之后以及第一个逗号之前的文本内容,作为符合所述指定位置条件的文本内容,所述文本内容为包含表征所述当事人名称信息的文本。
可选的,还可以提取所述裁判文书的当事人信息描述文本中的第一个冒号之前的文本内容,作为符合所述指定位置条件的文本内容,所述文本内容为包含表征所述当事人身份信息的文本。
在本申请实施例中,基于裁判文书这一公文的书写格式可知,用于描述当事人信息的描述文本通常都位于裁判文书的开头,例如图2所示,图2为本申请实施例提供的一份裁判文书的部分内容示意图,该裁判文书为北京互联网法院的一份民事判决书,从该裁判文书中可知,其涉及的当事人实体部分的文本描述形式是:
原告:XX电影制片厂有限公司,…
被告:XX电视台,…
法定代表人:速XX,…
法定代表人:聂XX,…
上述涉及当事人实体部分的文本在本实施例中被称为当事人信息描述文本,以“原告:XX电影制片厂有限公司,…”为例,其第一个冒号之前的文本内容是“原告”,该部分文本内容可以视为当事人实体中的当事人身份信息。其第一个冒号之后以及第一个逗号之前的文本内容是“XX电影制片厂有限公司”,该部分文本内容可以视为当事人实体中的当事人名称信息。
本实施例中,可以只提取第一个冒号之后以及第一个逗号之前的文本内容,即提取出文本内容“XX电影制片厂有限公司”,也可以既提取第一个冒号之后以及第一个逗号之前的文本内容,且提取第一个冒号之前的文本内容,即提取出文本内容“原告XX电影制片厂有限公司”。
可选的,若提取出的文本内容包括第一个冒号之前的文本内容,则还可执行过滤步骤,只保留指定身份的所述当事人实体。一般地,可以过滤掉身份为第三人、法定代表人等当事人实体,只保留身份为原告、被告的当事人实体。
在本申请实施例中,基于提取的裁判文书中当事人信息描述文本中符合这种在裁判文书开头的指定位置的文本内容,即可较为快捷、准确和全面的提取出该裁判文书中包含的当事人实体信息,如企业实体或个人实体等,从而提高从裁判文书中提取当事人实体这一过程的效率。
本申请实施例通过对裁判文书这一种特殊公文的书写格式规律进行大数据统计和总结,确定裁判文书在描述当事人实体信息时,多将该实体信息描述位置设置于当事人名称信息描述文本中的第一个冒号之后和第一个逗号之前的文本内容中。因此,在本申请实施例中获取当事人实体信息时,只需获取相关位置的文本即可较为全面且准确的获取该裁判文书包含的至少两个当事人实体的相关信息,相较于提取指定位置可以基于文本空间位置进行提取,这种基于文本符号进行位置识别提取的精确度更好,也能够进一步地提高处理效率,并减少问题提取过程中所要处理的数据量。
提取所述裁判文书的当事人信息描述文本中的符合指定位置条件的文本内容时,包括:利用预设的第一类正则表达式提取出所述裁判文书的当事人信息描述文本中的符合指定位置条件的文本内容。该第一类正则表达式是基于对裁判文书中当事人实体信息描述文本的数据书写格式进行大数据统计和规律总结确定的,从而更加有效的保证提取结果的准确性和全面性。也便于通过计算机语言进行实施。
S103、从所述裁判文书中确定出至少两个所述当事人实体各自的合同身份信息。
在本公开实施例的一种实现方式中,所述合同身份信息为甲方身份或乙方身份,所述从所述裁判文书中确定出至少两个所述当事人实体各自的合同身份信息,参见图3,包括以下步骤:
S103a,获取第二类正则表达式,所述第二类正则表达式是根据甲方关键词、乙方关键词以及当事人实体在裁判文书中的表述格式所确定的;
S103b,在所述裁判文书的事实描述文本中,基于所述第二类正则表达式对至少两个所述当事人实体进行正则匹配;
S103c,将与甲方关键词相匹配的第一当事人实体的合同身份信息确定为甲方身份,将与乙方关键词相匹配的第二当事人实体的合同身份信息确定为乙方身份。
在一些实施例中,裁判文书中的甲方关键词/乙方关键词与当事人实体之间符合指定的文本表述格式,则可认为两者相匹配。
在特定类型的裁判文书中会包括事实描述文本,具体文本形式可参见图4。事实描述文本的内容是当事人之前所签订的合同内容在裁判文书中的体现。在一些实施例中,可以使用预设的事实文本关键句来自动识别出事实描述文本的开头,该事实文本关键句例如可以是:“法院认定事实:”等等。
可选的,还可基于裁判文书中的事实描述文本中的过滤关键词来过滤掉无法识别出供应关系的裁判文书。当识别到事实描述文本中包含某些预设的过滤关键词时,则可判定该事实描述文本是与供应关系无关的文本,不能从其中提取到供应关系,则可将该裁判文书过滤掉。该过滤步骤可以在步骤S102之前执行。
事实描述文本中记载有当事人实体以及该当事人实体所对应的合同身份信息。以图4为例,假设先前步骤中确定了若干个当事人实体,其中两个当事人实体的实体名称分别为福XX公司和通XX公司。图4中的“福XX公司(甲方)”和“通XX公司(乙方)”这种文本表述符合指定的文本表述格式【实体名称(甲方关键词)】和【实体名称(乙方关键词)】,则可确定实体名称为福XX公司的当事人实体与甲方关键词相匹配,其对应的合同身份信息为甲方身份。实体名称为通XX公司的当事人实体与乙方关键词相匹配,其对应的合同身份信息为乙方身份。
其中,甲方/乙方关键词可以是文本“甲方”、“乙方”,也可以为其它相关的关键词,例如可以是文本“委托方”、“被委托方”等等。在本实施例中,会基于当事人实体与各种可能的甲方/乙方关键词之间的各种可能的表述关系形成第二类正则表达式,并基于第二类正则表达式的匹配结果得到当事人实体的合同身份。
在本公开实施例的一种实现方式中,合同身份信息除了甲方关键词,乙方关键词之外,还可包含丙方关键词等。
S104、根据所确定出的合同身份信息,确定至少两个所述当事人实体之间的供应关系。
在一些实施例中,可以仅确定至少两个所述当事人实体之间具有供应关系。或者,在一些特定类型的裁判文书中,也可以将合同身份信息为甲方身份的当事人实体确定为供应关系中的需求方,将合同身份信息为乙方身份的当事人实体确定为供应关系中的供应方,以生成两个所述当事人实体之间的供应关系。
可选的,还可基于裁判文书中的预设的辅助关键词来辅助判断当事人实体之间的供应关系,其他关键词可以例如是委托、验收等等。可以知道,接受委托的一方应为供应关系中的供应方,进行验收的一方应为供应关系中的需求方。该通过预设的辅助关键词来辅助判断当事人实体之间的供应关系的步骤在具体实现时也可使用正则表达式来完成。
在本公开实施例的一种具体实现场景中,通过根据裁判文书这种特定公文中关于合同身份信息的文本数据格式进行规律总结,可以有效的降低需要处理的数据量,在保证数据处理准确性的同时,提高处理效率。
可选地,在本公开的一种实施例中,还包括:
根据所提取出的至少两个当事人实体之间的供应关系标注对应的裁判文书,基于所述裁判文书生成训练样本;
依据所述训练样本训练神经网络模型,以获取用于识别供应关系的目标神经网络模型。
传统方法利用神经网络模型对数据进行挖掘以获取不同企业之间的供应信息时,需要获取海量的样本数据对神经网络模型进行训练,而上述实施例所得到的供应关系可以用于充实样本数据,进而构建或优化神经网络模型。
可选地,在本公开实施例的一种实现方式中,对于供应关系之中的细节信息,如采购金额、采购时间、采购项目等,也可以通过使用正则匹配的方式对裁判文书中的相关信息进行进一步提取,以提高获取的供应关系的全面性,为用户提高更好的使用体验感和便利性。具体实现过程本实施例此处不再赘述。
本公开实施例提供一种供应关系获取方法包括:获取待处理的裁判文书,从裁判文书中提取出至少两个当事人实体,从裁判文书中提取出至少两个当事人实体之间的合同身份信息,根据所提取出的合同身份信息,确定至少两个当事人实体之间的供应关系。本公开通过获取用于表征企业实体之间合同纠纷的裁判文书,并根据该裁判文书的相关信息确定至少两个企业实体之间的供应信息,避免了传统方法再利用神经网络模型对数据进行挖掘以获取不同企业之间的供应信息时,需要获取海量的样本数据对神经网络模型进行训练的过程,实施成本低、效率高,确定的企业供应关系的准确性好。
实施例二、
第二方面,基于本公开第一方面所述的供应关系获取方法,本公开的实施例还提供一种供应关系获取装置,如图5所示,图5为本公开实施例提供的一种供应关系获取装置50的结构示意图,该供应关系获取装置50包括:
文书获取模块501,用于获取待处理的裁判文书;
实体确定模块502,用于从所述裁判文书中提取出至少两个当事人实体;
可选地,在本公开实施例的一种实现方式中,所述当事人实体包括企业实体和/或个人实体。
身份确定模块503,用于从所述裁判文书中确定出至少两个所述当事人实体各自的合同身份信息;
关系确定模块504,用于根据所确定出的合同身份信息,确定至少两个所述当事人实体之间的供应关系。
可选地,在本公开实施例的一种实现方式中,文书获取模块501还用于:对裁判文书的案由字段进行识别,以确定所述裁判文书的案由类目,将案由类目符合预设条件的裁判文书作为待处理的裁判文书。
可选地,在本公开实施例的一种实现方式中,实体确定模块502还用于确定所述裁判文书的当事人信息描述文本中的符合指定位置条件的文本内容,基于所提取出的文本内容确定至少两个当事人实体。
可选地,在本公开实施例的一种实现方式中,实体确定模块502还用于针对所述裁判文书的当事人信息描述文本中的每一行文本,确定出第一个冒号之后以及第一个逗号之前的文本内容,作为当事人实体中的当事人名称信息。
可选地,在本公开实施例的一种实现方式中,实体确定模块302还用于针对所述裁判文书的当事人信息描述文本中的每一行文本,确定出所述裁判文书的当事人信息描述文本中的第一个冒号之前的文本内容,作为当事人实体中的当事人身份信息。
可选地,在本公开实施例的一种实现方式中,实体确定模块302还用于根据当事人实体中的当事人身份信息,对确定出的各个当事人实体进行过滤处理,所述过滤处理的过滤结果中只保留当事人身份信息符合预设条件的当事人实体。
可选地,在本公开实施例的一种实现方式中,当事人身份信息符合预设条件的当事人实体是:当事人身份信息是原告的当事人实体,以及当事人身份信息是被告的当事人实体。
可选地,在本公开实施例的一种实现方式中,所述合同身份信息为甲方身份或乙方身份,对应的,所述身份确定模块,还用于:
获取第二类正则表达式,所述第二类正则表达式是根据甲方关键词、乙方关键词以及当事人实体在裁判文书中的表述格式所确定的;
在所述裁判文书的事实描述文本中,基于所述第二类正则表达式对至少两个所述当事人实体进行正则匹配;
将与甲方关键词相匹配的第一当事人实体的合同身份信息确定为甲方身份,将与乙方关键词相匹配的第二当事人实体的合同身份信息确定为乙方身份。
可选地,在本公开实施例的一种实现方式中,所述关系确定模块还用于:
将合同身份信息为甲方身份的当事人实体确定为供应关系中的需求方,将合同身份信息为乙方身份的当事人实体确定为供应关系中的供应方,以生成两个所述当事人实体之间的供应关系。
实施例三、
第三方面,本公开实施例的还提供一种存储介质,所述存储介质上存储有计算机程序,所述处理器执行所述存储介质上存储的计算机程序时,实现如本公开第一方面所述的任一种供应关系获取方法,该供应关系获取方法包括但不限于:
获取待处理的裁判文书;
从所述裁判文书中确定出至少两个当事人实体;
从所述裁判文书中确定出至少两个所述当事人实体各自的合同身份信息;
根据所确定出的合同身份信息,确定至少两个所述当事人实体之间的供应关系。
实施例四、
基于本公开实施例一所述的视频播放测试方法,本公开实施例还提供一种用于关系获取的电子设备,如图6所示,图6为本实施例提供的一种用于关系获取的电子设备硬件结构示意图;该电子设备的硬件结构可以包括:处理器601,通信接口602,计算机可读介质603和通信总线604;
其中,处理器601、通信接口602、计算机可读介质603通过通信总线606完成相互间的通信;
可选的,通信接口602可以为通信模块的接口,如GSM模块的接口;
其中,处理器601具体可以配置为运行存储器上存储的可执行程序,从而执行上述任意一方法实施例的所有方法或者其中部分方法。
处理器601可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本公开实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
至此,本公开已经对本主题的特定实施例进行了描述说明。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作可以按照不同的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序,以实现期望的结果。在某些实施方式中,多任务处理和并行处理可以是有利的。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。涉及人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由涉及人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来涉及和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本公开时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本公开的实施例可提供为方法、系统或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定事务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本公开,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行事务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本公开的实施例而已,并不用于限制本公开。对于本领域技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本公开的权利要求范围之内。
Claims (14)
1.一种供应关系获取方法,其特征在于,包括:
获取待处理的裁判文书;
从所述裁判文书中确定出至少两个当事人实体;
从所述裁判文书中确定出至少两个所述当事人实体各自的合同身份信息;
根据所确定出的合同身份信息,确定至少两个所述当事人实体之间的供应关系。
2.根据权利要求1所述的供应关系获取方法,其特征在于,所述当事人实体包括企业实体和/或个人实体。
3.根据权利要求1所述的供应关系获取方法,其特征在于,所述合同身份信息为甲方身份或乙方身份,所述从所述裁判文书中确定出至少两个所述当事人实体各自的合同身份信息,包括:
在所述裁判文书的事实描述文本中,将与甲方关键词相匹配的第一当事人实体的合同身份信息确定为甲方身份,将与乙方关键词相匹配的第二当事人实体的合同身份信息确定为乙方身份。
4.根据权利要求3所述的供应关系获取方法,其特征在于,所述方法还包括:
获取第二类正则表达式,所述第二类正则表达式是根据甲方关键词、乙方关键词以及当事人实体在裁判文书中的表述格式所确定的;
在所述裁判文书的事实描述文本中,基于所述第二类正则表达式对至少两个所述当事人实体进行正则匹配,以确定与甲方关键词相匹配的第一当事人实体,以及与乙方关键词相匹配的第二当事人实体。
5.根据权利要求3所述的供应关系获取方法,其特征在于,所述根据所确定出的合同身份信息,确定至少两个所述当事人实体之间的供应关系,包括:
将合同身份信息为甲方身份的当事人实体确定为供应关系中的需求方,将合同身份信息为乙方身份的当事人实体确定为供应关系中的供应方,以生成两个所述当事人实体之间的供应关系。
6.根据权利要求1所述的供应关系获取方法,其特征在于,所述获取待处理的裁判文书,包括:
对裁判文书的案由字段进行识别,以确定所述裁判文书的案由类目;
将所述案由类目符合预设条件的裁判文书作为所述待处理的裁判文书。
7.根据权利要求1所述的供应关系获取方法,其特征在于,所述从所述裁判文书中确定出至少两个当事人实体,包括:
确定所述裁判文书的当事人信息描述文本中的符合指定位置条件的文本内容;
基于所确定出的文本内容确定出至少两个所述当事人实体。
8.根据权利要求4所述的供应关系获取方法,其特征在于,所述确定所述裁判文书的当事人信息描述文本中的符合指定位置条件的文本内容,包括:
针对所述裁判文书的当事人信息描述文本中的每一行文本,确定出第一个冒号之后以及第一个逗号之前的文本内容,作为当事人实体中的当事人名称信息。
9.根据权利要求5所述的供应关系获取方法,其特征在于,所述确定所述裁判文书的当事人信息描述文本中的符合指定位置条件的文本内容,包括:
针对所述裁判文书的当事人信息描述文本中的每一行文本,确定出所述裁判文书的当事人信息描述文本中的第一个冒号之前的文本内容,作为当事人实体中的当事人身份信息。
10.根据权利要求6所述的供应关系获取方法,其特征在于,所述确定所述裁判文书的当事人信息描述文本中的第一个冒号之前的文本内容,作为当事人实体中的当事人身份信息后,还包括:
根据当事人实体中的当事人身份信息,对确定出的各个当事人实体进行过滤处理,所述过滤处理的过滤结果中只保留当事人身份信息符合预设条件的当事人实体。
11.根据权利要求7所述的供应关系获取方法,其特征在于,所述当事人身份信息符合预设条件的当事人实体是:当事人身份信息是原告的当事人实体,以及当事人身份信息是被告的当事人实体。
12.一种供应关系获取装置,其特征在于,包括:
文书获取模块,用于获取待处理的裁判文书;
实体确定模块,用于从所述裁判文书中确定出至少两个当事人实体;
身份确定模块,用于从所述裁判文书中确定出至少两个所述当事人实体各自的合同身份信息;
关系确定模块,用于根据所确定出的合同身份信息,确定至少两个所述当事人实体之间的供应关系。
13.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述处理器执行所述存储介质上存储的计算机程序时,实现如权利要求1-11中任一项所述的供应关系获取方法。
14.一种电子设备,其特征在于,所述电子设备包括存储器以及处理器,所述存储器上用于存储计算机可执行程序,所述处理器用于运行所述计算机可执行程序以实施权利要求1-11中任一所述的供应关系获取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111508944.6A CN114239561B (zh) | 2021-12-10 | 2021-12-10 | 供应关系获取方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111508944.6A CN114239561B (zh) | 2021-12-10 | 2021-12-10 | 供应关系获取方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114239561A true CN114239561A (zh) | 2022-03-25 |
CN114239561B CN114239561B (zh) | 2023-04-28 |
Family
ID=80754668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111508944.6A Active CN114239561B (zh) | 2021-12-10 | 2021-12-10 | 供应关系获取方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114239561B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115794889A (zh) * | 2022-12-22 | 2023-03-14 | 北京明朝万达科技股份有限公司 | 人身关系处理方法、装置、电子设备及计算可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017092555A1 (zh) * | 2015-12-01 | 2017-06-08 | 北京国双科技有限公司 | 一种裁判文书中的金额解析方法及装置 |
CN111177332A (zh) * | 2019-11-27 | 2020-05-19 | 中证信用增进股份有限公司 | 自动提取裁判文书涉案标的和裁判结果的方法及装置 |
CN111291161A (zh) * | 2020-02-20 | 2020-06-16 | 平安科技(深圳)有限公司 | 法律案件知识图谱查询方法、装置、设备及存储介质 |
CN111783449A (zh) * | 2020-06-24 | 2020-10-16 | 鼎富智能科技有限公司 | 一种裁判文书中判决结果的要素提取方法及装置 |
-
2021
- 2021-12-10 CN CN202111508944.6A patent/CN114239561B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017092555A1 (zh) * | 2015-12-01 | 2017-06-08 | 北京国双科技有限公司 | 一种裁判文书中的金额解析方法及装置 |
CN111177332A (zh) * | 2019-11-27 | 2020-05-19 | 中证信用增进股份有限公司 | 自动提取裁判文书涉案标的和裁判结果的方法及装置 |
CN111291161A (zh) * | 2020-02-20 | 2020-06-16 | 平安科技(深圳)有限公司 | 法律案件知识图谱查询方法、装置、设备及存储介质 |
CN111783449A (zh) * | 2020-06-24 | 2020-10-16 | 鼎富智能科技有限公司 | 一种裁判文书中判决结果的要素提取方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115794889A (zh) * | 2022-12-22 | 2023-03-14 | 北京明朝万达科技股份有限公司 | 人身关系处理方法、装置、电子设备及计算可读存储介质 |
CN115794889B (zh) * | 2022-12-22 | 2023-09-01 | 北京明朝万达科技股份有限公司 | 人身关系处理方法、装置、电子设备及计算可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114239561B (zh) | 2023-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9477750B2 (en) | System and method for real-time dynamic measurement of best-estimate quality levels while reviewing classified or enriched data | |
US9424524B2 (en) | Extracting facts from unstructured text | |
CN109460551B (zh) | 签名信息提取方法及装置 | |
CN109582772B (zh) | 合同信息提取方法、装置、计算机设备和存储介质 | |
CN105095288B (zh) | 数据分析方法及数据分析装置 | |
CN112287914B (zh) | Ppt视频段提取方法、装置、设备及介质 | |
CN112199588A (zh) | 舆情文本筛选方法及装置 | |
US10929615B2 (en) | Tone analysis of legal documents | |
CN110738055A (zh) | 文本的实体识别方法、设备及存储介质 | |
CN111259160A (zh) | 知识图谱构建方法、装置、设备及存储介质 | |
CN109697231A (zh) | 一种案件文书的显示方法、系统、存储介质和处理器 | |
CN110765889A (zh) | 法律文书的特征提取方法、相关装置及存储介质 | |
CN112163072A (zh) | 基于多数据源的数据处理方法以及装置 | |
CN114239561A (zh) | 供应关系获取方法、装置、存储介质及电子设备 | |
CN113139033B (zh) | 文本处理方法、装置、设备及存储介质 | |
CN109492401B (zh) | 一种内容载体风险检测方法、装置、设备及介质 | |
CN118396786A (zh) | 合同文档审核方法和装置、电子设备及计算机可读存储介质 | |
CN114092119A (zh) | 供应关系获取方法、装置、存储介质及电子设备 | |
CN107577667B (zh) | 一种实体词处理方法和装置 | |
US10373278B2 (en) | Annotation of legal documents with case citations | |
CN108021596B (zh) | 新闻的展示方法和装置 | |
CN111050194B (zh) | 视频序列处理方法、视频序列处理装置、电子设备及计算机可读存储介质 | |
US10002450B2 (en) | Analyzing a document that includes a text-based visual representation | |
CN113010573A (zh) | 一种关联关系提取方法、装置及电子设备 | |
Ha et al. | Contract Metadata Identification in Czech Scanned Documents. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |