CN112330459A - 一种基于工商数据挖掘企业投融资事件的方法及装置 - Google Patents

一种基于工商数据挖掘企业投融资事件的方法及装置 Download PDF

Info

Publication number
CN112330459A
CN112330459A CN202011142011.5A CN202011142011A CN112330459A CN 112330459 A CN112330459 A CN 112330459A CN 202011142011 A CN202011142011 A CN 202011142011A CN 112330459 A CN112330459 A CN 112330459A
Authority
CN
China
Prior art keywords
enterprise
change
change information
investment
financing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011142011.5A
Other languages
English (en)
Other versions
CN112330459B (zh
Inventor
周立运
杨鹏程
沈锦秋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Huabin Licheng Technology Co.,Ltd.
Original Assignee
Beijing Huabin Licheng Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Huabin Licheng Technology Co ltd filed Critical Beijing Huabin Licheng Technology Co ltd
Priority to CN202011142011.5A priority Critical patent/CN112330459B/zh
Publication of CN112330459A publication Critical patent/CN112330459A/zh
Application granted granted Critical
Publication of CN112330459B publication Critical patent/CN112330459B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Technology Law (AREA)
  • Fuzzy Systems (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明实施例提供一种基于工商数据挖掘企业投融资事件的方法及装置,其中所述方法包括:获取目标企业的工商数据中的企业变更信息集,其中企业变更信息集包括至少一条企业变更信息;对企业变更信息进行处理,得到与企业投融资事件相关的目标企业变更信息;根据目标企业变更信息与预设的投资机构库进行比较,得到对应的投资机构;确定符合投融资事件的企业变更信息集及对应的目标企业,并基于目标企业的企业变更信息集及其对应的投资机构进行信息拼接,得到目标企业的投融资记录信息,从而可以让用户直观、准确、及时的获取企业融资情况,辅助用户更好地做出判断,可以保证融资纪录准确、及时地呈现给用户。

Description

一种基于工商数据挖掘企业投融资事件的方法及装置
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种基于工商数据挖掘企业投融资事件的方法及装置。
背景技术
企业投融资是指企业经营运作的两种不同的形式,具体包括企业投资和企业融资两种形式,其目的都是通过投资融资活动,壮大企业实力,获取企业更大效益的方式,是企业经营的重要数据。
传统的,各个机构都是通过资讯获取企业与投资机构的投融资数据。投融资数据的获取受制于企业是否主动披露,但是至少一半以上的企业并不对外主动披露融资活动。其次,企业在披露信息时,会考虑经营因素,造成披露日期与实际融资时间并不一致。另外,企业变更内容的格式较乱,掺杂着大量其他企业变更内容。而且投资机构也是通过层层下设的有限合伙企业来实现投资,通过投资机构的名称用户无法直观穿透看到背后真正的投资机构名称。
所以,现有技术中的数据存在大量的无关数据,缺少能够有效挖掘投融资数据的方法。
发明内容
本发明实施例提供一种基于工商数据挖掘企业投融资事件的方法及装置、电子设备和存储介质,用以解决现有技术中不够灵活、性能较低、兼容性较差的缺陷。
本发明实施例提供一种基于工商数据挖掘企业投融资事件的方法,其特征在于,包括:
获取目标企业的工商数据中的企业变更信息集,其中,所述企业变更信息集包括至少一条企业变更信息;
对所述企业变更信息进行处理,得到与企业投融资事件相关的目标企业变更信息;
根据目标企业变更信息与预设的投资机构库进行比较,得到对应的投资机构;
确定符合投融资事件的企业变更信息集及对应的目标企业,并基于目标企业的企业变更信息集及其对应的投资机构进行信息拼接,得到目标企业的投融资记录信息。
根据本发明一个实施例的基于工商数据挖掘企业投融资事件的方法,对所述企业变更信息进行处理,得到与企业投融资事件相关的目标企业变更信息,包括:
判断所述企业变更信息是否为股东变更信息或者注册资本变更信息;
若是,直接将所述股东变更信息添加投资人变更标记或者将所述注册资本变更信息添加注册资本变更标记;
若否,根据企业变更信息进行语义分析,得到对应的变更项目;将包括注册资本变更项目的企业变更信息添加注册资本变更标记;对未添加注册资本变更标记的企业变更信息进行投资机构的识别,将新加的投资机构数组对应的企业变更信息添加投资人变更标记;
将添加投资人变更标记或添加注册资本变更标记的企业变更信息作为与企业投融资事件相关的目标企业变更信息。
根据本发明一个实施例的基于工商数据挖掘企业投融资事件的方法,对未添加注册资本变更标记的企业变更信息进行投资机构的识别,将新加的投资机构数组对应的企业变更信息添加投资人变更标记,包括:
将未添加注册资本变更标记的企业变更信息中的变更前数据和变更后数据进行过滤以及数组变更,得到变更前的企业数组和变更后的企业数组;
根据变更前的企业数组和变更后的企业数组的差集,得到新加的投资机构数组,将新加的投资机构数组对应的企业变更信息添加投资人变更标记。
根据本发明一个实施例的基于工商数据挖掘企业投融资事件的方法,将包括注册资本变更项目的企业变更信息添加注册资本变更标记,包括:
将变更后数据中包括第一字符的企业变更信息添加注册资本变更标记;
将变更项目包括注册、资本以及变更的企业变更信息,分别提取变更前数据中的金额和变更后数据中的金额,并在变更后数据中的金额大于变更前数据中的金额的情况下,将所述企业变更信息添加注册资本变更标记。
根据本发明一个实施例的基于工商数据挖掘企业投融资事件的方法,将未添加注册资本变更标记的企业变更信息中的变更前数据和变更后数据进行过滤以及数组变更,得到变更前的企业数组和变更后的企业数组,包括:
剔除未添加注册资本变更标记的企业变更信息中的变更前数据和变更后数据中的第二字符集;
将剔除后的企业变更信息中的变更前数据和变更后数据进行数组变更,得到对应的初始企业数组;
将初始企业数组进行多级数组过滤,得到变更前的企业数组和变更后的企业数组,其中,所述数组过滤包括字符串长度过滤、指定字符集过滤、数组结尾字符过滤中的至少一种。
根据本发明一个实施例的基于工商数据挖掘企业投融资事件的方法,根据目标企业变更信息与预设的投机机构库进行比较,得到对应的投资机构,包括:
根据目标企业变更信息对应的新加的投资机构数组与投资机构库的机构名称进行匹配;
若匹配,直接将所述目标企业变更信息与匹配的机构名称进行关联;
若不匹配,在投资机构库中新增机构名称,并将所述目标企业变更信息与新增机构名称关联。
根据本发明一个实施例的基于工商数据挖掘企业投融资事件的方法,确定符合投融资事件的企业变更信息集及对应的目标企业,并基于目标企业的企业变更信息集及其对应的投资机构进行信息拼接,得到目标企业的投融资记录信息,包括:
提取变更时间为同一天,且包括具有注册资本变更标记的企业变更信息以及投资人变更标记的企业变更信息的企业变更信息集;
将提取的企业变更信息集中的企业变更信息对应的信息字段进行拼接,得到目标企业的投融资记录信息,其中,所述信息字段包括投资机构数组、变更时间、企业名称、投资轮次中的至少一个。
本发明实施例还提供一种基于工商数据挖掘企业投融资事件的装置,包括:
获取模块,用于获取目标企业的工商数据中的企业变更信息集,其中,所述企业变更信息集包括至少一条企业变更信息;
清洗模块,用于对所述企业变更信息进行处理,得到与企业投融资事件相关的目标企业变更信息;
比较模块,用于根据目标企业变更信息与预设的投资机构库进行比较,得到对应的投资机构;
拼接模块,用于确定符合投融资事件的企业变更信息集及对应的目标企业,并基于目标企业的企业变更信息集及其对应的投资机构进行信息拼接,得到目标企业的投融资记录信息。
本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于工商数据挖掘企业投融资事件方法的步骤。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于工商数据挖掘企业投融资事件方法的步骤。
本发明实施例提供的基于工商数据挖掘企业投融资事件的方法及装置,对所述企业变更信息进行处理,得到与企业投融资事件相关的目标企业变更信息,根据目标企业变更信息与预设的投资机构库进行比较得到对应的投资机构,进而确定符合投融资事件的企业变更信息集及对应的目标企业,并基于目标企业的企业变更信息集及其对应的投资机构进行信息拼接,得到目标企业的投融资记录信息,从而可以让用户直观、准确、及时的获取企业融资情况,辅助用户更好地做出判断。采用本发明实施例所述的方法获取企业投融资数据,可以保证融资纪录准确、及时地呈现给用户。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种基于工商数据挖掘企业投融资事件的方法流程示意图;
图2是本发明另一实施例提供的一种基于工商数据挖掘企业投融资事件的方法流程示意图;
图3是本发明实施例提供的一种投融资记录信息的示意图;
图4是本发明实施例提供的一种基于工商数据挖掘企业投融资事件的装置的结构示意图;
图5是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明一个或多个实施例。在本发明一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本发明一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本发明一个或多个实施例涉及的名词术语进行解释。
企业工商数据:企业经营的一种信息,例如企业名称、董事、股东、经营范围等。
企业变更信息集:包括多条企业变更信息,每条企业变更信息为企业工商信息变更后生成的信息。
投融资数据:包括企业投资和企业融资两种数据,是企业经营的重要数据。
资本变更:企业的资本变化,例如企业A的资本由500万变更为1000万,则生成对应的资本变更记录。
投资人变更:为企业资本带来变化的投资人的变更,例如投资人B为企业A新增的1000万投资,企业A的投资人变更为投资人B。
本发明实施例公开了一种基于工商数据挖掘企业投融资事件的方法,参见图1,包括下述步骤101~104:
101、获取目标企业的工商数据中的企业变更信息集,其中所述企业变更信息集包括至少一条企业变更信息。
其中,目标企业可以为一个,也可以为多个。在多个目标企业的情况下,需要获取每个目标企业的工商数据中的企业变更信息集。
每个企业的工商数据中包含有该企业对应的企业变更信息集,该企业变更信息集中包括多条企业变更信息。
例如选择目标企业为企业A,获取企业A的工商数据中的企业变更信息a1、a2、a3、a4,作为企业A的企业变更信息集A1,企业变更信息a5、a6、a7、a8,作为企业A的企业变更信息集A2。
本实施例中,并非从企业披露信息中查找企业变更信息,而是创造性地从企业工商数据中获取企业变更信息,进而得到企业的投融资信息,解决了企业不主动披露的难题。而且工商变更的日期与实际完成融资的日期比较接近,更加客观、准确。
具体地,企业变更信息包括多种,例如投资变更信息、融资变更信息、企业投资人变更信息、企业名称变更信息、企业股东变更信息等。
102、对所述企业变更信息进行处理,得到与企业投融资事件相关的目标企业变更信息。
其中,对企业变更信息进行处理的方法有多种,例如对于股东变更信息或者注册资本变更信息,直接将所述股东变更信息添加投资人变更标记或者将注册资本变更信息添加注册资本变更标记。对于其他类型的企业变更信息,则需要基于语义分析进行挖掘清洗。其中,对企业变更信息进行挖掘清洗的方法有多种,例如根据关键词进行挖掘清洗等。关键词可以根据实际需求而设置,并根据实际效果而删减。例如将关键词设置为“注册”、“资本”、“变更”等。
本实施例中,对企业变更信息的挖掘清洗,并非对企业变更信息中各个字段的过滤,而是基于企业变更信息进行语义识别,并进行语义层面的判断,以更加准确地对企业变更信息进行识别和过滤。
在实际使用时,可以通过预先训练的语义识别模型进行识别,实现对企业变更信息的语义识别。
103、根据目标企业变更信息与预设的投资机构库进行比较,得到对应的投资机构。
具体地,步骤103包括:根据目标企业变更信息对应的新加的投资机构数组与投资机构库的机构名称进行匹配,进而得到目标企业变更信息对应的投资机构。
其中,投资机构库的投资机构为预先设置,并可以根据实际需求而删减。
104、确定符合投融资事件的企业变更信息集及对应的目标企业,并基于目标企业的企业变更信息集及其对应的投资机构进行信息拼接,得到目标企业的投融资记录信息。
需要注意的是,目标企业变更信息的多个信息字段以及投资机构的字段进行拼接,得到投融资记录信息。
其中,目标企业变更信息的信息字段包括投资机构数组、变更时间、企业名称、投资轮次中的至少一个。
本发明实施例提供的基于工商数据挖掘企业投融资事件的方法,对所述企业变更信息进行处理,得到与企业投融资事件相关的目标企业变更信息,根据目标企业变更信息得到对应的投资机构,进而基于目标企业的企业变更信息集及其对应的投资机构进行信息拼接,得到目标企业的投融资记录信息,从而可以让用户直观、准确、及时的获取企业融资情况,辅助用户更好地做出判断。采用本发明实施例所述的方法获取企业投融资数据,可以保证融资纪录准确、及时地呈现给用户。
本发明实施例公开了一种基于工商数据挖掘企业投融资事件的方法,参见图2,包括:
201、获取目标企业的工商数据中的企业变更信息集,其中,所述企业变更信息集包括至少一条企业变更信息。
202、判断所述企业变更信息是否为股东变更信息或者注册资本变更信息,若是,执行步骤203,若否,执行步骤204。
203、直接将所述股东变更信息添加投资人变更标记或者将所述注册资本变更信息添加注册资本变更标记,将添加投资人变更标记或添加注册资本变更标记的企业变更信息作为与企业投融资事件相关的目标企业变更信息。
204、根据企业变更信息进行语义分析,得到对应的变更项目。
其中,关键词可以根据实际需求而设置,并根据实际效果而删减。例如将关键词设置为“注册”、“资本”、“变更”等。
本实施例中,对企业变更信息的挖掘清洗,并非对企业变更信息中各个字段的过滤,而是基于企业变更信息进行语义识别,并进行语义层面的判断,以更加准确地对企业变更信息进行识别和过滤。
在实际使用时,可以通过预先训练的语义识别模型进行识别,实现对企业变更信息的语义识别。
205、将包括注册资本变更项目的企业变更信息添加注册资本变更标记。
具体地,步骤205包括步骤S251~S252:
S251、将变更后数据中包括第一字符的企业变更信息添加注册资本变更标记。
具体地,第一字符可以根据实际需求而设置,例如设置为“(+”。那么对应地,若变更后数据中包含第一字符["(+"],将该企业变更信息添加“注册资本变更”标记。
S252、将变更项目包括注册、资本以及变更的企业变更信息,分别提取变更前数据中的金额和变更后数据中的金额,并在变更后数据中的金额大于变更前数据中的金额的情况下,将所述企业变更信息添加注册资本变更标记。
例如,一条企业变更信息中包括["注册","资本","变更"]三个变更项目,提取变更前数据的金额为500万,变更后数据中的金额为1000万,则将该企业变更信息添加“资本变更”标记。
需要说明的是,步骤S251和步骤S252并非必然的执行先后顺序,而是两种不同的添加注册资本变更标记的方法。
206、对未添加注册资本变更标记的企业变更信息进行投资机构的识别,将新加的投资机构数组对应的企业变更信息添加投资人变更标记,将添加投资人变更标记或添加注册资本变更标记的企业变更信息作为与企业投融资事件相关的目标企业变更信息。
具体地,步骤206包括S261~S262:
S261、将未添加注册资本变更标记的企业变更信息中的变更前数据和变更后数据进行过滤以及数组变更,得到变更前的企业数组和变更后的企业数组。
具体地,步骤S261包括:剔除未添加注册资本变更标记的企业变更信息中的变更前数据和变更后数据中的第二字符集;将剔除后的企业变更信息中的变更前数据和变更后数据进行数组变更,得到对应的初始企业数组;将初始企业数组进行多级数组过滤,得到变更前的企业数组和变更后的企业数组,其中,所述数组过滤包括字符串长度过滤、指定字符集过滤、数组结尾字符过滤中的至少一种。
其中,过滤的方法有多种,本实施例中列举几种常见的过滤方式进行示意性的说明。
例如,将第二字符集设置为["更名","地址","企业类型","经营","监事","经理","董事"]等,则将包含上述第二字符的企业变更信息进行剔除。
然后,剔除包含["\\[新增\\]","\\[退出\\]","自然人股东","外籍自然人","其他非自然人投资者","法人股东","外国(地区)企业","企业法人","\\d","人民币实缴出资额折万美元","认缴.实缴.|","认缴.实缴.","认缴实缴",".实缴.|","认缴出资额","出资额","出资方式","美元实缴出资额",]的变更前数据和变更后数据。
再次,将剔除后的企业变更信息中的变更前数据和变更后数据进行数组变更,变更前数据和变更后数据中的[";",";",":",":",",","","、","\\|","","。",",,"替换为","]并根据","拆分,得到初始企业数组。
然后,再经过多级过滤:
剔除初始企业数组中字符串结尾为[".","'","-","*","*美金","其次","期次","占","占股份","占股份美金","*.*万"]的字符;
过滤初始企业数组中字符串小于5的数据;
过滤数组中字符串包含["年月日","吸收","除","到位","住所","收购本企业","经营本企业","批准","出口本企业","受托","董事会","申报","卫生许可","有效证书","报告","仅限","债权","余额","任期","任职","缴清","侧","系统收集","实收资本"]的数据;
过滤数组中字符串不包含["基金","管理计划","信托","公司","有限合伙","合伙企业","管理中心","投资中心","普通合伙","LIMITID","LTD","Limited","集团"]的数据,最终得到变更前的企业数组和变更后的企业数组。
需要说明的是,上述各个字符串仅为示意性的列举,本领域技术人员在具体使用时可以根据实际需求进行字符串的删减。
S262、根据变更前的企业数组和变更后的企业数组的差集,得到新加的投资机构数组,将新加的投资机构数组对应的企业变更信息添加投资人变更标记,将添加投资人变更标记的企业变更信息作为与企业投融资事件相关的目标企业变更信息。
经过步骤S261和S262,可以得到既添加注册资本变更标记又添加投资人变更标记的企业变更信息。此种企业变更信息是本实施例中得到企业投融资记录所需要的信息,但是还需要后续步骤的加工。
207、根据目标企业变更信息与预设的投资机构库进行比较,得到对应的投资机构。
具体地,步骤207包括:
根据目标企业变更信息对应的新加的投资机构数组与投资机构库的机构名称进行匹配;
若匹配,直接将所述目标企业变更信息与匹配的机构名称进行关联;
若不匹配,在投资机构库中新增机构名称,并将所述目标企业变更信息与新增机构名称关联。
208、提取变更时间为同一天,且包括具有注册资本变更标记的企业变更信息以及投资人变更标记的企业变更信息的企业变更信息集。
举例说明,对于企业A的企业变更信息集A1,包括企业变更信息a1、a2、a3、a4,其中企业变更信息a1具有注册资本变更标记,企业变更信息a2具有投资人变更标记,且企业变更信息的变更时间为同一天,则提取企业变更信息集A1。
对于企业A的企业变更信息集A2,包括企业变更信息a5、a6、a7、a8,其中企业变更信息a5具有注册资本变更标记,企业变更信息a6具有投资人变更标记,且企业变更信息a5~a8的变更时间并非同一天,则不提取该企业变更信息集A2。
需要说明的是,在变更时间为企业变更信息中的携带字段,通过比较变更前和变更后的时间的比较,从而确定变更时间是否为同一天。
209、将提取的企业变更信息集中的企业变更信息对应的信息字段进行拼接,得到目标企业的投融资记录信息。
其中,所述信息字段包括投资机构数组、变更时间、企业名称、投资轮次中的至少一个。
需要说明的是,本步骤209中,并非仅将添加标记的企业变更信息对应的信息字段进行拼接,而是将该提取的企业变更信息集中的所有企业变更信息对应的信息字段进行拼接。
图3示出了最终得到的投融资记录信息。由图3中可以看出,在得到每条投融资记录信息后,还可以进一步通过人工干预进行进一步的处理。另外还可以进行编辑和删除的操作。
本发明实施例提供的基于工商数据挖掘企业投融资事件的方法,对所述企业变更信息进行处理,得到与企业投融资事件相关的目标企业变更信息,根据目标企业变更信息与预设的投资机构库进行比较得到对应的投资机构,进而确定符合投融资事件的企业变更信息集及对应的目标企业,并基于目标企业的企业变更信息集及其对应的投资机构进行信息拼接,得到目标企业的投融资记录信息,从而可以让用户直观、准确、及时的获取企业融资情况,辅助用户更好地做出判断。采用本发明实施例所述的方法获取企业投融资数据,可以保证融资纪录准确、及时地呈现给用户。
本发明实施例公开了一种基于工商数据挖掘企业投融资事件的装置,参见图4,包括:
获取模块401,用于获取目标企业的工商数据中的企业变更信息集,其中,所述企业变更信息集包括至少一条企业变更信息;
处理模块402,用于对所述企业变更信息进行处理,得到与企业投融资事件相关的目标企业变更信息;
比较模块403,用于根据目标企业变更信息与预设的投资机构库进行比较,得到对应的投资机构;
拼接模块404,用于确定符合投融资事件的企业变更信息集及对应的目标企业,并基于目标企业的企业变更信息集及其对应的投资机构进行信息拼接,得到目标企业的投融资记录信息。
可选地,处理模块402,具体包括:
判断单元,用于判断所述企业变更信息是否为股东变更信息或者注册资本变更信息,若是,执行第一处理单元,如否,执行第二处理单元;
第一处理单元,用于直接将所述股东变更信息添加投资人变更标记或者将所述注册资本变更信息添加注册资本变更标记,将添加投资人变更标记或添加注册资本变更标记的企业变更信息作为与企业投融资事件相关的目标企业变更信息;
第二处理单元,用于根据企业变更信息进行语义分析,得到对应的变更项目,将包括注册资本变更项目的企业变更信息添加注册资本变更标记;对未添加注册资本变更标记的企业变更信息进行投资机构的识别,将新加的投资机构数组对应的企业变更信息添加投资人变更标记,将添加投资人变更标记或添加注册资本变更标记的企业变更信息作为与企业投融资事件相关的目标企业变更信息。
可选地,第二处理单元,具体用于:
将未添加注册资本变更标记的企业变更信息中的变更前数据和变更后数据进行过滤以及数组变更,得到变更前的企业数组和变更后的企业数组;
根据变更前的企业数组和变更后的企业数组的差集,得到新加的投资机构数组,将新加的投资机构数组对应的企业变更信息添加投资人变更标记。
可选地,第二处理单元,具体用于:
将变更后数据中包括第一字符的企业变更信息添加注册资本变更标记;
将变更项目包括注册、资本以及变更的企业变更信息,分别提取变更前数据中的金额和变更后数据中的金额,并在变更后数据中的金额大于变更前数据中的金额的情况下,将所述企业变更信息添加注册资本变更标记。
可选地,第二处理单元,具体用于:
剔除未添加注册资本变更标记的企业变更信息中的变更前数据和变更后数据中的第二字符集;
将剔除后的企业变更信息中的变更前数据和变更后数据进行数组变更,得到对应的初始企业数组;
将初始企业数组进行多级数组过滤,得到变更前的企业数组和变更后的企业数组,其中,所述数组过滤包括字符串长度过滤、指定字符集过滤、数组结尾字符过滤中的至少一种。
可选地,比较模块403,具体用于:
根据目标企业变更信息对应的新加的投资机构数组与投资机构库的机构名称进行匹配;
若匹配,直接将目标企业变更信息与匹配的机构名称进行关联;
若不匹配,在投资机构库中新增机构名称,并将所述目标企业变更信息与新增机构名称关联。
可选地,拼接模块404,具体用于:
提取变更时间为同一天,且包括具有注册资本变更标记的企业变更信息以及投资人变更标记的企业变更信息的企业变更信息集;
将提取的企业变更信息集中的企业变更信息对应的信息字段进行拼接,得到目标企业的投融资记录信息,其中,所述信息字段包括投资机构数组、变更时间、企业名称、投资轮次中的至少一个。
本发明实施例提供的基于工商数据挖掘企业投融资事件的装置,对所述企业变更信息进行处理,得到与企业投融资事件相关的目标企业变更信息,根据目标企业变更信息与预设的投资机构库进行比较得到对应的投资机构,确定符合投融资事件的企业变更信息集及对应的目标企业,并基于目标企业的企业变更信息集及其对应的投资机构进行信息拼接,得到目标企业的投融资记录信息,从而可以让用户直观、准确、及时的获取企业融资情况,辅助用户更好地做出判断。采用本发明实施例所述的方法获取企业投融资数据,可以保证融资纪录准确、及时地呈现给用户。
图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行基于工商数据挖掘企业投融资事件的方法包括:
获取目标企业的工商数据中的企业变更信息集,其中,所述企业变更信息集包括至少一条企业变更信息;
对所述企业变更信息进行处理,得到与企业投融资事件相关的目标企业变更信息;
根据目标企业变更信息与预设的投资机构库进行比较,得到对应的投资机构;
确定符合投融资事件的企业变更信息集及对应的目标企业,并基于目标企业的企业变更信息集及其对应的投资机构进行信息拼接,得到目标企业的投融资记录信息。
此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的基于工商数据挖掘企业投融资事件的方法,包括:
获取目标企业的工商数据中的企业变更信息集,其中,所述企业变更信息集包括至少一条企业变更信息;
对所述企业变更信息进行处理,得到与企业投融资事件相关的目标企业变更信息;
根据目标企业变更信息与预设的投资机构库进行比较,得到对应的投资机构;
确定符合投融资事件的企业变更信息集及对应的目标企业,并基于目标企业的企业变更信息集及其对应的投资机构进行信息拼接,得到目标企业的投融资记录信息。
又一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的基于工商数据挖掘企业投融资事件的方法包括:
获取目标企业的工商数据中的企业变更信息集,其中,所述企业变更信息集包括至少一条企业变更信息;
对所述企业变更信息进行处理,得到与企业投融资事件相关的目标企业变更信息;
根据目标企业变更信息与预设的投资机构库进行比较,得到对应的投资机构;
确定符合投融资事件的企业变更信息集及对应的目标企业,并基于目标企业的企业变更信息集及其对应的投资机构进行信息拼接,得到目标企业的投融资记录信息。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于工商数据挖掘企业投融资事件的方法,其特征在于,包括:
获取目标企业的工商数据中的企业变更信息集,其中,所述企业变更信息集包括至少一条企业变更信息;
对所述企业变更信息进行处理,得到与企业投融资事件相关的目标企业变更信息;
根据目标企业变更信息与预设的投资机构库进行比较,得到对应的投资机构;
确定符合投融资事件的企业变更信息集及对应的目标企业,并基于目标企业的企业变更信息集及其对应的投资机构进行信息拼接,得到目标企业的投融资记录信息。
2.根据权利要求1所述的基于工商数据挖掘企业投融资事件的方法,其特征在于,对所述企业变更信息进行处理,得到与企业投融资事件相关的目标企业变更信息,包括:
判断所述企业变更信息是否为股东变更信息或者注册资本变更信息;
若是,直接将所述股东变更信息添加投资人变更标记或者将所述注册资本变更信息添加注册资本变更标记,将添加投资人变更标记或添加注册资本变更标记的企业变更信息作为与企业投融资事件相关的目标企业变更信息;
若否,根据企业变更信息进行语义分析,得到对应的变更项目;将包括注册资本变更项目的企业变更信息添加注册资本变更标记;对未添加注册资本变更标记的企业变更信息进行投资机构的识别,将新加的投资机构数组对应的企业变更信息添加投资人变更标记;将添加投资人变更标记或添加注册资本变更标记的企业变更信息作为与企业投融资事件相关的目标企业变更信息。
3.根据权利要求2所述的基于工商数据挖掘企业投融资事件的方法,其特征在于,对未添加注册资本变更标记的企业变更信息进行投资机构的识别,将新加的投资机构数组对应的企业变更信息添加投资人变更标记,包括:
将未添加注册资本变更标记的企业变更信息中的变更前数据和变更后数据进行过滤以及数组变更,得到变更前的企业数组和变更后的企业数组;
根据变更前的企业数组和变更后的企业数组的差集,得到新加的投资机构数组,将新加的投资机构数组对应的企业变更信息添加投资人变更标记。
4.根据权利要求2所述的基于工商数据挖掘企业投融资事件的方法,其特征在于,将包括注册资本变更项目的企业变更信息添加注册资本变更标记,包括:
将变更后数据中包括第一字符的企业变更信息添加注册资本变更标记;
将变更项目包括注册、资本以及变更的企业变更信息,分别提取变更前数据中的金额和变更后数据中的金额,并在变更后数据中的金额大于变更前数据中的金额的情况下,将所述企业变更信息添加注册资本变更标记。
5.根据权利要求3所述的基于工商数据挖掘企业投融资事件的方法,其特征在于,将未添加注册资本变更标记的企业变更信息中的变更前数据和变更后数据进行过滤以及数组变更,得到变更前的企业数组和变更后的企业数组,包括:
剔除未添加注册资本变更标记的企业变更信息中的变更前数据和变更后数据中的第二字符集;
将剔除后的企业变更信息中的变更前数据和变更后数据进行数组变更,得到对应的初始企业数组;
将初始企业数组进行多级数组过滤,得到变更前的企业数组和变更后的企业数组,其中,所述数组过滤包括字符串长度过滤、指定字符集过滤、数组结尾字符过滤中的至少一种。
6.根据权利要求3所述的基于工商数据挖掘企业投融资事件的方法,其特征在于,根据目标企业变更信息与预设的投机机构库进行比较,得到对应的投资机构,包括:
根据目标企业变更信息对应的新加的投资机构数组与投资机构库的机构名称进行匹配;
若匹配,直接将所述目标企业变更信息与匹配的机构名称进行关联;
若不匹配,在投资机构库中新增机构名称,并将所述目标企业变更信息与新增机构名称关联。
7.根据权利要求2所述的基于工商数据挖掘企业投融资事件的方法,其特征在于,确定符合投融资事件的企业变更信息集及对应的目标企业,并基于目标企业的企业变更信息集及其对应的投资机构进行信息拼接,得到目标企业的投融资记录信息,包括:
提取变更时间为同一天,且包括具有注册资本变更标记的企业变更信息以及投资人变更标记的企业变更信息的企业变更信息集;
将提取的企业变更信息集中的企业变更信息对应的信息字段进行拼接,得到目标企业的投融资记录信息,其中,所述信息字段包括投资机构数组、变更时间、企业名称、投资轮次中的至少一个。
8.一种基于工商数据挖掘企业投融资事件的装置,其特征在于,包括:
获取模块,用于获取目标企业的工商数据中的企业变更信息集,其中,所述企业变更信息集包括至少一条企业变更信息;
清洗模块,用于对所述企业变更信息进行处理,得到与企业投融资事件相关的目标企业变更信息;
比较模块,用于根据目标企业变更信息与预设的投资机构库进行比较,得到对应的投资机构;
拼接模块,用于确定符合投融资事件的企业变更信息集及对应的目标企业,并基于目标企业的企业变更信息集及其对应的投资机构进行信息拼接,得到目标企业的投融资记录信息。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述的基于工商数据挖掘企业投融资事件的方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于工商数据挖掘企业投融资事件的方法的步骤。
CN202011142011.5A 2020-10-22 2020-10-22 一种基于工商数据挖掘企业投融资事件的方法及装置 Active CN112330459B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011142011.5A CN112330459B (zh) 2020-10-22 2020-10-22 一种基于工商数据挖掘企业投融资事件的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011142011.5A CN112330459B (zh) 2020-10-22 2020-10-22 一种基于工商数据挖掘企业投融资事件的方法及装置

Publications (2)

Publication Number Publication Date
CN112330459A true CN112330459A (zh) 2021-02-05
CN112330459B CN112330459B (zh) 2021-09-28

Family

ID=74310621

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011142011.5A Active CN112330459B (zh) 2020-10-22 2020-10-22 一种基于工商数据挖掘企业投融资事件的方法及装置

Country Status (1)

Country Link
CN (1) CN112330459B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113129072A (zh) * 2021-04-30 2021-07-16 上海药慧信息技术有限公司 一种基于投融资信息的企业估值确定方法及装置
CN113297238A (zh) * 2021-04-07 2021-08-24 北京金堤征信服务有限公司 基于历史变更记录进行信息挖掘的方法和装置
CN113901834A (zh) * 2021-10-14 2022-01-07 盐城金堤科技有限公司 文本展示方法及其装置、计算机存储介质、电子设备
CN114066331A (zh) * 2022-01-14 2022-02-18 金电联行(北京)信息技术有限公司 股东投资信息获取方法、装置、电子设备及存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060247994A1 (en) * 2001-03-14 2006-11-02 Mark Laycock Method and system for operating a financial instrument
US9449328B2 (en) * 2014-10-20 2016-09-20 Bank Of America Corporation System for encoding customer data
CN107945024A (zh) * 2017-12-12 2018-04-20 厦门市美亚柏科信息股份有限公司 识别互联网金融借贷企业经营异常的方法、终端设备及存储介质
CN108399240A (zh) * 2018-02-28 2018-08-14 北京金堤科技有限公司 企业变更信息数据挖掘方法和系统
CN108763507A (zh) * 2018-05-30 2018-11-06 北京百度网讯科技有限公司 企业关联关系挖掘方法和装置
CN110110231A (zh) * 2019-04-30 2019-08-09 翟红鹰 大数据技术的智能投资推荐方法、系统、终端及存储介质
CN110597870A (zh) * 2019-08-05 2019-12-20 长春市万易科技有限公司 一种企业关系挖掘方法
CN110619462A (zh) * 2019-09-10 2019-12-27 苏州方正璞华信息技术有限公司 一种基于ai模型的项目质量评估方法
CN111091467A (zh) * 2018-10-23 2020-05-01 上海交通大学 基于区块链与深度学习的股权交易管理计算机仿真系统
US10679166B2 (en) * 2012-09-28 2020-06-09 Oracle International Corporation Supply chain financial orchestration system
US10719888B2 (en) * 2002-09-09 2020-07-21 Xenogenic Development Limited Liability Company Context search system
CN111523853A (zh) * 2020-04-14 2020-08-11 上海资信有限公司 一种企业信用信息加工、整理及存储的管理方法
CN111680055A (zh) * 2020-06-10 2020-09-18 南京电狐网络科技有限公司 一种基于大数据的企业风控信息监控管理系统

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060247994A1 (en) * 2001-03-14 2006-11-02 Mark Laycock Method and system for operating a financial instrument
US10719888B2 (en) * 2002-09-09 2020-07-21 Xenogenic Development Limited Liability Company Context search system
US10679166B2 (en) * 2012-09-28 2020-06-09 Oracle International Corporation Supply chain financial orchestration system
US9449328B2 (en) * 2014-10-20 2016-09-20 Bank Of America Corporation System for encoding customer data
CN107945024A (zh) * 2017-12-12 2018-04-20 厦门市美亚柏科信息股份有限公司 识别互联网金融借贷企业经营异常的方法、终端设备及存储介质
CN108399240A (zh) * 2018-02-28 2018-08-14 北京金堤科技有限公司 企业变更信息数据挖掘方法和系统
CN108763507A (zh) * 2018-05-30 2018-11-06 北京百度网讯科技有限公司 企业关联关系挖掘方法和装置
CN111091467A (zh) * 2018-10-23 2020-05-01 上海交通大学 基于区块链与深度学习的股权交易管理计算机仿真系统
CN110110231A (zh) * 2019-04-30 2019-08-09 翟红鹰 大数据技术的智能投资推荐方法、系统、终端及存储介质
CN110597870A (zh) * 2019-08-05 2019-12-20 长春市万易科技有限公司 一种企业关系挖掘方法
CN110619462A (zh) * 2019-09-10 2019-12-27 苏州方正璞华信息技术有限公司 一种基于ai模型的项目质量评估方法
CN111523853A (zh) * 2020-04-14 2020-08-11 上海资信有限公司 一种企业信用信息加工、整理及存储的管理方法
CN111680055A (zh) * 2020-06-10 2020-09-18 南京电狐网络科技有限公司 一种基于大数据的企业风控信息监控管理系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HENRY M. KIM: "How to build enterprise data models to achieve compliance to standards or regulatory requirements", 《JOURNAL OF THE ASSOCIATION FOR INFORMATION SYSTEMS》 *
王鑫洋: "上市公司高管变更公告的股价效应研究", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》 *
陈岚君: "建立大型集团型企业投资系统", 《中国科技信息》 *
黄刚: "国有企业开展股权投资后评价审计的实践", 《中国内部审计》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113297238A (zh) * 2021-04-07 2021-08-24 北京金堤征信服务有限公司 基于历史变更记录进行信息挖掘的方法和装置
CN113297238B (zh) * 2021-04-07 2023-10-20 北京金堤征信服务有限公司 基于历史变更记录进行信息挖掘的方法和装置
CN113129072A (zh) * 2021-04-30 2021-07-16 上海药慧信息技术有限公司 一种基于投融资信息的企业估值确定方法及装置
CN113901834A (zh) * 2021-10-14 2022-01-07 盐城金堤科技有限公司 文本展示方法及其装置、计算机存储介质、电子设备
CN114066331A (zh) * 2022-01-14 2022-02-18 金电联行(北京)信息技术有限公司 股东投资信息获取方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN112330459B (zh) 2021-09-28

Similar Documents

Publication Publication Date Title
CN112330459B (zh) 一种基于工商数据挖掘企业投融资事件的方法及装置
CN107945024B (zh) 识别互联网金融借贷企业经营异常的方法、终端设备及存储介质
US8082193B2 (en) Multi-jurisdictional payroll requirements
CN107274291B (zh) 跨平台的估值表解析方法、存储介质及应用服务器
US20210327001A1 (en) Error control in multicomputer data processing
CN105303445A (zh) 农业投融资平台风险评估装置及系统
CN107688591A (zh) 一种精算处理方法和装置
CN110796539A (zh) 一种征信评估方法及装置
CN106651547A (zh) 数据处理方法及装置
CN115577691A (zh) 标书生成方法、存储介质及电子装置
CN114819618A (zh) 辅助政府投资决策的企业画像模型的构建方法
Černius et al. Financial information and management decisions: Impact of accounting policy on financial indicators of the firm
CN112633889A (zh) 一种企业基因测序系统及方法
US8682684B2 (en) Method, apparatus and computer program product for monitoring compliance in reporting unclaimed property
CN110009487A (zh) 一种金融借贷风险评估方法及系统
CN111428497A (zh) 一种自动抽取出资信息的方法、装置及设备
CN111177771A (zh) 一种人员简历的生成方法及装置
CN102521776A (zh) 一种对会计分录进行财务分析的方法
CN112989021B (zh) 用于顾问行为违规判定的方法、装置及设备
CN114971854A (zh) 一种交易信息处理方法及装置
CN114066331A (zh) 股东投资信息获取方法、装置、电子设备及存储介质
CN112734210A (zh) 一种智能分案方法及系统
Sudhamathi Artificial intelligence in accounting profession: A way forward
CN109949145A (zh) 一种基于复试记账法的每日账簿算法
CN112287237B (zh) 用于第三方交易平台的交易数据分析方法、装置及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 200131 3rd floor, building 1, 400 Fangchun Road, China (Shanghai) pilot Free Trade Zone, Pudong New Area, Shanghai

Patentee after: Shanghai Huabin Licheng Technology Co.,Ltd.

Country or region after: China

Address before: 102299 c2040, 2 / F, building 16, courtyard 37, Chaoqian Road, science and Technology Park, Changping District, Beijing

Patentee before: Beijing Huabin Licheng Technology Co.,Ltd.

Country or region before: China