CN108647288A - 企业关系的挖掘方法、装置、计算机设备及存储介质 - Google Patents
企业关系的挖掘方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN108647288A CN108647288A CN201810421649.9A CN201810421649A CN108647288A CN 108647288 A CN108647288 A CN 108647288A CN 201810421649 A CN201810421649 A CN 201810421649A CN 108647288 A CN108647288 A CN 108647288A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- data
- personnel
- relationship
- modeling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000000547 structure data Methods 0.000 claims abstract description 35
- 238000005065 mining Methods 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 13
- 238000013500 data storage Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开一种企业关系的挖掘方法、装置、计算机设备及存储介质。所述挖掘方法包括:从关系型数据库中获取企业数据,所述企业数据包括企业标识、企业人员、企业与企业之间的关系、企业与所述企业人员之间的关系、所述企业人员与所述企业人员之间的关系中的至少一种。利用图结构对获取到的所述企业数据进行建模,得到建模后的图结构数据。通过获取企业数据,利用图结构方式对企业数据进行建模,获取建模后的图结构数据;实现将企业数据直接建模为图结构数据,解决了关系型数据库所导致的企业数据关联性差的技术问题。
Description
技术领域
本申请涉及互联网技术领域,特别是涉及一种企业关系的挖掘方法、装置、计算机设备及存储介质。
背景技术
随着互联网行业的高速发展,在对企业关系进行挖掘时,企业数据具有数据量大、数据形式多样、处于实时更新的动态形式、各个企业或个人之间存在复杂的关联等特点。
在传统技术中,通过关系型数据库中的关系模型进行企业关系挖掘,主要通过关系型数据库中数据表的行来表示企业关系相应的数据。即通过将关系型数据库中的数据表关联起来,进而将数据表中的数据不断迭代以实现企业关系的挖掘。
然而,伴随着业数据量的快速增涨、企业数据内部关系的关联性及复杂度的增加,特别是业务复杂的互联网企业,由于关系型数据库结构简单,仅能通过数据表中的行来表示企业数据,会存在企业数据之间关联性差的技术问题。
发明内容
基于此,有必要针对利用上述传统技术进行企业关系挖掘时存在企业数据关联性差的技术问题,提供一种企业关系的挖掘方法、装置、计算机设备及存储介质。
一种企业关系的挖掘方法,包括:从关系型数据库中获取企业数据,所述企业数据包括企业标识、企业人员、企业与企业之间的关系、企业与所述企业人员之间的关系、所述企业人员与所述企业人员之间的关系中的至少一种对应的数据。利用图结构对获取到的所述企业数据进行建模,得到建模后的图结构数据。
在其中一个实施例中,所述从关系型数据库中获取企业数据之前,所述方法包括:通过网络爬虫实时获取企业的原始数据,对所述原始数据进行处理以获取所述企业数据;将所述企业数据存储在关系型数据库中。
在其中一个实施例中,所述图结构包括顶点、边、顶点属性及边属性;所述利用图结构对所述企业数据进行建模,包括:将所述企业标识、所述企业人员建模为顶点,将与所述企业标识和所述企业人员对应的数据建模为顶点属性;
将企业与企业之间的关系、企业与所述企业人员之间的关系、所述企业人员与所述企业人员之间的关系中的至少一种关系建模为边;将企业与企业之间的关系、企业与所述企业人员之间的关系、所述企业人员与所述企业人员之间的关系中的至少一种关系对应的数据建模为边属性。
在其中一个实施例中,所述方法还包括:通过图数据存储引擎,采用批量、实时或自定义中的任一方式,将建模后的图结构数据进行存储。
一种企业关系的挖掘装置,其特征在于,所述装置包括:企业数据获取模块,用于从关系型数据库中获取企业数据,所述企业数据包括企业标识、企业人员、企业与企业之间的关系、企业与所述企业人员之间的关系、所述企业人员与所述企业人员之间的关系中的至少一种;建模模块,用于利用图结构对所述企业数据进行建模,得到建模后的图结构数据。
在其中一个实施例中,所述装置还包括:原始数据采集模块,用于通过网络爬虫实时获取企业的原始数据,对所述原始数据进行处理以获取所述企业数据;并将所述企业数据存储在关系型数据库中。
在其中一个实施例中,所述图结构包括顶点、边、顶点属性及边属性;所述建模模块还用于:将所述企业标识、所述企业人员建模为顶点;将企业与企业之间的关系、企业与所述企业人员之间的关系、所述企业人员与所述企业人员之间的关系中的至少一种关系建模为边;将与所述企业标识和所述企业人员对应的数据建模为顶点属性;将所述企业之间的关系、所述企业与所述企业人员之间的关系、所述企业人员之间的关系中的至少一种关系对应的数据建模为边属性。
在其中一个实施例中,所述装置还包括:图结构数据存储模块,用于通过图数据存储引擎,采用批量、实时或自定义中的任一方式,将建模后的图结构数据进行存储。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例中的方法步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例中的方法步骤。
上述企业关系的挖掘方法、装置、计算机设备及存储介质,通过获取企业数据;利用图结构方式对企业数据进行建模;获取建模后的图结构数据;实现将企业数据直接建模为图结构数据,解决了关系型数据库所导致的企业数据关联性差的技术问题。
附图说明
图1为一个实施例中企业关系的挖掘方法的应用环境图;
图2为一个实施例中企业关系的挖掘方法的流程示意图;
图3为一个实施例中图结构的示意图;
图4为图2对应的实施例中在S210步骤之前的流程示意图;
图5为图2对应的实施例中S220步骤的流程示意图;
图6为另一个实施例中企业关系的挖掘方法的流程示意图;
图7为一个实施例中表示企业关系的图结构的示意图;
图8为一个实施例中企业关系的挖掘装置的结构框图;
图9为另一个实施例中企业关系的挖掘装置的结构框图;
图10为又一个实施例中企业关系的挖掘装置的结构框图;
图11为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的企业关系的挖掘方法,可以应用于如图1所示的应用环境中。其中,关系型数据库服务器110通过网络与图数据服务器120进行通信。关系型数据库服务器110利用网络爬虫从互联网上获取企业原始数据。关系型数据库服务器110对企业原始数据进行处理并存储为企业数据,图数据服务器120可以通过网络访问关系型数据库服务器110获取企业数据。图数据服务器120通过获取企业数据,利用图结构方式对企业数据进行建模,从而得到建模后的图结构数据,并通过图数据存储引擎将建模后的图结构数据进行存储。其中,关系型数据库服务器110或者图数据服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,请参见图2,提供了一种企业关系的挖掘方法,以该方法应用于图1中的图数据服务器120为例进行说明,包括以下步骤:
S210、从关系型数据库中获取企业数据。
其中,企业指的是以盈利为目的,运用各种生产要素向市场提供商品或服务,实行自主经营、自负盈亏、独立核算的法人或其他社会经济组织。企业数据指的是与企业经营相关的信息数据。具体地,关系型数据库服务器中存储有企业数据,图数据服务器通过网络从关系型数据库中获取相应的企业数据。
其中,企业数据包括企业标识、企业人员、企业与企业之间的关系、企业与企业人员之间的关系、企业人员与企业人员之间的关系中的至少一种对应的数据。企业标识指的是用于唯一表示企业的标识。企业人员指的是在企业中担任重要职位且承担企业运营责任的人员。企业与企业之间的关系指的是一个企业与其他企业之间存在直接或间接的控制关系或其他影响关系。企业与企业人员之间的关系指的是一个企业与其相应的企业人员之间存在的关联关系。企业人员与企业人员之间的关系指的是企业中企业人员之间存在的相关性。
S220、利用图结构对获取到的企业数据进行建模,得到建模后的图结构数据。
其中,图结构是一种用于表示复杂关系的数据结构,包括顶点的有穷非空集合和顶点之间的边的集合,还可以在顶点与边设有相应的属性。图结构可以表示为G=(V,E),也可以表示为G=(V,E,D)。图结构数据指的是由若干个图形数据元素按照一定关系所组成的有序集。图结构数据用于表示数据所对应的元素之间的几何关系、拓扑关系。需要说明的是,G、V、E、D分别是Graph(图)、Vertex(顶点)、Edge(边)、Data(属性)的首字母大写。图形数据元素可以是图结构中的顶点,也可以是图结构中的边,也可以是顶点和边对应的属性。请参见图3,圆圈表示顶点,圆圈之间的连接线表示边,圆圈中填写的阿拉伯数字表示顶点属性,连接线上的箭头表示边属性。边属性也可以采用其他形式表示。比如,采用文字说明的形式。
具体地,从关系型数据库中获取企业数据,可以利用图结构中的顶点、边对企业标识、企业人员、企业与企业之间的关系、企业与企业人员之间的关系、企业人员与企业人员之间的关系进行建模。也可以利用图结构中的顶点属性、边属性对与企业标识、企业人员、企业与企业之间的关系、企业与企业人员之间的关系、企业人员与企业人员之间的关系对应的数据进行建模。从而得到建模后与企业数据对应的图结构数据
上述企业关系的挖掘方法中,通过从关系型数据库中获取企业数据,利用图结构方式对企业数据进行建模,获取建模后的图结构数据,实现了将企业数据直接建模为图结构数据,解决了关系型数据库所导致的企业数据关联性差的技术问题。
在一个实施例中,请参见图4,从关系型数据库中获取企业数据之前,该方法包括以下步骤:
S410、通过网络爬虫实时获取企业的原始数据,对原始数据进行处理以获取企业数据。
其中,网络爬虫指的是一种按照一定的规则自动地抓取万维网信息的程序或者脚本。企业的原始数据指的是网络爬虫从万维网中抓取的且没有经过任何处理的数据。具体地,通过网络爬虫从万维网中实时抓取企业的原始数据,对企业的原始数据进行自然语言处理,按照企业标识和数据维度对企业的原始数据进行分类处理,从而获取到企业数据。其中,数据维度可以用于描述企业数据的类别。
S420、将企业数据存储在关系型数据库中。
按照企业标识和数据维度对企业的原始数据进行分类处理,将企业原始数据存储在一个个数据表中,获取到关系型的企业数据,将企业数据存储在关系型数据库中。
上述企业关系的挖掘方法中,通过实时获取企业的原始数据,确保及时更新企业的原始数据,进而实时更新企业数据对应的图结构模型。
在一个实施例中,请参见图5,图结构包括顶点、边、顶点属性及边属性;利用图结构对企业数据进行建模,包括以下步骤:
S510、将企业标识、企业人员建模为顶点,将与企业标识、企业人员对应的数据建模为顶点属性。
可以将企业标识建模为图结构的顶点,也可以将企业人员建模为图结构的顶点。比如,企业标识可以是企业名称,也可以是企业标志,则可以将企业名称或者企业标志建模为图结构的顶点。企业人员具体可以是企业的董监高,也可以是企业的法定代表人,还可以是股东,则可以将企业的董监高、企业的法定代表人、股东建模为图结构的顶点。
企业数据包括企业标识对应的数据和/或企业人员对应的数据。可以将与企业标识对应的数据建模为顶点属性,也可以将与企业人员对应的数据建模为顶点属性。比如,企业标识对应的数据可以是企业名称,如XX公司,也可以是企业标志,如商标。企业人员对应的数据可以是企业的董监高的姓名,也可以是企业的法定代表人的姓名,还可以是股东的姓名。姓名可以是中文的,也可以是英文的。如张三,Zhang。
S520、将企业与企业之间的关系、企业与企业人员之间的关系、企业人员与企业人员之间的关系中的至少一种关系建模为边,将企业与企业之间的关系、企业与企业人员之间的关系、企业人员与企业人员之间的关系中的至少一种关系对应的数据建模为边属性。
可以将企业与企业之间的关系建模为边,可以将企业与企业人员之间的关系建模为边,可以将企业人员与企业人员之间的关系中建模为边。比如,企业与企业之间的关系可以是控股关系,也可以是从属关系,则将控股关系、从属关系建模为边。企业与企业人员之间的关系可以是投资关系,也可以是管理关系,则将投资关系、管理关系建模为边。企业人员与企业人员之间的关系可以是夫妻关系,也可以是亲属关系,则将夫妻关系、亲属关系建模为边。
企业数据包括企业与企业之间的关系、企业与企业人员之间的关系、企业人员与企业人员之间的关系中的至少一种关系对应的数据。可以将企业之间的关系对应的数据建模为边属性,也可以将企业与企业人员之间的关系对应的数据建模为边属性,还可以将企业人员之间的关系中的至少一种关系对应的数据建模为边属性。比如,企业与企业人员之间的关系对应的数据可以是投资占比或者投资金额,也可以是高管职位。如总经理、董事、监事等。企业人员与企业人员之间的关系对应的数据可以是夫妻、亲属等。
上述企业关系的挖掘方法中,通过将企业标识、企业人员建模为顶点,将企业与企业之间的关系、企业与企业人员之间的关系、企业人员与企业人员之间的关系中的至少一种关系建模为边,将与企业标识、企业人员对应的数据建模为顶点属性,将企业与企业之间的关系、企业与企业人员之间的关系、企业人员与企业人员之间的关系中的至少一种关系对应的数据建模为边属性,实现了对企业数据的图结构建模,解决了关系数据建模简单所导致的企业数据关联性差的技术问题。
在一个实施例中,该方法还包括:通过图数据存储引擎,采用批量、实时或自定义中的任一方式,将建模后的图结构数据进行存储。
利用图结构中的顶点、边、顶点的属性及边的属性对企业数据进行建模,得到建模后与企业数据对应的图结构数据。采用批量、实时或自定义中的任一方式通过图数据存储引擎将得到的图结构数据以二进制形式进行存储。通过图数据存储引擎可以将图结构数据进行批量存储,也可以采用实时方式将图结构数据进行一个一个地存储。当批量或者实时的加载方式无法满足需求时,可以自定义数据加载的方式,如数据文件拷贝。
在一个实施例中,如图6所示,本实施例提供了一种企业关系的挖掘方法,包括以下步骤:
S610、通过网络爬虫实时获取企业的原始数据,对原始数据进行处理。
网络爬虫抓取到企业的原始数据,首先按照企业标识对企业的原始数据进行分类,然后按照企业的数据维度进行分类,从而获取到企业数据。数据维度可以用于描述企业数据的类别,比如数据维度可以包括工商基础信息、对外投资、失信、法院公告、裁判文书、开庭公告的类别,还可以包括税务、证书、软件著作权、财务信息、招投标、员工信息、司法拍卖等类别。
S620、将企业数据存储在关系型数据库中。
按照企业标识和数据维度对企业的原始数据进行分类处理,将企业原始数据存储在一个个数据表中,获取到关系型的企业数据,从而将企业数据存储在关系型数据库中。
S630、从关系型数据库中获取企业数据。
关系型数据库服务器中存储有企业数据,图数据服务器通过网络从关系型数据库中获取相应的企业数据。企业数据包括企业标识、企业人员、企业与企业之间的关系、企业与企业人员之间的关系、企业人员与企业人员之间的关系中的至少一个对应的数据。比如,请参见图7,企业始数据包括公司甲、公司乙、公司丙、张三、李四、公司甲与公司乙之间存在的控制关系、公司丙与公司乙之间存在的从属关系、张三对公司甲的参股行为、张三作为公司乙的法人代表、李四与公司丙的投资关系、李四作为公司甲的董事、张三与李四之间的夫妻关系对应的数据。
S640、将企业标识、企业人员建模为图结构的顶点,将与企业标识、企业人员对应的数据建模为顶点属性。
可以将企业标识建模为图结构的顶点,也可以将企业人员建模为图结构的顶点。可以将与企业标识对应的数据建模为顶点属性,也可以将与企业人员对应的数据建模为顶点属性。比如,请参见图7,将公司甲、公司乙、公司丙、张三、李四将建模为图结构的顶点。企业标识对应的数据分别为公司甲、公司乙、公司丙,企业人员对应的数据数据分别为张三、李四。
S650、将企业与企业之间的关系、企业与企业人员之间的关系、企业人员与企业人员之间的关系中的至少一种关系建模为图结构的边,将企业与企业之间的关系、企业与企业人员之间的关系、企业人员与企业人员之间的关系中的至少一种关系对应的数据建模为边属性。
可以将企业与企业之间的关系建模为边,可以将企业与企业人员之间的关系建模为边,可以将企业人员与企业人员之间的关系中建模为边。可以将企业之间的关系对应的数据建模为边属性,也可以将企业与企业人员之间的关系对应的数据建模为边属性,还可以将企业人员之间的关系中的至少一种关系对应的数据建模为边属性。比如,请参见图7,将公司甲与公司乙之间存在控制关系、公司丙与公司乙之间存在从属关系、张三与公司甲的参股关系、张三是公司乙的法人代表、李四与公司丙投资关系、李四是公司甲的董事、张三与李四之间的夫妻关系建模为图结构的边。将公司甲与公司乙之间的控制关系对应的控股比例数据建模为公司甲与公司乙之间的边属性,将公司丙与公司乙之间的从属关系数据建模为公司丙与公司乙之间的边属性,张三对公司甲的参股数据建模为张三与公司甲之间的边属性,将张三作为公司乙的法人代表建模为张三与公司乙之间的边属性,将李四对公司丙的投资对应的数据建模为李四与公司丙之间的边属性,将李四作为公司甲的董事建模为李四与公司甲之间的边属性,将张三与李四之间的夫妻关系建模为张三与李四之间的边属性。
S660、采用批量、实时或自定义中的任一方式,将建模后的图结构数据进行存储。
利用图结构中的顶点、边、顶点的属性及边的属性对企业数据进行建模,得到建模后与企业数据对应的图结构数据。采用批量、实时或自定义中的任一方式通过图数据存储引擎将得到的图结构数据以二进制形式进行存储。
应该理解的是,虽然图2、图4、图5和图6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且图2、图4、图5和图6中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图8所示,提供了一种企业关系的挖掘装置,挖掘装置包括原始数据获取模块810、建模模块820。其中,
原始数据获取模块810,用于从关系型数据库中获取企业数据。企业数据包括企业标识、企业人员、企业与企业之间的关系、企业与企业人员之间的关系、企业人员与企业人员之间的关系中的至少一种。
建模模块820,用于利用图结构对企业数据进行建模,得到建模后的图结构数据。
在一个实施例中,如图9所示,挖掘装置还包括原始数据采集模块910,用于通过网络爬虫实时获取企业的原始数据,对原始数据进行处理以获取企业数据;并将企业数据存储在关系型数据库中。
在一个实施例中,图结构包括顶点、边、顶点属性及边属性。建模模块820还用于:将企业标识、企业人员建模为顶点;将与企业标识和企业人员对应的数据建模为顶点属性;将企业与企业之间的关系、企业与企业人员之间的关系、企业人员与企业人员之间的关系中的至少一种关系建模为边;将企业之间的关系、企业与企业人员之间的关系、企业人员之间的关系中的至少一种关系对应的数据建模为边属性。
在一个实施例中,如图10所示,挖掘装置还包括图结构数据存储模块1010,用于通过图数据存储引擎,采用批量、实时或自定义中的任一方式,将建模后的图结构数据进行存储。
关于企业关系的挖掘装置的具体限定可以参见上文中对于企业关系的挖掘方法的限定,在此不再赘述。上述企业关系的挖掘装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储图结构数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现上述任一实施例中的企业关系的挖掘方法。
本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例中的方法步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一实施例中的企业关系的挖掘方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种企业关系的挖掘方法,其特征在于,包括:
从关系型数据库中获取企业数据,所述企业数据包括企业标识、企业人员、企业与企业之间的关系、企业与所述企业人员之间的关系、所述企业人员与所述企业人员之间的关系中的至少一种对应的数据;
利用图结构对获取到的所述企业数据进行建模,得到建模后的图结构数据。
2.根据权利要求1所述的方法,其特征在于,所述从关系型数据库中获取企业数据之前,所述方法包括:
通过网络爬虫实时获取企业的原始数据,对所述原始数据进行处理以获取所述企业数据;
将所述企业数据存储在关系型数据库中。
3.根据权利要求1所述的方法,其特征在于,所述图结构包括顶点、边、顶点属性及边属性;所述利用图结构对所述企业数据进行建模,包括:
将所述企业标识、所述企业人员建模为顶点,将与所述企业标识和所述企业人员对应的数据建模为顶点属性;
将企业与企业之间的关系、企业与所述企业人员之间的关系、所述企业人员与所述企业人员之间的关系中的至少一种关系建模为边;将企业与企业之间的关系、企业与所述企业人员之间的关系、所述企业人员与所述企业人员之间的关系中的至少一种关系对应的数据建模为边属性。
4.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:
通过图数据存储引擎,采用批量、实时或自定义中的任一方式,将建模后的图结构数据进行存储。
5.一种企业关系的挖掘装置,其特征在于,所述装置包括:
企业数据获取模块,用于从关系型数据库中获取企业数据,所述企业数据包括企业标识、企业人员、企业与企业之间的关系、企业与所述企业人员之间的关系、所述企业人员与所述企业人员之间的关系中的至少一种;
建模模块,用于利用图结构对所述企业数据进行建模,得到建模后的图结构数据。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
原始数据采集模块,用于通过网络爬虫实时获取企业的原始数据,对所述原始数据进行处理以获取所述企业数据;并将所述企业数据存储在关系型数据库中。
7.根据权利要求5所述的装置,其特征在于,所述图结构包括顶点、边、顶点属性及边属性;所述建模模块还用于:
将所述企业标识、所述企业人员建模为顶点;
将企业与企业之间的关系、企业与所述企业人员之间的关系、所述企业人员与所述企业人员之间的关系中的至少一种关系建模为边;
将与所述企业标识和所述企业人员对应的数据建模为顶点属性;
将所述企业之间的关系、所述企业与所述企业人员之间的关系、所述企业人员之间的关系中的至少一种关系对应的数据建模为边属性。
8.根据权利要求5所述的装置,其特征在于,所述装置还包括:
图结构数据存储模块,用于通过图数据存储引擎,采用批量、实时或自定义中的任一方式,将建模后的图结构数据进行存储。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810421649.9A CN108647288A (zh) | 2018-05-04 | 2018-05-04 | 企业关系的挖掘方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810421649.9A CN108647288A (zh) | 2018-05-04 | 2018-05-04 | 企业关系的挖掘方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108647288A true CN108647288A (zh) | 2018-10-12 |
Family
ID=63749392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810421649.9A Pending CN108647288A (zh) | 2018-05-04 | 2018-05-04 | 企业关系的挖掘方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108647288A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109558522A (zh) * | 2018-12-19 | 2019-04-02 | 重庆百行智能数据科技研究院有限公司 | 企业网络图的建立方法、装置和计算机可读存储介质 |
CN112270195A (zh) * | 2020-11-25 | 2021-01-26 | 上海水滴征信服务有限公司 | 确定企业关联关系、重名对象判定 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101308493A (zh) * | 2007-05-18 | 2008-11-19 | 亿览在线网络技术(北京)有限公司 | 实体关系展现方法和系统 |
CN104573133A (zh) * | 2015-02-13 | 2015-04-29 | 广州神马移动信息科技有限公司 | 存储数据的方法和设备 |
US20160004757A1 (en) * | 2013-10-04 | 2016-01-07 | Hitachi, Ltd. | Data management method, data management device and storage medium |
CN105740335A (zh) * | 2016-01-22 | 2016-07-06 | 山东合天智汇信息技术有限公司 | 一种基于titan的企业信息分析平台及其构建方法 |
CN106528822A (zh) * | 2016-11-17 | 2017-03-22 | 山东合天智汇信息技术有限公司 | 一种企业关系圈构建方法、查询方法及系统 |
CN107315856A (zh) * | 2017-05-27 | 2017-11-03 | 全球能源互联网研究院 | 一种基于图数据库的电网gis的建模方法及装置 |
CN107402927A (zh) * | 2016-05-19 | 2017-11-28 | 上海斯睿德信息技术有限公司 | 一种基于图模型的企业关联关系拓扑建立方法及查询方法 |
CN107644065A (zh) * | 2017-08-31 | 2018-01-30 | 北京金堤科技有限公司 | 企业信息关系网络的构建方法及装置 |
CN107679160A (zh) * | 2017-09-28 | 2018-02-09 | 深圳市华傲数据技术有限公司 | 基于图数据库的数据处理方法及装置 |
CN107832407A (zh) * | 2017-11-03 | 2018-03-23 | 上海点融信息科技有限责任公司 | 用于生成知识图谱的信息处理方法、装置和可读存储介质 |
-
2018
- 2018-05-04 CN CN201810421649.9A patent/CN108647288A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101308493A (zh) * | 2007-05-18 | 2008-11-19 | 亿览在线网络技术(北京)有限公司 | 实体关系展现方法和系统 |
US20160004757A1 (en) * | 2013-10-04 | 2016-01-07 | Hitachi, Ltd. | Data management method, data management device and storage medium |
CN104573133A (zh) * | 2015-02-13 | 2015-04-29 | 广州神马移动信息科技有限公司 | 存储数据的方法和设备 |
CN105740335A (zh) * | 2016-01-22 | 2016-07-06 | 山东合天智汇信息技术有限公司 | 一种基于titan的企业信息分析平台及其构建方法 |
CN107402927A (zh) * | 2016-05-19 | 2017-11-28 | 上海斯睿德信息技术有限公司 | 一种基于图模型的企业关联关系拓扑建立方法及查询方法 |
CN106528822A (zh) * | 2016-11-17 | 2017-03-22 | 山东合天智汇信息技术有限公司 | 一种企业关系圈构建方法、查询方法及系统 |
CN107315856A (zh) * | 2017-05-27 | 2017-11-03 | 全球能源互联网研究院 | 一种基于图数据库的电网gis的建模方法及装置 |
CN107644065A (zh) * | 2017-08-31 | 2018-01-30 | 北京金堤科技有限公司 | 企业信息关系网络的构建方法及装置 |
CN107679160A (zh) * | 2017-09-28 | 2018-02-09 | 深圳市华傲数据技术有限公司 | 基于图数据库的数据处理方法及装置 |
CN107832407A (zh) * | 2017-11-03 | 2018-03-23 | 上海点融信息科技有限责任公司 | 用于生成知识图谱的信息处理方法、装置和可读存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109558522A (zh) * | 2018-12-19 | 2019-04-02 | 重庆百行智能数据科技研究院有限公司 | 企业网络图的建立方法、装置和计算机可读存储介质 |
CN112270195A (zh) * | 2020-11-25 | 2021-01-26 | 上海水滴征信服务有限公司 | 确定企业关联关系、重名对象判定 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110489561B (zh) | 知识图谱构建方法、装置、计算机设备和存储介质 | |
CN108509485B (zh) | 数据的预处理方法、装置、计算机设备和存储介质 | |
CN109858737B (zh) | 基于模型部署的评分模型调整方法、装置和计算机设备 | |
CN108876133A (zh) | 基于业务信息的风险评估处理方法、装置、服务器和介质 | |
CN109389303B (zh) | 企业关系的查询方法、装置、计算机设备及存储介质 | |
CN108664582B (zh) | 企业关系的查询方法、装置、计算机设备及存储介质 | |
CN108717426B (zh) | 企业数据的更新方法、装置、计算机设备及存储介质 | |
CN112861662B (zh) | 基于人脸和交互文本的目标对象行为预测方法及相关设备 | |
CN112231416B (zh) | 知识图谱本体更新方法、装置、计算机设备及存储介质 | |
CN112699923A (zh) | 文档分类预测方法、装置、计算机设备及存储介质 | |
CN115423578B (zh) | 基于微服务容器化云平台的招投标方法和系统 | |
CN112990281A (zh) | 异常投标识别模型训练方法、异常投标识别方法及装置 | |
CN114677695A (zh) | 表格解析方法、装置、计算机设备和存储介质 | |
CN112417315A (zh) | 基于网站注册的用户画像生成方法、装置、设备和介质 | |
CN108647288A (zh) | 企业关系的挖掘方法、装置、计算机设备及存储介质 | |
CN111984659A (zh) | 数据更新方法、装置、计算机设备和存储介质 | |
DE102017006557A1 (de) | Verwenden von Markierungen zum Verfolgen von hochfrequenten Offsets für Patchabgleichsalgorithmen | |
CN114741402A (zh) | 业务特征池的处理方法、装置、计算机设备和存储介质 | |
CN114299500A (zh) | 识别方法、装置、计算机设备和存储介质 | |
CN110097250B (zh) | 产品风险预测方法、装置、计算机设备和存储介质 | |
CN111444368B (zh) | 构建用户画像的方法、装置、计算机设备及存储介质 | |
CN112836041A (zh) | 人员关系分析方法、装置、设备及存储介质 | |
EP4202808A1 (en) | Method and system for extracting contextual product feature model from requirements specification documents | |
CN110598124A (zh) | 数值属性挖掘方法、装置、计算机设备和存储介质 | |
CN115545976A (zh) | 跨境商标注册方法、系统、装置及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181012 |
|
RJ01 | Rejection of invention patent application after publication |