CN113254732B - 企业关系的确定方法、装置、计算机设备和存储介质 - Google Patents
企业关系的确定方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113254732B CN113254732B CN202110803816.8A CN202110803816A CN113254732B CN 113254732 B CN113254732 B CN 113254732B CN 202110803816 A CN202110803816 A CN 202110803816A CN 113254732 B CN113254732 B CN 113254732B
- Authority
- CN
- China
- Prior art keywords
- name
- branch
- office
- enterprise
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000003860 storage Methods 0.000 title claims abstract description 15
- 238000001914 filtration Methods 0.000 claims description 40
- 238000004590 computer program Methods 0.000 claims description 14
- 239000004566 building material Substances 0.000 claims description 6
- 238000012797 qualification Methods 0.000 claims description 5
- 239000012773 agricultural material Substances 0.000 claims description 4
- 230000007246 mechanism Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 238000009313 farming Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种企业关系的确定方法、装置、计算机设备和存储介质,首先,通过获取多个原始总公司名称和多个原始分支机构名称;接着,从各所述原始总公司名称中获取预设位置处的第一字词,从各所述原始分支机构名称中获取相同预设位置处的第二字词;并将各所述第一字词与各所述第二字词进行比较,根据比较结果得到总公司与分支机构之间的对应关系,所述对应关系包括总公司名称以及所述总公司名称所对应的分支机构名称;最后,当所述总公司名称包含在所述分支机构名称中时,确定所述总公司名称所对应的总公司与所述分支机构名称所对应的分支机构之间的企业关系,通过对本申请中的企业关系进行查询,可以得到准确且完善的企业分支机构。
Description
技术领域
本申请涉及数据处理技术领域,特别是涉及一种企业关系的确定方法、装置、计算机设备和存储介质。
背景技术
当一家企业发展到一定规模后,为了继续扩展其业务,扩大其产品销售范围,常常在不同的城市或同一城市的不同地区开设分支机构。分支机构是企业的一种常设机构,也可以理解为总公司所属的不具有独立的法人地位的派出机构,分支机构与总公司属同一法人实体,其生产、销售、财务、人事等方面受总公司支配和控制。
传统技术中,主要通过国家企业信用信息公示系统查询企业的分支机构。然而,通过国家企业信用信息公示系统查询得到的企业分支机构并不准确。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提升企业分支机构查询准确性的企业关系的确定方法、装置、计算机设备和存储介质。
一种企业关系的确定方法,所述方法包括:
获取总公司名称数据和分支机构名称数据,所述总公司名称数据包括多个原始总公司名称,所述分支机构名称数据包括多个原始分支机构名称;
从各所述原始总公司名称中获取预设位置处的第一字词,从各所述原始分支机构名称中获取相同预设位置处的第二字词;
将各所述第一字词与各所述第二字词进行比较,根据比较结果得到总公司与分支机构之间的对应关系,所述对应关系包括总公司名称以及所述总公司名称所对应的分支机构名称;
当所述总公司名称包含在所述分支机构名称中时,确定所述总公司名称所对应的总公司与所述分支机构名称所对应的分支机构之间的企业关系。
在其中一个实施例中,所述获取总公司名称数据和分支机构名称数据,包括:
获取企业名称数据和分支机构关键词,所述分支机构关键词用于表征任一企业为不具有企业法人资格的分支机构;
根据所述分支机构关键词对所述企业名称数据进行过滤,得到所述总公司名称数据;
从所述企业名称数据中获取满足分支机构预设条件的所述分支机构名称数据。
在其中一个实施例中,所述分支机构预设条件采用以下方式中的至少一种:
企业数据中不包括第一预设关键字,所述第一预设关键字包括个体工商户;
企业数据中不具有股东数据;
企业名称中的长度不小于第一长度阈值。
在其中一个实施例中,在所述根据所述分支机构关键词对所述企业名称数据进行过滤,得到所述总公司名称数据之前,所述方法还包括:
从所述企业名称数据中过滤掉名称长度小于第二长度阈值的企业名称数据;
从所述企业名称数据中过滤掉包括第二预设关键字的企业名称数据,所述第二预设关键字包括分公司、支行、门市部、分店、分行、办事处中的至少一个。
在其中一个实施例中,在所述从各所述原始总公司名称中获取预设位置处的第一字词,从各所述原始分支机构名称中获取相同预设位置处的第二字词之前,所述方法包括:
利用过滤关键词对所述原始总公司名称以及所述原始分支机构名称进行过滤,得到过滤后的原始总公司名称以及原始分支机构名称;其中,所述过滤关键词包括建材经营部、农作物种植、农资经营部、服装经营部中的至少一个。
在其中一个实施例中,所述根据比较结果得到总公司与分支机构之间的对应关系,包括:
当所述第一字词与所述第二字词相同时,确定进行比较的总公司与分支机构之间存在对应关系;
根据存在对应关系的总公司与分支机构,生成所述对应关系。
在其中一个实施例中,所述第一字词包括所述总公司名称中第一个字至第五个字;或者所述第一字词包括所述总公司名称中最后一个字至倒数第五个字。
在其中一个实施例中,所述方法还包括:
获取总公司与分支机构之间处于公示状态的公示企业关系,所述公示企业关系包括公示公司名称和公示机构名称;
当所述公示机构名称对应有至少两个总公司名称,利用所述公示企业关系更新所述总公司与所述分支机构之间的企业关系。
在其中一个实施例中,所述方法还包括:
当任一分支机构名称对应有至少两个总公司名称且所述至少两个总公司名称包括现用名称和曾用名称时,删除所述曾用名称所对应的总公司与所述任一分支机构名称所对应的分支机构之间的企业关系,保留所述现用名称所对应的总公司与所述任一分支机构名称所对应的分支机构之间的企业关系;或者
当任一分支机构名称对应有至少两个总公司名称且所述至少两个总公司名称的状态包括有效和无效时,删除处于无效状态的总公司与所述任一分支机构名称所对应的分支机构之间的企业关系,保留处于有效状态的总公司与所述任一分支机构名称所对应的分支机构之间的企业关系。
一种企业关系的确定装置,所述装置包括:
企业名称获取模块,用于获取总公司名称数据和分支机构名称数据,所述总公司名称数据包括多个原始总公司名称,所述分支机构名称数据包括多个原始分支机构名称;
名称字词获取模块,用于从各所述原始总公司名称中获取预设位置处的第一字词,从各所述原始分支机构名称中获取相同预设位置处的第二字词;
对应关系确定模块,用于将各所述第一字词与各所述第二字词进行比较,根据比较结果得到总公司与分支机构之间的对应关系,所述对应关系包括总公司名称以及所述总公司名称所对应的分支机构名称;
企业关系确定模块,用于当所述总公司名称包含在所述分支机构名称中时,确定所述总公司名称所对应的总公司与所述分支机构名称所对应的分支机构之间的企业关系。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
上述企业关系的确定方法、装置、计算机设备和存储介质,首先,通过获取多个原始总公司名称和多个原始分支机构名称;接着,从各所述原始总公司名称中获取预设位置处的第一字词,从各所述原始分支机构名称中获取相同预设位置处的第二字词;并将各所述第一字词与各所述第二字词进行比较,根据比较结果得到总公司与分支机构之间的对应关系,所述对应关系包括总公司名称以及所述总公司名称所对应的分支机构名称;最后,当所述总公司名称包含在所述分支机构名称中时,确定所述总公司名称所对应的总公司与所述分支机构名称所对应的分支机构之间的企业关系,通过对本申请中的企业关系进行查询,可以得到准确且完善的企业分支机构,解决企业分支机构查询不准确的技术问题。
附图说明
图1为一个实施例中企业关系的确定方法的应用环境图;
图2为一个实施例中企业关系的确定方法的流程示意图;
图3为一个实施例中步骤S210的流程示意图;
图4为另一个实施例中企业关系的确定方法的流程示意图;
图5为一个实施例中企业关系的确定装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的企业关系的确定方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。服务器104可以从国家企业信用信息公示系统获取企业名称数据,对企业名称数据进行清洗,得到总公司名称数据和分支机构名称数据,总公司名称数据包括多个原始总公司名称,分支机构名称数据包括多个原始分支机构名称。接着,服务器104从各原始总公司名称中获取预设位置处的第一字词,从各原始分支机构名称中获取相同预设位置处的第二字词,并将各第一字词与各第二字词进行比较,根据比较结果得到总公司与分支机构之间的对应关系,对应关系包括总公司名称以及总公司名称所对应的分支机构名称。最后,当总公司名称包含在分支机构名称中时,确定总公司名称所对应的总公司与分支机构名称所对应的分支机构之间的企业关系。可以得到总公司与分支机构之间的企业关系存储至服务器104的分支机构数据库中。终端102接收到用户输入的企业查询指令,企业查询指令可以包括总公司名称,根据总公司名称在分支机构数据库中进行查找,得到总公司名称对应的分支机构名称。企业查询指令也可以包括分支机构名称,根据分支机构名称在分支机构数据库中进行查找,得到分支机构名称对应的总公司名称。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种企业关系的确定方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
S210、获取总公司名称数据和分支机构名称数据。
其中,总公司名称数据包括多个原始总公司名称,分支机构名称数据包括多个原始分支机构名称。总公司是指依法设立共管辖公司全部组织的具有企业法人资格的总机构。分支机构是总公司管辖的分公司,是指公司在其住所以外设立的以自己的名义从事活动的机构。分支机构不具有企业法人资格,其民事责任由总公司承担。分支机构虽有公司字样但并非真正意义上的公司,无自己的章程,分支机构的名称可以是在总公司名称后加上如“分公司”字样。
具体地,可以预先将总公司名称数据存入服务器上的总公司待选库中,将分支机构名称数据存入服务器上的分支机构待选库中,从总公司待选库中获取总公司名称数据,从分支机构待选库中获取分支机构名称数据。在一些实施方式中,总公司待选库以及分支机构待选库也可以部署在与服务器通信连接的计算机设备上。
S220、从各原始总公司名称中获取预设位置处的第一字词,从各原始分支机构名称中获取相同预设位置处的第二字词。
其中,预设位置可以结合实际情况而设定,比如位于名称中的头部位置,再比如位于名称的尾部位置。具体地,由于总公司与分支机构之间的企业关系体现在总公司名称与分支机构公司名称上。因此,从各原始总公司名称中获取预设位置处的第一字词。第一字词可以包括具有一定数量(比如4个、5个或者6个)的文字。为了准确地识别总公司与分支机构之间的企业关系,在原始分支机构名称中的相同预设位置处获取第二字词,第二字词内的文字数量可以等于第一字词内的文字数量。
S230、将各第一字词与各第二字词进行比较,根据比较结果得到总公司与分支机构之间的对应关系。
其中,对应关系包括总公司名称以及总公司名称所对应的分支机构名称。具体地,总公司名称数据包括多个原始总公司名称,分支机构名称数据包括多个原始分支机构名称。各原始总公司名称可能对应有原始分支机构名称,因此,需要对原始总公司名称和原始分支机构名称进行分析挖掘。且总公司与分支机构之间的企业关系体现在总公司名称与分支机构公司名称上,从而将各第一字词与各第二字词进行比较,若任一原始总公司名称与任一原始分支机构名称的比较结果满足预先设定的条件,则可以确定该原始总公司名称对应的总公司与该原始分支机构名称对应的分支机构之间的对应关系。
通过各第一字词与各第二字词进行比较,对各原始总公司名称以及各原始分支机构名称进行过滤,得到具有对应关系的总公司名称以及总公司名称所对应的分支机构名称,并在总公司名称以及总公司名称所对应的分支机构名称之间建立对应关系。
S240、当总公司名称包含在分支机构名称中时,确定总公司名称所对应的总公司与分支机构名称所对应的分支机构之间的企业关系。
具体地,判断总公司名称是否包含在分支机构名称中,当总公司名称包含在分支机构名称中时,说明该总公司名称对应的总公司与分支机构名称所对应的分支机构之间的企业关系,即分支机构名称所对应的分支机构可以是总公司名称对应的总公司的分公司。需要说明的是,在确定总公司与分支机构之间的企业关系之后,可以将该企业关系存在对数据库中,当用户需要查询,从该数据库中获取准确且全面的总公司与分支机构之间的企业关系。
上述企业关系的确定方法中,首先,通过获取多个原始总公司名称和多个原始分支机构名称;接着,从各原始总公司名称中获取预设位置处的第一字词,从各原始分支机构名称中获取相同预设位置处的第二字词;并将各第一字词与各第二字词进行比较,根据比较结果得到总公司与分支机构之间的对应关系,对应关系包括总公司名称以及总公司名称所对应的分支机构名称;实现对数据量巨大的总公司名称数据和分支机构名称数据的准确筛选,得到总公司与分支机构之间的对应关系,将总公司与分支机构之间的对应关系的数量与数据量巨大的总公司名称数据和分支机构名称数据进行相比,明显地缩小了服务器的计算量,提升了服务器的计算速度。最后,当总公司名称包含在分支机构名称中时,确定总公司名称所对应的总公司与分支机构名称所对应的分支机构之间的企业关系,通过对本申请中的企业关系进行查询,可以得到准确且完善的企业分支机构,解决企业分支机构查询不准确的技术问题。
在一个实施例中,如图3所示,在步骤S210中,获取总公司名称数据和分支机构名称数据,包括:
S310、获取企业名称数据和分支机构关键词。
S320、根据分支机构关键词对企业名称数据进行过滤,得到总公司名称数据。
S330、从企业名称数据中获取满足分支机构预设条件的分支机构名称数据。
其中,分支机构关键词用于表征任一企业为不具有企业法人资格的分支机构。分支机构关键词可以是“分公司”等字词。企业名称数据可以是从国家企业信用信息公示系统获取的数据量巨大的企业名称。企业名称数据包括有个体工商户、建材经营部、农作物种植、农资经营部、服装经营部、各种总公司以及总公司的分公司。因此,利用分支机构关键词对企业名称数据进行过滤,将是属于分支机构的企业过滤掉,得到总公司名称数据。从企业名称数据中,将满足分支机构预设条件的企业筛选出来,作为分支机构名称数据。
本实施例中,通过分支机构关键词和分支机构预设条件对数据量巨大的企业名称数据进行过滤和筛选,不仅可以初步地减少了服务器的计算量,而且可以从企业名称数据中准确的获取总公司名称数据和分支机构名称数据,为确定总公司与企业分支机构之间的企业关系提供准确的数据基础。
在一个实施例中,分支机构预设条件采用以下方式中的至少一种:
企业数据中不包括第一预设关键字。
企业数据中不具有股东数据。
企业名称中的长度不小于第一长度阈值。
其中,第一预设关键字包括个体工商户,具体地,个体工商户不可能是一个总公司企业的分支机构,因此企业数据中不能包括个体工商户等第一预设关键字。总公司企业的分支机构也不具有股东数据或者法人数据,因此,企业数据中不能具有股东数据。总公司企业的分支机构的企业名称具有一定数量的文字,分支机构名称不会小于一定的文字长度,因此,企业名称中的长度不小于第一长度阈值。第一长度阈值可以是7。
本实施例中,从第一预设关键字、股东数据以及企业名称中的长度几个方面,考虑企业分支机构应该满足的条件,提升从企业名称数据中获取分支机构名称数据的准确性和全面性。
在一个实施例中,在根据分支机构关键词对企业名称数据进行过滤,得到总公司名称数据之前,该方法还包括:从企业名称数据中过滤掉名称长度小于第二长度阈值的企业名称数据;从企业名称数据中过滤掉包括第二预设关键字的企业名称数据。
其中,第二预设关键字包括分公司、支行、门市部、分店、分行、办事处中的至少一个。具体地,当企业名称的文字数量小于第二长度阈值(比如5)时,该企业名称不会再是一个总公司的名称,因此,从企业名称数据中过滤掉名称长度小于第二长度阈值的企业名称数据。当企业名称中出现第二预设关键字,该企业名称不会再是一个总公司的名称,因此,从企业名称数据中过滤掉包括第二预设关键字的企业名称数据。
本实施例中,从第二预设关键字以及企业名称中的长度两个方面,过滤掉部分的企业名称数据,提升从企业名称数据中获取总公司名称数据的准确性和全面性。
在一个实施例中,在从各原始总公司名称中获取预设位置处的第一字词,从各原始分支机构名称中获取相同预设位置处的第二字词之前,该方法包括:利用过滤关键词对原始总公司名称以及原始分支机构名称进行过滤,得到过滤后的原始总公司名称以及原始分支机构名称。
其中,过滤关键词包括建材经营部、农作物种植、农资经营部、服装经营部中的至少一个。具体地,若原始总公司名称或者原始分支机构名称中包括过滤关键词,则明显表明该企业名称不会是总公司名称,也不会是分支机构名称,利用过滤关键词对原始总公司名称以及原始分支机构名称进行过滤,得到过滤后的原始总公司名称以及原始分支机构名称,过滤掉干扰数据,缩小了数量,减少计算量,提升计算速度。
在一个实施例中,根据比较结果得到总公司与分支机构之间的对应关系,包括:当第一字词与第二字词相同时,确定进行比较的总公司与分支机构之间存在对应关系;根据存在对应关系的总公司与分支机构,生成对应关系。
具体地,从各原始总公司名称中获取预设位置处的第一字词,从各原始分支机构名称中获取相同预设位置处的第二字词。将各第一字词与各第二字词进行比较,当第一字词与第二字词相同时,确定进行比较的总公司与分支机构之间存在对应关系;根据存在对应关系的总公司与分支机构,生成总公司与分支机构之间的对应关系。
在一些实施方式中,第一字词包括总公司名称中第一个字至第五个字;或者第一字词包括总公司名称中最后一个字至倒数第五个字。
本实施例中,通过比较原始总公司名称中的前五个字以及原始分支机构名称中的前五个字,或者比较原始总公司名称中的后五个字以及原始分支机构名称中的后五个字,若相同,则说明进行比较的总公司与分支机构之间存在对应关系,可以在进行比较的总公司与分支机构之间,生成总公司与分支机构的对应关系,从总公司名称数据和分支机构名称数据中筛选出了具有对应关系的总公司与分支机构,可以得到一个数据表,数据表中包括总公司与分支机构之间的对应关系。过滤掉总公司名称数据和分支机构名称数据的干扰数据,得到具有对应关系的总公司与分支机构,不仅减少了后续的计算量,而且为后续提供准确的数据计算,还可以确保数据的全面性。
在一个实施例中,如图4所示,该方法还包括:
S410、获取总公司与分支机构之间处于公示状态的公示企业关系。
S420、当公示机构名称对应有至少两个总公司名称,利用公示企业关系更新总公司与分支机构之间的企业关系。
其中,公示企业关系包括公示公司名称和公示机构名称。具体地,可以从国家企业信用信息公示系统中获取总公司与分支机构之间处于公示状态的公示企业关系。一般情况下,处于公示状态的公示企业关系的准确性高于分析挖掘所确定的企业关系。因此,当公示机构名称对应有至少两个总公司名称,处于公示状态的公示企业关系的优先级要高一些,可以删除公示机构名称与分析挖掘所确定的总公司名称之间的对应关系。即当公示机构名称对应有至少两个总公司名称,利用公示企业关系更新总公司与分支机构之间的企业关系。
本实施例中,利用处于公示状态的公示企业关系更新总公司与分支机构之间的企业关系,提升企业关系数据的准确性和完整性。
在一个实施例中,该方法还包括:当任一分支机构名称对应有至少两个总公司名称且至少两个总公司名称包括现用名称和曾用名称时,删除曾用名称所对应的总公司与任一分支机构名称所对应的分支机构之间的企业关系,保留现用名称所对应的总公司与任一分支机构名称所对应的分支机构之间的企业关系。
具体地,总公司名称包括现用名称和曾用名称,若任一分支机构名称对应有至少两个总公司名称,这表明这份数据必定是存在错误,需要对至少两个总公司名称进行分析,若至少两个总公司名称分别是现用名称和曾用名称时,现用名称的优先级高于曾用名称的优先级。那么删除曾用名称所对应的总公司与任一分支机构名称所对应的分支机构之间的企业关系,保留现用名称所对应的总公司与任一分支机构名称所对应的分支机构之间的企业关系。
需要说明的是,计算总公司名称是否包含在分支机构名称时,可以采用Hive(一种数据仓库处理工具)的instr函数(包含函数,用于在一个字符串中搜索指定的字符,返回发现指定的字符的位置),可以计算现用名称是否包含在分支机构名称,也可以计算曾用名称是否包含在分支机构名称,当现用名称包含在分支机构名称中时,确定现用名称所对应的总公司与分支机构名称所对应的分支机构之间的企业关系。当曾用名称包含在分支机构名称中时,确定曾用名称所对应的总公司与分支机构名称所对应的分支机构之间的企业关系。在利用曾用名称计算具有关联或者企业关系的分支机构时,该曾用名称不能是其他企业的现用名称。
在一个实施例中,该方法还包括:当任一分支机构名称对应有至少两个总公司名称且至少两个总公司名称的状态包括有效和无效时,删除处于无效状态的总公司与任一分支机构名称所对应的分支机构之间的企业关系,保留处于有效状态的总公司与任一分支机构名称所对应的分支机构之间的企业关系。
具体地,总公司名称的状态包括有效和无效,有效状态包括存续、在营、在业。若任一分支机构名称对应有至少两个总公司名称,这表明这份数据必定是存在错误,需要对至少两个总公司名称进行分析,若至少两个总公司名称的状态包括有效和无效,有效状态的优先级高于无效状态。那么删除处于无效状态的总公司与任一分支机构名称所对应的分支机构之间的企业关系,保留处于有效状态的总公司与任一分支机构名称所对应的分支机构之间的企业关系。
在一个实施例中,提供了一种企业关系的确定方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
S502、获取企业名称数据和分支机构关键词,分支机构关键词用于表征任一企业为不具有企业法人资格的分支机构。
S504、从企业名称数据中过滤掉名称长度小于第二长度阈值的企业名称数据。
S506、从企业名称数据中过滤掉包括第二预设关键字的企业名称数据。
其中,第二预设关键字包括分公司、支行、门市部、分店、分行、办事处中的至少一个。
S508、根据分支机构关键词对企业名称数据进行过滤,得到总公司名称数据。
其中,总公司名称数据包括多个原始总公司名称。
S510、从企业名称数据中获取满足分支机构预设条件的分支机构名称数据。
其中,分支机构名称数据包括多个原始分支机构名称。分支机构预设条件采用以下方式中的至少一种:企业数据中不包括第一预设关键字,第一预设关键字包括个体工商户;企业数据中不具有股东数据;企业名称中的长度不小于第一长度阈值。
S512、利用过滤关键词对原始总公司名称以及原始分支机构名称进行过滤,得到过滤后的原始总公司名称以及原始分支机构名称。
其中,过滤关键词包括建材经营部、农作物种植、农资经营部、服装经营部中的至少一个。
S514、从各原始总公司名称中获取预设位置处的第一字词,从各原始分支机构名称中获取相同预设位置处的第二字词。
其中,第一字词包括总公司名称中第一个字至第五个字;或者第一字词包括总公司名称中最后一个字至倒数第五个字。
S516、将各第一字词与各第二字词进行比较,根据比较结果得到总公司与分支机构之间的对应关系。
具体地,当第一字词与第二字词相同时,确定进行比较的总公司与分支机构之间存在对应关系;根据存在对应关系的总公司与分支机构,生成对应关系。对应关系包括总公司名称以及总公司名称所对应的分支机构名称。
S518、当总公司名称包含在分支机构名称中时,确定总公司名称所对应的总公司与分支机构名称所对应的分支机构之间的企业关系。
S520、获取总公司与分支机构之间处于公示状态的公示企业关系,公示企业关系包括公示公司名称和公示机构名称。
S522、当公示机构名称对应有至少两个总公司名称,利用公示企业关系更新总公司与分支机构之间的企业关系。
S524、当任一分支机构名称对应有至少两个总公司名称且至少两个总公司名称包括现用名称和曾用名称时,删除曾用名称所对应的总公司与任一分支机构名称所对应的分支机构之间的企业关系,保留现用名称所对应的总公司与任一分支机构名称所对应的分支机构之间的企业关系。
S526、当任一分支机构名称对应有至少两个总公司名称且至少两个总公司名称的状态包括有效和无效时,删除处于无效状态的总公司与任一分支机构名称所对应的分支机构之间的企业关系,保留处于有效状态的总公司与任一分支机构名称所对应的分支机构之间的企业关系。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种企业关系的确定装置500,包括:企业名称获取模块502、名称字词获取模块504、对应关系确定模块506和企业关系确定模块508,其中:
企业名称获取模块502,用于获取总公司名称数据和分支机构名称数据,所述总公司名称数据包括多个原始总公司名称,所述分支机构名称数据包括多个原始分支机构名称。
名称字词获取模块504,用于从各所述原始总公司名称中获取预设位置处的第一字词,从各所述原始分支机构名称中获取相同预设位置处的第二字词。
对应关系确定模块506,用于将各所述第一字词与各所述第二字词进行比较,根据比较结果得到总公司与分支机构之间的对应关系,所述对应关系包括总公司名称以及所述总公司名称所对应的分支机构名称。
企业关系确定模块508,用于当所述总公司名称包含在所述分支机构名称中时,确定所述总公司名称所对应的总公司与所述分支机构名称所对应的分支机构之间的企业关系。
在一个实施例中,企业名称获取模块502,还用于获取企业名称数据和分支机构关键词,所述分支机构关键词用于表征任一企业为不具有企业法人资格的分支机构;根据所述分支机构关键词对所述企业名称数据进行过滤,得到所述总公司名称数据;从所述企业名称数据中获取满足分支机构预设条件的所述分支机构名称数据。
在一个实施例中,所述分支机构预设条件采用以下方式中的至少一种:
企业数据中不包括第一预设关键字,所述第一预设关键字包括个体工商户。
企业数据中不具有股东数据。
企业名称中的长度不小于第一长度阈值。
在一个实施例中,该装置还包括第一过滤模块,用于从所述企业名称数据中过滤掉名称长度小于第二长度阈值的企业名称数据;从所述企业名称数据中过滤掉包括第二预设关键字的企业名称数据,所述第二预设关键字包括分公司、支行、门市部、分店、分行、办事处中的至少一个。
在一个实施例中,该装置还包括第二过滤模块,用于利用过滤关键词对所述原始总公司名称以及所述原始分支机构名称进行过滤,得到过滤后的原始总公司名称以及原始分支机构名称;其中,所述过滤关键词包括建材经营部、农作物种植、农资经营部、服装经营部中的至少一个。
在一个实施例中,对应关系确定模块506,还用于当所述第一字词与所述第二字词相同时,确定进行比较的总公司与分支机构之间存在对应关系;根据存在对应关系的总公司与分支机构,生成所述对应关系。
在一个实施例中,所述第一字词包括所述总公司名称中第一个字至第五个字;或者所述第一字词包括所述总公司名称中最后一个字至倒数第五个字。
在一个实施例中,该装置还包括企业关系更新模块,用于获取总公司与分支机构之间处于公示状态的公示企业关系,所述公示企业关系包括公示公司名称和公示机构名称;当所述公示机构名称对应有至少两个总公司名称,利用所述公示企业关系更新所述总公司与所述分支机构之间的企业关系。
在一个实施例中,该装置还包括第一合并模块,用于当任一分支机构名称对应有至少两个总公司名称且所述至少两个总公司名称包括现用名称和曾用名称时,删除所述曾用名称所对应的总公司与所述任一分支机构名称所对应的分支机构之间的企业关系,保留所述现用名称所对应的总公司与所述任一分支机构名称所对应的分支机构之间的企业关系。或者
第二合并模块,用于当任一分支机构名称对应有至少两个总公司名称且所述至少两个总公司名称的状态包括有效和无效时,删除处于无效状态的总公司与所述任一分支机构名称所对应的分支机构之间的企业关系,保留处于有效状态的总公司与所述任一分支机构名称所对应的分支机构之间的企业关系。
关于企业关系的确定装置的具体限定可以参见上文中对于企业关系的确定方法的限定,在此不再赘述。上述企业关系的确定装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种企业关系的确定方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述实施例中的方法步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中的方法步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (12)
1.一种企业关系的确定方法,其特征在于,所述方法包括:
获取企业名称数据和分支机构关键词,根据所述分支机构关键词对所述企业名称数据进行过滤,得到总公司名称数据和满足分支机构预设条件的分支机构名称数据,所述总公司名称数据包括多个原始总公司名称,所述分支机构名称数据包括多个原始分支机构名称,所述总公司名称数据存储在总公司待选库中,所述分支机构名称数据存储在分支机构待选库中;
从各所述原始总公司名称中获取预设位置处的第一字词,从各所述原始分支机构名称中获取相同预设位置处的第二字词,所述第二字词内的文字数量等于所述第一字词内的文字数量,所述原始总公司名称以及所述原始分支机构名称是利用过滤关键词进行过滤后得到的数据;
将各所述第一字词与各所述第二字词进行比较,根据比较结果为字词相同的所述第一字词与所述第二字词,得到总公司与分支机构之间的对应关系,所述对应关系包括总公司名称以及所述总公司名称所对应的分支机构名称;
当所述总公司名称包含在所述分支机构名称中时,确定所述总公司名称所对应的总公司与所述分支机构名称所对应的分支机构之间的企业关系。
2.根据权利要求1所述的方法,其特征在于,所述获取企业名称数据和分支机构关键词,根据所述分支机构关键词对所述企业名称数据进行过滤,得到总公司名称数据和满足分支机构预设条件的分支机构名称数据,包括:
获取企业名称数据和分支机构关键词,所述分支机构关键词用于表征任一企业为不具有企业法人资格的分支机构;
根据所述分支机构关键词对所述企业名称数据进行过滤,得到所述总公司名称数据;
从所述企业名称数据中获取满足分支机构预设条件的所述分支机构名称数据。
3.根据权利要求2所述的方法,其特征在于,所述分支机构预设条件采用以下方式中的至少一种:
企业数据中不包括第一预设关键字,所述第一预设关键字包括个体工商户;
企业数据中不具有股东数据;
企业名称中的长度不小于第一长度阈值。
4.根据权利要求2所述的方法,其特征在于,在所述根据所述分支机构关键词对所述企业名称数据进行过滤,得到所述总公司名称数据之前,所述方法还包括:
从所述企业名称数据中过滤掉名称长度小于第二长度阈值的企业名称数据;
从所述企业名称数据中过滤掉包括第二预设关键字的企业名称数据,所述第二预设关键字包括分公司、支行、门市部、分店、分行、办事处中的至少一个。
5.根据权利要求1所述的方法,其特征在于,在所述从各所述原始总公司名称中获取预设位置处的第一字词,从各所述原始分支机构名称中获取相同预设位置处的第二字词之前,所述方法包括:
利用过滤关键词对所述原始总公司名称以及所述原始分支机构名称进行过滤,得到过滤后的原始总公司名称以及原始分支机构名称;其中,所述过滤关键词包括建材经营部、农作物种植、农资经营部、服装经营部中的至少一个。
6.根据权利要求1所述的方法,其特征在于,所述根据比较结果为字词相同的所述第一字词以及所述第二字词,得到总公司与分支机构之间的对应关系,包括:
当所述第一字词与所述第二字词相同时,确定进行比较的总公司与分支机构之间存在对应关系;
根据存在对应关系的总公司与分支机构,生成所述对应关系。
7.根据权利要求1所述的方法,其特征在于,所述第一字词包括所述总公司名称中第一个字至第五个字;或者所述第一字词包括所述总公司名称中最后一个字至倒数第五个字。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取总公司与分支机构之间处于公示状态的公示企业关系,所述公示企业关系包括公示公司名称和公示机构名称;
当所述公示机构名称对应有至少两个总公司名称,利用所述公示企业关系更新所述总公司与所述分支机构之间的企业关系。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当任一分支机构名称对应有至少两个总公司名称且所述至少两个总公司名称包括现用名称和曾用名称时,删除所述曾用名称所对应的总公司与所述任一分支机构名称所对应的分支机构之间的企业关系,保留所述现用名称所对应的总公司与所述任一分支机构名称所对应的分支机构之间的企业关系;或者
当任一分支机构名称对应有至少两个总公司名称且所述至少两个总公司名称的状态包括有效和无效时,删除处于无效状态的总公司与所述任一分支机构名称所对应的分支机构之间的企业关系,保留处于有效状态的总公司与所述任一分支机构名称所对应的分支机构之间的企业关系。
10.一种企业关系的确定装置,其特征在于,所述装置包括:
企业名称获取模块,用于获取企业名称数据和分支机构关键词,根据所述分支机构关键词对所述企业名称数据进行过滤,得到总公司名称数据和满足分支机构预设条件的分支机构名称数据,所述总公司名称数据包括多个原始总公司名称,所述分支机构名称数据包括多个原始分支机构名称,所述总公司名称数据存储在总公司待选库中,所述分支机构名称数据存储在分支机构待选库中;
名称字词获取模块,用于从各所述原始总公司名称中获取预设位置处的第一字词,从各所述原始分支机构名称中获取相同预设位置处的第二字词,所述第二字词内的文字数量等于所述第一字词内的文字数量,所述原始总公司名称以及所述原始分支机构名称是利用过滤关键词进行过滤后得到的名称数据;
对应关系确定模块,用于将各所述第一字词与各所述第二字词进行比较,根据比较结果为字词相同的所述第一字词与所述第二字词,得到总公司与分支机构之间的对应关系,所述对应关系包括总公司名称以及所述总公司名称所对应的分支机构名称;
企业关系确定模块,用于当所述总公司名称包含在所述分支机构名称中时,确定所述总公司名称所对应的总公司与所述分支机构名称所对应的分支机构之间的企业关系。
11.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110803816.8A CN113254732B (zh) | 2021-07-16 | 2021-07-16 | 企业关系的确定方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110803816.8A CN113254732B (zh) | 2021-07-16 | 2021-07-16 | 企业关系的确定方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113254732A CN113254732A (zh) | 2021-08-13 |
CN113254732B true CN113254732B (zh) | 2021-11-02 |
Family
ID=77180489
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110803816.8A Active CN113254732B (zh) | 2021-07-16 | 2021-07-16 | 企业关系的确定方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113254732B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115270800B (zh) * | 2022-09-28 | 2023-03-24 | 广州市玄武无线科技股份有限公司 | 终端门店名称的提取方法、装置、设备和计算机存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016157254A1 (ja) * | 2015-03-31 | 2016-10-06 | 株式会社三井住友銀行 | コーポレートファイナンスの海外与信管理のための銀行システム、方法およびプログラム |
CN110232187B (zh) * | 2019-05-20 | 2022-06-07 | 平安科技(深圳)有限公司 | 企业名称相似度识别方法、装置、计算机设备和存储介质 |
CN112926328A (zh) * | 2021-03-05 | 2021-06-08 | 西安循数信息科技有限公司 | 一种用于专利数据中申请人公司名称消歧的方法 |
-
2021
- 2021-07-16 CN CN202110803816.8A patent/CN113254732B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113254732A (zh) | 2021-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110109910A (zh) | 数据处理方法及系统、电子设备和计算机可读存储介质 | |
CN112433712A (zh) | 报表展示方法、装置、计算机设备和存储介质 | |
CN104541297A (zh) | 销售预测器(spe)的可扩展性 | |
CN113254732B (zh) | 企业关系的确定方法、装置、计算机设备和存储介质 | |
CN115544007A (zh) | 标签预处理方法、装置、计算机设备和存储介质 | |
CN114741402A (zh) | 业务特征池的处理方法、装置、计算机设备和存储介质 | |
CN113918437A (zh) | 用户行为数据分析方法、装置、计算机设备和存储介质 | |
CN111383072A (zh) | 一种用户信用评分方法、存储介质及服务器 | |
CN111008198B (zh) | 业务数据获取方法、装置、存储介质、电子设备 | |
CN111984659A (zh) | 数据更新方法、装置、计算机设备和存储介质 | |
CN115687350A (zh) | 索引构建方法、装置、计算机设备和存储介质 | |
CN113946755A (zh) | 基于关联规则的信息推送方法、装置、设备及存储介质 | |
US11893069B2 (en) | Platform, method, and system for a search engine of time series data | |
CN115098572A (zh) | 用户画像构建方法、装置和计算机设备 | |
CN113961811A (zh) | 基于事件图谱的话术推荐方法、装置、设备及介质 | |
CN113360496A (zh) | 一种构建元数据标签库的方法及装置 | |
CN112085566A (zh) | 基于智能决策的产品推荐方法、装置及计算机设备 | |
CN112199434A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN113515504B (zh) | 数据管理方法、装置、电子设备以及存储介质 | |
CN107918672B (zh) | 信息处理方法、装置、计算机设备和存储介质 | |
CN112579638B (zh) | 行为标签信息的处理方法、装置、计算机设备及存储介质 | |
CN115827800A (zh) | 基于数据库的媒体信息关联方法和装置 | |
CN115374114A (zh) | 数据维护的方法、装置、计算机设备和存储介质 | |
CN117407429A (zh) | 园区信息检索方法、装置、计算机设备及存储介质 | |
CN116244521A (zh) | 软件平台的服务业务获取方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: No. 8 Huizhi Street, Suzhou Industrial Park, Suzhou Area, China (Jiangsu) Pilot Free Trade Zone, Suzhou City, Jiangsu Province, 215000 Patentee after: Qichacha Technology Co.,Ltd. Address before: Room 503, 5 / F, C1 building, 88 Dongchang Road, Suzhou Industrial Park, 215000, Jiangsu Province Patentee before: Qicha Technology Co.,Ltd. |