CN111914147A - 一种企业疑似实际控制人征信方法及系统 - Google Patents

一种企业疑似实际控制人征信方法及系统 Download PDF

Info

Publication number
CN111914147A
CN111914147A CN202010805936.7A CN202010805936A CN111914147A CN 111914147 A CN111914147 A CN 111914147A CN 202010805936 A CN202010805936 A CN 202010805936A CN 111914147 A CN111914147 A CN 111914147A
Authority
CN
China
Prior art keywords
data
node
enterprise
stack
credit investigation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010805936.7A
Other languages
English (en)
Inventor
王文佳
邢荣
宋培东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chaozhou Zhuoshu Big Data Industry Development Co Ltd
Original Assignee
Chaozhou Zhuoshu Big Data Industry Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chaozhou Zhuoshu Big Data Industry Development Co Ltd filed Critical Chaozhou Zhuoshu Big Data Industry Development Co Ltd
Priority to CN202010805936.7A priority Critical patent/CN111914147A/zh
Publication of CN111914147A publication Critical patent/CN111914147A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Computational Linguistics (AREA)
  • Accounting & Taxation (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明涉及图论算法领域,具体提供了一种企业疑似实际控制人征信方法及系统。与现有技术相比,本发明的一种企业疑似实际控制人征信方法,具有以下步骤:S01、数据的采集;S02、数据的预处理;S03、有向图的任意两点路径遍历;S04、对遍历出的路径进行股权穿透计算。本发明基于有向图的企业疑似实际控制人征信模型,可以解决征信研究的难点之一,为企业征信提供决策支持,具有良好的推广价值。

Description

一种企业疑似实际控制人征信方法及系统
技术领域
本发明涉及图论算法领域,具体提供一种企业疑似实际控制人征信方法及系统。
背景技术
征信是依法收集、整理、保存、加工自然人、法人及其他组织的信用信息,并对外提供信用报告、信用评估和信用信息咨询等服务,帮助客户判断、控制信用风险,进行信用管理的活动。2013年3月,《征信业管理条例》正式实施,明确中国人民银行为征信业监督管理部门,征信业步入有法可依的轨道。随着大数据的应用日臻成熟,征信业也迎来了蓬勃发展。实际控制人的追溯是企业征信分析的重要指标之一。如何利用图论算法来解决企业实际控制人追溯是本发明要解决的问题。
发明内容
本发明是针对上述现有技术的不足,提供一种实用性强的企业疑似实际控制人征信方法。
本发明进一步的技术任务是提供一种设计合理、安全适用的企业疑似实际控制人征信系统。
本发明解决其技术问题所采用的技术方案是:
一种企业疑似实际控制人征信方法,具有以下步骤:
S01、数据的采集;
S02、数据的预处理;
S03、有向图的任意两点路径遍历;
S04、对遍历出的路径进行股权穿透计算。
进一步的,在步骤S01中,包括:
S011、提出数据采集需求;
S012、爬虫开发;
S013、爬虫部署;
S014、爬虫配置。
进一步的,在步骤S011中,根据数据分析业务需要,找出符合要求的数据源,然后确定每一个数据源的数据维度,制定采集的规则。
进一步的,在步骤S012中,通过外包来实现爬虫开发的问题;
在步骤S013中,爬虫服务器配置管理,大量IP配置管理;
在步骤S014中,为前期开发的爬虫工具,根据网站特征进行参数配置,实施数据采集。
进一步的,在步骤S02中,包括数据抽取与清洗,当数据不完整时,进行补全数据;
当不同来源的数据出现重复的情况,进行去除重复记录,仅保留一条;
同一个指标出现多个来源的数据,且数值不一样时,采用最权威渠道的数据;
数据与常识不符时,设定判定规则;
不同来源的不同指标实际的内涵与表示意义是不一样时,建立数据体系。
进一步的,在步骤S03中,包括:
S031、将始点设置为已访问,将其入栈;
S032、查看栈顶节点V在图中有没有到达,且没有入栈、从这个节点V出发访问过的节点;
S033、如果有,则将找到的这个节点入栈;
S034、如果没有,则将节点V访问到下一个节点的集合中每个元素赋值为零,V出栈;
S035、当栈顶元素为终点时,设置终点没有访问过,打印栈中元素,弹出栈顶节点;
重复执行S032至S035,直到栈中元素为空。
进一步的,在步骤S04中,对遍历出的所有路径进行股权穿透计算,设定路径筛选规则,选择相对股权最大值或者法定代表人,为企业的疑似实际控制人。
进一步的,在步骤S04中,对遍历出的所有路径进行股权穿透计算,设定路径筛选规则,选择相对股权最大值或者法定代表人,为企业的疑似实际控制人。
一种企业疑似实际控制人征信系统,包括数据采集模块、数据预处理模块、两点路径遍历模块和股权穿透计算模块;
所述数据采集模块用于采集数据、爬虫开发、爬虫部署和爬虫配置,进行分析所需的数据支撑;
所述数据预处理模块用于数据的抽取、清洗、去重、设定判定规则和建立数据体系,以达到数据的完整性、唯一性、权威性、合法性和一致性;
所述两点路径遍历模块用于将始点设置为已访问,将其入栈,查看栈顶节点V在图中有没有到达,且没有入栈、从这个节点V出发访问过的节点,如果有,则将找到的这个节点入栈;
如果没有,则将节点V访问到下一个节点的集合中每个元素赋值为零,V出栈;当栈顶元素为终点时,设置终点没有访问过,打印栈中元素,弹出栈顶节点,直到栈中元素为空;
所述股权穿透计算模块用于对遍历出的所有路径,进行股权穿透计算,设定路径筛选规则,选择相对股权最大值或者法定代表人,为企业的疑似实际控制人。
本发明的一种企业疑似实际控制人征信方法及系统和现有技术相比,具有以下突出的有益效果:
本发明基于有向图的企业疑似实际控制人征信模型,可以解决征信研究的难点之一,为企业征信提供决策支持。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图1是一种企业疑似实际控制人征信方法中有向图的示意图;
附图2是一种企业疑似实际控制人征信方法中数据采集和预处理的流程示意图。
具体实施方式
为了使本技术领域的人员更好的理解本发明的方案,下面结合具体的实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例都属于本发明保护的范围。
下面给出一个最佳实施例:
如图1、2所示,本实施例中的企业疑似实际控制人征信方法,具有以下步骤:
S01、数据的采集;
S02、数据的预处理;
S03、有向图的任意两点路径遍历;
S04、对遍历出的路径进行股权穿透计算。
在步骤S01中,包括:
S011、提出数据采集需求:根据数据分析业务需要,找出符合要求的数据源,然后确定每一个数据源的数据维度,制定采集的规则。
S012、爬虫开发:主要的难题是验证码识别,一般需要外包实现。
S013、爬虫部署:主要是爬虫服务器配置管理,大量IP(HTTP代理、VPN代理等)配置管理。
S014、爬虫配置:主要为前期开发的爬虫工具,根据网站特征进行参数配置,实施数据采集。
在步骤S02中,包括数据抽取与清洗,解决数据质量问题:
数据的完整性:比如人的属性中缺少性别、籍贯、年龄等,可以采取数据补全的方法。
数据的唯一性:比如不同来源的数据出现重复的情况,去除重复记录,只保留一条。
数据的权威性:比如同一个指标出现多个来源的数据,且数值不一样,可以采取最权威渠道的数据。
数据的合法性:比如数据与常识不符,市区内开车速度到达400km/h,可以设定判定规则。
数据的一致性:比如不同来源的不同指标,实际的内涵与表示意义不一样,可以建立数据体系。
在步骤S03中,包括:
S031、将始点设置为已访问,将其入栈;
S032、查看栈顶节点V在图中有没有到达,且没有入栈、从这个节点V出发访问过的节点;
S033、如果有,则将找到的这个节点入栈;
S034、如果没有,则将节点V访问到下一个节点的集合中每个元素赋值为零,V出栈;
S035、当栈顶元素为终点时,设置终点没有访问过,打印栈中元素,弹出栈顶节点;
重复执行S032至S035,直到栈中元素为空。
在步骤S04中,对遍历出的所有路径进行股权穿透计算,设定路径筛选规则,选择相对股权最大值或者法定代表人,为企业的疑似实际控制人。
上述方法对应的系统为:
一种企业疑似实际控制人征信系统,包括数据采集模块、数据预处理模块、两点路径遍历模块和股权穿透计算模块。数据采集模块用于采集数据、爬虫开发、爬虫部署和爬虫配置,进行分析所需的数据支撑。数据预处理模块用于数据的抽取、清洗、去重、设定判定规则和建立数据体系,以达到数据的完整性、唯一性、权威性、合法性和一致性。
两点路径遍历模块用于将始点设置为已访问,将其入栈,查看栈顶节点V在图中有没有到达,且没有入栈、从这个节点V出发访问过的节点,如果有,则将找到的这个节点入。
如果没有,则将节点V访问到下一个节点的集合中每个元素赋值为零,V出栈;当栈顶元素为终点时,设置终点没有访问过,打印栈中元素,弹出栈顶节点,直到栈中元素为空。
股权穿透计算模块用于对遍历出的所有路径,进行股权穿透计算,设定路径筛选规则,选择相对股权最大值或者法定代表人,为企业的疑似实际控制人。
上述具体的实施方式仅是本发明具体的个案,本发明的专利保护范围包括但不限于上述具体的实施方式,任何符合本发明的一种企业疑似实际控制人征信方法及系统权利要求书的且任何所述技术领域普通技术人员对其做出的适当变化或者替换,皆应落入本发明的专利保护范围。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (8)

1.一种企业疑似实际控制人征信方法,其特征在于,具有以下步骤:
S01、数据的采集;
S02、数据的预处理;
S03、有向图的任意两点路径遍历;
S04、对遍历出的路径进行股权穿透计算。
2.根据权利要求1所述的一种企业疑似实际控制人征信方法,其特征在于,在步骤S01中,包括:
S011、提出数据采集需求;
S012、爬虫开发;
S013、爬虫部署;
S014、爬虫配置。
3.根据权利要求2所述的一种企业疑似实际控制人征信方法,其特征在于,在步骤S011中,根据数据分析业务需要,找出符合要求的数据源,然后确定每一个数据源的数据维度,制定采集的规则。
4.根据权利要求3所述的一种企业疑似实际控制人征信方法,其特征在于,在步骤S012中,通过外包来实现爬虫开发的问题;
在步骤S013中,爬虫服务器配置管理,大量IP配置管理;
在步骤S014中,为前期开发的爬虫工具,根据网站特征进行参数配置,实施数据采集。
5.根据权利要求1所述的一种企业疑似实际控制人征信方法,其特征在于,在步骤S02中,包括数据抽取与清洗,当数据不完整时,进行补全数据;
当不同来源的数据出现重复的情况,进行去除重复记录,仅保留一条;
同一个指标出现多个来源的数据,且数值不一样时,采用最权威渠道的数据;
数据与常识不符时,设定判定规则;
不同来源的不同指标实际的内涵与表示意义是不一样时,建立数据体系。
6.根据权利要求1所述的一种企业疑似实际控制人征信方法,其特征在于,在步骤S03中,包括:
S031、将始点设置为已访问,将其入栈;
S032、查看栈顶节点V在图中有没有到达,且没有入栈、从这个节点V出发访问过的节点;
S033、如果有,则将找到的这个节点入栈;
S034、如果没有,则将节点V访问到下一个节点的集合中每个元素赋值为零,V出栈;
S035、当栈顶元素为终点时,设置终点没有访问过,打印栈中元素,弹出栈顶节点;
重复执行S032至S035,直到栈中元素为空。
7.根据权利要求1所述的一种企业疑似实际控制人征信方法,其特征在于,在步骤S04中,对遍历出的所有路径进行股权穿透计算,设定路径筛选规则,选择相对股权最大值或者法定代表人,为企业的疑似实际控制人。
8.一种企业疑似实际控制人征信系统,其特征在于,包括数据采集模块、数据预处理模块、两点路径遍历模块和股权穿透计算模块;
所述数据采集模块用于采集数据、爬虫开发、爬虫部署和爬虫配置,进行分析所需的数据支撑;
所述数据预处理模块用于数据的抽取、清洗、去重、设定判定规则和建立数据体系,以达到数据的完整性、唯一性、权威性、合法性和一致性;
所述两点路径遍历模块用于将始点设置为已访问,将其入栈,查看栈顶节点V在图中有没有到达,且没有入栈、从这个节点V出发访问过的节点,如果有,则将找到的这个节点入栈;
如果没有,则将节点V访问到下一个节点的集合中每个元素赋值为零,V出栈;当栈顶元素为终点时,设置终点没有访问过,打印栈中元素,弹出栈顶节点,直到栈中元素为空;
所述股权穿透计算模块用于对遍历出的所有路径,进行股权穿透计算,设定路径筛选规则,选择相对股权最大值或者法定代表人,为企业的疑似实际控制人。
CN202010805936.7A 2020-08-12 2020-08-12 一种企业疑似实际控制人征信方法及系统 Withdrawn CN111914147A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010805936.7A CN111914147A (zh) 2020-08-12 2020-08-12 一种企业疑似实际控制人征信方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010805936.7A CN111914147A (zh) 2020-08-12 2020-08-12 一种企业疑似实际控制人征信方法及系统

Publications (1)

Publication Number Publication Date
CN111914147A true CN111914147A (zh) 2020-11-10

Family

ID=73284270

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010805936.7A Withdrawn CN111914147A (zh) 2020-08-12 2020-08-12 一种企业疑似实际控制人征信方法及系统

Country Status (1)

Country Link
CN (1) CN111914147A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112991063A (zh) * 2021-04-01 2021-06-18 执立信息科技(上海)有限公司 企业股权穿透方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112991063A (zh) * 2021-04-01 2021-06-18 执立信息科技(上海)有限公司 企业股权穿透方法
CN112991063B (zh) * 2021-04-01 2023-03-21 执立信息科技(上海)有限公司 企业股权穿透方法

Similar Documents

Publication Publication Date Title
WO2022134588A1 (zh) 信息审核分类模型的构建方法和信息审核方法
CN107818150B (zh) 一种日志审计方法及装置
CN112417477A (zh) 一种数据安全监测方法、装置、设备及存储介质
CN109905276B (zh) 一种云服务质量监测方法及系统
CN110245273B (zh) 一种获取app业务特征库的方法及相应的装置
Huda et al. Identification of process-based fraud patterns in credit application
CN106230602B (zh) 数字证书的证书链的完整性检测系统及方法
CN112417492A (zh) 基于数据分类分级的服务提供方法
CN105721406A (zh) 一种获取ip黑名单的方法和装置
CN114372098A (zh) 基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台及方法
CN109710667A (zh) 一种基于大数据平台的多源数据融合共享实现方法及系统
CN115514784A (zh) 基于物联网的多源数据采集中台
CN111914147A (zh) 一种企业疑似实际控制人征信方法及系统
CN114841789A (zh) 基于区块链的审计审价故障数据在线编辑方法及系统
CN114491168A (zh) 调控云样本数据共享方法、系统、计算机设备及存储介质
CN113487241A (zh) 企业环保信用等级的分类方法、装置、设备及存储介质
CN113726525A (zh) 一种能源工业云网数据溯源方法及装置
KR100891345B1 (ko) 상이한 정보보호수준지표의 상호매핑을 지원하는 정보보호운영관리시스템 및 방법
CN111581371A (zh) 一种基于出境数据网络流量的网络安全分析方法和装置
CN114553588B (zh) 一种基于人工智能的互联网金融数据防护方法及服务器
CN116070193A (zh) 一种运维人员权限审计方法、系统及存储介质
CN108737379A (zh) 一种大数据传输处理算法
CN109583210A (zh) 一种水平权限漏洞的识别方法、装置及其设备
CN113486391A (zh) 一种基于云计算的财务数据处理方法
CN110110542A (zh) 影像资料管理系统、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20201110