CN112102093A - 主体身份及关联关系识别方法、装置、设备和介质 - Google Patents
主体身份及关联关系识别方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN112102093A CN112102093A CN202010777808.6A CN202010777808A CN112102093A CN 112102093 A CN112102093 A CN 112102093A CN 202010777808 A CN202010777808 A CN 202010777808A CN 112102093 A CN112102093 A CN 112102093A
- Authority
- CN
- China
- Prior art keywords
- information
- identity
- association
- subject
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 53
- 230000035515 penetration Effects 0.000 claims abstract description 26
- 238000012216 screening Methods 0.000 claims abstract description 10
- 238000005457 optimization Methods 0.000 claims description 20
- 230000011218 segmentation Effects 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 13
- 239000006185 dispersion Substances 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 6
- 230000010354 integration Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 3
- 230000001502 supplementing effect Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 5
- 238000000547 structure data Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 244000292411 Excoecaria agallocha Species 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000004753 textile Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种主体身份及关联关系识别方法,该方法包括:获取主体要素信息并输入主体身份识别引擎,通过主体身份识别引擎内载的标准数据库的数据库信息进行匹配。通过主体身份识别引擎将匹配的数据库信息对主体要素信息进行更新,得到精确识别的主体身份。通过股权穿透算法计算主体身份的外部关联关系,将所有外部关联关系与主体身份进行关联,得到目标关联群组。获取与主体身份及外部关联关系关联的内部关联存储信息,根据内部关联存储信息筛选出内部关联部门,将内部关联部门与目标关联群组关联,得到目标关联网络。本发明可帮助金融机构提前捕捉风险,确保投资安全。此外,还提出了主体身份及关联关系识别装置、设备和介质。
Description
技术领域
本发明涉及金融主体识别技术领域,尤其是涉及主体身份及关联关系识别方法、装置、设备和介质。
背景技术
在资本市场风控领域中,对主体及业务的风险识别、风险评估、风险处置等不同阶段的风险控制手段,均需要建立在主体身份清晰识别的基础之上,明确主体跨业务开展的情况,并对主体进行风险的监测、计量、分析以及处置工作。
但单一的主体身份识别仅能了解到主体在金融机构内部的业务开展情况,对于更完整的风险传导分析,不能很好的结合外部关联主体及与关联主体之间的传导关系。当风险出现于外部关联的主体时,风险会在存在关联的主体之间扩散,若在目标主体发生实际风险前不通过周边监测提前捕捉风险信号并进行风险预防工作,就不能实现“未雨绸缪”。当检测到目标主体疑似出现实现风险时,可能已无法避免风险的发生,这将会对金融机构造成极大的经济损失。
发明内容
基于此,有必要针对上述问题,提供一种有助于规避风险的主体身份及关联关系识别方法、装置、设备和介质。
一种主体身份及关联关系识别的方法,所述方法包括:
获取主体要素信息,将所述主体要素信息输入主体身份识别引擎,以使得所述主体要素信息与所述主体身份识别引擎内载的标准数据库的数据库信息进行匹配;
当所述主体要素信息的任一子主体要素信息与所述标准数据库的数据库信息匹配时,通过所述主体身份识别引擎将匹配的数据库信息对所述主体要素信息进行更新,得到精确识别的主体身份;
通过股权穿透算法计算所述主体身份的外部关联关系,将所有外部关联关系与所述主体身份进行关联,得到目标关联群组;
获取与所述主体身份及所述外部关联关系关联的内部关联存储信息,根据所述内部关联存储信息筛选出内部关联部门,将所述内部关联部门与所述目标关联群组关联,得到包括内部关联关系的目标关联网络。
在其中一个实施例中,在所述以使得所述主体要素信息与所述主体身份识别引擎内载的标准数据库的数据库信息进行匹配之后,还包括:
当所述主体要素信息的所有子主体要素信息与所述标准数据库的数据库信息不匹配时,通过所述主体身份识别引擎计算所述主体要素信息中的待确认主体名称与所有所述数据库信息中的已录入主体名称的相似度;
输出相似度排在前N的预设个数的所述数据库信息,获取用户从输出的所述预设个数的数据库信息中选择的目标数据库信息,将所述目标数据库信息作为模糊识别的主体身份。
在其中一个实施例中,所述计算所述主体要素信息中的待确认主体名称与所有所述数据库信息中的已录入主体名称的相似度,包括:
通过所述主体身份识别引擎调用向量空间模型和布尔模型计算所述主体要素信息中的待确认主体名称与所有所述数据库信息中的已录入主体名称的粗略相似度;
根据相似度调优规则对所述粗略相似度进行调优,得到调优后的相似度;其中,所述相似度调优规则包括分词权重调节规则、定位锁定规则、核心产品认定规则中的至少一种。
在其中一个实施例中,在所述将所述主体要素信息输入主体身份识别引擎之后,还包括:
通过所述主体身份识别引擎对所述主体要素信息进行繁简字体转化、符号清洗、身份证升位处理中的至少一种。
在其中一个实施例中,在所述获取主体要素信息之前,还包括:
从目标渠道获取企业标准信息及产品标准信息,将所述企业标准信息及所述产品标准信息输入数据库,对所述企业标准信息及所述产品标准信息进行同族归类,得到所述标准数据库;
将所述标准数据库导入所述主体身份识别引擎。
在其中一个实施例中,所述通过股权穿透算法计算所述主体身份的外部关联关系,还包括:
通过算法优化规则对所述股权穿透算法进行算法优化;其中,所述算法优化规则包括股权分散识别规则、普通合伙人上穿规则、交叉循环持股处理规则中的至少一种。
在其中一个实施例中,在所述得到目标关联群组之后,还包括:
从目标渠道获取外部关系信息,对所述外部关系信息进行信息整合,得到基础关系网;
通过社区发现算法将所述目标关联群组中的母群组分割为基于所述基础关系网的子群组。
一种主体身份及关联关系识别装置,所述装置包括:
信息匹配模块,用于获取主体要素信息,将所述主体要素信息输入主体身份识别引擎,以使得所述主体要素信息与所述主体身份识别引擎内载的标准数据库的数据库信息进行匹配;
主体身份识别模块,用于当所述主体要素信息的任一子主体要素信息与所述标准数据库的数据库信息匹配时,通过所述主体身份识别引擎将匹配的数据库信息对所述主体要素信息进行补充和/或更新,得到精确识别的主体身份;
关联群组构建模块,用于通过股权穿透算法计算所述主体身份的外部关联关系,将所有外部关联关系与所述主体身份进行关联,得到目标关联群组;
内部关系融合模块,用于与所述主体身份及所述外部关联关系关联的获取内部关联存储信息,根据所述内部关联存储信息筛选出内部关联部门,将所述内部关联部门与所述目标关联群组关联,得到包括内部关联关系的目标关联网络。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
获取主体要素信息,将所述主体要素信息输入主体身份识别引擎,以使得所述主体要素信息与所述主体身份识别引擎内载的标准数据库的数据库信息进行匹配;
当所述主体要素信息的任一子主体要素信息与所述标准数据库的数据库信息匹配时,通过所述主体身份识别引擎将匹配的数据库信息对所述主体要素信息进行更新,得到精确识别的主体身份;
通过股权穿透算法计算所述主体身份的外部关联关系,将所有外部关联关系与所述主体身份进行关联,得到目标关联群组;
获取与所述主体身份及所述外部关联关系关联的内部关联存储信息,根据所述内部关联存储信息筛选出内部关联部门,将所述内部关联部门与所述目标关联群组关联,得到包括内部关联关系的目标关联网络。
一种主体身份及关联关系识别设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
获取主体要素信息,将所述主体要素信息输入主体身份识别引擎,以使得所述主体要素信息与所述主体身份识别引擎内载的标准数据库的数据库信息进行匹配;
当所述主体要素信息的任一子主体要素信息与所述标准数据库的数据库信息匹配时,通过所述主体身份识别引擎将匹配的数据库信息对所述主体要素信息进行更新,得到精确识别的主体身份;
通过股权穿透算法计算所述主体身份的外部关联关系,将所有外部关联关系与所述主体身份进行关联,得到目标关联群组;
获取与所述主体身份及所述外部关联关系关联的内部关联存储信息,根据所述内部关联存储信息筛选出内部关联部门,将所述内部关联部门与所述目标关联群组关联,得到包括内部关联关系的目标关联网络。
本发明提供了主体身份及关联关系识别方法、装置、设备和介质,在对主体要素信息进行单一比对时,引入了数据具有较高可信度的标准数据库,从而可实现主体身份的准确识别。此外,还构建了融合有内部关联关系的目标关联群组,在该目标关联群组中可以查找到目标主体在群组中的位置、群组中的其他成员信息以及主体与其他成员的明确关系,从而构建了完整的风险由外至内的传导、预警、监测链路。从而目标主体未实际发生风险时,金融机构就可以提前捕捉风险信号,确保投资安全。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为第一实施例中主体身份及关联关系识别方法的流程示意图;
图2为一个实施例中股权穿透算法的示意图;
图3为一个实施例中目标关联群组的示意图;
图4为一个实施例中目标关联网络的示意图;
图5为第二实施例中主体身份及关联关系识别分法的流程示意图;
图6为一个实施例中主体身份及关联关系识别装置的结构示意图;
图7为一个实施例中主体身份及关联关系识别设备的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,图1为第一实施例中主体身份及关联关系识别方法的流程示意图,本第一实施例中主体身份及关联关系识别方法提供的步骤包括:
步骤102,获取主体要素信息,将主体要素信息输入主体身份识别引擎,以使得主体要素信息与主体身份识别引擎内载的标准数据库的数据库信息进行匹配。
表1:
原始主体ID | 主体类型 | 主体要素 |
1 | 企业 | 915300007343114578 |
2 | 企业 | 530000000003592 |
3 | 企业 | 云南路乔 |
如表1所示,主体要素信息包括原始主体ID(Identity document,身份标识号)、主体类型及主体要素等信息。本实施例中,该主体要素信息是从业务系统中调取得到,但在金融机构内部存在不同的业务系统,而不同业务系统中主体要素信息登记的标准不统一,因此同一主体对应的主体要素信息之间存在着表1所示的差异。
主体身份识别引擎是根据用户需求与一定算法,运用特定策略检索出特定信息反馈给用户的一门检索技术。本实施例中的主体身份识别引擎为实现搜索功能需建立在预先构建的标准数据库的基础上。其中,构建标准数据库的实现步骤具体包括:首先,从目标渠道获取企业标准信息及产品标准信息。该目标渠道包括工商局网站、交易所网站、企业官网、商品信息服务平台等渠道。而企业标准信息包括企业标准主体统一社会信用代码、工商注册号、企业标准主体名称等;产品标准信息包括产品标准名称、产品备案编号等。将这些企业标准信息及产品标准信息输入数据库中,并依据“证件信息类型”、“数据来源”、“同一主体名称”等归类标准对这些企业标准信息及产品标准信息进行同族归类,得到包含不同数据库信息的标准数据库。最后将标准数据库导入到主体身份识别引擎,以便后续用于数据调用。
步骤104,当主体要素信息的任一子主体要素信息与标准数据库的数据库信息匹配时,通过主体身份识别引擎将匹配的数据库信息对主体要素信息进行更新,得到精确识别的主体身份。
表2:
其中,子主体要素信息在本实施例中具体为表1中的“915300007343114578”、“530000000003592”及“云南路乔”。主体身份识别引擎将上述的子主体要素信息依据预设的重要性顺序分别与标准数据库的数据库信息匹配,可得到如表2所示的多个输出结果。对于第一行的输出结果,可以是在“915300007343114578”匹配数据库信息成功的基础上还更新了工商注册号、产品标准信息(图中未示出)等信息。对于第二行的输出结果,则可以是“530000000003592”匹配数据库信息成功的基础上还更新了统一社会信用代码等信息。而由于在录入“云南路乔”(“乔”实际应为“桥”)时存在录入失误,因此导致该子主体要素信息与标准数据中的数据库信息不匹配,不能得到搜索输出结果。进一步的,用户可任选表2中的一个主体要素信息作为精确识别的主体身份。
步骤106,通过股权穿透算法计算主体身份的外部关联关系,将所有外部关联关系与主体身份进行关联,得到目标关联群组。
参照图2,股权穿透算法实现步骤具体为:以主体身份对应的目标企业(云南路桥股份有限公司)为计算起点,获取该企业主体的股权结构数据。其中该股权结构数据包括外部控股节点对目标企业的控股数据,以及目标企业对各控股节点的控股数据(图2中仅示意出控股节点对目标企业的控股情况)。从该计算起点出发,基于股权结构数据中的股权关系穿透至控制节点。获取该控制节点的股权结构数据,并基于股权结构数据中的股权关系继续穿透,直至穿透至顶,找到不同的各个顶点。进一步的,通过计算每个顶点对起点的累计持股,还可找出找到顶点层中持股最大的实际控制方。最后将所有计算过的外部节点与目标企业进行关联,得到如图3所示的示意图。
进一步的,当在关联群组中发现与同一金融机构存在业务往来的其他的企业主体时,在关联群组中进行标示。如图3中所示的楚雄州开发投资有限公司。以助于金融机构及时归并同一关联群组中所有主体的风险敞口,进行准确的风险计量工作。
步骤108,获取与主体身份及外部关联关系关联的内部关联存储信息,根据内部关联存储信息筛选出内部关联部门,将内部关联部门与目标关联群组关联,得到包括内部关联关系的目标关联网络。
其中,内部关联存储信息包括机构内部存储的交易信息、业务信息及尽调信息。从这些内部关联存储信息中筛选出与主体身份及外部关联关系存在关联的部分信息,及与图3实施例中云南路桥股份有限公司及楚雄州开发投资有限公司存在关联的内部关联存储信息。进一步的,分析产生这些内部关联存储信息的内部关联部门,而这些内部关联部门即是金融机构内部与企业主体实际存在业务往来的部门。将这些内部关联部门在关联群组中分别与企业主体关联,最终得到如图4所示的目标关联网络。基于融合后的目标关联网络,金融机构可进行更完整的风险传导分析。
上述主体身份及关联关系识别方法,在对主体要素信息进行单一比对时,引入了数据具有较高可信度的标准数据库,从而可实现主体身份的准确识别。此外,还构建了融合有内部关联关系的目标关联群组,在该目标关联群组中可以查找到目标主体在群组中的位置、群组中的其他成员信息以及主体与其他成员的明确关系,从而构建了完整的风险由外至内的传导、预警、监测链路。从而目标主体未实际发生风险时,金融机构就可以提前捕捉风险信号,确保投资安全。
如图5所示,图5为第二实施例中主体身份及关联关系识别方法的流程示意图,本第二实施例中主体身份及关联关系识别方法提供的步骤包括:
步骤502,获取主体要素信息,将主体要素信息输入主体身份识别引擎,通过主体身份识别引擎对主体要素信息进行繁简字体转化、符号清洗、身份证升位处理中的至少一种,以使得主体要素信息与主体身份识别引擎内载的标准数据库的数据库信息进行匹配。
步骤504,当主体要素信息的任一子主体要素信息与标准数据库的数据库信息匹配时,通过主体身份识别引擎将匹配的数据库信息对主体要素信息进行更新,得到精确识别的主体身份。
在一个具体的实施场景中,步骤502-504与第一实施例中主体身份及关联关系识别方法中的步骤102-104基本一致,此处不再进行赘述。
步骤506,当主体要素信息的所有子主体要素信息与标准数据库的数据库信息不匹配时,通过主体身份识别引擎计算主体要素信息中的待确认主体名称与所有数据库信息中的已录入主体名称的相似度。
当主体要素信息的所有子主体要素信息与标准数据库的数据库信息不匹配时,说明主体要素信息在记录时由于不标准、老旧、缺漏等原因导致不能得到精确识别的主体身份,需通过模糊识别来进一步识别主体身份。
本实施例中,通过主体身份识别引擎调用向量空间模型和布尔模型计算主体要素信息中的待确认主体名称与所有数据库信息中的已录入主体名称的粗略相似度。具体的,首先调用布尔模型,建立每个已录入主体名称的文档,形成文档集。其中,文档以分词的形式进一步划分。示例性的,文档1包括分词:a、b、c、f、g、h;文档2包括分词:a、f、b、x、y、z。进一步的,获取用户构建的查询逻辑,如:文档中出现a或者b,但一定要出现z。将该查询逻辑表示为布尔表达式,并转换成析取范式进行搜索,可得到分别对应文档1和文档2的三元组二值判定(1,1,0)和(1,1,1),其中,“1”代表返回为“真”,“0”代表返回为“假”。因为文档2符合所有返回条件,因此将文档2保留。
进一步的,调用向量空间模型。首先选取合适的关键词,其中,选取关键词主要使用到如下的计算公式:
其中tft,d指分词在已录入主体名称的文档中的频率,指分词在语料库D的逆文档频率。该公式也简单表示为TF-IDF=TF(词频)×IDF(逆文档频率)。当TF-IDF值越大,说明该分词越重要,可作为关键词。本实施例中,可设定一个TF-IDF阈值,当TF-IDF值大于或等于该TF-IDF阈值,选取分词作为关键词;反之,当TF-IDF值小于该TF-IDF阈值,抛弃该分词。
进一步的,以两两计算粗略相似度为例,还需计算向量余弦值。首先构建待确认主体名称和一个已录入主体名称的分词文本,列出所有词分别计算词频,并写出分词向量。具体的,云南路乔的分词文本为:云南,路,乔;云南路桥股份有限公司的分词文本为:云南,路,桥,股份,有限,公司。包括分词:云南,路,乔,桥,股份,有限,公司。分别计算词频,云南路乔的词频为云南1,路1,乔1,桥0,股份0,有限0,公司0,记为分词向量[1,1,0,0,0,0];云南路桥股份有限公司的词频为云南1,路1,乔0,桥1,股份1,有限1,公司1,记为分词向量[1,1,0,1,1,1,1]。进一步的,通过如下的N维向量余弦公式计算余弦值,及粗略相似度:
更进一步的,根据相似度调优规则对粗略相似度进行调优,得到调优后的相似度;其中,相似度调优规则包括分词权重调节规则,即对部分分词调节权重,例如调低“公司”“股份”等易重复出现分词的分词权重。同时,相似度调优规则还包括定位锁定规则,即在主体身份识别引擎输入目标主体的注册地址,基于全球定位锁定并输出相似地址的所有企业。此外,相似度调优规则还包括核心产品认定规则,即在主体身份识别引擎输入目标主体的核心产品,输入与该核心产品存在关联关系的所有企业。本实施例中,在模糊识别时,可选择其中至少一种相似度调优规则对模糊识别进行调优。如表3所示,经过相似度调优规则调优后的云南路桥股份有限公司的相似度得分为9.920199。
步骤508,输出相似度排在前N的预设个数的数据库信息,获取用户从输出的预设个数的数据库信息中选择的目标数据库信息,将目标数据库信息作为模糊识别的主体身份。
表3:
如表3所示,在经过步骤506的模糊识别后,最终输出相似度前10的数据库信息。可以看出,其中“云南路桥股份有限公司”所关联的数据库信息为最相似的主体身份,而“云南纺织(集团)股份有限公司”所关联的数据库信息为最不相似的主体身份。进一步的,还需根据用户的选择确定其中的目标数据库信息,并将其作为模糊识别的主体身份。可以理解的是,在其他实施例中也能是相似度第二或更低的数据库信息作为目标数据库信息。
步骤510,通过算法优化规则对股权穿透算法进行算法优化,通过优化后的股权穿透算法计算主体身份的外部关联关系,将所有外部关联关系与主体身份进行关联,得到目标关联群组。
其中,算法优化规则包括股权分散识别规则、普通合伙人上穿规则、交叉循环持股处理规则中的至少一种。其中,股权分散识别规则是指将持股比例低于股权分散标准阈值的节点,标记为“股权分散节点”对所有企业上穿运算时,上穿至有“股权分散节点”标志的即停止上穿,计算对应企业的实控人。普通合伙人上穿规则是指首先识别有限合伙企业,再识别有限合伙企业中的普通合伙人关系并沿此关系上穿,直到上穿到实控人。交叉循环持股处理规则是指在沿股权路径上穿时,同时识别循环持股路径并在重复经过的节点处自动停止上穿,并识别出循环持股路径的实控人。本实施例中,在进行股权穿透算法计算时,可选择上述算法优化规则中的至少一种对股权穿透算法进行优化。
步骤512,从目标渠道获取外部关系信息,对外部关系信息进行信息整合,得到基础关系网;通过社区发现算法将目标关联群组中的母群组分割为基于基础关系网的子群组。
本实施例中,从工商局网站、新闻报道、交易所网站等目标渠道收集包括任职关系信息、担保关系信息、投资关系等外部关系信息,对这些信息进行归类整合,形成基础关系网。
遍历基础关系网中的所有节点,对应目标关联群组进行社区(母群组)间的节点转移。对于基础关系网中的每个节点,依次尝试将节点加入到每个邻居节点所在的社区中,并计算加入前后的模块度变化ΔQ。将节点A加入到使ΔQ最大的邻居节点所在的社区;重复节点转移步骤,直到基础关系网中所有节点转移完成,从而实现目标关联群组中节点的更进一步细化。
步骤714,获取与主体身份及外部关联关系关联的内部关联存储信息,根据内部关联存储信息筛选出内部关联部门,将内部关联部门与目标关联群组关联,得到包括内部关联关系的目标关联网络。
在一个具体的实施场景中,步骤714与第一实施例中主体身份及关联关系识别方法中的步骤108基本一致,此处不再进行赘述。
在一个实施例中,如图6所示,提出了一种主体身份及关联关系识别装置,该装置包括:
信息匹配模块602,用于获取主体要素信息,将主体要素信息输入主体身份识别引擎,以使得主体要素信息与主体身份识别引擎内载的标准数据库的数据库信息进行匹配;
主体身份识别模块604,用于当主体要素信息的任一子主体要素信息与标准数据库的数据库信息匹配时,通过主体身份识别引擎将匹配的数据库信息对主体要素信息进行补充和/或更新,得到精确识别的主体身份;
关联群组构建模块606,用于通过股权穿透算法计算主体身份的外部关联关系,将所有外部关联关系与主体身份进行关联,得到目标关联群组;
内部关系融合模块608,用于与主体身份及外部关联关系关联的获取内部关联存储信息,根据内部关联存储信息筛选出内部关联部门,将内部关联部门与目标关联群组关联,得到包括内部关联关系的目标关联网络。
上述主体身份及关联关系识别装置,在对主体要素信息进行单一比对时,引入了数据具有较高可信度的标准数据库,从而可实现主体身份的准确识别。此外,还构建了融合有内部关联关系的目标关联群组,在该目标关联群组中可以查找到目标主体在群组中的位置、群组中的其他成员信息以及主体与其他成员的明确关系,从而构建了完整的风险由外至内的传导、预警、监测链路。从而目标主体未实际发生风险时,金融机构就可以提前捕捉风险信号,确保投资安全。
在一个实施例中,主体身份及关联关系识别装置还包括:模糊识别模块,用于当主体要素信息的所有子主体要素信息与标准数据库的数据库信息不匹配时,通过主体身份识别引擎计算主体要素信息中的待确认主体名称与所有数据库信息中的已录入主体名称的相似度;输出相似度排在前N的预设个数的数据库信息,获取用户从输出的预设个数的数据库信息中选择的目标数据库信息,将目标数据库信息作为模糊识别的主体身份。
在一个实施例中,模糊识别模块,还具体用于通过主体身份识别引擎调用向量空间模型和布尔模型计算主体要素信息中的待确认主体名称与所有数据库信息中的已录入主体名称的粗略相似度;根据相似度调优规则对粗略相似度进行调优,得到调优后的相似度;其中,相似度调优规则包括分词权重调节规则、定位锁定规则、核心产品认定规则中的至少一种。
在一个实施例中,信息匹配模块602,还具体用于通过主体身份识别引擎对主体要素信息进行繁简字体转化、符号清洗、身份证升位处理中的至少一种。
在一个实施例中,主体身份及关联关系识别装置还包括:标准数据库构建模块,用于从目标渠道获取企业标准信息及产品标准信息,将企业标准信息及产品标准信息输入数据库,对企业标准信息及产品标准信息进行同族归类,得到标准数据库;将标准数据库导入主体身份识别引擎。
在一个实施例中,关联群组构建模块606,还具体用于通过算法优化规则对股权穿透算法进行算法优化;其中,算法优化规则包括股权分散识别规则、普通合伙人上穿规则、交叉循环持股处理规则中的至少一种。
在一个实施例中,关联群组构建模块606,还具体用于:从目标渠道获取外部关系信息,对外部关系信息进行信息整合,得到基础关系网;通过社区发现算法将目标关联群组中的母群组分割为基于基础关系网的子群组。
图7示出了一个实施例中主体身份及关联关系识别设备的内部结构图。如图7所示,该主体身份及关联关系识别设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该主体身份及关联关系识别设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现主体身份及关联关系识别方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行主体身份及关联关系识别方法。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的主体身份及关联关系识别设备的限定,具体的主体身份及关联关系识别设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
一种主体身份及关联关系识别设备,包括存储器、处理器以及存储在该存储器中并可在该处理器上执行的计算机程序,该处理器执行该计算机程序时实现如下步骤:获取主体要素信息,将主体要素信息输入主体身份识别引擎,以使得主体要素信息与主体身份识别引擎内载的标准数据库的数据库信息进行匹配;当主体要素信息的任一子主体要素信息与标准数据库的数据库信息匹配时,通过主体身份识别引擎将匹配的数据库信息对主体要素信息进行更新,得到精确识别的主体身份;通过股权穿透算法计算主体身份的外部关联关系,将所有外部关联关系与主体身份进行关联,得到目标关联群组;获取与主体身份及外部关联关系关联的内部关联存储信息,根据内部关联存储信息筛选出内部关联部门,将内部关联部门与目标关联群组关联,得到包括内部关联关系的目标关联网络。
在一个实施例中,在以使得主体要素信息与主体身份识别引擎内载的标准数据库的数据库信息进行匹配之后,还包括:当主体要素信息的所有子主体要素信息与标准数据库的数据库信息不匹配时,通过主体身份识别引擎计算主体要素信息中的待确认主体名称与所有数据库信息中的已录入主体名称的相似度;输出相似度排在前N的预设个数的数据库信息,获取用户从输出的预设个数的数据库信息中选择的目标数据库信息,将目标数据库信息作为模糊识别的主体身份。
在一个实施例中,计算主体要素信息中的待确认主体名称与所有数据库信息中的已录入主体名称的相似度,包括:通过主体身份识别引擎调用向量空间模型和布尔模型计算主体要素信息中的待确认主体名称与所有数据库信息中的已录入主体名称的粗略相似度;根据相似度调优规则对粗略相似度进行调优,得到调优后的相似度;其中,相似度调优规则包括分词权重调节规则、定位锁定规则、核心产品认定规则中的至少一种。
在一个实施例中,在将主体要素信息输入主体身份识别引擎之后,还包括:通过主体身份识别引擎对主体要素信息进行繁简字体转化、符号清洗、身份证升位处理中的至少一种。
在一个实施例中,在获取主体要素信息之前,还包括:从目标渠道获取企业标准信息及产品标准信息,将企业标准信息及产品标准信息输入数据库,对企业标准信息及产品标准信息进行同族归类,得到标准数据库;将标准数据库导入主体身份识别引擎。
在一个实施例中,通过股权穿透算法计算主体身份的外部关联关系,还包括:通过算法优化规则对股权穿透算法进行算法优化;其中,算法优化规则包括股权分散识别规则、普通合伙人上穿规则、交叉循环持股处理规则中的至少一种。
在一个实施例中,在得到目标关联群组之后,还包括:从目标渠道获取外部关系信息,对外部关系信息进行信息整合,得到基础关系网;通过社区发现算法将目标关联群组中的母群组分割为基于基础关系网的子群组。
一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现如下步骤:获取主体要素信息,将主体要素信息输入主体身份识别引擎,以使得主体要素信息与主体身份识别引擎内载的标准数据库的数据库信息进行匹配;当主体要素信息的任一子主体要素信息与标准数据库的数据库信息匹配时,通过主体身份识别引擎将匹配的数据库信息对主体要素信息进行更新,得到精确识别的主体身份;通过股权穿透算法计算主体身份的外部关联关系,将所有外部关联关系与主体身份进行关联,得到目标关联群组;获取与主体身份及外部关联关系关联的内部关联存储信息,根据内部关联存储信息筛选出内部关联部门,将内部关联部门与目标关联群组关联,得到包括内部关联关系的目标关联网络。
在一个实施例中,在以使得主体要素信息与主体身份识别引擎内载的标准数据库的数据库信息进行匹配之后,还包括:当主体要素信息的所有子主体要素信息与标准数据库的数据库信息不匹配时,通过主体身份识别引擎计算主体要素信息中的待确认主体名称与所有数据库信息中的已录入主体名称的相似度;输出相似度排在前N的预设个数的数据库信息,获取用户从输出的预设个数的数据库信息中选择的目标数据库信息,将目标数据库信息作为模糊识别的主体身份。
在一个实施例中,计算主体要素信息中的待确认主体名称与所有数据库信息中的已录入主体名称的相似度,包括:通过主体身份识别引擎调用向量空间模型和布尔模型计算主体要素信息中的待确认主体名称与所有数据库信息中的已录入主体名称的粗略相似度;根据相似度调优规则对粗略相似度进行调优,得到调优后的相似度;其中,相似度调优规则包括分词权重调节规则、定位锁定规则、核心产品认定规则中的至少一种。
在一个实施例中,在将主体要素信息输入主体身份识别引擎之后,还包括:通过主体身份识别引擎对主体要素信息进行繁简字体转化、符号清洗、身份证升位处理中的至少一种。
在一个实施例中,在获取主体要素信息之前,还包括:从目标渠道获取企业标准信息及产品标准信息,将企业标准信息及产品标准信息输入数据库,对企业标准信息及产品标准信息进行同族归类,得到标准数据库;将标准数据库导入主体身份识别引擎。
在一个实施例中,通过股权穿透算法计算主体身份的外部关联关系,还包括:通过算法优化规则对股权穿透算法进行算法优化;其中,算法优化规则包括股权分散识别规则、普通合伙人上穿规则、交叉循环持股处理规则中的至少一种。
在一个实施例中,在得到目标关联群组之后,还包括:从目标渠道获取外部关系信息,对外部关系信息进行信息整合,得到基础关系网;通过社区发现算法将目标关联群组中的母群组分割为基于基础关系网的子群组。
需要说明的是,上述主体身份及关联关系识别方法、装置、设备及计算机可读存储介质属于一个总的发明构思,主体身份及关联关系识别方法、装置、设备及计算机可读存储介质实施例中的内容可相互适用。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种主体身份及关联关系识别的方法,其特征在于,所述方法包括:
获取主体要素信息,将所述主体要素信息输入主体身份识别引擎,以使得所述主体要素信息与所述主体身份识别引擎内载的标准数据库的数据库信息进行匹配;
当所述主体要素信息的任一子主体要素信息与所述标准数据库的数据库信息匹配时,通过所述主体身份识别引擎将匹配的数据库信息对所述主体要素信息进行更新,得到精确识别的主体身份;
通过股权穿透算法计算所述主体身份的外部关联关系,将所有外部关联关系与所述主体身份进行关联,得到目标关联群组;
获取与所述主体身份及所述外部关联关系关联的内部关联存储信息,根据所述内部关联存储信息筛选出内部关联部门,将所述内部关联部门与所述目标关联群组关联,得到包括内部关联关系的目标关联网络。
2.根据权利要求1所述的方法,其特征在于,在所述以使得所述主体要素信息与所述主体身份识别引擎内载的标准数据库的数据库信息进行匹配之后,还包括:
当所述主体要素信息的所有子主体要素信息与所述标准数据库的数据库信息不匹配时,通过所述主体身份识别引擎计算所述主体要素信息中的待确认主体名称与所有所述数据库信息中的已录入主体名称的相似度;
输出相似度排在前N的预设个数的所述数据库信息,获取用户从输出的所述预设个数的数据库信息中选择的目标数据库信息,将所述目标数据库信息作为模糊识别的主体身份。
3.根据权利要求2所述的方法,其特征在于,所述计算所述主体要素信息中的待确认主体名称与所有所述数据库信息中的已录入主体名称的相似度,包括:
通过所述主体身份识别引擎调用向量空间模型和布尔模型计算所述主体要素信息中的待确认主体名称与所有所述数据库信息中的已录入主体名称的粗略相似度;
根据相似度调优规则对所述粗略相似度进行调优,得到调优后的相似度;其中,所述相似度调优规则包括分词权重调节规则、定位锁定规则、核心产品认定规则中的至少一种。
4.根据权利要求1所述的方法,其特征在于,在所述将所述主体要素信息输入主体身份识别引擎之后,还包括:
通过所述主体身份识别引擎对所述主体要素信息进行繁简字体转化、符号清洗、身份证升位处理中的至少一种。
5.根据权利要求1所述的方法,其特征在于,在所述获取主体要素信息之前,还包括:
从目标渠道获取企业标准信息及产品标准信息,将所述企业标准信息及所述产品标准信息输入数据库,对所述企业标准信息及所述产品标准信息进行同族归类,得到所述标准数据库;
将所述标准数据库导入所述主体身份识别引擎。
6.根据权利要求1所述的方法,其特征在于,所述通过股权穿透算法计算所述主体身份的外部关联关系,还包括:
通过算法优化规则对所述股权穿透算法进行算法优化;其中,所述算法优化规则包括股权分散识别规则、普通合伙人上穿规则、交叉循环持股处理规则中的至少一种。
7.根据权利要求1所述的方法,其特征在于,在所述得到目标关联群组之后,还包括:
从目标渠道获取外部关系信息,对所述外部关系信息进行信息整合,得到基础关系网;
通过社区发现算法将所述目标关联群组中的母群组分割为基于所述基础关系网的子群组。
8.一种主体身份及关联关系识别装置,其特征在于,所述装置包括:
信息匹配模块,用于获取主体要素信息,将所述主体要素信息输入主体身份识别引擎,以使得所述主体要素信息与所述主体身份识别引擎内载的标准数据库的数据库信息进行匹配;
主体身份识别模块,用于当所述主体要素信息的任一子主体要素信息与所述标准数据库的数据库信息匹配时,通过所述主体身份识别引擎将匹配的数据库信息对所述主体要素信息进行补充和/或更新,得到精确识别的主体身份;
关联群组构建模块,用于通过股权穿透算法计算所述主体身份的外部关联关系,将所有外部关联关系与所述主体身份进行关联,得到目标关联群组;
内部关系融合模块,用于与所述主体身份及所述外部关联关系关联的获取内部关联存储信息,根据所述内部关联存储信息筛选出内部关联部门,将所述内部关联部门与所述目标关联群组关联,得到包括内部关联关系的目标关联网络。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
10.一种主体身份及关联关系识别设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010777808.6A CN112102093B (zh) | 2020-08-05 | 2020-08-05 | 主体身份及关联关系识别方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010777808.6A CN112102093B (zh) | 2020-08-05 | 2020-08-05 | 主体身份及关联关系识别方法、装置、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112102093A true CN112102093A (zh) | 2020-12-18 |
CN112102093B CN112102093B (zh) | 2024-08-13 |
Family
ID=73749934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010777808.6A Active CN112102093B (zh) | 2020-08-05 | 2020-08-05 | 主体身份及关联关系识别方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112102093B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112749154A (zh) * | 2020-12-30 | 2021-05-04 | 上海微盟企业发展有限公司 | 一种数据入库方法、装置、设备及计算机可读存储介质 |
CN112991063A (zh) * | 2021-04-01 | 2021-06-18 | 执立信息科技(上海)有限公司 | 企业股权穿透方法 |
CN116385157A (zh) * | 2023-06-05 | 2023-07-04 | 紫金诚征信有限公司 | 用于征信信用主体识别的数据处理方法和装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101576903A (zh) * | 2009-03-03 | 2009-11-11 | 杜小勇 | 一种文档相似度衡量方法 |
US7792715B1 (en) * | 2002-09-21 | 2010-09-07 | Mighty Net, Incorporated | Method of on-line credit information monitoring and control |
CN108052888A (zh) * | 2017-04-18 | 2018-05-18 | 黄海虹 | 一种驾驶人员更换系统 |
CN108415989A (zh) * | 2018-02-12 | 2018-08-17 | 苏州朗动网络科技有限公司 | 身份信息识别方法、装置、计算机设备和存储介质 |
US20180373890A1 (en) * | 2016-06-10 | 2018-12-27 | OneTrust, LLC | Data processing systems for identity validation of data subject access requests and related methods |
CN109670937A (zh) * | 2018-09-26 | 2019-04-23 | 平安科技(深圳)有限公司 | 风险用户识别方法、用户设备、存储介质及装置 |
CN109858463A (zh) * | 2019-02-22 | 2019-06-07 | 成都云鼎丝路信息技术有限公司 | 一种双引擎用户识别方法、系统及终端 |
CN110609737A (zh) * | 2019-08-14 | 2019-12-24 | 平安科技(深圳)有限公司 | 关联数据查询方法、装置、计算机设备和存储介质 |
CN110929994A (zh) * | 2019-11-04 | 2020-03-27 | 中证征信(深圳)有限公司 | 企业关联风险的分析方法、装置、设备以及存储介质 |
CN111309822A (zh) * | 2020-02-11 | 2020-06-19 | 深圳众赢维融科技有限公司 | 用户身份识别方法及装置 |
CN111476508A (zh) * | 2020-05-15 | 2020-07-31 | 支付宝(杭州)信息技术有限公司 | 目标操作的风险识别方法及系统 |
-
2020
- 2020-08-05 CN CN202010777808.6A patent/CN112102093B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7792715B1 (en) * | 2002-09-21 | 2010-09-07 | Mighty Net, Incorporated | Method of on-line credit information monitoring and control |
CN101576903A (zh) * | 2009-03-03 | 2009-11-11 | 杜小勇 | 一种文档相似度衡量方法 |
US20180373890A1 (en) * | 2016-06-10 | 2018-12-27 | OneTrust, LLC | Data processing systems for identity validation of data subject access requests and related methods |
CN108052888A (zh) * | 2017-04-18 | 2018-05-18 | 黄海虹 | 一种驾驶人员更换系统 |
CN108415989A (zh) * | 2018-02-12 | 2018-08-17 | 苏州朗动网络科技有限公司 | 身份信息识别方法、装置、计算机设备和存储介质 |
CN109670937A (zh) * | 2018-09-26 | 2019-04-23 | 平安科技(深圳)有限公司 | 风险用户识别方法、用户设备、存储介质及装置 |
CN109858463A (zh) * | 2019-02-22 | 2019-06-07 | 成都云鼎丝路信息技术有限公司 | 一种双引擎用户识别方法、系统及终端 |
CN110609737A (zh) * | 2019-08-14 | 2019-12-24 | 平安科技(深圳)有限公司 | 关联数据查询方法、装置、计算机设备和存储介质 |
CN110929994A (zh) * | 2019-11-04 | 2020-03-27 | 中证征信(深圳)有限公司 | 企业关联风险的分析方法、装置、设备以及存储介质 |
CN111309822A (zh) * | 2020-02-11 | 2020-06-19 | 深圳众赢维融科技有限公司 | 用户身份识别方法及装置 |
CN111476508A (zh) * | 2020-05-15 | 2020-07-31 | 支付宝(杭州)信息技术有限公司 | 目标操作的风险识别方法及系统 |
Non-Patent Citations (2)
Title |
---|
刘奇飞: ""跨社交网络的用户身份关联技术研究"", 《中国优秀硕士论文全文数据库(社会科学I辑)》, 9 June 2019 (2019-06-09) * |
王智玮;: "自动目标识别中全源数据挖掘技术应用", 指挥信息系统与技术, no. 04, 28 August 2012 (2012-08-28) * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112749154A (zh) * | 2020-12-30 | 2021-05-04 | 上海微盟企业发展有限公司 | 一种数据入库方法、装置、设备及计算机可读存储介质 |
CN112749154B (zh) * | 2020-12-30 | 2023-03-24 | 上海微盟企业发展有限公司 | 一种数据入库方法、装置、设备及计算机可读存储介质 |
CN112991063A (zh) * | 2021-04-01 | 2021-06-18 | 执立信息科技(上海)有限公司 | 企业股权穿透方法 |
CN116385157A (zh) * | 2023-06-05 | 2023-07-04 | 紫金诚征信有限公司 | 用于征信信用主体识别的数据处理方法和装置 |
CN116385157B (zh) * | 2023-06-05 | 2023-08-15 | 紫金诚征信有限公司 | 用于征信信用主体识别的数据处理方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112102093B (zh) | 2024-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110489561B (zh) | 知识图谱构建方法、装置、计算机设备和存储介质 | |
CN109767322B (zh) | 基于大数据的可疑交易分析方法、装置和计算机设备 | |
CN112102093B (zh) | 主体身份及关联关系识别方法、装置、设备和介质 | |
US11663254B2 (en) | System and engine for seeded clustering of news events | |
CN110458324B (zh) | 风险概率的计算方法、装置和计算机设备 | |
US20200272645A1 (en) | Identity resolution in big, noisy, and/or unstructured data | |
CN109635082B (zh) | 政策影响分析方法、装置、计算机设备和存储介质 | |
CN109255586B (zh) | 一种面向电子政务办事的在线个性化推荐方法 | |
CN112347340B (zh) | 信息搜索方法、装置和计算机设备 | |
US20220229854A1 (en) | Constructing ground truth when classifying data | |
CN112380346B (zh) | 金融新闻情感分析方法、装置、计算机设备及存储介质 | |
CN114187120A (zh) | 一种车险理赔欺诈风险识别方法及装置 | |
CN111581193A (zh) | 数据处理方法、设备、计算机系统及存储介质 | |
CN111738762A (zh) | 不良资产回收价的确定方法、装置、设备和存储介质 | |
US20130339288A1 (en) | Determining document classification probabilistically through classification rule analysis | |
CN114998004A (zh) | 一种基于企业金融贷款风控的方法及系统 | |
CN111460268B (zh) | 数据库查询请求的确定方法、装置和计算机设备 | |
CN113159793A (zh) | 数据处理方法、装置、电子设备及计算机存储介质 | |
CN115982429B (zh) | 一种基于流程控制的知识管理方法及系统 | |
CN112491925A (zh) | 根据时间节点获取网络安全事件的方法、系统及电子设备 | |
CN106326472B (zh) | 一种侦查信息完整性验证方法 | |
Winkler | Data quality in data warehouses | |
US11892989B2 (en) | System and method for predictive structuring of electronic data | |
US12026458B2 (en) | Systems and methods for generating document templates from a mixed set of document types | |
US20240005035A1 (en) | Method for evaluating the risk of re-identification of anonymised data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |