CN113806600B - 业务数据的家庭关系网络构建方法、装置、设备及介质 - Google Patents

业务数据的家庭关系网络构建方法、装置、设备及介质 Download PDF

Info

Publication number
CN113806600B
CN113806600B CN202111151485.0A CN202111151485A CN113806600B CN 113806600 B CN113806600 B CN 113806600B CN 202111151485 A CN202111151485 A CN 202111151485A CN 113806600 B CN113806600 B CN 113806600B
Authority
CN
China
Prior art keywords
family
stock
incremental
data
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111151485.0A
Other languages
English (en)
Other versions
CN113806600A (zh
Inventor
黄移军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202111151485.0A priority Critical patent/CN113806600B/zh
Publication of CN113806600A publication Critical patent/CN113806600A/zh
Application granted granted Critical
Publication of CN113806600B publication Critical patent/CN113806600B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及人工智能技术领域,提供一种业务数据的家庭关系网络构建方法、装置、设备及介质,用于解决无法保证基于业务数据构建的家庭关系网络的标识唯一性、高效计算的技术问题。业务数据的家庭关系网络构建方法包括:获取存量业务数据的目标关系对数据;调用最大连通图算法对目标关系对数据进行遍历得到存量遍历数据,根据存量遍历数据构建最大连通子图得到存量家庭关系网络;获取增量家庭关系网络、存量家庭关系网络的存量家庭信息和增量家庭关系网络的增量家庭信息;通过存量家庭信息和增量家庭信息,将存量家庭关系网络和增量家庭关系网络进行融合得到目标家庭关系网络。此外,本发明还涉及区块链技术,目标家庭关系网络可存储于区块链中。

Description

业务数据的家庭关系网络构建方法、装置、设备及介质
技术领域
本发明涉及人工智能领域,尤其涉及一种业务数据的家庭关系网络构建方法、装置、设备及介质。
背景技术
随着业务的发展,对于业务数据的管理也成一个关注点,其中,家庭关系网络也是管理业务数据的方式之一。目前,一般都是通过根据每个全量业务数据来构建家庭关系网络来实现对业务数据的管理。但是,由于业务数据会实时变更,按照全量数据的方式来构建家庭关系网络会导致计算量巨大,或者,导致构建的家庭关系网络的标识无法保持不变,因而,导致了无法保证基于业务数据构建的家庭关系网络的标识唯一性、高效计算。
发明内容
本发明提供一种业务数据的家庭关系网络构建方法、装置、设备及介质,用于解决无法保证基于业务数据构建的家庭关系网络的标识唯一性、高效计算的技术问题。
本发明第一方面提供了一种业务数据的家庭关系网络构建方法,包括:
获取存量业务数据,对所述存量业务数据进行关系对提取,得到目标关系对数据;
调用预置的最大连通图算法,对所述目标关系对数据进行遍历,得到存量遍历数据,并根据所述存量遍历数据构建最大连通子图,得到存量家庭关系网络;
获取增量家庭关系网络,并获取所述存量家庭关系网络的存量家庭信息,以及所述增量家庭关系网络的增量家庭信息,所述存量家庭信息为存量家庭成员或目标存量家庭号信息,所述增量家庭信息为增量家庭成员或目标增量家庭号信息,所述目标存量家庭号信息包括目标存量业务时间和存量客户号,所述目标增量家庭号信息均包括目标增量业务时间和增量客户号;
通过所述存量家庭信息和所述增量家庭信息,将所述存量家庭关系网络和所述增量家庭关系网络进行融合,得到目标家庭关系网络。
可选的,在本发明第一方面的第一种实现方式中,所述获取增量家庭关系网络,并获取所述存量家庭关系网络的存量家庭信息,以及所述增量家庭关系网络的增量家庭信息,所述存量家庭信息为存量家庭成员或目标存量家庭号信息,所述增量家庭信息为增量家庭成员或目标增量家庭号信息,所述目标存量家庭号信息包括目标存量业务时间和存量客户号,所述目标增量家庭号信息均包括目标增量业务时间和增量客户号,包括:
获取增量业务数据,并基于所述增量业务数据构建增量家庭关系网络;
提取所述存量家庭关系网络的家庭成员,得到存量家庭成员,并提取增量家庭关系网络的家庭成员,得到增量家庭成员;
分别对所述存量家庭关系网络和所述增量家庭关系网络进行目标业务时间提取和客户号提取,得到初始存量家庭号信息和初始增量家庭号信息,所述目标业务时间提取中的目标业务时间用于指示家庭成员中最早的业务时间,所述初始存量家庭号信息包括目标存量业务时间和存量客户号,所述初始增量家庭号信息均包括目标增量业务时间和增量客户号;
通过预置的消息摘要算法,分别对所述初始存量家庭号信息和所述初始增量家庭号信息进行加密,得到目标存量家庭号信息和目标增量家庭号信息;
将所述存量家庭成员或所述目标存量家庭号信息确定为存量家庭信息,并将所述增量家庭成员或所述目标增量家庭号信息确定为增量家庭信息。
可选的,在本发明第一方面的第二种实现方式中,所述获取增量业务数据,并基于所述增量业务数据构建增量家庭关系网络,包括:
获取增量业务数据,获取所述增量业务数据中的增量关系对数据,并通过所述最大连通图算法对所述增量关系对数据进行遍历,得到新增遍历数据;
根据所述新增遍历数据创建增量无向子图,对所述增量无向子图进行连通分量的统计,得到增量最大连通子图;
根据所述增量最大连通子图生成增量家庭关系网络。
可选的,在本发明第一方面的第三种实现方式中,所述通过所述存量家庭信息和所述增量家庭信息,将所述存量家庭关系网络和所述增量家庭关系网络进行融合,得到目标家庭关系网络,包括:
当所述存量家庭信息为存量家庭成员,且所述增量家庭信息为增量家庭成员时,判断所述存量家庭成员中是否存在所述增量家庭成员;
若所述存量家庭成员存在所述增量家庭成员,则根据需求将所述增量家庭成员更新到所述存量家庭成员中,并将更新后的存量家庭成员的存量家庭关系网络确定为目标家庭关系网络。
可选的,在本发明第一方面的第四种实现方式中,所述通过所述存量家庭信息和所述增量家庭信息,将所述存量家庭关系网络和所述增量家庭关系网络进行融合,得到目标家庭关系网络,包括:
当所述存量家庭信息为目标存量家庭号信息,且所述增量家庭信息为目标增量家庭号信息时,获取客户号存在信息,所述客户号存在信息用于指示所述存量客户号在所述增量客户号中的存在状况;
根据所述客户号存在信息将所述目标增量家庭号信息合并到所述目标存量家庭信息中,得到已合并存量家庭信息,并判断所述已合并存量家庭信息对应的存量家庭关系网络是否家庭号唯一;
若所述已合并存量家庭信息对应的存量家庭关系网络是家庭号唯一,则将所述已合并存量家庭信息对应的存量家庭关系网络确定为目标家庭关系网络。
可选的,在本发明第一方面的第五种实现方式中,所述调用预置的最大连通图算法,对所述目标关系对数据进行遍历,得到存量遍历数据,并根据所述存量遍历数据构建最大连通子图,得到存量家庭关系网络,包括:
步骤一:对所述目标关系对数据中的多个客户数据进行随机选取,得到首客户数据,所述目标关系对数据包括多个客户数据和客户关系对,一个客户数据对应一个客户;
步骤二:调用预置的最大连通图算法中的搜索算法,基于所述首客户数据和所述客户关系对,对所述目标关系对数据进行遍历,得到首客户的存量遍历数据;
步骤三:根据所述首客户的存量遍历数据创建首客户存量无向子图,对所述首客户存量无向子图进行连通分量的统计,得到首客户最大连通子图;
步骤四:获取所述目标关系对数据中除了所述首客户最大连通子图之外的客户数据,得到其他客户数据,并对所述其他客户数据随机选取,得到次客户数据,基于所述次客户数据和所述客户关系对,对所述目标关系对数据进行遍历,得到次客户的存量遍历数据,基于所述次客户的存量遍历数据创建首客户存量无向子图,对所述次客户存量无向子图进行连通分量进行统计,得到次客户最大连通子图;
步骤五:重复执行步骤四,直至所述目标关系对数据中的所有客户数据均创建了对应的客户最大连通子图,得到剩余客户最大连通子图集,根据所述首客户最大连通子图、所述次客户最大连通子图和所述剩余客户最大连通子图集生成存量家庭关系网络。
可选的,在本发明第一方面的第六种实现方式中,所述通过所述存量家庭信息和所述增量家庭信息,将所述存量家庭关系网络和所述增量家庭关系网络进行融合,得到目标家庭关系网络之后,还包括:
基于所述目标家庭关系网络进行业务产品组合的分析和聚类,得到目标业务产品组合信息。
本发明第二方面提供了一种业务数据的家庭关系网络构建装置,包括:
提取模块,用于获取存量业务数据,对所述存量业务数据进行关系对提取,得到目标关系对数据;
遍历构建模块,用于调用预置的最大连通图算法,对所述目标关系对数据进行遍历,得到存量遍历数据,并根据所述存量遍历数据构建最大连通子图,得到存量家庭关系网络;
获取模块,用于获取增量家庭关系网络,并获取所述存量家庭关系网络的存量家庭信息,以及所述增量家庭关系网络的增量家庭信息,所述存量家庭信息为存量家庭成员或目标存量家庭号信息,所述增量家庭信息为增量家庭成员或目标增量家庭号信息,所述目标存量家庭号信息包括目标存量业务时间和存量客户号,所述目标增量家庭号信息均包括目标增量业务时间和增量客户号;
融合模块,用于通过所述存量家庭信息和所述增量家庭信息,将所述存量家庭关系网络和所述增量家庭关系网络进行融合,得到目标家庭关系网络。
可选的,在本发明第二方面的第一种实现方式中,所述获取模块包括:
构建单元,用于获取增量业务数据,并基于所述增量业务数据构建增量家庭关系网络;
第一提取单元,用于提取所述存量家庭关系网络的家庭成员,得到存量家庭成员,并提取增量家庭关系网络的家庭成员,得到增量家庭成员;
第二提取单元,用于分别对所述存量家庭关系网络和所述增量家庭关系网络进行目标业务时间提取和客户号提取,得到初始存量家庭号信息和初始增量家庭号信息,所述目标业务时间提取中的目标业务时间用于指示家庭成员中最早的业务时间,所述初始存量家庭号信息包括目标存量业务时间和存量客户号,所述初始增量家庭号信息均包括目标增量业务时间和增量客户号;
加密单元,用于通过预置的消息摘要算法,分别对所述初始存量家庭号信息和所述初始增量家庭号信息进行加密,得到目标存量家庭号信息和目标增量家庭号信息;
确定单元,用于将所述存量家庭成员或所述目标存量家庭号信息确定为存量家庭信息,并将所述增量家庭成员或所述目标增量家庭号信息确定为增量家庭信息。
可选的,在本发明第二方面的第二种实现方式中,所述构建单元具体用于:
获取增量业务数据,获取所述增量业务数据中的增量关系对数据,并通过所述最大连通图算法对所述增量关系对数据进行遍历,得到新增遍历数据;
根据所述新增遍历数据创建增量无向子图,对所述增量无向子图进行连通分量的统计,得到增量最大连通子图;
根据所述增量最大连通子图生成增量家庭关系网络。
可选的,在本发明第二方面的第三种实现方式中,所述融合模块具体用于:
当所述存量家庭信息为存量家庭成员,且所述增量家庭信息为增量家庭成员时,判断所述存量家庭成员中是否存在所述增量家庭成员;
若所述存量家庭成员存在所述增量家庭成员,则根据需求将所述增量家庭成员更新到所述存量家庭成员中,并将更新后的存量家庭成员的存量家庭关系网络确定为目标家庭关系网络。
可选的,在本发明第二方面的第四种实现方式中,所述融合模块具体还用于:
当所述存量家庭信息为目标存量家庭号信息,且所述增量家庭信息为目标增量家庭号信息时,获取客户号存在信息,所述客户号存在信息用于指示所述存量客户号在所述增量客户号中的存在状况;
根据所述客户号存在信息将所述目标增量家庭号信息合并到所述目标存量家庭信息中,得到已合并存量家庭信息,并判断所述已合并存量家庭信息对应的存量家庭关系网络是否家庭号唯一;
若所述已合并存量家庭信息对应的存量家庭关系网络是家庭号唯一,则将所述已合并存量家庭信息对应的存量家庭关系网络确定为目标家庭关系网络。
可选的,在本发明第二方面的第五种实现方式中,所述遍历构建模块具体用于:
步骤一:对所述目标关系对数据中的多个客户数据进行随机选取,得到首客户数据,所述目标关系对数据包括多个客户数据和客户关系对,一个客户数据对应一个客户;
步骤二:调用预置的最大连通图算法中的搜索算法,基于所述首客户数据和所述客户关系对,对所述目标关系对数据进行遍历,得到首客户的存量遍历数据;
步骤三:根据所述首客户的存量遍历数据创建首客户存量无向子图,对所述首客户存量无向子图进行连通分量的统计,得到首客户最大连通子图;
步骤四:获取所述目标关系对数据中除了所述首客户最大连通子图之外的客户数据,得到其他客户数据,并对所述其他客户数据随机选取,得到次客户数据,基于所述次客户数据和所述客户关系对,对所述目标关系对数据进行遍历,得到次客户的存量遍历数据,基于所述次客户的存量遍历数据创建首客户存量无向子图,对所述次客户存量无向子图进行连通分量进行统计,得到次客户最大连通子图;
步骤五:重复执行步骤四,直至所述目标关系对数据中的所有客户数据均创建了对应的客户最大连通子图,得到剩余客户最大连通子图集,根据所述首客户最大连通子图、所述次客户最大连通子图和所述剩余客户最大连通子图集生成存量家庭关系网络。
可选的,在本发明第二方面的第六种实现方式中,所述业务数据的家庭关系网络构建装置,还包括:
分析聚类模块,用于基于所述目标家庭关系网络进行业务产品组合的分析和聚类,得到目标业务产品组合信息。
本发明第三方面提供了一种业务数据的家庭关系网络构建设备,包括:存储器和至少一个处理器,所述存储器中存储有计算机程序;所述至少一个处理器调用所述存储器中的所述计算机程序,以使得所述业务数据的家庭关系网络构建设备执行上述的业务数据的家庭关系网络构建方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,使得计算机执行上述的业务数据的家庭关系网络构建方法。
本发明提供的技术方案中,获取存量业务数据,对所述存量业务数据进行关系对提取,得到目标关系对数据;调用预置的最大连通图算法,对所述目标关系对数据进行遍历,得到存量遍历数据,并根据所述存量遍历数据构建最大连通子图,得到存量家庭关系网络;获取增量家庭关系网络,并获取所述存量家庭关系网络的存量家庭信息,以及所述增量家庭关系网络的增量家庭信息,所述存量家庭信息为存量家庭成员或目标存量家庭号信息,所述增量家庭信息为增量家庭成员或目标增量家庭号信息,所述目标存量家庭号信息包括目标存量业务时间和存量客户号,所述目标增量家庭号信息均包括目标增量业务时间和增量客户号;通过所述存量家庭信息和所述增量家庭信息,将所述存量家庭关系网络和所述增量家庭关系网络进行融合,得到目标家庭关系网络。本发明实施例中,能够有效适应业务数据的实时变更,且计算简单便捷、有效,实现了既能够保证基于业务数据的家庭关系网络的标识唯一性,又能够高效计算的效果,解决了无法保证基于业务数据构建的家庭关系网络的标识唯一性、高效计算的技术问题。
附图说明
图1为本发明实施例中业务数据的家庭关系网络构建方法的一个实施例示意图;
图2为本发明实施例中业务数据的家庭关系网络构建方法的另一个实施例示意图;
图3为本发明实施例中业务数据的家庭关系网络构建装置的一个实施例示意图;
图4为本发明实施例中业务数据的家庭关系网络构建装置的另一个实施例示意图;
图5为本发明实施例中业务数据的家庭关系网络构建设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种业务数据的家庭关系网络构建方法、装置、设备及介质,解决了无法保证基于业务数据的家庭关系网络的标识唯一性、高效计算的技术问题。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(contentdelivery network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中业务数据的家庭关系网络构建方法的一个实施例包括:
101、获取存量业务数据,对存量业务数据进行关系对提取,得到目标关系对数据。
可以理解的是,本发明的执行主体可以为业务数据的家庭关系网络构建装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
服务器根据预设时间点对预置数据库进行检索,得到存量业务数据。其中,存量业务数据用于指示截止至预设时间点的已有全量业务数据(已有全量业务数据包括所有的有效数据和失效数据),例如:以存量业务数据为存量保单数据为例说明,预设时间点为2021年7月19号,则存量保单数据为截止到2021年7月19号的所有保单数据。
服务器对存量业务数据进行空值填充、异常检测和数据格式标准化,得到预处理后的存量业务数据;调用预置的关系抽取模型,对预处理后的存量业务数据进行实体识别,得到实体,基于实体对预处理后的存量业务数据进行三元组的实体关系抽取,得到目标关系对数据,目标关系对数据包括多个客户数据和客户关系对,客户关系对为各客户之间的关系对,客户数据用于指示各客户对应的业务数据,目标关系对数据例如:以存量业务数据为存量保单数据为例说明,调用预置的关系抽取模型,对预处理后的存量业务数据进行实体识别,得到实体:投保人、保单、被保人,被保人、保单、受益人,基于实体对存量保单数据进行三元组的实体关系抽取,得到实体关系:投保人(客户1)—保单—被保人以及被保人(客户2)—保单—受益人,对实体关系进行转换,得到客户之间的关系对:客户1—客户2的关系对,目标关系对数据为客户1—客户2的关系对,以及客户1和客户2分别对应的业务数据(即多个客户数据)。
102、调用预置的最大连通图算法,对目标关系对数据进行遍历,得到存量遍历数据,并根据存量遍历数据构建最大连通子图,得到存量家庭关系网络。
服务器调用预置的最大连通图算法,对目标关系对数据依次进行迭代的客户选择和客户遍历,得到每次遍历的数据,即存量遍历数据,根据每次遍历的数据构建初始子图,该初始子图包括无向图(非连通图)和连通图,其中,初始子图包括一个客户或一个以上客户的客户数据;对初始子图进行连通分量分析,得到最大连通子图,从而得到存量家庭关系网络,存量家庭关系网络为根据姓名、身份证和家庭住址等辅助信息,把有关联关系的人串起来,从而把家庭的成员识别到一起,并标识成员之间的关系,年龄、性别、学历、家庭住址、经济情况、婚姻状态等信息,能比较立体全面的刻画一个家庭成员的现状的关系网络。
103、获取增量家庭关系网络,并获取存量家庭关系网络的存量家庭信息,以及增量家庭关系网络的增量家庭信息,存量家庭信息为存量家庭成员或目标存量家庭号信息,增量家庭信息为增量家庭成员或目标增量家庭号信息,目标存量家庭号信息包括目标存量业务时间和存量客户号,目标增量家庭号信息均包括目标增量业务时间和增量客户号。
服务器从预置数据库中提取增量家庭关系网络,或者,获取增量业务数据,并基于增量业务数据构建增量家庭关系网络,其中,增量家庭关系网络为基于增量业务数据构建的家庭关系网络,增量业务数据为预设时间点之后新增的业务数据,例如:预设时间点为2021年7月19号,则增量业务数据为2021年7月19号之后新增的业务数据。
服务器获取存量家庭关系网络的各家庭所对应的存量家庭信息,存量家庭信息为存量家庭成员或目标存量家庭号信息。其中,目标存量家庭号信息为对目标存量业务时间和存量客户号进行加密后的消息摘要算法(message digest algorithm md5,MD5)值,目标存量家庭号信息中的目标存量业务时间为存量家庭关系网络的各家庭的各家庭成员(客户)的业务时间中最早的业务时间,例如:以存量业务数据为存量保单数据,则目标业务时间为存量家庭关系网络中各家庭的最早保单的承保时间,即客户1(家庭成员):2010-08-02、客户2(家庭成员):2012-05-02、客户3(家庭成员):2020-06-10,则目标业务时间为2010-08-02。目标存量家庭号信息中的存量客户号如:家庭成员1对应的客户号为:客户1或客户A。
服务器获取增量家庭关系网络对应各家庭对应的增量家庭信息,增量家庭信息为增量家庭成员或目标增量家庭号信息。其中,目标增量家庭号信息为对目标增量业务时间和增量客户号进行加密后的消息摘要算法(message digest algorithm md5,MD5)值,目标增量家庭号信息中的目标增量业务时间为增量家庭关系网络的各家庭中各家庭成员(客户)的业务时间中最早的业务时间,例如:以增量业务数据为增量保单数据,则目标业务时间为增量家庭关系网络中各家庭的最早保单的承保时间。
104、通过存量家庭信息和增量家庭信息,将存量家庭关系网络和增量家庭关系网络进行融合,得到目标家庭关系网络。
服务器根据存量家庭信息和增量家庭信息,对存量家庭关系网络和增量家庭关系网络进行重复值检测,即根据存量家庭信息和增量家庭信息,判断存量家庭关系网络与增量家庭关系网络之间是否存在重复的家庭信息,若是,则将对应的增量家庭关系网络添加至存量家庭关系网络,得到目标家庭关系网络,若否,则保留对应的增量家庭关系网络。进一步地,当存量家庭信息为目标存量家庭号信息、增量家庭信息为目标增量家庭号信息时,目标家庭关系网络用于指示同一个家庭的家庭号唯一、合成的新家庭的家庭号唯一。
本发明实施例中,能够有效适应业务数据的实时变更,且计算简单便捷、有效,实现了既能够保证基于业务数据的家庭关系网络的标识唯一性,又能够高效计算的效果,解决了无法保证基于业务数据的家庭关系网络的标识唯一性、高效计算的技术问题。
请参阅图2,本发明实施例中业务数据的家庭关系网络构建方法的另一个实施例包括:
201、获取存量业务数据,对存量业务数据进行关系对提取,得到目标关系对数据。
该步骤201的执行过程与上述步骤101的执行过程类似,在此不再赘述。
202、调用预置的最大连通图算法,对目标关系对数据进行遍历,得到存量遍历数据,并根据存量遍历数据构建最大连通子图,得到存量家庭关系网络。
具体地,服务器执行以下过程:步骤一:对目标关系对数据中的多个客户数据进行随机选取,得到首客户数据,目标关系对数据包括多个客户数据和客户关系对,一个客户数据对应一个客户;步骤二:调用预置的最大连通图算法中的搜索算法,基于首客户数据和客户关系对,对目标关系对数据进行遍历,得到首客户的存量遍历数据;步骤三:根据首客户的存量遍历数据创建首客户存量无向子图,对首客户存量无向子图进行连通分量的统计,得到首客户最大连通子图;步骤四:获取目标关系对数据中除了首客户最大连通子图之外的客户数据,得到其他客户数据,并对其他客户数据随机选取,得到次客户数据,基于次客户数据和客户关系对,对目标关系对数据进行遍历,得到次客户的存量遍历数据,基于次客户的存量遍历数据创建首客户存量无向子图,对次客户存量无向子图进行连通分量进行统计,得到次客户最大连通子图;步骤五:重复执行步骤四,直至目标关系对数据中的所有客户数据均创建了对应的客户最大连通子图,得到剩余客户最大连通子图集,根据首客户最大连通子图、次客户最大连通子图和剩余客户最大连通子图集生成存量家庭关系网络。
例如,步骤一:随机选取一个客户(客户1)作为起始点,得到客户1数据,即对目标关系对数据中的多个客户数据进行随机选取,得到首客户数据;步骤二:调用预置的最大连通图算法中的搜索算法,基于首客户数据,对目标关系对数据进行遍历,得到客户1的存量遍历数据,即首客户的存量遍历数据,该搜索算法为广度优先搜索算法或深度优先搜索算法,以广度优先搜索算法为例:基于首客户数据和客户关系对,从目标关系对数据中遍历与客户1有关系的所有人,得到客户2、客户3和客户4,继续遍历与客户2、客户3和客户4有关系的所有的人,不断循环,直到找不到新的有关系的客户,得到客户1的存量遍历数据,即首客户的存量遍历数据,步骤三:根据首客户的存量遍历数据创建首客户存量无向子图,对首客户存量无向子图进行连通分量的统计,得到首客户最大连通子图;步骤四:获取目标关系对数据中除了首客户最大连通子图之外的客户数据,得到其他客户数据,从其他客户数据中再次选择一个不存在首客户最大连通子图中的客户(客户2)数据,得到客户2数据,即获取目标关系对数据中除了首客户最大连通子图之外的客户数据,得到其他客户数据,并对其他客户数据随机选取,得到次客户数据,调用预置的最大连通图算法中的搜索算法,基于客户2数据和客户关系对,对目标关系对数据进行遍历,得到客户2的存量遍历数据,即次客户的存量遍历数据,该搜索算法为广度优先搜索算法或深度优先搜索算法,以广度优先搜索算法为例:从目标关系对数据中遍历与客户5有关系的所有人,得到客户6、客户7和客户8,继续遍历与客户6、客户7和客户8有关系的所有的人,不断循环,直到找不到新的有关系的客户,得到客户2的存量遍历数据,即次客户的存量遍历数据,根据客户2的存量遍历数据创建次客户存量无向子图,对次客户存量无向子图进行连通分量的统计,得到次客户最大连通子图;步骤五:按照步骤四依次类推,直到步骤一中的所有客户已经被分到不同的子图中,即目标关系对数据中的所有客户数据均创建了对应的客户最大连通子图,得到剩余客户最大连通子图集;首客户最大连通子图、次客户最大连通子图和剩余客户最大连通子图集构成了存量家庭关系网络,其中,首客户最大连通子图、次客户最大连通子图和剩余客户最大连通子图集中的各剩余客户最大连通子图分别均包括一个客户或一个以上客户的客户数据。
203、获取增量家庭关系网络,并获取存量家庭关系网络的存量家庭信息,以及增量家庭关系网络的增量家庭信息,存量家庭信息为存量家庭成员或目标存量家庭号信息,增量家庭信息为增量家庭成员或目标增量家庭号信息,目标存量家庭号信息包括目标存量业务时间和存量客户号,目标增量家庭号信息均包括目标增量业务时间和增量客户号。
具体地,服务器获取增量业务数据,并基于增量业务数据构建增量家庭关系网络;提取存量家庭关系网络的家庭成员,得到存量家庭成员,并提取增量家庭关系网络的家庭成员,得到增量家庭成员;分别对存量家庭关系网络和增量家庭关系网络进行目标业务时间提取和客户号提取,得到初始存量家庭号信息和初始增量家庭号信息,目标业务时间提取中的目标业务时间用于指示家庭成员中最早的业务时间,初始存量家庭号信息包括目标存量业务时间和存量客户号,初始增量家庭号信息均包括目标增量业务时间和增量客户号;通过预置的消息摘要算法,分别对初始存量家庭号信息和初始增量家庭号信息进行加密,得到目标存量家庭号信息和目标增量家庭号信息;将存量家庭成员或目标存量家庭号信息确定为存量家庭信息,并将增量家庭成员或目标增量家庭号信息确定为增量家庭信息。
服务器从预置数据库中获取增量业务数据;调用预置的最大连通图算法,基于增量业务数据构建增量家庭关系网络。从存量家庭关系网络中获取各家庭的家庭成员,从而得到存量家庭成员,从增量家庭关系网络中获取各家庭的家庭成员,从而得到增量家庭成员;对存量家庭关系网络中各家庭的家庭成员的业务时间进行提取和筛选,得到目标存量业务时间,对存量家庭关系网络中各家庭的家庭成员的客户号进行提取,得到存量客户号,目标存量业务时间和存量客户号即为初始存量家庭号信息,调用预置的消息摘要算法(message digest algorithm md5,MD5),对目标存量业务时间和存量客户号(即初始存量家庭号信息)进行加密,得到目标存量家庭号信息,并对增量家庭关系网络中各家庭的家庭成员的业务时间进行提取和筛选,得到目标增量业务时间,对增量家庭关系网络中各家庭的家庭成员的客户号进行提取,得到增量客户号,目标增量业务时间和增量客户号即为初始增量家庭号信息,调用预置的消息摘要算法(message digest algorithm md5,MD5),对目标增量业务时间和增量客户号(即初始增量家庭号信息)进行加密,得到目标增量家庭号信息。将存量家庭成员或目标存量家庭号信息确定为存量家庭信息,并将增量家庭成员或目标增量家庭号信息确定为增量家庭信息。
具体地,服务器获取增量业务数据,获取增量业务数据中的增量关系对数据,并通过最大连通图算法对增量关系对数据进行遍历,得到新增遍历数据;根据新增遍历数据创建增量无向子图,对增量无向子图进行连通分量的统计,得到增量最大连通子图;根据增量最大连通子图生成增量家庭关系网络。
服务器生成预设增量时间的结构化查询语句,通过该结构化查询语句对预置数据库进行查询,得到对应的增量业务数据,其中,预设增量时间用于指示预设时间点之后的时刻;调用预置的实体关系抽取模型,对增量业务数据依次进行实体识别和实体关系抽取,得到增量关系对数据;调用预置的最大连通图算法,对增量关系对数据进行迭代的客户选择和客户遍历,得到每次遍历的增量客户数据,即新增遍历数据,根据每次遍历的增量客户数据创建对应的子图,得到多个子图,即增量无向子图;对多个子图(即增量无向子图)进行连通分量的统计,得到增量最大连通子图,增量最大连通子图构成增量家庭关系网络。
204、通过存量家庭信息和增量家庭信息,将存量家庭关系网络和增量家庭关系网络进行融合,得到目标家庭关系网络。
具体地,服务器当存量家庭信息为存量家庭成员,且增量家庭信息为增量家庭成员时,判断存量家庭成员中是否存在增量家庭成员;若存量家庭成员存在增量家庭成员,则根据需求将增量家庭成员更新到存量家庭成员中,并将更新后的存量家庭成员的存量家庭关系网络确定为目标家庭关系网络。
当存量家庭信息为存量家庭成员,且增量家庭信息为增量家庭成员时,服务器判断存量家庭成员是否存在增量家庭成员;进一步地,根据需求将增量家庭成员更新到存量家庭成员中的执行步骤包括:若存量家庭成员中存在增量家庭成员,则进一步判断增量家庭成员中所有的家庭成员是否均存在存量家庭成员中,若是,则将对应的增量家庭成员插入到存量家庭成员中,家庭号以存量家庭成员对应的存量家庭关系网络的家庭号为准,若否,则根据预设合并条件(实际情况)是否要把存量的几个家庭(即存量家庭成员)和增量的家庭(即增量家庭成员)合并,组建新的家庭;若存量家庭成员中不存在增量家庭成员,则增量家庭成员对应的家庭为一个新的家庭,将其合并到存量家庭成员中;将更新后的存量家庭成员的存量家庭关系网络确定为目标家庭关系网络。
具体地,服务器当存量家庭信息为目标存量家庭号信息,且增量家庭信息为目标增量家庭号信息时,获取客户号存在信息,客户号存在信息用于指示存量客户号在增量客户号中的存在状况;根据客户号存在信息将目标增量家庭号信息合并到目标存量家庭信息中,得到已合并存量家庭信息,并判断已合并存量家庭信息对应的存量家庭关系网络是否家庭号唯一;若已合并存量家庭信息对应的存量家庭关系网络是家庭号唯一,则将已合并存量家庭信息对应的存量家庭关系网络确定为目标家庭关系网络。
当存量家庭信息为目标存量家庭号信息,且增量家庭信息为目标增量家庭号信息时,服务器获取存量客户号在增量客户号中的存在状况,得到客户号存在信息,可选的,可通过判断存量家庭信息中的客户号是否存在目标增量家庭号信息中的客户号,得到客户号存在信息。
根据客户号存在信息将目标增量家庭号信息合并到目标存量家庭信息中,得到已合并存量家庭信息,进一步地,根据客户号存在信息将目标增量家庭号信息中的客户号合并到目标存量家庭信息中的客户号中,得到已合并存量家庭信息,将目标增量家庭号信息删除,其执行过程包括:若客户号存在信息为存量家庭信息中的客户号全部存在目标增量家庭号信息的客户号中,则将目标增量家庭号信息中客户号对应的客户数据合并到目标存量家庭信息中客户号对应的客户数据中,原家庭及家庭号不变,即家庭号以目标存量家庭号信息的家庭号为准,得到已合并存量家庭信息;若客户号存在信息为存量家庭信息中的客户号部分存在目标增量家庭号信息的客户号中,则将存量家庭信息中相同客户号(存量家庭信息中存在目标增量家庭号信息的客户号中的客户号)的客户数据添加至目标存量家庭号信息中对应客户号的客户数据中,并将目标增量家庭号信息不相同客户号(存量家庭信息中不存在目标增量家庭号信息的客户号中的客户号)以及不相同客户号对应的客户数据,添加至目标存量家庭号信息对应的家庭关系表中,家庭号以目标存量家庭号信息的家庭号为准,得到已合并存量家庭信息;若客户号存在信息为存量家庭信息中的客户号全都不存在目标增量家庭号信息的客户号中,则以存量家庭信息对应的家庭为一个新的家庭,保留其家庭号,将其对应的增量关系网络合并到存量家庭关系网络中,得到已合并存量家庭信息。
对已合并存量家庭信息进行遍历,并判断已合并存量家庭信息对应的存量家庭关系网络是否家庭号唯一,若是,则将已合并存量家庭信息对应的存量家庭关系网络确定为目标家庭关系网络,若否,则重复执行上述步骤“当存量家庭信息为目标存量家庭号信息,且增量家庭信息为目标增量家庭号信息时,获取客户号存在信息,客户号存在信息用于指示存量客户号在增量客户号中的存在状况”和步骤“根据客户号存在信息将目标增量家庭号信息合并到目标存量家庭信息中,得到已合并存量家庭信息,并判断已合并存量家庭信息对应的存量家庭关系网络是否家庭号唯一”的执行过程,直至已合并存量家庭信息对应的存量家庭关系网络的家庭号唯一,从而得到目标家庭关系网络。
205、基于目标家庭关系网络进行业务产品组合的分析和聚类,得到目标业务产品组合信息。
服务器获取目标家庭关系网络中各家庭的所有业务产品信息,将目标家庭关系网络中各家庭的所有业务产品信息作为多个业务产品组合信息,一个业务产品信息组合对应一个家庭的所有业务产品信息;调用预置的相似度算法,对多个业务产品组合信息进行两两之间的相似度,得到组合相似度,其中,该相似度算法可为余弦相似度算法或欧式距离算法或其他计算相似度的算法,根据组合相似度对多个业务产品组合信息进行归类,得到归类之后的业务产品组合信息;调用预置的聚类算法,对归类之后的业务产品组合信息进行聚类分析,得到业务产品组合类型;获取与业务产品组合类型对应的初始历史业务产品组合信息,初始历史业务产品组合信息包括历史业务产品组合的基本产品信息、市场反馈信息和业务度量指标数据等;按照预设需求,对初始历史业务产品组合信息进行筛选,得到目标历史业务产品组合信息,其中,预设需求用于指示初始历史业务产品组合信息中业务产品组合符合当前市场条件、需求,以及市场反馈信息和业务度量指标数据符合预设保留条件;计算归类之后的业务产品组合信息与对应的目标历史业务产品组合信息之间的相似度,得到归类相似度;根据归类相似度从大到小的顺序对归类之后的业务产品组合信息进行排序,得到归类序列集,从各归类序列中选取各类型中排序第一的业务产品组合信息,从而得到目标业务产品组合信息。基于目标家庭关系网络的标识唯一性、高效计算的特性的基础上,提高了获取目标业务产品组合信息的效率和准确性。
本发明实施例中,不仅能够有效适应业务数据的实时变更,且计算简单便捷、有效,实现了既能够保证基于业务数据的家庭关系网络的标识唯一性,又能够高效计算的效果,解决了无法保证基于业务数据构建的家庭关系网络的标识唯一性、高效计算的技术问题,还能够基于目标家庭关系网络的标识唯一性、高效计算的特性的基础上,提高了获取目标业务产品组合信息的效率和准确性。
上面对本发明实施例中业务数据的家庭关系网络构建方法进行了描述,下面对本发明实施例中业务数据的家庭关系网络构建装置进行描述,请参阅图3,本发明实施例中业务数据的家庭关系网络构建装置一个实施例包括:
提取模块301,用于获取存量业务数据,对存量业务数据进行关系对提取,得到目标关系对数据;
遍历构建模块302,用于调用预置的最大连通图算法,对目标关系对数据进行遍历,得到存量遍历数据,并根据存量遍历数据构建最大连通子图,得到存量家庭关系网络;
获取模块303,用于获取增量家庭关系网络,并获取存量家庭关系网络的存量家庭信息,以及增量家庭关系网络的增量家庭信息,存量家庭信息为存量家庭成员或目标存量家庭号信息,增量家庭信息为增量家庭成员或目标增量家庭号信息,目标存量家庭号信息包括目标存量业务时间和存量客户号,目标增量家庭号信息均包括目标增量业务时间和增量客户号;
融合模块304,用于通过存量家庭信息和增量家庭信息,将存量家庭关系网络和增量家庭关系网络进行融合,得到目标家庭关系网络。
上述业务数据的家庭关系网络构建装置中各个模块的功能实现与上述业务数据的家庭关系网络构建方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本发明实施例中,能够有效适应业务数据的实时变更,且计算简单便捷、有效,实现了既能够保证基于业务数据的家庭关系网络的标识唯一性,又能够高效计算的效果,解决了无法保证基于业务数据构建的家庭关系网络的标识唯一性、高效计算的技术问题。
请参阅图4,本发明实施例中业务数据的家庭关系网络构建装置的另一个实施例包括:
提取模块301,用于获取存量业务数据,对存量业务数据进行关系对提取,得到目标关系对数据;
遍历构建模块302,用于调用预置的最大连通图算法,对目标关系对数据进行遍历,得到存量遍历数据,并根据存量遍历数据构建最大连通子图,得到存量家庭关系网络;
获取模块303,用于获取增量家庭关系网络,并获取存量家庭关系网络的存量家庭信息,以及增量家庭关系网络的增量家庭信息,存量家庭信息为存量家庭成员或目标存量家庭号信息,增量家庭信息为增量家庭成员或目标增量家庭号信息,目标存量家庭号信息包括目标存量业务时间和存量客户号,目标增量家庭号信息均包括目标增量业务时间和增量客户号;
融合模块304,用于通过存量家庭信息和增量家庭信息,将存量家庭关系网络和增量家庭关系网络进行融合,得到目标家庭关系网络;
分析聚类模块305,用于基于目标家庭关系网络进行业务产品组合的分析和聚类,得到目标业务产品组合信息。
可选的,获取模块303包括:
构建单元3031,用于获取增量业务数据,并基于增量业务数据构建增量家庭关系网络;
第一提取单元3032,用于提取存量家庭关系网络的家庭成员,得到存量家庭成员,并提取增量家庭关系网络的家庭成员,得到增量家庭成员;
第二提取单元3033,用于分别对存量家庭关系网络和增量家庭关系网络进行目标业务时间提取和客户号提取,得到初始存量家庭号信息和初始增量家庭号信息,目标业务时间用于指示家庭成员中最早的业务时间,初始存量家庭号信息包括目标存量业务时间和存量客户号,初始增量家庭号信息均包括目标增量业务时间和增量客户号;
加密单元3034,用于通过预置的消息摘要算法,分别对初始存量家庭号信息和初始增量家庭号信息进行加密,得到目标存量家庭号信息和目标增量家庭号信息;
确定单元3035,用于将存量家庭成员或目标存量家庭号信息确定为存量家庭信息,并将增量家庭成员或目标增量家庭号信息确定为增量家庭信息。
可选的,构建单元3031还可以具体用于:
获取增量业务数据,获取增量业务数据中的增量关系对数据,并通过最大连通图算法对增量关系对数据进行遍历,得到新增遍历数据;
根据新增遍历数据创建增量无向子图,对增量无向子图进行连通分量的统计,得到增量最大连通子图;
根据增量最大连通子图生成增量家庭关系网络。
可选的,融合模块304还可以具体用于:
当存量家庭信息为存量家庭成员,且增量家庭信息为增量家庭成员时,判断存量家庭成员中是否存在增量家庭成员;
若存量家庭成员存在增量家庭成员,则根据需求将增量家庭成员更新到存量家庭成员中,并将更新后的存量家庭成员的存量家庭关系网络确定为目标家庭关系网络。
可选的,融合模块304还可以具体用于:
当存量家庭信息为目标存量家庭号信息,且增量家庭信息为目标增量家庭号信息时,获取客户号存在信息,客户号存在信息用于指示存量客户号在增量客户号中的存在状况;
根据客户号存在信息将目标增量家庭号信息合并到目标存量家庭信息中,得到已合并存量家庭信息,并判断已合并存量家庭信息对应的存量家庭关系网络是否家庭号唯一;
若已合并存量家庭信息对应的存量家庭关系网络是家庭号唯一,则将已合并存量家庭信息对应的存量家庭关系网络确定为目标家庭关系网络。
可选的,遍历构建模块302还可以具体用于:
步骤一:对目标关系对数据中的多个客户数据进行随机选取,得到首客户数据,目标关系对数据包括多个客户数据和客户关系对,一个客户数据对应一个客户;
步骤二:调用预置的最大连通图算法中的搜索算法,基于首客户数据和客户关系对,对目标关系对数据进行遍历,得到首客户的存量遍历数据;
步骤三:根据首客户的存量遍历数据创建首客户存量无向子图,对首客户存量无向子图进行连通分量的统计,得到首客户最大连通子图;
步骤四:获取目标关系对数据中除了首客户最大连通子图之外的客户数据,得到其他客户数据,并对其他客户数据随机选取,得到次客户数据,基于次客户数据和客户关系对,对目标关系对数据进行遍历,得到次客户的存量遍历数据,基于次客户的存量遍历数据创建首客户存量无向子图,对次客户存量无向子图进行连通分量进行统计,得到次客户最大连通子图;
步骤五:重复执行步骤四,直至目标关系对数据中的所有客户数据均创建了对应的客户最大连通子图,得到剩余客户最大连通子图集,根据首客户最大连通子图、次客户最大连通子图和剩余客户最大连通子图集生成存量家庭关系网络。
上述业务数据的家庭关系网络构建装置中各模块和各单元的功能实现与上述业务数据的家庭关系网络构建方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本发明实施例中,不仅能够有效适应业务数据的实时变更,且计算简单便捷、有效,实现了既能够保证基于业务数据的家庭关系网络的标识唯一性,又能够高效计算的效果,解决了无法保证基于业务数据构建的家庭关系网络的标识唯一性、高效计算的技术问题,还能够基于目标家庭关系网络的标识唯一性、高效计算的特性的基础上,提高了获取目标业务产品组合信息的效率和准确性。
上面图3和图4从模块化功能实体的角度对本发明实施例中的业务数据的家庭关系网络构建装置进行详细描述,下面从硬件处理的角度对本发明实施例中业务数据的家庭关系网络构建设备进行详细描述。
图5是本发明实施例提供的一种业务数据的家庭关系网络构建设备的结构示意图,该业务数据的家庭关系网络构建设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对业务数据的家庭关系网络构建设备500中的一系列计算机程序操作。更进一步地,处理器510可以设置为与存储介质530通信,在业务数据的家庭关系网络构建设备500上执行存储介质530中的一系列计算机程序操作。
业务数据的家庭关系网络构建设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的业务数据的家庭关系网络构建设备结构并不构成对业务数据的家庭关系网络构建设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种业务数据的家庭关系网络构建设备,包括:存储器和至少一个处理器,所述存储器中存储有计算机程序,所述存储器和所述至少一个处理器通过线路互连;所述至少一个处理器调用所述存储器中的所述计算机程序,以使得所述业务数据的家庭关系网络构建设备执行上述业务数据的家庭关系网络构建方法中的步骤。本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,计算机可读存储介质中存储有计算机程序,当计算机程序在计算机上运行时,使得计算机执行业务数据的家庭关系网络构建方法的步骤。
进一步地,计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干计算机程序用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种业务数据的家庭关系网络构建方法,其特征在于,所述业务数据的家庭关系网络构建方法包括:
获取存量业务数据,对所述存量业务数据进行关系对提取,得到目标关系对数据;
调用预置的最大连通图算法,对所述目标关系对数据进行遍历,得到存量遍历数据,并根据所述存量遍历数据构建最大连通子图,得到存量家庭关系网络;
获取增量家庭关系网络,并获取所述存量家庭关系网络的存量家庭信息,以及所述增量家庭关系网络的增量家庭信息,所述存量家庭信息为存量家庭成员或目标存量家庭号信息,所述增量家庭信息为增量家庭成员或目标增量家庭号信息,所述目标存量家庭号信息包括目标存量业务时间和存量客户号,所述目标增量家庭号信息均包括目标增量业务时间和增量客户号;
其中,所述获取增量家庭关系网络,并获取所述存量家庭关系网络的存量家庭信息,以及所述增量家庭关系网络的增量家庭信息,包括:
获取增量业务数据,并基于所述增量业务数据构建增量家庭关系网络;
提取所述存量家庭关系网络的家庭成员,得到存量家庭成员,并提取增量家庭关系网络的家庭成员,得到增量家庭成员;
分别对所述存量家庭关系网络和所述增量家庭关系网络进行目标业务时间提取和客户号提取,得到初始存量家庭号信息和初始增量家庭号信息,所述目标业务时间提取中的目标业务时间用于指示家庭成员中最早的业务时间,所述初始存量家庭号信息包括目标存量业务时间和存量客户号,所述初始增量家庭号信息均包括目标增量业务时间和增量客户号;
通过预置的消息摘要算法,分别对所述初始存量家庭号信息和所述初始增量家庭号信息进行加密,得到目标存量家庭号信息和目标增量家庭号信息;
将所述存量家庭成员或所述目标存量家庭号信息确定为存量家庭信息,并将所述增量家庭成员或所述目标增量家庭号信息确定为增量家庭信息;
其中,所述获取增量业务数据,并基于所述增量业务数据构建增量家庭关系网络,包括:
获取增量业务数据,获取所述增量业务数据中的增量关系对数据,并通过所述最大连通图算法对所述增量关系对数据进行遍历,得到新增遍历数据;
根据所述新增遍历数据创建增量无向子图,对所述增量无向子图进行连通分量的统计,得到增量最大连通子图;
根据所述增量最大连通子图生成增量家庭关系网络;
通过所述存量家庭信息和所述增量家庭信息,将所述存量家庭关系网络和所述增量家庭关系网络进行融合,得到目标家庭关系网络。
2.根据权利要求1所述的业务数据的家庭关系网络构建方法,其特征在于,所述通过所述存量家庭信息和所述增量家庭信息,将所述存量家庭关系网络和所述增量家庭关系网络进行融合,得到目标家庭关系网络,包括:
当所述存量家庭信息为存量家庭成员,且所述增量家庭信息为增量家庭成员时,判断所述存量家庭成员中是否存在所述增量家庭成员;
若所述存量家庭成员存在所述增量家庭成员,则根据需求将所述增量家庭成员更新到所述存量家庭成员中,并将更新后的存量家庭成员的存量家庭关系网络确定为目标家庭关系网络。
3.根据权利要求2所述的业务数据的家庭关系网络构建方法,其特征在于,所述通过所述存量家庭信息和所述增量家庭信息,将所述存量家庭关系网络和所述增量家庭关系网络进行融合,得到目标家庭关系网络,包括:
当所述存量家庭信息为目标存量家庭号信息,且所述增量家庭信息为目标增量家庭号信息时,获取客户号存在信息,所述客户号存在信息用于指示所述存量客户号在所述增量客户号中的存在状况;
根据所述客户号存在信息将所述目标增量家庭号信息合并到所述目标存量家庭号信息中,得到已合并存量家庭信息,并判断所述已合并存量家庭信息对应的存量家庭关系网络是否家庭号唯一;
若所述已合并存量家庭信息对应的存量家庭关系网络是家庭号唯一,则将所述已合并存量家庭信息对应的存量家庭关系网络确定为目标家庭关系网络。
4.根据权利要求1所述的业务数据的家庭关系网络构建方法,其特征在于,所述调用预置的最大连通图算法,对所述目标关系对数据进行遍历,得到存量遍历数据,并根据所述存量遍历数据构建最大连通子图,得到存量家庭关系网络,包括:
步骤一:对所述目标关系对数据中的多个客户数据进行随机选取,得到首客户数据,所述目标关系对数据包括多个客户数据和客户关系对,一个客户数据对应一个客户;
步骤二:调用预置的最大连通图算法中的搜索算法,基于所述首客户数据和所述客户关系对,对所述目标关系对数据进行遍历,得到首客户的存量遍历数据;
步骤三:根据所述首客户的存量遍历数据创建首客户存量无向子图,对所述首客户存量无向子图进行连通分量的统计,得到首客户最大连通子图;
步骤四:获取所述目标关系对数据中除了所述首客户最大连通子图之外的客户数据,得到其他客户数据,并对所述其他客户数据随机选取,得到次客户数据,基于所述次客户数据和所述客户关系对,对所述目标关系对数据进行遍历,得到次客户的存量遍历数据,基于所述次客户的存量遍历数据创建首客户存量无向子图,对所述次客户存量无向子图进行连通分量进行统计,得到次客户最大连通子图;
步骤五:重复执行步骤四,直至所述目标关系对数据中的所有客户数据均创建了对应的客户最大连通子图,得到剩余客户最大连通子图集,根据所述首客户最大连通子图、所述次客户最大连通子图和所述剩余客户最大连通子图集生成存量家庭关系网络。
5.根据权利要求1-4中任一项所述的业务数据的家庭关系网络构建方法,其特征在于,所述通过所述存量家庭信息和所述增量家庭信息,将所述存量家庭关系网络和所述增量家庭关系网络进行融合,得到目标家庭关系网络之后,还包括:
基于所述目标家庭关系网络进行业务产品组合的分析和聚类,得到目标业务产品组合信息。
6.一种业务数据的家庭关系网络构建装置,其特征在于,所述业务数据的家庭关系网络构建装置包括:
提取模块,用于获取存量业务数据,对所述存量业务数据进行关系对提取,得到目标关系对数据;
遍历构建模块,用于调用预置的最大连通图算法,对所述目标关系对数据进行遍历,得到存量遍历数据,并根据所述存量遍历数据构建最大连通子图,得到存量家庭关系网络;
获取模块,用于获取增量家庭关系网络,并获取所述存量家庭关系网络的存量家庭信息,以及所述增量家庭关系网络的增量家庭信息,所述存量家庭信息为存量家庭成员或目标存量家庭号信息,所述增量家庭信息为增量家庭成员或目标增量家庭号信息,所述目标存量家庭号信息包括目标存量业务时间和存量客户号,所述目标增量家庭号信息均包括目标增量业务时间和增量客户号;
其中,所述获取增量家庭关系网络,并获取所述存量家庭关系网络的存量家庭信息,以及所述增量家庭关系网络的增量家庭信息,包括:
获取增量业务数据,并基于所述增量业务数据构建增量家庭关系网络;
提取所述存量家庭关系网络的家庭成员,得到存量家庭成员,并提取增量家庭关系网络的家庭成员,得到增量家庭成员;
分别对所述存量家庭关系网络和所述增量家庭关系网络进行目标业务时间提取和客户号提取,得到初始存量家庭号信息和初始增量家庭号信息,所述目标业务时间提取中的目标业务时间用于指示家庭成员中最早的业务时间,所述初始存量家庭号信息包括目标存量业务时间和存量客户号,所述初始增量家庭号信息均包括目标增量业务时间和增量客户号;
通过预置的消息摘要算法,分别对所述初始存量家庭号信息和所述初始增量家庭号信息进行加密,得到目标存量家庭号信息和目标增量家庭号信息;
将所述存量家庭成员或所述目标存量家庭号信息确定为存量家庭信息,并将所述增量家庭成员或所述目标增量家庭号信息确定为增量家庭信息;
其中,所述获取增量业务数据,并基于所述增量业务数据构建增量家庭关系网络,包括:
获取增量业务数据,获取所述增量业务数据中的增量关系对数据,并通过所述最大连通图算法对所述增量关系对数据进行遍历,得到新增遍历数据;
根据所述新增遍历数据创建增量无向子图,对所述增量无向子图进行连通分量的统计,得到增量最大连通子图;
根据所述增量最大连通子图生成增量家庭关系网络;
融合模块,用于通过所述存量家庭信息和所述增量家庭信息,将所述存量家庭关系网络和所述增量家庭关系网络进行融合,得到目标家庭关系网络。
7.一种业务数据的家庭关系网络构建设备,其特征在于,所述业务数据的家庭关系网络构建设备包括:存储器和至少一个处理器,所述存储器中存储有计算机程序;
所述至少一个处理器调用所述存储器中的所述计算机程序,以使得所述业务数据的家庭关系网络构建设备执行如权利要求1-5中任意一项所述的业务数据的家庭关系网络构建方法。
8.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述业务数据的家庭关系网络构建方法。
CN202111151485.0A 2021-09-29 2021-09-29 业务数据的家庭关系网络构建方法、装置、设备及介质 Active CN113806600B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111151485.0A CN113806600B (zh) 2021-09-29 2021-09-29 业务数据的家庭关系网络构建方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111151485.0A CN113806600B (zh) 2021-09-29 2021-09-29 业务数据的家庭关系网络构建方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN113806600A CN113806600A (zh) 2021-12-17
CN113806600B true CN113806600B (zh) 2023-09-15

Family

ID=78897118

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111151485.0A Active CN113806600B (zh) 2021-09-29 2021-09-29 业务数据的家庭关系网络构建方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113806600B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060010601A (ko) * 2004-07-28 2006-02-02 주식회사 유비쿼터스패밀리 네트워크를 기반으로 한 가족 사이트에서의 가족관계자동설정과 가계도 자동생성 시스템 및 방법
CN109903079A (zh) * 2019-01-21 2019-06-18 中国人民财产保险股份有限公司 信息处理方法、设备及存储介质
CN111445320A (zh) * 2020-03-30 2020-07-24 深圳市华云中盛科技股份有限公司 目标社群识别方法、装置、计算机设备及存储介质
CN113312368A (zh) * 2021-07-29 2021-08-27 北京达佳互联信息技术有限公司 一种关系数据更新方法、装置、电子设备及存储介质
CN113326265A (zh) * 2021-06-17 2021-08-31 深圳市慧择时代科技有限公司 家庭信息的构建方法、装置、存储介质和电子设备
CN113434607A (zh) * 2021-07-02 2021-09-24 智器云南京信息科技有限公司 基于图数据的行为分析方法、装置、电子设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060010601A (ko) * 2004-07-28 2006-02-02 주식회사 유비쿼터스패밀리 네트워크를 기반으로 한 가족 사이트에서의 가족관계자동설정과 가계도 자동생성 시스템 및 방법
CN109903079A (zh) * 2019-01-21 2019-06-18 中国人民财产保险股份有限公司 信息处理方法、设备及存储介质
CN111445320A (zh) * 2020-03-30 2020-07-24 深圳市华云中盛科技股份有限公司 目标社群识别方法、装置、计算机设备及存储介质
CN113326265A (zh) * 2021-06-17 2021-08-31 深圳市慧择时代科技有限公司 家庭信息的构建方法、装置、存储介质和电子设备
CN113434607A (zh) * 2021-07-02 2021-09-24 智器云南京信息科技有限公司 基于图数据的行为分析方法、装置、电子设备和存储介质
CN113312368A (zh) * 2021-07-29 2021-08-27 北京达佳互联信息技术有限公司 一种关系数据更新方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN113806600A (zh) 2021-12-17

Similar Documents

Publication Publication Date Title
US11985037B2 (en) Systems and methods for conducting more reliable assessments with connectivity statistics
CN110609759B (zh) 一种故障根因分析的方法及装置
US9805099B2 (en) Apparatus and method for efficient identification of code similarity
CN111709491B (zh) 基于自编码器的异常检测方法、装置、设备及存储介质
CN108768986B (zh) 一种加密流量分类方法及服务器、计算机可读存储介质
CN107193894B (zh) 数据处理方法、个体识别方法及相关装置
CN111352808B (zh) 告警数据处理方法、装置、设备及存储介质
CN106534164B (zh) 基于网络空间用户标识的有效虚拟身份刻画方法
CN104714931A (zh) 用于选择用以代表表格式信息的方法和系统
CN113706100B (zh) 配电网物联终端设备实时探测识别方法与系统
CN112035741A (zh) 基于用户体检数据的预约方法、装置、设备及存储介质
Ragunathan et al. Link prediction by analyzing common neighbors based subgraphs using convolutional neural network
CN114519571B (zh) 一种工程建设项目审批系统
CN115577701A (zh) 针对大数据安全的风险行为识别方法、装置、设备及介质
Alothman Raw network traffic data preprocessing and preparation for automatic analysis
CN114169301A (zh) 电子面单汇聚取号方法、装置、设备及存储介质
CN117171711B (zh) 一种基于云平台的企业内外部数据融合共享方法及系统
CN113806600B (zh) 业务数据的家庭关系网络构建方法、装置、设备及介质
CN113779110B (zh) 家庭关系网络提取方法、装置、计算机设备及存储介质
CN116366312A (zh) 一种Web攻击检测方法、装置及存储介质
CN112003884A (zh) 一种网络资产的采集和自然语言检索方法
CN113839956B (zh) 数据安全评估方法、装置、设备及存储介质
CN113380414B (zh) 基于大数据的数据采集方法及系统
CN109462598B (zh) 一种从网络报文中提取账号信息的方法
CN113656466A (zh) 保单数据查询方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant