具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
以下以几个具体的例子详细说明本申请实施例的具体实现。
以下首先介绍本申请一种群组数据处理的方法的实施例。图1是本申请实施例提供的群组数据处理方法的一种流程示意图,本申请提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的如图1所示,所述方法可以包括:
S110:获取待处理节点数据。
本申请实施例中,可以获取待理处理节点数据。所述的节点数据可以根据不同的业务对应不同的处理数据。一般的所述节点数据可以包括计算机处理的互联网信息中业务基础数据,如用户账户、交易记录、商品信息等。所述的待处理节点数据通常可以包括新加入的节点数据。本申实施例具体的应用场景中,所述待处理节点数据可以包括互联网业务系统在业务处理过程中的数据。例如所述待处理节点数据可以包括某一账号的一笔交易产生的相关数据:交易使用的卡、卡的类型、交易时间、交易类型等信息。
S120:计算出节点数据的群组中与所述待处理节点数据存在关联关系的节点数据所对应的关联群组的数量。
在本申请实施例中,在步骤S110获取待处理节点数据之后,可以计算出节点数据的群组中与所述待处理节点数据存在关联关系的节点数据所对应的关联群组的数量。所述节点数据的群组可以包括根据预设系统中节点数据之间的相关性将所述节点数据进行群组划分得到的群组。本实施例应用场景中,所述预设系统可以为互联网业务系统。
获取待处理节点数据后,可以在所述群组中查询计算得到与所述待处理节点数据存在关联关系的节点数据所对应的管理群组的数量。本申请中所述的关联关系一般的可以包括符合设置的数据关联性要求的对应关系,例如待处理节点数据与某一个或多个群组中的全部或部分节点数据相同或者与数据的某一标识信息相同,可以认为所述待处理节点与该群组存在关联关系。
在具体应用场景中,例如A节点数据为一笔用支付宝B的银行卡C付款给账号D的交易过程中的数据,包括支付宝B、银行卡C、账号D等数据。E节点数据为一笔用银行卡F给账号C转账的交易过程中的数据,包括银行卡F、账号C等数据。上述A节点数据与E节点数据中都包括账号C的数据信息,那么,可以判断所述A节点数据与所述E节点数据存在关联关系,则A节点数据与E节点数据所在的群组存在关联关系。
在其他的实施例,所述关联关系可以也可以为符合设置的优先级或从属关系,或其他自定义设置的关联关系。例如待处理节点数据DATA_1为业务系统S下的业务数据,那么可以认为待处理节点数据DATA_1与业务系统S下的三个群组S1、S2、S3存在关联关系。
本实施例中,可以基于设置的关联关系要求从原有节点数据的群组中查找计算得到与所述待处理节点数据存在关联关系的节点数据所对应的关联群组的数量。
S130:基于所述关联群组的数量建立存储所述待处理节点数据的群组的群组关系信息。
在本申请实施例中,进一步的可以基于所述关联群组的数量建立存储所述待处理节点数据的群组的群组关系信息。本申请中所述的群组关系信息通常可以包括与存储待处理节点数据的群组相关的信息、以及所述存储待处理节点数据的群组与所述关联群组的之间的关联性信息,可以用于有效的记录反映群组的演化过程,构建出群组与群组之间的演化关系。本申请的一些实施例中,所述群组关系信息可以例如群组关系树、群组链表、与相应群组对应的群组关系标识符等的群组信息。
如图2所示的是本申请实施例中基于关联群组数据建立的所述群组关系树的实施方式示意图,图2中,群组之间相连的连线及箭头可以表示群组之间的关联关系。所述群组链表可以为单独设置的用于存储群组以及群组之间关联关系的指针链表数据结构的存储单元,所述群组链表可用于单独存储群组与群组的关系信息,可以设置在专用的服务器上。其他的实施方式中,所述群组关系信息也可以以设置的群组标识符的形式体现出来。所述群组标识符可以设置为是群组的一个属性信息,用于记录与之相关联的关联群组的信息和该群组的演化信息。具体的例如用户信用信息群组18是根据用户信用卡信息群组8、用户车辆信用信息群组6、用户贷款信息群组4和水电煤气缴费记录信息群组15中的节点数据演化而来,那么此时可以在群组关系信息中构建记录下群组18是由群组8、6、4、15演化而来。具体的以群组关系标识符的形式体现出来可以为“G18=G8+G6+G4+G15”。
在本申请具体的节点数据处理的应用场景中,所述关联群组的数量的不同取值可以对应不同的处理方式,在具体实施过程中可以根据不同的处理方式确定所述群组关系信息。当然,在一些应用场景中也可以结合存储或设计需求进行自定义设定所述群组关系信息。本申请的一种实施例提供的实施方案中,所述基于所述关联群组的数量建立存储所述待处理节点数据的群组的群组关系信息可以包括:
当所述关联群组的数量为两个及以上时,建立存储所述待处理节点数据的新群组,以及所述新群组与所述关联群组的第一群组关系信息。
在本实施例中,所述第一群组关系信息可以记录有包括所述新群组与所述关联群组之间关联关系的信息,如所述建立的新群组是由哪些和与所述待处理节点数据存在关联关系的关联群组合并而来的。在一个具体的例子中,假设当前包括10个群组,且群组3包括X节点数据,所述X节点数据为一笔用银行卡A给银行卡B转账的交易过程中的数据;群组4包括Y节点数据,所述Y节点数据为一笔用银行卡C给银行卡D转账的交易过程中的数据;所述待处理节点数据为一笔用银行卡B给银行卡C转账的交易过程中的数据。那么,所述待处理节点数据与所述群组3中X节点数据包括相同的数据银行卡B,所述待处理节点数据与所述群组3中X节点数据存在关联关系;所述待处理节点数据与所述群组4中Y节点数据包括相同的数据银行卡C,所述待处理节点数据与所述群组4中Y节点数据存在关联关系,此时需要将待处理节点数据单独存入一个新群组,那么可以为所述待处理节点数据建立一个新群组,将所述待处理节点数据存储在所述新群组中,以及建立所述新群组和与群组3和群组4之间的第一群组关系信息,记录所述新群组是由群组3和4演变而来。
上述建立存储所述待处理节点数据点新群组后,还可以为所述新群组进行编号,以便于群组及群组之间关系的管理和识别。具体的,本申请的对节点数据的群组进行编号的一种实施方式中,可以包括:
获取节点数据的群组中群组的最大编号,将所述最大编号增加一个递增步长后的编号作为所述新群组的编号。
例如,获取的当前节点数据的群组的最大编号为10,则可以将所述新群组的编号设置为11。当然,所述编号的形式可以包括但不限于阿拉伯数字,其他的实施例中也可以为预先设置的其他编号数据格式,如字母与数字组合、字符串等。相应的,在对新群组进行编号时可以根据编号规则将所述最大编号增加一个递增步长后的编号作为所述新群组的编号。
另一个实施例,所述基于所述关联群组的数量建立存储所述待处理节点数据的群组的群组关系信息可以包括:
当所述关联群组的数量为一个时,将所述关联群组作为所述待处理节点数据的存储群组,以及建立所述存储群组的第二群组关系信息。
本实施例中,当所述关联群组的数量为一个时,可以直接将待处理节点数据存储到关联群组中。此时原有的群组关系中未新增群组,将所述存储群组的编号作为所述待处理节点数据的群组的编号。
在另一种应用场景中,若所述关联群组的数量为零,则可以新建一个待处理节点数据的初始群组,并记录下该初始群组的群组关系信息。这样,在以后其他群组与所述初始群组有关联关系时,可以基于该初始群组的信息进一步的在整个群组关系中扩展群组与群组的关系信息。因此,本申请的另一种实施例中,所述基于所述关联群组的数量建立存储所述待处理节点数据的群组的群组关系信息可以包括:
当所述关联群组的数量为零时,建立存储所述待处理节点数据的初始群组,以及所述初始群组的第三群组关系信息。
建立所述初始群组后可以将所述待处理节点数据存储在所述初始群组。进一步的,可以参照上述实施例所述,可以对所述初始群组设置相应的编号。具体的,可以获取节点数据的群组中群组的最大编号,将所述最大编号增加一个递增步长后的编号作为所述初始群组的编号。例如,当前群组关系树中群组的最大编号为10,所述初始群组的编号可以为11。
进一步的,如图3是本申请实施例提供的数据处理方法的另一种流程示意图,在一些实施例中,在步骤S130之后,如图3所示,所述方法还可以包括:
S140:通过所述群组关系信息查询与待查询节点数据相关联的群组的信息。
在本申请实施例中,建立群组与群组之间的群组关系信息后,可以通过所述群组关系信息查询与待查询节点数据相关联的群组的信息。有了节点数据的群组关系这一维度的信息,设计开发人员可以更加灵活、方便的对群组数据进行管理、分析,充分挖掘节点数据及相应群组的多维度信息,提高数据分析识别的精准性。
具体的,在以通过交易介质(交易过程中使用的卡)发生关联的互联网业务系统的网络群组数据的应用场景中,如图2所示,以群组4、群组5和群组7为例,假设所述群组4可以包括通过银行卡A进行付款给银行卡B的相关节点数据:银行卡A和银行卡B。群组5可以包括通过银行卡C给银行卡D转账的相关节点数据:银行卡C和银行卡D。群组7可以包括通过收到银行卡C给银行卡A转账的相关节点数据:银行卡C和银行卡A。在进行风险分析识别时,如果要分析群组7维度上的变量(相关联卡的数量)和信息(交易情况),通过所述群组关系信息,可以快速回溯计算得到群组7维度上变量为4张卡。而在该应用场景中群组变量(相关卡的数量)可以有效反映账号的稳定性,一般所述变量越小稳定性越好,发生风险概率低,反之,所述变量越大稳定性越差,相应的,发生风险概率高。因此,基于本申请的群组关系信息可以有效的对网络群组数据进行风险的分析和识别,提供数据处理的灵活性和准确性。
由上述可见,本申请一种群组数据处理的方法的实施例中,当存入新的待处理节点数据时,可以基于原有群组数据的群组关系计算出原有的群组中与所述待处理节点数据存在关联关系的节点数据所对应的关联群组的数量。基于所述关联群组的数量可以建立存储所述待处理节点数据的群组的群组关系信息。所述的群组关系信息可以用于有效的记录和反应群组的演化过程,为后续利用所述群组关系信息进行查询群组信息,进而可以实现对群组数据的查询、管理等。与现有技术相比,可以有效的记录和处理互联网业务系统中的节点数据及群组数据,提高了群组数据管理的灵活性、便利性和精准性,便于进行风险分析识别,可以降低用户损失,改善用户体验。
本申请另一方面还提供一种群组数据处理的装置,图4是本申请提供的群组数据处理装置的一种实施例的模块结构示意图,如图4所示,所述装置400可以包括:
数据获取模块410,可以用于获取待处理节点数据。
数量计算模块420,可以用于计算出节点数据的群组中与所述待处理节点数据存在关联关系的节点数据所对应的关联群组的数量;
数据处理模块430,可以用于基于所述关联群组的数量建立存储所述待处理节点数据的群组的群组关系信息。
本申请提供的群组数据处理装置可以基于原有群组数据的群组关系计算出原有的群组中与所述待处理节点数据存在关联关系的节点数据所对应的关联群组的数量。基于所述关联群组的数量可以建立存储所述待处理节点数据的群组的群组关系信息。所述的群组关系信息可以用于有效的记录和反应群组的演化过程,为后续利用所述群组关系信息进行查询群组信息,进而可以实现对群组数据的查询、管理等。
本申请提供所述数据处理模块430的一种具体实施例方式。具体的,本申请的一种实施例中所述数据处理模块430可以包括:
第一数据处理单元,用于当所述关联群组的数量为两个及以上时,建立存储所述待处理节点数据的新群组,以及所述新群组与所述关联群组的第一群组关系信息。
另一种实施例中,所述数据处理模块430可以包括:
第二数据处理单元,可以用于当所述关联群组的数量为一个时,将所述关联群组作为所述待处理节点数据的存储群组,以及建立所述存储群组的第二群组关系信息。
另一种实施例中,所述数据处理模块430可以包括:
第三数据处理单元,可以用于当所述关联群组的数量为零时,建立存储所述待处理节点数据的初始群组,以及所述初始群组的第三群组关系信息。
如前所述,本申请中建立的群组关系信息可以根据需要采用不同的记录方式,如群组关系树的形式。因此,本申请的一种实施例中,所述群组关系信息可以至少包括下述之一:
群组关系树、群组链表、与相应群组对应的群组关系标识符。
图5是本申请提供的群组数据处理装置的另一种实施例的模块结构示意图,另一种实施例中,如图5所示,所述装置400还可以包括:
查询模块440,可以用于通过所述群组关系信息查询与待查询节点数据相关联的群组的信息。
图6是本申请提供的群组数据处理装置的另一种实施例的模块结构示意图,另一种实施例中,如图6所示,所述装置400还可以包括:
编号模块450,可以用于获取节点数据的群组中群组的最大编号,将所述最大编号增加一个递增步长后的编号作为所述新群组或所述初始群组的编号。
由上述可见,本申请提供的群组数据处理的方法或装置的实施例当存入新的待处理节点数据时,可以基于原有群组数据的群组关系计算出原有的群组中与所述待处理节点数据存在关联关系的节点数据所对应的关联群组的数量。基于所述关联群组的数量可以建立存储所述待处理节点数据的群组的群组关系信息。所述的群组关系信息可以用于有效的记录和反应群组的演化过程,为后续利用所述群组关系信息进行查询群组信息,进而可以实现对群组数据的查询、管理等。与现有技术相比,可以有效的记录和处理互联网业务系统中的节点数据及群组数据,提高了群组数据管理的灵活性、便利性和精准性,便于进行风险分析识别,可以降低用户损失,改善用户体验。
尽管本申请内容中提到建立存储群组、建立群组关系信息等的数据处理的描述,但是,本申请并不局限于必须是完全标准或者所提及的数据处理应用环境的情况。本申请中各个实施例中所涉及的上述描述仅是本申请中的一些实施例中的应用。当然,在符合本申请上述各实施例的中所述的处理方法步骤的其他无创造性的变形,仍然可以实现相同的申请,在此不再赘述。
虽然本申请提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
上述实施例阐明装置或模块,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、移动通信终端、多处理器系统、基于微处理器的系统、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
虽然通过实施例描绘了本申请,本领域普通技术人员知道,本申请有许多变形和变化而不脱离本申请的精神,希望所附的权利要求包括这些变形和变化而不脱离本申请的精神。