CN109614415A - 一种数据挖掘、处理方法、装置、设备及介质 - Google Patents

一种数据挖掘、处理方法、装置、设备及介质 Download PDF

Info

Publication number
CN109614415A
CN109614415A CN201811147011.7A CN201811147011A CN109614415A CN 109614415 A CN109614415 A CN 109614415A CN 201811147011 A CN201811147011 A CN 201811147011A CN 109614415 A CN109614415 A CN 109614415A
Authority
CN
China
Prior art keywords
data
target data
node
root node
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811147011.7A
Other languages
English (en)
Other versions
CN109614415B (zh
Inventor
吴龙飞
宋燕
彭健鑫
谷胜才
林孝旦
陈辉
郑文宗
张璐
祝志晓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ANT Financial Hang Zhou Network Technology Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811147011.7A priority Critical patent/CN109614415B/zh
Publication of CN109614415A publication Critical patent/CN109614415A/zh
Application granted granted Critical
Publication of CN109614415B publication Critical patent/CN109614415B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/085Payment architectures involving remote charge determination or related payment systems
    • G06Q20/0855Payment architectures involving remote charge determination or related payment systems involving a third party
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例公开了一种数据挖掘、处理方法、装置、设备及介质,数据挖掘方法包括:根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据。

Description

一种数据挖掘、处理方法、装置、设备及介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据挖掘、处理方法、装置、设备及介质。
背景技术
在当今社会,数据成为重要的资源,例如数据可以用来分析某个人的爱好,也可以用于各类案件的侦破。但是随着社会和科技的发展,一方面数据的积累越来越多,另一方面数据的增长速度也越来越快,并且不同领域的数据的存储平台或者存储服务器等也不尽相同,如何从这些海量数据中挖掘出有用数据并对数据进行处理,并且提高数据挖掘的效率,这是一个难题。
鉴于上述内容,需要更高效的数据挖掘、处理方案。
发明内容
本说明书实施例提供了一种数据挖掘、处理方法、装置、设备及介质,用以解决如何更高效地进行数据挖掘、处理的技术问题。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供一种数据挖掘方法,包括:
根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据。
本说明书实施例提供一种数据处理方法,包括:
根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据;
对所述数据根节点和/或任意或指定级目标数据进行处理。
本说明书实施例还提供了一种数据挖掘装置,包括:
挖掘模块,用于根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点;以及,
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点;
目标数据确定模块,用于根据任一级属性节点中确定与其同级的目标数据。
本说明书实施例还提供了一种数据处理装置,包括:
挖掘模块,用于根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点;以及,
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点;
目标数据确定模块,用于根据任一级属性节点中确定与其同级的目标数据;
处理模块,用于对所述数据根节点和/或任意或指定级目标数据进行处理。
本说明书实施例还提供了一种数据挖掘设备,包括:
至少一个处理器;
以及,
与所述至少一个处理器通信连接的存储器;
其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据。
本说明书实施例还提供了一种数据处理设备,包括:
至少一个处理器;
以及,
与所述至少一个处理器通信连接的存储器;
其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据;
对所述数据根节点和/或任意或指定级目标数据进行处理。
本说明书实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如下的步骤:
根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据。
本说明书实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如下的步骤:
根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据;
对所述数据根节点和/或任意或指定级目标数据进行处理。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
从数据根节点开始按照挖掘维度逐级挖掘属性节点和目标数据,能够实现目标数据的一站式挖掘,且挖掘方向和路径更加清晰,数据挖掘效率也更高。在逐级挖掘的基础上,还可以进一步建立数据根节点、各级属性节点、各级目标数据之间的关联关系,便于对挖掘出来的包括各级属性节点在内的数据进行处理。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对本说明书实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书第一个实施例提供的一种实际应用场景下的数据挖掘系统的示意图。
图2是本说明书第二个实施例提供的一种数据挖掘方法的流程示意图。
图3是本说明书第二个实施例提供的一种数据挖掘过程示意图。
图4是本说明书第三个实施例提供的一种数据处理方法的流程示意图。
图5是本说明书第四个实施例提供的一种电信诈骗场景下的数据挖掘数据挖掘导图。
图6是本说明书第五个实施例提供的一种社交场景下的数据挖掘数据挖掘导图。
图7是本说明书第六个实施例提供的一种数据挖掘装置的结构示意图。
图8是本说明书第六个实施例提供的另一种数据挖掘装置的结构示意图。
图9是本说明书第六个实施例提供的另一种数据挖掘装置的结构示意图。
图10是本说明书第六个实施例提供的一种数据处理装置的结构示意图。
图11是本说明书第六个实施例提供的另一种数据处理装置的结构示意图。
图12是本说明书第七个实施例提供的一种数据处理装置的结构示意图。
图13是本说明书第七个实施例提供的另一种数据处理装置的结构示意图。
图14是本说明书第七个实施例提供的另一种数据处理装置的结构示意图。
图15是本说明书第七个实施例提供的另一种数据处理装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
在现有技术中,一方面数据的积累越来越多,另一方面数据的增长速度也越来越快,并且不同领域的数据的存储平台或者存储服务器等也不尽相同,如何从这些海量数据中挖掘出有用数据,并且提高数据挖掘的效率,这是一个难题。如图1所示,本说明书第一个实施例提供了在一种实际应用场景下的数据挖掘系统11,从数据根节点开始,按照挖掘维度挖掘一级属性节点,并根据一级属性节点中确定一级目标节点,从二级开始,就由上一级的目标数据按照挖掘维度挖掘下一级的属性节点,并根据每一级属性节点中确定同级目标节点,从而得到各级属性节点和各级目标数据,实现目标数据的一站式挖掘,且挖掘方向和路径更加清晰,数据挖掘效率也更高。在逐级挖掘的基础上,还可以进一步建立数据根节点、各级属性节点、各级目标数据之间的关联关系,便于对包括数据根节点和/或各级属性节点和/或各级目标数据在内的数据进行处理。
从程序角度而言,上述流程的执行主体可以为计算机或者服务器或者相应的数据挖掘系统等,另外,也可以有第三方应用客户端协助流程的执行。
图2为本说明书第二个实施例提供的一种数据挖掘方法的流程示意图,图3是本实施例中的数据挖掘过程示意图。结合图2和图3,本说明书本实施例提供的一种数据挖掘方法具体可以包括以下步骤:
S101:根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据。
数据根节点是数据挖掘的起点,不同场景下数据根节点的形式可能不同,例如可以是账户、社交账号、手机号、设备等。挖掘维度表示从哪些方面来分析对象,比如交易、资金、设备、WiFi网络等,都可以是对象的维度,维度没有具体的值。这里的“对象”即为要分析的目标,在本步骤中为数据根节点,下文将说明,“对象”也可以是目标数据,不同的对象的挖掘维度可以不同。属性节点是对象在挖掘维度下的具体的值,比如数据根节点为某银行账户,挖掘维度为交易,则属性节点就是该银行账户在某段时间范围内的交易信息,这些交易信息可以有多条,每一条可以包含时间、金额、状态、对方账户等信息。目标数据则是根据属性节点中来确定,沿用上例,假如属性节点是一条条的交易信息,每一条包含时间、金额、状态、对方账户等信息,则可以将对方账户筛选出来作为目标数据。一般来说,目标数据可以是从单个属性节点中所包含的数据,比如属性节点中的某些字段,还可以是与属性节点相关联的数据。当然,目标数据的具体形式实际场景而定。
在根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点前,可以建立数据根节点和/或目标数据与挖掘维度的对应关系,比如每种类型的数据根节点对应一种或多种挖掘维度,每种类型的目标数据对应一种或多种挖掘维度;又比如,不同重要度或优先级的数据根节点分别对应一种或多种挖掘维度,不同重要度或优先级的目标数据分别对应一种或多种挖掘维度,重要度或优先级高的数据根节点和/或目标节点对应的挖掘维度可以多一些。
根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点前,可以接收所述数据根节点。上述数据根节点和/或目标数据与挖掘维度的对应关系可以在接收数据根节点之前就确定好。在实际应用场景下,接收到数据根节点后,根据上述对应关系可以确定数据根节点的挖掘维度,进而寻找与数据根节点在确定的各个挖掘维度上相关联的一级属性节点;对于目标数据来说,可以每挖掘到一级目标数据后再根据上述对应关系对新挖掘到的这级目标数据确定挖掘维度。
S102:根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据。
首先指出,本步骤中的“上一级”和“下一级”是指相邻的两级。本步骤中挖掘维度的“对象”变成了各级目标数据。所述的“上一级目标数据”可以是S101中的一级目标数据,确定一级目标数据的挖掘维度,寻找与一级目标数据在其各个挖掘维度上相关联的二级属性节点,并根据二级属性节点确定二级目标数据。将二级目标数据作为“上一级目标数据”,确定二级目标数据的挖掘维度,寻找与该二级目标数据在其各个挖掘维度上相关联的三级属性节点,并根据三级属性节点确定三级目标数据,三级目标数据又可以作为“上一级目标数据”……寻找到n级属性节点,根据n级属性节点确定n级目标数据,将n级目标数据作为“上一级目标数据”,确定n级目标数据的挖掘维度,寻找与n级目标数据在其各个挖掘维度上相关联的n+1级属性节点,根据n+1级属性节点确定n+1级目标数据……上述步骤重复进行,从新挖掘到的“上一级目标数据”来寻找“下一级属性节点”,并根据寻找到的“下一级属性节点中”确定出与其同级的目标数据。
由上可知,本步骤中的“上一级目标数据”并不特指某一级目标数据,任一级目标数据都可以作为上一级目标数据;本步骤中的“下一级属性节点”也可以是除了以及属性节点之外的任一级属性节点。通过本步骤,就实现了逐级寻找属性节点以及逐级确定目标数据。
一般来说,数据根节点的挖掘维度是有至少一个的,虽然不一定在每个挖掘维度上都可以寻找到一级属性节点。通过数据根节点的各个挖掘维度所寻找到的一级属性节点形成了一级属性节点集合,里面包含一个或多个一级属性节点。相应的,根据一级属性节点所确定的一级目标数据也形成了一个一级目标数据集合。在由一级属性节点确定一级目标数据时,可以根据一级属性节点集合中的每一个一级属性节点来确定一级目标数据,也可以从一级属性节点集合中再筛选出一部分或者指定一部分以及属性节点,然后根据这一部分一级属性节点中的每一个一级属性节点来确定一级目标数据。在由一级目标数据寻找二级属性节点时,可以对一级目标数据集合中的每一个一级目标数据都确定挖掘维度,并寻找在其各个挖掘维度上相关联的二级属性节点;也可以从一级目标数据集合中再筛选出一部分或者指定一部分一级目标数据,然后对这一部分一级目标数据中的每一个目标数据都确定挖掘维度,并寻找在其各个挖掘维度上相关联的二级属性节点。同样的,寻找到的二级属性节点和确定的二级目标数据也分别可以形成二级属性节点集合和二级目标数据集合。以此类推,各级属性节点和各级目标数据都可以形成集合。类似于一级属性节点,对于每一级属性节点集合,可以根据其中的每一个属性节点来确定下一级目标数据,也可以根据其中的一部分属性节点来确定下一级目标数据。类似于一级目标数据,对于每一级目标数据集合,可以由其中的每个目标数据进行下一级属性节点的寻找,也可以由其中的一部分目标数据进行下一级属性节点的寻找。需要说明的是,对于各级属性节点和各级目标节点,不排除其中出现空集的情况。比如,有可能出现某一级属性节点集合是空集的情况,也有可能出现某一级属性节点集合不是空集,但根据该级属性节点确定出的同级目标数据却是空集的情况,即通过该级属性节点中确定不出目标数据。
在实际场景中,一般来说,寻找的属性节点的级数越多,所能得到的目标数据总量是越多的。但是通常来讲,级数越大的属性节点、目标数据与数据根节点的关系通常也是越松散的,其应用价值也相对更小一些。为了保证寻找和确定出的属性节点和目标数据的应用价值和/或为了控制寻找和确定出的属性节点和目标数据的数量和/或其他原因,可以对寻找属性节点和/或确定目标数据的级数做限定,当被寻找到的属性节点和/或确定的目标数据的级数达到级数阈值时,停止寻找下一级属性节点,即停止寻找属性节点。可能存在这种情况,例如n级目标数据集合不是空集,且没有达到级数阈值,在确定了用来寻找n+1级属性节点的目标数据(比如n级目标数据集合全部或者一部分,不妨就是n级目标数据集合全部)后,对每一个n级目标数据确定挖掘维度,且对每一个目标数据来说,在其各个挖掘维度上都没有寻找到n+1级属性节点,即n+1级属性节点是空集,这种情况下,可以变换所选择的用来寻找n+1级属性节点的n级目标数据(在一开始没有选择n级目标数据集合全部的情况下)和/或变换n级目标数据的挖掘维度,或者也可以停止寻找属性节点。或者m级属性节点集合不是空集,但m级目标数据集合却是空集,这种情况下也可以停止寻找属性节点。另外,在没有级数阈值的情况下,当某级目标数据为空时,可以停止寻找属性节点。
进一步,可以根据上述的数据根节点、各级属性节点和/或各级目标数据形成数据挖掘导图,从而清晰展现出目标数据的挖掘过程和结果。在不同场景下,形成的数据挖掘导图可能是不一样的。
通过本实施例,可以实现目标数据的一站式挖掘,且挖掘方向和路径更加清晰,数据挖掘效率也更高。在逐级挖掘的基础上,还可以进一步建立数据根节点、各级属性节点、各级目标数据之间的关联关系,便于对包括数据根节点和/或各级属性节点和/或各级目标数据在内的数据进行处理。
如图4所示,本说明书的第三个实施例提供了一种数据处理方法,包括:
S201:根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据。
该部分同第二个实施例中的S101。
S202:根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据。
该部分同第二个实施例中的S102。
S203:对所述数据根节点和/或任意或指定级目标数据进行处理。
在寻找到各级目标数据后,可以对所述数据根节点和/或任意或指定级目标数据进行处理。具体来说,可以将目标数据进行分类。分类既可以针对各级目标数据进行,也可以针对指定的某一级或某些级进行;既可以将各级或指定级的目标数据的全体汇集在一起进行分类,也可以针对选定的某些目标数据进行,且可以跨级选定。在对目标数据进行分类后,便可根据分类对目标数据进行处理。例如可以将目标数据分为有风险类和无风险类,然后对有风险类的目标数据进行管控;还可以将目标数据分为营销类和正常类,然后对营销类的目标数据进行管控。具体分为哪些类别以及采取的处理措施可以根据实际应用场景而定。
进一步,可以根据目标数据的分类确定数据根节点的标签。根据目标数据的分类确定数据根节点的标签包括但不限于以下方式:
确定目标数据分类后的各个类别对所述数据根节点的权重分数,根据权重分数最高的类别确定所述数据根节点的标签。具体可以包括:
(1)若分类是针对某一级目标数据进行的,则确定该级目标数据分类后的各个类别对数据根节点的权重分数,根据权重分数最高的类别确定所述数据根节点的标签。一般一级目标数据(即第一级目标数据)与数据根节点的关系相对更加紧密,所以通常是针对一级目标数据。
(2)若分类是针对多级目标数据进行的,但是是对每一级目标数据单独进行分类,则确定被分类的各级目标数据分类后的各个类别对数据根节点的权重分数,根据权重分数最高的类别确定所述数据根节点的标签。特别的,若不同级的目标数据分类时出现了相同的类别,则将不同级的相同类别的权重分数相加作为其对数据根节点的权重分数。例如,若只有某一级目标数据分类具有类别A,该级该类别A对数据根节点的权重分数为a,则类别A对数据根节点的权重分数为a;若还有其他级目标数据分类后也出现了类别A,则将各级出现的类别A对数据根节点的权重分数相加作为类别A对数据根节点的权重分数,例如若还有另一级目标数据分类后也具有类别A,该级该类别A对数据根节点的权重分数为b,则将a+b作为类别A对数据根节点的权重分数。
(3)若分类是针对多级目标数据的集合(即多级目标数据的全体)或多级目标数据的集合的一部分进行的,则确定对集合或集合一部分分类后的各个类别对数据根节点的权重分数,根据权重分数最高的类别确定所述数据根节点的标签。
在确定了数据根节点的标签后,就可以根据标签对数据根节点进行处理。例如数据根节点的标签为“风险”,就可以对数据根节点进行风险管控;又比如数据根节点的标签为“营销”,就可以对数据根节点进行营销管控。数据根节点具体可以有哪些标签以及采取的处理措施可以根据实际应用场景而定。
图5是本说明书第四个实施例提供的一种电信诈骗场景下的数据挖掘数据挖掘导图。在本实施例中,数据根节点是已经掌握的受害人资金账户(可以来自受害人的报案或投诉),比如银行账户、第三方支付平台账户以及各种可以转账的电子钱包账户,针对受害人账户可以确定多个挖掘维度,包括但不限于图4中示出的设备信息、资金信息、WiFi信息。通过设备信息这一挖掘维度,可以寻找到受害人账户登录过的设备,比如设备1、……、设备o,这些设备属于一级属性节点;通过资金信息这一挖掘维度,可以将时间范围限定在案发时间或者指定的时间段,然后寻找到关于受害人账户的交易明细,比如交易明细1、……、交易明细p,这些交易明细也属于一级属性节点;通过WiFi信息这一挖掘维度,可以寻找到受害人账户使用过的WiFi网络,比如WiFi网络1、……、WiFi网络q,这些WiFi网络也属于一级属性节点。当然,若还使用了其他挖掘维度,则可以获得其他挖掘维度上的一级属性节点。上述寻找到的各个一级属性节点属于一级属性节点集合。对于属性节点的寻找可以做成在线接口的形式,能够做到实时返回。
可以根据一级属性节点的全体或者一部分来确定一级目标数据。对于一级属性节点中的设备,可以确定出使用过设备的其他账户,包括资金账户,仅以设备1为例,可以确定出使用过设备1的资金账户1、……、资金账户r,这r个资金账户可以作为一级目标数据(由此可以看出目标数据可以是与属性节点相关联的数据,比如资金账户与设备关联);对于一级属性节点中的交易明细,可以确定出与受害人资金账户对应的对方账户,对应于交易明细1、……、交易明细p,可以确定对方账户1、……、对方账户p,这p个对方账户可以作为一级目标数据,如果是电商交易明细,还可以确定例如时间、金额、商品名称、收获地址及电话、卖家账号等数据,然后可以从中选取目标数据,比如将卖家账号、收货人电话作为目标数据(由此可以看出目标数据可以是属性节点中的某些字段);对于一级属性节点中的WiFi信息,可以确定出使用过WiFi网络的其他账户,包括资金账户,仅以WiFi网络1为例,可以确定出使用过WiFi网络1的资金账户1、……、资金账户s,这s个资金账户可以作为一级目标数据。上述确定的各个一级目标数据属于一级目标数据集合。
根据一级目标数据集合中的每一个一级目标数据,可以确定挖掘维度,包括但不限于设备信息、资金信息、WiFi信息,从而对于每一个一级目标数据在其各个挖掘维度上寻找二级属性节点。或者可以从一级目标数据集合中选择一部分,然后确定这一部分中每一个目标数据的挖掘维度,进而寻找二级属性节点。二级目标数据的确定过程同一级目标数据的确定过程。
以此类推,可以逐级寻找属性节点和确定目标数据,并且可以通过设置级数阈值的方式来作为停止寻找属性节点的条件,或者当出现某级目标数据为空集时停止寻找属性节点。
在本实施例中,一般是将资金账户作为目标数据。对于寻找到的各级目标数据,可以确定各个目标数据的风险度,从而锁定可疑账户。比如可以设定风险度阈值,将达到和/或超过风险度阈值的目标数据筛选出来作为可疑账户,通过可疑账户即可确定背后的风险目标,风险目标可以是嫌疑人。
可以对上述的目标数据进行分类,比如有些账户通过排查可以确定是风险目标账户,有些是非风险目标账户。对于非风险目标账户,可以看其与上述风险目标账户之间的关系,如果关系较为紧密,例如发生过汇款行为,则可以进一步确定非风险目标账户的持有人,持有人有可能是除数据根节点外的其他受害人,这样有利于帮助其他的受害人挽回损失。
以上仅是示例性的说明,实际应用可能会有不同。
图6是本说明书第五个实施例提供的一种社交场景下的数据挖掘数据挖掘导图。在本实施例中,数据根节点为某社交账号,对数据根节点所确定的挖掘维度为账户关注关系,从而可以确定该社交账号的关注明细,比如有该社交账号关注了公众号1,……,公众号t,这t个公众号作为一级属性节点,同时也可以作为一级目标数据。在本实施例中,一般确定一级目标数据即可。
进一步,可以将一级目标数据进行分类,例如将这些被数据根节点关注的社交账号或公众号分为“新闻”“娱乐”“财经”“体育”等类别,然后确定各个类别对数据根节点的权重分数,然后根据权重分数最高的类别确定数据根节点的标签,若出现不同类别权重分数并列最高的情况,则根据权重分数并列最高的类别确定数据根节点的标签。确定权重分数的方法包括但不限于:将每一类别的社交账号或公众号数量作为权重分数。比如数据根节点所关注的社交账号或公众号中属于“新闻”类别的最多,则数据根节点的标签就可以是“新闻”;又比如数据根节点所关注的社交账号或公众号中属于“新闻”和“娱乐”类别的并列最多,则数据根节点的标签就可以是“新闻”和“娱乐”。
在确定了数据根节点的标签后,就可以对数据根节点进行处理,例如向数据根基点发送“新闻”类资讯。
以上仅是示例性的说明,实际应用可能会有不同。
基于同样的思路,如图7所示,本说明书第六个实施例还提供了一种数据挖掘装置,包括:
挖掘模块301,用于根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点;以及,
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点;
目标数据确定模块302,用于根据任一级属性节点中确定与其同级的目标数据。
可选的,当被寻找到的属性节点和/或目标数据的级数达到级数阈值时,停止寻找属性节点;
和/或,
当某级目标数据为空时,停止寻找属性节点。
可选的,如图8所示,所述装置还包括:
风险度确定筛选模块303,用于确定任意或指定级目标数据中各个目标数据的风险度,根据所述风险度对所述各级目标数据进行筛选;
风险目标确定模块304,用于根据筛选后的各级目标数据确定风险目标。
可选的,如图9所示,所述装置还包括:
维度模块305,用于根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点前,建立数据根节点和/或目标数据与挖掘维度的对应关系;
和/或;
确定数据根节点和/或目标数据的挖掘维度。
可选的,建立数据根节点与挖掘维度的对应关系包括:
建立各重要度或优先级的数据根节点和/或目标数据与挖掘维度的对应关系;
和/或,
建立各类型数据根节点与挖掘维度的对应关系。
可选的,如图10所示,所述装置还包括:
根节点接收模块306,用于根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点前,接收所述数据根节点。
可选的,如图11所示,所述装置还包括:
成图模块307,用于根据所述数据根节点、各级属性节点和/或各级目标数据形成数据挖掘导图。
基于同样的思路,如图12所示,本说明书第七个实施例还提供了一种数据处理装置,包括:
挖掘模块401,用于根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点;以及,
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点;
目标数据确定模块402,用于根据任一级属性节点中确定与其同级的目标数据;
处理模块403,用于对所述数据根节点和/或任意或指定级目标数据进行处理。
可选的,如图13所示,所述装置还包括:
目标数据分类模块404,用于对任意或指定级目标数据进行分类;
所述处理模块403根据所述分类对所述数据根节点和/或任意或指定级目标数据进行处理。
可选的,如图14所示,所述装置还包括:
根节点标签确定模块405,用于根据所述目标数据的分类确定所述数据根节点的标签。
可选的,根据所述目标数据的分类确定所述数据根节点的标签包括:
确定目标数据的各个类别对所述数据根节点的权重分数;
根据权重分数最高的类别确定所述数据根节点的标签。
可选的,如图15所示,所述处理模块403还用于根据所述数据根节点的标签对所述数据根节点进行处理。
基于同样的思路,本说明书第八个实施例提供了一种数据挖掘设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据。
基于同样的思路,本说明书第九个实施例提供了一种数据挖掘设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据;
对所述数据根节点和/或任意或指定级目标数据进行处理。
基于同样的思路,本说明书第十个实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如下的步骤:
根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据。
基于同样的思路,本说明书第十一个实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如下的步骤:
根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据;
对所述数据根节点和/或任意或指定级目标数据进行处理。
上述对本说明书特定实施例进行了描述,其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,附图中描绘的过程不一定必须按照示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书实施例提供的装置、设备、非易失性计算机可读存储介质与方法是对应的,因此,装置、设备、非易失性计算机存储介质也具有与对应方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述对应装置、设备、非易失性计算机存储介质的有益技术效果。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Express ion Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Descript ion Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书实施例可提供为方法、系统、或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (25)

1.一种数据挖掘方法,其特征在于,
根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据。
2.如权利要求1所述的方法,其特征在于,当被寻找到的属性节点和/或目标数据的级数达到级数阈值时,停止寻找属性节点;
和/或,
当某级目标数据为空时,停止寻找属性节点。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:
确定任意或指定级目标数据中各个目标数据的风险度,根据所述风险度对所述各级目标数据进行筛选;
根据筛选后的各级目标数据确定风险目标。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点前,建立数据根节点和/或目标数据与挖掘维度的对应关系;
和/或;
确定数据根节点和/或目标数据的挖掘维度。
5.如权利要求4所述的方法,其特征在于,建立数据根节点与挖掘维度的对应关系包括:
建立各重要度或优先级的数据根节点和/或目标数据与挖掘维度的对应关系;
和/或,
建立各类型数据根节点与挖掘维度的对应关系。
6.如权利要求1至5中任一项所述的方法,其特征在于,所述方法还包括:
根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点前,接收所述数据根节点。
7.如权利要求1至5中任一项所述的方法,其特征在于,所述方法还包括:
根据所述数据根节点、各级属性节点和/或各级目标数据形成数据挖掘导图。
8.一种数据处理方法,其特征在于,
根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据;
对所述数据根节点和/或任意或指定级目标数据进行处理。
9.如权利要求8所述的方法,其特征在于,对所述数据根节点和/或任意或指定级目标数据进行处理包括:
对任意或指定级目标数据进行分类;
根据所述分类对所述数据根节点和/或任意或指定级目标数据进行处理。
10.如权利要求9所述的方法,其特征在于,所述方法还包括:
根据所述目标数据的分类确定所述数据根节点的标签。
11.如权利要求10所述的方法,其特征在于,根据所述目标数据的分类确定所述数据根节点的标签包括:
确定目标数据的各个类别对所述数据根节点的权重分数;
根据权重分数最高的类别确定所述数据根节点的标签。
12.如权利要求10或11所述的方法,其特征在于,根据所述数据根节点的标签对所述数据根节点进行处理。
13.一种数据挖掘装置,其特征在于,包括:
挖掘模块,用于根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点;以及,
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点;
目标数据确定模块,用于根据任一级属性节点中确定与其同级的目标数据。
14.如权利要求13所述的装置,其特征在于,所述装置还包括:
维度模块,用于根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点前,建立数据根节点和/或目标数据与挖掘维度的对应关系;
和/或;
确定数据根节点和/或目标数据的挖掘维度。
15.如权利要求14所述的装置,其特征在于,建立数据根节点与挖掘维度的对应关系包括:
建立各重要度或优先级的数据根节点和/或目标数据与挖掘维度的对应关系;
和/或,
建立各类型数据根节点与挖掘维度的对应关系。
16.如权利要求13至15中任一项所述的装置,其特征在于:所述装置还包括:
根节点接收模块,用于根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点前,接收所述数据根节点。
17.一种数据处理装置,其特征在于,包括:
挖掘模块,用于根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点;以及,
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点;
目标数据确定模块,用于根据任一级属性节点中确定与其同级的目标数据;
处理模块,用于对所述数据根节点和/或任意或指定级目标数据进行处理。
18.如权利要求17所述的装置,其特征在于,所述装置还包括:
目标数据分类模块,用于对任意或指定级目标数据进行分类;
所述处理模块根据所述分类对所述数据根节点和/或任意或指定级目标数据进行处理。
19.如权利要求18所述的装置,其特征在于,所述装置还包括:
根节点标签确定模块,用于根据所述目标数据的分类确定所述数据根节点的标签。
20.如权利要求19所述的装置,其特征在于,根据所述目标数据的分类确定所述数据根节点的标签包括:
确定目标数据的各个类别对所述数据根节点的权重分数;
根据权重分数最高的类别确定所述数据根节点的标签。
21.如权利要求19或20所述的装置,其特征在于,所述处理模块还用于根据所述数据根节点的标签对所述数据根节点进行处理。
22.一种数据挖掘设备,其特征在于,包括:
至少一个处理器;
以及,
与所述至少一个处理器通信连接的存储器;
其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据。
23.一种数据处理设备,其特征在于,包括:
至少一个处理器;
以及,
与所述至少一个处理器通信连接的存储器;
其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据;
对所述数据根节点和/或任意或指定级目标数据进行处理。
24.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,其特征在于,所述计算机可执行指令被处理器执行时实现如下的步骤:
根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据。
25.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,其特征在于,所述计算机可执行指令被处理器执行时实现如下的步骤:
根据数据根节点的挖掘维度寻找与所述数据根节点相关联的一级属性节点,并根据所述一级属性节点确定一级目标数据;
根据上一级目标数据的挖掘维度寻找与上一级目标数据相关联的下一级属性节点,并根据所述下一级属性节点确定与其同级的目标数据;
对所述数据根节点和/或任意或指定级目标数据进行处理。
CN201811147011.7A 2018-09-29 2018-09-29 一种数据挖掘、处理方法、装置、设备及介质 Active CN109614415B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811147011.7A CN109614415B (zh) 2018-09-29 2018-09-29 一种数据挖掘、处理方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811147011.7A CN109614415B (zh) 2018-09-29 2018-09-29 一种数据挖掘、处理方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN109614415A true CN109614415A (zh) 2019-04-12
CN109614415B CN109614415B (zh) 2023-03-28

Family

ID=66002523

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811147011.7A Active CN109614415B (zh) 2018-09-29 2018-09-29 一种数据挖掘、处理方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN109614415B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263065A (zh) * 2019-05-22 2019-09-20 阿里巴巴集团控股有限公司 数据钻取方法和装置
CN111209277A (zh) * 2020-01-06 2020-05-29 北京思维造物信息科技股份有限公司 一种数据处理方法、装置、设备及介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030018646A1 (en) * 2001-07-18 2003-01-23 Hitachi, Ltd. Production and preprocessing system for data mining
US20060010110A1 (en) * 2004-07-09 2006-01-12 Microsoft Corporation Systems and methods that facilitate data mining
US20070185904A1 (en) * 2003-09-10 2007-08-09 International Business Machines Corporation Graphics image generation and data analysis
US7433879B1 (en) * 2004-06-17 2008-10-07 Versata Development Group, Inc. Attribute based association rule mining
US20090177682A1 (en) * 2008-01-09 2009-07-09 International Business Machines Corporation Data mining using variable rankings and enhanced visualization methods
US20100106723A1 (en) * 2008-10-24 2010-04-29 Industry-Academic Cooperation Foundation, Yonsei University Method and system of clustering for multi-dimensional data streams
CN101794296A (zh) * 2010-01-13 2010-08-04 中国电子科技集团公司第五十四研究所 一种基于空中活动目标数据的挖掘方法
US20160092515A1 (en) * 2014-09-29 2016-03-31 International Business Machines Corporation Mining association rules in the map-reduce framework
WO2016054908A1 (zh) * 2014-10-10 2016-04-14 中兴通讯股份有限公司 基于物联网大数据平台的智能用户画像方法及装置
CN105740371A (zh) * 2016-01-27 2016-07-06 深圳大学 一种基于密度的增量聚类数据挖掘方法及系统
US20160357795A1 (en) * 2013-11-22 2016-12-08 Oricane Ab Method and apparatus for data mining
CN106294667A (zh) * 2016-08-05 2017-01-04 四川九洲电器集团有限责任公司 一种基于id3的决策树实现方法及装置
US20170344662A1 (en) * 2015-01-14 2017-11-30 Landmark Graphics Corporation Data filtering and mining using multiple-level, composite-attribute tree-node diagrams
CN108011367A (zh) * 2017-12-04 2018-05-08 贵州电网有限责任公司电力科学研究院 一种基于深度决策树算法的电力负荷特性挖掘方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030018646A1 (en) * 2001-07-18 2003-01-23 Hitachi, Ltd. Production and preprocessing system for data mining
US20070185904A1 (en) * 2003-09-10 2007-08-09 International Business Machines Corporation Graphics image generation and data analysis
US7433879B1 (en) * 2004-06-17 2008-10-07 Versata Development Group, Inc. Attribute based association rule mining
US20060010110A1 (en) * 2004-07-09 2006-01-12 Microsoft Corporation Systems and methods that facilitate data mining
US20090177682A1 (en) * 2008-01-09 2009-07-09 International Business Machines Corporation Data mining using variable rankings and enhanced visualization methods
US20100106723A1 (en) * 2008-10-24 2010-04-29 Industry-Academic Cooperation Foundation, Yonsei University Method and system of clustering for multi-dimensional data streams
CN101794296A (zh) * 2010-01-13 2010-08-04 中国电子科技集团公司第五十四研究所 一种基于空中活动目标数据的挖掘方法
US20160357795A1 (en) * 2013-11-22 2016-12-08 Oricane Ab Method and apparatus for data mining
US20160092515A1 (en) * 2014-09-29 2016-03-31 International Business Machines Corporation Mining association rules in the map-reduce framework
WO2016054908A1 (zh) * 2014-10-10 2016-04-14 中兴通讯股份有限公司 基于物联网大数据平台的智能用户画像方法及装置
US20170344662A1 (en) * 2015-01-14 2017-11-30 Landmark Graphics Corporation Data filtering and mining using multiple-level, composite-attribute tree-node diagrams
CN105740371A (zh) * 2016-01-27 2016-07-06 深圳大学 一种基于密度的增量聚类数据挖掘方法及系统
CN106294667A (zh) * 2016-08-05 2017-01-04 四川九洲电器集团有限责任公司 一种基于id3的决策树实现方法及装置
CN108011367A (zh) * 2017-12-04 2018-05-08 贵州电网有限责任公司电力科学研究院 一种基于深度决策树算法的电力负荷特性挖掘方法

Non-Patent Citations (13)

* Cited by examiner, † Cited by third party
Title
曾俊: "一种基于Hadoop架构的并行挖掘算法研究", 《现代电子技术》 *
李涛: "一种快速的关联规则挖掘算法", 《软件导刊》 *
林芝等: "基于信息论网络的时序数据库挖掘", 《计算机工程与应用》 *
林芳: "基于决策树的web模式挖掘框架研究", 《煤炭技术》 *
梁凤兰: "优化决策树改进挖掘算法仿真", 《计算机仿真》 *
王亮等: "快速挖掘最大频繁模式算法", 《计算机工程与应用》 *
王敏等: "China PubMed智能检索模型研究", 《中华医学图书情报杂志》 *
王磊等: "基于属性相关分析的离群数据并行挖掘算法", 《太原科技大学学报》 *
蒙华等: "树结构算法改善Cache数据库构建医院质控平台", 《电脑编程技巧与维护》 *
郝天鹏等: "改进的FP-growth关联规则挖掘算法", 《电脑知识与技术》 *
黄子诚: "基于决策树的数据挖掘技术", 《电脑知识与技术》 *
齐云飞等: "决策树数据挖掘算法在学生评价分析中的应用", 《河南职工医学院学报》 *
龚俊等: "一种全新的R树节点选择算法", 《计算机应用研究》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263065A (zh) * 2019-05-22 2019-09-20 阿里巴巴集团控股有限公司 数据钻取方法和装置
CN111209277A (zh) * 2020-01-06 2020-05-29 北京思维造物信息科技股份有限公司 一种数据处理方法、装置、设备及介质
CN111209277B (zh) * 2020-01-06 2023-11-24 北京思维造物信息科技股份有限公司 一种数据处理方法、装置、设备及介质

Also Published As

Publication number Publication date
CN109614415B (zh) 2023-03-28

Similar Documents

Publication Publication Date Title
CN107833060A (zh) 一种区块链中智能合约交易的验证方法以及系统
WO2019157946A1 (zh) 一种反洗钱方法、装置及设备
TWI745589B (zh) 風險特徵篩選、描述報文產生方法、裝置以及電子設備
CN109347787A (zh) 一种身份信息的识别方法及装置
CN108492124A (zh) 店铺信息推荐方法、装置及客户端
CN109934697A (zh) 一种基于图结构模型的信用风险控制方法、装置以及设备
CN104951446A (zh) 大数据处理方法及平台
CN107526667A (zh) 一种指标异常检测方法、装置以及电子设备
WO2018161900A1 (zh) 一种风控事件自动处理方法及装置
CN108984658A (zh) 一种智能问答数据处理方法及装置
US8984022B1 (en) Automating growth and evaluation of segmentation trees
US11748621B2 (en) Methods and apparatus for feature generation using improved term frequency-inverse document frequency (TF-IDF) with deep learning for accurate cloud asset tagging
CN110119860A (zh) 一种垃圾账号检测方法、装置以及设备
CN109583890A (zh) 异常交易对象的识别方法、装置及设备
CN108876102A (zh) 一种风险交易挖掘方法、装置及设备
CN110503568A (zh) 一种社区划分方法、系统及设备
CN109274597A (zh) 一种业务专线的控制方法、装置及设备
CN109993646A (zh) 会计分录信息确定方法及装置、账务数据记录方法及装置
CN110428139A (zh) 基于标签传播的信息预测方法及装置
CN110351136A (zh) 一种故障定位方法和装置
CN109636181A (zh) 一种用户信用分计算方法及系统
CN110147940A (zh) 一种风险控制处理方法、设备、介质以及装置
CN109614415A (zh) 一种数据挖掘、处理方法、装置、设备及介质
CN105868216A (zh) 一种实现对象过期操作的方法、装置和设备
CN107977768A (zh) 一种可增值资源的评估方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20201021

Address after: 27 Hospital Road, George Town, Grand Cayman ky1-9008

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: 27 Hospital Road, George Town, Grand Cayman ky1-9008

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20201021

Address after: 27 Hospital Road, George Town, Grand Cayman ky1-9008

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230227

Address after: 801-10, Section B, 8th floor, 556 Xixi Road, Xihu District, Hangzhou City, Zhejiang Province

Applicant after: Ant financial (Hangzhou) Network Technology Co.,Ltd.

Address before: 27 Hospital Road, George Town, Grand Cayman ky1-9008

Applicant before: Innovative advanced technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant