CN108053241A - 数据分析方法、装置及计算机可读存储介质 - Google Patents

数据分析方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN108053241A
CN108053241A CN201711315154.XA CN201711315154A CN108053241A CN 108053241 A CN108053241 A CN 108053241A CN 201711315154 A CN201711315154 A CN 201711315154A CN 108053241 A CN108053241 A CN 108053241A
Authority
CN
China
Prior art keywords
user
data
terminal
bit string
intersection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711315154.XA
Other languages
English (en)
Other versions
CN108053241B (zh
Inventor
顾大伟
朱虹
孙善禄
谭安率
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN201711315154.XA priority Critical patent/CN108053241B/zh
Publication of CN108053241A publication Critical patent/CN108053241A/zh
Application granted granted Critical
Publication of CN108053241B publication Critical patent/CN108053241B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/06Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols the encryption apparatus using shift registers or memories for block-wise or stream coding, e.g. DES systems or RC4; Hash functions; Pseudorandom sequence generators
    • H04L9/0643Hash functions, e.g. MD5, SHA, HMAC or f9 MAC

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Power Engineering (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种数据分析方法、装置及计算机可读存储介质,属于互联网技术领域。方法包括:获取第一用户集合;获取多个第一比特串和每个第一比特串对应的多个第二比特串,每个第一比特串用于表示第一用户集合与一个第二终端的第二用户集合的交集,每个第二比特串用于表示每个交集中的一个子集,子集中的用户标识具有相同属性;根据多个第一比特串,获取第一用户集合中被多个第二终端的多个第二用户集合覆盖的用户标识的数量;根据每个第一比特串对应的多个第二比特串以及数量,获取第一用户集合中每种属性的用户标识的比例。本公开通过与多个提供标签数据的第二终端进行数据协作,可以得到更精准的计算结果。

Description

数据分析方法、装置及计算机可读存储介质
技术领域
本公开涉及互联网技术领域,尤其涉及一种数据分析方法、装置及计算机可读存储介质。
背景技术
随着互联网的发展,信息的传播模式发生了很大改变。广告投放是互联网比较常见的信息传播模式,广告主在网站上投放广告时,会对本次广告投放的受众人群有一定的标签要求,例如,该标签可以是性别,包括男和女两种属性,广告主可以要求受众人群中性别为男的比例、性别为女的比例。广告投放之后,广告主需要找第三方监测公司来分析本次广告投放的受众人群数据,得到受众人群的男女比例。
相关技术中,在需要分析受众人群数据时,第三方监测公司会与拥有丰富标签数据的数据公司合作,具体过程包括:第三方监测公司向该数据公司提供相关的受众人群ID(identification,标识),该数据公司可以利用已有的标签数据,计算出这些受众人群的男女比例,并将计算结果返回给该第三方监测公司。其中,数据公司已有的标签数据可以是多个ID对应的性别数据。
发明内容
本公开实施例提供了一种数据分析方法、装置及计算机可读存储介质,可以解决相关技术计算结果并不精准的问题。
根据本公开实施例的第一方面,提供一种数据分析方法,包括:
获取第一用户集合,所述第一用户集合包含多个用户标识;
获取多个第一比特串和每个第一比特串对应的多个第二比特串,每个第一比特串用于表示所述第一用户集合与一个第二终端的第二用户集合的交集,每个第二比特串用于表示每个交集中的一个子集,所述子集中的用户标识具有相同属性,所述第二用户集合包含多个可提供标签数据的用户标识,所述标签数据包含多种属性;
根据所述多个第一比特串,获取所述第一用户集合中被多个第二终端的多个第二用户集合覆盖的用户标识的数量;
根据所述每个第一比特串对应的多个第二比特串以及所述数量,获取所述第一用户集合中每种属性的用户标识的比例。
本公开实施例提供的方法,通过具有数据分析需求的第一终端与多个提供标签数据的第二终端进行数据协作,第一终端根据第一用户集合与多个第二用户集合的交集对应的多个第一比特串以及每个第一比特串对应的多个第二比特串,获取第一用户集合中被多个第二用户集合覆盖的用户标识的数量,进而获取每种属性的用户标识的比例。上述技术方案中多个第二终端仅将能够用于获取相关统计信息的比特串提供给第一终端,由第一终端根据这些比特串来进行计算,得到最终的计算结果。相比于一个第二终端的一个第二用户集合,该多个第二终端提供的多个第二用户集合可以覆盖第一用户集合中更多的用户标识,可以得到更精准的计算结果。
在第一方面的一种可能实现方式中,所述根据所述多个第一比特串,获取所述第一用户集合中被多个第二终端的多个第二用户集合覆盖的用户标识的数量之后,所述方法还包括:
根据所述数量以及所述第一用户集合中用户标识的数量,获取所述多个第二用户集合对所述第一用户集合中用户标识的覆盖率。
在第一方面的一种可能实现方式中,所述获取多个第一比特串和每个第一比特串对应的多个第二比特串,包括:
向所述多个第二终端发送数据匹配请求,所述数据匹配请求用于请求获取所述第一用户集合与多个第二用户集合的多个交集;
从所述多个第二终端获取所述多个第一比特串和所述每个第一比特串对应的多个第二比特串。
在第一方面的一种可能实现方式中,所述从所述多个第二终端获取所述多个第一比特串和所述每个第一比特串对应的多个第二比特串之前,所述方法还包括:
对所述第一用户集合进行加密,得到第一加密数据;
根据所述第一加密数据生成第一过滤算法,将所述第一过滤算法添加至数据共享系统中的区块链,以使所述多个第二终端基于所述第一过滤算法对多个第二加密数据进行过滤,得到多个第二数据,所述多个第二加密数据由所述多个第二终端对多个第二用户集合进行加密生成;
从所述区块链获取多个第二过滤算法,基于所述多个第二过滤算法对所述第一用户集合进行过滤,得到多个第一数据,所述多个第二过滤算法由所述多个第二终端根据所述多个第二数据生成并添加至所述区块链;
当任一个第二过滤算法对应的第一数据与第二数据一致时,将所述第一数据作为生成所述任一个第二过滤算法的第二终端的第二用户集合与所述第一用户集合的交集。
在第一方面的一种可能实现方式中,所述对所述第一用户集合进行加密,得到第一加密数据,包括:
利用消息摘要MD5算法,确定所述第一用户集合中每个用户标识对应的MD5值,将得到的MD5值集合作为所述第一加密数据。
根据本公开实施例的第二方面,提供一种数据分析方法,包括:
获取所述第二终端的第二用户集合与第一终端的第一用户集合的交集,所述第二用户集合包含多个可提供标签数据的用户标识,所述标签数据包含多种属性;
获取所述交集对应的第一比特串,所述第一比特串用于表示所述交集;
获取所述交集的多个子集,每个子集中的用户标识具有相同属性;
获取所述多个子集对应的多个第二比特串,每个第二比特串用于表示一个子集;
为所述第一终端提供所述第一比特串和所述多个第二比特串。
本公开实施例提供的方法,通过具有数据分析需求的第一终端与多个提供标签数据的第二终端进行数据协作,每个第二终端获取第二用户集合与第一终端的第一用户集合的交集,以及该交集中具有相同属性的用户标识组成的多个子集,进而获取用于表示该交集的第一比特串和表示该多个子集的第二比特串,使得第一终端可以根据该多个第二终端的多个第一比特串以及每个第一比特串对应的多个第二比特串,获取第一用户集合中被多个第二用户集合覆盖的用户标识的数量,进而获取每种属性的用户标识的比例。上述技术方案中多个第二终端仅将能够用于获取相关统计信息的比特串提供给第一终端,由第一终端根据这些比特串来进行计算,得到最终的计算结果。相比于一个第二终端的一个第二用户集合,该多个第二终端提供的多个第二用户集合可以覆盖第一用户集合中更多的用户标识,可以得到更精准的计算结果。
在第二方面的一种可能实现方式中,所述获取所述交集对应的第一比特串,包括:
使用Hyper LogLog算法,将所述交集转换为所述第一比特串。
在第二方面的一种可能实现方式中,所述获取所述交集的多个子集,包括:
将所述交集与所述第二用户集合的多个子集合进行交集运算,得到所述多个子集,每个子集合中的用户标识具有相同属性。
在第二方面的一种可能实现方式中,所述获取所述多个子集对应的多个第二比特串,包括:
对于每个子集,使用Hyper LogLog算法,将所述子集转换为第二比特串。
在第二方面的一种可能实现方式中,所述获取所述第二终端的第二用户集合与第一终端的第一用户集合的交集,包括:
接收所述第一终端发送的数据匹配请求,所述数据匹配请求用于请求获取所述第一用户集合与第二用户集合的交集;
对所述第二用户集合进行加密,得到第二加密数据;
从所述区块链获取第一过滤算法,基于所述第一过滤算法对所述第二加密数据进行过滤,得到第二数据,所述第一过滤算法由所述第一终端根据第一加密数据生成并添加至所述区块链;
根据所述第二数据生成第二过滤算法,将所述第二过滤算法添加至所述区块链,以使所述第一终端基于所述第二过滤算法对所述第一加密数据进行过滤,得到第一数据;
当所述第二数据与所述第一数据一致时,将所述第二数据作为所述交集。
在第二方面的一种可能实现方式中,所述对所述第二用户集合进行加密,得到第二加密数据,包括:
利用消息摘要MD5算法,确定所述第二用户集合中每个用户标识对应的MD5值,将得到的MD5值集合作为所述第二加密数据。
根据本公开实施例的第三方面,提供一种数据分析装置,包括:
第一获取模块,用于获取第一用户集合,所述第一用户集合包含多个用户标识;
第二获取模块,用于获取多个第一比特串和每个第一比特串对应的多个第二比特串,每个第一比特串用于表示所述第一用户集合与一个第二终端的第二用户集合的交集,每个第二比特串用于表示每个交集中的一个子集,所述子集中的用户标识具有相同属性,所述第二用户集合包含多个可提供标签数据的用户标识,所述标签数据包含多种属性;
第三获取模块,用于根据所述多个第一比特串,获取所述第一用户集合中被多个第二终端的多个第二用户集合覆盖的用户标识的数量;
第四获取模块,用于根据所述每个第一比特串对应的多个第二比特串以及所述数量,获取所述第一用户集合中每种属性的用户标识的比例。
在第三方面的一种可能实现方式中,所述装置还包括:
第五获取模块,用于根据所述数量以及所述第一用户集合中用户标识的数量,获取所述多个第二用户集合对所述第一用户集合中用户标识的覆盖率。
在第三方面的一种可能实现方式中,所述第二获取模块用于向所述多个第二终端发送数据匹配请求,所述数据匹配请求用于请求获取所述第一用户集合与多个第二用户集合的多个交集;从所述多个第二终端获取所述多个第一比特串和所述每个第一比特串对应的多个第二比特串。
在第三方面的一种可能实现方式中,所述第二获取模块还用于:
对所述第一用户集合进行加密,得到第一加密数据;
根据所述第一加密数据生成第一过滤算法,将所述第一过滤算法添加至数据共享系统中的区块链,以使所述多个第二终端基于所述第一过滤算法对多个第二加密数据进行过滤,得到多个第二数据,所述多个第二加密数据由所述多个第二终端对多个第二用户集合进行加密生成;
从所述区块链获取多个第二过滤算法,基于所述多个第二过滤算法对所述第一用户集合进行过滤,得到多个第一数据,所述多个第二过滤算法由所述多个第二终端根据所述多个第二数据生成并添加至所述区块链;
当任一个第二过滤算法对应的第一数据与第二数据一致时,将所述第一数据作为生成所述任一个第二过滤算法的第二终端的第二用户集合与所述第一用户集合的交集。
在第三方面的一种可能实现方式中,所述第二获取模块用于利用消息摘要MD5算法,确定所述第一用户集合中每个用户标识对应的MD5值,将得到的MD5值集合作为所述第一加密数据。
根据本公开实施例的第四方面,提供一种数据分析装置,包括:
第一获取模块,用于获取所述第二终端的第二用户集合与第一终端的第一用户集合的交集,所述第二用户集合包含多个可提供标签数据的用户标识,所述标签数据包含多种属性;
第二获取模块,用于获取所述交集对应的第一比特串,所述第一比特串用于表示所述交集;
第三获取模块,用于获取所述交集的多个子集,每个子集中的用户标识具有相同属性;
第四获取模块,用于获取所述多个子集对应的多个第二比特串,每个第二比特串用于表示一个子集;
提供模块,用于为所述第一终端提供所述第一比特串和所述多个第二比特串。
在第四方面的一种可能实现方式中,所述装置还包括:
所述第二获取模块用于使用Hyper LogLog算法,将所述交集转换为所述第一比特串。
在第四方面的一种可能实现方式中,所述第三获取模块用于将所述交集与所述第二用户集合的多个子集合进行交集运算,得到所述多个子集,每个子集合中的用户标识具有相同属性。
在第四方面的一种可能实现方式中,所述第四获取模块用于对于每个子集,使用Hyper LogLog算法,将所述子集转换为第二比特串。
在第四方面的一种可能实现方式中,所述第一获取模块用于:
接收所述第一终端发送的数据匹配请求,所述数据匹配请求用于请求获取所述第一用户集合与第二用户集合的交集;
对所述第二用户集合进行加密,得到第二加密数据;
从所述区块链获取第一过滤算法,基于所述第一过滤算法对所述第二加密数据进行过滤,得到第二数据,所述第一过滤算法由所述第一终端根据第一加密数据生成并添加至所述区块链;
根据所述第二数据生成第二过滤算法,将所述第二过滤算法添加至所述区块链,以使所述第一终端基于所述第二过滤算法对所述第一加密数据进行过滤,得到第一数据;
当所述第二数据与所述第一数据一致时,将所述第二数据作为所述交集。
在第四方面的一种可能实现方式中,所述第一获取模块用于利用消息摘要MD5算法,确定所述第二用户集合中每个用户标识对应的MD5值,将得到的MD5值集合作为所述第二加密数据。
根据本公开实施例的第五方面,提供一种数据分析装置,包括:
处理器;
用于存储处理器可执行的指令的存储器;
其中,所述处理器被配置为:
获取第一用户集合,所述第一用户集合包含多个用户标识;
获取多个第一比特串和每个第一比特串对应的多个第二比特串,每个第一比特串用于表示所述第一用户集合与一个第二终端的第二用户集合的交集,每个第二比特串用于表示每个交集中的一个子集,所述子集中的用户标识具有相同属性,所述第二用户集合包含多个可提供标签数据的用户标识,所述标签数据包含多种属性;
根据所述多个第一比特串,获取所述第一用户集合中被多个第二终端的多个第二用户集合覆盖的用户标识的数量;
根据所述每个第一比特串对应的多个第二比特串以及所述数量,获取所述第一用户集合中每种属性的用户标识的比例。
根据本公开实施例的第六方面,提供一种数据分析装置,包括:
处理器;
用于存储处理器可执行的指令的存储器;
其中,所述处理器被配置为:
获取所述第二终端的第二用户集合与第一终端的第一用户集合的交集,所述第二用户集合包含多个可提供标签数据的用户标识,所述标签数据包含多种属性;
获取所述交集对应的第一比特串,所述第一比特串用于表示所述交集;
获取所述交集的多个子集,每个子集中的用户标识具有相同属性;
获取所述多个子集对应的多个第二比特串,每个第二比特串用于表示一个子集;
为所述第一终端提供所述第一比特串和所述多个第二比特串。
根据本公开实施例的第七方面,提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的方法步骤。
根据本公开实施例的第八方面,提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第二方面所述的方法步骤。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种数据分析方法的流程图。
图2是根据一示例性实施例示出的一种数据分析方法的流程图。
图3是根据一示例性实施例示出的一种数据分析方法的流程图。
图4是根据一示例性实施例示出的一种数据分析方法的整体架构示意图。
图5是根据一示例性实施例示出的一种数据分析装置的框图。
图6是根据一示例性实施例示出的一种数据分析装置的框图。
图7是根据一示例性实施例示出的一种数据分析装置的框图。
图8是根据一示例性实施例示出的一种数据分析装置800的框图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种数据分析方法的流程图,如图1所示,数据分析方法用于第一终端中,包括以下步骤:
在步骤101中,获取第一用户集合,该第一用户集合包含多个用户标识。
在步骤102中,获取多个第一比特串和每个第一比特串对应的多个第二比特串,每个第一比特串用于表示该第一用户集合与一个第二终端的第二用户集合的交集,每个第二比特串用于表示每个交集中的一个子集,该子集中的用户标识具有相同属性,该第二用户集合包含多个可提供标签数据的用户标识,该标签数据包含多种属性。
在步骤103中,根据该多个第一比特串,获取该第一用户集合中被多个第二终端的多个第二用户集合覆盖的用户标识的数量。
在步骤104中,根据该每个第一比特串对应的多个第二比特串以及该数量,获取该第一用户集合中每种属性的用户标识的比例。
本公开实施例中,通过具有数据分析需求的第一终端与多个提供标签数据的第二终端进行数据协作,第一终端根据第一用户集合与多个第二用户集合的交集对应的多个第一比特串以及每个第一比特串对应的多个第二比特串,获取第一用户集合中被多个第二用户集合覆盖的用户标识的数量,进而获取每种属性的用户标识的比例。上述技术方案中多个第二终端仅将能够用于获取相关统计信息的比特串提供给第一终端,由第一终端根据这些比特串来进行计算,得到最终的计算结果。相比于一个第二终端的一个第二用户集合,该多个第二终端提供的多个第二用户集合可以覆盖第一用户集合中更多的用户标识,可以得到更精准的计算结果。
在一种可能实现方式中,该根据该多个第一比特串,获取该第一用户集合中被多个第二终端的多个第二用户集合覆盖的用户标识的数量之后,该方法还包括:
根据该数量以及该第一用户集合中用户标识的数量,获取该多个第二用户集合对该第一用户集合中用户标识的覆盖率。
在一种可能实现方式中,该获取多个第一比特串和每个第一比特串对应的多个第二比特串,包括:
向该多个第二终端发送数据匹配请求,该数据匹配请求用于请求获取该第一用户集合与多个第二用户集合的多个交集;
从该多个第二终端获取该多个第一比特串和该每个第一比特串对应的多个第二比特串。
在一种可能实现方式中,该从该多个第二终端获取该多个第一比特串和该每个第一比特串对应的多个第二比特串之前,该方法还包括:
对该第一用户集合进行加密,得到第一加密数据;
根据该第一加密数据生成第一过滤算法,将该第一过滤算法添加至数据共享系统中的区块链,以使该多个第二终端基于该第一过滤算法对多个第二加密数据进行过滤,得到多个第二数据,该多个第二加密数据由该多个第二终端对多个第二用户集合进行加密生成;
从该区块链获取多个第二过滤算法,基于该多个第二过滤算法对该第一用户集合进行过滤,得到多个第一数据,该多个第二过滤算法由该多个第二终端根据该多个第二数据生成并添加至该区块链;
当任一个第二过滤算法对应的第一数据与第二数据一致时,将该第一数据作为生成该任一个第二过滤算法的第二终端的第二用户集合与该第一用户集合的交集。
在一种可能实现方式中,该对该第一用户集合进行加密,得到第一加密数据,包括:
利用消息摘要MD5算法,确定该第一用户集合中每个用户标识对应的MD5值,将得到的MD5值集合作为该第一加密数据。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
图2是根据一示例性实施例示出的一种数据分析方法的流程图,如图2所示,数据分析方法用于第二终端中,包括以下步骤:
在步骤201中,获取该第二终端的第二用户集合与第一终端的第一用户集合的交集,该第二用户集合包含多个可提供标签数据的用户标识,该标签数据包含多种属性。
在步骤202中,获取该交集对应的第一比特串,该第一比特串用于表示该交集。
在步骤203中,获取该交集的多个子集,每个子集中的用户标识具有相同属性。
在步骤204中,获取该多个子集对应的多个第二比特串,每个第二比特串用于表示一个子集。
在步骤205中,为该第一终端提供该第一比特串和该多个第二比特串。
本公开实施例中,通过具有数据分析需求的第一终端与多个提供标签数据的第二终端进行数据协作,每个第二终端获取第二用户集合与第一终端的第一用户集合的交集,以及该交集中具有相同属性的用户标识组成的多个子集,进而获取用于表示该交集的第一比特串和表示该多个子集的第二比特串,使得第一终端可以根据该多个第二终端的多个第一比特串以及每个第一比特串对应的多个第二比特串,获取第一用户集合中被多个第二用户集合覆盖的用户标识的数量,进而获取每种属性的用户标识的比例。上述技术方案中多个第二终端仅将能够用于获取相关统计信息的比特串提供给第一终端,由第一终端根据这些比特串来进行计算,得到最终的计算结果。相比于一个第二终端的一个第二用户集合,该多个第二终端提供的多个第二用户集合可以覆盖第一用户集合中更多的用户标识,可以得到更精准的计算结果。
在一种可能实现方式中,该获取该交集对应的第一比特串,包括:
使用Hyper LogLog算法,将该交集转换为该第一比特串。
在一种可能实现方式中,该获取该交集的多个子集,包括:
将该交集与该第二用户集合的多个子集合进行交集运算,得到该多个子集,每个子集合中的用户标识具有相同属性。
在一种可能实现方式中,该获取该多个子集对应的多个第二比特串,包括:
对于每个子集,使用Hyper LogLog算法,将该子集转换为第二比特串。
在一种可能实现方式中,该获取该第二终端的第二用户集合与第一终端的第一用户集合的交集,包括:
接收该第一终端发送的数据匹配请求,该数据匹配请求用于请求获取该第一用户集合与第二用户集合的交集;
对该第二用户集合进行加密,得到第二加密数据;
从该区块链获取第一过滤算法,基于该第一过滤算法对该第二加密数据进行过滤,得到第二数据,该第一过滤算法由该第一终端根据第一加密数据生成并添加至该区块链;
根据该第二数据生成第二过滤算法,将该第二过滤算法添加至该区块链,以使该第一终端基于该第二过滤算法对该第一加密数据进行过滤,得到第一数据;
当该第二数据与该第一数据一致时,将该第二数据作为该交集。
在一种可能实现方式中,该对该第二用户集合进行加密,得到第二加密数据,包括:
利用消息摘要MD5算法,确定该第二用户集合中每个用户标识对应的MD5值,将得到的MD5值集合作为该第二加密数据。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
本公开实施例可以应用于具有数据分析需求的第一终端与提供标签数据的多个第二终端进行数据协作,实现数据分析的场景,具体应用于广告活动中通过多方协作分析广告曝光的受众人群的场景。可以理解的是,上述场景仅是本公开实施例的一个示例场景,本公开实施例提供的数据分析方法还可以应用于其他场景,在此不做限定。
图3是根据一示例性实施例示出的一种数据分析方法的流程图,基于第一终端与多个第二终端的交互,如图3所示,数据分析方法包括以下步骤:
在步骤301中,第一终端获取第一用户集合,该第一用户集合包含多个用户标识。
其中,用户标识可以是用户ID,如用户编号、账号、手机号、手机的MAC(MediaAccess Control,媒体访问控制)地址等,本公开实施例对此不做限定。
本公开实施例中,第一终端可以从本地存储中获取第一用户集合。例如,当某个广告主想要分析其投放的广告的受众人群时,可以预先将受众人群的ID提供给第一终端,第一终端可以将受众人群ID作为第一用户集合,保存到第一终端的本地存储中。当接收到数据分析指令时,第一终端可以执行获取第一用户集合的步骤,其中,该数据分析指令可以由第一终端的归属用户通过相应操作触发。
需要说明的是,第二终端也可以不在本地预先存储该第一用户集合,而在需要进行数据分析时,从其他设备获取该第一用户集合,本公开实施例对第一用户集合的来源以及获取第一用户集合的触发方式不做限定。
在步骤302中,第一终端对该第一用户集合进行加密,得到第一加密数据。
本公开实施例中,为了确定第一用户集合与第二终端的第二用户集合的交集,第一终端可以对第一用户集合进行加密,生成第一加密数据,以便后续生成第一过滤算法提供给多个第二终端,使得该多个第二终端可以基于该第一过滤算法对第二用户集合进行过滤。通过对第一用户集合进行加密处理,可以保护数据的隐私安全。
在一种可能实现方式中,第一终端对第一用户集合进行加密的过程可以包括:第一终端利用MD5(Message-Digest Algorithm 5,信息摘要算法5)算法,确定该第一用户集合中每个用户标识对应的MD5值,将得到的MD5值集合作为该第一加密数据。
需要说明的是,除了MD5算法以外,第一终端还可以采用其他加密算法对第一用户集合进行加密处理,本公开实施例对此不做限定。
在步骤303中,第一终端根据该第一加密数据生成第一过滤算法,将该第一过滤算法添加至数据共享系统中的区块链。
其中,第一过滤算法可以提供为一个过滤器,具体可以为Bloom Filter(布隆过滤器)。数据共享系统是指用于节点与节点之间共享数据,确定节点与节点之间的交集数据的系统。数据共享系统中的每个节点均存储有一条相同的区块链,该区块链上的全部节点可以共享区块链上的所有数据。当任一节点向区块链中添加诸如过滤算法等数据时,区块链上的其他节点可以从该区块链上获取到该数据。
本公开实施例中,区块链上可以包括第一节点和多个第二节点,其中,第一节点对应第一终端,第一节点可以将第一终端上传的数据(如过滤算法)添加至区块链,供其他节点获取后发送给对应的终端。每个第二节点对应一个第二终端,第二节点可以将第二终端上传的数据(如过滤算法)添加至区块链,供其他节点获取后发送给对应的终端。因此,第一终端和第二终端分别可以通过第一节点和第二节点实现将数据添加至区块链的过程。
在该步骤303中,第一终端生成第一过滤算法后,可以将该第一过滤算法发送给区块链上的第一节点,由该第一节点将该第一过滤算法添加至该区块链。
在步骤304中,第一终端向多个第二终端发送数据匹配请求,该数据匹配请求用于请求获取第一用户集合与多个第二用户集合的多个交集,该第二用户集合包含多个可提供标签数据的用户标识,该标签数据包含多种属性。
本公开实施例中,第一终端可以采用发送数据匹配请求的方式,分别请求与每个第二终端进行数据匹配,以获取第一用户集合与多个第二用户集合的多个交集。
对于任一个第二终端,第一用户集合与该第二终端的第二用户集合的交集可以是指第一用户集合与该第二用户集合共同包含的用户标识。其中,该第二用户集合可以包含多个可提供标签数据的用户标识,标签数据包含多种属性,例如,标签数据可以是gender(性别),包含Male(男)和Female(女)两种属性。当然,除了性别以外,标签数据还可以是其他类型,如年龄段,包含20~30岁、30~50岁、50~60岁等多种属性,本公开实施例对此不做限定。
需要说明的是,该步骤304可以在步骤303之后进行,也可以在执行步骤302至步骤303生成第一过滤算法的过程中执行,也可在执行步骤303中生成第一过滤算法后添加至区块链之前执行,或在执行步骤303中将第一过滤算法添加至区块链之后执行,本公开对第一终端向第二终端发送数据匹配请求的时机不做具体限定。
在步骤305中,对于每个第二终端,当接收到第一终端发送的数据匹配请求时,该第二终端对第二用户集合进行加密,得到第二加密数据。
本公开实施例中,第二用户集合可以用于第二终端与第一终端的第一用户集合进行匹配,以确定第一用户集合与第二用户集合共同包含的用户标识。
对于每个第二终端,当接收到第一终端发送的数据匹配请求时,该第二终端可以触发数据的匹配过程,包括该步骤305至后续步骤309。
该步骤305与步骤302中第一终端对第一用户集合进行加密的过程同理,具体地,第二终端可以利用MD5算法,确定第二终端的第二用户集合中每个用户标识对应的MD5值,将得到的MD5值集合作为该第二加密数据。
在步骤306中,第二终端从该区块链获取第一过滤算法,基于该第一过滤算法对该第二加密数据进行过滤,得到第二数据。
本公开实施例中,当第一终端将第一过滤算法添加至区块链后,第二终端可以从该区块链获取第一过滤算法。具体地,第二终端可以通过第二节点从区块链上获取该第一过滤算法。由于区块链上的各个节点之间可以实现数据共享,当第一终端通过第一节点将第一过滤算法添加至区块链后,第二终端对应的第二节点可以从该区块链上获取该第一过滤算法,进而将该第一过滤算法发送给第二终端,使得第二终端可以基于第一过滤算法对第二加密数据进行过滤,得到第二数据。
其中,第二终端在基于第一过滤算法对第二加密数据进行过滤时,第二终端可将第二加密数据中与第一加密数据不匹配的数据过滤掉,将当前确定的第二加密数据中可能与第一加密数据匹配的数据作为第二数据。
在步骤307中,第二终端根据该第二数据生成第二过滤算法,将该第二过滤算法添加至该区块链。
在本公开实施例中,第二终端根据第二数据生成第二过滤算法的过程与第一终端生成第一过滤算法的过程同理,第二终端生成第二过滤算法后,可以将该第二过滤算法发送给区块链上的第二节点,由该第二节点添加至该区块链。
在步骤308中,第一终端从该区块链获取第二过滤算法,基于该第二过滤算法对该第一加密数据进行过滤,得到第一数据。
在本公开实施例中,当第二终端将第二过滤算法添加至区块链后,第一终端可以从该区块链获取第二过滤算法。
在该步骤308中,第一终端可以通过第一节点从区块链上获取该第二过滤算法。由于区块链上的每个节点可以实现数据共享,当第二终端通过第二节点将第二过滤算法添加至区块链后,第一终端对应的第一节点可以从该区块链上获取该第二过滤算法,进而将该第二过滤算法发送给第一终端,使得第一终端可以基于第二过滤算法对第一加密数据进行过滤,得到第一数据。
其中,第一终端在基于第二过滤算法对第一加密数据进行过滤得到第一数据的过程与上述步骤306中第二终端得到第二数据的过程同理,在此不做赘述。
在步骤309中,当该第一数据与该第二数据一致时,第二终端将该第二数据作为第一用户集合与第二用户集合的交集。
在本公开实施例中,当第一数据与第二数据一致时,说明第一数据为第一用户集合与第二用户集合的交集。
可选地,第二终端在获取第一用户集合和第二用户集合的交集后,可以通过第二节点和第一节点将获取的交集共享给第一终端,例如,第二终端可以将该交集发送给区块链上的第二节点,由第二节点将该交集添加至区块链,使得区块链上的第一节点可以获取该交集后,发送给该第一节点对应的第一终端。
需要说明的是,该步骤309仅以交集的确定由第二终端执行为例进行说明,实际上,也可以由第一终端执行,这样,当第一终端确定第一数据和第二数据一致时,第一终端可以将第一数据作为该交集,并通过第一节点和第二节点将该交集共享给第二终端。例如,第一终端可以将该交集发送给区块链上的第一节点,由第一节点将该交集添加至区块链,使得区块链上的第二节点可以获取该交集后,发送给该第二节点对应的第二终端。
当然,交集的确定也可以由第二终端和第一终端同时执行,本公开实施例对此不做限定。
需要说明的是,该步骤309是以第一数据与第二数据一致为例进行说明,实际上,当第一数据与第二数据不一致时,说明当前还未确定第一用户集合与第二用户集合的交集,需要第一终端继续基于第一数据生成第三过滤算法,通过第一节点将第三过滤算法添加至区块链,以使第二终端基于第三过滤算法对第二数据进行过滤,并重复执行上述生成过滤算法并对数据进行过滤的过程,直至第一终端得到的过滤后的数据与第二节点得到的过滤后的数据一致时,确定第一用户集合与第二用户集合的交集为止。
上述步骤302至步骤309是确定第一用户集合与第二用户集合的交集,即第一用户集合和第二用户集合共同包含的用户标识。该整个过程通过数据共享系统的区块链实现,第一终端仅需公开根据第一用户集合生成的过滤算法,第二终端仅需公开根据第二用户集合生成的过滤算法,参与方无需公开原始数据,保证了参与方的数据隐私安全。
需要说明的是,上述步骤302至步骤309是第一终端和第二终端获取交集的过程,对于多个第二终端中的每个第二终端,均执行上述步骤302至步骤309中第二终端执行的步骤。
也即是,第一终端和多个第二终端获取交集的过程可以包括:第一终端对该第一用户集合进行加密,得到第一加密数据;根据该第一加密数据生成第一过滤算法,将该第一过滤算法添加至数据共享系统中的区块链;多个第二终端基于该第一过滤算法对多个第二加密数据进行过滤,得到多个第二数据,该多个第二加密数据由该多个第二终端对多个第二用户集合进行加密生成;第一终端从该区块链获取多个第二过滤算法,基于该多个第二过滤算法对该第一用户集合进行过滤,得到多个第一数据,该多个第二过滤算法由该多个第二终端根据该多个第二数据生成并添加至该区块链;当任一个第二过滤算法对应的第一数据与第二数据一致时,第一终端将该第一数据作为生成该任一个第二过滤算法的第二终端的第二用户集合与该第一用户集合的交集。
通过基于区块链的可信数据交换方案,获取第一终端的第一用户集合与多个第二终端的多个第二用户集合的多个交集,在保护参与方数据隐私的同时实现数据协作。
在步骤310中,对于每个第二终端,该第二终端在获取第二用户集合与第一用户集合的交集后,获取该交集对应的第一比特串,该第一比特串用于表示该交集。
其中,第一比特串可以是二进制比特串,第一比特串可用于获取该交集的统计信息。
本公开实施例中,第二终端得到的交集是第一终端的第一用户集合与第二终端的第二用户集合共同包含的用户标识,为了便于统计这些用户标识的数量,第二终端可以将该交集用比特串的形式来表示。
在一种可能实现方式中,第二终端可以使用Hyper LogLog算法,将该交集转换为该第一比特串。例如,交集转换成的第一比特串为00001111,该比特串中第一次出现1的位置为4,那么该交集的基数为16,说明该交集中包含16个不同的用户标识,也说明第二终端可以提供该16个用户标识的标签数据。
在步骤311中,该第二终端获取该交集的多个子集,每个子集中的用户标识具有相同属性。
本公开实施例中,第二终端的第二用户集合可以包含多个子集合,每个子集合中的用户标识具有相同属性,不同子集合对应不同属性。第二终端可以将该交集与该第二用户集合的多个子集合进行交集运算,得到该交集的多个子集,其中,每个子集对应一种属性。
以标签数据为gender为例,第二用户集合可以包含两个子集合,如第一子集合和第二子集合。第一子集合中用户标识的属性均为Female属性,第二子集合中用户标识的属性均为Male属性。第二终端可以将第一用户集合和第二用户集合的交集与第一子集合进行交集运算,得到该交集的第一子集,该第一子集中的用户标识均为Female属性;第二终端可以将第一用户集合和第二用户集合的交集与第二子集合进行交集运算,得到该交集的第二子集,该第二子集中的用户标识均为male属性。
在步骤312中,该第二终端获取该多个子集对应的多个第二比特串,每个第二比特串用于表示一个子集。
本公开实施例中,第二终端得到的每个子集是第二终端可以为第一终端提供标签数据的用户标识中,具有相同属性的用户标识组成的集合,为了便于统计每种属性的用户标识的数量,第二终端可以将每个子集用比特串的形式来表示。
在一种可能实现方式中,对于每个子集,第二终端可以使用Hyper LogLog算法,将该子集转换为第二比特串。第二终端可以将得到的多个第二比特串存储在本地。由步骤311可知,每个子集对应一种属性,故每个第二比特串也对应一种属性。
需要说明的是,上述步骤312和步骤311是以第二终端先获取多个子集后,再获取多个第二比特串为例进行说明,实际上,第二终端也可以先获取一个子集,然后获取该子集对应的第二比特串,再获取另一个子集后,获取该另一个子集对应的第二比特串,以此类推,获取到多个子集和多个子集对应的多个第二比特串。
需要说明的是,上述步骤310至步骤312是第二终端获取第一用户集合和第二用户集合的交集以及该交集的多个子集的过程,对于多个第二终端中的每个第二终端,均执行上述步骤310至步骤312。
在步骤313中,多个第二终端为第一终端提供多个第一比特串和每个第一比特串对应的多个第二比特串。
本公开实施例中,第一终端和每个第二终端均可以维护一个IPFS(InterPlanetary File System,星际文件系统)系统中的IPFS节点,为了便于描述,将第一终端的IPFS节点称为第一IPFS节点,将第二终端的IPFS节点称为第二IPFS节点。该IPFS系统是一种分布式文件存储系统,该IPFS系统可以结合区块链,为该IPFS系统的各个IPFS节点提供数据服务,例如,每个IPFS节点可以基于区块链和IPFS网络,获取其他IPFS节点上存储的数据。
在一种可能实现方式中,多个第二终端为第一终端提供多个第一比特串和每个第一比特串对应的多个第二比特串的过程可以包括:对于每个第二终端,该第二终端在获取第一比特串和多个第二比特串后,可以通过第二IPFS节点在本地存储该第一比特串和多个第二比特串,分别生成该第一比特串和多个第二比特串的地址信息。其中,该地址信息可以为间接地址信息,如该第一比特串和多个第二比特串的hash值。
进而,该第二终端可以将该第一比特串和多个第二比特串的地址信息添加至区块链,例如该第二终端可以通过区块链上的第二节点将地址信息添加至区块链。第一终端可以通过区块链上的第一节点获取每个第二终端的第一比特串和多个第二比特串的地址信息。
进而,第一终端可以根据地址信息,从第二终端的第二IPFS节点获取第一比特串和多个第二比特串。具体地,第一终端可以根据第一比特串和多个第二比特串的地址信息,如hash值,通过对该hash值进行hash运算,即可得到第一比特串和多个第二比特串在第二终端的存储位置,进而通过第一IPFS节点从该存储位置获取第一比特串和多个第二比特串。例如,第一IPFS节点可以利用IPFS网络的比特流协议,从第二IPFS节点的该存储位置获取该第二终端的第一比特串和多个第二比特串。通过上述过程,第一终端可以从多个第二终端获取多个第一比特串和每个第一比特串对应的多个第二比特串。
在步骤314中,第一终端获取多个第一比特串和每个第一比特串对应的多个第二比特串后,根据该多个第一比特串,获取该第一用户集合中被多个第二终端的多个第二用户集合覆盖的用户标识的数量。
由步骤311可知,每个第一比特串可以用于表示第一用户集合与每个第二用户集合的交集,考虑到每个第二用户集合可以提供标签数据的用户标识有限,即使多个第二终端提供多个第二用户集合,也可能不能完全覆盖第一用户集合中的每个用户标识。
因此,为了确定多个第二用户集合可以覆盖的用户标识,第一终端可以对多个第一比特串进行并集运算,得到第一用户集合中被多个第二用户集合覆盖的用户标识的数量。
可选地,第一终端还可以根据该第一用户集合中被覆盖的用户标识的数量以及该第一用户集合中用户标识的数量,获取该多个第二用户集合对该第一用户集合中用户标识的覆盖率。具体地,第一终端可以用被覆盖的用户标识的数量除以第一用户集合中用户标识的数量,得到覆盖率。
以A和B两个第二终端为例,覆盖率可以用下式(1)来表示:
matchRate=|ALLA∪ALLB|/TALineCount (1)
其中,matchRate为覆盖率,ALLA为终端A对应的第一比特串,ALLB为终端B对应的第一比特串,∪为比特串的并集运算,|ALLA∪ALLB|表示并集运算后的结果数量,即第一用户集合中被覆盖的用户标识的数量,TALineCount为第一用户集合中用户标识的数量。
在步骤315中,根据该每个第一比特串对应的多个第二比特串以及该第一用户集合中被覆盖的用户标识的数量,获取该第一用户集合中每种属性的用户标识的比例。
从上述步骤312可知,每个第二比特串对应一种属性。对于每种属性,第一终端可以从每个第二终端的多个第二比特串中选出一个该属性对应的第二比特串,从而得到该属性对应的多个第二比特串。
进而,第一终端可以对该属性对应的多个第二比特串进行并集运算,得到第一用户集合被覆盖的用户标识中具有该属性的用户标识的数量。
考虑到有的第二终端提供的标签数据可能不准确,导致该属性的用户标识判断有误,故第一终端可以从多个第二终端中选择一个优先级最高的第二终端,并对该优先级最高的第二终端中该属性对应的第二比特串,以及其他第二终端中除该属性以外的其他属性对应的第二比特串进行交集运算,以得到第一用户集合被覆盖的用户标识中被误判为该属性的用户标识的数量。
进一步地,第一终端可以将第一用户集合被覆盖的用户标识中具有该属性的用户标识的数量减去被误判为该属性的用户标识的数量,再将得到的数量除以第一用户集合中被覆盖的用户标识的数量,得到第一用户集合中具有该属性的用户标识的比例。
以Female和Male两种属性为例,对于Female属性,第一终端可以从终端A中选择Female属性对应的第二比特串,表示为FemaleA;从终端B中选择Female属性对应的第二比特串,表示为FemaleB。对于male属性,第一终端可以从终端A中选择Male属性对应的第二比特串,表示为maleA;从终端B中选择Male属性对应的第二比特串,表示为MaleB
以终端A的优先级高于终端B为例,第一用户集合中male属性的用户标识的比例可以用下式(2)来表示:
maleRate=(|MaleA∪MaleB|-|FemaleA∩MaleB|)/|ALLAUALLB| (2)
其中,maleRate为Male属性的用户标识的比例,U为比特串的并集运算,∩为比特串的交集运算,|ALLAUALLB|表示第一用户集合中被覆盖的用户标识的数量,|MaleAUMaleB|表示被覆盖的用户标识中具有Male属性的用户标识的数量,|FemaleA∩MaleB|表示被误判为Male属性的用户标识的数量。
第一用户集合中Female属性的用户标识的比例可以用下式(3)来表示:
FemaleRate=(|FemaleAUFemaleB|-|MaleA∩FemaleB|)/|ALLAUALLB| (3)
其中,FemaleRate为Female属性的用户标识的比例,|ALLAUALLB|表示第一用户集合中被覆盖的用户标识的数量,|FemaleA∪FemaleB|表示被覆盖的用户标识中具有Female属性的用户标识的数量,|FemaleA∩MaleB|表示被误判为Female属性的用户标识的数量。
需要说明的是,上述步骤314至步骤315是第一终端根据每个第二终端对应的第一比特串和多个第二比特串,获取该第一用户集合中每种属性的用户标识比例的过程。上述过程中,第一终端通过上述式(1)至(3)所示的聚合算法,对每个第二终端对应的第一比特串和多个第二比特串进行聚合计算,得到该第一用户集合中每种属性的用户标识的比例,基于HyperLogLog算法实现交集、并集计算,可以保护参与方的隐私数据。
可以理解的是,上述式(1)至(3)仅是聚合算法的一个简单示例,实际上,第一终端还可以通过其他聚合算法来获取每种属性的用户标识的比例,也即是,聚合算法可插拔,实际应用中聚合算法可以根据场景重新定义,或者升级,不局限于上文提出的聚合算法。本公开实施例提供了一种可信、安全的数据协作方案,在保护参与方数据隐私的同时完成数据协作。实际场景中联合多家数据公司协同计算出更精准的结果,打破了由于数据隐私而造成的数据孤岛,实现数据协作发挥数据更大的潜力。
本公开实施例中,通过具有数据分析需求的第一终端与多个提供标签数据的第二终端进行数据协作,每个第二终端获取第二用户集合与第一终端的第一用户集合的交集,以及该交集中具有相同属性的用户标识组成的多个子集,进而获取用于表示该交集的第一比特串和表示该多个子集的第二比特串,使得第一终端可以根据该多个第二终端的多个第一比特串以及每个第一比特串对应的多个第二比特串,获取第一用户集合中被多个第二用户集合覆盖的用户标识的数量,进而获取每种属性的用户标识的比例。上述技术方案中多个第二终端仅将能够用于获取相关统计信息的比特串提供给第一终端,由第一终端根据这些比特串来进行计算,得到最终的计算结果。相比于一个第二终端的一个第二用户集合,该多个第二终端提供的多个第二用户集合可以覆盖第一用户集合中更多的用户标识,可以得到更精准的计算结果。
了便于更直观的理解本公开实施例提供的数据分析方法,下面将结合图4提供的一种数据分析方法的整体架构示意图,以具有数据分析需求的第一终端为终端A(第一用户集合为目标受众人群ID,简称TA数据)、提供标签数据的两个第二终端为终端A和终端B、标签数据为gender(包括male和Female两种属性)为例,举出本公开实施例的一个实际应用场景,基于该场景对上述技术方案进行解释说明。图4中End-user C是指终端C的归属用户,End-user A(Provider)是指终端A的归属用户,End-user B(Provider)是指终端B的归属用户,IPFS-Node C是指终端C维护的IPFS节点,IPFS-Node A是指终端A维护的IPFS节点,IPFS-Node B是指终端B维护的IPFS节点,Peer是指区块链上的节点,各个终端维护的IPFS节点可以通过IPFS网络进行通信。终端A或终端B中的All是指终端A可以提供标签数据的所有用户标识,Male是指所有用户标识中属性为Male的用户标识,Male是指所有用户标识中属性为Male的用户标识,Female是指所有用户标识中属性为Female的用户标识。
如图4中①所示,终端C可以获取该TA数据,对该TA数据进行加密后,得到TA数据摘要,该TA数据和TA数据摘要的数据行数为TALineCount,该过程对应图3所示实施例中的步骤301和步骤302。
如图4中②所示,终端C可以根据该TA数据摘要生成第一过滤算法后添加至区块链,如发送给区块链上的第一节点,该过程对应图3所示实施例中的步骤301至步骤303;
另外,终端C可以选择2个现有的终端A和终端B(提供gender数据)发起数据分析过程,此时,终端C会分别请求与A和B的gender数据做匹配,该过程对应图3所示实施例中的步骤304;
相应地,终端A可以响应终端C的请求,通过区块链完成数据匹配,结果为A_matched_all;终端B可以响应终端C的请求,通过区块链完成数据匹配,结果为B_matched_all,该过程对应图3所示实施例中的步骤305至步骤309。
如图4中③所示,终端A可以计算A_matched_all的HyperLogLog结果为ALLA,并通过将A_matched_all与本地Male标签数据交集得到结果数据A_matched_male,计算HyperLogLog结果为MaleA;通过将A_matched_all与本地Female标签数据交集得到结果数据A_matched_Female,计算HyperLogLog结果为FemaleA;该过程对应图3所示实施例中的步骤310至步骤312。
如图4中④所示,终端B可以计算B_matched_all的HyperLogLog结果为ALLB,并通过将B_matched_all与本地Male标签数据交集得到结果数据B_matched_male,计算HyperLogLog结果为MaleB;通过将B_matched_all与本地Female标签数据交集得到结果数据B_matched_Female,计算HyperLogLog结果为FemaleB;该过程对应图3所示实施例中的步骤310至步骤312。
如图4中⑤所示,终端C获取到A的HyperLogLog结果(ALLA、MaleA、FemaleA)以及B的HyperLogLog结果(ALLB、MaleB、FemaleB)后,可以对数据进行聚合计算,得到matchRate、MaleRate和FemaleRate,该过程对应图3所示实施例中的步骤313至步骤315。
图5是根据一示例性实施例示出的一种数据分析装置的框图。参照图5,该装置包括第一获取模块501、第二获取模块502、第三获取模块503和第四获取模块504。
第一获取模块501被配置为获取第一用户集合,该第一用户集合包含多个用户标识;
第二获取模块502被配置为获取多个第一比特串和每个第一比特串对应的多个第二比特串,每个第一比特串被配置为表示该第一用户集合与一个第二终端的第二用户集合的交集,每个第二比特串被配置为表示每个交集中的一个子集,该子集中的用户标识具有相同属性,该第二用户集合包含多个可提供标签数据的用户标识,该标签数据包含多种属性;
第三获取模块503被配置为根据该多个第一比特串,获取该第一用户集合中被多个第二终端的多个第二用户集合覆盖的用户标识的数量;
第四获取模块504被配置为根据该每个第一比特串对应的多个第二比特串以及该数量,获取该第一用户集合中每种属性的用户标识的比例。
在一种可能实现方式中,参见图6,该装置还包括:
第五获取模块505,被配置为根据该数量以及该第一用户集合中用户标识的数量,获取该多个第二用户集合对该第一用户集合中用户标识的覆盖率。
在一种可能实现方式中,该第二获取模块被配置为向该多个第二终端发送数据匹配请求,该数据匹配请求被配置为请求获取该第一用户集合与多个第二用户集合的多个交集;从该多个第二终端获取该多个第一比特串和该每个第一比特串对应的多个第二比特串。
在一种可能实现方式中,该第二获取模块502还被配置为:
对该第一用户集合进行加密,得到第一加密数据;
根据该第一加密数据生成第一过滤算法,将该第一过滤算法添加至数据共享系统中的区块链,以使该多个第二终端基于该第一过滤算法对多个第二加密数据进行过滤,得到多个第二数据,该多个第二加密数据由该多个第二终端对多个第二用户集合进行加密生成;
从该区块链获取多个第二过滤算法,基于该多个第二过滤算法对该第一用户集合进行过滤,得到多个第一数据,该多个第二过滤算法由该多个第二终端根据该多个第二数据生成并添加至该区块链;
当任一个第二过滤算法对应的第一数据与第二数据一致时,将该第一数据作为生成该任一个第二过滤算法的第二终端的第二用户集合与该第一用户集合的交集。
在一种可能实现方式中,该第二获取模块502被配置为利用消息摘要MD5算法,确定该第一用户集合中每个用户标识对应的MD5值,将得到的MD5值集合作为该第一加密数据。
本公开实施例中,通过具有数据分析需求的第一终端与多个提供标签数据的第二终端进行数据协作,第一终端根据第一用户集合与多个第二用户集合的交集对应的多个第一比特串以及每个第一比特串对应的多个第二比特串,获取第一用户集合中被多个第二用户集合覆盖的用户标识的数量,进而获取每种属性的用户标识的比例。上述技术方案中多个第二终端仅将能够用于获取相关统计信息的比特串提供给第一终端,由第一终端根据这些比特串来进行计算,得到最终的计算结果。相比于一个第二终端的一个第二用户集合,该多个第二终端提供的多个第二用户集合可以覆盖第一用户集合中更多的用户标识,可以得到更精准的计算结果。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图7是根据一示例性实施例示出的一种数据分析装置的框图。参照图7,该装置包括第一获取模块701、第二获取模块702、第三获取模块703、第四获取模块704和提供模块705。
第一获取模块701被配置为获取该第二终端的第二用户集合与第一终端的第一用户集合的交集,该第二用户集合包含多个可提供标签数据的用户标识,该标签数据包含多种属性;
第二获取模块702被配置为获取该交集对应的第一比特串,该第一比特串被配置为表示该交集;
第三获取模块703被配置为获取该交集的多个子集,每个子集中的用户标识具有相同属性;
第四获取模块704被配置为获取该多个子集对应的多个第二比特串,每个第二比特串被配置为表示一个子集;
提供模块705被配置为该第一终端提供该第一比特串和该多个第二比特串。
在一种可能实现方式中,该第二获取模块702被配置为使用Hyper LogLog算法,将该交集转换为该第一比特串。
在一种可能实现方式中,该第三获取模块703被配置为将该交集与该第二用户集合的多个子集合进行交集运算,得到该多个子集,每个子集合中的用户标识具有相同属性。
在一种可能实现方式中,该第四获取模块704被配置为对于每个子集,使用HyperLogLog算法,将该子集转换为第二比特串。
在一种可能实现方式中,该第一获取模块701被配置为:
接收该第一终端发送的数据匹配请求,该数据匹配请求被配置为请求获取该第一用户集合与第二用户集合的交集;
对该第二用户集合进行加密,得到第二加密数据;
从该区块链获取第一过滤算法,基于该第一过滤算法对该第二加密数据进行过滤,得到第二数据,该第一过滤算法由该第一终端根据第一加密数据生成并添加至该区块链;
根据该第二数据生成第二过滤算法,将该第二过滤算法添加至该区块链,以使该第一终端基于该第二过滤算法对该第一加密数据进行过滤,得到第一数据;
当该第二数据与该第一数据一致时,将该第二数据作为该交集。
在一种可能实现方式中,该第一获取模块701被配置为利用消息摘要MD5算法,确定该第二用户集合中每个用户标识对应的MD5值,将得到的MD5值集合作为该第二加密数据。
本公开实施例中,通过具有数据分析需求的第一终端与多个提供标签数据的第二终端进行数据协作,每个第二终端获取第二用户集合与第一终端的第一用户集合的交集,以及该交集中具有相同属性的用户标识组成的多个子集,进而获取用于表示该交集的第一比特串和表示该多个子集的第二比特串,使得第一终端可以根据该多个第二终端的多个第一比特串以及每个第一比特串对应的多个第二比特串,获取第一用户集合中被多个第二用户集合覆盖的用户标识的数量,进而获取每种属性的用户标识的比例。上述技术方案中多个第二终端仅将能够用于获取相关统计信息的比特串提供给第一终端,由第一终端根据这些比特串来进行计算,得到最终的计算结果。相比于一个第二终端的一个第二用户集合,该多个第二终端提供的多个第二用户集合可以覆盖第一用户集合中更多的用户标识,可以得到更精准的计算结果。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图8是根据一示例性实施例示出的一种数据分析装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图8,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述数据分析方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,非临时性计算机可读存储介质可以是只读内存(ROM)、随机存取存储器(RAM)、只读光盘(CD-ROM)、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种存储有计算机程序的计算机可读存储介质,例如存储有计算机程序的存储器,上述计算机程序被处理器执行时实现上述图1、图2或图3对应的实施例中的数据分析方法。例如,计算机可读存储介质可以是只读内存(ROM)、随机存取存储器(RAM)、只读光盘(CD-ROM)、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (22)

1.一种数据分析方法,其特征在于,应用于第一终端,所述方法包括:
获取第一用户集合,所述第一用户集合包含多个用户标识;
获取多个第一比特串和每个第一比特串对应的多个第二比特串,每个第一比特串用于表示所述第一用户集合与一个第二终端的第二用户集合的交集,每个第二比特串用于表示每个交集中的一个子集,所述子集中的用户标识具有相同属性,所述第二用户集合包含多个可提供标签数据的用户标识,所述标签数据包含多种属性;
根据所述多个第一比特串,获取所述第一用户集合中被多个第二终端的多个第二用户集合覆盖的用户标识的数量;
根据所述每个第一比特串对应的多个第二比特串以及所述数量,获取所述第一用户集合中每种属性的用户标识的比例。
2.根据权利要求1所述的方法,其特征在于,所述根据所述多个第一比特串,获取所述第一用户集合中被多个第二终端的多个第二用户集合覆盖的用户标识的数量之后,所述方法还包括:
根据所述数量以及所述第一用户集合中用户标识的数量,获取所述多个第二用户集合对所述第一用户集合中用户标识的覆盖率。
3.根据权利要求1所述的方法,其特征在于,所述获取多个第一比特串和每个第一比特串对应的多个第二比特串,包括:
向所述多个第二终端发送数据匹配请求,所述数据匹配请求用于请求获取所述第一用户集合与多个第二用户集合的多个交集;
从所述多个第二终端获取所述多个第一比特串和所述每个第一比特串对应的多个第二比特串。
4.根据权利要求3所述的方法,其特征在于,所述从所述多个第二终端获取所述多个第一比特串和所述每个第一比特串对应的多个第二比特串之前,所述方法还包括:
对所述第一用户集合进行加密,得到第一加密数据;
根据所述第一加密数据生成第一过滤算法,将所述第一过滤算法添加至数据共享系统中的区块链,以使所述多个第二终端基于所述第一过滤算法对多个第二加密数据进行过滤,得到多个第二数据,所述多个第二加密数据由所述多个第二终端对多个第二用户集合进行加密生成;
从所述区块链获取多个第二过滤算法,基于所述多个第二过滤算法对所述第一用户集合进行过滤,得到多个第一数据,所述多个第二过滤算法由所述多个第二终端根据所述多个第二数据生成并添加至所述区块链;
当任一个第二过滤算法对应的第一数据与第二数据一致时,将所述第一数据作为生成所述任一个第二过滤算法的第二终端的第二用户集合与所述第一用户集合的交集。
5.根据权利要求4所述的方法,其特征在于,所述对所述第一用户集合进行加密,得到第一加密数据,包括:
利用消息摘要MD5算法,确定所述第一用户集合中每个用户标识对应的MD5值,将得到的MD5值集合作为所述第一加密数据。
6.一种数据分析方法,其特征在于,应用于第二终端,所述方法包括:
获取所述第二终端的第二用户集合与第一终端的第一用户集合的交集,所述第二用户集合包含多个可提供标签数据的用户标识,所述标签数据包含多种属性;
获取所述交集对应的第一比特串,所述第一比特串用于表示所述交集;
获取所述交集的多个子集,每个子集中的用户标识具有相同属性;
获取所述多个子集对应的多个第二比特串,每个第二比特串用于表示一个子集;
为所述第一终端提供所述第一比特串和所述多个第二比特串。
7.根据权利要求6所述的方法,其特征在于,所述获取所述交集的多个子集,包括:
将所述交集与所述第二用户集合的多个子集合进行交集运算,得到所述多个子集,每个子集合中的用户标识具有相同属性。
8.根据权利要求6所述的方法,其特征在于,所述获取所述第二终端的第二用户集合与第一终端的第一用户集合的交集,包括:
接收所述第一终端发送的数据匹配请求,所述数据匹配请求用于请求获取所述第一用户集合与第二用户集合的交集;
对所述第二用户集合进行加密,得到第二加密数据;
从所述区块链获取第一过滤算法,基于所述第一过滤算法对所述第二加密数据进行过滤,得到第二数据,所述第一过滤算法由所述第一终端根据第一加密数据生成并添加至所述区块链;
根据所述第二数据生成第二过滤算法,将所述第二过滤算法添加至所述区块链,以使所述第一终端基于所述第二过滤算法对所述第一加密数据进行过滤,得到第一数据;
当所述第二数据与所述第一数据一致时,将所述第二数据作为所述交集。
9.根据权利要求8所述的方法,其特征在于,所述对所述第二用户集合进行加密,得到第二加密数据,包括:
利用消息摘要MD5算法,确定所述第二用户集合中每个用户标识对应的MD5值,将得到的MD5值集合作为所述第二加密数据。
10.一种数据分析装置,其特征在于,应用于第一终端,所述装置包括:
第一获取模块,用于获取第一用户集合,所述第一用户集合包含多个用户标识;
第二获取模块,用于获取多个第一比特串和每个第一比特串对应的多个第二比特串,每个第一比特串用于表示所述第一用户集合与一个第二终端的第二用户集合的交集,每个第二比特串用于表示每个交集中的一个子集,所述子集中的用户标识具有相同属性,所述第二用户集合包含多个可提供标签数据的用户标识,所述标签数据包含多种属性;
第三获取模块,用于根据所述多个第一比特串,获取所述第一用户集合中被多个第二终端的多个第二用户集合覆盖的用户标识的数量;
第四获取模块,用于根据所述每个第一比特串对应的多个第二比特串以及所述数量,获取所述第一用户集合中每种属性的用户标识的比例。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
第五获取模块,用于根据所述数量以及所述第一用户集合中用户标识的数量,获取所述多个第二用户集合对所述第一用户集合中用户标识的覆盖率。
12.根据权利要求10所述的装置,其特征在于,所述第二获取模块用于向所述多个第二终端发送数据匹配请求,所述数据匹配请求用于请求获取所述第一用户集合与多个第二用户集合的多个交集;从所述多个第二终端获取所述多个第一比特串和所述每个第一比特串对应的多个第二比特串。
13.根据权利要求12所述的装置,其特征在于,所述第二获取模块还用于:
对所述第一用户集合进行加密,得到第一加密数据;
根据所述第一加密数据生成第一过滤算法,将所述第一过滤算法添加至数据共享系统中的区块链,以使所述多个第二终端基于所述第一过滤算法对多个第二加密数据进行过滤,得到多个第二数据,所述多个第二加密数据由所述多个第二终端对多个第二用户集合进行加密生成;
从所述区块链获取多个第二过滤算法,基于所述多个第二过滤算法对所述第一用户集合进行过滤,得到多个第一数据,所述多个第二过滤算法由所述多个第二终端根据所述多个第二数据生成并添加至所述区块链;
当任一个第二过滤算法对应的第一数据与第二数据一致时,将所述第一数据作为生成所述任一个第二过滤算法的第二终端的第二用户集合与所述第一用户集合的交集。
14.根据权利要求13所述的装置,其特征在于,所述第二获取模块用于利用消息摘要MD5算法,确定所述第一用户集合中每个用户标识对应的MD5值,将得到的MD5值集合作为所述第一加密数据。
15.一种数据分析装置,其特征在于,应用于第二终端,所述装置包括:
第一获取模块,用于获取所述第二终端的第二用户集合与第一终端的第一用户集合的交集,所述第二用户集合包含多个可提供标签数据的用户标识,所述标签数据包含多种属性;
第二获取模块,用于获取所述交集对应的第一比特串,所述第一比特串用于表示所述交集;
第三获取模块,用于获取所述交集的多个子集,每个子集中的用户标识具有相同属性;
第四获取模块,用于获取所述多个子集对应的多个第二比特串,每个第二比特串用于表示一个子集;
提供模块,用于为所述第一终端提供所述第一比特串和所述多个第二比特串。
16.根据权利要求15所述的装置,其特征在于,所述第三获取模块用于将所述交集与所述第二用户集合的多个子集合进行交集运算,得到所述多个子集,每个子集合中的用户标识具有相同属性。
17.根据权利要求15所述的装置,其特征在于,所述第一获取模块用于:
接收所述第一终端发送的数据匹配请求,所述数据匹配请求用于请求获取所述第一用户集合与第二用户集合的交集;
对所述第二用户集合进行加密,得到第二加密数据;
从所述区块链获取第一过滤算法,基于所述第一过滤算法对所述第二加密数据进行过滤,得到第二数据,所述第一过滤算法由所述第一终端根据第一加密数据生成并添加至所述区块链;
根据所述第二数据生成第二过滤算法,将所述第二过滤算法添加至所述区块链,以使所述第一终端基于所述第二过滤算法对所述第一加密数据进行过滤,得到第一数据;
当所述第二数据与所述第一数据一致时,将所述第二数据作为所述交集。
18.根据权利要求17所述的装置,其特征在于,所述第一获取模块用于利用消息摘要MD5算法,确定所述第二用户集合中每个用户标识对应的MD5值,将得到的MD5值集合作为所述第二加密数据。
19.一种数据分析装置,其特征在于,所述装置包括:
处理器;
用于存储处理器可执行的指令的存储器;
其中,所述处理器被配置为:
获取第一用户集合,所述第一用户集合包含多个用户标识;
获取多个第一比特串和每个第一比特串对应的多个第二比特串,每个第一比特串用于表示所述第一用户集合与一个第二终端的第二用户集合的交集,每个第二比特串用于表示每个交集中的一个子集,所述子集中的用户标识具有相同属性,所述第二用户集合包含多个可提供标签数据的用户标识,所述标签数据包含多种属性;
根据所述多个第一比特串,获取所述第一用户集合中被多个第二终端的多个第二用户集合覆盖的用户标识的数量;
根据所述每个第一比特串对应的多个第二比特串以及所述数量,获取所述第一用户集合中每种属性的用户标识的比例。
20.一种数据分析装置,其特征在于,所述装置包括:
处理器;
用于存储处理器可执行的指令的存储器;
其中,所述处理器被配置为:
获取所述第二终端的第二用户集合与第一终端的第一用户集合的交集,所述第二用户集合包含多个可提供标签数据的用户标识,所述标签数据包含多种属性;
获取所述交集对应的第一比特串,所述第一比特串用于表示所述交集;
获取所述交集的多个子集,每个子集中的用户标识具有相同属性;
获取所述多个子集对应的多个第二比特串,每个第二比特串用于表示一个子集;
为所述第一终端提供所述第一比特串和所述多个第二比特串。
21.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5任一项所述的方法步骤。
22.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求6-9任一项所述的方法步骤。
CN201711315154.XA 2017-12-12 2017-12-12 数据分析方法、装置及计算机可读存储介质 Active CN108053241B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711315154.XA CN108053241B (zh) 2017-12-12 2017-12-12 数据分析方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711315154.XA CN108053241B (zh) 2017-12-12 2017-12-12 数据分析方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN108053241A true CN108053241A (zh) 2018-05-18
CN108053241B CN108053241B (zh) 2021-12-28

Family

ID=62124285

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711315154.XA Active CN108053241B (zh) 2017-12-12 2017-12-12 数据分析方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN108053241B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241423A (zh) * 2018-08-29 2019-01-18 北京小米移动软件有限公司 信息推荐方法、装置、电子设备及存储介质
CN110944008A (zh) * 2019-09-13 2020-03-31 腾讯科技(深圳)有限公司 基于区块链的任务酬劳处理方法、装置、设备及存储介质
CN111274249A (zh) * 2020-01-19 2020-06-12 深圳前海微众银行股份有限公司 用户画像数据存储优化方法、设备及可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150245084A1 (en) * 2014-02-27 2015-08-27 Cinsay, Inc. Apparatus and method for gathering analytics
CN106874392A (zh) * 2017-01-13 2017-06-20 微梦创科网络科技(中国)有限公司 受众用户信息的索引存储及广告信息投放的方法和装置
CN106959965A (zh) * 2016-01-12 2017-07-18 腾讯科技(北京)有限公司 一种信息处理方法及服务器
CN107070654A (zh) * 2017-05-12 2017-08-18 北京小米移动软件有限公司 信息采集方法及装置
CN107315967A (zh) * 2017-06-23 2017-11-03 北京小米移动软件有限公司 数据匹配方法、装置及计算机可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150245084A1 (en) * 2014-02-27 2015-08-27 Cinsay, Inc. Apparatus and method for gathering analytics
CN106959965A (zh) * 2016-01-12 2017-07-18 腾讯科技(北京)有限公司 一种信息处理方法及服务器
CN106874392A (zh) * 2017-01-13 2017-06-20 微梦创科网络科技(中国)有限公司 受众用户信息的索引存储及广告信息投放的方法和装置
CN107070654A (zh) * 2017-05-12 2017-08-18 北京小米移动软件有限公司 信息采集方法及装置
CN107315967A (zh) * 2017-06-23 2017-11-03 北京小米移动软件有限公司 数据匹配方法、装置及计算机可读存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241423A (zh) * 2018-08-29 2019-01-18 北京小米移动软件有限公司 信息推荐方法、装置、电子设备及存储介质
CN109241423B (zh) * 2018-08-29 2021-05-04 北京小米移动软件有限公司 信息推荐方法、装置、电子设备及存储介质
CN110944008A (zh) * 2019-09-13 2020-03-31 腾讯科技(深圳)有限公司 基于区块链的任务酬劳处理方法、装置、设备及存储介质
CN110944008B (zh) * 2019-09-13 2021-03-19 腾讯科技(深圳)有限公司 基于区块链的任务酬劳处理方法、装置、设备及存储介质
CN111274249A (zh) * 2020-01-19 2020-06-12 深圳前海微众银行股份有限公司 用户画像数据存储优化方法、设备及可读存储介质

Also Published As

Publication number Publication date
CN108053241B (zh) 2021-12-28

Similar Documents

Publication Publication Date Title
CN106921560A (zh) 语音通信方法、装置及系统
CN106028166A (zh) 直播过程中直播间切换方法及装置
CN106254467A (zh) 文件分享方法及装置
CN107948708A (zh) 弹幕展示方法及装置
CN106231378A (zh) 直播间的显示方法、装置及系统
CN104869574A (zh) 无线网络连接方法及装置
CN105808469B (zh) 数据处理方法、装置、终端及智能设备
CN109271239A (zh) 数据处理的方法、装置、系统、设备及介质
CN106020587A (zh) 消息显示方法及装置
CN104639609B (zh) 网络共享方法及装置
CN105956879A (zh) 一种发送电子券的方法、装置和系统
CN107204883A (zh) 网络故障处理方法及装置
CN106162211A (zh) 基于直播应用进行直播的方法及装置
CN108053241A (zh) 数据分析方法、装置及计算机可读存储介质
CN106296170A (zh) 二维码付款的方法、装置及系统
CN107197320A (zh) 视频直播方法、装置和系统
CN108021932A (zh) 数据检测方法、装置及电子设备
CN105303412A (zh) 内容项目排布方法、装置及系统
CN107423386A (zh) 生成电子卡片的方法及装置
CN106990894A (zh) 智能设备的控制方法及装置
CN107070654A (zh) 信息采集方法及装置
CN106128440A (zh) 一种歌词显示处理方法、装置、终端设备及系统
CN106096009A (zh) 消息生成方法及装置
CN109241423A (zh) 信息推荐方法、装置、电子设备及存储介质
CN106777016A (zh) 基于即时通信进行信息推荐的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant