CN108268545B - 一种分级的用户标签库的创建的方法和装置 - Google Patents

一种分级的用户标签库的创建的方法和装置 Download PDF

Info

Publication number
CN108268545B
CN108268545B CN201611270163.7A CN201611270163A CN108268545B CN 108268545 B CN108268545 B CN 108268545B CN 201611270163 A CN201611270163 A CN 201611270163A CN 108268545 B CN108268545 B CN 108268545B
Authority
CN
China
Prior art keywords
log information
library
user
projection
user tag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611270163.7A
Other languages
English (en)
Other versions
CN108268545A (zh
Inventor
杨剑青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Hangzhou Information Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Hangzhou Information Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201611270163.7A priority Critical patent/CN108268545B/zh
Publication of CN108268545A publication Critical patent/CN108268545A/zh
Application granted granted Critical
Publication of CN108268545B publication Critical patent/CN108268545B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种分级的用户标签库的创建的方法,所述方法包括:接收日志信息后,确定所述日志信息中是否包含用户身份标识字段,所述日志信息中包含用户身份标识字段时,将所述日志信息存储于用户标签库中的主库中;所述日志信息未包含用户身份标识字段时,获取所述日志信息中的标示所述日志信息的类型的类型标识符,并在用户标签库中的所有投影库中查找与所述日志信息的类型标识符匹配的第一投影库,查找成功时,将所述日志信息存储于第一投影库中;查找失败时,在用户标签库中新建第二投影库,将所述日志信息存储于第二投影库中,并将所述第二投影库的类型标示为所述日志信息的类型标识符。本发明还公开了一种分级的用户标签库的创建的装置。

Description

一种分级的用户标签库的创建的方法和装置
技术领域
本发明涉及数据挖掘领域,尤其涉及一种分级的用户标签库的创建的方法和装置。
背景技术
随着移动互联网的发展和普及,移动智能终端得到了大规模的应用。在空闲时,人们往往喜欢打开移动智能终端、登陆APP来访问互联网;此时,APP会对用户的操作(比如在购物网站上购买商品,付费等操作)进行跟踪,生成日志信息,并将日志信息发送到服务器,服务器会利用日志信息建立用户标签库;之后,通过标签库中的日志信息对用户进行画像,基于用户画像对用户进行分群,然后针对不同用户进行精确广告投放和商品推荐等。
在现有技术中,通常用户标签库的构造如图1所示,在整个用户标签库中,使用用户唯一标识符来唯一的标识一个用户,将该用户的每条日志信息都对应到该用户唯一标识符,即只要使用用户唯一标识符就可以获取该用户的所有日志信息;此处,用户唯一标识符一般为身份证号、手机号码等能够唯一确定一个用户身份的标识符,但用户唯一标识符涉及到用户的隐私,且一般会涉及法律问题,因此,在构建这种类型的用户标签库就会存在着困难。在一些细分场景,这种“大而全”用户标签库显得很臃肿,不便于使用。由于这种类型的用户标签库是“大而全”的,导致其购买费用比较高。
因此,亟需一种适用于实际场景、体量适中、便于使用且成本低的用户标签库,及其创建方法。
发明内容
有鉴于此,本发明实施例期望提供一种适用于实际场景、体量适中、便于使用且成本低的用户标签库的创建的方法和装置。
为达到上述目的,本发明的技术方案是这样实现的:
本发明实施例提供了一种分级的用户标签库的创建的方法,包括以下步骤:
接收日志信息后,确定所述日志信息中是否包含用户身份标识字段,所述日志信息中包含用户身份标识字段时,将所述日志信息存储于用户标签库中的主库中;
所述日志信息未包含用户身份标识字段时,获取所述日志信息中的标示所述日志信息的类型的类型标识符,并在用户标签库中的所有投影库中查找与所述日志信息的类型标识符匹配的第一投影库,查找成功时,将所述日志信息存储于第一投影库中;查找失败时,在用户标签库中新建第二投影库,将所述日志信息存储于第二投影库中,并将所述第二投影库的类型标示为所述日志信息的类型标识符。
上述方案中,所述接收日志信息,包括:接收到电信管理系统所发送的包含对用户账号进行变更的日志信息,或接收到移动智能终端所发送的包含APP运行日志的日志信息。
上述方案中,所述确定所述日志信息中是否包含用户身份标识字段,包括:确定所述日志信息中是否包含手机号码或身份证号。
上述方案中,所述获取所述日志信息中的标示所述日志信息的类型的类型标识符,包括:获取所述日志信息中包含的终端编号和应用程序编号。
本发明实施例提供了一种分级的用户标签库的整理方法,所述方法包括:对于主库中所存储的任一第二日志信息,如果在所有投影库中查找到与所述第二日志信息匹配的第一日志信息,在所述第二日志信息的存储项中添加第一日志信息的链接。
本发明实施例提供了一种分级的用户标签库的创建的装置,所述装置包括:主库处理模块,用于接收日志信息后,确定所述日志信息中是否包含用户身份标识字段,所述日志信息中包含用户身份标识字段时,将所述日志信息存储于用户标签库中的主库中;
投影库处理模块,用于所述日志信息未包含用户身份标识字段时,获取所述日志信息中的标示所述日志信息的类型的类型标识符,并在用户标签库中的所有投影库中查找与所述日志信息的类型标识符匹配的第一投影库,查找成功时,将所述日志信息存储于第一投影库中;查找失败时,在用户标签库中新建第二投影库,将所述日志信息存储于第二投影库中,并将所述第二投影库的类型标示为所述日志信息的类型标识符。
上述方案中,所述主库处理模块,具体用于:接收到电信管理系统所发送的包含对用户账号进行变更的日志信息,或接收到移动智能终端所发送的包含APP运行日志的日志信息。
上述方案中,所述主库处理模块,具体用于:确定所述日志信息中是否包含手机号码或身份证号。
上述方案中,投影库处理模块,具体用于:获取所述日志信息中包含的终端编号和应用程序编号。
本发明实施例提供了一种分级的用户标签库的整理装置,包括以下模块:整理模块,用于对于主库中所存储的任一第二日志信息,如果在所有投影库中查找到与所述第二日志信息匹配的第一日志信息,在所述第二日志信息的存储项中添加第一日志信息的链接。
本发明实施例提供的分级的用户标签库的创建的方法和装置,接收日志信息后,确定所述日志信息中是否包含用户身份标识字段,所述日志信息中包含用户身份标识字段时,将所述日志信息存储于用户标签库中的主库中;所述日志信息未包含用户身份标识字段时,获取所述日志信息中的标示所述日志信息的类型的类型标识符,并在用户标签库中的所有投影库中查找与所述日志信息的类型标识符匹配的第一投影库,查找成功时,将所述日志信息存储于第一投影库中;查找失败时,在用户标签库中新建第二投影库,将所述日志信息存储于第二投影库中,并将所述第二投影库的类型标示为所述日志信息的类型标识符。如此,提供适用于实际场景、体量适中、便于使用且成本低的用户标签库。
附图说明
图1为现有技术中用户标签库的架构示意图;
图2为本发明实施例的分级的用户标签库的创建的方法的流程示意图;
图3为本发明实施例的分级的用户标签库的创建的装置的组成结构示意图。
具体实施方式
本发明实施例中,接收日志信息后,确定所述日志信息中是否包含用户身份标识字段,所述日志信息中包含用户身份标识字段时,将所述日志信息存储于用户标签库中的主库中;所述日志信息未包含用户身份标识字段时,获取所述日志信息中的标示所述日志信息的类型的类型标识符,并在用户标签库中的所有投影库中查找与所述日志信息的类型标识符匹配的第一投影库,查找成功时,将所述日志信息存储于第一投影库中;查找失败时,在用户标签库中新建第二投影库,将所述日志信息存储于第二投影库中,并将所述第二投影库的类型标示为所述日志信息的类型标识符。
下面结合实施例对本发明的技术方案作进一步详细的说明。
本发明实施例提供了一种分级的用户标签库的创建的方法,如图2所示,包括以下步骤:
步骤201:接收日志信息后,确定所述日志信息中是否包含用户身份标识字段,所述日志信息中包含用户身份标识字段时,将所述日志信息存储于用户标签库中的主库中;
下面是一些常见的日志信息:
当用户在智能移动终端上使用APP(Application,计算机应用程序)时,APP会自动记录用户的操作,并将这些操作转换成拥有固定格式的日志信息,然后将这些日志信息发送给服务器,服务器就会接收到这些日志信息;出于安全的考虑,APP一般无法获取到手机号码或身份证号等,因此,为了能够唯一的标识该智能移动终端,APP通常会给智能移动终端分配唯一的编号(记为TerminalID,Terminal Identification,终端编号),同时为了与其他APP区分开来,会给APP分配唯一的应用程序编号(记为APPID,ApplicationIdentification,应用程序编号)。例如,APPID:xxxx,TermianlID:563436343,TAG:消费者,消费233,访问页面5个,停留时间23S。所述终端编号可以为IMEI(International MobileEquipment Identity,国际移动设备身份码)。
在日常生活中,电信用户会对其账号进行某些操作,比如:缴费,变更套餐等,电信系统会捕获到这些操作,同时会生成日志信息,在这种情形下,电信系统可以获取到用户的手机号码,例如:手机号:13xxxxxxxxx,性别:男,套餐:288元包。所述电信系统包括BOSS(Business&Operation Support System,业务运营支撑系统)等。
在实际使用中,网络服务提供商通常会给用户发送短信,在这种情形下,电信系统会获取到用户的手机号码,例如:手机号:13xxxxxxxxx,行为:收到京东验证码。
以上仅仅是举出了一些具体的日志信息的实例,在实际中,有多种类型的日志信息。
作为一种可选的实施例,将所述日志信息存储到主库中,包括:将所述日志信息转换成主库所规定的格式,然后再存储进主库中。为了方便对日志信息进行处理,用户标签库都有其特定的存储格式,因此,需要将所述日志信息转换成主库所定义的格式,然后在存储进主库中。这里,主库中所存储的每条日志信息都能够唯一对应一个用户。
步骤202:所述日志信息未包含用户身份标识字段时,获取所述日志信息中的标示所述日志信息的类型的类型标识符,并在用户标签库中的所有投影库中查找与所述日志信息的类型标识符匹配的第一投影库,查找成功时,将所述日志信息存储于第一投影库中;查找失败时,在用户标签库中新建第二投影库,将所述日志信息存储于第二投影库中,并将所述第二投影库的类型标示为所述日志信息的类型标识符。
作为一种可选的实施例,将所述日志信息存储进第一投影库,包括:将所述日志信息转换成第一投影库所规定的格式,然后再存储进第一投影库中。为了方便对日志信息进行处理,用户标签库都有其特定的存储格式,因此,需要将所述日志信息转换成第一投影库所规定的格式,然后再存储进第一投影库中。
在实际中,日志信息都会有固定格式,因此,可以通过该固定格式就可以判断出该日志信息的类型,进而生成类型标识符;也可以将该日志信息中的某个属性的值作为类型标识符;如果该日志信息中包含应用程序编号或终端编号时,也可以程序编号或终端编号作为类型标识符。
该分级的用户标签库包含包括多个投影库,每个投影库存储相同类型的日志信息,则可将每个投影库应用于特定的应用场景,因此,相对于传统的“大而全”的用户标签库,该投影库具有计算量小、精确度高、针对性强的特点,更加便于用户画像,且相应的成本也更低。
在创建该分级的用户标签库的过程中,当接收到新类型的日志信息时,需要新建投影库来存储该日志信息。
本发明实施例中,所述接收日志信息,包括:接收到电信管理系统所发送的包含对用户账号进行变更的日志信息,或接收到移动智能终端所发送的包含APP运行日志的日志信息。
本发明实施例中,其特征在于,所述确定所述日志信息中是否包含用户身份标识字段,包括:确定所述日志信息中是否包含手机号码或身份证号。
这里,在主库中,通过每条日志信息所包含的手机号码或身份证号,可以精确定位到一个具体的用户,在利用主库中的日志信息进行用户画像时,可以精确到具体的用户;从而可以根据用户画像中的浏览兴趣和使用习惯等,对具体的用户进行精确广告投放和商品推荐。
本发明实施例中所述获取所述日志信息中的标示所述日志信息的类型的类型标识符,包括:获取所述日志信息中包含的终端编号和应用程序编号。
作为一种可选的实施例,所述终端编号包括IMEI(International MobileEquipment Identity,国际移动设备身份码),每一只移动电话机在组装完成后都将被赋予一个全球唯一的一组IMEI号码,因此,利用IMEI可以唯一的确定一个移动电话,具有精确性高的优点。
这里,在投影库中,每条日志信息不一定都包含能够唯一标识用户身份的用户唯一标识符,但是由于每条日志信息都包含有终端编号和应用程序编号,因此,在利用投影库中的日志信息进行用户画像时,可以精确到具体的智能移动终端;从而可以根据用户画像中的浏览兴趣和使用习惯等,对具体的应用终端进行精确广告投放和商品推荐,根据发明人在实际中的长期观察,可以获得很好的效果。
本发明实施例提供了一种分级的用户标签库的整理方法,包括:对于主库中所存储的任一第二日志信息,如果在所有投影库中查找到与所述第二日志信息匹配的第一日志信息,在所述第二日志信息的存储项中添加第一日志信息的链接。
这里,可以根据实际需要来定义匹配准则,例如:确定第二日志信息中的终端编号等于第一日志信息中的终端编号时,则第一日志信息与第二日志信息匹配;或者通过电信系统获取到第二日志中的用户唯一标识符所标识的用户,且获取到第一日志信息中终端编号所标识的移动智能终端,确定该移动智能终端属于该用户时,则第一日志信息与第二日志信息匹配。
这里在第二日志信息的存储项中存储第一日志信息的链接,不仅可以通过该链接直接获取到第一日志信息,而且相较于在第二日志信息的存储项中存储第一日志信息,存储链接所耗费的空间比较小。
这里,由于主库中的所有日志信息都包含有用户唯一标识符,可以精确到具体的用户;但这就会导致主库中的信息不够全面,因此,建立一个完整的用户标签库,从而可以通过用户的用户唯一标识符获取关于该用户的所有信息。从而使得该分级的用户标签库不仅具有用于实际场景、体量适中、便于使用且成本低的优点,而且还等同于传统的“大而全”的用户标签库。
本发明实施例中,所述确定所述投影库中的第一日志信息的与所述主库中的第二日志信息匹配,包括:获取所述投影库中的第一日志信息中的第一终端编号和第一应用程序编号,获取所述主库中的第二日志信息中的第二终端编号和第二应用程序编号,确定第一终端编号等于第二终端编号且第一应用程序编号等于第二应用程序编号时,第一日志信息与第二日志信息匹配。
当第一终端编号等于第二终端编号且第一应用程序编号等于第二应用程序编号时,则第一日志信息与第二日志信息来自于相同的智能移动终端,因此,第一日志信息与第二日志信息匹配。
本发明实施例提供了一种分级的用户标签库的创建的装置,如图3所示,包括如下模块:
主库处理模块1,用于接收日志信息后,确定所述日志信息中是否包含用户身份标识字段,所述日志信息中包含用户身份标识字段时,将所述日志信息存储于用户标签库中的主库中;
下面是一些常见的日志信息:
当用户在智能移动终端上使用APP(Application,计算机应用程序)时,APP会自动记录用户的操作,并将这些操作转换成拥有固定格式的日志信息,然后将这些日志信息发送给服务器,服务器就会接收到这些日志信息;出于安全的考虑,APP一般无法获取到手机号码或身份证号等,因此,为了能够唯一的标识该智能移动终端,APP通常会给智能移动终端分配唯一的编号(记为TerminalID,Terminal Identification,终端编号),同时为了与其他APP区分开来,会给APP分配唯一的应用程序编号(记为APPID,ApplicationIdentification,应用程序编号)。例如,APPID:xxxx,TermianlID:563436343,TAG:消费者,消费233,访问页面5个,停留时间23S。所述终端编号可以为IMEI(International MobileEquipment Identity,国际移动设备身份码)。
在日常生活中,电信用户会对其账号进行某些操作,比如:缴费,变更套餐等,电信系统会捕获到这些操作,同时会生成日志信息,在这种情形下,电信系统可以获取到用户的手机号码,例如:手机号:13xxxxxxxxx,性别:男,套餐:288元包。所述电信系统包括BOSS(Business&Operation Support System,业务运营支撑系统)等。
在实际使用中,网络服务提供商通常会给用户发送短信,在这种情形下,电信系统会获取到用户的手机号码,例如:手机号:13xxxxxxxxx,行为:收到京东验证码。
以上仅仅是举出了一些具体的日志信息的实例,在实际中,有多种类型的日志信息。
作为一种可选的实施例,将所述日志信息存储到主库中,包括:将所述日志信息转换成主库所规定的格式,然后再存储进主库中。为了方便对日志信息进行处理,用户标签库都有其特定的存储格式,因此,需要将所述日志信息转换成主库所定义的格式,然后在存储进主库中。这里,主库中所存储的每条日志信息都能够唯一对应一个用户。
投影库处理模块2,用于所述日志信息未包含用户身份标识字段时,获取所述日志信息中的标示所述日志信息的类型的类型标识符,并在用户标签库中的所有投影库中查找与所述日志信息的类型标识符匹配的第一投影库,查找成功时,将所述日志信息存储于第一投影库中;查找失败时,在用户标签库中新建第二投影库,将所述日志信息存储于第二投影库中,并将所述第二投影库的类型标示为所述日志信息的类型标识符。
作为一种可选的实施例,将所述日志信息存储进第一投影库,包括:将所述日志信息转换成第一投影库所规定的格式,然后再存储进第一投影库中。为了方便对日志信息进行处理,用户标签库都有其特定的存储格式,因此,需要将所述日志信息转换成第一投影库所规定的格式,然后再存储进第一投影库中。
在实际中,日志信息都会有固定格式,因此,可以通过该固定格式就可以判断出该日志信息的类型,进而生成类型标识符;也可以将该日志信息中的某个属性的值作为类型标识符;如果该日志信息中包含应用程序编号或终端编号时,也可以程序编号或终端编号作为类型标识符。
该分级的用户标签库包含包括多个投影库,每个投影库存储相同类型的日志信息,则可将每个投影库应用于特定的应用场景,因此,相对于传统的“大而全”的用户标签库,该投影库具有计算量小、精确度高、针对性强的特点,更加便于用户画像,且相应的成本也更低。
在创建该分级的用户标签库的过程中,当接收到新类型的日志信息时,需要新建投影库来存储该日志信息。
本发明实施例中,所述主库处理模块1,具体用于:接收到电信管理系统所发送的包含对用户账号进行变更的日志信息,或接收到移动智能终端所发送的包含APP运行日志的日志信息。
本发明实施例中,所述主库处理模块1,具体用于:确定所述日志信息中是否包含手机号码或身份证号。
这里,在主库中,通过每条日志信息所包含的手机号码或身份证号,可以精确定位到一个具体的用户,在利用主库中的日志信息进行用户画像时,可以精确到具体的用户;从而可以根据用户画像中的浏览兴趣和使用习惯等,对具体的用户进行精确广告投放和商品推荐。
本发明实施例中,所述投影库处理模块2,具体用于:获取所述日志信息中包含的终端编号和应用程序编号。
作为一种可选的实施例,所述终端编号包括IMEI(International MobileEquipment Identity,国际移动设备身份码),每一只移动电话机在组装完成后都将被赋予一个全球唯一的一组IMEI号码,因此,利用IMEI可以唯一的确定一个移动电话,具有精确性高的优点。
这里,在投影库中,每条日志信息不一定都包含能够唯一标识用户身份的用户唯一标识符,但是由于每条日志信息都包含有终端编号和应用程序编号,因此,在利用投影库中的日志信息进行用户画像时,可以精确到具体的智能移动终端;从而可以根据用户画像中的浏览兴趣和使用习惯等,对具体的应用终端进行精确广告投放和商品推荐,根据发明人在实际中的长期观察,可以获得很好的效果。
本发明实施例还提供了一种基于上述分级的用户标签库的创建的装置的整理装置,包括以下模块:
整理模块,用于对于主库中所存储的任一第二日志信息,如果在所有投影库中查找到与所述第二日志信息匹配的第一日志信息,在所述第二日志信息的存储项中添加第一日志信息的链接。
这里,可以根据实际需要来定义匹配准则,例如:确定第二日志信息中的终端编号等于第一日志信息中的终端编号时,则第一日志信息与第二日志信息匹配;或者通过电信系统获取到第二日志中的用户唯一标识符所标识的用户,且获取到第一日志信息中终端编号所标识的移动智能终端,确定该移动智能终端属于该用户时,则第一日志信息与第二日志信息匹配。
这里在第二日志信息的存储项中存储第一日志信息的链接,不仅可以通过该链接直接获取到第一日志信息,而且相较于在第二日志信息的存储项中存储第一日志信息,存储链接所耗费的空间比较小。
这里,由于主库中的所有日志信息都包含有用户唯一标识符,可以精确到具体的用户;但这就会导致主库中的信息不够全面,因此,建立一个完整的用户标签库,从而可以通过用户的用户唯一标识符获取关于该用户的所有信息。从而使得该分级的用户标签库不仅具有用于实际场景、体量适中、便于使用且成本低的优点,而且还等同于传统的“大而全”的用户标签库。
本发明实施例中,整理模块,具体用于:获取所述投影库中的第一日志信息中的第一终端编号和第一应用程序编号,获取所述主库中的第二日志信息中的第二终端编号和第二应用程序编号,确定第一终端编号等于第二终端编号且第一应用程序编号等于第二应用程序编号时,第一日志信息与第二日志信息匹配。
当第一终端编号等于第二终端编号且第一应用程序编号等于第二应用程序编号时,则第一日志信息与第二日志信息来自于相同的智能移动终端,因此,第一日志信息与第二日志信息匹配。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (10)

1.一种分级的用户标签库的创建的方法,其特征在于,包括以下步骤:
接收日志信息后,确定所述日志信息中是否包含用户身份标识字段,所述日志信息中包含用户身份标识字段时,将所述日志信息存储于用户标签库中的主库中;
所述日志信息未包含用户身份标识字段时,获取所述日志信息中的标示所述日志信息的类型的类型标识符,并在用户标签库中的所有投影库中查找与所述日志信息的类型标识符匹配的第一投影库,查找成功时,将所述日志信息存储于第一投影库中;查找失败时,在用户标签库中新建第二投影库,将所述日志信息存储于第二投影库中,并将所述第二投影库的类型标示为所述日志信息的类型标识符。
2.根据权利要求1所述的分级的用户标签库的创建的方法,其特征在于,所述接收日志信息,包括:
接收到电信管理系统所发送的包含对用户账号进行变更的日志信息,或接收到移动智能终端所发送的包含APP运行日志的日志信息。
3.根据权利要求1所述的分级的用户标签库的创建的方法,其特征在于,所述确定所述日志信息中是否包含用户身份标识字段,包括:
确定所述日志信息中是否包含手机号码或身份证号。
4.根据权利要求1所述的分级的用户标签库的创建的方法,其特征在于,所述获取所述日志信息中的标示所述日志信息的类型的类型标识符,包括:
获取所述日志信息中包含的终端编号和应用程序编号。
5.一种分级的用户标签库的整理方法,其特征在于,所述方法包括:
对于用户标签库中的主库中所存储的任一第二日志信息,如果在所述用户标签库中的所有投影库中查找到与所述第二日志信息匹配的第一日志信息,在所述第二日志信息的存储项中添加第一日志信息的链接;其中,所述用户标签库由权利要求1-4任一项所述的方法创建。
6.一种分级的用户标签库的创建的装置,其特征在于,所述装置包括:
主库处理模块,用于接收日志信息后,确定所述日志信息中是否包含用户身份标识字段,所述日志信息中包含用户身份标识字段时,将所述日志信息存储于用户标签库中的主库中;
投影库处理模块,用于所述日志信息未包含用户身份标识字段时,获取所述日志信息中的标示所述日志信息的类型的类型标识符,并在用户标签库中的所有投影库中查找与所述日志信息的类型标识符匹配的第一投影库,查找成功时,将所述日志信息存储于第一投影库中;查找失败时,在用户标签库中新建第二投影库,将所述日志信息存储于第二投影库中,并将所述第二投影库的类型标示为所述日志信息的类型标识符。
7.根据权利要求6所述的分级的用户标签库的创建的装置,其特征在于,所述主库处理模块,具体用于:
接收到电信管理系统所发送的包含对用户账号进行变更的日志信息,或接收到移动智能终端所发送的包含APP运行日志的日志信息。
8.根据权利要求6所述的分级的用户标签库的创建的装置,其特征在于,所述主库处理模块,具体用于:
确定所述日志信息中是否包含手机号码或身份证号。
9.根据权利要求6所述的分级的用户标签库的创建的装置,其特征在于,投影库处理模块,具体用于:
获取所述日志信息中包含的终端编号和应用程序编号。
10.一种分级的用户标签库的整理装置,其特征在于,包括以下模块:
整理模块,用于对于用户标签库中的主库中所存储的任一第二日志信息,如果在所述用户标签库中的所有投影库中查找到与所述第二日志信息匹配的第一日志信息,在所述第二日志信息的存储项中添加第一日志信息的链接;其中,所述用户标签库由权利要求6-9任一项所述的装置创建。
CN201611270163.7A 2016-12-30 2016-12-30 一种分级的用户标签库的创建的方法和装置 Active CN108268545B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611270163.7A CN108268545B (zh) 2016-12-30 2016-12-30 一种分级的用户标签库的创建的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611270163.7A CN108268545B (zh) 2016-12-30 2016-12-30 一种分级的用户标签库的创建的方法和装置

Publications (2)

Publication Number Publication Date
CN108268545A CN108268545A (zh) 2018-07-10
CN108268545B true CN108268545B (zh) 2020-11-10

Family

ID=62771247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611270163.7A Active CN108268545B (zh) 2016-12-30 2016-12-30 一种分级的用户标签库的创建的方法和装置

Country Status (1)

Country Link
CN (1) CN108268545B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109271383B (zh) * 2018-09-05 2021-01-08 广州视源电子科技股份有限公司 动态标签处理方法、装置、计算机设备和存储介质
CN111241048A (zh) * 2020-01-03 2020-06-05 广东金赋科技股份有限公司 一种web终端日志管理方法、装置、介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101179436A (zh) * 2007-11-23 2008-05-14 上海华为技术有限公司 实现调试日志的关联方法及装置
CN102164050A (zh) * 2011-05-16 2011-08-24 北京星网锐捷网络技术有限公司 日志解析方法及日志解析节点设备
CN103763361A (zh) * 2014-01-13 2014-04-30 北京奇虎科技有限公司 一种基于用户行为推荐应用的方法、系统及推荐服务器
CN104217031A (zh) * 2014-09-28 2014-12-17 北京奇虎科技有限公司 一种根据服务器搜索日志数据进行用户分类的方法和装置
CN104239158A (zh) * 2013-06-07 2014-12-24 Sap欧洲公司 用于自动分析和链接错误日志的分析引擎

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7779021B1 (en) * 2004-03-09 2010-08-17 Versata Development Group, Inc. Session-based processing method and system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101179436A (zh) * 2007-11-23 2008-05-14 上海华为技术有限公司 实现调试日志的关联方法及装置
CN102164050A (zh) * 2011-05-16 2011-08-24 北京星网锐捷网络技术有限公司 日志解析方法及日志解析节点设备
CN104239158A (zh) * 2013-06-07 2014-12-24 Sap欧洲公司 用于自动分析和链接错误日志的分析引擎
CN103763361A (zh) * 2014-01-13 2014-04-30 北京奇虎科技有限公司 一种基于用户行为推荐应用的方法、系统及推荐服务器
CN104217031A (zh) * 2014-09-28 2014-12-17 北京奇虎科技有限公司 一种根据服务器搜索日志数据进行用户分类的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于时间特征的移动用户标签生成方法;刘炎;《中国优秀硕士学位论文全文数据库》;20160315;全文 *

Also Published As

Publication number Publication date
CN108268545A (zh) 2018-07-10

Similar Documents

Publication Publication Date Title
CN107665233B (zh) 数据库数据处理方法、装置、计算机设备和存储介质
CN109951435B (zh) 一种设备标识提供方法及装置和风险控制方法及装置
CN106919625B (zh) 一种互联网用户属性识别方法和装置
CN109756760B (zh) 视频标签的生成方法、装置及服务器
CN109086377B (zh) 设备画像的生成方法、装置及计算设备
CN104579909B (zh) 一种用户信息的分类、用户分组信息的获取方法和设备
WO2014032419A1 (zh) 一种基于图片获得咨询信息的方法和系统
CN113220657B (zh) 数据处理方法、装置及计算机设备
US11244153B2 (en) Method and apparatus for processing information
CN110717536A (zh) 一种生成训练样本的方法及装置
CN114610951A (zh) 数据处理方法、装置、电子设备及可读存储介质
US9665574B1 (en) Automatically scraping and adding contact information
CN111177481B (zh) 用户标识映射方法及装置
CN108268545B (zh) 一种分级的用户标签库的创建的方法和装置
CN114066533A (zh) 产品推荐方法、装置、电子设备及存储介质
CN110189171B (zh) 特征数据的生成方法、装置及设备
CN111026613B (zh) 日志处理方法及装置
EP3616092A1 (en) Media sharing based on identified physical objects
CN116842984A (zh) 一种图形码的解码方法及其制码方法
CN110704498A (zh) 数据提取方法、装置、设备及计算机可读存储介质
CN111078905A (zh) 一种数据处理方法、装置、介质以及设备
CN110895552A (zh) 一种人员信息获取方法及装置
CN114781517A (zh) 风险识别的方法、装置及终端设备
CN111263351B (zh) 业务处理方法、业务处理装置、电子设备及存储介质
Namiot et al. On mobile wireless tags

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 310012 building A01, 1600 yuhangtang Road, Wuchang Street, Yuhang District, Hangzhou City, Zhejiang Province

Applicant after: CHINA MOBILE (HANGZHOU) INFORMATION TECHNOLOGY Co.,Ltd.

Applicant after: China Mobile Communications Corp.

Address before: 310012, No. 14, building three, Chang Torch Hotel, No. 259, Wensanlu Road, Xihu District, Zhejiang, Hangzhou

Applicant before: CHINA MOBILE (HANGZHOU) INFORMATION TECHNOLOGY Co.,Ltd.

Applicant before: China Mobile Communications Corp.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant