CN106295701A - 用户识别方法及装置 - Google Patents

用户识别方法及装置 Download PDF

Info

Publication number
CN106295701A
CN106295701A CN201610666003.8A CN201610666003A CN106295701A CN 106295701 A CN106295701 A CN 106295701A CN 201610666003 A CN201610666003 A CN 201610666003A CN 106295701 A CN106295701 A CN 106295701A
Authority
CN
China
Prior art keywords
user
type
user type
information
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610666003.8A
Other languages
English (en)
Inventor
李鹏
于洋
郭振强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing 58 Information Technology Co Ltd
Original Assignee
Beijing 58 Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing 58 Information Technology Co Ltd filed Critical Beijing 58 Information Technology Co Ltd
Priority to CN201610666003.8A priority Critical patent/CN106295701A/zh
Publication of CN106295701A publication Critical patent/CN106295701A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种用户识别方法及装置,该方法可以包括:获取待识别用户的至少一个目标属性信息;获取用户识别模型,所述用户识别模型中包括至少两个用户类型、及各所述用户类型对应的属性信息;根据各所述目标属性信息、及各所述用户类型对应的属性信息,确定各所述目标属性信息对应的用户类型;根据各所述目标属性信息对应的用户类型,确定所述待识别用户的用户类型。用于提高确定用户类型的准确性。

Description

用户识别方法及装置
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种用户识别方法及装置。
背景技术
目前,随着互联网技术的不断发展,用户可以通过注册账号通过互联网发布多种网络行为,例如在互联网中发布帖子等。
在实际应用过程中,数据服务器通常可以根据用户类型,对用户执行不同的操作,例如,根据用户的类型,向用户进行信息推荐。在现有技术中,数据服务器通常根据用户在注册账号时输入的用户信息,获取用户类型。然而,在现有技术中,由于很多用户注册的用户信息与实际的用户信息不相符,进而导致数据服务器无法获取准确的用户类型。
发明内容
本发明实施例提供一种用户识别方法及装置,用于提高确定用户类型的准确性。
第一方面,本发明实施例提供一种用户识别方法,包括:
获取待识别用户的至少一个目标属性信息;
获取用户识别模型,所述用户识别模型中包括至少两个用户类型、及各所述用户类型对应的属性信息;
根据各所述目标属性信息、及各所述用户类型对应的属性信息,确定各所述目标属性信息对应的用户类型;
根据各所述目标属性信息对应的用户类型,确定所述待识别用户的用户类型。
在一种可能的实施方式中,所述获取待识别用户的至少一个目标属性信息,包括:
获取所述待识别用户对应的日志信息;
根据所述用户识别模型中各所述用户类型对应的属性信息的类型,在所述日志信息中获取所述目标属性信息。
在另一种可能的实施方式中,根据各所述目标属性信息、及各所述用户类型对应的属性信息,确定各所述目标属性信息对应的用户类型,包括:
在各所述用户类型对应的属性信息中,获取所述目标属性信息匹配的匹配属性信息;
将所述匹配属性信息对应的用户类型确定为所述目标属性信息对应的用户类型。
在另一种可能的实施方式中,根据各所述目标属性信息对应的用户类型,确定所述待识别用户的用户类型,包括:
获取各所述目标属性信息的权重值;
根据各所述目标属性信息的权重值、各所述目标属性信息对应的用户类型,确定所述待识别用户与各用户类型的匹配系数;
根据所述待识别用户与各用户类型的匹配系数,确定所述待识别用户的用户类型。
在另一种可能的实施方式中,针对各所述用户类型中的任意一个第一用户类型,所述根据各所述目标属性信息的权重值、各所述目标属性信息对应的用户类型,确定所述待识别用户与各用户类型的匹配系数,包括:
根据如下公式一,确定所述待识别用户与所述第一用户类型的匹配系数P:
其中,所述n为所述目标属性信息的个数,所述λi为第i个目标属性信息的权重值,所述Ki为所述第i个目标属性信息与所述第一用户类型的匹配度,其中,若所述第i个目标属性信息对应的用户类型为所述第一用户类型,则所述Ki为1,否则,所述Ki为0。
在另一种可能的实施方式中,所述获取用户识别模型之前,还包括:
确定各所述用户类型对应的样本用户;
获取各所述样本用户的属性信息;
根据各所述样本用户的属性信息,生成所述用户识别模型。
在另一种可能的实施方式中,根据各所述样本用户的属性信息,生成所述用户识别模型,包括:
根据各所述用户类型对应的样本用户的属性信息,确定各所述用户类型对应的属性信息;
根据各所述用户类型对应的属性信息,生成所述用户识别模型。
在另一种可能的实施方式中,针对各所述用户类型中的任意一个第二用户类型,所述根据各所述用户类型对应的样本用户的属性信息,确定各所述用户类型对应的属性信息,包括:
获取所述第二用户类型对应的属性信息的至少一个属性类型;
在所述第二用户类型对应的样本用户的属性信息中,获取各所述属性类型对应的属性信息集合;
对各所述属性类型对应的属性信息集合进行整合处理,得到各所述属性类型对应的属性信息;
根据各所述属性类型对应的属性信息,确定所述第二用户类型对应的属性信息。
第二方面,本发明实施例提供一种用户识别装置,包括:
第一获取模块,用于获取待识别用户的至少一个目标属性信息;
第二获取模块,用于获取用户识别模型,所述用户识别模型中包括至少两个用户类型、及各所述用户类型对应的属性信息;
第一确定模块,用于根据各所述目标属性信息、及各所述用户类型对应的属性信息,确定各所述目标属性信息对应的用户类型;
第二确定模块,用于根据各所述目标属性信息对应的用户类型,确定所述待识别用户的用户类型。
在一种可能的实施方式中,所述第一获取模块具体用于:
获取所述待识别用户对应的日志信息;
根据所述用户识别模型中各所述用户类型对应的属性信息的类型,在所述日志信息中获取所述目标属性信息。
在另一种可能的实施方式中,所述第一确定模块具体用于:
在各所述用户类型对应的属性信息中,获取所述目标属性信息匹配的匹配属性信息;
将所述匹配属性信息对应的用户类型确定为所述目标属性信息对应的用户类型。
在另一种可能的实施方式中,所述第二确定模块包括获取单元、第一确定单元及第二确定单元,其中,
所述获取单元用于,获取各所述目标属性信息的权重值;
所述第一确定单元用于,根据各所述目标属性信息的权重值、各所述目标属性信息对应的用户类型,确定所述待识别用户与各用户类型的匹配系数;
所述第二确定单元用于,根据所述待识别用户与各用户类型的匹配系数,确定所述待识别用户的用户类型。
在另一种可能的实施方式中,针对各所述用户类型中的任意一个第一用户类型,所述第一确定单元具体用于:
根据如下公式一,确定所述待识别用户与所述第一用户类型的匹配系数P:
其中,所述n为所述目标属性信息的个数,所述λi为第i个目标属性信息的权重值,所述Ki为所述第i个目标属性信息与所述第一用户类型的匹配度,其中,若所述第i个目标属性信息对应的用户类型为所述第一用户类型,则所述Ki为1,否则,所述Ki为0。
在另一种可能的实施方式中,所述装置还包括第三确定模块、第三获取模块和生成模块,其中,
所述第三确定模块用于,在所述第二获取模块获取用户识别模型之前,确定各所述用户类型对应的样本用户;
所述第三获取模块用于,获取各所述样本用户的属性信息;
所述生成模块用于,根据各所述样本用户的属性信息,生成所述用户识别模型。
在另一种可能的实施方式中,所述生成模块包括第三确定单元和生成单元,其中,
所述第三确定单元用于,根据各所述用户类型对应的样本用户的属性信息,确定各所述用户类型对应的属性信息;
所述生成单元用于,根据各所述用户类型对应的属性信息,生成所述用户识别模型。
在另一种可能的实施方式中,针对各所述用户类型中的任意一个第二用户类型,所述第三确定单元具体用于:
获取所述第二用户类型对应的属性信息的至少一个属性类型;
在所述第二用户类型对应的样本用户的属性信息中,获取各所述属性类型对应的属性信息集合;
对各所述属性类型对应的属性信息集合进行整合处理,得到各所述属性类型对应的属性信息;
根据各所述属性类型对应的属性信息,确定所述第二用户类型对应的属性信息。
本发明实施例提供的用户识别方法及装置,当需要确定待识别用户的用户类型时,用户识别装置根据待识别用户的目标属性信息、及用户识别模型中各用户类型对应的属性信息,确定各目标属性信息对应的用户类型,并根据各目标属性信息对应的用户类型,确定待识别用户的用户类型。由于目标属性信息可以体现待识别用户在互联网中的实际行为,根据待识别用户在互联网中的实际行为和用户识别模型,可以准确的确定出待识别用户的用户类型,进而提高确定待识别用户的用户类型的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的用户识别方法的应用场景示意图;
图2为本发明提供的用户识别方法的流程示意图;
图3为本发明提供的确定用户类型方法的流程示意图;
图4为本发明提供的生成用户识别模型方法的流程示意图;
图5为本发明提供的用户识别装置的结构示意图一;
图6为本发明提供的用户识别装置的结构示意图二。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明提供的用户识别方法的应用场景示意图,请参见图1,包括用户识别模型101。当需要获取待识别用户的用户类型时,可以在用户识别模型中输入待识别用户的属性信息。待识别模型101可以根据待识别用户的属性信息识别得到待识别用户的用户类型。在本申请中,待识别模型101为根据样本用户的属性信息生成的,以使待识别模型101可以根据待识别用户的属性信息,对待识别用户进行准确的识别,以获取准确的用户类型。下面,通过具体实施例对本申请所示的技术方案进行详细说明。
需要说明的是,下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
图2为本发明提供的用户识别方法的流程示意图,请参见图2,该方法可以包括:
S201、获取待识别用户的至少一个目标属性信息;
S202、获取用户识别模型,用户识别模型中包括至少两个用户类型、及各用户类型对应的属性信息;
S203、根据各目标属性信息、及各用户类型对应的属性信息,确定各目标属性信息对应的用户类型;
S204、根据各目标属性信息对应的用户类型,确定待识别用户的用户类型。
本发明实施例的执行主体可以为用户识别装置,该用户识别装置可以设置在数据服务器中。可选的,该用户识别装置可以通过软件和/或硬件实现。
在本发明实施例中,用户识别装置对各个用户的用户类型的识别方法相同。下面,以用户识别装置对待识别用户的用户类型进行识别的过程为例,对图2实施例所示的方法进行详细说明。
在实际应用过程中,当用户识别装置需要对待识别用户的用户类型进行识别时,先获取待识别用户的至少一个目标属性信息。可选的,用户识别装置可以获取所述待识别用户对应的日志信息,并根据用户识别模型中各用户类型对应的属性信息的类型,在日志信息中获取目标属性信息。该日志信息可以为待识别用户在互联网中发布网络行为的过程中生成的,因此,目标属性信息可以体现待识别用户在互联网中的实际行为。可选的,目标属性信息可以包括待识别用户一天内在网络发布帖子的数量、待识别用户登录预设网站的频繁度等。
用户识别装置还获取用户识别模型,该用户识别模型中包括至少两个用户类型、及各用户类型对应的属性信息。可选的,该用户识别模型可以为预先生成的。例如,用户识别模型可以如表1所示:
表1
/ 用户类型1 用户类型2 ……
属性信息类型1 属性信息11 属性信息21 ……
属性信息类型2 属性信息12 属性信息21 ……
属性信息类型3 属性信息13 属性信息21 ……
…… …… …… ……
需要说明的是,表1指示以示例的形式示意用户识别模型,并不是对用户识别模型的限定,在实际应用过程中,可以根据实际需要设置该用户识别模型。
在用户识别装置获取得到目标属性信息及用户识别模型之后,用户识别装置根据各目标属性信息、及各用户类型对应的属性信息,确定各目标属性信息对应的用户类型。可选的,用户识别装置可以在各用户类型对应的属性信息中,获取目标属性信息匹配的匹配属性信息,并将匹配属性信息对应的用户类型确定为目标属性信息对应的用户类型。
用户识别装置根据各目标属性信息对应的用户类型,确定待识别用户的用户类型。例如,假设待识别用户的目标属性信息的个数为5个,若其中3个目标属性信息对应的用户类型均为用户类型1,则可以确定待识别用户的用户类型为用户类型1。
本发明实施例提供的用户识别方法,当需要确定待识别用户的用户类型时,用户识别装置根据待识别用户的目标属性信息、及用户识别模型中各用户类型对应的属性信息,确定各目标属性信息对应的用户类型,并根据各目标属性信息对应的用户类型,确定待识别用户的用户类型。由于目标属性信息可以体现待识别用户在互联网中的实际行为,根据待识别用户在互联网中的实际行为和用户识别模型,可以准确的确定出待识别用户的用户类型,进而提高确定待识别用户的用户类型的准确性。
在图2所示实施例的基础上,可选的,用户识别装置可以通过如下可行的实现方式根据各目标属性信息对应的用户类型,确定待识别用户的用户类型(图2所示实施例的中的S204),具体的,请参见图3所示的实施例。
图3为本发明提供的确定用户类型方法的流程示意图,请参见图3,该方法可以包括:
S301、获取各目标属性信息的权重值;
S302、根据各目标属性信息的权重值、各目标属性信息对应的用户类型,确定待识别用户与各用户类型的匹配系数;
S303、根据待识别用户与各用户类型的匹配系数,确定待识别用户的用户类型。
在图3所示的实施例中,用户识别装置可以获取待识别用户的各目标属性信息的权重值,该权重值可以体现各目标属性信息的重要程度。在实际应用过程中,可以根据实际需要确定各目标属性信息的权重值。
用户识别获取各目标属性信息的权重值之后,根据各目标属性信息的权重值、各目标属性信息对应的用户类型,确定待识别用户与各用户类型的匹配系数。针对各用户类型中的任意一个第一用户类型,可以根据如下公式一,确定待识别用户与第一用户类型的匹配系数P:
其中,n为目标属性信息的个数,λi为第i个目标属性信息的权重值,Ki为第i个目标属性信息与第一用户类型的匹配度,其中,若第i个目标属性信息对应的用户类型为第一用户类型,则Ki为1,否则,Ki为0。
在用户识别装置获取得到待识别用户与各用户类型的匹配系数之后,用户识别装置根据待识别用户与各用户类型的匹配系数,确定待识别用户的用户类型。可选的,用户识别装置将与待识别用户的匹配系数最高的用户类型确定为待识别用户的用户类型。
下面,通过具体示例,对图2-图3实施例所示的方法进行详细说明。
示例性的,假设待识别用户为用户1,当需要确定用户1的用户类型时,先获取用户1的目标属性信息,假设用户1的目标属性信息、及各目标属性信息对应的权重值如表2所示:
表2
用户识别装置还获取用户识别模型,假设用户识别模型如表3所示:
表3
属性信息的类型 个人用户 商家用户
日发帖量 1-10 20-100
绑定手机号个数 1-4 5-20
日常登录频繁度 1-15 30-200
用户识别装置先判断用户1的日发帖量(5)与个人用户的日发帖量(1-10)相匹配,则用户识别装置确定用户1的日发帖量对应的用户类型为个人用户。
用户识别装置先判断用户1的绑定手机号个数(3)与个人用户的绑定手机号个数(1-4)相匹配,则用户识别装置确定用户1的绑定手机号个数对应的用户类型为个人用户。
用户识别装置先判断用户1的日常登录频繁度(35)与商家用户的日常登录频繁度(30-200)相匹配,则用户识别装置确定用户1的30-200对应的用户类型为商家用户。
在用户识别装置确定得到用户1的各个目标属性信息对应的用户类型之后,用户识别装置根据各目标属性信息的权重值、及各目标属性信息对应的用户类型,确定用户1与各用户类型的匹配系数:
用户1与个人用户的匹配系数为:
P=0.5×1+0.3×1+0.2×0=0.8;
用户1与商家用户的匹配系数为:
P=0.5×0+0.3×0+0.2×1=0.2;
由上可知,用户1与个人用户的匹配系数为0.8,用户1与商家用户的匹配系数为0.2,因此,可以确定用户1的用户类型为个人用户。
在上述任意一个实施例的基础上,在用户识别装置获取用户识别模型之前,需要先生成用户识别模型,可选的,可以通过如下可行的实现方式生成用户识别模型,具体的,请参见图4所示的实施例。
图4为本发明提供的生成用户识别模型方法的流程示意图,请参见图4,该方法可以包括:
S401、确定各用户类型对应的样本用户;
S402、获取各样本用户的属性信息;
S403、根据各样本用户的属性信息,生成用户识别模型。
在图4所示的实施例中,当用户识别装置需要生成用户识别模型时,先确定用户识别模型中包括的用户类型,并确定各用户类型对应的样本用户。其中,一种用户类型对应的样本用户为已被确认为该用户类型的用户。
用户识别装置获取各样本用户的属性信息,并根据各样本用户的属性信息,生成用户识别模型。可选的,用户识别装置可以根据各用户类型对应的样本用户的属性信息,确定各用户类型对应的属性信息;根据各用户类型对应的属性信息,生成用户识别模型。
在上述过程中,用户识别装置确定各用户类型对应的属性信息的过程相同。具体的,针对各用户类型中的任意一个第二用户类型,可以通过如下可行的实现方式获取第二用户类型对应的属性信息:获取第二用户类型对应的属性信息的至少一个属性类型;在第二用户类型对应的样本用户的属性信息中,获取各属性类型对应的属性信息集合;对各属性类型对应的属性信息集合进行整合处理,得到各属性类型对应的属性信息;根据各属性类型对应的属性信息,确定第二用户类型对应的属性信息。
下面,通过具体示例,对图4实施例所示的方法进行详细说明。
假设用户识别模型中包括两种用户类型,分别为个人用户类型和商家用户类型。用户识别装置获取个人用户类型对应的100个样本用户,分别记为样本用户1-样本用户100,用户识别装置还获取商家用户类型对应的100个样本用户,分别记为样本用户101-样本用户200。
用户识别装置获取样本用户1-样本用户100的属性信息,并根据样本用户1-样本用户100的属性信息,确定个人用户类型对应的属性信息。具体的,用户识别装置获取个人用户类型的属性信息的3属性类型,分别为日发帖量、绑定手机号个数、及日常登录频繁度,则用户识别装置先获取样本用户1-样本用户100的日发帖量,并对样本用户1-样本用户100的日发帖量进行整合处理,得到日发帖量对应的属性信息,假设样本用户1-样本用户100中90%以上用户的日发帖量都在1-10之间,则确定个人用户的日发帖量对应的属性信息为1-10。同理,用户识别装置获取个人用户的绑定手机号个数和日常登录频繁度的属性信息。
用户识别装置获取样本用户101-样本用户200的属性信息,并根据样本用户101-样本用户200的属性信息,确定商家用户类型对应的属性信息。具体的,用户识别装置获取商家用户类型的属性信息的3属性类型,分别为日发帖量、绑定手机号个数、及日常登录频繁度,则用户识别装置先获取样本用户101-样本用户200的日发帖量,并对样本用户101-样本用户200的日发帖量进行整合处理,得到日发帖量对应的属性信息,假设样本用户101-样本用户200中85%以上用户的日发帖量都在20-100之间,则确定商家用户的日发帖量对应的属性信息为20-100。同理,用户识别装置获取商家用户的绑定手机号个数和日常登录频繁度的属性信息。
需要说明的是,在用户识别装置获取得到的用户识别模型之后,可以对用户识别模型进行测试,并可以根据测试结果对用户识别模型中的参数进行调节。例如,可以调节对象识别模型中包括的用户类型、样本集合、样本个数等。通过对用户识别模型中的参数进行调节,以提高用户识别模型对用户类型识别的精确性。
图5为本发明提供的用户识别装置的结构示意图一,请参见图5,该装置可以包括:
第一获取模块501,用于获取待识别用户的至少一个目标属性信息;
第二获取模块502,用于获取用户识别模型,所述用户识别模型中包括至少两个用户类型、及各所述用户类型对应的属性信息;
第一确定模块503,用于根据各所述目标属性信息、及各所述用户类型对应的属性信息,确定各所述目标属性信息对应的用户类型;
第二确定模块504,用于根据各所述目标属性信息对应的用户类型,确定所述待识别用户的用户类型。
本发明实施例提供的用户识别装置可以执行上述方法实施例所示的技术方案,其实现原理以及有益效果类似,此处不再进行赘述。
在一种可能的实施方式中,所述第一获取模块501具体用于:
获取所述待识别用户对应的日志信息;
根据所述用户识别模型中各所述用户类型对应的属性信息的类型,在所述日志信息中获取所述目标属性信息。
在另一种可能的实施方式中,所述第一确定模块503具体用于:
在各所述用户类型对应的属性信息中,获取所述目标属性信息匹配的匹配属性信息;
将所述匹配属性信息对应的用户类型确定为所述目标属性信息对应的用户类型。
图6为本发明提供的用户识别装置的结构示意图二,在图5所示实施例的基础上,请参见图6,所述第二确定模块504包括获取单元5041、第一确定单元5042及第二确定单元5043,其中,
所述获取单元5041用于,获取各所述目标属性信息的权重值;
所述第一确定单元5042用于,根据各所述目标属性信息的权重值、各所述目标属性信息对应的用户类型,确定所述待识别用户与各用户类型的匹配系数;
所述第二确定单元5043用于,根据所述待识别用户与各用户类型的匹配系数,确定所述待识别用户的用户类型。
在另一种可能的实施方式中,针对各所述用户类型中的任意一个第一用户类型,所述第一确定单元5042具体用于:
根据如下公式一,确定所述待识别用户与所述第一用户类型的匹配系数P:
其中,所述n为所述目标属性信息的个数,所述λi为第i个目标属性信息的权重值,所述Ki为所述第i个目标属性信息与所述第一用户类型的匹配度,其中,若所述第i个目标属性信息对应的用户类型为所述第一用户类型,则所述Ki为1,否则,所述Ki为0。
进一步的,所述装置还包括第三确定模块505、第三获取模块506和生成模块507,其中,
所述第三确定模块505用于,在所述第二获取模块502获取用户识别模型之前,确定各所述用户类型对应的样本用户;
所述第三获取模块506用于,获取各所述样本用户的属性信息;
所述生成模块507用于,根据各所述样本用户的属性信息,生成所述用户识别模型。
在另一种可能的实施方式中,所述生成模块507包括第三确定单元5071和生成单元5072,其中,
所述第三确定单元5071用于,根据各所述用户类型对应的样本用户的属性信息,确定各所述用户类型对应的属性信息;
所述生成单元5072用于,根据各所述用户类型对应的属性信息,生成所述用户识别模型。
在另一种可能的实施方式中,针对各所述用户类型中的任意一个第二用户类型,所述第三确定单元5071具体用于:
获取所述第二用户类型对应的属性信息的至少一个属性类型;
在所述第二用户类型对应的样本用户的属性信息中,获取各所述属性类型对应的属性信息集合;
对各所述属性类型对应的属性信息集合进行整合处理,得到各所述属性类型对应的属性信息;
根据各所述属性类型对应的属性信息,确定所述第二用户类型对应的属性信息。
本发明实施例提供的用户识别装置可以执行上述方法实施例所示的技术方案,其实现原理以及有益效果类似,此处不再进行赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (16)

1.一种用户识别方法,其特征在于,包括:
获取待识别用户的至少一个目标属性信息;
获取用户识别模型,所述用户识别模型中包括至少两个用户类型、及各所述用户类型对应的属性信息;
根据各所述目标属性信息、及各所述用户类型对应的属性信息,确定各所述目标属性信息对应的用户类型;
根据各所述目标属性信息对应的用户类型,确定所述待识别用户的用户类型。
2.根据权利要求1所述的方法,其特征在于,所述获取待识别用户的至少一个目标属性信息,包括:
获取所述待识别用户对应的日志信息;
根据所述用户识别模型中各所述用户类型对应的属性信息的类型,在所述日志信息中获取所述目标属性信息。
3.根据权利要求1或2所述的方法,其特征在于,根据各所述目标属性信息、及各所述用户类型对应的属性信息,确定各所述目标属性信息对应的用户类型,包括:
在各所述用户类型对应的属性信息中,获取所述目标属性信息匹配的匹配属性信息;
将所述匹配属性信息对应的用户类型确定为所述目标属性信息对应的用户类型。
4.根据权利要求1或2所述的方法,其特征在于,根据各所述目标属性信息对应的用户类型,确定所述待识别用户的用户类型,包括:
获取各所述目标属性信息的权重值;
根据各所述目标属性信息的权重值、各所述目标属性信息对应的用户类型,确定所述待识别用户与各用户类型的匹配系数;
根据所述待识别用户与各用户类型的匹配系数,确定所述待识别用户的用户类型。
5.根据权利要求4所述的方法,其特征在于,针对各所述用户类型中的任意一个第一用户类型,所述根据各所述目标属性信息的权重值、各所述目标属性信息对应的用户类型,确定所述待识别用户与各用户类型的匹配系数,包括:
根据如下公式一,确定所述待识别用户与所述第一用户类型的匹配系数P:
其中,所述n为所述目标属性信息的个数,所述λi为第i个目标属性信息的权重值,所述Ki为所述第i个目标属性信息与所述第一用户类型的匹配度,其中,若所述第i个目标属性信息对应的用户类型为所述第一用户类型,则所述Ki为1,否则,所述Ki为0。
6.根据权利要求1或2所述的方法,其特征在于,所述获取用户识别模型之前,还包括:
确定各所述用户类型对应的样本用户;
获取各所述样本用户的属性信息;
根据各所述样本用户的属性信息,生成所述用户识别模型。
7.根据权利要求6所述的方法,其特征在于,根据各所述样本用户的属性信息,生成所述用户识别模型,包括:
根据各所述用户类型对应的样本用户的属性信息,确定各所述用户类型对应的属性信息;
根据各所述用户类型对应的属性信息,生成所述用户识别模型。
8.根据权利要求7所述的方法,其特征在于,针对各所述用户类型中的任意一个第二用户类型,所述根据各所述用户类型对应的样本用户的属性信息,确定各所述用户类型对应的属性信息,包括:
获取所述第二用户类型对应的属性信息的至少一个属性类型;
在所述第二用户类型对应的样本用户的属性信息中,获取各所述属性类型对应的属性信息集合;
对各所述属性类型对应的属性信息集合进行整合处理,得到各所述属性类型对应的属性信息;
根据各所述属性类型对应的属性信息,确定所述第二用户类型对应的属性信息。
9.一种用户识别装置,其特征在于,包括:
第一获取模块,用于获取待识别用户的至少一个目标属性信息;
第二获取模块,用于获取用户识别模型,所述用户识别模型中包括至少两个用户类型、及各所述用户类型对应的属性信息;
第一确定模块,用于根据各所述目标属性信息、及各所述用户类型对应的属性信息,确定各所述目标属性信息对应的用户类型;
第二确定模块,用于根据各所述目标属性信息对应的用户类型,确定所述待识别用户的用户类型。
10.根据权利要求9所述的装置,其特征在于,所述第一获取模块具体用于:
获取所述待识别用户对应的日志信息;
根据所述用户识别模型中各所述用户类型对应的属性信息的类型,在所述日志信息中获取所述目标属性信息。
11.根据权利要求9或10所述的装置,其特征在于,所述第一确定模块具体用于:
在各所述用户类型对应的属性信息中,获取所述目标属性信息匹配的匹配属性信息;
将所述匹配属性信息对应的用户类型确定为所述目标属性信息对应的用户类型。
12.根据权利要求9或10所述的装置,其特征在于,所述第二确定模块包括获取单元、第一确定单元及第二确定单元,其中,
所述获取单元用于,获取各所述目标属性信息的权重值;
所述第一确定单元用于,根据各所述目标属性信息的权重值、各所述目标属性信息对应的用户类型,确定所述待识别用户与各用户类型的匹配系数;
所述第二确定单元用于,根据所述待识别用户与各用户类型的匹配系数,确定所述待识别用户的用户类型。
13.根据权利要求12所述的装置,其特征在于,针对各所述用户类型中的任意一个第一用户类型,所述第一确定单元具体用于:
根据如下公式一,确定所述待识别用户与所述第一用户类型的匹配系数P:
其中,所述n为所述目标属性信息的个数,所述λi为第i个目标属性信息的权重值,所述Ki为所述第i个目标属性信息与所述第一用户类型的匹配度,其中,若所述第i个目标属性信息对应的用户类型为所述第一用户类型,则所述Ki为1,否则,所述Ki为0。
14.根据权利要求9或10所述的装置,其特征在于,所述装置还包括第三确定模块、第三获取模块和生成模块,其中,
所述第三确定模块用于,在所述第二获取模块获取用户识别模型之前,确定各所述用户类型对应的样本用户;
所述第三获取模块用于,获取各所述样本用户的属性信息;
所述生成模块用于,根据各所述样本用户的属性信息,生成所述用户识别模型。
15.根据权利要求14所述的装置,其特征在于,所述生成模块包括第三确定单元和生成单元,其中,
所述第三确定单元用于,根据各所述用户类型对应的样本用户的属性信息,确定各所述用户类型对应的属性信息;
所述生成单元用于,根据各所述用户类型对应的属性信息,生成所述用户识别模型。
16.根据权利要求15所述的装置,其特征在于,针对各所述用户类型中的任意一个第二用户类型,所述第三确定单元具体用于:
获取所述第二用户类型对应的属性信息的至少一个属性类型;
在所述第二用户类型对应的样本用户的属性信息中,获取各所述属性类型对应的属性信息集合;
对各所述属性类型对应的属性信息集合进行整合处理,得到各所述属性类型对应的属性信息;
根据各所述属性类型对应的属性信息,确定所述第二用户类型对应的属性信息。
CN201610666003.8A 2016-08-11 2016-08-11 用户识别方法及装置 Pending CN106295701A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610666003.8A CN106295701A (zh) 2016-08-11 2016-08-11 用户识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610666003.8A CN106295701A (zh) 2016-08-11 2016-08-11 用户识别方法及装置

Publications (1)

Publication Number Publication Date
CN106295701A true CN106295701A (zh) 2017-01-04

Family

ID=57671831

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610666003.8A Pending CN106295701A (zh) 2016-08-11 2016-08-11 用户识别方法及装置

Country Status (1)

Country Link
CN (1) CN106295701A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108959870A (zh) * 2018-07-10 2018-12-07 北京奇艺世纪科技有限公司 一种用户识别方法及装置
CN109033285A (zh) * 2018-07-12 2018-12-18 北京比特智学科技有限公司 信息推送方法及装置
CN109191167A (zh) * 2018-07-17 2019-01-11 阿里巴巴集团控股有限公司 一种目标用户的挖掘方法和装置
CN112115357A (zh) * 2020-09-11 2020-12-22 华中师范大学 一种在线课程论坛交互模式识别方法及系统
CN112580494A (zh) * 2020-12-16 2021-03-30 北京影谱科技股份有限公司 基于深度学习的监控视频中人员的识别跟踪方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1244010A1 (en) * 2001-03-20 2002-09-25 SAP Portals Europe GmbH Method, computer program product and article of manufacture for providing service-to-role assignment to launch application services in role-based computer system
CN102609460A (zh) * 2012-01-13 2012-07-25 中国科学院计算技术研究所 微博客数据采集方法及系统
CN103412930A (zh) * 2013-08-17 2013-11-27 北京品友互动信息技术有限公司 一种互联网用户属性识别方法
CN103914494A (zh) * 2013-01-09 2014-07-09 北大方正集团有限公司 一种微博用户身份识别方法及系统
CN105096161A (zh) * 2015-07-17 2015-11-25 腾讯科技(深圳)有限公司 一种进行信息展示的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1244010A1 (en) * 2001-03-20 2002-09-25 SAP Portals Europe GmbH Method, computer program product and article of manufacture for providing service-to-role assignment to launch application services in role-based computer system
CN102609460A (zh) * 2012-01-13 2012-07-25 中国科学院计算技术研究所 微博客数据采集方法及系统
CN103914494A (zh) * 2013-01-09 2014-07-09 北大方正集团有限公司 一种微博用户身份识别方法及系统
CN103412930A (zh) * 2013-08-17 2013-11-27 北京品友互动信息技术有限公司 一种互联网用户属性识别方法
CN105096161A (zh) * 2015-07-17 2015-11-25 腾讯科技(深圳)有限公司 一种进行信息展示的方法和装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108959870A (zh) * 2018-07-10 2018-12-07 北京奇艺世纪科技有限公司 一种用户识别方法及装置
CN108959870B (zh) * 2018-07-10 2021-01-22 北京奇艺世纪科技有限公司 一种用户识别方法及装置
CN109033285A (zh) * 2018-07-12 2018-12-18 北京比特智学科技有限公司 信息推送方法及装置
CN109191167A (zh) * 2018-07-17 2019-01-11 阿里巴巴集团控股有限公司 一种目标用户的挖掘方法和装置
CN112115357A (zh) * 2020-09-11 2020-12-22 华中师范大学 一种在线课程论坛交互模式识别方法及系统
CN112580494A (zh) * 2020-12-16 2021-03-30 北京影谱科技股份有限公司 基于深度学习的监控视频中人员的识别跟踪方法和装置

Similar Documents

Publication Publication Date Title
CN106295701A (zh) 用户识别方法及装置
Gadiraju et al. A taxonomy of microtasks on the web
CN103368986B (zh) 一种信息推荐方法及信息推荐装置
US9978084B1 (en) Configurable relevance service test platform
US8341101B1 (en) Determining relationships between data items and individuals, and dynamically calculating a metric score based on groups of characteristics
CN106354634A (zh) 接口测试方法及装置
WO2019024496A1 (zh) 企业推荐方法及应用服务器
CN112860841A (zh) 一种文本情感分析方法、装置、设备及存储介质
CN105868254A (zh) 信息推荐方法及装置
CN103455411B (zh) 日志分类模型的建立、行为日志分类方法及装置
Buzick et al. Using test scores from students with disabilities in teacher evaluation
CN107729330B (zh) 获取数据集的方法和装置
CN106033455B (zh) 一种处理用户操作信息的方法与设备
CN109308311A (zh) 一种多源异构数据融合系统
CN107305559A (zh) 一种应用推荐方法和装置
Sher et al. On multi-device use: Using technological modality profiles to explain differences in students' learning
CN109582834B (zh) 数据风险预测方法及装置
CN110020196A (zh) 一种基于不同数据源的用户分析方法和装置及计算设备
CN108959289B (zh) 网站类别获取方法和装置
CN104867032A (zh) 电子商务客户评价鉴别系统
WO2014050837A1 (ja) 判定装置、判定方法、及びコンピュータ読み取り可能な記録媒体
CN106294881A (zh) 信息识别方法及装置
Lane et al. Propensity score analysis: A secondary data analysis of work–life policy and performance outcomes
CN114285896B (zh) 信息推送方法、装置、设备、存储介质及程序产品
Garman et al. Enhancing efficiency, reliability, and rigor in competency model analysis using natural language processing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170104