CN114614997A - 一种身份识别方法、装置、计算机设备和存储介质 - Google Patents

一种身份识别方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN114614997A
CN114614997A CN202011317862.9A CN202011317862A CN114614997A CN 114614997 A CN114614997 A CN 114614997A CN 202011317862 A CN202011317862 A CN 202011317862A CN 114614997 A CN114614997 A CN 114614997A
Authority
CN
China
Prior art keywords
user
identity
data
identification
user identity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011317862.9A
Other languages
English (en)
Other versions
CN114614997B (zh
Inventor
周意
刘源
况荡
万鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Jiangxi Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Jiangxi Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Jiangxi Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202011317862.9A priority Critical patent/CN114614997B/zh
Publication of CN114614997A publication Critical patent/CN114614997A/zh
Application granted granted Critical
Publication of CN114614997B publication Critical patent/CN114614997B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0807Network architectures or network communication protocols for network security for authentication of entities using tickets, e.g. Kerberos
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0876Network architectures or network communication protocols for network security for authentication of entities based on the identity of the terminal or configuration, e.g. MAC address, hardware or software configuration or device fingerprint

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computing Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Power Engineering (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种身份识别方法、装置、计算机设备和存储介质。本发明实施例提供的技术方案中,获取数据记录;根据数据记录和获取的抓包数据,生成用户身份特征;对用户身份特征和构建的身份特征知识库进行汇总,生成用户身份识别规则;通过用户身份识别规则,根据获取的用户特征数据,生成用户身份识别结果,可以高效准确地识别出用户的会员身份。

Description

一种身份识别方法、装置、计算机设备和存储介质
【技术领域】
本发明涉及通信技术领域,尤其涉及一种身份识别方法、装置、计算机设备和存储介质。
【背景技术】
目前对用户会员身份的识别方法主要是通过统一资源定位器(Uniform ResourceLocator,简称:URL)的信息对用户业务进行识别,但由于现在互联网头部视频应用业务90%流量以上采用超文本传输安全协议(Hyper Text Transfer Protocol overSecureSocket Layer,简称:HTTPS)加密协议,因此目前的识别方法无法识别用户的会员身份。
【发明内容】
有鉴于此,本发明实施例提供了一种身份识别方法、装置、计算机设备和存储介质,可以高效准确地识别出用户的会员身份。
一方面,本发明实施例提供了一种身份识别方法,所述方法包括:
获取数据记录;
根据数据记录和获取的抓包数据,生成用户身份特征;
对用户身份特征和构建的身份特征知识库进行汇总,生成用户身份识别规则;
通过用户身份识别规则,根据获取的用户特征数据,生成用户身份识别结果。
可选地,在根据数据记录和获取的抓包数据,生成用户身份特征之前,还包括:
通过抓包工具对用户终端进行抓包,抓取出抓包数据。
可选地,根据数据记录和获取的抓包数据,生成用户身份特征,包括:
接收用户终端发送的地址集请求,地址集请求包括用户识别码;
按照用户识别码,从抓包数据中查询出用户的地址集,地址集包括用户会员信息;
将用户会员信息与数据记录进行匹配,匹配出用户身份特征。
可选地,抓包数据包括用户日志;
根据数据记录和获取的抓包数据,生成用户身份特征,包括:
从用户日志中提取出广告特征;
将广告特征与数据记录进行匹配,匹配出用户身份特征。
可选地,身份特征知识库包括第一地址集特征和视频类别,第一地址集特征对应于视频类别,视频类别包括广告视频或节目视频;用户身份特征包括身份标识、第二地址集信息,身份标识包括会员标识或非会员标识;
对用户身份特征和构建的身份特征知识库进行汇总,生成用户身份识别规则,包括:
从第一地址集特征中筛选出广告视频对应的第一子地址;
从第二地址集特征中筛选出非会员标识对应的第二子地址;
将第一子地址与第二子地址进行合并,生成非会员识别规则;
从第一地址集特征中筛选出节目视频对应的第三子地址;
从第二地址集特征中筛选出会员标识对应的第四子地址;
将第三子地址与第四子地址进行合并,生成会员识别规则;
将会员识别规则和非会员识别规则进行汇总,生成用户身份识别规则。
可选地,在通过用户身份识别规则,根据获取的用户特征数据,生成用户身份识别结果之前,还包括:
按照设定时间段获取用户特征数据。
可选地,用户身份识别结果包括会员身份或非会员身份;
在通过用户身份识别规则,根据获取的用户特征数据,生成用户身份识别结果之后,还包括:
对会员身份的用户添加会员标签;
对非会员身份的用户添加非会员标签。
另一方面,本发明实施例提供了一种身份识别装置,包括:
第一获取单元,用于获取数据记录;
第一生成单元,用于根据数据记录和获取的抓包数据,生成用户身份特征;
汇总单元,用于对用户身份特征和构建的身份特征知识库进行汇总,生成用户身份识别规则;
第二生成单元,用于通过用户身份识别规则,根据获取的用户特征数据,生成用户身份识别结果。
另一方面,本发明实施例提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述身份识别方法。
另一方面,本发明实施例提供了一种计算机设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,其特征在于,所述程序指令被处理器加载并执行时实现上述身份识别方法。
本发明实施例的方案中,获取数据记录;根据数据记录和获取的抓包数据,生成用户身份特征;对用户身份特征和构建的身份特征知识库进行汇总,生成用户身份识别规则;通过用户身份识别规则,根据获取的用户特征数据,生成用户身份识别结果,可以高效准确地识别出用户的会员身份。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种身份识别方法的流程图;
图2为本发明实施例提供的又一种身份识别方法的流程图;
图3为本发明实施例提供的用户ID对应的FAT URL的查询示意图;
图4为本发明实施例提供一种以数据记录为XDR为例的数据示意图;
图5为本发明实施例提供的一种身份识别装置的结构示意图;
图6为本发明实施例提供的一种计算机设备的示意图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二等来描述设定阈值,但这些设定阈值不应限于这些术语。这些术语仅用来将设定阈值彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一设定阈值也可以被称为第二设定阈值,类似地,第二设定阈值也可以被称为第一设定阈值。
图1为本发明实施例提供的一种身份识别方法的流程图,如图1所示,该方法包括:
步骤101、获取数据记录。
步骤102、根据数据记录和获取的抓包数据,生成用户身份特征。
步骤103、对用户身份特征和构建的身份特征知识库进行汇总,生成用户身份识别规则。
步骤104、通过用户身份识别规则,根据获取的用户特征数据,生成用户身份识别结果。
本发明实施例提供的技术方案中,获取数据记录;根据数据记录和获取的抓包数据,生成用户身份特征;对用户身份特征和构建的身份特征知识库进行汇总,生成用户身份识别规则;通过用户身份识别规则,根据获取的用户特征数据,生成用户身份识别结果,可以高效准确地识别出用户的会员身份。
图2为本发明实施例提供的又一种身份识别方法的流程图,如图2所示,该方法包括:
步骤201、获取数据记录。
本发明实施例中,各步骤由服务器执行。
本发明实施例中,数据记录为XDR(X Data Recording),XDR是由呼叫数据记录(Call Data Recording,简称:CDR)演变而来的概念。CDR是传统通信网中对通话过程中网络关键信息的记录。XDR是CDR概念的扩展,在本发明实施例中泛指对移动网络和承载网络中数据流量的关键信息记录,即:流量日志,以用户会话为单位,一个用户会话形成一条XDR。
本发明实施例中,数据记录包括域名(Domain)、路径(Path)、用户代理(User_agent)、安全性(Secure)、URL主机(host)和通一资源标志符(UniformResourceIdentifier,URI)。
步骤202、通过抓包工具对用户终端进行抓包,抓取出抓包数据。
作为一种可选方案,抓包工具为Wireshark,Wireshark是一个网络封包分析软件。
本发明实施例中,步骤202具体包括:
步骤2021、用户终端通过网关向服务器发送第一信号,第一信号包括随机数字和第一加密方法。
本发明实施例中,第一信号为Client Hello信号,第一加密方法为用户终端支持的加密方法。
步骤2022、服务器通过网管向用户终端发送第二信号,第二信号包括随机数字和第二加密方法。
本发明实施例中,第二信号为Server Hello信号,第二加密方法为用户终端和服务器均支持的加密方法。
进一步地,服务器通过用户端发送认证权限(Certification Authority,简称:CA)证书。
步骤2023、服务器通过网关向用户终端发送第三信号,第三信号包括密钥交换(DH)算法的参数和交换密钥(Server Key Change),并根据该参数和交换密钥生成第一对称密钥。
本发明实施例中,第三信号为Server Hello Done信号。
步骤2024、响应于用户终端对CA证书验证成功,根据DH算法的参数和交换密钥生成第二对称密钥,第一对称密钥与第二对称密钥相同。
步骤2025、用户终端通过网关向服务器发送第四信号。
本发明实施例中,第四信号更高密码(Change cipher)信号。
本发明实施例中,服务器接收到第四信号,表明完成加密。
步骤2026、用户端接收用户输入的登录信息,并通过网关将登录信息发送至服务器。
步骤2027、响应于服务器对登录信息验证成功,通过网关向用户终端发送登录成功消息,登录成功消息包括登录界面资源压缩下载包。
步骤2028、用户终端接收用户点击的播视频按钮,并通过FAT URL向服务器发送用户识别码(ID)、用户登录方式和用户会员信息。
步骤2029、服务器通过用户会员信息判断该用户是否为会员用户,若是,执行步骤2133;若否,执行步骤2130。
本发明实施例中,服务器记录点播内容。
步骤2130、服务器通过网关向用户终端发送广告信息并记录广告开始时间。
步骤2131、用户终端根据广告信息并播放广告,以供普通用户观看。
本发明实施例中,用户终端在播放广告的同时,向服务器发送视频文件分片文件信息请求,视频文件分片文件信息请求包括字段标志;服务器根据字段标志查询出视频文件分片文件信息,并将视频文件分片文件信息发送至用户终端。例如:字段标志包括#EXT-X-MEDIA-SEQUENCE,视频文件分片文件信息包括第一个分片的序列号;字段标志包括#EXT-X-TARGETDURATION,视频文件分片文件信息包括每个分片TS的最大的时长;字段标志包括#EXT-X-ENDLIST,视频文件分片文件信息包括文件结束符;字段标志包括#EXTINF extrainfo,视频文件分片文件信息包括分片信息,如时长、带宽等;字段标志包括EXT-X-PLAYLIST-TYPE,视频文件分片文件信息包括多媒体文件(PlayList)的可变性信息。
本发明实施例中,视频文件分片文件为m3u8格式。
步骤2132、用户终端通过网关向服务器发送观看广告结束消息和视频分片数据请求,视频分片数据请求包括字段标志。
步骤2133、服务器向用户终端记录广告结束时间,并按照字段标志查询出视频内容文件,将视频内容文件发送至用户终端。
本发明实施例中,服务器将视频内容文件发送至用户终端后,记录视频观看开始时间。
本发明实施例中,若用户为会员用户,由于会员用户不需要观看广告,因此不需要记录广告结束时间,可以直接观看视频内容。
步骤2134、用户终端向服务器发送视频观看结束消息。
步骤2135、服务器记录视频观看结束时间。
本发明实施例中,抓包数据包括会员用户和普通用户分别提交的用户日志。以腾讯视频、爱奇艺视频和优酷视频三大互联网头部视频应用程序为例,会员用户的用户日志包括点播内容、视频观看开始时间和视频观看结束时间;普通用户的用户日志包括视频观看开始时间、视频观看结束时间、点播内容、广告开始时间和广告结束时间。将用户日志进行汇总,生成业务日志,例如:业务日志如表1所示:
表1
Figure BDA0002791821090000091
其中,App名称为应用程序的名称。
本发明实施例中,抓包数据包括用户ID、地址集(FAT URL)、App名称、视频类别和视频标识。
步骤203、根据数据记录和获取的抓包数据,生成用户身份特征。
本发明实施例中,步骤203具体包括:
步骤2031、接收用户终端发送的FAT URL请求,FAT URL请求包括用户ID。
本发明实施例中,用户终端向服务器发送FAT URL请求,FAT URL请求包括用户ID。
步骤2032、按照用户ID,从抓包数据中查询出用户的FAT URL,FAT URL包括用户会员信息。
本发明实施例中,从抓包数据中查询出用户ID对应的FAT URL,FAT URL包括与用户ID相关的所有状态信息,该状态信息包括用户ID、用户登录方式、用户会员信息。
图3为本发明实施例提供的用户ID对应的FAT URL的查询示意图,如图3所示,用户登录方式、用户ID和用户会员信息在图3中以圆圈的方式勾画内容,并用箭头指示勾画的内容代表的含义。具体地,用户登录方式(f_logintype)为qq;用户ID(f_vuid)为328612613;用户会员信息(f_vip)为0,标识该用户是普通用户。
步骤2033、将用户会员信息与数据记录进行匹配,匹配出用户身份特征。
本发明实施例中,通过用户会员信息与数据记录进行匹配,查询出用户会员信息对应的数据记录,生成用户身份特征。例如:用户身份特征如表2所示:
表2
Figure BDA0002791821090000101
其中,Domain为域名、Path为路径、User_agent为用户代理、Secure为安全性,Name为状态信息,Value为状态信息的值。
进一步地,由于有些业务站点会为每个用户生成特定版本的URL,用于追踪用户的身份,通常会对真正的URL进行扩展,在URL路径开始或结束的地方添加一些其他的状态信息。用户浏览站点时,Web服务器会动态生成一些超链,继续维护URL中的状态信息,将Web服务器上若干个独立的HTTP事务捆绑成一个地址集。
本发明实施例中,服务器可以通过用户会员信息直接识别出用户的会员身份,若用户会员信息中f_vip=0,表明该用户为普通用户;若用户会员信息中f_vip=1,表明该用户为会员用户。
作为一种可选方案,步骤203具体包括:
步骤3031、从用户日志中提取出广告特征。
步骤3032、将广告特征与数据记录进行匹配,匹配出用户身份特征。
图4为本发明实施例提供一种以数据记录为XDR为例的数据示意图,如图4所示,XDR包括host域名和URI。
本发明实施例中,以数据记录为XDR为例,将广告特征与XDR进行匹配,匹配出广告特征对应的host域名和URI。
步骤204、从第一地址集特征中筛选出广告视频对应的第一子地址。
本发明实施例中,根据抓包数据预先构建身份特征知识库。身份特征知识库包括第一URL特征、App名称、视频标识和视频类别,第一URL特征对应于视频类别,第一URL特征对应于抓包数据的URL,视频类别包括广告视频或节目视频;用户身份特征包括身份标识、第二URL特征,身份标识包括会员标识或非会员标识。例如:App名称为腾讯视频的身份特征知识库如表3所示,App名称为爱奇艺的身份特征知识库如表4所示,App名称为优酷视频的身份特征知识库如表5所示。
表3
序号 App名称 第一URL特征 视频类别 视频标识
1 腾讯视频 video.dispatch.tc.qq.com 广告视频 b02050nzxy0
2 腾讯视频 vlive.qqvideo.tc,qq.com 广告视频 0205olc4fa
3 腾讯视频 btrace.qq.com/kvcollect 节目视频 f_vip=1
4 腾讯视频 btrace.qq.com/kvcollect 节目视频 f_vip=0
表4
Figure BDA0002791821090000121
其中,表4中空白表示无限制条件。
表5
Figure BDA0002791821090000131
其中,表5中空白表示无限制条件。
例如:从腾讯视频的身份特征知识库的第一URL特征中筛选出广告视频对应的第一子地址vlive.qqvideo.tc,qq.com和video.dispatch.tc.qq.com。
步骤205、从第二URL特征中筛选出非会员标识对应的第二子地址。
例如:从用户身份特征中的第二URL特征筛选出非会员标识对应的第二子地址。
步骤206、将第一子地址与第二子地址进行合并,生成非会员识别规则。
本发明实施例中,将第一子地址和第二子地址的相同部分进行合并,生成非会员识别规则。
步骤207、从第一URL特征中筛选出节目视频对应的第三子地址。
例如:从腾讯视频的身份特征知识库的第一URL特征中筛选出节目视频对应的第三子地址btrace.qq.com/kvcollect。
步骤208、从第二地址集特征中筛选出会员标识对应的第四子地址。
例如:从用户身份特征中的第二URL特征筛选出非会员标识对应的第四子地址。
步骤209、将第三子地址与第四子地址进行合并,生成会员识别规则。
本发明实施例中,将第三子地址和第四子地址的相同部分进行合并,生成会员识别规则。
步骤210、将会员识别规则和非会员识别规则进行汇总,生成用户身份识别规则。
例如:用户身份识别规则如表6所示:
表6
Figure BDA0002791821090000151
进一步地,对XDR进行鲁棒性验证。具体地,获取指定时间段的XDR和抓包数据,其中,指定时间段可以根据实际情况进行设置,作为一种可选方案,指定时间段为1小时;统计出用户会员信息为0的XDR的第一数量;统计出用户会员信息为1的XDR的第二数量;统计出用户会员信息为其它的XDR的第三数量;查询出普通用户对应的识别规则,并统计出每条识别规则对应的XDR的第四数量和每条识别规则在XDR中的第一占比;统计出每个网络接口及协议对应的XDR的第五数量和每个网络接口及协议在XDR中的第二占比;根据XDR总条数、第一数量、第二数量、第三数量、第四数量、第五数量、第一占比和第二占比,生成验证结果。例如:验证结果如表7所示:
表7
Figure BDA0002791821090000161
根据表8,通过支持度、置信度和提升度来评价识别规则的鲁棒性,例如:评价结果如表8所示:
表8
Figure BDA0002791821090000171
由上表可以看出,用户身份识别规则的支持度、可信度和提升度均为1,即:可以通过host域名和URI来准确识别用户身份。
步骤211、按照设定时间段获取用户特征数据。
本发明实施例中,设定时间段可根据实际情况进行设置。作为一种可选方案,设定时间段为30天。
本发明实施例中,用户特征数据包括数据记录。
步骤212、通过用户身份识别规则,根据获取的用户特征数据,生成用户身份识别结果。
本发明实施例中,通过用户身份识别规则对用户特征数据进行识别,生成用户身份识别结果。
本发明实施例中,用户身份识别结果包括会员身份或非会员身份。
例如:以腾讯视频、爱奇艺和优酷视频为例,2020年1月15日至2020年2月14日的各视频应用用户身份的识别情况如表9所示:
表9
Figure BDA0002791821090000181
步骤213、对会员身份的用户添加会员标签。
步骤214、对非会员身份的用户添加非会员标签。
本发明实施例提供的身份识别方法的技术方案中,获取数据记录;根据数据记录和获取的抓包数据,生成用户身份特征;对用户身份特征和构建的身份特征知识库进行汇总,生成用户身份识别规则;通过用户身份识别规则,根据获取的用户特征数据,生成用户身份识别结果,可以高效准确地识别出用户的会员身份。
图5为本发明实施例提供的一种虚拟专用网络登录装置的结构示意图,该装置用于执行上述虚拟专用网络登录方法,如图5所示,该装置包括:第一获取单元11、第一生成单元12、汇总单元13和第二生成单元14。
第一获取单元11用于获取数据记录。
第一生成单元12用于根据数据记录和获取的抓包数据,生成用户身份特征。
汇总单元13用于对用户身份特征和构建的身份特征知识库进行汇总,生成用户身份识别规则。
第二生成单元14用于通过用户身份识别规则,根据获取的用户特征数据,生成用户身份识别结果。
本发明实施例中,该装置还包括:抓取单元15。
抓取单元15用于通过抓包工具对用户终端进行抓包,抓取出抓包数据。
本发明实施例中,第一生成单元12具体用于接收用户终端发送的地址集请求,地址集请求包括用户识别码;按照用户识别码,从抓包数据中查询出用户的地址集,地址集包括用户会员信息;将用户会员信息与数据记录进行匹配,匹配出用户身份特征。
本发明实施例中,第一生成单元12具体用于从用户日志中提取出广告特征;将广告特征与数据记录进行匹配,匹配出用户身份特征。
本发明实施例中,汇总单元13具体用于从第一地址集特征中筛选出广告视频对应的第一子地址;从第二地址集特征中筛选出非会员标识对应的第二子地址;将第一子地址与第二子地址进行合并,生成非会员识别规则;从第一地址集特征中筛选出节目视频对应的第三子地址;从第二地址集特征中筛选出会员标识对应的第四子地址;将第三子地址与第四子地址进行合并,生成会员识别规则;将会员识别规则和非会员识别规则进行汇总,生成用户身份识别规则。
本发明实施例中,该装置还包括:获取单元16。
获取单元16用于按照设定时间段获取用户特征数据。
本发明实施例中,该装置还包括:第一添加单元17和第二添加单元18。
第一添加单元17用于对会员身份的用户添加会员标签。
第二添加单元18用于对非会员身份的用户添加非会员标签。
本发明实施例的方案中,获取数据记录;根据数据记录和获取的抓包数据,生成用户身份特征;对用户身份特征和构建的身份特征知识库进行汇总,生成用户身份识别规则;通过用户身份识别规则,根据获取的用户特征数据,生成用户身份识别结果,可以高效准确地识别出用户的会员身份。
本发明实施例提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述身份识别方法的实施例的各步骤,具体描述可参见上述身份识别方法的实施例。
本发明实施例提供了一种计算机设备,包括存储器和处理器,存储器用于存储包括程序指令的信息,处理器用于控制程序指令的执行,程序指令被处理器加载并执行时实现上述身份识别方法的实施例的各步骤,具体描述可参见上述身份识别方法的实施例。
图6为本发明实施例提供的一种计算机设备的示意图。如图6所示,该实施例的计算机设备30包括:处理器31、存储器32以及存储在存储32中并可在处理器31上运行的计算机程序33,该计算机程序33被处理器31执行时实现实施例中的应用于身份识别方法,为避免重复,此处不一一赘述。或者,该计算机程序被处理器31执行时实现实施例中应用于身份识别装置中各模型/单元的功能,为避免重复,此处不一一赘述。
计算机设备30包括,但不仅限于,处理器31、存储器32。本领域技术人员可以理解,图6仅仅是计算机设备30的示例,并不构成对计算机设备30的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如计算机设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器31可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器32可以是计算机设备30的内部存储单元,例如计算机设备30的硬盘或内存。存储器32也可以是计算机设备30的外部存储设备,例如计算机设备30上配备的插接式硬盘,智能存储(Smart Media,SM)卡,安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。进一步地,存储器32还可以既包括计算机设备30的内部存储单元也包括外部存储设备。存储器32用于存储计算机程序以及计算机设备所需的其他程序和数据。存储器32还可以用于暂时地存储已经输出或者将要输出的数据。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (10)

1.一种身份识别方法,其特征在于,所述方法包括:
获取数据记录;
根据所述数据记录和获取的抓包数据,生成用户身份特征;
对所述用户身份特征和构建的身份特征知识库进行汇总,生成用户身份识别规则;
通过所述用户身份识别规则,根据获取的用户特征数据,生成用户身份识别结果。
2.根据权利要求1所述的方法,其特征在于,在所述根据所述数据记录和获取的抓包数据,生成用户身份特征之前,还包括:
通过抓包工具对用户终端进行抓包,抓取出所述抓包数据。
3.根据权利要求2所述的方法,其特征在于,所述根据所述数据记录和获取的抓包数据,生成用户身份特征,包括:
接收用户终端发送的地址集请求,所述地址集请求包括用户识别码;
按照所述用户识别码,从所述抓包数据中查询出用户的地址集,所述地址集包括用户会员信息;
将所述用户会员信息与所述数据记录进行匹配,匹配出所述用户身份特征。
4.根据权利要求2所述的方法,其特征在于,所述抓包数据包括用户日志;
所述根据所述数据记录和获取的抓包数据,生成用户身份特征,包括:
从所述用户日志中提取出广告特征;
将所述广告特征与所述数据记录进行匹配,匹配出所述用户身份特征。
5.根据权利要求1所述的方法,其特征在于,所述身份特征知识库包括第一地址集特征和视频类别,所述第一地址集特征对应于所述视频类别,所述视频类别包括广告视频或节目视频;所述用户身份特征包括所述身份标识、第二地址集信息,所述身份标识包括会员标识或非会员标识;
所述对所述用户身份特征和构建的身份特征知识库进行汇总,生成用户身份识别规则,包括:
从所述第一地址集特征中筛选出所述广告视频对应的第一子地址;
从所述第二地址集特征中筛选出所述非会员标识对应的第二子地址;
将所述第一子地址与所述第二子地址进行合并,生成非会员识别规则;
从所述第一地址集特征中筛选出所述节目视频对应的第三子地址;
从所述第二地址集特征中筛选出所述会员标识对应的第四子地址;
将所述第三子地址与所述第四子地址进行合并,生成会员识别规则;
将所述会员识别规则和所述非会员识别规则进行汇总,生成所述用户身份识别规则。
6.根据权利要求1所述的方法,其特征在于,在所述通过所述用户身份识别规则,根据获取的用户特征数据,生成用户身份识别结果之前,还包括:
按照设定时间段获取所述用户特征数据。
7.根据权利要求6所述的方法,其特征在于,所述用户身份识别结果包括会员身份或非会员身份;
在所述通过所述用户身份识别规则,根据获取的用户特征数据,生成用户身份识别结果之后,还包括:
对所述会员身份的用户添加会员标签;
对所述非会员身份的用户添加非会员标签。
8.一种身份识别装置,其特征在于,所述装置包括:
第一获取单元,用于获取数据记录;
第一生成单元,用于根据所述数据记录和获取的抓包数据,生成用户身份特征;
汇总单元,用于对所述用户身份特征和构建的身份特征知识库进行汇总,生成用户身份识别规则;
第二生成单元,用于通过所述用户身份识别规则,根据获取的用户特征数据,生成用户身份识别结果。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至7中任意一项所述的身份识别方法。
10.一种计算机设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,其特征在于,所述程序指令被处理器加载并执行时实现权利要求1至7任意一项所述的身份识别方法。
CN202011317862.9A 2020-11-23 2020-11-23 一种身份识别方法、装置、计算机设备和存储介质 Active CN114614997B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011317862.9A CN114614997B (zh) 2020-11-23 2020-11-23 一种身份识别方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011317862.9A CN114614997B (zh) 2020-11-23 2020-11-23 一种身份识别方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN114614997A true CN114614997A (zh) 2022-06-10
CN114614997B CN114614997B (zh) 2023-07-07

Family

ID=81856134

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011317862.9A Active CN114614997B (zh) 2020-11-23 2020-11-23 一种身份识别方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN114614997B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140207813A1 (en) * 2005-05-31 2014-07-24 FairWarning, Inc. Identity mapping system and method
CN107294905A (zh) * 2016-03-30 2017-10-24 苏宁云商集团股份有限公司 一种识别用户的方法及装置
CN110446161A (zh) * 2019-07-12 2019-11-12 中国移动通信集团黑龙江有限公司 一种用户身份识别方法、装置、设备及存储介质
CN110609935A (zh) * 2019-08-29 2019-12-24 湖南草花互动网络科技有限公司 用户身份标签生成方法、装置、计算机设备和存储介质
CN111475365A (zh) * 2019-12-10 2020-07-31 南京新贝金服科技有限公司 一种基于cookie的标签式AB测试方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140207813A1 (en) * 2005-05-31 2014-07-24 FairWarning, Inc. Identity mapping system and method
CN107294905A (zh) * 2016-03-30 2017-10-24 苏宁云商集团股份有限公司 一种识别用户的方法及装置
CN110446161A (zh) * 2019-07-12 2019-11-12 中国移动通信集团黑龙江有限公司 一种用户身份识别方法、装置、设备及存储介质
CN110609935A (zh) * 2019-08-29 2019-12-24 湖南草花互动网络科技有限公司 用户身份标签生成方法、装置、计算机设备和存储介质
CN111475365A (zh) * 2019-12-10 2020-07-31 南京新贝金服科技有限公司 一种基于cookie的标签式AB测试方法及系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
卢喜利;周军;周月鹏;: "基于Cookie技术和启发式规则的用户识别算法", 微计算机应用 *
孙丽娟;: "运营商大数据变现实践", 通信企业管理 *
张春生;庄丽艳;: "基于兴趣的Web挖掘中用户身份的识别新方法", 计算机技术与发展 *
张玺;张学玲;张洪欣;: "基于Web日志的数据预处理方法研究", 滨州学院学报 *
彭如香;杨涛;孔华锋;王永剑;: "基于广告联盟的虚拟身份画像方法研究", 计算机应用与软件 *

Also Published As

Publication number Publication date
CN114614997B (zh) 2023-07-07

Similar Documents

Publication Publication Date Title
US10650119B2 (en) Multimedia data processing method, apparatus, system, and storage medium
US9508077B2 (en) Podcasting having inserted content distinct from the podcast content
CN107666619B (zh) 直播数据传输方法、装置、电子设备、服务器及存储介质
WO2017101423A1 (zh) 广告推送方法、装置、视频服务器及终端设备
CN108243188B (zh) 一种接口访问、接口调用和接口验证处理方法及装置
CN107370780B (zh) 基于互联网的媒体推送方法、装置和系统
CN106878265A (zh) 一种数据处理方法及装置
CN115004672B (zh) 信息推送方法、装置、服务器及存储介质
CN104412605B (zh) 发送装置、信息处理方法、程序、接收装置和应用链接系统
CN109640113A (zh) 一种拖拉视频数据的处理方法及代理服务器
CN105978703A (zh) 一种视频故障反馈的方法、客户端以及服务器
CN103535011A (zh) 内容分发网络cdn路由方法、设备和系统
WO2015078122A1 (zh) 数据流的识别方法及设备
WO2016081875A1 (en) Using hashed media identifiers to determine audience measurement data including demographic data from third party providers
CN106791961B (zh) 视频偏好信息处理方法、装置及系统
CN111897978A (zh) 直播状态监测方法、装置、电子设备及存储介质
CN104426834B (zh) 一种网页请求方法、客户端、服务器以及系统
CN101615184A (zh) 一种识别网页相关资源类型的方法及装置
CN108960894A (zh) 一种广告实时计费方法、装置、服务器及存储介质
CN114614997B (zh) 一种身份识别方法、装置、计算机设备和存储介质
CN111932317A (zh) 基于区块链的广告播放方法、装置、介质及电子设备
JP2010140098A (ja) サービスを受けるための認証情報を登録するサービスサーバを含むシステムの動作方法及び転送サーバ
CN112135199B (zh) 基于多类型视频源的视频播放方法及相关设备
CN107809681A (zh) 切片视频传输的方法及装置
CN107707630B (zh) 一种用于文件传输的方法与装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant