CN108108495A - 一种识别用户访问轨迹的方法及装置 - Google Patents

一种识别用户访问轨迹的方法及装置 Download PDF

Info

Publication number
CN108108495A
CN108108495A CN201810051688.4A CN201810051688A CN108108495A CN 108108495 A CN108108495 A CN 108108495A CN 201810051688 A CN201810051688 A CN 201810051688A CN 108108495 A CN108108495 A CN 108108495A
Authority
CN
China
Prior art keywords
user
access
journal file
track
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810051688.4A
Other languages
English (en)
Inventor
黄翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Xinxintong Technology Co Ltd
Original Assignee
Xiamen Xinxintong Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Xinxintong Technology Co Ltd filed Critical Xiamen Xinxintong Technology Co Ltd
Priority to CN201810051688.4A priority Critical patent/CN108108495A/zh
Publication of CN108108495A publication Critical patent/CN108108495A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种识别用户访问轨迹的方法及装置,该方法包括:获取网站日志文件中的设备标识和与设备标识关联的IP地址,并进行md5校验以得到用户ID值;根据用户ID值对日志文件进行筛选以得到用户ID值相同的日志文件;以及查询每个筛选得到的日志文件中是否包含用户访问标识,排除不包含用户访问标识的日志文件,以确定同一用户的访问日志,并根据确定的日志文件识别用户的访问轨迹;其中,用户访问标识为同一用户在非首次访问一网络地址时,由web服务器自动生成并保存,并在用户再次访问网络地址时,由web服务器将用户访问标识保存在用户的日志文件中。利用本发明,能够通过网络访问日志识别出用户的访问轨迹。

Description

一种识别用户访问轨迹的方法及装置
技术领域
本发明涉及互联网技术领域,特别是涉及一种识别用户访问轨迹的方法及装置。
背景技术
访问用户在视频网站的视频观看、特定内容的浏览等用户行为会产生日志文件,在日志文件中详细记录了用户的ID和相应的用户行为等相关信息。
由于通过日志文件中的用户行为可体现用户对于网站特定视频文件等内容的爱好和特定的网站访问习惯;为此,通过对大量的用户ID所对应的用户行为进行相似的计算,就可以把相似度更高的用户ID关联起来,即,将用户ID进行分组,从而可以确定这些关联的用户ID属于同一用户,在确定了访问用户后,可以为该用户进行相应的视频推荐和广告投放,从而提高视频推荐和广告投放的针对性。
随着互联网科技的发展,登录网站的用户人均可使用网站访问设备的数量越来也多,且网站访问的种类也开始多样化,即,每个用户很可能会使用多个设备以及不同种类的终端设备(如,个人电脑、手机或平板电脑等)来访问同一网站。同时,无线网络也在各种公共场所广泛普及,用户在处于不同的公共场所下皆可以使用当前场所的无线网络获得免费访问网络,以进行视频观看等。
在现有的技术手段下,只能根据IP地址来确定关联的用户ID;各种公共场所以普及无线网络的情况下,IP地址相同就不能明确表示用户ID相同。因此,不能准确识别用户访问访问轨迹。进一步地,现有技术手段下,网站还可以通过租用专用的第三方统计服务器进行网络日志的分析以识别用户访问轨迹,但是利用第三方统计服务器,只能保留一段时间内的网络访问日志,无法对历史数据进行追溯,同时增加管理成本。
发明内容
本发明主要解决的技术问题是提供一种识别用户访问轨迹的方法及装置,以通过网络访问日志识别出用户的访问轨迹。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种识别用户访问轨迹的方法,所述方法包括:获取网站日志文件中的设备标识和与所述设备标识关联的IP地址,并进行md5校验以得到用户ID值;根据所述用户ID值对所述日志文件进行筛选以得到用户ID值相同的日志文件;以及查询每个筛选得到的所述日志文件中是否包含用户访问标识,排除不包含所述用户访问标识的日志文件,以确定同一用户的访问日志,并根据确定的所述日志文件识别所述用户的访问轨迹;其中,所述用户访问标识为同一用户在非首次访问一网络地址时,由web服务器自动生成并保存,并在所述用户再次访问所述网络地址时,由所述web服务器将所述用户访问标识保存在所述用户的日志文件中。
其中,获取网站日志文件中的设备标识和与所述设备标识关联的IP地址,并进行md5校验以得到用户ID值,具体为:获取网站日志文件中的设备标识和与所述设备标识关联的IP地址,并利用第一计算公式进行md5校验以得到用户ID值;其中,所述第一计算公式为:client_id=md5(IP+UA),其中,client_id为所述用户ID,UA为所述设备标识。
其中,所述设备标识为设备的唯一识别码。
其中,查询每个筛选得到的所述日志文件中是否包含用户访问标识,排除不包含所述用户访问标识的日志文件,以确定同一用户的访问日志,并根据确定的所述日志文件识别所述用户的访问轨迹,包括:查询每个筛选得到的所述日志文件中是否包含用户访问标识,排除不包含所述用户访问标识的日志文件,以确定同一用户的访问日志;通过所述用户ID,并根据确定的所述日志文件识别所述用户的访问轨迹。
为解决上述技术问题,本发明采用的另一个技术方案是:提供一种识别用户访问轨迹的装置,所述装置包括:数据库,用于记录用户访问网络的日志文件;日志解析单元,用于从所述数据库中获取网站日志文件中的设备标识和与所述设备标识关联的IP地址,并进行md5校验以得到用户ID值;日志筛选单元,用于根据所述用户ID值对所述日志文件进行筛选以得到用户ID值相同的日志文件;以及查询每个筛选得到的所述日志文件中是否包含用户访问标识,排除不包含所述用户访问标识的日志文件,以确定同一用户的访问日志;其中,其中,所述用户访问标识为同一用户在非首次访问一网络地址时,由web服务器自动生成并保存,并在所述用户再次访问所述网络地址时,由所述web服务器将所述用户访问标识保存在所述用户的日志文件中;访问轨迹确定单元,用于根据所述日志筛选单元确定的所述日志文件识别所述用户的访问轨迹。
其中,所述日志解析单元利用第一计算公式进行md5校验以得到所述用户ID值,其中,所述第一计算公式为:client_id=md5(IP+UA),其中,client_id为所述用户ID,UA为所述设备标识。
其中,所述设备标识为设备的唯一识别码。
其中,所述访问轨迹确定单元用于通过所述用户ID,并根据确定的所述日志文件识别所述用户的访问轨迹。
本发明的有益效果是:本发明提供的识别用户访问轨迹的方法及装置,通过识别网络日志文件中所包含的设备标识与IP地址进行md5校验以生成用户ID,并对网络日志文件具有相同用户ID的日志进行筛选以得到具有相同用户访问标识的日志,从而得到同一用户的访问日志,以识别该用户的访问轨迹,无需第三方统计系统,利用网络服务器自身的日志文件实现用户访问轨迹识别,统计结果准确、有说服性。
附图说明
图1是本发明实施方式中的一种识别用户访问轨迹的方法的流程示意图;
图2是本发明实施方式中的一种识别用户访问轨迹的装置的结构示意图。
具体实施方式
下面结合附图和实施方式对本发明进行详细说明。
请参阅图1,为本发明实施方式中的一种识别用户访问轨迹的方法的流程示意图,该方法包括:
步骤S10:获取网站日志文件中的设备标识和与所述设备标识关联的IP地址,并进行md5校验以得到用户ID值;
其中,网站日志文件是由用户在访问网络时,由web服务器记录其HTTP日志,尤其是http_cooki变量,从而形成的该用户的日志文件。
以nginx服务器为例,在配置文件中设置如下:
log_format super_log`$remote—addr-$server_addr[$time—local]
$request_method$http—host$request_uri$request_time$status$body bytessent"$http referer""$http_user_agent""$http_cookie"’;
在站点中设置如下:
access_log logs/super.log super_log
在super.log中会产生的日志如下:
第一条日志:
113.106.97.213-219.129.216.95[09/Dec/2017:00:02:40+0800]GETwww.xxx.com/?cid=25092 0.047 200 5250"-""Mozilla/5.0(iPhone;CPU iPhone OS 9_3_2like Mac OS X)AppleWebKit/601.1.46(KHTML,like Gecko)Mobile/13F69MicroMessenger/6.5.22NetType/WIFI Language/zh_CN""-"
第二条日志:
113.106.97.213-219.129.216.95[09/Dec/2017:ll:57:46+0800]GETwww.xxx.com/item_6442?cid=21686&from=timeline 0.017 200 13861"-""Mozilla/5.0(Linux;Android 6.0.1;vivo Y66Build/MMB29M;wv)AppleWebKit/537.36(KHTML,likeGecko)Version/4.0Chrome/53.0.2785.49 Mobile MQQBrowser/6.2 TBS/043622 Safari/537.36 MicroMessenger/6.5.22.1160 NetType/WIFI..Language/zh_CN""-"
第三条日志:
113.106.97.213-219.129.216.95[09/Dec/2017:12:03:30+0800]GETwww.xxx.com'/item_6442?cid=21686&category_id=400 0.017 200 13862"https://www.xxx.com/item_6442?cid=21686&from=timeline""Mozilla/5.0(Linux;Android6.0.1;vivo Y66Build/MMB29M;wv)AppleWebKit/537.36(KHTML,like Gecko)Version/4.0Chrome/53.0.2785.49 Mobile MQQBrowser/6.2 TBS/043622 Safari/537.36MicroMessenger/6.5.22.1160 NetType/WIFI Language/zh—CN""PHPSESSID=djpg615edlrd0gghga8uk04m50;"
第四条日志:
113.106.97.213-2197129:216.95[09/Dec/2017:12:04:21+0800]GETwww.xxx.com/member?cid=21686 0.001 200 73"https://www.xxx.com/item_64 4 2?cid=2168 6&category_id=400""Mozilla/5.0(Linux;Android 6.0.1;vivo Y66 Build/MMB29M;wv)AppleWebKit/537.36(KHTML,like Gecko)Version/4.0 Chrome/53.0.2785.49Mobile MQQBrowser/6.2 TBS/043622 Safari/537.36 MicroMessenger/6.5.22.1160NetType/WIFI Language/zh_CN""PHPSESSID=dipq615edlrd0gqhga8uk04m50;is_item=l;back_href_line_detail=%2F%3Fcid%3D21686"
由此可以看出,第一条日志和第二条日志出现同一个IP地址,即,113.106.97.213-219.129.216.95;第一条日志的设备标识为“iPhone;CPU iPhone OS 9_3_2like Mac OS X”,第二条日志的设备标识为“Linux;Android 6.0.1;vivo Y66 Build/MMB29M”,因此,第一条日志和第二日志对应的用户并不是同一个用户。
进一步地,步骤S10,具体为:
获取网站日志文件中的设备标识和与所述设备标识关联的IP地址,并利用第一计算公式进行md5校验以得到用户ID值;其中,所述第一计算公式为:
client_id=md5(IP+UA),其中,client_id为所述用户ID,UA为所述设备标识。
在每条日志文件中,IP为用户IP地址,UA为设备的唯一识别信息;例如,在第一条日志文件中,IP地址为“113.106.97.213-219.129.216.95”,UA为“iPhone;CPU iPhone OS9_3_2 like Mac OS X”,通过第一计算公式对这两个信息进行计算得到的client_id为“703da695faba38ce6d0f52bdc1d4022c”。
同理,对其余日志文件进行上的处理,分别得到:
第二条日志中,client_id=2b95272abb93a61bf2a6946f7776ef01;
第三条日志中,client_id=2b95272abb93a61bf2a6946f7776ef01;
第四条日志中,client_id=2b95272abb93a61bf2a694 6f7776ef01;
步骤S11,根据所述用户ID值对所述日志文件进行筛选以得到用户ID值相同的日志文件;
步骤S12,查询每个筛选得到的所述日志文件中是否包含用户访问标识,排除不包含所述用户访问标识的日志文件,以确定同一用户的访问日志,并根据确定的所述日志文件识别所述用户的访问轨迹。
其中,所述用户访问标识为同一用户在非首次访问一网络地址时,由web服务器自动生成并保存,并在所述用户再次访问所述网络地址时,由所述web服务器将所述用户访问标识保存在所述用户的日志文件中。
具体地,根据计算得到的client_id对日志文件进行筛选,确定client_id相同的日志文件,并在确定的日志文件中获取“PHPSESSID”,从而得到这个的用户访问标识session_id。然后,在确定的日志文件中,筛选没有用户访问标识session_id的日志。
例如,对网络日志文件进行如上筛选后,得到如下的结果:
Client_id Session_id
第一条日志 703da695faba38ce6d0f52bdcld4Q22c
第二条日志 2b95272abb93a61bf2a694 6f7776ef01 dipq615edlrd0gqhga8uk04m50
第三条日志 2b95272abb93a61bf2a694 6f7776ef01 dipq615edlrd0gqhga8uk04m50
第四条日志 2b95272abb93a61bf2a694 6f7776ef01 dipq615edlrd0gqhga8uk04m50
根据确定的所述日志文件确定该唯一用户,并根据用户的日志文件展示该用户的访问轨迹。
例如,根据“dipq615edlrd0gqhga8uk04m50”,可以看到这个用户的访问轨迹如下:
www.xxx.com/item_6442?cid=21686&from=timeline;
www.xxx.com/item_6442?cid=21686&category_id=400;
www.xxx.com/member?cid=21686。
请参阅图2,为本发明实施方式中的一种识别用户访问轨迹的装置的结构示意图。该装置20包括:数据库21、日志解析单元22、日志筛选单元23、访问轨迹确定单元24。
日志解析单元22用于从数据库21中获取网站日志文件中的设备标识和与所述设备标识关联的IP地址,并进行md5校验以得到用户ID值。
其中,网站日志文件是由用户在访问网络时,由web服务器记录其HTTP日志,尤其是http_cooki变量,从而形成的该用户的日志文件,并保存在数据库21中。
日志筛选单元23用于查询每个筛选得到的所述日志文件中是否包含用户访问标识,排除不包含所述用户访问标识的日志文件,以确定同一用户的访问日志。
访问轨迹确定单元24用于根据日志筛选单元23确定的所述日志文件识别所述用户的访问轨迹。
下面对本发明实施方式中的识别用户访问轨迹的装置的工作原理进行举例说明。
以nginx服务器为例,在配置文件中设置如下:
log_format super_log`$remote—addr-$server_addr[$time—local]
$request_method$http—host$request_uri$request_time$status$body bytessent"$http referer""$http_user_agent""$http_cookie"’;
在站点中设置如下:
access_log logs/super.log super_log
在super.log中会产生的日志如下:
第一条日志:
113.106.97.213-219.129.216.95[09/Dec/2017:00:02:40+0800]GETwww.xxx.com/?cid=25092 0.047 200 5250"-""Mozilla/5.0(iPhone;CPU iPhone OS 9_3_2 like Mac OS X)AppleWebKit/601.1.46(KHTML,like Gecko)Mobile/13F69MicroMessenger/6.5.22 NetType/WIFI Language/zh_CN""-"
第二条日志:
113.106.97.213-219.129.216.95[09/Dec/2017:ll:57:46+0800]GETwww.xxx.com/item_6442?cid=21686&from=timeline 0.017 200 13861"-""Mozilla/5.0(Linux;Android 6.0.1;vivo Y66 Build/MMB29M;wv)AppleWebKit/537.36(KHTML,like Gecko)Version/4.0 Chrome/53.0.2785.49 Mobile MQQBrowser/6.2 TBS/043622Safari/537.36 MicroMessenger/6.5.22.1160 NetType/WIFI..Language/zh_CN""-"
第三条日志:
113.106.97.213-219.129.216.95[09/Dec/2017:12:03:30+0800]GETwww.xxx.com'/item_6442?cid=21686&category_id=400 0.017 200 13862"https://www.xxx.com/item_6442?cid=21686&from=timeline""Mozilla/5.0(Linux;Android6.0.1;vivo Y66 Build/MMB29M;wv)AppleWebKit/537.36(KHTML,like Gecko)Version/4.0 Chrome/53.0.2785.49 Mobile MQQBrowser/6.2 TBS/043622 Safari/537.36MicroMessenger/6.5.22.1160 NetType/WIFI Language/zh—CN""PHPSESSID=djpg615edlrd0gghga8uk04m50;"
第四条日志:
113.106.97.213-2197129:216.95[09/Dec/2017:12:04:21+0800]GETwww.xxx.com/member?cid=21686 0.001 200 73"https://www.xxx.com/item_64 4 2?cid=2168 6&category_id=400""Mozilla/5.0(Linux;Android 6.0.1;vivo Y66 Build/MMB29M;wv)AppleWebKit/537.36(KHTML,like Gecko)Version/4.0 Chrome/53.0.2785.49Mobile MQQBrowser/6.2 TBS/043622 Safari/537.36 MicroMessenger/6.5.22.1160NetType/WIFI Language/zh_CN""PHPSESSID=dipq615edlrd0gqhga8uk04m50;is_item=l;back_href_line_detail=%2F%3Fcid%3D21686"
日志解析单元22对每一条日志进行解析以获取IP地址即对应的设备标识UA:
日志解析单元22还对每一条日志的IP和UA利用第一计算公式进行md5校验以得到用户ID值;其中,所述第一计算公式为:
client_id=md5(IP+UA);
因此,对每条日志文件进行md5校验,分别得到:
第一条日志中,client_id=703da695faba38ce6d0f52bdc1d4022c;
第二条日志中,client_id=2b95272abb93a61bf2a6946f7776ef01;
第三条日志中,client_id=2b95272abb93a61bf2a6946f7776ef01;
第四条日志中,client_id=2b95272abb93a61bf2a694 6f7776ef01;
日志筛选单元23根据计算得到的client_id对日志文件再次进行筛选以得到client_id值相同的日志文件。因此,通过本次筛选得到如下结果:
第二条日志中,client_id=2b95272abb93a61bf2a6946f7776ef01;
第三条日志中,client_id=2b95272abb93a61bf2a6946f7776ef01;
第四条日志中,client_id=2b95272abb93a61bf2a694 6f7776ef01;
日志筛选单元23在确定的日志文件中获取“PHPSESSID”,从而得到这个的用户访问标识session_id。然后,在确定的日志文件中,筛选没有用户访问标识session_id的日志。
例如,对网络日志文件进行如上筛选后,得到如下的结果:
Client_id Session_id
第二条日志 2b95272abb93a61bf2a694 6f7776ef01 dipq615edlrd0gqhga8uk04m50
第三条日志 2b95272abb93a61bf2a694 6f7776ef01 dipq615edlrd0gqhga8uk04m50
第四条日志 2b95272abb93a61bf2a694 6f7776ef01 dipq615edlrd0gqhga8uk04m50
访问轨迹确定单元24根据确定的所述日志文件确定该唯一用户,并根据用户的日志文件展示该用户的访问轨迹。因此,根据“dipq615edlrd0gqhga8uk04m50”,可以看到这个用户的访问轨迹如下:
www.xxx.com/item_6442?cid=21686&from=timeline;
www.xxx.com/item_6442?cid=21686&category_id=400;
www.xxx.com/member?cid=21686。
本发明提供的识别用户访问轨迹的方法及装置,通过识别网络日志文件中所包含的设备标识与IP地址进行md5校验以生成用户ID,并对网络日志文件具有相同用户ID的日志进行筛选以得到具有相同用户访问标识的日志,从而得到同一用户的访问日志,以识别该用户的访问轨迹,无需第三方统计系统,利用网络服务器自身的日志文件实现用户访问轨迹识别,统计结果准确、有说服性。
以上所述仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种识别用户访问轨迹的方法,其特征在于,所述方法包括:
获取网站日志文件中的设备标识和与所述设备标识关联的IP地址,并进行md5校验以得到用户ID值;
根据所述用户ID值对所述日志文件进行筛选以得到用户ID值相同的日志文件;以及
查询每个筛选得到的所述日志文件中是否包含用户访问标识,排除不包含所述用户访问标识的日志文件,以确定同一用户的访问日志,并根据确定的所述日志文件识别所述用户的访问轨迹;其中,所述用户访问标识为同一用户在非首次访问一网络地址时,由web服务器自动生成并保存,并在所述用户再次访问所述网络地址时,由所述web服务器将所述用户访问标识保存在所述用户的日志文件中。
2.根据权利要求1所述的识别用户访问轨迹的方法,其特征在于,获取网站日志文件中的设备标识和与所述设备标识关联的IP地址,并进行md5校验以得到用户ID值,具体为:
获取网站日志文件中的设备标识和与所述设备标识关联的IP地址,并利用第一计算公式进行md5校验以得到用户ID值;其中,所述第一计算公式为:
client_id=md5(IP+UA),其中,client_id为所述用户ID,UA为所述设备标识。
3.根据权利要求1所述的识别用户访问轨迹的方法,其特征在于,所述设备标识为设备的唯一识别码。
4.根据权利要求1所述的识别用户访问轨迹的方法,其特征在于,查询每个筛选得到的所述日志文件中是否包含用户访问标识,排除不包含所述用户访问标识的日志文件,以确定同一用户的访问日志,并根据确定的所述日志文件识别所述用户的访问轨迹,包括:
查询每个筛选得到的所述日志文件中是否包含用户访问标识,排除不包含所述用户访问标识的日志文件,以确定同一用户的访问日志;
通过所述用户ID,并根据确定的所述日志文件识别所述用户的访问轨迹。
5.一种识别用户访问轨迹的装置,其特征在于,所述装置包括:
数据库,用于记录用户访问网络的日志文件;
日志解析单元,用于从所述数据库中获取网站日志文件中的设备标识和与所述设备标识关联的IP地址,并进行md5校验以得到用户ID值;
日志筛选单元,用于根据所述用户ID值对所述日志文件进行筛选以得到用户ID值相同的日志文件;以及查询每个筛选得到的所述日志文件中是否包含用户访问标识,排除不包含所述用户访问标识的日志文件,以确定同一用户的访问日志;其中,其中,所述用户访问标识为同一用户在非首次访问一网络地址时,由web服务器自动生成并保存,并在所述用户再次访问所述网络地址时,由所述web服务器将所述用户访问标识保存在所述用户的日志文件中;
访问轨迹确定单元,用于根据所述日志筛选单元确定的所述日志文件识别所述用户的访问轨迹。
6.根据权利要求5所述的识别用户访问轨迹的装置,其特征在于,所述日志解析单元利用第一计算公式进行md5校验以得到所述用户ID值,其中,所述第一计算公式为:
client_id=md5(IP+UA),其中,client_id为所述用户ID,UA为所述设备标识。
7.根据权利要求5所述的识别用户访问轨迹的装置,其特征在于,所述设备标识为设备的唯一识别码。
8.根据权利要求5所述的识别用户访问轨迹的装置,其特征在于,所述访问轨迹确定单元用于通过所述用户ID,并根据确定的所述日志文件识别所述用户的访问轨迹。
CN201810051688.4A 2018-01-19 2018-01-19 一种识别用户访问轨迹的方法及装置 Pending CN108108495A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810051688.4A CN108108495A (zh) 2018-01-19 2018-01-19 一种识别用户访问轨迹的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810051688.4A CN108108495A (zh) 2018-01-19 2018-01-19 一种识别用户访问轨迹的方法及装置

Publications (1)

Publication Number Publication Date
CN108108495A true CN108108495A (zh) 2018-06-01

Family

ID=62219087

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810051688.4A Pending CN108108495A (zh) 2018-01-19 2018-01-19 一种识别用户访问轨迹的方法及装置

Country Status (1)

Country Link
CN (1) CN108108495A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347917A (zh) * 2019-06-14 2019-10-18 北京纵横无双科技有限公司 一种医疗信息推送方法及装置
CN112152873A (zh) * 2020-09-02 2020-12-29 杭州安恒信息技术股份有限公司 用户识别方法、装置、计算机设备和存储介质
CN112491602A (zh) * 2020-11-17 2021-03-12 中国平安财产保险股份有限公司 行为数据的监控方法、装置、计算机设备及介质
CN114860557A (zh) * 2022-04-08 2022-08-05 广东联想懂的通信有限公司 用户行为信息生成方法、装置、设备及可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103067198A (zh) * 2012-12-14 2013-04-24 北京集奥聚合科技有限公司 一种关联用户CookieID的方法及系统
CN103631828A (zh) * 2012-08-28 2014-03-12 阿里巴巴集团控股有限公司 确定访问路径的方法和装置、确定页面流失率的方法和系统
CN103823883A (zh) * 2014-03-06 2014-05-28 焦点科技股份有限公司 一种网站用户访问路径的分析方法及系统
CN105577735A (zh) * 2014-11-07 2016-05-11 阿里巴巴集团控股有限公司 基于浏览器的用户行为追踪方法及装置
CN106708841A (zh) * 2015-11-12 2017-05-24 北京国双科技有限公司 网站访问路径的聚合方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631828A (zh) * 2012-08-28 2014-03-12 阿里巴巴集团控股有限公司 确定访问路径的方法和装置、确定页面流失率的方法和系统
CN103067198A (zh) * 2012-12-14 2013-04-24 北京集奥聚合科技有限公司 一种关联用户CookieID的方法及系统
CN103823883A (zh) * 2014-03-06 2014-05-28 焦点科技股份有限公司 一种网站用户访问路径的分析方法及系统
CN105577735A (zh) * 2014-11-07 2016-05-11 阿里巴巴集团控股有限公司 基于浏览器的用户行为追踪方法及装置
CN106708841A (zh) * 2015-11-12 2017-05-24 北京国双科技有限公司 网站访问路径的聚合方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
武海平,等: "《PHP 4.0编程指南与样例》", 31 December 2000 *
程博: "基于日志的web挖掘相关技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347917A (zh) * 2019-06-14 2019-10-18 北京纵横无双科技有限公司 一种医疗信息推送方法及装置
CN112152873A (zh) * 2020-09-02 2020-12-29 杭州安恒信息技术股份有限公司 用户识别方法、装置、计算机设备和存储介质
CN112491602A (zh) * 2020-11-17 2021-03-12 中国平安财产保险股份有限公司 行为数据的监控方法、装置、计算机设备及介质
CN112491602B (zh) * 2020-11-17 2023-09-26 中国平安财产保险股份有限公司 行为数据的监控方法、装置、计算机设备及介质
CN114860557A (zh) * 2022-04-08 2022-08-05 广东联想懂的通信有限公司 用户行为信息生成方法、装置、设备及可读存储介质
CN114860557B (zh) * 2022-04-08 2023-05-26 广东联想懂的通信有限公司 用户行为信息生成方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
US20220150318A1 (en) Methods and apparatus to monitor online activity
US11729287B2 (en) Methods and apparatus to determine media impressions using distributed demographic information
US11272249B2 (en) Methods and apparatus to collect distributed user information for media impressions
CN108108495A (zh) 一种识别用户访问轨迹的方法及装置
US10333882B2 (en) Methods and apparatus to estimate demographics of users employing social media
US20180315060A1 (en) Methods and apparatus to estimate media impression frequency distributions
US20140358676A1 (en) Methods and apparatus to determine an adjustment factor for media impressions
EP2991018A1 (en) Methods and apparatus to associate transactions with media impressions
CA3112126A1 (en) Methods and apparatus to monitor media presentations
WO2003079588A2 (en) Systems and methods for media audience measurement
EP3776432A1 (en) Processor systems to estimate audience sizes and impression counts for different frequency intervals
WO2020103079A1 (en) Methods and apparatus to reduce computer-generated errors in computer-generated audience measurement data
CN106682180B (zh) 数据查询方法及装置
US11997354B2 (en) Methods and apparatus to identify and triage digital ad ratings data quality issues
CN109214663B (zh) 计算业务引流的方法、装置、计算机设备和存储介质
US20220156779A1 (en) Method, apparatus, and computer device for calculating website user credit point
US9270547B1 (en) Determining device counts
CN110377857B (zh) 一种显示信息处理方法、装置、电子设备及存储介质
JP7297129B1 (ja) 情報処理装置及び情報処理方法
US20210217040A1 (en) Systems and methods of tracking entity program participant activity on social media through entity account on social media
Samuel How your website is viewed
Malinowski et al. WE‐D‐204B‐05: Online Monitoring and Error Detection of Real‐Time Tumor Displacement Prediction Accuracy Using Statistical Process Control
Och et al. SU‐F‐207‐08: CT Protocol Management Using Quantitative Clinical Image Quality Measurement
JPWO2019207645A1 (ja) コンピュータプログラム
Huo WE‐E‐217A‐01: CAD: Quality Assurance of CAD Systems Implemented in Clinical Use

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180601