CN110874433A - 信息处理方法及其系统、计算机系统及计算机可读介质 - Google Patents

信息处理方法及其系统、计算机系统及计算机可读介质 Download PDF

Info

Publication number
CN110874433A
CN110874433A CN201811007145.9A CN201811007145A CN110874433A CN 110874433 A CN110874433 A CN 110874433A CN 201811007145 A CN201811007145 A CN 201811007145A CN 110874433 A CN110874433 A CN 110874433A
Authority
CN
China
Prior art keywords
log
identification information
information
domain name
access request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811007145.9A
Other languages
English (en)
Inventor
高伟
王海旭
吴凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201811007145.9A priority Critical patent/CN110874433A/zh
Publication of CN110874433A publication Critical patent/CN110874433A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本公开提供了一种信息处理方法,应用于能够提供日志服务的日志服务器的方法,包括:接收客户端发送的用于指示访问指定域名的访问请求,其中,指定域名隶属于第一域名;响应于访问请求,获取日志服务器中第一域名的第一标识信息;以及基于第一标识信息的获取结果,生成访问请求的日志信息,并向客户端返回日志信息的生成结果,以使得客户端能够基于生成结果为客户端设置在第一域名下的第二标识信息。此外,本公开还提供了一种信息处理系统,应用于能够提供日志服务的日志服务器,一种计算机系统以及一种计算机可读介质。

Description

信息处理方法及其系统、计算机系统及计算机可读介质
技术领域
本公开涉及网络技术领域,更具体地,涉及一种信息处理方法及其系统,一种计算机系统及一种计算机可读介质。
背景技术
在互联网时代,用户可以通过各种网络平台享受互联网带来的便利,网站作为向用户展示信息的一种重要的网络平台,由于信息量大,更新快等优势,尤其受到用户的青睐。完整的采集用户浏览网页生成的行为日志,通过数据加工和分析,发掘用户的真实意图,应用到搜索,推荐和广告等业务中,可以为用户提供更精准的个性化推送服务。
然而,在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:相关技术中,网站的域名可能会有不同域的情况,而不同域的行为日志,可能会被标识为不同用户的日志行为,导致用户行为路径记录不完整,对用户真实意图的分析可能有影响。
针对相关技术中的上述问题,目前还未提出有效的解决方案。
发明内容
有鉴于此,本公开提供了一种信息处理方法及其系统,应用于能够提供日志服务的日志服务器、一种信息处理方法及其系统,应用于客户端、一种计算机系统以及一种计算机可读介质。
本公开的第一个方面提供了一种信息处理方法,应用于能够提供日志服务的日志服务器,包括:接收客户端发送的用于指示访问指定域名的访问请求,其中,上述指定域名隶属于第一域名;响应于上述访问请求,获取上述日志服务器中上述第一域名的第一标识信息;以及基于上述第一标识信息的获取结果,生成上述访问请求的日志信息,并向上述客户端返回上述日志信息的生成结果,以使得上述客户端能够基于上述生成结果为上述客户端设置在上述第一域名下的第二标识信息。
根据本公开的实施例,上述基于上述第一标识信息的获取结果,生成上述访问请求的日志信息包括:在上述第一标识信息的获取结果为空的情况下,基于上述第一域名,根据预设规则创建上述第一标识信息;以及基于上述第一标识信息,生成上述访问请求的日志信息。
根据本公开的实施例,上述基于上述第一标识信息,生成上述访问请求的日志信息包括:基于上述第一标识信息,生成用户标识信息;获取上述访问请求的请求日志信息;以及添加上述用户标识信息至上述请求日志信息,生成上述访问请求的日志信息。
根据本公开的实施例,上述基于上述第一标识信息的获取结果,生成上述访问请求的日志信息包括:在上述第一标识信息的获取结果为非空的情况下,基于上述第一标识信息,生成用户标识信息;获取上述访问请求的请求日志信息;以及添加上述用户标识信息至上述请求日志信息,生成上述访问请求的日志信息。
本公开的第二个方面提供了一种信息处理方法,应用于客户端,包括:向能够提供日志服务的日志服务器发送用于指示访问指定域名的访问请求,其中,上述指定域名隶属于第一域名,以使上述日志服务器能够响应于上述访问请求,获取上述日志服务器中上述第一域名的第一标识信息,并基于上述第一标识信息,生成上述访问请求的日志信息,并向上述客户端返回上述日志信息的生成结果;以及基于上述生成结果为上述客户端设置在上述第一域名下的第二标识信息。
本公开的第三个方面提供了一种信息处理系统,应用于能够提供日志服务的日志服务器,包括:接收模块,用于接收客户端发送的用于指示访问指定域名的访问请求,其中,上述指定域名隶属于第一域名;获取模块,用于响应于上述访问请求,获取上述日志服务器中上述第一域名的第一标识信息;以及处理模块,用于基于上述第一标识信息的获取结果,生成上述访问请求的日志信息,并向上述客户端返回上述日志信息的生成结果,以使得上述客户端能够基于上述生成结果为上述客户端设置在上述第一域名下的第二标识信息。
根据本公开的实施例,上述处理模块包括:创建子模块,用于在上述第一标识信息的获取结果为空的情况下,基于上述第一域名,根据预设规则创建上述第一标识信息;以及第一生成子模块,用于基于上述第一标识信息,生成上述访问请求的日志信息。
根据本公开的实施例,上述第一生成子模块包括:第一生成单元,用于基于上述第一标识信息,生成用户标识信息;获取单元,用于获取上述访问请求的请求日志信息;以及第二生成单元,用于添加上述用户标识信息至上述请求日志信息,生成上述访问请求的日志信息。
根据本公开的实施例,上述处理模块包括:第二生成子模块,用于在上述第一标识信息的获取结果为非空的情况下,基于上述第一标识信息,生成用户标识信息;获取子模块,用于获取上述访问请求的请求日志信息;以及第三生成子模块,用于添加上述用户标识信息至上述请求日志信息,生成上述访问请求的日志信息。
本公开的第四个方面提供了一种信息处理系统,应用于客户端,包括:发送模块,用于向能够提供日志服务的日志服务器发送用于指示访问指定域名的访问请求,其中,上述指定域名隶属于第一域名,以使上述日志服务器能够响应于上述访问请求,获取上述日志服务器中上述第一域名的第一标识信息,并基于上述第一标识信息,生成上述访问请求的日志信息,并向上述客户端返回上述日志信息的生成结果;以及设置模块,用于基于上述生成结果为上述客户端设置在上述第一域名下的第二标识信息。
本公开的第五个方面提供了一种计算机系统,包括:一个或多个处理器,存储装置,用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现如上所述的信息处理方法。
本公开的第六个方面提供了一种计算机可读介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现如上所述的信息处理方法。
根据本公开的实施例,基于日志服务器中第一域名的标识信息,生成访问请求的日志信息,通过服务器接收访问请求时的设置,将同一用户访问不同域的页面标识为同一用户,客户端侧,发送用于指示访问指定域名的访问请求,基于服务器返回的日志信息,为客户端设置在第一域名下的第二标识信息,可以在客户端标记访问不同域的日志行为,可以至少部分克服相关技术中,访问同一域名的不同域时,被标记为不同用户的日志行为的技术问题,实现访问不同域的日志被标记为同一用户的,达到提升用户行为的完整性,提高用户真实意图的分析的准确性的技术效果。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1A示意性示出了根据本公开实施例的信息处理方法及其系统的示例性系统架构;
图1B示意性示出了根据本公开实施例的的信息处理方法及其系统的应用场景;
图2示意性示出了根据本公开实施例的应用于能够提供日志服务的日志服务器的信息处理方法的流程图;
图3A示意性示出了根据本公开实施例的基于第一标识信息的获取结果,生成访问请求的日志信息的流程图;
图3B示意性示出了根据本公开实施例在基于所述第一标识信息,生成访问请求的日志信息的流程图;
图3C示意性示出了根据本公开又一实施例的基于第一标识信息的获取结果,生成访问请求的日志信息的流程图;
图3D示意性示出了相关技术记录用户行为日志的效果图;
图3E示意性示出了根据本公开实施例记录用户行为日志效果图;
图3F示意性示出了根据本公开实施例应用于客户端的信息处理方法的流程图;
图4示意性示出了根据本公开实施例的应用于能够提供日志服务的日志服务器的信息处理系统的框图;
图5A示意性示出了根据本公开实施例的处理模块的框图;
图5B示意性示出了根据本公开实施例的第一生成子模块的框图;
图5C示意性示出了根据本公开另一实施例的处理模块的框图;
图5D示意性示出了根据本公开实施例的应用于客户端的信息处理系统的框图;以及
图6示意性示出了根据本公开实施例的计算机系统的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。本领域技术人员还应理解,实质上任意表示两个或更多可选项目的转折连词和/或短语,无论是在说明书、权利要求书还是附图中,都应被理解为给出了包括这些项目之一、这些项目任一方、或两个项目的可能性。例如,短语“A或B”应当被理解为包括“A”或“B”、或“A和B”的可能性。
本公开提供了一种应用于能够提供日志服务的日志服务器的方法,包括:接收客户端发送的用于指示访问指定域名的访问请求,其中,指定域名隶属于第一域名;响应于访问请求,获取日志服务器中第一域名的第一标识信息;以及基于第一标识信息的获取结果,生成访问请求的日志信息,并向客户端返回日志信息的生成结果,以使得客户端能够基于生成结果为客户端设置在第一域名下的第二标识信息。
图1A示意性示出了根据本公开实施例的信息处理方法及其系统的示例性系统架构100。需要注意的是,图1A所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1A所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和日志服务器105。网络104用以在终端设备101、102、103和日志服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。上述通讯客户端应用通常会采用埋点技术,当用户操作触发该通讯客户端应用执行埋点代码时,该通讯客户端应用会生成日志上报请求,并将该日志上报请求发送至日志服务器105,由日志服务器105存储该请求上报的日志。终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
需要说明的是,本公开实施例所提供的应用于能够提供日志服务的日志服务器的方法一般可以由服务器105执行。相应地,本公开实施例所提供的应用于能够提供日志服务的日志服务器的系统一般可以设置于服务器105中。本公开实施例所提供的应用于能够提供日志服务的日志服务器的方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的应用于能够提供日志服务的日志服务器的系统也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。本公开实施例所提供的应用于客户端的方法可以由终端设备101、102、或103执行,或者也可以由不同于终端设备101、102、或103的其他终端设备执行。相应地,本公开实施例所提供的应用于客户端的系统也可以设置于终端设备101、102、或103中,或设置于不同于终端设备101、102、或103的其他终端设备中。
应该理解,图1A中的终端设备、网络和日志服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和日志服务器。
图1B示意性示出了根据本公开实施例的的信息处理方法及其系统的应用场景110。需要注意的是,图1B所示仅为可以应用本公开实施例的应用场景的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
在该应用场景110中,包括通过网络连接以实现彼此通信的可以提供浏览服务的客户端111和可以提供日志服务的日志服务器112。
当用户通过客户端111的浏览器浏览网站A(第一域名)的页面1时,页面1上采集用户行为日志的埋点被执行,用于收集页面1域名下的浏览器缓存(cookie)信息113和页面1的页面信息等,组织成一条字符串,以http请求日志服务器112的一个点像素的图片,日志服务器112在接收到用户的http请求后,将该条日志记录到日志文件114中,同时可以给客户端111返回正常值,类似地,用户在页面1上点击,继续访问页面2,页面2上采集用户行为日志的埋点被执行,用于收集页面2域名下的浏览器缓存(cookie)信息113和页面2的页面信息等,组织成一条字符串,以http请求日志服务器112的一个点像素的图片,日志服务器112在接收到用户的http请求后,将该条日志记录到日志文件114中,同时可以给客户端111返回正常值,类似地,用户在页面2上点击,继续访问页面3,页面3上采集用户行为日志的埋点被执行,用于收集页面3域名下的浏览器缓存(cookie)信息113和页面3的页面信息等,组织成一条字符串,以http请求日志服务器112的一个点像素的图片,日志服务器112在接收到用户的http请求后,将该条日志记录到日志文件114中,同时可以给客户端111返回正常值,由于是一个像素点,对页面并无影响。相关技术人员可以对日志服务器112的日志文件114中存储的大量日志进行加工分析,发掘用户的真实意图,为用户提供精准的推送服务。
需要说明的是,本公开实施例提及的网站A具有第一域名,由于网站业务繁多,在网站的第一域名下的多个页面(页面1,页面2和页面3)可能会对应不同的域。由于不同浏览器架构不同,难以在不同的浏览器之间统一用户的行为,因此,本公开实施例仅针对用户在同一浏览器上访问不同域的页面产生的浏览轨迹这一应用场景。
应该理解,图1B中的网站A的页面数目仅仅是示意性的。根据实现需要,可以具有任意数目的页面数目,本公开不做限定,只要任意数目的页面的域均隶属于网站A的域名即可。
图2示意性示出了根据本公开实施例的应用于能够提供日志服务的日志服务器的信息处理方法的流程图。
如图2所示,该方法可以包括操作S210~S230。其中:
在操作S210,接收客户端发送的用于指示访问指定域名的访问请求。
在操作S220,响应于访问请求,获取日志服务器中第一域名的第一标识信息。
在操作S230,基于第一标识信息的获取结果,生成访问请求的日志信息,并向客户端返回日志信息的生成结果,以使得客户端能够基于生成结果为客户端设置在第一域名下的第二标识信息。
根据本公开的实施例,第一域名为网站的域名,对应于网站的不同页面具有的域名称为指定域名,可以理解的是,多个指定域名仅对应于本页面的域名,且隶属于第一域名。当用户在浏览网站页面时,任一操作可以产生访问请求从客户端发送给能够提供日志服务的日志服务器,对应于网站的第一域名,具有第一域名的服务器将与第一域名相关的日志行为日志记录下来,以便在实现对用户浏览行为的完整记录的同时,给后续利用日志信息分析用户行为提供数据支持。
根据本公开的实施例,日志服务器在接收到访问请求后,可以获取日志服务器中第一域名的第一标识信息,基于第一标识信息的获取结果,生成访问请求的日志信息,使得日志信息中包含有第一域名的标识信息,将同一用户访问不同域的页面,识别为同一用户,使得完整记录同一用户的行为。
需要说明的是,第一域名的第一标识信息可以包括但限于浏览器缓存(cookie)信息。
根据本公开的实施例,日志服务器还可以向客户端返回日志信息的生成结果,以使得客户端能够基于生成结果为客户端设置在第一域名下的第二标识信息。
通过本公开的实施例,接收客户端发送的用于指示访问指定域名的访问请求,获取日志服务器中第一域名的第一标识信息,基于第一标识信息的获取结果,生成访问请求的日志信息,通过服务器接收访问请求时的标识信息的设置,可以将访问不同域的页面的用户标识为同一用户,实现跨域用户行为的统一,可以至少部分克服相关技术中,访问同一域名的不同域时,被标记为不同用户的日志行为的技术问题,实现访问不同域的日志被标记为同一用户的,达到提升用户行为的完整性,提高用户真实意图的分析的准确性的技术效果。
下面参考图3A~图3C,根据附图1B中的应用场景,以网站A的第一域名为domain.com,页面1的指定域名为domaina.com,页面2的指定域名为domainb.com,页面3的指定域名为domainc.com为例,结合具体实施例对图2所示的方法做进一步说明。
图3A示意性示出了根据本公开实施例的基于第一标识信息的获取结果,生成访问请求的日志信息的流程图。
如图3A所示,该方法可以包括操作S311和S312。其中:
在操作S311,在第一标识信息的获取结果为空的情况下,基于第一域名,根据预设规则创建第一标识信息。
在操作S312,基于第一标识信息,生成访问请求的日志信息。
根据本公开的实施例,用户访问网站页面时,页面中的埋点Javascript片段被执行,以动态创建一个script标签,并将script指向一个单独的数据收集脚本,如JS文件,该JS被执行可以收集该页域名下的cookie信息和页面信息等,然后组织成一条字符串,以https请求日志服务器的一个点像素的图片,日志服务器收到请求,同时可以读取日志服务器域名下的cookie信息以创建第一标识信息,若第一标识信息的获取结果为空,则可以根据第一域名,以创建第一标识信息。
具体地,用户访问网站域名domain.com下域名为domaina.com的页面1,页面中采集用户行为日志的埋点JS被执行,会收集该页面1域名domaina.com下的cookie信息和页面信息等,组织成一条字符串,以https请求日志服务器(domain.com)的一个点像素的图片,如:https://domain.com/log.gif?url=domaina.com$uuid=domaina$...,日志服务器收到请求,同时读取domain.com域名下的cookie信息,如果为空,则根据第一域名domain.com,创建第一标识信息auid字段。
通过本公开的实施例,在日志服务器的第一标识信息为空的情况下,根据第一域名生成第一标识信息,并基于该第一标识信息生成访问请求的日志信息,实现根据不同指定域名隶属于的第一域名标记日志信息,使得日志信息携带有第一域名的信息,在实现完整性的同时,可以标记出日志信息是否属于同一域名。
图3B示意性示出了根据本公开实施例在基于所述第一标识信息,生成访问请求的日志信息的流程图。
如图3B所示,该方法可以包括操作S321~S323。其中:
在操作S321,基于第一标识信息,生成用户标识信息。
在操作S322,获取访问请求的请求日志信息。
在操作S323,添加用户标识信息至请求日志信息,生成访问请求的日志信息。
根据本公开的实施例,以在JS中创建通用唯一识别码uuid相同的原理(此处不再赘述),生成一个值,并赋值给auid字段,作为创建的第一标识信息,并将该字段加到请求日志中,以生成访问请求的日志信息。
具体地,以在JS中创建通用唯一识别码(Universally Unique Identifier,以下简称uuid)相同的原理(此处不再赘述),生成一个值,并赋值给(Authority UniqueIdentifier,以下简称auid)字段(同一用户标识,假设为domain),将该字段加到请求日志中,如图3E所示:https://domain.com/log.gif?url=domaina.com$uuid=domaina$auid =domai n$...,再记录到.log的日志文件中,同时会给客户端返回正常值,并在客户端domain.com域名下设置第二标识信息为domain。
通过本公开的实施例,根据第一标识信息,生成用户标识信息,添加至请求日志信息,生成访问请求的日志信息,使得日志信息可以标记出访问请求对应的用户信息,以便于识别该日志信息是否属于同一域名。
图3C示意性示出了根据本公开又一实施例的基于第一标识信息的获取结果,生成访问请求的日志信息的流程图。
如图3C所示,该方法可以包括操作S331~S333。其中:
操作S331,在第一标识信息的获取结果为非空的情况下,基于第一标识信息,生成用户标识信息。其中:
在操作S332,获取访问请求的请求日志信息。
在操作S333,添加用户标识信息至请求日志信息,生成访问请求的日志信息。
图3D示意性示出了相关技术记录用户行为日志的效果图。
图3E示意性示出了根据本公开实施例记录用户行为日志效果图。
根据本公开的实施例,用户在页面1上点击,继续访问域名为domainb.com的页面2,同样可以发送如图3D所示的https请求(https://domain.com/log.gif?url= domainb.com$uuid=domainb$...)至日志服务器(domain.com)。日志服务器接收到请求,同时会读取domain.com域名下的cookie,若发现已有赋值,则直接将该auid字段及其值增加到请求日志中,生成如图3E所示的https请求(https://domain.com/log.gif?url= domainb.com$uuid=domainb$auid=do main$...),并记录到.log文件中,同时给客户端返回正常值,在domain.com域名下的cookie不做重新设置。
根据本公开的实施例,依次继续访问域名为domainc.com的页面3,同样可以发送如图3D所示的https请求(https://domain.com/log.gif?url=domainc.com$uuid= domainc$...)至日志服务器(domain.com)。日志服务器接收到请求,同时会读取domain.com域名下的cookie,若发现已有赋值,则直接将该auid字段及其值增加到请求日志中,生成如图3E所示的https请求(https://domain.com/log.gif?url=domainc.com$ uuid=domainc$auid=dom ain$...),并记录到.log文件中,同时给客户端返回正常值,在domain.com域名下的cookie不做重新设置。
根据本公开的实施例,日志文件log中就会记录用户的浏览点击行为。尽管访问的页面属于不同域的,但日志中的用户标识auid是相同的,所以使用auid字段可将该用户标记为同一用户。
通过本公开的实施例,在日志服务器的第一标识信息为非空的情况下,根据第一标识信息,生成用户标识信息,添加至请求日志信息,生成访问请求的日志信息,使得日志信息可以标记出访问请求对应的用户信息,以便于识别该日志信息是否属于同一域名。
图3F示意性示出了根据本公开实施例应用于客户端的信息处理方法的流程图。
如图3F所示,该方法可以包括操作S341和操作S342。其中:
在操作S341,向能够提供日志服务的日志服务器发送用于指示访问指定域名的访问请求。
在操作S342,基于生成结果为客户端设置在第一域名下的第二标识信息。
根据本公开的实施例,与日志服务器对应地,在指定域名隶属于第一域名,客户端向服务器发送用于指示访问指定域名的访问请求,使得日志服务器能够响应于访问请求,获取日志服务器中第一域名的第一标识信息,并基于第一标识信息,生成访问请求的日志信息,并向客户端返回日志信息的生成结果,客户端在接收到返回正常值的返回结果后,设置客户端在第一域名下的第二标识信息。
具体地,对应于在客户端上进行的针对页面1的访问请求,在日志服务器domain.com域名下的cookie信息为空的情况下,在客户端domain.com域名下的cookie设置为domain,在日志服务器domain.com域名下的cookie信息不为空的情况下,对客户端domain.com域名下的cookie不做重新设置。
通过本公开的实施例,在客户端侧,发送用于指示访问指定域名的访问请求,基于服务器返回的日志信息,为客户端设置在第一域名下的第二标识信息,可以在客户端标记访问不同域的日志行为。
图4示意性示出了根据本公开实施例的应用于能够提供日志服务的日志服务器的信息处理系统的框图。
如图4所示,该系统400可以包括接收模块410、接收模块410以及处理模块430。其中:
接收模块410用于接收客户端发送的用于指示访问指定域名的访问请求。
获取模块420用于响应于访问请求,获取日志服务器中第一域名的第一标识信息。
处理模块430用于基于第一标识信息的获取结果,生成访问请求的日志信息,并向客户端返回日志信息的生成结果,以使得客户端能够基于生成结果为客户端设置在第一域名下的第二标识信息。
通过本公开的实施例,接收客户端发送的用于指示访问指定域名的访问请求,获取日志服务器中第一域名的第一标识信息,基于第一标识信息的获取结果,生成访问请求的日志信息,通过服务器接收访问请求时的标识信息的设置,可以将访问不同域的页面的用户标识为同一用户,实现跨域用户行为的统一,可以至少部分克服相关技术中,访问同一域名的不同域时,被标记为不同用户的日志行为的技术问题,实现访问不同域的日志被标记为同一用户的,达到提升用户行为的完整性,提高用户真实意图的分析的准确性的技术效果。
图5A示意性示出了根据本公开实施例的处理模块的框图。
如图5A所示,该处理模块430可以包括创建子模块511以及第一生成子模块512。其中:
创建子模块511用于在第一标识信息的获取结果为空的情况下,基于第一域名,根据预设规则创建第一标识信息。
第一生成子模块512用于基于第一标识信息,生成访问请求的日志信息。
通过本公开的实施例,在日志服务器的第一标识信息为空的情况下,根据第一域名生成第一标识信息,并基于该第一标识信息生成访问请求的日志信息,实现根据不同指定域名隶属于的第一域名标记日志信息,使得日志信息携带有第一域名的信息,在实现完整性的同时,可以标记出日志信息是否属于同一域名。
图5B示意性示出了根据本公开实施例的第一生成子模块的框图。
如图5B所示,该第一生成子模块512可以包括第一生成单元521、获取单元522以及第二生成单元523。其中:
第一生成单元521用于基于第一标识信息,生成用户标识信息。
获取单元522用于获取访问请求的请求日志信息。
第二生成单元523用于添加用户标识信息至请求日志信息,生成访问请求的日志信息。
通过本公开的实施例,根据第一标识信息,生成用户标识信息,添加至请求日志信息,生成访问请求的日志信息,使得日志信息可以标记出访问请求对应的用户信息,以便于识别该日志信息是否属于同一域名。
图5C示意性示出了根据本公开另一实施例的处理模块的框图。
如图5C所示,该处理模块430除了可以包括第二生成子模块531、获取子模块532以及第三生成子模块533。其中:
第二生成子模块531用于在第一标识信息的获取结果为非空的情况下,基于第一标识信息,生成用户标识信息。
获取子模块532用于获取防问请求的请求日志信息。
第三生成子模块533用于添加用户标识信息至请求日志信息,生成访问请求的日志信息。
通过本公开的实施例,在日志服务器的第一标识信息为非空的情况下,根据第一标识信息,生成用户标识信息,添加至请求日志信息,生成访问请求的日志信息,使得日志信息可以标记出访问请求对应的用户信息,以便于识别该日志信息是否属于同一域名。
图5D示意性示出了根据本公开实施例的应用于客户端的信息处理系统的框图。
如图5D所示,该系统500可以包括发送模块541以及设置模块542。其中:
发送模块541用于向能够提供日志服务的日志服务器发送用于指示访问指定域名的访问请求。
设置模块542用于基于生成结果为客户端设置在第一域名下的第二标识信息。
通过本公开的实施例,在客户端侧,发送用于指示访问指定域名的访问请求,基于服务器返回的日志信息,为客户端设置在第一域名下的第二标识信息,可以在客户端标记访问不同域的日志行为。
根据本公开的实施例的模块、子模块,单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块,单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块,单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块,单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,接收模块410、接收模块410、处理模块430、发送模块541以及设置模块542中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,接收模块410、接收模块410、处理模块430、发送模块541以及设置模块542中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,接收模块410、接收模块410、处理模块430、发送模块541以及设置模块542中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图6示意性示出了根据本公开实施例的计算机系统的方框图。图6示出的计算机系统仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,根据本公开实施例的计算机系统600包括处理器601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。处理器601例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器601还可以包括用于缓存用途的板载存储器。处理器601可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 603中,存储有系统600操作所需的各种程序和数据。处理器601、ROM 602以及RAM 603通过总线604彼此相连。处理器601通过执行ROM 602和/或RAM 603中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 602和RAM 603以外的一个或多个存储器中。处理器601也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,系统600还可以包括输入/输出(I/O)接口605,输入/输出(I/O)接口605也连接至总线604。系统600还可以包括连接至I/O接口605的以下部件中的一项或多项:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被处理器601执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线、光缆、射频信号等等,或者上述的任意合适的组合。
例如,根据本公开的实施例,计算机可读介质可以包括上文描述的ROM 602和/或RAM 603和/或ROM 602和RAM 603以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (12)

1.一种信息处理方法,应用于能够提供日志服务的日志服务器,包括:
接收客户端发送的用于指示访问指定域名的访问请求,其中,所述指定域名隶属于第一域名;
响应于所述访问请求,获取所述日志服务器中所述第一域名的第一标识信息;以及
基于所述第一标识信息的获取结果,生成所述访问请求的日志信息,并向所述客户端返回所述日志信息的生成结果,以使得所述客户端能够基于所述生成结果为所述客户端设置在所述第一域名下的第二标识信息。
2.根据权利要求1的方法,其中,所述基于所述第一标识信息的获取结果,生成所述访问请求的日志信息包括:
在所述第一标识信息的获取结果为空的情况下,基于所述第一域名,根据预设规则创建所述第一标识信息;以及
基于所述第一标识信息,生成所述访问请求的日志信息。
3.根据权利要求2的方法,其中,所述基于所述第一标识信息,生成所述访问请求的日志信息包括:
基于所述第一标识信息,生成用户标识信息;
获取所述访问请求的请求日志信息;以及
添加所述用户标识信息至所述请求日志信息,生成所述访问请求的日志信息。
4.根据权利要求2的方法,所述基于所述第一标识信息的获取结果,生成所述访问请求的日志信息包括:
在所述第一标识信息的获取结果为非空的情况下,基于所述第一标识信息,生成用户标识信息;
获取所述访问请求的请求日志信息;以及
添加所述用户标识信息至所述请求日志信息,生成所述访问请求的日志信息。
5.一种信息处理,方法应用于客户端,包括:
向能够提供日志服务的日志服务器发送用于指示访问指定域名的访问请求,其中,所述指定域名隶属于第一域名,以使所述日志服务器能够响应于所述访问请求,获取所述日志服务器中所述第一域名的第一标识信息,并基于所述第一标识信息,生成所述访问请求的日志信息,并向所述客户端返回所述日志信息的生成结果;以及
基于所述生成结果为所述客户端设置在所述第一域名下的第二标识信息。
6.一种信息处理系统,应用于能够提供日志服务的日志服务器,包括:
接收模块,用于接收客户端发送的用于指示访问指定域名的访问请求,其中,所述指定域名隶属于第一域名;
获取模块,用于响应于所述访问请求,获取所述日志服务器中所述第一域名的第一标识信息;以及
处理模块,用于基于所述第一标识信息的获取结果,生成所述访问请求的日志信息,并向所述客户端返回所述日志信息的生成结果,以使得所述客户端能够基于所述生成结果为所述客户端设置在所述第一域名下的第二标识信息。
7.根据权利要求6的系统,其中,所述处理模块包括:
创建子模块,用于在所述第一标识信息的获取结果为空的情况下,基于所述第一域名,根据预设规则创建所述第一标识信息;以及
第一生成子模块,用于基于所述第一标识信息,生成所述访问请求的日志信息。
8.根据权利要求7的系统,其中,所述第一生成子模块包括:
第一生成单元,用于基于所述第一标识信息,生成用户标识信息;
获取单元,用于获取所述访问请求的请求日志信息;以及
第二生成单元,用于添加所述用户标识信息至所述请求日志信息,生成所述访问请求的日志信息。
9.根据权利要求7的系统,所述处理模块包括:
第二生成子模块,用于在所述第一标识信息的获取结果为非空的情况下,基于所述第一标识信息,生成用户标识信息;
获取子模块,用于获取所述访问请求的请求日志信息;以及
第三生成子模块,用于添加所述用户标识信息至所述请求日志信息,生成所述访问请求的日志信息。
10.一种信息处理系统,应用于客户端,包括:
发送模块,用于向能够提供日志服务的日志服务器发送用于指示访问指定域名的访问请求,其中,所述指定域名隶属于第一域名,以使所述日志服务器能够响应于所述访问请求,获取所述日志服务器中所述第一域名的第一标识信息,并基于所述第一标识信息,生成所述访问请求的日志信息,并向所述客户端返回所述日志信息的生成结果;以及
设置模块,用于基于所述生成结果为所述客户端设置在所述第一域名下的第二标识信息。
11.一种计算机系统,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现权利要求1至5中任一项的信息处理方法。
12.一种计算机可读介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现权利要求1至5中任一项的信息处理方法。
CN201811007145.9A 2018-08-30 2018-08-30 信息处理方法及其系统、计算机系统及计算机可读介质 Pending CN110874433A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811007145.9A CN110874433A (zh) 2018-08-30 2018-08-30 信息处理方法及其系统、计算机系统及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811007145.9A CN110874433A (zh) 2018-08-30 2018-08-30 信息处理方法及其系统、计算机系统及计算机可读介质

Publications (1)

Publication Number Publication Date
CN110874433A true CN110874433A (zh) 2020-03-10

Family

ID=69715744

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811007145.9A Pending CN110874433A (zh) 2018-08-30 2018-08-30 信息处理方法及其系统、计算机系统及计算机可读介质

Country Status (1)

Country Link
CN (1) CN110874433A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112069137A (zh) * 2020-09-02 2020-12-11 北京百度网讯科技有限公司 生成信息的方法、装置、电子设备及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150256508A1 (en) * 2014-03-04 2015-09-10 Opendns, Inc. Transparent Proxy Authentication Via DNS Processing
CN105049251A (zh) * 2015-07-23 2015-11-11 小米科技有限责任公司 访问日志的处理方法、设备和系统
CN106603296A (zh) * 2016-12-20 2017-04-26 北京奇虎科技有限公司 日志的处理方法及装置
CN106657184A (zh) * 2015-10-30 2017-05-10 北京国双科技有限公司 日志信息的解析方法及装置
CN107634942A (zh) * 2017-09-08 2018-01-26 北京京东尚科信息技术有限公司 识别恶意请求的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150256508A1 (en) * 2014-03-04 2015-09-10 Opendns, Inc. Transparent Proxy Authentication Via DNS Processing
CN105049251A (zh) * 2015-07-23 2015-11-11 小米科技有限责任公司 访问日志的处理方法、设备和系统
CN106657184A (zh) * 2015-10-30 2017-05-10 北京国双科技有限公司 日志信息的解析方法及装置
CN106603296A (zh) * 2016-12-20 2017-04-26 北京奇虎科技有限公司 日志的处理方法及装置
CN107634942A (zh) * 2017-09-08 2018-01-26 北京京东尚科信息技术有限公司 识别恶意请求的方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112069137A (zh) * 2020-09-02 2020-12-11 北京百度网讯科技有限公司 生成信息的方法、装置、电子设备及计算机可读存储介质
CN112069137B (zh) * 2020-09-02 2024-05-17 阿波罗智联(北京)科技有限公司 生成信息的方法、装置、电子设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
US20210314354A1 (en) Techniques for determining threat intelligence for network infrastructure analysis
CN107622135B (zh) 用于显示信息的方法和装置
US9436763B1 (en) Infrastructure enabling intelligent execution and crawling of a web application
CN106911693B (zh) 用于检测网页内容劫持的方法、装置和终端设备
CN108494860B (zh) Web访问系统、用于客户端的web访问方法和装置
US11361149B2 (en) Techniques for web framework detection
CN110297995B (zh) 用于收藏信息的方法和装置
US20210334318A1 (en) Mechanism for Web Crawling E-Commerce Resource Pages
US9578006B2 (en) Restricted content publishing with search engine registry
US20190253332A1 (en) Correlated page resources for single page applications
CN110929128A (zh) 一种数据爬取方法、装置、设备和介质
CN111783005B (zh) 显示网页的方法、装置和系统、计算机系统和介质
CN111222067B (zh) 信息生成方法和装置
CN111859077A (zh) 数据处理方法、装置、系统、计算机可读存储介质
CN112083982B (zh) 信息处理方法和装置
CN110874433A (zh) 信息处理方法及其系统、计算机系统及计算机可读介质
CN113590985B (zh) 页面跳转配置方法、装置、电子设备和计算机可读介质
US10417296B1 (en) Intelligent bookmarking with URL modification
CN114281704A (zh) 一种网站测试方法、装置、电子设备和介质
US11216490B2 (en) Method and system for the creation and maintenance of a web presence data store built automatically for all entities with a social media presence
US20200097555A1 (en) Changing a language for a user session replay
CN111767486B (zh) 用于展示页面的方法、装置、电子设备和计算机可读介质
CN116880901B (zh) 应用页面解析方法、装置、电子设备与计算机可读介质
US11770437B1 (en) Techniques for integrating server-side and client-side rendered content
CN113779350A (zh) 数据采集方法、装置、计算机系统和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination