CN1761961A - 在因特网搜索引擎上检测无效点击的方法和设备 - Google Patents

在因特网搜索引擎上检测无效点击的方法和设备 Download PDF

Info

Publication number
CN1761961A
CN1761961A CNA200480007418XA CN200480007418A CN1761961A CN 1761961 A CN1761961 A CN 1761961A CN A200480007418X A CNA200480007418X A CN A200480007418XA CN 200480007418 A CN200480007418 A CN 200480007418A CN 1761961 A CN1761961 A CN 1761961A
Authority
CN
China
Prior art keywords
click
search
searcher
session
search terms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200480007418XA
Other languages
English (en)
Other versions
CN100533434C (zh
Inventor
河定秀
姜锡昊
李宇晟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naver Corp
Original Assignee
NHN Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NHN Corp filed Critical NHN Corp
Publication of CN1761961A publication Critical patent/CN1761961A/zh
Application granted granted Critical
Publication of CN100533434C publication Critical patent/CN100533434C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及一种因特网搜索引擎服务器。更明确地说,本发明涉及用于检测搜索项的无效点击的方法和设备,搜索项被包括在一个由因特网搜索引擎服务器提供的搜索结果网页内。本发明涉及一种用于在因特网搜索引擎中检测无效点击的方法,包括下列步骤:响应于来自于搜索器的搜索请求产搜索结果网页;获取一对应于被产生网页的页面标识符;从搜索器接收一包括在搜索结果网页内的搜索项的点击;获取一对应于被点击的搜索项的站点标识符;并且如果页面标识符和站点标识符与预定时段内的其它点击有关的页面标识符和站点标识符一致,则确定该点击无效。根据本发明提供了一个用于检测无效点击的方法和设备,其检测各种不正当地增加搜索项点击量的尝试,并且立即处理这些尝试。

Description

在因特网搜索引擎上检测无效点击的方法和设备
技术领域
本发明涉及因特网搜索引擎服务器。更明确地说,本发明涉及用于检测搜索项的无效点击的方法和设备,搜索项被包括在一个由因特网搜索引擎服务器提供的搜索结果网页内。此外,本发明涉及用于检测无效点击的方法和设备,其可以检测不公平地增加搜索项点击量的各种尝试并可以立即应付这些尝试。
背景技术
随着因特网的使用越来越广泛,诸如可经由因特网访问的网页之类的信息源的数量已经以算术级数增长。此外,为了在大量信息源之中发现信息,搜索器访问诸如NAVER、Yahoo和Lycos之类的因特网搜索引擎服务器以请求搜索。因特网搜索服务提供商产生一个包括搜索项在内的搜索结果网页,其包括与搜索器输入的搜索字有关的信息,然后向搜索器提供生成的搜索结果网页。例如,当搜索器访问NAVER搜索引擎服务器然后输入搜索字″Digital Camera(数码相机)″时,搜索结果网页如图2所示。包括在搜索结果网页内的每一项都与URL(统一资源定位符)有关。
因为与单一搜索字有关的搜索项的数量不计其数,然而,这类不计其数的搜索项如何在搜索结果网页上显示和以什么顺序显示对因特网搜索服务提供商来说是一个非常重要的问题。因特网搜索服务提供商通过结合几个标准来确定搜索项的列出顺序。已被广泛使用的其中一个标准是用户对特殊搜索项的点击量。例如,如果用户对一个搜索项的点击量很大,则该搜索项被显示在搜索结果网页相对靠上的部分。甚至在因特网搜索服务提供商通过结合多个参数来确定搜索项的列出顺序的情况中,如果其中一个参数是用户点击量,则具有很高点击量的搜索项被显示在搜索结果网页的相对靠上的部分。
此外,因特网搜索服务器产生的搜索结果网页被显示得越高,用户可能点击和访问该网页的可能性就越大。从而,web服务器的网络信息提供商想要把与他(她)自己有关的搜索项显示在搜索结果网页的顶端。因为这个原因,为了将他(她)的网页搜索项显示在搜索结果网页的顶端,网络信息提供商可以故意地访问因特网搜索服务器来多次点击他(她)自己网页的搜索项。有时,网络信息提供商可以用一个专门的程序不断地点击他(她)的网页的搜索项。因为这类不公平的搜索项点击并不反映真实的用户搜索结果,所以因特网搜索服务提供商必须检测这类无效的点击。
先有技术中存在这类服务,其中,与搜索项有关的网络信息提供商基于搜索结果网页中的每个搜索项的点击量被收费。因特网搜索服务提供商Overture Services,Inc.(U.S.A)提供这类服务,其中,当搜索器点击与网络信息提供商有关的搜索结果网页中的搜索项时,网络信息提供商支付每次点击。在这种情况下,如果搜索器故意多次点击一个特殊的搜索项,则与搜索项有关的网络信息提供商必须支付额外的费用。因此,甚至在这种情况下也必须要检测无效点击,其意图是只增加点击量而实际上没有对搜索项进行搜索。
发明内容
本发明被提供来解决上述的先有技术中的问题。本发明的一个目的是提供用于检测搜索项的无效点击的方法和设备,搜索项包括在一个由因特网搜索引擎服务器提供的搜索结果网页内。
本发明的另一个目的是提供用于检测无效点击的方法和设备,其可以检测不正当增加搜索项的点击量的各种尝试,并且可以立即应付这些尝试。
本发明的另一个目的是提供一个用于检测无效点击的方法和设备,其中,为了检测无效点击而提供的几个标识符很难被仿造或伪造。
为了达到上述目的并解决先有技术中的上述问题,本发明提供了一个在因特网搜索引擎中检测无效点击的方法,包括下列步骤:响应于来自搜索器的搜索请求产生一个搜索结果网页,获取一个对应于被产生网页的页面标识符,从搜索器接收包括在搜索结果网页内的搜索项的点击,获取一个对应于被点击搜索项的站点标识符,并且如果页面标识符和站点标识符与在预定时段内的其它点击有关的页面标识符和站点标识符一致,则确定该点击是无效的。
根据本发明的方面提供了一个用于在因特网搜索引擎中检测无效点击的方法,包括下列步骤:响应于来自搜索器的搜索请求产生一个搜索结果网页,获取一个包括在搜索器终端存储的会话cookie文件内的会话标识符,从搜索器接收一个包括在搜索结果网页内的搜索项点击,获取一个对应于被点击搜索项的站点标识符,并且如果会话标识符和站点标识符与预定时段内与其它点击有关的会话标识符和站点标识符一致,则确定该点击是无效的。
根据本发明的方面提供了一个用于在因特网搜索引擎中检测无效点击的方法,包括下列步骤:从搜索器接收包括在搜索结果网页内的搜索项的点击,获取一个对应于搜索器终端的客户机IP地址,获取一个对应于被点击的搜索项的站点标识符,并且如果客户机IP地址和站点标识符与预定时段内的其它点击有关的客户机IP地址和站点标识符一致,则确定该点击是无效的。
根据本发明的方面提供了一个用于在因特网搜索引擎中检测无效点击的方法,包括下列步骤:响应于来自搜索器的搜索请求产生一个搜索结果网页,获取一个对应于搜索器终端的终端标识符,产生一个包括终端标识符的用户cookie文件然后把用户cookie文件存储在搜索器终端中,从搜索器接收一个包括在搜索结果网页内的搜索项点击,获取一个对应于被点击搜索项的站点标识符,并且如果终端标识符和站点标识符与预定时段内的其它点击有关的终端标识符和站点标识符一致,则确定该点击是无效的。
根据本发明的另一个方面提供了一个用于检测无效点击的设备,其中,如果搜索器点击包括在由因特网搜索引擎提供的搜索结果网页内的搜索项,则至少搜索器终端的IP地址、搜索器终端所属的网络地址、与搜索结果网页有关的搜索字、搜索器的web浏览器的相关信息、与存储在搜索器终端中的点击和cookie文件信息有关的点击时间、与搜索项有关的URL信息的其中一个被接收,并且基于一个根据被接收信息预定的标准(reference)来确定该点击是否无效。
根据本发明的另一个方面提供了一个用于检测无效点击的设备,包括(1)一个日志存储单元,其响应于搜索器点击包括在由因特网搜索引擎提供的搜索结果网页内的搜索项,来存储一个至少与下列两项有关的日志:搜索器终端的IP地址,搜索器终端所属的网络地址,与搜索结果网页有关的搜索字,搜索器的web浏览器的相关信息,与点击有关的点击时间、存储在搜索器终端中cookie文件信息和与搜索项有关的URL信息,(2)一个无效点击模型存储单元,其存储与至少下列中两个有关的无效点击模型:搜索器终端的IP地址、搜索器终端所属的网络地址、与搜索结果网页有关的搜索字、搜索器的web浏览器的相关信息、与点击有关的点击时间、存储在搜索器终端中的cookie文件信息、和与搜索项有关的URL信息,和(3)一个无效点击决定单元,其基于日志存储单元中存储的日志和无效点击模型存储单元中存储的无效点击模型来确定搜索点击是否是一个无效点击。
根据本发明的另一个方面提供了一个用于检测无效点击的设备,包括一个点击计数器装置,用于针对包括在由因特网搜索引擎提供的搜索结果网页内的搜索项,计数预定时段内每个搜索项的搜索器点击量,一个平均点击量计算装置,用于在预定时段内计算属于搜索项所属类别的搜索项的平均点击量,和一个决定装置,用于确定每个搜索项的点击量是否比平均点击量大一个预定的差。
根据本发明的另一个方面提供了一个用于检测无效点击的设备,包括一个点击计数器装置,用于针对包括在由因特网搜索引擎提供的搜索结果网页内的搜索项,计数预定时段内每个搜索项的搜索器点击量,一个平均点击量计算装置,用于在搜索结果网页中在预定时段内计算位于搜索项较高端的搜索项的预定第一数量和位于搜索项较低端的搜索结果的预定第二数量的平均点击量,和决定装置,用于确定每个搜索项的点击量是否比平均点击量大一个预定的差。
无效点击很难精确地定义,并且无效点击的范围应该取决于实施例和应用来不同地定义。然而,无效点击可能指的是以只增加点击量而不以实际搜索为目的而做出的点击。
附图说明
图1是一个示意图,说明因特网搜索服务器的一个网络连接,包括用于检测无效点击的设备和根据本发明的客户机终端。
图2是一个说明由因特网搜索引擎产生的搜索结果网页的示意图。
图3是一个说明根据本发明实施例来检测无效点击的设备结构的框图。
图4是一个根据本发明实施例来检测无效点击的方法流程图。
图5显示了根据本发明实施例的示例的日志文件。
图6a和6b是一个根据本发明实施例来检测无效点击的方法流程图。
图7显示了一个根据本发明实施例的示例的日志文件。
图8是一个根据本发明实施例来产生会话标识符的方法流程图。
图9是一个根据本发明实施例来检测无效点击的方法流程图。
图10显示了一个根据本发明实施例的示例的日志文件。
图11是一个根据本发明实施例来检测无效点击的方法流程图。
图12是一个说明通用计算机系统的结构的框图,该系统可用于创立一个搜索引擎服务器和一个用于根据本发明检测无效点击的设备。
具体实施方式
在下文中,本发明的优选实施例将参考附图被详细描述。
图1是一个示意图,说明包括用于检测无效点击的设备和根据本发明的客户机终端的因特网搜索服务器的网络连接。
尝试不公平点击的搜索器或作弊器经由连接到因特网103的客户机终端101来访问因特网搜索服务器104。作弊器通过多次点击由因特网搜索服务器104提供的搜索结果网页中的搜索项来增加点击量。例如在图2中,假定搜索项202是一个与http://www.invalidclick.com有关的搜索项,并且作弊器不断地点击搜索项202以便于搜索项202被显示在搜索结果网页的顶端。
当客户机终端101被连接到搜索引擎服务器104或其它网络站点时,cookie文件102是一个由搜索引擎服务器104或其它网络站点存储在客户机终端101的硬盘中的特殊的文本文件。在用于连接网络站点的HTTP协议中,每个对网页的请求都与其它请求无关。因此,网络服务器不具这样的信息,即哪个页面先前已经被发送到客户机终端101或者客户机终端101先前已经执行了什么工作。因此,为了关联像这样独立处理的各个请求,一个cookie文件被提供。这类cookie文件服务允许网络服务器把用户信息存储在用户的计算机中。为了在本发明中检测无效点击,甚至可以使用几个cookie文件。这将在后面被详细描述。
日志文件105是一个用于存储与用户点击模型相关的几个日志的文件。在本发明中,为了检测无效点击而使用几个参数。在与各个点击有关的参数被存储在日志文件中之后,基于预定的规则和模型来确定输入点击是否无效。
根据本发明实施例的日志文件的例子如图5、7和10中所示。
图3是一个说明根据本发明实施例来检测无效点击的设备结构的框图。
根据本发明实施例来检测无效点击301的设备包括参数输入单元304、日志存储单元305、无效点击模型存储单元306、无效点击验证单元307、无效点击报告单元308和无效点击决定单元309。
如果搜索器点击包括在由因特网搜索引擎提供的搜索结果网页内的搜索项,则与该点击有关的几个参数302被输入到参数输入单元304。这些参数是用于确定无效点击的基本信息,并且包括搜索器终端的IP地址、搜索器终端所属的网络地址、与搜索结果网页有关的搜索字、搜索器的web浏览器的相关信息、与点击有关的点击时间、存储在搜索器终端中的cookie文件信息、与搜索项有关的URL信息等等。
如果搜索器向因特网搜索引擎服务器104请求一个搜索,则搜索请求分组从客户机终端101被传递到因特网搜索引擎服务器104。搜索请求分组包括一个根据HTTP协议的分组配置并且还被包含在因特网(IP:网际协议)分组内。因为源IP地址字段被包括在因特网协议分组的配置内,所以因特网搜索引擎服务器104从点击所请求的搜索请求分组提取一个源IP地址,从而提取搜索器终端的IP地址。
源IP地址的前部分是搜索器终端所属的网络地址。IP地址由4个字节组成。IP地址的前部分是一个用于识别搜索器终端所属网络的网络地址,而其剩余部分是用于识别网络内的搜索器终端的地址。因此,网络地址从源IP地址中被提取。根据本发明的实施例,IP地址前部分的3个字节被认为是一个网络地址并且该网络地址从源IP地址被获得。例如,如果源IP地址是123.45.67.89,则123.45.67被提取为一个网络地址。
与搜索结果网页有关的搜索字是一个由搜索器输入因特网搜索服务器104的值。
搜索器的web浏览器的相关信息是web浏览器上的信息,所述web浏览器被装载在搜索器的客户机终端101中并被用来访问因特网搜索服务器104。web浏览器的相关信息包括web浏览器的类型、web浏览器的版本、web浏览器的产品ID等等。特别地,即使当多个搜索器具有相同类型和相同版本的web浏览器时,它们的web浏览器的产品ID也可能不同。从而,它变成了用于识别一个搜索器终端的有用信息。
根据被用于连接到网络的HTTP协议,客户机的一部分环境参数被包括在HTTP分组内来传送到网络服务器。网络服务器的程序(搜索引擎程序)可以接收环境参数并且可以使用这些参数来检测无效点击。
这类环境参数包括下列信息:
REMOTE_HOST:被连接者的域名
REMOTE_ADDR:被连接客户机主机的IP地址
REMOTE_USER:被连接者的名字(在网络服务器设置了用户验证的情况下显示)
REMOTE_USER:被连接者的ID(在网络服务器设置了用户验证的情况下被显示)
HTTP_USER_AGENT:被连接者驱动的程序的相关注册信息,一般来说是浏览器的名称
HTTP_ACCEPT_LANGUAGE:被连接者使用的语言
HTTP_REFERER:呼叫对应CGI程序的文档名称
REQUEST_METHOD:向服务器传输数据的方法(GET,POST)
QUERY_STRING:当数据以GET模式发送时,发送数据的被存储参数
CONTENT_LENGTH:当数据以POST模式被发送时,被发射数据的总长度(字节数)
CONTENT_TYPE:当数据以POST模式被发射时,数据的MIME类型
AUTH_TYPE:用于确认用户授权的参数
SERVER_NAME:当前服务器的域名
SERVER_SOFTWARE:当前安装在服务器上的网络服务器程序的名称
SERVER_PROTOCOL:服务器当前使用的网络协议的名称和版本
SERVER_PORT:服务器当前所使用的端口数(在HTTP的情况下一般是80)
PATH_INFO:被呼叫的CGI程序的当前路径的信息
PATH_TRANSLATED:网络要求的网络服务器中的当前资源路径的相关信息
SCRIPT_NAME:当前正在被呼叫的CGI程序的名称
HTTP_ACCEPT:当前可以以HTTP接收的资源的类型
与搜索器的点击有关的点击时间是来自搜索器的点击输入被接收的时间。根据本发明的另一个实施例,与搜索器的点击时间有关的其它时间可以被使用。例如,可以使用搜索器实际上将点击输入客户机的时间。
存储在搜索器终端中的cookie文件上的信息被因特网搜索服务器104获得,其中因特网搜索服务器104访问存储在客户机终端101中的cookie文件102。在本发明中,cookie文件102可以被用于多种用途。这将参考其它实施例被详细描述。
与搜索器点击的搜索项有关的URL信息可以通过查阅搜索数据库而获得,因为它被存储在与搜索引擎服务器104有关的搜索数据库(未示出)中。URL信息可以是网络服务器的域名或包括域名、目录和文件名的信息。例如,http://www.naver.com和http://www.naver.com/download是相同的,因为它们是鉴于域名的www.naver.com,但是具有不同的URL。在本发明中,使用URL及至域名的实施例已经为了解释起见进行了说明。然而,本发明覆盖了所有的实施例,其中,如果URL尽管其域名相同但是具有不同的目录(因为它们包括了域名、目录和文件名全部),则URL被认为是不同的搜索项。此外应当理解,在本发明中,URL信息包括根据这个说明书的所有实施例。
此外,除了上述的参数之外,在本发明的精神内,被用于检测无效点击的其它参数也可以被用来检测无效点击。
上述种类的参数302被输入到参数输入单元304。这些参数又被存储在日志存储单元305中。根据本发明,存储在日志存储单元中的日志的例子如图5、7和10中所示。在这些附图中,只包括一部分参数的日志被显示以用于解释。然而,根据本发明的另一个实施例,包括全部或一部分参数302的日志可以被存储在日志存储单元305中。
根据本发明的一个实施例,日志存储单元305在其中存储关于至少下列两项的日志:搜索器终端的IP地址、搜索器终端所属的网络地址、与搜索结果网页有关的搜索字、搜索器的web浏览器的相关信息、与点击有关的点击时间、存储在搜索器终端中的cookie文件信息和与搜索项有关的URL信息。根据本发明的一个优选实施例,日志存储单元305在其中存储一个关于至少下列一项的日志:搜索器终端的IP地址、搜索器终端所属的网络地址、与搜索结果网页有关的搜索字、搜索器的web浏览器的相关信息、与点击有关的点击时间、存储在搜索器终端中的cookie文件信息和与搜索项有关的URL信息。
无效点击型式存储单元306在其中存储一个与至少下列两项的一对有关的无效点击模型或规则:搜索器终端的IP地址、搜索器终端所属的网络地址、与搜索结果网页有关的搜索字、搜索器的web浏览器的相关信息、与点击有关的点击时间、存储在搜索器终端中的cookie文件信息和与搜索项有关的URL信息。例如,搜索器终端的IP地址和与搜索项有关的URL信息型在10分钟内的点击输入中彼此一致的规则或模型可以被存储在无效点击模型存储单元306中。同样地,用于确定无效点击的被存储在无效点击模型存储单元306中的规则等等可以用文件的形式存储,该文件使用根据预定规则的预定语言。或者,在上述规则或模型的情况下,它可以用程序的形式被存储以便于它被确定是一无效点击。
无效点击决定单元309基于日志存储单元305中存储的日志和无效点击模型存储单元306中存储的无效点击模型来确定搜索器点击是否是无效点击。
无效点击报告单元308向因特网搜索引擎的管理员303报告与点击中的预定标准一致的点击,其被无效点击决定单元309确定无效。根据本发明的一个实施例,无效点击报告单元308向因特网搜索引擎的管理员报告所有被无效点击决定单元309确定为无效的点击。在这种情况下,预定标准是已经被无效点击决定单元309确定为无效的所有点击。根据本发明的另一个实施例,指示是否向管理员303报告对应于规则或模型的情况的字段被存储在无效点击模型存储单元306中储存的每个规则或者模型中。在这种情况下,在对应于管理员303必须被通知的规则的情况下,无效点击报告单元308将其报告给管理员303。
无效点击验证单元307允许管理员303把已经被无效点击决定单元309确定为无效的点击改变成有效点击。因为无效点击验证单元307可以把误定为无效点击的点击改变成有效点击,所以无效点击可以被更精确地确定。
图4是一个根据本发明实施例来检测无效点击的方法流程图。
因特网搜索服务器104从搜索器接收一个搜索请求(步骤401)。如果搜索器访问因特网搜索服务器104然后输入搜索字,则该搜索字作为搜索请求分组被传送到因特网搜索服务器104。
因特网搜索服务器104响应于该搜索请求产生一个搜索结果网页(步骤402)。例如图2中所示,包括多个对应于搜索器输入搜索字的搜索项的搜索结果网页被提供给搜索器。
对应于产生的搜索结果网页的页面标识符被获取(步骤403)。每当产生搜索结果网页的时候就产生一个页面标识符。页面标识符是一个用于识别搜索结果网页的标识符。因此,如果相同的搜索器通过重复地向因特网搜索服务器104的搜索窗中输入相同的搜索字,则每次都分配一个新的页面标识符。同样地,如果搜索器点击显示搜索结果网页的web浏览器中的″reload(重新加载)″,则因特网搜索服务器104向搜索结果网页分配一个新的页面标识符,因为搜索请求分组从客户机终端101传送到因特网搜索服务器104。不同的页面标识符被分配给乍一看相同的搜索结果网页是可能的。然而,如果新的搜索请求从客户机终端101被接收,则搜索结果网页在那时被重新产生。不同于先前的搜索结果网页的搜索结果网页从而可以被提供。
在步骤404中,因特网搜索服务器104从搜索器接收一个包括在搜索结果网页内的搜索项的点击。如果点击被接收,则因特网搜索服务器104允许用于搜索项的超链接来连接因特网搜索服务器104,允许因特网搜索服务器104执行必要的处理,然后允许客户机终端访问对应于该搜索项的网络站点。例如,在http://www.naver.com/abc/*http://www.invalidclick.com/被准备作为对应于″http//www.invalidclick.com/″的搜索项超链接的情况下,如果搜索器点击该搜索项,则搜索被允许以访问称作http://www.naver.com的搜索服务器。搜索服务器允许客户机终端根据位于超链接后侧的URL来访问http://www.invalidclick.com。
因特网搜索服务器104获取一个对应于被点击搜索项的站点标识符(步骤405)。站点标识符是一个用于识别搜索项的标识符,并且基于对应于搜索项的URL信息来产生。根据本发明的另一个实施例,站点标识符使用对应于搜索项的原URL信息。用作产生站点标识符的基本信息的URL信息可以是网络服务器的域名或包括域名、目录和文件名在内的信息。例如,http://www.naver.com和http://www.naver.com/download是相同的,因为它们从域名的观点来看都是www.naver.com,但是从URL的观点来看则不相同。在本发明中,一个使用URL及至域名的实施例已经为了解释方便起见而进行了说明。然而,本发明覆盖了所有的实施例,其中,如果URL尽管其域名相同但是具有不同的目录(因为它们不仅包括了域名,而且还包括了目录和文件名),则URL被认为是不同的搜索项。此外应当理解,在本发明中,URL信息包括根据这个说明书的所有实施例。
在步骤406中,如果页面标识符和站点标识符与预定时段内的其它点击相关的页面标识符和站点标识符一致,则用于检测无效点击的设备确定点击是无效的。
图5显示了根据本发明实施例的示例的日志文件。图4的实施例将参考图5来说明。
根据本发明,每当从用户接收一个搜索项的点击,页面标识符509和站点标识符510就被存储在日志文件500中。附图标记501到508指出被存储的各个点击输入的日志。
作弊器访问因特网搜索服务器104以请求一搜索。因特网搜索服务器104产生搜索结果网页并产生一个对应于搜索结果网页的页面标识符″nCe249sisnO″。作弊器不断地点击包括在搜索结果网页内的一个特定的搜索项。即使一旦所产生的搜索结果网页中的特定搜索项被不断地点击,页面标识符也不会被重新产生。从而,页面标识符保留了相同的值。
从而在预定时段内的点击输入日志中,确定具有相同的页面标识符和相同的站点标识符的日志501、日志502和日志504是无效点击。根据本发明的一个实施例,确定一致的日志中的一个是无效点击,则剩余的日志是无效点击。
作弊器可以通过点击web浏览器中的″reload″来更新搜索结果网页。在这种情况下,页面标识符被重新分配并且关于页面标识符的日志是日志505。其后,作弊器点击相同搜索项的情况对应于日志506。
因此,根据这个实施例,如果作弊器点击″reloads″然后点击相同的搜索项(在日志506的情况下),则它不被确定是一个无效点击。同样地,用于确定″reload″是无效点击的情况的方法将参考图6在下列实施例中被说明。
图6a和6b是一个根据本发明实施例来检测无效点击的方法流程图。
因特网搜索服务器104从搜索器接收搜索请求(步骤601)。因特网搜索服务器104响应于该搜索请求产生一搜索结果网页(步骤602)。
用于确定无效点击的设备确定会话cookie文件是否被存储在请求搜索的客户机终端101中(步骤603)。步骤603到步骤611被处理以获得一个会话标识符。
如果确定会话cookie文件没有存储在客户机终端101中,则用于确定无效点击的设备产生一个新的会话标识符(步骤604)。在步骤605中,包括会话标识符在内的会话cookie文件被存储在客户机终端101中。会话标识符的更新时间还被存储在会话cookie文件中。更新时间被存储在会话cookie文件中(步骤609)。
如果确定会话cookie文件在步骤602中存储在客户机终端101中,则用于确定无效点击的设备确定包括会话cookie文件在内的会话标识符的最后更新时间是否在预定时段内(步骤606)。
作为步骤606中的确定结果,如果包括在会话cookie文件内的会话标识符的最后更新时间在预定时段内,则用于确定无效点击的设备提取一个包括在会话cookie文件内的会话标识符(步骤607)。
作为步骤606中的确定结果,如果包括没有会话cookie文件内的会话标识符的最后更新时间不在预定时段内,则用于确定无效点击的设备产生一个新的会话标识符(步骤608)。包括在会话cookie文件内的会话标识符用重新创建的会话标识符来更新(步骤610)。会话标识符的更新时间被存储在会话cookie文件中(步骤611)。
因特网搜索服务器104从搜索器接收一个包括在搜索结果网页内的搜索项的点击(步骤612)。
因特网搜索服务器104获取一个对应于被点击搜索项的站点标识符(步骤613)。
如果会话标识符和站点标识符与在预定时段内与其它点击有关的会话标识符和站点标识符一致,则用于检测无效点击的设备确定该点击是无效点击(步骤614)。
图7显示了根据本发明实施例的示例的日志文件。
在这个实施例中,每当从用户接收一个搜索项的点击,点击时间710、会话标识符的更新时间711、会话标识符712和站点标识符713被存储在日志文件700中。附图标记701到708指出对应于各个点击输入存储的日志。
作弊器访问因特网搜索服务器104以请求一个搜索请求。因特网搜索服务器104产生一个搜索结果网页。因特网搜索服务器104接收一个包括在搜索结果网页内包括在内搜索项的点击。
因特网搜索服务器104确定会话cookie文件是否被存储在客户机终端101中。如果确定会话cookie文件没有存储在客户机终端101中,则因特网搜索服务器104产生一个新的会话标识符,并且将其更新时间和包括会话标识符在内的会话cookie文件存储在客户机终端101中。在这个实施例中,会话标识符″xigw9492″和更新时间″10:50:14″被记录。此外,对应于搜索项的点击时间、更新时间、会话标识符和站点标识符作为日志701被存储在日志文件700中。在第一次产生会话cookie文件的情况中,只要在那时还产生点击和会话标识符,会话cookie文件就被产生。从而,点击时间和会话标识符更新时间是相同的。
作弊器在相同的搜索结果页面中点击相同的搜索项。因特网搜索服务器104确定会话cookie文件是否被存储在客户机终端101中。因为上述产生的会话cookie文件已经被存储在客户机终端101中,因特网搜索服务器104访问存储在客户机终端101中的会话cookie文件。会话cookie文件在其中存储一个会话标识符和会话标识符的最后更新时间。在这个实施例中,会话标识符″xigw9492″和更新时间″10:50:14″被存储在会话cookie文件中。
因特网搜索服务器104确定来自搜索器的搜索项的点击时间是否在从与会话标识符有关的最后更新时间开始的预定时段内。在这个实施例中,第二点击的点击时间是″10:50:18″。如果预定时段是5秒,则点击时间″10:50:18″在从最后更新时间″10:50:14″开始的预定时段内。同样地,在这种情况下,存储在会话cookie文件中的会话标识符被用作一个当前的会话标识符并且该会话cookie文件的会话标识符没有被更新。从而在这种情况下,例如日志702被记录。
从而,确定日志702是一个无效点击,因为它具有与日志701相同的会话标识符和站点标识符。
日志704对应于其中作弊器请求″reload″的情况。同样地,结果作弊器请求″reload″,制定出存储在客户机终端101中的会话cookie文件的标准,并且会话标识符没有被更新,因为存储在会话cookie文件中的最后更新时间在预定时段内。因此,例如日志704被记录。因为它和日志701一样,所以确定日志704是一个无效点击。即,根据这个实施例,有可能检测作弊器在短时间间隔内在点击″reload″之后点击相同的搜索项的情况。
日志705对应于这种情况,即相同搜索项的点击从不同于日志701、日志702和日志704的搜索器被接收。在这种情况下,因为新的会话标识符被分配,所以它不被确定为一个无效点击。
日志709对应于这种情况,即与日志701相同的搜索器在相当多时间之后点击相同的搜索项。在这种情况下,因为点击在相当长时间之后才被接收,所以它不被确定为一个无效点击。
根据这个实施例,作弊器在预定时段之后点击相同的搜索项的情况,因为一个会话标识符被产生,所以它被确定是一个无效点击。
同样地,根据本发明的另一个实施例基于无效点击决定来确定这样的情况可能是一个无效点击,即在从相同搜索项的最后点击时间开始的预定时段内做出点击。这将被简单地说明。
如果点击从搜索器被接收,则确定会话cookie文件是否被存储在终端中。如果确定会话cookie文件被存储在终端中,则确定来自搜索器的搜索项的点击时间是否在从与会话标识符有关的最后点击时间开始的预定时段内。
如果确定搜索项的点击时间在预定时段内,则包括在会话cookie文件内的会话标识符被获取并且最后点击时间用搜索项的点击时间来更新。
如果确定搜索项的点击时间不在预定时段内,则新的会话标识符被产生以更新包括在会话cookie文件内的会话标识符。此外,最后点击时间用搜索项的点击时间来更新。
例如在图7中,在存在来自于相同客户机终端的相同搜索项的多个点击的情况下,如果确定从最后的点击已经过去了5秒的情况是有效的,则与日志704有关的点击被确定是有效的,因为它在先前的最后点击时间″10:50:18″的13秒后被做出“10:50:31”。
根据本发明的优选实施例,时间参考根据无效点击的检测目的来决定。
图8是一个根据本发明实施例来产生会话标识符的方法流程图。
会话标识符必须被唯一地分配以便它能与其它的会话标识符区分并且必须很难被仿造或伪造。在会话标识符只被唯一地分配的情况下,存在一个可能性,即作弊器实际上可能产生一个会话标识符然后把会话标识符存储在会话cookie中,或者可能用一个程序不正当地增加点击量,这个程序被驱动来不断地点击搜索项而同时改变会话标识符。
源数据801是用于产生会话标识符805的基本数据。源数据可以是当前的时间信息、搜索字、搜索器的web浏览器的产品ID等等。源数据可以是随机选择的数量。散列函数802被应用到源数据801以产生一个编码串803。然后,校验和被添加到编码串803以产生会话标识符805。校验和用来防止作弊器伪造会话标识符。
用于根据这个实施例产生会话标识符的方法可以被应用来产生一个随后将被说明的页面标识符、站点标识符、终端标识符等等。
图9是一个根据本发明实施例来检测无效点击的方法流程图。
因特网搜索服务器104从搜索器接收一个包括在搜索结果网页内的搜索项的点击(步骤901)。因特网搜索服务器104获取一个对应于搜索器的终端101的客户机IP地址(步骤902)。客户机的IP地址可以从被接收的IP分组的源IP地址字段中提取。
因特网搜索服务器104获取对应于被点击搜索项的站点标识符(步骤903)。
在步骤904中,如果客户机IP地址和站点标识符与预定时段内其它点击相关的客户机IP地址和站点客户机IP地址一致,则用于搜索无效点击的设备确定该点击无效。
图10显示了根据本发明实施例的示例的日志文件。
在这个实施例中,每当从用户接收一个搜索项的点击,点击时间1010、客户机IP地址1011和站点标识符1012就被存储在日志文件1000中。附图标记1001到1009指定对应于各个点击输入的所存储的日志。
如果相同的客户机终端不断地点击相同的搜索项,则如果点击在预定时段内被重复,则该点击无效的可能性很高。然而,往往是这样的情况,即相同客户机终端的用户在相当长时间之后点击相同的搜索项。换言之,存在一个趋势,即用户往往访问一个它很感兴趣的网络站点。如果用户在短时间内不断地访问一个网络站点,则很难把它看作是一个普通的点击。从而,这个情况被确定是一个无效点击。例如,如果时间标准是5分钟,则具有与日志1001相同的客户机IP地址和相同的站点标识符的日志1002、日志1004和日志1005被确定是无效点击。确定在大约20分钟中与被点击日志1009相关的点击是有效点击。
如果基于客户机IP地址来确定无效点击,那么存在一些需要谨慎的点。在客户机终端使用代理服务器或IP网关的情况中,存在一个危险,即使作弊器点击与其它的客户机终端相同的搜索项,它也可能被确定为一个无效点击。因此,优选地,这个实施例与使用诸如会话标识符之类的其它参数的一个实施例一起联合构造。
相反地,存在这样一种情况,即点击相同搜索项的客户机终端的客户机IP地址是不同的,而它们的网络地址是相同的。这对应于这样一种情况,即几个人不断地尝试用一个程序来不公平的点击一处或点击相同的搜索项,而同时改变它们的源IP地址。在这种情况下,如果点击相同搜索项的客户机终端的网络地址是相同的并且其它情况(例如,在搜索项所属的目录内,点击量大于平均点击量的情况)被满足,则这可以被确定是一个无效点击。
图11是一个根据本发明实施例来检测无效点击的方法流程图。
因特网搜索服务器104从搜索器接收搜索请求(步骤1101)并且产生一个搜索结果网页(步骤1102)。
因特网搜索服务器104确定包括终端标识符在内的用户cookie文件是否被存储在终端中(步骤1103)。
由于步骤1103中的确定结果,如果包括终端标识符在内的用户cookie文件没有被存储在终端中,则因特网搜索服务器104产生一个终端标识符(步骤1104)。
因特网搜索服务器104产生包括终端标识符在内的用户cookie文件并把它存储在搜索器终端中(步骤1105)。
由于步骤1103中的确定结果,如果包括终端标识符在内的用户cookie文件被存储在终端中,则因特网搜索服务器104从用户cookie文件中提取终端标识符(步骤1106)。
因特网搜索服务器104从搜索器接收包括在搜索结果网页内的搜索项的点击(步骤1107),然后获取一个对应于被点击搜索项的站点标识符(步骤1108)。
最后,在步骤1109中,用于确定如果无效点击的设备确定终端标识符和站点标识符与与预定时段内其它点击有关的终端标识符和站点标识符一致,则该点击是无效的。
根据这个实施例,即使客户机终端使用一个代理服务器或IP网关,也有可能用终端标识符来判别客户机的终端。从而,即使不同的客户机终端使用代理服务器或IP网关,也可能正确地识别来自于不同客户机的点击。
在本发明的另一个实施例中,如果对于包括在由因特网搜索引擎提供的搜索结果网页内的搜索项,预定时段内每个搜索项的搜索器的点击量大于属于搜索项所属类别的搜索项的平均点击量,则它被认为是一个无效点击并从而将其报告给管理员。
根据本实施例的用于检测无效点击的设备包括点击计数器装置,用于针对包括在由因特网搜索引擎提供的搜索结果网页内的搜索项计数预定时段内每个搜索项的搜索器点击量,平均点击量计算装置,用于计算预定时段内属于搜索项所属类别的搜索项的平均点击量,和决定装置,用于确定每个搜索项的点击量是否比平均点击量大一个预定的差。如果每个搜索项的点击量比平均点击量大一个预定的差,则这个事实经由无效点击报告单元308被报告给管理员。
根据本发明的另一个实施例,针对包括在由因特网搜索引擎提供的搜索结果网页内的搜索项,在预定时间段内,将每个搜索项的搜索器的点击量与预定时段内在搜索结果网页中的位于搜索项上端的搜索项预定第一数量和位于搜索项下端的搜索项的预定第二数量的平均点击量相比较。例如,在相同的周期中,特殊的搜索项的点击量与紧接位于特殊搜索项上的两个搜索项和紧接位于特殊搜索项下的两个搜索项的点击量相比较。作为比较的结果,如果特殊搜索项的点击量比围绕其它搜索项的点击量大5倍,则它是无效点击的可能性很高并且从而同样地被报告给管理员。
用于确定无效点击的各种方法已经在上面被说明。用于确定无效点击的方法可以被独立地使用或者可以与用于确定无效点击的方法联合使用。例如,一个规则可以被存储在无效点击模型存储单元306中,其中,对应于搜索项的客户机IP地址、页面标识符和站点标识符在从搜索项的最后点击开始的5分钟内被重复的情况是无效的。
在本发明中,因特网搜索服务器和用于识别不公平点击的设备已经被混乱地描述为单个单元。然而,根据本发明的另一个实施例,应当注意它们可以根据它们的功能被分开执行并且可以由不同的管理员来管理。
此外,在本发明中,被显示并被描述为分开元件的元件可以物理上被创建在单个系统中并且可以物理上被创建在一个单独的系统中。
此外,尽管几个实施例已经在本发明中被说明,对于所属领域技术人员来说显而易见的是,多个实施例的一部分或剩余的实施例也属于本发明的精神。
另外,本发明的实施例还涉及包括用于执行不同的计算机执行操作的程序指令的计算机可读媒介。该媒介还可以单独(或与程序指令相结合)包括数据文件、数据结构、数据表等等。媒介和程序指令可以被特别地设计并构造以用于本发明目的,或它们可能是众所周知的类型并是计算机软件领域的技术人员可用的。计算机可读媒介的例子包括诸如硬盘、软盘和磁带之类的磁性媒介;诸如CD-ROM磁盘之类的光媒介;诸如可光读磁盘之类的磁光媒介;和被特别配置来存储和执行程序指令的硬件装置,比如只读存储器装置(ROM)和随机存取存储器(RAM)。媒介还可能是诸如光或金属线路、导波器等等之类的传输媒介,包括发射规定程序指令、数据结构等等的信号的载波。程序指令的例子包括两个诸如由编译器产生的之类的机器代码,和包括可以由计算机使用解释器来执行的高级代码在内的文件。
图12是一个说明通用计算机系统的结构的框图,该系统可用于创立搜索引擎服务器和用于根据本发明检测无效点击的设备。
计算机系统包括任意数量的处理器1240(也被称为中央处理器或CPUs),它们被耦合到包括主存储器1260(一般来说是随机存取存储器或″RAM″)、主存储器1270(一般来说是只读存储器或″ROM″)的存储装置。在本领域中众所周知的是,主存储器1260把数据和指令单向传送到CPU,并且主存储器1260一般被用来以双向方式传送数据和指令。这两个主存储器装置都可以包括如上所述的任何适当的类型的计算机可读媒介。大容量存储装置1210还被双向耦合到CPU1240和提供附加的数据存储量并且可以包括如上所述的任何计算机可读媒介。大容量存储装置1210可以被用来存储程序、数据等等,并且一般是一个诸如比主存储器慢的硬盘之类的辅助存储器媒介。诸如光盘1220之类的特殊大容量存储装置还可以把数据单向传递给CPU。处理器1240还被耦合到一个接口1230,其包括一个或多个输入输出设备,比如视频监视器、跟踪球、鼠标、键盘、扩音器、触控式显示器、换能器读卡机、磁或纸带读取器、写字板、触针、音频或手写识别器或诸如当然包括其它计算机之类的其它众所周知的输入装置。最后,如通常在1250所示,处理器1240可以选择性地使用网络连接被耦合到计算机或电信网。有了这类网络连接,CPU可以在执行上述方法步骤的过程中从网络接收信息或者可以向网络输出信息是可期望的。上述装置和材料对于计算机硬件和软件领域中的技术人员来说是很熟悉的。
如上所述的硬件元件可以被配置(一般暂时)来充当一个或多个执行本发明操作的软件模块。
工业实用性
根据上述的本发明,一个用于检测包括在由因特网搜索引擎服务器提供的搜索结果网页内的搜索项的无效点击的方法和设备被提供。
根据本发明,一个用于检测无效点击的方法和设备,其可以检测各种不正当地增加搜索项点击量的尝试,并且立即处理这些尝试。即,如果新模型的不公平的点击尝试被发现,则该模型或规则被存储在一个根据本发明的无效点击模型存储单元中。从而,立即处理这个遵循新模型的不公平点击尝试是可能的。
此外,根据本发明提供了一个用于检测无效点击的方法和设备,其可以防止为了检测无效点击而提供的几个标识符被仿造或伪造。
尽管本发明已经关于附图中说明的本发明实施例而被说明,然而它并没有被限制在其中,因为对于所属领域技术人员来说,显然可以在其中做出不同的置换、修改和改变。本发明的范围由附加的权利要求来定义。所有在权利要求的意义和范围内做出的改变或修改或其等效物应该被看作是属于本发明的范围。

Claims (21)

1.一种用于在因特网搜索引擎中检测无效点击的方法,包括下列步骤:
(a)响应于来自于搜索器的搜索请求产生搜索结果网页;
(b)获取一对应于所产生的网页的页面标识符;
(c)从搜索器接收一包括在搜索结果网页内的搜索项的点击;
(d)获取一对应于被点击搜索项的站点标识符;和
(e)如果页面标识符和站点标识符与预定时段内的与其它点击有关的页面标识符和站点标识符一致,则确定该点击无效。
2.权利要求1的方法,其中,页面标识符和站点标识符包括一校验和。
3.一种用于在因特网搜索引擎中检测无效点击的方法,包括下列步骤:
响应于来自于搜索器的搜索请求产生搜索结果网页;
获取一包括在搜索器终端中存储的会话cookie文件内的会话标识符;
从搜索器接收一包括在搜索结果网页内的搜索项的点击;
获取一对应于被点击搜索项的站点标识符;和
如果会话标识符和站点标识符与在预定时段内的与其它点击有关的会话标识符和站点标识符一致,则确定该点击无效。
4.权利要求3的方法,其中,获取包括在搜索器终端中存储的会话cookie文件内的会话标识符的步骤包括下列步骤:
确定会话cookie文件是否被存储在终端中;和
如果确定会话cookie文件没有存储在终端中,则产生一新的会话标识符然后把包括产生的会话标识符的会话cookie文件存储在终端中。
5.权利要求4的方法,还包括下列步骤:
如果确定会话cookie文件被存储在终端中,则确定包括在会话cookie文件内的会话标识符的最后更新时间是否在预定时段内;和
如果确定最后更新时间在预定时段内,则获取一包括在会话cookie文件内的会话标识符。
6.权利要求5的方法,还包括下列步骤:
如果确定最后更新时间不在预定时段内,则通过产生新的会话标识符来更新包括在会话cookie文件内的会话标识符;和
把会话标识符的更新时间存储在会话cookie文件中。
7.权利要求4的方法,还包括下列步骤:
如果确定会话cookie文件存储在终端中,则确定来自搜索器的搜索项的点击时间是否在与会话标识符有关的最后点击时间之后的预定时段内;
如果确定搜索项的点击时间在最后点击时间之后的预定时段内,则获取一包括在会话cookie文件内的会话标识符;和
用搜索项的点击时间来更新最后点击时间。
8.权利要求7的方法,还包括下列步骤:
如果确定搜索项的点击时间不在最后点击时间之后的预定时段内,则通过产生新的会话标识符来更新包括在会话cookie文件内的会话标识符;和
用搜索项的点击时间来更新最后点击时间。
9.权利要求3到8中任何一个的方法,其中,会话标识符和站点标识符包括一个校验和。
10.一种用于在因特网搜索引擎中检测无效点击的方法,包括下列步骤:
从搜索器接收一包括在搜索结果网页内的搜索项的点击;
获取一对应于搜索器终端的客户机IP地址;
获取一对应于被点击搜索项的站点标识符;和
如果客户机IP地址和站点标识符与预定时段内的与其它点击有关的客户机IP地址和站点标识符一致,则确定该点击是无效的。
11.权利要求10的方法,其中,站点标识符用其中包括的校验和来产生。
12.一种用于在因特网搜索引擎中检测无效点击的方法,包括下列步骤:
响应于来自于搜索器的搜索请求产生一搜索结果网页;
获取一对应于搜索器终端的终端标识符;
产生一包括终端标识符的用户cookie文件,然后把用户cookie文件存储在搜索器终端中;
从搜索器接收一包括在搜索结果网页内的搜索项的点击;
获取一对应于被点击搜索项的站点标识符;和
如果终端标识符和站点标识符与预定时段内的与其它点击有关的终端标识符和站点标识符一致,则确定该点击是无效的。
13.权利要求12的方法,还包括下列步骤:
确定包括终端标识符在内的cookie文件是否被存储在终端中;和
如果确定包括终端标识符在内的用户cookie文件存储在终端中,则从用户cookie文件接收终端标识符。
14.权利要求12或13的方法,其中,终端标识符和站点标识符包括一校验和。
15.一种计算机可读的记录媒介,其中,一个用于实现根据权利要求1到8和10到13中任何一个的程序被记录。
16.一种用于检测无效点击的设备,其中:
如果搜索器点击包括在由因特网搜索引擎提供的搜索结果网页内的搜索项,则搜索器终端的IP地址、搜索器终端所属的网络地址、与搜索结果网页有关的搜索字、搜索器的web浏览器的相关信息、与存储在搜索器终端中的点击和cookie文件信息有关的点击时间、与搜索项有关的URL信息中的至少一个被接收,并且根据基于接收的信息的预定的标准来确定点击是否无效。
17.一种用于检测无效点击的设备,包括:
日志存储单元,其响应于包括在由因特网搜索引擎提供的搜索结果网页内的搜索项的搜索器点击,存储至少与下列两项相关的日志:搜索器终端的IP地址、搜索器终端所属的网络地址、与搜索结果网页有关的搜索字、搜索器的web浏览器的相关信息、与该点击有关的点击时间、存储在搜索器终端中的cookie文件信息和与搜索项有关的URL信息;
无效点击模型存储单元,其存储与下列中至少两项的一对有关的无效点击模型:搜索器终端的IP地址、搜索器终端所属的网络地址、与搜索结果网页有关的搜索字、有关搜索器的web浏览器的信息,与点击有关的点击时间,存储在搜索器终端中的cookie文件信息、与搜索项有关的URL信息;和
无效点击决定单元,其基于日志存储单元中存储的日志和无效点击模型存储单元中存储的无效点击模型来确定搜索器点击是否是一个无效点击。
18.权利要求17的设备,还包括无效点击报告单元,用于向因特网搜索引擎的管理员报告满足被确定为无效的点击之中的预定标准的点击。
19.权利要求18的设备,还包括无效点击验证单元,其根据管理员的输入把无效点击改变成一个有效点击。
20.一种用于检测无效点击的设备,包括:
点击计数器装置,用于针对包括在由因特网搜索引擎提供的搜索结果网页内的搜索项,计数预定时段内每个搜索项的搜索器点击量;
平均点击量计算装置,用于在预定时段内计算属于搜索项所属类别的搜索项的平均点击量;和
决定装置,用于确定每个搜索项的点击量是否比平均点击量大一个预定的差。
21.一种用于检测无效点击的设备,包括:
点击计数器装置,用于针对包括在由因特网搜索引擎提供的搜索结果网页内的搜索项,计数预定时段内每个搜索项的搜索器点击量;
平均点击量的计算装置,用于在预定时段内在搜索结果网页中,计算位于搜索项上端的搜索项的预定第一数量和位于搜索项下端的搜索项的预定第二数量的平均点击量;和
决定装置,用于确定每个搜索项的点击量是否比平均点击量大一个预定的差。
CNB200480007418XA 2003-03-19 2004-02-27 在因特网搜索引擎上检测无效点击的方法和设备 Expired - Lifetime CN100533434C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020030017233A KR100619178B1 (ko) 2003-03-19 2003-03-19 인터넷 검색 엔진에 있어서의 무효 클릭 검출 방법 및 장치
KR1020030017233 2003-03-19

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CNA2008101610324A Division CN101388035A (zh) 2003-03-19 2004-02-27 在因特网搜索引擎上检测无效点击的方法和设备

Publications (2)

Publication Number Publication Date
CN1761961A true CN1761961A (zh) 2006-04-19
CN100533434C CN100533434C (zh) 2009-08-26

Family

ID=36707372

Family Applications (2)

Application Number Title Priority Date Filing Date
CNB200480007418XA Expired - Lifetime CN100533434C (zh) 2003-03-19 2004-02-27 在因特网搜索引擎上检测无效点击的方法和设备
CNA2008101610324A Pending CN101388035A (zh) 2003-03-19 2004-02-27 在因特网搜索引擎上检测无效点击的方法和设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CNA2008101610324A Pending CN101388035A (zh) 2003-03-19 2004-02-27 在因特网搜索引擎上检测无效点击的方法和设备

Country Status (4)

Country Link
JP (1) JP4358188B2 (zh)
KR (1) KR100619178B1 (zh)
CN (2) CN100533434C (zh)
WO (1) WO2004084097A1 (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008055439A1 (fr) * 2006-11-08 2008-05-15 Tencent Technology (Shenzhen) Company Limited Système et procédé permettant d'identifier un clic de réseau
CN102289756A (zh) * 2010-06-18 2011-12-21 百度在线网络技术(北京)有限公司 点击有效性的判断方法及其系统
CN103368857A (zh) * 2012-03-26 2013-10-23 北大方正集团有限公司 一种发送数据信息的方法及系统
CN103475543A (zh) * 2013-09-11 2013-12-25 北京思特奇信息技术股份有限公司 一种检测系统业务异常调用的方法及系统
CN104331306A (zh) * 2014-10-14 2015-02-04 北京齐尔布莱特科技有限公司 一种内容更新方法、设备以及系统
US8996404B2 (en) 2007-04-26 2015-03-31 Nhn Business Platform Corporation Method for processing invalid click and system for executing the method
CN104580244A (zh) * 2015-01-26 2015-04-29 百度在线网络技术(北京)有限公司 恶意点击的防御方法和装置
CN105677869A (zh) * 2016-01-06 2016-06-15 广州神马移动信息科技有限公司 多维度搜索日志反作弊方法、系统及计算设备
CN107077455A (zh) * 2014-06-03 2017-08-18 埃克斯凯利博Ip有限责任公司 釆用基于事件的流量评分确定流量质量
CN107526748A (zh) * 2016-06-22 2017-12-29 华为技术有限公司 一种识别用户点击行为的方法和设备
CN108255885A (zh) * 2016-12-29 2018-07-06 北京酷我科技有限公司 一种歌曲的推荐方法及系统
CN110020206A (zh) * 2019-04-12 2019-07-16 北京搜狗科技发展有限公司 一种搜索结果排序方法及装置
CN110069691A (zh) * 2019-04-29 2019-07-30 百度在线网络技术(北京)有限公司 用于处理点击行为数据的方法和装置

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11042886B2 (en) 2003-09-04 2021-06-22 Google Llc Systems and methods for determining user actions
US8706551B2 (en) * 2003-09-04 2014-04-22 Google Inc. Systems and methods for determining user actions
KR100786796B1 (ko) * 2005-03-25 2007-12-18 주식회사 다음커뮤니케이션 인터넷 광고 과금 방법 및 시스템
US7933917B2 (en) * 2005-05-06 2011-04-26 Nhn Corporation Personalized search method and system for enabling the method
KR20060028463A (ko) * 2006-03-09 2006-03-29 정성욱 온라인 광고 시스템에서의 이용자 부정 클릭 추적과 방지시스템 및 그 방법
KR100777659B1 (ko) * 2006-04-10 2007-11-19 (주)소만사 키워드 광고 부정 사용 검출 장치
KR100777660B1 (ko) * 2006-04-10 2007-11-19 (주)소만사 로봇 기반 키워드 광고 부정 사용 방지 방법 및 이를실현시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한기록 매체
WO2008030670A1 (en) * 2006-09-08 2008-03-13 Microsoft Corporation Detecting and adjudicating click fraud
KR100841348B1 (ko) * 2007-08-16 2008-06-25 방용정 클릭당 과금되는 광고의 부정클릭시 과금하지 않는 인터넷광고 시스템 및 그 방법
KR100902466B1 (ko) * 2007-10-30 2009-06-11 엔에이치엔비즈니스플랫폼 주식회사 키워드 검색 어뷰저 추적 방법 및 시스템
KR100914600B1 (ko) * 2007-11-14 2009-08-31 엔에이치엔(주) 무효 클릭 판단 방법 및 시스템
KR101020949B1 (ko) * 2008-11-18 2011-03-09 주식회사 데이타웨이브 시스템 키워드 광고의 부정 클릭 검출 방법 및 서버
KR20110116562A (ko) 2010-04-19 2011-10-26 서울대학교산학협력단 대규모 다중 사용자 온라인 롤플레잉 게임에서 봇을 검출하는 방법 및 시스템
KR101158464B1 (ko) * 2010-11-26 2012-06-20 고려대학교 산학협력단 봇 프로세스 탐지 장치 및 방법
CN102663062B (zh) * 2012-03-30 2015-01-14 北京奇虎科技有限公司 一种处理搜索结果中无效链接的方法及装置
JP2014026528A (ja) * 2012-07-27 2014-02-06 Nippon Telegr & Teleph Corp <Ntt> 有効クリック数算出装置、方法、及びプログラム
KR101919137B1 (ko) * 2012-11-08 2018-11-15 네이버 주식회사 광고 영역의 가치지수에 따른 디스플레이 광고 단가 산출 방법 및 시스템
KR101781311B1 (ko) 2013-07-26 2017-09-22 엠파이어 테크놀로지 디벨롭먼트 엘엘씨 디바이스 및 세션 식별
KR101639752B1 (ko) * 2015-02-13 2016-07-15 네이버 주식회사 필터로직을 이용하여 컨텐츠 뷰를 집계하는 시스템 및 방법
CN105069061B (zh) * 2015-07-28 2019-03-12 安一恒通(北京)科技有限公司 历史浏览记录中网页的加载方法、系统、浏览器和服务器
CN111444408B (zh) * 2020-03-26 2021-09-14 腾讯科技(深圳)有限公司 网络搜索处理方法、装置、电子设备
WO2022049776A1 (ja) * 2020-09-07 2022-03-10 シエンプレ株式会社 不正クリック防止システム、不正クリック防止方法及びプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6269361B1 (en) * 1999-05-28 2001-07-31 Goto.Com System and method for influencing a position on a search result list generated by a computer network search engine
KR20020020584A (ko) * 2000-09-09 2002-03-15 맹진기 인터넷 설문조사 시스템 및 방법과 그 프로그램 소스를저장한 기록매체

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008055439A1 (fr) * 2006-11-08 2008-05-15 Tencent Technology (Shenzhen) Company Limited Système et procédé permettant d'identifier un clic de réseau
US8996404B2 (en) 2007-04-26 2015-03-31 Nhn Business Platform Corporation Method for processing invalid click and system for executing the method
CN102289756A (zh) * 2010-06-18 2011-12-21 百度在线网络技术(北京)有限公司 点击有效性的判断方法及其系统
CN103368857B (zh) * 2012-03-26 2016-09-21 北大方正集团有限公司 一种发送数据信息的方法及系统
CN103368857A (zh) * 2012-03-26 2013-10-23 北大方正集团有限公司 一种发送数据信息的方法及系统
CN103475543A (zh) * 2013-09-11 2013-12-25 北京思特奇信息技术股份有限公司 一种检测系统业务异常调用的方法及系统
CN107077455A (zh) * 2014-06-03 2017-08-18 埃克斯凯利博Ip有限责任公司 釆用基于事件的流量评分确定流量质量
CN104331306A (zh) * 2014-10-14 2015-02-04 北京齐尔布莱特科技有限公司 一种内容更新方法、设备以及系统
CN104331306B (zh) * 2014-10-14 2017-05-10 北京齐尔布莱特科技有限公司 一种内容更新方法、设备以及系统
CN104580244A (zh) * 2015-01-26 2015-04-29 百度在线网络技术(北京)有限公司 恶意点击的防御方法和装置
CN104580244B (zh) * 2015-01-26 2018-03-13 百度在线网络技术(北京)有限公司 恶意点击的防御方法和装置
CN105677869A (zh) * 2016-01-06 2016-06-15 广州神马移动信息科技有限公司 多维度搜索日志反作弊方法、系统及计算设备
CN107526748A (zh) * 2016-06-22 2017-12-29 华为技术有限公司 一种识别用户点击行为的方法和设备
CN108255885A (zh) * 2016-12-29 2018-07-06 北京酷我科技有限公司 一种歌曲的推荐方法及系统
CN108255885B (zh) * 2016-12-29 2020-11-06 北京酷我科技有限公司 一种歌曲的推荐方法及系统
CN110020206A (zh) * 2019-04-12 2019-07-16 北京搜狗科技发展有限公司 一种搜索结果排序方法及装置
CN110069691A (zh) * 2019-04-29 2019-07-30 百度在线网络技术(北京)有限公司 用于处理点击行为数据的方法和装置

Also Published As

Publication number Publication date
WO2004084097A1 (en) 2004-09-30
CN100533434C (zh) 2009-08-26
KR100619178B1 (ko) 2006-09-05
CN101388035A (zh) 2009-03-18
KR20040082633A (ko) 2004-09-30
JP2006520940A (ja) 2006-09-14
JP4358188B2 (ja) 2009-11-04

Similar Documents

Publication Publication Date Title
CN1761961A (zh) 在因特网搜索引擎上检测无效点击的方法和设备
CN1320472C (zh) 以使用者知识为基础的信息分类系统
CN1262949C (zh) 确定网络上交互有效性的系统和方法
RU2408066C2 (ru) Способ и устройство доставки сетевой информации
CN1284107C (zh) 用于搜索一组信息项的信息检索设备和方法
CN1168034C (zh) 报文搜寻系统与终端机
US20160127262A1 (en) Method and apparatus to throttle media access by web crawlers
CN1759392A (zh) 在Web搜索引擎上产生搜索结果列表的方法
CN1512408A (zh) 记录图像文件的方法以及记录和提供图像文件的装置
CN1906612A (zh) 用于记录通信网络中跨一个或多个搜索引擎的搜索轨迹的方法和系统
CN1419186A (zh) 根据排序付费的搜索系统中的位置报价
CN1913522A (zh) 基于xml文件的rss信息交互处理方法
CN1230752C (zh) 信息处理系统、信息处理设备以及信息处理方法
CN1684063A (zh) 根据从属关系或文件类型控制文件的公开
CN1507237A (zh) 用于重放动态超文本传输协议事务的方法和系统
CN1226034A (zh) 命名书签组
CN101034997A (zh) 一种数据信息精确发布的方法和系统
CN1573752A (zh) Url检索系统、服务器及url检索方法
CN1784680A (zh) 搜索条件的逐渐放宽
CN1877582A (zh) 广告信息检索系统及广告信息检索方法
JP2011526016A (ja) 分散型検索の結果のマネタイズおよび優先順位付け
CN1926532A (zh) 能用给定的访问方法进行数据发送的数据处理装置
CN101075908A (zh) 一种网络点击统计系统及方法
WO2018121266A1 (zh) 一种应用程序获取方法和装置以及一种终端设备
CN1832393A (zh) 基于数字版权管理系统的数字内容传播方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: NHN BUSINESS PLATFORM CO., LTD.)

Free format text: FORMER NAME: NHN CO., LTD.

CP03 Change of name, title or address

Address after: Gyeonggi Do, South Korea

Patentee after: NHN BUSINESS PLATFORM Corp.

Address before: Seoul, South Kerean

Patentee before: NHN Corp.

ASS Succession or assignment of patent right

Owner name: NABAO CO., LTD.

Free format text: FORMER OWNER: NHN CORP.

Effective date: 20141114

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20141114

Address after: Gyeonggi Do city of South Korea

Patentee after: NAVER Corp.

Address before: Gyeonggi Do, South Korea

Patentee before: NHN BUSINESS PLATFORM Corp.

CX01 Expiry of patent term

Granted publication date: 20090826

CX01 Expiry of patent term