JP2006520940A - Invalid click detection method and apparatus in internet search engine - Google Patents
Invalid click detection method and apparatus in internet search engine Download PDFInfo
- Publication number
- JP2006520940A JP2006520940A JP2005518761A JP2005518761A JP2006520940A JP 2006520940 A JP2006520940 A JP 2006520940A JP 2005518761 A JP2005518761 A JP 2005518761A JP 2005518761 A JP2005518761 A JP 2005518761A JP 2006520940 A JP2006520940 A JP 2006520940A
- Authority
- JP
- Japan
- Prior art keywords
- click
- search
- searcher
- invalid
- identifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9566—URL specific, e.g. using aliases, detecting broken or misspelled links
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本発明は、インターネット検索エンジンサーバに関するものであって、より詳細には、インターネット検索エンジンサーバによって提供される検索結果ウェブページに含まれた検索項目に対する無効クリックを検出する方法および装置に関する。本発明は、検索者からの検索要請に応答して検索結果ウェブページを生成するステップと、前記生成されたウェブページに対応するページ識別子を獲得するステップと、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、前記ページ識別子および前記サイト識別子が所定時間以内の他のクリックと関連したページ識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップとを含むインターネット検索エンジンにおける無効クリック検出方法を提供する。本発明によると、不当に検索項目に対するクリック数を増加させようとする多様な試図を検出し、このような試図に対して即時に対処することができる無効クリック検出方法および装置を提供する。The present invention relates to an Internet search engine server, and more particularly, to a method and apparatus for detecting invalid clicks on a search item included in a search result web page provided by an Internet search engine server. The present invention includes a step of generating a search result web page in response to a search request from a searcher, a step of acquiring a page identifier corresponding to the generated web page, and a searcher to the search result web page. Receiving a click on the included search item; obtaining a site identifier corresponding to the clicked search item; and the page identifier and the page identifier associated with the other click within the predetermined period of time. And a method of detecting invalid clicks in an Internet search engine, including the step of determining that the click is invalid when the site identifier matches. According to the present invention, there is provided an invalid click detection method and apparatus capable of detecting a variety of trial drawings that attempt to increase the number of clicks on a search item unfairly and responding immediately to such trial illustrations. .
Description
本発明は、インターネット検索エンジンサーバに関するものであって、より詳細には、インターネット検索エンジンサーバによって提供される検索結果ウェブページに含まれた検索項目に対する無効クリックを検出する方法および装置に関する。また、本発明は、不当に検索結果に対するクリック数を増加させようとする多様な試図を検出し、このような試図に対して即時に対処することができる無効クリック検出方法および装置に関する。 The present invention relates to an Internet search engine server, and more particularly, to a method and apparatus for detecting invalid clicks on a search item included in a search result web page provided by an Internet search engine server. The present invention also relates to an invalid click detection method and apparatus capable of detecting various trial images that attempt to unduly increase the number of clicks on a search result and responding immediately to such trial illustrations.
インターネットが広く普及する中、インターネットを介してアクセスすることができるウェブページなどの情報源(information source)の数は、幾何級数的に増加している。また、このように無数の情報源の中から検索者が必要とする情報を探すため、検索者は、ネイバー、ヤフー(商標登録)、ライコスなどのインターネット検索エンジンサーバにアクセスして検索を要請(要求)する。インターネット検索サービス提供者は、検索者から入力された検索語と関連した情報を含んでいる検索項目を含んだ検索結果ウェブページを生成して提供者に提供する。例えば、検索者がネイバー検索エンジンサーバに接続して“Digital Camera”という検索語を入力した場合の検索結果ウェブページが図2に示されている。検索結果ウェブページに含まれた各項目は、URL(Uniform Resource Location)と関連する。 As the Internet becomes widespread, the number of information sources such as web pages that can be accessed via the Internet is increasing in a geometric series. In addition, in order to search for information required by a searcher from a myriad of information sources, the searcher accesses an Internet search engine server such as Neighbor, Yahoo (registered trademark), or Lycos and requests a search ( Request). The Internet search service provider generates a search result web page including a search item including information related to a search word input from the searcher and provides the search result web page to the provider. For example, FIG. 2 shows a search result web page when a searcher connects to a neighbor search engine server and inputs a search term “Digital Camera”. Each item included in the search result web page is associated with a URL (Uniform Resource Location).
しかし、1つの検索語と関連する検索項目は無数であるため、このように多くの検索項目をどのような順で検索結果ウェブページに表示するのかは、インターネット検索サービス提供者にとって非常に重要な問題である。インターネット検索サービス提供者は、様々な基準を組み合わせて検索項目の羅列順序を決定するが、この中で多く用いられる基準の1つは、使用者(利用者)の検索項目に対するクリック数である。例えば、検索項目に対する使用者のクリック数が多ければ、相対的に検索結果ウェブページの上位に表示される。インターネット検索サービス提供者が、複数のパラメータを組み合わせて検索項目の羅列順序を決定する場合にも、前記パラメータの中の1つが使用者のクリック数である場合には、クリック数が多い検索項目は相対的に検索結果ウェブページの上位に表示される。 However, since there are an infinite number of search items related to one search term, the order in which many search items are displayed on the search result web page is very important for Internet search service providers. It is a problem. The Internet search service provider determines a list order of search items by combining various criteria, and one of the criteria often used is the number of clicks on the search items of the user (user). For example, if the number of clicks by the user for the search item is large, it is displayed relatively higher in the search result web page. Even when the Internet search service provider determines a list order of search items by combining a plurality of parameters, if one of the parameters is the number of clicks by the user, It is displayed relatively higher in the search result web page.
また、インターネット検索サーバによって生成される検索結果ウェブページの上位に表示される程、使用者がクリックして訪問する可能性が高くなるため、ウェブサーバネットワーク情報提供者は、自身と関連した検索項目が検索結果ウェブページで上位に表示されることを所望する。このようなネットワーク情報提供者の中には、自身のウェブページに対する検索項目が検索結果ウェブページで上位に表示されるようにするため、意図的にインターネット検索サーバにアクセスして自身のウェブページに対する検索項目を何度もクリックする場合がある。また、ある場合は、プログラムを作成して、自身のウェブページに対する検索項目が継続してクリックされるような効果を出すようにしたりもする。しかし、このような検索項目に対する不当なクリックは、使用者全体の自然な検索結果を反映するものではないため、インターネット検索サービス提供者は、このような無効クリック(invalid click)を検出する必要がある。 In addition, the higher the search result web page generated by the Internet search server is displayed, the higher the possibility that the user clicks and visits. Therefore, the web server network information provider can search items related to himself / herself. In the search result web page. Among such network information providers, in order to display search items for their web pages at the top of the search result web page, the Internet search server is intentionally accessed to You may click a search item many times. In some cases, a program is created so that the search item for its own web page is continuously clicked. However, since an illegal click on such a search item does not reflect a natural search result of the entire user, the Internet search service provider needs to detect such an invalid click. is there.
従来技術の中には、検索結果ウェブページにおいて、ある検索項目がどれ程多くクリックされたかによって、前記検索項目と関連したネットワーク情報提供者に課金するサービスを提供する場合もある。米国のインターネット検索サービス提供者であるオーバーチュア社は、ネットワーク情報提供者からクリック当りいくら支払うという入力を受けた後、検索結果ウェブページで前記ネットワーク情報提供者と関連した検索項目がクリックされると、前記ネットワーク情報提供者にクリック当りの課金を遂行する。この場合、ある検索者が人為的に特定した検索項目に対して複数のクリックを行うと、前記ネットワーク情報提供者は、不当に多くの費用を支払うことになる。従って、この場合にも、実際に検索の意図を有しておらず、単にクリック数を増加させるという意図からなる無効クリックを検出する必要がある。 Some conventional techniques provide a service that charges a network information provider related to a search item according to how many search items are clicked on the search result web page. Overture, a U.S. Internet search service provider, receives input from a network information provider to pay per click, and when a search item related to the network information provider is clicked on a search result web page, The network information provider is charged per click. In this case, when a searcher performs a plurality of clicks on a search item artificially specified, the network information provider pays an unreasonable amount of money. Therefore, in this case as well, it is necessary to detect invalid clicks that do not actually have the intention of search but simply have the intention of increasing the number of clicks.
本発明は、前記のような従来技術を改善するために案出されたものであって、インターネット検索エンジンサーバによって提供される検索結果ウェブページに含まれた検索項目に対する無効クリックを検出する方法および装置を提供することを目的とする。 The present invention has been devised to improve the prior art as described above, and a method for detecting invalid clicks on a search item included in a search result web page provided by an Internet search engine server. An object is to provide an apparatus.
また 、不当に検索項目に対するクリック数を増加させようとする多様な試図を検出し、このような試図に対して即時に対処することができる無効クリック検出方法および装置を提供することを他の目的とする。 Another object of the present invention is to provide a method and apparatus for detecting invalid clicks that can detect a variety of sample drawings that attempt to unduly increase the number of clicks on a search item and can immediately deal with such sample drawings. The purpose.
また、無効クリックを検出するために提供される様々な識別子の偽造および変造がし難い無効クリック検出方法および装置を提供することを他の目的とする。 Another object of the present invention is to provide an invalid click detection method and apparatus in which various identifiers provided for detecting invalid clicks are difficult to forge and falsify.
前記の目的を解決し、従来技術の問題点を解決するために、本発明は、検索者からの検索要請に応答して検索結果ウェブページを生成するステップと、前記生成されたウェブページに対応するページ識別子を獲得するステップと、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、前記ページ識別子および前記サイト識別子が所定時間以内の他のクリックと関連したページ識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップとを含むインターネット検索エンジンにおける無効クリック検出方法を提供する。 In order to solve the above-mentioned object and solve the problems of the prior art, the present invention generates a search result web page in response to a search request from a searcher, and corresponds to the generated web page Obtaining a page identifier, receiving a click on a search item included in the search result web page from a searcher, obtaining a site identifier corresponding to the clicked search item, and the page A method for detecting invalid clicks in an Internet search engine is provided, including: determining that a click is invalid if the identifier and the site identifier match a page identifier and a site identifier associated with another click within a predetermined time.
また、検索者からの検索要請に応答して検索結果ウェブページを生成するステップと、前記検索者の端末機に保存されたセッションクッキーファイルに含まれたセッション識別子を獲得するステップと、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、前記セッション識別子および前記サイト識別子が所定時間以内の他のクリックと関連したセッション識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップとを含む。 A step of generating a search result web page in response to a search request from the searcher; a step of acquiring a session identifier included in a session cookie file stored in the searcher's terminal; and Receiving a click with respect to a search item included in the search result web page; obtaining a site identifier corresponding to the clicked search item; Determining that the click is invalid if it matches the session identifier and site identifier associated with the click.
また、検索者から検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、前記検索者の端末機に対応するクライアントIPアドレスを獲得するステップと、前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、前記クライアントIPアドレスおよび前記サイト識別子が所定時間以内の他のクリックと関連したクライアントIPアドレスおよびサイト識別子と一致する場合、前記クリックを無効と判断するステップとを含む。 A step of receiving a click on a search item included in a search result web page from a searcher; a step of acquiring a client IP address corresponding to the searcher's terminal; and a step corresponding to the clicked search item Obtaining a site identifier, and determining that the click is invalid if the client IP address and the site identifier match a client IP address and site identifier associated with another click within a predetermined time.
また、検索者からの検索要請に応答して検索結果ウェブページを生成するステップと、前記検索者の端末機に対応する端末機識別子を獲得するステップと、前記端末機識別子を含む使用者クッキーファイルを生成して前記検索者の端末機に保存するようにするステップと、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、前記端末機識別子および前記サイト識別子が所定時間以内の他のクリックと関連した端末機識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップとを含む。 A step of generating a search result web page in response to a search request from a searcher; a step of acquiring a terminal identifier corresponding to the searcher's terminal; and a user cookie file including the terminal identifier Corresponding to the clicked search item, a step of generating a search result and storing the search result on the searcher's terminal, a step of receiving a click on the search item included in the search result web page from the searcher Obtaining a site identifier, and determining that the click is invalid if the terminal identifier and the site identifier match a terminal identifier and a site identifier associated with another click within a predetermined time.
また、検索者がインターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目をクリックした場合、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間および前記検索者の端末機に保存されたクッキーファイル情報の中の少なくとも1つと、前記検索項目と関連したURL情報を受信し、前記受信した情報に基づき、所定の基準に従って前記クリックの無効可否を判断することを特徴とする無効クリック検出装置が提供される。 In addition, when a searcher clicks a search item included in a search result web page provided by an Internet search engine, the IP address of the searcher's terminal, the network address to which the searcher's terminal belongs, the search A search term associated with the results web page, information about the searcher's web browser, click time associated with the click, and cookie file information stored on the searcher's terminal; and the search item An invalid click detection device is provided that receives related URL information and determines whether or not the click is invalid based on the received information according to a predetermined criterion.
また、(1)インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対する検索者のクリックに応答し、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報、および前記検索項目と関連したURL情報の中の少なくとも2つに関するログを保存するログ保存部と、(2)前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報、および前記検索項目と関連したURL情報の中の少なくとも2つの情報の対と関連した無効クリックパターンを保存する無効クリックパターン保存部と、(3)前記ログ保存部に保存された前記ログおよび前記無効クリックパターン保存部に保存された無効クリックパターンに基づき、前記検索者のクリックが無効クリックであるかを判断する無効クリック判断部とを含む無効クリック検出装置が提供される。 (1) In response to a searcher's click on a search item included in a search result web page provided by an Internet search engine, the IP address of the searcher's terminal and the network to which the searcher's terminal belongs Address, search term associated with the search result web page, information about the searcher's web browser, click time associated with the click, cookie file information stored on the searcher's terminal, and association with the search item A log storage unit for storing logs related to at least two of the URL information, (2) an IP address of the searcher's terminal, a network address to which the searcher's terminal belongs, and a search result web page Search terms, information about the searcher's web browser, related to the click An invalid click pattern storage unit for storing an invalid click pattern associated with a pair of at least two pieces of information in a lick time, cookie file information stored in the searcher's terminal, and URL information associated with the search item; (3) an invalid click determination unit that determines whether the searcher's click is an invalid click based on the log stored in the log storage unit and the invalid click pattern stored in the invalid click pattern storage unit; An invalid click detection device is provided.
また、インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対して、所定期間の前記検索項目当りの検索者のクリック数をカウントするクリック数カウント手段と、前記検索項目が属するカテゴリに属する検索項目の前記所定期間の平均クリック数を計算する平均クリック数計算手段と、前記検索項目当りのクリック数が前記平均クリック数に対して所定の差より大きい場合を判断する判断手段とを含む無効クリック検出装置が提供される。 In addition, for the search items included in the search result web page provided by the Internet search engine, click number counting means for counting the number of clicks of the searcher per search item for a predetermined period, and the search items belong An average click number calculating means for calculating the average number of clicks of the search items belonging to the category for the predetermined period; and a determination means for determining when the number of clicks per search item is greater than a predetermined difference with respect to the average click number; An invalid click detection device is provided.
また、インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対して、所定期間の前記検索項目当りの検索者のクリック数をカウントするクリック数カウント手段と、前記検索結果ウェブページで前記検索項目の上に位置する所定の第1個数の検索項目および前記検索項目の下に位置する所定の第2個数の検索項目の前記所定期間の平均クリック数を計算する平均クリック数計算手段と、前記検索項目当りのクリック数が前記平均クリック数に対して所定の差より大きい場合を判断する判断手段を含む無効クリック検出装置が提供される。 In addition, for the search items included in the search result web page provided by the Internet search engine, click number counting means for counting the number of clicks of the searcher per search item for a predetermined period, and the search result web page The average click number calculating means for calculating the average number of clicks in the predetermined period of the predetermined first number of search items positioned above the search item and the predetermined second number of search items positioned below the search item. And an invalid click detection device including a determination unit that determines when the number of clicks per search item is greater than a predetermined difference with respect to the average number of clicks.
無効クリック(invalid click)は正確に定義するのが難しく、各実施例および応用例によって、その範囲が異なって定められなければならない。ただ、一般的に無効クリックとは、実際に検索の意図を有さず、単にクリック数を増加させる意図からなるクリックとして説明される。 Invalid clicks are difficult to define accurately and must be defined differently in each embodiment and application. However, in general, an invalid click is described as a click that does not actually have the intention of search but simply has the intention of increasing the number of clicks.
本発明によると、インターネット検索エンジンサーバによって提供される検索結果ウェブページに含まれた検索項目に対する無効クリックを検出する方法および装置が提供される。 According to the present invention, a method and apparatus for detecting invalid clicks on search items included in a search result web page provided by an Internet search engine server are provided.
また、不当に検索項目に対するクリック数を増加させようとする多様な試図を検出し、このような試図に対して即時に対処することができる無効クリック検出方法および装置が提供される。すなわち、新たなパターンの不当なクリック試図が発見された場合、前記パターンまたは規則を本発明による無効クリックパターン保存部に保存することによって、前記新たなパターンの不当なクリック試図に対して即時に対処することができる。 In addition, an invalid click detection method and apparatus capable of detecting various sample drawings that attempt to unduly increase the number of clicks on a search item and responding immediately to such sample drawings are provided. That is, when an invalid click sample of a new pattern is found, the pattern or rule is stored in the invalid click pattern storage unit according to the present invention, so that the invalid click sample of the new pattern is immediately stored. Can deal with.
また、無効クリックを検出するために提供される様々な識別子の偽造または変造がし難い無効クリック検出方法および装置を提供する。 The present invention also provides an invalid click detection method and apparatus in which various identifiers provided for detecting invalid clicks are difficult to forge or alter.
以下、添付された図面を参照して、本発明の実施例を詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.
図1は、本発明による無効クリック検出装置を含んだインターネット検索サーバとクライアント端末機とのネットワーク接続を示した図である。 FIG. 1 is a diagram illustrating a network connection between an Internet search server including an invalid click detection apparatus according to the present invention and a client terminal.
検索者(searcher)または不当なクリックを試図する不当クリック試図者(cheater)は、インターネット103と接続されたクライアントクライアント端末機101を介してインターネット検索サーバ104に接続する。不当クリック試図者は、インターネット検索サーバ104によって提供された検索結果ウェブページの中で、クリック数を高めようとする検索項目を複数回クリックするなどの方法を用いて、クリック数を高めようと試図する。例えば、図2において、検索項目202がhttp://www.invalidclick.comと関連した検索項目であり、不当クリック試図者は、検索項目202が検索結果ウェブページで上位に表示されるようにするため、前記検索項目202を継続してクリックする場合を想定することができる。
A searcher or an unauthorized click examiner who attempts an unauthorized click connects to the
クッキーファイル(cookie file)102は、クライアント端末機101が検索エンジンサーバ104または他のウェブサイトに接続した場合、前記検索エンジンサーバ104または他のウェブサイトをクライアント端末機101のハードディスクに保存しておく特別なテキストファイルである。ウェブサイトの接続に用いられるHTTPプロトコルでウェブページに対するそれぞれの要求は、他の要求とはすべて独立(independent)している。従って、ウェブサーバは、クライアント端末機101に、以前にどのようなページを送ったか、または以前にどのような作業を共に遂行したかに関するいかなる情報をも有することができない。従って、このように独立的に処理されるそれぞれの要求との関連を結ぶためにクッキーファイルが提供され、このようなクッキーファイルは、ウェブサーバに使用者に関する情報を使用者のコンピュータに保存することができるようにする役割をする。本発明においても、無効クリックを検出するために様々なクッキーファイルを用いる。これに関しては、後で詳細に説明する。
The
ログファイル(log file)105は、使用者のクリックに関連した様々なログ(log)を保存するファイルである。本発明においては、無効クリックを検出するために様々なパラメータを用い、各クリックと関連したパラメータをログファイルに保存した後、所定の規則およびパターンを用いて入力されたクリックが無効であるかを判断する。図5、図7および図10に、本発明の実施例によるログファイルの例が示されている。
The
図3は、本発明の一実施例による無効クリック検出装置を示したブロック図である。 FIG. 3 is a block diagram illustrating an invalid click detection apparatus according to an exemplary embodiment of the present invention.
本発明の一実施例による無効クリック検出装置301は、パラメータ入力部304、ログ保存部305、無効クリックパターン保存部306、無効クリック検証部307、無効クリック報告部308、無効クリック判断部309とを含む。
An invalid
インターネット検索エンジンによって提供された検索結果ウェブページの中に含まれた検索項目に対して検索者がクリックした場合、前記クリックと関連した様々なパラメータ302がパラメータ入力部304に入力される。前記パラメータは、無効クリックを判断するための基礎情報であって、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報、および前記検索項目と関連したURL情報などである。
When a searcher clicks on a search item included in a search result web page provided by an Internet search engine,
検索者がインターネット検索エンジンサーバ104に検索要請(要求)をする場合、検索要請パケットがクライアント端末機101からインターネット検索エンジンサーバ104に送信される。前記検索要請パケットは、HTTPプロトコルによるパケット構成をしており、またインターネットプロトコル(IP:Internet Protocol)パケットが含まれて構成される。しかし、前記インターネットプロトコルパケットの構成にはソースIPアドレス(Source IP address)フィールドが含まれているため、インターネット検索エンジンサーバ104は、クリックを要請した検索要請パケットからソースIPアドレスを抽出することによって、検索者の端末機のIPアドレスを抽出する。
When a searcher makes a search request (request) to the Internet
ソースIPアドレスの中で前の部分は、検索者の端末機が属するネットワークのアドレスである。IPアドレスは4バイトで構成され、この中で前部分は検索者の端末機が属するネットワークを識別するためのネットワークアドレスであり、残りの部分が前記ネットワーク内で検索者の端末機を識別するためのアドレスとなる。 The previous part of the source IP address is the address of the network to which the searcher's terminal belongs. The IP address is composed of 4 bytes, in which the front part is a network address for identifying the network to which the searcher's terminal belongs, and the remaining part is for identifying the searcher's terminal in the network. Address.
従って、前記ソースIPアドレスの中からネットワークアドレスを抽出する。本発明の一実施例によると、前の3バイトをネットワークアドレスと見なしてソースIPアドレスからネットワークアドレスを得る。例えば、ソースIPアドレスが123.45.67.89であれば、ネットワークアドレスとして123.45.67を抽出する。 Therefore, a network address is extracted from the source IP address. According to one embodiment of the present invention, the network address is obtained from the source IP address by regarding the previous 3 bytes as a network address. For example, if the source IP address is 123.45.67.89, 123.45.67 is extracted as the network address.
前記検索結果ウェブページと関連した検索語は、検索者がインターネット検索サーバ104に入力した値である。
The search term associated with the search result web page is a value entered by the searcher into the
検索者のウェブブラウザに対する情報は、検索者のクライアント端末機101に設置され、検索者がインターネット検索サーバ104にアクセスするために用いられたウェブブラウザに関する情報である。前記ウェブブラウザに対する情報には、ウェブブラウザの種類、ウェブブラウザのバージョン(version)およびウェブブラウザの製品ID(Product ID)などが含まれる。特に、ウェブブラウザの製品IDは、複数の検索者が同一な種類および同一なバージョンのウェブブラウザを設置した場合でも互いに異なるため、検索者の端末機を識別することができる優れた情報となる。
Information on the searcher's web browser is information on the web browser that is installed in the searcher's
ウェブ接続に用いられるHTTPプロトコルによると、クライアントの環境変数の中の一部がHTTPパケットに含まれてウェブサーバに送信される。ウェブサーバのプログラム(検索エンジンプログラム)は、前記環境変数を受信し、これを無効クリック検出に用いることができる。 According to the HTTP protocol used for web connection, a part of the environment variables of the client is included in the HTTP packet and transmitted to the web server. The web server program (search engine program) can receive the environment variable and use it for invalid click detection.
このような環境変数としては、下記のような情報が含まれる。
REMOTE_HOST:接続した人のドメインネーム
REMOTE_ADDR:接続したクライアントホストのIPアドレス
REMOTE_USER:接続した人の名前(ユーザー認証が設定されたウェブサーバである場合に示される)
REMOTE_IDENT:接続した人のID(ユーザー認証が設定されたウェブサーバである場合に示される)
HTTP_USER_AGENT:接続した人が動作させているプログラムの登録情報、一般的にはブラウザの名前
HTTP_ACCEPT_LANGUAGE:接続した人が使用している言語
HTTP_REFERER:該当するCGIプログラムを呼び出した文章の名前
REQUEST_METHOD:サーバにデータを伝送する方法(GET、POST)
QUERY_STRING:GET方式でデータを伝送した場合、伝送されたデータが保存される変数
CONTENT_LENGTH:POST方式でデータを伝送した場合、伝送されたデータの全体長さ数(バイト数)
CONTENT_TYPE:POST方式でデータを伝送した場合、伝送されるMIME型
AUTH_TYPE:使用者の使用権限を確認するための変数
SERVER_NAME:現在サーバのドメインネーム
SERVER_SOFTWARE:現在サーバに設置されたウェブサーバプログラムの名前
SERVER_PROTOCOL:現在サーバが使用するウェブプロトコルの名前およびバージョン
SERVER_PORT:現在サーバが使用するポート番号(HTTPである場合、一般的に80)
PATH_INFO:呼び出されたCGIプログラムの現在経路の情報
PATH_TRANSLATED:ウェブサーバでウェブが必要な資源(リソース)の経路の情報
SCRIPT_NAME:現在呼び出されるCGIプログラムの名前
HTTP_ACCEPT:現在HTTPで受け取ることができる資源(リソース)の形態
Such environment variables include the following information.
REMOTE_HOST: Domain name of the connected person REMOTE_ADDR: IP address of the connected client host REMOTE_USER: Name of the connected person (shown when the web server is configured for user authentication)
REMOTE_IDENT: ID of the connected person (shown when the web server is set up for user authentication)
HTTP_USER_AGENT: Registration information of the program operated by the connected person, generally the name of the browser HTTP_ACCEPT_LANGUAGE: Language used by the connected person HTTP_REFERER: Name of the sentence that called the corresponding CGI program REQUEST_METHOD: Data to the server (GET, POST)
QUERY_STRING: A variable in which the transmitted data is stored when data is transmitted by the GET method. CONTENT_LENGTH: When data is transmitted by the POST method, the total length of the transmitted data (number of bytes)
CONTENT_TYPE: When the data is transmitted by the POST method, the MIME type to be transmitted AUTH_TYPE: a variable for confirming the use authority of the user SERVER_NAME: the domain name of the current server SERVER_SOFTWARE: the name of the web server program currently installed on the server SERVER_PROTOCOL : Name and version of the web protocol currently used by the server SERVER_PORT: Port number currently used by the server (typically 80 if HTTP)
PATH_INFO: Information on the current route of the called CGI program PATH_TRANSLATED: Information on the route of the resource (resource) required by the web server SCRIPT_NAME: Name of the currently called CGI program HTTP_ACCEPT: Resource that can be received by the current HTTP (resource) ) Form
検索者のクリックと関連したクリック時間は、検索者からクリック入力を受信した時間を用いる。本発明のさらに他の実施例によると、前記検索者のクリック時間と関連した他の時間を用いることもできる。例えば、検索者がクライアントでクリックを実際に入力した時間を用いることもできる。 The click time associated with the searcher's click uses the time when the click input is received from the searcher. According to yet another embodiment of the present invention, other time associated with the searcher's click time may be used. For example, the time when the searcher actually inputs a click on the client can be used.
検索者の端末機に保存されたクッキーファイル情報は、インターネット検索サーバ104がクライアント端末機101に保存されたクッキーファイル102にアクセスして得る。本発明において、クッキーファイル102は、様々な用途で使用されることができるが、これに関しては他の実施例を通して詳細に説明する。
The cookie file information stored in the searcher's terminal is obtained by the
検索者がクリックした検索項目と関連したURL情報は、検索エンジンサーバ104と関連した検索データベース(図示省略)に保存されているため、前記検索データベースを参照することによって得ることができる。前記URL情報は、ウェブサーバのドメインネームであったり、またはドメインネーム、ディレクトリおよびファイル名を含んだ情報であったりする。例えば、“http://www.naver.com”と“http://www.naver.com/download”をドメインネームだけで見ると、すべてwww.naver.comと同一であるが、URL全体で見ると互いに異なる。本発明においては、説明の便宜のため、ドメインネームまでのURLを用いた実施例を説明するが、本発明は、ドメインネーム、ディレクトリおよびファイル名をすべて含み、ドメインネームが同じであってもディレクトリなどが異なれば互いに異なる検索項目と見なされる実施例の場合もすべて含まれる。また、本発明において、URL情報は、本記載に従い、前記実施例すべてを含むものと解釈されなければならない。
Since the URL information related to the search item clicked by the searcher is stored in a search database (not shown) related to the
また、前記で説明したパラメータ以外の無効クリックの検出に有用な他のパラメータも、本発明の技術的思想の範囲内で、無効クリックの検出のために用いることができる。 Other parameters useful for detecting invalid clicks than the parameters described above can also be used for invalid click detection within the scope of the technical idea of the present invention.
前記のような多様なパラメータ302はパラメータ入力部304に入力され、前記パラメータは再びログ保存部305に保存される。本発明によるログ保存部に保存されたログ(log)の例が、図5、図7および図10に示されている。前記図では、それぞれの説明の便宜のため、一部のパラメータのみを含んだログが示されている。しかし、本発明のさらに他の実施例によると、前記パラメータ302の全部または一部を含んだログがログ保存部305に保存される。
The
本発明の一実施例によると、ログ保存部305は、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報、および前記検索項目と関連したURL情報の中の少なくとも2つに関するログを保存する。本発明の好ましい実施例によると、ログ保存部305は、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、および前記検索者の端末機に保存されたクッキーファイル情報の中の少なくとも1つと、前記検索項目と関連したURL情報に関するログを保存する。
According to an embodiment of the present invention, the
無効クリックパターン保存部306は、前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報、および前記検索項目と関連したURL情報の中の少なくとも2つの情報の対と関連した無効クリックパターン(pattern)または規則(rule)を保存する。例えば、“10分間のクリック入力中、検索者の端末機のIPアドレスおよび検索項目と関連したURL情報がすべて一致する場合”という規則またはパターンを保存する。このように無効クリックを判断するための規則などを保存する無効クリックパターン保存部306には、所定の規則によって定められた言語(language)を用いてファイルの形態で保存されたり、または前記のような規則またはパターンに該当する場合は無効クリックと判断するようにするプログラムの形態で保存されたりする。 The invalid click pattern storage unit 306 includes an IP address of the searcher's terminal, a network address to which the searcher's terminal belongs, a search term associated with the search result web page, information on the searcher's web browser, Click time associated with a click, cookie file information stored on the searcher's terminal, and an invalid click pattern or rule associated with at least two pairs of URL information associated with the search item (Rule) is saved. For example, a rule or pattern “when the IP address of the searcher's terminal and the URL information related to the search item all match during the click input for 10 minutes” is stored. In this way, the invalid click pattern storage unit 306 that stores rules for determining invalid clicks is stored in the form of a file using a language defined by a predetermined rule, or as described above. If it corresponds to a simple rule or pattern, it is stored in the form of a program that determines that it is an invalid click.
無効クリック判断部309は、ログ保存部305に保存されたログおよび無効クリックパターン保存部306に保存された無効クリックパターンに基づき、検索者のクリックが無効クリックであるかを判断する。
The invalid click determination unit 309 determines whether the searcher's click is an invalid click based on the log stored in the
無効クリック報告部308は、無効クリック判断部309によって無効と判断されたクリックの中で、所定の基準によるクリックをインターネット検索エンジンの管理者303に報告する。本発明の一実施例によると、無効クリック報告部308は、無効クリック判断部309によって無効と判断されたクリックのすべてをインターネット検索エンジンの管理者に報告する。この場合、前記所定の基準は、無効クリック報告部308が無効クリック判断部309によって無効と判断されたクリックすべてとなる。本発明のさらに他の実施例によると、無効クリックパターン保存部306に保存された規則またはパターンはそれぞれ、前記規則またはパターンに該当する場合は管理者303に報告するべきかに関するフィールドを含んで保存される。この場合には、管理者303に報告すべき規則に該当した場合、無効クリック報告部308が管理者303に報告する。
The invalid click report unit 308 reports a click based on a predetermined standard among the clicks determined to be invalid by the invalid click determination unit 309 to the
無効クリック検証部307は、無効クリック判断部309によって無効クリックとして検出されたクリックを管理者303の入力によって有効クリックに変更する。無効クリック検証部307によって、間違って無効クリックと判断されたクリックを有効クリックに変更することができるため、無効クリックの判断がより正確になる。
The invalid click verification unit 307 changes the click detected as an invalid click by the invalid click determination unit 309 to a valid click according to the input of the
図4は、本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。 FIG. 4 is a flowchart illustrating an invalid click detection method according to an exemplary embodiment of the present invention.
ステップ401で、インターネット検索サーバ104は、検索者から検索要請を受信する。検索者がインターネット検索サーバ104に接続して検索語を入力すると、前記検索語が検索要請パケットとしてインターネット検索サーバ104に送信される。
In
ステップ402で、インターネット検索サーバ104は、前記検索要請に応答して検索結果ウェブページを生成する。例えば、図2に示されたように、検索者の検索語入力に対して複数の検索項目を含んだ検索結果ウェブページを前記検索者に提供する。
In
ステップ403で、前記生成された検索結果ウェブページに対応するページ識別子を獲得する。ページ識別子(Page Identifier)は、検索結果ウェブページが生成されるたびに生成され、前記検索結果ウェブページを識別する識別子である。従って、同一な検索者がインターネット検索サーバ104の検索ウィンドウで同一な検索語を反復して入力することで検索を要請する場合には、その都度新たなページ識別子が割り当てられる。同様に、検索者が検索結果ウェブページを表示しているウェブブラウザで“更新(reload)”項目をクリックすると、クライアント端末機101からインターネット検索サーバ104に検索要請パケットが送信されるため、インターネット検索サーバ104は検索結果ウェブページに対する新たなページ識別子を割り当てる。一見、同一に見える検索結果ウェブページに対して互いに異なるページ識別子が割り当てられるものと思われるが、クライアント端末機101から新たな検索要請を受信する場合、その時に新たに検索結果ウェブページを生成するため、以前の検索結果ウェブページとは異なる検索結果ウェブページが提供される。
In
ステップ404で、インターネット検索サーバ104は、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信する。クリックを受信した場合、前記検索項目に対するハイパーリンクが先ず前記インターネット検索サーバ104にアクセスするようにし、その後、インターネット検索サーバ104が必要な処理をした後、前記検索項目に対応するウェブサイトにクライアント端末機が接続することができるようにする。例えば、“http://www.invalidclick.com/”に対応する検索項目のハイパーリンクとして“http://www.naver.com/abc/*http://www.invalidclick.com/”が用意されており、前記検索項目をクリックした場合、“http://www.naver.com”という検索サーバに先ず接続され、前記検索サーバは前記ハイパーリンクの後にあるURLに従って、前記http://www.invalidclick.comにクライアント端末機が接続するようにする。
In
ステップ405で、インターネット検索サーバ104は、前記クリックされた検索項目に対応するサイト識別子(site identifier)を獲得する。サイト識別子は検索項目を識別する識別子であり、検索項目に対応するURL情報に基づいて生成される。本発明のさらに他の実施例によると、サイト識別子としては検索項目に対応するURL情報をそのまま使用する。前記サイト識別子を生成するための基礎情報として使用されるURL情報は、ウェブサーバのドメインネームであったり、またはドメインネーム、ディレクトリおよびファイル名を含む情報であったりする。例えば、“http://www.naver.com/download”と“http://www.naver.com”をドメインネームだけで見ると、両者ともwww.naver.comと同一であるが、URL全体で見ると互いに異なる。本発明においては、説明の便宜のため、ドメインネームまでのURLを用いた実施例を説明したが、本発明は、ドメインネーム、ディレクトリおよびファイル名をすべて含み、ドメインネームが同じであってもディレクトリなどが異なると、互いに異なる検索項目と見なされる実施例の場合もすべて含む。また、本発明において、サイト識別子は、本記載にに従い、前記実施例のすべてを含むものと解釈されなければならない。
In
ステップ406で、無効クリック検出装置は、前記ページ識別子および前記サイト識別子が所定時間以内の他のクリックと関連したページ識別子およびサイト識別子と一致する場合、前記クリックを無効と判断する。
In
図5は、本発明の一実施例によるログファイルの一例を示した図である。図4の実施例を、図5を参照して説明する。 FIG. 5 is a diagram illustrating an example of a log file according to an embodiment of the present invention. The embodiment of FIG. 4 will be described with reference to FIG.
本発明は、使用者から検索項目に対するクリックを入力されるたびごとに、ページ識別子509およびサイト識別子510をログファイル500に保存する。図面符号501乃至図面符号508は、それぞれのクリック入力に対して保存されたログである。
The present invention saves the page identifier 509 and the site identifier 510 in the
不当クリック試図者は、インターネット検索サーバ104に接続して検索要請を行う。そうすると、インターネット検索サーバ104は、検索結果ウェブページを生成し、前記検索結果ウェブページに対応するページ識別子、“nCe249sisn0”を生成する。不当クリック試図者は、前記検索結果ウェブページに含まれた特定の検索項目を継続してクリックする。一度生成された検索結果ウェブページで特定の検索項目を継続してクリックしてもページ識別子は新たに生成されないため、ページ識別子は継続して同一な値を有するようになる。
The illegal click sampler connects to the
従って、所定時間入力されたクリックに対するログの中で、ページ識別子およびサイト識別子が一致するログ501、ログ502およびログ504は無効クリックと判断される。本発明の一実施例によると、前記一致するログの中で、1つは有効クリックと判断され、残りは無効クリックと判断される。
Therefore, among the logs for clicks input for a predetermined time, the
不当クリック試図者は、自身のウェブブラウザで“更新”をクリックすることによって、検索結果ウェブページを更新する。この場合、ページ識別子も新たに割り当てられ、これに関するログがログ505である。その後、不当クリック試図者が再び同一な検索項目に対してクリックした場合がログ506である。
An unjust click executor updates the search result web page by clicking "update" in his web browser. In this case, a page identifier is also newly assigned, and a log related to this is the
従って、本実施例によると、不当クリック試図者が“更新”を行った後、同一の検索項目に対してクリックした場合(ログ506の場合)は無効クリックとして検出されない。このように“更新”を行った場合も、無効クリックとして検出することができる方法が、図6aおよび図6bを参照した以下の実施例において説明されている。 Therefore, according to the present embodiment, when the illegal click sampler performs “update” and then clicks on the same search item (in the case of the log 506), it is not detected as an invalid click. A method that can be detected as an invalid click even when “update” is performed in this way is described in the following embodiments with reference to FIGS. 6a and 6b.
図6aおよび図6bは、本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。 6a and 6b are flowcharts illustrating the sequence of an invalid click detection method according to an embodiment of the present invention.
ステップ601で、インターネット検索サーバ104は、検索者から検索要請を受信し、ステップ602で、インターネット検索サーバ104は、前記検索要請に応答して検索結果ウェブページを生成する。
In
ステップ603で、無効クリック判断装置は、検索要請を行ったクライアント端末機101にセッションクッキーファイル(session cookie file)が保存されているかを判断する。ステップ603からステップ611までは、セッション識別子(session identifier)を得る過程を説明するためのものである。
In
万一、クライアント端末機101にセッションクッキーファイルが保存されていなければ、ステップ604で、無効クリック判断装置は新たなセッション識別子(session identifier )を生成する。そして、ステップ605で、前記セッション識別子を含むセッションクッキーファイルをクライアント端末機101に保存する。前記セッションクッキーファイルにはセッション識別子の更新時間も保存されるが、ステップ609で、更新時間をセッションクッキーファイルに保存する。
If no session cookie file is stored in the
万一、ステップ603での判断の結果、クライアント端末機101にセッションクッキーファイルが保存されていれば、ステップ606で、前記セッションクッキーファイルに含まれたセッション識別子の最終更新時間が所定時間以内であるかを判断する。
If the session cookie file is stored in the
ステップ606での判断の結果、セッションクッキーファイルに保存されたセッション識別子の最終更新時間が所定時間以内であれば、ステップ607で、前記セッションクッキーファイルに含まれたセッション識別子を抽出する。
If it is determined in
ステップ606での判断の結果、セッションクッキーファイルに含まれたセッション識別子の最終更新時間が所定時間以内でなければ、ステップ608で、新たなセッション識別子を生成する。ステップ610で、セッションクッキーファイルに含まれたセッション識別子を前記新たに生成されたセッション識別子に更新する。ステップ611では、前記セッション識別子の更新時間を前記セッションクッキーファイルに保存する。
If the result of determination in
ステップ612で、インターネット検索サーバ104は、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信する。
In
ステップ613で、インターネット検索サーバ104は、前記クリックされた検索項目に対応するサイト識別子(site identifier)を獲得する。
In
ステップ614で、無効クリック検出装置は、前記セッション識別子および前記サイト識別子が所定時間以内の他のクリックと関連したセッション識別子およびサイト識別子と一致した場合、前記クリックを無効と判断する。
In
図7は、本発明の一実施例によるログファイルの一例を示した図である。 FIG. 7 is a diagram illustrating an example of a log file according to an embodiment of the present invention.
本実施例は、使用者から検索項目に対するクリックを入力されるたびごとに、クリック時間710、セッション識別子の更新時間711、セッション識別子712およびサイト識別子713をログファイル700に保存する。図面符号701乃至図面符号708は、それぞれのクリック入力に対して保存されたログである。
In this embodiment, each time a click on a search item is input by a user, a
不当クリック試図者はインターネット検索サーバ104に接続して検索要請を行い、インターネット検索サーバ104は検索結果ウェブページを生成する。インターネット検索サーバ104は、前記検索結果ウェブページに含まれた検索項目に対するクリックを受信する。
The illegal click sampler connects to the
インターネット検索サーバ104は、クライアント端末機101にセッションクッキーファイルが保存されているかを確認する。セッションクッキーファイルが保存されていなければ新たなセッション識別子を生成し、その更新時間および前記セッション識別子を含むセッションクッキーファイルをクライアント端末機101に保存する。本実施例では、セッション識別子“xigw9492”および更新時間“10:50:14”が記録されている。また、ログファイル700にクリック時間、更新時間、セッション識別子および検索項目に対応するサイト識別子をログ701で保存する。セッションクッキーファイルを初めに生成する場合は、クリック時にセッションクッキーファイルが生成され、またその時にセッション識別子が生成されるため、クリック時間およびセッション識別子の更新時間が同一である。
The
不当クリック試図者は同一の検索結果ページで、同一の検索項目に対してクリックする。インターネット検索サーバ104は、クライアント端末機101にセッションクッキーファイルが保存されているかを確認する。前記で生成したセッションクッキーファイルがすでにクライアント端末機101に保存されているため、インターネット検索サーバ104は、クライアント端末機101に保存されたセッションクッキーファイルにアクセスする。前記セッションクッキーファイルには、セッション識別子および前記セッション識別子の最終更新時間が保存されている。本実施例では、セッション識別子“xigw9492”および更新時間“10:50:14”がセッションクッキーファイルに保存されている。
An illegal click examiner clicks on the same search item on the same search result page. The
インターネット検索サーバ104は、検索者からの検索項目に対するクリック時間が、前記セッション識別子と関連した最終更新時間から所定時間以内であるかを判断する。本実施例で、2度目クリックのクリック時間は“10:50:18”である。所定時間を5分とした場合、前記クリック時間“10:50:18”は、最終更新時間“10:50:14”から所定時間以内である。従って、この場合には、セッションクッキーファイルに保存されているセッション識別子を現在のセッション識別子として、セッションクッキーファイルのセッション識別子を更新しない。従って、この場合には、ログ702のように記録される。
The
ログ702は、ログ701とセッション識別子およびサイト識別子が同一であるため、無効クリックと判断される。 The log 702 is determined to be an invalid click because the session identifier and the site identifier are the same as the log 701.
ログ704は、不当クリック試図者が“更新”要請を行った場合に関するものである。不当クリック試図者が“更新”要請を行った場合にも同様に、クライアント端末機101に保存されたセッションクッキーファイルを参照し、前記セッションクッキーファイルに保存された最終更新時間が一定時間内であるため、セッション識別子を更新しない。従って、ログ704のように記録され、ログ704はログ701と同一であるため無効クリックと判断される。すなわち、本実施例によると、不当クリック試図者が短時間内に“更新”を行った後、同一の検索項目をクリックした場合を検出することができる。
The
ログ705は、ログ701、ログ702およびログ704とは異なる検索者から同一の検索項目に対するクリックを受信した場合に関するものである。この場合は、新たなセッション識別子が割り当てられるため、無効クリックと判断されない。
The
ログ709は、ログ701と同一の検索者が相当に長い時間の後に同一の検索項目をクリックした場合に関するものである。この場合は、相当に長い時間の後にクリックを受信したものであるため、無効クリックと判断されない。
The
本実施例によると、セッション識別子が生成された後、一定時間、同一の検索項目をクリックした場合は、無効クリックと判断される。 According to the present embodiment, when the same search item is clicked for a certain period of time after the session identifier is generated, it is determined that the click is invalid.
これと類似して、本発明のさらに他の実施例によると、無効クリック判断の基準として、同一の検索項目に対する最終クリック時間から一定時間以内である場合を無効クリックと判断することができるが、これに関して簡単に説明する。 Similarly, according to another embodiment of the present invention, as a criterion for determining invalid clicks, it can be determined that invalid clicks are within a certain time period from the last click time for the same search item. This will be briefly described.
検索者からクリックを受信した場合、前記端末機に前記セッションクッキーファイルが保存されているかを判断する。前記端末機に前記セッションクッキーファイルが保存されている場合、前記検索者からの前記検索項目に対するクリック時間が前記セッション識別子と関連した最終クリック時間から所定時間以内であるかを判断する。 When a click is received from a searcher, it is determined whether the session cookie file is stored in the terminal. If the session cookie file is stored in the terminal, it is determined whether the click time for the search item from the searcher is within a predetermined time from the last click time associated with the session identifier.
前記検索項目に対するクリック時間が前記最終クリック時間から所定時間以内である場合、前記セッションクッキーファイルに含まれたセッション識別子を獲得し、前記最終クリック時間を前記検索項目に対するクリック時間に更新する。 If the click time for the search item is within a predetermined time from the last click time, the session identifier included in the session cookie file is acquired, and the last click time is updated to the click time for the search item.
前記検索項目に対するクリック時間が前記最終クリック時間から所定時間以内でない場合、新たなセッション識別子を生成し、前記セッションクッキーファイルに含まれたセッション識別子を更新する。また、前記最終クリック時間を前記検索項目に対するクリック時間に更新する。 If the click time for the search item is not within a predetermined time from the last click time, a new session identifier is generated, and the session identifier included in the session cookie file is updated. The last click time is updated to the click time for the search item.
例えば、図7において、同一のクライアント端末機から同一の検索項目に対して複数のクリックがある場合、最終クリックから5秒経過した場合は有効であると判断すると、ログ704と関連したクリックは、それ以前の最終クリック時間“10:50:18”よりも13秒後である“10:50:13”にクリックされたため有効と判断される。本発明の好ましい実施例によると、前記時間の基準は、無効クリックを検出する目的に従って決定される。
For example, in FIG. 7, when there are a plurality of clicks for the same search item from the same client terminal, if it is determined that it is valid when 5 seconds have passed since the last click, the click associated with the
図8は、本発明の一実施例によってセッション識別子を生成する方法の順序を示した流れ図である。 FIG. 8 is a flowchart illustrating an order of a method for generating a session identifier according to an embodiment of the present invention.
セッション識別子は、他のセッション識別子と区別されるように単独的に割り当てられなければならず、同時に偽造または変造がし難いようにしなければならない。なぜなら、単に単独的に割り当てられる場合には、不当クリック試図者がセッション識別子を架空で生成してセッションクッキーに保存したり、またはプログラムを介して継続してセッション識別子を変更したりしながらクリックを行うプログラムを準備して、不当にクリック数を高めることができるためである。 Session identifiers must be assigned solely to distinguish them from other session identifiers, and at the same time be difficult to forge or alter. Because, if it is simply assigned alone, the click clicker can generate a session identifier fictitiously and save it in a session cookie, or continue to change the session identifier through a program This is because the number of clicks can be unfairly increased by preparing a program that performs the above.
ソースデータ801は、セッション識別子805を生成するための基礎データであって、現在の時間情報、検索語、検索者のウェブブラウザの製品IDなど、様々である。また、無作為で選択された数字でもある。このようなソースデータ801を、ハッシング関数(hashing function)802を適用してエンコーディング(暗号化)されたストリング(文字列)803を生成する。その後、エンコーディングされたストリング803にチェックサム(checksum)を追加してセッション識別子805を生成する。前記チェックサムを用いることによって、不当クリック試図者がセッション識別子を偽造することを防止する。
The
本実施例によるセッション識別子の生成方法は、ページ識別子、サイト識別子および前で説明した実施例の端末機識別子などを生成するのにも適用される。 The session identifier generation method according to the present embodiment is also applied to generate a page identifier, a site identifier, and the terminal identifier of the embodiment described above.
図9は、本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。 FIG. 9 is a flowchart illustrating an invalid click detection method according to an exemplary embodiment of the present invention.
ステップ901で、インターネット検索サーバ104は、検索者から検索結果ウェブページに含まれた検索項目に対するクリックを受信する。ステップ902で、インターネット検索サーバ104は、検索者の端末機101に対応するクライアントIPアドレスを獲得する。クライアントIPアドレスは、受信したIPパケットのソースIPアドレスフィールドから抽出することができる。
In
ステップ903で、インターネット検索サーバ104は、前記クリックされた検索項目に対応するサイト識別子を獲得する。
In
ステップ904で、無効クリック検出装置は、前記クライアントIPアドレスおよび前記サイト識別子が所定時間以内の他のクリックと関連したクライアントIPアドレスおよびサイト識別子と一致する場合、前記クリックを無効と判断する。
In
図10は、本発明の一実施例によるログファイルの一例を示した図である。 FIG. 10 is a diagram illustrating an example of a log file according to an embodiment of the present invention.
本実施例は、使用者から検索項目に対するクリックを入力されるたびごとに、クリック時間1010、クライアントIPアドレス1011およびサイト識別子1012をログファイル1000に保存する。図面符号1001乃至図面符号1009は、それぞれのクリック入力に対して保存されたログである。
In this embodiment, every time a click on a search item is input by a user, a click time 1010, a
同一なクライアント端末機の使用者が継続して同一の検索項目をクリックする場合、前記クリックが一定時間内に反復されると、前記クリックは無効クリックである可能性が高い。しかし、相当な長い時間の後に同一のクライアント端末機の使用者が同一の検索項目をクリックした場合は様々である。すなわち、使用者は関心の高いウェブサイトには頻繁に訪問する傾向があるためである。しかし、短い一定期間内に継続して訪問することは、正常的なクリックであると判断するのが困難であるため、このような場合は無効クリックと判断する。例えば、前記時間の基準を5分とした場合、ログ1001と同一のクライアントIPアドレスおよびサイト識別子を有するログ1002、ログ1004、ログ1005は無効クリックと判断され、約20分後にクリックされたログ1009と関連したクリックは有効と判断される。
When users of the same client terminal continuously click on the same search item, if the click is repeated within a predetermined time, the click is likely to be an invalid click. However, there are various cases where a user of the same client terminal clicks the same search item after a considerable long time. In other words, users tend to visit frequently interested websites. However, since it is difficult to determine that it is a normal click to continuously visit within a short period of time, in such a case, it is determined to be an invalid click. For example, when the time standard is 5 minutes, the
但し、クライアントIPアドレスを基準として無効クリックを判断する場合は注意すべき点がある。クライアント端末機がプロキシサーバ(proxy server)またはIP共有機を用いる場合には、実際には別のクライアント端末機から同一の検索項目に対してクリックがなされたにもかかわらず無効クリックと判断される危険があるためである。従って、好ましくは、本実施例はセッション識別子など、他のパラメータを用いる実施例と組み合わせて構成することが好ましい。 However, there are points to be noted when determining invalid clicks based on the client IP address. When the client terminal uses a proxy server or an IP sharing machine, it is determined that the click is actually invalid even though the same search item is clicked from another client terminal. This is because there is a danger. Therefore, this embodiment is preferably configured in combination with an embodiment using other parameters such as a session identifier.
反対に、同一の検索項目に対するクリック要請を行うクライアント端末機のクライアントIPアドレスは異なるが、ネットワークアドレスが同一な場合がある。例えば、何人かが一箇所に集って継続して不当なクリックを試図したり、またはプログラムを用いてソースIPアドレスを変えたりしながらクリック要請をする場合がある。この場合は、同一の検索項目に対してクリック要請を行ったクライアント端末機のネットワークアドレスが同一であり、その他の違う条件(例えば、前記検索項目が属するディレクトリ内の平均クリック数よりも極めてクリック数が多いなどの条件)を満たす場合、無効クリックと判断することができる。 Conversely, the client IP address of the client terminal that makes a click request for the same search item is different, but the network address may be the same. For example, there are cases where several people gather in one place and continuously try an illegal click, or make a click request while changing the source IP address using a program. In this case, the network address of the client terminal that made the click request for the same search item is the same, and other different conditions (for example, the number of clicks much more than the average number of clicks in the directory to which the search item belongs). If the condition (such as a large number) is satisfied, it can be determined that the click is invalid.
図11は、本発明の一実施例による無効クリック検出方法の順序を示した流れ図である。 FIG. 11 is a flowchart illustrating the sequence of an invalid click detection method according to an embodiment of the present invention.
ステップ1101で、インターネット検索サーバ104は検索者からの検索要請を受信し、ステップ1102で、検索結果ウェブページを生成する。
In
ステップ1103で、インターネット検索サーバ104は、前記端末機に前記端末機識別子を含む使用者クッキーファイルが保存されているかを判断する。
In
ステップ1103の判断の結果、前記端末機に前記端末機識別子を含む使用者クッキーファイルが保存されていなければ、ステップ1104で端末機識別子を生成し、ステップ1105で、インターネット検索サーバ104は、前記端末機識別子を含む使用者クッキーファイルを生成して前記検索者端末機に保存する。
If it is determined in
ステップ1103の判断の結果、前記端末機に前記端末機識別子を含む使用者クッキーファイルが保存されていれば、ステップ1106で、使用者クッキーファイルから前記端末機識別子を抽出する。
If it is determined in
ステップ1107で、インターネット検索サーバ104は、検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信し、ステップ1108で、前記クリックされた検索項目に対応するサイト識別子を獲得する。
In
最後に、ステップ1109で、無効クリック判断装置は、前記端末機識別子および前記サイト識別子が所定時間以内の他のクリックと関連した端末機識別子およびサイト識別子と一致する場合、前記クリックを無効と判断する。
Finally, in
本実施例によると、クライアント端末機がプロキシサーバ(proxy server)またはIP共有機を用いる場合にも、クライアント端末機を端末機識別子で区分することができるため、互いに異なるクライアント端末機がプロキシサーバまたはIP共有機を使用する場合にも、適切に前記互いに異なるクライアントからのクリックを識別することができる。 According to the present embodiment, even when the client terminal uses a proxy server or an IP sharing machine, the client terminal can be classified by the terminal identifier. Even when using an IP sharing machine, clicks from different clients can be appropriately identified.
本発明のさらに他の実施例は、インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対して所定期間の前記検索項目当りの検索者のクリック数が前記検索項目が属するカテゴリに属する検索項目の平均クリック数よりも極めて大きい場合は、無効クリックと疑って管理者に報告する。 According to another embodiment of the present invention, a search item included in a search result web page provided by an Internet search engine includes a category to which a searcher clicks per search item in a predetermined period belongs. If it is much larger than the average number of clicks for search items belonging to, report it to the administrator as suspected invalid clicks.
本実施例による無効クリック検出装置は、インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対して所定期間の前記検索項目当りの検索者のクリック数をカウントするクリック数カウント手段、前記検索項目が属するカテゴリに属する検索項目の前記所定期間の平均クリック数を計算する平均クリック数計算手段、および前記検索項目当りのクリック数が前記平均クリック数に対して所定の差より大きい場合を判断する判断手段を含む。前記検索項目当りのクリック数が前記平均クリック数に対して所定の差より大きい場合には、無効クリック報告部308を介して管理者に報告する。 The invalid click detection device according to the present embodiment includes a click number counting means for counting the number of clicks of a searcher per search item for a predetermined period with respect to a search item included in a search result web page provided by an Internet search engine. An average click number calculating means for calculating an average number of clicks of the search item belonging to the category to which the search item belongs, and a case where the number of clicks per search item is greater than a predetermined difference with respect to the average click number Judgment means for judging When the number of clicks per search item is larger than a predetermined difference with respect to the average number of clicks, it is reported to the administrator via the invalid click report unit 308.
本発明のさらに他の実施例によると、インターネット検索エンジンによって提供された検索結果ウェブページに含まれた検索項目に対して所定期間の前記検索項目当りの検索者のクリック数を、前記検索結果ウェブページで前記検索項目の上に位置する所定の第1個数の検索項目および前記検索項目の下に位置する所定の第2個数の検索項目の前記所定期間の平均クリック数と比較する。例えば、特定検索項目に対するクリック数と前記特定検索項目のすぐ上に位置した検索項目2つおよび前記特定検索項目のすぐ下に位置した検索項目2つに対する同一な期間のクリック数を比較する。前記比較した結果、前記特定検索項目に対するクリック数が周囲の他の検索項目に対するクリック数より例えば5倍以上多ければ、これは無効クリックの可能性が高いと判断され、管理者に報告する。 According to another exemplary embodiment of the present invention, the number of clicks of a searcher per search item for a predetermined period with respect to a search item included in a search result web page provided by an Internet search engine is calculated as the search result web. The page is compared with the average number of clicks in the predetermined period of a predetermined first number of search items positioned above the search items and a predetermined second number of search items positioned below the search items. For example, the number of clicks for a specific search item is compared with the number of clicks in the same period for two search items located immediately above the specific search item and two search items located immediately below the specific search item. As a result of the comparison, if the number of clicks on the specific search item is, for example, five times or more higher than the number of clicks on other search items in the vicinity, it is determined that the possibility of invalid clicks is high, and is reported to the administrator.
以上、無効クリックを判断するための多様な方法を記載したが、前記無効クリック判断方法は独自的に用いることも、また他の無効クリック判断方法と組み合わせて用いることもできる。例えば、無効クリックパターン保存部306で、クライアントIPアドレス、ページ識別子および検索項目に対応するサイト識別子が、前記検索項目に対する最終クリックから5分内に反復された場合は無効とする規則を保存することができる。 Although various methods for determining invalid clicks have been described above, the invalid click determination method can be used independently or in combination with other invalid click determination methods. For example, the invalid click pattern storage unit 306 stores a rule that invalidates a client IP address, a page identifier, and a site identifier corresponding to a search item within 5 minutes from the last click on the search item. Can do.
本発明において、インターネット検索サーバと無効クリック検出装置は1つの装置として混用されて説明されたが、本発明のさらに他の実施例によると、前記インターネット検索サーバと無効クリック検出装置は、その機能に従って分離されて実装され、また、異なる管理者によって管理される。 In the present invention, the Internet search server and the invalid click detection device have been described as being mixed as one device. However, according to another embodiment of the present invention, the Internet search server and the invalid click detection device are in accordance with their functions. Implemented separately and managed by different administrators.
本発明において、別個の構成要素で図示されて説明された構成要素は、物理的に1つのシステムから構成されたり、または物理的に別個のシステムから構成されたりしてもよい。 In the present invention, the components illustrated and described as separate components may be physically configured from one system or may be physically configured from separate systems.
また、本発明において、様々な実施例が説明されたが、本発明の技術的思想の範囲内で前記複数の実施例の中で説明された技術的思想の一部を組み合わせたり除外したりした構成も、やはり本発明が属する技術分野において通常の知識を有する者には、本発明の技術範囲内であるということは明らかである。 Also, various embodiments have been described in the present invention, but some of the technical ideas described in the plurality of embodiments are combined or excluded within the scope of the technical idea of the present invention. It will be apparent to those skilled in the art to which the present invention pertains that the construction is also within the technical scope of the present invention.
また、本発明の実施例は、多様なコンピュータで実現される動作を遂行するためのプログラム命令を含むコンピュータ読み取り可能媒体を含む。前記コンピュータ読み取り可能媒体は、プログラム命令、データファイル、データ構造などを単独または組み合わせて含む。前記媒体におけるプログラム命令は本発明のために特別に設計されて構成されたものであったり、コンピュータソフトウェアの当業者に公知されて使用可能なものであったりする。コンピュータ読み取り可能記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスクおよび磁気テープのような磁気媒体(magnetic media)、CD−ROM、DVDのような光記録媒体(optical media)、フレキシブルディスク(floptical disk)のような光磁気媒体(magneto−optical media)、およびロム(ROM)、ラム(RAM)、フラッシュメモリなどのようなプログラム命令を保存して遂行するように特別に構成されたハードウェア装置が含まれる。前記媒体は、プログラム命令、データ構造などを保存する信号を伝送する搬送波を含む光または金属線、導波管などの伝送媒体である。プログラム命令の例としては、コンパイラによって生成されたもののような機械語コードだけでなく、インタプリタなどを用いてコンピュータによって実行される高級言語コードを含む。 Embodiments of the present invention also include a computer readable medium including program instructions for performing operations implemented on various computers. The computer readable medium includes program instructions, data files, data structures, etc. alone or in combination. The program instructions in the medium may be specially designed and configured for the present invention, or may be known and usable by those skilled in the computer software art. Examples of the computer-readable recording medium include a magnetic medium such as a hard disk, a floppy (registered trademark) disk and a magnetic tape, an optical recording medium such as a CD-ROM and a DVD, a flexible disk ( Hardware specially configured to store and execute magneto-optical media such as floppy disks and program instructions such as ROM, RAM, flash memory, etc. Device included. The medium is a transmission medium such as an optical or metal line or a waveguide including a carrier wave that transmits a signal that stores program instructions, data structures, and the like. Examples of program instructions include not only machine language codes such as those generated by a compiler, but also high-level language codes that are executed by a computer using an interpreter or the like.
図12は、本発明による検索エンジンサーバおよび無効クリック検出装置を構成するのに採用される汎用コンピュータシステムの内部ブロック図である。 FIG. 12 is an internal block diagram of a general-purpose computer system that is employed to configure a search engine server and an invalid click detection device according to the present invention.
コンピュータシステム1200は、ラム(RAM:Random Access Memory)1202とロム(ROM:Read Only Memory)1203を含む主記憶装置と接続される1つ以上のプロセッサ1201を含む。プロセッサ1201は、中央処理装置(CPU)ともいう。本技術分野において広く知られているように、ロム1203はデータ(data)と命令(instruction)を単方向性でCPUに伝達する役割をし、ラム1202は通常、データと命令を両方向性で伝達するのに用いられる。ラム1202およびロム1203は、コンピュータ読み取り可能媒体のいかなる適切な形態をも含む。大容量記憶装置(Mass Storage)1204は、両方向性でプロセッサ1201と接続されて追加的なデータ保存能力を提供し、前記コンピュータ読み取り可能記録媒体の中のいかなるものにも該当する。大容量記憶装置1204は、プログラム、データなどを保存するのに用いられ、通常、主記憶装置よりも速度が遅いハードディスクのような補助記憶装置である。CDロム1206のような特定大容量記憶装置が用いられることもある。プロセッサ1201は、ビデオモニター、トラックボール、マウス、キーボード、マイクロフォン、タッチスクリーン型ディスプレイ、カード読み取り機、磁気または紙テープ読み取り機、音声または手書き文字認識機、ジョイスティック、またはその他の公のコンピュータ入出力装置のような1つ以上の入出力インターフェイス1205と接続される。最後に、プロセッサ1201は、ネットワークインターフェイス1207を介して有線または無線通信ネットワークに接続される。このようなネットワーク接続を介して前記された方法の手順を遂行する。前記された装置または道具は、コンピュータハードウェアおよびソフトウェア技術分野の当業者に広く知られている。
The
前記されたハードウェア装置は、本発明の動作を遂行するために1つ以上のソフトウェアモジュールとして作動するように構成される。 The hardware device described above is configured to operate as one or more software modules to perform the operations of the present invention.
以上のように、本発明は限定された実施例と図面によって説明されているが、本発明は実施例に限定されるものではなく、本発明が属する分野にて通常の知識を有する者であれば、このような記載から多様な修正および変形が可能である。従って、本発明の思想は特許請求の範囲によって解釈されるべきであり、この均等または等価的変形は本発明の思想の範囲に属することは言うまでもない。 As described above, the present invention has been described with reference to the limited embodiments and drawings. However, the present invention is not limited to the embodiments, and those having ordinary knowledge in the field to which the present invention belongs. For example, various modifications and variations can be made from such description. Therefore, the idea of the present invention should be construed by the claims, and it goes without saying that this equivalent or equivalent modification belongs to the scope of the idea of the present invention.
Claims (21)
前記生成されたウェブページに対応するページ識別子を獲得するステップと、
検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、
前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、
前記ページ識別子および前記サイト識別子が所定時間以内の他のクリックと関連したページ識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップと
を含むことを特徴とするインターネット検索エンジンにおける無効クリック検出方法。 Generating a search results web page in response to a search request from a searcher;
Obtaining a page identifier corresponding to the generated web page;
Receiving a click on a search item included in the search result web page from a searcher;
Obtaining a site identifier corresponding to the clicked search item;
An invalid click in an Internet search engine, comprising: determining that the click is invalid if the page identifier and the site identifier match a page identifier and a site identifier associated with another click within a predetermined time. Detection method.
前記検索者の端末機に保存されたセッションクッキーファイルに含まれたセッション識別子を獲得するステップと、
検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、
前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、
前記セッション識別子および前記サイト識別子が所定時間以内の他のクリックと関連したセッション識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップと
を含むことを特徴とするインターネット検索エンジンにおける無効クリック検出方法。 Generating a search results web page in response to a search request from a searcher;
Obtaining a session identifier contained in a session cookie file stored in the searcher's terminal;
Receiving a click on a search item included in the search result web page from a searcher;
Obtaining a site identifier corresponding to the clicked search item;
An invalid click in an Internet search engine, comprising: determining that the click is invalid if the session identifier and the site identifier match a session identifier and a site identifier associated with another click within a predetermined time period. Detection method.
前記端末機に前記セッションクッキーファイルが保存されているかを判断するステップと、
前記端末機に前記セッションクッキーファイルが保存されていない場合、新たなセッション識別子を生成し、前記生成されたセッション識別子を含むセッションクッキーファイルを前記端末機に保存するステップと
を含むことを特徴とする請求項3に記載のインターネット検索エンジンにおける無効クリック検出方法。 Obtaining a session identifier included in a session cookie file stored in the searcher's terminal;
Determining whether the session cookie file is stored in the terminal; and
When the session cookie file is not stored in the terminal, a new session identifier is generated, and a session cookie file including the generated session identifier is stored in the terminal. The invalid click detection method in the Internet search engine of Claim 3.
前記最終更新時間が前記所定時間以内である場合、前記セッションクッキーファイルに含まれたセッション識別子を獲得するステップと
をさらに含むことを特徴とする請求項4に記載のインターネット検索エンジンにおける無効クリック検出方法。 If the session cookie file is stored in the terminal, determining whether the last update time of the session identifier included in the session cookie file is within a predetermined time;
The method according to claim 4, further comprising: obtaining a session identifier included in the session cookie file when the last update time is within the predetermined time. .
前記セッション識別子の更新時間を前記セッションクッキーファイルに保存するステップと
をさらに含むことを特徴とする請求項5に記載のインターネット検索エンジンにおける無効クリック検出方法。 If the last update time is not within the predetermined time, generating a new session identifier and updating the session identifier included in the session cookie file;
The method according to claim 5, further comprising: storing the session identifier update time in the session cookie file.
前記検索項目に対するクリック時間が前記最終クリック時間から所定時間以内である場合、前記セッションクッキーファイルに含まれたセッション識別子を獲得するステップと、
前記最終クリック時間を前記検索項目に対するクリック時間に更新するステップと
を含むことを特徴とする請求項4に記載のインターネット検索エンジンにおける無効クリック検出方法。 If the session cookie file is stored in the terminal, determining whether the click time for the search item from the searcher is within a predetermined time from the last click time associated with the session identifier;
Obtaining a session identifier included in the session cookie file if the click time for the search item is within a predetermined time from the last click time;
The method according to claim 4, further comprising: updating the last click time with a click time for the search item.
前記最終クリック時間を前記検索項目に対するクリック時間に更新するステップと
をさらに含むことを特徴とする請求項7に記載のインターネット検索エンジンにおける無効クリック検出方法。 If the click time for the search item is not within a predetermined time from the last click time, generating a new session identifier and updating the session identifier included in the session cookie file;
The method according to claim 7, further comprising: updating the last click time with a click time for the search item.
前記検索者の端末機に対応するクライアントIPアドレスを獲得するステップと、
前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、
前記クライアントIPアドレスおよび前記サイト識別子が所定時間以内の他のクリックと関連したクライアントIPアドレスおよびサイト識別子と一致する場合、前記クリックを無効と判断するステップと
を含むことを特徴とするインターネット検索エンジンにおける無効クリック検出方法。 Receiving a click from a searcher on a search item included in a search results webpage;
Obtaining a client IP address corresponding to the terminal of the searcher;
Obtaining a site identifier corresponding to the clicked search item;
In the Internet search engine comprising: determining that the click is invalid if the client IP address and the site identifier match a client IP address and a site identifier associated with another click within a predetermined time period. Invalid click detection method.
前記検索者の端末機に対応する端末機識別子を獲得するステップと、
前記端末機識別子を含む使用者クッキーファイルを生成して前記検索者の端末機に保存するようにするステップと、
検索者から前記検索結果ウェブページに含まれた検索項目に対するクリックを受信するステップと、
前記クリックされた検索項目に対応するサイト識別子を獲得するステップと、
前記端末機識別子および前記サイト識別子が所定時間以内の他のクリックと関連した端末機識別子およびサイト識別子と一致する場合、前記クリックを無効と判断するステップと
を含むことを特徴とするインターネット検索エンジンにおける無効クリック検出方法。 Generating a search results web page in response to a search request from a searcher;
Obtaining a terminal identifier corresponding to the searcher's terminal;
Generating a user cookie file including the terminal identifier and storing it in the searcher's terminal; and
Receiving a click on a search item included in the search result web page from a searcher;
Obtaining a site identifier corresponding to the clicked search item;
In the Internet search engine, comprising: determining that the click is invalid when the terminal identifier and the site identifier match a terminal identifier and a site identifier associated with another click within a predetermined time. Invalid click detection method.
前記端末機に前記端末機識別子を含む使用者クッキーファイルが保存されている場合、前記使用者クッキーファイルから前記端末機識別子を受信するステップと
をさらに含むことを特徴とする請求項12に記載のインターネット検索エンジンにおける無効クリック検出方法。 Determining whether a user cookie file including the terminal identifier is stored in the terminal;
The method of claim 12, further comprising: when the user cookie file including the terminal identifier is stored in the terminal, receiving the terminal identifier from the user cookie file. Invalid click detection method in Internet search engine.
前記検索者の端末機のIPアドレス、前記検索者の端末機が属するネットワークアドレス、前記検索結果ウェブページと関連した検索語、前記検索者のウェブブラウザに対する情報、前記クリックと関連したクリック時間、前記検索者の端末機に保存されたクッキーファイル情報および前記検索項目と関連したURL情報の中の少なくとも2つの情報の対と関連した無効クリックパターンを保存する無効クリックパターン保存部と、
前記ログ保存部に保存された前記ログおよび前記無効クリックパターン保存部に保存された無効クリックパターンに基づき、前記検索者のクリックが無効クリックであるかを判断する無効クリック判断部と
を含むことを特徴とする無効クリック検出装置。 In response to a searcher's click on a search item included in a search result web page provided by an Internet search engine, the IP address of the searcher's terminal, the network address to which the searcher's terminal belongs, and the search result Among the search terms related to the web page, information about the searcher's web browser, click time related to the click, cookie file information stored on the searcher's terminal, and URL information related to the search item A log storage unit for storing logs related to at least two of
The IP address of the searcher's terminal, the network address to which the searcher's terminal belongs, the search term associated with the search result web page, the information for the searcher's web browser, the click time associated with the click, An invalid click pattern storage unit that stores an invalid click pattern associated with at least two pairs of cookie file information stored in a searcher's terminal and URL information associated with the search item;
An invalid click determination unit that determines whether the click of the searcher is an invalid click based on the log stored in the log storage unit and the invalid click pattern stored in the invalid click pattern storage unit. An invalid click detection device.
前記検索項目が属するカテゴリに属する検索項目の前記所定期間の平均クリック数を計算する平均クリック数計算手段と、
前記検索項目当りのクリック数が前記平均クリック数に対して所定の差より大きい場合を判断する判断手段と
を含むことを特徴とする無効クリック検出装置。 Click number counting means for counting the number of clicks of a searcher per search item for a predetermined time for a search item included in a search result web page provided by an Internet search engine;
Average click number calculating means for calculating an average number of clicks of the predetermined period of the search item belonging to the category to which the search item belongs;
An invalid click detection device, comprising: a determination unit configured to determine whether the number of clicks per search item is greater than a predetermined difference with respect to the average number of clicks.
前記検索結果ウェブページで前記検索項目の上に位置する所定の第1個数の検索項目および前記検索項目の下に位置する所定の第2個数の検索項目の前記所定期間の平均クリック数を計算する平均クリック数計算手段と、
前記検索項目当りのクリック数が前記平均クリック数に対して所定の差より大きい場合を判断する判断手段と
を含むことを特徴とする無効クリック検出装置。 Click number counting means for counting the number of clicks of a searcher per search item for a predetermined time for a search item included in a search result web page provided by an Internet search engine;
The average number of clicks in the predetermined period of the predetermined first number of search items positioned above the search items and the predetermined second number of search items positioned below the search items in the search result web page is calculated. Means to calculate average clicks,
An invalid click detection device, comprising: a determination unit configured to determine whether the number of clicks per search item is greater than a predetermined difference with respect to the average number of clicks.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030017233A KR100619178B1 (en) | 2003-03-19 | 2003-03-19 | Method and apparatus for detecting invalid clicks on the internet search engine |
PCT/KR2004/000416 WO2004084097A1 (en) | 2003-03-19 | 2004-02-27 | Method and apparatus for detecting invalid clicks on the internet search engine |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006520940A true JP2006520940A (en) | 2006-09-14 |
JP4358188B2 JP4358188B2 (en) | 2009-11-04 |
Family
ID=36707372
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005518761A Expired - Lifetime JP4358188B2 (en) | 2003-03-19 | 2004-02-27 | Invalid click detection device in Internet search engine |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP4358188B2 (en) |
KR (1) | KR100619178B1 (en) |
CN (2) | CN100533434C (en) |
WO (1) | WO2004084097A1 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008541220A (en) * | 2005-05-06 | 2008-11-20 | エヌエイチエヌ コーポレーション | Personalized search method and personalized search system |
JP2014026528A (en) * | 2012-07-27 | 2014-02-06 | Nippon Telegr & Teleph Corp <Ntt> | Effective click counter, method and program |
JP6873343B1 (en) * | 2020-09-07 | 2021-05-19 | シエンプレ株式会社 | Unauthorized click prevention system, unauthorized click prevention method and program |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11042886B2 (en) | 2003-09-04 | 2021-06-22 | Google Llc | Systems and methods for determining user actions |
US8706551B2 (en) * | 2003-09-04 | 2014-04-22 | Google Inc. | Systems and methods for determining user actions |
KR100786796B1 (en) * | 2005-03-25 | 2007-12-18 | 주식회사 다음커뮤니케이션 | Method and system for billing of internet advertising |
KR20060028463A (en) * | 2006-03-09 | 2006-03-29 | 정성욱 | Click tracking and management system for online advertisement service |
KR100777660B1 (en) * | 2006-04-10 | 2007-11-19 | (주)소만사 | Method of detecting robot-based invalid use of keyword advertisement and computer-readable medium having thereon program performing function embodying the same |
KR100777659B1 (en) * | 2006-04-10 | 2007-11-19 | (주)소만사 | Device of detecting invalid use of keyword advertisement |
WO2008030670A1 (en) * | 2006-09-08 | 2008-03-13 | Microsoft Corporation | Detecting and adjudicating click fraud |
CN101075908B (en) * | 2006-11-08 | 2011-04-20 | 腾讯科技(深圳)有限公司 | Method and system for accounting network click numbers |
KR100857148B1 (en) | 2007-04-26 | 2008-09-05 | 엔에이치엔(주) | Method for processing invalid click and system for executing the method |
KR100841348B1 (en) * | 2007-08-16 | 2008-06-25 | 방용정 | Non-cost internet advertisement system each time unfairness click of cost-per-click-view and method thereof |
KR100902466B1 (en) * | 2007-10-30 | 2009-06-11 | 엔에이치엔비즈니스플랫폼 주식회사 | System and Method for Tracking a Keyword Search Abuser |
KR100914600B1 (en) * | 2007-11-14 | 2009-08-31 | 엔에이치엔(주) | System and Method for Determining Invalid Clicks |
KR101020949B1 (en) * | 2008-11-18 | 2011-03-09 | 주식회사 데이타웨이브 시스템 | Method and server for detecting unfair click of keyword advertisement |
KR20110116562A (en) | 2010-04-19 | 2011-10-26 | 서울대학교산학협력단 | Method and system for detecting bot scum in massive multiplayer online role playing game |
CN102289756A (en) * | 2010-06-18 | 2011-12-21 | 百度在线网络技术(北京)有限公司 | Method and system for judging click validation |
KR101158464B1 (en) * | 2010-11-26 | 2012-06-20 | 고려대학교 산학협력단 | Method and apparatus for detecting bot process |
CN103368857B (en) * | 2012-03-26 | 2016-09-21 | 北大方正集团有限公司 | A kind of method and system sending data message |
CN102663062B (en) * | 2012-03-30 | 2015-01-14 | 北京奇虎科技有限公司 | Method and device for processing invalid links in search result |
KR101919137B1 (en) * | 2012-11-08 | 2018-11-15 | 네이버 주식회사 | Display advertising rate calculating method and system acording to value index of advertisement slot |
EP3025245A4 (en) * | 2013-07-26 | 2017-05-03 | Empire Technology Development LLC | Device and session identification |
CN103475543A (en) * | 2013-09-11 | 2013-12-25 | 北京思特奇信息技术股份有限公司 | Abnormal system service call detection method and system |
WO2015184579A1 (en) * | 2014-06-03 | 2015-12-10 | Yahoo! Inc | Determining traffic quality using event-based traffic scoring |
CN104331306B (en) * | 2014-10-14 | 2017-05-10 | 北京齐尔布莱特科技有限公司 | Content updating method, equipment and system |
CN104580244B (en) * | 2015-01-26 | 2018-03-13 | 百度在线网络技术(北京)有限公司 | The defence method and device clicked maliciously |
KR101639752B1 (en) * | 2015-02-13 | 2016-07-15 | 네이버 주식회사 | System and method for aggregating view of contents using filter logic |
CN105069061B (en) * | 2015-07-28 | 2019-03-12 | 安一恒通(北京)科技有限公司 | Loading method, system, the browser and server of webpage in historical viewings record |
CN105677869A (en) * | 2016-01-06 | 2016-06-15 | 广州神马移动信息科技有限公司 | Multidimensional search log anti-cheating method, system and computing equipment |
CN107526748B (en) * | 2016-06-22 | 2021-08-03 | 华为技术有限公司 | Method and equipment for identifying user click behavior |
CN108255885B (en) * | 2016-12-29 | 2020-11-06 | 北京酷我科技有限公司 | Song recommendation method and system |
CN110020206B (en) * | 2019-04-12 | 2021-10-15 | 北京搜狗科技发展有限公司 | Search result ordering method and device |
CN110069691B (en) * | 2019-04-29 | 2021-05-28 | 百度在线网络技术(北京)有限公司 | Method and device for processing click behavior data |
CN111444408B (en) * | 2020-03-26 | 2021-09-14 | 腾讯科技(深圳)有限公司 | Network search processing method and device and electronic equipment |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6269361B1 (en) * | 1999-05-28 | 2001-07-31 | Goto.Com | System and method for influencing a position on a search result list generated by a computer network search engine |
KR20020020584A (en) * | 2000-09-09 | 2002-03-15 | 맹진기 | Internet survey system and method and media for storing program source thereof |
-
2003
- 2003-03-19 KR KR1020030017233A patent/KR100619178B1/en active IP Right Grant
-
2004
- 2004-02-27 WO PCT/KR2004/000416 patent/WO2004084097A1/en active Application Filing
- 2004-02-27 CN CNB200480007418XA patent/CN100533434C/en not_active Expired - Lifetime
- 2004-02-27 CN CNA2008101610324A patent/CN101388035A/en active Pending
- 2004-02-27 JP JP2005518761A patent/JP4358188B2/en not_active Expired - Lifetime
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008541220A (en) * | 2005-05-06 | 2008-11-20 | エヌエイチエヌ コーポレーション | Personalized search method and personalized search system |
JP4648455B2 (en) * | 2005-05-06 | 2011-03-09 | エヌエイチエヌ コーポレーション | Personalized search method and personalized search system |
JP2014026528A (en) * | 2012-07-27 | 2014-02-06 | Nippon Telegr & Teleph Corp <Ntt> | Effective click counter, method and program |
JP6873343B1 (en) * | 2020-09-07 | 2021-05-19 | シエンプレ株式会社 | Unauthorized click prevention system, unauthorized click prevention method and program |
WO2022049776A1 (en) * | 2020-09-07 | 2022-03-10 | シエンプレ株式会社 | Click fraud prevention system, click fraud prevention method, and program |
Also Published As
Publication number | Publication date |
---|---|
JP4358188B2 (en) | 2009-11-04 |
CN101388035A (en) | 2009-03-18 |
CN100533434C (en) | 2009-08-26 |
KR100619178B1 (en) | 2006-09-05 |
KR20040082633A (en) | 2004-09-30 |
WO2004084097A1 (en) | 2004-09-30 |
CN1761961A (en) | 2006-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4358188B2 (en) | Invalid click detection device in Internet search engine | |
US10999384B2 (en) | Method and system for identifying website visitors | |
US8131799B2 (en) | User-transparent system for uniquely identifying network-distributed devices without explicitly provided device or user identifying information | |
US7761558B1 (en) | Determining a number of users behind a set of one or more internet protocol (IP) addresses | |
US20020046281A1 (en) | Request tracking for analysis of website navigation | |
JP2006146882A (en) | Content evaluation | |
EP3852327A1 (en) | Exception access behavior identification method and server | |
JP6520513B2 (en) | Question and Answer Information Providing System, Information Processing Device, and Program | |
WO2004068371A1 (en) | Method and system of measuring and recording user data in a communications network | |
CN116324766A (en) | Optimizing crawling requests by browsing profiles | |
US9843559B2 (en) | Method for determining validity of command and system thereof | |
KR100619179B1 (en) | Method and apparatus for detecting invalid clicks on the internet search engine | |
WO2005122017A1 (en) | Method for determining validity of command and system thereof | |
JP4542122B2 (en) | An apparatus for performing URL filtering by acquiring an original URL of content stored in a cache server or the like | |
KR20040083340A (en) | Method and apparatus for detecting invalid clicks on the internet search engine | |
KR101755427B1 (en) | Method and system for tracking web-database user using data mining | |
KR100914600B1 (en) | System and Method for Determining Invalid Clicks | |
WO2010122228A1 (en) | Testing apparatus and method | |
CN110120898B (en) | Remote webpage resource change monitoring and harm detection and identification method | |
JP5006471B2 (en) | Web service cooperation management system and method thereof | |
KR100368338B1 (en) | Method for Connection Web Page Using E-Mail Address | |
Zou et al. | Malicious Websites Identification Based on Active-Passive Method | |
Jansen et al. | Recognising Client-side Behavioral Detection of Web Bots | |
Fletcher et al. | Analytics Techniques | |
Ping | WEBSITE SERVER CLUES INVESTIGATION TAKE “XIN PU JING” GAMBLING CASE FOR EXAMPLE |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081021 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090224 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090522 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090714 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090805 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120814 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4358188 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120814 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120814 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120814 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130814 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |