JP5094940B2 - 特定クエリ判別装置及びその方法 - Google Patents

特定クエリ判別装置及びその方法 Download PDF

Info

Publication number
JP5094940B2
JP5094940B2 JP2010220587A JP2010220587A JP5094940B2 JP 5094940 B2 JP5094940 B2 JP 5094940B2 JP 2010220587 A JP2010220587 A JP 2010220587A JP 2010220587 A JP2010220587 A JP 2010220587A JP 5094940 B2 JP5094940 B2 JP 5094940B2
Authority
JP
Japan
Prior art keywords
query
specific
web page
click
specific web
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010220587A
Other languages
English (en)
Other versions
JP2012078888A (ja
Inventor
泰斗 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2010220587A priority Critical patent/JP5094940B2/ja
Publication of JP2012078888A publication Critical patent/JP2012078888A/ja
Application granted granted Critical
Publication of JP5094940B2 publication Critical patent/JP5094940B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、特定クエリ判別装置及びその方法に関する。
近年、検索サーバを介してWebページを検索することが広く行われている。しかしながら、通常のクエリであると考えてそれらを使用しても検索結果には、アダルトページ等の特定のWebページが多く含まれることがあり、検索画面にこのようなページが表示されることは、青少年の教育上の観点から見ても好ましくない。
そのため、このような特定のWebページを非表示にする装置が多数提案されている。例えば、特許文献1には、予め登録したキーワードファイルを読み込み、そのキーワードに基づく検索を定期的に自動で行って、検索結果情報から抽出した「不良URL(Universal Resource Locator)」を不良URLデータベースに登録し、クライアント装置からの送信要求情報をWebサーバへ送信するか否かを判定する管理サーバが開示されている。
特開2004−46739号公報
しかしながら、特許文献1において、どのようなクエリが特定のWebページの検索を意図するアダルトクエリ等の特定のクエリであり、どのようなクエリが特定のWebページの検索を意図していない非アダルトクエリ等の通常のクエリであるのかについて判別する技術は開示されていない。従って、検索エンジンが、ユーザが入力したクエリが特定のクエリかあるいは通常のクエリであるかを適切に判断できれば、ユーザが安心して検索エンジンを使用できるようにアダルトページ等の特定のWebページの排除等の適切な処理を行うことができるが、特許文献1に開示された技術を用いても、どのようなクエリに対してアダルトページ等の特定のWebページを検索結果画面から排除すればよいのか判断することができない。
本発明は、上記課題に鑑み、ユーザが入力したクエリが、特定のクエリであるか、あるいは、通常のクエリあるかを、自動的に判断する装置及び方法を提供することにより、ユーザが安心して使用できるような検索サービスを提供することを目的とする。さらに、特定のクエリである可能性も通常のクエリである可能性もあるグレークエリであると判断した場合に、多数のユーザが実際に行った判断結果を利用して、当該グレークエリが特定のWebページを検索するための特定のクエリであるか否かを判別する装置及び方法を提供することを目的とする。
本発明では、以下のような解決手段を提供する。
(1) 所定のクエリが特定のクエリであるか否かを判別する特定クエリ判別装置であって、クエリに対する検索結果リストのクリックログを記憶するクリックログ記憶手段と、前記クエリに対する検索結果リストに含まれるページについて、特定のWebページか否かを判断する特定Webページ判断手段と、前記クリックログ記憶手段に記憶された前記クリックログを参照して、前記所定のクエリに対する検索結果リストに含まれるページへのリンクの総クリック数を集計する総クリック数集計手段と、前記クリックログ記憶手段に記憶された前記クリックログ及び前記特定Webページ判断手段によって判断された結果に基づいて、前記所定のクエリに対する検索結果リストに含まれるページのうち、特定のWebページと判断したページへのリンクのクリック数を集計する特定Webページクリック数集計手段と、前記特定のWebページと判断したページへのリンクのクリック数の前記総クリック数に対する第1の比を算出する特定Webページクリック率算出手段と、前記特定Webページクリック率算出手段によって算出された前記第1の比が所定の値以上である場合に、前記所定のクエリが特定のクエリであると判別する特定クエリ判別手段とを備える特定クエリ判別装置。
(1)に記載の発明によれば、クリックログ記憶手段は、クエリに対する検索結果リストのクリックログを記憶し、特定Webページ判断手段は、そのクエリに対する検索結果リストに含まれるページについて、特定のWebページか否かを判断する。また、総クリック数集計手段は、クリックログ記憶手段に記憶されたクリックログを参照して、所定のクエリに対する検索結果リストに含まれるページへのリンクの総クリック数を集計し、特定Webページクリック数集計手段は、クリックログ記憶手段に記憶されたクリックログ及び特定Webページ判断手段によって判断された結果に基づいて、所定のクエリに対する検索結果リストに含まれるページのうち、特定のWebページと判断したページへのリンクのクリック数を集計する。そして、特定Webページクリック率算出手段は、特定のWebページと判断したページへのリンクのクリック数の総クリック数に対する第1の比を算出し、特定クエリ判別手段は、特定Webページクリック率算出手段によって算出された第1の比が所定の値以上である場合に、所定のクエリが特定のクエリであると判別する。このようにすることで、ユーザが入力したクエリが、特定のクエリであるか、あるいは、通常のクエリあるかを、クリックログに基づいて自動的に判断できるため、ユーザが安心して使用できるような検索サービスを提供できる。
(2) (1)に記載の特定クエリ判別装置であって、前記特定Webページ判断手段が特定のWebページと判断したページの数の、前記所定のクエリに対する検索結果リストに含まれる総ページ数に対する第2の比を算出する特定Webページ率算出手段を備え、前記特定クエリ判別手段は、前記第1の比が大きいほど大きな値となり、かつ、前記第2の比が大きいほど大きな値となる指数が、特定の値以上である場合に、前記所定のクエリが特定のクエリであると判別する特定クエリ判別装置。
(2)に記載の発明によれば、(1)に記載の発明と同様に、検索装置として機能するために逐次更新される最新の情報を参照して特定のクエリの判別を行っている。そのため、特定のクエリに関する情報が記憶されたデータベースを更新する頻度を下げることなく、特定Webページクリック率算出手段が算出した比と、特定Webページ率算出手段が算出した比との両方に基づき、クエリが特定のクエリであるか否かを判別するため、ユーザが入力したクエリが、特定のクエリであるか、あるいは、非特定のクエリあるかを、いっそう高い精度で判別することの可能な特定クエリ判別装置を提供できる。
(3) (1)に記載の特定クエリ判別装置であって、前記特定クエリ判別手段は、前記第1の比が第1の所定の値以上であり、かつ、第2の所定の値以下である場合に、前記所定のクエリが、特定のクエリであるか否か不明なグレークエリであると判別し、前記特定クエリ判別手段がグレークエリであると判別したクエリをユーザ端末から受信した数を、当該グレークエリと判別したクエリと関連付けて記憶し、さらに当該グレークエリと判別したクエリを送信したユーザ端末から受け付けた、前記検索結果リストから前記特定のWebページの削除を要求する操作を示す情報を、前記グレークエリであると判別したクエリと関連付けて記憶する特定Webページ削除要求記憶手段と、前記グレークエリを前記ユーザ端末から受信した数が、第3の所定の値以上となった場合であって、かつ、前記削除を要求する操作を示す情報の数の、前記グレークエリを前記ユーザ端末から受信した数に対する比が、第4の所定の値以上となった場合、前記グレークエリであると判別したクエリを特定のクエリであると再判別する再判別手段とを備える特定クエリ判別装置。
(3)に記載の発明によれば、特定のクエリと、特定のクエリでないクエリとを識別するだけでなく、特定のクエリであるか否か不明なクエリをグレークエリとして識別する。そして、再判別手段は、グレークエリをユーザ端末から受信した数が第3の所定の値以上となった場合であって、かつ、そのグレークエリについての検索結果リストから特定のWebページの削除を要求する操作を示す情報の数の、グレークエリをユーザ端末から受信した数に対する比が、第4の所定の値以上となった場合、もともとグレークエリであると判別したクエリを特定のクエリであると再判別する。これにより、ユーザが入力したクエリが、特定のクエリである可能性も通常のクエリである可能性もあるグレークエリであると判断した場合に、多数のユーザが実際に行った判断結果を利用して、当該グレークエリが特定のWebページを検索するための特定のクエリであるか否かを判別する装置を提供できる。
(4) 所定のクエリが特定のクエリであるか否かをコンピュータが判別する特定クエリ判別方法であって、クエリに対する検索結果リストのクリックログを記憶するクリックログ記憶工程と、前記クエリに対する検索結果リストに含まれるページについて、特定のWebページか否かを判断する特定Webページ判断工程と、前記クリックログ記憶工程で記憶した前記クリックログを参照して、前記所定のクエリに対する検索結果リストに含まれるページへのリンクの総クリック数を集計する総クリック数集計工程と、前記クリックログ記憶工程で記憶した前記クリックログ及び前記特定Webページ判断工程で判断した結果に基づいて、前記所定のクエリに対する検索結果リストに含まれるページのうち、特定のWebページと判断したページへのリンクのクリック数を集計する特定Webページクリック数集計工程と、前記特定のWebページと判断したページへのリンクのクリック数の前記総クリック数に対する第1の比を算出する特定Webページクリック率算出工程と、前記特定のWebページクリック率算出工程で算出した前記第1の比が所定の値以上である場合に、前記所定のクエリが特定のクエリであると判別する特定クエリ判別工程とを含む方法。
(4)に記載の方法によれば、当該方法に係る発明を実施することにより、(1)と同様の効果が期待できる。
本発明によれば、ユーザが入力したクエリが、特定のクエリであるか、あるいは、通常のクエリあるかを、クリックログに基づいて自動的に判断することにより、ユーザが安心して使用できるような検索サービスを提供し、さらに、特定のクエリである可能性も通常のクエリである可能性もあるグレークエリであると判断した場合に、多数のユーザが実際に行った判断結果を利用して、当該グレークエリが特定のWebページを検索するための特定のクエリであるか否かを判別する装置及び方法を提供することができる。
本実施形態に係る特定クエリ判別装置1を説明するための全体構成を示す図である。 本実施形態に係るクリックログデータベース21を示す図である。 本実施形態に係る削除要求データベース23を示す図である。 本実施形態に係る特定クエリ判別装置1による特定クエリ判別タスクを示すフローチャートである。 変形例に係る特定クエリ判別装置1による特定クエリ判別タスクを示すフローチャートである。 本実施形態に係る特定クエリ判別装置1による再判別タスクを示すフローチャートである。
以下、本発明の実施形態について図を参照しながら説明する。
[全体構成]
図1は、本実施形態に係る特定クエリ判別装置1を説明するための全体構成を示す図である。特定クエリ判別装置1は、ユーザ端末2や検索サーバ3とネットワークを介して接続され、制御部10と、記憶部30とを備える。
まず、記憶部30の構成から説明する。記憶部30は、クリックログデータベース31(以下「クリックログDB31」という。)、判別済クエリデータベース32(以下「判別済クエリDB32」という。)及び削除要求データベース33(以下「削除要求DB33」という。)を備える。
クリックログDB31には、種々のクエリについて、ユーザがクリックしたページへのリンクを示すURLや当該ページへのリンクのクリック数等が記憶される。クリックログDB31は、図2に例示され、クリックログDB31に記憶された種々のクエリに関する「クエリ」フィールドと、そのクエリを用いて検索した場合にヒットするページのURLを示す「URL」フィールドと、そのページへのリンクのクリック数を示す「クリック数」フィールドと、そのURLに対応するページが特定のWebページであるか否かを識別するための「特定フラグ」フィールドとを備える。クリックしたURLが示すページが特定のWebページである場合には、「特定フラグ」フィールドに「○」が記憶されている。なお、各ページが特定のWebページであるか否かの判別は、当該ページに含まれるキーワードの内容や、画像データの特徴等に基づいて、公知の様々な手法を用いることができる。なお、クリックログDB31への情報の入力は、制御部10のクリックログ記憶部11によって行われる。
判別済クエリDB32には、特定クエリ判別装置1を用いて判別したクエリが特定のクエリであるか否かの情報が記憶される。
削除要求DB33には、特定のクエリであるか否かが不明なグレークエリついて、当該グレークエリを送信したユーザ端末2から受け付けた、当該グレークエリに対する検索結果のリストから特定のWebページの削除を要求する操作を示す情報が記憶される。削除要求DB33は、図3に例示され、グレークエリを示す「グレークエリ」フィールドと、ユーザ端末2から行われた、当該グレークエリに対する検索結果のリストから特定のWebページの削除を要求する操作の回数を示す「削除要求操作回数」フィールドとを備える。
図1に戻り、制御部10の構成を説明する。制御部10は、特定クエリ判別装置1に係る各機能を統括的に制御する部分である。制御部10は、クエリに対する検索結果リストのクリックログをクリックログDB31に記憶するクリックログ記憶部11を備える。このクリックログ記憶部11及び先のクリックログDB31は、クリックログ記憶手段として機能する。
なお、制御部10は、クリックログDB31に記憶された種々のクエリに対する検索結果リストに含まれる複数のページについて、これらのページが特定のWebページか否かを判断する特定Webページ判断部12を備える。この特定Webページ判断部12は、特定Webページ判断手段として機能する。特定Webページ判断部12は、各ページの検索した判断結果を記憶装置に格納してもよいし、また、記憶装置に格納することなく、各ページを検索した結果をそのまま使用することもできる。また、特定Webページ判断部12は、例えば、既存のアダルトページ判別装置等の特定Webページ判別装置であればよく、アダルトページ判別装置の場合は、Webページの中に含まれる単語のうち、卑わいと定義された単語を一定数以上含む場合に特定のWebページと判別するものが知られている。また、Webページの中に含まれる文字や映像等を識別し、その識別した文字や映像等を数値化し、その数値化によって得られた値の合計が所定の閾値を超える場合にアダルトページと判別するものも知られている。特定のWebページと判断したページは、特定フラグを「○」に更新し、予めクリックログDB31に記憶されている。
また、制御部10は、クリックログDB31に記憶されたクリックログを参照して、所定のクエリに対する検索結果リストに含まれるページへのリンクの総クリック数を集計する総クリック数集計部13を備える。この総クリック数集計部13は、総クリック数集計手段として機能する。総クリック数集計部13は、クリックログDB31を参照し、所定のクエリで検索した場合にヒットする全てのページのURLを抽出し、これら全てのページのURLのそれぞれについて、「クリック数」フィールドから個別のクリック数を抽出する。そして、総クリック数集計部13は、抽出したクリック数の合計を集計することで、所定のクエリに対する検索結果リストに含まれるページへのリンクの総クリック数を集計する。
また、制御部10は、クリックログDB31に記憶されたクリックログ及び特定Webページ判断部12によって判断された結果に基づいて、所定のクエリに対する検索結果リストに含まれるページのうち、特定のWebページと判断したページへのリンクのクリック数を集計する特定Webページクリック数集計部14を備える。この特定Webページクリック数集計部14は、特定Webページクリック数集計手段として機能する。特定Webページクリック数集計部14は、クリックログDB31を参照し、所定のクエリで検索した場合にヒットする複数のページのうち、「特定フラグ」フィールドが「○」となっているページのURLを抽出し、これらのURLについて、「クリック数」フィールドから個別のクリック数を抽出する。そして、特定Webページクリック数集計部14は、抽出したクリック数の合計を集計することで、クリックログDB31に記憶されたクリックログ及び特定Webページ判断部12によって判断された結果に基づいて、所定のクエリに対する検索結果リストに含まれるページのうち、特定のWebページと判断したページへのリンクのクリック数を集計する。
また、制御部10は、特定Webページクリック数集計部14が集計した「特定のWebページへのリンクの総クリック数」の、総クリック数集計部13が集計した「全てのページへのリンクの総クリック数」に対する第1の比を算出する特定Webページクリック率算出部15を備える。この特定Webページクリック率算出部15は、特定のWebページクリック率算出手段として機能する。例えば、特定Webページクリック数集計部14が集計した「特定のWebページへのリンクの総クリック数」が「98,245」であり、総クリック数集計部13が集計した「全てのページへのリンクの総クリック数」が「156,238」である場合、特定Webページクリック率算出部15が算出する比は、98,245/156,238≒0.63となる。
また、制御部10は、特定Webページクリック率算出部15によって算出された第1の比が所定の値以上である場合に、所定のクエリが特定のクエリであると判別する特定クエリ判別部16を備える。この特定クエリ判別部16は、特定クエリ判別手段として機能する。
ところで、制御部10の構成は、さらに、特定Webページ判断部12が特定のWebページと判断したページの数の、所定のクエリに対する検索結果リストに含まれる総ページ数に対する第2の比を算出する特定Webページ率算出部17を備え、特定クエリ判別部16は、第1の比が大きいほど大きな値となり、かつ、第2の比が大きいほど大きな値となる指数が、特定の値以上である場合に、所定のクエリを特定のクエリと判別するようにするといっそう好ましい。この指数としては、例えば、第1の比をAとし、第2の比をBとした場合のA及びBを変数とした判別式D=αA+βB+γ(α、β、γは一定の係数)を用いることが考えられる。
また、特定クエリ判別部16は、第1の比が第1の所定の値以上であり、かつ、第2の所定の値以下である場合に、所定のクエリが、特定のクエリであるか否か不明なグレークエリであると判別するとともに、制御部10が、ユーザ端末2に対し、当該グレークエリが特定のクエリであるか否かの判断を要求する特定クエリ判断要求部18と、ユーザ端末2から送信された判断結果を受信する判断結果受信部19と、特定Webページ削除要求記憶部20と、再判別部21とをさらに備えるといっそう好ましい。特定Webページ削除要求記憶部20は、特定クエリ判別部16がグレークエリであると判別したクエリをユーザ端末2から受信した数を、当該グレークエリと判別したクエリと関連付けて記憶部30の所定の記憶領域(クリックログDB31であってもよいし、他の領域であってもよい。)に記憶し、さらに当該グレークエリと判別したクエリを送信したユーザ端末2から受け付けた、検索結果リストから特定のWebページの削除を要求する操作を示す情報を、グレークエリであると判別したクエリと関連付けて削除要求DB33に記憶する。また、再判別部21は、グレークエリに対するユーザ判断を集計し統計処理を行って、当該クエリを非特定のクエリであるか、特定のクエリであるか判断をしている。一例を示すがこれには限られない。グレークエリをユーザ端末2から受信した数が第3の所定の値以上となった場合であって、かつ、削除を要求する操作を示す情報の数の、グレークエリをユーザ端末2から受信した数に対する比が第4の所定の値以上となった場合、特定クエリ判別部16がグレークエリであると判別したクエリを特定のクエリであると再判別する。特定クエリ判断要求部18は、特定のクエリ判断要求手段として機能し、判断結果受信部19は、判断結果受信手段として機能する。また、特定Webページ削除要求記憶部20及び削除要求DB33は、特定Webページ削除要求記憶手段として機能し、再判別部21は、再判別手段として機能する。
[本実施形態のハードウェア及びソフトウェアの構成]
本実施形態のハードウェア及びソフトウェアの構成について説明する。特定クエリ判別装置1のハードウェアには、制御装置(制御部)としてのCPUの他、記憶装置(記憶部)、通信装置(通信部)、表示装置(表示部)及び入力装置(入力部)が含まれる。記憶装置(記憶部)としては、例えば、メモリ(RAM、ROM等)、ハードディスクドライブ(HDD)又は光ディスク(CD、DVD等)ドライブ等が挙げられる。通信装置(通信部)としては、例えば、各種有線又は無線インターフェース装置等が挙げられる。表示装置(表示部)としては、例えば、液晶ディスプレイ又はプラズマディスプレイ等の各種ディスプレイが挙げられる。入力装置(入力部)としては、例えば、キーボード、ポインティング・デバイス(マウス等)又はリモコン装置等が挙げられる。
特定クエリ判別装置1のソフトウェアには、上記ハードウェアを制御するプログラムやデータが含まれる。プログラムやデータは、記憶装置(記憶部)により記憶され、制御装置(制御部)により適宜実行、参照される。また、コンピュータ・プログラムやデータは、電磁的方法により配布することも可能であり、CD−ROM等のコンピュータ可読媒体に記録して配布することも可能である。
[フローチャート]
図4〜図6は、本実施形態に係る特定クエリ判別装置1のフローチャートである。そのうち、図4は、所定のクエリが特定のクエリであるか否かを判別するための特定クエリ判別タスクのフローチャートであり、図5は、変形例に係る特定クエリ判別タスクのフローチャートである。図6は、グレークエリが特定のクエリであるか非特定のクエリであるかを判別するための再判別タスクのフローチャートである。
次に、図4を参照して、特定クエリ判別タスクを説明する。ステップS11では、総クリック数集計部13は、総クリック数集計処理を行う。この処理では、総クリック数集計部13は、クリックログDB31に記憶されたクリックログを参照して、所定のクエリに対する検索結果リストに含まれるページへのリンクの総クリック数を集計する。総クリック数集計部13は、クリックログDB31を参照し、所定のクエリで検索した場合にヒットする全てのページのURLを抽出し、これら全てのページのURLのそれぞれについて、「クリック数」フィールドから個別のクリック数を抽出する。そして、総クリック数集計部13は、抽出したクリック数の合計を集計することで、所定のクエリに対する検索結果リストに含まれるページへのリンクの総クリック数を集計する。
続いて、ステップS12では、特定Webページクリック数集計部14は、特定Webページクリック数集計処理を行う。この処理では、特定Webページクリック数集計部14は、クリックログDB31に記憶されたクリックログ及び特定Webページ判断部12によって判断された結果に基づいて、所定のクエリに対する検索結果リストに含まれるページのうち、特定のWebページと判断したページへのリンクのクリック数を集計する。特定Webページクリック数集計部14は、クリックログDB31を参照し、所定のクエリで検索した場合にヒットする複数のページのうち、「特定フラグ」フィールドが「○」となっているページのURLを抽出し、これらのURLについて、「クリック数」フィールドから個別のクリック数を抽出する。そして、特定Webページクリック数集計部14は、抽出したクリック数の合計を集計することで、クリックログDB31に記憶されたクリックログ及び特定Webページ判断部12によって判断された結果に基づいて、所定のクエリに対する検索結果リストに含まれるページのうち、特定のWebページと判断したページへのリンクのクリック数を集計する。
続いて、ステップS13では、特定Webページクリック率算出部15は、特定Webページクリック率算出処理を行う。この処理では、特定Webページクリック率算出部15は、特定Webページクリック数集計部14が集計した「特定のWebページへのリンクの総クリック数」の、総クリック数集計部13が集計した「全てのページへのリンクの総クリック数」に対する第1の比を算出する。例えば、特定Webページクリック数集計部14が集計した「特定のWebページへのリンクの総クリック数」が「98,245」であり、総クリック数集計部13が集計した「全てのページへのリンクの総クリック数」が「156,238」である場合、特定Webページクリック率算出部15が算出する比は、98,245/156,238≒0.63となる。
続いて、ステップS14では、特定クエリ判別部16は、特定クエリ判別処理を行う。この処理では、特定クエリ判別部16は、特定Webページクリック率算出部15によって算出された第1の比が所定の値以上である場合に、所定のクエリが特定のクエリであると判別する。
なお、制御部10が特定Webページ率算出部17を備えていない場合は上記の処理で足りるが、特定Webページ率算出部17を備えている場合は、図5に示すように、特定Webページクリック率算出部15が特定Webページクリック率算出処理を行った後に、特定Webページ率算出部17が特定Webページ率算出処理を行うことが好ましい(ステップS15)。特定のWebページ率算出処理では、特定Webページ率算出部17は、特定Webページ判断部12が特定のWebページと判断したページの数の、所定のクエリに対する検索結果リストに含まれる総ページ数に対する第2の比を算出する。そして、特定クエリ判別処理(ステップS16)では、特定クエリ判別部16は、第1の比が大きいほど大きな値となり、かつ、第2の比が大きいほど大きな値となる指数である上記の判別式Dが、特定の値以上である場合に、所定のクエリを特定のクエリと判別する。また、特定クエリ判別部16は、第1の比が第1の所定の値以上であり、かつ、第2の所定の値以下である場合に、所定のクエリが、特定のクエリであるか否か不明なグレークエリであると判別する。そして、特定クエリ判別部16は、特定のクエリでもグレークエリでもないクエリを通常のクエリと判別する。
特定クエリ判別部16が特定クエリ判別処理を終えると、制御部10は、特定クエリ判別タスクに関する一連の処理を終了する。
次に、図6を参照して、再判別タスクを説明する。ステップS21では、制御部10は、ユーザ端末2からのクエリを受け付ける。
続いて、ステップS22では、制御部10は、クエリの判別データの読み込みを行う。この処理では、制御部10は、特定クエリ判別部16の判別結果の読み込みを行う。
続いて、ステップS23では、制御部10は、ステップS22の処理で読み込んだクエリがグレークエリであるか否かを判別する。この判別がYESのときは、ステップS24に移り、NOのときは、再判別タスクに関する一連の処理を終了する。
続いて、ステップS24では、制御部10は、グレークエリが特定のクエリであるか通常のクエリであるかのユーザからの入力を受け付ける。この処理では、特定クエリ判断要求部18は、ユーザ端末2に対し、当該グレークエリが特定のクエリであるか否かの判断を要求し、判断結果受信部19は、ユーザ端末2から送信された判断結果を受信する。
続いて、ステップS25では、制御部10は、「特定のクエリ」であると入力されたか否かを判別する。この処理では、判断結果受信部19の受信結果が「特定のクエリ」であるか否かを判別する。この判別がYESのときは、ステップS26に移り、NOのときは、ステップS27に移る。
続いて、ステップS26では、制御部10は、特定Webページ表示処理を行う。この処理では、制御部10は、ステップS21の処理で受け付けたクエリの応答として、特定のWebページのURLを含めた検索結果をユーザ端末2に送信する。一方、ステップS27では、制御部10は、特定Webページ非表示処理を行う。この処理では、制御部10は、ステップS21の処理で受け付けたクエリの応答として、特定のWebページのURLを含まない検索結果をユーザ端末2に送信する。
続いて、ステップS28では、特定Webページ削除要求記憶部20は、特定クエリ判別部16がグレークエリであると判別したクエリをユーザ端末2から受信した数を、当該グレークエリと判別したクエリと関連付けて記憶部30の所定の記憶領域に記憶する。所定の記憶領域は、クリックログDB31であってもよいし、他の領域であってもよい。
続いて、ステップS29では、特定Webページ削除要求記憶部20は、当該グレークエリと判別したクエリを送信したユーザ端末2から受け付けた、検索結果リストから特定のWebページの削除を要求する操作を示す情報を、グレークエリであると判別したクエリと関連付けて削除要求DB33に記憶する。
続いて、ステップS30では、再判別部21が再判別処理を行う。この処理では、再判別部21は、グレークエリをユーザ端末2から受信した数が第3の所定の値以上となった場合であって、かつ、削除を要求する操作を示す情報の数の、グレークエリをユーザ端末2から受信した数に対する比が第4の所定の値以上となった場合、特定クエリ判別部16がグレークエリであると判別したクエリを特定のクエリであると再判別する。この処理を終えると、制御部10は、再判別タスクに関する一連の処理を終了する。
本実施形態に記載の発明では、ユーザ端末2からのクリック数に基づいて特定のクエリか否かを判別することに着目し、特定のWebページと判断したページへのリンクのクリック数の総クリック数に対する第1の比を算出する特定Webページクリック率算出部15と、この第1の比が所定の値以上である場合に、所定のクエリが特定のクエリであると判別する特定クエリ判別部16とを設けた。このようにすることで、ユーザが入力したクエリが、特定のクエリであるか、あるいは、通常のクエリあるかを、クリックログに基づいて自動的に判断できるため、ユーザが安心して使用できるような検索サービスを提供できる。
また、本実施形態に記載の発明では、特定Webページ判断部12が特定のWebページと判断したページの数の、所定のクエリに対する検索結果リストに含まれる総ページ数に対する第2の比を算出する特定Webページ率算出部17を設け、特定クエリ判別部16は、第1の比が大きいほど大きな値となり、かつ、第2の比が大きいほど大きな値となる指数が特定の値以上である場合に、所定のクエリを特定のクエリであると判別するようにした。このようにすることで、特定のクエリに関する情報が記憶されたデータベースを更新する頻度を下げることなく、特定Webページクリック率算出部15が算出した比と、特定Webページ率算出部17が算出した比との両方に基づき、クエリが特定のクエリであるか否かを判別するため、クエリが特定のクエリであるか否かをいっそう高い精度で判別することの可能な特定クエリ判別装置1及び方法を提供できる。
また、本実施形態に記載の発明では、特定クエリ判別部16は、第1の比が第1の所定の値以上であり、かつ、第2の所定の値以下である場合に、所定のクエリがグレークエリであると判別する。そして、特定Webページ削除要求記憶部20は、特定クエリ判別部16がグレークエリであると判別したクエリをユーザ端末2から受信した数を、当該グレークエリと判別したクエリと関連付けて記憶する。また、特定Webページ削除要求記憶部20は、当該グレークエリと判別したクエリを送信したユーザ端末2から受け付けた、検索結果リストから特定のWebページの削除を要求する操作を示す情報を、グレークエリであると判別したクエリと関連付けて削除要求DB33に記憶する。そして、再判別部21は、グレークエリに対するユーザ判断を集計し統計処理を行って、当該クエリを通常のクエリであるか、特定のクエリであるか判断をしている。一例を示すがこれには限られない。特定Webページ削除要求記憶部20と、グレークエリをユーザ端末2から受信した数が、第3の所定の値以上となった場合であって、かつ、削除を要求する操作を示す情報の数の、グレークエリをユーザ端末2から受信した数に対する比が、第4の所定の値以上となった場合、グレークエリであると判別したクエリを特定のクエリであると再判別する。これにより、クエリが特定のクエリであるか否かを、ユーザの判断を考慮することにより、なおいっそう高い確度で判別することの可能な特定クエリ判別装置1及び方法を提供できる。
なお、本実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本実施形態に記載されたものに限定されるものではない。
1 特定クエリ判別装置
10 制御部
11 クリックログ記憶部
12 総クリック数集計部
13 特定Webページクリック数集計部
14 特定Webページクリック率算出部
15 特定クエリ判別部
30 記憶部
31 クリックログデータベース
32 判別済クエリデータベース

Claims (4)

  1. 所定のクエリが特定のクエリであるか否かを判別する特定クエリ判別装置であって、
    クエリに対する検索結果リストのクリックログを記憶するクリックログ記憶手段と、
    前記クエリに対する検索結果リストに含まれるページについて、特定のWebページか否かを判断する特定Webページ判断手段と、
    前記クリックログ記憶手段に記憶された前記クリックログを参照して、前記所定のクエリに対する検索結果リストに含まれるページへのリンクの総クリック数を集計する総クリック数集計手段と、
    前記クリックログ記憶手段に記憶された前記クリックログ及び前記特定Webページ判断手段によって判断された結果に基づいて、前記所定のクエリに対する検索結果リストに含まれるページのうち、特定のWebページと判断したページへのリンクのクリック数を集計する特定Webページクリック数集計手段と、
    前記特定のWebページと判断したページへのリンクのクリック数の前記総クリック数に対する第1の比を算出する特定Webページクリック率算出手段と、
    前記特定Webページクリック率算出手段によって算出された前記第1の比が所定の値以上である場合に、前記所定のクエリが特定のクエリであると判別する特定クエリ判別手段とを備える特定クエリ判別装置。
  2. 請求項1に記載の特定クエリ判別装置であって、
    前記特定Webページ判断手段が特定のWebページと判断したページの数の、前記所定のクエリに対する検索結果リストに含まれる総ページ数に対する第2の比を算出する特定Webページ率算出手段を備え、
    前記特定クエリ判別手段は、前記第1の比が大きいほど大きな値となり、かつ、前記第2の比が大きいほど大きな値となる指数が、特定の値以上である場合に、前記所定のクエリが特定のクエリであると判別する特定クエリ判別装置。
  3. 請求項1に記載の特定クエリ判別装置であって、
    前記特定クエリ判別手段は、前記第1の比が第1の所定の値以上であり、かつ、第2の所定の値以下である場合に、前記所定のクエリが、特定のクエリであるか否か不明なグレークエリであると判別し、
    前記特定クエリ判別手段がグレークエリであると判別したクエリをユーザ端末から受信した数を、当該グレークエリと判別したクエリと関連付けて記憶し、さらに当該グレークエリと判別したクエリを送信したユーザ端末から受け付けた、前記検索結果リストから前記特定のWebページの削除を要求する操作を示す情報を、前記グレークエリであると判別したクエリと関連付けて記憶する特定Webページ削除要求記憶手段と、
    前記グレークエリを前記ユーザ端末から受信した数が、第3の所定の値以上となった場合であって、かつ、前記削除を要求する操作を示す情報の数の、前記グレークエリを前記ユーザ端末から受信した数に対する比が、第4の所定の値以上となった場合、前記グレークエリであると判別したクエリを特定のクエリであると再判別する再判別手段とを備える特定クエリ判別装置。
  4. 所定のクエリが特定のクエリであるか否かをコンピュータが判別する特定クエリ判別方法であって、
    クエリに対する検索結果リストのクリックログを記憶するクリックログ記憶工程と、
    前記クエリに対する検索結果リストに含まれるページについて、特定のWebページか否かを判断する特定Webページ判断工程と、
    前記クリックログ記憶工程で記憶した前記クリックログを参照して、前記所定のクエリに対する検索結果リストに含まれるページへのリンクの総クリック数を集計する総クリック数集計工程と、
    前記クリックログ記憶工程で記憶した前記クリックログ及び前記特定Webページ判断工程で判断した結果に基づいて、前記所定のクエリに対する検索結果リストに含まれるページのうち、特定のWebページと判断したページへのリンクのクリック数を集計する特定Webページクリック数集計工程と、
    前記特定のWebページと判断したページへのリンクのクリック数の前記総クリック数に対する第1の比を算出する特定Webページクリック率算出工程と、
    前記特定Webページクリック率算出工程で算出した前記第1の比が所定の値以上である場合に、前記所定のクエリが特定のクエリであると判別する特定クエリ判別工程とを含む方法。
JP2010220587A 2010-09-30 2010-09-30 特定クエリ判別装置及びその方法 Active JP5094940B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010220587A JP5094940B2 (ja) 2010-09-30 2010-09-30 特定クエリ判別装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010220587A JP5094940B2 (ja) 2010-09-30 2010-09-30 特定クエリ判別装置及びその方法

Publications (2)

Publication Number Publication Date
JP2012078888A JP2012078888A (ja) 2012-04-19
JP5094940B2 true JP5094940B2 (ja) 2012-12-12

Family

ID=46239112

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010220587A Active JP5094940B2 (ja) 2010-09-30 2010-09-30 特定クエリ判別装置及びその方法

Country Status (1)

Country Link
JP (1) JP5094940B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102206289B1 (ko) * 2019-06-05 2021-01-22 네이버 주식회사 장소 검색 커버리지를 통합하는 방법 및 시스템

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060184577A1 (en) * 2005-02-15 2006-08-17 Kaushal Kurapati Methods and apparatuses to determine adult images by query association
JP2008537225A (ja) * 2005-04-11 2008-09-11 テキストディガー,インコーポレイテッド クエリについての検索システムおよび方法
JP2008181186A (ja) * 2007-01-23 2008-08-07 Yahoo Japan Corp クエリーログを利用したキーワードとサイトの関連度を求める方法
JP4833305B2 (ja) * 2009-02-16 2011-12-07 ニフティ株式会社 ホットサイト提示システム

Also Published As

Publication number Publication date
JP2012078888A (ja) 2012-04-19

Similar Documents

Publication Publication Date Title
US9613009B2 (en) Predicting user navigation events
US9043322B2 (en) Classifying search results
US9215243B2 (en) Identifying and ranking pirated media content
US7917840B2 (en) Dynamic aggregation and display of contextually relevant content
US7747614B2 (en) Difference control for generating and displaying a difference result set from the result sets of a plurality of search engines
US20180176313A1 (en) System and method for monitoring network traffic
US20160055164A1 (en) News alert system and method
US7966341B2 (en) Estimating the date relevance of a query from query logs
US9015174B2 (en) Likefarm determination
US20090210409A1 (en) Increasing online search engine rankings using click through data
US20100042615A1 (en) Systems and methods for aggregating content on a user-content driven website
KR20110009198A (ko) 최다 클릭된 다음 객체들을 갖는 검색 결과
CN106357789B (zh) 一种信息访问控制方法、服务器及计算机可读存储介质
KR100856916B1 (ko) 관심사를 반영하여 추출한 정보 제공 방법 및 시스템
US9760641B1 (en) Site quality score
US20140258823A1 (en) Intelligent categorization of bookmarks
US20140101165A1 (en) Searchable and size-constrained local log repositories for tracking visitors' access to web content
US20090234830A1 (en) System and method for automatic detection of needy queries
JP5094940B2 (ja) 特定クエリ判別装置及びその方法
US9558233B1 (en) Determining a quality measure for a resource
JP5442543B2 (ja) コンテンツ間類似度算出装置及びコンテンツ間類似度算出方法
JP6217075B2 (ja) 配信方法,配信装置および配信プログラム
US8190603B2 (en) Information providing system, information providing method and information providing record medium
US9177255B1 (en) Cloud systems and methods for determining the probability that a second application is installed based on installation characteristics
KR100462829B1 (ko) 명령어의 유효성 판단 방법 및 그 시스템

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120911

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120912

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120918

R150 Certificate of patent or registration of utility model

Ref document number: 5094940

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150928

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350