JP6739379B2 - 情報処理装置、情報処理方法、プログラム、および広告情報処理システム - Google Patents

情報処理装置、情報処理方法、プログラム、および広告情報処理システム Download PDF

Info

Publication number
JP6739379B2
JP6739379B2 JP2017046663A JP2017046663A JP6739379B2 JP 6739379 B2 JP6739379 B2 JP 6739379B2 JP 2017046663 A JP2017046663 A JP 2017046663A JP 2017046663 A JP2017046663 A JP 2017046663A JP 6739379 B2 JP6739379 B2 JP 6739379B2
Authority
JP
Japan
Prior art keywords
queries
query
graph data
node
association
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017046663A
Other languages
English (en)
Other versions
JP2018151789A (ja
Inventor
田村 健
健 田村
伸次 池宮
伸次 池宮
琢郎 森
琢郎 森
工藤 和也
和也 工藤
麻里 衣目
麻里 衣目
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2017046663A priority Critical patent/JP6739379B2/ja
Publication of JP2018151789A publication Critical patent/JP2018151789A/ja
Application granted granted Critical
Publication of JP6739379B2 publication Critical patent/JP6739379B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置、情報処理方法、プログラム、および広告情報処理システムに関する。
従来、ウェブ検索において、ユーザが入力したキーワード(クエリ)を解析する技術についての研究が進められている。例えば、過去に入力されたクエリのリストを用いてクエリ間の関連性を解析することで、利便性の高い検索サービスを提供することが可能となる(例えば、特許文献1参照)。
特開2015−97026号公報
クエリの解析においては、クエリ間の関連性をいかに正確に把握できるかが重要となる。また、膨大な数のクエリが解析対象となるため、解析処理を簡易化することも求められている。
本発明は、このような事情を考慮してなされたものであり、クエリ間の関連性を正確かつ簡単に把握することが可能な情報処理装置、情報処理方法、プログラム、および広告情報処理システムを提供することを目的の一つとする。
本発明の一態様は、ネットワーク検索に用いられた複数のクエリにおける各2つのクエリの間の関連度を、前記各2つのクエリの双方を検索したユーザ数に基づいて算出する算出部と、前記各2つのクエリの間の関連付けの有無と、前記各2つのクエリの間の関連度とを示すグラフデータを生成する生成部と、前記グラフデータに基づいてクエリを分類する分類部と、を備える情報処理装置である。
本発明の一態様によれば、クエリ間の関連性を正確かつ簡単に把握することができる。
第1実施形態における情報処理システム1の構成図である。 第1実施形態における情報処理装置7の機能構成を示す図である。 第1実施形態におけるクエリ間の関連性を示すグラフデータである。 第1実施形態における情報処理装置7の処理の一例を示すフローチャートである。 第1実施形態におけるノード処理の一例を説明した図である。 第1実施形態におけるノード処理の一例を説明した図である。 第1実施形態におけるノード処理の一例を説明した図である。 第1実施形態におけるノード間の親子関係を示す木構造を示す図である。 第2実施形態における情報処理装置7の処理の一例を示すフローチャートである。 第2実施形態におけるクエリ間の関連性を示すグラフデータである。 第2実施形態におけるノード処理の一例を説明した図である。 第3実施形態における情報処理装置7の処理の一例を示すフローチャートである。 第3実施形態におけるクエリ間の関連性を示すグラフデータである。 第3実施形態におけるノード処理の一例を説明した図である。 第1実施形態における情報処理システム1Aの構成図である。
以下、図面を参照し、本発明の情報処理装置、情報処理方法、プログラム、および広告情報処理システムの実施形態について説明する。情報処理装置は、ユーザの端末装置から送信されたクエリ間の関連度を示す重複検索スコアを算出し、算出した重複検索スコアに基づいてクエリの分類を行う。
<第1実施形態>
図1は、第1実施形態における情報処理システム1の構成図である。情報処理システム1は、例えば、一以上の端末装置3と、一以上の検索サーバ5と、一以上の情報処理装置7とを備える。端末装置3と、検索サーバ5とは、ネットワークNWによって互いに接続されており、このネットワークNWを介して互いに通信する。ネットワークNWは、例えば、WAN(Wide Area Network)やLAN(Local Area Network)、インターネット、専用回線、無線基地局、プロバイダなどを含む。
[端末装置]
端末装置3は、検索サービスを利用するユーザによって操作される。端末装置3は、例えば、パーソナルコンピュータ、スマートフォンなどの携帯電話やタブレット端末、PDA(Personal Digital Assistant)などのコンピュータ装置である。端末装置3では、ユーザの操作に基づいて動作するブラウザまたはアプリケーションプログラムが、情報提供を要求するクエリを検索サーバ5に送信し、クエリと関連付けされた検索情報を検索サーバ5から受信する。
[検索サーバ]
検索サーバ5は、端末装置3からクエリを受信し、受信したクエリに基づいて検索の結果を提供する。検索サーバ5は、クエリと、コンテンツの参照情報(例えばURLなど)とを関連付けた検索データベース(図示しない)を備えている。検索サーバ5は、端末装置3からクエリを受信した場合、検索データベースから、クエリに関連付けられたコンテンツを参照するための参照情報を抽出し、端末装置3に送信する。
検索サーバ5は、端末装置3から受信したクエリと、クエリの送信元の端末装置3のユーザの識別情報とを関連付けした履歴情報を記憶部(図示しない)に記憶する。ユーザの識別情報とは、例えば、端末装置3に備えられたウェブブラウザごとに管理されるクッキー(HTTP cookie)に関する情報や、端末装置3のIPアドレスなどである。これらの識別情報は、クエリを入力したユーザの識別情報とみなすことができる。また、ユーザが検索サーバ5にアクセスする際にログインを行っている場合、そのログインIDをユーザの識別情報としてよい。
[情報処理装置]
情報処理装置7は、検索サーバ5から履歴情報を取得し、取得した履歴情報を用いてクエリの分類を行う。図2は、情報処理装置7の機能構成を示す図である。情報処理装置7は、例えば、取得部10と、関連度算出部12(算出部)と、生成部14と、分類部16と、記憶部18とを備える。情報処理装置7に含まれる各機能部は、複数の装置に分散されてもよい。例えば、関連度算出部12と他の機能部とは別体の装置によって実現されてもよい。記憶部18は、NAS(Network Attached Storage)などの記憶装置であってもよい。
関連度算出部12、生成部14、および分類部16は、例えば、CPU(Central Processing Unit)などのプロセッサが、記憶部18に記憶されたプログラム(ソフトウェア)を実行することにより実現される。プログラムは、例えば、ネットワークNWを介してアプリケーションサーバからダウンロードされてもよいし、予め情報処理装置7にプリインストールされていてもよい。また、これらの機能部は、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)などのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。記憶部18は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ、またはこれらのうち複数が組み合わされたハイブリッド型記憶装置などによって実現される。
取得部10は、端末装置3から送信されたクエリと、送信元の端末装置3のユーザの識別情報とが関連付けされた履歴情報を検索サーバ5から取得し、記憶部18に記憶させる。
関連度算出部12は、ネットワーク検索に用いられた複数のクエリにおける各2つのクエリの間の関連度を、各2つのクエリの双方を検索したユーザ数に基づいて算出する。例えば、関連度算出部12は、記憶部18から履歴情報を読み出し、クエリ間の関連度を示す重複検索スコアを算出する。重複検索スコアScoreは、例えば、以下の式(1)によって算出される。
Figure 0006739379
式(1)において、Auserは、クエリAの検索ユーザ数であり、Buserは、クエリBの検索ユーザ数であり、ALLuserは、検索ユーザ数全体であり、Auser∧Buserは、クエリAとクエリBとの双方を検索しているユーザ数である。重複検索スコアScoreは、値が大きいほど、クエリAとクエリBとの関連度が強いことを示す。また、クエリAとクエリBとの検索ユーザ数が互いに近いほど、重複検索スコアScoreが高くなる傾向になる。関連度算出部12は、重複検索スコアを算出した2つのクエリを示す情報と、算出した重複検索スコアとを関連付けした情報(以下、「重複検索スコア情報」と呼ぶ)を記憶部18に記憶させる。
生成部14は、複数のクエリにおける各2つのクエリの間の関連付けの有無と、この各2つのクエリの間の関連度とを示すグラフデータを生成する。また、生成部14は、生成したグラフデータにおける複数のクエリの中から、関連付けされたクエリの数が1つであるクエリを選択し、この選択したクエリと、この選択したクエリと関連付けされたクエリとの間の親子関係を設定する。例えば、生成部14は、記憶部18から読み出した履歴情報を用いて、図3に示すようなグラフデータを生成する。
図3では、計8個のクエリがノードAからHとして示されている。図3において、リンクL1からリンクL9が各ノード間の関連付けの有無を示している。リンクL1からリンクL9によって互いに結ばれた2つのノードは、同一のユーザによって双方が検索された2つのクエリを示している。図3において括弧内に示された数値は、各リンクの重複検索スコアを示している。
例えば、図3においては、ノードAと、ノードDとは、リンクL4によって接続され、その重複検索スコアは“6”であることが示されている。また、ノードAは、リンクL5によってノードBと接続され、その重複検索スコアは“8”であり、リンクL3によってノードCと接続され、その重複検索スコアは“4”であり、リンクL4によってノードDと接続され、その重複検索スコアは“6”であり、リンクL2によってノードEと接続され、その重複検索スコアは“5”であることが示されている。すなわち、ノードAは、ノードBとの関連性が最も高いことが分かる。
分類部16は、生成部14によって生成されたグラフデータに基づいてクエリを分類する。分類部16によるクエリの分類処理の詳細については後述する。
記憶部18は、取得部10が検索サーバ5から取得した履歴情報、関連度算出部12が算出した重複検索スコア情報、生成部14によって生成されたグラフデータ、分類部16によって分類されたクエリの分類結果などを記憶する。
[情報処理装置の処理]
次に、図4を参照しながら情報処理装置7の動作について説明する。図4は、情報処理装置7の処理の一例を示すフローチャートである。
まず、取得部10は、履歴情報を検索サーバ5から取得し、記憶部18に記憶させる(ステップS101)。
次に、関連度算出部12は、記憶部18から履歴情報を読み出し、読み出した履歴情報に基づいて重複検索スコアを算出する(ステップS103)。関連度算出部12は、重複検索スコア情報を記憶部18に記憶させる。
次に、生成部14は、記憶部18から重複検索スコア情報を読み出して、クエリ間の関連性を示すグラフデータを生成する(ステップS105)。例えば、生成部14は、図3に示すようなクエリ間の関連性を示すグラフデータを生成する。
次に、生成部14は、接続先のノードの数が1つであるノード(以下、「末端ノード」と呼ぶ)の処理を行う(ステップS107)。例えば、生成部14は、グラフデータにおいて、末端ノードを選択し、選択した末端ノードを「子ノード」とし、選択した末端ノードの接続先のノードを「親ノード」として親子関係を設定する。
図5は、図3に示されたグラフデータに対するノード処理の一例を説明する図である。図3に示すグラフデータにおいては、2つの末端ノード(ノードDおよびノードF)が存在する。図5のステップS107(1回目)に示されるように、生成部14は、例えば、処理対象の末端ノードとしてノードDを選択し、選択したノードDを「子ノード」とし、ノードDの接続先であるノードAをノードDの「親ノード」として親子関係を設定する。親子関係の設定が完了したノードDは、グラフデータからは削除されたとみなして以降の処理が行われる。図5では、削除されたノードは点線で示されている。
次に、生成部14は、全ての末端ノードの処理が完了したか否かを判定する(ステップS109)。生成部14は、全ての末端ノードの処理が完了していないと判定した場合、未処理の末端ノードに対して上記の親子関係の設定を行う。図5に示す例においてノードDの処理が完了した後には、未処理の末端ノードであるノードFが存在する。このため、図5のステップS107(2回目)に示されるように、生成部14は、処理対象の末端ノードとしてノードFを選択し、選択したノードFを「子ノード」とし、ノードFの接続先であるノードEをノードFの「親ノード」として親子関係を設定する。
上記のノードFに対する処理の結果、ノードEは、ノードAのみに接続された末端ノードとなる。このため、図5のステップS107(3回目)に示されるように、生成部14は、処理対象の末端ノードとしてノードEを選択し、選択したノードEを「子ノード」とし、ノードEの接続先であるノードAをノードEの「親ノード」として親子関係を設定する。
一方、生成部14は、全ての末端ノードの処理が完了したと判定した場合、グラフデータに含まれる全てのノードの処理が完了したか否かを判定する(ステップS111)。生成部14は、全てのノードの処理が完了していないと判定した場合、未処理のノード(ここでは、関連付けされたクエリの数が2つ以上であるクエリが未処理のノードとなる)の中で、接続先のノードの数が最も少ないノードを処理対象として選択し、選択したノードに接続された複数のリンクの内、重複検索スコアが最も低いリンクを削除する(ステップS113)。リンクが削除されることにより新たに末端ノードが生成されるため、生成部14は、この新たに生成された末端ノードに対する上記の処理を行う。
図5に示す例において末端ノードであるノードEの処理が完了した後には、未処理のノードであるノードA、B、C、G、およびHが存在する。このため、生成部14は、全てのノードの処理が完了していないと判定し、上記のリンクの削除処理を行う。例えば、図5に示す例において、接続先のノードの数が最も少ないノードとして、接続先のノードの数が2つであるノードA、C、G、およびHが処理対象の候補となる。生成部14は、ノードA、C、G、およびHのいずれかを1つを処理対象として選択し(図5に示す例ではノードAを選択し)、選択したノードAに接続された複数のリンクL5およびL3の内、重複検索スコアが低いリンクL3を削除する。リンクL3が削除されたことにより、ノードAおよびノードCが末端ノードとなる。なお、生成部14は、選択したノードに接続された複数のリンクの中で重複検索スコアが最も低いリンクが複数存在する場合には、任意の1つのリンクを削除してよい。
図6は、図5に示す例においてリンクL3が削除された後のノード処理の一例を説明する図である。図6のステップS107(4回目)に示されるように、生成部14は、処理対象の末端ノードとしてノードAを選択し、選択したノードAを「子ノード」とし、ノードAの接続先であるノードBをノードAの「親ノード」として親子関係を設定する。さらに、図6のステップS107(5回目)に示されるように、生成部14は、処理対象の末端ノードとしてノードCを選択し、選択したノードCを「子ノード」とし、ノードCの接続先であるノードBをノードCの「親ノード」として親子関係を設定する。
図6に示す例において末端ノードであるノードCの処理が完了した後には、未処理のノードであるノードB、G、およびHが存在する。このため、接続先のノードの数が最も少ないノードとして、接続先のノードの数が2つであるノードB、G、およびHが処理対象の候補となる。生成部14は、ノードB、G、およびHのいずれかを1つを処理対象として選択し(図6に示す例ではノードBを選択し)、選択したノードBに接続された複数のリンクL7およびL8の内、重複検索スコアが低いリンクL7を削除する。リンクL7が削除されたことにより、ノードBおよびノードGが末端ノードとなる。
図7は、図6に示す例においてリンクL7が削除された後のノード処理の一例を説明する図である。図7のステップS107(6回目)に示されるように、生成部14は、処理対象の末端ノードとしてノードBを選択し、選択したノードBを「子ノード」とし、ノードBの接続先であるノードHをノードBの「親ノード」として親子関係を設定する。さらに、図7のステップS107(7回目)に示されるように、生成部14は、処理対象の末端ノードとしてノードGを選択し、選択したノードGを「子ノード」とし、ノードGの接続先であるノードHをノードGの「親ノード」として親子関係を設定する。
一方、生成部14は、全てのノードの処理が完了したと判定した場合、クエリ間の親子関係を示す木構造を生成する(ステップS115)。図8は、図5から図7において設定された親子関係をまとめた木構造を示す図である。図8に示す木構造では、第1から第5階層までの各層にノードが配置されている。
次に、分類部16は、生成部14によって生成された木構造を用いてクエリを分類する(ステップS117)。例えば、分類部16は、木構造における階層に基づいてクエリを分類する。分類部16は、同一階層に位置するクエリを同一のグループに属するクエリとして分類してよい。また、分類部16は、予め設定された階層以下のクエリを同一のグループに属するクエリとして分類してもよい。クエリの分類に利用される基準は任意である。以上により、情報処理装置7は、本フローチャートの処理を終了する。
以上において説明した第1実施形態によれば、クエリ間の関連性を正確かつ簡単に把握することができる。
<第2実施形態>
以下、第2実施形態について説明する。第1実施形態と比較して、第2実施形態の情報処理装置7は、分類部16におけるクエリの分類処理が異なる。このため、構成などについては第1実施形態で説明した図および関連する記載を援用し、詳細な説明を省略する。
[情報処理装置の処理]
次に、図9を参照しながら情報処理装置7の動作について説明する。図9は、第2実施形態における情報処理装置7の処理の一例を示すフローチャートである。
まず、取得部10は、履歴情報を検索サーバ5から取得し、記憶部18に記憶させる(ステップS201)。
次に、関連度算出部12は、記憶部18から履歴情報を読み出し、読み出した履歴情報に基づいて重複検索スコアを算出する(ステップS203)。関連度算出部12は、重複検索スコア情報を記憶部18に記憶させる。
次に、生成部14は、記憶部18から重複検索スコア情報を読み出して、クエリ間の関連性を示すグラフデータを生成する(ステップS205)。例えば、生成部14は、図10に示すようなクエリ間の関連性を示すグラフデータを生成する。図10に示すグラフデータにおいては、計10個のクエリがノードAからJとして示されている。
次に、分類部16は、生成したグラフデータにおいて、処理対象とする1つのノードをランダムに選択する(ステップS207)。次に、分類部16は、選択したノードを基準として、所定のリンク数以内で接続されたクエリを1つのグループに分類する(ステップS209)。
図11は、図10に示されたグラフデータに対するノード処理の一例を説明する図である。図11のステップS207およびS209(1回目)に示されるように、分類部16は、例えば、処理対象のノードとしてノードJを選択する。次に、分類部16は、ノードJを基準として、例えば、リンク数が3以内で接続されたノードを同一のグループ(Jグループ)に属するノードとして分類する。リンク数が3以内で接続されたノードには、ノードJとリンクL11を介して直接的に接続されたノードI(リンク数1)と、ノードJとリンクL11およびL10を介して接続されたノードH(リンク数2)と、ノードJとリンクL11、L10、およびL9を介して接続されたノードG(リンク数3)と、ノードJとリンクL11、L10、およびL8を介して接続されたノードB(リンク数3)とが含まれる。
次に、分類部16は、全てのノードの分類処理が完了したか否かを判定する(ステップS211)。分類部16は、全てのノードの分類処理が完了していないと判定した場合、ノードの分類処理が完了していないノードの中から、処理対象とする1つのノードをランダムに選択し、上記の分類処理を再度行う。
図11に示す例においてノードJを基準とした分類が完了した後には、未分類のノードであるノードA、C、D、E、およびFが存在する。このため、分類部16は、全てのノードの分類処理が完了していないと判定し、ノードA、C、D、E、およびFの中から、処理対象とする1つのノードをランダムに選択し、上記の分類処理を行う。図11のステップS207およびS209(2回目)に示されるように、分類部16は、例えば、処理対象とするノードとしてノードFを選択する。
次に、分類部16は、ノードFを基準として、例えば、リンク数が3以内で接続されたノードを同一のグループ(Fグループ)に属するノードとして分類する。リンク数が3以内で接続されたノードには、ノードFとリンクL1を介して直接的に接続されたノードE(リンク数1)と、ノードFとリンクL1およびL2を介して接続されたノードA(リンク数2)と、ノードFとリンクL1、L2、およびL4を介して接続されたノードD(リンク数3)と、ノードFとリンクL1、L2、およびL5を介して接続されたノードB(リンク数3)と、ノードFとリンクL1、L2、およびL3を介して接続されたノードC(リンク数3)とが含まれる。
ここで、ノードBは、ノードJを基準としたグループ(Jグループ)と、ノードFを基準としたグループ(Fグループ)との双方に所属することになる。このように、クエリのランダムな選択を複数回行うことにより、1つのノードが複数のグループに所属することになった場合には、分類部16は、このノードと、このノードの接続先の各ノードとの重複検索スコアの大きさに基づいて、いずれのグループに分類するかを決定する。
例えば、ノードJを基準とした分類処理においてノードJからノードBに至る経路上のノードBと接続されたリンク(図11に示す例では、リンクL8(10))と、ノードFを基準とした分類処理においてノードFからノードBに至る経路上のノードBと接続されたリンク(図11に示す例では、リンクL5(8))とでは、リンクL5(8)よりもリンクL8(10)の重複検索スコアが高い。この場合、ノードBは、重複検索スコアが高い(すなわち、Jグループとの結び付きが強い)と考えられるため、分類部16は、ノードBをJグループに分類する。なお、ノードJを基準としたリンクL8と、ノードFを基準としたリンクL5との重複検索スコアが互いに同じである場合には、分類部16は、ノードBを任意の一方のグループに分類してよい。
一方、分類部16は、全てのノードの分類処理が完了したと判定した場合、分類結果を記憶部18に記憶させる。以上により、情報処理装置7は、本フローチャートの処理を終了する。
以上において説明した第2実施形態によれば、クエリ間の関連性を正確かつ簡単に把握することができる。また、処理対象とする1つのノードをランダムに選択して、この選択したノードを基準とした分類処理を行うことで処理を簡略化することができる。
<第3実施形態>
以下、第3実施形態について説明する。第1実施形態と比較して、第3実施形態の情報処理装置7は、分類部16におけるクエリの分類処理が異なる。このため、構成などについては第1実施形態で説明した図および関連する記載を援用し、詳細な説明を省略する。
[情報処理装置の処理]
次に、図12を参照しながら情報処理装置7の動作について説明する。多くのクエリと関連付けされるクエリは、スパムなどによって不正に検索が行われたキーワードである場合がある。このような多くのクエリと関連付けされるクエリを含む履歴情報に対して処理を行うと、クエリ間の関連性が複雑化し、分類処理の精度が低下する場合がある。そこで、本実施形態の情報処理装置7では、所定数以上のクエリと関連付けされるクエリを削除し、削除したクエリ以外のクエリについて分類処理を行う。図12は、第3実施形態における情報処理装置7の処理の一例を示すフローチャートである。
まず、取得部10は、履歴情報を検索サーバ5から取得し、記憶部18に記憶させる(ステップS301)。
次に、関連度算出部12は、記憶部18から履歴情報を読み出し、読み出した履歴情報に基づいて重複検索スコアを算出する(ステップS303)。関連度算出部12は、重複検索スコア情報を記憶部18に記憶させる。
次に、生成部14は、記憶部18から重複検索スコア情報を読み出して、クエリ間の関連性を示すグラフデータを生成する(ステップS305)。例えば、生成部14は、図13に示すようなクエリ間の関連性を示すグラフデータを生成する。図13に示すグラフデータにおいては、計10個のクエリがノードAからJとして示されている。
次に、生成部14は、生成したグラフデータにおいて、接続先のノードの数が所定数以上であるノードを削除する(ステップS307)。図14は、図13に示されたグラフデータに対するノード処理の一例を説明する図である。図14のステップS307に示されるように、生成部14は、接続先のノードの数が所定数以上である(図14に示す例では、接続先のノードの数が5つ以上)ノードBを削除する。これにより、ノードIは、接続先を有さないノードとなる。この場合、分類部16は、ノードIは、Iグループに属するノードとして分類する。
次に、生成部14は、接続先のノードの数が1つである末端ノードの処理を行う(ステップS309)。図14に示す例においてノードBが削除された後のグラフデータにおいては、2つの末端ノード(ノードDおよびノードF)が存在する。図14のステップS309(1回目)に示されるように、生成部14は、例えば、処理対象の末端ノードとしてノードDを選択し、選択したノードDを「子ノード」とし、ノードDの接続先であるノードAをノードDの「親ノード」として親子関係を設定する。
次に、生成部14は、全ての末端ノードの処理が完了したか否かを判定する(ステップS311)。生成部14は、全ての末端ノードの処理が完了していないと判定した場合、未処理の末端ノードに対して上記の親子関係の設定を行う。図14に示す例においてノードDの処理が完了した後には、未処理の末端ノードであるノードFが存在する。このため、図14のステップS309(2回目)に示されるように、生成部14は、処理対象の末端ノードとしてノードFを選択し、選択したノードFを「子ノード」とし、ノードFの接続先であるノードEをノードFの「親ノード」として親子関係を設定する。
一方、生成部14が全ての末端ノードの処理が完了したと判定した場合、分類部16は、グラフデータにおける複数のノードの中から処理対象とする1つのノードをランダムに選択する(ステップS313)。次に、分類部16は、選択したノードを基準として、所定のリンク数以内で接続されたクエリを1つのグループに分類する(ステップS315)。例えば、図14のステップS313およびS315(1回目)に示されるように、分類部16は、例えば、処理対象とするノードとしてノードJを選択する。次に、分類部16は、ノードJを基準として、例えば、リンク数が3以内で接続されたノードを同一のグループ(Jグループ)に属するノードとして分類する。リンク数が3以内で接続されたノードには、ノードJとリンクL11を介して直接的に接続されたノードH(リンク数1)と、ノードJとリンクL12を介して直接的に接続されたノードG(リンク数1)とが含まれる。
次に、分類部16は、全てのノードの分類処理が完了したか否かを判定する(ステップS317)。分類部16は、全てのノードの分類処理が完了していないと判定した場合、ノードの分類処理が完了していないノードの中から、処理対象とする1つのノードをランダムに選択し、上記の分類処理を再度行う。
図14に示す例においてノードJを基準とした分類が完了した後には、未分類のノードであるノードA、C、およびEが存在する。このため、分類部16は、全てのノードの分類処理が完了していないと判定し、ノードA、C、およびEの中から、処理対象とする1つのノードをランダムに選択し、上記の分類処理を行う。図14のステップS313およびS315(2回目)に示されるように、分類部16は、例えば、処理対象とするノードとしてノードCを選択する。次に、分類部16は、ノードCを基準として、例えば、リンク数が3以内で接続されたノードを同一のグループ(Cグループ)に属するノードとして分類する。リンク数が3以内で接続されたノードには、ノードCとリンクL3を介して直接的に接続されたノードA(リンク数1)と、ノードCとリンクL13を介して直接的に接続されたノードE(リンク数1)とが含まれる。
また、上記の末端ノード処理において、ノードA(親ノード)の子ノードと設定されたノードD、およびノードE(親ノード)の子ノードと設定されたノードFは、親ノードと同じグループ(Cグループ)に所属するノードとして分類される。
一方、分類部16は、全てのノードの分類処理が完了したと判定した場合、分類結果を記憶部18に記憶させる。以上により、情報処理装置7は、本フローチャートの処理を終了する。
以上において説明した第3実施形態によれば、クエリ間の関連性を正確かつ簡単に把握することができる。また、多くのクエリと関連付けされるクエリを削除することで、クエリ間の関連性の複雑化を回避でき、クエリの分類処理の精度を向上させることができる。
<第4実施形態>
以下、第4実施形態について説明する。第1実施形態と比較して、第4実施形態の情報処理システムが、広告情報処理装置をさらに備える点が異なる。このため、構成などについては第1実施形態で説明した図および関連する記載を援用し、詳細な説明を省略する。
図15は、広告情報処理システム1Aの構成図である。広告情報処理システム1Aは、例えば、図1に示す端末装置3、検索サーバ5、および情報処理装置7に加えて、広告情報処理装置9を備える。広告情報処理装置9は、検索サーバ5および情報処理装置7と接続されている。
[広告情報処理装置]
広告情報処理装置9は、情報処理装置7から出力されたクエリの分類結果に基づいて、検索サーバ5が端末装置3から受信したクエリに応じた広告情報を決定する。広告情報処理装置9は、決定した広告情報を検索サーバ5に出力する。検索サーバ5は、端末装置3から受信したクエリに対する検索の結果とともに、広告情報処理装置9から入力された広告情報を端末装置3に送信する。
例えば、広告情報処理装置9は、複数の広告情報と、広告情報の各々と関連付けされたクエリとを記憶する記憶部(図示しない)を備えている。広告情報処理装置9は、上記の第1から第3実施形態における情報処理装置7によって出力された分類結果に基づいて、検索サーバ5が端末装置3から受信したクエリと関連付けされた広告情報、あるいは、このクエリと同じグループに分類された他のクエリと関連付けされた広告情報を検索サーバ5に出力する。
上記の第4実施形態の広告情報処理システム1Aによれば、端末装置3のユーザが入力したクエリに適した広告情報を、端末装置3に提供することができる。これにより、広告効果の高いサービスを実現することができる。
上記の実施形態では、クエリ間の重複検索スコアに基づいてクエリを分類する方法について説明した。なお、クエリの分類を行う場合には、クエリが検索された時間に関する情報があわせて使用されてもよい。例えば、分類部16は、検索サーバ5から取得した履歴情報と、検索サーバ5が端末装置3から各クエリを受信した時間に関する情報とが関連付けされた情報を用いて、クエリ間の関連性を示すグラフデータを生成してもよい。このグラフデータにおいては、関連付けされたクエリ間における時間的な検索の順序が有向グラフによって示されている。また、検索サーバ5が端末装置3から各クエリを受信した時間(検索時間)または各クエリ間の検索時間の差分が、各ノードまたはリンクに紐付けされている。このようなグラフデータを生成することで、例えば、あるユーザは、クエリAを検索した後にクエリBを検索しているといった検索の時系列情報を把握することができ、クエリの分類をより詳細に行うことができる。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
1‥情報処理システム、1A‥広告情報処理システム、3‥端末装置、5‥検索サーバ、7‥情報処理装置、9‥広告情報処理装置、10‥取得部、12‥関連度算出部、14‥生成部、16‥分類部、18‥記憶部、NW‥ネットワーク

Claims (12)

  1. ネットワーク検索に用いられた複数のクエリにおける各2つのクエリの間の関連度を、前記各2つのクエリの双方を検索したユーザ数に基づいて算出する算出部と、
    前記各2つのクエリの間の関連付けの有無と、前記各2つのクエリの間の関連度とを示すグラフデータを生成する生成部と、
    前記生成部によって生成されたグラフデータに基づいてクエリを分類する分類部と、
    を備え
    前記生成部は、前記グラフデータにおける前記複数のクエリの中から、関連付けされたクエリの数が1つであるクエリを選択し、前記選択したクエリを子ノードとし、前記選択したクエリと関連付けされたクエリを親ノードとする親子関係の設定処理を行い、
    前記生成部は、前記親子関係の設定が完了した前記選択したクエリは、前記グラフデータから削除されたとみなして、前記親子関係の設定処理を繰り返し行い、
    前記分類部は、前記生成部により設定された前記親子関係に基づいてクエリを分類する、
    情報処理装置。
  2. 前記生成部は、前記グラフデータにおいて関連付けされたクエリの数が2つ以上であるクエリについて、前記関連度が最も低いクエリとの関連付けを削除して、関連付けされたクエリの数が1つであるクエリを生成し、前記生成したクエリと、前記生成したクエリと関連付けされたクエリとの間の親子関係を設定する、
    請求項1に記載の情報処理装置。
  3. ネットワーク検索に用いられた複数のクエリにおける各2つのクエリの間の関連度を、前記各2つのクエリの双方を検索したユーザ数に基づいて算出する算出部と、
    前記各2つのクエリの間の関連付けの有無と、前記各2つのクエリの間の関連度とを示すグラフデータを生成する生成部と、
    前記生成部によって生成されたグラフデータに基づいてクエリを分類する分類部と、
    を備え、
    前記分類部は、前記グラフデータにおける前記複数のクエリの中から、1つのクエリをランダムに選択し、前記選択したクエリを基準として所定のリンク数以内で接続されたクエリを1つのグループに分類する、
    情報処理装置
  4. 前記分類部は、前記クエリのランダムな選択を複数回行うことにより1つクエリが複数のグループに分類される場合には、前記1つのクエリと、前記1つのクエリと関連付けされたクエリとの間の関連度に基づいて、前記1つのクエリが分類される1つのグループを決定する、
    請求項3に記載の情報処理装置。
  5. ネットワーク検索に用いられた複数のクエリにおける各2つのクエリの間の関連度を、前記各2つのクエリの双方を検索したユーザ数に基づいて算出する算出部と、
    前記各2つのクエリの間の関連付けの有無と、前記各2つのクエリの間の関連度とを示すグラフデータを生成する生成部と、
    前記生成部によって生成されたグラフデータに基づいてクエリを分類する分類部と、
    を備え、
    前記生成部は、前記グラフデータにおける前記複数のクエリの中から、所定数以上のクエリと関連付けされたクエリを削除し、
    前記分類部は、前記削除したクエリ以外のクエリを分類し、
    前記生成部は、更に、前記グラフデータにおける前記複数のクエリの中から、関連付けされたクエリの数が1つであるクエリを選択し、前記選択したクエリと、前記選択したクエリと関連付けされたクエリとの間の親子関係を設定し、
    前記分類部は、前記複数のクエリの中から、前記選択したクエリ以外の1つのクエリをランダムに選択し、前記ランダムに選択したクエリを基準として所定のリンク数以内で接続されたクエリと、前記ランダムに選択したクエリおよび前記所定のリンク数以内で接続されたクエリと親子関係が設定されたクエリとを1つのグループに分類する、
    情報処理装置
  6. コンピュータが、
    ネットワーク検索に用いられた複数のクエリにおける各2つのクエリの間の関連度を、前記各2つのクエリの双方を検索したユーザ数に基づいて算出し、
    前記各2つのクエリの間の関連付けの有無と、前記各2つのクエリの間の関連度とを示すグラフデータを生成し、
    前記グラフデータに基づいてクエリを分類する、
    情報処理方法であって、
    前記グラフデータにおける前記複数のクエリの中から、関連付けされたクエリの数が1つであるクエリを選択し、前記選択したクエリを子ノードとし、前記選択したクエリと関連付けされたクエリを親ノードとする親子関係の設定処理を行い、
    前記親子関係の設定が完了した前記選択したクエリは、前記グラフデータから削除されたとみなして、前記親子関係の設定処理を繰り返し行い、
    設定された前記親子関係に基づいてクエリを分類する、
    情報処理方法。
  7. コンピュータが、
    ネットワーク検索に用いられた複数のクエリにおける各2つのクエリの間の関連度を、前記各2つのクエリの双方を検索したユーザ数に基づいて算出し、
    前記各2つのクエリの間の関連付けの有無と、前記各2つのクエリの間の関連度とを示すグラフデータを生成し、
    前記グラフデータに基づいてクエリを分類する、
    情報処理方法であって、
    前記グラフデータにおける前記複数のクエリの中から、1つのクエリをランダムに選択し、前記選択したクエリを基準として所定のリンク数以内で接続されたクエリを1つのグループに分類する、
    情報処理方法。
  8. コンピュータが、
    ネットワーク検索に用いられた複数のクエリにおける各2つのクエリの間の関連度を、前記各2つのクエリの双方を検索したユーザ数に基づいて算出し、
    前記各2つのクエリの間の関連付けの有無と、前記各2つのクエリの間の関連度とを示すグラフデータを生成し、
    前記グラフデータに基づいてクエリを分類する、
    情報処理方法であって、
    前記グラフデータにおける前記複数のクエリの中から、所定数以上のクエリと関連付けされたクエリを削除し、前記削除したクエリ以外のクエリを分類し、
    前記グラフデータにおける前記複数のクエリの中から、関連付けされたクエリの数が1つであるクエリを選択し、前記選択したクエリと、前記選択したクエリと関連付けされたクエリとの間の親子関係を設定し、前記複数のクエリの中から、前記選択したクエリ以外の1つのクエリをランダムに選択し、前記ランダムに選択したクエリを基準として所定のリンク数以内で接続されたクエリと、前記ランダムに選択したクエリおよび前記所定のリンク数以内で接続されたクエリと親子関係が設定されたクエリとを1つのグループに分類する、
    情報処理方法。
  9. コンピュータに、
    ネットワーク検索に用いられた複数のクエリにおける各2つのクエリの間の関連度を、前記各2つのクエリの双方を検索したユーザ数に基づいて算出させ、
    前記各2つのクエリの間の関連付けの有無と、前記各2つのクエリの間の関連度とを示すグラフデータを生成させ、
    前記グラフデータに基づいてクエリを分類させる、
    プログラムであって、
    前記グラフデータにおける前記複数のクエリの中から、関連付けされたクエリの数が1つであるクエリを選択させ、前記選択したクエリを子ノードとし、前記選択したクエリと関連付けされたクエリを親ノードとする親子関係の設定処理を行わせ、
    前記親子関係の設定が完了した前記選択したクエリは、前記グラフデータから削除されたとみなして、前記親子関係の設定処理を繰り返し行わせ、
    設定された前記親子関係に基づいてクエリを分類させる、
    プログラム。
  10. コンピュータに、
    ネットワーク検索に用いられた複数のクエリにおける各2つのクエリの間の関連度を、前記各2つのクエリの双方を検索したユーザ数に基づいて算出させ、
    前記各2つのクエリの間の関連付けの有無と、前記各2つのクエリの間の関連度とを示すグラフデータを生成させ、
    前記グラフデータに基づいてクエリを分類させる、
    プログラムであって、
    前記グラフデータにおける前記複数のクエリの中から、1つのクエリをランダムに選択させ、前記選択したクエリを基準として所定のリンク数以内で接続されたクエリを1つのグループに分類させる、
    プログラム。
  11. コンピュータに、
    ネットワーク検索に用いられた複数のクエリにおける各2つのクエリの間の関連度を、前記各2つのクエリの双方を検索したユーザ数に基づいて算出させ、
    前記各2つのクエリの間の関連付けの有無と、前記各2つのクエリの間の関連度とを示すグラフデータを生成させ、
    前記グラフデータに基づいてクエリを分類させる、
    プログラムであって、
    前記グラフデータにおける前記複数のクエリの中から、所定数以上のクエリと関連付けされたクエリを削除させ、前記削除したクエリ以外のクエリを分類させ、
    前記グラフデータにおける前記複数のクエリの中から、関連付けされたクエリの数が1つであるクエリを選択させ、前記選択したクエリと、前記選択したクエリと関連付けされたクエリとの間の親子関係を設定させ、前記複数のクエリの中から、前記選択したクエリ以外の1つのクエリをランダムに選択させ、前記ランダムに選択したクエリを基準として所定のリンク数以内で接続されたクエリと、前記ランダムに選択したクエリおよび前記所定のリンク数以内で接続されたクエリと親子関係が設定されたクエリとを1つのグループに分類させる、
    プログラム。
  12. 請求項1から5のいずれか一項に記載の情報処理装置と、
    ユーザの端末装置からクエリを受信し、前記受信したクエリに応じた検索の結果を前記端末装置に送信する検索サーバと、
    前記情報処理装置から出力されたクエリの分類結果に基づいて、前記検索サーバが受信した前記クエリと関連付けされた広告情報を決定する広告情報処理装置と、
    を備え、
    前記検索サーバは、更に、前記広告情報処理装置によって決定された前記広告情報を前記端末装置に送信する、
    広告情報処理システム。
JP2017046663A 2017-03-10 2017-03-10 情報処理装置、情報処理方法、プログラム、および広告情報処理システム Active JP6739379B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017046663A JP6739379B2 (ja) 2017-03-10 2017-03-10 情報処理装置、情報処理方法、プログラム、および広告情報処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017046663A JP6739379B2 (ja) 2017-03-10 2017-03-10 情報処理装置、情報処理方法、プログラム、および広告情報処理システム

Publications (2)

Publication Number Publication Date
JP2018151789A JP2018151789A (ja) 2018-09-27
JP6739379B2 true JP6739379B2 (ja) 2020-08-12

Family

ID=63680401

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017046663A Active JP6739379B2 (ja) 2017-03-10 2017-03-10 情報処理装置、情報処理方法、プログラム、および広告情報処理システム

Country Status (1)

Country Link
JP (1) JP6739379B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020095357A1 (ja) * 2018-11-06 2020-05-14 データ・サイエンティスト株式会社 検索ニーズ評価装置、検索ニーズ評価システム、及び検索ニーズ評価方法
JP6990757B1 (ja) 2020-11-19 2022-01-12 ヤフー株式会社 生成装置、生成方法及び生成プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5226401B2 (ja) * 2008-06-25 2013-07-03 インターナショナル・ビジネス・マシーンズ・コーポレーション 文書データの検索を支援する装置及び方法
JP5079845B2 (ja) * 2010-05-28 2012-11-21 富士通株式会社 コンテンツナビゲーションプログラム
JP5431256B2 (ja) * 2010-06-29 2014-03-05 インターナショナル・ビジネス・マシーンズ・コーポレーション 業務プロセス解析方法、システム及びプログラム
JP6450203B2 (ja) * 2015-01-27 2019-01-09 日本放送協会 個人プロファイル生成装置及びそのプログラム、並びに、コンテンツ推薦装置

Also Published As

Publication number Publication date
JP2018151789A (ja) 2018-09-27

Similar Documents

Publication Publication Date Title
US10410128B2 (en) Method, device, and server for friend recommendation
US8655805B2 (en) Method for classification of objects in a graph data stream
US8903800B2 (en) System and method for indexing food providers and use of the index in search engines
CN106991160B (zh) 一种基于用户影响力以及内容的微博传播预测方法
CN102054003B (zh) 网络信息推荐、建立网络资源索引的方法及系统
WO2016003508A1 (en) Context-aware approach to detection of short irrelevant texts
US20100306166A1 (en) Automatic fact validation
CN110991742A (zh) 一种社交网络信息转发概率预测方法及系统
CN102063468A (zh) 一种用于确定查询序列的查询类别的设备及其方法
JP6739379B2 (ja) 情報処理装置、情報処理方法、プログラム、および広告情報処理システム
JP2011141682A (ja) 地域情報検索サーバ及び地域情報検索方法
Lota et al. A systematic literature review on sms spam detection techniques
WO2015165230A1 (zh) 一种社交消息的监测方法及装置
JP5980723B2 (ja) 緊急時ノウハウ参照支援方法、緊急時ノウハウ参照支援装置、及び緊急時ノウハウ参照支援プログラム
CN110120918B (zh) 一种标识解析方法及装置
CN105159899B (zh) 一种搜索的方法和装置
JP6749865B2 (ja) 情報収集装置、および、情報収集方法
JP7042720B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN103530418B (zh) 信息搜索与发布方法与系统
CN106528510A (zh) 一种数据处理的方法及装置
JP5424781B2 (ja) データフロー解析装置、データフロー解析システム、データフロー解析方法およびデータフロー解析プログラム
JP2015064650A (ja) 情報処理装置、記事情報生成方法およびプログラム
JP7078569B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN104809148B (zh) 一种用于确定标杆对象的方法和装置
CN104731867B (zh) 一种对对象进行聚类的方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190325

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200421

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200623

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200721

R150 Certificate of patent or registration of utility model

Ref document number: 6739379

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350