JP2013088923A - Important query extraction device, important query extraction method and important query extraction program - Google Patents
Important query extraction device, important query extraction method and important query extraction program Download PDFInfo
- Publication number
- JP2013088923A JP2013088923A JP2011227090A JP2011227090A JP2013088923A JP 2013088923 A JP2013088923 A JP 2013088923A JP 2011227090 A JP2011227090 A JP 2011227090A JP 2011227090 A JP2011227090 A JP 2011227090A JP 2013088923 A JP2013088923 A JP 2013088923A
- Authority
- JP
- Japan
- Prior art keywords
- query
- node
- score
- important
- setting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 49
- 239000000284 extract Substances 0.000 claims description 7
- 238000000034 method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Abstract
Description
本発明は、複数のクエリのなかで重要なクエリを抽出する重要クエリ抽出装置、重要クエリ抽出方法および重要クエリ抽出プログラムに関する。 The present invention relates to an important query extraction device, an important query extraction method, and an important query extraction program for extracting an important query from a plurality of queries.
インターネット上の情報を検索するシステムとして、キーワード検索機能を備えたサーチエンジンが用いられている。
この際、検索を行うユーザが、適切なキーワードを入力できない可能性もある。このため、キーワードを入力したユーザに対して、より適切なクエリを提示する方法が提案されている(例えば、特許文献1参照)。
A search engine having a keyword search function is used as a system for searching information on the Internet.
At this time, the user who performs the search may not be able to input an appropriate keyword. For this reason, a method for presenting a more appropriate query to a user who has input a keyword has been proposed (for example, see Patent Document 1).
特許文献1では、クエリの発生頻度と、前記クエリに関するユーザ満足度スコアとに基づいてクエリランクを計算し、このクエリランクが高順位のクエリを抽出する。そして、入力されたクエリに対して類似度の高いクエリであり、かつ、前記クエリランクが高順位のクエリを修正クエリとして提供する。 In Patent Document 1, a query rank is calculated based on a query occurrence frequency and a user satisfaction score related to the query, and a query having a higher rank is extracted. A query having a high similarity to the input query and having a high query rank is provided as a modified query.
しかしながら、前記特許文献1では、スペルミスを含むクエリであっても、そのクエリの入力頻度が高い場合には、高ランクと判定されてしまうため、必ずしもユーザの望むクエリが高ランクと判定されていないという問題があった。 However, in Patent Document 1, even if a query includes a spelling error, if the input frequency of the query is high, the query is determined to have a high rank. Therefore, the query desired by the user is not necessarily determined to have a high rank. There was a problem.
本発明の目的は、入力されたクエリに関連して、重要度の高いクエリを判定して出力できる重要クエリ抽出装置、重要クエリ抽出方法および重要クエリ抽出プログラムを提供することにある。 An object of the present invention is to provide an important query extraction device, an important query extraction method, and an important query extraction program that can determine and output a query having high importance in relation to an input query.
本発明の重要クエリ抽出装置は、検索キーワードとなる単語が含まれるクエリを取得するクエリ取得部と、前記クエリ取得部で取得されたクエリを、クエリログとして順次記憶するクエリログ記憶部と、前記クエリ取得部で取得したクエリを第1ノードに設定する第1ノード設定部と、前記クエリログ記憶部に記憶されているクエリログから、前記第1ノードのクエリに含まれる単語を含むクエリを抽出し、抽出されたクエリを第2ノードに設定する第2ノード設定部と、前記各ノード間に有向エッジを追加し、各有向エッジのスコアを設定するスコア設定部と、前記スコア設定部で設定されたスコアに基づいて重要ノードを特定し、そのノードに設定されたクエリを重要クエリとして出力するクエリ出力部とを備え、前記スコア設定部は、一方のノードから他方のノードに向かう有向エッジのスコアを、他方のノードに含まれる単語数と、各ノードに共通する単語の希少性を表す数値とに基づいて設定することを特徴する。 The important query extraction device of the present invention includes a query acquisition unit that acquires a query including a word that is a search keyword, a query log storage unit that sequentially stores the query acquired by the query acquisition unit as a query log, and the query acquisition A query including a word included in the query of the first node is extracted from a query log stored in the query log storage unit and a first node setting unit that sets the query acquired in the first node Set by the second node setting unit for setting the query to the second node, a score setting unit for adding a directed edge between the nodes, and setting a score for each directed edge, and the score setting unit. A query output unit that identifies an important node based on the score and outputs a query set in the node as an important query, and the score setting unit includes: Score directed edges directed from square node to the other, and the number of words contained in the other node, to said setting based on the value representing the scarcity of words common to each node.
本発明によれば、クエリログ記憶部は、端末装置からインターネットなどのネットワークを介して送信されるキーワード検索用のクエリを、順次記憶してクエリログとして記憶する。たとえば、ウェブページをキーワードで検索する検索サーバに対して、各端末装置からクエリが入力されると、このクエリは検索サーバから本発明の重要クエリ抽出装置に転送され、前記クエリログ記憶部に記憶される。従って、本発明の重要クエリ抽出装置は、ウェブページ等の各種検索サーバに組み込まれていてもよいし、検索サーバとデータ通信可能に構成されていてもよい。
そして、端末装置からクエリが入力されると、第1ノード設定部は、その入力クエリを第1ノードに設定する。第2ノード設定部は、第1ノードのクエリに含まれる単語を含むクエリを前記クエリログ記憶部から抽出して第2ノードに設定する。
たとえば、入力クエリとして、歌手名である「A」という固有名詞と、「曲」という歌手の属性に関連する言葉の二つの単語が入力された場合、第1ノード設定部は、「A 曲」という二つの単語を含むクエリを第1ノードに設定する。また、第2ノード設定部は、「A」という単語を含むクエリと、「曲」という単語を含むクエリを抽出し、第2ノードに設定する。たとえば、第2ノードとして設定されるクエリには、「A」、「A、画像」、「A、歌詞」など、過去に固有名詞「A」を含んで入力された各種クエリと、「歌詞、曲」など、過去に「曲」を含んで入力された各種クエリが抽出され、これらにより複数の第2ノードが設定される。
According to the present invention, the query log storage unit sequentially stores a keyword search query transmitted from a terminal device via a network such as the Internet and stores it as a query log. For example, when a query is input from each terminal device to a search server that searches a web page using a keyword, the query is transferred from the search server to the important query extraction device of the present invention and stored in the query log storage unit. The Therefore, the important query extraction device of the present invention may be incorporated in various search servers such as a web page, or may be configured to be able to perform data communication with the search server.
Then, when a query is input from the terminal device, the first node setting unit sets the input query to the first node. The second node setting unit extracts a query including a word included in the query of the first node from the query log storage unit and sets the query as a second node.
For example, when two words, a proper noun “A” that is a singer name and a word related to the attribute of the singer “song”, are input as input queries, the first node setting unit displays “A song”. A query including these two words is set as the first node. The second node setting unit extracts a query including the word “A” and a query including the word “song” and sets the extracted query as a second node. For example, the query set as the second node includes various queries that have been input including the proper noun “A” in the past, such as “A”, “A, image”, “A, lyrics”, and “lyrics, Various queries that have been input including “music” in the past, such as “music”, are extracted, and a plurality of second nodes are set by these.
スコア設定部は、各ノード間に有向エッジを追加し、有向エッジのスコアを設定する。この際、第2ノードが複数ある場合には、有向エッジは、第1ノードと各第2ノード間だけでなく、第2ノード間にも設定される。この際、スコア設定部は、2つのノード間の有向エッジのスコアを、有向エッジの方向によって設定する。すなわち、第1ノードおよび第2ノード間の有向エッジは、第2ノードから第1ノードに向かう第1の有向エッジと、逆方向の第2の有向エッジとの2つが設定され、各有向エッジはそれぞれスコアが設定される。
2つのノード間の各有向エッジのスコアは、2つのノードに共通する単語の希少性が高い場合に高くなる。希少性を表す数値とは、たとえば、クエリログ記憶部に記憶されたクエリログにおいて、その単語が含まれるクエリの数であり、このクエリの数が少ないほど希少性が高いと判断できる。たとえば、歌手名である「A」という単語は、「曲」といった普通名詞に比べると、クエリ履歴の数も少なくなる。「曲」という単語は、他の歌手名等と共に入力されることも多いからである。なお、この希少性は、たとえば、単語のデータベースを作成しておき、単語毎に希少性を表す数値を設定しておいてもよい。
The score setting unit adds a directed edge between the nodes and sets the score of the directed edge. At this time, when there are a plurality of second nodes, the directed edge is set not only between the first node and each second node but also between the second nodes. At this time, the score setting unit sets the score of the directed edge between the two nodes according to the direction of the directed edge. That is, two directed edges between the first node and the second node are set, a first directed edge from the second node toward the first node and a second directed edge in the opposite direction. A score is set for each directed edge.
The score of each directed edge between two nodes is high when the rarity of words common to the two nodes is high. The numerical value representing the rarity is, for example, the number of queries including the word in the query log stored in the query log storage unit, and it can be determined that the rarity is higher as the number of queries is smaller. For example, the word “A” that is the name of a singer has a smaller number of query histories than an ordinary noun such as “song”. This is because the word “song” is often input together with other singer names. The rarity may be created, for example, by creating a database of words and setting a numerical value representing the rarity for each word.
また、有向エッジのスコアは、有向エッジが向かう方向のノードにおける単語数も考慮して設定される。たとえば、単語数が多いほどスコアが低くなり、少ないほどスコアが高くなるように設定する。すなわち、第1ノードとして、「A(歌手名)、曲」の2つの単語が入力されている場合に、第2ノードとして歌手名「A」のみのノードと、「A、B、C」の3名の歌手名が設定されたノードとを想定した場合、歌手名Aと曲をクエリとして入力したユーザにとって、他の歌手名B,Cは検索キーワードとしては不要であり、ノイズとなってしまう。このため、歌手名「A」のみのクエリのほうが重要となる。前記「B,C」はいずれも固有名詞であるため、単語の希少性のみでスコアを設定しようとすると、前記2つのクエリでスコアの差が出にくい。一方、単語数もスコアの算出に加えれば、単語数が少ないほどスコアが高くなり、前記歌手名「A」のみのクエリのスコアを高くできる。 The score of the directed edge is set in consideration of the number of words in the node in the direction toward the directed edge. For example, the score is set to be lower as the number of words is larger, and the score is higher as the number is smaller. That is, when two words “A (singer name), song” are input as the first node, a node having only the singer name “A” as the second node, and “A, B, C” Assuming a node in which three singer names are set, the other singer names B and C are unnecessary as search keywords for the user who has input the singer name A and the song as a query, and it causes noise. . For this reason, a query with only the singer name “A” is more important. Since “B, C” are both proper nouns, if it is attempted to set a score based only on the rarity of a word, it is difficult for the two queries to produce a difference in score. On the other hand, if the number of words is added to the score calculation, the smaller the number of words, the higher the score, and the higher the score of the query for the singer name “A” alone.
以上のように、希少性の高い単語を入力している場合、ユーザはその単語に関係する情報を最も要求していると推定できる。また、希少性の高い単語を含んでいても、クエリ内の単語数が多い場合には、その他の単語がノイズとなって適切な検索結果が得られない可能性がある。従って、その単語を含むクエリで単語数が少ないものが最も重要度の高いクエリと判定でき、本発明によればクエリログ記憶部に記憶されたクエリログから重要クエリを的確に抽出できる。このようにして抽出した重要クエリは、クエリ出力部によって、ユーザの端末装置等に出力される。このため、端末装置を操作するユーザは、スペルミスや誤表記を含まない、例えば固有表現の正しい表記などの重要クエリを得ることができる。 As described above, when a word having a high rarity is input, it can be estimated that the user most demands information related to the word. Even if words with a high degree of rarity are included, if the number of words in the query is large, other words may become noise and an appropriate search result may not be obtained. Accordingly, a query including the word with a small number of words can be determined as the most important query, and according to the present invention, an important query can be accurately extracted from the query log stored in the query log storage unit. The important query extracted in this manner is output to the user terminal device or the like by the query output unit. For this reason, the user who operates the terminal device can obtain an important query such as a correct notation of a proper expression, which does not include a spelling error or a misrepresentation.
また、端末装置を操作するユーザは、クエリ候補として重要クエリを選択できる。従って、入力したクエリの検索結果として適切なものが無かった場合などに、本発明の重要クエリ抽出装置から出力された重要クエリを選択して再度検索することで、適切な検索結果を得ることができる。 A user who operates the terminal device can select an important query as a query candidate. Accordingly, when there is no appropriate search result of the input query, an appropriate search result can be obtained by selecting the important query output from the important query extraction device of the present invention and searching again. it can.
本発明の重要クエリ抽出装置において、前記スコア設定部は、入力されたクエリに含まれる単語の中で、最も希少性の高い単語のみで構成されるノードが存在する場合は、そのノードに向かう有向エッジのスコアを最も高く設定し、前記クエリ出力部は、前記有向エッジのスコアが最も高いノードのクエリを重要クエリとして出力することが好ましい。
スコア設定部は、単語数が少ないクエリほどエッジのスコアを高くし、希少性の高い単語ほどエッジのスコアを高くする。このため、入力されたクエリに含まれる単語のなかで、最も希少性の高い単語が1つのみ含まれたクエリのノードに向かうエッジのスコアが最も高い値となる。従って、クエリ出力部は、スコアの高いノードのクエリを重要クエリとして出力する。
このため、歌手名Aのように固有名詞のみのクエリがクエリログ記憶部の履歴に存在すれば、そのクエリが重要クエリとして出力され、ユーザがその重要クエリを用いて検索すれば、その固有名詞に関する検索結果を得ることができる。
In the important query extraction device of the present invention, when there is a node composed only of the most rare word among the words included in the input query, the score setting unit is directed to the node. It is preferable that the score of the directional edge is set to be the highest, and the query output unit outputs a query of a node having the highest score of the directional edge as an important query.
The score setting unit increases the edge score as the query has a smaller number of words, and increases the edge score as the word is more rare. For this reason, among the words included in the input query, the score of the edge toward the node of the query including only one of the rarest words is the highest value. Therefore, the query output unit outputs a query of a node having a high score as an important query.
For this reason, if a query of only proper nouns exists in the history of the query log storage unit like the singer name A, the query is output as an important query, and if the user searches using the important query, Search results can be obtained.
本発明の重要クエリ抽出装置において、前記スコア設定部は、ノードiからノードjに向かうエッジのスコアをH_{i,j}、ノードjに設定されたクエリを構成する単語数をN_q_j、前記クエリログ記憶部において単語wを含むクエリ数を示す数値をDF(w)、ノードiおよびノードjに含まれる単語に関するDF(w)の逆数を加算した値をΣ_{w∈q_i∩q_j}1/DF(w)とした場合に、前記エッジのスコアを以下の式(1)で求めることが好ましい。
[数1]
H_{i,j}=1/N_q_j*(Σ_{w∈q_i∩q_j} 1/DF(w)) ……(1)
In the important query extraction apparatus of the present invention, the score setting unit includes H_ {i, j} as the score of the edge from the node i to the node j, N_q_j as the number of words constituting the query set in the node j, and the query log. A numerical value indicating the number of queries including the word w in the storage unit is DF (w), and a value obtained by adding the reciprocal of DF (w) regarding the words included in the nodes i and j is Σ_ {w∈q_i∩q_j} 1 / DF In the case of (w), the edge score is preferably obtained by the following equation (1).
[Equation 1]
H_ {i, j} = 1 / N_q_j * (Σ_ {w∈q_i∩q_j} 1 / DF (w)) …… (1)
この式(1)を用いれば、ノードjの単語数が分母となっているので、単語数が多いほどスコアが小さくなる。また、各ノードに共通する単語に関し、その単語を含むクエリの数を示すDF(w)の逆数を、共通する単語分だけ加算している。従って、クエリ数が少ない単語、つまり希少性の高い単語ほど、スコアが大きくなる。
従って、前記スコアは、単語数が少なく、各ノードに共通する単語の希少性が高い場合に値が大きくなり、このスコアが大きくなればクエリの重要度も高くなると判定できる。
If this formula (1) is used, since the number of words of node j is the denominator, the score becomes smaller as the number of words increases. For words common to each node, the reciprocal of DF (w) indicating the number of queries including the word is added for the common words. Accordingly, the score becomes larger as the number of queries is smaller, that is, the word is more rare.
Therefore, the score increases when the number of words is small and the rareness of words common to each node is high, and it can be determined that the importance of the query increases as the score increases.
本発明の重要クエリ抽出方法は、コンピュータにより、重要クエリを抽出する重要クエリ抽出方法であって、前記コンピュータは、クエリの履歴が記憶されたクエリログ記憶部を備え、検索キーワードとなる単語が含まれるクエリを取得するクエリ取得ステップと、前記クエリ取得ステップで取得したクエリを第1ノードに設定する第1ノード設定ステップと、前記クエリログ記憶部に記憶されているクエリの履歴から、前記第1ノードのクエリに含まれる単語を含むクエリを抽出し、抽出されたクエリを第2ノードに設定する第2ノード設定ステップと、前記各ノード間に有向エッジを追加し、各有向エッジのスコアを設定するスコア設定ステップと、前記スコア設定ステップで設定されたスコアに基づいて重要ノードを特定し、そのノードに設定されたクエリを重要クエリとして出力するクエリ出力ステップとを実行し、前記スコア設定ステップは、一方のノードから他方のノードに向かう有向エッジのスコアを、他方のノードに含まれる単語数と、各ノードに共通する単語の希少性を表す数値とに基づいて設定することを特徴する。 The important query extraction method of the present invention is an important query extraction method for extracting an important query by a computer, and the computer includes a query log storage unit in which a history of the query is stored, and a word as a search keyword is included. From the query acquisition step of acquiring a query, the first node setting step of setting the query acquired in the query acquisition step as a first node, and the history of queries stored in the query log storage unit, A query including a word included in the query is extracted, a second node setting step for setting the extracted query as a second node, a directional edge is added between the nodes, and a score for each directional edge is set. And an important node is identified based on the score set in the score setting step and the score set in the score setting step. A query output step of outputting the query set to as an important query, wherein the score setting step calculates the score of the directed edge from one node to the other node, and the number of words included in the other node. And setting based on a numerical value representing the rarity of words common to each node.
本発明の重要クエリ抽出プログラムは、コンピュータに、検索キーワードとなる単語が含まれるクエリを取得するクエリ取得ステップと、前記クエリ取得ステップで取得したクエリを第1ノードに設定する第1ノード設定ステップと、クエリの履歴が記憶されたクエリログ記憶部に記憶されているクエリの履歴から、前記第1ノードのクエリに含まれる単語を含むクエリを抽出し、抽出されたクエリを第2ノードに設定する第2ノード設定ステップと、前記各ノード間に有向エッジを追加し、各有向エッジのスコアを設定するスコア設定ステップと、前記スコア設定ステップで設定されたスコアに基づいて重要ノードを特定し、そのノードに設定されたクエリを重要クエリとして出力するクエリ出力ステップとを実行させる重要クエリ抽出プログラムであって、前記スコア設定ステップは、一方のノードから他方のノードに向かう有向エッジのスコアを、他方のノードに含まれる単語数と、各ノードに共通する単語の希少性を表す数値とに基づいて設定することを特徴する。 The important query extraction program of the present invention includes a query acquisition step for acquiring a query including a word as a search keyword in a computer, and a first node setting step for setting the query acquired in the query acquisition step as a first node; A query including a word included in the query of the first node is extracted from a query history stored in a query log storage unit in which a query history is stored, and the extracted query is set as a second node. 2-node setting step, adding a directional edge between the nodes, setting a score of each directional edge, and identifying an important node based on the score set in the score setting step, An important query extraction program that executes a query output step that outputs the query set for that node as an important query The score setting step includes a score of a directed edge from one node to the other node, the number of words included in the other node, and a numerical value representing the rarity of words common to each node; It is characterized by setting based on
これらの重要クエリ抽出方法および重要クエリ抽出プログラムにおいても、前記重要クエリ抽出装置と同様の作用効果を奏することができる。 Also in these important query extraction methods and important query extraction programs, the same effects as the important query extraction device can be obtained.
以下、本発明の実施形態を図面に基づいて説明する。
図1には、本発明の重要クエリ抽出装置10を用いた検索システム1を示す。
検索システム1は、重要クエリ抽出装置10と、ウェブページの情報を収集・検索する情報検索装置20と、端末装置30とを備えている。重要クエリ抽出装置10および情報検索装置20と、端末装置30とは、図示略のインターネットを介して通信可能に構成されている。また、重要クエリ抽出装置10および端末装置30によって、検索補助システムが構成されている。
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
FIG. 1 shows a search system 1 using an important
The search system 1 includes an important
インターネットは、TCP/IPなどの汎用のプロトコルに基づくインターネットである。各端末装置30は、移動しながらインターネットに接続可能であることが好ましい。このため、端末装置30は、携帯電話網を介してインターネットに接続したり、無線LAN(LOCAL AREA NETWORK)を介してインターネットに接続する。
なお、端末装置30を重要クエリ抽出装置10や情報検索装置20に接続させるための構成は、インターネットに限定されず、無線媒体により情報が送受信可能な複数の基地局がネットワークを構成する通信回線網や放送網などのネットワーク、さらには、データを直接受信するための媒体となる無線媒体自体など、データを送受信させるいずれの構成も利用できる。
The Internet is the Internet based on a general-purpose protocol such as TCP / IP. Each
Note that the configuration for connecting the
重要クエリ抽出装置10や情報検索装置20は、ハードウェア構成として、RAM(RANDOM ACCESS MEMORY)やROM(READ ONLY MEMORY)等の図示しない記憶手段と、CPU(CENTRAL PROCESSING UNIT)等の制御手段と、を備えたサーバ装置で構成されている。RAMはデータなどを一時的に記憶できる一時領域などを有しており、ROMはOS(OPERATING SYSTEM:基本ソフトウェア)や各種サーバを制御するプログラム、各種アプリケーション、各種データ等が格納されている。CPUは、これらの記憶手段に格納されているプログラムを読み出し、このプログラムに従って各種処理を行う。特に、重要クエリ抽出装置10は、記憶手段に記憶された重要クエリ抽出プログラムを読み出して、後述する重要クエリ抽出方法を実行する。
The important
[情報検索装置]
情報検索装置20は、図1に示すように、クローラ部21と、ウェブページデータベース(WEBページDB)22と、サーチエンジン23を備えている。
クローラ部21は、インターネット上のウェブページを巡回し、その内容を収集し、前記WEBページDB22に登録する検索ロボットである。
サーチエンジン23は、全文検索などを行うものであり、端末装置30から検索用のキーワードが入力されると、前記WEBページDB22を用いてキーワードを検索し、その検索結果を端末装置30に出力する。
このような情報検索装置20は、従来から知られているものであり、詳細な説明は省略する。
[Information retrieval device]
As shown in FIG. 1, the
The
The
Such an
[重要クエリ抽出装置]
重要クエリ抽出装置10は、図1に示すように、クエリ取得部11、ノード設定部12、スコア設定部13、クエリ出力部14、クエリログ記憶部17、クエリ関係記憶部18を備えている。ノード設定部12は、第1ノード設定部121と、第2ノード設定部122とを備える。
[Important query extractor]
As illustrated in FIG. 1, the important
クエリ取得部11は、端末装置30から情報検索装置20に入力されるクエリを、情報検索装置20から入手し、クエリログ記憶部17に記憶する。このため、クエリログ記憶部17には、様々な端末装置30から情報検索装置20に入力された過去のクエリの履歴が記憶される。
また、クエリ取得部11は、今回、情報検索装置20から入力されたクエリをノード設定部12に出力する。
The query acquisition unit 11 acquires a query input from the
Further, the query acquisition unit 11 outputs the query input from the
ノード設定部12は、クエリ取得部11で取得した各クエリの関係を示す有向グラフのノードを設定し、クエリ関係記憶部18に記憶する。
このノード設定部12における処理を、具体例に基づいて説明する。
まず、ノード設定部12において設定されてクエリ関係記憶部18に記憶される有向グラフ(クエリの関係モデル)の一例について、図2に基づいて説明する。
図2に示す有向グラフは、歌手名ABCDEFと曲の2つの単語を含むクエリが入力された場合の例である。
The
The processing in the
First, an example of a directed graph (query relationship model) set in the
The directed graph shown in FIG. 2 is an example when a query including two words of a singer name ABCDEF and a song is input.
すなわち、ノード設定部12の第1ノード設定部121は、入力されたクエリ「ABCDEF、曲」を第1ノード41に設定する。
次に、第2ノード設定部122は、第1ノード41に含まれる単語「ABCDEF」と「曲」を含むクエリをクエリログ記憶部17から抽出し、第2ノードに設定する。図2の例では、第2ノードとして、歌手名「ABCDEF」のみのノード42、「ABCDEF、画像」の2つの単語からなるノード43、「ABCDEF、歌詞」の2つの単語からなるノード44、「歌詞、曲」の2つの単語からなるノード45、「曲」のみからなるノード46が設定されている。
なお、歌手名をスペルミスした「ABGDEF」というクエリ47も履歴に記憶されている。従来のように、類似クエリも抽出している場合は、このクエリ47も第2ノードに設定されて後述するエッジが設けられるが、本実施形態では類似クエリにはエッジは設定されない。このため、図2ではエッジ部分に「×」印を付けている。
That is, the first node setting unit 121 of the
Next, the second
A
各ノード41〜45間には、有向エッジ51〜70が設定されている。すなわち、2つのノード間には、一方のノードから他方のノードに向かう有向エッジと、逆方向の有向エッジの2本のエッジが設定される。
ノード設定部12は、図2に示すような有効グラフを作成し、クエリ関係記憶部18に記憶する。
Directed edges 51 to 70 are set between the
The
スコア設定部13は、各有向エッジ51〜70のスコアを設定する。スコア設定部13は、一方のノードから他方のノードに向かう有向エッジのスコアを、他方のノードに含まれる単語数と、各ノードに共通する単語の希少性とに基づいて設定する。
具体的には、スコア設定部13は、入力されたクエリに含まれる単語の中で、最も希少性の高い単語のみで構成される有向ノードに向かうエッジのスコアを最も高く設定する。
単語の希少性は、クエリの履歴において、前記単語が含まれるクエリの数によって判定される。すなわち、クエリ数が少ないほど、希少性が高いと判定できる。歌手名のような固有名詞と、曲、画像、歌詞のような普通名詞とを比較すると、通常、固有名詞のほうが、その単語を含むクエリの数も少なくなり、希少性も高くなる。このため、図2のグラフでは、希少性の高い単語(歌手名ABCDEF)のみで構成されるノード42に向かう有向エッジ51,57,59が最も高いスコアになる。
The
Specifically, the
Word rarity is determined by the number of queries that contain the word in the query history. That is, it can be determined that the scarcity is higher as the number of queries is smaller. Comparing proper nouns such as singer names with common nouns such as songs, images, and lyrics, proper nouns usually have fewer queries that contain the word and are more rare. For this reason, in the graph of FIG. 2, the directed
スコア設定部13における具体的なスコアの算出式の一例は以下の式(2)に示す通りである。
[数2]
H_{i,j}=1/N_q_j*(Σ_{w∈q_i∩q_j} 1/DF(w)) ……(2)
An example of a specific score calculation formula in the
[Equation 2]
H_ {i, j} = 1 / N_q_j * (Σ_ {w∈q_i∩q_j} 1 / DF (w)) …… (2)
ここで、H_{i,j}は、ノードiからノードjに向かう有向エッジのスコアを表す。また、N_q_jは、ノードjに設定されたクエリq_jを構成する単語数を表す。さらに、DF(w)は単語wの希少性を示す数値であり、本実施形態では、クエリログ記憶部17のクエリ履歴において、その単語wを含むクエリの数である。Σ_{w∈q_i∩q_j} 1/DF(w)は、ノードiに設定されたクエリq_iと、ノードjに設定されたクエリq_jに共通する単語wに関するDF(w)の逆数を、両クエリに共通する単語の分だけ加算した値を示す。
Here, H_ {i, j} represents the score of the directed edge from node i to node j. N_q_j represents the number of words constituting the query q_j set for the node j. Furthermore, DF (w) is a numerical value indicating the rarity of the word w, and in this embodiment, is the number of queries including the word w in the query history of the query
有向エッジ51,52における前記スコアの算出例を説明する。
有向エッジ51は、ノード41(前記式2のノードi)からノード42(前記式2のノードj)に向かうエッジである。そして、ノード42に設定されたクエリの単語数(N_q_j)は、歌手名ABCDEFのみであるから「1」となる。また、歌手名ABCDEFを含むクエリの数が、クエリログ記憶部17の履歴の中に1000個あった場合、DF(ABCDEF)=1000となる。
ノード41,42に共通する単語はABCDEFのみであるから、Σ_{w∈q_i∩q_j} 1/DF(w)=1/1000である。すると、スコアH_{i,j}は、1/1*1/1000=0.001である。
An example of calculating the score at the directed
The directed
Since the only word common to the
一方、有向エッジ52の場合、ノード41に設定されたクエリの単語数は「2」である。
ノード41,42に共通する単語はABCDEFのみであるから、Σ_{w∈q_i∩q_j} 1/DF(w)=1/1000である。すると、スコアH_{i,j}は、1/2*1/1000=0.0005であり、前記有向エッジ51に比べて小さくなる。
On the other hand, in the case of the directed
Since the only word common to the
有向エッジ57,59は、共通する単語がABCDEFで同じであり、かつ、エッジが向かう方向のノードの単語数が「1」で共通するため、有向エッジ51と同じスコアになる。
また、有向エッジ53〜62は、共通する単語がABCDEFで同じであり、かつ、エッジが向かう方向のノードの単語数が「2」で共通するため、有向エッジ52と同じスコアになる。
The directed edges 57 and 59 have the same score as the directed
Further, the directed
一方、有向エッジ63〜70は、2つのノードに共通する単語が「曲」や「歌詞」である。このような普通名詞は、クエリログに記憶されているクエリ数も多くなる。単語「曲」のクエリ数が1万個であれば、DF(曲)=10000となる。このため、有向エッジ67、69のスコアは、1/1*1/10000=0.0001であり、有向エッジ63,64,68,70のスコアは、1/2*1/10000=0.00005である。
単語「歌詞」のクエリ数が8000個であれば、DF(歌詞)=8000となり、有向エッジ65,66のスコアは、1/2*1/8000=0.0000625である。
スコア設定部13は、各有向エッジのスコアを、クエリ関係記憶部18の有向グラフに記憶する。具体的には、スコアH_{i,j}を行列と見なしてスコアを設定する。
On the other hand, the words common to the two nodes in the directed
If the number of queries for the word “lyric” is 8000, DF (lyric) = 8000, and the score of the directed
The
クエリ出力部14は、スコア設定部13で設定された有向エッジのスコアのなかで最も高い値の有向エッジを探し、その有向エッジが向かう方向のノードを重要と判定する。前記図2の例では、有向エッジ51,57,59のスコアが最も高い値となる。従って、クエリ出力部14は、ノード42が重要と判定する。そこで、クエリ出力部14は、ノード42のクエリ「ABCDEF」を重要クエリとして、端末装置30に出力する。
このため、ユーザは、重要クエリ抽出装置10から提供された重要クエリを利用した検索を行うことができ、求める情報を得ることができる。
The
For this reason, the user can perform a search using an important query provided from the important
[重要クエリ抽出装置の動作]
次に、重要クエリ抽出装置10における重要クエリ抽出処理に関し、図3のフローチャートに基づいて説明する。図3に示す処理は、前述したように、重要クエリ抽出プログラムを実行することで実施される。
重要クエリ抽出装置10のクエリ取得部11は、端末装置30から送信されるクエリを取得する(ステップS11)。クエリ取得部11は、取得したクエリをクエリログ記憶部17に記憶し、かつ、ノード設定部12に出力する。
ノード設定部12の第1ノード設定部121は、取得したクエリを第1ノードに設定する(ステップS12)。
[Operation of important query extractor]
Next, the important query extraction processing in the important
The query acquisition unit 11 of the important
The first node setting unit 121 of the
次に、第2ノード設定部122は、第1ノードの単語を含むクエリを、クエリログ記憶部17から抽出し、第2ノードを設定する(ステップS13)。また、第2ノード設定部122は、各ノード間に有向のエッジを設定して、クエリ間の関係を示すモデルとして有向グラフを作成し、クエリ関係記憶部18に記憶する(ステップS14)。
Next, the second
次に、スコア設定部13は、前記各エッジのスコアを算出し、クエリ関係記憶部18に記憶する(ステップS15)。
クエリ出力部14は、前記各エッジのスコアで最も高い値を検索し、重要クエリを抽出する(ステップS16)。
さらに、クエリ出力部14は、抽出した重要クエリを、端末装置30に出力する(ステップS17)。
以上により、重要クエリの抽出処理が終了する。重要クエリ抽出装置10は、端末装置30からクエリが入力されるたびに、前記ステップS11〜S17の処理を実行する。
Next, the
The
Further, the
Thus, the important query extraction process ends. The important
端末装置30においては、重要クエリ抽出装置10から出力された重要クエリが表示される。そして、ユーザが表示されたクエリを選択すると、端末装置30は、サーチエンジン23にクエリを出力し、その検索結果を取得して表示する。
In the
[実施形態の作用効果]
以上の実施形態によれば、以下の作用効果を奏することができる。
重要クエリ抽出装置10は、端末装置30から入力されたクエリに含まれる単語を有するクエリをクエリログ記憶部17から抽出して各ノードに設定する。そして、各ノード間のエッジのスコアを、各ノード間に共通する単語の希少性を示す値と、エッジが向かう方向のノードの単語数に基づいて設定し、希少性の高い単語であり、かつ、単語数が少ないノードに向かうエッジのスコアが高くなるように設定した。このため、固有名詞と、普通名詞からなるクエリを入力した場合、その固有名詞単独のクエリがクエリログ記憶部17に記憶されていれば、そのクエリを重要クエリとして抽出し、端末装置30に出力できる。通常、固有名詞のような希少性の高い、つまりクエリログに記憶されている数が少ない単語を入力している場合、ユーザはその単語に関係する情報を最も要求していると推定できる。従って、その単語を含むクエリで単語数が少ないものが最も重要度の高いクエリと判定できる。
このため、端末装置30のユーザは、重要クエリ抽出装置10からスペルミスや誤表記を含まない、例えば固有表現の正しい表記などの重要クエリを得ることができ、この重要クエリを用いて新たな検索を行うことで、求める情報を入手できる可能性が高まる。
[Effects of Embodiment]
According to the above embodiment, the following effects can be obtained.
The important
For this reason, the user of the
また、本実施形態では、単語の希少性を表す数値として、前記クエリログ記憶部17に記憶されたクエリ数としている。このため、各ノードの設定も、エッジのスコアの算出も、クエリログ記憶部17に記憶されたクエリログ(履歴)のみに基づいて行うことができる。すなわち、本実施形態では、前記重要クエリを抽出するには、クエリ履歴をクエリログ記憶部17に記憶しておくだけでよく、たとえば、各ユーザが複数のクエリをどのように入力したか等の行動履歴が保存されたログなどを用意する必要がない。このため、システム的な負荷が小さく、簡易なシステムで重要クエリを抽出できる。
In the present embodiment, the number of queries stored in the query
さらに、スペルミスを含む類似クエリの入力頻度が高い場合であっても、本実施形態では、一致する単語を含むクエリのみをノードに設定し、類似する単語にはエッジが設定されない。このため、スペルミスを含む類似クエリが重要クエリと誤って判定されることを防止できる。 Furthermore, even when the input frequency of similar queries including spelling errors is high, in this embodiment, only queries including matching words are set as nodes, and edges are not set for similar words. For this reason, it is possible to prevent a similar query including a spelling error from being erroneously determined as an important query.
[変形例]
なお、本発明は、上述した実施形態に限定されるものではなく、本発明の目的を達成できる範囲で、以下に示される変形をも含むものである。
たとえば、上記実施形態では、情報検索装置20と、重要クエリ抽出装置10とを別々のサーバ装置で構成していたが、これらを1つのサーバ装置で構成してもよい。
[Modification]
In addition, this invention is not limited to embodiment mentioned above, In the range which can achieve the objective of this invention, the deformation | transformation shown below is also included.
For example, in the above embodiment, the
また、エッジのスコアを算出するための式としては、前記式(2)に記載されたものに限定されない。すなわち、クエリの単語の希少性が高いほどスコアが高くなり、かつ、クエリに含まれる単語数が少ないほどスコアが高くなるような式であればよい。 Further, the formula for calculating the score of the edge is not limited to the formula described in the formula (2). In other words, any expression may be used as long as the word rarity of the query is high, the score is high, and the score is high as the number of words included in the query is small.
本発明は、入力されたクエリに関連して、重要度の高いクエリを判定して出力できる重要クエリ抽出装置、重要クエリ抽出方法および重要クエリ抽出プログラムとして利用できる。 INDUSTRIAL APPLICABILITY The present invention can be used as an important query extraction device, an important query extraction method, and an important query extraction program that can determine and output a query with high importance in relation to an input query.
1…検索システム、10…重要クエリ抽出装置、11…クエリ取得部、12…ノード設定部、121…第1ノード設定部、122…第2ノード設定部、13…スコア設定部、14…クエリ出力部、17…クエリログ記憶部、18…クエリ関係記憶部、20…情報検索装置、30…端末装置。 DESCRIPTION OF SYMBOLS 1 ... Search system, 10 ... Important query extraction apparatus, 11 ... Query acquisition part, 12 ... Node setting part, 121 ... 1st node setting part, 122 ... 2nd node setting part, 13 ... Score setting part, 14 ... Query output , 17 ... Query log storage unit, 18 ... Query relation storage unit, 20 ... Information retrieval device, 30 ... Terminal device.
Claims (5)
前記クエリ取得部で取得されたクエリを、クエリログとして順次記憶するクエリログ記憶部と、
前記クエリ取得部で取得したクエリを第1ノードに設定する第1ノード設定部と、
前記クエリログ記憶部に記憶されているクエリログから、前記第1ノードのクエリに含まれる単語を含むクエリを抽出し、抽出されたクエリを第2ノードに設定する第2ノード設定部と、
前記各ノード間に有向エッジを追加し、各有向エッジのスコアを設定するスコア設定部と、
前記スコア設定部で設定されたスコアに基づいて重要ノードを特定し、そのノードに設定されたクエリを重要クエリとして出力するクエリ出力部とを備え、
前記スコア設定部は、一方のノードから他方のノードに向かう有向エッジのスコアを、他方のノードに含まれる単語数と、各ノードに共通する単語の希少性を表す数値とに基づいて設定する
ことを特徴する重要クエリ抽出装置。 A query acquisition unit for acquiring a query including a word as a search keyword;
A query log storage unit for sequentially storing the queries acquired by the query acquisition unit as a query log;
A first node setting unit that sets a query acquired by the query acquisition unit as a first node;
A second node setting unit that extracts a query including a word included in the query of the first node from a query log stored in the query log storage unit, and sets the extracted query as a second node;
A score setting unit that adds a directed edge between the nodes and sets a score of each directed edge;
A query output unit that identifies an important node based on the score set by the score setting unit and outputs a query set to the node as an important query;
The score setting unit sets the score of the directed edge from one node to the other node based on the number of words included in the other node and a numerical value representing the rarity of words common to each node. An important query extraction device characterized by that.
前記スコア設定部は、入力されたクエリに含まれる単語の中で、最も希少性の高い単語のみで構成されるノードが存在する場合は、そのノードに向かう有向エッジのスコアを最も高く設定し、
前記クエリ出力部は、前記有向エッジのスコアが最も高いノードのクエリを重要クエリとして出力する
ことを特徴とする重要クエリ抽出装置。 The important query extraction device according to claim 1,
The score setting unit sets the highest score of the directed edge toward the node when there is a node composed only of the rarest word among the words included in the input query. ,
The said query output part outputs the query of the node with the highest score of the said directed edge as an important query. The important query extraction apparatus characterized by the above-mentioned.
前記スコア設定部は、ノードiからノードjに向かうエッジのスコアをH_{i,j}、ノードjに設定されたクエリを構成する単語数をN_q_j、前記クエリログ記憶部において単語wを含むクエリ数を示す数値をDF(w)、ノードiおよびノードjに含まれる単語に関するDF(w)の逆数を加算した値をΣ_{w∈q_i∩q_j} 1/DF(w)とした場合に、前記エッジのスコアを、
H_{i,j}=1/N_q_j*(Σ_{w∈q_i∩q_j} 1/DF(w))
で求める
ことを特徴とする重要クエリ抽出装置。 In the important query extraction device according to claim 1 or 2,
The score setting unit has an edge score from node i to node j as H_ {i, j}, the number of words constituting a query set in node j as N_q_j, and the number of queries including word w in the query log storage unit DF (w) is a numerical value indicating DF (w), and a value obtained by adding the reciprocal of DF (w) for the words included in node i and node j is Σ_ {w∈q_i∩q_j} 1 / DF (w), Edge score,
H_ {i, j} = 1 / N_q_j * (Σ_ {w∈q_i∩q_j} 1 / DF (w))
An important query extraction device characterized by
前記コンピュータは、
クエリの履歴が記憶されたクエリログ記憶部を備え、
検索キーワードとなる単語が含まれるクエリを取得するクエリ取得ステップと、
前記クエリ取得ステップで取得したクエリを第1ノードに設定する第1ノード設定ステップと、
前記クエリログ記憶部に記憶されているクエリの履歴から、前記第1ノードのクエリに含まれる単語を含むクエリを抽出し、抽出されたクエリを第2ノードに設定する第2ノード設定ステップと、
前記各ノード間に有向エッジを追加し、各有向エッジのスコアを設定するスコア設定ステップと、
前記スコア設定ステップで設定されたスコアに基づいて重要ノードを特定し、そのノードに設定されたクエリを重要クエリとして出力するクエリ出力ステップとを実行し、
前記スコア設定ステップは、一方のノードから他方のノードに向かう有向エッジのスコアを、他方のノードに含まれる単語数と、各ノードに共通する単語の希少性を表す数値とに基づいて設定する
ことを特徴する重要クエリ抽出方法。 An important query extraction method for extracting an important query by a computer,
The computer
A query log storage unit storing a history of queries,
A query acquisition step for acquiring a query including a word as a search keyword;
A first node setting step of setting the query acquired in the query acquisition step as a first node;
A second node setting step of extracting a query including a word included in the query of the first node from a query history stored in the query log storage unit, and setting the extracted query as a second node;
A score setting step of adding a directed edge between the nodes and setting a score of each directed edge;
A query output step of identifying an important node based on the score set in the score setting step, and outputting a query set in the node as an important query;
In the score setting step, the score of the directed edge from one node to the other node is set based on the number of words included in the other node and a numerical value representing the rarity of words common to each node. An important query extraction method characterized by that.
検索キーワードとなる単語が含まれるクエリを取得するクエリ取得ステップと、
前記クエリ取得ステップで取得したクエリを第1ノードに設定する第1ノード設定ステップと、
クエリの履歴が記憶されたクエリログ記憶部に記憶されているクエリの履歴から、前記第1ノードのクエリに含まれる単語を含むクエリを抽出し、抽出されたクエリを第2ノードに設定する第2ノード設定ステップと、
前記各ノード間に有向エッジを追加し、各有向エッジのスコアを設定するスコア設定ステップと、
前記スコア設定ステップで設定されたスコアに基づいて重要ノードを特定し、そのノードに設定されたクエリを重要クエリとして出力するクエリ出力ステップとを実行させる重要クエリ抽出プログラムであって、
前記スコア設定ステップは、一方のノードから他方のノードに向かう有向エッジのスコアを、他方のノードに含まれる単語数と、各ノードに共通する単語の希少性を表す数値とに基づいて設定する
ことを特徴する重要クエリ抽出プログラム。 On the computer,
A query acquisition step for acquiring a query including a word as a search keyword;
A first node setting step of setting the query acquired in the query acquisition step as a first node;
A query including a word included in the query of the first node is extracted from a query history stored in a query log storage unit in which a query history is stored, and the extracted query is set as a second node. Node setting step;
A score setting step of adding a directed edge between the nodes and setting a score of each directed edge;
An important query extraction program for executing an query output step of identifying an important node based on the score set in the score setting step and outputting a query set in the node as an important query,
In the score setting step, the score of the directed edge from one node to the other node is set based on the number of words included in the other node and a numerical value representing the rarity of words common to each node. An important query extraction program characterized by that.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011227090A JP5524160B2 (en) | 2011-10-14 | 2011-10-14 | Important query extraction device, important query extraction method, and important query extraction program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011227090A JP5524160B2 (en) | 2011-10-14 | 2011-10-14 | Important query extraction device, important query extraction method, and important query extraction program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013088923A true JP2013088923A (en) | 2013-05-13 |
JP5524160B2 JP5524160B2 (en) | 2014-06-18 |
Family
ID=48532799
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011227090A Active JP5524160B2 (en) | 2011-10-14 | 2011-10-14 | Important query extraction device, important query extraction method, and important query extraction program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5524160B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015022528A (en) * | 2013-07-19 | 2015-02-02 | ヤフー株式会社 | Trigger query acquisition device, trigger query acquisition method, and program |
JP2019159906A (en) * | 2018-03-14 | 2019-09-19 | ヤフー株式会社 | Information processing apparatus, information processing method, and program |
JP2020135566A (en) * | 2019-02-21 | 2020-08-31 | ヤフー株式会社 | Information processing device, information processing method, and information processing program |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06208588A (en) * | 1992-08-14 | 1994-07-26 | Ricoh Co Ltd | Document retrieving system |
JPH113343A (en) * | 1997-06-10 | 1999-01-06 | Fuji Xerox Co Ltd | Information retrieving device |
JPH11184865A (en) * | 1997-12-19 | 1999-07-09 | Matsushita Electric Ind Co Ltd | Document summarizing device |
JP2007164583A (en) * | 2005-12-15 | 2007-06-28 | Oki Electric Ind Co Ltd | Apparatus, method, and program for determination |
JP2010061322A (en) * | 2008-09-03 | 2010-03-18 | Nippon Telegr & Teleph Corp <Ntt> | Information retrieving device and information retrieval program |
JP2010061178A (en) * | 2008-08-05 | 2010-03-18 | Ricoh Co Ltd | Information processor, information retrieval system, information processing method, and program |
-
2011
- 2011-10-14 JP JP2011227090A patent/JP5524160B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06208588A (en) * | 1992-08-14 | 1994-07-26 | Ricoh Co Ltd | Document retrieving system |
JPH113343A (en) * | 1997-06-10 | 1999-01-06 | Fuji Xerox Co Ltd | Information retrieving device |
JPH11184865A (en) * | 1997-12-19 | 1999-07-09 | Matsushita Electric Ind Co Ltd | Document summarizing device |
JP2007164583A (en) * | 2005-12-15 | 2007-06-28 | Oki Electric Ind Co Ltd | Apparatus, method, and program for determination |
JP2010061178A (en) * | 2008-08-05 | 2010-03-18 | Ricoh Co Ltd | Information processor, information retrieval system, information processing method, and program |
JP2010061322A (en) * | 2008-09-03 | 2010-03-18 | Nippon Telegr & Teleph Corp <Ntt> | Information retrieving device and information retrieval program |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015022528A (en) * | 2013-07-19 | 2015-02-02 | ヤフー株式会社 | Trigger query acquisition device, trigger query acquisition method, and program |
US9940408B2 (en) | 2013-07-19 | 2018-04-10 | Yahoo Japan Corporation | Trigger query obtaining apparatus, trigger query obtaining method, and non-transitory computer readable recording medium |
JP2019159906A (en) * | 2018-03-14 | 2019-09-19 | ヤフー株式会社 | Information processing apparatus, information processing method, and program |
JP6998245B2 (en) | 2018-03-14 | 2022-01-18 | ヤフー株式会社 | Information processing equipment, information processing methods, and programs |
JP2020135566A (en) * | 2019-02-21 | 2020-08-31 | ヤフー株式会社 | Information processing device, information processing method, and information processing program |
Also Published As
Publication number | Publication date |
---|---|
JP5524160B2 (en) | 2014-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8452763B1 (en) | Extracting and scoring class-instance pairs | |
JP5396533B2 (en) | Information processing apparatus, information processing method, and program for information processing apparatus | |
US20100241647A1 (en) | Context-Aware Query Recommendations | |
JP5084858B2 (en) | Summary creation device, summary creation method and program | |
EP2686783A2 (en) | Keyword extraction from uniform resource locators (urls) | |
KR20160124079A (en) | Systems and methods for in-memory database search | |
US9720982B2 (en) | Method and apparatus for natural language search for variables | |
CN112612875B (en) | Query term automatic expansion method, device, equipment and storage medium | |
JPWO2010026900A1 (en) | Relationship discovery device, relationship discovery method, and relationship discovery program | |
JP2009037501A (en) | Information retrieval apparatus, information retrieval method and program | |
JP5524160B2 (en) | Important query extraction device, important query extraction method, and important query extraction program | |
JP5787941B2 (en) | Trigger query acquisition device, trigger query acquisition method, and program | |
JP4824070B2 (en) | Search processing apparatus, search processing method and program for selecting seed of crawler for specialized search using click log | |
JP5141144B2 (en) | Information retrieval system and information retrieval program | |
CN111625640A (en) | Question and answer processing method, device and storage medium | |
JP2011128737A (en) | Dictionary generation processing method, program, and device | |
JP5659500B2 (en) | Web service storage program and Web service storage device | |
KR20190000061A (en) | Method and system for providing relevant keywords based on keyword attribute | |
JP4962973B2 (en) | Search server, method and program | |
JP5491478B2 (en) | Search query related word output device, search query related word output method, and search auxiliary system | |
CN116541801B (en) | Multi-device information centralized processing system, device and storage medium | |
JP5530334B2 (en) | Information search apparatus and information search program | |
JP2008071296A (en) | Data management device, data management method, and data management program | |
US20230244724A1 (en) | Method and system for automated public information discovery | |
JP5636700B2 (en) | Related word dictionary creation device, related word dictionary creation method, program, and document search system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130814 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130820 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131016 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20131119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140217 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20140224 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140311 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140409 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5524160 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |