JP2012164242A - Related word extraction device, related word extraction method, related word extraction program - Google Patents
Related word extraction device, related word extraction method, related word extraction program Download PDFInfo
- Publication number
- JP2012164242A JP2012164242A JP2011025579A JP2011025579A JP2012164242A JP 2012164242 A JP2012164242 A JP 2012164242A JP 2011025579 A JP2011025579 A JP 2011025579A JP 2011025579 A JP2011025579 A JP 2011025579A JP 2012164242 A JP2012164242 A JP 2012164242A
- Authority
- JP
- Japan
- Prior art keywords
- search
- word
- related word
- words
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、検索エンジンの技術分野、特に検索ログから検索語(キーワード)の関連語を抽出し、抽出された関連語を追加の検索語としてユーザに推薦する技術に関する。 The present invention relates to a technical field of a search engine, and more particularly to a technique for extracting related words of a search word (keyword) from a search log and recommending the extracted related word to a user as an additional search word.
周知のように検索エンジンは、ユーザ入力の検索語の文字列(クエリ)に応じてインターネット上の文書のリストを応答し、ユーザはインターネット上の膨大な情報から必要な情報を得るために検索エンジンを利用している。ここでユーザが検索エンジンに入力する検索語としては、ユーザの知りたい「人、モノ、出来事」などの名詞が入力されることが多い。 As is well known, a search engine responds with a list of documents on the Internet according to a character string (query) of a search term input by a user, and the user can obtain necessary information from a vast amount of information on the Internet. Is used. Here, nouns such as “people, things, and events” that the user wants to know are often input as search terms that the user inputs to the search engine.
ところが、検索語が複数の意味を有する場合やユーザが検索語について何か特定の事柄を知りたいという検索要求を持っている場合がある。前者の例としては「ヤクルト(登録商標)」という検索語に対しては飲料品としての「ヤクルト」の他に、企業や野球球団の意味も存在する。また、後者の例としては、「京都」という検索語に対して、「京都」の「紅葉」について知りたいユーザや「花見」「土産」などについて知りたいユーザなども存在する。 However, there are cases where a search word has a plurality of meanings, or a user has a search request to know something specific about the search word. As an example of the former, for the search term “Yakult (registered trademark)”, there is a meaning of a company or a baseball team in addition to “Yakult” as a beverage. In addition, as the latter example, there are a user who wants to know “autumn leaves” of “Kyoto” and a user who wants to know “cherry-blossom viewing”, “souvenir” and the like for the search term “Kyoto”.
そこで、「goo(登録商標)」や「Google(登録商標)」などの検索エンジンは、図11に示すように、ユーザの検索補助などのために現在の流行を考慮した関連語を追加の検索語として推薦・提示するガイド機能を有し、ユーザの利便性を高めている。この関連語については、図12に示すように、クエリログにおける検索語の共起性や検索語同士におけるクリック先URLの共通性から抽出する方法、あるいは検索語による検索結果の上位にランクされた電子文書(Webページ)内で検索語の周辺に出現する単語から抽出する特許文献1の方法が知られている。 Therefore, search engines such as “goo (registered trademark)” and “Google (registered trademark)” additionally search related words taking into account the current trend for user search assistance as shown in FIG. It has a guide function that recommends and presents words, improving user convenience. As for this related word, as shown in FIG. 12, a method of extracting from the co-occurrence of the search word in the query log and the commonality of the click destination URL between the search words, or the electronic ranked in the top of the search result by the search word A method of Patent Document 1 is known that extracts from words appearing around a search word in a document (Web page).
しかしながら、ユーザに追加の検索語を提示するWebページ上のスペースは有限であるものの、関連語を関連度順に表示すると同じ意味合いの関連語(例えば「京都」に対して「桜」「花見」「さくら」など)が上位に並んでしまうおそれがある。 However, although the space on the Web page for presenting additional search terms to the user is limited, when related terms are displayed in the order of relevance, related terms having the same meaning (for example, “Cherry”, “Hanami”, “ Sakura "etc.) may be placed at the top.
また、多様な意図を持ったユーザが存在することから、検索の利便性を向上させるためには同じ意図と考えられる関連語ばかりではなく、異なる意図の関連語も幅広く推薦・提示することが好ましい。 In addition, since there are users with various intentions, it is preferable to recommend and present not only related words that are considered to have the same intention but also related words that have different intentions in order to improve the convenience of search. .
ところが、特許文献1などの従来手法で抽出した関連語の集合を意味的にクラスタリングするためには各語の意味情報を保持したうえで計算を実行しなければならない。この場合に検索語には膨大な種類の語が存在するため、すべての語の意味情報を保持することは困難である。 However, in order to semantically cluster a set of related words extracted by a conventional method such as Patent Document 1, it is necessary to perform calculation after retaining the semantic information of each word. In this case, since there are a large number of types of search words, it is difficult to hold the semantic information of all the words.
本発明は、上述のような従来技術の問題点を解決するためになされたものであり、多様性のある関連語をより少ないデータの解析で抽出し、ユーザに提示することを解決課題としている。 The present invention has been made in order to solve the above-described problems of the prior art, and it is an object of the present invention to extract various related words by analyzing less data and present them to the user. .
そこで、本発明は、検索語に流行があることに着目し、検索語が急増した期間と検索語とを1つのグループ(バースト情報)とし、その期間の関連語(例えば検索語と同時に検索された語など)を求める。このグループ毎に検索エンジンの要求に応じて関連語群を抽出し、ユーザに提示する。 Therefore, the present invention pays attention to the fact that search terms have a trend, and the term in which the search terms have increased rapidly and the search terms are grouped into one group (burst information), and the related terms (for example, the search terms are searched at the same time). For example). A group of related terms is extracted for each group in response to a request from the search engine and presented to the user.
本発明に係る関連語抽出装置は、検索ログを任意の単位で解析し、該解析単位ごとに検索回数が閾値以上の割合で増加している検索語を検出する検出手段と、検出手段の検出した検索語に関連する関連語群を検索ログから抽出し、抽出された関連語群を前記解析単位ごとにグループ化し、該グループ群を検索語と併せてデータベースに保存する関連語抽出手段と、検索エンジンの要求に応じてデータベースからユーザ入力の検索語の関連語を重複無く順に選択し、選択された関連語群を検索エンジンに出力する関連語出力手段と、を備える。 The related word extraction apparatus according to the present invention analyzes a search log in an arbitrary unit, detects a search word in which the number of searches increases at a rate equal to or greater than a threshold for each analysis unit, and detection by the detection unit A related word extracting means for extracting a related word group related to the search word from the search log, grouping the extracted related word group for each analysis unit, and storing the group group together with the search word in a database; And related word output means for sequentially selecting related words of search words input by the user from the database in response to a request from the search engine, and outputting the selected related word group to the search engine.
本発明に係る関連語抽出方法は、検索ログを任意の単位で解析し、該解析単位ごとに検索回数が閾値以上の割合で増加している検索語を検出する検出ステップと、検出ステップで検出した検索語に関連する関連語群を検索ログから抽出し、抽出された関連語群を前記解析単位ごとにグループ化し、該グループ群を検索語と併せてデータベースに保存する関連語抽出ステップと、検索エンジンの要求に応じてデータベースからユーザ入力の検索語の関連語を重複無く順に選択し、選択された関連語群を検索エンジンに出力する関連語出力ステップと、を有する。 The related word extraction method according to the present invention includes a detection step of analyzing a search log in an arbitrary unit, and detecting a search word in which the number of searches is increasing at a rate equal to or greater than a threshold for each analysis unit, and detecting in the detection step Extracting a related word group related to the search term from the search log, grouping the extracted related word group for each analysis unit, and storing the group group together with the search word in a database; and A related word output step of sequentially selecting related words of the search words input by the user from the database in response to a request of the search engine, and outputting the selected related word group to the search engine.
前記各態様においてデータベースに保存されたグループあるいはグループ内の関連語群をクラスタリングすることもできる。クラスタリングには、グループ内の関連語の類似度・クリック先の情報などが利用される。 In each of the above embodiments, the groups stored in the database or related word groups in the group can be clustered. For clustering, the similarity of related words in a group, information on a click destination, and the like are used.
なお、本発明は、前記抽出装置としてコンピュータを機能させるプログラムの態様としてもよい。このプログラムは、ネットワークや記録媒体などを通じて提供することができる。 In addition, this invention is good also as an aspect of the program which makes a computer function as said extraction apparatus. This program can be provided through a network or a recording medium.
本発明によれば、多様性のある関連語をより少ないデータの解析で抽出し、ユーザに提示することができる。 According to the present invention, various related words can be extracted by analyzing less data and presented to the user.
≪第1実施形態≫
図1に基づき本発明の第1実施形態に係る関連語抽出装置を説明する。この抽出装置1は、検索エンジン2の検索ログDB3から検索語に関連する関連語を抽出し、抽出された関連語を検索エンジン2の要求に応じて出力する。具体的には、前記抽出装置1は、コンピュータにより構成され、通常のコンピュータのハードウェアリソース、例えばCPU.メモリ(RAM).ハードディスクドライブ装置などを備える。
<< First Embodiment >>
A related word extraction apparatus according to the first embodiment of the present invention will be described with reference to FIG. The extraction device 1 extracts related words related to the search word from the
このハードウェアリソースとソフトウェアリソースとの協働の結果、前記抽出装置1は、バースト検出手段4.バースト情報DB5.関連語抽出手段6.バースト関連語情報DB7.関連語出力手段8を実装する。この各DB3.5.7は、メモリ(RAM)やハードディスクドライブ装置などの記憶装置に構築されているものとする。ここで前記DB3には検索エンジン2の検索窓から得られた検索ログが記録されている。ここでは検索ログには、検索に利用した検索語のクエリログと、該検索語の検索結果に対するクリック先情報(URLやページ情報など)のクリックログとが含まれる。
As a result of the cooperation between the hardware resource and the software resource, the extraction device 1 uses the burst detection means 4. Burst information DB5. Related term extraction means6. Burst related word information DB7. The related word output means 8 is implemented. Each DB 3.5.7 is assumed to be built in a storage device such as a memory (RAM) or a hard disk drive device. Here, a search log obtained from the search window of the
前記検出手段4は、前記DB3に記録されたクエリログのデータを任意の日時単位で解析する。ここでは一例として1日単位でクエリログのデータを解析し、検索回数が急増した検索語を検出する(バースト検出ステップ)。この検索回数が急増したか否か、即ちバーストしたか否かを判定するにあたっては閾値を用いる。例えば過去数日間(任意の期間)の移動平均値に対して3σ以上(σは標準偏差)で検索回数が上昇している場合に異常時と判定し、バーストと検出してよい。このとき前記検出手段4は、バーストの検出日とバーストした検索語とをペアにしたバースト情報を前記DB5に保存する。
The detection means 4 analyzes query log data recorded in the
前記抽出手段6は、前記DB5の格納データを参照し検出日毎に検索語を取得し、クエリログのデータを解析して検索語の関連語群を抽出する(関連語抽出ステップ)。すなわち、前記DB5の格納データ中から検索日と検索語で絞り込んだクエリログのデータのみを解析し、検索語の関連語群を抽出する。関連語の抽出にあたっては、単に検索時に該検索語と同時に入力された語の共起回数や、該共起回数を該検索語の検索数で除算した「tf・idf」のような指標を用いてもよく、特許文献1のように検出日の検索結果の上位のWebページを解析して関連語を抽出してもよい。
The extraction means 6 refers to the data stored in the
ここで抽出した関連語群は、バーストの検出日毎に関連語グループにグループ化され、検索語と併せて関連語グループ群が前記DB7に保存される。具体的には前記DB7には、「検索語.関連語グループ(検出日:「word|score,word|score,word|score),関連語グループ(検出日:「word|score,word|score,word|score),・・・」として記録される。ここで各関連語(word)と対に記録される「score」は、関連語の関連度や「tf・idf」のなどのスコア情報を示している。
The related word group extracted here is grouped into related word groups for each burst detection date, and the related word group group is stored in the
前記出力手段8は、ユーザが図示省略の端末(例えばPC.携帯電話など)を通じて検索エンジン2の検索窓に検索語を入力したときに、該検索エンジン2のフロントエンドからの要求としてユーザ入力の検索語を受け取る。受け取った検索語のレコードを前記DB7から取得し、図2に示すように、取得したレコードの関連語グループからラウンドロビン形式で重複無く関連語を選択する。
The output means 8 receives a user input as a request from the front end of the
ここで選択された任意数の関連語が検索エンジン2のフロントエンドに返答され、検索エンジン2の前記ガイド機能に利用される。すなわち、検索エンジン2が受け取った関連語群が、ユーザ入力の検索語に追加する推薦語として検索窓などの追加語の提示スペースに一覧表示される。
Any number of related terms selected here are returned to the front end of the
これにより検索語の流行(バースト)を考慮して関連語群を抽出し、ユーザに検索の推薦語として提示することができる。すなわち、ある検索語の検索回数は一定ではなく、一時的に急増(バースト)することがある。この代表的な原因としては、TVや新聞などのメディアで取り上げられたり、あるWeb上のコミュニティ(掲示板やソーシャルメディアなど)で話題となったことなどが挙げられる。 As a result, related word groups can be extracted in consideration of the search word trend (burst) and presented to the user as search recommended words. That is, the number of searches for a certain search term is not constant, and may increase rapidly (burst). Typical reasons for this include being taken up by media such as TV and newspapers, and being talked about in certain Web communities (such as bulletin boards and social media).
このような検索語の検索回数が一時的に急増したバースト検出日には、ある検索語は特定の検索意図に偏っているため(特定の検索意図の割合が多い)、その意図に沿った関連語をクエリログから抽出することができる。例えばバースト検出日ではなく、定常状態のときに「ヤクルト」という検索語を使うユーザのうち、(「飲料品」,「健康食品」,「ヤクルト球団」)の情報を意図するユーザの割合は、それぞれ(「40%」,「30%」,「30%」)であったとする。ところが、11月3日に球団としてのヤクルト(ヤクルトスワローズ)が優勝し、「ヤクルト」での検索回数が急増した場合(バーストした場合)、先ほどの検索意図の割合は(「5%」,「5%」,「90%」)になっている場合がある。このときのクエリログから抽出された関連語グループにはヤクルト球団の関連語が多数包含される。 On the day of burst detection when the number of searches for such search terms has increased temporarily, a certain search term is biased toward a specific search intention (a high percentage of specific search intentions), so the relevant relationship according to that intention Words can be extracted from the query log. For example, among the users who use the search term “Yakult” in the steady state instead of the burst detection date, the percentage of users who intend to use the information (“beverage”, “health food”, “Yakult baseball team”) Assume that they are respectively (“40%”, “30%”, “30%”). However, if Yakult (Yakult Swallows) as a team wins on November 3, and the number of searches for “Yakult” has increased rapidly (when bursting), the percentage of search intentions (“5%”, “ 5% "," 90% "). The related word group extracted from the query log at this time includes many related words of the Yakult team.
したがって、バースト検出日毎に関連語グループを作成すれば、多様な検索意図の関連語を抽出してユーザに提示でき、検索の利便性を向上させることができる。図3に基づき説明すれば、同一の検索語についてバースト1の関連語グループには意図Bの関連語が多く含まれているため、該意図Bの関連語が抽出され易い一方、バースト2の関連語グループには意図Aの関連語が多く含まれているため、該意図Aの関連語が抽出され易い。すなわち、バースト1.2の関連語グループは、図4に示すように、それぞれ定常状態(バースト前1週間の平均)よりも語a.bの割合が「0.3」増加している。このときバースト1から抽出した語bは、意図Bによるものである可能性が高く、バースト2から抽出した語aは意図Aによるものである可能性が高い。したがって、各関連語グループから抽出された関連語をユーザに提示することで、意図A.Bの推薦語を提示することができる。
Therefore, if a related word group is created for each burst detection date, related words with various search intentions can be extracted and presented to the user, and the convenience of search can be improved. If it demonstrates based on FIG. 3, since the related word group of the burst 1 contains many related words of the intention B about the same search word, while the related word of the intention B is easy to be extracted, Since many related words of the intention A are included in the word group, the related words of the intention A are easily extracted. That is, as shown in FIG. 4, the related word group of burst 1.2 has words a. The ratio of b is increased by “0.3”. At this time, the word b extracted from the burst 1 is highly likely to be due to the intention B, and the word a extracted from the
また、図5〜図7中、「キーワード」は前記検出手段4の検出した検索語を示し、「全体」は従来のガイド機能で提示される関連語群を示し、「バースト考慮」は前記抽出装置1を用いたガイド機能で提示される関連語群を示し、アンダーライン部は従来のガイド機能では提示されてない関連語を示し、前記抽出装置1を用いれば多様性のある関連語群をユーザに提示できることが分かる。 In FIG. 5 to FIG. 7, “keyword” indicates a search word detected by the detection unit 4, “whole” indicates a related word group presented by the conventional guide function, and “burst consideration” indicates the extraction The related word group presented by the guide function using the apparatus 1 is shown, the underlined part shows the related word group not presented by the conventional guide function, and if the extracting apparatus 1 is used, the related word group having diversity is shown. It can be seen that it can be presented to the user.
このとき前記抽出装置1によれば、バースト検出日のクエリログのデータのみを用いて関連語を抽出するため、多様性のある関連語をより少ないデータの解析で抽出ができ、処理の効率化にも貢献できる。なお、バースト毎に関連語グループを作成して関連語を推薦語として提示するため、ユーザは過去の流行や出来事を容易に検索でき、この点でもユーザの検索活動を支援できる。 At this time, according to the extraction apparatus 1, since related words are extracted using only the query log data of the burst detection date, a variety of related words can be extracted by analyzing less data, thereby improving processing efficiency. Can also contribute. In addition, since a related word group is created for each burst and related words are presented as recommended words, the user can easily search for past fashions and events, and in this respect can also support the user's search activities.
図8は、前記抽出手段6の他の処理例を示している。ここではバースト検出日・定常状態間で関連語のスコア情報、即ち前記DB7に保存された「word」の「score」値の差分を算出することで、さらなる効果拡大を図っている。
FIG. 8 shows another processing example of the extraction means 6. Here, the effect is further expanded by calculating the difference between the score information of the related words between the burst detection date and the steady state, that is, the difference of the “score” value of “word” stored in the
具体的には、バースト検出日前の任意の期間(ここでは一週間とする。)を定常状態とし、定常状態の各関連語の関連度や「tf・idf」などのスコア平均を、バースト検出日における同じ関連語のスコア情報、即ち前記DB7に保存された「score」の値から減算する。これにより定常状態で高いスコア値を得ていた関連語のスコア値は減少し、相対的にバースト検出日のみに高いスコア値の関連語が上位として抽出される。
Specifically, an arbitrary period (in this case, one week) before the burst detection date is set as the steady state, and the degree of association of each related word in the steady state and the score average such as “tf · idf” are calculated as the burst detection date. Is subtracted from the score information of the same related word in, ie, the value of “score” stored in the
例えば図8中の関連語「東京ディズニーリゾート」は、定常状態において「tf・idf」の最高値「0.15」を得ているものの、検索語「ディズニー(登録商標)」のバースト検出日には最低値「0.05」なため、関連語群中の下位で抽出されている。一方、関連語「ディズニールームランプ」は、定常状態において「tf・idf」の最低値「0.02」であるものの、検索語「ディズニー」のバースト日には二番目の値「0.14」を得ているため、第2位で抽出されている。 For example, the related word “Tokyo Disney Resort” in FIG. 8 obtains the maximum value “0.15” of “tf · idf” in the steady state, but on the burst detection date of the search word “Disney (registered trademark)”. Since the minimum value is “0.05”, it is extracted in the lower order in the related word group. On the other hand, although the related word “Disney room lamp” has the lowest value “0.02” of “tf · idf” in the steady state, the second value “0.14” is displayed on the burst date of the search word “Disney”. Therefore, it is extracted in the second place.
≪第2実施形態≫
図9は、本発明の第2実施形態に係る関連語抽出装置を示している。この抽出装置11には、前記DB7の保存データをクラスタリングするクラスタリング手段9が設けられている。ここではバーストした検索語に対する関連語グループを再グループ化する。
<< Second Embodiment >>
FIG. 9 shows a related word extraction apparatus according to the second embodiment of the present invention. The extraction device 11 is provided with clustering means 9 for clustering the data stored in the
すなわち、前記DB7に保存された検索語の関連語グループ群には、同じ意図の類似した検索語を含む関連語グループが存在する場合がある。例えば検索語「京都」は毎年春にバースト(流行)が存在し、そのバースト検出日の関連語群としては「桜」や「花見」、「吉野」などが同じように抽出される。これらを別々のブループとしてラウンドロビンで関連語を抽出すると、同じ意図の関連語が多くなってしまう。
That is, there may be a related term group including similar search terms with the same intention in the related term group of search terms stored in the
このとき検索窓などの追加語を提示するスペースは有限なため、同じ意味合いの関連語が上位に並んで多種多様な関連語をユーザに提示できないおそれが生じる。そこで、前記DB7に保存された関連語グループをクラスタリングし、類似するグループを一つのグループにまとめるためにクラスタリング手段9を前記抽出装置1に設けた。
At this time, since the space for presenting additional words such as a search window is limited, there is a possibility that related words having the same meaning are arranged at the top and various related words cannot be presented to the user. Therefore, clustering means 9 is provided in the extraction device 1 in order to cluster related word groups stored in the
このクラスタリング手段9は、前記DB7のレコードを取得し、取得されたレコード中の関連語グループ群を、該グループ内に含まれる関連語の類似性でクラスタリングする(クラスタリングステップ)。この関連語の類似性判定には、関連語の種類や前記DB7に関連語と対で記録された「score」のスコア情報を利用する。クラスタリング手法としては代表的なウォード法やK平均法など、どの手段を用いてもよく、クラスタリングの際に作成されるクラスタ数も任意に指定してよいものとする。
The clustering means 9 acquires the records of the
例えば検索語「京都」で20XX年4月xx日に検出されたバーストでは、「桜」「花見」が関連語グループとして保存され、200Y年4月yy日も「桜」「花見」が関連語グループとして保存されていれば同じ意図の関連語と考えられる。その際に関連語「桜」「花見」の種類やそれぞれの関連度(tf・idfなど)をスコア情報として、その分布の傾向などによって各関連語グループをクラスタリングする。 For example, in a burst detected on April xx 20XX in the search term “Kyoto”, “Sakura” and “Hanami” are stored as related word groups, and “Sakura” and “Hanami” are also related words on April yy, 200Y. If they are stored as a group, they are considered related terms with the same intention. At that time, the types of related words “sakura” and “cherry-blossom viewing” and the degree of relevance (tf / idf etc.) are used as score information, and each related word group is clustered according to its distribution tendency.
また、前述のようにヤクルト球団(ヤクルトスワローズ)が優勝し、最初に検索語「ヤクルト」がバーストした場合、バースト検出日以降に同じ意図の関連語グループ群が連続すれば、同様に該各関連語グループをクラスタリングする。 As described above, if the Yakult Swallows wins and the search term “Yakult” bursts for the first time, if related word groups of the same intention continue after the burst detection date, Cluster word groups.
そして、各クラスタに含まれるレコードの関連語グループを統合して、関連度の高い順に関連語のリストをクラスタ毎に作成する。このとき統合する関連語グループ内の関連語が重複していれば、関連度はスコア情報の合計値を用いてもよく、最大値や中央値・平均値を用いてもよく、その他の方法を用いてもよい。 Then, related word groups of records included in each cluster are integrated, and a list of related words is created for each cluster in descending order of relevance. If the related terms in the related term group to be integrated at this time are duplicated, the total value of the score information may be used as the relevance level, the maximum value, the median value, or the average value may be used. It may be used.
図10に基づき説明すれば、G1〜G4は前記DB7のレコード、即ちある検索語の関連語グループを示している。ここではG1.G2内の各関連語は、共に検索意図A(yy/mm/dd)を持つため、スコア分布などが類似し、クラスタリングの結果、G1.G2が統合されている。 If it demonstrates based on FIG. 10, G1-G4 has shown the record of the said DB7, ie, the related word group of a certain search term. Here, G1. Since each related word in G2 has a search intention A (yy / mm / dd), the score distribution is similar, and as a result of clustering, G1. G2 is integrated.
そうすると、クラスタリングの結果、関連語グループ群がクラスタ毎に再構築されるため、前記DB7の当該レコードを更新して保存する。ここで更新された前記DB7から前記出力手段8が、ラウンドロビン形式で重複無く順に関連語を選択し、任意数の関連語を検索エンジン2のフロントエンドに返答する。
Then, as a result of clustering, the related word group group is reconstructed for each cluster, so that the record in the
このように同じ意図の関連語グループが統合されて再構築されることから、バースト検出日毎に作成した関連語グループが多くなりすぎたり、同じ意図の関連語グループが多数生じることが防止される。したがって、検索窓などの追加語の提示スペースに関連語群を有効に表示でき、検索エンジンでの表示に利用し易くなる。 Since related word groups having the same intention are integrated and reconstructed in this way, it is possible to prevent an excessive number of related word groups created for each burst detection date or a large number of related word groups having the same intention. Therefore, the related word group can be effectively displayed in the additional word presentation space such as the search window, and can be easily used for display in the search engine.
また、クラスタリングの結果、再構築される関連語グループ群には、同じ意図の関連語がまとめられていることから、関連語グループ毎に関連語を推薦語として検索窓などに表示すれば、多様な検索意図の推薦語をユーザに提示できる。このとき検索窓などのスペースが有限なことに鑑み、推薦語数が閾値(任意数)を超えている場合には関連語グループ単位(クラスタ単位)で代表の関連語を推薦語として表示してもよい。 In addition, related word groups that are reconstructed as a result of clustering contain related words with the same intention, so if you display related words as recommended words for each related word group in the search window, etc. It is possible to present recommended words intended for a search to a user. At this time, considering that the space of the search window is limited, if the number of recommended words exceeds the threshold (arbitrary number), the representative related words may be displayed as recommended words in related word group units (cluster units). Good.
(1)他の処理例1
クラスタリング手段9は、前記DB7に格納された関連語グループ単位ではなく、関連語単位でクラスタリングすることもできる。このクラスタリングには前記DB3に保存されたクリックログを用いる。
(1) Other processing example 1
The clustering means 9 can also perform clustering by related word unit instead of the related word group unit stored in the
すなわち、クラスタリング手段9は、前記DB7から各レコード(検索語と関連語グループ群)を抽出する。抽出されたレコード毎に検索語・関連語のいずれからもクリックされたクリック先の情報を前記DB3のクリックログから取得し、取得されたクリック先の情報にて関連語群をクラスタリングする。このクリック先の情報としては、例えばクリック先URLのホスト名やパス名、あるいはクリック先URLのページ情報(高出現頻度の単語など)を用いることができる。これらの情報が共通していれば同じクラスタに関連語が配置され、「score」のスコア値順に関連語のリストがクラスタ毎に作成される。
That is, the clustering means 9 extracts each record (search word and related word group group) from the
これによりクラスタリングの結果、関連語グループがクラスタ毎に再構築され、検索語と各クラスタとに前記DB7のレコードが更新され、前述と同様の効果が得られる。ここでも推薦語数が閾値(任意数)を超えている場合には、関連語グループ単位で代表の関連語を推薦語として表示できるものとする。
As a result of the clustering, the related word group is reconstructed for each cluster, the record of the
(2)他の処理例2
クラスタリング手段9は、前記DB7の関連語グループ群を関連語の類似性ではなく、各関連語グループのクリック先の情報でクラスタリングすることもできる。
(2) Other processing example 2
The clustering means 9 can also cluster the related word group groups in the
ここでは関連語グループ内の各関連語からクリックされたクリック先の情報を前記DB3のクリックログから取得する。取得されたすべてのクリック先の情報で関連語グループ群をクラスタリングしてもよく、それぞれの関連語グループを代表するクリック先の情報でクラスタリングをしてもよい。代表するクリック先としては、例えばクリック回数が上位(事前に定められた順位以上)のクリック先を選定することができる。
Here, information on the click destination clicked from each related word in the related word group is acquired from the click log of the
このときクリック先の情報としては、前記処理例1と同様にクリック先URLのホスト名やパス名、あるいはクリック先URLのページ情報(例えば高出現頻度の単語など)を用いることができ、これらの情報が共通する各関連語グループが統合され、関連度の高い順に関連語のリストがクラスタ毎に作成される。 At this time, as the click destination information, the host name or path name of the click destination URL, or page information of the click destination URL (for example, a word having a high appearance frequency) can be used as in the processing example 1. Related word groups having common information are integrated, and a list of related words is created for each cluster in descending order of the degree of relevance.
これによりクラスタリングの結果、関連語グループ群がクラスタ毎に再構築され、再構築された関連語グループ(クラスタ)に前記DB7のレコードが更新され、前述と同様の効果が得られる。ここでも推薦語数が閾値(任意数)を超えている場合には、関連語グループ単位で代表の関連語を推薦語として表示できる。
As a result of the clustering, the related word group group is reconstructed for each cluster, the record of the
≪プログラムなど≫
本発明は、前記抽出装置1.11の各手段4〜9の一部もしくは全部として、コンピュータを機能させる関連語抽出プログラムとして構成することもできる。この関連語抽出プログラムによれば、前記各ステップの一部あるいは全部をコンピュータに実行させることが可能となる。
≪Programs≫
The present invention can also be configured as a related word extraction program that causes a computer to function as a part or all of the means 4 to 9 of the extraction device 1.11. According to this related word extraction program, a part or all of the steps can be executed by a computer.
前記プログラムは、Webサイトや電子メールなどネットワークを通じて提供することができる。また、前記プログラムは、CD−ROM,DVD−ROM,CD−R,CD−RW,DVD−R,DVD−RW,MO,HDD,BD−ROM,BD−R,BD−REなどの記録媒体に記録して、保存・配布することも可能である。この記録媒体は、記録媒体駆動装置を利用して読み出され、そのプログラムコード自体が前記実施形態の処理を実現するので、該記録媒体も本発明を構成する。 The program can be provided through a network such as a website or e-mail. The program is stored in a recording medium such as a CD-ROM, DVD-ROM, CD-R, CD-RW, DVD-R, DVD-RW, MO, HDD, BD-ROM, BD-R, or BD-RE. It is also possible to record, save and distribute. This recording medium is read using a recording medium driving device, and the program code itself realizes the processing of the above embodiment, so that the recording medium also constitutes the present invention.
1.11…関連語抽出装置
2…検索エンジン
3…検索ログDB(データベース)
4…バースト検出手段(検出手段)
5…バースト情報DB(データベース)
6…関連語抽出手段
7…バースト関連語情報DB(データベース)
8…関連語出力手段
9…クラスタリング手段
1.11 ... Related
4 ... Burst detection means (detection means)
5 ... Burst information DB (database)
6 ... Related word extraction means 7 ... Burst related word information DB (database)
8 ... Related word output means 9 ... Clustering means
Claims (9)
検索ログを任意の単位で解析し、該解析単位ごとに検索回数が閾値以上の割合で増加している検索語を検出する検出手段と、
検出手段の検出した検索語に関連する関連語群を検索ログから抽出し、抽出された関連語群を前記解析単位ごとにグループ化し、該グループ群を検索語と併せてデータベースに保存する関連語抽出手段と、
検索エンジンの要求に応じてデータベースからユーザ入力の検索語の関連語を重複無く順に選択し、選択された関連語群を検索エンジンに出力する関連語出力手段と、
を備えることを特徴とする関連語抽出装置。 A related word extraction device that extracts related words related to a search word based on a search log of a search engine in advance and returns a related word of a user input search word in response to a request from the search engine,
A detection means for analyzing a search log in an arbitrary unit, and detecting a search term in which the number of searches increases at a rate equal to or greater than a threshold for each analysis unit;
A related word group related to the search word detected by the detecting means is extracted from the search log, the extracted related word group is grouped for each analysis unit, and the related word group is stored in the database together with the search word. Extraction means;
A related word output means for sequentially selecting related words of user input search words from the database in response to a request of the search engine, and outputting the selected related word group to the search engine;
A related word extraction device comprising:
検索ログを任意の単位で解析し、該解析単位ごとに検索回数が閾値以上の割合で増加している検索語を検出する検出手段と、
検出手段の検出した検索語に関連する関連語群を検索ログから抽出し、抽出された関連語群を前記解析単位ごとにグループ化し、該グループ群を検索語と併せてデータベースに保存する関連語抽出手段と、
データベースに保存されたグループ群をそれぞれのグループ内の各関連語の類似性でクラスタリングして各グループを統合し、データベースを更新するクラスタリング手段と、
検索エンジンの要求に応じてクラスタリング手段により更新されたデータベースからユーザ入力の検索語の関連語を重複無く順に選択し、選択された関連語群を検索エンジンに出力する関連語出力手段と、
を備えることを特徴とする関連語抽出装置。 A related word extraction device that extracts related words related to a search word based on a search log of a search engine in advance and returns a related word of a user input search word in response to a request from the search engine,
A detection means for analyzing a search log in an arbitrary unit, and detecting a search term in which the number of searches increases at a rate equal to or greater than a threshold for each analysis unit;
A related word group related to the search word detected by the detecting means is extracted from the search log, the extracted related word group is grouped for each analysis unit, and the related word group is stored in the database together with the search word. Extraction means;
Clustering means for clustering groups stored in the database with the similarity of each related word in each group, integrating each group, and updating the database,
Related word output means for sequentially selecting related words of user input search words from the database updated by the clustering means in response to a request from the search engine, and outputting the selected related word group to the search engine;
A related word extraction device comprising:
検索ログを任意の単位で解析し、該解析単位ごとに検索回数が閾値以上の割合で増加している検索語を検出する検出手段と、
検出手段の検出した検索語に関連する関連語群を検索ログから抽出し、抽出された関連語群を前記解析単位ごとにグループ化し、該グループ群を検索語と併せてデータベースに保存する関連語抽出手段と、
検索ログ中のクリックログからデータベース中の検索語および関連語からクリックされたクリック先の情報を抽出し、抽出されたクリック先の情報に応じてデータベース中の関連語群をクラスタリングし、データベースを更新するクラスタリング手段と、
検索エンジンの要求に応じてクラスタリング手段により更新されたデータベースからユーザ入力の検索語の関連語を重複無く順に選択し、選択された関連語群を検索エンジンに出力する関連語出力手段と、
を備えることを特徴とする関連語抽出装置。 A related word extraction device that extracts related words related to a search word based on a search log of a search engine in advance and returns a related word of a user input search word in response to a request from the search engine,
A detection means for analyzing a search log in an arbitrary unit, and detecting a search term in which the number of searches increases at a rate equal to or greater than a threshold for each analysis unit;
A related word group related to the search word detected by the detecting means is extracted from the search log, the extracted related word group is grouped for each analysis unit, and the related word group is stored in the database together with the search word. Extraction means;
Clicked information from the search term and related terms in the database is extracted from the click log in the search log, and the related terms in the database are clustered according to the extracted clicked information, and the database is updated. Clustering means to
Related word output means for sequentially selecting related words of user input search words from the database updated by the clustering means in response to a request from the search engine, and outputting the selected related word group to the search engine;
A related word extraction device comprising:
検索ログを任意の単位で解析し、該解析単位ごとに検索回数が閾値以上の割合で増加している検索語を検出する検出手段と、
検出手段の検出した検索語に関連する関連語群を検索ログから抽出し、抽出された関連語群を前記解析単位ごとにグループ化し、該グループ群を検索語と併せてデータベースに保存する関連語抽出手段と、
データベースに保存されたグループ内の各関連語からクリックされたクリック先の情報を検索ログ中のクリックログから抽出し、抽出されたクリック先の情報でグループ群をクラスタリングして統合し、データベースのレコードを更新するクラスタリング手段と、
検索エンジンの要求に応じてクラスタリング手段により更新されたデータベースからユーザ入力の検索語の関連語を重複無く順に選択し、選択された関連語群を検索エンジンに出力する関連語出力手段と、
を備えることを特徴とする関連語抽出装置。 A related word extraction device that extracts related words related to a search word based on a search log of a search engine in advance and returns a related word of a user input search word in response to a request from the search engine,
A detection means for analyzing a search log in an arbitrary unit, and detecting a search term in which the number of searches increases at a rate equal to or greater than a threshold for each analysis unit;
A related word group related to the search word detected by the detecting means is extracted from the search log, the extracted related word group is grouped for each analysis unit, and the related word group is stored in the database together with the search word. Extraction means;
Click destination information clicked from each related term in the group saved in the database is extracted from the click log in the search log, and the group of groups is clustered and integrated with the extracted click destination information, and the database record A clustering means for updating
Related word output means for sequentially selecting related words of user input search words from the database updated by the clustering means in response to a request from the search engine, and outputting the selected related word group to the search engine;
A related word extraction device comprising:
検索ログを任意の単位で解析し、該解析単位ごとに検索回数が閾値以上の割合で増加している検索語を検出する検出ステップと、
検出ステップで検出した検索語に関連する関連語群を検索ログから抽出し、抽出された関連語群を前記解析単位ごとにグループ化し、該グループ群を検索語と併せてデータベースに保存する関連語抽出ステップと、
検索エンジンの要求に応じてデータベースからユーザ入力の検索語の関連語を重複無く順に選択し、選択された関連語群を検索エンジンに出力する関連語出力ステップと、
を有することを特徴とする関連語抽出方法。 A related word extraction method executed by a device that extracts a related word related to a search word based on a search log of a search engine in advance and returns a related word of a user input search word in response to a request from the search engine,
A detection step of analyzing a search log in an arbitrary unit, and detecting a search term in which the number of searches increases at a rate equal to or greater than a threshold for each analysis unit;
A related word group extracted from the search log related word groups related to the search word detected in the detecting step, the extracted related word groups are grouped for each analysis unit, and the group words are stored in the database together with the search words. An extraction step;
A related word output step of selecting related words of a search word input by a user from a database in order according to a request of the search engine without duplication, and outputting the selected related word group to the search engine;
The related word extraction method characterized by having.
検索ログを任意の単位で解析し、該解析単位ごとに検索回数が閾値以上の割合で増加している検索語を検出する検出ステップと、
検出ステップで検出した検索語に関連する関連語群を検索ログから抽出し、抽出された関連語群を前記解析単位ごとにグループ化し、該グループ群を検索語と併せてデータベースに保存する関連語抽出ステップと、
データベースに保存されたグループ群をそれぞれのグループ内の各関連語の類似性でクラスタリングして各グループを統合し、データベースを更新するクラスタリングステップと、
検索エンジンの要求に応じてクラスタリングステップで更新されたデータベースからユーザ入力の検索語の関連語を重複無く順に選択し、選択された関連語群を検索エンジンに出力する関連語出力ステップと、
を有することを特徴とする関連語抽出方法。 A related word extraction method executed by a device that extracts a related word related to a search word based on a search log of a search engine in advance and returns a related word of a user input search word in response to a request from the search engine,
A detection step of analyzing a search log in an arbitrary unit, and detecting a search term in which the number of searches increases at a rate equal to or greater than a threshold for each analysis unit;
A related word group extracted from the search log related word groups related to the search word detected in the detecting step, the extracted related word groups are grouped for each analysis unit, and the group words are stored in the database together with the search words. An extraction step;
A clustering step of clustering groups stored in the database according to the similarity of each related word in each group, integrating each group, and updating the database;
A related word output step of sequentially selecting related words of the search word input by the user from the database updated in the clustering step according to a request of the search engine, and outputting the selected related word group to the search engine;
The related word extraction method characterized by having.
検索ログを任意の単位で解析し、該解析単位ごとに検索回数が閾値以上の割合で増加している検索語を検出する検出ステップと、
検出ステップで検出した検索語に関連する関連語群を検索ログから抽出し、抽出された関連語群を前記解析単位ごとにグループ化し、該グループ群を検索語と併せてデータベースに保存する関連語抽出ステップと、
検索ログ中のクリックログからデータベース中の検索語および関連語からクリックされたクリック先の情報を抽出し、抽出されたクリック先の情報に応じてデータベース中の関連語群をクラスタリングし、データベースを更新するクラスタリングステップと、
検索エンジンの要求に応じてクラスタリングステップで更新されたデータベースからユーザ入力の検索語の関連語を重複無く順に選択し、選択された関連語群を検索エンジンに出力する関連語出力ステップと、
を有することを特徴とする関連語抽出方法。 A related word extraction method executed by a device that extracts a related word related to a search word based on a search log of a search engine in advance and returns a related word of a user input search word in response to a request from the search engine,
A detection step of analyzing a search log in an arbitrary unit, and detecting a search term in which the number of searches increases at a rate equal to or greater than a threshold for each analysis unit;
A related word group extracted from the search log related word groups related to the search word detected in the detecting step, the extracted related word groups are grouped for each analysis unit, and the group words are stored in the database together with the search words. An extraction step;
Clicked information from the search term and related terms in the database is extracted from the click log in the search log, and the related terms in the database are clustered according to the extracted clicked information, and the database is updated. A clustering step to
A related word output step of sequentially selecting related words of the search word input by the user from the database updated in the clustering step according to a request of the search engine, and outputting the selected related word group to the search engine;
The related word extraction method characterized by having.
検索ログを任意の単位で解析し、該解析単位ごとに検索回数が閾値以上の割合で増加している検索語を検出する検出ステップと、
検出ステップで検出した検索語に関連する関連語群を検索ログから抽出し、抽出された関連語群を前記解析単位ごとにグループ化し、該グループ群を検索語と併せてデータベースに保存する関連語抽出ステップと、
データベースに保存されたグループ内の各関連語からクリックされたクリック先の情報を検索ログ中のクリックログから抽出し、抽出されたクリック先の情報でグループ群をクラスタリングして統合し、データベースのレコードを更新するクラスタリングステップと
検索エンジンの要求に応じてクラスタリングステップで更新されたデータベースからユーザ入力の検索語の関連語を重複無く順に選択し、選択された関連語群を検索エンジンに出力する関連語出力ステップと、
を有することを特徴とする関連語抽出方法。 A related word extraction method executed by a device that extracts a related word related to a search word based on a search log of a search engine in advance and returns a related word of a user input search word in response to a request from the search engine,
A detection step of analyzing a search log in an arbitrary unit, and detecting a search term in which the number of searches increases at a rate equal to or greater than a threshold for each analysis unit;
A related word group extracted from the search log related word groups related to the search word detected in the detecting step, the extracted related word groups are grouped for each analysis unit, and the group words are stored in the database together with the search words. An extraction step;
Click destination information clicked from each related term in the group saved in the database is extracted from the click log in the search log, and the group of groups is clustered and integrated with the extracted click destination information, and the database record The related words that select the related words of the user input search words in order without duplication from the database updated in the clustering step according to the request of the search engine, and output the selected related words to the search engine An output step;
The related word extraction method characterized by having.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011025579A JP5547669B2 (en) | 2011-02-09 | 2011-02-09 | Related word extraction device, related word extraction method, related word extraction program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011025579A JP5547669B2 (en) | 2011-02-09 | 2011-02-09 | Related word extraction device, related word extraction method, related word extraction program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012164242A true JP2012164242A (en) | 2012-08-30 |
JP5547669B2 JP5547669B2 (en) | 2014-07-16 |
Family
ID=46843554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011025579A Expired - Fee Related JP5547669B2 (en) | 2011-02-09 | 2011-02-09 | Related word extraction device, related word extraction method, related word extraction program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5547669B2 (en) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100813831B1 (en) * | 2002-04-12 | 2008-03-17 | 삼성에스디아이 주식회사 | Mandrel for winding electrode roll |
JP2014096003A (en) * | 2012-11-08 | 2014-05-22 | Nippon Telegr & Teleph Corp <Ntt> | Burst detection device, burst detection method, and program |
JP5687401B1 (en) * | 2014-04-23 | 2015-03-18 | 楽天株式会社 | Information providing apparatus, information providing method, program, and recording medium |
JP2019145093A (en) * | 2018-01-17 | 2019-08-29 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | Method and apparatus for generating information |
JP2019160239A (en) * | 2018-03-16 | 2019-09-19 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | Analyzer, analysis method, and computer program |
JP2020047058A (en) * | 2018-09-20 | 2020-03-26 | Zホールディングス株式会社 | Specifying apparatus, specifying method, and specifying program |
US20210319074A1 (en) * | 2020-04-13 | 2021-10-14 | Naver Corporation | Method and system for providing trending search terms |
JP2022177197A (en) * | 2020-11-04 | 2022-11-30 | データ・サイエンティスト株式会社 | Search needs evaluation program, search needs evaluation device, and search needs evaluation method, and evaluation program, evaluation device, and evaluation method |
US12079228B2 (en) | 2020-11-04 | 2024-09-03 | Datascientist Inc. | Search needs evaluation program, search needs evaluation device and search needs evaluation method, and evaluation program, evaluation device and evaluation method |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007034466A (en) * | 2005-07-25 | 2007-02-08 | Yafoo Japan Corp | Information retrieval system and information retrieval program |
-
2011
- 2011-02-09 JP JP2011025579A patent/JP5547669B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007034466A (en) * | 2005-07-25 | 2007-02-08 | Yafoo Japan Corp | Information retrieval system and information retrieval program |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100813831B1 (en) * | 2002-04-12 | 2008-03-17 | 삼성에스디아이 주식회사 | Mandrel for winding electrode roll |
JP2014096003A (en) * | 2012-11-08 | 2014-05-22 | Nippon Telegr & Teleph Corp <Ntt> | Burst detection device, burst detection method, and program |
JP5687401B1 (en) * | 2014-04-23 | 2015-03-18 | 楽天株式会社 | Information providing apparatus, information providing method, program, and recording medium |
WO2015162719A1 (en) * | 2014-04-23 | 2015-10-29 | 楽天株式会社 | Information provision device, information provision method, program, and recording medium |
JP2019145093A (en) * | 2018-01-17 | 2019-08-29 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | Method and apparatus for generating information |
JP2019160239A (en) * | 2018-03-16 | 2019-09-19 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | Analyzer, analysis method, and computer program |
JP2020047058A (en) * | 2018-09-20 | 2020-03-26 | Zホールディングス株式会社 | Specifying apparatus, specifying method, and specifying program |
US20210319074A1 (en) * | 2020-04-13 | 2021-10-14 | Naver Corporation | Method and system for providing trending search terms |
JP2022177197A (en) * | 2020-11-04 | 2022-11-30 | データ・サイエンティスト株式会社 | Search needs evaluation program, search needs evaluation device, and search needs evaluation method, and evaluation program, evaluation device, and evaluation method |
JP7262863B2 (en) | 2020-11-04 | 2023-04-24 | データ・サイエンティスト株式会社 | Search Needs Evaluation Program, Search Needs Evaluation Device and Search Needs Evaluation Method, Evaluation Program, Evaluation Device and Evaluation Method |
US12079228B2 (en) | 2020-11-04 | 2024-09-03 | Datascientist Inc. | Search needs evaluation program, search needs evaluation device and search needs evaluation method, and evaluation program, evaluation device and evaluation method |
Also Published As
Publication number | Publication date |
---|---|
JP5547669B2 (en) | 2014-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5547669B2 (en) | Related word extraction device, related word extraction method, related word extraction program | |
US9830386B2 (en) | Determining trending topics in social media | |
US8589399B1 (en) | Assigning terms of interest to an entity | |
US8972413B2 (en) | System and method for matching comment data to text data | |
US20150186790A1 (en) | Systems and Methods for Automatic Understanding of Consumer Evaluations of Product Attributes from Consumer-Generated Reviews | |
JP6538277B2 (en) | Identify query patterns and related aggregate statistics among search queries | |
US9088808B1 (en) | User interaction based related videos | |
US20160328401A1 (en) | Method and apparatus for recommending hashtags | |
US10152478B2 (en) | Apparatus, system and method for string disambiguation and entity ranking | |
US10592841B2 (en) | Automatic clustering by topic and prioritizing online feed items | |
US20100125531A1 (en) | System and method for the automated filtering of reviews for marketability | |
CN108133058B (en) | Video retrieval method | |
US9552415B2 (en) | Category classification processing device and method | |
US8838580B2 (en) | Method and system for providing keyword ranking using common affix | |
US9996529B2 (en) | Method and system for generating dynamic themes for social data | |
US9792377B2 (en) | Sentiment trent visualization relating to an event occuring in a particular geographic region | |
JP5341847B2 (en) | Search query recommendation method, search query recommendation device, search query recommendation program | |
US9607031B2 (en) | Social data filtering system, method and non-transitory computer readable storage medium of the same | |
WO2016027364A1 (en) | Topic cluster selection device, and search method | |
JP6059683B2 (en) | Local topic word extraction device, local topic word extraction method, and local topic word extraction program | |
Daoud et al. | Mining query-driven contexts for geographic and temporal search | |
JP6142617B2 (en) | Information processing apparatus, information processing method, and information processing program | |
US8752184B1 (en) | Spam detection for user-generated multimedia items based on keyword stuffing | |
Singh et al. | A clustering and opinion mining approach to socio-political analysis of the blogosphere | |
JP2013084216A (en) | Fixed phrase discrimination device and fixed phrase discrimination method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131210 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140225 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140421 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140513 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140515 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5547669 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |