JP5769648B2 - Related word acquisition apparatus and related word acquisition method - Google Patents

Related word acquisition apparatus and related word acquisition method Download PDF

Info

Publication number
JP5769648B2
JP5769648B2 JP2012035284A JP2012035284A JP5769648B2 JP 5769648 B2 JP5769648 B2 JP 5769648B2 JP 2012035284 A JP2012035284 A JP 2012035284A JP 2012035284 A JP2012035284 A JP 2012035284A JP 5769648 B2 JP5769648 B2 JP 5769648B2
Authority
JP
Japan
Prior art keywords
related word
word
acquired
acquisition
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012035284A
Other languages
Japanese (ja)
Other versions
JP2013171450A (en
Inventor
昌宏 脊戸柳
昌宏 脊戸柳
佑介 深澤
佑介 深澤
宮川 聡
聡 宮川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2012035284A priority Critical patent/JP5769648B2/en
Publication of JP2013171450A publication Critical patent/JP2013171450A/en
Application granted granted Critical
Publication of JP5769648B2 publication Critical patent/JP5769648B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、単語に関連する関連語を取得する関連語取得装置及び関連語取得方法に関する。   The present invention relates to a related word acquisition device and a related word acquisition method for acquiring related words related to a word.

従来、ある単語に関連する関連語を取得する際に、特定の範囲において対象の単語と同時に出現する単語のペアは関連度が高いと推定し、同時出現頻度の高い単語を関連語として取得する共起性解析に基づいた手法がある(例えば、下記特許文献1)。   Conventionally, when acquiring a related word related to a certain word, it is estimated that a pair of words appearing simultaneously with the target word in a specific range has a high degree of relevance, and a word having a high simultaneous appearance frequency is acquired as a related word There is a method based on co-occurrence analysis (for example, Patent Document 1 below).

特開2005−135113号公報JP 2005-135113 A

しかしながら、共起性解析に基づいた手法において、共起性解析の対象を例えばコンテンツ数の少ないコンテンツ集合とすると、十分な数の関連語を取得できず、利用価値の低い関連語を取得するおそれがある。一方、共起性解析の対象を例えばウェブ上に存在する全てのコンテンツ集合に拡大すると、十分な数の関連語は取得可能となるが、ノイズとなる単語を多数関連語として取得してしまい、結果として利用価値の低い関連語を取得するおそれがある。   However, in the method based on the co-occurrence analysis, if the target of co-occurrence analysis is a content set with a small number of contents, for example, a sufficient number of related words cannot be acquired, and related words with low utility value may be acquired. There is. On the other hand, if the target of co-occurrence analysis is expanded to all content sets existing on the web, for example, a sufficient number of related words can be acquired, but many words that become noise are acquired as related words, As a result, there is a risk of acquiring related terms with low utility value.

本発明は、上記のような課題を解決するために成されたものであり、単語に関連する利用価値の高い関連語を取得することができる関連語取得装置及び関連語取得方法を提供することを目的とする。   The present invention has been made to solve the above-described problems, and provides a related word acquisition apparatus and a related word acquisition method capable of acquiring related words having high utility value related to words. With the goal.

本発明の一側面に係る関連語取得装置は、単語が解説された記事の集合であり、ネットワークを介して参照可能なオンライン百科事典であって、記事に含まれる単語が当該オンライン百科事典内の当該単語が解説された記事を参照しているオンライン百科事典と、ネットワークを介して通信可能な関連語取得装置であって、単語を取得する単語取得手段と、単語取得手段によって取得された単語に基づいた記事を、オンライン百科事典から取得する記事取得手段と、記事取得手段によって取得された記事において、当該オンライン百科事典内の他の記事を参照している単語を、単語取得手段によって取得された単語の関連語候補として取得すると共に、単語取得手段によって取得された単語をクエリとしてウェブ検索を行い、検索結果に含まれる単語を関連語候補として取得する関連語候補取得手段と、関連語候補取得手段によって取得された関連語候補が解説された記事の当該オンライン百科事典内での参照数を取得する関連語情報取得手段と、関連語情報取得手段によって取得された、関連語候補が解説された記事の参照数に基づいて、当該関連語候補の評価値を算出する関連語評価値算出手段と、関連語評価値算出手段によって算出された関連語候補の評価値に基づいて、関連語を取得する関連語取得手段と、を備える。 The related word acquisition apparatus according to one aspect of the present invention is an online encyclopedia that is a set of articles in which words are explained and can be referred to via a network, and the words included in the articles are included in the online encyclopedia. An online encyclopedia that refers to an article in which the word is explained, and a related word acquisition device that can communicate via a network, the word acquisition means for acquiring the word, and the word acquired by the word acquisition means Article acquisition means for acquiring an article based on an online encyclopedia, and in an article acquired by the article acquisition means, a word referring to another article in the online encyclopedia is acquired by the word acquisition means It acquires as a related word candidate word, performs a web search words acquired by word obtaining means as a query, in the search results Obtaining related words information obtained and related term candidate obtaining means for obtaining that the words as related word candidates, a number of references in the related term candidate obtaining unit by within the online encyclopedia article is obtained related word candidate is commentary A related word evaluation value calculating means for calculating an evaluation value of the related word candidate based on the number of references of the article in which the related word candidate is explained, acquired by the related word information acquiring means, and a related word evaluation value Related word acquisition means for acquiring a related word based on the evaluation value of the related word candidate calculated by the calculation means.

このように、取得された単語に基づいたオンライン百科事典の記事において、他の記事を参照している単語が、取得された単語の関連語候補として取得される。そして、関連語候補が解説された記事のオンライン百科事典内での参照数に基づいて、当該関連語候補の評価値が算出され、算出された関連語候補の評価値に基づいて、最終的な関連語が取得される。このように、オンライン百科事典内における関連語候補の評価値を利用することで、取得された単語について、関連性と重要性とを考慮した利用価値の高い関連語を取得することができる。また、ウェブ検索の検索結果に含まれる単語が関連語候補として追加されるため、取得された単語について、より関連性と重要性とを考慮した利用価値の高い関連語を取得することができる。 In this way, in an online encyclopedia article based on the acquired word, a word referring to another article is acquired as a related word candidate of the acquired word. Then, the evaluation value of the related word candidate is calculated based on the number of references in the online encyclopedia of the article describing the related word candidate, and the final evaluation value of the related word candidate is calculated based on the calculated evaluation value of the related word candidate. Related terms are obtained. As described above, by using the evaluation value of the related word candidate in the online encyclopedia, it is possible to acquire a related word having a high utility value in consideration of the relevance and importance of the acquired word. Moreover, since the word contained in the search result of a web search is added as a related word candidate, the related word with the high utility value which considered the relevance and importance more about the acquired word can be acquired.

また、本発明の別の一側面に係る関連語取得装置は、単語が解説された記事の集合であり、ネットワークを介して参照可能なオンライン百科事典であって、記事に含まれる単語が当該オンライン百科事典内の当該単語が解説された記事を参照しているオンライン百科事典と、ネットワークを介して通信可能な関連語取得装置であって、コンテンツ集合に含まれるコンテンツから単語を抽出する単語抽出手段と、単語を取得する単語取得手段と、単語取得手段によって取得された単語に基づいた記事を、オンライン百科事典から取得する記事取得手段と、記事取得手段によって取得された記事において、当該オンライン百科事典内の他の記事を参照している単語を、単語取得手段によって取得された単語の関連語候補として取得する関連語候補取得手段と、関連語候補取得手段によって取得された関連語候補が解説された記事の当該オンライン百科事典内での参照数を取得する関連語情報取得手段と、関連語情報取得手段によって取得された、関連語候補が解説された記事の参照数に基づいて、当該関連語候補の評価値を算出する関連語評価値算出手段と、関連語評価値算出手段によって算出された関連語候補の評価値に基づいて、関連語を取得する関連語取得手段と、を備え、関連語情報取得手段は、更に、コンテンツ集合内の、関連語候補取得手段によって取得された関連語候補を含むコンテンツの数を取得し、関連語評価値算出手段は、更に、関連語情報取得手段によって取得されたコンテンツの数及び関連語候補のコンテンツ集合内での出現回数に基づいて、関連語候補の評価値を算出する。A related word acquisition apparatus according to another aspect of the present invention is an online encyclopedia that is a collection of articles in which words are explained, and can be referred to via a network. An online encyclopedia that refers to an article that describes the word in the encyclopedia and a related word acquisition device that can communicate via a network, and extracts a word from content included in the content set A word acquisition means for acquiring a word, an article acquisition means for acquiring an article based on the word acquired by the word acquisition means from an online encyclopedia, and an article acquired by the article acquisition means in the online encyclopedia Related word candidates that acquire words referring to other articles as related word candidates of words acquired by the word acquisition means Obtained means, related word information obtaining means for obtaining the number of references in the online encyclopedia of the article describing the related word candidate obtained by the related word candidate obtaining means, and obtained by the related word information obtaining means The related word evaluation value calculating means for calculating the evaluation value of the related word candidate based on the number of references of the article in which the related word candidate is explained, and the related word candidate evaluation value calculated by the related word evaluation value calculating means Related word acquisition means for acquiring a related word based on the information, and the related word information acquisition means further calculates the number of contents including the related word candidate acquired by the related word candidate acquisition means in the content set. The related word evaluation value calculating means further acquires the evaluation of the related word candidates based on the number of contents acquired by the related word information acquiring means and the number of appearances of the related word candidates in the content set. To calculate the value.
かかる場合、コンテンツ集合に含まれるコンテンツの単語について、当該コンテンツ集合内における関連語候補の評価値を更に利用することができるため、より関連性と重要性とを考慮した利用価値の高い関連語を取得することができる。In such a case, since the evaluation value of the related word candidate in the content set can be further used for the word of the content included in the content set, the related word having a higher use value in consideration of the relevance and importance is selected. Can be acquired.

また、関連語評価値算出手段は、更に、当該オンライン百科事典内の全記事数に基づいて、関連語候補の評価値を算出してもよい。かかる場合、オンライン百科事典内の全記事数、すなわち母集団の情報も考慮された関連語候補の評価値が算出されるため、より関連性と重要性とを考慮した利用価値の高い関連語を取得することができる。   The related word evaluation value calculation means may further calculate an evaluation value of a related word candidate based on the total number of articles in the online encyclopedia. In such a case, the number of all articles in the online encyclopedia, that is, the evaluation value of the related word candidate that also considers the population information is calculated. Can be acquired.

ところで、関連語取得装置に係る発明は、方法の発明として捉えることができ、同様の作用・効果を奏する。方法の発明は、以下のように記述することができる。   By the way, the invention which concerns on a related word acquisition apparatus can be grasped as invention of a method, and has the same operation and effect. The invention of the method can be described as follows.

本発明の一側面に係る関連語取得方法は、単語が解説された記事の集合であり、ネットワークを介して参照可能なオンライン百科事典であって、記事に含まれる単語が当該オンライン百科事典内の当該単語が解説された記事を参照しているオンライン百科事典と、ネットワークを介して通信可能な関連語取得装置による関連語取得方法であって、単語を取得する単語取得ステップと、単語取得ステップにおいて取得された単語に基づいた記事を、オンライン百科事典から取得する記事取得ステップと、記事取得ステップにおいて取得された記事において、当該オンライン百科事典内の他の記事を参照している単語を、単語取得ステップにおいて取得された単語の関連語候補として取得すると共に、単語取得ステップにおいて取得された単語をクエリとしてウェブ検索を行い、検索結果に含まれる単語を関連語候補として取得する関連語候補取得ステップと、関連語候補取得ステップにおいて取得された関連語候補が解説された記事の当該オンライン百科事典内での参照数を取得する関連語情報取得ステップと、関連語情報取得ステップにおいて取得された、関連語候補が解説された記事の参照数に基づいて、当該関連語候補の評価値を算出する関連語評価値算出ステップと、関連語評価値算出ステップにおいて算出された関連語候補の評価値に基づいて、関連語を取得する関連語取得ステップと、を含む
また、本発明の別の一側面に係る関連語取得方法は、単語が解説された記事の集合であり、ネットワークを介して参照可能なオンライン百科事典であって、記事に含まれる単語が当該オンライン百科事典内の当該単語が解説された記事を参照しているオンライン百科事典と、ネットワークを介して通信可能な関連語取得装置による関連語取得方法であって、コンテンツ集合に含まれるコンテンツから単語を抽出する単語抽出ステップと、単語を取得する単語取得ステップと、単語取得ステップにおいて取得された単語に基づいた記事を、オンライン百科事典から取得する記事取得ステップと、記事取得ステップにおいて取得された記事において、当該オンライン百科事典内の他の記事を参照している単語を、単語取得ステップにおいて取得された単語の関連語候補として取得する関連語候補取得ステップと、関連語候補取得ステップにおいて取得された関連語候補が解説された記事の当該オンライン百科事典内での参照数を取得する第1関連語情報取得ステップと、第1関連語情報取得ステップにおいて取得された、関連語候補が解説された記事の参照数に基づいて、当該関連語候補の評価値を算出する第1関連語評価値算出ステップと、コンテンツ集合内の、関連語候補取得ステップにおいて取得された関連語候補を含むコンテンツの数を取得する第2関連語情報取得ステップと、第2関連語情報取得ステップにおいて取得されたコンテンツの数及び関連語候補のコンテンツ集合内での出現回数に基づいて、関連語候補の評価値を算出する第2関連語評価値算出ステップと、第1関連語評価値算出ステップ及び第2関連語評価値算出ステップにおいて算出された関連語候補の評価値に基づいて、関連語を取得する関連語取得ステップと、を含む。
A related word acquisition method according to one aspect of the present invention is a set of articles in which words are explained and is an online encyclopedia that can be referred to via a network, and the words included in the article are stored in the online encyclopedia. An online encyclopedia that refers to an article in which the word is explained, and a related word acquisition method by a related word acquisition device that can communicate via a network, in a word acquisition step for acquiring a word and a word acquisition step Article acquisition step for acquiring articles based on the acquired words from the online encyclopedia, and words acquired in the article acquisition step for words referring to other articles in the online encyclopedia acquires as a related word candidates of the retrieved word in step, the word acquired in word acquiring step Search the web as area, search result word contained in the related word candidate acquisition step of acquiring a related word candidates, the articles obtained related word candidate is commentary in related term candidate obtaining step the online encyclopedia the encyclopedia Related word information acquisition step for acquiring the number of references in, and a related word candidate calculation value obtained in the related word information acquisition step based on the reference number of articles in which related word candidates are explained comprising a word evaluation value calculating step, based on the evaluation value of the relevant word candidate calculated in the related-word evaluation value calculation step, and the related word acquiring the related word, the.
A related word acquisition method according to another aspect of the present invention is a set of articles in which words are explained, and is an online encyclopedia that can be referred to via a network. An online encyclopedia that refers to an article that describes the word in the encyclopedia and a related word acquisition method by a related word acquisition device that can communicate via a network. In the article extraction step, the word acquisition step of acquiring the word, the article acquisition step of acquiring the article based on the word acquired in the word acquisition step from the online encyclopedia, and the article acquired in the article acquisition step Words that refer to other articles in the online encyclopedia are acquired in the word acquisition step. A related word candidate acquisition step for acquiring a related word candidate for the selected word, and a first related word for acquiring the number of references in the online encyclopedia of the article describing the related word candidate acquired in the related word candidate acquisition step An information acquisition step and a first related word evaluation value calculation step of calculating an evaluation value of the related word candidate based on the number of references of the article in which the related word candidate is explained, acquired in the first related word information acquisition step And a second related word information acquisition step for acquiring the number of contents including the related word candidates acquired in the related word candidate acquisition step in the content set, and the number of contents acquired in the second related word information acquisition step And a second related word evaluation value calculating step for calculating an evaluation value of the related word candidate based on the number of appearances of the related word candidate in the content set, Based on the evaluation value of the relevant word candidate calculated in collocation evaluation value calculation step and the second related word evaluation value calculating step includes a related word acquiring related terms.

本発明によれば、単語に関連する利用価値の高い関連語を取得することができる。   According to the present invention, it is possible to acquire a related word having a high utility value related to a word.

本発明の第1実施形態に係る関連語取得システムの構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of the related word acquisition system which concerns on 1st Embodiment of this invention. 本発明の第1実施形態及び第2実施形態に係る関連語取得装置のハードウェア構成の一例を示す図である。It is a figure which shows an example of the hardware constitutions of the related word acquisition apparatus which concerns on 1st Embodiment and 2nd Embodiment of this invention. 本発明の第1実施形態における関連語管理テーブルのテーブルデータの一例を示す図である。It is a figure which shows an example of the table data of the related word management table in 1st Embodiment of this invention. 本発明の第1実施形態に係る関連語取得装置における関連語取得方法の処理動作の一例を示すフローチャートである。It is a flowchart which shows an example of the processing operation of the related word acquisition method in the related word acquisition apparatus which concerns on 1st Embodiment of this invention. 本発明の第2実施形態に係る関連語取得システムの構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of the related word acquisition system which concerns on 2nd Embodiment of this invention. 本発明の第2実施形態における関連語管理テーブルのテーブルデータの一例を示す図である。It is a figure which shows an example of the table data of the related word management table in 2nd Embodiment of this invention. 本発明の第2実施形態に係る関連語取得装置における関連語取得方法の処理動作の一例を示すフローチャートである。It is a flowchart which shows an example of the processing operation of the related word acquisition method in the related word acquisition apparatus which concerns on 2nd Embodiment of this invention.

以下、添付図面を参照しながら本発明の実施形態を詳細に説明する。なお、図面の説明において同一又は同等の要素には同一の符号を付し、重複する説明を省略する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the description of the drawings, the same or equivalent elements are denoted by the same reference numerals, and redundant description is omitted.

(関連語取得システム5の構成)
図1は、本発明の一実施形態に係る関連語取得システム5の構成を示す図である。関連語取得システム5は、図1に示す通り、関連語取得装置1と、オンライン百科事典2と、ウェブ検索システム3とを含んで構成される。関連語取得装置1とオンライン百科事典2とウェブ検索システム3とは、ネットワーク4を介して互いに通信可能である。
(Configuration of related word acquisition system 5)
FIG. 1 is a diagram showing a configuration of a related word acquisition system 5 according to an embodiment of the present invention. As shown in FIG. 1, the related word acquisition system 5 includes a related word acquisition device 1, an online encyclopedia 2, and a web search system 3. The related word acquisition device 1, the online encyclopedia 2, and the web search system 3 can communicate with each other via the network 4.

関連語取得装置1は、ある単語に関する関連語を評価値に基づいて取得するPC(Personal Computer)である。関連語取得装置1は、PCに限定されず、ノートPC、サーバ、移動機端末などであってもよい。関連語取得装置1のその他の機能構成については後述する。   The related word acquisition device 1 is a PC (Personal Computer) that acquires related words related to a certain word based on an evaluation value. The related word acquisition device 1 is not limited to a PC, and may be a notebook PC, a server, a mobile terminal, or the like. Other functional configurations of the related word acquisition device 1 will be described later.

オンライン百科事典2は、単語が解説された記事の集合であり、ネットワークを介して参照可能なオンライン百科事典である。さらに、オンライン百科事典2は、記事に含まれる単語がオンライン百科事典2内の当該単語が解説された記事を参照している。ここで、単語が記事を参照しているとは、例えば、単語から記事に対してHTML(HyperText Markup Language)などにおけるリンクが張られていて、単語から記事に辿ることができる(アクセス可能である)ことを示す。オンライン百科事典2の具体例として、Wikipedia(登録商標)が挙げられる。   The online encyclopedia 2 is a collection of articles in which words are explained, and is an online encyclopedia that can be referred to via a network. Further, in the online encyclopedia 2, the words included in the articles refer to articles in which the words in the online encyclopedia 2 are explained. Here, a word refers to an article, for example, a link in HTML (HyperText Markup Language) or the like is provided from the word to the article, and the article can be traced from the word (accessible). ) A specific example of the online encyclopedia 2 is Wikipedia (registered trademark).

ウェブ検索システム3は、入力されたクエリ(キーワード)に応じたウェブページを検索し、検索されたウェブページへの参照(リンク)を検索結果として表示するシステムである。ウェブ検索システム3は、検索結果において、検索されたウェブページへの参照と共に、当該ウェブページの内容を説明する文章であるスニペットを表示する。スニペットは、一般的に、HTMLで記述されたウェブページにおいてmetaタグ内に記述された内容(メタデータ)であるが、これに限るものではない。例えば、スニペットは、ウェブページ内に含まれる、入力されたクエリに対応する単語周辺の文章であってもよい。   The web search system 3 is a system that searches a web page corresponding to an input query (keyword) and displays a reference (link) to the searched web page as a search result. In the search result, the web search system 3 displays a snippet that is a sentence explaining the content of the web page along with a reference to the searched web page. A snippet is generally content (metadata) described in a meta tag in a web page described in HTML, but is not limited to this. For example, the snippet may be a sentence around a word corresponding to the input query included in the web page.

ネットワーク4は、インターネット網や移動体通信網などにより構成されているが、これらに限定されない。   The network 4 is configured by the Internet network, a mobile communication network, or the like, but is not limited thereto.

<第1実施形態>
図1に示す通り、第1実施形態に係る関連語取得装置1は、関連語取得対象単語管理テーブル101、単語取得部102(単語取得手段)、記事取得部103(記事取得手段)、関連語候補取得部104(関連語候補取得手段)、関連語情報取得部105(関連語情報取得手段)、関連語評価値算出部106(関連語評価値算出手段)、関連語管理テーブル107、及び関連語取得部108(関連語取得手段)を含んで構成される。
<First Embodiment>
As shown in FIG. 1, the related word acquisition apparatus 1 according to the first embodiment includes a related word acquisition target word management table 101, a word acquisition unit 102 (word acquisition unit), an article acquisition unit 103 (article acquisition unit), a related word. Candidate acquisition unit 104 (related word candidate acquisition unit), related word information acquisition unit 105 (related word information acquisition unit), related word evaluation value calculation unit 106 (related word evaluation value calculation unit), related word management table 107, and related A word acquisition unit 108 (related word acquisition means) is included.

図2は、関連語取得装置1のハードウェア構成の一例を示す。関連語取得装置1は、ハードウェア構成として、CPU50と、RAM51と、ROM52と、キーボードやテンキーなどから成る入力部53と、外部との通信を行う通信部54と、補助記憶装置55と、ディスプレイなどから成る出力部56と、を備える。前述した関連語取得装置1の各機能ブロックの機能は、RAM51などにプログラムやデータなどを読み込ませ、CPU50の制御の下でプログラムを実行することで実現される。   FIG. 2 shows an example of the hardware configuration of the related word acquisition device 1. The related word acquisition device 1 includes, as a hardware configuration, a CPU 50, a RAM 51, a ROM 52, an input unit 53 including a keyboard and a numeric keypad, a communication unit 54 that communicates with the outside, an auxiliary storage device 55, and a display And an output unit 56 composed of the like. The function of each functional block of the related word acquisition device 1 described above is realized by causing the RAM 51 or the like to read a program or data and executing the program under the control of the CPU 50.

以下、図1に示す関連語取得装置1の各機能ブロックについて説明する。   Hereinafter, each functional block of the related word acquisition apparatus 1 illustrated in FIG. 1 will be described.

関連語取得対象単語管理テーブル101は、関連語取得の対象となる単語を登録した単語リスト(関連語取得対象単語リスト)を管理する。   The related word acquisition target word management table 101 manages a word list (related word acquisition target word list) in which words to be related word acquisition targets are registered.

単語取得部102は、関連語取得対象である単語を取得する。具体的には、単語取得部102は、関連語取得対象単語管理テーブル101によって管理されている単語リストから、関連語取得対象の単語を取得する。なお、単語取得部102による単語の取得方法は、単語リストからの取得に限るものではない。また、単語取得部102は、ユーザ、自装置、及び他の装置から直接単語を取得してもよい。   The word acquisition unit 102 acquires a word that is a related word acquisition target. Specifically, the word acquisition unit 102 acquires a word as a related word acquisition target from the word list managed by the related word acquisition target word management table 101. The word acquisition method by the word acquisition unit 102 is not limited to acquisition from the word list. Moreover, the word acquisition part 102 may acquire a word directly from a user, an own apparatus, and another apparatus.

記事取得部103は、単語取得部102によって取得された単語に基づいた記事を、オンライン百科事典2から取得する。具体的には、記事取得部103は、単語取得部102によって取得された単語が解説された記事を、ネットワーク4を介して、オンライン百科事典2から取得する。例えば、単語取得部102によって取得された単語が、単語「自動車」であった場合、記事取得部103は、単語「自動車」を解説する記事をオンライン百科事典2から取得する。   The article acquisition unit 103 acquires an article based on the word acquired by the word acquisition unit 102 from the online encyclopedia 2. Specifically, the article acquisition unit 103 acquires an article describing the word acquired by the word acquisition unit 102 from the online encyclopedia 2 via the network 4. For example, when the word acquired by the word acquisition unit 102 is the word “car”, the article acquisition unit 103 acquires an article explaining the word “car” from the online encyclopedia 2.

関連語候補取得部104は、記事取得部103によって取得された記事において、オンライン百科事典2内の他の記事を参照している単語を、単語取得部102によって取得された単語の関連語候補として取得する。具体的には、関連語候補取得部104は、記事取得部103によって取得された記事において、オンライン百科事典2内の他の記事に対してリンクが張られている単語を関連語候補として取得する。例えば、記事取得部103によって取得された記事が、単語「自動車」を解説する記事であり、当該記事に単語「エンジン」及び単語「タイヤ」が含まれ、単語「エンジン」には「エンジン」を解説する記事へのリンクが張られ、単語「タイヤ」には「タイヤ」を解説する記事へのリンクが張られていた場合、関連語候補取得部104は、単語「エンジン」及び単語「タイヤ」を単語「自動車」の関連語候補として取得する。   The related word candidate acquisition unit 104 uses a word referring to another article in the online encyclopedia 2 as an associated word candidate of the word acquired by the word acquisition unit 102 in the article acquired by the article acquisition unit 103. get. Specifically, the related word candidate acquisition unit 104 acquires words related to other articles in the online encyclopedia 2 as related word candidates in the article acquired by the article acquisition unit 103. . For example, the article acquired by the article acquisition unit 103 is an article that explains the word “car”, and the word “engine” and the word “tire” are included in the article, and the word “engine” includes “engine”. When the link to the article to be explained is set and the word “tire” is linked to the article to explain “tire”, the related word candidate acquisition unit 104 sets the word “engine” and the word “tire”. As a related word candidate of the word “car”.

関連語情報取得部105は、関連語候補取得部104によって取得された関連語候補が解説された記事の当該オンライン百科事典2内での参照数を取得する。具体的には、関連語情報取得部105は、関連語候補取得部104によって取得された関連語候補が解説された記事の当該オンライン百科事典2内での被リンク数を取得する。例えば、関連語候補取得部104によって取得された関連語候補が「エンジン」であり、関連語候補「エンジン」を解説する記事に対して、オンライン百科事典2内の5つの記事からリンクされていた場合、関連語情報取得部105は、被リンク数である5を取得する。   The related word information acquisition unit 105 acquires the number of references in the online encyclopedia 2 of articles describing the related word candidates acquired by the related word candidate acquisition unit 104. Specifically, the related word information acquisition unit 105 acquires the number of linked pages in the online encyclopedia 2 of the article describing the related word candidate acquired by the related word candidate acquisition unit 104. For example, the related word candidate acquired by the related word candidate acquiring unit 104 is “engine”, and the articles explaining the related word candidate “engine” are linked from five articles in the online encyclopedia 2. In this case, the related word information acquisition unit 105 acquires 5, which is the number of linked links.

関連語評価値算出部106は、関連語情報取得部105によって取得された、関連語候補が解説された記事の参照数に基づいて、(オンライン百科事典2内における)当該関連語候補の評価値を算出する。関連語評価値算出部106は、更に、当該オンライン百科事典2内の全記事数に基づいて、(オンライン百科事典2内における)関連語候補の評価値を算出してもよい。具体的には、関連語候補iの被リンク数をb、オンライン百科事典2の全記事数をNとすると、関連語評価値算出部106は、オンライン百科事典2内における関連語候補の評価値Gを以下の式(1)により算出する。

Figure 0005769648
The related word evaluation value calculation unit 106 evaluates the evaluation value of the related word candidate (in the online encyclopedia 2) based on the number of references of the article in which the related word candidate is explained, acquired by the related word information acquisition unit 105. Is calculated. The related word evaluation value calculation unit 106 may further calculate the evaluation value of the related word candidate (in the online encyclopedia 2) based on the total number of articles in the online encyclopedia 2. Specifically, if the number of linked links of the related word candidate i is b i and the total number of articles in the online encyclopedia 2 is N, the related word evaluation value calculation unit 106 evaluates the related word candidates in the online encyclopedia 2. The value G i is calculated by the following equation (1).
Figure 0005769648

関連語管理テーブル107は、関連語評価値算出部106によって算出された関連語候補の評価値を格納する。図3は、関連語管理テーブル107のテーブルデータの一例を示す図である。図3に示す通り、関連語管理テーブル107では、関連語候補「エンジン」に対して、オンライン百科事典2内における評価値Gが「5.8」として登録され、同様に、関連語候補「タイヤ」に対して、評価値Gが「3.3」として登録されている。 The related word management table 107 stores the evaluation value of the related word candidate calculated by the related word evaluation value calculation unit 106. FIG. 3 is a diagram illustrating an example of table data of the related word management table 107. As shown in FIG. 3, in the related word management table 107, the evaluation value G i in the online encyclopedia 2 is registered as “5.8” for the related word candidate “engine”. The evaluation value G i is registered as “3.3” for “tire”.

関連語取得部108は、関連語評価値算出部106によって算出された関連語候補の評価値に基づいて、関連語を取得する。具体的には、関連語取得部108は、関連語管理テーブル107に格納された関連語候補について、当該関連語候補のオンライン百科事典2内における評価値Gが予め設定された閾値以上の関連語候補を関連語として決定し、取得する。関連語取得部108は、取得した関連語を出力部56を介して出力してもよいし、通信部54を介して外部の装置に送信してもよい。 The related word acquisition unit 108 acquires a related word based on the evaluation value of the related word candidate calculated by the related word evaluation value calculation unit 106. Specifically, the related word acquisition unit 108, the related word candidates stored in the associated word management table 107, associated evaluation value G i in the related word candidate online encyclopedia in 2 is equal to or greater than a preset threshold value Word candidates are determined as related words and acquired. The related word acquisition unit 108 may output the acquired related word via the output unit 56, or may transmit the acquired related word to an external device via the communication unit 54.

<第1実施形態における関連語取得方法>
続いて、第1実施形態に係る関連語取得装置1における関連語取得方法の処理の手順を、図4を参照して説明する。まず、単語取得部102は、関連語取得対象単語管理テーブル101によって管理された単語リストから単語を取得する(ステップS1、単語取得ステップ)。次に、記事取得部103は、S1において取得された単語に基づいた記事を取得する(ステップS2、記事取得ステップ)。次に、関連語候補取得部104は、S2において取得された記事において、オンライン百科事典2内の他の記事を参照している単語を、S1において取得された単語の関連語候補として取得する(ステップS3、関連語候補取得ステップ)。
<Related Word Acquisition Method in First Embodiment>
Next, the processing procedure of the related word acquisition method in the related word acquisition apparatus 1 according to the first embodiment will be described with reference to FIG. First, the word acquisition unit 102 acquires words from the word list managed by the related word acquisition target word management table 101 (step S1, word acquisition step). Next, the article acquisition unit 103 acquires an article based on the word acquired in S1 (step S2, article acquisition step). Next, the related word candidate acquisition unit 104 acquires a word that refers to another article in the online encyclopedia 2 in the article acquired in S2 as a related word candidate of the word acquired in S1 ( Step S3, related word candidate acquisition step).

次に、関連語情報取得部105は、S3において取得された関連語候補が解説された記事のオンライン百科事典2内での参照数を取得し(関連語情報取得ステップ)、関連語評価値算出部106は、取得した参照数に基づいてオンライン百科事典2内における関連語候補の評価値を算出する(ステップS4、関連語評価値算出ステップ)。次に、関連語取得部108は、S4において算出された関連語候補の評価値に基づいて、関連語を取得する(ステップS5、関連語取得ステップ)。次に、関連語取得装置1は、単語リストに未取得の単語があるか判定し(ステップS6)、あると判定した場合はS1に戻り、ないと判定した場合は処理を終了する。   Next, the related word information acquisition unit 105 acquires the number of references in the online encyclopedia 2 of the article describing the related word candidate acquired in S3 (related word information acquisition step), and calculates a related word evaluation value. The unit 106 calculates the evaluation value of the related word candidate in the online encyclopedia 2 based on the acquired number of references (step S4, related word evaluation value calculating step). Next, the related word acquisition unit 108 acquires a related word based on the evaluation value of the related word candidate calculated in S4 (step S5, related word acquisition step). Next, the related word acquisition device 1 determines whether there is an unacquired word in the word list (step S6). If it is determined that there is an unacquired word, the process returns to S1, and if it is determined that there is not, the process ends.

<第1実施形態の変形例>
続いて、第1実施形態に係る関連語取得装置1の変形例について説明する。変形例において、関連語候補取得部104は、更に、単語取得部102によって取得された単語をクエリとしてウェブ検索を行い、検索結果に含まれる単語を関連語候補として取得する。具体的には、関連語候補取得部104は、単語取得部102によって取得された単語をクエリとしてウェブ検索を行い、検索結果であるスニペットから単語を抽出し、関連語候補として取得する。
<Modification of First Embodiment>
Then, the modification of the related word acquisition apparatus 1 which concerns on 1st Embodiment is demonstrated. In the modification, the related word candidate acquisition unit 104 further performs a web search using the word acquired by the word acquisition unit 102 as a query, and acquires a word included in the search result as a related word candidate. Specifically, the related word candidate acquisition unit 104 performs a web search using the word acquired by the word acquisition unit 102 as a query, extracts a word from a snippet as a search result, and acquires it as a related word candidate.

また、変形例において、関連語評価値算出部106は、更に、関連語候補取得部104によって取得された、スニペットから抽出された関連語候補の、当該スニペット内における出現頻度に基づいて、(オンライン百科事典2内における)関連語候補の評価値を算出してもよい。具体的には、関連語候補iの被リンク数をb、ウェブ検索の検索結果であるスニペットから得られた関連語候補iの当該スニペット内における出現頻度をc、オンライン百科事典2の全記事数をNとすると、関連語評価値算出部106は、オンライン百科事典2内における関連語候補の評価値Gを以下の式(2)により算出する。

Figure 0005769648
In the modification, the related word evaluation value calculation unit 106 further (online) based on the appearance frequency of the related word candidate extracted from the snippet acquired by the related word candidate acquisition unit 104 in the snippet. You may calculate the evaluation value of a related word candidate (in the encyclopedia 2). Specifically, the number of linked links of the related word candidate i is b i , the appearance frequency of the related word candidate i obtained from the snippet as a search result of the web search is c, and all articles of the online encyclopedia 2 If the number is N, related word evaluation value calculation unit 106 calculates the equation (2) below the evaluation value G i of the associated word candidates in an online encyclopedia 2.
Figure 0005769648

<第1実施形態の作用効果>
以下、第1実施形態の作用効果について説明する。
<Operational effects of the first embodiment>
Hereinafter, the effect of the first embodiment will be described.

第1実施形態に係る関連語取得装置1によれば、取得された単語に基づいたオンライン百科事典2の記事において、他の記事を参照している単語が、取得された単語の関連語候補として取得される。そして、関連語候補が解説された記事のオンライン百科事典2内での参照数に基づいて、当該関連語候補の評価値が算出され、算出された関連語候補の評価値に基づいて、最終的な関連語が取得される。このように、オンライン百科事典2内における関連語候補の評価値を利用することで、取得された単語について、関連性と重要性とを考慮した利用価値の高い関連語を取得することができる。   According to the related word acquisition device 1 according to the first embodiment, in an article of the online encyclopedia 2 based on the acquired word, a word referring to another article is a related word candidate of the acquired word. To be acquired. Then, the evaluation value of the related word candidate is calculated based on the number of references in the online encyclopedia 2 of the article describing the related word candidate, and finally, based on the calculated evaluation value of the related word candidate. Related words are acquired. As described above, by using the evaluation value of the related word candidate in the online encyclopedia 2, it is possible to acquire a related word having a high utility value in consideration of the relevance and importance of the acquired word.

また、関連語候補取得部104は、更に、単語取得部102によって取得された単語をクエリとしてウェブ検索を行い、検索結果に含まれる単語を関連語候補として取得してもよい。かかる場合、ウェブ検索の検索結果に含まれる単語が関連語候補として追加されるため、取得された単語について、より関連性と重要性とを考慮した利用価値の高い関連語を取得することができる。   Further, the related word candidate acquisition unit 104 may further perform a web search using the word acquired by the word acquisition unit 102 as a query, and acquire a word included in the search result as a related word candidate. In such a case, since the word included in the search result of the web search is added as a related word candidate, it is possible to acquire a related word having a higher utility value considering the relevance and importance of the acquired word. .

また、関連語評価値算出部106は、更に、当該オンライン百科事典2内の全記事数に基づいて、関連語候補の評価値を算出してもよい。かかる場合、オンライン百科事典2内の全記事数、すなわち母集団の情報も考慮された関連語候補の評価値が算出されるため、より関連性と重要性とを考慮した利用価値の高い関連語を取得することができる。   Further, the related word evaluation value calculation unit 106 may further calculate the evaluation value of the related word candidate based on the total number of articles in the online encyclopedia 2. In such a case, since the evaluation value of the related word candidate is calculated in consideration of the total number of articles in the online encyclopedia 2, that is, the population information, the related word having higher use value considering the relevance and importance. Can be obtained.

<第2実施形態>
続いて、第2実施形態に係る関連語取得装置1について説明する。第2実施形態においては、関連語取得装置1は、ユーザが興味を持ちそうなコンテンツをレコメンド(推薦)するレコメンド機能(不図示)を搭載していることを前提とする。一般的に、レコメンド機能は、ユーザごとに各コンテンツに対してレコメンド用の評価値(レコメンド評価値)を算出し、算出したレコメンド評価値に基づいて、レコメンドするコンテンツ(レコメンド対象コンテンツ)を選択し、ユーザに表示する。関連語取得装置1が搭載するレコメンド機能は、レコメンド対象コンテンツを算出する際にレコメンド評価値を用いるような既存技術であれば、どのような技術を用いて実現してもよい。
Second Embodiment
Then, the related word acquisition apparatus 1 which concerns on 2nd Embodiment is demonstrated. In the second embodiment, it is assumed that the related word acquisition apparatus 1 is equipped with a recommendation function (not shown) that recommends (recommends) content that the user is likely to be interested in. In general, the recommendation function calculates an evaluation value for recommendation (recommendation evaluation value) for each content for each user, and selects a content to be recommended (recommended content) based on the calculated recommendation evaluation value. To the user. The recommendation function installed in the related word acquisition device 1 may be realized by any technique as long as it is an existing technique that uses a recommendation evaluation value when calculating a recommendation target content.

以下、図5に示す第2実施形態に係る関連語取得装置1の各機能ブロックについて第1実施形態と異なる点を説明する。なお、第1実施形態と同一の構成要素、同一の処理内容のステップについては、第1実施形態で用いた符号を記載した。   Hereinafter, differences between the functional blocks of the related word acquisition apparatus 1 according to the second embodiment shown in FIG. 5 and the first embodiment will be described. In addition, the code | symbol used in 1st Embodiment was described about the step of the same component as 1st Embodiment and the same processing content.

レコメンド対象コンテンツ管理テーブル501は、レコメンド対象コンテンツの集合(コンテンツ集合)を管理するテーブルである。   The recommendation target content management table 501 is a table for managing a set of recommendation target contents (content set).

単語抽出部502(単語抽出手段)は、レコメンド対象コンテンツ管理テーブル501によって管理されているレコメンド対象コンテンツのうち、ユーザが選択したコンテンツのデータ、または当該コンテンツのメタデータを形態素解析することにより取得された単語を抽出し、関連語取得対象単語管理テーブル101に格納する。   The word extraction unit 502 (word extraction means) is acquired by performing morphological analysis on the data of the content selected by the user or the metadata of the content among the recommended content managed by the recommended content management table 501. The extracted words are extracted and stored in the related word acquisition target word management table 101.

関連語情報取得部505(関連語情報取得手段)は、関連語情報取得部105の機能に加えて、更に、コンテンツ集合内の、関連語候補取得部104によって取得された関連語候補を含むコンテンツの数を取得する。具体的には、関連語情報取得部505は、レコメンド対象コンテンツ管理テーブル501によって管理されているレコメンド対象コンテンツの集合について、関連語候補取得部104によって取得された関連語候補をコンテンツ内容として、またはコンテンツのメタデータとして含むレコメンド対象コンテンツの数を取得する。   In addition to the function of the related word information acquisition unit 105, the related word information acquisition unit 505 (related word information acquisition unit) further includes content including a related word candidate acquired by the related word candidate acquisition unit 104 in the content set. Get the number of. Specifically, the related word information acquisition unit 505 uses the related word candidate acquired by the related word candidate acquisition unit 104 as the content content for the set of recommendation target content managed by the recommendation target content management table 501, or The number of recommended content to be included as content metadata is acquired.

関連語評価値算出部506(関連語評価値算出手段)は、関連語評価値算出部106の機能に加えて、更に、関連語情報取得部505によって取得されたコンテンツの数に基づいて、(レコメンド対象コンテンツの集合内における)関連語候補の評価値を算出する。具体的には、関連語候補iのレコメンド対象コンテンツの集合全体のメタデータ内における出現回数をn、全コンテンツ数をX、関連語候補iを含むレコメンド対象コンテンツ数をxとすると、関連語評価値算出部506は、レコメンド対象コンテンツの集合内における関連語候補の評価値Fを以下の式(3)により算出する。

Figure 0005769648
The related word evaluation value calculation unit 506 (related word evaluation value calculation means), in addition to the function of the related word evaluation value calculation unit 106, further, based on the number of contents acquired by the related word information acquisition unit 505 ( The evaluation value of the related word candidate (within the recommended target content set) is calculated. Specifically, if the number of appearances of the related word candidate i in the metadata of the entire set of recommended target content is n i , the total number of contents is X, and the number of recommended target content including the related word candidate i is x i , The word evaluation value calculation unit 506 calculates the evaluation value F i of the related word candidate in the recommendation target content set by the following equation (3).
Figure 0005769648

関連語評価値算出部506は、オンライン百科事典2内における関連語候補の評価値Gと、レコメンド対象コンテンツの集合内における関連語候補の評価値Fとに基づいて、関連語候補の総合評価値Hを算出する。具体的には、関連語評価値算出部506は、関連語候補の総合評価値Hを、以下の式(4)により算出する。

Figure 0005769648
The related word evaluation value calculation unit 506 calculates the total of related word candidates based on the evaluation value G i of the related word candidate in the online encyclopedia 2 and the evaluation value F i of the related word candidate in the recommended target content set. An evaluation value H i is calculated. Specifically, the related word evaluation value calculation unit 506 calculates the comprehensive evaluation value H i of the related word candidate by the following equation (4).
Figure 0005769648

式(4)において、係数α及びβは、任意に決定することができる。なお、関連語評価値算出部506は、関連語候補の総合評価値Hを、以下の式(5)により算出してもよい。

Figure 0005769648
In equation (4), the coefficients α and β can be arbitrarily determined. Note that the related word evaluation value calculation unit 506 may calculate the comprehensive evaluation value H i of the related word candidate using the following equation (5).
Figure 0005769648

関連語管理テーブル507は、関連語候補と、関連語評価値算出部506によって算出されたオンライン百科事典2内における当該関連語候補の評価値Gと、レコメンド対象コンテンツの集合内における当該関連語候補の評価値Fと、当該関連語候補の総合評価値Hとを、図6に示すデータテーブル例のように、互いに関連付けて格納する。 Related word management table 507, a related word candidate, the evaluation value G i of the related word candidate in the online encyclopedia 2 calculated by the related word evaluation value calculation unit 506, the associated word in the set of recommendation target content The candidate evaluation value F i and the overall evaluation value H i of the related word candidate are stored in association with each other as in the data table example shown in FIG.

関連語取得部508(関連語取得手段)は、関連語管理テーブル507に格納された関連語候補の総合評価値Hについて、関連語候補の評価値が予め設定された閾値以上の関連語候補を関連語として決定し、取得する。 The related word acquisition unit 508 (related word acquisition means) relates to the related word candidate for which the evaluation value of the related word candidate is equal to or higher than a preset threshold value for the comprehensive evaluation value H i of the related word candidate stored in the related word management table 507. Is determined as a related term and acquired.

<第2実施形態における関連語取得方法>
続いて、第2実施形態に係る関連語取得装置1における関連語取得方法の処理の手順を、図7を参照して説明する。まず、単語抽出部502は、レコメンド対象コンテンツ管理テーブル501によって管理されているレコメンド対象コンテンツのうち、ユーザが選択したコンテンツのデータ、または当該コンテンツのメタデータを形態素解析することにより取得された単語を抽出し、抽出した単語を単語リストとして関連語取得対象単語管理テーブル101に格納する(ステップS0)。S0に続くS1〜S4及びS6は第1実施形態と同様のため説明を省略する。S4の次に、関連語情報取得部505は、レコメンド対象コンテンツ管理テーブル501によって管理されているレコメンド対象コンテンツの集合内の、S3において取得された関連語候補を含むコンテンツの数を取得し(関連語情報取得ステップ)、関連語評価値算出部506は、取得したコンテンツの数に基づいて、レコメンド対象コンテンツの集合内における関連語候補の評価値を算出する(ステップS55、関連語評価値算出ステップ)。次に、関連語取得部108は、S4及びS55において算出された関連語候補の評価値に基づいて、関連語を取得する(ステップS56、関連語取得ステップ)。
<Related Word Acquisition Method in Second Embodiment>
Next, the processing procedure of the related word acquisition method in the related word acquisition device 1 according to the second embodiment will be described with reference to FIG. First, the word extraction unit 502 selects a word acquired by performing morphological analysis on the data of the content selected by the user or the metadata of the content among the recommended content managed by the recommended content management table 501. The extracted words are stored in the related word acquisition target word management table 101 as a word list (step S0). Since S1 to S4 and S6 following S0 are the same as those in the first embodiment, the description thereof is omitted. Next to S4, the related word information acquisition unit 505 acquires the number of contents including the related word candidate acquired in S3 in the set of recommended target contents managed by the recommended target content management table 501 (related Word information acquisition step), the related word evaluation value calculation unit 506 calculates the evaluation value of the related word candidate in the set of recommended content based on the number of acquired contents (step S55, related word evaluation value calculation step) ). Next, the related word acquisition unit 108 acquires a related word based on the evaluation value of the related word candidate calculated in S4 and S55 (step S56, related word acquisition step).

<第2実施形態の作用効果>
以下、第2実施形態の作用効果について説明する。
<Effects of Second Embodiment>
Hereinafter, the function and effect of the second embodiment will be described.

第2実施形態に係る関連語取得装置1によれば、単語抽出部502は、コンテンツ集合に含まれるコンテンツから単語を抽出し、関連語情報取得部505は、更に、コンテンツ集合内の、関連語候補取得部104によって取得された関連語候補を含むコンテンツの数を取得し、関連語評価値算出部506は、更に、関連語情報取得部505によって取得されたコンテンツの数及び関連語候補のコンテンツ集合内での出現回数に基づいて、関連語候補の評価値を算出してもよい。かかる場合、コンテンツ集合に含まれるコンテンツの単語について、当該コンテンツ集合内における関連語候補の評価値を更に利用することができるため、より関連性と重要性とを考慮した利用価値の高い関連語を取得することができる。すなわち、コンテンツ集合に適した関連語を取得することができる。   According to the related word acquisition device 1 according to the second embodiment, the word extraction unit 502 extracts words from the content included in the content set, and the related word information acquisition unit 505 further includes related words in the content set. The number of contents including the related word candidate acquired by the candidate acquisition unit 104 is acquired, and the related word evaluation value calculation unit 506 further includes the number of contents acquired by the related word information acquisition unit 505 and the content of the related word candidate. The evaluation value of the related word candidate may be calculated based on the number of appearances in the set. In such a case, since the evaluation value of the related word candidate in the content set can be further used for the word of the content included in the content set, the related word having a higher use value in consideration of the relevance and importance is selected. Can be acquired. That is, a related term suitable for the content set can be acquired.

1…関連語取得装置、2…オンライン百科事典、3…ウェブ検索システム、4…ネットワーク、5…関連語取得システム、101…関連語取得対象単語管理テーブル、102…単語取得部、103…記事取得部、104…関連語候補取得部、105…関連語情報取得部、106…関連語評価値算出部、107…関連語管理テーブル、108…関連語取得部、501…レコメンド対象コンテンツ管理テーブル、502…単語抽出部、505…関連語情報取得部、506…関連語評価値算出部、507…関連語管理テーブル、508…関連語取得部。   DESCRIPTION OF SYMBOLS 1 ... Related word acquisition apparatus, 2 ... Online encyclopedia, 3 ... Web search system, 4 ... Network, 5 ... Related word acquisition system, 101 ... Related word acquisition object word management table, 102 ... Word acquisition part, 103 ... Article acquisition , 104 ... related word candidate acquisition unit, 105 ... related word information acquisition unit, 106 ... related word evaluation value calculation unit, 107 ... related word management table, 108 ... related word acquisition unit, 501 ... recommended target content management table, 502 ... Word extraction unit, 505 ... Related word information acquisition unit, 506 ... Related word evaluation value calculation unit, 507 ... Related word management table, 508 ... Related word acquisition unit.

Claims (5)

単語が解説された記事の集合であり、ネットワークを介して参照可能なオンライン百科事典であって、記事に含まれる単語が当該オンライン百科事典内の当該単語が解説された記事を参照しているオンライン百科事典と、ネットワークを介して通信可能な関連語取得装置であって、
単語を取得する単語取得手段と、
前記単語取得手段によって取得された単語に基づいた記事を、前記オンライン百科事典から取得する記事取得手段と、
前記記事取得手段によって取得された記事において、当該オンライン百科事典内の他の記事を参照している単語を、前記単語取得手段によって取得された単語の関連語候補として取得すると共に、前記単語取得手段によって取得された単語をクエリとしてウェブ検索を行い、検索結果に含まれる単語を関連語候補として取得する関連語候補取得手段と、
前記関連語候補取得手段によって取得された関連語候補が解説された記事の当該オンライン百科事典内での参照数を取得する関連語情報取得手段と、
前記関連語情報取得手段によって取得された、関連語候補が解説された記事の参照数に基づいて、当該関連語候補の評価値を算出する関連語評価値算出手段と、
前記関連語評価値算出手段によって算出された関連語候補の評価値に基づいて、関連語を取得する関連語取得手段と、
を備える関連語取得装置。
Online encyclopedia that is a collection of articles in which words are explained, and can be referred to via the network, and the words included in the articles refer to articles in which the words in the online encyclopedia are explained A related word acquisition device that can communicate with an encyclopedia via a network,
Word acquisition means for acquiring a word;
Article acquisition means for acquiring an article based on the word acquired by the word acquisition means from the online encyclopedia;
In the article acquired by the article acquisition means, a word referring to another article in the online encyclopedia is acquired as a related word candidate of the word acquired by the word acquisition means, and the word acquisition means A related word candidate acquisition unit that performs a web search using the word acquired by the query as a query, and acquires a word included in the search result as a related word candidate;
Related word information acquiring means for acquiring the number of references in the online encyclopedia of articles describing related word candidates acquired by the related word candidate acquiring means;
A related word evaluation value calculating means for calculating an evaluation value of the related word candidate based on the number of references of the article in which the related word candidate is explained, acquired by the related word information acquiring means;
Based on the evaluation value of the related word candidate calculated by the related word evaluation value calculating unit, the related word acquiring unit that acquires the related word;
A related word acquisition device comprising:
単語が解説された記事の集合であり、ネットワークを介して参照可能なオンライン百科事典であって、記事に含まれる単語が当該オンライン百科事典内の当該単語が解説された記事を参照しているオンライン百科事典と、ネットワークを介して通信可能な関連語取得装置であって、  Online encyclopedia that is a collection of articles in which words are explained, and can be referred to via the network, and the words included in the articles refer to articles in which the words in the online encyclopedia are explained A related word acquisition device that can communicate with an encyclopedia via a network,
コンテンツ集合に含まれるコンテンツから単語を抽出する単語抽出手段と、A word extracting means for extracting words from content included in the content set;
単語を取得する単語取得手段と、Word acquisition means for acquiring a word;
前記単語取得手段によって取得された単語に基づいた記事を、前記オンライン百科事典から取得する記事取得手段と、Article acquisition means for acquiring an article based on the word acquired by the word acquisition means from the online encyclopedia;
前記記事取得手段によって取得された記事において、当該オンライン百科事典内の他の記事を参照している単語を、前記単語取得手段によって取得された単語の関連語候補として取得する関連語候補取得手段と、In the article acquired by the article acquisition means, related word candidate acquisition means for acquiring a word referring to another article in the online encyclopedia as a related word candidate of the word acquired by the word acquisition means; ,
前記関連語候補取得手段によって取得された関連語候補が解説された記事の当該オンライン百科事典内での参照数を取得する関連語情報取得手段と、Related word information acquiring means for acquiring the number of references in the online encyclopedia of articles describing related word candidates acquired by the related word candidate acquiring means;
前記関連語情報取得手段によって取得された、関連語候補が解説された記事の参照数に基づいて、当該関連語候補の評価値を算出する関連語評価値算出手段と、A related word evaluation value calculating means for calculating an evaluation value of the related word candidate based on the number of references of the article in which the related word candidate is explained, acquired by the related word information acquiring means;
前記関連語評価値算出手段によって算出された関連語候補の評価値に基づいて、関連語を取得する関連語取得手段と、Based on the evaluation value of the related word candidate calculated by the related word evaluation value calculating unit, the related word acquiring unit that acquires the related word;
を備え、With
前記関連語情報取得手段は、更に、前記コンテンツ集合内の、前記関連語候補取得手段によって取得された関連語候補を含むコンテンツの数を取得し、The related word information acquisition means further acquires the number of contents including the related word candidates acquired by the related word candidate acquisition means in the content set,
前記関連語評価値算出手段は、更に、前記関連語情報取得手段によって取得されたコンテンツの数及び前記関連語候補の前記コンテンツ集合内での出現回数に基づいて、関連語候補の評価値を算出する、The related word evaluation value calculation means further calculates an evaluation value of the related word candidate based on the number of contents acquired by the related word information acquisition means and the number of appearances of the related word candidate in the content set. To
関連語取得装置。Related word acquisition device.
前記関連語評価値算出手段は、更に、当該オンライン百科事典内の全記事数に基づいて、関連語候補の評価値を算出することを特徴とする請求項1又は2に記載の関連語取得装置。   The related word acquisition apparatus according to claim 1, wherein the related word evaluation value calculation unit further calculates an evaluation value of a related word candidate based on the total number of articles in the online encyclopedia. . 単語が解説された記事の集合であり、ネットワークを介して参照可能なオンライン百科事典であって、記事に含まれる単語が当該オンライン百科事典内の当該単語が解説された記事を参照しているオンライン百科事典と、ネットワークを介して通信可能な関連語取得装置による関連語取得方法であって、
単語を取得する単語取得ステップと、
前記単語取得ステップにおいて取得された単語に基づいた記事を、前記オンライン百科事典から取得する記事取得ステップと、
前記記事取得ステップにおいて取得された記事において、当該オンライン百科事典内の他の記事を参照している単語を、前記単語取得ステップにおいて取得された単語の関連語候補として取得すると共に、前記単語取得ステップにおいて取得された単語をクエリとしてウェブ検索を行い、検索結果に含まれる単語を関連語候補として取得する関連語候補取得ステップと、
前記関連語候補取得ステップにおいて取得された関連語候補が解説された記事の当該オンライン百科事典内での参照数を取得する関連語情報取得ステップと、
前記関連語情報取得ステップにおいて取得された、関連語候補が解説された記事の参照数に基づいて、当該関連語候補の評価値を算出する関連語評価値算出ステップと、
前記関連語評価値算出ステップにおいて算出された関連語候補の評価値に基づいて、関連語を取得する関連語取得ステップと、
含む関連語取得方法。
Online encyclopedia that is a collection of articles in which words are explained, and can be referred to via the network, and the words included in the articles refer to articles in which the words in the online encyclopedia are explained A related word acquisition method using an encyclopedia and a related word acquisition device capable of communicating via a network,
A word acquisition step for acquiring a word;
An article acquisition step of acquiring an article based on the word acquired in the word acquisition step from the online encyclopedia;
In the article acquired in the article acquisition step, a word referring to another article in the online encyclopedia is acquired as a related word candidate of the word acquired in the word acquisition step, and the word acquisition step A related word candidate acquisition step of performing a web search using the word acquired in the query as a query and acquiring a word included in the search result as a related word candidate;
A related word information acquisition step of acquiring the number of references in the online encyclopedia of the article describing the related word candidate acquired in the related word candidate acquisition step;
A related word evaluation value calculating step of calculating an evaluation value of the related word candidate based on the number of references of the article in which the related word candidate is explained, acquired in the related word information acquiring step;
A related word acquisition step of acquiring a related word based on the evaluation value of the related word candidate calculated in the related word evaluation value calculating step;
Related word acquisition method including
単語が解説された記事の集合であり、ネットワークを介して参照可能なオンライン百科事典であって、記事に含まれる単語が当該オンライン百科事典内の当該単語が解説された記事を参照しているオンライン百科事典と、ネットワークを介して通信可能な関連語取得装置による関連語取得方法であって、  Online encyclopedia that is a collection of articles in which words are explained, and can be referred to via the network, and the words included in the articles refer to articles in which the words in the online encyclopedia are explained A related word acquisition method using an encyclopedia and a related word acquisition device capable of communicating via a network,
コンテンツ集合に含まれるコンテンツから単語を抽出する単語抽出ステップと、A word extraction step of extracting words from content included in the content set;
単語を取得する単語取得ステップと、A word acquisition step for acquiring a word;
前記単語取得ステップにおいて取得された単語に基づいた記事を、前記オンライン百科事典から取得する記事取得ステップと、An article acquisition step of acquiring an article based on the word acquired in the word acquisition step from the online encyclopedia;
前記記事取得ステップにおいて取得された記事において、当該オンライン百科事典内の他の記事を参照している単語を、前記単語取得ステップにおいて取得された単語の関連語候補として取得する関連語候補取得ステップと、In the article acquired in the article acquisition step, a related word candidate acquisition step of acquiring a word referring to another article in the online encyclopedia as a related word candidate of the word acquired in the word acquisition step; ,
前記関連語候補取得ステップにおいて取得された関連語候補が解説された記事の当該オンライン百科事典内での参照数を取得する第1関連語情報取得ステップと、A first related word information acquisition step of acquiring the number of references in the online encyclopedia of the article describing the related word candidate acquired in the related word candidate acquisition step;
前記第1関連語情報取得ステップにおいて取得された、関連語候補が解説された記事の参照数に基づいて、当該関連語候補の評価値を算出する第1関連語評価値算出ステップと、A first related word evaluation value calculating step for calculating an evaluation value of the related word candidate based on the number of references of the article in which the related word candidate is explained, acquired in the first related word information acquiring step;
前記コンテンツ集合内の、前記関連語候補取得ステップにおいて取得された関連語候補を含むコンテンツの数を取得する第2関連語情報取得ステップと、  A second related word information acquisition step of acquiring the number of contents including the related word candidates acquired in the related word candidate acquisition step in the content set;
前記第2関連語情報取得ステップにおいて取得されたコンテンツの数及び前記関連語候補の前記コンテンツ集合内での出現回数に基づいて、関連語候補の評価値を算出する第2関連語評価値算出ステップと、  A second related word evaluation value calculating step of calculating an evaluation value of the related word candidate based on the number of contents acquired in the second related word information acquiring step and the number of appearances of the related word candidate in the content set. When,
前記第1関連語評価値算出ステップ及び前記第2関連語評価値算出ステップにおいて算出された関連語候補の評価値に基づいて、関連語を取得する関連語取得ステップと、A related word acquisition step of acquiring a related word based on an evaluation value of a related word candidate calculated in the first related word evaluation value calculating step and the second related word evaluation value calculating step;
を含む関連語取得方法。Related word acquisition method including
JP2012035284A 2012-02-21 2012-02-21 Related word acquisition apparatus and related word acquisition method Active JP5769648B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012035284A JP5769648B2 (en) 2012-02-21 2012-02-21 Related word acquisition apparatus and related word acquisition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012035284A JP5769648B2 (en) 2012-02-21 2012-02-21 Related word acquisition apparatus and related word acquisition method

Publications (2)

Publication Number Publication Date
JP2013171450A JP2013171450A (en) 2013-09-02
JP5769648B2 true JP5769648B2 (en) 2015-08-26

Family

ID=49265333

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012035284A Active JP5769648B2 (en) 2012-02-21 2012-02-21 Related word acquisition apparatus and related word acquisition method

Country Status (1)

Country Link
JP (1) JP5769648B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7183077B2 (en) * 2019-02-28 2022-12-05 ヤフー株式会社 Information processing device, information processing method, and program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4917061B2 (en) * 2007-12-18 2012-04-18 日本電信電話株式会社 Characteristic keyword detection apparatus, characteristic keyword detection method, program, and recording medium

Also Published As

Publication number Publication date
JP2013171450A (en) 2013-09-02

Similar Documents

Publication Publication Date Title
JP5340751B2 (en) Document processing apparatus and document processing method
CN104850554B (en) Searching method and system
CN109190049B (en) Keyword recommendation method, system, electronic device and computer readable medium
US9817908B2 (en) Systems and methods for news event organization
US9785704B2 (en) Extracting query dimensions from search results
KR20160025007A (en) Automatic generation of headlines
KR100859918B1 (en) Method and apparatus for evaluating searched contents by using user feedback and providing search result by utilizing evaluation result
WO2012096388A1 (en) Unexpectedness determination system, unexpectedness determination method, and program
US9542474B2 (en) Forensic system, forensic method, and forensic program
JP2014203442A (en) Recommendation information generation device and recommendation information generation method
Carey et al. HTML web content extraction using paragraph tags
JP2017134787A (en) Device, program, and method for analyzing topic evaluation in multiple areas
US11269896B2 (en) System and method for automatic difficulty level estimation
JP2011221979A (en) Retrieval support system, retrieval support method and retrieval support program
US20170235835A1 (en) Information identification and extraction
JP2014085862A (en) Prediction server, program, and method for predicting number of future comments on prediction target content
Bu et al. An FAR-SW based approach for webpage information extraction
JP7388256B2 (en) Information processing device and information processing method
JP2009015796A (en) Apparatus and method for extracting multiplex topics in text, program, and recording medium
JP2008262506A (en) Information extraction system, information extraction method, and information extraction program
JP2015121858A (en) Data processing device and data processing method
JP5769648B2 (en) Related word acquisition apparatus and related word acquisition method
US20210103702A1 (en) System and method for link prediction with semantic analysis
JP2006155275A (en) Information extraction method and information extraction device
JP2007148741A (en) Web search support server

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140811

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150303

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150602

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150623

R150 Certificate of patent or registration of utility model

Ref document number: 5769648

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250