JP2013117866A - Keyword place name pair extraction device, method and program - Google Patents
Keyword place name pair extraction device, method and program Download PDFInfo
- Publication number
- JP2013117866A JP2013117866A JP2011265119A JP2011265119A JP2013117866A JP 2013117866 A JP2013117866 A JP 2013117866A JP 2011265119 A JP2011265119 A JP 2011265119A JP 2011265119 A JP2011265119 A JP 2011265119A JP 2013117866 A JP2013117866 A JP 2013117866A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- place name
- keyword
- occurrence
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、キーワード地名ペア抽出装置及び方法及びプログラムに係り、特に、指定したキーワードと地名のペアを抽出するためのキーワード地名ペア抽出装置及び方法及びプログラムに関する。例えば、キーワードとして「みかん」が入力された場合、当該キーワードに対応する「愛媛」を抽出し、当該地名の地図を表示する技術に適用するためのキーワード地名ペア抽出装置及び方法及びプログラムに関する。 The present invention relates to a keyword place name pair extraction apparatus, method, and program, and more particularly, to a keyword place name pair extraction apparatus, method, and program for extracting a specified keyword and place name pair. For example, the present invention relates to a keyword place name pair extraction apparatus, method, and program for applying to a technique of extracting “Ehime” corresponding to the keyword and displaying a map of the place name when “Mikan” is input as a keyword.
さまざまな事物をキーワードとして指定した際、そのキーワードに関連する場所を知ることができれば便利である。たとえば、「餃子」をキーワードとして指定したときに、「餃子」に関連する場所として餃子で有名な「宇都宮」の地図が表示され、宇都宮で餃子を提供する店舗の情報が地図上に表示されれば有益である。そのためには、キーワードとそれに関連する地名のペアをデータとして保持しておく必要がある。 When various things are specified as keywords, it is convenient to know the location related to the keywords. For example, when “Gyoza” is specified as a keyword, a map of “Utsunomiya” famous for gyoza is displayed as a place related to “Gyoza”, and information on stores providing dumplings in Utsunomiya is displayed on the map. Is beneficial. In order to do so, it is necessary to store a pair of a keyword and its associated place name as data.
キーワードと地名のペアを抽出する技術としては、名前と職業などのような何らかの関係を持つペアを抽出する手法が提案されている。少量のペアを用意し、ペアからのパターンの抽出とパターンからペアの抽出を繰り返すことにより、大量のペアを抽出する。この手法をキーワードと地名に対して適用することにより、キーワードと地名からなる少量のペアから大量のペアを抽出することが可能である(例えば、非特許文献1参照)。 As a technique for extracting a pair of a keyword and a place name, a technique for extracting a pair having a certain relationship such as a name and an occupation has been proposed. A small number of pairs are prepared, and a large number of pairs are extracted by repeating extraction of patterns from the pairs and extraction of pairs from the patterns. By applying this method to keywords and place names, it is possible to extract a large number of pairs from a small amount of pairs consisting of keywords and place names (see, for example, Non-Patent Document 1).
しかしながら、非特許文献1の手法では、キーワードと地名との共起頻度が高くないとペアとして抽出されないという問題があった。そのため、共起頻度の算出に用いるコーパスの規模が小さいような場合には、共起頻度が低くなり、ペアを抽出できなかった。この問題を解決するために、地名の表す地域に属する部分的な地域(例えば、市に属する区など)での共起頻度を足し合わせてその地名での共起頻度とすることが考えられる。しかし、一部の部分的な地域での共起頻度が高いような場合には、足し合わせることによりペアを抽出する上でのノイズとなり、不適切なペアが抽出されてしまうという問題があった。
However, the method of Non-Patent
本発明は上記の問題点に鑑みてなされたものであって、キーワードが地名の表す地域に広く分布しているかどうかを判定し、広く分布していれば部分的な地域での共起頻度を足し合わせてその地名とキーワードとの共起頻度とすることにより、共起頻度が低いことによりペアが抽出できないことを回避するとともに、足し合わせてもノイズとならずに適切にキーワードと地名のペアを抽出することを可能としたキーワード地名ペア抽出装置及び方法及びプログラムを提供することを目的とする。 The present invention has been made in view of the above problems, and determines whether or not a keyword is widely distributed in an area indicated by a place name. If the keyword is widely distributed, the co-occurrence frequency in a partial area is determined. Adding together the place name and keyword co-occurrence frequency avoids the inability to extract a pair due to low co-occurrence frequency, and also adds the keyword and place name pair appropriately without adding noise. It is an object of the present invention to provide a keyword place name pair extraction apparatus, method, and program capable of extracting a name.
上記の課題を解決するため、本発明(請求項1)は、入力されたキーワードと地名のペアの集合に対応するキーワードと地名のペアを抽出するキーワード地名ペア抽出装置であって、
地名と該地名の表す地域の属する部分的な地域の集合を格納した地理データベースと、
部分的な地域毎キーワードの分布の文書全体における全体頻度及び該地域内の複数のキーワードとの共起頻度を格納した頻度データベースと、
入力された地名に基づいて前記地理データベースを参照して、該地名に属する部分的な地域の集合を取得する部分地域取得手段と、
前記部分的な地域集合の各地域に基づいて前記頻度データベースを参照して、該地域に対応する全体頻度及び該地域のキーワードとの共起頻度を取得する頻度取得手段と、
前記全体頻度と前記キーワードとの共起頻度に基づいて、該キーワードが地名を表す地域に広く分布していると判断された場合は、部分的な地域の共起頻度を足し合わせて前記頻度データベースを更新する頻度統合手段と、
前記入力されたキーワードと地名のペアの集合に基づいて、前記頻度データベースを検索し、キーワードと地名のペアを抽出する地名ペア抽出手段と、を有する。
In order to solve the above problems, the present invention (Claim 1) is a keyword place name pair extraction device that extracts a pair of a keyword and a place name corresponding to a set of input keyword and place name pairs,
A geographic database storing a place name and a set of partial areas to which the area represented by the place name belongs;
A frequency database storing the overall frequency in the entire document of partial keyword distribution and the frequency of co-occurrence with a plurality of keywords in the region;
A partial area acquisition means for referring to the geographic database based on the input place name and acquiring a set of partial areas belonging to the place name;
Referring to the frequency database based on each region of the partial region set, a frequency acquisition means for acquiring a total frequency corresponding to the region and a co-occurrence frequency with the keyword of the region;
Based on the co-occurrence frequency of the overall frequency and the keyword, if it is determined that the keyword is widely distributed in the area representing the place name, the frequency database is obtained by adding the co-occurrence frequencies of partial areas. Frequency integration means to update
And a place name pair extraction unit that searches the frequency database based on the set of the input keyword and place name pairs and extracts a keyword and place name pair.
また、本発明(請求項2)は、前記頻度データベースの前記全体頻度から得られる分布とキーワードとの共起頻度から得られる分布との間の類似性を表す分布類似性スコアを算出する分布類似性スコア算出手段を有し、
前記頻度統合手段において、
前記分布類似性スコアに基づいて頻度を統合するかを判定し、統合する場合には、地域毎の共起頻度を統合して、前記頻度データベースを更新する。
Further, the present invention (Claim 2) is configured to calculate a distribution similarity score representing a similarity between a distribution obtained from the overall frequency of the frequency database and a distribution obtained from a co-occurrence frequency of keywords. Having sex score calculation means,
In the frequency integration means,
It is determined whether to integrate frequencies based on the distribution similarity score, and in the case of integration, the co-occurrence frequencies for each region are integrated and the frequency database is updated.
また、本発明(請求項3)は、前記分布類似性スコア算出手段において、
分布が類似しているほど値が小さくなるKLダイバージェンスを用い、
前記頻度統合手段において、
前記分布類似性スコアが所定の値より小さい場合に前記地域毎の共起頻度を統合すると判定する。
In the present invention (Claim 3), in the distribution similarity score calculation means,
Using KL divergence, the value becomes smaller as the distribution is similar,
In the frequency integration means,
When the distribution similarity score is smaller than a predetermined value, it is determined that the co-occurrence frequencies for each region are integrated.
本発明によれば、キーワードが地名の表す地域に広く分布しているかどうかを判定し、広く分布していれば部分的な地域での共起頻度を足し合わせてその地名とキーワードとの共起頻度とすることにより、共起頻度が低いことによりペアが抽出できないことを回避するとともに、足し合わせてもノイズとならずに適切にペアを抽出することができる。 According to the present invention, it is determined whether or not a keyword is widely distributed in the area represented by the place name. If the keyword is widely distributed, the co-occurrence of the place name and the keyword is added by adding the co-occurrence frequencies in the partial areas. By setting the frequency, it is possible to avoid that the pair cannot be extracted due to the low co-occurrence frequency, and it is possible to appropriately extract the pair without adding noise even if they are added together.
以下図面と共に、本発明の実施の形態を説明する。 Embodiments of the present invention will be described below with reference to the drawings.
図1は、本発明の実施例であるキーワード地名ペア抽出装置100の構成を示す図である。図1に示すキーワード地名ペア抽出装置100は、部分地域取得部1と、頻度取得部2と、分布同一性スコア算出部3と、頻度統合部4と、キーワード地名ペア抽出部5と、地理データベース6と、頻度データベース7を有する。
FIG. 1 is a diagram showing a configuration of a keyword place name pair extraction device 100 according to an embodiment of the present invention. A keyword place name pair extraction device 100 shown in FIG. 1 includes a partial
図2に、地理データベース6の例を示す。同図に示すように、地理データベース6は、地名と当該地名の表す地域の属する部分的な地域の集合を格納する。
FIG. 2 shows an example of the
また、図3に頻度データベース7の例を示す。同図に示す頻度データベース7は、部分的な地域毎に、当該地域が文書中に存在する全体頻度及び地域に関係するキーワード毎の共起頻度を格納する。キーワード毎の共起頻度は、キーワードKの数分(n)格納されているものとする。
FIG. 3 shows an example of the
部分地域取得部1は、地名に対し、地理データベース6を参照して、その地名の表す地域の属する部分的な地域の集合を取得する。
The partial
頻度取得部2は、部分的な地域のそれぞれに関して、頻度データベース7を参照して、全体頻度およびキーワードとの共起頻度を取得する。
The
分布類似性スコア算出部3は、全体頻度から得られる分布とキーワードとの共起頻度から得られる分布との間の類似性を表す分布類似性スコアを算出する。
The distribution similarity
頻度統合部4は、分布類似性スコアをもとに頻度を統合すべきかどうかを判定し、統合すべきと判定された場合には地域ごとの共起頻度を統合して入力された地名の共起頻度とし、頻度データベース7を更新する。
The
キーワード地名ペア抽出部5は、検索時に検索対象のキーワードと地名のペアの集合が入力されると、頻度データベース7を参照して入力されたペア以外のキーワードと地名のペアを抽出する。
The keyword place name
次に、キーワード地名ペア抽出装置100の動作をより具体的に説明する。 Next, the operation of the keyword place name pair extraction apparatus 100 will be described more specifically.
図4は、本発明の一実施の形態における動作のフローチャートである。 FIG. 4 is a flowchart of the operation in one embodiment of the present invention.
以下の処理において、ステップ1〜5は、頻度データベース更新のための処理であり、ステップ6は、入力されたキーワードと地名の集合に対する検索処理である。
In the following process,
ステップ1) 部分地域取得部1では、地名集合が入力されると、各地名に対し、地理データベース6を参照して、その地名の表す地域の属する部分的な地域の集合を取得する。ここでは、地名として「A」が入力されたものとする。地理データベース6の例を図2に示す。「A」に対応する部分的な地域として、「a1,a2,a3,a4,a5,a6」が得られる。部分的な地域の取得方法はこれに限るものではなく、地名「A」を表す住所と前方一致する住所を持つ地域を部分的な地域としたりしても構わない。
Step 1) When a set of place names is input, the partial
ステップ2) 頻度取得部2では、部分的な地域のそれぞれに関して、頻度データベース7を参照して、当該部分的な地域が文書中に存在する全体頻度および当該地域に関連するキーワードとの共起頻度を取得する。図3の例では、部分地域「a1」に関して、頻度データベース7から全体頻度およびキーワードK1との共起頻度を取得すると、それぞれ8000、8となる。ここでは、利用する全体頻度として文書頻度を用いる。利用する全体頻度は、各地域における分布が反映されているものであればどのようなものでもよく、その地域における対象とするキーワードの頻度の合計などを用いたりしても構わない。
Step 2) The
上記の全体頻度とは、キーワード毎の頻度に対して扱うデータ全体に関する頻度を指す。本実施の形態では、文書頻度を用いるため、扱っている文書中で各地域に関する文書(例えば、その地名を本文に含む文書)が1000文書あった場合には、全体頻度は1000となる。 The above-mentioned overall frequency refers to the frequency related to the entire data to be handled with respect to the frequency for each keyword. In the present embodiment, since the document frequency is used, if there are 1000 documents related to each region (for example, a document including the place name in the text) among the documents being handled, the total frequency is 1000.
ステップ3) 分布類似性スコア算出部3では、全体頻度から得られる分布とキーワードとの共起頻度から得られる分布との間の類似性を表す分布類似性スコアを算出する。ここでは、全体頻度から得られる分布Pとキーワードとの共起頻度から得られる分布Qとの間の類似性を表す分布類似性スコアとして、KLダイバージェンスを用いる。
Step 3) The distribution similarity
図5〜図7にKLダイバージェンスに基づいて判定した分布類似性スコアの例を示す。キーワードK1に関してKLダイバージェンスを算出する。頻度データベース7の全体頻度から文書の分布P(a1)を算出すると、
P(a1)=8000/(8000+4000+2000+1000+500+500)
となる。a2などについても同様である。キーワードの分布Q(a1)を算出すると、
Q(a1)=8/(8+6+4+4+4+4)
となる。a2などについても同様である。これにより、P(a1)log(P(a1)/Q(a1))=0.314となる。a2などについても同様である。最終的な分布類似性スコアは0.224となる。キーワードK2,K3についても同様に分布類似性スコアを算出すると、それぞれ0.520、0.044となる。
5 to 7 show examples of distribution similarity scores determined based on KL divergence. KL divergence is calculated for the keyword K1. When the document distribution P (a1) is calculated from the overall frequency of the
P (a1) = 8000 / (8000 + 4000 + 2000 + 1000 + 500 + 500)
It becomes. The same applies to a2. When the keyword distribution Q (a1) is calculated,
Q (a1) = 8 / (8 + 6 + 4 + 4 + 4 + 4)
It becomes. The same applies to a2. As a result, P (a1) log (P (a1) / Q (a1)) = 0.314. The same applies to a2. The final distribution similarity score is 0.224. When the distribution similarity score is similarly calculated for the keywords K2 and K3, they are 0.520 and 0.044, respectively.
ステップ4) 頻度統合部4では、分布類似性スコアをもとに頻度を統合すべきかどうかを判定し、統合すべきと判定された場合は、ステップ5に移行し、統合の必要がない場合はステップ6に移行する。KLダイバージェンスの値は分布が類似しているほど値が小さくなり、分布がまったく同一の場合に0で最小値となるため、ここでは分布類似性スコアが0.3以下のものを統合すべきと判定することにする。統合すべきかどうかの判定方法はこれに限るものではなく、異なる閾値を用いたり、割合を用いたりしても構わない。キーワードK1およびK3については統合すべきであると判定されるため、a1からa6までのK1、K3との共起頻度を統合して地名AのキーワードK1、K3との共起頻度とし、頻度データベース7を更新する。キーワードK2については統合を行わない。
Step 4) The
ステップ5) 頻度統合部4は、ステップ4で統合すべきと判定された場合には地域ごとの共起頻度を統合して入力された地名の共起頻度とし、頻度データベース7を更新する。
Step 5) If it is determined in
ステップ6) キーワード地名ペア抽出部5では、キーワードと地名のペアの集合が入力されると、頻度データベース7を参照してキーワードと地名のペアを抽出する。キーワードと地名のペアの抽出方法としては、Espresso(登録商標)などの方法を適用することができる。
Step 6) When the keyword place name
具体的には、
<うどん,香川>
<牛タン,仙台>
<みかん,愛媛>
のような少量のキーワードと地名のペアを入力として、当該入力以外の
<たこ焼き,大阪>
<ひつまぶし,名古屋>
…
のような大量のキーワードと地名のペアを新たに獲得することができる。
In particular,
<Udon, Kagawa>
<Beef tongue, Sendai>
<Mandarin orange, caress>
<Takoyaki, Osaka> other than that input
<Hitsumabushi, Nagoya>
...
A large number of keyword / place name pairs can be acquired.
このように、キーワードK1やK3のように地名の表す地域に広く分布していれば部分的な地域での共起頻度を足し合わせてその地名とキーワードとの共起頻度として頻度データベース7を更新することができるため、検索時に入力されたキーワードと地名のペアの集合に対するペアの抽出に利用することができる。また、キーワードK2のように特定の部分的な地域に偏って共起するような場合は統合を行わないため、ノイズを発生させずに適切にペアを抽出することができる。
Thus, if it is widely distributed in the area indicated by the place name such as keywords K1 and K3, the
なお、上記の図1に示すキーワード地名ペア抽出装置の構成要素の一連の動作をプログラムとして構築し、キーワード地名ペア抽出装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。 In addition, a series of operations of the constituent elements of the keyword place name pair extraction device shown in FIG. 1 is constructed as a program, installed and executed on a computer used as the keyword place name pair extraction device, or distributed through a network. It is possible to make it.
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。 The present invention is not limited to the above-described embodiments, and various modifications and applications are possible within the scope of the claims.
1 部分地域取得部
2 頻度取得部
3 分布類似性スコア算出部
4 頻度統合部
5 キーワード地名ペア抽出部
6 地理データベース
7 頻度データベース
DESCRIPTION OF
Claims (7)
地名と該地名の表す地域の属する部分的な地域の集合を格納した地理データベースと、
部分的な地域毎キーワードの分布の文書全体における全体頻度及び該地域内の複数のキーワードとの共起頻度を格納した頻度データベースと、
入力された地名に基づいて前記地理データベースを参照して、該地名に属する部分的な地域の集合を取得する部分地域取得手段と、
前記部分的な地域集合の各地域に基づいて前記頻度データベースを参照して、該地域に対応する全体頻度及び該地域のキーワードとの共起頻度を取得する頻度取得手段と、
前記全体頻度と前記キーワードとの共起頻度に基づいて、該キーワードが地名を表す地域に広く分布していると判断された場合は、部分的な地域の共起頻度を足し合わせて前記頻度データベースを更新する頻度統合手段と、
前記入力されたキーワードと地名のペアの集合に基づいて、前記頻度データベースを検索し、キーワードと地名のペアを抽出する地名ペア抽出手段と、
を有することを特徴とするキーワード地名ペア抽出装置。 A keyword place name pair extraction device that extracts a keyword and place name pair corresponding to a set of input keyword and place name pairs,
A geographic database storing a place name and a set of partial areas to which the area represented by the place name belongs;
A frequency database storing the overall frequency in the entire document of partial keyword distribution and the frequency of co-occurrence with a plurality of keywords in the region;
A partial area acquisition means for referring to the geographic database based on the input place name and acquiring a set of partial areas belonging to the place name;
Referring to the frequency database based on each region of the partial region set, a frequency acquisition means for acquiring a total frequency corresponding to the region and a co-occurrence frequency with the keyword of the region;
Based on the co-occurrence frequency of the overall frequency and the keyword, if it is determined that the keyword is widely distributed in the area representing the place name, the frequency database is obtained by adding the co-occurrence frequencies of partial areas. Frequency integration means to update
Based on the set of input keyword / place name pairs, the frequency database is searched, and place name pair extraction means for extracting a keyword / place name pair;
A keyword place name pair extraction device characterized by comprising:
前記頻度統合手段は、
前記分布類似性スコアに基づいて頻度を統合するかを判定し、統合する場合には、地域毎の共起頻度を統合して、前記頻度データベースを更新する、
請求項1記載のキーワード地名ペア抽出装置。 A distribution similarity score calculating means for calculating a distribution similarity score representing a similarity between a distribution obtained from the overall frequency of the frequency database and a distribution obtained from a co-occurrence frequency of keywords;
The frequency integration means includes
Determining whether to integrate frequencies based on the distribution similarity score, if integrating, integrate the co-occurrence frequency for each region, and update the frequency database,
The keyword place name pair extraction device according to claim 1.
分布が類似しているほど値が小さくなるKL(Kullback Leibler)ダイバージェンスを用い、
前記頻度統合手段は、
前記分布類似性スコアが所定の値より小さい場合に前記地域毎の共起頻度を統合すると判定する
請求項2記載のキーワード地名ペア抽出装置。 The distribution similarity score calculation means includes:
Using KL (Kullback Leibler) divergence, the value becomes smaller as the distribution is similar,
The frequency integration means includes
The keyword place name pair extraction device according to claim 2, wherein when the distribution similarity score is smaller than a predetermined value, it is determined that the co-occurrence frequencies for each region are integrated.
地名と該地名の表す地域の属する部分的な地域の集合を格納した地理データベースと、
部分的な地域毎キーワードの分布の文書全体における全体頻度及び該地域内の複数のキーワードとの共起頻度を格納した頻度データベースと、
を有する装置において、
部分地域取得手段が、入力された地名に基づいて前記地理データベースを参照して、該地名に属する部分的な地域の集合を取得する部分地域取得ステップと、
頻度取得手段が、前記部分的な地域集合の各地域に基づいて前記頻度データベースを参照して、該地域に対応する全体頻度及び該地域のキーワードとの共起頻度を取得する頻度取得ステップと、
頻度統合手段が、前記全体頻度と前記キーワードとの共起頻度に基づいて、該キーワードが地名を表す地域に広く分布していると判断された場合は、部分的な地域の共起頻度を足し合わせて前記頻度データベースを更新する頻度統合ステップと、
地名ペア抽出手段が、前記入力されたキーワードと地名のペアの集合に基づいて、前記頻度データベースを検索し、キーワードと地名のペアを抽出する地名ペア抽出ステップと、
を行うことを特徴とするキーワード地名ペア抽出方法。 A keyword place name pair extraction method for extracting a keyword and place name pair corresponding to a set of input keyword and place name pairs,
A geographic database storing a place name and a set of partial areas to which the area represented by the place name belongs;
A frequency database storing the overall frequency in the entire document of partial keyword distribution and the frequency of co-occurrence with a plurality of keywords in the region;
In a device having
A partial area acquisition unit refers to the geographic database based on the input place name, and acquires a partial area set belonging to the place name;
A frequency acquisition unit that refers to the frequency database based on each region of the partial region set and acquires a total frequency corresponding to the region and a co-occurrence frequency with the keyword of the region;
If the frequency integration means determines that the keyword is widely distributed in the area representing the place name based on the co-occurrence frequency of the overall frequency and the keyword, the co-occurrence frequency of the partial area is added. A frequency integration step of updating the frequency database together;
A place name pair extraction unit searches the frequency database based on the set of the input keyword and place name pairs, and extracts a place name pair of keywords and place names; and
The keyword place name pair extraction method characterized by performing.
前記頻度統合ステップにおいて、
前記分布類似性スコアに基づいて頻度を統合するかを判定し、統合する場合には、地域毎の共起頻度を統合して、前記頻度データベースを更新する、
請求項4記載のキーワード地名ペア抽出方法。 Distribution similarity score calculation means for calculating a distribution similarity score representing a similarity between a distribution obtained from the overall frequency of the frequency database and a distribution obtained from a co-occurrence frequency of keywords. Do the steps,
In the frequency integration step,
Determining whether to integrate frequencies based on the distribution similarity score, if integrating, integrate the co-occurrence frequency for each region, and update the frequency database,
The keyword place name pair extraction method according to claim 4.
分布が類似しているほど値が小さくなるKLダイバージェンスを用い、
前記頻度統合ステップにおいて、
前記分布類似性スコアが所定の値より小さい場合に前記地域毎の共起頻度を統合すると判定する
請求項5記載のキーワード地名ペア抽出方法。 In the distribution similarity score calculation step,
Using KL divergence, the value becomes smaller as the distribution is similar,
In the frequency integration step,
The keyword place name pair extraction method according to claim 5, wherein when the distribution similarity score is smaller than a predetermined value, it is determined that the co-occurrence frequencies for each region are integrated.
請求項1乃至3のいずれか1項に記載のキーワード地名ペア抽出装置の各手段として機能させるキーワード地名ペア抽出プログラム。 Computer
A keyword place name pair extraction program that functions as each means of the keyword place name pair extraction apparatus according to any one of claims 1 to 3.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011265119A JP5583107B2 (en) | 2011-12-02 | 2011-12-02 | Keyword place name pair extraction apparatus, method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011265119A JP5583107B2 (en) | 2011-12-02 | 2011-12-02 | Keyword place name pair extraction apparatus, method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013117866A true JP2013117866A (en) | 2013-06-13 |
JP5583107B2 JP5583107B2 (en) | 2014-09-03 |
Family
ID=48712386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011265119A Expired - Fee Related JP5583107B2 (en) | 2011-12-02 | 2011-12-02 | Keyword place name pair extraction apparatus, method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5583107B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020165950A (en) * | 2019-03-29 | 2020-10-08 | 富士通株式会社 | Device, method, and system for detecting state of exercise based on wireless signal |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6850937B1 (en) * | 1999-08-25 | 2005-02-01 | Hitachi, Ltd. | Word importance calculation method, document retrieving interface, word dictionary making method |
JP2008282328A (en) * | 2007-05-14 | 2008-11-20 | Nippon Telegr & Teleph Corp <Ntt> | Text sorting device, text sorting method, text sort program, and recording medium with its program recorded thereon |
JP2010198189A (en) * | 2009-02-24 | 2010-09-09 | Yahoo Japan Corp | Device and method for machine learning |
JP2010277363A (en) * | 2009-05-28 | 2010-12-09 | Yahoo Japan Corp | Feeling information expression server, feeling information expression system, and feeling expression method |
WO2011004529A1 (en) * | 2009-07-06 | 2011-01-13 | 日本電気株式会社 | Classification hierarchy re-creation system, classification hierarchy re-creation method, and classification hierarchy re-creation program |
JP2011180901A (en) * | 2010-03-02 | 2011-09-15 | Nippon Telegr & Teleph Corp <Ntt> | Device, method and program for evaluating reusability of experience information |
-
2011
- 2011-12-02 JP JP2011265119A patent/JP5583107B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6850937B1 (en) * | 1999-08-25 | 2005-02-01 | Hitachi, Ltd. | Word importance calculation method, document retrieving interface, word dictionary making method |
JP2008282328A (en) * | 2007-05-14 | 2008-11-20 | Nippon Telegr & Teleph Corp <Ntt> | Text sorting device, text sorting method, text sort program, and recording medium with its program recorded thereon |
JP2010198189A (en) * | 2009-02-24 | 2010-09-09 | Yahoo Japan Corp | Device and method for machine learning |
JP2010277363A (en) * | 2009-05-28 | 2010-12-09 | Yahoo Japan Corp | Feeling information expression server, feeling information expression system, and feeling expression method |
WO2011004529A1 (en) * | 2009-07-06 | 2011-01-13 | 日本電気株式会社 | Classification hierarchy re-creation system, classification hierarchy re-creation method, and classification hierarchy re-creation program |
JP2011180901A (en) * | 2010-03-02 | 2011-09-15 | Nippon Telegr & Teleph Corp <Ntt> | Device, method and program for evaluating reusability of experience information |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020165950A (en) * | 2019-03-29 | 2020-10-08 | 富士通株式会社 | Device, method, and system for detecting state of exercise based on wireless signal |
US11808838B2 (en) | 2019-03-29 | 2023-11-07 | Fujitsu Limited | Motion state detection apparatus and method based on wireless signals and system |
Also Published As
Publication number | Publication date |
---|---|
JP5583107B2 (en) | 2014-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10191977B2 (en) | System and method for providing technology assisted data review with optimizing features | |
US9104979B2 (en) | Entity recognition using probabilities for out-of-collection data | |
US20190004873A1 (en) | Application program interface mashup generation | |
US20160275148A1 (en) | Database query method and device | |
CN107145545B (en) | Top-k area user text data recommendation method in social network based on position | |
US10133807B2 (en) | Author disambiguation and publication assignment | |
US9734207B2 (en) | Entity resolution techniques and systems | |
CN110457672A (en) | Keyword determines method, apparatus, electronic equipment and storage medium | |
GB2558718A (en) | Search engine | |
CN105229723A (en) | The Language Modeling of complete language sequence | |
US20190384856A1 (en) | Description matching for application program interface mashup generation | |
CN103559313B (en) | Searching method and device | |
US10354339B2 (en) | Automatic initiation for generating a company profile | |
CN106202440B (en) | Data processing method, device and equipment | |
CN108287850B (en) | Text classification model optimization method and device | |
US10216787B2 (en) | Method, apparatus, and computer-readable medium for contextual data mining using a relational data set | |
US20170235835A1 (en) | Information identification and extraction | |
US10504145B2 (en) | Automated classification of network-accessible content based on events | |
US9317871B2 (en) | Mobile classifieds search | |
US20190004872A1 (en) | Application program interface mashup generation | |
CN105488165B (en) | Data retrieval method and system based on index database | |
JP5583107B2 (en) | Keyword place name pair extraction apparatus, method, and program | |
US9104755B2 (en) | Ontology enhancement method and system | |
JP6097707B2 (en) | Data updating apparatus, method, and program | |
JP2018010482A (en) | Document concept base generation device, document concept search device, method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20131004 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140204 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140625 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140708 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140715 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5583107 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |