JP6077980B2 - 地域関連キーワード決定装置、地域関連キーワード決定方法、および地域関連キーワード決定プログラム - Google Patents

地域関連キーワード決定装置、地域関連キーワード決定方法、および地域関連キーワード決定プログラム Download PDF

Info

Publication number
JP6077980B2
JP6077980B2 JP2013238559A JP2013238559A JP6077980B2 JP 6077980 B2 JP6077980 B2 JP 6077980B2 JP 2013238559 A JP2013238559 A JP 2013238559A JP 2013238559 A JP2013238559 A JP 2013238559A JP 6077980 B2 JP6077980 B2 JP 6077980B2
Authority
JP
Japan
Prior art keywords
keyword
region
score
frequency
regional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013238559A
Other languages
English (en)
Other versions
JP2015099464A (ja
Inventor
伸章 廣嶋
伸章 廣嶋
西岡 秀一
秀一 西岡
鷲崎 誠司
誠司 鷲崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013238559A priority Critical patent/JP6077980B2/ja
Publication of JP2015099464A publication Critical patent/JP2015099464A/ja
Application granted granted Critical
Publication of JP6077980B2 publication Critical patent/JP6077980B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、指定した地域に関連するキーワードを決定する技術に関する。
さまざまな地域を指定して、その地域に関連するキーワードを知ることができれば便利である。例えば、「横須賀」近辺の地域を指定したときに、「横須賀」に関連するキーワードが「海軍カレー」であることがわかれば、その地域の名所や名物を知ることができ、旅行計画の立案などの際に有益である。
地域に関連するキーワードを決定する技術として、非特許文献1には、地域全体での出現の割合に比べて、対象とする地域での出現の割合が高い語(特徴的な語)をキーワードとして獲得する方法が提案されている。
廣嶋伸章,安田宜仁,藤田尚樹,片岡良治、「地理情報検索におけるクエリ入力支援のための特徴語の提示」、2012年度人工知能学会全国大会(JSAI2012)
しかしながら、非特許文献1の方法では、対象とする地域のみに関連しているキーワードについては選択されやすいが、対象とする地域のほかにも関連している地域が存在するようなキーワードについては選択されにくいという問題がある。そのため、例えば「まんじゅう」が横須賀の名物であったとしても、「まんじゅう」を名物とする地域は他にも多く存在するため、「まんじゅう」は横須賀に関連するキーワードとして選択されにくい。
本発明は、上記の事情に鑑みなされたものであり、本発明の目的は、関連する地域が多く存在するようなキーワードであっても、対象となる地域に関連するキーワードであれば選択されることを可能とする地域関連キーワード決定装置、地域関連キーワード決定方法、および地域関連キーワード決定プログラムを提供することにある。
上記の課題を解決するため、本発明は、地域関連キーワード決定装置であって、指定された地域に対応付けられた複数のキーワードと、各キーワードの各地域での頻度とを頻度データベースから取得するキーワード頻度取得手段と、前記キーワード頻度取得手段が取得した各キーワードの各地域での頻度を用いて、各キーワードの分布がどの程度一様であるかを表す分布一様性スコアを算出する分布一様性スコア算出手段と、前記キーワード頻度取得手段が取得した各キーワードの各地域での頻度を用いて、各キーワードの前記指定された地域での頻度で出現することが、前記各地域全体と比較してまれであるかの度合いを表す地域スコアを算出する地域スコア算出手段と、前記分布一様性スコアを用いて、分布が一様であるほど前記指定された地域との関連が高くなるように、各キーワードの前記地域スコアを補正する地域スコア補正手段と、前記補正した地域スコアに基づいて、前記指定された地域に関連するキーワードを決定するキーワード決定手段と、を有すること を要旨とする。
上記地域関連キーワード決定装置において、前記キーワード決定手段は、前記補正した地域スコアが高いキーワードを、前記指定された地域に関連するキーワードとして決定することとしてもよい。
上記地域関連キーワード決定装置において、前記地域スコア補正手段は、パラメータを調整することで、前記地域スコアの補正の程度を制御することとしてもよい。
本発明は、コンピュータが行う地域関連キーワード決定方法であって、指定された地域に対応付けられた複数のキーワードと、各キーワードの各地域での頻度とを頻度データベースから取得するキーワード頻度取得ステップと、前記キーワード頻度取得ステップで取得した各キーワードの各地域での頻度を用いて、各キーワードの分布がどの程度一様であるかを表す分布一様性スコアを算出する分布一様性スコア算出ステップと、前記キーワード頻度取得ステップで取得した各キーワードの各地域での頻度を用いて、各キーワードの前記指定された地域での頻度で出現することが、前記各地域全体と比較してまれであるかの度合いを表す地域スコアを算出する地域スコア算出ステップと、前記分布一様性スコアを用いて、分布が一様であるほど前記指定された地域との関連が高くなるように、各キーワードの前記地域スコアを補正する地域スコア補正ステップと、前記補正した地域スコアに基づいて、前記指定された地域に関連するキーワードを決定するキーワード決定ステップと、を行うことを要旨とする。
上記地域関連キーワード決定方法において、前記キーワード決定ステップは、前記補正した地域スコアが高いキーワードを、前記指定された地域に関連するキーワードとして決定することとしてもよい。
上記地域関連キーワード決定方法において、前記地域スコア補正ステップは、パラメータを調整することで、前記地域スコアの補正の程度を制御することとしてもよい。
本発明は、上記地域関連キーワード決定装置として機能させるための地域関連キーワード決定プログラムである。
本発明によれば、関連する地域が多く存在するようなキーワードであっても、対象となる地域に関連するキーワードであれば選択されることを可能とする地域関連キーワード決定装置、地域関連キーワード決定方法、および地域関連キーワード決定プログラムを提供することができる。
本発明の一実施形態における地域関連キーワード決定装置の構成図である。 地域関連キーワード決定装置の動作を示すフローチャートである。 頻度データベースから取得したキーワードと頻度の一例を示す図である。 各キーワードの分布一様性スコアの一例を示す図である。 各キーワードの指定された地域での地域スコアの一例を示す図である。 各キーワードの補正後の地域スコアの一例を示す図である。
以下、本発明の実施の形態を、図面を用いて説明する。
図1は、本発明の実施形態である地域関連キーワード決定装置100の構成を示す図である。図1に示す地域関連キーワード決定装置100は、キーワード頻度取得部1と、分布一様性スコア算出部2と、地域スコア算出部3と、地域スコア補正部4と、キーワード決定部5と、頻度データベース6を有する。
キーワード頻度取得部1は、指定された地域に対し、頻度データベース6を参照して、当該地域に対応付けられた複数のキーワードと、各キーワードの各地域での頻度とを取得する。
分布一様性スコア算出部2は、各キーワードに対して、キーワードの各地域での頻度を用いて、キーワードの分布がどの程度一様であるかを表す分布一様性スコアを算出する。
地域スコア算出部3は、各キーワードに対して、キーワードの各地域での頻度を用いて、キーワードが対象とする地域全体と比較して、指定された地域でその頻度で出現することがまれであるかどうかを表す地域スコアを算出する。
地域スコア補正部4は、各キーワードに対して、分布一様性スコアを用いて、分布が一様であるほど指定された地域との関連が高くなるように前記地域スコアを補正する。
キーワード決定部5は、補正した地域スコアに基づいて、指定された地域に対応付けられた複数のキーワードの中から、当該指定された地域に関連するキーワードを決定する。
ここで、キーワードとは、検索などを行うユーザが興味を持ち、情報を知りたいと考えられる事物を単語で表現したものである。また、地域とは、行政区や座標などで分割された地図上の範囲である。
上記説明した地域関連キーワード決定装置100は、例えば、CPUと、メモリと、HDD等の外部記憶装置などを備えた汎用的なコンピュータシステムを用いることができる。このコンピュータシステムにおいて、CPUがメモリ上にロードされた地域関連キーワード決定装置100のプログラムを実行することにより、地域関連キーワード決定装置100の各機能が実現される。また、地域関連キーワード決定装置100のプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD−ROMなどのコンピュータ読取り可能な記録媒体に記憶することも、ネットワークを介して配信することもできる。なお、地域関連キーワード決定装置100は、複数のコンピュータから構成されるシステムであってもよい。
次に、地域関連キーワード決定装置の動作をより具体的に説明する。
図2は、地域関連キーワード決定装置100の動作を示すフローチャートである。
キーワード頻度取得部1は、指定された地域に対し、頻度データベース6を参照して、当該地域に対応付けられたキーワードと、そのキーワードの各地域での頻度とを取得する(S11)。頻度データベース6は、各キーワードが、どの地域にどれだけの頻度で出現したかが格納されたデータベースである。キーワード頻度取得部1は、頻度データベース6から、指定された地域に出現したキーワードと、当該キーワードの各地域での頻度とを取得する。
図3は、頻度データベース6から取得したキーワードと頻度との一例を示す図である。図示する例では、指定された地域に対応付けられた複数のキーワードK1−K5と、各地域L1−L5とを縦軸および横軸としたテーブルであって、キーワード毎に当該キーワードの各地域での頻度が設定されている。
分布一様性スコア算出部2は、頻度データベース6から取得した頻度を用いて、各キーワードに対して、キーワードの分布がどの程度一様であるかを表す指標である分布一様性スコアを算出する(S12)。ここでは、分布一様性スコアとして、エントロピーを用いる。分布一様性スコアの算出方法は、キーワードの分布がどの程度一様であるかを表すスコアであればエントロピーに限るものではなく、分散の値を利用したりしてもかまわない。エントロピーは以下の式により求められる。
Figure 0006077980
ここで、pはキーワードが各地域で出現する確率であり、キーワードの各地域での頻度を、キーワードの各地域全体での頻度で割った値となる。図3に示す場合、キーワードK1に関して分布一様性スコアを算出すると、−(0.5×log0.5+0.1×log0.1+0.2×log0.2+0.05×log0.05+0.15×log0.15)=1.333となる。残りのキーワードK2−K5についても、同様に分布一様性スコアを算出した結果を図4に示す。なお、分布一様性スコア(ここでは、エントロピー)が高いほど、一様に分布していることを示す。
地域スコア算出部3は、頻度データベース6から取得した頻度を用いて、各キーワードに対して、地域スコアを算出する(S13)。地域スコアは、キーワードが対象とする各地域全体(全地域)と比較して、指定した地域でその頻度で出現することがまれであるかどうかを表すものである。ここでは、各地域全体での全キーワードの頻度をn、指定された地域での全キーワードの頻度をs、各地域全体での該当キーワードの頻度をk、指定された地域での該当キーワードの頻度をrとする。そして、nとsとkの値から推定可能な指定された地域での該当キーワードの頻度の平均値λ=sk/nと比較して、指定された地域での該当キーワードの頻度がr以上であることがどの程度の確率で起こりうることであるかを表すポアソン確率の逆数を算出して地域スコアとする。ポアソン確率は、以下の式により求められる。
Figure 0006077980
地域スコアの算出方法は、キーワードが対象とする各地域全体と比較して、指定した地域で出現することがまれであるかどうかを表すものであればこれに限るものではなく、地域に属するかどうかという事象とキーワードを含むかどうかという事象との関連の強さをカイ2乗検定やフィッシャーの正確確率検定を用いて算出してもかまわない。
図3に示す場合において、キーワードK1の地域L1(指定された地域)での地域スコアを求めると、n=680、s=150、k=20、r=10であるため、λ=4.412となり、地域スコアは66.67となる。地域L1について残りのキーワードK2−K5についても同様にして求めた結果を図5に示す。なお、地域スコア(ここでは、ポアソン確率の逆数)が高いほど、指定された地域に強く関連していることを示す。
地域スコア補正部4は、各キーワードの分布一様性スコアを用いて、分布が一様であるほど地域との関連が高くなるように各キーワードの地域スコアを補正する(S14)。すなわち、分布一様性スコアが高いほど、地域スコアを高くするように、分布一様性スコアに応じて地域スコアを補正する。
ここでは、分布一様性スコアは高いほど分布が一様であることを示し、地域スコアは高いほど地域に関連することを示していることを考慮し、以下の式により地域スコアを補正する。
Figure 0006077980
ここで、SL’は補正した地域スコア、SLは地域スコア、αは1以上の値、SDは分布一様性スコアである。地域スコアの補正の方法は、分布が一様であるほど地域との関連が高くなるようなものであればこれに限るものではない。α=50としてキーワードK1について補正を行うと、図4および図5に示す場合、12264.72となる。残りのキーワードK2−K5についても同様に補正を行った結果を図6に示す。なお、パラメータαの値を調整することで、地域スコアの補正の程度を制御するものとする。
キーワード決定部5では、補正した地域スコアを用いて、指定した地域に関連するキーワードを決定する(S15)。具体的には、補正した地域スコアが高いキーワードを、指定された地域に関連するキーワードとして決定する。ここでは、キーワードを1つ選択することとする。キーワードの決定の方法はこれに限るものではなく、複数のキーワードを選択してもかまわない。
地域スコアが最も高いキーワードを1つ選択すると、図6に示す補正後の地域スコアの場合、キーワードK2が選択される。
図5に示す補正前の地域スコアでは、K2よりもK1のほうが高い値となっており、地域スコアのみを用いた場合ではK1がキーワードとして選択されるが、補正を行うことにより、関連する地域が多く存在するようなキーワードK2が選択されるようになる。どの程度の補正を行うかはパラメータαを調節することで制御できる。例えば、指定された地域への旅行者向けにはαの値を小さくして観光名所のような当該地域でのみ関連するようなキーワードを取得し、一方、指定された地域の地元の人向けにはαの値を大きくして、関連する地域が多いが当該地域でも関連するようなキーワードを取得する、ということが可能となる。
以上説明した本実施形態では、キーワードが各地域でどの程度一様に分布しているかを算出し、一様に分布しているキーワードほど選択されやすくなるように地域スコアを補正する。これにより、本実施形態では、関連する地域が多く存在するようなキーワードであっても、指定された地域に関連していれば選択可能となる。
例えば、選択された複数の地域関連キーワードを、指定された地域の地図上に表示するアプリケーションサービスにおいて、指定された地域では、「まんじゅう」が名産として話題であるが、「まんじゅう」は全国各地で関連があるため、補正前の地域スコア(図2:S13)を用いて複数の地域関連キーワードを選択した場合、地域関連キーワードとして「まんじゅう」は選択されないが、補正後の地域スコア(図2:S14)を用いて複数の地域関連キーワードを選択した場合、地域関連キーワードとして「まんじゅう」は選択され、地図上に表示される。このように、本実施形態によれば、様々な地域において、適切な地域関連キーワードを選択し、決定することができる。
また、本実施形態によれば、地元以外の人が旅行計画の立案をする際に有効な地域関連キーワードを提示するだけでなく、地元の人が周囲の役立つ情報を探す際に有効な地域関連キーワードも提示可能とし、用途に応じた地域情報の取得を容易にすることができる。
なお、本発明は上記実施形態に限定されるものではなく、特許請求の範囲内において、種々変更・応用が可能である。
1 :キーワード頻度取得部
2 :分布一様性スコア算出部
3 :地域スコア算出部
4 :地域スコア補正部
5 :キーワード決定部
6 :頻度データベース
100:地域関連キーワード決定装置

Claims (7)

  1. 地域関連キーワード決定装置であって、
    指定された地域に対応付けられた複数のキーワードと、各キーワードの各地域での頻度とを頻度データベースから取得するキーワード頻度取得手段と、
    前記キーワード頻度取得手段が取得した各キーワードの各地域での頻度を用いて、各キーワードの分布がどの程度一様であるかを表す分布一様性スコアを算出する分布一様性スコア算出手段と、
    前記キーワード頻度取得手段が取得した各キーワードの各地域での頻度を用いて、各キーワードの前記指定された地域での頻度で出現することが、前記各地域全体と比較してまれであるかの度合いを表す地域スコアを算出する地域スコア算出手段と、
    前記分布一様性スコアを用いて、分布が一様であるほど前記指定された地域との関連が高くなるように、各キーワードの前記地域スコアを補正する地域スコア補正手段と、
    前記補正した地域スコアに基づいて、前記指定された地域に関連するキーワードを決定するキーワード決定手段と、を有すること
    を特徴とする地域関連キーワード決定装置。
  2. 請求項1記載の地域関連キーワード決定装置であって、
    前記キーワード決定手段は、前記補正した地域スコアが高いキーワードを、前記指定された地域に関連するキーワードとして決定すること
    を特徴とする地域関連キーワード決定装置。
  3. 請求項1または2記載の地域関連キーワード決定装置であって、
    前記地域スコア補正手段は、パラメータを調整することで、前記地域スコアの補正の程度を制御すること
    を特徴とする地域関連キーワード決定装置。
  4. コンピュータが行う地域関連キーワード決定方法であって、
    指定された地域に対応付けられた複数のキーワードと、各キーワードの各地域での頻度とを頻度データベースから取得するキーワード頻度取得ステップと、
    前記キーワード頻度取得ステップで取得した各キーワードの各地域での頻度を用いて、各キーワードの分布がどの程度一様であるかを表す分布一様性スコアを算出する分布一様性スコア算出ステップと、
    前記キーワード頻度取得ステップで取得した各キーワードの各地域での頻度を用いて、各キーワードの前記指定された地域での頻度で出現することが、前記各地域全体と比較してまれであるかの度合いを表す地域スコアを算出する地域スコア算出ステップと、
    前記分布一様性スコアを用いて、分布が一様であるほど前記指定された地域との関連が高くなるように、各キーワードの前記地域スコアを補正する地域スコア補正ステップと、
    前記補正した地域スコアに基づいて、前記指定された地域に関連するキーワードを決定するキーワード決定ステップと、を行うこと
    を特徴とする地域関連キーワード決定方法。
  5. 請求項4記載の地域関連キーワード決定方法であって、
    前記キーワード決定ステップは、前記補正した地域スコアが高いキーワードを、前記指定された地域に関連するキーワードとして決定すること
    を特徴とする地域関連キーワード決定方法。
  6. 請求項4または5記載の地域関連キーワード決定方法であって、
    前記地域スコア補正ステップは、パラメータを調整することで、前記地域スコアの補正の程度を制御すること
    を特徴とする地域関連キーワード決定方法。
  7. 請求項1から3のいずれか一項に記載の地域関連キーワード決定装置として機能させるための地域関連キーワード決定プログラム。
JP2013238559A 2013-11-19 2013-11-19 地域関連キーワード決定装置、地域関連キーワード決定方法、および地域関連キーワード決定プログラム Active JP6077980B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013238559A JP6077980B2 (ja) 2013-11-19 2013-11-19 地域関連キーワード決定装置、地域関連キーワード決定方法、および地域関連キーワード決定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013238559A JP6077980B2 (ja) 2013-11-19 2013-11-19 地域関連キーワード決定装置、地域関連キーワード決定方法、および地域関連キーワード決定プログラム

Publications (2)

Publication Number Publication Date
JP2015099464A JP2015099464A (ja) 2015-05-28
JP6077980B2 true JP6077980B2 (ja) 2017-02-08

Family

ID=53376048

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013238559A Active JP6077980B2 (ja) 2013-11-19 2013-11-19 地域関連キーワード決定装置、地域関連キーワード決定方法、および地域関連キーワード決定プログラム

Country Status (1)

Country Link
JP (1) JP6077980B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003150601A (ja) * 2001-11-14 2003-05-23 Nippon Telegr & Teleph Corp <Ntt> 地域別特徴算出方法および地域別特徴算出装置ならびに地域別特徴算出プログラム
JP4490989B2 (ja) * 2007-04-06 2010-06-30 株式会社きざしカンパニー 語句の属性を決定する方法および同方法を利用した広告方法
US20110161072A1 (en) * 2008-08-20 2011-06-30 Nec Corporation Language model creation apparatus, language model creation method, speech recognition apparatus, speech recognition method, and recording medium
JP5271863B2 (ja) * 2009-10-13 2013-08-21 日本電信電話株式会社 情報分析装置、情報分析方法および情報分析プログラム

Also Published As

Publication number Publication date
JP2015099464A (ja) 2015-05-28

Similar Documents

Publication Publication Date Title
US9436690B2 (en) System and method for predicting a geographic origin of content and accuracy of geotags related to content obtained from social media and other content providers
US20170147575A1 (en) Location-Based Recommendations Using Nearest Neighbors in a Locality Sensitive Hashing (LSH) Index
US11118927B2 (en) Computer-implemented method for recommending booths-to-visit
US10185751B1 (en) Identifying and ranking attributes of entities
US10713485B2 (en) Object storage and retrieval based upon context
JP2017525026A (ja) 文脈検索の提示の生成
CN105488096B (zh) 动态概要生成器
KR20180019656A (ko) 키워드 제시 방법 및 장치
JP6594317B2 (ja) ニュースタイムラインおよび薦められるニュースエディションの生成
US20180260473A1 (en) Full text retrieving and matching method and system based on lucene custom lexicon
JP6454407B2 (ja) 地図における候補アドレス情報を取得する方法及び装置
EP4300324A3 (en) Selecting backing stores based on data request
EP2945081A1 (en) Interpreting user queries based on nearby locations
JP6077980B2 (ja) 地域関連キーワード決定装置、地域関連キーワード決定方法、および地域関連キーワード決定プログラム
US10922321B2 (en) Interpreting user queries based on device orientation
US9390323B1 (en) Recommending sites through metadata analysis
CN106796599B (zh) 基于附近位置解释用户查询
US20170154051A1 (en) Hashmaps
EP3276510B1 (en) Electronic dataset searching
JP5981381B2 (ja) 施設関連キーワード決定装置
US20180285765A1 (en) Identifying user-specific values for entity attributes
KR101723310B1 (ko) 특허공보를 기반으로한 대리인 검색 서비스 제공 시스템 및 방법
JP6550308B2 (ja) 情報処理システム及びコンピュータプログラム
JP6075051B2 (ja) サーバ装置、電子会議システム及びプログラム
RU2017131044A (ru) Способы и системы для экспериментального планирования и анализа

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160303

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161222

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170113

R150 Certificate of patent or registration of utility model

Ref document number: 6077980

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150