JP5778643B2 - ローカルスポット判別装置、ローカルスポット判別方法及びローカルスポット判別プログラム - Google Patents

ローカルスポット判別装置、ローカルスポット判別方法及びローカルスポット判別プログラム Download PDF

Info

Publication number
JP5778643B2
JP5778643B2 JP2012198026A JP2012198026A JP5778643B2 JP 5778643 B2 JP5778643 B2 JP 5778643B2 JP 2012198026 A JP2012198026 A JP 2012198026A JP 2012198026 A JP2012198026 A JP 2012198026A JP 5778643 B2 JP5778643 B2 JP 5778643B2
Authority
JP
Japan
Prior art keywords
spot
place name
local
name
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012198026A
Other languages
English (en)
Other versions
JP2014052926A (ja
Inventor
田中 陽子
陽子 田中
佐藤 吉秀
吉秀 佐藤
宮原 伸二
伸二 宮原
義昌 小池
義昌 小池
良治 片岡
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012198026A priority Critical patent/JP5778643B2/ja
Publication of JP2014052926A publication Critical patent/JP2014052926A/ja
Application granted granted Critical
Publication of JP5778643B2 publication Critical patent/JP5778643B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ローカルスポットを判別する技術、例えば、店舗や建造物等、特定の住所の場所(スポット)がその周辺地域に特化して人気があるスポットであるかを判定し、観光客向けのではなく、地元の人の行動の対象となるスポットを抽出するための技術に関する。
スポットの中には、全国的に知名度が高いスポット(有名スポット)と、ある地域の中で地元の人からの知名度が高いスポット(ローカルスポット)がある。有名スポットを判別する技術としては、位置情報付きのウェブ文書を用いて人が集まっているエリアを有名スポットとする手法が知られている(例えば非特許文献1,2)。
非特許文献1に開示の手法では、位置情報付きのウェブ文書の密度から、人が集まっている場所を検出し、ユーザの行動パターンを抽出している。
非特許文献2に開示の手法では、ある期間内で多くのユーザから位置情報付きのウェブ文書が投稿された場所を人気スポットとして、関連するフレーズとともに抽出している。
Tatsuya Fujisaka,Ryong Lee,Kazutoshi Sumiya,"Discovery of User Behavior Patterns from Geo-tagged Micro-blogs", The ICUIMC'10, January 14-15, 2010, SKKU, Suwon, Korea 渡辺一史,大知正直,岡部誠,尾内理紀夫,"Twitterを用いた実世界ローカルイベント検出",第4回楽天開発シンポジウム,デモ・ポスターセッション ,2011年11月19日 平野徹,松尾義博,菊井玄一郎"地理的距離と有名度を用いた地名の曖昧性解消",情報処理学会第70回全国大会,2008年3月13日,3D‐7,"2‐85"〜"2‐86"
従来手法では、スポットから遠方にいる人からも知られているか、スポットの近辺でしか知名度がないか、などの知名度の地理的広がりを考慮していないため、有名スポットとローカルスポットの区別ができない。また、位置情報付きのウェブ文書を用いているが、実際には位置情報が付いている文書の割合は少ない。位置情報のない文書に対して、位置を推定する技術もあるが、スポットの情報を含むすべての文書に対して推定を行うのは計算コストがかかる。
本発明は、上記の事情に鑑み、特定の住所表現を持つスポットについてそのスポットの周辺地域に特化した人気の高さを把握することで当該スポットがローカルスポットであるかを判別することを技術課題とする。
本発明は、対象スポットがローカルスポットであるかの判断にあたり、対象スポットの名称を含む文書の群から抽出された当該スポットの住所に含まれる各地名の出現頻度と、前記住所に含まれる予め定めた階層より下の階層にある地名に対して、前記地名が表す地理範囲が狭いほど小さくなるように決定した前記各地名の地理スコア並びに前記出現頻度とに基づき、当該スポットのローカル度を算出する。
本発明のローカルスポット判別装置の態様としては、対象スポットがその周辺地域に特化して人気のあるローカルスポットであるかを判断するローカルスポット判別装置であって、対象スポットの名称を含む文書の群から抽出された当該スポットの住所に含まれる各地名の出現頻度に基づき当該各地名の支持スコアを算出する支持スコア計算手段と、前記住所に含まれる予め定めた階層より下の階層にある地名に対して、前記地名が表す地理範囲が狭いほど小さくなるように決定した前記各地名の地理スコア、前記算出された前記各地名の支持スコアに基づき重み付けして加算した当該スポットのローカル度を算出するローカル度計算手段とを備える。
前記ローカル度計算手段は、前記住所に含まれる予め定めた階層より下の階層にある地名に対して、前記各地名の前記地理スコア、前記各地名の前記支持スコアに基づき重み付けして加算した値と、前記予め定めた階層以上の階層にある地名に対して、前記各地名の前記地理スコア、前記各地名の前記支持スコアに基づき重み付けして算出した値を用い、前者の値が大きいほど、また後者の値が小さいほど値が大きくなるようにローカル度を算出してもよい。
本発明のローカルスポット判別方法の態様としては、対象スポットがその周辺地域に特化して人気のあるローカルスポットであるかを判断するローカルスポット判別方法であって、支持スコア計算手段が対象スポットの名称を含む文書の群から抽出された当該スポットの住所に含まれる各地名の出現頻度に基づき当該各地名の支持スコアを算出するステップと、ローカル度計算手段が前記住所に含まれる予め定めた階層より下の階層にある地名に対して、前記地名が表す地理範囲が狭いほど小さくなるように決定した前記各地名の地理スコア、前記算出された前記各地名の支持スコアに基づき重み付けして加算した当該スポットのローカル度を算出するステップとを有する。
前記ローカル度を算出するステップでは、前記住所に含まれる予め定めた階層より下の階層にある地名に対して、前記各地名の前記地理スコア、前記各地名の前記支持スコアに基づき重み付けして加算した値と、前記予め定めた階層以上の階層にある地名に対して、前記各地名の前記地理スコア、前記各地名の前記支持スコアに基づき重み付けして算出した値を用い、前者の値が大きいほど、また後者の値が小さいほど値が大きくなるようにローカル度を算出してもよい。
尚、本発明は、前記ローカルスポット判別装置を構成する各手段としてコンピュータを機能させるプログラムまたは前記ローカルスポット判別方法の各ステップをコンピュータに実行させるプログラムの態様とすることもできる。
以上の発明によれば対象スポットのローカル度の高さを把握できるので当該スポットがローカルスポットであるかを判別できる。
本発明の実施形態であるローカルスポット判別装置を示したブロック図。 本発明の実施形態であるローカルスポット判別処理の手順を説明したフロー図。 地名の階層の一例を示した階層図。
以下、図面を参照しながら本発明の実施の形態について説明するが本発明はこの実施形態に限定されるものではない。
(概要)
図1に示された発明の実施形態のローカルスポット判別装置1は、スポットの名称と地理スコア的に下位階層の地名との共起が多いほど、そのスポットはその周辺に特化して人気のあるスポットであると判断している。一方、地理スコア的に上位階層の地名との共起が多いほど、周辺に特化していない有名スポットであると判断している。そして、対象スポットがローカルスポットであるかの判別にあたり、対象スポット名と地理スコア的に下位階層の地名との共起が多いほど当該対象スポットは局所的に知名度が高いとして判断する。この局所的な知名度(ローカル度)の高いスポットをローカルスポットとして判断している。
特に、本実施形態では、検索範囲として対象スポットの住所に含まれる予め定めた階層以下の階層にある地名の範囲において有名であるがその地名より上の階層にある地名の範囲では有名ではないスポットをローカルスポットとして判断する。例えば、「京都市」を指定した場合、京都市の中では有名であるが、それより上位の京都府や近畿地方、日本ではそれほど有名ではないスポットをローカルスポットとして判断する。
以下の詳細な説明では、あるスポットがその周辺のどれくらい狭い地域に特化して人気があるスポットであるかを表す指標を「ローカル度」と定義している。また、ローカル度の高さを判定する対象のスポットについて、その場所にある店舗名や建造物名等のその場所を表す名称を「スポット名」と称している。ここでは、特定の住所で表現することができるスポットのみを扱う。
住所は例えば「京都府長岡京市天神2丁目15番13号」のように「京都府」「長岡京市」「天神」「2丁目」「15番」「13号」等の地名からなる特定の場所を示す表現を意味する。地名の区切り方は任意であればよく、「天神2丁目」までを1つの地名とするように区切っても構わない。また、全ての地名を扱ってもよいし、番地などを除いた「京都府」「長岡京市」「天神」までを地名として扱ってもよい。
行政区分で考えると、長岡京市は京都府に、天神2丁目は長岡京市に属している。ここで、ある地名の範囲での例えば面積や人口、その地名で始まる全ての住所数等、地名が表す地理範囲が狭いほど小さくなるように決定した値を当該地名の地名スコアとして定義する。
ある地名で始まる全ての住所数は例えば「京都府京都市下京区立売西町79番1号」「京都府長岡京市天神1丁目14番1号」等の「京都府」で始まる住所の数を示し、「京都府」の地名スコアは例えば「京都府」から始まる全ての住所の数で定義する。「天神」で始まる住所は、「京都府長岡京市天神」で始まる住所を指し、例えば「京都府長岡京市天神1丁目1番1号」等が挙げられる。そして、「天神」の地名スコアとして例えば「京都府長岡京市天神」から始まる全ての住所数であると定義すると、地名スコアの高い地名を上位として地名を階層的に表現することができる。
国内の住所に含まれる階層の一例を図3に示した。地名スコアは面積や人口、住所数等というように、階層の親子関係にある2つの地名について、親の地名のスコアが子の地名のスコアより大きくなるような値であればよく、任意の値で示してもよい。例えば「京都府」と「長岡京市」は行政区分的に親子関係であり、親の「京都府」の地名スコアを10、子の「長岡京市」の地名スコアを「京都」の地名スコアより小さい5、同様に「長岡京市」を親に持つ「天神」の地名スコアはさらに小さい3、というように任意の値に決めて用いてもよい。
ローカル度が高いスポットは、そのスポットの場所を表す際に地名スコア的に下位の階層にある地名と併記されることが多い。例えば、全国的に有名な「八坂神社」と全国的に有名ではないが地元で人気のある百貨店の「藤井大丸」は、実際の距離では1km程度しか離れていないが、「八坂神社」は「京都の八坂神社」「八坂神社は関西にある有名な神社」というように、「京都」「関西」のような地名スコア的に上位の地名との共起が多い。一方、「藤井大丸」は「四条高倉の藤井大丸」「四条に行ったついでに藤井大丸に行った」というように「四条」「四条高倉」のような地名スコア的に下位の地名との共起が多い。
そこで、有名スポット判別装置1は、スポット名と地名スコア的に下位階層の住所表現との共起が多いほどそのスポットは周辺地域で人気が高いと判断する一方で、地名スコア的に上位階層の地名との共起が多いほど当該スポットは全国的に人気が高いと判断している。つまり、前記上位階層の地名との共起は少ないが前記下位階層の地名との共起が多いようなスポットは周辺地域に特化して人気があるローカルスポットであると判断している。ローカル度は、対象スポットの住所に含まれる予め定めた階層より下の階層にある地名に対して、予め獲得された文書群から抽出された各地名とスポット名との共起回数(共起頻度)と、当該各地名の地名スコアに基づき決定される。
また、前記予め定めた階層より下の階層にある地名に対して上記方法で決定された値と、前記予め定めた階層以上の階層にある地名に対して同様の方法で決定された値を用い、前者の値が大きいほど、また後者の値が小さいほど値が大きくなるようにローカル度を決定してもよい。
(装置の構成)
ローカルスポット判別装置1は図1に示されたように少なくとも地名スコア計算部2、文書獲得部3、地名抽出部4、支持スコア計算部5、ローカル度計算部6、ローカルスポット判断部7、文書データベース8(以下、文書DB8)を備える。各機能部2〜8はサーバ(コンピュータ)のハードウェアリソースによって実現される。すなわち、装置1は少なくとも演算装置(CPU)、記憶装置(メモリ、ハードディスク装置等)、通信インタフェース等のコンピュータに係るハードウェアリソースを備える。そして、これらのハードウェアリソースがソフトウェアリソース(OS、アプリケーション等)と協働することにより各機能部2〜8が実装される。
地名スコア計算部2は、ローカル度の高さの判定対象であるスポットの住所に含まれる地名の地名スコアを例えば面積、人口、住所数のいずれかに基づき算出する。例えば、前記判定対象のスポットSのスポット名がNであり、その住所Addrが複数の地名A1,…,Anからなる場合、地名A1,…,Anの範囲における例えば面積、人口、住所数のいずれに基づき当該地名A1,…,Anの地名スコアGA1,…,GAnを算出する。ただし、地名の階層が上位にある地名から順にA1,…,Anとする。
文書獲得部3は、スポットSのスポット名Nを含む文書を文書DB8から任意の数だけ取得する。文書DB8は予めクローラ等の周知の情報収集手段によって収集した任意のスポット名を含んだ文書情報を格納している。前記文書情報としては例えばスポット名を含むブログ記事が挙げられる。文書DB8は定期的に更新される。尚、文書DB8は、装置1本体のハードウェア資源(記憶装置)に構築することに限定することなく、ネットワークを介したハードウェア資源(サーバ)に構築してもよい。
地名抽出部4は、前記取得された文書群からスポットSの住所Addrに含まれる地名A1,…,Anを抽出する。この地名の抽出にあたり、同じスポット名だが住所が異なるスポットが複数ある場合、対象のスポット以外を表す地名は除外する。
例えば、同じ「八坂神社」というスポット名のスポットが京都府と長崎県にあり、それぞれの住所が「京都府」「京都市」「東山区」「祇園町」という地名と、「長崎県」「長崎市」「鍛治屋町」という地名からなるとする。ローカル度を算出したい対象のスポットは京都の八坂神社で、文書中に「長崎県長崎市」という地名が抽出された場合、「長崎県」「長崎市」のどちらも「京都府」の下位の階層にないため、抽出された「長崎県長崎市」の地名は以後用いない。このように、対象とするスポットの住所に含まれる地名の下位の階層にない地名を含む場合、その地名は異なるスポットを表すとして除外する。
前記地名の抽出にあたり、一つの文書中に前記対象のスポットの住所に含まれる地名がある場合、任意の方法によって一つの地名のスコアを用いるとよい。例えば、最も下位の地名の地名スコアや、全ての地名スコアを平均したスコアなどを用いてよい。
また、前記地名の抽出にあたり、ある文書から対象のスポットの住所を探した結果、そのスポットの住所そのものが在った場合、飲食店の一覧を掲載している文書等そのスポットの情報について主に述べているわけではない文書を前記抽出の対象にしてしまうことがある。若しくは、スポットの正式な住所を形式的に掲載している部分を後述の支持スコアに反映してしまうことがあり、ローカル度の算出に精度が下がる可能性があるので、当該住所そのものについては除外するとよい。
または、前記地名の抽出にあたり、地名の周辺に出現する語に基づき特定する技術(1),その地名の有名度などに基づき特定する技術(2)のいずれか、若しくは、技術(1)(2)を組合せたものを適用してもよい(非特許文献3)。技術(1)では、実世界での位置が特定されていない地名と獲得文書中で共起する他の地名の実世界での位置との地理的距離が最短となる候補を当該地名の実世界での位置と特定する。技術(2)では、地名の候補の最大の有名度(例えば店舗数)を全候補の和で割った値を尤度とし、この尤度が閾値よりも大きい場合に有名度が最大となる候補を当該地名の実世界での位置と特定する。
支持スコア計算部5は、前記取得された文書群の範囲で、前記抽出された地名A1,…,Anとスポット名Nとの共起回数を地名A1,…,Anの支持スコアCA1,…,CAnとして算出する。
ローカル度計算部6は、地名スコアGA1,…,GAn及び支持スコアCA1,…,CAnと、検索範囲として指定された地名Auの階層以上の階層にある地名の地名スコアの地理スコア並びに支持スコアとに基づき、スポットSのローカル度Lを計算する。より具体的には、地名Auの階層より下の階層にある地名Au+1,…,Anについて、支持スコアCAu+1,…,CAnを地理スコアGAu+1,…,GAnでそれぞれ重み付けした総和の値と、Auの階層以上の階層にある各地名A1,…,Auの支持スコアC1,…,CAuを地理スコアGA1,…,GAuでそれぞれ重みづけをした総和の値について、前者の値が大きいほど、また後者の値が小さいほど値が大きくなるように、スポットSのローカル度Lを算出する。
あるスポットがユーザの指定した地名の地名スコア的な階層以下の階層の地域で有名な場合、当該スポットの名称は前記指定された地名の階層よりも下位の階層の地名と伴って表れることが多い。ローカル度は、ユーザが検索範囲として指定した地名よりも地名スコア的に下位の階層にある地名についてはプラスに作用するが、検索範囲の地名を含む上位の階層にある地名についてはペナルティとして作用する。したがって、スポットSのローカル度Lは以下の式(1)の演算によって算出できる。
Figure 0005778643
ローカル度Lの算出方法はこれに限らず、検索範囲の地名を含む上位の階層にある地名についてはペナルティとして作用するような方法であればよく、例えば以下の式(1)’の演算によって算出してもよい。
Figure 0005778643
また、ペナルティを考慮せず、Auの階層より下の階層にある地名についてのみ計算してもよい。
検索範囲の地名Auは対象とするスポットSの住所に含まれる地名A1,…,Anに含まれる地名であればどれでもよく、地名の階層も特に限定しない。地名Auは、ユーザが入力デバイス(キーボード、マウス等)の操作によって指定したものであってもよいし、ユーザがネットワーク(インターネット等)を介して端末にて地図情報を閲覧している場合に当該地図情報の範囲内から自動的に取得したものであってもよい。
式(1)及び式(1)’のパラメータαはそのペナルティの重みを調整する変数とし、地名スコア的に上位の階層にある地名との共起がどの程度ペナルティとして作用するかを調整する。ペナルティを考慮しない場合には、式(1)のαを0とし、式(1)’の右辺第2項が1となるように値を設定する。
ローカルスポット判断部7は、前記算出されたスポットSのローカル度Lの値に基づきスポットSがローカルスポットであるかを判断する。ローカル度Lは、より狭い範囲を表す地名との共起が多いほど高くなるが、より広い範囲を表す地名との共起が多いほど全国的にも有名なスポットとして考えられるため低くなる。複数のスポットがある場合、それぞれのローカル度Lを計算し、ローカル度Lが高いスポットほどその周辺地域に特化した人気があるということを表す。具体的にはスポットSのローカル度Lが閾値を越えている場合、スポットSはローカルスポットであると判断する。前記閾値は任意に設定可能である。尚、複数のスポットの中から周辺地域に特化して人気なスポットを探したい場合、ローカル度Lを高い順にソートし、ローカル度Lの値が上位k件のスポットをローカルスポットと判断するようにしてもよい。
(処理手順の説明)
図2を参照しながら具体例に基づき本実施形態におけるローカルスポットの判別手順について説明する。
具体例では、住所「京都府長岡京市天神2丁目15番13号」のスポット「長岡天満宮」と、住所「京都府長岡京市天神1丁目14番1号」のスポット「まんぷく食堂」の2つのスポットを入力データとした。また、後述のS4での地名スコアの算出には当該地名の「人口」が利用されている。
S1:入力デバイスまたはネットワークを介してスポット名「長岡天満宮」並びに当該スポットの住所「京都府長岡京市天神2丁目15番13号」さらに検索範囲として指定された地名「京都」が装置1内に入力される。尚、本事例では前記指定された検索範囲よりも広い範囲を表す地名によるペナルティを調整する式(1)のパラメータαは「1」に設定されている。
本事例では「住所」の記載において番地以前の部分のみを区切ったものを地名としている。入力されたスポットの住所は地名スコア的に上位から順に「京都府」「長岡京市」「天神」の3つの地名を有するものであると判断され、これらの地名と後述のS3〜S7の処理に供される地名A1〜A3との対応関係は以下の式(2)〜(4)の通りとなっている。
Figure 0005778643
S2:文書獲得部3は、スポット名「長岡天満宮」の入力を受けるとこのスポット名を含む文書(例えばブログ記事)を文書DB8から任意の数(例えば1000件)だけ取得する。
S3:地名抽出部4は、S2で取得された文書群から住所「京都府長岡京市天神」に含まれる地名を抽出する。
例えば文書「京都にある長岡天満宮にいった。」の場合には「京都府」が抽出される。文書「天神1丁目にできたまんぷく食堂でランチ。」の場合には「京都府長岡京市天神」が抽出される。また、文書「横浜にあるまんぷく食堂にいった。」は、「横浜市」が表す範囲は「京都府」「長岡京市」「天神」のどの地名が表すエリアにも当てはまらないので、対象としたスポット「長岡天満宮」について述べた記事ではないと判断される。このように対象のスポットの住所が持つ地名の範囲外にある地名は除外される。
S4:地名スコア計算部2は、スポット「長岡天満宮」の住所「京都府長岡京市天神」を構成する地名「京都府」「長岡京市」「天神」について「人口」に基づき地名スコアを算出する。地名「京都府」「長岡京市」「天神」の地名スコアGA1,GA2,GA3は各々例えば以下の式(5)〜(7)で示した通りとなる。尚、S4では、地名の地理情報が示す範囲(例えば面積、人口、住所数等)の階層に基づき任意の値(例えば階層の上位の順に「京都府」「長岡京市」「天神」に対してそれぞれ10点、5点、3点)で設定してもよい。
Figure 0005778643
S5:支持スコア計算部5は、「長岡天満宮」を含む文書群(例えば1000件)の範囲で、S3にて抽出した地名「京都府」「長岡京市」「天神」とスポット名「長岡天満宮」との共起回数を当該各地名の支持スコアとして算出する。地名「京都府」「長岡京市」「天神」の支持スコアCA1,CA2,CA3は各々例えば以下の式(8)〜(10)の通りとなる。
Figure 0005778643
S6:ローカル度計算部6はS4,S5でそれぞれ算出された地名「京都府」「長岡京市」「天神」の地名スコア,支持スコアをパラメータとする式(1)による演算によって「長岡天満宮」のローカル度Lを算出する。
具体的には式(6)(7)(9)(10)の数値及び前記検索範囲として指定された「京都」に対応した式(5)(8)の数値を以下の式(11)に代入した演算により以下の式(12)で示した値が「長岡天満宮」のローカル度L(長岡天満宮)として算出される。
Figure 0005778643
S7:ローカルスポット判断部7は、S6で算出したスポット「長岡天満宮」のローカル度Lの値「−1050351.5」に基づきスポットSがローカルスポットであるかを判断する。当該ローカル度Lの値が閾値を越えている場合、同判断部7は「長岡天満宮」はローカルスポットであると判断する。
次いで、S1で入力されたスポット名「まんぷく食堂」とその住所「京都府長岡京市天神1丁目14番1号」及び検索範囲の地名「京都」が上述のS2〜S7の処理に供されて当該スポットがローカルスポットであるかが判断される。
S5では、「まんぷく食堂」を含む文書群(例えば1000件)の範囲で、S3にて抽出された地名「京都府」「長岡京市」「天神」とスポット名「まんぷく食堂」との共起回数が当該スポットに基づく当該各地名の支持スコアとして算出される。地名「京都府」「長岡京市」「天神」の支持スコアCA1,CA2,CA3は各々例えば以下の式(13)〜(15)の通りとなる。
Figure 0005778643
S6では、S4,S5で各々算出された地名「京都府」「長岡京市」「天神」の地名スコア,支持スコアをパラメータとする式(1)による演算によって「まんぷく食堂」のローカル度Lが算出される。
具体的には上記の式(6)(7)(14)(15)の数値及び前記検索範囲として指定された「京都」に対応した式(5)(13)の数値を以下の式(16)に代入した演算により以下の式(17)で示した値が「まんぷく食堂」のローカル度L(まんぷく食堂)として算出される。
Figure 0005778643
S7では、S6で算出されたスポット「まんぷく食堂」のローカル度Lの値「−131207.04」に基づきスポットSがローカルスポットであるかを判別される。具体的には当該ローカル度Lの値が閾値を越えている場合、「まんぷく食堂」はローカルスポットであると判断される。
また、S7では、算出したスポット「まんぷく食堂」のローカル度Lの値と先に算出したスポット「長岡天満宮」のローカル度Lの値との比較によりどちらのスポットがローカルなスポットであるかを判断する。式(12)(17)の値から明らかなようにローカル度L(長岡天満宮)<ローカル度L(まんぷく食堂)であるので「まんぷく食堂」は「長岡天満宮」よりもローカルなスポットであることが判る。
以上の処理手順S1〜S7で得られた判別結果は出力デバイス(モニタ等)またはネットワークを介したユーザの端末に出力される。
(本実施形態の効果)
以上のようにローカルスポット判別装置1によれば判定対象のスポットがある周辺地域に特化して人気が高いローカルスポットであるかどうかを判断する際に当該スポットのローカル度の高さを把握できる。これにより、特定の住所表現を有するスポットがローカルスポットであるかを判断できる。
特に、ローカル度に閾値が適宜に設けられることでローカルスポットを客観的に判断できる。
また、一つの地域内に判定対象のスポットが複数在る場合、これらのスポットをローカル度の高い順に並べることができ、ローカル度の高い単数または複数のローカルスポットを抽出できる。
さらに、判定対象のスポットの住所に含まれる地名の地理範囲に応じた階層に基づく値を示す地名スコアが当該地名のローカル度の演算に供されることで、当該地名の地理情報に依存した有名スポットの判別が行える。
また、予め定めた検索範囲に応じたローカルスポットを抽出することができる。
(本発明のプログラムとしての態様)
本発明はローカルスポット判別装置1を構成する上記の機能部2〜7の一部若しくは全てとしてコンピュータを機能させるプログラムで構成しこれを当該コンピュータに実行させることで実現できる。または、ローカルスポット判別装置1が実行する上記の手順S1〜S7の一部若しくは全てをコンピュータに実行させるプログラムで構成しこれを当該コンピュータに実行させることで実現できる。そして、前記プログラムをそのコンピュータが読み取り可能な周知の記録媒体、例えば、FD(Floppy(登録商標) Disk)や、MO(Magneto‐Optical disk)、ROM(Read Only Memory)、メモリカード、CD(Compact Disk)‐ROM、DVD(Digital Versatile Disk)‐ROM、CD‐R、CD‐RW、HDD、SSD、リムーバブルディスクなどに記録して、保存したり、配布したりすることが可能である。さらに、前記プログラムをインターネットや電子メール等でネットワークを介して提供することも可能である。
1…ローカルスポット判別装置
2…地名スコア計算部(地理スコア計算手段)
3…文書獲得部
4…地名抽出部
5…支持スコア計算部(支持スコア計算手段)
6…ローカル度計算部(ローカル度計算手段)

Claims (7)

  1. 対象スポットがその周辺地域に特化して人気のあるローカルスポットであるかを判断するローカルスポット判別装置であって、
    対象スポットの名称を含む文書の群から抽出された当該スポットの住所に含まれる各地名の出現頻度に基づき当該各地名の支持スコアを算出する支持スコア計算手段と、
    前記住所に含まれる予め定めた階層より下の階層にある地名に対して、前記地名が表す地理範囲が狭いほど小さくなるように決定した前記各地名の地理スコア、前記算出された前記各地名の支持スコアに基づき重み付けして加算した当該スポットのローカル度を算出するローカル度計算手段と
    を備えたこと
    を特徴とするローカルスポット判別装置。
  2. 前記ローカル度計算手段は、前記住所に含まれる予め定めた階層より下の階層にある地名に対して、前記各地名の前記地理スコア、前記各地名の前記支持スコアに基づき重み付けして加算した値と、前記予め定めた階層以上の階層にある地名に対して、前記各地名の前記地理スコア、前記各地名の前記支持スコアに基づき重み付けして算出した値を用い、前者の値が大きいほど、また後者の値が小さいほど値が大きくなるようにローカル度を算出すること
    を特徴とする請求項1に記載のローカルスポット判別装置。
  3. 前記地名が表す地理範囲が狭いほど小さくなるように決定した値は前記地名の地理情報が示す範囲の面積、前記範囲内の人口、前記範囲内の住所数のいずれかに基づき設定された値であることを特徴とする請求項1または2に記載のローカルスポット判別装置。
  4. 対象スポットがその周辺地域に特化して人気のあるローカルスポットであるかを判断するローカルスポット判別方法であって、
    支持スコア計算手段が対象スポットの名称を含む文書の群から抽出された当該スポットの住所に含まれる各地名の出現頻度に基づき当該各地名の支持スコアを算出するステップと、
    ローカル度計算手段が前記住所に含まれる予め定めた階層より下の階層にある地名に対して、前記地名が表す地理範囲に応じて狭いほど小さくなるように決定した前記各地名の地理スコア、前記算出された前記各地名の支持スコアに基づき重み付けして加算した当該スポットのローカル度を算出するステップと
    を有すること
    を特徴とするローカルスポット判別方法。
  5. 前記ローカル度を計算するステップでは、前記住所に含まれる予め定めた階層より下の階層にある地名に対して、前記各地名の前記地理スコア、前記各地名の前記支持スコアに基づき重み付けして加算した値と、前記予め定めた階層以上の階層にある地名に対して、前記各地名の前記地理スコア、前記各地名の前記支持スコアに基づき重み付けして算出した値を用い、前者の値が大きいほど、また後者の値が小さいほど値が大きくなるようにローカル度を算出すること
    を特徴とする請求項4に記載のローカルスポット判別方法。
  6. 前記地名が表す地理範囲が狭いほど小さくなるように決定した値は前記地名の地理情報が示す範囲の面積、前記範囲内の人口、前記範囲内の住所数のいずれかに基づき設定されることを特徴とする請求項4または5に記載のローカルスポット判別方法。
  7. コンピュータを請求項1から3のいずれか1項に記載のローカルスポット判別装置を構成する各手段として機能させることを特徴とするローカルスポット判別プログラム。
JP2012198026A 2012-09-10 2012-09-10 ローカルスポット判別装置、ローカルスポット判別方法及びローカルスポット判別プログラム Active JP5778643B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012198026A JP5778643B2 (ja) 2012-09-10 2012-09-10 ローカルスポット判別装置、ローカルスポット判別方法及びローカルスポット判別プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012198026A JP5778643B2 (ja) 2012-09-10 2012-09-10 ローカルスポット判別装置、ローカルスポット判別方法及びローカルスポット判別プログラム

Publications (2)

Publication Number Publication Date
JP2014052926A JP2014052926A (ja) 2014-03-20
JP5778643B2 true JP5778643B2 (ja) 2015-09-16

Family

ID=50611332

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012198026A Active JP5778643B2 (ja) 2012-09-10 2012-09-10 ローカルスポット判別装置、ローカルスポット判別方法及びローカルスポット判別プログラム

Country Status (1)

Country Link
JP (1) JP5778643B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6031164B1 (ja) * 2015-07-24 2016-11-24 日本電信電話株式会社 スポット判定装置、スポット判定方法、および、スポット判定プログラム

Also Published As

Publication number Publication date
JP2014052926A (ja) 2014-03-20

Similar Documents

Publication Publication Date Title
Yin et al. Adapting to user interest drift for poi recommendation
CN104156436B (zh) 一种社交云媒体协同过滤推荐方法
CN103795613B (zh) 一种在线社交网络中朋友关系预测的方法
Fujimura et al. Topigraphy: visualization for large-scale tag clouds
JP5738358B2 (ja) 移動パターンマイニング装置及び方法
JP6247775B2 (ja) 時系列予測装置、及び時系列予測方法
JP7092194B2 (ja) 情報処理装置、判定方法、及びプログラム
JP5778643B2 (ja) ローカルスポット判別装置、ローカルスポット判別方法及びローカルスポット判別プログラム
CN104850623B (zh) 多维度数据分析模型动态扩展方法和系统
JP2018124617A (ja) 教師データ収集装置、教師データ収集方法、及びプログラム
JP5734118B2 (ja) ソーシャルネットワークから小集団を抽出し、名前付け、並びに可視化する方法およびプログラム
JP5778642B2 (ja) 有名スポット判別装置、有名スポット判別方法及び有名スポット判別プログラム
JP5903376B2 (ja) 情報推薦装置、情報推薦方法、及び情報推薦プログラム
JPWO2011070979A1 (ja) 辞書作成装置、単語収集方法、及び、プログラム
CN110580304A (zh) 数据融合方法、装置、计算机设备及计算机存储介质
CN112738756B (zh) 一种物联网设备数据收集方法及装置
JP5727541B2 (ja) 目的来店施設情報提供装置及び方法及びプログラム
JP5462713B2 (ja) Webページ収集装置、方法及びプログラム
KR20180137387A (ko) 중첩 커뮤니티 검출 장치 및 방법
KR101083476B1 (ko) 문서의 위치 정보를 이용한 문서 순위 산출 시스템 및 방법
Katragadda et al. An unsupervised approach to identify location based on the content of user’s tweet history
JP5199968B2 (ja) キーワードタイプ判定装置、キーワードタイプ判定方法およびキーワードタイプ判定プログラム
JP5650607B2 (ja) 文書検索キーワード提示装置及び方法
JP5806971B2 (ja) 地域推定装置及び方法及びプログラム
JP2013004013A (ja) プロファイル更新装置およびその制御方法、ならびに、プロファイル更新用プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141017

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150707

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150709

R150 Certificate of patent or registration of utility model

Ref document number: 5778643

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150