JP5806974B2 - 近隣情報検索装置及び方法及びプログラム - Google Patents

近隣情報検索装置及び方法及びプログラム Download PDF

Info

Publication number
JP5806974B2
JP5806974B2 JP2012113850A JP2012113850A JP5806974B2 JP 5806974 B2 JP5806974 B2 JP 5806974B2 JP 2012113850 A JP2012113850 A JP 2012113850A JP 2012113850 A JP2012113850 A JP 2012113850A JP 5806974 B2 JP5806974 B2 JP 5806974B2
Authority
JP
Japan
Prior art keywords
event
information
reputation
time
reputation information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012113850A
Other languages
English (en)
Other versions
JP2013242620A (ja
Inventor
宜仁 安田
宜仁 安田
正彬 西野
正彬 西野
佐藤 大祐
大祐 佐藤
良治 片岡
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012113850A priority Critical patent/JP5806974B2/ja
Publication of JP2013242620A publication Critical patent/JP2013242620A/ja
Application granted granted Critical
Publication of JP5806974B2 publication Critical patent/JP5806974B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、近隣情報検索装置及び方法及びプログラムに係り、特に、指定地点の近隣における有用な情報を検索するための近隣情報検索装置及び方法及びプログラムに関する。
従来より、住所や地図上の地点を指定することによって、近隣での有用な情報を提示する装置が知られている。これは、例えば、外出先において、インターネットに接続された携帯端末等を用いて、現在地の近隣において人気のレストランについての情報を得るといった目的のために利用されている。例えば、社会的評価を反映した近隣ランドマークの検索方法が提案されている(例えば、特許文献1参照)。
上記の手段の代替として、Web上の文書から行事や催し物等のイベント情報を抽出する技術(例えば、非特許文献1参照)と、文書を解析して、対象に対する評価情報を抽出する従来技術(例えば、非特許文献2参照)とを組み合わせることで、あるいは起こっているイベントのうち評判の良いものを提示することで、近隣での有用な情報を提示する方法も考えられるであろう。
特開2007-011933号公報
斉藤隆太、石野亜耶、難波英嗣、竹澤寿幸、"新聞記事とWebからのイベント情報の自動抽出"、電子情報通信学会第20回Webインテリジェンスとインタラクション研究会, 2011. 乾孝司、奥村学、"テキストを対象とした評価情報の分析に関する研究動向"、自然言語処理, Vol. 13, No.3, pp. 201-241.
しかしながら、従来技術によれば、レストランやランドマークといった、ある場所に永続的に存続するものしか取り扱えないため、一時的に存在するようなものには使えないという問題がある。
また、既存のイベント抽出技術と評判分析技術を用いた場合には、永続的に存在しないようなイベントを対象とできるが、イベント抽出によって取り出されたイベントのうち、さらに評判情報の評価が高いもののみを対象とすることになるため、数が限定されてしまうという問題がある。
本発明は、上記の点に鑑みなされたもので、永続的に存在せず、一時的に存在するような行事や催し物も含めて有用な近隣情報を提示することが可能な近隣情報検索装置及び方法及びプログラムを提供することを目的とする。
上記の課題を解決するため、本発明(請求項1)は、指定地点の近隣における有用な情報を検索するための近隣情報検索装置であって、
文書データ入力されると、評判情報を抽出し、各評判情報について時刻表現と地理表現が結びつくものを抽出し、評判情報記憶手段に格納する評判情報抽出手段と、
前記評判情報記憶手段から未来の時刻を属性として持つ評判情報を抽出し、時刻、地理座標が一致もしくは類似する情報をクラスタリングし、クラスタ毎に各クラスタに含まれる評価極性の総数に対するポジティブな評価極性の比率を求め、該比率が所定の閾値よりも高いものを、期待されているイベントとして抽出するイベント抽出手段と、
指定位置の座標が入力されると、該座標と前記イベント抽出手段で抽出された前記イベントと該イベントの比率についてスコアを算出し、該スコアが高い順にk件出力するイベント選定手段と、を有する。
また、本発明(請求項2)は、前記イベント選定手段において、
前記スコアを、前記イベントと該イベントの比率の対について、該イベントの座標と前記指定位置の座標との距離、該イベントの時刻と現在時刻との時間から算出する手段を含む。
本発明によれば、事前に設定されたデータベース中のランドマークのみを対象とする必要がないので、永続的に存在せず、一時的に存在するような行事や催し物も含めて有用な近隣情報を提示することができる。
また、イベントの名称の表記にゆれがある場合であってもイベントを抽出することが可能となるため、検出可能なイベントを増やすことができる。
本発明の一実施の形態における近隣情報検索装置の構成図である。 本発明の一実施の形態における動作の概要のフローチャートである。 本発明の一実施の形態における評判情報抽出処理部のフローチャートである。 本発明の一実施の形態におけるステップ11の出力例である。 本発明の一実施の形態における評判情報抽出処理部の出力例である。 本発明の一実施の形態におけるイベント抽出処理部のフローチャートである。 本発明の一実施の形態におけるイベント選定部のフローチャートである。
以下、図面と共に本発明の実施の形態を説明する。
図1は、本発明の一実施の形態における近隣情報検索装置の構成を示す。
同図に示す近隣情報検索装置は、データ入力部1、評判情報抽出処理部2、評判情報記憶部3、イベントと期待度の抽出部4、イベント選定部5から構成される。
図2は、本発明の一実施の形態における概要動作のフローチャートである。
ステップ0) データ入力部1は、文書群をデータとして受け取る、特に、Web等から収集した大量の文書群を想定している。
ステップ1) 評判情報抽出処理部2は、入力された文書群から評判情報を抽出する。詳細な動作を図3に示す。
ステップ11) まず、入力文書群に対して、評判情報を抽出する。これには、非特許文献2に代表されるような、テキストからの評判情報を抽出し、対象(イベント名)と評価極性を同定する、従来手法を利用することができる。この結果の例を図4に示す。ここで、評価極性は対象に対して肯定的、積極的であるならP,否定的、消極的であるならNとする。
ステップ12) 次に、抽出された各評判情報について、それが結びつく時刻表現、地理表現を探し、時刻情報、地理座標を取得する。結びつく時刻表現、地理表現の探索範囲は、評判情報の対象を含む文・及びその前後一定数の文である。あるいは、同一の段落としてもよい。
時刻表現とは、時刻を直接記述したもの(3月4日、18時、2012年4月12日等)や、相対的な時間の指定(3時間前、明日、明後日、来月等)のことを指す。相対的な時刻表現は、特開2011-086152号公報で示されるような従来手法を用いて絶対時刻に変換する。
地理表現とは、地名(神奈川県,神奈川県鎌倉市)、ランドマーク名(東京駅、東京スカイツリー)等のことである。地理表現の抽出及び、地理表現に対する地理座標の割り当てには、文献「平野徹,松尾義博,菊井玄一郎,「地理的距離と有名度を用いた地名の曖昧性解消」,情報処理学会全国大会講演論文集, 2008.」で示されるような従来手法を用いることができる。
評判情報のうち、時間情報と地理座標のどちらも見つかったものについて、その時刻、場所とともに評判情報を評判情報記憶部3に格納する。図5に評判情報抽出処理部2から評判情報記憶部3に格納された情報の例を示す。
ステップ2) イベントと期待度の抽出部4は、評判情報記憶部3を参照し、期待されているイベント群について、イベントの情報と期待度の対を出力する。
イベントと期待度の抽出部4の動作を図6のフローチャートを用いて説明する。
ステップ21) まず、評判情報記憶部3に記憶されている評判情報のうち、未来の時刻を属性として持つものを取り出す。次に、時刻、地理座標が類似、もしくは一致し、評価対象が類似する情報をそれぞれクラスタとしてまとめる。クラスタリングの手法は当業者に公知の各種技術を用いることができる。時刻、地理座標に利用する類似度としては、例えば、2つのイベントの時間の差、位置の差をユークリッド距離として得ることができる。また、評価対象の文字列の類似には当業者に公知の編集距離を用いることができる。
ステップ22) 以下の処理をまとめたグループ毎に行う。
ステップ23) 上記の手順によって得たクラスタ毎に、そのクラスタに含まれる総数に対するポジティブな評価極性の比率ppを調べる。比率ppが事前に設定した定数閾値よりも高ければステップ24に移行する。
ステップ24) 評判対象の表現を期待されているイベントとして取り扱い、当該評価に対する評判情報記憶部3のエントリと、比率ppの対を出力する。
ステップ3) イベント選定部5の処理を図7に示す。
ステップ31)イベント選定部5への入力は2種類ある。1つは装置に入力された指定位置の座標xである。もう一つは、イベントと期待度の抽出部4によって出力された、期待されているイベントの情報と期待度の対の集合である。
入力中の全てのイベント−期待度の対(e,c)について、以下のスコアScore(e,c)
を算出する。
Score(e,c)=αdist(x,e)+βtime(n,e)+γc
ここで、dist(,e)は、イベントeの座標と座標の距離であり、time(n,e)はイベントeの時刻と現在時刻nとの時間であり、α、β、γは事前に定めたパラメータ定数である。
ステップ32) イベント選定部5は、上記のスコアが高いイベントから上位k件(kは事前に定められた定数)を出力する。
上記のように、本発明では、名称の表記にゆれがあっても、イベントが行われる場所、時間は一致することに着目し、同一場所・時間で、評価極性がP(ポジティブ)であるものをイベントの候補としてまとめることで、精度を失うことなく、多数の期待されているイベントを抽出することができる。
また、距離、時間、期待度に応じて候補イベントをスコア付けし、このスコアが高いものから提示することで有用な情報を提示することが可能となる。
なお、上記の図1に示す近隣情報検索装置の各構成要素の動作をプログラムとして構築し、近隣情報検索装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
1 データ入力部
2 評判情報抽出処理部
3 評判情報記憶部
4 イベントと期待度の抽出部
5 イベント選定部

Claims (5)

  1. 指定地点の近隣における情報を検索するための近隣情報検索装置であって、
    文書データ入力されると、評判情報を抽出し、各評判情報について時刻表現と地理表現が結びつくものを抽出し、評判情報記憶手段に格納する評判情報抽出手段と、
    前記評判情報記憶手段から未来の時刻を属性として持つ評判情報を抽出し、時刻、地理座標が一致もしくは類似する情報をクラスタリングし、クラスタ毎に各クラスタに含まれる評判情報から評判の良さを表す期待度を求め、期待度が所定の閾値よりも高いものを、期待されているイベントとして抽出し、該イベントとその期待度の対を出力するイベント抽出手段と、
    指定位置の座標が入力されると、該座標と前記期待度に基づいて、前記イベント抽出手段で抽出された前記イベントとその期待度の対に対するスコアを算出し、該スコアが高い順にk件出力するイベント選定手段と、
    を有することを特徴とする近隣情報検索装置。
  2. 前記イベント選定手段は、
    前記スコアを、前記イベントとその期待度の対について、該イベントの座標と前記指定位置の座標との距離、該イベントの時刻と現在時刻との時間から算出する手段を含む
    請求項1記載の近隣情報検索装置。
  3. 指定地点の近隣における有用な情報を検索するための近隣情報検索方法であって、
    文書データ入力されると、評判情報を抽出し、各評判情報について時刻表現と地理表現が結びつくものを抽出し、評判情報記憶手段に格納する評判情報抽出ステップと、
    前記評判情報記憶手段から未来の時刻を属性として持つ評判情報を抽出し、時刻、地理座標が一致もしくは類似する情報をクラスタリングし、クラスタ毎に各クラスタに含まれる評判情報から評判の良さを表す期待度を求め、期待度が所定の閾値よりも高いものを、期待されているイベントとして抽出し、該イベントとその期待度の対を出力するイベント抽出ステップと、
    指定位置の座標が入力されると、該座標と前記期待度に基づいて、前記イベント抽出ステップで抽出された前記イベントとその期待度の対に対するスコアを算出し、該スコアが高い順にk件出力するイベント選定ステップと、
    コンピュータが行うことを特徴とする近隣情報検索方法。
  4. 前記イベント選定ステップにおいて、
    前記スコアを、前記イベントとその期待度の対について、該イベントの座標と前記指定位置の座標との距離、該イベントの時刻と現在時刻との時間から算出する
    請求項3記載の近隣情報検索方法。
  5. コンピュータを、
    請求項1または2に記載の近隣情報検索装置の各手段として機能させるための近隣情報検索プログラム。
JP2012113850A 2012-05-17 2012-05-17 近隣情報検索装置及び方法及びプログラム Expired - Fee Related JP5806974B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012113850A JP5806974B2 (ja) 2012-05-17 2012-05-17 近隣情報検索装置及び方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012113850A JP5806974B2 (ja) 2012-05-17 2012-05-17 近隣情報検索装置及び方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2013242620A JP2013242620A (ja) 2013-12-05
JP5806974B2 true JP5806974B2 (ja) 2015-11-10

Family

ID=49843467

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012113850A Expired - Fee Related JP5806974B2 (ja) 2012-05-17 2012-05-17 近隣情報検索装置及び方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5806974B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7923373B2 (en) 2007-06-04 2011-04-12 Micron Technology, Inc. Pitch multiplication using self-assembling materials
US7790531B2 (en) 2007-12-18 2010-09-07 Micron Technology, Inc. Methods for isolating portions of a loop of pitch-multiplied material and related structures

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004234288A (ja) * 2003-01-30 2004-08-19 Nippon Telegr & Teleph Corp <Ntt> Web検索方法及び装置、Web検索プログラム並びにそのプログラムを記録した記録媒体
JP4496900B2 (ja) * 2004-09-10 2010-07-07 日本電信電話株式会社 イベント情報抽出装置及びプログラム
JP4148522B2 (ja) * 2004-11-19 2008-09-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 表現検出システム、表現検出方法、及びプログラム
JP5345987B2 (ja) * 2010-08-18 2013-11-20 日本電信電話株式会社 文書検索装置、文書検索方法および文書検索プログラム
JP5541049B2 (ja) * 2010-09-29 2014-07-09 大日本印刷株式会社 データ生成装置、データの生成方法及びデータ生成プログラム

Also Published As

Publication number Publication date
JP2013242620A (ja) 2013-12-05

Similar Documents

Publication Publication Date Title
EP3153978B1 (en) Address search method and device
CN108287843B (zh) 一种兴趣点信息检索的方法和装置、及导航设备
CN106033416B (zh) 一种字符串处理方法及装置
WO2018177316A1 (zh) 信息识别方法、计算设备及存储介质
CN107203526B (zh) 一种查询串语义需求分析方法及装置
JP5087377B2 (ja) 地理的情報を含む文書群の検索装置、検索方法、検索プログラムおよびそのプログラムを記録した記録媒体
US11455344B2 (en) Computer implemented system and method for geographic subject extraction for short text
Rousell et al. Extraction of landmarks from OpenStreetMap for use in navigational instructions
JP2014154137A (ja) 移動パターンマイニング装置及び方法
US20180260473A1 (en) Full text retrieving and matching method and system based on lucene custom lexicon
JP6662689B2 (ja) 単語判定装置
JP5806974B2 (ja) 近隣情報検索装置及び方法及びプログラム
Kim et al. Harvesting large corpora for generating place graphs
Blank et al. Geocoding place names from historic route descriptions
Berman et al. Historical gazetteer system integration: Chgis, regnum francorum, and geonames
JP5977199B2 (ja) 地域連想語抽出装置、地域連想語抽出方法及び地域連想語抽出プログラム
JP5826148B2 (ja) 図面管理サーバ及びこれを用いた図面管理システム
JP5801252B2 (ja) イベント抽出装置及び方法及びプログラム
KR20110076089A (ko) 이미지 중복 제거시의 대표 이미지 선택 방법 및 시스템
JP5792871B1 (ja) 代表スポット出力方法、代表スポット出力装置および代表スポット出力プログラム
JP5670944B2 (ja) 文書要約装置及び方法及びプログラム
JP5583107B2 (ja) キーワード地名ペア抽出装置及び方法及びプログラム
JP2012113422A (ja) 文書処理装置、方法、及びプログラム
JP5650607B2 (ja) 文書検索キーワード提示装置及び方法
JP3812799B2 (ja) 文書集合特徴化方法および該方法を用いた文書集合検索方法およびそれらの装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141020

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150707

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150812

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150901

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150907

R150 Certificate of patent or registration of utility model

Ref document number: 5806974

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees