JP2013228888A - 地域推定装置及び方法及びプログラム - Google Patents

地域推定装置及び方法及びプログラム Download PDF

Info

Publication number
JP2013228888A
JP2013228888A JP2012100488A JP2012100488A JP2013228888A JP 2013228888 A JP2013228888 A JP 2013228888A JP 2012100488 A JP2012100488 A JP 2012100488A JP 2012100488 A JP2012100488 A JP 2012100488A JP 2013228888 A JP2013228888 A JP 2013228888A
Authority
JP
Japan
Prior art keywords
document
expression
information
index
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012100488A
Other languages
English (en)
Other versions
JP5806971B2 (ja
Inventor
Naoki Fujita
尚樹 藤田
Yoshihiko Kazuhara
良彦 数原
Yoshihito Yasuda
宜仁 安田
Ryoji Kataoka
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012100488A priority Critical patent/JP5806971B2/ja
Publication of JP2013228888A publication Critical patent/JP2013228888A/ja
Application granted granted Critical
Publication of JP5806971B2 publication Critical patent/JP5806971B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】 地名表現がない文書であっても、当該文書に対応する地理を推定する。
【解決手段】 本発明は、入力された文書が地名を含む場合は、固有表現、地名表現、該地名表現に対応する緯度経度の地理情報を抽出し、地名を含まない場合は、固有表現のみを抽出して文書情報記憶手段に格納し、文書情報記憶手段から、固有表現と地理情報の組み合わせを取得して、該固有表現をキーとし、該地理情報を対応付けた固有表現−地理インデクスを生成し、固有表現−地理インデクスの地理情報から不要なデータを削除し、文書情報記憶手段から文書毎の文書IDと固有表現と地理情報を取得し、該文書に地理情報がある場合は、文書IDと地理情報を出力し、該地理情報がない場合は、固有表現と、インデクス記憶手段から取得した固有表現に対応する地理情報を文書IDと共に出力する。
【選択図】 図1

Description

本発明は、文書から地名や住所情報抽出のための地域推定装置及び方法及びプログラムに係り、特に、文書に地名や住所等の地域に関連する語を含まない場合に、文書内の他の固有表現などの情報から文書に対応する地域を推定するための地域推定装置及び方法及びプログラムに関する。
文書から固有表現を抽出する手法がある(例えば、特許文献1参照)。当該手法により文書内の固有表現を抽出できる。また、固有表現抽出の際に、その固有表現が人名であるか地名であるかなどの種類の判定も可能であり、その手法を用いることで文書から地名のみを抽出することが可能である。抽出された地名表現に対して、実世界での位置を一意に決定する手法がある(例えば、特許文献2、非特許文献1参照)。当該手法では、文書内の各地名に対応する実世界の位置候補の情報をデータベースに保存しておき、そのレコードを用いている。
特開2011-198051号公報 特許第4510792号公報
平野徹、他:地理的距離と有名度を用いた地名曖昧性解消 情報処理学会全国大会 2008.
しかしながら、上記の従来の手法では、事前に登録しておいた"地名表現⇔地理情報"のレコードを用いて、地名表現から地理情報を特定するため、地名表現が含まれない文書に対しては地理情報を対応づけられない。
また、地名表現以外の固有表現を擬似的に地名表現としてレコードに登録しておくことで簡易的に対応表現を広げられるが(店名など)、固有表現に対して一意に地理を決定できない場合なども考えられる(時間と共に変化する場合など)。
本発明は、上記の点に鑑みなされたもので、文書中に地名表現がなくても地理を推定することが可能な地域推定装置及び方法及びプログラムを提供することを目的とする。
上記の課題を解決するため、本発明(請求項1)は、入力された文書を解析し、該文書に対応する地理情報を出力する地域推定装置であって、
入力された文書が地名を含む場合は、固有表現、地名表現、該地名表現に対応する緯度経度の地理情報を抽出し、地名を含まない場合は、固有表現のみを抽出し、文書情報記憶手段に格納する文書解析手段と、
前記文書情報記憶手段から、前記固有表現と前記地理情報の組み合わせを取得して、該固有表現をキーとし、該地理情報を対応付けた固有表現−地理インデクスを生成し、インデクス記憶手段に格納するインデックス作成手段と、
前記インデクス記憶手段から、地理的に広く分布している、または、地理的に特徴がないデータを削除するデータトリミング手段と、
前記文書情報記憶手段から前記文書毎の文書IDと前記固有表現と前記地理情報を取得し、該文書に地理情報がある場合は、文書IDと地理情報を出力し、該地理情報がない場合は、前記インデクス記憶手段から取得した該固有表現に対応する地理情報を文書IDと共に出力する地理推定手段と、を有する。
また、本発明(請求項2)は、前記インデクス作成手段において、
前記文書情報記憶手段から取得した前記地理情報を、検索対象とする地理範囲内を任意の単位で区切り、区切られた各メッシュのメッシュIDに変換し、該地理情報に対応する前記固有表現が前記文書で出現する頻度のスコアと対応付けた固有表現−地理インデクスを前記インデクス記憶手段に格納する手段を含み、
前記データトリミング手段において、
前記インデクス記憶手段の前記メッシュIDに対応するスコアを分析し、該スコアの分散が高い固有表現のデータを前記インデクス記憶手段から除去する手段と、
前記インデクス記憶手段の前記メッシュIDに対応するスコアを分析し、該スコアの分布が、所定の閾値以下の固有表現のデータを前記インデクス記憶手段から除去する手段と、を含む。
また、本発明(請求項3)は、前記地理推定手段において、
前記固有表現−地理インデクスのメッシュID毎にスコアを合算し、合算したスコアが最も高いメッシュIDの中心点を示す地理情報、または、隣接するメッシュのスコアが所定の閾値以上のメッシュIDのメッシュが示す地理情報を出力する手段を含む。
また、本発明(請求項4)は、前記インデクス作成手段において、
前記文書が入力される毎に前記固有表現−地理インデクスを生成する手段を含む。
また、本発明(請求項5)は、前記インデクス作成手段において、前記地名表現の広さに応じて低減する係数を用いて前記スコアを算出する手段を含む。
また、本発明(請求項6)は、文書が入力されると、指定された一定の期間内の文書を選択し、前記解析手段に出力する文書選択手段を更に有する。
上記のように本発明によれば、当該文書の地理判定の際に、地名を含まない文書でも、他の文書での固有表現と地名の共起情報を用いて、当該文書中の各固有表現がどの地理と関係しているかを合わせることで、当該文書に対応する地理を推定することが可能となる。その際に、地理推定に利用する固有表現の選定とノイズの除去を行うことで正確性を高めている。
また、固有表現と地理の関係を入力される文書集合ごとに作り直すことで、リアルタイム性のある地理判定が可能となる。
さらに、所定の時間範囲の文書のみを処理対象文書とすることにより、時間応じた地理推定が可能となる。
本発明の第1の実施の形態における地域推定装置の構成図である。 本発明の第1の実施の形態における地域推定装置のデータの流れを示す図である。 本発明の第1の実施の形態におけるデータトリミング部の処理を示す図である。 本発明の第1の実施の形態における地理推定の例である。 本発明の第2の実施の形態における地域推定装置の構成図である。 本発明の第2の実施の形態における文書選択部の処理の例である。
以下、図面と共に本発明の実施の形態を説明する。
[第1の実施の形態]
図1は、本発明の第1の実施の形態における地域推定装置の構成を示す。
同図に示す地域推定装置は、固有表現抽出・地理解析部110、固有表現−地理インデクス作成部120、データトリミング部130、地理推定部140、文書情報テーブル10、固有表現−地理インデクス記憶部20を有し、解析対象の文書集合を入力とし、各文書に対応する地理情報を出力する。文書情報テーブル10、固有表現−地理インデクス記憶部20は、メモリやハードディスク装置等の記憶媒体である。
以下に、地域推定装置の各機能を説明する。
固有表現抽出・地理解析部110は、解析対象の文書集合に対して地名表現を含む固有表現抽出解析、各地名に対応する緯度経度情報を抽出する地理解析を行う。その際に固有表現解析は特許文献1など、地理解析は特許文献2や非特許文献1の既存の手法を用いることで実現できる。解析した結果は文書情報テーブル10に格納する。その際に文書毎にユニークな番号を文書IDとして付与する。文書情報テーブル10は、図2に示すように、文書IDカラム、固有表現カラム、地名カラム、地理カラムがあり、それぞれ下記の情報を含む。
・文書IDカラム:文書ID
・固有表現カラム:文書に含まれる固有表現のリスト
・地名カラム:文書に含まれる地名表現のリスト
・地理カラム:文書に含まれる地名表現に対応する緯度経度情報(ポイントもしくは範囲を示す情報)
具体的には、図2の例において、文書1(文書ID:0001)は、『奈良県橿原市には飛鳥時代のお寺がたくさんあるらしい』という地名が含まれる文書から、固有表現として「飛鳥時代』『お寺』を抽出し、地名として『奈良県橿原市』を抽出し、地理情報として『34.510517.135.793762』を抽出し、文書情報テーブル10に格納する。また、文書2「文書ID:0002」は『飛鳥時代の遺跡がすごい!!』という地名が含まれない文書である。当該文書2から、固有表現として『奈良時代』、『遺跡』のみを抽出し、文書情報テーブル10に格納する。
固有表現−地理インデクス作成部120は、文書情報テーブル10から各文書毎に、「固有表現カラムの情報」と「地理カラム」の組み合わせの情報を取得し、固有表現をキーとする固有表現−地理インデクスを作成する。
本発明では、対象とする範囲内(例えば日本国内)を任意の単位で区切り(例えば、東西1km、南北1kmずつ)、各メッシュに対してユニークなIDとしてメッシュIDを付与しておき、取得した地理情報が対応するメッシュIDに変換する。例えば、地理情報がポイントならば1つのメッシュID、範囲ならばメッシュIDのリストとなる。文書情報テーブル10から取得した「固有表現情報」と「地理情報」から、各文書で複数の
{固有表現:メッシュID(のリスト):当該文書での頻度}
の組み合わせを作ることができ、最終的に全文書で固有表現をキーとして合算したものを固有表現−地理インデクスとして保存する。固有表現に対応する値は、
"(メッシュID:スコア),(メッシュID:スコア)…"
となる。スコアは単に出現頻度としても良いし、tf・idfのように固有表現の総出現回数を考慮することで、高頻度の一つのキーワードの影響が強くなりすぎるのを防ぐこともできる。
当該固有表現−地理インデクス作成部120では、地理の情報のない文書に関しては処理を行わない。そのため、図2に示すように、文書1と文書4に対する処理のみが行われる。
固有表現−地理インデクス作成部120の他のバリエーションとして以下のような手法としてもよい。
(1)固有表現−地理インデクスは、文書集合が入力される毎に作り直しても、文書集合が連続するものであるならば、前回のインデクスを更新するだけでよい。作り直す場合では、その時のリアルタイム性のある地理判定が行われ、継続されたインデクスを利用する場合は全期間での統計的な地理判定が行われる。
(2)各文書で複数の{固有表現:メッシュID(のリスト):当該文書での頻度}を作成する際に、各地理表現の広さに応じて低減する係数を付与することが考えられる。これは、"東京都"のように広い範囲と"東京都武蔵野市緑町"のように小さな範囲で語られる固有表現を同等に扱わず、小さな範囲で語られる場合を重要視することができる。その際には、固有表現と地理情報の組み合わせ毎に
{固有表現:メッシュID(のリスト):頻度:範囲考慮係数}
のデータを作成する。ここで範囲考慮スコアは下記の式などで計算可能である。
範囲考慮スコア=1/log100 (当該地理表現の範囲に含まれるメッシュ数)
なお、地理が地点(ポイント)の場合は1とする。
この{固有表現:メッシュID(のリスト):頻度:範囲考慮係数}のデータを用いて最終的に固有表現に対応する"(メッシュID:スコア),(メッシュID:スコア)…"のデータを作成する際には、頻度に範囲考慮係数を乗算した上で積算していくことで可能である。頻度がtf-idfとなっても同様の手法で可能である。
データトリミング部130は、固有表現−地理インデクスの各固有表現の地理情報から、不要なデータを削除する。データトリミング部130の機能は、「データ選別」と「ノイズ除去」に分けられる。図3に、データトリミング部130の処理を示す。以下、それぞれについて述べる。
・データ選別:
図3(a)に示すように、各固有表現について、地理的スコアが広く分散しているものは地理を推定する際に有用ではない。そのため、各地理におけるスコアの分布を解析し、分散が高い固有表現のデータは固有表現−地理インデクス記憶部20から除去する。分散が高いかどうかの判定には、通常の標準偏差やエントロピーを計算したり、最大スコアの30%以上の地理がどれほどあるかなどで求める。
・ノイズ除去:
図3(b)に示すように、各固有表現において、地理的に特徴的な範囲のみの情報を用いることで、有効性が高まると考える。そのため、各固有表現のスコアの分布において、一定の閾値以下のものを固有表現−地理インデクス記憶部20から除去する。閾値は頻度をスコアとする場合には10、tf・idfをスコアとする場合では0.1など絶対値で指定しても、分布の最大値の25%などと相対的に設定してもよい。
地理推定部140は、文書情報テーブル10から各文書の文書ID,固有表現、地理情報を取得し、地理情報がある場合は、{文書ID,地理情報}の組み合わせを出力し、地理情報がない場合は、固有表現情報と固有表現−地理インデクス記憶部20の固有表現−地理インデックスを用いて地理を推定し、推定した結果を{文書ID,推定値理情報}として出力する。
地理推定部140は、取得した固有表現に対応する地理情報を固有表現−地理インデクス記憶部20から取得し、各地理情報をメッシュID毎にスコアを合算し、1つの"(メッシュID,スコア)、(メッシュID:スコア)、…"のリストを作成する。推定される地理はリスト中でスコアが最も高いメッシュIDの中心点を示す緯度経度情報や、隣接するメッシュのスコアが既定の閾値以上ならば、連結を行い、その最小矩形範囲が示す緯度経路情報(範囲もしくはポイント)としてもよい。
スコアの合算においては、通常の加算の代わりに乗算や、調和平均等を用いても良い。
図4に、地理推定部140具体的な例を示す。
地名を含まない文書として「飛鳥時代の遺跡がすごい!!」が入力された場合を示す。
データトリミング部130において、固有表現「飛鳥時代」、「遺跡」毎に出現頻度分布を作成し(ステップ1)、地理推定部140において、それらの出現頻度分布を合算して、最も頻度の高い箇所を地理と推定する(ステップ2)。
[第2の実施の形態]
本実施の形態では、入力する文書集合を生成する機能について説明する。
図5は、本発明の第2の実施の形態における地域推定装置の構成を示す。図1と同一構成部分には同一符号を付し、その説明を省略する。
図5に示す地域推定装置は、図1の構成に文書選択部210を付加した構成である。
文書選択部210は、文書が入力されると、ユーザによって指定された一定の期間(○日前や○ケ月前まで)の文書を選択し、固有表現抽出・地理解析部110に出力する。
これにより、例えば、リアルタイム性の地理判定を求める場合には、図6に示すように、各固有表現の出現頻度分布を作成する対象文書を、直近の数時間などとして区切ることで、時間に応じた地理推定が可能となる。図6の例では、「出雲駅伝」開催中は『出雲』が、「箱根駅伝」開催中は『箱根』の分布が強くなる。
上記のように、本発明では、文書から抽出された地名表現を地図上のメッシュに展開し、固有表現にはスコア(tf・idfなど)を付与し、{固有表現,メッシュ,スコア}からなるデータを生成し、文書に地名表現がない場合は、当該データを用いて固有表現のスコアをメッシュ単位に合算し、スコアが高いメッシュを当該文書の地名表現として出力することができる。
なお、上記の実施の形態における図1、図5に示す地域推定装置の各構成要素の動作をプログラムとして構築し、地域推定装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
10 文書情報テーブル
20 固有表現−地理インデクス記憶部
110 固有表現抽出・地理解析部
120 固有表現−地理インデクス作成部
130 データトリミング部
140 地理推定部
210 文書選択部

Claims (8)

  1. 入力された文書を解析し、該文書に対応する地理情報を出力する地域推定装置であって、
    入力された文書が地名を含む場合は、固有表現、地名表現、該地名表現に対応する緯度経度の地理情報を抽出し、地名を含まない場合は、固有表現のみを抽出し、文書情報記憶手段に格納する文書解析手段と、
    前記文書情報記憶手段から、前記固有表現と前記地理情報の組み合わせを取得して、該固有表現をキーとし、該地理情報を対応付けた固有表現−地理インデクスを生成し、インデクス記憶手段に格納するインデックス作成手段と、
    前記インデクス記憶手段から、地理的に広く分布している、または、地理的に特徴がないデータを削除するデータトリミング手段と、
    前記文書情報記憶手段から前記文書毎の文書IDと前記固有表現と前記地理情報を取得し、該文書に地理情報がある場合は、文書IDと地理情報を出力し、該地理情報がない場合は、前記インデクス記憶手段から取得した該固有表現に対応する地理情報を文書IDと共に出力する地理推定手段と、
    を有することを特徴とする地域推定装置。
  2. 前記インデクス作成手段は、
    前記文書情報記憶手段から取得した前記地理情報を、検索対象とする地理範囲内を任意の単位で区切り、区切られた各メッシュのメッシュIDに変換し、該地理情報に対応する前記固有表現が前記文書で出現する頻度のスコアと対応付けた固有表現−地理インデクスを前記インデクス記憶手段に格納する手段を含み、
    前記データトリミング手段は、
    前記インデクス記憶手段の前記メッシュIDに対応するスコアを分析し、該スコアの分散が高い固有表現のデータを前記インデクス記憶手段から除去する手段と、
    前記インデクス記憶手段の前記メッシュIDに対応するスコアを分析し、該スコアの分布が、所定の閾値以下の固有表現のデータを前記文書情報記憶手段から除去する手段と、
    を含む請求項1記載の地域推定装置。
  3. 前記地理推定手段は、
    前記固有表現−地理インデクスのメッシュID毎にスコアを合算し、合算したスコアが最も高いメッシュIDの中心点を示す地理情報、または、隣接するメッシュのスコアが所定の閾値以上のメッシュIDのメッシュが示す地理情報を出力する手段を含む
    請求項1記載の地域推定装置。
  4. 前記インデクス作成手段は、
    前記文書が入力される毎に前記固有表現−地理インデクスを生成する手段を含む
    請求項2記載の地域推定装置。
  5. 前記インデクス作成手段は、
    前記地名表現の広さに応じて低減する係数を用いて前記スコアを算出する手段を含む請求項2記載の地域推定装置。
  6. 文書が入力されると、指定された一定の期間内の文書を選択し、前記解析手段に出力する文書選択手段を更に有する
    請求項1記載の地域推定装置。
  7. 入力された文書を解析し、該文書に対応する地理情報を出力する地域推定方法であって、
    文書解析手段が、入力された文書が地名を含む場合は、固有表現、地名表現、該地名表現に対応する緯度経度の地理情報を抽出し、地名を含まない場合は、固有表現のみを抽出し、文書情報記憶手段に格納する文書解析ステップと、
    インデクス作成手段が、前記文書情報記憶手段から、前記固有表現と前記地理情報の組み合わせを取得して、該固有表現をキーとし、該地理情報を対応付けた固有表現−地理インデクスを生成し、インデクス記憶手段に格納するインデックス作成ステップと、
    データトリミング手段が、前記インデクス記憶手段から、地理的に広く分布している、または、地理的に特徴がないデータを削除するデータトリミングステップと、
    地理推定手段が、前記文書情報記憶手段から前記文書毎の文書IDと前記固有表現と前記地理情報を取得し、該文書に地理情報がある場合は、文書IDと地理情報を出力し、該地理情報がない場合は、前記インデクス記憶手段から取得した該固有表現に対応する地理情報を文書IDと共に出力する地理推定ステップと、
    を行うことを特徴とする地域推定方法。
  8. コンピュータを、
    請求項1乃至6のいずれか1項に記載の地域推定装置の各手段として機能させるための地域推定プログラム。
JP2012100488A 2012-04-25 2012-04-25 地域推定装置及び方法及びプログラム Expired - Fee Related JP5806971B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012100488A JP5806971B2 (ja) 2012-04-25 2012-04-25 地域推定装置及び方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012100488A JP5806971B2 (ja) 2012-04-25 2012-04-25 地域推定装置及び方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2013228888A true JP2013228888A (ja) 2013-11-07
JP5806971B2 JP5806971B2 (ja) 2015-11-10

Family

ID=49676452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012100488A Expired - Fee Related JP5806971B2 (ja) 2012-04-25 2012-04-25 地域推定装置及び方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5806971B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104537062A (zh) * 2014-12-29 2015-04-22 北京牡丹电子集团有限责任公司数字电视技术中心 一种地址信息抽取方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080010262A1 (en) * 2006-06-12 2008-01-10 Metacarta, Inc. System and methods for providing statstically interesting geographical information based on queries to a geographic search engine
JP2008542883A (ja) * 2005-05-27 2008-11-27 グーグル インコーポレイテッド 位置顕著性に基づくローカル検索結果のスコアリング
JP2009134464A (ja) * 2007-11-29 2009-06-18 Nippon Telegr & Teleph Corp <Ntt> 地名が意味する範囲を考慮した検索結果スニペットの生成装置、生成方法、生成プログラムおよびその生成プログラムを記録した記録媒体
WO2011149104A1 (ja) * 2010-05-28 2011-12-01 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラム、および、記録媒体
JP2012043115A (ja) * 2010-08-18 2012-03-01 Nippon Telegr & Teleph Corp <Ntt> 文書検索装置、文書検索方法および文書検索プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008542883A (ja) * 2005-05-27 2008-11-27 グーグル インコーポレイテッド 位置顕著性に基づくローカル検索結果のスコアリング
US20080010262A1 (en) * 2006-06-12 2008-01-10 Metacarta, Inc. System and methods for providing statstically interesting geographical information based on queries to a geographic search engine
JP2009134464A (ja) * 2007-11-29 2009-06-18 Nippon Telegr & Teleph Corp <Ntt> 地名が意味する範囲を考慮した検索結果スニペットの生成装置、生成方法、生成プログラムおよびその生成プログラムを記録した記録媒体
WO2011149104A1 (ja) * 2010-05-28 2011-12-01 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラム、および、記録媒体
JP2012043115A (ja) * 2010-08-18 2012-03-01 Nippon Telegr & Teleph Corp <Ntt> 文書検索装置、文書検索方法および文書検索プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
松本 光弘 他: "WWW上の文書に含まれるイベント情報からの地名の同定", 人工知能学会研究会資料 第88回 知識ベースシステム研究会資料, vol. 903, no. 6, JPN6015028599, 22 February 2010 (2010-02-22), JP, pages 33 - 38, ISSN: 0003146188 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104537062A (zh) * 2014-12-29 2015-04-22 北京牡丹电子集团有限责任公司数字电视技术中心 一种地址信息抽取方法及系统

Also Published As

Publication number Publication date
JP5806971B2 (ja) 2015-11-10

Similar Documents

Publication Publication Date Title
JP6254583B2 (ja) 動的言語モデル
US8958826B2 (en) Device and method for mobility pattern mining
US20160034426A1 (en) Creating Cohesive Documents From Social Media Messages
JP5351123B2 (ja) 文書検索キーワード提示装置および文書検索キーワード提示プログラム
JP5806971B2 (ja) 地域推定装置及び方法及びプログラム
JP5639549B2 (ja) 情報検索装置及び方法及びプログラム
JP5637073B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP5271863B2 (ja) 情報分析装置、情報分析方法および情報分析プログラム
JP5806974B2 (ja) 近隣情報検索装置及び方法及びプログラム
JP5604406B2 (ja) 情報検索装置及び方法及びプログラム
JP5801243B2 (ja) 特徴キーワード推薦装置及び方法及びプログラム
JP5824415B2 (ja) 住所特徴語抽出装置及び方法及びプログラム
JP5670944B2 (ja) 文書要約装置及び方法及びプログラム
JP5798081B2 (ja) 情報検索装置及び方法及びプログラム
JP2015102987A (ja) 地名推定方法、地名推定装置及び地名推定プログラム
JP5410359B2 (ja) クエリ選択装置及びプログラム
JP2014229231A (ja) 地域連想語抽出装置、地域連想語抽出方法及び地域連想語抽出プログラム
JP5801252B2 (ja) イベント抽出装置及び方法及びプログラム
JP5548243B2 (ja) イベント発生地点抽出装置、方法、及びプログラム
JP5583107B2 (ja) キーワード地名ペア抽出装置及び方法及びプログラム
JP6031164B1 (ja) スポット判定装置、スポット判定方法、および、スポット判定プログラム
KR101896612B1 (ko) 사용자의 위치와 관련된 키워드를 근린 생활 키워드로서 추출하는 키워드 추출 시스템 및 방법
JP2016161828A (ja) 地図情報表示装置
JP2016110165A (ja) イベント情報抽出装置、イベント情報抽出方法及びイベント情報抽出プログラム
JP5815467B2 (ja) 検索キーワード提示装置及び方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141020

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150623

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150714

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150810

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150901

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150907

R150 Certificate of patent or registration of utility model

Ref document number: 5806971

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees