JP5604406B2 - 情報検索装置及び方法及びプログラム - Google Patents

情報検索装置及び方法及びプログラム Download PDF

Info

Publication number
JP5604406B2
JP5604406B2 JP2011248074A JP2011248074A JP5604406B2 JP 5604406 B2 JP5604406 B2 JP 5604406B2 JP 2011248074 A JP2011248074 A JP 2011248074A JP 2011248074 A JP2011248074 A JP 2011248074A JP 5604406 B2 JP5604406 B2 JP 5604406B2
Authority
JP
Japan
Prior art keywords
mesh
expression data
specific expression
search
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011248074A
Other languages
English (en)
Other versions
JP2013105282A (ja
Inventor
尚樹 藤田
宜仁 安田
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011248074A priority Critical patent/JP5604406B2/ja
Publication of JP2013105282A publication Critical patent/JP2013105282A/ja
Application granted granted Critical
Publication of JP5604406B2 publication Critical patent/JP5604406B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報検索装置及び方法及びプログラムに係り、特に、検索者が地理的範囲を地図の表示範囲や緯度経度情報を入力して検索を行うことができる文書検索サービスにおいて、その条件下で特徴的なキーワードを検索前に表示させることで検索者の検索を支援するための情報検索装置及び方法及びプログラムに関する。
インターネット上の文書を検索する検索エンジンなどでは、現在どのようなキーワードでの検索が増加しているか解析を行い、増加しているキーワードを提示することで、検索者の検索を支援している(例えば、非特許文献1参照)。
このような時間的に特徴的なキーワードを抽出するためには、検索対象文書の登校時刻情報とその中に含まれるキーワードのデータや、検索エンジンの検索ログデータ(検索時刻と投入キーワード)を任意の単位(例として1日単位や1時間単位)で解析し、出現回数が急増した特長的なキーワードを検出する。特徴的であるかは標準偏差やポアソン確率を用いることで判定可能である。例えば、管理図による手法では過去数日間(任意の期間)の移動平均値に対して3σ以上(σは標準偏差)上昇している場合に、異常値と判定しており、その場合に特徴的であると判定することができる。検索対象文書のデータを使用する際には、電子文書の作成日時がピーク時間帯に近接し周期性を有するほど高いスコアを与え、高スコアであれば作成日時の時間表現候補を時間表現とする方法(例えば、特許文献1参照)を用いて検索対象文書から時間表現を抽出することができ、それを投稿時間の代わりに利用することができる。また、特定の固有表現に関する形態素と固有表現状態との対情報が登録された辞書を用いて固有表現識別子を置き換える方法(例えば、特許文献2参照)を用いることにより、文書内の固有表現のみを抽出することができるので、双方の出力を時間情報と固有表現の組合せのデータとなり、上記検索ログデータと同様に特徴的なキーワードを抽出可能となる。
また、文書内のテキストを解析して地名情報を特定する手法が提案されている(例えば、非特許文献2参照)。当該手法の結果を用いることで各文書がどの地域に関係しているかを解析することが可能である。これを用いることで、予め用意したおいたキーワード集合がどの地域に関係付けられた文書で出現しているか解析でき、特定の地域で推薦するキーワードを抽出することが可能と考えられる。具体的な手法としては、地域を東西・南北それぞれ200mや緯度経度で8秒毎などの固定の値で区切り(「メッシュ」と呼ぶ)、メッシュ毎に関連する文書集合中の各キーワードの頻度を分析する。複数のメッシュを含むある地域において、あるキーワードの頻度が全体の頻度分布中で特徴的に高い場合、そのキーワードは当該地域での推薦すべきキーワードであると判定できる。特徴的であるかは上記と同様に全メッシュにおける平均出現頻度に対して当該メッシュでの出現頻度3σ(σは標準偏差)以上高い場合に特徴的と判断してもよいし、ポアソン確率を用いることで判定可能である。
上記を組合せて、時間と地理的な情報双方を用いて特徴的なキーワードを抽出するためには、例えば、地理的に(緯度、経度)の2次元の分布に時間(日単位)の次元を加えて、3次元における分布情報を保持することで可能だと考える。地理的には、緯度経度を8000ミリ秒毎に区切り、時間的には1日単位で区切ることで、図1のような3次元メッシュを作成することができ、それぞれのメッシュのデータとしては検索対象文書中で地理と時間が対応する文書に含まれるキーワードとその頻度情報が格納される。
3次元メッシュを用いて、各メッシュ(複数選択可)で特徴的なキーワードを取得するためには、メッシュに含まれる全キーワードそれぞれに対して、ポアソン確率を計算することで可能である。ポアソン確率は下記の式で計算可能であり、その確率が高いキーワードが特徴的であるといえる。
Figure 0005604406
式中に用いられている各変数は下記の通りである。
・n : 全検索対象文書数
・s : 全検索対象文書内での当該キーワードの出現頻度
・k : 当該メッシュ内の全キーワードの出現頻度の合計
・r : 当該メッシュ内での当該キーワードの出現頻度
ただし、当該機能での計算においてn , sは事前に設定しておく。
特開2011−86152号公報 特開2007−323271号公報
Google(登録商標)急上昇キーワード:http://www.google.co.jp/m/trends. 平野 徹,他:地理的距離と有名度を用いた地名曖昧性解消情報処理学会全国大会2008.
しかしながら、上記の従来の技術では、指定範囲内のデータが少ない場合、特徴的な語が抽出できないという問題がある。
検索対象文書の量が膨大でない限り、3次元メッシュはスパースな構造になりがちであり、データが少ない場合など、時間、地理の条件で指定されたメッシュがデータを保持しない場合があるため、特徴的な語が抽出できない場合がある。
また、データが検索対象文書に存在しても出力したい語数を得ることができない場合がある。
本発明は、上記の点に鑑みなされたもので、指定された時間情報、地理範囲で特徴的なキーワードを出力する際に、該当する条件下のデータが存在しない場合にも、その指定条件と関係性の高いデータを取得して、キーワードを出力することが可能で、また、規定した個数のキーワードを必ず取得することが可能な情報検索装置及び方法及びプログラムを提供することを目的とする。
上記の課題を解決するため、本発明(請求項1)は、地理的範囲を入力された地図の表示範囲や緯度経度情報に基づいてキーワードを検索して提示する情報検索装置であって、
前処理手段と、キーワード抽出手段と、を有し、
前記前処理手段は、
検索対象文書が入力されると、固有表現、地理表現、地理情報、時間情報を抽出して解析結果記憶手段に格納する文書解析手段と、
前記解析結果記憶手段から解析結果を取得してメッシュ番号を付与し、該メッシュ番号毎に固有表現の数を合計して3次元メッシュテーブルに格納するメッシュテーブル作成手段と、を有し、
前記キーワード抽出手段は、
利用者から入力された時間情報及び地理範囲を取得し、該時間情報及び該地理範囲に基づいてメッシュIDを計算するメッシュ番号計算手段と、
前記メッシュIDに基づいて前記3次元メッシュテーブルを参照し、対応する固有表現データを取得する固有表現データ取得手段と、
前記固有表現データ取得手段において、前記メッシュIDにより固有表現データが取得できなかった場合に、前記時間情報の要素及び前記地理範囲の要素の少なくともいずれか一方を拡張することにより、探索範囲を拡大し、再度固有表現データの探索を行う固有表現データ再取得手段と、
取得した固有表現データを出力する出力手段と、を有する。
また、本発明(請求項2)は、地理的範囲を入力された地図の表示範囲や緯度経度情報に基づいてキーワードを検索して提示する情報検索装置であって、
前処理手段と、キーワード抽出手段と、を有し、
前記前処理手段は、
検索対象文書が入力されると、固有表現、地理表現、地理情報、時間情報を抽出して解析結果記憶手段に格納する文書解析手段と、
前記解析結果記憶手段から解析結果を取得してメッシュ番号を付与し、該メッシュ番号毎に固有表現の数を合計して3次元メッシュテーブルに格納するメッシュテーブル作成手段と、を有し、
前記キーワード抽出手段は、
利用者から入力された時間情報及び地理範囲を取得し、該時間情報及び該地理範囲に基づいてメッシュIDを計算するメッシュ番号計算手段と、
前記メッシュIDに基づいて前記3次元メッシュテーブルを参照し、対応する固有表現データを取得する固有表現データ取得手段と、
前記固有表現データ取得手段で、取得した前記固有表現データを出力する出力手段と、
前記出力手段で出力された固有表現データの数が所定の数に満たない場合に、前記時間除法の要素及び前記地理範囲の要素の少なくともいずれか一方を拡張することにより、探索範囲を拡大し、再度固有表現データの探索を行い、前記出力手段に出力する固有表現データ再取得手段と、を有する。
また、本発明(請求項3)は、前記固有表現データ再取得手段において、
前記時間情報の時間要素を所定の比率に基づいて、前方または後方のいずれか、または、双方に探索範囲を拡大して前記3次元メッシュテーブルを探索する時間探索手段、
前記地理範囲を所定の比率に基づいて地理的に拡大して前記3次元メッシュテーブルを探索する地理拡大探索手段、
のいずれか、または、両方を含む。
また、本発明(請求項4)は、前記時間探索手段において、前記前方探索を優先させる。
本発明によれば、指定された時間情報、地理範囲で特徴的なキーワードを出力する際に、該当する条件下のデータが存在しない場合にも、その指定条件と関係性の高いと考えられる固有表現データを取得して、キーワードを出力することができる。
また、規定数に達するまで固有表現データの再取得を行うことにより、必ず規定語数のキーワードの出力が可能となる。その際には、均等に広げるよりも最も情報を得やすいと思われる方向に偏って広げるため、範囲拡大は必要最小限に抑えることができる。
3次元メッシュのイメージ図である。 本発明で用いるインタフェースのイメージである。 本発明の一実施の形態における情報検索装置の構成図である。 本発明の一実施の形態における前処理を説明するための図である。 本発明の一実施の形態における文書解析部の構成図である。 本発明の一実施の形態における3次元メッシュテーブルである。 本発明の一実施の形態におけるキーワード抽出処理を説明するための図である。 本発明の一実施の形態における前方探索の3次元メッシュのイメージである。 本発明の一実施の形態における時間及び探索範囲拡大のイメージである。 本発明の一実施の形態におけるキーワード抽出処理を説明するための図である。
以下図面と共に、本発明の実施の形態を説明する。
本発明の処理は、「前処理」と「キーワード抽出処理」に分けられる。
「前処理」は検索対象文書を解析し、3次元メッシュの各メッシュに格納するデータを抽出・掲載し、保存領域に格納する処理である。
「キーワード抽出処理」は、検索者が指定した時間及び地理的範囲に応じて、特徴的なキーワードを出力する処理である。
本発明が想定するサービスは、検索者が図2のようなインタフェースを用いて地理的範囲と時間を指定した上で、キーワードによる検索を行う検索サービスであり、本発明を用いることで検索者のキーワードの入力を補助することが可能である。
図3は、本発明の一実施の形態における情報検索装置の構成を示す。
情報検索装置は、文書解析部1、3次元メッシュテーブル作成部2、メッシュ番号計算部3、固有表現データ取得部4、固有表現データ再取得部5、固有表現出力部6、解析結果保存テーブル7、3次元メッシュテーブル8から構成される。
解析結果保存テーブル7、3次元メッシュテーブル8は、ハードディスク等の記憶媒体に格納されるテーブルであり、解析結果保存テーブル7は、文書解析部1によって解析された文書の解析結果として、ページ番号、固有表現、地理情報、時間情報が格納される。3次元メッシュテーブル8は、メッシュIDと固有表現データが格納される。
まず、前処理について説明する。
図4は、本発明の一実施の形態における前処理を説明するための図である。
文書解析部1は、図5に示す機能を有する。文書解析部1は、ページ番号決定部11、、固有表現抽出部12、地名表現抽出部13、地理情報抽出部14、時間情報抽出部15、解析結果保存部16から構成される。
ページ番号決定部11は、入力された検索対象文書の各ページに対してページ番号をユニークに決定する。
固有表現抽出部12は、検索対象文書中の固有表現を抽出する。固有表現の抽出などには、特許文献2等で示される従来の手法を用いることができる。
地名表現抽出部13は、検索対象文書中に記述された地名と思われる表現を抽出する。地名は必ずしも完全な住所でなくとも、断片的な地名(例えば、「浜松」など)でも構わない。これは、非特許文献2等で示される従来の手法を用いることができる。
地理情報抽出部14は、地名表現抽出部13で抽出された地名表現から緯度経度情報を抽出する。単純には地名とその領域が記された辞書を用意しておき、文書中に現れる地名をパターンマッチする方法を使うことができる。
時間情報抽出部15は、検索対象文書中の時間表現を抽出する。時間表現の抽出には、特許文献1等で示される従来の手法を用いることができる。抽出の際には任意の単位の時間情報とする(例えば、日単位など)。
解析結果保存部16は、解析結果保存テーブル7に解析結果として、
<ページ番号><固有表現><地理情報(緯度・経度)><時間情報>
を格納する。
3次元メッシュテーブル作成部2は、解析結果保存テーブル7から解析結果を読み込んで以下の処理を行う。
1)解析結果の地理情報の緯度及び経度それぞれを8000ミリ秒単位など任意の単位で集約して番号を決定する。例えば、日本の西端、南端をそれぞれ0番として8000ミリ秒単位で1番、2番と番号を決定し、各緯度及び経度を番号に変換する。
2)時間情報と経度番号、緯度番号を合わせてメッシュ番号とする。例えば、
20110908−5350−6000(時間情報−緯度番号−経度番号)
3)メッシュ番号毎に固有表現の数を合計して、3次元メッシュテーブルに図6に示す構造で保存する。1つのページ番号の地理情報、時間情報に複数のデータがある場合は全ての組合せについて、加算を行う。
ここまでが前処理である。
次に、キーワード抽出処理について説明する。
検索者が図2のインタフェースを用いて指定した時間(yyyy,mm,dd)と地理範囲(南西の点の緯度経度、東北の点の緯度経度)を入力として、出力する。
図7は、本発明の一実施の形態におけるキーワード抽出処理を説明するための図である。
ステップ101) メッシュ番号計算部3は、入力された時間情報、地理範囲に含まれるメッシュIDを計算し、リストとして固有表現データ取得部4に出力する。
ステップ102) 固有表現データ取得部4は、メッシュ番号計算部3から入力されたメッシュIDのリストをキーとして3次元メッシュ番号テーブル8から固有表現データを取得する。
ステップ103) 固有表現データ取得部4で指定したメッシュIDのリストデータを取得できなかった場合には、ステップ104に移行し、取得した場合はステップ105に移行する。
ステップ104) 固有表現データ再取得部5は、ステップ102において、あるメッシュにデータがない場合は、図8に示すように、メッシュIDリストの各メッシュIDの時間要素を1単位(1日)前方の期間に含まれるメッシュID全てをキーとして3次元メッシュ番号テーブル8から固有表現データを取得する。
当該処理は、固有表現データが取得できるまで繰り返し実施される。
また、時間要素を前方だけでなく後方にも探索することも可能とする。比率αを用いて再取得n回の場合、下記のようにする。
前方n単位:後方m単位=α:(1−α) (但し、0.5≦α≦1)
このように比率αを用いて前方後方双方に探索する設定を可能とする。その際にαを0.5以上1以下とすることで、前方を優先させる。
また、地理要素に関しても範囲を広げて探索可能とする。比率βを用いて再取得n回目の場合、当該メッシュIDから"β×n"(1以下切捨て)の距離にあるメッシュを探索対象とする。ここで距離とは、隣接するメッシュ同士の距離は1、2つの隣のメッシュ間の距離は2とする。メッシュIDリストに含まれる全てのメッシュIDでの広がりを合わせたものを再取得対象とする。
また、時間要素と地理要素共に範囲を広げる場合は、再取得n回目の場合、時間に関して前方n単位、後方m単位とすると、元のメッシュの時間要素をt=0とすると、各tにおけるメッシュの地理要素の広がりの距離d(t)は下記の式で得られ、その距離にあるメッシュを探索対象とする。
Figure 0005604406
上記のように指定された地理、時間に当てはまる検索対象文書が存在しない場合に、時間的に前方を探索することで関係性の高いキーワードが出力できる。
ある店舗が8月1日に開店した場合を例とすると、来店した人が作成するブログなどの検索対象ページは時間と共に増加する。そのため、8月1日の時間表現が含まれるページがなくても、8月2日の時間表現が含まれるページ(8月2日に来店した人が「8月2日に行ってきました」などと書く)は存在する可能性があるため、前方を優先して探索することが効果的である。
また、地理的にも広がり度合いを明示的に指定することで、地理的には広げたくない場合や、広げてもよい場合双方に対応可能である。
探索範囲を、時間的、地理的に拡大する3次元メッシュテーブルのイメージを図9に示す。同図において、(b)は、探索範囲(a)から時間的な広がりを示し、(c)は、(a)から地理的な広がりを示し、(d)は、時間的な広がり及び地理的な広がりを合わせたものである。
ステップ105) 固有表現出力部6は、取得した固有表現データから出力する固有表現を決定する。決定する際のアルゴリズムは、例えば、取得した固有表現データに含まれる固有表現の頻度を合計し、上位10語を出力する手法や、各メッシュID毎に頻度上位2語ずつを出力する手法、固有表現が全体中で特徴的かどうかポアソン確率を計算してポアソン確率の上位10語を出力する手法などがある。
次に、他の実施の形態を説明する。
前述の実施の形態では、図7のフローにおいて、メッシュ番号計算処理、固有表現データ取得処理、固有表現データ再取得処理、固有表現出力処理の順に行ったが、この手法に限定されることなく、図10に示すように、メッシュ番号計算処理(ステップ101)、固有表現データ取得処理(ステップ102)、固有表現出力処理(ステップ203)、固有表現データ再取得処理(ステップ204)の順にすることで、出力する固有表現の数が10語(規定した個数)を必ず出力することが可能となる。
この場合、固有表現データ再取得部5の処理が、固有表現出力部6が規定した10個に達していない場合に呼び出され、その後、再取得した固有表現データを固有表現出力部6に出力する。これにより、固有表現出力部6から規定数の固有表現データを出力する。
なお、上記の図3に示す情報検索装置の各構成要素の動作をプログラムとして構築し、情報検索装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
1 文書解析部
2 3次元メッシュテーブル作成部
3 メッシュ番号計算部
4 固有表現データ取得部
5 固有表現データ再取得部
6 固有表現出力部
7 解析結果保存テーブル
8 3次元メッシュテーブル
11 ページ番号決定部
12 固有表現抽出部
13 地名表現抽出部
14 地理情報抽出部
15 時間情報抽出部
16 解析結果保存部

Claims (8)

  1. 地理的範囲を入力された地図の表示範囲や緯度経度情報に基づいてキーワードを検索して提示する情報検索装置であって、
    前処理手段と、キーワード抽出手段と、を有し、
    前記前処理手段は、
    検索対象文書が入力されると、固有表現、地理表現、地理情報、時間情報を抽出して解析結果記憶手段に格納する文書解析手段と、
    前記解析結果記憶手段から解析結果を取得してメッシュ番号を付与し、該メッシュ番号毎に固有表現の数を合計して3次元メッシュテーブルに格納するメッシュテーブル作成手段と、を有し、
    前記キーワード抽出手段は、
    利用者から入力された時間情報及び地理範囲を取得し、該時間情報及び該地理範囲に基づいてメッシュIDを計算するメッシュ番号計算手段と、
    前記メッシュIDに基づいて前記3次元メッシュテーブルを参照し、対応する固有表現データを取得する固有表現データ取得手段と、
    前記固有表現データ取得手段において、前記メッシュIDにより固有表現データが取得できなかった場合に、前記時間情報の要素及び前記地理範囲の要素の少なくともいずれか一方を拡張することにより、探索範囲を拡大し、再度固有表現データの探索を行う固有表現データ再取得手段と、
    取得した固有表現データを出力する出力手段と、
    を有することを特徴とする情報検索装置。
  2. 地理的範囲を入力された地図の表示範囲や緯度経度情報に基づいてキーワードを検索して提示する情報検索装置であって、
    前処理手段と、キーワード抽出手段と、を有し、
    前記前処理手段は、
    検索対象文書が入力されると、固有表現、地理表現、地理情報、時間情報を抽出して解析結果記憶手段に格納する文書解析手段と、
    前記解析結果記憶手段から解析結果を取得してメッシュ番号を付与し、該メッシュ番号毎に固有表現の数を合計して3次元メッシュテーブルに格納するメッシュテーブル作成手段と、を有し、
    前記キーワード抽出手段は、
    利用者から入力された時間情報及び地理範囲を取得し、該時間情報及び該地理範囲に基づいてメッシュIDを計算するメッシュ番号計算手段と、
    前記メッシュIDに基づいて前記3次元メッシュテーブルを参照し、対応する固有表現データを取得する固有表現データ取得手段と、
    前記固有表現データ取得手段で取得した前記固有表現データを出力する出力手段と、
    前記出力手段で出力された固有表現データの数が所定の数に満たない場合に、前記時間情報の要素及び前記地理範囲の要素の少なくともいずれか一方を拡張することにより、探索範囲を拡大し、再度固有表現データの探索を行い、前記出力手段に出力する固有表現データ再取得手段と、
    を有することを特徴とする情報検索装置。
  3. 前記固有表現データ再取得手段は、
    前記時間情報の時間要素を所定の比率に基づいて、前方または後方のいずれか、または、双方に探索範囲を拡大して前記3次元メッシュテーブルを探索する時間探索手段、
    前記地理範囲を所定の比率に基づいて地理的に拡大して前記3次元メッシュテーブルを探索する地理拡大探索手段、
    のいずれか、または、両方を含む
    請求項1または2記載の情報検索装置。
  4. 前記時間探索手段は、
    前記前方探索を優先させる
    請求項3記載の情報検索装置。
  5. 地理的範囲を入力された地図の表示範囲や緯度経度情報に基づいてキーワードを検索して提示する情報検索方法であって、
    前処理過程と、キーワード抽出過程からなり、
    前記前処理過程において、
    文書解析手段が、検索対象文書が入力されると、固有表現、地理表現、地理情報、時間情報を抽出して解析結果記憶手段に格納する文書解析ステップと、
    メッシュテーブル作成手段が、前記解析結果記憶手段から解析結果を取得してメッシュ番号を付与し、該メッシュ番号毎に固有表現の数を合計して3次元メッシュテーブルに格納するメッシュテーブル作成ステップと、を行い
    前記キーワード抽出過程において、
    メッシュ番号計算手段が、利用者から入力された時間情報及び地理範囲を取得し、該時間情報及び該地理範囲に基づいてメッシュIDを計算するメッシュ番号計算ステップと、
    固有表現データ取得手段が、前記メッシュIDに基づいて前記3次元メッシュテーブルを参照し、対応する固有表現データを取得する固有表現データ取得ステップと、
    固有表現データ再取得手段が、前記固有表現データ取得ステップにおいて、前記メッシュIDにより固有表現データが取得できなかった場合に、前記時間情報の要素及び前記地理範囲の要素の少なくともいずれか一方を拡張することにより、探索範囲を拡大し、再度固有表現データの探索を行う固有表現データ再取得ステップと、
    出力手段が、取得した固有表現データを出力する出力ステップと、
    を行うことを特徴とする情報検索方法。
  6. 地理的範囲を入力された地図の表示範囲や緯度経度情報に基づいてキーワードを検索して提示する情報検索方法であって、
    前処理過程と、キーワード抽出過程からなり、
    前記前処理過程において、
    文書解析手段が、検索対象文書が入力されると、固有表現、地理表現、地理情報、時間情報を抽出して解析結果記憶手段に格納する文書解析ステップと、
    メッシュテーブル作成手段が、前記解析結果記憶手段から解析結果を取得してメッシュ番号を付与し、該メッシュ番号毎に固有表現の数を合計して3次元メッシュテーブルに格納するメッシュテーブル作成ステップと、を行い
    前記キーワード抽出過程において、
    メッシュ番号計算手段が、利用者から入力された時間情報及び地理範囲を取得し、該時間情報及び該地理範囲に基づいてメッシュIDを計算するメッシュ番号計算ステップと、
    固有表現データ取得手段が、前記メッシュIDに基づいて前記3次元メッシュテーブルを参照し、対応する固有表現データを取得する固有表現データ取得ステップと、
    出力手段が、前記固有表現データ取得ステップで取得した前記固有表現データを出力する出力ステップと、
    固有表現データ再取得手段が、前記出力ステップで出力された固有表現データの数が所定の数に満たない場合に、前記時間情報の要素及び前記地理範囲の要素の少なくともいずれか一方を拡張することにより、探索範囲を拡大し、再度固有表現データの探索を行い、前記出力手段に出力する処理を、該固有表現データの個数が所定の数になるまで繰り返す固有表現データ再取得ステップと、
    を行うことを特徴とする情報検索方法。
  7. 前記固有表現データ再取得ステップにおいて、
    前記時間情報の時間要素を所定の比率に基づいて、前方または後方のいずれか、または、双方に探索範囲を拡大して前記3次元メッシュテーブルを探索する時間探索ステップ、
    前記地理範囲を所定の比率に基づいて地理的に拡大して前記3次元メッシュテーブルを探索する地理探索ステップ、
    のいずれか、または、両方を行い、
    前記時間探索ステップでは、前方探索を優先させる
    請求項5または6記載の情報検索方法。
  8. コンピュータを、
    請求項1乃至4のいずれか1項に記載の情報検索装置の各手段として機能させるための情報検索プログラム。
JP2011248074A 2011-11-11 2011-11-11 情報検索装置及び方法及びプログラム Expired - Fee Related JP5604406B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011248074A JP5604406B2 (ja) 2011-11-11 2011-11-11 情報検索装置及び方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011248074A JP5604406B2 (ja) 2011-11-11 2011-11-11 情報検索装置及び方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2013105282A JP2013105282A (ja) 2013-05-30
JP5604406B2 true JP5604406B2 (ja) 2014-10-08

Family

ID=48624785

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011248074A Expired - Fee Related JP5604406B2 (ja) 2011-11-11 2011-11-11 情報検索装置及び方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5604406B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111858787B (zh) * 2019-09-24 2024-07-30 北京嘀嘀无限科技发展有限公司 一种poi信息获取的方法及装置
CN111324683B (zh) * 2020-02-19 2023-08-25 中国电子科技集团公司第二十八研究所 一种时空与要素统一编码的数据管理方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1153366A (ja) * 1997-07-31 1999-02-26 Nippon Telegr & Teleph Corp <Ntt> 施設検索方法
JP4227370B2 (ja) * 2002-07-26 2009-02-18 キヤノン株式会社 情報検索装置、情報検索方法及びプログラム
JP2004234288A (ja) * 2003-01-30 2004-08-19 Nippon Telegr & Teleph Corp <Ntt> Web検索方法及び装置、Web検索プログラム並びにそのプログラムを記録した記録媒体
JP5390840B2 (ja) * 2008-11-27 2014-01-15 株式会社日立製作所 情報分析装置

Also Published As

Publication number Publication date
JP2013105282A (ja) 2013-05-30

Similar Documents

Publication Publication Date Title
CN102855309B (zh) 一种基于用户行为关联分析的信息推荐方法及装置
CN103984757B (zh) 在搜索结果页上插入新闻信息条目的方法和系统
Liu et al. A search and summary application for traffic events detection based on twitter data
US20160335367A1 (en) Entity disambiguation using multisource learning
WO2015035401A1 (en) Automated discovery using textual analysis
CN106599215A (zh) 一种基于深度学习的问句生成方法和问句生成系统
Jaiswal et al. Predicting time-sensitive user locations from social media
JP5604406B2 (ja) 情報検索装置及び方法及びプログラム
Hugo et al. Introduction: Advancing the demography of forced migration and refugees
JP2008123526A (ja) 情報検索方法及び装置
JP5639549B2 (ja) 情報検索装置及び方法及びプログラム
Glomb et al. Popularity of the cult of Asclepius in the times of the Antonine Plague: Temporal modeling of epigraphic evidence
JP5528402B2 (ja) キーワード関連地名抽出装置及び方法及びプログラム
JP5224453B2 (ja) 地理的特徴情報抽出方法およびシステム
US9092409B2 (en) Smart scoring and filtering of user-annotated geocoded datasets
CN109241395B (zh) 一种基于关键词解析的试题网络排重检索办法
Johnson et al. 140 characters or less: How is the twitter mediascape influencing the Egyptian revolution?
KR20180044111A (ko) 데이터 수집 방법 및 그 장치
JP5801243B2 (ja) 特徴キーワード推薦装置及び方法及びプログラム
JP5798081B2 (ja) 情報検索装置及び方法及びプログラム
JP5977199B2 (ja) 地域連想語抽出装置、地域連想語抽出方法及び地域連想語抽出プログラム
JP5815467B2 (ja) 検索キーワード提示装置及び方法及びプログラム
JP2018151789A (ja) 情報処理装置、情報処理方法、プログラム、および広告情報処理システム
JP5806971B2 (ja) 地域推定装置及び方法及びプログラム
JP5410359B2 (ja) クエリ選択装置及びプログラム

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20131004

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140617

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140819

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140825

R150 Certificate of patent or registration of utility model

Ref document number: 5604406

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees