JP5604406B2 - 情報検索装置及び方法及びプログラム - Google Patents
情報検索装置及び方法及びプログラム Download PDFInfo
- Publication number
- JP5604406B2 JP5604406B2 JP2011248074A JP2011248074A JP5604406B2 JP 5604406 B2 JP5604406 B2 JP 5604406B2 JP 2011248074 A JP2011248074 A JP 2011248074A JP 2011248074 A JP2011248074 A JP 2011248074A JP 5604406 B2 JP5604406 B2 JP 5604406B2
- Authority
- JP
- Japan
- Prior art keywords
- mesh
- expression data
- specific expression
- search
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
前処理手段と、キーワード抽出手段と、を有し、
前記前処理手段は、
検索対象文書が入力されると、固有表現、地理表現、地理情報、時間情報を抽出して解析結果記憶手段に格納する文書解析手段と、
前記解析結果記憶手段から解析結果を取得してメッシュ番号を付与し、該メッシュ番号毎に固有表現の数を合計して3次元メッシュテーブルに格納するメッシュテーブル作成手段と、を有し、
前記キーワード抽出手段は、
利用者から入力された時間情報及び地理範囲を取得し、該時間情報及び該地理範囲に基づいてメッシュIDを計算するメッシュ番号計算手段と、
前記メッシュIDに基づいて前記3次元メッシュテーブルを参照し、対応する固有表現データを取得する固有表現データ取得手段と、
前記固有表現データ取得手段において、前記メッシュIDにより固有表現データが取得できなかった場合に、前記時間情報の要素及び前記地理範囲の要素の少なくともいずれか一方を拡張することにより、探索範囲を拡大し、再度固有表現データの探索を行う固有表現データ再取得手段と、
取得した固有表現データを出力する出力手段と、を有する。
前処理手段と、キーワード抽出手段と、を有し、
前記前処理手段は、
検索対象文書が入力されると、固有表現、地理表現、地理情報、時間情報を抽出して解析結果記憶手段に格納する文書解析手段と、
前記解析結果記憶手段から解析結果を取得してメッシュ番号を付与し、該メッシュ番号毎に固有表現の数を合計して3次元メッシュテーブルに格納するメッシュテーブル作成手段と、を有し、
前記キーワード抽出手段は、
利用者から入力された時間情報及び地理範囲を取得し、該時間情報及び該地理範囲に基づいてメッシュIDを計算するメッシュ番号計算手段と、
前記メッシュIDに基づいて前記3次元メッシュテーブルを参照し、対応する固有表現データを取得する固有表現データ取得手段と、
前記固有表現データ取得手段で、取得した前記固有表現データを出力する出力手段と、
前記出力手段で出力された固有表現データの数が所定の数に満たない場合に、前記時間除法の要素及び前記地理範囲の要素の少なくともいずれか一方を拡張することにより、探索範囲を拡大し、再度固有表現データの探索を行い、前記出力手段に出力する固有表現データ再取得手段と、を有する。
前記時間情報の時間要素を所定の比率に基づいて、前方または後方のいずれか、または、双方に探索範囲を拡大して前記3次元メッシュテーブルを探索する時間探索手段、
前記地理範囲を所定の比率に基づいて地理的に拡大して前記3次元メッシュテーブルを探索する地理拡大探索手段、
のいずれか、または、両方を含む。
<ページ番号><固有表現><地理情報(緯度・経度)><時間情報>
を格納する。
20110908−5350−6000(時間情報−緯度番号−経度番号)
3)メッシュ番号毎に固有表現の数を合計して、3次元メッシュテーブルに図6に示す構造で保存する。1つのページ番号の地理情報、時間情報に複数のデータがある場合は全ての組合せについて、加算を行う。
このように比率αを用いて前方後方双方に探索する設定を可能とする。その際にαを0.5以上1以下とすることで、前方を優先させる。
2 3次元メッシュテーブル作成部
3 メッシュ番号計算部
4 固有表現データ取得部
5 固有表現データ再取得部
6 固有表現出力部
7 解析結果保存テーブル
8 3次元メッシュテーブル
11 ページ番号決定部
12 固有表現抽出部
13 地名表現抽出部
14 地理情報抽出部
15 時間情報抽出部
16 解析結果保存部
Claims (8)
- 地理的範囲を入力された地図の表示範囲や緯度経度情報に基づいてキーワードを検索して提示する情報検索装置であって、
前処理手段と、キーワード抽出手段と、を有し、
前記前処理手段は、
検索対象文書が入力されると、固有表現、地理表現、地理情報、時間情報を抽出して解析結果記憶手段に格納する文書解析手段と、
前記解析結果記憶手段から解析結果を取得してメッシュ番号を付与し、該メッシュ番号毎に固有表現の数を合計して3次元メッシュテーブルに格納するメッシュテーブル作成手段と、を有し、
前記キーワード抽出手段は、
利用者から入力された時間情報及び地理範囲を取得し、該時間情報及び該地理範囲に基づいてメッシュIDを計算するメッシュ番号計算手段と、
前記メッシュIDに基づいて前記3次元メッシュテーブルを参照し、対応する固有表現データを取得する固有表現データ取得手段と、
前記固有表現データ取得手段において、前記メッシュIDにより固有表現データが取得できなかった場合に、前記時間情報の要素及び前記地理範囲の要素の少なくともいずれか一方を拡張することにより、探索範囲を拡大し、再度固有表現データの探索を行う固有表現データ再取得手段と、
取得した固有表現データを出力する出力手段と、
を有することを特徴とする情報検索装置。 - 地理的範囲を入力された地図の表示範囲や緯度経度情報に基づいてキーワードを検索して提示する情報検索装置であって、
前処理手段と、キーワード抽出手段と、を有し、
前記前処理手段は、
検索対象文書が入力されると、固有表現、地理表現、地理情報、時間情報を抽出して解析結果記憶手段に格納する文書解析手段と、
前記解析結果記憶手段から解析結果を取得してメッシュ番号を付与し、該メッシュ番号毎に固有表現の数を合計して3次元メッシュテーブルに格納するメッシュテーブル作成手段と、を有し、
前記キーワード抽出手段は、
利用者から入力された時間情報及び地理範囲を取得し、該時間情報及び該地理範囲に基づいてメッシュIDを計算するメッシュ番号計算手段と、
前記メッシュIDに基づいて前記3次元メッシュテーブルを参照し、対応する固有表現データを取得する固有表現データ取得手段と、
前記固有表現データ取得手段で取得した前記固有表現データを出力する出力手段と、
前記出力手段で出力された固有表現データの数が所定の数に満たない場合に、前記時間情報の要素及び前記地理範囲の要素の少なくともいずれか一方を拡張することにより、探索範囲を拡大し、再度固有表現データの探索を行い、前記出力手段に出力する固有表現データ再取得手段と、
を有することを特徴とする情報検索装置。 - 前記固有表現データ再取得手段は、
前記時間情報の時間要素を所定の比率に基づいて、前方または後方のいずれか、または、双方に探索範囲を拡大して前記3次元メッシュテーブルを探索する時間探索手段、
前記地理範囲を所定の比率に基づいて地理的に拡大して前記3次元メッシュテーブルを探索する地理拡大探索手段、
のいずれか、または、両方を含む
請求項1または2記載の情報検索装置。 - 前記時間探索手段は、
前記前方探索を優先させる
請求項3記載の情報検索装置。 - 地理的範囲を入力された地図の表示範囲や緯度経度情報に基づいてキーワードを検索して提示する情報検索方法であって、
前処理過程と、キーワード抽出過程からなり、
前記前処理過程において、
文書解析手段が、検索対象文書が入力されると、固有表現、地理表現、地理情報、時間情報を抽出して解析結果記憶手段に格納する文書解析ステップと、
メッシュテーブル作成手段が、前記解析結果記憶手段から解析結果を取得してメッシュ番号を付与し、該メッシュ番号毎に固有表現の数を合計して3次元メッシュテーブルに格納するメッシュテーブル作成ステップと、を行い
前記キーワード抽出過程において、
メッシュ番号計算手段が、利用者から入力された時間情報及び地理範囲を取得し、該時間情報及び該地理範囲に基づいてメッシュIDを計算するメッシュ番号計算ステップと、
固有表現データ取得手段が、前記メッシュIDに基づいて前記3次元メッシュテーブルを参照し、対応する固有表現データを取得する固有表現データ取得ステップと、
固有表現データ再取得手段が、前記固有表現データ取得ステップにおいて、前記メッシュIDにより固有表現データが取得できなかった場合に、前記時間情報の要素及び前記地理範囲の要素の少なくともいずれか一方を拡張することにより、探索範囲を拡大し、再度固有表現データの探索を行う固有表現データ再取得ステップと、
出力手段が、取得した固有表現データを出力する出力ステップと、
を行うことを特徴とする情報検索方法。 - 地理的範囲を入力された地図の表示範囲や緯度経度情報に基づいてキーワードを検索して提示する情報検索方法であって、
前処理過程と、キーワード抽出過程からなり、
前記前処理過程において、
文書解析手段が、検索対象文書が入力されると、固有表現、地理表現、地理情報、時間情報を抽出して解析結果記憶手段に格納する文書解析ステップと、
メッシュテーブル作成手段が、前記解析結果記憶手段から解析結果を取得してメッシュ番号を付与し、該メッシュ番号毎に固有表現の数を合計して3次元メッシュテーブルに格納するメッシュテーブル作成ステップと、を行い
前記キーワード抽出過程において、
メッシュ番号計算手段が、利用者から入力された時間情報及び地理範囲を取得し、該時間情報及び該地理範囲に基づいてメッシュIDを計算するメッシュ番号計算ステップと、
固有表現データ取得手段が、前記メッシュIDに基づいて前記3次元メッシュテーブルを参照し、対応する固有表現データを取得する固有表現データ取得ステップと、
出力手段が、前記固有表現データ取得ステップで取得した前記固有表現データを出力する出力ステップと、
固有表現データ再取得手段が、前記出力ステップで出力された固有表現データの数が所定の数に満たない場合に、前記時間情報の要素及び前記地理範囲の要素の少なくともいずれか一方を拡張することにより、探索範囲を拡大し、再度固有表現データの探索を行い、前記出力手段に出力する処理を、該固有表現データの個数が所定の数になるまで繰り返す固有表現データ再取得ステップと、
を行うことを特徴とする情報検索方法。 - 前記固有表現データ再取得ステップにおいて、
前記時間情報の時間要素を所定の比率に基づいて、前方または後方のいずれか、または、双方に探索範囲を拡大して前記3次元メッシュテーブルを探索する時間探索ステップ、
前記地理範囲を所定の比率に基づいて地理的に拡大して前記3次元メッシュテーブルを探索する地理探索ステップ、
のいずれか、または、両方を行い、
前記時間探索ステップでは、前方探索を優先させる
請求項5または6記載の情報検索方法。 - コンピュータを、
請求項1乃至4のいずれか1項に記載の情報検索装置の各手段として機能させるための情報検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011248074A JP5604406B2 (ja) | 2011-11-11 | 2011-11-11 | 情報検索装置及び方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011248074A JP5604406B2 (ja) | 2011-11-11 | 2011-11-11 | 情報検索装置及び方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013105282A JP2013105282A (ja) | 2013-05-30 |
JP5604406B2 true JP5604406B2 (ja) | 2014-10-08 |
Family
ID=48624785
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011248074A Expired - Fee Related JP5604406B2 (ja) | 2011-11-11 | 2011-11-11 | 情報検索装置及び方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5604406B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111858787B (zh) * | 2019-09-24 | 2024-07-30 | 北京嘀嘀无限科技发展有限公司 | 一种poi信息获取的方法及装置 |
CN111324683B (zh) * | 2020-02-19 | 2023-08-25 | 中国电子科技集团公司第二十八研究所 | 一种时空与要素统一编码的数据管理方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1153366A (ja) * | 1997-07-31 | 1999-02-26 | Nippon Telegr & Teleph Corp <Ntt> | 施設検索方法 |
JP4227370B2 (ja) * | 2002-07-26 | 2009-02-18 | キヤノン株式会社 | 情報検索装置、情報検索方法及びプログラム |
JP2004234288A (ja) * | 2003-01-30 | 2004-08-19 | Nippon Telegr & Teleph Corp <Ntt> | Web検索方法及び装置、Web検索プログラム並びにそのプログラムを記録した記録媒体 |
JP5390840B2 (ja) * | 2008-11-27 | 2014-01-15 | 株式会社日立製作所 | 情報分析装置 |
-
2011
- 2011-11-11 JP JP2011248074A patent/JP5604406B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013105282A (ja) | 2013-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102855309B (zh) | 一种基于用户行为关联分析的信息推荐方法及装置 | |
CN103984757B (zh) | 在搜索结果页上插入新闻信息条目的方法和系统 | |
Liu et al. | A search and summary application for traffic events detection based on twitter data | |
US20160335367A1 (en) | Entity disambiguation using multisource learning | |
WO2015035401A1 (en) | Automated discovery using textual analysis | |
CN106599215A (zh) | 一种基于深度学习的问句生成方法和问句生成系统 | |
Jaiswal et al. | Predicting time-sensitive user locations from social media | |
JP5604406B2 (ja) | 情報検索装置及び方法及びプログラム | |
Hugo et al. | Introduction: Advancing the demography of forced migration and refugees | |
JP2008123526A (ja) | 情報検索方法及び装置 | |
JP5639549B2 (ja) | 情報検索装置及び方法及びプログラム | |
Glomb et al. | Popularity of the cult of Asclepius in the times of the Antonine Plague: Temporal modeling of epigraphic evidence | |
JP5528402B2 (ja) | キーワード関連地名抽出装置及び方法及びプログラム | |
JP5224453B2 (ja) | 地理的特徴情報抽出方法およびシステム | |
US9092409B2 (en) | Smart scoring and filtering of user-annotated geocoded datasets | |
CN109241395B (zh) | 一种基于关键词解析的试题网络排重检索办法 | |
Johnson et al. | 140 characters or less: How is the twitter mediascape influencing the Egyptian revolution? | |
KR20180044111A (ko) | 데이터 수집 방법 및 그 장치 | |
JP5801243B2 (ja) | 特徴キーワード推薦装置及び方法及びプログラム | |
JP5798081B2 (ja) | 情報検索装置及び方法及びプログラム | |
JP5977199B2 (ja) | 地域連想語抽出装置、地域連想語抽出方法及び地域連想語抽出プログラム | |
JP5815467B2 (ja) | 検索キーワード提示装置及び方法及びプログラム | |
JP2018151789A (ja) | 情報処理装置、情報処理方法、プログラム、および広告情報処理システム | |
JP5806971B2 (ja) | 地域推定装置及び方法及びプログラム | |
JP5410359B2 (ja) | クエリ選択装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20131004 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140204 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140611 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140617 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140819 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140825 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5604406 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |