JP5620896B2 - 文書検索装置及び方法及びプログラム - Google Patents
文書検索装置及び方法及びプログラム Download PDFInfo
- Publication number
- JP5620896B2 JP5620896B2 JP2011220544A JP2011220544A JP5620896B2 JP 5620896 B2 JP5620896 B2 JP 5620896B2 JP 2011220544 A JP2011220544 A JP 2011220544A JP 2011220544 A JP2011220544 A JP 2011220544A JP 5620896 B2 JP5620896 B2 JP 5620896B2
- Authority
- JP
- Japan
- Prior art keywords
- place name
- name
- place
- hierarchy
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G06F17/30—
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
地名と広い地域ほど値が大きく狭い地域ほど値が小さくなるような該地名の知名度を示した地名知名度記憶手段と、
地名と該地名を構成する階層を格納した地名記憶手段と、
入力された都道府県名から丁目番地までを含む正規地名に基づいて前記地名記憶手段を参照して、該正規地名の階層表現を取得し、該階層表現の下位の地名の知名度を前記地名知名度記憶手段から取得し、所定の閾値以下の知名度の地名を除き、該正規地名の上位の階層を省略しても一意であれば該上位の階層の地名部分を省略し、上位の階層の地名部分を省略した地名の知名度が、他の地名の知名度の和よりも大きければその地名を検索対象として検索する地名抽出手段と、
入力されたキーワードを含み、前記地名抽出手段で抽出された地名を少なくとも一つ含むような文書を検索する検索手段と、を有する。
入力された座標または地理範囲から、対応する都道府県名から丁目番地までを含む正規地名を取得する正規地名取得手段と、
前記正規地名に基づいて前記地名記憶手段を参照し、該地名の階層を取得し、最下位の階層を除いた地名に基づいて前記地名知名度記憶手段を参照し、該地名に対応する知名度が所定の閾値未満であるかを判定する処理を、該地名に階層がなくなるまで、または、閾値以上になるまで繰り返し、その時点における地名を候補リストに追加する下位省略地名展開手段と、
前記地名記憶手段に、前記候補リストの地名の最上位の階層を除いた地名Aを含む地名がない場合は、該地名Aを該出力リストに加え、ある場合は、曖昧さがあると判断し、該地名Aについて最上位階層から記述した語の知名度aと、それ以外の語の知名度bを取得し、該知名度bの和が該知名度aより小さければ該地名Aを検索語として出力リストに追加する処理を、地名階層がなくなるまで、または、曖昧さがあり、該知名度bの和が該知名度a以上となるまで、該候補リストの地名全てに対して繰り返し、該出力リストを出力する上位省略地名展開手段と、を含む。
102 地名語辞書
110 正規地名取得部
120 下位省略地名展開部
130 上位省略地名展開部
140 検索部
Claims (5)
- 地名として適したものを検索するための文書検索装置であって、
地名と広い地域ほど値が大きく狭い地域ほど値が小さくなるような該地名の知名度を示した地名知名度記憶手段と、
地名と該地名を構成する階層を格納した地名記憶手段と、
入力された都道府県名から丁目番地までを含む正規地名に基づいて前記地名記憶手段を参照して、該正規地名の階層表現を取得し、該階層表現の下位の地名の知名度を前記地名知名度記憶手段から取得し、所定の閾値以下の知名度の地名を除き、該正規地名の上位の階層を省略しても一意であれば該上位の階層の地名部分を省略し、上位の階層の地名部分を省略した地名の知名度が、他の地名の知名度の和よりも大きければその地名を検索対象として抽出する地名抽出手段と、
入力されたキーワードを含み、前記地名抽出手段で抽出された地名を少なくとも一つ含むような文書を検索する検索手段と、
を有することを特徴とする文書検索装置。 - 前記地名抽出手段は、
入力された座標または地理範囲から、対応する都道府県名から丁目番地までを含む正規地名を取得する正規地名取得手段と、
前記正規地名に基づいて前記地名記憶手段を参照し、該地名の階層を取得し、最下位の階層を除いた地名に基づいて前記地名知名度記憶手段を参照し、該地名に対応する知名度が所定の閾値未満であるかを判定する処理を、該地名に階層がなくなるまで、または、閾値以上になるまで繰り返し、その時点における地名を候補リストに追加する下位省略地名展開手段と、
前記地名記憶手段に、前記候補リストの地名の最上位の階層を除いた地名Aを含む地名がない場合は、該地名Aを該出力リストに加え、ある場合は、曖昧さがあると判断し、該地名Aについて最上位階層から記述した語の知名度aと、それ以外の語の知名度bを取得し、該知名度bの和が該知名度aより小さければ該地名Aを検索語として出力リストに追加する処理を、地名階層がなくなるまで、または、曖昧さがあり、該知名度bの和が該知名度a以上となるまで、該候補リストの地名全てに対して繰り返し、該出力リストを出力する上位省略地名展開手段と、
を含む請求項1記載の文書検索装置。 - 地名として適したものを検索するための文書検索方法であって、
地名と広い地域ほど値が大きく狭い地域ほど値が小さくなるような該地名の知名度を示した地名知名度記憶手段と、
地名と該地名を構成する階層を格納した地名記憶手段と、を有する装置において、
地名抽出手段が、入力された都道府県名から丁目番地までを含む正規地名に基づいて前記地名記憶手段を参照して、該正規地名の階層表現を取得し、該階層表現の下位の地名の知名度を前記地名知名度記憶手段から取得し、所定の閾値以下の知名度の地名を除き、該正規地名の上位の階層を省略しても一意であれば該上位の階層の地名部分を省略し、上位の階層の地名部分を省略した地名の知名度が、他の地名の知名度の和よりも大きければその地名を検索対象として抽出する地名抽出ステップと、
検索手段が、入力されたキーワードを含み、前記地名抽出ステップで抽出された地名を少なくとも一つ含むような文書を検索する検索ステップと、
を行うことを特徴とする文書検索方法。 - 前記地名抽出ステップにおいて、
正規地名取得手段が、入力された座標または地理範囲から、対応する都道府県名から丁目番地までを含む正規地名を取得する正規地名取得ステップと、
下位省略地名展開手段が、前記正規地名に基づいて前記地名記憶手段を参照し、該地名の階層を取得し、最下位の階層を除いた地名に基づいて前記地名知名度記憶手段を参照し、該地名に対応する知名度が所定の閾値未満であるかを判定する処理を、該地名に階層がなくなるまで、または、閾値以上になるまで繰り返し、その時点における地名を候補リストに追加する下位省略地名展開ステップと、
上位省略地名展開手段が、前記地名記憶手段に、前記候補リストの地名の最上位の階層を除いた地名Aを含む地名がない場合は、該地名Aを該出力リストに加え、ある場合は、曖昧さがあると判断し、該地名Aについて最上位階層から記述した語の知名度aと、それ以外の語の知名度bを取得し、該知名度bの和が該知名度aより小さければ該地名Aを検索語として出力リストに追加する処理を、地名階層がなくなるまで、または、曖昧さがあり、該知名度bの和が該知名度a以上となるまで、該候補リストの地名全てに対して繰り返し、該出力リストを出力する上位省略地名展開ステップと、
を含む請求項3記載の文書検索方法。 - コンピュータを、
請求項1または2に記載の文書検索装置の各手段として機能させるための文書検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011220544A JP5620896B2 (ja) | 2011-10-04 | 2011-10-04 | 文書検索装置及び方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011220544A JP5620896B2 (ja) | 2011-10-04 | 2011-10-04 | 文書検索装置及び方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013080405A JP2013080405A (ja) | 2013-05-02 |
JP5620896B2 true JP5620896B2 (ja) | 2014-11-05 |
Family
ID=48526720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011220544A Expired - Fee Related JP5620896B2 (ja) | 2011-10-04 | 2011-10-04 | 文書検索装置及び方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5620896B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002334096A (ja) * | 2001-05-11 | 2002-11-22 | Hitachi Ltd | 携帯端末に対する情報提供システム |
JP2010146030A (ja) * | 2007-03-29 | 2010-07-01 | Access Co Ltd | 検索システム、携帯型情報機器、検索プログラム |
JP5174279B2 (ja) * | 2010-03-26 | 2013-04-03 | 楽天株式会社 | 検索システム、検索方法、検索プログラム及び記録媒体 |
-
2011
- 2011-10-04 JP JP2011220544A patent/JP5620896B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013080405A (ja) | 2013-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5296147B2 (ja) | 地理的関連性に従う文書のインデックス付け | |
KR100930455B1 (ko) | 쿼리별 검색 컬렉션 생성 방법 및 시스템 | |
KR100903961B1 (ko) | 시그니처 파일을 이용한 고차원 데이터 색인 및 검색방법과 그 시스템 | |
JP5616444B2 (ja) | 文書インデックス化およびデータクエリングのための方法およびシステム | |
JP5087377B2 (ja) | 地理的情報を含む文書群の検索装置、検索方法、検索プログラムおよびそのプログラムを記録した記録媒体 | |
JP2009110513A (ja) | ワードの類似性を用いたオントロジーの自動生成 | |
JP2009129323A (ja) | 同義語抽出装置 | |
JP4324650B2 (ja) | 情報資源検索装置、情報資源検索方法及び情報資源検索プログラム | |
JP4237813B2 (ja) | 構造化文書管理システム | |
Li et al. | A probabilistic topic-based ranking framework for location-sensitive domain information retrieval | |
US20140280050A1 (en) | Term searching based on context | |
JP2010123036A (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP5620896B2 (ja) | 文書検索装置及び方法及びプログラム | |
Manguinhas et al. | A geo-temporal web gazetteer integrating data from multiple sources | |
JP2011159100A (ja) | 逐次類似文書検索装置、逐次類似文書検索方法およびプログラム | |
Calazans Campelo et al. | Geographic scope modeling for web documents | |
JP6079207B2 (ja) | キーワード提示プログラム、キーワード提示方法及びキーワード提示装置 | |
JP5589009B2 (ja) | 推薦クエリ抽出装置及び方法及びプログラム | |
JP5199968B2 (ja) | キーワードタイプ判定装置、キーワードタイプ判定方法およびキーワードタイプ判定プログラム | |
Katragadda et al. | An unsupervised approach to identify location based on the content of user’s tweet history | |
JP2010250389A (ja) | 情報検索システム、方法及びプログラム、索引作成システム、方法及びプログラム、 | |
CN107818091B (zh) | 文档处理方法及装置 | |
JP2019008477A (ja) | 判別プログラム、判別装置及び判別方法 | |
JP5670944B2 (ja) | 文書要約装置及び方法及びプログラム | |
JP5303500B2 (ja) | 文書検索装置及び方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20131004 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140204 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140611 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140617 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140818 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140916 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140919 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5620896 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |