JP5050599B2 - 情報検索システム、情報検索装置、情報検索方法、及びそのプログラム。 - Google Patents
情報検索システム、情報検索装置、情報検索方法、及びそのプログラム。 Download PDFInfo
- Publication number
- JP5050599B2 JP5050599B2 JP2007076044A JP2007076044A JP5050599B2 JP 5050599 B2 JP5050599 B2 JP 5050599B2 JP 2007076044 A JP2007076044 A JP 2007076044A JP 2007076044 A JP2007076044 A JP 2007076044A JP 5050599 B2 JP5050599 B2 JP 5050599B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- keyword
- replacement
- similarity
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
そして、このような情報検索システム等において、利用者により入力された検索キーワードから検索結果が得られない場合に、その検索キーワードを自動的に類似するキーワードに置換することで検索範囲を拡張し、少なくとも1件以上の検索結果を取得できるようにするユーザ支援機能を有するものが開示されている(特許文献1参照)。
図1は、本実施の形態に係る情報検索装置1を実現するコンピュータのハードウェア構成図である。
情報検索装置1は、制御部3、記憶部5、メディア入出力部7、通信制御部9、入力部11、表示部13、周辺機器I/F部15等が、バス17と介して接続される。
なお、以下の実施の形態では、コンピュータをハードウェアとして利用した情報検索装置1の例を示しているが、コンピュータに限るものではなく、例えばカーナビゲーションシステム等の各種電子機器に応用することも可能である。
ROMは、不揮発性メモリであり、コンピュータのブートプログラムやBIOS等のプログラム、データ等を恒久的に保持している。
RAMは、揮発性メモリであり、記憶部5、ROM、記録媒体等からロードしたプログラム、データ等を一時的に保持するとともに、制御部3が各種処理を行う為に使用するワークエリアを備える。
これらの各プログラムコードは、制御部3により必要に応じて読み出されてRAMに移され、CPUに読み出されて各種の手段として実行される。
図2は、情報検索装置1の機能の概要を示すブロック図である。
例えば、条件データから抽出した個々のキーワードとして「百貨店」と入力された場合に、同義語データベース27を参照して「百貨店」に対応する同義語「デパート」を抽出し、この同義語も検索キーワードとする。
f=W1×S1x+W2×S2y+・・・+Wn×Snz・・・(1)
で表される。
ただし、キーワードKiに対応する置換後のキーワード集合にはKi自身(元のキーワード)も含むものとし、自身との類似度は1.0とする。
また検索手段25は、検索式評価手段25により、置換の正当性が高い、すなわち評価値fの値が大きい検索式から順に情報検索を実行し、一つ以上の検索結果データを取得した場合には、検索を終了して、検索結果出力手段26に出力する。
図3に示すように、同義語データベース27には、あるキーワードに対する同義語が設定されている。例えば、「百貨店」というキーワードに対しては同義語「デパート」等が対応付けられている。
図4に示すように、類似度付き置換候補データベース28には、あるキーワードに類似する類似キーワードRが、元のキーワードとどの程度類似しているかを数値で示した類似度Sに対応付けて設定されている。ここで類似キーワードとは、意味の類似する語をいい、検索キーワードの置換候補とするものである。また各キーワードはカテゴリに対応付けて整理されている。
例えば、地域カテゴリの類似キーワードを収集するには、駅を表すキーワードの場合には、その隣接駅や所在地を類似キーワードとすればよい。また、その類似度を設定するには、駅名同士の場合であれば2点間の距離を用い、駅名と県名のように下位概念と上位概念の関係にある場合は、駅名、市町村、都道府県といった規模の階層の差を類似度に反映すればよい。
また、業種カテゴリの類似キーワードを収集するには、利用者に予めアンケート調査等を実施し、その結果から類似キーワードを選出すればよい。また、類似度を設定するには、アンケート中の出現頻度を目安に設定すればよい。
図5に示すように、置換重み指数データベース29には、あるキーワードが他のキーワードにどの程度置換可能かどうかを示す置換重み指数Wがキーワード毎に設定されている。また各キーワードはカテゴリに対応付けて整理されている。置換重み指数Wは、例えば0より大きく1以下の数値で表現される。
この変換表30には距離基準毎に置換重み指数が設定されている。例えば、半径0.5km程度の徒歩圏内に相当する地域には比較的大きな値の置換重み指数「0.9」が設定され、半径2km程度の地域内には置換重み指数「0.7」が設定され、半径10km程度の市内に相当する地域には置換重み指数「0.5」が設定され、半径20km程度の地区内には置換重み指数「0.3」が設定され、半径50km程度の県内に相当する地域には小さな値の置換重み指数「0.1」が設定されている。
図7は本実施の形態における情報検索装置1において実行される情報検索処理の流れを説明するフローチャートであり、図8は情報検索装置1の表示部13に表示される表示画面の一例、図9及び図10は情報検索処理にて生成される検索式リストの例を示す図である。
以下、図7のフローチャート、図8の表示画面例、図9及び図10に示す検索式リストの具体例を参照しながら、情報検索装置1で実行される情報検索処理を説明する。
類似度付き置換候補データベース28(図4)を参照すると、「名東区」の類似キーワードには「千種区」、「昭和区」、「名古屋市」が設定されている。また、「ホームセンター」の類似キーワードには「デパート」と「スーパー」が設定されている。
従って、これらの類似キーワードと元のキーワード(「名東区」、「ホームセンター」)とを含む全ての組み合わせが、検索式リストとして生成される(図9の表の中列)。
制御部3は、入力された条件データから検索キーワードとして「藤が丘駅」及び「カフェ」を抽出する。
そして、制御部3は、これらの類似キーワードと元のキーワード(「藤が丘駅」、「カフェ」)とを含む全ての組み合わせを、検索式リストとして生成する(図10の中列)。
21・・・・・・条件データ入力手段
22・・・・・・検索キーワード抽出手段
23・・・・・・検索式リスト生成手段
24・・・・・・検索式評価手段
25・・・・・・検索手段
26・・・・・・検索結果出力手段
27・・・・・・同義語データベース
28・・・・・・類似度付き置換候補データベース
29・・・・・・置換重み指数データベース
Claims (13)
- あるキーワードに類似する類似キーワードを、元のキーワードとどの程度類似しているかを示す類似度に対応付けてキーワード毎に設定した類似度付き置換候補データベースと、
あるキーワードが他のキーワードにどの程度置換可能かどうかを示す置換重み指数をキーワード毎に設定した置換重み指数データベースと、
入力された条件データから検索キーワードを抽出する検索キーワード抽出手段と、
前記検索キーワード抽出手段により抽出された全ての検索キーワードについて、前記類似度付き置換候補データベースを参照して類似キーワードを抽出し、その類似キーワードと元の検索キーワードとを含む全ての組み合わせを検索式のリストとして生成する検索式リスト生成手段と、
前記置換重み指数データベースに設定された置換重み指数と、前記類似度付き置換候補データベースに設定された類似度と、を用いて、前記検索式リスト生成手段により生成された各検索式について、元の検索キーワードからの置換の正当性を評価する検索式評価手段と、
前記検索式評価手段による評価結果に基づいて、該検索式を条件データに置き換えて情報検索を行う検索手段と、
を備えることを特徴とする情報検索装置。 - 前記検索式評価手段は、前記検索式に含まれる各キーワードについて前記置換重み指数と前記類似度との重畳和を算出し、その結果に基づいて置換の正当性を評価することを特徴とする請求項1記載の情報検索装置。
- 前記検索手段は、検索式評価手段による評価の結果に基づき、置換の正当性の高い検索式から順に情報検索を実行し、一つ以上の検索結果データを取得した場合に検索を終了することを特徴とする請求項1記載の情報検索装置。
- あるキーワードに対する同義語を設定した同義語データベースを更に備え、
前記検索キーワード抽出手段は、入力された条件データから抽出したキーワードの同義語を前記同義語データベースを参照して抽出し、その同義語も含めて検索キーワードとすることを特徴とする請求項1記載の情報検索装置。 - ネットワークを介して互いに通信接続された複数の情報処理装置により構成される情報検索システムであって、
あるキーワードに類似する類似キーワードを、元のキーワードとどの程度類似しているかを示す類似度に対応付けてキーワード毎に設定した類似度付き置換候補データベースと、
あるキーワードが他のキーワードにどの程度置換可能かどうかを示す置換重み指数をキーワード毎に設定した置換重み指数データベースと、
入力された条件データから検索キーワードを抽出する検索キーワード抽出手段と、
前記検索キーワード抽出手段により抽出された全ての検索キーワードについて、前記類似度付き置換候補データベースを参照して類似キーワードを抽出し、その類似キーワードと元の検索キーワードとを含む全ての組み合わせを検索式のリストとして生成する検索式リスト生成手段と、
前記置換重み指数データベースに設定された置換重み指数と、前記類似度付き置換候補データベースに設定された類似度と、を用いて、前記検索式リスト生成手段により生成された各検索式について、元の検索キーワードからの置換の正当性を評価する検索式評価手段と、
前記検索式評価手段による評価結果に基づいて、該検索式を条件データに置き換えて情報検索を行う検索手段と、
を備えることを特徴とする情報検索システム。 - 前記検索式評価手段は、前記検索式に含まれる各キーワードについて前記置換重み指数と前記類似度との重畳和を算出し、その結果に基づいて置換の正当性を評価することを特徴とする請求項5記載の情報検索システム。
- 前記検索手段は、検索式評価手段による評価の結果に基づき、置換の正当性の高い検索式から順に情報検索を実行し、一つ以上の検索結果データを取得した場合に検索を終了することを特徴とする請求項5記載の情報検索システム。
- あるキーワードに対する同義語を設定した同義語データベースを更に備え、
前記検索キーワード抽出手段は、入力された条件データから抽出したキーワードの同義語を前記同義語データベースを参照して抽出し、その同義語も含めて検索キーワードとすることを特徴とする請求項5記載の情報検索システム。 - 入力された条件データから検索キーワードを抽出する検索キーワード抽出ステップと、
前記検索キーワード抽出ステップにより抽出された全ての検索キーワードについて、あるキーワードに類似する類似キーワードを、元のキーワードとどの程度類似しているかを示す類似度に対応付けてキーワード毎に設定した類似度付き置換候補データベースを参照して類似キーワードを抽出し、その類似キーワードと元の検索キーワードとを含む全ての組み合わせを検索式のリストとして生成する検索式リスト生成ステップと、
あるキーワードが他のキーワードにどの程度置換可能かどうかを示す置換重み指数をキーワード毎に設定した置換重み指数データベースに設定された置換重み指数と、前記類似度付き置換候補データベースに設定された類似度と、を用いて、前記検索式リスト生成ステップにより生成された各検索式について、元の検索キーワードからの置換の正当性を評価する検索式評価ステップと、
前記検索式評価ステップによる評価結果に基づいて、該検索式を条件データに置き換えて情報検索を行う検索ステップと、
を備え、それらのステップをCPUが行うことを特徴とする情報検索方法。 - 前記検索式評価ステップは、前記検索式に含まれる各キーワードについて前記置換重み指数と前記類似度との重畳和を算出し、その結果に基づいて置換の正当性を評価することを特徴とする請求項9記載の情報検索方法。
- 前記検索ステップは、検索式評価ステップによる評価の結果に基づき、置換の正当性の高い検索式から順に情報検索を実行し、一つ以上の検索結果データを取得した場合に検索を終了することを特徴とする請求項9記載の情報検索方法。
- 前記検索キーワード抽出ステップは、入力された条件データから抽出したキーワードの同義語を、あるキーワードに対する同義語を設定した同義語データベースを参照して抽出し、その同義語も含めて検索キーワードとすることを特徴とする請求項9記載の情報検索方法。
- コンピュータを請求項1から4のいずれかの情報検索装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007076044A JP5050599B2 (ja) | 2007-03-23 | 2007-03-23 | 情報検索システム、情報検索装置、情報検索方法、及びそのプログラム。 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007076044A JP5050599B2 (ja) | 2007-03-23 | 2007-03-23 | 情報検索システム、情報検索装置、情報検索方法、及びそのプログラム。 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008234519A JP2008234519A (ja) | 2008-10-02 |
JP5050599B2 true JP5050599B2 (ja) | 2012-10-17 |
Family
ID=39907186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007076044A Expired - Fee Related JP5050599B2 (ja) | 2007-03-23 | 2007-03-23 | 情報検索システム、情報検索装置、情報検索方法、及びそのプログラム。 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5050599B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101868936B1 (ko) * | 2011-10-25 | 2018-06-20 | 주식회사 케이티 | 키워드 추출 및 정련 시스템과 그 방법 |
JP2019159883A (ja) * | 2018-03-14 | 2019-09-19 | アルパイン株式会社 | 検索システム、検索方法 |
CN113449099B (zh) * | 2020-03-25 | 2024-02-23 | 瑞典爱立信有限公司 | 文本分类方法和文本分类设备 |
WO2024069941A1 (ja) * | 2022-09-30 | 2024-04-04 | 三菱電機株式会社 | 情報処理装置、検索方法、及び検索プログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3527540B2 (ja) * | 1994-06-15 | 2004-05-17 | 株式会社アドイン研究所 | 情報検索装置 |
JP3430431B2 (ja) * | 1995-02-06 | 2003-07-28 | 日本電信電話株式会社 | データベース検索装置及びデータベース検索方法 |
JPH1097545A (ja) * | 1996-09-20 | 1998-04-14 | Sharp Corp | 情報処理装置 |
JP3612914B2 (ja) * | 1997-01-14 | 2005-01-26 | 富士ゼロックス株式会社 | 構造化文書検索装置及び構造化文書検索方法 |
JP2003016103A (ja) * | 2001-06-28 | 2003-01-17 | Ai Frontier:Kk | ホームページにおけるデータ紹介提示方式 |
JP4459269B2 (ja) * | 2005-03-31 | 2010-04-28 | パイオニア株式会社 | 曲検索装置、曲検索方法及び曲検索用プログラム並びに情報記録媒体 |
-
2007
- 2007-03-23 JP JP2007076044A patent/JP5050599B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008234519A (ja) | 2008-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4810469B2 (ja) | 検索支援装置、プログラム及び検索支援システム | |
US8145662B2 (en) | Methods and apparatus for generating a data dictionary | |
US20090313572A1 (en) | Phrase builder | |
JP2012501499A (ja) | バーティカル提案により検索要求を支援するためのシステム及び方法 | |
JP5494126B2 (ja) | 文書推薦システム、文書推薦装置、文書推薦方法、及びプログラム | |
JP6390139B2 (ja) | 文書検索装置、文書検索方法、プログラム、及び、文書検索システム | |
JPH06309362A (ja) | 情報検索方法 | |
CN104881397B (zh) | 缩写词扩展方法和装置 | |
JP5050599B2 (ja) | 情報検索システム、情報検索装置、情報検索方法、及びそのプログラム。 | |
JP6003637B2 (ja) | 情報処理装置、ノード抽出プログラムおよびノード抽出方法 | |
US20190121918A1 (en) | Identifying merchant data associated with multiple data structures | |
JP5302614B2 (ja) | 施設関連情報の検索データベース形成方法および施設関連情報検索システム | |
JP5897991B2 (ja) | 専門家評価情報管理装置 | |
US20090144222A1 (en) | Chart generator for searching research data | |
JP2017219899A (ja) | ナレッジ検索装置、ナレッジ検索方法、および、ナレッジ検索プログラム | |
US20090144318A1 (en) | System for searching research data | |
US20090144241A1 (en) | Search term parser for searching research data | |
JP2012043115A (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
US20090144242A1 (en) | Indexer for searching research data | |
JP2001325276A (ja) | 情報処理システム、情報処理方法、コンピュータプログラム、記憶媒体及びプログラム伝送装置 | |
US20090144317A1 (en) | Data search markup language for searching research data | |
US20090144243A1 (en) | User interface for searching research data | |
JP2018022217A (ja) | ナレッジ検索装置、ナレッジ検索方法、および、ナレッジ検索プログラム | |
JP6570712B2 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
JP5417359B2 (ja) | 文書評価支援システム、及び文書評価支援方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100302 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20100528 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100528 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120329 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120410 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120608 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120626 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120709 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5050599 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150803 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |