JP2005316590A - 情報検索装置 - Google Patents
情報検索装置 Download PDFInfo
- Publication number
- JP2005316590A JP2005316590A JP2004131494A JP2004131494A JP2005316590A JP 2005316590 A JP2005316590 A JP 2005316590A JP 2004131494 A JP2004131494 A JP 2004131494A JP 2004131494 A JP2004131494 A JP 2004131494A JP 2005316590 A JP2005316590 A JP 2005316590A
- Authority
- JP
- Japan
- Prior art keywords
- search
- screen
- information
- range
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】クエリ解析器12は、ユーザが入力したクエリを解析して、出力先の検索エンジンSE(i)(i=1,2,・・・,n)の検索特性に適した検索キーワードKW(i)を抽出する。検索エンジン群10は、検索特性の異なる検索エンジンを含むので、クエリ解析器12が出力する検索キーワードKW(i)は、出力先の検索エンジンSE(i)の検索特性によって変化する。
【選択図】図1
Description
第1実施形態の情報検索装置(情報検索システム)2における検索対象データ群である論文データ群を構成する個々の論文データは、論文を電子化したXML文書である。図5は論文P2を例示する図である。図6および図7は、図5の論文P2を電子化して得られたXML文書X2を例示する図である。XML文書X2は、RDF(Resource Description Framework)のステートメントをXML構文で表現したものとなっている。
○ハードウエア構成;
図8は、情報検索装置2のハードウエア構成を示す図である。
図9は、情報検索装置2の全体機能構成を示すブロック図である。
図10は、クエリ解析器212の機能構成を示すブロック図である。なお、自然文「抄録に電子カルテを含む論文」がクエリとして入力された場合を例としてあげて以下の説明を行う。
HTML文書生成部211は、検索画面、検索結果総合表示画面、範囲限定検索結果表示画面および範囲指定解除検索結果表示画面をHTMLで記述したHTML文書を生成する。以下では、個々のGUI画面について最初に説明し、しかる後にGUI画面間の遷移について説明する。
図11は、検索画面201を例示する図である。検索画面201は、左側の検索条件入力画面201Lと右側のヘルプ画面201Rとからなる複合画面である。このような複合画面は、HTML文書中でフレームを定義することによって実現される。この点は、後述する検索結果総合表示画面、範囲限定検索結果表示画面および範囲指定解除検索結果表示画面も同様である。
図12は、検索結果総合表示画面(以下では「総合画面」とも称する)202を例示する図である。総合画面202は、左側の検索条件総合一覧表示画面(以下では「総合一覧画面」とも称する)202Lと右側の詳細情報表示画面202Rとからなる複合画面である。ただし、総合画面202が表示された直後には、詳細情報表示画面202Rは空欄となっている。
図14は、範囲限定検索結果表示画面(以下では「範囲限定画面」とも称する)を例示する図である。範囲限定画面203は、左側の範囲限定検索結果一覧表示画面(以下では「範囲限定一覧画面」とも称する)203Lと右側の詳細情報表示画面203Rとからなる複合画面である。なお、範囲限定画面203が表示された直後には詳細情報表示画面203Rは空欄であるが、総合画面202の詳細情報表示画面202Rと同様の詳細情報表示画面203Rが表示された状態が図14には示されている。
図15は、範囲指定解除検索結果表示画面(以下では「範囲指定解除画面」とも称する)204を例示する図である。範囲指定解除画面204は、左側の範囲指定解除検索結果一覧表示画面(以下では「範囲指定解除一覧画面」とも称する)204Lと右側の詳細情報表示画面204Rとからなる複合画面である。なお、範囲指定解除画面204が表示された直後には詳細情報表示画面204Rは空欄であるが、総合画面202の詳細情報表示画面202Rと同様の詳細情報表示画面204Rが表示された状態が図15には示されている。
図16は、検索画面201、総合画面202、範囲限定画面203および範囲指定解除画面204の間の遷移を示す図である。
情報検索装置2の動作を図17および図18のフローチャートを参照しながら説明する。
第2実施形態の情報検索装置3は、第1実施形態の情報検索装置2と類似の構成を有する。したがって、図5〜図9および図16〜図18に関する説明は、情報検索装置3についても当てはまる。しかし、情報検索装置3においては、クエリ解析器の機能構成と、HTML文書生成部211が生成するGUI画面の具体的態様とが情報検索装置2とは異なる。以下では、この相違点について説明する。なお、以下の説明では、情報検索装置2と同等の構成には同じ参照符号を使用して重複説明を省略する。
○クエリ解析器;
図19は、クエリ解析器312の機能構成を示すブロック図である。なお、クエリとして自然文「田中さんの書いた論文」が入力された場合を例としてあげて以下の説明を行う。第3実施形態のクエリ解析器312は、第2実施形態のクエリ解析器212と同様に、ユーザが入力したクエリから検索処理に用いられる全文検索キーワードおよび範囲指定検索キーワードを抽出して検索エンジン群210へ出力する。ただし、クエリ解析器312においては、クエリ解析器212の形態素解析部241が係り受け解析部341に置き換えられている。係り受け解析部341は、自然文の係り受け解析および形態素解析を実行するとともに、辞書244を参照して自然文を文節(「田中さんが」「書いた」「論文」の3文節)および単語(「田中」「さん」「が」「書く(「書い」の終止形)」「た」「論文」の6単語)に分解する。このとき、動詞である「書く」は名詞である「著者」に変換される。しかる後に、クエリ解析器312は、不要語除去ルール245を参照して分解された単語のうち検索キーワードとして不適当な不要語(助詞である「が」や文書特定能力の低い「さん」「論文」)を削除し、残る単語(「著者」「田中」の2単語)を検索キーワード抽出部243へ出力する。
○検索画面;
図20は、HTML文書生成部211が生成する検索画面301を例示する図である。検索画面301には、自然文のクエリを直接入力するためのクエリ入力エリアAR41が表示される。クエリ入力エリアAR41には、任意の文字列を入力可能である。クエリ入力エリアAR41に文字列を入力後に検索ボタンBT41の押下が行われると、当該文字列がクエリとしてクエリ解析部312へ与えられる。
図21は、検索結果総合表示画面(総合画面)302を例示する図である。
第2実施形態の範囲限定検索結果表示画面(範囲限定画面)および範囲指定解除検索結果表示画面(範囲指定解除画面)は、総合画面302と同様の表示レイアウトを有する。ただし、範囲限定画面および範囲指定解除画面で一覧表示される検索結果は、それぞれ、範囲指定検索結果および全文検索結果である。また、表示される画面遷移用のボタンは、グラフィカルな形状は総合画面と類似しているが、その機能は第1実施形態の範囲限定画面および範囲指定解除画面と同等になっている。
21 データベースサーバ
22 ネットワーク
1 クライアント
101〜103 ユーザインターフェース画面
201,301 検索画面
202,302 検索結果総合表示画面(総合画面)
203 範囲限定検索結果表示画面(範囲限定画面)
204 範囲指定解除検索結果表示画面(範囲指定解除画面)
X2 XML文書
Claims (10)
- 情報検索装置であって、
検索キーワードを用いて検索対象データ群に対する検索処理を実行する複数の検索エンジンを含む検索エンジン群と、
ユーザが入力したクエリから前記検索キーワードを抽出し、
前記複数の検索エンジンのうち検索特性が互いに異なるものを含んだ2個以上の検索エンジンへ出力する抽出手段と、
を備え、
前記抽出手段が、出力先の検索エンジンの検索特性に基づいて前記検索キーワードを変化させることを特徴とする情報検索装置。 - 請求項1に記載の情報検索装置において、
前記検索エンジン群が、検索範囲を指定した検索処理を実行する検索エンジンを含み、
前記抽出手段が、前記検索範囲を前記クエリに基づいて決定することを特徴とする情報検索装置。 - 請求項1または請求項2に記載の情報検索装置において、
前記検索処理により得られる検索結果をユーザに提示するユーザインターフェース画面を生成する画面生成手段をさらに備えることを特徴とする情報検索装置。 - 請求項3に記載の情報検索装置において、
前記画面生成手段が、前記2個以上の検索エンジンが実行した検索処理により得られた検索結果を統合して提示する第1ユーザインターフェース画面を生成することを特徴とする情報検索装置。 - 請求項4に記載の情報検索装置において、
前記画面生成手段が、さらに、
前記2個以上の検索エンジンが実行した検索処理により得られた検索結果の各々を個別に提示する第2ユーザインターフェース画面を生成するとともに、
ユーザから与えられた所定の操作に応答して、表示手段に表示されるユーザインターフェース画面が前記第1ユーザインターフェース画面および前記第2ユーザインターフェース画面の間で切り替わることを特徴とする情報検索装置。 - 請求項3に記載の情報検索装置において、
前記画面生成手段が、前記2個以上の検索エンジンが実行した検索処理により得られた検索結果を分離して提示する第1ユーザインターフェース画面を生成することを特徴とする情報検索装置。 - 請求項6に記載の情報検索装置において、
前記画面生成手段が、さらに、
前記2個以上の検索エンジンが実行した検索処理により得られた検索結果の各々を個別に提示する第2ユーザインターフェース画面を生成するとともに、
ユーザから与えられた所定の操作に応答して、表示手段に表示されるユーザインターフェース画面が前記第1ユーザインターフェース画面および前記第2ユーザインターフェース画面の間で切り替わることを特徴とする情報検索装置。 - 請求項1ないし請求項7のいずれかに記載の情報検索装置において、
前記2個以上の検索エンジンが、メタデータ検索エンジンおよび全文検索エンジンを含むことを特徴とする情報検索装置。 - 請求項1ないし請求項8のいずれかに記載の情報検索装置において、
前記抽出手段が、形態素解析または係り受け解析を用いて前記検索キーワードを抽出することを特徴とする情報検索装置。 - 情報検索装置であって、
第1検索特性を有する第1検索エンジンと、
前記第1検索特性とは異なる第2検索特性を有する第2検索エンジンと、
前記第1検索特性に適した第1検索キーワード群と前記第2検索特性に適した第2検索キーワード群とをユーザが入力したクエリから抽出する抽出手段と、
を備え、
前記第1検索キーワードと前記第2検索キーワードとが、それぞれ、前記第1検索エンジンおよび前記第2検索エンジンにおける検索対象データ群に対する検索処理に用いられることを特徴とする情報検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004131494A JP2005316590A (ja) | 2004-04-27 | 2004-04-27 | 情報検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004131494A JP2005316590A (ja) | 2004-04-27 | 2004-04-27 | 情報検索装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005316590A true JP2005316590A (ja) | 2005-11-10 |
Family
ID=35443975
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004131494A Pending JP2005316590A (ja) | 2004-04-27 | 2004-04-27 | 情報検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005316590A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007086125A1 (ja) * | 2006-01-26 | 2007-08-02 | Itochu Techno-Science Corporation | ネットワークシステムおよびコンピュータプログラム |
JP2008021031A (ja) * | 2006-07-11 | 2008-01-31 | Canon Inc | 検索サーバ装置及びその制御方法、情報処理装置及びその制御方法、情報処理システム、情報検索装置及びその制御方法、プログラム、記憶媒体 |
JP2009146181A (ja) * | 2007-12-14 | 2009-07-02 | Pioneer Electronic Corp | サーバ装置及びプログラム |
JP2013250996A (ja) * | 2013-08-14 | 2013-12-12 | Fujitsu Ltd | 情報検索方法、プログラム及び装置 |
JP2016042213A (ja) * | 2014-08-13 | 2016-03-31 | ヤフー株式会社 | 抽出装置、検索サーバ、情報処理装置、抽出システム、抽出方法及び抽出プログラム |
JP2017120613A (ja) * | 2015-12-28 | 2017-07-06 | 株式会社リコー | 情報処理装置、情報処理方法、情報処理プログラムおよび情報処理システム |
-
2004
- 2004-04-27 JP JP2004131494A patent/JP2005316590A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007086125A1 (ja) * | 2006-01-26 | 2007-08-02 | Itochu Techno-Science Corporation | ネットワークシステムおよびコンピュータプログラム |
JP2008021031A (ja) * | 2006-07-11 | 2008-01-31 | Canon Inc | 検索サーバ装置及びその制御方法、情報処理装置及びその制御方法、情報処理システム、情報検索装置及びその制御方法、プログラム、記憶媒体 |
JP2009146181A (ja) * | 2007-12-14 | 2009-07-02 | Pioneer Electronic Corp | サーバ装置及びプログラム |
JP2013250996A (ja) * | 2013-08-14 | 2013-12-12 | Fujitsu Ltd | 情報検索方法、プログラム及び装置 |
JP2016042213A (ja) * | 2014-08-13 | 2016-03-31 | ヤフー株式会社 | 抽出装置、検索サーバ、情報処理装置、抽出システム、抽出方法及び抽出プログラム |
US10467305B2 (en) | 2014-08-13 | 2019-11-05 | Yahoo Japan Corporation | Extraction device, search server, information processing device, extraction system, extraction method, and non-transitory computer readable storage medium |
JP2017120613A (ja) * | 2015-12-28 | 2017-07-06 | 株式会社リコー | 情報処理装置、情報処理方法、情報処理プログラムおよび情報処理システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7730013B2 (en) | System and method for searching dates efficiently in a collection of web documents | |
JP5744873B2 (ja) | トラステッドクエリのシステムおよび方法 | |
JP4767694B2 (ja) | 不正ハイパーリンク検出装置及びその方法 | |
US8321396B2 (en) | Automatically extracting by-line information | |
CN103034633B (zh) | 生成扩展的搜索结果页面摘要的方法及装置 | |
JPH07325827A (ja) | ハイパーテキスト自動生成装置 | |
JP2009169541A (ja) | Webページ検索サーバ及びクエリ推薦方法 | |
JP2007072646A (ja) | 検索装置、検索方法およびプログラム | |
US20110307497A1 (en) | Synthewiser (TM): Document-synthesizing search method | |
KR100403947B1 (ko) | 개인용 전자문서를 생성하는 방법, 시스템 및 컴퓨터프로그램 제조물 | |
KR20020075359A (ko) | 디지털 소스로부터 정보를 포착하고 관리하기 위한 시스템및 방법 | |
JP2007193697A (ja) | 情報収集装置,情報収集方法およびプログラム | |
US8612431B2 (en) | Multi-part record searches | |
JP2005316590A (ja) | 情報検索装置 | |
JP3683687B2 (ja) | 情報フィルタリング装置および情報フィルタリング方法 | |
JP2007011973A (ja) | 情報検索装置及び情報検索プログラム | |
JPH11134341A (ja) | ハイパーメデイア記述言語による記述情報の抜粋表示シ ステム | |
JP2004157965A (ja) | 検索支援装置、検索支援方法、プログラムおよび記録媒体 | |
JP2002183175A (ja) | テキストマイニング方法 | |
JP5746912B2 (ja) | テキストパターン抽出を用いてWeb文書をリファインするための方法、システム及びコンピュータ読み出し可能記録媒体 | |
JP4980604B2 (ja) | 文書検索装置、文書検索方法、文書検索プログラム及び記録媒体 | |
JP5187187B2 (ja) | 体験情報検索システム | |
Tsapatsoulis | Web image indexing using WICE and a learning-free language model | |
JP2005250693A (ja) | 文字情報分類プログラム | |
JP2000105769A (ja) | 文書表示方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070307 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080617 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080703 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080812 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080916 |