JP4803805B2 - 検索装置 - Google Patents
検索装置 Download PDFInfo
- Publication number
- JP4803805B2 JP4803805B2 JP2006177041A JP2006177041A JP4803805B2 JP 4803805 B2 JP4803805 B2 JP 4803805B2 JP 2006177041 A JP2006177041 A JP 2006177041A JP 2006177041 A JP2006177041 A JP 2006177041A JP 4803805 B2 JP4803805 B2 JP 4803805B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- headword
- search
- contents
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明に係る検索システムM1に係る機能ブロック図を図1に示す。検索システムM1は、知識辞書情報生成装置M3及び検索装置M5を有している。
検索システム1のハードウェア構成を図2を用いて説明する。検索システム1は、知識辞書情報生成装置21及び検索装置23を有している。知識辞書情報生成装置21及び検索装置23は、互いにネットワークを介してデータの送受信が可能なように接続されている。
知識辞書情報生成装置21のハードウェア構成を図3を用いて説明する。知識辞書情報生成装置21は、CPU211、メモリ212、ハードディスク213、および通信回路218を備えている。また、知識辞書情報生成装置21には、キーボード214、マウス215、ディスプレイ216、およびCD−ROMドライブ217が接続されている。
検索装置23のハードウェア構成を図4に基づいて説明する。検索装置23は、CPU231、メモリ232、ハードディスク233、および通信回路238を備えている。また、検索装置23には、キーボード234、マウス235、ディスプレイ236、およびCD−ROMドライブ237が接続されている。
知識辞書情報生成装置21が通信回路218を介して取得する索引入力DB、目次入力DB、及びハードディスク213に記録する知識辞書DBについて説明する。
索引入力DBは、書籍の索引ページの電子データである索引ページデータに基づいて生成されるデータである。索引入力DBを説明する前に、索引ページデータについて図5A、図5Bを用いて説明する。
目次入力DBは、書籍の目次ページの電子データである目次ページデータに基づいて生成されるデータである。目次入力DBを説明する前に、目次ページデータについて図7A、図7Bを用いて説明する。
知識辞書DBとは、ある語句と当該語句に関連する語句とを関連付けて記述したデータベースである。
知識辞書情報生成装置21における動作の概略を図11に示す。以下において、知識辞書情報生成装置21は、索引入力DBとして図6に示すものを、目次入力DBとして図9に示すものを取得するとして説明する。
CPU211は索引語知識抽出処理を実行し、メモリ212に索引語知識抽出DBを生成する。索引語知識抽出DBの一例を図12に示す。索引語知識抽出DBは、[見出し語]列C1001、[見出し語ID]列C1003、及び[関連見出し語群]列C1005を有している。[見出し語]列C1001には、索引入力DBの[索引語]列C301から抽出した索引語が記述される。[見出し語ID]列C1003には、[見出し語]列C1001に記述された見出し語を一意に特定するID番号が記述される。[関連見出し語群]列C1005には、索引入力DBの[索引見出し語群]列C303に記述される索引見出し語が記述される。
CPU211は目次見出し語知識抽出処理を実行し、メモリ212に目次見出し語知識抽出DBを生成する。目次見出し語知識抽出DBの一例を図14に示す。目次見出し語知識抽出DBは、[見出し語]列C1201、[見出し語ID]列C1203、及び[関連見出し語群]列C1205を有している。[見出し語]列C1201には、目次入力DBの[目次見出し語]列C403から抽出した目次見出し語が記述される。[見出し語ID]列C1203には、[見出し語]列C1201に記述された見出し語を一意に特定するID番号が記述される。[関連見出し語群]列C1205には、目次入力DBの[階層フラグ]列C401及び[目次見出し]列C403に基づいて決定した目次見出し語が記述される。詳細については後述する。
CPU211は知識辞書生成処理を実行し、図10に示す知識辞書DBを生成する。
検索装置23における動作の概略を図17に示す。検索装置23のCPU231は、検索プログラムの起動命令があったと判断すると(S1701)、検索プログラムを起動し、図18に示す検索画面をディスプレイ236に表示する(S1703)。検索画面には、検索語記述領域A601、検索条件選択領域A603、及び検索結果表示領域A605が設けられている。検索語記述領域A601は、テキストボックスにより構成されている。検索条件選択領域A603には、「前方一致」、「後方一致」、「部分一致」及び「完全一致」の各検索条件を選択することができるラジオボタンが表示されている。検索結果表示領域A605は、主検索処理(後述)の検索結果を表示する第1の検索結果表示領域A615、及び、見出し語検索処理(後述)若しくは関連見出し語検索処理(後述)の検索結果を表示する第2の検索結果表示領域A625を有している
検索装置23を使用するユーザは、検索しようとする語句を検索語として検索語記述領域A601にキーボード234(図4参照)等の入力手段を用いて記述する。さらに、ユーザは、検索条件選択領域A603に表示されているラジオボタンを用いて、所望の検索条件を選択する。そして、ユーザは、検索を開始するための検索ボタンB601を選択する。
検索装置23のCPU231が、検索ボタンB601が選択された判断した場合に行う主検索処理を図20に示すフローチャートを用いて説明する。
検索装置23のCPU231が、見出し語マークMRK1が選択された判断した場合に行う見出し語検索処理を図21に示すフローチャートを用いて説明する。
検索装置23のCPU231が、見出し語マークMRK3が選択された判断した場合に行う関連見出し語検索処理を図24に示すフローチャートを用いて説明する。
検索装置23では、検索した結果の一部若しくは全部を検索結果保存情報として保存することができる。ユーザは、検索結果保存情報を利用することによって、過去に行った検索の履歴を知ることができるので、今後の検索に対する指針を得ることができる。
(1)目次ページデータの階層構造
前述の実施例1においては、目次ページデータの階層構造として、「章」、「項」、「節」、「内容」の四層階層を例示したが、例示のものに限定されない。例えば、「章」及び「内容」の二層階層、「章」、「項」、「内容」の三層階層等にしてもよい。
前述の実施例1においては、索引ページにおけるページ番号から当該ページを代表する索引見出し語を取得する際には、ページ−見出し語テーブルを利用するものとしたが、代表する索引見出し語を取得できるのであれば例示のものに限定されない。例えば、書籍の内容を示す内容データから、ページ番号に対応するページの内容を取得し、内容を解析して当該内容を代表する単語を決定し、決定した単語が目次見出し語に存在するものについて当該ページを代表する目次見出し語とするようにしてもよい。
前述の実施例1においては、目次見出しが重複するか否かを判断して、見出し語IDを付与することとした。しかし、階層フラグの値と目次見出し語の値とを組み合わせることによって、目次見出し語の重複を判断し、見出し語IDを付与するようにしてもよい。これにより、目次見出し語として異なる階層に同じ名前の目次見出し語が存在する場合であっても、適切に見出し語IDを付与することができる。
前述の実施例1においては、索引入力DBは階層構造を有していないものとした。しかし、索引入力DBについても、索引語間に階層構造を有するようにしてもよい。この場合、実施例1における目次入力DBと同様に処理すればよい。
前述の実施例1では、階層構造として目次における「章」、「項」、「節」、「内容」を例示したが、階層構造を示すものであれば例示のものに限定されない。例えば、「レベル1」、「レベル2」、・・・等であってもよい。
前述の実施例1においては、知識辞書DBでは、階層フラグが「項」の見出し語については階層フラグが「章」の見出し語の関連見出し語として、階層フラグが「節」の見出し語については階層フラグが「項」の見出し語の関連見出し語として等、下位の階層に属する見出し語が、上位の階層に属する見出し語の関連語とされていた。しかし、上位の階層に属する見出し語が、下位の階層に属する見出し語の関連語とするようにしてもよい。
前述の実施例1においては、検索結果として表示する見出し語及び関連見出し語について、階層的に表示すること、及び、見出し語マークMRK1、関連見出し語マークMRK3によって、両者を区別することとした。しかし、検索結果として表示する見出し語及び関連見出し語を区別して表示できるものであれば、これに限定されない。例えば、見出し語をボールド等による強調表示とし、関連見出し語を強調表示しないようにするようにしてもよい。
前述の実施例1においては、検索装置23において、検索語に対する関連見出し語を得られることとしたが、さらに、検索結果として得られた見出し語・関連見出し語に関する情報源(例えば、ウェブページ)をユーザに提示するようにしてもよい。この場合、知識辞書DBに登録されている見出し語にウェブページのURL等のアクセス情報を関連付けて、当該知識辞書DBに登録するようにすればよい。検索結果画面にて表示した見出し語・関連見出し語を所定の方法で選択すると、情報源を表示するようにすればい。さらに、情報源に対してネットワークを介してアクセスできるようにしてもよい。
前述の実施例1においては、検索システム1を知識辞書情報生成装置21及び検索装置23によって構成したが、両者の機能を一体とした検索装置としてもよい。
前述の実施例1においては、検索装置23は、関連語を検索するための主検索処理、見出し語検索処理、関連見出し語検索処理、及び検索結果保存処理を行うこととした。しかし、主検索処理をベースとして、他の処理を選択的に組み合わせるようにしてもよい。例えば、検索装置23は、主検索処理、見出し語検索処理、及び関連見出し語検索処理のみを有するようにしてもよい。
前述の実施例1においては、検索結果を保存する際に、ユーザが選択した見出し語若しくは関連見出し語に関連する見出し語及び関連見出し語を一群として保存し、検索結果保存情報表示領域A1305に表示することとしたが、保存する情報としてはこれに限定されない。例えば、ユーザが選択した見出し語若しくは関連見出し語のみを保存し、表示するようにしてもよい。また、ユーザが関連見出し語を選択した場合には、当該関連見出し語と上位の見出し語のみを保存し、表示するようにしてもよい。
前述の実施例1においては、図に示した各フローチャートに基づいて、各処理を実現するようにした。しかし、各処理を実現できるものであれば、各フローチャート内における処理の順番は例示のものに限定されない。
M3・・・・・知識辞書情報生成装置
M5・・・・・検索装置
M31・・・・・目次情報取得手段
M33・・・・・索引情報取得手段
M35・・・・・知識辞書生成手段
M51・・・・・検索語取得手段
M52・・・・・検索結果情報取得手段
M53・・・・・検索結果情報表示手段
M54・・・・・検索語選択手段
M55・・・・・保存情報選択手段
M56・・・・・検索結果情報保存手段
M57・・・・・保存検索結果情報表示手段
1・・・・・検索システム
21・・・・・知識辞書情報生成装置
23・・・・・検索装置
Claims (5)
- 見出し語情報と、当該見出し語情報と関連する事項である関連見出し語情報とが関連付けられた知識辞書情報を用いて検索を行う検索装置であって、
検索に用いる語句である検索語情報を取得する検索語取得手段、
取得した前記検索語情報を用いて、前記知識辞書情報の前記見出し語情報に対して所定の検索を行い、前記検索語情報に対応する前記見出し語情報及び当該見出し語情報に関連付けられた前記関連見出し語情報を検索結果情報として取得する検索結果情報取得手段、
前記検索結果情報を表示する検索結果情報表示手段、
を有する検索装置において、
前記知識辞書情報は、さらに、
書籍の目次に含まれる見出しを表す目次見出し情報を複数有する目次情報であって、当該目次情報に属する前記目次見出し情報と少なくとも他の一の前記目次見出し情報とが階層構造により関連付けられていた目次情報と、書籍の索引に含まれる見出しを表す索引見出し情報を有する索引情報であって、当該索引見出し情報と少なくとも他の一の前記索引見出し情報とが関連付けられていた索引情報と、が統合された知識辞書情報であって、
前記目次見出し情報及び前記索引見出し情報により前記見出し語情報が構成され、
当該目次見出し情報に関連付けられた他の目次見出し情報及び当該索引見出し情報に関連付けられた他の索引見出し情報により前記関連見出し語が構成され、
前記知識辞書情報のデータ構造は、前記関連見出し語情報において、前記目次見出し情報と他の前記目次見出し情報との間には階層構造が存在せず、さらに、前記見出し語情報の前記目次見出し情報と、当該目次見出し情報が属していた前記階層構造の階層と関連する階層に属する他の前記目次見出し情報が前記関連見出し語情報として関連付けられていること、
を特徴とする検索装置。 - 請求項1に係る検索装置において、
前記検索語取得手段は、ネットワークを介して前記検索結果情報取得手段と接続されていること、
を特徴とする検索装置。 - 見出し語情報と、当該見出し語情報と関連する事項である関連見出し語情報とが関連付けられた知識辞書情報対して検索を行う検索プログラムであって、
前記検索プログラムは、コンピュータを、
検索に用いる語句である検索語を取得する検索語取得手段、
取得した前記検索語情報を用いて、前記知識辞書情報の前記見出し語情報に対して所定の検索を行い、前記検索語情報に対応する前記見出し語情報及び当該見出し語情報に関連付けられた前記関連見出し語情報を検索結果情報として取得する検索結果情報取得手段、
前記検索結果情報を表示する検索結果情報表示手段、として機能させる検索プログラムにおいて、
前記知識辞書情報は、さらに、
書籍の目次に含まれる見出しを表す目次見出し情報を複数有する目次情報であって、当該目次情報に属する前記目次見出し情報と少なくとも他の一の前記目次見出し情報とが階層構造により関連付けられていた目次情報と、書籍の索引に含まれる見出しを表す索引見出し情報を有する索引情報であって、当該索引見出し情報と少なくとも他の一の前記索引見出し情報とが関連付けられていた索引情報と、が統合された知識辞書情報であって、
前記目次見出し情報及び前記索引見出し情報により前記見出し語情報が構成され、
当該目次見出し情報に関連付けられた他の目次見出し情報及び当該索引見出し情報に関連付けられた他の索引見出し情報により前記関連見出し語が構成され、
前記知識辞書情報のデータ構造は、
前記関連見出し語情報において、前記目次見出し情報と他の前記目次見出し情報との間には階層構造が存在せず、さらに、前記見出し語情報の前記目次見出し情報と、当該目次見出し情報が属していた前記階層構造の階層と関連する階層に属する他の前記目次見出し情報が前記関連見出し語情報として関連付けられていること、
を特徴とする検索プログラム。 - 請求項3に係る検索プログラムにおいて、
前記検索語取得手段は、ネットワークを介して前記検索結果情報取得手段と接続されていること、
を特徴とする検索プログラム。 - コンピュータを用いて、見出し語情報と、当該見出し語情報と関連する事項である関連見出し語情報とが関連付けられた知識辞書情報に対して検索を行う検索方法において、
前記コンピュータが、検索に用いる語句である検索語を取得し、
前記コンピュータが、取得した前記検索語情報を用いて、前記知識辞書情報の前記見出し語情報に対して所定の検索を行い、前記検索語情報に対応する前記見出し語情報及び当該見出し語情報に関連付けられた前記関連見出し語情報を検索結果情報として取得し、
前記コンピュータが、前記検索結果情報を表示する検索方法において、
前記知識辞書情報は、さらに、
書籍の目次に含まれる見出しを表す目次見出し情報を複数有する目次情報であって、当該目次情報に属する前記目次見出し情報と少なくとも他の一の前記目次見出し情報とが階層構造により関連付けられていた目次情報と、書籍の索引に含まれる見出しを表す索引見出し情報を有する索引情報であって、当該索引見出し情報と少なくとも他の一の前記索引見出し情報とが関連付けられていた索引情報と、が統合された知識辞書情報であって、
前記目次見出し情報及び前記索引見出し情報により前記見出し語情報が構成され、
当該目次見出し情報に関連付けられた他の目次見出し情報及び当該索引見出し情報に関連付けられた他の索引見出し情報により前記関連見出し語が構成され、
前記知識辞書情報のデータ構造は、前記関連見出し語情報において、前記目次見出し情報と他の前記目次見出し情報との間には階層構造が存在せず、さらに、前記見出し語情報の前記目次見出し情報と、当該目次見出し情報が属していた前記階層構造の階層と関連する階層に属する他の前記目次見出し情報が前記関連見出し語情報として関連付けられていること、
を特徴とする検索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006177041A JP4803805B2 (ja) | 2006-06-27 | 2006-06-27 | 検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006177041A JP4803805B2 (ja) | 2006-06-27 | 2006-06-27 | 検索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008009543A JP2008009543A (ja) | 2008-01-17 |
JP4803805B2 true JP4803805B2 (ja) | 2011-10-26 |
Family
ID=39067732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006177041A Expired - Fee Related JP4803805B2 (ja) | 2006-06-27 | 2006-06-27 | 検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4803805B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5265638B2 (ja) * | 2010-09-28 | 2013-08-14 | ヤフー株式会社 | 電子端末機及び方法 |
JP5814682B2 (ja) * | 2011-08-01 | 2015-11-17 | 株式会社 ミックウェア | ナビゲーション装置、地点名称出力方法、およびプログラム |
JP6447549B2 (ja) * | 2016-03-15 | 2019-01-09 | カシオ計算機株式会社 | テキスト検索装置、テキスト検索方法及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2881891B2 (ja) * | 1990-01-16 | 1999-04-12 | 株式会社日立製作所 | 階層形式をもつ電子化マニユアルの処理装置 |
JPH0528199A (ja) * | 1991-07-18 | 1993-02-05 | Canon Inc | 文書検索装置 |
JP3579945B2 (ja) * | 1995-02-28 | 2004-10-20 | 富士ゼロックス株式会社 | 階層項目検索装置および階層項目検索方法 |
JP2004272682A (ja) * | 2003-03-10 | 2004-09-30 | Casio Comput Co Ltd | 情報表示制御装置及びプログラム |
JP2005222188A (ja) * | 2004-02-04 | 2005-08-18 | Akiyoshi Kato | 辞書またはインターネットの検索方法及び装置 |
-
2006
- 2006-06-27 JP JP2006177041A patent/JP4803805B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008009543A (ja) | 2008-01-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10031649B2 (en) | Automated content detection, analysis, visual synthesis and repurposing | |
CA2935272C (en) | Coherent question answering in search results | |
KR101554293B1 (ko) | 교차 언어 정보 검색 | |
US20100114991A1 (en) | Managing the content of shared slide presentations | |
MX2013005056A (es) | Enfoque multimodal para entrada de busqueda de consulta. | |
KR101391107B1 (ko) | 검색 대상의 타입을 인터렉티브하게 표시하는 검색 서비스 제공 방법 및 장치 | |
JP2001306599A (ja) | 映像の階層的管理方法および階層的管理装置並びに階層的管理プログラムを記録した記録媒体 | |
JP4803805B2 (ja) | 検索装置 | |
Kan | SlideSeer: A digital library of aligned document and presentation pairs | |
JP2009003515A (ja) | 情報検索装置 | |
Wu et al. | Deconfounded and explainable interactive vision-language retrieval of complex scenes | |
JP2009080625A (ja) | 知識構築装置、プログラムおよび知識構築方法 | |
CN107180058B (zh) | 一种用于基于字幕信息进行查询的方法和装置 | |
JP5451696B2 (ja) | 字幕付加装置、コンテンツデータ、字幕付加方法及びプログラム | |
JP2008009542A (ja) | 知識辞書情報生成装置 | |
CN116414854A (zh) | 数据资产查询方法、装置、计算机设备和存储介质 | |
Martins et al. | Geographically-aware information retrieval for collections of digitized historical maps | |
JP2006023968A (ja) | 固有表現抽出方法および装置並びにそれらに用いるプログラム | |
Greulich | Embedded indexing with Word: new light on an old topic. Part 1: how to monitor creation of an index | |
JP2009098829A (ja) | 漫画のコマ検索装置 | |
US20150309991A1 (en) | Input support device, input support method, and input support program | |
JP2020173611A (ja) | 検索処理プログラム、検索処理方法および検索処理装置 | |
TWI243321B (en) | Prefix glossary method and system for assisting word input | |
JP2014222448A (ja) | 書籍抽出装置、書籍抽出方法及び書籍抽出用プログラム | |
CN115630620B (zh) | 工程造价分析数据采集与处理的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080630 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090609 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20101027 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110520 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110530 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110721 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110808 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110808 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140819 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |