JP4803805B2 - 検索装置 - Google Patents

検索装置 Download PDF

Info

Publication number
JP4803805B2
JP4803805B2 JP2006177041A JP2006177041A JP4803805B2 JP 4803805 B2 JP4803805 B2 JP 4803805B2 JP 2006177041 A JP2006177041 A JP 2006177041A JP 2006177041 A JP2006177041 A JP 2006177041A JP 4803805 B2 JP4803805 B2 JP 4803805B2
Authority
JP
Japan
Prior art keywords
information
headword
search
contents
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006177041A
Other languages
English (en)
Other versions
JP2008009543A (ja
Inventor
教彦 瀬戸川
泰文 藤井
毅 稲垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Solutions Ltd
Original Assignee
Hitachi Solutions Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Solutions Ltd filed Critical Hitachi Solutions Ltd
Priority to JP2006177041A priority Critical patent/JP4803805B2/ja
Publication of JP2008009543A publication Critical patent/JP2008009543A/ja
Application granted granted Critical
Publication of JP4803805B2 publication Critical patent/JP4803805B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、知識辞書情報を用いる検索システムであって、特に、検索語に関連する語句を容易に検索することができるものに関する。
従来の検索システムについて図31及び図32を用いて説明する。図31に示すように、検索システム3110は、本検索システム3110を動作させるためのプログラム3112が記憶されたROM3114、CPU3116、RAM3118、文書や画像などの被検索対象のデータが格納された被検索対象データベース3120、任意のキーワードと当該キーワードに関連する関連語の関係、すなわち検索条件として使用可能な任意の語句間の関係を示す関連語辞書データ(以下、関連語辞書と称す)が格納された関連語辞書データベース3122、履歴データベース3124、キーボードやマウスなどの操作装置3126、及び表示装置3128が相互に接続されている。
なお、関連語辞書データベース3122に記憶する語句間の関連には、語句間の関連度を表す情報が含まれている。ここで、関連語RiのキーワードKに対する関連度は、関連語Ri(i:1〜4)を用いて本検索システム3110で検索に成功した回数Xi、失敗した回数Yiを履歴データベース3124より抽出し、このXi、Yiを用いて演算される。
検索システム3110では、ユーザにより一又は複数のキーワードが入力されると、関連語辞書データベース3122から、ユーザにより入力された各キーワードについて、当該キーワードと関連する語句として登録されている関連語を関連度の高いものから所定数(本実施の形態では8個)を上限として選択する。そして、検索システム3110は、ユーザが入力したキーワードと、キーワードに関連する語句として選択した関連語とを、グラフ構造表示した画面310を表示装置3128に表示することで、ユーザにGUIを提供し、ユーザからの検索条件として用いる語句の選択を受け付ける。
図32に示すように、検索システム3110が表示する画面310では、キーワード(K1〜4)及び関連語(R1〜8)の各語句を、それぞれ四角形のボタン312で表し、このボタン312を頂点とし、関連する語句のボタン312間を接続線314で結んで構成したグラフ構造が表示される。
特開2004−287827
前述の検索装置3110には、以下のような問題点がある。検索装置3110が提供する検索結果は、検索語に対して予め関連付けられている関連語である。したがって、概念的には、ユーザが提供した検索語の範囲を超えるものではない。つまり、ユーザは、ユーザが予め想定した概念を超える語句を得ることはできない、という問題点がある。このような問題点は、ある語句について、ユーザが思っている概念と、当該語句の一般的な概念とが異なっている場合に、特に問題となる。
また、関連語辞書では、語句間の関連度を算出することによって、語句と語句とを定量的に関連付けている。しかし、このような関連度では、語句と語句とがどのように関連しているのか、つまり、定性的な関連づけを示すことはできない。このため、検索語に対して定性的な関連付けを辿ることによって獲得することができる関連語については、ユーザは獲得することができない、という問題点がある。
そこで、本発明は、検索語に対して幅広い範囲の関連語を提供することができる検索システムの提供を目的とする。
本発明に関する課題を解決するための手段および発明の効果を以下に示す。
本発明に係る検索装置及び検索プログラムでは、検索に用いる語句である検索語情報取得し、取得した前記検索語情報を用いて、前記知識辞書情報の前記見出し語情報に対して所定の検索を行い、前記検索語情報に対応する前記見出し語情報及び当該見出し語情報に関連付けられた前記関連見出し語情報を検索結果情報として取得し、前記検索結果情報を表示する。
これにより、検索結果として、単に見出し語を提示するだけでなく、関連見出し語をも提示することができる。よって、ユーザは、検索語に関連する関連見出し語を容易に得ることができる。
本発明に係る検索装置及び検索プログラムでは、さらに、前記検索結果情報の前記見出し語情報と前記関連見出し語情報とを区別して表示する。
これにより、ユーザは、見出し語と関連見出し語との関係を容易に把握することができる。
本発明に係る検索装置及び検索プログラムでは、さらに、前記検索結果情報として表示された前記見出し語情報若しくは前記関連見出し語情報を選択検索語情報として選択し、(a)前記見出し語情報が前記選択検索語情報として選択されたと判断すると、当該選択検索語情報を用いて、前記知識辞書情報の前記関連見出し語情報に対して所定の検索を行い、前記選択検索語情報に対応する前記関連見出し語情報及び当該関連見出し語情報に関連付けられた前記見出し語情報を検索結果情報として取得し、(b)前記関連見出し語情報が前記選択検索語情報として選択されたと判断すると、当該選択検索語情報を用いて、前記知識辞書情報の前記見出し語情報に対して所定の検索を行い、前記選択検索語情報に対応する前記見出し語情報及び当該見出し語情報に関連付けられた前記関連見出し語情報を検索結果情報として取得する。
これにより、見出し語を選択するのか、関連見出し語を選択するのかによって、異なる検索を行うことができる。よって、ユーザは、関連見出し語を取得するために行う検索の幅を広げることができるので、より適切な関連見出し語を容易に得ることができる。
本発明に係る検索装置及び検索プログラムでは、さらに、前記検索語情報を用いて検索し、取得した前記検索結果情報と、前記選択検索語情報を用いて検索し、取得した前記検索結果情報と、を並べて表示する。
これにより、検索結果の履歴を容易に確認することができる。よって、ユーザは、過去の検索履歴を参考に今後の検索を行うことができる。
本発明に係る検索装置及び検索プログラムでは、前記検索結果情報として表示された前記見出し語情報若しくは前記関連見出し語情報を選択保存情報として選択し、前記見出し語情報が前記選択保存情報として選択されたと判断すると、当該見出し語情報及び当該見出し語情報に関連付けられた前記関連見出し語情報を保存検索結果情報として記憶手段に保持し、前記関連見出し語情報が前記選択保存情報として選択されたと判断すると、当該関連見出し語情報及び当該関連見出し語情報に関連付けられた前記見出し語情報を保存検索結果情報として記憶手段に保持する。
これにより、今後の検索を行うに際して、過去の検索結果の履歴を用いることができる。よって、ユーザは、過去の検索履歴を参考に今後の検索を行うことができる。
本発明に係る検索装置及び検索プログラムでは、さらに、保存した前記保存検索結果情報を、検索の履歴が分かるように表示する。
これにより、検索結果の履歴を容易に確認することができる。よって、ユーザは、過去の検索履歴を参考に今後の検索を行うことができる。
本発明に係る検索装置及び検索プログラムでは、さらに、書籍の目次に含まれる見出しを表す目次見出し情報を複数有する目次情報であって、当該目次情報に属する前記目次見出し情報と少なくとも他の一の前記目次見出し情報とが階層構造により関連付けられていた目次情報と、書籍の索引に含まれる見出しを表す索引見出し情報を有する索引情報であって、当該索引見出し情報と少なくとも他の一の前記索引見出し情報とが関連付けられていた索引情報と、が統合された知識辞書情報であって、前記目次見出し情報及び前記索引見出し情報により前記見出し語情報が構成され、当該目次見出し情報に関連付けられた他の目次見出し情報及び当該索引見出し情報に関連付けられた他の索引見出し情報により前記関連見出し語が構成され、前記知識辞書情報のデータ構造は、前記関連見出し語情報において、前記目次見出し情報と他の前記目次見出し情報との間には階層構造が存在せず、さらに、前記見出し語情報の前記目次見出し情報と、当該目次見出し情報が属していた前記階層構造の階層と関連する階層に属する他の前記目次見出し情報が前記関連見出し語情報として関連付けられている。
これにより、予め見出し語間においてある程度の関連づけが施されている書籍の目次情報及び索引情報を用いて、検索語に対する関連見出し語を取得することができる。よって、ユーザは、より適切な関連見出し語を容易に取得することができる。
ここで、請求項に記載されている要素と実施例における要素との対応関係を示す。検索装置は検索装置23に、検索プログラムはCD−ROM230に記録されている検索プログラムに、それぞれ対応する。検索語取得手段、検索結果情報取得手段、検索結果情報表示手段、検索語選択手段、保存情報選択手段、検索結果情報保存手段、及び保存検索結果情報表示手段M57は、それぞれCPU211及びメモリ212に該当する。
見出し語情報は知識辞書データベースの[見出し語]列C501の値に、関連見出し語情報は知識辞書データベースの[関連見出し語群]列C505に、知識辞書情報は知識辞書データベースに、それぞれ対応する。
検索語情報は、検索語記述領域A601に記述される検索語に、検索結果情報は検索結果表示領域A605に表示される検索結果に、それぞれ対応する。
選択検索語情報は、第1の検索結果表示領域A615に表示される見出し語若しくは関連見出し語であって、ユーザが選択した選択語情報に対応する。
選択保存情報は検索結果表示領域A1303において選択された見出し語若しくは関連見出し語に、保存検索結果情報は検索結果保存情報に、それぞれ対応する。
目次見出し情報は目次入力データベースの[目次見出し語]列C403の値に、索引見出し情報は索引入力データベースの[索引語]列C301の値に、それぞれ対応する。
また、階層構造は、目次入力データベースにおける目次見出し間に存在する階層構造(図8参照)に対応する。
本発明における検索システムの実施例を以下において説明する。
1. 概要
本発明に係る検索システムM1に係る機能ブロック図を図1に示す。検索システムM1は、知識辞書情報生成装置M3及び検索装置M5を有している。
知識辞書情報生成装置M3は、目次情報取得手段M31、索引情報取得手段M33、及び、知識辞書情報生成手段M35を有している。
目次情報取得手段M31は、書籍の目次に含まれる見出しを表す目次見出し情報を複数有する目次情報であって、当該目次情報に属する前記目次見出し情報と少なくとも他の一の前記目次見出し情報とが階層構造により関連付けられているものを取得する。
索引情報取得手段M33は、書籍の索引に含まれる見出しを表す索引見出し情報を有する索引情報を取得する。
知識辞書情報生成手段M35は、取得した目次情報及び索引情報を統合して知識辞書情報を生成する。また、知識辞書情報生成手段M35は、前記知識辞書情報に属する前記目次見出し情報と当該知識辞書情報に属する他の前記目次見出し情報との間には階層構造が存在しないように知識辞書情報を生成し、さらに、前記知識辞書情報に属する前記目次見出し情報と、当該目次見出し情報が属していた前記階層構造の階層と関連する階層に属する他の前記目次見出し情報と、を関連付けて前記知識辞書情報を生成する。さらに、知識辞書情報生成手段M35は、前記目次見出し情報と当該目次見出し情報が属する階層以外の階層に属する前記目次見出し情報と関連付けて前記知識辞書情報を生成する。さらに、知識辞書情報生成手段M35は、前記目次見出し情報と当該目次見出し情報が属する階層より所定の下位の階層に属する前記目次見出し情報と関連付ける。さらに、知識辞書情報生成手段M35は、前記知識辞書情報を生成するにあたって、前記目次見出し情報と前記索引見出し情報との間に重複がないように前記知識辞書情報を生成する。さらに、知識辞書情報生成手段M35は、前記目次見出し情報と前記索引見出し情報との間に重複が存在する場合には、前記目次見出し情報若しくは前記索引見出し情報のいづれかと、当該目次見出し情報が属する階層より所定の下位の階層に属する前記目次見出し情報及び当該索引見出し情報と関連付けられていた他の索引見出し情報と、を関連付けて前記知識辞書情報を生成する。
また、検索装置M5は、検索語取得手段M51、検索結果情報取得手段M52、検索結果情報表示手段M53、検索語選択手段M54、保存情報選択手段M55、検索結果情報保存手段M56、及び保存検索結果情報表示手段M57を有している。
検索語取得手段M51は、検索に用いる語句である検索語情報取得する。
検索結果情報取得手段M52は、取得した前記検索語情報を用いて、前記知識辞書情報の前記見出し語情報に対して所定の検索を行い、前記検索語情報に対応する前記見出し語情報及び当該見出し語情報に関連付けられた前記関連見出し語情報を検索結果情報として取得する。また、検索結果情報取得手段M52は、(a)前記見出し語情報が前記選択検索語情報として選択されたと判断すると、当該選択検索語情報を用いて、前記知識辞書情報の前記関連見出し語情報に対して所定の検索を行い、前記選択検索語情報に対応する前記関連見出し語情報及び当該関連見出し語情報に関連付けられた前記見出し語情報を検索結果情報として取得し、(b)前記関連見出し語情報が前記選択検索語情報として選択されたと判断すると、当該選択検索語情報を用いて、前記知識辞書情報の前記見出し語情報に対して所定の検索を行い、前記選択検索語情報に対応する前記見出し語情報及び当該見出し語情報に関連付けられた前記関連見出し語情報を検索結果情報として取得する。
検索結果情報表示手段M53は、検索結果情報を表示する。また、検索結果情報表示手段M53は、前記検索結果情報の前記見出し語情報と前記関連見出し語情報とを区別して表示する。さらに、検索結果情報表示手段M53は、前記検索語情報を用いて検索し、取得した前記検索結果情報と、前記選択検索語情報を用いて検索し、取得した前記検索結果情報と、を並べて表示する。
検索語選択手段M54は、前記検索結果情報として表示された前記見出し語情報若しくは前記関連見出し語情報を選択検索語情報として選択する。
保存情報選択手段M55は、前記検索結果情報として表示された前記見出し語情報若しくは前記関連見出し語情報を選択保存情報として選択する。
検索結果情報保存手段M56は、前記見出し語情報が前記選択保存情報として選択されたと判断すると、当該見出し語情報及び当該見出し語情報に関連付けられた前記関連見出し語情報を保存検索結果情報として記憶手段に保持し、前記関連見出し語情報が前記選択保存情報として選択されたと判断すると、当該関連見出し語情報及び当該関連見出し語情報に関連付けられた前記見出し語情報を保存検索結果情報として記憶手段に保持する。
保存検索結果情報表示手段M57は、保存した前記保存検索結果情報を、検索の履歴が分かるように表示する。
これにより、既に単語間、概念間の関係性を規定している索引情報及び目次情報を用いて知識辞書情報を生成することができる。よって、容易に一定品質の知識辞書情報を生成することができる。
これにより、検索結果として、単に見出し語を提示するだけでなく、関連見出し語をも提示することができる。よって、ユーザは、検索語に関連する関連見出し語を容易に得ることができる。
2. ハードウェア構成
検索システム1のハードウェア構成を図2を用いて説明する。検索システム1は、知識辞書情報生成装置21及び検索装置23を有している。知識辞書情報生成装置21及び検索装置23は、互いにネットワークを介してデータの送受信が可能なように接続されている。
2.1. 知識辞書情報生成装置21
知識辞書情報生成装置21のハードウェア構成を図3を用いて説明する。知識辞書情報生成装置21は、CPU211、メモリ212、ハードディスク213、および通信回路218を備えている。また、知識辞書情報生成装置21には、キーボード214、マウス215、ディスプレイ216、およびCD−ROMドライブ217が接続されている。
CPU211は、ハードディスク213に記録されているオペレーティング・システム(OS)、知識辞書情報生成プログラム等その他のアプリケーションに基づいた処理を行う。メモリ212は、CPU211に対して作業領域を提供する。ハードディスク213は、オペレーティング・システム(OS)、知識辞書情報生成プログラム等その他のアプリケーションを記録保持する。通信回路218は、ネットワークを介してデータの送受信を行う。なお、ハードディスク213に記録される知識辞書データベース(以下、知識辞書DBとする)、通信回路218を介して取得する索引入力データベース(以下、索引入力DBとする)及び目次入力データベース(以下、目次入力DBとする)については後述する。
CD−ROMドライブ217は、知識辞書情報生成プログラムが記録されているCD−ROM210から知識辞書情報生成プログラムを、また、他のCD−ROMからその他のアプリケーションのプログラムを読み取る等、CD−ROMからのデータの読み取りを行う。
キーボード214、マウス215は、外部からの命令を受け付ける。ディスプレイ216は、ユーザインターフェイス等を表示する。
2.2. 検索装置23
検索装置23のハードウェア構成を図4に基づいて説明する。検索装置23は、CPU231、メモリ232、ハードディスク233、および通信回路238を備えている。また、検索装置23には、キーボード234、マウス235、ディスプレイ236、およびCD−ROMドライブ237が接続されている。
CPU231は、ハードディスク233に記録されているオペレーティング・システム(OS)、検索プログラム等その他のアプリケーションに基づいた処理を行う。メモリ232は、CPU231に対して作業領域を提供する。ハードディスク233は、オペレーティング・システム(OS)、検索プログラム等その他のアプリケーションを記録保持する。
CD−ROMドライブ237は、検索プログラムが記録されているCD−ROM230から検索プログラムを、また、他のCD−ROMからその他のアプリケーションのプログラムを読み取る等、CD−ROMからのデータの読み取りを行う。
キーボード234、マウス235は、外部からの命令を受け付ける。ディスプレイ236は、検索結果画面やその他のユーザインターフェイス等を表示する。
3. データ
知識辞書情報生成装置21が通信回路218を介して取得する索引入力DB、目次入力DB、及びハードディスク213に記録する知識辞書DBについて説明する。
3.1. 索引入力DB
索引入力DBは、書籍の索引ページの電子データである索引ページデータに基づいて生成されるデータである。索引入力DBを説明する前に、索引ページデータについて図5A、図5Bを用いて説明する。
図5Aは、一般的な書籍の紙媒体としての索引ページを示している。索引ページには、一般的に、見出し語記述領域A501及びページ番号記述領域A503が設定されいる。索引語記述領域A501には索引の対象となる索引語が、ページ番号記述領域A503には索引語が記述されているページのページ番号が、それぞれ記述されている。この索引ページに基づく索引ページデータの一例を図5Bに示す。索引ページデータは、[索引語]列C601及び[ページ番号]列C603を有している。[索引語]列C601には、図5Aにおける索引語記述領域A601に記述されている索引語が記述される。[ページ番号]列C603には、図5Aにおけるページ番号記述領域A503に記述されているページ番号が、索引語に対応して記述される。
索引入力DBについて、図6を用いて説明する。索引入力DBは、[索引語]列C301及び[索引見出し語群]列C303を有している。[索引語]列C301には、索引ページデータの[索引語]列C601に記述されている索引語が記述される。[索引見出し語群]列C303には、索引ページデータの[ページ番号]列C603に記述されているページ番号のページを代表する見出し語が記述される。
あるページから、当該ページを代表する見出し語を抽出する方法は、別途存在する、各ページ番号と当該ページ番号のページを代表する見出し語との関係を記述したテーブル(以下、ページ−見出し語テーブルとする。)を用いればよい。つまり、索引入力DBの生成を行うコンピュータに、索引ページデータ及びページ−見出し語テーブルとを与えることによって、当該コンピュータは、索引ページデータの[ページ番号]列C603からページ番号を取得し、ページ−見出し語テーブルを用いて、当該ページに対応する見出し語を取得する。そして、取得した見出し語と索引ページデータの[索引語]列C601の索引語を索引入力DBの[索引語]列C301に、取得した見出し語を対応する索引入力DBの[索引見出し列語群]列C303に記述する。これによって、索引入力DBを取得することができる。
3.2. 目次入力DB
目次入力DBは、書籍の目次ページの電子データである目次ページデータに基づいて生成されるデータである。目次入力DBを説明する前に、目次ページデータについて図7A、図7Bを用いて説明する。
図7Aは、一般的な書籍の紙媒体としての目次ページを示している。目次ページには、一般的に、目次見出し語記述領域A701、ページ番号記述領域A703、及び著者名記述領域A705が設定されいる。目次見出し語記述領域A701には目次見出し語が、ページ番号記述領域A703には目次見出し語に関する内容が記述されている部分の最初のページのページ番号が、著者名記述領域A705には当該目次見出し語に関する内容を記述した著者名が、それぞれ記述されている。
一般的に、目次を構成する目次見出し語については階層構造を有することが多い。図7Aにおける目次見出し語においては、「情報科学」が「章」に、「情報理論」、「ニューメディア論」、及び「マルチメディア論」が「「章」 「情報科学」」に属する「項」に、「情報基礎」及び「通信理論」が「「項」 「情報理論」」に属する「節」に、「ハードウェア」及び「ソフトウェア」が「「節」 「情報基礎」」に属する「内容」に、「誤り訂正符号」及び「エントロピー」が「「節」 「通信理論」」に属する「内容」に、「マルチメディア」、「インターネット」及び「ブロードバンド」が「「項」 「ニューメディア論」」に属する「内容」に、「テレビ」、「インターネット」及び「携帯電話」が「「項」 「マルチメディア論」」に属する「内容」に、「田中△△」が「「内容」 「ハードウェア」「ソフトウェア」」を記述した「著者名」に、「佐藤□□」が「「内容」 「誤り訂正符号」「エントロピー」」を記述した「著者名」に、「山田○○」が「「内容」 「マルチメディア」「インターネット」「ブロードバンド」」を記述した「著者名」に、「山本××」が「「内容」 「テレビ」「インターネット」「携帯電話」」を記述した「著者名」に、それぞれ対応する。この階層構造を図8に示す。図8に示したように、図7Aにおける目次ページでは、目次見出し語を構成する階層構造として、「章」、「項」、「節」「内容」という四層階層を有している。
この目次ページに基づく目次ページデータの一例を図7Bに示す。目次ページデータは、[階層フラグ]列C701、[目次見出し語]列C703、[ページ番号]列C705、及び[著者名]列C707を有している。[階層フラグ]列C701には、「目次見出し語」列C703に記述された目次見出し語が属する階層が記述される。[目次見出し語]列C703には図7Aにおける目次見出し語記述領域A701に記述されている目次見出し語が記述される。[ページ番号]列C705には、図7Aにおけるページ番号記述領域A703に記述されているページ番号が、目次見出し語に対応して記述される。[著者名]列C707には、図7Aにおける著者名記述領域A705に記述されている著者名が、目次見出し語に対応して記述される。
なお、目次ページデータにおいては、ある階層に属する下位の階層に対応する目次見出し語は、当該上位の階層の目次見出し語に連続して配置される。図7Bに示すように、「節」階層の「情報基礎」に属する「内容」階層の「ハードウェア」及び「ソフトウェア」が、一群として「節」階層の「情報基礎」に連続して配置される。また、「項」階層の「情報理論」に属する「節」階層の「情報基礎」、「通信理論」が、一群として「項」階層の「情報基礎」に連続して配置される。
目次入力DBについて、図9を用いて説明する。目次入力DBは、[階層フラグ]列C401、[目次見出し語]列C403、及び[著者名]列C405を有している。[階層フラグ]列C401には、[目次見出し語]列C403に記述された目次見出し語が属する階層が記述される。[目次見出し語]列C403には、目次ページデータの[目次見出し語]列C703に記述されている目次見出し語が記述される。[著者名]列C405には、目次ページデータの[著者名]列C707に記述されている著者名が、目次見出し語に対応して記述される。
3.3. 知識辞書DB
知識辞書DBとは、ある語句と当該語句に関連する語句とを関連付けて記述したデータベースである。
知識辞書DBのデータ構造を図10に示す。知識辞書DBは、[見出し語]列C501、[見出し語ID]列C503、及び[関連見出し語群]列C505を有している。[見出し語]列C501には、索引入力DB(図6参照)の[索引語]列C301から抽出した索引語及び目次入力DB(図9参照)の[目次見出し語]列C403から抽出した目次見出し語が記述される。なお、索引語と目次見出し語で重複するものについては、どちらか一方を排除し、重複がないようにしている。[見出し語ID]列C503には、[見出し語]列C501に記述された見出し語を一意に特定するID番号が見出し語IDとして記述される。[関連見出し語群]列C505には、索引入力DBの[索引見出し列語群]列C303に記述された索引見出し語、目次入力DBの[階層フラグ]列C401と[目次見出し]列C403とに基づいて決定した目次見出し語、及び、[著者名]列C405に記述された著者名が記述される。[関連見出し語群]列C505に記述される関連見出し語については、より詳細に後述する。
4. 知識辞書情報生成装置21の動作
知識辞書情報生成装置21における動作の概略を図11に示す。以下において、知識辞書情報生成装置21は、索引入力DBとして図6に示すものを、目次入力DBとして図9に示すものを取得するとして説明する。
知識辞書情報生成装置21のCPU211は、ユーザによって知識辞書作成プログラムが起動されたと判断すると(S901)、索引入力DBを取得する(S903)。CPU211は、取得した索引入力DBを用いて、索引語知識抽出処理を実行する(S905)。CPU211は、索引語知識抽出処理によって、索引語知識抽出DB(後述)を生成する。
また、CPU211は、目次入力DBを取得する(S907)。CPU211は、取得した目次入力DBを用いて、目次見出し語知識抽出処理を実行する(S909)。CPU211は、目次見出し語知識抽出処理によって、目次見出し語知識抽出DB(後述)を生成する。
CPU211は、生成した索引語知識抽出DB及び目次見出し語知識抽出DBを用いて知識辞書DBを生成する知識辞書生成処理を実行する(S911)。
以下において、索引語知識抽出処理(S905)、目次見出し語知識抽出処理(S909)、及び知識辞書生成処理(S911)を説明する。
4.1. 索引語知識抽出処理
CPU211は索引語知識抽出処理を実行し、メモリ212に索引語知識抽出DBを生成する。索引語知識抽出DBの一例を図12に示す。索引語知識抽出DBは、[見出し語]列C1001、[見出し語ID]列C1003、及び[関連見出し語群]列C1005を有している。[見出し語]列C1001には、索引入力DBの[索引語]列C301から抽出した索引語が記述される。[見出し語ID]列C1003には、[見出し語]列C1001に記述された見出し語を一意に特定するID番号が記述される。[関連見出し語群]列C1005には、索引入力DBの[索引見出し語群]列C303に記述される索引見出し語が記述される。
CPU211が実行する索引語知識抽出処理を図13に示すフローチャートを用いて説明する。CPU211は、索引入力DBの各レコードの[索引語]列C301に記述されている索引語を抽出し、見出し語として索引語知識抽出DBの[見出し語]列C1001に記述する(S1101)。例えば、図6の索引入力DBにおいては、索引語「リード・ソロモン符号」、「リアルタイムOS」、・・・・を抽出し、見出し語として[見出し語]列C1001に記述する。
CPU211は、抽出した索引語に対応する索引語知識抽出DBの[索引見出し語群]列C303に記述されている索引見出し語を抽出し、ステップS1101で抽出した索引語に対応するように、索引語知識抽出DBの[関連見出し語群]列C1005に、関連見出し語として記述する。例えば、図6の索引入力DBにおいては、索引語「リード・ソロモン符号」に対する索引見出し語として「誤り訂正符号」、「ハミング符号」、「CIRC」、・・・・を抽出し、関連見出し語として、対応する「関連見出し語群]列C1005に記述する。
CPU211は、索引入力DBの[索引語]列C301に記述されている索引語の数だけステップS1101〜S1103までの処理を繰り返す(S1105)。
そして、CPU211は、メモリ212に記憶している索引語知識抽出DBの[見出し語]列C1001に記述されている見出し語に対して一意の見出し語IDを付与する(S1107)。また、CPU211は、索引語知識抽出DBの見出し語と見出し語IDの関係基づいて、[関連見出し語群]列C1005に記述されている関連見出し語に対して、見出し語IDを付与する(S1109)。
以上より、CPU211は、索引語知識抽出DBを生成する。
4.2. 目次見出し語知識抽出処理
CPU211は目次見出し語知識抽出処理を実行し、メモリ212に目次見出し語知識抽出DBを生成する。目次見出し語知識抽出DBの一例を図14に示す。目次見出し語知識抽出DBは、[見出し語]列C1201、[見出し語ID]列C1203、及び[関連見出し語群]列C1205を有している。[見出し語]列C1201には、目次入力DBの[目次見出し語]列C403から抽出した目次見出し語が記述される。[見出し語ID]列C1203には、[見出し語]列C1201に記述された見出し語を一意に特定するID番号が記述される。[関連見出し語群]列C1205には、目次入力DBの[階層フラグ]列C401及び[目次見出し]列C403に基づいて決定した目次見出し語が記述される。詳細については後述する。
CPU211が実行する目次見出し語知識抽出処理を図15に示すフローチャートを用いて説明する。CPU211は、目次入力DBの各レコードの[目次見出し語]列C401に記述されている目次見出し語を抽出し、目次見出し語知識抽出DBの[見出し語]列C1201に見出し語として記述する(S1301)。例えば、図9の目次入力DBから目次見出し語「情報科学」、「情報理論」、「情報基礎」、・・・・を抽出し、図14の目次見出し語知識抽出DBの[見出し語]列C1201に見出し語として記述する。
CPU211は、抽出した目次見出し語に対応する[著者名]列C407に記述されている著者名を抽出し、目次見出し語知識抽出DBの[関連見出し語群]列C1205に関連見出し語として記述する(S1303)。例えば、図9の目次入力DBの目次見出し語「誤り訂正符号」に対しては、著者名「佐藤□□」を抽出し、図14の目次見出し語知識抽出DBの見出し語「誤り訂正符号」に対応する[関連見出し語群]列C1205に関連見出し語として記述する。
CPU211は、抽出した目次見出し語に対応する[階層フラグ]列C401に記述されている階層フラグを抽出する(S1305)。CPU211は、抽出した階層フラグが「章」に関するものであるか否かを判断する(S1307)。CPU211は、抽出した階層フラグが「章」に関するものであると判断すると、ステップS1301で抽出した目次見出し語を「章見出し」として、メモリ212へ一時記憶する(S1309)。
CPU211は、ステップS1307において抽出した階層フラグが「章」に関するものでないと判断すると、抽出した階層フラグが「項」に関するものであるか否かを判断する(S1311)。CPU211は、抽出したテーマフラグが「項」に関するものであると判断すると、ステップS1301で抽出した目次見出し語を「項見出し」として、メモリ212へ一時記憶する(S1313)。そして、CPU211は、この段階でメモリ212へ「章見出し」として記憶している目次見出し語を取得する(S1315)。CPU211は、ステップS1301で取得した目次見出しを「章見出し」に対応する関連見出し語として、目次見出し語知識抽出DBの[関連見出し語群]列C1205に記述する(S1317)。例えば、図9において、階層フラグ「項」の目次見出し語「情報理論」については、この段階でメモリ121に「章見出し」と記憶されている「情報科学」の関連見出し語して、目次見出し語知識抽出DBの[関連見出し語群]列C1205に記述される。
CPU211は、ステップS1311において抽出した階層フラグが「項」に関するものでないと判断すると、抽出した階層フラグが「節」に関するものであるか否かを判断する(S1321)。CPU211は、抽出したテーマフラグが「節」に関するものであると判断すると、ステップS1301で抽出した目次見出し語を「節見出し」として、メモリ212へ一時記憶する(S1323)。そして、CPU211は、この段階でメモリ212へ「項見出し」として記憶している目次見出し語を取得する(S1325)。CPU211は、ステップS1301で取得した目次見出しを「項見出し」に対応する関連見出し語として、目次見出し語知識抽出DBの[関連見出し語群]列C1205に記述する(S1327)。例えば、図9において、階層フラグ「節」の目次見出し語「通信理論」については、この段階でメモリ121に「項見出し」と記憶されている「情報理論」の関連見出し語して、目次見出し語知識抽出DBの[関連見出し語群]列C1205に記述される。
CPU211は、ステップS1311において抽出したテーマフラグが「節」に関するものでない(つまり、階層フラグが設定されていない)と判断すると、この段階でメモリ212に「項見出し」若しくは「節見出し」として記憶している目次見出しを取得する(S1335)。CPU211は、ステップS1301で取得した目次見出しを「項見出し」若しくは「節見出し」に対応する関連見出し語として、目次見出し語知識抽出DBの[関連見出し語群]列C1205に記述する(1337)。例えば、図9において、階層フラグが設定されていない目次見出し語「マルチメディア」については、この段階でメモリ121には「節見出し」が記憶されていないので、「項見出し」と記憶されている「ニューメディア論」の関連見出し語として、目次見出し語知識抽出DBの[関連見出し語群]列C1205に記述される。
CPU211は、目次入力DBの[目次見出し語]列C401に記述されている目次見出し語の数だけステップS1301〜S1321までの処理を繰り返す(S1341)。
CPU211は、全ての目次見出し語についてステップS1301〜S1321までの処理を繰り返すと、目次見出し語知識抽出DBの[見出し語]列C1201に記述されている見出し語に対して一意の見出し語IDを付与する(S1343)。なお、ここで付与する見出し語IDは、ステップS1107で付与する見出し語IDとは異なるものであり、重複しない。続いて、CPU211は、目次見出し語知識抽出DBの見出し語と見出し語IDの関係基づいて、[関連見出し語群]列C1305に記述されている関連見出し語に対して、見出し語IDを付与する(S1345)。
4.3. 知識辞書生成処理
CPU211は知識辞書生成処理を実行し、図10に示す知識辞書DBを生成する。
CPU211が実行する知識辞書生成処理を図16に示すフローチャートを用いて説明する。CPU211は、メモリ212に記憶している索引語知識抽出DBの[見出し語]列C1001及び同様に記憶している目次見出し語知識抽出DBの[見出し語]列C1201について、論理OR演算で合成し、知識辞書DBの[見出し語]列C501に記述する(S1401)。したがって、知識辞書DBの[見出し語]列C501に記述されている見出し語には、重複するものは存在しない。
また、CPU211は、知識辞書DBの[見出し語]列C501に記述した見出し語のそれぞれに対応する索引語知識抽出DBの[関連見出し語群]列C1005及び/若しくは目次見出し語知識抽出DBの[関連見出し語群]列C1205についても合成し、対応する知識辞書DBの[関連見出し語群]列C505に記述する(S1403)。なお、索引語知識抽出DBの[見出し語]列C1001と目次見出し語知識抽出DBの[見出し語]列C1201とを合成する際の論理OR演算により、重複すると判断された見出し語については、それぞれに対応する[関連見出し語群]列C1005、C1205に記述されている関連見出し語を合成して、知識辞書DBの[関連見出し語群]列C505に記述する。
さらに、CPU211は、合成した[見出し語]列C501に記述されている見出し語に対して、それぞれを一意に特定する見出し語IDを新たに付与する(S1405)。
CPU211は、知識辞書DBの見出し語に対して付与した見出し語IDに基づいて、「関連見出し語群」列C505に記述された関連見出し語に対して、見出し語IDを付与する(S1407)。
5. 検索装置23の動作
検索装置23における動作の概略を図17に示す。検索装置23のCPU231は、検索プログラムの起動命令があったと判断すると(S1701)、検索プログラムを起動し、図18に示す検索画面をディスプレイ236に表示する(S1703)。検索画面には、検索語記述領域A601、検索条件選択領域A603、及び検索結果表示領域A605が設けられている。検索語記述領域A601は、テキストボックスにより構成されている。検索条件選択領域A603には、「前方一致」、「後方一致」、「部分一致」及び「完全一致」の各検索条件を選択することができるラジオボタンが表示されている。検索結果表示領域A605は、主検索処理(後述)の検索結果を表示する第1の検索結果表示領域A615、及び、見出し語検索処理(後述)若しくは関連見出し語検索処理(後述)の検索結果を表示する第2の検索結果表示領域A625を有している
検索装置23を使用するユーザは、検索しようとする語句を検索語として検索語記述領域A601にキーボード234(図4参照)等の入力手段を用いて記述する。さらに、ユーザは、検索条件選択領域A603に表示されているラジオボタンを用いて、所望の検索条件を選択する。そして、ユーザは、検索を開始するための検索ボタンB601を選択する。
CPU231は、検索ボタンB601が選択された判断すると(S1705)、主検索処理を実行する(S1707)。CPU231が、主検索処理の結果をディスプレイ236に表示した検索結果画面を図19に示す。
図19に示す検索結果画面においては、第1の検索結果表示領域A615に検索結果が表示されている。第1の検索結果表示領域A615には、主検索処理によって検索された、知識抽出DBの[見出し語]列C501に記述されている見出し語、及び、当該見出し語に対応する[関連見出し語群]列C505に記述された関連見出し語が表示される。なお、第1の検索結果表示領域A615に表示される見出し語の先頭部分には見出し語マークMRK1が、また、関連見出し語の先頭部分には関連見出し語マークMRK3が表示される。さらに、主検索処理の結果として検索された見出し語及び関連見出し語は、互いに関連するものであるとが明確となるように表示される。図19においては、関連見出し語が、見出し語の下位に属するような階層構造形式で表示されている。
このように、主検索処理の検索結果として見出し語だけを表示するのではなく、当該見出し語に関連する関連見出し語をも、当該見出し語との関連を明示しながら表示することによって、ユーザは自らが入力した検索語に対する複数の情報を得ることができるので、所望の検索結果を簡単かつ素早く得ることができるようになる。
図17に戻って、CPU231は、図19の検索結果画面に表示された見出し語マークMRK1が選択されたと判断すると(S1711)、見出し語検索処理を実行する(S1713)。また、CPU231は、図19の検索結果画面に表示された関連見出し語マークMRK3が選択されたと判断すると(S1721)、関連見出し語検索処理を実行する(S1723)。
以下において、主検索処理(S1707)、追加検索処理(S1713)、及び関連見出し語検索処理(S1723)について説明する。
5.1. 主検索処理
検索装置23のCPU231が、検索ボタンB601が選択された判断した場合に行う主検索処理を図20に示すフローチャートを用いて説明する。
CPU231は、検索ボタンB601が選択された判断すると、検索語記述領域A601に記述されている検索情報及び検索条件選択領域A603で選択された検索条件情報を取得し(S2001)、メモリ232に一時記憶する(S2003)。
CPU231は、取得した検索語情報及び検索条件情報に基づいて、知識辞書DB(図10参照)の[見出し語]列C501に対する検索処理を実行する(S2005)。CPU231は、検索された[見出し語]列C501の見出し語、及び、当該見出し語に対応する[見出し語ID]列C503及び[関連見出し語群]列C505の値を取得する(S2007)。
CPU231は、取得した見出し語の先頭部分に見出し語マークMRK1を、また、関連見出し語の先頭部分に関連見出し語マークMRK3を表示し、第1の検索結果表示領域A615に表示する。また、CPU231は、見出し語及び関連見出し語を、互いに関連するものであるとが明確となるように、関連見出し語が見出し語の下位に属するような階層構造形式として表示する。
例えば、ユーザが検索語「情報理論」を検索語記述領域A601に記述し、検索条件として「部分一致」を選択した場合を考える。
CPU231は、検索ボタンB601が選択された判断すると、検索語記述領域A601に記述されている検索情報「情報理論」及び検索条件選択領域A603で選択された検索条件情報「部分一致」を取得し(S2001)、メモリ232に一時記憶する(S2003)。
CPU231は、取得した検索語情報「情報理論」及び検索条件情報「部分一致」に基づいて、知識辞書DB(図10参照)の[見出し語]列C501に対する検索処理を実行する(S2005)。CPU231は、検索の結果、[見出し語]列C501の見出し語「情報理論」、及び、当該見出し語「情報理論」に対応する[見出し語ID]列C503の見出し語ID「K001」及び[関連見出し語群]列C505の関連見出し語「情報基礎(K002)、通信の理論(K004)」を取得する(S2007)。
CPU231は、図19に示すように、取得した見出し語「情報理論」の先頭部分に見出し語マークMRK1を、また、関連見出し語「情報基礎(K002)」及び「通信の理論(K004)」の先頭部分に関連見出し語マークMRK3を表示し、第1の検索結果表示領域A615に表示する。また、CPU231は、見出し語及び関連見出し語を、互いに関連するものであるとが明確となるように、関連見出し語「情報基礎(K002)」及び「通信の理論(K004)」が見出し語「情報理論」の下位に属するような階層構造形式として表示する。
5.2. 見出し語検索処理
検索装置23のCPU231が、見出し語マークMRK1が選択された判断した場合に行う見出し語検索処理を図21に示すフローチャートを用いて説明する。
CPU231は、主検索結果情報表示領域A615に表示されている見出し語マークMRK1(図19参照)が選択されたと判断すると、当該見出し語マークMRK1に対応する見出し語の値を選択語情報として取得し(S2101)、メモリ232に一時記憶する(S2103)。
CPU231は、取得した選択語情報を検索キーとして知識辞書DBの[見出し語]列C501を検索する(S2105)。CPU231は、取得した選択語情報に対応する見出し語IDを[見出し語ID]列C503から取得する(S2107)。そして、CPU231は、取得した見出し語ID若しくは見出し語を[関連見出し語群]列C505に有する[見出し語]列C501の値を取得する(S2109)。さらに、CPU231は、ステップS2109で取得した見出し語に対応する[関連見出し語群]列C505の値を取得する(S2111)。
例えば、図19に示すような検索結果が得られた場合を考える。ここで、ユーザが第1の検索結果表示領域A615に表示されている見出し語「情報理論」について、関連する見出し語を知りたいと思った場合、ユーザは、マウス235等で見出し語マークMRK1を選択する。
CPU231は、見出し語マークMRK1が選択されたと判断すると、当該見出し語マークMRK1に対応する見出し語「情報理論」を選択語情報として取得し(S2101)、メモリ232に一時記憶する(S2103)。
CPU231は、取得した選択語情報「情報理論」を検索キーとして知識辞書DBの[見出し語]列C501を検索する(S2105)。CPU231は、取得した選択語情報に対応する見出し語ID「K001」を[見出し語ID]列C503から取得する(S2107)。そして、CPU231は、取得した見出し語ID「K001」若しくは見出し語「情報理論」を[関連見出し語群]列C505に有する[見出し語]列C501の見出し語「情報科学」を取得する(S2109)。さらに、CPU231は、ステップS2109で取得した見出し語「情報科学」に対応する[関連見出し語群]列C505の関連見出し語「情報理論(K001)、ニューメディア論(K003)、マルチメディア論(K011)」を取得する(S2111)。
CPU231は、見出し語「情報科学」及び取得した関連見出し語「情報理論(K001)、ニューメディア論(K003)、マルチメディア論(K011)」を、第2の検索結果表示領域A625に表示する。このように、ユーザが入力した検索語を用いて検索した結果である検索結果情報を第1の検索結果表示領域A623に表示し、選択語情報を用いて検索した結果である検索結果情報とを第2の検索結果表示領域A625に表示に表示し、両者を並べて表示することによって、ユーザは、過去の検索履歴を参考に今後の検索を行うことができるようになる。
CPU231が、見出し語検索処理の結果をディスプレイ236に表示した検索結果画面を図22に示す。図22に示すように、CPU231は、見出し語及び関連見出し語を、互いに関連するものであるとが明確となるように、関連見出し語「情報理論(K001)」、「ニューメディア論(K003)」、及び「マルチメディア論(K011)」が見出し語「情報科学」の下位に属するような階層構造形式として表示する。
このように、検索装置23を用いることによって、検索語「情報理論」からは検索することが難しい語句、つまり概念が異なる語句「ニューメディア論」や「マルチメディア論」を容易に得ることができる。本実施例における検索装置23では、一般的な検索では取得することが難しい検索語に関連する語句を容易に取得することができる。
なお、ユーザは、図22に示すような検索結果画面の第2の検索結果表示領域A625に表示された関連見出し語「情報理論(K001)」、「ニューメディア論(K003)」、及び「マルチメディア論(K011)」について、さらに検索することが可能である。この場合、CPU231が行う検索は、選択された関連見出し語に対する主検索処理である。
例えば、関連見出し語「ニューメディア論」が選択された場合、「ニューメディア論」を検索語として、ステップS2001〜S2007までの主検索処理が実行される(図20参照)。このようにして検索語「ニューメディア論」に対する主検索処理の検索結果を表示した検索結果画面を図23に示す。
5.3. 関連見出し語検索処理
検索装置23のCPU231が、見出し語マークMRK3が選択された判断した場合に行う関連見出し語検索処理を図24に示すフローチャートを用いて説明する。
CPU231は、主検索結果情報表示領域A615に表示されている関連見出し語マークMRK3が選択されたと判断すると、当該見出し語マークMRK3に対応する見出し語の値を選択語情報として取得し(S2401)、メモリ232に一時記憶する(S2403)。
CPU231は、取得した選択語情報を検索キーとして知識辞書DBの[見出し語]列C501を検索する(S2405)。そして、CPU231は、検索された[見出し語]列C501の見出し語、及び、当該見出し語に対応する[関連見出し語群]列C505の値を取得する(S2407)。
例えば、図19に示すような検索結果が得られた場合を考える。ここで、ユーザが第1の検索結果表示領域A615に表示されている関連見出し語「通信理論」について、関連する見出し語を知りたいと思った場合、ユーザは、マウス235等で関連見出し語マークMRK3を選択する。
CPU231は、主検索結果情報表示領域A615に表示されている関連見出し語マークMRK3が選択されたと判断すると、当該見出し語マークMRK3に対応する見出し語「通信理論」を選択語情報として取得し(S2401)、メモリ232に一時記憶する(S2403)。
CPU231は、取得した選択語情報「通信理論」を検索キーとして知識辞書DBの[見出し語]列C501を検索する(S2405)。そして、CPU231は、検索された見出し語「通信理論」に対応する[関連見出し語群]列C505の関連見出し語「誤り訂正符号(K006)、エントロピー(K007)」を取得する(S2407)。
CPU231は、見出し語「通信理論」及び取得した関連見出し語「誤り訂正符号(K006)、エントロピー(K007)」を、第2の検索結果表示領域A625に表示する。このように、ユーザが入力した検索語を用いて検索した結果である検索結果情報を第1の検索結果表示領域A623に表示し、選択語情報を用いて検索した結果である検索結果情報とを第2の検索結果表示領域A625に表示に表示し、両者を並べて表示することによって、ユーザは、過去の検索履歴を参考に今後の検索を行うことができるようになる。
CPU231が、見出し語検索処理の結果をディスプレイ236に表示した検索結果画面を図25に示す。図25に示すように、CPU231は、見出し語及び関連見出し語を、互いに関連するものであるとが明確となるように、関連見出し語「誤り訂正符号(K006)」及び「エントロピー(K007)」が見出し語「通信理論」の下位に属するような階層構造形式として表示する。
このように、検索装置23を用いることによって、検索語「情報理論」の下位概念に属する語句「誤り訂正符号」や「エントロピー」を容易に得ることができる。つまり、本実施例における検索装置23では、一般的な検索で取得することができる関連語も容易に取得することができる。
なお、ユーザは、見出し語検索処理の場合と同様に、第2の検索結果表示領域A625に表示された関連見出し語について、さらに主検索処理を行うことが可能である。
5.4. 検索結果保存処理
検索装置23では、検索した結果の一部若しくは全部を検索結果保存情報として保存することができる。ユーザは、検索結果保存情報を利用することによって、過去に行った検索の履歴を知ることができるので、今後の検索に対する指針を得ることができる。
以下においては、検索語として「情報」が検索語記述領域A601に記述され、検索条件として「部分一致」が選択されて検索が行われた結果を示す検索結果画面である図26を参照しながら、検索結果保存処理を図27に示すフローチャートを用いて説明する。
検索装置23のCPU231が、図26に示される保存ボタンB603が選択された判断すると(S2601)、既に検索結果保存情報をハードディスク233に存在するか否かを判断する(S2603)。CPU231は、検索結果保存情報がハードディスク233に存在すると判断すると、当該検索結果保存情報をメモリ232に取得する(S2605)。CPU231は、図28に示すような検索結果保存画面A1301を表示する(S2607)。検索結果保存画面は、現在の検索結果を表示する検索結果表示領域A1303及び検索結果保存情報を表示する検索結果保存情報表示領域A1305を有している。
CPU231は、検索結果保存画面上の追加ボタンB1301が選択されたと判断すると(S2609)、検索結果表示領域A1303において選択されている見出し語若しくは関連見出し語を、検索結果保存情報表示領域A1305に表示し、検索結果保存情報として保存する(S2610)。この際、CPU231は、関連見出し語が選択されている場合には、当該関連見出し語の上位に位置する見出し語及び当該見出し語に属する全ての関連見出し語を一群として、検索結果保存情報として保存する。例えば、図28において、検索結果表示領域A1303に表示されている関連見出し語「通信理論」が選択され、追加ボタンB1301が選択された場合、関連見出し語「通信理論」の上位に位置する見出し語「情報理論」及び当該見出し語「情報理論」に属する全ての関連見出し語「情報基礎」、「通信理論」を一群として、検索結果保存情報表示領域A1305に表示し、検索結果保存情報として保存する。この場合の検索結果保存画面A1301を図29に示す。
なお、見出し語及び関連見出し語を一群として検索結果保存情報表示領域A1305に表示表示する際に、ユーザが選択した見出し語若しくは関連見出し語をハイライト表示するようにしてもよい。
さらに、CPU231は、検索結果表示領域A1303において選択されている見出し語若しくは関連見出し語を検索結果保存情報として保存する際に、以前に保存した検索結果保存情報が存在し、検索結果保存情報表示領域A1305に表示されている場合には、既に表示されている検索結果保存情報に追加するように、新たに追加保存する一群の見出し語及び関連見出し語を表示する。これにより、ユーザは、検索の履歴を容易に把握することができる。このように、一群の見出し語及び関連見出し語が既存の検索結果保存情報に追加的に表示された検索結果保存画面の一例を図30に示す。図30においては、今回保存した見出し語「ニューメディア論」、関連見出し語「マルチメディア」、「インターネット」、「ブロードバンド」が、以前に検索結果保存情報として保存していた見出し語「情報理論」、関連見出し語「情報基礎」、「通信理論」に追加的に表示されている。
図27に戻って、CPU231は、検索結果保存画面上の削除ボタンB1301が選択されたと判断すると(S2621)、検索結果保存情報表示領域A1305において選択されている見出し語若しくは関連見出し語を、検索結果保存情報表示領域A1305から削除し、また、検索結果保存情報からも削除する(S2623)。この際、CPU231は、検索結果を保存する場合と同様に、選択された見出し語・関連見出し語を一群として削除する。例えば、図29において、検索結果保存情報表示領域A1305に表示されている関連見出し語「通信理論」が選択され、削除ボタンB1303が選択された場合、関連見出し語「通信理論」の上位に位置する見出し語「情報理論」及び当該見出し語「情報理論」に属する全ての関連見出し語「情報基礎」、「通信理論」を一群として、検索結果保存情報表示領域A1305から削除し、また、検索結果保存情報からも削除する。
図27に戻って、CPU231は、検索結果保存画面上の検索ボタンB1305が選択されたと判断すると(S2631)、検索結果表示領域A1303において選択されている見出し語若しくは関連見出し語に関する検索処理を実行する。この場合、見出し語が選択されていれば見出し語検索処理を、関連見出し語が選択されていれば関連見出し語検索処理を実行する(S2633)。
CPU231は、検索結果保存処理が終了したと判断すると、現在の検索結果保存処理を終了し(S2641)、検査結果表示画面に戻る。
[その他の実施形態]
(1)目次ページデータの階層構造
前述の実施例1においては、目次ページデータの階層構造として、「章」、「項」、「節」、「内容」の四層階層を例示したが、例示のものに限定されない。例えば、「章」及び「内容」の二層階層、「章」、「項」、「内容」の三層階層等にしてもよい。
(2)索引ページにおけるページ番号から当該ページを代表する索引見出し語の取得方法
前述の実施例1においては、索引ページにおけるページ番号から当該ページを代表する索引見出し語を取得する際には、ページ−見出し語テーブルを利用するものとしたが、代表する索引見出し語を取得できるのであれば例示のものに限定されない。例えば、書籍の内容を示す内容データから、ページ番号に対応するページの内容を取得し、内容を解析して当該内容を代表する単語を決定し、決定した単語が目次見出し語に存在するものについて当該ページを代表する目次見出し語とするようにしてもよい。
また、書籍の内容を示す内容データからページ番号に対応するページの内容を取得し、当該ページから対応する索引語を検索し、検索した索引語を含む行から1行ずつ遡るように順に抽出し、抽出した行が本文行であるか見出し行であるか判断し、見出し行であれば、当該見出し語をページを代表する索引見出し語とするようにしてもよい。
(3)目次見出し語知識抽出DBにおける見出し語IDの付与方法
前述の実施例1においては、目次見出しが重複するか否かを判断して、見出し語IDを付与することとした。しかし、階層フラグの値と目次見出し語の値とを組み合わせることによって、目次見出し語の重複を判断し、見出し語IDを付与するようにしてもよい。これにより、目次見出し語として異なる階層に同じ名前の目次見出し語が存在する場合であっても、適切に見出し語IDを付与することができる。
(4)各データベースのデータ構造
前述の実施例1においては、索引入力DBは階層構造を有していないものとした。しかし、索引入力DBについても、索引語間に階層構造を有するようにしてもよい。この場合、実施例1における目次入力DBと同様に処理すればよい。
また、前述の実施例1においては、目次ページにおいて、著者名記述領域A705が存在する場合を例示したが、著者名記述領域A705が必ずしも存在しなくともよい。この場合、目次ページデータは[著者名]列C707を、目次入力DBは[著者名]列C405を、それぞれ有さないこととなる。また、知識辞書DBの[関連見出し語群]列C505には、著者名に関するデータが存在しないこととなる。
(5)階層構造
前述の実施例1では、階層構造として目次における「章」、「項」、「節」、「内容」を例示したが、階層構造を示すものであれば例示のものに限定されない。例えば、「レベル1」、「レベル2」、・・・等であってもよい。
(6)知識辞書DBにおける関連見出し語
前述の実施例1においては、知識辞書DBでは、階層フラグが「項」の見出し語については階層フラグが「章」の見出し語の関連見出し語として、階層フラグが「節」の見出し語については階層フラグが「項」の見出し語の関連見出し語として等、下位の階層に属する見出し語が、上位の階層に属する見出し語の関連語とされていた。しかし、上位の階層に属する見出し語が、下位の階層に属する見出し語の関連語とするようにしてもよい。
また、見出し語に対する関連見出し語は、1階層下位の階層に属する見出し語としたが、これに限定されない。例えば、2階層下位の階層に属する見出し語を当該見出し語の関連見出し語とするようにしてもよい。この場合、各関連見出し語と関連見出し語が属する階層を明らかにするフラグとを関連付ける必要がある。
さらに、各見出し語において、所定の上位の階層に属する見出し語と所定の下位の階層に属する見出し語とを当該見出し語の関連見出し語とするようにしてもよい。この場合も、各関連見出し語と当該関連見出し語が属する階層を明らかにするフラグとを関連付ける必要がある。
(7)検索結果表示画面における見出し語と関連見出し語の区別
前述の実施例1においては、検索結果として表示する見出し語及び関連見出し語について、階層的に表示すること、及び、見出し語マークMRK1、関連見出し語マークMRK3によって、両者を区別することとした。しかし、検索結果として表示する見出し語及び関連見出し語を区別して表示できるものであれば、これに限定されない。例えば、見出し語をボールド等による強調表示とし、関連見出し語を強調表示しないようにするようにしてもよい。
(8)検索結果の提供
前述の実施例1においては、検索装置23において、検索語に対する関連見出し語を得られることとしたが、さらに、検索結果として得られた見出し語・関連見出し語に関する情報源(例えば、ウェブページ)をユーザに提示するようにしてもよい。この場合、知識辞書DBに登録されている見出し語にウェブページのURL等のアクセス情報を関連付けて、当該知識辞書DBに登録するようにすればよい。検索結果画面にて表示した見出し語・関連見出し語を所定の方法で選択すると、情報源を表示するようにすればい。さらに、情報源に対してネットワークを介してアクセスできるようにしてもよい。
(9)検索システム1の構成
前述の実施例1においては、検索システム1を知識辞書情報生成装置21及び検索装置23によって構成したが、両者の機能を一体とした検索装置としてもよい。
また、前述の実施例1においては、検索装置23は、ネットワークを介して知識辞書DBにアクセスすることとしたが、CD等の記録媒体によって知識辞書DBの提供を受けるようにしてもよい。
(10)検索装置23における機能の選択
前述の実施例1においては、検索装置23は、関連語を検索するための主検索処理、見出し語検索処理、関連見出し語検索処理、及び検索結果保存処理を行うこととした。しかし、主検索処理をベースとして、他の処理を選択的に組み合わせるようにしてもよい。例えば、検索装置23は、主検索処理、見出し語検索処理、及び関連見出し語検索処理のみを有するようにしてもよい。
(11)検索結果の保存
前述の実施例1においては、検索結果を保存する際に、ユーザが選択した見出し語若しくは関連見出し語に関連する見出し語及び関連見出し語を一群として保存し、検索結果保存情報表示領域A1305に表示することとしたが、保存する情報としてはこれに限定されない。例えば、ユーザが選択した見出し語若しくは関連見出し語のみを保存し、表示するようにしてもよい。また、ユーザが関連見出し語を選択した場合には、当該関連見出し語と上位の見出し語のみを保存し、表示するようにしてもよい。
(12)フローチャートにおける処理の順番
前述の実施例1においては、図に示した各フローチャートに基づいて、各処理を実現するようにした。しかし、各処理を実現できるものであれば、各フローチャート内における処理の順番は例示のものに限定されない。
本発明における検索システムの実施例1における機能ブロック図を示した図である。 検索システム1のハードウェア構成を示した図である。 知識辞書情報生成装置21のハードウェア構成を示した図である。 検索装置21のハードウェア構成を示した図である。 索引ページデータを説明するための図であり、Aは紙媒体の索引ページを、Bは索引ページデータ(電子データ)のデータ構造を示した図である。 索引入力DBのデータ構造を示した図である。 目次ページデータを説明するための図であり、Aは紙媒体の目次ページを、Bは目次ページデータ(電子データ)のデータ構造を示した図である。 目次の階層構造を示した図である。 目次入力DBのデータ構造を示した図である。 知識辞書DBのデータ構造を示した図である。 知識辞書情報生成装置21の動作の概要を示したフローチャートである。 索引語知識抽出DBのデータ構造を示した図である。 索引語知識抽出処理を示したフローチャートである。 目次見出し語知識抽出DBのデータ構造を示した図である。 目次見出し語知識抽出処理を示したフローチャートである。 知識辞書生成処理を示したフローチャートである。 検索装置23の動作の概要を示したフローチャートである。 検索画面を示した図である。 検索結果画面を示した図である。 主検索処理を示したフローチャートである。 見出し語検索処理を示したフローチャートである。 検索結果画面を示した図である。 検索結果画面を示した図である。 関連見出し語検索処理を示したフローチャートである。 検索結果画面を示した図である。 検索結果画面を示した図である。 検索結果保存処理を示したフローチャートである。 検索結果保存画面の一例を示した図である。 検索結果保存画面の一例を示した図である。 検索結果保存画面の一例を示した図である。 従来の検索装置を説明するための図である。 従来の検索装置を説明するための図である。
符号の説明
M1・・・・・検索システム
M3・・・・・知識辞書情報生成装置
M5・・・・・検索装置
M31・・・・・目次情報取得手段
M33・・・・・索引情報取得手段
M35・・・・・知識辞書生成手段
M51・・・・・検索語取得手段
M52・・・・・検索結果情報取得手段
M53・・・・・検索結果情報表示手段
M54・・・・・検索語選択手段
M55・・・・・保存情報選択手段
M56・・・・・検索結果情報保存手段
M57・・・・・保存検索結果情報表示手段
1・・・・・検索システム
21・・・・・知識辞書情報生成装置
23・・・・・検索装置

Claims (5)

  1. 見出し語情報と、当該見出し語情報と関連する事項である関連見出し語情報とが関連付けられた知識辞書情報を用いて検索を行う検索装置であって、
    検索に用いる語句である検索語情報を取得する検索語取得手段、
    取得した前記検索語情報を用いて、前記知識辞書情報の前記見出し語情報に対して所定の検索を行い、前記検索語情報に対応する前記見出し語情報及び当該見出し語情報に関連付けられた前記関連見出し語情報を検索結果情報として取得する検索結果情報取得手段、
    前記検索結果情報を表示する検索結果情報表示手段、
    を有する検索装置において、
    前記知識辞書情報は、さらに、
    書籍の目次に含まれる見出しを表す目次見出し情報を複数有する目次情報であって、当該目次情報に属する前記目次見出し情報と少なくとも他の一の前記目次見出し情報とが階層構造により関連付けられていた目次情報と、書籍の索引に含まれる見出しを表す索引見出し情報を有する索引情報であって、当該索引見出し情報と少なくとも他の一の前記索引見出し情報とが関連付けられていた索引情報と、が統合された知識辞書情報であって、
    前記目次見出し情報及び前記索引見出し情報により前記見出し語情報が構成され、
    当該目次見出し情報に関連付けられた他の目次見出し情報及び当該索引見出し情報に関連付けられた他の索引見出し情報により前記関連見出し語が構成され、
    前記知識辞書情報のデータ構造は、前記関連見出し語情報において、前記目次見出し情報と他の前記目次見出し情報との間には階層構造が存在せず、さらに、前記見出し語情報の前記目次見出し情報と、当該目次見出し情報が属していた前記階層構造の階層と関連する階層に属する他の前記目次見出し情報が前記関連見出し語情報として関連付けられていること、
    を特徴とする検索装置。
  2. 請求項1に係る検索装置において、
    前記検索語取得手段は、ネットワークを介して前記検索結果情報取得手段と接続されていること、
    を特徴とする検索装置。
  3. 見出し語情報と、当該見出し語情報と関連する事項である関連見出し語情報とが関連付けられた知識辞書情報対して検索を行う検索プログラムであって、
    前記検索プログラムは、コンピュータを、
    検索に用いる語句である検索語を取得する検索語取得手段、
    取得した前記検索語情報を用いて、前記知識辞書情報の前記見出し語情報に対して所定の検索を行い、前記検索語情報に対応する前記見出し語情報及び当該見出し語情報に関連付けられた前記関連見出し語情報を検索結果情報として取得する検索結果情報取得手段、
    前記検索結果情報を表示する検索結果情報表示手段、として機能させる検索プログラムにおいて、
    前記知識辞書情報は、さらに、
    書籍の目次に含まれる見出しを表す目次見出し情報を複数有する目次情報であって、当該目次情報に属する前記目次見出し情報と少なくとも他の一の前記目次見出し情報とが階層構造により関連付けられていた目次情報と、書籍の索引に含まれる見出しを表す索引見出し情報を有する索引情報であって、当該索引見出し情報と少なくとも他の一の前記索引見出し情報とが関連付けられていた索引情報と、が統合された知識辞書情報であって、
    前記目次見出し情報及び前記索引見出し情報により前記見出し語情報が構成され、
    当該目次見出し情報に関連付けられた他の目次見出し情報及び当該索引見出し情報に関連付けられた他の索引見出し情報により前記関連見出し語が構成され、
    前記知識辞書情報のデータ構造は、
    前記関連見出し語情報において、前記目次見出し情報と他の前記目次見出し情報との間には階層構造が存在せず、さらに、前記見出し語情報の前記目次見出し情報と、当該目次見出し情報が属していた前記階層構造の階層と関連する階層に属する他の前記目次見出し情報が前記関連見出し語情報として関連付けられていること、
    を特徴とする検索プログラム。
  4. 請求項3に係る検索プログラムにおいて、
    前記検索語取得手段は、ネットワークを介して前記検索結果情報取得手段と接続されていること、
    を特徴とする検索プログラム。
  5. コンピュータを用いて、見出し語情報と、当該見出し語情報と関連する事項である関連見出し語情報とが関連付けられた知識辞書情報に対して検索を行う検索方法において、
    前記コンピュータが、検索に用いる語句である検索語を取得し、
    前記コンピュータが、取得した前記検索語情報を用いて、前記知識辞書情報の前記見出し語情報に対して所定の検索を行い、前記検索語情報に対応する前記見出し語情報及び当該見出し語情報に関連付けられた前記関連見出し語情報を検索結果情報として取得し、
    前記コンピュータが、前記検索結果情報を表示する検索方法において、
    前記知識辞書情報は、さらに、
    書籍の目次に含まれる見出しを表す目次見出し情報を複数有する目次情報であって、当該目次情報に属する前記目次見出し情報と少なくとも他の一の前記目次見出し情報とが階層構造により関連付けられていた目次情報と、書籍の索引に含まれる見出しを表す索引見出し情報を有する索引情報であって、当該索引見出し情報と少なくとも他の一の前記索引見出し情報とが関連付けられていた索引情報と、が統合された知識辞書情報であって、
    前記目次見出し情報及び前記索引見出し情報により前記見出し語情報が構成され、
    当該目次見出し情報に関連付けられた他の目次見出し情報及び当該索引見出し情報に関連付けられた他の索引見出し情報により前記関連見出し語が構成され、
    前記知識辞書情報のデータ構造は、前記関連見出し語情報において、前記目次見出し情報と他の前記目次見出し情報との間には階層構造が存在せず、さらに、前記見出し語情報の前記目次見出し情報と、当該目次見出し情報が属していた前記階層構造の階層と関連する階層に属する他の前記目次見出し情報が前記関連見出し語情報として関連付けられていること、
    を特徴とする検索方法。
JP2006177041A 2006-06-27 2006-06-27 検索装置 Expired - Fee Related JP4803805B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006177041A JP4803805B2 (ja) 2006-06-27 2006-06-27 検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006177041A JP4803805B2 (ja) 2006-06-27 2006-06-27 検索装置

Publications (2)

Publication Number Publication Date
JP2008009543A JP2008009543A (ja) 2008-01-17
JP4803805B2 true JP4803805B2 (ja) 2011-10-26

Family

ID=39067732

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006177041A Expired - Fee Related JP4803805B2 (ja) 2006-06-27 2006-06-27 検索装置

Country Status (1)

Country Link
JP (1) JP4803805B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5265638B2 (ja) * 2010-09-28 2013-08-14 ヤフー株式会社 電子端末機及び方法
JP5814682B2 (ja) * 2011-08-01 2015-11-17 株式会社 ミックウェア ナビゲーション装置、地点名称出力方法、およびプログラム
JP6447549B2 (ja) * 2016-03-15 2019-01-09 カシオ計算機株式会社 テキスト検索装置、テキスト検索方法及びプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2881891B2 (ja) * 1990-01-16 1999-04-12 株式会社日立製作所 階層形式をもつ電子化マニユアルの処理装置
JPH0528199A (ja) * 1991-07-18 1993-02-05 Canon Inc 文書検索装置
JP3579945B2 (ja) * 1995-02-28 2004-10-20 富士ゼロックス株式会社 階層項目検索装置および階層項目検索方法
JP2004272682A (ja) * 2003-03-10 2004-09-30 Casio Comput Co Ltd 情報表示制御装置及びプログラム
JP2005222188A (ja) * 2004-02-04 2005-08-18 Akiyoshi Kato 辞書またはインターネットの検索方法及び装置

Also Published As

Publication number Publication date
JP2008009543A (ja) 2008-01-17

Similar Documents

Publication Publication Date Title
US10031649B2 (en) Automated content detection, analysis, visual synthesis and repurposing
CA2935272C (en) Coherent question answering in search results
KR101554293B1 (ko) 교차 언어 정보 검색
US20100114991A1 (en) Managing the content of shared slide presentations
MX2013005056A (es) Enfoque multimodal para entrada de busqueda de consulta.
KR101391107B1 (ko) 검색 대상의 타입을 인터렉티브하게 표시하는 검색 서비스 제공 방법 및 장치
JP2001306599A (ja) 映像の階層的管理方法および階層的管理装置並びに階層的管理プログラムを記録した記録媒体
JP4803805B2 (ja) 検索装置
Kan SlideSeer: A digital library of aligned document and presentation pairs
JP2009003515A (ja) 情報検索装置
Wu et al. Deconfounded and explainable interactive vision-language retrieval of complex scenes
JP2009080625A (ja) 知識構築装置、プログラムおよび知識構築方法
CN107180058B (zh) 一种用于基于字幕信息进行查询的方法和装置
JP5451696B2 (ja) 字幕付加装置、コンテンツデータ、字幕付加方法及びプログラム
JP2008009542A (ja) 知識辞書情報生成装置
CN116414854A (zh) 数据资产查询方法、装置、计算机设备和存储介质
Martins et al. Geographically-aware information retrieval for collections of digitized historical maps
JP2006023968A (ja) 固有表現抽出方法および装置並びにそれらに用いるプログラム
Greulich Embedded indexing with Word: new light on an old topic. Part 1: how to monitor creation of an index
JP2009098829A (ja) 漫画のコマ検索装置
US20150309991A1 (en) Input support device, input support method, and input support program
JP2020173611A (ja) 検索処理プログラム、検索処理方法および検索処理装置
TWI243321B (en) Prefix glossary method and system for assisting word input
JP2014222448A (ja) 書籍抽出装置、書籍抽出方法及び書籍抽出用プログラム
CN115630620B (zh) 工程造价分析数据采集与处理的方法及系统

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080630

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090609

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20101027

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110530

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110808

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110808

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140819

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees