JP3431618B2 - データ検索装置および検索方法 - Google Patents
データ検索装置および検索方法Info
- Publication number
- JP3431618B2 JP3431618B2 JP2001311259A JP2001311259A JP3431618B2 JP 3431618 B2 JP3431618 B2 JP 3431618B2 JP 2001311259 A JP2001311259 A JP 2001311259A JP 2001311259 A JP2001311259 A JP 2001311259A JP 3431618 B2 JP3431618 B2 JP 3431618B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- record
- data
- search key
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
及びハイパーテキストシステムに関し、特に、ダイナミ
ックにデータの内容や個数が変化するデータベースにお
いて、リンク情報を持たせることなしにハイパーテキス
ト的な情報間の移動を可能にするデータ検索装置および
検索方法に関する。
キストデータ間をリンクさせ、その間をダイナミックに
移動することを可能にする。従来のハイパーテキストシ
ステムについては、”Hypertext: An I
ntroduction and Survey”,
COMPUTER, Vol.20, No.9, 1
987, the Computer Society
of the IEEE等で紹介されている。
テムは、データ間に明示的なリンクを形成するものと、
暗黙のリンクを形成するものとに大別される。
トシステムにおいて問題となるのは、リンクの保守であ
る。例えばデータに変更や追加があった場合、以前に存
在していたリンクの整合性を保つために、リンクの変更
や追加、削除といった作業を避けることはできない。こ
のため、従来のハイパーテキストシステムは、例えば操
作マニュアルなどといった、利用者による変更が加えら
れないことを前提としたデータに対して適用される場合
が多い。すなわち、ノード間をリンクで関係づける作業
は、ハイパーテキストデータの作成者が注意深く行い、
利用者は操作するのみといった応用事例が多い。
載の「データ処理装置」のように、従来のエディタを用
いてハイパーテキスト書類を容易に編集することが行わ
れている。しかし、これは従来のリンクを持つハイパー
テキストデータに対する編集を容易にするものであり、
リンクの保守が必要なことに変わりはない。
ワード検索によってデータ間のつながりを持たせる、い
わゆる暗黙のリンクを用いたハイパーテキストシステム
においては、利用者にノードの存在を明示することがで
きず、データ間の移動を偶然性に頼らざるをえなかっ
た。
は、明示的なノードとリンクを持たせることなしに、ハ
イパーテキスト的に情報を連結させ、かつ、ノードの存
在を利用者に明示できるデータ検索装置および検索方法
を提供することにある。
は、文字列データと該文字列データを検索するための一
つまたは複数の検索キーとを一組とするレコードを複数
個記憶するデータベースと、第1のレコードの文字列デ
ータを表示する際に、第1のレコードの検索キーとして
登録されている文字列と第1の検索キーとして登録され
ていないが第2のレコードの検索キーとして登録されて
いる文字列とをともに該文字列データ中の他の文字列と
識別可能に表示する表示手段と、前記識別可能に表示さ
れた文字列が利用者に指示された際に該文字列を検索キ
ーとして前記データベースを検索する検索手段とを備え
る。また、本発明の検索方法は、文字列データと該文字
列データを検索するための一つまたは複数の検索キーと
を一組とするレコードを複数個記憶するデータベースの
検索方法であって、第1のレコードの文字列データを表
示する際に、第1のレコードの検索キーとして登録され
ている文字列と第1の検索キーとして登録されていない
が第2のレコードの検索キーとして登録されている文字
列とをともに該文字列データ中の他の文字列と識別可能
に表示するステップと、前記識別可能に表示された文字
列が利用者に指示された際に該文字列を検索キーとして
前記データベースを検索するステップとを備える。
データと該文字列データを検索するための一つまたは複
数の検索キーとを一組とするレコードを複数個記憶する
データベースと、第1のレコードの文字列データを表示
する際に、第1のレコードの検索キーとして登録されて
いる文字列と第1の検索キーとして登録されていないが
第2のレコードの検索キーとして登録されている文字列
とをともに該文字列データ中の他の文字列と識別可能に
表示する表示手段と、前記識別可能に表示された文字列
が利用者に指示された際に該文字列を検索キーとして前
記データベースを検索する検索手段とを備える。また、
本発明のデータ検索方法は、文字列データと該文字列デ
ータを検索するための一つまたは複数の検索キーとを一
組とするレコードを複数個記憶するデータベースの検索
方法であって、第1のレコードの文字列データを表示す
る際に、第1のレコードの検索キーとして登録されてい
る文字列と第1のレコードの検索キーとして登録されて
いないが第2のレコードの検索キーとして登録されてい
る文字列とをともに該文字列データ中の他の文字列と識
別可能に表示するステップとを備える。
の中の検索キーの集合とを比較し、検索キーの集合の要
素が、データの文字列中に存在する時、その文字列を他
の文字列と識別可能な表示にする。
が指示手段によって指示することによって、その文字列
を検索キーとして検索し、他のデータへの移動を可能と
する。
を示すブロック図である。図1に示す装置は、中央処理
装置(CPU)101と、読み出し専用記憶装置(RO
M)102と、ランダムアクセス記憶装置(RAM)1
03と、データを記憶する2次記憶装置104と、デー
タの表示を行う表示装置105と、データ及び命令の入
力を行う入力装置106と、データ及び命令の入力を補
助する補助入力装置107とから構成されている。
例えば、ハードディスク、フロッピーディスク、光磁気
ディスク等の読み書き可能な記憶装置であり、また、書
きこみが不要な使用に際しては、CD−ROM等の記憶
装置でもよい。
えば、ブラウン管、ELパネル、液晶パネル等を用いた
ディスプレイ装置である。
6は、例えば、キーボードである。
装置107は、例えば、マウス、トラックボール、ジョ
イスティック等の指示装置である。補助入力装置107
は無くても良く、その際は、入力装置106によって、
補助入力装置107の機能を補ってもよい。
別の形式でも良く、例えば複数CPUの並列コンピュー
タシステムや、単独あるいは複数の利用者が、同時に利
用するシステムであってもよい。
置における、全体の処理の流れを示したフローチャート
である。まず、本データ処理装置を利用者が操作するた
めのウインドウを表示装置105に表示する(110
1)。そして、利用者からの入力を待つ(1102)。
図12は、ウインドウの一例を示す説明図であるが、そ
の詳細については後述する。利用者からの入力は、入力
装置106或いは補助入力装置107を使用して行なわ
れる。利用者からの入力があった場合、その入力によっ
て動作を決定する。マウス等の指示装置によって、ウイ
ンドウのボタンを表す部分606a〜606eが指示さ
れた場合(1103)、ボタン押下処理(1106)を
行う。また、レコードの内容表示領域604が指示され
た場合(1104)、内容領域押下処理(1107)を
行う。終了ボタン606eが指示された場合(110
5)は、本データ処理装置を終了させる。なお、終了ボ
タン606eが指示されたか否かの判断は、他のボタン
が指示されたか否かの判断(1103)の中で行っても
よいし、終了処理はボタン押下処理(1106)の中で
行ってもよい。
06)の流れを示したフローチャートである。利用者に
よって検索ボタン602が指示された場合(1201)
には、検索ボタン押下処理(1202)を、編集ボタン
606aが指示された場合(1203)には、編集ボタ
ン押下処理(1204)を、保存ボタン606bが指示
された場合(1205)には、保存ボタン押下処理(1
206)を、登録ボタン606cが指示された場合(1
207)には、登録ボタン押下処理(1208)を、削
除ボタン606dが指示された場合(1209)には、
削除ボタン押下処理(1210)を、それぞれ行う。
107)の流れを示したフローチャートである。まず、
利用者によってマウス等の指示装置によって指示された
部分が、下線等でマークされた文字列の部分であるか否
かを判定する(1301)。マークされた文字列の部分
でない場合は、この処理を終了する。マークされた文字
列の部分である場合は、その文字列を取り出し(130
2)、取り出した文字列を検索キー入力領域601に出
力し(1303)、検索処理を行う(1304)。な
お、マークされた文字列の意味については後述する。
の流れを示したフローチャートである。まず、検索キー
入力領域601から、文字列を取り出す(1401)。
検索キー入力領域601に文字列が無ければ(140
2)、検索を行わずに終了する。検索キー入力領域60
1に文字列が存在すれば、その文字列からハッシュ値を
計算する(1403)。次に、ハッシュ値をインデクス
としてハッシュ表を参照し(1404)、文字列が登録
されているか否かを判定する(1405)。登録されて
いれば、その文字列を検索キーとするレコードを表示し
(1406)、登録されていなければ、検索されなかっ
た旨を表示する(1407)。
ハッシュ表の一例を示した図である。この実施例では、
検索方法として、ハッシュ検索を採用している。あるレ
コードに登録された見出し語及び検索キーは、図6に示
したハッシュ表に登録される。ハッシュ表上において、
見出し語及び検索キーの文字列が登録される位置は、ハ
ッシュ関数によって決められる。ハッシュ関数は、例え
ば対象とする文字列のコードを演算することによって、
文字列から一意に決められる自然数を発生させる。見出
し語及び検索キーの文字列は、ハッシュ関数によって計
算された値をインデクスとして、ハッシュ表に登録され
る。図6では、例えば「コンピュータ」という文字列
は、ハッシュ関数によって「1」というハッシュ値が計
算され、「1」をインデクスとしてハッシュ表に登録さ
れている。また、「計算機」という文字列は、ハッシュ
関数によって「4」というハッシュ値が計算され、
「4」をインデクスとしてハッシュ表に登録されてい
る。
に、そのデータベースが保持する見出し語及び検索キー
が含まれるか否かを判断するための方法の一例を示した
流れ図である。検索されたレコードは、その内容部を表
示する際に、まず内容部の文字列が単語に分解される
(701)。内容部の文字列が、例えば日本語であれ
ば、最長一致法、文節数最小法、最尤評価法等の形態素
解析法を用いて、単語に分解する。図8に示した単語の
集合は、図9に示したレコードの内容部を形態素解析し
た結果の例である。次に、もしシソーラスが用意されて
いる場合は、分解された各単語をそれぞれシソーラスで
検索し、その結果得られた単語を、分解された各単語と
マージする。このように分解された個々の単語を、図6
で説明するハッシュ表を用いて検索し(704)、ハッ
シュ表に存在する単語については、その単語の文字列
を、他の文字列と識別可能となるように、例えば下線を
表示する(706)。この動作を、分解された単語全て
について繰り返すことにより、内容部の文字列に下線等
のマークを付ける。また、分解された全ての単語ではな
く、助詞等を省いたものだけを検索あるいはマーク付け
の対象としてもよい。
装置における、レコードのデータ構造の一例を示したも
のである。レコードは、見出し語、本文、検索キーから
なり、それぞれは、固定長または可変長の文字列を表す
データである。検索キーは例えばカンマ「,」で区切ら
れた文字列の組である。なお、見出し語領域は無くても
よい。
を示したものである。図9では、見出し語に「comp
uter」、本文にその説明、検索キーに「コンピュー
タ,計算機」となっている。図11では、見出し語に
「keyboard」、本文にその説明、検索キーに
「キーボード,コンピュータ,文字,入力装置」となっ
ている。
置を、例えばパーソナルコンピュータ上で実施した場合
の画面の一例を示したものである。図12は、図9およ
び図11で例示したレコードが蓄積されていて、図9で
例示したレコードが検索された状態を示している。利用
者は、検索キー入力領域601に、例えば「コンピュー
タ」と入力し、検索ボタン602をマウス等で指示する
ことにより検索する。すると、検索されたレコードの見
出し語が、見出し語リスト603に表示され、その内容
が、内容表示領域404に表示される。図12には、見
出し語表示領域605が示されているが、これは無くて
もよい。
604の「コンピュータ」という部分と、「計算機」と
いう部分と、「入力装置」という部分に下線が表示され
ている。これは、このデータ処理装置が保持している検
索キーを示している。このうち、「入力装置」という文
字列は、図9に示したレコードすなわち図12に表示さ
れているレコードの検索キーではない。「入力装置」と
いう文字列は、図11に示したレコードの検索キーであ
る。つまり、「入力装置」という文字列に下線が表示さ
れているということは、「入力装置」という検索キーを
持つ他のレコード、すなわち、図11に例示したレコー
ドが存在していることを暗に示しているといえる。この
ように、あるレコードの本文中に、このデータ処理装置
が保持する検索キーが含まれている場合に、その文字列
を、例えば下線を表示する等して、他の文字と識別可能
とすることによって、利用者に検索キーを容易に発見さ
せ、かつ、ハイパーテキスト的なレコード間の移動を可
能にする。
と図11(図13ではレコード2)の二つのレコード間
の、検索キーによる暗黙のリンク状態を、レコード1に
注目して示したものである。図13のレコード1におけ
る、破線矩形で囲んで示した「コンピュータ」という文
字列は、そのレコードの検索キーとして登録されてい
る。すなわち、この「コンピュータ」という文字列は、
この文字列が登録されているレコード1自身を指し示し
ていると考えることができる。図中では、その状態を実
線の矢印で示している。レコード1における、破線矩形
で囲んで示した「計算機」という文字列も同様である。
は、図13のレコード2にも登録されている。すなわ
ち、「コンピュータ」という検索キーは、レコード1の
みならず、レコード2の検索キーでもあるので、レコー
ド1の破線矩形で囲んで示した「コンピュータ」という
文字列からレコード2への、暗黙のリンクと考えること
ができる。図中では、その状態を破線の矢印で示してい
る。
んで示した「入力装置」という文字列は、レコード1の
検索キーとしては登録されていないが、レコード2の検
索キーとしては登録されている。したがって、レコード
1における、破線矩形で囲んで示した「入力装置」とい
う文字列は、レコード2への、暗黙のリンクと考えるこ
とができる。図中では、その状態を破線の矢印で示して
いる。
ンクの概念を示した図である。図14のレコード1の内
容部の「記憶装置」という文字列は、まずシソーラスに
よって検索され、「メモリ」という文字列に変換され
る。「メモリ」という文字列は、図14のレコード2の
検索キーとして登録されているので、レコード1の「記
憶装置」という文字列は、シソーラスを経由することに
よって、レコード2への暗黙のリンクと考えることがで
きる。このように、レコードの内容文字列にマークを付
加する処理を行う際に、シソーラスを用意することによ
って、検索キーと直接対応しない文字列であっても、暗
黙のリンクを実現することができる。
実施例を詳細に説明してきたが、本発明はこの実施例に
限定されるものではない。上記の実施例以外の様々な変
更や追加を、本発明の範囲内において行うこともでき
る。例えば、上記実施例では、検索の方法としてハッシ
ュ表を用いているが、二分探索木を用いてもよいし、K
MP探索やBM探索等の全文検索を用いてもよいし、他
のいかなる方法で検索を実現してもよい。
に、そのデータベースが保持する見出し語及び検索キー
が含まれる場合に、その文字列を、他の文字列と識別で
きる表示にすることにより、利用者に容易に検索キーを
発見させることができる。
しに、ハイパーテキスト的なデータ間の移動を実現し、
また、利用者によるデータ検索のナビゲーション情報を
提供することができる。
構成を示すブロック図である。
処理フローを示すフローチャートである。
動作の概略を示すフローチャートである。
の動作の概略を示すフローチャートである。
理および図4の処理フローにおける検索処理の動作の概
略を示すフローチャートである。
の一例を示す図である。
を示すフローチャートである。
果の一例を示す図である。
を示す図である。
造の一例を示す図である。
うレコードの一例を示す図である。
である。
す図である。
を示した図である。
置、103…読み書き可能記憶装置、104…2次記憶
装置、105…表示装置、106…入力装置、107…
補助入力装置、601…検索キー入力領域、602…検
索ボタン、603…見出し語リスト表示領域、604…
内容表示領域、605…見出し語表示領域、606a…
編集ボタン、606b…保存ボタン、606c…登録ボ
タン、606d…削除ボタン、606e…終了ボタン
Claims (4)
- 【請求項1】 文字列データと該文字列データを検索す
るための一つまたは複数の検索キーとを一組とするレコ
ードを複数個記憶するデータベースと、第1のレコードの文字列データを表示する際に、第1の
レコードの検索キーとして登録されている文字列と第1
の検索キーとして登録されていないが第2のレコードの
検索キーとして登録されている文字列とをともに該 文字
列データ中の他の文字列と識別可能に表示する表示手段
と、 前記識別可能に表示された文字列が利用者に指示された
際に該文字列を検索キーとして前記データベースを検索
する検索手段とを備えるデータ検索装置。 - 【請求項2】 文字列データと該文字列データを検索す
るための一つまたは複数の検索キーとを一組とするレコ
ードを複数個記憶するデータベースの検索方法であっ
て、第1のレコードの文字列データを表示する際に、第1の
レコードの検索キーとして登録されている文字列と第1
の検索キーとして登録されていないが第2のレコードの
検索キーとして登録されている文字列とをともに該文字
列データ中の他の文字列と識別可能に表示するステップ
と、 前記識別可能に表示された文字列が利用者に指示された
際に該文字列を検索キーとして前記データベースを検索
するステップとを備えるデータ検索方法。 - 【請求項3】 文字列データと該文字列データを検索す
るための一つまたは複数の検索キーとを一組とするレコ
ードを複数個記憶するデータベースと、 第1のレコードの文字列データを表示する際に、第1の
レコードの検索キーとして登録されている文字列と第1
のレコードの検索キーとして登録されていないが第2の
レコードの検索キーとして登録されている文字列とをと
もに該文字列データ中の他の文字列と識別可能に表示す
る表示手段とを備えるデータ検索装置。 - 【請求項4】 文字列データと該文字列データを検索す
るための一つまたは複数の検索キーとを一組とするレコ
ードを複数個記憶するデータベースの検索方法であっ
て、 第1のレコードの文字列データを表示する際に、第1の
レコードの検索キーとして登録されている文字列と第1
のレコードの検索キーとして登録されていないが第2の
レコードの検索キーとして登録されている文字列とをと
もに該文字列データ中の他の文字列と識別可能に表示す
るステップとを備えるデータ検索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001311259A JP3431618B2 (ja) | 2001-10-09 | 2001-10-09 | データ検索装置および検索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001311259A JP3431618B2 (ja) | 2001-10-09 | 2001-10-09 | データ検索装置および検索方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7082388A Division JPH08278980A (ja) | 1995-04-07 | 1995-04-07 | データ処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002157257A JP2002157257A (ja) | 2002-05-31 |
JP3431618B2 true JP3431618B2 (ja) | 2003-07-28 |
Family
ID=19130118
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001311259A Expired - Fee Related JP3431618B2 (ja) | 2001-10-09 | 2001-10-09 | データ検索装置および検索方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3431618B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007034962A (ja) * | 2005-07-29 | 2007-02-08 | Sharp Corp | 電子辞書および電子辞書の検索方法、電子辞書の検索プログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2853206B2 (ja) * | 1989-10-03 | 1999-02-03 | 日本電信電話株式会社 | ノウハウ蓄積支援装置 |
JP2925042B2 (ja) * | 1991-08-30 | 1999-07-26 | 日本電信電話株式会社 | 情報リンク生成方法 |
JPH05128157A (ja) * | 1991-11-08 | 1993-05-25 | Ricoh Co Ltd | 文書検索装置 |
JPH05257986A (ja) * | 1992-03-13 | 1993-10-08 | Matsushita Electric Ind Co Ltd | 文字列検索装置 |
JPH0696121A (ja) * | 1992-09-10 | 1994-04-08 | Matsushita Electric Ind Co Ltd | 自動辞書検索装置 |
JPH0728799A (ja) * | 1993-06-25 | 1995-01-31 | Hitachi Electron Service Co Ltd | 用語辞書生成機能を備えた文書表示方法 |
-
2001
- 2001-10-09 JP JP2001311259A patent/JP3431618B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2002157257A (ja) | 2002-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2783558B2 (ja) | 要約生成方法および要約生成装置 | |
US5893087A (en) | Method and apparatus for improved information storage and retrieval system | |
JP2896634B2 (ja) | 全文登録語検索装置および全文登録語検索方法 | |
US20060101320A1 (en) | System and method for the storage, indexing and retrieval of XML documents using relational databases | |
JPH03172966A (ja) | 類似文書検索装置 | |
US7509303B1 (en) | Information retrieval system using attribute normalization | |
JP4073989B2 (ja) | 自然言語検索入力装置 | |
JP3431618B2 (ja) | データ検索装置および検索方法 | |
JP2007133682A (ja) | 全文検索システム、及び、その全文検索方法 | |
JPH08278980A (ja) | データ処理装置 | |
JPH117452A (ja) | ネットワークを介した情報収集方法および装置と該方法を実施するプログラムを記録した記録媒体 | |
JPH05250416A (ja) | データベースの登録・検索装置 | |
JPH0727532B2 (ja) | 情報検索方法及びシステム | |
JP2962287B2 (ja) | 構造化文書検索装置及びプログラムを記録した機械読み取り可能な記録媒体 | |
JP2002236702A (ja) | データ検索装置および検索方法 | |
JPS6175952A (ja) | 文書入力処理方式 | |
JPH1185765A (ja) | タグ付文書検索システム | |
JP2990314B2 (ja) | データ管理装置 | |
JP3239845B2 (ja) | 全文検索装置および方法 | |
JPH0535798A (ja) | データベース検索装置 | |
JP3279002B2 (ja) | 情報管理装置 | |
JPH01307865A (ja) | 文字列検索方式 | |
JPH08249341A (ja) | 文書データベースの文書格納・検索装置 | |
JP2002278991A (ja) | 文書情報検索システム | |
JPH11312166A (ja) | データベース管理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090523 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100523 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120523 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140523 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |