JPH0462665A - データ検索装置 - Google Patents

データ検索装置

Info

Publication number
JPH0462665A
JPH0462665A JP2173808A JP17380890A JPH0462665A JP H0462665 A JPH0462665 A JP H0462665A JP 2173808 A JP2173808 A JP 2173808A JP 17380890 A JP17380890 A JP 17380890A JP H0462665 A JPH0462665 A JP H0462665A
Authority
JP
Japan
Prior art keywords
word
characters
search
specific field
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2173808A
Other languages
English (en)
Inventor
Hiroichi Yoshida
広市 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2173808A priority Critical patent/JPH0462665A/ja
Publication of JPH0462665A publication Critical patent/JPH0462665A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (イ)産業上の利用分野 この発明は、例えば日本語ワードプコセッサや日本語文
書の作成支び記憶が可能なコンピュータなどの文書処理
装置に用いられ、に記憶された文書中から所望の文字を
検索するデータ検索装置に関する。
(ロ)従来の技術 従来、この種のデータ検索装置においては、特許情報な
との過去の文献をデータベースとしてメモリに記憶させ
ておき、その文献を検索する場合には、検索効率を高め
ろために、各々の文献に対して、その文献を代表する用
語、つまりその文章中に用いられている代表的な用語を
被検索用キーワードとしてあらかじめ登録しておき、検
索時には、指定したキーワードと各文献中の被検索用キ
ーワードとが一致するかとうかを調べて、一致した文献
をデータベースから取り出す、という検索方法が一般に
用いられている。
(ハ)発明が解決しようとする課題 しかしながら、このようなデータ検索装置においては、
上記の被検索用キーワードにどのような用語を選択する
かによってデータベースの良し悪しが決められてしまう
。また、年月の経過と共に被検索用キーワードがその文
献にマツチしなくなるという可能性もある。
こういった不具合を解決するfこめには、被検索用キー
ワードにかかわらず、各文献の文章中の全ての文字に対
して指定し几キーワードか当てはまるかどうかを調べる
ようにすればよい。すなわち、第6図に示すように、文
献の文章中から、例えば、「人工知能」という単語を検
索するのであれば、文章中の文字を一文字ずつソフトさ
せて、[人工知能ヱという指定しfこキーワードと同じ
綴りの文字列が存在するかどうかを調べるようにすれば
よい しかし、このように文献の文章全てを検索して、該当す
る単語があるかとうかをチエツクする場合には、検索時
間が長くかかるという問題がある。
この発明は、このような事情を考慮してなされたもので
、検索対象となる文献の文章を所定の専門用語で区切り
、専門用語間をスキップさせて該当する専門用語を検索
するようにしたデータ検索装置を提供するものである。
(ニ)課題を解決する1=めの手段 第1図はこの発明の構成を示すブロック図である。
図に示すように、この発明は、文章を記憶した文章記憶
手段101と、文章記憶手段101に記憶された文章を
特定分野に所属する単語の先頭位置で区切る構文解析手
段102と、構文解析手段102により区切られた各単
語の先頭位置間の文字数を語間長として記憶する語間長
記憶手段103と、前記特定分野に所属する任意の単語
を検索文字として入力するための入力手段+04と、入
力手段104から入力された検索文字と同じ単語を文章
記憶手段lotに記憶された文章中から検索するに際し
語間長記憶手段103に記憶された語間長を参照し前記
特定分野に所属する単語の先頭から検索文字と同数の文
字列部分のみを各単語の語間長毎にスキップして検索す
る検索手段!05を備えてなるデータ検索装置である。
なお、この発明において、文章記憶手段101及び文章
記憶手段103としては、フロッピーディスク装置、磁
気ディスク装置等の外部記憶装置が主として用いられる
構文解析手段102及び検索手段105としては、CP
U、ROM、RAM、I10ポートからなるマイクロコ
ンピュータを用いるのが便利である。
入力手段104としては、任意の文字列を検索文字とし
て入力できるものであればよく、キーボード装置、タブ
レット装置等や、データの一括入力が可能なフロッピー
ディスク装置や磁気ディスク装置等が用いられる。
(ホ)作用 第1図に示すように、この発明によれば、文章記憶手段
101に記憶された文章は、構文解析手段102によっ
て、特定分野に所属する単語の先頭位置で区切られ、区
切られた単語の先頭位置間の文字数が、それぞれ語間長
として語間長記憶手段103に記憶される。
そして、入力手段104から、特定分野に所属する任意
の単語が検索文字として入力されると、検索手段105
により、語間長記憶手段+03に記憶された語間長か参
、照され、特定分野に所属する単語の先頭から検索文字
と同数の文字列部分のみか各単語の語間長毎にスキップ
されて検索が行われる。
従って、検索文字と同じ文字列は、特定分野に所属する
単語毎にスキップされて検索されるので、全文字検索よ
りち短い検索時間で該当文字列を検索することができる
(へ)実施例 以下、図面に示す実施例に基づいてこの発明を詳述する
。なお、これによってこの発明が限定されるものてはな
い。
第2図はこの発明を日本語ワードプロセッサに適用した
一実施例の構成を示すブロック図である。
この図において、1ほかなキーやファンクションキー等
を備えたキーホードであり、各種の文章や、特定分野に
所属する任意の単語を検索文字として制御部2に入力す
る。
制@部2は、CPU、RO〜!、RAM、I10ポート
からなるマイクロコンピュータによって構成され、RO
Mに書き込まれている制御プログラムに従い、後述する
各種のデータ処理を行う。
3は外部からデータを入力する1こめのフロッピーディ
スク装置、磁気ディスク装置等の磁気記憶媒体や、ポイ
ンティングデバイスなとの入力装置である。
4はCRTデイスプレィ装置やLC(液晶)デイスプレ
ィ装置、あるいはELデイスプレィ装置等からなる表示
装置である。
5はキーボード1及び入力装置3から入力された各種の
文章を記憶するための磁気ディスク装置からなるデータ
ベースである。
6は高級日本語ワードプロセッサのような文章校正支援
システムなどに用いられ、入力された漢字かな交じり文
を文節単位に区切る構文解析装置である。
7は漢字かな交じり文が文節単位に区切られる際に構文
解析装置6によって参照されるROMからなる構文解析
用の一般辞書である。
8は各種の特定分野に所属する単語を専門用語として記
憶し1こROMからなる構文解析用の専門用語辞書であ
り、構文解析装置6によって漢字かな交じり文か文節単
位に区切られる際に参、照される。
9はデータベース5に記憶されfこ文章中にキーボード
lから入力された検索文字があるかどうかを検索する検
索装置である。
lOはRAMからなる結果バッファであり、検索装置8
によって検索された被検索文字の位置を示すポインタを
記憶している。
構文解析装置6及び検索装置9はマイクロプロセッサか
ら構成されている。
このような本発明のデータ検索装置においては、まず、
文章データがフロッピーディスクなどの形で入力装置3
から入力され、この文章データに、キーボードlから第
3図(a)に示すようなキーワードが付加される。この
キーワードはそれを付加する人間の主観によって決めら
れる。次に、制御部2は、この文章データを構文解析装
置6に送る。
構文解析装置6は、送られてきた文章データを構文解析
用の一般辞書7及び専門用語辞書8を用いて、第3図(
c)に“/”で示すように専門用語単位に区切り、この
ように専門用語辞書8を使って区切った単語間の文字数
の情報を、第3図(b)に示すような専門語間長データ
として、キーワードと文章データと共にデータベース5
に登録する。
すなわち、検索文字は、専門分野の文献においては専門
用語で指定され、その専門用語は必ず文節の先頭に位置
することに着目して、文章をあらかじめ専門用語単位に
区切っておく。
そして、データベース5の検索時には、キーボードlか
ら、キーワードによる検索か文章全体の検索かが選択さ
れる。キーワードによる検索の場合は一般的なデータベ
ース検索と同じである。文章全体の検索の場合は、検索
する文字列が入力されて、スタートキーが押されると、
制御部2は、検索する文字列を検索装置9に送る。検索
装置9は、文章の先頭から一文字ずつ検索文字と一致す
るか否かを調べる。一致しない場合は、第4図に示すよ
うに、専門語間長データから計算して1度に次の専門用
語の先頭まで検索位置を進める。このようにして、−船
釣なデータベース検索よりも高速な検索を行う。
次に、このような制御部2の処理動作の内容を第5図に
示すフローチャートに従い説明する。
データ検索時には、制御部2は、第3図(b)で示す専
門語間長データのポインタと、第3図(C)で示す文章
データのポインタを、それぞれ先頭へ移動しくステップ
21.22)、さらに、キーホードlから人力されr二
検索文字列のポインタを先頭に移動する(ステップ23
)。
そして、文章データの終了であるのか否かを調べ(ステ
ップ24)、終了でない場合には以下の処理を行う。
まず、文章データの先頭の文字と検索文字列の先頭の文
字とを比較しくステップ25)、一致した場合には、文
章データのポインタを1つ進めると共に(ステップ26
)、検索文字列のポインタを1つ進めて(ステップ27
)、専門語間長データの文字数を1減しくステップ28
)、ステップ24に戻る。
そして、ステップ25において、文章データの文字と検
索文字列の文字とか一致しなかっ1こ場合には、文章デ
ータのポインタを、残りの専門語間長データぶんスキッ
プさせ(ステップ2つ)、専門語間長データポインタを
次の文字数の所に移動する(ステップ30)。
また、ステップ25において、文章データの文字列と検
索文字列とか全て一致しfコ場合には、致した被検索文
字列の位置を結果バッファ9にセットして(ステップ3
1)、ステップ30に進む。
このようにして、データベース登録時に、キーワード以
外に文章の専門用語間の長さを登録し、検索時にはその
専門用語間の長さを参照して、専門用語毎にスキップし
て検索することにより、文章データを単純に全て検索す
るよりも高速に検索することができる。
(ト)発明の効果 この発明によれば、検索文字と同と文字列を文章中から
検索するときには、文章を特定分野に所属する単語の先
頭位置で区切って、特定分野に所属する単語の先頭から
検索文字と同数の文字列部分のみを特定分野に所属する
単語毎にスキップして検索するようにしfコので、文章
を全て検索するよりも短い時間で検索文字と同じ文字列
を文章中から検索することができる。
【図面の簡単な説明】
第1図はこの発明の構成を示すブロック図、第2図はこ
の発明の一実施例の構成を示すブロック図、第3図の(
a)〜(C)はキーワード、専門語間長データ及び文章
データのそれぞれの記憶内容の一例を示す説明図、第4
図はこの発明の検索方法を示す説明図、第5図は実施例
の動作を示すフローチャート、第6図は従来の全文字検
索の方法を示す説明図である。 工・・・・・キーボード、2・・−・・・制御部、3・
・・・・人力装置、4・・・・・・表示装置、5− ・
・データベース、6・・・構文解析装置、7・・・構文
解析用の一般辞書、8 ・・・専門用語辞書、9 ・・
検索装置、io・・・・・結果バッファ。 第1図

Claims (1)

    【特許請求の範囲】
  1. 1、文章を記憶した文章記憶手段と、文章記憶手段に記
    憶された文章を特定分野に所属する単語の先頭位置で区
    切る構文解析手段と、構文解析手段により区切られた各
    単語の先頭位置間の文字数を語間長として記憶する語間
    長記憶手段と、前記特定分野に所属する任意の単語を検
    索文字として入力するための入力手段と、入力手段から
    入力された検索文字と同じ単語を文章記憶手段に記憶さ
    れた文章中から検索するに際し語間長記憶手段に記憶さ
    れた語間長を参照し前記特定分野に所属する単語の先頭
    から検索文字と同数の文字列部分のみを各単語の語間長
    毎にスキップして検索する検索手段を備えてなるデータ
    検索装置。
JP2173808A 1990-06-29 1990-06-29 データ検索装置 Pending JPH0462665A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2173808A JPH0462665A (ja) 1990-06-29 1990-06-29 データ検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2173808A JPH0462665A (ja) 1990-06-29 1990-06-29 データ検索装置

Publications (1)

Publication Number Publication Date
JPH0462665A true JPH0462665A (ja) 1992-02-27

Family

ID=15967546

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2173808A Pending JPH0462665A (ja) 1990-06-29 1990-06-29 データ検索装置

Country Status (1)

Country Link
JP (1) JPH0462665A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455661A (en) * 1993-03-25 1995-10-03 Kabushiki Kaisha Toshiba Charging device for an image forming apparatus
JP2003011659A (ja) * 2001-06-27 2003-01-15 Denso Corp 空調装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455661A (en) * 1993-03-25 1995-10-03 Kabushiki Kaisha Toshiba Charging device for an image forming apparatus
JP2003011659A (ja) * 2001-06-27 2003-01-15 Denso Corp 空調装置

Similar Documents

Publication Publication Date Title
US7523102B2 (en) Content search in complex language, such as Japanese
JP2783558B2 (ja) 要約生成方法および要約生成装置
US5890103A (en) Method and apparatus for improved tokenization of natural language text
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JPH09198395A (ja) 文書検索装置
JPH0462665A (ja) データ検索装置
EP1605371A1 (en) Content search in complex language, such as japanese
JPH09179875A (ja) 情報検索装置
JP2529418B2 (ja) 文書検索装置
JPH0462664A (ja) データ検索装置
JP2621999B2 (ja) 文書処理装置
JPH07114565A (ja) 電子辞書
JPH0793345A (ja) 文書検索装置
JPH0973454A (ja) 文書作成装置及び文書作成方法
Takeda et al. CRITAC—An experimental system for Japanese text proofreading
JPH01126767A (ja) 辞書参照装置
Lewi et al. Computer Documentation System for Small-and Medium-Sized Information Collections
JPH06149790A (ja) 文章作成装置
JP2894298B2 (ja) 文書検索装置
JPH08249341A (ja) 文書データベースの文書格納・検索装置
JPS62287338A (ja) 検索装置
JPH06187329A (ja) 自然言語処理装置
JP2002251394A (ja) 全文検索システム
JPH0991304A (ja) 情報検索方法、情報検索システム及び情報検索用記憶媒体
JPH09101951A (ja) 文書検索装置