JPH03286371A - 文書情報検索装置 - Google Patents

文書情報検索装置

Info

Publication number
JPH03286371A
JPH03286371A JP2087834A JP8783490A JPH03286371A JP H03286371 A JPH03286371 A JP H03286371A JP 2087834 A JP2087834 A JP 2087834A JP 8783490 A JP8783490 A JP 8783490A JP H03286371 A JPH03286371 A JP H03286371A
Authority
JP
Japan
Prior art keywords
search
document information
keyword
retrieving
pieces
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2087834A
Other languages
English (en)
Other versions
JP3007375B2 (ja
Inventor
Masako Bosu
雅子 望主
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2087834A priority Critical patent/JP3007375B2/ja
Publication of JPH03286371A publication Critical patent/JPH03286371A/ja
Application granted granted Critical
Publication of JP3007375B2 publication Critical patent/JP3007375B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は予め内容に対応したキーワードと共に登録され
た文書情報をキーワードの指定に基づいて検索する文書
情報検索装置に関する。
従来の技術 現在、情報処理作業を高速化する装置として文書情報検
索装置が開発された。これは、予め機器に多数の文書情
報を内容に即したキーワードと共に登録しておき、検索
作業時には作業者が所定のキーワードを指定することで
文書情報が付与されたキーワードに従って選出されると
云うものである。
ここで、上述のような文書情報検索装置では、文書情報
の入力時に所定のシソーラスを設定して検索時に利用す
る統制キーワード方式等と称するものと、文書情報の入
力時には文書内容を直接入力して検索時には全情報に対
してキーワード検索を行なうフリーターム方式と称する
ものとが存している。ここで、このフリーターム方式の
検索システムは、文書情報の入力作業が簡易で装置の構
造も簡略なので普及しているが、実際には文書情報の登
録時に機器が抽出したキーワードと検索作業時に作業者
が指定するキーワードとの間に単語構造に差異が存して
適切な文書情報が検索されない場合がある。
このような単語構造の差異による検索不良はキーワード
が複合語である場合に多発しがちである。
これは、複合語が漢字、片仮名、英字等を自在に組合わ
せた構造となっており、同様な意味内容でも組合せの順
番などが異なるものが多いことに起因している。ここで
、文書中のキーワードとなる語は、その分野の専門用語
である場合が多いが、このような専門用語は実際には新
技術や新概念であるために複合語で表現されることが多
い。従って、文書情報検索装置には、複合語からなるキ
ーワードを指定しても文書情報を的確に検索できること
が要望されている。
そこで、このような課題を解決するため、文書情報から
キーワードの入力時にキーワードを単語分割して部分文
字列を生成し、これもキーワードとする方式が提案され
ている。(「日本語文章からのキーワード自動抽出」情
報処理学会第35同量国大会、昭和62年後期)この場
合、文書情報から抽出されたキーワードと作業者が指定
するキーワードとの単am造の差異による検索漏れは解
消されるが、新たに生成されたキーワードによって要望
する検索内容に不適切な文書情報も多量に検索されるこ
とになるに こで、要望する検索内容に適切な文書情報を・適量検索
する方法としては、特定性の高い概念から順次検索作業
を行なうことが提案されている。
(rAPrimer、 Learned  Infor
mationJ 198+。
「サーチセーの時代J  1986.6)これは最初は
最も特定性の高い概念で検索作業を行ない、この検索結
果が多量であった場合は次に特定性の高い概念で再度検
索作業を行なうと云うものである。このようにして検索
結果を絞り込むことで、所定量の文書情報を得ることが
できる。
だが、指定したキーワードが複合語で複数の単語構造が
想定される場合、指定したキーワードの単語構造で適切
でないと検索結果が微量になることがあり、この場合、
作業者が検索結果を理解して次のキーワードを再度指定
する必要が生じる。
発明が解決しようとする課題 上述のように、従来の文書情報検索装置ではキーワード
が複合語の場合、文書情報から抽出されたキーワードと
作業者が指定するキーワードとの単語構造の差異により
、内容が的確な文書情報を適切な個数で選出することが
困難になっている。
課題を解決するための手段 予め文書情報が内容に即したキーワードと共に登録され
たファイル手段を設け、検索用のキーワードと文書情報
の検索目標数とを指定する検索条件指定手段を設け、こ
の検索条件指定手段から入力されたキーワードとファイ
ル手段に登録されたキーワードとの一致に従ってファイ
ル手段から文書情報を検索する検索手段を設け、この検
索手段が検索した文書情報の個数と検索条件指定手段で
指定された検索目標数とを比較して作業の完了か再実行
かを判定する検索結果判定手段を設け、この検索結果判
定手段の判定結果が再実行であった場合に検索条件指定
手段で指定されたキーワードを単語分割して一部を排し
た部分文字列を生成して検索手段にキーワードとして再
入力する部分キーワード生成手段を設けた。
作用 検索手段が検索した文書情報の個数と検索条件指定手段
で指定された検索目標数とを比較して作業の完了か再実
行かを判定する検索結果判定手段を設け、この検索結果
判定手段の判定結果が再実行であった場合に検索条件指
定手段で指定されたキーワードを単語分割して一部を排
した部分文字列を生成して検索手段にキーワードとして
再入力する部分キーワード生成手段を設けたことにより
、複合語をキーワードとして検索結果の個数を予め指定
した検索作業を実行することができ、検索結果が検索目
標数に到達するまで指定したキーワードの概念が拡大さ
れて作業が繰返されるので、要望する検索内容に適した
文書情報が所望の個数得られる。
実施例 本発明の実施例を第1図ないし第3図に基づいて説明す
る。この文書情報検索装置1は、第工図に例示するよう
に、キーボード(図示せず)等を備えた検索条件指定手
段2と、検索手段3と、デイスプレィ等の検索結果出力
手段4が接続された検索結果判定手段5と、共に部分キ
ーワード生成手段である単語分割手段6と部分文字列生
成手段7とが順次接続され、この部分文字列生成手段7
の出力部が前記検索手段3にフィードバック接続された
構造となっている。
なお、第2図に例示するように、前記検索手段3に接続
された単語辞書8には、各種単語の表記情報と品詞情報
とが格納されており、第3図に例示するように、前記検
索手段3に接続されたファイル手段であるインバーテツ
ドファイル9には、予め入力された文書情報から抽出さ
れたキーワードと各文書情報の登録番号とが格納されて
いる。
このような構成において、この文書情報検索装置1では
、検索条件指定手段2で検索用のキーワードと文書情報
の検索目標数とを指定すると、検索手段3が入力された
キーワードとインバーテツドファイル内のキーワードと
の一致に従って文書情報の検索を行なう。そこで、この
検索手段3の検索結果が入力された検索結果判定手段5
は、検索された文書情報の件数が検索条件指定手段2で
指定された検索目標数に到達していれば作業の完了を判
定し、検索結果が検索結果出力手段4から出力されて作
業が終了する。
ここで、検索手段3の検索件数が検索条件指定手段2で
指定された検索目標数に到達していないことを検索結果
判定手段5が判定した場合、単語辞書8に基づいて動作
する単語分割手段6で検索条件指定手段2で指定された
キーワードが単語分割されて各々の品詞が判別される。
そこで、この分割された単語群が入力された部分キーワ
ード生成手段7では、その一部を排した部分文字列が生
成され、これがキーワードとして検索手段3に再入力さ
れることになる。ここで、部分キーワード生成手段7に
よる部分文字列の生成は、基本的には先頭部を排除する
ことで実行されるが、この他に品詞情報に基づいて訪米
が一般名詞となるようにしてキーワードに適した部分文
字列を生成することも可能である。なお、上述のように
単語群の先頭部を排除してキーワードを生成するのは、
日本語では複合語は訪米が全体を代表して前部は修飾で
ある場合が多いことを考慮したことによる。
上述のように、この文書情報検索装置1ては、検索結果
が検索目標数に到達するまで指定したキーワードの概念
が拡大されて作業が繰返されるので、要望する検索内容
に適した文書情報が所望の個数得られることになる。
ここで、この文書情報検索装置1の検索作業の具体例を
以下に例示する。まず、インバーテツドファイル9への
キーワードの設定処理として、例えば、情報処理に関す
る所定の日本語文章を文書情報として入力したところ、
第3図に例示したような情報が格納されたとする。
つぎに、上述のようにしてインバーテツドファイル9が
設定された文書情報検索装置1に、「多機能レーザファ
クシミリ」と云う複合語をキーワードとして入力すると
共に検索目標数を20件として指定した場合、−回目の
検索作業では文書番号「5」、「6」、「45」の3件
の文書情報が検索される。そこで、この検索結果が検索
目標数に満たないことが検索結果判定手段5で判定され
、単語分割手段6に入力されたキーワード「多機能レー
ザファクシミリ」は、 「多機能°レーザファクシミリ」 =「修飾名詞′一般名詞′一般名詞J (′は単語の区切り) と云うように単語分割されて品詞情報が判別される。そ
こで、部分文字列生成手段7では、先頭部の「多機能」
が省略されると共に訪米が一般名詞であることが確認さ
れて「レーザファクシミリ」が生成され、これをキーワ
ードとして検索作業が再度実行される。そこで、例えば
、この検索結果が5件であったとすると合計8件なので
、また検索目標数には満たない。そこで、上述と同様に
して今度は先頭部の「レーザJが省略された「ファクシ
ミリ」がキーワードとして検索作業が実行され、この検
索結果が15件であったとすると合計23件となり、検
索目標数20件に到達したことが判定されて検索作業が
完了する。なお、このようにして検索された文書情報は
、省略した個数が少ないキーワードで検索されたものか
ら順番に出力されることになる。
また、例えば、この文書情報検索装置1に「高速ファク
シミリ」と云う複合語をキーワードとして入力すると共
に検索目標数を20件として指定した場合、−回目の検
索作業では3件の文書情報が検索される。そこで、「高
速」が省略された「ファクシミリ」をキーワードとして
二回目の検索作業が実行され、この検索結果が15件で
あったとすると、合計18件となって検索目標数20件
に満たないので検索結果判定手段5は作業の再実行を判
定する。だが、この文書情報検索装置1では、次のキー
ワード候補である「高速」が修飾名詞であって一般名詞
ではないことが部分文字列生成手段7で検知され、キー
ワードの生成不能が検索手段3から検索結果判定手段5
に転送されて検索先が終了する。
つまり、この文書情報検索装置lでは、複合語をキーワ
ードとして検索結果の個数を予め指定した検索作業を実
行することができ、検索された文書情報は要望する検索
内容に適したものから順番に略指定した個数が出力され
る。つまり、この文書情報検索装置1では、検索された
文書情報の個数が微小であるために異なるキーワードを
手作業で再入力したり、多量に検索された不要な文書情
報から必要なものを手作業で判別するようなことを要し
ない。従って、この文書情報検索装置lは、専門用語を
指定して技術文書を検索するような作業を簡易かつ良好
に実行することができる。
発明の効果 本発明は上述したように、予め文書情報が内容に即した
キーワードと共に登録されたファイル手段を設け、検索
用のキーワードと文書情報の検索目標数とを指定する検
索条件指定手段を設け、この検索条件指定手段から入力
されたキーワードとファイル手段に登録されたキーワー
ドとの一致に従ってファイル手段から文書情報を検索す
る検索手段を設け、この検索手段が検索した文書情報の
個数と検索条件指定手段で指定された検索目標数とを比
較して作業の完了か再実行かを判定する検索結果判定手
段を設け、この検索結果判定手段の判定結果が再実行で
あった場合に検索条件指定手段で指定されたキーワード
を単語分割して一部を排した部分文字列を生成して検索
手段にキーワードとして再入力する部分キーワード生成
手段を設けたことにより、複合語をキーワードとして検
索3・・・検索手段、 5・・・検索結果判定手段、6゜ 7・・・ 結果の個数を予め指定した検索作業を実行するこ部分キ
ーワード生成手段、9・・・ファイル手段とができ、検
索結果が検索目標数に到達するまで指定したキーワード
の概念が拡大されて作業が繰返されるので、要望する検
索内容に適した文書情報が所望の個数得られることにな
り、従来の装置のように、検索された文書情報の個数が
微小であるために異なるキーワードを手作業で再入力し
たり、多量に検索された不要な文書情報から必要なもの
を手作業で判別するようなことを要せず、簡易な操作で
検索結果が良好な文書情報検索装置を得ることができる
等の効果を有するものである。
株式会社
【図面の簡単な説明】
第1図は本発明の実施例を示すブロック図、第2図及び
第3図は要部のデータ構造を示す概念説明図である。

Claims (1)

    【特許請求の範囲】
  1. 予め文書情報が内容に即したキーワードと共に登録され
    たファイル手段と、検索用のキーワードと文書情報の検
    索目標数とを指定する検索条件指定手段と、この検索条
    件指定手段から入力されたキーワードと前記ファイル手
    段に登録されたキーワードとの一致に従って前記ファイ
    ル手段から文書情報を検索する検索手段と、この検索手
    段が検索した文書情報の個数と前記検索条件指定手段で
    指定された検索目標数とを比較して作業の完了か再実行
    かを判定する検索結果判定手段と、この検索結果判定手
    段の判定結果が再実行であった場合に前記検索条件指定
    手段で指定されたキーワードを単語分割して一部を排し
    た部分文字列を生成して前記検索手段にキーワードとし
    て再入力する部分キーワード生成手段とよりなることを
    特徴とする文書情報検索装置。
JP2087834A 1990-04-02 1990-04-02 文書情報検索装置 Expired - Fee Related JP3007375B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2087834A JP3007375B2 (ja) 1990-04-02 1990-04-02 文書情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2087834A JP3007375B2 (ja) 1990-04-02 1990-04-02 文書情報検索装置

Publications (2)

Publication Number Publication Date
JPH03286371A true JPH03286371A (ja) 1991-12-17
JP3007375B2 JP3007375B2 (ja) 2000-02-07

Family

ID=13925963

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2087834A Expired - Fee Related JP3007375B2 (ja) 1990-04-02 1990-04-02 文書情報検索装置

Country Status (1)

Country Link
JP (1) JP3007375B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0877146A (ja) * 1994-08-31 1996-03-22 Fuji Xerox Co Ltd 文書検索提示装置
JPH1074207A (ja) * 1996-08-30 1998-03-17 Adoin Kenkyusho:Kk 情報検索装置及び情報検索方法
JPH10207896A (ja) * 1997-01-17 1998-08-07 Nippon Telegr & Teleph Corp <Ntt> 検索用語拡張方法及び装置及び情報検索方法及び装置
JP2006209757A (ja) * 2005-01-25 2006-08-10 Microsoft Corp クエリ詳細化のためのシステムおよび方法
US7765193B2 (en) 2004-03-15 2010-07-27 Ricoh Company, Ltd. Control of document disclosure according to affiliation or document type
JP2015179527A (ja) * 2015-05-12 2015-10-08 株式会社Jvcケンウッド 情報選択装置、情報選択方法、およびコンピュータプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0877146A (ja) * 1994-08-31 1996-03-22 Fuji Xerox Co Ltd 文書検索提示装置
JPH1074207A (ja) * 1996-08-30 1998-03-17 Adoin Kenkyusho:Kk 情報検索装置及び情報検索方法
JPH10207896A (ja) * 1997-01-17 1998-08-07 Nippon Telegr & Teleph Corp <Ntt> 検索用語拡張方法及び装置及び情報検索方法及び装置
US7765193B2 (en) 2004-03-15 2010-07-27 Ricoh Company, Ltd. Control of document disclosure according to affiliation or document type
JP2006209757A (ja) * 2005-01-25 2006-08-10 Microsoft Corp クエリ詳細化のためのシステムおよび方法
JP2015179527A (ja) * 2015-05-12 2015-10-08 株式会社Jvcケンウッド 情報選択装置、情報選択方法、およびコンピュータプログラム

Also Published As

Publication number Publication date
JP3007375B2 (ja) 2000-02-07

Similar Documents

Publication Publication Date Title
US10929603B2 (en) Context-based text auto completion
JPH08305730A (ja) 機械読み取り可能形式の文書からプロセッサに対してキーフレーズを選択する自動的方法
JPH08255172A (ja) 文書検索システム
JP2006099428A (ja) 文書要約作成システム、方法、及びプログラム
JPH03286371A (ja) 文書情報検索装置
JPH0581326A (ja) データベース検索装置
US20040054677A1 (en) Method for processing text in a computer and a computer
JPH09185632A (ja) 情報検索・編集方法及び装置
JPH07210565A (ja) 情報検索方法及び装置
JP3498635B2 (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体
JPH0535798A (ja) データベース検索装置
JP3161660B2 (ja) キーワード検索方法
JP2005092824A (ja) 文書検索装置、文書検索方法、文書検索プログラム、および記録媒体
JP2005293165A (ja) ファイル検索装置及びその方法
JPH0520323A (ja) 文字列変換装置
JP3111081B2 (ja) データ検索装置
JPH09128406A (ja) 文書検索装置および検索方法
JP2001052022A (ja) データ集計・参照型検索システム
JPS6379178A (ja) 文書イメ−ジ電子フアイル装置
JPH09231217A (ja) 言語解析システムおよび方法
JP2000163433A (ja) 同意語登録管理システム
JPH09114842A (ja) 情報検索処理装置および情報検索処理方法
JPS62159223A (ja) 文書情報検索方式
JPH0934897A (ja) 図書管理システム
JPH0869455A (ja) 文書検索方法,文書検索装置及び文書記憶装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071126

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081126

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees