JPH0528198A - 文書情報検索装置 - Google Patents

文書情報検索装置

Info

Publication number
JPH0528198A
JPH0528198A JP3271736A JP27173691A JPH0528198A JP H0528198 A JPH0528198 A JP H0528198A JP 3271736 A JP3271736 A JP 3271736A JP 27173691 A JP27173691 A JP 27173691A JP H0528198 A JPH0528198 A JP H0528198A
Authority
JP
Japan
Prior art keywords
data
search
document information
correlation
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3271736A
Other languages
English (en)
Inventor
Hiroyuki Sone
弘幸 曽根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP3271736A priority Critical patent/JPH0528198A/ja
Publication of JPH0528198A publication Critical patent/JPH0528198A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 相関データにより必要とする文書情報の内容
を推測することにより、適切な文書情報を必要度に応じ
て配列することを可能にする。 【構成】 文書情報に記載されているワードを検出する
ワード検出部21と、前記検出されたワード及び前記文
書情報に付与された検索データに対応した文書情報を蓄
積装置2から検索する情報検索部11と、相関データに
より前記検出されたワード及び前記文書情報に付与され
た検索データから内容データを推測する推測部17と、
前記内容データに基づいて前記検索された文書情報を配
列する配列部18とからなる制御装置3と、前記配列さ
れた文書情報を出力する出力装置4から構成される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書情報に自動的に検
索データを付与する装置、付与された検索データを効率
的に修正する装置、ある体系の検索データを他の体系の
検索データに変換する装置、検索式による文書情報検索
を効率的に行う装置、自動的に文書情報を検索する装置
に関する。
【0002】
【従来の技術】社会の発展にともない様々な文書情報が
発行されその量は膨大なものとなっており、かつそれら
の文書情報から必要な文書情報を検索して利用すること
が益々重要になってきている。この文書情報検索方法に
は、文書情報に内容に応じた分類や文書情報から抽出し
たキーワード等からなる検索要素を付与検索データとし
て付与しておき、検索時に必要とする検索データが付与
された文書情報を求めるものと、テキストサーチのよう
に必要とするワードが記載されている文書情報を求める
ものとがある。上記の文書情報に付与する付与検索デー
タは、特開平2−171853号公報に記載されている
ように2つのキーワード間の関係を表したキーワードコ
ンネクションを用いて文書情報に記載されているワード
と関連度の大きいキーワード候補語を付与検索データで
あるキーワードに決定していた。また各文書情報の付与
検索データが誤っていては適切な検索が不可能となるた
め検索データの修正が必要となるが、この付与検索デー
タ修正は検索時に検索式に適合しない文書情報を発見し
た場合、その都度検索者が修正を行っていた。さらにあ
る体系の検索データを他の体系の検索データに変換する
場合には、変換表を用意しておき変換時に被変換検索デ
ータに対応した変換検索データを変換された検索データ
としていた。文書情報の効率的検索及び自動文書情報検
索では、特開平2−165276号公報に記載されてい
るようにキーワードの組を格納した知識ベースを用意し
ておき、入力された検索式またはワードを含む知識ベー
ス中の検索知識データ毎に対応した文書情報を検索結果
としていた。
【0003】
【発明が解決しようとする課題】文書情報への検索デー
タ付与に関しては、検索データが単にキーワードでなく
分類のような文書情報の内容に関するものである場合、
ある分類が文書情報に記載されている多くのワードと関
係度が大きいからといって必ずしもその文書情報に対応
した検索データになるとは限らず、付与される検索デー
タの適格度が低下する欠点を有していた。検索データ修
正に関しては、検索時に検索データの修正を行うため検
索作業が繁雑となり文書情報に誤った検索データが付与
されていることを発見してもなかなか修正が行われなか
った。しかも従来の修正方法では、文書情報に誤った検
索データが付与されている場合は適用できるが、文書情
報に付与される必要のある検索データが付与されていな
い場合には適用できなかった。検索データの変換に関し
ては、変換される検索データの体系が多観点の分類体系
で変換先の検索データが一観点の分類体系の場合や、文
書情報に付与された検索データが複数の場合、適格な変
換を行っていなかった。文書情報の効率的検索及び自動
文書情報検索では、単に知識ベース中の検索知識データ
毎に検索結果を調べるため、最適の文書情報が必ずしも
最初の検索知識データ中に存在するわけではないので効
率的に検索されていなかった。本発明の目的は以下の点
にある。文書情報への検索データ付与では、文書情報に
記載されているワードの組に最も適した文書情報の内容
に関する検索データを自動的に付与することを可能にし
た文書情報検索装置を提供する。検索データ修正では、
誤った検索データが付与された可能性の高い文書情報及
び付与されることが必要な検索データが付与されていな
い可能性の高い文書情報を自動的に検出することを可能
にした文書情報検索装置を提供する。検索データの変換
では、変換される検索データの体系が多観点の分類体系
で変換先の検索データが一観点の分類体系でも自動的に
検索データを変換することを可能にした文書情報検索装
置を提供する。文書情報の効率的検索及び自動文書情報
検索では、必要度の高い文書情報を自動的に配列するこ
とを可能にした文書情報検索装置を提供するものであ
る。
【0004】
【課題を解決するための手段】文書情報への検索データ
付与では、文書情報に記載されているワードのパターン
を検出し、検出されたワードのパターンと相関関係度の
大きい検索データを相関データから求めて付与検索デー
タとする。検索データ修正では、特定の検索データと相
関関係度の小さい検索データ及び大きい検索データを相
関データから求め、求められた検索データが特定の検索
データと共に付与及び付与されていない文書情報を求め
るものと、各文書情報の付与検索データ中に他の付与検
索データと相関関係度が小さい検索データ及び付与検索
データと相関関係度の大きい付与検索データでない検索
データを相関データから求めるものとがある。検索デー
タの変換では、変換される検索データのパターンと相関
関係度の大きい変換先の検索データを相関データから求
めて変換された検索データとする。文書情報の効率的検
索では、検索式を解析してランク順位の付与された構成
データを求めて新たな検索式の作成するものと、ランク
順位の付与された配列データを求めて検索式で検索され
た文書情報を配列するものとがある。自動文書情報検索
では、相関データによって入力データから内容データを
求めて検索式を作成するものと、入力データに対応した
文書情報を検索しておき前記内容データより検索された
文書情報を配列するものとがある。
【0005】
【作用】文書情報への検索データ付与では、文書情報に
記載されたワードのパターンと最も相関関係度の大きい
検索データの判明が自動的に行われる。検索データ修正
では、誤った検索データが付与された可能性の高い文書
情報及び付与されることが必要な検索データが付与され
ていない可能性の高い文書情報と対応した検索データの
検出が自動的に行われる。検索データの変換では、変換
される検索データのパターンと最も相関関係度の大きい
変換先の検索データの判明が自動的に行われる。検索式
入力による文書情報の検索では、必要度の高い順に検索
された文書情報が配列される。自動文書情報検索では、
文書情報の検索及び文書情報の必要度に応じた配列が自
動的に行われる。
【0006】
【実施例】第1図には本願の全ての実施例に関わる文書
情報検索装置の構成が記載されている。この文書情報検
索装置について簡単に説明すると、1は検索式や検索デ
ータ及びワードまたは各種の命令を入力するキーボード
等からなる入力装置、2は文書情報や相関データ等を蓄
積する蓄積装置、3は文書情報検索等を行うために各装
置を制御する制御装置、4は文書情報検索の結果等を出
力するディスプレイやプリンタ等からなる出力装置であ
る。そして蓄積装置2は、相関データを蓄積した相関蓄
積部5、文書情報の情報データと付与検索データ及び体
系毎の検索データを蓄積した情報蓄積部6、検索式作成
等に用いる規則を蓄積した規則蓄積部7、同義語や上位
概念語下位概念語等のワードを蓄積したシソーラス部8
からなり、また制御装置3は、相関蓄積部5に蓄積され
た相関データを検出する相関検出部9、相関データを作
成する作成部10、情報蓄積部6から情報データや付与
検索データ及び検索データを検索する情報検索部11、
情報蓄積部6に蓄積された文書情報に検索データの付与
または付与された検索データの修正をする付与・修正部
12、規則蓄積部7から検索式作成等のための規則を検
出する規則検出部13、シソーラス部8から特定のワー
ドの同義語や上位概念下位概念等のワードを検索するシ
ソーラス検索部14、入力された検索式を解析する解析
部16、各種の推測を行う推測部17、検索された文書
情報を配列する配列部18、検索式を構成する構成部2
0、文書情報からワードを検出するワード検出部21、
各部を制御する制御部15からなる。蓄積装置2の情報
蓄積部6に蓄積されている文書情報は、文書情報自体で
ある情報データと、検索のために付与された検索データ
(以下「付与検索データ」という)から成り立ってい
る。検索データは、分類等のように情報データの内容か
ら決定されるものと、キーワード等のように情報データ
に記載されているワード(以下「記載ワード」という)
から決定されるものとがあり、また個々の検索データを
検索要素とする。本願のすべての実施例は、相関データ
を用いることを基本としているので最初に相関関係と相
関データの作成及び利用について説明する。相関関係と
は、蓄積されている文書情報または検索された文書情報
を文書情報の内容に応じて集合化することにより、検索
データ及びワードが同一の集合である確率や各集合に対
応した検索データ及びワードの組み合わせパターンを明
らかにしたものである。この相関関係である同一の集合
である確率(以下「相関関係度」という)や組み合わせ
パターンを明らかにしたデータを相関データとする。こ
の相関データの形態には、特定の検索データ及びワード
と他の検索データ及びワードが同一の文書情報にどの程
度付与または記載されているかを明らかにした特定型、
同一集合の文書情報の付与検索データ及び記載ワードの
パターンを明らかにしたパターン型、特定型とパターン
型を組み合わせた混合型とがある。相関データの作成及
び利用には、作成部10において作成した相関データを
相関蓄積部5に蓄積しておき、相関データ利用時に相関
検出部9により必要とする相関データを相関蓄積部5か
ら検出して利用する蓄積型と、相関データの利用時に作
成部10で逐次相関関係を求めて相関データを作成し利
用する逐次型とがある。次にこの装置による蓄積型の相
関データ作成動作例について説明する。最初に入力装置
1に相関データ作成命令及び設定条件を入力する。相関
データ作成命令を受けた制御部15は、設定条件に基づ
いたすべての検索要素及びワードを情報検索部11及び
ワード検出部21またはシソーラス検索部14から取り
出し、取り出された検索要素及びワードを作成部10に
入力する。ここで検索要素の取り出しは、情報検索部1
1により情報蓄積部6から設定条件の体系に属する検索
データや設定条件の範囲に属する文書情報の付与検索デ
ータ等を求めることにより行われ、ワードの取り出し
は、一旦設定条件の範囲に属する文書情報を情報検索部
11により情報蓄積部6から求めておき、求められた文
書情報をワード検出部21へ入力することにワードを求
めるか、シソーラス検索部14によりシソーラス部8か
ら設定条件のワードを求めることにより行われる。ここ
で設定条件に基づいたすべての検索要素及びワードは、
相関データ作成命令入力時に入力データとして入力して
もよい。また設定条件とは作成する相関データの形態、
検索データや文書情報の範囲を限定する条件をいう。作
成部10は、入力された検索要素及びワードから検索要
素及びワードの組またはパターンからなる作成データを
作成する。制御部15は、作成データ中の検索要素及び
ワードすべてが付与及び記載された文書情報を情報検索
部11に情報蓄積部6から検索させて文書情報件数(以
下「相関件数」という)を求めさせ、求められた相関件
数を作成部10へ入力する。作成部10は求められた各
作成データ毎の相関件数から相関データを作成する。こ
こで作成された相関データには、利用時に適切な相関デ
ータを求められるように、設定条件や相関データ中の検
索要素及びワードを明らかにしたデータを検出データと
して付与しておいてもよい。制御部15は作成された相
関データを相関蓄積部5へ入力して蓄積させることによ
り、蓄積型の相関データ作成は完了する。逐次型の相関
データ作成は、蓄積型と同様に作成部10へ入力された
検索要素及びワードから作成データを作成して各作成デ
ータに対応する相関件数を求め、予め定められた形態の
相関データを作成する。次に作成部10での特定型の作
成データ作成方法例及び相関データ作成方法例について
詳述する。作成データ作成方法では、入力された検索要
素及びワードの中から特定の検索要素またはワードを指
定項目とする。指定項目以外のある検索要素またはワー
ドを相関項目とする。ここで指定項目及び相関項目は、
検索要素及びワードからなる複数の組でもよく、また入
力された検索要素が多観点の分類体系に属するものであ
れば指定項目を特定の観点の検索要素に限定してもよ
い。指定項目と相関項目の検索要素及びワードの組を作
成データとする。指定項目の検索要素またはワード以外
で相関項目とされていない検索要素またはワードを相関
項目とし、同様に指定項目と相関項目の組を作成データ
とする。さらに指定項目とされていない検索要素または
ワードを指定項目とし、同様に相関項目を選定して作成
データを作成することにより特定型の作成データの作成
が完了する。次に相関データ作成方法では、作成データ
のうちある作成データを指定データとし、指定データの
相関件数から指定項目と相関項目との相関関係度を決定
(ランク分け)してその相関関係度(ランク)を明らか
にしたものを相関データとする。ここで相関関係度の決
定(ランク分け)は、相関件数によって判断するか、ま
たは通常検索要素毎の文書情報件数が偏っているため、
相関件数が多いからといって必ずしも相関関係が深いと
は限らずまた逆に相関件数が少ないからといって相関関
係が浅いとも限らないので、指定項目の全文書情報件数
に対する相関件数の割合等で決定してもよい。指定デー
タとされていない作成データを指定データとし、同様に
相関関係度を決定することにより相関データの作成が完
了する。ここで2検索要素間に関する特定型の相関デー
タ作成の具体例について説明する。第2図には、全ての
実施例での具体的な検索要素に用いる情報蓄積部6に蓄
積されている検索データ例で、(a)及び(c)は1観
点の分類体系の検索要素、(b)は多観点の分類体系の
検索要素、(d)はキーワードを示している。相関デー
タ作成命令により制御部15が情報検索部11から作成
部10へ入力した検索データは、第2図(a)〜(d)
の検索データであるとする。作成部10では、入力され
た検索要素のうち例えば分類体系2の検索要素である分
類Aaを指定項目とし、他の検索要素A,B,C,D,
Ab,Ac・・nを相関項目として、(Aa,A),
(Aa,B),・・,(Aa,n)の作成データを作成
する。制御部15はこれらの作成データを情報検索部1
1へ入力し、作成データの検索要素が付与検索データと
して付与されている相関件数を求める。第3図にはその
結果例を示している。作成部10は、相関件数から例え
ば分類Aaの全文書情報件数が207件で全文書情報件
数に対する相関件数の割合が60%以上の相関項目の検
索要素を指定項目の検索要素との相関関係度が大きいも
の(ランク1位のもの)として「☆」、割合が40%以
上のものを相関関係度がある程度大きいもの(ランク2
位のもの)として「○」、10%以下を相関関係度が小
さいもの(ランク4位のもの)として「×」とランク分
けを行うと、第3図のように分類Aaとその他の検索要
素との相関関係度が明らかとなる。同様に他の検索要素
を指定項目として分類体系1と分類体系2間の相関関係
度を明らかにした相関データを第4図に示す。次にワー
ドと検索データ間に関する特定型の相関データ作成の具
体例について説明する。情報検索部11から検索された
設定範囲内の文書情報を、ワード検出部21へ入力して
検出されたワードがaa,bb,・・,kkであるとす
る。ここで検出されたワードを指定項目とし、第2図
(b)の分類体系2の検索要素を相関項目として作成デ
ータを作成し、作成データ中の分類体系2の検索要素に
対応した文書情報を検索するとともに、検索された文書
情報の中からテキストサーチにより作成データ中のワー
ドが記載された相関件数を求める。ここでテキストサー
チ時に作成データ中のワードの同義語や類義語等をシソ
ーラス検索部14から求めておき、同義語や類義語等を
含めて相関件数を求めてもよい。さらに相関データに用
いるワードを統一するために同義語等をあるワードに統
一するようにしてもよい。求められた相関件数から2検
索要素間の相関データと同様にして求めた相関データを
第5図に示す。次に作成部10でのパターン型の作成デ
ータ作成方法例及び相関データ作成方法例について詳述
する。作成データ作成方法では、入力された検索要素及
びワードからなるすべての組み合わせパターンを作成す
ることにより作成データの作成が完了する。ここで入力
された検索要素が多観点の分類体系に属するものであれ
ば、特定の観点の検索要素を基に組み合わせパターンを
作成するように限定してもよい。次に相関データ作成方
法では、作成データ毎の相関件数の程度を明らかにした
ものを相関データとすることにより相関データの作成が
完了する。ここで相関件数の少ないパターンは、相関デ
ータとしての意味が低いので、ある程度相関件数の多い
パターン(以下「代表パターン」という)を相関データ
としてもよい。この場合相関件数が少なく代表パターン
とされなかったパターンに対応する相関件数は、そのパ
ターンの検索要素及びワードからなりかつそのパターン
に近似した代表パターンの相関件数とすることにより、
相関データ作成の設定範囲内にあるすべての文書情報が
必ずどれかの代表パターンに属するように相関データを
作成してもよい。以上で説明したパターン型の作成デー
タ及び相関データ作成は、実際にはパターン数が膨大と
なるため相関データ作成までに多くの時間がかかる。そ
こで次に2検索要素間の相関データを用いた効率的なパ
ターン型の作成データ及び相関データの作成方法例につ
いて説明する。最初にすでに説明した特定型の相関デー
タ作成方法により、2検索要素間の相関データを作成す
る。ここですでにこの2検索要素間の相関データが相関
蓄積部5に蓄積されている場合には、相関検出部9によ
りその相関データを相関蓄積部5から求める。作成また
は求められた相関データ中のある指定項目の検索要素を
基準の作成データとする。情報検索部11により求めた
作成データに対応した相関件数が第1の設定値より大き
い場合には、作成データ中の指定項目の検索要素と第1
のランクの相関関係度にある相関項目の検索要素を求
め、基準の作成データの検索要素を含み求められた相関
項目の検索要素からなるすべてのパターンを作成して新
たな作成データとし、相関件数が第1の設定値未満の作
成データはその作成データを代表パターンとする。新た
な作成データの各相関件数を求め、相関件数が第1の設
定値以上の作成データはさらに作成データ中の指定項目
の検索要素と第2のランクの相関関係度にある相関項目
の検索要素を求め、作成データ中の検索要素を含み求め
られた相関項目の検索要素からなるすべてのパターンを
作成して新たな作成データとする。ここで作成データ毎
の相関件数を求める場合に、作成データを含まれる検索
要素が多い順に配列しておき、配列下位の作成データの
相関件数には配列上位の作成データに属した文書情報を
除くようにしてもよい。さらに厳密に配列下位の相関件
数を求める場合には、配列下位の作成データの検索要素
すべてを含む第2の設定値以上の相関件数である配列上
位の作成データに属した文書情報を除くようにしてもよ
い。相関件数が第1の設定値未満で第2の設定値以上の
作成データはその作成データを代表パターンとする。文
書情報件数が第2の設定値未満の作成データは作成デー
タの検索要素数数が1に限り代表パターンとする。同様
にしてすべての作成データが代表パターンまたはその相
関件数が第1の設定値未満になるまでか、作成データ作
成時の相関関係度のランクがあるランクに達するまで新
たな作成データを作成し、代表パターンを求めていく。
相関データの指定項目の検索要素のうち、基準の作成デ
ータとされていない検索要素を基準の作成データとし
て、同様に代表パターンを求めることによって、2検索
要素間の相関データを用いて効率的に代表パターンを求
めることができ、相関データの作成が完了する。以上の
説明では、作成される相関データが検索要素からなる場
合について説明したが、検索要素とワードまたはワード
のみからなる相関データを作成する場合には、利用する
特定型の相関データは検索要素とワード間または2ワー
ド間の相関データとなる。ここで代表パターン作成の具
体例について説明する。設定条件として対象の検索デー
タを第2図(b)の検索データ、第1の設定値を45、
第二の設定値を40、相関データのランクを2位までと
する。相関データ作成命令により制御部15は相関検出
部9から検出した第4図の相関データを作成部10へ入
力する。作成部10では例えば分類Abを基準の作成デ
ータとする。作成データAbに対応した相関件数が第1
の設定値より大きい131件であったとすると、作成部
10はAbと相関関係度が第1のランクの検索要素であ
るBaとCaを相関データから求め、Abを含みBa及
びCaからすべての組[Ab,Ba,Ca],[Ab,
Ba],[Ab,Ca],[Ab]を作成して新たな作
成データとする。これらの作成データに対応した相関件
数を配列順位の高い作成データ(検索要素数の多い)順
に、配列下位の作成データの相関件数はその検索要素す
べてを含む第2の設定値以上の相関件数である配列上位
の作成データに属した文書情報を除くようにして情報検
索部11で求めた結果が第6図のパターン1の件数欄に
示されている。作成データ[Ab,Ba,Ca]及び
[Ab]の相関件数が第1の設定値より大きいので、相
関データから第2のランクの相関関係度の検索要素を求
めるとAa及びCaが求まるが、Caはすでに前段階で
選出されているので除く。そこで新たな作成データは、
Ab,Ba,Caを含みAaからなるすべての組[A
b,Ba,Ca,Aa],[Ab,Ba,Ca]と、A
bを含みAaからなるすべての組[Ab,Aa],[A
b]となる。前段階と同様に各作成データの相関件数を
求めると、第6図のパターン2の件数欄のようになる。
相関関係度のランクが2位に設定されているので、新た
な作成データの作成は終了する。その結果分類Abに関
する代表パターンは、[Ab,Ba,Ca]及び[A
b]となる。ここで各代表パターンにAbと相関関係度
の小さい検索要素を否定パターンとしてもよい。以下同
様にして各検索要素に関する代表パターン及び否定パタ
ーンを求めた結果を第7図に示す。次に作成部10での
混合型の作成データ作成方法例及び相関データ作成方法
例について詳述する。作成データ作成方法では、入力さ
れた検索要素及びワードからなるすべての組み合わせパ
ターンを作成する。ここですでにパターン型の相関デー
タが作成され相関蓄積部5に蓄積されている場合には、
相関検出部9よりその相関データを求めて作成部10へ
入力して利用してもよい。パターン(または代表パター
ン)のうちあるパターン(または代表パターン)を指定
項目とする。入力された検索要素及びワードのうちある
検索要素またはワードを相関項目とし、指定項目と相関
項目からからなる組を作成データとする。ここで指定項
目及び相関項目にはそれぞれパターン(または代表パタ
ーン)や検索要素及びワードからなる様々な組み合わせ
がとれる。相関項目とされていない入力された検索要素
またはワードを相関項目とし、同様に指定項目と相関項
目からなる組を作成データとする。さらに指定項目とさ
れていないパターン(または代表パターン)を指定項目
とし、同様に相関項目を選定して作成データを作成する
ことにより混合型の作成データの作成が完了する。次に
相関データ作成方法では、混合型の相関データ作成は特
定型と同様にして作成データ中の指定項目と相関項目と
の相関関係度を決定(ランク分け)することにより、相
関データを作成することができる。ここでパターン型及
び混合型の相関データによる代表パターン毎の文書情報
検索を簡易にするために、代表パターン作成時に付与・
修正部12により文書情報にその文書情報が属する代表
パターンに対応した検索要素を付与しておいてもよい。
ここで混合型の相関データ作成の具体例について説明す
る。相関データ作成命令により制御部15は、情報検索
部11から検出した第2図(a)及び(b)の検索デー
タと相関検出部9から検出した第7図の相関データを作
成部10へ入力する。作成部10では入力された相関デ
ータのうち例えば代表パターン[Aa,Ba,Ca]を
指定項目とし他の検索要素A,B,C,D,Ab,Ac
・・Ccを相関項目として、(Aa,Ba,Ca,
A),(Aa,Ba,Ca,B),・・,(Aa,B
a,Ca,Cc)の作成データを作成する。制御部15
はこれらの作成データを情報検索部11へ入力し、作成
データの検索要素が付与検索データとして付与されてい
る相関件数を求める。同様にして他の代表パターンを指
定項目とし、分類体系1及び2の検索要素を相関項目と
して求めた相関データの結果を第8図に示す。また9図
には情報検索部11から検索さらた設定範囲内の文書情
報をワード検出部21へ入力して検出されたワード(図
中の指定項目のaa,bb,・・・,kk)により求め
た代表パターンに検索データとの相関関係を求めて作成
したワードと検索データ間に関する混合型の相関データ
を表わしている。次に相関蓄積部5に複数の相関データ
が蓄積されている場合に、相関検出部9に入力された設
定データ、検索データ、ワードから最適の相関データを
検出する方法について説明する。最初に相関検出部9へ
利用する相関データに関する設定データや検索データ、
ワード等を入力する。入力された設定データ中に相関デ
ータを選択する選択データが存在している場合には、そ
の選択データで選択された相関データを相関蓄積部5か
ら検出する。設定データが入力されていない場合や設定
データ内に選択データが含まれていない場合には、入力
された検索データ、ワード等がデータ内に存在する相関
データを検出する。ここで検出された相関データが1つ
の場合は、検出された相関データを最適の相関データと
する。検出された相関データが複数の場合には、各相関
データの最適度を推測し最適度に応じた重み付け値を各
相関データに付加する。最適度の推測は、例えば相関デ
ータに含まれている入力された検索要素数、ワード数を
単に加算した数値を重み付け値として付加し、重み付け
値に応じて検出された相関データを配列し、ある配列順
位や重み付け値までの相関データを最適の相関データと
決定することにより、相関データの自動検出が完了す
る。ここで特定の検索要素やワードが含まれている相関
データを優先するためにそれらの検索要素やワードの重
み付け値を他の検索要素やワードより大きな値に設定し
ておいてもよい。第1の実施例は、文書情報に記載され
ているワードによってその文書情報に記載されている内
容から判断される検索データを自動的に推測して付与す
る装置に関する。ここで検索データの自動付与方法の基
本原理について述べる。文書情報に付与される検索デー
タには、分類等のように文書情報に記載されている内容
から判断されるものと、キーワード等のように文書情報
に記載されているワード自体からなるものとがある。文
書情報に記載されている内容は、文書情報に記載されて
いるワードの組み合わせから判断できる可能性が高いの
で、文書情報に記載されているワードの組み合わせと検
索データとの相関関係を求めることにより、最も適切と
推測される検索データを求めることが可能となる。次に
この装置の付与動作例について説明する。最初に制御部
15は入力装置1または情報蓄積部6から入力された文
書情報をワード検出部21へ入力する。ワード検出部2
1は、入力された文書情報に記載されているワードを形
態素解析などにより取り出し、ワードリストを作成す
る。制御部15は作成されたワードリストを推測部17
へ入力し、さらに蓄積型の相関データを用いる場合には
ワードリストを相関検出部9へ入力し、逐次型の相関デ
ータを用いる場合にはワードリスト及び情報検索部11
より求めた付与対象となる範囲の検索データを作成部1
0へ入力する。蓄積型の相関データを用いる場合には相
関検出部9は、ワードリストのワードを含む相関データ
を相関蓄積部5から検出し、制御部15は検出した相関
データを推測部17へ入力する。逐次型の相関データを
用いる場合には作成部10は、ワードリストのワードと
検索データから作成データを作成し、情報検索部11で
作成データに対応する文書情報件数を求めることにより
相関データを作成し、制御部15は作成した相関データ
を推測部17へ入力する。推測部17は、ワードリスト
のワードと相関データから入力された文書情報に付与す
べき検索データを推測する。ここで第2の実施例によ
り、推測された検索データを検索データ間の相関データ
を用いて修正し、修正後の検索データを推測された検索
データとしてもよい。制御部15は推測された検索デー
タを付与・修正部12へ入力する。付与・修正部12
は、入力された検索データを対応する文書情報の付与検
索データとして情報蓄積部6へ入力することにより、文
書情報の検索データ自動付与が完了する。ここで推測さ
れた検索データは、付与・修正部12で自動付与せず
に、出力装置4に出力してもよい。次にワード検出部2
1のワードリスト作成例について説明する。ここで作成
するワードリストのワードは、シソーラス部8の見出し
ワードに限るものとする。制御部15は、ワード検出部
21が入力された文書情報から1語ワードを検出する毎
に検出されたワードをシソーラス検索部14へ入力す
る。制御部15は、シソーラス検索部14に入力された
ワードが見出しワードに存在しているかを調べさせ、そ
の結果をワード検出部21へ入力する。ワード検出部2
1は、検出したワードがシソーラス部8の見出しワード
に存在しかつワードリストのワードとして登録されてい
ない場合、その検出したワードをワードリストに登録す
る。ここで検出したワードの同義語がすでにワードリス
トに登録されてい場合には、そのワードは登録しなくて
もよく、さらに同義語に対してシソーラス部8に統一語
が登録されている場合には、ワードリストのワードは統
一語に統一してもよい。またワードリストに登録された
ワードには、同一ワードが検出される毎に出現数として
カウント値1を付加してもよく、さらにカウント値が設
定値より大きい値のワードのみをワードリストのワード
としてもよい。以上のようにして入力された文書情報に
記載されているワードからのワードリスト作成が完了す
る。ここでワード検出部21でのワードリスト作成の具
体例について説明する。第10図(a)には、ワード検
出部21へ入力された文書情報例が記載されており、シ
ソーラス部8には第10図(b)のように技術用語の見
出しワードとその見出しワードに関する上位概念語、同
義語、下位概念語等が蓄積されているとする。ワード検
出部21では最初に「エンジン」というワードを検出す
る。以下一般化するために各ワードをその下線に示した
記号で説明する。「エンジン」つまりabというワード
がシソーラス部8の見出しワードに存在するかをシソー
ラス検索部14により確認する。シソーラス部8には第
10図(b)から分かるようにabというワードが見出
しワードに存在するので、シソーラス部8はabという
見出しワードに対応する統一語aaをワード検出部21
へ入力する。ワード検出部21は、aaがワードリスト
に登録されていないので、aaをワードリスト上に登録
しカウント値「1」を付加する。同様にして検出された
ワードをシソーラス検索部14において確認を取り、検
出されたワードに対応する統一語をワードリストへ登録
することにより第10図(c)に示されたワードリスト
が作成される。ここでカウント値Aは同一の統一語が検
出された個数を表わし、カウント値Bは上位概念の統一
語に下位概念の統一語の出現数を含めた個数を表わして
いる。次に推測部17でのワードと検索データ間の相関
データによる推測方法例を第11図のフローチャートを
用いて詳述する。最初に入力された相関データのうちワ
ードリストのワードを含むある指定項目または相関項目
を指定データとする(図中2)。ここで代表パターンか
らなる相関データを用いる場合、指定データにはワード
リストのワードの組に近似した代表パターンに限定して
もよい。指定データに対応した相関項目または指定項目
中の検索要素に、指定データとの相関関係度に応じた重
み付け値を付加する(図中3)。付加される重み付け値
は、指定データのワードリストのワードの組への近似値
も対応させてよい。パターン型の相関データを用いる場
合には、ワードリストのワードを含むパターン(または
代表パターン)を指定データとし、指定データ内の検索
要素に相関件数やワードリストのワードの組ヘの近似値
に応じた重み付け値を付加する。またワードリストのワ
ードに出現数のカウント値が付与されている場合には、
検索要素にワードのカンウト値に対応した重み付け値を
さらに付加してもよい。このようにしてまだ指定データ
とされていない指定項目または相関項目を指定データと
して、同様に検索要素への重み付け値付加を行う。検索
要素の重み付け値の総計を求め(図中5)、総計値が設
定値より大きい検索要素を取り出し(図中6)、取り出
された検索要素を総計値の大きい順に配列することによ
り、検索データの推測が完了する。ここで推測部17に
よる具体的推測方法例について説明する。推測部17へ
は第9図の相関データと第10図(c)のワードリスト
が入力されたとする。ワードリスト中のワードのうちカ
ウント値Bが2以上のワードの集合と相関データの各指
定項目との近似値を求めると第12図(a)の近似値欄
のようになる。ここで近似値を例えば、 N*N/(X*Y)*10 の整数部とする。Xはワードの集合のワード数、Yは指
定項目中のワード数、Nは指定項目中に含まれるワード
の集合のワード数である。指定データには近似値が6以
上の代表パターンに限定すると、代表パターン[aa,
bb,ii]が指定データとなる。ここで付加する重み
付け値は、近似値に相関関係度に対応した値を乗算した
ものとする。また相関関係度に対応した値は、相関関係
度順に「+2」、「+1」、「0」、「−1」と設定す
る。相関データから指定データに対応する相関項目の検
索要素を求めると、分類Aa,Ab,・・,Ccが求ま
り、これらの検索要素に重み付け値を付加すると第12
図(b)の重み付け値欄のようになる。指定データが1
つなので重み付け値が各検索要素の総計値となり、第1
2図(c)のように適格度を設定し適格度3位以上を付
与すべき検索データとすると、検索データの推測結果は
第12図(d)となる。ここで指定データが複数ある場
合には、各検索要素に付加された重み付け値の平均をと
るようにする。第2の実施例は、文書情報に付与された
検索データ(付与検索データ)を効率的に修正する装置
に関する。修正される付与検索データには、誤って付与
された検索データ(以下「誤り修正データ」という)と
付与する必要があるにもかかわらず付与されなかった検
索データ(以下「付与修正データ」という)とがある。
また修正方法の形態には、検索データ毎に行う集団型と
文書情報毎に行う個別型がある。集団型修正方法の基本
原理は、検索データ間の相関関係から特定の検索データ
と相関関係度の小さい他の検索データを誤り修正データ
とし、特定の検索データと誤り修正データの検索データ
とが共に付与検索データとされている文書情報を求め、
そして特定の検索データと相関関係度が大きい検索デー
タを付与修正データとし、特定の検索データが付与検索
データとされている文書情報から付与修正データの検索
データが付与検索データとされていない文書情報を求め
るものである。個別型修正方法の基本原理は、文書情報
の付与検索データ中に他の検索データと相関関係度の小
さい検索データを誤り修正データとし、付与検索データ
以外の検索データのうち付与検索データと相関関係度の
大きい検索データを付与修正データとするものである。
次にこの装置による集団型の修正動作例について説明す
る。最初に修正命令と修正範囲データを入力装置1へ入
力する。制御部15は修正命令を受けると、蓄積型の相
関データを用いる場合には修正範囲データに対応する相
関データを相関検出部9により相関蓄積部5から求めさ
せ、逐次型の相関データを用いる場合には情報検索部1
1により情報蓄積部6から求めた修正範囲データに対応
する検索データを作成部10へ入力して相関データを求
めさせ、求めた相関データを推測部17へ入力する。推
測部17は、入力された相関データから誤り修正データ
と付与修正データを推測する。制御部15は、推測結果
を情報検索部11へ入力して誤り修正データ及び付与修
正データに対応する文書情報を検索させる。制御部15
は検索結果及び推測結果を付与・修正部12へ入力して
該当する文書情報の付与検索データを修正するか出力装
置4に出力することにより検索データの修正が完了す
る。次に推測部17での集団型による推測方法例を第1
3図のフローチャートを用いて詳述する。最初に入力さ
れた相関データのうちある指定項目(パターン型の相関
データではパターンまたは代表パターン)を指定データ
とする(図中2)。指定データと相関項目の検索データ
との相関関係度を相関データから求め、相関項目の検索
データに相関関係度に応じた重み付け値を付加する(図
中3)。ここで指定データは指定項目に限らず相関項目
でもよい。またパターン型の相関データを用いる場合に
は、指定データに対応した否定パターン中の検索データ
に否定パターンに対応した重み付け値を付加し、指定デ
ータに近似したパターンまたは代表パターン中に含まれ
る指定データ中の検索データ以外の検索データにそのパ
ターンまたは代表パターンの指定データへの近似値に対
応した重み付け値を付加する。後者の重み付け付加は、
混合型の相関データにも利用できる。重み付け値が第1
の設定値より小さい検索データを誤り修正データとし、
第2の設定値より大きい検索データを付与修正データと
して求める。指定データとその誤り修正データ及び指定
データとその付与修正データとで修正データを構成する
(図中4,5)。また共通の誤り修正データを持つ指定
データを組にしたり、共通の付与修正データを持つ指定
データを組にして修正データを構成してもよい。ここで
推測結果の誤り修正データ及び付与修正データは、重み
付け値の総計値によって配列しておいてもよい。指定デ
ータとされていない指定項目が存在している場合には、
その指定項目を指定データとして同様に誤り修正データ
及び付与修正データを求める。以上の結果誤って付与さ
れた可能性の高い検索データと、付与する必要があるに
もかかわらず付与されなかった可能性の高い検索データ
が明らかにされた。次に集団型の修正動作の具体例につ
いて述べる。例えば修正範囲データにより、相関検出部
9から推測部17へ入力された相関データが第8図の混
合型の相関データであったとする。代表パターン[B
a,Ca]が指定データになったとする。相関データか
ら分類体系2の検索データへの重み付け値Aは、第14
図(a)のようになる。さらに指定データ中の検索デー
タを含みかつ指定データ以外の検索データを含む代表パ
ターンを求め、求められた代表パターン中の指定データ
以外の検索データに求められた代表パターンの指定デー
タへの近似値を重み付け値Bとして付加すると、第14
図(b)のようになる。ここで近似値を例えば、 N*N/(X*Y)*10 の整数部に設定するとする。Xは指定データ中の検索デ
ータ数、Yは代表パターン中の検索データ数、Nは代表
パターンに含まれる指定データ中の検索データ数であ
る。第14図(a)の検索データの重み付け値Aに第1
4図(b)の重み付け値Bを加算し重み付け値の総計を
求め、第1の設定値を3とし第2の設定値を−1とし、
重み付け値に応じて検索データを配列すると、代表パタ
ーン[Ba,Ca]の誤り修正データ及び付与修正デー
タは第14図(d)のようになる。情報検索部11へは
第14図(d)の修正データが入力され、誤り修正デー
タ及び付与修正データに対応した文書情報が検索され、
検索された文書情報には誤り修正データ及び付与修正デ
ータが付与されて出力装置4に出力されるので、文書情
報毎に誤って付与された検索データと、付与する必要が
あるにもかかわらず付与されなかった検索データとが明
らかにされる。ここで誤り修正データ及び付与修正デー
タに重み付け値の総計値によって第1の実施例のように
適格度を付加してもよい。次にこの装置による個別型の
修正動作例について説明する。最初に修正命令と修正範
囲データを入力装置1へ入力する。制御部15は修正命
令を受けると、情報検索部11に情報蓄積部6から修正
範囲データに対応する文書情報を求めさせ、その文書情
報の付与検索データを推測部17と相関検出部9または
作成部10へ入力する。蓄積型の相関データを用いる場
合には、相関検出部9は入力された付与検索データに対
応する相関データを相関蓄積部5から求めさせる。逐次
型の相関データを用いる場合には、情報検索部11によ
り情報蓄積部6から求めさせた文書情報の付与検索デー
タが属する体系の検索データを作成部10へ入力して相
関データを求めさせ、求めた相関データを推測部17へ
入力する。推測部17は、入力された相関データから文
書情報毎の誤り修正データと付与修正データを推測す
る。制御部15は推測結果を付与・修正部12へ入力し
て該当する文書情報の付与検索データを修正するか出力
装置4へ出力することにより文書情報毎の検索データの
修正を完了する。次に推測部17での個別型による推測
方法例を第15図のフローチャートを用いて詳述する。
最初に入力された文書情報毎の付与検索データのうちあ
る付与検索データを特定データとする(図中2)。特定
データの検索データを含む相関データ中のある指定項目
(パターン型の相関データではパターンまたは代表パタ
ーン)を指定データとする(図中3)。ここで指定デー
タは、指定項目に限定されるものでなく相関項目も含め
てよい。指定データと指定データ以外の特定データ中の
検索データとの相関関係度を相関データから求め、その
特定データ中の検索データに相関関係度に対応した重み
付け値を付加する(図中4)。また指定データと特定デ
ータ以外の検索データとの相関関係度を相関データから
求め、その特定データ以外の検索データに相関関係度に
対応した重み付け値を付加する(図中5)。パターン型
の相関データを用いる場合には、指定データに対応する
否定パターン中の指定データ以外の特定データ中の検索
データに否定パターンに対応した重み付け値を付加し、
また指定データ中の特定データ以外の検索データに指定
データの特定データへの近似値に対応した重み付け値を
付加する。ここで後者の重み付け値付加は混合型におい
ても利用できる。指定データとされていない相関データ
中の指定項目が存在している場合には、その指定項目を
指定データとして同様に重み付け付加を行う。重み付け
値の付加された検索データの重み付け値を総計し、重み
付け値が第1の設定値より小さい特定データ中の検索デ
ータを誤り修正データとし(図中7)、重み付け値が第
2の設定値より大きい特定データ以外の検索データを付
与修正データとる(図中8)。特定データとされていな
い入力された文書情報の付与検索データを特定データと
し、同様に誤り修正データ及び付与修正データを作成す
る。ここで推測結果の誤り修正データ及び付与修正デー
タは、重み付け値の総計値によって配列しておいてもよ
い。以上の結果文書情報毎に誤って付与された可能性の
高い検索データと、付与する必要があるにもかかわらず
付与されなかった可能性の高い検索データが明らかにさ
れる。次に個別型の修正動作の具体例について述べる。
例えば修正範囲データにより、相関検出部9から推測部
17へ入力された相関データが第8図の混合型の相関デ
ータであり、また情報検索部11から推測部17へ入力
された文書情報の付与検索データが[Ab,Bb,C
a]であったとする。ここで推測に利用する代表パター
ンは近似値が3以上の代表パターンに限定するとする。
ここで近似値を例えば、 N*N/(X*Y)*10 の整数部に設定する。Xは特定データ中の検索要素数、
Yは指定データ中の検索要素数、Nは指定データ中に含
まれる特定データ中の検索要素数である。付与検索デー
タの検索要素を含む代表パターン[Ab,Ba,Ca]
を指定データとすると、指定データの特定データへの近
似値は4となり、代表パターン[Ab,Ba,Ca]と
分類体系2の検索データとの相関関係度を求めて近似値
に対応した重み付け値付加を行うと第16図(b)の重
み付け値A欄のようになる。さらに代表パターン[A
b,Ba,Ca]は特定データ以外の検索データを含む
ので、その検索データに近似値を重み付け値として付加
すると第16図(c)の重み付け値B欄のようになる。
同様に近似値が3以上の代表パターンに関して分類体系
2の検索データとの相関関係度を求めて重み付け値付加
を行い、各検索データの重み付け値を総計すると第16
図(d)のようになる。第1の設定値を−4、第2の設
定値を4とすると誤り修正データ及び付与修正データは
第16図(e)のようになる。付与・修正部12へは、
文書情報と第16図(e)の誤り修正データ及び付与修
正データが入力され、文書情報の付与検索データ[A
b,Bb,Ca]を[Aa,Ab,Ca]と修正するこ
とにより付与検索データの修正が完了する。ここで適格
度を設定しておき各修正データを重み付け値の総計値に
よって適格度の付与と適格度順の配列を行って出力装置
4へ出力してもよい。次に付与検索データ修正の確認方
法について説明する。確認方法には、第1の実施例の検
索データ付与を用いる方法と、第3の実施例の検索デー
タ変換によるものとがある。前記第1の実施例の検索デ
ータ付与を用いる方法では、修正結果から修正が必要と
された文書情報をワード検出部21へ入力し、文書情報
毎にワードリストを作成し、各文書情報に付与すべき検
索データを求める。誤り修正データとされた検索要素の
うち記載ワードから付与検索データとして求められた検
索要素は誤り修正データから削除し、付与修正データと
された検索要素のうち記載ワードから付与検索データと
して求められた検索要素に含まれないものは付与修正デ
ータから削除する。以上の結果まだ修正を必要とする文
書情報を修正結果とする。ここで修正データに重み付け
値または適格度が付加され、記載ワードから付与検索デ
ータとして求められた検索データに重み付け値または適
格度が付加されている場合には、両者の重み付け値また
は適格度を加算等して重み付け値または適格度の修正を
行い、その修正された重み付け値または適格度により、
修正が必要とする文書情報を決定し適格度付加及び配列
を行ってもよい。第3の実施例の検索データ変換を用い
る方法では、修正結果から修正が必要とされた文書情報
に他の体系に属する検索データがすでに付与されている
場合、付与されている他の体系に属する検索データを修
正を行っている検索データの体系に変換する。誤り修正
データとされた検索要素のうち変換された検索データ内
にも含まれるものは修正データから削除し、付与修正デ
ータとされた検索要素のうち変換された検索データ内に
含まれないものは修正データから削除する。以上の結果
まだ修正を必要とする文書情報を修正結果とする。ここ
で前記第1の実施例を用いる方法と同様変換された検索
データに重み付け値または適格度が付加されている場合
には、修正結果の重み付け値または適格度の修正を行い
修正が必要とする文書情報を決定し適格度付加及び配列
を行ってもよい。相関データを相関蓄積部5に蓄積して
いる場合には、検索データ修正時または修正後定期的に
相関データの修正を行ってもよい。さらにすでに検索デ
ータの修正を行った文書情報には、検索データとして修
正済みのデータを付与しておき以降の修正では除外され
るようにしてもよい。第3の実施例は、ある体系に属す
る検索データを他の体系に属する検索データに自動的に
変換する装置に関する。変換の方法の形態には、検索デ
ータ毎に変換を行う一括変換型と、各文書情報に付与さ
れている検索データ毎に変換を行う個別変換型とがあ
る。一括変換型変換方法の基本原理は、変換対象の検索
データと相関関係度の大きい変換先の検索データを変換
された検索データとするものである。個別変換型変換方
法の基本原理は、文書情報に付与されている検索データ
と総合的に相関関係度が大きい変換先の検索データを変
換された検索データとするものである。次にこの装置に
よる変換動作例について説明する。最初に入力装置1か
ら変換命令と変換先の検索データに関する変換対象デー
タ及び一括変換型では変換される検索データ、個別変換
型では変換される文書情報の検索データが入力される。
制御部15は変換命令を受けると、蓄積型の相関データ
を用いる場合には相関検出部9に相関蓄積部5から変換
される検索データと変換対象データに関する相関データ
を求めさ、逐次型の相関データを用いる場合には情報検
索部11に情報蓄積部6から変換対象データに関する検
索データを求めさせ、変換される検索データと求められ
た検索データを作成部10へ入力して相関データを求め
させる。変換される検索データ及び求められた相関デー
タを推測部17へ入力する。推測部17は、入力された
相関データにより変換される検索データに対応した変換
先の検索データを変換データとして推測する。制御部1
5は変換データを出力装置4へ出力することにより変換
が完了する。ここで推測部17での一括変換型の推測方
法例を第17図のフローチャートを用いて詳述する。最
初に入力された相関データのうち、変換される検索デー
タの検索要素を含むある指定項目を指定データとする
(図中2)。指定データと変換先の検索データとの相関
関係度を相関データから求め、変換先の検索データに相
関関係度に対応した重み付け値を付加する(図中3)。
ここで検索データが複数の検索要素からなり、指定デー
タも複数の検索要素から構成されている場合には、付加
する重み付け値は指定データの変換される検索データへ
の近似値を考慮した値としてもよい。またパターン型の
相関データを用いる場合には、変換される検索データ及
び変換先の検索データを含むパターン(または代表パタ
ーン)を指定データとし、指定データ内の変換先の検索
データに指定データの相関件数や指定データの変換され
る検索データへの近似値に対応した重み付け値を付加す
る。指定データとされていない指定項目を指定データと
し、同様に変換先の検索データに指定データへの相関関
係度に対応した重み付け値を付加する。以上は変換され
る検索データが指定項目に存在する相関データについて
の重み付けを述べたが、これに限らず相関項目に変換さ
れる検索データが存在する場合には、相関項目を指定デ
ータとして変換先の検索データに相関関係度に対応した
重み付け値を付加してもよい。次に変換先の検索データ
の重み付け値を総計し(図中5)、総計された重み付け
値が第1の設定値以上の検索データを取り出し、重み付
け値に応じて配列し変換データとすることにより、検索
データの変換が完了する。ここで推測部17での個別型
の推測方法例を第18図のフローチャートを用いて詳述
する。最初に入力された文書情報のうちある文書情報の
付与検索データを特定データとする(図中2)。特定デ
ータ中の検索要素を含む相関データ中のある指定項目を
指定データとする(図中3)。指定データと変換先の検
索データとの相関関係度を相関データから求め、変換先
の検索データに相関関係度に対応した重み付け値を付加
する(図中4)。付加する重み付け値には、指定データ
の特定データへの近似値を考慮した値を含めてもよい。
パターン型の相関データを用いる場合には、特定データ
及び変換先の検索データを含むパターン(または代表パ
ターン)を指定データとし、指定データ内の変換先の検
索データに指定データの相関件数や指定データの特定デ
ータへの近似値に対応した重み付け値を付加する。特定
データ中の検索要素を含み指定データとされていない指
定項目を指定データとし、同様に指定データと変換先の
検索データとの相関関係度を相関データから求め、変換
先の検索データに相関関係度に対応した重み付け値を付
加する。以上は変換される検索データが指定項目に存在
する相関データでの重み付けを述べたが、これに限らず
相関項目に変換される検索データが存在する場合には、
相関項目を指定データとして指定項目の変換先の検索デ
ータに相関関係度に対応した重み付け値を付加する。次
に変換先の検索データの重み付け値を総計し(図中
6)、総計された重み付け値が第1の設定値以上の検索
データを取り出し、重み付け値に応じて配列し変換デー
タとする。入力された文書情報のうち特定データとされ
ていない文書情報の付与検索データを特定データし、同
様にして変換データを作成することにより検索データの
変換が完了する。次に個別型の推測方法の具体例につい
て説明する。文書情報の付与検索データが分類体系2の
分類Ba,Caであり、変換先の検索データが分類体系
1の分類とする。推測部17へは、分類Ba,Ca及び
第8図の分類体系2と分類体系1の相関データが入力さ
れる。分類Ba,Caが特定データとなりこの特定デー
タを含む指定項目の代表パターンを指定データとし、各
指定データの特定データへの近似値をXは特定データ中
の検索要素数、Yは指定データ中の検索要素数、Nは指
定データ中に含まれる特定データ中の検索要素数として
例えば、 N*N/(X*Y)*10 の整数部に設定すると第19図(a)のようになる。こ
こで指定データは特定データのすべての検索要素を含む
ものに限定してもよい。各指定データの特定データへの
近似値も同図に示されている。近似値が5以上の代表パ
ターンに限定し、分類体系1の検索データへの重み付け
値を相関関係度に対応した値に近似値を乗算した値とす
ると、付加される重み付け値は第19図(b)のように
なる。第1の設定値を1とすると、変換データは第19
図(c)の分類C及びDとなる。ここで適格度を設定し
ておき各変換データを重み付け値の総計値によって適格
度の付与と適格度順の配列を行ってもよい。一括変換型
及び個別型の推測動作に於いて、入力された相関データ
が複数の場合には、ある相関データにより重み付け値を
付加された検索データに他の相関データによる重み付け
値を加算する等により、複数の相関データによる推測を
行なうことも可能である。変換された検索データの補正
方法例について説明する。補正方法には、第1の実施例
の検索データ付与を用いる方法と、第2の実施例の検索
データ修正によるものとがある。前記第1の実施例の検
索データ付与を用いる方法は、文書情報の付与検索デー
タを変換先の検索データに変換する場合に有効である。
変換対象の文書情報をワード検出部21へ入力し、文書
情報毎にワードリストを作成し、各文書情報に付与すべ
き変換先の体系に属する検索データを求める。第3の実
施例で求められた検索データの重み付け値に第1の実施
例で求められた検索データの重み付け値を加算して平均
値を求め、その平均値を補正された重み付け値総計とし
て変換された検索データを決定する。前記第2の実施例
の検索データ修正を用いる方法は、変換された検索デー
タが多観点の分類のように複数の検索データからなる場
合に有効である。変換された検索データの各検索要素に
変換された検索データ中の他の検索要素との相関関係度
による重み付け値を求め、第3の実施例で求められた検
索要素の重み付け値に第2の実施例で求められた検索要
素の重み付け値を加算して平均値を求め、その平均値を
補正された重み付け値総計として変換された検索データ
を決定する。第4の実施例は、検索式により検索された
文書情報の中から必要度の高い文書情報を効率的に検索
する装置に関する。効率的検索方法の形態には、検索式
から必要度に対応した検索式を新たに構成して検索を行
う事前型と検索式によって検索された文書情報を文書情
報毎の必要度に対応して配列する事後型がある。ここで
検索式及び検索式に用いる論理記号について説明する。
検索式の要素は検索データの検索要素やワードであり、
要素間の関係は論理積の「*」、論理和の「+」、論理
否定の「−」、及び( )等の演算子で示され演算子の
優先順序は例えば、 ( ,)> * > +,− として定義される。また検索要素をAijとすると一般
に検索式Kは、 K=Σ(±)(A1j*A2j*・・*Anj) と表すことができ、この式を展開すると K=(±){A11*A21*・・*An1}(±){A12*A22* ・・*An2}・・ (±){A1m*A2m*・・*Anm} となることから、検索式は検索要素または検索要素を論
理積で結合した組からなる論理和集合及び論理否定集合
に展開できる。次にこの装置による事前型の検索動作例
を説明する。最初に検索式を入力装置1へ入力する。制
御部15は入力された検索式を解析部16へ入力して検
索式を解析させ、解析結果を推測部17へ入力する。解
析結果は検索式を展開したものと検索式に含まれる検索
要素及びワードを明らかにしたものから構成されてい
る。また制御部15は蓄積型の相関データを用いる場合
には解析結果を相関検出部9へ入力して相関蓄積部5か
ら解析結果の検索データ及びワードに対応する相関デー
タを求めさせ、逐次型の相関データを用いる場合には解
析結果を情報検索部11へ入力して情報蓄積部6から求
めさせた解析結果の検索データが属する体系の検索デー
タを作成部10へ入力し相関データを求めさせ、求めた
相関データを推測部17へ入力する。推測部17では、
入力された解析結果及び相関データから検索式構成のた
めの構成データを推測する。制御部15は、推測結果を
構成部20へ入力して新たな検索式を構成させる。制御
部15は新たな検索式を情報検索部11に入力して文書
情報の検索を行い、検索結果を出力装置4へ出力するこ
とにより検索を完了する。次にこの装置による事後型の
検索動作例を説明する。最初に検索式を入力装置1へ入
力する。制御部15は入力された検索式を情報検索部1
1及び解析部16へ入力し、情報検索部11に情報蓄積
部6から検索式による文書情報及びその付与検索データ
を求めさせ、解析部16に検索式を解析させる。解析結
果は検索式を展開したものと検索式に含まれる検索要素
及びワードを明らかにしたもの等から構成されている。
制御部15は解析結果と検索式により検索された文書情
報毎の付与検索データを推測部17へ入力する。また制
御部15は、蓄積型の相関データを用いる場合には相関
検出部9に相関蓄積部5から解析結果の検索データ及び
ワードに対応する相関データを求めさ、逐次型の相関デ
ータを用いる場合には検索式による検索された文書情報
をワード検出部21へ入力して検出させたワード及び情
報検索部11で求められた検索式による文書情報の付与
検索データ及び解析結果の検索データを作成部10へ入
力して相関データを求めさせ、求められた相関データを
推測部17へ入力する。推測部17では、入力された解
析結果及び相関データから配列データを推測する。制御
部15は、推測結果及び検索された文書情報を配列部1
8へ入力して文書情報を配列させ、配列結果を出力装置
4へ出力することにより検索を完了する。次に推測部1
7での基本的推測方法及び推測方法例について述べる。
推測方法1は、論理和集合中の検索要素またはワードの
多くを検索データとして付与またはワードとして記載さ
れている文書情報ほど必要度が高いと推測する方法であ
る。ここで推測方法1の推測方法例について詳述する。
最初にすべての論理和集合の検索要素及びワードの集合
を第1ランクの推測データとする。次に第1ランクの構
成データから一つの論理和集合を除いたすべての検索要
素及びワードの集合を第2ランクの推測データとする。
以下同様に第Nランクの推測データを作成する場合には
第1ランクの推測データからあるN−1つの論理和集合
を除くようにする。ここで作成した推測データがすでに
作成した推測データと同じ場合にはその推測データを除
いてもよい。またさらに厳密に推測データを作成する場
合には、次のランクの推測データを作成するときに一つ
の論理和集合すべての検索要素及びワードを除かず、部
分的に検索要素及びワードを除くようにしてランクを細
分化して構成してもよい。構成データは推測データと論
理和集合及び論理否定集合で構成し、配列データは推測
データで構成することにより構成データ及び配列データ
の推測が完了する。推測方法2は、論理和集合の検索要
素及びワードと相関関係度の大きい検索要素及びワード
が付与または記載されている文書情報ほど必要度が高い
と推測する方法である。ここで第20図のフローチャー
トを用いて推測方法2の推測方法例について詳述する。
最初に入力された解析結果のうち、ある論理和集合を特
定データとする(図中2)。入力された相関データのう
ち特定データ中の検索要素またはワードを含むある指定
項目を指定データとする(図中3)。パターン型の相関
データでは指定データは特定データ中の検索要素及びワ
ードを含むあるパターン(または代表パターン)とな
る。指定データと非構成要素(検索式を構成していない
検索要素、ワード、パターン等)との相関関係度を求
め、相関関係度に応じて重み付け値を非構成要素に付加
する(図中4)。パターン型の相関データを用いる場合
には、指定データに対応した否定パターン中の非構成要
素に否定パターンに対応した重み付け値を付加し、指定
データ中の非構成要素に特定データの指定データへの近
似値に対応した重み付け値を付加する。この後者の重み
付け値付加は混合型においても利用できる。指定データ
とされていない指定項目を指定データとし、同様にして
非構成要素への重み付け値付加を行う。特定データとさ
れていない解析結果中の論理和集合を特定データとし、
同様に指定データを選定して非構成要素への重み付け値
付加を行う。次に非構成要素の重み付け値を総計する
(図中7)。総計された重み付け値の大きさに応じてラ
ンク分けされた非構成要素を推測データとする(図中
8)。構成データは推測データと論理和集合及び論理否
定集合で構成し、配列データは推測データで構成するこ
とにより構成データ及び配列データの推測が完了する。
次に推測方法2による推測データ作成の具体例について
説明する。入力された検索式が、 Ab(Ca−Cc)+Bb であったとすと解析部16により論理和集合としてBb
とAb*Ca、論理否定集合としてAb*Ccが求ま
る。推測部17へは、上記の解析結果と第8図の相関デ
ータとが入力されたとする。そこでBbを特定データと
して、代表パターン[Ba,Bb,Cc]を指定データ
に選定する。指定データに対応した非構成要素は、A
a,Ac,Bc,Cbであり、これらの非構成要素に第
8図の相関関係度が「☆」、「○」、「 」、「×」に
応じ重み付け値を「+2」、「+1」、「0」、「−
1」と付加するとすると第21図(a)の非構成要素の
重み付け値欄のようになる。またNを指定データ中の特
定データの検索要素数、Xを特定データの検索要素数、
Yを指定データの検索要素数とし、近似値を例えば、 N*N/(X*Y)*10 の整数部に設定する。指定データ中の非構成要素はBa
であり、この非構成要素に指定データの特定データへの
近似値を重み付け値として付加すると、第21図(a)
の非構成要素の重み付け値欄のようになる。特定データ
の検索要素を含む他の代表パターンを指定データとして
同様に非構成要素への重み付け値付加を行い、各非構成
要素への重み付け値を合計すると第21図(a)の重み
付け値合計欄となる。さらにAb*Caを特定データと
して同様に非構成要素への重み付け値付加を行い、各非
構成要素への重み付け値を合計すると第21図(b)の
重み付け値合計欄となる。各非構成要素に付加された重
み付け値を総計し、総計値に応じて非構成要素をランク
分けして推測データとすると第21図(c)の推測デー
タ欄上段となる。重み付け値の総計が1以上の非構成要
素からなるすべての組を推定データとし、推定データに
その要素数に応じた重み付け値を設定し、推定データ内
の非構成要素の重み付け値総計と加算して推定データの
ランク分けを行うと第21図(c)の推測データ欄下段
のようになり、推測データの作成が完了する。推測方法
3は、論理否定集合の検索要素及びワードと相関関係度
の大きい検索要素及びワードが検索データとして付与ま
たはワードとして記載されている文書情報ほど必要度が
低いと推測する方法である。推測方法3では、推測方法
2において特定データを論理否定集合とすることによ
り、同様にして構成データ及び配列データを推測するこ
とができる。ただしランク付けは、重み付け値の総計値
が大きいほど低くなる。推測方法4は、文書情報に付与
された検索データ中に論理和集合中の検索要素の占める
割合が大きいほど必要度の高い文書情報であると推測す
る方法である。ここで第22図のフローチャートを用い
てパターン型及び混合型の相関データによる推測方法例
について詳述する。最初に入力された解析結果のうち、
ある論理和集合を特定データとする(図中2)。そして
入力された相関データのうち特定データ中の検索要素ま
たはワードを含むある指定項目を指定データとする(図
中3)。パターン型の相関データはパターン(または代
表パターン)を指定データとする。指定データに論理和
集合への近似値に応じた重み付け値を付加する(図中
4)。ここで近似値とは指定データ中に含まれている論
理和集合の検索要素及びワードの割合及び数、指定デー
タ中の非構成要素と論理和集合及び論理否定集合との相
関関係度等により決定される。指定データとされていな
い指定項目を指定データとし、同様にして指定データへ
の重み付け値付加を行う。特定データとされていない解
析結果中の論理和集合を特定データとし、同様に指定デ
ータへの重み付け値付加を行う。各指定項目の重み付け
値を総計し(図中7)、総計値の大きさに応じてランク
分けし、その結果を推測データとする(図中8)。構成
データは推測データと論理和集合及び論理否定集合で構
成し、配列データは推測データで構成することにより構
成データ及び配列データの推測が完了する。次に推測方
法4による推測データ作成の具体例について説明する。
推測方法1と同様に入力された検索式が、 Ab(Ca−Cc)+Bb であったとすと解析部16により論理和集合としてBb
とAb*Ca、論理否定集合としてAb*Ccが求ま
る。推測部17へは、上記解析結果と第8図の相関デー
タとが入力されたとする。そこでBbを特定データと
し、指定項目[Ba,Bb,Cc]を指定データに選定
する。ここでNを指定データ中の特定データの検索要素
数、Xを特定データの検索要素数、Yを指定データの検
索要素数、Zを論理和集合の要素数とし、近似値を例え
ば、 N*N/(X*Y*Z)*100 の整数部に設定する。指定項目[Ba,Bb,Cc]の
特定データへの近似値は16となり、同様に他のBbを
含む指定項目を指定データとして近似値に対応した重み
付け値を行うと第23図(a)となり、さらにAb*C
aを特定データとして同様に指定データへの重み付け値
付加を行うと第23図(b)となる。指定項目の重み付
け値を総計し、総計値に応じてランク分けして推測デー
タとすると第23図(c)の推測データ欄となり、推測
データの作成が完了する。以上説明した推測方法は、複
数組み合わせて行ってもよい。次に構成部20における
検索式作成例について説明する。最初に入力された構成
データのうち、ランク順位が第1位の推測データを取り
出す。取り出された推測データ中の検索要素及びワード
を論理積で結合したものと論理和集合とをさらに論理積
で結合して論理式を作成する。作成された論理式に論理
否定集合を論理否定で結合してランク1位の検索式を作
成し、作成された検索式にランクを付加する。同様にラ
ンク順位順の推測データと論理和集合及び論理否定集合
からその推測データのランクに対応した検索式を作成
し、作成された検索式にランクを付加することにより検
索式の作成が完了する。ここで下位のランクの検索式
は、上位のランクの検索式で検索される文書情報を含ま
ないように構成してもよい。次に構成部20における検
索式作成の具体例について説明する。構成部20へは第
21図(c)の推測データからなる構成データが入力さ
れたとする。ランク順位が第1位の推測データBaに論
理和集合と論理否定集合を論理結合してランク1位の検
索式を作成すると、第24図(b)の検索式欄のように
なる。同様にして推測データのランク順位順の検索式を
作成すると、第24図(b)の検索式欄のようになり検
索式の作成が完了する。次に配列部18における検索さ
れた文書情報の配列方法例について説明する。配列方法
には、配列データに基づいて検索された文書情報を集団
的にランク付けして配列する集団配列方法と、検索され
た文書情報の検索データに基づいて一件一件の文書情報
の配列順位を決定する個別配列方法とがある。そこで集
団配列方法例について説明する。最初に入力された配列
データのうち、ランク順位が1位の推測データを取り出
す。推測データ中の検索要素及びワードが検索データと
して付与及びワードとして記載されている文書情報を取
り出し、取り出された文書情報にランク1位を付与す
る。同様にランク順位順の推測データ中の検索要素及び
ワードが付与及び記載されている文書情報を取り出し、
取り出された文書情報に推測データのランクに対応した
ランクを付与し、最後にランクが付与されなかった文書
情報には最下位のランクを付与することにより文書情報
の配列が完了する。ここで高位のランクが付与された文
書情報には下位のランク付与を行わないようにしてもよ
い。次に個別配列方法例について説明する。最初に検索
されたある文書情報の付与検索データ及び記載ワードを
取り出す。配列データのうちデータ内のすべての要素が
取り出された付与検索データ及び記載ワードに含まれる
推測データを求め、その文書情報に求められた推測デー
タのランクに対応した重み付け値を付加する。ここでの
重み付け値は、求められたすべての推測データのランク
に対応した重み付け値を総計したり、最もランクが高い
推測データのランクに対応した重み付け値にしたり、取
り出された付与検索データ及び記載ワードに一番近似し
た推測データのランクに対応した重み付け値とする。重
み付け値の付加されていない文書情報に同様にして重み
付け値を付加する。文書情報に重み付け値の大きい順の
ランクを付加することで、文書情報の配列が完了する。
次に配列部18における個別配列方法の具体例について
説明する。配列部18へ検索式によって第24図(c)
のように6つの検索された文書情報と第23図(c)の
推測データからなる配列データが入力されたとする。最
初第24図(c)の文書情報番号1の付与検索データが
[Ab,Ba,Ca]であるとすると、この付与検索デ
ータに一番近似した推測データは[Ab,Ba,Ca]
である。Iをランク順位として付加する重み付け値を例
えば、 (11−I)*10 と設定すると、推測データ[Ab,Ba,Ca]のラン
ク順位は2位であるから文書情報番号1の文書情報への
重み付け値は90となる。同様にして配列部18へ入力
された文書情報の付与検索データに一番近似した推測デ
ータを求め、文書情報に求められた推測データのランク
に対応した重み付け値を付加し、重み付け値順に配列ラ
ンクを決定すると第24図(c)の配列ランク欄のよう
になり、文書情報の配列が完了する。文書情報の出力方
法には、単に文書情報をランク順に出力するだけでな
く、判別値を設定しておき、ランク付けの根拠となった
重み付け値を判別した適格度を各文書情報に付加するこ
とにより、検索時に検索者へ各文書情報の必要度及び出
力継続の必要性等の情報を提供できるようにしてもよ
い。第5の実施例は、入力された検索データ及びワード
(以下「入力データ」という)から入力データの内容推
測を行い自動的に検索式を作成して検索を行う装置に関
する。内容推測の基本原理には、用いる相関データによ
り以下の方法がある。特定型の相関データを用いた内容
推測は、入力データ間の相関関係度を求め相関関係度が
高い検索要素の組やワードの組等を文書情報の主要内容
と推定する。パターン型及び混合型の相関データを用い
た内容推測は、相関データから入力データのパターンに
対応したパターンを文書情報の主要内容と推測する。こ
の装置による検索動作例について説明する。最初に入力
装置1から検索命令と入力データが入力される。ここで
情報蓄積部6に蓄積されているある文書情報の関連情報
を検索する場合などでは、検索命令によりその文書情報
の付与検索データを情報検索部11により情報蓄積部6
から求めて入力データとしたり、またその文書情報をワ
ード検出部21へ入力して求めたワードを入力データと
してもよい。検索命令を受けた制御部15は、入力デー
タを推測部17と相関検出部9または作成部10へ入力
する。次に制御部15は蓄積型の相関データを用いる場
合には相関検出部9に相関蓄積部5から入力データに対
応する相関データを求めさせ、逐次型の相関データ用い
る場合には作成部10により入力データに関する相関デ
ータを求めさせ、この求められた相関データを推測部1
7へ入力する。推測部17は、入力データ及び相関デー
タから文書情報の内容データを推測する。制御部15は
推測部17で求められた内容データと規則検出部13で
規則蓄積部7から求めた規則とを構成部20へ入力す
る。構成部20は内容データから規則にしたがって検索
式を作成する。制御部15は作成された検索式を情報検
索部11へ入力して検索を行わせ、検索結果を出力装置
4へ出力することにより、文書情報の検索が完了する。
ここで予め検索される文書情報数が限定されており優先
順位のある検索式を複数作成する場合には、構成部20
での優先順位高位の検索式作成毎に情報検索部11にお
いて検索を行わせ、検索された文書情報数が限定数に達
した段階で検索式の作成及び検索を終了するようにして
もよい。また検索された文書情報を配列部18へ入力し
て、第4の実施例で述べた推測方法により例えば入力デ
ータを1つの論理和集合としてさらに必要度の高い文書
情報順に配列し直してもよい。次に推測部17での特定
型の相関データによる内容データの推測方法例を第25
図のフローチャートを用いて詳述する。最初に、入力デ
ータ中のある検索要素またはワードを特定データとする
(図中2)。特定データ以外の入力データ中のある検索
要素またはワードを指定データとする(図中3)。特定
データと指定データとの相関関係度を求め、指定データ
に相関関係度に応じた重み付け値を付加する(図中
4)。指定データとされていない特定データ以外の検索
要素またはワードを指定データとし、同様に特定データ
との相関関係度による重み付け値付加を行う。特定デー
タとされていない入力データ中の検索要素またはワード
を特定データとし、同様に指定データの選定を行い、特
定データとの相関関係度から指定データへの重み付け値
付加を行う。次に特定データと指定データとの組を組デ
ータとし、同一の組データ内の指定データの重み付け値
を総計する(図中5)。組データを重み付け値によりグ
ループ分けしたものを内容データとすることにより、文
書情報の内容データの推測が完了する。そこで特定型の
相関データによる内容データの具体的推測方法例につい
て説明する。入力装置1からの入力データが例えば第2
図の分類体系2に属する検索要素からなる、 Ab,Bb,Ca であったとする。制御部15は、上記の入力データと第
4図の相関データを推測部17へ入力する。推測部17
では最初にAbを特定データとし、特定データ以外の検
索要素Bb及びCaを指定データとして特定データとの
相関関係度を相関データから求めて重み付け値を付加す
ると第26図(a)のように求まる。相関関係に対する
重み付け値を予め「☆」は「+2」、「○」は「+
1」、「 」は「0」、「×」は「−1」と設定してお
く。同様に特定データをBb及びCaとした場合の指定
データとの相関関係度による重み付け値は、第26図
(b)及び(c)のように求まる。特定データと指定デ
ータの検索要素を組にすると第26図(d)となり、各
組の重み付け値を総計すると第26図(d)の重み付け
値総計欄のようになる。各組をグループ分けする判別値
を第26図(e)のように設定すると、内容データは第
26図(f)のように構成される。次に推測部17での
パターン型及び混合型の相関データによる内容データの
推測方法例を第27図のフローチャートを用いて詳述す
る。最初に入力データ中の検索要素またはワードを含む
指定項目(パターン型の相関データではパターンまたは
代表パターン)のうちある指定項目を指定データとする
(図中2)。指定データに入力データへの近似値に対応
した重み付け値を付加する(図中3)。ここで近似値は
入力データの要素数、指定データの要素数、指定データ
中に含まれる入力データの要素数、指定データと入力デ
ータ中の指定データに含まれない要素との相関関係度等
から適宜設定されるものである。指定データとされてい
ないパターン(または代表パターン)を指定データと
し、同様に指定データに入力データへの近似値に対応し
た重み付け値を付加する。パターン(または代表パター
ン)毎の重み付け値を総計し総計値によりグループ分け
したものを内容データとすることにより、文書情報の内
容データ推測が完了する。ここで指定項目が検索要素ま
たはワードで相関項目がパターンの混合型の相関データ
を用いる場合には、指定項目のうちの入力データ中の検
索データ及びワードを指定データとし、重み付け値は相
関項目のパターンに指定データとの相関関係度に応じて
付加してもよい。そこで混合型の相関データによる内容
データの具体的推測方法例について説明する。入力装置
1からの入力データが例えば第2図の分類体系2に属す
る検索要素からなる、 Ab,Bb,Ca であったとする。制御部15は、上記の入力データと第
8図の相関データを推測部17へ入力する。推測部17
では入力データの検索要素を含む代表パターンを相関デ
ータから求め、各代表パターンを指定データとして入力
データへの近似値に対応した重み付け値を付加すると第
28図(a)の重み付け値欄のようになる。ここでXを
入力データの検索要素数、Yを代表パターンの検索要素
数、Nは代表パターン中に含まれる入力データの検索要
素数とし、近似値を例えば、 N*N/(X*Y)*100 の整数部に設定する。近似値に対する重み付け値は、近
似値をそのまま重み付け値とする。各代表パターンをグ
ループ分けする判別値を第28図(b)に設定すると、
内容データは第28図(c)の内容データ欄のように構
成され、入力データから文書情報の内容と推定する内容
データの作成が完了する。次に構成部20における検索
式作成について説明する。検索式作成には、規則として
予め登録してある論理式に内容データを代入して検索式
を作成する検索式登録型と、グループ毎の内容データを
一定の規則に従って論理結合して検索式を作成する規則
登録型とがある。構成部20での検索式登録型による検
索式の作成方法例について説明する。規則蓄積部7には
例えば第29図のように内容データのグループ数m毎に
最適の検索結果が得られる順の優先順位が付与された検
索式の集合が登録されているものとする。ここで第29
図の検索式において、積Q(I)はI番目にグループ順
位が高い内容データの要素を論理積結合した集合であ
り、和Q(I)はI番目にグループ順位が高い内容デー
タの要素を論理和結合した集合であり、グループ毎の内
容データの論理構成をさらに細分化することにより精密
な検索が可能となる。そこで最初に入力された規則のう
ち入力された内容データのグループ数に対応した論理式
の集合を選択する。選択された論理式の集合のうち優先
順位が第1の論理式の論理要素に内容データを代入し
て、優先順位の付与された検索式を作成する。以下同様
に優先順位の論理式順に内容データを代入して優先順位
の付与された検索式を作成することにより検索式の作成
が終了する。次に検索式登録型による具体的検索式の作
成方法例について説明する。制御部15によって構成部
20へ第26図の内容データ及び内容データのグループ
数が2なのでm=2に対応した第29図の登録論理式が
入力されたとする。検索式の各要素は、 積Q(1)=Ab*Ca 積Q(2)={Ab*Bb}*{Bb*Ca} 和Q(1)=Ab+Ca 和Q(2)={Ab+Bb}+{Bb+Ca} となるから、優先順位順の登録検索式へ内容データを代
入すると、 K(1)={Ab*Ca}*{{Ab*Bb}+{Bb+Ca}} K(2)={Ab*Ca}*{{Ab+Bb}+(Bb+Ca}} K(3)=Ab*Ca K(4)={Ab+Ca}*{{Ab*Bb}*{Bb*Ca}} K(5)={Ab+Ca}*{{Ab+Bb)+{Bb+Ca}} K(6)=Ab+Ca K(7)={Ab*Bb}*{Bb*Ca} K(8)={Ab+Bb}+{Bb+Ca} となり、優先順位の付与された検索式の作成が終了す
る。次に構成部20での規則登録型による検索式の作成
方法例について説明する。規則蓄積部7には最適の検索
結果が得られるように例えば、 K(2n−1)=積Q(1)*・・*積Q(m−n)*積Q(m+1−n) ・・・・(1) K(2n)=積Q(1)*・・*積Q(m−n)*和Q(m+1−n) ・ ・・・(2) ただしm+1−n=1のとき K(2n)=和Q(m+1−n) のような規則が登録されていたとする。ここでnは整
数、mは内容データのグループ数、積Q(a)はa番目
にグループ順位が高い内容データの要素を論理積結合し
た集合であり、和Q(a)はa番目にグループ順位が高
い内容データの要素を論理和結合した集合である。最初
に入力された内容データのグループ数mを求め、n=1
とし内容データを(1)式に代入して検索式K(1)を
作成し優先順位第1位を付与し、次に内容データを
(2)式に代入して検索式K(2)を作成し優先順位第
2位を付与する。以下同様にnの数値を1づつ増加させ
て、内容データを(1)式及び(2)式に交互に代入す
ることにより、優先順位の付与された検索式の作成が終
了する。次に規則登録型による具体的検索式の作成方法
例について説明する。制御部15によって、構成部20
へ第28図の内容データ及び上記(1)及び(2)式が
入力されたとする。内容データのグループ数は3である
からm=3となり、(1)及び(2)式の論理要素は、 積Q(1)=Ab*Ba*Ca 積Q(2)={Ab}*{Bb}*{Ca} 積Q(3)={Aa*Ba*Ca}*{Ba*Bb*Cc}*{Ba*Bb }*{Ba*Ca}*{Ca*Cb} 和Q(1)=Ab+Ba+Ca 和Q(2)={Ab}+{Bb}+{Ca} 和Q(3)={Aa+Ba+Ca}+{Ba+Bb+Cc}+{Ba+Bb }+{Ba+Ca}+{Ca+Cb} となるから、登録されている規則により、 K(1)={Ab*Ba*Ca}*{{Ab}*{Bb}*{Ca}}*{{ Aa*Ba*Ca}*{Ba*Bb*Cc}*{Ba*Bb} *{Ba*Ca}*{Ca*Cb}} K(2)={Ab*Ba*Ca}*{{Ab}*{Bb}*{Ca}}*{{ Aa+Ba+Ca}+{Ba+Bb+Cc}+{Ba+Bb}+{Ba+Ca} +Ca+Cb}} K(3)={Ab*Ba*Ca}*{{Ab}*{Bb}*{Ca}} K(4)={Ab*Ba*Ca}*{{Ab)+{Bb}+{Ca}} K(5)=Ab*Ba*Ca K(6)=Ab+Ba+Ca が求まり、優先順位の付与された検索式の作成が終了す
る。第6の実施例は、入力された検索データ及びワード
(以下「入力データ」という)から入力データに対応し
た文書情報を検索しておき、検索された文書情報の中か
ら適切な文書情報を自動的に配列する装置に関する。次
にこの装置による検索動作例について説明する。最初に
入力装置1から検索命令と入力データが入力される。こ
こで入力データを第5の実施例と同様に,情報検索部1
1及びワード検出部21から求めてもよい。検索命令を
受けた制御部15は、入力データを推測部17と配列部
18及び情報検索部11へ入力する。制御部15は情報
検索部11に入力データである検索データ及びワードが
付与または記載された文書情報を情報蓄積部6から検索
させ、検索された文書情報を配列部18へ入力する。こ
こで入力データが検索データのみの場合には検索された
文書情報の付与検索データを、入力データがワードのみ
の場合には検索された文書情報をワード検出部21へ入
力して求めた記載ワードを、入力データが検索データ及
びワードからなる場合には検索された文書情報の付与検
索データ及び記載ワードを配列部18へ入力する。次に
制御部15は蓄積型の相関データ用いる場合には入力デ
ータを相関検出部9へ入力して相関蓄積部5から入力デ
ータに対応する相関データを求めさせ、逐次型の相関デ
ータ用いる場合には情報検索部11から検索された文書
情報の付与検索データ及びワード検出部21から検索さ
れた文書情報に記載されたワードを作成部10へ入力す
ることにより入力データに関する相関データを求めさ
せ、この求められた相関データを推測部17へ入力す
る。推測部17は、入力データ及び相関データから文書
情報の内容データを推測する。制御部15は推測部17
で求められた内容データ及び規則検出部13で規則蓄積
部7から求めた規則または入力データを配列部18へ入
力する。配列部18は検索された文書情報の配列を行
う。制御部15は配列した文書情報を出力装置4へ出力
することにより、文書情報の検索が完了する。推測部1
7での内容データの推測方法は第5の実施例の内容デー
タの推測方法と同様に行うことができるので、説明は省
略する次に配列部18での配列方法について説明する。
配列方法には、内容データに基づいて検索された文書情
報を集団的に配列する集団配列方法と、検索された文書
情報の付与検索データに基づいて一件一件の文書情報の
配列順位を決定する個別配列方法とがある。そこで集団
配列方法例について説明する。集団配列方法1は、内容
データをそのまま利用する方法である。最初に1番高い
グループ順位のある内容データを特定データとする。特
定データの検索データ及びワードが付与または記載され
ている文書情報を検索された文書情報の中から求め、求
められた文書情報に1位の配列順位を付与する。同じグ
ループ順位に他の内容データがある場合には、その内容
データを特定データとし同様にして特定データに対応し
た文書情報を求めて1位の配列順位を付与する。さらに
同様にしてグループ順位順の内容データをそれぞれ特定
データとし、特定データに対応した文書情報を求め、求
められた文書情報にグループ順位順に配列順位を付与す
る。ここですでにグループ順位が上位の内容データによ
り配列順位が決定された文書情報には、グループ順位が
下位の内容データにより配列順位を付与しない。また配
列順位が付与されていない文書情報には最下位の配列順
位を付与する。以上により検索された文書情報の配列順
位が決定する。集団配列方法2は、第5の実施例で説明
した検索式作成と同様に内容データの要素を入力された
規則に従い組み合わせて優先順位が付与された検索デー
タ及びワードからなる集合を作成し、作成された集合に
対応した文書情報に優先順位の応じた配列順位を付与す
るものである。次に個別配列方法例について説明する。
個別配列方法は、検索された各文書情報の付与検索デー
タ及び記載ワードがどのランクの内容データを含んでい
るかにより配列順位を決定する方法である。最初にある
検索された文書情報の付与検索データを特定データとす
る。ここで内容データ中のある要素を指定データとし、
指定データが特定データに含まれているかを確かめ、含
まれている場合には特定データの文書情報に指定データ
のグループ順位に対応した重み付け値を付加する。指定
データとされていない内容データ中の要素を指定データ
とし、同様に特定データの文書情報に重み付け値を付加
する。ここで重み付け値付加の対象となる指定データに
は、特定データに最も近似した指定データに限定した
り、さらに特定データの文書情報が属する指定データに
限定してもよい。特定データとされていない文書情報の
付与検索データを特定データとし、同様に特定データの
文書情報に重み付け値を付加する。すべての文書情報に
重み付け値を付加したのち、各文書情報に付加された重
み付け値を総計し総計値に応じて配列順位を決定し、決
定された配列順位を各文書情報に付与することにより、
検索された文書情報の配列が完了する。上記の配列方法
には、ある配列方法で決定された配列順位の値と他の配
列方法で決定された配列順位の値にある重み付け値乗算
した値とを加算し、加算値に応じた新たな配列順位を決
定する等の方法で、例えば以下に説明する内容データを
用いない配列方法と組み合わせて行ってもよい。配列方
法1は、各文書情報の付与検索データ及び記載ワードの
入力データへの近似値により検索された文書情報を配列
する方法である。最初にある検索された文書情報の付与
検索データ及び記載ワードを特定データとする。特定デ
ータの入力データへの近似値を求め、特定データの文書
情報に求められた近似値に対応した重み付け値を付加す
る。特定データとされていない検索された文書情報の付
与検索データを特定データとし、同様に特定データの文
書情報に重み付け値を付加する。検索されたすべての文
書情報に重み付け値を付加したのち、重み付け値に応じ
て配列順位を決定し、決定された配列順位を各文書情報
に付与することにより、検索された文書情報の配列が完
了する。配列方法2は、入力データを1つの論理和集合
とすることにより第4の実施例の推測方法2及び3と同
様に検索された文書情報の入力データ以外の付与検索デ
ータ及び記載ワードと入力データとの相関関係度を求め
ることによって、検索された文書情報を配列する方法で
ある。次に配列順位の決定された文書情報が入力データ
の検索データ及びワードを欠如している場合、検索され
た文書情報毎に欠如した検索データ及びワード(以下
「欠如データ」という)に対応する最適な補足文書情報
を提供する提供方法例について説明する。提供方法1
は、欠如データを付与または記載された文書情報のうち
配列順位が上位の文書情報を補足文書情報とすることに
より、入力データへの必要度の高い文書情報を補足文書
情報とするものである。最初に配列順位が決定されたあ
る文書情報と入力データを比較し、第1の欠如データを
求める。次に第1の欠如データの検索データ及びワード
を付与または記載されている文書情報を配列された文書
情報から求め、配列順位が上位の文書情報からn件まで
を第1の補足文書情報とする。次にn件の各補足文書情
報の第1の欠如データから欠如したし検索データ及びワ
ードを第2の欠如データとし、各第2の欠如データを付
与または記載されている文書情報を配列された文書情報
から求め、配列順位が上位の文書情報からn件までをそ
れぞれ第2の補足文書情報とし、以下同様にしてある設
定値の段階までの補足文書情報を求めるか、欠如データ
が存在しなくなるまで次の段階の補足文書情報を求め続
けることにより補足文書情報の提供が完了する。ここで
補足文書情報に決定する文書情報は、欠如データに近似
した検索データ及び記載ワードが付与または記載された
ものに限定してもよい。提供方法2は、欠如データを含
むグループ順位上位の内容データを求め、求められた内
容データに対応した文書情報のうち配列順位が上位の文
書情報を補足文書情報とすることにより、欠如データの
要素のうち相互にある程度相関関係度のある要素の集合
に対応した文書情報を補足文書情報とするものである。
最初に配列順位が決定されたある文書情報と入力データ
を比較し欠如データを求める。次に欠如データの検索デ
ータ及びワードを含むグループ順位順の内容データを求
め、求められた内容データの検索データ及びワードに対
応する文書情報を求め、配列順位が上位の文書情報から
n件までを第1の補足文書情報とする。以下同様にして
前回よりグループ順位が下位の内容データを求め、求め
られた内容データの検索データ及びワードに対応する文
書情報を求め、配列順位が上位の文書情報からn件まで
を補足文書情報とすることにより補足文書情報の提供が
完了する。提供方法3は、相関データが混合型の場合に
適応されるもので、欠如データに対応した文書情報のう
ち、補足情報を必要とする文書情報と相関関係度が大き
い文書情報を補足文書情報とすることにより、補足情報
を必要とする文書情報との関連性が高い文書情報を補足
文書情報とするものである。最初に配列順位が決定され
たある文書情報と入力データを比較し、欠如データを求
める。次に前記文書情報の付与検索データ及び記載ワー
ドと欠如データを推測部17へ入力する。推測部17で
は前記文書情報に対応するパターン(または代表パター
ン)の指定項目を特定データとし、欠如データに対応す
るあるパターン(または代表パターン)の相関項目を指
定データとし、指定データに特定データへの相関関係度
に対応した重み付け値を付加する。指定データとされて
いない欠如データに対応するパターン(または代表パタ
ーン)の相関項目を同様に指定データとして重み付け値
付加を行い、重み付け値の大きい複数のパターン(また
は代表パターン)を配列部18へ入力する。配列部18
では重み付け値が最大のの入力されたパターン(または
代表パターン)の検索データ及びワードに対応する文書
情報を求め、配列順位が上位の文書情報からn件までを
第1の補足文書情報とする。以下同様にして重み付け値
順のパターン(または代表パターン)に対応する文書情
報のうち配列順位が上位の文書情報を補足文書情報とす
ることにより補足文書情報の提供が完了する。以上説明
した補足文書情報の提供方法は、相互に混合して行って
もよく、また第5の実施例においても適応できる。次に
上記個別配列方法及び提供方法1による具体的配列方法
例について説明する。配列部18には、入力データA
b,Bb,Caと第28図の内容データ、及び第30図
(a)の入力データに対応して検索された文書情報が入
力されたとする。検索された文書情報のうち文書情報1
の付与検索データ[Ba,Ca,Cb]を特定データと
する。この特定データに検索要素がすべて含まれている
内容データは[Ca],[Ba,Ca],[Ca,C
b]であるが、内容データ[Ca]は他の内容データ
[Ba,Ca]及び[Ca,Cb]に含まれるため重み
付け値付加の指定データとはならないので、重み付け値
付加の指定データとなる内容データは[Ba,Ca]と
[Ca,Cb]となり、内容データのグループ順位Mに
応じ重み付け値(6−M)を付加するとすると、[B
a,Ca,Cb]の特定データに付加される重み付け値
は第30図(a)の重み付け値A欄のようになる。同様
にして他の検索された文書情報にも指定データを限定し
て重み付け値を付加して総計値を求めると第30図
(a)の重み付け値A欄のようになる。総計値にしたが
って検索された文書情報を配列すると第30図(b)の
ようになる。各文書情報に対する欠如データを求める
と、第30図(b)の欠如データ欄のようになる。ここ
で文書情報番号が1の付与検索データ[Ba,Ca,C
b]を特定データとした場合、第1の欠如データの要素
は[Ab,Bb]となりこの欠如データに対応した文書
情報を求める文書情報番号2、3、4、5が求まり、こ
のうち配列順位が一番高い文書情報を補足文書情報とす
ると文書情報番号4の文書情報が補足文書情報となる。
この補足文書情報の第1の欠如データから欠如した検索
データは[Bb]なので、これを第2の欠如データとし
同様に補足文書情報を求めると文書情報番号5の文書情
報が求まり特定データへの補足文書情報の提供が完了す
る。同様にして他の配列された文書情報の補足文書情報
を求めると第30図(b)となり、検索された文書情報
の配列順位とその文書情報を補足する文書情報が組とし
て求められる。文書情報の出力方法では、第5の実施例
と同様各文書情報に適格度を付加してもよい。第7の実
施例は、前記した実施例を総合して検索データによる検
索とテキストサーチとを併用した文書情報検索装置に関
する。ここでは具体的にある特許文献に関する関連特許
文献を検索する場合の文書情報検索装置の動作を例にし
て説明する。最初に特許文献を特定する公開番号等の入
力データを入力装置1へ入力する。入力データに対応し
た特許文献とその付与検索データを情報検索部11によ
り情報蓄積部6から求め、特許文献をワード検出部21
へ入力して記載ワードの検出を行う。ここで求められた
付与検索データが自動検索用の検索データでない場合に
は、前記第1の実施例の方法により検索データを求める
か、または求められた検索データを前記第3の実施例に
より自動検索できる検索データに変換して自動検索用の
検索データを求めてもよい。さらに前記第2の実施例に
より求められた自動検索用の検索データを修正してもよ
い。求められた付与検索データにより前記第5または第
6の実施例の方法により関連特許文献を検索及び配列を
行う。ここで第6の実施例では検索もれを防止するため
に検索データだけでなく記載ワードに対応した特許文献
を検索したのち配列を行ってもよい。また特許文献では
特に時代毎の技術の流れや、各企業毎の特色があるので
入力データの特許文献の付与検索データに関する全体の
相関データのみでなく、出願時期毎に細分化した相関デ
ータのうち入力された特許文献の出願時期が属する相関
データや出願人毎に細分化された相関データのうち入力
データの特許文献の出願人が属する相関データ等の複数
の相関データを利用することにより推測精度の向上を行
ってもよい。検索及び配列は特定の配列順位までの文献
に限定してもよい。次にワード検出部21で検出した前
記記載ワードにより前記第5または第6の実施例の方法
により検索データにより配列された関連特許文献に再度
配列を行う。ここで内容データ作成に利用するワードを
前記記載ワードのうち特許請求の範囲等に記載されたワ
ードに限定してもよい。そして検索データにより配列さ
れた関連特許文献の各配列のための重み付け値にワード
による配列のための重み付け値を加算等により総計し、
総計値に応じて関連特許文献の配列を決定する。以上よ
り入力データの特許文献に関連する文献を関連の程度に
応じて配列または配列順位を付与して出力装置4へ出力
することにより関連特許文献の検索が完了する。上記で
は検索データによる検索及び配列の後ワードによる配列
を行ったが、ワードにより検索及び配列の後検索データ
による配列を行ってもよい。第8の実施例は、登録した
文書に類似した文書の発行を自動監視する装置に関す
る。ここでは具体的に契約によって特許権者から特許権
者の特許文献を登録し、登録された特許文献に類似した
文書を監視することにより特許権侵害の恐れがある文書
や者等の情報を契約者の特許権者に報告する場合の文書
情報検索装置による監視動作例について説明する。自動
監視装置には入力データが監視文書である場合の入力型
と、入力データが非監視文書である非入力型とがある。
入力型では入力データを登録した特許文献に関するデー
タとすることで前記第5、6、7の実施例と同様に情報
蓄積部6に蓄積された文書情報の中から入力データの特
許文献に関連した文書情報を検索して配列させ、関連度
の高い文書情報または特許文献を出力装置4より出力さ
せ文書情報の監視を行うことができる。非入力型では情
報蓄積部6に登録された特許文献の情報データと付与検
索データ及び特許権者である登録者が蓄積され、入力装
置1へは特許公報や技術文献等の文書情報が入力され、
入力された文書情報の付与検索データとワード検出部2
1で検出した入力された文書情報の記載ワードから前記
第5、6、7の実施例と同様に情報蓄積部6に蓄積され
た登録特許文献の中から入力データの文書情報に関連し
た登録特許文献を検索し配列させ、関連度の高い登録特
許文献及び登録者を出力装置4より出力させることによ
り文書情報の監視を行うことができる。以上に記載した
各実施例において設定値、ランク数、近似値、重み付け
値等は適宜設定されるものであり、また推測時の重み付
け値付加において特定の検索要素やワードの重み付け値
は他の検索要素やワードの重み付け値と相違させてもよ
い。代表パターンの相関データを用いた推測において、
ある代表パターンに対応した文書情報を求める場合に
は、その代表パターンの要素すべてを含む上位(ワード
数または検索データ数が多い)の代表パターンに対応し
た文書情報は除くようにしてもよい。
【0007】
【発明の効果】本発明は、以上のように構成されている
ので、以下に記載されているような効果を奏する。文書
情報への検索データ付与では、文書情報に記載されてい
るワードの組に最も適した文書情報の内容に関する検索
データを自動的に付与するとともに、付与すべき検索デ
ータを適格度順に配列して出力することにより、出力結
果から文書情報の解析者に付与すべき検索データの決定
を容易にさせる情報を提供できる。また相関データが複
数ある場合には解析する文書情報に応じて相関データを
設定でき、設定値の調整により容易に付与基準の調整が
行え、さらに検索データ付与後の自動修正を行うことに
より推測精度を向上させることができる。検索データ修
正では、誤った検索データが付与された可能性の高い文
書情報及び付与されることが必要な検索データが付与さ
れていない可能性の高い文書情報を自動的に検出すると
ともに、各文書情報毎に修正の必要度順に検索データを
配列して出力することにより、出力結果から修正者に修
正すべき検索データの決定を容易にさせる情報を提供す
ることができる。また相関データが複数ある場合には修
正する検索データの文書情報に応じて相関データを設定
でき、設定値の調整により容易に修正基準の調整が行
え、さらに修正確認を自動的に行うことにより推測精度
を向上させることができる。検索データの変換では、変
換される検索データの体系が多観点の分類体系で変換先
の検索データが一観点の分類体系でも自動的に検索デー
タを変換するとともに、変換された検索データを適格度
順に配列して出力することにより、出力結果から変換者
に変換すべき検索データの決定を容易にさせる情報を提
供することができる。また相関データが複数ある場合に
は変換する検索データの文書情報に応じて相関データを
設定でき、設定値の調整により容易に変換基準の調整が
行え推測精度を向上させることができる。文書情報の効
率的検索では、必要度の高い順に検索された文書情報を
配列して出力することにより、効率的な文書情報の検索
が可能であり、検索時に検索者へ検索継続効果を情報と
して提供できる。また複数の相関データがある場合には
検索する文書情報に応じて相関データを設定できるの
で、推測精度を向上させることができる。自動文書情報
検索では、必要度の高い順に文書情報を自動的に検索し
配列して出力することにより、検索者は効率的に必要な
文書情報を検索結果から抽出することができる。また設
定値の調整や規則の設定等によりにより容易に推測精度
の調整や配列の調整が行え、複数の相関データがある場
合には検索する文書情報に応じて相関データを設定でき
るので、推測精度を向上させることができる。さらに検
索された文書情報が検索要求要素を完全に満たしていな
い場合でも、検索された文書情報毎に最適な補足文書情
報を提供することができる。
【図面の簡単な説明】
【図1】 本発明の文書情報検索装置の構成を示すブ
ロック図。
【図2】 情報蓄積部6に蓄積されている検索データ
の構成例
【図3】 特定型の相関データの作成例。
【図4】 検索データ間の特定型の相関データ例。
【図5】 ワードと検索データ間の特定型の相関デー
タ例。
【図6】 パターン型の相関データの作成例。
【図7】 検索データ間のパターン型の相関データ
例。
【図8】 検索データ間の混合型の相関データ例。
【図9】 ワードと検索データ間の混合型の相関デー
タ例。
【図10】 第1の実施例でのワードリスト作成の具体
例。
【図11】 第1の実施例での検索データ推測のフロー
チャート。
【図12】 第1の実施例での検索データ付与の具体
例。
【図13】 第2の実施例での集団型の修正データ推測
のフローチャート。
【図14】 第2の実施例での集団型の検索データ修正
の具体例。
【図15】 第2の実施例での個別型の修正データ推測
のフローチャート。
【図16】 第2の実施例での個別型の検索データ修正
の具体例。
【図17】 第3の実施例での一括変換型の検索データ
変換推測のフローチャート。
【図18】 第3の実施例での個別変換型の検索データ
変換推測のフローチャート。
【図19】 第3の実施例での個別変換型の検索データ
変換の具体例。
【図20】 第4の実施例での推測方法2のフローチャ
ート。
【図21】 第4の実施例での推測方法2の推測データ
作成の具体例。
【図22】 第4の実施例での推測方法4のフローチャ
ート。
【図23】 第4の実施例での推測方法4の推測データ
作成の具体例。
【図24】 第4の実施例での検索式作成及び配列の具
体例。
【図25】 第5の実施例での内容データ推測のフロー
チャート。
【図26】 第5の実施例での特定型の相関データによ
る内容データ推測の具体例。
【図27】 第5の実施例での内容データ推測のフロー
チャート。
【図28】 第5の実施例での混合型の相関データによ
る内容データ推測の具体例。
【図29】 規則蓄積部7に蓄積されている登録論理式
の具体例。
【図30】 第6の実施例での配列の具体例。
【符号の説明図】1 入力装置 2 蓄積装置 3 制御装置 4 出力装置 5 相関蓄積部 6 情報蓄積部 7 規則蓄積部 8 シソーラス部 9 相関検出部 10 作成部 11 情報検索部 12 付与・修正部 13 規則検出部 14 シソーラス検索部 15 制御部 16 解析部 17 推測部 18 配列部 20 構成部 21 ワード検出部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 文書情報に記載されているワードを検出
    するワード検出部と、ワードと検索データ間の相関デー
    タにより前記検出されたワードに対応した検索データを
    推測する推測部とからなる制御装置と、推測された検索
    データを出力する出力装置とからなる文書情報検索装置
    において、前記相関データをワードのパターンと検索デ
    ータ間の相関データとしたことを特徴とする文書情報検
    索装置。
  2. 【請求項2】 検索データ間の相関データにより誤り修
    正データと付与修正データを作成する推測部と、前記誤
    り修正データと前記付与修正データに対応した文書情報
    を蓄積装置から検索する情報検索部とからなる制御装置
    と、検索された文書情報及び文書情報に対応した前記誤
    り修正データと前記付与修正データを出力する出力装置
    とを備えたことを特徴とする文書情報検索装置。
  3. 【請求項3】 蓄積装置から文書情報を検出する情報検
    索部と、検索データ間の相関データにより検出された文
    書情報の付与検索データから誤り修正データと付与修正
    データを作成する推測部とからなる制御装置と、検出さ
    れた文書情報及び文書情報に対応した前記誤り修正デー
    タと前記付与修正データを出力する出力装置とを備えた
    ことを特徴とする文書情報検索装置。
  4. 【請求項4】 変換される検索データを入力する入力装
    置と、検索データ間の相関データにより前記変換される
    検索データに対応した変換先の検索データを推測する推
    測部とからなる制御装置と、前記変換先の検索データを
    出力する出力装置とからなる文書情報検索装置におい
    て、前記相関データを変換される検索データのパターン
    と変換先の検索データ間の相関データとしたことを特徴
    とする文書情報検索装置。
  5. 【請求項5】 検索式を入力する入力装置と、入力され
    た検索式を解析する解析部と、相関データにより解析部
    の解析結果からランク順位の付与された構成データを作
    成する推測部と、前記構成データに基づいてランク順位
    の付与された検索式を作成する構成部と、前記作成され
    た検索式によって蓄積装置から文書情報を検索する情報
    検索部とからなる制御装置と、検索された文書情報を出
    力する出力装置とを備えたことを特徴とする文書情報検
    索装置。
  6. 【請求項6】 検索式を入力する入力装置と、入力され
    た検索式によって蓄積装置から文書情報を検索する情報
    検索部と、入力された検索式を解析する解析部と、相関
    データにより解析部の解析結果からランク順位の付与さ
    れた配列データを作成する推測部と、前記配列データに
    基づいて前記検索された文書情報を配列する配列部とか
    らなる制御装置と、前記配列された文書情報を出力する
    出力装置とを備えたことを特徴とする文書情報検索装
    置。
  7. 【請求項7】 相関データによって入力データから内容
    データを推測する推測部と、前記内容データに基づいて
    検索式を作成する構成部と、前記作成された検索式によ
    り蓄積装置から文書情報を検索する情報検索部とからな
    る制御装置と、前記検索された文書情報を出力する出力
    装置とを備えたことを特徴とする文書情報検索装置。
  8. 【請求項8】 入力データに対応した文書情報を蓄積装
    置から検索する情報検索部と、相関データによって入力
    データから内容データを推測する推測部と、前記内容デ
    ータに基づいて前記検索された文書情報を配列する配列
    部とからなる制御装置と、前記配列された文書情報を出
    力する出力装置とを備えたことを特徴とする文書情報検
    索装置。
  9. 【請求項9】 文書情報に記載されているワードを検出
    するワード検出部と、前記文書情報に付与された検索デ
    ータ及びまたは前記検出されたワードに対応した文書情
    報を蓄積装置から検索する情報検索部と、相関データに
    より前記文書情報に付与された検索データ及びまたは前
    記検出されたワードから内容データを推測する推測部
    と、前記内容データに基づいて前記検索された文書情報
    を配列する配列部とからなる制御装置と、前記配列され
    た文書情報を出力する出力装置とを備えたことを特徴と
    する文書情報検索装置。
JP3271736A 1991-07-22 1991-07-22 文書情報検索装置 Pending JPH0528198A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3271736A JPH0528198A (ja) 1991-07-22 1991-07-22 文書情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3271736A JPH0528198A (ja) 1991-07-22 1991-07-22 文書情報検索装置

Publications (1)

Publication Number Publication Date
JPH0528198A true JPH0528198A (ja) 1993-02-05

Family

ID=17504118

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3271736A Pending JPH0528198A (ja) 1991-07-22 1991-07-22 文書情報検索装置

Country Status (1)

Country Link
JP (1) JPH0528198A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0704810A1 (en) 1994-09-30 1996-04-03 Hitachi, Ltd. Method and apparatus for classifying document information
JP2008502047A (ja) * 2004-06-04 2008-01-24 ヴァイタル・ソース・テクノロジーズ,インコーポレイテッド コンテンツの部分を管理及び編成するシステム、方法及びコンピュータプログラムプロダクト

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0704810A1 (en) 1994-09-30 1996-04-03 Hitachi, Ltd. Method and apparatus for classifying document information
JP2008502047A (ja) * 2004-06-04 2008-01-24 ヴァイタル・ソース・テクノロジーズ,インコーポレイテッド コンテンツの部分を管理及び編成するシステム、方法及びコンピュータプログラムプロダクト

Similar Documents

Publication Publication Date Title
US5168565A (en) Document retrieval system
Salton et al. Advanced feedback methods in information retrieval
EP0304191B1 (en) Text search system
KR100295354B1 (ko) 문서 정보 검색 시스템
US7406462B2 (en) Prediction of query difficulty for a generic search engine
JP4011906B2 (ja) プロファイル情報の情報検索方法、プログラム、記録媒体及び装置
US5404514A (en) Method of indexing and retrieval of electronically-stored documents
US7451139B2 (en) Document similarity calculation apparatus, clustering apparatus, and document extraction apparatus
US7516113B2 (en) Cost-benefit approach to automatically composing answers to questions by extracting information from large unstructured corpora
US5659766A (en) Method and apparatus for inferring the topical content of a document based upon its lexical content without supervision
US7617164B2 (en) Efficiency of training for ranking systems based on pairwise training with aggregated gradients
US8005774B2 (en) Determining a relevance function based on a query error derived using a structured output learning technique
US20030145002A1 (en) Method and system for organizing objects according to information categories
WO1992004681A1 (en) Adaptive ranking system for information retrieval
GB2366036A (en) Categorising information
US7895198B2 (en) Gradient based optimization of a ranking measure
US7836059B2 (en) System and method for minimally predictive feature identification
Lam et al. A meta-learning approach for text categorization
Lebanon et al. Conditional models on the ranking poset
CN117272995A (zh) 一种重复工单推荐方法及装置
JPH0528198A (ja) 文書情報検索装置
JPH08272806A (ja) データベース検索システム
Banerjee et al. Feature selection using rough sets
JPH0394375A (ja) 文書検索装置
JP3418876B2 (ja) データ・ベース検索装置および方法