JPH0420220B2 - - Google Patents

Info

Publication number
JPH0420220B2
JPH0420220B2 JP57503388A JP50338882A JPH0420220B2 JP H0420220 B2 JPH0420220 B2 JP H0420220B2 JP 57503388 A JP57503388 A JP 57503388A JP 50338882 A JP50338882 A JP 50338882A JP H0420220 B2 JPH0420220 B2 JP H0420220B2
Authority
JP
Japan
Prior art keywords
block
text
package
word
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57503388A
Other languages
English (en)
Other versions
JPS58501525A (ja
Inventor
Ruisu Emu Garii
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
System Development Corp
Original Assignee
System Development Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by System Development Corp filed Critical System Development Corp
Publication of JPS58501525A publication Critical patent/JPS58501525A/ja
Publication of JPH0420220B2 publication Critical patent/JPH0420220B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Description

請求の範囲 1 デイジタルデータ処理手段とテキストのブロ
ツク識別子のテーブルの記憶された表示とを用い
て、記憶されたテキストのデータベースにおいて
質問と最もよく一致するテキストのブロツクを捜
すための方法であつて、 データベースはテキストのブロツクに分類され
た単語の表示を有し、テキストのブロツク識別子
の表示はグループをなしてそのテーブルから選択
可能であり、各グループは記憶されたデータベー
ス内の異なる単語に対応し、テキストのブロツク
識別子の各グループ内の表示における各テキスト
のブロツク識別子は、対応する単語を含む記憶さ
れたデータベース内のテキストのブロツクの指示
を与え、 (a) 記憶されたデータベースに含まれるテキスト
のブロツクにおいて捜されるべき複数の単語の
表示を有する質問を受けるステツプと、 (b) 複数の質問単語の各々に対して、記憶された
データベースに含まれる同等単語の対応する組
を決定する決定ステツプとを備え、 同等単語の各組は対応する質問単語と同等で
あり、各同等単語は、記憶されたテーブルに表
示されたテキストのブロツク識別子の対応する
グループを有し、 (c) 決定された同等単語に対応するグループにお
けるテキストのブロツク識別子の表示を処理す
ることによつて、少なくとも1つのテキストの
ブロツクに対してスコアを形成する処理ステツ
プをさらに備え、 前記スコアは、前記少なくとも1つのテキス
トのブロツクにおいて少なくとも1つの同等単
語を有する組の総数を表わし、 (d) 前記スコアを利用して、前記記憶されたテキ
ストのデータベースにおいて選択されたテキス
トのブロツクに関する出力データを与える利用
ステツプをさらに備える、方法。 2 テキストのブロツクはテキストのデータベー
スの段落からなる、請求の範囲第1項記載の方
法。 3 前記処理ステツプは、前記決定ステツプにお
いて決定された各同等単語に対応するテキストの
ブロツク識別子の各グループの表示を前記テーブ
ルから読出すステツプを含む、請求の範囲第1項
記載の方法。 4 前記処理ステツプは、スコアを形成する際に
テーブルから読出されたテキストのブロツク識別
子の表示に関する少なくとも1つの組合せ分類を
行なうステツプをさらに含む、請求の範囲第3項
記載の方法。 5 前記処理ステツプは、 同じテキストのブロツク識別子のいかなる表示
も複製することなく、同等単語の各組に対応する
グループ内のテキストのブロツク識別子の表示を
組合せて同等単語の各組に対するテキストのブロ
ツク識別子のさらなるグループの表示を形成する
ステツプと、 同等単語の各組に対するテキストのブロツク識
別子の前記さらなるグループの表示をさらに処理
することによつて、前記スコアを形成するさらな
る処理ステツプとを含む、請求の範囲第1項記載
の方法。 6 前記さらなる処理ステツプは、 同じテキストのブロツク識別子のいかなる表示
も複製することなく、テキストのブロツク識別子
の前記さらなるグループの各々からテキストのブ
ロツク識別子の表示を組合せるステツプと、 各テキストのブロツクに対して、個々のスコア
を形成するステツプとを含み、 各スコアは、そのテキストのブロツクに対応す
る少なくとも1つのテキストのブロツク識別子の
表示を含む前記さらなるグループの数を表わす、
請求の範囲第5項記載の方法。 7 前記処理ステツプにおいて、複数のテキスト
のブロツクの各々に対してスコアが与えられ、各
テキストのブロツクに対する各スコアは、対応す
るテキストのブロツクにおいて少なくとも1つの
同等単語を含む組の総数を表わす、請求の範囲第
1項記載の方法。 8 前記処理ステツプにおいて、前記テキストの
ブロツクの各々に対して前記スコアの1つが形成
され、 前記利用ステツプは、出力のために、記憶され
たデータベースからテキストのブロツク識別子に
よつて指示されたテキストのブロツクの表示を選
択するステツプと、テキストのブロツクの選択さ
れた表示を出力するステツプとを含み、 前記ブロツクは、対応するテキストのブロツク
識別子のスコアを用いて配列される、請求の範囲
第1項記載の方法。 9 テキストのブロツクの表示は、スコアに従つ
て値が減少する順序に出力される、請求の範囲第
8項記載の方法。 10 前記処理ステツプは、ポインタの組を形成
するステツプを含み、各ポインタの組はテキスト
のブロツク識別子の前記グループの1つに対して
少なくとも1つのポインタの表示を含み、 前記処理ステツプは、前記ポインタの組からの
少なくとも1つのポインタの表示を利用して、前
記記憶されたテーブル内の対応するグループから
テキストのブロツク識別子を選択するステツプを
さらに含む、請求の範囲第1項記載の方法。 11 前記決定ステツプは、質問単語の容認し得
る綴り間違いでありかつ容認し得る語尾変化であ
る、データベースにおける単語を選択するステツ
プを含む、請求の範囲第1項記載の方法。 12 容認し得る綴り間違いでありかつ容認し得
る語尾変化である単語を選択するステツプは、質
問単語の語幹とデータベース単語の語頭文字との
間の正確な一致、1文字置換、1文字削除または
1文字挿入を有し、かつ容認し得る接尾辞をもま
た有するデータベース単語を選択するステツプを
含む、請求の範囲第11項記載の方法。 13 テキストのブロツク識別子のテーブルの記
憶された表示を用いて、記憶されたテキストのデ
ータベースにおいて質問と最もよく一致するテキ
ストのブロツクを捜すためのデイジタルデータ処
理装置であつて、 データベースはテキストのブロツクに分類され
た単語の表示を有し、テキストのブロツク識別子
の表示はグループをなしてそのテーブルから選択
可能であり、各グループは記憶されたデータベー
ス内の異なる単語に対応し、テキストのブロツク
識別子の各グループ内の表示における各テキスト
のブロツク識別子は、対応する単語を含む記憶さ
れたデータベース内のテキストのブロツクの指示
を与え、 (a) 記憶されたデータベースに含まれるテキスト
のブロツクにおいて捜されるべき複数の単語の
表示を有する質問を受ける手段と、 (b) 複数の質問単語の各々に対して、記憶された
データベースに含まれる同等単語の対応する組
を決定する決定手段とを備え、 同等単語の各組は対応する質問単語と同等で
あり、各同等単語は、記憶されたテーブルに表
示されたテキストのブロツク識別子の対応する
グループを有し、 (c) 決定された同等単語に対応するグループにお
けるテキストのブロツク識別子の表示を処理す
ることによつて、少なくとも1つのテキストの
ブロツクに対してスコアを形成する処理手段を
さらに備え、 前記スコアは、前記少なくとも1つのテキス
トのブロツク内の少なくとも1つの同等単語を
有する組の総数を表わし、 (d) 前記スコアを利用して、前記記憶されたテキ
ストのデータベースにおいて選択されたテキス
トのブロツクに関する出力データを与える利用
手段をさらに備える、デイジタルデータ処理装
置。 14 テキストのブロツクはテキストのデータベ
ースの段落からなる、請求の範囲第13項記載の
装置。 15 前記処理手段は、前記決定手段において決
定された各同等単語に対応するテキストのブロツ
ク識別子の各グループの表示を前記テーブルから
読出す手段を含む、請求の範囲第13項記載の装
置。 16 前記処理手段は、スコアを形成する際にテ
ーブルから読出されたテキストのブロツク識別子
の表示に関する少なくとも1つの組合せ分類を行
なう手段をさらに含む、請求の範囲第15項記載
の装置。 17 前記処理手段は、 同じテキストのブロツク識別子のいかなる表示
も複製することなく、同等単語の各組に対応する
グループ内のテキストのブロツク識別子の表示を
組合せて同等単語の各組に対するテキストのブロ
ツク識別子のさらなるグループの表示を形成する
手段と、 同等単語の各組に対するテキストのブロツク識
別子の前記さらなるグループの表示をさらに処理
することによつて、前記スコアを形成するさらな
る処理手段とを含む、請求の範囲第13項記載の
装置。 18 前記さらなる処理手段は、 同じテキストのブロツク識別子のいかなる表示
も複製することなく、テキストのブロツク識別子
の前記さらなるグループの各々からテキストのブ
ロツク識別子の表示を組合せる手段と、 各テキストのブロツクに対して、個々のスコア
を形成する手段とを含み、 各スコアは、そのテキストのブロツクに対応す
る少なくとも1つのテキストのブロツク識別子の
表示を含む前記さらなるグループの数を表わす、
請求の範囲第17項記載の装置。 19 前記処理手段は、複数のテキストのブロツ
クの各々に対するスコアを与える手段を含み、各
テキストのブロツクに対する各スコアは、対応す
るテキストのブロツクにおいて少なくとも1つの
同等単語を含む組の総数を表わす、請求の範囲第
13項記載の装置。 20 前記処理手段は、複数のテキストのブロツ
クの各々に対して前記スコアの1つを与える手段
を含み、 前記利用手段は、出力のために、記憶されたデ
ータベースからテキストのブロツク識別子によつ
て指示されたテキストのブロツクの表示を選択す
る手段と、テキストのブロツクの選択された表示
を出力する出力手段とを含み、 前記ブロツクは、対応するテキストのブロツク
識別子に対するスコアに対応する順序にある、請
求の範囲第13項記載の装置。 21 前記出力手段は、スコアに従つて値が減少
する順序にテキストのブロツクの表示を出力する
ように動作する、請求の範囲第20項記載の装
置。 22 前記処理手段は、ポインタの組を形成する
手段を含み、組の各ポインタはテキストのブロツ
ク識別子の前記グループの1つに対して少なくと
も1つのポインタの表示を含み、 前記処理手段は、前記ポインタの組からの少な
くとも1つのポインタの表示を利用して、前記記
憶されたデータベース内の対応するグループから
テキストのブロツク識別子を選択する手段をさら
に含む、請求の範囲第13項記載の装置。 23 前記決定手段は、質問単語の容認し得る綴
り間違いおよび容認し得る語尾変化である、デー
タベースにおける単語を選択する手段を含む、請
求の範囲第13項記載の装置。 24 容認し得る綴り間違いおよび容認し得る語
尾変化である単語を選択する手段は、質問単語の
語幹とデータベース単語の語頭文字との間の正確
な一致、1文字置換、1文字削除または1文字挿
入を有するデータベース単語を選択する手段を含
む、請求の範囲第23項記載の装置。 25 前記テーブルの表示を記憶するための少な
くとも1つのメモリを含む、請求の範囲第13項
記載の装置。 26 テキストのブロツクの表示がそこから選択
される、テキストのデータベースの表示を記憶す
るためのメモリ手段を含む、請求の範囲第20項
記載の装置。 関連特許出願の参照 この発明は、次のものの主題と関連する。 Robert V.DickinsonおよびLouis Michael
Galieの名義で出願された、「パターン解析による
単語類別のためのデイジタルデータ処理方法およ
び手段」という名称の特許出願、および、
Robert V.Dickinson、Louis Michael Galie、
およびCraig A.Snowの名義で出願された、「末
尾解析により増補された単語類別によるデイジタ
ルデータ処理方法および手段」という名称の特許
出願、両出願は同日付で提出された。 上述の特許出願の内容を、ここに参照のために
引用する。 発明の背景 この発明は記憶されたテキストのデータベース
における位置決めのための方法および手段に関
し、これらのテキストのブロツクは多数の単語か
らなる質問と最もよく適合する。 質問と最もよく適合するテキストのブロツク
を、記憶された原データベースに位置決めするた
めの方法および手段は一般的に知られている。1
つの方法および手段が、米国特許第4068298号に
記述されている。この特許は、「ピツピング
(piping)」および「ブライトネス(brightness)」
と呼ばれる技術が、質問と最もよく適合するデー
タベースにおけるエントリ位置決めのために用い
られる構成を説明している。次にエントリは、い
かによく一致するかに従つてスコアされる。原質
問、および好ましくはエントリに対する識別子
が、スコアを用いて順序づけられ、それによつ
て、最良のスコアを有する段落に対する識別子が
最初に現われ、最小のスコアを有する段落に対す
る識別子が最後に現われる。次に使用者は、最良
のスコアを有する段落に対する識別子で始まるエ
ントリの実際のテキストを読出し得る。 逆フアイルを用いる先行技術の構成が、1977年
にPrentice Hallによつて刊行された、James
Martinによる、コンピユータデータベース構造
という題の本の第31章、558〜577ページに説明さ
れている。引用される1つの構成は、テキストの
ブロツクに或る単語を含むことに基づいて、テキ
ストをスコアする逆フアイルシステムを用いるス
テアズ(Stairs)である。このシステムは明らか
に、すべての探索項(すなわち質問単語)を有す
るテキストのブロツクを探索し、すべての同等物
がデータベースに記憶されることを必要とし、ま
た単語の組合わせがいかによくテキストのブロツ
クと一致するかに基づいて戻されるテキストのブ
ロツクを順序づけない。 発明の概要 この発明は、記憶されたテキストのデータベー
スに、質問と最もよく一致するテキストのブロツ
クを位置決めするための改良された方法を開示す
る。 この発明による方法および手段は、上述した特
許に用いられる方法および手段と比較して、質問
単語の組と同等である単語の組を位置決めするこ
とにおいて、呼び戻し(recall)および精度を改
良するということが発見された。この発明はま
た、複雑な制御構造がないので、従来の検索方法
およびシステムを越える重要な改良である。 デイジタルデータ処理手段とテキストのブロツ
ク識別子のテーブルの記憶された表示とを用い
て、記憶されたテキストのデータベースにおいて
質問と最もよく一致するテキストのブロツクを捜
すためのこの発明に従う方法が説明される。デー
タベースは、テキストのブロツクに分類された単
語の表示を有する。テキストのブロツク識別子の
表示は、グループをなしてテーブルから選択可能
である。各グループは、記憶されたデータベース
における別々の単語に対応する。テキストのブロ
ツク識別子の各グループ内の表示における各テキ
ストのブロツク識別子は、対応する単語を含む記
憶されたデータベースにおけるテキストのブロツ
クの指示を与える。方法は、以下のステツプを備
える。記憶されたデータベースに含まれるテキス
トのブロツクにおいて捜されるべき複数の単語の
表示を有する質問が受取られる。複数の質問単語
の各々に対し、記憶されたデータベースに含まれ
る同等の単語の対応する組を決定する。同等の単
語の各組は、対応する質問単語と同等である。各
同等単語は、記憶されたテーブルに表わされるテ
キストのブロツク識別子の対応するグループを有
する。決定された同等単語に対応するグループに
おけるテキストのブロツク識別子の表示を処理
し、それによつて、少なくとも1つのテキストの
ブロツクに対するスコアを形成する。スコアは、
少なくとも1つのテキストのブロツクにおける少
なくとも1つの同等単語を有する組の総数の指示
を与える。スコアは、記憶されたテキストのデー
タベースにおける選択されたテキストのブロツク
に関する出力データを与えるために利用される。 次に、重要なこととして、テキストのブロツク
は、テキストのブロツクにおける少なくとも1つ
の同等単語を有する同等の組の総数に従つて、使
用者によつて、選択および出力のためにスコアさ
れる。このことは、次に、質問がテキストのブロ
ツクと一致する精度の非常によい基準を与え、テ
キストのブロツクの選択および出力のために用い
られ得る。 好ましくは、テキストのブロツクは、テキスト
のデータベースの段落からなる。好ましい構成に
おいて処理のステツプは、テーブルからテキスト
のブロツクの識別子の各グループの表示を読出す
ステツプを備え、テキストのブロツク識別子の各
グループは、決定のステツプにおいて決定される
各同等単語に対応する。 さらに好ましい構成に従つて、処理のステツプ
はさらに、スコアを形成するステツプにおいてテ
ーブルから読出されたテキストのブロツク識別子
の表示による少なくとも1つの組合せ分類を実行
するステツプを備える。 さらに、好ましくは、処理のステツプは以下の
ステツプを含む。同じテキストのブロツク識別子
のいかなる表示も複製することなく、同等単語の
各組に対応するグループ内のテキストのブロツク
識別子の表示を組合せて同等単語の各組に対する
テキストのブロツク識別子のさらなるグループを
形成し、そのさらなるグループの表示を処理し
て、それによつてスコアを形成する。 好ましくは、さらに処理を行なうステツプは、
同じテキストのブロツク識別子のいかなる表示も
複製することなく、テキストのブロツク識別子の
さらなるグループの各々からのテキストのブロツ
ク識別子の表示を組合せるステツプを含む。スコ
アを形成するステツプは、テキストのブロツクの
各々ごとに、個々のスコアを形成するステツプを
含む。各スコアは、そのようなテキストのブロツ
クに対応する少なくとも1つのテキストのブロツ
ク識別子の表示を含む前記さらなるグループの数
を指示する。 さらに、好ましくは、処理のステツプは、複数
のテキストのブロツクの各々に対しスコアを与え
るステツプを含む。各テキストのブロツクに対す
る各スコアは、対応するテキストのブロツクにお
ける少なくとも1つの同等単語を含む組の総数の
指示を与える。また好ましくは、処理のステツプ
は、複数のテキストのブロツクの各々に対するス
コアを形成するステツプを含む。スコアを利用し
て出力データを与えるステツプは、出力に対し記
憶されたデータベースからテキストのブロツクの
表示を選択するステツプを含む。ブロツクは、テ
キストのブロツク識別子によつて指示される。テ
キストのブロツクの選択された表示は、次に出力
となり、そこでは、ブロツクは、対応するテキス
トのブロツク識別子に対するスコアに対応する順
に並ぶ。 好ましくは、テキストのブロツクの表示は、ス
コアに従つて値が減少する順序の出力である。さ
らに、好ましくは、処理のステツプは、ポインタ
の組を形成するステツプを含む。各ポインタの組
は、テキストのブロツクの識別子のグループのう
ちの1つに対する少なくとも1つのポインタの表
示を含む。ポインタの組からの少なくとも1つの
ポインタの表示は、記憶されたテーブルにおける
対応するグループからテキストのブロツク識別子
を選択するために利用される。 さらに好ましくは、同等単語の対応する組を決
定するステツプは、質問単語の容認し得る綴り誤
りおよび容認し得る語尾変化である、データベー
スにおける単語を選択するステツプを含む。 好ましくは、容認し得る綴り誤りおよび容認し
得る語尾変化である単語を選択するステツプは、
質問単語の語幹とデータベース単語の語頭文字と
の間の、正確な一致、、1文字交叉、1文字削除、
および1文字挿入を有するデータベース単語を選
択するステツプを含む。 上記のようなスコアリングによつて、ユーザー
が最も好ましい順序でアクセスされたデータレコ
ードを得ることが可能となる。 【図面の簡単な説明】 第1図は、この発明による手段および方法を具
体化するデイジタルデータ処理システムのブロツ
ク図である。 第2図は、第1図のシステムの全処理を示すフ
ローチヤートである。 第3図は、第1図のシステムの処理のシーケン
スを示すフローチヤートであり、処理の初期ステ
ツプを一般化し、かつ処理の後の方のステツプに
おいてより詳細になる。 第4図は、スコア方法を実行するためのデイジ
タルデータ処理手段の概略ブロツク図である。 第5図は、第5A図ないし第5D図からなり、
スコア方法に関連する第1図のデイジタルデータ
処理システムの処理のシーケンスの一部を詳細に
示すフローチヤートである。 第6図は、第5図に示された処理に利用される
RAM1104に含まれる種々のバツフアの概略
ブロツク図である。 第7図は、デイスク記憶装置1107に記憶さ
れ、かつ第5図に示された処理の間に第1図のデ
イジタルデータ処理システムによつて利用され
る、テキストのデータベースの部分の概略ブロツ
ク図である。 第8図ないし第16図は、第6図のパツケージ
バツフア130に含まれるパツケージに、第7図
の段落基準のテーブルに含まれる段落基準ととも
に、第5図に示された方法を実行する間の、第6
図に示された或るバツフアの記憶内容の例を与え
るブロツク図である。 詳細な説明 索 引 一般的な説明 A コンピユータプログラム方法および手段 1 前書 2 方法の概要 3 テキストのブロツクを位置決めするための方
法および手段の概要 B 第1図および第5図の方法および手段の詳細
な説明 テーブル A テーブルの索引 1 QDCMD方法および手段に用いるバツフア 2 QDCMD方法および手段に用いる変数 3 テキストのデータベースの例 4 例−データベースにおける段落基準(段落識
別子)のテーブル 5 質問単語「RATES」および「INTEREST」
に対する段落基準および対応するスコアの例 6 組合せ処理後の段落基準(テキストのブロツ
ク識別子)および対応するスコアの例 一般的な説明 A コンピユータプログラム方法および手段 1 前書 第1図は、プログラマブルデイジタルデータ
処理システムの概略ブロツク図である。ハード
ウエアおよびコンピユータプログラムが含まれ
ており、コンピユータプログラムはリードオン
リメモリ内に記憶されており、質問単語の容認
し得る綴り誤りおよび容認し得る語尾変化の両
方である記憶されたデータベース内に含まれる
候補(またエントリとも呼ばれる)単語を位置
決めおよび決定するためのものである。データ
ベースは好ましくは、段落および記録に配列さ
れるテキストのデータベースである。ハードウ
エアおよびソフトウエアがまた含まれ、質問単
語の容認し得る綴り誤りおよび容認し得る語尾
変化であるエントリ単語を用い、かつ段落が容
認し得るエントリ単語といかによく一致するか
に従つてデータベースの段落をスコアする。デ
ータベースの段落の表示は、スコアの減少する
順に使用者に戻され、最良のスコアされた段落
は最初に戻される。 第1図を参照すると、使用者は端末1102
を用いて、システム内に質問単語を入れ、各単
語は1つまたはより多い文字で構成されてい
る。次にインターフエイス1103、マイクロ
プロセツサ1108、ランダムアクセスメモリ
(RAM)1104、およびリードオンリメモ
リ(ROM)1106を含む外部回路は、質問
単語を解剖し、かつストツプ単語と呼ばれる質
問に対してほとんどまたは全く重要性のない単
語を捨てる。残りの質問単語は、意味のある質
問単語として参照される。解剖後の意味のある
質問単語は、RAM1104内にストアされ、
かつ次に1つずつ取出されて、意味のある質問
単語の容認し得る綴り誤りおよび容認し得る語
尾変化の両方であるデータベースエントリ単語
を位置決めするための記憶されたデータベース
におけるエントリを問合せるために用いられ
る。データベースのエントリ単語の表示は、
種々の形態でメモリ、つまり外部デイスク記憶
装置1107内に記憶され、そして必要なとき
にデイスク制御装置1105を通じてランダム
アクセスメモリ(RAM)1104に処理のた
めに転送される。 QAP制御ボード1109は、プログラマブ
ルマイクロプロセツサシステムである。より詳
しくは、QAP制御ボード1109は、マイク
ロプロセツサ1118および綴り誤り類別シス
テム1114を含み、綴り誤り類別システム1
114はプログラマブルマイクロプロセツサを
また含む。このシステムには、簡単のために1
つであるとして示され、そしてここではリード
オンリメモリ(ROM)1122,1124と
して示されている2つのリードオンリメモリ
と、簡単のために1つとして示されそしてここ
ではランダムアクセスメモリ(RAM)112
6,1128として示されている2つのランダ
ムアクセスメモリと、先入れ先出し(FIFO)
メモリ1130とがさらに含まれる。包括的に
1115で示されたインターフエイスおよび制
御システムは、マイクロプロセツサ1118と
バス1110との間をインターフエイスし、し
たがつて残りの外部回路をバス1110の右側
にインターフエイスする。インターフエイス制
御システム1115はまたマイクロプロセツサ
1118とROM1122,1124、RAM
1126,1128、およびFIFO1130と
の間をインターフエイスする。FIFO1130
は、MCS1114とマイクロプロセツサ11
18との間でデータを転送するための主通信を
与える。 マイクロプロセツサ1118の動作を制御す
るプログラムは、ROM1122,1124内
に記憶されている。RAM1126,1128
は、探索パツドメモリならびにマイクロプロセ
ツサ1118によつてその処理において用いら
れる種々の値に対する記憶を与える。 簡単には、各意味のある質問単語の表示は、
RAM1104からRAM1126,1128
に転送される。ここでマイクロプロセツサ11
18は一度に1つずつ質問単語を取出し、その
質問単語から接尾辞を取り去り、語幹を残し、
そして質問単語に対する接尾辞類別指示を形成
する。次に質問単語は、FIFO1130を通つ
てMCS1114に送られる。さらに質問単語
に対する一群のエントリ単語が、RAM110
4からFIFO1130を通つてMCS1114に
転送される。次にMCS1114におけるマイ
クロプロセツサは、質問単語の語幹を取出し、
それをエントリ単語の最初の文字と比例し、そ
して各エントリ単語に対して綴り誤りの類別を
決定する。質問単語語幹と比較されて容認し得
る綴り誤り類別を持つように決定されたこれら
のエントリ単語は、エントリ単語に対する綴り
誤り類別とともにFIFO1130へそしてそこ
からRAM1126,1128へ転送し返され
る。次にこの点で、RAM1126,1128
は、対応する質問単語の容認し得る綴り誤りで
あるエントリ単語、対応する質問単語の語幹の
長さ、および対応する質問単語に対する接尾辞
類別指示を含んでいる。次にマイクロプロセツ
サ1118は、語幹の長さおよび綴り誤り類別
値を用いて、各エント単語における接尾辞の位
置を決定し、さらに接尾辞類別指示を用いて、
エントリ単語が原質問単語の容認し得る語尾変
化であるかどうかを決定する。容認し得る綴り
誤りでありかつ原質問単語の容認し得る語尾変
化であるエントリ単語は、質問に対する相当単
語と呼ばれ、これらの相当単語の表示は次に
RAM1104に転送し返され、そこでそれら
はこの後より詳細に説明されるように、スコア
リングのためのパツケージを形成しかつ使用者
に対して出力するために用いられる。 2 方法の概要 第1図のシステムの全体的ブロツク図を頭に
おいて、ここで第2図の全体的なフローチヤー
トを考察する。まず最初に3008で示される
ように、使用者は、オペレータコンソール11
02(第1図)のキーボード1102Aを用い
て、質問を作り出す。その質問は、使用者がデ
イスク1107に記憶された原データベースの
段落における組合せにおいて見つけたいと思つ
ている1つまたはそれ以上の質問単語から成つ
ている。例示的に、その質問単語は「RATES
OF INTEREST」であつてもよい。 ブロツク3012で示されるように、第1図
のデータ処理システムは次にストツプ単語の3
010のテーブルを用いて、質問からストツプ
単語を識別しかつ除去して、意味のある質問単
語を残す。次に意味のある質問単語は、残りの
フローに1つずつ送られる。 各質問単語は、質問単語の語幹および質問単
語の語幹の長さを決定することによつて、30
15で示されるように処理される。さらに質問
単語の接尾辞が質問単語から剥ぎ取られ、語幹
のみが残される。質問単語の接尾辞のみまたは
語幹の隣接部分と組合せたものが、質問単語の
語幹に対して容認し得る接尾辞の種類を決定す
るために用いられる。より詳細に説明すれば、
容認し得る接尾辞の種類は、その後頭文字が質
問単語の語幹の容認し得る綴り誤りであるエン
トリ(候補)単語が、容認し得る接尾辞を持つ
ており、したがつてそのエントリ単語が容認し
得る綴り誤りでありかつ質問単語の容認し得る
語尾変化であるかどうか、ということを決定す
るために用いられる。したがつてフローのブロ
ツク3015の後に、システムはその質問の各
質問単語に対して次のものを決定する。すなわ
ち、除去された接尾辞(すなわち単語
「RATES」に対して接尾辞「ES」が剥ぎ取ら
れて質問語幹「RAT」に残している)を持つ
原質問単語である質問語幹3016、語幹の長
さ(すなわち質問単語(RATES」に対して語
幹長は3である)を示す語幹長指示3018、
および質問単語の接尾辞が含まれる種類を示す
接尾辞種類指示3020である。 テキストのデータベースは、エントリ単語を
含む。テキストのデータベースの或る部分はエ
ントリ単語のデイクシヨナリであり、エントリ
単語は最初の2文字によつてアクセス可能であ
りかつ記憶される。同一の最初の2文字を持つ
単語はすべて一緒に記憶される。たとえば、文
字AAで始まる意味のある単語の表示は一緒に
配列され、文字ABで始まる意味のある単語の
表示は一緒に配列され、…というようにされ
る。同一の最初の2文字を持つデータベースエ
ントリ単語は、データベースエントリ単語のフ
アミリーと呼ばれる。エントリ単語のそのよう
な配列は、データベースの好ましい配列ではあ
るが、この発明の本質ではない。 質問単語の1つに対応するエントリ単語のフ
アミリーは、質問語幹3016を質問単語に対
応するフアミリーにおけるエントリ単語の各々
の語頭文字と比較してフローのブロツク302
4で最初に処理され、それによつて質問単語語
幹3016の容認し得る綴り誤りであるエント
リ単語のセツト3026を形成する。したがつ
て質問単語に対応するエントリ単語のフアミリ
ーは、語頭が質問単語語幹の容認し得る綴り誤
りであるエントリ単語のセツトに縮小される。 フローのブロツク3030の間に、語頭文字
が質問単語語幹3016の容認し得る綴り誤り
であるセツト3026におけるエントリ単語が
次に調べられて、それらが原質問単語の容認し
得る語尾変化であるかどうかが決定される。こ
のために、質問単語に対する接尾辞種類表示3
020が、容認し得ると接尾辞がそこから得ら
れる容認し得る接尾辞テーブル3028をアク
セスするために用いられ、またセツト3026
におけるエントリ単語と比較されて、容認し得
る接尾辞を持つておりしたがつて容認し得る語
尾変化であるものを決定する。ブロツク303
0に続いて、質問単語の容認し得る綴り誤りお
よび容認し得る語尾変化(すなわち同等性)で
あるエントリ単語のセツト3031が存在す
る。 フローのブロツク3032の間に、システム
はセツト3031の各エントリ単語に対するパ
ケツトを有する質問単語に対するパツケージ3
038を形成する。各パケツトは、記憶された
データベースにおける対応するエントリ単語に
関して情報を位置決めするために用いられるコ
ード化された情報または指示のセツトを含む。
この発明にとつて興味あることは、各パケツト
が、以下に説明するように、対応するエントリ
単語がテキストのデータベースに含まれるドキ
ユメント内の段落および/またはドキユメント
の各々を位置決めするために用いられる指示を
持つているということである。 次に別の意味のある質問単語に対してブロツ
ク3015,3024,3030および303
4における方法のステツプが繰返され、それに
よつて次の質問単語に対する(上で論議された
タイプの)容認し得る綴り誤りおよび容認し得
る語尾変化の両方であるエントリ単語を位置決
めする。パツケージ3038が次の質問単語に
対して形成され、対応する質問単語の容認し得
る綴り誤りおよび容認し得る語尾変化であるエ
ントリ単語の各々に対するパケツトを含んでい
る。この処理は、上で議論した方法で、質問単
語の各々に対して形成されているパツケージを
持つ質問の意味のある単語の各々に対して繰返
される。 フローのブロツク3036の間に、質問単語
の各々に対して1つずつ、パツケージ3038
を用いて、同等性単語の各々が含まれている現
実の段落(そして所望ならばドキユメント)を
識別する段落基準が得られる。テキストのデー
タベースにおける各段落に対する段落基準は、
次にそれがいかによく同等性単語と一致するか
ということに従つてスコアされ、そして最後に
はブロツク3044で、スコアされてしまつた
段落基準に対応するデータベースの段落が、オ
ペレータコンソール1102のCRT上の視覚
的デイスプレイに対して出力される。テキスト
の現段落を含むテキストのデータベースはフロ
ーにおいて3034で包括的に示されており、
段落基準を用いて、かつデータ処理技術におい
て周知の技術を用いて、アクセスされかつ読出
される。 質問の単語と最もよく一致する、一般的にテ
キストのブロツクと呼ばれる、テキストの段落
および記録を、記憶されたテキストのデータベ
ースに位置決めするための方法、およびテキス
トのブロツクが使用者に対し出力される方法
を、以下のセクシヨンにおいてより詳細に説明
する。 3 テキストのブロツクを位置決めするための方
法および手段の概要 テキストのデータベースと任意のテキストの
質問における単語の組合わせとの間の一致を決
定するための、第1図におけるものと同様の、
デイジタルデータ処理システムを用いる方法
が、第3図に示されている。テキストのブロツ
クに含まれる質問の同等単語の数に基づいて、
データベースにおける他のテキストのブロツク
に関してテキストのブロツクをランク付けする
スコア技術が用いられる。 第3図を参照して、デイジタルデータ処理シ
ステムは、以下の方法を実行する。フローのブ
ロツク3050の間に、使用者は、オペレータ
端子1102に、システムにおける質問の単語
の表示を形成する。その結果、これらの質問単
語は、システムによつて受取られる。この質問
は、使用者がデイスク1107に記憶されたデ
ータベースの1つのテキストのブロツクに位置
決めすることを望む質問単語の組合わせであ
る。ここにおいては例として、各テキストのブ
ロツクは、ドキユメント内の段落である。 たとえば、テーブル3は、デイスク1107
に記憶されたテキストのデータベースを与え
る。テーブル3を参照すると、たとえば3つの
ドキユメントが存在する。ドキユメント1は段
落1〜9を有し、ドキユメント2は段落1〜2
0を有し、またドキユメント3は段落1〜29
を有する。たとえばここにおいては、テキスト
のブロツクは、テーブル3の左端に示されるよ
うに、ドキユメント1の第1段落で始まりドキ
ユメント3の最後の段落で終わる番号が順に付
けられている。簡単のために、テーブル3は、
すべての段落のすべてのセンテンスを含んでは
いない。興味ある各段落内のセンテンスのみが
示される。質問は、たとえば、単語「RATES
OF INTEREST」である。ブロツク3052
で、質問は解剖され、興味のある質問単語
「RATES」および「INTEREST」を残して、
ストツプ単語「OF」が除去される。ブロツク
3054の間に、データ処理システムは、同等
エントリ単語の組を形成し、それらは変形セツ
トメモリと呼ばれるメモリに記憶される。この
メモリは、たとえば、第1図におけるRAM1
104である。 第3図のフローのブロツク3050,305
2および3054は、一般的に、第2図のフロ
ーチヤートのフローブロツク3008ないし3
032に対応する。したがつて、フローにおけ
るブロツク3054に従つて、変形セツトメモ
リは、質問の意味のある単語の各々に対する同
等単語の表示の組(すなわちパツケージ)を含
む。同等単語は、好ましくは、上述したように
決定される質問の意味のある単語の容認し得る
綴り誤りおよび容認し得る語尾変化である、デ
ータベースからエントリ単語である。同等単語
の表示は、その単語がテキストのブロツクのど
こで発見され得るかに対するポインタのよう
な、同等単語に関する情報を与える。 テーブル4は、意味のある質問単語RATES
およびINTERESTの同等のものであるデータ
ベースからの単語のリストの例を与える。たと
えば、質問単語INTERESTに対する同等単語
は、単語INTEREST、INTERESTING、お
よびINTERETであ。質問単語RATESに対す
る同等単語は、RATE、RATES、および
RATINGである。テーブル4はまた、データ
ベースに含まれかつデイスク1107に記憶さ
れるテキストのブロツク識別子のテーブルの一
部の内容の例である。データベースにおける異
なつたエントリ単語の各々に対応する、テーブ
ルに対する記憶位置が存在する。各エントリ単
語に対応する記憶位置は、対応するエントリ単
語が位置決めされるテキストのブロツクの各々
(段落およびドキユメント)を識別する、1つ
またはより多くのテキストのブロツク識別子
(段落基準でもある)を含む。たとえば、テー
ブル4および3を参照すると、エントリ単語
INTERESTは、テキストのブロツク識別子2
に対応するドキユメント1、段落2、テキスト
のブロツク識別子4に対応するドキユメント
1、段落4、テキストのブロツク識別子12に
対応する段落3、ドキユメント2、などに位置
決めされる。第3図のフローチヤートは、30
56でのテキストのブロツク識別子のテーブル
を示す。 フローのブロツク3058の間にデータ処理
システムは、各組における各同等エントリ単語
に対し、テーブル3056に記憶された対応す
るテキストのブロツク識別子を決定するように
動作する。たとえば、テーブル4は、左側に同
等エントリ単語の例を示し、右側に対応するテ
キストのブロツク識別子を示す。 ここでスコアの原理について考察する。好ま
しくは、発見される各テキストのブロツクは、
テキストのブロツクにおけると同一の少なくと
も1つと同等単語を含む組の総数を表わす値
で、別々にスコアされる。1つの組が同じテキ
ストのブロツクにおける1つまたはより多くの
単語と同一である1つ以上の同等単語を含む場
合であつても、どのテキストのブロツクに対し
ても、1よりも大きい増分値は指定されない。 テーブル5は、テーブル4に示された同等エ
ントリ単語の組に対する種々のテキストのブロ
ツク識別子およびその結果としてのスコアを示
すために例として与えられる。第1の同等の組
は単語RATE、RATES、およびRATINGか
らなり、また第2の組はINTEREST、
INTERESTING、およびINTERETからな
る。テーブル3および4を参照すると、テキス
トのブロツク1は同等エントリ単語RATESを
含むが、単語INTERESTに対応する組からの
同等エントリ単語のいかなるものをも含まな
い。したがつて、そのスコアは1である。しか
し、テキストのブロツク4は単語RATE、
RATES、およびINTERESTを含むが、スコ
アの2を受けるのみである。スコアは、テキス
トのブロツク4における単語と一致する1つの
単語(または1つ以上の単語)を含む同等単語
の2つの組の各々に対し1をカウントすること
によつて作られるカウントである。言い換えれ
ば、同じ同等の組内に両単語RATEおよび
RATESを有するために、付加的なカウントは
与えられない。同等の解析が、テーブル5に要
約されるように、他のテキストのブロツクに対
するスコアを決定するために用いられ得る。 テキストの単語におけるすべての質問に対
し、可能な最大段落スコアはNであり、ここで
Nは同等単語の組の数である。0からNまでの
すべての整数のスコアが可能である。システム
はまた、同等単語を全く含まないテキストのブ
ロツクが0をスコアし、かつ質問と無関係であ
るとして判定されるように構成され得る。おそ
らく、少なくとも1つの同等単語を含むもの
は、関連するものであろう。より多くの同等の
ものを含むテキストのブロツクは、より少ない
同等単語を含むテキストのブロツクよりもより
関連するものであると思われる。ここに用いら
れる「同等単語」は、対応する質問単語と正確
に一致する単語、ならびに、質問単語の容認し
得る綴り誤りおよび語尾変化である単語、およ
び質問単語の容認し得る綴り誤りおよび語尾変
化と同義である単語を含むことを意図してい
る。 任意の同等単語がテキストのブロツクにおい
て起こる回数は関係がないということを認識す
ることが重要である。たとえば、任意の同等単
語を9回含むテキストのブロツクは、その単語
を含む同等の各組に対しスコアの1を受取るの
みである。 ここで第3図のフローに戻つて、システムが
動作する方法を考察する。ブロツク3060の
間に、データ処理システムは、バツフアメモリ
内に、各同等単語の組における各同等単語に対
応するテーブル3056からのテキストのブロ
ツク識別子を記憶する。テキストのブロツク識
別子の異なつた組は、同等単語の各組に対し、
(したがつて各意味のある質問単語に対し)記
憶される。 ブロツク3060の間に、テキストのブロツ
ク識別子を複製することなく、テキストのブロ
ツク識別子が組合わせられる。これを組合せ分
類とよぶ。また各結果としてのテキストのブロ
ツク識別子はスコアされる。各特定の結果的テ
キストのブロツク識別子に対するスコアは、特
定のテキストのブロツク識別子に対応する、テ
キストのブロツクにおける少なくとも1つの同
等単語を有する、同等単語の異なつた組の数を
与える。このことは、テキストのブロツク識別
子が発生する異なつた組の数を、テキストのブ
ロツク識別子が同一組において1回以上起こつ
ても重ねてカウントすることなく、カウントす
ることによつて達成される。 フローのブロツク3064の間に、テキスト
のブロツク識別子は、テキストのブロツク識別
子がスコアの値によつて降下的順序となるよう
に、スコアによつて分類される。テーブル6
は、最高のスコアを有するテキストのブロツク
を最初に、最低のスコアを有するテキストのブ
ロツクを最後に、スコアによる降下的順序に分
類されたテーブル5のテキストのブロツク識別
子を示す。他の分類順序は、この後議論する。 フローのブロツク3066の間に、データベ
ース内のテキストのブロツクの表示は、最高の
スコアで始まるスコアによつて出力される。こ
のために、第3図のブロツク3068で示され
るテキストのデータベースは、テーブル3に示
されるようなテキストのデータベースの表示を
含む。各テキストのブロツク識別子は、対応す
るドキユメントおよび段落をテキストのデータ
ベースに位置決めするために用いられる、か
つ、ドキユメントおよび段落における実際のテ
キストの表示を制御装置1102のCRT11
02Bを通じて使用者に戻すための、ポインタ
である。 第4図は、第2図のフローによつて示される
処理の一部を実行するための、デイジタルデー
タ処理手段の一般化されたブロツク図である。
変形セツトメモリ3070は、質問単語の各々
に対する同等エントリ単語(候補単語)の組を
記憶するために設けられる。メモリ3070
は、多くの異なつた形態における同等エントリ
単語の表示を記憶し得る。たとえば、変形セツ
トメモリは、実際の同等エントリ単語を表わす
コード化された文字を記憶し得る。しかし、好
ましくは、変形セツトメモリは、同等エントリ
単語の表示を記憶し、そこでは、表示はアドレ
スポインタなどであり、その表示は同等エント
リ単語の各々に関する情報を位置決めするため
に用いられる。後者の場合において、対応する
同等単語が位置決めされるすべてのテキストの
ブロツクを与える、対応するテキストのブロツ
ク識別子を含む、テキストのブロツク識別子の
記憶されたテーブルにおける位置を位置決めす
るための情報を与える値が記憶される。 同等単語によつて構成されるテキストのブロ
ツク識別子のテーブルを記憶するためのメモリ
3072が示されている。このテーブルは、多
くの異なつた方法で構成され得る。しかし好ま
しくは、このメモリは、同等単語を用いて選択
可能である。たとえば、各同等エントリ単語
は、1つの値(すなわち変形セツトメモリ30
70に含まれる値のうちの1つ)を指定され、
かつメモリにおける記憶位置に対応する値を指
定される。各記憶位置は、対応する同等単語に
対するテキストのブロツク識別子の各々含む。
したがつて、メモリ3072における記憶位置
の各々は、テキストのブロツク識別子のグルー
プを含み、各グループは、テーブル4に一般的
に示されるように記憶されたデータベース内の
異なつた同等エントリ単語に対応する。 選択回路1074は、メモリ3070に含ま
れる各セツトにおける各同等エントリ単語の表
示を利用して、メモリ3072からテキストの
ブロツク識別子の対応するグループを得る。選
択回路は、多くの異なつた方法で構成され得
る。たとえば、変形セツトメモリ3070に記
憶される表示が、実際の同等エントリ単語の表
示であり、かつメモリ3072におけるテーブ
ルが、テキストのブロツク識別子の対応するグ
ループが後続するデータベースの実際のエント
リ単語の表示を含むならば、選択回路3074
は、比較器として構成されて、同等エントリ単
語をメモリ3072のテーブルにおけるエント
リ単語と一致するかどうか比較してもよい。一
致が発見されると、対応するテキストのブロツ
ク識別子は、対応するメモリ記憶位置から読出
される。 しかし、好ましい実施例において、メモリ3
070に記憶される値は、メモリ3072のテ
ーブル内へのアドレスポインタまたは識別子と
して用いられ、それによつて、対応するテキス
トのブロツク識別子を(直接にまたは間接に)
位置決めしかつ読出す。 テキストのブロツク識別子およびスコアメモ
リ3076が与えられる。メモリ3076は、
メモリ3072におけるテーブルから得られる
テキストのブロツク識別子の各々を記憶する。
テキストのブロツク識別子は、好ましくは、組
で記憶され、1つの組は各同等エントリ単語に
対し、また各組は対応する同等エントリ単語に
対するテキストのブロツク識別子のすべてを含
む。組合わせ段落識別子および増分スコア回路
3078は、異なつた組の各々からのテキスト
のブロツク識別子を組合わせ、かつそれらをメ
モリ3076に記憶し、それによつて、テキス
トのブロツク識別子の1つのリストが複写なし
で形成される。各テキストのブロツク識別子に
対応して、テキストのブロツク識別子が各異な
つた組において発生した回数を示すスコアまた
はカウントが形成される。 好ましくは、分類器3080は、組合わせら
れたテキストのブロツク識別子を、スコアによ
る降下的値の順序に分類する。 次に要約すれば、質問と最もよく一致するテ
キストのブロツクを記憶されたテキストのデー
タベースに位置決めするための、デイジタルデ
ータ処理手段およびテキストのブロツク識別子
のテーブルの記憶された表示を用いる方法が説
明されてきた。たとえば、テキストのブロツク
は、段落またはドキユメント内の段落である。
個々のテキストのブロツク識別子の表示は、グ
ループをなしてテーブルから選択可能であり、
各グループは記憶されたデータベースにおける
別々の単語に対応する。テキストのブロツク識
別子の各グループ内の表示における各テキスト
のブロツク識別子は、対応する単語を含む記憶
されたデータベースにおけるテキストのブロツ
ク指示を与える。 方法は、以下のステツプを含む。記憶された
データベースに含まれるテキストのブロツクに
おいて捜されるべき複数の単語の表示を有する
質問単語が受取られる。複数の質問単語の各々
に対し、記憶されたデータベースに含まれる同
等単語の対応する組が決定される。同等単語の
各組は、対応する質問単語と同等である。各同
等単語は、記憶されたテーブルに表わされるテ
キストのブロツク識別子の対応するグループを
有する。方法はまた、決定された同等単語に対
応するグループにおけるテキストのブロツク識
別子の表示を処理して、それによつて、少なく
とも1つのテキストのブロツクに対するスコア
を形成するステツプを含む。スコアは、少なく
とも1つのテキストのブロツクにおける少なく
とも1つの同等単語を有する組の総数の指示を
与える。 最後にスコアは、記憶されたテキストのデー
タベースにおける選択されたテキストのブロツ
クに関する出力データを与えるために用いられ
る。好ましくは、テキストのブロツク識別子
は、スコアに従つて下降的順序に分類され、ま
た、各テキストのブロツク識別子に対応するデ
ータベースの対応するブロツクの表示は、読出
されて、オペレータコンソールCRTに出力さ
れる。 B 第1図および第5図の方法および手段の詳細
な説明 第5図(第5A図〜第5D図)は、第1図のシ
ステムの処理のシーケンスを示すフローチヤート
であり、QDPCMDプログラムを実行し、
QDPCMDは、前に形成された同等単語の表示に
依存して、データベースの段落が分類されるよう
にする。 含まれる方法および手段は、或るバツフアを用
いる。これらのバツフアの名前およびその各々の
目的の説明は、テーブル1に示されている。テー
ブル1にリストされかつ説明されたバツフアの表
示は、ランダムアクセスメモリ(RAM)110
4に含まれる。第6図は、テーブル1にリストさ
れる種々のバツフアを示すブロツク図である。バ
ツフア120,122,124,126および1
28は、段落基準の処理および組合わせのため、
かつスコアを形成するために用いられる主要なバ
ツフアである。 第7図を参照すると、デイスク記憶装置110
7は、記憶されたデータベースの一部である段落
基準のテーブルの表示を含む。このテーブルは一
般的に300として指定され、また例として、番
号300−1,300−60,300−61,3
00−62,300−80,300−81,30
0−82によつて表わされるメモリ記憶位置をも
つて示されている。他のメモリ記憶位置は、点線
によつて示されている。各メモリ記憶位置は、同
等単語に対応する。たとえば、メモリ記憶位置3
00−60,−61および−62は、同等単語
INTEREST、INTERESTING、および
INTERETに対応し、メモリ記憶位置300−
80,−81および−82は、同等単語RATE、
RATES、およびRATINGに対応する。したが
つて、テーブル300における各メモリ記憶位置
は、データベースにおける異なつた単語に対応す
る。デーブル300における各メモリ記憶位置
は、対応するデータベース単語に対する段落基準
のグループを含む。たとえば、メモリ記憶位置3
00−60は、データベース単語INTERESTに
対するすべての段落基準を含む。段落基準は、対
応する単語が位置決めされる段落および各ドキユ
メントを識別する値である。たとえば、データベ
ース単語INTERESTに対応するメモリ記憶位置
300−60は、段落基準2,4,12,20,
28および31を含む。これらはテーブル6に示
されたINTERESTに対する同一の段落基準(テ
キストのブロツク識別子)であるということが認
識されよう。テーブル3を参照すると、これらの
段落基準は、テーブルの左側に沿つて示される段
落基準に対応し、また、対応する単語がテキスト
のデータベースにおいて発見されるドキユメント
および段落を識別する。 データベースにおける実際のテキストの表示
は、第6図に400で示されたデイスク装置11
07の特別のメモリ領域に記憶される。記憶され
たテキストのデータベース400の段落の各々
は、段落基準300のテーブルにおける段落基準
の別々のものを用いてアクセス可能である。第6
図の記憶されたテキストのデータベースは、段落
基準1,2ないしZに対応するメモリ記憶位置を
もつて表わされており、ここではZは、データベ
ースの最後の段落であり、データベースの欠けた
段落は、点線によつて示されている。 第5図を参照すると、パツケージ(結果)バツ
フア130が、2つのパツケージ、すなわちパツ
ケージ(PKG)1およびパツケージ(PKG)2
をもつて示されている。上述したように、第1A
図のデイジタルデータ処理手段は、1つまたはよ
り多くの質問単語からなるオペレータ端子110
2から質問を受取るように動作し、かつ次に、各
質問単語に対し、対応する質問単語の容認し得る
綴り誤りおよび容認し得る語尾変化である同等単
語の組を形成するように動作する。同義であるよ
うな他の同等単語はまた、当業者にとつて明白で
あるように、同等単語に含まれてもよい。各パツ
ケージは、異なつた意味のある質問単語に対応
し、また同等単語の各々に対応するパケツトを含
む。パケツトは、デイジタルデータ処理システム
によつて、段落基準300のテーブル(第7図)
における対応する記憶位置を位置決めしかつアク
セスするために用いられる、デイジタルデータ表
示の組である。各パケツトに含まれる表示は、た
とえば、デイスク記憶装置1107に記憶される
テーブルの開始に関して、テーブル300におけ
るメモリ記憶位置を識別する間接アドレスであつ
てもよく、また実際のアドレスであつてもよい。
テーブル300における各メモリ記憶位置を位置
決めするための他のコード化方法は、当業者にと
つて明らかであろう。 第6図を詳細に参照すると、たとえば、パツケ
ージPKG1は、第7図における同一番号によつ
て識別されるメモリ記憶位置に対応する番号30
0−60,300−61および300−62によ
つて一般的に指定される表示を含む。値300−
60,300−61およ、び300−62を含む
メモリ記憶位置は、パツケージPKG1のP1,
P2およびP3として識別されるパツケージであ
る。同様に、パツケージPKG2は、段落基準3
00のテーブル(第7図)における対応した番号
の記憶位置に参照されるパケツト300−80,
300−81および300−82を含む。パケツ
ト300−80,300−81および300−8
2は、パツケージPKG2のパケツトP1,P2
およびP3である。たとえば、第6図は、パツケ
ージPKG1,PKG2ないしPKGZを示すが、パ
ツケージPKG1およびPKG2のみが、ここに与
えられる例においては利用される。また例とし
て、パツケージの各々は、パケツトP1ないし
PYの記憶に対する位置を持つものとして示され
ているが、パツケージPKG1およびPKG2の最
初の3つのパケツトのみが示されて例として用い
られる。パケツトは同一数のパケツトおよびパケ
ツトを記憶するための記憶位置をもつて示されて
いるが、パケツトの数はパツケージ間で変化され
てもよいということが理解されよう。 質問通信バツフア132は、RAM1104に
含まれ、次のようなシステムに用いられる或る変
数を記憶する。記憶位置220は、任意の質問に
対するパツケージの数であるパツケージカウント
(PACKAGES COUNT)を記憶する。質問通
信バツフア132のメモリ記憶位置224は、メ
モリ内の記憶位置のアレイであるパツケージサイ
ズ(PACKAGES SIZE)を含む。各メモリ記
憶位置は、パツケージバツフア130におけるパ
ツケージのうちの1つにおけるパケツトの数の表
示を含む。メモリ記憶位置224のアレイのサイ
ズは、使用者の質問が含んでもよい意味のある単
語の最大数であり、したがつて、パツケージバツ
フア130に含まれてもよいパツケージの最大数
である。たとえば、パツケージサイズ
(PACKAGES SIZE)アレイ224は、パツケ
ージPKG1,PKG2…PKGXに対応する224
−1ないし224−Xとして示される記憶位置を
有する。 質問通信バツフア132のメモリ記憶位置22
6は、パツケージバツフア130の開始のアドレ
スであるパツケージバツフア記憶位置
(PACKAGES BUFFER LOCATION)を含
む。メモリ記憶位置228は、スコア組合わせ処
理の完了に続く一致バツフア124におけるエン
トリの数である一致エントリ(MATCH ENT
RIES)を含む。QDPCMDプログラムからのエ
グジツトの上に、記憶位置228は、(意味のあ
る質問単語の正確な一致を含む)任意の意味のあ
る質問単語の任意の容認し得る綴り誤りおよび容
認し得る語尾変化の1つまたはより多くの発生を
含むデータベース内の段落の数である一致カウン
ト(MATCH COUNT)を含む。メモリ記憶
位置230は、一致バツフア124の開始のアド
レスである一致バツフア記憶位置(MATCH
BUFFER LACATION)を含む。 変数バツフア134は、テーブル2に示される
残りの変数、すなわち変数132〜252を含む。 第5図のフローチヤートは、ブロツク標識F1
ないしF32を有して示されている。各ブロツク
は、このブロツクに対応する第1図のデイジタル
データ処理システムによつて実行される処理を示
す概略説明を含む。 ここで、パツケージバツフア130が第6図の
パツケージPKG1およびPKG2に示される基準
値でロードされてしまい、データベース300に
おける段落基準のテーブルが第7図に示される3
00−60,−61,−62,−80,−81および
−82での値を含み、第7図に示される記憶され
たテキストのデータベース400がテーブル3に
示されるテキストのデータベースの例を含むと仮
定する。また、意味のある質問単語は
INTERESTおよびRATEであり、パツケージバ
ツフア130は同等エントリ単語INTEREST、
INTERSTING、INTEREST、RATE、
RATES、およびRATINGにそれぞれ対応する
パケツト300−60,−61,−62、ならびに
−80,−81および−82を含むと仮定する。 ここで第5A図および第6図および第7図のフ
ローチヤートを参照すると、処理は、QDPCMD
プログラムが呼出されるときに、ブロツクF1で
開始する。ブロツクF2の間に、パツケージカウ
ント(PACKAGES COUNT)、パツケージサ
イズ(PACKAGES SIZE)アレイ、およびパ
ツケージバツフア記憶位置(PACKAGES
BUFFER LOCATION)は、質問通信バツフ
ア132の記憶位置220,224および226
に記憶される。ブロツクF3の間に、プログラミ
ング手順は、以下のバツフアすなわち、基準収集
バツフア120、信号パツケージ組合わせ出力バ
ツフア122、一致バツフア124、信号パツケ
ージ組合わせテーブル126、およびスコア組合
わせテーブル128、を割当てる。さらに、一致
バツフア記憶位置(MATCH BUFFER
LOCATION)値が記憶位置230に記憶され、
したがつて、一致バツフアの開始のアドレスを含
む。 ブロツクF4の間に、記憶位置128における
一致カウント値は、0にセツトされる。テーブル
2を参照すると、一致カウントは、最終的に、組
合わせ処理の完了に続く一致バツフア内にある一
致エントリの数を表わす値である。 ブロツクF5の間に、記憶位置232における
パツケージポインタは、パツケージバツフア13
0における第1のパツケージの記憶位置にセツト
される。たとえば、表示300−60を含む第1
の記憶位置は、ゼロの記憶位置を有し、この値は
今パツケージポインタ(PACKAGE
POINTER)231に含まれている。さらに、パ
ツケージ番号(PACKAGE NLMBER)23
2における値は、パツケージPKG1に対応する
1にセツトされる。パツケージポインタ231お
よびパツケージ番号232は、処理されている現
在のパツケージの開始をアクセスするために
RAM1104内のどこへ行くべきかについて、
デイジタルデータ処理システムに対する情報を与
える。 フローのブロツクF6の間に、スコア組合わせ
テーブルエントリポインタ(SCORE MERGE
TABLE ENTRY POINTER)240は、
スコア組合わせテーブルバツフア128の開始位
置にセツトされ、またスコア組合わせテーブルエ
ントリ(SCORE MERGE TABLE
ENTRIES)242(変数バツフア134、第6
図)は、0にセツトされる。したがつて、この点
で、表示がデイジタルデータ処理システムにとつ
て利用可能であり、組合わせテーブル128にお
ける次の記憶位置を指示し、(1つのパツケージ
組合わせ出力バツフア122内のパツケージ基準
の組の記憶位置およびサイズからなる)エントリ
を形成する。 ブロツクF7の間に、1つのPKG組合わせス
トアポインタ(SINGLE PKG MERGE
STORE POINTER)252は、1つのパツケ
ージ組合わせ出力バツフア122の開始位置を指
示するようにセツトされる。これは、1つのパツ
ケージ組合わせ出力バツフアの開始での記憶位置
であり、そこでは、基準収集バツフアからの第1
の段落識別子が、1つのパツケージ組合わせの結
果として記憶される。 ブロツクF7に続いて、ブロツクF8に入り、
そこでは、デイジタルデータ処理システムがパツ
ケージバツフア130におけるすべてのパツケー
ジを通じて終了されたかどうかを決定するために
チエツクが行なわれる。より詳細に説明すれば、
システムは、すべてのパケツト内のパケツトごと
に対する段落基準の収集を完了して、終了する。
このために、システムが終了したかどうかに関
し、パツケージ番号232をパツケージカウント
230(バツフア134、第6図)と比較するこ
とによつて、決定が行なわれる。与えられている
例において、パツケージ番号232はブロツクF
5において1にセツトされており、またパツケー
ジカウント200(質問におけるパツケージの
数)は2であり(すなわちPKG1およびPKG
2)、したがつて、記憶位置232における値1
は220における値よりも小さく、したがつてブ
ロツクF8からNOルートがブロツクF9へと続
く。もし232における値が220における値よ
りも大きかつたなら、これはすべてのパツケージ
におけるすべてのパケツトが処理されてしまつた
ときに起こるのであるが、そのときは、ブロツク
F8からYESルートがブロツクF28へと続く。 ブロツクF9の間に、コンピユータシステム
は、パツケージに対する段落基準を記憶している
ところに初期設定される。この初期設定は、基準
収集バツフア120の開始である。このために、
変数バツフア134の基準収集ストアポインタ
(REFERENCE GATHER STORE
POINTER)250は、基準収集バツフア120
(第6図)の開始記憶位置にセツトされる。第8
図ないし第15図は、基準収集バツフア120な
らびに他のバツフア122,124,126、お
よび128の例を示し、それらはデイスク記憶装
置1107に含まれる段落基準300のテーブル
(第7図)における記憶位置300−60,−6
1,−62,−80,−81、および−82に含ま
れる段落基準の組合わせの間のものである。たと
えば、基準収集ストアポインタ250の値は、第
8図において記号A1によつて表わされ、また図
面に示されるように、基準収集バツフア120の
開始を指し示す。 ブロツクF10の間に、1つのPKG組合わせ
テーブルエントリポインタ(SINGLE PKG
MERGE TABLE ENTRY POINTER)2
46は、1つのパツケージ組合わせテーブルバツ
フア126の開始記憶位置にセツトされる。この
値は、第8図において記号G1によつて示されて
いる。さらに、1つのPKG組合わせテーブルエ
ントリ(SINGLE PKG MERGE TABLE
ENTRIES)248は、0にセツトされる。した
がつて、この点で、記憶位置246における値
は、1つのパツケージ組合わせテーブルバツフア
126の開始を指し示し、また1つのPKG組合
わせテーブルエントリ248は、この時点で1つ
のパツケージ組合わせテーブルバツフア126内
にゼロのエントリが存在するということを意味す
る0である。 ブロツクF11の間に、パツケージ番号236
は、1にセツトされ、したがつて、パツケージバ
ツフア130における第1のパケツトが処理され
ているということを示す。さらに、パケツトポイ
ンタ234は、パケツトポインタ131によつて
今指し示されている現在のパケツト(すなわち
PKG1)における(第6図においてP1として
指定されている)第1のパケツトの記憶位置を示
す値にセツトされる。さらに、ブロツクF11の
間に、パケツトカウント238は、現在のパケツ
トにおけるパケツトの数に初期設定される。第6
図の例を参照して、現在のパケツトPKG1には
Yパケツトが存在する。このために、デイジタル
データ処理システムは、この時点で1である現在
のパケツト番号232を用いて、パツケージサイ
ズアレイ224をアクセスする。その結果、パツ
ケージサイズアレイ224(第6図)の記憶位置
224−1がアクセスされ、値3がそこから読出
されて、パケツトカウント238として記憶され
る。記憶位置224−1における値3は、パツケ
ージバツフア130の第のパツケージPKG1に
含まれるパケツトの数であり、この値は今パツケ
ージカウント記憶位置238に含まれている。 ブロツクF11に続いて、ブロツクF12に入
る。フローのブロツクF12は、ループ制御であ
り、そこでは、デイジタルデータ処理システム
は、現在のパツケージにおけるパケツトの数に対
する基準をアクセスし終わつたかどうかを決定す
る。パツケージ番号236は、初めで、1である
が、パケツトカウント238は3である。したが
つて、前者は明らかに後者よりも大きく、ブロツ
クF12からNOルートがフローのブロツクF1
3へととられる。 フローのブロツクF13の間に、デイジタルデ
ータ処理システムは、パケツトポインタ234に
よつて指示されるパケツトに含まれる基準によつ
て指し示されるすべての段落基準を戻すデータベ
ースルーチン(図示せず)を呼出す。したがつ
て、システムは、パケツトポインタ234によつ
て指示されるRAM1104内の記憶位置に移行
する。与えられている例において、これはパツケ
ージバツフア130のPKG1における第1のパ
ケツトP1であり、基準300−80を含む。第
7図のデイスク記憶装置1107に示される段落
基準300のテーブルを参照して、対応する記憶
位置は、単語RATEに対する段落基準3,4、
および12を含む。したがつて、デイジタルデー
タ処理システムは、段落基準300のテーブルか
ら段落基準3,4および12を得て、それらを値
が増加する順序に戻し、第8図に示されるような
基準バツフア120に同じ順序でそれらを記憶す
る。段落基準は、たとえば第8図にA1として示
される基準収集ストアポインタ250によつて指
示される記憶位置で始まる基準収集バツフア12
0に記憶される。したがつて、ブロツクF13の
間に、戻された基準(REFERENCES
RETURNED)254は、基準収集バツフア1
20に記憶される段落基準の数にセツトされ、そ
の数はこの場合は3である。次に要約すれば、フ
ローのブロツクF13の間に、デイジタルデータ
処理システムは、処理されているパツケージバツ
フア130(第6図)の現在のパツケージ
(PKG1)内の1つのパケツトに対する段落基準
を得る。 フローのブロツクF13に続いて、フローのブ
ロツクF14に入り、そこでは、データ処理シス
テムが任意の段落基準を戻したかどうか、すなわ
ち、段落基準300のテーブル(第7図)から任
意の段落基準を得たかどうか、ということを見る
ためにチエツクが行なわれる。このために、その
前のブロツクF13の間に、戻された基準254
は3にセツトされていて、したがつて0よりも大
きく、したがつてF14からYESルートがブロ
ツクF15へと続く。 したがつて、例において、3つの段落基準が得
られ、基準収集バツフア120に記憶される。フ
ローのブロツクF15の間に、1つのPKG組合
わせテーブルエントリポインタ246によつて特
定される記憶位置で、1つのパツケージ組合わせ
テーブルバツフア126においてエントリが形成
され、1つのPKG組合わせテーブルエントリポ
インタ246は例としてG1で示されている(第
8図)。バツフア120おけるエントリは、ちよ
うど戻された段落基準の開始記憶位置、すなわち
値:基準収集ストアポインタ250、および、戻
された段落基準の数、すなわち値:戻された基準
254、からなつている。たとえば、1つのパツ
ケージ組合わせテーブルバツフア126は今、ア
ドレスG1における値3が続くアドレスA1を含
む。 フローのブロツクF16にここで入る。ブロツ
クF16の間に、1つのPKG組合わせテーブル
エントリ248は、1だけ増加されて、1つのパ
ツケージ組合わせテーブルバツフア126が今1
エントリを含むということを指示する。 ここでフローのブロツクF17に入り、そこで
は、1つのPKG組合わせテーブルエントリポイ
ンタ252は、次の後続のエントリに対する1つ
のパツケージ組合わせテーブルバツフア126内
の次の記憶位置を今指し示すように調整される。
246における値は、例として、第8図にG2と
して、示されている。 ブロツクF18の間に、システムは基準収集ス
トアポインタ250によつて指し示される記憶位
置を更新して、それによつて、現在のパツケージ
におけるパケツトに対しデータベースを次に呼出
すことを可能にするための基準として、そこに記
憶された最後の段落基準に続く基準収集バツフア
120(第8図)における記憶位置を今指し示
す。250における値は、第8図において、B1
として例示的に示されている。たとえば、値B1
は、値A1にバツフア120内に位置する段落基
準のサイズを加えることによつて決定され得る。
その代わりに、値B1に達するまで、値A1がバツ
フア120内に位置する各段落基準に対し増加さ
れもよい。 ブロツクF18に続いて、またはブロツクF1
4に続いて、フローのブロツクF19に入る。も
し戻された基準254が0よりも大きくなく、ブ
ロツクF14からのNOルートがとられれば、ブ
ロツクF14からのエントリに入る。ブロツクF
19の間に、パケツト番号236は、1だけ増加
されて、それによつてパツケージバツフア130
(第6図)における表示300−81を含んで示
されるパケツトの数を含む。したがつて、デイジ
タルデータ処理システムは今、次のパケツトに対
する基準を収集するように準備される。 ブロツクF20の間に、パケツトポインタ23
4は、パケツトポインタ234によつて現在指し
示されているパケツトに続く現在のパツケージ内
の可能なパケツトの記憶位置と等しくセツトされ
る。したがつて、パケツトポインタ234は今、
現在処理されているパケツトのパツケージ内のア
ドレスを含み、それは例示的に、第6図におい
て、表示300−81を含むパケツトである。 ブロツクF20に続いて、デイジタルデータ処
理システムは円1Bを通じてブロツクF12に戻
り、そこではシステムは、パツケージにおける最
後のパケツトで終了したかどうかを見るためにチ
エツクを行なう。与えられている例において。パ
ケツト番号236は今2である(3つのパケツト
のうちの1つが処理された)。またパケツト番号
236は、パケツトカウント238が今値3を含
むので、パケツトカウント238よりも大きくな
く、したがつてブロツクF13に再び入り、そこ
ではパツケージPKG1のパケツト2に対応する
段落基準が、記憶位置B1で始まる基準収集バツ
フア120(第8図)に加えられる。 第5図および第6図を参照すると、PKG1の
パケツトP2は表示300−81を含み、段落基
準1,2,4,9,10、および20を含むエン
トリ単語RATESに対する段落基準300のテー
ブル内の記憶位置を指し示す。したがつて、これ
らの段落基準は、基準収集バツフア120に加え
られて、第9図における基準収集バツフア120
に示される状態となる。したがつて、戻された基
準254は、基準収集バツフア120に記憶され
る段落基準の数に対応する6にセツトされる。 ブロツクF14〜18に再び入り、それによつ
て基準収集ストアポインタ250がセツトされ
て、段落基準が基準収集バツフア120に付け加
えられた後の次の利用可能な記憶位置を指し示す
ようにし、また1つのパツケージ組合わせテーブ
ルバツフア126は、新たなエントリつまり新た
に加えられたエントリ基準の開始に対するポイン
タ、ポインタB1でロードされ、かつ、バツフア
120に加えられたエントリ基準の数を表わす
値、番号6でロードされる。値B1および6は、
1つのPKG組合わせストアポインタ252にお
けるG2によつて指し示される記憶位置で加算さ
れる。次にポインタ252は増加されて、それに
よつて今、1つのパツケージ組合わせテーブルバ
ツフア126における次の利用可能な記憶位置で
ある記憶位置G3を指し示す。したがつてこの点
で、1つのPKG組合わせストアポインタ252
は1つのパツケージ組合わせテーブルバツフア1
26における次の利用可能な記憶位置(すなわち
G3)を指し示しており、また基準収集ストアポ
インタ250は基準収集バツフア120おける次
の利用可能な記憶位置(すなわちC1)を指し示
している。 ブロツクF18に続いてブロツクF19および
20に再び入り、そこではパケツト番号236が
1だけ増加されて、それによつて今パケツト3が
処理されるべきであるということを指示する。ブ
ロツクF20の間に、パケツトポインタ234が
セツトされて、それによつてパケツトポインタ2
34によつて現在指し示されているパケツトに続
く現在のパツケージ内の可能なパケツトの記憶位
置のアドレスを指し示す。したがつてポインタ2
34は今、パツケージPKG1における表示30
0−82を含むパケツトP3を指し示しており、
これは第7図を参照すると、エントリ単語
RATINGに対する段落基準に対応する。 ブロツクF20の後のフローのブロツクF12
およびF13に再び入り、そこでは単語
RATINGに対応するPKG1における第3のパケ
ツトP3が、上述した方法で処理される。したが
つて、第10図に示されるように、段落基準30
0のテーブル(第7図)の300−82での4つ
の段落基準6,7,15および17が読出され、
基準収集ストアポインタ250によつて指し示さ
れる記憶位置C1で始まる基準収集バツフア12
0に加えられる。さらに、基準収集ストアポイン
タ250は、最後の段落基準の後の次の利用可能
な記憶位置D1に増加される。しかし、これは
PKG1の最後のパケツトであるので、250に
おけるポインタは、システムがパケツトPKG1
に対するすべての基準を発生してしまつたので、
用いられない。さらに、パケツトポインタ234
は、現在のパケツトP3に続く現在のパツケージ
PKG1内の可能なパケツトP4のアドレスにセ
ツトされる。しかし、これもまた用いられない。
さらにパケツト番号236はブロツクF19の間
に増加されて、それによつて今値4を含む。 F20に続いて、ブロツクF12に再び入る。
この点で、パケツト番号236は、パケツトカウ
ント238に含まれる値3よりも大きい4を含
む。したがつて、ブロツクF12からのYESル
ートが、円3Aを通じて、ブロツクF21にとら
れる。 システムが現在のパツケージ(この例において
はPKG1)に対するすべてのパツケージ基準を
収集してしまうと、ブロツクF21に入り、任意
の基準が現在のパツケージに対し発生されたかど
うかを見るためにチエツクが今行なわれる。この
ために、ブロツクF21の間に、1つのPKG組
合わせテーブルエントリ248は、それが0より
も大きいかどうかを見るためにチエツクされる。
この点で、248は、基準収集バツフア120に
含まれる段落基準の3つの組、および1つのパツ
ケージ組合わせテーブルバツフア126における
3つのエントリが存在するということを示す値の
3を含む。したがつて、YESルートが、ブロツ
クF21からブロツクF22にとられる。 フローのブロツクF22の間に基準収集バツフ
ア120にあるすべての3つの段落基準リストか
ら1つのパツケージ組合わせが実行され、第11
図に示される1つのパツケージ組合わせ出力バツ
フア122の内容の結果となる。1つのパツケー
ジ組合わせ処理は、すべての複写をすることな
く、かつさらに段落基準値を増加して段落基準を
順序づけて、基準収集バツフア120に含まれる
1つのパツケージ(すなわちPKG1)からの段
落基準のリストから段落基準の新たなリストを作
り出す。たとえば、基準収集バツフア120は、
2つの4の段落基準を含むが、1つのパツケージ
組合わせ出力バツフア122においては、ただ1
つの4の段落基準がそのリストに含まれる。1つ
のパツケージ組合わせ出力バツフア122におけ
る新たなリストは、現在のパツケージ(PKG1)
に対し「パツケージ基準の組」と呼ばれ、第11
図に示される1つのPKG組合わせストアポイン
タ252によつて示される記憶位置E1で始まる
1つのパツケージ組合わせ出力バツフア122に
記憶される。別な言い方をすれば、バツフア12
2に含まれるPKG1に対するパツケージ基準の
組は、基準収集バツフア120に含まれる段落基
準の3つのリストの任意のものにおいて起こるユ
ニークな段落基準のリストを有する。 ブロツクF22に続いて、ブロツクF23に入
りそこではデイジタルデータ処理システムは、1
つのパツケージ組合わせテーブルバツフア126
において作られたエントリと同一の形式のスコア
組合わせテーブルバツフア128におけるスコア
組合わせテーブルエントリを作る。この点で、ス
コア組合わせテーブルエントリポインタ240
は、エントリが記憶され得る次の記憶位置のスコ
ア組合わせテーブルバツフア128内のアドレス
を含む。このアドレスは、第11図において、記
号H1によつて示されている。スコア組合わせテ
ーブルバツフア128における各記憶位置は、1
つのパツケージ組合わせ出力バツフア122内の
記憶位置からなるエントリを記憶し、そこでは1
つのパツケージ組合わせ(つまりパツケージ基準
の組)の結果が始まる。この始まりは、もちろ
ん、第11図に示されるように、記号E1によつ
て表わされるアドレスを現在含む1つのPKG組
合わせストアポインタ252の内容である。バツ
フア128におけるエントリはまた、バツフア1
22にちようど記憶されたパツケージ基準の組に
ちようど記憶された段落基準の数を含む。この特
別の場合において、バツフア122におけるパツ
ケージ基準の組には、12の段落基準が存在する。
したがつて、スコア組合わせテーブルバツフア1
28のアドレスH1での第1のエントリは、アド
レスE1および番号12(第11図参照)の表示
からなる。 ブロツクF24の間に、スコア組合わせテーブ
ルエントリポインタ240は、第11図に示され
るように、記号H2によつて示されるアドレスで
あるスコア組合わせテーブルバツフア128内の
次のエントリ記憶位置にセツトされる。したがつ
て、スコア組合わせテーブルエントリ242は1
だけ増加される。24における値は最初は0であ
つて、今は1を含み、したがつてスコア組合わせ
テーブルバツフア128に記憶されていたスコア
組合わせテーブルエントリの数含み、それゆえに
この点で1つのパツケージ組合わせ出力バツフア
122内に存在するパツケージ基準の組の数含
む。 フローのブロツクF25の間に、1つのPKG
組合わせストアポインタ252は、1つのパツケ
ージ組合わせ出力バツフア122における、その
バツフアに現在記憶されている最後の段落基準に
続く記憶位置のアドレスに次にセツトされる。た
とえば、このアドレスは第11図においてE2に
よつて表わされ、段落基準20に続く記憶位置の
アドレスである。次にこれは、PKG2に対する
パツケージ基準の記憶に対する開始記憶位置とな
る。 ブロツクF26の間に、記憶位置232におけ
るパツケージ番号は1だけ増加され、それによつ
て、段落基準収集処理の間に現在処理されている
パツケージ(すなわちPKG2)の数である2を
含む。パツケージ番号232における値は、1か
らパツケージカウント220の内容まで分布し得
るということが注意されるべきである。 ブロツクF27の間に、パツケージポインタ2
31は、この場合においてはパツケージPKG2
である次の可能なパツケージのパツケージバツフ
ア130における開始記憶位置にセツトされる。
第5図および第6図を参照すると、パツケージ番
号232におけるアドレスは次に、エントリ単語
INTEREST、INTERESTING、および
INTERETに対する表示300−60,61お
よび62を含むパツケージPKG2の開始アドレ
スである。ブロツクF27に続いて、システムは
今、円1Aを通じてブロツクF8に戻る。 もしブロツクF8の間にパツケージ番号232
がパツケージカウント220よりも大きいという
ことが発見されれば、それは処理状態のパツケー
ジが全く存在しないということを意味し、したが
つて、YESルートがブロツクF8から円4Aを
介してフローのブロツクF28にとられる。しか
し、与えられている例において、パツケージ番号
232およびパツケージカウント220はとも
に、2であり、したがつて第1のパケツトに関
し、NOルートが上述した方法でブロツクF8か
らブロツクF9にとられる。 ブロツクF9の間に、基準収集ストアポインタ
250は、基準収集バツフア120の開始記憶位
置にセツトされ、そこではパケツトPKG2の第
1のパケツトに対する段落基準が記憶されるべき
である。たとえば、第12図において、これは記
号A2によつて示されるアドレスである。ブロツ
クF10の間に、1つのPKG組合わせテーブル
エントリポインタ246は、1つのパツケージ組
合わせテーブルバツフア126の開始記憶位置に
セツトされる。また、これは新しいパツケージで
あるので、1つのPKG組合わせテーブルエント
リ248によつて表わされるエントリの数は0に
リセツトされる。ブロツクF11の間に、パケツ
ト番号236は、パツケージPKG2における第
1のパケツトが現在処理されているということを
示す1にセツトされる。さらに、パケツトポイン
タ234は、PKG2における第1のパケツトの
記憶位置のアドレスにセツトされる。さらに、パ
ケツトカウント238は、パツケージサイズアレ
イ記憶位置224−2(第6図)に含まれるパツ
ケージサイズにセツトされる。このために、値パ
ツケージ番号232によつて示されるパツケージ
サイズアレイ224における記憶位置がアクセス
されて、値3が読出され、記憶位置238に記憶
される。 F12の間に、パケツト番号236における1
がパケツトカウント238における値3と比較さ
れ、より小さいということが発見され、したがつ
てブロツクF13へのNOルートがとられる。 F13の間に、パケツト表示300−60が、
段落基準300のテーブル(第7図)から単語
RATESに対する段落基準を読出しかつ位置決め
するために用いられ、その段落基準は、基準収集
ストアポインタ250に今含まれているアドレス
A2で始まる増加する値の順序に、基準収集バツ
フア120内に記憶される。第7図を参照する
と、アドレス300−60に対応する段落基準3
00のテーブルにおける記憶位置はINTEREST
に対するものであり、したがつて段落基準2,
4,12,28および31が第12図に示される
ように基準収集バツフア120に記憶されるとい
うことがわかる。 少なくともいくつかの基準が段落基準のテーブ
ルから戻されてきており、したがつてブロツクF
14およびF15に順に入る。 F15の間に、1つのパツケージ組合わせテー
ブルエントリが、1つのPKG組合わせテーブル
エントリポインタ246によつて今指し示されて
いる1つのパツケージ組合わせテーブルバツフア
内の記憶位置で形成される。この記憶位置はアド
レスG4によつて表わされ、この記憶位置で、エ
ントリの数、つまり6とともにバツフア120内
のエントリの開始アドレスA2が、第12図に示
されるようにバツフア126に記憶される。ブロ
ツクF19およびブロツクF20の間に、パケツ
ト番号236およびパケツトポインタ234が調
整されて、それによつて、それらは今パツケージ
PKG2における次のパケツトP2に対応し、ブ
ロツクF8ないしF20が繰返される。ブロツク
F8〜F20の間の後続の処理は、上述したライ
ンに一般的に従い、ブロツク内の注意書およびこ
れらのブロツクに対する上述した説明や例を参照
して容易に理解されよう。しかし、処理の結果
は、一般的に第13図において示されている。示
されるように、表示300−61を含む第2のパ
ケツトに対する段落基準は、エントリ
INTERESTINGに対する段落基準を含む段落基
準300のテーブル内の対応するエントリを読出
すために利用される。したがつて、段落基準6,
40,45、および58が今、基準収集ストアポ
インタ250に今含まれるアドレスB2で始まる
基準収集バツフア120に記憶される。したがつ
て、これらのエントリの開始のアドレス、つまり
アドレスB2、およびエントリの数、つまり4
は、1つのパツケージ組合わせテーブルバツフア
126のアドレスG5に記憶され、アドレスG2
は今、1つPKG組合わせテーブルエントリポイ
ンタ246に記憶される。 次にブロツクF8ないしF20が、さらに繰返
される。このとき、パケツト番号236は3であ
り、パケツトポインタ234はパケツトバツフア
130のPKG2における第3のパケツトP3の
アドレスを含む。第3のパケツトは、表示300
−62を含む。したがつて、段落基準300のテ
ーブル(第7図)を参照し、エントリ単語
INTERETに対応する段落基準9が読出され基
準収集バツフア120に記憶される。第14図を
参照すると、基準収集ストアポインタ250は
今、アドレスC2を含み、したがつて、段落基準
9がアドレスC2で記憶される。したがつて、現
在のエントリのアドレス、つまりアドレスC2、
および現在のエントリにおける基準の数、つまり
1が、第14図に再び示されるように、1つのパ
ツケージ組合わせテーブルバツフア126のアド
レスG6で記憶される。 この点で、システムは、意味のある質問単語の
1つの完全な組(この例においては意味のある質
問単語はRATESおよびINTERESTである)に
対するすべてのパツケージを通過した。ブロツク
F8ないしF12に再び入る。このとき、パケツ
ト番号236における数は4に増加されており、
したがつてパケツトカウント238における値3
よりも大きい。したがつて、F12からのYES
ルートが、ブロツクF21およびF22に対して
とられる。いくつかのエントリが基準収集バツフ
ア120内に位置していたので、YESルートが
ブロツクF21からブロツクF22に対してとら
れた。ブロツクF22の間に、デイジタルデータ
処理システムは、基準収集バツフア120に含ま
れる段落基準から段落基準のユニークなリストを
作る。このユニークなリストは、パツケージ
PKG2に対し「基準のパツケージ」と呼ばれ、
1つのパツケージ組合わせ出力バツフア122に
おけるアドレスE2で始まつて形成される。アド
レスE2は今、1つのPKG組合わせストアポイ
ンタ252に含まれる。この状態は、第15図に
示されている。 要約すれば、この点までに、デイジタルデータ
処理システムはパツケージバツフア130内のあ
らゆる1つのパツケージを通過してしまい、パツ
ケージバツフア130内の各パツケージに対する
バツフア122内のパツケージ基準の組を発生す
る。与えられた例において、2つのパツケージが
存在する。しかし、システムのメモリ限定におい
て、各パツケージ内にいかなる数のパツケージお
よびいかなる数のパケツトが存在してもよいとい
うことが理解されよう。 ブロツクF22に続いて、ブロツクF23ない
しF27に再び入り、そこではスコア組合わせテ
ーブルバツフア128における次のエントリに入
る。このことについて、スコア組合わせテーブル
エントリは、スコア組合わせテーブルエントリポ
インタ240によつて指し示されているスコア組
合わせテーブルバツフア128内の記憶位置で形
成される。この点で、ポインタ240は、たとえ
ばアドレスH2を含む。したがつて、1つの
PKG組合わせストアポインタ252に含まれる
アドレスE2およびPKG2に対するパツケージ
基準の組における段落基準の数である値11は、ス
コア組合わせテーブルバツフア128における記
憶位置H2で記憶される。 ブロツクF26の間に、パケツト番号232は
1だけ増加され、したがつて今3であり、すなわ
ちパツケージバツフア130(第6図)における
パツケージの数よりも高いものである。したがつ
て、ブロツクF27に続いて、ブロツクF8に再
び入り、そこではパツケージ番号232がパツケ
ージカウント220における値よりも大きいとい
うことが発見され、したがつて、YESルートが、
ブロツクF8から円F4を介してブロツクF28
にとられる。ブロツクF28ないしF32の処理
の間に、1つのパツケージ組合わせ出力バツフア
122におけるパツケージ基準の組は、段落基準
のユニークな組に組合わせられる。さらに、1つ
のパツケージ組合わせ出力バツフア122におけ
る異なつたパツケージ基準の組において段落基準
が発生する回数を、その段落基準と関連して記憶
することによつて、各段落基準がスコアされる。
ここでその処理を考察する。 ブロツクF28の間に、スコア組合わせテーブ
ルエントリ242は、それが0よりも大きいかど
うかを見るためにチエツクされる。もし一致バツ
フア124に組合わされるべき1つのパツケージ
組合わせ出力バツフア122内の任意のパツケー
ジ基準が存在すれば、それは常に0よりも大き
い。この例において、比較は、242における値
が0よりも大きいことを発見し、したがつて
YESルートがブロツクF29に対してとられる。
ブロツクF29の間の処理は、1つのパツケージ
組合わせ出力バツフア122における異なつたパ
ツケージ基準の組において見い出されるすべての
段落基準のユニークなリストを発生するという点
において、ブロツクF15の間の処理と同様であ
る。 このユニークなリストは、すべての複写段落基
準なしで、1つのパツケージ組合わせ出力バツフ
ア122に含まれるすべてのパツケージ基準値の
リストを作る。ブロツクF29の間の処理は、組
合わせ処理の間に、デイジタルデータ処理システ
ムが同一の段落基準を含むパツケージ基準の組の
数のカウントであるスコアを計算するということ
において、ブロツクF15の間の処理とは異な
る。異なつたパツケージ基準の組において特定の
段落基準が発生する回数は、スコアとなり、次に
それは、一致バツフア124における対応する段
落基準と関連して記憶される。段落基準およびス
コアのリストは、使用者の質問に対し「一致の
組」と呼ばれる。この一致の組は、バツフア12
4の開始で始まつて、一致バツフア124に記憶
される。 第16図を参照すると、一致バツフア124は
今、1つのパツケージ組合わせ出力バツフア12
2に含まれるパツケージ基準の組に対する一致リ
ストを含む。デイジタルデータ処理システムは値
が増加する順序に段落基準を順序づける、という
ことがさらに気付かれよう。一致バツフア124
の内容は、テーブル5の例と同一である。 ここで第3図のフローチヤートに戻つて、一致
の組が一致バツフア124に記憶されてしまつた
後、デイジタルデータ処理システムはスコアによ
つて段落基準を分類し、最高のスコアの段落基準
が最初で最低のスコアの段落基準が最後であるリ
ストになつた段落基準を与える。例において、た
だ2つの異なつた値のスコア、つまり1および2
が存在するが、実際のシステムにおいては、おそ
らく多くの異なつたスコアが存在するということ
が理解されよう。スコアは、最高のスコアが最初
にかつ最低のスコアが最後となる下降的値の順序
に記憶され、段落基準は対応するスコアと関連し
て記憶される。この動作は、ブロツク3064で
示されている。スコアによる分類の結果は、テー
ブル6において例として示されるものであつても
よい。 他のタイプの分類が実行されてもよいというこ
とが理解されよう。たとえば、好ましくは、段落
基準はドキユメント番号および段落番号に分解さ
れ、分類がスコアによつて実行され、ドキユメン
トのリストを与え、そこではドキユメントに対す
るスコアは下降的値の順序にリストされている。
次に、各ドキユメントにおいて、段落がスコアに
よつて分類され、スコアによつて下降的値の順序
に段落をリストする。 分類処理の後、段落基準は、デイスク記憶装置
1107(第7図)においてたとえばテーブル3
における400で示されるような、実際のテキス
トのデータベースをアクセスするために、デイジ
タルデータ処理システムによつて用いられる。特
定の段落基準に対応する各段落内の実際のテキス
トは、次に読出され、そして表示がオペレータコ
ンソール1102(第1図)のCRTにデイスプ
レイされる。 この発明の例示的な実施例が図示の目的で説明
されてきたが、種々の変更、修正および置換え
が、以下のクレームによつて規定されるこの発明
の精神から逸脱することなくそのような実施例に
組み入れられ得るということが理解されよう。 テーブル1 QDCMD方法および手段に用いるバツフア 基準収集バツフア−120 各パツケージに対して1回、インタラクテイブ
処理において規則される。各回用いられ、1つの
パツケージにおいて表わされたすべての単語に対
するすべての段落基準はこのバツフア内に記憶さ
れる。段落基準は、繰返してバツフアに記憶さ
れ、すなわち、繰返しごとにパツケージにおける
各単語に対する基準が、数値を増加して記憶され
る。 1つのパツケージ組合わせ出力バツフア−122 データベース内で発生する(すなわち段落内に
ある)単語を有する各パツケージに対し発生され
るパツケージ基準の組を含む。パツケージ基準の
組は、基準収集バツフアにおける段落基準のグル
ープからの別々の1つのパツケージ組合わせの結
果として、一度に1つずつバツフア内に記憶され
る。 一致バツフア−124 スコア組合わせ処理の結果である一致エントリ
を含む。スコア組合わせは、1つのパツケージ組
合わせ出力バツフア内のパツケージ基準の組を、
一致エントリからなる一致の組へと組合わせる。 1つのパツケージ組合わせテーブルバツフア−1
26 1つのパツケージ組合わせ処理によつて用いら
れる1つのパツケージ組合わせテーブルの構成の
ために用いられる。このテーブルは、基準収集バ
ツフア内のパツケージの各単語に対する段落基準
の数および記憶位置を示す。 スコア組合わせテーブルバツフア−128 スコア組合わせ処理によつて用いられるスコア
組合わせテーブルの構成のために用いられる。こ
のテーブルは、1つのパツケージ組合わせ出力バ
ツフア内のパツケージ基準の組のサイズおよび記
憶位置を示す。 パツケージ(結果)バツフア−130 QAPサブシステムとの繰り返しのインタラク
テイブによりQDETWDにより発生されるパツケ
ージを含む。このバツフアの記憶位置は、
QPCNTLによりQDPCMDに送られる。[サイズ
=パツケージカウント★ (パケツト/パツケー
ジ)★ (パケツトのサイズ)](パツケージバツフ
ア記憶位置参照) 質問通信バツフア−132 質問のサイズにわたつて存在しなければならな
い変数を含む。このバツフア内の変数は、パツケ
ージカウント−220、パツケージサイズアレイ
−224、パツケージバツフア記憶位置−22
6、一致カウント−228、一致バツフア記憶位
置−230である。 テーブル2 QDCMD方法および手段に用いる変数 パツケージカウント−220 質問におけるパツケージの数を含む。
QPCNTLによつて、質問通信バツフアを介して、
QDPCMDに送られる。QPCNTLによつてセツ
トされる。(=意味のある単語の番号)。 パツケージサイズ(★ )−224 各パツケージ内のパケツトの数を含むアイテム
のアレイ。パツケージPKG1におけるパケツト
の数はパツケージサイズ(1)によつてアクセスされ
る。このアレイは、QPCNTLによつて、質問通
信バツフアを介して、QDPCMDに送られる。こ
のアレイのサイズは、特定のシステムの資源の制
限によつて課せられ、使用者の質問が含んでもよ
い意味のある単語の最大数を表わす(意味のある
質問単語はパツケージと1対1に対応する)。 パツケージバツフア記憶位置−226 パツケージバツフア130の開始アドレスを含
む。パツケージバツフアを割当てるとき、
QDETWDによつてセツトされる。質問通信バツ
フア132内に位置決めされる。 パツケージポインタ−231 段落基準収集処理の間、現在処理されているパ
ツケージの開始記憶位置でのパツケージバツフア
内のアドレスを含む。 パツケージ番号−232 段落基準収集処理の間、現在処理されているパ
ツケージの数を含む。その正しい範囲は、1から
パツケージカウント220の内容までである。 パケツトポインタ−234 段落基準収集処理の間、現在処理されているパ
ケツトのパツケージ内のアドレスを含む。 パケツト番号−236 段落基準収集処理の間、現在処理されている
(現在のパツケージにおける)パケツトの数を含
む。その正しい範囲は、1からパツケージサイズ
(パツケージの番号)の内容までである。 パケツトカウント−238 パツケージ基準収集処理の間、現在処理されて
いるパツケージ内のパケツトの数を含む。パツケ
ージ番号によつて表わされるパツケージが処理さ
れるとき、パツケージサイズ(パツケージ番号)
にセツトされる。 スコア組合わせテーブルエントリポインタ−24
0 次の記憶位置のスコア組合わせテーブルバツフ
ア内のアドレスを含み、そこではスコア組合わせ
テーブルエントリが構成され得る。 スコア組合わせテーブルエントリ−242 作られたスコア組合わせテーブルエントリの数
を含む。1つのパツケージ組合わせ出力バツフア
内に存在するパツケージ基準の組の数を表わす。 1つのPKG組合わせテーブルエントリポインタ
−246 次の記憶位置の1つのパツケージ組合わせテー
ブルバツフア内のアドレスを含み、そこでは1つ
のパツケージ組合わせテーブルエントリが構成さ
れ得る。 1つのPKG組合わせテーブルエントリ−248 作られた1つのパツケージ組合わせテーブルエ
ントリの数を含む。基準収集バツフア内に存在す
る、段落基準の順序づけられたリストの数を表わ
す。 一致カウント−228 スコア組合わせ処理の完了に続き、一致バツフ
ア内にある一致エントリの数を含む。QDPCMD
からのエグジツトの上に、使用者の質問における
任意の意味のある単語、または、使用者の質問の
意味のある単語の任意のものの任意の容認し得る
綴り誤りまたは語尾変化、の1つまたはより多く
の発生を含むデータベース内の段落の数表わす。
この変数は、質問通信バツフア内に位置決めさ
れ、QPCNTLに戻る前にQDPCMDによつてセ
ツトされる。 一致バツフア記憶位置−230 一致バツフアの開始のアドレスを含む。この変
数は、質問通信バツフア内に位置決めされる。
QPCNTLに戻る前にQDPCMDによつてセツト
される。 基準収集ストアポインタ−250 基準収集バツフア内のアドレスを含み、そこで
はパツケージの次の単語パツケージに対する段落
基準が記憶され始める。 1つのPKG組合わせストアポインタ−252 1つのパツケージ組合わせ出力バツフア内のア
ドレスを含み、そこでは次のパツケージ基準の組
が記憶され始める。 戻された基準−254 データベースにより単語パケツトに対し戻され
る段落基準の数を含む。データベースによつて戻
される0の値は、このアルゴリズムと無関係なシ
ステム処理が当のパケツトによつて示される単語
を含むすべての段落のアクセス可能性を除いたと
いうこと、または使用者がデータベース内に全く
起こらない単語を知つてデータベースを作ること
に何らかの意味を持つているということを示す。
いずれの場合においても、0の値が、完了のため
にアルゴリズムによつて処理される。 【表】 【表】 【表】 テーブル4 例−データベースにおける段落基準(段落識別
子)のテーブル 段落基準 同等エントリ単語 (段落識別子) 〓 INTEREST 2、4、12、20、28、31 INTERESTING 6、40、45、58 INTERET 9 〓 RATE 3、4、12 RATES 1、2、4、9、10、20 RATING 6、7、15、17 〓 テーブル5 段落基準(テキストのブロツク識別子) スコア 1 1 2 2 3 1 4 2 6 2 7 1 9 2 10 1 12 2 15 1 17 1 20 2 28 1 31 1 40 1 45 1 58 1 テーブル6 段落基準(テキストのブロツク識別子) スコア 2 2 4 2 6 2 9 2 12 2 20 2 1 1 3 1 7 1 10 1 15 1 17 1 28 1 31 1 40 1 45 1 58 1
JP57503388A 1981-09-30 1982-09-28 記憶されたテキストのデ−タベ−スにおける表示を位置決めするためのディジタルデ−タ処理手段を用いる方法および手段 Granted JPS58501525A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US06/307,093 US4495566A (en) 1981-09-30 1981-09-30 Method and means using digital data processing means for locating representations in a stored textual data base
US307093 1981-09-30

Publications (2)

Publication Number Publication Date
JPS58501525A JPS58501525A (ja) 1983-09-08
JPH0420220B2 true JPH0420220B2 (ja) 1992-04-02

Family

ID=23188211

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57503388A Granted JPS58501525A (ja) 1981-09-30 1982-09-28 記憶されたテキストのデ−タベ−スにおける表示を位置決めするためのディジタルデ−タ処理手段を用いる方法および手段

Country Status (4)

Country Link
US (1) US4495566A (ja)
EP (1) EP0075903A3 (ja)
JP (1) JPS58501525A (ja)
WO (1) WO1983001328A1 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4689768A (en) * 1982-06-30 1987-08-25 International Business Machines Corporation Spelling verification system with immediate operator alerts to non-matches between inputted words and words stored in plural dictionary memories
US4674066A (en) * 1983-02-18 1987-06-16 Houghton Mifflin Company Textual database system using skeletonization and phonetic replacement to retrieve words matching or similar to query words
US4771401A (en) * 1983-02-18 1988-09-13 Houghton Mifflin Company Apparatus and method for linguistic expression processing
US4603385A (en) * 1983-05-11 1986-07-29 International Business Machines Corp. Integrated data processing/text processing system having a terminal with dual emulation and enhanced function capabilities
US4580218A (en) * 1983-09-08 1986-04-01 At&T Bell Laboratories Indexing subject-locating method
JPS61120275A (ja) * 1984-11-16 1986-06-07 Toshiba Corp 日本語ワ−ドプロセツサ
US4783758A (en) * 1985-02-05 1988-11-08 Houghton Mifflin Company Automated word substitution using numerical rankings of structural disparity between misspelled words & candidate substitution words
US5051947A (en) * 1985-12-10 1991-09-24 Trw Inc. High-speed single-pass textual search processor for locating exact and inexact matches of a search pattern in a textual stream
US4870568A (en) * 1986-06-25 1989-09-26 Thinking Machines Corporation Method for searching a database system including parallel processors
US5021997A (en) * 1986-09-29 1991-06-04 At&T Bell Laboratories Test automation system
US4972349A (en) * 1986-12-04 1990-11-20 Kleinberger Paul J Information retrieval system and method
US5062074A (en) * 1986-12-04 1991-10-29 Tnet, Inc. Information retrieval system and method
US4862408A (en) * 1987-03-20 1989-08-29 International Business Machines Corporation Paradigm-based morphological text analysis for natural languages
US4823306A (en) * 1987-08-14 1989-04-18 International Business Machines Corporation Text search system
US5157783A (en) * 1988-02-26 1992-10-20 Wang Laboratories, Inc. Data base system which maintains project query list, desktop list and status of multiple ongoing research projects
US4839853A (en) * 1988-09-15 1989-06-13 Bell Communications Research, Inc. Computer information retrieval using latent semantic structure
US5201048A (en) * 1988-12-01 1993-04-06 Axxess Technologies, Inc. High speed computer system for search and retrieval of data within text and record oriented files
US5303361A (en) * 1989-01-18 1994-04-12 Lotus Development Corporation Search and retrieval system
US5404514A (en) * 1989-12-26 1995-04-04 Kageneck; Karl-Erbo G. Method of indexing and retrieval of electronically-stored documents
US5761655A (en) * 1990-06-06 1998-06-02 Alphatronix, Inc. Image file storage and retrieval system
US5321833A (en) * 1990-08-29 1994-06-14 Gte Laboratories Incorporated Adaptive ranking system for information retrieval
US6131092A (en) * 1992-08-07 2000-10-10 Masand; Brij System and method for identifying matches of query patterns to document text in a document textbase
US5873056A (en) * 1993-10-12 1999-02-16 The Syracuse University Natural language processing system for semantic vector representation which accounts for lexical ambiguity
JP3201945B2 (ja) * 1995-01-10 2001-08-27 インターナショナル・ビジネス・マシーンズ・コーポレーション データベースのテーブルを比較する方法
JP2929963B2 (ja) * 1995-03-15 1999-08-03 松下電器産業株式会社 文書検索装置および単語索引作成方法および文書検索方法
US5706365A (en) * 1995-04-10 1998-01-06 Rebus Technology, Inc. System and method for portable document indexing using n-gram word decomposition
US5724571A (en) * 1995-07-07 1998-03-03 Sun Microsystems, Inc. Method and apparatus for generating query responses in a computer-based document retrieval system
US6016307A (en) 1996-10-31 2000-01-18 Connect One, Inc. Multi-protocol telecommunications routing optimization
US6473404B1 (en) * 1998-11-24 2002-10-29 Connect One, Inc. Multi-protocol telecommunications routing optimization
US6968332B1 (en) * 2000-05-25 2005-11-22 Microsoft Corporation Facility for highlighting documents accessed through search or browsing
US6941513B2 (en) 2000-06-15 2005-09-06 Cognisphere, Inc. System and method for text structuring and text generation
US9600513B2 (en) 2011-06-09 2017-03-21 International Business Machines Corporation Database table comparison
US20200078677A1 (en) * 2018-09-07 2020-03-12 Mz Ip Holdings, Llc System and method for managing viewable segments of computer application content
CN113810471A (zh) * 2021-08-18 2021-12-17 深圳市元征科技股份有限公司 一种数据传输方法、发送设备及接收设备

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3828319A (en) * 1969-06-23 1974-08-06 Ipc Service Ltd Composition system
US3753239A (en) * 1971-06-30 1973-08-14 Ibm Data flow in a machine log system
US3940746A (en) * 1971-09-29 1976-02-24 Ing. C. Olivetti & C., S.P.A. System for automatically processing and printing the contents and the format of a text
US4028680A (en) * 1971-09-29 1977-06-07 Ing. C. Olivetti & C., S.P.A. System for automatically processing and printing the contents and the format of a text
US3713107A (en) * 1972-04-03 1973-01-23 Ncr Firmware sort processor system
US3848232A (en) * 1973-07-12 1974-11-12 Omnitext Inc Interpretive display processor
US3970993A (en) * 1974-01-02 1976-07-20 Hughes Aircraft Company Cooperative-word linear array parallel processor
US4270182A (en) * 1974-12-30 1981-05-26 Asija Satya P Automated information input, storage, and retrieval system
GB1499704A (en) * 1975-04-18 1978-02-01 Olivetti & Co Spa Automatic typing system
US4068298A (en) * 1975-12-03 1978-01-10 Systems Development Corporation Information storage and retrieval system
JPS5335434A (en) * 1976-09-13 1978-04-01 Lexicon Corp Information processor
US4218760A (en) * 1976-09-13 1980-08-19 Lexicon Electronic dictionary with plug-in module intelligence
JPS5398749A (en) * 1977-02-08 1978-08-29 Nec Corp Information retrieval system
US4270185A (en) * 1977-06-20 1981-05-26 Motorola Israel Limited Memory control circuitry for a supervisory control system

Also Published As

Publication number Publication date
EP0075903A2 (en) 1983-04-06
JPS58501525A (ja) 1983-09-08
US4495566A (en) 1985-01-22
EP0075903A3 (en) 1985-04-17
WO1983001328A1 (en) 1983-04-14

Similar Documents

Publication Publication Date Title
JPH0420220B2 (ja)
KR100295354B1 (ko) 문서 정보 검색 시스템
US6026398A (en) System and methods for searching and matching databases
US5404507A (en) Apparatus and method for finding records in a database by formulating a query using equivalent terms which correspond to terms in the input query
US4775956A (en) Method and system for information storing and retrieval using word stems and derivative pattern codes representing familes of affixes
JP2832988B2 (ja) データ検索システム
JP3820878B2 (ja) 情報検索装置,スコア決定装置,情報検索方法,スコア決定方法及びプログラム記録媒体
JP5302614B2 (ja) 施設関連情報の検索データベース形成方法および施設関連情報検索システム
EP1492036A2 (en) Database search system
JP3908634B2 (ja) 検索支援方法および検索支援装置
JP5398202B2 (ja) 翻訳プログラム、翻訳システム、翻訳システムの製造方法及び対訳データ生成方法
KR100906809B1 (ko) 키워드 검색 방법
JP2004220456A (ja) 技術マップ作成方法、技術マップ作成プログラム及びそのプログラムを記録した記録媒体
JP2005010848A (ja) 情報検索装置、情報検索方法、情報検索プログラム、及び記録媒体
CN112905026A (zh) 展示单词建议的方法、装置、存储介质及计算机设备
CN115310436A (zh) 一种文档提纲的抽取方法、装置、电子设备及存储介质
JP2732661B2 (ja) テキスト型データベース装置
JP6181890B2 (ja) 文献解析装置、文献解析方法およびプログラム
JPH08180066A (ja) インデックス作成方法、文書検索方法及び文書検索装置
EP1076305A1 (en) A phonetic method of retrieving and presenting electronic information from large information sources, an apparatus for performing the method, a computer-readable medium, and a computer program element
JP2014049044A (ja) コンテンツ管理装置、コンテンツ管理システム、コンテンツ管理方法、プログラム、及び記憶媒体
KR100931693B1 (ko) 키워드 검색 방법
JP2009181524A (ja) 文書検索システム及び文書検索方法
JPH08115340A (ja) 文書検索装置およびそれに用いるインデックスファイルの作成装置
JP2003016105A (ja) 関連度値算出装置