JP3099298B2

JP3099298B2 - 文書検索方法および装置

Info

Publication number: JP3099298B2
Application number: JP8054791A
Authority: JP
Inventors: 川口　　久光; 充秋沢; 寛次加藤; 敦畠山; 浩道藤澤
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1991-03-20
Filing date: 1991-03-20
Publication date: 2000-10-16
Anticipated expiration: 2015-10-16
Also published as: JPH04293161A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は情報処理システム，特に
情報検索システムにおけるフルテキストサーチに係り，
近傍条件，文脈条件，および論理条件などの複合条件判
定処理を高速に実現する方法および装置に関するもので
ある。テキストデータベース，ワードプロセッサ，およ
び文書ファイリングシステムなどにおける検索に利用し
得るものである。

【０００２】

【従来の技術】近年，文献情報や特許情報などの２次情
報(書誌情報)のみならず，１次情報(原文)をも含む大規
模データベース・サービスの重要性が増してきている。
従来，データベースの情報検索では，シソーラスに基づ
いて統制されたキーワードや分類コード等の２次情報に
よる検索が行われてきている。しかし，この方法では数
十件から数百件までにしか絞り込めないため，検索者が
最終段階で直接本文を読んで内容を確認しなければなら
ないという効率上の問題がある。また，分類体系自体が
年月と共に変化するため，常にキーワードや分類コード
を更新しなければならないという問題も生じてくる。更
に，キーワード付け(インデキシングと言う)には時間が
かかるため新たな文書はバッチ処理によりかなりの量を
まとめて登録する。そのため，検索する情報は常に一定
期間の送れを持つという問題がある。

【０００３】これらの問題に対処する一つの方法とし
て，検索者が自由な検索語に基づいて，文書の本文を直
接参照して内容を検索できるフルテキストサーチシステ
ムが考えられている。このようなフルテキストサーチシ
ステムを実現するための文書検索装置がいくつか提案さ
れている。その中の代表的な文書検索装置の構成を第２
図に示し，その内容について説明する。(エルエー
ホラー：”ハードウェアシステムズフォーテキ
ストインフォメーションリトリーバル”，エーシ
ーエム，エスアイジーアイアール，第６回コ
ンファレンス１９８３年，Ｌ．Ａ．Ｈｏｌｌａａ
ｒ：”ＨａｒｄｗａｒｅｓｙｓｔｅｍｓｆｏｒＴ
ｅｘｔＩｎｆｏｒｍａｔｉｏｎＲｅｔｒｉｅｖａ
ｌ”，ＡＣＭＳＩＧＩＲ６ｔｈＣｏｎｆｅｒｅｎｃ
ｅ１９８３)文書検索装置１において，検索制御手段
１０１は検索装置全体の制御とホストコンピュータとの
通信を行う。すなわち，ホストコンピュータから送られ
てくる検索要求２０１を受け付けこれを解析し，文字列
照合手段２００と複合条件判定手段３００へ検索情報２
０２として送出する。また，検索制御手段１０１は記憶
装置制御手段１０４を制御して，文字列記憶手段１０５
に格納された文書データ２０４を文字列照合手段２００
へ読み出す。文字列照合手段２００は文書データ２０４
の中に検索要求で指示された検索語(以後，検索ターム
と呼ぶ)に合致するものがあるかどうかを調べ，もし該
当するものがあれば，該当文字列を識別する情報２０５
を複合条件判定手段３００へ出力する。複合条件判定手
段３００は該文字列識別情報２０５に対して，検索要求
中に指示されたＡＮＤやＯＲなどで構成される論理条件
などが満足されるか否かを調べる。複合条件が満足され
た場合には，該当する文書の識別情報や文書内容を検索
結果２０６としてホストコンピュータへ返送する。

【０００４】本システムでは絞り込みを精度良く行うた
めに，複合条件判定手段３００の検索条件として論理条
件の他に，英文を対象とした以下に示す条件が提案され
ている。 “Ａ .ｎ. Ｂ” (１−１) “＜Ａ，Ｂ＞ｎ” (１−２) “ＡＡＮＤＢＩＮＳＥＮＴ”(１−３) (１−１)式の“Ａ .ｎ. Ｂ”という条件式は，“Ａ”と
“Ｂ”という２つの検索タームがこの順序で現れ，かつ
この２つの検索タームがｎ単語以内に近接して現れる文
書を探し出すことを表す。 (１−２)式の“＜Ａ，Ｂ＞ｎ”という条件式は，“Ａ”
と“Ｂ”という２つの検索タームがその順序を問わず
に，すなわち“Ａ”が“Ｂ”の前に現れる場合，あるい
は“Ｂ”が“Ａ”の前に現れる場合のどちらであって
も，これらの検索タームがｎ語以内に近接して現れる文
書を探し出すことを表す。 (１−１)式や(１−２)式のように検索ターム間の近接の
度合いを尺度とする検索条件を近傍条件と呼ぶことにす
る。 (１−３)式の“ＡＡＮＤＢＩＮＳＥＮＴ”とい
う条件式は，“Ａ”と“Ｂ”という２つの検索タームが
その順序を問わずに，同一の文(センテンス)に現れる文
書を探し出すことを表す。 (１−３)式のように文や段落（パラグラフ）という同一
文脈（フィールドとも呼ぶ）上における２つの検索ター
ムの共起を判定する条件を文脈条件と呼ぶことにする。

【０００５】このように本引用文献では，検索ターム間
の距離的な結び付きや文脈的な結び付きを制約とする近
傍条件および文脈条件などの検索条件が複合条件として
提案されている。これらの条件を用いると単に論理条件
を用いて検索するのに比べ，キーワード間の意味的な結
び付きを加味して検索できることになるため，木目細か
な検索が行えることになり，その結果精度の良い絞り込
みが出来ることになる。しかしながら，本引用文献には
近傍条件や文脈条件を実現する具体的な方法が記述され
ていない。また，フルテキストサーチでは文書データを
直接サーチするため処理時間が膨大となる。そこで検索
タームを高速に探索するためにタームコンパレータと呼
ぶ文字列照合用ハードウエアが提案されている。この具
体的実現方法は，例えば特開昭６０−１０５０３９に開
示されている。このタームコンパレータでは，数ＭＢｙ
ｔｅ／ｓから数十ＭＢｙｔｅ／ｓと高速に文字列照合を
行うことが可能である。しかしながら，これらのターム
コンパレータには文字列照合手段２００と同等の機能し
かなく，検索の絞り込みに重要な近傍条件，文脈条件，
および論理条件などの複合条件判定機能は搭載されてい
ない。さらに，複合条件判定手段３００では文字列照合
手段２００で高速に照合処理された大量の検索ターム
(以後，照合タームと呼ぶ)を文字列照合手段２００の照
合処理速度と同じく高速に判定処理しなければならな
い。これは，文字列照合手段２００がいくら高速に処理
できたとしても，複合条件判定手段３００の処理が遅い
とシステムとしての検索速度が落ちてしまうため検索時
間を短縮することができないからである。したがって，
複合条件判定手段３００としては近傍条件，文脈条件，
および論理条件を高速判定処理できるものでなければな
らないということになる。

【０００６】

【発明が解決しようとする課題】本発明の課題は，フル
テキストサーチ特有の木目細かな絞り込みを可能とす
る，近傍条件判定，文脈条件判定，および論理条件判定
などの複合条件の具体的な判定方法を提供するととも
に，これらの組合せ処理をハードウェア化された文字列
照合手段と同等の速度で行うことのできる複合条件判定
方法を提供することである。

【０００７】本発明で具体的に実現しようとする複合条
件検索機能は以下の通りである。まず近傍条件として
は，日本語の場合には検索タームの間に存在する文字数
に上限あるいは下限を指定した字間距離条件検索を，英
語の場合には検索ターム間の語数に上限あるいは下限を
指定した語間条件検索などを実現する。字間距離条件の
例としては，以下のようなものがある。 “文書［８Ｃ］検索” (２−１) “文書［１０ｃ］検索” (２−２) “文書［８ｃ，１０ｃ］検索” (２−３) “文書＜１０ｃ＞検索” (２−４) (２−１)式の“文書［８Ｃ］検索”という条件式は，
“文書”と“検索”という２つの検索タームがこの順序
で現われ，かつこの２つの検索タームの間に８文字以内
の文字が挾まっている文書を探し出すということを表わ
す。したがって，第３図に示した例文の中では，と
を検索することになる。 (２−２)式の“文書［１０ｃ］検索”という条件式は，
“文書”と“検索”という２つの検索タームがその順序
を問わずに，すなわち“文書”が“検索”の前に現われ
る場合，あるいは“検索”が“文書”の前に現われる場
合のどちらであっても，これらの検索タームが１０文字
以内に近接して現われる文書を探し出すことを表わす。
したがって，第３図に示した例文の中では，とと
を検索することになる。 (２−３)式の“文書［８ｃ，１０ｃ］検索”という条件
式は，２つの検索タームがその順序を問わず，８文字以
上離れていて，かつ１０文字以内に近接して現われる文
書を探し出すことを表わす。したがって，第３図に示し
た例文の中では，とを検索することになる。 (２−４)式の“文書＜１０ｃ＞検索”という条件式は，
“文書”と“検索”という２つの検索タームがその順序
を問わず，１０文字以上離れて現われる文書を探し出す
ことを表わす。したがって，第３図に示した例文の中で
は，とを検索することになる。

【０００８】次に，語間距離条件の例としては以下のよ
うなものがある。 “ｔｅｘｔ［８Ｗ］ｓｅａｒｃｈ” (３−１) “ｔｅｘｔ［１０ｗ］ｓｅａｒｃｈ”(３−２) “ｔｅｘｔ［８ｗ，１０ｗ］ｓｅａｒｃｈ”(３−３) “ｔｅｘｔ＜１０ｗ＞ｓｅａｒｃｈ”(３−４) (３−１)式の“ｔｅｘｔ［８Ｗ］ｓｅａｒｃｈ”という
条件式は，“ｔｅｘｔ”と“ｓｅａｒｃｈ”という２つ
の検索タームがこの順序で現われ，かつこの２つの検索
タームの間に８語(ワード)以下の単語が挾まっている文
書を探し出すということを表わす。 (３−２)式の“ｔｅｘｔ［１０ｗ］ｓｅａｒｃｈ”とい
う条件式は，“ｔｅｘｔ”と“ｓｅａｒｃｈ”という２
つの検索タームがその順序を問わずに，すなわち“ｔｅ
ｘｔ”が“ｓｅａｒｃｈ”の前に現われる場合，あるい
は“ｓｅａｒｃｈ”が“ｔｅｘｔ”の前に現われる場合
のどちらであっても，これらの検索タームが１０語以内
に近接して現われる文書を探し出すことを表わす。 (３−３)式の“ｔｅｘｔ［８ｗ，１０ｗ］ｓｅａｒｃ
ｈ”という条件式は，“ｓｅａｒｃｈ”と“ｔｅｘｔ”
という２つの検索タームがその順序を問わず，８語以上
離れていて，かつ１０語以内に近接して現われる文書を
探し出すことを表わす。 (３−４)式の“ｔｅｘｔ＜１０ｗ＞ｓｅａｒｃｈ”とい
う条件式は“ｔｅｘｔ”と“ｓｅａｒｃｈ”という２つ
の検索タームがその順序を問わず，１０語以上離れて現
われる文書を探し出すことを表わす。以上が近傍条件と
しての課題となる。

【０００９】次に文脈条件検索としては，日本語および
英語とも次のようなものがある。 “文書［Ｐ］検索”， “ｔｅｘｔ［Ｐ］ｓｅａｒｃｈ”(４−１) “文書［ｐ］検索”， “ｔｅｘｔ［ｐ］ｓｅａｒｃｈ”(４−２) “文書［Ｓ］検索”， “ｔｅｘｔ［Ｓ］ｓｅａｒｃｈ”(４−３) “文書［ｓ］検索”， “ｔｅｘｔ［ｓ］ｓｅａｒｃｈ”(４−４) “文書［ＰＨ］検索”， “ｔｅｘｔ［ＰＨ］ｓｅａｒｃｈ”(４−５) “文書［ｐｈ］検索”， “ｔｅｘｔ［ｐｈ］ｓｅａｒｃｈ”(４−６)

【００１０】以下，日本語の例で説明する。 (４−１)式の“文書［Ｐ］検索”という条件式は，
“文書”と“検索”という２つの検索タームがこの順序
で，同一の段落(パラグラフ)に現われる文書を探し出す
ということを表わす。 (４−２)式の“文書［ｐ］検索”という条件式は，
“文書”と“検索”という２つの検索タームが順序を問
わずに，同一の段落に現われる文書を探し出すというこ
とを表わす。 (４−３)式の“文書［Ｓ］検索”という条件式は，
“文書”と“検索”という２つの検索タームがこの順序
で，同一の文(センテンス)に現われる文書を探し出すと
いうことを表わす。 (４−４)式の“文書［ｓ］検索”という条件式は，
“文書”と“検索”という２つの検索タームが順序を問
わずに，同一の文に現われる文書を探し出すということ
を表わす。 (４−５)式の“文書［ＰＨ］検索”という条件式は，
“文書”と“検索”という２つの検索タームがこの順序
で，同一の句(フレーズ)に現われる文書を探し出すとい
うことを表わす。日本語の場合，句と
は“、”，“，”，および“。”で区切られた文章を言
う。英語の場合は“，”および“．”で区切られた文章
ということになる。 (４−６)式の“文書［ｐｈ］検索”という条件式は，
“文書”と“検索”という２つの検索タームが順序を問
わずに，同一の句に現われる文書を探し出すということ
を表わす。以上が文脈条件としての課題となる。

【００１１】最後に論理条件としては日本語および英語
とも次のようなものがある。 “文書［ＡＮＤ］検索”， “ｔｅｘｔ［ＡＮＤ］ｓｅａｒｃｈ” (５−１) “文書［ＯＲ］検索”， “ｔｅｘｔ［ＯＲ］ｓｅａｒｃｈ” (５−２) “文書［ＮＯＴ］検索”， “ｔｅｘｔ［ＮＯＴ］ｓｅａｒｃｈ” (５−３)

【００１２】以下，日本語の例で説明する。 (５−１)式の“文書［ＡＮＤ］検索”という条件式は，
“文書”と“検索”という２つの検索タームが同時に現
われる文書を探し出すということを表わす。 (５−２)式の“文書［ＯＲ］検索”という条件式は，
“文書”あるいは“検索”という検索タームが現われる
文書を探し出すということを表わす。 (５−３)式の“文書［ＮＯＴ］検索”という条件式は，
“文書”という検索タームが現われて，かつ“検索”と
いう検索タームが現われない文書を探し出すということ
を表わす。以上が論理条件としての課題となる。

【００１３】これらの課題をまとめると，本発明の課題
はフルテキストサーチ特有の木目細かな絞り込みを可能
とする，近傍条件判定，文脈条件判定，および論理条件
判定などの複合条件の具体的な判定方法を提供するとと
もに，これらの組合せ処理をハードウェア化された文字
列照合手段と同等の速度で行うことの出来る複合条件判
定方法を提供することである。

【００１４】

【課題を解決するための手段】これらの課題を解決する
ために，本発明の方法は，文字列照合ステップと複合条
件判定ステップを備えている。文字列照合ステップにお
いては，文書中に指定された検索タームが照合された場
合，該文書の識別子である文書識別子と，照合された検
索ターム，すなわち，照合タームの識別子および該文書
中における照合タームの先頭文字位置と末尾文字位置を
照合情報として出力し，文脈条件が指定され，文脈を識
別する文字列が照合された場合，該文書の識別子と照合
された文脈識別文字列の識別子および該文書中における
該照合文脈識別文字列の先頭文字位置と末尾文字位置を
照合情報として出力する。

【００１５】複合条件判定ステップは，近傍条件判定ス
テップ，文脈条件判定ステップまたは論理条件判定ステ
ップ，または，これら各ステップの組み合わせからなっ
ている。近傍条件判定ステップにおいては，前記文字列
照合ステップで出力された照合情報に基づいて検索条件
式に指定された検索ターム間の文字数で表した近接距離
条件について判定を行い，条件に合致した前方に位置す
る検索タームの先頭文字位置と後方に位置する検索ター
ムの末尾文字位置を判定結果の照合情報として，これを
前記文字列照合ステップで出力された照合情報に付加し
て出力する。

【００１６】文脈条件判定ステップにおいては，検索条
件式中に近傍条件が含まれている場合には，前記近傍条
件判定ステップで出力された照合情報に基づいて該検索
条件式中に指定された検索タームの同一句，同一文，あ
るいは同一段落内での共起条件について判定を行い，条
件に合致した前方に位置する文脈識別文字列の先頭文字
位置と後方に位置する文脈識別文字列の末尾文字位置を
照合情報として，これを前記近傍条件判定ステップで出
力された照合情報に付加して出力する。検索条件式中に
近傍条件が含まれていない場合には，前記文字列照合ス
テップで出力された照合情報に基づいて該検索条件式中
に指定された検索タームの同一句，同一文，あるいは同
一段落内での共起条件について判定を行い，条件に合致
した前方に位置する文脈識別文字列の先頭文字位置と後
方に位置する文脈識別文字列の末尾文字位置を照合情報
として，これを前記文字列照合ステップで出力された照
合情報に付加して出力する。

【００１７】論理条件判定ステップにおいては，検索条
件式中に近傍条件が含まれている場合には前記近傍条件
判定ステップで出力された照合情報に基づき，検索条件
式中に近傍条件および文脈条件が含まれている場合また
は文脈条件が含まれている場合には前記文脈条件判定ス
テップで出力された照合情報に基づき，そして，検索条
件式中に論理条件のみが含まれている場合には前記文字
列照合ステップで出力された照合情報に基づいて，該検
索条件式中に指定された該検索ターム間の論理条件につ
いて判定を行い，条件に合致した文書単位の照合情報を
前段ステップで出力された照合情報に付加して最終的な
検索結果情報として出力する。

【００１８】また，本発明の装置の一つは次のように文
字列照合手段と複合条件判定手段で構成される。文字列
照合手段は，文書中に指定された検索タームが照合され
た場合，該文書の識別子である文書識別子と，照合され
た検索ターム，すなわち，照合タームの識別子および該
文書中における照合タームの先頭文字位置と末尾文字位
置を照合情報として出力し，文脈条件が指定され，文脈
を識別する文字列が照合された場合，該文書の識別子と
照合された文脈識別文字列の識別子および該文書中にお
ける該照合文脈識別文字列の先頭文字位置と末尾文字位
置を照合情報として出力する。

【００１９】複合条件判定手段は，近傍条件判定手段，
文脈条件判定手段，および論理条件判定手段から構成さ
れる。近傍条件判定手段は，前記文字列照合手段で出力
された照合情報に基づいて検索条件式に指定された検索
ターム間の文字数で表した近接距離条件について判定を
行い，条件に合致した前方に位置する検索タームの先頭
文字位置と後方に位置する検索タームの末尾文字位置を
判定結果の照合情報として，これを前記文字列照合手段
で出力された照合情報に付加して出力する。文脈条件判
定手段は，前記近傍条件判定手段で出力された照合情報
に基づいて該検索条件式中に指定された検索タームの同
一句，同一文，あるいは同一段落内での共起条件につい
て判定を行い，条件に合致した前方に位置する文脈識別
文字列の先頭文字位置と後方に位置する文脈識別文字列
の末尾文字位置を照合情報として，これを前記近傍条件
判定手段で出力された照合情報に付加して出力する。論
理条件判定手段は，前記文脈条件判定手段で出力された
照合情報に基づいて該検索条件式中に指定された該検索
ターム間の論理条件について判定を行い，条件に合致し
た文書単位の照合情報を最終的な検索結果情報として出
力する。

【００２０】

【作用】文字列照合において，文書識別子と，照合ター
ムの識別子および文書中における照合タームの先頭文字
位置と末尾文字位置とが照合情報として出力され，ま
た，文脈条件が指定された際に，文脈識別文字列の識別
子および文書中における該照合文脈識別文字列の先頭文
字位置と末尾文字位置とが照合情報として出力されるの
で，近傍条件の判定は，検索条件式中の検索タームにつ
いては前記照合タームの識別子との一致をみることによ
り判定し，検索条件式中の字間距離条件については一致
をみた各照合タームの先頭文字位置と末尾文字位置とを
比較判定することにより行われる。文脈条件の判定は，
検索条件式中の検索タームについては，文字列照合，近
傍条件の判定で得られた照合タームの識別子との一致を
みることにより判定し，検索条件式中の検索タームが共
起する範囲についての条件については，相前後する文脈
識別文字列の識別子の位置と一致をみた各照合タームの
先頭文字位置と末尾文字位置とを比較することにより，
相前後する文脈識別文字列の識別子の位置の間に一致を
みた各照合タームが共起することを判定することにより
行われる。論理条件については，検索条件式中の検索タ
ームについては，文字列照合，近傍条件の判定，文脈条
件の判定で得られた照合タームの識別子との一致をみる
ことにより判定し，一致をみた照合タームの識別子が検
索条件式中の論理条件を満たしているか否かを判定する
ことにより行われる。

【００２１】そして，文字列照合手段および複合条件判
定手段を構成することにより，上記の近傍条件，文脈条
件，および論理条件などの複合条件判定を一貫して実現
することができるためフルテキストサーチ特有の木目細
かな検索が可能となる。さらに，例えば３つのマイクロ
コンピュータで各々，近傍条件判定処理，文脈条件判定
処理，および論理条件判定処理を実行させることによ
り，各処理間で同期を取らなくとも処理動作させること
が可能となる。すなわち，これらのマイクロコンピュー
タではそれぞれの入力バッファに照合情報が格納される
とこれに応じて条件判定処理を始めるというパイプライ
ン処理を行うことが可能となり，高速な複合条件判定処
理を実現することができる。

【００２２】

【実施例】最初に、本発明の方法および装置の原理につ
いて説明する。文字列照合手段において，まず文書デー
タが入力された際，文書の先頭に格納された文書識別子
が検出され照合結果として出力される。次に文書中に指
定された検索タームが照合された場合，照合された照合
タームの識別子と，該文書中における照合タームの照合
位置として照合タームの先頭文字位置と末尾文字位置が
照合情報として出力される。すなわち，１文書における
照合情報としては，図１３に示すように先頭に文書識別
子があり，その次から検索タームの照合情報が来る構成
となる。以上の処理が文書毎に全ての文書データを読み
込み終えるまで繰り返し行われる。

【００２３】具体的な検索タームの照合方法について図
４を用いて説明する。例えば文字列照合手段に，検索タ
ーム“文書”が設定され，“．．．。文書理解を用いた
検索システムである。．．．．”という文書が入力され
たことを想定する。この場合の文字列照合手段の出力と
して得られる文書識別情報および照合ターム識別情報は
（６−１）および（６−２）のように表す。（Ｄ１，０，０）（６−１）（Ｔ１，Ｘｓ，Ｘｅ）（６−２）文書識別情報（６−１）においてＤ１は文書識別子を表
し，これに続く２項は定数０（ゼロ）である。照合ター
ム識別情報（６−２）において，Ｔ１は検索タームの識
別子（以後，照合ターム識別子と呼ぶ）を表し，Ｘｓは
文書中で探索された照合タームの先頭文字位置を，Ｘｅ
は同様に末尾文字位置を表わす。図４の例では，文書識
別情報は（Ｄ１，０，０）となり，“文書”の照合ター
ム識別情報は（Ｔ１，３１，３２）となる。

【００２４】次に複合条件判定手段では，以下のような
判定処理が行われる。まず，近傍条件判定手段では前記
文字列照合手段で出力された照合情報に基づいて，検索
ターム間の文字数で表した近接距離条件について判定が
行われる。すなわち，検索条件式に指定された前方に位
置する検索タームの末尾文字位置と後方に位置する検索
タームの先頭文字位置との文字距離を算出し，この文字
距離が近傍条件に指定された距離および順序を満たして
いるか否かの判定が行われる。近接距離条件が成立した
場合には判定結果として，条件に合致した前方に位置す
る検索タームの先頭文字位置と後方に位置する検索ター
ムの末尾文字位置を照合情報として，これを前記文字列
照合手段で出力された照合情報に付加して出力する。具
体的な近傍条件処理例を図５を用いて説明する。例えば
“文書”と“理解”がこの順序で現れ，かつ４文字以内
に近接する文書を検索するという近傍条件“文書［４
Ｃ］理解”が設定され，文字列照合手段に文書 “．．．。文書理解を用いた検索システムであ
る。．．．．” が入力されたことを想定する。まず，検索タームとして
“文書”と“理解”が文字列照合手段に設定される。文
書が入力されると，この２つの検索タームについて文字
列照合処理が実行され，以下の文書識別情報と照合ター
ム識別情報が得られる。（Ｄ１，０，０）（６−３）（Ｔ１，３１，３２）（６−４）（Ｔ２，３３，３４）（６−５）（６−３）は文書識別情報，（６−４）は“文書”の照
合ターム識別情報，および（６−５）は“理解”の照合
ターム識別情報である。次に，これらの情報に基づいて
近傍条件“文書［４Ｃ］理解”について処理が行われ
る。

【００２５】本例では，条件に合致した前方に位置する
検索ターム“文書”の末尾文字位置である３２と，条件
に合致した後方に位置する検索ターム“理解”の先頭文
字位置である３３から文字距離は０（（３３−３２）−
１）＝１−１＝０）であることが算出でき，指定された
４文字より小さいため，本例における近傍条件“文書
［４Ｃ］理解”は成立していると判定される。最後に判
定結果として，本近傍条件の識別子ＰＩＤをＰ１とし，
条件に合致した前方に位置する検索ターム“文書”の先
頭文字位置である３１をＸｓに，後方に位置する検索タ
ーム“理解”の末尾文字位置である３４をＸｅとした照
合情報（６−６）（以後，近傍条件識別情報と呼ぶ。文
脈条件の場合には文脈条件識別情報、論理条件の場合に
は論理条件識別情報と呼び、これらの情報を総称して複
合条件識別情報と呼ぶ。）を，以下のように文字列照合
手段で出力された照合情報に（６−３），（６−４），
および（６−５）に付加して出力する。（Ｄ１，０，０）（６−３）（Ｔ１，３１，３２）（６−４）（Ｔ２，３３，３４）（６−５）（Ｐ１，３１，３４）（６−６）すなわち，近傍条件の判定結果を（ＰＩＤ，Ｘｓ，Ｘ
ｅ）という検索タームの照合情報と同じ形式で照合ター
ム識別情報に付加する形で出力する。

【００２６】次に文脈条件判定手段では前記近傍条件判
定手段で出力された照合情報に基づいて検索条件式中に
指定された検索タームの同一句，同一文，あるいは同一
段落内での共起条件について判定を行う。共起条件判定
では，条件に指定された文脈識別文字列の先頭文字位置
から次の文脈識別文字列の末尾文字位置までの文脈範囲
内に，２つの検索タームが条件中に指定された順序で現
れているかどうかの判定を行う。共起条件が成立した場
合には，判定結果として本文脈条件の識別子と条件に指
定された前方に位置する文脈識別文字列の先頭文字位置
と，後方に位置する文脈識別文字列の末尾文字位置を照
合情報として，これを前記近傍条件判定手段で出力され
た照合情報に付加して出力する。

【００２７】具体的な文脈条件の判定処理の例を図６を
用いて説明する。ここでは，“文書”と“理解”がこの
順序で現れ，かつ同一文内に共起する文脈条件“文書
［Ｓ］検索”が設定され，文字列照合手段に“．．．。
文書理解を用いた検索システムである。．．．．”とい
う文書（文書識別子＝１）が入力されたことを想定す
る。まず，検索タームとして“文書”と“検索”が，
さらに文脈条件が指定されているので，文脈を識別する
ための文字列“。”が文字列照合手段に設定される。文
字列照合手段では，この３つの検索タームが照合され，
図６に示すように（Ｄ１，０，０）（６−７）（Ｓ１，３０，３０）（６−８）（Ｔ１，３１，３２）（６−９）（Ｔ３，３３，３４）（６−１０）（Ｓ１，４８，４８）（６−１１）が出力される。照合ターム識別情報（６−８）および
（６−１１）において，Ｓ１は文脈を識別する文字
列“。”の識別子を表している。

【００２８】これらの照合情報は，近傍条件判定手段に
送られるが，本例の場合では近傍条件が設定されていな
いため，近傍条件判定手段からは入力した照合情報が以
下のようにそのまま出力される。（Ｄ１，０，０）（６−７）（Ｓ１，３０，３０）（６−８）（Ｔ１，３１，３２）（６−９）（Ｔ３，３３，３４）（６−１０）（Ｓ１，４８，４８）（６−１１）（６−７）は文書識別情報，（６−９）は“文書”の，
（６−１０）は“検索”の照合ターム識別情報の，（６
−８）と（６−１１）は“。”の照合ターム識別情報で
ある。

【００２９】次に，これらの照合情報に基づいて文脈条
件“文書［Ｓ］検索”に関する共起条件判定が行われ
る。本例では，文脈すなわち文（センテンス）の範囲
は，条件に指定された文脈識別文字列“。”の先頭文字
位置である３０文字目から次の文脈識別文字列“。”の
末尾文字位置である４８文字目までとして，すなわち
（６−８）から（６−１１）までの範囲で表される。本
例の場合，この文脈範囲内に，条件に指定された検索タ
ーム“文書”および“検索”がこの順序で含まれている
ため，“文書［Ｓ］検索”が成立していると判定され
る。ここで，“文書”と“検索”の順序関係は“文書”
の末尾文字位置（３２）と“検索”の先頭文字位置（４
０）を比較して判定される。すなわち，“文書”の末尾
文字位置（３２）が“検索”の先頭文字位置（４０）よ
り小さい（３２＜４０）ので，“文書”の方が“検索”
より前に位置していると判定できる。

【００３０】最後に判定結果として，本文脈条件の識別
子ＣＩＤをＣ１とし，条件に指定された前方に位置する
文脈識別文字列“。”の先頭文字位置である３０（先頭
位置情報）と，後方に位置する文脈識別文字列“。”の
末尾文字位置である４８（末尾位置情報）を照合情報
（６−１２）（以後，文脈条件識別情報と呼ぶ）とし
て，これを前記近傍条件判定手段で出力された照合情報
に付加して以下のように出力する。（Ｄ１，０，０）（６−７）（Ｓ１，３０，３０）（６−８）（Ｔ１，３１，３２）（６−９）（Ｔ３，３３，３４）（６−１０）（Ｓ１，４８，４８）（６−１１）（Ｃ１，３０，４８）（６−１２）

【００３１】最後に論理条件判定手段では前記文脈条件
判定手段で出力された照合情報に基づいて該検索条件式
中に指定された検索ターム間の論理条件について判定を
行い，条件に指定された文書単位の照合情報を最終的な
検索結果情報として出力する。具体的な論理条件の判定
処理の例を図７を用いて説明する。例えば，“文書”と
“検索”という２つの検索タームが同一文書中に現れる
論理条件“文書［ＡＮＤ］検索”が設定され，文字列照
合手段に文書 “．．．。文書理解を用いた検索システムであ
る。．．．．” が入力されたことを想定する。まず，検索タームとして
“文書”と“検索”が文字列照合手段に設定され，本図
の例の文書が入力されると，文字列照合手段より以下の
照合ターム識別情報が得られる。（Ｄ０，０，０）（６−１３）（Ｔ１，３１，３２）（６−１４）（Ｔ３，３９，４０）（６−１５）（６−１３）は文書識別情報，（６−１４）は“文書”
の，（６−１５）は“検索”の照合ターム識別情報であ
る。もし，近傍条件および文脈条件が設定されていない
場合には，近傍条件判定手段および文脈条件判定手段を
経由するかたちで，これらの情報はそのまま論理条件判
定手段入力され，論理条件“文書［ＡＮＤ］検索”につ
いての論理条件判定が行われる。

【００３２】本例では論理条件判定手段において，“文
書”と“検索”の照合タームが１文書内に同時に存在す
ることを調べ，論理条件“文書［ＡＮＤ］検索”が成立
するものと判定を下す。そして，本条件を満足した文書
識別情報（６−１３）と，本判定結果として本論理条件
の識別子ＬＩＤをＬ１とし，該当文書の先頭文字位置と
末尾文字位置とを照合情報（６−１６）（以後，論理条
件識別情報と呼ぶ）として，これを前記文脈条件判定手
段の出力に付加して，以下のように出力する。（Ｄ０，０，０）（６−１３）（Ｔ１，３１，３２）（６−１４）（Ｔ３，３９，４０）（６−１５）（Ｌ１，０，９９）（６−１６）

【００３３】以上のように，検索条件式中に指定された
検索ターム間の文字数で表した近接距離条件について判
定を行う近傍条件判定手段と，検索条件式中に指定され
た検索タームの同一句，同一文，あるいは同一段落内で
の共起条件について判定を行う文脈条件判定手段と,検
索条件式中に指定された検索ターム間の論理条件につい
て判定を行う論理条件判定手段からなる複合条件判定手
段を用いることにより，フルテキストサーチ特有の木目
細かな絞り込み検索が可能となる。さらに各複合条件判
定を構成する近傍条件判定処理，文脈条件判定処理，お
よび論理条件判定処理の入出力情報形式が全く同じにな
っているため，これらを分散してパイプライン処理する
ことにより高速な複合条件判定処理が可能となる。

【００３４】次に、本発明における第１の実施例につい
て図１を用いて説明する。本実施例は文字列照合回路２
００と複合条件判定回路３００から構成されている。文
字列照合回路２００では検索制御手段１０１（図２）か
ら送られてくる検索対象の検索タームと記憶装置制御手
段１０４（図２）の制御の基に文字列記憶手段１０５
（図２）から読み出される文書データ２０４とを照合
し，照合されたものがあれば照合ターム情報を照合結果
２０５として複合条件判定回路３００へ送る。複合条件
判定回路３００では検索制御手段１０１から送られてく
る複合条件を基に文字列照合回路２００より出力される
照合ターム識別情報に関して複合条件が満たされるか否
かを判定し，条件に合致する場合には該当する照合ター
ム識別情報と複合条件識別情報を文書単位に判定結果２
０６として出力する。

【００３５】まず，文字列照合回路２００について詳細
に説明する。文字列照合回路２００は，タームコンパレ
ータ２１０，文書識別子検出回路２２０，文字数カウン
ト回路２３０，位置情報付加回路８００，および検索タ
ーム長テーブル２５０から構成されている。タームコン
パレータ２１０では，指定された検索タームと送られて
くる文書データ２０４との照合を行い，照合されたもの
があればその検索タームの識別子である照合ターム識別
子２１１（正の整数値データ）を，照合されたものがな
い場合には０（ゼロ）を位置情報付加回路８００へ送出
する。すなわち，照合ターム識別子２１１の値として，
０の場合は無効データであり，正の整数の場合は有効デ
ータであり照合タームの識別子を表す。このタームコン
パレータ２１０としては，特開昭６０−１０５０３９に
開示されているものを用いることができる。文書識別子
検出回路２２０は，第８図に示すようにレジスタ２２４
〜２２８と２２９ａ，コンパレータ２２３、セレクタ２
２９から構成されている。レジスタ２２４には文書単位
に文書データの先頭に付与されているトップオブテキス
トコード（ＴＯＴ）が，レジスタ２２９ａには０（ゼ
ロ）が初期設定されている。８ビット単位に送られてく
る文書データ２０４は，レジスタ２２５〜レジスタ２２
８から構成される４段のシフトレジスタ２２８ｂに次々
と入力される。コンパレータ２２３では，この最終段出
力２２８ａについてレジスタ２２４に格納されているＴ
ＯＴと等しいか否かの比較を行う。レジスタ２２５〜レ
ジスタ２２８では各出力を３２ビットの出力２２２とし
てセレクタ２２９に送り，最終段出力２２８ａがＴＯＴ
の場合には，コンパレータ２２３よりセレクト信号２２
３ａが送られ，３２ビットの出力２２２を文書識別子２
２１として選択し，位置情報付加回路８００へ送出す
る。また，セレクタ信号２２３ａが送られない間，セレ
クタ２２９ではレジスタ２２９ａに格納された０を選択
する。すなわち，文書データの中から，文書単位に文書
データの先頭に付与されているＴＯＴが検出され，これ
に続いて格納されている３２ビットの文書識別子２２１
が位置情報付加回路８００へ送出され，ＴＯＴが検出さ
れない間は０の文書識別子２２１が送出されることにな
る。

【００３６】文字数カウント回路２３０では，送られて
くる文書データ２０４に対して，各文書毎に先頭からの
８ビットの文字コード数をカウントし，１文字が２バイ
トで構成される文字数へ変換し、これを位置情報付加回
路８００へ送出する。文書毎に文字コードカウント値を
リセットするのに，文書識別子検出回路２２０から出力
されるＴＯＴ検出信号２２３ａが用いられる。検索ター
ム長テーブル２５０には，図９に示すように照合ターム
識別子２１１をアドレスとするスロットに該当検索ター
ムの長さが格納されており，位置情報付加回路８００よ
り照合ターム識別子を受け取り，位置情報付加回路８０
０へ照合ターム識別子に対応した検索ターム長８７３を
返送する。本図では，照合ターム識別子が１の検索ター
ム“理解”のターム長である２と，照合ターム識別子が
２の検索ターム“システム”のターム長である４という
情報が設定されている。従って，例えば“検索”に対応
する照合ターム識別子２１１として１を受け取ると検索
ターム長として２を送り返すことになる。

【００３７】位置情報付加回路８００は，図１０に示す
ようにレジスタ８１０〜８１６，ＯＲゲート８８０〜８
８１，セレクタ８２０〜８２２，減算器８３０，および
加算器８３１から構成されている。本回路の初期設定と
して，レジスタ８１３，レジスタ８１４，およびレジス
タ８１５には０（ゼロ）が設定されており，各々セレク
タ８２０，セレクタ８２１，およびセレクタ８２２に０
を出力している。また，レジスタ８１６には１が設定さ
れており，加算器８３１に１を出力している。セレクタ
８２０〜８２２ではセレクト信号８９０，８９１の両方
が０の場合はＺポートを選択する。すなわち各セレクタ
は，レジスタ８１３，レジスタ８１４，およびレジスタ
８１５を各々選択することになり，セレクタ８２０〜８
２２の出力として０が照合情報２０５として出力される
ことになる。また，セレクト信号８９０が１でセレクト
信号８９１が０の場合はＸポートを，セレクト信号８９
０が０でセレクト信号８９１が１の場合にはＹポートを
選択する。レジスタ８１０には文書識別子検出回路２２
０から文書識別子２２１が送られる度に文書識別子２２
１が格納されると共に，セレクタ８２０およびＯＲゲー
ト８８０へ出力される。ここで，文書識別子２２１が０
の場合は文書の識別子以外が検出されたことを示してい
る。ＯＲゲート８８０ではレジスタ８１０に文書識別子
２２１が格納された際，文書識別子２２１の各ビット間
の論理和を取り演算結果であるセレクト信号８９０がセ
レクタ８２０〜８２２に送られる。

【００３８】したがって，レジスタ８１０に文書識別子
２２１が格納された場合には文書識別子２２１の値は０
（ゼロ）ではないため，ＯＲゲート８８０の演算結果８
９０が１になる。これを受けてセレクタ８２０〜８２２
に１が出力されるため各セレクタではＸポートが選択さ
れる。照合情報２０５には，識別子としてレジスタ８１
０に格納されている文書識別子２２１が，先頭位置情報
としてレジスタ８１４に格納されている０（ゼロ）が，
末尾位置情報としてレジスタ８１３に格納されている０
（ゼロ）が文書識別情報として出力されることになる。
従って，文書識別子は図１１に示すように３２ビットの
文書識別子と，先頭位置情報が０でかつ末尾位置情報も
０である３２ビットの０の固定値から構成されることに
なる。

【００３９】レジスタ８１１にはタームコンパレータ２
１０から照合ターム識別子２１１が送られる度に照合タ
ーム識別子２１１が格納されると共に，この照合ターム
識別子２１１はセレクタ８２０，ＯＲゲート８８１，お
よび検索ターム長テーブル２５０へ出力される。さらに
検索ターム長テーブル２５０から照合ターム識別子２１
１に応じて検索ターム長８７３が読み出され減算器８３
０に出力される。ここで，照合ターム識別子２１１が０
の場合は検索タームが照合されていないことを示してい
る。また，レジスタ８１２には文字数カウント回路２３
０から文字数カウント２３１が送られる度に，文字数カ
ウント２３１は照合タームの末尾位置情報８１２ａとし
て格納されると共に，減算器８３０およびセレクタ８２
２へ出力され，さらに減算器８３０で末尾位置情報８１
２ａから検索ターム長８７３を引き，さらに加算器８３
１で１加えられた照合タームの先頭位置情報８３１ａが
セレクタ８２１に出力される。ＯＲゲート８８１ではレ
ジスタ８１１に照合ターム識別子２１１が格納された
際，照合ターム識別子２１１の各ビット間の論理和を取
り演算結果であるセレクト信号８９１がセレクタ８２０
〜８２２に送られる。

【００４０】したがって，レジスタ８１１に照合ターム
識別子２１１が格納された場合には，照合ターム識別子
２１１の値は０でないため，ＯＲゲート８８１の出力が
１となる。これを受けてセレクト信号８９１が１として
セレクタ８２０〜８２２に送られるため各セレクタでは
Ｙポートが選択され，照合情報２０５には，識別子とし
てレジスタ８１１に格納されている照合ターム識別子２
１１と，先頭位置情報として加算器８３１から出力され
ている先頭位置情報８３１ａと，末尾位置情報としてレ
ジスタ８１２に格納されている末尾位置情報８１２ａが
照合ターム識別情報として出力されることになる。よっ
て，照合ターム識別情報は図１２に示すように３２ビッ
トの照合ターム識別子と，１６ビットの先頭位置情報お
よび１６ビットの末尾位置情報からなる３２ビットの照
合位置情報として出力されることになる。

【００４１】以上の説明より明らかなように，照合情報
は（Ｔｎ，Ｘｓ，Ｘｅ）と表すことができる。ここでＴ
ｎは文書識別子または照合ターム識別子を表す。また，
Ｘｓは照合タームの先頭位置情報を，Ｘｅは照合ターム
の末尾位置情報を表す。したがって図４の照合情報の例
（Ｔ２，３３，３４）では，Ｔ２が照合ターム識別子を
表し，３３が照合タームの先頭位置情報を，３４が照合
タームの末尾位置情報を表すことになる。

【００４２】以上説明したタームコンパレータ２１０，
文書識別子検出回路２２０，文字数カウント回路２３
０，検索ターム長テーブル２５０，および位置情報付加
回路８００の動作により文字列照合回路２００からは図
１３に示すような照合情報が文書毎に出力されることに
なる。すなわち，文書毎にまず先頭に文書識別情報が来
て，次に照合ターム識別情報が並ぶ構成となる。また文
書識別情報は，照合ターム識別情報と構造が同じであ
り，位置情報が０の照合ターム識別情報と見なすことが
できる。したがって，照合ターム識別情報と同様に扱う
ことができるため，文書識別情報を構造上意識すること
なく一括した処理を行うことが可能となる。以上が文字
列照合回路２００の詳細な説明である。

【００４３】次に，文字列照合回路２００の動作を具体
例で説明する。ここでは，検索条件式 “Ｑ＝((文書［４Ｃ］理解)［Ｓ］システム) ［ＡＮＤ］(文書［Ｓ］検索)”（７−１）を例として説明する。本例では検索タームとして“Ｔ
１：文書”，“Ｔ２：理解”，“Ｔ３：検索”，“Ｔ
４：システム”および“Ｓ１：。”の５つが検索制御手
段１０１より送られ，検索タームはタームコンパレータ
２１０に，検索タームの長さは検索ターム長テーブルに
設定される。ここで，Ｔ１，Ｔ２，Ｔ３，Ｔ４，および
Ｓ１はそれぞれ検索ターム“文書”，“理解”，“検
索”，“システム”，および“。”の照合ターム識別子
を表わす。“Ｓ１：。”は，文脈条件の“［Ｓ］”すな
わち文脈として文（センテンス）の指定に対応してセン
テンスの文脈識別文字列（以後，文脈マーカーと呼ぶ）
としての“。”を検出するためのものである。

【００４４】文書としては， “・・・。文書理解を用いた検索システムである。・・
・・” （７−２）が入力されるものする。文書識別子はＤ１とする。この
文書データが文字列照合回路２００へ入力されたときの
照合結果２０５が図１４に示すような以下の照合情報が
出力される。 (Ｄ１，０，０) (８−１) (Ｓ１，３０，３０) (８−２) (Ｔ１，３１，３２) (８−３) (Ｔ２，３３，３４) (８−４) (Ｔ３，３９，４０) (８−５) (Ｔ４，４１，４４) (８−６) (Ｓ１，４８，４８) (８−７) （８−１）は文書識別情報を表している。文書識別情報
（８−１）においてＤ１は文書識別子を表し，これに続
く２項は定数０である。（８−２）と（８−７）は文脈
マーカー“。”の，（８−３）は“文書”の，（８−
４）は“理解”の，（８−５）は“検索”の，および
（８−６）は“システム”の照合ターム識別情報を表し
ている。また，Ｓ１は“。”の，Ｔ１は“文書”の，Ｔ
２は“理解”の，Ｔ３は“検索”の，およびＴ４は“シ
ステム”の照合ターム識別子を表している。これら（８
−１）〜（８−７）の照合情報２０５が複合判定回路３
００の入力として送られることになる。

【００４５】次に，複合条件判定回路３００の条件判定
処理について説明する。複合条件判定回路３００は図１
に示すように，３つのマイクロコンピュータのＭＰＵａ
３０１，ＭＰＵｂ３０２，およびＭＰＵｃ３０３から構
成されている。マイクロコンピュータＭＰＵａ３０１で
は近傍条件判定プログラム３１０が，マイクロコンピュ
ータＭＰＵｂ３０２では文脈条件判定プログラム３２０
が，マイクロコンピュータＭＰＵｃ３０３では論理条件
判定プログラム３３０が実行される。さらに各ＭＰＵ間
にはファーストイン・ファーストアウト（ＦＩＦＯ）メ
モリを使用してたバッファ３５０，３６０，および３７
０が配置され，それぞれのＭＰＵ間のデータの受渡しに
用いられている。

【００４６】まず，近傍条件判定プログラム３１０の判
定処理について説明する。近傍条件判定プログラム３１
０では，文字列照合回路２００からバッファ３５０に送
り込まれた照合情報２０５を読み出し，検索情報２０２
として指定された近傍条件に合致するか否かを判定す
る。近傍条件例としては，（７−１）の中に“文書［４
Ｃ］理解”という条件式がある。“文書［４Ｃ］理解”
という条件式は，“文書”と“理解”という２つの検索
タームがこの順序で現われ，且つこの２つの検索ターム
が４文字以内に近接して現れる文書を探し出すというこ
とを表す。ここでは検索式を一種の演算式と見なして，
“文書”を前方オペランドＴａ，“検索”を後方オペラ
ンドＴｂと，また“［４Ｃ］”をオペレーションと呼ぶ
ことにする。さらに本近傍条件を表す識別子を“Ｐｉ”
とする。なおＰｉには照合ターム識別子とは区別できる
コードを割り付ける。このように定義することにより，
近傍条件は“Ｐｉ：Ｔａ［ｎＣ］Ｔｂ”と記述すること
ができる。以下の説明はこの定義を用いて行う。

【００４７】近傍条件のオペレーションにはこの他にも
前述したように， “Ｐｉ：Ｔａ［ｎＣ，ｍＣ］Ｔｂ” “Ｐｉ：Ｔａ＜ｎＣ＞Ｔｂ” “Ｐｉ：Ｔａ［ｎｃ］Ｔｂ” “Ｐｉ：Ｔａ［ｎｃ，ｍｃ］Ｔｂ” “Ｐｉ：Ｔａ＜ｎｃ＞Ｔｂ” などがある。この近傍条件の処理の手順について図１５
を用いて詳細に説明する。まず，繰返し処理ステップ１
０００ではバッファ３５０内の照合情報２０５を全て，
すなわち最後の文書の照合情報を読み出し尽くすまで１
００１から１０１０までの処理ステップを繰り返す。

【００４８】照合情報読込み処理ステップ１００１で
は，バッファ３５０より照合情報２０５を１個読み出
し，バッファ３６０へ出力する。照合情報識別処理ステ
ップ１００２では，上記照合情報読込み処理ステップ１
００２で読み込んだ照合情報２０５が文書識別情報なの
か，あるいは照合ターム識別情報なのか調べる。すなわ
ち照合情報の下位３２ビットが０（ゼロ）の場合には，
文書識別子と判定する。文書識別子と判定した場合に
は，文書単位の初期化処理ステップ１００４を実行す
る。ここではワークエリアとして使用する前方オペラン
ドバッファ３１１の０（ゼロ）クリアを行う。照合情報
２０５が照合ターム識別情報の場合には，後方オペラン
ド識別処理ステップ１００３を実行する。後方オペラン
ド識別処理ステップ１００３では，照合ターム識別情報
の照合ターム識別子を調べて，後方オペランドとして近
傍条件に指定された照合タームか否かを判定する。後方
オペランドの場合には後述する前方オペランドバッファ
３１１に格納されている照合ターム識別情報との距離を
求め，指定された近傍条件を満たしているか否かを判定
する。

【００４９】以降，前方オペランドに指定された検索タ
ームに関する照合ターム識別情報を前方照合ターム識別
情報と呼び，後方オペランドに指定された検索タームに
関する照合ターム識別情報を後方照合ターム識別情報と
呼ぶことにする。すなわち，前方オペランドバッファ繰
返し処理ステップ１００５では前方オペランドバッファ
３１１に格納されている前方照合ターム識別情報と後方
オペランドに指定されている後方照合ターム識別情報と
の近接条件を判定することになる。この近接条件判定で
は，まず前方照合ターム識別情報読込み処理ステップ１
００６において前方オペランドバッファ３１１から前方
照合ターム識別情報を読み込む。次に近接条件判定処理
ステップ１００７で，読み込まれた前方照合ターム識別
情報と後方照合ターム識別情報の位置情報を比較して指
定された近接条件が満足されるか否かを判定し，近接条
件が満される場合には判定結果を照合情報としてバッフ
ァ３６０および前方オペランドバッファ３１１に出力す
る。

【００５０】前方オペランド識別処理ステップ１００９
では，照合ターム識別情報の照合ターム識別子が前方オ
ペランドとして指定されている場合には，後方オペラン
ドに指定されているものも含めて，この照合ターム識別
情報を前方オペランドバッファ３１１に出力する。これ
は例えば，近傍条件として“Ｐｉ：Ｔａ［ｎＣ］Ｔｂ”
と“Ｐｊ：Ｔｂ［ｎＣ］Ｔｃ”が指定された場合，つま
りＴｂが後方オペランドとしても，前方オペランドとし
ても指定されているような場合に，Ｔｂについては後方
オペランド識別処理ステップ１００３と前方オペランド
識別処理ステップ１００９の両方の処理が必要となるか
らである。このために，後方オペランド識別処理ステッ
プ１００３と前方オペランド識別処理ステップ１００９
を分けて処理を行うことになる。以上の各処理ステップ
をバッファ３５０に格納されている照合情報に対し繰返
し実行していくことにより，近傍条件判定処理を実現す
ることができる。

【００５１】以上の処理手順を具体例で説明する。検索
条件としては，（７−１）に示した式“Ｑ＝((文書［４
Ｃ］理解)［Ｓ］システム)［ＡＮＤ］(文書［Ｓ］検
索)”を例に用いて説明する。各条件判定プログラムに
は，検索制御手段１０１で解析され各条件に分離された
条件式が設定される。具体的には，近傍条件判定プログ
ラム３１０に本条件式（７−１）の近傍条件部分“文書
［４Ｃ］理解”が，近傍条件識別子Ｐ１と“文書”およ
び“理解”に対応する検索ターム識別子Ｔ１およびＴ２
を用いて，“Ｐ１：Ｔ１［４Ｃ］Ｔ２”という形で与え
られる。今，（７−２）に示した文書 “・・・。文書理解を用いた検索システムである。・・
・・” が入力されたとすると，前述したように文字列照合回路
２００からは以下の（８−１）〜（８−７）が照合情報
としてバッファ３５０へ出力される。これらの照合情報
を図１７に示す。

【００５２】(Ｄ１，０，０) (８−１) (Ｓ１，３０，３０) (８−２) (Ｔ１，３１，３２) (８−３) (Ｔ２，３３，３４) (８−４) (Ｔ３，３９，４０) (８−５) (Ｔ４，４１，４４) (８−６) (Ｓ１，４８，４８) (８−７) （８−１）は文書識別情報を表している。Ｄ１は文書識
別子である。（８−２）と（８−７）は“。”の照合タ
ーム識別情報を表している。また，（８−３），（８−
４），（８−５），および（８−６）は，それぞれ“文
書”，“理解”，“検索”，および“システム”の照合
ターム識別情報を表している。さらに，Ｓ１，Ｔ１，
Ｔ２，Ｔ３，およびＴ４は，それぞれ“。”，“文
書”，“理解”，“検索”，および“システム”の照合
ターム識別子を表している。以上の条件における近傍条
件判定処理を図１５を用いて１ステップずつ説明する。
初期状態では図１６ａ，図１６ｂの初期状態に示すよう
にバッファ３５０に照合情報（８−１）〜（８−７）が
格納されており，前方オペランドバッファ３１１及びバ
ッファ３６０は０クリアされた状態になっている。

【００５３】近傍条件判定処理プログラムではこれらの
照合情報２０５をバッファ３５０から一つずつ読込み，
近傍条件“Ｐ１：Ｔ１［４Ｃ］Ｔ２”について判定処理
を行う。まずステップ１として，読込み処理ステップ１
００１が実行され，照合情報（８−１）すなわち(Ｄ
１，０，０)が図１６のステップ１に示すようにプログ
ラムのワークエリアに読み込まれ，バッファ３６０へ照
合情報としてそのまま出力される。次に照合情報識別処
理ステップ１００２が実行され，照合情報(Ｄ１，０，
０)が文書識別情報かどうかが調べられる。照合情報(Ｄ
１，０，０)は後部の２項が両方とも０（ゼロ），すな
わち下位３２ビットが０（ゼロ）のため，文書識別情報
と判断される。したがって，初期化処理ステップ１００
４が実行され，内部のワークエリアである前方オペラン
ドバッファ３１１がゼロクリアされる。その後ステップ
２として再び，照合情報読込み処理ステップ１００１が
実行され照合情報（８−２）すなわち(Ｓ１，３０，３
０)が読み込まれ，同様にしてバッファ３６０へそのま
ま出力される。次に照合情報識別処理ステップ１００２
が実行され，照合情報（８−２）が文書識別情報か照合
ターム識別情報かどうかが調べられる。照合情報（８−
２），すなわち(Ｓ１，３０，３０)は下位３２ビットが
０（ゼロ）でないため，文書識別情報ではなく照合ター
ム識別情報と判断される。そして，次の後方オペランド
識別処理ステップ１００３で，本照合ターム識別情報が
近傍条件中に指定された後方オペランドに指定されたも
のに該当するかどうかが調べられる。

【００５４】近傍条件 “Ｐ１：Ｔ１［４Ｃ］Ｔ２”の
後方オペランドに指定された検索タームはＴ２であり，
本照合タームＳ１は後方オペランドに該当しないため，
１００５〜１００８の処理は行われず，すなわち，近傍
条件判定処理は行われず，次の前方オペランド識別処理
ステップ１００９が実行されることになる。本処理ステ
ップでは，上記照合ターム識別情報（８−２）が近傍条
件“Ｐ１：Ｔ１［４Ｃ］Ｔ２”の前方オペランドとして
指定されたものに該当するかどうかが調べられる。本照
合タームはＳ１のため前方オペランドには該当しないた
め，処理ステップ１０１０は実行されず，すなわち前方
オペランドバッファ３１１へ格納されることなく処理を
終える。

【００５５】ステップ３として繰返し処理１０００によ
り，読込み処理ステップ１００１が実行され，３番目の
照合情報（８−３）すなわち（Ｔ１，３１，３２）が読
み込まれ，第２の入力と同様にバッファ３６０へ出力さ
れる。同時に照合情報識別処理ステップ１００２が実行
される。文書識別情報か照合ターム識別情報かが調べら
れる。（８−３）は照合ターム識別情報なので後方オペ
ランド識別処理ステップ１００３が実行され，後方オペ
ランドでないため前方オペランド識別処理ステップ１０
０９が実行される。照合ターム識別情報（８−３），す
なわち（Ｔ１，３１，３２）は近傍条件“Ｐ１：Ｔ１
［４Ｃ］Ｔ２”の前方オペランドに指定されているの
で，前方オペランド格納処理ステップ１０１０が実行さ
れ，図１６のステップ３に示すように前方オペランドバ
ッファに格納される。

【００５６】また，ステップ４として繰返し処理１００
０により，読込み処理ステップ１００１が実行され，４
番目の照合情報（８−４）すなわち（Ｔ２，３３，３
４）が読み込まれ，第３の入力と同様にバッファ３６０
へ照合ターム識別情報（８−４）が出力される。次に照
合情報識別処理ステップ１００２が実行され，文書識別
情報か照合ターム識別情報かが調べられる。（８−４）
は照合ターム識別情報なので後方オペランド識別処理ス
テップ１００３が実行される。（８−４）すなわち（Ｔ
２，３３，３４）は近傍条件“Ｐ１：Ｔ１［４Ｃ］Ｔ
２”の後方オペランドに指定されているので，処理ステ
ップ１００５から１００８までの近接条件判定処理が実
行される。まず前方オペランドバッファ読込み処理ステ
ップ１００６が実行され，前方オペランドバッファ３１
１に格納されている前方照合ターム識別情報（８−３）
が読み込まれる。次に近接条件判定処理ステップ１００
７が実行され前方照合ターム識別情報（８−３）と後方
照合ターム識別情報（８−４）との文字距離が調べられ
る。（８−３）すなわち（Ｔ１，３１，３２）の末尾位
置Ｘｅは３２であり，（８−４）すなわち（Ｔ２，３
３，３４）の先頭位置は３３なので，その間の文字距離
は０であり指定条件の４文字以下を満たしている。この
ため判定結果出力処理ステップ１００８が実行され，判
定結果として（８−３）の先頭位置である３１を先頭位
置とし，（８−４）の末尾位置である３４を末尾位置と
し，照合ターム識別子をＰ１とする近傍条件識別情報
（Ｐ１，３１，３４）（図１７）が図１６ａ，図１６ｂ
のステップ４のように前方オペランドバッファ３１１と
バッファ３６０へ出力される。さらに，繰返し処理１０
００により，読込み処理ステップ１００１が実行され，
５番目の照合情報（８−５）すなわち（Ｔ３，３９，４
０）が読込まれ，第４の入力と同様にバッファ３６０へ
（８−５）が出力される。次に照合情報識別処理ステッ
プ１００２が実行され，文書識別情報か照合ターム識別
情報かが調べられる。照合ターム識別情報（８−５）は
近傍条件に設定されていない照合識別情報であるため，
後方オペランド識別処理ステップ１００３および前方オ
ペランド識別処理ステップ１００９のいずれの処理も行
われずに次の入力に移る。以後，最後の照合ターム情報
（８−７）まで同じように近傍条件判定処理を繰り返
す。

【００５７】以上の近傍条件判定処理によって，以下に
示す（９−１）〜（９−８）の照合ターム識別情報（図
１７）がバッファ３６０へ出力される。 (Ｄ１，０，０) (９−１) (Ｓ１，３０，３０) (９−２) (Ｔ１，３１，３２) (９−３) (Ｔ２，３３，３４) (９−４) (Ｐ１，３１，３４) (９−５) (Ｔ３，３９，４０) (９−６) (Ｔ４，４１，４４) (９−７) (Ｓ１，４８，４８) (９−８) ここで注目すべき点は，近傍条件判定結果（９−５）も
照合ターム識別情報として，末尾位置情報の昇順にソー
トし，格納されている点である。このため，後述するよ
うに文脈条件判定の際，全ての文脈と照合タームとの組
合せについて包含関係をチェックしなくても済むため処
理を軽減できるようになる。これらの照合ターム識別情
報は文脈条件判定プログラム３２０へ送られることにな
る。

【００５８】次に，文脈条件判定プログラム３２０の判
定処理について説明する。文脈条件判定プログラム３２
０では，近傍条件判定プログラム３１０からバッファ３
６０に送り込まれた照合情報を読み出し，検索情報２０
２として指定された文脈条件に合致するか否かを判定す
る。文脈条件の例としては，（７−１）に示したような
“文書［Ｓ］検索”がある。“文書［Ｓ］検索”という
条件式は，“文書”と“検索”という２つの検索ターム
がこの順序で，同一の文（センテンス）に現れる文書を
探し出すということを表す。ここで本文脈条件を表す識
別子（以後，文脈条件識別子と呼ぶ）をＣｉとする。Ｃ
ｉには照合ターム識別子とは区別できるコードを割り付
ける。このように定義することにより，文脈条件は“Ｃ
ｉ：Ｔａ［Ｓ］Ｔｂ”と記述することができる。以下の
説明はこの定義を用いて行うことにする。文脈条件には
この他にも， “Ｃｉ：Ｔａ［Ｐ］Ｔｂ”， “Ｃｉ：Ｔａ［ＰＨ］Ｔｂ”， “Ｃｉ：Ｔａ［ｐ］Ｔｂ”， “Ｃｉ：Ｔａ［ｓ］Ｔｂ”， “Ｃｉ：Ｔａ［ｐｈ］Ｔｂ” などがある。

【００５９】文脈条件判定の原理について，図１８の近
傍条件判定処理出力例を用いて説明する。（７−２）に
示した文書“・・・。文書理解を用いた検索システムで
ある。・・・・”が入力されたことを想定すると，前述
したように近傍条件判定プログラム３１０からは本図に
示す以下の（９−１）〜（９−８）が照合情報としてバ
ッファ３６０を介し文脈条件判定処理プログラム３２０
へ送られる。 (Ｄ１，０，０) (９−１) (Ｓ１，３０，３０) (９−２) (Ｔ１，３１，３２) (９−３) (Ｔ２，３３，３４) (９−４) (Ｐ１，３１，３４) (９−５) (Ｔ３，３９，４０) (９−６) (Ｔ４，４１，４４) (９−７) (Ｓ１，４８，４８) (９−８) （９−１）は文書識別情報を表している。Ｄ１は文書識
別子を表し，これに続く２項は定数０である。（９−
２）と（９−８）は文脈マーカー“。”の照合ターム識
別情報を表している。同様に，（９−３），（９−
４），（９−６），および（９−７）は，それぞれ“文
書”，“理解”，“検索”“システム”の照合ターム識
別情報を表している。ここで，Ｓ１，Ｔ１，Ｔ２，Ｔ
３，およびＴ４は，それぞれ“。”，“文書”，“理
解”，“検索”，および“システム”の照合ターム識別
子を表す。また，（９−５）は近傍条件“文書［４Ｃ］
理解”が照合された際の近傍条件識別情報を表してい
る。Ｐ１は近傍条件“文書［４Ｃ］理解”の近傍条件識
別子である。

【００６０】以上の照合情報に基づいて，まず照合ター
ム識別子の順序が指定されている文脈条件“Ｃｉ：Ｔａ
［Ｓ］Ｔｂ”に関する共起判定を実行する。ここで識別
子Ｔａを０番目の識別子と呼び，識別子Ｔｂを１番目の
識別子と呼ぶ。共起判定では，文脈条件に指定されてい
る全ての識別子が文脈中に出現したかどうかの判定を行
う。共起判定の成否を判断するために，ここでは共起カ
ウンタを用いる。この共起カウンタは指定された文脈条
件に対応して１つずつ設ける。これより順序が指定され
ている文脈条件における共起カウンタの制御方法につい
て，以下説明する。文脈条件“Ｃｉ：Ｔａ［Ｓ］Ｔｂ”
における文脈すなわち文（センテンス）の範囲は，出現
した文脈マーカー“。”の照合情報（９−２）から次に
出現する文脈マーカー“。”の照合情報（９−８）まで
である。よって，（９−２）〜（９−８），すなわち
（Ｓ１，３０，３０）〜（Ｓ１，４８，４８）がセンテ
ンスの範囲となる。このため，（９−２）すなわち
（Ｓ１，３０，３０）から順番に調べる。文脈マーカー
“。”が出現すると共起カウンタを０（ゼロ）にリセッ
トし，次に文脈条件に指定された照合情報が現れるかど
うかを調べていく。まず，文脈条件に指定された第０番
目の識別子Ｔａが現れるまで共起カウンタの値を変更し
ない。すなわち，共起カウンタの値が０のとき第０番目
の識別子Ｔａに着目し，この識別子が現れるのを監視す
る。ここで識別子Ｔａの照合情報が現れた場合，共起カ
ウンタをカウントアップする。つまり共起カウンタの値
を０から１に変更する。

【００６１】次に共起カウンタの値が１を示しているの
で，文脈条件に指定されている第１番目の識別子Ｔｂが
現れるのを監視し，現れた場合に共起カウンタをカウン
トアップする。ここで識別子Ｔｂの照合情報が現れた場
合，共起カウンタをカウントアップする。すなわち，共
起カウンタの値を１から２に更新する。ここで共起カウ
ンタの値が２になったところで，本文脈条件に指定され
た識別子が全て現れたことになるため，共起条件が成立
したことを判別できる。このように共起カウンタを制御
することにより，順序が指定された文脈条件における共
起判定を行っている。共起カウンタの判定は，後述する
ように次の文脈マーカーが現れた時点で行う。さら
に，次に文脈マーカー“。”の照合情報（９−８）すな
わち（Ｓ１，４８，４８）が出現する。この時点の共起
カウンタの値は２になっている。共起カウンタの値が２
ということは，文脈条件に指定されている２つの検索タ
ームの識別子が出現し，共起条件が成立していることを
表している。このとき，成立した文脈条件の文脈条件識
別情報を出力する。この文脈条件識別情報の先頭位置情
報には前に現れた文脈マーカー“。”の先頭位置情報で
ある３０を設定し，末尾位置情報には後に現れた文脈マ
ーカー“。”の末尾位置情報である４８を設定する。ま
た，文脈条件識別情報の識別子には文脈条件の識別子
“Ｃｉ”を設定する。すなわち，文脈条件識別情報（Ｃ
ｉ，３０，４８）を出力する。

【００６２】次に，照合ターム識別子の順序を問わない
文脈条件“Ｃｊ：Ｔａ［ｓ］Ｔｂ”の場合の共起カウン
タの制御方法について，以下説明する。文脈の範囲は同
様に（９−２）〜（９−８），すなわち（Ｓ１，３０，
３０）〜（Ｓ１，４８，４８）がセンテンスの範囲とな
る。このため，同様に（９−２）すなわち（Ｓ１，３
０，３０）から順番に調べる。まず，文脈マーカ
ー“。”が出現すると同様に共起カウンタを０（ゼロ）
にリセットする。次に文脈条件に指定された照合情報が
現れるかどうかを調べていく。まず，識別子“Ｔｂ”
の照合情報が現れた場合，共起カウンタをカウントアッ
プする。つまり共起カウンタの値は０から１に更新す
る。この後で既に出現した識別子“Ｔｂ”の照合情報が
同一文脈中に再び現れた場合には共起カウンタの値を変
更しない。次に識別子“Ｔａ”の照合情報が現れた場
合，共起カウンタをカウントアップする。つまり共起カ
ウンタの値は１から２に更新する。ここで共起カウンタ
の値が２になったところで，，本文脈条件に指定された
２つの識別子が全て現れたことになるため，共起条件が
成立したことが判別できる。この後で既に出現した識別
子“Ｔａ”の照合情報が同一文脈中に再び現れた場合に
も共起カウンタの値を変更しない。さらに，次に文脈マ
ーカー“。”の照合情報（９−８）すなわち（Ｓ１，４
８，４８）が出現したとき，既に共起カウンタが２，す
なわち共起条件が成立しているので，本文脈条件の文脈
条件識別情報を出力する。すなわち，文脈条件識別情報
（Ｃｊ，３０，４８）を出力する。このように共起カウ
ンタを制御することにより，順序を問わない文脈条件の
共起判定にも使用することができる。以上のように共起
カウンタを制御することにより共起判定の成否を判断す
ることができる。

【００６３】文脈条件の処理の手順について図１９を用
いて詳細に説明する。まず繰返し処理ステップ１１００
ではバッファ３６０内の照合情報を全て，すなわち最後
の文書の照合情報を読み出し尽くすまで１１０１から１
１１２までの処理ステップを繰り返す。照合情報読込み
処理ステップ１１０１では，バッファ３６０より照合情
報を１個読み出し，ワークエリアへ出力する。照合情報
識別処理ステップ１１０２では，上記照合情報読込み処
理ステップ１１０１で読み込んだ照合情報が照合ターム
識別情報なのかどうかを調べる。すなわち照合情報の下
位３２ビットが０（ゼロ）でない場合には，照合ターム
識別子と判定する。この場合には，文脈マーカーを検出
する文脈マーカー識別処理ステップ１１０３を実行す
る。照合ターム識別情報以外の場合には，照合情報をバ
ッファ３７０へ出力する照合情報出力処理ステップ１１
１２を実行する。文脈マーカー識別処理ステップ１１０
３では，照合ターム識別情報の照合ターム識別子を調べ
て文脈条件に指定された文脈の文脈マーカーか否かを判
定する。文脈マーカーの場合には，後処理ステップ１１
０４が実行される。

【００６４】後処理ステップ１１０４では，これまで共
起判定を行ってきた文脈の末尾位置情報を格納し，ワー
クエリアに格納する。この文脈識別情報は後述する照合
ターム識別情報出力処理ステップ１１１０でバッファ３
７０に出力される。その後，前処理ステップ１１０４ａ
を実行する。ここでは本文脈マーカーを端点とする次の
文脈に対し共起判定を実行するための準備を行う。ま
ず，本文脈マーカーを端点とする文脈に関する文脈条件
の共起カウンタを０にリセットする。さらに，本文脈マ
ーカーの先頭位置情報を，本文脈マーカーを端点とする
文脈の先頭位置情報とする。後処理ステップ１１０４に
おいて，文脈条件識別情報をワークエリアに格納し，再
度文脈条件判定を行うのは文脈条件が入れ子の場合を考
慮しているからである。文脈条件の入れ子とは，すなわ
ち，“Ｃｊ：（Ｔａ［ｓ］Ｔｂ）［ｐ］Ｔｃ”のように
“Ｔａ”と“Ｔｂ”という２つの検索タームがその順序
を問わず，同一文（センテンス）に現れ，且つこの文
（センテンス）と“Ｔｃ”という検索タームが順序を問
わず，同一段落（パラグラフ）に現れる文書を探し出す
というように文脈条件中に文脈条件が指定される場合を
いう。

【００６５】この判定手順としては，文脈条件を“Ｃ
ｉ：（Ｔａ［ｓ］Ｔｂ）”と“Ｃｊ：Ｃｉ［ｐ］Ｔｃ”
とに分け，まず含まれている方の文脈条件すなわち本例
では段落に包含されているセンテンスに関する文脈条件
“Ｃｉ：（Ｔａ［ｓ］Ｔｂ）”を判定する。このセンテ
ンスの文脈条件が成立したと想定する。この成立時にセ
ンテンスの文脈条件識別情報が一時格納バッファに格納
される。次にセンテンスの文脈マーカーが現れたとき，
このセンテンスの文脈条件識別情報に末尾位置情報が設
定され，文脈条件識別情報として確定する。このセンテ
ンスの文脈条件識別情報をワークエリアに格納し，含む
方の文脈条件すなわち本例では段落に関する文脈条件
“Ｃｊ：Ｃｉ［ｐ］Ｔｃ”の判定対象とする。その後，
照合ターム識別子Ｔｃの照合ターム識別情報が現れたと
想定する。このとき，段落の文脈条件は成立し，一時格
納バッファに段落の文脈条件識別情報が格納される。次
に段落の文脈マーカーが出現したとき，この段落の文脈
条件識別情報に末尾位置情報が設定され，文脈条件識別
情報として確定される。このように処理を行うことによ
って，入れ子の文脈条件“Ｃｊ：（Ｔａ［ｓ］Ｔｂ）
［ｐ］Ｔｃ”の条件判定を実現している。

【００６６】文脈マーカー識別処理ステップ１１０３の
後には，ワークエリア繰返し処理ステップ１１０６を実
行する。ワークエリア繰返し処理ステップ１１０６で
は，照合情報読込み処理ステップ１１０１や後処理ステ
ップ１１０４でワークエリアに格納された全ての照合タ
ーム識別情報について１１０７〜１１１０の共起判定処
理を繰り返し実行する。文脈条件指定識別処理ステップ
１１０７では，ワークエリアに格納されている照合ター
ム識別情報の照合ターム識別子から文脈条件に指定され
ているか否かを調べる。文脈条件に指定されている場合
には共起判定処理ステップ１１０８が実行され，文脈条
件に指定されている照合ターム識別子が文脈中に現れる
度にカウントアップする共起カウンタ値が２かどうかを
調べる。共起カウンタ値が２ということは，文脈条件に
指定された２つの照合ターム識別子が発見され文脈条件
が成立したことを表している。文脈条件が成立した場合
には，該当文脈条件の文脈条件識別子を一時格納バッフ
ァ３２１に格納する一時格納処理ステップ１１０９を実
行する。その後，文脈マーカー識別処理ステップ１１１
０ａを実行し，文脈マーカーの照合ターム識別情報でな
ければ照合ターム識別情報出力処理ステップ１１１０を
実行する。ここでは，照合ターム識別情報をバッファ３
７０に出力する。以上の各処理ステップをバッファ３６
０に格納されている照合情報に対し繰返し実行していく
ことにより文脈条件判定処理を実現することができる。

【００６７】以上の処理手順を具体例で説明する。検索
条件としては，（７−１）に示した式“Ｑ＝((文書［４
Ｃ］理解)［Ｓ］システム)［ＡＮＤ］(文書［ｓ］検
索)”を例に用いる。各条件判定プログラムには，検索
制御手段１０１で解析され各条件に分離された条件式が
設定される。具体的には，文脈条件判定プログラム３２
０には本条件式（７−１）の文脈条件部分“（文書［４
Ｃ］理解）［Ｓ］システム”と“文書［ｓ］検索”が設
定される。ここでは，近傍条件“文書［４Ｃ］理解”の
識別子をＰ１とし，“システム”の検索ターム識別子を
Ｔ３とすることにより，文脈条件“（文書［４Ｃ］理
解）［Ｓ］システム”を“Ｃ１：Ｐ１［Ｓ］Ｔ３”とい
う形で表す。Ｃ１は文脈条件の識別子である。同様に，
文脈条件“文書［ｓ］検索”は“Ｃ２：Ｔ１［ｓ］Ｔ
４”と表される。Ｃ２は文脈条件の識別子であり，Ｔ１
は“文書”の，Ｔ４は“検索”の検索ターム識別子であ
る。

【００６８】今，（７−２）に示した文書 “・・・。文書理解を用いた検索システムである。・・
・・” が入力されたとすると，前述したように近傍条件判定プ
ログラム３１０からは図１８に示す以下の（９−１）〜
（９−８）が照合情報としてバッファ３６０へ出力され
る。 (Ｄ１，０，０) (９−１) (Ｓ１，３０，３０) (９−２) (Ｔ１，３１，３２) (９−３) (Ｔ２，３３，３４) (９−４) (Ｐ１，３１，３４) (９−５) (Ｔ３，３９，４０) (９−６) (Ｔ４，４１，４４) (９−７) (Ｓ１，４８，４８) (９−８) 本例では，文脈マーカーの照合情報（９−２）と（９−
８）を端点とする文脈，すなわちセンテンスにおいて，
文脈条件“（文書［４Ｃ］理解）［Ｓ］システム”と文
脈条件“文書［ｓ］検索”が成立するか否かが判定され
ることになる。

【００６９】この条件式における文脈条件判定処理につ
いて図２０ａ，図２０ｂと図２１ａ，図２１ｂを用いて
説明する。まず，図２０ａ，図２０ｂに示す初期状態に
おいては，バッファ３６０に照合情報（９−１）〜（９
−８）が格納されており，一時格納バッファ３２１及び
バッファ３７０は０クリアされた状態になっている。文
脈条件判定処理プログラム３２０ではこれらの照合情報
をバッファ３６０から照合情報を一つずつ読込み，文脈
条件“Ｃ１：Ｐ１［Ｓ］Ｔ３”と文脈条件“Ｃ２：Ｔ１
［ｓ］Ｔ４”について判定処理を行う。まずステップ１
として，図１９に示す読込み処理ステップ１１０１が実
行され，照合情報（９−１）すなわち照合情報(Ｄ１，
０，０)が図２０ａ，図２０ｂのステップ１に示すよう
にプログラムのワークエリアに読み込まれる。次に照合
情報識別処理ステップ１１０２が実行され，照合情報
（９−１）が照合ターム識別情報かどうかが調べられ
る。照合情報(Ｄ１，０，０)は後部の２項が両方とも０
（ゼロ），すなわち下位３２ビットが０（ゼロ）のた
め，文書識別情報と判断される。したがって，照合情報
(Ｄ１，０，０)は照合ターム識別情報でないため，文脈
マーカー識別処理ステップ１１１０ａにより文脈マーカ
ーのものでないと判断される。このため，次の照合情報
出力処理ステップ１１１０が実行され，そのままバッフ
ァ３７０へ出力される。

【００７０】その後ステップ２として，再び照合情報読
込み処理ステップ１１０１が実行され，照合情報（９−
２）すなわち(Ｓ１，３０，３０)が読み込まれる。次に
照合情報識別処理ステップ１１０２が実行され，照合情
報(Ｓ１，３０，３０)が照合ターム識別情報かどうかが
調べられる。照合情報(Ｓ１，３０，３０)は下位３２ビ
ットが０（ゼロ）でないため，文書識別情報ではなく照
合ターム識別情報と判断される。そして，次の文脈マー
カー識別処理ステップ１１０３が実行され，本照合ター
ム識別情報が文脈条件中に指定された文脈の文脈マーカ
ーに該当するかどうかが調べられる。照合情報(Ｓ１，
３０，３０)の照合ターム識別子Ｓ１は文脈マーカーに
指定された“。”に対応するものであるので，後処理ス
テップ１１０４が実行されることになる。

【００７１】後処理ステップ１１０４では，まず本文脈
マーカーＳ１を端点とする文脈の末尾位置情報を設定す
る。次に，一時格納バッファ３２１に照合情報が格納さ
れているかどうかをかどうかを調べ，格納されている場
合には一時格納バッファ３２１の内容を全てワークエリ
アに読み込む。一時格納バッファ３２１には，後述する
ように指定文脈条件に対応した文脈条件識別情報が照合
情報として格納されている。ここでは，照合情報が格納
されていないため，ワークエリアには読み込まれないこ
とになる。この後に，前処理ステップ１１０４ａを実行
する。ここではセンテンスの文脈条件，すなわち“Ｃ
１：Ｐ１［Ｓ］Ｔ３”と“Ｃ２：Ｔ１［ｓ］Ｔ４”に対
応する共起カウンタａと共起カウンタｂに０を設定す
る。次に文脈先頭位置情報に文脈マーカーＳ１の先頭位
置情報である３０を設定する。その後，ワークエリア繰
返し処理ステップ１１０６を実行する。ここでは本照合
ターム識別子“Ｓ１”が文脈条件に指定されていないた
め文脈条件指定識別処理ステップ１１０７は実行されな
い。さらに文脈マーカー識別処理ステップ１１１０ａが
実行されるが，本照合ターム識別子“Ｓ１”は文脈マー
カーの照合ターム識別情報であるため，照合ターム識別
情報出力処理ステップ１１１０は実行されない。したが
って，文脈マーカーの照合ターム識別情報はバッファ３
７０に出力されないことになる。

【００７２】ステップ３として，繰返し処理ステップ１
１００により読込み処理ステップ１１０１が実行され，
３番目の照合情報（９−３），すなわち（Ｔ１，３１，
３２）がワークエリアに読み込まれる。次に照合情報識
別処理ステップ１１０２が実行され，照合ターム識別情
報か否かが調べられる。照合情報（Ｔ１，３１，３２）
は照合ターム識別情報なので文脈マーカー識別処理ステ
ップ１１０３が実行される。照合ターム識別情報（Ｔ
１，３１，３２）の照合ターム識別子Ｔ１は文脈マーカ
ーの照合ターム識別子Ｓ１でないため，後処理ステップ
１１０４は実行されない。この後，ワークエリア繰返し
処理ステップ１１０６が実行され，ワークエリアに格納
されている照合ターム識別情報について１１０７〜１１
１０の共起判定処理が実施される。文脈条件指定識別処
理ステップ１１０７では，ワークエリアに格納されてい
る照合ターム識別情報（Ｔ１，３１，３２）の照合ター
ム識別子Ｔ１を参照して文脈条件に指定された照合ター
ムか否かを調べる。本照合ターム識別子Ｔ１は，文脈条
件“Ｃ２：Ｔ１［ｓ］Ｔ４”に指定されているので共起
判定処理１１０８が実行されることになる。ここで，文
脈条件“Ｃ２：Ｔ１［ｓ］Ｔ４”に対応した共起カウン
タａはカウントアップされ，共起カウンタａの値は０か
ら１に更新される。しかし，共起カウンタａの値が２で
ないため，共起判定は成立しないことになる。この後，
文脈マーカー識別処理ステップ１１１０ａを実行するが
文脈マーカーの照合ターム識別情報でないため，照合タ
ーム識別情報出力処理ステップ１１１０が実行される。
ここで照合ターム識別情報（Ｔ１，３１，３２）がバッ
ファ３７０に出力される。

【００７３】また，ステップ４として繰返し処理ステッ
プ１１００のもとに，読込み処理ステップ１１０１が実
行され，４番目の照合情報（９−４），すなわち（Ｔ
２，３３，３４）がワークエリアに読み込まれる。そし
て照合情報識別処理ステップ１１０２が実行され，照合
ターム識別情報か否かが調べられる。照合情報（Ｔ２，
３３，３４）は照合ターム識別情報なので文脈マーカー
識別処理ステップ１１０３が実行されるが，照合ターム
識別情報（Ｔ２，３３，３４）の照合ターム識別子はＳ
１でないため，後処理ステップ１１０４は実行されな
い。この後，ワークエリア繰返し処理ステップ１１０６
のもとに，文脈条件指定識別処理ステップ１１０７が実
行され，ワークエリア内の照合ターム識別情報が文脈条
件に指定されているか否かが調べられる。ワークエリア
に格納されている照合ターム識別情報（Ｔ２，３３，３
４）の照合ターム識別子Ｔ２は文脈条件に指定されてい
ないため，共起判定処理ステップ１１０８は実行されな
い。また，照合ターム識別情報は文脈マーカーでないた
め，照合ターム識別情報出力処理ステップ１１１０が実
行され，照合ターム識別情報（Ｔ２，３３，３４）がバ
ッファ３７０に出力される。

【００７４】さらにステップ５として，繰返し処理ステ
ップ１１００のもとで，読込み処理ステップ１１０１が
実行され，５番目の照合情報（９−５）すなわち（Ｐ
１，３１，３４）がワークエリアに読込まれる。更に照
合情報識別処理ステップ１１０２により照合ターム識別
情報か否かが調べられ，照合情報（Ｐ１，３１，３４）
は照合ターム識別情報なので文脈マーカー識別処理ステ
ップ１１０３が実行される。ここで，照合ターム識別情
報（Ｐ１，３１，３４）の照合ターム識別子はＳ１でな
いため，この後ワークエリア繰返し処理ステップ１１０
６が実行され，ワークエリアに格納されている照合ター
ム識別情報について１１０７〜１１１０の共起判定処理
が実行される。文脈条件指定識別処理ステップ１１０７
では，ワークエリアに格納されている照合ターム識別情
報（Ｐ１，３１，３４）の照合ターム識別子Ｐ１を参照
して文脈条件に指定されているか否かが調べられる。こ
の場合，文脈条件“Ｃ１：Ｐ１［Ｓ］Ｔ３”に対応する
共起カウンタｂの値が０であり，且つ照合ターム識別子
Ｐ１は文脈条件“Ｃ１：Ｐ１［Ｓ］Ｔ３”の第０番目の
照合ターム識別子として指定されている。このため共起
判定処理１１０８が実行されることになる。ここで，共
起カウンタｂはカウントアップされ，共起カウンタｂの
値は０から１になる。しかし，共起カウンタｂの値が２
でないため，共起判定は成立しないことになる。この
後，本照合ターム識別情報が文脈マーカーのものでない
ため照合ターム識別情報出力処理ステップ１１１０が実
行され，本照合ターム識別情報（Ｐ１，３１，３４）が
バッファ３７０に出力される。

【００７５】さらにステップ６として，繰返し処理ステ
ップ１１００のもとに，読込み処理ステップ１１０１が
実行され，６番目の照合情報（９−６）すなわち（Ｔ
３，３９，４０）がワークエリアに読込まれ，その後に
照合情報識別処理ステップ１１０２が実行される。ここ
で，照合情報（Ｔ３，３９，４０）が照合ターム識別情
報か否かが調べられ，照合情報（Ｔ３，３９，４０）は
照合ターム識別情報なので文脈マーカー識別処理ステッ
プ１１０３が実行されるが，照合ターム識別情報（Ｔ
３，３９，４０）は文脈マーカーでないため，後処理ス
テップ１１０４は実行されないことになる。この後，ワ
ークエリア繰返し処理ステップ１１０６が実行され，ワ
ークエリアに格納されている照合ターム識別情報につい
て１１０７〜１１１０の共起判定処理が実行されること
になる。文脈条件指定識別処理ステップ１１０７では，
ワークエリアに格納されている照合ターム識別情報（Ｔ
３，３９，４０）の照合ターム識別子Ｔ３を参照して，
本照合ターム識別子が文脈条件に指定されているか否か
が調べられる。この場合，文脈条件“Ｃ１：Ｐ１［Ｓ］
Ｔ３”に対応する共起カウンタｂの値が１であり，且つ
照合ターム識別子Ｔ３は文脈条件“Ｃ１：Ｐ１［Ｓ］Ｔ
３”の１番目の識別子に指定されているので共起判定処
理１１０８が実行される。ここで共起カウンタｂがカウ
ントアップされ，共起カウンタｂの値は１から２に更新
される。共起カウンタｂの値が２になったことから，共
起判定が成立したものと判断することができる。このと
き，一時格納処理ステップ１１０９が実行され，文脈条
件“Ｃ１：Ｐ１［Ｓ］Ｔ３”の文脈条件識別情報（Ｃ
１，３０，Ｘｅ１）が一時格納バッファ３２１に格納さ
れる。ここでは，文脈の後方を端点とする文脈マーカー
の位置情報がまだ判明しないため，仮に文脈末尾位置情
報をＸｅ１として置く。この後に文脈マーカーの照合タ
ーム識別情報が現れたとき，この文脈末尾位置情報は後
処理ステップ１１０４で設定される。その後，本照合タ
ーム識別情報は文脈マーカーのものでないため照合ター
ム識別情報出力処理ステップ１１１０が実行され，今成
立した照合ターム識別情報（Ｔ３，３９，４０）がバッ
ファ３７０に出力される。

【００７６】ステップ７として，繰返し処理ステップ１
１００のもとで，読込み処理ステップ１１０１が実行さ
れ，７番目の照合情報（９−７）すなわち（Ｔ４，４
１，４６）がワークエリアに読込まれる。その後，照合
情報識別処理ステップ１１０２が実行され，本照合情報
が照合ターム識別情報か否かが調べられる。照合情報
（Ｔ４，４１，４６）は照合ターム識別情報なので文脈
マーカー識別処理ステップ１１０３が実行され，照合タ
ーム識別情報（Ｔ４，４１，４６）は文脈マーカーでな
いため，後処理ステップ１１０４は実行されない。この
後，ワークエリア繰返し処理ステップ１１０６が実行さ
れ，ワークエリアに格納されている照合ターム識別情報
について１１０７〜１１１０の共起判定処理が実行され
ることになる。文脈条件指定識別処理ステップ１１０７
では，ワークエリアに格納されている照合ターム識別情
報（Ｔ４，４１，４６）の照合ターム識別子Ｔ４を参照
して，本照合タームが文脈条件に指定されているか否か
が調べられる。この場合，照合ターム識別子Ｔ４は文脈
条件“Ｃ２：Ｔ１［ｓ］Ｔ４”に指定されているので共
起判定処理１１０８が実行される。ここで，文脈条件
“Ｃ２：Ｔ１［ｓ］Ｔ４”におけるの照合ターム識別
子Ｔ４が現れたため，本文脈条件に対応する共起カウン
タａがカウントアップされ，共起カウンタａの値は１か
ら２になり，共起判定が成立することになる。したがっ
て，一時格納処理ステップ１１０９が実行され，今成立
した文脈条件“Ｃ２：Ｔ１［ｓ］Ｔ４”の文脈条件識別
情報（Ｃ２，３０，Ｘｅ２）が一時格納バッファ３２１
に格納される。文脈末尾位置情報は決定されていないの
でＸｅ２を一時的に設定しておく。その後，本照合ター
ム識別情報が文脈マーカーのものでないため照合ターム
識別情報出力処理ステップ１１１０が実行され，照合タ
ーム識別情報（Ｔ４，４１，４６）がバッファ３７０に
出力される。

【００７７】最後にステップ８として，再び照合情報読
込み処理ステップ１１０１が実行され，本照合情報（９
−８）すなわち(Ｓ１，４８，４８)が読み込まれる。次
に照合情報識別処理ステップ１１０２が実行され，照合
情報(Ｓ１，４８，４８)が照合ターム識別情報であるか
どうかが調べられる。照合情報(Ｓ１，４８，４８)は照
合ターム識別情報であるため，次の文脈マーカー識別処
理ステップ１１０３が実行され，本照合ターム識別情報
が文脈条件中に指定された文脈に関する文脈マーカーに
該当するかどうかが調べられる。照合ターム識別子はＳ
１であるため指定されたセンテンスの文脈マーカ
ー“。”に該当することになり，後処理ステップ１１０
４が実行される。後処理ステップ１１０４では，まず本
文脈マーカーの末尾位置情報である４８を文脈末尾位置
情報とする。次に，センテンスの文脈条件識別情報（Ｃ
１，３０，Ｘｅ１）と（Ｃ２，３０，Ｘｅ２）が格納さ
れている一時格納バッファ３２１にセンテンスの文脈末
尾位置情報４８を設定し，この処理結果は図２１ａ，図
２１ｂのステップ８に示した（Ｃ１，３０，４８）と
（Ｃ２，３０，４８）のようになる。この処理結果はワ
ークエリアに格納される。さらに前処理ステップ１１０
４ａが実行され，センテンスの文脈条件の共起カウンタ
を０クリアし，本文脈マーカーの先頭位置情報４８を文
脈先頭位置情報に設定する。

【００７８】その後，ワークエリア繰返し処理ステップ
１１０６が実行される。まず文脈条件識別情報（Ｃ１，
３０，４８）について，文脈条件指定識別処理ステップ
１１０７が実行されるが照合ターム識別子Ｃ１は文脈条
件に指定されていないため共起判定処理１１０８は実行
されず，照合ターム識別情報出力処理ステップ１１１０
が実行され，文脈条件識別情報（Ｃ１，３０，４８）が
バッファ３７０に出力される。すなわち，本文脈条件識
別情報の位置情報は，文脈マーカーの識別子（９−２）
と（９−８）を端点とするセンテンスの先頭位置情報３
０と末尾位置情報４８を位置情報としている。この後に
再度，ワークエリア繰返し処理ステップ１１０６が実行
され，文脈条件識別情報（Ｃ２，３０，４８）につい
て，文脈条件指定識別処理ステップ１１０７が実行され
るが照合ターム識別子Ｃ２も文脈条件に指定されていな
いため，照合ターム識別情報出力処理ステップ１１１０
により，文脈条件識別情報（Ｃ２，３０，４８）がバッ
ファ３７０に出力される。

【００７９】以上の文脈条件判定処理が実行されること
により，図２２に示す（１０−１）〜（１０−８）の照
合情報がバッファ３７０へ出力される。 (Ｄ１，０，０) (１０−１) (Ｔ１，３１，３２) (１０−２) (Ｔ２，３３，３４) (１０−３) (Ｐ１，３１，３４) (１０−４) (Ｔ３，３９，４０) (１０−５) (Ｔ４，４１，４４) (１０−６) (Ｃ１，３０，４８) (１０−７) (Ｃ２，３０，４８) (１０−８) ここで，（１０−７）は文脈条件“（文書［４Ｃ］理
解）［Ｓ］システム”の文脈条件識別情報であり，同様
に（１０−８）は“文書［ｓ］検索”の文脈条件識別情
報である。これらの照合情報は引き続き論理条件判定プ
ログラム３３０へ送られることになる。

【００８０】最後に，論理条件判定プログラム３３０の
判定処理について説明する。論理条件判定プログラム３
３０では，文脈条件判定プログラム３２０からバッファ
３７０に送り込まれた照合情報を読み出し，検索制御手
段１０１より検索情報２０２として指定された論理条件
に合致するか否かを判定する。論理条件例としては，例
えば“文書［ＡＮＤ］検索”という条件式がある。“文
書［ＡＮＤ］検索”という条件式は，“文書”と“検
索”という２つの検索タームが同時に現れる文書を探し
出すということを表す。また，本論理条件を表す識別子
（以後，論理条件識別子と呼ぶ）をＬｉとする。なおＬ
ｉには照合ターム識別子とは区別できるコードを割り付
ける。このように定義することにより，論理条件は “Ｌｉ：Ｔａ［ＡＮＤ］Ｔｂ” と記述することができる。以下の説明はこの定義を用い
て行う。論理条件にはこの他にも，“Ｌｉ：Ｔａ［Ｏ
Ｒ］Ｔｂ”と“Ｌｉ：Ｔａ［ＮＯＴ］Ｔｂ”がある。こ
こで論理条件“Ｌｉ：Ｔａ［ＯＲ］Ｔｂ”は，“Ｔａ”
あるいは“Ｔｂ”という検索タームが現れる文書を探し
出すということを表し，論理条件“Ｌｉ：Ｔａ［ＮＯ
Ｔ］Ｔｂ”は，“Ｔａ”という検索タームが現われて，
且つ“Ｔｂ”という検索タームが現われない文書を探し
出すということを表している。

【００８１】これらの論理条件は検索制御手段１０１に
おいて，以下に示す積の一般形式に変換され，検索情報
２０２として論理条件判定プログラム３３０に指定され
る。Ｌｉ：(Ａ１１＋Ａ１２＋・・・＋Ａ１ｊ）＊(Ａ２１＋Ａ２２＋・・・＋Ａ２ｋ）＊・・・＊(Ａｎ１＋Ａ２２＋・・・＋Ａｎｍ）（１０−１）（１０−１）式において，“＋”は論理和を表わし，
“＊”は論理積を表わす。また，Ａｎｍを要素と呼び，
(Ａｎ１＋Ａ２２＋・・・＋Ａｎｍ)を項と呼ぶ。要素Ａ
ｎｍとしては否定（“¬”で表す）が掛かっている要素
¬Ａｎｍも存在する。また，項にも否定が掛かった項
¬(Ａｎ１＋Ａ２２＋・・・＋Ａｎｍ)が存在する。ここ
で¬Ａｎｍを負論理の要素と呼ぶ。これに対し，否定が
掛かっていない項を正論理の要素と呼ぶ。また，¬(Ａ
ｎ１＋Ａ２２＋・・・＋Ａｎｍ)を負論理の項と呼び，
否定が掛かっていない項を正論理の項と呼ぶ。

【００８２】（１０−１）式では，項の論理積の形にな
っているので，（１０−１）式が成立する（真になる）
ためには，各々の項が全て成立する必要がある。そのた
め，カウンタを用意し，成立した項をカウントする。こ
のカウンタ（以後，項カウンタと呼ぶ）の値が項の個数
に等しければ，（１０−１）式は成立したことになる。
負論理の要素を含まない負論理の項と負論理の要素を含
む正論理の項は最初から成立している。したがって，項
カウンタの初期値には負論理の要素を含まない負論理の
項の個数と負論理の要素を含む正論理の項の個数とを加
算した値を設定する。この項カウンタを次のように制御
することにより，（１０−１）式の成否を判定すること
ができる。つまり，項カウンタには初期値として負論理
の項の個数を設定し，項が不成立から成立に変化した場
合には項カウンタに１を加算し，逆に項が成立から不成
立に変化した場合には項カウンタから１を減算する。項
が不成立から不成立または成立から成立のように変化し
ない場合は項カウンタの値を更新しない。このように項
カウンタを制御し，文書単位に項カウンタの値が項の個
数に等しいかを調べることにより（１０−１）式の成立
を判別することができる。また，式全体に否定が掛って
いる場合には逆に，項カウンタの値が項の個数未満かを
調べることにより（１０−１）式の成立を判別すること
ができる。

【００８３】次に，全ての項では要素の論理和になって
いるため，項が成立するためにはいずれかの要素が成立
していれば良いことになる。１つの項の成否判定方法に
ついて以下説明する。ここでは，項の成否を調べるため
にカウンタを用い，項に指定されている要素において，
要素が成立したものの個数をカウントする。このカウン
タ（以後，要素カウンタと呼ぶ）の値が１以上，すなわ
ちいずれかの要素が成立している場合は，項は成立した
ものと見做す。負論理の要素は最初から成立していると
見做せるので，要素カウンタの初期値には負論理の要素
の個数を設定する。このため，要素カウンタは項に対応
して１つずつ，すなわち項の個数だけ設ける。

【００８４】この要素カウンタを以下のように制御する
ことにより項の成否を判定することができる。つまり，
要素カウンタには初期値として負論理の要素の個数を設
定し，要素が不成立から成立に変化した場合には要素カ
ウンタに１を加算し，逆に要素が成立から不成立に変化
した場合には要素カウンタから１を減算する。ここでの
要素は照合ターム識別子に対応しているため，要素が不
成立から不成立または成立から成立のようには変化しな
い。よって，不成立から成立に変化するのは正論理の要
素の場合のみであり，成立から不成立に変化するのは負
論理の要素の場合のみである。したがって，正論理の要
素に対応する照合ターム識別情報が現れた場合には要素
カウンタに１を加算し，逆に負論理の要素に対応する照
合ターム識別情報が現れた場合には要素カウンタから１
を減算する。

【００８５】このように要素カウンタを制御し，照合タ
ーム識別情報が入力される度に要素カウンタの値が１以
上かを調べることにより項の成立を判断する。また，項
に否定が掛っているときには逆に，要素カウンタの値が
０かを調べることにより項の成立を判断する。この後，
項の成立判定の結果をもとに，項が不成立から成立に変
化した場合には項カウンタに１を加算し，逆に項が成立
から不成立に変化した場合には項カウンタから１を減算
する。また，否定を含めた項が不成立から不成立または
成立から成立のように変化しない場合は項カウンタの値
を更新しない。このように項カウンタを制御し，文書単
位に項カウンタの値が項の個数に等しいか否かを調べる
ことにより（１０−１）式の成否を判別することができ
る。例えば上記の“Ｌｉ：Ｔａ［ＡＮＤ］Ｔｂ”すなわ
ち“Ｌｉ：Ｔａ＊Ｔｂ”の場合には， “Ｌｉ：¬（（¬Ｔａ）＋（¬Ｔｂ））” のように変換され検索情報２０２として論理条件判定プ
ログラム３３０に渡される。

【００８６】この論理条件の処理の手順について図２３
を用いて詳細に説明する。例えば上記の“Ｌｉ：Ｔａ
［ＡＮＤ］Ｔｂ”すなわち“Ｌｉ：Ｔａ＊Ｔｂ”の場合
には， “Ｌｉ：¬（（¬Ｔａ）＋（¬Ｔｂ））” （１０−２）のように変換され検索情報２０２として論理条件判定プ
ログラム３３０に渡される。本論理条件には，負論理の
項が１つ存在する。さらにこの項の中には，負論理の要
素が２つ存在する。項が１つなのでここでは，要素カウ
ンタを１つ使用する。項カウンタの初期値には，負論理
の要素を含まない負論理の項の個数と負論理の要素を含
む正論理の項の個数とを加算した値を設定することにな
るが，本例の項は負論理要素を含む負論理の項なので該
当しないため０を設定する。また，要素カウンタには，
負論理の要素の個数である２を設定する。ここでは，項
に¬が掛かっているため，要素カウンタをカウントダウ
ンし，要素カウンタの値が０になったときに項が成立し
たものと判断することができる。また，論理条件（１０
−２）式に¬が掛かっていないため，項カウンタの値が
１のときに論理条件（１０−２）式が成立したものと判
断することができる。

【００８７】まず繰返し処理ステップ１２００ではバッ
ファ３７０内の照合情報を全て，すなわち最後の文書の
照合情報を読み出し尽くすまで１２０１から１２１０ま
での処理ステップを繰り返す。読込み処理ステップ１２
０１では，バッファ３７０より照合情報を読み出しプロ
グラムのワークエリアへ格納する。照合情報識別処理ス
テップ１２０２では，上記読込み処理ステップ１２０１
で読み込んだ照合情報が文書識別情報か，それとも照合
ターム識別情報なのかを調べる。すなわち照合情報の後
部２項が両方とも０（ゼロ），すなわち下位３２ビット
が０（ゼロ）の場合には，文書識別情報と判定する。こ
の場合には論理条件成立判定処理ステップ１２０３が実
行される。論理条件が成立したとき，すなわち論理条件
（１０−２）式では，項カウンタの値が１のとき論理条
件が成立していることを示している。

【００８８】論理条件が成立した場合，文書識別情報判
定処理ステップ１２０３ａが実行され，さらに本文書識
別情報が最初の文書識別情報でない場合，結果出力処理
ステップ１２０４を実行する。文書識別情報判定処理ス
テップ１２０３ａにおいて，最初の文書識別情報の場
合，判定処理を行わないが，これは，まだ論理条件の判
定処理を何も行っていないためである。結果出力処理ス
テップ１２０４では，後述する照合情報を格納した出力
バッファ３３１の内容と論理条件判定結果（以後，論理
条件識別情報と呼ぶ）を複合条件判定結果２０６として
出力する。このように，文書識別情報を検出したとき
に，論理条件判定処理を行うのは，１文書単位に指定論
理条件の成否を判定する必要があるためである。

【００８９】ここで出力される論理条件判定結果情報の
内容としては，位置情報には文書の先頭位置情報および
文書の末尾位置情報が設定され，識別子には論理条件識
別子Ｌｉが格納される照合情報（Ｌｉ，文書先頭位置情
報，文書末尾位置情報）となる。この文書先頭位置情報
としては常に文書の先頭で位置情報が０クリアされるた
め，必ず０（ゼロ）となる。したがって論理条件識別情
報（Ｌｉ，０，文書末尾位置情報）となる。また論理条
件成立判定処理ステップ１２０３の後，初期設定処理ス
テップ１２０５を実行し，出力バッファ３３１を０クリ
アするとともに，要素カウンタと項カウンタの初期設定
を行う。本例では要素カウンタに２を設定し，項カウン
タに０を設定する。

【００９０】照合情報識別処理ステップ１２０２におい
て照合情報が照合ターム識別情報であると判定された場
合には，照合ターム識別処理ステップ１２０６を実行
し，照合ターム識別情報内の照合ターム識別子が論理条
件の要素に指定されているか否かを調べる。ここで要素
に指定されている場合には，要素判定処理ステップ１２
０６ａを実行し，まず見つかった要素について論理条件
を調べ，要素に¬が掛かっていない場合にはカウントア
ップ処理ステップ１２０６ｂを実行し，要素カウンタに
１を加算する。逆に要素に¬が掛かっている場合にはカ
ウントダウン処理ステップ１２０６ｃを実行し，要素カ
ウンタから１を減算する。ここで要素カウンタの値が０
となった場合には項の不成立を表し，１以上となった場
合には項の成立を表す。項に¬が掛っているときは逆
に，要素カウンタの値が０のとき成立を表わし，１以上
のとき不成立を表わす。

【００９１】次に項成立判定処理ステップ１２０７を実
行する。ここでは要素が指定されている項が不成立から
成立に変化したのか，もしくは成立から不成立に変化し
たのかを調べる。項成立判定方法としては，要素カウン
タが，この計算前と計算後で，不成立から成立に変化し
た場合は成立した項が１つ増えたので項カウンタに１を
加算し，成立から不成立に変化した場合は成立した項が
１つ減ったため項カウンタから１を減算する。本例で
は，初期状態における要素カウンタの値は２で，項カウ
ンタの値は０である。ここで要素Ｔａが見つかった場
合，要素Ｔａには¬が掛かっているので要素カウンタか
ら１を減算するため，要素カウンタの値は１となる。こ
の場合項には¬が掛っているので，項は不成立から不成
立へ変化したため，項カウンタは更新しない。さらに要
素Ｔｂが見つかった場合，要素Ｔｂには¬が掛かってい
るので要素カウンタから１を減算する。要素カウンタの
値は０となり，項は不成立から成立に変化したことにな
るため，項カウンタに１を加算する。この結果，項カウ
ンタの値は１となる。以上のようにして，項成立判定処
理が行われる。

【００９２】照合情報識別処理ステップ１２０２の処理
の後，照合情報退避処理ステップ１２１０を実行し，照
合情報を出力バッファ３３１に出力する。照合情報退避
処理ステップ１２１０を実行する。この出力バッファ３
３１には１文書分の照合情報が格納され，論理条件成立
判定処理ステップ１２０３で論理条件成立が判明したと
きに複合条件判定結果２０６として出力される。以上の
各処理ステップをバッファ３７０に格納されている照合
情報に対し繰返し実行していくことにより論理条件判定
処理を実現することができる。繰返し処理ステップ１２
００終了後，最後に処理した文書については論理条件判
定が実行されないことになる。これは，文書識別情報の
入力をタイミングとして，前に読み込んだ文書の論理条
件判定を行っているからである。したがって，ここで再
度，論理条件成立判定処理ステップ１２０３を実行し，
最後に読み込んだ文書についての論理条件判定を行う。

【００９３】以上の処理手順を具体例で説明する。検索
条件としては，（７−１）に示した式“Ｑ＝((文書［４
Ｃ］理解)［Ｓ］システム)［ＡＮＤ］(文書［ｓ］検
索)”を例に用いて説明する。各条件判定プログラムに
は検索制御手段１０１で解析され，各条件に分離された
条件式が設定される。具体的には，論理条件判定プログ
ラム３３０には本条件式（７−１）の論理条件部分
“((文書［４Ｃ］理解)［Ｓ］システム)［ＡＮＤ］(文
書［ｓ］検索)”が設定される。ここでは，文脈条件
“(文書［４Ｃ］理解)［Ｓ］システム”の識別子をＣ１
とし，文脈条件“文書［ｓ］検索”の識別子をＣ２とす
ることにより，（７−１）の論理条件部分を“Ｌ１：Ｃ
１［ＡＮＤ］Ｃ２”という形で表す。Ｌ１は論理条件識
別子である。さらに“Ｌ１：¬（（¬Ｃ１）＋（¬Ｃ
２））”に変換され，論理条件判定プログラム３３０に
設定される。

【００９４】今，（７−２）に示した文書 “・・・。文書理解を用いた検索システムである。・・
・・” が入力されたとすると，前述したように文脈条件判定プ
ログラム３２０からは，図２２に示す以下の（１１−
１）〜（１１−８）が照合情報としてバッファ３７０へ
出力される。 (Ｄ１，０，０) (１１−１) (Ｔ１，３１，３２) (１１−２) (Ｔ２，３３，３４) (１１−３) (Ｐ１，３１，３４) (１１−４) (Ｔ３，３９，４０) (１１−５) (Ｔ４，４１，４４) (１１−６) (Ｃ１，３０，４８) (１１−７) (Ｃ２，３０，４８) (１１−８) （１１−１）は文書識別情報を表しており，Ｄ１は文書
識別子を表し，これに続く２項は定数０である。（１１
−２），（１１−３），（１１−５），および（１１−
６）は，それぞれ“文書”，“理解”，“検索”，およ
び“システム”の照合ターム識別情報を表わす。また，
Ｔ１，Ｔ２，Ｔ３，およびＴ４は，それぞれ“文書”，
“理解”，“検索”，および“システムの照合ターム識
別子を表わす。また，（１１−４）は近傍条件“文書
［４Ｃ］理解”の近傍条件識別情報を表しており，Ｐ１
はこの近傍条件識別子を表している。さらに，（１１−
７）は文脈条件“(文書［４Ｃ］理解)［Ｓ］システム”
の文脈条件識別情報を表しており，Ｃ２はこの文脈条件
識別子を表し，（１１−８）は文脈条件“文書［ｓ］検
索”の文脈条件識別情報を表しており，Ｃ２はこの文脈
条件識別子を表している。

【００９５】以上の条件における論理条件判定処理につ
いて図２４ａ，図２４ｂと図２５を用いて１ステップず
つ説明する。初期状態では図２４ａ，図２４ｂの初期状
態に示すようにバッファ３７０に照合情報（１１−１）
〜（１１−８）が格納されており，出力バッファ３３１
及びバッファ３７０は０クリアされた状態になってい
る。論理条件判定処理プログラム３３０ではバッファ３
７０からこれらの照合情報を一つずつ読込み，論理条件
“Ｌｉ：¬（（¬Ｃ１）＋（¬Ｃ２））”について判定
処理を行う。

【００９６】まず図２４ａ，図２４ｂのステップ１に示
すように，読込み処理ステップ１２０１が実行され照合
情報（１１−１），すなわち照合情報(Ｄ１，０，０)が
プログラムのワークエリアに読み込まれる。次に照合情
報識別処理ステップ１２０２が実行され，照合情報（１
１−１）が文書識別情報であるか照合ターム識別情報で
あるかが調べられる。照合情報(Ｄ１，０，０)は後部の
２項が両方とも０（ゼロ）のため，文書識別情報と判断
される。したがって，論理条件成立判定処理ステップ１
２０３および文書識別情報判定処理ステップ１２０３ａ
が実行されるが，最初の文書識別情報なので結果出力処
理ステップ１２０４は実行されない。次に，初期設定処
理ステップ１２０５を実行し，出力バッファ３３１を０
クリアし，要素カウンタと項カウンタの初期設定を行
う。本例では，要素カウンタの初期値としては¬が掛か
っている要素（¬Ｃ１）と（¬Ｃ２）の数である２を設
定する。また，本項（（¬Ｃ１）＋（¬Ｃ２））は¬が
掛かっている要素を含む¬が掛かっている項である。こ
のため項カウンタの初期値としては，¬が掛かっている
要素を含まない¬が掛かっている項や¬が掛かっている
要素を含む¬が掛かっていない項¬が存在しないため０
を設定する。照合情報識別処理ステップ１２０２が終了
したら，次に照合情報退避処理ステップ１２１０が実行
され，照合情報(Ｄ１，０，０)が出力バッファ３３１に
格納される。

【００９７】その後ステップ２として，再び照合情報読
込み処理ステップ１２０１が実行され，照合情報（１１
−２）すなわち(Ｔ１，３１，３２)が読み込まれる。次
に照合情報識別処理ステップ１２０２が実行され，照合
情報(Ｔ１，３１，３２)が照合ターム識別情報かどうか
が調べられる。照合情報(Ｔ１，３１，３２)は下位３２
ビットが０（ゼロ）でないため，照合ターム識別情報と
判断される。そして，次の照合ターム識別処理ステップ
１２０６で，本照合ターム識別情報が論理条件中に指定
された要素に該当するかどうか調べられる。本論理条件
には，照合情報(Ｔ１，３１，３２)の照合識別子Ｔ１が
指定されていないため，処理ステップ１２０６ａ〜１２
０９は実行されないことになる。照合情報識別処理ステ
ップ１２０２が終了した後，照合情報退避処理ステップ
１２１０が実行され，照合情報(Ｔ１，３１，３２)が出
力バッファ３３１に格納される。同様にステップ６まで
照合情報の照合情報識別子は本論理条件に指定されてな
いので照合情報退避処理ステップ１２１０だけが実行さ
れ，照合情報(Ｔ２，３３，３４)，（Ｐ１，３１，３
４），（Ｔ３，３９，４０），および（Ｔ４，４１，４
４）が出力バッファ３３１に格納される。

【００９８】さらにステップ７として，再び照合情報読
込み処理ステップ１２０１が実行され照合情報（１１−
７），すなわち(Ｃ１，３０，４８)が読み込まれる。次
に照合情報識別処理ステップ１２０２が実行され，照合
情報(Ｃ１，３０，４８)が照合ターム識別情報かどうか
調べられる。照合情報(Ｃ１，３０，４８)は下位３２ビ
ットが０（ゼロ）でないため，照合ターム識別情報と判
断される。そして，次の照合ターム識別処理ステップ１
２０６で，照合ターム識別情報が論理条件中に指定され
た要素に該当するかどうかが調べられる。本論理条件に
は，照合情報(Ｃ１，３０，４８)の照合識別子Ｃ１が指
定されているため，処理ステップ１２０６ａ〜１２０９
が実行されることになる。まず，要素判定処理ステップ
１２０６ａが実行される。本論理条件では，要素カウン
タの初期値は２で項カウンタの初期値は１である。ここ
で要素Ｃ１には¬が掛かっているのでカウントダウン処
理ステップ１２０６ｃが実行される。ここで要素カウン
タから１だけ減算する。その結果，要素カウンタの値は
２から１に更新される。次に項判定処理ステップ１２０
７が実行される。この時点の要素カウンタの値は１なの
で，項は不成立から不成立への変化となる。このため，
項カウンタは更新されない。照合情報識別処理ステップ
１２０２が終了した後，照合情報退避処理ステップ１２
１０が実行され，照合情報(Ｃ１，３０，４８)が出力バ
ッファ３３１に格納される。

【００９９】最後にステップ８として，照合情報読込み
処理ステップ１２０１が実行され照合情報（１１−
８），すなわち(Ｃ２，３０，４８)が読み込まれる。次
に照合情報識別処理ステップ１２０２が実行され，照合
情報(Ｃ２，３０，４８)が照合ターム識別情報かどうか
調べられる。照合情報(Ｃ２，３０，４８)は下位３２ビ
ットが０（ゼロ）でないため，照合ターム識別情報と判
断される。そして，次の照合ターム識別処理ステップ１
２０６で，照合ターム識別情報が論理条件中に指定され
た要素に該当するかどうかが調べられる。本論理条件に
は，照合情報(Ｃ２，３０，４８)の照合識別子Ｃ２が指
定されているため，処理ステップ１２０６ａ〜１２０９
が実行されることになる。この時点の要素カウンタの値
は０で，項カウンタの値は１となっている。まず，要素
判定処理ステップ１２０６ａが実行される。ここで，要
素Ｃ２には¬が掛かっているのでカウントダウン処理ス
テップ１２０６ｃが実行される。ここで要素カウンタか
ら１だけ減算する。その結果，要素カウンタの値は１か
ら０となる。次に項判定処理ステップ１２０７が実行さ
れる。このとき本項には，¬が掛かっているので不成立
から成立への変化が起こったことになる。このため，カ
ウントアップ処理ステップ１２０８が実行され，項カウ
ンタは１を加算され０から１に更新される。その後，照
合情報退避処理ステップ１２１０が実行され，照合情報
(Ｃ２，３０，４８)は出力バッファ３３１に格納され
る。ここで繰返し処理１２００は終了するが，最後の文
書なので論理条件成立判定処理ステップ１２０３が実行
される。項カウンタが１なので，本論理条件が成立して
いる。このため，結果出力処理ステップ１２０４が実行
され，照合情報を格納した出力バッファ３３１の内容と
論理条件判定結果情報（Ｌ１，０，９９）が複合条件判
定結果２０６として出力される。Ｌ１は論理条件識別子
を，０は文書先頭位置情報を，９９は文書末尾位置情報
を表している。

【０１００】以上の論理条件判定処理の結果，最終的に
は，以下に示す（１１−１）〜（１１−９）の照合情報
が，検索条件式（７−１）に示した式“Ｑ＝((文書［４
Ｃ］理解)［Ｓ］システム)［ＡＮＤ］(文書［ｓ］検
索)”の複合条件判定結果２０６として出力される。 (Ｄ１，０，０) (１１−１) (Ｔ１，３１，３２) (１１−２) (Ｔ２，３３，３４) (１１−３) (Ｐ１，３１，３４) (１１−４) (Ｔ３，３９，４０) (１１−５) (Ｔ４，４１，４４) (１１−６) (Ｃ１，３０，４８) (１１−７) (Ｃ２，３０，４８) (１１−８) (Ｌ１，０，９９) (１１−９) （１１−１）は文書識別情報を表しており，Ｄ１は文書
識別子を表わす。（１１−２），（１１−３），（１１
−５），および（１１−６）は，それぞれ“文書”，
“理解”，“検索”，および“システム”の照合ターム
識別情報を表わす。また，（１１−４）は近傍条件“文
書［４Ｃ］理解”の近傍条件識別情報を表している。さ
らに，（１１−７）は文脈条件“(文書［４Ｃ］理解)
［Ｓ］システム”の文脈条件識別情報を表し，（１１−
８）は文脈条件“文書［ｓ］検索”の文脈条件識別情報
を表している。最後の（１１−９）は論理条件 “((文書［４Ｃ］理解)［Ｓ］システム)［ＡＮＤ］(文
書［ｓ］検索)” の論理条件識別情報を表しており，Ｌ１はこの論理条件
識別子を表している。以上が論理条件判定プログラム３
１０，文脈条件判定プログラム３２０，および論理条件
判定プログラム３３０により構成される複合条件判定処
理の実現方法である。

【０１０１】以上説明したように文字列照合回路２００
および複合条件判定回路３００を構成することにより，
近傍条件，文脈条件，および論理条件などの複合条件判
定条件を一貫して実現することができるためフルテキス
トサーチ特有の木目細かな検索が可能となる。さらに，
例えば３つのマイクロコンピュータで各々，近傍条件判
定プログラム３１０，文脈条件判定プログラム３２０，
および論理条件判定プログラム３３０を実行させること
により，プログラム間で同期を取らなくとも動作させる
ことが可能となる。すなわち，これらのプログラムはそ
れぞれの入力バッファに照合情報が格納されるとこれに
応じて条件判定処理を始めるというパイプライン処理を
行うことが可能となり，高速な複合条件判定処理を実現
することができる。

【０１０２】次に本発明の第２の実施例について図２６
を用いて説明する。本実施例では，複合条件のうち１つ
の条件しか設定されない場合に１つのマイクロプロセッ
サしか動作しないにもかかわらず，常に３つの複合条件
のパイプライン処理を行わなければならないという第１
の実施例の欠点を，与えられた検索条件に使用されてい
ない複合条件がある場合にはその複合条件判定プログラ
ムをバイパスすることにより解決し，効率の良い複合条
件判定処理を提供するものである。本実施例は文字列照
合回路２００と複合条件判定回路３００ａからなり，複
合条件判定回路３００ａは，３つのマイクロコンピュー
タ，すなわちＭＰＵａ３０１，ＭＰＵｂ３０２，および
ＭＰＵｃ３０３と，マルチプレクサ３９０〜３９２，並
びにセレクタ３８０〜３８２から構成されている。マイ
クロコンピュータＭＰＵａ３０１では近傍条件判定プロ
グラム３１０が，マイクロコンピュータＭＰＵｂ３０２
では文脈条件判定プログラム３２０が，マイクロコンピ
ュータＭＰＵｃ３０３では論理条件判定プログラム３３
０が実行される。さらに各ＭＰＵ間にはファーストイン
・ファーストアウト（ＦＩＦＯ）メモリを使用したバッ
ファ３５０，３６０，および３７０が配置され，それぞ
れのＭＰＵ間のデータの受渡しに用いられる。

【０１０３】本実施例の特徴である複合条件判定回路の
バイパス機能について述べる。本機能は指定された検索
条件式で用いられていない複合条件に対応する判定プロ
グラムが搭載されているマイクロプロセッサをマルチプ
レクサやセレクタを用いてバイパスすることにより，使
用する複合条件判定プログラムが搭載されているマイク
ロプロセッサのみを実行させる機能である。例えば検索
条件式“文書［４Ｃ］理解”が指定された場合には，近
傍条件のみが使用されるため，文字列照合回路２００か
ら得た照合情報２０５をバッファ３５０経由で近傍条件
判定プログラム３１０に入力し，近傍条件判定プログラ
ム３１０では近傍条件判定を行い，照合情報をバッファ
３６０を経由し，直接複合条件判定結果２０６として送
出するようにする。また，検索条件式 “（文書［Ｓ］理解）［ＡＮＤ］システム”が指定され
た場合には，文脈条件と論理条件が使用されるため，文
字列照合回路２００から得た照合情報２０５をバッファ
３５０経由で直接，文脈条件判定プログラム３２０に入
力し，文脈条件判定プログラム３２０から出力される照
合情報はバッファ３７０を経由して論理条件判定プログ
ラム３３０に入力し，この論理条件判定プログラム３３
０から出力される照合情報を複合条件判定結果２０６と
して送出するようにする。

【０１０４】このような複合条件判定回路３００ａのバ
イパス機能の具体的な実現方式について説明する。この
バイパス動作はマルチプレクサ３９０〜３９２とセレク
タ３８０〜３８２の設定により実現する。この設定情報
は第２図の検索制御手段１０１からの検索情報２０２と
して与えられる。マルチプレクサ３９０では，文字列照
合回路２００からの照合情報２０５を，ａ１が選択され
た場合は論理条件判定プログラム３３０へ，ｂ１が指定
された場合は文脈条件判定プログラム３２０へ，ｃ１が
指定された場合は近傍条件判定プログラム３１０へ，ｄ
１が選ばれた場合には複合条件回路３００ａの複合条件
判定結果２０６として送出することになる。マルチプレ
クサ３９１では，近傍条件判定プログラム３１０の出力
を，ａ２が指定された場合には文脈条件判定プログラム
３２０へ，ｂ２が指定された場合には論理条件判定プロ
グラム３３０へ，ｃ２が指定された場合には複合条件回
路３００ａの出力として直接送出することになる。マル
チプレクサ３９２では文脈条件判定プログラム３２０の
出力を，ａ３が指定された場合には論理条件判定プログ
ラム３３０へ，ｂ３が指定された場合には複合条件判定
結果２０６として送出することになる。

【０１０５】セレクタ３８０では文脈条件判定プログラ
ム３２０の入力の選択を行い，マルチプレクサ３９０に
ｂ１が設定されたときはＸ１を，すなわち文字列照合回
路２００の照合結果２０５を選択し，マルチプレクサ３
９１にａ２が設定されたときはＹ１を，すなわち近傍条
件判定プログラム３１０の出力を選択する。セレクタ３
８１では論理条件判定プログラム３２０の入力の選択を
行い，マルチプレクサ３９０にａ１が設定されたときは
Ｘ２を，すなわち文字列照合回路２００の照合結果２０
５を選択し，マルチプレクサ３９１がｂ２に設定された
ときはＹ２を，すなわち近傍条件判定プログラム３１０
の出力を選択し，マルチプレクサ３９２がａ３に設定さ
れたときはＺ２を，すなわち文脈条件判定プログラム３
２０の出力を選択する。セレクタ３８２では複合条件判
定結果２０６の選択を行い，マルチプレクサ３９０にｄ
１が設定されたときはＺ３を，すなわち文字列照合回路
２００の照合結果２０５を選択し，マルチプレクサ３９
１がｃ２に設定されたときはＹ３を，すなわち近傍条件
判定プログラム３１０の出力を選択し，マルチプレクサ
３９２がｂ３に設定されたときはＸ３を，すなわち文脈
条件判定プログラム３２０の出力を選択し，それ以外の
場合はＷ３を選択する，すなわち論理条件判定プログラ
ム３３０の出力を選択する。以上述べたように，セレク
タ３８０〜３８２の設定は，マルチプレクサ３９０〜３
９２の設定に応じて行うことになる。

【０１０６】複合条件の組合せにより，以下のようにマ
ルチプレクサの選択を行うことになる。複合条件なし ───────── ｄ１のみを選択近傍条件のみ ───────── ｃ１とｃ２を選択文脈条件のみ ───────── ｂ１とｂ３を選択論理条件のみ ───────── ａ１のみを選択近傍条件と文脈条件 ────── ｃ１，ａ２，およびｂ３を選択近傍条件と論理条件 ────── ｃ１とｂ２を選択文脈条件と論理条件 ────── ｂ１とａ３を選択近傍条件と文脈条件と論理条件 ─ ｃ１，ａ２，およびａ３を選択以上のように，検索制御手段１０１からの検索情報２０
２として与えられたマルチプレクサ３９０〜３９２およ
びセレクタ３８０〜３８２の設定情報に基づき，近傍条
件判定プログラム３１０，文脈条件判定プログラム３２
０，および論理条件判定プログラム３３０などの複合条
件判定プログラムをマルチプレクサ３９０〜３９２およ
びセレクタ３８０〜３８２を用いて選択的に接続するこ
とにより，複合条件の内１つの条件しか設定されない場
合に１つのマイクロプロセッサしか使用しないにもかか
わらず，常に３つの複合条件判定プログラムのパイプラ
イン処理を行うという第１の実施例の欠点を解決し，効
率の良い複合条件判定処理を実現することが可能とな
り，高速な検索を行う文書検索装置を実現することがで
きる。

【０１０７】次に本発明の第３の実施例について図２７
を用いて説明する。本実施例では，複合条件判定回路３
００ｂにおける，近傍条件判定プログラム３１０，文脈
条件判定プログラム３２０，および論理条件判定プログ
ラム３３０の３つの複合条件判定プログラムを１つのマ
イクロコンピュータ上に載せ，これらの複合条件を切り
換えて順番に実行させることにより，複合条件判定処理
を実現することを目的としている。本実施例の複合条件
判定回路３００ｂは，処理速度では第１の実施例に劣る
が，１つのマイクロコンピュータで実現できるためコス
トを低くできるという効果が得られる。

【０１０８】本実施例は文字列照合処理２００と複合条
件判定回路３００ｂからなり，さらに複合条件判定回路
３００ｂは，マイクロコンピュータＭＰＵａ３０１およ
び文字列照合回路２００とのデータの受渡しを行うバッ
ファ３５０から構成される。マイクロコンピュータＭＰ
Ｕａ３０１には，近傍条件判定プログラム３１０，文脈
条件判定プログラム３２０，および論理条件判定プログ
ラム３３０などの３つの複合条件判定プログラムと，こ
れらのプログラムを切り替えるスケジューラ３４０が搭
載されている。ここでバッファ３６０，３７０はプログ
ラムのワークエリアとして確保されるが，プログラムに
よりファーストイン・ファーストアウト（ＦＩＦＯ）メ
モリとして使用することで，第１の実施例と同様の機能
を得ることができる。スケジューラ３４０における，複
合条件プログラムの切替え順序は，まず近傍条件判定プ
ログラム３１０を実行し，次に文脈条件判定プログラム
３２０，さらに次は論理条件判定プログラム３３０を実
行し，近傍条件判定プログラム３１０に戻るような順序
に複合条件プログラムの切替えを行う。また，スケジュ
ーラ３４０における複合条件プログラムを切り換えるタ
イミングは，ｎ個の照合ターム情報処理する毎やｎ件文
書を処理する毎などにすることも可能である。これはス
ケジューラ３４０のプログラムの切替え処理時間との兼
ね合いで定めることになる。もし，頻繁に切り替えると
プログラムの切替え時間が複合条件プログラムの実行処
理時間に対し，大きな割合を占めるようになるため，数
百〜数千の照合情報，もしくは数十から数百文書でプロ
グラムを切り替えるのが効果的である。以上のように複
合条件判定回路３００ｂを構成することにより，第１の
実施例よりも処理速度では劣るものの，１つのマイクロ
コンピュータで近傍条件判定プログラム３１０，文脈条
件判定プログラム３２０，および論理条件判定プログラ
ム３３０などの複合条件判定処理を実現できるため，コ
ストの低い文書検索装置を実現することができる。

【０１０９】次に本発明の第４の実施例について図２８
を用いて説明する。本実施例では複合条件判定回路３０
０ｃにおける，近傍条件判定プログラム３１０および文
脈条件判定プログラム３２０の２つの複合条件判定プロ
グラムを１つのマイクロコンピュータに載せ，これらの
複合条件を切り換えて順番に処理させることにより，近
傍条件および文脈の２つの複合条件判定処理を実現させ
ることを目的としている。また，論理条件判定プログラ
ム３３０は，別のマイクロコンピュータＭＰＵｂ３０３
に搭載する。本実施例の複合条件判定回路３００ｃは，
処理速度では第１の実施例に劣るが，２つのマイクロコ
ンピュータで実現できるためコストを抑えることができ
るという効果が得られる。本実施例は文字列照合回路２
００と複合条件判定回路３００ｃからなり，複合条件判
定回路３００ｃは，マイクロコンピュータＭＰＵａ３０
５およびマイクロコンピュータＭＰＵｂ３０３と文字列
照合回路２００とのデータの受渡しを行うバッファ３５
０，３７０から構成される。

【０１１０】マイクロコンピュータＭＰＵａには，近傍
条件判定プログラム３１０および文脈条件判定プログラ
ム３２０の２つの複合条件判定プログラムと，これらの
プログラムを切り替えるスケジューラ３４１が搭載され
ている。ここでバッファ３６０はプログラムのワークエ
リアとして確保されるが，プログラムによりファースト
イン・ファーストアウト（ＦＩＦＯ）メモリとして使用
することにより，第１の実施例と同様の機能を得ること
ができる。スケジューラ３４１では，まず近傍条件判
定プログラム３１０を実行し，次に文脈条件判定プログ
ラム３２０を実行し，その後で近傍条件判定プログラム
３１０に戻るような順序に複合条件プログラムの切替え
を行う。また，スケジューラ３４１における複合条件プ
ログラムを切り換えるタイミングは，ｎ個の照合ターム
情報を処理する毎やｎ文書を処理する毎などにする。こ
れはスケジューラ３４１のプログラムの切替え処理時間
との兼ね合いで定めることになる。もし，頻繁に切り替
えるとプログラムの切替え時間が複合条件処理プログラ
ムの実行時間に対し，大きな割合を占めるようになるた
め，数百〜数千の照合情報，もしくは数十から数百文書
でプログラムを切り替えるのが効果的である。以上のよ
うに複合条件判定回路３００ｃを構成することにより，
第１の実施例よりも処理速度では劣るが，２つのマイク
ロコンピュータで，近傍条件判定プログラム３１０，文
脈条件判定プログラム３２０，および論理条件判定プロ
グラム３３０などの複合条件判定処理を実現できるた
め，コストを抑えた比較的高速な文書検索装置を提供す
ることができる。

【０１１１】次に本発明の第５の実施例について図２９
を用いて説明する。本実施例では，第４の実施例におい
て複合条件のうち１つの条件しか設定されない場合でも
常に２つのマイクロプロセッサによる複合条件のパイプ
ライン処理を行うという欠点を，与えられた検索条件に
使用されていない複合条件がある場合にはその複合条件
判定プログラムをバイパスすることにより解決し，処理
効率の良い複合条件判定回路３００ｄを提供することを
目的としている。本実施例は文字列照合回路２００と複
合条件判定回路３００ｄからなり，複合条件判定回路３
００ｄは，マイクロコンピュータＭＰＵａ３０５および
マイクロコンピュータＭＰＵｂ３０３と文字列照合回路
２００とのデータの受渡しを行うバッファ３５０と３７
０，さらにマルチプレクサ３９１と３９２およびセレク
タ３８０と３８１から構成される。

【０１１２】本実施例の特徴である複合条件判定回路の
バイパス機能について述べる。本機能は指定された検索
条件式で使用されていない複合条件判定プログラムが搭
載されているマイクロプロセッサをマルチプレクサやセ
レクタを用いてバイパスすることにより，使用する複合
条件判定プログラムが搭載されているマイクロプロセッ
サのみを実行させる機能である。例えば検索条件式“文
書［４Ｃ］理解”が指定された場合には，近傍条件のみ
が使用されるため，文字列照合回路２００から得た照合
情報２０５をバッファ３５０経由で近傍条件判定プログ
ラム３１０および文脈条件判定プログラム３２０に入力
し，これから出力されて照合情報をバッファ３７０経由
で直接複合条件判定結果２０６として送出するようにす
る。また，検索条件式“理解［ＡＮＤ］システム”が指
定された場合には，論理条件が使用されているため，文
字列照合回路２００から得た照合情報２０５をバッファ
３５０経由で直接，論理条件判定プログラム３３０に入
力し，この論理条件判定プログラム３３０から出力され
る照合情報を複合条件判定結果２０６として送出するよ
うにする。

【０１１３】このような複合条件判定プログラムのバイ
パス機能の具体的な実現方法について説明する。このよ
うな動作はマルチプレクサ３９１と３９２とセレクタ３
８０と３８１の設定により実現する。この設定情報は第
２図の検索制御手段１０１からの検索制御情報２０２と
して与えられる。マルチプレクサ３９１では，文字列照
合回路２００からの照合情報２０５を，ａ２が指定され
た場合には論理条件判定プログラム３３０へ送出するこ
とになる。また，ｂ２が指定された場合には，文字列照
合回路２００からの照合情報２０５を近傍条件判定プロ
グラム３１０へ送出し，さらにｃ２が指定された場合に
は複合条件回路３００の出力として直接送出することに
なる。マルチプレクサ３９２では文脈条件判定プログラ
ム３２０の出力を，ａ３が指定された場合には論理条件
判定プログラム３３０へ，ｂ３が指定された場合には複
合条件判定結果２０６として送出する。

【００１１４】セレクタ３８０では論理条件判定プログ
ラム３３０の入力の選択を行い，マルチプレクサ３９１
にａ２が設定されたときはＸ１を，すなわち文字列照合
回路２００の照合結果２０５を選択し，マルチプレクサ
３９２にａ３が設定されたときはＹ１を，すなわち文脈
条件判定プログラム３２０の出力を選択することにな
る。セレクタ３８１では複合条件判定結果２０６の選択
を行い，マルチプレクサ３９１にｃ２が設定されたとき
はＸ２を，すなわち文字列照合回路２００の照合結果２
０５を選択し，マルチプレクサ３９２がｂ３に設定され
たときはＹ２を，すなわち文脈条件判定プログラム３２
０の出力を選択し，それ以外の場合はＺ２を，すなわち
論理条件判定プログラム３３０の出力を選択する。以上
述べたように，セレクタ３８０と３８１の設定は，マル
チプレクサ３９１と３９２の設定に応じて行うことにな
る。

【０１１５】複合条件の組合せにより，以下のようにマ
ルチプレクサの選択を行うことになる。（１）複合条件なし ───────── ｃ２のみを選択（２）論理条件のみ ───────── ａ２のみを選択（３）近傍条件と文脈条件 ────── ｂ２とｂ３を選択（４）近傍条件と文脈条件と論理条件 ─ ｂ２とａ３を選択以上のように，検索制御手段１０１からの検索制御情報
２０２として与えられたマルチプレクサ３９１と３９２
およびセレクタ３８１と３８２の設定情報に基づき，近
傍条件判定プログラム３１０，文脈条件判定プログラム
３２０，および論理条件判定プログラム３３０などの複
合条件判定プログラムをマルチプレクサ３９１と３９２
およびセレクタ３８０と３８１を用いて選択的に接続す
ることにより，第４の実施例が複合条件の内１つの条件
しか設定されない場合には１つのマイクロプロセッサし
か使用されないにもかかわらず，常に２つマイクロプロ
ッセサにより複合条件のパイプライン処理を行うという
欠点を解決し，効率の良い複合条件判定処理を実現する
ことが可能となり，比較的低コストで且つ比較的高速な
文書検索装置を実現することができる。

【０１１６】次に本発明の第６の実施例について図３０
を用いて説明する。本実施例では複合条件判定回路３０
０ｅにおける，文脈条件判定プログラム３２０および論
理条件判定プログラム３３０の２つの複合条件判定プロ
グラムを１つのマイクロコンピュータに搭載し，これら
の複合条件を切り換えて順番に処理させることにより，
文脈条件および論理条件の２つの複合条件判定処理を１
つのマイクロコンピュータで実現することを目的として
いる。また，近傍条件判定プログラム３１０は，別のマ
イクロコンピュータに受け持たせる。本実施例の複合条
件判定回路３００ｅは，処理速度では第１の実施例に劣
るが，２つのマイクロコンピュータで実現できるため比
較的高性能を維持してコストを抑えることができるとい
う効果が得られる。

【０１１７】本実施例は文字列照合回路２００と複合条
件判定回路３００ｅからなり，複合条件判定回路３００
ｅは，マイクロコンピュータＭＰＵａ３０１およびマイ
クロコンピュータＭＰＵｂ３０６と文字列照合回路２０
０とのデータの受渡しを行うバッファ３５０，３６０か
ら構成される。マイクロコンピュータＭＰＵａ３０６に
は，文脈条件判定プログラム３２０および論理条件判定
プログラム３３０の２つの複合条件判定プログラムと，
これらのプログラムを切り替えるスケジューラ３４２が
搭載されている。ここでバッファ３７０はプログラムの
ワークエリアに確保されるが，プログラムでファースト
イン・ファーストアウト（ＦＩＦＯ）メモリとして使用
することにより，第１の実施例と同様の機能を得ること
ができる。スケジューラ３４２では，まず文脈条件判定
プログラム３２０を実行し，次に論理条件判定プログラ
ム３３０を実行し，その後で文脈条件判定プログラム３
２０に戻るというような順序に複合条件プログラムの切
替えを行う。また，スケジューラ３４２における複合条
件プログラムを切り換えるタイミングは，ｎ個の照合タ
ーム情報を処理する毎やｎ件の文書を処理する毎などに
することも可能である。これはスケジューラ３４２のプ
ログラムの切替え処理時間との兼ね合いで定めることに
なる。もし，頻繁に切り替えるとプログラムの切替え時
間が複合条件処理プログラムの実行時間に対し，大きな
割合を占めるようになるため，数百〜数千の照合情報，
もしくは数十から数百文書でプログラムを切り替えるの
が効果的である。以上のように複合条件判定回路３００
ｅを構成することにより，第１の実施例よりも処理速度
では劣るが，２つのマイクロコンピュータで，近傍条件
判定プログラム３１０，文脈条件判定プログラム３２
０，および論理条件判定プログラム３３０などの複合条
件判定処理を行うため，低コストで比較的高速な文書検
索装置を実現することができる。

【０１１８】次に本発明の第７の実施例について図３１
を用いて説明する。本実施例では，第６の実施例におい
て複合条件のうち１つの条件しか設定されない場合でも
常に２つのマイクロプロセッサによる複合条件のパイプ
ライン処理を行うという問題点を，与えられた検索条件
に使用されていない複合条件がある場合にはその複合条
件判定プログラムをバイパスすることにより解決し，処
理効率の良い複合条件判定回路３００ｆを実現すること
を目的としている。本実施例は文字列照合回路２００と
複合条件判定回路３００ｆからなり，複合条件判定回路
３００ｆは，マイクロコンピュータＭＰＵａ３０１およ
びマイクロコンピュータＭＰＵｂ３０６と文字列照合回
路２００とのデータの受渡しを行うバッファ３５０と３
６０，さらにマルチプレクサ３９１と３９２およびセレ
クタ３８０と３８１から構成される。

【０１１９】本実施例の特徴である複合条件判定回路の
バイパス機能について述べる。本機能は指定された検索
条件式に使用されてない複合条件判定プログラムが搭載
されているマイクロプロセッサをマルチプレクサやセレ
クタを用いてバイパスすることにより，使用する複合条
件判定プログラムが搭載されているマイクロプロセッサ
のみを実行させる機能である。例えば検索条件式“文書
［４Ｃ］理解”が指定された場合には，近傍条件のみが
使用されるため，文字列照合回路２００から得た照合情
報２０５をバッファ３５０経由で近傍条件判定プログラ
ム３１０に入力し，この出力の照合情報をバッファ３７
０経由で直接複合条件判定結果２０６として送出する。
また，検索条件式“理解［ＡＮＤ］システム”が指定さ
れた場合には，論理条件が使用されているため，文字列
照合回路２００から得た照合情報２０５をバッファ３５
０経由で直接，文脈条件判定プログラム３２０に入力
し，さらにバッファ３７０を経由し論理条件判定プログ
ラム３３０に入力し，この論理条件判定プログラム３３
０の出力の照合情報を複合条件判定結果２０６として送
出する。

【０１２０】このような複合条件判定回路のバイパス機
能の具体的な実現方法について説明する。このような動
作はマルチプレクサ３９１と３９２とセレクタ３８０と
３８１の設定により実現される。この設定情報は第２図
の検索制御手段１０１からの検索情報２０２として与え
られる。マルチプレクサ３９１では，文字列照合回路２
００からの照合情報２０５の出力を，ａ２が指定された
場合には文脈条件判定プログラム３２０へ，ｂ２が指定
された場合には近傍条件判定プログラム３１０へ，ｃ２
が指定された場合には複合条件回路３００の出力として
直接送出することになる。マルチプレクサ３９２では近
傍条件判定プログラム３１０の出力を，ａ３が指定され
た場合には文脈条件判定プログラム３２０へ，ｂ３が指
定された場合には複合条件判定結果２０６として送出す
ることになる。

【０１２１】セレクタ３８０では文脈条件判定プログラ
ム３２０の入力の選択を行い，マルチプレクサ３９１に
ａ２が設定されたときはＸ１を，すなわち文字列照合回
路２００の照合結果２０５を選択し，マルチプレクサ３
９２にａ３が設定されたときはＹ１を，すなわち近傍条
件判定プログラム３１０の出力を選択する。セレクタ３
８１では複合条件判定結果２０６の選択を行い，マルチ
プレクサ３９１にｃ２が設定されたときはＸ２を，すな
わち文字列照合回路２００の照合結果２０５を選択し，
マルチプレクサ３９２がｂ３に設定されたときはＹ２
を，すなわち近傍条件判定プログラム３１０の出力を選
択し，それ以外の場合はＺ２を，すなわち論理条件判定
プログラム３３０の出力を選択する。

【０１２２】以上述べたように，セレクタ３８０と３８
１の設定は，マルチプレクサ３９１と３９２の設定に応
じて行うことになる。すなわち複合条件の組合せによ
り，以下のようにマルチプレクサの選択を行うことにな
る。（１）複合条件なし ───────── ｃ２のみを選択（２）近傍条件のみ ───────── ｂ２とｂ３を選択（３）文脈条件と論理条件 ────── ａ２のみを選択（４）近傍条件と文脈条件と論理条件 ─ ｂ２とａ３を選択以上のように，検索制御手段１０１からの検索制御情報
２０２として与えられたマルチプレクサ３９１と３９２
およびセレクタ３８１と３８２の設定情報に基づき，近
傍条件判定プログラム３１０，文脈条件判定プログラム
３２０，および論理条件判定プログラム３３０などの複
合条件判定プログラムをマルチプレクサ３９１と３９２
およびセレクタ３８０と３８１を用いて選択的に接続す
ることにより，第６の実施例が複合条件の内１つの条件
しか設定されない場合には１つのマイクロプロセッサし
か使用されないにもかかわらず，常に２つマイクロプロ
ッセサにより複合条件のパイプライン処理を行うという
欠点を解決し，効率の良い複合条件判定処理を実現する
ことが可能となり，コストを抑えた比較的高速な文書検
索装置を提供することができる。

【０１２３】次に本発明の第８の実施例について図３２
を用いて説明する。第１の実施例では，文字列照合回路
２００から出力される照合情報の中に近傍条件の処理対
象にならない文脈識別文字列，すなわち文脈マーカーの
照合情報も入っているため，近傍条件判定プログラム３
１０では文脈マーカーの照合情報についても近傍条件判
定処理を実施することになり，近傍条件判定の処理速度
が落ちるという問題がある。本実施例では上記問題点を
解決する複合条件判定方法として，文脈マーカーの照合
情報のみを格納するバッファ３８０を設け，近傍条件判
定処理をバイパスし文脈マーカーの照合情報が必要な文
脈条件判定プログラム３２０に入力することにより高速
な複合条件判定処理が可能な複合条件判定回路３００ｇ
を実現することが目的である。

【０１２４】本実施例は文字列照合回路２００と複合条
件判定回路３００ｇからなり，複合条件判定回路３００
ｇは，マイクロコンピュータＭＰＵａ３０１，マイクロ
コンピュータＭＰＵｂ３０２ａおよびマイクロコンピュ
ータＭＰＵｃ３０３とこれらの間のデータの受渡しを行
うバッファ３５０，３６０，３７０および３８０，さら
にマルチプレクサ７１０，文脈マーカー検出器７２０か
ら構成される。マルチプレクサ７１０は通常はポートａ
を選択し，文字列照合回路２００から送られる照合情報
２０５を近傍条件判定プログラム３１０の入力となるバ
ッファ３５０へ送出する。また，後述する文脈マーカー
検出器７２０から文脈マーカー検出信号７２１が送られ
るとマルチプレクサ７１０ではポートｂを選択し，後述
するソートマージプログラム７３０の入力となるバッフ
ァ３８０へ送出する。すなわち，文脈マーカーの照合情
報はバッファ３８０へ送出されることになる。さらに，
後述する文脈マーカー検出器７２０から文書識別情報検
出信号７２２が送られるとマルチプレクサ７１０ではポ
ートａとポートｂの両方を選択し，バッファ３５０とバ
ッファ３８０へ同時に送出する。すなわち，文書識別情
報はバッファ３５０とバッファ３８０の両方へ送出され
ることになる。

【０１２５】文脈マーカー検出器７２０では，文字列照
合回路２００の出力を参照して，文脈マーカーの照合情
報か否かを判定する。すなわち，照合情報の照合情報識
別子があらかじめ定められた文脈マーカーの照合情報識
別子と同じもので，且つ先頭位置情報と末尾位置情報と
も０（ゼロ）でないということであれば，文脈マーカー
であると判定する。また，先頭位置情報と末尾位置情報
とが共に０（ゼロ）であれば，文書識別情報であると判
定する。文脈マーカー検出器７２０は，文書識別情報検
出用のコンパレータ，文脈マーカーの照合ターム情報識
別用の２つのコンパレータ，文脈マーカーの識別子格納
用のレジスタ，および０（ゼロ）を格納するレジスタか
ら構成される。まず，文書識別情報検出用のコンパレー
タは，照合情報の位置情報が０かどうかを調べ，０の場
合には文書識別情報検出信号７２２を出力する。すなわ
ち，０が格納されているレジスタと照合情報の位置情報
を比較し，等しい場合に文書識別情報検出信号７２２を
出力することになる。次に，文脈マーカーの照合ターム
情報識別用のコンパレータは，文脈マーカーの照合ター
ム情報識別子かどうかを調べるコンパレータと，今調べ
ている照合情報が照合ターム情報かどうかを調べるコン
パレータを用意する。ここで，これらの両方のコンパレ
ータから成立信号が出力された場合にのみ文脈マーカー
検出信号７２１を出力する。文脈マーカーの照合ターム
情報識別子かどうかを調べるコンパレータでは，照合情
報の照合情報識別子が文脈マーカーの識別子と同じ場
合，すなわち照合情報の照合情報識別子と文脈マーカー
の識別子格納用のレジスタとを比較し，等しい場合に成
立信号を出力する。照合ターム情報かどうかを調べるコ
ンパレータでは，照合情報の位置情報が０でない場合，
すなわち照合情報の位置情報と０が格納されているレジ
スタとを比較し，等しくない場合に成立信号を出力す
る。以上のように，文脈マーカー検出器７２０を構成す
る。

【０１２６】文脈マーカーの照合情報が文脈マーカー検
出器７２０に入力された場合，マルチプレクサ７１０に
文脈マーカー検出信号７２１を出力する。これに応じ
て，マルチプレクサ７１０では，文字列照合回路２００
から送られた照合情報２０５の送出先をバッファ３５０
からバッファ３８０へ切り替えることになる。文書識別
情報であればマルチプレクサ７１０に文書識別情報検出
信号７２２を出力する。これに応じて，マルチプレクサ
７１０では，文字列照合回路２００から送られた照合情
報２０５の送出先をバッファ３５０とバッファ３８０の
両方に設定する。

【０１２７】マイクロコンピュータ３０２ａでは，ソー
トマージプログラム７３０と文脈条件判定プログラム３
２０とこれらを制御するスケジューラ３４２が実行され
る。ソートマージプログラム７３０ではバッファ３６０
に格納された近傍条件判定プログラム３１０の出力とし
ての照合情報と，バッファ３８０に格納された文脈マー
カー照合情報とを，末尾位置情報の昇順にマージする。
すなわち，バッファ３６０とバッファ３８０から各々照
合情報を１つずつ読み込み，これらの末尾位置情報を比
較する。そして，バッファ３６０から読み込んだ照合情
報の末尾位置情報がバッファ３８０から読み込んだ照合
情報の末尾位置情報より小さい場合には，バッファ３６
０から読み込んだ照合情報をバッファ３９０へ先に出力
し，次はバッファ３６０から照合情報を読み込み，同様
に先程のバッファ３８０から読み込んだ照合情報と比較
し，小さい方をバッファ３９０へ出力する。逆にバッフ
ァ３８０の照合情報の末尾位置情報がバッファ３６０の
照合情報の末尾位置情報より小さい場合はバッファ３８
０の照合情報をバッファ３９０へ出力し，次はバッファ
３８０から照合情報を読込み，同様に先程のバッファ３
６０から読み込んだ照合情報と比較し，小さい方をバッ
ファ３９０へ出力する。また，文書識別情報はバッファ
３６０から読み込んだもののみをバッファ３９０に出力
し，バッファ３８０から読み込んだ文書識別情報はバッ
ファ３９０に出力しない。さらに，ここで行うソートマ
ージは文書毎に処理を行う。

【０１２８】これらの処理を行うことによりバッファ３
９０には，バッファ３６０とバッファ３８０の照合情報
が末尾位置情報でソートマージされることになり，第１
の実施例における近傍条件判定プログラム３１０の出力
した照合情報と同様のものが格納されることになる。ス
ケジューラ３４３における，プログラムの切替え順序
は，まずソートマージプログラム７３０を実行し，次に
文脈条件判定プログラム３２０を実行し，ソートマージ
プログラム７３０に戻るような順序にプログラムの切替
えを行う。また，スケジューラ３４３におけるプログラ
ムを切り換えるタイミングは，ｎ個の照合ターム情報処
理する毎やｎ件文書を処理する毎などにすることも可能
である。これはスケジューラ３４３のプログラムの切替
え処理時間との兼ね合いで定めることになる。もし，頻
繁に切り替えるとプログラムの切替え時間がプログラム
の実行処理時間に対し，大きな割合を占めるようになる
ため，数百〜数千の照合情報，もしくは数十から数百文
書でプログラムを切り替えるのが効果的である。以上の
ように複合条件判定回路３００ｇを実現することにより
近傍条件判定処理に必要のない文脈マーカーの照合情報
を近傍条件判定プログラム３１０をバイパスすることが
可能となり，第１の実施例より高速な文書検索装置が実
現できる。

【０１２９】次に本発明の第９の実施例について図３３
を用いて説明する。本実施例は第８の実施例と同様に，
文字列照合回路２００から出力される照合情報の中に近
傍条件の処理対象にならない文脈マーカーの照合情報も
入っているため，近傍条件判定プログラム３１０では文
脈マーカーの照合情報についても近傍条件判定処理を実
施することになり，近傍条件判定の処理速度が落ちると
いう第１の実施例の問題点を，文脈マーカーの照合情報
のみを格納するバッファを設け，近傍条件判定処理をバ
イパスし文脈マーカーの照合情報が必要な文脈条件判定
プログラム３２０のみに入力することにより高速な複合
条件判定処理が行える複合条件判定回路３００ｈを実現
することが目的である。

【０１３０】本実施例が第８の実施例と異なるのは，文
脈マーカー検出専用に文脈マーカー用文字列照合回路２
００ａを設けた点である。第８の実施例では文脈マーカ
ーを含む検索タームを全て文字列照合回路２００に設定
するため，文字列照合回路２００に設定する検索ターム
数が多くなるという問題がある。さらには文字列照合回
路２００の許容する検索ターム数を超えてしまう場合も
出てくる。また，文脈マーカーの検索タームは１度設定
すれば済むものであるのに対して，第８の実施例のよう
に検索条件が与えられる度に文脈マーカーの検索ターム
も再設定すると，検索情報２０２の作成時間および設定
時間が長くなるという問題点も生じる。

【０１３１】本実施例は文字列照合回路２００と文脈マ
ーカー用文字列照合回路２００ａ，および複合条件判定
回路３００ｈから構成される。複合条件判定回路３００
ｈは，マイクロコンピュータＭＰＵａ３０１，マイクロ
コンピュータＭＰＵｂ３０２ａおよびマイクロコンピュ
ータＭＰＵｃ３０３とこれらの間のデータの受渡しを行
うバッファ３５０，３６０，３７０および３８０から構
成される。文脈マーカー用文字列照合回路２００ａの構
成は文字列照合回路２００と同様であり，文脈マーカー
用文字列照合回路２００ａには文脈マーカーを検索ター
ムとして設定し，文字列照合回路２００には文脈マーカ
ー以外の検索タームを設定する。また，検索制御手段１
０１では，文字列照合回路２００には検索条件が与えら
れる度に検索情報２０２を設定するが，文脈マーカー用
文字列照合回路２００ａは本検索装置の立上時に１度だ
け設定する。

【０１３２】本実施例の処理手順を具体例で説明する。
まず，文字列照合回路２００と文脈マーカー用文字列照
合回路２００ａの動作を具体例で説明する。（７−１）
に示した式 “Ｑ＝((文書［４Ｃ］理解)［Ｓ］システム)［ＡＮＤ］
(文書［Ｓ］検索)” を例に用いて説明する。各複合条件判定プログラムには
検索制御手段１０１で解析され，各条件に分離された条
件式が設定される。本例では検索制御手段１０１より文
字列照合回路２００には，Ｔ１：文書”，“Ｔ２：理
解”，“Ｔ３：検索”，および“Ｔ４：システム”の４
つが検索タームとして設定され，文脈マーカー用文字列
照合回路２００ａには，“Ｓ１：。”が検索タームとし
て設定される。

【０１３３】今，（７−２）に示した文書 “・・・。文書理解を用いた検索システムである。・・
・・” が入力されたとすると，文字列照合回路２００からは以
下の照合情報（１３−１）〜（１３−５）が照合情報２
０５としてバッファ３５０へ出力される。 (Ｄ１，０，０) (１３−１) (Ｔ１，３１，３２) (１３−２) (Ｔ２，３３，３４) (１３−３) (Ｔ３，３９，４０) (１３−４) (Ｔ４，４１，４４) (１３−５) また，文脈マーカー用文字列照合回路２００ａからは以
下の文脈マーカーの照合情報（１２−１）〜（１２−
３）が照合情報２０５ａとしてバッファ３８０へ出力さ
れる。 (Ｄ１，０，０) (１２−１) (Ｓ１，３０，３０) (１２−２) (Ｓ１，４８，４８) (１２−３) 上記のバッファ３６０，３８０の照合情報は第８の実施
例と同じように，近傍条件判定プログラム３１０，ソー
トマージプログラム７３０，文脈条件判定プログラム３
２０，および論理条件判定プログラム３３０により処理
される。以上のように文脈マーカー検出専用の文字列照
合回路２００ａを設けることにより，近傍条件判定処理
に必要のない文脈マーカーの照合情報を近傍条件判定プ
ログラム３１０をバイパスすることが可能となり，さら
に第８の実施例よりも文脈マーカーに関する検索情報２
０２の作成時間および設定時間が少なくて済むため，第
１の実施例より高速な文書検索装置が実現できる。

【０１３４】次に本発明の第１０の実施例について図３
４を用いて説明する。本実施例は第１の実施例の複合条
件判定回路３００では，マイクロコンピュータＭＰＵａ
３０１，マイクロコンピュータＭＰＵｂ３０２，および
マイクロコンピュータＭＰＵｃ３０３のデータの受渡し
に使用しているバッファ３６０およびバッファ３７０に
ファーストイン・ファーストアウト（ＦＩＦＯ）メモリ
という特殊なメモリを使用しているため，メモリ容量当
りのコストが高く掛かるという問題点がある。本実施例
では，この代りに一般のメモリを使用することにより低
コストの複合条件判定回路３００ｉを実現することを目
的としている。

【０１３５】本実施例はマイクロコンピュータＭＰＵａ
３０１，マイクロコンピュータＭＰＵｂ３０２，マイク
ロコンピュータＭＰＵｃ３０３，バッファ３５０，バス
６３０，および共有メモリ６２０から構成される。ま
た，マイクロコンピュータＭＰＵａ３０１では近傍条件
判定プログラム３１０が，マイクロコンピュータＭＰＵ
ｂ３０２では文脈条件判定プログラム３２０が，マイク
ロコンピュータＭＰＵｃ３０３では論理条件判定プログ
ラム３３０が実行される。

【０１３６】共有メモリ６２０は近傍条件判定プログラ
ム３１０，文脈条件判定プログラム３２０，および論理
条件判定プログラム３３０のデータの受渡しに使用す
る。すなわち，近傍条件判定プログラム３１０と文脈条
件判定プログラム３２０とのデータの受渡しには共有メ
モリ６２０内のバッファ３６０ａが，文脈条件判定プロ
グラム３２０と論理条件判定プログラム３３０とのデー
タの受渡しにはバッファ３７０ａがそれぞれ使用され
る。バッファ３６０ａとバッファ３７０ａは，近傍条件
判定プログラム３１０，文脈条件判定プログラム３２
０，および論理条件判定プログラム３３０においてプロ
グラムでファーストイン・ファーストアウト（ＦＩＦ
Ｏ）メモリとして使用することにより，それぞれバッフ
ァ３６０とバッファ３７０と同様の機能を得ることが可
能である。

【０１３７】本実施例の複合条件判定処理の動作につい
て説明する。文字列照合回路２００の照合結果は照合情
報２０５としてバッファ３５０に送出される。バッファ
３５０に格納された照合情報は近傍条件判定プログラム
３１０で処理され判定結果は共有メモリ６２０内のバッ
ファ３６０ａに格納される。次にバッファ３６０ａに照
合情報が格納されると文脈条件判定プログラム３２０が
実行され，文脈条件判定プログラム３２０の判定結果は
共有メモリ６２０内のバッファ３７０ａに格納される。
さらにバッファ３７０ａに照合情報が格納されると論理
条件判定プログラム３３０が実行され，論理条件判定プ
ログラム３３０の判定結果は複合条件判定結果２０６と
して送出される。以上のように，複合条件判定回路３０
０ｉを実現することにより，ＦＩＦＯメモリの替わりに
低コストの通常のメモリをバッファ３６０ａ，３７０ａ
に使用することが可能となり，低コストの安い文書検索
装置を実現することができる。

【０１３８】最後に本発明の第１１の実施例について図
３５を用いて説明する。第１の実施例の複合条件判定回
路３００では，マイクロコンピュータＭＰＵａ３０１，
マイクロコンピュータＭＰＵｂ３０２，およびマイクロ
コンピュータＭＰＵｃ３０３間のデータの受渡しに使用
するバッファ３６０およびバッファ３７０にファースト
イン・ファーストアウト（ＦＩＦＯ）メモリという特殊
なメモリを使用しているため，メモリ容量当りのコスト
が高くつくという問題点がある。本実施例ではこのＦＩ
ＦＯメモリの代りに，一般のメモリを使用することによ
り低コストの複合条件判定回路３００ｊを実現すること
を目的としている。また，第１０の実施例では，共有メ
モリ６２０を３つのマイクロプロセッサで時分割でアク
セスするため，各プロセッサが同じ回数のメモリアクセ
スを行うとすると，メモリのアクセス回数は３倍になり
処理速度がメモリのアクセスネックになるという問題が
ある。これに対して本実施例では，各プロセッサ間に一
般のメモリを使用したバッファを２面設けることにより
解決することを目的としている。

【０１３９】本実施例はマイクロコンピュータＭＰＵａ
３０１，マイクロコンピュータＭＰＵｂ３０２，マイク
ロコンピュータＭＰＵｃ３０３，バッファ３５０，バッ
ファ３６０ｂおよびバッファ３７０ｂから構成される。
また，マイクロコンピュータＭＰＵａ３０１では近傍条
件判定プログラム３１０が，マイクロコンピュータＭＰ
Ｕｂ３０２では文脈条件判定プログラム３２０が，マイ
クロコンピュータＭＰＵｃ３０３では論理条件判定プロ
グラム３３０が実行される。

【０１４０】バッファ３６０ｂは近傍条件判定プログラ
ム３１０と文脈条件判定プログラム３２０のデータの受
渡しに使用され，バッファ３７０ｂは文脈条件判定プロ
グラム３２０と論理条件判定プログラム３３０のデータ
の受渡しに使用されている。バッファ３６０ｂでは，マ
ルチプレクサ６３０，セレクタ６３１，メモリ６２２，
６２３，バス６４０，６４１，および通信メモリ６２４
から構成されている。バッファ３７０ｂもバッファ３６
０ｂと同様に構成される。２面バッファを構成するメモ
リ６２２とメモリ６２３は近傍条件判定プログラム３１
０から文脈条件判定プログラム３２０への照合情報の受
渡しに使用される。近傍条件判定プログラム３１０がメ
モリ６２２に照合情報を出力している間，文脈条件判定
プログラム３２０はメモリ６２３から以前に近傍条件判
定プログラム３１０が出力した照合情報を読み込む。ま
た，近傍条件判定プログラム３１０がメモリ６２３に照
合情報を出力している間，文脈条件判定プログラム３２
０はメモリ６２２から以前に近傍条件判定プログラム３
１０が出力した照合情報を読み込む。通信メモリ６２４
は，メモリ６２２およびメモリ６２３のバッファの切り
替えのための制御情報の受渡しに使用される。

【０１４１】マルチプレクサ６３０は切り替え信号６３
０ａに０が設定されるとポートａを選択し，近傍条件判
定プログラム３１０の出力する照合情報がメモリ６２２
に格納される。切り替え信号６３０ａに１が設定される
とポートｂを選択し，近傍条件判定プログラム３１０の
出力する照合情報がメモリ６２３に格納される。セレク
タ６３１は切り替え信号６３１ａに０が設定されるとポ
ートｘが選択され，メモリ６２２から照合情報が文脈条
件判定プログラム３２０により読込まれる。切り替え信
号６３１ａに１が設定されるとポートｙが選択され，メ
モリ６２２から照合情報が文脈条件判定プログラム３２
０により読込まれる。

【０１４２】以下，バッファ３６０ｂの２面バッファ方
式の動作の制御方法について説明する。まず，近傍条件
判定プログラム３１０が切り替え信号６３０ａとして０
をマルチプレクサ６３０に送る，すなわち近傍条件判定
プログラム３１０から出力される照合情報をメモリ６２
２に出力する。近傍条件判定プログラム３１０がメモリ
６２２に所定の量の照合情報を書き込み終えたとき通信
メモリ６２４を経由し，文脈条件判定プログラム３２０
にメモリ６２２が使用できることを知らせる。文脈条件
判定プログラム３２０はこれを受け，セレクタ６３１に
切り替え信号６３１ａとして０を設定する。すなわち，
文脈条件判定プログラム３２０の入力としてメモリ６２
２を選択することになり，メモリ６２２の照合情報を読
み込み文脈条件判定処理を行う。

【０１４３】次に，近傍条件判定プログラム３１０が切
り替え信号６３０ａとして１をマルチプレクサ６３０に
送る。すなわち近傍条件判定プログラム３１０から出力
される照合情報をメモリ６２３に出力することになる。
近傍条件判定プログラム３１０がメモリ６２３に所定の
量の照合情報を書き込み終えたとき通信メモリ６２４を
経由し，文脈条件判定プログラム３２０にメモリ６２３
が使用できることを知らせる。文脈条件判定プログラム
３２０はこれを受け，セレクタ６３１に切り替え信号６
３１ａとして１を設定する。すなわち，文脈条件判定プ
ログラム３２０の入力としてメモリ６２３を選択するこ
とになり，メモリ６２３の照合情報を読み込み文脈条件
判定処理を行う。

【０１４４】その後再び，近傍条件判定プログラム３１
０が切り替え信号６３０ａとして０をマルチプレクサ６
３０に送る。このとき，近傍条件判定プログラム３１０
がメモリ６２２に照合情報を書き込む場合，文脈条件判
定プログラム３２０からのメモリ６２２の読込み終了が
報告されるまで，近傍条件判定プログラム３１０はメモ
リ６２２への照合情報の書込みを待つことになる。この
ため文脈条件判定プログラム３２０においてメモリ６２
２の読込みが終了したとき通信メモリ６２４を経由し，
メモリ６２２の読込みが終了したことを知らせる。この
ようにメモリ６２２およびメモリ６２３のバッファの切
替えを制御することにより，近傍条件判定プログラム３
１０と文脈条件判定プログラム３２０とが同じメモリを
アクセスすることのない２面バッファ方式が実現され
る。文脈条件判定プログラム３２０と論理条件判定プロ
グラム３３０とのデータの受渡しに使用するバッファ３
７０ｂもバッファ３６０ｂと同様のものを使用すること
ができる。以上のように，実現することにより，ＦＩＦ
Ｏメモリの替わりに低コストの通常のメモリをバッファ
３６０ｂ，３７０ｂを用いて複合条件判定回路３００ｊ
を構成することにより，低コストで，且つ高速な文書検
索装置を実現することができる。

【０１４５】

【発明の効果】以上のように本発明が提供する文書検索
方法および装置によれば，複合条件である近傍条件，文
脈条件，および論理条件を容易に判定することができ，
しかも高速に判定処理することが可能となり，フルテキ
ストサーチ特有の木目細かな検索を高速に実現する文書
検索装置を提供することができる。

【図面の簡単な説明】

【図１】本発明を用いた複合条件判定回路の説明図であ
る。

【図２】文書検索装置の説明図である。

【図３】複合条件の判定例の説明図である。

【図４】照合情報の説明図である。

【図５】複合条件の判定例の説明図である。

【図６】複合条件の判定例の説明図である。

【図７】複合条件の判定例の説明図である。

【図８】文書識別子検出回路の説明図である。

【図９】検索ターム長テーブルの説明図である。

【図１０】位置情報付加回路の説明図である。

【図１１】文書識別情報の説明図である。

【図１２】照合ターム識別情報の説明図である。

【図１３】照合情報の説明図である。

【図１４】照合情報の説明図である。

【図１５】近傍条件判定処理の説明図である。

【図１６ａ】近傍条件判定処理の説明図の一部である。

【図１６ｂ】近傍条件判定処理の説明図の他部である。

【図１７】近傍条件判定処理の説明図である。

【図１８】文脈条件判定処理の説明図である。

【図１９】文脈条件判定処理の説明図である。

【図２０ａ】文脈条件判定処理の説明図の一部である。

【図２０ｂ】文脈条件判定処理の説明図の他部である。

【図２１ａ】文脈条件判定処理の説明図の一部である。

【図２１ｂ】文脈条件判定処理の説明図の他部である。

【図２２】文脈条件判定処理の説明図である。

【図２３】論理条件判定処理の説明図である。

【図２４ａ】論理条件判定処理の説明図の一部である。

【図２４ｂ】論理条件判定処理の説明図の他部である。

【図２５】論理条件判定処理の説明図である。

【図２６】本発明を用いた複合条件判定回路の説明図で
ある。

【図２７】本発明を用いた複合条件判定回路の説明図で
ある。

【図２８】本発明を用いた複合条件判定回路の説明図で
ある。

【図２９】本発明を用いた複合条件判定回路の説明図で
ある。

【図３０】本発明を用いた複合条件判定回路の説明図で
ある。

【図３１】本発明を用いた複合条件判定回路の説明図で
ある。

【図３２】本発明を用いた複合条件判定回路の説明図で
ある。

【図３３】本発明を用いた複合条件判定回路の説明図で
ある。

【図３４】プロセッサ間のバッファの説明図である。

【図３５】プロセッサ間のバッファの説明図である。

【符号の説明】

１０１検索制御手段１０４記憶装置制御手段１０５文字列記憶手段２００文字列照合手段３００複合条件判定手段２１０文書識別子検出回路２２０タームコンパレータ２３０文字数カウンタ２４０位置情報付加回路２５０検索ターム長テーブル３１０近傍条件判定プログラム３２０文脈条件判定プログラム３３０論利条件判定プログラム３５０バッファ３６０バッファ３７０バッファ３８０バッファ

───────────────────────────────────────────────────── フロントページの続き (72)発明者畠山敦東京都国分寺市東恋ケ窪１丁目280番地株式会社日立製作所中央研究所内 (72)発明者藤澤浩道東京都国分寺市東恋ケ窪１丁目280番地株式会社日立製作所中央研究所内 (56)参考文献特開昭61−28132（ＪＰ，Ａ) 特開昭63−205762（ＪＰ，Ａ) 特開昭60−105039（ＪＰ，Ａ) 特開平３−125263（ＪＰ，Ａ) 加藤寛次他，「大規模文書情報システム用テキストサーチマシンの研究」，情報処理学会研究報告（89−ＦＩ−14）Ｖｏｌ．89 Ｎｏ．66，1989（平01−07− 27），ｐ．１−８菊池忠一他，「構成文字の属性／文字位置を含むコード化による全文検索の高速化手法」，電子情報通信学会技術研究報告（ＤＥ90−24〜30）Ｖｏｌ．90 Ｎｏ．362，ｐ．１−７ (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06F 17/30 G06F 17/24 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】文字コードとして蓄積された文書データ
ベースを対象として検索条件式中に指定された検索語を
含む文書を検索する文書検索方法において、文書中に指定検索語が照合された場合、該文書の識別子
を含む文書識別情報と照合された検索語の識別子および
該文書中における照合位置とを照合情報として出力する
文字列照合ステップと、該文字列照合ステップで出力された照合情報を基に前記
検索条件式中に指定された検索語間の位置関係に関する
検索条件を判定し、検索条件に合致したことを示す判定
結果の照合情報を作成し検索結果として出力する複合条
件判定ステップから構成されることを特徴とする文書検
索方法。
【請求項２】請求項１記載の文書検索方法における複
合条件判定ステップとして、検索条件式中に指定された検索語間の近接距離条件につ
いて判定を行う近傍条件判定ステップを有することを特
徴とする文書検索方法。
【請求項３】請求項１記載の文書検索方法における複
合条件判定ステップとして、検索条件式中に指定された検索語の同一句、同一文、あ
るいは同一段落内での共起条件について判定を行う文脈
条件判定ステップを有することを特徴とする文書検索方
法。
【請求項４】請求項１記載の文書検索方法における複
合条件判定ステップとして、検索条件式中に指定された検索語間の論理条件について
判定を行う論理条件判定ステップを有することを特徴と
する文書検索方法。
【請求項５】請求項１記載の文書検索方法における複
合条件判定処理ステップとして、検索条件式中に指定された検索語間の近接距離条件につ
いて判定を行う近傍条件判定ステップと、該検索条件式中に指定された該検索語の同一句、同一
文、あるいは同一段落内での共起条件について判定を行
う文脈条件判定ステップと、該検索条件式中に指定された該検索語間の論理条件につ
いて判定を行う論理条件判定ステップを有することを特
徴とする文書検索方法。
【請求項６】請求項５記載の文書検索方法において、文字列照合ステップとして、文書中に指定検索語が照合
された場合、該文書の識別子を含む文書識別子と照合さ
れた検索語の識別子および該文書中における照合検索語
の先頭文字位置と末尾文字位置を照合情報として出力
し、文脈条件が指定され、文脈を識別する文字列が照合
された場合、該文書の識別子と照合された文脈識別文字
列の識別子および該文書中における該照合文脈識別文字
列の先頭位置と末尾位置を照合情報として出力するとと
もに、複合条件判定ステップを構成する近傍条件判定ステッ
プ、文脈条件判定ステップ、及び論理条件判定ステップ
において、近傍条件判定ステップでは前記文字列照合ステップで出
力された照合情報に基づいて検索条件式に指定された検
索語間の文字数で表した近接距離条件について判定を行
い、条件に合致した前方に位置する検索語の先頭文字位
置と後方に位置する検索語の末尾文字位置を判定結果の
照合情報として、これを前記文字列照合ステップで出力
された照合情報に付加して出力し、文脈条件判定ステップでは前記近傍条件判定ステップで
出力された照合情報に基づいて該検索条件式中に指定さ
れた検索語の同一句、同一文、あるいは同一段落内での
共起条件について判定を行い、条件に合致した前方に位
置する文脈識別文字列の先頭文字位置と後方に位置する
文脈識別文字列の末尾文字位置を照合情報として、これ
を前記近傍条件判定ステップで出力された照合情報に付
加して出力し、論理条件判定ステップでは前記文脈条件判定ステップで
出力された照合情報に基づいて該検索条件式中に指定さ
れた該検索語間の論理条件について判定を行い、条件に
合致した文書単位の照合情報を最終的な検索結果情報と
して出力することを特徴とする文書検索方法。
【請求項７】文字コードとして蓄積された文書データ
ベースを対象として検索条件式中に指定された検索語を
含む文書を検索する文書検索装置において、文書中に指定検索語が照合された場合、該文書の識別子
を含む文書識別情報と照合された検索語の識別子および
該文書中における照合位置とを照合情報として出力する
文字列照合手段と、該文字列照合手段で出力された照合情報を基に前記検索
条件式中に指定された検索語間の位置関係に関する検索
条件を判定し、検索条件に合致したことを示す判定結果
の照合情報を作成し検索結果として出力する複合条件判
定手段から構成されることを特徴とする文書検索装置。
【請求項８】請求項７記載の文書検索装置における複
合条件判定手段として、検索条件式中に指定された検索語間の近接距離条件につ
いて判定を行う近傍条件判定手段を備えることを特徴と
する文書検索装置。
【請求項９】請求項７記載の文書検索装置における複
合条件判定手段として、検索条件式中に指定された検索語の同一句、同一文、あ
るいは同一段落内での共起条件について判定を行う文脈
条件判定手段を備えることを特徴とする文書検索装置。
【請求項１０】請求項７記載の文書検索装置における
複合条件判定手段として、検索条件式中に指定された検索語間の論理条件について
判定を行う論理条件判定手段を備えることを特徴とする
文書検索装置。
【請求項１１】請求項７記載の文書検索装置における
複合条件判定処理手段として、検索条件式中に指定された検索語間の文字数で表した近
接距離条件について判定を行う近傍条件判定手段と、該検索条件式中に指定された該検索語の同一句、同一
文、あるいは同一段落内での共起条件について判定を行
う文脈条件判定手段と、該検索条件式中に指定された該検索語間の論理条件につ
いて判定を行う論理条件判定手段を備えることを特徴と
する文書検索装置。