JPH05307566A - 並列処理型内容検索装置 - Google Patents

並列処理型内容検索装置

Info

Publication number
JPH05307566A
JPH05307566A JP4111298A JP11129892A JPH05307566A JP H05307566 A JPH05307566 A JP H05307566A JP 4111298 A JP4111298 A JP 4111298A JP 11129892 A JP11129892 A JP 11129892A JP H05307566 A JPH05307566 A JP H05307566A
Authority
JP
Japan
Prior art keywords
processor
parallel processing
processing type
processor element
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4111298A
Other languages
English (en)
Inventor
Ichigaku Asano
一学 浅野
Hiroshi Mori
啓 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP4111298A priority Critical patent/JPH05307566A/ja
Publication of JPH05307566A publication Critical patent/JPH05307566A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 分割部分の処理を連結するための余分な通信
を不要にして、検索時間を短縮した並列処理型内容検索
装置を提供する。 【構成】 各々記憶装置111〜114を有する複数の
プロセッサ要素101〜104が相互結合網を介して接
続されたマルチプロセッサからなり、テキスト情報を各
プロセッサ要素101〜104の記憶装置111〜11
4に分割して格納する手段と、格納されたテキスト内容
を比較して必要な情報を検索する手段とを備えた並列処
理型内容検索装置であって、テキスト格納順で次のプロ
セッサ要素に格納している続き部分と一定の長さ分重複
させて格納する手段を備えている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数のプロセッサ要素
に文献検索、新聞記事検索等のテキスト情報を分割して
格納しておき、格納されたテキスト内容を比較して必要
な情報を検索する内容検索装置に関するものである。
【0002】
【従来の技術】図3は、従来の並列処理型内容検索装置
の問題点を説明するための図であり、301,302,
303,…,304はプロセッサ要素、311,31
2,313,…,314はそれぞれプロセッサ要素30
1,302,303,…,304に接続された記憶装置
で文献等のテキスト情報を分割して格納している。32
0は各プロセッサ要素への検索の指示の送出及び各プロ
セッサ要素から検索結果を受信し、まとめる処理を行う
制御プロセッサ、330はプロセッサ要素相互間、及び
制御プロセッサとプロセッサ要素間の通信を伝達する相
互結合網である。
【0003】特定の文字列(例えば「レジスタ」等)を
含んでいる文献等を検索する場合、制御プロセッサ32
0は、検索開始の指示とともに、特定の文字列をプロセ
ッサ要素301〜304へ送る。プロセッサ要素301
〜304では、それぞれ記憶装置311〜314に格納
されているテキスト情報を読み出して、制御プロセッサ
320から送られた特定の文字列が含まれていないか比
較を行う。特定の文字列が含まれていた場合は、プロセ
ッサ要素301〜304は、文書の識別名等必要な情報
を制御プロセッサ320へ送信する。制御プロセッサ3
20は、プロセッサ要素301〜304から受信した文
書の識別名等をまとめて、装置全体としての検索結果を
作成する。
【0004】従来装置では、テキスト情報を各プロセッ
サ要素301〜304の記憶装置311〜314に分割
して格納する場合、単純に一定量毎に分けて格納してい
る。このため、検索の対象となる単語等の特定文字列が
2つのプロセッサ要素に分割される可能性がある。図3
では、文字列「レジスタ」が記憶装置311と312に
分割されている。また、文字列「カウンタ」が文書1で
は、記憶装置314と311に分割され、文書2では、
記憶装置312と313に分割されている。記憶装置3
11と312に分割されている文字列「レジスタ」を検
索する場合を例に説明する。以下の3つの方法がある。
【0005】第1の方法は、プロセッサ要素301で
「レジス」まで一致した時点で分割部分に到達すると、
プロセッサ要素302へ文書1の第1分割部分で「レジ
ス」まで検出した旨を送信する。これを受信したプロセ
ッサ要素302では、文書1の第1分割部分に連続した
部分が特定文字列の続きの部分「タ」であるかを判定
し、一致すれば、文書の識別名等を制御プロセッサ32
0へ送信する。
【0006】第2の方法は、プロセッサ要素301で
「レジス」まで一致した時点で分割部分に到達すると、
プロセッサ要素302へ文書1の第1分割部分に連続し
た特定文字列の残文字数分(この例では1文字)を送信
依頼する。プロセッサ要素302は、この依頼を受け
て、該当の文字数分のテキストを送信する。プロセッサ
要素301では、この受け取ったテキストを特定文字列
の残文字「タ」と比較し、一致すれば、文書の識別名等
を制御プロセッサ320へ送信する。
【0007】第3の方法は、プロセッサ要素301は、
「レジス」まで一致した時点で分割部分に到達すると、
制御プロセッサ320へ文書1の第1分割部分で「レジ
ス」まで検出した旨を送信する。プロセッサ要素302
では、プロセッサ要素301の動作とは独立して、分割
部分に連続した部分については特定文字列の途中からの
文字列(この例では、「ジスタ」、「スタ」、「タ」)
と比較し、これらに一致すれば、制御プロセッサ320
へ文書1の第1分割部分に連続して「タ」を検出した旨
を送信する。制御プロセッサ320では、プロセッサ要
素301と302からの報告を合わせて、特定の文字列
が検出されたかを判定する。
【0008】
【発明が解決しようとする課題】前記従来装置では、検
索しようとしている特定文字列が2つのプロセッサ要素
に分割されて格納されると、2つのプロセッサ要素間、
または制御プロセッサとプロセッサ要素間の余分な通信
が必要となり、検索時間が増加するという問題があっ
た。
【0009】本発明は、前記問題点を解決するためにな
されたものであり、その目的とするところは、分割部分
の処理を連結するための余分な通信を不要にして、検索
時間を短縮した並列処理型内容検索装置を提供すること
にある。
【0010】本発明の前記ならびにその他の目的及び新
規な特徴は、本明細書の記述及び添付図面によって明ら
かにする。
【0011】
【課題を解決するための手段】前記目的を達成するため
に、本発明は、各々記憶装置を有する複数のプロセッサ
要素が相互結合網を介して接続されたマルチプロセッサ
からなり、テキスト情報を各プロセッサ要素の記憶装置
に分割して格納する手段と、格納されたテキスト内容を
比較して必要な情報を検索する手段とを備えた並列処理
型内容検索装置であって、テキスト格納順で次のプロセ
ッサ要素に格納している続き部分と一定の長さ分重複さ
せて格納する手段を備えたことを最も主要な特徴とす
る。
【0012】
【作用】前述の手段によれば、重複格納部分の長さより
短い文字列を検索する場合、重複格納部分内で特定文字
列の検索が完了し、次のプロセッサと処理を連結する必
要がない。
【0013】
【実施例】以下、図面を参照して、本発明の一実施例を
詳細に説明する。
【0014】図1は、本発明の実施例の並列処理型内容
検索装置の概略構成を示すブロック構成図である。図1
において、101,102,103,…,104はプロ
セッサ要素、111,112,113,…,114はそ
れぞれプロセッサ要素101,102,103,…,1
04に接続された記憶装置で文献等のテキスト情報を分
割して格納している。120は各プロセッサ要素への検
索の指示の送出及び各プロセッサ要素からの検索結果を
受信し、まとめる処理を行う制御プロセッサ、130は
プロセッサ要素相互間、及び制御プロセッサとプロセッ
サ要素間の通信を伝達する相互結合網である。
【0015】本実施例では、テキスト情報を各プロセッ
サ要素101〜104の記憶装置111〜114に分割
して格納する場合、テキスト格納順で次のプロセッサ要
素の記憶装置に格納している続きの部分と一定の長さ分
重複させて格納している(図1の斜線部分)。
【0016】本実施例の並列処理型内容検索装置による
検索の動作を図2を用いて説明する。
【0017】図2において、201は記憶装置111に
格納されている文書である。斜線部分は記憶装置112
と重複して記憶している部分である。特定文字列「レジ
スタ」を比較する場合、重複格納部分の長さが特定文字
列「レジスタ」以上なので、テキスト格納順で次のプロ
セッサ要素への連続の処理は不要である。
【0018】単独プロセッサでの内容検索処理と異なる
点は、格納されている文書202のように斜線部分に特
定文字列すべてが含まれている場合、すなわち、特定文
字列の先頭が重複格納部分にある場合は、一致したとは
みなされない点である。この場合はテキスト格納順で次
のプロセッサ要素で一致が検出される。
【0019】重複格納部分より長い特定文字列の検索の
場合は、従来の装置と同様の動作を行う。なお、プロセ
ッサ要素内での文字列検索のアルゴリズムは、テキスト
情報を1文字ずつシフトして特定文字と比較する方法、
有限状態オートマトン法等の従来装置と同じものが使用
できる。以上のように、重複格納部分の長さより短い文
字列を検索する場合、従来装置で発生するような余分な
通信が不要なので、検索時間を短くすることができる。
【0020】以上、本発明を実施例に基づき具体的に説
明したが、本発明は、前記実施例に限定されるものでは
なく、その要旨を逸脱しない範囲において種々変更し得
ることはいうまでもない。
【0021】
【発明の効果】以上、説明したように、本発明によれ
ば、重複格納部分の長さより短い文字列を検索する場
合、従来装置で発生するような分割部分の処理を連結す
るための余分な通信が不要となるので、検索時間を短く
することができる。
【図面の簡単な説明】
【図1】 本発明の一実施例の並列処理型内容検索装置
の概略構成を示すブロック構成図、
【図2】 図1の並列処理型内容検索装置による検索の
動作を説明するための重複格納部分を示す図、
【図3】 従来の内容検索装置の問題点を説明するため
の図。
【符号の説明】
101〜104…プロセッサ要素、111〜114…記
憶装置、120…制御プロセッサ、130…相互結合
網、201,202…格納されている文書、301〜3
04…プロセッサ要素、311〜314…記憶装置、3
20…制御プロセッサ、330…相互結合網。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 各々記憶装置を有する複数のプロセッサ
    要素が相互結合網を介して接続されたマルチプロセッサ
    からなり、テキスト情報を各プロセッサ要素の記憶装置
    に分割して格納する手段と、格納されたテキスト内容を
    比較して必要な情報を検索する手段とを備えた並列処理
    型内容検索装置であって、テキスト格納順で次のプロセ
    ッサ要素に格納している続き部分と一定の長さ分重複さ
    せて格納する手段を備えたことを特徴とする並列処理型
    内容検索装置。
JP4111298A 1992-04-30 1992-04-30 並列処理型内容検索装置 Pending JPH05307566A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4111298A JPH05307566A (ja) 1992-04-30 1992-04-30 並列処理型内容検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4111298A JPH05307566A (ja) 1992-04-30 1992-04-30 並列処理型内容検索装置

Publications (1)

Publication Number Publication Date
JPH05307566A true JPH05307566A (ja) 1993-11-19

Family

ID=14557681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4111298A Pending JPH05307566A (ja) 1992-04-30 1992-04-30 並列処理型内容検索装置

Country Status (1)

Country Link
JP (1) JPH05307566A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100402913B1 (ko) * 1994-08-31 2004-03-26 프라이스 워터하우스 엘엘피 데이타베이스검색을위한병렬처리시스템

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100402913B1 (ko) * 1994-08-31 2004-03-26 프라이스 워터하우스 엘엘피 데이타베이스검색을위한병렬처리시스템

Similar Documents

Publication Publication Date Title
JP2589777B2 (ja) 知識システム
US6088705A (en) Method and apparatus for loading data into a database in a multiprocessor environment
JPS5846742B2 (ja) 対話式デ−タ検索装置
JPS61193266A (ja) 情報検索システム
JP2003509733A5 (ja)
JPH05307566A (ja) 並列処理型内容検索装置
JPH0392942A (ja) ファイルの格納方法およびアクセス方法
CN1009317B (zh) 分布式处理系统中的数据处理方法
JP2524450B2 (ja) 検索システム
JPH05303594A (ja) 並列処理型内容検索装置
JPH0728836A (ja) データベース検索方法及びこの方法を用いたデータベースシステム
JP2520941B2 (ja) デ―タベ―ス・テ―ブルを検索する方法
JPH08235218A (ja) オブジェクト指向データベース管理システムにおける問い合わせの分割処理方式
JPH0218641A (ja) データ管理方法
JPH04257062A (ja) ハッシュキューを用いるデータ処理装置
JPH04315260A (ja) 文字列照合方式
JPH02127742A (ja) 空き領域検索方式
JPH02259863A (ja) 分散処理型エディタ
JPH02282840A (ja) ジャーナル出力方式
JPH07253918A (ja) 分散データベースアクセス方式
JP2895892B2 (ja) データ処理装置
JPH0281229A (ja) 定数登録処理方式
JPS616746A (ja) 部分書込み制御方式
JPH05143276A (ja) 入出力制御装置
JPH01300741A (ja) 伝送データ径路履歴格納方式