JPH0354625A - Cluster type magnetic disk device - Google Patents

Cluster type magnetic disk device

Info

Publication number
JPH0354625A
JPH0354625A JP1188772A JP18877289A JPH0354625A JP H0354625 A JPH0354625 A JP H0354625A JP 1188772 A JP1188772 A JP 1188772A JP 18877289 A JP18877289 A JP 18877289A JP H0354625 A JPH0354625 A JP H0354625A
Authority
JP
Japan
Prior art keywords
magnetic disk
disk device
input
file
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1188772A
Other languages
Japanese (ja)
Inventor
Noriyuki Kaneoka
則幸 兼岡
Mitsuo Oyama
大山 光男
Kanji Kato
加藤 寛次
Hisamitsu Kawaguchi
川口 久光
Hiromichi Fujisawa
藤沢 浩道
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP1188772A priority Critical patent/JPH0354625A/en
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to DE69032712T priority patent/DE69032712T2/en
Priority to EP90909360A priority patent/EP0437615B1/en
Priority to PCT/JP1990/000774 priority patent/WO1990016036A1/en
Priority to US07/555,483 priority patent/US5168533A/en
Publication of JPH0354625A publication Critical patent/JPH0354625A/en
Priority to US07/843,162 priority patent/US5469354A/en
Priority to US07/914,334 priority patent/US5220625A/en
Priority to US07/985,795 priority patent/US5519857A/en
Priority to US08/031,625 priority patent/US5471610A/en
Priority to US08/031,700 priority patent/US5454105A/en
Priority to US08/444,842 priority patent/US5748953A/en
Priority to US08/839,407 priority patent/US6094647A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Automatic Disk Changers (AREA)

Abstract

PURPOSE:To input/output plural files successively by satisfying fast transfer speed by requested by host equipment, and comprising the device of the minimum number of magnetic disk devices corresponding to the capacity of a data base to store data. CONSTITUTION:The device is comprised of (n) data memory devices 15 having the magnetic disk device 1, an input/output buffer 3 with the capacity of one cylinder of the magnetic disk device 1 connected to each of the memory devices, respectively, and a multi-disk controller 4 which controls them. Assuming data transfer speed from the magnetic disk device to the input/output buffer as tByte/sec, and the rotating speed of the magnetic disk device as Rrps, the device is comprised of the minimum number of data memory devices which satisfies conditions I and II as equation II in the case of being less than equation I when the minimum seek time of the magnetic disk device exceeds a time M/ Tsec to transfer the data of MByte of one input/output buffer to the host equipment. In such a way, it is possible to input/output the plural files large in memory capacity successively and at high speed in spite of the size of the file.

Description

【発明の詳細な説明】[Detailed description of the invention] 【産業上の利用分野】[Industrial application field]

本発明は外部記憶装置において、記憶容量が大きく,短
時間の書き込み,読み出しが可能な集合型磁気ディスク
装置、ならびに、複数件のファイルの連続書き込み,読
み出しに適した集合型磁気ディスク装置、および,集合
型磁気ディスク装置のデータ格納構造に関する。
The present invention relates to an external storage device, including a collective magnetic disk device with a large storage capacity and capable of writing and reading in a short time, a collective magnetic disk device suitable for continuous writing and reading of multiple files, and This invention relates to a data storage structure of a collective magnetic disk device.

【従来の技術】[Conventional technology]

近年、文献情報や特許情報などの2次情報(書誌情報)
のみならず、1次情報(本文)をも含む大規模データベ
ース・サービスの重要性が増している.このようなデー
タベースの情報検索では、従来、キーワードや分類コー
ドによる方法が用いられてきている.しかし、この方法
では数十件から数百件までにしか絞り込めないため、検
索者が最終段階で直接本文を読んで内容を確認しなけれ
ばならないという効率上の問題がある。また、分類体系
自体が年月と共に変化するため、常にキーワードや分類
コードを更新しなければならないという問題も生じてく
る。更に、キーワード付け(インデキシングと言う)に
は時間がかかるため新たな文書はバッチ処理によりかな
りの量をまとめて登録する.そのため、検索できる登録
された情報は常に一定期間の遅れを持つという問題があ
った。 これらの問題に対処する一つの方法として、検索者が自
由なキーワードに基づいて文書の本文を直接参照して内
容を検索できる全文検索システムが考えられている。 一方、このような全文検索システムを目指した文字列検
索装置がいくつか提案されている。その代表的な構戊を
第2図に示し、まず、その内容について説明する。 文字列検索装置101において、検索制御手段102は
検索装置全体の制御と、ホストコンピュータから送られ
てくる検索要求を受け付け、これを解析し、文字列照合
手段105と複合条件判別千段104へ検索情報として
送出する。また、検索制御手段1−02はディスク制御
手段103を制御して、文字列記憶手段106に格納さ
れる文字列データを文字列照合手段へ送り込む。 文字列照合手段105は入力文字データの中に検索要求
に合致するものがあるかどうかを調べ、もし該当するも
のがあれば、文字列を識別する情報を複合条件判別手段
1. 0 4へ出力する。複合条件判別手段104は該
文字列識別情報に基づいて検索要求中に指定された相互
の位置関係などの複合条件が満足するか否かを調べる。 複合条件が潤足する場合には、該当する文書へのポイン
タ情報や文書内容のテキストデータを検索結果としてホ
ストコンピュータへ返送する。 文字列検索装置1. 0 1の構戊要素である文字列記
憶手段106として大規模なデータの記憶ができる磁気
ディスク装置が必要となる。一般の磁気ディスク装置は
データの入出力が高速にできない問題があり、また、デ
ータの入出力が高速にできるマルチヘッド型の磁気ディ
スク装置は非常に高価であるという問題があった。 そこで、安価な一般の小型磁気ディスクを複数台接続し
てデータの入出力の速度を高速化する集合型の磁気ディ
スク装置が考えられてきた。そのひとつとして特開昭6
 0 − 1. 1 7 3 2 6号公報記載の「画
像データ分割記憶装置Jがある。 この装置は複数台の磁気ディスク装置を有し、磁気ディ
スク装置と同数の磁気ディスクコントローラ,入出力バ
ッファと外部装置との間のデータ転送を制御するマスク
コントローラによって構威し,外部装置から入力したデ
ータをマスタコントローラにおいて、入出力バソファの
容量以下に分割し、その分割したデータを各磁気ディス
クコントローラに順次転送し、該磁気ディスクコントロ
ーラは対応する磁気ディスク装置に書き込む。マスクコ
ントローラは書き込みを行なっていない磁気ディスク装
置の磁気ディスクコントローラに対し、シーク動作を行
なわせることによって、データを格納する複数の磁気デ
ィスク装置の2台目以降の、シーク時間を見掛け上なく
し、データの書き込み,読み出し時間を短縮しようとす
るものである。 (発明が解決しようとする課題) 文字列検索装置の文字列記憶手段で重嬰となる要素は、
記憶容量が大きいこと,ファイルのサイズにかかわらず
、複数のファイルを連続的に高速で入出力できること、
安価であることの3点であり、これらの要素を満足する
集合型磁気ディスク装置の開発が必要であった。 従来技術では、ただシーク時間のアクセス時間を見掛け
」二なくすことにより、データの書き込み,読み出し時
間を短縮しようとするもので、外部機器の要求するデー
タ転送速度に対して何台の磁気ディスク装置を用いて構
成すれば良いかについて配慮されておらずコストパフォ
ーマンスの点で問題があった。 また、従来技術は画像データのようにデータサイズの大
きなファイルが複数の磁気ディスク装置にまたがるよう
な場合にはアクセス時間を削減できる効果があるが、複
数の磁気ディスク装置にまたがらないデータサイズの小
さなファイルの書き込み,読み出しを行なう場合には、
シーク時間を隠すことができず,1介の磁気ディスク’
jArlと同じアクセス時間となってしまう問題があっ
た。 また、従来技術は複数のファイルの連続的な書き込み,
読み出しを行なう点に配慮がされておらず、上位機器か
らの書き込み,読み出し命令を1件のファイルについて
のみ処理可能で,複数のファイルをアクセスする場合に
は、1件の処理を繰返し行なう必要があり、それに要す
るオーバヘッド時間が長くなってしまう問題があった。 また、オーバヘッド時間のひとつとして、上位機器から
アクセス対象となるファイルを指定するためのファイル
識別コードから磁気ディスク装置の格納位置情報を検索
する処理がある。従来の一般的な磁気ディスク装置では
、ファイル識別コードとしてASCIIコード等の文字
コード列で構戒されるファイル名称で表現されており、
このファイル名称により,磁気ディスク装置のファイル
管理情報エリアに格納されているファイル管理情報を検
索して物理的な格納位置を求めなければならず、それに
要する処理時間が大きい問題があった。 本発明の目的は、記憶容量が大きい、ファイルのサイズ
にかかわらず複数のファイルを連続的に高速に入出力で
きる,安価な集合型磁気ディスク装置を提供するもので
ある。 [発明が解決するための手段】 上記目的を達成するために以下の手段を採用した 集合型磁気ディスク装置を、磁気ディスク装置を有する
複数台のデータ記憶装置と、データ記憶装置へ入出力す
るデータを一時格納する入出力バッファと、データ記憶
装置と入出力バッファの制御を行なうマルチディスクコ
ントローラとによって構威したものである。 さらに、データ記憶装置を、磁気ディスクコントローラ
を有するl台の磁気ディスク装置によって構成するか、
または、磁気ディスクコントローラを有する複数台の磁
気ディスク装置と、磁気ディスク装置を選択するマルチ
プレクサとによって構成したものである。 さらに,入出力バッファは、上記データ記憶装置装置と
、複数台につき、磁気ディスク装置の少なくとも1シリ
ンダ分の容量を持ち、1面、また、2面の半導体メモリ
によって構成する。 なお、メモリは半導体記憶素子以外の光メモリ等の高速
記憶素子を用いて実現することもできる。 データ記憶装置と入出力バッファの制御を行うマルチデ
ィスクコントローラは、上位機器からの要求を格納する
半導体記憶素子を用いた通信メモリと,データ転送の制
御を行なうマルチプレクスコントローラと、磁気ディス
ク装置内の物理的格納位置を検索するための半導体記憶
素子を用いた物理情報テーブルと、それらを制御するマ
スタコントローラとによって構成している.なお、通信
メモリ,物理情報テーブルは半導体記憶素子以外の光メ
モリ等の高速記憶素子を用いて実現することもできる. なお、マスクコントローラは、マイクロコンピュータを
使用し、各構成要素を制御するものである. さらにマルチディスクコントローラに,ファイル識別子
として、階層的なグループに分類する論理分類を行なっ
たファイルの該論理分類固有の識別コードである論理分
類よりと、該論理分類内の固有の番号とによって構戒す
るファイルIDを用いるようにしたものである。 また、マルチディスクコントローラでは、ファイルID
内の論理分類IDに従い、ファイルの磁気ディスク装置
への物理的格納位置を決定する管理情報を格納した構造
定義テーブルをマスクコントローラのメモリ内に持つよ
うにしたものである。 上位機器と入出力バッファ間のデータ転送の制御を行な
うマルチプレクスコントローラは、入出力バッフアのデ
ータバスを選択するマルチプレクサと、マスクコントロ
ーラの介在なしにデータ転送を行なうDMAコントロー
ラと、データ転送が必要な範囲の入出力パッファの先頭
アドレスを格納する先頭アドレス登録テーブルと、終了
アドレスを格納する終了アドレス登録テーブルとによっ
て構成したものである。
In recent years, secondary information such as literature information and patent information (bibliographic information)
Large-scale database services that include not only primary information (text) but also primary information (text) are becoming increasingly important. Conventionally, methods using keywords and classification codes have been used to search for information in such databases. However, this method only narrows down the results from a few dozen to a few hundred, and there is an efficiency problem in that the searcher must directly read the text to confirm the content at the final stage. Furthermore, since the classification system itself changes over time, the problem arises that keywords and classification codes must be constantly updated. Furthermore, since adding keywords (referred to as indexing) takes time, new documents are registered in batches in large quantities. Therefore, there has been a problem that registered information that can be searched always has a certain period of delay. As one method for dealing with these problems, a full-text search system is being considered that allows a searcher to directly refer to the text of a document and search for content based on free keywords. On the other hand, several character string search devices aiming at such a full-text search system have been proposed. A typical structure thereof is shown in FIG. 2, and its contents will be explained first. In the string search device 101, the search control means 102 controls the entire search device, receives search requests sent from the host computer, analyzes them, and sends the search to the string matching means 105 and the compound condition discrimination stage 104. Send as information. The search control means 1-02 also controls the disk control means 103 to send the character string data stored in the character string storage means 106 to the character string collation means. The character string matching means 105 checks whether there is anything in the input character data that matches the search request, and if there is any matching, the character string matching means 105 passes information identifying the character string to the complex condition determining means 1. Output to 04. The compound condition determining means 104 checks whether compound conditions such as mutual positional relationship specified in the search request are satisfied based on the character string identification information. If the compound conditions are satisfied, pointer information to the corresponding document and text data of the document content are returned to the host computer as search results. Character string search device 1. A magnetic disk device capable of storing a large amount of data is required as the character string storage means 106, which is a component of 0.01. General magnetic disk drives have the problem of not being able to input and output data at high speeds, and multi-head magnetic disk drives that can input and output data at high speeds are extremely expensive. Therefore, a collective type magnetic disk device has been considered in which a plurality of inexpensive general small magnetic disks are connected to increase the data input/output speed. One of them is the Japanese Patent Publication No. 6
0-1. There is an "Image data division storage device J" described in Publication No. 17326. This device has multiple magnetic disk devices, and has the same number of magnetic disk controllers, input/output buffers, and external devices as the magnetic disk devices. The master controller divides data input from an external device into pieces that are less than the capacity of the input/output bus sofa, and sequentially transfers the divided data to each magnetic disk controller. The magnetic disk controller writes to the corresponding magnetic disk device.The mask controller causes the magnetic disk controller of the magnetic disk device that is not writing to perform a seek operation, so that two of the plurality of magnetic disk devices that store data are stored. This is an attempt to apparently eliminate the seek time after the second one and shorten the time for writing and reading data. (Problem to be solved by the invention) An important element in the string storage means of a string search device. teeth,
Large storage capacity, ability to input and output multiple files continuously at high speed regardless of file size,
There were three points: low cost, and it was necessary to develop a collective magnetic disk device that satisfied these factors. Conventional technology attempts to shorten data writing and reading time by simply eliminating the access time of seek time, and it is difficult to reduce the number of magnetic disk drives needed to meet the data transfer speed required by external equipment. There was a problem in terms of cost performance as there was no consideration given to whether it should be used in the configuration. In addition, the conventional technology has the effect of reducing access time when a file with a large data size such as image data spans multiple magnetic disk drives, but when the data size does not span multiple magnetic disk drives, When writing or reading small files,
Unable to hide seek time, only one magnetic disk'
There was a problem that the access time was the same as jArl. In addition, the conventional technology continuously writes multiple files,
No consideration is given to the point of reading, and write and read commands from the host device can only be processed for one file, and when accessing multiple files, it is necessary to repeatedly perform one process. However, there is a problem in that the overhead time required for this becomes long. Further, as one of the overhead times, there is a process of searching storage location information of the magnetic disk device from a file identification code for specifying a file to be accessed from a host device. In conventional general magnetic disk drives, the file identification code is expressed as a file name that is a string of character codes such as ASCII code.
This file name requires searching the file management information stored in the file management information area of the magnetic disk device to find the physical storage location, which poses a problem in that the processing time required is large. SUMMARY OF THE INVENTION An object of the present invention is to provide an inexpensive collective magnetic disk device that has a large storage capacity and can input and output multiple files continuously at high speed regardless of the file size. [Means for Solving the Invention] In order to achieve the above object, a collective magnetic disk device employing the following means is provided with a plurality of data storage devices each having a magnetic disk device, and data to be input/output to the data storage device. It consists of an input/output buffer that temporarily stores data, and a multi-disk controller that controls the data storage device and the input/output buffer. Furthermore, the data storage device is configured by l magnetic disk devices each having a magnetic disk controller, or
Alternatively, it is configured by a plurality of magnetic disk devices each having a magnetic disk controller and a multiplexer for selecting the magnetic disk devices. Furthermore, the input/output buffer has a capacity equivalent to at least one cylinder of a magnetic disk device for each of the data storage devices, and is constituted by semiconductor memory on one or two sides. Note that the memory can also be realized using a high-speed storage element such as an optical memory other than a semiconductor storage element. The multi-disk controller, which controls data storage devices and input/output buffers, consists of a communication memory using semiconductor storage elements that stores requests from higher-level devices, a multiplex controller that controls data transfer, and a multi-disk controller that controls data transfer. It consists of a physical information table using semiconductor memory elements to search for physical storage locations, and a master controller to control them. Note that the communication memory and physical information table can also be realized using high-speed storage elements such as optical memory other than semiconductor storage elements. Note that the mask controller uses a microcomputer to control each component. Furthermore, the multi-disk controller uses the logical classification, which is an identification code unique to the logical classification of files that have been logically classified into hierarchical groups, as well as a unique number within the logical classification, as a file identifier. In this case, the file ID is used. In addition, in a multi-disk controller, the file ID
The mask controller has a structure definition table in its memory that stores management information for determining the physical storage location of a file in the magnetic disk device according to the logical classification ID in the file. The multiplex controller controls data transfer between the host device and the input/output buffer, and includes a multiplexer that selects the data bus for the input/output buffer, a DMA controller that transfers data without the intervention of a mask controller, and a DMA controller that controls data transfer between the host device and the input/output buffer. It consists of a start address registration table that stores the start address of the input/output puffer in the range, and an end address registration table that stores the end address of the range.

【作用】[Effect]

上記技術手段の働きを以下に述べる6 データ記憶装置がn台、データ記憶装置内の上記磁気デ
ィスク装置の転送データがトラック間にまたがらずシー
ク動作を行なわないときの磁気ディスク装置から入出力
バ ッファヘのデータ転送速度をを [ B yte/ s
ec]、ディスク装置の1シリンダ分の容量をM [B
ytel,磁気ディスク装置の最小シーク時間をs [
seel .磁気ディスク装置の回転速度をR [rp
s] 、出力バッファの容量を上記磁気ディスク装置の
1シリンダ分の容量M[Bytelと同一とした場合に
、集合型磁気ディスク装置から上位機器へのデータ転送
速度T [ B yte/ seclは以下の条件を満
足する必要がある。 磁気ディスク装置の最小シーク時間s [seclが1
つの上記入出力バッファのM[Byte]のデータを上
位機器に転送する時間(M/T) [seclより大き
い場合、データ記憶装置から出力バッファ八のデータ転
送時間は、磁気ディスク装置の最小シーク時間s [s
eclと,磁気ディスク装置の最大回転待ち時間( 1
 / R )  [see]と、データ記憶装置から入
出力バッファへのデータ転送時間(M/t)  [se
c]の合計時間で、これが、全ての入出力バッファのデ
ータを上位機器に転送する時間(nM/T)  [se
c]以内で動作すればよい。 これを数式で表すと のようになり、データ記憶装置の台数nは次式のように
書き表すことができる。 また、磁気ディスク装置の最小シーク時間5 [sec
]が1つの入出力バツファのM[Byteコのデータを
上位機器に転送する時間(M/T)[seC]以下の場
合には、磁気ディスク装置がシーク動作を終了しても磁
気ディスク装置からデー夕転送を行なおうとする入出力
バッファが、上記機器へのデータ転送を行っているため
にデータ記憶装置から入出力バッフアへのデータ転送が
できない。そのため、入出力バッファから上位機器への
データ転送が終了するまで待つ必要がある。そこで、デ
ータ記憶装置から入出力バッファへのデータ転送時間は
、1つの入出力バッファから上位機器へのデータ転送時
間(M / T )  [seclと、磁気ディスク装
置の最大回転待ち時間(1/R)[sec]とデータ記
憶装置から入出力バッファへのデータ転送時間(M /
 t )  [seclの合計時間が、全ての入出力バ
ッファのデータを上位機器に転送する時間(nM/T)
  [sec]以内で動作すればよい.これを数式で表
すと のようになり、データ記憶装置の台数nは次式のように
書き表すことができる。 これらの条件式を満足する最小台数のデータ記憶装置で
集合型磁気ディスク装置を構或することで、上位機器の
要求するデータ転送速度を満足するコストパフォーマン
スの良い磁気ディスクitを提供することができる。 データ記憶装置は、データファイルの記憶を行なう。デ
ータ記憶装置を磁気ディスクコントローラを有する磁気
ディスク装置で構或することによって、磁気ディスクへ
のデータの書き込み,読み出し制御を該磁気ディスクコ
ントローラが行ない、マルチディスクコントローラの処
理が軽減される。 また、データ記憶装置を複数台の磁気ディスク装置と、
磁気ディスク装置のデータパスを上記入出力バッフアの
データバスに選択して接続するマルチプレクサにより構
或することにより、記憶容量を大きくすることができる
。 入出力バッファはデータ記憶装置に入出力するデータの
一時格納を行なう。 書き込みの場合、データ記憶装置内の磁気ディスク装置
の書き込み速度より早い速度で、上位機器から入出力バ
ッファに次々とデータの転送を行ない、データ転送が終
了した入出力バッファは磁気ディスク装置へ磁気ディス
ク装置の書き込み速度でデータの書き込みを行なう。読
み出しの場合、それぞれの磁気ディスク装置は磁気ディ
スク装置の読み出し速度で入出力バッファへのデータの
読み出しを行ない,読み出しが終了した入出力バッファ
は、磁気ディスク装置の読み出し速度よりも早い速度で
、上位機器へのデータの転送を行なう.これにより、上
位機器へのデータの入出力を磁気ディスク装置の書き込
み,読み出し速度よりも早い速度で行なうことができる
。 さらに入出力バッファをデータ記憶装置装置と、複数台
につき2面持つことにより,第l面の入出力バッファが
上位機器とデータ転送している間に、第2面の入出力バ
ッファがデータ記憶装置との書き込み,読み出しを行な
える。これにより上位機器とのデ一夕転送が終了するま
で磁気ディスク装置がデータの転送動作を待つ時間を削
減でき、書き込み,読み出しが短時間に行なえる。この
ときの上位機器の要求するデータ転送速度を満足するコ
ストパフォーマンスの良い磁気ディスク装置を提供する
条件式は、第1式で表現される。 マルチディスクコントローラは上位機器からのデータフ
ァイルの書き込み,読み出し要求に対し、データ記憶装
置と入出力バッファの制御を行なうものである.書き込
み,読み出しの対象となるファイルのファイルIDを複
数件格納できる半導体記憶素子を用いた通信メモリは、
上位機器からの命令の受理,処理の終了報告処理におけ
るオーバヘッド時間が削減され、データファイルの連続
書き込み,読み出しが短時間に行なえる.短時間にアク
セス可能な半導体記憶素子を用いた物理情報テーブルは
、論理的なファイルIDから磁気ディスク装置の物理的
格納位置を短時間に求めることができ、このため、デー
タファイルの読み出しにかかるオーバヘッド時間が短時
間になる。 また、磁気ディスク装置に格納するファイルの識別を行
なうものは、従来、可変長の文字コード列で構成される
ファイル名称であったのに対し、固定長の数値コードで
構或されるファイルIDは、小さなサイズのコードで表
現が可能で,書き込み,読み出しを行なうデータファイ
ルの指定や物理的格納位置の検索処理が単純化され、そ
れに要するオーバヘッド時間も短縮できる。 さらに,データファイルを格納する場合にも、論理的に
関係するファイルの物理的格納位置を近接させることに
より、シーク時間を短くすることができアクセス時間を
短縮できる. マルチブレクスコントローラ内のマルチプレクサは、上
記入出力バッファのデータパスを選択する.先頭アドレ
ス登録テーブルと終了アドレス登録テーブルは,入出力
バッファに格納されているデータの内、必要なデータが
格納されている範囲を指定する先頭アドレスと終了アド
レスをいくつか格納する.DMAコントローラは、先頭
アドレス登録テーブルと終了アドレス登録テーブルで指
定した範囲の入出力パッファのデータを上位機器にマス
クコントローラの介在なしで高速に転送する。 磁気ディスク装置の同一シリンダ上に読み出すファイル
が複数件ある場合に、読み出すファイルのサイズをf 
1 [Bytel v f 2 [Byte] 、その
間の読み出し不要のファイルのサイズをk [Byte
] 、磁気ディスク装置の読み出し速度をを [ B 
yte/ sec] .磁気ディスク装置の回転速度を
R [rps] 、磁気ディスク装置の平均シーク時間
をS [sec]とするとき、平均回転待ち時間は(1
/2R)  [secコであり、一度に読み出す時間が
一つづつ読み出す時間よりも短かくなる条件は、 のように表すことができる。 この数式は容易に次 式のように書き表すことができる。 f この条件式を満足する時、マルチプレクスコントローラ
は、読み出し不要のファイルも一旦入出力バッファに読
み出し、上位機器に転送する際に不要なファイルの部分
を除いて必要部分のみを転送する。これにより,磁気デ
ィスクが一度の読み出し処理で複数のファイルを読み出
すことができ、読み出し処理で発生するアクセス時間を
短くすることができる。
The operation of the above technical means will be described below.6 When there are n data storage devices and the transfer data of the above magnetic disk devices in the data storage devices does not span between tracks and does not perform a seek operation, the transfer data is transferred from the magnetic disk device to the input/output buffer. The data transfer rate is [Byte/s]
ec], the capacity of one cylinder of the disk device is M [B
ytel, the minimum seek time of the magnetic disk device is s [
seel. The rotational speed of the magnetic disk device is R [rp
s], the output buffer capacity is the same as the capacity of one cylinder of the magnetic disk device M [Byte], the data transfer rate from the collective magnetic disk device to the host device T [Byte/sec is as follows. conditions must be met. Minimum seek time s of magnetic disk device [secl is 1
The time (M/T) to transfer M [Bytes] of data from the above input/output buffers to the host device [If larger than secl, the data transfer time from the data storage device to the output buffer 8 is the minimum seek time of the magnetic disk device s [s
ecl and the maximum rotational waiting time of the magnetic disk device (1
/ R ) [see] and the data transfer time from the data storage device to the input/output buffer (M/t) [se
c], which is the time (nM/T) to transfer the data of all input/output buffers to the upper device [se
c]. This can be expressed as a mathematical formula, and the number n of data storage devices can be expressed as in the following formula. In addition, the minimum seek time of the magnetic disk device is 5 [sec
] is less than the time (M/T) [seC] for transferring 1 Byte of data to the host device of one input/output buffer, even if the magnetic disk device finishes the seek operation, the magnetic disk device Data cannot be transferred from the data storage device to the input/output buffer because the input/output buffer that is attempting to transfer data is currently transferring data to the device mentioned above. Therefore, it is necessary to wait until the data transfer from the input/output buffer to the higher-level device is completed. Therefore, the data transfer time from the data storage device to the input/output buffer is the data transfer time from one input/output buffer to the host device (M/T) [secl] and the maximum rotational waiting time (1/R) of the magnetic disk device. ) [sec] and the data transfer time from the data storage device to the input/output buffer (M/
t) [The total time of secl is the time to transfer data of all input/output buffers to the upper device (nM/T)
It only needs to operate within [sec]. This can be expressed as a mathematical formula, and the number n of data storage devices can be expressed as in the following formula. By constructing a collective magnetic disk device with the minimum number of data storage devices that satisfy these conditional expressions, it is possible to provide a magnetic disk IT with good cost performance that satisfies the data transfer speed required by host equipment. . The data storage device stores data files. By configuring the data storage device as a magnetic disk device having a magnetic disk controller, the magnetic disk controller controls writing and reading data to and from the magnetic disk, and the processing of the multi-disk controller is reduced. In addition, the data storage device can be a plurality of magnetic disk devices,
The storage capacity can be increased by configuring a multiplexer that selectively connects the data path of the magnetic disk device to the data bus of the input/output buffer. The input/output buffer temporarily stores data to be input/output to the data storage device. In the case of writing, data is transferred one after another from the host device to the input/output buffer at a speed faster than the writing speed of the magnetic disk device in the data storage device, and after the data transfer is completed, the input/output buffer is transferred to the magnetic disk device. Data is written at the writing speed of the device. In the case of reading, each magnetic disk device reads data to the input/output buffer at the read speed of the magnetic disk device, and the input/output buffer after reading is transferred to the upper level at a speed faster than the read speed of the magnetic disk device. Transfers data to the device. Thereby, data can be input/output to the host device at a faster speed than the writing/reading speed of the magnetic disk device. Furthermore, by having two input/output buffers for each data storage device, while the input/output buffer on the first side is transferring data with the host device, the input/output buffer on the second side is connected to the data storage device. You can write to and read from. This can reduce the time the magnetic disk device waits for the data transfer operation until the data transfer with the host device is completed, and writing and reading can be performed in a short time. The conditional expression for providing a magnetic disk device with good cost performance that satisfies the data transfer speed required by the host device at this time is expressed by the first expression. The multi-disk controller controls data storage devices and input/output buffers in response to data file write and read requests from higher-level devices. A communication memory using a semiconductor memory element that can store multiple file IDs of files to be written or read is
Overhead time in receiving commands from host devices and processing completion reports is reduced, allowing continuous writing and reading of data files in a short time. A physical information table using a semiconductor memory element that can be accessed in a short time can quickly determine the physical storage location of a magnetic disk device from a logical file ID, and therefore reduces the overhead required to read data files. Time becomes short. In addition, whereas files stored in magnetic disk devices have traditionally been identified by file names consisting of variable-length character code strings, file IDs are made up of fixed-length numerical codes. , can be expressed using small-sized code, simplifying the process of specifying data files to be written or read and searching for physical storage locations, and reducing the overhead time required. Furthermore, when storing data files, by physically storing logically related files close to each other, seek time and access time can be shortened. A multiplexer in the multiplex controller selects the data path of the input/output buffer. The start address registration table and end address registration table store several start addresses and end addresses that specify the range where the necessary data is stored among the data stored in the input/output buffer. The DMA controller transfers input/output buffer data in the range specified by the start address registration table and the end address registration table to the host device at high speed without the intervention of a mask controller. If there are multiple files to be read on the same cylinder of the magnetic disk device, set the size of the file to be read to f.
1 [Byte v f 2 [Byte], the size of the file that does not need to be read during that time is k [Byte]
] , the read speed of the magnetic disk device [B
yte/sec]. When the rotational speed of the magnetic disk device is R [rps] and the average seek time of the magnetic disk device is S [sec], the average rotational waiting time is (1
/2R) [sec], and the condition that the time to read at a time is shorter than the time to read one by one can be expressed as follows. This formula can be easily written as the following formula. f When this conditional expression is satisfied, the multiplex controller temporarily reads files that do not need to be read into the input/output buffer, and transfers only the necessary portions, excluding unnecessary file portions, when transferring the files to the host device. This allows the magnetic disk to read a plurality of files in one read process, thereby shortening the access time that occurs in the read process.

【実施例1 以下、本発明を文字列検索装置に適用した実施例である
実施例1を説明する。 第3図は本発明を用いた集合型磁気ディスク装置の構成
を示すもので、磁気ディスク装置1を有するn台のデー
タ記憶装置15と、データ記憶装置15それぞれに接続
する磁気ディスク装置1の1シリンダ分の容量を持つ入
出力バッファ3と、データ記憶装115と入出力バッフ
ァ3の制御を行なうマルチディスクコントローラ4によ
って構或している。 ここではデータ記憶装W15は装置と、複数台の磁気デ
ィスク装置1で構威し,入出力バッファ3は上記磁気デ
ィスク装置1の1シリンダの容量を持つメモリ1面で構
威している。 マルチディスクコントローラ4は、アクセスの対象とな
るファイルのファイルIDを上位機器7から直接設定で
きる通信メモリ5と高速データバス10の制御を行なう
マルチプレクスコントローラ8とファイルIDから磁気
ディスク装置の格納先物理情報を求めるための変換テー
ブルである物理情報テーブル6および、それらを制御す
るマスクコントローラ9によって構成している。 上位機器7は集合型磁気ディスク装置に命令を与えるホ
ストコントローラと入力されるデータの中から指定した
文字列を検出し、その検出情報を出力する文字列検索装
置により構威している。 本集合型磁気ディスク装置にデータファイルを構或する
データベースの構築を行なう前には、データベースの構
造定義処理を行なう。 本集合型磁気ディスク装置では論理的に関連するファイ
ルを物理的格納位置が近接するように配置する手段とし
て、最初に物理シリンダを階層構造を持つ論理分類ID
に従い割り振っている。複数件のファイルを一度にアク
セスする場合、論理的に関連するファイルを対象にする
ことが多い。 そこで、格納位置を近接させることにより、磁気ディス
ク装置のシリンダ間を磁気ヘッドが移動する距離を短く
し、アクセス時間の一部であるシーク時間を短縮させる
. 階層構造を持つ論理分類IDに従った物理シリンダの割
り振りは、上位機器7が論理分類IDと該ファイル分類
が必要とする記憶容量の組が集まって構成されるデータ
ベース構造定義情報を通信メモリ5に格納した後、マル
チディスクコントローラ4に対しデータベースの構造定
義命令を発行する。構造定義命令を受けたマルチディス
クコントローラ4内のマスクコントローラ9は、通信メ
モリ5にセットされたデータベースの構造定義情報に基
づいて、論理分類に物理位置がどう対応するかをマスク
コントローラ9内のメモリ上に第4図で示すような構造
の構造定義テーブルを作或する。第4図は2階層でそれ
ぞれの階層で2つの分類を持つ例で、磁気ディスク装置
全体を一台の磁気ディスク装置としてまとめて、各分類
ごとの格納位置をシリンダの位置で,記憶容量をシリン
ダ数で示したものである。 また、データベースの構造定義処理では,マルチディス
クコントローラ4内のマスクコントローラ9は論理分類
毎に、書き込むファイルの格納先の物理位置を保持する
ために、マスクコントローラ9内のメモリ上に第5図に
示すような、書き込むファイルの格納先の物理位置を差
し示す格納位置ポインタテーブルを作戒する。構造定義
が終了した時点では、格納位置ポインタテーブルは構造
定義で設定した各論理分類の先頭シリンダ,先頭トラッ
ク,先頭セクタ,セクタ内先頭位置を示すことになる。 第5図では第4図で示した例の分類でファイルを格納し
た場合の格納位置ポインタ情報を格納している。 次にデータベースの構築について説明する。本集合型磁
気ディスク装置ではアクセスの対象となるファイルをフ
ァイルID(論理分類IDと論理分類内の個有の番号で
構成)により指定する手段として、ファイルIDを用い
た管理情報を作成している。 上位機器7は通信メモリ5に書込み対象となるファイル
のファイルIDとファイルサイズの組が複数件分集まっ
て構成されるファイル情報を格納した後、マルチディス
クコントローラ4に対し書き込み命令を発行する。書き
込み命令を受けたマルチディスクコントローラ4は,第
7図に示すフローで処理を実行する。マルチディスクコ
ントローラ4内のマスクコントローラ9は,通信メモリ
5からファイル情報の中のファイルIDを読み出し,該
ファイルIDが示すファイルを格納する格納位置を格納
位置ポインタテーブルから読み出す.格納位置が求まる
とその物理シリンダに書き込める残り容量が求まる。そ
の残り容量よりもファイル情報のファイルサイズで与え
られるファイルのサイズが小さければ第6図に示すよう
なファイルIDをエントリとする物理情報テーブル6に
その格納位!!(ディスク番号,シリンダ番号,トラッ
ク番号,セクタ番号,セクタ内位置)、ファイルサイズ
,ディスクまたがり数を書き込む.ディスクまたがり数
は,ファイルが何台の磁気ディスク装置1にまたがって
いるかを表わすもので、処理対象となっているファイル
が、装置と、複数台の磁気ディスク装置の1つのシリン
ダに書き切れなかった場合はファイルを分割して書き残
したファイルを次のディスクに書き込むことになる。こ
のファイル分割した書き残しファイルであれば,この値
をカウントアップする。物理情報テーブル6のエントリ
はファイル情報で与えられるファイルIDで示される。 物理情報テーブルへの書込みの後、格納位置ポインタを
ファイルサイズ分進める。 ファイルサイズと残り容量が等しい場合は,l台の磁気
ディスク装置1のシリンダがいっぱいになった時で,そ
の磁気ディスク装置1への書き込み処理を行なう。 残り容量よりもファイルサイズが大きい場合には、磁り
容量と分割基準サイズを比べる.分割基準サイズは構造
定義処理で設定する値で,シリンダの残り容量が非常に
小さいにもかかわらずファイルを磁気ディスク装置1の
間にまたがるように格納すると、そのファイルを読み出
すためには2台の磁気ディスク装置1を制御しなければ
ならず、その処理分オーバヘッドが大きくなる.そこで
、ある基準を設定してその基準値よりも残り容量が小さ
い場合には次の磁気ディスク装fllのシリンダの先頭
から書き込むようにするものである。 残り容量が分割基準サイズ以上の場合には、物理情報テ
ーブル6に格納位置、ファイルサイズを格納した後,残
り容量に書き込める分のファイルと書き残した分の書き
残しファイルとに分割する.物理情報テーブル6には格
納物理位置とファイルサイズを書込む. lシリンダがいっぱいとなる物理情報を作威した磁気デ
ィスク装置1は書き込み処理を行なう。 書き残しファイルはループを戻り、次の処理対象ファイ
ルとなる. 残り容量が分割基準サイズよりも小さい場合には,格納
位置ポインタテーブルを次のシリンダの先頭に進めた後
、処理対象ファイルをそのまま次の処理対象ファイルと
してループを戻り処理を続ける.この時、1シリンダが
いっぱいとなる物理情報を作威した磁気ディスク装置は
書き込み処理を行なう. 書き込み処理は、マスクコントローラ9がシーク命令を
磁気ディスク装置1に発行し、シーク動作を開始する.
次に,上位機器7にファイルの転送要求を発行し,マス
クコントローラ9は上位機器7にファイルの転送を要求
するとともに,マルチプレクスコントローラ8を制御し
てデータパスを切り換え、転送されてくるファイルを物
理情報で指定する入出力バッファ3へのファイルの転送
を行なう。シーク動作が終了し、ファイルの転送が終了
するとマスタコントローラ9は書込み命令を磁気ディス
ク装置1に発行し、該磁気ディスク装置1は書き込み動
作を実行する。 上記の動作を繰返しデータベースの構築を行なう。 第8図は書き込み処理の時間的な関係を示すもので、上
位機器7から図に示すように1−1,2−1,・・・・
・・ H  1.1−2+ 2  2t・・・・・・と
次々と転送されてくるデータは、マルチディスクコント
ローラ4内のマルチプレクスコントローラ8により、入
出力バッファ3−1.3−2,・・・・・・3−n, 
3−1. 3−2,・・・・・・に格納される。このと
き、例えば磁気ディスク装置1−1は、データ転送1−
1を開始する直前にマスクコントローラ9の指令により
シークを開始している。データ転送1−1が終了した時
点で、マスクコントローラ9は磁気ディスク装置1−1
に書き込み命令を発行する。磁気ディスク装置1−1は
指定の書き込み位置に達するまで回転待ちを行なった後
、入出力バッファ3−1のデータ1−1を所定のシリン
ダ,トラック,セクタへ書き込み始める。 この間、他の磁気ディスク装置も図に示すように同様の
処理を行なうことになる。 第8図とこれに関する以上の説明から明らかなように、
各磁気ディスク装置はそれぞれ並行して、連続でファイ
ルの書き込みができ、短時間でデータベースの構築がで
きる。 次に、ファイルの読み出し処理について説明する。また
、同一磁気ディスク装置の同一シリンダ上に読み出すフ
ァイルが複数件ある場合に、読み出すファイルの間にあ
る読み出し不要のファイルも入出力バッファに一旦読み
出し、上位機器に転送する際に読み出し不要のファイル
を削除する手段について説明する。 上位機器7は読み出すファイルのファイルIDが複数件
分集まって構成するファイル情報を通信メモリ5に格納
した後、マルチディスクコントローラ4に対して読み出
し命令を発行する。 読み出し命令を受けたマルチディスクコントロ一ラ4は
、第9図に示すフローで処理を実行する.マルチディス
クコントローラ4内のマスクコントローラ9は、通信メ
モリ5から最初に読み出すべきファイルのファイルID
を読み出し、該ファイルIDから該ファイルが格納され
ている物理情報を物理情報テーブル6により検索する。 このファイルを先ファイル、物理情報を先ファイルの物
理情報とする。次に、通信メモリ5から次に読み出すべ
きファイルのファイルIDを読み出し、該ファイルID
から該ファイルが格納されている物理情報を物理情報テ
ーブル6により検索する。このファイルを後ファイル、
物理情報を後ファイルの物理情報とする。 求めた物理情報から先ファイルと後ファイルが同一シリ
ンダに存在するかを調べ、同一シリンダに存在するかを
調べ,同一シリンダに存在すれば先ファイルと後ファイ
ルの間に、指定していない読み出し不要のファイル群が
あるか調べ、あれば、そのファイル群の総サイズを求め
る。読み出し不要の一ファイルのサイズが小さい場合に
は、先ファイルと後ファイルを一度の読み出し命令で読
出せるように、物理情報を合成する。次に合成した物理
情報を先ファイルの物理情報としてループを戻り,通信
メモリ5から次のファイルIDを読み出し、そのファイ
ルを後ファイルとして同様な処理を行なう。 先ファイルと後ファイルが同一シリンダに存在しない場
合と読み出し不要ファイルのサイズが大きい場合には、
先ファイルの磁気ディスク装置からの読み出し処理を実
行する。後ファイルの物理情報は先ファイルの物理情報
としてループを戻り、通信メモリ5から次のファイルI
Dを読出し、それを後ファイルとして同様な処理を行な
う。 このような動作を指定したファイルすべてを読み出すま
で繰り返す。 先ファイルの磁気ディスク装置からの読み出し処理は、
まず、マスクコントローラ9は先ファイルの物理情報が
示す磁気ディスク装置1−iの磁気ディスクコントロー
ラ2−iに物理情報が示す物現位置へ磁気ヘッドを移動
させるシーク命令を発行し、磁気ディスク装ii 1 
− iはシーク動作を開始する。シーク動作が終了する
と、入出力バツファ3−iがデータを書き込んでも良い
状態であれば、マスクコントローラ9は読み出し命令を
磁気ディスクコントローラ2−iに発行し、入出力バッ
ファ3−iに磁気ディスク装置1−iから読み出したフ
ァイルの格納を開始する。格納が終了すると、マスクコ
ントローラ9はマルチプレクスコントローラ8を制御し
て入出力バッフア3−iから上位機器7へのデータの転
送を開始させる。 マルチプレクスコントローラ8は第10図に示すように
、上位機器7のデータパスに入出力バツファ3−1から
3−nのデータパスを選択して接続するマルチプレクサ
201と選択したi番目の入出力バッファ3−iから上
位機器7にマスクコントローラ9の介在なしにデータを
出力するDMAコントローラ202と該DMAコントロ
ーラ202に入出力バッファ3−iの転送範囲を指定す
るための先頭アドレスと終了アドレスを格納する先頭ア
ドレス登録テーブル203と終了アドレス登録テーブル
204により構或している。 マスクコントローラ9は人出カバツファ3−iの転送す
べきファイルが存在する先頭アドレスを先頭アドレス登
録テーブル203に、終了アドレスを終了アドレス登録
テーブル204に設定した後、他の入出力バッファ3か
ら上位機器7へのデータの転送が行なわれていなければ
DMAコントローラ202に起動命令を発行する。DM
Aコントローラ202は先頭アドレス登録テーブル20
3と終了アドレス登録テーブル204を参照しながら指
定した範囲のデータのみを上位機器7の要求する転送速
度でマスクコントローラ9の介在なしに転送を行なう。 先ファイルと後ファイルを一度の読出し命令で読み出せ
るように、物理情報を合成する処理を行ない入出力バッ
ファ3−iに読み出した場合には、先頭アドレス登録テ
ーブル203と終了アドレス登録テーブル204に必要
なファイルすべてが転送されるようにアドレスを複数件
分設定し、同様な処理を行なう。 先ファイルと後ファイルを一度の読出し命令で読み出せ
るように、物理情報を合成する処理は次の条件を満足す
る場合に行なう. 先ファイルのサイズをf 1 [Byte] 、後ファ
イルのサイズをf 2 [Byte] +読み出し不要
のファイル群の総サイズをk [Byte] 、磁気デ
ィスク装置1から入出力パツファ3へのシーク動作を含
まない実効的な転送速度をを [ B yte/ se
e]、回転速度をR [rps] .平均シーク時間を
s [sec]とするとき、平均回転待ち時間は(1/
2R)であり、一度に読み出す時間が一つずつ読み出す
時間よりも短かくなる条件は, のようになり,第3式で示すように書き表すことができ
る. t k ≦ (3) 2R ファイルの読み出し処理の時間的な関係は、上位機器7
が要求する転送速度をT [Byte/seCl、各磁
気ディスク装置1の1シリンダ分の容量がM [Byt
e] 、各磁気ディスク装置1から入出力バッファ3へ
の転送速度をを [Byte/sec] .各磁気ディ
スク装置lの最小シーク時間をs [sec],回転速
度をR [rps]とすると、最少シーク時間s [s
ec]がi番目の入出力バッフア3−i上のファイルを
上位機器7に転送する時間(M/T)より大きい場合に
は、第11図に示すようになる。 上位機器7の要求する転送速度を満足するには、i台目
の磁気ディスク装11−iが入出力バッファ3−iにフ
ァイルを読み出す時間( s + 1 / R+M/ 
t )が、全ての入出力バッファ3上のファイルを上位
機器7に転送する時間( n M / T )以内であ
れば良いことになる。ここでは、連続したシリンダを読
み出すためシーク時間を最少シーク時間とした。また、
磁気ディスク装W1に読み出し命令を発行した時点の磁
気ヘッドの位置がいかなる場合でも、上位機器7の要求
する転送速度を満足するように、回転待ちの時間を最大
値である(1/R)とした。この関係を数式で表わすと
のようになり、第1式で示すように書き表わすことがで
きる。 また、最少シーク時間5 [sec]がi番目の入出力
バッフア3−i上のファイルを上位機器7に転送する時
間(M/T)以下の場合のファイルの読み出し処理の時
間的な関係は、第12図に示すようになる。この場合は
、シーク動作が終了しても入出力バッファ3−iはファ
イルを上位機器7に転送中であるため、読み出し命令を
i台目の磁気ディスク装1i 1 − iに発行するこ
とができない.そこで、入出力バッファ3−iのファイ
ルが上位機器7に転送が終了した時点に読み出し命令を
i台目の磁気ディスク装置1 − iに発行することに
なる。従って、上位機器7の要求する転送速度を満足す
るには,i台目の磁気ディスク装M 1 − iが入出
力バッファ3−iにファイルを読み出す時間(M/T 
+ 1 /R +M/ t )が、全ての入出力バッフ
ァ3上のファイルを上位機器7に転送する時間(nM/
T)以内であれば良いことになる.この関係を数式で表
わすと のようになり、第2式で示すように書き表わすことがで
きる。 t MR 速度を満足するには磁気ディスク装置lを何台組み合わ
せればよいかを求めることができ、第工式を満足する最
少の台数の磁気ディスク装置1で集合型磁気ディスク装
置を構或すれば最もコストパフォーマンスの良いものと
なる。 例えば、1トラックの容量が20k (キロ)[ B 
yte]の6トラックからなる,1シリンダ分の容量が
1 2 0 k [Bytelの磁気ディスク装置1に
より構威し、上位機器7が要求する転送速度を2M(メ
ガ)  [ B yte/ sec] .各磁気ディス
ク装置1から入出力バッファ3へのシーク動作を含まな
い実効的な転送速度をI M [ B yte/ se
c]、各磁気ディスク装置1の最小シーク時間を10m
(ミリ)  [secコ、回転速度を50[rps]と
すると、第1式は次のようになり, この式を満足する最少のnは4となる。 第13図に3台の磁気ディスク装W1で構成した集合型
磁気ディスク装置の読み出し中の時間関係で、第14図
に4台の磁気ディスク装置工で構成した集合型磁気ディ
スク装置の読み出し中の時間関係、第15図に5台の磁
気ディスク装置1で構成した集合型磁気ディスク装置の
読み出し中の時間関係を示す。 第13図の3台の磁気ディスク装置1で構或した場合に
は、図からもわかるように磁気ディスク装置1から入出
力バッファ3にデータを読み出す時間が入出力バッファ
3から上位機器7への転送時間に間に合わず、入出力バ
ッファ3から上位機器7にデータの転送ができない時間
aが発生し、入出力バッファ3から上位機器7への転送
速度が約1 . 6 M [ B yte/ seeコ
となり上位機器が要求する転送速度を満足できない。 また、第15図の5台の磁気ディスク装置1で構成した
場合には、上位機器7が要求する転送速度を満足はする
ものの,第14図の4台の磁気ディスク装i!lで構成
した場合に比べ、王台の磁気ディスク装N1が処理をし
ない時間bが長く磁気ディスク装置の使用効率が悪い。 従って,第1式を満足する最少のnに一致する4台の磁
気ディスク装置1で構或した場合が、最もコストパフォ
ーマンスの良い集合型磁気ディスク装置と言える。 本発明を文字列検索装置に適用したもう1つの実施例で
ある実施例2について第l図を用いて説明する. 実施例1で説明した集合型磁気ディスク装置は、指定し
たファイルのみを読み出す場合、指定したファイルが磁
気ディスク装W1−1から1−nに平均して存在すれば
、実施例1で述べたような動作を実施して、上位機器7
八のデータ転送速度を高めることができる。しかし、装
置と、複数台の磁気ディスク装置1−iにだけ指定した
ファイルが存在する場合、装置と、複数台の磁気ディス
ク装置1 − iの読み出しが連続して行われることに
なる。この場合、上位機器7八のデータ転送は、一旦磁
気ディスク装置1−iから入出力バッファ3−iに読み
出した後、入出力バッファ3−iから上位機器7へ転送
する2段読み出しを行なわねばならないため、データ転
送が低下してしまうという状況が発生する。このように
、指定したファイルが偏って磁気ディスク装置1に存在
すると上位機器7八のデータ転送速度を効果的に高める
ことができない状況が発生し得る。そこで、実施例2は
、ファイルが偏って格納されないようにすることで,常
に全磁気ディスク装置1を読み出し動作させ、上位機器
7へのデータ転送速度を高めるものである。 また,本実施例では記憶容量をさらに高めるために、磁
気ディスク装置の台数を増やしている。 第1図は本発明を用いた集合型磁気ディスク装置の構或
を示すもので、第3図との相違点は磁気ディスク装置1
の1シリンダ分と同じ容量の入出力バッフア3を2面持
ち、第1面の入出力バッフア3aのデータを上位機器7
に転送している間に、第2面の入出力バッファ3bに磁
気ディスク装置1からの読み出したファイルを格納する
ことができることである. また、一つのデータ記憶装M15をm台の磁気ディスク
装1i 1 − i − 1〜1−i−mとマルチプレ
クサ14によって構威し、集合型磁気ディスク装置の総
記憶容量を装置と、複数台の磁気ディスク装置の記憶容
量の(nXm)倍にしている.動作を説明すると、まず
、実施例1と同様にデータベースの構造定義処理を行な
うが、入出力バッファ3にマルチプレクサ14を介して
接続するm台の磁気ディスク装N1を識別する情報を構
造定義情報に追加する。 データベースの構築は実施例1と同様に行なうが、いく
つかの相違点がある。実施例1との相違点は、ファイル
情報で与えられるファイルを構戒する磁気ディスク装置
の台数分に分割して、全磁気ディスク装置に分散して格
納することである。 また,入出力バッフア3のデータを格納物理情報で与え
られるm台の内の装置と、複数台の磁気ディスク装置1
−i−jにマルチプレクサ〜l4を制御して格納するこ
とである. ファイルの分割方法としては、ファイルサイズを台数で
割った分割サイズを求め、ファイルの先頭から分割サイ
ズごとに装置と、複数台目の磁気ディスク装置1−1−
jから1−2−j,1−3−jと順番に格納していくも
のと,ファイルの先頭から1バイトずつと言ったように
,決められたサイズごとに装置と、複数台目の磁気ディ
スク装置1−1−jから1−2−j,1−3−jと順番
に格納していくものがある. ファイルサイズが磁気ディスク装置の台数で割り切れな
い場合は,ファイルサイズが磁気ディスクの倍数となる
ように無効データを末尾に付加して、常に装置と、複数
台目の磁気ディスク装il1−1−jにファイルの先頭
がくるように格納する。 次にファイルの読出しについて説明する。これも実施例
1と同様に行なうが、本構成では入出力バッファ3を2
面(3a及び3b)持うているため,それぞれの磁気デ
ィスク装置lから入出力バッファ3に読出したファイル
を格納した時点で、次のファイルの読出しの処理を開始
することができる。 ファイルの読み出し処理の時間的な関係は第上6図のよ
うになり、実施例1に比べると入出力バッファ3にデー
タを書き込んでも良い状態になるまでの待ち時間がなく
なり、より高速の転送が可能になる.実施例1と同じ条
件で上位機器7の要求する転送速度を満足する関係は,
装置と、複数台の磁気ディスク装ill − i − 
jから2面ある入出力バッファ3−iの一方の入出力バ
ッファ3a−iにファイルを読み出す時間( s + 
1 / R + M / t )が、もう一方の全ての
入出力バッファ3b−1から3b−nまでのファイルを
上位機器7に転送する時間( n M. / T )以
内であればよく、これを数式で表すと のようになり、この数式は容易に次式のように書き表す
ことができる。 この条件により、実施例1と同様に上位機器が要求する
転送速度を満足するためのデータ記憶装置15の台数を
求めることができる。 また、大きな記憶容量が求められる場合には、データ記
憶装置15をm台の磁気ディスク装置」−とマルチプレ
クサ14によって構威し、記憶容量をm倍化することが
できる6 これらのことから決定される最少台数の磁気ディスク装
置lで集合型磁気ディスク装置をa或すれば、最もコス
トパフォーマンスの良いものとなる。 第16図の実施例では各磁気ディスク装置のシーク動作
の起動を上位機器への入出力バッファ3−1〜3−nの
データ転送が終了した時点で行なっているが、それぞれ
読み出しが終了した時点で行なっても良いことは明らか
である。 以上の2つの実施例では磁気ディスク装置を用いた場合
について説明したが、磁気ディスク装置以外の光ディス
ク装置等の記憶媒体が回転する記憶装置についても同様
なことは明確である。 【発明の効果】 本発明によれば、上位機器が要求する高速の転送速度を
満足すると共に、格納するデータベースの容量に応じて
集合型磁気ディスク装置を最少台数の磁気ディスク装置
で構或することができ、ファイルのサイズにかかわらず
複数のファイルを連続的に高速に入出力できる、安価な
集合型磁気ディスクを提供できる効果がある。
[Embodiment 1] Embodiment 1, which is an embodiment in which the present invention is applied to a character string search device, will be described below. FIG. 3 shows the configuration of a collective magnetic disk device using the present invention, which includes n data storage devices 15 each having a magnetic disk device 1, and one of the magnetic disk devices 1 connected to each of the data storage devices 15. It consists of an input/output buffer 3 having a capacity equivalent to a cylinder, and a multi-disk controller 4 that controls the data storage device 115 and the input/output buffer 3. Here, the data storage device W15 consists of a device and a plurality of magnetic disk drives 1, and the input/output buffer 3 consists of one memory surface of the magnetic disk drive 1 having a capacity of one cylinder. The multi-disk controller 4 includes a communication memory 5 that can directly set the file ID of the file to be accessed from the host device 7, a multiplex controller 8 that controls the high-speed data bus 10, and a physical storage destination of the magnetic disk device based on the file ID. It consists of a physical information table 6, which is a conversion table for obtaining information, and a mask controller 9, which controls them. The host device 7 consists of a host controller that gives commands to the collective magnetic disk device, and a character string search device that detects a specified character string from input data and outputs the detected information. Before constructing a database constituting data files in this collective magnetic disk device, a database structure definition process is performed. In this collective magnetic disk device, as a means of arranging logically related files so that their physical storage locations are close to each other, we first assign physical cylinders to logical classification IDs with a hierarchical structure.
It is allocated according to the following. When accessing multiple files at once, logically related files are often targeted. Therefore, by placing the storage locations close together, the distance that the magnetic head moves between the cylinders of the magnetic disk drive is shortened, and the seek time, which is a part of the access time, is shortened. In order to allocate physical cylinders according to logical classification IDs that have a hierarchical structure, the higher-level device 7 stores database structure definition information in the communication memory 5, which is composed of a set of logical classification IDs and storage capacity required by the file classification. After storing, a database structure definition command is issued to the multi-disk controller 4. Upon receiving the structure definition command, the mask controller 9 in the multi-disk controller 4 stores in the memory in the mask controller 9 how the physical position corresponds to the logical classification based on the structure definition information of the database set in the communication memory 5. A structure definition table having the structure shown in FIG. 4 above is created. Figure 4 is an example of a two-layer structure with two categories in each layer.The entire magnetic disk drive is combined into one magnetic disk drive, and the storage location for each category is determined by the cylinder position, and the storage capacity is determined by the cylinder position. It is shown in numbers. In addition, in the database structure definition process, the mask controller 9 in the multi-disk controller 4 stores the physical location of the storage destination of the file to be written for each logical classification on the memory in the mask controller 9 as shown in FIG. Create a storage location pointer table that indicates the physical location of the storage location of the file to be written, as shown. When the structure definition is completed, the storage position pointer table indicates the first cylinder, first track, first sector, and first position within the sector of each logical classification set in the structure definition. In FIG. 5, storage position pointer information when files are stored according to the classification shown in FIG. 4 is stored. Next, the construction of the database will be explained. This collective magnetic disk device creates management information using file IDs as a means of specifying files to be accessed using file IDs (consisting of a logical classification ID and a unique number within the logical classification). . After storing, in the communication memory 5, file information consisting of a plurality of sets of file IDs and file sizes of files to be written, the host device 7 issues a write command to the multi-disk controller 4. The multi-disk controller 4 that has received the write command executes processing according to the flow shown in FIG. The mask controller 9 in the multi-disk controller 4 reads the file ID in the file information from the communication memory 5, and reads the storage location where the file indicated by the file ID is to be stored from the storage location pointer table. Once the storage location is determined, the remaining capacity that can be written to that physical cylinder is determined. If the file size given by the file size of the file information is smaller than the remaining capacity, the file size is stored in the physical information table 6 whose entry is the file ID as shown in FIG. ! Write the (disk number, cylinder number, track number, sector number, position within the sector), file size, and number of disks. The number of disk spans indicates how many magnetic disk devices 1 the file spans, and the file being processed could not be written to one cylinder of the device or multiple magnetic disk devices. In this case, the file will be divided and the remaining files will be written to the next disc. If this file is an unwritten file after being divided, this value is counted up. Entries in the physical information table 6 are indicated by file IDs given in file information. After writing to the physical information table, advance the storage location pointer by the file size. If the file size and remaining capacity are equal, when the cylinders of l magnetic disk devices 1 are full, the write process to that magnetic disk device 1 is performed. If the file size is larger than the remaining capacity, compare the magnetic capacity and the division standard size. The division standard size is a value that is set in the structure definition process. Even though the remaining capacity of the cylinder is very small, if a file is stored across magnetic disk units 1, it will take two drives to read the file. The magnetic disk device 1 must be controlled, and the processing overhead increases. Therefore, a certain standard is set, and if the remaining capacity is smaller than the standard value, data is written from the beginning of the cylinder of the next magnetic disk device fll. If the remaining capacity is equal to or larger than the division reference size, the storage location and file size are stored in the physical information table 6, and then the files are divided into files that can be written in the remaining capacity and files that are left unwritten. The storage physical location and file size are written in the physical information table 6. The magnetic disk device 1 that has created the physical information that fills the l cylinder performs a write process. The unwritten file returns through the loop and becomes the next file to be processed. If the remaining capacity is smaller than the division standard size, advance the storage position pointer table to the beginning of the next cylinder, then return to the loop and continue processing with the file to be processed as the next file to be processed. At this time, the magnetic disk device that has created the physical information that fills one cylinder performs a write process. In the write process, the mask controller 9 issues a seek command to the magnetic disk device 1 and starts a seek operation.
Next, a file transfer request is issued to the higher-level device 7, and the mask controller 9 requests the higher-level device 7 to transfer the file, and also controls the multiplex controller 8 to switch the data path and process the transferred file. The file is transferred to the input/output buffer 3 specified by the physical information. When the seek operation is completed and the file transfer is completed, the master controller 9 issues a write command to the magnetic disk device 1, and the magnetic disk device 1 executes the write operation. The above operations are repeated to construct the database. FIG. 8 shows the temporal relationship of write processing, from the host device 7 to 1-1, 2-1, . . . as shown in the figure.
... H 1.1-2+ 2 2t... The data that is transferred one after another is sent to the input/output buffers 3-1.3-2, . . . by the multiplex controller 8 in the multi-disk controller 4. ...3-n,
3-1. 3-2, . . . At this time, for example, the magnetic disk device 1-1 transfers data 1-
1, the seek is started by a command from the mask controller 9. When the data transfer 1-1 is completed, the mask controller 9 transfers the data to the magnetic disk device 1-1.
Issue a write command to. After the magnetic disk device 1-1 waits for rotation until it reaches a designated write position, it begins writing data 1-1 in the input/output buffer 3-1 to a predetermined cylinder, track, or sector. During this time, other magnetic disk devices will also perform similar processing as shown in the figure. As is clear from Figure 8 and the above explanation,
Each magnetic disk device can write files in parallel and continuously, making it possible to build a database in a short time. Next, file read processing will be explained. In addition, when there are multiple files to be read on the same cylinder of the same magnetic disk device, the files that do not need to be read between the files to be read are also read into the input/output buffer, and the files that do not need to be read are saved when transferring to the host device. The method for deleting will be explained. After storing file information consisting of a plurality of file IDs of files to be read in the communication memory 5, the host device 7 issues a read command to the multi-disk controller 4. The multi-disk controller 4 that receives the read command executes processing according to the flow shown in FIG. The mask controller 9 in the multi-disk controller 4 determines the file ID of the file to be read first from the communication memory 5.
is read out, and the physical information table 6 is searched for the physical information in which the file is stored based on the file ID. Let this file be the destination file and the physical information be the physical information of the destination file. Next, the file ID of the file to be read next is read from the communication memory 5, and the file ID
The physical information table 6 is searched for the physical information in which the file is stored. After this file,
Set the physical information as the physical information of the subsequent file. Check whether the first file and the next file exist in the same cylinder from the obtained physical information, check whether they exist in the same cylinder, and if they exist in the same cylinder, there is no need to read unspecified files between the first file and the next file. Find out if there is a group of files, and if so, find the total size of the group of files. When the size of one file that does not need to be read is small, the physical information is combined so that the first file and the next file can be read with a single read command. Next, the process returns to the loop using the synthesized physical information as the physical information of the previous file, reads the next file ID from the communication memory 5, and performs similar processing using that file as the next file. If the destination file and subsequent file do not exist in the same cylinder, or if the size of the file that does not need to be read is large,
Executes the process of reading the destination file from the magnetic disk device. The physical information of the next file returns through the loop as the physical information of the previous file, and is transferred from the communication memory 5 to the next file I.
D is read and the same process is performed using it as a subsequent file. This operation is repeated until all specified files are read. The process of reading the destination file from the magnetic disk device is as follows:
First, the mask controller 9 issues a seek command to the magnetic disk controller 2-i of the magnetic disk device 1-i indicated by the physical information of the previous file to move the magnetic head to the physical position indicated by the physical information, and 1
- i starts a seek operation. When the seek operation is completed, if the input/output buffer 3-i is in a state where data can be written, the mask controller 9 issues a read command to the magnetic disk controller 2-i, and writes the input/output buffer 3-i to the magnetic disk device. Start storing the file read from 1-i. When the storage is completed, the mask controller 9 controls the multiplex controller 8 to start transferring data from the input/output buffer 3-i to the host device 7. As shown in FIG. 10, the multiplex controller 8 connects a multiplexer 201 that selects and connects the data paths of the input/output buffers 3-1 to 3-n to the data path of the host device 7, and the selected i-th input/output buffer. A DMA controller 202 that outputs data from 3-i to the host device 7 without the intervention of the mask controller 9, and a start address and an end address for specifying the transfer range of the input/output buffer 3-i are stored in the DMA controller 202. It consists of a start address registration table 203 and an end address registration table 204. The mask controller 9 sets the start address where the file to be transferred of the crowd buffer 3-i exists in the start address registration table 203 and the end address in the end address registration table 204, and then transfers the data from other input/output buffers 3 to the host device. If data has not been transferred to DMA controller 202, a start command is issued to DMA controller 202. DM
The A controller 202 has the start address registration table 20
3 and the end address registration table 204, only the data in the specified range is transferred at the transfer speed requested by the host device 7 without the intervention of the mask controller 9. When the physical information is combined and read into the input/output buffer 3-i so that the first file and the next file can be read with a single read command, the first address registration table 203 and the end address registration table 204 are required. Set multiple addresses so that all files are transferred, and perform the same process. In order to read the first file and the next file with a single read command, the process of combining physical information is performed when the following conditions are satisfied. The size of the first file is f 1 [Byte], the size of the next file is f 2 [Byte] + the total size of the file group that does not need to be read is k [Byte], and the seek operation from the magnetic disk device 1 to the input/output buffer 3 is The effective transfer rate does not include [Byte/se
e], and the rotational speed is R [rps]. When the average seek time is s [sec], the average rotation waiting time is (1/
2R), and the condition that the time to read at a time is shorter than the time to read one by one is as follows, and can be written as shown in the third equation. t k ≦ (3) The temporal relationship of the 2R file read processing is as follows:
The transfer rate required by
e], the transfer rate from each magnetic disk device 1 to the input/output buffer 3 is [Byte/sec]. If the minimum seek time of each magnetic disk device l is s [sec] and the rotation speed is R [rps], then the minimum seek time s [s]
ec] is longer than the time (M/T) for transferring the file on the i-th input/output buffer 3-i to the higher-level device 7, as shown in FIG. 11. In order to satisfy the transfer speed required by the host device 7, the time required for the i-th magnetic disk unit 11-i to read the file to the input/output buffer 3-i (s + 1 / R + M /
t) is within the time (nM/T) for transferring all the files on the input/output buffers 3 to the host device 7. Here, the seek time was set as the minimum seek time in order to read consecutive cylinders. Also,
Regardless of the position of the magnetic head at the time a read command is issued to the magnetic disk unit W1, the rotation waiting time is set to the maximum value (1/R) so as to satisfy the transfer speed required by the host device 7. did. This relationship can be expressed mathematically as shown in the first equation. Furthermore, the temporal relationship of file read processing when the minimum seek time 5 [sec] is less than the time (M/T) for transferring the file on the i-th input/output buffer 3-i to the host device 7 is as follows: The result is as shown in FIG. In this case, even after the seek operation is completed, the input/output buffer 3-i is still transferring the file to the host device 7, so a read command cannot be issued to the i-th magnetic disk device 1i1-i. .. Therefore, when the transfer of the file in the input/output buffer 3-i to the host device 7 is completed, a read command is issued to the i-th magnetic disk device 1-i. Therefore, in order to satisfy the transfer speed required by the host device 7, the time required for the i-th magnetic disk device M1-i to read the file to the input/output buffer 3-i (M/T
+ 1 /R +M/t) is the time (nM/t) to transfer the files on all input/output buffers 3 to the host device
It is good if it is within T). This relationship can be expressed mathematically as shown in the second equation. It is possible to determine how many magnetic disk drives 1 should be combined in order to satisfy the tMR speed, and to construct a collective magnetic disk drive with the minimum number of magnetic disk drives 1 that satisfy the first formula. It is the most cost effective option. For example, the capacity of one truck is 20k (kg) [B
The magnetic disk device 1 is composed of 6 tracks of 120K [Bytel] and has a capacity of 1 cylinder, and the transfer rate required by the host device 7 is 2M (mega) [Byte/sec]. The effective transfer rate from each magnetic disk device 1 to the input/output buffer 3, excluding seek operations, is I M [Byte/se
c], the minimum seek time of each magnetic disk device 1 is 10 m
(millimeter) If the rotational speed is 50 [rps], the first equation becomes as follows, and the minimum n that satisfies this equation is 4. Figure 13 shows the time relationship during reading from a collective magnetic disk drive configured with three magnetic disk units W1, and Figure 14 shows the time relationship during readout from a collective magnetic disk drive consisting of four magnetic disk units W1. Time Relationship: FIG. 15 shows the time relationship during reading in a collective magnetic disk device composed of five magnetic disk devices 1. When the three magnetic disk devices 1 shown in FIG. A time a occurs during which data cannot be transferred from the input/output buffer 3 to the higher-level device 7 because the transfer time is not met, and the transfer speed from the input-output buffer 3 to the higher-level device 7 is approximately 1. 6 M[Byte/see], and the transfer speed required by the upper-level device cannot be satisfied. Furthermore, when configured with the five magnetic disk devices 1 shown in FIG. 15, although the transfer speed required by the host device 7 is satisfied, the four magnetic disk devices i! shown in FIG. Compared to the case where the main magnetic disk unit N1 does not perform processing, the time b is longer when the main magnetic disk unit N1 does not perform processing, and the usage efficiency of the magnetic disk unit is poor. Therefore, it can be said that the case where the four magnetic disk drives 1 that meet the minimum value n that satisfies the first equation are used is the most cost-effective collective magnetic disk drive. Embodiment 2, which is another embodiment in which the present invention is applied to a character string search device, will be explained using FIG. When reading only a specified file, the collective magnetic disk device described in Embodiment 1 can read only a specified file, as long as the specified file exists on average in magnetic disk devices W1-1 to 1-n. The host device 7
Eight data transfer speeds can be increased. However, if the specified file exists only in the device and the plurality of magnetic disk devices 1-i, reading from the device and the plurality of magnetic disk devices 1-i will be performed continuously. In this case, data transfer from the host device 78 must be performed in two stages, in which data is read from the magnetic disk device 1-i to the input/output buffer 3-i and then transferred from the input/output buffer 3-i to the host device 7. As a result, a situation occurs in which data transfer is degraded. In this way, if the designated files exist unevenly in the magnetic disk device 1, a situation may arise in which the data transfer speed of the host device 78 cannot be effectively increased. Therefore, in the second embodiment, by preventing files from being stored unbalanced, all the magnetic disk devices 1 are always operated for reading, and the data transfer speed to the host device 7 is increased. Furthermore, in this embodiment, the number of magnetic disk devices is increased in order to further increase the storage capacity. FIG. 1 shows the configuration of a collective magnetic disk device using the present invention, and the difference from FIG. 3 is that the magnetic disk device 1
It has two sides of input/output buffer 3 with the same capacity as one cylinder of
The file read from the magnetic disk device 1 can be stored in the input/output buffer 3b on the second side while the file is being transferred to the magnetic disk device 1. In addition, one data storage device M15 is configured by m magnetic disk devices 1i1-i-1 to 1-i-m and a multiplexer 14, and the total storage capacity of the collective magnetic disk device is divided by the devices and multiple devices. It is (nXm) times the storage capacity of the magnetic disk device. To explain the operation, first, similar to the first embodiment, the database structure definition process is performed, but information identifying the m magnetic disk drives N1 connected to the input/output buffer 3 via the multiplexer 14 is added to the structure definition information. to add. The database is constructed in the same manner as in Example 1, but there are some differences. The difference from the first embodiment is that the file given by the file information is divided into the number of magnetic disk drives to be monitored, and is distributed and stored in all the magnetic disk drives. In addition, the data of the input/output buffer 3 is stored in the m devices given by the physical information and the plurality of magnetic disk devices 1.
-i-j to control and store multiplexer ~l4. The file division method is to calculate the division size by dividing the file size by the number of devices, and from the beginning of the file to the device for each division size and to the multiple magnetic disk devices 1-1-
In some cases, data is stored in order from j to 1-2-j, then 1-3-j, and in other cases, data is stored in a device of a predetermined size, such as 1-2-j, 1-3-j, etc. from the beginning of the file. There are disk devices that store data in order from disk devices 1-1-j to 1-2-j and 1-3-j. If the file size is not divisible by the number of magnetic disk units, invalid data is added to the end so that the file size is a multiple of the number of magnetic disks. Store the file so that the beginning of the file is located at . Next, file reading will be explained. This is also done in the same way as in the first embodiment, but in this configuration, the input/output buffer 3 is
3a and 3b, it is possible to start the process of reading the next file at the time when the file read from each magnetic disk device l is stored in the input/output buffer 3. The time relationship of file read processing is as shown in Figure 6 above, and compared to the first embodiment, there is no waiting time until the state is ready for writing data to the input/output buffer 3, and faster transfer is possible. It becomes possible. The relationship that satisfies the transfer speed required by the host device 7 under the same conditions as in Example 1 is as follows:
device and multiple magnetic disk drives ill-i-
The time to read a file from j to one input/output buffer 3a-i of two input/output buffers 3-i (s +
1/R + M/t) is within the time (n M./T) for transferring files from all other input/output buffers 3b-1 to 3b-n to the host device 7, and this is expressed as a mathematical formula, and this mathematical formula can be easily written as the following formula. Based on this condition, it is possible to determine the number of data storage devices 15 to satisfy the transfer speed required by the host device, as in the first embodiment. Furthermore, when a large storage capacity is required, the data storage device 15 can be configured with m magnetic disk devices and the multiplexer 14, and the storage capacity can be multiplied by m. If a collective magnetic disk device is constructed using the minimum number of magnetic disk devices l, it will have the best cost performance. In the embodiment shown in FIG. 16, the seek operation of each magnetic disk device is started at the time when the data transfer from the input/output buffers 3-1 to 3-n to the host device is completed, but each time the read operation is completed. It is clear that you can do this with Although the above two embodiments have been described using a magnetic disk device, it is clear that the same applies to a storage device in which a storage medium rotates, such as an optical disk device other than a magnetic disk device. [Effects of the Invention] According to the present invention, it is possible to satisfy the high transfer speed required by host equipment, and to configure a collective magnetic disk device with a minimum number of magnetic disk devices according to the capacity of the database to be stored. This has the effect of providing an inexpensive collective magnetic disk that can input and output multiple files continuously at high speed regardless of the file size.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明を文字列検索装置に適用した一実施例で
ある実施例2を示す構成図、第2図は文字列検索装置の
一例を示す構成図、第3図は本発明を文字列検索装置に
適用した一実施例である実施例1を示す構或図、第4図
は構造定義テーブルの構造を示す図、第5図は格納位置
ポインタテーブルの構造を示す図、第6図は物理情報テ
ーブルの構造を示す図、第7図は実施例1のファイルの
書き込み処理のフローチャート図、第8図は実施例1の
集合型磁気ディスク装置におけるファイルの書き込み処
理のタイムチャート図、第9図は実施例lのファイルの
読み出し処理のフローチャート図、第10[i1はマル
チプレクスコントローラの構威を示す図、第11図は実
施例1の集合型磁気ディスク装置におけるファイルの読
み出し処理のタイムチャート図,第l2@は実施例lの
集合型磁気ディスク装置におけるファイルの読み出し処
理のタイムチャート図,第13図は実施例工において3
台の磁気ディスク装置で構威した集合型磁気ディスク装
置におけるファイルの読出し処理のタイムチャート図、
第14図は実施例1において4台の磁気ディスク装置で
構成した集合型磁気ディスク装置におけるファイルの読
出し処理のタイムチャート図、第15図は実施例1にお
いて5台の磁気ディスク装置で構威した集合型磁気ディ
スク装置におけるファイルの読出し処理のタイムチャー
ト図、第16図は実施例2の集合型磁気ディスク装置に
おけるファイルの読み出し処理のタイムチャート図であ
る。 符号の説明 1・・・磁気ディスク装置 2・・・磁気ディスクコントローラ 3・・・入出力バッファ 4・・・マルチディスクコントローラ 5・・・通信メモリ 6・・・物理情報テーブル 7・・・上位機器 8・・・マルチプレクスコントローラ 9・・・マスクコントローラ 10.12・・・データバス 11.13・・・制御バス 14・・・マルチプレクサ 15・・・データ記憶装置 工6・・・集合型磁気ディスク装置 101・・・文字列検索装置 102・・・検索制御手段 103・・・ディスク制御手段 104・・・複合条件判別手段 105・・・文字照合手段 106・・・文字列記憶手段 107〜111・・・制御手段 201・・・マルチプレクサ 202・・・DMAコントローラ 203・・・先頭アドレス登録テーブル204・・・終
了アドレス登録テーブル13図 わー 竿ζぎ 不5ぺ1りイ立夏 〆イ〉7テー11レ鼾圓 1句賛L・j嘴宅反デーフ゛1レ 茅ど図 5社 ’i−v−m ki.+3園 算?φ園 7− tデ図
FIG. 1 is a block diagram showing a second embodiment, which is an embodiment in which the present invention is applied to a character string search device. FIG. 2 is a block diagram showing an example of a string search device. FIG. FIG. 4 is a diagram showing the structure of a structure definition table, FIG. 5 is a diagram showing the structure of a storage position pointer table, and FIG. 7 is a flowchart of the file writing process in the first embodiment. FIG. 8 is a time chart of the file writing process in the collective magnetic disk device of the first embodiment. FIG. 9 is a flowchart of file read processing in Embodiment 1, 10 [i1 is a diagram showing the structure of the multiplex controller, and FIG. 11 is a time chart of file read processing in the collective magnetic disk device of Embodiment 1. Chart diagram, No. 12@ is a time chart diagram of file read processing in the collective magnetic disk device of Example I, and FIG.
A time chart diagram of file read processing in a collective magnetic disk device configured with one magnetic disk device,
FIG. 14 is a time chart of file read processing in a collective magnetic disk device configured with four magnetic disk devices in Example 1, and FIG. 15 is a time chart of file read processing in a collective magnetic disk device configured with five magnetic disk devices in Example 1. FIG. 16 is a time chart of file read processing in the collective magnetic disk device of the second embodiment. Explanation of symbols 1...Magnetic disk device 2...Magnetic disk controller 3...I/O buffer 4...Multi-disk controller 5...Communication memory 6...Physical information table 7...Upper device 8...Multiplex controller 9...Mask controller 10.12...Data bus 11.13...Control bus 14...Multiplexer 15...Data storage device 6...Collective magnetic disk Device 101...Character string search device 102...Search control means 103...Disk control means 104...Compound condition determination means 105...Character matching means 106...Character string storage means 107-111. ...Control means 201...Multiplexer 202...DMA controller 203...Start address registration table 204...End address registration table 13 11th level snoring round 1 poem praise L・j beak defense 1st level chido diagram 5 company'i-v-m ki. +3 garden calculation? φ garden 7-t de figure

Claims (1)

【特許請求の範囲】 1、磁気ディスク装置を有する複数台のデータ記憶装置
と、該データ記憶装置へ入出力するデータを一時格納す
る入出力バッファと、該データ記憶装置と該入出力バッ
ファの制御を行なうマルチディスクコントローラからな
る集合型磁気ディスク装置と、該マルチディスクコント
ローラ制御命令を発行する上位機器とを有する磁気ディ
スクシステムにおいて、前記上位機器の要求する転送速
度がT[Byte/sec]、該磁気ディスク装置の1
シリンダ分の容量がM[Byte]、上記データ記憶装
置から上記入出力バッフアへのデータ転送速度をt[B
yte/sec]、上記磁気ディスク装置の最小シーク
時間をs[sec]、上記磁気ディスク装置の回転速度
をR[rps]、上記入出力バッファの容量を上記磁気
ディスク装置の該シリンダ分の容量M[Byte]と同
一またはそれ以上とするとき、上記磁気ディスク装置の
最小シーク時間s[sec]が上記入出力バッファのデ
ータM[Byte]を上記上位機器に転送する時間(M
/T)[sec]より長いとき n≧T{1/t+1/M〔s+(1/R)〕}また、上
記磁気ディスク装置の最小シーク時間s[sec]が上
記入出力バッファのデータM[Byte]を上記上位機
器に転送する時間(M/T)[sec]以下のとき n≧1+T(1/t+1/MR)} を満足するn台のデータ記憶装置によって構成すること
を特徴とする集合型磁気ディスク装置。 2、請求項1記載の集合型磁気ディスク装置において、
上記データ記憶装置として、磁気ディスクコントローラ
を有する複数台の磁気ディスク装置と、複数台の上記磁
気ディスク装置の内の1台の上記磁気ディスク装置を選
択するマルチプレクサによって構成することを特徴とす
る集合型磁気ディスク装置。 3、請求項1記載の集合型磁気ディスク装置において、
上記入出力バッファを上記データ記憶装置1台につき2
面持ち、第1面の入出力バッファのデータを上記上位機
器に転送している間に、第2面の入出力バッファに上記
データ記憶装置からの読み出したデータを格納し、上記
磁気ディスク装置の最小シーク時間s[sec]が上記
入出力バッファのデータM[Byte]を上記上位機器
に転送する時間以下のときに n≧T{1/t+1/M〔s+(1/K)〕}を満足す
るnを有することを特徴とした集合型磁気ディスク装置
。 4、請求項1記載の集合型磁気ディスク装置において、
上記上位機器とマルチディスクコントローラを接続する
通信メモリ手段をマルチディスクコントローラ内に有す
ることを特徴とする集合型磁気ディスク装置。 5、請求項4記載の集合型磁気ディスク装置において、
上記通信メモリ手段として半導体記憶素子有することを
特徴とする集合型磁気ディスク装置。 6、請求項1記載の集合型磁気ディスク装置において、
上位機器から転送される論理分類の固有の識別コードで
ある論理分類よりと、該論理分類内のファイル固有の番
号とからなる、ファイルIDを解釈し、上記磁気ディス
ク装置の物理位置に対応させる物理情報テーブル手段を
上記マルチディスクコントローラ内に有することを特徴
とする集合型磁気ディスク装置。 7、請求項6記載の集合型磁気ディスク装置において、
上記物理情報テーブル手段として半導体記憶素子を有す
ることを特徴とする集合型磁気ディスク装置。 8、請求項1記載の集合型磁気ディスク装置において、
上記磁気ディスク装置の同一シリンダ上に読み出すファ
イルが複数件ある場合に、先に読み出すファイルと次に
読み出すファイルとの間の読み出さないファイル群の総
容量を に[Byte]、上記データ記憶装置から上記入出力バ
ッフアへの転送速度をを[Byte/sec]、上記磁
気ディスク装置の回転速度をR[rps]とするとき k≦t/2R を満足するに[Byte]の場合には、先に読み出すフ
ァイルと次に読み出すファイルとの間の、読み出す必要
のないファイル群も上記入出力バッファに一旦読み出し
、上記入出力バッファから上記上位機器への転送の際に
、不要なファイル群の部分を除いて転送する手段を持つ
マルチディスクコントローラを有することを特徴とした
集合型磁気ディスク装置。
[Claims] 1. A plurality of data storage devices each having a magnetic disk device, an input/output buffer for temporarily storing data to be input/output to the data storage device, and control of the data storage device and the input/output buffer. In a magnetic disk system that has a collective magnetic disk device consisting of a multi-disk controller that performs magnetic disk device 1
The capacity of the cylinder is M [Bytes], and the data transfer rate from the data storage device to the input/output buffer is t [B
yte/sec], the minimum seek time of the magnetic disk device is s [sec], the rotational speed of the magnetic disk device is R [rps], and the capacity of the input/output buffer is the capacity M of the magnetic disk device for the cylinder. [Byte], when the minimum seek time s [sec] of the magnetic disk device is the time (M
/T)[sec] when n≧T{1/t+1/M[s+(1/R)]} Also, the minimum seek time s[sec] of the magnetic disk device is longer than the data M[sec] of the input/output buffer. When the time (M/T) [sec] for transferring [Byte] to the above-mentioned host device is less than n≧1+T(1/t+1/MR)}. type magnetic disk device. 2. In the collective magnetic disk device according to claim 1,
A collective type characterized in that the data storage device is constituted by a plurality of magnetic disk devices each having a magnetic disk controller and a multiplexer that selects one of the plurality of magnetic disk devices. Magnetic disk device. 3. In the collective magnetic disk device according to claim 1,
2 of the above input/output buffers per data storage device.
While the data in the input/output buffer on the first side is being transferred to the host device, the data read from the data storage device is stored in the input/output buffer on the second side, and n≧T{1/t+1/M[s+(1/K)]} is satisfied when the seek time s[sec] is less than or equal to the time to transfer data M[Byte] of the input/output buffer to the higher-level device. A collective magnetic disk device characterized by having n. 4. In the collective magnetic disk device according to claim 1,
A collective magnetic disk device characterized in that the multi-disk controller includes communication memory means for connecting the host device and the multi-disk controller. 5. In the collective magnetic disk device according to claim 4,
A collective magnetic disk device comprising a semiconductor storage element as the communication memory means. 6. The collective magnetic disk device according to claim 1,
A physical controller that interprets a file ID consisting of a logical classification, which is a unique identification code of a logical classification transferred from a higher-level device, and a number unique to a file within the logical classification, and makes it correspond to the physical location of the magnetic disk device. A collective magnetic disk device comprising information table means in the multi-disk controller. 7. The collective magnetic disk device according to claim 6,
A collective magnetic disk device comprising a semiconductor storage element as the physical information table means. 8. The collective magnetic disk device according to claim 1,
When there are multiple files to be read on the same cylinder of the above magnetic disk device, the total capacity of the group of files that will not be read between the first file to be read and the next file to be read is set in [Bytes], and the total capacity of the files to be read from the above data storage device is If the transfer rate to the input/output buffer is [Byte/sec] and the rotation speed of the magnetic disk device is R [rps], then if k≦t/2R is satisfied [Byte], read first. Files that do not need to be read between the file and the next file to be read are also read into the input/output buffer, and when transferred from the input/output buffer to the host device, the unnecessary files are removed. A collective magnetic disk device characterized by having a multi-disk controller having means for transferring data.
JP1188772A 1989-06-14 1989-07-24 Cluster type magnetic disk device Pending JPH0354625A (en)

Priority Applications (12)

Application Number Priority Date Filing Date Title
JP1188772A JPH0354625A (en) 1989-07-24 1989-07-24 Cluster type magnetic disk device
DE69032712T DE69032712T2 (en) 1989-06-14 1990-06-14 HIERARCHICAL PRE-SEARCH TYPE DOCUMENT SEARCH METHOD, DEVICE THEREFOR, AND A MAGNETIC DISK ARRANGEMENT FOR THIS DEVICE
EP90909360A EP0437615B1 (en) 1989-06-14 1990-06-14 Hierarchical presearch-type document retrieval method, apparatus therefor, and magnetic disc device for this apparatus
PCT/JP1990/000774 WO1990016036A1 (en) 1989-06-14 1990-06-14 Hierarchical presearch-type document retrieval method, apparatus therefor, and magnetic disc device for this apparatus
US07/555,483 US5168533A (en) 1989-06-14 1990-08-09 Hierarchical presearch type text search method and apparatus and magnetic disk unit used in the apparatus
US07/843,162 US5469354A (en) 1989-06-14 1992-02-28 Document data processing method and apparatus for document retrieval
US07/914,334 US5220625A (en) 1989-06-14 1992-07-17 Information search terminal and system
US07/985,795 US5519857A (en) 1989-06-14 1992-11-30 Hierarchical presearch type text search method and apparatus and magnetic disk unit used in the apparatus
US08/031,625 US5471610A (en) 1989-06-14 1993-03-15 Method for character string collation with filtering function and apparatus
US08/031,700 US5454105A (en) 1989-06-14 1993-03-15 Document information search method and system
US08/444,842 US5748953A (en) 1989-06-14 1995-05-18 Document search method wherein stored documents and search queries comprise segmented text data of spaced, nonconsecutive text elements and words segmented by predetermined symbols
US08/839,407 US6094647A (en) 1989-06-14 1997-04-11 Presearch type document search method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1188772A JPH0354625A (en) 1989-07-24 1989-07-24 Cluster type magnetic disk device

Publications (1)

Publication Number Publication Date
JPH0354625A true JPH0354625A (en) 1991-03-08

Family

ID=16229511

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1188772A Pending JPH0354625A (en) 1989-06-14 1989-07-24 Cluster type magnetic disk device

Country Status (1)

Country Link
JP (1) JPH0354625A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06297653A (en) * 1991-10-04 1994-10-25 Kao Corp Container
WO2014155772A1 (en) * 2013-03-29 2014-10-02 株式会社東芝 Storage device control system, storage device control device, and program
JP2017123158A (en) * 2016-01-06 2017-07-13 三星電子株式会社Samsung Electronics Co.,Ltd. Data management method and apparatus, and electronic apparatus

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06297653A (en) * 1991-10-04 1994-10-25 Kao Corp Container
WO2014155772A1 (en) * 2013-03-29 2014-10-02 株式会社東芝 Storage device control system, storage device control device, and program
JP2017123158A (en) * 2016-01-06 2017-07-13 三星電子株式会社Samsung Electronics Co.,Ltd. Data management method and apparatus, and electronic apparatus

Similar Documents

Publication Publication Date Title
US5317727A (en) Method apparatus for determining prefetch operating for a data base
US6631443B1 (en) Disk storage system having capability for performing parallel read operation
EP0130349B1 (en) A method for the replacement of blocks of information and its use in a data processing system
US7536505B2 (en) Storage system and method for controlling block rearrangement
JP2804115B2 (en) Disk file system
JPH07191899A (en) File transfer method, data access method and data writing method
US6424970B1 (en) Sorting system and method executed by plural computers for sorting and distributing data to selected output nodes
CN110968269A (en) SCM and SSD-based key value storage system and read-write request processing method
JP2002182953A (en) Distributed file management method
JPH04268622A (en) Rotary memory system
US7600074B2 (en) Controller of redundant arrays of independent disks and operation method thereof
JPH0354625A (en) Cluster type magnetic disk device
JPS59220853A (en) Disc cache system
JPH0277884A (en) Information retrieval device
US10860577B2 (en) Search processing system and method for processing search requests involving data transfer amount unknown to host
JPH1063436A (en) Method and device for storing data
JPH06332622A (en) Information processor
US20100241643A1 (en) Magnetic disk device and metadata management system
JPH0581337A (en) Data processor
JPH0328944A (en) Disk cache controller, and control method and integrated circuit for control thereof
CN115525209A (en) Metadata compression method and device
Chun Access and organization of secondary memory devices
JPS63291145A (en) Method for managing file
JPS63120349A (en) File multiplex control system
JPH02163850A (en) Memory device