WO2001006660A1 - Amount-of-data reducing method and reduced amount-of-data generating system - Google Patents

Amount-of-data reducing method and reduced amount-of-data generating system Download PDF

Info

Publication number
WO2001006660A1
WO2001006660A1 PCT/JP2000/004756 JP0004756W WO0106660A1 WO 2001006660 A1 WO2001006660 A1 WO 2001006660A1 JP 0004756 W JP0004756 W JP 0004756W WO 0106660 A1 WO0106660 A1 WO 0106660A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
extracting
predetermined
blocks
same
Prior art date
Application number
PCT/JP2000/004756
Other languages
French (fr)
Japanese (ja)
Inventor
Kouki Hara
Motoshi Kimura
Original Assignee
Vertex Software Co.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vertex Software Co. filed Critical Vertex Software Co.
Priority to AU60174/00A priority Critical patent/AU6017400A/en
Publication of WO2001006660A1 publication Critical patent/WO2001006660A1/en

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/42Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code using table look-up for the coding or decoding process, e.g. using read-only memory

Definitions

  • the present invention relates to a data reduction method and a data reduction system, and more particularly, to a data reduction method and a data reduction system in which the amount of data to be transmitted is reduced to improve transmission efficiency.
  • a digital content distribution system is a software system that manages a data recording device that can record digital data through information transmission means such as a satellite system or a line.
  • information transmission means such as a satellite system or a line.
  • the content distribution means transmits the request.
  • a collation code for collating the identification code with the time-axis-compressed digital data of the content software corresponding to the request is delivered to the data recording device through the information transmission means.
  • This data recording device expands the digital data and outputs it to the output device only when the received collation code is matched with its own identification code.
  • the decompression device is characterized by expanding the digital data compressed and recorded in the data recording device and reproducing the content software.
  • the information processing device and the communication method are communication methods between the first and second information processing devices connected by a communication network, wherein the first information processing device transmits the second information processing device to the second information processing device.
  • a receiving step of receiving the data transmitted in the transmitting step in the first information processing apparatus by adding Restoring and storing this.
  • Many of these conventional systems employ compression techniques, which require the software required for compression when decompressing, and have a compression ratio of about 10%.
  • this compression method requires the same software for compression and decompression, and software must be used for both compression and decompression, and both decompression and compression are performed by the user. .
  • the conventional compression method has a problem that the transmission efficiency cannot be improved because the software compression ratio is several tens of percent.
  • a data compression method for compressing data that has been reduced by a data reduction method, a data reduction system, and a data reduction method according to the present invention, and a method for compressing compressed data
  • the data reduction method, the data transmission system and the data recording system for reducing the capacity are to be configured as shown below.
  • the search for extracting the same portion is characterized in that the data to be searched is divided into data blocks of an arbitrary size, and the data blocks are collated in an arbitrary order and collated.
  • the data reduction method described in (1) is characterized in that the data to be searched is divided into data blocks of an arbitrary size, and the data blocks are collated in an arbitrary order and collated.
  • the search for extracting the same part is characterized in that the data to be searched is divided into data blocks of an arbitrary size, and matching is performed on data obtained by connecting any number of the data blocks.
  • the data reduction method according to (1) is characterized in that the data to be searched is divided into data blocks of an arbitrary size, and matching is performed on data obtained by connecting any number of the data blocks.
  • the data to be searched is divided into data blocks of an arbitrary size, and a higher priority is given to a data block having a large number of reference appearances.
  • the data to be searched is divided into data blocks of an arbitrary size, and the appearance order and appearance frequency of data blocks of the same data among the data blocks are obtained.
  • the predetermined mathematical formula is compared with data prepared from a pattern prepared in advance, and selects a familiar mathematical formula.
  • the data to be searched is divided into data blocks of an arbitrary size, and collation is performed on data obtained by connecting the data blocks in an arbitrary order.
  • the search for extracting the same portion is characterized in that the data to be searched is divided into data blocks of an arbitrary size, and matching is performed on data obtained by connecting any number of the data blocks.
  • a small-capacity data generation system according to (5) In the search for extracting the same portion, the data to be searched is divided into data blocks of an arbitrary size, and the priority of the data block having a higher number of reference appearances is set higher than that of the data block.
  • the small-capacity data generation system according to (15) characterized in that:
  • the data to be searched is divided into data blocks of an arbitrary size, and the appearance order and appearance frequency of data blocks of the same data in the data blocks are obtained.
  • the search for extracting the same portion is characterized in that the data to be searched is divided into data blocks of an arbitrary size, and the data blocks are collated in an arbitrary order and collated with data.
  • a data compression method for compressing data that has been reduced by the data reduction method described in (29).
  • the search for extracting the same part is characterized in that the data to be searched is divided into data blocks of an arbitrary size, and matching is performed on data obtained by connecting the data blocks in an arbitrary number.
  • the data to be searched is divided into data blocks of an arbitrary size, and the A data compression method for compressing data reduced in size by the data reduction method described in (29), wherein the priority is set higher.
  • the data to be searched is divided into data blocks of an arbitrary size, and the appearance order and the appearance frequency of the data blocks of the same data in the data blocks are determined.
  • the sequence of a predetermined length has a length that can be easily applied to the mathematical formula, and compresses data reduced in size by the data reduction method according to (29). Data compression method.
  • the predetermined mathematical formula is compared with a graph prepared in advance, and a familiar mathematical formula is selected, and the predetermined mathematical formula is reduced by the data reduction method according to (29) or (40).
  • a data compression method that compresses the volumeized data.
  • Predetermined source data is compressed by a predetermined method, the compressed data is expanded from a predetermined data length until the data no longer matches, and the longest identical part is extracted, and the extracted longest identical part is extracted. Starting with the data length to be excluded, the data length is expanded until the data no longer matches, and the next longest identical part is repeatedly extracted. The extracted identical part and the remaining data are composed of the predetermined length. Converting the converted data to a predetermined mathematical expression using the converted data as a parameter, converting the converted data into a predetermined mathematical expression. Method to reduce data capacity.
  • the search for extracting the same part is characterized in that the data to be searched is divided into data blocks of an arbitrary size, and the data blocks are collated in any order and collated. (43) A data reduction method for reducing the compressed data volume described in (43).
  • the data to be searched is divided into data blocks of an arbitrary size, and collation is performed on data obtained by connecting the data blocks in an arbitrary number.
  • the data to be searched is The data block is divided into data blocks, and priority is given to a data block having a large number of reference appearances, wherein the compressed data described in (43) is reduced in data volume.
  • the data to be searched is divided into data blocks of an arbitrary size, and the appearance order and the appearance frequency of the data blocks of the same data in the data blocks are obtained.
  • the predetermined mathematical formula is a pattern data which is prepared in advance and will be generated.
  • (61) Starting from the specified source data with the specified data length until the data no longer matches Means for extracting the longest identical part by expanding the data, and extracting the next longest identical part by expanding the data starting from a predetermined data length, excluding the extracted longest identical part, until the data no longer matches. Means for repeatedly performing the same operation, means for converting the extracted identical part and the remaining data into a sequence having a predetermined length, and comparing the converted sequence with the pattern data which will generate the sequence. Means for converting the compared difference into a predetermined mathematical expression as a parameter; and recording the reduced capacity data converted into the predetermined mathematical expression on a predetermined recording medium and reducing the recorded reduced capacity.
  • a small-capacity data reproduction system comprising reproduction means capable of reproducing data appropriately.
  • (63) Means for extracting the longest identical portion by extending the predetermined source data from the predetermined byte length until the data no longer matches, and extracting the data excluding the extracted longest identical portion to the predetermined data length Means to repeatedly expand data until the data no longer matches and extract the next longest identical part, and convert the extracted identical part and the remaining data into a sequence of predetermined length Means for performing the conversion, the means for comparing the converted sequence with the patterned data that will be generated, the means for converting the compared difference into a predetermined mathematical expression as a parameter, and the small value converted to the predetermined mathematical expression.
  • a small-capacity data reproduction system comprising reproduction means capable of appropriately reproducing the large-capacity data.
  • FIG. 1 is an overall flow chart for realizing the data reduction method of the present invention.
  • FIG. 2 is an overall block diagram for realizing the data reduction method.
  • FIG. 3 is a block diagram showing a block generation / rule generation unit and a coding calculation unit that constitute the capacity reduction method.
  • FIG. 4 is an explanatory diagram showing a method of searching for the same block.
  • FIG. 5 is an explanatory diagram showing a method for searching for an approximate block.
  • Fig. 6 is a conceptual diagram of usage frequency measurement.
  • FIG. 7 is a conceptual diagram for detecting unique data.
  • FIG. 8 is a conceptual diagram for generating reduced-volume data using mathematical formulas. BEST MODE FOR CARRYING OUT THE INVENTION
  • a system for reducing data capacity includes, as shown in FIG. 1, source data 100 such as video data, music data, etc.
  • the unique conversion data 210 is created by performing the conversion process, the unique conversion data 210 is converted into a predetermined mathematical expression to generate the mathematical expression conversion data 220, and the data amount is reduced for transmission. This is to create the reduced capacity data 300.
  • the unique conversion data 210 and the mathematical expression conversion data 220 constitute a recording calculation unit 200.
  • the created small-capacity data 300 is compressed and transmitted by a well-known compression method, or the source data 100 is compressed.
  • this small-capacity data 300 is transmitted, or the source data is compressed into reduced-capacity data and then compressed again by a compression method to create reduced-capacity data.
  • this small-capacity data 300 is transmitted to a desired destination by radio wave, light, or electric communication, or CD-RO It is configured to be recordable on a recording medium composed of a disk-shaped medium such as M, a tape-shaped medium such as DAT or DDS, or a recording medium composed of an IC memory.
  • the recording medium is not limited to these, and includes, for example, using optical, magnetic, physical and chemical recording media. Further, it is needless to say that the recorded small-volume data can be reproduced and used.
  • the data reduction system having such a feature includes a unique conversion data generation unit 210 that converts source data 100 into a predetermined sequence to generate unique conversion data, Formula conversion data generation unit 220 that converts the unique conversion data into meaningful data and converts it into mathematical formulas to generate formula conversion data, unique conversion data generation unit 210, and formula conversion data generation
  • the section 220 is composed of a block generation and rule generation section 400 for extracting the characteristics of the data itself and performing block processing and rule processing to reduce the data amount.
  • the block generation and rule generation unit 400 includes a common part extraction unit 410 for extracting a common part of data, a difference extraction unit 420, and a coding calculation unit 2 It consists of 0 0.
  • the common part extraction unit 4110 is divided into the same part extraction unit 411 that extracts the same part of the data, the approximate part extraction unit 412 that extracts the approximate part of the data, and the priority based on the frequency of use of the same part. And a data weighting unit 4 13 for weighting the data by adding a.
  • the same part extraction unit 4111 includes a longest same part extraction logic 4 14 and a different direction same part extraction logic 4 15.
  • the longest identical part extraction logic 4 1 4 is to extract the longest identical part of the data, starting from a predetermined data length, decompressing the data to be searched until it no longer matches, and extracting the longest Extract the same part. In other words, the largest identical part can be extracted, and the more identical parts, the smaller the amount of data to be sent.
  • the different direction same part extraction logic 4 15 searches from the reverse direction and extracts the same part.When searching in the forward direction, the data is compared not only in the forward direction but also in the reverse direction when matching the data. The collation is performed.
  • the approximated part extraction unit 412 extracts a common block including a dissimilar part and includes an out-of-order data detection logic 416 and a different data length detection logic 41 7 It is composed of
  • the out-of-order data detection logic 416 detects a portion that uses the same data column in a different order, divides the data to be searched into data blocks of an arbitrary size, and divides the divided data blocks into arbitrary data blocks. The collation is performed on the data concatenated in order.
  • the different data length detection logic 417 detects a portion including the same data string and having a different total data length, divides the search target data into data blocks of an arbitrary size, and divides the divided data blocks. Performs collation on data linked in any number.
  • Fig. 5 is a conceptual diagram of the approximate partial extraction. First, when there is a data block called "EFGH I ABC" 41, the approximate ones are “ABDEFGH I" 40 and “AABCDDDEFGH IJ 42". The common part of these is “EFGH l” 50 is the common block. By gathering approximate blocks having this common part, it is possible to set some rules there.
  • a predetermined method can be selected from the aggregate of approximate blocks without being limited to the processing of the same block.
  • a predetermined rule can be applied based on statistics and the like, and it becomes possible to reduce the capacity of data overnight.
  • the data weighting section 413 is composed of a use frequency measurement logic 418 for determining the priority order based on the frequency of the common block and a unique data detection logic 419 for processing data having no common block. Have been.
  • the usage frequency measurement logic 418 determines the priority based on the usage frequency, the reference block content, and the like, and divides the data to be searched into data blocks of an arbitrary size. Then, the number of appearances of the divided data blocks is counted.
  • the unique data detection logic 4 "I 9 measures the similarity of data and determines the priority, and divides the data to be searched into data blocks of arbitrary size. The appearance of the divided data blocks Determine the order and frequency of use.
  • FIG. 6 is a conceptual diagram of the usage frequency measurement logic.
  • “AJ data block is referred to by“ A 1 J, ”“ A 2 ”in source data 100
  • “ BJ data block is represented by ⁇ ⁇ If only “1” is referenced, “ ⁇ ” is referenced from two places, so the priority is higher than “BJ one place”.
  • Fig. 7 is a conceptual diagram of the unique data detection logic, which includes data blocks ⁇ HI '' and ⁇ ys '' that are common to source data 100, and therefore has low priority and does not include common blocks. Has a lower priority.
  • the difference extraction unit 420 includes a common part comparison unit 421 that compares the data of the blocks having the common part with each other, and a non-similar part of the block having the common part. It is composed of a difference comparison unit 4 22 which compares the differences.
  • the common part comparing section 421 compares the common parts to extract the difference, and divides and compares the dissimilar parts of the common block.
  • a repetitive block detection logic 4 2 4 for detecting repetition of the common block.
  • the division / comparison logic 4 2 3 divides the data into arbitrary data lengths and compares them with the blocks of the extracted common part, and divides the data to be searched into data blocks of arbitrary size. Then, the number included in the common part is measured.
  • the repetitive block detection logic 4 2 4 divides the data into arbitrary data lengths and detects continuity, and divides the data to be searched into data blocks of arbitrary size. Then, a continuous part in a specific common part is detected.
  • the difference comparison unit 422 calculates the similarity detection logic 425 that detects the similarity of the dissimilar part in the block including the common part and the content ratio of the common part that includes the dissimilar part with respect to the common part. It consists of common part content ratio measurement logic 4 26 for measurement.
  • the similarity detection logic 425 determines the priority based on the similarity between the difference data, and measures the similarity in the same manner as the common part to determine the priority.
  • Common part included The ratio measurement logic 426 corrects the priority based on the ratio included in the common part, measures the frequency of use of the common part, and corrects the priority.
  • the coding calculation unit 200 includes a unique conversion data generation unit 210 that uniquely converts the data that has been blocked and ruled by the block generation and rule generation unit 400 described above, and a predetermined mathematical expression. And a mathematical expression conversion data generation unit 220 for conversion.
  • the unique conversion data generation unit 210 converts the common part of the coded and ruled data into a sequence of arbitrary length. Convert to
  • the mathematical expression conversion data generation unit 220 generates predetermined data by applying a predetermined mathematical expression to the data composed of the sequence created by the unique conversion data generation unit 210 described above. Based on the fluctuation of the sequence generated by the unique conversion data generation unit 210, a predetermined sequence of appearing and disappearing trends is detected, compared with the sequence data of the tendency prepared in advance, and the most common formula is selected. I do. Then, the difference from the pattern drawn by the selected formula is converted into a formula as a parameter.
  • FIG. 8 is a conceptual diagram for generating reduced-volume data by using a mathematical formula, wherein “A BD 8 W
  • the source data 100 is uniquely converted into a predetermined sequence to make it meaningful data, and at the same time, the statistical properties of the data are grasped by blocking and making rules, and the data
  • the statistical properties of the data are grasped by blocking and making rules, and the data
  • grasping patterns and formulating the grasped patterns as parameters to generate reduced-volume data all source data can be used as common blocks, trend parameters, and rule-based data. This allows the data to be reduced without truncating the data that makes up the source data, so that the restoration can be completely restored.
  • the predetermined data according to the present invention is expanded from the predetermined byte length until the data no longer matches, and the longest identical portion is extracted, and the extracted longest identical portion is removed.
  • Repeat the process of extracting the next longest identical part by expanding the data starting from the specified byte length until the data no longer matches, and converting the extracted identical part and the remaining data into a sequence of predetermined length By converting the converted sequence into a mathematical expression by using as a parameter the patternized data that would be generated in advance, the data to be transmitted can be converted into predetermined meaningful data. This has the effect of improving the transmission efficiency by reducing the amount of data that is actually transmitted in entanglement.

Abstract

Predetermined source data is decompressed until data does not agree starting with a predetermined data length to extract the longest agreeing part. The source data except the extracted longest agreeing part is decompressed until data does not agree starting with a predetermined length to extract the next longest agreeing part. Such operations are repeated to transform the extracted agreeing part and the other part of the data to a sequence of numbers having a predetermined length. The sequence of numbers is compared with patterned data expected to occur, and the difference is made a parameter. The data is transformed into a predetermined mathematical expression according to the parameter to generate and output data the amount of which is reduced.

Description

明 細 書 データ小容量化方法及び小容量化データ生成システム 技術分野  Description Data reduction method and data generation system
本発明は、 データ小容量化方法及びデータ小容量化システムに関するものであり、 詳しくは伝送するデータ量を少なくして伝送の効率化を図ったデータ小容量化方法及 びデータ小容量化システムに関する。 背景技術  The present invention relates to a data reduction method and a data reduction system, and more particularly, to a data reduction method and a data reduction system in which the amount of data to be transmitted is reduced to improve transmission efficiency. . Background art
従来技術における圧縮やデータを配信するための技術として、 例えば特開平 1 1 一 1 4 9 7 0 7号公報で開示されているデジタルコンテンツ配信システムゃ特開平 7— 1 5 2 6 6 8号公報で開示されている情報処理装置及び配信方法などがある。  As a technique for compressing and distributing data in the prior art, for example, a digital content distribution system disclosed in Japanese Patent Application Laid-Open No. H11-149907 is disclosed in Japanese Patent Application Laid-Open No. Hei 7-152686. , An information processing apparatus and a distribution method.
デジタルコンテンツ配信システムは、 サテライトシステム又は回線等の情報伝送手 段を通じたデジタルデータを記録することのできるデータ記録装置を管理するソフ卜 ウェア利用者が映像、 画像、 音楽、 テキスト等のコンテンツソフトウェアを時間軸圧 縮してディスクデータに変換しコードを割り当てて蓄積するコンテンツ配信手段に対 し、 配信を希望するコンテンッソフトウェアのコードとデータ記録装置の識別コード をリクエスト送信すると、 コンテンツ配信手段はこのリクエス卜に応じたコンテンツ ソフ卜ウェアの時間軸圧縮したデジタルデータと識別コ一ドを照合する照合コードを 情報伝送手段を通じてデータ記録装置に配信する。 このデータ記録装置は受信した照 合コードが自身の識別コードと照合された場合にのみデジタルデータを展開して出力 装置に出力する。 展開装置は、 データ記録装置に圧縮記録されたデジタルデータを展 開してコンテンツソフトウエアを再生することを特徴とするものである。  A digital content distribution system is a software system that manages a data recording device that can record digital data through information transmission means such as a satellite system or a line. When a request for the content software code to be distributed and the identification code of the data recording device is transmitted to the content distribution means for compressing the time axis, converting the data into disc data, assigning a code, and storing the code, the content distribution means transmits the request. A collation code for collating the identification code with the time-axis-compressed digital data of the content software corresponding to the request is delivered to the data recording device through the information transmission means. This data recording device expands the digital data and outputs it to the output device only when the received collation code is matched with its own identification code. The decompression device is characterized by expanding the digital data compressed and recorded in the data recording device and reproducing the content software.
又、 情報処理装置及び通信方法は、 通信網で接続された第 1及び第 2の情報処理装 置間における通信方法であって、 第 1の情報処理装置より第 2の情報処理装置に対し てデータの要求を行う要求工程と、 要求工程による要求を受けて第 2の情報処理装置 が提供すべきデータを獲得する獲得工程と、 通信網の混み具合に応じて獲得工程で獲 得したデータを圧縮する圧縮工程と、 圧縮工程において圧縮されたデータにソフトウ エアの圧縮状態を示す情報を付加して第 1の情報処理装置において、 送信工程にて送 信されたデータを受信する受信工程と、 第 1の情報処理装置において受信されたデー タをその圧縮状態を示す情報に基づいて復元してこれを格納する格納工程とを備える。 このような従来システムの多くには圧縮手法が採用されその圧縮方式では圧縮の際 に必要なソフ卜ウェアが解凍の場合も必要となり、しかも圧縮率が 1 0 %程度である。 また、 この圧縮方式は圧縮と解凍に同一ソフトウェアが必要となり、 しかも圧縮にも 解凍にも全てにわたってソフトウエアが介在しなければならず、 その解凍も圧縮も全 てユーザが行うことになつている。 Further, the information processing device and the communication method are communication methods between the first and second information processing devices connected by a communication network, wherein the first information processing device transmits the second information processing device to the second information processing device. A requesting process for requesting data, and a second information processing device receiving the request in the requesting process. An acquisition step for acquiring data to be provided by the user, a compression step for compressing the data acquired in the acquisition step according to the degree of congestion in the communication network, and information indicating the compression state of software on the data compressed in the compression step. A receiving step of receiving the data transmitted in the transmitting step in the first information processing apparatus by adding Restoring and storing this. Many of these conventional systems employ compression techniques, which require the software required for compression when decompressing, and have a compression ratio of about 10%. In addition, this compression method requires the same software for compression and decompression, and software must be used for both compression and decompression, and both decompression and compression are performed by the user. .
しかしながら、 従来技術における圧縮方式は、 ソフトウェアの圧縮率が数十%であ るため、 伝送効率が改善できないという問題がある。  However, the conventional compression method has a problem that the transmission efficiency cannot be improved because the software compression ratio is several tens of percent.
従って、 データを伝送するに際して、 如何にしてデータ伝送の効率化を図れるかに 解決しなければならない課題を有する。 発明の開示  Therefore, when transmitting data, there is a problem to be solved how to improve the efficiency of data transmission. Disclosure of the invention
上記課題を解決するために、 本発明に係るデータ小容量化方法及び小容量化データ 生成システム及びデータ小容量化方法によリ小容量化したデータを圧縮するデータ圧 縮方法及び圧縮したデータを小容量化するデータ小容量化方法及び小容量化データ伝 送システム及び小容量化データ記録システムは下記に示す構成にすることである。  In order to solve the above-mentioned problems, a data compression method for compressing data that has been reduced by a data reduction method, a data reduction system, and a data reduction method according to the present invention, and a method for compressing compressed data, The data reduction method, the data transmission system and the data recording system for reducing the capacity are to be configured as shown below.
( 1 ) 所定のソースデータを所定データ長から始めてデータが一致しなくなるまでデ 一夕を伸長して最長同一部分を抽出し、 該抽出した最長同一部分を除くデータを所定 データ長から始めてデータが一致しなくなるまでデータを伸長して次の最長同一部分 を抽出することを繰り返し行い、 抽出された同一部分及び残リのデータを所定の長さ からなる数列に変換し、 該変換した数列を発生するであろうパターン化されたデータ と比較してその差をパラメータとし、 該パラメータに基づいて所定の数式に変換して 小容量化データを生成して出力することを特徴とするデータ小容量化方法。 (2) 前記同一部分を抽出するための検索において、 被対象データの同一照合時に順 方向及び逆方向からも照合を行うことを特徴とする (1 ) に記載のデータ小容量化方 法。 (1) Starting predetermined source data from a predetermined data length, expanding the data until the data no longer matches, extracting the longest identical part, and starting from the predetermined data length, excluding the extracted longest identical part from the predetermined data length It repeatedly expands the data until it no longer matches and extracts the next longest identical part, converts the extracted identical part and remaining data into a sequence of predetermined length, and generates the converted sequence. Data difference which is compared with patterned data which is likely to be used as a parameter, and is converted into a predetermined mathematical formula based on the parameter to generate and output the reduced capacity data. Method. (2) The method for reducing data capacity according to (1), wherein, in the search for extracting the same part, matching is performed from the forward direction and the backward direction at the same matching of the target data.
(3) 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデ 一タブロックに分割し、 該データブロックを任意順で連結したデータに対して照合を 行うことを特徴とする (1 ) に記載のデータ小容量化方法。  (3) The search for extracting the same portion is characterized in that the data to be searched is divided into data blocks of an arbitrary size, and the data blocks are collated in an arbitrary order and collated. The data reduction method described in (1).
(4) 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデ 一タブロックに分割し、 該データブロックを任意個数連結したデータに対して照合を 行うことを特徴とする (1 ) に記載のデータ小容量化方法。  (4) The search for extracting the same part is characterized in that the data to be searched is divided into data blocks of an arbitrary size, and matching is performed on data obtained by connecting any number of the data blocks. (1) The data reduction method according to (1).
(5) 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデ 一タブロックに分割し、 該データブロックのうち参照出現回数が多いものに対して優 先順位を高くするようにしたことを特徴とする (1 ) に記載のデータ小容量化方法。  (5) In the search for extracting the same part, the data to be searched is divided into data blocks of an arbitrary size, and a higher priority is given to a data block having a large number of reference appearances. (1) The method for reducing data capacity according to (1).
(6) 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデ 一タブロックに分割し、 該データブロックのうち同一データからなるデータブロック の出現順序及び出現頻度を求めて優先順位を設定することを特徴とする (1 ) に記載 のデータ小容量化方法。  (6) In the search for extracting the same part, the data to be searched is divided into data blocks of an arbitrary size, and the appearance order and appearance frequency of data blocks of the same data among the data blocks are obtained. The method for reducing data capacity according to (1), wherein priorities are set by setting.
(7) 前記同一部分を有するデータブロックを抽出した後において、 該データブロッ クに含まれる共通データを抽出すると共にその個数を計測するようにしたことを特徴 とする (1 ) に記載のデータ小容量化方法。  (7) After extracting the data block having the same part, the common data included in the data block is extracted and the number of the common data is measured, and the data size of the data block according to (1) is measured. Capacity method.
(8) 前記同一部分を有するデータブロックを抽出した後において、 該抽出されたデ 一タブロックのうち、 同一又は近似したデータブロックの繰り返し又は連続する箇所 を検出するようにしたことを特徴とする (1 ) に記載のデータ小容量化方法。  (8) After extracting the data block having the same part, a repeated or continuous portion of the same or similar data block is detected from among the extracted data blocks. (1) The method for reducing data capacity according to (1).
(9) 前記同一部分を有するデータブロックを抽出した後において、 該抽出されたデ 一タブロックのうち、 同一又は近似したデータブロックの使用頻度の高い順に優先順 位を設定するようにしたことを特徴とする (1 ) に記載のデータ小容量化方法。  (9) After extracting the data blocks having the same part, priorities are set in descending order of use frequency of the same or similar data blocks among the extracted data blocks. The data reduction method according to (1), which is characterized in that:
(10)前記同一部分を有するデータブロックを抽出した後において、 該抽出された データブロックのうち、 同一又は近似したデータブロックの使用頻度に応じて設定さ れている優先順位の補正を行うことを特徴とする(1 )に記載のデータ小容量化方法。(10) After extracting the data blocks having the same portion, the extracted data blocks are set in accordance with the frequency of use of the same or similar data blocks. (1) The method for reducing data capacity according to (1), wherein the priority order is corrected.
(1 1 ) 前記所定の長さの数列は、 前記数式に適用し易い長さであることを特徴とす る (1 ) に記載のデータ小容量化方法。 (11) The data reduction method according to (1), wherein the sequence of the predetermined length has a length that can be easily applied to the mathematical formula.
(1 2)前記グラフ化は、前記数列の変動に基づいて生成することを特徴とする (1 ) に記載のデータ小容量化方法。  (1 2) The method for reducing data capacity according to (1), wherein the graphing is generated based on a change in the sequence.
(1 3)前記所定の数式は、予め用意してあるパターンからされたデータと比較して、 卑近な数式を選択することを特徴とする (1 ) 又は (1 2) に記載のデータ小容量化 方法。  (13) The predetermined mathematical formula is compared with data prepared from a pattern prepared in advance, and selects a familiar mathematical formula. The data small capacity according to (1) or (12), Method.
(1 4) 前記選択した数式が、 発生するであろうパターン化されたデータとの差を、 数列から数式に変換する際のパラメ一タとすることを特徴とする (1 3) に記載のデ ータ小容量化方法。  (14) The method according to (13), wherein the selected mathematical formula is characterized in that a difference between the selected mathematical formula and the patterned data that is to be generated is used as a parameter when converting a numerical sequence into a mathematical formula. Data reduction method.
(1 5) 所定のソースデータを所定データ長から始めてデータが一致しなくなるまで データを伸長して最長同一部分を抽出する手段と、 該抽出した最長同一部分を除くデ ータを所定データ長から始めてデータが一致しなくなるまでデータを伸長して次の最 長同一部分を抽出することを繰り返し行う手段と、 抽出された同一部分及び残りのデ ータを所定の長さからなる数列に変換する手段と、 該変換した数列を発生するであろ うパターン化されたデータと比較する手段と、 該比較した差をパラメータとして所定 の数式に変換する手段とからなることを特徴とする小容量化データ生成シス亍ム。 (15) Starting predetermined source data from a predetermined data length, expanding the data until data no longer matches, extracting the longest identical portion, and extracting data excluding the extracted longest identical portion from the predetermined data length. Means for repeatedly extracting the next longest identical portion by expanding the data until the data no longer matches, and converting the extracted identical portion and the remaining data into a sequence of predetermined lengths Means for comparing the converted sequence with patterned data that will generate the converted sequence; and means for converting the compared difference into a predetermined mathematical expression using the compared difference as a parameter. Generation system.
(1 6) 前記同一部分を抽出するための検索において、 被対象データの同一照合時に 順方向及び逆方向からも照合を行うことを特徴とする (1 5) に記載の小容量化デー タ生成システム。 (16) In the search for extracting the same part, the collation is performed from the forward direction and the reverse direction at the time of the same collation of the target data, and the reduced-volume data generation according to (15) is characterized. system.
(1 7) 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズの データブロックに分割し、 該デ一タブロックを任意順で連結したデータに対して照合 を行うことを特徴とする (1 5) に記載の小容量化データ生成システム。  (17) In the search for extracting the same portion, the data to be searched is divided into data blocks of an arbitrary size, and collation is performed on data obtained by connecting the data blocks in an arbitrary order. A small-volume data generation system according to (15).
(1 8) 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズの データブロックに分割し、 該データブロックを任意個数連結したデータに対して照合 を行うことを特徴とする (1 5) に記載の小容量化データ生成システム。 (1 9) 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズの データブロックに分割し、 該データブロックのうち参照出現回数が多いものに対して 優先順位を高〈するようにしたことを特徴とする (1 5) に記載の小容量化デ一タ生 成システム。 (18) The search for extracting the same portion is characterized in that the data to be searched is divided into data blocks of an arbitrary size, and matching is performed on data obtained by connecting any number of the data blocks. (15) A small-capacity data generation system according to (5). (19) In the search for extracting the same portion, the data to be searched is divided into data blocks of an arbitrary size, and the priority of the data block having a higher number of reference appearances is set higher than that of the data block. The small-capacity data generation system according to (15), characterized in that:
(20) 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズの データブロックに分割し、 該データブロックのうち同一データからなるデータブロッ クの出現順序及び出現頻度を求めて優先順位を設定することを特徴とする (1 5) に 記載の小容量化データ生成システム。  (20) In the search for extracting the same part, the data to be searched is divided into data blocks of an arbitrary size, and the appearance order and appearance frequency of data blocks of the same data in the data blocks are obtained. The small-volume data generation system according to (15), wherein priorities are set.
(21 ) 前記同一部分を有するデータブロックを抽出した後において、 該データプロ ックに含まれる共通データを抽出すると共にその個数を計測するようにしたことを特 徴とする (1 5) に記載の小容量化データ生成システム。  (21) The method according to (15), wherein after extracting the data block having the same portion, common data included in the data block is extracted and the number of common data is measured. Small-capacity data generation system.
(22) 前記同一部分を有するデータブロックを抽出した後において、 該抽出された データブロックのうち、 同一又は近似したデータブロックの繰り返し又は連続する箇 所を検出するようにしたことを特徴とする (1 5) に記載の小容量化データ生成シス テム。  (22) After extracting the data block having the same portion, a repeated or continuous portion of the same or similar data block is detected from among the extracted data blocks. 15 A small-capacity data generation system according to 5).
(23) 前記同一部分を有するデータブロックを抽出した後において、 該抽出された データブロックのうち、 同一又は近似したデータプロックの使用頻度の高い順に優先 順位を設定するようにしたことを特徴とする (1 5) に記載の小容量化データ生成シ ステム。  (23) After extracting the data blocks having the same part, priorities are set in the order of the frequency of use of the same or similar data blocks among the extracted data blocks. (15) A small-capacity data generation system described in (5).
(24) 前記同一部分を有するデータブロックを抽出した後において、 該抽出された データブロックのうち、 同一又は近似したデータブロックの使用頻度に応じて設定さ れている優先順位の補正を行うことを特徴とする (1 5) に記載の小容量化データ生 成システム。  (24) After extracting the data blocks having the same part, the priority set according to the use frequency of the same or similar data blocks among the extracted data blocks is corrected. A small-volume data generation system according to (15).
(25) 前記所定の長さの数列は、 前記数式に適用し易い長さであることを特徴とす る (1 5) に記載の小容量化データ生成システム。  (25) The reduced-volume data generation system according to (15), wherein the sequence of the predetermined length has a length that can be easily applied to the mathematical formula.
(26) 前記発生するであろうパターン化されたデータは、 前記数列の変動に基づい て生成することを特徴とする (1 5) に記載の小容量化データ生成システム。 ( 2 7 ) 前記所定の数式は、 予め用意してあるパターン化されたデータと比較して、 卑近な数式を選択することを特徴とする (1 5 ) 又は (2 6 ) に記載の小容量化デー タ生成システム。 (26) The reduced-volume data generation system according to (15), wherein the patterned data that is likely to be generated is generated based on a change in the sequence. (27) The small mathematical expression according to (15) or (26), wherein the predetermined mathematical formula is compared with pattern data prepared in advance, and selects a familiar mathematical formula. Data generation system.
( 2 8 ) 前記選択した数式が、 発生するであろうパターン化されているデータとの差 を、 数式から数列に変換する際のパラメータとすることを特徴とする (2 7 ) に記載 の小容量化データ生成システム。  (28) The difference according to (27), wherein the difference between the selected mathematical expression and the patterned data that is likely to occur is used as a parameter when converting the mathematical expression into a sequence. Capacity data generation system.
( 2 9 ) 所定のソースデータを所定データ長から始めてデータが一致しなくなるまで データを伸長して最長同一部分を抽出し、 該抽出した最長同一部分を除くデータを所 定データ長から始めてデータが一致しなくなるまでデータを伸長して次の最長同一部 分を抽出することを繰り返し行い、 抽出された同一部分及び残りのデータを所定の長 さからなる数列に変換し、 該変換した数列を発生するであろうパターン化されたデー 夕に基づいて所定の数式に変換し、 該変換されたデータを所定の方式により圧縮する ようにしたことを特徴とするデータ小容量化方法により小容量化したデータを圧縮す るデータ圧縮方法。  (29) Starting predetermined source data from a predetermined data length, decompressing the data until the data no longer matches, extracting the longest identical portion, and excluding the extracted longest identical portion from the predetermined data length. It repeats the process of expanding the data until it no longer matches and extracting the next longest identical part, converting the extracted identical part and the remaining data into a sequence of a predetermined length, and generating the converted sequence. The converted data is converted into a predetermined mathematical expression based on the patternized data, and the converted data is compressed according to a predetermined method. A data compression method that compresses data.
( 3 0 ) 前記同一部分を抽出するための検索において、 被対象データの同一照合時に 順方向及び逆方向からも照合を行うことを特徴とする (2 9 ) に記載のデータ小容量 化方法により小容量化したデータを圧縮するデータ圧縮方法。  (30) In the search for extracting the same part, matching is performed from the forward direction and the reverse direction at the time of the same matching of the target data, and the data reduction method according to (29) is used. A data compression method for compressing small-volume data.
( 3 1 ) 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズの データブロックに分割し、 該データブロックを任意順で連結したデータに対して照合 を行うことを特徴とする (2 9 ) に記載のデータ小容量化方法により小容量化したデ ータを圧縮するデータ圧縮方法。  (31) The search for extracting the same portion is characterized in that the data to be searched is divided into data blocks of an arbitrary size, and the data blocks are collated in an arbitrary order and collated with data. A data compression method for compressing data that has been reduced by the data reduction method described in (29).
( 3 2 ) 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズの データブロックに分割し、 該データブロックを任意個数連結したデータに対して照合 を行うことを特徴とする (2 9 ) に記載のデータ小容量化方法により小容量化したデ —タを圧縮するデータ圧縮方法。  (32) The search for extracting the same part is characterized in that the data to be searched is divided into data blocks of an arbitrary size, and matching is performed on data obtained by connecting the data blocks in an arbitrary number. A data compression method for compressing data that has been reduced in size by the data reduction method described in (29).
( 3 3 ) 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズの データブロックに分割し、 該データブロックのうち参照出現回数が多いものに対して 優先順位を高くするようにしたことを特徴とする (2 9 ) に記載のデータ小容量化方 法により小容量化したデータを圧縮するデータ圧縮方法。 (33) In the search for extracting the same part, the data to be searched is divided into data blocks of an arbitrary size, and the A data compression method for compressing data reduced in size by the data reduction method described in (29), wherein the priority is set higher.
( 3 4 ) 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズの データブロックに分割し、 該データブロックのうち同一データからなるデ一タブロッ クの出現順序及び出現頻度を求めて優先順位を設定することを特徴とする (2 9 ) に 記載のデータ小容量化方法により小容量化したデータを圧縮するデータ圧縮方法。  (34) In the search for extracting the same part, the data to be searched is divided into data blocks of an arbitrary size, and the appearance order and the appearance frequency of the data blocks of the same data in the data blocks are determined. A data compression method for compressing data reduced in size by the data reduction method described in (29), wherein the priority is determined and the priority order is set.
( 3 5 ) 前記同一部分を有するデータブロックを抽出した後において、 該データプロ ックに含まれる共通データを抽出すると共にその個数を計測するようにしたことを特 徴とする (2 9 ) に記載のデータ小容量化方法により小容量化したデータを圧縮する データ圧縮方法。  (35) After extracting the data block having the same portion, the common data included in the data block is extracted and the number of the common data is measured. (29) A data compression method for compressing data that has been reduced by the described data reduction method.
( 3 6 ) 前記同一部分を有するデータブロックを抽出した後において、 該抽出された データブロックのうち、 同一又は近似したデータブロックの繰り返し又は連続する箇 所を検出するようにしたことを特徴とする (2 9 ) に記載のデータ小容量化方法によ リ小容量化したデータを圧縮するデータ圧縮方法。  (36) After extracting the data block having the same portion, a repeated or continuous portion of the same or similar data block is detected from among the extracted data blocks. A data compression method for compressing data that has been reduced according to the data reduction method described in (29).
( 3 7 ) 前記同一部分を有するデータブロックを抽出した後において、 該抽出された データブロックのうち、 同一又は近似したデータブロックの使用頻度の高い順に優先 順位を設定するようにしたことを特徴とする (2 9 ) に記載のデータ小容量化方法に よリ小容量化したデータを圧縮するデータ圧縮方法。  (37) After extracting the data blocks having the same part, priorities are set in descending order of use frequency of the same or similar data blocks among the extracted data blocks. A data compression method for compressing data that has been reduced by the data reduction method described in (29).
( 3 8 ) 前記同一部分を有するデータブロックを抽出した後において、 該抽出された データブロックのうち、 同一又は近似したデータブロックの使用頻度に応じて設定さ れている優先順位の補正を行うことを特徴とする (2 9 ) に記載のデータ小容量化方 法によリ小容量化したデータを圧縮するデータ圧縮方法。  (38) After extracting the data blocks having the same part, the priority set in accordance with the use frequency of the same or similar data blocks among the extracted data blocks is corrected. A data compression method for compressing data that has been reduced in volume by the data reduction method described in (29).
( 3 9 ) 前記所定の長さの数列は、 前記数式に適用し易い長さであることを特徴とす る (2 9 ) に記載のデータ小容量化方法により小容量化したデータを圧縮するデータ 圧縮方法。  (39) The sequence of a predetermined length has a length that can be easily applied to the mathematical formula, and compresses data reduced in size by the data reduction method according to (29). Data compression method.
( 4 0 ) 前記グラフ化は、 前記数列の変動に基づいて生成することを特徴とする (2 9 ) に記載のデータ小容量化方法によリ小容量化したデータを圧縮するデータ圧縮方 法。 (40) The graphing is generated based on the variation of the sequence, and the data compression method for compressing the data reduced in size by the data reduction method according to (29). Law.
(41 ) 前記所定の数式は、 予め用意してあるグラフと比較して、 卑近な数式を選択 することを特徴とする (29) 又は (40) に記載のデータ小容量化方法によリ小容 量化したデータを圧縮するデータ圧縮方法。  (41) The predetermined mathematical formula is compared with a graph prepared in advance, and a familiar mathematical formula is selected, and the predetermined mathematical formula is reduced by the data reduction method according to (29) or (40). A data compression method that compresses the volumeized data.
(42) 前記選択した数式が、 描いているグラフとの差を、 数式から数列に変換する 際のパラメータとすることを特徴とする (41 ) に記載のデータ小容量化方法により 小容量化したデータを圧縮するデータ圧縮方法。  (42) The difference between the selected mathematical expression and the graph being drawn is used as a parameter when converting the mathematical expression into a sequence, and the data is reduced by the data reduction method according to (41). A data compression method that compresses data.
(43) 所定のソースデータを所定の方式で圧縮し、 該圧縮したデータを所定データ 長から始めてデータが一致しなくなるまでデータを伸長して最長同一部分を抽出し、 該抽出した最長同一部分を除くデータを所定データ長から始めてデータが一致しなく なるまでデータを伸長して次の最長同一部分を抽出することを繰り返し行い、 抽出さ れた同一部分及び残りのデータを所定の長さからなる数列に変換し、 該変換した数列 を発生するであろうパターン化されたデータと比較し、 該比較した差をパラメータと して所定の数式に変換することを特徴とする圧縮したデータを小容量化するデータ小 容量化方法。  (43) Predetermined source data is compressed by a predetermined method, the compressed data is expanded from a predetermined data length until the data no longer matches, and the longest identical part is extracted, and the extracted longest identical part is extracted. Starting with the data length to be excluded, the data length is expanded until the data no longer matches, and the next longest identical part is repeatedly extracted.The extracted identical part and the remaining data are composed of the predetermined length. Converting the converted data to a predetermined mathematical expression using the converted data as a parameter, converting the converted data into a predetermined mathematical expression. Method to reduce data capacity.
(44) 前記同一部分を抽出するための検索において、 被対象データの同一照合時に 順方向及び逆方向からも照合を行うことを特徴とする (43) に記載の圧縮したデー タを小容量化するデータ小容量化方法。  (44) In the search for extracting the same part, matching is performed from the forward direction and the backward direction at the time of the same matching of the subject data, and the compressed data described in (43) is reduced in capacity. To reduce data capacity.
(45) 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズの データプロックに分割し、 該データプロックを任意順で連結したデータに対して照合 を行うことを特徴とする (43) に記載の圧縮したデータを小容量化するデータ小容 量化方法。  (45) The search for extracting the same part is characterized in that the data to be searched is divided into data blocks of an arbitrary size, and the data blocks are collated in any order and collated. (43) A data reduction method for reducing the compressed data volume described in (43).
(46) 前記同一部分を抽出するための検索は、 被検索対象のデ一タを任意サイズの データブロックに分割し、 該データブロックを任意個数連結したデータに対して照合 を行うことを特徴とする (43) に記載の圧縮したデータを小容量化するデータ小容 量化方法。  (46) In the search for extracting the same part, the data to be searched is divided into data blocks of an arbitrary size, and collation is performed on data obtained by connecting the data blocks in an arbitrary number. (4) A data volume reduction method for reducing the volume of compressed data according to (43).
(47) 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズの データブロックに分割し、 該データブロックのうち参照出現回数が多いものに対して 優先順位を高くするようにしたことを特徴とする (43) に記載の圧縮したデータを 小容量化するデータ小容量化方法。 (47) In the search for extracting the same part, the data to be searched is The data block is divided into data blocks, and priority is given to a data block having a large number of reference appearances, wherein the compressed data described in (43) is reduced in data volume. Method.
(48) 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズの データブロックに分割し、 該データブロックのうち同一データからなるデ一タブロッ クの出現順序及び出現頻度を求めて優先順位を設定することを特徴とする (43) に 記載の圧縮したデータを小容量化するデータ小容量化方法。  (48) In the search for extracting the same part, the data to be searched is divided into data blocks of an arbitrary size, and the appearance order and the appearance frequency of the data blocks of the same data in the data blocks are obtained. The data reduction method according to (43), wherein the compressed data is reduced in size.
(49) 前記同一部分を有するデータブロックを抽出した後において、 該データプロ ックに含まれる共通データを抽出すると共にその個数を計測するようにしたことを特 徴とする (43) に記載の圧縮したデータを小容量化するデータ小容量化方法。  (49) The method according to (43), wherein after extracting the data block having the same portion, common data included in the data block is extracted and the number of common data is measured. A data reduction method for reducing the volume of compressed data.
(50) 前記同一部分を有するデータブロックを抽出した後において、 該抽出された データブロックのうち、 同一又は近似したデータブロックの繰り返し又は連続する箇 所を検出するようにしたことを特徴とする (43) に記載の圧縮したデータを小容量 化するデータ小容量化方法。  (50) After extracting the data block having the same portion, a repeated or continuous portion of the same or similar data block is detected from among the extracted data blocks. 43) A data reduction method for reducing the amount of compressed data described in (4).
(51 ) 前記同一部分を有するデータブロックを抽出した後において、 該抽出された データブロックのうち、 同一又は近似したデータプロックの使用頻度の高い順に優先 順位を設定するようにしたことを特徴とする (43) に記載の圧縮したデータを小容 量化するデータ小容量化方法。  (51) After extracting the data blocks having the same part, priorities are set in descending order of use frequency of the same or similar data blocks among the extracted data blocks. (43) A data reduction method for reducing compressed data as described in (43).
(52) 前記同一部分を有するデータブロックを抽出した後において、 該抽出された データブロックのうち、 同一又は近似したデータブロックの使用頻度に応じて設定さ れている優先順位の補正を行うことを特徴とする (43) に記載の圧縮したデータを 小容量化するデータ小容量化方法。  (52) After extracting the data blocks having the same part, the priority set in accordance with the frequency of use of the same or similar data blocks among the extracted data blocks is corrected. A data reduction method according to (43), wherein the compressed data is reduced.
(53) 前記所定の長さの数列は、 前記数式に適用し易い長さであることを特徴とす る (43) に記載のデータ小容量化方法。  (53) The data reduction method according to (43), wherein the sequence of the predetermined length has a length that can be easily applied to the mathematical formula.
(54) 前記グラフ化は、 前記数列の変動に基づいて生成することを特徴とする (4 3) に記載の圧縮したデータを小容量化するデータ小容量化方法。  (54) The data reduction method according to (43), wherein the graphing is generated based on the variation of the sequence.
(55) 前記所定の数式は、 予め用意してある発生するであろうパターン化したデ一 タと比較して、 卑近な数式を選択することを特徴とする (4 3 ) 又は (5 4 ) に記載 の圧縮したデータを小容量化するデータ小容量化方法。 (55) The predetermined mathematical formula is a pattern data which is prepared in advance and will be generated. The method for reducing data capacity according to (43) or (54), characterized by selecting a formula that is more familiar than the data.
( 5 6 ) 前記選択した数式が、 発生するであろうパターン化されたデータとの差を用 いて、 数式から数列に変換する際のパラメータとすることを特徴とする (5 5 ) に記 載の圧縮したデータを小容量化するデータ小容量化方法。  (56) The method according to (55), wherein the selected mathematical expression is used as a parameter when converting the mathematical expression into a sequence by using a difference from the patterned data that will occur. Data reduction method for reducing the volume of compressed data.
( 5 7 ) 所定のソースデータを所定データ長から始めてデータが一致しなくなるまで データを伸長して最長同一部分を抽出する手段と、 該抽出した最長同一部分を除くデ ータを所定データ長から始めてデータが一致しなくなるまでデータを伸長して次の最 長同一部分を抽出することを繰り返し行う手段と、 抽出された同一部分及び残りのデ —タを所定の長さからなる数列に変換する手段と、 該変換した数列を発生するであろ うパターン化されたデータと比較する手段と、 該比較した差をパラメータとして所定 の数式に変換する手段と、 該所定の数式に変換された小容量化データを所望の相手先 に伝送する伝送手段とからなることを特徴とする小容量化データ伝送システム。  (57) Starting predetermined source data from a predetermined data length, expanding the data until data no longer matches, extracting the longest identical portion, and extracting data excluding the extracted longest identical portion from the predetermined data length. Means for repeatedly decompressing data until the data no longer matches and extracting the next longest identical part, and converting the extracted identical part and the remaining data into a sequence of predetermined lengths Means, means for comparing the converted sequence with patterned data which will generate, means for converting the compared difference into a predetermined mathematical expression as a parameter, and small capacity converted into the predetermined mathematical expression Transmission means for transmitting the coded data to a desired destination.
( 5 8 ) 前記伝送手段は、 電波及び/又は光及び/又は電気的通信によることを特徴と する上記 (5 7 ) に記載の小容量化データ伝送システム。  (58) The small-capacity data transmission system according to (57), wherein the transmission means is based on radio waves and / or light and / or electrical communication.
( 5 9 ) 所定のソースデータを所定データ長から始めてデータが一致しなくなるまで データを伸長して最長同一部分を抽出する手段と、 該抽出した最長同一部分を除くデ —タを所定データ長から始めてデータが一致しなくなるまでデータを伸長して次の最 長同一部分を抽出することを繰り返し行う手段と、 抽出された同一部分及び残りのデ —タを所定の長さからなる数列に変換する手段と、 該変換した数列を発生するであろ うパターン化されたデータと比較する手段と、 該比較した差をパラメータとして所定 の数式に変換する手段と、 該所定の数式に変換された小容量化データを記録媒体に記 録する記録手段とからなることを特徴とする小容量化データ記録システム。  (59) Starting predetermined source data from a predetermined data length, expanding the data until data no longer matches, extracting the longest identical portion, and extracting data excluding the extracted longest identical portion from the predetermined data length. Means for repeatedly decompressing data until the data no longer matches and extracting the next longest identical part, and converting the extracted identical part and the remaining data into a sequence of predetermined lengths Means, means for comparing the converted sequence with patterned data which will generate, means for converting the compared difference into a predetermined mathematical expression as a parameter, and small capacity converted into the predetermined mathematical expression And a recording means for recording the converted data on a recording medium.
( 6 0 ) 前記記録媒体は、 可動自在なディスク状媒体及び/又はテープ状媒体及び/ 又は I Cメモリで構成された記憶媒体であることを特徴とする (5 9 ) に記載の小容 量化データ記録システム。  (60) The storage medium according to (59), wherein the recording medium is a movable disk-shaped medium and / or a tape-shaped medium and / or a storage medium configured with an IC memory. Recording system.
( 6 1 ) 所定のソースデータを所定データ長から始めてデータが一致しなくなるまで データを伸長して最長同一部分を抽出する手段と、 該抽出した最長同一部分を除くデ 一夕を所定データ長から始めてデータが一致しなくなるまでデータを伸長して次の最 長同一部分を抽出することを繰り返し行う手段と、 抽出された同一部分及び残りのデ —タを所定の長さからなる数列に変換する手段と、 該変換した数列を発生するであろ うパターン化されたデータと比較する手段と、 該比較した差をパラメータとして所定 の数式に変換する手段と、 該所定の数式に変換された小容量化データを所定の記録媒 体に記録すると共に該記録されている小容量化データを適宜再生することができる再 生手段とからなることを特徴とする小容量化データ再生システム。 (61) Starting from the specified source data with the specified data length until the data no longer matches Means for extracting the longest identical part by expanding the data, and extracting the next longest identical part by expanding the data starting from a predetermined data length, excluding the extracted longest identical part, until the data no longer matches. Means for repeatedly performing the same operation, means for converting the extracted identical part and the remaining data into a sequence having a predetermined length, and comparing the converted sequence with the pattern data which will generate the sequence. Means for converting the compared difference into a predetermined mathematical expression as a parameter; and recording the reduced capacity data converted into the predetermined mathematical expression on a predetermined recording medium and reducing the recorded reduced capacity. A small-capacity data reproduction system comprising reproduction means capable of reproducing data appropriately.
( 6 2 ) 前記記録媒体は、 可動自在なディスク状媒体及び 又はテープ状媒体及び/ 又は I Cメモリで構成された記憶媒体であることを特徴とする (6 1 ) に記載の小容 量化データ再生システム。  (62) The recording medium described in (61), wherein the recording medium is a movable disk-shaped medium and / or a tape-shaped medium and / or a storage medium configured with an IC memory. system.
( 6 3 ) 所定のソースデータを所定バイ 卜長から始めてデータが一致しなくなるまで データを伸長して最長同一部分を抽出する手段と、 該抽出した最長同一部分を除くデ ータを所定データ長から始めてデータがー致しなくなるまでデータを伸長して次の最 長同一部分を抽出することを繰り返し行う手段と、 抽出された同一部分及び残りのデ ータを所定の長さからなる数列に変換する手段と、 該変換した数列を発生するであろ うパターン化されたデータと比較する手段と、 該比較した差をパラメータとして所定 の数式に変換する手段と、 該所定の数式に変換された小容量化データを適宜再生する ことができる再生手段とからなることを特徴とする小容量化データ再生システム。 このように、 データの同一部分を抽出して同一部分は一つの同一データにして絡め て、 その絡めたデータを更に所定の数列に変換して更に発生するであろうパターン化 されたデータと比較してその差をパラメータとして数式にすることによって、 伝送す るデータは少量にして且つその伝送するデータに含まれているデータの意味は極めて ボリュームのあるデータとすることが可能であるから、 圧縮して送るデータよリも更 に効率のよいデータ伝送を実現することができる。 図面の簡単な説明 第 1図は、 本願発明におけるデータ小容量化方法を具現化するための全体流れ図で ある。 (63) Means for extracting the longest identical portion by extending the predetermined source data from the predetermined byte length until the data no longer matches, and extracting the data excluding the extracted longest identical portion to the predetermined data length Means to repeatedly expand data until the data no longer matches and extract the next longest identical part, and convert the extracted identical part and the remaining data into a sequence of predetermined length Means for performing the conversion, the means for comparing the converted sequence with the patterned data that will be generated, the means for converting the compared difference into a predetermined mathematical expression as a parameter, and the small value converted to the predetermined mathematical expression. A small-capacity data reproduction system comprising reproduction means capable of appropriately reproducing the large-capacity data. In this way, the same part of the data is extracted and the same part is entangled as one identical data, and the entangled data is further converted into a predetermined sequence and compared with the patterned data which may be generated further. Then, by using the difference as a parameter as an equation, the amount of data to be transmitted can be reduced and the meaning of the data included in the transmitted data can be extremely large data. It is possible to realize more efficient data transmission than data to be transmitted. BRIEF DESCRIPTION OF THE FIGURES FIG. 1 is an overall flow chart for realizing the data reduction method of the present invention.
第 2図は、 同データ小容量化方法を具現化するための全体プロック図である。 第 3図は、 同小容量化方法を構成するブロック生成及びルール化生成部とコード化 計算部とを示したブロック図である。  FIG. 2 is an overall block diagram for realizing the data reduction method. FIG. 3 is a block diagram showing a block generation / rule generation unit and a coding calculation unit that constitute the capacity reduction method.
第 4図は、 同一ブロックを検索する手法を示した説明図である。  FIG. 4 is an explanatory diagram showing a method of searching for the same block.
第 5図は、 近似ブロックを検索するための手法を示した説明図である。  FIG. 5 is an explanatory diagram showing a method for searching for an approximate block.
第 6図は、 使用頻度計測の概念図である。  Fig. 6 is a conceptual diagram of usage frequency measurement.
第 7図は、 ユニークデータを検出するための概念図である。  FIG. 7 is a conceptual diagram for detecting unique data.
第 8図は、 数式による小容量化データを生成するための概念図である。 発明を実施するための最良の形態  FIG. 8 is a conceptual diagram for generating reduced-volume data using mathematical formulas. BEST MODE FOR CARRYING OUT THE INVENTION
次に、 本発明に係るデータ小容量化方法及び小容量化データ生成システム及びデー タ小容量化方法によリ小容量化したデータを圧縮するデータ圧縮方法及び圧縮したデ 一タを小容量化するデータ小容量化方法及び小容量化データ伝送システム及び小容量 化データ記録システムの実施の形態について図面を参照して説明する。  Next, a data compression method for compressing data that has been reduced by the data reduction method, the data reduction system, and the data reduction method according to the present invention, and reducing the volume of the compressed data. An embodiment of a data reduction method, a data transmission system and a data recording system will be described with reference to the drawings.
本発明に係るデータの小容量化システムは、 第 1図に示すように、 例えば、 映像デ ータ、 音楽データ等のソースデータ 1 0 0を所定のブロック化及びルール化すると共 に、 所定数列化処理を施して一意変換データ 2 1 0を作成し、 この一意変換データ 2 1 0を所定の数式に変換して数式変換データ 2 2 0を生成して、 伝送すべくデータ量 を減少させた小容量化データ 3 0 0を作成するものである。 一意変換データ 2 1 0と 数式変換データ 2 2 0とによリコ一ド化計算部 2 0 0を構成する。 加えて、 図示しな いが、 伝送の際には、 この作成した小容量化データ 3 0 0を周知の技術である圧縮手 法により圧縮して伝送すること、 又はソースデータ 1 0 0を圧縮して上記小容量化デ —タ 3 0 0にして伝送すること、 又はソースデータを圧縮して小容量化データにして から再度圧縮手法により圧縮して小容量化データを作成する。 又、 この小容量化デ一 タ 3 0 0は、 所望の相手先に電波、 光、 電気的通信により伝送され、 又は C D— R O M等のディスク状媒体、 D A T、 D D S等のテープ状媒体からなる記録媒体又は I C メモリで構成されている記録媒体に記録できる構成になっている。 尚、 記録媒体はこ れらに限定されることなく、 例えば、 光、 磁気、 物理的並びに化学的な記録媒体を用 いることが含まれる。 更に、 この記録されている小容量化データは再生して使用する ことができることは勿論のことである。 As shown in FIG. 1, a system for reducing data capacity according to the present invention includes, as shown in FIG. 1, source data 100 such as video data, music data, etc. The unique conversion data 210 is created by performing the conversion process, the unique conversion data 210 is converted into a predetermined mathematical expression to generate the mathematical expression conversion data 220, and the data amount is reduced for transmission. This is to create the reduced capacity data 300. The unique conversion data 210 and the mathematical expression conversion data 220 constitute a recording calculation unit 200. In addition, although not shown, at the time of transmission, the created small-capacity data 300 is compressed and transmitted by a well-known compression method, or the source data 100 is compressed. Then, the above-mentioned reduced-capacity data 300 is transmitted, or the source data is compressed into reduced-capacity data and then compressed again by a compression method to create reduced-capacity data. Also, this small-capacity data 300 is transmitted to a desired destination by radio wave, light, or electric communication, or CD-RO It is configured to be recordable on a recording medium composed of a disk-shaped medium such as M, a tape-shaped medium such as DAT or DDS, or a recording medium composed of an IC memory. The recording medium is not limited to these, and includes, for example, using optical, magnetic, physical and chemical recording media. Further, it is needless to say that the recorded small-volume data can be reproduced and used.
このような特徴を有するデータ小容量化システムは、 第 2図に示すように、 ソース データ 1 0 0を所定の数列に変換して一意変換データを生成する一意変換データ生成 部 2 1 0と、 この一意変換データを意味のあるデータ毎にまとめる処理をして数式に 変換して数式変換データを生成する数式変換データ生成部 2 2 0と、 一意変換データ 生成部 2 1 0及び数式変換データ生成部 2 2 0において、 データそのものの特徴を抽 出してブロック化及びルール化処理を施してデータ量を少なくするブロック生成及び ルール化生成部 4 0 0とから構成されている。  As shown in FIG. 2, the data reduction system having such a feature includes a unique conversion data generation unit 210 that converts source data 100 into a predetermined sequence to generate unique conversion data, Formula conversion data generation unit 220 that converts the unique conversion data into meaningful data and converts it into mathematical formulas to generate formula conversion data, unique conversion data generation unit 210, and formula conversion data generation The section 220 is composed of a block generation and rule generation section 400 for extracting the characteristics of the data itself and performing block processing and rule processing to reduce the data amount.
ブロック生成及びルール化生成部 4 0 0は、 第 3図に示すように、 データの共通部 分を抽出する共通部分抽出部 4 1 0と、 差分抽出部 4 2 0と、 コード化計算部 2 0 0 とからなる。  As shown in FIG. 3, the block generation and rule generation unit 400 includes a common part extraction unit 410 for extracting a common part of data, a difference extraction unit 420, and a coding calculation unit 2 It consists of 0 0.
共通部分抽出部 4 1 0は、 データの同一部分を抽出する同一部分抽出部 4 1 1 と、 データの近似部分を抽出する近似部分抽出部 4 1 2と、 同一部分の使用頻度により優 先順位を付けてデータの重み付けを行うデータ重み付け部 4 1 3とから構成されてい る。  The common part extraction unit 4110 is divided into the same part extraction unit 411 that extracts the same part of the data, the approximate part extraction unit 412 that extracts the approximate part of the data, and the priority based on the frequency of use of the same part. And a data weighting unit 4 13 for weighting the data by adding a.
同一部分抽出部 4 1 1は、 最長同一部分抽出ロジック 4 1 4と、 異方向同一部分袖 出ロジック 4 1 5とからなる。 最長同一部分抽出ロジック 4 1 4は、 データの最も長 い同一部分を抽出するものであり、 所定のデータ長から始めて一致しなくなるまで検 索の対象となるデータを伸長してデータ内の最も長い同一部分を抽出する。 即ち、 最 大の同一部分を抽出し、 その同一部分がたくさんあればあるほど送るデータの量は少 なくすることができるのである。 異方向同一部分抽出ロジック 4 1 5は、 逆方向から も検索し同一部分を抽出するものであり、 順方向への検索をした際にデータの同一性 照合時に順方向のみではなく逆方向からも照合を行うものである。 例えば、 第 4図に 示すように、 ブロック 「ABCDJ 20が存在する場合に、 前方方向で一致するブロ ックは 「ABCD」 1 0であり、 後方方向で一致するブロックは 「DCBAJ 1 1で あり、 これら両者ともに同一ブロックとして処理することができるのである。 The same part extraction unit 4111 includes a longest same part extraction logic 4 14 and a different direction same part extraction logic 4 15. The longest identical part extraction logic 4 1 4 is to extract the longest identical part of the data, starting from a predetermined data length, decompressing the data to be searched until it no longer matches, and extracting the longest Extract the same part. In other words, the largest identical part can be extracted, and the more identical parts, the smaller the amount of data to be sent. The different direction same part extraction logic 4 15 searches from the reverse direction and extracts the same part.When searching in the forward direction, the data is compared not only in the forward direction but also in the reverse direction when matching the data. The collation is performed. For example, in Figure 4 As shown, when the block “ABCDJ 20 is present, the block that matches in the forward direction is“ ABCD ”10 and the block that matches in the backward direction is“ DCBAJ 11 ”, both of which are the same block. It can be processed as.
近似部分抽出部 41 2は、 第 3図に示すように、 共通ブロックに非類似の部分を含 んだ状態で抽出するものであり、 異順序データ検出ロジック 41 6と異データ長検出 ロジック 41 7とから構成されている。  As shown in FIG. 3, the approximated part extraction unit 412 extracts a common block including a dissimilar part and includes an out-of-order data detection logic 416 and a different data length detection logic 41 7 It is composed of
異順序データ検出ロジック 41 6は、 同じデ一タ列を異なる順序で使用する部分を 検出するものであり、 検索対象のデータを任意サイズのデータブロックに分割し、 こ の分割したデータブロックを任意順で連結したデータに対して照合を行う。  The out-of-order data detection logic 416 detects a portion that uses the same data column in a different order, divides the data to be searched into data blocks of an arbitrary size, and divides the divided data blocks into arbitrary data blocks. The collation is performed on the data concatenated in order.
異データ長検出ロジック 41 7は、 同じデータ列が含まれるトータルデータ長が異 なる部分を検出するものであり、 検索対象のデータを任意サイズのデータブロックに 分割して、 この分割したデータブロックを任意個数連結したデータに対して照合を行 う。 第 5図は、 近似部分抽出概念図であり、 先ず 「EFGH I ABC」 41 というデ 一タブロックが存在した場合に、 その近似するものとしては 「ABDEFGH I」 4 0と、 「AABCDDDEFGH I J 42である。 これらの共通するところは Γ E F G H l」 50が共通ブロックになる。 この共通部分を有する近似ブロックを集合させる ことにより、 そこに何らかのルールを設定することが可能になる。 このように一部共 通しているブロックを中心にして非類似部分のブロックを組み合わせた近似ブロック を集合させることによって、 同一ブロックの処理にとどまることなく、 近似ブロック を集合させた中から所定の方式の統計等により所定のルール化を施すことができ、 デ 一夕の小容量化を図ることが可能になる。  The different data length detection logic 417 detects a portion including the same data string and having a different total data length, divides the search target data into data blocks of an arbitrary size, and divides the divided data blocks. Performs collation on data linked in any number. Fig. 5 is a conceptual diagram of the approximate partial extraction. First, when there is a data block called "EFGH I ABC" 41, the approximate ones are "ABDEFGH I" 40 and "AABCDDDEFGH IJ 42". The common part of these is “EFGH l” 50 is the common block. By gathering approximate blocks having this common part, it is possible to set some rules there. By gathering approximate blocks that combine blocks of dissimilar parts centering on partially common blocks in this way, a predetermined method can be selected from the aggregate of approximate blocks without being limited to the processing of the same block. A predetermined rule can be applied based on statistics and the like, and it becomes possible to reduce the capacity of data overnight.
データ重み付け部 41 3は、 第 3図に示すように、 共通ブロックの頻度による優先 順位を決定する使用頻度計測ロジック 41 8と共通プロックを有しないデータを処理 するユニークデータ検出ロジック 41 9とから構成されている。  As shown in FIG. 3, the data weighting section 413 is composed of a use frequency measurement logic 418 for determining the priority order based on the frequency of the common block and a unique data detection logic 419 for processing data having no common block. Have been.
使用頻度計測ロジック 41 8は、 使われる頻度、 基準ブロック含有率等を基に優先 度を決定するものであり、 検索対象のデータを任意サイズのデータブロックに分割す る。 そして、 分割したデータブロックの出現回数を数える。 ユニークデータ検出ロジック 4 "I 9は、 データの類似性を計測し、 優先度を決定す るものであり、検索対象のデータを任意サイズのデータブロックに分割する。そして、 分割したデータブロックの出現順序及び使用頻度を求める。 The usage frequency measurement logic 418 determines the priority based on the usage frequency, the reference block content, and the like, and divides the data to be searched into data blocks of an arbitrary size. Then, the number of appearances of the divided data blocks is counted. The unique data detection logic 4 "I 9 measures the similarity of data and determines the priority, and divides the data to be searched into data blocks of arbitrary size. The appearance of the divided data blocks Determine the order and frequency of use.
第 6図は使用頻度計測ロジックの概念図であり、例えばソースデータ 1 0 0に「A J というデータブロックが「A 1 J、 「A 2」で参照され、 「B J というデ一タブロックが Γ Β 1」 でのみ参照されたとすると、 「Α」 が 2箇所から参照されているため、 「B J の一箇所に比べれば優先度が高くなる。  FIG. 6 is a conceptual diagram of the usage frequency measurement logic. For example, “AJ data block is referred to by“ A 1 J, ”“ A 2 ”in source data 100, and“ BJ data block is represented by Γ Γ If only “1” is referenced, “Α” is referenced from two places, so the priority is higher than “BJ one place”.
第 7図はユニークデータ検出ロジックの概念図であり、 ソースデータ 1 0 0に共通 なデータブロック 「ひ」、 「ys」 を含むため優先度が低くなリ、 共通したブロックを含 まない場合には優先度が低くなる。  Fig. 7 is a conceptual diagram of the unique data detection logic, which includes data blocks `` HI '' and `` ys '' that are common to source data 100, and therefore has low priority and does not include common blocks. Has a lower priority.
差分抽出部 4 2 0は、 第 3図に示すように、 共通部分を有するブロックによリデー タの比較を行う共通部分比較部 4 2 1 と、 共通部分を有するブロックのうち非類似部 分の差を比較する差分比較部 4 2 2とから構成されている。  As shown in FIG. 3, the difference extraction unit 420 includes a common part comparison unit 421 that compares the data of the blocks having the common part with each other, and a non-similar part of the block having the common part. It is composed of a difference comparison unit 4 22 which compares the differences.
共通部分比較部 4 2 1は、 第 3図に示すように、 共通部分を比較して差分を抽出す るものであり、 共通ブロックの非類似部分を分割して比較する分割比較ロジック 4 2 3と共通ブロックの繰返しを検出する繰返しブロック検出ロジック 4 2 4とからなる。 分割比較ロジック 4 2 3は、 任意のデータ長に分割し抽出済みの共通部分のブロッ クとの比較を行うものであり、 検索対象のデータを任意サイズのデータブロックに分 割する。 そして、 共通部分に含まれる個数を計測する。  As shown in FIG. 3, the common part comparing section 421 compares the common parts to extract the difference, and divides and compares the dissimilar parts of the common block. And a repetitive block detection logic 4 2 4 for detecting repetition of the common block. The division / comparison logic 4 2 3 divides the data into arbitrary data lengths and compares them with the blocks of the extracted common part, and divides the data to be searched into data blocks of arbitrary size. Then, the number included in the common part is measured.
繰返しブロック検出ロジック 4 2 4は、 任意のデータ長に分割し、 連続性を検出す るものであり、検索対象のデータを任意サイズのデータブロックに分割する。そして、 特定の共通部分内での連続する箇所を検出する。  The repetitive block detection logic 4 2 4 divides the data into arbitrary data lengths and detects continuity, and divides the data to be searched into data blocks of arbitrary size. Then, a continuous part in a specific common part is detected.
差分比較部 4 2 2は、 共通部分を含むブロックのうち非類似の部分の類似性を検出 する類似性検出ロジック 4 2 5と、 共通部分に対して非類似部分が含まれている含有 率を計測するための共通部分含有率計測ロジック 4 2 6とから構成されている。 類似 性検出ロジック 4 2 5は、 差分データ同士の類似性を基に優先度を決定するものであ リ、 各々の類似性を共通部分と同様の手法で測り優先順位を決定する。 共通部分含有 率計測ロジック 4 2 6は、 共通部分に含まれる割合を基に優先度を補正するものであ り、 共通部分の使用頻度を計測し、 優先順位を補正する。 The difference comparison unit 422 calculates the similarity detection logic 425 that detects the similarity of the dissimilar part in the block including the common part and the content ratio of the common part that includes the dissimilar part with respect to the common part. It consists of common part content ratio measurement logic 4 26 for measurement. The similarity detection logic 425 determines the priority based on the similarity between the difference data, and measures the similarity in the same manner as the common part to determine the priority. Common part included The ratio measurement logic 426 corrects the priority based on the ratio included in the common part, measures the frequency of use of the common part, and corrects the priority.
コード化計算部 2 0 0は、 上述したブロック生成及びルール化生成部 4 0 0により ブロック化及びルール化されたデータを一意的に変換する一意変換データ生成部 2 1 0と、 所定の数式に変換する数式変換データ生成部 2 2 0とから構成されている。 一意変換データ生成部 2 1 0は、 コード化及びルール化されたデータの共通部分を 任意長の数列に変換するものであり、 バイトオーダー等を考慮しながら数式に適用し 易い長さの数字列に変換する。  The coding calculation unit 200 includes a unique conversion data generation unit 210 that uniquely converts the data that has been blocked and ruled by the block generation and rule generation unit 400 described above, and a predetermined mathematical expression. And a mathematical expression conversion data generation unit 220 for conversion. The unique conversion data generation unit 210 converts the common part of the coded and ruled data into a sequence of arbitrary length. Convert to
数式変換データ生成部 2 2 0は、 上記の一意変換データ生成部 2 1 0で作成された 数列からなるデータに所定の数式を当て嵌めて所定のデータを作成するものであり、 具体的には一意変換データ生成部 2 1 0により生成された数列の変動を基に所定の数 列の出没する傾向を検出し、 予め用意されている傾向の数列データと比較し、 最も卑 近な数式を選択する。 そして、 選択した数式が描くパターンとの差をパラメータとし て数式に変換する。  The mathematical expression conversion data generation unit 220 generates predetermined data by applying a predetermined mathematical expression to the data composed of the sequence created by the unique conversion data generation unit 210 described above. Based on the fluctuation of the sequence generated by the unique conversion data generation unit 210, a predetermined sequence of appearing and disappearing trends is detected, compared with the sequence data of the tendency prepared in advance, and the most common formula is selected. I do. Then, the difference from the pattern drawn by the selected formula is converted into a formula as a parameter.
第 8図は、数式による小容量化データを生成するための概念図であり、「A B D 8 W FIG. 8 is a conceptual diagram for generating reduced-volume data by using a mathematical formula, wherein “A BD 8 W
E 8 9 F A J というソースデータ 1 0 0は、 一意変換されて、 「3 2 4 9 8E 8 9 F A J source data 100 is uniquely converted to “3 2 4 9 8
6 4 5 3 0 1 7 8 - ■ ■ ,」 という数列 1 0 O Aを生成し、 この数列"! 0 O Aは、 予 め傾向数列データと比較され、その選択した数式のパターンの差をパラメータとして、 Γ 7 / 9+ 1 1 / 3 * 5 / 1 3」 という数式 1 0 0 Cに変換される。 6 4 5 3 0 1 7 8-■ ■, ”, a sequence 10 OA is generated, and this sequence“! 0 OA is compared with the trend sequence data in advance, and the difference in the pattern of the selected formula is used as a parameter. , Γ 7/9 + 1 1/3 * 5/13 ”.
このようにして、 ソースデータ 1 0 0を所定の数列に一意変換して意味のあるデー タにすると共に、 ブロック化及びルール化をしてデータの統計的な性質を把握し、 そ のデータのパターンを把握し、 その把握したパターンをパラメータとして数式化して 小容量化データを生成するようにしたことによって、 ソースデータを全て共通ブロッ ク、 傾向パラメータ、 ルール化されたデータとすることができ、 これはソースデータ を構成するデータを切り捨てることなくデータそのものを少なくすることができるた め、 復元は完全な形で戻すことが可能である。 産業上の利用可能性 In this way, the source data 100 is uniquely converted into a predetermined sequence to make it meaningful data, and at the same time, the statistical properties of the data are grasped by blocking and making rules, and the data By grasping patterns and formulating the grasped patterns as parameters to generate reduced-volume data, all source data can be used as common blocks, trend parameters, and rule-based data. This allows the data to be reduced without truncating the data that makes up the source data, so that the restoration can be completely restored. Industrial applicability
以上説明したように、本発明に係る所定のデ,ータを所定バイ 卜長から始めてデータ がー致しなくなるまでデータを伸長して最長同一部分を抽出し、 この抽出しだ最長同 一部分を除くデータを所定バイ卜長から始めてデータが一致しなくなるまでデータを 伸長して次の最長同一部分を抽出することを繰り返し行い、 抽出された同一部分及び 残りのデータを所定の長さからなる数列に変換し、 この変換した数列を予め発生する であろうパターン化されたデータをパラメータとして使用するようにして数式に変換 するようにしたことにより、 伝送するデータを所定の意味のあるデータにしては絡め て実際に伝送するデータの量を少なくして伝送効率を向上させることができるという 効果がある。  As described above, the predetermined data according to the present invention is expanded from the predetermined byte length until the data no longer matches, and the longest identical portion is extracted, and the extracted longest identical portion is removed. Repeat the process of extracting the next longest identical part by expanding the data starting from the specified byte length until the data no longer matches, and converting the extracted identical part and the remaining data into a sequence of predetermined length By converting the converted sequence into a mathematical expression by using as a parameter the patternized data that would be generated in advance, the data to be transmitted can be converted into predetermined meaningful data. This has the effect of improving the transmission efficiency by reducing the amount of data that is actually transmitted in entanglement.

Claims

請 求 の 範 囲 The scope of the claims
1 . 所定のソースデータを所定データ長から始めてデータが一致しなくなるまでデー タを伸長して最長同一部分を抽出し、 該抽出した最長同一部分を除くデータを所定デ ータ長から始めてデータが一致しなくなるまでデータを伸長して次の最長同一部分を 抽出することを繰り返し行い、 抽出された同一部分及び残リのデータを所定の長さか らなる数列に変換し、 該変換した数列を発生するであろうパターン化されたデータと 比較してその差をパラメータとし、 該パラメータに基づいて所定の数式に変換して小 容量化データを生成して出力することを特徴とするデータ小容量化方法。 1. Determining the predetermined source data starting from the predetermined data length and extracting the longest identical portion by extending the data until the data no longer matches, and extracting the data excluding the extracted longest identical portion from the predetermined data length starting with the predetermined data length. It repeats the process of extracting the next longest identical part by expanding the data until it no longer matches, converting the extracted identical part and remaining data into a sequence of a predetermined length, and generating the converted sequence Data reduction, wherein the difference is compared with the patterned data which is likely to be used as a parameter, and the difference is converted into a predetermined mathematical expression based on the parameter to generate and output the reduced data. Method.
2 . 前記同一部分を抽出するための検索において、 被対象データの同一照合時に順方 向及び逆方向からも照合を行うことを特徴とする請求の範囲第 1項に記載のデータ小 容量化方法。 2. The data reduction method according to claim 1, wherein, in the search for extracting the same part, matching is performed from the forward direction and the backward direction at the time of the same matching of the subject data. .
3 . 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデー タブロックに分割し、 該データブロックを任意順で連結したデータに対して照合を行 うことを特徴とする請求の範囲第 1項に記載のデータ小容量化方法。  3. The search for extracting the same portion is characterized in that the data to be searched is divided into data blocks of an arbitrary size, and the data blocks are collated with data connected in an arbitrary order. 2. The data reduction method according to claim 1, wherein
4 . 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデー タブロックに分割し、 該データブロックを任意個数連結したデータに対して照合を行 うことを特徴とする請求の範囲第 1項に記載のデータ小容量化方法。  4. The search for extracting the same portion is characterized in that data to be searched is divided into data blocks of an arbitrary size, and collation is performed on data obtained by connecting any number of the data blocks. 2. The data reduction method according to claim 1.
5 . 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデー タブロックに分割し、 該データブロックのうち参照出現回数が多いものに対して優先 順位を高くするようにしたことを特徴とする請求の範囲第 1項に記載のデータ小容量 化方法。  5. In the search for extracting the same part, the data to be searched is divided into data blocks of an arbitrary size, and a priority is given to a data block having a large number of reference appearances. 2. The data reduction method according to claim 1, wherein
6 . 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデー タブロックに分割し、 該データブロックのうち同一データからなるデータブロックの 出現順序及び出現頻度を求めて優先順位を設定することを特徴とする請求の範囲第 1 項に記載のデータ小容量化方法。  6. In the search for extracting the same part, the data to be searched is divided into data blocks of an arbitrary size, and the appearance order and the appearance frequency of the data blocks of the same data among the data blocks are determined to give priority. 2. The data reduction method according to claim 1, wherein the order is set.
7 . 前記同一部分を有するデータブロックを抽出した後において、 該データブロック に含まれる共通データを抽出すると共にその個数を計測するようにしたことを特徴と する請求の範囲第 1項に記載のデータ小容量化方法。 7. After extracting the data block having the same portion, the data block 2. The data reduction method according to claim 1, wherein common data included in the data is extracted and the number of common data is measured.
8 . 前記同一部分を有するデータブロックを抽出した後において、 該抽出されたデ一 タブロックのうち、 同一又は近似したデータブロックの繰り返し又は連続する箇所を 検出するようにしたことを特徴とする請求の範囲第 1項に記載のデータ小容量化方法。  8. After extracting the data block having the same portion, a repeated or continuous portion of the same or similar data block is detected from among the extracted data blocks. 2. The method for reducing data capacity according to item 1, wherein
9 . 前記同一部分を有するデータブロックを抽出した後において、 該抽出されたデー タブロックのうち、 同一又は近似したデータブロックの使用頻度の高い順に優先順位 を設定するようにしたことを特徴とする請求の範囲第 1項に記載のデータ小容量化方 法。  9. After extracting the data blocks having the same part, priorities are set in descending order of use frequency of the same or similar data blocks among the extracted data blocks. The method for reducing data capacity according to claim 1.
1 0 . 前記同一部分を有するデータブロックを抽出した後において、 該抽出されたデ 一タブロックのうち、 同一又は近似したデータブロックの使用頻度に応じて設定され ている優先順位の補正を行うことを特徴とする請求の範囲第 1項に記載のデータ小容 量化方法。 10. After the extraction of the data blocks having the same part, the priority set according to the frequency of use of the same or similar data blocks among the extracted data blocks is corrected. 2. The method for reducing data volume according to claim 1, wherein:
1 1 . 前記所定の長さの数列は、 前記数式に適用し易い長さであることを特徴とする 請求の範囲第 1項に記載のデータ小容量化方法。  11. The data reduction method according to claim 1, wherein the sequence of the predetermined length has a length that can be easily applied to the mathematical formula.
1 2 . 前記グラフ化は、 前記数列の変動に基づいて生成することを特徴とする請求の 範囲第 1項に記載のデータ小容量化方法。  12. The method for reducing data capacity according to claim 1, wherein the graphing is generated based on a change in the sequence.
1 3 . 前記所定の数式は、 予め用意してあるパターンからされたデータと比較して、 卑近な数式を選択することを特徴とする請求の範囲第 1項又は第 1 2項に記載のデー タ小容量化方法。  13. The data according to claim 1 or 12, wherein the predetermined mathematical formula is compared with data prepared from a pattern prepared in advance, and selects a familiar mathematical formula. Data reduction method.
1 4 . 前記選択した数式が、 発生するであろうパターン化されたデータとの差を、 数 列から数式に変換する際のパラメータとすることを特徴とする請求の範囲第 1 3項に 記載のデータ小容量化方法。  14. The method according to claim 13, wherein the selected mathematical formula is used as a parameter for converting a difference from patterned data that is likely to be generated into a mathematical formula from a sequence. Data reduction method.
1 5 . 所定のソースデータを所定バイト長から始めてデータが一致しなくなるまでデ ータを伸長して最長同一部分を抽出する手段と、 該抽出した最長同一部分を除くデー タを所定データ長から始めてデータが一致しなくなるまでデータを伸長して次の最長 同一部分を抽出することを繰り返し行う手段と、 抽出された同一部分及び残リのデー タを所定の長さからなる数列に変換する手段と、 該変換した数列を発生するであろう パターン化されたデータと比較する手段と、 該比較した差をパラメ一タとして所定の 数式に変換する手段とからなることを特徴とする小容量化データ生成システム。 15. Means for extracting predetermined source data from a predetermined byte length and extracting the longest identical portion by expanding the data until the data no longer matches, and extracting data excluding the extracted longest identical portion from the predetermined data length. A means for repeatedly expanding the data until the data no longer matches for the first time and extracting the next longest identical part; Means for converting the data into a sequence of predetermined lengths; means for comparing the converted sequence with the patterned data that would be generated; and converting the compared differences into parameters as predetermined parameters. And a means for performing data reduction.
1 6 . 前記同一部分を抽出するための検索において、 被対象データの同一照合時に順 方向及び逆方向からも照合を行うことを特徴とする請求の範囲第 1 5項に記載の小容 量化データ生成システム。  16. The reduced-volume data according to claim 15, wherein, in the search for extracting the same part, matching is performed from the forward direction and the backward direction at the same matching of the subject data. Generation system.
1 7 . 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデ —タブロックに分割し、 該データブロックを任意順で連結したデータに対して照合を 行うことを特徴とする請求の範囲第 1 5項に記載の小容量化データ生成システム。  17. The search for extracting the same portion is characterized in that the data to be searched is divided into data blocks of any size, and the data blocks are collated in any order and collated. The reduced-volume data generation system according to claim 15, wherein:
1 8 . 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデ 一タブロックに分割し、 該データブロックを任意個数連結したデータに対して照合を 行うことを特徴とする請求の範囲第 1 5項に記載の小容量化データ生成システム。 18. The search for extracting the same portion is characterized in that data to be searched is divided into data blocks of an arbitrary size, and collation is performed on data obtained by connecting any number of the data blocks. The reduced-volume data generation system according to claim 15, wherein:
1 9 . 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデ 一タブロックに分割し、 該データブロックのうち参照出現回数が多いものに対して優 先順位を高くするようにしたことを特徴とする請求の範囲第 1 5項に記載の小容量化 データ生成システム。  19. In the search for extracting the same part, the data to be searched is divided into data blocks of an arbitrary size, and the data blocks having a higher number of reference appearances are given higher priority. The reduced-volume data generation system according to claim 15, wherein the data generation system is configured to perform the above-described processing.
2 0 . 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデ 一タブロックに分割し、 該デ一タブロックのうち同一デ一タからなるデータブロック の出現順序及び出現頻度を求めて優先順位を設定することを特徴とする請求の範囲第 1 5項に記載の小容量化データ生成システム。  20. In the search for extracting the same part, the data to be searched is divided into data blocks of an arbitrary size, and the appearance order and the appearance of data blocks of the same data among the data blocks are determined. 16. The small-capacity data generation system according to claim 15, wherein priorities are set based on appearance frequencies.
2 1 . 前記同一部分を有するデータブロックを抽出した後において、 該データブロッ クに含まれる共通データを抽出すると共にその個数を計測するようにしたことを特徴 とする請求の範囲第 1 5項に記載の小容量化データ生成システム。  21. The method according to claim 15, wherein after extracting the data block having the same portion, the common data included in the data block is extracted and the number of the common data is measured. A small-volume data generation system according to the above description.
2 2 . 前記同一部分を有するデータブロックを抽出した後において、 該抽出されたデ —タブロックのうち、 同一又は近似したデータブロックの繰り返し又は連続する箇所 を検出するようにしたことを特徴とする請求の範囲第 1 5項に記載の小容量化データ 生成システム。 22. After extracting the data block having the same portion, a repeated or continuous portion of the same or similar data block is detected from among the extracted data blocks. The reduced-volume data generation system according to claim 15.
2 3 . 前記同一部分を有するデータブロックを抽出した後において、 該抽出されたデ 一タブロックのうち、 同一又は近似したデータブロックの使用頻度の高い順に優先順 位を設定するようにしたことを特徴とする請求の範囲第 1 5項に記載の小容量化デー タ生成システム。 23. After extracting the data blocks having the same part, priorities are set in descending order of use frequency of the same or similar data blocks among the extracted data blocks. A reduced-capacity data generation system according to claim 15, characterized in that:
2 4. 前記同一部分を有するデータブロックを抽出した後において、 該抽出されたデ 一タブロックのうち、 同一又は近似したデータブロックの使用頻度に応じて設定され ている優先順位の補正を行うことを特徴とする請求の範囲第 1 5項に記載の小容量化 データ生成システム。 2 4. After extracting the data blocks having the same part, correcting the priority set according to the frequency of use of the same or similar data blocks among the extracted data blocks. The reduced-volume data generation system according to claim 15, characterized in that:
2 5 . 前記所定の長さの数列は、 前記数式に適用し易い長さであることを特徴とする 請求の範囲第 1 5項に記載の小容量化データ生成システム。  25. The small-capacity data generation system according to claim 15, wherein the predetermined-length sequence is a length that is easily applied to the mathematical formula.
2 6 . 前記発生するであろうパターン化されたデータは、 前記数列の変動に基づいて 生成することを特徴とする請求の範囲第 1 5項に記載の小容量化データ生成システム。  26. The miniaturized data generation system according to claim 15, wherein the patternized data that is to be generated is generated based on the variation of the sequence.
2 7 . 前記所定の数式は、 予め用意してあるパターン化されたデータと比較して、 卑 近な数式を選択することを特徴とする請求の範囲第 1 5項又は第 2 6項に記載の小容 量化データ生成システム。 27. The predetermined mathematical formula is compared with pattern data prepared in advance, and selects a familiar mathematical formula, wherein the mathematical formula is selected. Small volume data generation system.
2 8 .前記選択した数式が、発生するであろうパターン化されているデータとの差を、 数式から数列に変換する際のパラメータとすることを特徴とする請求の範囲第 2 7項 に記載の小容量化データ生成システム。  28. The method according to claim 27, wherein the difference between the selected mathematical expression and the patterned data that will occur is used as a parameter when converting the mathematical expression into a sequence. Small-capacity data generation system.
2 9 . 所定のソースデータを所定データ長から始めてデータが一致しなくなるまでデ —タを伸長して最長同一部分を抽出し、 該抽出した最長同一部分を除〈データを所定 データ長から始めてデータが一致しなくなるまでデータを伸長して次の最長同一部分 を抽出することを繰り返し行い、 抽出された同一部分及び残りのデータを所定の長さ からなる数列に変換し、 該変換した数列を発生するであろうパターン化されたデータ に基づいて所定の数式に変換し、 該変換されたデータを所定の方式により圧縮するよ うにしたことを特徴とするデータ小容量化方法によリ小容量化したデータを圧縮する データ圧縮方法。  2 9. Starting with the specified source data, expanding the data until the data no longer matches, extracting the longest identical part, and removing the extracted longest identical part <Data starts with the predetermined data length Is repeated until data no longer matches, and the next longest identical part is repeatedly extracted.The extracted identical part and the remaining data are converted into a sequence having a predetermined length, and the converted sequence is generated. The data is converted into a predetermined mathematical expression based on the patternized data that is likely to be converted, and the converted data is compressed by a predetermined method. A data compression method that compresses compressed data.
3 0. 前記同一部分を抽出するための検索において、 被対象データの同一照合時に順 方向及び逆方向からも照合を行うことを特徴とする請求の範囲第 2 9項に記載のデー タ小容量化方法により小容量化したデータを圧縮するデータ圧縮方法。 3 0. In the search for extracting the same part, 29. A data compression method for compressing data reduced in size by the data reduction method according to claim 29, wherein the comparison is performed also in the direction and the reverse direction.
3 1 . 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデ 一タブロックに分割し、 該データブロックを任意順で連結したデータに対して照合を 行うことを特徴とする請求の範囲第 2 9項に記載のデータ小容量化方法により小容量 化したデータを圧縮するデータ圧縮方法。 31. The search for extracting the same part is characterized in that data to be searched is divided into data blocks of an arbitrary size, and collation is performed on data obtained by connecting the data blocks in an arbitrary order. A data compression method for compressing data reduced in size by the data reduction method according to claim 29.
3 2 . 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデ ータプロックに分割し、 該データプロックを任意個数連結したデータに対して照合を 行うことを特徴とする請求の範囲第 2 9項に記載のデータ小容量化方法により小容量 化したデータを圧縮するデータ圧縮方法。  32. In the search for extracting the same part, the data to be searched is divided into data blocks of an arbitrary size, and collation is performed on data obtained by connecting any number of the data blocks. A data compression method for compressing data that has been reduced by the data reduction method described in Item 29.
3 3 . 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデ ータプロックに分割し、 該データプロックのうち参照出現回数が多いものに対して優 先順位を高くするようにしたことを特徴とする請求の範囲第 2 9項に記載のデータ小 容量化方法により小容量化したデータを圧縮するデータ圧縮方法。  33. In the search for extracting the same part, the data to be searched is divided into data blocks of an arbitrary size, and a priority is given to a data block having a large number of reference appearances. 30. A data compression method for compressing data reduced in size by the data reduction method according to claim 29.
3 4 . 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデ 一タブロックに分割し、 該データブロックのうち同一データからなるデータブロック の出現順序及び出現頻度を求めて優先順位を設定することを特徴とする請求の範囲第 2 9項に記載のデータ小容量化方法により小容量化したデータを圧縮するデータ圧縮 方法。 34. In the search for extracting the same part, the data to be searched is divided into data blocks of an arbitrary size, and the appearance order and appearance frequency of data blocks of the same data among the data blocks are obtained. 31. A data compression method for compressing data reduced in size by the data reduction method according to claim 29, wherein priority is set by setting.
3 5 . 前記同一部分を有するデータブロックを抽出した後において、 該デ一タブロッ クに含まれる共通データを抽出すると共にその個数を計測するようにしたことを特徴 とする請求の範囲第 2 9項に記載のデータ小容量化方法により小容量化したデータを 圧縮するデータ圧縮方法。  35. The method according to claim 29, wherein after extracting the data block having the same portion, the common data included in the removable block is extracted and the number thereof is measured. A data compression method for compressing data that has been reduced by the data reduction method described in (1).
3 6 . 前記同一部分を有するデータブロックを抽出した後において、 該抽出されたデ 一タブロックのうち、 同一又は近似したデータブロックの繰り返し又は連続する箇所 を検出するようにしたことを特徴とする請求の範囲第 2 9項に記載のデータ小容量化 方法によリ小容量化したデータを圧縮するデータ圧縮方法。 36. After extracting the data block having the same portion, a repeated or continuous portion of the same or similar data block is detected from among the extracted data blocks. A data compression method for compressing data reduced in size by the data reduction method according to claim 29.
3 7 . 前記同一部分を有するデータブロックを抽出した後において、 該抽出されたデ 一タブロックのうち、 同一又は近似したデータプロックの使用頻度の高い順に優先順 位を設定するようにしたことを特徴とする請求の範囲第 2 9項に記載のデータ小容量 化方法により小容量化したデータを圧縮するデータ圧縮方法。 37. After extracting the data blocks having the same part, priorities are set in descending order of use frequency of the same or similar data blocks among the extracted data blocks. A data compression method for compressing data reduced in size by the data reduction method according to claim 29.
3 8 . 前記同一部分を有するデータブロックを抽出した後において、 該抽出されたデ 一タブロックのうち、 同一又は近似したデータブロックの使用頻度に応じて設定され ている優先順位の補正を行うことを特徴とする請求の範囲第 2 9項に記載のデータ小 容量化方法によリ小容量化したデータを圧縮するデータ圧縮方法。 38. After extracting the data blocks having the same part, the priority set in accordance with the frequency of use of the same or similar data blocks among the extracted data blocks is corrected. 30. A data compression method for compressing data which has been reduced by the data reduction method according to claim 29.
3 9 . 前記所定の長さの数列は、 前記数式に適用し易い長さであることを特徴とする 請求の範囲第 2 9項に記載のデータ小容量化方法によリ小容量化したデータを圧縮す るデータ圧縮方法。 39. The data having the predetermined length, the length of which is easily applicable to the mathematical formula, wherein the data reduced in size by the data reduction method according to claim 29. A data compression method that compresses data.
4 0 . 前記グラフ化は、 前記数列の変動に基づいて生成することを特徴とする請求の 範囲第 2 9項に記載のデータ小容量化方法により小容量化したデータを圧縮するデー タ圧縮方法。  40. The data compression method for compressing data reduced by the data reduction method according to claim 29, wherein the graphing is generated based on the variation of the sequence. .
4 1 . 前記所定の数式は、 予め用意してあるグラフと比較して、 卑近な数式を選択す ることを特徴とする請求の範囲第 2 9項又は第 4 0項に記載のデータ小容量化方法に よリ小容量化したデータを圧縮するデータ圧縮方法。  41. The small data volume according to claim 29 or 40, wherein the predetermined mathematical formula is selected from a more familiar mathematical formula in comparison with a graph prepared in advance. A data compression method that compresses data that has been reduced in size by a data compression method.
4 2 . 前記選択した数式が、 描いているグラフとの差を、 数式から数列に変換する際 のパラメータとすることを特徴とする請求の範囲第 4 1項に記載のデータ小容量化方 法によリ小容量化したデータを圧縮するデータ圧縮方法。  42. The method for reducing data capacity according to claim 41, wherein the selected mathematical expression uses a difference from a drawn graph as a parameter when converting the mathematical expression into a sequence. A data compression method for compressing small-volume data.
4 3 . 所定のソースデータを所定の方式で圧縮し、 該圧縮したデータを所定データ長 から始めてデータが一致しなくなるまでデータを伸長して最長同一部分を抽出し、 該 抽出した最長同一部分を除くデータを所定データ長から始めてデータが一致しな〈な るまでデータを伸長して次の最長同一部分を抽出することを繰り返し行い、 抽出され た同一部分及び残りのデータを所定の長さからなる数列に変換し、 該変換した数列を 発生するであろうパターン化されたデータと比較し、 該比較した差をパラメータとし て所定の数式に変換することを特徴とする圧縮したデータを小容量化するデータ小容 量化方法。 4 3. Predetermined source data is compressed by a predetermined method, the compressed data is expanded from a predetermined data length until the data no longer matches, the longest identical part is extracted, and the extracted longest identical part is extracted. The data to be removed is started from a predetermined data length, the data is repeatedly expanded until the data no longer matches, and the next longest identical part is repeatedly extracted.The same part and the remaining data are extracted from the predetermined length. Converting the converted sequence into a predetermined mathematical expression by using the converted sequence as a parameter, and comparing the converted sequence with patternized data that will be generated. Data volume Quantification method.
4 4 . 前記同一部分を抽出するための検索において、 被対象データの同一照合時に順 方向及び逆方向からも照合を行うことを特徴とする請求の範囲第 4 3項に記載の圧縮 したデータを小容量化するデータ小容量化方法。  44. In the search for extracting the same part, matching is performed from the forward direction and the backward direction at the time of the same matching of the target data, wherein the compressed data according to claim 43 is obtained. Data reduction method to reduce the data volume.
4 5 . 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデ 一タブロックに分割し、 該データブロックを任意順で連結したデータに対して照合を 行うことを特徴とする請求の範囲第 4 3項に記載の圧縮したデータを小容量化するデ ータ小容量化方法。 45. The search for extracting the same portion is characterized in that the data to be searched is divided into data blocks of an arbitrary size, and the data blocks are collated in any order and collated. The method for reducing data capacity according to claim 43, wherein the capacity of the compressed data is reduced.
4 6 . 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデ 一タブロックに分割し、 該データブロックを任意個数連結したデータに対して照合を 行うことを特徴とする請求の範囲第 4 3項に記載の圧縮したデータを小容量化するデ ータ小容量化方法。  46. The search for extracting the same part is characterized in that the data to be searched is divided into data blocks of an arbitrary size, and collation is performed on data obtained by concatenating an arbitrary number of the data blocks. The method for reducing data capacity according to claim 43, wherein said compressed data is reduced in capacity.
4 7 . 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデ 一タブロックに分割し、 該データブロックのうち参照出現回数が多いものに対して優 先順位を高くするようにしたことを特徴とする請求の範囲第 4 3項に記載の圧縮した データを小容量化するデータ小容量化方法。  47. In the search for extracting the same part, the data to be searched is divided into data blocks of an arbitrary size, and the data blocks having a higher number of reference appearances are given higher priority. The data reduction method according to claim 43, wherein the compressed data is reduced in volume.
4 8 . 前記同一部分を抽出するための検索は、 被検索対象のデータを任意サイズのデ 一タブロックに分割し、 該データブロックのうち同一データからなるデータブロック の出現順序及び出現頻度を求めて優先順位を設定することを特徴とする請求の範囲第 4 3項に記載の圧縮したデータを小容量化するデータ小容量化方法。  48. In the search for extracting the same part, the data to be searched is divided into data blocks of an arbitrary size, and the appearance order and the appearance frequency of data blocks of the same data among the data blocks are obtained. 44. The data reduction method according to claim 43, wherein the priority is set by setting the compression order.
4 9 . 前記同一部分を有するデータブロックを抽出した後において、 該デ一タブロッ クに含まれる共通データを抽出すると共にその個数を計測するようにしたことを特徴 とする請求の範囲第 4 3項に記載の圧縮したデータを小容量化するデータ小容量化方 法。  49. The method according to claim 43, wherein after extracting the data block having the same portion, the common data included in the deblock is extracted and the number thereof is measured. Data reduction method for reducing the volume of compressed data described in.
5 0. 前記同一部分を有するデータブロックを抽出した後において、 該抽出されたデ 一タブロックのうち、 同一又は近似したデータブロックの繰り返し又は連続する箇所 を検出するようにしたことを特徴とする請求の範囲第 4 3項に記載の圧縮したデータ を小容量化するデータ小容量化方法。 50. After extracting the data block having the same portion, a repeated or continuous portion of the same or similar data block is detected from among the extracted data blocks. Compressed data according to claim 43 A method for reducing the data capacity to reduce the capacity
5 1 . 前記同一部分を有するデータブロックを抽出した後において、 該抽出されたデ 一タブロックのうち、 同一又は近似したデータブロックの使用頻度の高い順に優先順 位を設定するようにしたことを特徴とする請求の範囲第 4 3項に記載の圧縮したデー タを小容量化するデータ小容量化方法。  51. After extracting the data blocks having the same part, priorities are set in descending order of the frequency of use of the same or similar data blocks among the extracted data blocks. A data reduction method according to claim 43, wherein the compressed data is reduced in volume.
5 2 . 前記同一部分を有するデ一タブロックを抽出した後において、 該抽出されたデ 一タブロックのうち、 同一又は近似したデータブロックの使用頻度に応じて設定され ている優先順位の補正を行うことを特徴とする請求の範囲第 4 3項に記載の圧縮した データを小容量化するデータ小容量化方法。  52. After extracting the data blocks having the same part, correction of the priority set according to the frequency of use of the same or similar data blocks among the extracted data blocks is performed. 4. The data reduction method according to claim 43, wherein the compressed data is reduced.
5 3 . 前記所定の長さの数列は、 前記数式に適用し易い長さであることを特徴とする 請求の範囲第 4 3項に記載のデータ小容量化方法。 53. The method for reducing data capacity according to claim 43, wherein the numerical sequence having the predetermined length has a length that can be easily applied to the mathematical formula.
5 4 . 前記グラフ化は、 前記数列の変動に基づいて生成することを特徴とする請求の 範囲第 4 3項に記載の圧縮したデータを小容量化するデータ小容量化方法。  54. The data reduction method according to claim 43, wherein the graphing is generated based on the variation of the sequence.
5 5 . 前記所定の数式は、 予め用意してある発生するであろうパターン化したデータ と比較して、 卑近な数式を選択することを特徴とする請求の範囲第 4 3項又は第 5 4 項に記載の圧縮したデータを小容量化するデータ小容量化方法。  55. The predetermined mathematical formula is selected as compared with pattern data which is likely to be prepared in advance, and selects a familiar mathematical formula. Data reduction method for reducing the volume of the compressed data described in the section.
5 6 . 前記選択した数式が、 発生するであろうパターン化されたデータとの差を用い て、 数式から数列に変換する際のパラメータとすることを特徴とする請求の範囲第 5 5項に記載の圧縮したデータを小容量化するデータ小容量化方法。  56. The method according to claim 55, wherein the selected mathematical expression is used as a parameter when converting the mathematical expression into a numerical sequence by using a difference from the patterned data that will occur. A data reduction method for reducing the volume of the described compressed data.
5 7 . 所定のソースデータを所定バイ卜長から始めてデータが一致しな〈なるまでデ 一夕を伸長して最長同一部分を抽出する手段と、 該抽出した最長同一部分を除くデー タを所定データ長から始めてデータが一致しな〈なるまでデータを伸長して次の最長 同一部分を抽出することを繰り返し行う手段と、 抽出された同一部分及び残リのデ一 タを所定の長さからなる数列に変換する手段と、 該変換した数列を発生するであろう パターン化されたデータと比較する手段と、 該比較した差をパラメータとして所定の 数式に変換する手段と、 該所定の数式に変換された小容量化データを所望の相手先に 伝送する伝送手段とからなることを特徴とする小容量化データ伝送システム。 5 7. Starting the specified source data from the specified byte length, expanding the data until the data matches, and extracting the longest identical part, and extracting the data excluding the extracted longest identical part. Means for repeatedly expanding data and extracting the next longest identical part until the data does not match, starting from the data length, and extracting the extracted identical part and remaining data from a predetermined length. Means for converting the converted sequence into pattern data which will generate the converted sequence; means for converting the compared difference into a predetermined mathematical expression as a parameter; A small-capacity data transmission system comprising transmission means for transmitting the converted small-capacity data to a desired destination.
5 8 . 前記伝送手段は、 電波及び/又は光及び/又は電気的通信によることを特徴とす る請求の範囲第 5 7項に記載の小容量化データ伝送システム。 58. The small-capacity data transmission system according to claim 57, wherein said transmission means is based on radio waves and / or light and / or electrical communication.
5 9 . 所定のソースデータを所定バイ卜長から始めてデータが一致しなくなるまでデ ータを伸長して最長同一部分を抽出する手段と、 該抽出した最長同一部分を除くデー タを所定データ長から始めてデータが一致しなくなるまでデータを伸長して次の最長 同一部分を抽出することを繰り返し行う手段と、 抽出された同一部分及び残リのデー タを所定の長さからなる数列に変換する手段と、 該変換した数列を発生するであろう パターン化されたデータと比較する手段と、 該比較した差をパラメータとして所定の 数式に変換する手段と、 該所定の数式に変換された小容量化データを記録媒体に記録 する記録手段とからなることを特徴とする小容量化データ記録システム。  5 9. Means for extracting the longest identical part by extending the predetermined source data from the predetermined byte length until the data does not match, and extracting the data excluding the extracted longest identical part to the predetermined data length Means for repeatedly extracting the next longest identical part by expanding the data until the data no longer matches, and converting the extracted identical part and remaining data into a sequence of predetermined length Means, means for comparing the converted sequence with patterned data that will generate the converted sequence, means for converting the compared difference into a predetermined mathematical expression as a parameter, and small capacity converted into the predetermined mathematical expression Recording means for recording the converted data on a recording medium.
6 0 .前記記録媒体は、可動自在なディスク状媒体及び Z又はテープ状媒体及び/又は I Cメモリで構成された記憶媒体であることを特徴とする請求の範囲第 5 9項に記載 の小容量化データ記録システム。  60. The small-capacity storage medium according to claim 59, wherein the recording medium is a movable disk-shaped medium and a storage medium formed of a Z or tape-shaped medium and / or an IC memory. Data recording system.
6 1 . 所定のソースデータを所定バイ卜長から始めてデータが一致しなくなるまでデ ータを伸長して最長同一部分を抽出する手段と、 該抽出した最長同一部分を除くデー タを所定データ長から始めてデータが一致しなくなるまでデータを伸長して次の最長 同一部分を抽出することを繰り返し行う手段と、 抽出された同一部分及び残りのデー タを所定の長さからなる数列に変換する手段と、 該変換した数列を発生するであろう パターン化されたデータと比較する手段と、 該比較した差をパラメータとして所定の 数式に変換する手段と、 該所定の数式に変換された小容量化データを所定の記録媒体 に記録すると共に該記録されている小容量化データを適宜再生することができる再生 手段とからなることを特徴とする小容量化データ再生システム。  6 1. Means for extracting the longest identical part by extending the predetermined source data from the predetermined byte length until the data no longer matches, and extracting the data excluding the extracted longest identical part to the predetermined data length. Means for repeatedly extracting the next longest identical part by expanding the data until the data no longer matches, and means for converting the extracted identical part and the remaining data into a sequence of predetermined length Means for comparing the converted sequence with patterned data that will generate the converted sequence; means for converting the compared difference into a predetermined mathematical expression as a parameter; and reducing the capacity converted to the predetermined mathematical expression. Reproducing means for recording data on a predetermined recording medium and appropriately reproducing the recorded small-volume data. Tem.
6 2 .前記記録媒体は、可動自在なディスク状媒体及び Z又はテープ状媒体及び/又は I Cメモリで構成された記憶媒体であることを特徴とする請求の範囲第 6 1項に記載 の小容量化データ再生システム。  62. The small-capacity storage medium according to claim 61, wherein the recording medium is a movable disk-shaped medium and a storage medium configured of a Z or tape-shaped medium and / or an IC memory. Data reproduction system.
6 3 . 所定のソースデータを所定バイト長から始めてデータが一致しな〈なるまでデ ータを伸長して最長同一部分を抽出する手段と、 該抽出した最長同一部分を除くデー タを所定データ長から始めてデータが一致しなくなるまでデータを伸長して次の最長 同一部分を抽出することを繰り返し行う手段と、 抽出された同一部分及び残リのデー タを所定の長さからなる数列に変換する手段と、 該変換した数列を発生するであろう パターン化されたデータと比較する手段と、 該比較した差をパラメータとして所定の 数式に変換する手段と、 該所定の数式に変換された小容量化データを適宜再生するこ とができる再生手段とからなることを特徴とする小容量化データ再生システム。 6 3. Means for extracting the longest identical part by extending the predetermined source data starting from a predetermined byte length until the data does not match, and extracting the longest identical part. Means for repeatedly extracting data starting from a predetermined data length and extracting the next longest identical part until the data no longer matches, and extracting the extracted identical part and remaining data from a predetermined length. Means for converting the converted sequence into pattern data which will generate the converted sequence; means for converting the compared difference into a predetermined mathematical expression as a parameter; A small-capacity data reproducing system comprising reproducing means capable of appropriately reproducing the converted small-volume data.
PCT/JP2000/004756 1999-07-16 2000-07-14 Amount-of-data reducing method and reduced amount-of-data generating system WO2001006660A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
AU60174/00A AU6017400A (en) 1999-07-16 2000-07-14 Amount-of-data reducing method and reduced amount-of-data generating system

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP11/202411 1999-07-16
JP20241199 1999-07-16

Publications (1)

Publication Number Publication Date
WO2001006660A1 true WO2001006660A1 (en) 2001-01-25

Family

ID=16457070

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2000/004756 WO2001006660A1 (en) 1999-07-16 2000-07-14 Amount-of-data reducing method and reduced amount-of-data generating system

Country Status (2)

Country Link
AU (1) AU6017400A (en)
WO (1) WO2001006660A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0129439A1 (en) * 1983-06-20 1984-12-27 Sperry Corporation High speed data compression and decompression apparatus and method
US5016009A (en) * 1989-01-13 1991-05-14 Stac, Inc. Data compression apparatus and method
JPH05152971A (en) * 1991-11-29 1993-06-18 Fujitsu Ltd Data compressing/restoring method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0129439A1 (en) * 1983-06-20 1984-12-27 Sperry Corporation High speed data compression and decompression apparatus and method
US5016009A (en) * 1989-01-13 1991-05-14 Stac, Inc. Data compression apparatus and method
JPH05152971A (en) * 1991-11-29 1993-06-18 Fujitsu Ltd Data compressing/restoring method

Also Published As

Publication number Publication date
AU6017400A (en) 2001-02-05

Similar Documents

Publication Publication Date Title
US6191710B1 (en) Data compression and decompression method and system for data compression and decompression
Robinson SHORTEN: Simple lossless and near-lossless waveform compression
KR100527891B1 (en) Method of performing huffman decoding
EP1039645A1 (en) Method and apparatus for data compression
JP2007508753A (en) Data compression system and method
JP2007508753A5 (en)
US6130631A (en) Method and apparatus utilizing a simplified content-addressable memory for JPEG decoding
US6400293B1 (en) Data compression system and method
WO2001006660A1 (en) Amount-of-data reducing method and reduced amount-of-data generating system
JPH04359315A (en) Data compression controller and data restoration controller
WO2001076193A1 (en) Data communication system
JP2023064241A (en) Storage system and data processing method in storage system
JP2830697B2 (en) Data processing device
JPH09181610A (en) Pattern compression method and device
JP3565147B2 (en) Decryption device
JP3442105B2 (en) Data compression and decompression methods
US7378587B2 (en) Method for fast compressing and decompressing music data and system for executing the same
JP3384844B2 (en) Data compression method and apparatus and data decompression method and apparatus
JPH0884260A (en) Compression system and expansion system for two-dimension image data
JPH07336696A (en) Compressing system and expanding system for two-dimensional image data
JPH06274311A (en) Data compression device and data restoration device
JPH05244015A (en) Data compression system
Hidayat et al. Critical Understanding Performance of Huffman and Lempel Zip to Pattern Audio Data 16-bit
JP2002135128A (en) Data-compression method, data compression/expansion method, data-compression device, and data compression/ expansion device
JP3602224B2 (en) Test pattern compression device

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CR CU CZ DE DK DM DZ EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ PL PT RO RU SD SE SG SI SK SL TJ TM TR TT TZ UA UG US UZ VN YU ZA ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE BF BJ CF CG CI CM GA GN GW ML MR NE SN TD TG

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

122 Ep: pct application non-entry in european phase
NENP Non-entry into the national phase

Ref country code: JP