JP5487985B2 - 圧縮装置、方法及びプログラム、並びに展開装置、方法及びプログラム - Google Patents
圧縮装置、方法及びプログラム、並びに展開装置、方法及びプログラム Download PDFInfo
- Publication number
- JP5487985B2 JP5487985B2 JP2010006034A JP2010006034A JP5487985B2 JP 5487985 B2 JP5487985 B2 JP 5487985B2 JP 2010006034 A JP2010006034 A JP 2010006034A JP 2010006034 A JP2010006034 A JP 2010006034A JP 5487985 B2 JP5487985 B2 JP 5487985B2
- Authority
- JP
- Japan
- Prior art keywords
- code
- data
- frequent
- storage unit
- processing target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図6に示したコード付与処理を実施すると、出現した順番にコードが付与されることになる。ステップS7では、コードを付与した順番に従って小さい順に符号を付与する。すなわち、s1を一番小さい符号に変換し、s2を二番目に小さい符号に変換し、s3を三番目に小さい符号に変換する。例えば、符号にアルファベットを採用する場合、符号の順番はアルファベット順に従う。但し、他の基準にて順序が決まるようにしてもよい。
例えば図9に示すような処理を行う。まず、符号付与部13は、圧縮すべき構造データの処理対象列において、頻出値集合表に登録されている各頻出値集合の出現回数を計数し、符号表格納部14に格納する(図9:ステップS31)。例えば、図10に示すようなデータが得られる。すなわち、コード及び頻出値集合の組み合わせに対応して出現回数が登録される。なお、例えば図6の処理フローにおいて、コードを付与すると共に同じ頻出値集合Xが検出されるとカウンタを1増加させるといった手法にて、頻出値集合毎に出現回数を計数するようにしてもよい。
この方法では、まず、符号付与部13は、コードsiの集合Σと、1から|Σ|(すなわち集合Σに属する要素の数)の数の集合Xとを設定する(図12:ステップS51)。具体的には、集合Σに、全てのコードsiを入れて、集合Xに1から|Σ|の数を入れる。
j=argmaxj∈XJaccord(ci-1,sj) (1)
Jaccord(a,b)=|Set(a)∩Set(b)|/|Set(a)∪Set(b)| (2)
Set(a)は、符号aが表す頻出値集合であり、|Set(a)|は、符号aが表す頻出値集合に含まれる頻出値の数を表す。
この場合にも、移動元の行の位置データが生成できる。具体的には、図20Bに示すように、図20Aの符号列Lの各行の移動元は、先頭から順番に「12」「11」「8」「1」「4」「6」「9」「2」「5」「7」「10」「3」行目となる。このような移動元の行の位置データも、符号列格納部16に格納される。
データ格納部に格納されており且つ行と列とが規定されている構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出ステップと、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、所定の規則に従って符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与ステップと、
前記構造データにおける各処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換するステップと、
前記符号の第1のシーケンスに対して、同一符号が連続するように順列変換処理を実施し、前記符号の第2のシーケンスを生成する順列変換ステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並べ替え処理ステップと、
前記データ格納部に格納されている、並び替え後の構造データに対して圧縮処理を実施するステップと、
を、コンピュータに実行させるための圧縮プログラム。
前記符号付与ステップが、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせを特定するステップと、
特定された前記頻出値又は前記頻出値の組み合わせが、前記符号表データ格納部に未登録であれば、当該頻出値又は頻出値の組み合わせである頻出値集合に対して未使用の符号を付与し、当該頻出値集合と当該符号とを対応付けて前記符号表データ格納部に格納するステップと、
を含む付記1記載の圧縮プログラム。
前記所定の規則が、
前記構造データにおける前記処理対象行を並べ替えても変化することがない指標に基づき前記頻出値集合を順序づけ、当該順序に応じて大きくなるように符号を順に対応付けるという規則である
付記1記載の圧縮プログラム。
前記符号付与ステップが、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせである頻出値集合を特定すると共に、特定された前記頻出値集合の出現頻度を計数するステップと、
前記出現頻度が最も大きい頻出値集合に対して最も小さい符号を付与し、前記符号表データ格納部に格納するステップと、
直前に符号が付与された前記頻出値集合と前記頻出値についての類似度が最も高く且つ符号が付与されていない頻出値集合を特定し、直前に付与された符号より大きい符号を、特定された前記頻出値集合に付与し、前記符号表データ格納部に格納するステップと、
を含む付記1記載の圧縮プログラム。
前記符号表データ格納部に格納されている前記頻出値集合と対応する前記符号とを、圧縮されたデータと共に第2データ格納部に格納するステップ
をさらに前記コンピュータに実行させるための付記2記載の圧縮プログラム。
各前記処理対象行が、行全体又は前記処理対象列と交差する部分を含む、行の一部である
付記1乃至5のいずれか1つ記載の圧縮プログラム。
各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記頻出値抽出ステップから前記並べ替え処理ステップを、異なる処理対象列に対して複数回実施する
付記1乃至5のいずれか1つ記載の圧縮プログラム。
圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納するステップと、
前記データ格納部に格納されている前記構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出ステップと、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、前記構造データにおける処理対象行を並べ替えても変化しない指標を基に符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与ステップと、
前記構造データにおける各前記処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換するステップと、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並び替え処理ステップと、
をコンピュータに実行させるための解凍プログラム。
前記符号付与ステップが、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせである頻出値集合を特定すると共に、特定された前記頻出値集合の出現頻度を計数するステップと、
前記出現頻度が最も大きい頻出値集合に対して最も小さい符号を付与し、前記符号表データ格納部に格納するステップと、
直前に符号が付与された前記頻出値集合と前記頻出値についての類似度が最も高く且つ符号が付与されていない頻出値集合を特定し、直前に付与された符号より大きい符号を、特定された前記頻出値集合に付与し、前記符号表データ格納部に格納するステップと、
を含む付記8記載の解凍プログラム。
各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記頻出値抽出ステップから前記並び替え処理ステップを、異なる処理対象列に対して複数回実施する
付記8又は9記載の解凍プログラム。
圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納するステップと、
前記データ格納部に格納されている前記構造データにおける各処理対象行を、前記構造データに出現する値又は値の組み合わせである値集合と符号とが対応付けて登録されている符号表において当該処理対象行に含まれる値と同一の値集合が対応付けている符号に変換する変換ステップと、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納するステップと、
をコンピュータに実行させるための解凍プログラム。
各前記処理対象行が、行全体又は前記処理対象列と交差する部分を含む、行の一部である
付記8乃至11のいずれか1つ記載の解凍プログラム。
各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記変換ステップから前記並び替え処理ステップを、異なる処理対象列に対して複数回実施する
付記11記載の解凍プログラム。
データ格納部に格納されており且つ行と列とが規定されている構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出ステップと、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、所定の規則に従って符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与ステップと、
前記構造データにおける各処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換するステップと、
前記符号の第1のシーケンスに対して、同一符号が連続するように順列変換処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並べ替え処理ステップと、
前記データ格納部に格納されている、並び替え後のデータに対して圧縮処理を実施するステップと、
を含み、コンピュータに実行される圧縮方法。
前記符号付与ステップが、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせを特定するステップと、
特定された前記頻出値又は前記頻出値の組み合わせが、前記符号表データ格納部に未登録であれば、当該頻出値又は頻出値の組み合わせである頻出値集合に対して未使用の符号を付与し、当該頻出値集合と当該符号とを対応付けて前記符号表データ格納部に格納するステップと、
を含む付記14記載の圧縮方法。
前記所定の規則が、
前記構造データにおける前記処理対象行を並べ替えても変化することがない指標に基づき前記頻出値集合を順序づけ、当該順序に応じて大きくなるように符号を順に対応付けるという規則である
請求項14記載の圧縮方法。
前記符号付与ステップが、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせである頻出値集合を特定すると共に、特定された前記頻出値集合の出現頻度を計数するステップと、
前記出現頻度が最も大きい頻出値集合に対して最も小さい符号を付与し、前記符号表データ格納部に格納するステップと、
直前に符号が付与された前記頻出値集合と前記頻出値についての類似度が最も高く且つ符号が付与されていない頻出値集合を特定し、直前に付与された符号より大きい符号を、特定された前記頻出値集合に付与し、前記符号表データ格納部に格納するステップと、
を含む付記14記載の圧縮方法。
前記符号表データ格納部に格納されている前記頻出値集合と対応する前記符号とを、圧縮されたデータと共に第2データ格納部に格納するステップ
をさらに含む付記15記載の圧縮方法。
各前記処理対象行が、行全体又は前記処理対象列と交差する部分を含む、行の一部である
付記14乃至18のいずれか1つ記載の圧縮方法。
各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記頻出値抽出ステップから前記並べ替え処理ステップを、異なる処理対象列に対して複数回実施する
付記14乃至18のいずれか1つ記載の圧縮方法。
圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納するステップと、
前記データ格納部に格納されている前記構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出ステップと、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、前記構造データにおける処理対象行を並べ替えても変化しない指標を基に符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与ステップと、
前記構造データにおける各前記処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換するステップと、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並び替え処理ステップと、
を含み、コンピュータに実行される解凍方法。
前記符号付与ステップが、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせである頻出値集合を特定すると共に、特定された前記頻出値集合の出現頻度を計数するステップと、
前記出現頻度が最も大きい頻出値集合に対して最も小さい符号を付与し、前記符号表データ格納部に格納するステップと、
直前に符号が付与された前記頻出値集合と前記頻出値についての類似度が最も高く且つ符号が付与されていない頻出値集合を特定し、直前に付与された符号より大きい符号を、特定された前記頻出値集合に付与し、前記符号表データ格納部に格納するステップと、
を含む付記21記載の解凍方法。
各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記頻出値抽出ステップから前記並び替え処理ステップを、異なる処理対象列に対して複数回実施する
付記21又は22のいずれか1つ記載の解凍方法。
圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納するステップと、
前記データ格納部に格納されている前記構造データにおける各処理対象行を、前記構造データに出現する値又は値の組み合わせである値集合と符号とが対応付けて登録されている符号表において当該処理対象行に含まれる値と同一の値集合が対応付けている符号と同一符号間における識別子との組み合わせに変換する変換ステップと、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納するステップと、
を含み、コンピュータに実行される解凍方法。
各前記処理対象行が、行全体又は前記処理対象列と交差する部分を含む、行の一部である
付記21乃至24のいずれか1つ記載の解凍方法。
各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記変換ステップから前記並び替え処理ステップを、異なる処理対象列に対して複数回実施する
付記24記載の解凍方法。
データ格納部に格納されており且つ行と列とが規定されている構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出部と、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、所定の規則に従って符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与部と、
前記構造データにおける各処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換する符号化処理部と、
前記符号の第1のシーケンスに対して、同一符号が連続するように順列変換処理を実施し、前記符号の第2のシーケンスを生成する順列変換処理部と、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並び替え処理部と、
前記データ格納部に格納されている、並び替え後の構造データに対して圧縮処理を実施する圧縮処理部と、
を有する圧縮装置。
前記符号付与部が、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせを特定する処理部と、
特定された前記頻出値又は前記頻出値の組み合わせが、前記符号表データ格納部に未登録であれば、当該頻出値又は頻出値の組み合わせである頻出値集合に対して未使用の符号を付与し、当該頻出値集合と当該符号とを対応付けて前記符号表データ格納部に格納する処理部と、
を含む付記27記載の圧縮装置。
前記所定の規則が、
前記構造データにおける前記処理対象行を並べ替えても変化することがない指標に基づき前記頻出値集合を順序づけ、当該順序に応じて大きくなるように符号を順に対応付けるという規則である
付記27記載の圧縮装置。
前記符号付与部が、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせである頻出値集合を特定すると共に、特定された前記頻出値集合の出現頻度を計数する計数部と、
前記出現頻度が最も大きい頻出値集合に対して最も小さい符号を付与し、前記符号表データ格納部に格納する第1付与部と、
直前に符号が付与された前記頻出値集合と前記頻出値についての類似度が最も高く且つ符号が付与されていない頻出値集合を特定し、直前に付与された符号より大きい符号を、特定された前記頻出値集合に付与し、前記符号表データ格納部に格納する第2付与部と、
を含む付記27記載の圧縮装置。
前記符号表データ格納部に格納されている前記頻出値集合と対応する前記符号とを、圧縮されたデータと共に第3データ格納部に格納する処理部
をさらに含む付記28記載の圧縮装置。
各前記処理対象行が、行全体又は前記処理対象列と交差する部分を含む、行の一部である
付記27乃至31のいずれか1つ記載の圧縮装置。
各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記頻出値抽出部、前記符号付与部、前記符号化処理部、前記順列変換処理部及び前記並び替え処理部に、異なる処理対象列に対して複数回処理させる
付記27乃至31のいずれか1つ記載の圧縮装置。
圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納する解凍処理部と、
前記データ格納部に格納されている前記構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出部と、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、前記構造データにおける処理対象行を並べ替えても変化しない指標を基に符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与部と、
前記構造データにおける各前記処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換する符号化処理部と、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成する順列逆変換処理部と、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを第2データ格納部に格納する並び替え処理部と、
を有する解凍装置。
前記符号付与部が、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせである頻出値集合を特定すると共に、特定された前記頻出値集合の出現頻度を計数する処理部と、
前記出現頻度が最も大きい頻出値集合に対して最も小さい符号を付与し、前記符号表データ格納部に格納する処理部と、
直前に符号が付与された前記頻出値集合と前記頻出値についての類似度が最も高く且つ符号が付与されていない頻出値集合を特定し、直前に付与された符号より大きい符号を、特定された前記頻出値集合に付与し、前記符号表データ格納部に格納する処理部と、
を含む付記34記載の解凍装置。
各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記頻出値抽出部、前記符号付与部、前記符号化処理部、前記順列逆変換処理部及び前記並び替え処理部に、異なる処理対象列に対して複数回処理させる
付記34又は35記載の解凍装置。
圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納する解凍処理部と、
前記データ格納部に格納されている前記構造データにおける各処理対象行を、前記構造データに出現する値又は値の組み合わせである値集合と符号とが対応付けて登録されている符号表において当該処理対象行に含まれる値と同一の値集合が対応付けている符号に変換する符号化処理部と、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成する順列逆変換処理部と、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並び替え処理部と、
を有する解凍装置。
各前記処理対象行が、行全体又は前記処理対象列と交差する部分を含む、行の一部である
付記34乃至37のいずれか1つ記載の解凍装置。
各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記符号化処理部と前記順列逆変換処理部と前記並び替え処理部とに、異なる処理対象列に対して複数回処理させる
付記37記載の解凍装置。
12 頻出値表格納部 13 符号付与部
14 符号表格納部 15 順列変換処理部
16 符号列格納部 17 並び替え処理部
18 圧縮処理部 19 圧縮データ格納部
20 符号化処理部
210 圧縮データ格納部 211 入力部
212 解凍処理部 213 データ格納部
214 頻出値抽出部 215 頻出値表格納部
216 符号付与部 217 符号表格納部
218 符号化処理部 219 符号列格納部
220 順列逆変換処理部
221 並び替え処理部
Claims (13)
- データ格納部に格納されており且つ行と列とが規定されている構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出部と、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、所定の規則に従って符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与部と、
前記構造データにおける各処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換する符号化処理部と、
前記符号の第1のシーケンスに対して、同一符号が連続するように順列変換処理を実施し、前記符号の第2のシーケンスを生成する順列変換処理部と、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並び替え処理部と、
前記データ格納部に格納されている、並び替え後の構造データに対して圧縮処理を実施する圧縮処理部と、
を有する圧縮装置。 - 前記符号付与部が、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせを特定する処理部と、
特定された前記頻出値又は前記頻出値の組み合わせが、前記符号表データ格納部に未登録であれば、当該頻出値又は頻出値の組み合わせである頻出値集合に対して未使用の符号を付与し、当該頻出値集合と当該符号とを対応付けて前記符号表データ格納部に格納する処理部と、
を含む請求項1記載の圧縮装置。 - 前記所定の規則が、
前記構造データにおける前記処理対象行を並べ替えても変化することがない指標に基づき前記頻出値集合を順序づけ、当該順序に応じて大きくなるように符号を順に対応付けるという規則である
請求項1記載の圧縮装置。 - 前記符号付与部が、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせである頻出値集合を特定すると共に、特定された前記頻出値集合の出現頻度を計数する計数部と、
前記出現頻度が最も大きい頻出値集合に対して最も小さい符号を付与し、前記符号表データ格納部に格納する第1付与部と、
直前に符号が付与された前記頻出値集合と前記頻出値についての類似度が最も高く且つ符号が付与されていない頻出値集合を特定し、直前に付与された符号より大きい符号を、特定された前記頻出値集合に付与し、前記符号表データ格納部に格納する第2付与部と、
を含む請求項1記載の圧縮装置。 - 各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記頻出値抽出部、前記符号付与部、前記符号化処理部、前記順列変換処理部及び前記並び替え処理部に、異なる処理対象列に対して複数回処理させる
請求項1乃至4のいずれか1つ記載の圧縮装置。 - 圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納する解凍処理部と、
前記データ格納部に格納されている前記構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出部と、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、前記構造データにおける処理対象行を並べ替えても変化しない指標を基に符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与部と、
前記構造データにおける各前記処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換する符号化処理部と、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成する順列逆変換処理部と、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを第2データ格納部に格納する並び替え処理部と、
を有する解凍装置。 - 圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納する解凍処理部と、
前記データ格納部に格納されている前記構造データにおける各処理対象行を、前記構造データに出現する値又は値の組み合わせである値集合と符号とが対応付けて登録されている符号表において当該処理対象行に含まれる値と同一の値集合が対応付けている符号に変換する符号化処理部と、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成する順列逆変換処理部と、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並び替え処理部と、
を有する解凍装置。 - データ格納部に格納されており且つ行と列とが規定されている構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出ステップと、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、所定の規則に従って符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与ステップと、
前記構造データにおける各処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換するステップと、
前記符号の第1のシーケンスに対して、同一符号が連続するように順列変換処理を実施し、前記符号の第2のシーケンスを生成する順列変換ステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並べ替え処理ステップと、
前記データ格納部に格納されている、並び替え後の構造データに対して圧縮処理を実施するステップと、
を、コンピュータに実行させるための圧縮プログラム。 - 圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納するステップと、
前記データ格納部に格納されている前記構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出ステップと、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、前記構造データにおける処理対象行を並べ替えても変化しない指標を基に符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与ステップと、
前記構造データにおける各前記処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換するステップと、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並び替え処理ステップと、
をコンピュータに実行させるための解凍プログラム。 - 圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納するステップと、
前記データ格納部に格納されている前記構造データにおける各処理対象行を、前記構造データに出現する値又は値の組み合わせである値集合と符号とが対応付けて登録されている符号表において当該処理対象行に含まれる値と同一の値集合が対応付けている符号に変換する変換ステップと、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納するステップと、
をコンピュータに実行させるための解凍プログラム。 - データ格納部に格納されており且つ行と列とが規定されている構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出ステップと、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、所定の規則に従って符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与ステップと、
前記構造データにおける各処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換するステップと、
前記符号の第1のシーケンスに対して、同一符号が連続するように順列変換処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並べ替え処理ステップと、
前記データ格納部に格納されている、並び替え後のデータに対して圧縮処理を実施するステップと、
を含み、コンピュータに実行される圧縮方法。 - 圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納するステップと、
前記データ格納部に格納されている前記構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出ステップと、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、前記構造データにおける処理対象行を並べ替えても変化しない指標を基に符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与ステップと、
前記構造データにおける各前記処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換するステップと、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並び替え処理ステップと、
を含み、コンピュータに実行される解凍方法。 - 圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納するステップと、
前記データ格納部に格納されている前記構造データにおける各処理対象行を、前記構造データに出現する値又は値の組み合わせである値集合と符号とが対応付けて登録されている符号表において当該処理対象行に含まれる値と同一の値集合が対応付けている符号と同一符号間における識別子との組み合わせに変換する変換ステップと、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納するステップと、
を含み、コンピュータに実行される解凍方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010006034A JP5487985B2 (ja) | 2010-01-14 | 2010-01-14 | 圧縮装置、方法及びプログラム、並びに展開装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010006034A JP5487985B2 (ja) | 2010-01-14 | 2010-01-14 | 圧縮装置、方法及びプログラム、並びに展開装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011145883A JP2011145883A (ja) | 2011-07-28 |
JP5487985B2 true JP5487985B2 (ja) | 2014-05-14 |
Family
ID=44460678
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010006034A Active JP5487985B2 (ja) | 2010-01-14 | 2010-01-14 | 圧縮装置、方法及びプログラム、並びに展開装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5487985B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2015008650A1 (ja) * | 2013-07-16 | 2017-03-02 | 株式会社日立製作所 | 医用画像管理装置及び医用画像管理方法 |
WO2018069999A1 (ja) * | 2016-10-12 | 2018-04-19 | 富士通株式会社 | 出力プログラム、出力方法および出力システム |
WO2018096998A1 (ja) * | 2016-11-28 | 2018-05-31 | 株式会社ターボデータラボラトリー | データ圧縮装置、コンピュータプログラム及びデータ圧縮方法 |
JP6787231B2 (ja) | 2017-04-04 | 2020-11-18 | 富士通株式会社 | データ処理プログラム、データ処理方法およびデータ処理装置 |
US10860399B2 (en) * | 2018-03-15 | 2020-12-08 | Samsung Display Co., Ltd. | Permutation based stress profile compression |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0233632A (ja) * | 1988-07-25 | 1990-02-02 | Nec Corp | データ圧縮方式 |
JPH08180067A (ja) * | 1994-12-26 | 1996-07-12 | Nec Corp | データベースレコード圧縮システム |
US6009432A (en) * | 1998-07-08 | 1999-12-28 | Required Technologies, Inc. | Value-instance-connectivity computer-implemented database |
JP4451722B2 (ja) * | 2004-06-08 | 2010-04-14 | 三菱電機株式会社 | データベースサーバ及びデータベースシステム |
JP4740060B2 (ja) * | 2006-07-31 | 2011-08-03 | 富士通株式会社 | 重複データ検出プログラム、重複データ検出方法および重複データ検出装置 |
US7769729B2 (en) * | 2007-05-21 | 2010-08-03 | Sap Ag | Block compression of tables with repeated values |
-
2010
- 2010-01-14 JP JP2010006034A patent/JP5487985B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011145883A (ja) | 2011-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9390098B2 (en) | Fast approximation to optimal compression of digital data | |
JP3278297B2 (ja) | データ圧縮方法及びデータ復元方法並びにデータ圧縮装置及びデータ復元装置 | |
JP5487985B2 (ja) | 圧縮装置、方法及びプログラム、並びに展開装置、方法及びプログラム | |
US7689630B1 (en) | Two-level bitmap structure for bit compression and data management | |
JP5831298B2 (ja) | プログラム、情報処理装置およびインデックス生成方法 | |
CN101783788A (zh) | 文件压缩、解压缩方法、装置及压缩文件搜索方法、装置 | |
CN103582883A (zh) | 具有组格式的可变长度数据的改进型编码和解码 | |
CN110825363B (zh) | 智能合约获取方法、装置、电子设备及存储介质 | |
WO2011007956A2 (ko) | 데이터의 압축방법 | |
JP6681313B2 (ja) | データを符号化するための方法、コンピュータ・プログラムおよびシステム | |
JP7286810B2 (ja) | テキスト知能化洗浄方法、装置及びコンピュータ読み取り可能な記憶媒体 | |
US20160217207A1 (en) | Semantic structure search device and semantic structure search method | |
US20180041224A1 (en) | Data value suffix bit level compression | |
CN113627132B (zh) | 数据去重标记码生成方法、系统、电子设备及存储介质 | |
CN104133883B (zh) | 电话号码归属地数据压缩方法 | |
CN110007955B (zh) | 一种指令集模拟器译码模块代码的压缩方法 | |
JP4758494B2 (ja) | ビット長を符号に変換する回路及び方法 | |
Inagaki et al. | Novel and generalized sort-based transform for lossless data compression | |
JPH06290021A (ja) | ソースプログラム圧縮方法 | |
CN112527753B (zh) | Dns解析记录无损压缩方法、装置、电子设备及存储介质 | |
JPH05152971A (ja) | データ圧縮・復元方法 | |
JPH05135102A (ja) | 文書検索方式 | |
CN111026554B (zh) | 一种XenServer系统物理内存分析方法及系统 | |
Li et al. | Efficient parallel design for BWT-based DNA sequences data multi-compression algorithm | |
Xiao et al. | Index Compression for Audio Fingerprinting Systems Based on Compressed Suffix Array |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120910 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131008 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140210 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5487985 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |