JP2011145883A - 圧縮装置、方法及びプログラム、並びに展開装置、方法及びプログラム - Google Patents
圧縮装置、方法及びプログラム、並びに展開装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2011145883A JP2011145883A JP2010006034A JP2010006034A JP2011145883A JP 2011145883 A JP2011145883 A JP 2011145883A JP 2010006034 A JP2010006034 A JP 2010006034A JP 2010006034 A JP2010006034 A JP 2010006034A JP 2011145883 A JP2011145883 A JP 2011145883A
- Authority
- JP
- Japan
- Prior art keywords
- code
- data
- frequent
- storage unit
- processing target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】行と列とを含む構造データ内の頻出値から、頻出値又は頻出値の組み合わせである頻出値集合に対して所定の規則に従って符号を割り当てる。そして、構造データにおける各行を、当該行に含まれる値と同一の頻出値集合に対応する符号に変換する。さらに、符号の第1シーケンスに対して、同一符号が連続するように順列変換処理を実施し、符号の第2シーケンスを生成する。第2シーケンスに従って、構造データにおける行を並び替え、並び替え後の構造データに対して既存の圧縮処理を実施する。
【選択図】図2
Description
図6に示したコード付与処理を実施すると、出現した順番にコードが付与されることになる。ステップS7では、コードを付与した順番に従って小さい順に符号を付与する。すなわち、s1を一番小さい符号に変換し、s2を二番目に小さい符号に変換し、s3を三番目に小さい符号に変換する。例えば、符号にアルファベットを採用する場合、符号の順番はアルファベット順に従う。但し、他の基準にて順序が決まるようにしてもよい。
例えば図9に示すような処理を行う。まず、符号付与部13は、圧縮すべき構造データの処理対象列において、頻出値集合表に登録されている各頻出値集合の出現回数を計数し、符号表格納部14に格納する(ステップS31)。例えば、図10に示すようなデータが得られる。すなわち、コード及び頻出値集合の組み合わせに対応して出現回数が登録される。なお、例えば図6の処理フローにおいて、コードを付与すると共に同じ頻出値集合Xが検出されるとカウンタを1増加させるといった手法にて、頻出値集合毎に出現回数を計数するようにしてもよい。
この方法では、まず、符号付与部13は、コードsiの集合Σと、1から|Σ|(すなわち集合Σに属する要素の数)の数の集合Xとを設定する(ステップS51)。具体的には、集合Σに、全てのコードsiを入れて、集合Xに1から|Σ|の数を入れる。
j=argmaxj∈XJaccord(ci-1,sj) (1)
Jaccord(a,b)=|Set(a)∩Set(b)|/|Set(a)∪Set(b)| (2)
Set(a)は、符号aが表す頻出値集合であり、|Set(a)|は、符号aが表す頻出値集合に含まれる頻出値の数を表す。
この場合にも、移動元の行の位置データが生成できる。具体的には、図20Bに示すように、図20Aの符号列Lの各行の移動元は、先頭から順番に「12」「11」「8」「1」「4」「6」「9」「2」「5」「7」「10」「3」行目となる。このような移動元の行の位置データも、符号列格納部16に格納される。
データ格納部に格納されており且つ行と列とが規定されている構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出ステップと、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、所定の規則に従って符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与ステップと、
前記構造データにおける各処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換するステップと、
前記符号の第1のシーケンスに対して、同一符号が連続するように順列変換処理を実施し、前記符号の第2のシーケンスを生成する順列変換ステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並べ替え処理ステップと、
前記データ格納部に格納されている、並び替え後の構造データに対して圧縮処理を実施するステップと、
を、コンピュータに実行させるための圧縮プログラム。
前記符号付与ステップが、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせを特定するステップと、
特定された前記頻出値又は前記頻出値の組み合わせが、前記符号表データ格納部に未登録であれば、当該頻出値又は頻出値の組み合わせである頻出値集合に対して未使用の符号を付与し、当該頻出値集合と当該符号とを対応付けて前記符号表データ格納部に格納するステップと、
を含む付記1記載の圧縮プログラム。
前記所定の規則が、
前記構造データにおける前記処理対象行を並べ替えても変化することがない指標に基づき前記頻出値集合を順序づけ、当該順序に応じて大きくなるように符号を順に対応付けるという規則である
付記1記載の圧縮プログラム。
前記符号付与ステップが、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせである頻出値集合を特定すると共に、特定された前記頻出値集合の出現頻度を計数するステップと、
前記出現頻度が最も大きい頻出値集合に対して最も小さい符号を付与し、前記符号表データ格納部に格納するステップと、
直前に符号が付与された前記頻出値集合と前記頻出値についての類似度が最も高く且つ符号が付与されていない頻出値集合を特定し、直前に付与された符号より大きい符号を、特定された前記頻出値集合に付与し、前記符号表データ格納部に格納するステップと、
を含む付記1記載の圧縮プログラム。
前記符号表データ格納部に格納されている前記頻出値集合と対応する前記符号とを、圧縮されたデータと共に第2データ格納部に格納するステップ
をさらに前記コンピュータに実行させるための付記2記載の圧縮プログラム。
各前記処理対象行が、行全体又は前記処理対象列と交差する部分を含む、行の一部である
付記1乃至5のいずれか1つ記載の圧縮プログラム。
各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記頻出値抽出ステップから前記並べ替え処理ステップを、異なる処理対象列に対して複数回実施する
付記1乃至5のいずれか1つ記載の圧縮プログラム。
圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納するステップと、
前記データ格納部に格納されている前記構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出ステップと、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、前記構造データにおける処理対象行を並べ替えても変化しない指標を基に符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与ステップと、
前記構造データにおける各前記処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換するステップと、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並び替え処理ステップと、
をコンピュータに実行させるための解凍プログラム。
前記符号付与ステップが、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせである頻出値集合を特定すると共に、特定された前記頻出値集合の出現頻度を計数するステップと、
前記出現頻度が最も大きい頻出値集合に対して最も小さい符号を付与し、前記符号表データ格納部に格納するステップと、
直前に符号が付与された前記頻出値集合と前記頻出値についての類似度が最も高く且つ符号が付与されていない頻出値集合を特定し、直前に付与された符号より大きい符号を、特定された前記頻出値集合に付与し、前記符号表データ格納部に格納するステップと、
を含む付記8記載の解凍プログラム。
各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記頻出値抽出ステップから前記並べ替え処理ステップを、異なる処理対象列に対して複数回実施する
付記8又は9記載の解凍プログラム。
圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納するステップと、
前記データ格納部に格納されている前記構造データにおける各処理対象行を、前記構造データに出現する値又は値の組み合わせである値集合と符号とが対応付けて登録されている符号表において当該処理対象行に含まれる値と同一の値集合が対応付けている符号に変換する変換ステップと、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納するステップと、
をコンピュータに実行させるための解凍プログラム。
各前記処理対象行が、行全体又は前記処理対象列と交差する部分を含む、行の一部である
付記8乃至11のいずれか1つ記載の解凍プログラム。
各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記変換ステップから前記並べ替え処理ステップを、異なる処理対象列に対して複数回実施する
付記11記載の解凍プログラム。
データ格納部に格納されており且つ行と列とが規定されている構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出ステップと、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、所定の規則に従って符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与ステップと、
前記構造データにおける各処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換するステップと、
前記符号の第1のシーケンスに対して、同一符号が連続するように順列変換処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並べ替え処理ステップと、
前記データ格納部に格納されている、並び替え後のデータに対して圧縮処理を実施するステップと、
を含み、コンピュータに実行される圧縮方法。
前記符号付与ステップが、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせを特定するステップと、
特定された前記頻出値又は前記頻出値の組み合わせが、前記符号表データ格納部に未登録であれば、当該頻出値又は頻出値の組み合わせである頻出値集合に対して未使用の符号を付与し、当該頻出値集合と当該符号とを対応付けて前記符号表データ格納部に格納するステップと、
を含む付記14記載の圧縮方法。
前記所定の規則が、
前記構造データにおける前記処理対象行を並べ替えても変化することがない指標に基づき前記頻出値集合を順序づけ、当該順序に応じて大きくなるように符号を順に対応付けるという規則である
請求項14記載の圧縮方法。
前記符号付与ステップが、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせである頻出値集合を特定すると共に、特定された前記頻出値集合の出現頻度を計数するステップと、
前記出現頻度が最も大きい頻出値集合に対して最も小さい符号を付与し、前記符号表データ格納部に格納するステップと、
直前に符号が付与された前記頻出値集合と前記頻出値についての類似度が最も高く且つ符号が付与されていない頻出値集合を特定し、直前に付与された符号より大きい符号を、特定された前記頻出値集合に付与し、前記符号表データ格納部に格納するステップと、
を含む付記14記載の圧縮方法。
前記符号表データ格納部に格納されている前記頻出値集合と対応する前記符号とを、圧縮されたデータと共に第2データ格納部に格納するステップ
をさらに含む付記15記載の圧縮方法。
各前記処理対象行が、行全体又は前記処理対象列と交差する部分を含む、行の一部である
付記14乃至18のいずれか1つ記載の圧縮方法。
各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記頻出値抽出ステップから前記並べ替え処理ステップを、異なる処理対象列に対して複数回実施する
付記14乃至18のいずれか1つ記載の圧縮方法。
圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納するステップと、
前記データ格納部に格納されている前記構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出ステップと、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、前記構造データにおける処理対象行を並べ替えても変化しない指標を基に符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与ステップと、
前記構造データにおける各前記処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換するステップと、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並び替え処理ステップと、
を含み、コンピュータに実行される解凍方法。
前記符号付与ステップが、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせである頻出値集合を特定すると共に、特定された前記頻出値集合の出現頻度を計数するステップと、
前記出現頻度が最も大きい頻出値集合に対して最も小さい符号を付与し、前記符号表データ格納部に格納するステップと、
直前に符号が付与された前記頻出値集合と前記頻出値についての類似度が最も高く且つ符号が付与されていない頻出値集合を特定し、直前に付与された符号より大きい符号を、特定された前記頻出値集合に付与し、前記符号表データ格納部に格納するステップと、
を含む付記21記載の解凍方法。
各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記頻出値抽出ステップから前記並べ替え処理ステップを、異なる処理対象列に対して複数回実施する
付記21又は22のいずれか1つ記載の解凍方法。
圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納するステップと、
前記データ格納部に格納されている前記構造データにおける各処理対象行を、前記構造データに出現する値又は値の組み合わせである値集合と符号とが対応付けて登録されている符号表において当該処理対象行に含まれる値と同一の値集合が対応付けている符号と同一符号間における識別子との組み合わせに変換する変換ステップと、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納するステップと、
を含み、コンピュータに実行される解凍方法。
各前記処理対象行が、行全体又は前記処理対象列と交差する部分を含む、行の一部である
付記21乃至24のいずれか1つ記載の解凍方法。
各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記変換ステップから前記並べ替え処理ステップを、異なる処理対象列に対して複数回実施する
付記24記載の解凍方法。
データ格納部に格納されており且つ行と列とが規定されている構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出部と、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、所定の規則に従って符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与部と、
前記構造データにおける各処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換する符号化処理部と、
前記符号の第1のシーケンスに対して、同一符号が連続するように順列変換処理を実施し、前記符号の第2のシーケンスを生成する順列変換処理部と、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並び替え処理部と、
前記データ格納部に格納されている、並び替え後の構造データに対して圧縮処理を実施する圧縮処理部と、
を有する圧縮装置。
前記符号付与部が、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせを特定する処理部と、
特定された前記頻出値又は前記頻出値の組み合わせが、前記符号表データ格納部に未登録であれば、当該頻出値又は頻出値の組み合わせである頻出値集合に対して未使用の符号を付与し、当該頻出値集合と当該符号とを対応付けて前記符号表データ格納部に格納する処理部と、
を含む付記27記載の圧縮装置。
前記所定の規則が、
前記構造データにおける前記処理対象行を並べ替えても変化することがない指標に基づき前記頻出値集合を順序づけ、当該順序に応じて大きくなるように符号を順に対応付けるという規則である
付記27記載の圧縮装置。
前記符号付与ステップが、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせである頻出値集合を特定すると共に、特定された前記頻出値集合の出現頻度を計数するステップと、
前記出現頻度が最も大きい頻出値集合に対して最も小さい符号を付与し、前記符号表データ格納部に格納するステップと、
直前に符号が付与された前記頻出値集合と前記頻出値についての類似度が最も高く且つ符号が付与されていない頻出値集合を特定し、直前に付与された符号より大きい符号を、特定された前記頻出値集合に付与し、前記符号表データ格納部に格納するステップと、
を含む付記27記載の圧縮装置。
前記符号表データ格納部に格納されている前記頻出値集合と対応する前記符号とを、圧縮されたデータと共に第3データ格納部に格納する処理部
をさらに含む付記28記載の圧縮装置。
各前記処理対象行が、行全体又は前記処理対象列と交差する部分を含む、行の一部である
付記27乃至31のいずれか1つ記載の圧縮装置。
各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記頻出値抽出部、前記符号付与部、前記符号化処理部、前記順列変換処理部及び前記並べ替え処理部に、異なる処理対象列に対して複数回処理させる
付記27乃至31のいずれか1つ記載の圧縮装置。
圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納する解凍処理部と、
前記データ格納部に格納されている前記構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出部と、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、前記構造データにおける処理対象行を並べ替えても変化しない指標を基に符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与部と、
前記構造データにおける各前記処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換する符号化処理部と、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成する順列逆変換処理部と、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを第2データ格納部に格納する並び替え処理部と、
を有する解凍装置。
前記符号付与部が、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせである頻出値集合を特定すると共に、特定された前記頻出値集合の出現頻度を計数する処理部と、
前記出現頻度が最も大きい頻出値集合に対して最も小さい符号を付与し、前記符号表データ格納部に格納する処理部と、
直前に符号が付与された前記頻出値集合と前記頻出値についての類似度が最も高く且つ符号が付与されていない頻出値集合を特定し、直前に付与された符号より大きい符号を、特定された前記頻出値集合に付与し、前記符号表データ格納部に格納する処理部と、
を含む付記34記載の解凍装置。
各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記頻出値抽出部、前記符号付与部、前記符号化処理部、前記順列逆変換処理部及び前記並べ替え処理部に、異なる処理対象列に対して複数回処理させる
付記34又は35記載の解凍装置。
圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納する解凍処理部と、
前記データ格納部に格納されている前記構造データにおける各処理対象行を、前記構造データに出現する値又は値の組み合わせである値集合と符号とが対応付けて登録されている符号表において当該処理対象行に含まれる値と同一の値集合が対応付けている符号に変換する符号化処理部と、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成する順列逆変換処理部と、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並び替え処理部と、
を有する解凍装置。
各前記処理対象行が、行全体又は前記処理対象列と交差する部分を含む、行の一部である
付記34乃至37のいずれか1つ記載の解凍装置。
各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記符号化処理部と前記順列逆変換処理部と前記並び替え処理部とに、異なる処理対象列に対して複数回処理させる
付記37記載の解凍装置。
12 頻出値表格納部 13 符号付与部
14 符号表格納部 15 順列変換処理部
16 符号列格納部 17 並び替え処理部
18 圧縮処理部 19 圧縮データ格納部
20 符号化処理部
210 圧縮データ格納部 211 入力部
212 解凍処理部 213 データ格納部
214 頻出値抽出部 215 頻出値表格納部
216 符号付与部 217 符号表格納部
218 符号化処理部 219 符号列格納部
220 順列逆変換処理部
221 並び替え処理部
Claims (13)
- データ格納部に格納されており且つ行と列とが規定されている構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出部と、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、所定の規則に従って符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与部と、
前記構造データにおける各処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換する符号化処理部と、
前記符号の第1のシーケンスに対して、同一符号が連続するように順列変換処理を実施し、前記符号の第2のシーケンスを生成する順列変換処理部と、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並び替え処理部と、
前記データ格納部に格納されている、並び替え後の構造データに対して圧縮処理を実施する圧縮処理部と、
を有する圧縮装置。 - 前記符号付与部が、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせを特定する処理部と、
特定された前記頻出値又は前記頻出値の組み合わせが、前記符号表データ格納部に未登録であれば、当該頻出値又は頻出値の組み合わせである頻出値集合に対して未使用の符号を付与し、当該頻出値集合と当該符号とを対応付けて前記符号表データ格納部に格納する処理部と、
を含む請求項1記載の圧縮装置。 - 前記所定の規則が、
前記構造データにおける前記処理対象行を並べ替えても変化することがない指標に基づき前記頻出値集合を順序づけ、当該順序に応じて大きくなるように符号を順に対応付けるという規則である
請求項1記載の圧縮装置。 - 前記符号付与ステップが、
前記構造データにおける各前記処理対象行に含まれる前記頻出値又は前記頻出値の組み合わせである頻出値集合を特定すると共に、特定された前記頻出値集合の出現頻度を計数するステップと、
前記出現頻度が最も大きい頻出値集合に対して最も小さい符号を付与し、前記符号表データ格納部に格納するステップと、
直前に符号が付与された前記頻出値集合と前記頻出値についての類似度が最も高く且つ符号が付与されていない頻出値集合を特定し、直前に付与された符号より大きい符号を、特定された前記頻出値集合に付与し、前記符号表データ格納部に格納するステップと、
を含む請求項1記載の圧縮装置。 - 各前記処理対象行が、前記処理対象列と交差する部分を含む、行の一部であり、
前記頻出値抽出部、前記符号付与部、前記符号化処理部、前記順列変換処理部及び前記並べ替え処理部に、異なる処理対象列に対して複数回処理させる
請求項1乃至4のいずれか1つ記載の圧縮装置。 - 圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納する解凍処理部と、
前記データ格納部に格納されている前記構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出部と、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、前記構造データにおける処理対象行を並べ替えても変化しない指標を基に符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与部と、
前記構造データにおける各前記処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換する符号化処理部と、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成する順列逆変換処理部と、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを第2データ格納部に格納する並び替え処理部と、
を有する解凍装置。 - 圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納する解凍処理部と、
前記データ格納部に格納されている前記構造データにおける各処理対象行を、前記構造データに出現する値又は値の組み合わせである値集合と符号とが対応付けて登録されている符号表において当該処理対象行に含まれる値と同一の値集合が対応付けている符号に変換する符号化処理部と、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成する順列逆変換処理部と、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並び替え処理部と、
を有する解凍装置。 - データ格納部に格納されており且つ行と列とが規定されている構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出ステップと、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、所定の規則に従って符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与ステップと、
前記構造データにおける各処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換するステップと、
前記符号の第1のシーケンスに対して、同一符号が連続するように順列変換処理を実施し、前記符号の第2のシーケンスを生成する順列変換ステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並べ替え処理ステップと、
前記データ格納部に格納されている、並び替え後の構造データに対して圧縮処理を実施するステップと、
を、コンピュータに実行させるための圧縮プログラム。 - 圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納するステップと、
前記データ格納部に格納されている前記構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出ステップと、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、前記構造データにおける処理対象行を並べ替えても変化しない指標を基に符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与ステップと、
前記構造データにおける各前記処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換するステップと、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並び替え処理ステップと、
をコンピュータに実行させるための解凍プログラム。 - 圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納するステップと、
前記データ格納部に格納されている前記構造データにおける各処理対象行を、前記構造データに出現する値又は値の組み合わせである値集合と符号とが対応付けて登録されている符号表において当該処理対象行に含まれる値と同一の値集合が対応付けている符号に変換する変換ステップと、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納するステップと、
をコンピュータに実行させるための解凍プログラム。 - データ格納部に格納されており且つ行と列とが規定されている構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出ステップと、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、所定の規則に従って符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与ステップと、
前記構造データにおける各処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換するステップと、
前記符号の第1のシーケンスに対して、同一符号が連続するように順列変換処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並べ替え処理ステップと、
前記データ格納部に格納されている、並び替え後のデータに対して圧縮処理を実施するステップと、
を含み、コンピュータに実行される圧縮方法。 - 圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納するステップと、
前記データ格納部に格納されている前記構造データにおける処理対象列において出現する値の出現回数を計数し、当該出現回数に基づき頻出値を抽出し、頻出値格納部に格納する頻出値抽出ステップと、
前記頻出値格納部に格納されている前記頻出値又は前記構造データにおける特定の行内に出現する前記頻出値の組み合わせである頻出値集合に対して、前記構造データにおける処理対象行を並べ替えても変化しない指標を基に符号を付与し、前記頻出値集合と前記符号とを対応付けて符号表データ格納部に格納する符号付与ステップと、
前記構造データにおける各前記処理対象行を、当該処理対象行に含まれる値と同一の頻出値集合に対応付けられている符号に変換するステップと、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納する並び替え処理ステップと、
を含み、コンピュータに実行される解凍方法。 - 圧縮されたデータを解凍することで行と列とが規定されている構造データを生成し、データ格納部に格納するステップと、
前記データ格納部に格納されている前記構造データにおける各処理対象行を、前記構造データに出現する値又は値の組み合わせである値集合と符号とが対応付けて登録されている符号表において当該処理対象行に含まれる値と同一の値集合が対応付けている符号と同一符号間における識別子との組み合わせに変換する変換ステップと、
前記符号の第1のシーケンスに対して、前記構造データに施された所定の順列変換処理の逆処理を実施し、前記符号の第2のシーケンスを生成するステップと、
前記第1及び第2のシーケンスの符号の対応関係に従って、前記構造データにおける前記処理対象行を並び替え、並び替え後の前記構造データを前記データ格納部に格納するステップと、
を含み、コンピュータに実行される解凍方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010006034A JP5487985B2 (ja) | 2010-01-14 | 2010-01-14 | 圧縮装置、方法及びプログラム、並びに展開装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010006034A JP5487985B2 (ja) | 2010-01-14 | 2010-01-14 | 圧縮装置、方法及びプログラム、並びに展開装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011145883A true JP2011145883A (ja) | 2011-07-28 |
JP5487985B2 JP5487985B2 (ja) | 2014-05-14 |
Family
ID=44460678
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010006034A Active JP5487985B2 (ja) | 2010-01-14 | 2010-01-14 | 圧縮装置、方法及びプログラム、並びに展開装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5487985B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015008650A1 (ja) * | 2013-07-16 | 2015-01-22 | 株式会社 日立メディコ | 医用画像管理装置及び医用画像管理方法 |
WO2018069999A1 (ja) * | 2016-10-12 | 2018-04-19 | 富士通株式会社 | 出力プログラム、出力方法および出力システム |
WO2018096998A1 (ja) * | 2016-11-28 | 2018-05-31 | 株式会社ターボデータラボラトリー | データ圧縮装置、コンピュータプログラム及びデータ圧縮方法 |
US10367523B2 (en) | 2017-04-04 | 2019-07-30 | Fujitsu Limited | Data processing method and data processing apparatus |
JP2019159329A (ja) * | 2018-03-15 | 2019-09-19 | 三星ディスプレイ株式會社Samsung Display Co.,Ltd. | ストレス補償システムおよび方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0233632A (ja) * | 1988-07-25 | 1990-02-02 | Nec Corp | データ圧縮方式 |
JPH08180067A (ja) * | 1994-12-26 | 1996-07-12 | Nec Corp | データベースレコード圧縮システム |
JP2002520715A (ja) * | 1998-07-08 | 2002-07-09 | リクワイヤード テクノロジーズ インコーポレイテッド | 値・インスタンス・接続性をコンピュータで実現したデータベース |
JP2005352561A (ja) * | 2004-06-08 | 2005-12-22 | Mitsubishi Electric Corp | データベースサーバ及びデータベースクライアント |
JP2008033728A (ja) * | 2006-07-31 | 2008-02-14 | Fujitsu Ltd | 重複データ検出プログラム、重複データ検出方法および重複データ検出装置 |
JP2008287723A (ja) * | 2007-05-21 | 2008-11-27 | Sap Ag | 繰り返し値を有するテーブルのブロック圧縮 |
-
2010
- 2010-01-14 JP JP2010006034A patent/JP5487985B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0233632A (ja) * | 1988-07-25 | 1990-02-02 | Nec Corp | データ圧縮方式 |
JPH08180067A (ja) * | 1994-12-26 | 1996-07-12 | Nec Corp | データベースレコード圧縮システム |
JP2002520715A (ja) * | 1998-07-08 | 2002-07-09 | リクワイヤード テクノロジーズ インコーポレイテッド | 値・インスタンス・接続性をコンピュータで実現したデータベース |
JP2005352561A (ja) * | 2004-06-08 | 2005-12-22 | Mitsubishi Electric Corp | データベースサーバ及びデータベースクライアント |
JP2008033728A (ja) * | 2006-07-31 | 2008-02-14 | Fujitsu Ltd | 重複データ検出プログラム、重複データ検出方法および重複データ検出装置 |
JP2008287723A (ja) * | 2007-05-21 | 2008-11-27 | Sap Ag | 繰り返し値を有するテーブルのブロック圧縮 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015008650A1 (ja) * | 2013-07-16 | 2015-01-22 | 株式会社 日立メディコ | 医用画像管理装置及び医用画像管理方法 |
JPWO2015008650A1 (ja) * | 2013-07-16 | 2017-03-02 | 株式会社日立製作所 | 医用画像管理装置及び医用画像管理方法 |
WO2018069999A1 (ja) * | 2016-10-12 | 2018-04-19 | 富士通株式会社 | 出力プログラム、出力方法および出力システム |
JPWO2018069999A1 (ja) * | 2016-10-12 | 2019-06-24 | 富士通株式会社 | 出力プログラム、出力方法および出力システム |
US11216709B2 (en) | 2016-10-12 | 2022-01-04 | Fujitsu Limited | Non-transitory computer-readable storage medium for storing program, output method, and output system |
WO2018096998A1 (ja) * | 2016-11-28 | 2018-05-31 | 株式会社ターボデータラボラトリー | データ圧縮装置、コンピュータプログラム及びデータ圧縮方法 |
JPWO2018096998A1 (ja) * | 2016-11-28 | 2019-10-17 | 株式会社ターボデータラボラトリー | データ圧縮装置、コンピュータプログラム及びデータ圧縮方法 |
US10367523B2 (en) | 2017-04-04 | 2019-07-30 | Fujitsu Limited | Data processing method and data processing apparatus |
JP2019159329A (ja) * | 2018-03-15 | 2019-09-19 | 三星ディスプレイ株式會社Samsung Display Co.,Ltd. | ストレス補償システムおよび方法 |
JP7285662B2 (ja) | 2018-03-15 | 2023-06-02 | 三星ディスプレイ株式會社 | ストレス補償を遂行するシステム、ディスプレイおよびディスプレイを動作させる方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5487985B2 (ja) | 2014-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9390098B2 (en) | Fast approximation to optimal compression of digital data | |
JP3278297B2 (ja) | データ圧縮方法及びデータ復元方法並びにデータ圧縮装置及びデータ復元装置 | |
US7689630B1 (en) | Two-level bitmap structure for bit compression and data management | |
JP5487985B2 (ja) | 圧縮装置、方法及びプログラム、並びに展開装置、方法及びプログラム | |
JP5831298B2 (ja) | プログラム、情報処理装置およびインデックス生成方法 | |
JP6681313B2 (ja) | データを符号化するための方法、コンピュータ・プログラムおよびシステム | |
CN103582883A (zh) | 具有组格式的可变长度数据的改进型编码和解码 | |
CN110825363B (zh) | 智能合约获取方法、装置、电子设备及存储介质 | |
CN101783788A (zh) | 文件压缩、解压缩方法、装置及压缩文件搜索方法、装置 | |
JP7286810B2 (ja) | テキスト知能化洗浄方法、装置及びコンピュータ読み取り可能な記憶媒体 | |
US20180041224A1 (en) | Data value suffix bit level compression | |
CN102867049A (zh) | 一种基于单词查找树实现的汉语拼音快速分词方法 | |
JP5656593B2 (ja) | 符号化データを復号する装置及び方法 | |
CN102707948A (zh) | 一种源代码生成方法 | |
CN113627132B (zh) | 数据去重标记码生成方法、系统、电子设备及存储介质 | |
CN114528944A (zh) | 一种医疗文本编码方法、装置、设备及可读存储介质 | |
JP2006351001A (ja) | コンテンツ特徴量抽出方法及び装置及びコンテンツ同一性判定方法及び装置 | |
CN104133883B (zh) | 电话号码归属地数据压缩方法 | |
JP4758494B2 (ja) | ビット長を符号に変換する回路及び方法 | |
WO2019018030A1 (en) | COMPRESSION AND RECOVERY OF STRUCTURED RECORDINGS | |
CN110007955A (zh) | 一种指令集模拟器译码模块代码的压缩方法 | |
CN116489251A (zh) | 通用码流解析方法、装置、计算机可读介质及终端设备 | |
Radhakrishnan et al. | Huffman coding and decoding using Android | |
CN110287147B (zh) | 一种字符串排序方法及装置 | |
WO2016013209A1 (ja) | 文集合抽出システム、方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120910 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131008 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140210 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5487985 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |