JP6733483B2 - 符号化プログラム、符号化方法および符号化装置 - Google Patents

符号化プログラム、符号化方法および符号化装置 Download PDF

Info

Publication number
JP6733483B2
JP6733483B2 JP2016198915A JP2016198915A JP6733483B2 JP 6733483 B2 JP6733483 B2 JP 6733483B2 JP 2016198915 A JP2016198915 A JP 2016198915A JP 2016198915 A JP2016198915 A JP 2016198915A JP 6733483 B2 JP6733483 B2 JP 6733483B2
Authority
JP
Japan
Prior art keywords
column
columns
encoding
processing target
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2016198915A
Other languages
English (en)
Other versions
JP2018060444A (ja
Inventor
龍 松井
龍 松井
慶一 冨山
慶一 冨山
片岡 正弘
正弘 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2016198915A priority Critical patent/JP6733483B2/ja
Priority to EP17186618.9A priority patent/EP3306496B1/en
Priority to US15/680,319 priority patent/US20180101566A1/en
Publication of JP2018060444A publication Critical patent/JP2018060444A/ja
Application granted granted Critical
Publication of JP6733483B2 publication Critical patent/JP6733483B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2379Updates performed during online database operations; commit processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/221Column-oriented storage; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses

Description

本発明は、符号化プログラム等に関する。
抽出/変換・加工/ロード(ETL;Extract/Transform/Load)の処理においては、複数のテーブルに存在するデータを参照した処理が行われ、複数のテーブルの参照においては、専用ツール等を用いた処理が行われる。例えば、テーブルはcsv(Comma-Separated Values)等の汎用ファイルで記述された後に、zipによる圧縮形式によって、圧縮される。
従来技術では、処理対象のカラムを指定する処理対象カラム情報を受け付けて、テーブルから処理対象となるカラムを抽出する作業を実行した後に、抽出したカラムのデータを圧縮する作業を行う。ここで、zipによる圧縮では、ある程度の圧縮率を得るために、カラムの区切りを示すデリミタをまたいだ形で圧縮が行われる。
図9は、従来技術を説明するための図である。図9では一例として、テーブル10を用いた処理について説明する。テーブル10には項目「伝票ID、連番、売上時刻、商品コード、店舗ID、売上個数」が設定されており、各項目に対応した値が設定されている。各項目に対応するカラムの値は、デリミタにより区切られているものとする。従来技術は、処理対象カラム情報11を受け付けると、処理対象カラム情報11に基づいて、処理対象のカラムを抽出することで、抽出データ12を生成する。
図9に示す処理対象カラム情報11では、項目「商品コード」、「売上個数」のカラムを抽出することが指定されている。このため、従来技術は、テーブル10のうち、項目「商品コード」のカラムに対応するデータ10aおよび項目「売上個数」のカラムに対応するデータ10bを抽出し、抽出データ12を生成する。ここで、抽出データ12に含まれるデータは、カラム毎に区切られた状態で存在している。例えば、抽出データ12の1行目のレコードに着目すると、「A00009」と「9」とがデリミタで区切られて存在している。
従来技術は、抽出データ12をzipにより圧縮する場合には、各カラムの区切りを考慮しないで圧縮を行い、圧縮データ13を生成する。このため、各カラムをまたいで圧縮が行われ、例えば、「A00009」と「9」とがまとめて、符号化される。
特開2014−191593号公報 特開平9−204349号公報 特開平7−220051号公報 特開2012−256144号公報
しかしながら、上述した従来技術では、符号化情報を一旦中間ファイルに変換しないと、各カラムの区切りを判別することができないという問題がある。
図9で説明したように、従来のzipによる圧縮では、圧縮効率を得るために、デリミタをまたいだ形で圧縮が行われる。このため、例えば、圧縮データ13のままでは、カラムの区切りを特定することが難しいため、カラムの区切りを特定するためだけに、圧縮データ13を復号化した中間ファイル等を生成することになり、効率的ではない。
1つの側面では、本発明は、中間ファイルを生成せずに、カラムの区切りを判別可能な符号化情報を生成することができる符号化プログラム、符号化方法および符号化装置を提供することを目的とする。
第1の案では、コンピュータに下記の処理を実行させる。コンピュータは、複数のカラムが区切り情報で区切られたテーブルに含まれる複数のカラムのうち、処理対象となる複数の処理対象カラムを特定する処理対象カラム情報を取得する。コンピュータは、処理対象カラム情報を用いて、テーブルの複数の処理対象カラムをカラム単位で符号化する。コンピュータは、符号化された複数の処理対象カラムを結合した符号化テーブルを生成する。
中間ファイルを生成せずに、カラムの区切りを判別可能な符号化情報を生成することができる。
図1は、本実施例に係る符号化装置の処理を説明するための図である。 図2は、本実施例に係るシステムの構成を示す図である。 図3は、本実施例に係る符号化装置の構成を示す機能ブロック図である。 図4は、データ加工定義ファイルのデータ構造の一例を示す図である。 図5は、処理データのデータ構造の一例を示す図である。 図6は、符号化テーブルのデータ構造の一例を示す図である。 図7は、符号化装置の処理手順を示すフローチャートである。 図8は、符号化プログラムを実行するコンピュータの一例を示す図である。 図9は、従来技術を説明するための図である。
以下に、本願の開示する符号化プログラム、符号化方法および符号化装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。
図1は、本実施例に係る符号化装置の処理を説明するための図である。図1では一例として、テーブル10を用いて説明する。テーブル10には項目「伝票ID、連番、売上時刻、商品コード、店舗ID、売上個数」が設定されており、各項目に対応した値が設定されている。各項目に対応するカラムの値は、デリミタにより区切られているものとする。符号化装置は、処理対象カラム情報11を受け付けると、処理対象カラム情報11に基づいて、テーブル10の各カラムを走査する。
符号化装置は、テーブル10の各カラムを走査し、処理対象のカラムにヒットした場合には、ヒットしたカラムを、カラム単位で抽出し、抽出したカラムを符号化する。符号化装置は、上記の処理を繰り返し実行することで、処理対象のカラムをカラム単位で符号化し、符号化した情報を結合することで、符号化テーブル123を生成する。
図1に示す処理対象カラム情報11では、項目「商品コード」、「売上個数」のカラムを抽出することが指定されている。符号化装置は、テーブル10の1行目のレコードの各カラムを走査すると、処理対象のカラムとして、「A00009」と「9」とがヒットする。このため、符号化装置は、「A00009」を「(A00009)」に符号化し、「9」を「(9)」に符号化する。本実施例では説明の便宜上、符号化されたカラムの情報を括弧付きで表すこととする。
符号化装置は、テーブル10の2行目のレコードの各カラムを走査すると、処理対象のカラムとして、「A00015」と「5」とがヒットする。このため、符号化装置は、「A0015」を「(A00015)」に符号化し、「5」を「(5)」に符号化する。符号化装置は、テーブル10の3行目のレコードの各カラムを走査すると、処理対象のカラムとして、「A00003」と「14」とがヒットする。このため、符号化装置は、「A0003」を「(A00003)」に符号化し、「14」を「(14)」に符号化する。
符号化装置は、テーブル10の4行目のレコードの各カラムを走査すると、処理対象のカラムとして、「A00003」と「9」とがヒットする。このため、符号化装置は、「A0003」を「(A00003)」に符号化し、「9」を「(9)」に符号化する。符号化装置は、テーブル10の5行目のレコードの各カラムを走査すると、処理対象のカラムとして、「A00015」と「4」とがヒットする。このため、符号化装置は、「A0015」を「(A00015)」に符号化し、「4」を「(4)」に符号化する。
符号化装置は、符号化した各情報を結合することで、図1に示す符号化テーブル123を生成する。
このように、符号化装置は、複数のカラムがそれぞれデリミタで区切られたテーブル10から、処理対象となるカラムを特定し、カラム単位で符号化することで、符号化テーブル123を生成する。このため、符号化された状態であっても、符号化されたコードの単位で、カラムの区切りを特定することができる。例えば、図1に示す例では、「(A00009)」と「9」との間に区切りが存在することを判別できる。従って、中間ファイルを生成せずに、カラムの区切りを判別可能な符号化情報を生成できる。
次に、本実施例に係るシステムの構成の一例について説明する。図2は、本実施例に係るシステムの構成を示す図である。図2に示すように、このシステムは、収集元システム50と、配布先システム60と、符号化装置100とを有する。符号化装置100は、ネットワーク等を介して、収集元システム50および配布先システム60に接続する。
収集元システム50は、図1で説明したテーブル10等の処理対象となる情報を収集するシステムである。以下の説明では、収集元システム50が収集した処理対象となる情報を、処理データと表記する。収集元システム50は、処理データを符号化装置100に送信する。
配布先システム60は、符号化装置100から出力される符号化テーブル123を受信し、各種の処理を実行するシステムである。
符号化装置100は、複数のカラムがそれぞれデリミタで区切られたテーブル10から、処理対象となるカラムを特定し、カラム単位で符号化することで、符号化テーブル123を生成する装置である。例えば、テーブル10は、収集元システム50から送信される処理データに含まれているものとする。符号化装置100は、符号化テーブル123を配布先システム60に配布する。
図3は、本実施例に係る符号化装置の構成を示す機能ブロック図である。図3に示すように、この符号化装置100は、通信部110と、記憶部120と、制御部130とを有する。
通信部110は、ネットワークを介して、収集元システム50および配布先システム60とデータ通信を実行する処理部である。後述する制御部130は、通信部110を介して、収集元システム50および配布先システム60とデータをやり取りする。通信部110は、通信装置に対応する。
記憶部120は、処理手順定義121、処理データ122、符号化テーブル123を有する。記憶部120は、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子に対応する。または、各記憶部120は、ハードディスク、光ディスクなどの記憶装置に対応する。
処理手順定義121は、処理対象となるテーブルの情報および処理対象となるカラムの情報(処理対象カラム情報11)を定義する情報である。処理手順定義121には、データ構造定義ファイルと、データ加工定義ファイルとを含む情報である。処理手順定義121は、管理者等により予め生成されているものとする。
データ構造定義ファイルは、処理対象となるデータのテーブル情報を保存したファイルである。テーブル情報は、項目名によって指定されている。例えば、テーブル情報で示される項目名が「伝票ID、連番、売上時刻、商品コード、店舗ID、売上個数」である場合には、図1で説明したテーブル10が、処理対象のテーブルとなる。
データ加工定義ファイルは、図1で説明した処理対象カラム情報11に対応する情報である。図4は、データ加工定義ファイルのデータ構造の一例を示す図である。図4に示すように、データ加工定義ファイルでは、領域70aにおいて、各データ変換処理を定義する。例えば、結合やカラム抽出などのデータ変換処理を行う場合には、「Replace」が領域70aに設定される。
領域70bには、データ抽出における入力データの定義情報が設定される。処理対象となるテーブルの項目名(カラム)をID名で定義し、領域70cで示される処理で利用される。
領域70cには、出力データ(符号化テーブル123)の定義情報が設定される。領域70cにおいて、処理対象となるカラムの項目名が指定される。図4に示す例では、処理対象となるカラムの項目名が「商品コード、売上個数」であることが定義されている。
処理データ122は、収集元システム50によって生成される情報である。図5は、処理データのデータ構造の一例を示す図である。例えば、処理データ122には、テーブル10と、図示しない他のテーブルが含まれる。各テーブルには、項目名が設定されており、各項目に対応した値が設定されている。
符号化テーブル123は、後述する生成部133による生成される情報である。図6は、符号化テーブルのデータ構造の一例を示す図である。符号化テーブル123は、図1で説明したように、カラム単位で符号化されたコードがそれぞれ結合されたものとなる。また、符号化テーブル123では、連結されたコードの結合部分が、区切りであるため、符号化テーブル123を復号化しなくても、カラムの区切りを判別することができる。
制御部130は、収集部131と、取得部132と、生成部133と、配布部134とを有する。制御部130は、ASIC(Application Specific Integrated Circuit)や、FPGA(Field Programmable Gate Array)などの集積装置に対応する。また、制御部130は、例えば、CPUやMPU(Micro Processing Unit)等の電子回路に対応する。
収集部131は、図1に示した収集元システム50から処理データ122を収集する処理部である。収集部131は、収集した処理データ122を、記憶部120に格納する。
取得部132は、記憶部120に格納された処理手順定義121を取得する処理部である。取得部132は、処理手順定義121を、生成部133に出力する。
生成部133は、処理手順定義121を基にして、処理データ122から処理対象となるテーブルを抽出し、テーブルから符号化テーブル123を生成する処理部である。
生成部133が、処理データ122から、処理対象となるテーブルを抽出する処理の一例について説明する。生成部133は、処理手順定義121に含まれるデータ構造定義ファイルを参照し、処理対象となるテーブルが有する項目を特定する。生成部133は、特定した項目と、処理データ122のテーブルに設定された項目とを比較して、特定した項目を全て含むテーブルを、処理データ122から抽出する。
生成部133が、抽出したテーブルを基にして符号化テーブル123を生成する処理の一例について説明する。生成部133は、処理手順定義121に含まれるデータ加工定義ファイルを参照し、テーブル10に含まれる処理対象となるカラムをカラム単位で符号化し、符号化したカラムを結合した符号化テーブル123を生成する。
生成部133の具体的な処理は、図1で説明した処理に対応する。なお、データ加工定義ファイルは、図1に示した処理対象カラム情報11に対応する。また、処理対象として抽出されたテーブルはテーブル10に対応する。
例えば、テーブル10には項目「伝票ID、連番、売上時刻、商品コード、店舗ID、売上個数」が設定されており、各項目に対応した値が設定されている。各項目に対応するカラムの値は、デリミタにより区切られているものとする。生成部133は、データ加工定義ファイルに基づいて、テーブル10の各カラムを走査する。
生成部133は、テーブル10の各カラムを走査し、処理対象のカラムにヒットした場合には、ヒットしたカラムを、カラム単位で抽出し、抽出したカラムを符号化する。例えば、生成部133は、カラムの情報と、カラムの情報に対応するコードとを対応付けた変換規則に基づいて、カラムを符号化する。生成部133は、上記の処理を繰り返し実行することで、処理対象のカラムをカラム単位で符号化し、符号化した情報を結合することで、符号化テーブル123を生成する。
なお、生成部133は、テーブル10に含まれるカラムの位置関係に対応させて、符号化した各カラムを配置し、連結することで、符号化テーブル123を生成する。例えば、符号化前のテーブル10において、商品コード「A00009」と、売上個数「9」とは同じ1行目のレコードである。このため、生成部133は、符号化テーブル123を生成する場合に、符号化した「(A00009)」と「(9)」とを1行目のレコードに配置して、連結する。
配布部134は、生成部133により生成された符号化テーブル123を、配布先システム60に送信する処理部である。
次に、本実施例に係る符号化装置100の処理手順の一例について説明する。図7は、符号化装置の処理手順を示すフローチャートである。図7に示すように、符号化装置100の取得部132は、処理手順定義121を取得する(ステップS101)。
符号化装置100の生成部133は、処理データ122から処理手順定義121に対応するテーブルを読み込む(ステップS102)。生成部133は、テーブルから一つのカラムを読み込む(ステップS103)。
生成部133は、読み込んだカラムが、処理対象のカラムか否かを判定する(ステップS104)。生成部133は、処理対象のカラムでない場合には(ステップS104,No)、ステップS107に移行する。
一方、生成部133は、処理対象のカラムである場合には(ステップS104,Yes)、読み込んだカラムをカラム単位で符号化する(ステップS105)。生成部133は、符号化した情報を書き込む(ステップS106)。
生成部133は、他のカラムが存在するか否かを判定する(ステップS107)。生成部133は、他のカラムが存在する場合には(ステップS107,Yes)、ステップS103に移行する。
一方、生成部133は、他のカラムが存在しない場合には(ステップS107,No)、カラム単位で符号化した情報を結合することで、符号化テーブル123を生成する(ステップS108)。
次に、本実施例に係る符号化装置100の効果について説明する。符号化装置100は、複数のカラムがそれぞれデリミタで区切られたテーブル10から、処理対象となるカラムを特定し、カラム単位で符号化することで、符号化テーブル123を生成する。このため、符号化された状態であっても、符号化されたコードの単位で、カラムの区切りを特定することができる。例えば、図1に示す例では、「(A00009)」と「9」との間に区切りが存在することを判別できる。従って、中間ファイルを生成せずに、カラムの区切りを判別可能な符号化情報を生成できる。
また、符号化装置100は、テーブル10に含まれる複数のカラムを走査し、処理対象となるカラムを特定した時点で、特定したカラムをカラム単位で符号化する。このため、従来技術では、符号化対象となるカラムを全て抽出した後に、符号化を行う場合と比較して、抽出と符号化とが同時に実行できるので、符号化を効率よく実行できる。
また、符号化装置100は、テーブル10に含まれるカラムの位置関係に対応させて、符号化した各カラムを配置し、連結することで符号化テーブル123を生成する。このため、テーブル10の項目と、処理対象となるカラムがわかれば、符号化テーブル123を復号化することなく、各カラムが何の項目に対応するものかを判別することができる。
次に、上記実施例に示した符号化装置100と同様の機能を実現する符号化プログラムを実行するコンピュータの一例について説明する。図8は、符号化プログラムを実行するコンピュータの一例を示す図である。
図8に示すように、コンピュータ200は、各種演算処理を実行するCPU201と、ユーザからのデータの入力を受け付ける入力装置202と、ディスプレイ203とを有する。また、コンピュータ200は、記憶媒体からプログラム等を読取る読み取り装置204と、ネットワークを介して他のコンピュータとの間でデータの授受を行うインタフェース装置205とを有する。また、コンピュータ200は、各種情報を一時記憶するRAM206と、ハードディスク装置207とを有する。そして、各装置201〜207は、バス208に接続される。
ハードディスク装置207は、取得プログラム207a、生成プログラム207bを読み出してRAM206に展開する。取得プログラム207aは、取得プロセス206aとして機能する。生成プログラム207bは、生成プロセス206bとして機能する。例えば、取得プロセス206aは、取得部132に対応する。生成プロセス206bは、生成部133に対応する。
なお、取得プログラム207a、生成プログラム207bについては、必ずしも最初からハードディスク装置207に記憶させておかなくても良い。例えば、コンピュータ200に挿入されるフレキシブルディスク(FD)、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ200が取得プログラム207a、生成プログラム207bを読み出して実行するようにしてもよい。
以上の各実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)コンピュータに、
複数のカラムが区切り情報で区切られたテーブルに含まれる複数のカラムのうち、処理対象となる複数の処理対象カラムを特定する処理対象カラム情報を取得し、
前記処理対象カラム情報を用いて、前記テーブルの前記複数の処理対象カラムをカラム単位で符号化し、
符号化された前記複数の処理対象カラムを結合した符号化テーブルを生成する、
処理を実行させることを特徴とする符号化プログラム。
(付記2)前記符号化する処理は、前記テーブルに含まれる複数のカラムを走査し、前記処理対象カラムを特定した時点で、特定した処理対象カラムをカラム単位で符号化することを特徴とする付記1に記載の符号化プログラム。
(付記3)前記符号化テーブルを生成する処理は、テーブルに含まれるカラムの位置関係に対応させて、符号化した各処理対象カラムを配置し、連結することで前記符号化テーブルを生成することを特徴とする付記1または2に記載の符号化プログラム。
(付記4)コンピュータが実行する符号化方法であって、
複数のカラムが区切り情報で区切られたテーブルに含まれる複数のカラムのうち、処理対象となる複数の処理対象カラムを特定する処理対象カラム情報を取得し、
前記処理対象カラム情報を用いて、前記テーブルの前記複数の処理対象カラムをカラム単位で符号化し、
符号化された前記複数の処理対象カラムを結合した符号化テーブルを生成する、
処理を実行させることを特徴とする符号化方法。
(付記5)前記符号化する処理は、前記テーブルに含まれる複数のカラムを走査し、前記処理対象カラムを特定した時点で、特定した処理対象カラムをカラム単位で符号化することを特徴とする付記4に記載の符号化方法。
(付記6)前記符号化テーブルを生成する処理は、テーブルに含まれるカラムの位置関係に対応させて、符号化した各処理対象カラムを配置し、連結することで前記符号化テーブルを生成することを特徴とする付記4または5に記載の符号化方法。
(付記7)複数のカラムが区切り情報で区切られたテーブルに含まれる複数のカラムのうち、処理対象となる複数の処理対象カラムを特定する処理対象カラム情報を取得する取得部と、
前記処理対象カラム情報を用いて、前記テーブルの前記複数の処理対象カラムをカラム単位で符号化し、符号化された前記複数の処理対象カラムを結合した符号化テーブルを生成する生成部と
を有することを特徴とする符号化装置。
(付記8)前記生成部は、前記テーブルに含まれる複数のカラムを走査し、前記処理対象カラムを特定した時点で、特定した処理対象カラムをカラム単位で符号化することを特徴とする付記7に記載の符号化装置。
(付記9)前記生成部は、テーブルに含まれるカラムの位置関係に対応させて、符号化した各処理対象カラムを配置し、連結することで前記符号化テーブルを生成することを特徴とする付記7または8に記載の符号化装置。
100 符号化装置
110 通信部
120 記憶部
121 処理手順定義
122 処理データ
123 符号化テーブル
130 制御部
131 収集部
132 取得部
133 生成部
134 配布部

Claims (4)

  1. コンピュータに、
    複数のカラムが区切り情報で区切られたテーブルに含まれる複数のカラムのうち、処理対象となる複数の処理対象カラムを特定する処理対象カラム情報を取得し、
    前記処理対象カラム情報を用いて、前記テーブルに含まれる複数のカラムを走査し、前記処理対象カラムを特定した時点で、特定した処理対象カラムをカラム単位で符号化し、
    符号化された前記複数の処理対象カラムを結合した符号化テーブルを生成する、
    処理を実行させることを特徴とする符号化プログラム。
  2. 前記符号化テーブルを生成する処理は、テーブルに含まれるカラムの位置関係に対応させて、符号化した各処理対象カラムを配置し、連結することで前記符号化テーブルを生成することを特徴とする請求項に記載の符号化プログラム。
  3. コンピュータが実行する符号化方法であって、
    複数のカラムが区切り情報で区切られたテーブルに含まれる複数のカラムのうち、処理対象となる複数の処理対象カラムを特定する処理対象カラム情報を取得し、
    前記処理対象カラム情報を用いて、前記テーブルに含まれる複数のカラムを走査し、前記処理対象カラムを特定した時点で、特定した処理対象カラムをカラム単位で符号化し、
    符号化された前記複数の処理対象カラムを結合した符号化テーブルを生成する、
    処理を実行させることを特徴とする符号化方法。
  4. 複数のカラムが区切り情報で区切られたテーブルに含まれる複数のカラムのうち、処理対象となる複数の処理対象カラムを特定する処理対象カラム情報を取得する取得部と、
    前記処理対象カラム情報を用いて、前記テーブルに含まれる複数のカラムを走査し、前記処理対象カラムを特定した時点で、特定した処理対象カラムをカラム単位で符号化し、符号化された前記複数の処理対象カラムを結合した符号化テーブルを生成する生成部と
    を有することを特徴とする符号化装置。
JP2016198915A 2016-10-07 2016-10-07 符号化プログラム、符号化方法および符号化装置 Expired - Fee Related JP6733483B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2016198915A JP6733483B2 (ja) 2016-10-07 2016-10-07 符号化プログラム、符号化方法および符号化装置
EP17186618.9A EP3306496B1 (en) 2016-10-07 2017-08-17 Encoding program, encoding method, and encoding apparatus
US15/680,319 US20180101566A1 (en) 2016-10-07 2017-08-18 Non-transitory computer-readable recording medium, encoding method, and encoding apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016198915A JP6733483B2 (ja) 2016-10-07 2016-10-07 符号化プログラム、符号化方法および符号化装置

Publications (2)

Publication Number Publication Date
JP2018060444A JP2018060444A (ja) 2018-04-12
JP6733483B2 true JP6733483B2 (ja) 2020-07-29

Family

ID=59683420

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016198915A Expired - Fee Related JP6733483B2 (ja) 2016-10-07 2016-10-07 符号化プログラム、符号化方法および符号化装置

Country Status (3)

Country Link
US (1) US20180101566A1 (ja)
EP (1) EP3306496B1 (ja)
JP (1) JP6733483B2 (ja)

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07220051A (ja) 1994-02-08 1995-08-18 Hitachi Ltd 画像データ変換システム
JP3493091B2 (ja) 1996-01-25 2004-02-03 富士通株式会社 情報表示システム、情報提供装置及び情報表示装置
US6996589B1 (en) * 2002-01-16 2006-02-07 Convergys Cmg Utah, Inc. System and method for database conversion
EP2040180B1 (en) * 2007-09-24 2019-01-16 Hasso-Plattner-Institut für Digital Engineering gGmbH ETL-less zero-redundancy system and method for reporting OLTP data
US8108361B2 (en) * 2008-07-31 2012-01-31 Microsoft Corporation Efficient column based data encoding for large-scale data storage
JP5549177B2 (ja) * 2009-10-22 2014-07-16 富士通株式会社 圧縮プログラム、方法及び装置、並びに解凍プログラム、方法及び装置
JP5844554B2 (ja) 2011-06-08 2016-01-20 Jfeシステムズ株式会社 データ管理保存システム
US8762875B2 (en) * 2011-12-23 2014-06-24 Blackberry Limited Posting activity visualization
JP2014191593A (ja) 2013-03-27 2014-10-06 Nec Corp カラムストア型データベース管理システム
KR101522870B1 (ko) * 2013-10-01 2015-05-26 주식회사 파수닷컴 데이터 컬럼 암호화 장치 및 방법
WO2015097773A1 (ja) * 2013-12-25 2015-07-02 株式会社日立製作所 要因抽出システム、要因抽出方法
US10067909B2 (en) * 2014-06-25 2018-09-04 Sap Se Sparse linear algebra in column-oriented in-memory database
US9430554B2 (en) * 2014-08-28 2016-08-30 Weebly, Inc. Object-relational mapping based on virtual columns

Also Published As

Publication number Publication date
EP3306496B1 (en) 2021-03-24
EP3306496A1 (en) 2018-04-11
US20180101566A1 (en) 2018-04-12
JP2018060444A (ja) 2018-04-12

Similar Documents

Publication Publication Date Title
KR101638594B1 (ko) Dna 서열 검색 방법 및 장치
TW201710957A (zh) 二維碼的產生方法、解碼方法以及裝置
JP2005141650A (ja) 構造化文書符号化装置及び構造化文書符号化方法ならびにそのプログラム
RU2007141934A (ru) Адаптивная группировка параметров для улучшенной эффективности кодирования
EP3154202B1 (en) Encoding program, encoding method, encoding device, decoding program, decoding method, and decoding device
US20060170574A1 (en) Method and apparatus for compressing and decompressing data, and computer product
US7430509B2 (en) Lattice encoding
CN103051341B (zh) 数据编码装置及方法、数据解码装置及方法
JP2007043595A (ja) 可変長符号復号化方法および装置ならびにデータ伸長装置
JP6733483B2 (ja) 符号化プログラム、符号化方法および符号化装置
JP5472610B2 (ja) 数値データ列の符号化/復号化の方法および装置
JP2007088962A (ja) 順序データ圧縮方法、順序データ解凍方法、順序データ処理プログラム、順序データ圧縮装置、順序データ解凍装置、および、順序データ処理システム
JP2011114546A (ja) データ圧縮装置、データ伸長装置、データ圧縮プログラム、及びデータ伸長プログラム
USRE45300E1 (en) Context-adaptive variable length coder with simultaneous storage of incoming data and generation of syntax elements
US20150193646A1 (en) Read-in Device, Read-in Result Output Method, and Medium
JP5626440B2 (ja) 数値データ列の符号化/復号化の方法および装置
JP6045415B2 (ja) データ構造化方法、データ再構成方法、データ構造化プログラム、データ再構成プログラム及びデータ符号化装置
JP2023501093A (ja) カスタマイズ可能な区切りテキスト圧縮フレームワーク
KR101661646B1 (ko) 이미지 코드를 이용한 웹페이지 서비스 시스템 및 방법
JP2015191585A (ja) データ加工装置、情報処理装置、方法、およびプログラム
JP6105355B2 (ja) 画像圧縮装置および画像伸張装置,ならびにこれらの動作制御方法
WO2022009342A1 (ja) 情報処理プログラム、情報処理方法および情報処理装置
US10367523B2 (en) Data processing method and data processing apparatus
JP6972568B2 (ja) 圧縮プログラム、復元プログラム、圧縮方法、復元方法、および情報処理装置
KR101573983B1 (ko) 데이터 압축 및 데이터 복원 방법과 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190709

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200318

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200407

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200609

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200622

R150 Certificate of patent or registration of utility model

Ref document number: 6733483

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees