JP5171211B2 - データ形式変換装置 - Google Patents

データ形式変換装置 Download PDF

Info

Publication number
JP5171211B2
JP5171211B2 JP2007285345A JP2007285345A JP5171211B2 JP 5171211 B2 JP5171211 B2 JP 5171211B2 JP 2007285345 A JP2007285345 A JP 2007285345A JP 2007285345 A JP2007285345 A JP 2007285345A JP 5171211 B2 JP5171211 B2 JP 5171211B2
Authority
JP
Japan
Prior art keywords
continuous
data
conversion
data format
records
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007285345A
Other languages
English (en)
Other versions
JP2009116395A (ja
Inventor
重雄 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2007285345A priority Critical patent/JP5171211B2/ja
Publication of JP2009116395A publication Critical patent/JP2009116395A/ja
Application granted granted Critical
Publication of JP5171211B2 publication Critical patent/JP5171211B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

この発明は、入力ファイルのデータのデータ形式を変換するデータ形式変換装置及びデータ形式変換プログラム及びデータ形式変換方法に関する。
従来より、入力ファイルからデータを読み出し、読み出したデータに対する加工処理を行い、結果を出力をする処理において、各処理ステップを並列に実行することが行われている(例えば、特許文献1)。ここで提案されている方法には、データソースからデータを読み取るステップ、データを読み取りながらデータを特性付ける要約データを計算するステップ、および要約データに基づくプロファイル情報を格納するステップを含むプロファイリングステップと、格納したプロファイル情報にアクセスするステップ、およびアクセスしたプロファイル情報に従ってデータを処理するステップが含まれる。ここで、データプロファイリングステップは並列に実行できるものとし、これには、データをパーツへパーティション化するステップ、および各パーツを処理するステップが含まれる。従来より提案されているデータ処理方式では、入力ファイルからのデータ入力、読み出したデータに対する加工処理(プロファイリング処理やデータ変換処理)、データ出力の各ステップを並列実行することにより、処理の効率化を実現することが可能となる。
しかし、読み出したデータに対する加工処理が他の処理に比較して負荷が高い場合には、このデータ加工処理が全体処理のネックとなり、性能が向上しないという課題があった。例えば、項目値の区切り文字としてカンマを使用するCSV(Comma Separated Values)ファイルを入力ファイルとし、このファイルから読み出したデータを、出力先のデータ形式に変換するファイル変換処理の場合、入力データ内の各項目値のデータ長、およびレコード長が可変長であるため、入力ファイルから読み出したバッファ内での、項目やレコードの区切り位置を、データ変換処理を開始する前に特定することができない。
そのため、データ変換処理では、入力バッファ内での項目値の区切り文字(カンマ等)を探索し、抽出した項目に対して順に変換処理を実行するという手順になる。区切り文字を探索する処理、および、データ変換処理は他の処理に比べて負荷が高く、この部分の処理が全体処理のネックとなり、ファイル変換処理の性能が向上しないという課題がある。
特表2007−506191号公報
本発明は、CSVファイルのような可変長の入力ファイルのデータを読み出し、出力先のデータに変換するファイル変換処理において、各項目値の出現位置を事前に探索して格納し、この項目値の出現位置情報を用いて、列単位、あるいは、行単位にデータ変換処理を複数並列に実行することにより処理の並列度を向上し、ファイル変換処理の高速実行を可能な装置の提供を目的とする。
この発明のデータ形式変換装置は、
区切られて連続する複数の項目値からなるレコードを要素とするとともに、このレコードごとに区切られて連続する連続レコードを格納する連続レコード格納部と、
前記連続レコード格納部に格納された連続レコードを対象として、項目値の区切りとレコードの区切りとを探索し、探索結果に基づいて、それぞれの項目値の出現位置を示す出現位置情報を生成する探索部と、
前記探索部により生成された出現位置情報に基づいて、前記連続レコード格納部に格納された連続レコードのデータ形式を変換する変換部と
を備えたことを特徴とする。
この発明により、ファイル変換処理の高速実行の可能なデータ形式変換装置を提供することができる。
実施の形態1.
図1は、コンピュータであるファイル変換装置1の外観の一例を示す図である。図1において、ファイル変換装置1は、システムユニット830、CRT(Cathode・Ray・Tube)やLCD(液晶)の表示画面を有する表示装置813、キーボード814(Key・Board:K/B)、マウス815、FDD817(Flexible・Disk・Drive)、コンパクトディスク装置818(CDD:Compact Disk Drive)、プリンタ装置819などのハードウェア資源を備え、これらはケーブルや信号線で接続されている。
図2は、実施の形態1におけるファイル変換装置1のハードウェア資源の一例を示す図である。図2において、ファイル変換装置1は、プログラムを実行するCPU810(中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサともいう)を備えている。CPU810は、バス825を介してROM(Read Only Memory)811、RAM(Random Access Memory)812、表示装置813、キーボード814、マウス815、通信ボード816、FDD817、CDD818、プリンタ装置819、磁気ディスク装置820と接続され、これらのハードウェアデバイスを制御する。磁気ディスク装置820の代わりに、光ディスク装置、フラッシュメモリなどの記憶装置でもよい。
RAM812は、揮発性メモリの一例である。ROM811、FDD817、CDD818、磁気ディスク装置820等の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置あるいは記憶部、格納部、バッファの一例である。通信ボード816、キーボード814、FDD817などは、入力部、入力装置の一例である。また、通信ボード816、表示装置813、プリンタ装置819などは、出力部、出力装置の一例である。
通信ボード816は、ネットワーク(LAN等)に接続されている。通信ボード816は、LANに限らず、インターネット、ISDN等のWAN(ワイドエリアネットワーク)などに接続されていても構わない。
磁気ディスク装置820には、オペレーティングシステム821(OS)、ウィンドウシステム822、プログラム群823、ファイル群824が記憶されている。プログラム群823のプログラムは、CPU810、オペレーティングシステム821、ウィンドウシステム822により実行される。
上記プログラム群823には、以下に述べる実施の形態の説明においてファイル変換装置1の構成要素である「入力処理装置5〜出力処理装置8」として説明する機能を実行するプログラムが記憶されている。プログラムは、CPU810により読み出され実行される。
ファイル群824には、以下に述べる実施の形態の説明において、「出力定義情報」、「項目情報」「〜の判定結果」として説明する情報や、「〜の算出結果」、「〜の抽出結果」、「〜の生成結果」、「〜の処理結果」として説明する情報や、データや信号値や変数値やパラメータなどが、「〜ファイル」や「〜データベース」の各項目として記憶されている。「〜ファイル」や「〜データベース」は、ディスクやメモリなどの記録媒体に記憶される。ディスクやメモリなどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU810によりメインメモリやキャッシュメモリに読み出され、抽出・検索・参照・比較・演算・計算・処理・出力・印刷・表示などのCPUの動作に用いられる。抽出・検索・参照・比較・演算・計算・処理・出力・印刷・表示のCPUの動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリやキャッシュメモリやバッファメモリに一時的に記憶される。
また、以下に述べる実施の形態の説明においては、データや信号値は、RAM812のメモリ、FDD817のフレキシブルディスク、CDD818のコンパクトディスク、磁気ディスク装置820の磁気ディスク、その他光ディスク、ミニディスク、DVD(Digital・Versatile・Disk)等の記録媒体に記録される。また、データや信号は、バス825や信号線やケーブルその他の伝送媒体によりオンライン伝送される。
また、以下に述べる実施の形態の説明において、「入力処理装置5〜出力処理装置8」として説明するものは、「〜部」、「手段」、「〜回路」、「〜機器」であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。すなわち、「入力処理装置5〜出力処理装置8」として説明するものは、ROM811に記憶されたファームウェアで実現されていても構わない。或いは、ソフトウェアのみ、或いは、素子・デバイス・基板・配線などのハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD等の記録媒体に記憶される。プログラムはCPU810により読み出され、CPU810により実行される。すなわち、プログラムは、以下に述べる「入力処理装置5〜出力処理装置8」としてコンピュータを機能させるものである。あるいは、以下に述べる「入力処理装置5〜出力処理装置8」の手順や方法をコンピュータに実行させるものである。
図3は、入力ファイル2から読み出したデータを、出力先のデータ形式に変換して書き込むファイル変換方式を実行するファイル変換装置1(データ形式変換装置)の構成図である。図3において、ファイル変換装置1は、入力処理装置5(入力処理部)、区切り文字探索処理装置6(探索部)、変換処理装置7(変換部)、出力処理装置8(出力処理部)を備える。また、ファイル変換装置1は、入力ファイル2のデータが格納される入力用バッファ9、データ書込み装置4に渡すデータ形式変換後のデータが格納される出力用バッファ11を、それぞれ複数個備える。なお、入力用バッファ9、出力用バッファ11という場合は、特に断らない限り複数を意味するものとする。また、ファイル変換装置1は、後述の項目情報テーブル10(出現位置情報)を格納するテーブル格納部12を備える。ファイル変換装置1は、入力ファイル2、および、出力先定義情報3を入力とし、データ書込み装置4を出力先とする。
(入力用バッファ)
図4は、出力先の項目数が3個の場合(即ち、1レコードが3項目からなる場合)の入力用バッファ9と、項目情報テーブル10との関係を示す図である。図4を説明する。入力用バッファに格納される入力ファイルのデータは、図4に示すように、区切られて連続する複数の項目値からなるレコードを要素とするとともに、このレコードごとに区切られて連続する連続レコードである。すなわち、項目値ABCDEFG等からなるレコード「ABCDEFG,123,XYZ」、項目値HIJK等からなるレコード「HIJK,45,XX」等を要素とし、「改行記号」により区切られて、これらレコードが連続する「ABCDEFG,123,XYZ」〜「KLM、7890123」の連続レコードである。なお、入力ファイルの連続レコードが複数の入力用バッファに分散して格納される場合には、入力ファイルの連続レコードの連続性は保持されて格納される。例えば、入力ファイルの連続レコードがR(1)〜R(N)であり、入力用バッファを3つとすると、第1の入力用バッファにはR(1)〜R(m)のレコードからなる連続レコードが格納され、第2の入力用バッファにはR(m+1)〜R(n)のレコードからなる連続レコードが格納され、第3の入力用バッファにはR(n+1)〜R(N)のレコードからなる連続レコードが格納される。
(項目情報テーブル)
項目情報テーブル10は、区切り文字探索処理装置6によって生成される。項目情報テーブル10に格納される情報は、各項目毎の、
(1)出現した入力用バッファ9の番号21、
(2)バッファ内オフセット22、
(3)項目値の長さ23
から構成される。図4では、入力用バッファ9は「バッファ番号=1」である。そして、例えば、一つのレコード「ABCDEFG,123,XYZ」における項目値ABCDEFGについて前記の(1)〜(3)は、「1,0,7」であり、「123」は「1,8,3」である。項目情報テーブル10は、前記の(1)〜(3)により、それぞれの入力用バッファに分散して格納された連続レコードを管理することができる。すなわち、区切り文字探索処理装置6(探索部)は、複数の入力用バッファに分散して格納された連続レコードを対象として、入力用バッファごとに項目情報テーブル10を生成する。複数設けられた変換処理部(変換部)のそれぞれは、区切り文字探索処理装置6により生成された入力用バッファごとの項目情報テーブル10に基づいて、複数の入力用バッファに分散して格納されたデータのデータ形式を変換することが可能となる。
(出力先定義情報)
図5は、出力先定義情報3の構成例を示す図である。出力先定義情報3は、通番31、データ型情報32、データ型が文字型の場合のデータ長33、および、データ型が数値型の場合の精度34から構成される。通番31が「1〜3」となっているのは、出力先の項目数が3個となっているからである。すなわち、通番31の「1〜3」は、それぞれ第1番項目〜第3項目に対応する。
次に動作について説明する。図6は、ファイル変換装置1によるファイル変換方式のフローチャートである。図6は、データ変換処理を「行単位」(レコード単位)に並列実行する場合のファイル変換方式のフローチャートである。まずファイル変換装置1は、ステップS42において、出力先定義情報3を読出し、メモリ内に保持する。次に、ステップS43において、入力処理装置5、区切り文字探索処理装置6、出力処理装置8を起動する。
入力処理装置5、区切り文字探索処理装置6、出力処理装置8は、それぞれ並列に実行可能な形態で起動される。区切り文字探索処理装置6は、入力用バッファ9にデータが読み込まれるまで待機状態となり、出力処理装置8は、出力用バッファ11にデータが書き込まれるまで待機状態となる。
ステップS44において、変換処理装置7a〜7cが複数起動される。変換処理装置7a〜7cは、それぞれが並列に実行可能な形態で起動され、図3では3つを示しているが例示であり、起動する数は、システムの搭載プロセッサ数を超えない範囲で起動する。変換処理装置7a〜7cは、区切り文字探索処理装置6が、区切り文字(項目値の区切り、レコードの区切り)を探索し、項目情報テーブル10に項目値の出現位置(出現位置情報)を格納するまでは待機状態となる。
ステップS45において、読出しを行っていない入力ファイル2のデータが存在すれば、入力処理装置5が、入力用バッファ9に、入力ファイル2からデータを読み出す(ステップS46)。前述のように入力用バッファ9は複数用意し、入力処理装置5は、入力用バッファ9に空きがあれば、入力ファイル2からの読み込みを行う。入力用バッファ9の空きがない状態になると、入力処理装置5は、入力用バッファ9に空きが生じるまで待機状態となる。前記のように、複数の入力用バッファには連続レコードの連続性が保持された状態で格納される。
(探索処理)
入力用バッファ9に入力ファイルのデータ(連続レコード)が読み込まれると、区切り文字探索処理装置6が実行を開始し、入力用バッファ9内の探索を開始する。区切り文字探索処理装置6は、入力用バッファ9内の先頭から区切り文字または改行文字を探索する。区切り文字探索処理装置6は、区切り文字または改行文字を検出すると、検出した時点までを一つの項目とみなし、項目情報テーブル10に、検出した項目値の出現位置情報として、「入力用バッファ9の番号」、「入力用バッファ9内のオフセット」、「項目の長さ」を格納する(ステップS47)。
前述の図4を用いて、入力用バッファ9から項目情報テーブル10に位置情報を設定する方法を説明する。この処理(方法)は、区切り文字探索処理装置6が実行するものである。図4の例は、区切り文字としてカンマを定義した場合である。まず、最初にカンマが出現した位置までを一つの項目値「ABCDEFG」と判断し、この項目値が出現するバッファ内の位置として、バッファ内オフセット「0」と、項目値の長さ「7」を項目情報テーブル10に格納する。同様に、2番目の項目値を「123」、3番目の項目値を「XYZ」と判断し、それぞれの項目値のバッファ内オフセットと長さを項目情報テーブル10に格納する。出力先の項目数は、出力先定義情報3を参照することにより認識可能である。このため、最後の項目値の区切りは、改行文字により判断する。区切り文字探索処理装置6は、入力用バッファ9内の最後まで探索処理を実行すると、待機していた変換処理装置7に実行開始を通知する。
(変換処理の動作)
ステップS48、ステップS49における変換処理装置7の動作を図7を用いて説明する。図7は、データ変換処理を「列単位」に並列実行する場合を説明する図である。ステップS48及びステップS49は、個々の「変換処理部と対応する出力用バッファ」についてのステップである。すなわち、複数の変換処理装置7a、7b、7cのそれぞれが、各レコード単位に項目値のデータ変換処理を実施する場合を示す図である。データ変換処理は、入力ファイル2内のデータを出力先のデータ形式に変換する処理であり、出力先のデータ型が数値型の場合は、文字列の数値を数値型に変換する処理であり、あるいは、出力先のデータ型が固定長の文字列型の場合は、項目値の後ろにパティング文字を追加する処理である。
複数の変換処理装置7a、7b、7cのそれぞれは、項目情報テーブル10を用いて、入力用バッファ9内での異なるレコードの先頭位置を特定し、入力用バッファ9からデータ(レコード)を読出して変換処理を実施し、それぞれ自身に対応する出力用バッファ11a、11b、11cに変換結果を出力する。変換処理装置7a、7b、7cのそれぞれは、それぞれ並列にデータ変換処理、および、出力用バッファへの書込み処理を実行する。この結果、出力用バッファ11a、11b、11cには、レコード単位に変換結果が書き込まれる。
複数の変換処理装置でのデータ変換処理、および、出力用バッファへの書込み処理は、出力用バッファに空きがある間は、繰返し実行される。出力用バッファに空きがない状態になると、出力処理装置8が、出力用バッファの内容を出力するために、データ書込み装置4を呼び出し、データ書込み装置4に書込みを実行させる。即ち、出力処理装置8は、出力用バッファに格納されているデータをデータ書込み装置4に処理可能な形態に処理し(例えばデータを分断)、データ書込み装置4に渡す。データ書込み装置4は、出力処理装置8から渡されたデータを出力処理装置8に応じて設けられている記憶装置に書き込む。
出力用バッファの内容出力後に、区切り文字探索処理装置6は、入力用バッファ9(複数ある場合は全部の入力用バッファ)内のデータすべてに対して変換処理を実施したかの判定を行い(ステップS51)、未処理のデータがあれば、変換処理ステップS48に戻り、変換処理を実行する。入力用バッファ9内のデータをすべて処理すると、再び入力ファイル2を入力用バッファ9に読み込む処理を実施する。入力ファイル2の読み込み処理がすべて完了すると、ファイル変換処理は終了する。
以上のように、ファイル変換処理において、入力ファイル2からのデータの読み込み処理、読み込んだデータに対する区切り文字の探索処理とデータ変換処理、およびデータ出力処理をそれぞれ並列実行可能としているため、プロセッサが複数搭載されたシステムでは、複数プロセッサを有効に活用して処理の並列度を向上させることにより、ファイル変換処理性能の向上を実現することができる。また、本実施の形態1のファイル変換装置1では、データ変換処理の前に、区切り文字を探索し、項目情報テーブル10に各項目値の出現位置を格納することにより、データ変換処理実行時には、入力用バッファ内のどの位置に各レコードが格納されているかが特定される。そのため、データ変換処理を複数並列に実行し、それぞれが異なるレコードに対する変換処理を実施することが可能となり、さらに並列度を向上させることができる。
実施の形態2.
次に図8、図9を参照して実施の形態2を説明する。実施の形態1では、データ変換処理をレコード単位(行単位)に並列に実行する場合を説明したが、実施の形態2では、データ変換処理を「列単位」に並列に実行する場合を説明する。
図8は、データ変換処理を「列単位」に並列実行する場合のファイル変換方式のフローチャートである。図8は、図6のS48に「行単位」とあるのに対して、S68では「列単位」とある点のみ異なり、後は同じである。
ステップS68、ステップS69における変換処理装置の動作を図9を用いて説明する。図9は、データ変換処理を「列単位」に並列実行する場合を説明する図である。変換処理装置7d〜7fのそれぞれは、項目情報テーブル10に基づいて、入力用バッファ9に格納された連続レコードに対し、この連続レコードを構成するそれぞれのレコードにおけるレコード内の出現位置を同じくする項目値を単位として、データ形式を変換する。即ち、変換処理装置7d〜7fのそれぞれぞれは、互いに異なる「列」のデータを変換する。即ち、図9に示すように、変換処理装置7dは、各レコードの1番目の項目値の変換処理を実施する。即ち、入力ファイル2の第1列の項目値を変換する。具体的には、変換処理装置7dは、項目情報テーブル10から、1番目の項目値の出現位置を特定し、入力用バッファ9からデータを読出して変換処理を実施し、1番目の項目用の出力用バッファ11dに変換結果を出力する。変換処理装置7e、7fは、それぞれ、2番目、3番目の項目値に対する変換処理を実施し、2番目の項目用の出力用バッファ11e、3番目の項目用の出力用バッファ11fに変換結果を出力する。変換処理装置7d、7e、7fは、それぞれ並列にデータ変換処理、および、出力用バッファへの書込み処理を実行し、出力用バッファ11d、11e、11fには、列単位に変換結果が書き込まれる。これにより、入力ファイルに対して、列単位で並列処理のデータ変換処理が可能となる。
以下の変換後の処理は、実施の形態1の「レコード単位(行単位)」の場合と同様である。即ち、複数の変換処理装置でのデータ変換処理、および、出力用バッファへの書込み処理は、出力用バッファに空きがある間は、繰返し実行される。出力用バッファに空きがない状態になると、出力処理装置8が、出力用バッファの内容を出力するために、データ書込み装置4を呼び出し、書込みを実行させる。
以上のように、ファイル変換処理において、データ変換処理を「列単位」に並列に実行することにより、変換処理実行時の並列度を向上させることが可能となり、ファイル変換処理の性能向上を実現できる。また、列単位にデータ変換処理を実施する本実施の形態2では、各変換処理装置が対象とする出力先のデータ型は、常に同じデータ型となる。したがって、変換処理を実施する前に、出力先のデータ型の判別処理を行ってデータ型に応じた変換処理を起動する処理が不要となり、データ変換処理のみを連続実行すればよいことになり、変換処理の効率化を実現できる。さらに、各変換処理単位で扱うデータ項目が同じとなるため、同じ項目値が連続して出現する可能性が高くなる場合も生じる。そのような場合は、データ変換前の値とデータ変換後の値を保持しておき、データ変換前の値と同じ値が出現すると、データ変換処理を省略し、あらかじめ保持していたデータ変換後の値を出力用バッファに書き込むことにより、さらに変換処理の効率化を実現できる。
以上の実施の形態では、
入力ファイルを読み込んで、出力先のデータ形式に変換する処理において、以下の手段を備えたファイル変換方式を説明した。
(a)入力ファイルからデータを入力用バッファに読み込む手段
(b)入力用バッファから、項目の区切り、および、行の区切りを探索し、各項目値の出現位置情報を項目情報テーブルとして格納する手段
(c)入力用バッファと、項目情報テーブルから、出力先のデータ形式へのデータ変換処理を行い、変換結果を出力用バッファに書き込む手段
(d)出力用バッファの内容をファイルまたはデータベースに書き込む手段。
以上の実施の形態では、
前記ファイル変換処理において、
入力用バッファ内での項目値の出現位置を特定するために、
各項目値が出現するバッファ番号、
バッファ内オフセット、
および、項目値の長さを格納する項目情報テーブル
を備えたファイル変換方式を説明した。
以上の実施の形態では、
前記ファイル変換処理において、
データ変換処理手段を複数実行し、
それぞれのデータ変換処理手段が、
項目情報テーブル内に格納された項目値の位置情報をもとに、入力用バッファ内のデータに対して、列単位に並列に変換処理を実行し、列単位に出力用バッファに書き込む
ファイル変換方式を説明した。
以上の実施の形態では、
前記ファイル変換処理において、
データ変換処理手段を複数実行し、
それぞれのデータ変換処理手段が、
項目情報テーブル内に格納された項目値の位置情報をもとに、入力用バッファ内のデータに対して、行単位に並列に変換処理を実行し、行単位に出力用バッファに書き込むファイル変換方式を説明した。
以上の実施の形態では、
前記、ファイル変換処理において、
以下の装置を備えたファイル変換装置を説明した。
(a)入力処理装置
(b)区切り文字探索処理装置
(c)変換処理装置
(d)出力処理装置。
実施の形態1におけるファイル変換装置1の外観の一例を示す図。 実施の形態1におけるファイル変換装置1のハードウェア構成を示す図。 実施の形態1におけるファイル変換装置1のブロック図。 実施の形態1における入力用バッファ9と項目情報テーブル10との関係を示す図。 実施の形態1における出力先定義情報3を示す図。 実施の形態1におけるファイル変換装置1の動作のフローチャート。 実施の形態1におけるファイル変換装置1の動作を説明するための図。 実施の形態2におけるファイル変換装置1の動作のフローチャート。 実施の形態2におけるファイル変換装置1の動作を説明するための図。
符号の説明
1 ファイル変換装置、2 入力ファイル、3 出力先定義情報、4 データ書込み装置、5 入力処理装置、6 区切り文字探索処理装置、7a,7b,7c,7d,7e,7f 変換処理装置、8 出力処理装置、9 入力用バッファ、10 項目情報テーブル、11 出力用バッファ、12 テーブル格納部、810 CPU、811 ROM、812 RAM、813 表示装置、814 K/B、815 マウス、816 通信ボード、817 FDD、818 CDD、819 プリンタ装置、820 磁気ディスク装置、821 OS、822 ウィンドウシステム、823 プログラム群、824 ファイル群、825 バス、830 システムユニット。

Claims (5)

  1. 区切られて連続する複数の項目値からなるレコードを要素とするとともに、このレコードごとに区切られて連続する連続レコードを格納する連続レコード格納部と、
    前記連続レコード格納部に格納された連続レコードを対象として、項目値の区切りとレコードの区切りとを探索し、探索結果に基づいて、それぞれの項目値の出現位置を示す出現位置情報を生成する探索部と、
    前記探索部により生成された出現位置情報に基づいて、前記連続レコード格納部に格納された連続レコードのデータ形式を変換する変換部と
    を備え
    前記連続レコード格納部は、
    複数のバッファからなるとともに、
    前記複数のバッファは、
    連続レコードにおけるレコードの連続性を保持したまま連続レコードを分散して格納し、
    前記探索部は、
    複数の前記バッファに分散して格納された連続レコードを対象として、前記バッファごとに出現位置情報を並列処理によって生成するデータ形式変換装置であり
    前記データ形式変換装置は、
    複数の前記変換部を備え、
    複数の前記変換部のそれぞれは、
    記探索部の前記並列処理により生成された前記バッファごとの出現位置情報に基づいて、複数の前記バッファに分散して格納された連続レコードの前記バッファごとのデータ形式を並列処理によって変換することを特徴とするデータ形式変換装置。
  2. 前記データ形式変換装置は、さらに、
    連続レコードを含むファイルから連続レコードを読み込み、読み込まれた連続レコードの連続性を保持したままで複数の前記バッファのそれぞれに並列処理によって連続レコードを分散して格納する入力処理部を備えたことを特徴とする請求項記載のデータ形式変換装置。
  3. 数の前記変換部のそれぞれは、
    前記探索部により前記バッファごとに生成された前記出現位置情報に基づいて、前記バッファに格納された連続レコードに対し、この連続レコードを構成するそれぞれのレコードにおけるレコード内の出現位置を同じくする項目値を単位として、データ形式を並列処理によって変換することを特徴とする請求項1または2に記載のデータ形式変換装置。
  4. 数の前記変換部のそれぞれは、
    前記探索部により前記バッファごとに生成された前記出現位置情報に基づいて、前記バッファに格納された連続レコードに対し、この連続レコードを構成するレコードを単位として、データ形式を並列処理によって変換することを特徴とする請求項1または2のいずれかに記載のデータ形式変換装置。
  5. 複数の前記変換部のそれぞれは、
    データ形式の変換された連続レコードを並列処理で出力し、
    前記データ形式変換装置は、さらに、
    複数の前記変換部のそれぞれに対応するとともに、複数の前記変換部のそれぞれから前記並列処理で出力された変換された連続レコードを入力して格納する複数の変換データ格納部と、
    複数の前記変換データ格納部に格納された変換された連続データを他の装置に出力する出力処理部と
    を備えたことを特徴とする請求項1〜4のいずれかに記載のデータ形式変換装置。
JP2007285345A 2007-11-01 2007-11-01 データ形式変換装置 Active JP5171211B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007285345A JP5171211B2 (ja) 2007-11-01 2007-11-01 データ形式変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007285345A JP5171211B2 (ja) 2007-11-01 2007-11-01 データ形式変換装置

Publications (2)

Publication Number Publication Date
JP2009116395A JP2009116395A (ja) 2009-05-28
JP5171211B2 true JP5171211B2 (ja) 2013-03-27

Family

ID=40783514

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007285345A Active JP5171211B2 (ja) 2007-11-01 2007-11-01 データ形式変換装置

Country Status (1)

Country Link
JP (1) JP5171211B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5327239B2 (ja) * 2011-01-31 2013-10-30 オムロン株式会社 データ収集装置、並びに、該データ収集装置の制御方法および制御プログラム
JP5672336B2 (ja) * 2013-05-28 2015-02-18 オムロン株式会社 データ収集装置、並びに、該データ収集装置の制御方法および制御プログラム
JP6207354B2 (ja) * 2013-11-18 2017-10-04 三菱電機株式会社 データベース連携装置及びデータベース連携プログラム
JP6383289B2 (ja) * 2014-12-29 2018-08-29 三菱電機インフォメーションネットワーク株式会社 入力ファイル処理装置、入力ファイル処理プログラム及び入力ファイル処理方法
JP6772883B2 (ja) 2017-02-15 2020-10-21 富士通株式会社 読込プログラム、読込方法および情報処理装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03147036A (ja) * 1989-11-01 1991-06-24 Casio Comput Co Ltd 可変長データ処理装置
JPH11259584A (ja) * 1998-03-10 1999-09-24 Casio Comput Co Ltd 表出力装置及び記録媒体
JPH11296510A (ja) * 1998-04-13 1999-10-29 Nec Corp データ変換装置
JP2000057231A (ja) * 1998-08-07 2000-02-25 Fujitsu Ltd プログラム間データ転送システムおよびデータ転送プログラムを格納した記憶媒体
JP3918023B2 (ja) * 2005-06-27 2007-05-23 クオリティ株式会社 個人情報管理システム

Also Published As

Publication number Publication date
JP2009116395A (ja) 2009-05-28

Similar Documents

Publication Publication Date Title
TWI519963B (zh) 用以完成可變寬度資料輸入之方法及系統
US20170249144A1 (en) Combining loads or stores in computer processing
US10649905B2 (en) Method and apparatus for storing data
US20100037226A1 (en) Grouping and dispatching scans in cache
JP5171211B2 (ja) データ形式変換装置
CN116483441B (zh) 基于移位缓冲的输出时序优化系统、方法及相关设备
KR20080044872A (ko) 컴퓨터 상에서 정보 또는 데이터를 처리하기 위한 시스템및 방법
JP2008210073A (ja) ログデータサイズ削減装置及びログデータサイズ削減装置のログデータサイズ削減方法
US20070079109A1 (en) Simulation apparatus and simulation method
US5696991A (en) Method and device for parallel accessing data with optimal reading start
JP5001703B2 (ja) システム設計検証装置
CN114036431A (zh) 页面缓存跳转方法、装置、电子设备及存储介质
CN114518841A (zh) 存储器中处理器和使用存储器中处理器输出指令的方法
JP5972461B2 (ja) データ連携支援装置及びデータ連携支援方法
CA2878558C (en) Lock free streaming of executable code data
JP2021189719A (ja) 情報処理装置及び受信処理プログラム
US6972770B1 (en) Method and apparatus for performing raster operations in a data processing system
JP7201545B2 (ja) 帳票処理プログラム、帳票処理方法、及び帳票処理装置
US8666925B1 (en) Method for parallel computation of a finite state machine
JP5303943B2 (ja) 演算処理装置および演算処理装置の制御方法
JPWO2018020647A1 (ja) 描画データ生成プログラム、描画データ生成装置、及び描画データ生成方法
JP2831837B2 (ja) 文書検索装置
JP2007219893A (ja) ファームウェア評価システムおよびファームウェア評価方法
JP6455229B2 (ja) ストレージ装置、読出記憶装置決定方法、読出記憶装置決定プログラム、およびストレージシステム
JP6383289B2 (ja) 入力ファイル処理装置、入力ファイル処理プログラム及び入力ファイル処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100916

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120918

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121018

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121225

R150 Certificate of patent or registration of utility model

Ref document number: 5171211

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250