JP6693549B2 - 情報処理装置、情報処理方法および情報処理プログラム - Google Patents

情報処理装置、情報処理方法および情報処理プログラム Download PDF

Info

Publication number
JP6693549B2
JP6693549B2 JP2018200431A JP2018200431A JP6693549B2 JP 6693549 B2 JP6693549 B2 JP 6693549B2 JP 2018200431 A JP2018200431 A JP 2018200431A JP 2018200431 A JP2018200431 A JP 2018200431A JP 6693549 B2 JP6693549 B2 JP 6693549B2
Authority
JP
Japan
Prior art keywords
information processing
compression
code
unit
interpreter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018200431A
Other languages
English (en)
Other versions
JP2019053741A (ja
Inventor
片岡 正弘
正弘 片岡
崇記 小澤
崇記 小澤
貢嗣 山本
貢嗣 山本
朋彦 穗坂
朋彦 穗坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2018200431A priority Critical patent/JP6693549B2/ja
Publication of JP2019053741A publication Critical patent/JP2019053741A/ja
Application granted granted Critical
Publication of JP6693549B2 publication Critical patent/JP6693549B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報処理装置などに関する。
インタープリタ形式のプログラム言語で記述されたプログラムを実行する際には、情報処理装置は、当該プログラムのソースコードに対して字句解析を行ない、字句解析の結果に応じて内部コードの割り当てを行う。そして、情報処理装置は、割て当てられた内部コードに従って、逐次処理を実行する。
また、ソースコードが圧縮された状態で保持されることがある。かかる場合には、圧縮されたインタープリタ形式のソースコードを実行する際には、情報処理装置は、ソースコードの伸長処理を実行してから、字句解析および内部コードの割り当てを行う。
特開平6−290021号公報 特開平5−324730号公報 特開平2−1027号公報
しかしながら、インタープリタ形式のソースコードが圧縮された状態で保持される場合に、プログラムを実行する都度、ソースコードの伸長と字句解析が繰り返されるため、実行指示から実行終了までの処理に時間がかかり、資源が浪費されるという問題がある。
ここで、ソースコードが圧縮された状態で保持される場合に、ソースコードの実行指示から実行終了までの処理に時間がかかり、資源が浪費されるという問題について、図1を参照して説明する。図1は、インタープリタ実行のシーケンスを示す参考図である。図1に示すように、情報処理装置は、圧縮された状態で保持されたソースプログラムの圧縮データを全て伸長した伸長データを記憶領域に記憶する。そして、情報処理装置は、記憶領域に記憶された全ての伸長データについて、字句解析および内部コード生成を行い、さらに、生成された内部コードについて、構文解析およびインタープリタの実行を行う。これにより、情報処理装置は、圧縮データ全体の伸長を行ってから伸長後の伸長データに対して字句解析および内部コード生成を行うこととなり、ソースコードの実行指示から実行終了までの処理に時間がかかってしまう。
1つの側面では、インタープリタ形式のソースコード等のデータのインタープリタの実行を効率化することを目的とする。
第1の案では、情報処理装置は、インタープリタ形式のデータに対して、字句解析を行う字句解析部と、前記字句解析部によって字句解析が行われたデータを、内部データと圧縮符号とを関連付ける圧縮辞書を用いて圧縮する圧縮部と、前記圧縮部によって圧縮されたデータに対するインタープリタの実行指示を受けた場合に、前記圧縮されたデータを前記圧縮辞書に基づいて内部データに変換する変換部と、前記変換部によって変換された内部データに基づいて、順次処理を実行する実行部と、を有する。
1つの態様によれば、インタープリタ形式のソースコード等のデータのインタープリタの実行速度を向上させることができる。
図1は、インタープリタ実行のシーケンスを示す参考図である。 図2は、実施例に係るインタープリタ実行のシーケンスの一例を示す図である。 図3は、実施例に係る圧縮処理の流れを示す図である。 図4は、実施例に係る葉の構造体のデータ構造の一例を示す図である。 図5は、実施例に係る内部コード対応表のデータ構造の一例を示す図である。 図6は、圧縮ファイルのブロック構成例を示す図である。 図7は、実施例に係る内部コード変換処理の流れを示す図である。 図8は、実施例に係る情報処理装置の機能構成を示すブロック図である。 図9は、実施例に係る圧縮部の機能構成を示すブロック図である。 図10は、実施例に係る実行部の機能構成を示すブロック図である。 図11は、実施例に係る圧縮処理のフローチャートの一例を示す図である。 図12は、実施例に係る実行処理のフローチャートの一例を示す図である。 図13は、実施例の情報処理装置のハードウェア構成を示す図である。 図14は、コンピュータで動作するプログラムの構成例を示す図である。
以下に、本願の開示する情報処理装置、情報処理方法および情報処理プログラムの実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。
[実施例に係るインタープリタ実行のシーケンスの一例を示す図]
図2は、実施例に係るインタープリタ実行のシーケンスの一例を示す図である。図2に示すように、インタープリタ圧縮処理は、インタープリタ形式のソースプログラムを字句解析し、字句解析結果を内部コードと関連付け、圧縮符号を割当て、圧縮ファイルに保存する。そして、インタープリタ実行処理は、ソースプログラムを圧縮された状態のままで、内部コード変換を経て、構文解析およびインタープリタの実行を行う
例えば、情報処理装置は、インタープリタ形式のソースプログラムを圧縮する際、当該ソースプログラムに対して、字句解析を行う。ここでいう字句解析とは、未圧縮状態のソースプログラムを単語に分割することをいう。単語には、既に予約されている単語を示す予約語、変数、改行、コメントが含まれる。予約語には、制御文や演算子が含まれる。制御文の一例として、forやwhileが挙げられる。演算子の一例として、+、−、×、/、=が挙げられる。変数には、数値を示す変数(数値変数)、定数、アドレスを示す変数(アドレス変数)が含まれる。数値変数の一例として、int_maxやint_minが挙げられる。定数の一例として、100や1000が挙げられる。アドレス変数の一例として、proc_abcやsub_aが挙げられる。
情報処理装置は、字句解析によって分割された単語を、内部コードと圧縮符号とを関連付ける圧縮辞書を用いて圧縮する。ここでいう内部コードとは、インタープリタを実行する際に用いられる内部的なコードのことをいう。圧縮辞書に内部コードと圧縮符号とを関連付けることで、圧縮された後のソースプログラムを圧縮された状態のままで、圧縮符号を内部コードに変換することが可能になる。そして、情報処理装置は、圧縮データを記憶領域に記憶する。
情報処理装置は、記憶領域に記憶された圧縮データを、内部コードと圧縮符号とを関連付ける圧縮辞書を用いて、内部コードに変換する。そして、情報処理装置は、変換された内部コードについて、構文解析およびインタープリタの実行を行う。これにより、インタープリタ形式のソースコードが圧縮された状態で保持される場合に、インタープリタの実行指示から実行終了までの実行速度を向上させることができる。言い換えると、実際のソースプログラムの実行に適した内部コードと、圧縮を目的とした圧縮コード(圧縮符号)とは、必ずしも一致しないので、情報処理装置は、字句解析が完了した状態で、符号割当てと、実行に適した内部コードとの対応関係を圧縮辞書に生成しておく。これにより、情報処理装置は、字句解析により得られたソースプログラムの規則性を、ファイルサイズの縮小と、プログラムの実行のためのコード変換の双方に利用することができる。
[実施例に係る圧縮処理の流れ]
図3は、実施例に係る圧縮処理の流れを示す図である。図3では、インタープリタ形式のソースプログラムには、例えば、「・・・IF A=100 THEN C=B ELSE C=D・・・」というデータが含まれる。
図3に示すように、情報処理装置は、インタープリタ形式のソースプログラムに対して、字句解析を行う。例えば、情報処理装置は、ソースプログラムを、「IF」,「A」,「=」,「100」,「THEN」,「C」,「=」,「B」,「ELSE」,「C」,「=」,「D」・・・に分割する。
情報処理装置は、分割した単語の名標を属性毎に分類する。ここでいう属性には、例えば、予約語、変数、改行、コメントがある。予約語は、例えば、制御文と演算子とに分けられる。変数は、例えば、数値変数と定数とアドレス変数とに分けられる。ここでは、予約語の制御文には、「IF」、「THEN」、「ELSE」が分類される。予約語の演算子には、「=」が分類される。変数の数値変数には、「A」、「B」、「C」が分類される。変数の定数には、「100」が分類される。
情報処理装置は、分類した属性毎の単語の名標を、それぞれ圧縮辞書に対応するケヤキ木を構成する葉に割り当てる。ここでは、予約語の制御文「IF」が、ケヤキ木の3番目の葉に割り当てられたとする。そして、情報処理装置は、3番目の葉の属性の領域に、予約語1(制御文)であることを示すビットを「1」(ON)に設定する。そして、情報処理装置は、3番目の葉の単語へのポインタに、「IF」の実体が記憶された領域へのポインタを設定する。ポインタは、例えば、実体(内容)と内部コードとを対応付ける内部コード対応表の内容を指す。すなわち、かかるポインタは、圧縮符号と内部コードとを関連付ける。
情報処理装置は、属性毎の分類に応じて、単語の文字列や記号の出現頻度を集計する。そして、情報処理装置は、属性毎の分類に応じて、出現頻度のより高い単語に対して、より短い圧縮符号を割り当てる。すなわち、情報処理装置は、単語の出現頻度でエントロピー符号化を行う。情報処理装置は、単語に対応する葉の圧縮符号の領域に、単語に割り当てられた圧縮符号を設定する。情報処理装置は、葉の圧縮符号長に単語に割り当てられた圧縮符号の符号長を設定する。
情報処理装置は、生成されたケヤキ木を用いて、ソースコードの圧縮符号化を行う。情報処理装置は、圧縮データを圧縮ファイルに格納する。
[葉の構造体のデータ構造]
図4は、実施例に係る葉の構造体のデータ構造の一例を示す図である。図4に示すように、葉の構造体には、葉の標識と、圧縮符号長と、属性と、圧縮符号と、単語へのポインタとが格納される。葉の標識は、葉を一意に識別する情報である。圧縮符号長は、圧縮符号の符号長である。属性は、単語の属性を示す情報である。属性は、8ビット記号(コメント)、改行、予約語1(制御文)、予約語2(演算子)、変数1(数値変数)、変数2(定数)、変数3(アドレス変数)を含む。各属性には、各ビットが対応付けられ、単語の属性に応じて、対応するビットが1(ON)に設定される。
[内部コード対応表のデータ構造]
図5は、実施例に係る内部コード対応表のデータ構造の一例を示す図である。図5に示すように、内部コード対応表は、内容と、バイト長と、内部コードとを対応付けて記憶する。内容は、単語の文字列である。バイト長は、内容のバイト長である。内部コードは、内容に対応付けられる内部コードである。内部コードは、属性毎の分類に応じて、割り当てられる。例えば、属性が予約語1(制御文)である場合には、「01」から割り当てられ、属性が変数1(数値変数)である場合には、「10」から割り当てられ、属性が予約語2(演算子)である場合には、「20」から割り当てられる。一例として、内容が「IF」である場合には、内部コードとして「01」が割り当てられている。なお、内部コード対応表は、予め作成され、記憶される。
[圧縮ファイルのブロック構成]
図6は、圧縮ファイルのブロック構成例を示す図である。図6に示すように、圧縮ファイルは、ヘッダ部と、圧縮符号データとを有する。圧縮符号データは、情報処理装置が生成した各圧縮符号に対応する。ヘッダ部は、例えば、圧縮ファイルの生成に用いられた圧縮アルゴリズムを識別する情報や、圧縮に用いられたパラメータなどの情報を有する。例えば、ヘッダ部には、単語の文字列と、単語の属性と、出現頻度とが対応付けて格納される。これは、情報処理装置がインタープリタを実行する際に、ケヤキ木の生成が必要であるからである。
[実施例に係る内部コード変換処理の流れ]
図7は、実施例に係る内部コード変換処理の流れを示す図である。図7に示すように、情報処理装置は、圧縮ファイルのヘッダ部に記憶された情報を用いて、ケヤキ木を生成する。例えば、情報処理装置は、単語の文字列を、ケヤキ木を構成する葉に割り当てる。情報処理装置は、葉の属性の領域に、単語の属性を「1」(ON)に設定する。情報処理装置は、葉の単語へのポインタに、内部コード対応表に記憶された、単語の文字列と一致する内容の領域へのポインタを設定する。情報処理装置は、葉の圧縮符号に、単語の出現頻度を基に割り当てた圧縮符号を設定し、葉の圧縮符号長に圧縮符号の符号長を設定する。すなわち、情報処理装置は、単語の出現頻度でエントロピー符号化を行い、符号化された圧縮符号を葉の圧縮符号に設定する。
情報処理装置は、生成されたケヤキ木を用いて、圧縮ファイルの圧縮符号データの内部コード化を行う。例えば、情報処理装置は、圧縮符号データから順次圧縮符号を読み出す。情報処理装置は、読み出した圧縮符号のビット列と、葉に割り当てられた圧縮符号のビット列とを比較し、読み出した圧縮符号のビット列にヒットする枝に接続される葉を特定する。情報処理装置は、特定した葉の単語へのポインタが指す内容に対応する内部コードを取得する。すなわち、情報処理装置は、読み出した圧縮符号を内部コードに変換する。
情報処理装置は、1行毎に、変換された内部コードを用いて、構文解析およびインタープリタの実行を行う。1行には、「改行」から次の「改行」までの間の複数の圧縮符号に対応する内部コードが含まれる。これにより、インタープリタ形式のソースプログラムが圧縮状態で保持される場合に、情報処理装置は、圧縮状態を伸長しなくても、圧縮状態から直接内部コードに変換するので、インタープリタの実行速度を向上させることができる。すなわち、情報処理装置は、インタープリタの実行指示から実行終了までの実行速度を向上させることができる。
なお、情報処理装置は、1行毎に、複数の圧縮符号に対応する葉の属性を用いて構文解析を行い、複数の圧縮符号に対応するそれぞれの内部コードを用いてインタープリタの実行を行っても良い。これにより、情報処理装置は、葉の属性を用いて構文解析を行うので、さらに、インタープリタの実行速度を向上させることができる。
[情報処理装置の機能構成]
図8は、実施例に係る情報処理装置の機能構成を示すブロック図である。図8に示すように、この情報処理装置100は、圧縮部200と、実行部300とを有する。
圧縮部200は、図3に示した圧縮処理を実行する処理部である。実行部300は、図7に示した内部コード変換処理を含むインタープリタを実行する処理部である。記憶部400は、内部コード対応表410を記憶する。内部コード対応表410は、図5に示したデータ構造と同様であるので、その説明を省略する。
[圧縮部の機能構成]
図9は、実施例に係る圧縮部の機能構成を示すブロック図である。図9に示すように、圧縮部200は、ファイルリード部210、字句解析部220、出現頻度集計部230、ケヤキ木生成部240、圧縮符号化部250およびファイルライト部260を有する。
ファイルリード部210は、ファイル内のインタープリタ形式のソースプログラムを読み出す。ファイルリード部210は、読み出したソースプログラムを字句解析部220および圧縮符号化部250に出力する。
字句解析部220は、ソースプログラムに対して、字句解析を行う。例えば、字句解析部220は、ソースプログラムを単語毎に分割する。字句解析部220は、分割した単語を属性に分類する。字句解析部220は、属性毎の分類を出現頻度集計部230およびケヤキ木生成部240に出力する。
出現頻度集計部230は、属性毎の分類に応じて、分類に属する単語の文字列や記号の出現頻度を集計する。出現頻度集計部230は、属性毎の分類に応じて、集計された出現頻度のより高い単語に対して、より短い圧縮符号を割り当てる。すなわち、出現頻度集計部230は、単語の出現頻度でエントロピー符号化を行う。
ケヤキ木生成部240は、属性に応じたケヤキ木を生成する。例えば、ケヤキ木生成部240は、字句解析部220によって分類された属性毎の単語を、ケヤキ木を構成する葉に割り当てる。ケヤキ木生成部240は、単語の属性を、単語の葉に対応する属性の領域に設定する。ケヤキ木生成部240は、単語の文字列を示すポインタを、単語の葉に対応する単語へのポインタに設定する。すなわち、ケヤキ木生成部240は、単語へのポインタに、内部コード対応表410に記憶された、単語の文字列と一致する内容の領域へのポインタを設定する。ケヤキ木生成部240は、出現頻度集計部230によって割り当てた圧縮符号を、単語の葉に対応する圧縮符号に設定し、圧縮符号の符号長を、単語の葉に対応する圧縮符号長に設定する。ケヤキ木生成部240は、生成されたケヤキ木を圧縮符号化部250に出力する。
圧縮符号化部250は、生成されたケヤキ木を用いて、ソースプログラムの圧縮符号化を行う。圧縮符号化部250は、ソースプログラムの圧縮符号データをファイルライト部260に出力する。
ファイルライト部260は、ソースプログラムの圧縮符号データを圧縮ファイルに書き込む。ファイルライト部260は、字句解析部220によって属性毎に分類された単語の文字列および単語の属性を、出現頻度集計部230によって集計された出現頻度とともに、圧縮ファイルのヘッダ部に書き込む。
[実行部の機能構成]
図10は、実施例に係る実行部の機能構成を示すブロック図である。図10に示すように、実行部300は、ファイルリード部310、ケヤキ木生成部320、内部コード変換部330、構文解析部340およびインタープリタ実行部350を有する。
ファイルリード部310は、圧縮ファイルの実行指示を受け付けると、実行指示を受け付けた圧縮ファイルを読み出す。ファイルリード部310は、読み出した圧縮ファイルをケヤキ木生成部320および内部コード変換部330に出力する。
ケヤキ木生成部320は、圧縮ファイルのヘッダ部に記憶された情報を用いて、ケヤキ木を生成する。ヘッダ部に記憶された情報には、単語毎の文字列、属性および出現頻度が含まれる。例えば、ケヤキ木生成部320は、単語の文字列を、ケヤキ木を構成する葉に割り当てる。ケヤキ木生成部320は、葉の属性の領域に、単語の属性を「1」(ON)に設定する。ケヤキ木生成部320は、葉の単語へのポインタに、内部コード対応表410に記憶された、単語の文字列と一致する内容の領域へのポインタを設定する。ケヤキ木生成部320は、葉の圧縮符号に、単語の出現頻度を基に割り当てられる圧縮符号を設定し、葉の圧縮符号長に圧縮符号の符号長を設定する。すなわち、ケヤキ木生成部320は、単語の出現頻度でエントロピー符号化を行い、符号化された圧縮符号を葉の圧縮符号に設定する。ケヤキ木生成部320は、生成されたケヤキ木を内部コード変換部330に出力する。
内部コード変換部330は、生成されたケヤキ木を用いて、圧縮ファイルの圧縮符号データの内部コード化を行う。例えば、内部コード変換部330は、圧縮符号データから順次圧縮符号を読み出す。内部コード変換部330は、読み出した圧縮符号のビット列と、ケヤキ木の葉に割り当てられた圧縮符号のビット列とを比較し、読み出した圧縮符号のビット列にヒットする枝に接続される葉を特定する。内部コード変換部330は、特定した葉の単語へのポインタが示す、内部コード対応表410の内容に対応する内部コードを取得する。すなわち、内部コード変換部330は、読み出した圧縮符号を内部コードに変換する。内部コード変換部330は、変換された内部コードを構文解析部340に出力する。
構文解析部340は、1行毎に、変換された内部コードを用いて、構文解析を行う。例えば、構文解析部340は、「改行」の内部コードから次の「改行」の内部コードまでの間の複数の内部コードを用いて、構文解析を行う。構文解析部340は、1行分の複数の内部コードをインタープリタ実行部350に出力する。なお、構文解析部340は、「改行」から次の「改行」までの間の複数の圧縮符号に対応する葉の属性を用いて構文解析を行っても良い。
インタープリタ実行部350は、1行分の複数の内部コードを用いて、インタープリタを実行する。なお、インタープリタ実行部350は、1行分の複数の圧縮符号に対応する葉の属性を用いて構文解析を行う場合には、1行分の複数の圧縮符号に対応するそれぞれの内部コードを用いて、インタープリタを実行すれば良い。
[圧縮処理のフローチャート]
図11は、実施例に係る圧縮処理のフローチャートの一例を示す図である。
まず、情報処理装置100は、ソースプログラムを受け付けたか否かを判定する(ステップS11)。情報処理装置100は、ソースプログラムを受け付けていないと判定した場合には(ステップS11;No)、ソースプログラムを受け付けるまで、判定処理を繰り返す。
一方、情報処理装置100は、ソースプログラムを受け付けたと判定した場合には(ステップS11;Yes)、受け付けたソースプログラムに対して、字句解析を行う(ステップS12)。
そして、情報処理装置100は、字句解析されたそれぞれの字句(単語)を属性毎に分類する(ステップS13)。情報処理装置100は、属性毎の分類に応じて、分類に属する単語の出現頻度を集計する(ステップS14)。情報処理装置100は、それぞれの単語を、出現頻度に応じて圧縮符号に割り当てる(ステップS15)。すなわち、情報処理装置100は、属性毎の分類に応じて、集計された出現頻度のより高い単語に対して、より短い圧縮符号を割り当てる。
そして、情報処理装置100は、字句解析されたそれぞれの単語をケヤキ木の葉に割り当て、割り当てたケヤキ木の葉に、圧縮符号、属性、内部コードへのポインタを設定する(ステップS16)。例えば、情報処理装置100は、それぞれの単語毎に、単語の葉に対応する属性の領域に、単語の属性を設定する。情報処理装置100は、単語の葉に対応する単語へのポインタに、単語の文字列を示すポインタを設定する。すなわち、情報処理装置100は、単語へのポインタに、内部コード対応表410に記憶された、単語の文字列と一致する内容の領域へのポインタを設定する。情報処理装置100は、単語の葉に対応する圧縮符号に、出現頻度に応じて割り当てられた圧縮符号を設定し、単語の葉に対応する圧縮符号長に、圧縮符号の符号長を設定する。
そして、情報処理装置100は、ケヤキ木を参照して、受け付けたソースプログラムを圧縮符号化する(ステップS17)。
そして、情報処理装置100は、ソースプログラムの圧縮符号データを圧縮ファイルに書き込む(ステップS18)。加えて、情報処理装置100は、字句解析されたそれぞれの単語の文字列および属性を、出現頻度とともに、圧縮ファイルのヘッダ部に書き込む。
[実行処理のフローチャート]
図12は、実施例に係る圧縮処理のフローチャートの一例を示す図である。
図12に示すように、情報処理装置100は、圧縮ファイルを受け付けたか否かを判定する(ステップS21)。情報処理装置100は、圧縮ファイルを受け付けていないと判定した場合には(ステップS21;No)、圧縮ファイルを受け付けるまで、判定処理を繰り返す。
一方、情報処理装置100は、圧縮ファイルを受け付けたと判定した場合には(ステップS21;Yes)、ケヤキ木を生成する(ステップS22)。例えば、情報処理装置100は、圧縮ファイルのヘッダ部に記憶された情報を用いて、ケヤキ木を生成する。
そして、情報処理装置100は、圧縮ファイルの圧縮符号データから圧縮符号を読み出す(ステップS23)。情報処理装置100は、生成したケヤキ木を参照し、読み出した圧縮符号にヒットする葉を特定する(ステップS24)。
そして、情報処理装置100は、内部コード対応表410を参照し、特定した葉の圧縮符号を葉に紐づく内部コードに変換する(ステップS25)。例えば、情報処理装置100は、特定した葉の単語へのポインタが示す、内部コード対応表410の内容に対応する内部コードを取得する。
そして、情報処理装置100は、1行毎に、変換された内部コードをもとに構文解析し、インタープリタを実行する(ステップS26)。例えば、情報処理装置100は、「改行」の内部コードから次の「改行」の内部コードまでの間の複数の内部コードを用いて、構文解析を行う。情報処理装置100は、かかる複数の内部コードを用いて、インタープリタを実行する。なお、情報処理装置100は、1行毎に、圧縮符号に対応する葉の属性をもとに構文解析を行っても良い。
そして、情報処理装置100は、圧縮ファイルの圧縮符号データの終端か否かを判定する(ステップS27)。情報処理装置100は、圧縮ファイルの圧縮符号データの終端でないと判定した場合には(ステップS27;No)、次の圧縮符号を読み出すべく、ステップS23に移行する。
一方、情報処理装置100は、圧縮ファイルの圧縮符号データの終端であると判定した場合には(ステップS27;Yes)、実行処理を終了する。
[実施例の効果]
上記実施例によれば、情報処理装置100は、インタープリタ形式のソースコードに対して、字句解析を行う。情報処理装置100は、字句解析が行われたソースコードを、内部コードと圧縮符号とを関連付ける圧縮辞書を用いて圧縮する。情報処理装置100は、圧縮されたソースコードに対するインタープリタの実行指示を受けた場合に、前記圧縮されたソースコードを前記圧縮辞書に基づいて内部コードに変換する。そして、情報処理装置100は、変換された内部コードに基づいて、順次処理を実行する。かかる構成によれば、情報処理装置100は、圧縮されたソースコードを伸長しなくても、内部コードと圧縮符号とを関連付ける圧縮辞書を用いることで圧縮状態からインタープリタの内部コードに変換できる。この結果、情報処理装置100は、圧縮されたソースコードのインタープリタの実行速度を向上させることができる。
また、上記実施例によれば、情報処理装置100は、字句解析が行われた単語毎に、各単語に対応する圧縮符号、属性および内部コードへのポインタを葉に含むツリー構造を生成する。情報処理装置100は、生成されたツリー構造に登録されている単語に対応する属性をもとに、構文解析を実行し、当該単語に対応する内部コードをもとに、インタープリタ処理を実行する。かかる構成によれば、情報処理装置100は、圧縮符号とその属性をすばやく判定できるので、構文解析の高速化を実現できる。
また、上記実施例によれば、情報処理装置100は、ソースコードに対して字句解析が行われた単語毎に、属性およびソースコードにおける出現頻度を対応付けて、圧縮ファイルのヘッダ部に格納する。かかる構成によれば、情報処理装置100は、圧縮ファイルのヘッダ部に格納された情報を用いて、インタープリタの実行前にケヤキ木を生成することができる。この結果、情報処理装置100は、ケヤキ木を用いることで、圧縮されたソースコードのインタープリタの実行速度を向上させることができる。
[実施例に関連する他の態様]
以下、上述の実施形態における変形例の一部を説明する。下記の変形例のみでなく、本発明の本旨を逸脱しない範囲の設計変更は適宜行われうる。
また、実施例に係る情報処理装置100は、圧縮辞書に対応するツリー構造としてケヤキ木を生成すると説明した。しかしながら、情報処理装置100は、これに限定されず、圧縮辞書に対応するツリー構造としてハフマン木を生成するものとしても良い。すなわち、情報処理装置100は、属性毎の単語を、それぞれ圧縮辞書に対応するハフマン木を構成する葉に割り当て、それぞれの葉に、対応する単語の圧縮符号、属性および単語へのポインタを設定すれば良い。そして、情報処理装置100は、生成されたハフマン木を用いて、圧縮状態のソースコードの内部コード化を行ない、内部コードを用いて、構文解析およびインタープリタの実行を行えば良い。
また、実施例に係る情報処理装置100は、ソースプログラムを圧縮する際に、ソースプログラムの圧縮符号データを圧縮ファイルに書き込み、加えて、単語毎に単語の文字列および属性を、出現頻度とともに、圧縮ファイルのヘッダ部に書き込む。そして、情報処理装置100は、圧縮されたソースプログラムを実行する際に、圧縮ファイルのヘッダ部に記憶された情報を用いて、ケヤキ木を生成し、生成されたケヤキ木を用いて、圧縮ファイルの圧縮符号データの内部コード化を行う。しかしながら、情報処理装置100は、これに限定されず、ソースプログラムを圧縮する際に、ソースプログラムの圧縮符号データを圧縮ファイルに書き込み、加えて、ケヤキ木および内部コード対応表410を圧縮ファイルのトレーラ部に書き込むようにしても良い。これにより、情報処理装置100は、圧縮されたソースプログラムを実行する際に、ケヤキ木を生成する必要がなく、ケヤキ木を読み出すだけでその後の圧縮符号データの内部コード化を行うことができ、さらに、インタープリタの実行速度を向上させることができる。
また、実施例に示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
[情報処理装置のハードウェア構成]
図13は、実施例の情報処理装置のハードウェア構成を示す図である。図13の例が示すように、コンピュータ500は、各種演算処理を実行するCPU501と、ユーザからのデータ入力を受け付ける入力装置502と、モニタ503とを有する。また、コンピュータ500は、記憶媒体からプログラム等を読み取る媒体読取装置504と、他の装置と接続するためのインターフェース装置505と、他の装置と無線により接続するための無線通信装置506とを有する。また、コンピュータ500は、各種情報を一時記憶するRAM507と、ハードディスク装置508とを有する。また、各装置501〜508は、バス509に接続される。
ハードディスク装置508には、例えば図9に示した字句解析部220、出現頻度集計部230、ケヤキ木生成部240および圧縮符号化部250の各処理部と同様の機能を有する圧縮処理プログラムが記憶される。また、ハードディスク装置508には、例えば図10に示したケヤキ木生成部320、内部コード変換部330、構文解析部340およびインタープリタ実行部350の各処理部と同様の機能を有する実行処理プログラムが記憶される。また、ハードディスク装置508には、圧縮処理プログラムおよび実行処理プログラムを含む情報処理プログラムを実現するための各種データが記憶される。
CPU501は、ハードディスク装置508に記憶された各プログラムを読み出して、RAM507に展開して実行することで各種の処理を行う。これらのプログラムは、コンピュータ500を、例えば図9に示した字句解析部220、出現頻度集計部230、ケヤキ木生成部240および圧縮符号化部250として機能させることができる。これらのプログラムは、コンピュータ500を、例えば図10に示したケヤキ木生成部320、内部コード変換部330、構文解析部340およびインタープリタ実行部350として機能させることができる。
なお、上記の情報処理プログラムは、必ずしもハードディスク装置508に記憶されている必要はない。例えば、コンピュータ500が読み取り可能な記憶媒体に記憶されたプログラムを、コンピュータ500が読み出して実行するようにしてもよい。コンピュータ500が読み取り可能な記憶媒体は、例えば、CD−ROMやDVDディスク、USB(Universal Serial Bus)メモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリ、ハードディスクドライブ等が対応する。また、公衆回線、インターネット、LAN(Local Area Network)等に接続された装置にこのプログラムを記憶させておき、コンピュータ500がこれらからプログラムを読み出して実行するようにしてもよい。
図14は、コンピュータで動作するプログラムの構成例を示す図である。コンピュータ500において、図14に示すハードウェア群26(501〜509)の制御を行なうOS(オペレーティング・システム)27が動作する。OS27に従った手順でCPU501が動作して、ハードウェア群26の制御・管理が行なわれることにより、アプリケーションプログラム29やミドルウェア28に従った処理がハードウェア群26で実行される。さらに、コンピュータ500において、ミドルウェア28またはアプリケーションプログラム29が、RAM407に読み出されてCPU501により実行される。
CPU501により符号化する単語を受け付けた場合、ミドルウェア28またはアプリケーションプログラム29の少なくとも一部に基づく処理を行なうことで、(それらの処理をOS27に基づいてハードウェア群26を制御して)圧縮部200および実行部300の情報処理機能が実現される。情報処理機能は、それぞれアプリケーションプログラム29自体に含まれてもよいし、アプリケーションプログラム29に従って呼び出されることで実行されるミドルウェア28の一部であってもよい。
100 情報処理装置
200 圧縮部
210 ファイルリード部
220 字句解析部
230 出現頻度集計部
240 ケヤキ木生成部
250 圧縮符号化部
260 ファイルライト部
300 実行部
310 ファイルリード部
320 ケヤキ木生成部
330 内部コード変換部
340 構文解析部
350 インタープリタ実行部
400 記憶部
410 内部コード対応表

Claims (5)

  1. インタープリタ形式のプログラムデータに対して、字句解析を行う字句解析部と、
    前記字句解析部によって字句解析が行われた前記プログラムデータを、インタープリタ処理を実行する際に用いられる内部コードと圧縮符号とを関連付ける圧縮辞書を用いて圧縮する圧縮部と、
    前記圧縮部によって圧縮された前記プログラムデータに対するインタープリタの実行指示を受けた場合に、前記圧縮された前記プログラムデータを前記圧縮辞書に基づいて内部コードに変換する変換部と、
    前記変換部によって変換された内部コードに基づいて、順次処理を実行する実行部と、
    を有することを特徴とする情報処理装置。
  2. 前記字句解析が行われた単語毎に、各単語に対応する圧縮符号、属性および内部コードへのポインタを葉に含むツリー構造を生成するツリー構造生成部を有し、
    前記実行部は、前記ツリー構造生成部によって生成されたツリー構造に登録されている単語に対応する属性をもとに、構文解析を実行し、当該単語に対応する内部コードをもとに、インタープリタ処理を実行する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記プログラムデータに対して前記字句解析が行われた単語毎に属性および前記プログラムデータにおける出現頻度を対応付けて、圧縮ファイルのヘッダ部に格納する格納部
    を有することを特徴とする請求項1または請求項2に記載の情報処理装置。
  4. コンピュータが、
    インタープリタ形式のプログラムデータに対して、字句解析を行い、
    前記字句解析が行われた前記プログラムデータを、インタープリタ処理を実行する際に用いられる内部コードと圧縮符号とを関連付ける圧縮辞書を用いて圧縮し、
    圧縮された前記プログラムデータに対するインタープリタの実行指示を受けた場合に、前記圧縮された前記プログラムデータを前記圧縮辞書に基づいて内部コードに変換し、
    変換された内部コードに基づいて、順次処理を実行する
    各処理を実行することを特徴とする情報処理方法。
  5. コンピュータに、
    インタープリタ形式のプログラムデータに対して、字句解析を行い、
    前記字句解析が行われた前記プログラムデータを、インタープリタ処理を実行する際に用いられる内部コードと圧縮符号とを関連付ける圧縮辞書を用いて圧縮し、
    圧縮された前記プログラムデータに対するインタープリタの実行指示を受けた場合に、前記圧縮された前記プログラムデータを前記圧縮辞書に基づいて内部コードに変換し、
    変換された内部コードに基づいて、順次処理を実行する
    処理を実行させることを特徴とする情報処理プログラム。
JP2018200431A 2018-10-24 2018-10-24 情報処理装置、情報処理方法および情報処理プログラム Active JP6693549B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018200431A JP6693549B2 (ja) 2018-10-24 2018-10-24 情報処理装置、情報処理方法および情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018200431A JP6693549B2 (ja) 2018-10-24 2018-10-24 情報処理装置、情報処理方法および情報処理プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017523034A Division JP6428936B2 (ja) 2015-06-10 2015-06-10 情報処理装置、情報処理方法および情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2019053741A JP2019053741A (ja) 2019-04-04
JP6693549B2 true JP6693549B2 (ja) 2020-05-13

Family

ID=66013479

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018200431A Active JP6693549B2 (ja) 2018-10-24 2018-10-24 情報処理装置、情報処理方法および情報処理プログラム

Country Status (1)

Country Link
JP (1) JP6693549B2 (ja)

Also Published As

Publication number Publication date
JP2019053741A (ja) 2019-04-04

Similar Documents

Publication Publication Date Title
KR101247075B1 (ko) 마크업 언어 데이터의 인코딩
JP2002529849A (ja) データ処理リソースを供給された内蔵システムにおいて実行可能な中間オブジェクトコードプログラムのためのデータ圧縮方法、および、この方法に対応しかつマルチアプリケーションを備えた内蔵システム
JP6550765B2 (ja) 文字データ変換プログラム、文字データ変換装置および文字データ変換方法
US11394956B2 (en) Encoding apparatus and encoding method
JP6686639B2 (ja) 符号化プログラム、符号化装置、符号化方法、復号化プログラム、復号化装置および復号化方法
US20200294629A1 (en) Gene sequencing data compression method and decompression method, system and computer-readable medium
JP2017073615A (ja) 符号化プログラム、符号化方法、符号化装置、復号化プログラム、復号化方法および復号化装置
AU2019250125B2 (en) Information processing apparatus, information processing method, and information processing program
KR101842420B1 (ko) 정보 처리 장치 및 데이터 관리 방법
US9479195B2 (en) Non-transitory computer-readable recording medium, compression method, decompression method, compression device, and decompression device
US20150248432A1 (en) Method and system
JP6613669B2 (ja) 圧縮プログラム、圧縮方法、情報処理装置、置換プログラムおよび置換方法
JP6693549B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP2007537642A (ja) Xmlデータの構造化されたブロック単位の圧縮及び解凍方法及び装置
US20070226724A1 (en) Method and apparatus for firmware execution and provision
US20160210304A1 (en) Computer-readable recording medium, information processing apparatus, and conversion process method
JP2016063475A (ja) 符号化装置、符号化方法、復号装置、復号方法、及び、プログラム
JPH0865172A (ja) データ圧縮装置
CN105893086A (zh) 一种基于音频处理器的系统固件压缩方法及其解压缩方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190709

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200114

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200305

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200317

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200330

R150 Certificate of patent or registration of utility model

Ref document number: 6693549

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150