WO2021070393A1

WO2021070393A1 - 解析機能付与装置、解析機能付与方法及び解析機能付与プログラム

Info

Publication number: WO2021070393A1
Application number: PCT/JP2019/040336
Authority: WO
Inventors: 利宣碓井; 知範幾世; 裕平川古谷; 誠岩村; 三好　潤
Original assignee: 日本電信電話株式会社
Priority date: 2019-10-11
Filing date: 2019-10-11
Publication date: 2021-04-15
Also published as: US20230028595A1; JP7287480B2; JPWO2021070393A1

Abstract

解析機能付与装置（１０）は、スクリプトエンジンの仮想機械を解析する仮想機械解析部（１２１）と、仮想機械の命令の体系である命令セットアーキテクチャを解析する命令セットアーキテクチャ解析部（１２２）と、仮想機械解析部（１２１）及び命令セットアーキテクチャ解析部（１２２）による解析によって得られたアーキテクチャ情報に基づいて、スクリプトエンジンに、マルチパス実行機能を付与するフックを施す解析機能付与部（１２３）と、を有する。

Description

解析機能付与装置、解析機能付与方法及び解析機能付与プログラム

　本発明は、解析機能付与装置、解析機能付与方法及び解析機能付与プログラムに関する。

　マルウェアを用いたスパム（マルスパム）やファイルレスマルウェアなどの多様な攻撃の形態が生じるにともなって、悪性な挙動を示すスクリプト（悪性スクリプト）による攻撃の脅威が顕在化している。

　悪性スクリプトとは、悪意のある挙動を持ったスクリプトであり、スクリプトエンジンの提供する機能を悪用して攻撃を実現するプログラムである。一般に、オペレーティングシステム（Operating　System：ＯＳ）がデフォルトで有するスクリプトエンジンや、Webブラウザや文書ファイルのビューアなど、特定のアプリケーションが有するスクリプトエンジンを用いて攻撃が実施される。

　こうしたスクリプトエンジンの多くは、ユーザの許可が必要な場合もあるものの、ファイル操作やネットワーク通信、プロセスの起動など、システムを介した挙動も実現可能である。したがって、悪性スクリプトを用いた攻撃は、実行ファイルのマルウェアを用いた攻撃と同様に、ユーザに対しての脅威となる。

　この悪性スクリプトによる攻撃に対策を講じるためには、スクリプトの持つ挙動を正確に把握する必要がある。したがって、スクリプトを解析することで、その挙動を明らかにする技術が希求される。

　悪性スクリプトを解析する際に生じる問題として、コードの難読化がある。悪性スクリプトの多くは、難読化と呼ばれる、解析を妨害する処理が施されている。難読化は、故意にコードの複雑さを高めることで、コードの表層的な情報に基づく解析を困難にする。すなわち、スクリプトを実行せずに、コードから得られる情報で解析する、静的解析と呼ばれる解析方法を妨害する。

　特に、実行するコードの一部を外部から動的に取得する場合は、そのコードは実行しなければ得られないため、静的には解析できない。したがって、静的解析はその原理上、不可能となる。

　一方で、スクリプトを実行し、その振る舞いを監視することで挙動を知る動的解析と呼ばれる手法は、前述のような難読化の影響を受けない。このため、悪性スクリプトの解析においては、動的解析に基づく手法が主に用いられている。

　一般的な動的解析では、解析環境で悪性スクリプトを実行し、その挙動を監視することにより、悪性スクリプト中で実行された単一の実行経路の挙動のみが得られる。このため、解析環境で実行されなかった経路の挙動は得ることができないという問題がある。

　言い換えると、特定の条件下でしか実行されない経路を有する悪性スクリプトについては、動的解析によっても、全ての挙動を解析しきれないという問題がある。

　特定の条件下でしか実行されない経路がある場合として、例えば、指令サーバからの指令によってその先の実行経路が決まる場合や、解析妨害によって解析環境では悪性な挙動を示さないようになっている場合がある。

　前者は、指令サーバからの指令がなければ、その先の実行経路が決定されず、悪性な挙動を持った経路が実行されない場合である。悪性スクリプトを検出して解析する際には、既に攻撃者が撤退して指令サーバがなくなっている場合も少なくないため、そのような場合には、悪性な挙動を観測できない。

　後者は、悪性スクリプトが、自身が実行されている環境の情報を取得し、それが特定の条件を満たしていなければ、悪性な挙動を示さないという解析妨害である。例えば、解析環境に高頻度に見られる特徴が見られた場合には、自分が解析されていると判断して、実行を中断するという解析妨害に用いられる。

　図１８は、解析妨害の一例を示すコード片を示す図である。このコード片は、実行されている環境のＣＰＵ（Central　Processing　Unit）のコア数を取得し、それが２以上かつ８以下でなければ、解析環境の可能性が高いと判断して、実行を終了するという解析妨害を持つ。さもなければ、解析環境ではないと判断して、悪性な挙動を示す。

　このような特定の条件下でしか実行されない経路の挙動を捉えるためには、複数の実行経路を実行するマルチパス実行が必要となる。

　マルチパス実行では、実行が条件分岐に到達した際に、実行状態を分岐させ、分岐した各々の実行状態が、分岐のそれぞれの実行経路を辿るようにする。これにより、条件分岐で発生する二つの実行経路の両方を実行する。

　マルチパス実行の実現について、例えば、非特許文献１には、JavaScript（登録商標）に対して、マルチパス実行の一種であるシンボリック実行を実現する手法が記載されている。この手法によれば、JavaScriptのスクリプトの条件分岐において、実行可能な経路を網羅的に辿り、挙動を観測できる。

　また、非特許文献２には、JavaScriptに対して、マルチパス実行の一種である経路強制実行を実現する手法が記載されている。この手法によれば、JavaScriptのスクリプトの条件分岐において、全ての経路を網羅的に辿り、挙動を観測できる。

　非特許文献３には、スクリプトエンジンに予め手動で改造を施した上で、そのスクリプトエンジンをバイナリ向けのシンボリック実行基盤の上で実行することで、スクリプトエンジン上で実行されているスクリプトに対して、スクリプトエンジン越しにシンボリック実行を実現する手法が記載されている。この手法によれば、手動で改造を施せるスクリプトエンジンがあれば、どのようなスクリプト言語でも汎用的にシンボリック実行を実現し、実行可能な経路を網羅的に辿って、挙動を観測できる。

　そして、非特許文献４には、マルウェアが自身のプログラムの難読化にしばしば用いる仮想機械（Virtual　Machine：ＶＭ）を解析する手法が記載されている。この手法によれば、ＶＭを解析することで、そのアーキテクチャの情報を取得できる。スクリプトエンジンにおいてスクリプトの実行を司るのはＶＭであるため、この手法の考え方を一部転用できる。

Prateek　Saxena,　et　al,　"A　Symbolic　Execution　Framework　for　JavaScript",　2010　IEEE　Symposium　on　Security　and　Privacy. Kyungtae　Kim,　et　al,　"J-Force:　Forced　Execution　on　JavaScript". Stefan　Bucur,　et　al,　"Prototyping　Symbolic　Execution　Engines　for　Interpreted　Languages". Monirul　Sharif,　et　al,　"Automatic　Reverse　Engineering　of　Malware　Emulators",　2009　30th　IEEE　Symposium　on　Security　and　Privacy.

　しかしながら、非特許文献１及び非特許文献２に記載の手法では、スクリプトエンジンごとに個別にマルチパス実行機能を設計し、実装する必要があるという課題があった。また、非特許文献１及び非特許文献２に記載の手法では、マルチパス実行機能を実現するために、スクリプトエンジンのＶＭのアーキテクチャの情報を事前に知る必要があるという課題があった。

　また、非特許文献３に記載の手法では、スクリプトエンジンへの改造を要するため、やはり、スクリプトエンジンのＶＭのアーキテクチャ情報を事前に知る必要があるという課題があった。また、非特許文献３に記載の手法では、スクリプトエンジン内での条件分岐の仕組みなど、詳細なアーキテクチャを考慮しないため、スクリプトに対する細粒度のマルチパス実行が難しいという課題があった。

　このスクリプトエンジンのアーキテクチャ情報の取得には、解析作業が必要となる。オープンソースのスクリプトエンジンに対しては、ソースコードの解析によって実現できるが、ソースコードが得られるスクリプト言語に限られ、一定の工数も要する。さらに、プロプライエタリのスクリプトエンジンについては、バイナリのリバースエンジニアリングの必要があり、人手での実施には熟練したリバースエンジニアと多大な工数を要するため、現実的でない。さらに、そのリバースエンジニアリングの自動化は、確立されていない。

　そして、非特許文献４に記載の手法では、マルウェアの持つＶＭのみを対象としており、スクリプトエンジンの持つＶＭは対象としていないため、スクリプトエンジンには直接的には適用できないという課題があった。また、非特許文献４に記載の手法は、マルチパス実行に重要な条件分岐に関わるアーキテクチャ情報の取得には言及していないという課題もあった。さらに、非特許文献４に記載の手法では、ＶＭの解析のみに焦点を当てており、マルチパス実行の付与など、ＶＭへの機能付与は考慮していないという課題もあった。

　本発明は、上記に鑑みてなされたものであって、スクリプトエンジンに対して、事前のアーキテクチャ情報なしにマルチパス実行機能の付与を実現できる解析機能付与装置、解析機能付与方法及び解析機能付与プログラムを提供することを目的とする。

　上述した課題を解決し、目的を達成するために、本発明の解析機能付与装置は、悪性のスクリプトエンジンの仮想機械を解析する第一の解析部と、仮想機械の命令の体系である命令セットアーキテクチャを解析する第二の解析部と、第一の解析部及び第二の解析部による解析によって得られたアーキテクチャ情報に基づいて、スクリプトエンジンに、マルチパス実行機能を付与するフックを施す付与部と、を有することを特徴とする。

　また、本発明の解析機能付与方法は、解析機能付与装置が実行する解析機能付与方法であって、悪性のスクリプトエンジンの仮想機械を解析する第一の解析工程と、仮想機械の命令の体系である命令セットアーキテクチャを解析する第二の解析工程と、第一の解析工程及び第二の解析工程における解析によって得られたアーキテクチャ情報に基づいて、スクリプトエンジンに、マルチパス実行機能を付与するフックを施す付与工程と、を含んだことを特徴とする。

　また、本発明の解析機能付与プログラムは、悪性のスクリプトエンジンの仮想機械を解析する第一の解析ステップと、仮想機械の命令の体系である命令セットアーキテクチャを解析する第二の解析ステップと、第一の解析工程及び第二の解析工程における解析によって得られたアーキテクチャ情報に基づいて、スクリプトエンジンに、マルチパス実行機能を付与するフックを施す付与ステップと、をコンピュータに実行させる。

　本発明によれば、スクリプトエンジンに対して、事前のアーキテクチャ情報なしにマルチパス実行機能の付与を実現できる。

図１は、スクリプトエンジンの構成の一例を説明するための図である。図２は、スクリプトエンジンが有するＶＭの擬似コードを示す図である。図３は、実施の形態に係る解析機能付与装置の構成の一例を説明する図である。図４は、インタプリタループ検出及び仮想プログラムカウンタ検出に用いるテストスクリプト（第一のテストスクリプト）の一例を示す図である。図５は、分岐ＶＭ命令検出に用いるテストスクリプト（第二のテストスクリプト）の一例を示す図である。図６は、実行トレースの一例を示す図である。図７は、ＶＭ実行トレースの一例を示す図である。図８は、実施の形態に係る解析機能付与処理の処理手順を示すフローチャートである。図９は、図８に示す実行トレース取得処理の処理手順を示すフローチャートである。図１０は、図８に示すインタプリタループ検出処理の処理手順を示すフローチャートである。図１１は、図８に示す仮想プログラムカウンタ検出処理の処理手順を示すフローチャートである。図１２は、図８に示すデコーダ・ディスパッチャ検出処理の処理手順を示すフローチャートである。図１３は、図８に示す条件分岐フラグ検出処理の処理手順を示すフローチャートである。図１４は、図８に示すＶＭ実行トレース取得処理の処理手順を示すフローチャートである。図１５は、図８に示す分岐ＶＭ命令検出処理の処理手順を示すフローチャートである。図１６は、図８に示す解析機能付与処理の処理手順を示すフローチャートである。図１７は、プログラムが実行されることにより、解析機能付与装置が実現されるコンピュータの一例を示す図である。図１８は、解析妨害の一例を示すコード片を示す図である。

　以下に、本願に係る解析機能付与装置、解析機能付与方法及び解析機能付与プログラムの実施形態を図面に基づいて詳細に説明する。また、本発明は、以下に説明する実施形態により限定されるものではない。

［実施の形態］
　実施の形態に係る解析機能付与装置は、テストスクリプトを用いてスクリプトエンジンのバイナリを解析することにより、インタプリタループと、仮想プログラムカウンタ（ＶＰＣ）と、デコーダ・ディスパッチャと、条件分岐フラグと、ＶＭにおける分岐命令（分岐ＶＭ命令）とを順に検出する。

　なお、これらはいずれも、スクリプトエンジンの構成要素であり、アーキテクチャに関する情報である。図１及び図２を参照して、一般的なスクリプトエンジンの構成とそれらの働きについて説明する。

　図１は、スクリプトエンジンの構成の一例を説明するための図である。図１に示すように、スクリプトエンジン１は、バイトコードコンパイラ２と仮想機械（Virtual　Machine：ＶＭ）３を有する。また、バイトコードコンパイラ２は、構文解析部４、バイトコード生成部５を有する。また、ＶＭ３は、コードキャッシュ部６、フェッチ部７、デコード部８、実行部９を有する。これらのフェッチ部７、デコード部８、実行部９は、繰り返し実行され、インタプリタループと呼ばれる。そして、スクリプトエンジン１は、スクリプトの入力を受け付ける。

　構文解析部４は、スクリプトを入力として受け取り、字句解析及び構文解析を経て、抽象構文木（Abstract　Syntax　Tree：ＡＳＴ）を生成し、バイトコード生成部５に出力する。バイトコード生成部５は、ＡＳＴを入力として受け取り、バイトコードに変換してコードキャッシュ部６に格納する。

　フェッチ部７は、コードキャッシュ部６からＶＭオペコードをフェッチし、デコード部８に出力する。ここで、ＶＭオペコードは、ＶＭ命令のオペコード部を指す。デコード部８は、ＶＭオペコードを入力として受け取り、デコーダ・ディスパッチャを用いてＶＭオペコードを解釈し、対応したプログラムにディスパッチする。実行部９は、ＶＭ命令に対応したプログラムを実行する。インタプリタループの繰り返しにより、ＶＭ命令を次々に実行していくことで、スクリプトに記述した内容が実行される。

　図２を参照して、スクリプトエンジンの構成要素の働きについて説明する。図２は、スクリプトエンジンが有するＶＭの擬似コードを示す図である。図２に示すように、まず、擬似コードは、ＶＰＣを初期化している（１行目）。擬似コードでは、while文のループがインタプリタループである（２行目）。擬似コードでは、コードキャッシュからＶＰＣの指すＶＭオペコードが取得され（３行目）、Switch文を用いてデコード及びディスパッチされる（４、５、７行目）。そして、擬似コードでは、ディスパッチされた先の、ＶＭオペコードに対応したプログラムが実行される（６、８行目）。

　また、分岐ＶＭ命令とはスクリプト内で分岐を発生させるＶＭ命令であり、条件分岐フラグは、条件分岐時に分岐がなされるか否かのフラグを保持する領域である。

［解析機能付与装置］
　まず、本実施の形態に係る解析機能付与装置１０は、悪性のスクリプトエンジンバイナリに対して、分岐命令のフックと、メモリ操作命令のフックにより、ブランチトレースとメモリアクセストレースからなる実行トレースを取得する。ただし、ブランチトレースは、実行された分岐を記録したものであり、メモリアクセストレースは、実行されたメモリの読み書きを記録したものである。

　そして、この解析機能付与装置１０は、この実行トレースを解析し、インタプリタループを検出する。インタプリタループの検出には、実行時の条件を変えて取得した複数の実行トレースの差分を基に解析する差分実行解析と呼ばれる解析手法を適用する。この時、実行時の条件はテストスクリプトに異なるものを用いることで変更する。ここでは、分岐回数に着目した差分実行解析を用いる。ここで得られたインタプリタループの内部が、以降の解析対象となる。

　また、この解析機能付与装置１０は、実行トレースを解析し、ＶＰＣを検出する。解析機能付与装置は、ＶＰＣの検出には、メモリの読み込み回数に着目した差分実行解析を適用する。

　さらに、この解析機能付与装置１０は、スクリプトエンジンのバイナリを静的解析し、デコーダ・ディスパッチャを検出する。前提として、デコーダ・ディスパッチャは、Switch文またはジャンプテーブルや関数テーブルで実現される。こうしたSwitch文、ジャンプテーブル或いは関数テーブルを用いたテーブルジャンプは、静的解析で検出する手法が一般に知られているため、解析機能付与装置１０は、所定の方法でこれらを検出する。

　そして、この解析機能付与装置１０は、実行トレースを解析し、条件分岐フラグを検出する。解析機能付与装置１０は、条件分岐フラグの検出として、メモリの読み込みに着目した差分実行解析を適用する。

　続いて、この解析機能付与装置１０は、スクリプトエンジンバイナリに対して、ＶＰＣの監視と、デコーダ・ディスパッチャのＶＭオペコードの監視により、ＶＭ実行トレースを取得する。ただし、ＶＭ実行トレースは、実行されたＶＭオペコードと、ＶＰＣを記録したものである。

　この解析機能付与装置１０は、このＶＭ実行トレースを解析し、分岐ＶＭ命令を検出する。解析機能付与装置１０は、分岐ＶＭ命令の検出において、まず、多数のテストスクリプトを実行して、ＶＭ実行トレースを取得する。そして、解析機能付与装置１０は、ＶＭ実行トレースから、ＶＭオペコードと、その実行の前後でのＶＰＣの変化量を組にして収集する。ＶＭオペコードが分岐ＶＭ命令以外のものの場合、ＶＰＣの変化量は、ほぼ一定である。一方、ＶＭオペコードが分岐ＶＭ命令のものの場合、ＶＰＣは分岐先によってばらつきが生じる。解析機能付与装置１０は、ＶＭオペコードごとＶＰＣの変化量のばらつきを分散で評価し、分散が一定の閾値以上のものを、分岐ＶＭ命令として検出する。

　そして、解析機能付与装置１０は、ここまでで得られたＶＰＣ、分岐ＶＭ命令、及び、条件分岐フラグに基づいて、スクリプトエンジンのバイナリに対して、フックを施す。このフックによって、解析機能付与装置１０は、ＶＰＣが指す先を監視し、それが分岐ＶＭ命令であるとき、実行状態を分岐させる。そして、解析機能付与装置１０は、一方の実行状態をそのまま実行し、もう一方の実行状態は条件分岐フラグを書き換えた上で実行する。これによって、条件分岐の両方の実行経路が実行されるようになる。以上のようにして、解析機能付与装置１０は、クリプトエンジンへの後付けでのマルチパス機能の付与を実現する。

［解析機能付与装置の構成］
　続いて、図３を参照して、実施の形態に係る解析機能付与装置１０の構成について具体的に説明する。図３は、実施の形態に係る解析機能付与装置の構成の一例を説明する図である。

　図１に示すように、解析機能付与装置１０は、入力部１１、制御部１２、記憶部１３、出力部１４を有する。そして、解析機能付与装置１０は、テストスクリプト及びスクリプトエンジンバイナリの入力を受け付ける。

　入力部１１は、キーボードやマウス等の入力デバイスで構成され、外部からの情報の入力を受け付け、制御部１２に入力する。入力部１１は、テストスクリプト及びスクリプトエンジンバイナリの入力を受け付け、制御部１２に出力する。テストスクリプトは、スクリプトエンジンを動的解析して実行トレース及びＶＭ実行トレースを取得する際に、入力されるスクリプトである。なお、テストスクリプトの詳細は後述する。スクリプトエンジンバイナリは、スクリプトエンジンを構成する実行可能ファイルである。スクリプトエンジンバイナリは、複数の実行可能ファイルによって構成される場合がある。

　制御部１２は、各種の処理手順などを規定したプログラム及び所要データを格納するための内部メモリを有し、これらによって種々の処理を実行する。例えば、制御部１２は、ＣＰＵ（Central　Processing　Unit）やＭＰＵ（Micro　Processing　Unit）などの電子回路である。制御部１２は、仮想機械解析部１２１（第一の解析部）、命令セットアーキテクチャ解析部１２２（第二の解析部）及び解析機能付与部１２３（付与部）を有する。

　仮想機械解析部１２１は、スクリプトエンジンのＶＭを解析する。仮想機械解析部１２１は、実行時の条件を変えて複数の実行トレースを取得し、差分実行解析を用いて複数の実行トレースを解析し、ＶＰＣ及び条件分岐フラグを取得する。仮想機械解析部１２１は、実行トレース取得部１２１１（第一の取得部）、インタプリタループ検出部１２１２（第一の検出部）、仮想プログラムカウンタ検出部１２１３（第二の検出部）、デコーダ・ディスパッチャ検出部１２１４（第三の検出部）及び条件分岐フラグ検出部１２１５（第四の検出部）を有する。

　実行トレース取得部１２１１は、テストスクリプト及びスクリプトエンジンバイナリを入力として受け付ける。実行トレース取得部１２１１は、スクリプトエンジンバイナリの実行を監視しながら、テストスクリプトを実行することで、実行トレースを取得する。

　実行トレースは、ブランチトレースとメモリアクセストレースとによって構成される。ブランチトレースは、実行の際の分岐命令の種類と、分岐元アドレスと分岐先アドレスを記録する。メモリアクセストレースは、メモリ操作の種類と、操作対象のメモリアドレスを記録する。ブランチトレース及びメモリアクセストレースは、命令フックによって取得可能であることが知られている。実行トレース取得部１２１１が取得した実行トレースは、実行トレースＤＢ１３１に格納される。

　インタプリタループ検出部１２１２は、実行トレースＤＢ１３１に格納された第一のテストスクリプトに対する実行トレースを取り出して解析し、インタプリタループを検出する。インタプリタループ検出部１２１２は、各ＶＭ命令の実行後には、必ずインタプリタループの先頭を分岐先とする分岐が発生することを利用し、この分岐先を発見することで、インタプリタループを検出する。

　このため、インタプリタループ検出部１２１２は、インタプリタループの検出には、分岐の回数に着目した差分実行解析を用いる。インタプリタループ検出部１２１２は、繰り返し回数及び繰り返される文の数が異なる繰り返しを持った複数のテストスクリプトの実行トレースを比較し、分岐回数が繰り返し回数及び繰り返される文の数の両方に比例している分岐先を発見する。インタプリタループ検出部１２１２は、この分岐先をインタプリタループの先頭として検出する。

　仮想プログラムカウンタ検出部１２１３は、実行トレースＤＢ１３１に格納された第一のテストスクリプトに対する実行トレースを取り出して解析し、ＶＰＣを検出する。仮想プログラムカウンタ検出部１２１３は、各ＶＭ命令の実行後には、必ずＶＰＣを保持するメモリへの読み込みが発生することを利用し、この読み込み先を発見することで、ＶＰＣを検出する。

　このため、仮想プログラムカウンタ検出部１２１３は、ＶＰＣの検出として、メモリの読み込み回数に着目した差分実行解析を用いる。仮想プログラムカウンタ検出部１２１３は、インタプリタループの検出と同じテストスクリプトを用いて取得された複数のテストスクリプトの実行トレースを比較し、メモリ読み込み回数が繰り返される回数及び繰り返される文の数との両方に比例しているメモリを発見する。仮想プログラムカウンタ検出部１２１３は、このメモリをＶＰＣとして検出する。

　デコーダ・ディスパッチャ検出部１２１４は、スクリプトエンジンバイナリに対して、所定の静的解析により、インタプリタループ内に存在するSwitch文や関数テーブル、ジャンプテーブルを検出する。デコーダ・ディスパッチャ検出部１２１４は、これらの処理の命令列をデコーダ・ディスパッチャとして検出する。

　条件分岐フラグ検出部１２１５は、実行トレースＤＢ１３１に格納された第二のテストスクリプトに対する実行トレースを取り出して解析し、条件分岐フラグを発見する。条件分岐フラグ検出部１２１５は、メモリの読み込み回数に着目した差分実行解析を用いて、複数の実行トレースを解析し、条件分岐フラグを検出する。条件分岐フラグ検出部１２１５は、様々なパターンで条件分岐を実行し、その際のメモリの変化のパターンをテストスクリプト上の条件分岐のパターンと照らし合わせることで、条件分岐フラグを格納するメモリを検出する。

　命令セットアーキテクチャ解析部１２２は、ＶＭの命令の体系である命令セットアーキテクチャを解析する。命令セットアーキテクチャ解析部１２２は、ＶＭ実行トレース取得部１２２１（第二の取得部）及び分岐ＶＭ命令検出部１２２２（第五の検出部）を有する。

　ＶＭ実行トレース取得部１２２１は、実行トレース取得部１２１１と同じく、テストスクリプト及びスクリプトエンジンバイナリを入力として受け付ける。ＶＭ実行トレース取得部１２２１は、スクリプトエンジンバイナリの実行を監視しながら、テストスクリプトを実行することで、ＶＭ上で実行された実行トレースであるＶＭ実行トレースを取得する。

　ＶＭ実行トレースは、実行されたＶＭ命令ごとのＶＰＣとＶＭオペコードで構成される。ＶＰＣの記録は、仮想プログラムカウンタ検出部１２１３で検出されたＶＰＣのメモリを監視することで実現できる。ＶＭオペコードの記録は、デコーダ・ディスパッチャ検出部１２１４で検出されたデコーダに入力されるＶＭオペコードを監視することで実現できる。ＶＭ実行トレース取得部１２２１は、取得したＶＭ実行トレースは、ＶＭ実行トレースＤＢ１３３に格納される。

　分岐ＶＭ命令検出部１２２２は、ＶＭ実行トレースＤＢ１３３に格納されたＶＭ実行トレースを取り出して解析し、分岐ＶＭ命令を検出する。分岐ＶＭ命令検出部１２２２は、分岐ＶＭ命令とそれ以外のＶＭ命令とではＶＰＣの値のばらつきの大きさが異なることに着目し、閾値を決めて、よりＶＰＣの値のばらつきの大きいものを分岐ＶＭ命令として検出する。分岐ＶＭ命令検出部１２２２は、ＶＭ実行トレースのＶＭオペコードごとの仮想プログラムカウンタの変化量のばらつきによって、分岐ＶＭ命令を検出する。

　解析機能付与部１２３は、仮想機械解析部１２１及び命令セットアーキテクチャ解析部１２２による解析によって得られたアーキテクチャ情報に基づいて、スクリプトエンジンに、マルチパス実行機能を付与するフックを施す。解析機能付与部１２３は、得られたＶＰＣ、分岐ＶＭ命令及び条件分岐フラグを用いてスクリプトエンジンにフックを施す。このフックは、ＶＰＣを監視してＶＭオペコードを確認し、分岐ＶＭ命令のＶＭオペコードであれば、実行状態を分岐させるフックである。そして、このフックは、一方の実行状態はそのまま実行し、もう一方の実行状態は条件分岐フラグを書き換えて実行することで、スクリプトエンジンにマルチパス実行機能を付与するフックである。

　記憶部１３は、ＲＡＭ（Random　Access　Memory）、フラッシュメモリ（Flash　Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現され、解析機能付与装置１０を動作させる処理プログラムや、処理プログラムの実行中に使用されるデータなどが記憶される。記憶部１３は、実行トレースデータベース（ＤＢ）１３１、ＶＭ実行トレースＤＢ１３３及びアーキテクチャ情報ＤＢ１３２を有する。

　実行トレースＤＢ１３１及びＶＭ実行トレースＤＢ１３３は、それぞれ実行トレース取得部１２１１及びＶＭ実行トレース取得部１２２１によって取得された実行トレース及びＶＭ実行トレースを格納する。実行トレースＤＢ１３１及びＶＭ実行トレースＤＢ１３３は、解析機能付与装置１０によって管理される。もちろん、実行トレースＤＢ１３１及びＶＭ実行トレースＤＢ１３３は、他の装置（サーバ等）によって管理されていてもよく、この場合には、実行トレース取得部１２１１及びＶＭ実行トレース取得部１２２１は、出力部１４の通信インタフェースを介して、取得した実行トレース及びＶＭ実行トレースを、実行トレースＤＢ１３１及びＶＭ実行トレースＤＢ１３３の管理サーバ等に出力して、実行トレースＤＢ１３１及びＶＭ実行トレースＤＢ１３３に記憶させる。

　出力部１４は、例えば、液晶ディスプレイやプリンタ等であって、解析機能付与装置１０に関する情報を含む各種情報を出力する。また、出力部１４は、外部装置との間で、各種データの入出力を司るインタフェースであってもよく、外部装置に各種情報を出力してもよい。

［テストスクリプトの構成］
　テストスクリプトについて説明する。テストスクリプトは、スクリプトエンジンを動的解析する際に入力されるスクリプトである。このテストスクリプトは、分岐命令の実行やメモリ読み書きの回数に着目し、異なる回数のテストスクリプトを実行したときに生じるスクリプトエンジンの挙動の差分を捉えるために用いられる。このテストスクリプトは、解析の事前に準備するものであり、手動で作成するものである。この作成には、対象のスクリプト言語の仕様に関する知識が必要となる。

　図４は、インタプリタループの検出及びＶＰＣの検出に用いるテストスクリプト（第一のテストスクリプト）の一例を示す図である。第一のテストスクリプトでは、繰り返し処理を用いる（２行目）。第一のテストスクリプトでは、テストスクリプト内の繰り返し回数（２行目）や繰り返される文の数（３行目から５行目）を増減させることで、実行時の条件を変更し、差分を発生させる。

　図５は、分岐ＶＭ命令検出に用いるテストスクリプト（第二のテストスクリプト）の一例を示す図である。第二のテストスクリプトでは、複数回の条件分岐を用いる（４行目から８行目）。第二のテストスクリプトにおいて、この複数回の条件分岐では、特定の順序のパターンで分岐がなされたり、なされなかったりするように、分岐条件を制御する（１行目、５行目）。第二のテストスクリプトでは、条件分岐の回数や、分岐の成否の順序パターンを変更し、差分を発生させる。

［実行トレースの構成］
　次に、実行トレースについて説明する。図６は、実行トレースの一例を示す図である。実行トレースは、前述の通り、ブランチトレースとメモリアクセストレースによって構成されている。図６は、実行トレースの一例を示す図である。以降、図６を用いて実行トレースの構成を示す。

　実行トレースは、traceという要素を有する。traceには、そのログ行がブランチトレースか、メモリアクセストレースかが示される。

　ブランチトレースのログ行は、例えば、図６の１行目から１０行目に記載の書式になっており、type、src、dstの三つの要素からなる。typeは、実行された分岐命令がcall命令によるものか、jmp命令によるものか、ret命令によるものかを示す。また、srcは、分岐元のアドレスを示し、dstは、分岐先のアドレスを示す。

　メモリアクセストレースのログ行は、たとえば、図６の１１行目から１３行目に記載の書式になっており、type、target、valueの三つの要素からなる。typeは、メモリアクセスが読み込みか書き込みかを示す。targetは、メモリアクセスの対象となるメモリアドレスを示す。また、valueには、メモリアクセスの結果の値が格納される。

［ＶＭ実行トレースの構成］
　次に、ＶＭ実行トレースについて説明する。図７は、ＶＭ実行トレースの一例を示す図である。ＶＭ実行トレースは、前述の通り、ＶＭオペコードとＶＰＣとを記録したものである。図７は、ＶＭ実行トレースの一部を切り出したものである。以降、図７を用いてＶＭ実行トレースの構成を示す。

　ＶＭ実行トレースのログ行は、たとえば、図７に記載の書式になっており、vpc及びopcodeの二つの要素からなる。vpcは、ＶＰＣの値を示す。また、opcodeは、ＶＭオペコードの値を示す。

［インタプリタループ検出部の処理］
　次に、インタプリタループ検出部１２１２の処理について説明する。インタプリタループの検出は、取得した実行トレースのブランチトレースのログを解析することで実現される。インタプリタループでは一般に、ＶＭ命令の実行後に分岐命令でループの先頭に飛ぶ。このため、インタプリタループ検出部１２１２は、ブランチトレース中の分岐命令の分岐先アドレスの中から、インタプリタループの先頭に該当するものを検出する。インタプリタループ検出部１２１２は、分岐回数に着目した差分実行解析を用いる。

　インタプリタループ検出部１２１２は、第一のテストスクリプトに対応した実行トレースを用いる。インタプリタループの先頭への分岐の回数は、テストスクリプト内の繰り返し回数及び、繰り返し処理の中の文の数に比例する。繰り返しの回数をＮ、繰り返される文の数をＭとしたとき、概ねＭＮ程度のインタプリタループの先頭への分岐が発生する。このため、インタプリタループ検出部１２１２は、Ｎ及びＭをそれぞれ２Ｎと２Ｍ、３Ｎと３Ｍと増やした第一のテストスクリプトに対する実行トレースにおいて、４ＭＮ、９ＭＮという増え方をした分岐先を、インタプリタループの先頭として検出する。

［仮想プログラムカウンタ検出部の処理］
　次に、仮想プログラムカウンタ検出部１２１３の処理について説明する。仮想プログラムカウンタの検出は、取得した実行トレースのメモリアクセストレースのログを解析することで実現される。ＶＰＣは一般にメモリ上に格納されており、ＶＭ命令が実行されるたびに読み込まれるため、このメモリアドレスへの値の読み込みが発生する。このため、仮想プログラムカウンタ検出部１２１３は、メモリアクセストレース中のメモリ読み込みの対象アドレスの中から、ＶＰＣに該当するものを検出する。仮想プログラムカウンタ検出部１２１３は、メモリの読み込み回数に着目した差分実行解析を用いる。

　仮想プログラムカウンタ検出部１２１３は、第一のテストスクリプトに対応した実行トレースを用いる。ＶＰＣの読み込みの回数は、テストスクリプト内の繰り返し回数及び、繰り返し処理の中の文の数に比例する。繰り返しの回数をＮ、繰り返される文の数をＭとしたとき、概ねＭＮ程度のＶＰＣの読み込みが発生する。このため、インタプリタループ検出部１２１２は、Ｎ及びＭをそれぞれ２Ｎと２Ｍ、３Ｎと３Ｍと増やした第一のテストスクリプトに対する実行トレースにおいて、４ＭＮ、９ＭＮという増え方をしたメモリを、ＶＰＣとして検出する。

［デコーダ・ディスパッチャ検出部の処理］
　次に、デコーダ・ディスパッチャ検出部１２１４の処理について説明する。デコーダ・ディスパッチャ検出部１２１４は、スクリプトエンジンのバイナリを所定の手法で静的解析することで、デコーダ・ディスパッチャを検出する。

　デコーダ・ディスパッチャの実装には一般に、二つの種類が存在する。デコーダ・ディスパッチャの実装の一つ目の種類は、Switch文を用いた実装であり、二つ目の種類は、関数テーブルやジャンプテーブルを用いたテーブルジャンプによる実装である。Switch文及びテーブルジャンプの認識は、既存の静的解析の手法で実現できることが一般に知られている。このため、デコーダ・ディスパッチャ検出部１２１４は、所定の静的解析の手法で検出されたSwitch文及びテーブルジャンプのうち、インタプリタループ内に存在するものを、デコーダ・ディスパッチャとして検出する。

［条件分岐フラグ検出部の処理］
　次に、条件分岐フラグ検出部１２１５の処理について説明する。条件分岐フラグ検出部１２１５は、インタプリタループ内でのメモリアクセスを解析することで、条件分岐フラグを検出する。

　条件分岐フラグ検出部１２１５は、第二のテストスクリプトを用いて得られた実行トレースを用いる。条件分岐フラグ検出部１２１５は、インタプリタループ内でのメモリアクセスから、二段階の絞り込みをすることで、条件分岐フラグを検出する。条件分岐フラグには、分岐がなされるか、なされないかの二つの状態がある。また、条件分岐フラグは、条件分岐の回数に比例した回数、読み込まれると考えられる。

　このことから、条件分岐フラグ検出部１２１５は、一段階目の絞り込みとして、条件分岐の回数に比例した回数のメモリ読み込みがあるメモリを抽出する。そして、条件分岐フラグ検出部１２１５は、二段階目の絞り込みとして、各メモリ読み込み時の値が、テストスクリプトの条件分岐と対応付くように二つの値を行き来しているメモリを抽出する。

　例えば、条件分岐フラグが、分岐がなされる場合をＸ、なされない場合をＹで保持している場合、図５の第二のテストスクリプトでは、条件分岐の順序のパターンはなされる、なされない、なされる、なされる、なされないとなる。このため、条件分岐フラグ検出部１２１５は、Ｘ、Ｙ、Ｘ、Ｘ、Ｙと二つの値を行き来しているメモリアドレスを抽出する。条件分岐フラグ検出部１２１５は、これを分岐の回数を変更しながら繰り返すことにより、条件分岐フラグを検出する。

［分岐ＶＭ命令検出部の処理］
　次に、分岐ＶＭ命令検出部１２２２の処理について説明する。分岐ＶＭ命令検出部１２２２は、取得したＶＭ実行トレースのログを解析することで分岐ＶＭ命令を検出する。ここでのテストスクリプトは、分岐ＶＭ命令が含まれていればよいため、分岐の制御構文を含むスクリプトでありさえすればどのようなものでもよい。例えば、インターネット上から収集したり、公式ドキュメントから取得したりしてテストスクリプトを準備する。

　まず、分岐ＶＭ命令検出部１２２２は、ＶＭ実行トレースから、ＶＭ命令のオペコードと、命令の実行前後でのＶＰＣのオフセットとを、組として取得する。このオフセットｏは、命令の実行前のＶＰＣの値をｐ_ｐｒｅｖ、実行後の値をｐ_ｎｅｘｔとして、ｏ＝ｐ_ｎｅｘｔ－ｐ_ｐｒｅｖで算出される。

　ここで、あるＶＭ命令が分岐命令のとき、このオフセットは、分岐先に依存して変化する。一方、分岐命令以外のときは、オフセットは、ＶＭ命令のサイズに依存して変化する。このため、ＶＭ命令のオペコードとオフセットとの組を収集し、オペコードごとにオフセットの値を見たとき、分岐命令であれば分岐先によって様々な値にばらつき、分岐命令以外であればＶＭ命令のサイズという特定の値に集中する。

　したがって、分岐ＶＭ命令検出部１２２２は、このオフセットのばらつきを評価するため、分散ｓを用いる。あるオペコードに対するオフセットの集合ＯをＯ＝｛ｏ_０，ｏ_１，・・・，ｏ_Ｎ｝（オフセットｏの平均は（１）式を参照）とし、ｔを閾値としたとき、分岐命令か否かは、分散ｓ（（２）式を参照）を基に、（３）式のように判定される。これによって、分岐ＶＭ命令検出部１２２２は、分岐ＶＭ命令を検出する。

　なお、分岐以外のＶＭ命令では、ばらつきがほとんど見られず、分岐ＶＭ命令とそれ以外のＶＭ命令との境界は明確であることが多い。このため、閾値として、例えば、得られた分散の値を数直線上にプロットして、できた二つの群を分割可能な値が、設定される。

［解析機能付与部の処理］
　次に、解析機能付与部１２３の処理を説明する。解析機能付与部１２３は、スクリプトエンジンバイナリと、ここまでの処理で検出されたフックポイント及びタップポイントを入力として受け付ける。解析機能付与部１２３は、スクリプトエンジンに対して、フックポイントでのフックを施す。

　ここで、解析機能付与部１２３は、フック時に、フックに対応した言語要素が実行され、その引数としてのタップポイントのメモリがログ出力されるように、解析用のコードを挿入する。この解析用のコードは、フックポイントとタップポイントとが判明していれば、容易に生成できる。これによって、スクリプトが実行された際に、その挙動がログ出力されるようになり、解析機能の付与が実現される。

　このフックによる解析機能の付与は、スクリプトエンジンバイナリに対するバイナリを直接書き換えて実現してもよく、バイナリが実行されてプロセスメモリ上に展開された際にメモリイメージを書き換えて実現してもよい。

［解析機能付与装置の処理手順］
　次に、解析機能付与装置１０による解析機能付与処理の処理手順について説明する。図８は、実施の形態に係る解析機能付与処理の処理手順を示すフローチャートである。

　まず、入力部１１は、テストスクリプト及びスクリプトエンジンバイナリを入力として受け取る（ステップＳ１）。

　そして、実行トレース取得部１２１１は、スクリプトエンジンのバイナリを監視しながらテストスクリプトを実行してブランチトレースとメモリアクセストレースを取得する実行トレース取得処理を行う（ステップＳ２）。そして、インタプリタループ検出部１２１２は、実行トレースＤＢ１３１に格納された第一のテストスクリプトに対する実行トレースを取り出して解析し、インタプリタループを発見するインタプリタループ検出処理を行う（ステップＳ３）。

　仮想プログラムカウンタ検出部１２１３は、実行トレースＤＢ１３１に格納された第一のテストスクリプトに対する実行トレースを取り出して解析し、ＶＰＣを発見する仮想プログラムカウンタ検出処理を行う（ステップＳ４）。デコーダ・ディスパッチャ検出部１２１４は、スクリプトエンジンバイナリに対して、所定の静的解析により、インタプリタループ内に存在するSwitch文や関数テーブル、ジャンプテーブルを検出するデコーダ・ディスパッチャ検出処理を行う（ステップＳ５）。条件分岐フラグ検出部１２１５は、実行トレースＤＢ１３１に格納された第二のテストスクリプトに対する実行トレースを取り出して解析し、条件分岐フラグを発見する条件分岐検出処理を行う（ステップＳ６）。

　ＶＭ実行トレース取得部１２２１は、テストスクリプト及びスクリプトエンジンバイナリを入力として受け付け、スクリプトエンジンバイナリの実行を監視しながら、テストスクリプトを実行することで、ＶＭ実行トレースを取得するＶＭ実行トレース取得処理を行う（ステップＳ７）。分岐ＶＭ命令検出部１２２２は、ＶＭ実行トレースＤＢ１３３に格納されたＶＭ実行トレースを取り出して解析し、分岐ＶＭ命令を検出する分岐ＶＭ命令検出処理を行う（ステップＳ８）。

　解析機能付与部１２３は、得られたＶＰＣ、分岐ＶＭ命令及び条件分岐フラグを用いてスクリプトエンジンにフックを施す解析機能付与処理を行う（ステップＳ９）。そして、出力部１４は、マルチパス実行機能が付与されたスクリプトエンジンバイナリを出力する（ステップＳ１０）。

［実行トレース取得処理の処理手順］
　次に、図９に示す実行トレース取得処理の流れについて説明する。図９は、図８に示す実行トレース取得処理の処理手順を示すフローチャートである。

　まず、実行トレース取得部１２１１は、テストスクリプト及びスクリプトエンジンバイナリを入力として受け取る（ステップＳ１１）。そして、実行トレース取得部１２１１は、受け取ったスクリプトエンジンに対して、ブランチトレースを取得するためのフックを施す（ステップＳ１２）。また、実行トレース取得部１２１１は、受け取ったスクリプトエンジンに対して、メモリアクセストレースを取得するためのフックも施す（ステップＳ１３）。

　そして、実行トレース取得部１２１１は、その状態で受け取ったテストスクリプトをスクリプトエンジンに入力して実行させ（ステップＳ１４）、それによって取得される実行トレースを実行トレースＤＢ１３１に格納する（ステップＳ１５）。

　実行トレース取得部１２１１は、入力されたテストスクリプトを全て実行し終えているか否かを判定する（ステップＳ１６）。実行トレース取得部１２１１は、入力されたテストスクリプトを全て実行し終えている場合（ステップＳ１６：Ｙｅｓ）、処理を終了する。これに対し、実行トレース取得部１２１１は、入力されたテストスクリプトを全て実行していない場合（ステップＳ１６：Ｎｏ）、ステップＳ１４のテストスクリプトの実行に戻って処理を続ける。

［インタプリタループ検出処理の処理手順］
　次に、図８に示すインタプリタループ検出処理の流れについて説明する。図１０は、図８に示すインタプリタループ検出処理の処理手順を示すフローチャートである。

　まず、インタプリタループ検出部１２１２は、実行トレースＤＢ１３１から第一のテストスクリプトによる実行トレースを一つ取り出す（ステップＳ２１）。そして、インタプリタループ検出部１２１２は、実行トレースのうちのブランチトレースに着目し、分岐先ごとに分岐回数を数え上げる（ステップＳ２２）。続いて、インタプリタループ検出部１２１２は、実行トレースの取得に用いた第一のテストスクリプトを入力として受け取り（ステップＳ２３）、それを解析して繰り返しの回数と繰り返される文の数を取得する（ステップＳ２４）。

　インタプリタループ検出部１２１２は、実行トレースＤＢ１３１から、繰り返し回数や繰り返される文の数の異なる第一のテストスクリプトによる実行トレースを、さらに一つ取り出す（ステップＳ２５）。そして、インタプリタループ検出部１２１２は、ブランチトレースに着目し、分岐先ごとに分岐回数を数え上げる（ステップＳ２６）。また、インタプリタループ検出部１２１２は、実行トレースの取得に用いた第一のテストスクリプトを入力として受け取り（ステップＳ２７）、テストスクリプトを解析して繰り返しの回数と繰り返される文の数を取得する（ステップＳ２８）。

　そして、インタプリタループ検出部１２１２は、繰り返し回数や繰り返される文の増減に比例して分岐回数が変化する分岐先のみに絞り込む（ステップＳ２９）。インタプリタループ検出部１２１２は、分岐先を一つのみに絞り込めたか否かを判定する（ステップＳ３０）。

　インタプリタループ検出部１２１２は、分岐先を一つのみに絞り込めていない場合（ステップＳ３０：Ｎｏ）、ステップＳ２５に戻り、次の実行トレースを一つ取り出して処理を継続する。一方、インタプリタループ検出部１２１２は、分岐先を一つのみに絞り込めた場合（ステップＳ３０：Ｙｅｓ）、絞り込まれた分岐先をインタプリタループの先頭としてアーキテクチャ情報ＤＢ１３２に格納して（ステップＳ３１）、処理を終了する。

［仮想プログラムカウンタ検出処理の処理手順］
　次に、図８に示す仮想プログラムカウンタ検出処理の流れについて説明する。図１１は、図８に示す仮想プログラムカウンタ検出処理の処理手順を示すフローチャートである。

　まず、仮想プログラムカウンタ検出部１２１３は、実行トレースＤＢ１３１から第一のテストスクリプトによる実行トレースを一つ取り出す（ステップＳ４１）。続いて、仮想プログラムカウンタ検出部１２１３は、実行トレースのうちのメモリアクセストレースに着目し、メモリ読み込み先ごとに読み込み回数を数え上げる（ステップＳ４２）。

　仮想プログラムカウンタ検出部１２１３は、実行トレースの取得に用いた第一のテストスクリプトを入力として受け取り（ステップＳ４３）、その第一のテストスクリプトを解析して繰り返しの回数と繰り返される文の数とを取得する（ステップＳ４４）。

　続いて、仮想プログラムカウンタ検出部１２１３は、実行トレースＤＢ１３１から、繰り返し回数や繰り返される文の数の異なる第一のテストスクリプトによる実行トレースを、さらに一つ取り出す（ステップＳ４５）。そして、仮想プログラムカウンタ検出部１２１３は、メモリアクセストレースに着目し、メモリ読み込み先ごとに読み込み回数を数え上げる（ステップＳ４６）。また、仮想プログラムカウンタ検出部１２１３は、実行トレースの取得に用いた第一のテストスクリプトを入力として受け取り（ステップＳ４７）、テストスクリプトを解析して繰り返しの回数と繰り返される文の数を取得する（ステップＳ４８）。

　ここで、仮想プログラムカウンタ検出部１２１３は、繰り返し回数や繰り返される文の増減に比例して読み込み回数が変化するメモリ読み込み先のみに絞り込む（ステップＳ４９）。

　そして、仮想プログラムカウンタ検出部１２１３は、メモリ読み込み先を一つのみに絞り込めたか否かを判定する（ステップＳ５０）。仮想プログラムカウンタ検出部１２１３は、メモリ読み込み先を一つのみに絞り込めていない場合（ステップＳ５０：Ｎｏ）、ステップＳ４５に戻り、次の実行トレースを一つ取り出して処理を継続する。一方、仮想プログラムカウンタ検出部１２１３は、メモリ読み込み先を一つのみに絞り込めた場合（ステップＳ５０：Ｙｅｓ）、絞り込まれたメモリ読み込み先を仮想プログラムカウンタとしてアーキテクチャ情報ＤＢ１３２に格納して（ステップＳ５１）、処理を終了する。

［デコーダ・ディスパッチャ検出処理の処理手順］
　次に、図８に示すデコーダ・ディスパッチャ検出処理の流れについて説明する。図１２は、図８に示すデコーダ・ディスパッチャ検出処理の処理手順を示すフローチャートである。

　まず、デコーダ・ディスパッチャ検出部１２１４は、スクリプトエンジンバイナリを入力として受け取る（ステップＳ６１）。そして、デコーダ・ディスパッチャ検出部１２１４はアーキテクチャ情報ＤＢ１３２から、インタプリタループの情報を取り出す（ステップＳ６２）。

　続いて、デコーダ・ディスパッチャ検出部１２１４は、インタプリタループ内のSwitch文及びテーブルジャンプを、所定の静的解析で検出する（ステップＳ６３）。デコーダ・ディスパッチャ検出部１２１４は、検出されたSwitch文またはテーブルジャンプをデコーダ・ディスパッチャとして、アーキテクチャ情報ＤＢ１３２に格納し（ステップＳ６４）、処理を終了する。

［条件分岐フラグ検出処理の処理手順］
　次に、図８に示す条件分岐フラグ検出処理の流れについて説明する。図１３は、図８に示す条件分岐フラグ検出処理の処理手順を示すフローチャートである。

　まず、条件分岐フラグ検出部１２１５は、実行トレースＤＢ１３１から第二のテストスクリプトによる実行トレースを一つ取り出す（ステップＳ７１）。そして、条件分岐フラグ検出部１２１５は、メモリアクセストレースに着目し、メモリ読み込み先ごとに読み込み回数を数え上げる（ステップＳ７２）。

　また、条件分岐フラグ検出部１２１５は、実行トレースの取得に用いた第二のテストスクリプトを、入力として受け取り（ステップＳ７３）、この第二のテストスクリプトを解析して、条件分岐の回数とTrue／Falseの順序パターンを取得する（ステップＳ７４）。そして、条件分岐フラグ検出部１２１５は、条件分岐の回数に比例して読み込み回数が変化するメモリ読み込み先のみに絞り込む（ステップＳ７５）。さらに、条件分岐フラグ検出部１２１５は、読み込んだメモリの値がTrue／Falseの順序パターンに合わせて二つの値を行き来しているメモリ読み込み先のみに絞り込む（ステップＳ７６）。

　条件分岐フラグ検出部１２１５は、メモリ読み込み先を一つのみに絞り込めたか否かを判定する（ステップＳ７７）。条件分岐フラグ検出部１２１５は、メモリ読み込み先を一つのみに絞り込めていない場合（ステップＳ７７：Ｎｏ）、ステップＳ７１に戻り、次の実行トレースを一つ取り出して処理を継続する。一方、条件分岐フラグ検出部１２１５は、メモリ読み込み先を一つのみに絞り込めた場合（ステップＳ７７：Ｙｅｓ）、絞り込まれた読み込み先を仮想プログラムカウンタとしてアーキテクチャ情報ＤＢ１３２に格納し（ステップＳ７８）、処理を終了する。

［ＶＭ実行トレース取得処理の処理手順］
　次に、図８に示すＶＭ実行トレース取得処理の流れについて説明する。図１４は、図８に示すＶＭ実行トレース取得処理の処理手順を示すフローチャートである。

　まず、ＶＭ実行トレース取得部１２２１は、テストスクリプト及びスクリプトエンジンバイナリを入力として受け取る（ステップＳ８１）。そして、ＶＭ実行トレース取得部１２２１は、受け取ったスクリプトエンジンに対して、ＶＰＣ及びＶＭオペコードを記録するためのフックを施す（ステップＳ８２）。

　ＶＭ実行トレース取得部１２２１は、その状態で受け取ったテストスクリプトをスクリプトエンジンに入力して実行させ（ステップＳ８３）、それによって取得されるＶＭ実行トレースをＶＭ実行トレースＤＢ１３３に格納する（ステップＳ８４）。

　ＶＭ実行トレース取得部１２２１は、入力されたテストスクリプトを全て実行したか否かを判定する（ステップＳ８５）。ＶＭ実行トレース取得部１２２１は、入力されたテストスクリプトを全て実行し終えている場合（ステップＳ８５：Ｙｅｓ）、処理を終了する。ＶＭ実行トレース取得部１２２１は、入力されたテストスクリプトを全て実行し終えていない場合（ステップＳ８５：Ｎｏ）、ステップＳ８３のテストスクリプトの実行に戻って処理を続ける。

［分岐ＶＭ命令検出処理の処理手順］
　次に、図８に示す分岐ＶＭ命令検出処理の流れについて説明する。図１５は、図８に示す分岐ＶＭ命令検出処理の処理手順を示すフローチャートである。

　まず、分岐ＶＭ命令検出部１２２２は、ＶＭ実行トレースＤＢ１３３から、ＶＭ実行トレースを一つ取り出す（ステップＳ９１）。そして、分岐ＶＭ命令検出部１２２２は、ＶＭオペコードごとに、実行の前後でのＶＰＣの変化量を集計する（ステップＳ９２）。

　分岐ＶＭ命令検出部１２２２は、ＶＭ実行トレースＤＢ１３３の全てのＶＭ実行トレースを処理し終えたか否かを判定する（ステップＳ９３）。ＶＭ実行トレースＤＢ１３３の全てのＶＭ実行トレースを処理し終えていない場合（ステップＳ９３：Ｎｏ）、分岐ＶＭ命令検出部１２２２は、ステップＳ９１に戻り、次のＶＭ実行トレースを一つ取り出して処理する。

　ＶＭ実行トレースＤＢ１３３の全てのＶＭ実行トレースを処理し終えている場合（ステップＳ９３：Ｙｅｓ）、分岐ＶＭ命令検出部１２２２は、ＶＭオペコードごとにＶＰＣの変化量の分散を算出する（ステップＳ９４）。そして、分岐ＶＭ命令検出部１２２２は、閾値を入力として受け取る（ステップＳ９５）。分岐ＶＭ命令検出部１２２２は、分散が閾値よりも大きいＶＭオペコードのみに絞り込み（ステップＳ９６）、それらを分岐ＶＭ命令としてアーキテクチャ情報ＤＢ１３２に格納して（ステップＳ９７）、処理を終了する。

［解析機能付与処理の処理手順］
　次に、図８に示す解析機能付与処理の流れについて説明する。図１５は、図８に示す解析機能付与処理の処理手順を示すフローチャートである。

　まず、解析機能付与部１２３は、スクリプトエンジンバイナリを入力として受け取る（ステップＳ１０１）。そして、解析機能付与部１２３はアーキテクチャ情報ＤＢ１３２からＶＰＣ、条件分岐フラグ、条件分岐ＶＭ命令を取り出す（ステップＳ１０２）。続いて、解析機能付与部１２３は、スクリプトエンジンのフックポイントにフックを施す（ステップＳ１０３）。解析機能付与部１２３は、このフック時に、マルチパス実行用コードが実行されるよう、コードを生成してスクリプトエンジンに挿入する（ステップＳ１０４）。解析機能付与部１２３は、こうして得られたフックの施されたスクリプトエンジンを、マルチパス実行機能付きのスクリプトエンジンとして出力し（ステップＳ１０５）、処理を終了する。

［実施の形態の効果］
　このように、本実施の形態に係る解析機能付与装置１０は、スクリプトエンジンのＶＭを解析し、ＶＭの命令の体系である命令セットアーキテクチャを解析し、これらの解析によって得られたアーキテクチャ情報に基づいてスクリプトエンジンに、マルチパス実行機能を付与するフックを施す。

　具体的には、解析機能付与装置１０は、スクリプトエンジンのバイナリを監視しながらテストスクリプトを実行してブランチトレースとメモリアクセストレースを取得する。そして、解析機能付与装置１０は、その実行トレースに基づいて仮想機械を解析し、インタプリタループ、ＶＰＣ、デコーダ・ディスパッチャ、条件分岐フラグのアーキテクチャ情報を取得する。さらに、解析機能付与装置１０は、テストスクリプトを実行してＶＭ実行トレースを取得し、そのＶＭ実行トレースを用いて命令セットアーキテクチャを解析して分岐ＶＭ命令をアーキテクチャ情報として取得する。その後、解析機能付与装置１０は、得られたアーキテクチャ情報を基にスクリプトエンジンにマルチパス実行機能を付与する。

　これによって、解析機能付与装置１０は、バイナリのみしか手に入らないプロプライエタリなスクリプトエンジンに対しても、実行トレース及びＶＭ実行トレースの取得に基づく解析により各種アーキテクチャ情報を検出し、人手でのリバースエンジニアリングを要することなく、マルチパス実行機能の付与を実現できる。

　また、解析機能付与装置１０は、多様なスクリプトエンジンに対して、テストスクリプトさえ用意すれば自動でマルチパス実行機能を付与できるため、個別の設計や実行をようすることなく、マルチパス実行機能の付与を実現できる。

　さらに、解析機能付与装置１０は、条件分岐などの詳細なアーキテクチャを考慮しているため、スクリプトの条件分岐に対して正確なマルチパス実行機能の付与を実現できる。

　このように、解析機能付与装置１０によれば、スクリプトエンジンを解析し、マルチパス実行機能を後付けで付与することにより、多種多様なスクリプト言語のスクリプトエンジンに対して、マルチパス実行機能の自動的な付与を実現できる。

　上述したように、解析機能付与装置１０は、多種多様なスクリプト言語で記述される悪性スクリプトの挙動の解析に有用であり、特定の条件を満たさなければ実行されない経路を持った悪性スクリプトに対して、その影響を受けずに、挙動を網羅的に解析することに適している。したがって、本実施の形態を用いて、様々なスクリプトエンジンにマルチパス実行機能を付与することによって、悪性スクリプトの挙動を解析して検知などの対策に生かすことが可能である。

［実施形態のシステム構成について］
　図３に示す解析機能付与装置１０の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、解析機能付与装置１０の機能の分散及び統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散または統合して構成することができる。

　また、解析機能付与装置１０においておこなわれる各処理は、全部または任意の一部が、ＣＰＵ及びＣＰＵにより解析実行されるプログラムにて実現されてもよい。また、解析機能付与装置１０においておこなわれる各処理は、ワイヤードロジックによるハードウェアとして実現されてもよい。

　また、実施の形態において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的に行うこともできる。もしくは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上述及び図示の処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて適宜変更することができる。

［プログラム］
　図１７は、プログラムが実行されることにより、解析機能付与装置１０が実現されるコンピュータの一例を示す図である。コンピュータ１０００は、例えば、メモリ１０１０、ＣＰＵ１０２０を有する。また、コンピュータ１０００は、ハードディスクドライブインタフェース１０３０、ディスクドライブインタフェース１０４０、シリアルポートインタフェース１０５０、ビデオアダプタ１０６０、ネットワークインタフェース１０７０を有する。これらの各部は、バス１０８０によって接続される。

　メモリ１０１０は、ＲＯＭ１０１１及びＲＡＭ１０１２を含む。ＲＯＭ１０１１は、例えば、ＢＩＯＳ（Basic　Input　Output　System）等のブートプログラムを記憶する。ハードディスクドライブインタフェース１０３０は、ハードディスクドライブ１０９０に接続される。ディスクドライブインタフェース１０４０は、ディスクドライブ１１００に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ１１００に挿入される。シリアルポートインタフェース１０５０は、例えばマウス１１１０、キーボード１１２０に接続される。ビデオアダプタ１０６０は、例えばディスプレイ１１３０に接続される。

　ハードディスクドライブ１０９０は、例えば、ＯＳ１０９１、アプリケーションプログラム１０９２、プログラムモジュール１０９３、プログラムデータ１０９４を記憶する。すなわち、解析機能付与装置１０の各処理を規定するプログラムは、コンピュータ１０００により実行可能なコードが記述されたプログラムモジュール１０９３として実装される。プログラムモジュール１０９３は、例えばハードディスクドライブ１０９０に記憶される。例えば、解析機能付与装置１０における機能構成と同様の処理を実行するためのプログラムモジュール１０９３が、ハードディスクドライブ１０９０に記憶される。なお、ハードディスクドライブ１０９０は、ＳＳＤ（Solid　State　Drive）により代替されてもよい。

　また、上述した実施の形態の処理で用いられる設定データは、プログラムデータ１０９４として、例えばメモリ１０１０やハードディスクドライブ１０９０に記憶される。そして、ＣＰＵ１０２０が、メモリ１０１０やハードディスクドライブ１０９０に記憶されたプログラムモジュール１０９３やプログラムデータ１０９４を必要に応じてＲＡＭ１０１２に読み出して実行する。

　なお、プログラムモジュール１０９３やプログラムデータ１０９４は、ハードディスクドライブ１０９０に記憶される場合に限らず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ１１００等を介してＣＰＵ１０２０によって読み出されてもよい。あるいは、プログラムモジュール１０９３及びプログラムデータ１０９４は、ネットワーク（ＬＡＮ（Local　Area　Network）、ＷＡＮ（Wide　Area　Network）等）を介して接続された他のコンピュータに記憶されてもよい。そして、プログラムモジュール１０９３及びプログラムデータ１０９４は、他のコンピュータから、ネットワークインタフェース１０７０を介してＣＰＵ１０２０によって読み出されてもよい。

　以上、本発明者によってなされた発明を適用した実施の形態について説明したが、本実施の形態による本発明の開示の一部をなす記述及び図面により本発明は限定されることはない。すなわち、本実施の形態に基づいて当業者等によりなされる他の実施の形態、実施例及び運用技術等はすべて本発明の範疇に含まれる。

　１　スクリプトエンジン
　２　バイトコードコンパイラ
　３　仮想機械（ＶＭ）
　４　構文解析部
　５　バイトコード生成部
　６　コードキャッシュ部
　７　フェッチ部
　８　デコード部
　９　実行部
　１０　解析機能付与装置
　１１　入力部
　１２　制御部
　１３　記憶部
　１４　出力部
　１２１　仮想機械解析部
　１２２　命令セットアーキテクチャ解析部
　１２３　解析機能付与部
　１３１　実行トレースデータベース（ＤＢ）
　１３２　アーキテクチャ情報ＤＢ
　１３３　ＶＭ実行トレースＤＢ
　１２１１　実行トレース取得部
　１２１２　インタプリタループ検出部
　１２１３　仮想プログラムカウンタ検出部
　１２１４　デコーダ・ディスパッチャ検出部
　１２１５　条件分岐フラグ検出部
　１２２１　ＶＭ実行トレース取得部
　１２２２　分岐ＶＭ命令検出部

Claims

　悪性のスクリプトエンジンの仮想機械を解析する第一の解析部と、
　前記仮想機械の命令の体系である命令セットアーキテクチャを解析する第二の解析部と、
　前記第一の解析部及び前記第二の解析部による解析によって得られたアーキテクチャ情報に基づいて、スクリプトエンジンに、マルチパス実行機能を付与するフックを施す付与部と、
　を有することを特徴とする解析機能付与装置。
　前記アーキテクチャ情報は、前記仮想機械の命令が実行されるたびにメモリから読み込まれる対象アドレスである仮想プログラムカウンタ、実行状態の条件分岐時に分岐がなされるか否かのフラグを保持する領域である条件分岐フラグ、及び、実行状態の分岐を発生させる仮想機械命令である分岐仮想機械命令であることを特徴とする請求項１に記載の解析機能付与装置。
　前記第一の解析部及び前記第二の解析部は、テスト用のスクリプトを用いた解析を実施することを特徴とする請求項１または２に記載の解析機能付与装置。
　前記第一の解析部は、
　実行時の条件を変えて複数の実行トレースを取得する第一の取得部を有し、
　差分実行解析を用いて前記複数の実行トレースを解析し、前記仮想プログラムカウンタ及び前記条件分岐フラグを取得することを特徴とする請求項２に記載の解析機能付与装置。
　前記第一の解析部は、
　前記複数の実行トレースを解析し、インタプリタループを検出する第一の検出部と、
　メモリの読み込み回数に着目した差分実行解析を用いて前記複数の実行トレースを解析し、前記仮想プログラムカウンタを検出する第二の検出部と、
　スクリプトエンジンのバイナリを静的解析し、デコーダ・ディスパッチャを検出する第三の検出部と、
　メモリの読み込み回数に着目した差分実行解析を用いて前記複数の実行トレースを解析し、前記条件分岐フラグを検出する第四の検出部と、
　を有することを特徴とする請求項４に記載の解析機能付与装置。
　前記第二の解析部は、
　前記仮想機械において実行された実行トレースである仮想機械実行トレースを取得する第二の取得部と、
　前記仮想機械実行トレースの仮想機械オペコードごとの仮想プログラムカウンタの変化量のばらつきによって、前記分岐仮想機械命令を検出する第五の検出部と、
　を有することを特徴とする請求項２に記載の解析機能付与装置。
　解析機能付与装置が実行する解析機能付与方法であって、
　悪性のスクリプトエンジンの仮想機械を解析する第一の解析工程と、
　前記仮想機械の命令の体系である命令セットアーキテクチャを解析する第二の解析工程と、
　前記第一の解析工程及び前記第二の解析工程における解析によって得られたアーキテクチャ情報に基づいて、スクリプトエンジンに、マルチパス実行機能を付与するフックを施す付与工程と、
　を含んだことを特徴とする解析機能付与方法。
　悪性のスクリプトエンジンの仮想機械を解析する第一の解析ステップと、
　前記仮想機械の命令の体系である命令セットアーキテクチャを解析する第二の解析ステップと、
　前記第一の解析ステップ及び前記第二の解析ステップにおける解析によって得られたアーキテクチャ情報に基づいて、スクリプトエンジンに、マルチパス実行機能を付与するフックを施す付与ステップと、
　をコンピュータに実行させるための解析機能付与プログラム。