WO2012053284A1

WO2012053284A1 - オブジェクトへのアクセスを検出する方法、並びにそのコンピュータ及びコンピュータ・プログラム

Info

Publication number: WO2012053284A1
Application number: PCT/JP2011/069484
Authority: WO
Inventors: 怜大平
Original assignee: インターナショナル・ビジネス・マシーンズ・コーポレーション
Priority date: 2010-10-20
Filing date: 2011-08-29
Publication date: 2012-04-26
Also published as: DE112011103536T5; GB201307566D0; US20120102284A1; GB2498484A

Abstract

本発明は、オブジェクトへのアクセスを効率良く行うことを目的とする。本発明は、オブジェクトへのアクセスを検出する方法、並びにそのコンピュータ及びコンピュータ・プログラムを提供する。当該方法は、上記オブジェクトへのポインタを操作して、当該ポインタを読み書き保護領域を指すポインタに変換するステップと、当該読み書き保護領域へのアクセス要求に応じて例外が発生することを利用して、上記変換されたポインタから元のポインタへ逆変換するステップとを含む。また、上記逆変換するステップは、上記例外が発生した命令を参照して、当該例外が発生した命令から、上記操作されたポインタを取得するステップと、当該取得されたポインタを逆変換して、当該逆変換された元のポインタが指すオブジェクトの先頭へのポインタを取得するステップとを含みうる。

Description

オブジェクトへのアクセスを検出する方法、並びにそのコンピュータ及びコンピュータ・プログラム

　本発明は、コンピュータのメモリに保管されたオブジェクトへのアクセスを検出する技法に関し、特には変形されたオブジェクト・フォーマットを有するオブジェクトへのアクセスを検出する技法に関する。

　多くのプログラムでは、メモリのヒープ領域に多数のオブジェクトが動的に割り付けられる。当該オブジェクト・フォーマットは、例えば現在のＪａｖａ（商標）仮想マシン（Virtual
Machine）実装においてプログラム実行を通じて固定されている。当該固定されたオブジェクト・フォーマットは、例えばヘッダ及びデータ・フィールドのレイアウト、並びにそれらのサイズである。ここで、メモリー・フットプリント（メモリ使用量）、メモリ帯域幅、キャッシュ・ミス、ガーベジ・コレクション（ＧＣ）頻度、及びＧＣオーバーヘッドを減少させることが、上記プログラムを実行するコンピュータのコストを減少させる上で有用である。そこで、上記固定されたオブジェクト・フォーマット（以下、「通常のオブジェクト・フォーマット」又は「元のオブジェクト・フォーマット」ともいう）を、上記コストを減少させるように変形し、上記プログラムに適用可能な多くのオブジェクト・フォーマット（以下、「変形されたオブジェクト・フォーマット」ともいう）が開発されている（下記図４～図６を参照）。

　オブジェクト・フォーマットが通常と異なり変形されている場合に、全てのアクセスでオブジェクト・フォーマットを確認する必要がある。しかしながら、全てのアクセスにおいてオブジェクト・フォーマットを確認することは、ランタイム・オーバーヘッドを生じ、しかもシステムのコスト面で不利である。

　また、オブジェクト・フォーマットが通常と異なり変形されている場合に、変形されたオブジェクト・フォーマットを有するオブジェクトを含むページを保護する必要がある。そのために、変形されたフォーマットを有するオブジェクトを回復するに際して、上記ページ中に含まれる全てのオブジェクト（当該変形されたフォーマットを有するオブジェクトを含む）が回復されなければならない（下記特許文献１及び下記図８を参照）。また、当該保護の他の例においては、ハードウェアのサポートが必要とされる（下記非特許文献１を参照）。

　特許文献１の発明は、メモリ領域に存在し所定の期間アクセスされないオブジェクトを隔離してメモリ領域を有効に使用するための方法に関し、特に、ヒープメモリ中に存在するオブジェクトを隔離するための方法に関する（段落０００１）。特許文献１は、もしもユーザプログラムから準アクセス不可領域にアクセスがあった場合はシグナル・ハンドラに制御が移り、シグナル・ハンドラ中ではアクセスした仮想メモリアドレスが取得できるので、オブジェクトを同定してアクセスフラグを立てること、及び、次のＧＣの時にアクセスフラグが立っているオブジェクトは通常のヒープメモリ領域に戻してフラグをクリアすることを記載する（段落０１１４）。

　下記特許文献２の発明は、マルチタスク処理が可能なマルチタスク制御方法及び記憶媒体に関する（段落０００１）。特許文献２は、割込みシグナル等の事象が発生した場合に、シグナル・ハンドラが割込みの発生を検出すると、シグナル・ハンドラはスーパーシグナルスレッドへ割り込みイベントの発生を通知する旨を記載する（段落００６４）。

　下記非特許文献２は、オブジェクトの圧縮方法を開示する。

　下記非特許文献３は、永続的なオブジェクトへのアクセス方法を開示する。

特開２０１０－０１５２２３号公報特開２０００－０６６９０４号公報

Cliff Click et al., "The Pauseless GC Algorithm", ［online］, VEE’05,pp. 46 - 56, June 11-12, 2005, インターネット〈URLhttps://www.usenix.org/events/vee05/full_papers/p46-click.pdf〉 Jennifer B. Sartor et al., "No Bit Left Behind: The Limits of HeapData Compression", ［online］, ISMM’08, pp. 111-120, June 7-8, 2008, インターネット〈URLhttp://www.cs.utexas.edu/~jbsartor/ismm08-limits-compression.pdf〉 Charles Lamb et al., "THE OBJECT STORE DATABASE SYSTEM",Communication of the ACM, Vol. 34, No. 10, pp. 50-63, October 1991

　本発明は、コンピュータのメモリに保管されたオブジェクトへのアクセスを効率良く行うことを目的とする。特には、本発明は、変形されたオブジェクト・フォーマットを有するオブジェクトへのアクセスを効率良く行うことを目的とする。

　本発明は、オブジェクトへのアクセスを検出する方法、並びにコンピュータ・プログラム及びコンピュータを提供する。本発明は、オブジェクトへのポインタを操作して、当該ポインタを読み書き保護領域を指すポインタに変換し、当該読み書き保護領域へのアクセス要求に応じて例外が発生することを利用して、上記変換されたポインタから元のポインタへ逆変換することを特徴とする。当該逆変換によって元のポインタが回復されるので、元のポインタが指すオブジェクトを検出すること、そして当該元のポインタが指すオブジェクトへアクセスすることが可能になる。

　また、本発明の１つの実施態様では、上記逆変換は、例外が発生した命令を参照して、当該例外が発生した命令から、上記操作されたポインタを取得すること、当該取得されたポインタを逆変換して、当該逆変換された元のポインタが指すオブジェクトの先頭へのポインタを取得することを含む。当該逆変換された元のポインタが指すオブジェクトの先頭へのポインタを取得することによって、上記元のポインタが指すオブジェクトを検出すること、そして当該元のポインタが指すオブジェクトへアクセスすることが可能になる。

　また、本発明のさらに別の実施態様では、上記逆変換された元のポインタが指すオブジェクトのヘッダ情報を参照して、当該逆変換された元のポインタが指すオブジェクト（参照されたヘッダ情報を有するオブジェクトでもある）のフォーマットに適した処理が行われうる。当該処理は、例えば、アクセスされる圧縮されたオブジェクトの伸長、又は、アクセスされるオブジェクトの遅延割り当てである。

　本発明の実施態様に従うと、読み書き保護領域へのアクセス要求に応じて例外が発生することを利用して、元のポインタが回復されるので当該元のポインタがアクセスするオブジェクトへ効率良くアクセスを行うことが可能である。また、本発明の実施態様に従うと、逆変換された元のポインタが指すオブジェクトの先頭へのポインタを取得することが可能であるので、元のポインタが指すオブジェクトを容易に検出することが可能である。また、本発明の実施態様に従うと、逆変換された元のポインタが指すオブジェクトのヘッダ情報を参照し、当該参照されたヘッダ情報を有するオブジェクトのフォーマットに適した処理が行われるので、オブジェクト・フォーマットが通常と異なり変形されている場合であっても、当該異なるフォーマットを有するオブジェクトへ容易にアクセスすることが可能である。このことは、通常のオブジェクト・フォーマットに比べてメモリ使用量の少ないフォーマットを採用することを可能にし、さらにこのことはシステムのコストの低減ないしは処理速度の向上をもたらす。

本発明の実施形態におけるコンピュータ・ハードウェアの基本的なブロック図を示す。図１に示すコンピュータ・ハードウェアの機能を有し、本発明の実施態様に従うシステムの機能ブロック図を示す。オブジェクト、及びオブジェクトへのポインタの例を示す。通常のオブジェクト・フォーマットが、圧縮により変形されたオブジェクト・フォーマットの例を示す。通常のオブジェクト・フォーマットが、ポインタを使用して文字配列を指定することにより変形されたオブジェクト・フォーマットの例を示す。通常のオブジェクト・フォーマットが、フィールド再配置により変形されたオブジェクト・フォーマットの例を示す。従来技術である、永続的なオブジェクト・データベース方式における、オブジェクトへのアクセス方法を示す。従来技術である、永続的なオブジェクト・データベース方式における、圧縮されたオブジェクトへのアクセス方法を示す。本発明の実施態様に従う、ポインタを読み書き保護領域を指すように変換した場合のオブジェクトへのアクセス方法を示す。本発明の実施態様に従う、ポインタを読み書き保護領域を指すように変換した場合のオブジェクトへのアクセス方法を示す。本発明の実施態様に従う、オブジェクトへのポインタを、読み書き保護領域を指すように変換する例を示す。本発明の実施態様に従う、読み書き保護領域がヒープ領域と同じサイズである場合におけるバリア・ポインタの例を示す。本発明の実施態様に従う、読み書き保護領域がヒープ領域よりも小さいサイズである場合におけるバリア・ポインタの例を示す。本発明の実施態様に従う、読み書き保護領域がＯＳ保護領域である場合におけるバリア・ポインタの例を示す。本発明の実施態様に従う、オブジェクトへのアクセスを検出する方法のフローチャートを示す。本発明の実施態様に従う、オブジェクトの先頭へのポインタ値を格納するスロットを使用してメモリ・アクセス例外を処理するアルゴリズムのフローチャートを示す。本発明の実施態様に従う、オブジェクトの割り付けにおいて、オブジェクトへのポインタを読み書き保護領域を指すように変換するアルゴリズムのフローチャートを示す。本発明の実施態様に従う、ガーベジ・コレクションにおいて、オブジェクトへのポインタを読み書き保護領域を指すように変換するアルゴリズムのフローチャートを示す。本発明の実施態様である、図１７のステップ１７０１（ＧＣ開始前）における仮想アドレス・スペースを示す。本発明の実施態様である、図１７のステップ１７０３における仮想アドレス・スペースを示す。本発明の実施態様である、図１７のステップ１７０４及び１７０５を通じて処理される場合における仮想アドレス・スペース、並びに要素Ｐ及び集合Ｓの内容を示す。本発明の実施態様である、図１７のステップ１７０７、１７０９及び１７１０を通じて処理される場合における仮想アドレス・スペース、並びに要素Ｐ及び集合Ｓの内容を示す。本発明の実施態様である、図１７のステップ１７０４、１７０５、１７０７、１７０９及び１７１０を通じて処理される場合における仮想アドレス・スペース、並びに要素Ｐ及び集合Ｓの内容を示す。本発明の実施態様である、図１７のステップ１７０４、１７０５、１７０７及び１７０８を通じて処理される場合における仮想アドレス・スペース、並びに要素Ｐ及び集合Ｓの内容を示す。本発明の実施態様である、図１７のステップ１７０８、１７０９、１７１０、１７０４、１７０５、１７０７及び１７０８を通じて処理される場合における仮想アドレス・スペース、並びに要素Ｐ及び集合Ｓの内容を示す。本発明の実施態様である、図１７のステップ１７０９、１７１０、１７０４及び１７０６を通じて処理される場合における仮想アドレス・スペース、並びに要素Ｐ及び集合Ｓの内容を示す。本発明の実施態様に従う、シグナル・ハンドラを呼び出して、変換されたポインタから元のポインタを回復（逆変換）させる動作の例を示す。本発明の実施態様に従う、シグナル・ハンドラ・アルゴリズムの例を示す。本発明の実施態様に従う、オブジェクトへのアクセスの頻度とオーバーヘッドとの関係についての実験結果を示す。

　本発明の実施形態を、以下に図面に従って説明する。以下の図を通して、特に断らない限り、同一の符号は同一の対象を指す。本発明の実施形態は、本発明の好適な態様を説明するためのものであり、本発明の範囲をここで示すものに限定する意図はないことを理解されたい。

　図１は、本発明の実施形態におけるコンピュータ・ハードウェアの基本的なブロック図を示す。
　コンピュータ（１０１）は、ＣＰＵ（１０２）とメイン・メモリ（１０３）とを備えており、これらはバス（１０４）に接続されている。ＣＰＵ（１０２）は好ましくは、３２ビット又は６４ビットのアーキテクチャに基づくものであり、例えば、インテル社のＣｏｒｅ　ｉ（商標）シリーズ、Ｃｏｒｅ　２（商標）シリーズ、Ａｔｏｍ（商標）シリーズ、Ｘｅｏｎ（商標）シリーズ、Ｐｅｎｔｉｕｍ（登録商標）シリーズ、Ｃｅｌｅｒｏｎ（登録商標）シリーズ、ＡＭＤ社のＰｈｅｎｏｍ（商標）シリーズ、Ａｔｈｌｏｎ（商標）シリーズ、Ｔｕｒｉｏｎ（商標）シリーズ又はＳｅｍｐｒｏｎ（商標）が使用されうる。バス（１０４）には、ディスプレイ・コントローラ（１０５）を介して、ディスプレイ（１０６）、例えば液晶ディスプレイ（ＬＣＤ）が接続されうる。ディスプレイ（１０６）は、コンピュータの管理のために、通信回線を介してネットワークに接続されたコンピュータについての情報と、そのコンピュータ上で動作中のソフトウェアについての情報を、適当なグラフィック・インタフェースで表示するために使用される。バス（１０４）にはまた、ＳＡＴＡ又はＩＤＥコントローラ（１０７）を介して、記憶装置（１０８）、例えばハードディスク又はシリコン・ディスクと、ドライブ（１０９）、例えばＣＤ、ＤＶＤ又はＢＤドライブとが接続されうる。バス（１０４）にはさらに、キーボード・マウスコントローラ（１１０）又はＵＳＢバス（図示せず）を介して、キーボード（１１１）及びマウス（１１２）が接続されうる。

　記憶装置（１０８）には、オペレーティング・システム、Ｊ２ＥＥなどのＪａｖａ（登録商標）処理環境、Ｊａｖａ（登録商標）アプリケーション、Ｊａｖａ（登録商標）仮想マシン（ＶＭ）、Ｊａｖａ（登録商標）実行時（ＪＩＴ）コンパイラを提供するプログラム、その他のプログラム、及びデータが、メイン・メモリ１０３にロード可能に記憶されている。
　ドライブ（１０９）は、必要に応じて、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ又はＢＤからプログラムを記憶装置（１０８）にインストールするために使用される。

　通信インタフェース（１１４）は、例えばイーサネット（登録商標）・プロトコルに従う。通信インタフェース（１１４）は、通信コントローラ（１１３）を介してバス（１０４）に接続され、コンピュータ（１０１）を通信回線（１１５）に物理的に接続する役割を担い、コンピュータ（１０１）のオペレーティング・システムの通信機能のＴＣＰ／ＩＰ通信プロトコルに対して、ネットワーク・インタフェース層を提供する。なお、通信回線（１１５）は、有線ＬＡＮ環境、又は例えばＩＥＥＥ８０２．１１ａ／ｂ／ｇ／ｎなどの無線ＬＡＮ接続規格に基づく無線ＬＡＮ環境であってもよい。

　図２は、図１に示すコンピュータ（１０１）のハードウェア機能を有し、本発明の実施態様に従うコンピュータ（２０１）の機能ブロック図を示す。
　コンピュータ（２０１）は、図１に示す例えばＣＰＵ（１０２）、メイン・メモリ（１０３）及び記憶装置（１０８）に加えて、変換部（２１１）、逆変換部（２１２）を備えている。コンピュータ（２０１）は、さらに、処理部（２１３）及び実行部（２１４）を備えうる。

　変換部（２１１）は、オブジェクトへのポインタを操作して、当該ポインタを読み書き保護領域を指すポインタに変換する。
　本発明の１つの実施態様として、変換部（２１１）は、例えば、下記（１）～（３）に示す変換処理を行いうる。
　（１）ポインタに一定のオフセット値を加えて、読み書き保護領域を指すポインタ（変換されたポインタ）を得る。
　（２）オブジェクトへのポインタをｎビット数分（ｎは整数である）右シフトし、そして一定のオフセット値を加えて、読み書き保護領域を指す（変換されたポインタ）を得る。
　（３）オブジェクトへのポインタをｎビット数分（ｎは整数である）右シフトし、そして空いた左（上位）ビットに読み書き保護領域のアドレスを埋め込んで、読み書き保護領域を指す（変換されたポインタ）を得る。
　変換部（２１１）は、上記変換を、例えば、オブジェクトの割り付けにおいて、又は、ガーベジ・コレクションにおいて行う。

　逆変換部（２１２）は、読み書き保護領域へのアクセス要求に応じて例外が発生することを利用して、上記変換されたポインタから元のポインタへ逆変換する。
　本発明の１つの実施態様として、逆変換部（２１２）は、上記例外が発生した命令を参照して、当該例外が発生した命令から、上記操作されたポインタを取得し、当該取得されたポインタを逆変換して、当該逆変換された元のポインタが指すオブジェクトの先頭へのポインタを取得する。
　本発明の他の実施態様として、逆変換部（２１２）は、例外が発生した命令アドレスと、オブジェクトの先頭へのポインタ値を格納するスロット（ピンニング・アレイ・スロットともいう）のレジスタ又はスロット番号との対応表を参照して、当該例外が発生した命令アドレスから、前記操作されたポインタを取得し、当該取得されたポインタを逆変換して、当該逆変換された元のポインタが指すオブジェクトの先頭へのポインタを取得する。　本発明の他の実施態様として、逆変換部（２１２）は、
　上記変換部（２１１）で行われた（１）～（３）に対応して、下記（１’）～（３’）に示す逆変換処理を行いうる。
　（１’）上記（１）において変換されたポインタから一定のオフセット値を減じて、元のポインタを得る。
　（２’）上記（２）において変換されたポインタから一定のオフセット値を減じ、そして上記（２）と同じｎビット数分左シフトして、元のポインタを得る。
　（３’）上記（３）において変換されたポインタを上記（３）と同じｎビット数分左シフトして、元のポインタを得る。

　処理部（２１３）は、逆変換された元のポインタが指すオブジェクトのヘッダ情報を参照して、当該参照されたヘッダ情報を有するオブジェクトのフォーマットに適した処理をする。当該フォーマットに適した処理は、例えば、圧縮オブジェクトの伸長、又は、文字配列の遅延割り当てである。

　実行部（２１４）は、フォーマットに適した処理を行った後に、逆変換された元のポインタが指すオブジェクトにアクセスする。

　図３は、オブジェクト、及びオブジェクトへのポインタの例を示す。
　「オブジェクト」は、プログラム上の抽象化された手続きの対象を具体化したものであり、プログラム中に記述されるオブジェクトの割り付け場所から生成されるオブジェクトである。「オブジェクト」は、プログラムの実行時に、メモリ内、例えばヒープ領域内に割り付けられる。「オブジェクト」は、例えばクラスから生成される。「オブジェクト」は、プログラムの実行が、例えば中断又は完了した場合であっても、ヒープ領域に存在しうる。ヒープ領域は、プログラムに使用されるヒープ領域全体ではなく、当該ヒープ領域全体の一部であって、オブジェクトが割り付けられる領域である。ヒープ領域は、例えば、ＧＣの対象となるヒープ領域である。

　「オブジェクト」は、典型的には、ヘッダ及び少なくとも１のフィールドを含む（下記図４及び図６を参照）。ヘッダは、オブジェクト内に埋め込まれた、オブジェクト自体の情報を保持する部分であり、例えばオブジェクトのサイズ及び種類の情報を含む。フィールドは、オブジェクトの利用者がアクセス可能な部分であり、例えばポインタと非ポインタの２種類のデータを有する。ポインタとは、メモリ領域上のある場所を参照する値であり、多くの言語処理系では，オブジェクトへのポインタはオブジェクトの先頭アドレスを参照する（図３を参照）。非ポインタは、プログラミングにおいて、値そのものを利用するものであり、数値、文字、及び／又は真偽値を包含する。

　「オブジェクト」は、メモリ領域上に割り付けられる。ＧＣは、配置されたオブジェクトを状況に応じて、移動したり、破棄したりする。

　「オブジェクトのフォーマット」には、所謂、通常のオブジェクト・フォーマット、及び、通常のオブジェクト・フォーマットが変形されたオブジェクト・フォーマット（以下、「変形されたオブジェクト・フォーマット」ともいう）を包含する。

　「通常のオブジェクト・フォーマット」は、例えば、Ｊａｖａ（商標）、Ｃ♯、Ｓｃｒｉｐｔ（ＰＨＰ又はＰｅｒｌ）、Ｒｕｂｙ、Ｃ、Ｃ＋＋、ＬＩＳＰ、Ｐｙｔｈｏｎ又はＨａｓｋｅｌｌの実装中に見られるフォーマットであり、特に変形されていないフォーマットをいう。Ｊａｖａ（商標）において、オブジェクト・フォーマットは、Ｊａｖａ（商標）の実装中（すなわち、メモリ内）でしか見られない。通常のオブジェクト・フォーマットは、オブジェクトのクラスによって異なる。

　「変形されたオブジェクト・フォーマット」とは、メモリー・フットプリント（メモリ使用量）、メモリ帯域幅、キャッシュ・ミス、ガーベジ・コレクション頻度、及びＧＣオーバーヘッドを減少させることを目的として、通常のオブジェクト・フォーマットが変形されたオブジェクト・フォーマットである。オブジェクト・フォーマットの変形例は、下記図４～図６に示されているが、本発明はこれらの変形例に限定されるものでない。

　オブジェクトＸ（３１１）は、その中にポインタ（３２１）を有する。ポインタ（３２１）は、オブジェクトＡ（３１２）へのアクセスを示し、オブジェクトＡ（３１２）の先頭のアドレスを有する。オブジェクトＡ（３１２）は、ポインタ（３２１）のターゲット・オブジェクトでもある。オブジェクトＡ（３１２）は、通常のオブジェクト・フォーマットを有するオブジェクト、又は、変形されたオブジェクト・フォーマットのいずれであってもよい。

　オブジェクトＹ（３３１）は、その中にポインタ（３４１）を有する。ポインタ（３４１）は、オブジェクトＢ（３３２）へのアクセスを示し、オブジェクトＢ（３３２）の先頭アドレスを有する。オブジェクトＢ（３３２）は、ポインタ（３４１）のターゲット・オブジェクトでもある。オブジェクトＢ（３３２）は、その中にポインタ（３４２）を有する。ポインタ（３４２）は、オブジェクトＣ（３３３）へのアクセスを示し、オブジェクトＣ（３３３）の先頭アドレスを有する。オブジェクトＣ（３３３）は、ポインタ（３４２）のターゲット・オブジェクトでもある。このように、ポインタを順に読み取り、当該読み取られたポインタからさらに他のオブジェクトへのアクセスが示される。オブジェクトＢ（３３２）及びオブジェクトＣ（３３３）はそれぞれ、通常のオブジェクト・フォーマットを有するオブジェクト、又は、変形されたオブジェクト・フォーマットのいずれであってもよい。

　図４は、通常のオブジェクト・フォーマットが、圧縮により変形されたオブジェクト・フォーマットの例を示す。
　圧縮により変形されるとは例えば、ある文字配列（character array(s)）又はある部位に割り当てられた文字配列がアクセスされない傾向にあり且つそれら文字配列がアスキー（ＡＳＣＩＩ）文字列のみを含む場合に、当該文字配列が圧縮されうることをいう。オブジェクトの圧縮は、オブジェクト・アクセスの最適化をもたらす。

　オブジェクト・フォーマット（４０１）は、通常のフォーマットを示す。オブジェクト・フォーマット（４０２）は、オブジェクト・フォーマット（４０１）が圧縮により変形された場合のフォーマットを示す。
　オブジェクト・フォーマット（４０１）は、ヘッダ（４１１）並びに、ヌル値のデータ・フィールド（４１２、４１４、４１６及び４１８）及びアスキーのデータ・フィールド（４１３、４１５、４１７及び４１９）を含む。オブジェクト・フォーマット（４０２）は、ヘッダ（４２１）及び、アスキーのデータ・フィールド（４２２～４２５）を含む。　

　変形されたオブジェクト・フォーマット（４０２）では、オブジェクト・フォーマット（４０１）のヌル値のデータ・フィールド（４１２、４１４、４１６及び４１８）が削除され、且つアスキーのデータ・フィールド（４１３、４１５、４１７及び４１９）が結合されている。変形されたオブジェクト・フォーマット（４０２）のデータ・フィールドの数は４であり、オブジェクト・フォーマット（４０１）のデータ・フィールドの数は８であることから、変形されたオブジェクト・フォーマット（４０２）のデータ・フィールドはオブジェクト・フォーマット（４０１）のデータ・フィールドの半分に圧縮されている。変形されたオブジェクト・フォーマット（４０２）では、データ・フィールドの数が圧縮されているので、オブジェクト・フォーマット（４０１）に比べてメモリのコストを低減することが可能である。

　オブジェクトの圧縮方法については、多くの知られている方法がある（非特許文献２を参照）。

　図５は、通常のオブジェクト・フォーマットが、ポインタを使用して文字配列を指定することにより変形されたオブジェクト・フォーマットの例を示す。
　ポインタを使用して文字配列を指定するとは例えば、ある部位に割り当てられた複数のストリング・オブジェクトがアクセスされない傾向にあり且つそれらストリング・オブジェクトが他のストリング・オブジェクトと連結されることによって生成される場合に、当該連結されうる文字配列がポインタを使用して文字配列を指定されることをいう。当該ポインタを使用する文字配列の割り当ては、遅延的に（lazily）生じうる。遅延割り当ては、オブジェクトが実際に必要とされるまで当該オブジェクトを割り当てないので、オブジェクト・アクセスの最適化をもたらす。

　オブジェクト・フォーマット（５０１）は、通常のフォーマットを示す。オブジェクト・フォーマット（５０２）は、オブジェクト・フォーマット（５０１）が変形された場合のフォーマットを示す。

　オブジェクト・フォーマット（５０１）では、文字配列（５１２）及び文字配列（５２２）の２つが異なる位置に割り当てられている場合に、文字配列（５１２）及び文字配列（５２２）が結合されて、文字配列（５３２）が新たに生成されることを示す。文字配列（５３２）の生成は、遅延的に生じうる。オブジェクト・フォーマット（５０２）では、文字配列（５４２）及び文字配列（５５２）が異なる位置に割り当てられている場合に、文字配列（５４２）及び文字配列（５５２）のそれぞれが、２つのポインタ（５６２及び５６３）を使用して指定されることを示す。

　変形されたオブジェクト・フォーマット（５０２）では、オブジェクト・フォーマット（５０１）の文字配列（５３２）の代わりに２つのポインタ（５６２及び５６３）を有している点で異なっている。オブジェクト・フォーマット（５０２）では、文字配列（５３２）の代わりに２つのポインタ（５６２及び５６３）を有しているので、メモリのコストを低減することが可能である。

　図６は、通常のオブジェクト・フォーマットが、フィールド再配置により変形されたオブジェクト・フォーマットの例を示す。
　フィールド再配置とは例えば、オブジェクト中の２つ又はそれ以上のフィールドが同時にアクセスされる傾向にある場合に、当該２つ又はそれ以上のフィールドについてのデータキャッシュミスを減少させるために、当該２つ又はそれ以上のフィールドが同一場所に配置（co-locate）されることを示す。
　オブジェクト・フォーマット（６０１）は、通常のフォーマットを示す。オブジェクト・フォーマット（６０２）は、オブジェクト・フォーマット（６０１）が変形された場合のフォーマットを示す。
　オブジェクト・フォーマット（６０１）は、ヘッダ（６１１）及び、データ・フィールドを１～６（６１２～６１７）の順で含む。オブジェクト・フォーマット（６０２）は、ヘッダ（６２１）及び、データ・フィールドを１、６、３、４、５及び２（６２２～６２７）の順で含む。
　データ・フィールド１（６１２）及びデータ・フィールド６（６１７）は、同時にアクセスされる傾向にあるとする。
　オブジェクト・フォーマット（６０１）では、同時にアクセスされる傾向にあるデータ・フィールド１（６１２）及びデータ・フィールド６（６１７）が離れて存在している。そこで、変形されたオブジェクト・フォーマット（６０２）では、データ・フィールド１（６２２）に隣にデータ・フィールド６（６２３）が位置するように変形されている。変形されたオブジェクト・フォーマット（６０２）では、同時にアクセスされる傾向にあるデータ・フィールド１（６２２）及びデータ・フィールド６（６２３）が隣に位置するように変形されているので、メモリ・アクセスのコストを低減することが可能である。

　以下では、本発明の実施態様に従う、ポインタを読み書き保護領域を指すように変換した場合のオブジェクトへのアクセス方法（下記図９Ａ及び図９Ｂを参照）の内容をより理解しやすくするために、従来技術である永続的なオブジェクト・データベース方式における、オブジェクトへのアクセス方法（下記図７及び図８を参照）をまず説明する。

　図７は、従来技術である、永続的なオブジェクト・データベース方式における、オブジェクトへのアクセス方法を示す。
　永続的なオブジェクト・データベース方式によるオブジェクトへのアクセスは下記の特徴を有する：（１）オブジェクトへのアクセスの監視がページ単位である；（２）当該方式が向いているケースはページ単位でアクセスの局所性がある場合である；及び、（３）当該方式の適用分野は、主に、データベース及びディスクへの分野であり、特にスワッピング・アウト／又はスワッピング・インにおいてである。図７に示す永続的なオブジェクトへのアクセス方法は、例えば非特許文献３に示されている。

　コンピュータ（２０１）のメモリ上に仮想アドレス・スペース（７０１）がある。仮想アドレス・スペース（７０１）上に、読み書き保護ページ（７０２）がある。オブジェクトＸ（７２１）のポインタは読み書き保護ページ内のオブジェクトＡ（７４１を参照）の先頭アドレスを示し、及び、オブジェクトＡ（７４１を参照）のポインタはオブジェクトＢ（７４２を参照）の先頭アドレスを示しているとする。また、オブジェクトＹ（７３１）のポインタはオブジェクトＣ（７４３を参照）の先頭アドレスを示しているとする。オブジェクトＡ（７４１を参照）、オブジェクトＢ（７４２を参照）及びオブジェクトＣ（７４３を参照）は、読み書き保護ページ（７０２）内にあるとする。

　図７の上図に示されているように、コンピュータ（２０１）が、オブジェクトＸ（７２１）からポインタを辿ってオブジェクトＡにアクセスしたとする。そのオブジェクトＡへのポイント先が読み書き保護ページ（７０２）である場合、コンピュータ（２０１）は、シグナル・ハンドラを使用して、全スレッドの実行を停止し、読み書き保護ページ（７０２）の保護を外す。保護を外した後の仮想アドレス・スペース（７０１）を図７の下図に示す。そして、当該下図に示されるように、コンピュータ（２０１）は、シグナル・ハンドラを使用して、オブジェクトＡ（７４１）をディスク又はリモートマシンからメモリ上にロードして、プログラムの実行を再開する。しかしながら、上記方法では、上記ロードにおいて、コンピュータ（２０１）は、オブジェクトＡ（７４１）だけでなく、当該オブジェクトＡ（７４１）と同じ読み書き保護ページ（７０２）内にあったオブジェクトＢ（７４２）及びオブジェクトＣ（７４３）もメモリ上にロードする。従って、メモリのコストが増大するというデメリットがある。
　図７の下図では、ロードされたオブジェクトＡ（７４１）から指されているオブジェクトがまだロードされていない場合、コンピュータ（２０１）は、新たな読み書き保護ページ（７０３）を割り当てて、オブジェクトＡ（７４１）のポインタがその読み書き保護ページ（７０３）を指すようにすることを示す。同様に、図７の下図では、ロードされたオブジェクトＣ（７４３）から指されているオブジェクトがまだロードされていない場合、コンピュータ（２０１）は、新たな読み書き保護ページ（７０３）を割り当てて、オブジェクＣ（７４３）のポインタがその読み書き保護ページ（７０３）を指すようにすることを示す。

　図８は、従来技術である、永続的なオブジェクト・データベース方式における、圧縮されたオブジェクトへのアクセス方法を示す。
　永続的なオブジェクト・データベース方式の特徴は上記において述べたとおりである。　

　コンピュータ（２０１）のメモリ上に仮想アドレス・スペース（８０１）がある。仮想アドレス・スペース（８０１）上に、読み書き保護ページ（８０２）がある。オブジェクトＸ（８２１）のポインタは圧縮オブジェクトＡ（８２２）の先頭アドレスを示し、及び、圧縮オブジェクトＡ（８２２）のポインタは圧縮オブジェクトＢ（８２３）の先頭アドレスを示しているとする。また、圧縮オブジェクトＹ（８３１）のポインタは圧縮オブジェクトＣ（８３２）の先頭アドレスを示しているとする。圧縮オブジェクトＡ（８２２）、圧縮オブジェクトＢ（８２３）及び圧縮オブジェクトＣ（８３２）は、読み書き保護ページ（８０２）内にあるとする。

　図８の上図に示されているように、コンピュータ（２０１）が、オブジェクトＸ（８２１）からポインタを辿ったとする。そのポイント先が読み書き保護ページ（８０２）である場合、コンピュータ（２０１）は、シグナル・ハンドラを使用して、全スレッドの実行を停止し、読み書き保護ページ（８０２）の保護を外す（８１２）。保護を外した後の仮想アドレス・スペース（８０１）を図８の下図に示す。そして、当該下図に示されるように、コンピュータ（２０１）は、シグナル・ハンドラを使用して、圧縮オブジェクトＡ（８２２）をメモリ上に伸長し、プログラムの実行を再開する。しかしながら、上記方法では、上記伸長において、圧縮オブジェクトＡ（８２２）だけでなく、当該圧縮オブジェクトＡ（８２２）と同じ読み書き保護ページ（８０２）内にある圧縮オブジェクトＢ（８２３）及び圧縮オブジェクトＣ（８３２）をもメモリ上に伸長する。従って、メモリのコストが増大するというデメリットがある。

　図９Ａ及び図９Ｂは、本発明の実施態様に従う、ポインタを読み書き保護領域を指すように変換した場合のオブジェクトへのアクセス方法を示す。
　本発明の実施態様に従う、オブジェクトへのアクセスは下記の特徴を有する：（１）オブジェクトへのアクセスの監視がページ単位でなく、個々のオブジェクト単位である；（２）当該方式が向いているケースはページ単位でアクセスの局所性がある場合でなく、ヒープ中に散らばっているオブジェクト毎に監視したい場合である；及び、（３）本発明の実施態様の適用分野は、主に、オブジェクト・アクセスのプロファイリング、オブジェクトの圧縮、オブジェクトの遅延割り付け、及びオブジェクトの再配置である。

　図９Ａにおいて、コンピュータ（２０１）のメモリ上に仮想アドレス・スペース（９０１）がある。仮想アドレス・スペース（９０１）上に、読み書き保護領域（９０２）がある。オブジェクトＸ（９２１）のポインタは読み書き保護領域（９０２）のアドレス（９２２）を示し、圧縮オブジェクトＡ（９２３）のポインタは読み書き保護領域（９０２）のアドレス（９２４）を示しているとする。また、オブジェクトＹ（９３１）のポインタは読み書き保護領域（９０２）のアドレス（９３２）を示しているとする。

　ここで留意すべきことは、オブジェクトＸ（９２１）のポインタは圧縮オブジェクトＡ（９２３）を指すアドレス（すなわち、圧縮オブジェクトＡの先頭アドレス）から、読み書き保護領域（９０２）を指すポインタに変換されていることである。また、圧縮オブジェクトＡ（９２３）のポインタは圧縮オブジェクトＢ（９２５）を指すアドレス（すなわち、圧縮オブジェクトＢの先頭アドレス）から、読み書き保護領域（９０２）を指すポインタに変換されていることである。また、オブジェクトＹ（９３１）のポインタは圧縮オブジェクトＣ（９３３）を指すアドレス（すなわち、圧縮オブジェクトＣの先頭アドレス）から、読み書き保護領域（９０２）を指すポインタに変換されていることである。

　本明細書において、上記のように、ターゲット・オブジェクトへのポインタを読み書き保護領域を指すように変換（コード操作）することを「バリアライズ」（barrierize）という。バリアライズは、割り当てにおいて又はＧＣにおいて行われる。このバリアライズは、本発明の実施態様において、全てのオブジェクトにおいて行われうる。

　本明細書において、上記バリアライズによって変換されたポインタを、「バリア（barrier）・ポインタ」という。バリア・ポインタという名は、本発明者によって名付けられたものである。バリア・ポインタを介する全てのアクセスは、例外を生じさせる。

　上記変換によって各オブジェクトのポインタは読み書き保護領域（９０２）を指すように変換されるが、読み書き保護領域（９０２）内にオブジェクトそれ自体は実際には存在しないことに留意されたい。

　コンピュータ（２０１）が、オブジェクトＸ（９２１）からポインタを辿ったとする。そのポイント先が読み書き保護領域（９０２）のアドレス（９２２）を示しているとする。従って、読み書き保護領域（９０２）へのアクセス要求が生じる。ポイント先が読み書き保護領域（９０２）のアドレスを示しているので、当該アクセス要求に応じて例外が発生する。当該例外が発生することに応じて、コンピュータ（２０１）は、シグナル・ハンドラを使用して、オブジェクトＸ（９２１）のポインタから元のポインタを逆変換する。そして、コンピュータ（２０１）は、シグナル・ハンドラを使用して、アクセスされる圧縮オブジェクトＡ（９２３）のみを伸長する。圧縮オブジェクトＡ（９２３）のみを伸長した後の仮想アドレス・スペース（９０１）を図９Ｂに示す。図９Ｂに示すように、圧縮オブジェクトＡ（９２３）のみが伸長され、圧縮オブジェクトＢ（９２５）及び圧縮オブジェクトＣ（９３３）は伸長されない。すなわち、本発明の実施態様において、アクセスされるオブジェクトのみ、すなわち圧縮オブジェクトＡ（９２３）のみを伸長すればよい。コンピュータ（２０１）は、伸長されたオブジェクトＡ（９４３）へのアクセスを行い、プログラムの実行を再開する。

　同様に、コンピュータ（２０１）が、オブジェクトＡ（９４３）からポインタを辿ったとする。そのポイント先が読み書き保護領域（９０２）のアドレス（９２４）を示しているとする。従って、読み書き保護領域（９０２）へのアクセス要求が生じる。ポイント先が読み書き保護領域（９０２）のアドレスを示しているので、当該アクセス要求に応じて例外が発生する。当該例外が発生することに応じて、コンピュータ（２０１）は、シグナル・ハンドラを使用して、オブジェクトＡ（９４３）のポインタから元のポインタを逆変換する。そして、コンピュータ（２０１）は、シグナル・ハンドラを使用して、アクセスされる圧縮オブジェクトＢ（９２５）のみを伸長する。すなわち、圧縮オブジェクトＣ（９３３）は伸長されない。コンピュータ（２０１）は、伸長されたオブジェクトＢ（９２５）（図示せず）へのアクセスを行い、プログラムの実行を再開する。

　同様に、コンピュータ（２０１）が、オブジェクトＹ（９３１）からポインタを辿ったとする。そのポイント先が読み書き保護領域（９０２）のアドレス（９３２）を示しているとする。従って、読み書き保護領域（９０２）へのアクセス要求が生じる。ポイント先が読み書き保護領域（９０２）のアドレスを示しているので、当該アクセス要求に応じて例外が発生する。当該例外が発生することに応じて、コンピュータ（２０１）は、シグナル・ハンドラを使用して、オブジェクトＹ（９３１）のポインタから元のポインタを逆変換する。そして、コンピュータ（２０１）は、シグナル・ハンドラを使用して、アクセスされる圧縮オブジェクトＣ（９３３）のみを伸長する。コンピュータ（２０１）は、伸長されたオブジェクトＣ（９３３）（図示せず）へのアクセスを行い、プログラムの実行を再開する。

　本明細書において、上記バリアライズによって変換されたポインタを元に戻すように逆変換（コード操作）することを「アンバリアライズ」（unbarrierize）という。

　以上の通り、本発明の実施態様に従う方法では、アクセスされるオブジェクトのみ、すなわち圧縮オブジェクトＡ（９２３）のみを伸長すればよく、他の圧縮されたオブジェクトは影響されないことからメモリのコストが低減できる。言い換えれば、個々のオブジェクトを対象として当該個々のオブジェクトのフォーマットに適した処理をすることが可能であり、全てのオブジェクトについて、上記処理をする場合に比べて、システムのコスト（例えばメモリ使用量）を低減させることができるという有意点がある。

　図１０は、本発明の実施態様に従う、オブジェクトへのポインタを、読み書き保護領域を指すように変換する例を示す。
　オブジェクト（１００１）に含まれるポインタ（１００２）は、オブジェクトＡ（１００５）へのポインタである。ポインタ（１００２）は、変換前のポインタであり、通常、その下位２又は３ビット（１００４）がゼロであり、それ以外のビットがアクセスされるべきオブジェクトのアドレス（１００３）を示す。アドレス（１００３）は例えば、オブジェクトＡ（１００５）の先頭アドレスである。
　本発明の実施態様に従うと、ポインタ（１００２）の下位２又は３ビット（１００４）がゼロであるという点を使用する。

　本発明の実施態様に従うと、下記に示すポインタのビット操作を行うことによって、ポインタ（１００２）が読み書き保護領域を指すポインタに変換される。当該変換の一つの例は、例えば、ポインタ（１００２）をｎビット数分（ｎは整数である、例えばｎは２又は３である）右シフトし、そして空いた左（上位）ビットに読み書き保護領域を指すポインタを設定することによって行われる。

　ポインタ（１０１２）は、上記変換により生成されたポインタである。上位ｎビット（１０１３）の数は、上記右シフトされたビットと同じ数である。それ以外のビット（１０１４）は、上記ビット（１００３）と同じである。ポインタ（１０１２）の先頭（１０１３）が読み書き保護領域のアドレス（１０１５）を示す。

　読み書き保護領域は、例えば、特定の言語により生じるメモリ領域（例えばＪａｖａ（商標）のヒープ外にある読み書き保護領域であり）、例えばＯＳメモリ領域である。また、読み書き保護領域は、例えば例外を生じさせるアドレスでありうる。例えば、コンピュータに３２ビットＬｉｎｕｘ（商標）がインストールされている場合、その読み書き保護領域は、0xC0000000及びそれより上のアドレスである。当該読み書き保護領域は、ユーザからアクセス不可能である。その他、コンピュータが実装するプログラム言語に従う読み書き保護領域のアドレスが使用されうる。

　本発明の実施態様に従うと、バリアライズにおいて読み書き保護領域を使用することによって、ポインタを実メモリ（リアル・メモリ）に割り当てる必要はなく、単に仮想メモリ領域を予約し且つ保護するだけでよいという有利点がある。また、本発明の実施態様に従うと、ユーザ空間の仮想メモリ領域を予約する必要さえないという有利点がある。

　本発明の実施態様に従うと、次に示すポインタのビット操作を行うことによって、ポインタ（１０１２）が逆変換される。逆変換の結果、オブジェクトＸ（１０２１）のポインタは、オブジェクトＡの先頭アドレスを指すようになる。すなわち、変換されたポインタから元のポインタへ逆変換される。逆変換は、ポインタ（１０１２）をｎビット数分（ｎは整数である、例えばｎは２又は３である）左シフトし、そして当該左シフトした分空いた右（下位）ビット（１０２４）にゼロを設定することによって行われる。この逆変換によって、ポインタ（１０１２）からポインタ（１０２２）（すなわち、ポインタ１００２と同じである）が生成されて、目的のオブジェクトＡ（１０２５）へのアクセスを検出することが可能になる。

　下記図１１～図１３において、本発明の実施態様に従う種々のバリア・ポインタの例を示す。図１１～図１３のいずれもメモリ・レイアウトであり、図１１のバリア・ポインタが基本的なバリア・ポインタであり、図１２～図１３が拡張的なバリア・ポインタである。本発明の実施態様において、当業者は図１１～図１３のバリア・ポインタ及びその他の実施態様のバリア・ポインタを任意に使用しうる。

　図１１は、本発明の実施態様に従う、読み書き保護領域がヒープ領域と同じサイズである場合におけるバリア・ポインタの例を示す。
　仮想アドレス・スペース（１１０１）上に、Ｊａｖａ（商標）ヒープ領域（１１１１）と、読み書き保護領域（１１１２）がある。元のポインタは矢印（１１２１）で示されており、バリア・ポインタは矢印（１１２２）で示されている。
　図１１の例では、読み書き保護領域（１１１２）が、Ｊａｖａ（商標）ヒープ領域（１１１１）と同じアドレス・サイズになるように予約される。同じアドレス・サイズにすることによって、実装が簡単になる。バリアライズにおいて、Ｊａｖａ（商標）ヒープ領域（１１１１）と読み書き保護領域（１１１２）との間の一定のオフセットがポインタに加えられる。一方、アンバリアライズにおいて、一定のオフセットが減じられる。当該オフセットは、Ｊａｖａ（商標）ＶＭの初期化の間及びプログラム実行の間を通じて一定である。ほとんどのＯＳは、読み書き保護された仮想アドレス領域を予約するためのシステム・コールを有している。ここで、読み書き保護領域（１１１２）は、実メモリの割り当てを要求しないことに留意されたい。最近のＯＳは、実メモリの内容がプログラムによって最初にアクセスされるまで実メモリを仮想ページに割り当てない。読み書き保護領域（１１１２）は例外を生じさせるためにのみ使用される。従って、読み書き保護領域（１１１２）の内容は、外部から決してアクセスされず且つ実メモリも要求されない。図１１に示す場合において、もしＪａｖａ（商標）ヒープ領域（１１１１）が動的に拡張されるのであれば、読み書き保護領域（１１１２）も同様に拡張されなければならない。しかし、一般にこの拡張が成功することは保証されない。それ故に、プログラムが実行を開始するときに、読み書き保護領域（１１１２）のサイズは、Ｊａｖａ（商標）ヒープ領域（１１１１）の最大サイズと一致するようにする。なお、読み書き保護領域（１１１２）のサイズがＪａｖａ（商標）ヒープ領域（１１１１）のサイズよりも小さくないようにしてもよい。

　バリアライズは、オブジェクトの割り付けにおいて（下記図１６を参照）、又はＧＣにおいて（下記図１７を参照）行われうる。オブジェクトの割り付け時におけるバリアライズは、ある割り当て部位で割り付けられたオブジェクトをプロファイリング又は最適化するために有用である。バリア・ポインタが正確に作動するために、ターゲット・オブジェクトへポイントする全てのポインタがバリアライズされることが重要である。レジスタ中の一つのポインタのみが割り当て直後に割り当てられたオブジェクトをポイントする故に、生成されたＪＩＴコードにおいて又は改変されたインタープリタにおいてレジスタをバリアライズすることで足りる。対照的に、ＧＣにおけるバリアライズは、長く生きているオブジェクトをプロファイリングし又は最適化するために適している。
　本発明の実施態様において、図１１～図１３に示すバリアライズ及びアンバリアライズの方式のうち、図１１に示すバリアライズ及びアンバリアライズの方式が最も基本的な方式である。

　図１２は、本発明の実施態様に従う、読み書き保護領域がヒープ領域よりも小さいサイズである場合におけるバリア・ポインタの例を示す。
　仮想アドレス・スペース（１２０１）上に、Ｊａｖａ（商標）ヒープ領域（１２１１）と、読み書き保護領域（１２１２）がある。元のポインタは矢印（１２２１）で示されており、バリア・ポインタは矢印（１２２２）で示されている。図１２において使用されるオブジェクトは、例えば８バイト単位でアラインされている。一般的なＣＰＵの設計では、例えば８バイトのデータを８バイト・アラインしていないアドレスから読もうとすると、オーバーヘッドがかかる。そこで、オブジェクトの先頭を８バイト・アラインしておけばオブジェクトの中のフィールドも８バイト・アラインされるのでアクセスに余計なオーバーヘッドがかからないからである。
　図１１の例では、読み書き保護領域（１１１２）のサイズは、Ｊａｖａ（商標）ヒープ領域（１１１１）の最大サイズと一致又はそれよりも大きくするようにする。しかしながら、仮想アドレス・スペース（１１０１）は限られたリソースである。仮想アドレスにおける追加領域はまたトランスレーション・ルックアサイド・バッファ（ＴＬＢ）ミスを増加させる。従って、読み書き保護領域をできるだけ小さくすることがよい。

　図１２の例では、読み書き保護領域（１２１２）が、Ｊａｖａ（商標）ヒープ領域（１２１１）よりも小さいサイズになるように予約される。例えば、読み書き保護領域（１２１２）は、Ｊａｖａ（商標）ヒープ領域（１２１１）の８分の１のサイズでありうる。バリアライズにおいて、ポインタのｎビット数分右シフトされ、オフセットが加えられる。一方、アンバリアライズにおいて、一定のオフセットが減じられ、ｎビット分が左シフトされる。バリアライズは、図１１の例と同様に、オブジェクトの割り付けにおいて、又はＧＣにおいて行われる。

　図１２に示すように、より小さい読み書き保護領域（１２１２）にとって、Ｊａｖａ（商標）ＶＭは、全てのＪａｖａ（商標）オブジェクトが８バイト境界上で整列されるという事実を利用しうる。各オブジェクト・ポインタの最後３ビットはゼロであるので、なんらの情報を失うことなしに３ビット数分の右シフトが可能である。従って、読み書き保護領域（１２１２）のサイズは、上記されているように、Ｊａｖａ（商標）ヒープ領域（１２１１）の８分の１のサイズでありうる。図１２のバリアライズにおいて、バリア・ポインタは下記の式１で表されうる。

　［式１］
　Barrier_pointer＝(Original_pointer - HEAP_BASE) >> 3 + PROTECTED_BASE

　式１は、下記式２で表されるように簡略化した形で表されうる。

　［式２］
　Barrier_pointer = Original_pointer >> 3 + CONSTANT；
　CONSTANT = PROTECTED_BASE - HEAP_BASE >> 3

　なお、図１２に示すバリア・ポインタにおける問題点は、バリア・ポインタを通じてのアクセスは読み書き保護領域（１２１２）外のポインタ（アドレス）でありうることである。従って、オブジェクトへのポインタをバリアライズするときに、この条件が確認されなければならない。この確認は、下記式３で表されうる。

　［式３］
　Barrier_pointer + Object_size <= PROTECTED_TOP
　ここで、PROTECTED_TOPは、読み書き保護領域のトップ・アドレスである。

　図１３は、本発明の実施態様に従う、読み書き保護領域がＯＳ保護領域である場合におけるバリア・ポインタの例を示す。
　図１３は、図１２とは別の方法によって、読み書き保護領域のサイズを減少させる方法を示す。
　図１３の例では、仮想アドレス・スペース（１３０１）上に、Ｊａｖａ（商標）ヒープ領域（１３１１）と、Ｌｉｎｕｘ（商標）　ＯＳ領域（１３１２）がある。Ｌｉｎｕｘ（商標）　ＯＳ領域（１３１２）は、ＯＳに使用されるアドレス範囲であるので読み書き保護領域である。元のポインタは矢印（１３２１）で示されており、バリア・ポインタは矢印（１３２２）で示されている。
図１３の例では、Ｌｉｎｕｘ（商標）　ＯＳ領域（１３１２）がＬｉｎｕｘ（商標）　ＯＳプログラムの仕様に従い、仮想アドレス・スペース（１３０１）の４分の１を占めており、且つOxC0...000から開始する。このＬｉｎｕｘ（商標）　ＯＳ領域（１３１２）にユーザはアクセスすることができない。バリアライズにおいて、ポインタのｎビット数分右シフトされ、空いた２ビットにＬｉｎｕｘ（商標）　ＯＳ領域（１３１２）の先頭を指すアドレスが設定される（図１３の例の場合、11である）。一方、アンバリアライズにおいて、ポインタのｎビット分が左シフトされる。Ｊａｖａ（商標）ＶＭはユーザ・スペース中に読み書き保護領域を予約する必要がない。例えば、３２ビットＷｉｎｄｏｗｓ（商標）において、当該ＯＳは典型的に仮想アドレス・スペースの２分の１又は４分の１を予約する。例えば、３２ビットＡＩＸにおいて、当該ＯＳは典型的に、４ＧＢの仮想アドレス・スペースの１６分の１を占める。このことは、Ｊａｖａ（商標）ＶＭが読み書き保護領域を予約するために他の場所において２５６ＭＢで予約しうることを意味する。バリアライズは、図１１の例と同様に、オブジェクトの割り付けにおいて、又はＧＣにおいて行われる。

　図１４は、本発明の実施態様に従う、オブジェクトへのアクセスを検出する方法のフローチャートを示す。
　ステップ１４０１では、コンピュータ（２０１）は、オブジェクトへのアクセスを検出するアルゴリズムを開始する。

　ステップ１４０２では、変換部（２１１）は、上記オブジェクト（ターゲット・オブジェクト）へのポインタをコード操作して、当該ポインタを読み書き保護領域を指すポインタに変換する。当該ポインタの変換の態様は、変換部（２１１）の説明において述べたとおりである。ここで、オブジェクトの先頭以外の部分にアクセスがあった場合に、当該オブジェクトへのポインタが変換によって読み書き保護領域を指すことを保証する必要がある。そこで、当該保証をするために、元のポインタをバリアライズする際に、バリア・ポインタとオブジェクトサイズとの合計値が、読み書き保護領域を超えていないことをチェックする必要がある。ただし、当該合計値が読み書き保護領域を超えていたとしても、バリアライズを諦めればよいだけであるので、このオブジェクトについては通常と異なるフォーマットに変換できないだけである。

　ステップ１４０３では、コンピュータ（２０１）は、読み書き保護領域へのアクセスで例外が起きた場合に、メモリ・アクセス例外を検出して、シグナル・ハンドラを起動する。例外が発生している場合、当該処理はステップ１４０４に進む。一方、例外が発生していない場合は、例外の発生を待つ。なお、コンピュータ（２０１）は、起動された上記シグナル・ハンドラを使用して、以下のステップ１４０４～１４１０の各処理を行う。

　ステップ１４０４では、コンピュータ（２０１）は、シグナル・ハンドラを使用して、例外が起きたデータ・アドレスが読み書き保護領域の中にあるデータ・アドレスかどうかを確認する。例外の発生は、例えば、セグメンテーション・フォールトの発生である。例外が起きたデータ・アドレスが読み書き保護領域の中にあるデータ・アドレスであることに応じて、当該処理はステップ１４０５に進む。一方、例外が起きたデータ・アドレスが読み書き保護領域の中にあるデータ・アドレスでないことに応じて、当該処理はステップ１４０６に進む。

　ステップ１４０５では、逆変換部（２１２）は、シグナル・ハンドラを使用して、例外が起きたデータ・アドレスが読み書き保護領域の中にあるデータ・アドレスであることに応じて、上記変換されたポインタから元のポインタへ逆変換をする。当該ポインタの逆変換の本発明の実施態様は、逆変換部（２１２）の説明において述べたとおりであるが、逆変換部（２１２）の動作を下記にさらに詳細に説明する。

　当該シグナル・ハンドラは、本来アクセスするはずであったオブジェクトの先頭へのポインタを入手する必要がある。なぜならば、コンピュータ（２０１）は、元のオブジェクトの先頭へのポインタの先から当該元のオブジェクトのヘッダなどを読み出し、そして当該元のオブジェクトが圧縮されている場合に、当該圧縮オブジェクトを伸長するかどうかを決める必要があるためである。元のオブジェクトの先頭へのポインタを得るために、シグナル・ハンドラは以下の処理を行う。一般に、コンピュータ（２０１）は、シグナル・ハンドを使用して、例外が起きた命令のアドレスがわかるので、当該アドレスにある命令を読み出すと、例えば、下記式４で表されるフォーマットで表される命令が得られる（下記図１８に対応する発明の詳細な説明の記載を参照）。

　［式４］
　load（ロード），ロード先レジスタ，［ポインタ値の入っているレジスタ，オフセット］

　さらに、コンピュータ（２０１）は、シグナル・ハンドを使用して、例外が起きたときのレジスタの値が読めるので、上記フォーマット中の「ポインタ値の入っているレジスタ」の中身のポインタ値を読むことができる。そこで、オブジェクトにアクセスする命令が下記式５に示すフォーマットであるように、ＪＩＴコンパイラ又はインタープリタが改変される。

　［式５］
　load（ロード），ロード先レジスタ，［オブジェクトの先頭へのポインタ値の入っているレジスタ，オフセット］

　ただし、現在のＪＩＴコンパイラが吐き出すコード又はインタープリタは、上記フォーマット形式でオブジェクトにアクセスしていることがほとんどであるので、上記改変をする必要性は少ないであろう。このようにして、コンピュータ（２０１）は、シグナル・ハンドを使用して、式２で示される命令を読み出して、さらに「オブジェクトの先頭へのポインタ値」を読み出す。「オブジェクトの先頭へのポインタ値」は実際にはバリア・ポインタであるので、コンピュータ（２０１）は、シグナル・ハンドを使用して、当該「オブジェクトの先頭へのポインタ値」についてアンバリアライズを行う。その結果、コンピュータ（２０１）は、元のオブジェクトの先頭へのポインタ値を入手することができる

　例えばメモリ参照が[base_reg_object_head, reg_offset/imm_offset]のフォーマットで表される場合、コンピュータ（２０１）は、base_reg_object_headを読み取り、そしてアンバリアライズすることによって逆変換を行う（図１８に対応する発明の詳細な説明の記載を参照）。また、当該逆変換は、上記ステップ１４０２で述べた例の場合、変換されたポインタをステップ１４０２でｎビット数分右シフトしたのと同じｎビット数分だけ左シフトすることによって行われる。または、当該逆変換は、例えば、例外が発生した命令を参照して、当該例外が発生した命令から、ポインタが変換されたオブジェクトの先頭へのポインタを取得し、当該取得したポインタを逆変換して元のオブジェクトの先頭へのポインタを取得することによって行われる。

　ステップ１４０８では、処理部（２１３）は、オブジェクトに応じた処理が必要かどうかを、例えばオブジェクトのヘッダ情報を参照して確認する。オブジェクトのヘッダには、例えば圧縮又は遅延割付などを識別するための符号が書かれている。例えば、ヘッダの特定のフィールドに“０”と書かれている場合は通常のフォーマットを意味し、同フィールドに“１”と書かれている場合は圧縮されたフォーマットを意味し、及び同フィールドに“２”と書かれている場合は、割り付けが遅延されたフォーマットを意味する。オブジェクトに応じた処理が必要な場合、当該処理はステップ１４０９に進む。一方、オブジェクトに応じた処理が必要でない場合、当該処理はステップ１４１０に進む。

　ステップ１４０９では、処理部（２１３）は、シグナル・ハンドラを使用して、逆変換された元のポインタが指すオブジェクトのヘッダ情報を参照して、当該オブジェクトのフォーマットに適した処理を行う。オブジェクトのフォーマットに適した処理とは、例えば、オブジェクトへのアクセスのログを取ること、オブジェクトを元の形式へ戻すこと、新しい形式のままオブジェクトのフィールドにアクセスすることを包含する。オブジェクトへのアクセスのログを取ることで、プログラムの最適化においても、本発明の実施態様であるオブジェクトへのアクセスを検出する方法を使用することが可能である。オブジェクトを元の形式へ戻すこととは、例えばアクセスされるオブジェクトが圧縮されている場合に当該圧縮オブジェクトを伸長すること、又はアクセスされる文字配列を遅延割り当てすることである。

　ステップ１４１０では、実行部（２１４）は、シグナル・ハンドラを使用して、逆変換された元のポインタが指すオブジェクトにアクセスする。そして、当該処理は、ステップ１４０３に戻る。

　ステップ１４０６では、コンピュータ（２０１）は、シグナル・ハンドラを使用して、例外が起きたデータ・アドレスが読み書き保護領域の中にあるデータ・アドレスでないことに応じて、当該例外が不正なアクセスであると判断し、当該不正なアクセスに応じた処理を行う。当該処理は、例えば、メモリ・ダンプの取得である。

　ステップ１４０７では、コンピュータ（２０１）は、オブジェクトへのアクセスを検出するアルゴリズムを終了する。

　図１５は、本発明の実施態様に従う、ピンニング・アレイ・スロットを使用してメモリ・アクセス例外を処理するアルゴリズムのフローチャートを示す。
　図１４のアルゴリズムでは、逆変換部（２１２）によって実行されるステップ１４０５において、［オブジェクトの先頭へのポインタ値の入っているレジスタ，オフセット］（式５を参照）という式を使用してアンバリアライズを行い、元のオブジェクトの先頭へのポインタ値が得られることを説明した。しかしながら、このような形式にできないオブジェクト・アクセスがありうる。特に、配列オブジェクトへのアクセスにおいて顕著である。そこで、配列オブジェクトへのアクセスがある場合に、本アルゴリズムを使用しうる。なお、図１５のアルゴリズムはステップ１５０４及び１５０７を有している点で図１４のアルゴリズムと異なり、ステップ１５０８～１５０９を経由する場合に図１４に対応する処理（すなわち、ピンニング・アレイ・スロットを使用しない態様）が行われる。
　配列オブジェクトへのアクセスは、下記式６～８で表される命令列になりうる。

　［式６］
　　レジスタＸ=配列オブジェクトの先頭へのポインタ値

　［式７］
　　レジスタＸ=レジスタＸ＋インデックス

　［式８］
　　ロード(load)，ロード先レジスタ，［レジスタＸ，オフセット］

　ここで、式６のポインタ値がバリア・ポインタであった場合、式８の時点でのレジスタＸの値から元の配列オブジェクトの先頭へのポインタ値を得ることは一般に困難である。なぜならば、単にアンバリアライズを行っても変なポインタ値になるだけであるからである。このようなレジスタＸの値は、オブジェクトの先頭でなく内部を指すので、内部ポインタを呼ばれる。そこで、このような配列オブジェクトへのアクセスについては、下記式９～１２で表されるようにアクセスするように、ＪＩＴコンパイラ又はインタープリタを改変する。

　［式９］　　　　　　　　　　　　
　　レジスタＸ=配列オブジェクトの先頭へのポインタ値

　［式１０］
　　pinning_array_slot=レジスタ

　［式１１］
　　レジスタＸ=レジスタＸ＋インデックス

　［式１２］
　　ロード(load)，ロード先レジスタ，［レジスタＸ，オフセット］

　式１０において、配列オブジェクトの先頭へのポインタ値をピンニング・アレイ・スロット（pinning_array_slot）中に保存しておく。ピンニング・アレイ・スロットは、オブジェクトの先頭へのポインタ値を保存しておく領域である。ピンニング・アレイ・スロットは、実際には、別のレジスタ又はスタック中にあるスロットである。また、式１２の命令アドレスから、対応するピンニング・アレイ・スロットのレジスタ又はスロットのレジスタ又はスロット番号への対応表を作っておく。シグナル・ハンドラは、例外が起きた命令のアドレスをキーにして、上記対応表を引く。もし対応するピンニング・アレイ・スロットがある場合、当該対応するピンニング・アレイ・スロットから配列オブジェクトの先頭へのポインタ値を読み出す。当該読み出されたポインタ値はバリア・ポインタであるので、アンバリアライズを行って元の配列オブジェクトの先頭へのポインタ値を得ることができる。このピンニング・アレイ・スロットは、ＧＣがオブジェクトを移動できるようにするために、例えばＪａｖａ（商標）ＶＭに例えば内部ポインタ・アウェア（aware）ＧＣとして既にサポートされているものである。内部ポインタ・アウェアＧＣとは、オブジェクト内部を指すポインタを扱うことのできるＧＣである。従って、ＪＩＴコンパイラ又はインタープリタを改変する必要は実際にはない。ただし、上記対応表が本発明の実施態様において新たに用意される必要があるものである。また、内部ポインタを用いた配列アクセスの箇所は実際にはプログラム中に多くはないので、対応表自体が大きくなりメモリを消費しすぎるということはない。

　以下に、上記ピンニング・アレイ・スロットを使用して、内部ポインタを使用する配列オブジェクトへのアクセス例外を処理するアルゴリズムのフローチャートを示す。
　ステップ１５０１では、コンピュータ（２０１）は、シグナル・ハンドラを使用して、メモリ・アクセス例外を処理するアルゴリズムを開始する。当該アルゴリズムの開始後に、読み書き保護領域へのアクセスで例外が起きて、シグナル・ハンドラが呼び出され、そして当該シグナル・ハンドラが実行される。

　ステップ１５０２では、コンピュータ（２０１）は、読み書き保護領域へのアクセスで例外が起きた場合に、例外を検出して、シグナル・ハンドラを起動する。例外が発生している場合、当該処理はステップ１５０３に進む。一方、例外が発生していない場合は、例外の発生を待つ。なお、コンピュータ（２０１）は、起動された上記シグナル・ハンドラを使用して、以下のステップ１５０３～１５１３の各処理を行う。

　ステップ１５０３では、コンピュータ（２０１）は、シグナル・ハンドラを使用して、例外が起きたデータ・アドレスが読み書き保護領域の中にあるデータ・アドレスかどうかを確認する。例外の発生は、例えば、セグメンテーション違反（セグメンテーション・フォールトともいう）の発生である。セグメンテーション違反は、ソフトウェアの実行時に起きる特定のエラー条件であり、アクセスが許可されていないメモリ上の位置、もしくは許可されていない方法（例えば、リードオンリーの位置へ書き込みをしようとする又はオペレーティング・システムの部分を上書きしようとする）でメモリ上の位置のアクセスしようとするときに起きる。例外が起きたデータ・アドレスが読み書き保護領域の中にあるデータ・アドレスであることに応じて、当該処理はステップ１５０４に進む。一方、例外が起きたデータ・アドレスが読み書き保護領域の中にあるデータ・アドレスでないことに応じて、当該処理はステップ１５０５に進む。

　ステップ１５０４では、コンピュータ（２０１）は、シグナル・ハンドラを使用して、例外が起きた命令アドレスに対応するピンニング・アレイ・スロットがあるかどうかを判定する。そのような各アクセスを、配列オブジェクトのヘッドへのポインタを含むスタック・スロットに関連付ける。この関連付けられたスロットを、上記されているように、ピンニング・アレイ・スロットという。ピンニング・アレイ・スロットには、各命令が関連付けられている。ピンニング・アレイ・スロットがあることに応じて、当該処理はステップ１５０７に進む。

　ステップ１５０７では、コンピュータ（２０１）は、シグナル・ハンドラを使用して、ピンニング・アレイ・スロットから元のオブジェクトの先頭のアドレスに対応するバリア・ポインタを読み出す。

　ステップ１５１０では、コンピュータ（２０１）は、シグナル・ハンドラを使用して、読み出したバリア・ポインタを逆変換して、元のオブジェクトの先頭のアドレスを得る。逆変換については、上述したとおりである。

　ステップ１５１１では、コンピュータ（２０１）は、シグナル・ハンドラを使用して、逆変換された元のポインタが指すオブジェクトのヘッダ情報を参照して、当該オブジェクトのフォーマットに適した処理を行う。オブジェクトのフォーマットに適した処理とは、例えば、オブジェクトへのアクセスのログを取る、オブジェクトを元の形式へ戻す、新しい形式のままオブジェクトのフィールドにアクセスすることを包含する。オブジェクトを元の形式へ戻すとは、例えばオブジェクトが圧縮されている場合に当該圧縮オブジェクトを伸長すること、又は文字配列を遅延割り当てをすることである。

　ステップ１５１２では、コンピュータ（２０１）は、シグナル・ハンドラを使用して、逆変換された元のポインタが指すオブジェクトにアクセスする。そして、当該処理は、ステップ１５１３に進む。

　ステップ１５１３では、コンピュータ（２０１）は、シグナル・ハンドラを使用して、メモリ・アクセス例外を処理するアルゴリズムを終了する。

　ステップ１５０５では、コンピュータ（２０１）は、シグナル・ハンドラを使用して、例外が起きたデータ・アドレスが読み書き保護領域の中にあるデータ・アドレスでないことに応じて、当該例外が不正なアクセスであると判断し、当該不正なアクセスに応じた処理を行う。当該処理は、例えば、メモリ・ダンプの取得である。

　ステップ１５０６では、コンピュータ（２０１）は、シグナル・ハンドラを使用して、オブジェクトへのアクセスを検出するアルゴリズムを終了する。

　ステップ１５０８では、コンピュータ（２０１）は、シグナル・ハンドラを使用して、例外が起きた命令アドレスの命令をデコードして、ベース・レジスタ番号をメモリ内に読み出す。コンピュータ（２０１）は、シグナル・ハンドラを使用して、例外が起きたときの全てのレジスタ値を読み出すことができる。

　ステップ１５０９では、コンピュータ（２０１）は、シグナル・ハンドラを使用して、ステップ１５０８において読み出されたベース・レジスタ番号に対応するレジスタ値をメモリ内に読み出す。当該読み出したレジスタ値が、元のオブジェクトの先頭のアドレスに対応するバリア・ポインタである。当該処理はステップ１５１０に進み、上記されているように、当該読み出したレジスタ値（バリア・ポインタである）が逆変換されて、元のオブジェクトの先頭アドレスが得られる。

　下記図１６及び図１７において、本発明の実施態様に従う種々のバリアライズするアルゴリズムの例を示す。バリアライズは、図１４のステップ１４０２において実行される。

　図１６は、本発明の実施態様に従う、オブジェクトの割り付けにおいてバリアライズするアルゴリズムのフローチャートを示す。
　図１６のステップ１６０１～１６０４は、図１４のステップ１４０２において行われる処理の一つの実施態様である。
　ステップ１６０１では、コンピュータ（２０１）は、バリアライズを開始する。
　ステップ１６０２では、コンピュータ（２０１）は、ヒープメモリにオブジェクトを割り付ける。上記オブジェクトが割り付けられた直後において、当該割り付けられたオブジェクトを指すポインタは1つだけである。
　ステップ１６０３では、コンピュータ（２０１）は、上記オブジェクトが割り付けられた直後において、上記ポインタを読み書き保護領域を指すように変換する。
　ステップ１６０４では、コンピュータ（２０１）は、上記逆変換の終了に応じて、上記アルゴリズムを終了する。

　図１７は、本発明の実施態様に従う、ＧＣにおいてバリアライズするアルゴリズムのフローチャートを示す。
　図１７のステップ１７０１～１７１０は、図１４のステップ１４０２において行われる処理の一つの実施態様である。
　ステップ１７０１では、コンピュータ（２０１）は、バリアライズを開始する。
　ステップ１７０２では、コンピュータ（２０１）は、ポインタへのポインタを保存するための集合Ｓを空にする。
　ステップ１７０３では、コンピュータ（２０１）は、レジスタ又はスタックなどのＧＣのルート集合を上記集合Ｓに追加する。
　ステップ１７０４では、コンピュータ（２０１）は、集合Ｓに要素が入っているかどうかを検査する。集合Ｓに要素が入っている場合、当該処理はステップ１７０５に進む。一方、集合Ｓに要素が入っていない場合、当該処理はステップ１７０６に進む。
　ステップ１７０５では、コンピュータ（２０１）は、集合Ｓに要素が入っていることに応じて、集合Ｓから要素を１つ取り出す。この取り出した要素を要素Ｐと名付ける。要素Ｐはポインタへのポインタである。
　ステップ１７０６では、コンピュータ（２０１）は、集合Ｓに要素が入っていないことに応じて、上記アルゴリズムを終了する。
　ステップ１７０７では、コンピュータ（２０１）は、要素Ｐが指す先のポインタが指す先のオブジェクト・フォーマットが変形されたオブジェクト・フォーマットであるかどうかを検査する。上記変形されたフォーマットである場合、当該処理はステップ１７０８に進む。一方、上記変形されたフォーマットでない場合、当該処理はステップ１７０９に進む。
　ステップ１７０８では、コンピュータ（２０１）は、要素Ｐが指す先のポインタが指す先のオブジェクト・フォーマットが、変形されたオブジェクト・フォーマットであることに応じて、要素Ｐが指す先のポインタを、読み書き保護領域を指すように変換して、Ｐが指す先のメモリに格納する。ステップ１７０８は、ＧＣにおいてバリアライズするステップである。
　ステップ１７０９では、コンピュータ（２０１）は、要素Ｐが指す先のポインタが指す先のオブジェクトＱをＧＣのルーチンで処理する。当該ＧＣのルーチンは、典型的にはオブジェクトＱを生きていると見なして、当該オブジェクトＱにマーク付けをする。
　ステップ１７１０では、コンピュータ（２０１）は、オブジェクトＱの中のポインタ・フィールド（例えば、図３の３２２）へのポインタを集合Ｓに追加する。

　図１８～図２５は、本発明の実施態様である、図１７の各ステップにおける仮想アドレス・スペースの例を示す。

　図１８Ａは、本発明の実施態様である、図１７のステップ１７０１（ＧＣ開始前）における仮想アドレス・スペースを示す。
　コンピュータ（２０１）のメモリ上に仮想アドレス・スペース（１８０１）がある。仮想アドレス・スペース（１８０１）上に、読み書き保護領域（１８０２）及びスレッドのスタック領域（１８０３）がある。読み書き保護領域（１８０２）には、実メモリが割り付けられていない。スレッドのスタック領域（１８０３）は、ＧＣのルート集合の一部である。

　オブジェクトＸ（１８１１）のポインタ（１８２１）は、オブジェクトＹの先頭アドレスを指す。また、オブジェクトＸ（１８１１）のポインタ（１８２２）は、圧縮オブジェクトＡ（１８１２）の先頭アドレスを指す。オブジェクトＹ（１８１３）のポインタ（１８２３）は、圧縮オブジェクトＡ（１８１２）の先頭アドレスを指す。
　また、スレッドのスタック領域中のポインタ（１８３１）は、オブジェクトＸ（１８１１）の先頭アドレスを指す。

　オブジェクトＡ（１８１２）は圧縮されたフォーマットになっている。従って、オブジェクトＡへのポインタ（１８２２及び１８２３）をバリア・ポインタに変換する必要がある。

　図１８Ｂは、各オブジェクトＸ、Ｙ及びＡと、各オブジェクトＸ、Ｙ及びＡの先頭を指す各ポインタ値と、各オブジェクトＸ、Ｙ及びＡに対応する各バリア・ポインタ値を示す。なお、通常のオブジェクト・フォーマットのポインタは、各ポインタ値の上位２ビットが１１以外のポインタである。バリア・ポインタは、上記通常のオブジェクト・フォーマットのポインタを２ビット数分右シフトし、そして空いた上位２ビットに１１を立てた値である。

　図１８Ｃは、図１８～図２５において示される４つのポインタを示し、且つ当該ポインタそれぞれを指すポインタ値（当該ポインタそれぞれが保持しているポインタ値でないことに留意されたい）を示す。なお、当該ポインタそれぞれを指すポインタ値は、前提として与えられた値である。

　図１９Ａは、本発明の実施態様である、図１７のステップ１７０３における仮想アドレス・スペースを示す。
　ステップ１７０３では、コンピュータ（２０１）は、ＧＣのルート集合が集合Ｓに加えられることから、オブジェクトＸを指す、スタック領域中のポインタを指すポインタ値（000000）を集合Ｓに追加する（図１９Ｂ）。

　図２０Ａは、本発明の実施態様である、図１７のステップ１７０４及び１７０５を通じて処理される場合における仮想アドレス・スペースを示す。
　ステップ１７０５では、コンピュータ（２０１）は、集合Ｓから要素Ｐを取り出すことから、オブジェクトＸを指す、スタック領域中のポインタを指すポインタ値（000000）を集合Ｓから取り出す（図２０Ｂ）。

　図２１Ａは、本発明の実施態様である、図１７のステップ１７０７、１７０９及び１７１０を通じて処理される場合の仮想アドレス・スペースを示す。
　ステップ１７１０では、コンピュータ（２０１）は、オブジェクトＸの中のポインタ・フィールドへのポインタを集合Ｓに追加する（図２１Ｂ）。すなわち、コンピュータ（２０１）は、オブジェクトＹを指す、オブジェクトＸの中のポインタを指すポインタ値（001000）、及び、オブジェクトＡを指す、オブジェクトＸの中のポインタを指すポインタ値（001100）を、集合Ｓに追加する。そして、コンピュータ（２０１）は、要素Ｐをクリアにする。なお、図２１ＡのオブジェクトＸは、図１７のステップ１７１０でいうオブジェクトＱに対応する。

　図２２Ａは、本発明の実施態様である、図１７のステップ１７０４、１７０５、１７０７、１７０９及び１７１０を通じて処理される場合の仮想アドレス・スペースを示す。
　ステップ１７０５では、コンピュータ（２０１）は、集合Ｓから要素Ｐ（ここでは、オブジェクトＹを指す、オブジェクトＸの中のポインタを指すポインタ値（001000））を取り出すことから、オブジェクトＹを指す、オブジェクトＸの中のポインタを指すポインタ値（001000）を集合Ｓから取り出す。そして、ステップ１７１０では、コンピュータ（２０１）は、オブジェクトＹの中のポインタ・フィールドへのポインタを集合Ｓに追加し、要素Ｐをクリアする（図２２Ｂ）。すなわち、コンピュータ（２０１）は、オブジェクトＡを指す、オブジェクトＹの中のポインタを指すポインタ値（011100）を、集合Ｓに追加し、且つ、要素Ｐ（オブジェクトＹを指す、オブジェクトＸの中のポインタを指すポインタ値（001000））をクリアする。なお、図２２ＡのオブジェクトＹは、図１７のステップ１７１０でいうオブジェクトＱに対応する。

　図２３Ａは、本発明の実施態様である、図１７のステップ１７０４、１７０５、１７０７及び１７０８を通じて処理される場合の仮想アドレス・スペースを示す。
　ステップ１７０５では、コンピュータ（２０１）は、集合Ｓから要素Ｐ（ここでは、オブジェクトＡを指す、オブジェクトＸの中のポインタを指すポインタ値（001100））を取り出すことから、オブジェクトＡを指す、オブジェクトＸの中のポインタを指すポインタ値（001100）を集合Ｓから取り出す。そして、ステップ１７０８では、コンピュータ（２０１）は、オブジェクトＡを指す、オブジェクトＸの中のポインタ（100000）を書き換えて（右へ２ビット数分シフトし、空きビットへ11を追加する）、バリア・ポインタ（111000）に変換する。そして、ステップ１７１０では、コンピュータ（２０１）は、要素Ｐをクリアする。なお、図２３ＡのオブジェクトＡは、図１７のステップ１７１０でいうオブジェクトＱに対応する。

　図２４Ａは、本発明の実施態様である、図１７のステップ１７０８、１７０９、１７１０、１７０４、１７０５、１７０７及び１７０８を通じて処理される場合の仮想アドレス・スペースを示す。
　ステップ１７０５では、コンピュータ（２０１）は、集合Ｓから要素Ｐ（ここでは、オブジェクトＡを指す、オブジェクトＹの中のポインタを指すポインタ値（011100））を取り出すことから、オブジェクトＡを指す、オブジェクトＹの中のポインタを指すポインタ値（011100）を集合Ｓから取り出す。そして、ステップ１７０８では、コンピュータ（２０１）は、オブジェクトＡを指す、オブジェクトＹの中のポインタ（100000）を書き換えて（右へ２ビット数分シフトし、空きビットへ11を追加する）、バリア・ポインタ（111000）に変換する。そして、ステップ１７１０では、コンピュータ（２０１）は、要素Ｐをクリアする。なお、図２４ＡのオブジェクトＡは、図１７のステップ１７１０でいうオブジェクトＱに対応する。

　図２５Ａは、本発明の実施態様である、図１７のステップ１７０９、１７１０、１７０４及び１７０６を通じて処理される場合の仮想アドレス・スペースを示す。
　ステップ１７１０では、コンピュータ（２０１）は、要素Ｐをクリアにする。そしてステップ１７０４に戻り、コンピュータ（２０１）は、集合Ｓに要素が入っていないので、処理をステップ１７０６に進めて、終了する。図２５Ｂは、バリアライズが終了した際の仮想アドレス・スペースを示す。

　図２６は、本発明の実施態様に従う、シグナル・ハンドラを呼び出して、変換されたポインタから元のポインタを回復（逆変換）させる動作の例を示す。
　SIGSEGVは、セグメンテーション違反シグナルを示す。
　コード（２６０１）は、符号２６０２に示されている操作を行うコードである。メモリ参照は、下記のフォーマットで表される：[base_reg_object_head,
reg_offset/imm_offset]。また、オブジェクトへのアクセス（ＣＰＵのメモリへのアクセス命令）は、“ld/st reg,
[base_reg_object_head, reg/imm_offset]”（ロード／ストア，ロード先レジスタ，［ポインタ値の入っているレジスタ，オフセット］）のフォーマットでなければならない。
　コード（２６０１）は、下記に示す内容の動作を行う（２６０２を参照）。
　・命令を0×ab04でデコードする；
　・r12をメモリr3に読み込む；（r12はbase_reg_object_headである）
　・r12の最上位の２ビットが設定される場合であって、
　　　0xab04がピンニング・アレイ・スロットに関連付けられている場合、
　　　　元のポインタをピンニング・アレイ・スロットから取得し、
　　　関連付けられていない場合、
　　　　元のポインタを、r12から２ビット数分だけ左シフトすることによって取得し、　　そして、オブジェクトが元のポインタによって指されているようにバリア・ポインタから元のポインタを回復する。

　図２７は、本発明の実施態様に従う、シグナル・ハンドラ・アルゴリズムの例を示す。　バリア・ポインタを介するアクセスはハードウェア・メモリ例外をいつも生じ、当該メモリ例外はＯＳによって信号に変換される。図２７のアルゴリズムは、Ｊａｖａ（商標）ＶＭに実装されるシグナル・ハンドラ・アルゴリズムを示す。以下に、そのアルゴリズムの内容を説明する。

（１）ヘッド・ポインタの回復（逆変換）
　ＯＳは、例外コード・アドレス、例外データ・アドレス、及びハードウェア例外の時間でのレジスタのシグナル内容を保持するシグナル内容をシグナル・ハンドラに渡す。シグナル・ハンドラは、まず、例外データ・アドレスが、アドレス比較によって読み書き保護領域内にあるかどうかをチェックする（行２）。例外データ・アドレスが読み書き保護領域内にある場合、シグナル・ハンドラは、アクセスされるオブジェクトのヘッドへのポインタ（以下、「ヘッダ・ポインタ」という）を回復させなければならない。オブジェクトの内部へのポインタ（以下、「内部ポインタ」という）は十分でない。なぜならば、シグナル・ハンドラはプロファイリング又はリカバリを実行するかどうかを決定するために、オブジェクトのヘッダを参照しなければならないからである（行１１）。一般的に、例外データ・アドレスをアンバリアライズすることは内部ポインタを生成するのみである。もしＪａｖａ（商標）ＶＭが内部ポインタからヘッダ・ポインタを得るための機能をサポートするならば、当該機能が使用されうる。一般的にそのようなサポートがないので、オブジェクト・アクセス命令がＪＩＴコンパイラにより生成されたコード又はインタープリタ・コードであるかどうかにかかわらず、オブジェクト・アクセス命令のフォーマットを制限する必要がある。このことは、メモリ・レジスタのレジスタ引数がヘッダ・ポインタでなければならないことを意味する。例えば、形式[base_reg,
offset_reg/immediate]のメモリ参照において、base_regは、ヘッダ・ポインタでなければならない。次に、オブジェクト・アクセス命令を伸長し、且つシグナル内容からbase_regの内容をメモリ内にロードすることによってバリアライズされたヘッダ・ポインタが得られうる（行６～８）。この制限は、既存のＪａｖａ（商標）ＶＭ及びＪＩＴコンパイラにおいて通常満足される。

　しかしながら、この制限は、大きいオブジェクトをアクセスする場合に破壊されうる。例えば、ＪＩＴコンパイラにおいてループ導出変数最適化及び強度減少は、配列への内部ポインタをもたらしうる。内部ポインタを使用するそれら命令のために、メソッドのレジスタにおいて又はスタック・スロットにおいてヘッダ・ポインタを維持するためにＪＩＴコンパイラで生成されたコードが改変される。多くのＪＩＴコンパイラは、ＧＣがルート・オブジェクトをトラバースすることを助けるためにこの機能を既にサポートしている。このサポートなしに、ＧＣは内部ポインタによって指されているオブジェクトをマーク付け又は移動することができない。加えて、ＪＩＴコンパイラは、内部ポインタを使用する各命令を、ヘッダ・ポインタを保持するレジスタ番号又はスタック・オフセットに関連付けるために改変される必要がある。このことは、シグナル・ハンドラが例外コード・アドレスからヘッダ・ポインタを入手することを可能にする（行３～４）。ほとんどのオブジェクト・アクセス命令が内部ポインタを使用しないので、上記関連付けられたデータ構造が過剰的に増えることはない。

（２）オブジェクト・アクセスのエミュレーション
　ヘッダ・ポインタのアンバリアライズ後に（行１０）、シグナル・ハンドラは、オブジェクトのヘッダに依存して回復操作又はプロファイリングを実行する。回復を必要とするオブジェクトはそれらのヘッダに設定されている特別なビットを有する。プロファイリングのために、シグナル・ハンドラは、アクセスを記録し（行１６）及び例外命令の実行をエミュレートする（行１７）。例えばロードをエミュレートすることは、例外ロード命令の代わりにロードを実行し、そしてロードされた値をシグナル内容中のターゲット・レジスタに書き込むことを意味する。シグナル・ハンドラは、ベース・レジスタにアンバリアライズされたポインタを書き込むこと、そして例外命令を戻してそれを再実行することを許されていない。このアプローチを使用して、アンバリアライズされたポインタを使用する次の命令がハードウェア例外をもはや生じさせず、従ってプロファイルされるべきアクセスの幾つかをミスされることを生じさせる。悪いことに、このアプローチはプログラムのセマンティクスを変化させうる。なぜならば、幾つかのオブジェクトは、２つの異なるポインタ値によって表され、ポインタ・イクオリティ命令が、２つのオブジェクトが同じオブジェクトを参照している場合でさえもファールスを戻すことを生じさせる。それ故に、シグナル・ハンドラは例外命令をエミュレートすることが必要である。

　図２８は、本発明の実施態様に従う、オブジェクトへのアクセスの頻度とオーバーヘッドとの関係についての実験結果を示す。
　ポインタが指すオブジェクトにほとんどアクセスがないことを仮定した最適化の場合を考える。ポインタが指すオブジェクトにほとんどアクセスがない場合とは、例えば、当該オブジェクトが圧縮されている場合（図４を参照）、又はオブジェクトが遅延割り付けされる場合（図５を参照）である。従来技術である永続的なオブジェクト・データベース方式では、全てのオブジェクトの全アクセスにおいて実行時チェックをする必要がある。一方、本願発明の実施態様に従うと、ポインタが指すオブジェクトへのアクセスでのみ例外処理のオーバーヘッドがかかる。従って、本願発明の実施態様に従うと、オーバーヘッドが低減される。

　以下に、監視対象であるオブジェクトへのアクセス頻度とオーバーヘッドとの関係についての実験結果を示す。
　実験は、Ｎバイトのオブジェクトを割り付けるごとに１オブジェクトをアクセス監視の対象とした。なお、監視対象であるオブジェクトに頻繁にアクセスがあるものとする。当該実験は、Ｌｉｎｕｘ（商標）　ｐ６　４．７ＧＨｚ×１６上でＩＢＭ（商標）ｐｐｃ－３２　Ｊ９／ＴＲ　Ｊａｖａ（登録商標）６（ＳＲ６）を使用して行われた。図２８は、その結果のグラフを示す。グラフから、SPEC(Standard
Performance Evaluation Corporation)jvm2008のcompiler.compilerベンチマークに従うと、バイト数が３２ＫＢ又は４ＫＢにおいてオーバーヘッドが３％程度存在するが、バイト数が６４ＭＢ又は４ＭＢにおいてはオーバーヘッドがほとんど存在しないことがわかる。

　また、ポインタが指すオブジェクトが、図４に示す圧縮されたオブジェクト（４０２）を用意した。そして、当該圧縮されたオブジェクト（４０２）を使用して、図１４に従う方法を実装するコンピュータ上で、SPECjbb2005(Java（商標）
Server Benchmark)ベンチマーク・プログラムを実行した。その結果、割り当て時に圧縮されたオブジェクト（４０２）を割り当てる手法により、SPECjbb2005のベンチマーク値が６．８％改善された。

　また、ポインタが指すオブジェクトが、図５に示す遅延的に割当てられるストリング・オブジェクト（５０２）を用意した。そして、当該ストリング・オブジェクト（５０２）を使用して、図１４に従う方法を実装するコンピュータ上で、DaCapoベンチマーク中のbloatベンチマーク・プログラムを実行した。その結果、ストリング・オブジェクト（５０２）の場合、「bloat」ベンチマークが６％スピードアップされた。

　上記では、ポインタが指すオブジェクトにほとんどアクセスがないことを仮定した最適化の場合を考えた。しかし、上記ポインタが指すオブジェクトに頻繁にアクセスがあるようであれば、そもそもオブジェクトを圧縮又は遅延割り当ての対象とすることはない。または、上記ポインタが指すオブジェクトに頻繁にアクセスがある場合、本発明の実施態様を使用してオブジェクトのアクセス箇所がわかる。なぜならば、図１５のステップ１５０３に示されているように、例外が起きた命令アドレスがわかり、それがオブジェクトのアクセス箇所であるからである。よって、ＪＩＴコンパイラでプログラムを再コンパイルして、上記アクセス箇所だけについて、実行時チェックをするようにすればよい。

Claims

　コンピュータ処理において、オブジェクトへのアクセスを検出する方法であって、当該コンピュータが、
　当該オブジェクトへのポインタを操作して、当該ポインタを読み書き保護領域を指すポインタに変換するステップと、
　前記読み書き保護領域へのアクセス要求に応じて例外が発生することを利用して、前記変換されたポインタから元のポインタへ逆変換するステップと
　を実行することを含む、前記方法。
　前記逆変換するステップが、
　前記例外が発生した命令を参照して、当該例外が発生した命令から、前記操作されたポインタを取得するステップと、
　前記取得されたポインタを逆変換して、当該逆変換された元のポインタが指すオブジェクトの先頭へのポインタを取得するステップと
　を含む、請求項１に記載の方法。
　前記コンピュータが、
　前記逆変換された元のポインタが指すオブジェクトのヘッダ情報を参照して、当該逆変換された元のポインタが指すオブジェクトのフォーマットに適した処理をするステップ
　をさらに実行することを含む、請求項２に記載の方法。
　前記コンピュータが、
　前記フォーマットに適した処理を行った後に、前記逆変換された元のポインタが指すオブジェクトにアクセスするステップ
　をさらに実行することを含む、請求項３に記載の方法。
　前記フォーマットに適した処理が、圧縮オブジェクトの伸長、又は、文字配列の遅延割り当てである、請求項３に記載の方法。
　前記変換するステップが、ポインタに一定のオフセット値を加えて、前記読み書き保護領域を指すポインタを得るステップを含む、請求項１に記載の方法。
　前記逆変換するステップが、前記変換されたポインタから一定のオフセット値を減じて、前記元のポインタを得るステップを含む、請求項６に記載の方法。
　前記変換するステップが、前記オブジェクトへの前記ポインタをｎビット数分（ｎは整数である）右シフトし、そして一定のオフセット値を加えて、前記読み書き保護領域を指すポインタを得るステップを含む、請求項１に記載の方法。
　前記逆変換するステップが、前記変換されたポインタから一定のオフセット値を減じ、そして前記ｎビット数分左シフトして、前記元のポインタを得るステップを含む、請求項８に記載の方法。
　前記読み書き保護領域が、オペレーティング・システムの保護領域である、請求項１に記載の方法。
　前記変換するステップが、前記オブジェクトへの前記ポインタをｎビット数分（ｎは整数である）右シフトし、そして空いた左ビットに読み書き保護領域のアドレスを埋め込んで、前記読み書き保護領域を指すポインタを得るステップを含む、請求項１に記載の方法。
　前記逆変換するステップが、前記変換されたポインタを前記ｎビット数分左シフトして、前記元のポインタを得るステップを含む、請求項１１に記載の方法。
　前記逆変換するステップが、
　前記例外が発生した命令アドレスと、オブジェクトの先頭へのポインタ値を格納するスロットのレジスタ又はスロット番号との対応表を参照して、当該例外が発生した命令アドレスから、前記操作されたポインタを取得するステップと、
　前記取得されたポインタを逆変換して、当該逆変換された元のポインタが指すオブジェクトの先頭へのポインタを取得するステップを含む、請求項１に記載の方法。
　前記変換するステップが、オブジェクトの割り付けにおいて、又は、ガーベジ・コレクションにおいて行われる、請求項１に記載の方法。
　前記例外の発生が、セグメンテーション違反の発生である、請求項１に記載の方法。
　前記例外の発生によりシグナル・ハンドラが起動し、当該シグナル・ハンドラを使用して、前記逆変換するステップが実行される、請求項１に記載の方法。
　オブジェクトへのアクセスを検出するコンピュータであって、
　当該オブジェクトへのポインタを操作して、当該ポインタを読み書き保護領域を指すポインタに変換する変換部と、
　前記読み書き保護領域へのアクセス要求に応じて例外が発生することを利用して、前記変換されたポインタから元のポインタへ逆変換する逆変換部と
　を備えている、前記コンピュータ。
　前記変換部が、さらに、前記例外が発生した命令を参照して、当該例外が発生した命令から、前記操作されたポインタを取得し、当該取得されたポインタを逆変換して、当該逆変換された元のポインタが指すオブジェクトの先頭へのポインタを取得し、
　前記コンピュータが、
　前記逆変換された元のポインタが指すオブジェクトのヘッダ情報を参照して、当該逆変換された元のポインタが指すオブジェクトのフォーマットに適した処理をする処理部をさらに備えている、請求項１７に記載のコンピュータ。
　前記フォーマットに適した処理を行った後に、前記逆変換された元のポインタが指すオブジェクトにアクセスする実行部をさらに備えている、請求項１８に記載のコンピュータ。
　コンピュータに、請求項１～１６のいずれか一項に記載の方法の各ステップを実行させるコンピュータ・プログラム。