JP2022510804A

JP2022510804A - 倍精度を用いない隙間のないレイと三角形との交差

Info

Publication number: JP2022510804A
Application number: JP2021527088A
Authority: JP
Inventors: ジョナサンサレハスカイラー; ウールイジン
Original assignee: Advanced Micro Devices Inc
Current assignee: Advanced Micro Devices Inc
Priority date: 2018-12-13
Filing date: 2019-11-05
Publication date: 2022-01-28
Also published as: EP3895133A1; KR20210092231A; WO2020123060A1; US20200193685A1; CN113168728A

Abstract

本明細書では、隙間のない結果を生成する方法でレイ・三角形交差テストを実行する技術について説明する。この技術は、原点がレイの原点になるように三角形の座標を変換することを含む。この技術は、座標系をレイのビュースペースに投影することを含む。この技術は、重心座標を計算し、重心座標を補間して交差時間を取得することを含む。重心座標の符号は、ヒットが発生したかどうかを示す。上記の計算は、隙間のなさを提供するために無向浮動小数点丸めモードで実行される。無向丸めモードは、丸められる数値の仮数が、その数値の符号に依存しない方法で丸められるモードである。【選択図】図３

Description

（関連出願の相互参照）
本願は、２０１８年１２月１３日に出願された米国特許出願第１６／２１９，８２０号の利益を主張するものであり、その内容は、言及することによって本明細書に組み込まれる。

レイトレーシング（ray tracing）は、シミュレートされたレイ（光線）をキャストしてオブジェクトの交差をテストし、レイキャストの結果に基づいてピクセルを着色する、グラフィックスレンダリング技術の一種である。レイトレーシングは、ラスタライズベースの技術よりも計算コストが高くなるが、物理的により正確な結果が得られる。レイトレーシング演算における改良が絶えず行われている。

添付図面に関連して例として示される以下の説明から、より詳細な理解を得ることができる。

本開示の１つ以上の特徴を実装することができる例示的なデバイスのブロック図である。一例による、図１のアクセラレーテッドプロセッシングデバイス上での処理タスクの実行に関連する追加の詳細を示す、デバイスのブロック図である。一例による、レイトレーシング技術を用いてグラフィックスをレンダリングするためのレイトレーシングパイプラインを示す図である。一例による、境界ボリューム階層の図である。一例による、レイ・三角形交差テストを実行するための座標変換を示す図である。一例による、ラスタライズ動作としてのレイ・三角形交差テストを示す図である。本明細書で説明する技術が適用される例示的な三角形を示す図である。

本明細書では、隙間のない（watertight）結果を生成する方法でレイ・三角形交差テスト（ray-triangle intersection test）を実行する技術について説明する。この技術は、三角形の座標を、原点がレイの原点になるように変換することを含む。この技術は、座標系をレイのビュースペースに投影することを含む。この技術は、重心座標を計算し、重心座標を補間して交差時間を取得することを含む。重心座標の符号は、ヒットが発生したかどうかを示す。上記の計算は、隙間のなさを提供するために、無向浮動小数点丸めモード（non-directed floating point rounding mode）で実行される。無向丸めモード（non-directed rounding mode）とは、丸められた数値の仮数が、その数値の符号に依存しない方法で丸められるモードである。

図１は、本開示の１つ以上の特徴を実装することができる例示的なデバイス１００のブロック図である。デバイス１００は、例えば、コンピュータ、ゲーミングデバイス、ハンドヘルドデバイス、セットトップボックス、テレビ、携帯電話、又は、タブレットコンピュータを含む。デバイス１００は、プロセッサ１０２と、メモリ１０４と、記憶装置１０６と、１つ以上の入力デバイス１０８と、１つ以上の出力デバイス１１０と、を含む。デバイス１００は、オプションとして、入力ドライバ１１２及び出力ドライバ１１４も含む。デバイス１００は、図１に示されていない追加のコンポーネントを含むことが理解されよう。

様々な代替例では、プロセッサ１０２は、中央処理装置（ＣＰＵ）、グラフィックス処理装置（ＧＰＵ）、同じダイ上に配置されたＣＰＵ及びＧＰＵ、又は、１つ以上のプロセッサコアを含み、各プロセッサコアは、ＣＰＵ又はＧＰＵであってもよい。様々な代替例では、メモリ１０４は、プロセッサ１０２と同じダイ上に配置されてもよいし、プロセッサ１０２とは別々に配置されてもよい。メモリ１０４は、揮発性メモリ又は不揮発性メモリ（例えば、ランダムアクセスメモリ（ＲＡＭ）、ダイナミックＲＡＭ、キャッシュ等）を含む。

記憶装置１０６は、固定又は着脱可能な記憶装置（例えば、ハードディスクドライブ、ソリッドステートドライブ、光学ディスク、又は、フラッシュドライブ）を含む。入力デバイス１０８は、限定されないが、キーボード、キーパッド、タッチスクリーン、タッチパッド、検出器、マイクロフォン、加速度計、ジャイロスコープ、生体スキャナ、又は、ネットワーク接続（例えば、無線ＩＥＥＥ８０２信号の送信及び／若しくは受信のための無線ローカルエリアネットワークカード）を含む。出力デバイス１１０は、限定されないが、ディスプレイデバイス１１８、スピーカ、プリンタ、触覚フィードバックデバイス、１つ以上の照明、アンテナ、又は、ネットワーク接続（例えば、無線ＩＥＥＥ８０２信号の送信及び／若しくは受信のための無線ローカルエリアネットワークカード）を含む。

入力ドライバ１１２は、プロセッサ１０２及び入力デバイス１０８と通信し、プロセッサ１０２が入力デバイス１０８からの入力を受信することを可能にする。出力ドライバ１１４は、プロセッサ１０２及び出力デバイス１１０と通信し、プロセッサ１０２が出力デバイス１１０に出力を送信することを可能にする。入力ドライバ１１２及び出力ドライバ１１４がオプションのコンポーネントであることと、入力ドライバ１１２及び出力ドライバ１１４が存在しない場合には、デバイス１００が同じように動作することと、に留意されたい。出力ドライバ１１４は、ディスプレイデバイス１１８に結合されたアクセラレーテッドプロセッシングデバイス（ＡＰＤ）を含む。ＡＰＤ１１６は、計算コマンド及びグラフィックスレンダリングコマンドを処理するために、プロセッサ１０２から計算コマンド及びグラフィックスレンダリングコマンドを受信し、画素出力を、表示のためにディスプレイデバイス１１８に提供するように構成されている。以下により詳細に説明するように、ＡＰＤ１１６は、単一命令複数データ（ＳＩＭＤ）パラダイムに従って計算を実行するように構成された１つ以上の並列プロセッシングユニットを含む。よって、本明細書では、様々な機能がＡＰＤ１１６によって又はＡＰＤ１１６と共に実行されるものとして説明するが、様々な代替例では、ＡＰＤ１１６によって実行されるものとして説明する機能は、ホストプロセッサ（例えば、プロセッサ１０２）によって駆動されず、ディスプレイデバイス１１８に（グラフィカルな）出力を提供するように構成された、同様の機能を有する他のコンピューティングデバイスによって追加的又は代替的に実行される。例えば、ＳＩＭＤパラダイムに従って処理タスクを実行する任意のシステムが、本明細書で説明する機能を実行するように構成されてもよいことが考えられる。代わりに、ＳＩＭＤパラダイムに従って処理タスクを実行しないコンピューティングシステムが、本明細書で説明する機能を実行することが考えられる。

図２は、ＡＰＤ１１６上での処理タスクの実行に関連する追加の詳細を示す、デバイス１００のブロック図である。プロセッサ１０２は、システムメモリ１０４において、プロセッサ１０２によって実行される１つ以上の制御ロジックモジュールを維持する。制御ロジックモジュールは、オペレーティングシステム１２０と、ドライバ１２２と、アプリケーション１２６と、を含む。これらの制御ロジックモジュールは、プロセッサ１０２及びＡＰＤ１１６の動作の様々な特徴を制御する。例えば、オペレーティングシステム１２０は、ハードウェアと直接通信し、プロセッサ１０２上で実行される他のソフトウェアのためのハードウェアへのインタフェースを提供する。ドライバ１２２は、例えば、ＡＰＤ１１６の様々な機能にアクセスするために、プロセッサ１０２上で実行されるソフトウェア（例えば、アプリケーション１２６）へのアプリケーションプログラミングインタフェース（ＡＰＩ）を提供することによって、ＡＰＤ１１６の動作を制御する。いくつかの実施形態では、ドライバ１２２は、ＡＰＤ１１６の処理コンポーネント（以下により詳細に説明するＳＩＭＤユニット１３８等）によって実行されるプログラムをコンパイルするジャストインタイムコンパイラを含む。他の実施形態では、プログラムをコンパイルするためにジャストインタイムコンパイラが使用されず、通常のアプリケーションコンコンパイラは、ＡＰＤ１１６上で実行されるシェーダプログラムをコンパイルする。

ＡＰＤ１１６は、並列処理及び／又は順序付けされていない処理に適したグラフィックス操作及び非グラフィックス操作等の選択された機能についてのコマンド及びプログラムを実行する。ＡＰＤ１１６は、プロセッサ１０２から受信されたコマンドに基づいて、画素演算、幾何学的計算等のグラフィックスパイプライン演算を実行し、画像をディスプレイデバイス１１８にレンダリングするために使用される。ＡＰＤ１１６は、プロセッサ１０２から受信したコマンドに基づいて、ビデオ、物理シミュレーション、計算流体力学、又は、他のタスク等のように、グラフィックス演算に直接関連しない計算処理演算も実行する。

ＡＰＤ１１６は、ＳＩＭＤパラダイムに従って、並列方式で、プロセッサ１０２の要求に応じて動作を実行する１つ以上のＳＩＭＤユニット１３８を含む、計算ユニット１３２を含む。ＳＩＭＤパラダイムは、複数の処理要素が、単一のプログラム制御フローユニット及びプログラムカウンタを共有し、これにより、同じプログラムを実行するが、異なるデータでそのプログラムを実行することができる。一例では、各ＳＩＭＤユニット１３８は、１６個のレーンを含み、各レーンは、ＳＩＭＤユニット１３８内の他のレーンと同時に同じ命令を実行するが、異なるデータでその命令を実行する。全てのレーンが所定の命令を実行する必要がない場合には、プレディケーション（predication）を使用してレーンをオフにしてもよい。プレディケーションは、分岐する制御フローでプログラムを実行するためにも使用されてもよい。より具体的には、制御フローが個々のレーンによって実行される計算に基づいている条件付き分岐又は他の命令を有するプログラムの場合、現在実行されていない制御フローパスに対応するレーンのプレディケーション、及び、異なる制御フローパスの連続実行は、任意の制御フローを可能にする。実施形態では、計算ユニット１３２の各々は、ローカルＬ１キャッシュを有してもよい。実施形態では、複数の計算ユニット１３２は、Ｌ２キャッシュを共有する。

計算ユニット１３２における実行の基本単位は、ワークアイテムである。各ワークアイテムは、特定のレーンにおいて並列に実行されるプログラムの単一のインスタンスを表す。ワークアイテムは、単一のＳＩＭＤプロセッシングユニット１３８上で「ウェーブフロント（wavefront）」として同時に実行されてもよい。１つ以上のウェーブフロントが「ワークグループ」に含まれ、ワークグループは、同じプログラムを実行するように指定されたワークアイテムの集合を含む。ワークグループは、ワークグループを構成するウェーブフロントの各々を実行することによって実行される。代替例では、ウェーブフロントは、単一のＳＩＭＤユニット１３８上で順次、又は、異なるＳＩＭＤユニット１３８上で部分的若しくは完全に並列に実行される。ウェーブフロントは、単一のＳＩＭＤユニット１３８上で同時に実行されるワークアイテムの最大の集合として考えられてもよい。よって、プロセッサ１０２から受信したコマンドが、特定のプログラムが単一のＳＩＭＤユニット１３８上で同時に実行することができない程度に並列に実行されることを示す場合には、そのプログラムは、２つ以上のＳＩＭＤユニット１３８上で並列化されるか、同じのＳＩＭＤユニット１３８上で直列化される（又は、必要に応じて、並列化及び直列化の両方が行われる）ウェーブフロントに分割される。スケジューラ１３６は、異なる計算ユニット１３２及びＳＩＭＤユニット１３８上で様々なウェーブフロントをスケジューリングすることに関連する動作を実行するように構成されている。

計算ユニット１３２によって許容される並列性は、画素値計算、頂点変換、及び、他のグラフィックス演算等のグラフィックス関連演算に適している。よって、場合によっては、プロセッサ１０２からグラフィックス処理コマンドを受信するグラフィックスパイプライン１３４は、並列実行のために、計算タスクを計算ユニット１３２に提供する。

計算ユニット１３２は、グラフィックスに関連しない計算タスク、又は、グラフィックスパイプライン１３４の「通常」動作の一部として実行されない計算タスク（例えば、グラフィックスパイプライン１３４の動作のために実行される処理を補足するように実行されるカスタム動作）を実行するためにも使用される。プロセッサ１０２上で実行されるアプリケーション１２６又は他のソフトウェアは、そのような計算タスクを定義するプログラムを、実行のためにＡＰＤ１１６に送信する。

計算ユニット１３２は、シミュレートされたレイ（光線）とシーン内のオブジェクトとの交差をテストすることによって、３Ｄシーンをレンダリングする技術であるレイトレーシングを実施する。レイトレーシングに関連する作業の多くは、以下により詳細に説明するように、計算ユニット１３２のＳＩＭＤユニット１３８上で実行されるプログラム可能なシェーダプログラムによって実行される。また、各計算ユニット１３２は、レイが三角形と交差するかどうかを判別するためにテストを実行する固定機能ハードウェアアクセラレータ、すなわち、レイ交差ユニット１３９を含む。

図３は、一例による、レイトレーシング技術を用いてグラフィックスをレンダリングするためのレイトレーシングパイプライン３００を示す図である。レイトレーシングパイプライン３００は、レイトレーシングを利用してシーンをレンダリングすることに関する動作及びエンティティの概要を提供する。レイ生成シェーダ３０２と、任意のヒットシェーダ３０６と、最も近いヒットシェーダ３１０と、ミスシェーダ３１２とは、ＳＩＭＤユニット１３８で実行されているシェーダプログラムによって機能が実行されるレイトレーシングパイプラインステージを表すシェーダ実装ステージである。特定のシェーダ実装ステージの各々における具体的なシェーダプログラムは、アプリケーション提供コードによって（すなわち、アプリケーションコンパイラによってプリコンパイルされ、及び／又は、ドライバ１２２によってコンパイルされた、アプリケーション開発者によって提供されたコードによって）定義される。アクセラレーション構造横断ステージ（acceleration structure traversal stage）３０４は、レイが三角形にヒットするかどうかを判別するためにレイ交差テストを実行する。アクセラレーション構造横断ステージの動作は、レイ交差テストユニット１３９によって実行される。様々なプログラム可能なシェーダステージ（レイ生成シェーダ３０２、任意のヒットシェーダ３０６、最も近いヒットシェーダ３１０、ミスシェーダ３１２）は、ＳＩＭＤユニット１３８上で実行されるシェーダプログラムとして実装される。アクセラレーション構造横断ステージは、ソフトウェア（例えば、ＳＩＭＤユニット１３８上で実行されているシェーダプログラム）、ハードウェア（例えば、レイ交差ユニット１３９）、又は、ハードウェアとソフトウェアとの組み合わせとして実装される。ヒット又はミスユニット３０８は、例えば、他のユニットの一部として、ハードウェアアクセラレーテッド構造として、又は、ＳＩＭＤユニット１３８上で実行されているシェーダプログラムとして等のように、技術的に実現可能な任意の方法で実装される。レイトレーシングパイプライン３００は、部分的若しくは完全にソフトウェアで、又は、部分的若しくは完全にハードウェアで構成されてもよく、プロセッサ１０２、スケジューラ１３６、これらの組み合わせによって、又は、任意の他のハードウェア及び／若しくはソフトウェアユニットによって部分的若しくは完全に構成されてもよい。

レイトレーシングパイプライン３００は、以下のように動作する。レイ生成シェーダ３０２が実行される。レイ生成シェーダ３０２は、三角形に対してテストするためにレイのデータを設定し、三角形との交差に関してレイをテストするようにレイ交差テストユニット１３９に要求する。

レイ交差テストユニット１３９は、シーンボリューム及びシーン内のオブジェクトを記述するデータ構造であるアクセラレーション構造をアクセラレーション構造横断ステージ３０４において横断し、シーン内の三角形に対してレイをテストする。アクセラレーション構造横断ステージ３０４の一部であり得るヒット又はミスユニット３０８は、アクセラレーション構造横断ステージ３０４の結果（重心座標及び潜在的なヒット時間等の生データを含み得る）が実際にヒットを示すかどうかを判別する。三角形がヒットする場合、レイトレーシングパイプライン３００は、任意のヒットシェーダ３０６の実行をトリガする。複数の三角形が、単一のレイによってヒットする場合があることに留意されたい。アクセラレーション構造横断ステージが、レイの原点に最も近いものからレイの原点から最も遠いものの順に、アクセラレーション構造を横断することは保証されない。ヒット又はミスユニット３０８は、レイがヒットするレイの原点に最も近い三角形に対して、最も近いヒットシェーダ３１０の実行をトリガし、ヒットする三角形がなかった場合には、ミスシェーダをトリガする。任意のヒットシェーダ３０６は、レイ交差テストユニット３０４からのヒットを「拒絶（reject）」することが可能であり、したがって、ヒット又はミスユニット３０８は、レイ交差テストユニット３０４によってヒットが見つからないか受け入れられない場合に、ミスシェーダ３１２の実行をトリガすることに留意されたい。任意のヒットシェーダ３０６がヒットを「拒絶」し得る状況の一例は、レイ交差テストユニット１３９がヒットしていると報告する三角形の少なくとも一部が完全に透明である場合である。レイ交差テストユニット１３９は、形状のみをテストし、透明度についてはテストしないので、少なくともある程度の透明度を有する三角形へのヒットによって起動される任意のヒットシェーダ３０６は、報告されたヒットが、三角形の透明部分上の「ヒット」であるため、実際にはヒットでないと判別することができる。最も近いヒットシェーダ３１０の典型的な用途は、材料を、材料のテクスチャに基づいて着色することである。ミスシェーダ３１２の典型的な用途は、スカイボックスによって設定された色で画素を着色することである。最も近いヒットシェーダ３１０及びミスシェーダ３１２に対して定義されたシェーダプログラムは、画素を着色及び／又は他の操作を実行するための多種多様な技術を実施し得ることを理解されたい。

レイ生成シェーダ３０２がレイを生成する典型的な方法は、後方レイトレーシング（backwards ray tracing）と呼ばれる技術である。後方レイトレーシングでは、レイ生成シェーダ３０２は、カメラの点に原点を有するレイを生成する。画面に対応するように定義された平面に対してレイが交差する点は、レイが色を決定するために使用される画面上のピクセルを定義する。レイがオブジェクトにヒットする場合、そのピクセルは、最も近いヒットシェーダ３１０に基づいて着色される。レイがオブジェクトにヒットしない場合、ピクセルは、ミスシェーダ３１２に基づいて着色される。ピクセル毎に複数のレイがキャストされてもよく、ピクセルの最終的な色は、ピクセルのレイ毎に決定された色の組み合わせによって決められる。

任意のヒットシェーダ３０６、最も近いヒットシェーダ３１０、及び、ミスシェーダ３１２の何れかは、レイテストポイントにおいてレイトレーシングパイプライン３００に入る独自のレイを生成することが可能である。これらのレイは、あらゆる目的に使用することができる。一般的な用途の１つは、環境照明又は反射を実装することである。一例では、最も近いヒットシェーダ３１０が呼び出されると、最も近いヒットシェーダ３１０は、様々な方向にレイを生成する。生成されたレイがヒットするオブジェクト又は光毎に、最も近いヒットシェーダ３１０は、最も近いヒットシェーダ３１０に対応するピクセルに対して照明強度及び色を追加する。レイトレーシングパイプライン３００の様々なコンポーネントを使用してシーンをレンダリングすることができる方法のいくつかの例を説明しているが、多種多様な技術の何れかを代替的に使用し得ることを理解されたい。

上述したように、レイがオブジェクトにヒットするかどうかの判別は、本明細書において「レイ交差テスト」と呼ばれる。レイ交差テストは、原点からレイを発射し、レイが三角形にヒットするかどうか、ヒットする場合には、原点から三角形にヒットするまでの距離を決定することを含む。効率を高めるために、レイトレーシングテストは、境界ボリューム階層と呼ばれる空間の表現を用いる。この境界ボリューム階層は、上述した「アクセラレーション構造」である。境界ボリューム階層では、非リーフノード（non-leaf node）の各々は、そのノードのすべての子のジオメトリに境界を付ける軸合わせされた境界ボックス（axis aligned bounding box）を表す。例えば、ベースノードは、レイ交差テストが実行されている領域全体の最大範囲を表す。この例では、ベースノードに２つの子があり、各々が、領域全体を分割する相互に排他的な軸合わせされた境界ボックスを表す。これらの２つの子の各々は、これらの親の空間を分割する軸合わせされた境界ボックスを表す２つの子ノード等を有する。リーフノードは、レイテストを実行することができる三角形を表す。

境界ボリューム階層データ構造により、（複雑であり、処理リソースの観点からコストがかかる）レイ及び三角形の交差の数を、このようなデータ構造が使用されなかったためにシーン内の全ての三角形をレイに対してテストする必要があるシナリオと比較して、減らすことが可能になる。具体的には、レイが特定の境界ボックスと交差せず、その境界ボックスが多数の三角形の境界となる場合、そのボックス内の全ての三角形をテストから除外することができる。したがって、レイ交差テストは、軸合わせされた境界ボックスに対するレイのテストのシーケンスとして実行され、続けて三角形に対するテストが実行される。

図４は、一例による、境界ボリューム階層を示す図である。簡潔さのために、階層を２Ｄで示す。しかしながら、３Ｄへの拡張は簡単であり、本明細書で説明するテストは、概して、３次元で実行されることを理解されたい。

境界ボリューム階層の空間表現４０２を図４の左側に示し、境界ボリューム階層のツリー表現４０４を図４の右側に示す。空間表現４０２及びツリー表現４０４の両方において、非リーフノードが文字「Ｎ」で表され、リーフノードが文字「Ｏ」で表される。レイ交差テストは、ツリー４０４を横断することによって実行され、テストされた非リーフノード毎に、その非リーフノードのテストが失敗した場合、そのノードの下のブランチを除去する。例えば、レイは、Ｏ_５と交差するが、他の三角形とは交差しない。テストは、Ｎ_１に対してテストを行い、テストが成功したと判別する。テストは、Ｎ_２に対してテストを行い、（Ｏ_５がＮ_１内にないため）テストが失敗したと判別する。テストは、Ｎ_２の全てのサブノードを除去し、Ｎ_３に対してテストを行い、そのテストが成功したことを示す。テストは、Ｎ_６及びＮ_７をテストし、Ｎ_６については成功したがＮ_７については失敗したことを示す。テストは、Ｏ_５及びＯ_６をテストし、Ｏ_５については成功したがＯ_６については失敗したことを示す。８個の三角形をテストする代わりに、２つの三角形のテスト（Ｏ_５とＯ_６）及び５つのボックスのテスト（Ｎ_１、Ｎ_２、Ｎ_３、Ｎ_６及びＮ_７）が実行される。

レイ・三角形テストでは、レイが三角形にヒットするかどうか、及び、三角形にヒットするまでの時間（レイの原点から交点までの時間）を確認することを含む。概念的には、レイ・三角形テストは、三角形をレイのビュースペースに投影することによって、グラフィックス処理パイプラインで一般的に実行される三角形の２次元ラスタライズでのカバレージのテストと同様の簡単なテストの実行を可能にすることを含む。より具体的には、三角形をレイのビュースペースに投影すると、座標系が変換され、レイがｚ方向において下方を指すようになり、レイのｘ成分及びｙ成分が０になる（ただし、いくつかの変形例では、レイが、ｚ方向において、又は、正若しくは負のｘ若しくはｙ方向において上方を指し、他の２つの軸における成分がゼロである場合がある）。三角形の頂点は、この座標系に変換される。このような変換により、レイのｘ、ｙ座標が三角形の頂点のｘ、ｙ座標によって画定される三角形内にあるかどうかを確認するだけで、交差のテストを行うことが可能になり、これは、上述したラスタライズ動作である。

この変換を図５に示す。レイ５０２及び三角形５０４が、変換前の座標系５００に示されている。変換された座標系５１０の座標系において、レイ５１２は、－ｚ方向を指しているように示され、三角形５１４も、その座標系５１０に示されている。

図６は、ラスタライズ動作としてのレイ交差テストを示す図である。具体的には、頂点Ａ、Ｂ、Ｃが三角形５１４を画定し、頂点Ｔがレイ５１２の原点である。レイ５１２が三角形５１４と交差するかどうかのテストは、頂点Ｔが三角形ＡＢＣ内にあるかどうかをテストすることによって実行される。これについては、以下により詳しく説明する。

ここで、レイ・三角形テストのさらなる詳細を示す。先ず、座標系を回転させて、ｚ軸がレイの主軸となるようにする（「主軸」とは、レイが最も速く進む軸を意味する）。この回転は、レイ方向のｚ成分が０であるいくつかのエッジケース（edge cases）や、レイ方向のｚ成分が小さい場合に生じる数値安定性の低下を回避するために行われる。座標系の回転は、以下のように実行される。
ｉｎｔｋｚ＝０；
ｆｌｏａｔｌａｒｇｅｓｔ＿ｄｉｍ＝ｆａｂｓ（ｒａｙ＿ｄｉｒ．ｘ）；
ｉｆ（ｌａｒｇｅｓｔ＿ｄｉｍ＜ｆａｂｓ（ｒａｙ＿ｄｉｒ．ｙ））｛
ｋｚ＝１；
ｌａｒｇｅｓｔ＿ｄｉｍ＝ｆａｂｓ（ｒａｙ＿ｄｉｒ．ｙ）；
｝
ｉｆ（ｌａｒｇｅｓｔ＿ｄｉｍ＜ｆａｂｓ（ｒａｙ＿ｄｉｒ．ｚ））｛
ｋｚ＝２；
ｌａｒｇｅｓｔ＿ｄｉｍ＝ｆａｂｓ（ｒａｙ＿ｄｉｒ．ｚ）；
｝
ｉｆ（ｋｚ＝＝２）｛
ｒａｙ＿ｄｉｒ＝ｒａｙ＿ｄｉｒ；
ｒａｙ＿ｏｒｉｇｉｎ＝ｒａｙ＿ｏｒｉｇｉｎ；
ｖ０＝ｖ０；
ｖ１＝ｖ１；
ｖ２＝ｖ２；
｝ｅｌｓｅｉｆ（ｋｚ＝＝１）｛
ｒａｙ＿ｄｉｒ＝ｒａｙ＿ｄｉｒ．ｚｘｙ；
ｒａｙ＿ｏｒｉｇｉｎ＝ｒａｙ＿ｏｒｉｇｉｎ．ｚｘｙ；
ｖ０＝ｖ０．ｚｘｙ；
ｖ１＝ｖ１．ｚｘｙ；
ｖ２＝ｖ２．ｚｘｙ；
｝ｅｌｓｅ｛
ｒａｙ＿ｄｉｒ＝ｒａｙ＿ｄｉｒ．ｙｚｘ；
ｒａｙ＿ｏｒｉｇｉｎ＝ｒａｙ＿ｏｒｉｇｉｎ．ｙｚｘ；
ｖ０＝ｖ０．ｙｚｘ；
ｖ１＝ｖ１．ｙｚｘ；
ｖ２＝ｖ２．ｙｚｘ；
｝

ここで、ｋｚは、軸を回転する方法を決定するために使用されるヘルパー変数であり、ｌａｒｇｅｓｔ＿ｄｉｍは、レイの最大寸法であり、ｒａｙ＿ｄｉｒは、レイの方向を定義するｆｌｏａｔ３であり、ｒａｙ＿ｏｒｉｇｉｎは、レイの原点を定義するｆｌｏａｔ３であり、ｖ０、ｖ１、ｖ２は、三角形の頂点を定義するｆｌｏａｔ３であり、ｆａｂｓ（）は、浮動小数点の絶対値関数である。．ｚｘｙ又は．ｙｚｘをｆｌｏａｔ３に追加すると、ｆｌｏａｔ３．ｚｘｙが回転する。．ｚｘｙでは、新しいｘ成分が古いｚ成分になり、新しいｙ成分が新しいｘ成分になり、新しいｚ成分が古いｚ成分になる。．ｙｚｘでは、新しいｘ成分が古いｙ成分になり、新しいｙ成分が古いｚ成分になり、新しいｚ成分が古いｘ成分になる。上記の擬似コードは、ｒａｙ＿ｄｉｒｅｃｔｉｏｎベクトルの何れのコンポーネントが最大の絶対値を有するかを判別する。ｚ成分が最大の場合、ｋｚが２に設定され、回転が実行されない。ｙ成分が最大の場合、ｋｚが１に設定され、レイ及び頂点は、ｚ軸が古いｙ軸になるように回転する。ｘ成分が最大の場合、ｋｚが０に設定され、レイ及び頂点は、ｚ軸が古いｘ軸になるように回転する。

次に、頂点は、全て、レイの原点を基準として変換される。
ｆｌｏａｔ３ｖ０＿ｒｅｌ＝ｖ０－ｒａｙ＿ｏｒｉｇｉｎ；
ｆｌｏａｔ３ｖ１＿ｒｅｌ＝ｖ１－ｒａｙ＿ｏｒｉｇｉｎ；
ｆｌｏａｔ３ｖ２＿ｒｅｌ＝ｖ２－ｒａｙ＿ｏｒｉｇｉｎ；

次に、交差の計算を単純化するために、レイ及び三角形の頂点に線形変換を適用して、２Ｄでテストを実行可能にする。この線形変換は、各頂点及びレイ方向に変換行列Ｍを乗算することによって行われる。上記の変換ステップにより、ｒａｙ＿ｏｒｉｇｉｎが＜０，０，０＞にあるので、レイ方向をこのように変換することができる。行列Ｍは、次のとおりである。

行列の乗算は次のように行われる。
ｆｌｏａｔＡｘ＝ｖ０＿ｒｅｌ．ｘ^＊ｒａｙ＿ｄｉｒ．ｚ－ｒａｙ＿ｄｉｒ．ｘ^＊ｖ０＿ｒｅｌ．ｚ；
ｆｌｏａｔＡｙ＝ｖ０＿ｒｅｌ．ｙ^＊ｒａｙ＿ｄｉｒ．ｚ－ｒａｙ＿ｄｉｒ．ｙ^＊ｖ０＿ｒｅｌ．ｚ；
ｆｌｏａｔＡｚ＝ｖ０＿ｒｅｌ．ｚ；
ｆｌｏａｔＢｘ＝ｖ１＿ｒｅｌ．ｘ^＊ｒａｙ＿ｄｉｒ．ｚ－ｒａｙ＿ｄｉｒ．ｘ^＊ｖ１＿ｒｅｌ．ｚ；
ｆｌｏａｔＢｙ＝ｖ１＿ｒｅｌ．ｙ^＊ｒａｙ＿ｄｉｒ．ｚ－ｒａｙ＿ｄｉｒ．ｙ^＊ｖ１＿ｒｅｌ．ｚ；
ｆｌｏａｔＢｚ＝ｖ１＿ｒｅｌ．ｚ；
ｆｌｏａｔＣｘ＝ｖ２＿ｒｅｌ．ｘ^＊ｒａｙ＿ｄｉｒ．ｚ－ｒａｙ＿ｄｉｒ．ｘ^＊ｖ２＿ｒｅｌ．ｚ；
ｆｌｏａｔＣｙ＝ｖ２＿ｒｅｌ．ｙ^＊ｒａｙ＿ｄｉｒ．ｚ－ｒａｙ＿ｄｉｒ．ｙ^＊ｖ２＿ｒｅｌ．ｚ；
ｆｌｏａｔＣｚ＝ｖ２＿ｒｅｌ．ｚ；

行列Ｍは、変換されたレイ方向が常に＜０，０，ｒａｙ＿ｄｉｒ．ｚ＞となるように構成されているので、レイ方向を行列Ｍで明示的に変換する必要がない。これは、以下の理由によるものである。
ｒａｙ＿ｄｉｒ．ｘ＝ｒａｙ＿ｄｉｒ．ｘ^＊ｒａｙ＿ｄｉｒ．ｚ－ｒａｙ＿ｄｉｒ．ｚ^＊ｒａｙ＿ｄｉｒ．ｘ＝０
ｒａｙ＿ｄｉｒ．ｙ＝ｒａｙ＿ｄｉｒ．ｙ^＊ｒａｙ＿ｄｉｒ．ｚ－ｒａｙ＿ｄｉｒ．ｚ^＊ｒａｙ＿ｄｉｒ．ｙ＝０
ｒａｙ＿ｄｉｒ．ｚ＝ｒａｙ＿ｄｉｒ．ｚ

概念的には、行列Ｍは、レイ方向がｒａｙ＿ｄｉｒ．ｚの大きさのｚ成分のみを有するように座標をスケーリングし、剪断する。このように変換された頂点を用いて、レイ・三角形テストが２Ｄラスタライズテストとして実行される。図６は、頂点Ａ、Ｂ、Ｃを有する三角形６０２を示す図である。レイ６０４も示されている（点Ｔ）。頂点及びレイに対して実行された変換により、レイは－ｚ方向を指している。また、三角形は、レイが－ｚ方向を指す座標系に投影されるので、三角形・レイテストは、レイの原点が頂点Ａ、Ｂ、Ｃのｘ、ｙ座標で画定される三角形内にあるかどうかのテストとして再定式化される。さらに、上記の変換により、レイの原点は２Ｄの点（０，０）にあり、レイ及び三角形の交点（Ｔ）も２Ｄの点（０，０）にあり、三角形の頂点間の距離（頂点Ａの場合にはＡ－Ｔ、頂点Ｂの場合にはＢ－Ｔ、頂点Ｃの場合にはＣ－Ｔ）は、レイと三角形の交点が（０，０）にあるため、単にＡ、Ｂ、Ｃとなる。

次に、三角形の重心座標Ｕ、Ｖ、Ｗ（図６に示す）が、次の方法で計算される。
Ｕ＝ａｒｅａ（ＴｒｉａｎｇｌｅＣＢＴ）＝０．５×（Ｃ×Ｂ）
Ｖ＝ａｒｅａ（ＴｒｉａｎｇｌｅＡＣＴ）＝０．５×（Ａ×Ｃ）
Ｗ＝ａｒｅａ（ＴｒｉａｎｇｌｅＢＡＴ）＝０．５×（Ｂ×Ａ）

この計算は、次のように簡略化される。
ｆｌｏａｔＵ＝Ｃｘ×Ｂｙ－Ｃｙ×Ｂｘ；
ｆｌｏａｔＶ＝Ａｘ×Ｃｙ－Ａｙ×Ｃｘ；
ｆｌｏａｔＷ＝Ｂｘ×Ａｙ－Ｂｙ×Ａｘ；
２による除算は最終結果において無効になるので、除算は利用されない。

Ｕ、Ｖ、Ｗの符号は、レイが三角形と交差するかどうかを示す。より具体的には、Ｕ、Ｖ、Ｗが全て正の場合、又は、Ｕ、Ｖ、Ｗが全て負の場合、点Ｔは、図６の三角形の内側にあるので、レイが三角形と交差するとみなされる。Ｕ、Ｖ、Ｗの符号が異なる場合、点Ｔは、図６の三角形の外側にあるので、レイが三角形と交差しない。Ｕ、Ｖ、Ｗのうち何れか１つのみがゼロの場合、点Ｔは、その座標に対応するエッジを通る線上にある。この場合、他の２つの座標の符号が同じである場合には、点Ｔは、三角形６０２のエッジ上にあるが、他の２つの座標の符号が異なる場合には、点Ｔは、三角形のエッジ上にない。Ｕ、Ｖ、Ｗのうち２つのみがゼロの場合、点Ｔは、三角形の角にあるとみなされる。Ｕ、Ｖ、Ｗが全てゼロの場合、三角形は、面積がゼロの三角形である。もう１つのポイントとして、点Ｔが２Ｄにおいて三角形の内側にあり得る（レイが上記の三角形と交差しているものとして示される）が、レイが三角形の後ろにある場合には、３Ｄ空間において三角形に当たらない場合がある。以下に説明するｔの符号は、レイが三角形の後ろにある（したがって交差しない）かどうかを示す。具体的には、符号が負の場合、レイは三角形の後ろにあり、三角形と交差しない。符号が正又は０の場合、レイは三角形と交差する。

様々な実施形態では、点がエッジ又は角上にある場合、又は、三角形がゼロ面積の三角形である場合には、ヒット又はミスの何れかと考えられ得る。言い換えれば、エッジ上にある点がヒットかミスかの判別、及び／又は、角上の点がヒットかミスかの判別は、特定のポリシーに依存している。例えば、いくつかの実施形態では、点がエッジ又は角上にある全てのインスタンスがヒットとみなされる。他の実施形態では、そのようなインスタンスは全てミスとみなされる。さらに他の実施形態では、そのようないくつかのインスタンス（特定の方向を向いているエッジ上にある点Ｔな等）はヒットとみなされ、他のこのようなインスタンスはミスとみなされる。

さらに、レイが三角形にヒットする時間ｔが求められる。これは、三角形の全ての頂点のＺ値を補間することによって、既に計算された三角形の重心座標（Ｕ、Ｖ、Ｗ）を用いて行われる。最初に、点Ｔ（レイ及び三角形の交点）のｚ成分が計算される。

ここで、Ａｚは、ベクトルＡのｚ成分であり、Ｂｚは、ベクトルＢのｚ成分であり、Ｃｚは、ベクトルＣのｚ成分であり、Ｕ、Ｖ、Ｗは、上記で計算された重心座標である。Ｔ．ｘ及びＴ．ｙがゼロであるため、Ｔは（０，０，Ｔ.ｚ）である。時間ｔは、次のように計算される。

ここで、ｄｉｓｔａｎｃｅ（）は２点間の距離を表し、ｌｅｎｇｔｈ（）はベクトルの長さを表す。交差時間ｔの最終式は次のとおりである。

データパスの乗数との整合性を高めるために、この式を次のように変更することができる。

この値は、ハードウェア交差ユニットによって、分子及び分母の形式（ｔ＿ｎｕｍはｔの分子、ｔ＿ｄｅｎｏｍはｔの分母）でシェーダ（例えば、図３の何れかのシェーダ）に提供される。
ｆｌｏａｔｔ＿ｎｕｍ＝Ｕ^＊Ａｚ＋Ｖ^＊Ｂｚ＋Ｗ^＊Ｃｚ；
ｆｌｏａｔｔ＿ｄｅｎｏｍ＝Ｕ^＊ｒａｙ＿ｄｉｒ．ｚ＋Ｖ^＊ｒａｙ＿ｄｉｒ．ｚ＋Ｗ^＊ｒａｙ＿ｄｉｒ．ｚ

上述したように、重心座標は、以下のように計算される。
Ｕ＝Ｃｘ×Ｂｙ－Ｃｙ×Ｂｘ
Ｖ＝Ａｘ×Ｃｙ－Ａｙ×Ｃｘ
Ｗ＝Ｂｘ×Ａｙ－Ｂｙ×Ａｘ

いくつかの理由により、これらの計算が正しく行われなかった場合に、隙間のなさが損なわれる可能性がある（すなわち、エッジを共有する三角形間にギャップが存在する）。図７は、エッジを共有する２つの三角形の例を示す図である。第１の三角形７０２は、頂点Ａ_１、Ｂ_１、Ｃ_１を有する。第２の三角形７０４は、頂点Ａ_２、Ｂ_２、Ｃ_２を有する。三角形７０２及び三角形７０４は、エッジ７０６を共有する。また、レイの点Ｔは、エッジ７０６に近い特定の位置に示されている。頂点の座標は、レイの点Ｔと等しい原点を有するように変換されるので、計算が両方の三角形に対して実行された場合、三角形７０２の頂点Ｃ_１は、三角形７０４の頂点Ｂ_２と全く同じ位置にあり、頂点Ｂ_１は、三角形７０６の頂点Ｃ_２と全く同じ位置にある。

エッジ７０６の重心座標は、三角形７０２の場合には座標Ｕ_１であり、三角形７０４の場合には座標Ｕ_２である。これらの座標は、以下の方法で計算される。
Ｕ_１＝Ｃ_１ｘ×Ｂ_１ｙ－Ｃ_１ｙ×Ｂ_１ｘ
Ｕ_２＝Ｃ_２ｘ×Ｂ_２ｙ－Ｃ_２ｙ×Ｂ_２ｘ
Ｂ_１ｘ及びＢ_１ｙは、それぞれＢ_１のｘ成分及びｙ成分であり、Ｃ_１ｘ及びＣ_１ｙは、それぞれＣ_１のｘ成分及びｙ成分であり、Ｂ_２ｘ及びＢ_２ｙは、それぞれＢ_２のｘ成分及びｙ成分であり、Ｃ_２ｘ及びＣ_２ｙは、それぞれＣ_２のｘ成分及びｙ成分である。Ｃ_２はＢ_１と同じであり、Ｂ_２はＣ_１と同じであることに留意されたい。したがって、座標Ｕ_２の計算は、以下のように記述され得る。
Ｕ_２＝Ｂ_１ｘ×Ｃ_１ｙ－Ｂ_１ｙ×Ｃ_１ｘ

隙間のなさを生じさせるには、Ｕ_２を、常に－Ｕ_１と等しくする必要がある。言い換えれば、Ｕ_２は、常にＵ_１と反対の符号を有する（又は、Ｕ_２及びＵ_１の両方が０になる）。これは、Ｕ_１及びＵ_２の両方が同じ符号を有する場合、レイＴは、両方の三角形に対してミスとなる可能性があるためである。例えば、両方の三角形のＶ及びＷが正であった場合、Ｕ_１及びＵ_２の両方が負であった場合、レイＴは、両方の三角形に対してミスになる。点Ｔが、少なくとも１つの三角形にヒットする必要があるため、この状況は望ましくない。そうでなければ、両方に対してミスが発生し、穴として表示される可能性がある。

浮動小数点演算が機能する方法のため、全ての浮動小数点丸めモードでＵ_２が常に－Ｕ_１と等しくなるわけではない。具体的には、有向であるとみなされる浮動小数点丸めモードが、必ずしも上記の結果をもたらすとは限らず、無向であるとみなされる浮動小数点丸めモードが、上記の結果（すなわち、Ｕ_２が－Ｕ_１に等しくなる）をもたらす。浮動小数点演算がどのように機能するかを簡単に説明した後に、有向及び無向の丸めモードについて説明する。

浮動小数点数には、概念的に仮数、基数及び指数が含まれる。浮動小数点数の値は、基数を指数で累乗した値を仮数に乗じたものと等しい。丸めを含む算術演算の場合、丸めは、算術演算が無限の精度で計算され、仮数が利用可能なビット数に収まるように変更された（例えば、より高精度のビットが削除される）場合と同じ結果が得られるように適用される。

ゼロへの丸め（ＲＴＺ）、最も近い偶数への丸め（ＲＴＮＥ）、正の無限大への丸め（ＲＴＰ）、及び、負の無限大への丸め（ＲＴＮ）等のように、いくつかの異なる丸めモードがある。ＲＴＺ及びＲＴＮＥは共に無向丸めモードであり、ＲＴＰ及びＲＴＮは共に有向丸めモードである。丸めモードの「方向性」は、仮数の大きさが丸められる方法が浮動小数点数の符号に依存することを意味する。例示的な数では、丸められていない仮数は、値１０１０［０１］を有し、括弧内の部分は、使用可能なビットが不足しているために（すなわち、仮数に使用可能なのは４ビットのみである）、浮動小数点数の精度で表すことができない部分である。ＲＴＺモードでは、仮数の大きさがゼロに向けて丸められるので、仮数が１０１０に丸められる。これは、数値が正の符号を有するか負の符号を有するかに関係なく当てはまる。ＲＴＮＥでは、仮数が１０１０に丸められ、これは、丸められていない仮数に最も近い偶数である。対照的に、ＲＴＰモードでは、仮数が、符号に応じて異なるように丸められる。具体的には、符号が正の場合、仮数は、正の無限大に向かって１０１１に丸められる。符号が負の場合、小さい負の数が大きい負の数よりも正の無限大に近いので、仮数が１０１０に丸められる。ＲＴＮモードでは、結果が逆になる（数が負の場合には仮数が１０１１に丸められ、数が正の場合には１０１０に丸められる）。

上記の理由により、常にｒｏｕｎｄ（Ｘ）＝－ｒｏｕｎｄ（－Ｘ）（「ｒｏｕｎｄ（）」は浮動小数点丸め演算を示す）であるとは限らない。具体的には、有向丸めモードでは、ｒｏｕｎｄ（Ｘ）の大きさは、ｒｏｕｎｄ（－Ｘ）の大きさと異なる場合がある。このため、Ｕ_２＝Ｂ_１ｘ×Ｃ_１ｙ－Ｂ_１ｙ×Ｃ_１ｘが常に－Ｕ_１と等しいわけではない可能性があり、それは－（Ｃ_１ｙ×Ｂ_１ｘ－Ｃ_１ｘ×Ｂ_１ｙ）と等しい（注、Ｕ_１＝Ｃ_１ｘ×Ｂ_１ｙ－Ｃ_１ｙ×Ｂ_１ｘであり、それは（－Ｃ_１ｘ×Ｂ_１ｙ＋Ｃ_１ｙ×Ｂ_１ｘ）に等しく、それは－（Ｃ_１ｘ×Ｂ_１ｙ－Ｃ_１ｙ×Ｂ_１ｘ）に等しい）。より具体的には、有向丸めモードが用いられる場合、丸められた数の各々の仮数の大きさは、それらの数の符号に基づいて変化するので、ｒｏｕｎｄ（－ｒｏｕｎｄ（Ｃ_１ｘ×Ｂ_１ｙ）＋ｒｏｕｎｄ（Ｃ_１ｙ×Ｂ_１ｘ））が－ｒｏｕｎｄ（ｒｏｕｎｄ（Ｃ_１ｘ×Ｂ_１ｙ）－ｒｏｕｎｄ（Ｃ_１ｙ×Ｂ_１ｘ））と等しくない可能性がある。有向丸めモードで発生し得る大きさの僅かなシフトのために、Ｕ_１及びＵ_２の両方が同じ符号を有する可能性があり、そのことは、隙間のなさを破るであろう。図７に示す２つの三角形７０２，７０４の例では、点Ｔが両方の三角形に対してミスとみなされる可能性がある。

上記の理由により、重心座標の計算は、有向丸めモードを用いて実行される。いくつかの実施形態では、ＲＴＺ又はＲＴＮＥの何れかが、有向丸めモードとして用いられる。いくつかの実施形態では、ＲＴＮＥよりもＲＴＺの方がハードウェアでの実装が簡単であるため、ＲＴＺが用いられる。さらに、いくつかの実施形態では、重心座標を決定し、ｔを計算するための全ての乗算及び加算演算は、無向丸めモードを用いる（有向丸めモードではない）。これにより、関係する数値が正であるか負であるかに関係なく、これらの計算に対して仮数の値が同じになり、隙間のないレンダリングをもたらす。これらの計算には、頂点をレイの原点に対して変換する計算、行列Ｍによる乗算を介したレイのビュースペースへの投影、重心座標の計算、及び、レイ及び三角形の交差時間ｔを決定するための重心座標の補間が含まれる。一例では、以下の計算、すなわち、頂点からレイの原点を減算する変換計算、上述したような頂点ｘ、ｙ、ｚ成分のレイ方向ｚ成分による乗算及び積の減算を含むＡｘ、Ａｙ、Ｂｘ、Ｂｙ、Ｃｘ、Ｃｙを決定するための各計算、上述したＵ、Ｖ、Ｗを決定するための各計算、上述したＴ．ｚの分子及び分母を決定するための各計算は、無向丸めモードで実行される。明示的に言えば、以下の計算は、無向丸めモードで実行される。
ｆｌｏａｔ３ｖ０＿ｒｅｌ＝ｖ０－ｒａｙ＿ｏｒｉｇｉｎ；
ｆｌｏａｔ３ｖ１＿ｒｅｌ＝ｖ１－ｒａｙ＿ｏｒｉｇｉｎ；
ｆｌｏａｔ３ｖ２＿ｒｅｌ＝ｖ２－ｒａｙ＿ｏｒｉｇｉｎ；
ｆｌｏａｔＡｘ＝ｖ０＿ｒｅｌ．ｘ×ｒａｙ＿ｄｉｒ．ｚ－ｒａｙ＿ｄｉｒ．ｘ×ｖ０＿ｒｅｌ．ｚ；
ｆｌｏａｔＡｙ＝ｖ０＿ｒｅｌ．ｙ×ｒａｙ＿ｄｉｒ．ｚ－ｒａｙ＿ｄｉｒ．ｙ×ｖ０＿ｒｅｌ．ｚ；
ｆｌｏａｔＢｘ＝ｖ１＿ｒｅｌ．ｘ×ｒａｙ＿ｄｉｒ．ｚ－ｒａｙ＿ｄｉｒ．ｘ×ｖ１＿ｒｅｌ．ｚ；
ｆｌｏａｔＢｙ＝ｖ１＿ｒｅｌ．ｙ×ｒａｙ＿ｄｉｒ．ｚ－ｒａｙ＿ｄｉｒ．ｙ×ｖ１＿ｒｅｌ．ｚ；
ｆｌｏａｔＣｘ＝ｖ２＿ｒｅｌ．ｘ×ｒａｙ＿ｄｉｒ．ｚ－ｒａｙ＿ｄｉｒ．ｘ×ｖ２＿ｒｅｌ．ｚ；
ｆｌｏａｔＣｙ＝ｖ２＿ｒｅｌ．ｙ×ｒａｙ＿ｄｉｒ．ｚ－ｒａｙ＿ｄｉｒ．ｙ×ｖ２＿ｒｅｌ．ｚ；
ｆｌｏａｔＵ＝Ｃｘ×Ｂｙ－Ｃｙ×Ｂｘ；
ｆｌｏａｔＶ＝Ａｘ×Ｃｙ－Ａｙ×Ｃｘ；
ｆｌｏａｔＷ＝Ｂｘ×Ａｙ－Ｂｙ×Ａｘ；
ｆｌｏａｔｔ＿ｎｕｍ＝Ｕ×Ａｚ＋Ｖ×Ｂｚ＋Ｗ×Ｃｚ；
ｆｌｏａｔｔ＿ｄｅｎｏｍ＝Ｕ×ｒａｙ＿ｄｉｒ．ｚ＋Ｖ×ｒａｙ＿ｄｉｒ．ｚ＋Ｗ×ｒａｙ＿ｄｉｒ．ｚ

いくつかの例では、レイ・三角形の交差テストを実行するための上記の動作の全ては、レイ交差ユニット１３９によって実行される。

本明細書における開示に基づいて、多くの変形が可能であることを理解されたい。特徴及び要素が特定の組み合わせで上述されているが、各特徴又は要素は、他の特徴及び要素無しに単独で、又は、他の特徴及び要素を伴う若しくは伴わない様々な組み合わせで使用されてもよい。

提供された方法は、汎用コンピュータ、プロセッサ又はプロセッサコアにおいて実施することができる。好適なプロセッサは、例えば、汎用プロセッサ、専用プロセッサ、従来のプロセッサ、デジタルシグナルプロセッサ（ＤＳＰ）、複数のマイクロプロセッサ、ＤＳＰコアと協働する１つ以上のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）回路、他の任意のタイプの集積回路（ＩＣ）、及び／又は、状態機械を含む。このようなプロセッサは、処理されたハードウェア記述言語（ＨＤＬ）命令の結果と、ネットリストを含む他の中間データ（コンピュータ可読媒体に記憶することができる命令）と、を使用して製造プロセスを構成することによって、製造することができる。このような処理の結果は、本開示の特徴を実装するプロセッサを製造するための半導体製造プロセスで後に使用されるマスクワークとすることができる。

本明細書で提供される方法又はフローチャートは、汎用コンピュータ又はプロセッサによって実行されるために非一時的なコンピュータ可読記憶媒体に組み込まれたコンピュータプログラム、ソフトウェア又はファームウェアで実装することができる。非一時的なコンピュータ可読記憶媒体の例は、リードオンリメモリ（ＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）、レジスタ、キャッシュメモリ、半導体メモリデバイス、内蔵ハードディスク及びリムーバブルディスク等の磁気媒体、光磁気媒体、ＣＤ－ＲＯＭディスク及びデジタル多用途ディスク（ＤＶＤ）等の光学媒体を含む。

Claims

レイと三角形との間のヒットを検出する方法であって、
前記三角形の頂点及び前記レイの方向の頂点表現を、前記レイの方向が０であるｘ成分及びｙ成分を有し、前記頂点及び前記レイの各々が座標変換ユニットによって変更されていないｚ成分を有する座標系に変換することによって、前記レイのビュースペースに前記三角形の前記頂点を投影することと、
二次元空間における前記三角形の前記頂点に対する前記レイの交点の位置を示す重心座標を決定することであって、前記重心座標の決定は無向丸めモードを用いて実行される、ことと、
前記重心座標を補間して、前記レイが前記三角形と交差する時間の分子及び分母を生成することと、を含む、
方法。
前記無向丸めモードは、前記重心座標の仮数及び／又は前記重心座標を計算するために用いられる中間値の仮数が、符号に依存しない方法で丸められる浮動小数点丸めモードを含む、
請求項１の方法。
前記無向丸めモードは、前記重心座標の仮数及び／又は前記重心座標を計算するために用いられる中間値の仮数が、丸め後に前記仮数が丸め前よりも小さくなるように丸められる、ゼロに向かう丸めモードを含む、
請求項２の方法。
前記無向丸めモードは、前記重心座標の仮数及び／又は前記重心座標を計算するために用いられる中間値の仮数が、最も近い偶数に丸められる、最も近い偶数への丸めモードを含む、
請求項２の方法。
前記無向丸めモードは、前記重心座標の仮数及び／又は前記重心座標を計算するために用いられる中間値の仮数が、前記仮数の大きさが符号によって増加又は減少するように丸められる浮動小数点丸めモードを有する有向丸めモードを含まない、
請求項１の方法。
前記有向丸めモードは、正の無限大への丸めモード又は負の無限大への丸めモードを含む、
請求項５の方法。
前記三角形の前記頂点及び前記レイの方向の頂点表現を前記座標系に変換することは、無向丸めモードで浮動小数点計算を実行することを含む、
請求項１の方法。
前記重心座標を決定することは、重心座標をＣｘＢｙ－ＢｘＣｙとして計算するステップを含み、Ｃｘ及びＣｙは、前記重心座標に関連するエッジを境界づける頂点のうち１つの頂点のｘ座標及びｙ座標であり、Ｂｘ及びＢｙは、前記重心座標に関連するエッジを境界づける頂点のうち他の頂点のｘ座標及びｙ座標である、
請求項１の方法。
前記重心座標を決定することは、ＣｘＢｙの積を無向丸めモードにしたがって丸めることと、ＢｘＣｙの積を無向丸めモードにしたがって丸めることと、ＣｘＢｙ－ＢｘＣｙの差を無向丸めモードにしたがって丸めることと、を含む、
請求項８の方法。
レイと三角形との間の交差のテストを要求するように構成された処理ユニットと、
レイ交差テストユニットと、を備え、
前記レイ交差テストユニットは、
前記三角形の頂点及び前記レイの方向の頂点表現を、前記レイの方向が０であるｘ成分及びｙ成分を有し、前記頂点及び前記レイの各々が座標変換ユニットによって変更されていないｚ成分を有する座標系に変換することによって、前記レイのビュースペースに前記三角形の前記頂点を投影することと、
二次元空間における前記三角形の前記頂点に対する前記レイの交点の位置を示す重心座標を決定することであって、前記重心座標の決定は無向丸めモードを用いて実行される、ことと、
前記重心座標を補間して、前記レイが前記三角形と交差する時間の分子及び分母を生成することと、
によって前記テストを実行するように構成されている、
計算ユニット。
前記無向丸めモードは、前記重心座標の仮数及び／又は前記重心座標を計算するために用いられる中間値の仮数が、符号に依存しない方法で丸められる浮動小数点丸めモードを含む、
請求項１０の計算ユニット。
前記無向丸めモードは、前記重心座標の仮数及び／又は前記重心座標を計算するために用いられる中間値の仮数が、丸め後に前記仮数が丸め前の大きさよりも小さくなるように丸められる、ゼロに向かう丸めモードを含む、
請求項１０の計算ユニット。
前記無向丸めモードは、前記重心座標の仮数及び／又は前記重心座標を計算するために用いられる中間値の仮数が、前記最も近い偶数に丸められる、最も近い偶数への丸めモードを含む、
請求項１１の計算ユニット。
前記無向丸めモードは、前記重心座標の仮数及び／又は前記重心座標を計算するために用いられる中間値の仮数が、前記仮数の大きさが符号によって増加又は減少するように丸められる浮動小数点丸めモードを有する有向丸めモードを含まない、
請求項１０の計算ユニット。
前記有向丸めモードは、正の無限大への丸めモード又は負の無限大への丸めモードを含む、
請求項１４の計算ユニット。
前記三角形の前記頂点及び前記レイの方向の頂点表現を前記座標系に変換することは、無向丸めモードで浮動小数点計算を実行することを含む、
請求項１０の計算ユニット。
前記重心座標を決定することは、重心座標をＣｘＢｙ－ＢｘＣｙとして計算するステップを含み、Ｃｘ及びＣｙは、前記重心座標に関連するエッジを境界づける頂点のうち１つの頂点のｘ座標及びｙ座標であり、Ｂｘ及びＢｙは、前記重心座標に関連するエッジを境界づける頂点のうち他の頂点のｘ座標及びｙ座標である、
請求項１０の計算ユニット。
前記重心座標を決定することは、ＣｘＢｙの積を無向丸めモードにしたがって丸めることと、ＢｘＣｙの積を無向丸めモードにしたがって丸めることと、ＣｘＢｙ－ＢｘＣｙの差を無向丸めモードにしたがって丸めることと、を含む、
請求項１７の計算ユニット。
シェーダプログラムを実行のためにアクセラレーテッドプロセッシングデバイスに送信するように構成された中央処理装置と、
計算ユニットを含む前記アクセラレーテッドプロセッシングデバイスと、を備え、
前記計算ユニットは、
レイと三角形との間の交差のテストを要求するために前記シェーダプログラムを実行するように構成された処理ユニットと、
レイ交差テストユニットと、を備え、
前記レイ交差テストユニットは、
前記三角形の頂点及び前記レイの方向の頂点表現を、前記レイの方向が０であるｘ成分及びｙ成分を有し、前記頂点及び前記レイの各々が座標変換ユニットによって変更されていないｚ成分を有する座標系に変換することによって、前記レイのビュースペースに前記三角形の前記頂点を投影することと、
二次元空間における前記三角形の前記頂点に対する前記レイの交点の位置を示す重心座標を決定することであって、前記重心座標の決定は無向丸めモードを用いて実行される、ことと、
前記重心座標を補間して、前記レイが前記三角形と交差する時間の分子及び分母を生成することと、
によって前記テストを実行するように構成されている、
計算システム。
前記無向丸めモードは、前記重心座標の仮数及び／又は前記重心座標を計算するために用いられる中間値の仮数が、符号に依存しない方法で丸められる浮動小数点丸めモードを含む、
請求項１９の計算システム。