JP4901097B2 - グラフィックス処理ユニットを使用して機械学習技術の処理を速め、最適化するシステムおよび方法 - Google Patents
グラフィックス処理ユニットを使用して機械学習技術の処理を速め、最適化するシステムおよび方法 Download PDFInfo
- Publication number
- JP4901097B2 JP4901097B2 JP2004357352A JP2004357352A JP4901097B2 JP 4901097 B2 JP4901097 B2 JP 4901097B2 JP 2004357352 A JP2004357352 A JP 2004357352A JP 2004357352 A JP2004357352 A JP 2004357352A JP 4901097 B2 JP4901097 B2 JP 4901097B2
- Authority
- JP
- Japan
- Prior art keywords
- computer
- machine learning
- processing unit
- calculating
- graphics processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/955—Hardware or software architectures specially adapted for image or video understanding using specific electronic processors
Description
グラフィックス処理ユニット(GPU)は、従来、リアルタイム3Dグラフィックス表示を速めるために使用されてきた。しかし、処理能力およびプログラム可能性の向上の結果、GPUは、他の非グラフィックス関連のプロセスを効率的に処理することもできる。こうしたプロセスは一般に、大量のデータおよび処理(計算流体力学など)を伴う代替のグラフィックスアルゴリズムおよび特定のコンピュータ問題に限定されている。しかし、音声認識および手書き文字認識などの対話型使用アプリケーションには、GPUアーキテクチャの制限および特徴のために、相対的にあまり関心が集まっていない。
本明細書で開示した機械学習GPU実行エンジンおよび方法は、コンピューティング環境で動作するように設計されている。次の説明は、機械学習GPU実行エンジンおよび方法を実施できる適したコンピューティング環境の簡単な概要を提供するためのものである。
GPUは、リアルタイム3Dグラフィックス表示を速めるように設計されている。より優れたグラフィックスに対する要求が増えるにつれて、GPUは急速により強力でプログラム可能なものになりつつある。プログラム可能性の向上の結果、GPUは、他の多くのタイプの非グラフィックス関連プロセスの効率的な処理を行うこともできる。本明細書で開示した機械学習GPU実行エンジンおよび方法は、CPU処理の一部をGPUに移植することによってCPUの計算の制約を軽減する。より具体的には、本発明は、従来CPUによって処理されていた機械学習アーキテクチャをGPUに移植する。以下で詳述するように、これは、GPUのいくつかの制限を克服し、機械学習技術のGPU処理を速め、最適化するためのいくつかの実装技術の使用を必要とする。汎用コンピューティングでは、機械学習は、GPUへの移植に特に適している。というのは、GPUは一般のCPUより強力だからである。
図3は、一例として勾配降下アルゴリズムを使用する3層学習機械のトレーニングモジュールを示すブロック/フロー図である。図3は、一例として示したにすぎず、本発明を勾配降下アルゴリズムに限定するためのものではない。この例では、勾配降下を使用して学習機械の最適化が行われる。他の機械学習技術では、ベイジアンネットワーク、グラフィカルモデルなどのように、勾配の代わりに確率を伝えることもある。層の数または構成もまた制限的なものではなく、本発明はより多くの層、より少ない層、または異なる層の構成(不連続)を有することができる。パラメータをW=(W1,W2,W3)とする。モジュール全体の入力はX、出力はY=Y3である。
本明細書で開示した機械学習GPU実行エンジン200は、機械学習GPU実行方法を使用して、GPUによる機械学習技術の処理を可能にする。一般にこの方法は、GPUを使用して機械学習技術をトレーニングするトレーニング段階、およびトレーニング済み関数を使用して適用された問題を解決するテスト段階に分けることができる。次にこれらの各段階について説明する。
トレーニング段階では、機械学習GPU実行方法を使用して、機械学習技術の学習可能パラメータをトレーニングする。図5は、機械学習GPU実行方法のトレーニング段階の動作の概要を示すフロー図である。図5は、GPUで実行されるトレーニングセッションのデータフローおよび制御構造を表す。図は、任意のタイプの機械学習技術に固有のものではないことに留意されたい。多くのタイプの機械学習技術(SVM、K−means、LVQ(Learning Vector Quantization)、期待値最大化(EM)など)がこのアーキテクチャを使用することができる。上記の機械学習技術は当分野ではよく知られており、詳しい説明は行わない。図5に示すように、CPUは、命令をGPUに与え、GPUがこれらの命令を完了するまでブロックする。あるいは、CPUおよびGPUに同時に計算させることもできる。
テスト段階では、機械学習GPU実行方法を使用して入力およびトレーニング可能パラメータの関数を計算する。図6は、機械学習GPU実行方法のテスト段階の動作の概要を示すフロー図である。図6に示すように、機械学習GPU実行方法は、一部のトレーニング可能パラメータWおよび入力Xの所与の関数Gを計算する。トレーニング可能パラメータは、GPU、CPU、または他の任意の手段によって計算されている可能性があることに留意されたい。さらに、トレーニング可能パラメータは、トレーニングの結果であっても、またはそうでなくてもよい。この点で、図6は、図5に示したトレーニング可能パラメータのトレーニングには依存していない。
機械学習の問題の説明
いくつかの機械学習技術は、非常に大きい行列演算として実行することができる計算を核として含んでいる。特に興味深いのは、大きい行列/ベクトル乗算である。一例として、手書き文字認識に使用されるニューラルネットワークは、一般に1対の層を含んでいる。図7は、ニューラルネットワークにおける1対の層の詳細図である。
[w][i]=[o’]
[o]=f([o’])
幸いにも、ニューラルネットワーク、期待値最大化、および他の多くの勾配降下ベースのアルゴリズムなどの多くの機械学習技術は、簡単な基本要素(または構成単位)から成る。基本要素は、
・内積(ベクトルまたは行列とベクトルとの間)
・外積(ベクトル間)
・線形代数(ベクトルまたは行列に対するスカラによる加算、減算、乗算)
・ベクトルまたは行列に適用される非線形(tanh、シグモイド、閾値処理(thresholding))
・行列の転置
機械学習GPU実行方法は、1つまたは複数のピクセルシェーダを使用して上記のすべての演算を実施する。ピクセルシェーダは、グラフィックス処理パイプラインで使用される。ピクセルシェーダは、ピクセルレンダリングハードウェア上で実行される個々のプログラムである。特に、三角形をピクセルに変えるプロセスは、「ラスタ化」と呼ばれる。ハードウェアは、三角形を入力としてみなし、三角形がレンダリングされる前にロードすることができるプログラムで指定する各ピクセルをレンダリングするよう命令することができる。これらのプログラム可能な三角形レンダラを「ピクセルシェーダ」と呼ぶ。シェーダでのプログラムの命令は、それぞれ直接的なハードウェアの実施を有するため、アセンブリ言語に近い。例えばHigh Level Shader Language(HLSL)、Nvidia(登録商標)社のC graphics(Cg)、DirectXなど、シェーダの競合する言語(およびハードウェア)がある。ピクセルシェーダによって導入された新しい柔軟性によって、表面の写実的なレンダリングだけではなく、GPUを汎用並列プロセッサにより近づけることができるようになる。
機械学習GPU実行方法は、1つまたは複数のピクセルシェーダを使用して黒丸付きにした(bulleted)基本的な演算のそれぞれを実施する。第1の問題は、シェーダに結果を計算させることである。結果とはGPUメモリ内の矩形である。言い換えれば、結果は浮動小数点値(4ベクトル)の2次元行列でなければならない。しかし、ピクセルシェーダは、所与の三角形のすべてのピクセルをレンダリングする。この問題を克服するために、機械学習GPU実行方法は、三角形で矩形のビューポートを指定する。図8は、機械学習GPU実行方法によって使用される矩形メモリ技術を示している。図8は特に、レンダリングされるピクセルを含んでいる三角形800、および三角形800内の矩形ビューポイント810を示している。機械学習GPU実行方法によれば、GPUは、ビューポイント810と三角形800との共通部分のピクセルを計算するだけでよい。したがって所望の矩形領域を計算するために、領域がビューポイント810として指定され、三角形800で囲まれる。これがレンダリングターゲットとなる。
内積の実施を説明する前に、GPU作業領域が4つの成分を有しているという点から各単位演算について説明する。各ピクセルがx、y、z、およびwの値から成るためにこれらの成分が生じる。ラベルxおよびyは、ここでは、上記の説明でピクセル座標を参照するxおよびyと混同しないものとする。4つの成分は従来、4次元物体空間に座標を格納するために使用されている。機械学習GPU実行方法は、GPUプログラミングモデルおよびハードウェアのこの特徴を活用して、より速く計算を行う。成分のうちの3つを無視して、すべての計算を例えばx平面で行うこともできるが、その結果得られるプログラミングの単純化は、パフォーマンスの面で代償が高くなる。
ピクセル0:x−>要素0
ピクセル0:y−>要素1
ピクセル0:z−>要素2
ピクセル0:w−>要素3
ピクセル1:x−>要素4
などである。
2つのベクトルの外積を、4つすべての成分の使用で達成することができるが、別の新しい技術を導入する必要がある。この技術は、機械学習GPU実行方法によって使用され、インデクサテクスチャ技術(indexer texture technique)と呼ばれる。一般にこれは、上述したように要素にマップされたベクトルの4つの成分のうちのただ1つの成分の値を選択する方法である。
C0,0=A0*B0
C1,0=A1*B0
C2,0=A2*B0
C3,0=A3*B0
mul r1,r2,r3.wwww
dp4 r3.w,r4,r5
となる。
frc r3,t3 //インデクサテクスチャ座標の端数部分をレジスタ3にロードする
texld r4,r3,sl //レジスタ3のテクスチャ座標を使用してインデクサテクスチャをサンプリングする
上記の技術を使用して、2つのベクトルの外積を計算するピクセルシェーダが作成される。
内積とは、(行列A*ベクトルB−>ベクトルC)と表すことができる演算である。内積は問題を提起する。というのは、いくつかの値にわたってループしている間、合計を累積することが必要となるからである。これは、隣接するピクセル間に通信がないことを前提とするシェーダアーキテクチャに反する。このため、内積は、単一のピクセルシェーダとして実施することができない。しかし、以下に示すように、一連のシェーダおよび一部の追加メモリを使用することによって内積を実施することができる。
C0=A0,0*B0+A0,1*B1+A0,2*B2+A0,3*B3
C1=A1,0*B0+A1,1*B1+A1,2*B2+A1,3*B3
などである。
mul r0、r1.xxxx、r2
mad r0、rl.yyyy、r3、r0
mad r0、r1.zzzz、r4、r0
mad r0、rl.wwww、r5、r0
本明細書に開示した機械学習GPU実行システムおよび方法を完全に理解するために、実施例の動作上の詳細を提示する。この実施例は、機械学習GPU実行システムおよび方法を実施できる方法を1つだけ示していることに留意されたい。
1.行列*ベクトル−>ベクトル(内積)
2.ベクトルの要素ごとにx=f(x)(この場合fはtanhまたはロジスティック関数、またはそれらの導関数)
3.ベクトルA−ベクトルB−>ベクトルC
4.ベクトル*ベクトル−>行列(外積)
5.行列A+定数*行列B−>行列A
6.行列の置換
7.GPUメモリ内の新しい場所へのコピー(行列またはベクトル)
8.CPUメモリからGPUメモリへの、またはその逆のコピー(行列またはベクトル)(これはDirectXによって直接サポートされ、完全を期すためのみに言及される)
120 中央処理装置(CPU)
130 CPUメモリ
190 ビデオインターフェース
200 機械学習GPU実行エンジン
210 高速バス
220 グラフィックス処理ユニット(GPU)
230 GPUメモリ
240 トレーニングモジュール
250 テストモジュール
Claims (29)
- コンピュータアプリケーションを処理するコンピュータ実施方法であって、
グラフィックス処理ユニットが、機械学習技術のトレーニング可能パラメータ、トレーニングデータ、及びターゲットデータを入力するステップと、
前記グラフィックス処理ユニットが、該入力したトレーニング可能パラメータ及び該入力したトレーニングデータに基づいた関数を計算することにより、第1の結果を取得するステップと、
前記第1の結果と前記ターゲットデータとの誤差が小さくなるように、前記トレーニング可能パラメータの値を更新するステップと、
前記グラフィックス処理ユニットが、クエリデータを入力するステップと、
前記グラフィックス処理ユニットが、該入力したクエリデータ及び該更新されたトレーニング可能パラメータに基づいた関数を計算することにより、第2の結果を取得するステップと、
前記第2の結果を使用して前記コンピュータアプリケーションによって使用できるように解を提供するステップとを備え、
前記計算するステップ及び前記取得するステップは、行列と列ベクトルとの内積を計算するステップをさらに含み、
前記内積を計算するステップは、
前記行列のうちの12列の行列と前記列ベクトルのうちの12列の列ベクトルとの内積を計算するためのピクセルシェーダを使用することにより、複数の列ベクトル部分積を計算するステップと、
該計算された複数の列ベクトル部分積を合計することにより、単一の列ベクトルを取得するステップと
をさらに含むことを特徴とする方法。 - 前記コンピュータアプリケーションは(a)音声認識アプリケーション、(b)手書き文字認識アプリケーションのうちの一方の対話型使用コンピュータアプリケーションであることを特徴とする請求項1に記載のコンピュータ実施方法。
- 前記機械学習技術はニューラルネットワークであることを特徴とする請求項1に記載のコンピュータ実施方法。
- 前記グラフィックス処理ユニットに前記更新されたトレーニング可能パラメータの少なくとも一部を格納するステップをさらに含むことを特徴とする請求項1に記載のコンピュータ実施方法。
- 前記計算するステップ及び前記取得するステップは、前記ピクセルシェーダを使用して外積を計算するステップをさらに含むことを特徴とする請求項1に記載のコンピュータ実施方法。
- テクスチャマッピングを使用して前記外積を計算するステップをさらに含むことを特徴とする請求項5に記載のコンピュータ実施方法。
- 前記計算するステップ及び前記取得するステップは、前記ピクセルシェーダを使用して行列の転置を行うステップをさらに含むことを特徴とする請求項1に記載のコンピュータ実施方法。
- テクスチャマッピングを使用して前記行列の転置を行うステップをさらに含むことを特徴とする請求項7に記載のコンピュータ実施方法。
- 請求項1に記載の前記コンピュータ実施方法を実行するためのコンピュータ実行可能命令を格納したことを特徴とするコンピュータ可読記録媒体。
- グラフィックス処理ユニットを使用して機械学習技術を処理するプロセスであって、
グラフィックス処理ユニットが、前記機械学習技術のトレーニング可能パラメータ、トレーニングデータ、及びターゲットデータを入力するステップと、
前記グラフィックス処理ユニットが、該入力したトレーニング可能パラメータ及び該入力したトレーニングデータに基づいた関数を計算することにより、第1の結果を取得するステップと、
前記第1の結果と前記ターゲットデータとの誤差が小さくなるように、前記トレーニング可能パラメータの値を更新するステップと、
前記グラフィックス処理ユニットが、クエリデータを入力するステップと、
前記グラフィックス処理ユニットが、該入力したクエリデータ及び該更新されたトレーニング可能パラメータに基づいた関数を計算することにより、第2の結果を取得するステップと、
アプリケーションによって使用できるように前記第2の結果を出力するステップとを含み、
前記計算するステップ及び前記取得するステップは、行列と列ベクトルとの内積を計算するステップをさらに含み、
前記内積を計算するステップは、
前記行列のうちの12列の行列と前記列ベクトルのうちの12列の列ベクトルとの内積を計算するためのピクセルシェーダを使用することにより、複数の列ベクトル部分積を計算するステップと、
該計算された複数の列ベクトル部分積を合計することにより、単一の列ベクトルを取得するステップと
をさらに含むことを特徴とするプロセス。 - 前記ピクセルシェーダはグラフィックカードに存在することを特徴とする請求項10に記載のプロセス。
- 前記ピクセルシェーダを使用して、外積、行列の転置のうちの少なくとも1つを計算するステップをさらに含むことを特徴とする請求項10に記載のプロセス。
- 前記機械学習技術はニューラルネットワークであることを特徴とする請求項10に記載のプロセス。
- 前記機械学習技術は期待値最大化(EM)技術を使用することを特徴とする請求項10に記載のプロセス。
- 前記機械学習技術は(a)K−means技術、(b)LVQ(Learning Vector Quantization)技術のうちの少なくとも一方であることを特徴とする請求項10に記載のプロセス。
- 前記グラフィックス処理ユニットを使用して前記トレーニングデータを前処理するステップをさらに含むことを特徴とする請求項10に記載のプロセス。
- 前記前処理するステップは、(a)前記トレーニングデータを標準化してそれを入力のためにより適した形式にするステップと、(b)前記トレーニングデータから情報および特徴を抽出するステップと、(c)入力データを取得して前記入力データを前記グラフィックス処理ユニットにロードするステップとのうちの少なくとも1つを含むことを特徴とする請求項16に記載のプロセス。
- 1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに請求項10の前記プロセスを実施させるためのコンピュータ可読命令を格納したことを特徴とする1つまたは複数のコンピュータ可読記録媒体。
- グラフィックス処理ユニットを使用して機械学習技術を処理するためのコンピュータ実行可能命令を格納したコンピュータ可読記録媒体であって、
グラフィックス処理ユニットが、前記機械学習技術のトレーニング可能パラメータ及びピクセルシェーダを入力するステップと、
前記グラフィックス処理ユニットが、前記機械学習技術のトレーニングデータ及びターゲットデータを入力するステップと、
前記グラフィックス処理ユニットが、該入力したトレーニング可能パラメータ及び該入力したトレーニングデータに基づいた関数を計算することにより、第1の結果を取得するステップと、
前記第1の結果と前記ターゲットデータとの誤差が小さくなるように、前記トレーニング可能パラメータの値を更新するステップと、
前記グラフィックス処理ユニットが、クエリデータを入力するステップと、
前記グラフィックス処理ユニットが、該入力したクエリデータ及び該更新されたトレーニング可能パラメータに基づいた関数を計算することにより、対話型使用アプリケーションによって使用するように第2の結果を取得するステップとを含み、
前記計算するステップ及び前記取得するステップは、行列と列ベクトルとの内積を計算するステップをさらに含み、
前記内積を計算するステップは、
前記行列のうちの12列の行列と前記列ベクトルのうちの12列の列ベクトルとの内積を計算するための前記ピクセルシェーダを使用することにより、複数の列ベクトル部分積を計算するステップと、
該計算された複数の列ベクトル部分積を合計することにより、単一の列ベクトルを取得するステップと
をさらに含むことを特徴とするコンピュータ可読記録媒体。 - 少なくとも一部のトレーニング可能パラメータを前記グラフィックス処理ユニットに配置するステップをさらに含むことを特徴とする請求項19に記載のコンピュータ可読記録媒体。
- 前記クエリデータを前処理して入力データを取得するステップと、
前記グラフィックス処理ユニットに前記入力データをロードするステップと
をさらに含むことを特徴とする請求項19に記載のコンピュータ可読記録媒体。 - 前記ピクセルシェーダを使用して、外積、行列の転置のうちの少なくとも1つを計算するステップをさらに含むことを特徴とする請求項19に記載のコンピュータ可読記録媒体。
- 前記機械学習技術はニューラルネットワークであることを特徴とする請求項19に記載のコンピュータ可読記録媒体。
- 前記機械学習技術は勾配降下技術であることを特徴とする請求項19に記載のコンピュータ可読記録媒体。
- 前記勾配降下技術の調整可能パラメータの少なくとも一部を前記グラフィックス処理ユニットに配置するステップをさらに含むことを特徴とする請求項24に記載のコンピュータ可読記録媒体。
- 前記対話型使用アプリケーションは手書き文字認識アプリケーションであることを特徴とする請求項19に記載のコンピュータ可読記録媒体。
- 前記機械学習技術はニューラルネットワークであり、前記ニューラルネットワークを使用して分類を行うステップをさらに含むことを特徴とする請求項26に記載のコンピュータ可読記録媒体。
- 前記対話型使用アプリケーションは光学文字認識アプリケーションであることを特徴とする請求項19に記載のコンピュータ可読記録媒体。
- 前記機械学習技術はニューラルネットワークであり、前記ニューラルネットワークを使用して分類を行うステップをさらに含むことを特徴とする請求項28に記載のコンピュータ可読記録媒体。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US52857803P | 2003-12-09 | 2003-12-09 | |
US60/528,578 | 2003-12-09 | ||
US10/837,382 | 2004-04-30 | ||
US10/837,382 US7219085B2 (en) | 2003-12-09 | 2004-04-30 | System and method for accelerating and optimizing the processing of machine learning techniques using a graphics processing unit |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005182785A JP2005182785A (ja) | 2005-07-07 |
JP4901097B2 true JP4901097B2 (ja) | 2012-03-21 |
Family
ID=34636692
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004357352A Expired - Fee Related JP4901097B2 (ja) | 2003-12-09 | 2004-12-09 | グラフィックス処理ユニットを使用して機械学習技術の処理を速め、最適化するシステムおよび方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7219085B2 (ja) |
EP (2) | EP2648132B1 (ja) |
JP (1) | JP4901097B2 (ja) |
KR (1) | KR101137107B1 (ja) |
CN (1) | CN100468320C (ja) |
Families Citing this family (188)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8471852B1 (en) | 2003-05-30 | 2013-06-25 | Nvidia Corporation | Method and system for tessellation of subdivision surfaces |
US8704837B2 (en) * | 2004-04-16 | 2014-04-22 | Apple Inc. | High-level program interface for graphics operations |
US8134561B2 (en) | 2004-04-16 | 2012-03-13 | Apple Inc. | System for optimizing graphics operations |
US20050243087A1 (en) * | 2004-04-30 | 2005-11-03 | Shmuel Aharon | GPU-based Finite Element |
US8189002B1 (en) * | 2004-10-29 | 2012-05-29 | PME IP Australia Pty, Ltd. | Method and apparatus for visualizing three-dimensional and higher-dimensional image data sets |
US7800620B2 (en) * | 2004-11-05 | 2010-09-21 | Microsoft Corporation | Optimizing automated shader program construction |
US7598953B2 (en) * | 2004-11-05 | 2009-10-06 | Microsoft Corporation | Interpreter for simplified programming of graphics processor units in general purpose programming languages |
US7733347B2 (en) * | 2004-11-05 | 2010-06-08 | Microsoft Corporation | Automated construction of shader programs |
US7839854B2 (en) * | 2005-03-08 | 2010-11-23 | Thomas Alexander | System and method for a fast, programmable packet processing system |
US7403784B2 (en) * | 2005-03-10 | 2008-07-22 | Avaya Technology Corp. | Method and apparatus for positioning a set of terminals in an indoor wireless environment |
JP4327175B2 (ja) * | 2005-07-12 | 2009-09-09 | 株式会社ソニー・コンピュータエンタテインメント | マルチグラフィックプロセッサシステム、グラフィックプロセッサおよび描画処理方法 |
US7747070B2 (en) | 2005-08-31 | 2010-06-29 | Microsoft Corporation | Training convolutional neural networks on graphics processing units |
US8571346B2 (en) | 2005-10-26 | 2013-10-29 | Nvidia Corporation | Methods and devices for defective pixel detection |
US7750956B2 (en) | 2005-11-09 | 2010-07-06 | Nvidia Corporation | Using a graphics processing unit to correct video and audio data |
US8624909B2 (en) * | 2005-11-21 | 2014-01-07 | Vixs Systems Inc. | Image processing system and method thereof |
US8588542B1 (en) | 2005-12-13 | 2013-11-19 | Nvidia Corporation | Configurable and compact pixel processing apparatus |
US8737832B1 (en) | 2006-02-10 | 2014-05-27 | Nvidia Corporation | Flicker band automated detection system and method |
US7599861B2 (en) | 2006-03-02 | 2009-10-06 | Convergys Customer Management Group, Inc. | System and method for closed loop decisionmaking in an automated care system |
US7809663B1 (en) | 2006-05-22 | 2010-10-05 | Convergys Cmg Utah, Inc. | System and method for supporting the utilization of machine language |
US8379830B1 (en) | 2006-05-22 | 2013-02-19 | Convergys Customer Management Delaware Llc | System and method for automated customer service with contingent live interaction |
EP2275835B1 (en) * | 2006-06-20 | 2012-10-31 | Qualcomm Incorporated | Receiver for radio positioning signals |
US8134566B1 (en) * | 2006-07-28 | 2012-03-13 | Nvidia Corporation | Unified assembly instruction set for graphics processing |
US8594441B1 (en) | 2006-09-12 | 2013-11-26 | Nvidia Corporation | Compressing image-based data using luminance |
US8648867B2 (en) * | 2006-09-25 | 2014-02-11 | Neurala Llc | Graphic processor based accelerator system and method |
KR100915329B1 (ko) * | 2006-12-02 | 2009-09-03 | 한국전자통신연구원 | 그래픽 프로세서의 범용 계산을 위한 성능 테스트 방법 |
US7907138B2 (en) * | 2006-12-29 | 2011-03-15 | Intel Corporation | System co-processor |
US8723969B2 (en) | 2007-03-20 | 2014-05-13 | Nvidia Corporation | Compensating for undesirable camera shakes during video capture |
US8724895B2 (en) | 2007-07-23 | 2014-05-13 | Nvidia Corporation | Techniques for reducing color artifacts in digital images |
US8392529B2 (en) | 2007-08-27 | 2013-03-05 | Pme Ip Australia Pty Ltd | Fast file server methods and systems |
US8570634B2 (en) | 2007-10-11 | 2013-10-29 | Nvidia Corporation | Image processing of an incoming light field using a spatial light modulator |
WO2009067675A1 (en) | 2007-11-23 | 2009-05-28 | Mercury Computer Systems, Inc. | Client-server visualization system with hybrid data processing |
US8548215B2 (en) | 2007-11-23 | 2013-10-01 | Pme Ip Australia Pty Ltd | Automatic image segmentation of a volume by comparing and correlating slice histograms with an anatomic atlas of average histograms |
US10311541B2 (en) | 2007-11-23 | 2019-06-04 | PME IP Pty Ltd | Multi-user multi-GPU render server apparatus and methods |
US9904969B1 (en) | 2007-11-23 | 2018-02-27 | PME IP Pty Ltd | Multi-user multi-GPU render server apparatus and methods |
WO2011065929A1 (en) | 2007-11-23 | 2011-06-03 | Mercury Computer Systems, Inc. | Multi-user multi-gpu render server apparatus and methods |
US8515052B2 (en) | 2007-12-17 | 2013-08-20 | Wai Wu | Parallel signal processing system and method |
US9177368B2 (en) * | 2007-12-17 | 2015-11-03 | Nvidia Corporation | Image distortion correction |
US20090172353A1 (en) * | 2007-12-28 | 2009-07-02 | Optillel Solutions | System and method for architecture-adaptable automatic parallelization of computing code |
US8234228B2 (en) * | 2008-02-07 | 2012-07-31 | Nec Laboratories America, Inc. | Method for training a learning machine having a deep multi-layered network with labeled and unlabeled training data |
US8698908B2 (en) | 2008-02-11 | 2014-04-15 | Nvidia Corporation | Efficient method for reducing noise and blur in a composite still image from a rolling shutter camera |
US20090234603A1 (en) * | 2008-03-17 | 2009-09-17 | Anritsu Company | System and method for accelerating an electrical measurement instrument using a graphical processing unit |
US9379156B2 (en) | 2008-04-10 | 2016-06-28 | Nvidia Corporation | Per-channel image intensity correction |
JP2011524049A (ja) * | 2008-06-04 | 2011-08-25 | エヌイーシー ラボラトリーズ アメリカ インク | 超並列アクセラレータを使用して学習機械の訓練と分類とを並列化し高速化するシステム及び方法 |
US8274516B2 (en) * | 2008-08-04 | 2012-09-25 | Microsoft Corporation | GPU scene composition and animation |
US8200594B1 (en) * | 2008-09-10 | 2012-06-12 | Nvidia Corporation | System, method, and computer program product for accelerating a game artificial intelligence process |
US8373718B2 (en) | 2008-12-10 | 2013-02-12 | Nvidia Corporation | Method and system for color enhancement with color volume adjustment and variable shift along luminance axis |
US20100188412A1 (en) * | 2009-01-28 | 2010-07-29 | Microsoft Corporation | Content based cache for graphics resource management |
US8711159B2 (en) | 2009-02-23 | 2014-04-29 | Microsoft Corporation | VGPU: a real time GPU emulator |
US20100223213A1 (en) * | 2009-02-27 | 2010-09-02 | Optillel Solutions, Inc. | System and method for parallelization of machine learning computing code |
US8749662B2 (en) | 2009-04-16 | 2014-06-10 | Nvidia Corporation | System and method for lens shading image correction |
CN101664583B (zh) * | 2009-09-09 | 2012-05-09 | 深圳市海博科技有限公司 | 基于cuda的剂量计算优化方法和系统 |
US8698918B2 (en) | 2009-10-27 | 2014-04-15 | Nvidia Corporation | Automatic white balancing for photography |
US8560466B2 (en) * | 2010-02-26 | 2013-10-15 | Trend Micro Incorporated | Method and arrangement for automatic charset detection |
RU2458384C1 (ru) * | 2011-02-17 | 2012-08-10 | Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации | Устройство для контроля эвм |
US8489529B2 (en) * | 2011-03-31 | 2013-07-16 | Microsoft Corporation | Deep convex network with joint use of nonlinear random projection, Restricted Boltzmann Machine and batch-based parallelizable optimization |
US20130054566A1 (en) * | 2011-08-31 | 2013-02-28 | Microsoft Corporation | Acceleration of ranking algorithms using a graphics processing unit |
JP4976578B1 (ja) | 2011-09-16 | 2012-07-18 | 楽天株式会社 | 画像検索装置およびプログラム |
JP5879899B2 (ja) * | 2011-10-12 | 2016-03-08 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
TW201322006A (zh) * | 2011-11-18 | 2013-06-01 | Ind Tech Res Inst | 資料處理方法及其裝置 |
US20130163195A1 (en) * | 2011-12-22 | 2013-06-27 | Nvidia Corporation | System, method, and computer program product for performing operations on data utilizing a computation module |
US9798698B2 (en) | 2012-08-13 | 2017-10-24 | Nvidia Corporation | System and method for multi-color dilu preconditioner |
CN102841881A (zh) * | 2012-08-21 | 2012-12-26 | 浪潮电子信息产业股份有限公司 | 一种基于众核处理器的多重积分计算方法 |
US9508318B2 (en) | 2012-09-13 | 2016-11-29 | Nvidia Corporation | Dynamic color profile management for electronic devices |
US9307213B2 (en) | 2012-11-05 | 2016-04-05 | Nvidia Corporation | Robust selection and weighting for gray patch automatic white balancing |
US8880446B2 (en) | 2012-11-15 | 2014-11-04 | Purepredictive, Inc. | Predictive analytics factory |
US10423889B2 (en) | 2013-01-08 | 2019-09-24 | Purepredictive, Inc. | Native machine learning integration for a data management product |
CN103996069B (zh) * | 2013-02-20 | 2018-04-03 | 百度在线网络技术(北京)有限公司 | 一种基于多gpu的bpnn训练方法和装置 |
US10540803B2 (en) | 2013-03-15 | 2020-01-21 | PME IP Pty Ltd | Method and system for rule-based display of sets of images |
US11183292B2 (en) | 2013-03-15 | 2021-11-23 | PME IP Pty Ltd | Method and system for rule-based anonymized display and data export |
US8976190B1 (en) | 2013-03-15 | 2015-03-10 | Pme Ip Australia Pty Ltd | Method and system for rule based display of sets of images |
US9509802B1 (en) | 2013-03-15 | 2016-11-29 | PME IP Pty Ltd | Method and system FPOR transferring data to improve responsiveness when sending large data sets |
US11244495B2 (en) | 2013-03-15 | 2022-02-08 | PME IP Pty Ltd | Method and system for rule based display of sets of images using image content derived parameters |
US10070839B2 (en) | 2013-03-15 | 2018-09-11 | PME IP Pty Ltd | Apparatus and system for rule based visualization of digital breast tomosynthesis and other volumetric images |
US9218574B2 (en) | 2013-05-29 | 2015-12-22 | Purepredictive, Inc. | User interface for machine learning |
US9646262B2 (en) | 2013-06-17 | 2017-05-09 | Purepredictive, Inc. | Data intelligence using machine learning |
US9756222B2 (en) | 2013-06-26 | 2017-09-05 | Nvidia Corporation | Method and system for performing white balancing operations on captured images |
US9826208B2 (en) | 2013-06-26 | 2017-11-21 | Nvidia Corporation | Method and system for generating weights for use in white balancing an image |
CN104809501B (zh) * | 2014-01-24 | 2018-05-01 | 清华大学 | 一种基于类脑协处理器的计算机系统 |
CN104809498B (zh) * | 2014-01-24 | 2018-02-13 | 清华大学 | 一种基于神经形态电路的类脑协处理器 |
CN104809426B (zh) * | 2014-01-27 | 2019-04-05 | 日本电气株式会社 | 卷积神经网络的训练方法、目标识别方法及装置 |
US20150242741A1 (en) * | 2014-02-21 | 2015-08-27 | Qualcomm Incorporated | In situ neural network co-processing |
US9953646B2 (en) | 2014-09-02 | 2018-04-24 | Belleau Technologies | Method and system for dynamic speech recognition and tracking of prewritten script |
US9563825B2 (en) | 2014-11-20 | 2017-02-07 | Adobe Systems Incorporated | Convolutional neural network using a binarized convolution layer |
US9418319B2 (en) | 2014-11-21 | 2016-08-16 | Adobe Systems Incorporated | Object detection using cascaded convolutional neural networks |
US10540957B2 (en) | 2014-12-15 | 2020-01-21 | Baidu Usa Llc | Systems and methods for speech transcription |
CN104538033A (zh) * | 2014-12-29 | 2015-04-22 | 江苏科技大学 | 基于嵌入式gpu系统的并行化语音识别系统及方法 |
KR102204286B1 (ko) | 2015-01-28 | 2021-01-18 | 구글 엘엘씨 | 배치 정규화 레이어들 |
CN104915322B (zh) * | 2015-06-09 | 2018-05-01 | 中国人民解放军国防科学技术大学 | 一种卷积神经网络硬件加速方法 |
US9786026B2 (en) | 2015-06-15 | 2017-10-10 | Microsoft Technology Licensing, Llc | Asynchronous translation of computer program resources in graphics processing unit emulation |
US9881351B2 (en) | 2015-06-15 | 2018-01-30 | Microsoft Technology Licensing, Llc | Remote translation, aggregation and distribution of computer program resources in graphics processing unit emulation |
US10452971B2 (en) * | 2015-06-29 | 2019-10-22 | Microsoft Technology Licensing, Llc | Deep neural network partitioning on servers |
US10540588B2 (en) * | 2015-06-29 | 2020-01-21 | Microsoft Technology Licensing, Llc | Deep neural network processing on hardware accelerators with stacked memory |
KR102505279B1 (ko) * | 2015-07-24 | 2023-03-02 | 삼성전자주식회사 | 복수의 cpu 및 복수의 gpu를 지원하는 컴퓨팅 환경에서의 연산 방법 |
US11599672B2 (en) | 2015-07-31 | 2023-03-07 | PME IP Pty Ltd | Method and apparatus for anonymized display and data export |
US9984478B2 (en) | 2015-07-28 | 2018-05-29 | PME IP Pty Ltd | Apparatus and method for visualizing digital breast tomosynthesis and other volumetric images |
US9972063B2 (en) | 2015-07-30 | 2018-05-15 | International Business Machines Corporation | Pipelined approach to fused kernels for optimization of machine learning workloads on graphical processing units |
US10380479B2 (en) * | 2015-10-08 | 2019-08-13 | International Business Machines Corporation | Acceleration of convolutional neural network training using stochastic perforation |
CN108351983A (zh) * | 2015-10-28 | 2018-07-31 | 谷歌有限责任公司 | 修改计算图 |
US10319374B2 (en) * | 2015-11-25 | 2019-06-11 | Baidu USA, LLC | Deployed end-to-end speech recognition |
US10616314B1 (en) | 2015-12-29 | 2020-04-07 | Amazon Technologies, Inc. | Dynamic source routing for data transfer |
US10482380B2 (en) | 2015-12-30 | 2019-11-19 | Amazon Technologies, Inc. | Conditional parallel processing in fully-connected neural networks |
CN105631482A (zh) * | 2016-03-03 | 2016-06-01 | 中国民航大学 | 一种基于卷积神经网络模型的危险物品图像分类方法 |
US20170264501A1 (en) * | 2016-03-14 | 2017-09-14 | Catalina Labs, Inc. | System and method for generating advice for improving internet and wifi performance in a network using machine-learning techniques |
CN107292385A (zh) * | 2016-03-31 | 2017-10-24 | 阿里巴巴集团控股有限公司 | 一种类Alexnet网络的模型训练方法和装置 |
US11797459B2 (en) | 2016-06-17 | 2023-10-24 | Hewlett-Packard Development Company, L.P. | Shared machine-learning data structure |
KR20180012439A (ko) | 2016-07-27 | 2018-02-06 | 삼성전자주식회사 | 회선 신경망에서 가속기 및 이의 동작 방법 |
RU2635902C1 (ru) | 2016-08-05 | 2017-11-16 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система отбора обучающих признаков для алгоритма машинного обучения |
CN106327564B (zh) * | 2016-08-25 | 2019-01-11 | 河南理工大学 | 一种图像处理方法及装置 |
CN106408618B (zh) * | 2016-08-31 | 2019-05-07 | 上海交通大学 | 一种基于机器学习的图像解构方法 |
WO2018063840A1 (en) * | 2016-09-28 | 2018-04-05 | D5A1 Llc; | Learning coach for machine learning system |
CN106529679B (zh) * | 2016-10-14 | 2020-01-14 | 腾讯科技(上海)有限公司 | 一种机器学习方法及系统 |
US10380222B2 (en) | 2016-10-17 | 2019-08-13 | International Business Machines Corporation | Matrix factorization with two-stage data block dispatch associated with graphics processing units |
US10623775B1 (en) * | 2016-11-04 | 2020-04-14 | Twitter, Inc. | End-to-end video and image compression |
CN106779057B (zh) * | 2016-11-11 | 2020-04-17 | 北京旷视科技有限公司 | 基于gpu的计算二值神经网络卷积的方法及装置 |
US10360494B2 (en) * | 2016-11-30 | 2019-07-23 | Altumview Systems Inc. | Convolutional neural network (CNN) system based on resolution-limited small-scale CNN modules |
US11010431B2 (en) | 2016-12-30 | 2021-05-18 | Samsung Electronics Co., Ltd. | Method and apparatus for supporting machine learning algorithms and data pattern matching in ethernet SSD |
US10824934B2 (en) * | 2017-01-12 | 2020-11-03 | Texas Instruments Incorporated | Methods and apparatus for matrix processing in a convolutional neural network |
CN106951961B (zh) * | 2017-02-24 | 2019-11-26 | 清华大学 | 一种粗粒度可重构的卷积神经网络加速器及系统 |
US11227543B2 (en) | 2017-03-10 | 2022-01-18 | Semiconductor Energy Laboratory Co., Ltd. | Touch panel system, electronic device, and semiconductor device having a neural network |
US10497084B2 (en) | 2017-04-24 | 2019-12-03 | Intel Corporation | Efficient sharing and compression expansion of data across processing systems |
US10186011B2 (en) * | 2017-04-28 | 2019-01-22 | Intel Corporation | Programmable coarse grained and sparse matrix compute hardware with advanced scheduling |
US11138494B2 (en) * | 2017-05-02 | 2021-10-05 | International Business Machines Corporation | Storage controller acceleration for neural network training and inference |
US20180322386A1 (en) * | 2017-05-05 | 2018-11-08 | Intel Corporation | Fine-grain compute communication execution for deep learning frameworks |
US10572773B2 (en) * | 2017-05-05 | 2020-02-25 | Intel Corporation | On the fly deep learning in machine learning for autonomous machines |
DK3568756T3 (da) * | 2017-05-17 | 2022-09-19 | Google Llc | Specialformålstræningschip til neuralt netværk |
TWI751500B (zh) * | 2017-05-17 | 2022-01-01 | 美商谷歌有限責任公司 | 用於執行矩陣乘法之方法、硬體電路、運算系統及電腦儲存媒體 |
WO2018212514A1 (ko) * | 2017-05-18 | 2018-11-22 | 삼성전자 주식회사 | 360도 영상을 처리하는 방법 및 장치 |
GB2562529B (en) * | 2017-05-18 | 2019-12-11 | Samsung Electronics Co Ltd | Method and apparatus for stabilising 360 degree video |
WO2018234919A1 (ja) | 2017-06-21 | 2018-12-27 | 株式会社半導体エネルギー研究所 | ニューラルネットワークを有する半導体装置 |
US20190005377A1 (en) * | 2017-06-30 | 2019-01-03 | Advanced Micro Devices, Inc. | Artificial neural network reduction to reduce inference computation time |
US10671349B2 (en) | 2017-07-24 | 2020-06-02 | Tesla, Inc. | Accelerated mathematical engine |
US11157287B2 (en) | 2017-07-24 | 2021-10-26 | Tesla, Inc. | Computational array microprocessor system with variable latency memory access |
US11157441B2 (en) | 2017-07-24 | 2021-10-26 | Tesla, Inc. | Computational array microprocessor system using non-consecutive data formatting |
US11409692B2 (en) | 2017-07-24 | 2022-08-09 | Tesla, Inc. | Vector computational unit |
US11893393B2 (en) | 2017-07-24 | 2024-02-06 | Tesla, Inc. | Computational array microprocessor system with hardware arbiter managing memory requests |
US10909679B2 (en) | 2017-09-24 | 2021-02-02 | PME IP Pty Ltd | Method and system for rule based display of sets of images using image content derived parameters |
US11694066B2 (en) * | 2017-10-17 | 2023-07-04 | Xilinx, Inc. | Machine learning runtime library for neural network acceleration |
US10599978B2 (en) * | 2017-11-03 | 2020-03-24 | International Business Machines Corporation | Weighted cascading convolutional neural networks |
US11710028B2 (en) * | 2017-12-30 | 2023-07-25 | Intel Corporation | Efficient convolution in machine learning environments |
KR102113093B1 (ko) * | 2018-01-10 | 2020-05-20 | 서울대학교산학협력단 | 딥 뉴럴 네트워크를 위한 gpu 메모리 관리 방법 및 그를 수행하는 연산 장치 |
KR102228586B1 (ko) | 2018-01-19 | 2021-03-16 | 한국전자통신연구원 | Gpu 기반의 적응적 blas 연산 가속화 장치 및 방법 |
US11561791B2 (en) | 2018-02-01 | 2023-01-24 | Tesla, Inc. | Vector computational unit receiving data elements in parallel from a last row of a computational array |
US11468312B2 (en) * | 2018-02-02 | 2022-10-11 | Samsung Electronics Co., Ltd. | Memory management for machine learning training on GPU |
US10681173B2 (en) | 2018-04-03 | 2020-06-09 | International Business Machines Corporation | Optimized network traffic patterns for co-located heterogeneous network attached accelerators |
US10430493B1 (en) * | 2018-04-05 | 2019-10-01 | Rain Neuromorphics Inc. | Systems and methods for efficient matrix multiplication |
KR20190136431A (ko) | 2018-05-30 | 2019-12-10 | 삼성전자주식회사 | 뉴럴 네트워크 시스템, 이를 포함하는 어플리케이션 프로세서 및 뉴럴 네트워크 시스템의 동작방법 |
US20190378016A1 (en) * | 2018-06-07 | 2019-12-12 | International Business Machines Corporation | Distributed computing architecture for large model deep learning |
CN110766147B (zh) * | 2018-07-25 | 2022-10-11 | 赛灵思公司 | 神经网络编译器架构及编译方法 |
JP7216190B2 (ja) * | 2018-08-20 | 2023-01-31 | シーメンス アクチエンゲゼルシヤフト | プログラマブルロジックコントローラベースの人工知能用モジュール式アクセラレーションモジュール |
US11037356B2 (en) | 2018-09-24 | 2021-06-15 | Zignal Labs, Inc. | System and method for executing non-graphical algorithms on a GPU (graphics processing unit) |
KR102277172B1 (ko) * | 2018-10-01 | 2021-07-14 | 주식회사 한글과컴퓨터 | 인공 신경망 선택 장치 및 방법 |
CN109460260B (zh) * | 2018-10-24 | 2021-07-09 | 瑞芯微电子股份有限公司 | 一种快速开机的方法和装置 |
CN109272110A (zh) * | 2018-10-31 | 2019-01-25 | 上海交通大学 | 基于光子神经网络芯片的光电融合智能信号处理系统 |
US11526759B2 (en) * | 2018-11-05 | 2022-12-13 | International Business Machines Corporation | Large model support in deep learning |
CN109359120A (zh) * | 2018-11-09 | 2019-02-19 | 阿里巴巴集团控股有限公司 | 一种模型训练中的数据更新方法、装置及设备 |
US11880769B2 (en) * | 2018-11-14 | 2024-01-23 | Advanced Micro Devices, Inc. | Using multiple functional blocks for training neural networks |
US10922790B2 (en) * | 2018-12-21 | 2021-02-16 | Intel Corporation | Apparatus and method for efficient distributed denoising of a graphics frame |
CN113383225A (zh) * | 2018-12-26 | 2021-09-10 | 加利福尼亚大学董事会 | 使用深度学习将二维荧光波传播到表面上的系统和方法 |
US11537936B2 (en) | 2019-01-17 | 2022-12-27 | Servicenow, Inc. | Data set generation for testing of machine learning pipelines |
US11550971B1 (en) | 2019-01-18 | 2023-01-10 | X Development Llc | Physics simulation on machine-learning accelerated hardware platforms |
KR102543413B1 (ko) * | 2019-02-12 | 2023-06-13 | 에스케이하이닉스 주식회사 | 웨이트 매트릭스를 포맷하는 방법, 포맷된 데이터를 사용하는 가속기 및 이를 포함하는 시스템 |
US11170064B2 (en) | 2019-03-05 | 2021-11-09 | Corinne David | Method and system to filter out unwanted content from incoming social media data |
US11151325B2 (en) | 2019-03-22 | 2021-10-19 | Servicenow, Inc. | Determining semantic similarity of texts based on sub-sections thereof |
US10671892B1 (en) | 2019-03-31 | 2020-06-02 | Hyper Labs, Inc. | Apparatuses, methods, and systems for 3-channel dynamic contextual script recognition using neural network image analytics and 4-tuple machine learning with enhanced templates and context data |
US11595484B2 (en) | 2019-05-03 | 2023-02-28 | Servicenow, Inc. | Centralized machine learning predictor for a remote network management platform |
US11586659B2 (en) | 2019-05-03 | 2023-02-21 | Servicenow, Inc. | Clustering and dynamic re-clustering of similar textual documents |
US11651032B2 (en) | 2019-05-03 | 2023-05-16 | Servicenow, Inc. | Determining semantic content of textual clusters |
JP7351641B2 (ja) * | 2019-05-29 | 2023-09-27 | 理想科学工業株式会社 | 印刷データ生成装置 |
US11115432B2 (en) | 2019-07-08 | 2021-09-07 | Servicenow, Inc. | Multi-application recommendation engine for a remote network management platform |
CN110502975B (zh) * | 2019-07-09 | 2023-06-23 | 平安科技(深圳)有限公司 | 一种行人重识别的批量处理系统 |
CN110399222B (zh) * | 2019-07-25 | 2022-01-21 | 北京邮电大学 | Gpu集群深度学习任务并行化方法、装置及电子设备 |
KR20190096872A (ko) * | 2019-07-31 | 2019-08-20 | 엘지전자 주식회사 | 연합학습(Federated learning)을 통한 필기체 인식방법 및 이를 위한 장치 |
KR102147912B1 (ko) | 2019-08-13 | 2020-08-25 | 삼성전자주식회사 | 프로세서 칩 및 그 제어 방법들 |
JP7373840B2 (ja) * | 2019-10-03 | 2023-11-06 | 株式会社 システムスクエア | 検査装置 |
US11450712B2 (en) | 2020-02-18 | 2022-09-20 | Rain Neuromorphics Inc. | Memristive device |
CN111526357B (zh) * | 2020-04-14 | 2021-06-29 | 艾瑞思检测技术(苏州)有限公司 | 一种基于pca学习的显卡接口机器测试方法 |
CN111522771B (zh) * | 2020-04-20 | 2023-08-15 | 北京百度网讯科技有限公司 | 眼底图像处理方法、终端设备及存储介质 |
US20210374563A1 (en) * | 2020-05-29 | 2021-12-02 | Joni Jezewski | Solution Automation |
US11314783B2 (en) | 2020-06-05 | 2022-04-26 | Bank Of America Corporation | System for implementing cognitive self-healing in knowledge-based deep learning models |
US11756290B2 (en) | 2020-06-10 | 2023-09-12 | Bank Of America Corporation | System for intelligent drift matching for unstructured data in a machine learning environment |
US11470107B2 (en) | 2020-06-10 | 2022-10-11 | Servicenow, Inc. | Matching configuration items with machine learning |
US11451573B2 (en) | 2020-06-16 | 2022-09-20 | Servicenow, Inc. | Merging duplicate items identified by a vulnerability analysis |
US11915360B2 (en) | 2020-10-20 | 2024-02-27 | The Regents Of The University Of California | Volumetric microscopy methods and systems using recurrent neural networks |
CN112270413B (zh) * | 2020-10-22 | 2024-02-27 | 北京百度网讯科技有限公司 | 算子合并方法、装置、电子设备及存储介质 |
CN112508188A (zh) * | 2020-12-01 | 2021-03-16 | 北京奇艺世纪科技有限公司 | 一种分布式模型训练系统、方法、装置、设备和存储介质 |
US20220414492A1 (en) * | 2021-06-23 | 2022-12-29 | Joni Jezewski | Additional Solution Automation & Interface Analysis Implementations |
US20230044564A1 (en) * | 2021-08-03 | 2023-02-09 | Joni Jezewski | Other Solution Automation & Interface Analysis Implementations |
KR102543512B1 (ko) * | 2022-10-31 | 2023-06-13 | 서울대학교산학협력단 | 뉴럴 렌더링을 위한 저정밀도 하드웨어 가속기 및 그 동작 방법 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5343537A (en) * | 1991-10-31 | 1994-08-30 | International Business Machines Corporation | Statistical mixture approach to automatic handwriting recognition |
US5592597A (en) | 1994-02-14 | 1997-01-07 | Parametric Technology Corporation | Real-time image generation system for simulating physical paint, drawing media, and feature modeling with 3-D graphics |
-
2004
- 2004-04-30 US US10/837,382 patent/US7219085B2/en active Active
- 2004-11-04 EP EP13174608.3A patent/EP2648132B1/en active Active
- 2004-11-04 EP EP04026215.6A patent/EP1569128B1/en active Active
- 2004-11-17 KR KR1020040094065A patent/KR101137107B1/ko not_active IP Right Cessation
- 2004-12-08 CN CNB2004101019745A patent/CN100468320C/zh not_active Expired - Fee Related
- 2004-12-09 JP JP2004357352A patent/JP4901097B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005182785A (ja) | 2005-07-07 |
US7219085B2 (en) | 2007-05-15 |
CN1627251A (zh) | 2005-06-15 |
EP2648132B1 (en) | 2018-07-11 |
EP1569128B1 (en) | 2015-06-17 |
EP1569128A2 (en) | 2005-08-31 |
US20050125369A1 (en) | 2005-06-09 |
CN100468320C (zh) | 2009-03-11 |
KR101137107B1 (ko) | 2012-07-02 |
EP2648132A1 (en) | 2013-10-09 |
KR20050056124A (ko) | 2005-06-14 |
EP1569128A3 (en) | 2011-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4901097B2 (ja) | グラフィックス処理ユニットを使用して機械学習技術の処理を速め、最適化するシステムおよび方法 | |
US7548892B2 (en) | Processing machine learning techniques using a graphics processing unit | |
US7567252B2 (en) | Optimizing performance of a graphics processing unit for efficient execution of general matrix operations | |
US11847550B2 (en) | Sparse convolutional neural network accelerator | |
US11887001B2 (en) | Method and apparatus for reducing the parameter density of a deep neural network (DNN) | |
KR101298393B1 (ko) | 그래픽 처리 유닛 상에서 콘볼루션 신경망을 트레이닝하는방법 | |
Kolb et al. | Dynamic particle coupling for GPU-based fluid simulation | |
US9508181B2 (en) | Ordering and rendering buffers for complex scenes with cyclic dependency | |
US20190005377A1 (en) | Artificial neural network reduction to reduce inference computation time | |
US10397542B2 (en) | Facilitating quantization and compression of three-dimensional graphics data using screen space metrics at computing devices | |
EP3678037A1 (en) | Neural network generator | |
US20190371041A1 (en) | Compiler-assisted techniques for memory use reduction in graphics pipeline | |
CN109564694A (zh) | 用于基于入库的图形处理的顶点着色器 | |
US20220165040A1 (en) | Appearance-driven automatic three-dimensional modeling | |
US8482559B2 (en) | Method and apparatus for triangle tessellation | |
US10552211B2 (en) | Mechanism to increase thread parallelism in a graphics processor | |
US20210358174A1 (en) | Method and apparatus of data compression | |
Harris et al. | Iterative Solutions using Programmable Graphics Processing Units. | |
Ilie | Optical character recognition on graphics hardware | |
Cabido et al. | Hardware-accelerated template matching | |
Ohmer et al. | Real-time tracking with non-rigid geometric templates using the gpu | |
US20210407182A1 (en) | Load instruction for multi sample anti-aliasing | |
CN117974441A (zh) | 用于图像处理的方法、设备和计算机程序产品 | |
Strengert | Parallel visualization and compute environments for graphics clusters | |
Ohmer | Computer vision applications on graphics processing units |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110412 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110712 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110805 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111220 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111227 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150113 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees | ||
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |