JP2012530966A5 - - Google Patents

Download PDF

Info

Publication number
JP2012530966A5
JP2012530966A5 JP2012516227A JP2012516227A JP2012530966A5 JP 2012530966 A5 JP2012530966 A5 JP 2012530966A5 JP 2012516227 A JP2012516227 A JP 2012516227A JP 2012516227 A JP2012516227 A JP 2012516227A JP 2012530966 A5 JP2012530966 A5 JP 2012530966A5
Authority
JP
Japan
Prior art keywords
lphdr
input
execution units
operation execution
perform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012516227A
Other languages
English (en)
Other versions
JP2012530966A (ja
Filing date
Publication date
Priority claimed from US12/816,201 external-priority patent/US8150902B2/en
Application filed filed Critical
Publication of JP2012530966A publication Critical patent/JP2012530966A/ja
Publication of JP2012530966A5 publication Critical patent/JP2012530966A5/ja
Pending legal-status Critical Current

Links

Claims (53)

  1. 少なくとも1つの第1の低精度ハイ・ダイナミック・レンジ(LPHDR)演算実行ユニットであって、第2の数値を表す第1の出力信号を生み出すために、第1の数値を表す第1の入力信号に対して第1の処理を実行するように構成されており、
    第1の処理への許容できる有効な入力のダイナミック・レンジは、少なくとも1/65,000から65,000までの幅を有し、第1の処理への前記許容できる有効な入力の少なくともX=5%の入力に関して、
    第1の処理への前記許容できる有効な入力の少なくともX=5%の入力から選択された各特定の入力について繰り返し実行される第1の処理において、その特定の入力に対する第1の処理を実行するLPHDR演算実行ユニットの第1の出力信号によって表される数値の統計学的平均が、その同じ特定の入力の数値に対する第1の処理の正確な数学的計算の結果より少なくともY=0.05%だけ異なる
    LPHDR演算実行ユニットを備えることを特徴とするデバイス。
  2. 請求項1に記載されたデバイスであって、前記少なくとも1つの第1のLPHDR演算実行ユニットは、フィールド・プログラマブル・ゲート・アレイ(FPGA)の少なくとも一部を備えていることを特徴とするデバイス。
  3. 請求項1に記載されたデバイスであって、前記デバイス中のLPHDR演算実行ユニットの数は、
    少なくとも32ビット幅の浮動小数点数に対する少なくとも乗算の演算を実行するように構成されたデバイスにおける、負ではない整数の演算実行ユニットの数の3倍+20を超える数であることを特徴とするデバイス。
  4. 請求項3に記載されたデバイスであって、前記少なくとも1つの第1のLPHDR演算実行ユニットは、フィールド・プログラマブル・ゲート・アレイ(FPGA)の少なくとも一部を備えていることを特徴とするデバイス。
  5. 請求項1に記載されたデバイスであって、前記デバイス中のLPHDR演算実行ユニットの数は、
    少なくとも32ビット幅の浮動小数点数に対する少なくとも乗算の演算を実行するように構成されたデバイスにおける、負ではない整数の演算実行ユニットの数の5倍+50を超える数であることを特徴とするデバイス。
  6. 請求項1に記載されたデバイスであって、前記デバイス中のLPHDR演算実行ユニットの数は、
    少なくとも32ビット幅の浮動小数点数に対する少なくとも乗算の演算を実行するように構成されたデバイスにおける、負ではない整数の演算実行ユニットの数の5倍+100を超える数であることを特徴とするデバイス。
  7. 請求項1に記載されたデバイスであって、前記デバイス中のLPHDR演算実行ユニットの数は、
    少なくとも32ビット幅の浮動小数点数に対する少なくとも乗算の演算を実行するように構成されたデバイスにおける、負ではない整数の演算実行ユニットの数の5倍+1000を超える数であることを特徴とするデバイス。
  8. 請求項1に記載されたデバイスであって、前記デバイス中のLPHDR演算実行ユニットの数は、
    少なくとも32ビット幅の浮動小数点数に対する少なくとも乗算の演算を実行するように構成されたデバイスにおける、負ではない整数の演算実行ユニットの数の5倍+5000を超える数であることを特徴とするデバイス。
  9. コンピュータ・プロセッサーと、コンピュータ・プログラムの命令を記憶するためのコンピュータ読み取り可能なメモリを備え、
    当該コンピュータ・プログラムの命令は、第2のデバイスをエミュレートするためのプロセッサーによって実行することができ、
    当該第2のデバイスは、
    少なくとも1つの第1の低精度ハイ・ダイナミック・レンジ(LPHDR)演算実行ユニットであって、第2の数値を表す第1の出力信号を生み出すために、第1の数値を表す第1の入力信号に対して第1の処理を実行するように構成されており、
    第1の処理への許容できる有効な入力のダイナミック・レンジは、少なくとも1/65,000から65,000までの幅を有し、第1の処理への前記許容できる有効な入力の少なくともX=5%の入力に関して、
    第1の処理への前記許容できる有効な入力の少なくともX=5%の入力から選択された各特定の入力について繰り返し実行される第1の処理において、その特定の入力に対する第1の処理を実行するLPHDR演算実行ユニットの第1の出力信号によって表される数値の統計学的平均が、その同じ特定の入力の数値に対する第1の処理の正確な数学的計算の結果より少なくともY=0.05%だけ異なる
    LPHDR演算実行ユニットを備えることを特徴とするデバイス。
  10. 請求項9に記載されたデバイスであって、前記第2のデバイス中のLPHDR演算実行ユニットの数は、
    少なくとも32ビット幅の浮動小数点数に対する少なくとも乗算の演算を実行するように構成された第2のデバイスにおける、負ではない整数の演算実行ユニットの数の3倍+20を超える数であることを特徴とするデバイス。
  11. 請求項9に記載されたデバイスであって、前記第2のデバイス中のLPHDR演算実行ユニットの数は、
    少なくとも32ビット幅の浮動小数点数に対する少なくとも乗算の演算を実行するように構成された第2のデバイスにおける、負ではない整数の演算実行ユニットの数の5倍+100を超える数であることを特徴とするデバイス。
  12. 少なくとも1つの第1の低精度ハイ・ダイナミック・レンジ(LPHDR)演算実行ユニットであって、第2の数値を表す第1の出力信号を生み出すために、第1の数値を表す第1の入力信号に対して第1の処理を実行するように構成されており、
    第1の処理への許容できる有効な入力のダイナミック・レンジは、少なくとも1/65,000から65,000までの幅を有し、第1の処理への前記許容できる有効な入力の少なくともX=5%の入力に関して、
    第1の処理への前記許容できる有効な入力の少なくともX=5%の入力から選択された各特定の入力について繰り返し実行される第1の処理において、その特定の入力に対する第1の処理を実行するLPHDR演算実行ユニットの第1の出力信号によって表される数値の統計学的平均が、その同じ特定の入力の数値に対する第1の処理の正確な数学的計算の結果より少なくともY=0.05%だけ異なる
    LPHDR演算実行ユニットを備え、
    当該デバイス中のLPHDR演算実行ユニットの数は、
    少なくとも32ビット幅の浮動小数点数に対する少なくとも乗算の演算を実行するように構成されたデバイスにおける、負ではない整数の演算実行ユニットの数を上回っていることを特徴とするデバイス。
  13. 請求項12に記載されたデバイスであって、前記少なくとも1つの第1のLPHDR演算実行ユニットは、フィールド・プログラマブル・ゲート・アレイ(FPGA)の少なくとも一部を備えていることを特徴とするデバイス。
  14. 請求項12に記載されたデバイスであって、前記デバイス中のLPHDR演算実行ユニットの数は、
    少なくとも32ビット幅の浮動小数点数に対する少なくとも乗算の演算を実行するように構成されたデバイスにおける、負ではない整数の演算実行ユニットの数の3倍+20を超える数であることを特徴とするデバイス。
  15. 請求項14に記載されたデバイスであって、前記少なくとも1つの第1のLPHDR演算実行ユニットは、フィールド・プログラマブル・ゲート・アレイ(FPGA)の少なくとも一部を備えていることを特徴とするデバイス。
  16. 請求項12に記載されたデバイスであって、前記デバイス中のLPHDR演算実行ユニットの数は、
    少なくとも32ビット幅の浮動小数点数に対する少なくとも乗算の演算を実行するように構成されたデバイスにおける、負ではない整数の演算実行ユニットの数の5倍+50を超える数であることを特徴とするデバイス。
  17. 請求項12に記載されたデバイスであって、前記デバイス中のLPHDR演算実行ユニットの数は、
    少なくとも32ビット幅の浮動小数点数に対する少なくとも乗算の演算を実行するように構成されたデバイスにおける、負ではない整数の演算実行ユニットの数の5倍+100を超える数であることを特徴とするデバイス。
  18. 請求項12に記載されたデバイスであって、前記デバイス中のLPHDR演算実行ユニットの数は、
    少なくとも32ビット幅の浮動小数点数に対する少なくとも乗算の演算を実行するように構成されたデバイスにおける、負ではない整数の演算実行ユニットの数の5倍+1000を超える数であることを特徴とするデバイス。
  19. 請求項12に記載されたデバイスであって、前記デバイス中のLPHDR演算実行ユニットの数は、
    少なくとも32ビット幅の浮動小数点数に対する少なくとも乗算の演算を実行するように構成されたデバイスにおける、負ではない整数の演算実行ユニットの数の5倍+5000を超える数であることを特徴とするデバイス。
  20. コンピュータ・プロセッサーと、コンピュータ・プログラムの命令を記憶するためのコンピュータ読み取り可能なメモリを備え、
    当該コンピュータ・プログラムの命令は、第2のデバイスをエミュレートするためのプロセッサーによって実行することができ、
    当該第2のデバイスは、
    少なくとも1つの第1の低精度ハイ・ダイナミック・レンジ(LPHDR)演算実行ユニットであって、第2の数値を表す第1の出力信号を生み出すために、第1の数値を表す第1の入力信号に対して第1の処理を実行するように構成されており、
    第1の処理への許容できる有効な入力のダイナミック・レンジは、少なくとも1/65,000から65,000までの幅を有し、第1の処理への前記許容できる有効な入力の少なくともX=5%の入力に関して、
    第1の処理への前記許容できる有効な入力の少なくともX=5%の入力から選択された各特定の入力について繰り返し実行される第1の処理において、その特定の入力に対する第1の処理を実行するLPHDR演算実行ユニットの第1の出力信号によって表される数値の統計学的平均が、その同じ特定の入力の数値に対する第1の処理の正確な数学的計算の結果より少なくとも0.05%だけ異なる
    LPHDR演算実行ユニットを備え、
    当該第2のデバイス中のLPHDR演算実行ユニットの数は、
    少なくとも32ビット幅の浮動小数点数に対する少なくとも乗算の演算を実行するように構成された第2のデバイスにおける、負ではない整数の演算実行ユニットの数を上回っていることを特徴とするデバイス。
  21. 請求項20に記載されたデバイスであって、前記第2のデバイス中のLPHDR演算実行ユニットの数は、
    少なくとも32ビット幅の浮動小数点数に対する少なくとも乗算の演算を実行するように構成された第2のデバイスにおける、負ではない整数の演算実行ユニットの数の3倍+20を超える数であることを特徴とするデバイス。
  22. 請求項20に記載されたデバイスであって、前記第2のデバイス中のLPHDR演算実行ユニットの数は、
    少なくとも32ビット幅の浮動小数点数に対する少なくとも乗算の演算を実行するように構成された第2のデバイスにおける、負ではない整数の演算実行ユニットの数の5倍+100を超える数であることを特徴とするデバイス。
  23. 請求項1乃至22のいずれかに記載されたデバイスであって、前記XがX=10%であることを特徴とするデバイス。
  24. 請求項1乃至22のいずれかに記載されたデバイスであって、前記YがY=0.1%であることを特徴とするデバイス。
  25. 請求項1乃至22のいずれかに記載されたデバイスであって、前記YがY=0.5%であることを特徴とするデバイス。
  26. 請求項1乃至22のいずれかに記載されたデバイスであって、前記YがY=0.2%であることを特徴とするデバイス。
  27. 請求項1乃至22のいずれかに記載されたデバイスであって、前記XがX=10%であり、前記YがY=0.1%であることを特徴とするデバイス。
  28. 請求項1乃至22のいずれかに記載されたデバイスであって、前記XがX=10%であり、前記YがY=0.5%であることを特徴とするデバイス。
  29. 請求項1乃至22のいずれかに記載されたデバイスであって、前記XがX=10%であり、前記YがY=0.2%であることを特徴とするデバイス。
  30. 請求項1乃至22のいずれかに記載されたデバイスであって、第1の処理への入力であって、許容できる有効な入力のダイナミック・レンジは、少なくとも1/1,000,000から1,000,000までの幅を有することを特徴とするデバイス。
  31. 請求項1、11、14、24のいずれかに記載のデバイスであって、少なくとも1つの第1のLPHDR演算実行ユニットが、複数の局所的に接続されたLPHDR演算実行ユニットからなることを特徴とするデバイス。
  32. 請求項1または12のいずれかに記載のデバイスであって、前記デバイスがSIMDアーキテクチャを備えていることを特徴とするデバイス。
  33. 請求項1または12のいずれかに記載のデバイスであって、前記デバイスは、少なくとも1つの第1のLPHDR演算実行ユニットに局所的にアクセス可能なメモリを備えていることを特徴とするデバイス。
  34. 請求項1または12のいずれかに記載のデバイスであって、前記デバイスは、シリコン・チップ上に実装されていることを特徴とするデバイス。
  35. 請求項1または12のいずれかに記載のデバイスであって、前記デバイスは、デジタル技術を使用し、シリコン・チップ上に実装されていることを特徴とするデバイス。
  36. 請求項1または12のいずれかに記載のデバイスであって、前記デバイスは、少なくとも1つの第1のLPHDR演算実行ユニットを制御するように構成されたデジタル・プロセッサーを更に備えている。
  37. 請求項1または12のいずれかに記載のデバイスであって、前記デバイス中のLPHDR演算実行ユニットの数は、
    少なくとも32ビット幅の浮動小数点数に対する少なくとも乗算の演算を実行するように構成されたデバイスにおける、負ではない整数の演算実行ユニットの数の5倍+100を超える数であり、
    前記デバイスは、少なくとも1つのLPHDR演算実行ユニットに局所的にアクセス可能なメモリを備えており、
    前記デバイスは、デジタル技術を使用し、シリコン・チップ上に実装されていることを特徴とするデバイス。
  38. 請求項1または12のいずれかに記載のデバイスであって、前記デバイスはモバイル・デバイスの一部であることを特徴とするデバイス。
  39. 請求項1、9、12、20のいずれかに記載のデバイスであって、前記少なくとも1つの第1のLPHDR演算実行ユニットが、対数表示を使用することによって数値を表わしていることを特徴とするデバイス。
  40. 請求項1、9、12、20のいずれかに記載のデバイスであって、前記少なくとも1つの第1のLPHDR演算実行ユニットが、浮動小数点表示を使用することによって数値を表わしていることを特徴とするデバイス。
  41. 請求項1または12のいずれかに記載のデバイスであって、前記デバイスは、入力画像を表すデータを受け取るための入力手段を更に備え、
    当該入力画像には第1の入力信号が含まれていることを特徴とするデバイス。
  42. 請求項41に記載のデバイスであって、前記デバイスはモバイル・デバイスの一部であることを特徴とするデバイス。
  43. 請求項41に記載のデバイスであって、前記デバイスは入力画像のぼやけ除去のために構成されたものであることを特徴とするデバイス。
  44. 請求項1または12のいずれかに記載のデバイスであって、前記デバイスは、最近傍探索のために構成されたものであることを特徴とするデバイス。
  45. 請求項9または20のいずれかに記載のデバイスであって、前記第2のデバイスがSIMDアーキテクチャを備えていることを特徴とするデバイス。
  46. 請求項9または20のいずれかに記載のデバイスであって、前記第2のデバイスは、少なくとも1つの第1のLPHDR演算実行ユニットに局所的にアクセス可能なメモリを備えていることを特徴とするデバイス。
  47. 請求項9または20のいずれかに記載のデバイスであって、前記第2のデバイスは、シリコン・チップ上に実装されていることを特徴とするデバイス。
  48. 請求項9または20のいずれかに記載のデバイスであって、前記第2のデバイスは、デジタル技術を使用し、シリコン・チップ上に実装されていることを特徴とするデバイス。
  49. 請求項9または20のいずれかに記載のデバイスであって、前記第2のデバイスは、少なくとも1つの第1のLPHDR演算実行ユニットを制御するように構成されたデジタル・プロセッサーを更に備えている。
  50. 請求項9または20のいずれかに記載のデバイスであって、前記第2のデバイス中のLPHDR演算実行ユニットの数は、
    少なくとも32ビット幅の浮動小数点数に対する少なくとも乗算の演算を実行するように構成された第2のデバイスにおける、負ではない整数の演算実行ユニットの数の5倍+100を超える数であり、
    前記第2のデバイスは、少なくとも1つのLPHDR演算実行ユニットに局所的にアクセス可能なメモリを備えており、
    前記第2のデバイスは、デジタル技術を使用し、シリコン・チップ上に実装されていることを特徴とするデバイス。
  51. 請求項9または20のいずれかに記載のデバイスであって、前記第2のデバイスはモバイル・デバイスの一部であることを特徴とするデバイス。
  52. 請求項9または20のいずれかに記載のデバイスであって、前記第2のデバイスは、入力画像を表すデータを受け取るための入力手段を更に備え、
    当該入力画像には第1の入力信号が含まれていることを特徴とするデバイス。
  53. 請求項9または20のいずれかに記載のデバイスであって、前記第2のデバイスは、最近傍探索のために構成されたものであることを特徴とするデバイス。
JP2012516227A 2009-06-19 2010-06-16 コンパクトな演算処理要素を用いたプロセッシング Pending JP2012530966A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US21869109P 2009-06-19 2009-06-19
US61/218,691 2009-06-19
US12/816,201 2010-06-15
US12/816,201 US8150902B2 (en) 2009-06-19 2010-06-15 Processing with compact arithmetic processing element
PCT/US2010/038769 WO2010148054A2 (en) 2009-06-19 2010-06-16 Processing with compact arithmetic processing element

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2014077372A Division JP6184897B2 (ja) 2009-06-19 2014-04-03 コンパクトな演算処理要素を用いたプロセッシング

Publications (2)

Publication Number Publication Date
JP2012530966A JP2012530966A (ja) 2012-12-06
JP2012530966A5 true JP2012530966A5 (ja) 2014-06-19

Family

ID=43355205

Family Applications (7)

Application Number Title Priority Date Filing Date
JP2012516227A Pending JP2012530966A (ja) 2009-06-19 2010-06-16 コンパクトな演算処理要素を用いたプロセッシング
JP2014077372A Active JP6184897B2 (ja) 2009-06-19 2014-04-03 コンパクトな演算処理要素を用いたプロセッシング
JP2017144389A Active JP6371451B2 (ja) 2009-06-19 2017-07-26 コンパクトな演算処理要素を用いたプロセッシング
JP2018132055A Active JP6599522B2 (ja) 2009-06-19 2018-07-12 コンパクトな演算処理要素を用いたプロセッシング
JP2019182315A Active JP6796177B2 (ja) 2009-06-19 2019-10-02 コンパクトな演算処理要素を用いたプロセッシング
JP2020189077A Active JP7273018B2 (ja) 2009-06-19 2020-11-13 コンパクトな演算処理要素を用いたプロセッシング
JP2022200644A Active JP7565998B2 (ja) 2009-06-19 2022-12-15 コンパクトな演算処理要素を用いたプロセッシング

Family Applications After (6)

Application Number Title Priority Date Filing Date
JP2014077372A Active JP6184897B2 (ja) 2009-06-19 2014-04-03 コンパクトな演算処理要素を用いたプロセッシング
JP2017144389A Active JP6371451B2 (ja) 2009-06-19 2017-07-26 コンパクトな演算処理要素を用いたプロセッシング
JP2018132055A Active JP6599522B2 (ja) 2009-06-19 2018-07-12 コンパクトな演算処理要素を用いたプロセッシング
JP2019182315A Active JP6796177B2 (ja) 2009-06-19 2019-10-02 コンパクトな演算処理要素を用いたプロセッシング
JP2020189077A Active JP7273018B2 (ja) 2009-06-19 2020-11-13 コンパクトな演算処理要素を用いたプロセッシング
JP2022200644A Active JP7565998B2 (ja) 2009-06-19 2022-12-15 コンパクトな演算処理要素を用いたプロセッシング

Country Status (8)

Country Link
US (17) US8150902B2 (ja)
EP (2) EP2443551A4 (ja)
JP (7) JP2012530966A (ja)
KR (1) KR101235997B1 (ja)
CN (2) CN105760135B (ja)
BR (1) BRPI1011808A2 (ja)
CA (1) CA2768731C (ja)
WO (1) WO2010148054A2 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8150902B2 (en) 2009-06-19 2012-04-03 Singular Computing Llc Processing with compact arithmetic processing element
WO2012052774A2 (en) * 2010-10-21 2012-04-26 Bluwireless Technology Limited Data processing units
US8971599B2 (en) * 2010-12-20 2015-03-03 General Electric Company Tomographic iterative reconstruction
CN102651121B (zh) * 2011-02-23 2014-04-02 中国科学院声学研究所 一种基于fpga的3*3均值滤波算法的实现方法
US9553590B1 (en) * 2012-10-29 2017-01-24 Altera Corporation Configuring programmable integrated circuit device resources as processing elements
US9936579B2 (en) * 2013-02-01 2018-04-03 Apple Inc. Low profile packaging and assembly of a power conversion system in modular form
CN103647708A (zh) * 2013-11-29 2014-03-19 曙光信息产业(北京)有限公司 基于atca的数据报文处理板
JP6381215B2 (ja) * 2014-01-29 2018-08-29 キヤノン株式会社 画像処理装置、画像処理方法、表示装置、表示装置の制御方法、及び、プログラム
US10042813B2 (en) 2014-12-15 2018-08-07 Intel Corporation SIMD K-nearest-neighbors implementation
CN105843586B (zh) * 2016-04-02 2020-06-30 严发宝 一种高速数据采集实时加除计算实现方法
CN106126191B (zh) * 2016-06-06 2018-07-31 大连大学 基于映射模块的16位加减法器的方法
US10007487B1 (en) 2016-06-30 2018-06-26 Altera Corporation Double-precision floating-point operation
CN106155814B (zh) * 2016-07-04 2019-04-05 合肥工业大学 一种支持多种工作模式的可重构运算单元及其工作方式
CN107066706B (zh) * 2017-03-27 2019-07-30 中国科学院计算技术研究所 Gpu ffma指令在双发射模式下的通量测试方法
WO2018182742A1 (en) * 2017-03-31 2018-10-04 Intel Corporation Computation unit composed of stacked resistive elements
US10726514B2 (en) * 2017-04-28 2020-07-28 Intel Corporation Compute optimizations for low precision machine learning operations
EP3625670B1 (en) 2017-05-17 2022-02-23 Google LLC Performing matrix multiplication in hardware
US20180357287A1 (en) * 2017-06-10 2018-12-13 ScaleFlux, Inc. Hybrid software-hardware implementation of edit distance search
US10289413B2 (en) * 2017-10-02 2019-05-14 Advanced Micro Devices, Inc. Hybrid analog-digital floating point number representation and arithmetic
US11216250B2 (en) * 2017-12-06 2022-01-04 Advanced Micro Devices, Inc. Dynamic, variable bit-width numerical precision on field-programmable gate arrays for machine learning tasks
CN108089958B (zh) * 2017-12-29 2021-06-08 珠海市君天电子科技有限公司 Gpu测试方法、终端设备和计算机可读存储介质
DE102018209901A1 (de) * 2018-06-19 2019-12-19 Robert Bosch Gmbh Recheneinheit, Verfahren und Computerprogramm zum Multiplizieren zumindest zweier Multiplikanden
CN110865882B (zh) * 2018-08-28 2022-07-08 清华大学 数据处理方法、装置、计算机设备和存储介质
CN109840067B (zh) * 2019-01-14 2021-04-20 中国人民解放军国防科技大学 一种基于数学近似的浮点程序精度缺陷修复方法
US11106430B1 (en) * 2019-05-16 2021-08-31 Facebook, Inc. Circuit and method for calculating non-linear functions of floating-point numbers
CN112732220A (zh) * 2019-10-14 2021-04-30 安徽寒武纪信息科技有限公司 用于浮点运算的乘法器、方法、集成电路芯片和计算装置
US11514594B2 (en) 2019-10-30 2022-11-29 Vergence Automation, Inc. Composite imaging systems using a focal plane array with in-pixel analog storage elements
CN111104091B (zh) * 2019-12-12 2021-11-26 北京科技大学 一种动态浮点误差分析中精度特定计算的检测和转换方法
CN111126587B (zh) * 2019-12-30 2021-02-02 上海安路信息科技有限公司 交并比电路
US11709225B2 (en) * 2020-06-19 2023-07-25 Nxp B.V. Compression of data employing variable mantissa size
US11188304B1 (en) * 2020-07-01 2021-11-30 International Business Machines Corporation Validating microprocessor performance

Family Cites Families (102)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5346577B2 (ja) 1974-03-25 1978-12-14
US4380046A (en) 1979-05-21 1983-04-12 Nasa Massively parallel processor computer
JPS5630322A (en) * 1979-08-21 1981-03-26 Toshiba Corp D/a converter
US4493048A (en) 1982-02-26 1985-01-08 Carnegie-Mellon University Systolic array apparatuses for matrix computations
JPS5952380A (ja) * 1982-09-17 1984-03-26 Victor Co Of Japan Ltd 補間装置
US4583222A (en) 1983-11-07 1986-04-15 Digital Equipment Corporation Method and apparatus for self-testing of floating point accelerator processors
US5170484A (en) 1986-09-18 1992-12-08 Digital Equipment Corporation Massively parallel array processing system
US4985832A (en) 1986-09-18 1991-01-15 Digital Equipment Corporation SIMD array processing system with routing networks having plurality of switching stages to transfer messages among processors
FR2604270B1 (fr) * 1986-09-22 1991-10-18 Jutand Francis Additionneur binaire comportant un operande fixe, et multiplieur binaire parallele-serie comprenant un tel additionneur
US4933895A (en) 1987-07-10 1990-06-12 Hughes Aircraft Company Cellular array having data dependent processing capabilities
JPH01183732A (ja) 1988-01-18 1989-07-21 Daikin Ind Ltd 浮動小数点数から整数への変換装置および変換方法
US5153848A (en) 1988-06-17 1992-10-06 Bipolar Integrated Technology, Inc. Floating point processor with internal free-running clock
WO1990005335A1 (en) 1988-11-04 1990-05-17 Hitachi, Ltd. Apparatus for multiplication, division and extraction of square root
JP2765882B2 (ja) * 1988-11-14 1998-06-18 株式会社日立製作所 並列計算機,ベクトルレジスタ間データフロー同期装置およびネットワークプリセット装置
US5293500A (en) 1989-02-10 1994-03-08 Mitsubishi Denki K.K. Parallel processing method and apparatus
US5226166A (en) 1989-02-10 1993-07-06 Mitsubishi Denki K.K. Parallel operation processor with second command unit
JPH0314128A (ja) 1989-06-13 1991-01-22 Tomio Kurokawa 対数表現数値利用の演算装置
DE4002501A1 (de) * 1990-01-29 1991-08-01 Thomson Brandt Gmbh Verfahren zur umwandlung von digitalen signalen in analoge signale
JP2605916B2 (ja) 1990-03-19 1997-04-30 ヤマハ株式会社 波形信号発生装置
EP0463966B1 (en) 1990-06-29 1998-11-25 Digital Equipment Corporation High-performance multi-processor having floating point unit and operation method
JP2597736B2 (ja) * 1990-07-17 1997-04-09 株式会社東芝 高速乗算器
US5966528A (en) 1990-11-13 1999-10-12 International Business Machines Corporation SIMD/MIMD array processor with vector processing
AU2939892A (en) 1991-12-06 1993-06-28 Richard S. Norman Massively-parallel direct output processor array
JP2647327B2 (ja) 1992-04-06 1997-08-27 インターナショナル・ビジネス・マシーンズ・コーポレイション 大規模並列コンピューティング・システム装置
US5790834A (en) 1992-08-31 1998-08-04 Intel Corporation Apparatus and method using an ID instruction to identify a computer microprocessor
EP0632369A1 (en) 1993-06-29 1995-01-04 Stichting voor de Technische Wetenschappen CORDIC algorithms and architectures
US5623616A (en) 1993-07-22 1997-04-22 Hewlett-Packard Company Floating point operaton throughput control
DE69429061T2 (de) 1993-10-29 2002-07-18 Advanced Micro Devices, Inc. Superskalarmikroprozessoren
US5375084A (en) 1993-11-08 1994-12-20 International Business Machines Corporation Selectable interface between memory controller and memory simms
US5442577A (en) 1994-03-08 1995-08-15 Exponential Technology, Inc. Sign-extension of immediate constants in an alu
JPH0877282A (ja) 1994-09-09 1996-03-22 Radic:Kk アナログ演算回路
US5631859A (en) * 1994-10-27 1997-05-20 Hewlett-Packard Company Floating point arithmetic unit having logic for quad precision arithmetic
US5581485A (en) 1994-12-08 1996-12-03 Omni Microelectronics, Inc. Analog vector distance measuring and vector quantization architecture
US5689677A (en) 1995-06-05 1997-11-18 Macmillan; David C. Circuit for enhancing performance of a computer for personal use
JP3405864B2 (ja) 1995-09-12 2003-05-12 富士通株式会社 演算装置、相関演算装置、動画像圧縮装置、ずれ検出方法およびずれ検出装置
US5943242A (en) 1995-11-17 1999-08-24 Pact Gmbh Dynamically reconfigurable data processing system
US5666071A (en) 1995-12-01 1997-09-09 Advanced Micro Devices, Inc. Device and method for programming high impedance states upon select input/output pads
JP2806346B2 (ja) * 1996-01-22 1998-09-30 日本電気株式会社 演算処理装置
US6311282B1 (en) 1996-02-27 2001-10-30 Fujitsu Personal Systems, Inc. Method and apparatus for computing device with status display
US5892962A (en) * 1996-11-12 1999-04-06 Lucent Technologies Inc. FPGA-based processor
DE19651075A1 (de) 1996-12-09 1998-06-10 Pact Inf Tech Gmbh Einheit zur Verarbeitung von numerischen und logischen Operationen, zum Einsatz in Prozessoren (CPU's), Mehrrechnersystemen, Datenflußprozessoren (DFP's), digitalen Signal Prozessoren (DSP's) oder dergleichen
US5887160A (en) 1996-12-10 1999-03-23 Fujitsu Limited Method and apparatus for communicating integer and floating point data over a shared data path in a single instruction pipeline processor
US6065209A (en) 1997-05-23 2000-05-23 S-Cal Research Corp. Method of fabrication, tooling and installation of downhole sealed casing connectors for drilling and completion of multi-lateral wells
US6023753A (en) 1997-06-30 2000-02-08 Billion Of Operations Per Second, Inc. Manifold array processor
US5867693A (en) 1997-07-03 1999-02-02 Modern Video Technology, Inc. Extended resolution phase measurement
JPH11212763A (ja) * 1998-01-30 1999-08-06 Denso Corp 電子制御装置
DE69935361T2 (de) 1998-02-17 2007-11-29 Anadec Gmbh Verfahren und elektronische Schaltung zur Datenverarbeitung, insbesondere für die Berechnung von Wahrscheinlichkeitsverteilungen
US6173388B1 (en) 1998-04-09 2001-01-09 Teranex Inc. Directly accessing local memories of array processors for improved real-time corner turning processing
US6065029A (en) 1998-05-26 2000-05-16 N*Able Technologies, Inc. Method and system for providing a random number generator
US6650327B1 (en) 1998-06-16 2003-11-18 Silicon Graphics, Inc. Display system having floating point rasterization and floating point framebuffering
US6226737B1 (en) * 1998-07-15 2001-05-01 Ip-First, L.L.C. Apparatus and method for single precision multiplication
AU763178B2 (en) * 1998-09-10 2003-07-17 Ecchandes Inc. Visual device
JP2969115B1 (ja) * 1998-11-25 1999-11-02 株式会社日立製作所 半導体装置
US6622135B1 (en) 1998-12-29 2003-09-16 International Business Machines Corporation Method for detecting and classifying anomalies using artificial neural networks
US7242414B1 (en) * 1999-07-30 2007-07-10 Mips Technologies, Inc. Processor having a compare extension of an instruction set architecture
JP2000293494A (ja) 1999-04-09 2000-10-20 Fuji Xerox Co Ltd 並列計算装置および並列計算方法
JP2001043385A (ja) * 1999-05-25 2001-02-16 Ecchandesu:Kk 多帯域動画像中の移動物体のエッジ情報生成装置及び多帯域動画像中の移動物体のエッジ情報生成方法
US7346643B1 (en) 1999-07-30 2008-03-18 Mips Technologies, Inc. Processor with improved accuracy for multiply-add operations
US6675292B2 (en) 1999-08-13 2004-01-06 Sun Microsystems, Inc. Exception handling for SIMD floating point-instructions using a floating point status register to report exceptions
JP2001184335A (ja) 1999-12-24 2001-07-06 Kanazawa Inst Of Technology プログラマブル・ディジタル演算icとそのプログラマブル・ディジタル演算icを用いた装置ならびにそのプログラマブル・ディジタル演算icの製造方法
US6647507B1 (en) 1999-12-31 2003-11-11 Intel Corporation Method for improving a timing margin in an integrated circuit by setting a relative phase of receive/transmit and distributed clock signals
GB2370381B (en) 2000-12-19 2003-12-24 Picochip Designs Ltd Processor architecture
FI113714B (fi) 2000-12-28 2004-05-31 Ari Paasio Prosessori, piiri ja menetelmä kuvien käsittelemiseksi rinnakkaisprosessoriverkossa
JP3949915B2 (ja) * 2001-07-05 2007-07-25 日本電信電話株式会社 空間変換に基づく楕円体問合せ方法および装置と空間変換に基づく楕円体問合せプログラムおよび該プログラムを記録した記録媒体
US6941334B2 (en) 2002-02-01 2005-09-06 Broadcom Corporation Higher precision divide and square root approximations
US7234169B2 (en) 2002-04-29 2007-06-19 The Boeing Company Method and apparatus for integrating and monitoring key digital cinema system components as a means to verify system integrity
US6920574B2 (en) 2002-04-29 2005-07-19 Apple Computer, Inc. Conserving power by reducing voltage supplied to an instruction-processing portion of a processor
US6600222B1 (en) 2002-07-17 2003-07-29 Intel Corporation Stacked microelectronic packages
CN1265281C (zh) * 2002-07-29 2006-07-19 矽统科技股份有限公司 浮点数的对数运算方法和装置
US7133772B2 (en) 2002-07-30 2006-11-07 Global Locate, Inc. Method and apparatus for navigation using instantaneous Doppler measurements from satellites
US7194615B2 (en) * 2002-09-17 2007-03-20 Nokia Corporation Reconfigurable apparatus being configurable to operate in a logarithmic scale
US7209867B2 (en) 2002-10-15 2007-04-24 Massachusetts Institute Of Technology Analog continuous time statistical processing
US7243333B2 (en) 2002-10-24 2007-07-10 International Business Machines Corporation Method and apparatus for creating and executing integrated executables in a heterogeneous architecture
JP4184921B2 (ja) * 2002-11-06 2008-11-19 松下電器産業株式会社 確率型演算素子
US20070124565A1 (en) 2003-06-18 2007-05-31 Ambric, Inc. Reconfigurable processing array having hierarchical communication network
US7669035B2 (en) 2004-01-21 2010-02-23 The Charles Stark Draper Laboratory, Inc. Systems and methods for reconfigurable computing
JP3845636B2 (ja) 2004-01-21 2006-11-15 株式会社東芝 関数近似値の演算器
US7779177B2 (en) 2004-08-09 2010-08-17 Arches Computing Systems Multi-processor reconfigurable computing system
US7225323B2 (en) * 2004-11-10 2007-05-29 Nvidia Corporation Multi-purpose floating point and integer multiply-add functional unit with multiplication-comparison test addition and exponent pipelines
US7446773B1 (en) * 2004-12-14 2008-11-04 Nvidia Corporation Apparatus, system, and method for integrated heterogeneous processors with integrated scheduler
JP4547668B2 (ja) * 2004-12-24 2010-09-22 カシオ計算機株式会社 動き補償予測符号化装置及び動き補償予測符号化方法
US20070247189A1 (en) 2005-01-25 2007-10-25 Mathstar Field programmable semiconductor object array integrated circuit
US7921425B2 (en) 2005-03-14 2011-04-05 Cisco Technology, Inc. Techniques for allocating computing resources to applications in an embedded system
EP1724823A3 (fr) 2005-05-11 2009-09-09 Stmicroelectronics Sa Procédé de connexion d'une microplaquette de semi-conducteur sur un support d'interconnexion
JP2006350907A (ja) * 2005-06-20 2006-12-28 Ricoh Co Ltd Simd型マイクロプロセッサ、データ転送装置、及びデータ変換装置
US7863778B2 (en) 2005-07-25 2011-01-04 Arm Limited Power controlling integrated circuit cell
US7856618B2 (en) 2005-08-04 2010-12-21 International Business Machines Corporation Adaptively generating code for a computer program
US7512282B2 (en) 2005-08-31 2009-03-31 International Business Machines Corporation Methods and apparatus for incremental approximate nearest neighbor searching
US7301436B1 (en) 2005-11-14 2007-11-27 National Semiconductor Corporation Apparatus and method for precision trimming of integrated circuits using anti-fuse bond pads
US8595279B2 (en) 2006-02-27 2013-11-26 Qualcomm Incorporated Floating-point processor with reduced power requirements for selectable subprecision
JP4413198B2 (ja) * 2006-03-23 2010-02-10 富士通株式会社 浮動小数点データの総和演算処理方法及びコンピュータシステム
US7912887B2 (en) 2006-05-10 2011-03-22 Qualcomm Incorporated Mode-based multiply-add recoding for denormal operands
US20080059764A1 (en) 2006-09-01 2008-03-06 Gheorghe Stefan Integral parallel machine
JP4461135B2 (ja) 2006-12-25 2010-05-12 富士通株式会社 演算回路及び演算方法並びに情報処理装置
US8421794B2 (en) * 2007-03-23 2013-04-16 Qualcomm Incorporated Processor with adaptive multi-shader
US8463835B1 (en) 2007-09-13 2013-06-11 Xilinx, Inc. Circuit for and method of providing a floating-point adder
US8258410B2 (en) 2008-01-26 2012-09-04 International Business Machines Corporation Construction of reliable stacked via in electronic substrates—vertical stiffness control method
CN101334766B (zh) * 2008-06-30 2011-05-11 东软飞利浦医疗设备系统有限责任公司 一种并行微处理器及其实现方法
US20100114871A1 (en) * 2008-10-31 2010-05-06 University Of Southern California Distance Quantization in Computing Distance in High Dimensional Space
US7746104B1 (en) 2009-04-02 2010-06-29 Xilinx, Inc. Dynamically controlled output multiplexer circuits in a programmable integrated circuit
US7746108B1 (en) * 2009-04-02 2010-06-29 Xilinx, Inc. Compute-centric architecture for integrated circuits
US8150902B2 (en) 2009-06-19 2012-04-03 Singular Computing Llc Processing with compact arithmetic processing element

Similar Documents

Publication Publication Date Title
JP2012530966A5 (ja)
US11847452B2 (en) Systems, methods, and apparatus for tile configuration
EP3144805B1 (en) Method and processing apparatus for performing arithmetic operation
US20160026912A1 (en) Weight-shifting mechanism for convolutional neural networks
US20160140084A1 (en) Efficient sparse matrix-vector multiplication on parallel processors
GB2456775B (en) Apparatus and method for performing permutation operations on data
JP2017138964A5 (ja)
KR101843243B1 (ko) 제로값을 피연산자로 갖는 연산자에 대한 연산을 스킵하는 연산 방법 및 연산 장치
CN108845828B (zh) 一种协处理器、矩阵运算加速方法及系统
US10693466B2 (en) Self-adaptive chip and configuration method
JP2017515228A5 (ja)
CN108053361B (zh) 多互连视觉处理器及采用其的图像处理方法
US10466967B2 (en) System and method for piecewise linear approximation
Patle et al. Implementation of Baugh-Wooley Multiplier Based on Soft-Core Processor
JP2015185076A5 (ja)
EP3035188B1 (en) Fixed-point multiplication by one
JP2005141533A5 (ja)