JP7371255B2 - 乗算器及びオペレータ回路 - Google Patents

乗算器及びオペレータ回路 Download PDF

Info

Publication number
JP7371255B2
JP7371255B2 JP2022529732A JP2022529732A JP7371255B2 JP 7371255 B2 JP7371255 B2 JP 7371255B2 JP 2022529732 A JP2022529732 A JP 2022529732A JP 2022529732 A JP2022529732 A JP 2022529732A JP 7371255 B2 JP7371255 B2 JP 7371255B2
Authority
JP
Japan
Prior art keywords
inverting
transistor
bit
bits
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022529732A
Other languages
English (en)
Other versions
JP2023503119A (ja
Inventor
ファン,トワンバオ
ジアーン,ユエシーン
シー,シヤオシャン
ワーン,ゥローンジュイン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2023503119A publication Critical patent/JP2023503119A/ja
Application granted granted Critical
Publication of JP7371255B2 publication Critical patent/JP7371255B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3066Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction by means of a mask or a bit-map
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/52Multiplying; Dividing
    • G06F7/523Multiplying only
    • G06F7/533Reduction of the number of iteration steps or stages, e.g. using the Booth algorithm, log-sum, odd-even
    • G06F7/5334Reduction of the number of iteration steps or stages, e.g. using the Booth algorithm, log-sum, odd-even by using multiple bit scanning, i.e. by decoding groups of successive multiplier bits in order to select an appropriate precalculated multiple of the multiplicand as a partial product
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/52Multiplying; Dividing
    • G06F7/523Multiplying only
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/30Circuit design
    • G06F30/31Design entry, e.g. editors specifically adapted for circuit design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/30Circuit design
    • G06F30/32Circuit design at the digital level
    • G06F30/327Logic synthesis; Behaviour synthesis, e.g. mapping logic, HDL to netlist, high-level language to RTL or netlist
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/50Adding; Subtracting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/50Adding; Subtracting
    • G06F7/501Half or full adders, i.e. basic adder cells for one denomination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/544Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
    • G06F7/5443Sum of products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30007Arrangements for executing specific machine instructions to perform operations on data operands
    • G06F9/3001Arithmetic instructions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/60General implementation details not specific to a particular type of compression
    • H03M7/6011Encoder aspects

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Geometry (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Neurology (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)

Description

本願は、電子技術の分野に関連し、特に、乗算器及びオペレータ(operator:演算子、演算処理)回路に関連する。
人工知能(AI)技術の継続的な開発及び成熟に伴い、AI技術は、サーバ及び端末等の通信装置において徐々に普及している。AI技術は、通信装置内の中央処理装置(CPU)、ニューラルネットワーク処理装置(NPU)、グラフィックス処理装置(GPU)、又はデジタル信号プロセッサ(DSP)等のプロセッサの計算能力に対して高い要件を与える。プロセッサのコアコンピューティングユニットとして、乗算器は、益々重要な役割を果たす。
既存の乗算器のアーキテクチャは、標準的なエンコーダ及び標準的な加算器に基づいて設計される。図1に示されるように、特定の設計実施態様は、3つのステップ:(1)Radix(基数)-4ブースのアルゴリズムを使用して、Radix-4ブースエンコーダで第1の値及び第2の値を符号化して、部分積を取得する;(2)ウォレス(Wallace)ツリーを使用して部分積を圧縮する;(3)圧縮によって得られた2つの部分積を合計して、乗算演算の結果を取得する;に要約され得る。図1は、第1の値と第2の値との両方が16ビットの2進数であり、乗算演算の結果が32ビットの2進数である例を示しており、ここで、a[15:0]は第1の値を示し、b[15:0]は第2の値を示し、y[31:0]は乗算演算の結果を示す。しかしながら、Radix-4ブースアルゴリズム及びウォレスツリーに基づいて実装された前述の乗算器では、多くの標準的なエンコーダ及び標準的な加算器が使用される。標準的なエンコーダ及び標準的な加算器には、金属酸化物半導体(MOS)トランジスタが大数あり、トランジスタの面積が大きい。その結果、乗算器の面積が大きくなる。つまり、既存の乗算器の設計実施多様は複雑である。従って、実装がより容易な乗算器を設計することが期待される。
本願は、乗算器の実装の難しさを軽減するための、乗算器及びオペレータ回路を提供する。前述の目的を達成するために、本願では次の技術的解決策が使用される。
第1の態様によれば、乗算器が提供され、この乗算器は、Mビットの第1の値とNビットの第2の値との乗算を行うように構成され、ここで、M及びNは1より大きい整数である。乗算器には、P個のエンコーダグループ及びW個のレイヤの反転コンプレッサが含まれる。P個のエンコーダグループの各グループにはN個のエンコーダが含まれ、Wは正の整数であり、Pは1より大きい整数である。各エンコーダグループは非反転符号化演算子又は反転符号化演算子を使用して、各エンコーダグループに対応するグループ選択信号及びシンボル制御入力信号と、第2の値のビットの一部とを符号化して、1つの部分積を取得するように構成される。グループ選択信号及びシンボル制御入力信号は、第1の値のビットの一部に基づいて生成され、P個のエンコーダグループは符号化を行ってP個の部分積を取得する。W個のレイヤの反転コンプレッサは、反転圧縮演算子を使用してP個の部分積を圧縮して、2つの累積値を取得するように構成され、ここで、2つの累積値の合計は、第1の値と第2の値との積である。前述の技術的解決策では、P個のエンコーダグループは、非反転符号化演算子又は反転符号化演算子を使用して符号化を行い、W個のレイヤの反転コンプレッサは、反転圧縮演算子を使用して圧縮を行う。この実施態様の解決策は簡素である。例えば、この解決策には、面積が小さく、消費電力が少ないという利点があるため、乗算器の面積が小さく、消費電力が少なくなる。
第1の態様の可能な実施態様において、N個のエンコーダの各エンコーダは、第2の値の第1ビット及び第2ビットに対応し、グループ選択信号は、第1信号及び第2信号を含む。各エンコーダは、非反転符号化演算子又は反転符号化演算子を使用して、第1ビット、第2ビット、グループ選択信号、及びシンボル制御入力信号を符号化して、1つの部分積で1つの出力ビットを取得するように特に構成される。第1ビット及び第2ビットは、第2の値における隣接する2つのビット、又は第2の値における同じビットであり得る。前述の可能な実施態様において、エンコーダの符号化方法が提供され、符号化方法の実施態様の解決策は簡素である。例えば、エンコーダの面積を減らすことができる。
第1の態様の可能な実施態様において、エンコーダが非反転符号化演算子を使用する場合に、エンコーダは、非反転エンコーダであり、且つ以下の符号化演算を行うように特に構成され、その符号化演算には、第1信号と第1ビットとの両方が1であるか、又は第2信号と第2ビットとの両方が1である場合に、エンコーダが取得する出力ビットは、シンボル制御入力信号の反転であること;又は、第1信号及び第1ビットの少なくとも一方が0であり、且つ第2信号及び第2ビットの少なくとも一方が0である場合に、エンコーダが取得する出力ビットは、シンボル制御入力信号であること;が含まれる。前述の可能な実施態様において、非反転エンコーダが提供され、非反転エンコーダの実施態様の解決策は、簡素であり、例えば、面積が小さく、消費電力が少ない。
第1の態様の可能な実施態様において、エンコーダが反転符号化演算子を使用する場合に、エンコーダは、反転エンコーダであり、且つ以下の符号化演算を行うように特に構成され、その符号化演算には、第1信号と第1ビットとの両方が1である場合、又は、第2信号と第2ビットとの両方が1である場合に、エンコーダが取得する出力ビットは、シンボル制御入力信号であること;又は、第1信号及び第1ビットの少なくとも一方が0であり、且つ第2信号及び第2ビットの少なくとも一方が0である場合に、エンコーダが取得する出力ビットは、シンボル制御入力信号の反転であること;が含まれる。前述の可能な実施態様において、反転エンコーダが提供され、反転エンコーダの実施態様の解決策は、簡素であり、例えば、面積が小さく、消費電力が少ない。
第1の態様の可能な実施態様において、Wは1であり、W個のレイヤの反転コンプレッサは、第1レイヤの反転コンプレッサを含む。第1レイヤの反転コンプレッサは、反転圧縮演算子を低い桁の重みから高い桁の重みまで順序に使用して、各桁の重みに対応する残りのビット数が3未満になるまで、P個の部分積のマトリックス内の各桁の重みを圧縮して、第1の圧縮マトリックスを取得するように構成される。第1の圧縮マトリックスには2つの行が含まれ、各行は1つの累積値に対応する。各桁の重みに対する圧縮は、3ビット毎に桁の重みに対して実行される。そして、P個の部分積のマトリックスでは、各行には1つの部分積が含まれ、各列には、P個の部分積の同じ桁の重み(same digit bit)に対応する複数のビットが含まれる。前述の可能な実施態様において、提供する反転コンプレッサは、高い圧縮効率を有する。
第1の態様の可能な実施態様において、Wは1より大きい整数であり、W個のレイヤの反転コンプレッサには、第1レイヤの反転コンプレッサ~W番目のレイヤの反転コンプレッサまでが含まれる。第1レイヤの反転コンプレッサは、反転圧縮演算子を低い桁の重みから高い桁の重みまで順序に使用して、各桁の重みに対応する残りのビット数が3未満になるまで、P個の部分積のマトリックス内の各桁の重みを圧縮して、第1の圧縮マトリックスを取得するように構成される。i番目のレイヤの反転コンプレッサは、反転圧縮演算子を低い桁の重みから高い桁の重みまで順番に使用して、各桁の重みに対応する残りのビット数が3未満になるまで、(i-1)番目の圧縮マトリックス内の各桁の重みを圧縮して、i番目の圧縮マトリックスを取得するように構成され、ここで、iの値の範囲が2~Wである。W番目の圧縮マトリックスには2つの行が含まれ、各行は1つの累積値に対応する。各レイヤの反転コンプレッサによる各桁の重みに対する圧縮は、桁の重みの3ビットに対して実行される。P個の部分積のマトリックスでは、各行には1つの部分積が含まれ、各列には、P個の部分積の同じ桁の重みに対応する複数のビットが含まれる。前述の可能な実施態様において、提供するW個のレイヤの反転コンプレッサは、高い圧縮効率を有する。
第1の態様の可能な実施態様において、各桁の重みの3ビット毎に、各反転コンプレッサは、以下の圧縮を行うように特に構成され、その圧縮には、3ビットが全て0である場合に、出力キャリービットは1であり、現在の出力合計ビットは1であること;又は、3ビットが全て1である場合に、出力キャリービットは0であり、現在の出力合計ビットは0であること;又は、3ビットのうちの1ビットが1であり、他の2ビットが0である場合に、出力キャリービットは1であり、現在の出力合計ビットは0であること;又は、3ビットのうちの2ビットが1であり、他のビットが0である場合に、出力キャリービットは0であり、現在の出力合計ビットは1であること;が含まれる。前述の可能な実施態様は、反転コンプレッサの簡素で効果的な圧縮方法を提供する。
第1の態様の可能な実施態様において、エンコーダによって使用される同じ桁の重みに対応する符号化演算子の位相(phase)は、反転コンプレッサによって出力される現在の出力合計ビット又は出力キャリービットの位相に関連する。同じ桁の重みに対応するエンコーダは、同じ桁の重みに対応する出力ビットを取得するために符号化を行うエンコーダであり、同じ桁の重みに対応する反転コンプレッサは、同じ桁の重みの3ビットを圧縮する反転コンプレッサである。前述の可能な実施態様は、エンコーダによって使用される符号化演算子の位相を決定するための高速で効果的な方法を提供する。
第1の態様の可能な実施態様において、乗算器は、1つ又は複数のインバータをさらに含み、このインバータは、W個のレイヤの反転コンプレッサ内の1つ又は複数の反転コンプレッサによって出力される現在の出力合計ビット及び出力キャリービットの位相を反転するか、或いは1つ又は複数の反転コンプレッサに入力された3ビットのうちの少なくとも1ビットの位相を反転するように構成される。前述の可能な実施態様は、圧縮結果の精度を保証し、W個のレイヤの反転コンプレッサの圧縮効率を向上させることができる。
第1の態様の可能な実施態様において、乗算器は、プリコーダをさらに含み、このプリコーダは、第1の値を受け取り、第1の値のビットの一部に基づいてグループ選択信号及びシンボル制御入力信号を生成するように構成される。
第1の態様の可能な実施態様において、乗算器は、加算器をさらに含み、この加算器は、2つの累積値を受け取り、2つの累積値を合計(sum up)して積(product)を得るように構成される。
第2の態様によれば、オペレータ回路が提供され、このオペレータ回路には、第1トランジスタ、第2トランジスタ、第3トランジスタ、第4トランジスタ、第5トランジスタ、第6トランジスタ、第7トランジスタ、第8トランジスタ、第9トランジスタ、第10トランジスタ、第11トランジスタ、第12トランジスタ、第13トランジスタ、第14トランジスタ、及び第15トランジスタが含まれる。第1トランジスタ及び第2トランジスタは、電源端子と第1ノードとの間で並列に結合され、第3トランジスタ及び第4トランジスタは、第1ノードと第2ノードとの間で並列に結合され、第5トランジスタ及び第7トランジスタは、第2ノードと接地端子との間に直列に結合され、そして第6トランジスタ及び第8トランジスタは、第2ノードと接地端子との間に直列に結合される。第3トランジスタ及び第5トランジスタの制御端子は、第1入力を受け取るように構成され、第1トランジスタ及び第6トランジスタの制御端子は、第2入力を受け取るように構成され、第4トランジスタ及び第7トランジスタの制御端子は、第3入力を受け取るように構成され、そして第2トランジスタ及び第8トランジスタの制御端子は、第4入力を受け取るように構成される。第9トランジスタは、第5入力の反転と出力端子との間に結合され、第9トランジスタの制御端子は、第2ノードに結合される。第10トランジスタは、第2ノードと出力端子との間に結合され、第10トランジスタの制御端子は、第5入力の反転に結合される。第11トランジスタ及び第13トランジスタは、出力端子と接地端子の間に直列に結合される。第11トランジスタの制御端子は、第2ノードに結合される。第13トランジスタの制御端子は、第5入力の反転を受け取るように構成される。第12トランジスタは、出力端子と第2ノードとの間に結合され、第12トランジスタの制御端子は、第5入力を受け取るように構成される。第14トランジスタ及び第15トランジスタは、電源端子と接地端子との間に直列に結合され、第14トランジスタと第15トランジスタとの間の直列結合ノードは、第5入力の反転に結合される。第14トランジスタ及び第15トランジスタの制御端子は、第5入力を受け取るように構成される。前述の技術的解決策では、非反転符号化オペレータ回路が提供される。非反転符号化オペレータ回路は、トランジスタの数が少なく、占有面積が小さく、実装が簡素である。従って、オペレータ回路を乗算器に適用すると、乗算器の面積を減らすことができる。
第2の態様の可能な実施態様において、第1トランジスタ、第2トランジスタ、第3トランジスタ、第4トランジスタ、第9トランジスタ、第10トランジスタ、及び第14トランジスタは、P型MOS(PMOS)トランジスタである。第5トランジスタ、第6トランジスタ、第7トランジスタ、第8トランジスタ、第11トランジスタ、第12トランジスタ、第13トランジスタ、及び第15トランジスタは、N型MOS(NMOS)トランジスタである。前述の可能な実施態様において、提供するオペレータ回路がデータを符号化するときに、トランジスタのトグルレートは小さい。従って、オペレータ回路を乗算器に適用すると、乗算器の消費電力を低減することができる。
第3の態様によれば、オペレータ回路が提供され、このオペレータ回路には、第1トランジスタ、第2トランジスタ、第3トランジスタ、第4トランジスタ、第5トランジスタ、第6トランジスタ、第7トランジスタ、第8トランジスタ、第9トランジスタ、第10トランジスタ、第11トランジスタ、第12トランジスタ、第13トランジスタ、第14トランジスタ、及び第15トランジスタが含まれる。第1トランジスタ及び第2トランジスタは、電源端子と第1ノードとの間で並列に結合され、第3トランジスタ及び第4トランジスタは、第1ノードと第2ノードとの間で並列に結合され、第5トランジスタ及び第7トランジスタは、第2ノードと接地端子との間に直列に結合され、そして第6トランジスタ及び第8トランジスタは、第2ノードと接地端子との間に直列に結合される。第3トランジスタ及び第5トランジスタの制御端子は、第1入力を受け取るように構成され、第1トランジスタ及び第6トランジスタの制御端子は、第2入力を受け取るように構成され、第4トランジスタ及び第7トランジスタの制御端子は、第3入力を受け取るように構成され、そして第2トランジスタ及び第8トランジスタの制御端子は、第4入力を受け取るように構成される。第9トランジスタ及び第10トランジスタは、電源端子と出力端子の間に直列に結合され、第9トランジスタの制御端子は第5入力の反転に結合され、第10トランジスタの制御端子は、第2ノードに結合される。第11トランジスタは第2ノードと出力端子との間に結合され、第11トランジスタの制御端子は第5入力に結合される。第12トランジスタは、出力端子と第5入力の反転との間に結合され、第12トランジスタの制御端子は、第2ノードに結合される。第13トランジスタは、出力端子と第2ノードとの間に結合され、第13トランジスタの制御端子は第5入力の反転に結合される。第14トランジスタ及び第15トランジスタは、電源端子と接地端子との間に直列に結合され、第14トランジスタと第15トランジスタとの間の直列結合ノードは、第5入力の反転に結合される。第14トランジスタ及び第15トランジスタの制御端子は、第5入力を受け取るように構成される。前述の技術的解決策では、反転符号化オペレータ回路が提供される。反転符号化オペレータ回路は、トランジスタの数が少なく、占有面積が小さく、実装が簡素である。従って、オペレータ回路を乗算器に適用すると、乗算器の面積を減らすことができる。
第3の態様の可能な実施態様において、第1トランジスタ、第2トランジスタ、第3トランジスタ、第4トランジスタ、第9トランジスタ、第10トランジスタ、第11トランジスタ、及び第14トランジスタは、PMOSトランジスタである。第5トランジスタ、第6トランジスタ、第7トランジスタ、第8トランジスタ、第12トランジスタ、第13トランジスタ、及び第15トランジスタは、NMOSトランジスタである。前述の可能な実施態様において、提供するオペレータ回路がデータを符号化するときに、トランジスタのトグルレートは小さい。従って、オペレータ回路を乗算器に適用すると、乗算器の消費電力を低減することができる。
第4の態様によれば、オペレータ回路が提供され、このオペレータ回路には、第1トランジスタ、第2トランジスタ、第3トランジスタ、第4トランジスタ、第5トランジスタ、第6トランジスタ、第7トランジスタ、第8トランジスタ、第9トランジスタ、第10トランジスタ、第11トランジスタ、第12トランジスタ、第13トランジスタ、第14トランジスタ、第15トランジスタ、第16トランジスタ、第17トランジスタ、第18トランジスタ、第19トランジスタ、第20トランジスタ、第21トランジスタ、及び第22トランジスタが含まれる。第1トランジスタ及び第2トランジスタは、電源端子と第1ノードとの間で並列に結合され、第3トランジスタは、第1ノードと第1出力端子との間に結合され、第4トランジスタは、第1出力端子と第2ノードとの間に結合される。第5トランジスタ及び第6トランジスタは、第2ノードと接地端子との間で並列に結合され、第7トランジスタは電源端子と第3ノードとの間に結合され、第8トランジスタは第3ノードと第1出力端子との間に結合され、そして第9トランジスタは第1出力端子と第4ノードとの間に結合される。第10トランジスタは第4ノードと接地端子との間に結合され、第11トランジスタ及び第12トランジスタは、第3ノードと第2出力端子との間に直列に結合され、第13トランジスタ及び第14トランジスタは、第2出力端子と第4ノードとの間に直列に結合される。第15トランジスタ、第16トランジスタ、及び第17トランジスタは、電源端子と第5ノードとの間で並列に結合され、第18トランジスタは第5ノードと第2出力端子との間に結合され、第19トランジスタは第2出力端子と第6ノードとの間に結合され、そして第20トランジスタ、第21トランジスタ、及び第22トランジスタは、第6ノードと接地端子との間で並列に結合される。第3トランジスタ、第4トランジスタ、第12トランジスタ、第13トランジスタ、第15トランジスタ、及び第20トランジスタの制御端子は、第1入力を受け取るように構成される。第1トランジスタ、第5トランジスタ、第7トランジスタ、第10トランジスタ、第16トランジスタ、及び第21トランジスタの制御端子は、第2入力を受け取るように構成される。第2トランジスタ、第6トランジスタ、第8トランジスタ、第9トランジスタ、第11トランジスタ、第14トランジスタ、第17トランジスタ、及び第22トランジスタの制御端子は、第3入力を受け取るように構成される。第18トランジスタ及び第19トランジスタの制御端子は、第1出力端子に結合される。前述の技術的解決策では、反転圧縮オペレータ回路が提供される。反転圧縮オペレータ回路は、トランジスタの数が少なく、占有面積が小さく、実装が簡素である。従って、オペレータ回路を乗算器に適用すると、乗算器の面積を減らすことができる。
第4の態様の可能な実施態様において、第1トランジスタ、第2トランジスタ、第3トランジスタ、第7トランジスタ、第8トランジスタ、第11トランジスタ、第12トランジスタ、第15トランジスタ、第16トランジスタ、第17トランジスタ、及び第18トランジスタは、PMOSトランジスタである。第4トランジスタ、第5トランジスタ、第6トランジスタ、第9トランジスタ、第10トランジスタ、第13トランジスタ、第14トランジスタ、第19トランジスタ、第20トランジスタ、第21トランジスタ、及び第22トランジスタは、NMOSトランジスタである。前述の可能な実施態様において、提供するオペレータ回路がデータを圧縮するときに、トランジスタのトグルレートは小さい。従って、オペレータ回路を乗算器に適用すると、乗算器の消費電力を低減することができる。
第5の態様によれば、乗算器又はオペレータ回路を含むプロセッサが提供される。乗算器は、第1の態様又は第1の態様の可能な実施態様のいずれか1つで提供される乗算器であり、オペレータ回路は、第2の態様~第4の態様又は第2の態様~第4の態様の可能な実施態様のいずれか1つで提供されるオペレータ回路である。オプションで、プロセッサは、ニューラルネットワーク処理装置を含む。
第6の態様によれば、乗算器又はオペレータ回路を含むチップが提供される。乗算器は、第1の態様又は第1の態様の可能な実施態様のいずれか1つで提供される乗算器であり、オペレータ回路は、第2の態様~第4の態様又は第2の態様~第4の態様の可能な実施態様のいずれか1つで提供されるオペレータ回路である。
上記で提供する任意のプロセッサ又はチップは、上記で提供する乗算器又はオペレータ回路を含むことが理解され得る。従って、プロセッサ又はチップによって達成できる有利な効果については、上記の乗算器又はオペレータ回路の有利な効果を参照されたい。詳細については、ここでは再び説明しない。
従来技術による乗算器のアーキテクチャの図である。 本願の一実施形態による通信装置の構造の概略図である。 本願の一実施形態による乗算器の構造の概略図である。 本願の一実施形態による非反転エンコーダの論理ブロック図である。 本願の一実施形態による反転エンコーダの論理ブロック図である。 本願の一実施形態によるW個のレイヤの反転コンプレッサの圧縮例の図である。 本願の一実施形態によるW個のレイヤの反転コンプレッサの圧縮例の図である。 本願の一実施形態によるW個のレイヤの反転コンプレッサの圧縮例の図である。 本願の一実施形態によるW個のレイヤの反転コンプレッサの圧縮例の図である。 本願の一実施形態による反転コンプレッサの論理ブロック図である。 本願の一実施形態によるプリコーダ及びエンコーダの例示的な図である。 本願の一実施形態によるプリコーダ及びエンコーダの例示的な図である。 本願の一実施形態によるプリコーダ及びエンコーダの例示的な図である。 本願の一実施形態によるプリコーダ及びエンコーダの例示的な図である。 本願の一実施形態によるプリコーダ及びエンコーダの例示的な図である。 本願の一実施形態によるプリコーダ及びエンコーダの例示的な図である。 本願の一実施形態によるW個のレイヤの反転コンプレッサの別の圧縮例の図である。 本願の一実施形態による非反転エンコーダの回路図である。 本願の一実施形態による反転エンコーダの回路図である。 本願の一実施形態による反転コンプレッサの回路図である。
本願において、「少なくとも1つ」は1つ又は複数を意味し、「複数」は2つ以上を意味する。「及び/又は」という用語は、関連するオブジェクトを説明するための関連性の関係を説明し、3つの関係が存在し得ることを表す。例えば、A及び/又はBは、次の場合:Aのみが存在する、AとBとの両方が存在する、及びBのみが存在することを示し得、ここで、A及びBは単数形又は複数形であり得る。以下のアイテム(ピース)のうちの少なくとも1つ又はその類似の表現は、単一のアイテム(ピース)又は複数のアイテム(ピース)の任意の組合せを含む、これらのアイテムの任意の組合せを示す。例えば、a、b、又はcの少なくとも1つ(ピース)は、a;b;c;a及びb;a及びc;b及びc;又はa、b及びcを示し得、ここで、a、b及びcは単数形又は複数形であり得る。さらに、本願の実施形態では、「第1」及び「第2」等の単語は、基本的に類似した名前、機能、又は目的を有するオブジェクトを区別するために使用される。当業者は、「第1」及び「第2」等の単語が、数量又は実行順序を制限しないことを理解し得る。「結合」という用語は、ワイヤ又は接続端を介した直接接続又は別の装置を介した間接接続を含む、電気的接続を示すために使用される。従って、「結合」は、広範な意味での電子通信接続と見なすべきである。
図2は、本願の一実施形態による通信装置の構造の概略図である。通信装置は、端末、サーバ等であり得る。図2に示されるように、通信装置は、メモリ201、プロセッサ202、通信インターフェイス203、及びバス204を含み得る。メモリ201、プロセッサ202、及び通信インターフェイス203は、バス204を介して互いに接続される。メモリ201は、データ、ソフトウェアプログラム、及びモジュールを記憶するように構成され、且つ主にプログラム記憶領域及びデータ記憶領域を含む。プログラム記憶領域は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションプログラム等を記憶することができる。データ記憶領域は、装置の使用中に作成されたデータ等を記憶することができる。プロセッサ202は、通信装置の動作を制御及び管理するように構成され、例えば、メモリ201に記憶したソフトウェアプログラム及び/又はモジュールを起動又は実行することによって、及びメモリ201に記憶しれたデータを呼び出すことによって、装置の様々な機能を実行し、データを処理するように構成される。通信インターフェイス203は、装置の通信をサポートするように構成される。
プロセッサ202は、中央処理装置(CPU)、ネットワーク処理装置(NPU)、グラフィックス処理装置(GPU)、デジタル信号プロセッサ(DSP)、汎用プロセッサ等を含むが、これらに限定されるものではない。プロセッサ202は、1つ又は複数の乗算器を含み、例えば、乗算器マトリックスを含む。乗算器は、プロセッサ202において乗算演算を行う構成要素である。
バス204は、周辺機器相互接続(PCI)バス、拡張業界標準アーキテクチャ(EISA)バス等であり得る。バスは、アドレスバス、データバス、制御バス等に分類することができる。表現を容易にするために、図2のバスを表すために1本の太い線のみが使用されているが、これはバスが1つしかない、又はバスの種類が1つしかないという意味ではない。
技術的解決策をさらに説明するために、図3は、本願の一実施形態による乗算器の構造の概略図である。乗算器は、Mビットの第1の値とNビットの第2の値との乗算を行うように構成され、ここで、M及びNは1より大きい整数である。図3を参照すると、乗算器は、P個のプリコーダ308、P個のエンコーダグループ302、W個のレイヤの反転コンプレッサ303、及び加算器304を含む。P個のエンコーダグループ302内の各エンコーダグループ3021は、N個のエンコーダを含み、Wは正の整数であり、Pは1より大きい整数である。従来の設計と比較して、乗算器は実装が容易であり、この乗算器について以下で詳細に説明する。
P個のプリコーダ310内の各プリコーダ3011は、第1の値のビットの一部に基づいて、グループ選択信号及びシンボル制御入力信号を生成するように構成され、それによって、P個のプリコーダ310は、それに応じてP個のグループ選択信号及びP個のシンボル制御入力信号を生成する。P個のグループ選択信号及びP個のシンボル制御入力信号は、P個のエンコーダグループと1対1で対応している。つまり、1つのグループ選択信号及び1つのシンボル制御入力信号は1つのエンコーダグループに対応する。グループ選択信号は、第1の値における隣接する2つ又は3つのビットに基づいて生成され得る。シンボル制御入力信号は、第1の値における1ビットであってもよく、或いは第1の値における隣接する2つ又は3つのビットに基づいて生成してもよい。
例えば、第1の値が、4ビットの2進数であり且つa[3:0]として示され、Pが2に等しい場合に、2つのプリコーダは、a[3:0]に基づいて、2つのグループ選択信号及び2つのシンボル制御入力信号を生成し得る。2つのグループ選択信号において、第1のグループ選択信号は、a[0]及びa[1]に基づいて生成され得、第2のグループ選択信号は、a[1]~a[3]に基づいて生成され得る。2つのシンボル制御入力信号において、第1のシンボル制御入力信号はa[1]であり得、第2のシンボル制御入力信号はa[3]であり得る。a[i]は、a[3:0]における右から左へのi番目のビットを示し、iの値の範囲は0~3である。
各エンコーダグループ3021は、非反転符号化演算子又は反転符号化演算子を使用して、エンコーダグループに対応するグループ選択信号及びシンボル制御入力信号、並びに第2の値を符号化して、1つの部分積を取得するように構成される。P個のエンコーダグループは、符号化を行ってP個の部分積を取得する。
各エンコーダグループ3021は、N個のエンコーダを含み、N個のエンコーダの各エンコーダは、第2の値における第1ビット及び第2ビットに対応し、グループ選択信号は、第1信号及び第2信号を含む。各エンコーダは、非反転符号化演算子又は反転符号化演算子を使用して、第1ビット、第2ビット、グループ選択信号、及びシンボル制御入力信号を符号化して、1つの部分積で1つの出力ビットを取得するように特に構成される。各エンコーダグループ3021のN個のエンコーダはそれぞれ符号化を行って、1つの部分積でN個の出力ビットを取得する、つまり、部分積を取得する。第1ビット及び第2ビットは、第2の値における隣接する2つのビット、又は第2の値における同じビットであり得る。以下の実施形態は、これを詳細に説明し得る。
例えば、第2の値が、3ビットの2進数であり且つb[2:0]として示され、Nが3に等しい場合に、各エンコーダグループ3021には、3つのエンコーダが含まれる。3つのエンコーダのうち、第1エンコーダはb[2:0]における隣接する2つのビットb[0]及びb[1]に対応し、第2エンコーダはb[2:0]における隣接する2つのビットb[1]及びb[2]に対応し、第3エンコーダに対応する第1ビットと第2ビットとの両方がb[2:0]におけるb[2]である。つまり、1つのビットb[2]のみが最後の第3エンコーダに第1ビットと第2ビットとの両方として入力される。b[i]は、b[2:0]における右から左へのi番目のビットを示す。
第1の値がa[3:0]であり、第2の値がb[2:0]である前述の例を例として使用する。第1の符号化グループ内の第1のエンコーダが第2の値b[2:0]における隣接する2つのビットb[0]及びb[1]に対応する場合に、対応するグループ選択信号は、a[0]及びa[1]に基づいて生成された第1のグループ選択信号(A及びBとして示される)であり、対応するシンボル制御入力信号がa[1]である場合に、第1のエンコーダは、非反転符号化演算子又は反転符号化演算子を使用して、b[0]、b[1]、A、B、及びa[1]を符号化して、第1の部分積で1つの出力ビットを取得するように特に構成され得る。
具体的には、エンコーダが非反転符号化演算子を使用する場合に、そのエンコーダは、非反転エンコーダと呼ばれ得る。エンコーダが反転符号化演算子を使用する場合に、そのエンコーダは、反転エンコーダと呼ばれ得る。以下では、非反転エンコーダ及び反転エンコーダについて個別に詳しく説明する。
非反転エンコーダは、以下の符号化演算を行うように特に構成され、その符号化演算には、第1信号と第1ビットとの両方が1である場合、又は第2信号と第2ビットとの両方が1である場合に、非反転エンコーダが取得する出力ビットは、シンボル制御入力信号の反転であること;又は、第1信号及び第1ビットの少なくとも一方が0であり、且つ第2信号及び第2ビットの少なくとも一方が0である場合に、非反転エンコーダが取得する出力ビットは、シンボル制御入力信号であること;が含まれる。
図4は、本願の一実施形態による非反転エンコーダの論理ブロック図である。論理ブロック図には、符号化ゲートユニット、反転ユニット、及びスイッチ制御ユニットが含まれている。符号化ゲートユニットの機能は次の通りである。A及びSel_Aが両方とも1である場合、又はB及びSel_Bが両方とも1である場合に、1を出力する;それ以外の場合は、0を出力する。反転ユニットの機能は、符号化ゲートユニットの出力に対して反転を行うことである。スイッチ制御ユニットの機能は、反転ユニットの出力が1である場合に、Sを出力し、反転ユニットの出力が0である場合に、/Sを出力する。図4では、Aは第1信号を表し、Bは第2信号を表し、Sel_Aは第1ビットを表し、Sel_Bは第2ビットを表し、Sはシンボル制御入力信号を表し、/Sはシンボル制御入力信号の反転を表し、OUTは出力ビットを表す。
換言すると、非反転エンコーダは、以下の表1に示される論理表に基づいて符号化を特に実行することができ、ここで、表1のxは、「0」又は「1」のいずれか1つを表し、A、B、Sel_A、Sel_B、S、及びOUTは、図4のA、B、Sel_A、Sel_B、S、及びOUTと一致している。
Figure 0007371255000001
反転エンコーダは、以下の符号化演算を行うように特に構成され、その符号化演算には、第1信号と第1ビットとの両方が1である場合、又は第2信号と第2ビットとの両方が1である場合に、反転エンコーダが取得する出力ビットは、シンボル制御入力信号であること;又は、第1信号及び第1ビットの少なくとも一方が0であり、且つ第2信号及び第2ビットの少なくとも一方が0である場合に、反転エンコーダが取得する出力ビットは、シンボル制御入力信号の反転であること;が含まれる。
図5は、本願の一実施形態による反転エンコーダの論理ブロック図である。論理ブロック図には、符号化ゲートユニット、反転ユニット、及びスイッチ制御ユニットが含まれている。符号化ゲートユニットの機能は次の通りである。A及びSel_Aが両方とも1である場合、又はB及びSel_Bが両方とも1である場合に、1を出力する;それ以外の場合は、0を出力する。反転ユニットの機能は、符号化ゲートユニットの出力に対して反転を行うことである。スイッチ制御ユニットの機能は、反転ユニットの出力が0である場合に、Sを出力し、反転ユニットの出力が1である場合に、/Sを出力する。図5では、Aは第1信号を表し、Bは第2信号を表し、Sel_Aは第1ビットを表し、Sel_Bは第2ビットを表し、Sはシンボル制御入力信号を表し、/Sはシンボル制御入力信号の反転を表し、OUTは出力ビットを表す。
換言すると、反転エンコーダは、以下の表2に示される論理表に基づいて符号化を特に実行することができ、ここで、表2のxは、「0」又は「1」のいずれか1つを表し、A、B、Sel_A、Sel_B、S、及びOUTは、図5のA、B、Sel_A、Sel_B、S、及びOUTと一致している。
Figure 0007371255000002
W個のレイヤの反転コンプレッサ303は、反転圧縮演算子を使用して、P個の部分積を圧縮して、2つの累積値を取得するように構成される。
具体的には、Wが1である場合に、W個のレイヤの反転コンプレッサ303は、第1レイヤの反転コンプレッサを含み、この第1レイヤの反転コンプレッサは、反転圧縮演算子を低い桁の重みから高い桁の重みまで順番に使用して、各桁の重みに対応する残りのビット数が3未満になるまで、P個の部分積のマトリックス内の各桁の重みを圧縮して、2つの行を含む第1の圧縮マトリックスを取得するように構成され、ここで、各行は1つの累積値に対応する。具体的には、Wが1より大きい整数である場合に、W個のレイヤの反転コンプレッサ303は、第1レイヤの反転コンプレッサからW番目のレイヤの反転コンプレッサまでを含む。第1レイヤの反転コンプレッサは、反転圧縮演算子を低い桁の重みから高い桁の重みまで順序に使用して、各桁の重みに対応する残りのビット数が3未満になるまで、P個の部分積のマトリックス内の各桁の重みを圧縮して、第1の圧縮マトリックスを取得するように構成される。i番目のレイヤの反転コンプレッサは、反転圧縮演算子を低い桁の重みから高い桁の重みまで順番に使用して、各桁の重みに対応する残りのビット数が3未満になるまで、(i-1)番目の圧縮マトリックス内の各桁の重みを圧縮して、i番目の圧縮マトリックスを取得するように構成され、ここで、iの値の範囲が2~Wである。W番目の圧縮マトリックスには2つの行が含まれ、各行は1つの累積値に対応する。
各レイヤの反転コンプレッサによる各桁の重みに対する圧縮は、桁の重みの3ビットに対して実行され、そのレイヤの反転コンプレッサによる圧縮によって得られる出力キャリービット及び現在の合計ビットは圧縮されない。P個の部分積のマトリックスでは、各行には1つの部分積が含まれ、各列にはP個の部分積の同じ桁の重みに対応する複数のビットが含まれ、各桁の重みに対する圧縮が桁の重みの3ビットに対して実行される
例えば、P個のエンコーダグループが符号化を行って8つの部分積を取得し、各部分積には16ビットが含まれると仮定する。この場合に、8つの部分積のマトリックスが図6(a)に示され得、ここでPP[1]~PP[8]は8つの部分積を表し、2、2 、...、及び232は異なる桁の重みを示す。桁の重みは、W個のレイヤの反転コンプレッサの出力結果に関するものである。10進法の1ビット、10ビット、又は100ビットと同様に、桁の重みは、出力結果のバイナリ値の1ビットを示すために使用される。例えば、W個のレイヤの反転コンプレッサの出力結果が32ビットのバイナリ値である場合に、出力結果には32桁の重みが含まれる。桁の重みとは反対に、ビットは0又は1に対応し、1つのバイナリ情報を示す。W個のレイヤの反転コンプレッサの出力結果では、1桁の重みが1ビットであると考えることができる。
理解を容易にするために、図6(a)から変換した図6(b)に示されるように、W個のレイヤの反転コンプレッサ303の各レイヤの圧縮プロセスを、例を用いて説明する。具体的には、出力結果には32桁の重みが含まれ、第1レイヤの反転コンプレッサは、3ビット毎に圧縮し、マトリックス内の2~229の各桁の重みに対応するビット数が3未満のビットを予約し、2~229以外の他の桁の重みに対応するビット数が3未満になるビットを予約するように特に構成される。図6(b)の中実(solid)の各長方形ボックスは、第1レイヤの反転コンプレッサにおける1つの反転コンプレッサを表すために使用され得る。第1レイヤの反転コンプレッサによる圧縮によって得られた第1の圧縮マトリックスが図6(c)に示される。この図では、
Figure 0007371255000003
は、第1レイヤの反転コンプレッサによって出力された現在の出力合計ビットを示し、
Figure 0007371255000004
は、第1レイヤの反転コンプレッサによって出力された出力キャリービットを示す。第2レイヤの反転コンプレッサは、3ビット毎に圧縮し、第1の圧縮マトリックス内の2~223及び226の各桁の重みに対応するビット数が3未満のビットを予約し、2~223及び226以外の他の桁の重みに対応するビット数が3未満のビットを予約するように特に構成される。図6(c)の長方形ボックスは、第2レイヤの反転コンプレッサにおける1つの反転コンプレッサを表すために使用され得る。第2レイヤの反転コンプレッサによる圧縮によって得られた第2の圧縮マトリックスが図6(d)に示される。図では、
Figure 0007371255000005
は、第2レイヤの反転コンプレッサによって出力された現在の出力合計ビットを示し、
Figure 0007371255000006
は、第2レイヤの反転コンプレッサによって出力された出力キャリービットを示している。第3レイヤの反転コンプレッサからW番目のレイヤの反転コンプレッサへの後続の特定の圧縮プロセスは、第1レイヤの反転コンプレッサ及び第2レイヤの反転コンプレッサの特定の圧縮プロセスと同様である。本願のこの実施形態では、詳細について、ここでは再び説明しない。
各桁の重みの3ビット毎に、各反転コンプレッサは、以下の圧縮を行うように特に構成される:3ビットが全て0である場合に、出力キャリービットは1であり、現在の出力合計ビットは1である;3ビットが全て1である場合に、出力キャリービットは0であり、現在の出力合計ビットは0である;3ビットのうちの1ビットが1であり、他の2ビットが0である場合に、出力キャリービットは1であり、現在の出力合計ビットは0である;又は、3ビットのうちの2ビットが1であり、他のビットが0である場合に、出力キャリービットは0であり、現在の出力合計ビットは1である。
出力キャリービットは、圧縮した現在の桁の重みの次の桁の重みを指す出力ビットであり、現在の出力合計ビットは、圧縮した現在の桁の重みの圧縮によって得られる出力ビットである。例えば、圧縮した現在の桁の重みが2であり、圧縮した現在の桁の重みの次の桁の重みが2であると仮定する。2の3ビットが全て0である場合に、1つの1は2に対する圧縮によって生成され、1つの1は2に対して生成される。
図7は、本願の一実施形態による反転コンプレッサの論理ブロック図である。論理ブロック図には、反転キャリー出力ユニット及び反転合計出力ユニットが含まれている。反転キャリー出力ユニットの機能は次の通りである。Ai、Bi、及びCiのうちの少なくとも2つが有効である場合に(1又は0が有効であり得る)、出力は無効である(1が有効である場合に、0は無効である。又は、0が有効である場合に、1は無効である);それ以外の場合に、出力は有効である。反転合計出力ユニットの機能は次の通りである。Ai、Bi、及びCiのうちの2つが無効であるか、又は全てが無効である場合に、出力は有効である;それ以外の場合に、出力は無効である。反転合計出力ユニットへのnCip1入力が有効である場合に、それは、Ai、Bi、及びCiのうちの2つが無効であるか、Ai、Bi、及びCiの全てが無効であるかを区別するために使用することができる。図7のAi、Bi、及びCiは3つの入力ビットを表し、nCip1は出力キャリービットを表し、nSiは現在の出力合計ビットを表す。換言すると、各レイヤの反転コンプレッサは、以下の表3に示される論理表に基づいて圧縮を特に実行することができ、ここで、表3のAi、Bi、及びCiは3つの入力ビットを表し、nCip1は出力キャリービットを表し、nSiは現在の出力合計ビットを表す。
Figure 0007371255000007
さらに、乗算器は、1つ又は複数のインバータをさらに含むことができ、このインバータは、W個のレイヤの反転コンプレッサ303内の1つ又は複数の反転コンプレッサによって出力される現在の出力合計ビット及び出力キャリービットの位相を反転する、又は1つ又は複数の反転コンプレッサに入力された3ビットのうちの少なくとも1ビットの位相を反転するように構成される。
W個のレイヤの反転コンプレッサ303は、複数レイヤの反転コンプレッサを含み得、複数レイヤの反転コンプレッサの各レイヤは、少なくとも1つの反転コンプレッサを含み得る。各反転コンプレッサの出力位相は要件に基づいて設定することができ、各反転コンプレッサの出力位相は入力位相と反対であるため、各反転コンプレッサの入力位相も設定される。
反転コンプレッサの出力位相は、反転コンプレッサによって出力される現在の出力合計ビット及び出力キャリービットの位相、並びに現在の出力合計ビット及び出力キャリービットの位相が、同じである、つまり、両方とも正又は負であり得ることに留意されたい。反転コンプレッサの入力位相は、反転コンプレッサに入力される3ビットの構成された位相であり得、そして3ビットの構成された位相は同じである、すなわち、全て正又は負である。
W個のレイヤの反転コンプレッサ303内の1つ又は複数の反転コンプレッサの出力位相が構成された出力位相と異なる場合に、1つ又は複数のインバータは、1つ又は複数の反転コンプレッサによって出力される現在の出力合計ビット及び出力キャリービットの位相を反転するように構成され、それによって、位相が構成された出力位相と一致する。同様に、1つ又は複数の反転コンプレッサに入力される3ビットのうちの少なくとも1ビットの位相が構成された入力位相と異なる場合に、1つ又は複数のインバータは、1つ又は複数の反転コンプレッサに入力される3ビットのうちの少なくとも1ビットの位相を反転するように構成され、それによって、位相が構成された入力位相と一致する。
可能な実施態様において、各レイヤの反転コンプレッサに含まれる少なくとも1つの反転コンプレッサの出力位相は、以下の方法で設定され得る:最後のレイヤの反転コンプレッサの出力位相が正に設定され、第2から最後のレイヤの反転コンプレッサの出力位相が負に設定され、第3から最後のレイヤの反転コンプレッサの出力位相が正に設定され、...等、第1レイヤの出力位相が設定されるまで続く。本明細書の第1レイヤの反転コンプレッサは、各桁の重みに対応する複数のビットを上から下の順序で圧縮する最上位レイヤの反転コンプレッサを指し得、第2レイヤの反転コンプレッサは、次の上位レイヤの反転コンプレッサを指し得、...等である。例えば、W個のレイヤの反転コンプレッサ303が4つのレイヤの反転コンプレッサを含む場合に、出力位相は、以下の方法で設定され得る。第4レイヤの反転コンプレッサの出力位相が正に設定され、第3レイヤの反転コンプレッサの出力位相が負に設定され、第2レイヤの反転コンプレッサの出力位相が正に設定され、第1レイヤの反転コンプレッサの出力位相が負に設定される。
オプションで、反転コンプレッサの出力位相が構成された出力位相と一致しない場合、又は反転コンプレッサの入力位相が構成された入力位相と一致しない場合に、少なくとも3つのインバータが、構成された出力位相及び構成された入力位相の要件を満たすために反転を行う必要があり、反転コンプレッサの出力位相の設定は、必要なインバータの数を減らすために部分的に調整され得る。例えば、反転コンプレッサの設定された出力位相が正である場合(この場合に、反転コンプレッサの入力位相は負である)であって、反転コンプレッサの出力位相が正である場合に、反転コンプレッサに入力される3ビットの位相も正であり、反転コンプレッサは、3ビットの位相を反転するために3つのインバータを必要とし、これにより、構成された出力位相及び構成された入力位相の要件を満たすことができる。この場合に、反転コンプレッサの出力位相を負にリセットすることにより(この場合に、反転コンプレッサの入力位相は正である)、反転コンプレッサは2つの出力ビット(つまり、現在の出力合計ビット及び出力キャリービット)の出力位相を反転するために2つのインバータのみを必要とし、これにより、構成された出力位相及び構成された入力位相の要件を満たすことができる。
さらに、P個のエンコーダグループ302内の少なくとも1つのエンコーダによって使用される符号化演算子の位相は、W個のレイヤの反転コンプレッサ303内の少なくとも1つのレイヤの反転コンプレッサによって出力される現在の出力合計ビット又は出力キャリービットの位相に関連している。オプションで、少なくとも1つのエンコーダのそれぞれによって使用される符号化演算子の位相は、そのエンコーダに接続された反転コンプレッサの入力位相と同じになるように設定される。各エンコーダで使用される符号化演算子の位相は、正又は負の場合がある。エンコーダが使用する符号化演算子の位相が正である場合(つまり、非反転符号化演算子が使用される場合)に、エンコーダは非反転エンコーダであり得る。エンコーダが使用する符号化演算子の位相が負である場合(つまり、反転符号化演算子が使用される場合)に、エンコーダは反転エンコーダであり得る。
加算器304は、2つの累積値を受け取り、2つの累積値を合計(sum up)して積(product)を得るように構成される。W個のレイヤの反転コンプレッサ303がP個の部分積を圧縮して2つの累積値を取得した後に、W個のレイヤの反転コンプレッサ303は2つの累積値を加算器304に送信することができる。2つの累積値を受信すると、加算器304は、2つの累積値を合計して、第1の値と第2の値との積を取得する。
理解を容易にするために、以下では、第1の値がa[10:0]であり、第2の値がb[12:0]である例を使用して、本願における乗算器を説明する。図8A~図8Fに示されるように、乗算器は、6つのプリコーダ、6つのエンコーダグループ、及び3つのレイヤの反転コンプレッサを含み得る。
具体的には、第1のプリコーダは、a[0]及びa[1]に基づいて、グループ選択信号S0及びS1と、シンボル制御入力信号a[1]とを生成するように構成される。第2のプリコーダは、a[1]、a[2]、及びa[3]に基づいて、グループ選択信号S2及びS3と、シンボル制御入力信号a[3]とを生成するように構成される。第3のプリコーダは、a[3]、a[4]、及びa[5]に基づいて、グループ選択信号S4及びS5と、シンボル制御入力信号a[5]とを生成するように構成される。第4のプリコーダは、a[5]、a[6]、及びa[7]に基づいて、グループ選択信号S6及びS7と、シンボル制御入力信号a[7]とを生成するように構成される。第5のプリコーダは、a[7]、a[8]、及びa[9]に基づいて、グループ選択信号S8及びS9と、シンボル制御入力信号a[9]とを生成するように構成される。第6のプリコーダは、a[9]及びa[10]に基づいて、グループ選択信号S10と、シンボル制御入力信号S_11とを生成するように構成される。対応して、第1のエンコーダグループは、b[12:0]、S0、S1、及びa[1]を符号化して、第1の部分積PP[1]を取得するように構成される。第2のエンコーダグループは、b[12:0]、S2、S3、及びa[3]を符号化して、第2の部分積PP[2]を取得するように構成される。第3のエンコーダグループは、b[12:0]、S4、S5、及びa[5]を符号化して、第3の部分積PP[3]を取得するように構成される。第4のエンコーダグループは、b[12:0]、S6、S7、及びa[7]を符号化して、第4の部分積PP[4]を取得するように構成される。第5のエンコーダグループは、b[12:0]、S8、S9、及びa[9]を符号化して、第5の部分積PP[5]を取得するように構成される。第6のエンコーダグループは、b[12:0]、S10、及びS_11を符号化して、第6の部分積PP[6]を取得するように構成される。各エンコーダグループの各エンコーダは、b[12:0]の1ビット又は2ビット、対応するグループ選択信号、及び対応するシンボル制御入力信号を符号化するように個別に構成される。詳細については、図8A~図8Fを参照されたい。最後に、6つの部分積PP[1]~PP[6]に対応するマトリックスが図9に示され得る。乗算器内のW個のレイヤの反転コンプレッサ303の関連する説明によれば、図9に示されるマトリックスは、3つのレイヤの反転コンプレッサによって圧縮され得る。詳細な圧縮プロセスは、図6(a)~図6(d)の関連する説明と同様であり、本願のこの実施形態では、詳細について、ここでは再び説明しない。
本願のこの実施形態で提供される乗算器において、P個のプリコーダは、異なる構造を有するプリコーダを含み得る。例えば、図8A~図8Fでは、第1のプリコーダは、NOTゲート及びANDゲートを含み、第2のプリコーダ~第5のプリコーダはそれぞれ、XORゲート、XNORゲート、及びNORゲートを含み、第6のプリコーダは、XORゲート及びANDゲートを含む。さらに、本願のこの実施形態では、第1のエンコーダは、同じエンコーダグループ内の別のエンコーダの構造とは異なる構造を有し得、異なるグループ内のエンコーダの構造もまた異なり得る。例えば、図8A~図8Eの第1のグループ~第5のエンコーダグループにおいて、第1のエンコーダは、ANDゲート及びXORゲートを含み、第2エンコーダ~第13のエンコーダはそれぞれ、非反転エンコーダ又は反転エンコーダである。図8Fの第6のエンコーダグループ内の各エンコーダは、ANDゲート及びXNORゲートを含む。
図8A~図8FのPP[1]_i(iの値は1~14の範囲である)は第1の部分積PP[1]のi番目のビットを表し、Aは第1信号を表し、Bは第2信号を表し、Sel_Aは第1ビットを表し、Sel_Bは第2ビットを表し、Sはシンボル制御入力信号を表し、OUTは出力ビットを表すことに留意されたい。
図10は、本願の一実施形態による非反転符号化オペレータ回路の構造の概略図である。非反転符号化オペレータ回路は、非反転エンコーダとも呼ばれ得る。非反転エンコーダには、第1トランジスタM1、第2トランジスタM2、第3トランジスタM3、第4トランジスタM4、第5トランジスタM5、第6トランジスタM6、第7トランジスタM7、第8トランジスタM8、第9トランジスタM9、第10トランジスタM10、第11トランジスタM11、第12トランジスタM12、第13トランジスタM13、第14トランジスタM14、及び第15トランジスタM15が含まれる。
第1トランジスタM1及び第2トランジスタM2は、電源端子と第1ノード()(左記の()は、「丸1」を表す、以下同様)との間で並列に結合され、第3トランジスタM3及び第4トランジスタM4は、第1ノード()と第2ノード()(左記の()は「丸2」を表す、以下同様)との間で並列に結合され、第5トランジスタM5及び第7トランジスタM7は、第2ノード()と接地端子との間に直列に結合され、そして第6トランジスタM6及び第8トランジスタM8は、第2ノード()と接地端子との間に直列に結合される。第3トランジスタM3及び第5トランジスタM5の制御端子は、第1入力Aを受け取るように構成され、第1トランジスタM1及び第6トランジスタM6の制御端子は、第2入力Sel_Aを受け取るように構成され、第4トランジスタM4及び第7トランジスタM7の制御端子は、第3入力Bを受け取るように構成され、そして第2トランジスタM2及び第8トランジスタM8の制御端子は、第4入力Sel_Bを受け取るように構成される。
第9トランジスタM9は、第5入力Sの反転/Sと出力端子OUTとの間に結合され、第9トランジスタM9の制御端子は第2ノード()に結合され、第2ノード()の信号は/Yである。第10トランジスタM10は、第2ノード()と出力端子OUTとの間に結合され、第10トランジスタM10の制御端子は、第5入力Sの反転/Sに結合される。第11トランジスタM11及び第13トランジスタM13は、出力端子OUTと接地端子との間に直列に結合される。第11トランジスタM11の制御端子は第2ノード()に結合される。第13トランジスタM13の制御端子は、第5入力Sの反転/Sを受け取るように構成される。第12トランジスタM12は、出力端子OUTと第2ノード()との間に結合され、第12トランジスタM12の制御端子は、第5入力Sを受け取るように構成される。第14トランジスタM14及び第15トランジスタM15は、電源端子と接地端子との間に直列に結合され、第14トランジスタM14と第15トランジスタM15との間の直列結合ノードは、第5入力Sの反転/Sに結合される。第14トランジスタM14及び第15トランジスタM15の制御端子は、第5入力Sを受け取るように構成される。
本願のこの実施形態では、第1入力A~第5入力Sはそれぞれ、乗算器の前述の実施形態における非反転エンコーダの関連する説明における第1信号、第1ビット、第2信号、第2ビット、及びシンボル制御入力信号であり得る。
オプションで、第1トランジスタM1、第2トランジスタM2、第3トランジスタM3、第4トランジスタM4、第9トランジスタM9、第10トランジスタM10、及び第14トランジスタM14は、PMOSトランジスタである。第5トランジスタM5、第6トランジスタM6、第7トランジスタM7、第8トランジスタM8、第11トランジスタM11、第12トランジスタM12、第13トランジスタM13、及び第15トランジスタM15は、NMOSトランジスタである。対応して、制御端子は、対応するPMOSトランジスタ又はNMOSトランジスタのゲートを特に指す場合がある。
前述の例における第1トランジスタM1~第15トランジスタM15は、MOSトランジスタであり得るか、又はバイポーラ接合トランジスタによって置き換えられ得ることに留意されたい。図10に示されるトランジスタの種類は、単なる例であり、本願の実施形態に対する制限を構成するものではない。
図11は、本願の一実施形態による反転符号化オペレータ回路の構造の概略図である。反転符号化オペレータ回路は、反転エンコーダとも呼ばれ得る。反転エンコーダには、第1トランジスタM1、第2トランジスタM2、第3トランジスタM3、第4トランジスタM4、第5トランジスタM5、第6トランジスタM6、第7トランジスタM7、第8トランジスタM8、第9トランジスタM9、第10トランジスタM10、第11トランジスタM11、第12トランジスタM12、第13トランジスタM13、第14トランジスタM14、及び第15トランジスタM15が含まれる。
第1トランジスタM1及び第2トランジスタM2は、電源端子と第1ノード()との間で並列に結合され、第3トランジスタM3及び第4トランジスタM4は、第1ノード()と第2ノード()との間で並列に結合され、第5トランジスタM5及び第7トランジスタM7は、第2ノード()と接地端子との間に直列に結合され、そして第6トランジスタM6及び第8トランジスタM8は、第2ノード()と接地端子との間に直列に結合される。第3トランジスタM3及び第5トランジスタM5の制御端子は、第1入力Aを受け取るように構成され、第1トランジスタM1及び第6トランジスタM6の制御端子は、第2入力Sel_Aを受け取るように構成され、第4トランジスタM4及び第7トランジスタM7の制御端子は、第3入力Bを受け取るように構成され、そして第2トランジスタM2及び第8トランジスタM8の制御端子は、第4入力Sel_Bを受け取るように構成される。
第9トランジスタM9及び第10トランジスタM10は、電源端子と出力端子OUTとの間に直列に結合され、第9トランジスタM9の制御端子は第5入力Sの反転/Sに結合され、第10トランジスタM10の制御端子は第2ノード()に結合され、そして第2ノード()の信号は/Yである。第11トランジスタM11は、第2ノード()と出力端子OUTとの間に結合され、第11トランジスタM11の制御端子は第5入力Sに結合される。第12トランジスタM12は、出力端子OUTと第5入力Sの反転/Sとの間に結合され、第12トランジスタM12の制御端子は、第2ノード()に結合される。第13トランジスタM13は、出力端子OUTと第2ノード()の間に結合され、第13トランジスタM13の制御端子は、第5入力Sの反転/Sに結合される。第14トランジスタM14及び第15トランジスタM15は、電源端子と接地端子の間で直列に結合され、第14トランジスタM14と第15トランジスタM15との間の直列結合ノードは、第5入力Sの反転/Sに結合される。第14トランジスタM14及び第15トランジスタM15の制御端子は、第5入力Sを受け取るように構成される。
本願のこの実施形態では、第1入力A~第5入力Sはそれぞれ、乗算器の前述の実施形態における反転エンコーダの関連する説明における第1信号、第1ビット、第2信号、第2ビット、及びシンボル制御入力信号であり得る。
オプションで、第1トランジスタM1、第2トランジスタM2、第3トランジスタM3、第4トランジスタM4、第9トランジスタM9、第10トランジスタM10、第11トランジスタM11、及び第14トランジスタM14は、PMOSトランジスタである。第5トランジスタM5、第6トランジスタM6、第7トランジスタM7、第8トランジスタM8、第12トランジスタM12、第13トランジスタM13、及び第15トランジスタM15は、NMOSトランジスタである。対応して、制御端子は、対応するPMOSトランジスタ又はNMOSトランジスタのゲートを特に指す場合がある。
前述の例における第1トランジスタM1~第15トランジスタM15は、MOSトランジスタであり得るか、又はバイポーラ接合トランジスタによって置き換えられ得ることに留意されたい。図11に示されるトランジスタの種類は、単なる例であり、本願の実施形態に対する制限を構成するものではない。
図12は、本願の一実施形態による反転圧縮オペレータ回路の構造の概略図である。反転圧縮オペレータ回路は、反転コンプレッサとも呼ばれ得る。反転コンプレッサには、第1トランジスタM1、第2トランジスタM2、第3トランジスタM3、第4トランジスタM4、第5トランジスタM5、第6トランジスタM6、第7トランジスタM7、第8トランジスタM8、第9トランジスタM9、第10トランジスタM10、第11トランジスタM11、第12トランジスタM12、第13トランジスタM13、第14トランジスタM14、第15トランジスタM15、第16トランジスタM16、第17トランジスタM17、第18トランジスタM18、第19トランジスタM19、第20トランジスタM20、第21トランジスタM21、及び第22トランジスタM22が含まれる。
第1トランジスタM1及び第2トランジスタM2は、電源端子と第1ノード()との間で並列に結合され、第3トランジスタM3は、第1ノード()と第1出力端子nCip1との間に結合され、第4トランジスタM4は、第1出力端子nCip1と第2ノード()との間に結合される。第5トランジスタM5及び第6トランジスタM6は、第2ノード()と接地端子との間で並列に結合され、第7トランジスタM7は、電源端子と第3ノード()(左記は、「丸3」を表す、以下同様)との間に結合され、第8トランジスタM8は、第3ノード()と第1出力端子nCip1との間に結合され、そして第9トランジスタM9は、第1出力端子nCip1と第4ノード()(左記は、「丸4」を表す、以下同様)との間に結合される。第10トランジスタM10は第4ノード()と接地端子との間に結合され、第11トランジスタM11及び第12トランジスタM12は、第3ノード()と第2出力端子nSiとの間に直列に結合され、そして第13トランジスタM13及び第14トランジスタM14は、第2出力端子nSiと第4ノード()との間に直列に結合される。第15トランジスタM15、第16トランジスタM16、及び第17トランジスタM17は、電源端子と第5ノード()(左記は、「丸5」を表す、以下同様)との間で並列に結合され、第18トランジスタM18は、第5ノード()と第2出力端子nSiとの間に結合され、第19トランジスタM19は、第2出力端子nSiと第6のノード()(左記は、「丸6」を表す、以下同様)との間に結合され、そして第20トランジスタM20、第21トランジスタM21、及び第22トランジスタM22は、第6のノード()及び接地端子との間で並列に結合される。
第3トランジスタM3、第4トランジスタM4、第12トランジスタM12、第13トランジスタM13、第15トランジスタM15、及び第20トランジスタM20の制御端子は、第1入力Aiを受け取るように構成される。第1トランジスタM1、第5トランジスタM5、第7トランジスタM7、第10トランジスタM10、第16トランジスタM16、及び第21トランジスタM21の制御端子は、第2入力Biを受け取るように構成される。第2トランジスタM2、第6トランジスタM6、第8トランジスタM8、第9トランジスタM9、第11トランジスタM11、第14トランジスタM14、第17トランジスタM17、及び第22トランジスタM22の制御端子は、第3の入力Ciを受け取るように構成される。第18トランジスタM18及び第19トランジスタM19の制御端子は、第1出力端子nCip1に結合される。
本願のこの実施形態では、第1入力Ai、第2入力Bi、及び第3入力Ciは、乗算器の前述の実施形態における反転コンプレッサの関連する説明における3ビットであり得る。第1出力端子nCip1は、反転コンプレッサの出力キャリービットを出力するように構成され、第2出力端子nSiは、反転コンプレッサの現在の出力合計ビットを出力するように構成される。
オプションで、第1トランジスタM1、第2トランジスタM2、第3トランジスタM3、第7トランジスタM7、第8トランジスタM8、第11トランジスタM11、第12トランジスタM12、第15トランジスタM15、第16トランジスタM16、第17トランジスタM17、及び第18トランジスタM18は、PMOSトランジスタである。第4トランジスタM4、第5トランジスタM5、第6トランジスタM6、第9トランジスタM9、第10トランジスタM10、第13トランジスタM13、第14トランジスタM14、第19トランジスタM19、第20トランジスタM20、第21トランジスタM21、及び第22トランジスタM22は、NMOSトランジスタである。対応して、制御端子は、対応するPMOSトランジスタ又はNMOSトランジスタのゲートを特に指す場合がある。
前述の例における第1トランジスタM1~第22トランジスタM22は、MOSトランジスタであり得るか、又はバイポーラ接合トランジスタによって置き換えられ得ることに留意されたい。図12に示されるトランジスタの種類は、単なる例であり、本願の実施形態に対する制限を構成するものではない。
本願のこの実施形態では、上記で提供した非反転エンコーダ、反転エンコーダ、及び反転コンプレッサを使用する乗算器を、標準的なエンコーダ及び標準的な加算器を使用する既存の乗算器と比較する。詳細を表4及び表5に示す。本願の一実施形態では、この実施形態は、以下の特定のパラメータ値に限定されない。
Figure 0007371255000008
表4から、標準的な各エンコーダは、22個のトランジスタを使用し、0.2736の面積を占有し、面積比率は1.18であり、各非反転エンコーダ又は反転エンコーダは、15個のトランジスタを使用し、0.23256の面積を占有し、面積比率は1であることが分かり得る。標準的な各加算器は28個のトランジスタを使用し、0.2736の面積を占有し、面積比率は1.10であり、各反転コンプレッサは、24個のトランジスタを使用し、0.24816の面積を占有し、面積比率は1である。従って、本願の実施形態で提供される乗算器の面積は、より小さい。
Figure 0007371255000009
表5から、標準的なエンコーダは、1ビットのデータ毎に符号化するために4回トグルし、静的電力消費は0.44522であり、静的電力消費比率は1.18であり、動的電力消費比率は1.09であることが分かり得る。非反転エンコーダ又は反転エンコーダは、1ビットのデータ毎に符号化するために3回トグルし、静的消費電力は0.4084であり、静的消費電力の比率と動的消費電力の比率は両方とも1である。標準的な加算器は、1ビットのデータ毎に圧縮するために4回トグルし、静的消費電力は0.57685であり、静的消費電力は1.10であり、動的消費電力は1.80である。反転コンプレッサは、1ビットのデータ毎に圧縮するために2回トグルし、静的電力消費は0.32122であり、静的電力消費比率及び動的電力消費比率は両方とも1である。従って、本願の実施形態で提供される乗算器の電力消費は、より低い。
本願の実施形態で提供される乗算器のエンコーダは、非反転符号化演算子又は反転符号化演算子を使用して符号化を行う。すなわち、乗算器は、非反転エンコーダ又は反転エンコーダを使用して符号化を行う。また、コンプレッサは、反転コンプレッサを使用して圧縮を行う。乗算器の実施態様の解決策は簡素である。例えば、乗算器内のMOSトランジスタの数を減らして、乗算器の面積を減らすことができる。さらに、乗算器が1ビットのデータ毎に符号化又は圧縮する場合に、対応するエンコーダ又はコンプレッサのトグル時間の量が少ないため、乗算器の消費電力は低くなる。
最後に、前述の説明は、本願の実施形態の単なる特定の実施態様であり、本願の保護範囲を制限することを意図するものではないことに留意されたい。本願で開示する技術的範囲内の変更又は交換は、本願の保護範囲内に含まれるものとする。従って、本願の保護範囲は、特許請求の範囲の保護範囲に従うものとする。

Claims (14)

  1. Mビットの第1の値とNビットの第2の値との乗算を行うように構成された乗算器であって、M及びNは1より大きい整数であり、乗算器には、P個のエンコーダグループ及びW個のレイヤの反転コンプレッサが含まれ、前記P個のエンコーダグループの各グループにはN個のエンコーダが含まれ、Wは正の整数であり、Pは1より大きい整数であり、
    前記各エンコーダグループは、非反転符号化演算子又は反転符号化演算子を使用して、前記各エンコーダグループに対応するグループ選択信号及びシンボル制御入力信号と、前記第2の値のビットの一部とを符号化して、1つの部分積を取得するように構成され、前記グループ選択信号及び前記シンボル制御入力信号は、前記第1の値のビットの一部に基づいて生成され、前記P個のエンコーダグループは符号化を行ってP個の部分積を取得し、
    前記W個のレイヤの反転コンプレッサは、反転圧縮演算子を使用して前記P個の部分積を圧縮して、2つの累積値を取得するように構成され、該2つの累積値の合計は、前記第1の値と前記第2の値との積である、
    乗算器。
  2. 前記N個のエンコーダの各エンコーダは、前記第2の値の第1ビット及び第2ビットに対応し、前記グループ選択信号は、第1信号及び第2信号を含み、前記各エンコーダは、前記非反転符号化演算子又は前記反転符号化演算子を使用して、前記第1ビット、前記第2ビット、前記グループ選択信号、及び前記シンボル制御入力信号を符号化して、1つの部分積で1つの出力ビットを取得するように特に構成される、請求項1に記載の乗算器。
  3. エンコーダが非反転符号化演算子を使用する場合に、前記エンコーダは、非反転エンコーダであり、且つ以下の符号化演算を行うように特に構成され、該符号化演算には、
    前記第1信号と前記第1ビットとの両方が1である場合、又は前記第2信号と前記第2ビットとの両方が1である場合に、前記エンコーダが取得する前記出力ビットが、前記シンボル制御入力信号の反転であること、又は
    前記第1信号及び前記第1ビットの少なくとも一方が0であり、且つ前記第2信号及び前記第2ビットの少なくとも一方が0である場合に、前記エンコーダが取得する前記出力ビットは、前記シンボル制御入力信号であること、が含まれる、請求項2に記載の乗算器。
  4. エンコーダが反転符号化演算子を使用する場合に、前記エンコーダは、反転エンコーダであり、且つ以下の符号化演算を行うように特に構成され、該符号化演算には、
    前記第1信号と前記第1ビットとの両方が1である場合、又は前記第2信号と前記第2ビットとの両方が1である場合に、前記エンコーダが取得する前記出力ビットが、前記シンボル制御入力信号であること、又は
    前記第1信号及び前記第1ビットの少なくとも一方が0であり、且つ前記第2信号及び前記第2ビットの少なくとも一方が0である場合に、前記エンコーダが取得する前記出力ビットが、前記シンボル制御入力信号の反転であること、が含まれる、請求項2に記載の乗算器。
  5. Wは1であり、前記W個のレイヤの反転コンプレッサは、第1レイヤの反転コンプレッサを含み、
    前記第1レイヤの反転コンプレッサは、前記反転圧縮演算子を低い桁の重みから高い桁の重みまで順番に使用して、前記各桁の重みに対応する残りのビット数が3未満になるまで、前記P個の部分積のマトリックス内の各桁の重みを圧縮して、2つの行を含む第1の圧縮マトリックスを取得するように構成され、各行は1つの累積値に対応し、
    前記各桁の重みに対する圧縮は、3ビット毎に前記桁の重みに対して実行され、前記P個の部分積の前記マトリックスでは、各行には1つの部分積が含まれ、各列には、前記P個の部分積の同じ桁の重みに対応する複数のビットが含まれる、請求項1乃至4のいずれか一項に記載の乗算器。
  6. Wは1より大きい整数であり、前記W個のレイヤの反転コンプレッサには、第1レイヤの反転コンプレッサからW番目のレイヤの反転コンプレッサまでが含まれ、
    前記第1レイヤの反転コンプレッサは、前記反転圧縮演算子を低い桁の重みから高い桁の重みまで順番に使用して、前記各桁の重みに対応する残りのビット数が3未満になるまで、前記P個の部分積のマトリックス内の各桁の重みを圧縮して、第1の圧縮マトリックスを取得するように構成され、
    i番目のレイヤの反転コンプレッサは、前記反転圧縮演算子を低い桁の重みから高い桁の重みまで順番に使用して、前記各桁の重みに対応する残りのビット数が3未満になるまで、(i-1)番目の圧縮マトリックス内の前記各桁の重みを圧縮して、i番目の圧縮マトリックスを取得するように構成され、iの値の範囲は2~Wであり、
    W番目の圧縮マトリックスには2つの行が含まれ、各行は1つの累積値に対応し、
    各レイヤの反転コンプレッサによる前記各桁の重みに対する圧縮は、前記桁の重みの3ビットに対して実行され、前記P個の部分積の前記マトリックスでは、各行には1つの部分積が含まれ、各列には、前記P個の部分積の同じ桁の重みに対応する複数のビットが含まれる、請求項1乃至4のいずれか一項に記載の乗算器。
  7. 前記各桁の重みの前記3ビットに対して、各反転コンプレッサは、以下の圧縮を行うように特に構成され、該圧縮には、
    前記3ビットが全て0である場合に、出力キャリービットは1であり、現在の出力合計ビットは1であること、
    前記3ビットが全て1である場合に、出力キャリービットは0であり、現在の出力合計ビットは0であること、
    前記3ビットのうちの1ビットが1であり、他の2ビットが0である場合に、出力キャリービットは1であり、現在の出力合計ビットは0であること、又は
    前記3ビットのうちの2ビットが1であり、他のビットが0である場合に、出力キャリービットは0であり、現在の出力合計ビットは1であること、が含まれる、請求項5又は6に記載の乗算器。
  8. エンコーダによって使用される同じ桁の重みに対応する符号化演算子の位相が、前記反転コンプレッサによって出力される前記現在の出力合計ビット又は前記出力キャリービットの位相に関連し、
    前記同じ桁の重みに対応する前記エンコーダは、前記同じ桁の重みに対応する出力ビットを取得するために符号化を行うエンコーダであり、前記同じ桁の重みに対応する反転コンプレッサは、前記同じ桁の重みの前記3ビットを圧縮する反転コンプレッサである、請求項7に記載の乗算器。
  9. 当該乗算器は、1つ又は複数のインバータをさらに含み、該インバータは、前記W個のレイヤの反転コンプレッサ内の1つ又は複数の反転コンプレッサによって出力される現在の出力合計ビット及び出力キャリービットの位相を反転するか、或いは1つ又は複数の反転コンプレッサに入力される前記3ビットのうちの少なくとも1ビットの位相を反転するように構成される、請求項8に記載の乗算器。
  10. 前記乗算器は、プリコーダをさらに含み、該プリコーダは、前記第1の値を受け取り、前記第1の値の前記ビットの一部に基づいて前記グループ選択信号及び前記シンボル制御入力信号を生成するように構成される、請求項1乃至9のいずれか一項に記載の乗算器。
  11. 前記乗算器は、加算器をさらに含み、該乗算器は、前記2つの累積値を受け取り、該2つの累積値を合計して積を取得するように構成される、請求項1乃至10のいずれか一項に記載の乗算器。
  12. W個のレイヤの反転コンプレッサであって、Wは1より大きい整数であり、当該W個のレイヤの反転コンプレッサは、第1レイヤの反転コンプレッサからW番目のレイヤの反転コンプレッサまでを含み、
    前記第1レイヤの反転コンプレッサは、反転圧縮演算子を低い桁の重みから高い桁の重みまで順番に使用して、前記各桁の重みに対応する残りのビット数が3未満になるまで、P個の部分積のマトリックス内の各桁の重みを圧縮して、第1の圧縮マトリックスを取得するように構成され、
    i番目のレイヤの反転コンプレッサは、前記反転圧縮演算子を低い桁の重みから高い桁の重みまで順番に使用して、前記各桁の重みに対応する残りのビット数が3未満になるまで、(i-1)番目の圧縮マトリックス内の前記各桁の重みを圧縮して、i番目の圧縮マトリックスを取得するように構成され、iの値の範囲は2~Wであり、
    W番目の圧縮マトリックスには2つの行が含まれ、各行は1つの累積値に対応し、
    各レイヤの反転コンプレッサによる前記各桁の重みに対する圧縮は、前記桁の重みの3ビットに対して実行され、前記P個の部分積のマトリックスでは、各行には1つの部分積が含まれ、各列は、前記P個の部分積の同じ桁の重みに対応する複数のビットを含む、
    W個のレイヤの反転コンプレッサ。
  13. 前記各桁の重みの前記3ビットについて、各反転コンプレッサは、以下の圧縮を行うように特に構成され、該圧縮には、
    前記3ビットが全て0である場合に、出力キャリービットは1であり、現在の出力合計ビットは1であること、
    前記3ビットが全て1である場合に、出力キャリービットは0であり、現在の出力合計ビットは0であること、
    前記3ビットのうちの1ビットが1であり、他の2ビットが0である場合に、出力キャリービットは1であり、現在の出力合計ビットは0であること、又は
    前記3ビットのうちの2ビットが1であり、他のビットが0である場合に、出力キャリービットは0であり、現在の出力合計ビットは1であること、が含まれる、請求項12に記載のW個のレイヤの反転コンプレッサ。
  14. 当該W個のレイヤの反転コンプレッサは、1つ又は複数のインバータをさらに含み、該インバータは、当該W個のレイヤの反転コンプレッサ内の1つ又は複数の反転コンプレッサによって出力される現在の出力合計ビット及び出力キャリービットの位相を反転するか、或いは1つ又は複数の反転コンプレッサに入力される前記3ビットのうちの少なくとも1ビットの位相を反転するように構成される、請求項12に記載のW個のレイヤの反転コンプレッサ。
JP2022529732A 2019-11-21 2019-11-21 乗算器及びオペレータ回路 Active JP7371255B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2019/119993 WO2021097765A1 (zh) 2019-11-21 2019-11-21 一种乘法器及算子电路

Publications (2)

Publication Number Publication Date
JP2023503119A JP2023503119A (ja) 2023-01-26
JP7371255B2 true JP7371255B2 (ja) 2023-10-30

Family

ID=75980379

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022529732A Active JP7371255B2 (ja) 2019-11-21 2019-11-21 乗算器及びオペレータ回路

Country Status (7)

Country Link
US (1) US11855661B2 (ja)
EP (1) EP4030277A4 (ja)
JP (1) JP7371255B2 (ja)
KR (1) KR102676098B1 (ja)
CN (2) CN113946312A (ja)
BR (1) BR112022007427A2 (ja)
WO (1) WO2021097765A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023015442A1 (zh) * 2021-08-10 2023-02-16 华为技术有限公司 一种乘法器

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004227248A (ja) 2003-01-22 2004-08-12 Mitsubishi Electric Corp 演算装置及び演算方法
JP2009211481A (ja) 2008-03-05 2009-09-17 Nec Electronics Corp フィルタ演算器及び動き補償装置
US20150193203A1 (en) 2014-01-07 2015-07-09 Nvidia Corporation Efficiency in a fused floating-point multiply-add unit
US20160283614A1 (en) 2015-03-25 2016-09-29 Samsung Electronics Co., Ltd. Method for placing parallel multiplier
CN107977191A (zh) 2016-10-21 2018-05-01 中国科学院微电子研究所 一种低功耗并行乘法器
CN110058840A (zh) 2019-03-27 2019-07-26 西安理工大学 一种基于4-Booth编码的低功耗乘法器

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL179619C (nl) * 1974-04-18 1987-05-18 Philips Nv Digitale signaalverwerkingsinrichting voor het realiseren van een vooraf bepaalde overdrachtskarakteristiek.
US4153938A (en) * 1977-08-18 1979-05-08 Monolithic Memories Inc. High speed combinatorial digital multiplier
US4730340A (en) * 1980-10-31 1988-03-08 Harris Corp. Programmable time invariant coherent spread symbol correlator
JP3153370B2 (ja) * 1993-01-14 2001-04-09 三菱電機株式会社 乗算装置
US6195392B1 (en) * 1998-06-30 2001-02-27 U.S. Philips Corporation Method and arrangement for generating program clock reference values (PCRS) in MPEG bitstreams
US6877022B1 (en) * 2001-02-16 2005-04-05 Texas Instruments Incorporated Booth encoding circuit for a multiplier of a multiply-accumulate module
US7028068B1 (en) * 2003-02-04 2006-04-11 Advanced Micro Devices, Inc. Alternate phase dual compression-tree multiplier
US8064520B2 (en) * 2003-09-07 2011-11-22 Microsoft Corporation Advanced bi-directional predictive coding of interlaced video
US20140055290A1 (en) * 2003-09-09 2014-02-27 Peter Lablans Methods and Apparatus in Alternate Finite Field Based Coders and Decoders
US8577026B2 (en) * 2010-12-29 2013-11-05 Ternarylogic Llc Methods and apparatus in alternate finite field based coders and decoders
US20110064214A1 (en) * 2003-09-09 2011-03-17 Ternarylogic Llc Methods and Apparatus in Alternate Finite Field Based Coders and Decoders
CN100405288C (zh) * 2004-05-27 2008-07-23 扬智科技股份有限公司 乘法器的符号延伸方法及结构
CN104391675B (zh) * 2008-05-12 2020-03-24 高通股份有限公司 用于提高处理效率的设备和处理器
US9876488B2 (en) * 2015-11-02 2018-01-23 Mediatek Inc. Flip-flop circuit with data-driven clock

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004227248A (ja) 2003-01-22 2004-08-12 Mitsubishi Electric Corp 演算装置及び演算方法
JP2009211481A (ja) 2008-03-05 2009-09-17 Nec Electronics Corp フィルタ演算器及び動き補償装置
US20150193203A1 (en) 2014-01-07 2015-07-09 Nvidia Corporation Efficiency in a fused floating-point multiply-add unit
US20160283614A1 (en) 2015-03-25 2016-09-29 Samsung Electronics Co., Ltd. Method for placing parallel multiplier
CN107977191A (zh) 2016-10-21 2018-05-01 中国科学院微电子研究所 一种低功耗并行乘法器
CN110058840A (zh) 2019-03-27 2019-07-26 西安理工大学 一种基于4-Booth编码的低功耗乘法器

Also Published As

Publication number Publication date
US11855661B2 (en) 2023-12-26
US20220294468A1 (en) 2022-09-15
CN113227963A (zh) 2021-08-06
BR112022007427A2 (pt) 2022-07-12
EP4030277A1 (en) 2022-07-20
KR102676098B1 (ko) 2024-06-19
KR20220074965A (ko) 2022-06-03
WO2021097765A1 (zh) 2021-05-27
JP2023503119A (ja) 2023-01-26
EP4030277A4 (en) 2023-01-11
CN113227963B (zh) 2024-05-17
CN113946312A (zh) 2022-01-18

Similar Documents

Publication Publication Date Title
CN111008003B (zh) 数据处理器、方法、芯片及电子设备
CN110362293B (zh) 乘法器、数据处理方法、芯片及电子设备
CN110515587B (zh) 乘法器、数据处理方法、芯片及电子设备
JP7371255B2 (ja) 乗算器及びオペレータ回路
CN110554854B (zh) 数据处理器、方法、芯片及电子设备
CN110673823A (zh) 乘法器、数据处理方法及芯片
CN112764712B (zh) 一种高性能近似Booth乘法器及计算方法
CN111258544B (zh) 乘法器、数据处理方法、芯片及电子设备
CN111258633B (zh) 乘法器、数据处理方法、芯片及电子设备
CN209879493U (zh) 乘法器
CN110647307B (zh) 数据处理器、方法、芯片及电子设备
CN210006031U (zh) 乘法器
WO2023004783A1 (zh) 一种累加器、乘法器及算子电路
CN210006029U (zh) 数据处理器
Kumar et al. Complex multiplier: implementation using efficient algorithms for signal processing application
CN111258545B (zh) 乘法器、数据处理方法、芯片及电子设备
Abid et al. Modified operand decomposition multiplication for high performance parallel multipliers
Jagadeeshkumar et al. A novel design of low power and high speed hybrid multiplier
CN113031915A (zh) 乘法器、数据处理方法、装置及芯片
Reddy et al. A high speed, high Radix 32-bit Redundant parallel multiplier
CN113031909B (zh) 数据处理器、方法、装置及芯片
Jui et al. Efficient algorithm and hardware implementation of 3N for arithmetic and for radix-8 encodings
SAFIYA et al. A Modified Partial Product Generator for Redundant Binary Multipliers
REDDY et al. Design and Implementation of VLSI Architectures of 16-Bit Carry Select Adder Using Brent Kung Adder
JAYAKANTH et al. Implementation of Redundant Binary Multipliers with Modified Partial Product Generator

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220520

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230801

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230926

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231018

R150 Certificate of patent or registration of utility model

Ref document number: 7371255

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150