WO2013111200A1 - ニューラルネットワーク回路の学習方法 - Google Patents
ニューラルネットワーク回路の学習方法 Download PDFInfo
- Publication number
- WO2013111200A1 WO2013111200A1 PCT/JP2012/003492 JP2012003492W WO2013111200A1 WO 2013111200 A1 WO2013111200 A1 WO 2013111200A1 JP 2012003492 W JP2012003492 W JP 2012003492W WO 2013111200 A1 WO2013111200 A1 WO 2013111200A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- circuit
- input
- neural network
- electrode
- pulse voltage
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
- G06N3/065—Analogue means
Definitions
- the present invention relates to a learning method for a neural network circuit.
- Neural network mimics the neural network of a living body.
- the nerve cells of a living body exchange pulses (spike pulses) having a substantially constant shape. Therefore, as a neural network circuit for realizing a neural network, a model has been proposed which directly imitates a biological neural circuit and directly handles pulses.
- Patent Document 1 discloses a model (pulse density model) that expresses information using pulse density.
- This model is a model that expresses analog information using, for example, the number of pulses propagated in a certain time.
- Patent Document 2 discloses a model (pulse timing model) that expresses information using pulse timing. This model is a model that expresses analog information using a pulse and a time interval of the pulse.
- Non-Patent Document 1 discloses that by using a pulse timing model, higher performance can be obtained than when a pulse density model is used.
- the neural network circuit that realizes the pulse timing model as in Patent Document 2 has a problem that the circuit area of the entire neural network circuit is increased.
- An object of the present invention is to provide a neural network circuit learning method and a neural network circuit capable of realizing a learning operation based on pulse timing with a smaller number of elements.
- a learning method of a neural network circuit is a learning method of a neural network circuit configured by connecting a plurality of neural network circuit elements (40), wherein the plurality of neural network circuits are connected.
- Each of the network circuit elements (40) includes at least one synapse circuit (20) to which an output signal (hereinafter referred to as a first input signal) of another neural network circuit element (40) is input, and the at least one synapse circuit.
- a neuron circuit (30) to which an output signal of (20) is input, and the synapse circuit (20) includes a first electrode (13) and a second electrode formed on the semiconductor film (11).
- the neuron circuit (30) includes a waveform generation circuit (32) for generating a bipolar sawtooth pulse voltage or a Mexican hat pulse voltage (hereinafter referred to as a predetermined pulse voltage).
- a predetermined pulse voltage a bipolar sawtooth pulse voltage or a Mexican hat pulse voltage (hereinafter referred to as a predetermined pulse voltage).
- One input signal is configured to have the predetermined pulse voltage waveform, and is a temporal intermediate point of the predetermined pulse voltage waveform generated in the same neural network circuit element (40) as the variable resistance element (10).
- the first input signal is applied to the control electrode (15) of the variable resistance element (10) during a period having a predetermined time width before and after the intermediate point as a reference (hereinafter referred to as an input allowable period).
- the resistance value of the element (10) is changed.
- the learning operation based on the pulse timing can be realized with a smaller number of elements.
- FIG. 1 shows a block diagram of a neural network circuit element in the embodiment.
- FIG. 2A shows the shape of a bipolar sawtooth pulse voltage used for the first input signal voltage and the third input signal voltage in the embodiment.
- FIG. 2B shows the shape of a Mexican hat type pulse voltage used for the first input voltage and the third input voltage in the embodiment.
- FIG. 2C shows the shape of the square wave pulse voltage used for the second input voltage in the embodiment.
- FIG. 3 shows an operation of switching the conduction and non-conduction of the bipolar sawtooth pulse voltage V PRE shown in FIG. 2A using the square wave pulse voltage V POST2 shown in FIG. 2C in the first switch in the embodiment. Indicates.
- FIG. 3 shows an operation of switching the conduction and non-conduction of the bipolar sawtooth pulse voltage V PRE shown in FIG. 2A using the square wave pulse voltage V POST2 shown in FIG. 2C in the first switch in the embodiment. Indicates.
- FIG. 3 shows an operation of switching the conduction and non
- FIG. 4 shows an operation of switching the conduction and non-conduction of the Mexican hat pulse voltage V PRE shown in FIG. 2B using the square wave pulse voltage V POST2 shown in FIG. 2C in the first switch in the embodiment.
- FIG. 5A shows a cross-sectional view of the variable resistance element in the embodiment.
- FIG. 5B shows a circuit symbol of the variable resistance element in the embodiment.
- FIG. 6 shows an STDP evaluation circuit in the embodiment.
- FIG. 7A shows the shape of a bipolar sawtooth pulse voltage used for the first input signal voltage in the first embodiment.
- FIG. 7B shows the shape of the square wave pulse voltage used for the second input voltage in the first embodiment.
- FIG. 7C shows an asymmetric STDP in Example 1.
- FIG. 8 shows a circuit used for evaluating the integration operation in the first embodiment.
- FIG. 9 shows an asymmetric STDP in the first embodiment.
- FIG. 10A shows the shape of a Mexican hat type pulse voltage used for the first input signal voltage in the second embodiment.
- FIG. 10B shows the shape of the square wave pulse voltage used for the second input voltage in the second embodiment.
- FIG. 10C shows a symmetric STDP in the second embodiment.
- FIG. 11A shows a schematic diagram for explaining a hierarchical neural network.
- FIG. 11B shows a schematic diagram for explaining an interconnection neural network.
- FIG. 12 is a schematic diagram for explaining the operation of a general neuron.
- FIG. 13 is a schematic diagram for explaining the operation of the integral firing type neuron.
- FIG. 14A shows a schematic diagram for explaining STDP.
- FIG. 14A shows a schematic diagram for explaining STDP.
- FIG. 14B shows a schematic diagram illustrating the characteristics of the asymmetric STDP.
- FIG. 14C shows a schematic diagram illustrating a symmetric STDP.
- FIG. 15 is a cross-sectional view of a resistance change memory element disclosed in Patent Document 2.
- FIG. 16A is a block diagram showing a conventional STDP neural network circuit element disclosed in Patent Document 2.
- FIG. 16B is a block diagram showing an STDP portion of a conventional synapse circuit disclosed in Patent Document 2.
- FIG. 16C is a block diagram showing an STDP section of a conventional synapse circuit disclosed in Patent Document 2.
- FIG. 17 shows a signal generation circuit in the embodiment.
- a neural network imitates a biological neural network.
- a neural network uses a neuron imitating a nerve cell as a functional unit in a neural network as a functional unit, and performs information processing by arranging a plurality of neurons in a network.
- FIG. 11A there is a hierarchical neural network in which neurons 100 are connected in a hierarchy, and an interconnected neural network (Hopfield network) in which neurons 100 are connected to each other as shown in FIG. 11B.
- Neural network has two major functions. The first is a “processing” function that obtains an output from an input, and the second is a “learning” function that sets the input / output relationship of the entire neural network to a desired one.
- the hierarchical neural network shown in FIG. 11A includes three layers: an input layer 400, an intermediate layer 500, and an output layer 600. Each layer includes at least one neuron 100.
- the input layer 400 is connected to each neuron 100 in the intermediate layer 500.
- each neuron 100 in the intermediate layer 500 is connected to each neuron 100 in the output layer.
- the input signal 200 is input to the input layer 400, propagates in order through the intermediate layer 500 and the output layer 600, and is output from the output layer 600.
- a predetermined calculation described later is performed on the input value, and the output value is propagated to the neuron in the next layer.
- the output value from the output layer 600 becomes the final output 300 of the network.
- This series of operations is information processing of the neural network, and if a sufficient number of neurons are included in the intermediate layer 500, arbitrary input / output is realized.
- the hierarchical neural network illustrated in FIG. 11A includes three layers, a plurality of intermediate layers 500 may be included.
- FIG. 12 is a schematic diagram of a neuron.
- the neuron 100 includes synapse parts 121 and 122 and a neuron part 130.
- the number of synapse parts is equal to the number of neurons connected in the previous stage, that is, the number of input signals.
- the synapse units 121 and 122 weight each of the plurality of external input signals 111 and 112.
- the weighting values (w 1 , w 2 ) are called bond weights.
- the neuron unit 130 calculates the sum of the input signals weighted by the synapse unit, and outputs a value obtained by nonlinearly calculating the sum value.
- Equation 1 an external input signal is represented as x i (1, 2,..., N).
- n is equal to the number of input signals.
- the synapse unit multiplies each input signal by a corresponding connection weight value w i (1, 2,..., N), and the neuron unit calculates a sum V n thereof. To do.
- V n ⁇ w i x i (Equation 1)
- ⁇ is a sum symbol for i.
- the neuron unit sets the output value y as a result of performing the non-linear operation f on the obtained sum V n . Therefore, the output y of the neuron is expressed as shown in Equation 2.
- y f (V n ) (Formula 2)
- f a monotone increasing function having a saturation characteristic is used.
- a step function (step function) or a sigmoid function is often used.
- Neural networks have parallel processing because multiple neurons can perform operations at the same time. That is, unlike sequential computer information processing, parallel information processing is possible.
- [Learning function] An important feature of the neural network is that it has a “learning” function as well as a “processing” function that obtains an output from an input as described above. The learning described here is to set the input / output relationship of the entire neural network to a desired one by updating the above-described synaptic connection weight.
- Patent Document 1 discloses a model (pulse density model) that expresses information using pulse density.
- This model is a model that expresses analog information using, for example, the number of pulses propagated in a certain time.
- Patent Document 2 discloses a model (pulse timing model) that expresses information using pulse timing.
- This model is a model that expresses analog information using a time interval between pulses.
- signals exchanged between neurons are signals having a constant waveform, and thus there is an advantage that hardware implementation described later is easy.
- the pulse timing model can express information by each pulse, it can process information faster than the pulse density model.
- Non-Patent Document 1 discloses that by using a pulse timing model, higher performance can be obtained than when a pulse density model is used.
- Integral firing models have been proposed as neuron behavior models that can be applied to information representation using pulses as described above.
- an integral firing operation of a neuron having two input terminals will be described with reference to FIG.
- FIG. 13 shows temporal changes P 1 (t) and P 2 (t) of PSP at synapse 1 and synapse 2.
- the height of the PSP is proportional to the synaptic bond strength.
- t represents time.
- the neuron computes the sum of PSPs from all connected synapses. This is called the neuron internal potential V n (t).
- V n (t) When there are two input terminals to the neuron, as shown in FIG. 13, the internal potential V n (t) is the sum of P 1 (t) and P 2 (t). Generally speaking, the internal potential V n (t) is expressed as in Expression 3.
- V n (t) ⁇ P i (t) (Formula 3)
- P i the PSP at synapse i
- ⁇ the sum symbol for i.
- the neuron when the internal potential Vn exceeds a predetermined threshold value Vth , the neuron outputs a pulse signal y. This is called “firing” of neurons.
- the pulse output y is output from the neuron, and is input to another neuron after a certain transmission time t Delay .
- the pulse timing can also be used to update the synaptic connection weight in the learning operation.
- a learning operation using a property called spike timing synaptic plasticity Spike-timing ⁇ synaptic plasticity, hereinafter abbreviated as “STDP”
- STDP spike timing synaptic plasticity
- the synaptic connection load of synapse 1 is a feature that changes.
- Several types of STDP have also been observed in actual living nerve cells.
- the STDP is a characteristic in which the synaptic coupling strength w changes as a function of the time difference t POST -t PRE between t PRE and t POST at this time.
- the characteristic shown in FIG. 14B is asymmetric STDP, and the amount of change ⁇ w of the synaptic coupling strength depends on the time difference between the two pulses t POST -t PRE and also on the time order of both pulses.
- the characteristic shown in FIG. 14C is a symmetric STDP, and the amount of change ⁇ w of the synaptic coupling strength is determined by a function of only the time difference t POST ⁇ t PRE between the two pulses, and does not depend on the order of the pulses.
- Patent Document 2 discloses a method of storing a variable resistance value of a variable resistance memory element as a synapse coupling load.
- variable resistance memory element 720 has a structure in which a metal oxide film 722 is sandwiched between an upper electrode 721 and a lower electrode 723.
- a voltage is applied between the upper electrode 721 and the lower electrode 723, the resistance value between the upper electrode 721 and the lower electrode 723 changes to be non-volatile depending on the value of the flowing current.
- FIG. 16A is a block diagram of a conventional STDP neural network circuit element disclosed in Patent Document 2.
- the neural network circuit element is a hardware reproduction of a neuron that is a functional unit of the neural network.
- the neural network circuit element 700 includes a plurality of synapse circuits 710 and one neuron circuit 730.
- the synapse circuit 710 stores the synapse coupling load using the variable resistance memory element 720.
- the learning function is realized by changing the resistance value of the variable resistance memory element 720 by the method described above.
- 16B and 16C are circuit diagrams exemplified in Patent Document 2 regarding a specific configuration of the STDP unit illustrated in FIG. 16A.
- a neural network circuit requires a plurality of input terminals for one neuron circuit. Further, as the number of neural network circuit elements in the entire neural network circuit increases, the number of input terminals required for one neuron circuit increases. The same number of synapse circuits as the number of input terminals is required for one neuron circuit. Therefore, if a neural network circuit composed of a large number of neural network circuit elements is configured, a very large number of synapse circuits are required. For example, in the interconnected neural network shown in FIG. 11B, the number of synapses necessary when the number of neurons is n is the square of n. Therefore, in order to reduce the area of the neural network circuit, it is important to simplify the configuration of the synapse circuit.
- a signal to be propagated to the neuron circuit 730 and a signal for updating the synaptic load of the resistance change type memory element 720 by STDP are generated in the synapse circuit 710.
- the waveform is generated by the pulse generation unit and the STDP unit in FIG. 16A. Therefore, a signal generator and an arithmetic circuit as shown in FIGS. 16B and 16C are required in the synapse circuit, and the configuration of the synapse circuit 710 is large.
- the conventional synapse circuit 710 and its driving method have a problem that the area of the synapse circuit 710 becomes extremely large, and a neural network circuit using the synapse circuit 710 has also become large.
- the inventors of the present invention as a learning method and a neural network circuit of a neural network circuit, which can realize a learning operation by STDP with a smaller number of elements after extensive research.
- the inventors have come up with the following aspects.
- the inventors of the present invention generate a non-linear waveform for updating the synaptic load in the synapse circuit 710 in the conventional neural network circuit element 700, which is another neural network input to the synapse circuit 730.
- the signal from the circuit element (herein referred to as another input signal) is caused by the spike pulse itself (input pulse x 1 in FIG. 11).
- the other input signal is a spike pulse
- a spike pulse generated by the same neural network circuit element 700 as the input synapse circuit 710 (herein referred to as its own input signal). Therefore, there is a need to newly generate a non-linear waveform in the synapse circuit 710 using another input signal as a trigger.
- the inventors of the present invention need to convert the output signal itself of the neural network circuit element into a non-linear waveform after the other input signal is received by the synapse circuit of the neural network circuit element.
- the knowledge that it can be lost was obtained.
- a bipolar sawtooth waveform (bipolar sawtooth waveform) or Mexican-hat waveform (mexican-hat waveform) described later is used as the non-linear waveform.
- FIG. 1 shows a block diagram of a neural network circuit element 40 according to an embodiment.
- One neural network circuit element 40 includes at least one input terminal 51, the same number of synapse circuits 20 as the number of input terminals 51, one neuron circuit 30, and one output terminal 52.
- the neural network circuit is configured by connecting a plurality of neural network circuit elements 40 as shown in FIGS. 11A and 11B. Specifically, the output terminal 52 of the neural network circuit element 40 is connected to the input terminal 51 of another neural network circuit element 40.
- the input terminal 51 of the neural network circuit element 40 is connected to the first input terminal 41 of the synapse circuit 20.
- the output terminal 44 of the synapse circuit 20 is connected to the input terminal 45 of the neuron circuit 30.
- the first output terminal 46 of the neuron circuit 30 is connected to the output terminal 52 of the neural network circuit element 40.
- FIG. 1 only one neuron circuit 30 and one synapse circuit 20 are shown for ease of illustration, but actually, a plurality of synapse circuits 20 for one neuron circuit 30 are illustrated. Is connected.
- the neuron circuit 30 includes an integration circuit 31, a waveform generation circuit 32, and a delay circuit 33.
- the input terminal 44 of the neuron circuit 30 is connected to the integration circuit 31.
- the integration circuit 31 calculates the sum of currents flowing from the plurality of synapse circuits 20 connected to the neuron circuit 30. When the calculated value exceeds a predetermined value, a signal (trigger signal) is output to the waveform generation circuit 32.
- the signal generation circuit 32 generates a non-linear waveform pulse voltage V POST1 and a switching pulse voltage V POST2 using the signal from the integration circuit 31 as a trigger.
- the non-linear waveform pulse voltage V POST1 has, for example, the shape illustrated in FIGS. 2A and 2B or a shape obtained by inverting the sign thereof.
- the non-linear waveform pulse voltage shown in FIG. 2A is referred to as a “bipolar sawtooth pulse voltage”.
- a bipolar sawtooth pulse voltage is characterized by the fact that the potential, which is initially 0 volts, decreases to a predetermined negative potential over time, then rises to a predetermined positive potential, and then returns to 0 volts again. is there.
- the non-linear waveform pulse voltage shown in FIG. 2B is referred to as a “Mexican hat type pulse voltage”.
- the potential which is initially 0 volts, decreases to a predetermined negative potential with the passage of time, and then increases to a predetermined positive potential. Thereafter, the potential drops to a predetermined negative value and then returns to 0 volts again.
- the switching pulse voltage V POST2 for example, a square wave pulse voltage shown in FIG. 2C can be used.
- the signal generation circuit 32 generates a digital / analog converter 321 driven by the output signal from the integration circuit 31 as a trigger, and a bipolar sawtooth pulse voltage or Mexican hat pulse voltage. And a digital memory 322 in which the digital waveform data is stored.
- the digital / analog converter 321 reads the digital waveform data from the digital memory 322, converts it into an analog waveform, and outputs it.
- the non-linear waveform pulse voltage V POST1 is output to the first output terminal 45 after a predetermined delay time has elapsed by the delay circuit 32. Since the first output terminal 45 of the neuron circuit 30 is connected to the output terminal 52 of the neural network circuit element 40, the output signal of the delay circuit 33 becomes the output signal of the neural network circuit element 40. This output signal is input as a first input signal voltage (that is, a non-linear waveform pulse voltage VPRE ) to the first input terminal of the synapse circuit in another neural network circuit element (not shown).
- the switching pulse voltage V POST2 is output to the second output terminal 46 of the neuron circuit 30.
- the second output terminal 46 is connected to the second input terminals 42 of all the synapse circuits 20 connected to the neuron circuit 30 and is input as the second input signal voltage 60.
- the synapse circuit 20 includes a first switch 22, a second switch 21, a variable resistance element 10 described later, and a predetermined DC voltage source 23.
- the first input terminal 41 of the synapse circuit 20 is connected to the input terminal 26 of the first switch 22.
- the second input terminal 42 of the synapse circuit 20 is connected to the control terminal 28 of the first switch.
- the output terminal 27 of the first switch 22 is connected to the control electrode 15 of the variable resistance element 10.
- the output terminal 43 of the synapse circuit 20 is connected to the second electrode 14 of the variable resistance element 10.
- the output terminal 43 of the synapse circuit 20 is connected to the input terminal 44 of the neuron circuit 30.
- the first input signal voltage 60 of the synapse circuit 20 is a non-linear waveform pulse voltage V PRE from another neural network circuit element (not shown).
- the second input signal voltage 70 to the second input terminal 42 of the synapse circuit 20 is a switching pulse voltage V POST2 generated by the waveform generation circuit 32 of the neuron circuit 30 in the same neural network circuit element 40.
- the important point in the configuration of the neural network circuit element 40 of the present embodiment is that all the waveform generation is performed by the neuron circuit 30, and the generated nonlinear waveform pulse voltage V POST1 (inputted to the other neural network circuit element 40). And non-linear waveform pulse voltage V PRE ) and switching pulse voltage V POST2 are used to perform processing and learning operation. As a result, the synapse circuit 20 can be simplified.
- variable resistance element 10 shows a schematic cross-sectional view and a circuit symbol of the variable resistance element 10, respectively.
- the variable resistance element 10 includes a semiconductor film 11, a ferroelectric film 12, a first electrode 13, a second electrode 14, and a control electrode 15.
- the Z axis is the normal direction of the ferroelectric film 12.
- the X axis is a direction orthogonal to the Z axis.
- the circuit symbol of the variable resistance element 10 is expressed as shown in FIG. 5B.
- FIG. 1 shows a neural network circuit element 40 in which the variable resistance element 10 is incorporated based on the notation of FIG. 5B.
- An example of the material of the semiconductor film 11 is ZnO, GaN, or InGaZnO.
- Examples of the material of the ferroelectric film 12 are Pb (Zr, Ti) O 3 , Sr (Bi, Ta) O, or Bi 12 TiO 20 .
- Examples of the first electrode 13, the second electrode 14, and the control electrode 15 are a laminate composed of a platinum film and a titanium film.
- the semiconductor film 11, the ferroelectric film 12, and the control electrode 15 are stacked along the Z axis.
- a first electrode 13 and a second electrode 14 are disposed on the front side surface of the semiconductor film 11.
- the variable resistance value of the variable resistance element 10 is a resistance value between the first electrode 13 and the second electrode 14.
- the part of the semiconductor film 11 stacked on the part has a low resistance.
- the part of the semiconductor layer 11 laminated on the part has a high resistance.
- the resistance value between the first electrode 13 and the second electrode 14 is the resistance value of the semiconductor in the region sandwiched between the first electrode 13 and the second electrode 14. Therefore, the resistance value between the first electrode 13 and the second electrode 14 is continuous depending on the proportion of the ferroelectric film 12 stacked below the region having the upward and downward polarization directions. Changes.
- variable resistance element 10 by providing a potential difference between the first electrode 13 and the second electrode 14 and the control electrode 15, the polarization direction of the ferroelectric film 12 is changed, and the first electrode 13 and the second electrode 14 are changed.
- the resistance value between is controlled. For example, when a positive potential difference is provided between both electrodes and the control electrode 15 with respect to the first electrode 13 and the second electrode 14, the direction of the electric field due to polarization of the ferroelectric film 12 is upward (semiconductor film 11 Side).
- the direction of the electric field due to the polarization of the ferroelectric film 12 is easily directed downward (on the control electrode 15 side). Further, as the absolute value of the potential difference to be applied is larger, the amount of change in polarization of the ferroelectric film 12 due to the potential difference is increased. Therefore, when a positive potential difference is provided, the resistance value between the first electrode 13 and the second electrode 14 decreases, and when a negative potential difference is provided, the resistance value between the first electrode 13 and the second electrode 14 increases. However, the change in the resistance value becomes more significant as the absolute value of the applied potential difference is larger.
- the upward direction is the direction in which the semiconductor film 11 is laminated
- the downward direction means the direction in which the control electrode 15 is laminated.
- the first switch 22 is not connected between the control electrode 15 of the variable resistance element 10 and the first input terminal 41 of the synapse circuit 20 by the second input signal voltage 70 of the synapse circuit. Stay in continuity.
- the second switch 21 is configured such that the non-linear waveform pulse voltage V PRE that is the first input signal is input to the synapse circuit 20 while the DC voltage source (first reference voltage source) 23 and the first of the variable resistance element 10 are set.
- the electrode 13 is connected. That is, when the nonlinear waveform pulse voltage V PRE is input to the synapse circuit 20 as the first input signal voltage 60 from another neural network circuit element (not shown), the second switch 21 is caused by the nonlinear waveform pulse voltage V PRE . Opened and closed. For example, the second switch 21 is closed during the HI level period when the nonlinear waveform pulse voltage V PRE is equal to or higher than a predetermined voltage, and is opened during other periods.
- the second electrode 14 of the synapse circuit 20 has the same potential as the ground voltage (second reference voltage supplied from the second reference voltage source, which is different from the first reference voltage).
- variable resistance element 10 has a characteristic that the resistance value between the first electrode 13 and the second electrode 14 is variable as described above.
- the power supply voltage V DD is applied between the first electrode 13 and the second electrode 14 of the variable resistance element 10, and the second voltage of the variable resistance element 10 is supplied from the DC voltage source 23.
- a current proportional to the current conductivity (the reciprocal of the resistance value) of the variable resistance element 10 flows to the electrode 14 and is input to the neuron circuit 30.
- the magnitude of the current input to the neuron circuit 30 is proportional to the synaptic connection load w, and represents PSP (P 1 (t), P 2 (t)) in FIG. Therefore, in the present embodiment, the conductivity (the reciprocal of the resistance value) of the variable resistance element 10 corresponds to the synapse coupling load w.
- Such an input to the neuron circuit 30 is given asynchronously via the synapse circuit 20 from a plurality of other neural network circuit elements.
- the input currents from the plurality of synapse circuits 20 are spatiotemporally added in the integration circuit 31 of the neuron circuit 30. Integrating voltage generated by the space-time addition is regarded as the internal potential V n.
- V n Integrating voltage generated by the space-time addition is regarded as the internal potential V n.
- V n exceeds a predetermined threshold voltage V TH
- the waveform generation circuit 32 generates pulse voltages (V POST1 , V POST2 ).
- the non-linear waveform pulse voltage V POST1 generated by the waveform generation circuit 32 is a synapse circuit of another neural network circuit element circuit (not shown) after a predetermined delay time set by the delay circuit 33 has elapsed.
- the first input signal voltage V PRE is applied to the first input terminal. This delay time corresponds to the transmission delay time t Delay in the neuron model.
- the waveform generation circuit 32 of the neuron circuit 30 generates the switching pulse voltage V POST2 simultaneously with the nonlinear waveform pulse voltage V POST1 .
- the pulse voltage is output so that the time T in indicated by the dotted line in each of FIG. 2A and FIG. 2B or FIG. 2C is the same time.
- the switching pulse voltage V POST2 is supplied to the control terminal 28 of the first switch 22 of the synapse circuit 20 as the second input signal voltage 70.
- the nonlinear waveform pulse voltage V PRE of another neural network circuit element is input to the input terminal 26 of the first switch 22 of the synapse circuit 20 as the first input signal voltage 60.
- the first switch 22 is switched by the switching pulse voltage V POST2 .
- the switching pulse voltage V POST2 is a period having a predetermined time width before and after the intermediate point of the nonlinear waveform pulse voltage V PRE generated in the same neural network circuit element 40 as an intermediate point.
- the voltage level becomes a predetermined voltage level (HI level).
- the synaptic coupling strength of the synapse circuit 20 is updated by the change in the resistance value. “Learning” operation is possible.
- the waveform of the pulse voltage applied to the control electrode 15 of the variable resistance element 10 changes depending on the timing at which the nonlinear waveform pulse voltage V PRE and the switching pulse voltage V POST2 are applied.
- the degree of change in the resistance value of the variable resistance element 10 depends on the magnitude of the applied voltage, that is, the voltage waveform. For this reason, depending on the shape of the generated waveform that changes depending on the timing at which the two pulse voltages are applied, the degree of change in the resistance value also changes.
- the asymmetric STDP shown in FIG. 14B can be realized, and the Mexican hat type shown in FIG. 2B can be realized.
- the symmetric STDP shown in FIG. 14C can be realized.
- FIG. 3 summarizes the operation of the first switch 22 when the non-linear waveform pulse voltage V PRE is the bipolar sawtooth pulse voltage shown in FIG. 2A and the switching pulse voltage V POST2 is the square pulse voltage shown in FIG. 2C. It was.
- the non-linear waveform pulse voltage V PRE is applied to the control electrode 15 of the variable resistance element 10 only when the switching pulse voltage V POST2 is HI.
- a voltage applied to the control electrode 15 by the operation of the first switch 22 is assumed to be V sample .
- the input timing difference t POST2 ⁇ t PRE between the non-linear waveform pulse voltage V PRE and the switching pulse voltage V POST2 changes, the waveform of V sample also changes.
- V sample has a large potential difference change in the positive direction.
- the conductivity increases greatly. Therefore, when the change in the positive direction of V sample increases, the conductivity (reciprocal of the resistance value) increases greatly.
- FIG. 4 shows the operation of the first switch 22 when the nonlinear waveform pulse voltage V PRE is the Mexican hat type pulse voltage shown in FIG. 2B and the switching pulse voltage V POST2 is the square wave pulse voltage shown in FIG. 2C.
- the switching pulse voltage V POST2 is applied at the timing when the potential of the nonlinear waveform pulse voltage V PRE takes a positive value, the change in the potential difference in the positive direction of V sample increases.
- the conductivity increases greatly. Therefore, when the change in the positive direction of V sample increases, the conductivity (reciprocal of the resistance value) increases greatly.
- the switching pulse voltage V POST2 is applied at the timing when the potential of the nonlinear waveform pulse voltage V PRE takes a negative value, the V sample has a large potential difference change in the negative direction.
- the switching pulse voltage (second input signal voltage) V POST2 generated in the same neural network circuit element 40 and other neural network circuit elements.
- a potential difference depending on the timing difference is provided. Due to the potential difference provided in this way, the variable resistance element 10 can modulate the resistance value depending on the input timing difference.
- the non-linear pulse waveform voltage V PRE which is a bipolar sawtooth pulse voltage or Mexican hat pulse voltage input from another neural network circuit element is generated by the neuron circuit 30 in the same neural network circuit element 40. Since the comparison waveform is compared with the switching pulse voltage V POST2 corresponding to the generation timing of the bipolar sawtooth pulse voltage V POST1 , it is not necessary to generate the comparison waveform by the synapse circuit 20 itself, and the area of the synapse circuit 20 is reduced. be able to. Thereby, the circuit area of the neural network circuit element 40 itself can be reduced. Therefore, the learning operation based on the pulse timing can be realized with a smaller number of elements.
- a non-linear pulse waveform voltage V PRE to be compared a bipolar sawtooth pulse voltage waveform having two polarities and being symmetric with respect to a point of 0 volt or a line with a time of 0 volt as a reference A symmetrical hat voltage waveform is used. For this reason, the timing shift between the switching pulse voltage V POST2 that is the second input signal voltage compared with the first input signal voltage V PRE can be easily reflected in the modulation of the resistance value of the variable resistance element 10. .
- the waveforms of the non-linear pulse waveform voltages V PRE and V POST1 are not particularly limited as long as they are each a bipolar sawtooth pulse voltage waveform or a Mexican hat pulse voltage waveform as described above, but may be, for example, a bipolar sawtooth pulse voltage.
- FIG. 2A it is possible to employ a waveform in which the slope of the line segment connecting the apex of each polarity and the point of 0 volt is steeper than the slope of the other part. Due to the steep slope of the region close to the 0 volt point, even if the input timing difference between the first input signal voltage V PRE and the third input signal voltage V POST1 is slight, the change in the potential difference V effect becomes large.
- the sensitivity can be increased with respect to the input timing difference.
- the slope of the line segment connecting the vertices of each polarity is steep, so that the first input signal voltage V PRE and the third input Even when the input timing difference from the signal voltage V POST1 is slight, the change in the potential difference V effect becomes large, so that the sensitivity to the input timing difference can be increased.
- Example 1 (Production of variable resistance element 10)
- An oxide conductive film made of strontium ruthenate (SrRuO 3 ) having a thickness of 30 nm was deposited on a (001) single crystal substrate made of strontium titanate (SrTiO 3 ) by a pulse laser deposition (hereinafter referred to as PLD) method.
- the temperature of the substrate during deposition was 700 ° C.
- the control electrode 15 was formed by photolithography and ion milling.
- a ferroelectric film 12 made of lead zirconate titanate (Pb (Zr, Ti) O 3 ) having a thickness of 450 nm was deposited on the SRO using the PLD method. Thereafter, the temperature of the substrate was lowered to 400 ° C. Next, a semiconductor film 11 made of zinc oxide (ZnO) having a thickness of 30 nm was deposited.
- Pb (Zr, Ti) O 3 lead zirconate titanate
- a laminate composed of a titanium film having a thickness of 5 nm and a platinum film having a thickness of 30 nm was deposited by electron beam evaporation at room temperature. After the deposition, the first electrode 13 and the second electrode 14 were formed by a lift-off method. In this way, the variable resistance element 10 was obtained.
- the synaptic circuit shown in FIG. 6 was configured, and the STDP characteristics of the synaptic circuit using the above-described variable resistance element 10 were evaluated.
- a 0.1 volt DC voltage source was connected to V DD .
- a switch circuit 25 as shown in FIG. 6 was used for the first switch.
- the non-linear waveform pulse voltage V PRE is applied to the control electrode 15 of the variable resistance element 10 only when the switching pulse voltage V POST2 is HI, and the control electrode 15 of the variable resistance element 10 is grounded during other periods. The operation is performed.
- the configuration of the second switch 21 in FIG. 1 is omitted.
- the waveform shown in FIG. 7A is a non-linear waveform pulse voltage V PRE
- the waveform shown in FIG. 7B is a switching pulse voltage V POST2
- the switch circuit 25 is used as the first switch 22 in FIG.
- the switching operation as shown was realized.
- An asymmetric STDP as shown in FIG. 14B was obtained.
- the integrating circuit 31 includes an operational amplifier 53, a capacitor 36, and a resistor 37.
- the capacitance value of the capacitor 36 was 1 picofarad, and the resistance value of the resistor 37 was 1 megohm.
- the integration circuit 31 charges the capacitor 36 using the current input from the synapse circuit 20. This operation, the time integral of the operation result of the current is output as the integral voltage V n.
- the capacitor 36 is disposed between the negative input terminal ( ⁇ ) and the output terminal of the operational amplifier 35.
- the output signal of the operational amplifier 35 returns to the negative input terminal ( ⁇ ) via the resistor 37. As a result, the input to the negative input terminal ( ⁇ ) becomes virtual ground by the feedback function of the operational amplifier 35.
- the constant is determined by the predetermined power supply voltage and the resistance value of the variable resistance element 20 regardless of the number of synapse circuits 20 and the integrated potential of the capacitor 36.
- a current is input to the neuron circuit 30 through each synapse circuit 20.
- a circuit 25 similar to that in FIG. 6 is used as the first switch 22 of the synapse circuit 20 shown in FIG. 8, and a field effect transistor 24 is used as the second switch 21.
- a non-linear waveform pulse voltage V PRE is applied to the gate terminal of the field effect transistor 24.
- the field effect transistor 24 used in this embodiment is turned on when the non-linear waveform pulse voltage V PRE is HI, and is turned off otherwise. Since the on-resistance of the field effect transistor 24 is 1/100 or less of the resistance value of the variable resistance element 10, the resistance value between the DC voltage source 23 and the negative input terminal ( ⁇ ) of the operational amplifier 35 is approximately variable resistance element. Equal to a resistance value of 10. Accordingly, a pulse current flows through the variable resistance element 10 only when the nonlinear waveform pulse voltage V PRE is HI. The magnitude of the pulse current is approximately proportional to the reciprocal (conductivity) of the resistance value of the variable resistance element 10.
- Nonlinear waveform pulse voltage V PRE is evaluated for integral voltage V n after being applied 20 microseconds.
- the waveform shown in FIG. 7A is a non-linear waveform pulse voltage V PRE
- the waveform shown in FIG. 7B is a switching pulse voltage V POST2 .
- the amount of change in the integrated voltage is shown on the left axis of FIG.
- the same amount of change in conductivity as shown in FIG. 7C is plotted for reference.
- the change amount of the integration voltage shows a characteristic corresponding to the change amount of the conductivity, and it is shown that the STDP characteristic of the variable resistance element 10 is also reflected in the integration operation of the integration circuit 31.
- Example 2 Evaluation of synapse circuit 100
- the synapse circuit shown in FIG. 6 was configured, and the STDP characteristics of the synapse circuit using the variable resistance element 10 were evaluated.
- the change amount of the integrated voltage is shown on the right axis of FIG. 10C.
- the change amount of the integration voltage shows a characteristic corresponding to the change amount of the conductivity, and it is shown that the symmetric STDP characteristic of the variable resistance element 10 is also reflected in the integration operation of the integration circuit 31.
- the present invention can be used for load update operation of a neural network circuit.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Neurology (AREA)
- Semiconductor Memories (AREA)
- Feedback Control In General (AREA)
Abstract
パルスタイミングによる学習動作をより少ない数の素子の構成で実現することができるニューラルネットワーク回路の学習方法を提供する。シナプス回路(20)は、可変抵抗素子(10)を具備し、ニューロン回路(30)は、双極性ノコギリ形パルス電圧またはメキシカンハット形パルス電圧(以下、所定のパルス電圧)を発生させる波形発生回路(32)を備え、第1入力信号(他のニューラルネットワーク回路素子(40)の出力信号)が所定のパルス電圧波形を有するように構成され、可変抵抗素子(10)と同じニューラルネットワーク回路素子(40)内で生成された所定のパルス電圧波形の時間的な中間点を中間点とし、その中間点を基準として前後に所定の時間幅を有する期間(以下、入力許容期間)、可変抵抗素子(10)の制御電極(15)に、第1入力信号を入力可能とすることで、入力許容期間に対する第1入力信号の入力タイミングに依存して生じる第1電極(13)と制御電極(15)との間の電位差によって、可変抵抗素子(10)の抵抗値を変化させる。
Description
本発明は、ニューラルネットワーク回路の学習方法に関する。
現在、コンピュータの発展は目覚しく、日常の様々な場面で利用されている。しかし、これまでのコンピュータの処理能力の発展は部品の微細化とアルゴリズムの進化によって達成されたものであり、基本的な情報処理の原理は変化していない。一方で、これらのコンピュータは、その処理方式の特性のため、人が容易に行うことができる動作を非常に不得意としている。例えば、リアルタイムでの顔認識や、空間構造の把握などが挙げられる。こういった処理能力は、最新のアルゴリズムと最大規模のコンピュータを用いても人間の処理速度に及ばない。
これに対して、生体の脳の情報処理方式を模倣したコンピュータの研究が行われている。この処理モデルの最も基本となるものがニューラルネットワーク(neural network)である。
ニューラルネットワークは生体の神経回路網を模したものである。ここで、生体の神経細胞では、ほぼ一定形状のパルス(スパイクパルス)をやり取りしていることがわかっている。そこで、ニューラルネットワークを実現するニューラルネットワーク回路として、生体の神経回路をより忠実に真似て、パルスを直接扱うモデルが提案されている。例えば、特許文献1には、パルス密度を用いて情報を表現するモデル(パルス密度モデル)が開示されている。このモデルは、例えばある一定時間に伝播されるパルスの数を用いてアナログ情報を表現するモデルである。また、特許文献2にはパルスタイミングを用いて情報を表現するモデル(パルスタイミングモデル)が開示されている。このモデルは、パルスとパルスの時間的間隔とを用いてアナログ情報を表現するモデルである。これらパルス信号を扱うモデルでは、ニューロン(neuron)間でやり取りする信号が一定波形の信号であるため、ハードウェア化が容易であるという利点がある。しかし、特許文献1のようなパルス密度モデルでは密度を抽出する必要があるため、情報を表現するために一定の時間を要する。そのため、ニューロンの細かい時間スケールでの振る舞いを表現することはできないという欠点がある。一方、特許文献2のようなパルスタイミングモデルは、1つ1つのパルスによって情報を表現できるため、パルス密度モデルよりも高速な情報処理が可能である。例えば、非特許文献1には、パルスタイミングモデルを用いることで、パルス密度モデルを用いた場合よりも高い性能が得られることが開示されている。
W. Maass、"Networks of Spiking Neurons: The Third Generation of Neural Network Models、" Neural Networks、 vol. 10、 no. 9、 pp. 1659-1671、 1997.
しかしながら、特許文献2のようなパルスタイミングモデルを実現するニューラルネットワーク回路では、ニューラルネットワーク回路全体の回路面積が大きくなるという課題を有していた。
本発明の目的は、パルスタイミングによる学習動作をより少ない数の素子の構成で実現することができるニューラルネットワーク回路の学習方法およびニューラルネットワーク回路を提供することである。
上記課題を解決するための一の態様に係るニューラルネットワーク回路の学習方法は、複数のニューラルネットワーク回路素子(40)が接続されて構成されるニューラルネットワーク回路の学習方法であって、前記複数のニューラルネットワーク回路素子(40)のそれぞれは、他のニューラルネットワーク回路素子(40)の出力信号(以下、第1入力信号)が入力される少なくとも1つのシナプス回路(20)と、前記少なくとも1つのシナプス回路(20)の出力信号が入力される1つのニューロン回路(30)と、を具備し、前記シナプス回路(20)は、半導体膜(11)上に形成された第1電極(13)および第2電極(14)と、前記半導体膜(11)の主面に強誘電体膜(12)を介して形成された制御電極(15)とを備え、前記第1電極(13)と前記制御電極(15)との間の電位差に応じて前記第1電極(13)と前記第2電極(14)との間の抵抗値が変化する可変抵抗素子(10)を具備し、前記ニューロン回路(30)は、双極性ノコギリ形パルス電圧またはメキシカンハット形パルス電圧(以下、所定のパルス電圧)を発生させる波形発生回路(32)を備え、前記第1入力信号が前記所定のパルス電圧波形を有するように構成され、前記可変抵抗素子(10)と同じニューラルネットワーク回路素子(40)内で生成された前記所定のパルス電圧波形の時間的な中間点を中間点とし、その中間点を基準として前後に所定の時間幅を有する期間(以下、入力許容期間)、前記可変抵抗素子(10)の前記制御電極(15)に、前記第1入力信号を入力可能とすることで、前記入力許容期間に対する前記第1入力信号の入力タイミングに依存して生じる前記第1電極(13)と前記制御電極(15)との間の電位差によって、前記可変抵抗素子(10)の抵抗値を変化させるものである。
本発明の上記目的、他の目的、特徴、及び利点は、添付図面参照の下、以下の好適な実施態様の詳細な説明から明らかにされる。
本発明によれば、パルスタイミングによる学習動作をより少ない数の素子の構成で実現することができる。
[ニューラルネットワークの説明]
まず、本発明の実施の形態の前提となるニューラルネットワークおよびこれを実現するための従来におけるニューラルネットワーク回路の課題についてより詳しく説明する。ニューラルネットワークは生体の神経回路網を模したものである。ニューラルネットワークは、神経回路網における機能単位である神経細胞を模したニューロンを機能単位とし、複数のニューロンをネットワーク状に配置して情報処理を行う。例えば、図11Aに示すようにニューロン100を階層状に接続した階層型ニューラルネットワークや、図11Bに示すようにニューロン100同士を相互に接続した相互結合型ニューラルネットワーク(ホップフィールドネットワーク)がある。
まず、本発明の実施の形態の前提となるニューラルネットワークおよびこれを実現するための従来におけるニューラルネットワーク回路の課題についてより詳しく説明する。ニューラルネットワークは生体の神経回路網を模したものである。ニューラルネットワークは、神経回路網における機能単位である神経細胞を模したニューロンを機能単位とし、複数のニューロンをネットワーク状に配置して情報処理を行う。例えば、図11Aに示すようにニューロン100を階層状に接続した階層型ニューラルネットワークや、図11Bに示すようにニューロン100同士を相互に接続した相互結合型ニューラルネットワーク(ホップフィールドネットワーク)がある。
ニューラルネットワークは、大きく2つの機能を有する。1つ目は、入力から出力を得る「処理」機能であり、2つ目は、ニューラルネットワーク全体の入出力の関係を所望のものに設定する「学習」機能である。
[処理機能]
ここでは階層型ニューラルネットワーク回路を例に、情報処理の動作について説明する。図11Aに示した階層型ニューラルネットワークは、入力層400、中間層500、出力層600の3つの層を備えている。各層には少なくとも1つのニューロン100が含まれる。入力層400は中間層500の各ニューロン100と接続され、同様に、中間層500の各ニューロン100は出力層の各ニューロン100と接続されている。入力信号200は入力層400へ入力され、中間層500、出力層600と順に伝播し、出力層600から出力される。ニューロン100では、入力値に対して後述する所定の演算が行われ、その出力値を次の層のニューロンへ伝播する。従って、出力層600からの出力値が、ネットワークの最終出力300となる。この一連の動作がニューラルネットワークの情報処理であり、中間層500に含まれるニューロンを十分多くとると、任意の入出力が実現される。図11Aに示した階層型ニューラルネットワークは3つの層を備えているが、中間層500を複数備えることもできる。
ここでは階層型ニューラルネットワーク回路を例に、情報処理の動作について説明する。図11Aに示した階層型ニューラルネットワークは、入力層400、中間層500、出力層600の3つの層を備えている。各層には少なくとも1つのニューロン100が含まれる。入力層400は中間層500の各ニューロン100と接続され、同様に、中間層500の各ニューロン100は出力層の各ニューロン100と接続されている。入力信号200は入力層400へ入力され、中間層500、出力層600と順に伝播し、出力層600から出力される。ニューロン100では、入力値に対して後述する所定の演算が行われ、その出力値を次の層のニューロンへ伝播する。従って、出力層600からの出力値が、ネットワークの最終出力300となる。この一連の動作がニューラルネットワークの情報処理であり、中間層500に含まれるニューロンを十分多くとると、任意の入出力が実現される。図11Aに示した階層型ニューラルネットワークは3つの層を備えているが、中間層500を複数備えることもできる。
続いて、ニューラルネットワークの構成単位であるニューロンについて説明する。図12は、ニューロンの模式図である。ニューロン100は、シナプス(synapse)部121、122とニューロン部130を備えている。なお、シナプス部の数は前段に接続されたニューロンの数、つまり入力信号の数に等しい。シナプス部121、122は外部からの複数の入力信号111、112それぞれに対して重み付けを行う。重み付けの値(w1、w2)を結合荷重と呼ぶ。ニューロン部130は、シナプス部によって重み付けされた入力信号の和を計算し、和の値を非線形演算した値を出力する。ここで、外部からの入力信号をそれぞれxi(1、2、・・・、n)と表すとする。nは入力信号の数に等しい。式1に示すように、シナプス部は各入力信号に対して、対応する結合荷重の値wi(1、2、・・・、n)を乗算し、ニューロン部はそれらの和Vnを計算する。
Vn=Σwixi (式1)
ここで、Σはiについての和記号である。
ここで、Σはiについての和記号である。
さらにニューロン部は、求めた和Vnに対して非線形演算fを行った結果を出力値yとする。従ってニューロンの出力yは式2のように表される。
y=f(Vn) (式2)
非線形関数fには、飽和特性を持つ単調増加関数が用いられる。例えば、ステップ関数(階段関数)やシグモイド関数(sigmoid function)が用いられることが多い。
非線形関数fには、飽和特性を持つ単調増加関数が用いられる。例えば、ステップ関数(階段関数)やシグモイド関数(sigmoid function)が用いられることが多い。
ニューラルネットワークは、複数のニューロンが同時に演算を行うことができるため、並列処理性を持つ。つまり、従来型コンピュータの逐次情報処理とは異なり、並列情報処理が可能であることが特長である。
[学習機能]
ニューラルネットワークの重要な特徴は、上述したように入力から出力を得る「処理」機能だけでなく、「学習」機能を備えている点である。ここで述べる学習とは、上述したシナプスの結合荷重を更新することで、ニューラルネットワーク全体の入出力の関係を所望のものに設定することである。
ニューラルネットワークの重要な特徴は、上述したように入力から出力を得る「処理」機能だけでなく、「学習」機能を備えている点である。ここで述べる学習とは、上述したシナプスの結合荷重を更新することで、ニューラルネットワーク全体の入出力の関係を所望のものに設定することである。
[パルスニューロンモデル]
ここまでニューラルネットワークの処理機能と学習機能について詳述してきた。これまでの説明に用いたモデルにおいては、ニューロン間で伝播する信号は、電流や電位の値をアナログ値で表現したものであった。これに対して、生体の神経細胞では、ほぼ一定形状のパルス(スパイクパルス)をやり取りしていることがわかっている。そこで、生体の神経回路をより忠実に真似て、パルスを直接扱うモデルが提案されている。例えば、特許文献1には、パルス密度を用いて情報を表現するモデル(パルス密度モデル)が開示されている。このモデルは、例えばある一定時間に伝播されるパルスの数を用いてアナログ情報を表現するモデルである。また、特許文献2にはパルスタイミングを用いて情報を表現するモデル(パルスタイミングモデル)が開示されている。このモデルは、パルスとパルスの時間的間隔を用いてアナログ情報を表現するモデルである。これらパルス信号を扱うモデルでは、ニューロン間でやり取りする信号が一定波形の信号であるため、後述するハードウェア化が容易であるという利点がある。しかし、パルス密度モデルでは密度を抽出する必要があるため、情報を表現するために一定の時間を要する。そのためニューロンの細かい時間スケールでの振る舞いを表現することはできないという欠点がある。一方、パルスタイミングモデルは、1つ1つのパルスによって情報を表現できるため、パルス密度モデルよりも高速な情報処理が可能である。例えば、非特許文献1には、パルスタイミングモデルを用いることで、パルス密度モデルを用いた場合よりも高い性能が得られることが開示されている。
ここまでニューラルネットワークの処理機能と学習機能について詳述してきた。これまでの説明に用いたモデルにおいては、ニューロン間で伝播する信号は、電流や電位の値をアナログ値で表現したものであった。これに対して、生体の神経細胞では、ほぼ一定形状のパルス(スパイクパルス)をやり取りしていることがわかっている。そこで、生体の神経回路をより忠実に真似て、パルスを直接扱うモデルが提案されている。例えば、特許文献1には、パルス密度を用いて情報を表現するモデル(パルス密度モデル)が開示されている。このモデルは、例えばある一定時間に伝播されるパルスの数を用いてアナログ情報を表現するモデルである。また、特許文献2にはパルスタイミングを用いて情報を表現するモデル(パルスタイミングモデル)が開示されている。このモデルは、パルスとパルスの時間的間隔を用いてアナログ情報を表現するモデルである。これらパルス信号を扱うモデルでは、ニューロン間でやり取りする信号が一定波形の信号であるため、後述するハードウェア化が容易であるという利点がある。しかし、パルス密度モデルでは密度を抽出する必要があるため、情報を表現するために一定の時間を要する。そのためニューロンの細かい時間スケールでの振る舞いを表現することはできないという欠点がある。一方、パルスタイミングモデルは、1つ1つのパルスによって情報を表現できるため、パルス密度モデルよりも高速な情報処理が可能である。例えば、非特許文献1には、パルスタイミングモデルを用いることで、パルス密度モデルを用いた場合よりも高い性能が得られることが開示されている。
上述のような、パルスを用いた情報表現に適用できるニューロンの動作モデルとして、積分発火モデルが提案されている。ここでは、2つの入力端子を有するニューロンの積分発火動作について、図13を用いて説明する。
図13に示すように、外部もしくは他のニューロンから、シナプス1に入力パルスx1が入力され、シナプス2に入力パルスx2が入力されると、パルスが入力されたタイミングで、それぞれのシナプス部において単峰性の電圧変化が現れる。このようなシナプス部の電位をシナプス後電位(Post-synaptic potential、以下、「PSP」と略記する)と呼ぶ。図13にシナプス1およびシナプス2でのPSPの時間変化P1(t)とP2(t)を示す。PSPの高さはシナプス結合強度に比例する。ここでtは時間を表す。
ニューロンは、接続しているすべてのシナプスからのPSPの総和を演算する。これを、ニューロンの内部電位Vn(t)と呼ぶ。ニューロンへの入力端子が2つの場合、図13に示すように、内部電位Vn(t)はP1(t)とP2(t)の和となる。一般的に表すと、内部電位Vn(t)は式3のように表される。
Vn(t)=ΣPi(t) (式3)
ここで、PiはシナプスiでのPSPであり、Σはiについての和記号である。
ここで、PiはシナプスiでのPSPであり、Σはiについての和記号である。
図13に示すように、内部電位Vnがあらかじめ定められた閾値Vthを越えると、そのニューロンはパルス信号yを出力する。これをニューロンの「発火」と呼ぶ。パルス出力yはニューロンから出力され、一定の伝達時間tDelayを経た後に、他のニューロンに入力される。
パルスタイミングによる情報表現を用いる場合、学習動作におけるシナプス結合荷重の更新においてもパルスタイミングを利用することができる。特に、スパイクタイミングシナプス可塑性(Spike-timing dependent synaptic plasticity、以下では「STDP」と略記する)と呼ばれる性質を用いた学習動作が注目を浴びている。STDPとは、あるシナプス1に着目したとき、シナプス1に信号を送るニューロン(前ニューロン)が発火するタイミングと、シナプス1に重み付けされた信号を受け取るニューロン(後ニューロン)が発火するタイミングに依存して、シナプス1のシナプス結合荷重が変化する特徴である。実際の生物の神経細胞においても、いくつかの種類のSTDPが観測されている。
ここで図14Aを用いて、STDPについて説明する。図14Aに示すように、シナプス120に接続された前ニューロンが発火するタイミングをtPREとし、後ニューロン発火するタイミングをtPOSTとする。STDPとは、このときのtPREとtPOSTとの時間差tPOST-tPREを関数として、シナプスの結合強度wが変化する特性のことである。STDPには大きく分けて、2種類のものが知られている。図14Bに示した特性が非対称型STDPであり、シナプス結合強度の変化量Δwが2つのパルスの時間差tPOST-tPREに加えて、両パルスの時間順序にも依存する。図14Cに示した特性が対称型STDPであり、シナプス結合強度の変化量Δwが2つのパルスの時間差tPOST-tPREだけの関数で決まり、パルスの順番に依存しない。
[集積回路化]
ここまででニューラルネットワークの概要について詳述したが、ニューラルネットワークを構成するにあたっては、上述したニューロンの機能をどのようにして実現するかが問題となる。これまで、従来型コンピュータを用い、ソフトウェア処理にてニューロンの機能を実現する手法を用いることが多かった。しかし、この場合、複数のニューロンにおける処理をCPUが時分割で実行することになるため、本来の並列情報処理がなされない。
そのため、ハードウェアを用いてニューロンを構成し集積回路化することが必須である。
ここまででニューラルネットワークの概要について詳述したが、ニューラルネットワークを構成するにあたっては、上述したニューロンの機能をどのようにして実現するかが問題となる。これまで、従来型コンピュータを用い、ソフトウェア処理にてニューロンの機能を実現する手法を用いることが多かった。しかし、この場合、複数のニューロンにおける処理をCPUが時分割で実行することになるため、本来の並列情報処理がなされない。
そのため、ハードウェアを用いてニューロンを構成し集積回路化することが必須である。
上述のように、パルスタイミングによる情報表現に基づくニューラルネットワークは高い性能を実現できることが示唆されている。また、ニューロン間でやり取りする信号が一定波形の信号であるため、ハードウェア化が容易である。そのため、近年ではSTDPを用いた学習機能を実装したニューラルネットワークのハードウェア化、すなわちニューラルネットワーク回路の実現に関する研究が盛んである。STDPを用いた学習機能を含む従来のニューラルネットワーク回路においては、シナプス結合強度をアナログ量として記憶することに適した素子を実現することが最大の課題である。これについて、例えば特許文献2では、可変抵抗型メモリ素子の可変抵抗値をシナプス結合荷重として記憶させる手法が開示されている。図15は特許文献2に開示された可変抵抗型メモリ素子720の断面模式図である。可変抵抗型メモリ素子720は金属酸化膜722を上部電極721と下部電極723で挟んだ構造を有する。上部電極721と下部電極723との間に電圧を印加すると、流した電流値に依存して上部電極721と下部電極723との間の抵抗値が不揮発に変化する素子である。
図16Aは特許文献2に開示された従来のSTDPニューラルネットワーク回路素子のブロック図である。ここで、ニューラルネットワーク回路素子とは、ニューラルネットワークの機能単位であるニューロンをハードウェアで再現したものである。ニューラルネットワーク回路素子700は、複数のシナプス回路710と、1つのニューロン回路730と、を備えている。シナプス回路710は、可変抵抗型メモリ素子720を用いてシナプス結合荷重を記憶している。また、上述した手法で、可変抵抗型メモリ素子720の抵抗値を変更することによって、学習機能を実現している。図16Bおよび図16Cは、図16A中に示されたSTDP部の具体的な構成について、特許文献2に例示された回路図である。
図11Aおよび図11Bからわかるように、ニューラルネットワーク回路を構成するには、1つのニューロン回路に対して複数の入力端子が必要となる。また、ニューラルネットワーク回路全体のニューラルネットワーク回路素子の数が増えるに従って、1つのニューロン回路に対して必要となる入力端子の数は増加する。1つのニューロン回路に対して、入力端子の数と同数のシナプス回路が必要となる。そのため多数のニューラルネットワーク回路素子からなるニューラルネットワーク回路を構成すると、非常に多くのシナプス回路が必要となる。例えば、図11Bに示した相互結合型ニューラルネットワークでは、ニューロンの数をnとしたときに必要なシナプスの数はnの2乗となる。従って、ニューラルネットワーク回路をより小面積化するにはシナプス回路の構成を簡略化することが重要である。
従来のニューラルネットワーク回路素子700では、ニューロン回路730へ伝播させる信号および、STDPによって抵抗変化型メモリ素子720のシナプス荷重を更新するための信号を、シナプス回路710の中で生成している。例えば、図16A中のパルス発生部やSTDP部で波形を生成している。そのため、シナプス回路内に図16Bおよび図16Cに示すような信号発生器や演算回路が必要となり、シナプス回路710の構成が大規模なものとなってしまっていた。
以上の点から、従来のシナプス回路710およびその駆動法では、シナプス回710の面積が極めて大きくなるという課題を有しており、これを用いたニューラルネットワーク回路も大規模になっていた。
上記従来の課題に対して、本発明の発明者らは、鋭意研究の末、STDPによる学習動作をより少ない数の素子の構成で実現することができるニューラルネットワーク回路の学習方法およびニューラルネットワーク回路として、以下のような態様を想到するに至った。
本発明の発明者らは、従来のニューラルネットワーク回路素子700において、シナプス回路710内でシナプス荷重を更新するための非線形波形を生成しているのは、シナプス回路730に入力される他のニューラルネットワーク回路素子からの信号(ここでは他の入力信号と称する)がスパイクパルスそのもの(図11における入力パルスx1)であることに起因するものであることに着目した。つまり、従来の構成においては、他の入力信号がスパイクパルスであることにより、入力された当該シナプス回路710と同じニューラルネットワーク回路素子700で生成されたスパイクパルス(ここでは自己の入力信号と称する)と比較するために、他の入力信号をトリガとして当該シナプス回路710で非線形波形を新たに生じさせる必要性が生じていた。
そこで、本発明の発明者らは、ニューラルネットワーク回路素子の出力信号自体を非線形波形とすることで他の入力信号をニューラルネットワーク回路素子のシナプス回路が受信してから非線形波形に変換する必要性をなくすことができるという知見を得た。さらに、非線形波形同士を比較する際に、入力タイミング差を有効に検出するために、当該非線形波形として、後述する双極性ノコギリ形波形(bipolar sawtooth waveform)またはメキシカンハット形波形(mexican-hat waveform)が好適に採用できるという知見を得るに至った。
以下、本発明の実施の形態によるニューラルネットワーク回路の学習方法を、図面を参照しながら説明する。
(実施の形態)
図1は、実施の形態によるニューラルネットワーク回路素子40のブロック図を示す。1つのニューラルネットワーク回路素子40は少なくとも1つの入力端子51と、入力端子51の数と同数のシナプス回路20と、1つのニューロン回路30と、1つの出力端子52と、を備えている。また、ニューラルネットワーク回路は、図11A、図11Bに示すように、複数のニューラルネットワーク回路素子40が接続されることで構成される。具体的には、ニューラルネットワーク回路素子40の出力端子52は、他のニューラルネットワーク回路素子40の入力端子51に接続される。
図1は、実施の形態によるニューラルネットワーク回路素子40のブロック図を示す。1つのニューラルネットワーク回路素子40は少なくとも1つの入力端子51と、入力端子51の数と同数のシナプス回路20と、1つのニューロン回路30と、1つの出力端子52と、を備えている。また、ニューラルネットワーク回路は、図11A、図11Bに示すように、複数のニューラルネットワーク回路素子40が接続されることで構成される。具体的には、ニューラルネットワーク回路素子40の出力端子52は、他のニューラルネットワーク回路素子40の入力端子51に接続される。
ニューラルネットワーク回路素子40の入力端子51は、シナプス回路20の第1入力端子41に接続されている。シナプス回路20の出力端子44は、ニューロン回路30の入力端子45に接続されている。ニューロン回路30の第1出力端子46は、ニューラルネットワーク回路素子40の出力端子52に接続されている。なお、図1では、図面の見易さのため、1つのニューロン回路30および1つのシナプス回路20のみが記載されているが、実際には、1つのニューロン回路30に対して複数のシナプス回路20が接続される。
ニューロン回路30は、積分回路31と、波形発生回路32と、遅延回路33と、を備える。
ニューロン回路30の入力端子44は、積分回路31に接続されている。積分回路31は、ニューロン回路30に接続されている複数のシナプス回路20から流れ込む電流の和を演算する。そして、演算値が所定の値を超えたときに、波形発生回路32へ信号(トリガ信号)を出力する。
信号発生回路32は、積分回路31からの信号をトリガとして、非線形波形パルス電圧VPOST1およびスイッチングパルス電圧VPOST2を生成する。非線形波形パルス電圧VPOST1は、例えば、図2Aや図2Bに示した形状、またはそれらを符号反転させた形状である。ここで図2Aに示した非線形波形パルス電圧を「双極性ノコギリ形パルス電圧」と呼ぶこととする。双極性ノコギリ形パルス電圧の特徴は、初めは0ボルトである電位が、時間経過と共に所定の負の電位まで低下し、その後、所定の正の電位まで上昇した後に、再び0ボルトに戻ることである。一方、図2Bに示した非線形波形パルス電圧を「メキシカンハット形パルス電圧」と呼ぶこととする。メキシカンハット形パルス電圧の場合は、初めは0ボルトである電位が、時間経過と共に所定の負の電位まで低下した後、所定の正の電位まで上昇する。その後、電位は、所定の負の値まで低下した後、再び0ボルトに戻る。スイッチングパルス電圧VPOST2には、例えば図2Cに示した方形波パルス電圧が用いられ得る。
例えば、信号発生回路32は、図17に示すように、積分回路31からの出力信号をトリガとして駆動するデジタル/アナログコンバータ321と、双極性ノコギリ形パルス電圧またはメキシカンハット形パルス電圧を生成するためのデジタル波形データが記憶されたデジタルメモリ322とを備えている。デジタル/アナログコンバータ321は、積分回路31からの出力信号が入力されると、デジタルメモリ322からデジタル波形データを読み出し、これをアナログ波形に変換して出力する。
非線形波形パルス電圧VPOST1は、遅延回路32によって所定の遅延時間を経過した後、第1出力端子45に出力される。ニューロン回路30の第1出力端子45は、ニューラルネットワーク回路素子40の出力端子52に接続されているので、遅延回路33の出力信号がニューラルネットワーク回路素子40の出力信号となる。そして、この出力信号が他のニューラルネットワーク回路素子(図示省略)におけるシナプス回路の第1入力端子に第1入力信号電圧(すなわち、非線形波形パルス電圧VPRE)として入力されることとなる。スイッチングパルス電圧VPOST2は、ニューロン回路30の第2出力端子46に出力される。第2出力端子46は、ニューロン回路30に接続された、すべてのシナプス回路20の第2入力端子42に接続され、第2入力信号電圧60として入力される。
シナプス回路20は、第1スイッチ22と、第2スイッチ21と、後述する可変抵抗素子10と、所定の直流電圧源23と、を備える。シナプス回路20の第1入力端子41は、第1スイッチ22の入力端子26に接続されている。シナプス回路20の第2入力端子42は、第1スイッチの制御端子28に接続されている。
第1スイッチ22の出力端子27は、可変抵抗素子10の制御電極15に接続されている。シナプス回路20の出力端子43は、可変抵抗素子10の第2電極14に接続されている。シナプス回路20の出力端子43は、ニューロン回路30の入力端子44に接続されている。シナプス回路20の第1入力信号電圧60は、他のニューラルネットワーク回路素子(図示省略)からの非線形波形パルス電圧VPREである。またシナプス回路20の第2入力端子42への第2入力信号電圧70は、同じニューラルネットワーク回路素子40内のニューロン回路30の波形生成回路32が生成したスイッチングパルス電圧VPOST2である。
ここで、本実施の形態のニューラルネットワーク回路素子40の構成において重要な点は、波形生成はすべてニューロン回路30で行い、生成した非線形波形パルス電圧VPOST1(他のニューラルネットワーク回路素子40に入力される非線形波形パルス電圧VPREとなる)とスイッチングパルス電圧VPOST2を用いて処理および学習動作を行うことである。これによってシナプス回路20を簡略化することができる。
次に、可変抵抗素子10について説明する。図5Aおよび図5Bは、それぞれ、可変抵抗素子10の断面模式図および回路記号を示す。可変抵抗素子10は、半導体膜11、強誘電体膜12、第1電極13、第2電極14および制御電極15を具備する。Z軸は強誘電体膜12の法線方向である。X軸はZ軸に直交する方向である。また、可変抵抗素子10の回路記号を図5Bのように表記することとする。図1には、図5Bの表記に基づいて当該可変抵抗素子10が組み込まれたニューラルネットワーク回路素子40が示されている。
半導体膜11の材料の例は、ZnO、GaN、またはInGaZnOである。強誘電体膜12の材料の例は、Pb(Zr、Ti)O3、Sr(Bi,Ta)O、またはBi12TiO20である。第1電極13、第2電極14および制御電極15の例は、白金膜およびチタン膜から構成される積層体である。
半導体膜11、強誘電体膜12および制御電極15はZ軸に沿って積層されている。半導体膜11の表側の面に、第1電極13および第2電極14が配置されている。
次に、本実施の形態における、可変抵抗素子10の可変抵抗値について、図5Aを用いて説明する。可変抵抗素子10の可変抵抗値とは、第1電極13と第2電極14との間の抵抗値である。強誘電体膜12の一部分が上方向の分極方向を有する場合、当該一部分の上に積層している半導体膜11の部分は低い抵抗を有する。一方、強誘電体膜12の一部分が下方向の分極方向を有する場合、当該一部分の上に積層している半導体層11の部分は高い抵抗を有する。このとき、第1電極13と第2電極14との間の抵抗値は、第1電極13と第2電極14とに挟まれた領域の半導体の抵抗値となる。従って、当該領域の下に積層されている強誘電体膜12のうち上方向と下方向の分極方向を有する領域の割合によって、第1電極13と第2電極14との間の抵抗値は連続的に変化する。
次に、本実施の形態による可変抵抗素子10の抵抗値の制御方法について、図5Aを用いて説明する。可変抵抗素子10では、第1電極13および第2電極14と制御電極15との間に電位差を設けることで、強誘電体膜12の分極方向を変化させ、第1電極13と第2電極14との間の抵抗値が制御される。例えば、第1電極13および第2電極14を基準として、両電極と制御電極15との間に正の電位差を設けると、強誘電体膜12の分極による電場の向きが上方向(半導体膜11側)に向きやすくなる。反対に、負の電位差を設けると、強誘電体膜12の分極による電場の向きが下方向(制御電極15側)に向きやすくなる。また、与える電位差の絶対値が大きいほど、電位差による強誘電体膜12の分極の変化量が大きくなる。したがって、正の電位差を設けると第1電極13と第2電極14との間の抵抗値は減少し、負の電位差を設けると第1電極13と第2電極14との間の抵抗値は増加し、それら抵抗値の変化は与えた電位差の絶対値が大きいほど顕著になる。ここで、上方向とは半導体膜11が積層されている方向であり、下方向とは制御電極15が積層されている方向を意味している。
次にニューラルネットワーク回路素子40の動作の詳細について説明する。
まず、処理動作について説明する。
「処理」動作の間は、シナプス回路の第2入力信号電圧70によって、第1スイッチ22は、可変抵抗素子10の制御電極15と、シナプス回路20の第1入力端子41と、の間が非導通である状態を保つ。
また、第2スイッチ21は、第1入力信号である非線形波形パルス電圧VPREがシナプス回路20に入力されている間、直流電圧源(第1基準電圧源)23と可変抵抗素子10の第1電極13とを接続する。すなわち、他のニューラルネットワーク回路素子(図示省略)から、非線形波形パルス電圧VPREが第1入力信号電圧60としてシナプス回路20へ入力されると、その非線形波形パルス電圧VPREによって第2スイッチ21が開閉される。例えば第2スイッチ21は、非線形波形パルス電圧VPREが所定の電圧以上となるHIレベルの期間に閉状態となり、それ以外の期間に開状態となる。また、シナプス回路20の第2電極14は、グランド電圧(第1基準電圧と異なるように、第2基準電圧源から供給される第2基準電圧)と等電位となる。
第2スイッチ21が閉状態になると、直流電圧源23と可変抵抗素子10の第1電極13とが接続される。可変抵抗素子10は、前述したように第1電極13と第2電極14との間の抵抗値が可変する特性を有している。第2スイッチ21が閉状態になることにより、可変抵抗素子10の第1電極13と第2電極14との間に電源電圧VDDが印加され、直流電圧源23から可変抵抗素子10の第2電極14へ、可変抵抗素子10の現時点の伝導率(抵抗値の逆数)に比例した電流が流れ、ニューロン回路30に入力される。ニューロン回路30に入力される電流の大きさは、シナプス結合荷重wに比例しており、図13のPSP(P1(t),P2(t))を表現している。従って、本実施の形態では、可変抵抗素子10の伝導率(抵抗値の逆数)がシナプス結合荷重wに相当することとなる。
このようなニューロン回路30への入力は、複数の他のニューラルネットワーク回路素子からシナプス回路20を介して非同期的に与えられる。これら複数のシナプス回路20からの入力電流が、ニューロン回路30の積分回路31において時空間加算される。時空間加算によって生じる積分電圧は内部電位Vnとみなせる。内部電位Vnが所定の閾値電圧VTHを超えると、波形発生回路32がパルス電圧(VPOST1,VPOST2)を生成する。このうち、波形発生回路32で生成された非線形波形パルス電圧VPOST1は、遅延回路33により設定された所定の遅延時間が経過した後、他のニューラルネットワーク回路素子回路(図示省略)のシナプス回路の第1入力端子へ第1入力信号電圧VPREとして印加される。この遅延時間はニューロンモデルにおける伝達遅延時間tDelayに相当する。
次に、学習動作、特にSTDPを利用した学習動作について説明する。
「学習」動作時には、ニューロン回路30の波形発生回路32は非線形波形パルス電圧VPOST1と同時にスイッチングパルス電圧VPOST2を生成する。例えば、図2Aおよび図2Bまたは図2Cのそれぞれに点線で示される時刻Tinが同じ時刻となるように、パルス電圧を出力する。スイッチングパルス電圧VPOST2は第2入力信号電圧70としてシナプス回路20の第1スイッチ22の制御端子28へ与えられる。また他のニューラルネットワーク回路素子の非線形波形パルス電圧VPREが、第1入力信号電圧60としてシナプス回路20の第1スイッチ22の入力端子26に入力される。シナプス回路20では、スイッチングパルス電圧VPOST2によって、第1スイッチ22を切り替える。スイッチングパルス電圧VPOST2は、同じニューラルネットワーク回路素子40内で生成された非線形波形パルス電圧VPREの時間的な中間点を中間点とし、その中間点を基準として前後に所定の時間幅を有する期間、所定の電圧レベル(HIレベル)となる。
次に、可変抵抗素子10を具備するシナプス回路20において、STDPを実現する方法について、図1を用いて説明する。例えば、スイッチングパルス電圧VPOST2がHIレベルの期間は、第1スイッチ22によって、可変抵抗素子10の制御電極15と、シナプス回路20の第1入力端子41とが接続される場合を考える。すなわち、スイッチングパルス電圧VPOST2がHIレベルの期間、可変抵抗素子10の制御電極15に第1信号電圧VPREが入力可能な入力許容期間となる。この場合、スイッチングパルス電圧VPOST2によって、第1スイッチ22が可変抵抗素子10の制御電極15と第1入力端子41とを導通させている間に、非線形波形パルス電圧VPREが入力されると、その間だけ可変抵抗素子10の制御電極15にパルス電圧が印加される。従って、非線形波形パルス電圧VPREとスイッチングパルス電圧VPOST2が時間的に重なって入力されることで、可変抵抗素子10の制御電極15に有限の電圧が印加される。つまり、第1電極13および第2電極14と制御電極15との間に電位差が設けられるので、この電位差によって可変抵抗素子10の抵抗値が変更される。上述のとおり、本実施の形態においては、可変抵抗素子10の抵抗値の逆数(伝導率)がシナプス結合強度を表わしているので、その抵抗値の変化によりシナプス回路20のシナプス結合強度を更新する「学習」動作が可能となる。
また、非線形波形パルス電圧VPREとスイッチングパルス電圧VPOST2とが印加されるタイミングによって、可変抵抗素子10の制御電極15に印加されるパルス電圧の波形は変化する。上述のように、可変抵抗素子10の抵抗値変化の程度は印加される電圧の大きさ、つまり電圧波形に依存する。このため、2つのパルス電圧が印加されるタイミングによって変化する生成波形の形状に依存して、抵抗値変化の程度も変化する。本実施形態では、図2Aに示した双極性ノコギリ形パルス電圧を非線形波形パルス電圧として用いることで、図14Bに示した非対称型のSTDPを実現することができ、図2Bに示したメキシカンハット形パルス電圧を非線形波形パルス電圧として用いることで、図14Cに示した対称型のSTDPを実現することができる。
非線形波形パルス電圧VPREを図2Aに示す双極性ノコギリ形パルス電圧とし、スイッチングパルス電圧VPOST2を図2Cに示す方形波パルス電圧としたときの、第1スイッチ22の動作について、図3にまとめた。ここでは、スイッチングパルス電圧VPOST2がHIの期間だけ、非線形波形パルス電圧VPREが可変抵抗素子10の制御電極15に印加される場合を考える。第1スイッチ22の動作によって制御電極15に印加される電圧をVsampleとする。非線形波形パルス電圧VPREとスイッチングパルス電圧VPOST2の入力タイミング差tPOST2-tPREが変化すると、Vsampleの波形も変化する。例えばtPOST2-tPRE<0のとき(非線形波形パルス電圧VPREがスイッチングパルス電圧VPOST1より早く入力されるとき)、非線形波形パルス電圧VPREとスイッチングパルス電圧VPOST2が時間的に重なると、Vsampleの負方向の電位差変化が大きくなる。可変抵抗素子10の、第1電極13および第2電極14と、制御電極15との間に設けられる負の電位差が大きくなるほど、伝導率(抵抗値の逆数)が大きく減少する。従って、Vsampleの負方向の変化が大きくなると、伝導率(抵抗値の逆数)が大きく減少する。一方、tPOST2-tPRE>0のとき(非線形波形パルス電圧VPREがスイッチングパルス電圧VPOST1より遅く入力されるとき)は、非線形波形パルス電圧VPREとスイッチングパルス電圧VPOST2が時間的に重なると、Vsampleは、正方向の電位差変化が大きくなる。可変抵抗素子10の、第1電極13および第2電極14と、制御電極15との間に設けられる正の電位差が大きくなるほど、伝導率(抵抗値の逆数)が大きく増加する。従って、Vsampleの正方向の変化が大きくなると、伝導率(抵抗値の逆数)が大きく増加する。
同様に非線形波形パルス電圧VPREを図2Bに示すメキシカンハット形パルス電圧とし、スイッチングパルス電圧VPOST2を図2Cに示す方形波パルス電圧としたときの、第1スイッチ22の動作について、図4にまとめた。ここでも、スイッチングパルス電圧VPOST2がHIの期間(すなわち、前述の入力許容期間)だけ、非線形波形パルス電圧VPREが可変抵抗素子10の制御電極15に印加される場合を考える。非線形波形パルス電圧VPREとスイッチングパルス電圧VPOST2の入力タイミング差tPOST2-tPREが変化すると、Vsampleの波形も変化する。例えば、非線形波形パルス電圧VPREの電位が正の値をとるタイミングに、スイッチングパルス電圧VPOST2が印加されると、Vsampleの正方向の電位差変化が大きくなる。可変抵抗素子10の、第1電極13および第2電極14と、制御電極15との間に設けられる正の電位差が大きくなるほど、伝導率(抵抗値の逆数)が大きく増加する。従って、Vsampleの正方向の変化が大きくなると、伝導率(抵抗値の逆数)が大きく増加する。一方、非線形波形パルス電圧VPREの電位が負の値をとるタイミングに、スイッチングパルス電圧VPOST2が印加されると、Vsampleは、負方向の電位差変化が大きくなる。可変抵抗素子10の、第1電極13および第2電極14と、制御電極15との間に設けられる負の電位差が大きくなるほど、伝導率(抵抗値の逆数)が大きく減少する。従って、Vsampleの負方向の変化が大きくなると、伝導率(抵抗値の逆数)が大きく減少する。
このようにスイッチングパルス電圧VPOST2を用いて第1スイッチ22を切り替えることで、同じニューラルネットワーク回路素子40内で生成されたスイッチングパルス電圧(第2入力信号電圧)VPOST2と他のニューラルネットワーク回路素子から入力された非線形波形パルス電圧(第1入力信号電圧)VPREの入力タイミング差に基づいて、可変抵抗素子10の第1電極13および第2電極14と制御電極15との間に、当該入力タイミング差に依存した電位差が設けられる。このようにして設けられた電位差によって、可変抵抗素子10において入力タイミング差に依存した抵抗値の変調が実現される。
このように、他のニューラルネットワーク回路素子から入力される双極性ノコギリ形パルス電圧またはメキシカンハット形パルス電圧である非線形パルス波形電圧VPREを、同じニューラルネットワーク回路素子40内のニューロン回路30で生成される双極性ノコギリ形パルス電圧VPOST1の生成タイミングに応じたスイッチングパルス電圧VPOST2と比較するため、当該比較用の波形をシナプス回路20自身で生成する必要がなくなり、シナプス回路20の面積を小さくすることができる。これにより、ニューラルネットワーク回路素子40自体の回路面積を小さくすることができる。従って、パルスタイミングによる学習動作をより少ない数の素子の構成で実現することができる。
また、比較対象となる非線形パルス波形電圧VPREとして、2つの極性を有し、0ボルトの地点を基準として点対称となるような双極性ノコギリ形パルス電圧波形または0ボルトの時間を基準として線対称となるようなメキシカンハット形パルス電圧波形を用いている。このため、第1入力信号電圧VPREと比較される第2入力信号電圧であるスイッチングパルス電圧VPOST2との間のタイミングずれを容易に可変抵抗素子10の抵抗値の変調に反映させることができる。
非線形パルス波形電圧VPRE,VPOST1の波形は、それぞれ上記のような双極性ノコギリ形パルス電圧波形またはメキシカンハット形パルス電圧波形である限り特に限定されないが、例えば、双極性ノコギリ形パルス電圧であれば、図2Aに示すように、各極性の頂点と0ボルトの地点との間を結ぶ線分の傾きが他の部分の傾きより急峻であるような波形が採用可能である。0ボルトの地点に近い領域の傾きが急峻であることにより、第1入力信号電圧VPREと第3入力信号電圧VPOST1との入力タイミング差がわずかである場合でも電位差Veffectの変化が大きくなるため、入力タイミング差に対して感度を高めることができる。同様に、メキシカンハット形パルス電圧であれば、図2Bに示すように、各極性の頂点同士の間を結ぶ線分の傾きが急峻であることにより、第1入力信号電圧VPREと第3入力信号電圧VPOST1との入力タイミング差がわずかである場合でも電位差Veffectの変化が大きくなるため、入力タイミング差に対して感度を高めることができる。
なお、本実施の形態では、非線形波形パルス電圧VPREを用いて、シナプス回路20の第2スイッチ21を開閉したが、例えば非線形波形パルス電圧VPREが入力されている間、所定の電圧となるような方形波パルス電圧を用いて第2スイッチ21を開閉してもよい。
(実施例)
以下の実施例を参照しながら本発明をより詳細に説明する。
以下の実施例を参照しながら本発明をより詳細に説明する。
(実施例1)
(可変抵抗素子10の作製)
厚さ30nmのルテニウム酸ストロンチウム(SrRuO3)からなる酸化物導電膜を、チタン酸ストロンチウム(SrTiO3)からなる(001)単結晶基板上に、パルスレーザデポジション(以下PLD)法によって堆積した。堆積時の基板の温度は700℃であった。堆積後、フォトリソグラフィおよびイオンミリング法によって制御電極15を形成した。
(可変抵抗素子10の作製)
厚さ30nmのルテニウム酸ストロンチウム(SrRuO3)からなる酸化物導電膜を、チタン酸ストロンチウム(SrTiO3)からなる(001)単結晶基板上に、パルスレーザデポジション(以下PLD)法によって堆積した。堆積時の基板の温度は700℃であった。堆積後、フォトリソグラフィおよびイオンミリング法によって制御電極15を形成した。
基板の温度が700℃である状態で、PLD法を用いてSRO上に厚さ450nmのジルコニウム酸チタン酸鉛(Pb(Zr,Ti)O3)からなる強誘電体膜12を堆積した。その後、基板の温度を400℃まで下げた。次いで、厚さ30nmの酸化亜鉛(ZnO)からなる半導体膜11を堆積した。
半導体膜11上にパターニングされたレジストを形成した後、厚さ5nmのチタン膜と、厚さ30nmの白金膜から構成される積層体を、室温下で電子ビーム蒸着法によって堆積した。堆積後、リフトオフ法によって第1電極13と第2電極14を形成した。このようにして、可変抵抗素子10を得た。
(シナプス回路の評価)
図6に示したシナプス回路を構成し、上述の可変抵抗素子10を用いたシナプス回路のSTDP特性を評価した。VDDには0.1ボルトの直流電圧源を接続した。第1スイッチには図6に示すようなスイッチ回路25を用いた。スイッチ回路25はスイッチングパルス電圧VPOST2がHIの期間だけ、非線形波形パルス電圧VPREが可変抵抗素子10の制御電極15に印加され、それ以外の期間は可変抵抗素子10の制御電極15は接地されるような動作を行う。なお、図6においては図1における第2スイッチ21の構成は省略している。
図6に示したシナプス回路を構成し、上述の可変抵抗素子10を用いたシナプス回路のSTDP特性を評価した。VDDには0.1ボルトの直流電圧源を接続した。第1スイッチには図6に示すようなスイッチ回路25を用いた。スイッチ回路25はスイッチングパルス電圧VPOST2がHIの期間だけ、非線形波形パルス電圧VPREが可変抵抗素子10の制御電極15に印加され、それ以外の期間は可変抵抗素子10の制御電極15は接地されるような動作を行う。なお、図6においては図1における第2スイッチ21の構成は省略している。
本実施例では、図7Aに示す波形を非線形波形パルス電圧VPREとし、図7Bに示す波形をスイッチングパルス電圧VPOST2とし、スイッチ回路25を図1における第1スイッチ22として用いることで図3に示したようなスイッチング動作を実現した。印加する非線形波形パルス電圧VPREおよびスイッチングパルス電圧VPOST2のタイミングを変えながら、両パルス電圧を印加する前後の伝導率(抵抗値の逆数)の変化を測定すると、図7Cに示したように、図14Bのような非対称形のSTDPが得られた。
(積分動作の評価)
次に、図8に示したような、1つのシナプス回路20に積分回路31を接続した回路を作製し、STDPによる可変抵抗素子10の抵抗変化に伴う積分動作の変化について評価した。
次に、図8に示したような、1つのシナプス回路20に積分回路31を接続した回路を作製し、STDPによる可変抵抗素子10の抵抗変化に伴う積分動作の変化について評価した。
積分回路31は、オペアンプ53、キャパシタ36および抵抗37から構成される。キャパシタ36の容量値は1ピコファラッドとし、抵抗37の抵抗値は1メガオームとした。積分回路31は、シナプス回路20から入力される電流を用いてキャパシタ36を充電する。この動作によって、電流の時間積分の演算結果が積分電位Vnとして出力される。またキャパシタ36は、オペアンプ35の負極性入力端子(-)および出力端子間に配置されている。またオペアンプ35の出力信号は抵抗37を介して負極性入力端子(-)に戻る。その結果、オペアンプ35のフィードバック機能により、負極性入力端子(-)への入力が仮想接地となる。
オペアンプ35の負極性入力端子(-)への入力が仮想接地となるため、シナプス回路20の数やキャパシタ36の積分電位に関わらず、所定の電源電圧と可変抵抗素子20の抵抗値によって決まる一定電流が、各シナプス回路20を通して、ニューロン回路30へ入力される。
図8に示すシナプス回路20の第1スイッチ22として図6と同様の回路25を用い、第2スイッチ21として電界効果トランジスタ24を用いた。電界効果トランジスタ24のゲート端子には非線形波形パルス電圧VPREが印加される。本実施例に用いた電界効果トランジスタ24は、非線形波形パルス電圧VPREがHIのときにオンし、それ以外ではオフする。電界効果トランジスタ24のオン抵抗は可変抵抗素子10の抵抗値の100分の1以下であるため、直流電圧源23とオペアンプ35の負極製入力端子(-)の間の抵抗値はおよそ可変抵抗素子10の抵抗値に等しい。したがって、非線形波形パルス電圧VPREがHIの期間だけ、可変抵抗素子10にパルス電流が流れる。パルス電流の大きさはおよそ可変抵抗素子10の抵抗値の逆数(伝導率)に比例する。
ニューロン回路20に入力されたパルス電流は、積分回路31のキャパシタ36を充電するため、時間積分結果が出力Vnとして出力される。非線形波形パルス電圧VPREが印加されて20マイクロ秒後の積分電圧Vnについて評価した。
本実施例では、図7Aに示す波形を非線形波形パルス電圧VPREとし、図7Bに示す波形をスイッチングパルス電圧VPOST2とした。印加する非線形波形パルス電圧およびスイッチングパルス電圧のタイミングを変えながら、両パルス電圧を印加する前後の積分電圧Vnの変化を測定した。図9の左軸に積分電圧の変化量を示す。図9の右軸には、参考のため、図7Cに示した伝導率の変化量と同じものをプロットした。積分電圧の変化量は、伝導率の変化量に対応した特性を示し、可変抵抗素子10のSTDP特性が積分回路31の積分動作にも反映されていることが示された。
(実施例2)
(シナプス回路100の評価)
実施例1と同様に、図6に示したシナプス回路を構成し、可変抵抗素子10を用いたシナプス回路のSTDP特性を評価した。
(シナプス回路100の評価)
実施例1と同様に、図6に示したシナプス回路を構成し、可変抵抗素子10を用いたシナプス回路のSTDP特性を評価した。
図10Aに示す波形を非線形波形パルス電圧VPREとし、図10Bに示す波形をスイッチングパルス電圧VPOST2として印加する前後の伝導率(抵抗値の逆数)の変化を測定した。図10Cの左軸に示すように、図14Cのような対称形のSTDP特性が得られた。
(積分動作の評価)
次に、実施例1と同様に、図8に示したような、1つのシナプス回路20に積分回路31を接続した回路を作製し、STDPによる可変抵抗素子10の抵抗変化に伴う積分動作の変化について、非線形波形パルス電圧VPREが印加されて20マイクロ秒後の積分電圧Vnから評価した。
次に、実施例1と同様に、図8に示したような、1つのシナプス回路20に積分回路31を接続した回路を作製し、STDPによる可変抵抗素子10の抵抗変化に伴う積分動作の変化について、非線形波形パルス電圧VPREが印加されて20マイクロ秒後の積分電圧Vnから評価した。
図10Cの右軸に積分電圧の変化量を示す。積分電圧の変化量は、伝導率の変化量に対応した特性を示し、可変抵抗素子10の対称形STDP特性が積分回路31の積分動作にも反映されていることが示された。
上記説明から、当業者にとっては、本発明の多くの改良や他の実施形態が明らかである。従って、上記説明は、例示としてのみ解釈されるべきであり、本発明を実行する最良の態様を当業者に教示する目的で提供されたものである。本発明の精神を逸脱することなく、その構造及び/又は機能の詳細を実質的に変更できる。
本発明は、ニューラルネットワーク回路の荷重更新動作に用いられ得る。
10 可変抵抗素子
11 半導体膜
12 強誘電体膜
13 第1電極
14 第2電極
15 制御電極
20 シナプス回路
21 第2スイッチ
22 第1スイッチ
23 直流電圧源(第1基準電圧源)
30 ニューロン回路
31 積分回路
32 波形発生回路
33 遅延回路
40 ニューラルネットワーク回路素子
54 グランド電圧源(第2基準電圧源)
321 デジタル/アナログコンバータ
322 デジタルメモリ
11 半導体膜
12 強誘電体膜
13 第1電極
14 第2電極
15 制御電極
20 シナプス回路
21 第2スイッチ
22 第1スイッチ
23 直流電圧源(第1基準電圧源)
30 ニューロン回路
31 積分回路
32 波形発生回路
33 遅延回路
40 ニューラルネットワーク回路素子
54 グランド電圧源(第2基準電圧源)
321 デジタル/アナログコンバータ
322 デジタルメモリ
Claims (5)
- 複数のニューラルネットワーク回路素子(40)が接続されて構成されるニューラルネットワーク回路の学習方法であって、
前記複数のニューラルネットワーク回路素子(40)のそれぞれは、
他のニューラルネットワーク回路素子(40)の出力信号(以下、第1入力信号)が入力される少なくとも1つのシナプス回路(20)と、
前記少なくとも1つのシナプス回路(20)の出力信号が入力される1つのニューロン回路(30)と、を具備し、
前記シナプス回路(20)は、
半導体膜(11)上に形成された第1電極(13)および第2電極(14)と、前記半導体膜(11)の主面に強誘電体膜(12)を介して形成された制御電極(15)とを備え、前記第1電極(13)と前記制御電極(15)との間の電位差に応じて前記第1電極(13)と前記第2電極(14)との間の抵抗値が変化する可変抵抗素子(10)を具備し、
前記ニューロン回路(30)は、双極性ノコギリ形パルス電圧またはメキシカンハット形パルス電圧(以下、所定のパルス電圧)を発生させる波形発生回路(32)を備え、前記第1入力信号が前記所定のパルス電圧波形を有するように構成され、
前記可変抵抗素子(10)と同じニューラルネットワーク回路素子(40)内で生成された前記所定のパルス電圧波形の時間的な中間点を中間点とし、その中間点を基準として前後に所定の時間幅を有する期間(以下、入力許容期間)、前記可変抵抗素子(10)の前記制御電極(15)に、前記第1入力信号を入力可能とすることで、前記入力許容期間に対する前記第1入力信号の入力タイミングに依存して生じる前記第1電極(13)と前記制御電極(15)との間の電位差によって、前記可変抵抗素子(10)の抵抗値を変化させる、ニューラルネットワーク回路の学習方法。 - 前記シナプス回路(20)は、入力された前記第1入力信号を前記可変抵抗素子(10)の前記制御電極(15)に入力可能とするか否かを切り替える第1スイッチ(22)を備え、
前記ニューロン回路(30)は、前記第1スイッチ(22)を、前記入力許容期間、前記第1入力信号が前記制御電極(15)に入力可能な状態となるように切り替えるための第2入力信号を生成するよう構成される、請求項1に記載のニューラルネットワーク回路の学習方法。 - 前記ニューロン回路(30)は、
前記少なくとも1つのシナプス回路(20)の前記可変抵抗素子(10)を流れる電流値を積分する積分回路(31)と、
前記波形発生回路(32)で発生させた前記双極性ノコギリ形パルス電圧を所定時間遅延させて前記ニューラルネットワーク回路素子(40)の出力信号として出力する遅延回路(33)と、を具備し、
前記波形発生回路(32)は、前記積分回路(31)で積分された電流値に応じた前記所定のパルス電圧を発生させる、請求項1に記載のニューラルネットワーク回路の学習方法。 - 前記シナプス回路(20)は、一端が第1基準電圧源(23)に接続され、他端が前記可変抵抗素子(10)の前記第1電極(13)に接続される第2スイッチ(21)を備え、
前記第2スイッチ(21)は、前記第1入力信号が入力されている間、前記第1基準電圧源(23)と前記第1電極(13)とを接続するように構成される、請求項1に記載のニューラルネットワーク回路の学習方法。 - 複数のニューラルネットワーク回路素子(40)が接続されて構成されるニューラルネットワーク回路であって、
前記複数のニューラルネットワーク回路素子(40)のそれぞれは、
他のニューラルネットワーク回路素子(40)の出力信号(以下、第1入力信号)が入力される少なくとも1つのシナプス回路(20)と、
前記少なくとも1つのシナプス回路(20)の出力信号が入力される1つのニューロン回路(30)と、を具備し、
前記シナプス回路(20)は、半導体膜(11)上に形成された第1電極(13)および第2電極(14)と、前記半導体膜(11)の主面に強誘電体膜(12)を介して形成された制御電極(15)とを備え、前記第1電極(13)と前記制御電極(15)との間の電位差に応じて前記第1電極(13)と前記第2電極(14)との間の抵抗値が変化する可変抵抗素子(10)を具備し、
前記ニューロン回路(30)は、双極性ノコギリ形パルス電圧またはメキシカンハット形パルス電圧(以下、所定のパルス電圧)を生成する波形発生回路(32)を備え、前記第1入力信号が前記所定のパルス電圧波形を有するように構成され、
前記可変抵抗素子(10)と同じニューラルネットワーク回路素子(40)内で生成された前記所定のパルス電圧波形の時間的な中間点を中間点とし、その中間点を基準として前後に所定の時間幅を有する期間(以下、入力許容期間)、前記可変抵抗素子(10)の前記制御電極(15)に、前記第1入力信号を入力可能とすることで、前記入力許容期間に対する前記第1入力信号の入力タイミングに依存して生じる前記第1電極(13)と前記制御電極(15)との間の電位差によって、前記可変抵抗素子(10)の抵抗値を変化させる、ニューラルネットワーク回路。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012800152802A CN103460220A (zh) | 2012-01-23 | 2012-05-29 | 神经网络电路的学习方法 |
JP2013513467A JP5289647B1 (ja) | 2012-01-23 | 2012-05-29 | ニューラルネットワーク回路の学習方法 |
US13/951,448 US8965821B2 (en) | 2012-01-23 | 2013-07-25 | Learning method of neural network circuit |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012010657 | 2012-01-23 | ||
JP2012-010657 | 2012-01-23 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US13/951,448 Continuation US8965821B2 (en) | 2012-01-23 | 2013-07-25 | Learning method of neural network circuit |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2013111200A1 true WO2013111200A1 (ja) | 2013-08-01 |
Family
ID=48872979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2012/003492 WO2013111200A1 (ja) | 2012-01-23 | 2012-05-29 | ニューラルネットワーク回路の学習方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8965821B2 (ja) |
JP (1) | JP5289647B1 (ja) |
CN (1) | CN103460220A (ja) |
WO (1) | WO2013111200A1 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9792547B2 (en) | 2014-03-18 | 2017-10-17 | Panasonic Intellectual Property Management Co., Ltd. | Neural network circuit and learning method for neural network circuit |
CN110766130A (zh) * | 2018-07-28 | 2020-02-07 | 华中科技大学 | 一种bp神经网络学习电路 |
JP6841393B1 (ja) * | 2020-02-27 | 2021-03-10 | Tdk株式会社 | 演算回路及びニューロモーフィックデバイス |
WO2021066100A1 (ja) * | 2019-10-02 | 2021-04-08 | 国立大学法人東北大学 | シナプス回路の駆動方法 |
JP6892026B1 (ja) * | 2020-02-27 | 2021-06-23 | Tdk株式会社 | 演算回路、及びニューロモーフィックデバイス |
CN113033793A (zh) * | 2021-03-02 | 2021-06-25 | 常州大学 | 一种双极性脉冲电流激励二维Wilson神经元模型的电路 |
JP2021197191A (ja) * | 2020-06-11 | 2021-12-27 | ウィンボンド エレクトロニクス コーポレーション | 抵抗変化型シナプスアレイ装置 |
WO2023013018A1 (ja) * | 2021-08-06 | 2023-02-09 | 日本電気株式会社 | 演算装置、ニューラルネットワークシステム、ニューロンモデル装置、演算方法およびプログラム |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9015093B1 (en) | 2010-10-26 | 2015-04-21 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
US8775341B1 (en) | 2010-10-26 | 2014-07-08 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
CN103460220A (zh) * | 2012-01-23 | 2013-12-18 | 松下电器产业株式会社 | 神经网络电路的学习方法 |
WO2015001697A1 (ja) | 2013-07-04 | 2015-01-08 | パナソニックIpマネジメント株式会社 | ニューラルネットワーク回路、およびその学習方法 |
US10169701B2 (en) * | 2015-05-26 | 2019-01-01 | International Business Machines Corporation | Neuron peripheral circuits for neuromorphic synaptic memory array based on neuron models |
US10318861B2 (en) * | 2015-06-17 | 2019-06-11 | International Business Machines Corporation | Artificial neuron apparatus |
CN107563497B (zh) * | 2016-01-20 | 2021-03-19 | 中科寒武纪科技股份有限公司 | 用于稀疏人工神经网络的计算装置和运算方法 |
WO2018037335A1 (en) * | 2016-08-26 | 2018-03-01 | Semiconductor Energy Laboratory Co., Ltd. | Display device and electronic device |
KR20180111156A (ko) * | 2017-03-31 | 2018-10-11 | 에스케이하이닉스 주식회사 | 피드-백 라인을 가진 포스트-시냅틱 뉴런을 포함하는 뉴로모픽 소자 및 뉴로모픽 소자의 동작 방법 |
KR20180116842A (ko) | 2017-04-18 | 2018-10-26 | 에스케이하이닉스 주식회사 | 강유전체 트랜지스터를 포함하는 뉴로모픽 소자의 시냅스 시스템 |
CN107194463B (zh) * | 2017-04-20 | 2019-11-22 | 北京大学 | 神经元电路和神经形态电路 |
US11442695B2 (en) * | 2017-12-28 | 2022-09-13 | Tdk Corporation | Product-sum operation device, neuromorphic device, and method for determining malfunction in product-sum operation device |
JP6876281B2 (ja) * | 2017-12-28 | 2021-05-26 | Tdk株式会社 | 積和演算器、ニューロモーフィックデバイスおよび積和演算器の使用方法 |
JP6569755B1 (ja) * | 2018-03-06 | 2019-09-04 | Tdk株式会社 | ニューラルネットワーク装置、信号生成方法およびプログラム |
WO2020075272A1 (ja) * | 2018-10-11 | 2020-04-16 | Tdk株式会社 | 積和演算器、論理演算デバイス、ニューロモーフィックデバイス及び積和演算方法 |
EP3671750A1 (en) * | 2018-12-21 | 2020-06-24 | IMEC vzw | Synapse circuit with memory |
CN110163365A (zh) * | 2019-05-29 | 2019-08-23 | 北京科易达知识产权服务有限公司 | 一种应用于忆阻器突触阵列的脉冲神经元电路 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007004514A (ja) * | 2005-06-24 | 2007-01-11 | Elpida Memory Inc | 人工神経回路 |
US20080162391A1 (en) * | 2006-12-29 | 2008-07-03 | Neurosciences Research Foundation, Inc. | Solving the distal reward problem through linkage of stdp and dopamine signaling |
JP2009282782A (ja) * | 2008-05-22 | 2009-12-03 | Sharp Corp | 抵抗変化型可変抵抗素子を備えた積演算装置、及び積和演算装置、これらの装置を各ニューロン素子に備えるニューラルネットワーク、並びに積演算方法 |
JP2010146514A (ja) * | 2008-12-22 | 2010-07-01 | Sharp Corp | 情報処理装置及びこれを用いたニューラルネットワーク回路 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0731705B2 (ja) * | 1992-08-24 | 1995-04-10 | 東京工業大学長 | 自己学習型積和演算回路素子及び回路 |
KR0178805B1 (ko) * | 1992-08-27 | 1999-05-15 | 정호선 | 스스로 학습이 가능한 다층 신경회로망 및 학습 방법 |
JPH07114524A (ja) | 1993-10-14 | 1995-05-02 | Ricoh Co Ltd | 信号処理装置 |
US6470328B1 (en) * | 1998-08-07 | 2002-10-22 | Monolith Company, Ltd. | Artificial neuron on the base of B-driven threshold element |
KR20020093585A (ko) * | 2001-06-06 | 2002-12-16 | 마츠시타 덴끼 산교 가부시키가이샤 | 반도체장치 |
US8156057B2 (en) * | 2003-03-27 | 2012-04-10 | Knowm Tech, Llc | Adaptive neural network utilizing nanotechnology-based components |
GB0506253D0 (en) * | 2005-03-29 | 2005-05-04 | Univ Ulster | Electronic synapse device |
JP2009021436A (ja) * | 2007-07-12 | 2009-01-29 | Hitachi Ltd | 半導体装置 |
JP5106031B2 (ja) * | 2007-10-12 | 2012-12-26 | パナソニック株式会社 | 半導体記憶装置及びその製造方法並びに半導体スイッチング装置 |
WO2010082928A1 (en) * | 2009-01-15 | 2010-07-22 | Hewlett-Packard Development Company, L.P. | Silicon-based memristive device |
GB2471535B (en) * | 2010-01-07 | 2012-01-11 | Dna Electronics Ltd | Electrically actuated switch |
JP4852670B1 (ja) * | 2010-05-26 | 2012-01-11 | パナソニック株式会社 | 不揮発スイッチング装置を駆動する方法 |
US8441835B2 (en) * | 2010-06-11 | 2013-05-14 | Crossbar, Inc. | Interface control for improved switching in RRAM |
WO2012029211A1 (ja) * | 2010-09-02 | 2012-03-08 | パナソニック株式会社 | 不揮発性論理回路を駆動する方法 |
CN103493140B (zh) * | 2011-07-15 | 2016-07-06 | 松下知识产权经营株式会社 | 驱动半导体存储装置的方法 |
JP5289646B1 (ja) * | 2012-01-20 | 2013-09-11 | パナソニック株式会社 | ニューラルネットワーク回路の学習方法 |
CN103460220A (zh) * | 2012-01-23 | 2013-12-18 | 松下电器产业株式会社 | 神经网络电路的学习方法 |
US8658476B1 (en) * | 2012-04-20 | 2014-02-25 | Crossbar, Inc. | Low temperature P+ polycrystalline silicon material for non-volatile memory device |
JP5450912B1 (ja) * | 2012-06-04 | 2014-03-26 | パナソニック株式会社 | 不揮発性半導体装置を駆動する方法 |
-
2012
- 2012-05-29 CN CN2012800152802A patent/CN103460220A/zh active Pending
- 2012-05-29 JP JP2013513467A patent/JP5289647B1/ja not_active Expired - Fee Related
- 2012-05-29 WO PCT/JP2012/003492 patent/WO2013111200A1/ja active Application Filing
-
2013
- 2013-07-25 US US13/951,448 patent/US8965821B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007004514A (ja) * | 2005-06-24 | 2007-01-11 | Elpida Memory Inc | 人工神経回路 |
US20080162391A1 (en) * | 2006-12-29 | 2008-07-03 | Neurosciences Research Foundation, Inc. | Solving the distal reward problem through linkage of stdp and dopamine signaling |
JP2009282782A (ja) * | 2008-05-22 | 2009-12-03 | Sharp Corp | 抵抗変化型可変抵抗素子を備えた積演算装置、及び積和演算装置、これらの装置を各ニューロン素子に備えるニューラルネットワーク、並びに積演算方法 |
JP2010146514A (ja) * | 2008-12-22 | 2010-07-01 | Sharp Corp | 情報処理装置及びこれを用いたニューラルネットワーク回路 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9792547B2 (en) | 2014-03-18 | 2017-10-17 | Panasonic Intellectual Property Management Co., Ltd. | Neural network circuit and learning method for neural network circuit |
CN110766130A (zh) * | 2018-07-28 | 2020-02-07 | 华中科技大学 | 一种bp神经网络学习电路 |
CN110766130B (zh) * | 2018-07-28 | 2022-06-14 | 华中科技大学 | 一种bp神经网络学习电路 |
WO2021066100A1 (ja) * | 2019-10-02 | 2021-04-08 | 国立大学法人東北大学 | シナプス回路の駆動方法 |
JP6841393B1 (ja) * | 2020-02-27 | 2021-03-10 | Tdk株式会社 | 演算回路及びニューロモーフィックデバイス |
JP6892026B1 (ja) * | 2020-02-27 | 2021-06-23 | Tdk株式会社 | 演算回路、及びニューロモーフィックデバイス |
WO2021171480A1 (ja) * | 2020-02-27 | 2021-09-02 | Tdk株式会社 | 演算回路及びニューロモーフィックデバイス |
WO2021171454A1 (ja) * | 2020-02-27 | 2021-09-02 | Tdk株式会社 | 演算回路、及びニューロモーフィックデバイス |
JP2021197191A (ja) * | 2020-06-11 | 2021-12-27 | ウィンボンド エレクトロニクス コーポレーション | 抵抗変化型シナプスアレイ装置 |
CN113033793A (zh) * | 2021-03-02 | 2021-06-25 | 常州大学 | 一种双极性脉冲电流激励二维Wilson神经元模型的电路 |
CN113033793B (zh) * | 2021-03-02 | 2023-08-22 | 常州大学 | 一种双极性脉冲电流激励二维Wilson神经元模型的电路 |
WO2023013018A1 (ja) * | 2021-08-06 | 2023-02-09 | 日本電気株式会社 | 演算装置、ニューラルネットワークシステム、ニューロンモデル装置、演算方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20130311414A1 (en) | 2013-11-21 |
US8965821B2 (en) | 2015-02-24 |
CN103460220A (zh) | 2013-12-18 |
JPWO2013111200A1 (ja) | 2015-05-11 |
JP5289647B1 (ja) | 2013-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5289647B1 (ja) | ニューラルネットワーク回路の学習方法 | |
JP5289646B1 (ja) | ニューラルネットワーク回路の学習方法 | |
JP5659361B1 (ja) | ニューラルネットワーク回路、およびその学習方法 | |
JP6501146B2 (ja) | ニューラルネットワーク回路およびその学習方法 | |
JP5155843B2 (ja) | 情報処理装置及びこれを用いたニューラルネットワーク回路 | |
Pershin et al. | Experimental demonstration of associative memory with memristive neural networks | |
KR102230784B1 (ko) | Stdp 동작을 위한 시냅스 회로 및 시냅스 회로를 포함하는 뉴로모픽 시스템 | |
CN110428050B (zh) | 一种基于忆阻器实现多样化stdp学习规则的突触仿生电路 | |
CN111967589A (zh) | 神经元模拟电路及其驱动方法、神经网络装置 | |
Bakhshiev et al. | Mathematical Model of the Impulses Transformation Processes in Natural Neurons for Biologically Inspired Control Systems Development. | |
Kong et al. | Study of recall time of associative memory in a memristive Hopfield neural network | |
Xu et al. | A memristor model with concise window function for spiking brain-inspired computation | |
Donahue et al. | Design and analysis of neuromemristive echo state networks with limited-precision synapses | |
Wang et al. | A memristor-based learning engine for synaptic trace-based online learning | |
Hajiabadi et al. | Memristor-based synaptic plasticity and unsupervised learning of spiking neural networks | |
Siegel et al. | System model of neuromorphic sequence learning on a memristive crossbar array | |
Huang et al. | Adaptive SRM neuron based on NbOx memristive device for neuromorphic computing | |
KR102215067B1 (ko) | Stdp 학습 하드웨어 | |
Mulaosmanovic et al. | FeFETs for neuromorphic systems | |
Vu et al. | Spiking Neural Networks with Nonidealities from Memristive Silicon Oxide Devices | |
Ostrovskii et al. | Studying the dynamics of memristive synapses in spiking neuromorphic systems | |
Liu et al. | Implementation of Multiple-Step Quantized STDP based on Linear Weight Update Memristive Synapses | |
Nguyen et al. | Associative Memory Demonstrated By a Simple Design of Spiking Neural Network with an Ionic Synaptic Transistor | |
Sun et al. | A Memcapacitor Biomimetic Circuit Realizing Classical Conditioning and Fear Learning | |
Wang et al. | Realization of Artificial Neuron with Firing Saturation Based on Single Memristive Device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
ENP | Entry into the national phase |
Ref document number: 2013513467 Country of ref document: JP Kind code of ref document: A |
|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 12866671 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 12866671 Country of ref document: EP Kind code of ref document: A1 |