JP7235129B2 - 変数最適化装置、変数最適化方法、プログラム - Google Patents
変数最適化装置、変数最適化方法、プログラム Download PDFInfo
- Publication number
- JP7235129B2 JP7235129B2 JP2021546129A JP2021546129A JP7235129B2 JP 7235129 B2 JP7235129 B2 JP 7235129B2 JP 2021546129 A JP2021546129 A JP 2021546129A JP 2021546129 A JP2021546129 A JP 2021546129A JP 7235129 B2 JP7235129 B2 JP 7235129B2
- Authority
- JP
- Japan
- Prior art keywords
- variable
- function
- calculates
- update result
- following equation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005457 optimization Methods 0.000 title claims description 34
- 238000000034 method Methods 0.000 title claims description 30
- 230000006870 function Effects 0.000 claims description 138
- 230000009977 dual effect Effects 0.000 claims description 51
- 238000004364 calculation method Methods 0.000 claims description 48
- 239000013598 vector Substances 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 description 27
- 238000012545 processing Methods 0.000 description 21
- 239000011159 matrix material Substances 0.000 description 16
- 238000000354 decomposition reaction Methods 0.000 description 15
- 230000001174 ascending effect Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 238000013461 design Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 238000003860 storage Methods 0.000 description 10
- 230000008030 elimination Effects 0.000 description 7
- 238000003379 elimination reaction Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 4
- 125000004122 cyclic group Chemical group 0.000 description 4
- 238000012886 linear function Methods 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
- G06F17/13—Differential equations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N99/00—Subject matter not provided for in other groups of this subclass
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Operations Research (AREA)
- Computing Systems (AREA)
- Complex Calculations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、変数を最適化する技術に関する。
最適化技術は、画像処理、音声認識、自然言語処理など幅広い分野で利用されている。この最適化技術では、最適化のために、個々の問題に応じて設計されるコスト関数が用いられる。
以下では、コスト関数G(w)=G1(w)+G2(w)(w∈Rn(nは1以上の整数)は最適化対象となる変数、関数G1, G2:Rn→R∪{∞}はいずれも閉真凸関数(以後、閉真凸関数のことを単に凸関数という)である)の最小化問題を考える。
なお、コスト関数Gが3つ以上の項を含んでいる場合であっても、2つの凸関数の和として表現されれば式(1)に還元される。
この最小化問題(凸最適化問題ということもある)の最適解(つまり、最適化により最終的に得られる値)となる不動点wは、コスト関数Gの劣微分が0を含むときに得られる。
ここで、∂は劣微分作用素を表す。また、∂Gi(i=1, 2)は極大単調作用素となる。
なお、関数Giが不連続点を含む場合、その劣微分は集合となる。したがって、式(2)の劣微分(右辺)は多値となり得る。そのため、ここでは等号「=」の代わりに包含記号「∈」を用いる。
《ラグランジュ双対上昇問題》
次式のように、2つの変数{p, q}(p∈Rk, q∈Rm(k, mは1以上の整数))が線形等式により拘束された状況下で、2つの凸コスト関数H1:Rk→R∪{∞}, H2:Rm→R∪{∞}の和を最小化する問題(ラグランジュ双対上昇問題)について考える。
次式のように、2つの変数{p, q}(p∈Rk, q∈Rm(k, mは1以上の整数))が線形等式により拘束された状況下で、2つの凸コスト関数H1:Rk→R∪{∞}, H2:Rm→R∪{∞}の和を最小化する問題(ラグランジュ双対上昇問題)について考える。
ここで、行列A∈Rn×k, B∈Rn×mとベクトルc∈Rn(nは1以上の整数)は事前に与えられる。
ラグランジュ双対上昇問題のような、線形拘束付最小化問題を解くための1つの有用な戦略が、双対問題を解くことである。線形拘束付最小化問題に対して双対問題が存在する場合、双対問題はラグランジュ関数L(p, q, λ)のsup/inf(上界/下界)問題として定義される。
ここで、λ∈Rnは双対変数であり、・Tは転置を表す。また、Hi
*(i=1, 2)はHiの凸共役関数であり、それぞれ次式で与えられる。
λをwと置き換え、∂G1(w)=A∂H1
*(ATw), ∂G2(w)=B∂H2
*(BTw)-cとすれば、式(4)の右辺の問題は、式(2)の不動点を求める問題に帰着することがわかる。
ラグランジュ双対上昇問題の具体例として、全変動ノルムを用いた画像のノイズ除去問題がある。この問題については後述する。
ラグランジュ双対上昇問題などのコスト関数の最小化問題を解く方法として、非特許文献1に記載の方法がある。
K. Niwa and W. B. Kleijn, "Bregman monotone operator splitting", https://arxiv.org/abs/1807.04871, 2018.
非特許文献1に記載の変数更新則を用いてラグランジュ双対上昇問題を解く場合、コスト関数の値を小さくするように、変数を1ステップで更新しにくい(あるいは、更新できない)ことがある。つまり、従来の変数更新則では、場合によっては、最適解への収束に時間がかかるという問題、すなわち、変数の最適化に時間がかかるという問題があった。
そこで本発明では、最適化対象となる変数を高速に最適化する技術を提供することを目的とする。
本発明の一態様は、w∈Rnを最適化対象となる変数、G(w)(=G1(w)+G2(w))を入力データを用いて計算される、変数wを最適化するためのコスト関数(ただし、関数Gi(w):Rn→R∪{∞} (i=1, 2)は閉真凸関数)とし、D:Rn→Rを狭義凸関数(ただし、関数Dは微分可能であり、∇D(0)=0を満たす)、Ri(i=1, 2), Ci(i=1, 2)をそれぞれ次式で定義されるD-リゾルヴェント作用素、D-ケーリー作用素とし、
変数最適化装置が、D-リゾルヴェント作用素Ri(i=1, 2)とD-ケーリー作用素Ci(i=1, 2)を用いて、変数wの値を再帰的に計算する変数更新ステップを含み、-Gi(w) (i=1, 2)を関数Gi(w) (i=1, 2)を近似する強凸関数とし、前記変数更新ステップにおいて∇D(w)を計算する際、D-リゾルヴェント作用素R1とD-ケーリー作用素C1に対しては∇D(w)の計算にT1(w)=∇-G1(w)-∇-G1(0)を用い、D-リゾルヴェント作用素R2とD-ケーリー作用素C2に対しては∇D(w)の計算にT2(w)=∇-G2(w)-∇-G2(0)を用いる。
本発明によれば、最適化対象となる変数を高速に最適化することが可能となる。
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
各実施形態の説明に先立って、この明細書における表記方法について説明する。
_(アンダースコア)は下付き添字を表す。例えば、xy_zはyzがxに対する上付き添字であり、xy_zはyzがxに対する下付き添字であることを表す。
また、ある文字xに対する^xや~xのような上付き添え字の”^”や”~”は、本来”x”の真上に記載されるべきであるが、明細書の記載表記の制約上、^xや~xと記載しているものである。
<技術的背景>
まず、非特許文献1を参照して、式(2)の問題を解く手続きについて詳しく説明する。
まず、非特許文献1を参照して、式(2)の問題を解く手続きについて詳しく説明する。
《1:ブレグマン(Bregman)単調作用素分解に基づく変数更新則》
ここでは、式(2)の問題を解く方法として、ブレグマン単調作用素分解を用いる方法について説明する。この方法は、変数wを含む複数の変数を並列に更新しながら最終的にコスト関数Gを最小化するような不動点を得るための変数更新則である。なお、最適化の対象となる変数のことを主変数ということもある。
ここでは、式(2)の問題を解く方法として、ブレグマン単調作用素分解を用いる方法について説明する。この方法は、変数wを含む複数の変数を並列に更新しながら最終的にコスト関数Gを最小化するような不動点を得るための変数更新則である。なお、最適化の対象となる変数のことを主変数ということもある。
まず、変数更新則を導出する前にいくつかの準備を行う。
(1-1:ブレグマンダイバージェンス)
ブレグマンダイバージェンスは変数空間の計量を修正するために重要な役割を持つ。2つの異なる点{w, z}に対して、ブレグマンダイバージェンスJD(w||z)は次式で定義される。
ブレグマンダイバージェンスは変数空間の計量を修正するために重要な役割を持つ。2つの異なる点{w, z}に対して、ブレグマンダイバージェンスJD(w||z)は次式で定義される。
ここで、∇は微分作用素を表す。ブレグマンダイバージェンスの定義に用いる関数D:Rn→Rとして、任意の微分可能な狭義凸関数を用いることができる。したがって、関数Dは、例えば、非対称関数であっても構わない。
以下では、関数Dを∇D(0)=0を満たすものに限定する。その理由は、不動点に関する条件である式(2)に対して∇Dを適用した、以下の式(6)が成り立つようにするためである。
ここで、・-1は逆作用素、оは2つの作用素の合成を表す。
一般に、関数Dが異なれば、(∇D)-1о∂Giの性質は変わる。このため、∇Dの設計次第で、は変数更新則の収束率は変わることになる。つまり、∇Dは収束率の高速化に大きく影響する。収束率の高速化を図ることができる∇Dの設計については後述する。
(1-2:D-リゾルヴェント作用素とD-ケーリー作用素)
D-リゾルヴェント作用素Ri(i=1, 2)、D-ケーリー作用素Ci(i=1, 2)はそれぞれ式(7)、式(8)で与えられる。
D-リゾルヴェント作用素Ri(i=1, 2)、D-ケーリー作用素Ci(i=1, 2)はそれぞれ式(7)、式(8)で与えられる。
ここで、Iは同一作用素を表す。
なお、関数Dとしてn次元ユークリッド距離関数を用いると、D-リゾルヴェント作用素、D-ケーリー作用素はそれぞれよく知られたリゾルヴェント作用素、ケーリー作用素となる。つまり、D-リゾルヴェント作用素、D-ケーリー作用素は、それぞれリゾルヴェント作用素を一般化した作用素、ケーリー作用素を一般化した作用素となっている。
(1-3:ブレグマン単調作用素分解に基づく変数更新則)
以上の準備にもと、ブレグマン単調作用素分解に基づく変数更新則を導出する。ここでは、Bregman Peaceman-Rachford (B-P-R)型単調作用素分解(B-P-R splitting)に基づくBregman Peaceman-Rachford (B-P-R)型変数更新則と、Bregman Douglas-Rachford (B-D-R)型単調作用素分解(B-D-R splitting)に基づくBregman Douglas-Rachford (B-D-R)型変数更新則について説明する。
以上の準備にもと、ブレグマン単調作用素分解に基づく変数更新則を導出する。ここでは、Bregman Peaceman-Rachford (B-P-R)型単調作用素分解(B-P-R splitting)に基づくBregman Peaceman-Rachford (B-P-R)型変数更新則と、Bregman Douglas-Rachford (B-D-R)型単調作用素分解(B-D-R splitting)に基づくBregman Douglas-Rachford (B-D-R)型変数更新則について説明する。
B-P-R型変数更新則は、(∇D)-1によって変数空間の計量が修正された不動点に関する条件を表す式(6)を変形することにより得られる。
w∈R1(z)を満たす変数wの補助変数zを用いると、補助変数zに関して再帰的なB-P-R型単調作用素分解の式(9)が得られる。
式(9)を用いたB-P-R型変数更新則では、D-ケーリー作用素C1, C2を用いて変数を繰り返し更新していくことで、不動点が得られる。
D-リゾルヴェント作用素R1, R2及び補助変数x, y, z∈Rnを用いて、式(9)を簡単な変数更新則(B-P-R型変数更新則)に分解すると、式(10)~式(13)が得られる。
ここで、tは更新回数を表すインデックスである。
式(10)を変形すると、式(14)が得られる。
変数wの最小値が存在する場合、式(14)の積分形は式(15)で表される。
この式(15)は、ブレグマンダイバージェンスを用いて罰則項が一般化されたことを示している。
同様の議論により、式(12)から次式が得られる。
まとめると、B-P-R型単調作用素分解に基づくB-P-R型変数更新則は以下のようになる。
次に、B-D-R型変数更新則について説明する。B-D-R型単調作用素分解は、式(9)に平均化作用素を適用した、式(16)として得られる。
ここで、α∈(0, 1)である。
上記議論と同様の議論により、以下のB-D-R型単調作用素分解に基づくB-D-R型変数更新則が得られる。
以上、B-P-R型変数更新則とB-D-R型変数更新則について、それぞれアルゴリズムとしてまとめると図1のようになる。図1は、B-P-R型変数更新アルゴリズム、B-D-R型変数更新アルゴリズムが変数wとその補助変数x, y, zの更新則として実現されることを示している。
《2:収束率高速化のための条件》
B-P-R型単調作用素分解、B-D-R型単調作用素分解の収束率を算出することにより、収束率高速化のための条件を導出する。これにより、高速化を実現する∇Dの設計条件を考察することが可能となる。
B-P-R型単調作用素分解、B-D-R型単調作用素分解の収束率を算出することにより、収束率高速化のための条件を導出する。これにより、高速化を実現する∇Dの設計条件を考察することが可能となる。
2つの異なる点{w, z}を用いて、劣微分∂Giの単調性が式(17)により表されるものと仮定する。
ここで、{ρLB,i, ρUB,i}∈[0, ∞]である。一般に、{ρLB,i, ρUB,i}は関数Giによって変わる。例えば、関数Giが強凸かつリプリッツ平滑である場合、{ρLB,i, ρUB,i}∈(0, ∞)となる。
そして、計量修正作用素(∇D)-1を適用することにより、式(17)の単調性が式(18)により表されるようになると仮定する。
ここで、{σLB,i, σUB,i}∈[0, ∞]である。一般に、{σLB,i, σUB,i}は∇Dの設計によって変わる。
上記仮定のもと、式(9)のB-P-R型単調作用素分解の収束率は、(詳細な導出については省略することにするが、)式(19)で表される。
ここで、ztはt回更新したzの値、z0はzの初期値、z*はzの不動点を表す。また、ηi(i=1, 2)は、式(20)で与えられる。
式(20)からわかるように、ηiが0に近い値になるほど、収束率の高速化が見込める。
これは、B-D-R型単調作用素分解でも同様であり、式(16)のB-D-R型単調作用素分解の収束率は、式(19)’で表される。
式(20)で与えられるηiは、式(21)を満たす。つまり、ηiは0以上1以下の値をとり得る。
σLB,i=1, σUB,i=1であるとき、ηi=0となることからわかるように、σLB,i, σUB,iがそれぞれ1に近い値をとるとき、ηiも0に近い値をとる。したがって、式(18)を満たすσLB,i, σUB,iがそれぞれ1に近い値をとるように、∇Dを設計すると収束率の高速化が期待できる。
《3:従来の∇Dの設計》
非特許文献1では、式(22)に示すような正定値行列Mを用いた線形関数として∇Dを設計した。
非特許文献1では、式(22)に示すような正定値行列Mを用いた線形関数として∇Dを設計した。
正定値行列Mを用いた線形関数としたのは、行列Mに応じて、ニュートン(Newton)法、加速勾配(AGD)法、(一次)勾配降下(GD)法といった既存の最適化方法と結び付けられるからである。実際、正定値行列Mを適切に設計することにより、高速収束を実現することが数値シミュレーションによりわかっている。
しかし、ブレグマンダイバージェンスの定義に用いる関数Dの要件は、(1)∇D(0)=0を満たすことと、(2)微分可能な狭義凸関数であることの2点である。つまり、式(22)のように、正定値行列Mを用いた線形関数により∇Dを設計するのは、上記2つの要件を満たす関数Dの一例に過ぎない。つまり、∇Dがより収束率を高速化するような、上記2つの要件を満たす関数Dは上記設計以外にも存在する可能性がある。
《4:本願発明における∇Dの設計》
そこで、∇D(w)=Mwを満たす関数Dに制限するのではなく、式(18)を満たすσLB,i, σUB,iがそれぞれ1に近い値をとるような、∇Dの設計について提案する。具体的には、(1)高次の勾配情報を含む連続な非線形関数を∇Dに利用し、(2)∂G1と∂G2に適応して、∇Dを交互に修正することを特徴とする方法(以下、適応型交互計量修正法という)について提案する。
そこで、∇D(w)=Mwを満たす関数Dに制限するのではなく、式(18)を満たすσLB,i, σUB,iがそれぞれ1に近い値をとるような、∇Dの設計について提案する。具体的には、(1)高次の勾配情報を含む連続な非線形関数を∇Dに利用し、(2)∂G1と∂G2に適応して、∇Dを交互に修正することを特徴とする方法(以下、適応型交互計量修正法という)について提案する。
そのために、強単調性を満たす∇Dを用いることを考える。具体的には、コスト関数Giを近似する微分可能な強凸関数-Gi(i=1, 2)を用いて、∇Dを式(23)で定義する。
ここで、式(23)の∇Dが強単調性を満たすようにするために、正の係数{γ1
t, γ2
t}を用いる。{γ1
t, γ2
t}は、例えば、次式のようにすればよい。
式(23)により、∇Dが交互に適応的に修正されることがわかる。
図1のB-P-R型変数更新アルゴリズム、B-D-R型変数更新アルゴリズムに、式(23)の∇Dの設計を取り入れることにより、図2に示すB-P-R型変数更新アルゴリズム、B-D-R型変数更新アルゴリズムが得られる。
《5:ラグランジュ双対上昇問題に対するブレグマン単調作用素分解に基づく変数更新則》
ここでは、式(23)の∇Dを用いて、ラグランジュ双対上昇問題に対するB-P-R型変数更新則、B-D-R型変数更新則を導出する。
ここでは、式(23)の∇Dを用いて、ラグランジュ双対上昇問題に対するB-P-R型変数更新則、B-D-R型変数更新則を導出する。
先述の通り、ラグランジュ双対上昇問題では、2つの極大単調作用素を∂G1(w)=A∂H1
*(ATw), ∂G2(w)=B∂H2
*(BTw)-cを用いた。1つ目の極大単調作用素∂G1(w)に対して、∂G1(w)=A∂H1
*(ATw)と式(7)を用いて、変数wの補助変数zの定義式w∈R1(z)を変形すると、式(24)が得られる。
ここで、変数p∈∂H1
*(ATw)と、~w=∇D(w), ~z=∇D(z)(つまり、~w, ~zはそれぞれw, zを非線形変換した双対変数)に対して、式(25)が成り立つ。
凸共役関数の劣微分が∂H1
*=(∂H1)-1を満たすという基本的な性質を用いることにより、変数pに関する式p∈∂H1
*(ATw)は、式(26)のように変形される。
ここで、pの最小値が存在する場合、式(26)の積分形である式(27)によりpの更新則が表される。
ここで、D+は∇D+=(∇D)-1を満たす強凸関数である。
また、式(25)と、式(11)に対応する式x∈2w-zに非線形変形を適用して得られる式~x∈2~w-~zとを合成することにより、双対変数~xの更新則を表す式(28)が得られる。
2つ目の極大単調作用素∂G2(w)=B∂H2
*(BTw)-cに対しても、同様の議論により次式を導出することができる。
以上、ラグランジュ双対上昇問題に対するB-P-R型変数更新則、B-D-R型変数更新則について、それぞれアルゴリズムとしてまとめると図3のようになる。図3は、ラグランジュ双対上昇問題に対するB-P-R型変数更新アルゴリズム、B-D-R型変数更新アルゴリズムが変数p, qとその双対変数~x, ~zの更新則として実現されることを示している。
また、図3に示した2つのアルゴリズムに、式(23)の∇Dの設計を取り入れることにより、図4に示すB-P-R型変数更新アルゴリズム、B-D-R型変数更新アルゴリズムが得られる。
《6:全変動ノルムを用いた画像のノイズ除去問題》
ここでは、図4のアルゴリズムの応用例として、全変動ノルムを用いた画像のノイズ除去問題のための最適化アルゴリズムについて説明する。
ここでは、図4のアルゴリズムの応用例として、全変動ノルムを用いた画像のノイズ除去問題のための最適化アルゴリズムについて説明する。
全変動ノルムを用いた画像のノイズ除去問題を定義するために、例えば、次式のコスト関数H1, H2を用いることができる。
ここで、pは画像を表す変数、qはpの補助変数、sは観測画像(つまり、ノイズを除去する前の画像)を表す。また、μ, θ(>0)は所定の係数である。
また、2つの変数{p, q}は、式q=Φp(ただし、Φは正方巡回行列)により拘束されているものとする。Φが正方巡回行列であるので、qのi番目の要素qiは離散差分演算qi=[Φp]i=pi-1-pi+1により得られる。なお、正方巡回行列Φを用いるのは、演算量削減のためである。
ここで、A=Φ, B=-I, c=0とすることにより、上記仮定をおいたノイズ除去問題が式(3)により記述されることがわかる。したがって、このノイズ除去問題に、図4のアルゴリズムを用いることができる。
以下、∇Dの設計について説明する。1つ目の極大単調作用素∂G1(z)=Φ∂H1
*(ΦTz)に対しては、例えば、∇D, (∇D)-1をそれぞれ次式のようにすることができる。
ここで、ξ(>0)は関数T1が強単調性を満たすようにするために用いる係数である。
また、2つ目の極大単調作用素∂G2(x)=-∂H2
*(-x)-cに対しては、例えば、∇D, (∇D)-1をそれぞれ次式のようにすることができる。
ここで、xi(i=1, …, n)はxのi番目の要素を表す。また、ν(>0)は所定の定数であり、ν>μθが成り立つものとする。
以上、まとめると、上記仮定をおいたノイズ除去問題に対するB-P-R型変数更新アルゴリズム、B-D-R型変数更新アルゴリズムは、図5のようになる。図5において、F, ΨはそれぞれΦ=FΨFTを満たすn次元DFT行列と対角行列、Ωは(ΦΦT+ξI)=FΩFTを満たす対角行列である。ここで、・Hはエルミート転置を表す。
<第1実施形態>
以下、図6~図7を参照して変数最適化装置100を説明する。図6は、変数最適化装置100の構成を示すブロック図である。図7は、変数最適化装置100の動作を示すフローチャートである。図6に示すように変数最適化装置100は、変数更新部120と、記録部190を含む。記録部190は、変数最適化装置100の処理に必要な情報を適宜記録する構成部である。
以下、図6~図7を参照して変数最適化装置100を説明する。図6は、変数最適化装置100の構成を示すブロック図である。図7は、変数最適化装置100の動作を示すフローチャートである。図6に示すように変数最適化装置100は、変数更新部120と、記録部190を含む。記録部190は、変数最適化装置100の処理に必要な情報を適宜記録する構成部である。
変数最適化装置100は、入力データを用いて、最適化の対象となる変数w∈Rn(nは1以上の整数)を最適化し、その結果を出力値として出力する。ここで、入力データは変数wの最適化に用いるコスト関数G(w)を求めるために用いるデータである。以下、入力データを用いて計算される、変数wを最適化するためのコスト関数G(w)は、G(w)=G1(w)+G2(w)(ただし、関数Gi(w):Rn→R∪{∞} (i=1, 2)は閉真凸関数)と表されるものとする。
図7に従い変数最適化装置100の動作について説明する。
S120において、変数更新部120は、入力データを用いて、所定の手順により変数wを最適化し、その結果を出力値として出力する。以下、具体的に説明する。なお、ブレグマンダイバージェンスの定義に用いる関数D:Rn→Rは、微分可能であり、∇D(0)=0を満たす狭義凸関数であるものとする。
まず、変数更新部120は、入力データを用いて、変数wを最適化する際に用いるセットアップデータを計算する(S121-1)。変数更新部120は、例えば、コスト関数Gi(w) (i=1, 2)、関数Dと関数Giを用いて定義されるD-リゾルヴェント作用素Ri(i=1,2)、D-リゾルヴェント作用素Riを用いて定義されるD-ケーリー作用素Ci(i=1,2)、関数Gi(w) (i=1, 2)を近似する強凸関数-Gi(w) (i=1, 2)をセットアップデータとして計算する。
次に、変数更新部120は、D-リゾルヴェント作用素Ri(i=1,2)とD-ケーリー作用素Ci(i=1,2)を用いて、変数wの値を再帰的に計算する(S121-2)。変数更新部120が∇D(w)を計算する際、D-リゾルヴェント作用素R1とD-ケーリー作用素C1に対しては∇D(w)の計算にT1(w)=∇-G1(w)-∇-G1(0)を用い、D-リゾルヴェント作用素R2とD-ケーリー作用素C2に対しては∇D(w)の計算にT2(w)=∇-G2(w)-∇-G2(0)を用いる(式(23)参照)。
また、変数更新部120を図2のアルゴリズムに基づいて変数wの値を再帰的に計算する構成部として構成することもできる。つまり、S120において、変数更新部120は、入力データを用いて、所定のセットアップデータを計算した後、変数wのt+1回目の更新結果であるwt+1の計算を繰り返す。ここで、tは更新回数のカウントに用いる変数(以下、カウンタともいう)であり、0以上の整数値をとる。
以下、図8~図9を参照して変数更新部120について説明する。図8は、変数更新部120の構成を示すブロック図である。図9は、変数更新部120の動作を示すフローチャートである。図8に示すように変数更新部120は、初期化部121と、第1係数変数計算部1221と、変数計算部1222と、第1補助変数計算部1223と、第2係数変数計算部1224と、第2補助変数計算部1225と、第3補助変数計算部1226と、カウンタ更新部123と、終了条件判定部124を含む。
図9に従い変数更新部120の動作について説明する。なお、先ほどと同じく、D:Rn→Rを狭義凸関数(ただし、関数Dは微分可能であり、∇D(0)=0を満たす)、JDを関数Dを用いて定義されるブレグマンダイバージェンス、-Gi(w) (i=1, 2)を関数Gi(w) (i=1, 2)を近似する強凸関数、T1(w), T2(w)を次式で定義される関数
とし、ここでは、変数wの補助変数x, y, z∈Rnを用いる。
S121において、初期化部121は、カウンタtを初期化する。具体的には、t=0とする。また、初期化部121は、セットアップデータを計算する。
S1221において、第1係数計算部1221は、次式により、第1係数γ1のt+1回目の更新結果であるγ1
t+1を計算する。
S1222において、変数計算部1222は、次式により、変数wのt+1回目の更新結果であるwt+1を計算する。
S1223において、第1補助変数計算部1223は、次式により、補助変数xのt+1回目の更新結果であるxt+1を計算する。
S1224において、第2係数計算部1224は、次式により、第2係数γ2のt+1回目の更新結果であるγ2
t+1を計算する。
S1225おいて、第2補助変数計算部1225は、次式により、補助変数yのt+1回目の更新結果であるyt+1を計算する。
S1226おいて、第3補助変数計算部1226は、所定の式により、補助変数zのt+1回目の更新結果であるzt+1を計算する。
B-P-R型単調作用素分割を用いる場合は、次式を用いる。
また、B-D-R型単調作用素分割を用いる場合は、次式を用いる。
(ただし、αは0<α<1を満たす実数)
S123において、カウンタ更新部123は、カウンタtを1だけインクリメントする。具体的には、t←t+1とする。
S123において、カウンタ更新部123は、カウンタtを1だけインクリメントする。具体的には、t←t+1とする。
S124において、終了条件判定部124は、カウンタtが所定の更新回数T(Tは1以上の整数とする)に達した場合(つまり、t=Tとなり、終了条件が満たされた場合)は、そのときの変数wの値wTを出力値として、処理を終了する。それ以外の場合、S1221の処理に戻る。つまり、変数更新部120は、S1221~S124の計算を繰り返す。
本実施形態の発明によれば、最適化対象となる変数を高速に最適化することができる。
<第2実施形態>
以下、図6~図7を参照して変数最適化装置200を説明する。図6は、変数最適化装置200の構成を示すブロック図である。図7は、変数最適化装置200の動作を示すフローチャートである。図6に示すように変数最適化装置200は、変数更新部220と、記録部190を含む。記録部190は、変数最適化装置200の処理に必要な情報を適宜記録する構成部である。
以下、図6~図7を参照して変数最適化装置200を説明する。図6は、変数最適化装置200の構成を示すブロック図である。図7は、変数最適化装置200の動作を示すフローチャートである。図6に示すように変数最適化装置200は、変数更新部220と、記録部190を含む。記録部190は、変数最適化装置200の処理に必要な情報を適宜記録する構成部である。
変数最適化装置200は、入力データを用いて、最適化の対象となる変数p∈Rk, q∈Rm(k, mは1以上の整数)を最適化し、その結果を出力値として出力する。ここで、入力データは、変数p, qを最適化するためのコスト関数H1(p)+H2(q)を求めるために用いるデータである。以下、入力データを用いて計算される、変数p, qを最適化するためのコスト関数H1(p)+H2(q)を構成する関数H1(p):Rk→R∪{∞}, H2(q):Rm→R∪{∞}は、それぞれ閉真凸関数とする。また、事前に与えられている行列A∈Rn×k, B∈Rn×m及びベクトルc∈Rnを用いて、変数p, qが満たすべき制約Ap+Bq=cで拘束されているものとする。
図7に従い変数最適化装置200の動作について説明する。
S220において、変数更新部220は、入力データを用いて、所定の手順により変数p, qを最適化し、その結果を出力値として出力する。以下、図4のアルゴリズムに基づいて変数p, qの値を再帰的に計算する構成部として構成した変数更新部220について説明する。つまり、S220において、変数更新部220は、入力データを用いて、所定のセットアップデータを計算した後、変数pのt+1回目の更新結果であるpt+1と変数qのt+1回目の更新結果であるqt+1の計算を繰り返す。ここで、tは更新回数のカウントに用いる変数(以下、カウンタともいう)であり、0以上の整数値をとる。
以下、図10~図11を参照して変数更新部220について説明する。図10は、変数更新部220の構成を示すブロック図である。図11は、変数更新部220の動作を示すフローチャートである。図10に示すように変数更新部220は、初期化部221と、第1係数変数計算部2221と、第1変数計算部2222と、第1双対変数計算部2223と、第2係数変数計算部2224と、第2変数計算部2225と、第2双対変数計算部2226と、カウンタ更新部223と、終了条件判定部224を含む。
図11に従い変数更新部220の動作について説明する。なお、D:Rn→Rを狭義凸関数(ただし、関数Dは微分可能であり、∇D(0)=0を満たす)、D+を∇D+=(∇D)-1を満たす強凸関数、JD+を関数D+を用いて定義されるブレグマンダイバージェンス、∂G1(w), ∂G2(w)(w∈Rnは双対変数)を次式で定義される極大単調作用素
、T1(w), T2(w)を次式で定義される関数
とし、ここでは、双対変数x, z∈Rnに対して、~x=∇D(x), ~z=∇D(z)で定義される双対変数~x, ~z∈Rnを用いる。
S221において、初期化部221は、カウンタtを初期化する。具体的には、t=0とする。また、初期化部221は、変数p, qを最適化する際に用いるセットアップデータを計算する。初期化部221は、例えば、コスト関数H1(p), H2(q)をセットアップデータとして計算する。
S2221において、第1係数計算部2221は第1係数γ1のt+1回目の更新結果であるγ1
t+1を計算する。
S2222において、第1変数計算部2222は、次式により、変数pのt+1回目の更新結果であるpt+1を計算する。
S2223において、第1双対変数計算部2223は、次式により、双対変数~xのt+1回目の更新結果である~xt+1を計算する。
S2224において、第2係数計算部2224は、次式により、第2係数γ2のt+1回目の更新結果であるγ2
t+1を計算する。
S2225おいて、第2変数計算部2225は、次式により、変数qのt+1回目の更新結果であるqt+1を計算する。
S2226おいて、第2双対変数計算部2226は、所定の式により、双対変数~zのt+1回目の更新結果である~zt+1を計算する。
B-P-R型単調作用素分割を用いる場合は、次式を用いる。
また、B-D-R型単調作用素分割を用いる場合は、次式を用いる。
(ただし、αは0<α<1を満たす実数)
S223において、カウンタ更新部223は、カウンタtを1だけインクリメントする。具体的には、t←t+1とする。
S223において、カウンタ更新部223は、カウンタtを1だけインクリメントする。具体的には、t←t+1とする。
S224において、終了条件判定部224は、カウンタtが所定の更新回数T(Tは1以上の整数とする)に達した場合(つまり、t=Tとなり、終了条件が満たされた場合)は、そのときの変数p, qの値pT, qTを出力値として、処理を終了する。それ以外の場合、S2221の処理に戻る。つまり、変数更新部220は、S2221~S224の計算を繰り返す。
本実施形態の発明によれば、最適化対象となる変数を高速に最適化することができる。
<第3実施形態>
ここでは、<技術的背景>の《6:全変動ノルムを用いた画像のノイズ除去問題》で説明した図5のアルゴリズムに対応する実施形態について説明する。
ここでは、<技術的背景>の《6:全変動ノルムを用いた画像のノイズ除去問題》で説明した図5のアルゴリズムに対応する実施形態について説明する。
以下、図12~図13を参照してノイズ除去装置300を説明する。図12は、ノイズ除去装置300の構成を示すブロック図である。図13は、ノイズ除去装置300の動作を示すフローチャートである。図12に示すようにノイズ除去装置300は、画像更新部320と、記録部190を含む。記録部190は、ノイズ除去装置300の処理に必要な情報を適宜記録する構成部である。
ノイズ除去装置300は、観測画像sを用いて、ノイズを除去した出力画像を生成し、出力する。その際、画像を表す変数p∈Rkと変数pの補助変数q∈Rm(k, mは1以上の整数)を用い、変数p(とq)を最適化することにより、出力画像を生成する。ここでは、変数p, qを最適化するためのコスト関数H1(p)+H2(q)を構成する関数H1(p), H2(q)としてに次式で定義される関数を用いる。
ここで、μ, θ(>0)は所定の係数である。
また、変数{p, q}は、式q=Φp(ただし、Φは事前に与えられている正方巡回行列)により拘束されているものとする。
図13に従いノイズ除去装置300の動作について説明する。
S320において、画像更新部320は、観測画像sを用いて、所定の手順により変数p, qを最適化し、その結果を出力画像として出力する。以下、図5のアルゴリズムに基づいて変数p, qの値を再帰的に計算する構成部として構成した画像更新部320について説明する。つまり、S320において、画像更新部320は、観測画像sを用いて、所定のセットアップデータを計算した後、変数pのt+1回目の更新結果であるpt+1と変数qのt+1回目の更新結果であるqt+1の計算を繰り返す。ここで、tは更新回数のカウントに用いる変数(以下、カウンタともいう)であり、0以上の整数値をとる。
以下、図14~図15を参照して画像更新部320について説明する。図14は、画像更新部320の構成を示すブロック図である。図15は、画像更新部320の動作を示すフローチャートである。図14に示すように画像更新部320は、初期化部321と、第1係数変数計算部3221と、第1変数計算部3222と、第1双対変数計算部3223と、第2係数変数計算部3224と、第2変数計算部3225と、第2双対変数計算部3226と、カウンタ更新部323と、終了条件判定部324を含む。
図15に従い画像更新部320の動作について説明する。なお、D:Rn→Rを狭義凸関数(ただし、関数Dは微分可能であり、∇D(0)=0を満たす)、D+を∇D+=(∇D)-1を満たす強凸関数、∂G1(w), ∂G2(w)(w∈Rnは双対変数)を次式で定義される極大単調作用素
、T1(w), T2(w)を次式で定義される関数
(ただし、xi(i=1, …, n)はxのi番目の要素を表す。また、ν(>0)は所定の定数であり、ν>μθが成り立つ。)とし、ここでは、双対変数x, z∈Rnに対して、~x=∇D(x), ~z=∇D(z)で定義される双対変数~x, ~z∈Rnを用いる。
また、Φ=FΨFTを満たすn次元DFT行列Fと対角行列Ψ、(ΦΦT+ξI)=FΩFTを満たす対角行列Ωとする。
S321において、初期化部321は、カウンタtを初期化する。具体的には、t=0とする。また、初期化部321は、変数p, qを最適化する際に用いるセットアップデータを計算する。初期化部321は、例えば、コスト関数H1(p), H2(q)をセットアップデータとして計算する。
S3221において、第1係数計算部3221は第1係数γ1のt+1回目の更新結果であるγ1
t+1を計算する。
S3222において、第1変数計算部3222は、次式により、変数pのt+1回目の更新結果であるpt+1を計算する。
S3223において、第1双対変数計算部3223は、次式により、双対変数~xのt+1回目の更新結果である~xt+1を計算する。
S3224において、第2係数計算部3224は、次式により、第2係数γ2のt+1回目の更新結果であるγ2
t+1を計算する。
S3225おいて、第2変数計算部3225は、次式により、変数qのt+1回目の更新結果であるqt+1を計算する。
ただし、~xt+1=[~x1
t+1, …, ~xn
t+1]Tである。
S3226おいて、第2双対変数計算部3226は、所定の式により、双対変数~zのt+1回目の更新結果である~zt+1を計算する。
B-P-R型単調作用素分割を用いる場合は、次式を用いる。
また、B-D-R型単調作用素分割を用いる場合は、次式を用いる。
(ただし、αは0<α<1を満たす実数)
S323において、カウンタ更新部323は、カウンタtを1だけインクリメントする。具体的には、t←t+1とする。
S323において、カウンタ更新部323は、カウンタtを1だけインクリメントする。具体的には、t←t+1とする。
S324において、終了条件判定部324は、カウンタtが所定の更新回数T(Tは1以上の整数とする)に達した場合(つまり、t=Tとなり、終了条件が満たされた場合)は、そのときの変数pの値pTを出力画像として、処理を終了する。それ以外の場合、S3221の処理に戻る。つまり、画像更新部320は、S3221~S324の計算を繰り返す。
本実施形態の発明によれば、観測画像からノイズを除去した画像を高速に生成することができる。
<補記>
図16は、上述の各装置を実現するコンピュータの機能構成の一例を示す図である。上述の各装置における処理は、記録部2020に、コンピュータを上述の各装置として機能させるためのプログラムを読み込ませ、制御部2010、入力部2030、出力部2040などに動作させることで実施できる。
図16は、上述の各装置を実現するコンピュータの機能構成の一例を示す図である。上述の各装置における処理は、記録部2020に、コンピュータを上述の各装置として機能させるためのプログラムを読み込ませ、制御部2010、入力部2030、出力部2040などに動作させることで実施できる。
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD-ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている(外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい)。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。
ハードウェアエンティティでは、外部記憶装置(あるいはROMなど)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行・処理される。その結果、CPUが所定の機能(上記、…部、…手段などと表した各構成要件)を実現する。
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
既述のように、上記実施形態において説明したハードウェアエンティティ(本発明の装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP-ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
上述の本発明の実施形態の記載は、例証と記載の目的で提示されたものである。網羅的であるという意思はなく、開示された厳密な形式に発明を限定する意思もない。変形やバリエーションは上述の教示から可能である。実施形態は、本発明の原理の最も良い例証を提供するために、そして、この分野の当業者が、熟考された実際の使用に適するように本発明を色々な実施形態で、また、色々な変形を付加して利用できるようにするために、選ばれて表現されたものである。すべてのそのような変形やバリエーションは、公正に合法的に公平に与えられる幅にしたがって解釈された添付の請求項によって定められた本発明のスコープ内である。
Claims (7)
- w∈Rnを最適化対象となる変数、G(w)(=G1(w)+G2(w))を入力データを用いて計算される、変数wを最適化するためのコスト関数(ただし、関数Gi(w):Rn→R∪{∞} (i=1, 2)は閉真凸関数)とし、
D:Rn→Rを狭義凸関数(ただし、関数Dは微分可能であり、∇D(0)=0を満たす)、Ri(i=1, 2), Ci(i=1, 2)をそれぞれ次式で定義されるD-リゾルヴェント作用素、D-ケーリー作用素とし、
D-リゾルヴェント作用素Ri(i=1, 2)とD-ケーリー作用素Ci(i=1, 2)を用いて、変数wの値を再帰的に計算する変数更新部
を含み、
-Gi(w) (i=1, 2)を関数Gi(w) (i=1, 2)を近似する強凸関数とし、
前記変数更新部が∇D(w)を計算する際、D-リゾルヴェント作用素R1とD-ケーリー作用素C1に対しては∇D(w)の計算にT1(w)=∇-G1(w)-∇-G1(0)を用い、D-リゾルヴェント作用素R2とD-ケーリー作用素C2に対しては∇D(w)の計算にT2(w)=∇-G2(w)-∇-G2(0)を用いる
変数最適化装置。 - w∈Rnを最適化対象となる変数、G(w)(=G1(w)+G2(w))を入力データを用いて計算される、変数wを最適化するためのコスト関数(ただし、関数Gi(w):Rn→R∪{∞} (i=1, 2)は閉真凸関数)とし、
変数wのt+1回目の更新結果であるwt+1を計算する変数更新部
を含み、
x, y, z∈Rnをそれぞれ変数wの補助変数、D:Rn→Rを狭義凸関数(ただし、関数Dは微分可能であり、∇D(0)=0を満たす)、JDを関数Dを用いて定義されるブレグマンダイバージェンス、-Gi(w) (i=1, 2)を関数Gi(w) (i=1, 2)を近似する強凸関数、T1(w), T2(w)をそれぞれ次式で定義される関数
とし、
前記変数更新部は、
次式により、第1係数γ1のt+1回目の更新結果であるγ1 t+1を計算する第1係数計算部と、
次式により、変数wのt+1回目の更新結果であるwt+1を計算する変数計算部と、
次式により、補助変数xのt+1回目の更新結果であるxt+1を計算する第1補助変数計算部と、
次式により、第2係数γ2のt+1回目の更新結果であるγ2 t+1を計算する第2係数計算部と、
次式により、補助変数yのt+1回目の更新結果であるyt+1を計算する第2補助変数計算部と、
次式により、補助変数zのt+1回目の更新結果であるzt+1を計算する第3補助変数計算部と、
を含むことを特徴とする変数最適化装置。 - w∈Rnを最適化対象となる変数、G(w)(=G1(w)+G2(w))を入力データを用いて計算される、変数wを最適化するためのコスト関数(ただし、関数Gi(w):Rn→R∪{∞} (i=1, 2)は閉真凸関数)とし、
変数wのt+1回目の更新結果であるwt+1を計算する変数更新部
を含み、
x, y, z∈Rnをそれぞれ変数wの補助変数、D:Rn→Rを狭義凸関数(ただし、関数Dは微分可能であり、∇D(0)=0を満たす)、JDを関数Dを用いて定義されるブレグマンダイバージェンス、-Gi(w) (i=1, 2)を関数Gi(w) (i=1, 2)を近似する強凸関数、T1(w), T2(w)をそれぞれ次式で定義される関数
とし、
前記変数更新部は、
次式により、第1係数γ1のt+1回目の更新結果であるγ1 t+1を計算する第1係数計算部と、
次式により、変数wのt+1回目の更新結果であるwt+1を計算する変数計算部と、
次式により、補助変数xのt+1回目の更新結果であるxt+1を計算する第1補助変数計算部と、
次式により、第2係数γ2のt+1回目の更新結果であるγ2 t+1を計算する第2係数計算部と、
次式により、補助変数yのt+1回目の更新結果であるyt+1を計算する第2補助変数計算部と、
次式により、補助変数zのt+1回目の更新結果であるzt+1を計算する第3補助変数計算部と、
(ただし、αは0<α<1を満たす実数)
を含むことを特徴とする変数最適化装置。 - p∈Rk, q∈Rmを最適化対象となる変数、H1(p)+H2(q)を入力データを用いて計算される、変数p, qを最適化するためのコスト関数(ただし、関数H1(p):Rk→R∪{∞}, H2(q):Rm→R∪{∞}はそれぞれ閉真凸関数)、Ap+Bq=cを変数p, qが満たすべき制約(ただし、行列A∈Rn×k, B∈Rn×m及びベクトルc∈Rnは事前に与えられるものとする)とし、
変数pのt+1回目の更新結果であるpt+1と、変数qのt+1回目の更新結果であるqt+1とを計算する変数更新部
を含み、
D:Rn→Rを狭義凸関数(ただし、関数Dは微分可能であり、∇D(0)=0を満たす)、∂G1(w), ∂G2(w)(w∈Rnは双対変数)をそれぞれ次式で定義される極大単調作用素
、T1(w), T2(w)をそれぞれ次式で定義される関数
、D+を∇D+=(∇D)-1を満たす強凸関数、JD+を関数D+を用いて定義されるブレグマンダイバージェンス、x, z∈Rnをそれぞれ双対変数、~x, ~z∈Rnをそれぞれ~x=∇D(x), ~z=∇D(z)で定義される双対変数とし、
前記変数更新部は、
次式により、第1係数γ1のt+1回目の更新結果であるγ1 t+1を計算する第1係数計算部と、
次式により、変数pのt+1回目の更新結果であるpt+1を計算する第1変数計算部と、
次式により、双対変数~xのt+1回目の更新結果である~xt+1を計算する第1双対変数計算部と、
次式により、第2係数γ2のt+1回目の更新結果であるγ2 t+1を計算する第2係数計算部と、
次式により、変数qのt+1回目の更新結果であるqt+1を計算する第2変数計算部と、
次式により、双対変数~zのt+1回目の更新結果である~zt+1を計算する第2双対変数計算部と、
を含むことを特徴とする変数最適化装置。 - p∈Rk, q∈Rmを最適化対象となる変数、H1(p)+H2(q)を入力データを用いて計算される、変数p, qを最適化するためのコスト関数(ただし、関数H1(p):Rk→R∪{∞}, H2(q):Rm→R∪{∞}はそれぞれ閉真凸関数)、Ap+Bq=cを変数p, qが満たすべき制約(ただし、行列A∈Rn×k, B∈Rn×m及びベクトルc∈Rnは事前に与えられるものとする)とし、
変数pのt+1回目の更新結果であるpt+1と、変数qのt+1回目の更新結果であるqt+1とを計算する変数更新部
を含み、
D:Rn→Rを狭義凸関数(ただし、関数Dは微分可能であり、∇D(0)=0を満たす)、∂G1(w), ∂G2(w)(w∈Rnは双対変数)をそれぞれ次式で定義される極大単調作用素
、T1(w), T2(w)をそれぞれ次式で定義される関数
、D+を∇D+=(∇D)-1を満たす強凸関数、JD+を関数D+を用いて定義されるブレグマンダイバージェンス、x, z∈Rnをそれぞれ双対変数、~x, ~z∈Rnをそれぞれ~x=∇D(x), ~z=∇D(z)で定義される双対変数とし、
前記変数更新部は、
次式により、第1係数γ1のt+1回目の更新結果であるγ1 t+1を計算する第1係数計算部と、
次式により、変数pのt+1回目の更新結果であるpt+1を計算する第1変数計算部と、
次式により、双対変数~xのt+1回目の更新結果である~xt+1を計算する第1双対変数計算部と、
次式により、第2係数γ2のt+1回目の更新結果であるγ2 t+1を計算する第2係数計算部と、
次式により、変数qのt+1回目の更新結果であるqt+1を計算する第2変数計算部と、
次式により、双対変数~zのt+1回目の更新結果である~zt+1を計算する第2双対変数計算部と、
(ただし、αは0<α<1を満たす実数)
を含むことを特徴とする変数最適化装置。 - w∈Rnを最適化対象となる変数、G(w)(=G1(w)+G2(w))を入力データを用いて計算される、変数wを最適化するためのコスト関数(ただし、関数Gi(w):Rn→R∪{∞} (i=1, 2)は閉真凸関数)とし、
D:Rn→Rを狭義凸関数(ただし、関数Dは微分可能であり、∇D(0)=0を満たす)、Ri(i=1, 2), Ci(i=1, 2)をそれぞれ次式で定義されるD-リゾルヴェント作用素、D-ケーリー作用素とし、
変数最適化装置が、D-リゾルヴェント作用素Ri(i=1, 2)とD-ケーリー作用素Ci(i=1, 2)を用いて、変数wの値を再帰的に計算する変数更新ステップ
を含み、
-Gi(w) (i=1, 2)を関数Gi(w) (i=1, 2)を近似する強凸関数とし、
前記変数更新ステップにおいて∇D(w)を計算する際、D-リゾルヴェント作用素R1とD-ケーリー作用素C1に対しては∇D(w)の計算にT1(w)=∇-G1(w)-∇-G1(0)を用い、D-リゾルヴェント作用素R2とD-ケーリー作用素C2に対しては∇D(w)の計算にT2(w)=∇-G2(w)-∇-G2(0)を用いる
変数最適化方法。 - 請求項1ないし5のいずれか1項に記載の変数最適化装置としてコンピュータを機能させるためのプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/036692 WO2021053781A1 (ja) | 2019-09-19 | 2019-09-19 | 変数最適化装置、変数最適化方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021053781A1 JPWO2021053781A1 (ja) | 2021-03-25 |
JP7235129B2 true JP7235129B2 (ja) | 2023-03-08 |
Family
ID=74884434
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021546129A Active JP7235129B2 (ja) | 2019-09-19 | 2019-09-19 | 変数最適化装置、変数最適化方法、プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220391467A1 (ja) |
JP (1) | JP7235129B2 (ja) |
WO (1) | WO2021053781A1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016531343A (ja) | 2013-06-28 | 2016-10-06 | ディー−ウェイブ システムズ,インコーポレイテッド | データの量子処理のためのシステムおよび方法 |
WO2017135314A1 (ja) | 2016-02-03 | 2017-08-10 | 日本電気株式会社 | 情報処理装置、情報処理方法、及び、記録媒体 |
-
2019
- 2019-09-19 JP JP2021546129A patent/JP7235129B2/ja active Active
- 2019-09-19 US US17/761,592 patent/US20220391467A1/en active Pending
- 2019-09-19 WO PCT/JP2019/036692 patent/WO2021053781A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016531343A (ja) | 2013-06-28 | 2016-10-06 | ディー−ウェイブ システムズ,インコーポレイテッド | データの量子処理のためのシステムおよび方法 |
WO2017135314A1 (ja) | 2016-02-03 | 2017-08-10 | 日本電気株式会社 | 情報処理装置、情報処理方法、及び、記録媒体 |
Non-Patent Citations (1)
Title |
---|
NIWA, Kenta, et al.,Non-negative Matrix Factorization Using Bregman Monotone Operator Splitting,IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP),2019年04月17日,https://ieeexplore.ieee.org/abstract/document/8683509 |
Also Published As
Publication number | Publication date |
---|---|
WO2021053781A1 (ja) | 2021-03-25 |
US20220391467A1 (en) | 2022-12-08 |
JPWO2021053781A1 (ja) | 2021-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chertock et al. | Well-balanced schemes for the shallow water equations with Coriolis forces | |
WO2020071441A1 (ja) | 秘密シグモイド関数計算システム、秘密ロジスティック回帰計算システム、秘密シグモイド関数計算装置、秘密ロジスティック回帰計算装置、秘密シグモイド関数計算方法、秘密ロジスティック回帰計算方法、プログラム | |
WO2020162189A1 (ja) | 非負値行列分解最適化装置、非負値行列分解最適化方法、プログラム | |
JP2017016384A (ja) | 混合係数パラメータ学習装置、混合生起確率算出装置、及び、これらのプログラム | |
Blanes et al. | An efficient algorithm based on splitting for the time integration of the Schrödinger equation | |
JP7235129B2 (ja) | 変数最適化装置、変数最適化方法、プログラム | |
Liu et al. | A reduced Gaussian kernel least-mean-square algorithm for nonlinear adaptive signal processing | |
Kalyakin | Perturbation of a simple wave in a system with dissipation | |
WO2019225531A1 (ja) | 秘密一括近似システム、秘密計算装置、秘密一括近似方法、およびプログラム | |
Wang et al. | An efficient adaptive mesh redistribution method for a non-linear Dirac equation | |
Gemignani et al. | Relaxed fixed point iterations for matrix equations arising in Markov chain modeling | |
JP7156064B2 (ja) | 潜在変数最適化装置、フィルタ係数最適化装置、潜在変数最適化方法、フィルタ係数最適化方法、プログラム | |
Vogt et al. | Functional liftings of vectorial variational problems with Laplacian regularization | |
Chang et al. | Traveling wavefronts for a Lotka–Volterra competition model with partially nonlocal interactions | |
JP7173355B2 (ja) | Psd最適化装置、psd最適化方法、プログラム | |
Álvarez et al. | A numerical scheme for periodic travelling-wave simulations in some nonlinear dispersive wave models | |
WO2024100708A1 (ja) | グラフ信号処理装置、グラフ信号処理方法及びプログラム | |
US11758324B2 (en) | PSD optimization apparatus, PSD optimization method, and program | |
JP7279796B2 (ja) | 秘密勾配降下法計算方法、秘密深層学習方法、秘密勾配降下法計算システム、秘密深層学習システム、秘密計算装置、およびプログラム | |
Shao et al. | Quasi-Toeplitz trigonometric transform splitting methods for spatial fractional diffusion equations | |
WO2022270163A1 (ja) | 計算機システム及び介入効果予測方法 | |
WO2023119551A1 (ja) | 信号処理装置、信号処理方法、プログラム | |
Ohishi et al. | Equivalence between adaptive Lasso and generalized ridge estimators in linear regression with orthogonal explanatory variables after optimizing regularization parameters | |
Winkler | The Sylvester resultant matrix and image deblurring | |
Fan et al. | The Order-p Tensor Linear Complementarity Problem for Images Deblurring |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230206 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7235129 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |