WO2024009469A1

WO2024009469A1 - 行列単純化装置、行列単純化方法、およびプログラム

Info

Publication number: WO2024009469A1
Application number: PCT/JP2022/027010
Authority: WO
Inventors: 崇元佐々木; 幸浩坂東; 正樹北原
Original assignee: 日本電信電話株式会社
Priority date: 2022-07-07
Filing date: 2022-07-07
Publication date: 2024-01-11
Also published as: JPWO2024009469A1

Abstract

行列単純化装置は、Ｍ行２列行列Ｙ＝［ｙ_１，ｙ_２］又は２行Ｍ列行列Ｙ^Ｔ＝［ｙ_１，ｙ_２］^Ｔを、２つのＭ次元ベクトルｙ_１，ｙ_２とするベクトル化部と、重みｗ＝［ｗ_１，ｗ_２］^Ｔによる行列Ｙの加重核型ノルムが、像ＩｍＹ上の回転行列をＲとするとき、［ｙ_１－Ｒｙ_２，ｙ_１＋Ｒｙ_２］と前記重みｗに基づくグループ尖星準ノルムで表されることに基づいて、前記加重核型ノルムのＳＶＴ（Singular Value Thresholding）を算出することにより、行列Ｙの低ランク近似化を行う低ランク近似化部と、を備える。

Description

行列単純化装置、行列単純化方法、およびプログラム

　本発明は、行列単純化装置、行列単純化方法、およびプログラムに関する。

　データや物理現象に潜在する低ランク性に基づくデータ解析手法（以降、低ランクモデリング）が、コンピュータビジョン、画像処理、ゲノムデータ解析などの多くの分野で近年活発に研究されている。ここで、低ランク性とは、データや物理現象から導かれる行列Ｘについて、その階数ｒａｎｋ（Ｘ）がＸのサイズ（ここでは、行列Ｘの行数または列数のうちの小さい方）と比較して小さい性質である。低ランクモデリングでは、着目した行列の階数（rank）を最小化する数理計画問題を立式し、この問題の解を求めて所望の解析を実現する。

　関数rankは不連続で微分不能、非凸であり、これに基づく計画問題はＮＰ困難な組合せ最適化となる。このため、rank関数の代わりに核型ノルムを正則化する緩和アプローチが広く用いられる。核型ノルムはrank関数の凸包絡であるため、核型ノルムを最小化することで間接的に低ランク性を高められる。また核型ノルムの代わりに加重核型ノルムを正則化するアプローチも広く用いられる。加重核型ノルムは低ランク性を高める効果が核型ノルムより高い。

　核型ノルムや加重核型ノルムを含む最適化問題は、Alternating Direction Method of Multipliers（ＡＤＭＭ）等の近接分離法の反復計算で解を求められ、核型ノルムや加重核型ノルムの近接写像である特異値閾値処理（Singular Value Thresholding；ＳＶＴ）が繰り返し実行される。

　しかし、ＳＶＴ算出には計算量の大きい特異値分解（Singular Value Decomposition；ＳＶＤ）の算出が必要なため、解析結果を得るのに多くの計算時間を要する。ここで、各解析法で立式される核型ノルム正則化問題を、（１）少数の大型行列を正則化する問題と、（２）多数の小型行列を正則化する問題に分類する。前者（１）の用途は、例えば、ロバスト主成分分析や、欠損値推定・補間や、オプティカルフロー推定や、ダイナミックＭＲＩ（Magnetic Resonance Imaging）解析や、ゲノム解析等である。また、後者（２）の用途は、グラフ単純化や、偽色除去等である。

　前者（１）の問題の場合には、計算量を抑えてＳＶＴを高速化する手法がいくつか提案されている。J.F.Caiらは、行列を事前に完全直交分解（Complete Orthogonal Decomposition；ＣＯＤ）した後にニュートン法で反復更新し、ＳＶＤを行わずにＳＶＴを求める高速ＳＶＴ（Fast SVT；ＦＳＶＴ）を提案している（非特許文献１）。またT.H.Ohらは、大型行列を直交行列と小型のコア行列の積に近似することで、ＳＶＤの入力サイズを小さくして高速化する高速ランダム化ＳＶＴ（Fast Randomized SVT；ＦＲＳＶＴ）を提案している（非特許文献２）。ここに挙げるいずれの手法も、入力行列のサイズが大きい（行数および列数がそれぞれ５００～２０００程度）ときに計算量を抑え、大幅な速度改善効果を示す。

　一方で後者（２）の問題の場合、上記手法による高速化の効果は限定的であると考えられる。ＦＳＶＴを用いると、入力が小型の場合、直接のＳＶＤ計算と比較してＣＯＤとニュートン法の計算量が大きいという問題がある。また、ＦＲＳＶＴを用いると、入力が小型の場合、コア行列の縮退効果が小さいために高速化できず、また近似法であるため計算誤差が大きいという問題がある。加えて、これらの手法は多数の行列を同時に処理するデータ並列のアプローチを取れず、近年の並列アーキテクチャの計算資源を有効に活用できないという問題もある。

　特許文献１および非特許文献３では、計算量を抑えながらデータを並列に核型ノルムのＳＶＴを算出する高速並列ＳＶＴ（Fast Parallel SVT；ＦＰＳＶＴ）が提案されている。ＦＰＳＶＴでは、特異値を用いずにＬ_∞，２混合ノルムで核型ノルムを表現することで、ＳＶＤが不要なＳＶＴ計算を実現し、計算量を削減している。加えて、データを並列に処理する並列化アルゴリズムを容易に実現でき、多数の行列について同時処理が可能である。

特許第６８１０００３号公報

J.-F. Cai, O. Stanley, "Fast singular value thresholding without singular value decomposition," Methods and Applications of Analysis, vol.20, no.4, pp.335-352, Dec. 2013. T. H. Oh, Y. Matsushita, Y. W. Tai, and I. S. Kweon, "Fast randomized singular value thresholding for nuclear norm minimization," 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp.4484-4493, June 2015. 佐々木崇元, 北原正樹, 清水淳, "低ランク最適化のための高速特異値閾値処理の数理,"第16回情報科学技術フォーラム (FIT), 第1分冊, 2017, pp.5－12.

　しかしながら特許文献１、非特許文献３の技術では、核型ノルムのＳＶＴを高速に求められるが、加重核型ノルムのＳＶＴを求められない。低ランクモデリングにおいて低ランク性をより高めるために、加重核型ノルムのＳＶＴを高速に求める技術が求められている。

　本発明は、上記の課題認識に基づいて行われたものであり、加重核型ノルムのＳＶＴ（特異値閾値処理）についてより少ない計算量でかつ並列に求めることができ、より高速に行列の低ランク化をすることが可能となる行列単純化装置、行列単純化方法、およびプログラムを提供することを目的とする。

　本発明の一態様は、Ｍ行２列行列Ｙ＝［ｙ_１，ｙ_２］又は２行Ｍ列行列Ｙ^Ｔ＝［ｙ_１，ｙ_２］^Ｔを、２つのＭ次元ベクトルｙ_１，ｙ_２とするベクトル化部と、重みｗ＝［ｗ_１，ｗ_２］^Ｔによる行列Ｙの加重核型ノルムが、像ＩｍＹ上の回転行列をＲとするとき、［ｙ_１－Ｒｙ_２，ｙ_１＋Ｒｙ_２］と前記重みｗに基づくグループ尖星準ノルムで表されることに基づいて、前記加重核型ノルムのＳＶＴ（Singular Value Thresholding）を算出することにより、行列Ｙの低ランク近似化を行う低ランク近似化部と、を備える行列単純化装置である。

　本発明の一態様は、Ｍ行２列行列Ｙ＝［ｙ_１，ｙ_２］又は２行Ｍ列行列Ｙ^Ｔ＝［ｙ_１，ｙ_２］^Ｔを、２つのＭ次元ベクトルｙ_１，ｙ_２とするベクトル化ステップと、行列Ｙの重みｗ＝［ｗ_１，ｗ_２］^Ｔによる加重核型ノルムが、像ＩｍＹ上の回転行列をＲとするとき、（ｙ_１－Ｒｙ_２，ｙ_１＋Ｒｙ_２）とｗに基づくグループ尖星準ノルムで表されることに基づいて、前記加重核型ノルムのＳＶＴ（Singular Value Thresholding）を算出することにより、行列Ｙの低ランク近似化を行う低ランク近似化ステップと、を含む行列単純化方法である。

　本発明の一態様は、コンピュータを、Ｍ行２列行列Ｙ＝［ｙ_１，ｙ_２］又は２行Ｍ列行列Ｙ^Ｔ＝［ｙ_１，ｙ_２］^Ｔを、２つのＭ次元ベクトルｙ_１，ｙ_２とするベクトル化部、行列Ｙの重みｗ＝［ｗ_１，ｗ_２］^Ｔによる加重核型ノルムが、像ＩｍＹ上の回転行列をＲとするとき、（ｙ_１－Ｒｙ_２，ｙ_１＋Ｒｙ_２）とｗに基づくグループ尖星準ノルムで表されることに基づいて、前記加重核型ノルムのＳＶＴ（Singular Value Thresholding）を算出することにより、行列Ｙの低ランク近似化を行う低ランク近似化部、として機能させるためのプログラムである。

　本発明によれば、加重核型ノルムのＳＶＴ（特異値閾値処理）についてより少ない計算量でかつ並列に求めることができ、より高速に行列の低ランク化をすることが可能となる。

本発明の実施形態を説明する図であり、空間ＩｍＹにおけるベクトルｙ_１，ｙ_２，Ｒｙ_２，－Ｒｙ_２の関係を示すグラフである。アルゴリズム１（Ｍ≧３の場合のＳＶＴ算出法）を示す概略図である。アルゴリズム２（Ｍ＝２の場合のＳＶＴ算出法）を示す概略図である。行列単純化装置の概略機能構成の例を示すブロック図である。行列単純化装置が処理する主要なデータの構成の例を示す概略図である。行列単純化装置が処理する主要なデータの構成の例を示す概略図である。行列単純化装置が処理する主要なデータの構成の例を示す概略図である。行列単純化装置の処理の流れの例を示すフローチャートである。

　次に、本発明の実施形態について、図面を参照しながら説明する。以下において、実施形態に共通する低ランクモデリングについて説明し、その後で行列単純化装置１等の具体的な構成を説明する。

［１．加重核型ノルム正則化に基づく低ランクモデリング］
　本実施形態が対象とする加重核型ノルム正則化問題は、次に説明する通りの問題である。
　行列Ｘ∈Ｒ^Ｍ×Ｎ（ここで、Ｒは実数の集合。Ｒ^Ｍ×Ｎは実数を要素とするＭ行Ｎ列の行列の集合。以下においても同様。）の特異値をσ_ｉ（Ｘ）、ｉ＝１，２，・・・，Ｋとする。ただし、Ｋ＝ｍｉｎ（Ｍ，Ｎ）であり、ｍｉｎ（）は引数の最小値を返す関数である。なお、以後において、Ｍ行Ｎ列の行列のサイズを単に「Ｍ×Ｎ」と表す場合がある。

　このとき、加重核型ノルムは特異値σ_ｉ（Ｘ）の重み付けｗ_ｉの和として定義される。即ち、次の式(1)の通りである。

この加重核型ノルムを正則化することで低ランク性を推進できる。

　本実施形態は、多数の小型行列が加重核型ノルムで正則化される最適化問題を取り扱う。この問題は次の式(2)の形式を有する。

　式(2)で目的関数の第２項は加重核型ノルムの和による低ランク性の正則化関数であり、第１項はその他の正則化や忠実化関数である。線形写像Ｌ_ｉは低ランク性を規約する行列を生成するための線形写像である。

　背景技術において述べた「（２）多数の小型行列を正則化する問題」を解くためには、関数ｆと線形写像Ｌ_ｉに応じたアルゴリズムを選択する。そのアルゴリズムとして、非特許文献４や、非特許文献５では、関数ｆが微分可能あるいは近接写像計算可能であるため、ＡＤＭＭやPrimal Dual Splitting等の近接分離法を用いている。

［非特許文献４］佐々木崇元，谷田隆一，清水淳，“グラフ信号の局所線形近似によるグラフ形状単純化，” 第１５回情報科学技術フォーラム(FIT2016)，第３分冊，pp.1-4，Sept.2016.
［非特許文献５］S. Ono and I. Yamada, “Color-line regularization for color artifact removal,” IEEE Transactions on Computational Imaging, vol.2, no.3, pp.204-217, 2016.

　なお、ここで「近接写像計算可能」の意味は次の通りである。即ち、関数ｇに対し、点（ベクトル）ｙでの近接写像ｐｒｏｘ_ｇは、次の式(3)の様に定義される。

　加重核型ノルムを含むいくつかの関数については近接写像の効率的な計算法が知られており、そのような関数を近接写像計算可能であると呼ぶ。

　上記の近接分離法は、最適解への収束列を生成する反復計算手続きで、各反復では関数の勾配や近接写像などの１次情報に基づき解を更新し、目的関数を最小化する。

　「多数の小型行列を正則化する問題」の加重核型ノルムの和の正則化関数については、補助変数Ｙ_ｉ＝Ｌ_ｉＸ（ｉ＝１，…，Ｌ）を導入し、次の式(4)で表されるｇ（Ｙ_１，…，Ｙ_Ｌ）の近接写像を計算すれば良い。

　ｇ（Ｙ_１，…，Ｙ_Ｌ）の近接写像は、右辺を構成する各要素の近接写像を独立に計算すれば良く、次の式(5)が成立する。

　右辺の各要素は加重核型ノルムの近接写像で、加重核型ノルムのＳＶＴに等しい。加重核型ノルムは上の式において｜｜・｜｜_＊，ｗと表されている。

　加重核型ノルムのＳＶＴは、入力行列をＹ、重みベクトルをｗとして、次の式(6)で算出される。

　ここで、関数ＳＶＤ（・）は、特異値分解（ＳＶＤ）である。また、（・）_＋は、入力の各要素を非負値にクリッピングするランプ関数である。ｄｉａｇ（・）は入力ベクトルから対角行列を生成する関数である。

　なお、本実施形態での特異値分解は、「thin SVD」である。即ち、Ｙ＝ＵΣＶ^Ｔと分解した時（Ｙ∈Ｒ^Ｍ×Ｎ）、行列Ｕ，ＶはＫ＝ｍｉｎ（Ｍ，Ｎ）個の正規直交なベクトルから成り、（Ｋ＋１）番目以降の特異ベクトルの算出は省略する（Ｕ∈Ｒ^Ｍ×Ｋ，Ｖ∈Ｒ^Ｎ×Ｋ）。また、行列ΣはＫ×Ｋ対角行列である。数値解析ソフトＭＡＴＬＡＢ（MathWorks社，米国）で記述する場合は、「[U,S,V]=svd(Y,'econ');」である。

　即ち、関数ｇ（Ｙ_１，Ｙ_２，・・・，Ｙ_Ｌ）の近接写像は、Ｌ回のＳＶＴにより算出でき、それぞれのＳＶＴでは小型行列を入力とするＳＶＤ算出が必要である。近接分離法で反復演算する際、計算時間の多くは計算量の大きいＳＶＤ算出に費やされる。

　さて、関数ｇ（Ｙ_１，Ｙ_２，・・・，Ｙ_Ｌ）の近接写像はＬ個の行列Ｙ_１，Ｙ_２，・・・，Ｙ_Ｌの各々の間における依存関係が無いため、タスク並列処理が可能である。つまり、行列Ｙ_１，Ｙ_２，・・・，Ｙ_Ｌの各々についてＬ並列での処理が可能である。なお、扱う問題において各行列のサイズが小さい場合には、処理割当やメモリロードのオーバーヘッドが相対的に大きく、並列化による改善の効果が限定的である場合もある。

　そこで、オーバーヘッドが少ない、データ並列処理について説明する。アルゴリズムをデータ並列化できれば、Single Instruction Multiple Data（ＳＩＭＤ）等のデータ並列アーキテクチャを用いた実装により処理を高速化できる。しかし、ＳＶＤの算出は逐次的であり、且つ行列要素の参照位置や処理内容が入力Ｙ_ｉに依存するため、行列間で共通に計算できる処理が少なく、データ並列化は本質的に困難である。
　以上より、多数の小型行列を低ランクに正則化するモデルは最適解を高速に得るのが困難で、その原因は、ＳＶＤの多大な計算量と並列化の難しさにある。

［２．Fast Parallel SVT（ＦＰＳＶＴ）］
　ここでは、多数のＳＶＴ計算を高速に算出するＦＰＳＶＴを導出する。この手法は加重核型ノルムがグループ尖星準ノルムにより表現されるという特徴に基づいて導かれる。この特徴により、特異値を用いずに加重核型ノルムを表現できる。またＳＶＤを用いずにＳＶＴを表現できる。そしてこのＳＶＴは、ほとんどが線形変換で記述できるため、データ並列なアルゴリズムを導ける。本実施形態で得られるＳＶＴ算出法では計算量が削減されており、かつデータ並列なアルゴリズムとして実行可能である。

　入力行列のサイズをＭ×２とする次の式(7)が成り立つことから、入力が２×Ｎのサイズの行列のＳＶＴの算出は、Ｎ×２のサイズの行列のＳＶＴ算出の前後に、式(7)の転置処理を施すことで実現できる。

　まず特異値和σ_１＋σ_２と特異値差σ_１－σ_２は、非特許文献３により次の式(8)で表す通りである。なお式(8)において複号同順である。

ここでＲは回転行列であり、この回転行列Ｒは、像ＩｍＹ上のベクトルを、原点回りにＩｍＹに沿ってπ／２［ｒａｄ］回転させる。ただし回転方向の正負については、図１に示すように、ｙ_１からｙ_２に最短で辿り着く方向を回転の正方向（第１の方向）とし、その反対方向を負方向（第２の方向）とする。

　なお、上記の像ＩｍＹについて、次の通りである。即ち、行列Ａ∈Ｒ^Ｍ×Ｎに対し、部分空間ＩｍＡ＝｛Ａｘ｜ｘ∈Ｒ^Ｎ｝⊂Ｒ^ＭをＡの像という。

　これより、加重核型ノルムについて次の式(9)が成り立つ。

ここで、Ａとωは次の式(10-1)，(10-2)で表される。

また式(9)において関数vecは入力行列Ｙ＝［ｙ_１，ｙ_２］∈Ｒ^Ｍ×２を並べ替えて列ベクトル［ｙ_１ ^Ｔ，ｙ_２ ^Ｔ］^Ｔ∈Ｒ^２Ｍを出力する線形変換である。

　グループ尖星準ノルムΓ_ω（ｙ’_１，ｙ’_２）は（非特許文献６）、次の式(11)で表される。

ここで｜｜ｙ’｜｜_［１］と｜｜ｙ’｜｜_［２］は、次の式(12)で表される。

［非特許文献６］佐々木崇元, 坂東幸浩, 北原正樹, “尖星全変動正則化に基づくグラデーションとエッジ同時制御可能なエッジ保存平滑化,” 第36回信号処理シンポジウム講演論文集, 電子情報通信学会信号処理研究専門委員会, 2021, pp.181－186.

　これより近接写像は、

である。

　またｐｒｏｘ_Γω（ｙ_１’，ｙ_２’）は、

である。

ここで

である。ｓｇｎ（・）は符号関数、○に点は要素積、｜ｘ｜_↓は［｜ｘ_１｜，…，｜ｘ_N｜］^Ｔを降順にソートしたベクトルである。ｐｒｏｊ_κｍ（・）は非増加単調錘への射影でPool Adjacent Violators AlgorithmによってＯ（Ｎ）の計算量で解ける。

ｐｒｏｘ_Ωω（ａ，ｂ）において、ａ≧ｂ≧０，ω_１＋ω_２≧０，ω_２≦０を考えると、ｓｇｎ関数、ソート、絶対値は必要がなくなり、

である。

これを計算すると、

である。

ゆえに

である。

よって、

である。

ここでα，βは

である。

　従って、

が成立する。

　行列Ｒは非特許文献３によれば、次の式(22)の通り計算できる。

　従って、Ｍ≧３のときのＲ［ｙ_２，－ｙ_１］は、

であるため、最終的に式(21)は、

により計算できる。

　一方、Ｍ＝２のときは

とすると、

であるため、最終的に式(21)は、

により計算できる。

　以上により、(i)Ｙ^ＴＹを求め、(ii)ｔｒＹ^ＴＹ，ｄｅｔＹ^ＴＹを求め、(iii)σ_１，σ_２を求め、(iv)α，βを求め、(v)ｐｒｏｘ_{｜｜・｜｜＊，ｗ}（Ｙ）を以上の式で求めるという手順で加重核型ノルムのＳＶＴを求めることができる。(i), (ii), (v)は積和計算、(iii)は四則計算と根号計算、(iv)は四則計算とクリッピングで算出できる。よって多数の入力行列Ｙ_１，…，Ｙ_ＬのＳＶＴである

をＳＩＭＤ演算によって高速、並列に求めることができる。

　図２は、Ｍ≧３の場合にＳＶＴ（Singular Value Thresholding）を算出するアルゴリズムを示す概略図である。このアルゴリズムは疑似的なコードによって記述されている。以下、この図に沿ってアルゴリズムを説明する。

　本アルゴリズムにおいて、入力は、Ｍ×２（Ｍ行２列）の行列Ｙ、およびＳＶＴの重みベクトルｗである。Ｙの１列目、２列目の列ベクトル（Ｍ次元）をそれぞれｙ_１，ｙ_２と表す。また、ｗ＝［ｗ_１，ｗ_２］^Ｔはｗ_２≧ｗ_１≧０である。また出力は行列Ｙの重みｗによるＳＶＴである。出力される行列をＺと表す。

　以下では図の左側に付した行番号を参照しながら説明する。第１行において、変数ａ、ｂ、ｃへの代入が行われる。変数ａにはｙ_１ ^Ｔｙ_１、変数ｂにはｙ_１ ^Ｔｙ_２、変数ｃにはｙ_２ ^Ｔｙ_２を代入する。これらａ、ｂ、ｃはいずれもスカラー値である。

　第２行において、変数ｄ、ｅ、ｆへの代入が行われる。変数ｄにはａｃ－ｂ^２の値、変数ｅには√ｄの値、変数ｆにはａ＋ｃの値を代入する。変数ｄの値は行列Ｙ^ＴＹの行列式であり、変数ｅの値はその平方根、変数ｆの値は行列Ｙ^ＴＹのトレースである。

　第３行において、変数ｇ、ｈへの代入が行われる。変数ｇには√（ｆ＋２ｅ）の値、変数ｈには√（ｆ－２ｅ）の値を代入する。変数ｇの値は行列Ｙの特異値の和であり、変数ｈの値は行列Ｙの特異値の差である。

　第４行において、変数σ_１，σ_２への代入が行われる。変数σ_１には（ｇ＋ｈ）／２の値、変数σ_２には（ｇ－ｈ）／２の値を代入する。変数σ_１の値は行列Ｙの最大特異値であり、変数σ_２の値は行列Ｙの最小特異値である。

　第５行において、変数αへの代入が行われる。変数αに、ｇが０でない場合は

の値を、ｇが０の場合は０を代入する。

　第６行において、変数βへの代入が行われる。変数βに、ｈが０でない場合は

の値を、ｈが０の場合は０を代入する。

　第７行において、出力である変数Ｚへの代入が行われる。変数Ｚに

の値を代入する。そして処理を終了してＺを出力する。
　以上、説明したように、ＳＶＤを用いず、少ない計算量でＳＶＴを算出することができる。

　図３は、Ｍ＝２の場合にＳＶＴ（Singular Value Thresholding）を算出するアルゴリズムを示す概略図である。このアルゴリズムは疑似的なコードによって記述されている。以下、この図に沿ってアルゴリズムを説明する。

　本アルゴリズムにおいて、入力は、２×２（２行２列）の行列Ｙ、およびＳＶＴの重みＷである。Ｙの１列目、２列目の列ベクトル（２次元）をそれぞれｙ_１，ｙ_２と表し、行列Ｙの各要素を、行番号および列番号をこの順で並べたサフィックス（添え字）を用いて、ｙ_１，１，ｙ_１，２，ｙ_２，１，ｙ_２，２で表す。また、ｗ＝［ｗ_１，ｗ_２］^Ｔはｗ_２≧ｗ_１≧０である。また出力は行列Ｙの重みｗによるＳＶＴである。出力される行列をＺと表す。

　以下では図の左側に付した行番号を参照しながら説明する。第１行において、変数ａ、ｃへの代入が行われる。変数ａにはｙ_１ ^Ｔｙ_１、変数ｃにはｙ_２ ^Ｔｙ_２を代入する。これらａ、ｃはいずれもスカラー値である。

　第２行において、変数ｄ、ｅ、ｆへの代入が行われる。変数ｄにはｙ_１，１ｙ_２，２－ｙ_１，２ｙ_２，１の値、変数ｅには｜ｄ｜の値、変数ｆにはａ＋ｃの値を代入する。変数ｄの値は行列Ｙの行列式であり、変数ｅの値はその絶対値で行列Ｙ^ＴＹの行列式の平方根、変数ｆの値は行列Ｙ^ＴＹのトレースである。

の値を、ｇが０の場合は０を代入する。

の値を、ｈが０の場合は０を代入する。

　ここで本実施形態のアルゴリズムによるＳＶＴ算出のための計算量について考察する。行列ＹのサイズをＭ×２とする。ＳＶＤを用いるＳＶＴ算出法（従来技術）では、ＳＶＤを求めるために２４Ｍ＋１６０回、閾値処理に２回、行列積を求めるために６Ｍ＋４回の浮動小数点演算が必要である。即ち合計で、３０Ｍ＋１６６回の浮動小数点演算が必要である。

　一方、本実施形態のアルゴリズム１による方法では１２Ｍ＋２６回、アルゴリズム２による方法では３３回の浮動小数点演算が必要である。従って、Ｍ＝２の場合は約８５％、Ｍ＝３の場合は約７６％、Ｍ＝１０の場合は約６９％、それ以上の場合でも６０％以上の浮動小数点演算を削減できることが分かる。

　加えてアルゴリズム１およびアルゴリズム２のアルゴリズムは、ＳＩＭＤなどの並列アーキテクチャにより効率的に並列処理を行うことができる。

［３．行列単純化装置］
　次に、本実施形態の行列単純化装置１について説明する。図４は、本実施形態による行列単純化装置１の概略機能構成を示すブロック図である。図４に示すように、行列単純化装置１は、入力部１１と、ベクトル化部１２と、低ランク近似化部１３と、出力部１４とを含んで構成される。また、各部は、必要に応じてデータを記憶するための記憶部を内部に備える。この記憶部は、半導体メモリーや磁気ハードディスク装置などといった記憶手段を用いて実現される。また、各部の機能は、コンピュータとプログラムとで実現されてもよい。

　行列単純化装置１は、Ｍ行２列（ただし、Ｍ≧２）または２行Ｍ列の行列と２次元ベクトルである重みｗ＝［ｗ_１，ｗ_２］^Ｔを入力され、その行列を低ランク近似化し、低ランク近似化した行列を出力する装置である。

　入力部１１は、Ｍ行２列または２行Ｍ列の行列のデータを外部から取得する。なお、Ｍは、２以上の整数である。この行列の要素は、数値（スカラー値）である。入力部１１は、必要に応じて、入力した行列を転置する。つまり、後段のベクトル化部１２および低ランク近似化部１３がＭ行２列または２行Ｍ列のいずれか一方の形式の行列のみを処理するように構成されているときであって、入力された行列がその形式に合わないとき（つまり、縦と横が逆）に、入力部１１は、入力された行列を転置する。これにより、行列単純化装置１は、Ｍ行２列または２行Ｍ列のいずれの行列をも処理することができるようになる

　以下において、ベクトル化部１２と低ランク近似化部１３とは、Ｍ行２列の行列を処理するものとして説明する。但し、これが２行Ｍ列の行列を処理するものであってもよく、本質的な処理内容は変わらない。

　ベクトル化部１２は、Ｍ行２列の行列（Ｙとする）をベクトル化する。ここでのベクトル化とは、Ｍ行２列の行列Ｙを、２個のＭ次元の列ベクトルｙ_１（第１ベクトル）とｙ_２（第２ベクトル）とに分割して出力する処理である。つまり、Ｙ＝［ｙ_１，ｙ_２］である。ベクトル化部１２は、これらのベクトルｙ_１，ｙ_２を、低ランク近似化部１３に渡す。

　つまり、ベクトル化部１２は、Ｍ行２列の入力行列から各列に対応するＭ次元の第１ベクトルおよび第２ベクトルを抽出する（または２行Ｍ列の入力行列から各行に対応するＭ次元の第１ベクトルおよび第２ベクトルを抽出する）。

　低ランク近似化部１３は、ベクトル化部１２から渡されたベクトルｙ_１，ｙ_２と重みｗ＝［ｗ_１，ｗ_２］^Ｔに基づき、行列Ｙを低ランク近似化する。言い換えれば、低ランク近似化部１３は、行列Ｙを単純化する。すなわち、低ランク近似化部１３は、Fast Parallel SVT（ＦＰＳＶＴ）で前述した算出方法により、行列Ｙを低ランク近似化する。具体的には、低ランク近似化部１３は、Ｍの値に応じて、前述のアルゴリズム１または２のいずれかを用いて、行列Ｙの低ランク近似化を行う。より具体的には、Ｍ≧３の場合には、低ランク近似化部１３は、アルゴリズム１を用いる。また、Ｍ＝２の場合には、低ランク近似化部１３は、アルゴリズム２を用いる。これにより、低ランク近似化部１３は、低ランク化された行列Ｚを出力する。

　出力部１４は、低ランク近似化部１３によって求められた行列Ｚのデータを外部に出力する。つまり、行列単純化装置１は、入力される行列Ｙを低ランク単純化し、その結果である行列Ｚを出力する。なお、入力部１１が行列の転置を行った場合、出力部１４は、低ランク近似化部１３によって得られた行列Ｚを再び転置してから出力する。これにより、入力される行列のサイズ（行および列の数）と、出力される行列のサイズとを合わせることができる。

　次に、行列単純化装置１が扱う行列およびベクトルのデータの構造について説明する。
　図５Ａ～図５Ｃは、行列単純化装置１が処理する主要なデータの構成を示す概略図である。図５Ａは、入力行列Ｙのデータ構成を示す。ここでは、Ｍ行２列の場合の行列を示している。この図では行番号と列番号を付して示しており、行列Ｙの要素であるｙ_ｉｊ（ｉ＝１，・・・，Ｍ、ｊ＝１，２）が各領域に格納される。なお、２行Ｍ列の行列の場合には、行と列の方向が入れ替わる。図５Ｂは、行列Ｙを基にベクトル化されたベクトルｙ_１およびｙ_２のデータ構成を示す。ベクトルｙ_１およびｙ_２は、それぞれ、Ｍ次元の列ベクトルである。行列Ｙ（図５Ａ）の第１列がベクトルｙ_１に対応し、第２列がベクトルｙ_２に対応する。図５Ｃは、出力行列Ｚのデータ構成を示す。行列Ｚについても、Ｍ行２列の場合の行列を示している。行列Ｚの要素であるz_ｉｊ（ｉ＝１，・・・，Ｍ、ｊ＝１，２）が各領域に格納される。

　次に、本実施形態の行列単純化装置１の処理の流れについて説明する。図６は、本実施形態による行列単純化装置１の処理の流れを示すフローチャートである。

　まず、入力部１１は、Ｍ行２列（ただし、Ｍ≧２）または２行Ｍ列の行列と２次元ベクトルである重みｗ＝［ｗ_１，ｗ_２］^Ｔを受付ける（ステップＳ１０１）。
　次に、入力部１１は、入力行列が２行Ｍ列の場合（２列でない場合）は、転置してＭ行２列とする（ステップＳ１０２）。
　次に、ベクトル化部１２は、Ｍ行２列の行列Ｙを、２個のＭ次元の列ベクトルｙ_１（第１ベクトル）とｙ_２（第２ベクトル）とに分割する（ステップＳ１０３）。

　次に、低ランク近似化部１３は、Ｍ≧３か否か判定する（ステップＳ１０４）。
　ステップＳ１０４でＹｅｓ（Ｍ≧３）の場合は、低ランク近似化部１３は、ｙ_１ ^Ｔｙ_１、ｙ_１ ^Ｔｙ_２、ｙ_２ ^Ｔｙ_２を算出して、それぞれ変数ａ、ｂ、ｃへ代入する（ステップＳ１０５）。これらａ、ｂ、ｃはいずれもスカラー値である。

　次に、低ランク近似化部１３は、ａｃ－ｂ^２、√ｄ、ａ＋ｃを算出して、それぞれ変数ｄ、ｅ、ｆへ代入する（ステップＳ１０６）。変数ｄの値は行列Ｙ^ＴＹの行列式であり、変数ｅの値はその平方根、変数ｆの値は行列Ｙ^ＴＹのトレースである。

　次に、低ランク近似化部１３は、√（ｆ＋２ｅ）、√（ｆ－２ｅ）を算出して、それぞれ変数ｇ、ｈへ代入する（ステップＳ１０７）。変数ｇの値は行列Ｙの特異値の和であり、変数ｈの値は行列Ｙの特異値の差である。

　次に、低ランク近似化部１３は、（ｇ＋ｈ）／２、（ｇ－ｈ）／２を算出して、それぞれ変数σ_１，σ_２へ代入する（ステップＳ１０８）。変数σ_１の値は行列Ｙの最大特異値であり、変数σ_２の値は行列Ｙの最小特異値である。

　次に、低ランク近似化部１３は、ｇが０でない場合は

を算出し、変数αへ代入する。一方、低ランク近似化部１３は、ｇが０の場合は変数αへ０を代入する（ステップＳ１０９）。

　次に、低ランク近似化部１３は、ｈが０でない場合は

を算出し、変数βへ代入する。一方、低ランク近似化部１３は、ｈが０の場合は変数βへ０を代入する（ステップＳ１１０）。

　次に、低ランク近似化部１３は、

を算出し、変数Ｚへ代入する（ステップＳ１１１）。

　一方、ステップＳ１０４でＮｏ（Ｍ＝２）の場合は、低ランク近似化部１３は、ｙ_１ ^Ｔｙ_１、ｙ_２ ^Ｔｙ_２を算出して、それぞれ変数ａ、ｃへ代入する（ステップＳ１１２）。これらａ、ｃはいずれもスカラー値である。

　次に、低ランク近似化部１３は、ｙ_１，１ｙ_２，２－ｙ_１，２ｙ_２，１、｜ｄ｜、ａ＋ｃを算出して、それぞれ変数ｄ、ｅ、ｆへ代入する（ステップＳ１１３）。変数ｄの値は行列Ｙの行列式であり、変数ｅの値はその絶対値で行列Ｙ^ＴＹの行列式の平方根、変数ｆの値は行列Ｙ^ＴＹのトレースである。

　次に、低ランク近似化部１３は、√（ｆ＋２ｅ）、√（ｆ－２ｅ）を算出して、それぞれ変数ｇ、ｈへ代入する（ステップＳ１１４）。変数ｇの値は行列Ｙの特異値の和であり、変数ｈの値は行列Ｙの特異値の差である。

　次に、低ランク近似化部１３は、（ｇ＋ｈ）／２、（ｇ－ｈ）／２を算出して、それぞれ変数σ_１，σ_２へ代入する（ステップＳ１１５）。変数σ_１の値は行列Ｙの最大特異値であり、変数σ_２の値は行列Ｙの最小特異値である。

　次に、低ランク近似化部１３は、ｇが０でない場合は

を算出し、変数αへ代入する。一方、低ランク近似化部１３は、ｇが０の場合は変数αへ０を代入する（ステップＳ１１６）。

　次に、低ランク近似化部１３は、ｈが０でない場合は

を算出し、変数βへ代入する。一方、低ランク近似化部１３は、ｈが０の場合は変数βへ０を代入する（ステップＳ１１７）。

　次に、低ランク近似化部１３は、

を算出し、変数Ｚへ代入する（ステップＳ１１８）。

　ステップＳ１１１又はステップＳ１１８の後、出力部１４は、変数Ｚ（ステップＳ１０２で入力行列を転置していた場合は、Ｚ^Ｔ）の値を出力する。
　以上で、図６の行列単純化装置１の処理の流れの説明は終了である。

　上述した各実施形態における行列単純化装置１の機能の全部または一部を、コンピュータで実現するようにしても良い。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、ＯＳや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ＵＳＢメモリー等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバーやクライアントとなるコンピュータシステム内部の揮発性メモリーのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。

［効果］
　以上、説明した実施形態による行列単純化装置１は、特異値閾値処理（ＳＶＴ）の高速算出アルゴリズムを実行可能である。これにより、多数の小型行列を低ランク正則化する最適化問題の解を高速に求めることが可能となる。
　具体的には、行列単純化装置１は、Ｍ行２列または２行Ｍ列（Ｍ≧２）の行列を対象として、低ランク化処理を、少ない計算量で高速に実行することが可能となる。また、行列単純化装置１は、複数の行列を対象として、低ランク化処理を並列して実行することができる。つまり、行列単純化装置１により、Ｍ行２列または２行Ｍ列の行列に対するＦＰＳＶＴ（Fast Parallel SVT）アルゴリズムが実現される。

　さらに具体的には、核型ノルムを部分空間上のベクトル距離で表現できる発見に基づき、行列単純化装置１により、特異値分解（ＳＶＤ）が不要でデータ並列なＳＶＴ算出法を実現した。また、実際のデータを用いた評価実験の結果、従来手法以上の計算精度を持ちつつ、最大７７倍高速にＳＶＴを算出できることを確認した。

　以上、本発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。

　本発明は、多数の小型行列が加重核型ノルムで正則化される最適化問題を取り扱う技術に適用できる。またこれにより本発明は、グラフ単純化や偽色除去等をはじめとするデータや物理現象に潜在する低ランク性に基づくデータ解析を行う技術に適用できる。

　１・・・・行列単純化装置
　１１・・・入力部
　１２・・・ベクトル化部
　１３・・・低ランク近似化部
　１４・・・出力部

Claims

　Ｍ行２列行列Ｙ＝［ｙ_１，ｙ_２］又は２行Ｍ列行列Ｙ^Ｔ＝［ｙ_１，ｙ_２］^Ｔを、２つのＭ次元ベクトルｙ_１，ｙ_２とするベクトル化部と、
　重みｗ＝［ｗ_１，ｗ_２］^Ｔによる行列Ｙの加重核型ノルムが、像ＩｍＹ上の回転行列をＲとするとき、［ｙ_１－Ｒｙ_２，ｙ_１＋Ｒｙ_２］と前記重みｗに基づくグループ尖星準ノルムで表されることに基づいて、前記加重核型ノルムのＳＶＴ（Singular Value Thresholding）を算出することにより、行列Ｙの低ランク近似化を行う低ランク近似化部と、
　を備える行列単純化装置。
　前記グループ尖星準ノルムは、

とするとき、

と表される
　請求項１に記載の行列単純化装置。
　前記低ランク近似化部は、前記重みｗによる前記行列Ｙの前記加重核型ノルムのＳＶＴを、前記行列Ｙの最大特異値をσ_１、最小特異値をσ_２とし、σ_１とσ_２とｗとに基づく値をα，βとするとき、

により算出する
　請求項１に記載の行列単純化装置。
　前記低ランク近似化部は、（・）_＋をランプ関数とするとき、前記α，βを

により算出する
　請求項３に記載の行列単純化装置。
　前記低ランク近似化部は、Ｍ≧３のとき、ｄｅｔＹをＹの行列式とするとき、Ｒ［ｙ_２，－ｙ_１］を

により算出する
　請求項３に記載の行列単純化装置。
　前記低ランク近似化部は、Ｍ＝２のとき、

とし、ｓｇｎ（・）を符号関数、ｄｅｔＹをＹの行列式とするとき、Ｒ［ｙ_２，－ｙ_１］を

により算出する
　請求項３に記載の行列単純化装置。
　Ｍ行２列行列Ｙ＝［ｙ_１，ｙ_２］又は２行Ｍ列行列Ｙ^Ｔ＝［ｙ_１，ｙ_２］^Ｔを、２つのＭ次元ベクトルｙ_１，ｙ_２とするベクトル化ステップと、
　行列Ｙの重みｗ＝［ｗ_１，ｗ_２］^Ｔによる加重核型ノルムが、像ＩｍＹ上の回転行列をＲとするとき、（ｙ_１－Ｒｙ_２，ｙ_１＋Ｒｙ_２）とｗに基づくグループ尖星準ノルムで表されることに基づいて、前記加重核型ノルムのＳＶＴ（Singular Value Thresholding）を算出することにより、行列Ｙの低ランク近似化を行う低ランク近似化ステップと、
　を含む行列単純化方法。
　コンピュータを、
　Ｍ行２列行列Ｙ＝［ｙ_１，ｙ_２］又は２行Ｍ列行列Ｙ^Ｔ＝［ｙ_１，ｙ_２］^Ｔを、２つのＭ次元ベクトルｙ_１，ｙ_２とするベクトル化部、
　行列Ｙの重みｗ＝［ｗ_１，ｗ_２］^Ｔによる加重核型ノルムが、像ＩｍＹ上の回転行列をＲとするとき、（ｙ_１－Ｒｙ_２，ｙ_１＋Ｒｙ_２）とｗに基づくグループ尖星準ノルムで表されることに基づいて、前記加重核型ノルムのＳＶＴ（Singular Value Thresholding）を算出することにより、行列Ｙの低ランク近似化を行う低ランク近似化部、
　として機能させるためのプログラム。