JP7396601B2 - 解析装置、解析方法及びプログラム - Google Patents

解析装置、解析方法及びプログラム Download PDF

Info

Publication number
JP7396601B2
JP7396601B2 JP2022536433A JP2022536433A JP7396601B2 JP 7396601 B2 JP7396601 B2 JP 7396601B2 JP 2022536433 A JP2022536433 A JP 2022536433A JP 2022536433 A JP2022536433 A JP 2022536433A JP 7396601 B2 JP7396601 B2 JP 7396601B2
Authority
JP
Japan
Prior art keywords
data
measure
analysis
probability
inner product
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022536433A
Other languages
English (en)
Other versions
JPWO2022014657A1 (ja
Inventor
悠香 橋本
勲 石川
正弘 池田
吉伸 河原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
RIKEN Institute of Physical and Chemical Research
Original Assignee
Nippon Telegraph and Telephone Corp
RIKEN Institute of Physical and Chemical Research
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, RIKEN Institute of Physical and Chemical Research filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2022014657A1 publication Critical patent/JPWO2022014657A1/ja
Application granted granted Critical
Publication of JP7396601B2 publication Critical patent/JP7396601B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/52Multiplying; Dividing
    • G06F7/523Multiplying only
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Complex Calculations (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、解析装置、解析方法及びプログラムに関する。
自然界に現れるデータは基本的にランダム性を含んでおり、ランダム性を考慮したデータ解析技術が従来から研究されている。このようなランダム性をデータ解析において扱う枠組みとして、カーネル平均埋め込み(kernel mean embedding)が知られている。ランダム性は、事象の起こりやすさを表す集合関数である確率測度によって定式化される。カーネル平均埋め込みでは、この確率測度に内積やノルムといった「近さ」の概念を与える手法であり、確率測度同士の近さはRKHS(reproducing kernel Hilbert space)と呼ばれる空間での内積により与えられる。多くのデータ解析手法は近さの概念により成り立っているため、これにより、ランダム性を含むデータ同士の近さを測ったり、或るランダム性のあるデータを生成する確率測度を推定したりする等の一般的なデータ解析を、ランダム性のあるデータに対して適用することが可能となる。
一方で、ランダム性を含まないデータ解析技術で、複数のデータの相互作用を考慮する枠組みとして、RKHM(reproducing kernel Hilbert C*-module)を用いたものが知られている。RKHMはRKHSの拡張であり、通常複素数値である内積の代わりに、行列や線形作用素を一般化したC*-algebraと呼ばれる空間に値を持つ内積を定義することで、相互作用の情報を保存したまま解析を行うことができるようになる。これにより、相互作用のあるデータを精度良く解析したり、相互作用の情報を抽出したりすることが可能となる。
ところで、データの中には、複数のランダムなデータが相互作用し合って生じるものも多い。また、量子計算等の量子を扱う分野においては、量子の状態が各観測の確率という複数の確率により表現される。ランダム性を定式化するためには確率測度が用いられるが、データ解析における既存の枠組みでは、確率測度は複素数値であり、複数のランダム性を同時に扱うことはできない。一方で、量子力学においては、複数の確率により表される量子の状態を定式化するために、Hilbert空間上の線形作用素に値を持つ確率測度が用いられている(例えば、非特許文献1)。また、純粋数学の分野では、これをより一般化したベクトル値測度という概念が理論的に研究されている(例えば、非特許文献2)。
H.E. Brandt, Quantum measurement with a positive operator-valued measure. Acta Phys. Hung. B 20, 95-99, 2004. C. W. Swartz, Products of vector measures by means of Fubini's theorem, Mathematica Slovaca, 27(4):375-382, 1977.
しかしながら、上記の非特許文献1や非特許文献2は理論的な研究に留まっており、実際のデータ解析において、線形作用素に値を持つ確率測度を利用する枠組みは未だない。最近では量子から現れるデータを、機械学習の手法を用いて解析する研究も注目を集めており、そのような観点からも、複数のランダム性を同時に扱えるような、線形作用素に値を持つ確率測度をデータ解析において利用する枠組みは重要であると考えられる。
本発明の一実施形態は、上記の点に鑑みてなされたもので、複数のランダム性を持つデータ解析を実現することを目的とする。
上記目的を達成するため、一実施形態に係る解析装置は、ランダム性を持つ複数のデータのデータ集合を取得する取得部と、前記データ集合上の確率測度μ及びνであって、フォン・ノイマン環に値を持つ確率測度μ及びνを、カーネル平均埋め込みを拡張した写像ΦによってRKHM上にそれぞれ写像したΦ(μ)及びΦ(ν)の内積又はノルムを、前記確率測度μ及びνの内積又はノルムとして計算する解析部と、を有することを特徴とする。
複数のランダム性を持つデータ解析を実現することができる。
本実施形態に係る解析装置のハードウェア構成の一例を示す図である。 本実施形態に係る解析装置の機能構成の一例を示す図である。 本実施形態に係るデータ解析処理の一例を示すフローチャートである。 実験結果の一例を示す図(その1)である。 実験結果の一例を示す図(その2)である。
以下、本発明の一実施形態について説明する。本実施形態は、複数のランダム性を持つデータ解析を行うことができる解析装置10について説明する。本実施形態に係る解析装置10を用いることで、複数のランダム性を持つデータの解析、特に、例えば、複数のランダムなデータが相互作用し合っている場合のデータや量子状態を表すデータの可視化、異常検知等を行うことが可能となる。なお、本実施形態に係る解析装置10は、このような可視化や異常検知等の解析に加えて、例えば、その解析結果(特に、異常検知結果等)に基づいて、異常が検知されたデータが表す装置、機器、プログラム等の停止等の制御を行ってもよい。
<理論的構成及びその応用例>
まず、本実施形態の理論的構成及びその応用例について説明する。本実施形態では、カーネル平均埋め込みを拡張し、線形作用素に値を持つ確率測度に内積・ノルム等の「近さ」の概念を与える。ただし、複数のランダム性の情報をできるだけ保った解析を行うために、内積の値は複素数値ではなく、線形作用素値とする。このために、RKHSを用いた既知のカーネル平均埋め込みの代わりに、RKHMを用いたカーネル平均埋め込みとする。
1. RKHMを用いたカーネル平均埋め込み
Xをデータ(ランダム性を持つデータ)の属する空間、Aをフォン・ノイマン環(von Neumann-algebra)とし、A値positive definite kernel k:X×X→Aを考える。ただし、写像k:X×X→AがA値positive definite kernelであるとは、以下の条件1及び条件2を満たすことをいう。なお、フォン・ノイマン間の具体例としては、例えば、線形作用素全体の集合や行列全体の集合等が挙げられる。
(条件1)任意のx,y∈Xに対して、k(x,y)=k(x,y)は共役を表す)
(条件2)mを任意の自然数として、任意のx,x,・・・,xm-1∈Xと任意のc,c,・・・,cm-1∈Aに対して、
Figure 0007396601000001
はpositive
ここで、positiveとはvon Neumann-algebraで正定値であることを意味し、全ての固有値が0以上であるエルミート行列(つまり、エルミート正定値)等の一般化である。
A値positive definite kernel kが与えられたとき、XからA値関数への写像φを、φ(x)=k(・,x)により定義する。この写像φはfeature mapとも呼ばれる。
自然数mと、x,x,・・・,xm-1∈Xと、c,c,・・・,cm-1∈Aに対して、
Figure 0007396601000002
全体から、RKHMと呼ばれる空間を構成することができる。この空間をMと表す。Mには、A値の内積〈・,・〉とA値の大きさ|・|を定めることができる。
X上のA値測度とは、可測集合と呼ばれるXの部分集合からAへの関数μで、任意の2ペアの交わりがないような可算無限個の可測集合E,E,・・・に対して、
Figure 0007396601000003
を満たすものである。
A値測度に対して、その測度に関する積分を考えることができる。A値関数fが、単関数と呼ばれる関数の列
Figure 0007396601000004
の極限で表されるとき、fのμに関する積分は、sのμに関する積分の極限で定義される。ここで、単関数sとは、或る有限個の可測集合E,・・・,Eで任意の2ペアの交わりがないようなものとc,・・・,c∈Aに対して、
Figure 0007396601000005
と表されるような関数である。ただし、
Figure 0007396601000006
は指示関数である。
このとき、s(x)を左からμで積分した値を
Figure 0007396601000007
で定義し、
Figure 0007396601000008
と表す。同様に、s(x)を右からμで積分した値を
Figure 0007396601000009
で定義し、
Figure 0007396601000010
と表す。
上記の設定の下、有限なA値測度をRKHMの元に移す写像Φを、
Figure 0007396601000011
により定め、カーネル平均埋め込みと呼ぶ。RKHMの元同士のA値内積は定まっているため、Φが単射であれば、有限なA値測度μ、νのA値内積を、Φ(μ)とΦ(ν)のA値内積によって定めることができる。
例えば、X=R、A=Cm×mに対して、k:X×X→Aを、
Figure 0007396601000012
とする。ただし、||・||はR上のユークリッドノルム、c>0、Iはm次の単位行列である。また、Rは実数値全体、Cは複素数値全体を表す。このとき、このkから定まるΦは単射であることが示せる。
2. RKHMを用いたカーネル平均埋め込みの応用
2.1 A値測度の間の距離
有限A値測度μ、νのA値距離を以下で定義する。
γ(μ,ν)=|Φ(μ)-Φ(ν)|
このとき、Φが単射であれば、例えば、||γ(μ,ν)||は距離の性質を完全に満たす。つまり、||γ(μ,ν)||=||γ(ν,μ)||、||γ(μ,ν)||=0ならばμ=ν、||γ(μ,ν)||≦||γ(μ,λ)||+||γ(λ,ν)||が任意の有限A値測度μ、ν、λに対して成立する。
以下に有限A値測度の例を2つ挙げる。
例1:ランダム性を持つ複数のデータ間の共分散を表す測度
A=Cm×mとする。Xに値を持つm個の確率変数X,・・・,XとY,・・・,Yを考える。PをX上の確率測度とし、μを、(i,j)成分がXとXの共分散を表す測度(X,X*PになるようなA値測度(又は、その測度を中心化したバージョン
Figure 0007396601000013
になるようなA値測度)とする。このとき、γ(μ,μ)=0と、任意の有界関数f、gにより変換された確率変数の共分散が等しいこととが同値になる。よって、このようなA値測度に対して、後述するKernel PCAを行うことで、データ間の共分散の情報を保つような低次元の空間を得ることができる。
実際には、X,・・・,Xから得られたデータ{x1,1,x1,2,・・・,x1,N},・・・,{xm,1,xm,2,・・・,xm,N}と、Y,・・・,Yから得られたデータ{y1,1,y1,2,・・・,y1,N},・・・,{ym,1,ym,2,・・・,ym,N}とが与えられた際、Φ(μ)とΦ(μ)の内積〈Φ(μ),Φ(μ)〉の(i,j)成分を以下の式(1)のように近似する。
Figure 0007396601000014
ただし、k(x,y)は、全ての成分がX上の複素数値positive definite kernel
Figure 0007396601000015
であるようなCm×m値positive definite kernelである場合を考える。
例2:量子の状態を表す測度
量子力学において、Aを有界線形作用素全体の集合とする。量子の状態は線形作用素ρにより表され、その観測はA値測度μにより表されるため、量子の状態を表す線形作用素ρ、ρ、観測を表すA値測度μ、μに対し、各状態の観測μρとμρの近さはΦ(μρ)とΦ(μρ)の内積により表すことができる。
例えば、A=Cm×m、X=Cとし、i=1,・・・,sに対し、|ψ〉∈Xを正規化されたベクトルとする。これに対して、観測(つまり、X上のA値測度)
Figure 0007396601000016
を考える。このとき、状態ρ、ρ∈Cm×mに対して、Φ(μρ)とΦ(μρ)の内積は以下の式(2)により計算できる。
Figure 0007396601000017
2.2 Kernel PCA
A=Cm×mとする。複数のA値測度μ,・・・,μに対して、〈Φ(μ),Φ(μ)〉∈Aを(i,j)ブロックに持つ行列をGとする。Gはエルミート正定値行列になるため、固有値λ≧・・・≧λmn≧0と、これらの固有値にそれぞれ対応する正規直交な固有ベクトルv,・・・,vmnとが存在する。第i主軸を
Figure 0007396601000018
により定義し、pと表すこととすると、任意のs=1,・・・,mnに対してp,・・・,pは以下の式(3)を満たす。
Figure 0007396601000019
つまり、p,・・・,pは、Φ(μ),・・・,Φ(μ)を表現するs個(通常、s<<n)のベクトルのうち、誤差を最小にするものとみなせる。そこで、Φ(μ)を
Figure 0007396601000020
で近似することでμ,・・・,μを可視化したり、或るA値測度μに対して
Figure 0007396601000021
を、μがμ,・・・,μと比べてどの程度外れているかの値とみなして異常検知を行ったりすることができる。また、上述したように、データ間の共分散の情報を保つように次元削減を行うことができる。
2.3 その他の応用例
機械学習や統計のRKHSにおけるカーネル平均埋め込みを用いる既存の方法は、RKHSにおける確率測度のカーネル平均埋め込みを、上記の例1で記載した共分散を表す測度のRKHMにおけるカーネル平均埋め込みに一般化することで、依存し合う複数の要素を持つデータに対して適用可能となる。例えば、以下のような例が挙げられる。
・参考文献1「A. Gretton, K. M. Borgwardt, M. J. Rasch, B. Scholkopf, and A. Smola, A kernel two-sample test, Journal of Machine Learning Research, 13(1):723-773, 2012.」に記載されているtwo-sample testを一般化することで、依存し合う複数の要素を持つデータ同士の比較が可能となる。
・参考文献2「W. Jitkrittum, P. Sangkloy, M. W. Gondal, A. Raj, J. Hays, and B. Scholkopf, Kernel mean matching for content addressability of GANs, In Proceedings of the 36th International Conference on Machine Learning, volume 97, pages 3140-3151, 2019.」に記載されている生成モデルに対するkernel mean matchingを一般化することで、依存し合う複数の要素の共分散の情報を保ったデータを生成できる。
・参考文献3「H. Li, S. J. Pan, S. Wang, and A. C. Kot, Heterogeneous domain adaptation via nonlinear matrix factorization, IEEE Transactions on Neural Networks and Learning Systems, 31:984-996, 2019.」に記載されているMMDを用いたdomain adaptationを一般化することで、ソースドメインとターゲットドメインのデータが依存し合う複数の要素を持つ場合に、その共分散の情報を保って学習を行うことができる。
また、上記の例2で記載した量子の状態を表す測度に対するカーネル平均埋め込みの内積を用いて、量子の状態に対する機械学習や統計の手法を用いた解析が可能となる。
<解析装置10のハードウェア構成>
次に、本実施形態に係る解析装置10のハードウェア構成について、図1を参照しながら説明する。図1は、本実施形態に係る解析装置10のハードウェア構成の一例を示す図である。
図1に示すように、本実施形態に係る解析装置10は一般的なコンピュータ又はコンピュータシステムで実現され、ハードウェアとして、入力装置11と、表示装置12と、外部I/F13と、通信I/F14と、プロセッサ15と、メモリ装置16とを有する。これらの各ハードウェアは、それぞれがバス17を介して通信可能に接続されている。
入力装置11は、例えば、キーボードやマウス、タッチパネル等である。表示装置12は、例えば、ディスプレイ等である。なお、解析装置10は、入力装置11及び表示装置12のうちの少なくとも一方を有していなくてもよい。
外部I/F13は、外部装置とのインタフェースである。外部装置には、記録媒体13a等がある。解析装置10は、外部I/F13を介して、記録媒体13aの読み取りや書き込み等を行うことができる。なお、記録媒体13aには、例えば、CD(Compact Disc)、DVD(Digital Versatile Disk)、SDメモリカード(Secure Digital memory card)、USB(Universal Serial Bus)メモリカード等がある。
通信I/F14は、解析装置10を通信ネットワークに接続するためのインタフェースである。プロセッサ15は、例えば、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)等の各種演算装置である。メモリ装置16は、例えば、HDD(Hard Disk Drive)やSSD(Solid State Drive)、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ等の各種記憶装置である。
本実施形態に係る解析装置10は、図1に示すハードウェア構成を有することにより、後述するデータ解析処理を実現することができる。なお、図1に示すハードウェア構成は一例であって、解析装置10は、他のハードウェア構成を有していてもよい。例えば、解析装置10は、複数のプロセッサ15を有していてもよいし、複数のメモリ装置16を有していてもよい。
<解析装置10の機能構成>
次に、本実施形態に係る解析装置10の機能構成について、図2を参照しながら説明する。図2は、本実施形態に係る解析装置10の機能構成の一例を示す図である。
図2に示すように、本実施形態に係る解析装置10は、機能部として、取得部101と、解析部102と、記憶部103とを有する。取得部101及び解析部102は、例えば、解析装置10にインストールされた1以上のプログラムがプロセッサ15に実行させる処理により実現される。また、記憶部103は、例えば、メモリ装置16を用いて実現可能である。なお、記憶部103は、例えば、解析装置10と通信ネットワークを介して接続される記憶装置(例えば、データベースサーバ等)により実現されていてもよい。
記憶部103には、解析対象のデータ(例えば、解析対象となるXの元及びそのA値測度、上記の例2に対して適用する場合は更に量子の状態を表す線形作用素ρ等)が記憶される。
取得部101は、解析対象のデータを記憶部103から取得する。解析部102は、取得部101によって取得されたデータの解析(つまり、例えば、内積・ノルムの計算や、その計算結果を用いた可視化・異常検知等)を行う。
<データ解析処理>
次に、本実施形態に係る解析装置10が実行するデータ解析処理の流れについて、図3を参照しながら説明する。図3は、本実施形態に係るデータ解析処理の一例を示すフローチャートである。
まず、取得部101は、解析対象のデータ(つまり、解析対象となるXの元及びそのA値測度、上記の例2に対して適用する場合は更に量子の状態を表す線形作用素ρ等)を記憶部103から取得する(ステップS101)。
そして、解析部102は、上記のステップS101で取得されたデータの解析を行う(ステップS102)。なお、データの解析としては、上記の「2. RKHMを用いたカーネル平均埋め込みの応用」に記載した内積・ノルムの計算やその計算結果を用いた可視化・異常検知、データ同士の比較、データの生成、学習等が挙げられる。なお、内積の計算方法の具体例は、ランダム性を持つ複数のデータ間の共分散を表す測度である場合は上記の式(1)、量子の状態を表す測度である場合は上記の式(2)に示す通りである。
以上により、本実施形態に係る解析装置10は、複数のランダム性を持つデータ解析(特に、複数のランダムなデータが相互作用し合っている場合のデータや量子状態を表すデータの可視化、異常検知等)を行うことができる。
<実験>
最後に、上記の「2.1 A値測度の間の距離」に記載した例1及び例2に対して、本実施形態に係る解析装置10を適用した場合の実験結果について説明する。
1. ランダム性を持つ複数のデータ間の共分散を表す測度
X=R、Ω=Rとし、Ω上の、Xに値を持つ以下の式(4)~(6)のような確率変数からデータを作成した。
Figure 0007396601000022
μを、(i,j)成分がXとXの共分散を表す測度
Figure 0007396601000023
になるようなA値測度とする。このとき、Φ(μ)とΦ(μ)の内積、Φ(μ)とΦ(μ)の内積、Φ(μ)とΦ(μ)の内積を上記の式(1)によりそれぞれ計算し、Kernel PCAにより第1主軸及び第2主軸でμ、μ、μを可視化した。その結果を図4に示す。図4に示すように、相互に関係しているμとμ間の距離は近いのに対して、関係のないμとμ間の距離及びμとμ間の距離は遠くなっている。
(既存手法との比較)
上記の式(4)で定義される[X,X,X]に従う独立なデータと、上記の式(5)で定義される[Y,Y,Y]に従う独立なデータとをそれぞれ用意し、上記の参考文献1に記載されているtwo-sample testを行った。なお、two-sample testは2種類のサンプルが同じ確率分布に従うかどうかを判定するテストである。
本実施形態に係る解析装置10により各データ間の距離を測り(つまり、|Φ(μ)-Φ(μ)|により測り)、two-sample testを行ったもの(提案手法)と、既存の距離を測り、two-sample testを行ったもの(従来手法)とを比較した。従来手法としては、参考文献1に記載されているRKHSと、参考文献4「B. K. Sriperumbudur, K. Fukumizu, A. Gretton, B. Scholkopf, and G. R. G. Lanckriet, On the empirical estimation of integral probability metrics. Electronic Journal of Statistics, 6:1550-1599, 2012.」に記載されているKantrovich及びDadleyとを採用した。また、以下のCase1及びCase2のそれぞれの場合で、提案手法及び従来手法の各手法において異なるデータで50回テストを行い、2種類のサンプルが同じ分布に従うと判定された率を計算した。その結果を以下の表1に示す。
・Case1:[X,X,X]に従う独立なデータ10個と[X,X,X]に従う独立なデータ10個
・Case2:[X,X,X]に従う独立なデータ10個と[Y,Y,Y]に従う独立なデータ10個
Figure 0007396601000024
Case1では2種類のサンプルが同じ分布に従うと判定される率が高く、Case2では2種類のサンプルが同じ分布に従うと判定される率が低い方が、判定問題を正確に解けているといえる。提案手法ではCase1の率が高く、Case2の率が低いことを同時に達成しており、両方の場合で正確な判定ができているといえる。
2. 量子の状態を表す測度
上記の例2において、m=2、s=4とする。また、
Figure 0007396601000025
とする。このとき、a1,i=0.25(ただし、i=1,2,3,4)に対して
Figure 0007396601000026
とする。また、a2,1=0.4、a2,4=0.1、a2,2=a2,3=0.25に対して
Figure 0007396601000027
とする。更に、上記の例2と同様にμを定義する。ρ及びρについてはそれぞれに少量のノイズを加え、それぞれ50個のサンプルを用意した。
このとき、ρに関する50個の各サンプルρ1,i(ただし、i=1,・・・,50)について上記の式(3)に示す誤差(再構成誤差)を最小にする第1主軸pを求め、ρに関する50個の各サンプルとρに関する50個の各サンプルρj,i(ただし、j=1,2、i=1,・・・,50)それぞれに関してCm×m値の再構成誤差
Figure 0007396601000028
を計算し、そのノルムの値をプロットした。このプロット結果を図5に示す。つまり、図5では、ρに関するデータを正常状態と考え、それを用いて学習を行い、得られた近似p〈p,Φ(ρj,iμ)〉と真の状態Φ(ρj,iμ)とがどの程度離れているかの値を、正常状態からの乖離(異常度)と捉え、プロットしている。
図5に示すように、ρに関するサンプルに比べてρに関するサンプルの異常度は高くなっていることから、正常状態であるρに対してρが乖離している(つまり、異常状態である)ということが精度良く表現できているといえる。
本発明は、具体的に開示された上記の実施形態に限定されるものではなく、特許請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術等との組み合わせが可能である。
本願は、日本国に2020年7月16日に出願された基礎出願2020-122352号に基づくものであり、その全内容はここに参照をもって援用される。
10 解析装置
11 入力装置
12 表示装置
13 外部I/F
13a 記録媒体
14 通信I/F
15 プロセッサ
16 メモリ装置
17 バス
101 取得部
102 解析部
103 記憶部

Claims (6)

  1. ランダム性を持つ複数のデータのデータ集合を取得する取得部と、
    前記データ集合上の確率測度μ及びνであって、フォン・ノイマン環に値を持つ確率測度μ及びνを、カーネル平均埋め込みを拡張した写像ΦによってRKHM上にそれぞれ写像したΦ(μ)及びΦ(ν)の内積又はノルムを、前記確率測度μ及びνの内積又はノルムとして計算する解析部と、
    を有することを特徴とする解析装置。
  2. 前記確率測度はランダム性を持つ複数のデータ間の共分散を表す測度を各成分とする行列、前記フォン・ノイマン環はm×mの複素数値行列全体の集合であり、
    前記解析部は、
    前記データ集合上に値を持つm個の確率変数をそれぞれX,・・・,X及びY,・・・,Y、XとXの共分散を表す測度を(i,j)成分とする確率測度をμ=μ、YとYの共分散を表す測度を(i,j)成分とする確率測度をν=μとして、前記確率変数X,・・・,Xから得られたデータと前記確率変数Y,・・・,Yから得られたデータとを用いて、Φ(μ)及びΦ(μ)の内積を、m×mの複素数値行列を値に持つ正定値カーネルにより近似計算する、ことを特徴とする請求項1に記載の解析装置。
  3. 前記確率測度は量子力学において量子の状態を表す測度、前記フォン・ノイマン環はm×mの複素数値行列全体の集合であり、
    前記解析部は、
    前記量子の観測を表す前記フォン・ノイマン環上の測度をμ'、前記量子の状態をρ及びρ、前記確率測度をμ=ρμ'、ν=ρμ'として、前記データ集合に含まれるデータを用いて、Φ(ρμ')及びΦ(ρμ')の内積を、m×mの複素数値行列を値に持つ正定値カーネルにより計算する、ことを特徴とする請求項1に記載の解析装置。
  4. 前記解析部は、
    前記内積又はノルムの計算結果を用いて、前記データ集合の次元削減、前記確率測度の可視化、又は前記確率測度に対する異常検知を行う、ことを特徴とする請求項1又は2に記載の解析装置。
  5. ランダム性を持つ複数のデータのデータ集合を取得する取得手順と、
    前記データ集合上の確率測度μ及びνであって、フォン・ノイマン環に値を持つ確率測度μ及びνを、カーネル平均埋め込みを拡張した写像ΦによってRKHM上にそれぞれ写像したΦ(μ)及びΦ(ν)の内積又はノルムを、前記確率測度μ及びνの内積又はノルムとして計算する解析手順と、
    をコンピュータが実行することを特徴とする解析方法。
  6. コンピュータを、請求項1乃至4の何れか一項に記載の解析装置として機能させるプログラム。
JP2022536433A 2020-07-16 2021-07-14 解析装置、解析方法及びプログラム Active JP7396601B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2020122352 2020-07-16
JP2020122352 2020-07-16
PCT/JP2021/026531 WO2022014657A1 (ja) 2020-07-16 2021-07-14 解析装置、解析方法及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2022014657A1 JPWO2022014657A1 (ja) 2022-01-20
JP7396601B2 true JP7396601B2 (ja) 2023-12-12

Family

ID=79555649

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022536433A Active JP7396601B2 (ja) 2020-07-16 2021-07-14 解析装置、解析方法及びプログラム

Country Status (3)

Country Link
US (1) US20230237124A1 (ja)
JP (1) JP7396601B2 (ja)
WO (1) WO2022014657A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117196414B (zh) * 2023-11-06 2024-04-05 南通联润金属制品有限公司 一种金属加工质量控制系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HASHIMOTO, Yuka et al.,Analysis via Orthonormal Systems in Reproducing Kernel Hilbert C*-Modules and Applications,arXiv [online],2020年03月02日,[検索日 2023.11.02], インターネット:<URL:https://arxiv.org/pdf/2003.00738.pdf>
SRIPERUMBUDUR, Bharath K et al.,Injective Hilbert Space Embeddings of Probability Measures,Proceedings of the 21st Annual Conference on Learning Theory,2008年,111-122,[検索日 2023.11.02], インターネット:<URL:https://is.tuebingen.mpg.de/fileadmin/user_upload/files/publications/Paper- 4_[0].pdf>

Also Published As

Publication number Publication date
JPWO2022014657A1 (ja) 2022-01-20
WO2022014657A1 (ja) 2022-01-20
US20230237124A1 (en) 2023-07-27

Similar Documents

Publication Publication Date Title
Abarbanel et al. Machine learning: Deepest learning as statistical data assimilation problems
Schroeter et al. Estimating the domain of applicability for machine learning QSAR models: a study on aqueous solubility of drug discovery molecules
JP7098840B2 (ja) 量子ノイズプロセスの解析方法、装置、機器及び記憶媒体
WO2022041974A1 (zh) 量子噪声过程分析方法、系统及存储介质和电子设备
Cruz et al. Optimizing quantum phase estimation for the simulation of Hamiltonian eigenstates
US11270221B2 (en) Unsupervised clustering in quantum feature spaces using quantum similarity matrices
JP2013257251A (ja) 異常検知方法、プログラム及びシステム
Zhang et al. A symmetry and bi-recursive algorithm of accurately computing Krawtchouk moments
Dai et al. Generalized entropy plane based on permutation entropy and distribution entropy analysis for complex time series
Paul et al. A study on validating non-linear dimensionality reduction using persistent homology
JP7396601B2 (ja) 解析装置、解析方法及びプログラム
WO2022071997A1 (en) Reconstructing time series datasets with missing values utilizing machine learning
Xu et al. Mvse: Effort-aware heterogeneous defect prediction via multiple-view spectral embedding
Saleem et al. Direct feature evaluation in black-box optimization using problem transformations
WO2021039545A1 (ja) 異常検知装置、異常検知方法、及びプログラム
Reddy et al. A new approach for bias–variance analysis using regularized linear regression
Alippi et al. Ensembles of change-point methods to estimate the change point in residual sequences
Reis et al. Analysis and classification of the paper surface
US10692256B2 (en) Visualization method, visualization device, and recording medium
JP7359206B2 (ja) 学習装置、学習方法、及びプログラム
Chandra Support vector approach by using radial kernel function for prediction of software maintenance effort on the basis of multivariate approach
Saleem et al. Detection of Outliers in Binomial Regression Using CERES and Partial Residual Plots
Maskara et al. A learning algorithm with emergent scaling behavior for classifying phase transitions
JP7367843B2 (ja) 関係性抽出装置、関係性抽出方法、及びプログラム
WO2022034656A1 (ja) 解析装置、解析方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20221208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231114

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231121

R150 Certificate of patent or registration of utility model

Ref document number: 7396601

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150