JP6749381B2 - 採寸値とデプス画像とを相互に生成するプログラム及び装置 - Google Patents
採寸値とデプス画像とを相互に生成するプログラム及び装置 Download PDFInfo
- Publication number
- JP6749381B2 JP6749381B2 JP2018212569A JP2018212569A JP6749381B2 JP 6749381 B2 JP6749381 B2 JP 6749381B2 JP 2018212569 A JP2018212569 A JP 2018212569A JP 2018212569 A JP2018212569 A JP 2018212569A JP 6749381 B2 JP6749381 B2 JP 6749381B2
- Authority
- JP
- Japan
- Prior art keywords
- dimension number
- dimension
- component variable
- learning engine
- teacher data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005259 measurement Methods 0.000 title claims description 148
- 230000006870 function Effects 0.000 claims description 46
- 238000000034 method Methods 0.000 claims description 18
- 238000000513 principal component analysis Methods 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 description 27
- 230000000875 corresponding effect Effects 0.000 description 21
- 239000013598 vector Substances 0.000 description 21
- 238000010586 diagram Methods 0.000 description 16
- 230000009466 transformation Effects 0.000 description 7
- 238000000605 extraction Methods 0.000 description 6
- 230000037237 body shape Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 210000000056 organ Anatomy 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000005484 gravity Effects 0.000 description 3
- 210000003205 muscle Anatomy 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000003187 abdominal effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000002591 computed tomography Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000013421 nuclear magnetic resonance imaging Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000005672 electromagnetic field Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Landscapes
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Processing Or Creating Images (AREA)
- Image Analysis (AREA)
Description
他の用途として、ユーザが洋服を選ぶ場合、自らの一部の採寸箇所の採寸値のみを基準にして選択している。即ち、その採寸箇所の採寸値は、ユーザの体型を表す基準となっている。
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
相関学習エンジンを用いて、対象データとしての1体の次元数nの採寸値から次元数mの成分変数へエンコードするエンコード手段と、
統計学習エンジンを用いて、当該次元数mの成分変数からデプス画像にデコードするデコード手段と
してコンピュータを機能させることを特徴とする。
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
相関学習エンジンを用いて、対象データとしての1体の次元数nの採寸値から次元数mの成分変数へエンコードするエンコード手段と
してコンピュータを機能させることを特徴とする。
エンコード手段は、
対象データとして1体の次元数nの採寸値について、k(<n)個の採寸値のみ決定され、その他のn−k個の採寸値が欠損していても、次元数mの成分変数を推定するために、
k個の採寸値を束縛条件として、最適化された他のn−k個の採寸値を含む次元数mの成分変数を算出する
ようにコンピュータを機能させることも好ましい。
エンコード手段は、ラグランジュの未定乗数法(method of Lagrange multiplier)を用いる
ようにコンピュータを機能させることも好ましい。
エンコードされた次元数mの成分変数を記述したタグを作成するタグ作成手段と
して更にコンピュータを機能させることも好ましい。
異なるモデル種別のデプス画像それぞれに、教師データ群が用意され、
統計学習エンジン及び相関学習エンジンは、モデル種別毎に、異なる教師データ群によって複数個備えられ、
エンコード手段は、次元数nの採寸値に基づくモデル識別子に対応した相関学習エンジンを用いて、次元数nの採寸値から次元数mの成分変数へエンコードし、
タグ作成手段は、モデル種別識別子と、当該モデル種別識別子に基づく次元数mの成分変数とを対応付けてタグに記述する
ようにコンピュータを機能させることも好ましい。
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
統計学習エンジンを用いて、対象データとしての次元数mの成分変数からデプス画像にデコードするデコード手段と
してコンピュータを機能させることを特徴とする。
デコード手段は、対象データとしての次元数mの成分変数から、相関学習エンジンを用いて、次元数nの採寸値を導出する
ようにコンピュータを機能させることも好ましい。
次元数mの成分変数が記述されたタグから、次元数mの成分変数を読み取るタグ読取手段と
してコンピュータを機能させることも好ましい。
異なるモデル種別のデプス画像それぞれに、教師データ群が用意され、
統計学習エンジン及び相関学習エンジンは、モデル種別毎に、異なる教師データによって複数個備えられ、
タグ読取手段は、タグから、モデル種別識別子と、当該モデル種別識別子に基づく次元数mの成分変数とを読み取り、
デコード手段は、読み取られたモデル種別識別子に対応した相関学習エンジンを用いて、次元数mの成分変数からデプス画像へデコードする
してコンピュータを機能させることも好ましい。
タグは、QR(Quick Response、登録商標)コード又はRFID(Radio Frequency IDentifier)である
ようにコンピュータを機能させることも好ましい。
デプス画像は、人体又は物体の形状データであり、
教師データ群の複数体数は、デプス画像の点数よりも少ないものである
ようにコンピュータを機能させることも好ましい。
統計学習エンジンは、主成分分析(Principal Component Analysis)又はAutoEncoderに基づくものであり、
相関学習エンジンは、最小二乗法又はElasticNetに基づくものである
ようにコンピュータを機能させることも好ましい。
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
相関学習エンジンを用いて、対象データとしての1体の次元数nの採寸値から次元数mの成分変数へエンコードするエンコード手段と、
統計学習エンジンを用いて、当該次元数mの成分変数からデプス画像にデコードするデコード手段と
を有することを特徴とする。
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
相関学習エンジンを用いて、対象データとしての1体の次元数nの採寸値を入力し、次元数mの成分変数へエンコードするエンコード手段と
を有することを特徴とする。
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
対象データとしての次元数mの成分変数から、統計学習エンジンを用いて、デプス画像にデコードするデコード手段と
を有することを特徴とする。
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
統計学習エンジンを用いて、対象データとしての1体のデプス画像から、当該次元数mの成分変数へ逆デコードする逆デコード手段と
相関学習エンジンを用いて、当該次元数mの成分変数から、次元数nの採寸値へ逆エンコードする逆エンコード手段と
してコンピュータを機能させることを特徴とする。
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
統計学習エンジンを用いて、対象データとしての1体のデプス画像から、当該次元数mの成分変数へ逆デコードする逆デコード手段と
してコンピュータを機能させることを特徴とする。
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
相関学習エンジンを用いて、当該次元数mの成分変数から、次元数nの採寸値へ逆エンコードする逆エンコード手段と
してコンピュータを機能させることを特徴とする。
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
統計学習エンジンを用いて、対象データとしての1体のデプス画像から、当該次元数mの成分変数へ逆デコードする逆デコード手段と
相関学習エンジンを用いて、当該次元数mの成分変数から、次元数nの採寸値へ逆エンコードする逆エンコード手段と
を有することを特徴とする。
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
統計学習エンジンを用いて、対象データとしての1体のデプス画像から、当該次元数mの成分変数へ逆デコードする逆デコード手段と
を有することを特徴とする。
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
相関学習エンジンを用いて、当該次元数mの成分変数から、次元数nの採寸値へ逆エンコードする逆エンコード手段と
を有することを特徴とする。
図1によれば、装置1は、教師データ形成部100と、統計学習エンジン101と、相関学習エンジン102と、エンコード部111と、デコード部122とを有する。これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現できる。
統計学習エンジン101は、教師データ群の複数体のデプス画像を入力し、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する。
図2(a)によれば、1体のデプス画像は、高さh=960pixel、幅w=540pixel(8bit/pixel)で表現される。即ち、1体のデプス画像は、w*h(=518,400)次元のベクトルで表される。
図2(b)によれば、1体のデプス画像は、毎に、w*h次元空間(960×540=518,400)で表現される。
図4は、統計学習エンジンにおける主成分分析を表す簡易なコードである。
統計学習エンジン101は、具体的には、主成分分析(Principal Component Analysis)に基づくものである。
「主成分分析」によって、相関のあるw*h次元空間の1,000点から、互いに無相関で全体のばらつきを最もよく表す少数(例えば300個)の主成分(成分変数)を導出する。第1主成分の分散を最大化し、続く主成分はそれまでに決定した主成分と無相関という拘束条件の下で、分散を最大化するようにして選択される。主成分の分散を最大化することによって、観測値の変化に対する説明能力を可能な限り主成分に持たせる。主成分を与える主軸はw*h次空間の1,000点の群の直交基底となっている。主軸の直交性は、主軸が共分散行列の固有ベクトルになっており、共分散行列が実対称行列であることから導かれる。
本発明によれば、w*h(=518,400)次元空間における各デプス画像を、例えば300次元(成分変数)空間に射影する。主成分を与える変換は、観測値の集合からなる行列の特異値分解で表され、w*h次元空間の1,000点の群からなる矩形行列Xの特異値分解は、以下の式で表される。
X=U*Σ*VT
X:w*h次元空間の1,000点からなる行列(1,000行×w*h列)
U:n(1,000)×n(1,000)の正方行列(n次元単位ベクトルの直交行列)
Σ:n(1,000)×p(w*h)の矩形対角行列(対角成分は、Xの特異値)
V:p(w*h)×p(w*h)の正方行列(p次元単位ベクトルの直交行列)
ここで、Vの最初の300列からなる行列をVと改める。そして、その行列Vによる線形変換はXの主成分を与える。
V:w*h次元空間->統計形状(300次元)空間への変換を表す行列
V-1:統計形状(300次元)空間->w*h次元空間への変換を表す行列
尚、行列の上付き添え字-1は逆行列を示す記号ではなく、行列が定めるベクトルの変換に対して、その逆変換を意味する抽象的な記号として用いている。ここでは、V-1は、Vの転置VTと等しい。
s=x*V
x=s*V-1
s:統計形状空間のベクトル
x:w*h次元空間のベクトル
V:統計学習モデル
オートエンコーダは、ニューラルネットワークの一種で、情報量を小さくした特徴表現を実現する(例えば非特許文献3参照)。具体的には、入力データの次元数よりも、隠れ層の次元を圧縮したものである。入力データは、ニューラルネットワークを通して圧縮し、出力時には元のサイズに戻す。このとき、ニューラルネットワークは、入力データの抽象的概念(特徴量)を抽出する。
オートエンコーダも、主成分分析と同様に、相関のあるw*h次元空間の1,000点から、互いに無相関で全体のばらつきを最もよく表す300次元の成分変数を導出する。
相関学習エンジン102は、教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する。
この場合、採寸箇所を要素とし、採寸値をその要素値とした採寸値空間を導出することできる。例えば10カ所の採寸箇所の採寸値が付与されている場合、採寸値空間は10次元となる。
勿論、採寸箇所は、1カ所以上であればよい。身長だけでもよいし、身長+腹囲であってもよいし、身長+腹囲+胸囲であってもよい。
図7は、相関学習エンジンにおける統計形状空間と採寸値空間との間の線形変換を表す簡易なコードである。
相関学習エンジン102は、最小二乗法に基づくものである。
「最小二乗法(least squares method)」とは、複数の多次元ベクトル(データの組)から線形モデルで近似する際に、残差の二乗和が最小となる最も確からしい線形モデルを決定することをいう。
s=d*A
d=s*A-1
A=(DT*D)-1*DT*S (||D*A−S||を最小化するAを導出する)
s:統計形状空間のベクトル
d:採寸値空間のベクトル
S:統計形状空間のベクトルの組
D:採寸値空間のベクトルの組
A:相関学習モデル
相関学習エンジン102は、ElasticNetであってもよい。
ElasticNetとは、一般化線形モデルの回帰に正則化項を加味するモデルであって、次元圧縮及び過学習防止の両方を実現する(例えば非特許文献4参照)。データ数に対して特徴量の数が非常に多い場合や、特徴量間に強い相関(多重共線性)がある場合に、通常の回帰モデル構築の際に用いられる2乗誤差などの目的関数に加え、Lpノルム(pは正整数)のような正則化項を加えて最適化するものをいう。p=1の時にLasso回帰、p=2の時にRidge回帰と称する。また、それぞれに用いられている正則化項をL1ノルム、L2ノルムと呼ぶ。
Lasso回帰は、L1ペナルティにより変数選択と次元圧縮を行う
Ridge回帰は、L2ペナルティにより係数を縮小して過学習を抑える。
Elastic NetはこれらLasso回帰とRidge回帰を線形結合したモデルである。
これによって、統計形状空間と採寸値空間との間で、デプス画像の1体毎に対応付けることができる。
エンコード部111は、相関学習エンジン102を用いて、対象データとしての1体の次元数nの採寸値から、次元数mの成分変数へエンコードする。エンコードされた次元数mの成分変数は、採寸値を認識できない秘匿性を持つ。そのために、対象データの1体の次元数nの採寸値が守秘情報である場合に適する。
デコード部122は、統計学習エンジン101を用いて、エンコードされた次元数mの成分変数から、デプス画像にデコードする。
図8(b)は、対象データのデプス画像A〜Dそれぞれについて、統計学習エンジン101によって成分変数にエンコードし、その成分変数から統計学習エンジン101によってデコードしたデプス画像を表す。図8(a)と図8(b)とを比較して、主成分分析によってエンコード及びデコードをしても、デプス画像がほぼ同一形状に維持されていることが理解できる。
図8(c)は、対象データのデプス画像A〜Dそれぞれについて、採寸値(10カ所)から相関学習エンジン102によって成分変数にエンコードし、その成分変数から統計学習エンジン101によってデコードしたデプス画像を表す。図8(a)と図8(c)とを比較して、採寸値によってエンコード及びデコードしても、デプス画像がほぼ同一形状に維持されていることが理解できる。
[タグ作成部112]
タグ作成部112は、エンコード部111から出力された次元数mの成分変数を入力し、その成分変数を記述したタグを作成する。
[タグ読取部121]
タグ読取部121は、タグから、エンコードされた次元数mの成分変数を読み取る。読み取られた成分変数は、デコード部122へ出力される。
本発明によれば、デプス画像を、4バイトで300次元とした場合、1200バイト(成分変数)で表すことができる。300バイトをQRコードに記述することができれば、例えばユーザ自らの体型を表すデプス画像を、QRコードで明示することが可能となる。
本発明によれば、例えばデプス画像の成分変数を、RFタグに記述しておくだけで、リーダによって瞬時に読み取らせることができる。RFタグから成分変数を読み取ったリーダは、その成分変数に対応したデプス画像を瞬時にディスプレイに表示することもきる。
教師データ形成部100は、<F1:物体抽出機能>と、<F2:正規化機能>とを有する。
図11は、物体抽出機能の第4〜第5のステップを表す説明図である。
物体抽出機能は、以下の5つのステップを要する。
(S1)背景のみが映る第1のデプス画像を予め取得する。
(S2)前景と背景との両方を含む第2のデプス画像を入力する。
(S3)第1のデプス画像と第2のデプス画像とを比較して、ピクセル輝度の差の絶対値を導出する。
(S4)2値化処理によって2つのクラス(物体部分と非物体部分)に分離した2値画像を生成する。この2値化処理には、例えば「大津のアルゴリズム」を適用することができる。この判別分析法(discriminant analysis method)は、分離度(separation
metrics)という値が最大となる閾値を求め、自動的に2値化することができる。分離度は、クラス間分散(between-class variance)とクラス内分散(within-class variance)との比で求める。
(S5)S2で入力された第2のデプス画像から、S4で算出された2値化画像をマスク処理して、物体のみのデプス画像を抽出する。
正規化機能は、以下の5つのステップを要する。
(S1)物体抽出機能によって抽出したデプス画像の画像平面上のピクセル座標p=(x,y,z)から、3次元座標P=(X,Y,Z)を計算する。
各点P=(X,Y,Z)について、X=x*z/f, Y=y*z/f, Z=z
<既知のカメラ仕様>
焦点距離(物理) F (mm)
焦点距離(ピクセル) f=(fx,fy)=(F*sx,F*sy) (pixel)
ピクセルサイズ s=(sx,sy) (pixel/mm)
(S2)物体のデプス画像からバウンディングボックスを特定し、その重心を決定する。
(S3)S2によって決定された重心に基づいて、デプス画像を所定の重心に平行移動する。
(S4)S3によって平行移動されたデプス画像に対して、画像平面上のピクセル座標を計算する。
各点p=(x,y,z)について、x=X*f/Z, y=Y*f/Z, z=Z
(S5)S4によって計算されたピクセル座標は必ずしも整数値ではないので、補完を使って最終的なピクセル座標を計算する。
(S6)S5によって補完されたデプス画像を、教師データとして、統計学習エンジン101へ入力する。
医療用途の場合、MRI(核磁気共鳴画像法)やCT(コンピュータ断層撮影)によって撮影した医用画像のDICOMデータから、例えば臓器毎のデプス画像を作成することできる。例えば臓器毎にモデル種別を付与することによって、モデル種別に応じてデプス画像を切り替えることができる。
タグ作成部112は、モデルIDと、当該モデルIDに基づく次元数mの成分変数とを対応付けてタグに記述する。
デコード部122は、読み取られた次元数mの成分変数から、当該モデルIDに対応する相関学習エンジン102を用いて、デプス画像へデコードする。
図13は、本発明における欠損値を推定する採寸値空間を表す説明図である。
図14は、本発明における欠損値推定を表す簡易なコードである。
ここで、本発明によれば、対象データとして1体の次元数nの採寸値について、k(<n)個の採寸値のみが決定され、その他のn−k個の採寸値が欠損していてもよい。即ち、本発明によれば、教師データ群によって例えば10次元の採寸値空間から相関学習モデルを構築したとしても、例えばk=3個の採寸箇所の採寸値のみを入力することによって、次元数mの成分変数を推定することができる。
超楕円体を表す二次形式(x:列ベクトル)
f(x)=xT*C-1*x
C-1:対称行列
※実際には分散共分散行列はC=DT*D/教師データ群数
※-1は、逆行列を示す
F(x1,・・・,xn,λ1,・・・,λk)
=f(x1,・・・,xn)+Σλjgj(x1,・・・,xn)
とすることによって、以下の式を満たす。
dF/dxi=0 (i=1,・・・,n)
dF/dλj=0 (j=1,・・・,k)
アフィン超平面を表す一次方程式
gj(x)=nj T*(x−pj)=0
n:超平面の法線ベクトル
p:超平面上の点
特に、それぞれの超平面は基底に直交する(nの方向が基底方向に一致する)ために、以下のようになる。
gj(x)=xi−yj=0
yj:j番目の採寸値
xi:対応するxの要素
制約条件の下で、関数f(x)の最小値を求めることは、与えられた採寸値の下で、平均に最も近い体型を求めることとなる。
x:10次元列ベクトル
y:k個の採寸値を含む10次元列ベクトル (k個以外の採寸値の値は任意)
λ:ラグランジュ乗数を要素とするk次元列ベクトル
O:k行10列の行列 各行は与えられた採寸値に応じたone-hot行ベクトル
C:分散共分散行列
f(x)=1/2*xT*C-1*x
g(x)=O*(y−x)
F(x)=f(x)+λT*g(x)
dF/dx=C-1*x−OT*λ=0 (1)
dF/dλ=O*(y−x)=0 (2)
(1)より、x=C*OT*λ (3)
(3)を(2)に代入
O*y−O*C*OT*λ=0
λ=(O*C*OT)-1*O*y
λを(3)に代入
x=C*OT*(O*C*OT)-1*O*y
このユーザインタフェースによれば、採寸値に対応するデプス画像と、そのデプス画像の成分変数が記述されたQRコードとを、一見することができる。特に、QRコードを、カメラによって読み取らせるだけで、デプス画像を共有することできる。
図16によれば、装置1は、図1と同様に、教師データ形成部100と、統計学習エンジン101及び相関学習エンジン102を有すると共に、更に、逆デコード部132及び逆エンコード部131を有する。これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現できる。
逆デコード部132は、統計学習エンジン101を用いて、対象データとしての1体のデプス画像から、当該次元数mの成分変数へ逆デコードする。その次元数mの成分変数は、逆エンコード部131へ出力される。
逆エンコード部131は、相関学習エンジン101を用いて、当該次元数mの成分変数から、次元数nの採寸値へ逆エンコードする。その次元数nの採寸値は、逆デコード部132へ入力されたデプス画像に対応するものである。
本発明によれば、例えば以下のような用途に適する。
(用途1)ユーザ所持のスマートフォンを用いて、自らの体型の採寸値を入力し、成分変数を含むQRコードを作成しておく。そのQRコードを、転送先の装置のカメラへかざすことによって、自らの体型を表すデプス画像を瞬時に送信することができる。
逆に、ユーザ所持のスマートフォンを用いて、自らの体型のデプスカメラによって撮影したデプス画像を入力し、成分変数を含むQRコードを作成しておく。そのQRコードを、転送先の装置のカメラへかざすことによって、自らの採寸値を瞬時に送信することができる。
(用途2)衣料品業界の用途として、洋服の採寸値を入力することによって、その洋服に適したデプス画像を作成することができる。
(用途3)医療業界の用途として、ユーザのDICOMデータに基づくデプス画像を成分変数にエンコードしておくことによって、そのユーザの様々な臓器等の医用デプス画像をタグやRFIDに記憶させておき、瞬時に転送することができる。
(用途4)広告業界の用途として、ユーザから読み取った成分変数からデプス画像を再生し、そのデプス画像をそのユーザのキャラクタとして、サイネージディスプレイに表示させることができる。
(用途5)エンコードされた成分変数は、第三者が容易に認識することができず、個人情報の守秘性を持つ。
100 教師データ形成部
101 統計学習エンジン
102 相関学習エンジン
111 エンコード部
112 タグ作成部
121 タグ読取部
122 デコード部
131 逆エンコード部
132 逆デコード部
Claims (22)
- 対象データとしての1体の次元数nの採寸値から、デプス画像を生成する装置に搭載されたコンピュータを機能させるプログラムであって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
相関学習エンジンを用いて、対象データとしての1体の次元数nの採寸値から次元数mの成分変数へエンコードするエンコード手段と、
統計学習エンジンを用いて、当該次元数mの成分変数からデプス画像にデコードするデコード手段と
してコンピュータを機能させることを特徴とするプログラム。 - デプス画像をエンコードする装置に搭載されたコンピュータを機能させるプログラムであって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
相関学習エンジンを用いて、対象データとしての1体の次元数nの採寸値から次元数mの成分変数へエンコードするエンコード手段と
してコンピュータを機能させることを特徴とするプログラム。 - 前記エンコード手段は、
対象データとして1体の次元数nの採寸値について、k(<n)個の採寸値のみ決定され、その他のn−k個の採寸値が欠損していても、次元数mの成分変数を推定するために、
k個の採寸値を束縛条件として、最適化された他のn−k個の採寸値を含む次元数mの成分変数を算出する
ようにコンピュータを機能させることを特徴とする請求項2に記載のプログラム。 - 前記エンコード手段は、ラグランジュの未定乗数法(method of Lagrange multiplier)を用いる
ようにコンピュータを機能させることを特徴とする請求項3に記載のプログラム。 - エンコードされた次元数mの成分変数を記述したタグを作成するタグ作成手段と
して更にコンピュータを機能させることを特徴とする請求項2から4のいずれか1項に記載のプログラム。 - 異なるモデル種別のデプス画像それぞれに、教師データ群が用意され、
統計学習エンジン及び相関学習エンジンは、モデル種別毎に、異なる教師データ群によって複数個備えられ、
前記エンコード手段は、次元数nの採寸値に基づくモデル識別子に対応した相関学習エンジンを用いて、次元数nの採寸値から次元数mの成分変数へエンコードし、
前記タグ作成手段は、モデル種別識別子と、当該モデル種別識別子に基づく次元数mの成分変数とを対応付けてタグに記述する
ようにコンピュータを機能させることを特徴とする請求項5に記載のプログラム。 - 次元数mの成分変数から、デプス画像へデコードする装置に搭載されたコンピュータを機能させるプログラムであって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
統計学習エンジンを用いて、対象データとしての次元数mの成分変数からデプス画像にデコードするデコード手段と
してコンピュータを機能させることを特徴とするプログラム。 - 前記デコード手段は、対象データとしての次元数mの成分変数から、相関学習エンジンを用いて、次元数nの採寸値を導出する
ようにコンピュータを機能させることを特徴とする請求項7に記載のプログラム。 - 次元数mの成分変数が記述されたタグから、次元数mの成分変数を読み取るタグ読取手段と
してコンピュータを機能させることを特徴とする請求項7又は8に記載のプログラム。 - 異なるモデル種別のデプス画像それぞれに、教師データ群が用意され、
統計学習エンジン及び相関学習エンジンは、モデル種別毎に、異なる教師データによって複数個備えられ、
前記タグ読取手段は、タグから、モデル種別識別子と、当該モデル種別識別子に基づく次元数mの成分変数とを読み取り、
前記デコード手段は、読み取られたモデル種別識別子に対応した相関学習エンジンを用いて、次元数mの成分変数からデプス画像へデコードする
してコンピュータを機能させることを特徴とする請求項9に記載のプログラム。 - 前記タグは、QR(Quick Response、登録商標)コード又はRFID(Radio Frequency IDentifier)である
ようにコンピュータを機能させることを特徴とする請求項5、6、9又は10に記載のプログラム。 - デプス画像は、人体又は物体の形状データであり、
教師データ群の複数体数は、デプス画像の点数よりも少ないものである
ようにコンピュータを機能させることを特徴とする請求項1から11のいずれか1項に記載のプログラム。 - 統計学習エンジンは、主成分分析(Principal Component Analysis)又はAutoEncoderに基づくものであり、
相関学習エンジンは、最小二乗法又はElasticNetに基づくものである
ようにコンピュータを機能させることを特徴とする請求項1から12のいずれか1項に記載のプログラム。 - 対象データとしての1体の次元数nの採寸値から、デプス画像を生成する装置であって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
相関学習エンジンを用いて、対象データとしての1体の次元数nの採寸値から次元数mの成分変数へエンコードするエンコード手段と、
統計学習エンジンを用いて、当該次元数mの成分変数からデプス画像にデコードするデコード手段と
を有することを特徴とする装置。 - デプス画像をエンコードする装置であって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
相関学習エンジンを用いて、対象データとしての1体の次元数nの採寸値を入力し、次元数mの成分変数へエンコードするエンコード手段と
を有することを特徴とする装置。 - 次元数mの成分変数から、デプス画像へデコードする装置であって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
対象データとしての次元数mの成分変数から、統計学習エンジンを用いて、デプス画像にデコードするデコード手段と
を有することを特徴とする装置。 - デプス画像から、1体の次元数nの採寸値を推定する装置に搭載されたコンピュータを機能させるプログラムであって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
統計学習エンジンを用いて、対象データとしての1体のデプス画像から、当該次元数mの成分変数へ逆デコードする逆デコード手段と
相関学習エンジンを用いて、当該次元数mの成分変数から、次元数nの採寸値へ逆エンコードする逆エンコード手段と
してコンピュータを機能させることを特徴とするプログラム。 - デプス画像を逆デコードする装置に搭載されたコンピュータを機能させるプログラムであって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
統計学習エンジンを用いて、対象データとしての1体のデプス画像から、当該次元数mの成分変数へ逆デコードする逆デコード手段と
してコンピュータを機能させることを特徴とするプログラム。 - 次元数mの成分変数から、次元数nの採寸値へ逆エンコードする装置に搭載されたコンピュータを機能させるプログラムであって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
相関学習エンジンを用いて、当該次元数mの成分変数から、次元数nの採寸値へ逆エンコードする逆エンコード手段と
してコンピュータを機能させることを特徴とするプログラム。 - デプス画像から、1体の次元数nの採寸値を推定する装置であって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
統計学習エンジンを用いて、対象データとしての1体のデプス画像から、当該次元数mの成分変数へ逆デコードする逆デコード手段と
相関学習エンジンを用いて、当該次元数mの成分変数から、次元数nの採寸値へ逆エンコードする逆エンコード手段と
を有することを特徴とする装置。 - デプス画像を逆デコードする装置であって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
統計学習エンジンを用いて、対象データとしての1体のデプス画像から、当該次元数mの成分変数へ逆デコードする逆デコード手段と
を有することを特徴とする装置。 - 次元数mの成分変数から、次元数nの採寸値へ逆エンコードする装置であって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
相関学習エンジンを用いて、当該次元数mの成分変数から、次元数nの採寸値へ逆エンコードする逆エンコード手段と
を有することを特徴とする装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018212569A JP6749381B2 (ja) | 2018-11-12 | 2018-11-12 | 採寸値とデプス画像とを相互に生成するプログラム及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018212569A JP6749381B2 (ja) | 2018-11-12 | 2018-11-12 | 採寸値とデプス画像とを相互に生成するプログラム及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020080020A JP2020080020A (ja) | 2020-05-28 |
JP6749381B2 true JP6749381B2 (ja) | 2020-09-02 |
Family
ID=70801761
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018212569A Active JP6749381B2 (ja) | 2018-11-12 | 2018-11-12 | 採寸値とデプス画像とを相互に生成するプログラム及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6749381B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130081037A (ko) * | 2012-01-06 | 2013-07-16 | 한국전자통신연구원 | 인체 치수 측정 시스템 및 그 방법 |
US10796480B2 (en) * | 2015-08-14 | 2020-10-06 | Metail Limited | Methods of generating personalized 3D head models or 3D body models |
JP6988406B2 (ja) * | 2017-11-27 | 2022-01-05 | 富士通株式会社 | 手位置検出方法、手位置検出装置、及び手位置検出プログラム |
-
2018
- 2018-11-12 JP JP2018212569A patent/JP6749381B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020080020A (ja) | 2020-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6424309B1 (ja) | 採寸値に基づく3次元モデルを生成するプログラム及び装置 | |
US20230063306A1 (en) | Method for object recognition | |
CN110599395B (zh) | 目标图像生成方法、装置、服务器及存储介质 | |
JP6892569B2 (ja) | 人体に基づくデプス画像と組成値とを対応付ける装置 | |
CN111047548A (zh) | 姿态变换数据处理方法、装置、计算机设备和存储介质 | |
CN106780662B (zh) | 人脸图像生成方法、装置及设备 | |
Su et al. | Color and depth priors in natural images | |
Zhu et al. | Image interpolation based on non-local geometric similarities and directional gradients | |
Konda et al. | Unsupervised learning of depth and motion | |
CN114298997B (zh) | 一种伪造图片检测方法、装置及存储介质 | |
Chowdhary et al. | Singular value decomposition–principal component analysis-based object recognition approach | |
Srivastava et al. | Multifocus noisy image fusion using contourlet transform | |
WO2005050533A2 (en) | Image clustering with metric, local linear structure, and affine symmetry | |
JP6749381B2 (ja) | 採寸値とデプス画像とを相互に生成するプログラム及び装置 | |
JP2008171074A (ja) | 三次元形状モデル生成装置、三次元形状モデル生成方法、コンピュータプログラム、及び三次元形状モデル生成システム | |
JP6667785B1 (ja) | 3次元モデルとデプス画像とを対応付けて学習するプログラム | |
CN114913104B (zh) | 图像处理方法、图像处理装置、电子设备及存储介质 | |
Moradi et al. | Combining and Steganography of 3d face textures | |
US11922649B2 (en) | Measurement data calculation apparatus, product manufacturing apparatus, information processing apparatus, silhouette image generating apparatus, and terminal apparatus | |
JP7141610B1 (ja) | スキンモデルから骨格に基づく姿勢を統計的に分析するプログラム、装置及び方法 | |
CN110781802B (zh) | 一种基于信息论流形的人脸图像识别方法 | |
Cao et al. | Nmf based image sequence analysis and its application in gait recognition | |
Baek et al. | Parametric human body modelling system for virtual garment fitting | |
Zhai et al. | An efficient classification method based on principal component and sparse representation | |
CN116703687B (zh) | 图像生成模型处理、图像生成方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200108 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200711 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200728 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200730 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200730 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6749381 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |