JP6749381B2 - 採寸値とデプス画像とを相互に生成するプログラム及び装置 - Google Patents

採寸値とデプス画像とを相互に生成するプログラム及び装置 Download PDF

Info

Publication number
JP6749381B2
JP6749381B2 JP2018212569A JP2018212569A JP6749381B2 JP 6749381 B2 JP6749381 B2 JP 6749381B2 JP 2018212569 A JP2018212569 A JP 2018212569A JP 2018212569 A JP2018212569 A JP 2018212569A JP 6749381 B2 JP6749381 B2 JP 6749381B2
Authority
JP
Japan
Prior art keywords
dimension number
dimension
component variable
learning engine
teacher data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018212569A
Other languages
English (en)
Other versions
JP2020080020A (ja
Inventor
裕樹 有光
裕樹 有光
Original Assignee
裕樹 有光
裕樹 有光
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 裕樹 有光, 裕樹 有光 filed Critical 裕樹 有光
Priority to JP2018212569A priority Critical patent/JP6749381B2/ja
Publication of JP2020080020A publication Critical patent/JP2020080020A/ja
Application granted granted Critical
Publication of JP6749381B2 publication Critical patent/JP6749381B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Description

本発明は、採寸値とデプス画像とを相互に生成する技術に関する。具体的には、デプス画像に基づくエンコード及びデコードの技術に関する
近年、人体形状データを検知可能な3次元スキャナの技術がある(例えば非特許文献1及び2参照)。この技術によれば、人体に対する非接触の光学三角測量によって、3次元の点群データを計測する。これら点群データは、約100万点と超高密度であり、人体計測の用途では極めて小さい誤差を実現している。このような人体形状データは、体重以外の健康管理データとしても有効なものである。
従来、骨格モデルに重ねた筋肉モデルを、被験者の測定結果に合わせて変形させる技術がある(例えば特許文献1参照)。この技術によれば、体組成計及び3次元測定器による被験者の身体的な測定結果に基づいて、被験者自身に応じた人体モデルを作成する。人体モデルは、骨格、筋肉及び脂肪をセットにした解剖的なモデルであり、これらは、被験者の測定結果に応じて変形される。これらの骨格、筋肉及び脂肪それぞれのモデルを切り替えて表示することにより、被験者は、自らの体内の状況などを視覚的に認識することができる。
また、物体を特徴パラメータで表現した3次元モデルを予め格納しておき、撮像画像から検出した特徴領域の画像を、3次元モデルに適応させる技術もある(例えば特許文献2参照)。この技術によれば、特徴領域の画像に撮像されている物体を表す、3次元モデルの特徴パラメータの値を算出する。そして、その特徴パラメータの値と、特徴領域以外の領域の画像とを出力することによって、3次元画像全体のデータ量を削減している。
このような3次元モデルに対して、2.5次元画像を撮影可能なデプスカメラ(Depth Camera)が、一般的になってきている。デプスカメラとは、奥行き情報を取得する深度センサを内蔵したカメラをいう。通常のカメラが取得する2次元の平面的な画像(RGB)に加えて、奥行き情報(Depth)を取得することによって、3次元の立体的な情報を取得することができる。この情報は、画素毎の距離情報を伴う点群データであって、「デプス画像」と称される。また、1視点から見た3次元情報しか取得できないため、概念的に「2.5次元画像」とも称される。
特開2017−176803号公報 特開2009−268088号公報
「3D BODY SCANNER SCUVEG4」、株式会社スペースビジョン、[online]、[平成30年11月11日検索]、インターネット<URL:http://spacevision.ap-northeast-1.elasticbeanstalk.com/productservice/3d-body-scanner-scuveg4/> 「3D Body Station」、株式会社3D Body Lab、[online]、[平成30年11月11日検索]、インターネット<URL:https://www.3dbodylab.co.jp/3dbodystation/> 「オートエンコーダ」、[online]、[平成30年11月11日検索]、インターネット<https://deepage.net/deep_learning/2016/10/09/deeplearning_autoencoder.html> 「正則化」、[online]、[平成30年11月11日検索]、インターネット<https://stats.biopapyrus.jp/sparse-modeling/regularization.html>
前述した非特許文献1及び2の場合、人体の3次元モデルを生成するために、規模的に且つコスト的に大きい3次元スキャナを用いる必要がある。また、3次元モデルは、その精度を高めるべく、頂点数を例えば15,000以上とし、各頂点も3次元(x,y,z)で表現するために、それらの次元数は、45,000以上の膨大なデータ量となる。更に、デプス画像は、例えば高さh=960pixel、幅w=540pixelの場合、w*h=518,400次元のように、膨大なデータ量となる。
これに対し、本願の発明者は、光学三角測量の3次元スキャナを用意することなく、採寸値から、ユーザの体型に近い2.5次元画像(デプス画像)を簡易に生成することができないか、と考えた。例えばスマートフォンの場合、デプスカメラが、正面側に配置されて顔認証に用いられるのみならず、背面にも配置されてきている。
他の用途として、ユーザが洋服を選ぶ場合、自らの一部の採寸箇所の採寸値のみを基準にして選択している。即ち、その採寸箇所の採寸値は、ユーザの体型を表す基準となっている。
また、本願の発明者は、デプス画像のデータを、小容量で、且つ、簡易に共有(送受信)することができないか、と考えた。一般的には、例えば衣料品業界では、ユーザの体型を表す3次元モデルから、洋服の選択や採寸の調整の用途が考えられる。また、例えば医療業界では、DICOM(Digital Imaging and COmmunications in Medicine)データから各臓器のデプス画像を表す用途も考えられる。更に、広告業界では、そのユーザの体型に合わせたエージェントキャラクタを、サイネージディスプレイに表示させる用途も考えられる。そのためにも、ユーザとサービス提供者との間で、デプス画像のデータを瞬時に送受信させる必要がある。
更に、本願の発明者は、ユーザ自らの体型を表現するデプス画像は、そのユーザにとって個人情報として守秘されるべきものではないか、と考えた。即ち、そのデプス画像をエンコードしたデータ自体は、第三者にとって理解できないように暗号化されていることが好ましい。
そこで、本発明によれば、採寸値とデプス画像とを相互に生成すると共に、極めて小さいデータ容量にエンコード及びデコードすることができるプログラム及び装置を提供することを目的とする。
本発明によれば、対象データとしての1体の次元数nの採寸値から、デプス画像を生成する装置に搭載されたコンピュータを機能させるプログラムであって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
相関学習エンジンを用いて、対象データとしての1体の次元数nの採寸値から次元数mの成分変数へエンコードするエンコード手段と、
統計学習エンジンを用いて、当該次元数mの成分変数からデプス画像にデコードするデコード手段と
してコンピュータを機能させることを特徴とする。
本発明によれば、デプス画像をエンコードする装置に搭載されたコンピュータを機能させるプログラムであって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
相関学習エンジンを用いて、対象データとしての1体の次元数nの採寸値から次元数mの成分変数へエンコードするエンコード手段と
してコンピュータを機能させることを特徴とする。
本発明のプログラムにおける他の実施形態によれば、
エンコード手段は、
対象データとして1体の次元数nの採寸値について、k(<n)個の採寸値のみ決定され、その他のn−k個の採寸値が欠損していても、次元数mの成分変数を推定するために、
k個の採寸値を束縛条件として、最適化された他のn−k個の採寸値を含む次元数mの成分変数を算出する
ようにコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
エンコード手段は、ラグランジュの未定乗数法(method of Lagrange multiplier)を用いる
ようにコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
エンコードされた次元数mの成分変数を記述したタグを作成するタグ作成手段と
して更にコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
異なるモデル種別のデプス画像それぞれに、教師データ群が用意され、
統計学習エンジン及び相関学習エンジンは、モデル種別毎に、異なる教師データ群によって複数個備えられ、
エンコード手段は、次元数nの採寸値に基づくモデル識別子に対応した相関学習エンジンを用いて、次元数nの採寸値から次元数mの成分変数へエンコードし、
タグ作成手段は、モデル種別識別子と、当該モデル種別識別子に基づく次元数mの成分変数とを対応付けてタグに記述する
ようにコンピュータを機能させることも好ましい。
本発明によれば、次元数mの成分変数から、デプス画像へデコードする装置に搭載されたコンピュータを機能させるプログラムであって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
統計学習エンジンを用いて、対象データとしての次元数mの成分変数からデプス画像にデコードするデコード手段と
してコンピュータを機能させることを特徴とする。
本発明のプログラムにおける他の実施形態によれば、
デコード手段は、対象データとしての次元数mの成分変数から、相関学習エンジンを用いて、次元数nの採寸値を導出する
ようにコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
次元数mの成分変数が記述されたタグから、次元数mの成分変数を読み取るタグ読取手段と
してコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
異なるモデル種別のデプス画像それぞれに、教師データ群が用意され、
統計学習エンジン及び相関学習エンジンは、モデル種別毎に、異なる教師データによって複数個備えられ、
タグ読取手段は、タグから、モデル種別識別子と、当該モデル種別識別子に基づく次元数mの成分変数とを読み取り、
デコード手段は、読み取られたモデル種別識別子に対応した相関学習エンジンを用いて、次元数mの成分変数からデプス画像へデコードする
してコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
タグは、QR(Quick Response、登録商標)コード又はRFID(Radio Frequency IDentifier)である
ようにコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
デプス画像は、人体又は物体の形状データであり、
教師データ群の複数体数は、デプス画像の点数よりも少ないものである
ようにコンピュータを機能させることも好ましい。
本発明のプログラムにおける他の実施形態によれば、
統計学習エンジンは、主成分分析(Principal Component Analysis)又はAutoEncoderに基づくものであり、
相関学習エンジンは、最小二乗法又はElasticNetに基づくものである
ようにコンピュータを機能させることも好ましい。
本発明によれば、対象データとしての1体の次元数nの採寸値から、デプス画像を生成する装置であって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
相関学習エンジンを用いて、対象データとしての1体の次元数nの採寸値から次元数mの成分変数へエンコードするエンコード手段と、
統計学習エンジンを用いて、当該次元数mの成分変数からデプス画像にデコードするデコード手段と
を有することを特徴とする。
本発明によれば、デプス画像をエンコードする装置であって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
相関学習エンジンを用いて、対象データとしての1体の次元数nの採寸値を入力し、次元数mの成分変数へエンコードするエンコード手段と
を有することを特徴とする。
本発明によれば、次元数mの成分変数から、デプス画像へデコードする装置であって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
対象データとしての次元数mの成分変数から、統計学習エンジンを用いて、デプス画像にデコードするデコード手段と
を有することを特徴とする。
本発明によれば、デプス画像から、1体の次元数nの採寸値を推定する装置に搭載されたコンピュータを機能させるプログラムであって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
統計学習エンジンを用いて、対象データとしての1体のデプス画像から、当該次元数mの成分変数へ逆デコードする逆デコード手段と
相関学習エンジンを用いて、当該次元数mの成分変数から、次元数nの採寸値へ逆エンコードする逆エンコード手段と
してコンピュータを機能させることを特徴とする。
本発明によれば、デプス画像を逆デコードする装置に搭載されたコンピュータを機能させるプログラムであって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
統計学習エンジンを用いて、対象データとしての1体のデプス画像から、当該次元数mの成分変数へ逆デコードする逆デコード手段と
してコンピュータを機能させることを特徴とする。
本発明によれば、次元数mの成分変数から、次元数nの採寸値へ逆エンコードする装置に搭載されたコンピュータを機能させるプログラムであって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
相関学習エンジンを用いて、当該次元数mの成分変数から、次元数nの採寸値へ逆エンコードする逆エンコード手段と
してコンピュータを機能させることを特徴とする。
本発明によれば、デプス画像から、1体の次元数nの採寸値を推定する装置であって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
統計学習エンジンを用いて、対象データとしての1体のデプス画像から、当該次元数mの成分変数へ逆デコードする逆デコード手段と
相関学習エンジンを用いて、当該次元数mの成分変数から、次元数nの採寸値へ逆エンコードする逆エンコード手段と
を有することを特徴とする。
本発明によれば、デプス画像を逆デコードする装置であって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
統計学習エンジンを用いて、対象データとしての1体のデプス画像から、当該次元数mの成分変数へ逆デコードする逆デコード手段と
を有することを特徴とする。
本発明によれば、次元数mの成分変数から、次元数nの採寸値へ逆エンコードする装置であって、
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
相関学習エンジンを用いて、当該次元数mの成分変数から、次元数nの採寸値へ逆エンコードする逆エンコード手段と
を有することを特徴とする。
本発明のプログラム及び装置によれば、採寸値とデプス画像とを相互に生成すると共に、極めて小さいデータ容量にエンコード及びデコードすることができる。
本発明における採寸値からデプス画像を生成する装置の機能構成図である。 統計学習エンジンにおけるデプス画像のベクトル空間を表す説明図である。 統計学習エンジンにおける統計形状空間を表す説明図である。 統計学習エンジンにおける主成分分析を表す簡易なコードである。 採寸箇所の採寸値から導出した採寸値空間を表す説明図である。 統計形状空間と採寸値空間との線形変換を表す説明図である。 相関学習エンジンにおける統計形状空間と採寸値空間との間の線形変換を表す簡易なコードである。 本発明によってデコードされたデプス画像の精度を表す説明図である。 デプス画像をタグにエンコード及びデコードする装置の機能構成図である。 物体抽出機能の第1〜第3のステップを表す説明図である。 物体抽出機能の第4〜第5のステップを表す説明図である。 モデル種別に応じて学習エンジンを切り替える機能構成図である。 本発明における欠損値を推定する採寸値空間を表す説明図である。 本発明における欠損値推定を表す簡易なコードである。 本発明におけるデプス画像と採寸値とQRコードとを表すユーザインタフェースである。 本発明におけるデプス画像から採寸値を推定する装置の機能構成図である。
以下では、本発明の実施の形態について、図面を用いて詳細に説明する。
図1は、本発明における採寸値からデプス画像を生成する装置の機能構成図である。
図1の装置によれば、複数の採寸値を入力することによって、デプス画像を生成することができる。
図1によれば、装置1は、教師データ形成部100と、統計学習エンジン101と、相関学習エンジン102と、エンコード部111と、デコード部122とを有する。これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現できる。
[統計学習エンジン101]
統計学習エンジン101は、教師データ群の複数体のデプス画像を入力し、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する。
図2は、統計学習エンジンにおけるデプス画像のベクトル空間を表す説明図である。
図2によれば、教師データとしては、例えば様々な体型を持つ1,000人それぞれのデプス画像を想定している。デプス画像は、点群であって深度画像で表現されている。
図2(a)によれば、1体のデプス画像は、高さh=960pixel、幅w=540pixel(8bit/pixel)で表現される。即ち、1体のデプス画像は、w*h(=518,400)次元のベクトルで表される。
図2(b)によれば、1体のデプス画像は、毎に、w*h次元空間(960×540=518,400)で表現される。
尚、一般的な機械学習エンジンによれば、膨大な数の教師データを必要とするのに対し、本発明によれば、教師データ群の複数体数は、デプス画像の点数よりも少なくてもよい。即ち、教師データの画像1,000枚は、デプス画像のベクトル次元数518,400よりも少ないということにある。即ち、教師データの複数体数を、デプス画像のベクトル次元数以上に用意する必要がない。
図3は、統計学習エンジンにおける統計形状空間を表す説明図である。
図4は、統計学習エンジンにおける主成分分析を表す簡易なコードである。
<主成分分析>
統計学習エンジン101は、具体的には、主成分分析(Principal Component Analysis)に基づくものである。
「主成分分析」によって、相関のあるw*h次元空間の1,000点から、互いに無相関で全体のばらつきを最もよく表す少数(例えば300個)の主成分(成分変数)を導出する。第1主成分の分散を最大化し、続く主成分はそれまでに決定した主成分と無相関という拘束条件の下で、分散を最大化するようにして選択される。主成分の分散を最大化することによって、観測値の変化に対する説明能力を可能な限り主成分に持たせる。主成分を与える主軸はw*h次空間の1,000点の群の直交基底となっている。主軸の直交性は、主軸が共分散行列の固有ベクトルになっており、共分散行列が実対称行列であることから導かれる。
統計学習エンジン101は、w*h次元空間に対して、主成分分析に基づく成分変数数を次元数とする統計形状空間(例えば300次元)に射影させる統計学習モデルを構築する。
本発明によれば、w*h(=518,400)次元空間における各デプス画像を、例えば300次元(成分変数)空間に射影する。主成分を与える変換は、観測値の集合からなる行列の特異値分解で表され、w*h次元空間の1,000点の群からなる矩形行列Xの特異値分解は、以下の式で表される。
X=U*Σ*VT
X:w*h次元空間の1,000点からなる行列(1,000行×w*h列)
U:n(1,000)×n(1,000)の正方行列(n次元単位ベクトルの直交行列)
Σ:n(1,000)×p(w*h)の矩形対角行列(対角成分は、Xの特異値)
V:p(w*h)×p(w*h)の正方行列(p次元単位ベクトルの直交行列)
ここで、Vの最初の300列からなる行列をVと改める。そして、その行列Vによる線形変換はXの主成分を与える。
V:w*h次元空間->統計形状(300次元)空間への変換を表す行列
-1:統計形状(300次元)空間->w*h次元空間への変換を表す行列
尚、行列の上付き添え字-1は逆行列を示す記号ではなく、行列が定めるベクトルの変換に対して、その逆変換を意味する抽象的な記号として用いている。ここでは、V-1は、Vの転置VTと等しい。
図3からも明らかなとおり、行列V又はV-1による線形変換によって、w*h次元空間と統計形状空間との間で、デプス画像の1体毎に対応付けることができる。
s=x*V
x=s*V-1
s:統計形状空間のベクトル
x:w*h次元空間のベクトル
V:統計学習モデル
統計学習エンジン101は、オートエンコーダ(AutoEncoder)に基づくものであってもよい。
オートエンコーダは、ニューラルネットワークの一種で、情報量を小さくした特徴表現を実現する(例えば非特許文献3参照)。具体的には、入力データの次元数よりも、隠れ層の次元を圧縮したものである。入力データは、ニューラルネットワークを通して圧縮し、出力時には元のサイズに戻す。このとき、ニューラルネットワークは、入力データの抽象的概念(特徴量)を抽出する。
オートエンコーダも、主成分分析と同様に、相関のあるw*h次元空間の1,000点から、互いに無相関で全体のばらつきを最もよく表す300次元の成分変数を導出する。
[相関学習エンジン102]
相関学習エンジン102は、教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する。
図5は、採寸箇所の採寸値から導出した採寸値空間を表す説明図である。
教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられている。図5によれば、前述した図2における教師データのデプス画像の人体それぞれに、複数の採寸箇所の採寸値が付与されている。但し、採寸値は、デプス画像自体から導出されるものではなく、そのデプス画像が撮影された人体自体から採寸されたものである。即ち、デプス画像のデータと、採寸箇所の採寸値とが別個に対応付けられたものである。
この場合、採寸箇所を要素とし、採寸値をその要素値とした採寸値空間を導出することできる。例えば10カ所の採寸箇所の採寸値が付与されている場合、採寸値空間は10次元となる。
勿論、採寸箇所は、1カ所以上であればよい。身長だけでもよいし、身長+腹囲であってもよいし、身長+腹囲+胸囲であってもよい。
図6は、統計形状空間と採寸値空間との線形変換を表す説明図である。
図7は、相関学習エンジンにおける統計形状空間と採寸値空間との間の線形変換を表す簡易なコードである。
<最小二乗法>
相関学習エンジン102は、最小二乗法に基づくものである。
「最小二乗法(least squares method)」とは、複数の多次元ベクトル(データの組)から線形モデルで近似する際に、残差の二乗和が最小となる最も確からしい線形モデルを決定することをいう。
図5からも明らかなとおり、行列A又はA-1による線形変換によって、統計形状空間と採寸値空間との間で、デプス画像の1体毎に対応付けることができる。
s=d*A
d=s*A-1
A=(DT*D)-1*DT*S (||D*A−S||を最小化するAを導出する)
s:統計形状空間のベクトル
d:採寸値空間のベクトル
S:統計形状空間のベクトルの組
D:採寸値空間のベクトルの組
A:相関学習モデル
<ElasticNet>
相関学習エンジン102は、ElasticNetであってもよい。
ElasticNetとは、一般化線形モデルの回帰に正則化項を加味するモデルであって、次元圧縮及び過学習防止の両方を実現する(例えば非特許文献4参照)。データ数に対して特徴量の数が非常に多い場合や、特徴量間に強い相関(多重共線性)がある場合に、通常の回帰モデル構築の際に用いられる2乗誤差などの目的関数に加え、Lpノルム(pは正整数)のような正則化項を加えて最適化するものをいう。p=1の時にLasso回帰、p=2の時にRidge回帰と称する。また、それぞれに用いられている正則化項をL1ノルム、L2ノルムと呼ぶ。
Lasso回帰は、L1ペナルティにより変数選択と次元圧縮を行う
Ridge回帰は、L2ペナルティにより係数を縮小して過学習を抑える。
Elastic NetはこれらLasso回帰とRidge回帰を線形結合したモデルである。
これによって、統計形状空間と採寸値空間との間で、デプス画像の1体毎に対応付けることができる。
[エンコード部111]
エンコード部111は、相関学習エンジン102を用いて、対象データとしての1体の次元数nの採寸値から、次元数mの成分変数へエンコードする。エンコードされた次元数mの成分変数は、採寸値を認識できない秘匿性を持つ。そのために、対象データの1体の次元数nの採寸値が守秘情報である場合に適する。
[デコード部122]
デコード部122は、統計学習エンジン101を用いて、エンコードされた次元数mの成分変数から、デプス画像にデコードする。
図8は、本発明によってデコードされたデプス画像の精度を表す説明図である。
図8(a)は、対象データとして、4つの異なるデプス画像A〜Dを表す。
図8(b)は、対象データのデプス画像A〜Dそれぞれについて、統計学習エンジン101によって成分変数にエンコードし、その成分変数から統計学習エンジン101によってデコードしたデプス画像を表す。図8(a)と図8(b)とを比較して、主成分分析によってエンコード及びデコードをしても、デプス画像がほぼ同一形状に維持されていることが理解できる。
図8(c)は、対象データのデプス画像A〜Dそれぞれについて、採寸値(10カ所)から相関学習エンジン102によって成分変数にエンコードし、その成分変数から統計学習エンジン101によってデコードしたデプス画像を表す。図8(a)と図8(c)とを比較して、採寸値によってエンコード及びデコードしても、デプス画像がほぼ同一形状に維持されていることが理解できる。
図9は、デプス画像をタグにエンコード及びデコードする装置の機能構成図である。
図9によれば、図1と比較して、エンコードとしてのタグ作成部112と、デコードとしてのタグ読取部121とを有する。
[タグ作成部112]
タグ作成部112は、エンコード部111から出力された次元数mの成分変数を入力し、その成分変数を記述したタグを作成する。
[タグ読取部121]
タグ読取部121は、タグから、エンコードされた次元数mの成分変数を読み取る。読み取られた成分変数は、デコード部122へ出力される。
タグとしては、例えばQR(Quick Response)コードであってもよい。QRコードは、マトリックス型2次元コードであり、バイナリで最大2,953バイトを記述することができる。一般的なスマートフォンでは、QRコードをディスプレイに表示することもできるし、そのQRコードをカメラで読み取ることができる。
本発明によれば、デプス画像を、4バイトで300次元とした場合、1200バイト(成分変数)で表すことができる。300バイトをQRコードに記述することができれば、例えばユーザ自らの体型を表すデプス画像を、QRコードで明示することが可能となる。
また、タグとしては、QRコードに限らず、又はRFID(Radio Frequency IDentifier)であってもよい。RFIDとは、RFタグに記述された情報を、電磁界や電波を用いた近距離無線通信によって通信する技術をいう。例えばFelica(登録商標)であって、電子マネーや乗車カードに用いられている。
本発明によれば、例えばデプス画像の成分変数を、RFタグに記述しておくだけで、リーダによって瞬時に読み取らせることができる。RFタグから成分変数を読み取ったリーダは、その成分変数に対応したデプス画像を瞬時にディスプレイに表示することもきる。
[教師データ形成部100]
教師データ形成部100は、<F1:物体抽出機能>と、<F2:正規化機能>とを有する。
図10は、物体抽出機能の第1〜第3のステップを表す説明図である。
図11は、物体抽出機能の第4〜第5のステップを表す説明図である。
<F1:物体抽出機能>
物体抽出機能は、以下の5つのステップを要する。
(S1)背景のみが映る第1のデプス画像を予め取得する。
(S2)前景と背景との両方を含む第2のデプス画像を入力する。
(S3)第1のデプス画像と第2のデプス画像とを比較して、ピクセル輝度の差の絶対値を導出する。
(S4)2値化処理によって2つのクラス(物体部分と非物体部分)に分離した2値画像を生成する。この2値化処理には、例えば「大津のアルゴリズム」を適用することができる。この判別分析法(discriminant analysis method)は、分離度(separation
metrics)という値が最大となる閾値を求め、自動的に2値化することができる。分離度は、クラス間分散(between-class variance)とクラス内分散(within-class variance)との比で求める。
(S5)S2で入力された第2のデプス画像から、S4で算出された2値化画像をマスク処理して、物体のみのデプス画像を抽出する。
<F2:正規化機能>
正規化機能は、以下の5つのステップを要する。
(S1)物体抽出機能によって抽出したデプス画像の画像平面上のピクセル座標p=(x,y,z)から、3次元座標P=(X,Y,Z)を計算する。
各点P=(X,Y,Z)について、X=x*z/f, Y=y*z/f, Z=z
<既知のカメラ仕様>
焦点距離(物理) F (mm)
焦点距離(ピクセル) f=(fx,fy)=(F*sx,F*sy) (pixel)
ピクセルサイズ s=(sx,sy) (pixel/mm)
(S2)物体のデプス画像からバウンディングボックスを特定し、その重心を決定する。
(S3)S2によって決定された重心に基づいて、デプス画像を所定の重心に平行移動する。
(S4)S3によって平行移動されたデプス画像に対して、画像平面上のピクセル座標を計算する。
各点p=(x,y,z)について、x=X*f/Z, y=Y*f/Z, z=Z
(S5)S4によって計算されたピクセル座標は必ずしも整数値ではないので、補完を使って最終的なピクセル座標を計算する。
(S6)S5によって補完されたデプス画像を、教師データとして、統計学習エンジン101へ入力する。
図12は、モデル種別に応じて学習エンジンを切り替える機能構成図である。
図12によれば、異なるモデル種別のデプス画像それぞれに、教師データ群が用意されている。前述した実施形態によれば、デプス画像は人体であるとして説明したが、様々な物体であってもよい。
医療用途の場合、MRI(核磁気共鳴画像法)やCT(コンピュータ断層撮影)によって撮影した医用画像のDICOMデータから、例えば臓器毎のデプス画像を作成することできる。例えば臓器毎にモデル種別を付与することによって、モデル種別に応じてデプス画像を切り替えることができる。
異なるモデル種別のデプス画像それぞれに、教師データ群が用意される。そして、統計学習エンジン101及び相関学習エンジン102は、モデル種別毎に、異なる教師データ群によって複数個備えられる。
エンコード側として、エンコード部111は、対象データにおける次元数nの採寸値と、その対象データのモデルID(モデル種別識別子)とを入力する。そして、エンコード部111は、そのモデルIDに対応した相関学習エンジン102を用いて、次元数mの成分変数にエンコードする。
タグ作成部112は、モデルIDと、当該モデルIDに基づく次元数mの成分変数とを対応付けてタグに記述する。
デコード側として、タグ読取部121は、タグから、モデルIDと、当該モデルIDに基づく次元数mの成分変数とを読み取る。
デコード部122は、読み取られた次元数mの成分変数から、当該モデルIDに対応する相関学習エンジン102を用いて、デプス画像へデコードする。
<採寸値の欠損値推定>
図13は、本発明における欠損値を推定する採寸値空間を表す説明図である。
図14は、本発明における欠損値推定を表す簡易なコードである。
採寸値空間は、教師データ群のデプス画像に対応付けられた、固定の次元数n(=10)の採寸値を表すものである。
ここで、本発明によれば、対象データとして1体の次元数nの採寸値について、k(<n)個の採寸値のみが決定され、その他のn−k個の採寸値が欠損していてもよい。即ち、本発明によれば、教師データ群によって例えば10次元の採寸値空間から相関学習モデルを構築したとしても、例えばk=3個の採寸箇所の採寸値のみを入力することによって、次元数mの成分変数を推定することができる。
図13によれば、採寸値(10次元)空間上に、超楕円体の等値面が表されている。超楕円体とは、楕円を次元数n(=10)次元へ拡張したような図形をいう。等値面とは、その次元(=10)上に描かれる等高線図をいう。ここで、分散共分散行列C=DT*Dは既知であるとする。
超楕円体を表す二次形式(x:列ベクトル)
f(x)=xT*C-1*x
-1:対称行列
※実際には分散共分散行列はC=DT*D/教師データ群数
-1は、逆行列を示す
本発明によれば、k個の採寸値を束縛条件として、最適化された他のn−k個の採寸値を含む次元数mの成分変数を算出する。これには、ラグランジュの未定乗数法(method of Lagrange multiplier)を用いる。
ラグランジュの未定乗数法とは、束縛条件のもとで最適化する解析方法であって、いくつかの変数に対して、いくつかの関数の値を固定するという束縛条件のもとで、別のある1つの関数の極値を求めるという問題を考える。各束縛条件に対して、定数(未定乗数、Lagrange multiplier)を用意し、これらを係数とする線形結合を新しい関数(未定乗数も新たな変数とする)として考えることで、束縛問題を普通の極値問題として解く。
制約条件gj(x1,・・・,xn)=0(j=1,・・・,k)の下で、関数f(x1,・・・,xn)が極値をとる点について、
F(x1,・・・,xn1,・・・,λk)
=f(x1,・・・,xn)+Σλjj(x1,・・・,xn)
とすることによって、以下の式を満たす。
dF/dxi=0 (i=1,・・・,n)
dF/dλj=0 (j=1,・・・,k)
採寸値の欠損値推定の場合に、k個の採寸値が与えられた場合、制約条件gj(x)=0(j=1,・・・,k)は、10次元空間上のアフィン超平面を表す一次方程式であり、以下の式で表される。
アフィン超平面を表す一次方程式
j(x)=nj T*(x−pj)=0
n:超平面の法線ベクトル
p:超平面上の点
特に、それぞれの超平面は基底に直交する(nの方向が基底方向に一致する)ために、以下のようになる。
j(x)=xi−yj=0
j:j番目の採寸値
i:対応するxの要素
制約条件の下で、関数f(x)の最小値を求めることは、与えられた採寸値の下で、平均に最も近い体型を求めることとなる。
10次元空間の場合、具体的には、以下のように表される。
x:10次元列ベクトル
y:k個の採寸値を含む10次元列ベクトル (k個以外の採寸値の値は任意)
λ:ラグランジュ乗数を要素とするk次元列ベクトル
O:k行10列の行列 各行は与えられた採寸値に応じたone-hot行ベクトル
C:分散共分散行列
f(x)=1/2*xT*C-1*x
g(x)=O*(y−x)
F(x)=f(x)+λT*g(x)
dF/dx=C-1*x−OT*λ=0 (1)
dF/dλ=O*(y−x)=0 (2)
(1)より、x=C*OT*λ (3)
(3)を(2)に代入
O*y−O*C*OT*λ=0
λ=(O*C*OT)-1*O*y
λを(3)に代入
x=C*OT*(O*C*OT)-1*O*y
図15は、本発明におけるデプス画像と採寸値とQRコードとを表すユーザインタフェースである。
このユーザインタフェースによれば、採寸値に対応するデプス画像と、そのデプス画像の成分変数が記述されたQRコードとを、一見することができる。特に、QRコードを、カメラによって読み取らせるだけで、デプス画像を共有することできる。
図16は、本発明におけるデプス画像から採寸値を推定する装置の機能構成図である。
図16の装置によれば、図1と逆に、対象データとしての1体のデプス画像を入力することによって、複数の採寸値を推定することができる。
図16によれば、装置1は、図1と同様に、教師データ形成部100と、統計学習エンジン101及び相関学習エンジン102を有すると共に、更に、逆デコード部132及び逆エンコード部131を有する。これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現できる。
[逆デコード部132]
逆デコード部132は、統計学習エンジン101を用いて、対象データとしての1体のデプス画像から、当該次元数mの成分変数へ逆デコードする。その次元数mの成分変数は、逆エンコード部131へ出力される。
[逆エンコード部131]
逆エンコード部131は、相関学習エンジン101を用いて、当該次元数mの成分変数から、次元数nの採寸値へ逆エンコードする。その次元数nの採寸値は、逆デコード部132へ入力されたデプス画像に対応するものである。
以上、詳細に説明したように、本発明のプログラム及び装置によれば、採寸値とデプス画像とを相互に生成すると共に、極めて小さいデータ容量にエンコード及びデコードすることができる。
本発明によれば、例えば以下のような用途に適する。
(用途1)ユーザ所持のスマートフォンを用いて、自らの体型の採寸値を入力し、成分変数を含むQRコードを作成しておく。そのQRコードを、転送先の装置のカメラへかざすことによって、自らの体型を表すデプス画像を瞬時に送信することができる。
逆に、ユーザ所持のスマートフォンを用いて、自らの体型のデプスカメラによって撮影したデプス画像を入力し、成分変数を含むQRコードを作成しておく。そのQRコードを、転送先の装置のカメラへかざすことによって、自らの採寸値を瞬時に送信することができる。
(用途2)衣料品業界の用途として、洋服の採寸値を入力することによって、その洋服に適したデプス画像を作成することができる。
(用途3)医療業界の用途として、ユーザのDICOMデータに基づくデプス画像を成分変数にエンコードしておくことによって、そのユーザの様々な臓器等の医用デプス画像をタグやRFIDに記憶させておき、瞬時に転送することができる。
(用途4)広告業界の用途として、ユーザから読み取った成分変数からデプス画像を再生し、そのデプス画像をそのユーザのキャラクタとして、サイネージディスプレイに表示させることができる。
(用途5)エンコードされた成分変数は、第三者が容易に認識することができず、個人情報の守秘性を持つ。
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 装置
100 教師データ形成部
101 統計学習エンジン
102 相関学習エンジン
111 エンコード部
112 タグ作成部
121 タグ読取部
122 デコード部
131 逆エンコード部
132 逆デコード部

Claims (22)

  1. 対象データとしての1体の次元数nの採寸値から、デプス画像を生成する装置に搭載されたコンピュータを機能させるプログラムであって、
    教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
    教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
    教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
    相関学習エンジンを用いて、対象データとしての1体の次元数nの採寸値から次元数mの成分変数へエンコードするエンコード手段と、
    統計学習エンジンを用いて、当該次元数mの成分変数からデプス画像にデコードするデコード手段と
    してコンピュータを機能させることを特徴とするプログラム。
  2. デプス画像をエンコードする装置に搭載されたコンピュータを機能させるプログラムであって、
    教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
    教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
    教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
    相関学習エンジンを用いて、対象データとしての1体の次元数nの採寸値から次元数mの成分変数へエンコードするエンコード手段と
    してコンピュータを機能させることを特徴とするプログラム。
  3. 前記エンコード手段は、
    対象データとして1体の次元数nの採寸値について、k(<n)個の採寸値のみ決定され、その他のn−k個の採寸値が欠損していても、次元数mの成分変数を推定するために、
    k個の採寸値を束縛条件として、最適化された他のn−k個の採寸値を含む次元数mの成分変数を算出する
    ようにコンピュータを機能させることを特徴とする請求項2に記載のプログラム。
  4. 前記エンコード手段は、ラグランジュの未定乗数法(method of Lagrange multiplier)を用いる
    ようにコンピュータを機能させることを特徴とする請求項3に記載のプログラム。
  5. エンコードされた次元数mの成分変数を記述したタグを作成するタグ作成手段と
    して更にコンピュータを機能させることを特徴とする請求項2から4のいずれか1項に記載のプログラム。
  6. 異なるモデル種別のデプス画像それぞれに、教師データ群が用意され、
    統計学習エンジン及び相関学習エンジンは、モデル種別毎に、異なる教師データ群によって複数個備えられ、
    前記エンコード手段は、次元数nの採寸値に基づくモデル識別子に対応した相関学習エンジンを用いて、次元数nの採寸値から次元数mの成分変数へエンコードし、
    前記タグ作成手段は、モデル種別識別子と、当該モデル種別識別子に基づく次元数mの成分変数とを対応付けてタグに記述する
    ようにコンピュータを機能させることを特徴とする請求項5に記載のプログラム。
  7. 次元数mの成分変数から、デプス画像へデコードする装置に搭載されたコンピュータを機能させるプログラムであって、
    教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
    教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
    教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
    統計学習エンジンを用いて、対象データとしての次元数mの成分変数からデプス画像にデコードするデコード手段と
    してコンピュータを機能させることを特徴とするプログラム。
  8. 前記デコード手段は、対象データとしての次元数mの成分変数から、相関学習エンジンを用いて、次元数nの採寸値を導出する
    ようにコンピュータを機能させることを特徴とする請求項7に記載のプログラム。
  9. 次元数mの成分変数が記述されたタグから、次元数mの成分変数を読み取るタグ読取手段と
    してコンピュータを機能させることを特徴とする請求項7又は8に記載のプログラム。
  10. 異なるモデル種別のデプス画像それぞれに、教師データ群が用意され、
    統計学習エンジン及び相関学習エンジンは、モデル種別毎に、異なる教師データによって複数個備えられ、
    前記タグ読取手段は、タグから、モデル種別識別子と、当該モデル種別識別子に基づく次元数mの成分変数とを読み取り、
    前記デコード手段は、読み取られたモデル種別識別子に対応した相関学習エンジンを用いて、次元数mの成分変数からデプス画像へデコードする
    してコンピュータを機能させることを特徴とする請求項9に記載のプログラム。
  11. 前記タグは、QR(Quick Response、登録商標)コード又はRFID(Radio Frequency IDentifier)である
    ようにコンピュータを機能させることを特徴とする請求項5、6、9又は10に記載のプログラム。
  12. デプス画像は、人体又は物体の形状データであり、
    教師データ群の複数体数は、デプス画像の点数よりも少ないものである
    ようにコンピュータを機能させることを特徴とする請求項1から11のいずれか1項に記載のプログラム。
  13. 統計学習エンジンは、主成分分析(Principal Component Analysis)又はAutoEncoderに基づくものであり、
    相関学習エンジンは、最小二乗法又はElasticNetに基づくものである
    ようにコンピュータを機能させることを特徴とする請求項1から12のいずれか1項に記載のプログラム。
  14. 対象データとしての1体の次元数nの採寸値から、デプス画像を生成する装置であって、
    教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
    教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
    教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
    相関学習エンジンを用いて、対象データとしての1体の次元数nの採寸値から次元数mの成分変数へエンコードするエンコード手段と、
    統計学習エンジンを用いて、当該次元数mの成分変数からデプス画像にデコードするデコード手段と
    を有することを特徴とする装置。
  15. デプス画像をエンコードする装置であって、
    教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
    教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
    教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
    相関学習エンジンを用いて、対象データとしての1体の次元数nの採寸値を入力し、次元数mの成分変数へエンコードするエンコード手段と
    を有することを特徴とする装置。
  16. 次元数mの成分変数から、デプス画像へデコードする装置であって、
    教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
    教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
    教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
    対象データとしての次元数mの成分変数から、統計学習エンジンを用いて、デプス画像にデコードするデコード手段と
    を有することを特徴とする装置。
  17. デプス画像から、1体の次元数nの採寸値を推定する装置に搭載されたコンピュータを機能させるプログラムであって、
    教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
    教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
    教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
    統計学習エンジンを用いて、対象データとしての1体のデプス画像から、当該次元数mの成分変数へ逆デコードする逆デコード手段と
    相関学習エンジンを用いて、当該次元数mの成分変数から、次元数nの採寸値へ逆エンコードする逆エンコード手段と
    してコンピュータを機能させることを特徴とするプログラム。
  18. デプス画像を逆デコードする装置に搭載されたコンピュータを機能させるプログラムであって、
    教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
    教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
    教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
    統計学習エンジンを用いて、対象データとしての1体のデプス画像から、当該次元数mの成分変数へ逆デコードする逆デコード手段と
    してコンピュータを機能させることを特徴とするプログラム。
  19. 次元数mの成分変数から、次元数nの採寸値へ逆エンコードする装置に搭載されたコンピュータを機能させるプログラムであって、
    教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
    教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
    教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
    相関学習エンジンを用いて、当該次元数mの成分変数から、次元数nの採寸値へ逆エンコードする逆エンコード手段と
    してコンピュータを機能させることを特徴とするプログラム。
  20. デプス画像から、1体の次元数nの採寸値を推定する装置であって、
    教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
    教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
    教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
    統計学習エンジンを用いて、対象データとしての1体のデプス画像から、当該次元数mの成分変数へ逆デコードする逆デコード手段と
    相関学習エンジンを用いて、当該次元数mの成分変数から、次元数nの採寸値へ逆エンコードする逆エンコード手段と
    を有することを特徴とする装置。
  21. デプス画像を逆デコードする装置であって、
    教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
    教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
    教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
    統計学習エンジンを用いて、対象データとしての1体のデプス画像から、当該次元数mの成分変数へ逆デコードする逆デコード手段と
    を有することを特徴とする装置。
  22. 次元数mの成分変数から、次元数nの採寸値へ逆エンコードする装置であって、
    教師データ群として、デプス画像毎に、複数の採寸箇所に対応する次元数nの採寸値が対応付けられており、
    教師データ群の複数体のデプス画像から、次元圧縮された次元数mの成分変数を出力すると共に、統計学習モデルを構築する統計学習エンジンと、
    教師データ群の複数体のデプス画像から、次元数nの採寸値と、次元数mの成分変数との相関学習モデルを構築する相関学習エンジンと、
    相関学習エンジンを用いて、当該次元数mの成分変数から、次元数nの採寸値へ逆エンコードする逆エンコード手段と
    を有することを特徴とする装置。
JP2018212569A 2018-11-12 2018-11-12 採寸値とデプス画像とを相互に生成するプログラム及び装置 Active JP6749381B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018212569A JP6749381B2 (ja) 2018-11-12 2018-11-12 採寸値とデプス画像とを相互に生成するプログラム及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018212569A JP6749381B2 (ja) 2018-11-12 2018-11-12 採寸値とデプス画像とを相互に生成するプログラム及び装置

Publications (2)

Publication Number Publication Date
JP2020080020A JP2020080020A (ja) 2020-05-28
JP6749381B2 true JP6749381B2 (ja) 2020-09-02

Family

ID=70801761

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018212569A Active JP6749381B2 (ja) 2018-11-12 2018-11-12 採寸値とデプス画像とを相互に生成するプログラム及び装置

Country Status (1)

Country Link
JP (1) JP6749381B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130081037A (ko) * 2012-01-06 2013-07-16 한국전자통신연구원 인체 치수 측정 시스템 및 그 방법
US10796480B2 (en) * 2015-08-14 2020-10-06 Metail Limited Methods of generating personalized 3D head models or 3D body models
JP6988406B2 (ja) * 2017-11-27 2022-01-05 富士通株式会社 手位置検出方法、手位置検出装置、及び手位置検出プログラム

Also Published As

Publication number Publication date
JP2020080020A (ja) 2020-05-28

Similar Documents

Publication Publication Date Title
JP6424309B1 (ja) 採寸値に基づく3次元モデルを生成するプログラム及び装置
US20230063306A1 (en) Method for object recognition
CN110599395B (zh) 目标图像生成方法、装置、服务器及存储介质
JP6892569B2 (ja) 人体に基づくデプス画像と組成値とを対応付ける装置
CN111047548A (zh) 姿态变换数据处理方法、装置、计算机设备和存储介质
CN106780662B (zh) 人脸图像生成方法、装置及设备
Su et al. Color and depth priors in natural images
Zhu et al. Image interpolation based on non-local geometric similarities and directional gradients
Konda et al. Unsupervised learning of depth and motion
CN114298997B (zh) 一种伪造图片检测方法、装置及存储介质
Chowdhary et al. Singular value decomposition–principal component analysis-based object recognition approach
Srivastava et al. Multifocus noisy image fusion using contourlet transform
WO2005050533A2 (en) Image clustering with metric, local linear structure, and affine symmetry
JP6749381B2 (ja) 採寸値とデプス画像とを相互に生成するプログラム及び装置
JP2008171074A (ja) 三次元形状モデル生成装置、三次元形状モデル生成方法、コンピュータプログラム、及び三次元形状モデル生成システム
JP6667785B1 (ja) 3次元モデルとデプス画像とを対応付けて学習するプログラム
CN114913104B (zh) 图像处理方法、图像处理装置、电子设备及存储介质
Moradi et al. Combining and Steganography of 3d face textures
US11922649B2 (en) Measurement data calculation apparatus, product manufacturing apparatus, information processing apparatus, silhouette image generating apparatus, and terminal apparatus
JP7141610B1 (ja) スキンモデルから骨格に基づく姿勢を統計的に分析するプログラム、装置及び方法
CN110781802B (zh) 一种基于信息论流形的人脸图像识别方法
Cao et al. Nmf based image sequence analysis and its application in gait recognition
Baek et al. Parametric human body modelling system for virtual garment fitting
Zhai et al. An efficient classification method based on principal component and sparse representation
CN116703687B (zh) 图像生成模型处理、图像生成方法、装置和计算机设备

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200108

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20200711

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20200728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200730

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200730

R150 Certificate of patent or registration of utility model

Ref document number: 6749381

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250