JP6450710B2 - 情報予測システム、情報予測方法及び情報予測プログラム - Google Patents
情報予測システム、情報予測方法及び情報予測プログラム Download PDFInfo
- Publication number
- JP6450710B2 JP6450710B2 JP2016099737A JP2016099737A JP6450710B2 JP 6450710 B2 JP6450710 B2 JP 6450710B2 JP 2016099737 A JP2016099737 A JP 2016099737A JP 2016099737 A JP2016099737 A JP 2016099737A JP 6450710 B2 JP6450710 B2 JP 6450710B2
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- learning
- information
- vector
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 115
- 239000013598 vector Substances 0.000 claims description 210
- 238000012545 processing Methods 0.000 claims description 132
- 230000008569 process Effects 0.000 claims description 83
- 238000012805 post-processing Methods 0.000 claims description 20
- 230000008878 coupling Effects 0.000 claims description 16
- 238000010168 coupling process Methods 0.000 claims description 16
- 238000005859 coupling reaction Methods 0.000 claims description 16
- 238000010801 machine learning Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 2
- 238000000513 principal component analysis Methods 0.000 description 31
- 238000000605 extraction Methods 0.000 description 23
- 238000004364 calculation method Methods 0.000 description 14
- 239000011159 matrix material Substances 0.000 description 11
- 238000010606 normalization Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 7
- 230000001186 cumulative effect Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000000611 regression analysis Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000003709 image segmentation Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000036541 health Effects 0.000 description 2
- 238000011946 reduction process Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 208000004547 Hallucinations Diseases 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Landscapes
- Image Processing (AREA)
- Television Systems (AREA)
- Image Analysis (AREA)
Description
本発明は、上記問題点を解決するためになされたものであり、第1の情報に基づいて、第2の情報を効率的に予測するための情報予測システム、情報予測方法及び情報予測プログラムを提供することにある。
結合係数と、前記学習結果記憶部に記録された前記結合ベクトルを用いて、前記処理対象の予測先情報の特徴ベクトルを算出する予測処理とを実行する。これにより、効率的かつ的確に予測することができる。
図1に示すように、本実施形態では、画像処理システム20を用いる。この画像処理システム20には、入力部10、出力部15が接続されている。入力部10は、キーボードやポインティングデバイスにより構成され、担当者によって入力された情報を取得する。出力部15は、ディスプレイにより構成され、各種情報の出力を行なう。
超解像部215は、処理対象画像(入力画像)の解像度を上げる超解像処理を実行する。超解像部215は、処理対象画像及び計算途中の画像を記憶するメモリを備えている。
第2予測部217は、主成分ベクトルが直交化されていない場合に、高解像パッチの最適解を検索する処理を実行する。第2予測部217は、主成分係数の最適解の検索時に微小移動させる振れ幅に関するデータを保持している。
顔画像記憶部22には、学習に用いる顔画像(学習対象)に関する学習用画像データが記録されている。この学習画像データは、超解像処理のための学習に用いるデータが登録された場合に記録される。この顔画像データには、データ番号に関連付けられて、複数の顔画像が記録されている。
(学習処理)
まず、図2を用いて、学習処理を説明する。この学習処理は、第1の学習処理と第2の学習処理とを含む。第1の学習処理においては、サイズや顔パーツの位置を合わせるように正規化した高解像と低解像との顔画像のペアを生成する。第2の学習処理においては、高解像と低解像との顔画像のペアを、それぞれ所定形状(例えば、四角形)の要素(パッチ)に分割する。そして、パッチ単位で「低解像、高解像」の関係を、主成分分析によりカップリング学習する。
まず、図2(a)を用いて、第1の学習処理を説明する。
ここでは、画像処理システム20の制御部21は、顔画像記憶部22に記録された顔画像データにおいて、順次、処理対象のデータを特定し、以下の処理を繰り返す。
以上、顔画像記憶部22に記録されたすべての顔画像データについて終了するまで繰り返す。
次に、図2(b)を用いて、第2の学習処理を説明する。
ここでは、顔画像記憶部22に記録された顔画像データにおいて、順次、処理対象のデータを特定し、以下の処理を繰り返す。
ここでは、画像処理システム20の制御部21は、行列の作成処理を実行する(ステップS2−4)。具体的には、制御部21の学習部210は、処理対象のパッチについて、2次元パッチデータを生成する。ここでは、処理対象パッチにおけるRGB値を画素毎に並べた2次元パッチデータを生成する。そして、学習部210は、生成した2次元パッチデータを1次元行パッチベクトル(pij)に変換する。ここで、「i」はパッチ位置、「j」は顔画像データを特定する変数である。そして、学習部210は、1次元行パッチベクトル(pij)を行列Diに格納する。
以上を、すべての顔画像データについての処理を終了するまで繰り返す。
そして、すべての解像度(低解像画像、高解像画像)についての処理を終了するまで繰り返す。
次に、図3を用いて、特徴量抽出処理(ステップS2−2)を説明する。
まず、画像処理システム20の制御部21は、元画像の縮小処理を実行する(ステップS3−1)。具体的には、制御部21の特徴画像抽出部21dは、処理対象の顔画像を圧縮してサイズの縮小化を行なう。これにより、顔画像の高周波成分が切り捨てられる。
次に、図4を用いて、カップリング学習処理を説明する。ここでは、低解像パッチの主成分係数と、高解像パッチの主成分係数を結合して一つの行ベクトル(1次元ベクトル)を生成する。そして、行列に格納し、再度、主成分分析を行なう。低解像パッチの情報と高解像パッチの情報を結合して主成分分析することで、低解像パッチと高解像パッチの関係を学習する。
次に、画像処理システム20の制御部21は、行列の生成処理を実行する(ステップS4−2)。具体的には、制御部21の学習部210は、1次元行パッチベクトルPijを用いて、結合パッチベクトルのデータ行列Dmiを生成する。このデータ行列Dmiは、以下のように表現できる。
次に、図5〜図9を用いて、超解像処理を説明する。
まず、図5を用いて、超解像処理の概要を説明する。
まず、画像処理システム20の制御部21は、顔画像入力処理を実行する(ステップS5−1)。具体的には、制御部21の超解像部215は、入力部10によって指定された入力画像を取得する。
ここでは、画像処理システム20の制御部21は、超解像パッチの予測処理を実行する(ステップS5−7)。具体的には、制御部21の超解像部215は、超解像パッチについて、第1予測処理又は第2の予測処理を行なう。ここでは、主成分ベクトルが直交化されている場合には、第1予測処理を行ない、主成分ベクトルが直交化されていない場合には、第2の予測処理を行なう。この処理の詳細は後述する。
以上、処理対象画像のすべてのパッチの処理を終了するまで繰り返す。
図7を用いて、超解像パッチについて、第1の予測処理を説明する。この処理は、主成分ベクトルが直交化されており、より高速に処理したい場合に行なわれる。
図8を用いて、超解像パッチについて、第2の予測処理を説明する。この処理は、主成分ベクトルが直交化されていない場合や、nmax(l,i)以上の主成分ベクトルを考慮したい場合に行なわれる。
次に、画像処理システム20の制御部21は、繰り返し終了かどうかについての判定処理を実行する(ステップS7−5)。具体的には、制御部21の第2予測部217は、差分が最小値となった場合、繰り返し終了と判定する。
図9を用いて、ポスト処理を説明する。ここでは、IBP(iterative back projection)法を用いることにより、算出した超解像を入力画像のサイズに縮小した場合の画像と、入力画像との誤差を小さくする。
(1)本実施形態では、低解像画像と高解像画像とを用いて、主成分分析によるカップリング学習を行なう。低解像と高解像との関係を、主成分係数毎に独立に回帰分析により学習した場合には、精度のよい主成分係数と悪い主成分係数とが混在してしまうため、全体的な精度に課題が生じる場合がある。一方、本実施形態では、係数ベクトル単位で学習するため、主成分係数全体の精度が一致し、全体的な精度の向上を図ることができる。
図12に示すように、スケーリングファクターを用いない従来法では、超解像画像の劣化が生じているが、本実施形態では、良好な超解像を実現できている。
図14に示すように、ブロックノイズが生じた場合にも、ポスト処理により、影響を小さくすることができる。
・上記実施形態では、第1の特徴ベクトルとして低解像ベクトル、第2の特徴ベクトルとして高解像ベクトルを用いて、顔画像の超解像を行なう。超解像処理の対象は、顔画像に限定されるものではなく、形状にパターンを有する対象物を高画質に変換する超解像に適用することができる。この場合には、特定のパターンを有する低解像画像と高解像画像とを用いて、学習処理を行なう。
2次元画像のセグメンテーションにおいては、第1の特徴ベクトルとして対象2次元画像、第2の特徴ベクトルとして対象画像のセグメンテーションを用いる。
3次元画像のセグメンテーションにおいては、第1の特徴ベクトルとして対象3次元画像、第2の特徴ベクトルとして対象画像のセグメンテーションを用いる。
例えば、画像のボケ・ブレ除去においては、第1特徴ベクトルとして「ブレ・ボケを含む画像ベクトル」、第2特徴ベクトルとして「ブレ・ボケを除去した画像ベクトル」を用いる。
例えば、音声の高音質化においては、第1特徴ベクトルとして「低音質の音信号」、第2特徴ベクトルとして「高音質の音信号」を用いる。ここでは、音信号の信号そのもの、或いは高周波成分を要素とするベクトルを用いる。
・上記実施形態では、スケーリングファクターSinには、i番目の低解像パッチベクトルのn番目の主成分係数Cijnの標準偏差を用いる。スケーリングファクターSinは標準偏差に限定されるものではなく、主成分係数Cijnのばらつきを表わす指標を用いることが可能である。
次に、上記実施形態及び別例から把握できる技術的思想について、それらの効果とともに以下に追記する。
(1)上記課題を解決する情報予測システムは、学習対象を記録する学習対象記憶部と、学習結果を記録する学習結果記憶部と、入力部に接続された制御部とを備える。そして、情報予測システム、情報予測方法及び情報予測プログラムにおいては、前記制御部が、前記学習対象記憶部に記録された学習対象毎に、第1の特徴ベクトル及び第2の特徴ベクトルを算出し、前記第1の特徴ベクトルから、前記第1の特徴ベクトルの平均値を減算して生成された値を、前記第1の特徴ベクトルのばらつきを表わす指標で除算した第1の行ベクトルを生成するとともに、前記第2の特徴ベクトルから前記第2の特徴ベクトルの平均値を減算して生成された値を、前記第2の特徴ベクトルのばらつきを表わす指標で除算した第2の行ベクトルとを生成し、前記第1の行ベクトルと前記第2の行ベクトルとを結合することにより結合行ベクトルを生成し、すべての学習対象の前記結合行ベクトルを用いて、主成分分析を行なうことにより、結合主成分基底ベクトルを生成し、前記結合行ベクトルの平均ベクトルとともに前記学習結果記憶部に記録する学習処理と、前記入力部により指定された処理対象の第1の特徴ベクトルを算出し、前記第1の特徴ベクトの主成分係数を算出し、該主成分係数と、前記学習結果記憶部に記録された前記結合行ベクトルの平均ベクトル及び前記結合主成分基底ベクトルを用いて、処理対象の第2の特徴ベクトル
を算出する予測処理とを実行する。これにより、効率的かつ的確に第2の特徴ベクトルを予測することができる。
(2)上記情報予測システム、情報予測方法及び情報予測プログラムにおいては、前記結合主成分基底ベクトルと前記第1の特徴ベクトルの成分とを直交化して、前記学習結果記憶部に記録することが好ましい。これにより、直交化を利用して、計算の高速化を行なうことができる。
(3)上記情報予測システム、情報予測方法及び情報予測プログラムにおいては、算出した第2の特徴ベクトルを圧縮して、前記処理対象との差分を比較し、前記差分が基準値より大きい場合には、前記差分を拡大して、前記第2の特徴ベクトルから差し引くポスト処理を実行することが好ましい。これにより、予測時に生じた誤差を是正することができる。
(4)上記情報予測システム、情報予測方法及び情報予測プログラムにおいては、前記第1、第2の特徴ベクトルのばらつきを表わす指標として、それぞれ前記第1、第2の特徴ベクトルの主成分係数の標準偏差を用いることが好ましい。これにより、各係数のスケールが同等になり、主成分分析のメリットを活かすことができる。
Claims (6)
- 学習対象を記録する学習対象記憶部と、学習結果を記録する学習結果記憶部と、入力部に接続された制御部とを備えた情報予測システムであって、
前記制御部が、
前記学習対象記憶部に記録された学習対象毎に、予測元情報の特徴ベクトル及び予測先情報の特徴ベクトルを算出し、
前記予測元情報の特徴ベクトルと前記予測先情報の特徴ベクトルとを結合することにより結合ベクトルを生成し、
すべての学習対象の前記結合ベクトルを用いて、機械学習を行なうことにより、結合基底ベクトルを生成して前記学習結果記憶部に記録する学習処理と、
前記入力部により指定された処理対象を予測元情報とする特徴ベクトル及び、前記予測元情報の特徴ベクトルの結合係数を算出し、この結合係数と、前記学習結果記憶部に記録された前記結合ベクトルを用いて、前記処理対象の予測先情報の特徴ベクトルを算出する予測処理とを実行することを特徴とする情報予測システム。 - 前記予測元情報を第1の基底ベクトルで表現した第1の係数を、前記予測元情報のばらつきを表わす指標で除算した予測元情報の特徴ベクトルを生成するとともに、前記予測先情報を第2の基底ベクトルで表現した第2の係数を、前記予測先情報のばらつきを表わす指標で除算した予測先情報の特徴ベクトルを生成することを特徴とする請求項1に記載の情報予測システム。
- 前記予測元情報、予測先情報の特徴ベクトルのばらつきを表わす指標として、それぞれ前記予測元情報、予測先情報の特徴ベクトルの結合係数の標準偏差を用いることを特徴とする請求項2に記載の情報予測システム。
- 算出した予測先情報の特徴ベクトルを圧縮して、前記処理対象との差分を比較し、
前記差分が基準値より大きい場合には、前記差分を拡大して、前記予測先情報の特徴ベクトルから差し引くポスト処理を実行することを特徴とする請求項1〜3のいずれか一項に記載の情報予測システム。 - 学習対象を記録する学習対象記憶部と、学習結果を記録する学習結果記憶部と、入力部
に接続された制御部とを備えた情報予測システムを用いて、情報予測を行なう方法であって、
前記制御部が、
前記学習対象記憶部に記録された学習対象毎に、予測元情報の特徴ベクトル及び予測先情報の特徴ベクトルを算出し、
前記予測元情報の特徴ベクトルと前記予測先情報の特徴ベクトルとを結合することにより結合ベクトルを生成し、
すべての学習対象の前記結合ベクトルを用いて、機械学習を行なうことにより、結合基底ベクトルを生成して前記学習結果記憶部に記録する学習処理と、
前記入力部により指定された処理対象を予測元情報とする特徴ベクトル及び、前記予測元情報の特徴ベクトルの結合係数を算出し、この結合係数と、前記学習結果記憶部に記録された前記結合ベクトルを用いて、前記処理対象の予測先情報の特徴ベクトルを算出する予測処理とを実行することを特徴とする情報予測方法。 - 学習対象を記録する学習対象記憶部と、学習結果を記録する学習結果記憶部と、入力部に接続された制御部とを備えた情報予測システムを用いて、情報予測を行なうプログラムであって、
前記制御部を、
前記学習対象記憶部に記録された学習対象毎に、予測元情報の特徴ベクトル及び予測先情報の特徴ベクトルを算出し、
前記予測元情報の特徴ベクトルと前記予測先情報の特徴ベクトルとを結合することにより結合ベクトルを生成し、
すべての学習対象の前記結合ベクトルを用いて、機械学習を行なうことにより、結合基底ベクトルを生成して前記学習結果記憶部に記録する学習処理と、
前記入力部により指定された処理対象を予測元情報とする特徴ベクトル及び、前記予測元情報の特徴ベクトルの結合係数を算出し、この結合係数と、前記学習結果記憶部に記録された前記結合ベクトルを用いて、前記処理対象の予測先情報の特徴ベクトルを算出する予測処理とを実行する手段として機能させることを特徴とする情報予測プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016099737A JP6450710B2 (ja) | 2016-05-18 | 2016-05-18 | 情報予測システム、情報予測方法及び情報予測プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016099737A JP6450710B2 (ja) | 2016-05-18 | 2016-05-18 | 情報予測システム、情報予測方法及び情報予測プログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014231089A Division JP5937661B2 (ja) | 2014-11-13 | 2014-11-13 | 情報予測システム、情報予測方法及び情報予測プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016177829A JP2016177829A (ja) | 2016-10-06 |
JP2016177829A5 JP2016177829A5 (ja) | 2018-02-08 |
JP6450710B2 true JP6450710B2 (ja) | 2019-01-09 |
Family
ID=57071393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016099737A Active JP6450710B2 (ja) | 2016-05-18 | 2016-05-18 | 情報予測システム、情報予測方法及び情報予測プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6450710B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023516295A (ja) * | 2020-02-27 | 2023-04-19 | シーメンス・ヘルスケア・ダイアグノスティックス・インコーポレイテッド | 機械学習を用いた自動センサトレース検証 |
JP2024000211A (ja) * | 2022-06-20 | 2024-01-05 | 株式会社日立製作所 | 画像推定方法、評価値推定方法、及び画像推定装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6062207B2 (ja) * | 2011-10-28 | 2017-01-18 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 画像処理方法、および画像処理装置 |
-
2016
- 2016-05-18 JP JP2016099737A patent/JP6450710B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016177829A (ja) | 2016-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5937661B2 (ja) | 情報予測システム、情報予測方法及び情報予測プログラム | |
Chen et al. | Image super-resolution reconstruction based on feature map attention mechanism | |
Jiang et al. | Deep CNN denoiser and multi-layer neighbor component embedding for face hallucination | |
CN111523414A (zh) | 人脸识别方法、装置、计算机设备和存储介质 | |
US20130346047A1 (en) | Performance predicting apparatus, performance predicting method, and program | |
Huang et al. | Single image super-resolution via multiple mixture prior models | |
CN107784288A (zh) | 一种基于深度神经网络的迭代定位式人脸检测方法 | |
CN112990219B (zh) | 用于图像语义分割的方法和装置 | |
CN109685873B (zh) | 一种人脸重建方法、装置、设备和存储介质 | |
CN114463511A (zh) | 一种基于Transformer解码器的3D人体模型重建方法 | |
JP6450710B2 (ja) | 情報予測システム、情報予測方法及び情報予測プログラム | |
Mo et al. | The research of image inpainting algorithm using self-adaptive group structure and sparse representation | |
Feng et al. | Pedestrian detection based on attention mechanism and feature enhancement with SSD | |
Chen et al. | Single-image super-resolution via joint statistic models-guided deep auto-encoder network | |
Zhang et al. | Image extrapolation based on multi-column convolutional attention network | |
Luo et al. | Piecewise linear regression-based single image super-resolution via Hadamard transform | |
Liu et al. | Lightweight human pose estimation algorithm based on polarized self-attention | |
Fan et al. | Facial image super-resolution guided by adaptive geometric features | |
Luo et al. | Stacked hourglass networks based on polarized self-attention for human pose estimation | |
Li et al. | Human detection via image denoising for 5G-enabled intelligent applications | |
Zhou et al. | Lite-YOLOv3: a real-time object detector based on multi-scale slice depthwise convolution and lightweight attention mechanism | |
Wang et al. | Single image super-resolution via self-similarity and low-rank matrix recovery | |
Fu et al. | ESTISR: Adapting Efficient Scene Text Image Super-resolution for Real-Scenes | |
JP7190147B1 (ja) | 3次元形状記述子抽出器の製造方法、3次元形状検索方法及び3次元形状検索システム | |
WO2023119642A1 (ja) | 情報処理装置、情報処理方法、及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160613 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181031 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181210 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6450710 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R157 | Certificate of patent or utility model (correction) |
Free format text: JAPANESE INTERMEDIATE CODE: R157 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |