JP2019061671A - ブロックベースの主成分分析変換方法およびその装置 - Google Patents
ブロックベースの主成分分析変換方法およびその装置 Download PDFInfo
- Publication number
- JP2019061671A JP2019061671A JP2018177226A JP2018177226A JP2019061671A JP 2019061671 A JP2019061671 A JP 2019061671A JP 2018177226 A JP2018177226 A JP 2018177226A JP 2018177226 A JP2018177226 A JP 2018177226A JP 2019061671 A JP2019061671 A JP 2019061671A
- Authority
- JP
- Japan
- Prior art keywords
- dimensional
- principal component
- block
- component analysis
- input signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000513 principal component analysis Methods 0.000 title claims abstract description 78
- 238000011426 transformation method Methods 0.000 title claims abstract description 24
- 239000013598 vector Substances 0.000 claims abstract description 121
- 239000011159 matrix material Substances 0.000 claims abstract description 35
- 230000009466 transformation Effects 0.000 claims description 21
- 238000000034 method Methods 0.000 claims description 19
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 230000015654 memory Effects 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 6
- 230000005236 sound signal Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 7
- 238000012847 principal component analysis method Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000013139 quantization Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000000354 decomposition reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3068—Precoding preceding compression, e.g. Burrows-Wheeler transformation
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3082—Vector coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Complex Calculations (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】小さなデータサイズで原信号を完全に再構築することのできるブロックベースの主成分分析変換方法およびその装置を提供する。【解決手段】主成分分析変換方法は、入力信号を取得することと;入力信号を分割して、分割した入力信号に対応する複数の1次元ベクトルを取得し、複数の1次元ベクトルの数が、分割数であることと;複数の1次元ベクトルを2次元ベクトルに配列した後、分割数の複数の1次元ベクトルの平均値を差し引いて、ゼロ−平均ベクトルを取得することと;ゼロ−平均ベクトルの共分散行列を計算することと;共分散行列の固有ベクトルを計算することと;ゼロ−平均ベクトルと固有ベクトルを掛けて、投影係数を取得することを含む。【選択図】図2
Description
本発明は、ブロックベースの主成分分析変換方法およびその装置に関するものであり、特に、比較的小さなデータサイズで原信号を復元することのできるブロックベースの主成分分析変換方法およびその装置に関するものである。
伝統的な主成分分析(principal component analysis, PCA)が信号を処理する時、信号は非常に大きな次元を有するため、固有ベクトルと固有値を取得するための計算コストも非常に高い。ある関連研究は、ハードウェアを用いてこの問題を解決することを提案したが、そのような解決法は、ハードウェア上のコストを大幅に増加させる。そのため、いかにして主成分分析変換をより効果的に行うかが、本分野における重要な課題となっている。
このため、本発明は、小さなデータサイズで原信号を完全に再構築することのできるブロックベースの主成分分析変換方法およびその装置を提供する。
本発明は、入力信号を取得することと;入力信号を分割して、分割した入力信号に対応する複数の1次元ベクトルを取得し、複数の1次元ベクトルの数が、分割数であることと;複数の1次元ベクトルを2次元ベクトルに配列した後、分割数の複数の1次元ベクトルの平均値を差し引いて、ゼロ−平均(zero-mean)ベクトルを取得することと;ゼロ−平均ベクトルの共分散行列(covariance matrix)を計算することと;共分散行列の固有ベクトルを計算することと;ゼロ−平均ベクトルと固有ベクトルを掛けて、投影係数を取得することを含む主成分分析変換方法およびその装置を提供する。
本発明の1つの実施形態において、入力信号は、1次元信号であり、入力信号を分割して、分割した入力信号に対応する複数の1次元ベクトルを取得するプロセスは、1次元信号を複数のフレームに分割し、複数のフレームに対応する複数のサンプリングポイントに基づいて、複数の1次元ベクトルを取得することを含む。
本発明の1つの実施形態において、1次元信号は、音声信号(speech signal)である。
本発明の1つの実施形態において、入力信号は、2次元信号であり、入力信号を分割して、分割した入力信号に対応する複数の1次元ベクトルを取得するプロセスは、2次元信号を複数のブロックに分割して、複数のブロックの複数の画素に対応する複数の2次元行列(matrix)を取得し、複数の2次元行列を複数の1次元ベクトルに変換することを含む。
本発明の1つの実施形態において、2次元信号は、画像信号である。
本発明の1つの実施形態において、本発明の主成分分析変換方法は、さらに、投影係数と固有ベクトルの逆行列(inverse matrix)を掛けて、再構築されたゼロ−平均ベクトルを取得することと;再構築されたゼロ−平均ベクトルに平均値を足して、復元された1次元ベクトルを取得することと;復元された1次元ベクトルを復元された入力信号に配列することを含む。
本発明は、プロセッサと、プロセッサに結合されたメモリを含むブロックベースの主成分分析変換装置を提供する。プロセッサは、入力信号を取得し;入力信号を分割して、分割した入力信号に対応する複数の1次元ベクトルを取得し、複数の1次元ベクトルの数は、分割数であり;複数の1次元ベクトルを2次元ベクトルに配列した後、分割数の複数の1次元ベクトルの平均値を差し引いて、ゼロ−平均ベクトルを取得し;ゼロ−平均ベクトルの共分散行列を計算し;共分散行列の固有ベクトルを計算し;ゼロ−平均ベクトルと固有ベクトルを掛けて、投影係数を取得する。
本発明の1つの実施形態において、入力信号は、1次元信号であり、プロセッサは、1次元信号を複数のフレームに分割し、複数のフレームに対応する複数のサンプリングポイントに基づいて、複数の1次元ベクトルを取得する。
本発明の1つの実施形態において、入力信号は、2次元信号であり、プロセッサは、2次元信号を複数のブロックに分割して、複数のブロックの複数の画素に対応する複数の2次元行列を取得し、複数の2次元行列を複数の1次元ベクトルに変換する。
本発明の1つの実施形態において、プロセッサは、投影係数と固有ベクトルの逆行列を掛けて、再構築されたゼロ−平均ベクトルを取得し;再構築されたゼロ−平均ベクトルに平均値を足して、復元された1次元ベクトルを取得し;復元された1次元ベクトルを復元された入力信号に配列する。
以上のように、本発明のブロックベースの主成分分析変換方法およびその装置は、1次元信号または2次元信号を複数のフレームまたは複数のブロックに適切に分割して、対応する複数の1次元ベクトルを取得し;次に、複数の1次元ベクトルを2次元ベクトルに配列した後、分割数の複数の1次元ベクトルの平均値を差し引いて、ゼロ−平均ベクトルを取得し;ゼロ−平均ベクトルの共分散行列を計算し;共分散行列の固有ベクトルを計算し;その後、ゼロ−平均ベクトルと固有ベクトルを掛けて、投影係数を取得し、本発明の主成分分析の変換出力として使用する。本発明は、さらに、逆変換により、投影係数と固有ベクトルを掛けて、再構築されたゼロ−平均ベクトルを取得し、再構築されたゼロ−平均ベクトルに平均値を足して、復元された1次元ベクトルを取得し、最後に、復元された1次元ベクトルを所望のサイズのフレームまたはブロックに配列する。
本発明の上記および他の目的、特徴、および利点をより分かり易くするため、図面と併せた幾つかの実施形態を以下に説明する。
添付図面は、本発明の原理がさらに理解されるために含まれており、本明細書に組み込まれ、且つその一部を構成するものである。図面は、本発明の実施形態を例示しており、説明とともに、本発明の原理を説明する役割を果たしている。
以下、この考案のいくつかの別の実施形態を提供する。ここで説明すべきこととして、上述した実施形態の参照番号および一部の内容を以下の実施形態において使用するが、同一の参照番号は、同一または類似する構成要素を示すものとし、同じ技術内容については説明を省略する。省略した詳細説明については、上述した実施形態を参照することができるため、以下の実施形態では繰り返し説明しない。
図1は、本発明の1つの実施形態に係るブロックベースの主成分分析変換装置のブロック図である。
図1を参照すると、本発明のブロックベースの主成分分析変換装置100は、プロセッサ110およびメモリ120を含む。メモリ120は、プロセッサ110に結合される。
プロセッサ110は、例えば、中央処理装置(central processing unit, CPU)または他のプログラム可能な一般用途または特殊用途のマイクロプロセッサ(microprocessor)、デジタル信号プロセッサ(digital signal processor, DSP)、プログラマブルコントローラ(programmable controller)、特定用途向け集積回路(application specific integrated circuit, ASIC)、他の類似構成要素、あるいはこれらの組み合わせである。
メモリ120は、例えば、ランダムアクセスメモリ(random access memory, RAM)、読み出し専用メモリ(read-only memory, ROM)、フラッシュメモリ(flash memory)、ハードディスクドライブ(hard disk drive, HHD)、ソリッドステートドライブ(solid state drive, SSD)、他の類似構成要素、あるいはこれらの組み合わせである。
本発明の1つの実施形態において、ブロックベースの主成分分析変換装置100は、通信部品(図示せず)を介して音声信号または画像信号等の入力信号を受信して、その入力信号をメモリ120に保存または一時保存し、プロセッサ110が入力信号に対して主成分分析の変換および逆変換を実行できるようにする。
図2は、本発明の1つの実施形態に係るブロックベースの主成分分析変換方法の変換のフローチャートである。
図2を参照すると、ステップS201において、1次元信号を取得する。1次元信号は、例えば、44.1kのサンプリング周波数を有する32ビット浮動小数点量子化(floating-point quantization)音声信号である。
ステップS203において、1次元信号を複数のフレームに分割し、複数のフレームに対応する複数のサンプリングポイントに基づいて、複数の1次元ベクトルを取得する。複数の1次元ベクトルの数は、複数のフレームの数である。具体的に説明すると、プロセッサ110は、式(1)に示すように、所望のサイズの複数のフレームに基づいて、1次元信号を分割する。
式中、fは、1次元信号の第fフレームであり、Fは、1次元信号における複数のフレームの数であり、nは、複数のフレームにおける複数のサンプリングポイントの数であり、Tは、行列の転置(transpose)である。
ステップS205において、複数の1次元ベクトルを2次元ベクトルに配列した後、複数のフレームの数の複数の1次元ベクトルの平均値を差し引いて、ゼロ−平均ベクトルを取得する。具体的に説明すると、プロセッサ110は、式(2)に基づいて、複数の原n×1の1次元ベクトルをn×Fの2次元ベクトルに配列する。
ゼロ−平均ベクトルZVは、式(3)で表され、複数のフレームの数の複数の1次元ベクトルの平均値は、式(4)で表される。
ステップS207において、ゼロ−平均ベクトルの共分散行列を計算する。共分散行列Cは、式(5)で表される。
ステップS209において、共分散行列の固有ベクトルを計算する。具体的に説明すると、プロセッサ110は、行列分解法(matrix decomposition method)により、固有ベクトルevecを引き抜き、固有ベクトルは、本発明のフレームベースの主成分分析の基底関数(base function)であり、d(・)は、式(6)で表される行列分解法を示す。
ステップS211において、ゼロ−平均ベクトルを固有ベクトルで掛けて、投影係数を取得する。投影係数Pは、式(7)で表される本発明のフレームベースの主成分分析の変換出力である。
図3は、本発明の別の実施形態に係るブロックベースの主成分分析変換方法の変換のフローチャートである。
図3を参照すると、ステップS301において、2次元信号を取得する。2次元信号は、例えば、8ビット量子化2次元256×256画像信号である。
ステップS303において、2次元信号を複数のブロックに分割し、複数のブロックの複数の画素に対応する複数の2次元行列を取得し、複数の2次元行列を複数の1次元ベクトルに変換する。複数の1次元ベクトルの数は、複数のブロックの数である。具体的に説明すると、プロセッサ110は、式(8)に示すように、所望のサイズの複数のブロックに基づいて、1次元信号を分割する。
(8)
式中、rは、2次元信号の第r列(row)上のブロックであり、cは、2次元信号のc行(column)上のブロックであり、Rは、列における複数のブロックの合計数であり、Cは、行における複数のブロックの合計数であり、pは、複数のブロックにおける複数の画素の列の数であり、qは、複数のブロックにおける複数の画素の行の数である。
次に、プロセッサ110は、式(9)に示すように、さらに、
を使用して、複数の2次元行列を複数の1次元ベクトルに変換する。
を使用して、複数の2次元行列を複数の1次元ベクトルに変換する。
(9)
ステップS305において、複数の1次元ベクトルを2次元ベクトルに配列した後、複数のブロックの数の複数の1次元ベクトルの平均値を差し引いて、ゼロ−平均ベクトルを取得する。具体的に説明すると、プロセッサ110は、式(10)に基づいて、複数の原(p×q)×1の1次元ベクトルを(p×q)×Bの2次元ベクトルに配列する。Bは、RとCの積である。
ゼロ−平均ベクトルZVは、式(11)で表され、複数のブロックの数の複数の1次元ベクトルの平均値は、式(12)で表される。
ステップS307において、ゼロ−平均ベクトルの共分散行列を計算する。共分散行列Cは、式(13)で表される。
ステップS309において、共分散行列の固有ベクトルを計算する。具体的に説明すると、プロセッサ110は、行列分解法により、固有ベクトルevecを引き抜き、固有ベクトルは、本発明のブロックベースの主成分分析の基底関数であり、d(・)は、式(6)と同じ行列分解法を示す。
ステップS311において、ゼロ−平均ベクトルを固有ベクトルで掛けて、投影係数を取得する。投影係数Pは、式(7)で表される本発明のブロックベースの主成分分析の変換出力である。
図4は、本発明の1つの実施形態に係るブロックベースの主成分分析変換方法の逆変換のフローチャートである。
図4を参照すると、ステップS401において、投影係数を固有ベクトルの逆行列で掛けて、再構築されたゼロ−平均ベクトルを取得する。具体的に説明すると、プロセッサ110は、式(14)に示すように、単純に投影係数と固有ベクトルの逆行列を掛けることによって、再構築されたゼロ−平均ベクトルを取得する。
固有ベクトルは、直交行列であるため、固有ベクトルの逆行列は、固有ベクトルの転置行列と同一である。
ステップS403において、式(15)に示すように、平均値を再構築されたゼロ−平均ベクトルに足して、復元された1次元ベクトルを取得する。
ステップS405において、復元された1次元ベクトルを復元された入力信号に配列する。
原入力信号が1次元信号である場合、復元された1次元ベクトルは、式(16)で表され、復元された入力信号は、式(17)で表される。
原入力信号が2次元信号である場合、復元された1次元ベクトルは、式(18)で表され、復元された入力信号は、式(19)で表される。言及すべきこととして、式(19)の
は、復元された1次元ベクトルを所望のサイズの2次元行列に配列する伝達関数(transfer function)である。
は、復元された1次元ベクトルを所望のサイズの2次元行列に配列する伝達関数(transfer function)である。
以下、表1および表2を提供して、逆変換復元およびサンプリング単位の誤差に対する品質試験について説明する。
表1は、44.1kのサンプリング周波数を有する原1次元音声信号と逆変換された音声信号の間の差(すなわち、信号対雑音比(signal to noise ratio, SNR))を示したものである。
表2は、原256×256の2次元画像信号と逆変換された画像信号の間の差(すなわち、ピーク信号対雑音比(peak signal to noise ratio, PSNR))を示したものである。
表1および表2に基づくと、復元信号を量子化しない時、逆変換の復元されたSNRおよびPSNRによって、原信号が復元試験において完全に復元されなかったことがわかる。1ポイントの信号に0.5の誤差を追加し、その結果、SNRおよびPSNRの結果がいずれも単に逆変換によって復元されたSNRおよびPSNRよりも小さい場合、逆変換によって生じた誤差が、0.5の誤差によってもたらされる差よりも小さいことを示す。最後に、四捨五入(rounding process)をしてデジタル信号の誤差を除去し、逆変換により信号を完全に復元させる。
図5(a)および図5(b)は、本発明のブロックベースの主成分分析変換方法の投影係数の誤差が空間領域(spatial domain)における主成分および非主成分のそれぞれの画像品質にいかにして影響を与えるかを示した概略図である。図6(a)および図6(b)は、本発明のブロックベースの主成分分析変換方法の投影係数の誤差が周波数領域(frequency domain)における主成分および非主成分のそれぞれの画像品質にいかにして影響を与えるかを示した概略図である。
図5(a)、図5(b)、図6(a)、および図6(b)において、全ての横軸は、投影係数誤差の百分率を示し、全ての縦軸は、PSNRを示す。図5(b)は、図5(a)の局部拡大図である。図6(b)は、図6(a)の局部拡大図である。
図5(a)は、空間領域における画像信号の投影係数の倍率の変更が復元された信号の品質にいかにして影響を与えるかについて示したものである。図6(a)は、周波数領域における画像信号の投影係数の倍率の変更が復元された信号の品質にいかにして影響を与えるかについて示したものである。図5(a)および図6(a)において、試験は、いずれも8×8に分割されたブロックで行われる。図5(a)および図6(a)は、本発明のブロックベースの主成分分析が空間領域および周波数領域のデータを処理する時に、画像品質の堅牢性(robust)に同じ影響を与えることを証明している。また、図5(a)および図6(a)のPSNRは、非主成分投影係数によって修正された再構築信号の品質が主成分投影係数によって修正された再構築信号の品質よりも良いことを証明している。±20%の非主成分係数を変更する再構築された画像のPSNRは、約35dBであり、±10%の主成分係数を変更する再構築された画像のPSNRは、約35dBである。再構築された画像は、依然として良好な品質を有するため、投影係数は、データ隠蔽(data hiding)のキャリア空間として用いることもでき、水位標(watermark)等の情報を隠蔽技術に利用することができる。
図7(a)および図7(b)は、異なるサイズの分割されたブロックの異なる小数位に量子化された投影係数と画像品質を比較した概略図である。図7(b)は、図7(a)の局部拡大図である。図7(a)および図7(b)において、横軸は、いずれも小数位の数を示し、縦軸は、いずれもPSNRを示す。
図7(a)は、本発明のブロックベースの主成分分析方法で画像を異なるブロックサイズに分割した時に、小数第0位〜第20位に量子化した画像品質の比較を示したものである。第13位またはそれより大きい小数位に量子化した時、ブロックサイズの変化に関わらず、再構築された画像品質のPSNRは、増加せず、ブロックは、32×32のブロックサイズを有する時に最も大きなPSNRを有する。また、図7(b)からわかるように、第12位またはそれより大きな小数位に量子化した時、ブロックは、128×128のブロックサイズを有する時に最も大きなPSNRを有する;第12位より少ない小数位に量子化した時、ブロックは、32×32のブロックサイズを有する時に最も大きなPSNRを有する。
表3は、異なるブロックサイズで小数位を量子化した時に四捨五入した投影係数の復元品質の試験結果である。
表3からわかるように、ブロックサイズに関わらず、本発明の主成分分析方法において、小数第1位に量子化した時、全てのサイズのブロックにおける原画像が完全に再構築され、PSNRは無限である。
図8は、本発明のブロックベースの主成分分析のデータサイズ、非量子化離散コサイン変換(discrete cosine transform, DCT)のデータサイズ、および量子化離散コサイン変換(すなわち、JPEG)のデータサイズを比較した概略図である。
図8において、横軸は、PSNRを示し、縦軸は、圧縮率を示す。図8において、ブロックベースの主成分分析のデータサイズは、PSNRが上昇する時、量子化離散コサイン変換のデータサイズよりも常に大きい。しかしながら、ブロックベースの主成分分析のデータサイズと非量子化離散コサイン変換のデータサイズ、例えば、四角いマークの線と三角のマークの線を比較すると、圧縮率が0.8よりも大きい時、ブロックベースの主成分分析と非量子化離散コサイン変換の復元された画像(すなわち、PSNR)の品質は、非常に近い。一方、圧縮率が0.1から0.8の範囲内にある時、ブロックベースの主成分分析の復元された画像の品質は、非量子化離散コサイン変換の復元された画像の品質よりもわずかに優れている。一方、圧縮率が0.1よりも小さい時、ブロックベースの主成分分析によって生成された投影係数および固有ベクトルは、原データサイズよりもわずかに大きいため、さらに有効な量子化ベクトルアルゴリズムを行う前、ブロックベースの主成分分析の圧縮率は負の値であり、データサイズが原データサイズよりもわずかに大きいことを意味する。これらの比較からわかるように、ブロックベースの主成分分析と非量子化離散コサイン変換のデータサイズは、非常に類似している。そのため、ブロックベースの主成分分析の有効な量子化ベクトルアルゴリズムを開発する必要がある。
図9は、本発明のブロックベースの主成分分析と伝統的な主成分分析を比較した概略図である。
図9は、ブロックベースの主成分分析と伝統的な主成分分析の計算時間コスト、データサイズ、および復元された画像の品質を比較したものである。計算時間コストについては、本発明のブロックベースの主成分分析により処理速度が有効に向上する。ブロックベースの主成分分析の計算量は、分割されたブロックのサイズが128×128である時、伝統的な主成分分析よりも優れているが、ブロックベースの主成分分析のデータサイズは、95%の信頼水準(confidence level)において伝統的な主成分分析より大きい。しかしながら、分割されたブロックのサイズが64×64よりも小さい時、ブロックベースの主成分分析は、計算量において伝統的な主成分分析より優れているだけでなく、ブロックベースの主成分分析のデータサイズも95%の信頼水準において伝統的な主成分分析より小さい。また、PSNRが証明するように、再構築された情報は、原情報を劣化させずに完全に復元した。
図10は、本発明のブロックベースの主成分分析方法の操作時間コストとブロックベースの主成分分析方法における再構築に必要なデータサイズを比較した概略図である。
図10において、横軸は、ブロックサイズを示し、伝統的な主成分分析において、画像全体の中に1つのブロックしか存在しない、すなわち、画像は分割されない。左の縦軸は、データサイズを示し、その単位は、2のn乗の64ビット浮動小数点数である。右の縦軸は、コスト時間を示し、その単位は、10のn乗秒である。図10は、図9の表における情報を示す概略図である。
以上のように、主成分分析変換方法およびその装置は、1次元信号または2次元信号を複数のフレームまたは複数のブロックに適切に分割して、対応する複数の1次元ベクトルを取得し、複数の1次元ベクトルのゼロ−平均ベクトルを計算して、ゼロ−平均ベクトルの共分散行列を計算し、共分散行列の固有ベクトルを計算し、その後、ゼロ−平均ベクトルと固有ベクトルを掛けて、投影係数を取得し、本発明の主成分分析の変換出力として使用する。本発明は、さらに、逆変換により、投影係数と固有ベクトルの逆行列を掛けて、再構築されたゼロ−平均ベクトルを取得し、再構築されたゼロ−平均ベクトルに平均値を足して、復元された1次元ベクトルを取得し、最後に、復元された1次元ベクトルを所望のサイズのフレームまたはブロックに配列する。また、小さいデータサイズの前提の下に、主成分分析変換方法は、さらに、他の先行技術の方法では達成できなかった入力信号の完全復元を達成する。
以上のごとく、この発明を実施形態により開示したが、もとより、この発明を限定するためのものではなく、当業者であれば容易に理解できるように、この発明の技術思想の範囲内において、適当な変更ならびに修正が当然なされうるものであるから、その特許権保護の範囲は、特許請求の範囲および、それと均等な領域を基準として定めなければならない。
本発明のブロックベースの主成分分析変換方法およびその装置は、信号復元装置に応用することができる。
100 主成分分析変換装置
110 プロセッサ
120 メモリ
S201、S203、S205、S207、S209、S211 ブロックベースの主成分分析変換方法の変換ステップ
S301、S303、S305、S307、S309、S311 ブロックベースの主成分分析変換方法の変換ステップ
S401、S403、S405 ブロックベースの主成分分析変換方法の逆変換ステップ
110 プロセッサ
120 メモリ
S201、S203、S205、S207、S209、S211 ブロックベースの主成分分析変換方法の変換ステップ
S301、S303、S305、S307、S309、S311 ブロックベースの主成分分析変換方法の変換ステップ
S401、S403、S405 ブロックベースの主成分分析変換方法の逆変換ステップ
Claims (10)
- 入力信号を取得することと、
前記入力信号を分割して、前記分割した入力信号に対応する複数の1次元ベクトルを取得し、前記複数の1次元ベクトルの数が、分割数であることと、
前記複数の1次元ベクトルを2次元ベクトルに配列した後、前記分割数の前記複数の1次元ベクトルの平均値を差し引いて、ゼロ−平均ベクトルを取得することと、
前記ゼロ−平均ベクトルの共分散行列を計算することと、
前記共分散行列の固有ベクトルを計算することと、
前記ゼロ−平均ベクトルと前記固有ベクトルを掛けて、投影係数を取得することと、
を含むブロックベースの主成分分析変換方法。 - 前記入力信号が、1次元信号であり、前記入力信号を分割して、前記分割した入力信号に対応する前記複数の1次元ベクトルを取得するプロセスが、
前記1次元信号を複数のフレームに分割し、前記複数のフレームに対応する複数のサンプリングポイントに基づいて、前記複数の1次元ベクトルを取得することを含む請求項1に記載のブロックベースの主成分分析変換方法。 - 前記1次元信号が、音声信号である請求項2に記載のブロックベースの主成分分析変換方法。
- 前記入力信号が、2次元信号であり、前記入力信号を分割して、前記分割した入力信号に対応する前記複数の1次元ベクトルを取得するプロセスが、
前記2次元信号を複数のブロックに分割して、前記複数のブロックの複数の画素に対応する複数の2次元行列を取得し、前記複数の2次元行列を前記複数の1次元ベクトルに変換することを含む請求項1に記載のブロックベースの主成分分析変換方法。 - 2次元信号が、画像信号である請求項4に記載のブロックベースの主成分分析変換方法。
- 前記投影係数と前記固有ベクトルの逆行列を掛けて、再構築されたゼロ−平均ベクトルを取得することと、
前記再構築されたゼロ−平均ベクトルに前記平均値を足して、復元された1次元ベクトルを取得することと、
前記復元された1次元ベクトルを復元された入力信号に配列することと、
をさらに含む請求項1に記載のブロックベースの主成分分析変換方法。 - プロセッサと、
前記プロセッサに結合されたメモリと、
を含むブロックベースの主成分分析変換装置であって、前記プロセッサが、
入力信号を取得し、
前記入力信号を分割して、前記分割した入力信号に対応する複数の1次元ベクトルを取得し、前記複数の1次元ベクトルの数が分割数であり、
前記複数の1次元ベクトルを2次元ベクトルに配列した後、前記分割数の前記複数の1次元ベクトルの平均値を差し引いて、ゼロ−平均ベクトルを取得し、
前記ゼロ−平均ベクトルの共分散行列を計算し、
前記共分散行列の固有ベクトルを計算し、
前記ゼロ−平均ベクトルと前記固有ベクトルを掛けて、投影係数を取得するブロックベースの主成分分析変換装置。 - 前記入力信号が、1次元信号であり、前記プロセッサが、前記1次元信号を複数のフレームに分割し、前記複数のフレームに対応する複数のサンプリングポイントに基づいて、前記複数の1次元ベクトルを取得する請求項7に記載のブロックベースの主成分分析変換装置。
- 前記入力信号が、2次元信号であり、前記プロセッサが、前記2次元信号を複数のブロックに分割して、前記複数のブロックの複数の画素に対応する前記複数の2次元行列を取得し、前記複数の2次元行列を前記複数の1次元ベクトルに変換する請求項7に記載のブロックベースの主成分分析変換装置。
- 前記プロセッサが、前記投影係数と前記固有ベクトルの逆行列を掛けて、再構築されたゼロ−平均ベクトルを取得し、前記再構築されたゼロ−平均ベクトルに前記平均値を足して、復元された1次元ベクトルを取得し、前記復元された1次元ベクトルを復元された入力信号に配列する請求項7に記載のブロックベースの主成分分析変換装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW106132684 | 2017-09-22 | ||
TW106132684A TWI642291B (zh) | 2017-09-22 | 2017-09-22 | 基於區塊的主成分分析轉換方法及其裝置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019061671A true JP2019061671A (ja) | 2019-04-18 |
Family
ID=65034415
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018177226A Pending JP2019061671A (ja) | 2017-09-22 | 2018-09-21 | ブロックベースの主成分分析変換方法およびその装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10664720B2 (ja) |
JP (1) | JP2019061671A (ja) |
CN (1) | CN109544557A (ja) |
TW (1) | TWI642291B (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113706396B (zh) * | 2020-05-21 | 2024-04-30 | 北京机械设备研究所 | 基于滑动窗函数的遥测图像降噪处理方法 |
CN113283011B (zh) * | 2021-06-05 | 2022-05-03 | 申业 | 一种获取变速箱零件转速及负载的方法及系统 |
CN114397865B (zh) * | 2021-12-24 | 2023-10-20 | 广州市香港科大霍英东研究院 | 一种回收料混合比例在线检测方法、装置及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012504251A (ja) * | 2008-09-16 | 2012-02-16 | パーソニクス ホールディングス インコーポレイテッド | 音声ライブラリおよび方法 |
JP2014016746A (ja) * | 2012-07-06 | 2014-01-30 | Sony Computer Entertainment Inc | 画像処理装置および画像処理方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080130914A1 (en) * | 2006-04-25 | 2008-06-05 | Incel Vision Inc. | Noise reduction system and method |
US7358891B2 (en) * | 2006-05-27 | 2008-04-15 | Bae Systems Information And Electronic Systems Integration Inc. | Multipath resolving correlation interferometer direction finding |
US8077994B2 (en) * | 2008-06-06 | 2011-12-13 | Microsoft Corporation | Compression of MQDF classifier using flexible sub-vector grouping |
US8090146B2 (en) * | 2009-01-15 | 2012-01-03 | Google Inc. | Image watermarking |
US8848802B2 (en) * | 2009-09-04 | 2014-09-30 | Stmicroelectronics International N.V. | System and method for object based parametric video coding |
CN102510491A (zh) * | 2011-09-13 | 2012-06-20 | 海南大学 | 一种基于dwt可抗几何攻击的医学图像多重水印方法 |
CN102567993B (zh) * | 2011-12-15 | 2014-06-11 | 中国科学院自动化研究所 | 基于主成分分析的指纹图像质量评价方法 |
JP6028388B2 (ja) * | 2012-05-11 | 2016-11-16 | 富士通株式会社 | 到来方向推定装置、及び到来方向推定方法 |
CN102722866B (zh) * | 2012-05-22 | 2014-07-23 | 西安电子科技大学 | 基于主成份分析的压缩感知方法 |
JP2014116746A (ja) * | 2012-12-07 | 2014-06-26 | Samsung R&D Institute Japan Co Ltd | 撮像装置、歪補正回路及び歪補正方法 |
CN103208097B (zh) * | 2013-01-29 | 2015-09-30 | 南京理工大学 | 图像多方向形态结构分组的主分量分析协同滤波方法 |
WO2015138008A1 (en) * | 2014-03-10 | 2015-09-17 | Euclid Discoveries, Llc | Continuous block tracking for temporal prediction in video encoding |
WO2016015752A1 (en) | 2014-07-29 | 2016-02-04 | Hewlett-Packard Development Company, L.P. | Method and apparatus for validity determination of a data dividing operation |
US10056076B2 (en) * | 2015-09-06 | 2018-08-21 | International Business Machines Corporation | Covariance matrix estimation with structural-based priors for speech processing |
US20190087717A1 (en) * | 2016-04-01 | 2019-03-21 | Intel Corporation | Four stable state neuron |
-
2017
- 2017-09-22 TW TW106132684A patent/TWI642291B/zh not_active IP Right Cessation
-
2018
- 2018-03-26 CN CN201810252676.8A patent/CN109544557A/zh active Pending
- 2018-09-20 US US16/137,508 patent/US10664720B2/en active Active
- 2018-09-21 JP JP2018177226A patent/JP2019061671A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012504251A (ja) * | 2008-09-16 | 2012-02-16 | パーソニクス ホールディングス インコーポレイテッド | 音声ライブラリおよび方法 |
JP2014016746A (ja) * | 2012-07-06 | 2014-01-30 | Sony Computer Entertainment Inc | 画像処理装置および画像処理方法 |
Non-Patent Citations (1)
Title |
---|
RAVI KIRAN, CHANDRASHEKHAR KAMARGAONKAR: ""Region based medical image compression using block-based PCA"", 2016 INTERNATIONAL CONFERENCE ON COMPUTATION OF POWER, ENERGY INFORMATION AND COMMUINCATION (ICCPEIC, JPN6019033176, 1 September 2016 (2016-09-01), US, pages 091 - 096, ISSN: 0004240830 * |
Also Published As
Publication number | Publication date |
---|---|
US10664720B2 (en) | 2020-05-26 |
CN109544557A (zh) | 2019-03-29 |
TW201916626A (zh) | 2019-04-16 |
TWI642291B (zh) | 2018-11-21 |
US20190095755A1 (en) | 2019-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Needell et al. | Stable image reconstruction using total variation minimization | |
Raviraj et al. | The modified 2D-Haar wavelet transformation in image compression | |
KR101036731B1 (ko) | 손실 및 무손실 2차원 데이터 압축을 위한 가역 변환 | |
JP2019061671A (ja) | ブロックベースの主成分分析変換方法およびその装置 | |
WO2006036796A1 (en) | Processing video frames | |
Pandey et al. | Digital image processing using singular value decomposition | |
Dhumal et al. | Survey on comparative analysis of various image compression algorithms with singular value decomposition | |
EP1442392A2 (en) | Method and apparatus for performing spatial-to-frequency domain transform | |
Taşmaz et al. | Image enhancement via space-adaptive lifting scheme exploiting subband dependency | |
KR100633555B1 (ko) | 신호 복구 방법 | |
Lang et al. | Fast 4x4 Tchebichef moment image compression | |
Kim et al. | Video compressed sensing using iterative self-similarity modeling and residual reconstruction | |
Ahmed et al. | Image compression using Haar and modified Haar wavelet transform | |
Nowak et al. | Wavelet-vaguelette restoration in photon-limited imaging | |
Hong et al. | New fast DCT algorithms based on Loeffler's factorization | |
Safavi et al. | Perceptual Compressive Sensing based on Contrast Sensitivity Function: Can we avoid non-visible redundancies acquisition? | |
Subudhiray et al. | Implementation of hybrid DWT-DCT algorithm for image compression: a review | |
Zhang et al. | Blind image separation based on reorganization of block DCT | |
Suganya et al. | Increasing the quality of reconstructed image through hybrid compression technique | |
Zeng et al. | Discrete Cosine Transformation for image compression: A comparative study | |
Li et al. | Block-based compressed sensing of image using directional Tchebichef transforms | |
BR102017018244A2 (pt) | Transformada inteira de baixa complexidade para descorrelação de dados | |
Sushma et al. | Wavelet-narm based sparse representation for bio medical images | |
Vrscay | A simple model for affine self-similarity of images and its applications | |
Abu et al. | Fast and efficient 4x4 tchebichef moment image compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181029 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190903 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190830 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20200331 |