JP2019061671A - ブロックベースの主成分分析変換方法およびその装置 - Google Patents

ブロックベースの主成分分析変換方法およびその装置 Download PDF

Info

Publication number
JP2019061671A
JP2019061671A JP2018177226A JP2018177226A JP2019061671A JP 2019061671 A JP2019061671 A JP 2019061671A JP 2018177226 A JP2018177226 A JP 2018177226A JP 2018177226 A JP2018177226 A JP 2018177226A JP 2019061671 A JP2019061671 A JP 2019061671A
Authority
JP
Japan
Prior art keywords
dimensional
principal component
block
component analysis
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018177226A
Other languages
English (en)
Inventor
揚漢 李
Yang-Han Lee
揚漢 李
景棠 謝
Jing Tang Xie
景棠 謝
力銘 陳
Li-Ming Chen
力銘 陳
鼎文 陳
Ting-Wen Chen
鼎文 陳
宗廷 謝
Tzong-Tyng Hsieh
宗廷 謝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tamkang University
Original Assignee
Tamkang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tamkang University filed Critical Tamkang University
Publication of JP2019061671A publication Critical patent/JP2019061671A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3068Precoding preceding compression, e.g. Burrows-Wheeler transformation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Complex Calculations (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】小さなデータサイズで原信号を完全に再構築することのできるブロックベースの主成分分析変換方法およびその装置を提供する。【解決手段】主成分分析変換方法は、入力信号を取得することと;入力信号を分割して、分割した入力信号に対応する複数の1次元ベクトルを取得し、複数の1次元ベクトルの数が、分割数であることと;複数の1次元ベクトルを2次元ベクトルに配列した後、分割数の複数の1次元ベクトルの平均値を差し引いて、ゼロ−平均ベクトルを取得することと;ゼロ−平均ベクトルの共分散行列を計算することと;共分散行列の固有ベクトルを計算することと;ゼロ−平均ベクトルと固有ベクトルを掛けて、投影係数を取得することを含む。【選択図】図2

Description

本発明は、ブロックベースの主成分分析変換方法およびその装置に関するものであり、特に、比較的小さなデータサイズで原信号を復元することのできるブロックベースの主成分分析変換方法およびその装置に関するものである。
伝統的な主成分分析(principal component analysis, PCA)が信号を処理する時、信号は非常に大きな次元を有するため、固有ベクトルと固有値を取得するための計算コストも非常に高い。ある関連研究は、ハードウェアを用いてこの問題を解決することを提案したが、そのような解決法は、ハードウェア上のコストを大幅に増加させる。そのため、いかにして主成分分析変換をより効果的に行うかが、本分野における重要な課題となっている。
このため、本発明は、小さなデータサイズで原信号を完全に再構築することのできるブロックベースの主成分分析変換方法およびその装置を提供する。
本発明は、入力信号を取得することと;入力信号を分割して、分割した入力信号に対応する複数の1次元ベクトルを取得し、複数の1次元ベクトルの数が、分割数であることと;複数の1次元ベクトルを2次元ベクトルに配列した後、分割数の複数の1次元ベクトルの平均値を差し引いて、ゼロ−平均(zero-mean)ベクトルを取得することと;ゼロ−平均ベクトルの共分散行列(covariance matrix)を計算することと;共分散行列の固有ベクトルを計算することと;ゼロ−平均ベクトルと固有ベクトルを掛けて、投影係数を取得することを含む主成分分析変換方法およびその装置を提供する。
本発明の1つの実施形態において、入力信号は、1次元信号であり、入力信号を分割して、分割した入力信号に対応する複数の1次元ベクトルを取得するプロセスは、1次元信号を複数のフレームに分割し、複数のフレームに対応する複数のサンプリングポイントに基づいて、複数の1次元ベクトルを取得することを含む。
本発明の1つの実施形態において、1次元信号は、音声信号(speech signal)である。
本発明の1つの実施形態において、入力信号は、2次元信号であり、入力信号を分割して、分割した入力信号に対応する複数の1次元ベクトルを取得するプロセスは、2次元信号を複数のブロックに分割して、複数のブロックの複数の画素に対応する複数の2次元行列(matrix)を取得し、複数の2次元行列を複数の1次元ベクトルに変換することを含む。
本発明の1つの実施形態において、2次元信号は、画像信号である。
本発明の1つの実施形態において、本発明の主成分分析変換方法は、さらに、投影係数と固有ベクトルの逆行列(inverse matrix)を掛けて、再構築されたゼロ−平均ベクトルを取得することと;再構築されたゼロ−平均ベクトルに平均値を足して、復元された1次元ベクトルを取得することと;復元された1次元ベクトルを復元された入力信号に配列することを含む。
本発明は、プロセッサと、プロセッサに結合されたメモリを含むブロックベースの主成分分析変換装置を提供する。プロセッサは、入力信号を取得し;入力信号を分割して、分割した入力信号に対応する複数の1次元ベクトルを取得し、複数の1次元ベクトルの数は、分割数であり;複数の1次元ベクトルを2次元ベクトルに配列した後、分割数の複数の1次元ベクトルの平均値を差し引いて、ゼロ−平均ベクトルを取得し;ゼロ−平均ベクトルの共分散行列を計算し;共分散行列の固有ベクトルを計算し;ゼロ−平均ベクトルと固有ベクトルを掛けて、投影係数を取得する。
本発明の1つの実施形態において、入力信号は、1次元信号であり、プロセッサは、1次元信号を複数のフレームに分割し、複数のフレームに対応する複数のサンプリングポイントに基づいて、複数の1次元ベクトルを取得する。
本発明の1つの実施形態において、入力信号は、2次元信号であり、プロセッサは、2次元信号を複数のブロックに分割して、複数のブロックの複数の画素に対応する複数の2次元行列を取得し、複数の2次元行列を複数の1次元ベクトルに変換する。
本発明の1つの実施形態において、プロセッサは、投影係数と固有ベクトルの逆行列を掛けて、再構築されたゼロ−平均ベクトルを取得し;再構築されたゼロ−平均ベクトルに平均値を足して、復元された1次元ベクトルを取得し;復元された1次元ベクトルを復元された入力信号に配列する。
以上のように、本発明のブロックベースの主成分分析変換方法およびその装置は、1次元信号または2次元信号を複数のフレームまたは複数のブロックに適切に分割して、対応する複数の1次元ベクトルを取得し;次に、複数の1次元ベクトルを2次元ベクトルに配列した後、分割数の複数の1次元ベクトルの平均値を差し引いて、ゼロ−平均ベクトルを取得し;ゼロ−平均ベクトルの共分散行列を計算し;共分散行列の固有ベクトルを計算し;その後、ゼロ−平均ベクトルと固有ベクトルを掛けて、投影係数を取得し、本発明の主成分分析の変換出力として使用する。本発明は、さらに、逆変換により、投影係数と固有ベクトルを掛けて、再構築されたゼロ−平均ベクトルを取得し、再構築されたゼロ−平均ベクトルに平均値を足して、復元された1次元ベクトルを取得し、最後に、復元された1次元ベクトルを所望のサイズのフレームまたはブロックに配列する。
本発明の上記および他の目的、特徴、および利点をより分かり易くするため、図面と併せた幾つかの実施形態を以下に説明する。
添付図面は、本発明の原理がさらに理解されるために含まれており、本明細書に組み込まれ、且つその一部を構成するものである。図面は、本発明の実施形態を例示しており、説明とともに、本発明の原理を説明する役割を果たしている。
本発明の1つの実施形態に係るブロックベースの主成分分析変換装置のブロック図である。 本発明の1つの実施形態に係るブロックベースの主成分分析変換方法の変換のフローチャートである。 本発明の別の実施形態に係るブロックベースの主成分分析変換方法の変換のフローチャートである。 本発明の1つの実施形態に係るブロックベースの主成分分析変換方法の逆変換のフローチャートである。 図5(a)および図5(b)は、本発明のブロックベースの主成分分析変換方法の投影係数の誤差が空間領域における主成分および非主成分のそれぞれの画像品質にいかにして影響を与えるかを示した概略図である。 図6(a)および図6(b)は、本発明のブロックベースの主成分分析変換方法の投影係数の誤差が周波数領域における主成分および非主成分のそれぞれの画像品質にいかにして影響を与えるかを示した概略図である。 図7(a)および図7(b)は、異なるサイズの分割されたブロックの異なる小数位に量子化された投影係数と画像品質を比較した概略図である。 本発明のブロックベースの主成分分析のデータサイズ、非量子化離散コサイン変換のデータサイズ、および量子化離散コサイン変換のデータサイズを比較した概略図である。 本発明のブロックベースの主成分分析と伝統的な主成分分析を比較した概略図である。 本発明のブロックベースの主成分分析方法の操作時間コストとブロックベースの主成分分析方法における再構築に必要なデータサイズを比較した概略図である。
以下、この考案のいくつかの別の実施形態を提供する。ここで説明すべきこととして、上述した実施形態の参照番号および一部の内容を以下の実施形態において使用するが、同一の参照番号は、同一または類似する構成要素を示すものとし、同じ技術内容については説明を省略する。省略した詳細説明については、上述した実施形態を参照することができるため、以下の実施形態では繰り返し説明しない。
図1は、本発明の1つの実施形態に係るブロックベースの主成分分析変換装置のブロック図である。
図1を参照すると、本発明のブロックベースの主成分分析変換装置100は、プロセッサ110およびメモリ120を含む。メモリ120は、プロセッサ110に結合される。
プロセッサ110は、例えば、中央処理装置(central processing unit, CPU)または他のプログラム可能な一般用途または特殊用途のマイクロプロセッサ(microprocessor)、デジタル信号プロセッサ(digital signal processor, DSP)、プログラマブルコントローラ(programmable controller)、特定用途向け集積回路(application specific integrated circuit, ASIC)、他の類似構成要素、あるいはこれらの組み合わせである。
メモリ120は、例えば、ランダムアクセスメモリ(random access memory, RAM)、読み出し専用メモリ(read-only memory, ROM)、フラッシュメモリ(flash memory)、ハードディスクドライブ(hard disk drive, HHD)、ソリッドステートドライブ(solid state drive, SSD)、他の類似構成要素、あるいはこれらの組み合わせである。
本発明の1つの実施形態において、ブロックベースの主成分分析変換装置100は、通信部品(図示せず)を介して音声信号または画像信号等の入力信号を受信して、その入力信号をメモリ120に保存または一時保存し、プロセッサ110が入力信号に対して主成分分析の変換および逆変換を実行できるようにする。
図2は、本発明の1つの実施形態に係るブロックベースの主成分分析変換方法の変換のフローチャートである。
図2を参照すると、ステップS201において、1次元信号を取得する。1次元信号は、例えば、44.1kのサンプリング周波数を有する32ビット浮動小数点量子化(floating-point quantization)音声信号である。
ステップS203において、1次元信号を複数のフレームに分割し、複数のフレームに対応する複数のサンプリングポイントに基づいて、複数の1次元ベクトルを取得する。複数の1次元ベクトルの数は、複数のフレームの数である。具体的に説明すると、プロセッサ110は、式(1)に示すように、所望のサイズの複数のフレームに基づいて、1次元信号を分割する。
(1)
式中、fは、1次元信号の第fフレームであり、Fは、1次元信号における複数のフレームの数であり、nは、複数のフレームにおける複数のサンプリングポイントの数であり、Tは、行列の転置(transpose)である。
ステップS205において、複数の1次元ベクトルを2次元ベクトルに配列した後、複数のフレームの数の複数の1次元ベクトルの平均値を差し引いて、ゼロ−平均ベクトルを取得する。具体的に説明すると、プロセッサ110は、式(2)に基づいて、複数の原n×1の1次元ベクトルをn×Fの2次元ベクトルに配列する。
(2)
ゼロ−平均ベクトルZVは、式(3)で表され、複数のフレームの数の複数の1次元ベクトルの平均値は、式(4)で表される。
(3)
(4)
ステップS207において、ゼロ−平均ベクトルの共分散行列を計算する。共分散行列Cは、式(5)で表される。
(5)
ステップS209において、共分散行列の固有ベクトルを計算する。具体的に説明すると、プロセッサ110は、行列分解法(matrix decomposition method)により、固有ベクトルevecを引き抜き、固有ベクトルは、本発明のフレームベースの主成分分析の基底関数(base function)であり、d(・)は、式(6)で表される行列分解法を示す。
(6)
ステップS211において、ゼロ−平均ベクトルを固有ベクトルで掛けて、投影係数を取得する。投影係数Pは、式(7)で表される本発明のフレームベースの主成分分析の変換出力である。
(7)
図3は、本発明の別の実施形態に係るブロックベースの主成分分析変換方法の変換のフローチャートである。
図3を参照すると、ステップS301において、2次元信号を取得する。2次元信号は、例えば、8ビット量子化2次元256×256画像信号である。
ステップS303において、2次元信号を複数のブロックに分割し、複数のブロックの複数の画素に対応する複数の2次元行列を取得し、複数の2次元行列を複数の1次元ベクトルに変換する。複数の1次元ベクトルの数は、複数のブロックの数である。具体的に説明すると、プロセッサ110は、式(8)に示すように、所望のサイズの複数のブロックに基づいて、1次元信号を分割する。

(8)
式中、rは、2次元信号の第r列(row)上のブロックであり、cは、2次元信号のc行(column)上のブロックであり、Rは、列における複数のブロックの合計数であり、Cは、行における複数のブロックの合計数であり、pは、複数のブロックにおける複数の画素の列の数であり、qは、複数のブロックにおける複数の画素の行の数である。
次に、プロセッサ110は、式(9)に示すように、さらに、
を使用して、複数の2次元行列を複数の1次元ベクトルに変換する。

(9)
ステップS305において、複数の1次元ベクトルを2次元ベクトルに配列した後、複数のブロックの数の複数の1次元ベクトルの平均値を差し引いて、ゼロ−平均ベクトルを取得する。具体的に説明すると、プロセッサ110は、式(10)に基づいて、複数の原(p×q)×1の1次元ベクトルを(p×q)×Bの2次元ベクトルに配列する。Bは、RとCの積である。
(10)
ゼロ−平均ベクトルZVは、式(11)で表され、複数のブロックの数の複数の1次元ベクトルの平均値は、式(12)で表される。
(11)
(12)
ステップS307において、ゼロ−平均ベクトルの共分散行列を計算する。共分散行列Cは、式(13)で表される。
(13)
ステップS309において、共分散行列の固有ベクトルを計算する。具体的に説明すると、プロセッサ110は、行列分解法により、固有ベクトルevecを引き抜き、固有ベクトルは、本発明のブロックベースの主成分分析の基底関数であり、d(・)は、式(6)と同じ行列分解法を示す。
ステップS311において、ゼロ−平均ベクトルを固有ベクトルで掛けて、投影係数を取得する。投影係数Pは、式(7)で表される本発明のブロックベースの主成分分析の変換出力である。
図4は、本発明の1つの実施形態に係るブロックベースの主成分分析変換方法の逆変換のフローチャートである。
図4を参照すると、ステップS401において、投影係数を固有ベクトルの逆行列で掛けて、再構築されたゼロ−平均ベクトルを取得する。具体的に説明すると、プロセッサ110は、式(14)に示すように、単純に投影係数と固有ベクトルの逆行列を掛けることによって、再構築されたゼロ−平均ベクトルを取得する。
(14)
固有ベクトルは、直交行列であるため、固有ベクトルの逆行列は、固有ベクトルの転置行列と同一である。
ステップS403において、式(15)に示すように、平均値を再構築されたゼロ−平均ベクトルに足して、復元された1次元ベクトルを取得する。
(15)
ステップS405において、復元された1次元ベクトルを復元された入力信号に配列する。
原入力信号が1次元信号である場合、復元された1次元ベクトルは、式(16)で表され、復元された入力信号は、式(17)で表される。
(16)
(17)
原入力信号が2次元信号である場合、復元された1次元ベクトルは、式(18)で表され、復元された入力信号は、式(19)で表される。言及すべきこととして、式(19)の
は、復元された1次元ベクトルを所望のサイズの2次元行列に配列する伝達関数(transfer function)である。
(18)
(19)
以下、表1および表2を提供して、逆変換復元およびサンプリング単位の誤差に対する品質試験について説明する。
表1は、44.1kのサンプリング周波数を有する原1次元音声信号と逆変換された音声信号の間の差(すなわち、信号対雑音比(signal to noise ratio, SNR))を示したものである。
表2は、原256×256の2次元画像信号と逆変換された画像信号の間の差(すなわち、ピーク信号対雑音比(peak signal to noise ratio, PSNR))を示したものである。
表1および表2に基づくと、復元信号を量子化しない時、逆変換の復元されたSNRおよびPSNRによって、原信号が復元試験において完全に復元されなかったことがわかる。1ポイントの信号に0.5の誤差を追加し、その結果、SNRおよびPSNRの結果がいずれも単に逆変換によって復元されたSNRおよびPSNRよりも小さい場合、逆変換によって生じた誤差が、0.5の誤差によってもたらされる差よりも小さいことを示す。最後に、四捨五入(rounding process)をしてデジタル信号の誤差を除去し、逆変換により信号を完全に復元させる。
図5(a)および図5(b)は、本発明のブロックベースの主成分分析変換方法の投影係数の誤差が空間領域(spatial domain)における主成分および非主成分のそれぞれの画像品質にいかにして影響を与えるかを示した概略図である。図6(a)および図6(b)は、本発明のブロックベースの主成分分析変換方法の投影係数の誤差が周波数領域(frequency domain)における主成分および非主成分のそれぞれの画像品質にいかにして影響を与えるかを示した概略図である。
図5(a)、図5(b)、図6(a)、および図6(b)において、全ての横軸は、投影係数誤差の百分率を示し、全ての縦軸は、PSNRを示す。図5(b)は、図5(a)の局部拡大図である。図6(b)は、図6(a)の局部拡大図である。
図5(a)は、空間領域における画像信号の投影係数の倍率の変更が復元された信号の品質にいかにして影響を与えるかについて示したものである。図6(a)は、周波数領域における画像信号の投影係数の倍率の変更が復元された信号の品質にいかにして影響を与えるかについて示したものである。図5(a)および図6(a)において、試験は、いずれも8×8に分割されたブロックで行われる。図5(a)および図6(a)は、本発明のブロックベースの主成分分析が空間領域および周波数領域のデータを処理する時に、画像品質の堅牢性(robust)に同じ影響を与えることを証明している。また、図5(a)および図6(a)のPSNRは、非主成分投影係数によって修正された再構築信号の品質が主成分投影係数によって修正された再構築信号の品質よりも良いことを証明している。±20%の非主成分係数を変更する再構築された画像のPSNRは、約35dBであり、±10%の主成分係数を変更する再構築された画像のPSNRは、約35dBである。再構築された画像は、依然として良好な品質を有するため、投影係数は、データ隠蔽(data hiding)のキャリア空間として用いることもでき、水位標(watermark)等の情報を隠蔽技術に利用することができる。
図7(a)および図7(b)は、異なるサイズの分割されたブロックの異なる小数位に量子化された投影係数と画像品質を比較した概略図である。図7(b)は、図7(a)の局部拡大図である。図7(a)および図7(b)において、横軸は、いずれも小数位の数を示し、縦軸は、いずれもPSNRを示す。
図7(a)は、本発明のブロックベースの主成分分析方法で画像を異なるブロックサイズに分割した時に、小数第0位〜第20位に量子化した画像品質の比較を示したものである。第13位またはそれより大きい小数位に量子化した時、ブロックサイズの変化に関わらず、再構築された画像品質のPSNRは、増加せず、ブロックは、32×32のブロックサイズを有する時に最も大きなPSNRを有する。また、図7(b)からわかるように、第12位またはそれより大きな小数位に量子化した時、ブロックは、128×128のブロックサイズを有する時に最も大きなPSNRを有する;第12位より少ない小数位に量子化した時、ブロックは、32×32のブロックサイズを有する時に最も大きなPSNRを有する。
表3は、異なるブロックサイズで小数位を量子化した時に四捨五入した投影係数の復元品質の試験結果である。
表3からわかるように、ブロックサイズに関わらず、本発明の主成分分析方法において、小数第1位に量子化した時、全てのサイズのブロックにおける原画像が完全に再構築され、PSNRは無限である。
図8は、本発明のブロックベースの主成分分析のデータサイズ、非量子化離散コサイン変換(discrete cosine transform, DCT)のデータサイズ、および量子化離散コサイン変換(すなわち、JPEG)のデータサイズを比較した概略図である。
図8において、横軸は、PSNRを示し、縦軸は、圧縮率を示す。図8において、ブロックベースの主成分分析のデータサイズは、PSNRが上昇する時、量子化離散コサイン変換のデータサイズよりも常に大きい。しかしながら、ブロックベースの主成分分析のデータサイズと非量子化離散コサイン変換のデータサイズ、例えば、四角いマークの線と三角のマークの線を比較すると、圧縮率が0.8よりも大きい時、ブロックベースの主成分分析と非量子化離散コサイン変換の復元された画像(すなわち、PSNR)の品質は、非常に近い。一方、圧縮率が0.1から0.8の範囲内にある時、ブロックベースの主成分分析の復元された画像の品質は、非量子化離散コサイン変換の復元された画像の品質よりもわずかに優れている。一方、圧縮率が0.1よりも小さい時、ブロックベースの主成分分析によって生成された投影係数および固有ベクトルは、原データサイズよりもわずかに大きいため、さらに有効な量子化ベクトルアルゴリズムを行う前、ブロックベースの主成分分析の圧縮率は負の値であり、データサイズが原データサイズよりもわずかに大きいことを意味する。これらの比較からわかるように、ブロックベースの主成分分析と非量子化離散コサイン変換のデータサイズは、非常に類似している。そのため、ブロックベースの主成分分析の有効な量子化ベクトルアルゴリズムを開発する必要がある。
図9は、本発明のブロックベースの主成分分析と伝統的な主成分分析を比較した概略図である。
図9は、ブロックベースの主成分分析と伝統的な主成分分析の計算時間コスト、データサイズ、および復元された画像の品質を比較したものである。計算時間コストについては、本発明のブロックベースの主成分分析により処理速度が有効に向上する。ブロックベースの主成分分析の計算量は、分割されたブロックのサイズが128×128である時、伝統的な主成分分析よりも優れているが、ブロックベースの主成分分析のデータサイズは、95%の信頼水準(confidence level)において伝統的な主成分分析より大きい。しかしながら、分割されたブロックのサイズが64×64よりも小さい時、ブロックベースの主成分分析は、計算量において伝統的な主成分分析より優れているだけでなく、ブロックベースの主成分分析のデータサイズも95%の信頼水準において伝統的な主成分分析より小さい。また、PSNRが証明するように、再構築された情報は、原情報を劣化させずに完全に復元した。
図10は、本発明のブロックベースの主成分分析方法の操作時間コストとブロックベースの主成分分析方法における再構築に必要なデータサイズを比較した概略図である。
図10において、横軸は、ブロックサイズを示し、伝統的な主成分分析において、画像全体の中に1つのブロックしか存在しない、すなわち、画像は分割されない。左の縦軸は、データサイズを示し、その単位は、2のn乗の64ビット浮動小数点数である。右の縦軸は、コスト時間を示し、その単位は、10のn乗秒である。図10は、図9の表における情報を示す概略図である。
以上のように、主成分分析変換方法およびその装置は、1次元信号または2次元信号を複数のフレームまたは複数のブロックに適切に分割して、対応する複数の1次元ベクトルを取得し、複数の1次元ベクトルのゼロ−平均ベクトルを計算して、ゼロ−平均ベクトルの共分散行列を計算し、共分散行列の固有ベクトルを計算し、その後、ゼロ−平均ベクトルと固有ベクトルを掛けて、投影係数を取得し、本発明の主成分分析の変換出力として使用する。本発明は、さらに、逆変換により、投影係数と固有ベクトルの逆行列を掛けて、再構築されたゼロ−平均ベクトルを取得し、再構築されたゼロ−平均ベクトルに平均値を足して、復元された1次元ベクトルを取得し、最後に、復元された1次元ベクトルを所望のサイズのフレームまたはブロックに配列する。また、小さいデータサイズの前提の下に、主成分分析変換方法は、さらに、他の先行技術の方法では達成できなかった入力信号の完全復元を達成する。
以上のごとく、この発明を実施形態により開示したが、もとより、この発明を限定するためのものではなく、当業者であれば容易に理解できるように、この発明の技術思想の範囲内において、適当な変更ならびに修正が当然なされうるものであるから、その特許権保護の範囲は、特許請求の範囲および、それと均等な領域を基準として定めなければならない。
本発明のブロックベースの主成分分析変換方法およびその装置は、信号復元装置に応用することができる。
100 主成分分析変換装置
110 プロセッサ
120 メモリ
S201、S203、S205、S207、S209、S211 ブロックベースの主成分分析変換方法の変換ステップ
S301、S303、S305、S307、S309、S311 ブロックベースの主成分分析変換方法の変換ステップ
S401、S403、S405 ブロックベースの主成分分析変換方法の逆変換ステップ

Claims (10)

  1. 入力信号を取得することと、
    前記入力信号を分割して、前記分割した入力信号に対応する複数の1次元ベクトルを取得し、前記複数の1次元ベクトルの数が、分割数であることと、
    前記複数の1次元ベクトルを2次元ベクトルに配列した後、前記分割数の前記複数の1次元ベクトルの平均値を差し引いて、ゼロ−平均ベクトルを取得することと、
    前記ゼロ−平均ベクトルの共分散行列を計算することと、
    前記共分散行列の固有ベクトルを計算することと、
    前記ゼロ−平均ベクトルと前記固有ベクトルを掛けて、投影係数を取得することと、
    を含むブロックベースの主成分分析変換方法。
  2. 前記入力信号が、1次元信号であり、前記入力信号を分割して、前記分割した入力信号に対応する前記複数の1次元ベクトルを取得するプロセスが、
    前記1次元信号を複数のフレームに分割し、前記複数のフレームに対応する複数のサンプリングポイントに基づいて、前記複数の1次元ベクトルを取得することを含む請求項1に記載のブロックベースの主成分分析変換方法。
  3. 前記1次元信号が、音声信号である請求項2に記載のブロックベースの主成分分析変換方法。
  4. 前記入力信号が、2次元信号であり、前記入力信号を分割して、前記分割した入力信号に対応する前記複数の1次元ベクトルを取得するプロセスが、
    前記2次元信号を複数のブロックに分割して、前記複数のブロックの複数の画素に対応する複数の2次元行列を取得し、前記複数の2次元行列を前記複数の1次元ベクトルに変換することを含む請求項1に記載のブロックベースの主成分分析変換方法。
  5. 2次元信号が、画像信号である請求項4に記載のブロックベースの主成分分析変換方法。
  6. 前記投影係数と前記固有ベクトルの逆行列を掛けて、再構築されたゼロ−平均ベクトルを取得することと、
    前記再構築されたゼロ−平均ベクトルに前記平均値を足して、復元された1次元ベクトルを取得することと、
    前記復元された1次元ベクトルを復元された入力信号に配列することと、
    をさらに含む請求項1に記載のブロックベースの主成分分析変換方法。
  7. プロセッサと、
    前記プロセッサに結合されたメモリと、
    を含むブロックベースの主成分分析変換装置であって、前記プロセッサが、
    入力信号を取得し、
    前記入力信号を分割して、前記分割した入力信号に対応する複数の1次元ベクトルを取得し、前記複数の1次元ベクトルの数が分割数であり、
    前記複数の1次元ベクトルを2次元ベクトルに配列した後、前記分割数の前記複数の1次元ベクトルの平均値を差し引いて、ゼロ−平均ベクトルを取得し、
    前記ゼロ−平均ベクトルの共分散行列を計算し、
    前記共分散行列の固有ベクトルを計算し、
    前記ゼロ−平均ベクトルと前記固有ベクトルを掛けて、投影係数を取得するブロックベースの主成分分析変換装置。
  8. 前記入力信号が、1次元信号であり、前記プロセッサが、前記1次元信号を複数のフレームに分割し、前記複数のフレームに対応する複数のサンプリングポイントに基づいて、前記複数の1次元ベクトルを取得する請求項7に記載のブロックベースの主成分分析変換装置。
  9. 前記入力信号が、2次元信号であり、前記プロセッサが、前記2次元信号を複数のブロックに分割して、前記複数のブロックの複数の画素に対応する前記複数の2次元行列を取得し、前記複数の2次元行列を前記複数の1次元ベクトルに変換する請求項7に記載のブロックベースの主成分分析変換装置。
  10. 前記プロセッサが、前記投影係数と前記固有ベクトルの逆行列を掛けて、再構築されたゼロ−平均ベクトルを取得し、前記再構築されたゼロ−平均ベクトルに前記平均値を足して、復元された1次元ベクトルを取得し、前記復元された1次元ベクトルを復元された入力信号に配列する請求項7に記載のブロックベースの主成分分析変換装置。
JP2018177226A 2017-09-22 2018-09-21 ブロックベースの主成分分析変換方法およびその装置 Pending JP2019061671A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW106132684 2017-09-22
TW106132684A TWI642291B (zh) 2017-09-22 2017-09-22 基於區塊的主成分分析轉換方法及其裝置

Publications (1)

Publication Number Publication Date
JP2019061671A true JP2019061671A (ja) 2019-04-18

Family

ID=65034415

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018177226A Pending JP2019061671A (ja) 2017-09-22 2018-09-21 ブロックベースの主成分分析変換方法およびその装置

Country Status (4)

Country Link
US (1) US10664720B2 (ja)
JP (1) JP2019061671A (ja)
CN (1) CN109544557A (ja)
TW (1) TWI642291B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113706396B (zh) * 2020-05-21 2024-04-30 北京机械设备研究所 基于滑动窗函数的遥测图像降噪处理方法
CN113283011B (zh) * 2021-06-05 2022-05-03 申业 一种获取变速箱零件转速及负载的方法及系统
CN114397865B (zh) * 2021-12-24 2023-10-20 广州市香港科大霍英东研究院 一种回收料混合比例在线检测方法、装置及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012504251A (ja) * 2008-09-16 2012-02-16 パーソニクス ホールディングス インコーポレイテッド 音声ライブラリおよび方法
JP2014016746A (ja) * 2012-07-06 2014-01-30 Sony Computer Entertainment Inc 画像処理装置および画像処理方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080130914A1 (en) * 2006-04-25 2008-06-05 Incel Vision Inc. Noise reduction system and method
US7358891B2 (en) * 2006-05-27 2008-04-15 Bae Systems Information And Electronic Systems Integration Inc. Multipath resolving correlation interferometer direction finding
US8077994B2 (en) * 2008-06-06 2011-12-13 Microsoft Corporation Compression of MQDF classifier using flexible sub-vector grouping
US8090146B2 (en) * 2009-01-15 2012-01-03 Google Inc. Image watermarking
US8848802B2 (en) * 2009-09-04 2014-09-30 Stmicroelectronics International N.V. System and method for object based parametric video coding
CN102510491A (zh) * 2011-09-13 2012-06-20 海南大学 一种基于dwt可抗几何攻击的医学图像多重水印方法
CN102567993B (zh) * 2011-12-15 2014-06-11 中国科学院自动化研究所 基于主成分分析的指纹图像质量评价方法
JP6028388B2 (ja) * 2012-05-11 2016-11-16 富士通株式会社 到来方向推定装置、及び到来方向推定方法
CN102722866B (zh) * 2012-05-22 2014-07-23 西安电子科技大学 基于主成份分析的压缩感知方法
JP2014116746A (ja) * 2012-12-07 2014-06-26 Samsung R&D Institute Japan Co Ltd 撮像装置、歪補正回路及び歪補正方法
CN103208097B (zh) * 2013-01-29 2015-09-30 南京理工大学 图像多方向形态结构分组的主分量分析协同滤波方法
WO2015138008A1 (en) * 2014-03-10 2015-09-17 Euclid Discoveries, Llc Continuous block tracking for temporal prediction in video encoding
WO2016015752A1 (en) 2014-07-29 2016-02-04 Hewlett-Packard Development Company, L.P. Method and apparatus for validity determination of a data dividing operation
US10056076B2 (en) * 2015-09-06 2018-08-21 International Business Machines Corporation Covariance matrix estimation with structural-based priors for speech processing
US20190087717A1 (en) * 2016-04-01 2019-03-21 Intel Corporation Four stable state neuron

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012504251A (ja) * 2008-09-16 2012-02-16 パーソニクス ホールディングス インコーポレイテッド 音声ライブラリおよび方法
JP2014016746A (ja) * 2012-07-06 2014-01-30 Sony Computer Entertainment Inc 画像処理装置および画像処理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
RAVI KIRAN, CHANDRASHEKHAR KAMARGAONKAR: ""Region based medical image compression using block-based PCA"", 2016 INTERNATIONAL CONFERENCE ON COMPUTATION OF POWER, ENERGY INFORMATION AND COMMUINCATION (ICCPEIC, JPN6019033176, 1 September 2016 (2016-09-01), US, pages 091 - 096, ISSN: 0004240830 *

Also Published As

Publication number Publication date
US10664720B2 (en) 2020-05-26
CN109544557A (zh) 2019-03-29
TW201916626A (zh) 2019-04-16
TWI642291B (zh) 2018-11-21
US20190095755A1 (en) 2019-03-28

Similar Documents

Publication Publication Date Title
Needell et al. Stable image reconstruction using total variation minimization
Raviraj et al. The modified 2D-Haar wavelet transformation in image compression
KR101036731B1 (ko) 손실 및 무손실 2차원 데이터 압축을 위한 가역 변환
JP2019061671A (ja) ブロックベースの主成分分析変換方法およびその装置
WO2006036796A1 (en) Processing video frames
Pandey et al. Digital image processing using singular value decomposition
Dhumal et al. Survey on comparative analysis of various image compression algorithms with singular value decomposition
EP1442392A2 (en) Method and apparatus for performing spatial-to-frequency domain transform
Taşmaz et al. Image enhancement via space-adaptive lifting scheme exploiting subband dependency
KR100633555B1 (ko) 신호 복구 방법
Lang et al. Fast 4x4 Tchebichef moment image compression
Kim et al. Video compressed sensing using iterative self-similarity modeling and residual reconstruction
Ahmed et al. Image compression using Haar and modified Haar wavelet transform
Nowak et al. Wavelet-vaguelette restoration in photon-limited imaging
Hong et al. New fast DCT algorithms based on Loeffler's factorization
Safavi et al. Perceptual Compressive Sensing based on Contrast Sensitivity Function: Can we avoid non-visible redundancies acquisition?
Subudhiray et al. Implementation of hybrid DWT-DCT algorithm for image compression: a review
Zhang et al. Blind image separation based on reorganization of block DCT
Suganya et al. Increasing the quality of reconstructed image through hybrid compression technique
Zeng et al. Discrete Cosine Transformation for image compression: A comparative study
Li et al. Block-based compressed sensing of image using directional Tchebichef transforms
BR102017018244A2 (pt) Transformada inteira de baixa complexidade para descorrelação de dados
Sushma et al. Wavelet-narm based sparse representation for bio medical images
Vrscay A simple model for affine self-similarity of images and its applications
Abu et al. Fast and efficient 4x4 tchebichef moment image compression

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181029

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190903

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190830

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200331