TW201916626A - 基於區塊的主成分分析轉換方法及其裝置 - Google Patents

基於區塊的主成分分析轉換方法及其裝置 Download PDF

Info

Publication number
TW201916626A
TW201916626A TW106132684A TW106132684A TW201916626A TW 201916626 A TW201916626 A TW 201916626A TW 106132684 A TW106132684 A TW 106132684A TW 106132684 A TW106132684 A TW 106132684A TW 201916626 A TW201916626 A TW 201916626A
Authority
TW
Taiwan
Prior art keywords
dimensional
vector
signal
principal component
block
Prior art date
Application number
TW106132684A
Other languages
English (en)
Other versions
TWI642291B (zh
Inventor
李揚漢
謝景棠
陳力銘
陳鼎文
謝宗廷
Original Assignee
淡江大學
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 淡江大學 filed Critical 淡江大學
Priority to TW106132684A priority Critical patent/TWI642291B/zh
Priority to CN201810252676.8A priority patent/CN109544557A/zh
Priority to US16/137,508 priority patent/US10664720B2/en
Priority to JP2018177226A priority patent/JP2019061671A/ja
Application granted granted Critical
Publication of TWI642291B publication Critical patent/TWI642291B/zh
Publication of TW201916626A publication Critical patent/TW201916626A/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3068Precoding preceding compression, e.g. Burrows-Wheeler transformation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Complex Calculations (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本發明提出一種基於區塊的主成分分析轉換方法及其裝置。主成分分析轉換方法包括:獲得輸入訊號;分割輸入訊號並獲得對應分割後的輸入訊號的多個一維向量,其中此些一維向量的數量為分割數量;將此些一維向量排列成二維向量後,減去分割數量的一維向量的均值以獲得零平均向量;計算零平均向量的共變異數矩陣;計算共變異數矩陣的特徵向量;以及將零平均向量與特徵向量相乘以獲得投影係數。

Description

基於區塊的主成分分析轉換方法及其裝置
本發明是有關於一種基於區塊的主成分分析轉換方法及其裝置,且特別是有關於一種可以較低資料量還原原始訊號的主成分分析轉換方法及其裝置。
傳統主成分分析(Principal Component Analysis,PCA)在處理訊號時因為處理的訊號維度相當大,因此擷取特徵向量與特徵值所需要的計算成本也非常高。有相關研究提出利用硬體解決此問題,然而這會大幅增加硬體上的成本。因此如何更有效率地進行主成分分析轉換是本領域技術人員所應致力的目標。
有鑑於此,本發明提供一種基於區塊的主成分分析轉換方法及其裝置,能夠以低資料量完全重建原始訊號。
本發明提出一種基於區塊的主成分分析轉換方法,包括:獲得輸入訊號;分割輸入訊號並獲得對應分割後的輸入訊號的多個一維向量,其中上述一維向量的數量為分割數量;將上述一維向量排列成二維向量後,減去分割數量的一維向量的均值以獲得零平均向量;計算零平均向量的共變異數矩陣;計算共變異數矩陣的特徵向量;以及將零平均向量與特徵向量相乘以獲得投影係數。
在本發明的一實施例中,上述輸入訊號為一維訊號,且分割輸入訊號並獲得對應分割後的輸入訊號的上述一維向量的步驟包括:將一維訊號分割為多個訊框,並根據對應此些訊框的多個取樣點獲得上述一維向量。
在本發明的一實施例中,上述一維訊號語音訊號。
在本發明的一實施例中,上述輸入訊號為二維訊號,且分割輸入訊號並獲得對應分割後的輸入訊號的一維向量的步驟包括:將二維訊號分割為多個區塊,獲得對應此些區塊的多個像素的多個二維矩陣,並將上述二維矩陣轉換為上述一維向量。
在本發明的一實施例中,上述二維訊號為影像訊號。
在本發明的一實施例中,上述主成分分析轉換方法更包括:將投影係數與特徵向量的反矩陣相乘以獲得重建零平均向量;將重建零平均向量加上均值以獲得還原一維向量;以及將還原一維向量排列為還原輸入訊號。
本發明提出一種基於區塊的主成分分析轉換裝置,包括處理器及耦接到處理器的記憶體。其中處理器獲得輸入訊號;分割輸入訊號並獲得對應分割後的輸入訊號的一維向量,其中上述一維向量的數量為分割數量;將上述一維向量排列成二維向量後,減去分割數量的一維向量的均值以獲得零平均向量;計算零平均向量的共變異數矩陣;計算共變異數矩陣的特徵向量;以及將零平均向量與特徵向量相乘以獲得投影係數。
在本發明的一實施例中,上述輸入訊號為一維訊號,且處理器將一維訊號分割為多個訊框,並根據對應此些訊框的多個取樣點獲得上述一維向量。
在本發明的一實施例中,上述輸入訊號為二維訊號,且處理器將二維訊號分割為多個區塊,獲得對應此些區塊的多個像素的多個二維矩陣,並將上述二維矩陣轉換為上述一維向量。
在本發明的一實施例中,上述處理器將投影係數與特徵向量的反矩陣相乘以獲得重建零平均向量;將重建零平均向量加上均值以獲得還原一維向量;以及將還原一維向量排列為還原輸入訊號
基於上述,本發明基於區塊的主成分分析轉換方法及其裝置可對一維訊號或二維訊號做適當分割成多個訊框或多個區塊以獲得對應的多個一維向量。接著,將多個一維向量排列成二維向量後,減去分割數量的維向量的均值以獲得零平均向量並計算零平均向量的共變異數矩陣,求出共變異數矩陣的特徵向量,再將零平均向量與特徵向量相乘以獲得投影係數作為本發明主成分分析的正轉換輸出。本發明還可藉由逆轉換將投影係數與特徵向量的反矩陣相乘取回重建的零平均向量,將零平均向量加上均值以獲得還原一維向量,最後將還原一維向量排成指定大小的訊框或區塊。
為讓本發明的上述特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
圖1為根據本發明一實施例的基於區塊的主成分分析轉換裝置的方塊圖。
請參照圖1,本發明的主成分分析轉換裝置100包括處理器110及記憶體120。記憶體120耦接到處理器110。
處理器110例如是中央處理單元(Central Processing Unit,CPU),或是其他可程式化之一般用途或特殊用途的微處理器(Microprocessor)、數位信號處理器(Digital Signal Processor,DSP)、可程式化控制器、特殊應用積體電路(Application Specific Integrated Circuit,ASIC)或其他類似元件或上述元件的組合。
記憶體120例如是任何型態的固定或可移動隨機存取記憶體(Random Access Memory,RAM)、唯讀記憶體(Read-Only Memory,ROM)、快閃記憶體(flash memory)、硬碟(Hard Disk Drive,HDD)、固態硬碟(Solid State Drive,SSD)或類似元件或上述元件的組合。
在本發明的一實施例中,主成分分析轉換裝置100可藉由通訊元件(未繪示)接收語音訊號或影像訊號等輸入訊號,並將輸入訊號儲存或暫存在記憶體120中,以提供處理器110對此輸入訊號進行主成分分析的正轉換及逆轉換。
圖2為根據本發明一實施例的基於區塊的主成分分析轉換方法的正轉換流程圖。
請參照圖2,在步驟S201中,獲得一維訊號。此一維訊號例如是32位元浮點數量化且具有44.1k取樣頻率的語音訊號。
在步驟S203中,將一維訊號分割為多個訊框,並根據對應上述訊框的多個取樣點獲得多個一維向量,其中一維向量的數量為訊框數量。具體來說,處理器110會依指定大小的訊框來分割一維訊號,如方程式(1)。
(1)
其中f 為一維訊號的第f 個訊框(frame),F為一維訊號的訊框數量,n為訊框內的取樣點數,T為矩陣轉置。
在步驟S205中,將多個一維向量排列成二維向量後,減去訊框數量的多個一維向量的均值以獲得零平均向量。具體來說,處理器110會將取樣點依照方程式(2)將多個原一維向量排列成二維向量。
(2)
零平均向量ZV 如方程式(3),其中訊框數量的一維向量的均值如方程式(4)。
(3)
(4)
在步驟S207中,計算零平均向量的共變異數矩陣。共變異數矩陣C 如方程式(5)。
(5)
在步驟S209中,計算共變異數矩陣的特徵向量。具體來說,處理器110會從矩陣分解法萃取特徵向量evec ,而此特徵向量為本發明基於訊框的主成分分析的基底函數,d(.)表示矩陣分解法,如方程式(6)。
(6)
在步驟S211中,將零平均向量與特徵向量相乘以獲得投影係數。此投影係數P 為本發明基於訊框的主成分分析的正轉換輸出,如方程式(7)。
(7)
圖3為根據本發明另一實施例的主成分分析轉換方法的基於區塊的正轉換流程圖。
請參照圖3,在步驟S301中,獲得二維訊號。此二維訊號例如是八位元量化的二維256×256的影像訊號。
在步驟S303中,將二維訊號分割為多個區塊,獲得對應上述區塊的多個像素的多個二維矩陣,並將多個二維矩陣轉換為多個一維向量,其中一維向量的數量為區塊數量。具體來說,處理器110會依指定大小的區塊來分割一維訊號,如方程式(8)。
(8)
其中r為二維訊號中的第r 橫列(row)區塊,c 為二維訊號中的第c 直行(column)區塊,R 為橫列的區塊總數,C 為直行的區塊總數,p 為區塊中像素的橫列數,q 為區塊中像素的直行數。
接著,處理器110還可利用(.)將二維矩陣轉換為一維向量,如方程式(9)。
(9)
在步驟S305中,將多個一維向量排列成二維向量後,減去區塊數量的多個一維向量的均值以獲得零平均向量。具體來說,處理器110會將取樣點依照方程式(10)將多個原一維向量排列成二維向量,其中BRC 的乘積。(10)
零平均向量ZV 如方程式(11)所示,其中區塊數量的一維向量的均值如方程式(12)。
(11)
(12)
在步驟S307中,計算零平均向量的共變異數矩陣。共變異數矩陣C 如方程式(13)所示。
(13)
在步驟S309中,計算共變異數矩陣的特徵向量。具體來說,處理器110會從矩陣分解法萃取特徵向量evec ,而此特徵向量為本發明基於區塊的主成分分析的基底函數,d(.)表示矩陣分解法,相同於上述方程式(6)。
在步驟S311中,將零平均向量與特徵向量相乘以獲得投影係數。此投影係數P 為本發明基於區塊的主成分分析的正轉換輸出,相同於上述方程式(7)。
圖4為根據本發明一實施例的主成分分析轉換方法的基於區塊的逆轉換流程圖。
請參照圖4,在步驟S401中,將投影係數與特徵向量的反矩陣相乘以獲得重建零平均向量。具體來說,處理器110只要將投影係數與特徵向量的反矩陣相乘,就能獲得重建零平均向量,如方程式(14)。
(14)
由於特徵向量為正交矩陣,因此特徵向量的反矩陣與特徵向量轉置之後的矩陣相同。
在步驟S403中,將重建零平均向量加上均值以獲得還原一維向量。如方程式(15)。
(15)
在步驟S405中,將還原一維向量排列為還原輸入訊號。
若原始輸入訊號為一維訊號,則還原後的一維向量如方程式(16),且還原輸入訊號如方程式(17)。
(16)
(17)
若原始輸入訊號為二維訊號,則還原後的一維向量如方程式(17),且還原輸入訊號如方程式(18)。值得注意的是,方程式(18)中的(.)是將一維向量排列成指定大小的二維矩陣的轉換函數。
(17)
(18)
以下將藉由表1及表2說明本發明的主成分分析轉換方法的逆轉換還原及誤差在取樣單位上的品質測試。
表1為取樣頻率44.1k的一維語音訊號經逆轉換後與原語音訊號的差異(即,訊號雜訊比(Signal to Noise Ratio,SNR))。
表1:
表2為256×256的二維影像訊號經逆轉換與原影像訊號的差異(即,峰值訊號雜訊比(Peak Signal to Noise Ratio,PSNR))。
表2:
從表1及表2可得知,在還原測試中,當還原訊號未經量化處理時,從逆轉換還原的SNR及PSNR可看出無法完全還原出原始訊號。若將訊號的其中一點增加0.5的誤差,則SNR及PSNR結果皆小於單純經由逆轉換還原的SNR及PSNR值,代表了逆轉換所產生的誤差小於誤差0.5所造成的變化。最後,若利用捨入程序消除數位訊號上的誤差,就能達到逆轉換之完全還原訊號的效果。
圖5A及圖5B為本發明的基於區塊的主成分分析轉換方法的投影係數誤差分別對主成分與非主成分在空間域影像品質的影響的示意圖。圖6A及圖6B為本發明的基於區塊的主成分分析轉換方法的投影係數誤差分別對主成分與非主成分在頻率域影像品質的影響的示意圖。
在圖5A、圖5B、圖6A、圖6B中,橫軸皆為投影係數誤差百分比,縱軸皆為峰值訊號雜訊比(PSNR)。圖5B為圖5A的部分放大顯示圖。圖6B為圖6A的部分放大顯示圖。
圖5A顯示為在空間域的影像訊號上改變投影係數倍率對環原訊號品質的影響。圖6A顯示為在頻率域的影像訊號上改變投影係數倍率對環原訊號品質的影響。在圖5A及圖6A中都是以8×8的分割區塊進行測試。從圖5A及圖6A可證實本發明基於區塊的主成分分析在空間域資料或頻率域資料進行處理時,對影像品質的強健性(robust)影響相同。此外,從圖5A及圖6A中的峰值訊號雜訊比可證實非主成分投影係數修改後的重建訊號品質優於主成分投影係數修改後的重建訊號品質。對非主成分係數大小改變±20%重建影像的峰值訊號雜訊比約為35dB,而對主成分係數大小改變±10%重建影像的峰值訊號雜訊比約為35dB。由於還原影像仍有不錯的品質,這表示投影係數還可為隱藏資訊的載體空間,提供浮水印等資訊在隱藏技術上使用。
圖7A及圖7B為不同分割區塊大小的投影係數量化小數點位數與品質的比較圖。圖7B為圖7A的部分放大顯示圖。在圖7A及圖7B中,橫軸皆為小數點位數,縱軸皆為峰值訊號雜訊比(PSNR)。
圖7A顯示了在本發明基於區塊的主成分分析方法中將影像分割成不同區塊大小的情況下,量化到小數點0到20位的影像品質比較。當量化小數點大於第13位以後,不論區塊大小如何改變,所還原的影像品質的峰值訊號雜訊比都不會提高,其中區塊大小在32×32時的峰值訊號雜訊比最大。另外從圖7B可看出在小數點12位以前,區塊大小128×128的峰值訊號雜訊比最大。而在小數點12位以後,區塊大小32×32的峰值訊號雜訊比最大。
表3為測是小數點量化在不同區塊大小時,投影係數經由捨入程序(Rounding Process)的還原品質測試結果。
表3
從表3可得知不論區塊大小,本發明的主成分分析方法在小數點量化到第1位時,就可以在全部大小的區塊都達到原始影像完全重建的效果,其峰值訊號雜訊比為無限大。
圖8為本發明基於區塊的主成分分析、未量化離散餘弦轉換(Discrete Cosine Transform,DCT)及量化離散餘弦轉換(即,JPEG)資料量大小的比較圖。
圖8的橫軸為峰值訊號雜訊比且縱軸為壓縮率。在圖8中,隨著峰值訊號雜訊比的提高,基於區塊的主成分分析的資料量比量化離散餘弦轉換的資料量大。但若將基於區塊的主成分分析與未量化離散餘弦轉換的資料量大小作比較,如方形線與三角形線,在壓縮率大於0.8的位置,基於區塊的主成分分析與未量化離散餘弦轉換的還原影像品質(即,峰值訊號雜訊比)非常接近。當壓縮率介於0.1到0.8之間時,基於區塊的主成分分析的還原影像品質略優於未量化離散餘弦轉換的還原影像品質。當壓縮率小於0.1時,由於基於區塊的主成分分析所產生的投影係數與特徵向量稍為大於原始資料量,因此在未進行任何更有效的量化演算法之前,基於區塊的主成分分析的壓縮率會呈現負值,表示資料量會比原本資料稍微增加。從基於區塊的主成分分析與未量化離散餘弦轉換的資料量比較可以看出兩者資料量大小極為類似。因此,有效的基於區塊的主成分分析的量化演算法有其開發的必要。
圖9為本發明基於區塊的主成分分析與傳統主成分分析的比較圖。
圖9比較了基於區塊的主成分分析與傳統主成分分析的計算處理時間成本、資料量及還原影像品質。在計算時間成本上,本發明基於區塊的主成分分析可以有效加快處理速度。基於區塊的主成分分析在分割區塊大小為128×128時雖然計算量優於傳統主成分分析,但資料量大於傳統主成分分析取95%信賴水準。然而在分割區塊大小小於64×64時,基於區塊的主成分分析不但在計算量優於傳統主成分分析,而其資料量也小於傳統主成分分析取95%信賴水準,且重建資訊以峰值訊號雜訊比證實能夠無失真的完全還原原始資訊。
圖10為本發明基於區塊的主成分分析方法的執行時間成本與重建所需資料量的比較圖。
在圖10中,橫軸為區塊大小,而傳統PCA代表整個影像只有一個區塊,也就是不對影像進行區塊分割。左方的縱軸為資料量,其單位為2的n次方個64位元浮點數。右方的縱軸為花費時間,其單位為10的n次方秒。圖10為圖9中表格資料內容的示意圖。
綜上所述,本發明的主成分分析轉換方法及其裝置可對一維訊號或二維訊號做適當分割成多個訊框或多個區塊以獲得對應的一維向量,計算一維向量的零平均向量並計算零平均向量的共變異數矩陣,求出共變異數矩陣的特徵向量,再將零平均向量與特徵向量相乘以獲得投影係數作為本發明主成分分析的正轉換輸出。本發明還可藉由逆轉換將投影係數與特徵向量的反矩陣相乘取回重建的零平均向量,將零平均向量加上均值以獲得還原一維向量,最後將還原一維向量排成指定大小的訊框或區塊。此外,本發明的主成分分析轉換方法還可在低資料量的前提下達到輸入訊號的完全還原,這是其他方法無法達到的目標。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明的精神和範圍內,當可作些許的更動與潤飾,故本發明的保護範圍當視後附的申請專利範圍所界定者為準。
100‧‧‧主成分分析轉換裝置
110‧‧‧處理器
120‧‧‧記憶體
S201、S203、S205、S207、S209、S211‧‧‧基於區塊的主成分分析轉換方法的正轉換的步驟
S301、S303、S305、S307、S309、S311‧‧‧基於區塊的主成分分析轉換方法的正轉換的步驟
S401、S403、S405‧‧‧基於區塊的主成分分析轉換方法的逆轉換的步驟
圖1為根據本發明一實施例的基於區塊的主成分分析轉換裝置的方塊圖。 圖2為根據本發明一實施例的基於區塊的主成分分析轉換方法的正轉換流程圖。 圖3為根據本發明另一實施例的基於區塊的主成分分析轉換方法的正換轉流程圖。 圖4為根據本發明一實施例的基於區塊的主成分分析轉換方法的逆轉換流程圖。 圖5A及圖5B為本發明的基於區塊的主成分分析轉換方法的投影係數誤差分別對主成分與非主成分在空間域影像品質的影響的示意圖。 圖6A及圖6B為本發明的基於區塊的主成分分析轉換方法的投影係數誤差分別對主成分與非主成分在頻率域影像品質的影響的示意圖。 圖7A及圖7B為不同分割區塊大小的投影係數量化小數點位數與品質的比較圖。 圖8為本發明基於區塊的主成分分析、未量化離散餘弦轉換及量化離散餘弦轉換資料量大小的比較圖。 圖9為本發明基於區塊的主成分分析與傳統主成分分析的比較圖。 圖10為本發明基於區塊的主成分分析方法的執行時間成本與重建所需資料量的比較圖。

Claims (10)

  1. 一種基於區塊的主成分分析轉換方法,包括: 獲得一輸入訊號; 分割該輸入訊號並獲得對應分割後的該輸入訊號的多個一維向量,其中該些一維向量的數量為一分割數量; 將該些一維向量排列成一二維向量後,減去該分割數量的該些一維向量的一均值以獲得一零平均向量; 計算該零平均向量的一共變異數矩陣; 計算該共變異數矩陣的一特徵向量;以及 將該零平均向量與該特徵向量相乘以獲得一投影係數。
  2. 如申請專利範圍第1項所述的基於區塊的主成分分析轉換方法,其中該輸入訊號為一一維訊號,且分割該輸入訊號並獲得對應分割後的該輸入訊號的該些一維向量的步驟包括: 將該一維訊號分割為多個訊框,並根據對應該些訊框的多個取樣點獲得該些一維向量。
  3. 如申請專利範圍第2項所述的基於區塊的主成分分析轉換方法,其中該一維訊號一語音訊號。
  4. 如申請專利範圍第1項所述的基於區塊的主成分分析轉換方法,其中該輸入訊號為一二維訊號,且分割該輸入訊號並獲得對應分割後的該輸入訊號的該些一維向量的步驟包括: 將該二維訊號分割為多個區塊,獲得對應該些區塊的多個像素的多個二維矩陣,並將該些二維矩陣轉換為該些一維向量。
  5. 如申請專利範圍第4項所述的基於區塊的主成分分析轉換方法,其中該二維訊號為一影像訊號。
  6. 如申請專利範圍第1項所述的基於區塊的主成分分析轉換方法,更包括: 將該投影係數與該特徵向量的一反矩陣相乘以獲得一重建零平均向量; 將該重建零平均向量加上該均值以獲得一還原一維向量;以及 將該還原一維向量排列為一還原輸入訊號。
  7. 一種基於區塊的主成分分析轉換裝置,包括: 一處理器;以及 一記憶體,耦接到該處理器,其中該處理器 獲得一輸入訊號; 分割該輸入訊號並獲得對應分割後的該輸入訊號的多個一維向量,其中該些一維向量的數量為一分割數量; 將該些一維向量排列成一二維向量後,減去分割數量的該些一維向量的一均值以獲得一零平均向量; 計算該零平均向量的一共變異數矩陣; 計算該共變異數矩陣的一特徵向量;以及 將該零平均向量與該特徵向量相乘以獲得一投影係數。
  8. 如申請專利範圍第7項所述的基於區塊的主成分分析轉換方法,其中該輸入訊號為一一維訊號,且該處理器將該一維訊號分割為多個訊框,並根據對應該些訊框的多個取樣點獲得該些一維向量。
  9. 如申請專利範圍第7項所述的基於區塊的主成分分析轉換方法,其中該輸入訊號為一二維訊號,且該處理器將該二維訊號分割為多個區塊,獲得對應該些區塊的多個像素的多個二維矩陣,並將該些二維矩陣轉換為該一維向量。
  10. 如申請專利範圍第7項所述的基於區塊的主成分分析轉換方法,其中該處理器將該投影係數與該特徵向量的一反矩陣相乘以獲得一重建零平均向量,將該重建零平均向量加上該均值以獲得一還原一維向量,並將該還原一維向量排列為一還原輸入訊號。
TW106132684A 2017-09-22 2017-09-22 基於區塊的主成分分析轉換方法及其裝置 TWI642291B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
TW106132684A TWI642291B (zh) 2017-09-22 2017-09-22 基於區塊的主成分分析轉換方法及其裝置
CN201810252676.8A CN109544557A (zh) 2017-09-22 2018-03-26 基于区块的主成分分析转换方法及其装置
US16/137,508 US10664720B2 (en) 2017-09-22 2018-09-20 Block-based principal component analysis transformation method and device thereof
JP2018177226A JP2019061671A (ja) 2017-09-22 2018-09-21 ブロックベースの主成分分析変換方法およびその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW106132684A TWI642291B (zh) 2017-09-22 2017-09-22 基於區塊的主成分分析轉換方法及其裝置

Publications (2)

Publication Number Publication Date
TWI642291B TWI642291B (zh) 2018-11-21
TW201916626A true TW201916626A (zh) 2019-04-16

Family

ID=65034415

Family Applications (1)

Application Number Title Priority Date Filing Date
TW106132684A TWI642291B (zh) 2017-09-22 2017-09-22 基於區塊的主成分分析轉換方法及其裝置

Country Status (4)

Country Link
US (1) US10664720B2 (zh)
JP (1) JP2019061671A (zh)
CN (1) CN109544557A (zh)
TW (1) TWI642291B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113706396B (zh) * 2020-05-21 2024-04-30 北京机械设备研究所 基于滑动窗函数的遥测图像降噪处理方法
CN113283011B (zh) * 2021-06-05 2022-05-03 申业 一种获取变速箱零件转速及负载的方法及系统
CN114397865B (zh) * 2021-12-24 2023-10-20 广州市香港科大霍英东研究院 一种回收料混合比例在线检测方法、装置及存储介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080130914A1 (en) * 2006-04-25 2008-06-05 Incel Vision Inc. Noise reduction system and method
US7358891B2 (en) * 2006-05-27 2008-04-15 Bae Systems Information And Electronic Systems Integration Inc. Multipath resolving correlation interferometer direction finding
US8077994B2 (en) * 2008-06-06 2011-12-13 Microsoft Corporation Compression of MQDF classifier using flexible sub-vector grouping
US9253560B2 (en) * 2008-09-16 2016-02-02 Personics Holdings, Llc Sound library and method
US8090146B2 (en) * 2009-01-15 2012-01-03 Google Inc. Image watermarking
US8848802B2 (en) * 2009-09-04 2014-09-30 Stmicroelectronics International N.V. System and method for object based parametric video coding
CN102510491A (zh) * 2011-09-13 2012-06-20 海南大学 一种基于dwt可抗几何攻击的医学图像多重水印方法
CN102567993B (zh) * 2011-12-15 2014-06-11 中国科学院自动化研究所 基于主成分分析的指纹图像质量评价方法
JP6028388B2 (ja) * 2012-05-11 2016-11-16 富士通株式会社 到来方向推定装置、及び到来方向推定方法
CN102722866B (zh) * 2012-05-22 2014-07-23 西安电子科技大学 基于主成份分析的压缩感知方法
JP2014016746A (ja) * 2012-07-06 2014-01-30 Sony Computer Entertainment Inc 画像処理装置および画像処理方法
JP2014116746A (ja) * 2012-12-07 2014-06-26 Samsung R&D Institute Japan Co Ltd 撮像装置、歪補正回路及び歪補正方法
CN103208097B (zh) * 2013-01-29 2015-09-30 南京理工大学 图像多方向形态结构分组的主分量分析协同滤波方法
WO2015138008A1 (en) * 2014-03-10 2015-09-17 Euclid Discoveries, Llc Continuous block tracking for temporal prediction in video encoding
WO2016015752A1 (en) 2014-07-29 2016-02-04 Hewlett-Packard Development Company, L.P. Method and apparatus for validity determination of a data dividing operation
US10056076B2 (en) * 2015-09-06 2018-08-21 International Business Machines Corporation Covariance matrix estimation with structural-based priors for speech processing
US20190087717A1 (en) * 2016-04-01 2019-03-21 Intel Corporation Four stable state neuron

Also Published As

Publication number Publication date
US10664720B2 (en) 2020-05-26
CN109544557A (zh) 2019-03-29
JP2019061671A (ja) 2019-04-18
TWI642291B (zh) 2018-11-21
US20190095755A1 (en) 2019-03-28

Similar Documents

Publication Publication Date Title
Chan et al. Constrained total variation deblurring models and fast algorithms based on alternating direction method of multipliers
TWI642291B (zh) 基於區塊的主成分分析轉換方法及其裝置
US7379500B2 (en) Low-complexity 2-power transform for image/video compression
EP3072297A1 (en) Implementation design for hybrid transform coding scheme
Kumari et al. Analysis of orthogonal and biorthogonal wavelet filters for image compression
Pandey et al. Digital image processing using singular value decomposition
Dhumal et al. Survey on comparative analysis of various image compression algorithms with singular value decomposition
CN110599406B (zh) 一种图像增强方法及装置
WO2020060832A1 (en) Fast implementation of odd one dimensional transforms
Kumar et al. Design of modified vedic multiplier and FPGA implementation in multilevel 2d-DWT for image processing applications
Taşmaz et al. Image enhancement via space-adaptive lifting scheme exploiting subband dependency
TWI468015B (zh) 視訊解碼的平行處理裝置及方法
Kunchigi et al. Simulation of Vedic multiplier in DCT applications
Pandian et al. Effects of decomposition levels of wavelets in image compression algorithms
CN107689797B (zh) 基于维数任意的分块哈达玛测量矩阵的压缩感知信号重建方法
Shan et al. All phase discrete sine biorthogonal transform and its application in JPEG-like image coding using GPU
Jassim Image compression by embedding five modulus method into jpeg
Sunil et al. Analysis of wavelet for 3D-DWT volumetric image compression
Subudhiray et al. Implementation of hybrid DWT-DCT algorithm for image compression: a review
Paim et al. Exploring approximations in 4-and 8-point DTT hardware architectures for low-power image compression
Jeevan et al. Comparative study of DCT based image compression on hexagonal and conventional square pixel images
Sharma et al. Image compression and sparsity measurement by using multilevel and different wavelet functions
Nagaria et al. An optimized fast discrete cosine transform approach with various iterations and optimum numerical factors for image quality evaluation
Mehta et al. Image Compression using DCT and DWT-Technique
Gupta et al. Accurate simulation of on-sensor compressed sensing using ISET

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees