CN109544557A - 基于区块的主成分分析转换方法及其装置 - Google Patents

基于区块的主成分分析转换方法及其装置 Download PDF

Info

Publication number
CN109544557A
CN109544557A CN201810252676.8A CN201810252676A CN109544557A CN 109544557 A CN109544557 A CN 109544557A CN 201810252676 A CN201810252676 A CN 201810252676A CN 109544557 A CN109544557 A CN 109544557A
Authority
CN
China
Prior art keywords
dimensional
principal component
signal
block
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810252676.8A
Other languages
English (en)
Inventor
谢景棠
陈力铭
其他发明人请求不公开姓名
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tamkang University
Original Assignee
Tamkang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tamkang University filed Critical Tamkang University
Publication of CN109544557A publication Critical patent/CN109544557A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3068Precoding preceding compression, e.g. Burrows-Wheeler transformation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)

Abstract

本发明提出一种基于区块的主成分分析转换方法及其装置。主成分分析转换方法包括:获得输入信号;分割输入信号并获得对应分割后的输入信号的多个一维向量,其中这些一维向量的数量为分割数量;将这些一维向量排列成二维向量后,减去分割数量的一维向量的均值以获得零平均向量;计算零平均向量的协方差矩阵;计算协方差矩阵的特征向量;以及将零平均向量与特征向量相乘以获得投影系数。

Description

基于区块的主成分分析转换方法及其装置
技术领域
本发明是有关于一种基于区块的主成分分析转换方法及其装置,且特别是有关于一种可以较低数据量还原原始信号的主成分分析转换方法及其装置。
背景技术
传统主成分分析(Principal Component Analysis,PCA)在处理信号时因为处理的信号维度相当大,因此撷取特征向量与特征值所需要的计算成本也非常高。有相关研究提出利用硬件解决此问题,然而这会大幅增加硬件上的成本。因此如何更有效率地进行主成分分析转换是本领域技术人员所应致力的目标。
发明内容
有鉴于此,本发明提供一种基于区块的主成分分析转换方法及其装置,能够以低数据量完全重建原始信号。
本发明提出一种基于区块的主成分分析转换方法,包括:获得输入信号;分割输入信号并获得对应分割后的输入信号的多个一维向量,其中上述一维向量的数量为分割数量;将上述一维向量排列成二维向量后,减去分割数量的一维向量的均值以获得零平均向量;计算零平均向量的协方差矩阵;计算协方差矩阵的特征向量;以及将零平均向量与特征向量相乘以获得投影系数。
在本发明的一实施例中,上述输入信号为一维信号,且分割输入信号并获得对应分割后的输入信号的上述一维向量的步骤包括:将一维信号分割为多个帧,并根据对应这些帧的多个取样点获得上述一维向量。
在本发明的一实施例中,上述一维信号语音信号。
在本发明的一实施例中,上述输入信号为二维信号,且分割输入信号并获得对应分割后的输入信号的一维向量的步骤包括:将二维信号分割为多个区块,获得对应这些区块的多个像素的多个二维矩阵,并将上述二维矩阵转换为上述一维向量。
在本发明的一实施例中,上述二维信号为影像信号。
在本发明的一实施例中,上述主成分分析转换方法更包括:将投影系数与特征向量的反矩阵相乘以获得重建零平均向量;将重建零平均向量加上均值以获得还原一维向量;以及将还原一维向量排列为还原输入信号。
本发明提出一种基于区块的主成分分析转换装置,包括处理器及耦接到处理器的存储器。其中处理器获得输入信号;分割输入信号并获得对应分割后的输入信号的一维向量,其中上述一维向量的数量为分割数量;将上述一维向量排列成二维向量后,减去分割数量的一维向量的均值以获得零平均向量;计算零平均向量的协方差矩阵;计算协方差矩阵的特征向量;以及将零平均向量与特征向量相乘以获得投影系数。
在本发明的一实施例中,上述输入信号为一维信号,且处理器将一维信号分割为多个帧,并根据对应这些帧的多个取样点获得上述一维向量。
在本发明的一实施例中,上述输入信号为二维信号,且处理器将二维信号分割为多个区块,获得对应这些区块的多个像素的多个二维矩阵,并将上述二维矩阵转换为上述一维向量。
在本发明的一实施例中,上述处理器将投影系数与特征向量的反矩阵相乘以获得重建零平均向量;将重建零平均向量加上均值以获得还原一维向量;以及将还原一维向量排列为还原输入信号
基于上述,本发明基于区块的主成分分析转换方法及其装置可对一维信号或二维信号做适当分割成多个帧或多个区块以获得对应的多个一维向量。接着,将多个一维向量排列成二维向量后,减去分割数量的维向量的均值以获得零平均向量并计算零平均向量的协方差矩阵,求出协方差矩阵的特征向量,再将零平均向量与特征向量相乘以获得投影系数作为本发明主成分分析的正转换输出。本发明还可通过逆转换将投影系数与特征向量的反矩阵相乘取回重建的零平均向量,将零平均向量加上均值以获得还原一维向量,最后将还原一维向量排成指定大小的帧或区块。
为让本发明的上述特征和优点能更明显易懂,下文特举实施例,并配合所附图式作详细说明如下。
附图说明
图1为根据本发明一实施例的基于区块的主成分分析转换装置的方块图。
图2为根据本发明一实施例的基于区块的主成分分析转换方法的正转换流程图。
图3为根据本发明另一实施例的基于区块的主成分分析转换方法的正换转流程图。
图4为根据本发明一实施例的基于区块的主成分分析转换方法的逆转换流程图。
图5A及图5B为本发明的基于区块的主成分分析转换方法的投影系数误差分别对主成分与非主成分在空间域影像品质的影响的示意图。
图6A及图6B为本发明的基于区块的主成分分析转换方法的投影系数误差分别对主成分与非主成分在频域影像品质的影响的示意图。
图7A及图7B为不同分割区块大小的投影系数量化小数点位数与品质的比较图。
图8为本发明基于区块的主成分分析、未量化离散余弦转换及量化离散余弦转换数据量大小的比较图。
图9为本发明基于区块的主成分分析方法的执行时间成本与重建所需数据量的比较图。
符号说明:
100:主成分分析转换装置
110:处理器
120:存储器
S201、S203、S205、S207、S209、S211:基于区块的主成分分析转换方法的正转换的步骤
S301、S303、S305、S307、S309、S311:基于区块的主成分分析转换方法的正转换的步骤
S401、S403、S405:基于区块的主成分分析转换方法的逆转换的步骤
具体实施方式
图1为根据本发明一实施例的基于区块的主成分分析转换装置的方块图。
请参照图1,本发明的主成分分析转换装置100包括处理器110及存储器120。存储器120耦接到处理器110。
处理器110例如是中央处理单元(Central Processing Unit,CPU),或是其他可程式化的一般用途或特殊用途的微处理器(Microprocessor)、数字信号处理器(DigitalSignal Processor,DSP)、可程式化控制器、特定用途集成电路(Application SpecificIntegrated Circuit,ASIC)或其他类似元件或上述元件的组合。
存储器120例如是任何型态的固定或可移动随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、快闪存储器(flash memory)、硬盘驱动器(Hard Disk Drive,HDD)、固态硬盘(Solid State Drive,SSD)或类似元件或上述元件的组合。
在本发明的一实施例中,主成分分析转换装置100可通过通讯元件(未显示)接收语音信号或影像信号等输入信号,并将输入信号储存或暂存在存储器120中,以提供处理器110对此输入信号进行主成分分析的正转换及逆转换。
图2为根据本发明一实施例的基于区块的主成分分析转换方法的正转换流程图。
请参照图2,在步骤S201中,获得一维信号。此一维信号例如是32比特浮点数量化且具有44.1k取样频率的语音信号。
在步骤S203中,将一维信号分割为多个帧,并根据对应上述帧的多个取样点获得多个一维向量,其中一维向量的数量为帧数量。具体来说,处理器110会依指定大小的帧来分割一维信号,如方程式(1)。
Xf=[x(f-1)n+1,x(f-1)n+2,…,x(f-1)n+n]T,where f=1,…,F (1)
其中f为一维信号的第f个帧(frame),F为一维信号的帧数量,n为帧内的取样点数,T为矩阵转置。
在步骤S205中,将多个一维向量排列成二维向量后,减去帧数量的多个一维向量的均值以获得零平均向量。具体来说,处理器110会根据取样点依照方程式(2)将多个原n×1一维向量排列成n×F二维向量。
XV=[X1,X2,…,Xf,…XF],where f=1,…,F (2)
零平均向量ZV如方程式(3),其中帧数量的一维向量的均值如方程式(4)。
在步骤S207中,计算零平均向量的协方差矩阵。协方差矩阵C如方程式(5)。
在步骤S209中,计算协方差矩阵的特征向量。具体来说,处理器110会从矩阵分解法萃取特征向量evec,而此特征向量为本发明基于帧的主成分分析的基底函数,d(.)表示矩阵分解法,如方程式(6)。
在步骤S211中,将零平均向量与特征向量相乘以获得投影系数。此投影系数P为本发明基于帧的主成分分析的正转换输出,如方程式(7)。
evec×ZV=P (7)
图3为根据本发明另一实施例的主成分分析转换方法的基于区块的正转换流程图。
请参照图3,在步骤S301中,获得二维信号。此二维信号例如是八比特量化的二维256×256的影像信号。
在步骤S303中,将二维信号分割为多个区块,获得对应上述区块的多个像素的多个二维矩阵,并将多个二维矩阵转换为多个一维向量,其中一维向量的数量为区块数量。具体来说,处理器110会依指定大小的区块来分割一维信号,如方程式(8)。
其中r为二维信号中的第r横列(row)区块,c为二维信号中的第c直行(column)区块,R为横列的区块总数,C为直行的区块总数,p为区块中像素的横列数,q为区块中像素的直行数。
接着,处理器110还可利用将二维矩阵转换为一维向量,如方程式(9)。
在步骤S305中,将多个一维向量排列成二维向量后,减去区块数量的多个一维向量的均值以获得零平均向量。具体来说,处理器110会根据取样点依照方程式(10)将多个原(p×q)×1一维向量排列成(p×q)×B二维向量,其中B为R、C的乘积。
XV=[X1,X2,…,Xv,…,XR×C],where v=1,…,R×C (10)
零平均向量ZV如方程式(11)所示,其中区块数量的一维向量的均值如方程式(12)。
在步骤S307中,计算零平均向量的协方差矩阵。协方差矩阵C如方程式(13)所示。
在步骤S309中,计算协方差矩阵的特征向量。具体来说,处理器110会从矩阵分解法萃取特征向量evec,而此特征向量为本发明基于区块的主成分分析的基底函数,d(.)表示矩阵分解法,相同于上述方程式(6)。
在步骤S311中,将零平均向量与特征向量相乘以获得投影系数。此投影系数P为本发明基于区块的主成分分析的正转换输出,相同于上述方程式(7)。
图4为根据本发明一实施例的主成分分析转换方法的基于区块的逆转换流程图。
请参照图4,在步骤S401中,将投影系数与特征向量的反矩阵相乘以获得重建零平均向量。具体来说,处理器110只要将投影系数与特征向量的反矩阵相乘,就能获得重建零平均向量,如方程式(14)。
evec×P=Z′V (14)
由于特征向量为正交矩阵,因此特征向量的反矩阵与特征向量转置之后的矩阵相同。
在步骤S403中,将重建零平均向量加上均值以获得还原一维向量。如方程式(15)。
在步骤S405中,将还原一维向量排列为还原输入信号。
若原始输入信号为一维信号,则还原后的一维向量如方程式(16),且还原输入信号如方程式(17)。
Xre=[(X′1)T,(X′2)T,…(X′f)T,…(X′F)T,where f=1,…,F (16)
X′f=[x′(f-1)n+1,x′(f-1)n+2,…,x′(f-1)n+n]T,where f=1,…,F (17)
若原始输入信号为二维信号,则还原后的一维向量如方程式(18),且还原输入信号如方程式(19)。值得注意的是,方程式(19)中的是将一维向量排列成指定大小的二维矩阵的转换函数。
以下将通过表1及表2说明本发明的主成分分析转换方法的逆转换还原及误差在取样单位上的品质测试。
表1为取样频率44.1k的一维语音信号经逆转换后与原语音信号的差异(即,信噪比(Signal to Noise Ratio,SNR))。
表1:
表2为256×256的二维影像信号经逆转换与原影像信号的差异(即,峰值信噪比(Peak Signal to Noise Ratio,PSNR))。
表2:
从表1及表2可得知,在还原测试中,当还原信号未经量化处理时,从逆转换还原的SNR及PSNR可看出无法完全还原出原始信号。若将信号的其中一点增加0.5的误差,则SNR及PSNR结果皆小于单纯经由逆转换还原的SNR及PSNR值,代表了逆转换所产生的误差小于误差0.5所造成的变化。最后,若利用舍入程序消除数字信号上的误差,就能达到逆转换的完全还原信号的效果。
图5A及图5B为本发明的基于区块的主成分分析转换方法的投影系数误差分别对主成分与非主成分在空间域影像品质的影响的示意图。图6A及图6B为本发明的基于区块的主成分分析转换方法的投影系数误差分别对主成分与非主成分在频域影像品质的影响的示意图。
在图5A、图5B、图6A、图6B中,横轴皆为投影系数误差百分比,纵轴皆为峰值信噪比(PSNR)。图5B为图5A的部分放大显示图。图6B为图6A的部分放大显示图。
图5A显示为在空间域的影像信号上改变投影系数倍率对环原信号品质的影响。图6A显示为在频域的影像信号上改变投影系数倍率对环原信号品质的影响。在图5A及图6A中都是以8×8的分割区块进行测试。从图5A及图6A可证实本发明基于区块的主成分分析在空间域数据或频域数据进行处理时,对影像品质的鲁棒性(robust)影响相同。此外,从图5A及图6A中的峰值信噪比可证实非主成分投影系数修改后的重建信号品质优于主成分投影系数修改后的重建信号品质。对非主成分系数大小改变±20%重建影像的峰值信噪比约为35dB,而对主成分系数大小改变±10%重建影像的峰值信噪比约为35dB。由于还原影像仍有不错的品质,这表示投影系数还可为隐藏资讯的载体空间,提供浮水印等资讯在隐藏技术上使用。
图7A及图7B为不同分割区块大小的投影系数量化小数点位数与品质的比较图。图7B为图7A的部分放大显示图。在图7A及图7B中,横轴皆为小数点位数,纵轴皆为峰值信噪比(PSNR)。
图7A显示了在本发明基于区块的主成分分析方法中将影像分割成不同区块大小的情况下,量化到小数点0到20位的影像品质比较。当量化小数点大于第13位以后,不论区块大小如何改变,所还原的影像品质的峰值信噪比都不会提高,其中区块大小在32×32时的峰值信噪比最大。另外从图7B可看出在小数点12位以前,区块大小128×128的峰值信噪比最大。而在小数点12位以后,区块大小32×32的峰值信噪比最大。
表3为测是小数点量化在不同区块大小时,投影系数经由舍入程序(RoundingProcess)的还原品质测试结果。
表3:
区块大小 小数点第0位 小数点第1位
2×2 58.7529
4×4 58.9133
8×8 58.9348
16×16 60.2415
32×32
64×64
128x128
从表3可得知不论区块大小,本发明的主成分分析方法在小数点量化到第1位时,就可以在全部大小的区块都达到原始影像完全重建的效果,其峰值信噪比为无限大。
图8为本发明基于区块的主成分分析、未量化离散余弦转换(Discrete CosineTransform,DCT)及量化离散余弦转换(即,JPEG)数据量大小的比较图。
图8的横轴为峰值信噪比且纵轴为压缩率。在图8中,随着峰值信噪比的提高,基于区块的主成分分析的数据量比量化离散余弦转换的数据量大。但若将基于区块的主成分分析与未量化离散余弦转换的数据量大小作比较,如方形线与三角形线,在压缩率大于0.8的位置,基于区块的主成分分析与未量化离散余弦转换的还原影像品质(即,峰值信噪比)非常接近。当压缩率介于0.1到0.8之间时,基于区块的主成分分析的还原影像品质略优于未量化离散余弦转换的还原影像品质。当压缩率小于0.1时,由于基于区块的主成分分析所产生的投影系数与特征向量稍为大于原始数据量,因此在未进行任何更有效的量化演算法之前,基于区块的主成分分析的压缩率会呈现负值,表示数据量会比原本数据稍微增加。从基于区块的主成分分析与未量化离散余弦转换的数据量比较可以看出两者数据量大小极为类似。因此,有效的基于区块的主成分分析的量化演算法有其开发的必要。
表4为本发明基于区块的主成分分析与传统主成分分析的比较图。
表4:
表4比较了基于区块的主成分分析与传统主成分分析的计算处理时间成本、数据量及还原影像品质。在计算时间成本上,本发明基于区块的主成分分析可以有效加快处理速度。基于区块的主成分分析在分割区块大小为128×128时虽然计算量优于传统主成分分析,但数据量大于传统主成分分析取95%信赖水准。然而在分割区块大小小于64×64时,基于区块的主成分分析不但在计算量优于传统主成分分析,而其数据量也小于传统主成分分析取95%信赖水准,且重建资讯以峰值信噪比证实能够无失真的完全还原原始资讯。
图9为本发明基于区块的主成分分析方法的执行时间成本与重建所需数据量的比较图。
在图9中,横轴为区块大小,而传统PCA代表整个影像只有一个区块,也就是不对影像进行区块分割。左方的纵轴为数据量,其单位为2的n次方个64比特浮点数。右方的纵轴为花费时间,其单位为10的n次方秒。图9为表4中表格数据内容的示意图。
综上所述,本发明的主成分分析转换方法及其装置可对一维信号或二维信号做适当分割成多个帧或多个区块以获得对应的一维向量,计算一维向量的零平均向量并计算零平均向量的协方差矩阵,求出协方差矩阵的特征向量,再将零平均向量与特征向量相乘以获得投影系数作为本发明主成分分析的正转换输出。本发明还可通过逆转换将投影系数与特征向量的反矩阵相乘取回重建的零平均向量,将零平均向量加上均值以获得还原一维向量,最后将还原一维向量排成指定大小的帧或区块。此外,本发明的主成分分析转换方法还可在低数据量的前提下达到输入信号的完全还原,这是其他方法无法达到的目标。
虽然本发明已以实施例揭露如上,然其并非用以限定本发明,任何本领域技术人员,在不脱离本发明的精神和范围内,当可作些许的更动与润饰,故本发明的保护范围当视后附的申请专利范围所界定者为准。

Claims (10)

1.一种基于区块的主成分分析转换方法,其特征在于,包括:
获得输入信号;
分割该输入信号并获得对应分割后的该输入信号的多个一维向量,其中这些一维向量的数量为分割数量;
将这些一维向量排列成二维向量后,减去该分割数量的这些一维向量的均值以获得零平均向量;
计算该零平均向量的协方差矩阵;
计算该协方差矩阵的特征向量;以及
将该零平均向量与该特征向量相乘以获得投影系数。
2.如权利要求1所述的基于区块的主成分分析转换方法,其特征在于,该输入信号为一维信号,且分割该输入信号并获得对应分割后的该输入信号的这些一维向量的步骤包括:
将该一维信号分割为多个帧,并根据对应这些帧的多个取样点获得这些一维向量。
3.如权利要求2所述的基于区块的主成分分析转换方法,其特征在于,该一维信号一语音信号。
4.如权利要求1所述的基于区块的主成分分析转换方法,其特征在于,该输入信号为二维信号,且分割该输入信号并获得对应分割后的该输入信号的这些一维向量的步骤包括:
将该二维信号分割为多个区块,获得对应这些区块的多个像素的多个二维矩阵,并将这些二维矩阵转换为这些一维向量。
5.如权利要求4所述的基于区块的主成分分析转换方法,其特征在于,该二维信号为影像信号。
6.如权利要求1所述的基于区块的主成分分析转换方法,其特征在于,还包括:
将该投影系数与该特征向量的反矩阵相乘以获得重建零平均向量;
将该重建零平均向量加上该均值以获得还原一维向量;以及
将该还原一维向量排列为还原输入信号。
7.一种基于区块的主成分分析转换装置,其特征在于,包括:
处理器;以及
存储器,耦接到该处理器,其中该处理器
获得输入信号;
分割该输入信号并获得对应分割后的该输入信号的多个一维向量,其中这些一维向量的数量为分割数量;
将这些一维向量排列成二维向量后,减去分割数量的这些一维向量的均值以获得零平均向量;
计算该零平均向量的协方差矩阵;
计算该协方差矩阵的特征向量;以及
将该零平均向量与该特征向量相乘以获得投影系数。
8.如权利要求7所述的基于区块的主成分分析转换方法,其特征在于,该输入信号为一维信号,且该处理器将该一维信号分割为多个帧,并根据对应这些帧的多个取样点获得这些一维向量。
9.如权利要求7所述的基于区块的主成分分析转换方法,其特征在于,该输入信号为二维信号,且该处理器将该二维信号分割为多个区块,获得对应这些区块的多个像素的多个二维矩阵,并将这些二维矩阵转换为该一维向量。
10.如权利要求7所述的基于区块的主成分分析转换方法,其特征在于,该处理器将该投影系数与该特征向量的反矩阵相乘以获得重建零平均向量,将该重建零平均向量加上该均值以获得还原一维向量,并将该还原一维向量排列为还原输入信号。
CN201810252676.8A 2017-09-22 2018-03-26 基于区块的主成分分析转换方法及其装置 Pending CN109544557A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW106132684A TWI642291B (zh) 2017-09-22 2017-09-22 基於區塊的主成分分析轉換方法及其裝置
TW106132684 2017-09-22

Publications (1)

Publication Number Publication Date
CN109544557A true CN109544557A (zh) 2019-03-29

Family

ID=65034415

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810252676.8A Pending CN109544557A (zh) 2017-09-22 2018-03-26 基于区块的主成分分析转换方法及其装置

Country Status (4)

Country Link
US (1) US10664720B2 (zh)
JP (1) JP2019061671A (zh)
CN (1) CN109544557A (zh)
TW (1) TWI642291B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113706396B (zh) * 2020-05-21 2024-04-30 北京机械设备研究所 基于滑动窗函数的遥测图像降噪处理方法
CN113283011B (zh) * 2021-06-05 2022-05-03 申业 一种获取变速箱零件转速及负载的方法及系统
CN114397865B (zh) * 2021-12-24 2023-10-20 广州市香港科大霍英东研究院 一种回收料混合比例在线检测方法、装置及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530631A (zh) * 2012-07-06 2014-01-22 索尼电脑娱乐公司 图像处理装置及图像处理方法
JP2014116746A (ja) * 2012-12-07 2014-06-26 Samsung R&D Institute Japan Co Ltd 撮像装置、歪補正回路及び歪補正方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080130914A1 (en) * 2006-04-25 2008-06-05 Incel Vision Inc. Noise reduction system and method
US7358891B2 (en) * 2006-05-27 2008-04-15 Bae Systems Information And Electronic Systems Integration Inc. Multipath resolving correlation interferometer direction finding
US8077994B2 (en) * 2008-06-06 2011-12-13 Microsoft Corporation Compression of MQDF classifier using flexible sub-vector grouping
US9253560B2 (en) * 2008-09-16 2016-02-02 Personics Holdings, Llc Sound library and method
US8090146B2 (en) * 2009-01-15 2012-01-03 Google Inc. Image watermarking
US8848802B2 (en) * 2009-09-04 2014-09-30 Stmicroelectronics International N.V. System and method for object based parametric video coding
CN102510491A (zh) * 2011-09-13 2012-06-20 海南大学 一种基于dwt可抗几何攻击的医学图像多重水印方法
CN102567993B (zh) * 2011-12-15 2014-06-11 中国科学院自动化研究所 基于主成分分析的指纹图像质量评价方法
JP6028388B2 (ja) * 2012-05-11 2016-11-16 富士通株式会社 到来方向推定装置、及び到来方向推定方法
CN102722866B (zh) * 2012-05-22 2014-07-23 西安电子科技大学 基于主成份分析的压缩感知方法
CN103208097B (zh) * 2013-01-29 2015-09-30 南京理工大学 图像多方向形态结构分组的主分量分析协同滤波方法
WO2015138008A1 (en) * 2014-03-10 2015-09-17 Euclid Discoveries, Llc Continuous block tracking for temporal prediction in video encoding
WO2016015752A1 (en) 2014-07-29 2016-02-04 Hewlett-Packard Development Company, L.P. Method and apparatus for validity determination of a data dividing operation
US10056076B2 (en) * 2015-09-06 2018-08-21 International Business Machines Corporation Covariance matrix estimation with structural-based priors for speech processing
US20190087717A1 (en) * 2016-04-01 2019-03-21 Intel Corporation Four stable state neuron

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530631A (zh) * 2012-07-06 2014-01-22 索尼电脑娱乐公司 图像处理装置及图像处理方法
JP2014116746A (ja) * 2012-12-07 2014-06-26 Samsung R&D Institute Japan Co Ltd 撮像装置、歪補正回路及び歪補正方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
RAVI KIRAN等: "Region Based Medical Image compression Using Block-Based PCA", 《IEEE》 *

Also Published As

Publication number Publication date
TW201916626A (zh) 2019-04-16
TWI642291B (zh) 2018-11-21
US20190095755A1 (en) 2019-03-28
US10664720B2 (en) 2020-05-26
JP2019061671A (ja) 2019-04-18

Similar Documents

Publication Publication Date Title
Sandić-Stanković et al. DIBR synthesized image quality assessment based on morphological wavelets
CN105453132B (zh) 实施图像处理的信息处理设备和图像处理方法
CN109194959B (zh) 一种压缩感知成像方法、装置、设备、系统及存储介质
WO2008005950A2 (en) An apparatus and method for a generalized benford's law for analysis of dct and jpeg coefficients
CN109544557A (zh) 基于区块的主成分分析转换方法及其装置
CN107767337A (zh) 一种图像超分辨率重建方法、装置、移动终端及存储介质
CN112511824A (zh) 一种图像压缩采样方法及组件
Abu et al. An efficient compact Tchebichef moment for image compression
US20150296207A1 (en) Method and Apparatus for Comparing Two Blocks of Pixels
CN114651270A (zh) 通过时间可变形卷积进行深度环路滤波
CN116797510A (zh) 图像处理方法、装置、计算机设备和存储介质
CN104837014B (zh) 压缩图像的方法和图像处理设备
CN107154061B (zh) 一种分块压缩感知的正则化解码方法
Dhumal et al. Survey on comparative analysis of various image compression algorithms with singular value decomposition
Alexander et al. A simple, general model for the affine self-similarity of images
Fu et al. Screen content image quality assessment using Euclidean distance
CN111279392A (zh) 集群密度计算装置、集群密度计算方法以及集群密度计算程序
CN111669183B (zh) 一种压缩感知采样与重建方法、设备及存储介质
TWI622020B (zh) 使用二階區域二元圖的分群方法及疊代影像測試系統
CN116805370A (zh) 图像识别方法、装置及相关设备
CN103077396B (zh) 一种彩色图像的向量空间特征点提取方法及装置
Moon et al. Characterization of Transform-Based Lossy Compression for HPC Datasets
Wu et al. A new preprocessing algorithm used in color image compression
CN104952046B (zh) 基于统计的图像压缩感知低复杂度还原方法
Jeevan et al. Comparative study of DCT based image compression on hexagonal and conventional square pixel images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190329

WD01 Invention patent application deemed withdrawn after publication