TWI513291B - 影像處理的方法、裝置及電腦可讀取媒體 - Google Patents

影像處理的方法、裝置及電腦可讀取媒體 Download PDF

Info

Publication number
TWI513291B
TWI513291B TW102145947A TW102145947A TWI513291B TW I513291 B TWI513291 B TW I513291B TW 102145947 A TW102145947 A TW 102145947A TW 102145947 A TW102145947 A TW 102145947A TW I513291 B TWI513291 B TW I513291B
Authority
TW
Taiwan
Prior art keywords
image
frame
dictionary
buffer
high frequency
Prior art date
Application number
TW102145947A
Other languages
English (en)
Other versions
TW201524172A (zh
Inventor
Luo Wei Tsai
Guo Ruei Chen
Kual Zheng Lee
Original Assignee
Ind Tech Res Inst
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ind Tech Res Inst filed Critical Ind Tech Res Inst
Priority to TW102145947A priority Critical patent/TWI513291B/zh
Priority to US14/223,449 priority patent/US9268791B2/en
Publication of TW201524172A publication Critical patent/TW201524172A/zh
Application granted granted Critical
Publication of TWI513291B publication Critical patent/TWI513291B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20192Edge enhancement; Edge preservation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

影像處理的方法、裝置及電腦可讀取媒體
本揭露係關於一種影像處理(image processing)的方法、裝置及電腦可讀取媒體。
影響視訊串流的品質的關鍵因素之一為傳輸網路的頻寬。當視訊串流透過網路進行傳輸時,在有限頻寬的狀態下往往採用較低位元率的壓縮方式,從而容易使重建影像的視訊品質低落。此視訊品質低落的原因例如是,但不限定於重建影像時產生嚴重的區塊效應(blocking effect)影像、雜訊影像、或雨滴影像等。以區塊為基礎影像編解碼器廣泛地應用在影像壓縮上,例如JPEG、MPEG、以及H.264等皆為此類型的編解碼器。近年來利用稀疏表示法(sparse representation)來進行影像重建的技術可使得修復後的影像品質獲得明顯的提升。
稀疏表示法在影像處理上的應用廣泛,例如降低區塊效應、濾除雜訊、或去除雨滴等。稀疏表示法的技術事先準備大 量的參照影像來建立具代表性的影像特徵字典,並且以大量複雜的矩陣運算來建立此影像特徵字典,進而利用此影像特徵字典修補瑕疵影像。此類稀疏表示法需要有足夠的記憶體容量來儲存這些大量的參照影像,也需要足夠的負載來執行大量複雜的矩陣運算。
使用單一參照影像的稀疏表示法無須事先準備大量的參照影像,可擷取自身影像中有意義的部分進行字典學習。例如,有一技術擷取單張影像中不同方位的梯度資訊,並使用方向梯度直方圖(Histogram of Oriented Gradients,HOG)特徵,依照方位將此單張影像分解為雨滴與非雨滴兩部分進行字典學習,後續重建或修復影像則利用非雨滴字典進行影像中的雨滴去除。還有一技術將參照影像中的HOG特徵區分為水平與垂直兩部分進行影像字典訓練,並用於去除影像區塊效應。
在上述現行的重建或修復影像的技術中,有的技術事先收集大量自然影像來建立影像特徵字典,進而利用此影像特徵字典修補瑕疵影像。此類技術對於不同影像場景,難以適應於實際的應用情境。有的技術可避免事先收集大量參照影像,然而對於動態的視訊,每一影像畫面仍需要重新擷取內容並且訓練一影像字典。所以,能夠降低影像區塊效應的運算效能,並且能夠在少量參照記憶體需求下獲得良好的影像品質的技術是目前研發的重點。
本揭露的實施例可提供一種影像處理的方法與裝置。
本揭露的一實施例是關於一種影像處理的方法。此方法可包含;從輸入的多幀影像中,篩選出至少一影像並將輸入的此多幀影像儲存至一緩衝區,直到此緩衝區的一儲存空間達到一條件時;以及當此緩衝區的此儲存空間達到此條件時,對此緩衝區中多幀暫存影像執行一視訊處理程序,包括針對篩選出的此至少一影像,建立一影像字典,再依據此影像字典,對此緩衝區中此多幀暫存影像,進行一影像修復與重建程序,從而取得多幀重建後的影像。
本揭露的另一實施例是關於一種電腦可讀取媒體。電腦可讀取媒體具有數個指令。當前述指令被執行時,用以執行所述影像處理方法。
本揭露的又一實施例是關於一種影像處理的裝置。此裝置可包含一影像字典建立模組、一影像修復與重建模組、以及一記憶體。此影像字典建立模組從輸入的多幀影像中,篩選出至少一影像並將輸入的此多幀影像儲存至此記憶體中的一緩衝區,直到此緩衝區的一儲存空間達到一條件時,並且對於此緩衝區內的多幀暫存影像,將符合一影像相似度條件的至少一暫 存影像分解為至少一高頻影像與至少一低頻影像,並統計此至少一高頻影像的特徵分布用以建立一影像字典。此影像修復與重建模組依據此影像字典,對此緩衝區中多幀影像的多幀高頻影像進行修復,並結合多幀低頻影像與多幀修復後的高頻影像,從而取得多幀重建後的影像。
茲配合下列圖示、實施例之詳細說明及申請專利範圍,將上述及本發明之其他優點詳述於後。
110‧‧‧多幀影像
120‧‧‧篩選
130‧‧‧緩衝區
140‧‧‧視訊處理程序
142‧‧‧根據篩選出的此至少一影像,建立一影像字典
144‧‧‧依據此影像字典,對緩衝區中多幀暫存影像,進行一影像修復與重建程序
146‧‧‧多幀重建後的影像
Bdiff ‧‧‧差異量
i、k、p‧‧‧正整數
Mi,k ‧‧‧第k幀影像之第i區塊的平均值
Vi,k ‧‧‧第k幀影像之第i區塊的變異數
Mi,p ‧‧‧第p幀影像之第i區塊的平均值
Vi,p ‧‧‧第p幀影像之第i區塊的變異數
210‧‧‧一畫幀群組
205‧‧‧第k幀影
215‧‧‧第p幀影像
310‧‧‧將符合影像相似度條件的至少一暫存影像分解為至少一高頻影像與至少一低頻影像兩部分
320‧‧‧統計此至少一高頻影像的特徵分布
330‧‧‧利用此至少一高頻影像的特徵影像區塊進行一字典訓練,從而得到一影像字典
510‧‧‧高頻影像與低頻影像分解
520‧‧‧重建高頻影像
530‧‧‧影像結合
610‧‧‧修復後的影像區塊
620‧‧‧影像矩陣
605‧‧‧稀疏向量
700‧‧‧影像處理的裝置
710‧‧‧影像字典建立模組
720‧‧‧影像修復與重建模組
730‧‧‧記憶體
740‧‧‧視訊擷取裝置
第一圖是根據本揭露的一實施例,說明一影像處理的方法與一緩衝區協同運作的一示意圖。
第二圖是根據本揭露的一實施例,舉一範例說明多幀影像差異量的計算。
第三圖是根據本揭露的一實施例,說明基於畫幀群組來建立影像字典的運作流程。
第四A圖至第四C圖是根據本揭露的一實施例,說明統計影像特徵的一範例。
第五圖是根據本揭露的一實施例,說明使用影像字典之影像重建的運作流程。
第六圖是根據本揭露的一實施例,將影像特徵字典DHF_G 與其具有非零的稀疏向量係數進行一乘法運算,得到修復後的影像區塊的範例。
第七圖是根據本揭露的一實施例,說明一影像處理的裝置。
第八A圖至第八C圖是根據本揭露的一實施例,說明處理及重建監控影片中局部車牌的範例。
以下,參考伴隨的圖示,詳細說明依據本揭露的實施例,俾使本領域者易於瞭解。所述之發明創意可以採用多種變化的實施方式,當不能只限定於這些實施例。本揭露省略已熟知部分(well-known part)的描述,並且相同的參考號於本揭露中代表相同的元件。
依據本揭露的實施例,提供一種影像處理的技術,此技術利用一種動態調整的影像字典的學習機制,來篩選出具代表性的多幀影像,將滿足相似度運算的暫存影像進行高頻影像與低頻影像分解,並統計高頻影像的特徵分布,再利用這些特徵區塊影像建立影像字典。然後利用訓練所得的影像字典,針對修復影像(recovered image)的高頻影像進行修復,並將修復後的高頻影像與原始低頻影像相加,取得處理後的影像。在本揭露中,利用影像信號的最大值與影像中雜訊(noise)的比值,亦即峰值信噪比(Peak Signal-to-Noise Ratio,PSNR),以及結構上相似度(Structural Similarity,SSIM)作為視訊品質的量化指標,來衡量及驗證依據本揭露的實施例的可行性。PSNR值越大,代表視訊品質失真越少。SSIM值介於0和1之間,SSIM值越大, 代表與原始影像越接近。
第一圖是根據本揭露的一實施例,說明一影像處理的方法與一緩衝區協同運作的一示意圖。參考第一圖,從輸入的多幀影像110中,篩選120出至少一影像並將輸入的此多幀影像儲存至一緩衝區130,直到緩衝區130的儲存空間達到一條件。當緩衝區130的儲存空間達到此條件時,對緩衝區130中多幀暫存影像執行一視訊處理程序140,包括根據篩選出的此至少一影像,建立一影像字典(步驟142)、以及依據此影像字典,對緩衝區130中多幀暫存影像,進行一影像修復與重建程序(步驟144),從而取得多幀重建後的影像146。
依據本揭露的實施例,完成影像修復與重建程序後,此影像處理的方法可清空緩衝區130。緩衝區130的容量(儲存空間的大小)是可調整的,例如可依實際輸入的多幀影像110的特性、或是依實際應用的情境、或是依實際應用的需求等來調整緩衝區130的容量。緩衝區130的儲存空間符合該條件的情況例如是,但不限定於緩衝區130已屆滿時。
換句話說,此影像處理的方法是一種基於稀疏表示法的影像重建方法,並且可利用自我調適性(self-adaptive)、可動態使用畫幀群組(Group of Pictures,GOP)作為訓練影像字典的輸 入。此鄰近的畫幀群組中,可能有極大部分重複或高相似度的局部影像。所以,本揭露的實施例針對輸入的一系列的單幀影像110事先作篩選120,挑選出具代表性的多幀影像。在篩選120的過程中,可藉由計算一畫幀群組(GOP)210中兩幀影像(第k幀影像205與第p幀影像215)的一總差異量來決定是否捨棄前面第k幀、第k+1幀、…、第p-1幀的影像。當此總差異量小於一門檻值(threshold)時,則捨棄前面第k幀、第k+l幀、…、第p-1幀之影像。兩幀影像的總差異量是此兩幀影像在複數個區塊的差異量的加總,所述之複數個區塊例如是幀影像的所有區塊,或特定範圍的區塊等實施方式,以下以每一區塊為例說明,但不以此限制本申請。
第二圖是根據本揭露的一實施例,舉一範例說明兩幀影像之總差異量的計算。在第二圖的範例中,計算此差異量Bdiff 如下:Bdiff =[((Mi,k +Mi,p )/2)2 -((Vi,k +Vi,p )/2)2 ]2 /(Vi,k Vi,p ),其中,Mi,k 與Vi,k 分別是第k幀影像之第i區塊的平均值與變異數。Mi,p 與Vi,p 分別是第p幀影像之第i區塊的平均值與變異數。平均值與變異數只是一範例,也可以是其他統計量,例如平均絕對差(Mean Absolute Difference,MAD)、均方差(Mean Square Error,MSE)、最小化最大誤差值(Minimized Maximum Error,MME)等。第k幀影像與第p幀影像是同一畫幀群組210中的兩幀影像,i、k、p皆為正整數,k<p。兩幀影像的總差 異量小代表此兩幀影像的相似度高,也就是說,第p幀影像相似於第k幀影像。
當Bdiff 小於一門檻值Tb時,則第i區塊可被視為無明顯差異。依此,加總第k幀影像與第p幀影像中所有區塊的差異量,從而得到一總差異量。當此總差異量小於一門檻值Tf時,則後幀影像可被視為與前幀影像無明顯差異並且捨棄前面第k幀、第k+1幀、…、第p-1幀之影像。依此方式,比對緩衝區130中暫存影像的相似度,並且篩選出滿足一相似度比對條件(此範例為總差異量大於等於門檻值Tf)的一暫存影像集合。換句話說,緩衝區130中的暫存影像經篩選120後所挑選出的暫存影像集合是從輸入的一系列的單幀影像110中將那些極大部分重複或高相似度的影像濾除後,得到的剩餘影像組成的集合。
所以,依據本揭露的實施例,此影像處理的技術是一種基於稀疏表示法的影像重建技術,並且利用自我調適性、可動態使用鄰近的畫幀群組(GOP)作為影像特徵字典的學習機制。
第三圖是根據本揭露的一實施例,說明基於畫幀群組來建立影像字典的運作流程。在第三圖的運作流程中,對於緩衝區130中的多幀暫存影像,將符合影像相似度條件的至少一暫存影像分解為至少一高頻影像與至少一低頻影像兩部分(步驟 310),並且統計此至少一高頻影像的特徵分布(步驟320),然後利用此至少一高頻影像的特徵影像區塊進行一字典訓練,從而得到一影像字典(步驟330)。在步驟310中,可使用一低頻濾波器以取得此至少一暫存影像的低頻資訊。此低頻濾波器例如是但不限定於,均值濾波器(mean filter)、高斯濾波器、雙向濾波器(bilateral filter)、導向濾波器(guided filter)等。取得此至少一暫存影像的低頻資訊(即成為低頻影像)後,將原始的暫存影像與低頻影像相減,可得到高頻資訊。依此,將一原始的暫存影像I分解為高頻影像IHF 與低頻影像ILF ,可以式子表示為I=IHF +ILF
根據本揭露的一實施範例,低頻濾波器可採用導向濾波器取得暫時影像的低頻資訊。導向濾波器是一種強健的邊緣保留濾波器,可去除影像中的雜訊並可保留重要的邊緣資訊,同時可避免影像過渡模糊化,也就是說,可良好保存影像中的高頻部分與低頻部分。根據本揭露的實施例,利用高頻影像IHF 來訓練高頻影像字典DHF 。高頻影像字典DHF 可依據本身的幾何特性分解為兩個子字典DHF_G 與DHF_B ,分別代表高頻影像中具有關鍵特徵的部分與具有非關鍵特徵的部分。關鍵特徵是要被使用的特徵,例如梯度特徵。非關鍵特徵例如是區塊效應特徵、雜訊特徵等。DHF_G 稱為影像特徵字典,DHF_B 稱為非影像特徵字典。
區塊效應係指採用區塊壓縮方式的影像在被解碼後,在影像的邊際具有明顯的像素變化,所以可以合理推測影像在梯度上的變化在垂直與水平方向也具有明顯改變。一般常見的特徵擷取運算子例如是Daisy描述子、(Scale-invariant Feature Transform,SIFT)描述子、位置方向梯度直方圖(Gradient Location-Orientation Histogram,GLOH)描述子等。在步驟320中,統計高頻影像的特徵分布可使用HOG描述子作為影像修補(patch)的特徵描述並進行特徵統計。當使用HOG特徵描述子時,僅需統計訓練影像修補於水平及垂直方向的角度直方圖。
依此,第四A圖至第四C圖是根據本揭露的一實施例,說明統計影像特徵的一範例。其中,第四A圖是將一訓練影像分成16個區塊,此訓練影像修復的16個HOG特徵描述子,其中每一HOG特徵描述子描述一區塊的HOG特徵。第四B圖是將第四A圖中每一HOG特徵描述子量化成360度並取最大向量。第四C圖是第四B圖之水平方向的角度直方圖的一範例。在第四C圖的範例中,以水平方向的HOG特徵描述子為例,其角度變化取±5°的緩衝區間,亦即[355°,5°]和[175°,185°];若為垂直方向的HOG特徵描述子,則取樣區間為[85°,95°]和[265°,275°]。
在步驟330中,利用至少一高頻影像的特徵影像區塊進行 一字典訓練,可得到一高頻影像字典DHF 。此高頻影像字典DHF 可分為影像特徵字典DHF_G 與非影像特徵字典DHF_B 。當使用上述以HOG描述子作為影像修補的特徵描述來進行訓練時,非影像特徵字典DHF_B 可再細分為垂直區塊效應子字典DHF_BV 與水平區塊效應子字典DHF_BH ,此可表示為DHF_B ={DHF_BV ,DHF_BH }。
對於高頻影像字典DHF 的建立可採用如K-means、奇異值分解(k-means singular value decomposition,K-SVD)、線上字典學習(Online dictionary learning)等方法進行。根據本揭露的一實施例,使用正交匹配追蹤(orthogonal Matching Pursuit,OMP)演算法進行稀疏編碼來修復影像。第五圖是根據本揭露的一實施例,說明使用影像字典之影像重建的運作流程。參考第五圖的運作流程,在高頻影像與低頻影像分解(步驟510)中,一原始的暫存影像可被分解為一高頻影像IHF 與一低頻影像ILF 。在重建高頻影像(步驟520)中,對於一高頻影像IHF 中欲修復的影像區塊,可對高頻影像字典DHF 的影像特徵字典DHF_G 使用正交匹配追蹤(orthogonal Matching Pursuit,OMP)演算法進行稀疏編碼(也就是,將影像特徵字典DHF_G 中具有非零的稀疏向量係數與影像特徵字典DHF_G 進行一乘法運算)得到修復後的影像區塊,從而得到修復後的高頻影像。也就是說,對高頻影像字典DHF 的影像特徵字典DHF_G 進行稀疏編碼,得到高頻影像IHF 中修復後的一或多個影像區塊,從而得到一修復後的高頻影像。 在影像結合(步驟530)中,結合一低頻影像ILF 與一修復後的高頻影像,而獲得一重建後的影像,此範例可用式子表示如下:重建後的影像=低頻影像ILF +修復後的高頻影像。
第六圖是根據本揭露的一實施例,將影像特徵字典DHF_G 與其具有非零的稀疏向量係數進行一乘法運算,得到修復後的影像區塊的範例。在第六圖的範例中,稀疏向量605只有兩個非零的係數1(即第三元素與第八元素)。修復後的影像區塊610以區塊中各像素的像素值來表示。影像特徵字典DHF_G 的範例以一影像矩陣620中各像素的像素值來表示。所以,修復後的影像區塊610的第一像素的像素值等於25×1+15×1=40,依此類推,修復後的影像區塊610的第五像素的像素值等於20×1+5×1=25。
根據本揭露的又一實施例,在重建高頻影像中,對於一高頻影像IHF 中欲修復的影像區塊,也可對高頻影像字典DHF ,統計高頻影像IHF 的一特定特徵分布來建立一特定屬性的影像字典,再利用訓練所得的該特定屬性的影像字典,針對該高頻影像IHF 的局部區域進行修復,來處理及重建原始影像(例如一車輛或人)中的局部區域(例如局部車牌或人臉影像)。
承上述,第七圖是根據本揭露的一實施例,說明一影像處理的裝置。參考第七圖,影像處理的裝置700可包含一影像字 典建立模組710、一影像修復與重建模組720、以及一記憶體730。裝置700可與記憶體730中的緩衝區130協同運作。影像字典建立模組710從輸入的多幀影像中,篩選出至少一影像並將輸入的此多幀影像儲存至緩衝區130,並依據緩衝區130的容量決定是否進行一影像字典學習。當緩衝區130的一儲存空間達到一條件時,對於緩衝區130中的多幀暫存影像,將符合一影像相似度條件的至少一暫存影像分解為至少一高頻影像與至少一低頻影像,並且統計此至少一高頻影像的特徵分布用以建立此影像字典。影像修復與重建模組720依據此影像字典,對緩衝區130中多幀暫存影像的多幀高頻影像進行修復,並結合多幀低頻影像與多幀修復後的高頻影像,從而取得多幀重建後的影像146。
在影像處理的裝置700中,影像字典建立模組710與影像修復與重建模組720例如可由一處理器或積體電路來實現;輸入的多幀影像例如可由一視訊擷取裝置740來取得連續的一系列的單幀影像。裝置700可使用一鄰近的畫幀群組作為訓練此影像字典的輸入。影像字典建立的細節以及影像修復與重建的細節已載述於上述實施例中,此處不再重述。
根據本揭露的一實施例,此影像處理的技術可以只參照畫幀群組中的畫幀作為字典訓練的參照影像,原則上,可以節省儲存暫存影像之緩衝區的記憶體空間,並且可以加速後續影像 重建的運算時間。
以每100個畫幀為一群組為例,依據本揭露的實施例,針對一標準實驗影片(例如有300個畫幀)僅需訓練3個影像字典,就可用來重建此標準實驗影片的全部影像;並且在多種不同壓縮率(例如32、64、以及128每秒千位元(kbps)等)條件下,利用影像信號的最大值與影像中雜訊的比值(PSNR),作為這些重建影像之視訊品質的評估標準,以及使用結構相似度(SSIM)品質指標進行分析,此SSIM品質指標使用亮度、對比、以及結構共三種不同因素的組合,作為兩兩影像相似程度的度量。
依據本揭露的實施例,除了可調整視訊品質,還可以處理重建監控影片中局部車牌、人臉影像等。第八A圖至第八C圖是根據本揭露的一實施例,說明處理及重建監控影片中局部車牌的一範例。其中,第八A圖是一路口監控畫面中的原始車牌影像。第八B圖是使用x264壓縮破壞後的低畫質影像。第八C圖是根據本揭露實施例,重建後的修復影像。
綜上所述,依據本揭露的實施例提供一種影像處理的方法與裝置。其技術包含一動態調整的影像字典學習機制,取得一系列的連續影像後,存入一緩衝區中,並依據此緩衝區的容量決定是否進行影像字典學習。再使用此緩衝區中的暫存影像,計算這些暫存影像的差異量。將滿足差異性的至少一暫存影像 分解成至少一高頻影像與至少一低頻影像,並統計此至少一高頻影像的特徵分布,用以建立特定屬性的影像字典。利用此訓練所得的特定屬性的影像字典,修復此緩衝區中多幀暫存影像的高頻影像,並結合多幀低頻影像與多幀修復後的高頻影像,取得多幀重建後的影像。
前述影像處理方法可由電腦可讀取媒體之指令來實現。 當電腦讀取電腦可讀取媒體之指令時,能執行前述影像處理方法。電腦可讀取媒體例如為軟碟、硬碟、光碟(CD)、光碟-唯讀記憶體(CD-ROM)、光碟可覆寫式(CD-RW)、唯讀記憶體(ROM)、隨機存取記憶體(RAM)、可抹除可規劃唯讀記憶體(EPROM)、可電氣抹除可規劃唯讀記憶體(EEPROM)或快閃記憶體等。電腦可包括任何合宜的處理平台、裝置或系統、運算平台、裝置或系統。
以上所述者僅為依據本揭露的實施範例,當不能依此限定本揭露實施之範圍。即大凡發明申請專利範圍所作之均等變化與修飾,皆應仍屬本揭露專利涵蓋之範圍。
110‧‧‧多幀影像
120‧‧‧篩選
130‧‧‧緩衝區
140‧‧‧視訊處理程序
142‧‧‧根據篩選出的此至少一影像,建立一影像字典
144‧‧‧依據此影像字典,對緩衝區中多幀暫存影像,進行一 影像修復與重建程序
146‧‧‧多幀重建後的影像

Claims (20)

  1. 一種影像處理的方法,包含:從輸入的多幀影像中,篩選出至少一影像並將輸入的該多幀影像儲存至一緩衝區,直到該緩衝區的一儲存空間達到一條件時;以及當該緩衝區的該儲存空間達到該條件時,對該緩衝區中多幀暫存影像執行一視訊處理程序,包括根據篩選出的該至少一影像,建立一影像字典,再依據該影像字典,對該緩衝區中該多幀暫存影像,進行一影像修復與重建程序,從而取得多幀重建後的影像。
  2. 如申請專利範圍第1項所述之方法,其中在該篩選的過程中,該方法係藉由計算一畫幀群組中第k幀影像與第p幀影像的一相似度來決定是否捨棄前面第k幀、第k+1幀、…、第p-1幀之影像,當該對第k幀影像與第p幀影像的一總差異量小於一門檻值時,則捨棄前面第k幀、第k+1幀、…、第p-1幀的影像,p大於k,其中k、p為正整數。
  3. 如申請專利範圍第2項所述之方法,其中該總差異量是第k幀影像與第p幀影像的複數個區塊的一差異量的加總,並且該總差異量小於該門檻值時,代表該第p幀影像相似於該第k幀影像。
  4. 如申請專利範圍第3項所述之方法,其中該方法還包括:比對該緩衝區中該多幀暫存影像的該相似度,並且篩選出 滿足一相似度比對條件的一暫存影像集合,該相似度比對條件為該總差異量大於等於該門檻值。
  5. 如申請專利範圍第1項所述之方法,其中該方法使用一鄰近的畫幀群組作為訓練該影像字典的輸入。
  6. 如申請專利範圍第1項所述之方法,其中該緩衝區的該儲存空間的大小是可調整的。
  7. 如申請專利範圍第1項所述之方法,其中建立該影像字典還包括:對於該緩衝區中該多幀暫存影像,將符合一影像相似度條件的至少一暫存影像分解為至少一高頻影像與至少一低頻影像,並且統計該至少一高頻影像的一特徵分布,然後利用該至少一高頻影像的多個特徵影像區塊進行一字典訓練,從而得到該影像字典。
  8. 如申請專利範圍第1項所述之方法,其中進行該影像修復與重建程序還包括:將該緩衝區中該多幀暫存影像分解為多幀高頻影像與多幀低頻影像,並且利用至少一高頻影像來訓練一高頻影像字典;對該高頻影像字典的一影像特徵字典進行一稀疏編碼,得到該多幀高頻影像中修復後的一或多個影像區塊,從而得到多幀修復後的高頻影像;以及結合該多幀低頻影像與該多幀修復後的高頻影像,從而取得該多幀重建後的影像。
  9. 如申請專利範圍第1項所述之方法,其中該方法還包括:清空該緩衝區。
  10. 如申請專利範圍第8項所述之方法,其中該影像特徵字典係該至少一高頻影像中具有關鍵特徵的部分。
  11. 如申請專利範圍第7項所述之方法,其中該特徵分布係一特定特徵分布,該影像字典係一特定屬性的影像字典。
  12. 一種影像處理的裝置,包含:一影像字典建立模組,從輸入的多幀影像中,篩選出至少一影像並將輸入的該多幀影像儲存至一緩衝區,直到該緩衝區的一儲存空間達到一條件時,對於該緩衝區中多幀暫存影像,將符合一影像相似度條件的至少一暫存影像分解為至少一高頻影像與至少一低頻影像,並統計該至少一高頻影像的一特徵分布用以建立一影像字典;以及一影像修復與重建模組,依據該影像字典,對該緩衝區中該多幀暫存影像的多幀高頻影像進行修復,並結合多幀低頻影像與多幀修復後的高頻影像,從而取得多幀重建後的影像。
  13. 如申請專利範圍第12項所述之裝置,其中該影像字典建立模組與該影像修復與重建模組係以一處理器或一積體電路來實現。
  14. 如申請專利範圍第12項所述之裝置,其中該輸入的多幀影像係利用一視訊擷取裝置來取得連續的一系列的單幀影像。
  15. 如申請專利範圍第12項所述之裝置,其中該裝置使用一鄰近的畫幀群組作為訓練該影像字典的輸入。
  16. 如申請專利範圍第12項所述之裝置,其中該緩衝區的該儲存空間的大小是可調整的。
  17. 如申請專利範圍第12項所述之裝置,其中該影像字典建立模組藉由計算一畫幀群組中第k幀影像與第p幀影像的相似度來決定是否捨棄前面第k幀、第k+1幀、…、第p-1幀之影像,當該對第k幀影像與第p幀影像的一總差異量小於一門檻值時,則捨棄前面第k幀、第k+1幀、…、第p-1幀的影像,p大於k,其中k、p為正整數。
  18. 如申請專利範圍第17項所述之裝置,其中該總差異量是第k幀影像與第p幀影像的複數個區塊的一差異量的加總,並且該總差異量小於該門檻值時,代表該第p幀影像相似於該第k幀影像。
  19. 如申請專利範圍第12項所述之裝置,其中該影像字典建立模組利用該至少一高頻影像的特徵影像區塊進行一字典訓練,得到一高頻影像字典,該高頻影像字典分為一影像特徵字典與一非影像特徵字典。
  20. 一種電腦可讀取媒體,具有複數個指令,該些指令用以執行如申請專利範圍第1項所述之影像處理的方法。
TW102145947A 2013-12-12 2013-12-12 影像處理的方法、裝置及電腦可讀取媒體 TWI513291B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW102145947A TWI513291B (zh) 2013-12-12 2013-12-12 影像處理的方法、裝置及電腦可讀取媒體
US14/223,449 US9268791B2 (en) 2013-12-12 2014-03-24 Method and apparatus for image processing and computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW102145947A TWI513291B (zh) 2013-12-12 2013-12-12 影像處理的方法、裝置及電腦可讀取媒體

Publications (2)

Publication Number Publication Date
TW201524172A TW201524172A (zh) 2015-06-16
TWI513291B true TWI513291B (zh) 2015-12-11

Family

ID=53368697

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102145947A TWI513291B (zh) 2013-12-12 2013-12-12 影像處理的方法、裝置及電腦可讀取媒體

Country Status (2)

Country Link
US (1) US9268791B2 (zh)
TW (1) TWI513291B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI513291B (zh) * 2013-12-12 2015-12-11 Ind Tech Res Inst 影像處理的方法、裝置及電腦可讀取媒體
JP2016127475A (ja) * 2015-01-06 2016-07-11 株式会社リコー 画像処理システム、画像処理方法、及びプログラム
CN105654092B (zh) 2015-11-25 2019-08-30 小米科技有限责任公司 特征提取方法及装置
US11037276B2 (en) 2016-08-26 2021-06-15 Nokia Technologies Oy Method, apparatus and computer program product for removing weather elements from images
KR102050780B1 (ko) * 2018-01-10 2019-12-02 한국과학기술원 신경망을 이용한 컨텐츠 인지 기반 컨텐츠 전송 서버 장치 및 방법
CN113255571B (zh) * 2021-06-16 2021-11-30 中国科学院自动化研究所 抗jpeg压缩的伪造图像检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW325635B (en) * 1996-04-24 1998-01-21 Sony Corp Method and apparatus for blocking effect reduction in images by post-processing in the spatial domain an apparatus and method for post processing image data which previously was encoded using a discrete cosine transform in order to remove resulting blocking effects.
TW452710B (en) * 1998-10-30 2001-09-01 Intel Corp A computer product and a method for sparse matrices
US20090010501A1 (en) * 2007-07-05 2009-01-08 Sony Corporation Image processing apparatus and image processing method
TW201028018A (en) * 2009-01-07 2010-07-16 Ind Tech Res Inst Encoder, decoder, encoding method and decoding method
TW201101846A (en) * 2009-06-22 2011-01-01 Thomson Licensing Phase refinement for image prediction based on sparse representation

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8090028B2 (en) 2004-05-21 2012-01-03 Broadcom Corporation Video deblocking memory utilization
CN101421935B (zh) 2004-09-20 2011-05-25 Divx公司 视频去块滤波器
WO2006106508A2 (en) * 2005-04-04 2006-10-12 Technion Research & Development Foundation Ltd. System and method for designing of dictionaries for sparse representation
CN101779464B (zh) * 2007-06-08 2014-02-12 汤姆森特许公司 多格点基于稀疏性滤波基础上环内去伪像滤波方法和装置
US7965900B2 (en) 2007-09-26 2011-06-21 Hewlett-Packard Development Company, L.P. Processing an input image to reduce compression-related artifacts
US20090198716A1 (en) * 2008-02-04 2009-08-06 Shawn Allen Howarth Method of building a compression dictionary during data populating operations processing
US8866936B2 (en) * 2008-07-24 2014-10-21 Florida State University of Research Foundation Systems and methods for training an active random field for real-time image denoising
US8290251B2 (en) * 2008-08-21 2012-10-16 Adobe Systems Incorporated Image stylization using sparse representation
CN102088606B (zh) 2011-02-28 2012-12-05 西安电子科技大学 基于稀疏表示的去块效应方法
US8494305B2 (en) * 2011-12-20 2013-07-23 Mitsubishi Electric Research Laboratories, Inc. Image filtering by sparse reconstruction on affinity net
KR102080859B1 (ko) * 2013-04-08 2020-02-24 삼성전자주식회사 이미지 프로세서 및 이미지 프로세서의 이미지 처리 방법
TWI513291B (zh) * 2013-12-12 2015-12-11 Ind Tech Res Inst 影像處理的方法、裝置及電腦可讀取媒體
US9300865B2 (en) * 2014-01-24 2016-03-29 Goodrich Corporation Random imaging

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW325635B (en) * 1996-04-24 1998-01-21 Sony Corp Method and apparatus for blocking effect reduction in images by post-processing in the spatial domain an apparatus and method for post processing image data which previously was encoded using a discrete cosine transform in order to remove resulting blocking effects.
TW452710B (en) * 1998-10-30 2001-09-01 Intel Corp A computer product and a method for sparse matrices
US20090010501A1 (en) * 2007-07-05 2009-01-08 Sony Corporation Image processing apparatus and image processing method
TW201028018A (en) * 2009-01-07 2010-07-16 Ind Tech Res Inst Encoder, decoder, encoding method and decoding method
TW201101846A (en) * 2009-06-22 2011-01-01 Thomson Licensing Phase refinement for image prediction based on sparse representation

Also Published As

Publication number Publication date
TW201524172A (zh) 2015-06-16
US9268791B2 (en) 2016-02-23
US20150169632A1 (en) 2015-06-18

Similar Documents

Publication Publication Date Title
TWI513291B (zh) 影像處理的方法、裝置及電腦可讀取媒體
Xu et al. No-reference video quality assessment via feature learning
Ravi et al. Compression noise based video forgery detection
US7804896B2 (en) Content adaptive noise reduction filtering for image signals
RU2009127749A (ru) Сжатие и снятие сжатия изображения
US9843815B2 (en) Baseband signal quantizer estimation
US9245354B2 (en) System and method having transparent composite model for transform coefficients
WO2022143421A1 (zh) 噪声强度估计方法、装置及电子设备
CN113674165A (zh) 图像处理方法、装置、电子设备、计算机可读存储介质
Wang et al. Scalable facial image compression with deep feature reconstruction
CN114586359A (zh) 一种图像处理方法及装置
CN116363554A (zh) 一种监控视频关键帧提取方法、系统、介质、设备及终端
CN111445424A (zh) 图像处理和移动终端视频处理方法、装置、设备和介质
CN104021523A (zh) 一种基于边缘分类的图像超分辨率放大的新方法
CN113379858A (zh) 一种基于深度学习的图像压缩方法及装置
JP2006148878A (ja) 画像中の画素を分類する方法
Ma et al. Surveillance video coding with vehicle library
Su et al. Multimedia source identification using an improved weight photo response non-uniformity noise extraction model in short compressed videos
Manasa et al. A perceptually motivated no-reference video quality assessment algorithm for packet loss artifacts
CN112911298B (zh) 一种基于边界效应的hevc视频双压缩检测方法及系统
JP2005318614A (ja) 入力画像中のアーチファクトを低減する方法
KR20220070866A (ko) 딥러닝 기술이 적용된 영상 개선 방법, 장치 및 프로그램
KR101780444B1 (ko) 영상 신호의 노이즈 제거 방법
JP2006140999A (ja) 画像中の画素をフィルタリングする方法
CN113766250B (zh) 一种基于采样重构和特征增强的压缩图像质量提升方法