TWI559255B - Visual illusion analysis device, visual illusion adding image generating device, visual illusion analysis method, visual illusion adding image generation method, and program - Google Patents

Visual illusion analysis device, visual illusion adding image generating device, visual illusion analysis method, visual illusion adding image generation method, and program Download PDF

Info

Publication number
TWI559255B
TWI559255B TW102135306A TW102135306A TWI559255B TW I559255 B TWI559255 B TW I559255B TW 102135306 A TW102135306 A TW 102135306A TW 102135306 A TW102135306 A TW 102135306A TW I559255 B TWI559255 B TW I559255B
Authority
TW
Taiwan
Prior art keywords
decomposition
coefficient
image
image data
optical illusion
Prior art date
Application number
TW102135306A
Other languages
English (en)
Other versions
TW201419213A (zh
Inventor
Hitoshi Arai
Shinobu Arai
Original Assignee
Japan Science & Tech Agency
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Science & Tech Agency filed Critical Japan Science & Tech Agency
Publication of TW201419213A publication Critical patent/TW201419213A/zh
Application granted granted Critical
Publication of TWI559255B publication Critical patent/TWI559255B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • H04N1/6002Corrections within particular colour systems
    • H04N1/6005Corrections within particular colour systems with luminance or chrominance signals, e.g. LC1C2, HSL or YUV
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/001Texturing; Colouring; Generation of texture or colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/10Image enhancement or restoration using non-spatial domain filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/92Dynamic range modification of images or parts thereof based on global image properties
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20064Wavelet transform [DWT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Description

視錯覺的分析裝置、視錯覺添加影像產生裝置、視錯覺的分析方法、視錯覺添加影像產生方法、及程式
本發明係有關視錯覺的分析裝置、視錯覺添加影像產生裝置、視錯覺的分析方法、視錯覺添加影像產生方法、及程式。
習知技術中已發現會發生色彩的對比視錯覺的圖形等(參照下述之非專利文獻1)。19世紀,時任法國皇家掛毯製作所的染色研究部門監督之職的化學家謝佛勒(Chevreul)注意到明明是按照委託的配色製作的掛毯,看起來卻會有差異。當觀看謝佛勒視錯覺等的視錯覺圖形時會發生視錯覺現象,像是色彩和輝度等會被辨識成與實際上不同或是會看成實際上並沒有的色彩和輝度。
此外,下述之非專利文獻2所記載的方法中係揭示就人類初期視覺資訊處理的數理模型而言採用最大重複雙正交小波濾波器組(wavelet filter bank),對原影像進行非線性處理。此外,就人類視覺皮質的簡單細胞的數理模型而言,已開發出稱為風車小波框 (pinwheel wavelet frame)(參照下述之非專利文獻4)、簡單風車小框(simple pinwheel framelet)(參照下述之非專利文獻3)、風車小框的方位選擇性小波框,利用於影像解析等。此外,關於人類的視覺,在腦神經科學方面,有人提出了大腦皮質存在色彩.輝度細胞的實驗結果報告(參照下述之非專利文獻5)。
先前技術文獻 非專利文獻
非專利文獻1 「視錯覺插圖集」新井仁之著,三秀舍2007年出版
非專利文獻2 Hitoshi Arai, “A Nonlinear Model of Visual Information Processing Based on Discrete Maximal Overlap Wavelets”, Interdisciplinary Information Sciences, Vol. 11, No. 2, pp. 177~190 (2005).
非專利文獻3 Hitoshi Arai and Shinobu Arai, 2D tight framelets with orientation selectivity suggested by vision science, JSIAM Letters Vol.1, pp.9~12 (2009).
非專利文獻4 Hitoshi Arai and Shinobu Arai, Finite discrete, shift-invariant, directional filterbanks for visual information processing, I:construction,Interdisciplinary Information Sciences, Vol. 13, No.2, pp.255~273 (2007).
非專利文獻5 E.N.Johnson,M.J.Hawken and R. Shapley, The spatial transformation of color in the primary visual cortex of the macaque monkey, Nature Neuroscience, Vol.4, No.4, pp.409~416 (2001).
然而,習知技術中,影像實際上看起來是怎樣係取決觀看者的主觀,有無法定量化的問題點。尤其是對於與汽車等相關的工業設計師和與建築物等相關的室內設計師等負責配色的人員來說,係有就算意識到配色的結果對顧客來說,看起來並非能夠如自己原本所意圖般,但向來仍只能依靠專業經驗上所習得的技術來調整配色的問題點。
本發明乃係鑒於上述問題點而研創,目的在於提供能夠針對任意影像將可能發生的視錯覺量予以定量化或產生添加視錯覺量的影像之視錯覺的分析裝置、視錯覺添加影像產生裝置、視錯覺的分析方法、視錯覺添加影像產生方法及程式。
為了達成上述目的,本發明人在致力研究後,基於如下的想法完成了本發明。亦即,人類的視覺原本就會進行使想看的部分看得很清楚的資訊處理。人類會辨識出各種視錯覺,咸認為是視覺資訊處理的結果。此時,若數理模型接近人類的視覺資訊處理,則安裝有數理模型的計算機應當也能算出視錯覺。因此,本發明人想出藉由使用成功模擬明暗的視錯覺和色彩的對比視錯覺的數理模型,對原影像施行接近人類視覺的資 訊處理,製作出人類腦內所辨識到的影像,再藉由將其與原影像進行比對,便能夠將視錯覺予以數值化,從而完成了本發明。此外,基於同樣的原理,也能夠獲得預先添加有人類的視覺資訊處理會附加的視錯覺量之影像(視錯覺添加影像),使其在人類腦內辨識如原影像。
亦即,本發明的視錯覺的分析裝置係至少具備記憶部與控制部,該視錯覺的分析裝置的特徵為:前述記憶部係具備:濾波器記憶手段,係記憶屬於無方位性的近似濾波器及複數個具各方位性的細節濾波器之集合的方位選擇性小波框或方位選擇性濾波器組;及影像資料(data)記憶手段,係記憶影像資料;前述控制部係具備:分解手段,係藉由前述方位選擇性小波框或前述方位選擇性濾波器組對前述影像資料的色成分進行多重解析度分解而取得次頻帶信號;重建手段,係將藉由前述分解手段取得的前述次頻帶信號相加,藉此重建影像而取得重建影像資料;及視錯覺量數值化手段,係算出前述影像資料與前述重建影像資料間的前述色成分之比或差,藉此將視錯覺量予以數值化;前述分解手段係進一步具備:係數處理手段,係於前述多重解析度分解的分解期(phase)與合成期之間,對前述分解期輸出的分解細節係數進行下述的係數處理:由該分解細節係數所決定的能量(energy)愈大,愈是將該分解細節係數的大小比預定數值小的值抑制得更小,而該分解細節係數的大小比預定數值大的值係增強成更大,由該分解細節係數所決定的能量愈小,愈是將該分解細節係數的大小比預定數值小的值增強,而該分解細節係數的大小比預定數值大的值係抑制成更小。
此外,本發明係在前述記載的視錯覺的分析裝置中,前述係數處理手段係依前述分解細節係數的正負號之差異而進行個別的處理。
此外,本發明係在前述記載的視錯覺的分析裝置中,前述色成分係CIELAB色空間的L*、a*、b*其中一者。
此外,本發明係在前述記載的視錯覺的分析裝置中,前述視錯覺量數值化手段係使用色差,即使用L*的值、a*的值及b*的值於前述影像資料與前述重建影像資料間之差的平方總和的平方根進行計算作為前述視錯覺量。
此外,本發明係在前述記載的視錯覺的分析裝置中,前述係數處理手段係進行針對前述影像資料的a*及/或b*的色成分進行下述修正的前述係數處理:從a*及/或b*的前述分解細節係數與L*的前述分解細節係數而定的能量愈大愈將小的值抑制得更小,前述能量愈小愈將小的值增強。
此外,本發明係在前述記載的視錯覺的分析裝置中,前述係數處理手段係使用當前述分解細節係數的能量大時呈S字曲線自動連續變化,當前述能量小時呈N字曲線自動連續變化的函數進行前述係數處理。
此外,本發明係在前述記載的視錯覺的分析裝置中,前述係數處理手段係於前述分解期與前述合成期之間,正規化前述分解細節係數,以正規化後的前述分解細節係數即正規化分解細節係數之範數作為前述能量,對該正規化分解細節係數進行前述係數處理,再對經係數處理後的前述正規化分解細節係數進行前述正規化的逆運算。
此外,本發明係在前述記載的視錯覺的分析裝置中,前述分解手段係使用前述方位性為水平方向、垂直方向、對角方向構成的雙正交小波濾波器組或前述方位性為多方向的風車小框進行前述多重解析度分解。
此外,本發明係在前述記載的視錯覺的分析裝置中,前述分解手段係於前述多重解析度分解中,亦可使用其他濾波器組,例如依階數(level)進行風車小框的次數(degree)之改變等的濾波器組。
此外,本發明係在前述記載的視錯覺的分析裝置中,藉由前述分解手段進行的前述多重解析度分解係為最大重複多重解析度分解、最大抽減(decimated)多重解析度分解或部分抽減部分重複多重解析度分解。
此外,本發明係在前述記載的視錯覺的分析裝置中,前述控制部係進一步具備影像編輯手段,該影像編輯手段係編輯前述影像資料,並進行下述控制:針對經編輯的前述影像資料藉由前述分解手段進行前述多重解析度分解;前述視錯覺量數值化手段係計算從經編輯的前述影像資料取得的前述重建影像資料與未編輯的前述影像資料間之比或差作為前述視錯覺量;前述影像編輯手段係進行使前述視錯覺量變小的反覆編輯。
此外,本發明係在前述記載的視錯覺的分析裝置中,前述控制部係進一步具備影像編輯手段,該影像編輯手段係編輯前述影像資料,並進行下述控制:針對經編輯的前述影像資料藉由前述分解手段進行前述 多重解析度分解;前述視錯覺量數值化手段係計算經編輯的前述影像資料與從該經編輯的前述影像資料取得的前述重建影像資料間之比或差作為前述視錯覺量;前述影像編輯手段係進行使前述視錯覺量成為預定數值的反覆編輯。
此外,本發明係關於視錯覺添加影像產生裝置者,本發明的視錯覺添加影像產生裝置係至少具備記憶部與控制部,該視錯覺添加影像產生裝置的特徵為:前述記憶部係具備:濾波器記憶手段,係記憶屬於無方位性的近似濾波器及複數個具各方位性的細節濾波器之集合的方位選擇性小波框或方位選擇性濾波器組;及影像資料記憶手段,係記憶影像資料;前述控制部係具備:分解手段,係藉由前述方位選擇性小波框或前述方位選擇性濾波器組對前述影像資料進行多重解析度分解而取得次頻帶信號;及重建手段,係將藉由前述分解手段取得的前述次頻帶信號相加,藉此重建影像而取得重建影像資料;前述分解手段係進一步具備:係數處理手段,係於前述多重解析度分解的分解期與合成期之間,對前述分解期輸出的分解細節係數進行下述的係數處理:該分解細節係數的能量愈大愈將小的值增強,該分解細節係數的能量愈小愈將小的值抑制得更小。
此外,本發明的視錯覺添加影像產生裝置係在前述記載的視錯覺添加影像產生裝置中,前述係數處理手段係依前述分解細節係數的正負號之差異而進行個別的處理。
此外,本發明的視錯覺添加影像產生裝置係在前述記載的視錯覺添加影像產生裝置中,前述影像資料的色成分係CIELAB色空間的L*、a*、b*其中一者。
此外,本發明的視錯覺添加影像產生裝置係在前述記載的視錯覺添加影像產生裝置中,前述係數處理手段係進行針對前述影像資料的a*及/或b*的色成分進行下述修正的前述係數處理:從a*及/或b*的前述分解細節係數與L*的前述分解細節係數而定的能量愈大愈將小的值增強,前述能量愈小愈將小的值抑制得更小。
此外,本發明的視錯覺添加影像產生裝置係在前述記載的視錯覺添加影像產生裝置中,前述係數處理手段係使用當前述分解細節係數的能量大時呈N字曲線自動連續變化,當前述能量小時呈S字曲線自動連續變化的函數進行前述係數處理。
此外,本發明的視錯覺添加影像產生裝置係在前述記載的視錯覺添加影像產生裝置中,前述係數處理手段係於前述分解期與前述合成期之間,正規化前述分解細節係數,以正規化後的前述分解細節係數即正規化分解細節係數之範數作為前述能量,對該正規化分解細節係數進行前述係數處理,再對經係數處理後的前述正規化分解細節係數進行前述正規化的逆運算。
此外,本發明的視錯覺添加影像產生裝置係在前述記載的視錯覺添加影像產生裝置中,前述分解手段係使用前述方位性為由水平方向、垂直方向、對角 方向構成的雙正交小波濾波器組或前述方位性為多方向的風車小框進行前述多重解析度分解。
此外,本發明的視錯覺添加影像產生裝置係在前述記載的視錯覺添加影像產生裝置中,前述分解手段係於前述多重解析度分解中,亦可使用其他濾波器組,例如依階數進行風車小框的次數之改變等的濾波器組。
此外,本發明的視錯覺添加影像產生裝置係在前述記載的視錯覺添加影像產生裝置中,藉由前述分解手段進行的前述多重解析度分解係為最大重複多重解析度分解、最大抽減多重解析度分解或部分抽減部分重複多重解析度分解。
此外,本發明係關於視錯覺的分析方法者,本發明的視錯覺的分析方法係在至少具備記憶部與控制部的視錯覺分析裝置中執行,該視錯覺的分析方法的特徵為:前述記憶部係具備:濾波器記憶手段,係記憶屬於無方位性的近似濾波器及複數個具各方位性的細節濾波器之集合的方位選擇性小波框或方位選擇性濾波器組;及影像資料記憶手段,係記憶影像資料;含有在前述控制部執行的下述步驟:分解步驟,係藉由前述方位選擇性小波框或前述方位選擇性濾波器組對前述影像資料的色成分進行多重解析度分解而取得次頻帶信號;重建步驟,係將藉由前述分解步驟取得的前述次頻帶信號相加,藉此重建影像而取得重建影像資料;及視錯覺量數值化步驟,係算出前述影像資料與前述重建影像資 料間的前述色成分之比或差,藉此將視錯覺量予以數值化;前述分解步驟係進一步含有:係數處理步驟,係於前述多重解析度分解的分解期與合成期之間,對前述分解期輸出的分解細節係數進行下述的係數處理:該分解細節係數的能量愈大愈將小的值抑制得更小,該分解細節係數的能量愈小愈將小的值增強。
此外,本發明係關於視錯覺添加影像產生方法者,本發明的視錯覺添加影像產生方法係在至少具備記憶部與控制部的視錯覺添加影像產生裝置中執行,該視錯覺添加影像產生方法的特徵為:前述記憶部係具備:濾波器記憶手段,係記憶屬於無方位性的近似濾波器及複數個具各方位性的細節濾波器之集合的方位選擇性小波框或方位選擇性濾波器組;及影像資料記憶手段,係記憶影像資料;含有在前述控制部執行的下述步驟:分解步驟,係藉由前述方位選擇性小波框或前述方位選擇性濾波器組對前述影像資料進行多重解析度分解而取得次頻帶信號;及重建步驟,係將藉由前述分解步驟取得的前述次頻帶信號相加,藉此重建影像而取得重建影像資料;前述分解步驟係進一步含有:係數處理步驟,係於前述多重解析度分解的分解期與合成期之間,對前述分解期輸出的分解細節係數進行下述的係數處理:該分解細節係數的能量愈大愈將小的值增強,該分解細節係數的能量愈小愈將小的值抑制得更小。
此外,本發明係關於程式者,本發明的程式係用以使至少具備記憶部與控制部的視錯覺的分析裝 置執行視錯覺的分析方法,該程式的特徵為:前述記憶部係具備:濾波器記憶手段,係記憶屬於無方位性的近似濾波器及複數個具各方位性的細節濾波器之集合的方位選擇性小波框或方位選擇性濾波器組;及影像資料記憶手段,係記憶影像資料;使在前述控制部執行下述步驟:分解步驟,係藉由前述方位選擇性小波框或前述方位選擇性濾波器組對前述影像資料的色成分進行多重解析度分解而取得次頻帶信號;重建步驟,係將藉由前述分解步驟取得的前述次頻帶信號相加,藉此重建影像而取得重建影像資料;及視錯覺量數值化步驟,係算出前述影像資料與前述重建影像資料間的前述色成分之比或差,藉此將視錯覺量予以數值化;於前述分解步驟中進一步使下述步驟執行:係數處理步驟,係於前述多重解析度分解的分解期與合成期之間,對前述分解期輸出的分解細節係數進行下述的係數處理:該分解細節係數的能量愈大愈將小的值抑制得更小,該分解細節係數的能量愈小愈將小的值增強。
此外,本發明的程式係用以使至少具備記憶部與控制部的視錯覺添加影像產生裝置執行視錯覺添加影像產生方法,該程式的特徵為:前述記憶部係具備:濾波器記憶手段,係記憶屬於無方位性的近似濾波器及複數個具各方位性的細節濾波器之集合的方位選擇性小波框或方位選擇性濾波器組;及影像資料記憶手段,係記憶影像資料;使在前述控制部執行下述步驟:分解步驟,係藉由前述方位選擇性小波框或前述方位選擇性濾 波器組對前述影像資料進行多重解析度分解而取得次頻帶信號;及重建步驟,係將藉由前述分解步驟取得的前述次頻帶信號相加,藉此重建影像而取得重建影像資料;於前述分解步驟中進一步使下述步驟執行:係數處理步驟,係於前述多重解析度分解的分解期與合成期之間,對前述分解期輸出的分解細節係數進行下述的係數處理:該分解細節係數的能量愈大愈將小的值增強,該分解細節係數的能量愈小愈將小的值抑制得更小。
此外,本發明係關於記錄媒體者,係記錄有前述記載的程式。
依據本發明,係記憶屬於無方位性的近似濾波器及複數個具各方位性的細節濾波器之集合的方位選擇性小波框或方位選擇性濾波器組和影像資料,藉由方位選擇性小波框或方位選擇性濾波器組對影像資料的色成分進行多重解析度分解而取得次頻帶信號,將次頻帶信號相加,藉此重建影像而取得重建影像資料,此時,於多重解析度分解的分解期與合成期之間,對分解期輸出的分解細節係數,進行該分解細節係數的能量愈大愈將小的值抑制得更小,該分解細節係數的能量愈小愈將小的值增強之係數處理,算出影像資料與重建影像資料間的色成分之比或差,藉此將視錯覺量予以數值化。藉此,本發明係達到能夠針對任意影像將可能發生的視錯覺量予以定量化之效果。更具體言之,過往對於掌握哪個部分發生了何種程度的視錯覺係除了憑感覺以外就別 無他法,而依據本發明,便能夠以客觀的數值取得哪個部分發生了何種程度的視錯覺。更具體言之,能夠掌握印刷、設計、影片、塗裝等的色彩中視錯覺量的發生位置,並且能夠以客觀的指標掌握哪個位置應該施行修正,不需再依靠設計師的技術。
此外,依據本發明,係可依前述分解細節係數的正負號之差異而進行個別的處理,因此達到能夠進行更加接近人類視覺的自然的處理之效果。
此外,依據本發明,就前述色成分而言,係使用CIELAB色空間的L*、a*、b*其中一者。藉此,本發明係達到能夠進行接近人類感覺的自然的影像處理之效果。
此外,依據本發明,係使用色差,即使用L*的值、a*的值及b*的值於影像資料與重建影像資料間之差的平方總和的平方根進行計算作為視錯覺量,因此達到能夠以整合色彩與輝度的視錯覺量而得的合成分數(score)獲得更加接近綜合感覺的視錯覺量之效果。
此外,依據本發明,係進行針對前述影像資料的a*及/或b*的色成分進行下述修正的前述係數處理:從a*及/或b*的前述分解細節係數與L*的前述分解細節係數而定的能量愈大愈將小的值抑制得更小,前述能量愈小愈將小的值增強。藉此,達到能夠進行使輝度的效果與色彩的效果協同作用之對人類視覺辨識而言自然的影像處理之效果。
此外,依據本發明,係使用當上述分解細節係數的能量大時呈S字曲線自動連續變化,當分解細節係數的能量小時呈N字曲線自動連續變化的函數進行前記係數處理。藉此,本發明係達到能夠使用從S字曲線連續變化至N字曲線的函數之演算而輕鬆地執行下述係數處理之效果:即該分解細節係數的能量愈大愈將小的值抑制得更小,該分解細節係數的能量愈小愈將小的值增強。更具體言之,使用當周圍的刺激大時增大分解細節係數的變異,當周圍的刺激小時縮小分解細節係數的變異之函數,藉此,當周圍的刺激大時使小的刺激衰減,當周圍的刺激小時仍會意識到小的刺激,因此能夠按各影像自動地進行適當的影像處理。
此外,依據本發明,係於前述分解期與前述合成期之間,正規化前述細節分解係數,以正規化後的前述分解細節係數即正規化分解細節係數之範數作為前述能量,對該正規化分解細節係數進行前述係數處理,再對經係數處理後的前述正規化分解細節係數進行前述正規化的逆運算。藉此,本發明係達到能夠藉由正規化使係數在函數處理和能量計算等中容易處理之效果。
此外,依據本發明,係使用前述方位性為由水平方向、垂直方向、對角方向構成的雙正交小波濾波器組或前述方位性為多方向的風車小框進行前述多重解析度分解。藉此,本發明係達到能夠使用雙正交小波濾波器組進行簡易的計算、使用風車小框進行精密的計算之效果。
此外,依據本發明,係於前述多重解析度分解中,亦可使用其他濾波器組,例如依階數進行風車小框的次數之改變等的濾波器組。藉此,達到能夠進行考量到人類視覺特性的影像處理之效果。
此外,依據本發明,前述多重解析度分解係為最大重複多重解析度分解、最大抽減多重解析度分解或部分抽減部分重複多重解析度分解,因此能夠進行輕鬆的多重解析度分解取得分解細節係數,此外,不僅是高頻部分,低頻部分亦施行多重解析度的處理,因此達到能夠進行自然的影像處理之效果。
此外,依據本發明,係以編輯影像資料並針對經編輯的影像資料進行多重解析度分解之方式進行控制,此時,計算從經編輯的影像資料取得的重建影像資料與未編輯的影像資料間之比或差作為視錯覺量,進行使視錯覺量變小的反覆編輯。藉此,能夠取得添加腦內的視錯覺量份而就結果來說會被辨識如編輯前影像(初期影像)的編輯影像(輸出用影像)。此外,藉由將上述的輸出用影像以列印(print out)、印刷、顯示、漆畫(paint)等方式輸出,看到該影像的人會在腦內將其辨識成影像編輯前的原本的初期影像,從而達到不需要如習知般依靠專業技術進行配色調整之效果。
此外,本發明係以編輯影像資料並針對經編輯的影像資料進行多重解析度分解之方式進行控制,此時,計算經編輯的影像資料與從該經編輯的影像資料取得的重建影像資料間之比或差作為視錯覺量,進行使 視錯覺量成為預定數值的反覆編輯。藉此,達到以數值化後的視錯覺量為指標進行成為所期望視錯覺量之編輯,從而能夠製作視錯覺量多的影像和視錯覺量少的影像等任意的視錯覺量的影像之效果。
此外,本發明係記憶屬於無方位性的近似 濾波器及複數個具各方位性的細節濾波器之集合的方位選擇性小波框或方位選擇性濾波器組和影像資料,藉由方位選擇性小波框或方位選擇性濾波器組對影像資料進行多重解析度分解而取得次頻帶信號,將次頻帶信號相加,藉此重建影像而取得重建影像資料,此時,於多重解析度分解的分解期與合成期之間,對分解期輸出的分解細節係數,進行該分解細節係數的能量愈大愈將小的值增強,該分解細節係數的能量愈小愈將小的值抑制得更小之係數處理,藉此產生添加視錯覺的影像。藉此,本發明係能夠針對任意影像取得添加腦內的視錯覺量份而被辨識如該影像般的輸出用影像。此外,藉由將上述的輸出用影像以列印、印刷、顯示、漆畫等方式輸出,看到該影像的人會在腦內將其辨識為原本的影像,從而達到不需要如習知般依靠專業技術進行配色調整之效果。
100‧‧‧視錯覺分析裝置
102‧‧‧控制部
102a‧‧‧分解部
102b‧‧‧係數處理部
102c‧‧‧重建部
102d‧‧‧色空間轉換部
102e‧‧‧處理影像輸出部
102f‧‧‧視錯覺量數值化部
102g‧‧‧影像編輯部
104‧‧‧通訊控制介面部
106‧‧‧記憶部
106a‧‧‧小框檔案
106b‧‧‧影像資料檔案
108‧‧‧輸出入控制介面部
112‧‧‧輸入裝置
114‧‧‧輸出裝置
200‧‧‧外部系統
300‧‧‧網路
第1圖係顯示運用本實施形態的本視錯覺分析裝置100的構成的一例之方塊(block)圖。
第2圖係顯示將次數5的階數1與階數2的最大重複風車小框近似濾波器對次數5的階數3的最大重複風車小框濾波器進行循環相關積而得的濾波器之圖。
第3圖係顯示將次數7的階數1的最大重複風車小框近似濾波器對階數2(高頻側)的最大重複風車小框濾波器進行循環相關積而得的濾波器之圖。
第4圖係顯示將次數7的階數1與階數2的最大重複風車小框近似濾波器對階數3(低頻側)的最大重複風車小框濾波器進行循環相關積而得的濾波器之圖。
第5圖係次數7、階數k的風車小框中,以代號ak表示近似部分、以dk(1)至dk(99)的代號(編號)表示細節部分之圖。
第6圖係顯示本實施形態的視錯覺分析裝置100的基本處理的一例之流程圖(flow chart)。
第7圖係顯示最大重複多重解析度分解的分解期及合成期的濾波器組的一例之圖。
第8圖係顯示伴有正規化的分解細節係數的係數處理的一例之流程圖。
第9圖係顯示色彩的對比視錯覺影像的一例之圖。
第10圖係顯示第9圖中原影像的內側四角部分(原影像A與B共通)、屬於原影像A的影像處理結果之處理影像A的內側四角部分、屬於原影像B的影像處理結果之處理影像B的內側四角部分之圖。
第11圖係顯示色彩的對比視錯覺影像的其他例之圖。
第12圖係顯示第11圖中原影像的內側四角部分(原影像C與D共通)、屬於原影像C的影像處理結果之處理影像C的內側四角部分、屬於原影像D的影像處理結果之處理影像D的內側四角部分之圖。
第13圖係顯示色彩的對比視錯覺影像的其他例之圖。
第14圖係顯示第13圖中原影像的內側四角部分(原影像E與F共通)、屬於原影像E的影像處理結果之處理影像E的內側四角部分、屬於原影像F的影像處理結果之處理影像F的內側四角部分之圖。
第15圖係以原影像與處理影像的內側四角部分內的中心座標的L*的值、a*的值及b*的值之差分及該些差分的合成分數為視錯覺量予以圖表化之圖。
第16圖係顯示編號1至3的原影像、原影像中心剖面的L*、a*、b*的曲線圖、與原影像對應的處理影像、處理影像中心剖面的L*、a*、b*的曲線圖之圖。
第17圖係顯示編號4至6的原影像、原影像中心剖面的L*、a*、b*的曲線圖、與原影像對應的處理影像、處理影像中心剖面的L*、a*、b*的曲線圖之圖。
第18圖係顯示編號7至9的原影像、原影像中心剖面的L*、a*、b*的曲線圖、與原影像對應的處理影像、處理影像中心剖面的L*、a*、b*的曲線圖之圖。
第19圖係顯示內側小四角形與外側大四角形有均一輝度的原影像、內側小四角形與外側大四角形的輝度有大幅度差異的原影像的對比圖。
第20圖係本實施例中使用的基本圖形。
第21圖係顯示本實施例中使用的檢查色之圖。
第22圖係顯示具有根據處理結果選擇的背景色的基本圖形的例子之圖。
第23圖係以含有實施形態的順方向處理之方法對第22圖的基本圖形進行處理而導出的視錯覺色的排列圖。
第24圖係顯示原影像(512×512個像素)與本實施形態產生的處理影像的對比圖。
第25圖係顯示第24圖的各照片中從左數來第400個像素的行的L*的值之曲線圖。
第26圖係顯示第24圖的各照片中從左數來第400個像素的行的a*的值之曲線圖。
第27圖係顯示第24圖的各照片中從左數來第400個像素的行的b*的值之曲線圖。
第28圖係顯示視錯覺分析裝置100的擬合(fitting)處理的一例之流程圖。
第29圖係顯示本實施例中使用的原影像之圖。
第30圖係將原影像的中央小四角形部分擷取出之圖。
第31圖係顯示進行逆方向處理而作為重建影像獲得的視錯覺添加影像之圖。
第32圖係將視錯覺添加影像的中央小四角形部分擷取出之圖。
第33圖係顯示將第29圖的外側區域置換成白色而成的影像之圖。
第34圖係顯示進行逆方向處理而作為重建影像獲得的視錯覺添加影像之圖。
第35圖係顯示謝佛勒視錯覺圖形之圖。
第36圖係顯示對謝佛勒視錯覺圖形施行逆方向處理而得的視錯覺添加影像之圖。
第37圖係第35圖的謝佛勒視錯覺圖形的原影像與第36圖的視錯覺添加影像的橫剖面的輝度(CIELAB的L*)的曲線圖。
第38圖係顯示將次數7的階數1的最大重複風車小框的近似濾波器對階數2的最大重複風車小框濾波器(maximal overlap pinwheel framelet filters at level 2)進行循環相關積而得的濾波器之圖。
第39圖係顯示對測試(test)影像藉由次數7的風車小框進行階數2的最大重複多重解析度分解(2nd stage of maximal overlap MRA decomposition by pinwheel framelet)的結果的各次頻帶信號之圖。
以下,根據圖式詳細說明本發明的視錯覺的分析裝置、視錯覺添加影像產生裝置、視錯覺的分析方法、視錯覺添加影像產生方法及程式的實施形態。另外,本發明並不受下述的實施形態所限定。例如,就本實施形態中的色空間而言,雖然係針對使用CIE(國際照明委員會)均勻色彩空間(L*a*b*表色系統)之例進行說 明,但並不以此為限,只要是接近人類視覺的色空間,則亦可使用其他種色空間的色成分。
〔視錯覺分析裝置100的構成〕
接著,針對屬於本實施形態的視錯覺的分析裝置及視錯覺添加影像產生裝置之視錯覺分析裝置100的構成,參照第1圖進行說明。第1圖係顯示運用本實施形態的本視錯覺分析裝置100的構成的一例之方塊圖,係僅概念性地顯示該構成之中與本實施形態相關的部分。
在第1圖中,視錯覺分析裝置100概略上係具備控制部102、通訊控制介面(interface)部104、輸出入控制介面部108及記憶部106。此處,控制部102乃係統御整個視錯覺分析裝置100的CPU(Central Processing Unit;中央處理單元)等。輸出入控制介面部108乃係連接至輸入裝置112和輸出裝置114的介面。此外,記憶部106乃係存放各種資料庫(database)和資料表(table)等的裝置。該些視錯覺分析裝置100的各部係以能夠經由任意的通訊路徑進行通訊的方式連接。
存放在記憶部106的各種檔案(file)(小框檔案106a及影像資料檔案106b)乃係固定磁碟(disc)裝置等儲存(storage)手段。例如,記憶部106係存放用於各種處理的各種程式、資料表、檔案、資料庫及網頁(web page)等。
該些記憶部106的各構成要素之中,小框檔案106a乃係濾波器記憶手段,係記憶屬於無方位性的 近似濾波器及複數個具各方位性的細節濾波器之集合的方位選擇性小波框或方位選擇性濾波器組。此處,在本實施形態中,就方位選擇性小波框而言雖然係使用風車小框(pinwheel framelet),但方位選擇性小波框並不以此為限,例如,亦可使用簡單風車小框(simple pinwheel framelet)(參照上述之非專利文獻3)、風車小波框(pinwheel wavelet frame)(參照上述之非專利文獻4)等。此外,並不限於方位性為多方向的風車小框,亦可使用方位性為由水平方向、垂直方向、對角方向所構成的雙正交小波濾波器組。另外,風車小波框係具有構成的濾波器的長度係對應原影像的像素數目而變化之性質,相對於此,風車小框及簡單風車小框係具有濾波器的長度無關於像素數目之性質。例如,風車小框乃係具方位選擇性的二維小框,屬小波框的一種。就其一例而言,風車小框乃係將人類視覺皮質的簡單細胞轉化為數理模型而成者。其分解乃係人類腦內由簡單細胞分解的信號的數理性模型。另外,從神經科學的觀點來看,風車小框乃係比簡單風車小框更接近大腦皮質V1區的簡單細胞之模型。就其一例而言,風車小框係具有次數,且該次數為3以上的奇數,次數愈大,便能夠相應地檢測愈多的方位。另外,相應地,係具有濾波器的個數變多,計算時間也會跟著增加之性質。此外,就其一例而言,次數n的風車小框的濾波器數目係為(n+1)2+(n-1)2。其中,1個濾波器為近似濾波器,其餘的濾波器為細節濾波器。此處,第2圖係顯示將次數5的階數1及階數2的最大 重複風車小框近似濾波器對次數5的階數3的最大重複風車小框濾波器進行循環相關積而得的濾波器之圖(關於循環相關積,參照例如「線性代數 基礎與應用」新井仁之著,日本評論社股份有限公司(2006年)出版)。
該風車小框係為次數5,因此例如如第2圖所示,各階數係由左側6×6個濾波器與右側4×4個濾波器,合計共52個濾波器之集合所組成。其中,圖中央上部以黑色矩形圍起的那一個乃係藉由階數1至階數3的近似濾波器的循環相關積而得的濾波器,其餘的51個則係藉由將階數1至2的近似濾波器對階數3的細節濾波器進行循環相關積而得的濾波器。從細節濾波器製作的上述濾波器的方位性係以僅從近似濾波器製作的濾波器為中心,大致朝著風車的旋轉方向排列。另外,如待後之詳述,以各次數的風車小框進行的最大重複多重解析度分解係擁有階數,階數1係檢測最細節的部分(高頻部分)。第2圖係階數3的風車小框,隨著階數2、3…地增加,檢測愈加粗略的部分(低頻部分)。另外,小框檔案106a係可以函數的形式(小框濾波器的頻率響應函數等)記憶風車小框等方位選擇性小波框。關於函數的具體例,待後詳述。
另外,並不限於上述,在本實施形態中亦可使用各種小波。此處,小波並不限於古典的小波和狹義的小波等,亦包含廣義的小波。例如,小波係為有限長波形或是伴有從0放大再迅速收斂至0之振幅的波樣之振動,就其一例而言,包含賈伯(Gabor)濾波器和曲線 波(curvelet)之類的類小波。此外,小框檔案106a並不限於記憶方位選擇性小波框之類的框,亦可記憶方位選擇性濾波器組等濾波器群和具方位性的濾波器。就具各方位性的濾波器的一例而言,係為複數個具各方位性的細節濾波器,例如藉由濾波器抽出次頻帶信號等成分。
此外,影像資料檔案106b乃係影像資料記憶手段,係記憶影像資料。此處,記憶於影像資料檔案106b的影像資料係可為預先按各色成分描述色調和灰階值等的影像資料,亦可為未以本實施形態中所處理的色成分描述的影像資料。另外,當為後者時,藉由後述的色空間轉換部102d轉換成所期望的色空間,分解成各色成分。此外,記憶於影像資料檔案106b的影像資料係可為經由輸入裝置112輸入的影像資料,亦可為經由網路(network)300從外部系統200等接收的影像資料。此外,影像資料係可為彩色影像的圖像(image)資料,亦可為灰階(gray scale)的圖像資料。另外,將藉由風車小框等方位選擇性小波框進行多重解析度分解之前的原本的影像(資料)稱為原影像(資料),將根據次頻帶信號重建後的影像(資料)稱為重建影像(資料)。此處,影像資料檔案106b係亦可將影像尺寸(像素數目)與作為目標的原影像的影像資料相同的單位脈衝(unit pulse)信號記憶為影像資料。另外,記憶於影像資料檔案106b的單位脈衝信號係作為影像資料同樣輸入至記憶於小框檔案106a的濾波器組,所輸出的單位脈衝響應係供對作為目標的原影像的影像資料進行高速計算之用。另外,影像資料乃 係例如點陣(raster)形式或向量(vector)形式的二維影像資料等。此外,就影像的一例而言,係可為表示設計式樣(design)、照片、文字等的任意影像。此外,影像並不限於靜止影像,亦可為動態影像(影片)。
再回到第1圖,輸出入控制介面部108係進行輸入裝置112和輸出裝置114的控制。此外,就輸出裝置114而言,係能夠使用監視器(monitor)(包括家用電視機)等顯示裝置、印表機(printer)等印刷裝置等。此外,就輸入裝置112而言,係能夠使用攝像機(camera)等撮像裝置、連接外部記憶媒體的輸入裝置等,除此之外還能夠使用鍵盤(keyboard)、滑鼠(mouse)及麥克風(microphone)等。
此外,在第1圖中,控制部102係具有用來存放OS(Operating System;作業系統)等控制程式和規定各種處理步驟等的程式及必要資料的內部記憶體(memory)。此外,控制部102係藉由該些程式等進行用以執行各種處理的資訊處理。從功能概念的觀點來看,控制部102係具備分解部102a、重建部102c、色空間轉換部102d、處理影像輸出部102e、視錯覺量數值化部102f及影像編輯部102g。另外,分解部102a進一步具備係數處理部102b。
其中,分解部102a乃係分解手段,係針對影像資料(例如影像資料的色成分)進行以記憶於小框檔案106a的風車小框等方位選擇性小波框進行的多重解析度分解,取得次頻帶信號。此處,「多重解析度分解」 係包括最大重複多重解析度分解、最大抽減多重解析度分解及部分抽減部分重複多重解析度分解(關於最大重複多重解析度分解,參照例如「小波」新井仁之著,共立出版股份限公司(2010年)出版)。另外,藉由分解部102a計算多重解析度分解時使用循環相關積、迴圈卷積,該些計算係可藉由使用快速傅立葉轉換(Fast Fourier Transform)的公知的快速計算方法來進行。如上述,以風車小框等方位選擇性小波框進行的多重解析度分解係擁有階數。此處,第3圖及第4圖係用以顯示風車小框的階數造成的差異之圖,第3圖係顯示將階數1的最大重複風車小框近似濾波器對階數2(高頻側)的最大重複風車小框濾波器進行循環相關積而得的濾波器,第4圖係顯示將階數1與階數2的最大重複風車小框近似濾波器對階數3(低頻側)的最大重複小框濾波器進行循環相關積而得的濾波器。另外,第3圖及第4圖的次數皆為7,因此有(7+1)2+(7-1)2=100個濾波器。
就其一例而言,分解部102a係首先藉由以階數1的風車小框進行的最大重複多重解析度分解,檢測最細節的部分(高頻部分),隨著階數2、3…地增加,檢測愈加粗略的部分(低頻部分)。
以風車小框進行的多重解析度分解係具有分解期與合成期。各期係由近似濾波器與細節濾波器的陣列(array)組成的濾波器組所構成。分解部102a係在執行分解期及合成期的影像處理後,最終將原影像資料分解成「濾波器數目×階數」個影像信號(即次頻帶信號)。
例如,當以次數7的風車小框進行階數5的最大重複多重解析度分解時,某階數k(k=1至5)的次頻帶信號係具有藉由1個近似濾波器而得的1個近似部分與藉由99個細節濾波器而得的99個細節部分。此處,第5圖係次數7、階數k的風車小框中,以代號ak表示近似部分、以dk(1)至dk(99)的代號(編號)表示細節部分之圖。另外,代號(編號)的位置係與第3圖(k=2)或第4圖(k=3)中各濾波器的位置有對應關係。亦即,ak及dk(1)至dk(99)係表示從第3圖或第4圖中相對應之位置的濾波器取得的次頻帶信號。
此處,分解部102a的係數處理部102b乃係係數處理手段,係於多重解析度分解的分解期與合成期之間,對分解期輸出的分解細節係數進行係數處理。例如,係數處理部102b係可進行下述的係數處理:該分解細節係數的能量愈大愈將小的值抑制得更小,該分解細節係數的能量愈小愈將小的值增強(在下述中有時亦稱為「順方向處理」)。例如,當分解細節係數的能量大時,係數處理部102b係令該分解細節係數的變異增大,藉此,既將比較小的值抑制得更小,同時使比較大的值增強得更大。另一方面,當分解細節係數的能量小時,係數處理部102b係令該分解細節係數的變異縮小,藉此,既將比較小的值增強,同使將比較大的值加以抑制。
另外,係數處理部102b並不限於如上述進行順方向處理,亦可進行下述的係數處理:該分解細節係數的能量愈大愈將小的值增強,該分解細節係數的 能量愈小愈將小的值抑制得更小(在下述中有時亦稱為「逆方向處理」)。例如,當分解細節係數的能量大時,係數處理部102b係令該分解細節係數的變異縮小,藉此,既將比較小的值增強,同時將比較大的值加以抑制。另一方面,當分解細節係數的能量小時,係數處理部102b係令該分解細節係數的變異增大,藉此,既將比較小的值抑制得更小,同時使比較大的值增強得更大。
此處,當為像素數目多的影像時,亦可適當地分割該影像再針對各分割影像進行本實施形態的處理。
此外,係數處理部102b係亦可進行正規化,使分解細節係數的值於函數處理等的係數處理及/或能量計算中變得容易處理。例如,係數處理部102b係可於分解期與合成期之間,首先將分解細節係數取絕對值並予以正規化,以經正規化後的分解細節係數(稱為「正規化分解細節係數」)的平方範數(或可為其他範數)作為能量。此外,係數處理部102b係亦可配合所計算出的能量對正規化分解細節係數進行係數處理,再對經係數處理後的正規化分解細節係數進行正規化的逆運算,藉此而作為輸入至合成期的輸入資料。另外,當使用絕對值時,係於如下式般進行逆運算時將正負號還原。
x'=sgn(x)z'
(其中,x為分解細節係數,z為係數處理後的值,z'為正規化的逆運算結果的值。此處,若x≧0,則sgn(x)=1,若x<0,則sgn(x)=-1。另外,x'為還原正負號的結果的值。)
另外,係數處理部102b係亦可為了進行配合能量大小的係數處理而對能量值設置臨限值,按能量值的各範圍進行不同的係數處理;亦可不對能量值設置臨限值,而是以令變異配合能量值連續變化的函數進行演算,藉此進行係數處理。當採用前者時,例如,係數處理部102b係可使用按能量值的範圍進行設定的函數(例如Logit函數和Logistic方程式等)。當採用後者時,例如,係數處理部102b係可使用當分解細節係數的能量大時呈S字曲線連續變化,當能量小時呈N字曲線連續變化的函數(稱為「SN函數」)作為順方向處理進行係數處理。此處,下面係顯示SN函數的一例(參照上述之非專利文獻2)。另外,下述式1係若α>1則形成S字曲線,若α=1則形成直線,若α<1則形成N字曲線。
z=yα/{yα+(1-y)α}…(式1)
(其中,y為正規化分解細節係數(0≦y≦1),α為以正規化分解細節係數的能量為根據的指標值(0<α),z為經函數處理後的正規化分解細節係數。)另外,函數係亦可進行離散化,藉此轉化成資料表使用。
此處,在上述的式1中,只要以使原本決定α時的α與能量之增大關係反過來的方式重新決定的指標值例如α的倒數改定為α,便能夠做為逆方向處理的SN函數。亦即,只要如上述置換α,則就逆方向處理而言,係數處理部102b便能夠使用當分解細節係數的能量大時呈N字曲線連續變化,當上述能量小時呈S字曲線連續變化的SN函數進行逆方向的係數處理。另外, 在下述的實施形態中係進行用於順方向處理的說明,但只要將配合能量大小的係數處理內容的關係調換,同樣地可用來說明逆方向處理的進行。
另外,就係數處理部102b的一例而言,係按如CIELAB色空間的L*、a*及b*般等的各色成分進行係數處理,但並不限於獨立處理各色成分的值,亦可當進行一個色成分的係數處理時,根據其他色成分的值修正係數處理。例如,關於人類的視覺,在腦神經科學方面,係有大腦皮質存在色彩.輝度細胞的實驗結果(上述之非專利文獻5),根據該實驗結果設計推測出色彩.輝度細胞的作用的數理模型,藉此,係數處理部102b係亦可針對影像資料的a*及/或b*的色成分進行以下述方式修正的係數處理:從a*及/或b*的分解細節係數與L*的分解細節係數而定的能量愈大愈將小的值抑制得更小,上述能量愈小愈將小的值增強。此外,亦能夠依分解細節係數的正負號之相異而進行個別的處理。
此外,重建部102c乃係重建手段,係將藉由分解部102a取得的次頻帶信號相加,藉此重建影像而取得重建影像資料。例如,重建部102c係將上述藉由最大階數的近似濾波器而得的近似部分的次頻帶信號、與所有藉由細節濾波器而得的細節部分的次頻帶信號相加,藉此重建影像而取得重建影像資料。此時,由於風車小框具有完全重建性,因此若不藉由係數處理部102b進行處理,則重建部102c將會重現與原影像相同的影像。換言之,重建部102c係在係數處理部102b進行的 處理使分解細節係數增減後,將次頻帶信號相加,藉此取得對原影像施行過自然的影像處理的重建影像資料。
此處,利用上述的代號(編號),針對完全重建性進行說明。設原影像的輸入信號(原信號)為x,則以次數7的風車小框進行的階數5的最大重複多重解析度分解的完全重建性係以下式表示。
x=a5+(d5(1)+…+d5(99))+…+(d1(1)+…+d1(99))
此處,若定在分解部102a中經係數處理部102b處理過的細節部分為d5 '(1)、…、d1 '(99),此時,重建影像(信號)則以下式表示。
y=a5+(d5 '(1)+…+d5 '(99))+…+(d1 '(1)+…+d1 '(99))
此時,若在分解部102a中不進行係數處理,則會是d5 '(1)=d5(1)、…、d1 '(99)=d1(99),很顯然地,x=y(原影像與重建影像相同),成為完全重建。
此外,色空間轉換部102d乃係色空間轉換手段,係進行色空間的變換和色成分的分解.合成等。例如,當記憶於影像資料檔案106b的影像資料為彩色影像且資料未以本實施形態所使用的色成分描述時,色空間轉換部102d係在進行分解部102a的處理之前,轉換成目標色空間(例如CIELAB色空間)。藉由轉換成CIELAB色空間,影像係分解成L*(輝度)、a*(紅-綠)、b*(黃-藍)三個色成分。另外,色空間轉換部102d係亦可轉換成CIELAB色空間以外的其他種色空間。使用CIELAB色空間的優點在於其接近人類透過視網膜進行的視覺資訊轉換。另外,當影像資料係預先按本實施形 態所使用的各色成分描述了色調和灰階值等時,色空間轉換部102d亦可不進行色空間的相關處理。另外,若有必要,色空間轉換部102d係於重建部102c進行的影像資料重建處理中進行色成分的合成、色空間的轉換、輝度.色彩的標度(scale)轉換等。
此外,處理影像輸出部102e係將藉由重建部102c重建的重建影像資料輸出至輸出裝置114。例如,處理影像輸出部102e係可將重建影像顯示輸出於監視器等顯示裝置,亦可將重建影像印刷輸出於印表機等印刷裝置而製作印刷媒體。就作為印刷對象的媒體而言,係可為例如紙、透明膠片(投影片)等,亦可為例如傳單、扇子、卡片、繪本、賀年卡、聖誕卡、名片等形態。另外,配合輸出的形態,處理影像輸出部102e係亦可進行配合用途的設計變更(例如變更成明信片尺寸等)。此外,處理影像輸出部102e係亦可經由網路300將重建影像資料傳送至外部系統200。
此外,視錯覺量數值化部102f乃係視錯覺量數值化手段,係算出影像資料與重建影像資料間的色成分之比或差,藉此將視錯覺量予以數值化。例如,視錯覺量數值化部102f係亦可計算影像資料與重建影像資料間同個像素座標的L*、a*或b*的值之差(包括差的絕對值和平方)或比(包括比例、比率、百分比等)作為視錯覺量。另外,視錯覺量數值化部102f係亦可整合L*、a*或b*的值之差,計算該些差的平方總和的平方根作為綜合視錯覺量。另外,視錯覺量數值化部102f係可將數 值化後的視錯覺量直接以數值的形式輸出至輸出裝置114,亦可將視錯覺量予以圖表化後再輸出至輸出裝置114。例如,視錯覺量數值化部102f係亦可於橫剖影像的橫剖線將該橫剖線上的座標的視錯覺量予以圖表化後顯示於輸出裝置114。此外,視錯覺量數值化部102f係亦可對二維的影像以視錯覺量為高度而以三維表示。
此外,影像編輯部102g乃係影像編輯手段,係編輯影像資料。例如,影像編輯部102g係可針對記憶於影像資料檔案106b的影像資料,進行色調和灰階值的變更等。另外,影像編輯部102g係可讓使用者經由輸入裝置112進行影像的編輯,亦可自動以白平衡(white balance)等任意的演算法進行影像的編輯。就手動編輯的例子而言,影像編輯部102g係可令對編輯對象影像的各輝度的像素數目進行測繪(plot)而得的直方圖(histogram)顯示於輸出裝置114,讓使用者於直方圖上調整影像的明亮度和對比度。就自動編輯的例子而言,於藉由視錯覺量數值化部102f所算出的視錯覺量為預定值以上的同一色區域或與該區域鄰接的同一色區域,影像編輯部102g係可對屬於該區域的像素群選擇性地變更色彩,亦可進行色彩修正。另外,影像編輯部102g係亦可當藉由視錯覺量數值化部102f算出的色成分的視錯覺量大時,增加色彩的變更量,當視錯覺量小時,減少色彩的變更量。如上述,影像編輯部102g係亦可進行使變更後的影像的視錯覺影像與原本的初期影像之差分(視錯覺量)變小(例如變為最小)的反覆影像編輯,藉此而取得添加腦 內的視錯覺量份而就結果來說會被辨識如初期影像般的影像(輸出用影像)。亦即,藉由將上述的輸出用影像以列印、印刷、顯示、漆畫等方式輸出,看到該影像的人會在腦內將其辨識成影像編輯前的原本的初期影像,從而達到不需要如習知般依靠專業技術進行配色調整之效果。另外,並不限於使用計算出從編輯過的影像資料取得的重建影像資料、與未編輯的影像資料間之比或差作為視錯覺量而得的數值,亦可使用計算出編輯過的影像資料、與從該編輯過影像資料取得的重建影像資料間之比或差作為視錯覺量而得的數值。此時,影像編輯部102g係進行使視錯覺量成為預定數值的反覆編輯,藉此,達到以數值化後的視錯覺量為指標進行成為所期望視錯覺量之編輯,從而能夠製作視錯覺量多的影像和視錯覺量少的影像等任意的視錯覺量的影像之效果。
該視錯覺分析裝置100係亦可經由路由器(router)等通訊裝置及專用線等有線或無線的通訊線路而可進行通訊地連接至網路300。在第1圖中,通訊控制介面部104係進行視錯覺分析裝置100與網路300(或路由器等通訊裝置)間的通訊控制。亦即,通訊控制介面部104乃係連接至與通訊線路等連接的路由器等通訊裝置(未圖示)之介面,係具有經由通訊線路與其他終端進行資料通訊的功能。在第1圖中,網路300係具有將視錯覺分析裝置100與外部系統200相互連接的功能,例如為網際網路(internet)等。
在第1圖中,外部系統200係經由網路300而與視錯覺分析裝置100相互連接,可具備提供與影像資料和風車小框有關的外部資料庫和用以使電腦(computer)作為視錯覺分析裝置100發揮功能的程式之功能。此處,外部系統200係可構成為WEB伺服器(server)或ASP伺服器等。此外,外部系統200的硬體構成係亦可藉由一般市售的工作站(work station)、個人電腦(personal computer)等資訊處理裝置及其附屬裝置構成。此外,外部系統200的各功能係藉由外部系統200的硬體構成中的CPU、磁碟裝置、記憶體裝置、輸入裝置、輸出裝置、通訊控制裝置等及控置該些裝置的程式等而實現。
至此,本實施形態的視錯覺分析裝置100的構成說明完畢。
〔視錯覺分析裝置100的處理〕
接著,針對如上述構成的本實施形態的本視錯覺分析裝置100的處理的一例,以下參照第6圖至第39圖詳細進行說明。
〔基本處理〕
首先,針對視錯覺分析裝置100的基本處理,參照第6圖至第8圖進行說明。第6圖係顯示本實施形態的視錯覺分析裝置100的基本處理的一例之流程圖。
首先,分解部102a係對記憶於影像資料檔案106b的影像資料的色成分,進行以記憶於小框檔案 106a的風車小框進行的最大重複多重解析度分解,取得次頻帶信號(步驟SA-1)。另外,分解部102a係不限於使用風車小框,亦可使用方位性為由水平方向、垂直方向、對角方向所構成的雙正交小波濾波器組。此外,依需要(例如影像資料未以本實施形態所使用色成分描述時等),色空間轉換部102d係可對彩色影像進行所期望的色空間的轉換處理和色成分的分解處理。就其一例而言,色空間轉換部102d係可將彩色影像轉換成CIELAB色空間。藉此,影像係分解成L*(輝度)、a*(紅-綠)、b*(黃-藍)三個色成分。此處,第7圖係顯示最大重複多重解析度分解的分解期及合成期的濾波器組的一例之圖。圖中的數字表示階數。PW為細節濾波器,當為次數7時,各階數存在99個細節濾波器。A為近似濾波器,當同樣為次數7時,各階數存在1個近似濾波器。另外,在第7圖的例子中雖然係使用最大重複法,但本實施形態並不以此為限,亦可使用最大抽減法或其他的抽減法。
如第7圖所示,首先,分解部102a係使用階數1的風車小框,以原影像為輸入信號,分解成通過99個細節濾波器的信號與通過1個近似濾波器信號(以分解細節係數d1表示信號強度之信號)。接著,分解部102a係使用階數2的風車小框,將通過階數1的近似濾波器的信號分解成通過99個(階數2的)細節濾波器的信號(分解細節係數d2)與通過1個(階數2的)近似濾波器的信號。分解部102a係反覆進行此處理直到最大階數k(圖示的例子為階數5)為止,獲得分解細節係數d1至dk 及近似係數ak。此處所使用的風車小框的次數係亦可按各階數而變。在通常的多重解析度分解中,分解部102a係將在分解期獲得的由分解細節係數d1至d5所組成的信號直接施加給合成期的濾波器組,但在本實施形態中係進行本實施形態的係數處理而獲得輸入合成期用的分解細節係數d1 '至d5 '
亦即,如第6圖所示,分解部102a的係數處理部102b係於多重解析度分解的分解期與合成期之間,對分解期輸出的分解細節係數進行下述的係數處理:該分解細節係數的能量愈大愈將小的值抑制得更小,該分解細節係數的能量愈小愈將小的值增強(步驟SA-2)。此處,係數處理部102b係亦可針對影像資料的a*及/或b*的色成分進行下述修正的係數處理:從a*及/或b*的分解細節係數與L*的分解細節係數而定的能量愈大愈將小的值抑制得更小,上述能量愈小愈將小的值增強。此外,係數處理部102b係亦可進行正規化,使分解細節係數的值於函數處理等的係數處理及/或能量計算中變得容易處理。此處,第8圖係顯示伴有正規化的分解細節係數的係數處理的一例之流程圖。
如第8圖所示,首先,係數處理部102b係將分解期輸出的分解細節係數x的絕對值予以正規化(步驟SA-21)。例如,係數處理部102b係藉由適當的正規化手法以使所有分解細節係數x納入至0至1之間的數值之方式進行分解細節係數x的正規化。
接著,係數處理部102b係根據正規化分 解細節係數y,計算分解細節係數的能量(步驟SA-22)。例如,係數處理部102b係可以正規化分解細節係數y的平方範數∥y∥作為能量。另外,亦可進行指數調整,例如進行正規化等使能量能夠以函數處理來處理。
接著,係數處理部102b係配合步驟SA-22算出的能量,以非線性的方式進行正規化分解細節係數y的係數處理,獲得係數處理結果z(步驟SA-23)。例如,係數處理部102b係亦可為了進行配合能量大小的係數處理而對能量值設置臨限值,按能量值的各範圍進行不同的係數處理;亦可不對能量值設置臨限值,而是以令變異配合能量值連續變化的函數進行演算,藉此進行係數處理。就其一例而言,為了進行順方向處理,係數處理部102b係可使用當分解細節係數的能量大時呈S字曲線連續變化,當分解細節係數的能量小時呈N字曲線連續變化的SN函數進行係數處理。此處,下述式1乃係SN函數的一例(參照上述之非專利文獻2)。式1係若α>1則形成S字曲線,若α=1則形成直線,若α<1則形成N字曲線。另外,決定能量與參數α之對應的方法並不固定為一種,可採取反映個人差別的方式設定,此外,亦可按各階數、按各方位、按各色成分、按各分解細節係數的正負號進行設定。
z=yα/{yα+(1-y)α}…(式1)
(其中,y為正規化分解細節係數(0≦y≦1),α為以正規化分解細節係數的能量為根據的指標值(0<α),z為 經函數處理後的正規化分解細節係數。)另外,並不限於上述,為了進行逆方向處理,係數處理部102b係亦可使用當分解細節係數的能量大時呈N字曲線連續變化,當分解細節係數的能量小時呈S字曲線連續變化的SN函數進行係數處理。
接著,係數處理部102b係對在步驟SA-23經係數處理的正規化分解細節係數z進行正規化的逆運算,藉此而取得輸入至合成期的輸入資料x'(步驟SA-24)。另外,當使用上述的範數時,係於以下式進行逆運算時將正負號還原。
x'=sgn(x)z'
(其中,x為分解細節係數,z為係數處理後的值,z'為正規化的逆運算結果的值。此處,若x≧0,則sgn(x)=1,若x<0,則sgn(x)=-1。另外,x'為還原正負號的結果的值。)
再回到第6圖,分解部102a係以在步驟SA-2經係數處理後的分解細節係數為輸入資料進行合成期的處理(步驟SA-3)。亦即,分解部102a係將分解期輸出的信號再經係數處理後的信號,藉由合成期的濾波器而於最終取得99×5個次頻帶信號(細節部分)與1個次頻帶信號(近似部分)(參照第7圖)。
接著,重建部102c係將藉由分解部102a取得的次頻帶信號相加而重建影像(步驟SA-4)。另外,當將次頻帶信號相加而得的色成分的數值超過規定值(例如0至255灰階的範圍)時,重建部102c係可例如以 線性或非線性的方法將數值納入至規定範圍(例如0與255的範圍內),亦可以最低規定值(例如0)以下的數值為最低規定值而最高規定值(例如255)以上的數值則置換成255(使用臨限值的方法)。除此之外,依需要(例如必須以RGB輸出等情形),色空間轉換部102d係亦可進行色空間的轉換和色成分的合成等處理。另外,當在步驟SA-2中進行的是逆方向處理時,在該步驟SA-4中,重建部102c係能夠獲得視錯覺添加影像作為重建影像,因此下述的處理可不進行。
接著,視錯覺量數值化部102f係算出直至進行上述影像處理前的原本的影像資料與藉由重建部102c產生的重建影像資料間的色成分之比或差,藉此將視錯覺量予以數值化(步驟SA-5)。例如,視錯覺量數值化部102f係亦可計算影像資料與重建影像資料間同個像素座標的L*、a*或b*的值之差(包括差的絕對值和平方)或比(包括比例、比率、百分比等)作為視錯覺量。另外,視錯覺量數值化部102f係亦可整合L*、a*或b*的值之差,使用屬於該些差的平方總和的平方根之色差進行計算作為綜合視錯覺量。另外,在將視錯覺量予以數值化後,視錯覺量數值化部102f係亦可將視錯覺量直接以數值的形式輸出至輸出裝置114,亦可將視錯覺量予以圖表化後再輸出至輸出裝置114。例如,視錯覺量數值化部102f係亦可於橫剖影像的橫剖線將該橫剖線上的座標的視錯覺量予以圖表化後顯示於輸出裝置114。此外,視錯覺量數值化部102f係亦可對二維的影像以視錯覺量為高度而以三維表示。
至此,視錯覺分析裝置100的基本處理說明完畢。藉由上述含有順方向處理的處理而得的重建影像係對原影像施行有以本實施形態進行的影像處理,例如,施行有成為比原影像更接近人類辨識出的影像之自然的影像處理。能夠藉由上述本實施形態施行該自然的影像處理的原理可以如下方式思考。亦即,雖然人類的視覺資訊處理具備高度的處理功能,但在辨識時偶爾會出現視錯覺。如本實施形態般以人類的視覺資訊處理為基礎的數理模型能夠與人類同樣表現出視錯覺便是其進行與腦內視覺資訊處理類似的處理之證明。因此,將藉由該與腦內視覺資訊處理類似的處理而導出的處理影像與原影像進行比較,便能夠獲得經數值化的視錯覺量。
〔係數處理的實施例〕
接著,以下為藉由視錯覺分析裝置100的係數處理部102b進行係數處理的實施例。
為了以數學來描述當周圍的刺激量多時,弱的刺激便受到抑制,當周圍的刺激量弱時,弱的刺激便受到強調的現象等,設想一種函數,其係藉由參數而從具S字形圖表的函數連續地變形成具S字形圖表的函數。將具有上述特性的函數命名為辨識函數。就辨識函數的一例而言,舉下述的SN函數為例。
此處,設X為原影像,設X=(X1,X2,X3)為表示色空間中的資料。例如,當使用的是CIELAB色空間時,設X1為關於L*的資料,設X2為關於a*的資料,設X3為關於b*的資料。
接著,以風車小框分解Xμ(μ=1,2,3)。在此實施例中係針對X的像素數目為512×512個像素、5次的風車小框((5-1)2+(5+1)2=52個)、階數8之條件下的分解情形進行說明(另外,不同的像素數目、不同的風車小框等,同樣能夠以相同的概念進行)。
此時,Xμ的分解資料係能夠以下式表示(式中,l、p、j、k為整數)。
此處,(xμ[1,1;j,k])0≦j,k≦511為表示風車小框的分解近似係數,(xμ[l,p;j,k])0≦j,k≦511(2≦p≦52)為表示風車小框的分解細節係數。以下,設2≦p≦52。
設φμ,l,p為適當的雙變數函數,定下式(μ=1,2,3)。
〔數式3〕zμ[l,p;j,k]=φμ,l,p(x1[l,p;j,k],xμ[l,p;j,k])
例如,設如下(a1、a2為適當的正規化常數;μ=1,2,3)。
〔數式4〕φμ,l,p(s,t)=|s|/a1μ,l,p(s,t)=|s|/a1+|t|/a2
此外,設如下。
〔數式5〕 設的正規化12範數(μ=1,2,3)
設b1、b2、b3、b4為適當決定的非負實數。亦可按μ或各階數1而變。此外,亦可依風車小框的分解細節係數之中的方位p而變。此外,亦可按各分解細節係數的正負號而變。
〔數式6〕 定yμ[l,p]為
對xμ[l,p;j,k]的絕對值施行適當的正規化,將成為在0與1之間取值者定為yμ,1[l,p;j,k]。此外,定下式。其中,此處亦可將SN函數s以適當的辨識函數置換。
於yμ,2[l,p;j,k]乘上xμ[l,p;j,k]的正負號函數,施行正規化的逆運算,設之為y' μ[l,p;j,k]。
定對y' μ[l,p;j,k]施行風車小框合成濾波器而重建的資料為X' μ(μ=1,2,3)。定X'=(X' 1,X' 2,X' 3)。
X'為X的處理影像。另外,在處理影像的例子中,關於L*係按各階數針對方位成分將所有b1、b2、b3、b4設為相同,關於a*、b*係按各階數以水平.垂直、對角、其他來分別設定。
此處,上述中雖然係針對用以進行順方向處理的函數進行說明,但只要換成配合能量大小的係數處理內容,便能夠建立用以進行逆方向處理的函數。更具體言之,適當決定上述的b1、b2、b3、b4,改以左邊αμ[l,p]的等式的右邊乘以-1後的結果重定為αμ[l,p],藉此便能夠做為逆方向處理的係數處理的實施例。
另外,為了達成更接近人類視覺辨識的目的,亦可依xμ[l,p;j,k]的正負號之相異而改變處理方法。以下,針對依分解細節係數的正負號之差異而進行個別的處理之處理例進行說明。
同上述,設X為原影像,設X的像素數目為512×512個像素(像素數目並不以此為限)。此外,X係由L*、a*、b*組成,故分別定X1、X2、X3
以風車小框分解各Xμ(μ=1,2,3)。分解至階數8為止,在此例中係考慮大腦皮質V1區的簡單細胞的方位選擇性的特性而按階數改變風車小框的次數。
亦即,階數1至階數3為止係使用7次的風車小框,階數4至階數6為止係使用5次的風車小框,階數7與階數8係使用3次的風車小框。若設n1為在階數1使用的風車小框的濾波器數目,則此例中各階的濾波器數目係如下示。
n1=n2=n3=(7-1)2+(7+1)2=100
n4=n5=n6=(5-1)2+(5+1)2=52
n7=n8=(3-1)2+(3+1)2=20
定上述以風車小框進行的至階數8為止的分解係數如下。
接著,依xμ[l,p;j,k]的正負號之差異而改變處理方法。首先,以濾波器的類型(偶型、奇型、混合型)替s(l,p)分配+1或-1的值。例如,若與l,p對應的濾波器的類型為正向的偶型,則分配+1,若為負向的偶型,則分配-1,若為奇型、混合型,則分配+1。設如下。
〔數式10〕x μ (o)[l,pj,k]=max(0,sp(l,p)x μ [l,pj,k]) x μ (1)[l,pj,k]=min(0,sp(l,p)x μ [l,pj,k])
〔數式11〕 此處,定對進行適當正規化的結果為 。接著,將從進行非線性處理 之用的指數以例如下述的方法決定。
z μ (i)[l,pj,k]=φ μ,l,p (x 1 (i)[l,pj,k],x μ (i)[l,pj,k])
其中,此處係如下,且a11、…、a32係採用適當的正規化常數。
〔數式12〕φ 1,l,p (s,t)=|s|/a 11,φ 2,l,p (s,t)=|s|/a 21+|t|/a 22,φ 3,l,p (s,t)=|s|/a 31+|t|/a 32
〔數式13〕 設的正規化範數。
設如上。其中,此處,b1,i、b2,i、b3,i乃係能夠經實驗決定之常數。接著,為了進行非線性處理,設如下。
此處,
〔數式16〕 此處,定對進行正規化的逆運算的結果為 。此外,定對-進行 正規化的逆運算的結果為。此外,設如下。
定對上述y' μ[l,p;j,k]施行風車小框的合成濾波器而重建的影像的資料為X' μ(μ=1,2,3)。此外,定X'=(X' 1,X' 2,X' 3)。此X'為X的處理影像。
至此,視錯覺分析裝置100的具體化處理說明完畢。
〔色彩的對比視錯覺的模擬(simulation)〕
為了確認本實施形態使用的數理模型是否接近人類的視覺資訊處理,故以色彩的對比視錯覺影像作為原影像執行了以上述實施形態進行的處理。亦即,若數理模型接近人類的視覺資訊處理,則安裝有數理模型的計算機也會計算出視錯覺,因此確認了本實施形態是否能夠實際模擬人類的視錯覺。
第9圖係顯示色彩的對比視錯覺影像的一例之圖。第9圖的左圖(原影像A)與右圖(原影像B),內側四角部分的輝度、明度、色彩完全相同。然而,因為周圍的色彩的配置,人類的視覺資訊處理會產生看起來是不同色彩的錯覺。因此,藉由本實施形態的視錯覺分析裝置100對原影像A與原影像B分別進行了影像處理。第10圖係顯示原影像的內側四角部分(原影像A與B共通)、屬於原影像A的影像處理結果之處理影像A的內側四角部分、屬於原影像B的影像處理結果之處理影像B的內側四角部分之圖。
如第10圖所示,進行以本實施形態的視錯覺分析裝置100進行的影像處理後的結果,與原影像A對應的處理影像A的內側四角部分係表現得比實際鮮 明,與原影像B對應的處理影像B的內側四角部分係表現得比實際暗淡,就如同人類對原影像A、B的辨視運作(視錯覺)。因此,以本實施形態的視錯覺分析裝置100進行的影像處理可說是接近人類的視覺資訊處理。因此,確認了只要如圖示將原影像與處理影像的色成分值之差分算出便能夠將視錯覺量予以定量化。
此外,第11圖係顯示色彩的對比視錯覺影像的其他例之圖。第11圖的左圖(原影像C)與右圖(原影像D)係與前述相同,內側四角部分的輝度、明度、色彩完全相同。第12圖係顯示原影像的內側四角部分(原影像C與D共通)、屬於原影像C的影像處理結果之處理影像C的內側四角部分、屬於原影像D的影像處理結果之處理影像D的內側四角部分之圖。
如第12圖所示,進行以本實施形態的視錯覺分析裝置100進行的影像處理後的結果,與原影像C對應的處理影像C的內側四角部分係表現得比實際灰暗,與原影像D對應的處理影像D的內側四角部分係表現得比實際明亮,就如同人類對原影像C、D的辨視運作(視錯覺)。因此,確認了只要如圖示將原影像與處理影像的色成分值之差分算出便能夠將視錯覺量予以定量化。
此外,第13圖係顯示色彩的對比視錯覺影像的其他例之圖。第13圖的左圖(原影像E)與右圖(原影像F)係與前述相同,內側四角部分的輝度、明度、色彩完全相同。第14圖係顯示原影像的內側四角部分(原 影像E與F共通)、屬於原影像E的影像處理結果之處理影像E的內側四角部分、屬於原影像F的影像處理結果之處理影像F的內側四角部分之圖。
如第14圖所示,進行以本實施形態的視錯覺分析裝置100進行的影像處理後的結果,對應於原影像E的處理影像E的內側四角部分係表現得比實際灰暗,與原影像F對應的處理影像F的內側四角部分係表現得比實際明亮,就如同人類對原影像E、F的辨視運作(視錯覺)。此例乃係顯著地展現了在a*及b*的處理中亦添加L*的值之處理的進行效果之例。因此,確認了只要如圖示將原影像與處理影像的色成分值之差分算出便能夠將視錯覺量予以定量化。
上述的結果確認了以本實施形態的視錯覺分析裝置100進行的影像處理係極接近人類的視覺資訊處理。因此,藉由以使用接近人類的視覺資訊處理的數理模型之本實施形態進行的影像處理,對原影像施行接近人類視覺的資訊處理,便能夠提供人類辨識出的自然的處理影像。因此,接著,計算原影像與該接近腦內辨識影像的處理影像之差分,進行視錯覺量的定量化。此處,第15圖係以原影像與處理影像的內側四角部分內的中心座標的L*的值、a*的值及b*的值之差分及該些差分的合成分數(score)作為視錯覺量而予以圖表化之圖。圖中,縱軸代表經數值化的視錯覺量,橫軸代表9種原影像的編號:1至9。
此處,第16圖至第18圖係顯示9種原影像、原影像中心剖面的L*、a*、b*的圖表、與原影像對應的處理影像、處理影像中心剖面的L*、a*、b*的圖表之圖。另外,如原影像的圖表所示,9種影像的原影像的內側四角部分係共通,僅變更外側的輝度(L*的值)。
以根據該些9種原影像產生的處理影像的中心座標的值之差作為視錯覺量而予以圖表化後的結果為第15圖。如第15圖所示,在編號5,輝度(L*的值)的視錯覺量為最小,相對於此,a*的視錯覺量為最大。此結果係符合克希曼法則(Kirschmann's law)的第三法則「色彩對比在明亮度對比為最小時為最大」,此結果亦成了以本實施形態進行的影像處理乃係與腦內的視覺資訊處理類似之處理的證明。
第19圖係顯示內側小四角形與外側大四角形有均一輝度的原影像、內側小四角形與外側大四角形的輝度有大幅度差異的原影像的對比圖。如第19圖所示,誠如上述的克希曼法則,儘管內側小四角形在兩原影像間是共通的,但在均一輝度的情形中,內側小四角形在人眼中看起來卻會偏紅。為了反映出如此的色彩的對比視錯覺,即使將藉由本實施形態而得的處理影像的內側小四角形取出來看,均一輝度情形的內側小四角形的紅色程度仍提增而成為粉紅色。另外,對於上述「色彩對比在明亮度對比為最小時為最大」的克希曼法則,也有人提出反論,質疑相較於明亮度為均一時,明亮度有些許不同時的視錯覺才會是最大。
因此,如第15圖所示,計算原影像與處理影像間的L*、a*、b*的值之差的平方總和的平方根,即色差,作為該些色成分的視錯覺量的合成分數。結果,如圖所示,可知相較於明亮度為均一的編號5,明亮度有些許不同的編號6的綜合視錯覺量為最大。因此,確認了若是也添加由L*的值導致產生的輝度視錯覺而不是只添加由a*的值導致產生的色彩視錯覺,則亦符合對於克希曼法則的上述反論的內容。
〔色彩的對比視錯覺的實施例〕
此處,作為更具體的實施例,針對色彩的對比視錯覺的視錯覺量的定量化的實施例進行說明。在本實施例中,係藉由本實施形態調查了一顏色在色彩的對比視錯覺下看起來會是怎樣。
此處,第20圖係本實施例中使用的基本圖形。在本實施例中係對具有第20圖的形狀之圖形進行處理。另外,並不以此為限,基本圖形亦可為第20圖以外的圖形,亦可依目的製作。
在本實施例中,將第20圖中以黑色顯示的區域所塗的顏色稱為「背景色」。此外,在本實施例中,將中心小四角形部分所塗的顏色稱為「檢查色」。此外,將對小四角形的中心色因背景色而引起的視錯覺藉由本發明進行計算而導出的顏色稱為「視錯覺色」。
此處,第21圖係顯示本實施例中使用的檢查色之圖。在本實施例中,係使用第21圖的顏色作為檢查色,並調查該檢查色在色彩的對比視錯覺的影響下 看起來是怎樣。另外,檢查色係任意顏色,在選擇檢查色時係可利用數值輸入、利用選色器(color picker)、利用測色計等任一方法進行選擇。
在本實施例中,係於配色有第21圖的檢查色的基本圖形中令背景色一點一點地變化,並分別以含有本實施形態的順方向處理之方法進行處理。接著,從中選擇出一些視錯覺量較多且視錯覺色的傾向不同者。
第22圖係顯示具有根據處理結果選擇的背景色的基本圖形的例子之圖。此外,第23圖係以含有實施形態的順方向處理之方法對第22圖的基本圖形進行處理而導出的視錯覺色的排列圖。亦即,第23圖的各小四角形的顏色並非處理前的檢查色,而是以處理影像的中心的顏色即視錯覺色來塗滿小四角形而成。另外,第23圖中以箭頭標記出視錯覺色相對於檢查色為哪種傾向的顏色。
此處,第22圖中央(以標題「色彩的對比視錯覺」為圖的上方,從上方數下來第2列,左邊數來第5個)的背景色係與檢查色相同顏色,故為一樣的顏色。因此並不會發生視錯覺,因此,相對應的第23圖中央的顏色亦維持為原本的檢查色。在第23圖中,若以視錯覺量作為比較時的基準便容易明暸。
另外,在第23圖中,係為了減輕於視錯覺色上又發生視錯覺的可能,而採用隨機(random)的彩色點作為各小四角形的背景。然而,不管使用何種背景, 在表示視錯覺色時仍必須注意於該背景又產生視錯覺的情形。
關於係數處理結果的表示方法,除了第22圖和第23圖的方法以外,亦可配合目的做改變,例如以連續性變化來表示、以數值來表示、以圖表來表示等。
此處,以藉由本實施形態進行的方法處理基本圖形的各者時,雖然亦可每次進行,但為了使計算高速化,在上述實施例中係將預先計算好的處理結果予以資料表化來使用。更具體言之,係分別對基本圖形的檢查色與背景色之差以一定的間隔變化者進行處理,按各色成分將檢查色與背景色之差、檢查色與視錯覺色之差以資料表的形式保存,檢查色與視錯覺色的色差亦以資料表的形式保存。
藉此,即使改變檢查色,仍能夠根據上述的資料表將與背景色對應的視錯覺量快速地導出。能這麼做的理由有二。其一是本實施例使用的風車小框將影像分解成平均(近似部分)與變化(細節部分),在本實施例中係僅對變化施加非線性處理之故。另一個理由是在本實施例中係使用CIELAB色空間之故。當在色空間內僅發生相同變化時,辨識出的變化也會是相同的色空間適合本實施例。另外,上述的資料表係必須按每個基本圖形進行計算。
如上述,上述的資料表化的方法係能夠實現高速的計算,適合用於觀察視錯覺色的傾向等。另一方面,每次進行計算的方法則適合用於複雜的圖形和想 知道影像整體的視錯覺的樣子時。另外,在本實施例中雖然係指定檢查色,但亦能夠以同樣的方法指定背景色來進行。
藉由此實施例,能幫助找出在印刷等中利用色彩的對比視錯覺的具效果性的色彩組合,確認了在產業上有用。
〔風景照片的實施例〕
在上述的例子中,係針對使用經配色的影像的情形進行說明,但並不以此為限,亦能夠針對人物和風景的撮影照片將視錯覺量予以數值化。此處,第24圖係顯示原影像與本實施形態產生的處理影像的對比圖。
如第24圖所示,依據本實施形態,能夠 以類似人類初期視覺資訊處理的處理獲得接近腦內辨識影像的處理影像。此處,第25圖、第26圖及第27圖分別係顯示第24圖的各照片(512×512個像素)中從左數來第400個像素的行的L*、a*、b*的值之曲線圖。圖中橫軸代表從左數來第400個像素的行中從上算起的列數,縱軸代表各色成分(L*、a*或b*)的值。藍色係表示原影像各點的值之曲線,綠色係表示本實施形態產生的處理影像各點的值之曲線。
亦即,在第25圖至第27圖中,依據本實施形態,就其一例而言,係算出原影像的y軸的值與處理影像的y軸的值之差分作為視錯覺量。如圖所示,關於L*方面,針對有激烈變動的近景(橫軸的400至500 附近),影像處理所產生的影響小,而針對變化緩和的遠景(橫軸的0至300附近),影像處理所產生的影響(視錯覺量)大。此外,不僅是高頻部分,針對低頻部分亦有施行處理。因此,能夠獲得接近人類初期視覺資訊處理的自然的影像。如上述,藉由取得原影像與處理影像之差分,在風景照片等中亦能夠獲得視錯覺量。
〔擬合處理〕
接著,針對本實施形態的視錯覺分析裝置100的擬合處理,以下參照第28圖進行說明。在此擬合處理中,係以針對任意的影像(稱為「初期影像」)獲得在人類腦內被辨識如初期影像般的輸出用影像為目的。亦即,習知技術中,工業設計師等負責配色的人員就算意識到配色的結果對第三人來說,看起來並非能夠如自己原本意圖的初期影像般,卻只能依靠專業經驗上所習得的技術來調整配色,而本擬合處理的目的係在於以視錯覺量作為指標來進行影像編輯,藉此取得被辨識如初期影像般的輸出用影像。此處,第28圖係顯示視錯覺分析裝置100的擬合處理的一例之流程圖。
如第28圖所示,影像編輯部102g係將所期望的初期影像的資料輸入,作為測試影像(步驟SA-0)。另外,初期影像資料乃係任意的影像資料,就其一例而言,可為使用者利用任意的繪圖軟體(graphic software)等製作出的影像資料,亦可為透過數位像機(digital camera)等輸入裝置112所攝得的影像資料。
接著,視錯覺分析裝置100係進行前述的步驟SA-1至SA-4之處理,對測試影像進行多重解析度分解並產生重建的視錯覺影像(步驟SA-1至SA-4)。
接著,視錯覺量數值化部102f係計算初期影像資料與所產生的視錯覺影像資料(重建影像資料)間的色成分之差分作為視錯覺量(步驟SA-5')。例如,視錯覺量數值化部102f係計算影像資料與重建影像資料間同個像素座標的L*、a*、b*各者的值之差作為視錯覺量。接著,視錯覺量數值化部102f係亦可對二維的測試影像以各像素座標的視錯覺量為高度而以三維表示,藉此讓人憑目視明白哪個位置產生何種程度的視錯覺。
接著,影像編輯部102g係判定測試影像資料是否需要修正(步驟SA-6)。例如,影像編輯部102g係可當某座標存在預定臨限值以上的視錯覺量時,判定為需要修正。此外,影像編輯部102g係亦可顯示「是否進行測試影像的修正?」及「是」/「否」按鈕,當使用者透過輸入裝置112對「是」按鈕進行點擊(click)等時,判定為需要修正。
當判定為需要修正時(步驟SA-6,是),令處理回到步驟SA-0,影像編輯部102g係在對測試影像施行編輯後,作為新的測試影像再次輸入(步驟SA-0)。例如,影像編輯部102g係可當如第19圖中所述的影像編號5般有因視錯覺而看起來偏紅色的小區域時,提高該小區域的補色的灰階值以中和紅色的成分,亦可拉大該小區域的與周邊區域間的輝度差以產生明亮度對比。 如上述,於藉由視錯覺量數值化部102f所算出的視錯覺量為預定值以上的同一色區域和與該區域鄰接的同一色區域,影像編輯部102g係可對屬於該區域的像素群選擇性地變更色彩和輝度,亦可進行色彩修正。另外,影像編輯部102g係亦可不是自動進行上述演算法,而是讓使用者透過輸入裝置112於測試影像的直方圖上調整影像的明亮度和對比度。另外,影像編輯部102g係亦可使用公知的最佳化手法(擬合手法)隨機對測試影像施加變更。此外,影像編輯部102g係亦可使用模擬退火(simulated annealing)法等,當藉由視錯覺量數值化部102f所算出的色成分的視錯覺量大時,增加變更量,當視錯覺量小時,減少變更量。
接著,視錯覺分析裝置100係針對藉由影像編輯部102g再次輸入的測試影像反覆進行上述步驟SA-1至SA-6的處理。另外,在反覆處理中,視錯覺量數值化部102f係計算(非再次輸入的測試影像)初期影像資料與根據再次輸入的測試影像產生的視錯覺影像資料間的色成分之差分(步驟SA-5')。
如上述,視錯覺分析裝置100係以隨著反覆處理使色成分之差分成為最小之方式修正測試影像。接著,當如視錯覺量未滿預定臨限值時等而判定為測試影像資料不需要修正時(步驟SA-6,否),視錯覺分析裝置100係將最終獲得的測試影像取得作為輸出用影像,結束擬合處理。
藉由將所獲得的輸出用影像以列印、印刷、顯示、漆畫等方式輸出,看到該輸出用影像的人會在腦內將其辨識為接近初期影像的影像。如上述,依據本實施形態,係進行反覆影像編輯使藉由測試影像產生視錯覺影像與原本的初期影像之差分成為最小,因此能夠獲得亦添加有腦內的視錯覺量份而被人辨識為初期影像的輸出用影像,從而達到不需要如習知般依靠專業技術進行配色調整之效果。
〔逆方向處理〕
以下,針對逆方向處理的一例詳細進行說明。在上述的實施形態中,主要是為了進行視錯覺的定量化而針對從實際影像算出人類辨識出的影像即有視錯覺產生的影像(順方向處理)進行說明。順方向處理乃係與腦中的數理模型相同方向的處理。
相對於順方向處理,從人類觀看影像得的辨識結果算出實際影像的處理,此處稱之為逆方向處理。由於人類會產生視錯覺,所以人類會辨識到非原本所意圖讓人辨識到的色彩。但只要利用逆方向處理,就能夠知道應該讓人觀看哪種色彩的影像才能讓人辨識到原本所意圖的色彩。
另外,本實施形態的逆方向處理並非是順方向處理數學意義上的完全逆轉換。換言之,即使對順方向處理的輸出影像進行逆方向處理,就算近似上接近原影像,但嚴格來說並不會回復成原影像。理由之一在於以本實施形態所使用的方位選擇性小波框和方位選擇 性濾波器組進行的多重解析度分解。例如,在以風車小框進行的最大重複多重解析度分解中,對分解期的次頻帶信號施加非線性處理而得者、與將經過該合成期的輸出影像再度分解的分解期的次頻帶信號一般而言並不一致。除了特殊的情形外,以其他方位選擇性小波框和方位選擇性濾波器組進行的多重解析度分解也會如同上述(關於此點,參照例如「線性代數 基礎與應用」新井仁之著,日本評論社股份有限公司(2006年)出版)。
在逆方向處理中,係對分解期輸出的分解細節係數,進行下述的係數處理:分解細節係數的能量愈大愈將小的值增強,該分解細節係數的能量愈小愈將小的值抑制得更小。例如,使用SN函數時,若是為順方向處理,則將SN函數的指數置換為倒數,藉此便能夠進行前述的係數處理。例如,在前述的〔係數處理的實施例〕中,適當決定前述的b1、b2、b3、b4,將左邊αμ[l,p]的等式的右邊乘以-1後的結果重定為αμ[l,p],藉此便能夠獲得逆方向處理用的函數。
第29圖係本實施例中使用的原影像,第30圖係將中央小四角形部分擷取出之圖。第29圖的中央小四角形部分係如第30圖所示配色為灰色。然而,卻因色彩的對比視錯覺而看起來是帶著粉紅色。亦即,就算提示第29圖希望讓人辨識到灰色的小四角形,觀看的人還是不會辨識成灰色。
因此,對第29圖的原影像施行逆方向處理。第31圖係進行逆方向處理而獲得作為重建影像的視 錯覺添加影像,第32圖係將中央小四角形部分擷取出之圖。如第31圖所示,小四角形起看起來是灰色。亦即,確認了在添加視錯覺量後,看起來如第30圖中所意圖讓人辨識成的顏色。另外,第31圖的小四角形實際上的顏色乃係如第32圖所示接近灰色的綠色。如上述,確認了依據逆方向處理,能夠以將人在進行觀看時的視錯覺消除之方式進行配色,使顏色被辨識為原本所意圖的顏色。
此處,若比較第30圖與第31圖的小四角形部分的色彩,會發現到第30圖看起來比較暗。此係因為在第30圖中背景為白色亦造成色彩的對比視錯覺之故。
因此,接著,準備如第33圖所示將第29圖的外側區域置換成白色而成的影像作為原影像。接著,對第33圖的原影像同樣施行逆方向處理。第34圖係顯示進行逆方向處理而作為重建影像獲得的視錯覺添加影像之圖(在第33圖及第34圖中,影像並未包括框線)。
確認了對第33圖施行逆方向處理而得的第34圖乃係色彩看起來如在第30圖中原本所意圖讓人辨識到的顏色之影像。可知第31圖與第34圖的小四角形看起來是相同色彩。然而實際上,比較第32圖與第34圖即可知是不同的色彩。
如上述,藉由本實施例,確認了能夠獲得在人類腦內被辨識如原影像的視錯覺添加影像。藉此,可知能夠針對任意影像,就關於明暗的視錯覺及色彩的 對比視錯覺,添加腦內的視錯覺量份,而取得被辨識如該影像般的輸出用影像,前述視錯覺及色彩的對比視錯覺的主要因素被認為在於初期視覺資訊處理。
此處,作為其他的實施例,針對對視錯覺影像施行逆方向處理,產生讓人辨識為視錯覺量降低的影像之例進行說明。第35圖係顯示謝佛勒視錯覺圖形之圖。
在第35圖的謝佛勒視錯覺圖形中,各色條都是一定的的顏色,但例如比起中央的色條位於左側的色條中,從色條的左側到右側看起來有從暗到明的階度變化(gradation)。其中該些色條的右緣附近看起來似乎特別明亮。如上述,在謝佛勒視錯覺中,會辨識到原本並沒有的階度變化。
因此,對第35圖的謝佛勒視錯覺圖形施行以本實施形態進行的逆方向處理。第36圖係顯示對謝佛勒視錯覺圖形施行逆方向處理而得的視錯覺添加影像之圖。如第36圖所示,謝佛勒視錯覺係受到相當程度的抑制,幾乎辨識不到階度變化。此處,第37圖係第35圖的謝佛勒視錯覺圖形的原影像與第36圖的視錯覺添加影像的橫剖面的輝度(CIELAB的L*)的曲線圖。圖中的虛線表示原影像的輝度,實線表示視錯覺添加影像的輝度。
如第37圖所示,第35圖的原影像中的各色條的輝度為一定,橫剖面的曲線呈現階梯狀,而施行過逆方向處理的視錯覺添加影像則呈現去除掉角部變動 和緩。這是因為在視錯覺添加影像中已預先估算有在人腦中會附加的視錯覺量,在實際的人腦中係會辨識如第36圖所示,附加視錯覺量而接近原本的階梯狀,即幾乎無階度變化的輝度。
如上述,藉由本實施例,確認了對視錯覺量比較大的視錯覺圖形也施行逆方向處理而得的視錯覺添加影像係能夠辨識如接近原本的原影像的輝度和色調。
因此,可知藉由將上述的視錯覺添加影像作為輸出用影像以列印、印刷、顯示、漆畫等方式輸出,看到該影像的人會在腦內將其辨識為原本的影像,習知依靠專業技術進行的配色調整係能夠使用電腦等自動地獲得。
〔風車小框〕
在本實施形態中,作為例子使用的風車小框係亦可如前述為公知的簡單風車小框或風車小波框等方位選擇性小波框、或具有方位選擇性的濾波器組。此處,以下針對風車小框進行說明。
設次數為n≧3且為奇數,以A=(Ak,l):(n+1)×(n+1)對稱矩陣,找出在s=0、1…、[n/2],t=s、…、[n/2]下滿足As,t=An-s,t=As,n-t=An-s,n-t=s的矩陣。其中,[]代表高斯(Gauss)符號。
n=7時,滿足條件的矩陣如下。
若設B=(Bk,l):(n+1)×(n+1)矩陣,則為滿足下述條件(P)的矩陣。
〔數式19〕個自由變數。
其中,M為方形格子、五眼(quincunx)格子或六角格子的取樣矩陣。
〔數式23〕Λf={(0,0),(0,n),(n,0),(n,n)} Λg={(k,l)}k=0,n;l=1,…,n-1∪{(k,l)}l=0,n;k=1,…,n-1 Λa={(k,l)}k=1,…,n-1;l=1,…,n-1
引理2(H.& S.Arai,2008)Pn為與方形格子、五眼格子、六角格子相關的小框濾波器之必要且充分條件係B=(Bk,l)要滿足以下條件。
<求取滿足上述條件的B=(Bk,l)的方法>
將{(k,l):k=0、1、…、n0,l=s、…、n0、}排序如下。
μ=(k,l),ν=(k',l')
定理3(H.& S.Arai,2008)上述而得的B=(Bk,l)係滿足引理2。因此,Pn成為與方形格子、五眼格子、六角格子相關的小框濾波器。Pn稱為次數n的風車小框(pinwheel framelet of degree n)。第38圖係顯示將階數1的近似濾波器對階數2的最大重複風車小框濾波器(maximal overlap pinwheel framelet filters at level 2)進行循環相關積而得的濾波器之圖。此外,第39圖係顯示對測試影像藉由風車小框進行階數2的最大重複多重解析度分解(2nd stage of maximal overlap MRA decomposition by pinwheel framelet)的結果的各次頻帶信號之圖。
本實施形態的說明至此完畢。如上述,依據本實施形態,能夠提供能夠針對任意影像將可能發生的視錯覺量予以定量化或產生添加視錯覺量的影像之視錯覺的分析裝置、視錯覺添加影像產生裝置、視錯覺的分析方法、視錯覺添加影像產生方法、程式及記錄媒體。 尤其是由於色彩的對比視錯覺及視錯覺添加影像關係到製品等的色彩的呈現方式,因此對於從事施有色彩之製品等的製造.販賣等的產業(印刷、設計、影片、塗裝等產業)而言極為有用。
〔其他實施形態〕
以上已針對本發明的實施形態進行了說明,但除了上述的實施形態以外,本發明亦可在申請專利範圍記載的技術性思想範圍內藉由各種不同的實施形態實施。
例如,雖然上述係以視錯覺分析裝置100為單機(stand alone)的形態進行處理的情形為一例來說明,但視錯覺分析裝置100係亦可為對應來自用戶(client)終端(與視錯覺分析裝置100為不同機體)的要求進行處理,再將其處理結果回覆給該用戶終端。例如,視錯覺分析裝置100係可構成為ASP伺服器,接收經由網路300從用戶終端傳送來的原影像資料,將根據該原影像資料進行加工而得的處理影像的重建影像資料回覆給用戶終端。
此外,實施形態中所說明的各處理之中,說明為自動進行的處理的全部或一部分亦能夠以手動進行,或是說明為手動進行的處理的全部或一部分亦能夠以公知的方法自動進行。
除此之外,針對前述文獻中和圖式中所示的處理步驟、控制步驟、具體的名稱、包括各處理的登錄資料和檢索條件等參數的資訊、畫面例、資料庫結構,除了有特別記載的情形之外皆能夠自由變更。
此外,關於視錯覺分析裝置100,圖示的各構成要素係屬功能性上的示意,實體上並非一定要如圖示般構成。
例如,針對視錯覺分析裝置100的各裝置所具備的處理功能,特別是控制部102進行的各處理功能,其全部或是任意一部分係可以CPU(Central Processing Unit)及由該CPU解譯執行的程式來實現,此外,亦可採用以佈線邏輯(wired logic)構成的硬體來實現。另外,程式係記錄於後述含有用以使電腦執行本發明方法的經程式化後的命令之非暫時性的電腦可讀取的記錄媒體,且依需要接受視錯覺分析裝置100機械性讀取。亦即,在ROM(Read Only Memory;唯讀記憶體)或是HDD(Hard Disk Drive;硬碟)等記憶部106等係記錄有用以作為OS(Operating System)合同運作而給予CPU命令進行各種處理的電腦程式。該電腦程式係藉由載入至RAM(Random Access Memory;隨機存取記憶體)而執行,與CPU合同運作而構成控制部。
此外,該電腦程式係亦可記憶於經由任意的網路300連接至視錯覺分析裝置100的應用程式(application program)伺服器,亦能夠依需要下載其全部或一部分。
此外,亦可將本發明的程式存放在電腦可讀取的記錄媒體,此外亦能夠構成為程式製品。此處,該「記錄媒體」係指包含記憶卡(memory card)、USB記憶體(USB memory)、SD卡(Secure Digital Memory Card)、軟碟(flexible disc)、磁光碟(Magneto-Optical disc)、ROM、EPROM(Erasable Programmable Read-Only Memory;可抹除程式化唯讀記憶體)、EEPROM(Electrically Erasable Programmable Read-Only Memory;電子可抹除可程式化唯讀記憶體)、唯讀光碟(CD-ROM)、MO(Magneto-Optical disc)、數位多功能光碟(DVD)及藍光光碟(Blu-ray Disc)等任意的「可搬用物理媒體」。
此外,「程式」係指以任意的語言和描述方法描述的資料處理方法,不拘是原始碼(source code)、二進位碼(binary code)等形式。另外,「程式」並非一定限於單一性構成,亦包括以複數個模組(module)和程式庫(library)的形式分散構成者、以OS(Operating System)為代表的與個別程式合同運作而達成其功能者。另外,針對實施形態所示的各裝置中用以讀取記錄媒體的具體構成、讀取步驟或讀取後的安裝(install)步驟等,係能夠使用周知的構成和步驟。
存放在記憶部106的各種資料庫等(小框檔案106a、影像資料檔案106b)乃係RAM、ROM等記憶體裝置、硬碟等固定磁碟裝置、軟碟及光碟等儲存手段,存放用於提供給各種處理和網站(web site)的各種程式、資料表、資料庫及網頁用檔案等。
此外,視錯覺分析裝置100係亦可構成為既知的個人電腦、工作站等資訊處理裝置,此外,亦可於該資訊處理裝置連接任意的週邊裝置而構成。此外, 視錯覺分析裝置100係亦可藉由在該資訊處理裝置安裝使本發明方法實現的軟體(包括程式、資料等)而實現。
此外,裝置的分散.整合的具體形態並不限於圖式所示者,係能夠構成為配合各種的附加等或配合功能負載而將其全部或一部分以任意的單位於功能性上或物理性上分散.整合。亦即,可任意組合實施上述實施形態,亦可選擇性實施實施形態。
100‧‧‧視錯覺分析裝置
102‧‧‧控制部
102a‧‧‧分解部
102b‧‧‧係數處理部
102c‧‧‧重建部
102d‧‧‧色空間轉換部
102e‧‧‧處理影像輸出部
102f‧‧‧視錯覺量數值化部
102g‧‧‧影像編輯部
104‧‧‧通訊控制介面部
106‧‧‧記憶部
106a‧‧‧小框檔案
106b‧‧‧影像資料檔案
108‧‧‧輸出入控制介面部
112‧‧‧輸入裝置
114‧‧‧輸出裝置
200‧‧‧外部系統
300‧‧‧網路

Claims (25)

  1. 一種視錯覺的分析裝置,係至少具備記憶部與控制部,該視錯覺的分析裝置的特徵為:前述記憶部係具備:濾波器記憶手段,係記憶屬於無方位性的近似濾波器及複數個具各方位性的細節濾波器之集合的方位選擇性小波框或方位選擇性濾波器組;及影像資料記憶手段,係記憶影像資料;前述控制部係具備:分解手段,係藉由前述方位選擇性小波框或前述方位選擇性濾波器組對前述影像資料的色成分進行多重解析度分解而取得次頻帶信號;重建手段,係將藉由前述分解手段取得的前述次頻帶信號相加,藉此重建影像而取得重建影像資料;及視錯覺量數值化手段,係算出前述影像資料與前述重建影像資料間的前述色成分之比或差,藉此將視錯覺量予以數值化;前述分解手段係進一步具備:係數處理手段,係於前述多重解析度分解的分解期與合成期之間,對前述分解期輸出的分解細節係數進行下述的係數處理:該分解細節係數的能量愈大愈將小的值抑制得更小,該分解細節係數的能量愈小愈將小的值增強。
  2. 如申請專利範圍第1項之視錯覺的分析裝置,其中前述係數處理手段係依前述分解細節係數的正負號之差異而進行個別的處理。
  3. 如申請專利範圍第1項之視錯覺的分析裝置,其中前述色成分係CIELAB色空間的L*、a*、b*其中一者。
  4. 如申請專利範圍第3項之視錯覺的分析裝置,其中前述視錯覺量數值化手段係使用色差,即使用L*的值、a*的值及b*的值於前述影像資料與前述重建影像資料間之差的平方總和的平方根進行計算作為前述視錯覺量。
  5. 如申請專利範圍第3項之視錯覺的分析裝置,其中前述係數處理手段係進行針對前述影像資料的a*及/或b*的色成分進行下述修正的前述係數處理:從a*及/或b*的前述分解細節係數與L*的前述分解細節係數而定的能量愈大愈將小的值抑制得更小,前述能量愈小愈將小的值增強。
  6. 如申請專利範圍第1項之視錯覺的分析裝置,其中前述係數處理手段係使用當前述分解細節係數的能量大時呈S字曲線自動連續變化,當前述能量小時呈N字曲線自動連續變化的函數進行前述係數處理。
  7. 如申請專利範圍第1項之視錯覺的分析裝置,其中前述係數處理手段係於前述分解期與前述合成期之間,正規化前述分解細節係數,以正規化後的前述分解細節係數即正規化分解細節係數之範數作為前述能量,對該正規化分解細節係數進行前述係數處理,再對經 係數處理後的前述正規化分解細節係數進行前述正規化的逆運算。
  8. 如申請專利範圍第1項之視錯覺的分析裝置,其中前述分解手段係使用前述方位性為水平方向、垂直方向、對角方向構成的雙正交小波濾波器組或前述方位性為多方向的風車小框進行前述多重解析度分解。
  9. 如申請專利範圍第1項之視錯覺的分析裝置,其中前述分解手段係於前述多重解析度分解中,亦可使用其他濾波器組,例如依階數進行風車小框的次數之改變等的濾波器組。
  10. 如申請專利範圍第1項之視錯覺的分析裝置,其中藉由前述分解手段進行的前述多重解析度分解係為最大重複多重解析度分解、最大抽減多重解析度分解或部分抽減部分重複多重解析度分解。
  11. 如申請專利範圍第1項之視錯覺的分析裝置,其中前述控制部係進一步具備影像編輯手段,該影像編輯手段係編輯前述影像資料,並進行下述控制:針對經編輯的前述影像資料藉由前述分解手段進行前述多重解析度分解;前述視錯覺量數值化手段係計算從經編輯的前述影像資料取得的前述重建影像資料與未編輯的前述影像資料間之比或差作為前述視錯覺量;前述影像編輯手段係進行使前述視錯覺量變小的反覆編輯。
  12. 如申請專利範圍第1項之視錯覺的分析裝置,其中前述控制部係進一步具備影像編輯手段,該影像編輯手段係編輯前述影像資料,並進行下述控制:針對經編輯的前述影像資料藉由前述分解手段進行前述多重解析度分解;前述視錯覺量數值化手段係計算經編輯的前述影像資料與從該經編輯的前述影像資料取得的前述重建影像資料間之比或差作為前述視錯覺量;前述影像編輯手段係進行使前述視錯覺量成為預定數值的反覆編輯。
  13. 一種視錯覺添加影像產生裝置,係至少具備記憶部與控制部,該視錯覺添加影像產生裝置的特徵為:前述記憶部係具備:濾波器記憶手段,係記憶屬於無方位性的近似濾波器及複數個具各方位性的細節濾波器之集合的方位選擇性小波框或方位選擇性濾波器組;及影像資料記憶手段,係記憶影像資料;前述控制部係具備:分解手段,係藉由前述方位選擇性小波框或前述方位選擇性濾波器組對前述影像資料進行多重解析度分解而取得次頻帶信號;及重建手段,係將藉由前述分解手段取得的前述次頻帶信號相加,藉此重建影像而取得重建影像資料;前述分解手段係進一步具備: 係數處理手段,係於前述多重解析度分解的分解期與合成期之間,對前述分解期輸出的分解細節係數進行下述的係數處理:該分解細節係數的能量愈大愈將小的值增強,該分解細節係數的能量愈小愈將小的值抑制得更小。
  14. 如申請專利範圍第13項之視錯覺添加影像產生裝置,其中前述係數處理手段係依前述分解細節係數的正負號之差異而進行個別的處理。
  15. 如申請專利範圍第13項之視錯覺添加影像產生裝置,其中前述影像資料的色成分係CIELAB色空間的L*、a*、b*其中一者。
  16. 如申請專利範圍第15項之視錯覺添加影像產生裝置,其中前述係數處理手段係進行針對前述影像資料的a*及/或b*的色成分進行下述修正的前述係數處理:從a*及/或b*的前述分解細節係數與L*的前述分解細節係數而定的能量愈大愈將小的值增強,前述能量愈小愈將小的值抑制得更小。
  17. 如申請專利範圍第13項之視錯覺添加影像產生裝置,其中前述係數處理手段係使用當前述分解細節係數的能量大時呈N字曲線自動連續變化,當前述能量小時呈S字曲線自動連續變化的函數進行前述係數處理。
  18. 如申請專利範圍第13項之視錯覺添加影像產生裝置,其中前述係數處理手段係於前述分解期與前述合成期之間,正規化前述分解細節係數,以正規化後的 前述分解細節係數即正規化分解細節係數之範數作為前述能量,對該正規化分解細節係數進行前述係數處理,再對經係數處理後的前述正規化分解細節係數進行前述正規化的逆運算。
  19. 如申請專利範圍第13項之視錯覺添加影像產生裝置,其中前述分解手段係使用前述方位性為由水平方向、垂直方向、對角方向構成的雙正交小波濾波器組或前述方位性為多方向的風車小框進行前述多重解析度分解。
  20. 如申請專利範圍第13項之視錯覺添加影像產生裝置,其中前述分解手段係於前述多重解析度分解中,亦可使用其他濾波器組,例如依階數進行風車小框的次數之改變等的濾波器組。
  21. 如申請專利範圍第13項之視錯覺添加影像產生裝置,其中藉由前述分解手段進行的前述多重解析度分解係為最大重複多重解析度分解、最大抽減多重解析度分解或部分抽減部分重複多重解析度分解。
  22. 一種視錯覺的分析方法,係在至少具備記憶部與控制部的視錯覺分析裝置中執行,該視錯覺的分析方法的特徵為:前述記憶部係具備:濾波器記憶手段,係記憶屬於無方位性的近似濾波器及複數個具各方位性的細節濾波器之集合的方位選擇性小波框或方位選擇性濾波器組;及影像資料記憶手段,係記憶影像資料; 含有在前述控制部執行的下述步驟:分解步驟,係藉由前述方位選擇性小波框或前述方位選擇性濾波器組對前述影像資料的色成分進行多重解析度分解而取得次頻帶信號;重建步驟,係將藉由前述分解步驟取得的前述次頻帶信號相加,藉此重建影像而取得重建影像資料;及視錯覺量數值化步驟,係算出前述影像資料與前述重建影像資料間的前述色成分之比或差,藉此將視錯覺量予以數值化;前述分解步驟係進一步含有:係數處理步驟,係於前述多重解析度分解的分解期與合成期之間,對前述分解期輸出的分解細節係數進行下述的係數處理:該分解細節係數的能量愈大愈將小的值抑制得更小,該分解細節係數的能量愈小愈將小的值增強。
  23. 一種視錯覺添加影像產生方法,係在至少具備記憶部與控制部的視錯覺添加影像產生裝置中執行,該視錯覺添加影像產生方法的特徵為:前述記憶部係具備:濾波器記憶手段,係記憶屬於無方位性的近似濾波器及複數個具各方位性的細節濾波器之集合的方位選擇性小波框或方位選擇性濾波器組;及影像資料記憶手段,係記憶影像資料;含有在前述控制部執行的下述步驟: 分解步驟,係藉由前述方位選擇性小波框或前述方位選擇性濾波器組對前述影像資料進行多重解析度分解而取得次頻帶信號;及重建步驟,係將藉由前述分解步驟取得的前述次頻帶信號相加,藉此重建影像而取得重建影像資料;前述分解步驟係進一步含有:係數處理步驟,係於前述多重解析度分解的分解期與合成期之間,對前述分解期輸出的分解細節係數進行下述的係數處理:該分解細節係數的能量愈大愈將小的值增強,該分解細節係數的能量愈小愈將小的值抑制得更小。
  24. 一種程式,係用以使至少具備記憶部與控制部的視錯覺分析裝置執行視錯覺的分析方法,該程式的特徵為:前述記憶部係具備:濾波器記憶手段,係記憶屬於無方位性的近似濾波器及複數個具各方位性的細節濾波器之集合的方位選擇性小波框或方位選擇性濾波器組;及影像資料記憶手段,係記憶影像資料;使在前述控制部執行下述步驟:分解步驟,係藉由前述方位選擇性小波框或前述方位選擇性濾波器組對前述影像資料的色成分進行多重解析度分解而取得次頻帶信號;重建步驟,係將藉由前述分解步驟取得的前述次頻帶信號相加,藉此重建影像而取得重建影像資料;及 視錯覺量數值化步驟,係算出前述影像資料與前述重建影像資料間的前述色成分之比或差,藉此將視錯覺量予以數值化;於前述分解步驟中進一步使下述步驟執行:係數處理步驟,係於前述多重解析度分解的分解期與合成期之間,對前述分解期輸出的分解細節係數進行下述的係數處理:該分解細節係數的能量愈大愈將小的值抑制得更小,該分解細節係數的能量愈小愈將小的值增強。
  25. 一種程式,係用以使至少具備記憶部與控制部的視錯覺添加影像產生裝置執行視錯覺添加影像產生方法,該程式的特徵為:前述記憶部係具備:濾波器記憶手段,係記憶屬於無方位性的近似濾波器及複數個具各方位性的細節濾波器之集合的方位選擇性小波框或方位選擇性濾波器組;及影像資料記憶手段,係記憶影像資料;使在前述控制部執行下述步驟:分解步驟,係藉由前述方位選擇性小波框或前述方位選擇性濾波器組對前述影像資料進行多重解析度分解而取得次頻帶信號;及重建步驟,係將藉由前述分解步驟取得的前述次頻帶信號相加,藉此重建影像而取得重建影像資料;於前述分解步驟中進一步使下述步驟執行: 係數處理步驟,係於前述多重解析度分解的分解期與合成期之間,對前述分解期輸出的分解細節係數進行下述的係數處理:該分解細節係數的能量愈大愈將小的值增強,該分解細節係數的能量愈小愈將小的值抑制得更小。
TW102135306A 2012-09-28 2013-09-30 Visual illusion analysis device, visual illusion adding image generating device, visual illusion analysis method, visual illusion adding image generation method, and program TWI559255B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012216718 2012-09-28

Publications (2)

Publication Number Publication Date
TW201419213A TW201419213A (zh) 2014-05-16
TWI559255B true TWI559255B (zh) 2016-11-21

Family

ID=50388545

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102135306A TWI559255B (zh) 2012-09-28 2013-09-30 Visual illusion analysis device, visual illusion adding image generating device, visual illusion analysis method, visual illusion adding image generation method, and program

Country Status (7)

Country Link
US (1) US9426333B2 (zh)
EP (1) EP2902965B1 (zh)
JP (1) JP5622971B2 (zh)
KR (1) KR101769042B1 (zh)
CN (1) CN104781847B (zh)
TW (1) TWI559255B (zh)
WO (1) WO2014051169A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5385487B1 (ja) * 2012-02-29 2014-01-08 独立行政法人科学技術振興機構 スーパーハイブリッド画像生成装置、スーパーハイブリッド画像生成方法、印刷媒体製造方法、電子媒体製造方法、および、プログラム
CN104968272A (zh) * 2013-01-30 2015-10-07 国立研究开发法人科学技术振兴机构 图像处理用数字滤波器、图像处理装置、印刷介质、记录介质、图像处理方法以及程序
JP5785352B1 (ja) * 2015-02-25 2015-09-30 楽天株式会社 情報処理装置、情報処理方法、プログラム、記憶媒体
US11263783B2 (en) 2019-06-27 2022-03-01 Greg BORKMAN Color prediction using machine learning
WO2023028769A1 (zh) * 2021-08-30 2023-03-09 Oppo广东移动通信有限公司 成像模组、成像系统、图像处理方法及终端

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200947352A (en) * 2008-05-01 2009-11-16 Qisda Corp Method for halftone image transformation, printing and halftone mask generation
WO2012067254A1 (ja) * 2010-11-15 2012-05-24 独立行政法人科学技術振興機構 錯視画像生成装置、媒体、画像データ、錯視画像生成方法、印刷媒体製造方法、および、プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6907143B2 (en) * 2001-05-16 2005-06-14 Tektronix, Inc. Adaptive spatio-temporal filter for human vision system models
US6941017B2 (en) * 2001-09-18 2005-09-06 Tektronix, Inc. Temporal processing for realtime human vision system behavior modeling
US7780364B2 (en) * 2008-05-01 2010-08-24 Mitsubishi Electric Research Laboratories, Inc. Apparatus and method for reducing glare in images
JP2009296039A (ja) * 2008-06-02 2009-12-17 Canon Inc 画像処理装置、画像処理方法ならびにそのプログラムおよび記憶媒体
RU2512135C2 (ru) * 2008-11-18 2014-04-10 Панасоник Корпорэйшн Устройство воспроизведения, способ воспроизведения и программа для стереоскопического воспроизведения
CN104285239B (zh) * 2012-05-14 2018-02-23 独立行政法人科学技术振兴机构 图像处理装置、图像处理方法、以及印刷介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200947352A (en) * 2008-05-01 2009-11-16 Qisda Corp Method for halftone image transformation, printing and halftone mask generation
WO2012067254A1 (ja) * 2010-11-15 2012-05-24 独立行政法人科学技術振興機構 錯視画像生成装置、媒体、画像データ、錯視画像生成方法、印刷媒体製造方法、および、プログラム

Also Published As

Publication number Publication date
KR20150099707A (ko) 2015-09-01
EP2902965A1 (en) 2015-08-05
US9426333B2 (en) 2016-08-23
CN104781847B (zh) 2018-02-06
CN104781847A (zh) 2015-07-15
US20150264222A1 (en) 2015-09-17
JPWO2014051169A1 (ja) 2016-08-25
JP5622971B2 (ja) 2014-11-12
KR101769042B1 (ko) 2017-08-17
EP2902965A4 (en) 2016-06-08
TW201419213A (zh) 2014-05-16
EP2902965B1 (en) 2020-05-13
WO2014051169A1 (ja) 2014-04-03

Similar Documents

Publication Publication Date Title
JP6162283B2 (ja) 画像処理装置、画像処理方法、および、画像処理プログラム
TWI559255B (zh) Visual illusion analysis device, visual illusion adding image generating device, visual illusion analysis method, visual illusion adding image generation method, and program
CN107798661B (zh) 一种自适应的图像增强方法
CN108364270B (zh) 偏色图像颜色还原方法及装置
WO2021082088A1 (zh) 一种色调映射方法、装置及电子设备
CN101241593A (zh) 图层影像的影像处理装置及其方法
Khudhair et al. Color to grayscale image conversion based on singular value decomposition
CN114222033B (zh) 一种基于经验模态分解的自适应欧拉视频放大方法
CN115082296A (zh) 一种基于小波域图像生成框架的图像生成方法
Gavet et al. Image Processing Tutorials with Python®
US10943338B2 (en) Edge-induced visual illusion generation apparatus, method of generating edge-induced visual illusion, edge-induced visual illusion generation program, printing medium, and recording medium
Aydin et al. HyperColorization: propagating spatially sparse noisy spectral clues for reconstructing hyperspectral images
Richter et al. Digital Processes and Multimedia
JP6417938B2 (ja) 画像処理装置、画像処理方法、プログラム、及び記録媒体
Aydin Human visual system models in computer graphics
CN103164841B (zh) 对灰度图像进行伪彩色处理的方法及装置
Hossain Image restoration using distance transformation and neighboring pixel method