KR20080065447A - 영상의 속성에 기초한 영상 분류 방법 및 장치 - Google Patents

영상의 속성에 기초한 영상 분류 방법 및 장치 Download PDF

Info

Publication number
KR20080065447A
KR20080065447A KR1020070002595A KR20070002595A KR20080065447A KR 20080065447 A KR20080065447 A KR 20080065447A KR 1020070002595 A KR1020070002595 A KR 1020070002595A KR 20070002595 A KR20070002595 A KR 20070002595A KR 20080065447 A KR20080065447 A KR 20080065447A
Authority
KR
South Korea
Prior art keywords
components
brightness
image
color space
saturation
Prior art date
Application number
KR1020070002595A
Other languages
English (en)
Other versions
KR100886339B1 (ko
Inventor
조민기
로니어 루오
조희근
강병호
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020070002595A priority Critical patent/KR100886339B1/ko
Priority to US11/984,685 priority patent/US20080181493A1/en
Priority to CN2008100016413A priority patent/CN101222575B/zh
Priority to EP08150090A priority patent/EP1947577B1/en
Priority to JP2008001753A priority patent/JP5411433B2/ja
Publication of KR20080065447A publication Critical patent/KR20080065447A/ko
Application granted granted Critical
Publication of KR100886339B1 publication Critical patent/KR100886339B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/64Circuits for processing colour signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/35Categorising the entire scene, e.g. birthday party or wedding scene

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 입력 영상을 비즈니스 그래픽 영상 또는 사진 영상으로 분류하는 기술에 관한 것이다.
영상 분류 장치는 입력 영상을 밝기-채도 색공간의 성분으로 변환하는 색공간 변환부와, 상기 변환된 성분 중 밝기 성분의 밝기 빈도 분포를 계산하는 밝기 분석부와, 상기 변환된 성분 중 채도 성분의 평균을 계산하는 채도 분석부와, 상기 계산된 밝기 빈도 분포 및 채도 성분의 평균을 이용한 평가 함수를 소정의 문턱값과 비교하여 상기 입력 영상을 분류하는 영상 분류부로 이루어진다.
영상 속성, 사진 영상, 비즈니스 영상, CIELab

Description

영상의 속성에 기초한 영상 분류 방법 및 장치 {Method and apparatus for classifying Image based on the Image Feature}
도 1은 입력 영상을 분류한 후 각각의 영상에 적합한 색역 사상 기술을 적용하는 개념을 설명하는 도면.
도 2는 본 발명의 일 실시예에 따른 영상 속성에 기초한 영상 분류 장치의 구성을 도시하는 블록도.
도 3은 입력 영상의 RGB 데이터를 CIELab의 색공간의 데이터로 변환하는 과정을 보여주는 도면.
도 4는 입력 영상의 RGB 데이터를 CIECAM02의 색공간의 데이터로 변환하는 과정을 보여주는 도면.
도 5는 다층 퍼셉트론의 기본 개념을 보여주는 도면.
도 6은 본 발명의 일 실시예에 따른 영상 속성에 기초한 영상 분류 방법을 도시하는 흐름도.
(도면의 주요부분에 대한 부호 설명)
100 : 영상 분류 장치 105 : 색공간 변환부
110 : 밝기 분석부 120 : 채도 분석부
130 : 경계 분석부 140 : 영상 분류부
본 발명은 영상 처리 기술에 관한 것으로, 보다 상세하게는 주어진 입력 영상을 비즈니스 그래픽 영상 또는 사진 영상으로 분류하는 기술에 관한 것이다.
디스플레이 장치의 출력 특성을 기준 색상 또는 다른 장치에 맞게 설정하는 과정을 색보정(color calibration)이라고 하며, 인쇄할 색상을 정확하게 표현하기 위해 널리 사용된다. 모니터는 RGB(red, green, blue) 표현 방식이므로 CMYK(cyan, magenta, yellow, black) 잉크를 사용하는 프린터로 인쇄하기 위해 색 보정을 한다. 색 보정은 색 정의표(color lookup table) 값을 이용해서 작업한다.
그리고, 일반적으로 모니터, 스캐너, 카메라, 프린터 등과 같은 색을 재현하는 컬러 입출력 장치는 각각의 사용 분야에 따라 서로 다른 색공간(color space), 혹은 컬러 모델을 사용하고 있다. 예컨대, 컬러 영상의 경우 인쇄 장치에서는 CMY 또는 CMYK 색공간을 사용하고, 컬러 CRT(Cathode Ray Tube) 모니터나 컴퓨터 그래픽 장치에서는 RGB 색공간을 사용하며, 색상, 채도, 밝기를 각각 다루어야 하는 장치들은 HSI 색공간을 사용한다. 또한, 어느 장치에서나 정확하게 재생될 수 있는, 이른바 장치 독립적 컬러를 정의하기 위해 CIE 색공간이 사용되기도 하는데, 대표적으로 CIEXYZ, CIELab, CIELuv 색공간 등이 있다. 컬러 입출력 장치들간에는 이러한 색공간 외에도 표현할 수 있는 색의 범위, 즉 색역(color gamut)이 서로 상이할 수 있다. 이러한 색역의 차이로 인해 동일한 영상을 서로 다른 입출력 장치에서 관 찰하면 그 영상은 동일하지 않게 된다.
상기 CIELab 색상 모델은 국제 조명 협회(Commission Internationale d' Eclairge; CIE)가 색상 측정을 위한 국제 표준으로 제안한 최초의 색상 모델을 바탕으로 한다. CIELab 색상은 장치 독립적이다. 즉 이미지를 만들거나 출력하는데 사용하는 모니터, 프린터, 또는 컴퓨터와 같은 특정 장치에 상관없이 일정한 색을 만든다. CIELab 색상은 광도, 즉 밝기 요소(L)와 두 색조 a와 b 로 이루어진다. a 요소는 녹색에서 적색 사이에 위치하며, b 요소는 청색에서 황색 사이에 위치한다.
또한, 마이크로소프트에서는 윈도우 비스타(Windows VistaTM)이후 컬러 매칭을 위한 색공간으로 기존의 CIELab 색공간 외에 CIECAM02 색공간을 지원한다. CIECAM02 색공간은 CIELab 색공간에 비해 인간의 시각 특성을 보다 더 정확하게 모델링하였으며, 관찰 환경을 반영할 수 있다. 즉, 기존의 OS의 CMS(Color Management System, 이하 CMS)에서는 디스플레이와 프린터의 컬러 매칭시 관찰광원을 D50로 고정하였으나, 윈도우 비스타에서는 CIECAM02의 색공간을 지원하여 D50 광원 이외에 D65광원, F 광원, A 광원 등 다양한 조명 하에서 영상을 비교 관찰할 수 있게 되었다.
한편, 국제 색관리 표준화 단체인 ICC(International Color Consortium; http://www.color.org)는 렌더링 목적(rendering intents)에 따라 색역 사상 기술을 달리 적용하는 것을 표준으로 정하였다. 이러한 렌더링 목적으로는 지각 목적(perceptual intent), 상대적 측색 목적(relative colorimetric intent), 채도 목적(saturated intent) 등이 있다. 상대적 측색 목적을 제외한 2가지의 목적을 영상에 따라 적응적으로 적용하기 위해서는 먼저 주어진 영상이 비즈니스 그래픽 영상(business graphic image)인지 일반 사진 영상(photo image)인지를 판단해야 한다. 물론, 상대적 측색 목적에서도, 색차 최소화를 목적으로 하여 시감적으로 우수한 영상을 획득하는 데에는 이러한 판단이 필요할 수도 있다.
도 1은 영상 분류기를 통해 주어진 영상을 비즈니스 그래픽 영상 또는 사진 영상으로 분류한 후 각각의 영상에 적합한 색역 사상 기술을 적용하는 예를 보여준다. 도 1에 나타난 바와 같이, 입력 영상은 영상 분류기에 의해 비즈니스 그래픽 영상 또는 사진 영상으로 분류된다. 그 후, 각각의 영상 분류에 따라 최적화된 색역 사상을 적용하여 우수한 화질의 출력 영상을 획득할 수 있다. 즉, 비즈니스 그래픽 영상으로 분류된 입력 영상은 ICC 채도 색역 사상(ICC saturated gamut mapping)을, 사진 영상으로 분류된 입력 영상은 ICC 지각 색역 사상(ICC perceptual gamut mapping)을 적용하는 것이다.
그런데, 이와 같이 적절한 색역 사상을 적용하여 출력 영상을 향상시키기 위해서는 상기 영상 분류기에서의 정확한 영상 분류가 선행되어야 한다. 따라서, 영상의 정보 중 밝기 분포 분석, 채도 분석 및 경계선 분석 등의 다양한 분석을 통하여 입력 영상의 특성을 분류할 수 있는 기술을 고안할 필요가 있다.
본 발명이 이루고자 하는 기술적 과제는, 입력 영상을 보다 정확히 비즈니스 그래픽 영상 또는 사진 영상으로 분류하는 방법 및 장치를 제공하는 것이다.
본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기 기술적 과제를 달성하기 위한 본 발명의 일 실시예에 따른, 입력 영상을 비즈니스 그래픽 영상과 사진 영상으로 분류하는 장치는, 상기 입력 영상을 밝기-채도 색공간의 성분으로 변환하는 색공간 변환부; 상기 변환된 성분 중 밝기 성분의 밝기 빈도 분포를 계산하는 밝기 분석부; 상기 변환된 성분 중 채도 성분의 평균을 계산하는 채도 분석부; 및 상기 계산된 밝기 빈도 분포 및 채도 성분의 평균을 이용한 평가 함수를 소정의 문턱값과 비교하여 상기 입력 영상을 분류하는 영상 분류부를 포함한다.
상기 기술적 과제를 달성하기 위한 본 발명의 일 실시예에 따른, 입력 영상을 비즈니스 그래픽 영상과 사진 영상으로 분류하는 방법은, 상기 입력 영상을 밝기-채도 색공간의 성분으로 변환하는 단계; 상기 변환된 성분 중 밝기 성분의 밝기 빈도 분포를 계산하는 단계; 상기 변환된 성분 중 채도 성분의 평균을 계산하는 단계; 및 상기 계산된 밝기 빈도 분포 및 채도 성분의 평균을 이용한 평가 함수를 소정의 문턱값과 비교하여 상기 입력 영상을 분류하는 단계를 포함한다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태 로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
이하, 도면을 참조하여 본 발명의 일 실시예를 설명한다.
도 2는 본 발명의 일 실시예에 따른 영상 속성에 기초한 영상 분류 장치(100)의 구성을 도시하는 블록도이다. 영상 분류 장치(100)는 색공간 변환부(105), 밝기 분석부(110), 채도 분석부(120), 경계 분석부(130) 및 영상 분류부(140)를 포함하여 구성될 수 있다.
먼저, 색공간 변환부(105)는 입력 영상의 RGB 데이터를 밝기와 채도 성분으로 이루어진 색공간으로 변환한다. 상기 변환되는 색공간으로는 전술한 바와 같은, CIELab, CIECAM02 등이 있다.
도 3은 입력 영상의 RGB 데이터를 CIELab의 색공간의 데이터로 변환(transform)하는 과정을 보여주는 도면이다. RGB 데이터는 직접 Lab 데이터로는 변환될 수 없으며, 중간에 XYZ 데이터(CIEXYZ 색공간 상의 데이터)로의 변환 과정이 필요하다. 즉, RGB 데이터를 Lab 데이터로 변환하는 과정은 RGB 데이터를 XYZ 데이터로 변환하는 단계(S31)와, 변환된 XYZ 데이터를 Lab 데이터로 변환하는 단계(S32)로 이루어진다. 상기 제1 단계(S31)는 디스플레이되는 RGB 패치들을 측색 장비로 측색하여 XYZ 데이터를 획득함으로써 이루어진다. 다른 방법으로서, 상기 제1 단계(S31)에서, sRGB 모델에 의해 RGB 데이터를 XYZ 데이터로 변환할 수도 있 다. 이에 관한 참고문헌 1(IEC TC-100, IEC 61966-2-1, Color Management Default RGB Color Space sRGB, 1999)을 통하면 보다 자세한 방법을 알 수 있다. 상기 참고문헌 1에 따르면, RGB 데이터는 rR, rG, rB 성분으로 변환된 후, 특정 변환 매트릭스에 의하여 XYZ 데이터로 변환된다.
다음으로, 상기 제2 단계(S32)에서, XYZ 데이터는 다음의 수학식 1에 따라서 Lab 데이터로 변환될 수 있다.
Figure 112007002277469-PAT00001
수학식 1에서 L은 밝기(lightness)를 나타내고, a는 redness-greeness(적색 및 녹색 사이의 색상)를, b는 yellowness-blueness(청색 및 황색 사이의 색상)를 각각 나타낸다.
한편, 도 4는 입력 영상의 RGB 데이터를 CIECAM02의 색공간의 데이터(JCh 데이터)로 변환하는 과정을 보여주는 도면이다. 상기 과정은 입력 영상의 RGB 데이터를 XYZ 데이터로 변환하는 단계(S31)와, 변환된 XYZ 데이터를 JCh 데이터로 변환하는 단계(S41)로 이루어진다. 상기 JCh 데이터에서, J는 밝기를 나타내고, C는 채도 를, h는 색상을 각각 나타낸다. 상기 S31 단계는 도 3에서와 동일하다. 다만, S41 단계는 참고문헌 2(Nathan Moroney, Mark Fairchild, Robert Hunt, Changjun Li, Ronnier Luo and Todd Newman, The CIECAM02 Color Appearance Model, IS&T/SID 10th Color Imaging Conference)에 기재된 방법을 이용할 수 있다. 상기 참고문헌 2에서는, 참조 백색의 XYZ 데이터(CIEXYZ of the reference white), 참조 조건에서의 참조 백색(Reference white in reference conditions), 적응 필드의 사진 휘도(Photopic luminance of the adapting field), 배경 휘도 인자(Background luminance factor), 주변 파라미터(Surround parameters) 및 배경 파라미터(Background parameters) 등을 이용하여, XYZ 데이터를 JCh 데이터로 변환하는 방법을 개시한다.
다시 도 2를 참조하면, 색공간 변환부(105)는 변환된 밝기-채도 공간의 데이터(Lab 데이터, JCh 데이터 등)를 밝기 분석부(110), 채도 분석부(120) 및 경계 분석부(130)에 제공한다.
밝기 분석부(110)는 색공간 변환부(105)로부터 제공되는 밝기 성분을 이용하여 입력 영상의 밝기 빈도 분포(Lightness Frequency Distribution; 이하 LFD라고 함)를 계산한다. 상기 밝기 빈도 분포란 밝기 성분이 전체 범위에서 얼마나 연속적으로 분포하는가를 나타내는 지표이다. 상기 밝기 빈도 분포(LFD)는 예를 들어, 다음의 수학식 2에 의하여 계산될 수 있다.
Figure 112007002277469-PAT00002
수학식 2에서, Li는 Lab 영상의 i번째 밝기 성분을 의미하고, num_Li는 Li의 빈도를 나타낸다. 상기 i가 0에서 N까지의 범위를 가진다고 할 때, L0는 가장 어두운 밝기 성분 값이고, LN은 가장 밝은 밝기 성분 값이다. 수학식 2에 따르면, LFD는 유사한(인접한) 밝기 성분(Li 및 Li +1) 간에 발생 빈도가 유사할수록 작아지고, 그것이 유사하지 않을수록 커지는 특성을 갖는다. 즉, 일반 사진 영상에서는 LFD가 작아지고, 비즈니스 그래픽 영상에서는 LFD가 커진다.
채도 분석부(120)는 색공간 변환부(105)로부터 제공되는 채도 성분의 평균(Avg_C)을 계산한다. 상기 평균은 Lab 영상의 모든 화소가 갖는 채도의 평균 또는, 상기 Lab 영상으로부터 샘플링된 영상의 화소가 갖는 채도에 대한 평균을 의미할 수 있다. Lab 영상의 채도는 일반적으로 다음의 수학식 3과 같이 계산될 수 있다.
Figure 112007002277469-PAT00003
일반적으로, 사진 영상은 채도 성분의 평균(Avg_C)이 비즈니스 그래픽 영상에 비하여 높게 나타나므로, 상기 채도 성분의 평균의 크기를 통하여 입력 영상의 특성을 가늠할 수 있다.
경계 분석부(130)는 색공간 변환부(105)로부터 제공되는 밝기 성분의 주파수 분포를 계산한다. 보다 자세히, 경계 분석부(130)는 색공간 변환부(105)로부터 제공되는 밝기 성분을 이용하여 입력 영상의 푸리에 주파수 분포(Fourier Frequency Distribution)를 계산한다. 상기 주파수 분포는 상기 밝기 성분으로 표현된 영상을 주파수 변환(예: 이산 코사인 변환)하여 얻어지는 영상의 분포를 의미한다. 일반적으로, 비즈니스 그래픽 사진 영상은 상대적으로 고주파 성분이 많고, 사진 영상은 상대적으로 저주파 성분이 많다. 따라서, 입력 영상을 주파수 변환하여 얻어지는 주파수 영역에서의 분포에서, 사진 영상은 저주파수 성분을 포함한 다양한 주파수 성분을 나타냄에 비하여, 비즈니스 그래픽 영상은 주로 고주파수 성분을 나타낸다.
이러한 특성을 구분하기 위한 상기 푸리에 주파수 분포(FFD)는 다음의 수학식 4에 따라서 계산될 수 있다.
Figure 112007002277469-PAT00004
수학식 4에서, Ai는 Lab 영상의 i번째 주파수 성분(예: L에 대한 주파수 성분)을 의미하고, num_Ai는 Ai의 빈도를 나타낸다. 상기 i가 0에서 M까지의 범위를 가진다고 할 때, A0는 가장 낮은 주파수 성분 값이고, AM은 가장 높은 주파수 성분 값이다. 수학식 4에 따르면, FFD는 유사한(인접한) 주파수 성분(Ai 및 Ai +1) 간에 발생 빈도가 유사할수록 작아지고, 그것이 유사하지 않을수록 커지는 특성을 갖는다. 따라서, 입력 영상이 사진 영상일 때 FFD는 작아지고, 입력 영상이 비즈니스 그래픽 영상일 때 FFD는 커진다.
영상 분류부(140)는 상기 계산된 LFD, Avg_C 및 FFD를 소정의 문턱값과 비교하여 입력 영상이 비즈니스 그래픽 영상인지 사진 영상인지를 최종적으로 판단한다. 그런데, 상기 세 가지 파라미터에 대하여, 각각 문턱값을 설정한다면, 서로 상반된 판단이 나올 수가 있다. 따라서, 상기 세 가지 파라미터를 통합하여 하나의 문턱값으로 설정할 필요가 있다. 이를 위하여, 영상 분류부(140)는 신경망(Neural Network) 알고리즘을 이용하여, 상기 세 가지 파라미터를 포괄한 하나의 평가 함수를 계산하고, 상기 평가 함수에 대한 하나의 문턱값을 설정한다. 영상 분류부(140)는 상기 평가 함수가 상기 설정된 문턱값을 넘는가 여부에 따라 입력 영상을 비즈니스 그래픽 영상 또는 사진 영상으로 분류한다.
상기 신경망 알고리즘 중에서도 가장 많이 사용되는 것이 다층 퍼셉트론(MLP; multi-layer perceptron) 신경망이다. 도 5는 다층 퍼셉트론의 기본 개념을 보여준다. 입력 벡터는 x1 내지 xn의 n개의 파라미터 및 바이어스 항인 모멘텀 상수(1로 정의됨)로 이루어진다. 각각의 입력 값은 가중치 각각 wi에 의하여 곱해진 후, 가산기(51)에 의하여 더해진다. 그리고 그 더해진 결과에 대하여, 간단한 함수 f(x)(52)가 적용된다. 이러한 함수는 실행 함수 또는 평가 함수라고 알려져 있다.
이러한 과정을 통하여 계산되는 뉴런(y)은 다음의 수학식 5와 같이 표현될 수 있다.
y = f (w0 + x1*w1 + ... + xn*wn )
본 발명에서의 일 실시예와 같이, 세 개의 파라미터 LFD, Avg_C 및 FFD가 사용된다고 하면, n=3이고 x1 내지 x3은 임의의 영상 하나에 대한 LFD, Avg_C 및 FFD에 각각 해당된다. 수학식 5의 평가 함수 f(x)는 다양한 형태로 정의될 수 있는데, 다음의 수학식 6과 같은 시그모이드 함수로서 정의될 수 있다.
f(u) = 1 / (1 + e-u )
한편, 다층 퍼셉트론 신경망은 상기 가중치들을 적응(adapt)시킴으로써 복수의 입력 영상에 대하여 훈련(train)된다. 상기 훈련하는 동안에, 신경망 출력은 의도되는(desired) 출력과 비교된다. 상기 두 개의 신호 간의 차이는 가중치를 적응시키는 데 사용된다. 적응의 비율은 학습률(learning rate)에 의하여 제어될 수 있다.
이러한 학습 과정을 통하여, 수렴된 평가 함수는 예컨대, 0과 1사이에 존재할 수 있다. 사용자가 0을 사진 영상으로 1을 비즈니스 그래픽 영상으로 지정하였다면, 상기 평가 함수에 대하여 0.5를 문턱값으로 설정하여 영상을 분류할 수 있다. 즉, 수렴된 평가 함수가 0.5 이하 이면 사진 영상으로 0.5 이상이면 비즈니스 그래픽 영상으로 분류하는 것이다.
지금까지 도 2의 각 구성요소들은 메모리 상의 소정 영역에서 수행되는 태스크, 클래스, 서브 루틴, 프로세스, 오브젝트, 실행 쓰레드, 프로그램과 같은 소프트웨어(software)나, FPGA(field-programmable gate array)나 ASIC(application-specific integrated circuit)과 같은 하드웨어(hardware)로 구현될 수 있으며, 또한 상기 소프트웨어 및 하드웨어의 조합으로 이루어질 수도 있다. 상기 구성요소들은 컴퓨터로 판독 가능한 저장 매체에 포함되어 있을 수도 있고, 복수의 컴퓨터에 그 일부가 분산되어 분포될 수도 있다.
또한, 각 블록들은 특정된 논리적 기능을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 실시예들에서는 블록들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능하다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들은 사실 실질적으로 동시에 수행되는 것도 가능하고 그 블록들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.
도 6은 본 발명의 일 실시예에 따른 영상 속성에 기초한 영상 분류 방법을 도시하는 흐름도이다.
먼저, 색공간 변환부(105)는 입력된 RGB 영상을 밝기-채도 색공간의 성분으로 변환한다(S61). 상기 밝기-채도 색공간은 CIELab 색공간, CIECAM02 색공간 등 밝기와 채도를 표현할 수 있는 색공간을 의미한다.
그 다음, 밝기 분석부(110)는 색공간 변환부(105)에서 변환된 성분 중 밝기 성분의 밝기 빈도 분포를 계산한다(S62). 이 때, 밝기 분석부(110)는 전술한 수학식 2와 같이, 인접한 밝기 성분의 빈도 간의 차이를 이용하여 상기 밝기 빈도 분포를 계산할 수 있다.
한편, 채도 분석부(120)는 색공간 변환부(105)에서 변환된 성분 중 채도 성분의 평균을 계산한다(S63). 색공간 변환부(105)에서 CIELab 색공간으로 변환된 경우, 상기 채도는 전술한 수학식 3에 따라 구할 수 있다.
그리고, 경계 분석부(130)는 색공간 변환부(105)에서 변환된 성분 중 밝기 성분의 주파수 분포를 계산한다(S64). 보다 구체적으로, 상기 경계 분석부(130)는 상기 변환된 성분 중 밝기 성분을 주파수 영역으로 변환하고, 전술한 수학식 4와 같이, 상기 주파수 영역에서 인접한 주파수 성분의 빈도 간의 차이를 계산한다.
영상 분류부(140)는 상기 계산된 밝기 빈도 분포, 채도 성분의 평균 및 주파수 분포를 이용한 평가 함수를 계산한다(S65). 상기 평가 함수를 계산하는 데에는 신경망 알고리즘이 적용된다. 또한, 영상 분류부(140)는 상기 평가 함수가 소정의 문턱값을 넘는가를 판단하여(S66), 입력 영상을 비즈니스 그래픽 영상으로 분류하거나(S67), 입력 영상을 사진 영상으로 분류한다(S68).
이상 첨부된 도면을 참조하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야 한다.
본 발명에 따르면, 영상의 정보 중 밝기 분포, 채도 및 경계선 분석을 통해 주어진 영상을 비즈니스 그래픽 영상 또는 사진 영상으로 자동으로 분류할 수 있으며, 이를 영상 처리 기술에 응용하거나, 프린터 등의 출력 장치에서의 최적의 색재현을 구현하는데 응용할 수 있다. 실험예를 통하여, 상기 밝기 분포 분석 및 채도 분석이 상대적으로 중요하고, 경계 분석은 이들 분석들에 보조적으로 추가될 수 있다는 것을 확인할 수 있었다.

Claims (16)

  1. 입력 영상을 비즈니스 그래픽 영상과 사진 영상으로 분류하는 장치로서,
    상기 입력 영상을 밝기-채도 색공간의 성분으로 변환하는 색공간 변환부;
    상기 변환된 성분 중 밝기 성분의 밝기 빈도 분포를 계산하는 밝기 분석부;
    상기 변환된 성분 중 채도 성분의 평균을 계산하는 채도 분석부; 및
    상기 계산된 밝기 빈도 분포 및 채도 성분의 평균을 이용한 평가 함수를 소정의 문턱값과 비교하여 상기 입력 영상을 분류하는 영상 분류부를 포함하는 영상 분류 장치.
  2. 제1항에 있어서,
    상기 변환된 성분 중 밝기 성분의 주파수 분포를 계산하는 경계 분석부를 더 포함하는 영상 분류 장치.
  3. 제1항에 있어서,
    상기 입력 영상은 RGB 영상인 영상 분류 장치.
  4. 제3항에 있어서,
    상기 밝기-채도 색공간은 CIELab 색공간 또는 CIECAM02 색공간인 영상 분류 장치.
  5. 제1항에 있어서, 상기 밝기 분석부는
    인접한 밝기 성분의 빈도 간의 차이를 계산하는 영상 분류 장치.
  6. 제1항에 있어서, 상기 채도 성분은
    CIELab 색공간의 Lab 데이터 중, a 성분의 제곱과 b 성분의 제곱을 합한 값의 제곱근인 영상 분류 장치.
  7. 제2항에 있어서, 상기 경계 분석부는
    상기 변환된 성분 중 밝기 성분을 주파수 영역으로 변환하고, 상기 주파수 영역에서 인접한 주파수 성분의 빈도 간의 차이를 계산하는 영상 분류 장치.
  8. 제1항에 있어서, 상기 영상 분류부는
    신경망 알고리즘을 적용하여 상기 평가 함수를 구하는 영상 분류 장치.
  9. 입력 영상을 비즈니스 그래픽 영상과 사진 영상으로 분류하는 방법으로서,
    상기 입력 영상을 밝기-채도 색공간의 성분으로 변환하는 단계;
    상기 변환된 성분 중 밝기 성분의 밝기 빈도 분포를 계산하는 단계;
    상기 변환된 성분 중 채도 성분의 평균을 계산하는 단계; 및
    상기 계산된 밝기 빈도 분포 및 채도 성분의 평균을 이용한 평가 함수를 소 정의 문턱값과 비교하여 상기 입력 영상을 분류하는 단계를 포함하는 영상 분류 방법.
  10. 제9항에 있어서,
    상기 변환된 성분 중 밝기 성분의 주파수 분포를 계산하는 단계를 더 포함하는 영상 분류 방법.
  11. 제9항에 있어서,
    상기 입력 영상은 RGB 영상인 영상 분류 방법.
  12. 제11항에 있어서,
    상기 밝기-채도 색공간은 CIELab 색공간 또는 CIECAM02 색공간인 영상 분류 방법.
  13. 제9항에 있어서, 상기 밝기 빈도 분포를 계산하는 단계는
    인접한 밝기 성분의 빈도 간의 차이를 계산하는 단계를 포함하는 영상 분류 방법.
  14. 제9항에 있어서, 상기 채도 성분은
    CIELab 색공간의 Lab 데이터 중, a 성분의 제곱과 b 성분의 제곱을 합한 값 의 제곱근인 영상 분류 방법.
  15. 제10항에 있어서, 상기 주파수 분포를 계산하는 단계는
    상기 변환된 성분 중 밝기 성분을 주파수 영역으로 변환하는 단계; 및
    상기 주파수 영역에서 인접한 주파수 성분의 빈도 간의 차이를 계산하는 단계를 포함하는 영상 분류 방법.
  16. 제9항에 있어서, 상기 입력 영상을 분류하는 단계는
    신경망 알고리즘을 적용하여 상기 평가 함수를 구하는 영상 분류 방법.
KR1020070002595A 2007-01-09 2007-01-09 영상의 속성에 기초한 영상 분류 방법 및 장치 KR100886339B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020070002595A KR100886339B1 (ko) 2007-01-09 2007-01-09 영상의 속성에 기초한 영상 분류 방법 및 장치
US11/984,685 US20080181493A1 (en) 2007-01-09 2007-11-20 Method, medium, and system classifying images based on image properties
CN2008100016413A CN101222575B (zh) 2007-01-09 2008-01-07 基于图像属性将图像分类的方法和系统
EP08150090A EP1947577B1 (en) 2007-01-09 2008-01-08 Method, medium, and system classifying images based on image properties
JP2008001753A JP5411433B2 (ja) 2007-01-09 2008-01-09 映像の属性に基づいた映像分類方法、システムおよび保存媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070002595A KR100886339B1 (ko) 2007-01-09 2007-01-09 영상의 속성에 기초한 영상 분류 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20080065447A true KR20080065447A (ko) 2008-07-14
KR100886339B1 KR100886339B1 (ko) 2009-03-03

Family

ID=39310324

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070002595A KR100886339B1 (ko) 2007-01-09 2007-01-09 영상의 속성에 기초한 영상 분류 방법 및 장치

Country Status (5)

Country Link
US (1) US20080181493A1 (ko)
EP (1) EP1947577B1 (ko)
JP (1) JP5411433B2 (ko)
KR (1) KR100886339B1 (ko)
CN (1) CN101222575B (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11677918B2 (en) 2020-12-03 2023-06-13 Samsung Electronics Co., Ltd. Method and apparatus for color space conversion
CN116824906A (zh) * 2023-08-29 2023-09-29 成都市巨多广告有限公司 一种具有识别功能的停车场引导方法及系统

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101356370B1 (ko) * 2009-07-31 2014-01-27 엘지디스플레이 주식회사 데이터 보정방법 및 이를 이용한 액정표시장치
CN102855641A (zh) * 2012-08-10 2013-01-02 上海电机学院 基于外在品质的水果等级分类系统
CN105824826B (zh) * 2015-01-05 2019-05-21 深圳富泰宏精密工业有限公司 照片分群系统及方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5974174A (en) * 1996-09-26 1999-10-26 Victor Company Of Japan, Ltd. Picture-information processing apparatus
JP3981779B2 (ja) 1996-11-18 2007-09-26 セイコーエプソン株式会社 画像処理装置、画像処理方法および画像処理プログラムを記録した媒体
JP3921015B2 (ja) * 1999-09-24 2007-05-30 富士通株式会社 画像解析装置及び方法並びにプログラム記録媒体
JP4181732B2 (ja) 2000-06-30 2008-11-19 セイコーエプソン株式会社 画像判別方法およびそれを用いた画像処理方法ならびに記録媒体
JP4666274B2 (ja) * 2001-02-20 2011-04-06 日本電気株式会社 カラー画像処理装置及びその方法
JP4197858B2 (ja) * 2001-08-27 2008-12-17 富士通株式会社 画像処理プログラム
FR2830957B1 (fr) * 2001-10-12 2004-01-23 Commissariat Energie Atomique Procede et systeme de gestion de bases de donnees multimedia
JP3894802B2 (ja) * 2002-01-28 2007-03-22 株式会社国際電気通信基礎技術研究所 テクスチャ平坦度判別プログラム
JP2003250042A (ja) 2002-02-25 2003-09-05 Minolta Co Ltd 画像処理方法及び画像処理装置及びデジタルカメラ
US7058220B2 (en) * 2002-04-29 2006-06-06 Hewlett-Packard Development Company, L.P. Method and system for processing images using histograms
JP2003337945A (ja) 2002-05-20 2003-11-28 Olympus Optical Co Ltd 画像分類プログラム及び画像分類方法
BRPI0302384B1 (pt) * 2002-07-20 2018-06-19 Samsung Electronics Co., Ltd. "método para intensificar de forma adaptativa uma cor, e equipamento para intensificar de forma adaptativa a cor de uma imagem"
JP4040625B2 (ja) * 2002-09-12 2008-01-30 松下電器産業株式会社 画像処理装置、プリンタ装置、撮影装置、及びテレビ受像装置
KR100612835B1 (ko) * 2002-12-12 2006-08-18 삼성전자주식회사 영상의 색 특성에 관한 사용자 선호성 데이터 생성 방법및 장치와 이를 이용한 영상 색선호특성 변환 방법 및 장치
JP4333997B2 (ja) * 2004-08-24 2009-09-16 シャープ株式会社 画像処理装置、撮影装置、画像処理方法、画像処理プログラムおよび記録媒体
JP2006091980A (ja) * 2004-09-21 2006-04-06 Seiko Epson Corp 画像処理装置、画像処理方法および画像処理プログラム
US20070047803A1 (en) * 2005-08-30 2007-03-01 Nokia Corporation Image processing device with automatic white balance
JP4626497B2 (ja) * 2005-11-24 2011-02-09 株式会社日立製作所 映像処理装置および携帯端末装置
WO2007072442A2 (en) * 2005-12-23 2007-06-28 Koninklijke Philips Electronics N.V. Blind detection for digital cinema

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11677918B2 (en) 2020-12-03 2023-06-13 Samsung Electronics Co., Ltd. Method and apparatus for color space conversion
CN116824906A (zh) * 2023-08-29 2023-09-29 成都市巨多广告有限公司 一种具有识别功能的停车场引导方法及系统
CN116824906B (zh) * 2023-08-29 2023-11-17 成都市巨多广告有限公司 一种具有识别功能的停车场引导方法及系统

Also Published As

Publication number Publication date
US20080181493A1 (en) 2008-07-31
EP1947577A2 (en) 2008-07-23
KR100886339B1 (ko) 2009-03-03
JP5411433B2 (ja) 2014-02-12
JP2008178095A (ja) 2008-07-31
EP1947577A3 (en) 2009-05-06
CN101222575A (zh) 2008-07-16
EP1947577B1 (en) 2012-03-14
CN101222575B (zh) 2012-07-18

Similar Documents

Publication Publication Date Title
KR100881028B1 (ko) 회색 데이터 보정 장치 및 방법
US7436995B2 (en) Image-processing apparatus, image-capturing apparatus, image-processing method and image-processing program
US8363125B2 (en) Image processing apparatus, image processing method, and computer program product
US7312891B2 (en) Image processing method and apparatus
JP4068673B2 (ja) 画像処理装置および方法
US20070211272A1 (en) Apparatus and method for image-adaptive color reproduction
KR101394429B1 (ko) 출력 예측을 이용한 영상 재현 방법 및 장치
US7379208B2 (en) Hybrid gamut mapping
JP3691686B2 (ja) カラーデータ変換装置およびカラーデータ変換方法
KR100886339B1 (ko) 영상의 속성에 기초한 영상 분류 방법 및 장치
JP2005210495A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
US8270029B2 (en) Methods, apparatus and systems for using black-only on the neutral axis in color management profiles
KR101410703B1 (ko) 칼라 신호 처리 방법, 장치 및 기록매체
JP4910557B2 (ja) 色変換装置、色変換方法、色変換プログラム、色変換係数作成装置、色変換係数作成方法、及び色変換係数作成プログラム
JP2007312313A (ja) 画像処理装置、画像処理方法及びプログラム
JP2007243957A (ja) カラー画像データからグレイ情報を抽出するシステム、方法およびプログラム
JP2002094826A (ja) 画像処理装置、画像形成装置、並びに画像処理方法
US20080297817A1 (en) Image forming apparatus and color converting method thereof
JPH11146210A (ja) 画像処理装置
US8351099B2 (en) Hue specific monochromatic printing mechanism
Hung-Shing et al. Gamut mapping method adaptive to hue-divided color distributions
Aristova Smoothness of color transformations
Lukac Color in Multimedia
El Asaleh New media ICC profiles construction and concerns

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120116

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee