KR19990072314A - 컬러화상처리장치및패턴추출장치 - Google Patents

컬러화상처리장치및패턴추출장치 Download PDF

Info

Publication number
KR19990072314A
KR19990072314A KR1019990002796A KR19990002796A KR19990072314A KR 19990072314 A KR19990072314 A KR 19990072314A KR 1019990002796 A KR1019990002796 A KR 1019990002796A KR 19990002796 A KR19990002796 A KR 19990002796A KR 19990072314 A KR19990072314 A KR 19990072314A
Authority
KR
South Korea
Prior art keywords
color
pattern
image
circumscribed
pixel
Prior art date
Application number
KR1019990002796A
Other languages
English (en)
Other versions
KR100525692B1 (ko
Inventor
가쯔야마유따까
Original Assignee
아끼쿠사 나오유끼
후지쯔 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아끼쿠사 나오유끼, 후지쯔 가부시키가이샤 filed Critical 아끼쿠사 나오유끼
Publication of KR19990072314A publication Critical patent/KR19990072314A/ko
Application granted granted Critical
Publication of KR100525692B1 publication Critical patent/KR100525692B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/005General purpose rendering architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/143Segmentation; Edge detection involving probabilistic approaches, e.g. Markov random field [MRF] modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18105Extraction of features or characteristics of the image related to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

유사의 색이라도 효율적으로, 정밀도 좋게 분리 추출 가능하게 한 컬러 화상 처리 장치를 제공한다.
임계치 설정 수단(66)은, 주목 화소의 색 정보에 따라서 정해지는 임계치를 설정하고, 라벨링 수단(67)은 인접하는 화소의 색 정보를 비교하여, 그 거리가 임계치 설정 수단(66)으로 정해지는 임계치 이내일 때에 동일한 라벨을 부여한다.

Description

컬러 화상 처리 장치 및 패턴 추출 장치{COLOR IMAGE PROCESSING APPARATUS AND PATTERN EXTRACTING APPARATUS}
본 발명은 컬러 화상 처리 장치 및 패턴 추출 장치에 관한 것으로, 특히, 컬러 화상으로부터 헤드라인 등의 문자 영역을 추출하는 경우에 적용하기에 적합한 것이다.
최근, 컴퓨터나 컬러 프린터 등의 주변 기기의 발달과, 그 저가격화에 따라, 컬러 화상을 처리하는 분야가 넓어지고 있다. 이 때문에, 컬러 화상을 영역 분할하고, 컬러 화상 중으로부터 특정 영역만을 추출하는 기술이 요구되고 있다.
예를 들면, 컬러 화상 중의 동색 영역을 추출하는 기술이 요구되고 있다.
이 기술은, 예를 들면, CCD 카메라로 촬영한 컬러 정경 화상을 처리 대상의 입력 화상으로 하는 경우에서는, 화상 인식에 의한 과일 선별이나, 차의 감시, 보안을 위한 인물 감시 등, 다방면으로 요구되고 있다.
또한, 컬러 문서 화상을 입력 화상으로 하는 경우에서는, 화상으로부터 문서명이나 키워드 등을 자동 추출하여, 검색 시에 사용할 수 있는 것으로서 기대되고 있다. 그 일례로서, 도서관에서의 책의 분류나, 관리의 자동 시스템을 예로 들 수 있다. 그 외에도, 화상을 데이타 베이스로서 축적, 공유화하는 그룹 웨어에서의 자동 키워드 또는 파일명을 부여하는데 이용된다. 이들 정보는, 방대한 양의 컬러 문서 화상을 검색하는데 사용된다.
컬러 화상 중으로부터 특정 영역만을 추출하는 기술로서, 이하에 진술하는 바와 같은 방법이 제안되어 있다.
(1) RGB 색 공간 클러스터링법
이 RGB 색 공간 클러스터링법에서는, 색 분해 화상의 작성이 행해진다. 즉, CCD 카메라로 촬영한 RGB 화상의 화소에 대해 RGB 공간 상에서의 클러스터링을 행한다. 그리고, 하나의 클러스터에 속하는 화소만으로 색마다의 화상을 작성하여, 동일 색의 영역을 추출하거나, 또한 이 수법으로 생긴 영역을 병합하거나 하여, 새로운 영역을 추출하는 것이다.
도 44는 종래의 RGB 색 공간 클러스터링법을 나타낸 도면이다.
도 44에 있어서, 컬러 문서 화상(501)이 입력된 것으로 하면, 가까운 색을 갖는 패턴을 추출하여, 클러스터링을 행한다. 예를 들면, 패턴(502, 507)이 청계통 색, 패턴(503)이 녹계통 색, 패턴(504∼506)이 적계통 색으로 그려지고 있는 것으로 하면, 청계통 색의 패턴(502, 507)이 속하는 클러스터(508), 녹계통 색의 패턴(503)이 속하는 클러스터(509) 및 적계통 색의 패턴(504∼506)이 속하는 클러스터(510)가 RGB 공간 상에 생성된다.
클러스터(508∼510)가 생성되면, 하나의 클러스터(508∼510)에 속하는 화소만으로 클러스터(508∼510)마다의 화상을 작성한다. 이 결과, 클러스터(508)에 대해서는, 패턴(502', 507')으로 구성된 색 분해 화상(501a)이 생성되고, 클러스터(509)에 대해서는 패턴(503')으로 구성된 색 분해 화상(501b)이 생성되고, 클러스터(510)에 대해서는 패턴(504'∼506')으로 구성된 색 분해 화상(501c)이 생성된다.
(2) RGB 이외 색 공간 클러스터링법
RGB 공간에서 표현된 RGB 화상의 모든 화소를 HSV와 같은 별도의 색 공간으로 변환하고, 이 색 공간 상에서 어떠한 클러스터링을 행하고, 하나의 클러스터에 속하는 화소만으로 색마다의 화상을 작성하여 동일색의 영역을 추출하거나, 이 수법으로 생긴 영역을 병합하거나 하여, 새로운 영역을 추출하는 것이다.
또, 종래의 컬러 문서 화상으로부터 문자 영역을 추출하는 기술을 기재한 문헌으로서, 예를 들면, 이하의 것이 있다.
·센다 등「문자의 단색성에 주목한 컬러 화상으로부터의 문자 패턴 추출법」 전자 정보 통신 학회 PRU94-09, p17- 24
·우에하네 등「등색선 처리에 의한 컬러 화상으로부터의 문자 영역의 추출」 전자 정보 통신 학회 PRU94-09, p9 -16
·마츠오 등「컬러 문서 화상으로부터의 단색 문자 영역의 추출」 1997 전자 정보 통신 학회 종합 대회 D-12-19
·마츠오 등「농담 및 색 정보에 의한 정경 화상으로부터의 문자열 추출」 전자 정보 통신 학회 PRU92-121, p25 - 32
(3) 영역 확장법
이 영역 확장법에서는, 인접하는 화소의 색의 유사성에만 주목하여 라벨링이 행해진다. 즉, RGB에서 표현된 화소를 대상에, (R, G, B)의 각색 요소의 최대치(max)를 구하고, 이에 따라 색 화소를 (R/max, G/max, B/max)라 정규화하고, 정규화된 화상을 작성한다.
도 45는, 종래의 영역 확장법을 나타낸 도면이다.
도 45에 있어서, 화상 중의 화소 P1, P2, …를 각각 색 요소 RGB를 이용하여, P1(Rl, Gl, Bl), P2(R2, G2, B2), …로 표현한다(①).
다음에, 각 색 요소의 최대치를 구한다. 예를 들면, 화소 P1에서는, Rl, Gl, B1 중의 최대치를 max1로 하고, 화소 P2에서는, R2, G2, B2 중의 최대치를 max2로 한다. 그리고, 이 최대치에 의해 각 색 요소를 정규화하여, 정규화된 화소 P1'(R1/max1, G1/max1, B1/max1), P2' (R2/max2, G2/max2, B2/max2)를 작성한다(②).
다음에, 이 정규화한 화소 P1', P2'에 대해, 인접하는 화소 P1', P2'의 각 색 요소의 차분의 2승을 3요소에 대해 구하고, 이것을 누적하여 인접한 화소 P1', P2' 사이의 거리 d=(R1/max1-R2/max2)2+ (G1/max1 - G2/max2)2+ (B1/max1-B2/max2)2를 구한다(③).
이와 같이 하여 얻어진 거리 d가, 미리 정해진 고정의 임계치 TH0보다 작은 경우에, 양 화소 P1, P2를 동일 색이라 간주하여, 이것에 동일한 라벨을 부여하는 라벨링을 행한다. 이와 같이 하여 전체의 화상에 대해 라벨 부여를 행한 후에, 동일 라벨의 것을 추출하여, 동일한 색 영역을 추출한다.
이 영역 확장법은, 처리하는 대상이 화소의 주변만이므로, RGB 색 공간 클러스터링법에 비교하여 처리 시간을 짧게 할 수 있는 이점이 있다.
또, 영역 확장법에 대해서는, 특개평5-298443호 공보에 자세히 기재되어 있다.
또한, 색 분해 화상으로부터 문자 영역을 추출하는 방법으로서, 상기한 "우에하네 등「등색선 처리에 의한 컬러 화상으로부터의 문자 영역의 추출」전자 정보 통신 학회 PRU94-09, p9-16"에 기재되어 있는 방법이 있다. 이 방법에서는, 이하의 순서에 의해, 컬러 화상으로부터 문자 영역이 추출된다.
·1개의 색의 색 분해 화상으로부터 연결 영역의 외접 구형을 구한다.
·외접 구형의 사이즈 및 형상으로 일정한 범위에 있는 것만으로 제한한다.
·구형마다 인접 구형 탐색 범위를 설치하고, 그 내부에 관한 구형을 탐색하고, 상호 내부에 이러한 관계의 구형군을 그룹으로서 추출한다.
·그룹 내의 구형의 무게 중심의 직선성이 좋은 것만을 남긴다.
·그룹의 외접 구형을 구하고, 그 내부를 대상으로 그룹을 구성하는 영역의 색에 유사한 패턴을 추출한다.
그러나, 종래의 컬러 화상의 동색 영역의 클러스터링 방법에서는, 이하와 같은 문제가 있었다.
우선, RGB 색 공간 클러스터링법에서도, HSV 공간과 같은 다른 색 공간 클러스터링법에서도, 화상 전체의 화소를 사용하여 클러스터링이 행해진다. 이 때문에, 도 44에 도시한 바와 같이, 패턴(502)의 색과 패턴(507)의 색이 다른 경우에 있어서도, 패턴(502)의 색과 패턴(507)의 색이 가까운 경우에는, 추출하고 싶은 패턴(502)과 별도의 패턴(507)이 동일한 클러스터(508)로 분류될 가능성이 있다. 이 경우, 패턴(507)의 색의 영향으로, 패턴(502)의 색이 원래 형성하는 클러스터 형상이 변화한다. 이 결과, 패턴(502)의 색이 형성하는 클러스터 본래의 색의 범위가 왜곡되어, 패턴(502)을 추출하는 경우에, 정밀도가 좋은 영역 추출을 할 수 없게 된다. 예를 들면, 추출하고 싶은 패턴(502)의 색과 가까운 색의 패턴(507)이 별도의 장소에 있고, 양자가 1개의 클러스터(508)로서 추출되면, 클러스터(508)가 나타내는 색은, 패턴(502)의 색과 패턴(507)의 색이 혼재한 것으로 되고, 이 클러스터(508)가 나타내는 색에서는, 패턴(502)의 색의 범위 및 패턴(508)의 색의 범위를 커버할 수 없고, 추출 결과의 패턴(502', 507')에 구멍(511, 512)이 생기거나, 윤곽이 깨끗하게 추출되지 않거나 하는 경우가 있다.
또한, RGB 색 공간 클러스터링법이나, HSV 공간과 같은 다른 색 공간 클러스터링법에서는, 화상 전체의 다수의 화소를 대상으로 한 클러스터링을 행하므로, 클러스터링을 위해 필요한 계산 시간도 커진다.
또한, 영역 확장법에서는, 도 45에 도시한 바와 같이, 정규화를 행하기 때문에, 각 화소로 제산을 행하기 위한 계산량이 커진다. 또한, 제산의 결과를 부동 소수점의 데이타로서 전화소분 보유할 필요가 있고, 처리에 필요한 메모리 자원이 다수 필요해진다. 또한, 정규화한 후에도, 인접하는 화소가, 인간이 볼 때 동일하게 보이는 것에 대해서도, 인접 화소와의 색이 유사성을 어떻게 정의할지에 따라서는, 고정 임계치보다도 크게 멀리 떨어지는 경우가 있고, 영역 중의 구멍이나 영역 윤곽을 정확하게 추출할 수 없는 결과가 되는 경우가 있다. 또한, 인접 화소와의 관계만을 보고 있으므로, 문자 영역과 배경 영역의 경계에서 서서히 색이 변화해 가는 경우에는, 문자 영역이 배경 영역과 동일 라벨로 되는 경우가 있다.
또한, 종래의 문자 영역의 추출 방법에서는, 화상 전체에 대한 색 분해 화상이, 그 화상에 존재하는 색의 수만큼 생성되므로, 색 분해 화상의 생성에 시간이 걸린다고 하는 문제가 있다. 각 색 분해 화상은 화상 전체에 대해 생성되므로, 예를 들면, 그 화상으로부터 타이틀을 추출하는 경우에, 타이틀 영역 이외의 색의 영향을 받기 쉽고, 타이틀의 추출 정밀도가 악화한다고 하는 문제가 있다. 또한, 연결 영역의 외접 구형을 구하는 경우, 추출한 색 분해 화상마다 화상 전체에 대해 처리를 행할 필요가 있기 때문에, 하나의 컬러 화상으로부터 복수(추출한 색수분의)의 종횡이 동일한 사이즈의 화상이 필요하게 되어, 처리에 시간이 걸린다고 하는 문제가 있다.
또한, 외접 구형의 그룹핑도, 화상 전체에 대해 생성된 색 분해 화상마다 행해지므로, 처리에 시간이 걸림과 동시에, 추출 대상이 되는 문자가 다른 색 분해 화상에 클러스터링되면, 구제할 수 없다고 하는 문제가 있다.
또한, 그룹의 구성 시에 상호 탐색 범위에 관한 구형만을 추출하므로, 문자 패턴의 일부이지만, 작은 부분이 그룹으로부터 누락되기 쉽다. 또한, 누락된 부분을 복구하기 위해, 그룹 내의 색이 가까운 패턴의 추출을 마지막으로 행하지만, 이 때에 색이 유사한 노이즈를 복구하기 쉽다고 하는 문제가 있다.
그래서, 본 발명의 제1 목적은, 정규화 처리를 행하지 않고, 더구나 거리 계산을 행하는 처리 대상을 화상 영역의 일부에 한정한 컬러 화상 처리 장치를 제공하는 것이다.
또한, 본 발명의 제2 목적은, 추출 대상이 되는 패턴의 누락을 억제하면서, 처리를 고속화하는 것이 가능한 패턴 추출 장치를 제공하는 것이다.
또한, 본 발명의 제3 목적은, 추출 대상이 되는 패턴의 경계가 불명확한 경우에 있어서도, 추출 대상이 되는 패턴을 정밀도 좋게 추출하는 것이 가능한 패턴 추출 장치를 제공하는 것이다.
상술한 과제를 해결하기 위해, 본 발명에 의하면, 컬러 화상을 입력하여 컬러 화상 신호를 출력하는 컬러 화상 입력 수단과, 이 컬러 화상 신호를 유지하는 유지 수단과, 상기 컬러 화상 신호를 처리하는 연산 수단을 구비한 컬러 화상 처리 장치에 있어서, 주목 화소의 색 정보에 따라서 정해지는 임계치를 설정하는 임계치 설정 수단과, 인접하는 화소의 색 정보를 비교하여 그 거리가 상기 임계치 이내일 때 동일 라벨을 부여하는 라벨링을 행하는 라벨링 수단을 구비한 것을 특징으로 한다.
이것에 의해, 인접하는 화소가 동일 라벨을 부여하는지의 여부를 판정하는 거리의 임계치를, 고정치가 아니라, 주목 화소의 색 정보에 따라서 설정하는 것이 가능해져서, 동일 범위인지 여부의 판별을 정확하게 할 수 있기 때문에, 원하는 영역의 추출을 정확하게 얻을 수 있다.
또한, 본 발명의 한 형태에 따르면, 동일 라벨이 부여된 화소의 평균색을 구하는 평균 색 산출 수단과, 상기 주목 화소에 인접하는 화소의 색과 상기 평균색을 비교하는 평균색 비교 수단을 더욱 구비하고, 상기 라벨링 수단은, 상기 비교 결과가 소정의 범위 내에 있는 경우에만, 동일 라벨을 부여하도록 하고 있다.
이것에 의해, 추출 대상이 되는 영역의 색이 서서히 변화하고, 추출 대상이 되는 영역의 경계가 흐려져 있는 경우에 있어서도, 추출 대상이 되는 영역과 배경의 영역을 구분하는 것이 가능해져서, 추출 대상이 되는 영역의 추출 정밀도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 컬러 화상을 입력하여 컬러 화상 신호를 출력하는 컬러 화상 입력 수단과, 이 컬러 화상 신호를 유지하는 유지 수단과, 상기 컬러 화상 신호를 처리하는 연산 수단을 구비한 컬러 화상 처리 장치에 있어서, 컬러 화상 처리 장치에 있어서, 상기 컬러 화상 신호를 축소하여 축소 화상을 작성하는 화상 축소 수단을 설치하고, 이 축소 화상으로 동일한 색으로 간주할 수 있는 영역을 구하고, 그 영역에 대응하는 원화상의 영역을 축소 화상으로 추출한 색만에 주목하여 추출하는 것을 특징으로 한다.
이것에 의해, 축소 화상에 의해 동일한 색으로 간주할 수 있는 영역을 구하는 것이 가능해지도록 하였으므로, 동일한 색으로 간주할 수 있는 영역을 추출하는 처리를 빠르게 행할 수 있다.
또한, 본 발명의 한 형태에 따르면, 상기 축소 화상으로 라벨 화상과 라벨 영역의 외접 구형, 이 대표색, 동일 라벨 영역 내의 색의 종류의 수, 색의 종류 등을 구하고, 그것에 대응하는 원화상의 구형을 구하고, 그 구형 내부에서 대표색에 가까운 화소를 탐색하여, 그것을 기점으로 하여 라벨 처리를 행하는 것을 특징으로 한다.
이것에 의해, 축소 화상에 의해 라벨 화상과 라벨의 외접 구형, 그 대표색, 동일 라벨 영역 내의 색의 종류의 수, 색의 종류를 구하고, 또한 그것에 대응하는 원화상의 구형을 구하고, 그 구형 내부에서 라벨링 처리를 행하는 것이 가능해져서, 라벨링 처리를 빠르게 행할 수 있다.
또한, 본 발명의 한 형태에 따르면, 원화상의 라벨링을 행할 때에 축소 화상으로부터 요구한 모든 색의 종류와 유사성을 조사하고, 그것이 임계치보다도 작은 경우에 동일 라벨을 부여하는 것을 특징으로 한다.
이것에 의해, 축소 화상으로부터 요구한 모든 색의 종류와의 유사성을 조사하고, 그것이 임계치보다도 작을 때 동일 라벨을 부여하는 것이 가능해져서, 인간이 본 상태와 거의 동일한 상태에서의 영역 추출을 할수 있다.
또한, 본 발명의 한 형태에 따르면, 색의 유사성을 색의 3요소로 독립한 가변 임계치를 이용하여 판단함과 동시에, 색의 차의 거리 dci로서 3요소에 대해 모든 각각의 가변 임계치보다도 작은 경우에 색의 차의 거리를 0으로 간주하고, 그것 이외일 때 임계치보다도 큰 값의 거리라고 판별하는 것을 특징으로 한다.
이것에 의해, 색의 3요소에 대해 각각 독립적으로 임계치를 설치하고, 이 3요소의 전부가 각각의 임계치 이내에 존재할 때에 동일하다고 간주하는 것이 가능해져서, 임계치의 테이블의 용량을 작게 할 뿐만 아니라, 매우 정확한 라벨 부여를 할 수 있다.
또한, 본 발명의 한 형태에 따르면, 입력 화상 내의 패턴의 색 정보 및 기하학 정보에 기초하여, 상기 패턴의 분류를 행하도록 하고 있다.
이것에 의해, 컬러 입력 화상 내에서 동일색이 부여된 헤드라인 영역을 추출하는 경우 등에 있어서, 컬러 입력 화상 내의 일부의 영역에 범위를 한정하고, 색 정보에 기초를 둔 패턴의 분류를 행하고, 헤드라인 영역과 관계 없는 떨어진 영역에 존재하는 패턴을 분류 대상으로부터 제외하거나, 헤드라인 문자가 되지 않는 작은 패턴이나 큰 패턴을, 색 정보에 기초를 둔 패턴의 분류 대상으로부터 제거하거나 하는 것이 가능해지기 때문에, 헤드라인 영역의 추출 처리의 속도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 인접하는 화소끼리의 색 정보에 기초하여, 입력 화상 내의 화소의 클러스터링을 행하는 클러스터링 수단과, 상기 클러스터링 수단으로 얻어진 클러스터끼리의 색 정보 및 기하학 정보에 기초하여, 상기 클러스터의 그룹핑을 행하는 그룹핑 수단을 구비하고 있다.
이것에 의해, 입력 화상 내의 화소의 클러스터링을 행할 때에는, 자기의 화소의 근린의 화소와 색 정보를 비교하면 좋고, 입력 화상 내의 모든 화소끼리를 비교하면, 화소끼리의 색 정보의 비교 횟수가 입력 화상 내의 화소수의 2승의 오더가 되는데 대해, 자기의 화소의 근린의 화소와 비교한 경우에는, 화소끼리의 색 정보의 비교 횟수가 입력 화상 내의 화소수의 오더로 종료하기 때문에, 클러스터링 처리의 고속화가 가능해진다.
또한, 클러스터링된 클러스터를 그룹핑일 때의 처리 대상으로 하는 것에 의해, 동일 클러스터 내에 존재하는 화소를 일체적으로 취급하여 처리하는 것이 가능해져서, 개개의 화소를 처리 대상으로 할 필요가 없어지기 때문에, 그룹핑 처리를 고속으로 행하는 것이 가능해짐과 동시에, 입력 화상 내의 일부의 영역에 범위를 한정하여, 색이 유사한 클러스터끼리의 그룹핑을 행하는 것이 가능해지기 때문에, 그룹핑 처리의 보다 한층 고속화를 달성하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 제1 해상도에서는 동일색으로 간주되는 영역이, 제2 해상도에서는 다른 색의 집합이라 판별되는 경우에 있어서, 상기 제2 해상도로 판별한 색의 변동의 범위 내의 영역을, 동일색의 영역으로서 추출하도록 하고 있다.
이것에 의해, 기본이 되는 색의 도트의 크기 및 이들의 조합으로 입력 화상의 패턴의 색이 표현되어 있기 때문에, 그 입력 화상 내에서는 동일색으로서 표현되어 있는데도 불구하고, 판독 시의 해상도에 따라서는, 다른 색의 집합으로서 검출되는 경우에 있어서도, 입력 화상의 판독 시에 동일색의 범위를 정밀도 좋게 추출하는 것이 가능해지고, 입력 화상 내에서 동일색으로서 표현되어 있는 영역으로부터 패턴의 일부가 누락되거나, 부족되거나 하는 것을 방지하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 라벨 화상으로부터 생성된 외접 구형 중, 소정의 범위의 크기의 외접 구형을 추출하고, 그 추출된 외접 구형으로부터 일정한 범위 내에 탐색 영역을 설정하고, 라벨 화상으로부터 생성된 그 탐색 영역에 대한 외접 구형을, 추출된 외접 구형에 대한 그룹핑의 후보로 하도록 하고 있다.
이것에 의해, 라벨 화상으로부터 생성된 외접 구형 중, 탐색 영역을 설정할 때의 기준이 되는 외접 구형을 소정의 범위의 크기의 외접 구형에 한정하는 것이 가능해지고, 입력 화상으로부터 문자 영역을 추출할 때에, 노이즈 등의 미세한 패턴이나 배경이나 프레임 등이 큰 패턴의 외접 구형이, 문자열을 탐색할 때의 탐색 영역의 기준으로서 선택되는 것을 방지하는 것이 가능해지기 때문에, 문자열이 아닌 패턴에 대한 그룹핑 처리가 행해지는 것을 저감하고, 문자열만의 추출을 효율적으로 행하는 것이 가능해진다.
또한, 문자열을 탐색할 때의 탐색 영역을 주목하는 외접 구형으로부터 일정한 범위 내에 설정함으로써, 주목한 외접 구형의 근방의 문자만을 탐색하는 것이 가능해져서, 입력 화상으로부터 타이틀 등을 추출할때에, 그 타이틀과 떨어진 위치에 존재하고, 그 타이틀을 구성하지 않은 문자가 동일 그룹에 속하는 것으로 하여 추출되는 것을 방지하는 것이 가능해지기 때문에, 타이틀에 포함되는 일련의 문자만을 효율적으로 추출하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 입력 화상의 인접 화소 사이의 색 정보를 비교하는 제1 색 정보 비교 수단과, 상기 제1 색 정보 비교 수단으로 비교 대상이 된 화소의 색 정보와, 상기 화소에 인접하는 라벨 화상의 색 정보를 비교하는 제2 색 정보 비교 수단과, 상기 제1 색 정보비교 수단의 비교 결과 및 상기 제2 색 정보 비교 수단의 비교 결과에 기초하여, 라벨링을 행하는 라벨링 수단을 구비하고 있다.
이것에 의해, 색이 서서히 변화하는 경우에, 상호 인접하는 화소의 색 정보를 비교한 것 만으로는, 상호 인접하는 화소 사이에서는 색이 유사하기 때문에, 이들 화소에 동일한 라벨이 부여되고, 이들의 화소를 찾아간 결과, 색의 차이가 누적하여, 전혀 다른 색의 화소에 동일한 라벨이 부여되는 경우가 있는데 대해, 지금까지의 라벨 부여가 이루어진 패턴의 색 정보도 비교 대상으로 하는 것이 가능해지기 때문에, 색의 차이의 누적치도 고려하면서, 라벨 부여를 행하는 것이 가능해져서, 색이 서서히 변화하는 영역에 대해, 인접 화소 사이의 색 정보를 비교하면서 라벨링을 행하는 경우에 있어서도, 전혀 다른 색의 화소에 동일한 라벨이 부여되는 것을 방지하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 소정의 색으로 표현된 영역의 인접 화소 사이의 색차를 산출하는 색차 산출 수단과, 상기 색차에 기초하여, 임계치를 설정하는 임계치 설정 수단과, 상기 임계치에 기초하여, 상기 소정의 색으로 표현된 화소에 인접하는 화소의 라벨링을 행하는 라벨링 수단을 구비하고 있다.
이것에 의해, 입력 화상이 망점(Halfton printing) 인쇄법 등으로 인쇄되어 있기 때문에, 입력 화상 내에서는 동일색으로서 표현되어 있는데도 불구하고, 판독 시의 해상도에 의해서는, 다른 색의 집합으로서 검출되는 경우에 있어서도, 입력 화상의 판독 시에 동일색의 범위를 정밀도 좋게 추출하는 것이 가능해져서, 입력 화상 내에서 동일색으로서 표현되어 있는 영역으로부터 패턴의 일부가 누락되거나, 부족되거나 하는 것을 방지하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 기본이 되는 색의 도트를 격자점에 배치한 메쉬를 상호 회전하여 중첩시키고, 또한, 상기 도트의 크기를 변화시킴으로써, 인쇄 모델을 생성하도록 하고 있다.
이것에 의해, 망점 인쇄법으로 생성되는 색을 컴퓨터 상에서 가상적으로 생성하는 것이 가능해지고, 망점 인쇄법에 의한 색의 변동을 실제의 인쇄물을 이용하여 해석하지 않고, 망점 인쇄법에 의한 색의 변동을 식별하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 인쇄 모델로 표현된 색의 휘도치 및 상기 휘도치에 있어서의 인접 화소와의 색차를, 상기 인쇄 모델에 있어서의 판독 시의 해상도마다 등록한 색차 테이블을 생성하도록 하고 있다.
이것에 의해, 실제의 인쇄물을 판독하는 디바이스의 해상도가 어떠한 것이더라도, 실제의 인쇄물로부터 판독된 색이 동일색인지의 여부를 판단할 때의 임계치를 용이하게 취득하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 인쇄 모델에서의 판독 시의 해상도를, 입력 화상에 대해 추정하는 모델 해상도 추정 처리부를 구비하고 있다.
이것에 의해, 디바이스로 판독된 실제의 인쇄물을, 컴퓨터 상에서 가상적으로 생성된 인쇄 모델 상으로 다루는 것이 가능해지고, 디바이스로 판독된 실제의 인쇄물에 대해, 인쇄 모델로 생성된 임계치를 적용하여, 라벨링 처리를 행하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 상기 모델 해상도 추정 처리부는, 상기 색차 테이블에 등록되어 있는 색의 휘도치 및 색차가 입력 화상 전체에 가장 알맞는 해상도를, 상기 입력 화상에 있어서의 상기 인쇄 모델에서의 판독 시의 해상도라 추정한다.
이것에 의해, 디바이스로 판독된 실제의 인쇄물에 대해, 인쇄 모델로 생성된 알맞는 임계치를 입력 화상 전체에 적용하여, 라벨링 처리를 행하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 상기 모델 해상도 추정 처리부는, 상기 색차 테이블에 등록되어 있는 색의 휘도치 및 색차가 입력 화상이 국소적인 영역에서 가장 알맞는 해상도를, 상기 입력 화상의 국소적인 영역에서의 상기 인쇄 모델에서의 판독 시의 해상도라 추정한다.
이것에 의해, 디바이스로 판독된 실제의 인쇄물에 대해, 입력 화상 전체의 임계치와 맞지 않는 영역에 대해서는, 그 영역에 알맞는 임계치를 이용하여 라벨링 처리를 행하는 것이 가능해져서, 라벨링 처리의 정밀도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 상기 모델 해상도 추정 처리부는, 상기 인쇄 모델에서의 판독 시의 해상도를 고정치로 한다.
이것에 의해, 실제의 인쇄물에 대한 모델 해상도 추정 처리를 생략하는 것이 가능해져서, 처리 속도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 라벨링된 라벨 화상끼리를 그룹핑하는 그룹핑 수단을 구비하고 있다.
이것에 의해, 라벨링에 의해 추출된 문자 영역을, 문자열 영역으로서 통합하는 것이 가능해지고, 타이틀의 추출을 효율적으로 행하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 상기 그룹핑 수단은, 라벨 화상의 외접 구형에 대한 색 정보 및 상기 기하학 정보에 기초하여, 상기 라벨 화상을 동일한 그룹에 넣는지의 여부를 판별하도록 하고 있다.
이것에 의해, 컬러 입력 화상 내에서 동일색이 부여된 헤드라인 영역을 추출하는 경우 등에 있어서, 컬러 입력 화상 내의 일부의 영역에 범위를 한정하여 패턴의 추출을 행하고, 헤드라인 영역과 관계없는 떨어진 영역에 존재하는 패턴을 분류 대상으로부터 제외하거나, 헤드라인 문자가 되지 않는 노이즈 등의 작은 패턴이나 배경 등의 큰 패턴을 처리 대상으로부터 생략하는 것이 가능해지기 때문에, 헤드라인 영역의 추출 처리의 속도를 향상시키는 것이 가능해진다. 또한, 라벨링된 패턴을 외접 구형으로 표현함으로써, 문자 등을 구성하는 복잡한 패턴을 단순한 형태로 나타내는 것이 가능해져서, 패턴을 기억하는 기억 용량을 삭감하는 것이 가능해짐과 동시에, 패턴의 위치 관계 등을 구하는 경우에 있어서도, 처리를 단순화하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 색 정보는, 외접 구형에 포함되는 패턴의 대표색이다.
이것에 의해, 라벨링된 패턴을 외접 구형끼리로 비교하는 것이 가능해져서, 색 정보를 이용한 패턴의 그룹핑을 행할 때에, 그 패턴을 구성하는 각 화소끼리를 비교할 필요가 없어지기 때문에, 비교 대상이 되는 요소의 갯수를 저감시켜, 처리를 고속으로 행하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 기하학 정보는, 주목하는 외접 구형으로부터 소정의 범위 내에 있는 다른 외접 구형이다.
이것에 의해, 입력 화상으로부터 타이틀 영역 등을 추출할 때에, 그룹핑의 대상이 되는 외접 구형이 존재하는 범위를, 타이틀 영역으로서 상응한 범위에 한정하는 것이 가능해져서, 타이틀 영역으로부터 벗어난 영역에 대해서는, 그룹핑 처리를 생략하는 것이 가능해지기 때문에, 처리를 고속으로 행하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 상기 기하학 정보 산출 수단은, 각 외접 구형이 속하는 종횡의 좌표에 대응하여 구형 번호를 저장하는 구형 번호 저장 수단과, 주목하는 외접 구형으로부터 소정의 범위 내의 종횡의 각 좌표에 포함되는 구형 번호를 추출하는 구형 번호 추출 수단과, 상기 추출된 구형 번호 중 종횡의 좌표의 양쪽에 포함되는 것을, 주목하는 외접 구형으로부터 소정의 범위 내에 있는 다른 외접 구형으로서 추출하는 근방 구형 추출 수단을 구비하고 있다.
이것에 의해, 주목하는 외접 구형으로부터 소정의 범위 내에 있는 다른 외접 구형을 효율적으로 찾아 내기 시작하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 상기 구형 번호 저장 수단은, 외접 구형의 구형 번호를 좌표치의 순서로 저장하고, 상기 구형 번호 추출 수단은, 가장 작은 좌표치로부터 순서대로 구형 번호를 탐색하고, 좌표치가 변화할 때까지의 동안에 포함되는 구형 번호를 그 좌표에 속하는 구형 번호로서 추출한다.
이것에 의해, 외접 구형의 구형 번호를 저장하는 영역을 각 좌표치마다 미리 준비해 두면, 주목하는 외접 구형으로부터 소정의 범위 내에 존재할 가능성이 있는 다른 외접 구형의 갯수분만큼, 기억 용량을 각 좌표치마다 미리 준비 해 둘 필요가 있는데 대해, 실제로 존재하는 외접 구형에 대응하여 그 좌표치를 저장하는 것이 가능해지기 때문에, 외접 구형의 구형 번호를 저장하기 위해 필요한 기억 용량을 저감하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 주목하는 외접 구형으로부터 소정의 범위 내에 있는 다른 외접 구형으로서, 색차 테이블로부터 요구한 색차보다도, 2개의 외접 구형 사이의 대표색의 색차가 작은 경우에, 2개의 외접 구형을 동일한 그룹에 넣도록 한다.
이것에 의해, 입력 화상으로부터 타이틀 영역 등을 추출할 때에, 그룹핑의 대상이 되는 외접 구형이 존재하는 범위를, 타이틀 영역으로서 상응한 범위에 한정하는 것이 가능해짐과 동시에, 외접 구형끼리를 비교하여 색 정보를 이용한 패턴의 그룹핑을 행할 때에, 실제의 인쇄물의 판독 시에 발생하는 동일색에서의 색의 변동을 고려하는 것이 가능해져서, 처리를 고속으로 행하는 것이 가능해짐과 동시에, 판독 정밀도도 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 라벨 화상의 패턴의 굵기에 기초하여, 상기 라벨 화상의 그룹핑을 행한다.
이것에 의해, 굵기가 다른 문자를 각각의 그룹에 넣는 것이 가능해지기 때문에, 입력 화상으로부터 타이틀 등을 추출할 때에, 굵기가 같은 문자로 이루어지는 문자열만을 1개의 타이틀로 하는 것이 가능해져서, 타이틀을 추출할 때의 정밀도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 패턴의 윤곽 길이를 구하는 윤곽 추적 수단과, 상기 패턴의 면적을 구하는 면적 산출 수단과, 상기 패턴의 면적과 상기 패턴의 윤곽 길이와의 비에 기초하여, 상기 패턴의 굵기를 구하는 굵기 산출 수단을 구비하고 있다.
이것에 의해, 패턴의 굵기를 정밀도 좋게 구하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 상기 윤곽 추적 수단은, 패턴의 윤곽이 되는 제1 화소로부터 상기 패턴의 윤곽이 되는 제2 화소를 탐색할 때에, 상기 제1 화소에 인접하는 8개의 화소 중, 상기 제1 화소의 이동원의 화소에 인접하는 화소로부터 상기 제2 화소를 탐색한다.
이것에 의해, 패턴의 윤곽이 되는 제1 화소로부터 상기 패턴의 윤곽이 되는 제2 화소를 탐색하기 위해, 제1 화소에 인접하는 8개의 화소를 소정의 방향으로 탐색하고, 화소의 레벨이 배경의 레벨로부터 그 패턴의 레벨로 변한 점을 상기 제2 화소로 하는 경우, 이미 추출되어 있는 상기 제1 화소가 패턴의 윤곽이 되는 점으로서 재차 추출되는 것을 방지하는 것이 가능해져서, 윤곽 추적 처리의 속도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 그룹핑된 외접 구형의 크기에 기초하여, 문자 사이즈를 추정하는 문자 사이즈 추정 수단과, 상기 문자 사이즈로부터 정한 소정의 범위를 초과한 외접 구형을, 상기 외접 구형의 그룹으로부터 삭제하는 구형 삭제 수단을 구비하고 있다.
이것에 의해, 모양이나 그림 등의 패턴이 타이틀의 근처에 존재하고, 타이틀을 구성하는 문자와 모양이나 그림 등의 패턴이 동일한 그룹으로 분류된 경우에 있어서도, 모양이나 그림 등의 패턴을 그 그룹으로부터 제거하는 것이 가능해져서, 타이틀을 추출할 때의 정밀도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 상기 그룹핑 수단으로 그룹핑된 외접 구형의 배치 상태에 기초하여, 문자열 방향을 추정하는 문자열 방향 추정 수단과, 상기 그룹핑 수단으로 그룹핑된 외접 구형의 배치 상태에 기초하여, 문자열을 추출하는 문자열 추출 수단을 구비하고 있다.
이것에 의해, 외접 구형이 불규칙하게 배치되어 있는 영역과, 외접 구형이 규칙적으로 배치되어 있는 영역을 구별하는 것이 가능해져서, 외접 구형이 규칙적으로 배치되어 있는 영역을 타이틀 영역으로 하는 것이 가능해지기 때문에, 타이틀 영역만을 효율적으로 추출하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 그룹핑된 외접 구형의 그룹 내의 사이즈에 기초하여, 상기 그룹 내의 외접 구형을 재그룹핑하도록 하고 있다.
이것에 의해, 크기가 다른 문자를 각각의 그룹에 넣는 것이 가능해지기 때문에, 입력 화상으로부터 타이틀 등을 추출할 때에, 크기가 같은 문자로 이루어지는 문자열만을 1개의 타이틀로 하는 것이 가능해져서, 타이틀을 추출할 때의 정밀도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 상기 그룹핑 수단으로 그룹핑된 그룹의 외접 구형으로부터, 소정의 크기를 만족시키는 외접 구형을 추출하는 외접 구형 추출 수단과, 상기 추출된 외접 구형 중, 상호 인접하는 외접 구형의 상단 좌표 또는 하단 좌표가 가까운 것에, 횡 정렬 플래그를 부여하는 횡 정렬 플래그 부여 수단과, 상기 추출된 외접 구형 중, 상호 인접하는 외접 구형의 좌단 좌표 또는 우단 좌표가 가까운 것에, 종 정렬 플래그를 부여하는 종 정렬 플래그 부여 수단과, 상기 횡 정렬 플래그 및 상기 종 정렬 플래그의 갯수에 기초하여, 상기 그룹의 문자열 방향을 결정하는 문자열 방향 결정 수단과, 상기 결정된 문자열 방향에 대응하는 플래그가 부여된 상기 그룹 내의 외접 구형의 갯수의 비율에 기초하여, 상기 그룹의 외접 구형이 문자열의 외접 구형인지의 여부를 결정하는 문자열 결정 수단을 구비하고 있다.
이것에 의해, 그룹 내의 외접 구형이 일렬로 다 같이 배치되어 있는지의 여부를 판별하는 것이 가능해져서, 일렬로 다 같이 배치되어 있는 외접 구형이 많은 그룹을 타이틀 영역이라 간주하는 것이 가능해지기 때문에, 입력 화상으로부터 타이틀을 효율적으로 추출하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 그룹핑된 그룹의 외접 구형을 생성하는 외접 구형 생성 수단과, 그룹핑된 그룹 내의 패턴의 대표색에 기초하여, 그룹의 대표색을 산출하는 대표색 산출 수단을 구비하고 있다.
이것에 의해, 타이틀 영역에 존재하는 모든 색을 고려하여, 타이틀의 색을 산출하는 것이 가능해져서, 타이틀 영역의 국소적인 색의 차이의 영향을 저감시키는 것이 가능해지기 때문에, 타이틀의 색에 기초하여 타이틀 영역을 추출할 때의 정밀도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 그룹의 대표색에 기초하여, 상호 인접하여 존재하는 그룹의 외접 구형을 통합하도록 하고 있다.
이것에 의해, 동일한 타이틀을 구성하는 문자인데도 불구하고, 색이 미묘하게 다르기 때문에, 이들의 문자가 각각의 그룹에 속하게 된 경우에 있어서도, 이들의 문자를 동일한 그룹으로 통합하는 것이 가능해져서, 타이틀 영역을 효율적으로 추출하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 상호 인접하여 존재하는 그룹의 외접 구형의 크기의 차가 소정의 범위 내에 있고, 또한, 그룹의 대표색의 차가 일정한 범위 내에 있는 경우에, 그룹의 외접 구형을 통합한다.
이것에 의해, 그룹의 외접 구형을 통합할 때에, 동일한 타이틀을 구성하는 문자로 이루어지는 그룹만을 효율적으로 통합하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 그룹의 대표색에 기초하여, 원화상의 화소를 그룹의 외접 구형의 범위 내로부터 재추출하도록 하고 있다.
이것에 의해, 타이틀을 구성하는 문자에 탁점이나 반탁점 등이 포함되어 있고, 타이틀 영역의 국소적인 색의 차이의 영향으로, 이들 탁점이나 반탁점 등이 타이틀의 그룹으로부터 누락된 경우에 있어서도, 타이틀 영역의 전체적인 색과 비교하여, 이들 탁점이나 반탁점 등을 재추출하는 것이 가능해져서, 타이틀을 추출할 때의 정밀도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 재추출된 화소를 2치화하는 2치화 수단과, 상기 2치 화상의 라벨링을 행하는 제2 라벨링 수단과, 상기 제2 라벨링 수단에 의해 라벨링된 패턴의 외접 구형이 임계치보다 큰 것을, 상기 그룹에 추가하는 추가 수단을 구비하고 있다.
이것에 의해, 탁점이나 반탁점 등을 타이틀 영역으로부터 재추출할 때에, 타이틀과 동색의 미세한 노이즈가 타이틀 영역 내에 존재하는 경우에 있어서도, 이들 노이즈만을 삭제하는 것이 가능해져서, 타이틀을 추출할 때의 정밀도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 그룹핑된 그룹의 외접 구형의 면적, 위치 및 위치 관계의 정보에 기초하여, 그룹 내의 패턴의 출력 순서를 결정하도록 하고 있다.
이것에 의해, 입력 화상으로부터 복수의 타이틀 후보가 추출된 경우에 있어서도, 타이틀다움을 평가하는 것이 가능해져서, 타이틀로서의 우선도가 높은 것으로부터 순으로 출력하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 그룹핑된 그룹의 외접 구형 내의 라벨 화상에 1의 레벨을 부여한 2치 패턴을 생성하도록 하고 있다.
이것에 의해, 색 정보를 이용하여 라벨링된 라벨 화상으로부터, 2치 화상을 생성하는 것이 가능해져서, 컬러 화상으로부터 추출된 패턴의 인식 처리를 효율적으로 행하는 것이 가능해진다.
도 1은 본 발명의 제1 실시예에 따른 패턴 추출 장치의 구성을 나타내는 블럭도.
도 2는 본 발명의 제2 실시예에 따른 패턴 추출 장치의 구성을 나타내는 블럭도.
도 3은 본 발명의 제3 실시예에 따른 패턴 추출 장치의 구성을 나타내는 블럭도.
도 4는 본 발명의 제4 실시예에 따른 패턴 추출 장치의 구성을 나타내는 블럭도.
도 5는 본 발명의 한 실시예에 따른 패턴 추출 장치의 시스템 구성을 나타내는 블럭도.
도 6은 본 발명의 제5 실시예에 따른 패턴 추출 장치의 구성을 나타내는 블럭도.
도 7은 본 발명의 제6 실시예에 따른 패턴 추출 장치의 구성을 나타내는 블럭도.
도 8은 도 7의 패턴 추출 장치의 동작을 나타내는 플로우차트.
도 9는 본 발명의 한 실시예에 따른 축소 화상 작성 방법을 설명하는 도면.
도 10은 본 발명의 한 실시예에 따른 라벨링 방법을 설명하는 도면.
도 11은 본 발명의 한 실시예에 따른 임계치 참조 테이블의 구성을 나타내는 도면.
도 12는 본 발명의 한 실시예에 따른 임계치 참조 테이블의 별도의 구성을 나타내는 도면.
도 13은 본 발명의 한 실시예에 따른 외접 구형 처리 및 원화상 라벨링 처리의 설명도.
도 14는 망점 인쇄법에 의한 컬러 화상의 표현 방법의 설명도.
도 15는 망점 인쇄법에 의한 컬러 화상의 확대도.
도 16의 (a)는 망점 인쇄법으로 균일색으로 인쇄된 영역을 나타내는 도면, 도 16의 (b)는 도 16의 (a)의 영역에 판독 메쉬를 설정한 결과를 나타내는 도면, 도 16의 (c)는 각 화소마다의 판독 결과를 나타내는 도면.
도 17은 본 발명의 한 실시예에 따른 인쇄 모델의 생성 방법을 나타내는 도면.
도 18은 본 발명의 한 실시예에 따른 색차 테이블의 구성을 나타내는 도면.
도 19는 본 발명의 한 실시예에 따른 색차 테이블 생성 장치의 구성을 나타내는 블럭도.
도 20은 본 발명의 제7 실시예에 따른 패턴 추출 장치의 구성을 나타내는 블럭도.
도 21은 도 7의 패턴 추출 장치의 동작을 나타내는 플로우차트.
도 22는 본 발명의 한 실시예에 따른 모델 해상도 추정 처리의 설명도.
도 23은 본 발명의 한 실시예에 따른 색 라벨링 처리의 설명도.
도 24는 본 발명의 한 실시예에 따른 주목 구형의 주위의 탐색 범위의 설정 방법의 설명도.
도 25는 본 발명의 한 실시예에 따른 주목 구형의 주위의 탐색 범위에 관한 구형의 추출 방법의 설명도.
도 26은 본 발명의 한 실시예에 따른 주목 구형의 주위의 탐색 범위에 관한 구형 정보의 저장 방법의 설명도.
도 27은 본 발명의 한 실시예에 따른 문자선의 굵기의의 산출 방법의 설명도.
도 28은 본 발명의 한 실시예에 따른 문자선의 굵기에 의한 재그룹핑 처리의 설명도.
도 29는 본 발명의 한 실시예에 따른 윤곽 추적에서의 화소의 탐색 개시점의 설정 방법의 설명도.
도 30은 본 발명의 한 실시예에 따른 전류 화소로부터 본 방향 코드를 나타내는 도면.
도 31은 본 발명의 한 실시예에 따른 그룹 내의 큰 구형 삭제 처리의 설명도.
도 32는 본 발명의 한 실시예에 따른 구형 높이의 최대 빈도치의 산출 방법의 설명도.
도 33은 본 발명의 한 실시예에 따른 그룹 내의 중복 구형 통합 처리의 설명도.
도 34는 본 발명의 한 실시예에 따른 그룹 내 문자열 추출 처리의 설명도.
도 35는 본 발명의 한 실시예에 따른 문자열 내 분리 문자 통합 처리의 설명도.
도 36은 본 발명의 한 실시예에 따른 그룹 내의 문자열 사이즈에 의한 재그룹화 처리의 설명도.
도 37은 본 발명의 한 실시예에 따른 그릅 통합 처리의 설명도.
도 38은 본 발명의 한 실시예에 따른 구형 정렬에 의한 문자열과 유사한 그룹의 추출 처리의 설명도.
도 39는 본 발명의 한 실시예에 따른 노이즈 그룹의 삭제 처리의 설명도.
도 40은 본 발명의 한 실시예에 따른 그룹 내 동일색 패턴 추출 처리의 설명도.
도 41의 (a)는 본 발명의 한 실시예에 따른 원화상을 나타내는 도면, 도 41의 (b)는 도 41의 (a)의 라벨 화상을 나타내는 도면, 도 41의 (c)는 도 41의 (b)의 라벨 화상에 설정된 주목 구형을 나타내는 도면, 도 41의 (d)는 그룹 추출 결과를 나타내는 도면.
도 42의 (a)는 도 41의 (d)의 그룹 추출 결과를 문자선 굵기로 재그룹화한 결과를 나타내는 도면, 도 42의 (b)는 도 42의 (a)의 구형의 중복 통합 후의 결과를 나타내는 도면, 도 42의 (c)는 도 42의 (b)의 화상으로부터 구형 정렬에 의한 문자열과 유사한 그룹을 추출한 결과를 나타내는 도면, 도 42의 (d)는 도 42의 (c)의 화상으로부터 그룹 내 패턴을 추출한 결과를 나타내는 도면.
도 43의 (a)는 도 41의 (a)의 화상으로부터 추출된 타이틀의 제1 후보의 패턴을 나타내는 도면, 도 43의 (b)는 도 41의 (a)의 화상으로부터 추출된 타이틀의 제2 후보의 패턴을 나타내는 도면.
도 44는 종래의 색 분해 화상의 생성 방법을 나타내는 도면.
도 45는 종래의 영역 확장법을 나타내는 도면.
<도면의 주요 부분에 대한 부호의 설명>
1 : 색 정보 산출 수단
2 : 기하학 정보 산출 수단
3 : 분류 수단
11 : 클러스터링 수단
12 : 그룹핑 수단
21 : 색차 산출 수단
22 : 임계치 설정 수단
23, 33, 67, 77 : 라벨링 수단
31 : 제1 색 정보 비교 수단
32 : 제2 색 정보 비교 수단
41, 64, 74, 114, 134 : CPU
42 : ROM
43 : RAM
44 : 통신 인터페이스
45 : 통신 네트워크
46 : 버스
47 : 입출력 인터페이스
48 : 디스플레이
49 : 프린터
50, 63, 73, 113, 133 : 메모리
51 : 스캐너
52 : 키보드
53 : 드라이버
54 : 하드 디스크
55 : IC 메모리 카드
56 : 자기 테이프
57 : 플로피 디스크
58 : 광 디스크
61, 71, 111, 131 : 컬러 화상 입력 장치
62, 72, 112, 132 : 외부 출력 장치
65, 75 : 화상 축소 수단
66, 76 : 가변 임계치 설정 수단
78 : 외접 구형 처리 수단
79 : 원화상 라벨링 수단
80 : 특정 영역 추출 수단
115 : 인쇄 모델 생성부
116 : 색차 테이블 생성부
135 : 색차 테이블
136 : 생 분해 화상 생성부
137 : 문자 영역 추출부
이하, 본 발명의 실시예에 따른 패턴 추출 장치에 대해 도면을 참조하면서 설명한다.
도 1은, 본 발명의 제1 실시예에 따른 패턴 추출 장치의 구성을 나타낸 블럭도이다.
도 1에 있어서, 색 정보 산출 수단(1)은, 입력 화상 내의 패턴에 대한 색 정보를 산출한다. 기하학 정보 산출 수단(2)은, 입력 화상 내의 패턴에 대한 기하학 정보를 산출한다. 분류 수단(3)은, 색 정보 산출 수단(1)으로 산출된 색 정보 및 기하학 정보 산출 수단(2)으로 된 기하학 정보에 기초하여, 입력 화상 내의 패턴의 분류를 행한다. 여기서, 색 정보는, 예를 들면, 색 공간 상에서의 패턴의 색이다. 또한, 기하학 정보는, 예를 들면, 패턴의 크기나 입력 화상 내에서의 위치, 또는, 다른 패턴과의 상대적인 위치 관계이다.
이와 같이, 입력 화상 내의 패턴의 분류를 행할 때에, 패턴의 색 정보뿐만 아니라, 패턴의 기하학 정보를 이용함으로써, 컬러 입력 화상 내로부터 동일색이 부여된 헤드라인 영역을 추출하는 경우 등에 있어서, 컬러 입력 화상 내의 일부의 영역에 범위를 한정하여, 다른 라벨이 부여된 동일색의 패턴을 1개의 그룹으로 통합하거나, 특정한 위치에 있는 패턴이나 소정의 크기의 패턴에만 주목하여, 다른 라벨이 부여된 패턴을 1개의 그룹으로 통합하는 것이 가능해진다.
이 결과, 헤드라인 영역의 존재하는 가능성이 큰 범위에 대해서만 라벨링 처리를 행하거나, 헤드라인 문자가 되지 않는 노이즈 등의 작은 패턴이나 배경 등의 큰 패턴을 처리 대상으로부터 제거하거나 하는 것이 가능해져서, 헤드라인 영역의 추출 처리의 속도를 향상시키는 것이 가능해짐과 동시에, 헤드라인 영역 이외의 색의 영향을 적게 하는 것이 가능해지기 때문에, 헤드라인 영역의 추출 정밀도도 향상시키는 것이 가능해진다.
도 2는, 본 발명의 제2 실시예에 따른 패턴 추출 장치의 구성을 나타낸 블럭도이다.
도 2에 있어서, 클러스터링 수단(11)은, 이웃하는 화소끼리의 색 정보에 기초하여, 입력 화상 내의 화소의 클러스터링을 행한다. 그룹핑 수단(12)은, 클러스터링 수단(11)으로 얻어진 클러스터끼리의 색 정보 및 기하학 정보에 기초하여, 클러스터의 그룹핑을 행한다.
이것에 의해, 입력 화상 내의 화소의 클러스터링을 행할 때에는, 자기 화소가 인접하는 화소와 색 정보를 비교하면 좋고, 입력 화상 내의 모든 화소끼리를 비교할 필요가 없어진다.
이 결과, 입력 화상 내의 모든 화소끼리를 비교하면, 화소끼리의 색 정보의 비교 횟수가 입력 화상 내의 화소수의 2승의 오더가 되는데 대해, 자기 화소가 인접하는 화소와 비교한 경우에는, 화소끼리의 색 정보의 비교 횟수를 입력 화상 내의 화소수의 오더로 끝내는 것이 가능해져서, 클러스터링 처리의 고속화가 가능해진다.
또한, 클러스터링된 클러스터를 그룹핑 시의 처리 대상으로 함으로써, 동일 클러스터 내에 존재하는 화소를 일체적으로 취급하여 처리하는 것이 가능해져서, 개개의 화소를 처리 대상으로 할 필요가 없어지기 때문에, 그룹핑 처리를 고속으로 행하는 것이 가능해진다.
또한, 입력 화상 내의 일부의 영역에 범위를 한정하여 클러스터링의 그룹핑을 행하거나, 노이즈밖에 포함되어 있지 않는 작은 클러스터를 그룹핑 대상으로부터 제외하거나 하는 것이 가능해지기 때문에, 그룹핑 처리의 보다 한층 고속화를 달성하는 것이 가능해져서, 특히, 컬러 화상 등과 같이 라벨수가 막대한 수로 되는 경우에는, 효과가 크다.
도 3은, 본 발명의 제3 실시예에 따른 패턴 추출 장치의 구성을 나타낸 블럭도이다.
도 3에 있어서, 색차 산출 수단(21)은, 소정의 색으로 표현된 영역의 인접 화소 사이의 색차를 산출한다. 임계치 설정 수단(22)은, 색차 산출 수단(21)으로 산출된 색차에 기초하여 임계치를 설정한다. 라벨링 수단(23)은, 임계치 설정 수단(22)으로 설정된 임계치에 기초하여, 소정의 색으로 표현된 화소에 인접하는 화소의 라벨링을 행한다.
예를 들면, 입력 화상이 망점 인쇄법으로 인쇄한 인쇄물이고, 입력 화상의 패턴의 색이, 기본이 되는 다른 색의 도트의 크기 및 이들의 조합으로 표현되어 있는 것으로 한다. 여기서, 기본이 되는 다른 색의 도트의 크기가 작기 때문에, 기본이 되는 다른 색의 도트의 크기 및 이들의 조합으로 1개의 색을 표현한 때에, 육안으로는, 각 도트마다의 색의 차이가 식별할 수 없고, 그 색이 단일색으로 보이는 경우라도, 디바이스의 판독 해상도가 각 도트마다의 색의 차이를 판별할 수 있을 정도로 큰 경우에는, 육안으로는 단일색으로 보이는 영역이, 디바이스에 있어서는 단일색이 아니라고 판단된다.
이 때문에, 이 디바이스의 판독 결과를 그대로 이용하여, 라벨링을 행하면, 육안으로는 단일색으로 보이는 1개의 패턴에 다른 라벨이 부여되고, 이 라벨링 결과에 기초하여 추출된 패턴을 인간에게 제시하면, 인간이 1개의 패턴으로 인식하는 부분에, 구멍이 생기거나, 결함이 발생되거나 하여, 패턴의 추출 정밀도가 악화한다.
그래서, 육안으로 단일색으로 보이는 부분에 대해, 디바이스로 판독하였을 때의 색의 변동을 구하고, 그 색의 변동의 범위 내에 있는 화소에 동일한 라벨을 부여함으로써, 육안으로 단일색으로 보이는 1개의 패턴에 동일한 라벨을 부여하는것이 가능해져서, 인간이 하나의 패턴으로 인식하는 부분에, 구멍이 생기거나, 결함이 발생되거나 하는 것을 방지하는 것이 가능해진다.
도 4는, 본 발명의 제4 실시예에 따른 패턴 추출 장치의 구성을 나타낸 블럭도이다.
도 4에 있어서, 제1 색 정보 비교 수단(31)은, 입력 화상의 인접 화소 사이의 색 정보를 비교한다. 제2 색 정보 비교 수단(32)은, 제1 색 정보 비교 수단(31)으로 비교 대상이 된 화소의 색 정보와, 상기 화소에 인접하는 라벨 화상의 색 정보를 비교한다. 라벨링 수단(33)은, 제1 색 정보 비교 수단(31)의 비교 결과 및 제2 색 정보 비교 수단(32)의 비교 결과에 기초하여, 라벨링을 행한다. 여기서, 라벨 화상의 색 정보는, 예를 들면, 동일 라벨이 부여된 화소의 색 정보의 평균치이다.
예를 들면, 입력 화상의 타이틀 영역의 색이 서서히 변화하고 있기 때문에, 타이틀을 구성하는 문자열과 배경의 경계가 불명확하게 되어 있는 것으로 한다. 이 경우에, 상호 인접하는 화소의 색 정보를 비교한것 만으로는, 상호 인접하는 화소 사이에서는 색이 유사하기 때문에, 이들 화소에 동일한 라벨이 부여되고, 이들의 화소를 순서대로 찾아가면, 타이틀 영역 내에 배경의 패턴이 입력되고, 타이틀과는 색이 분명히 다른 화소에까지 동일한 라벨이 부여되는 경우가 있다.
여기서, 상호 인접하는 화소 사이에 대해서만 색 정보를 비교하는 것이 아니라, 이미 라벨 부여가 되어 있는 패턴의 색 정보와의 비교도 행하여, 라벨 부여를 행함으로써, 색이 서서히 변화하는 경우에 있어서도, 타이틀 영역과 배경 사이의 경계를 검출하는 것이 가능해진다.
도 5는, 본 발명의 한 실시예에 따른 패턴 추출 장치의 시스템 구성을 나타낸 블럭도이다.
도 5에 있어서, 참조 번호(41)는 전체적인 처리를 행하는 중앙 연산 처리 유닛(CPU), 참조 번호(42)는 리드 온리 메모리(ROM), 참조 번호(43)는 랜덤 억세스 메모리(RAM), 참조 번호(44)는 통신 인터페이스, 참조 번호(45)는 통신 네트워크, 참조 번호(46)는 버스, 참조 번호(47)는 입출력 인터페이스, 참조 번호(48)는 헤드라인 문자 등의 인식 결과 등을 표시하는 디스플레이, 참조 번호(49)는 헤드라인 문자 등의 인식 결과 등을 인쇄하는 프린터, 참조 번호(50)는 스캐너(51)에 의해 판독된 데이타를 일시적으로 저장하는 메모리, 참조 번호(51)는 입력 화상 등을 판독하는 스캐너, 참조 번호(52)는 키보드, 참조 번호(53)는 기억 매체를 구동하는 드라이버, 참조 번호(54)는 하드디스크, 참조 번호(55)는 IC 메모리 카드, 참조 번호(56)는 자기 테이프, 참조 번호(57)는 플로피 디스크, 참조 번호(58)는 CD-ROM이나 DVD-ROM 등의 광 디스크이다.
패턴 추출 처리를 행하는 프로그램 등은, 하드디스크(54), IC 메모리 카드(55), 자기 테이프(56), 플로피 디스크(57), 광 디스크(58) 등의 기억 매체에 저장된다. 그리고, 패턴 추출 처리를 행하는 프로그램 등을, 이들 기억 매체로부터 RAM(43)에 판독함으로써, 패턴 추출 처리를 행할 수 있다. 또한, 패턴 추출 처리를 행하는 프로그램 등을, ROM(42)에 저장하여 놓는 것도 가능하게 된다.
또한, 패턴 추출 처리를 행하는 프로그램 등을, 통신 인터페이스(44)를 통해 통신 네트워크(45)로부터 추출할 수 있다. 통신 인터페이스(44)에 접속되는 통신 네트워크(45)로서, 예를 들면, LAN(Local Area Network), WAN(Wide Area Network), 인터넷, 아날로그 전화망, 디지탈 전화망(ISDN: Integral Service Digital Network), PHS(퍼스널 핸디 시스템)나 위성 통신 등의 무선 통신망을 이용할 수 있다.
CPU(41)는, 패턴 추출 처리를 행하는 프로그램이 기동되면, 스캐너(51)에 의해 판독된 입력 화상의 라벨링을 행하는 임계치를 설정하고, 스캐너(51)에 의해 판독된 입력 화상으로부터 라벨 화상을 생성한다. 라벨 화상이 생성되면, 입력 화상의 패턴의 각 라벨마다, 각 패턴에 대한 외접 구형을 생성한다. 그리고, 각 외접 구형 내의 영역의 색 정보 및 외접 구형의 기하학 정보에 기초하여, 각 외접 구형의 그룹핑을 행하고, 이 그룹핑된 외접 구형의 배치 상태나 크기 등을 고려하여, 타이틀 영역 등을 추출한다. 타이틀 영역이 추출되면, 이 타이틀 영역에 포함되어 있는 패턴을 입력 화상으로부터 추출된 타이틀로서 디스플레이(48)나 프린터(49)에 출력하거나, 이 타이틀 영역에 포함되는 패턴의 문자 인식을 행하고, 그 인식 결과에 기초하여, 문서의 자동 검색을 행하거나 한다.
도 6은, 본 발명의 제5 실시예에 따른 패턴 추출 장치의 구성을 나타낸 블럭도이다.
도 6에 있어서, 참조 번호(61)는 컬러 화상 입력 장치, 참조 번호(62)는 외부 출력 장치, 참조 번호(63)는 메모리, 참조 번호(64)는 연산 장치(CPU), 참조 번호(65)는 화상 축소 수단, 참조 번호(66)는 가변 임계치 설정 수단, 참조 번호(67)는 라벨링 수단이다.
컬러 화상 입력 장치(1)로부터 컬러 화상 신호가 입력되면, 화상 축소 수단(65)이, 예를 들면, 화소수로 1/9의 축소 화상을 작성한다. 그리고, 이 축소 화상에 있어서, 영역 확장법 등의 수법을 이용하여, 다소의 색차를 허용하는 라벨링을 행하고, 동일 라벨 영역을 나타내는 라벨 화상과 동일 라벨 영역을 둘러싸는 외접 구형을 구한다.
이 때, 인접 화소와 동일 라벨을 부여하는 색의 값의 차의 임계치는, 영역 확장법과 같은 고정이 아니라, 대상이 되는 색에 의해 가변으로 한다. 이 임계치는, 예를 들면, 대상이 되는 색에 따라서, 미리 작성한 테이블을 가변 임계치 설정 수단(66)이 참조함으로써 얻어진다.
이와 같이, 축소 화상에서 구해진 동일 라벨 영역을 탐색하여, 그 중의 색을 표현하는 (R, G, B) 등의 수치열의 종류를 전부 조사하여, 이것을 이 라벨의 속성으로서 기억한다. 또한, 이 색의 종류로부터, 이 라벨의 대표색도 구한다.
다음에, 이러한 축소 화상으로 구한 외접 구형을 원화상에 반영시켜, 이 구형 내부만을 주사하여 대표색에 유사한 색을 검출하고, 이 화소로부터 인접 화소에 대한 라벨링을 행한다. 단, 동일하다고 간주하는 색은 상기한 처리에 의해 동일색이라고 간주한 색의 종류이다.
그리고, 원화상으로부터 요구한 라벨 화상 중으로부터, 대상이 되는 업무에 알맞는 특정 영역 추출을 행한다. 예를 들면, 큰 문자로 기재되어 있는 헤드라인이나, 타이틀 등의 키워드가 되는 문자의 영역을 컬러 문서로부터 추출하는 경우에는, 외접 구형의 크기나 정렬의 정보를 사용한 문자열 추출 기술로, 대상이 되는 문자열 영역만을 추출하면 좋다.
도 7은, 본 발명의 제6 실시예에 따른 패턴 추출 장치의 구성을 나타낸 블럭도이다.
도 7에 있어서, 참조 번호(71)는 컬러 화상 입력 장치, 참조 번호(72)는 외부 출력 장치, 참조 번호(73)는 메모리, 참조 번호(74)는 연산 장치이다.
컬러 화상 입력 장치(71)는, 외부의 컬러 화상을 RGB 신호로 입력하는 것으로, 예를 들면, CCD 카메라나, 스캐너 등이다.
외부 출력 장치(72)는 연산 장치(74)에 의해 여러가지 처리가 행해진 결과 얻어진 처리 결과를 출력하는 것으로, 예를 들면, 디스플레이 등으로 구성되어 있다.
메모리(73)는 화상 정보나 임계치 정보를 유지하는 것으로, 컬러 화상 입력 장치(71)로부터 입력된 컬러 화상 신호를 유지하거나, 유지된 컬러 화상 신호를 연산 장치(74)가 처리를 행함으로써 얻어진 처리 결과 등을 유지하거나 한다.
연산 장치(74)는, 컬러 화상 입력 장치(71)에 의해 입력된 컬러 화상 신호에 대해 축소 화상을 작성하거나, 라벨링 처리하거나, 특정 영역 추출 처리 등의 각종 처리를 행하는 것으로, 화상 축소 수단(75), 가변 임계치 설정 수단(76), 라벨링 수단(77), 외접 구형 처리(78), 원화상 라벨링 수단(79), 특정 영역 추출 수단(80) 등을 구비한다.
도 8은, 도 7의 컬러 화상 처리 장치의 동작을 나타낸 플로우차트이다.
도 8에 있어서, 예를 들면, 컬러 문서와 같은 피사체를, CCD 카메라나 스캐너 등의 촬상 장치와 같은 컬러 화상 장치(71)로 입력하고, 얻어진 컬러 화상을 메모리(73)에 보존한다(스텝 S1).
다음에, 이 메모리(73) 상에 보존된 컬러 화상을, 화상 축소 수단(75)이 고정 축소율로, 혹은, 축소 후에 규정의 크기가 되는 축소율로 축소하여, 메모리(73)에 셋트한다(스텝 S2). 이 축소율은 기록해 놓는다. 축소 방법은, 예를 들면, 도 9a에 도시한 바와 같이, 1/3로 축소하는 경우에는 (R, G, B)로 표현된 원화상의 3×3의 영역을 축소 화상 1×1에 대응시키는 것으로 되지만, 이 경우, 원화상의 3×3의 영역 내부의 9개의 화소의 색의 (R, G, B)를 1단위로 하여, 도 9b에 도시한 막대 그래프를 작성하고, 최대 빈도치를 대응하는 축소 화상의 화소의 값으로서 셋트한다.
만일, 하나로 결정되는 최대 빈도치가 없으면, 다음 복수치 중의, 어느 하나를 미리 정한 알고리즘으로 선출하여, 이것을 대응하는 축소 화상의 화소의 값으로 한다.
일반적으로는, 원화상의 n×n의 영역을 축소 화상의 1×1에 대응시키는 1/n의 축소율로 축소하는 경우에는, 원화상의 n×n의 영역 내부에 있는 화소의 색의 (R, G, B)를 1단위로서 취급한 막대 그래프를 작성하고, 예를 들면, 그 중간치나 최대 빈도치를 대응하는 축소 화상의 화소의 값으로 하는 것이다.
여기서, 축소 화상에 셋트하는 값은, 원화상의 대응하는 n×n의 영역 내부에 있는 화소의 색의 평균치 등과 같은 발생한 값이 아니라, 어디까지나, 원화상에 존재하는 값을 사용한다.
다음에, 이와 같이 축소 처리한 축소 화상에 대해, 라벨링 수단(77)이 색 라벨링 처리, 즉, 축소 화상을 대상으로서 인접하는 화소의 색이 유사한 경우에 동일 라벨을 부여하는 처리를 행한다(스텝 S3). 즉, 축소 화상에 대해, 그 좌측 상부로부터 라스터 스캔을 행하고, 라벨 부여가 되어 있지 않는 화소에 주목하고, 이 화소에 지금까지 부여한 라벨치보다도 +1한 라벨치를 부여한다.
예를 들면, 도 10의 (a)에 도시한 바와 같이, 주목 화소 C의 컬러의 값을 (Rc, Gc, Bc)로 하고, 이 주목 화소 C의 주위의 8화소를 1∼8로 하고, 이들 주위의 8화소의 컬러의 값을 (Rl, Gl, Bl) (i=1∼8)로 할 때, 각각의 화소의 컬러의 값(Rl, Gl, Bl) 값을 구한다. 즉, 화소 1, 2, . . . 8에 대한 컬러의 값 (Rl, Gl, Bl), (R2, G2, B2)…(R8, G8, B8)를 구한다.
그리고, 주목 화소의 컬러의 값(Rc, Gc, Bc)과의 거리 dcl(i=1∼8)을 구하고, 그것이 R, G, B에 대해 임계치(Rth, Gth, Bth)보다 작은 값의 경우에 주목 화소와 동일 라벨을 부여한다. 예를 들면, 화소(1)와 주목 화소 C와의 거리 dcl을 구하는 경우, R, G, B의 각 컬러마다 각각의 값이 임계치 Tth, Gth, Bth 이내에 있는지의 여부를 구하고, 3색 모두 임계치보다 작을 때, 즉 유사하고 있는 경우에, C와 동일한 라벨을 i에 부여하기 위해서 dcl에 작은 값을 부여한다. 그러나, 1색의 값이라도 임계치 이상일 때, 별도의 라벨을 부여하기 위한 큰 값(임계치 th보다 큰 값)을 부여한다. 이 거리 dc1은, 하기와 같이 하여 구해진다.
그리고, 수학식 1이 성립할 때, dcl=0으로서 동일 라벨을 부여하고, 불성립일 때, dcl=1000 등의 임계치보다도 큰 값을 부여한다. 일반적으로는, 도 10의 (b)에 도시한 바와 같이, 이하의 식으로 거리 dci(1=1∼ 8)를 나타낼 수 있다.
1000 그 이외의 조건
단, 1000은 이것에 한정되는 것이 아니라, 임계치보다 큰 값을 나타낸다.
또, 컬러마다의 임계치 (Rth, Gth, Bth)는, CCD 카메라나 스캐너 등의 입력 장치와 피사체에 의존한 샘플로부터 미리 구해 있던 표를 이용한다. 더구나, 주목 화소의 색의 값 (R, G, B)를 키로 하여, 이 색의 값에 따라서 미리 임계치를 정해 놓는다.
예를 들면, 도 11의 (a)에 도시한 바와 같이, 입력 화상에 대해 예상되는 주목 화소의 색의 값(R, G, B)의 모든 조합을 엔트리로서 갖는 표를 인용하여, 색의 각 요소마다, 요소마다 독립하여 정해진 임계치(Rth, Gth, Bth)를 구한다. 예를 들면, 도 11의 (a)의 테이블에서는, 주목 화소의 컬러의 값이 (Rl, Gl, B1)일 때 임계치가 R, G, B에 대해, 각각 (Rth1, Gth1, Bth1)이고, 주목 화소의 컬러치가 (R2, G2, B2)일 때 임계치가 (Rth2, Gth2, Bth2)이다.
도 11의 (a)의 경우에는, 미리 샘플의 분포로부터 예상되는 주목 화소의 색의 값을 키로 하여, 모든 색의 값의 조합을 엔트리로서 갖는 임계치 참조표를 준비해 두고, 주목 화소의 색의 조합에 의해, 이 임계치 참조표를 참조하는 예를 나타내었으므로, 표의 크기가 이들 각색의 조합의 분만큼 필요해져서, 매우 큰 것으로 된다.
여기서, 임계치 참조표의 대용량화를 방지하기 위해, 임계치 참조표의 엔트리에는 모든 (R, G, B)의 조합은 갖지 않고서, (R, G, B)의 값으로 클러스터링을 행한 결과의 (R, G, B)의 대표 엔트리만을 갖는 임계치 참조표를 준비하여, 주목 화소의 (R, G, B)의 값과 대표 엔트리와의 거리치 즉 유사도를 구하고, 가장 유사한 대표 엔트리를 추출하여, 그것을 키로 하여 색의 각 요소 독립의 임계치 (Rth,Gth, Bth)를 구하는 것도 가능하게 된다.
또한, 임계치 참조표의 대용량화를 방지하기 위해, 각색의 값을 N 계층으로 표현할 때, 예를 들면, N=256에 표현할 때, 컬러치마다 그 컬러에 대한 임계치를 기입한 임계치 참조표를 각 컬러마다 준비하고, 컬러마다 임계치를 이들 임계치 참조표보다 개별로 요구하면, 임계치 참조표의 용량은, 256×3의 엔트리수로 끝나므로 대폭 작게 할 수 있다. 예를 들면, 주목 화소의 컬러치가 (Rl, G2, B2)인 경우, 도 11의 (b)에 도시한 바와 같이, R1에 대한 임계치로서 임계치 참조표 R을 참조하여, DRth1 을 구하고, G2에 대한 임계치로서 임계치 참조표 G를 참조하여, Gth2 를 구하고, B2에 대한 임계치로서 임계치 참조표 B를 참조로 하여, Bth2를 구할 수 있다.
또한, 임계치를 구하는 임계치 참조표의 형식으로서, 도 11의 (a)에 도시한 모든 (R, G, B)의 조합이 아니라, 도 12에 도시한 바와 같이, 컬러치에 대해 복수의 그룹으로 나누고, 각 그룹마다 임계치를 정하는 것도 가능하게 된다. 도 12는 각 컬러치에 대해 4계층마다 1개의 임계치를 정한 예이고, R1∼R4에 대해서는 동일한 임계치 Rt1을, R5∼R8에 대해서는 동일한 임계치 Rt2…, 마찬가지로 G1∼G4에 대해 동일한 임계치 Gt1을 …, 또한, BN-3∼BN에 대해서는 동일한 임계치 BtM을 정한 예이다.
이들 임계치 참조표는, 특히 대상물이 인쇄물로 스캐너 입력인 경우에서는, 인쇄물의 상태를 모델화한 것으로부터 자동적으로 만드는 것도 가능하다.
다음에, 이 라벨 처리한 축소 화상, 즉 라벨 화상에 대해서도 외접 구형 처리를 외접 구형 처리 수단(78)을 행한다(스텝 S4). 즉, 스텝 S3에 있어서, 축소 화상에 대한 라벨링의 결과, 동일 영역은 동일한 라벨치가 부여된다. 그리고, 이 동일 영역에 대해 외접 구형을 구한다.
예를 들면, 도 13의 (a)에 도시한 바와 같이, 문자 영역(93∼95)과 다른 영역(92)의 색이 다른 컬러 화상(91)이 입력된 경우, 도 13의 (b)에 도시한 축소 라벨 화상(96)이 생성되고, 축소 라벨 화상(96)으로부터 외접 구형(98∼100)을 구할 수 있다.
도 13의 (b)에 있어서, 구형 영역(97)은 도 13의 (a)에 도시한 배경 영역(92)에 대응하여, 구형 영역(98∼100)은 각각 도 13의 (a)에 도시한 문자 영역(93∼95)에 대응한다.
그리고 나서, 라벨 화상에 있어서, 동일 라벨로서 기록되어 있는 화소를 주사하여, 그 중의 색의 종류를 전부 기록한다. 이 기록은, 각 외접 구형의 속성 정보로서 기록한다. 또한, 라벨 화상으로 동일 라벨로서 기록되어 있는 모든 화소로부터, 각 라벨의 대표색을 1개 구한다. 이 구하는 방법은, 예를 들면, 색의 종류마다 빈도 분포를 구하고, 가장 빈도가 높은 색을 대표색으로 하는 수법으로 구할 수 있다. 이 대표색 정보도, 외접 구형의 속성 정보로서 기록한다.
또한, 이 라벨링 처리의 결과로서, 라벨링 수단(77)은 다음과 같은 출력 정보를 작성한다.
라벨 화상으로서, 1화소당 2바이트 정보이고, 축소 화상 영역의 높이 및 폭의 사이즈, 축소율이 나타난다. 그리고, 이 축소 화상 영역 내에 존재하는 구형수 nr과 그 구형 정보가 나타난다. 구형 정보로서는, 그 영역 내에 존재하는 구형의 수를 나타내는 구형수 nr, 구형 번호, 이 구형에 내포하는 라벨 화상의 라벨 번호, 구형 좌측 상부 좌표(x1, yl), 구형 우측 하부 좌표(x2, y2), 구형 내의 대표색(Rs, Gs, Bs), 색의 종류수 nc, 색의 종류 (R0, G0, B0), (Rl, Gl, B1) … (Rn -1, Gn -1, Bn - 1) 등이 출력된다.
다음에, 원화상 라벨링 수단(79)은 상기 출력 정보를 받아, 우선, 축소 화상으로 만들어진 구형 정보의 좌측 상부 좌표치와 우측 하부 좌표치를 각각 축소율로 나누고, 대응하는 원화상에서의 좌표를 구한다. 축소율이 1/n인 경우에는 원화상의 구형은, 좌측 상부 좌표가 (x1*n, y1*n)이고, 우측 하부 좌표가 {(x2*n) -1, (y2*: n) - 1}이다. 여기서, *는 승산을 나타내고, 우측 하부 좌표는 1화소 복귀하기 위해서 - 1한다.
원화상 라벨링 수단(79)은, 이 좌표로 나타나는 원화상의 구형 내를 라스터 스캔하여, 이미 라벨이 부여되어 있지 않는 것으로, 또한, 상기 대표색(Rs, Gs, Bs)에 유사한 화소를 찾는다. 유사하다는 것은, 그 화소의 컬러치를 (Rl, Gl, Bl)로 할 때, 예를 들면,
|Rs - Ri| < Rth
and
|Gs - Gl | < Gth
and
|Bs - Bi| < Bth
를 만족시키는 것이다. 또, 여기서의 임계치 Rth, Gth, Bth는, 고정치이다.
이 조건을 만족하는 화소를 검출하면, 이 화소에 지금까지 부여한 라벨치 +1의 라벨치를 부여한다.
그리고 나서, 이 주목한 화소의 주위 8화소를 주사하여, 각각의 화소의 컬러치(Ri, Gi, Bi)를 구하고, 주목 화소의 컬러치 (Rc, Gc, Bc)와의 관계가,
|Rc - Ri| < Rth
and
|Gc - Gi | < Gth
and
|Bc - Bi| < Bth
를 만족시킬 때에 주목 화소와 동일 라벨을 부여한다(스텝 S5).
또한, 이 처리로 동일 라벨이 부여되지 않는 경우에서도, 현재 주목하고 있는 구형의 상기 속성 정보인 색의 종류 전부와 비교하여 마찬가지의 거리를 구하고, 그것이 임계치보다도 작은 경우에, 주목 화소와 동일 라벨을 부여한다.
이와 같이 하여, 도 13의 (c)에 도시한 바와 같이, 각 구형 내 97∼100으로 대표색에 유사한 화소에 주목하여 라벨을 부여함으로써, 그 구형 영역 97∼100 내에 존재하는 동일한 컬러치에 의해 구성되는 화소의 영역 102∼105가 추출된다. 또, 실제의 컬러 문서에 있어서, 화상 영역이 도 13의 (a)에 도시한 바와 같이 크지 않고, 배경이나 색 문자도 여러가지 크기의 것이 혼재하고 있는 경우에는, 동일 라벨 영역도, 도 13의 (c)에 도시한 바와 같이 단순한 것이 아니라, 복잡한 것으로 된다.
다음에, 이와 같이 원화상으로부터 요구한 라벨 화상(101) 중으로부터, 특정 영역 추출 수단(80)이, 대상이 되는 업무에 알맞는 특정 영역 추출을 행한다(스텝 S6). 예를 들면, 컬러 문서로부터 큰 문자로 기재되어 있는 헤드라인이나, 타이틀 등의 키워드가 되는 문자의 영역을 추출하는 경우에는, 미리 통지된 외접 구형의 크기나, 정렬의 정보를 사용한 종래의 문자열 추출의 수법에 기초하여, 대상이 되는 문자열 영역만을 추출할 수 있다.
예를 들면, 추출된 구형 정보를 대상으로서, 구형의 인접 관계를 구한다. 그리고, 상하 또는 좌우의 구형으로 좌표치가 가깝고, 즉, 좌표치의 차가 임계치 내에 들어 가고, 또한, (R, G, B)의 각 색차가 임계치 내에 들어 가는 것을 문자열로서 추출한다. 그리고, 이것을 외부 출력 장치(72)에 있어서, 예를 들면, 표시 출력한다.
또한, 컬러 정경 화상으로부터 하나의 물체를 추출하는 경우에는, 라벨 화상으로 인접하는 영역의 대표색을 HSV(색상, 채도, 명도) 등의 정보로 변환하고, 색상이 유사한 것을 병합 처리한다. 이에 따라, 그림자 등의 영향으로 분할되어 있던 것을 1개의 영역으로 통합할 수 있다. 그리고, 어느 정도의 면적을 갖는 영역을 물체의 후보 영역으로서 출력한다.
이와 같이, 본 발명의 제6 실시예에서는, 축소 화상에 의해 어느 정도 동일한 색으로 종합된 영역을 구하고, 그 범위만을 원화상으로 정밀하게 추출하도록 하였으므로, 처리 시간을 매우 단축할 수 있다. 또한, 인접하는 화소만을 대상으로 하여, 더구나, 화소의 색에 따른 임계치를 이용하여 라벨링을 행하므로, 국소적으로 정밀한 색 클러스터링이 가능해져서, 예를 들면, 추출하고 싶은 영역과 그 배경의 색이 유사한 경우에도, 별도로 구별하는 것이 가능해져서, 정밀도가 좋은 영역 추출을 할 수 있다.
또한, 주목 화소의 색에 따른 임계치를 구할 때, 주목 화소의 색의 3요소를 키로 하여 미리 준비 되어 있는 테이블을 참조하면 좋으므로, 임계치를 구하기 위해서 억세스하는 계산량이 적어서 좋다.
그리고, 주목 화소의 색에 따른 임계치를 구할 때, 주목 화소의 3요소와 테이블의 엔트리인 색의 3요소와의 거리치의 유사도를 구하여 주목 화소의 색에 가장 가까운 엔트리를 추출하여 거기에 기록되어 있는 임계치를 구하므로, 임계치가 기록되어 있는 테이블의 용량을 작게 할 수 있다.
더구나, 색의 3요소에 대한 독립의 임계치를, CCD 카메라나, 스캐너 등의 입력 기기와 피사체에 의존한 샘플의 분포로부터 미리 구한 표를 이용하여 결정하므로, 입력 기기에 의존한 임계치를 갖는 표를 만들 수 있으므로, 정확한 라벨 부여를 행할 수 있다.
다음에, 본 발명의 하나의 실시예에 따른 라벨링일 때 임계치의 설정 방법에 대해 설명한다.
잡지 등의 컬러 인쇄물은, 그라비아 등, 여러가지 인쇄 방법이 있지만, 망점 인쇄법으로 인쇄된 것이, 세상에는 많다. 망점 인쇄법으로 인쇄된 인쇄부에서는, 인간의 눈에는 균일색으로 보이는 영역에서도, 확대하여 보면, 컬러의 므와레 무늬 모양이 생겨 있다.
도 14는, 망점 인쇄에 있어서의 컬러의 므와레 무늬 모양을 나타낸 도면이다.
도 14의 (a)에 있어서, 원화상(111) 내의 「の」라고 쓰여진 영역은, 예를 들면, 오렌지색의 한색으로 그려져 있지만, 도 14의 (b)에 도시한 바와 같이, 「の」라고 쓰여진 영역의 일부를 확대하면, 그 영역은, 여러가지 색이 모여 구성되어 있다.
이 때문에, 인접 화소의 색차(RGB의 휘도차 등)를 고정 임계치와 비교하여, 이들의 화소에 동일 라벨을 부여하는지의 여부를 판단하면, 적응할 수 없는 경우가 있다. 예를 들면, 도 14의 「の」라 쓰여진 영역 내의 화소(111∼113)는, 「の」라 쓰여진 영역 내의 그 밖의 화소와 다른 라벨이 부여되고, 원화상(111)으로부터 「の」의 문자를 추출할 때에, 화소(112∼114)의 부분이 누락하여, 추출 정밀도가 악화된다.
그래서, 인쇄 모델을 이용하여, RGB의 평균 휘도치와 스캐너 판독 해상도마다의 인접 화소의 RGB 각 휘도차를 미리 요구하고, 이들의 결과를 색차 테이블에 저장하여 놓는다. 그리고, 색차 테이블을 참조하면서, 각색마다 임계치를 제어함으로써, 라벨링을 행한다.
예를 들면, 도 14의 「の」라 쓰여진 영역 내에서, 화소(114)와 화소(115) 사이의 색차가 최대인 경우, 화소(114)와 화소(115) 사이의 색차를 오렌지색의 영역을 추출할 때의 임계치로 설정한다. 이 결과, 원화상(111)으로부터 「の」의 문자를 추출할 때, 화소(112∼114)의 부분에 대해서도, 「の」라 쓰여진 영역 내의 그 밖의 화소와 동일한 라벨을 부여하는 것이 가능해져서, 화소(112∼114)의 부분의 누락을 방지하는 것이 가능해진다.
이하, 본 발명의 한 실시예에 따른 컬러 인쇄 모델 및 스캐너 판독 모델로부터, 색의 평균치, 인접 화소와의 색차 및 스캐너 판독 시의 해상도를 기술한 색차 테이블의 작성 수법에 대해 설명한다.
도 15는, 컬러의 망점 인쇄법으로 인쇄된 실제의 인쇄물을 확대하여 나타낸 도면이다.
도 15에 있어서, 망점 인쇄법에서는, 시안(물색), 마젠타(자색), 옐로우(황색)의 점 형상의 모양이 장소에 의해 점(121∼123)의 크기를 바꾸면서, 메쉬 형상으로 규칙적으로 배치되도록 되어 있다.
망점 인쇄를 행하는 경우, 우선, 3원색(또는, 흑을 가한 4원색)의 하나인 색에 대해, 어떤 일정한 간격의 메쉬의 교점에, 희망하는 농도가 되는 적당한 크기의 착색된 원을 배치하여 1색을 인쇄한다. 다음에, 조금 회전시킨 동일한 간격의 메쉬를 이용하여, 착색된 원의 크기를 변경하여, 별도의 색으로 인쇄한다. 또 하나의 색은, 더욱 회전시킨 메쉬를 이용하여, 착색된 원의 크기도 변경하여 인쇄한다. 이러한 인쇄 방법을 취함으로써, 1화소씩 보는 것이 아니라, 대국적으로 보는 인간에게 있어서는, 깨끗한 균일색으로 보이게 된다.
도 16은, 망점 인쇄법으로 1개의 메쉬를 이용하여 1개의 색을 인쇄한 경우에, 화소마다 휘도치가 다른 이유를 설명하는 도면이다.
도 16의 (a)에 있어서, 망점 인쇄법으로 1개의 색을 인쇄하는 경우, 인쇄 메쉬 M1의 격자점에 배치된 반경 r1의 착색된 원 D1을 인쇄하는 것으로 행해진다. 그리고, 망점 인쇄법으로 인쇄되는 색을 바꾸는 경우, 착색된 원 D1의 반경 r1을 변화시킨다. 이 때문에, 망점 인쇄법으로 1개의 색이 인쇄된 영역은, 반경 r1의 착색된 원 D1이 이산적으로 배치된 영역이 된다.
도 16의 (a)의 인쇄물을 스캐너 등으로 판독하는 경우, 스캐너 등에 고유의 해상도로 판독이 행해진다. 이 때문에, 착색된 원 D1은, 도 16의 (b)에 도시한 바와 같이, 판독 시의 해상도에 대응한 판독 메쉬 M2로 구획되는 화소마다 판독된다. 여기서, 착색된 원 D1은 이산적으로 배치되어 있으므로, 판독 메쉬 M2로 구획되는 화소에 포함되는 착색된 원 D1의 면적이, 모든 화소에 대해 균일하게 되지 않는다. 이 결과, 도 16의 (c)에 도시하는 바와 같이, 한가운데의 주목 화소에 대해, 그 주위의 8개의 인접 화소 P1∼P8의 평균 휘도가 다르게 된다.
한편, 도 16의 (a)의 인쇄물로부터 동일색의 영역을 추출하는 경우, 도16a의 인쇄물은 망점 인쇄법으로 1개의 색을 나타내는 것으로 하여 인쇄되어 있으므로, 도 16의 (c)의 한가운데의 주목 화소에 대해, 그 주위의 8개의 인접 화소 P1∼P8은, 주목 화소와 동일한 색을 나타내는 것으로 하여 추출할 필요가 있다. 이 때문에, 주목 화소와 각 인접 화소 P1∼P8과의 휘도차를 구하고, 이들 휘도차 중의 최대치(예를 들면,도 16의 (c)의 예에서는, 주목 화소와 인접 화소 P4와의 휘도차)를 기록해 놓는다. 그리고, 입력 화상으로부터 동일색의 영역을 추출하는 경우, 주목 화소와 인접 화소 사이의 휘도차의 최대치를 임계치로서, 이 임계치 이하의 휘도차를 갖는 인접 화소를 주목 화소와 동일한 색을 나타내는 것으로 하여 추출한다.
이하, 망점 인쇄법을 충실히 재현한 스캐너 판독 모델의 구축 방법에 대해 설명한다.
도 17은, 망점 인쇄법에 있어서의 스캐너 판독 모델을 나타낸 도면이다.
도 17에 있어서, 스캐너 판독 모델로서, 시안, 마젠타, 옐로우의 인쇄 메쉬 Ml1, M12, M13을, 각각 회전시켜 중합시킨 인쇄 모델을 만든다. 여기서, 시안, 마젠타, 예로우의 색의 농도를 조절하는 경우, 인쇄 메쉬 M11, M12, M13의 각 격자점에 배치되는 착색된 원 Dl1, D12, D13의 크기를 조절한다.
이 때, 일반적인 스캐너 판독 모델의 파라메터는,
·인쇄 메쉬 M11, M12, M13의 격자 간격 md
(단, 격자 간격 md는, 옐로우, 시안, 마젠타 공통 사이즈)
·옐로우 메쉬 Ml1의 수평선으로부터의 각도 θ11
·마젠타 메쉬 M12의 수평선으로부터의 각도 θ12
·시안 메쉬 M13의 수평선으로부터의 각도 θ13
·옐로우기 착색된 원 Dl1의 반경 r11
·마젠타가 착색된 원 D12의 반경 r12
·시안이 착색된 원 D13의 반경 r13
이지만, 본 실시예에서는, 이 모든 파라메터를 가변으로 하면 지나치게 번잡하므로, 어느 정도의 한정을 주고, 이하와 같이 설정하였다.
·옐로우 메쉬 Ml1의 수평선으로부터의 각도 θ11=15도
·마젠타 메쉬 M12의 수평선으로부터의 각도 θ12=30도
·시안 메쉬 M13의 수평선에서의 각도 θ13=45도
·격자 간격 md=20 도트
이 인쇄 모델을 사용하여, 시뮬레이션을 행하고, 옐로우, 마젠타, 시안이 착색된 원 Dll, D12, D13의 각각의 반경 rl1, r12, r13에 영향을 받는 평균 RGB치(Rm, Gm, Bm)를 구한다. 구체적으로는, 인쇄 메쉬 M11, M12, M13의 격자 간격 md보다도 꽤 큰 단위 면적을 생각하고,
Rm=255-단위 면적 중의 시안의 면적×255/단위 면적
Gm=255-단위 면적 중의 마젠타의 면적×255/단위 면적
Bm=255- 단위 면적 중의 옐로우의 면적×255/단위 면적
으로서 구한다.
다음에, 1개의 색(Rm, Gm, Bm)으로 균일하게 인쇄되어 있는 화상을 스캐너로 판독한 경우의 스캐너 판독 모델에 대해 생각한다. 이것은, 인쇄 메쉬 Ml1, M12, M13과 독립적인 간격 sd를 갖는 판독 메쉬 M14를 도입하여, 이 판독 메쉬 M14 내의 RGB의 각 휘도= 각색의 면적을 구하는 것에 상당한다.
여기서, 판독 메쉬 M14의 간격 sd가, 스캐너 판독 해상도에 상당한다. 또, 동일한 평균색 (Rm, Gm, Bm)의 화상을 판독하는 경우에서도, 스캐너 판독 해상도가 큰 경우에는, 인접 화소의 RGB 휘도치는 크게 다르고, 반대로 스캐너 판독 해상도가 작은 경우에는, 판독한 결과의 화소는 어떤 화소도 평균색 (Rm, Gm, Bm)에 근접하기 때문에, 인접 화소의 RGB 휘도차는 0에 근접하게 된다.
구체적인 1개의 판독 메쉬 M14 내의 RGB 휘도치 (Rc, Gc, Bc)는, 이하와 같이 된다.
Rc=255-판독 메쉬 면적 중의 시안의 면적×255
/ 판독 메쉬 면적
Gc=255-판독 메쉬 면적 중의 마젠타의 면적×255
/판독 메쉬 면적
Bc=255-판독 메쉬 면적 중의 옐로우의 면적×255
/ 판독 메쉬 면적
간격 sd를 바꾼 판독 메쉬 M14마다 RGB 휘도치(Rc, Gc, Bc)를 구해 놓고, 인접 화소와의 RGB 각각의 휘도차를 구하고, 그 중의 적당한 값(예를 들면, 최대치)을 색차 테이블에 기록한다.
이 때, 원래는, 인쇄 모델에서는, 인쇄 메쉬의 교점에 그려진 착색된 원은, RGB 서로 중첩되므로, RGB의 각 휘도치에 의해 서로 영향을 받아, RGB 독립이라고는 말할 수 없지만, 이 스캐너 판독 모델에서는, 단순화를 위해, RGB는 서로 독립한다고 하는 가설을 세웠다.
따라서, RGB 휘도치, 판독 해상도, 및 인접 화소의 휘도차의 결과가, RGB 독립의 테이블에 보존된다.
도 18은, R의 테이블이 예를 나타낸 도면이다.
도 18에 있어서, R 휘도치를 0∼255까지 변화시킨 경우에 대해, 스캐너 판독 해상도가 14∼35의 각각에 대해, 인접 화소와의 휘도차의 최대치를 구하고 있다. 여기서, R 휘도치는 3간격으로 기록하고 있지만, 이 간격의 사이의 값에 대해서는, 보간으로 구할 수 있다.
또, 도면의 예에서는, R의 테이블의 경우에 대해 도시하였지만, G, B의 테이블도 마찬가지이다.
이와 같이, 망점 인쇄법을 모방한 인쇄 모델을 구축함으로써, 망점 인쇄법으로 생성되는 색을 컴퓨터 상에서 재현하는 것이 가능해져서, 망점 인쇄법으로 실제로 인쇄된 인쇄물을 해석하지 않고, R, G, B의 테이블을 생성하는 것이 가능해진다.
R, G, B의 테이블이 제공되면, 이 R, G, B의 테이블을 참조함으로써, 입력 화상으로부터 동일색의 범위를 검출할 때의 임계치를 획득할 수 있다.
도 19는, 본 발명의 한 실시예에 따른 색차 테이블 생성 장치의 구성을 나타낸 블럭도이다.
도 19에 있어서, 참조 번호(111)는 컬러 화상 입력 장치, 참조 번호(112)는 외부 출력 장치, 참조 번호(113)는 메모리, 참조 번호(114)는 연산 장치(CPU)이다. 연산 장치(114)에는, 인쇄 모델 생성부(115) 및 색차 테이블 생성부(116)가 설치되고, 인쇄 모델 생성부(115)는, 도 17에 도시한 방법에 의해 인쇄 모델을 구축하고, 망점 인쇄법으로 생성되는 색을 컴퓨터 상에서 재현한다. 색차 테이블 생성부(116)는 망점 인쇄법을 모방한 인쇄 모델에 대해, 스캐너 판독 모델을 구축하고, 도 18에 도시한 바와 같은 색차 테이블을, R, G, B의 각 색에 대해 생성한다.
도 20은, 본 발명의 제7 실시예에 따른 패턴 추출 장치의 구성을 나타낸 블럭도이다.
도 20에 있어서, 참조 번호(131)는 컬러 화상 입력 장치, 참조 번호(132)는 외부 출력 장치, 참조 번호(133)는 메모리, 참조 번호(134)는 연산 장치(CPU)이다. 연산 장치(134)에는, 색차 테이블(135), 색 분해 화상 생성부(136) 및 문자 영역 추출부(137)가 설치되어 있다.
색차 테이블(135)은 예를 들면, 도 18에 나타내는 테이블이며, RGB의 각 색마다 휘도치, 판독 해상도 및 인접 화소의 휘도차가 저장되어 있다.
색 분해 화상 생성부(136)는 입력 화상의 판독 해상도 및 RGB 휘도치에 기초하여 색차 테이블(135)을 검색하고, 입력 화상의 판독 해상도 및 RGB 휘도치에 대응한 인접 화소의 휘도차를 취득한다. 그리고, 이 인접 화소의 휘도차를 그 인접 화소에 대해서 라벨링을 행할 때의 임계치로 한다. 또, 입력 화상의 판독 해상도 및 RGB 휘도치가 다르면, 인접 화소의 휘도차도 다르므로, 입력 화상의 라벨링을 행하고 있는 도중에, 입력 화상의 판독 해상도 및 RGB 휘도가 변화한 경우에는 색차 테이블(135)을 재차 검색하여 라벨링을 행할 때의 임계치를 갱신한다.
주목 화소의 색(R, G, B)을 키 정보로서, 색차 테이블(135)을 검색하고 RGB 각 색의 동일 색이라고 간주하는 인접 화소와의 RGB 각 휘도차의 임계치가 화소마다 구하면 그것을 주목 화소의 주위의 화소에 적응하고, R, G, B의 각 값과도 인접 화소와의 휘도차가 임계치 이내이면 주목 화소와 인접 화소에 동일 라벨을 부여하는 처리를 행한다.
이 라벨링 처리에서는 인접하는 화소만을 대상으로 하여, 더구나 화소의 색에 따른 임계치를 이용하여 라벨링을 행하므로, 국소적으로 정밀한 색 클러스터링이 가능하며, 라벨 화상에 구멍이 뚫리거나 윤곽이 부드럽지 못하거나 하는 것을 방지할 수 있다.
또한, 컬러 문서 화상으로부터 균일 색의 문자 영역을 고속, 고정밀도로 추출하는 것이 가능해진다.
또한, 배경과 물체의 색이 국소적으로 닮아 있어 화상 전체에서는 다른 장소에도 가까운 색이 있는 화상에 대해서는 국소적으로 정확하게 동일 색 영역을 추출하는 것이 가능해진다.
또한, 동일 색으로 간주 되는 영역에서도 화소의 색의 값이 주위의 색의 값보다도 다소 현격하게 차이가 나는 경우에서도 그 부분이 영역 내의 구멍이나 윤곽 부분이 울퉁불퉁함으로서 잘못 추출되는 것을 방지하고, 정밀도 좋게 추출하는 것이 가능해진다.
라벨 화상이 생성되면, 입력 화상의 패턴의 각 라벨마다 각 패턴에 대한 외접 구형을 생성한다. 그리고, 각 외접 구형 내의 영역의 색 정보 및 외접 구형의 기하학 정보에 기초하여 각 외접 구형의 그룹핑을 행한다.
문자 영역 추출부(137)는 색 분해 화상 생성부(136)에서 그룹핑된 외접 구형의 배치 상태나 크기 등을 고려하여, 원화상으로부터 구해진 라벨 화상 중에서부터 문자열 영역 추출을 행한다.
예를 들면, 컬러 문서로부터 큰 문자로 기재되어 있는 표제 이나 타이틀 등의 키워드가 되는 문자의 영역을 추출하는 경우, 외접 구형의 크기나 외접 구형이 열 정보를 사용함으로써 표제나 타이틀 등의 키워드가 되는 문자열 영역만을 추출한다.
도 21은 도 20의 패턴 추출 장치의 동작을 상세하게 나타내는 플로우차트이다.
도 21에서 우선, 화상 입력 처리를 행한다(스텝 S11). 이 화상 입력 처리에서는 CCD 카메라나 스캐너 등의 촬상 장치로 컬러 화상을 입력하고 메모리에 보존한다.
다음에, 모델 해상도 추정 처리를 행한다(스텝 S12). 이 모델 해상도 추정 처리에서는 컬러 인쇄의 므와레 무늬를 표현한 인쇄 모델 및 스캐너 판독 모델로부터 구한 색차 테이블에 등록되어 있는 평균 휘도 및 인접 화소의 휘도차의 최대치를 입력 화상으로부터 얻어지는 평균 휘도 및 인접 화소의 휘도차의 최대치와 비교하고, 입력 화상 전체를 통해서 가장 적합하는 스캐너 판독 해상도를 구한다.
도 22는 본 발명의 한 실시예에 따른 모델 해상도 추정 처리의 설명도이다.
도 22에서, 입력 화상(141)을 3×3 화소씩 메쉬(142)로 분할하고, 분할된 3×3 화소 a 내지 i의 평균 RGB 휘도(Rm, Gm, Bm)와 인접 화소의 휘도차의 최대치(Rd, Gd, Bd)를 입력 화상(141) 전체에 대해서 구한다. 여기서, 3×3 화소 a 내지 i의 인접 방향은 20 그대로 있으므로, 이들의 20대로 인접 화소의 휘도차를 구하고, 이들의 휘도차 중 최대치(Rd, Gd, Bd)를 채용한다.
그리고, 이 평균 RGB 휘도(Rm, Gm, Bm)와 인접 화소의 휘도차의 최대치(Rd, Gd, Bd)를 키 정보로서 색차 테이블을 검색하고, 색차 테이블에 등록되어 있는 평균 휘도 및 인접 화소의 휘도차의 최대치와 가장 적합한 스캐너 판독 해상도를 구한다. 그리고, 입력 화상(141)으로부터 구한 인접 화소의 휘도차의 최대치(Rd, Gd, Bd)와, 색차 테이블에 등록되어 있는 가장 적합한 스캐너 판독 해상도에서의 인접 화소의 휘도차의 최대치와의 차가 소정의 범위 내에 없는 경우, 그 3×3 화소 a 내지 i에 대해서 리젝트 부호(-1)를 되돌려 주고, 그 이외는 적합 부호(0)를 되돌려 주도록 한다.
이 처리를 입력 화상(141) 전체에 대해서 행함으로써, 메쉬(142)로 분할된 모든 3×3화소 a 내지 i에 대해서 리젝트 부호(-1) 또는 적합 부호(0)가 첨부된다. 리젝트 부호(-1) 또는 적합 부호(0)가 첨부된 3×3 화소 a 내지 i 중 적합 부호(0)가 첨부된 3×3화소 a 내지 i를 대상으로서, 이들에 대해서 구한 스캐너 판독 해상도를 평균하고, 이 평균치를 입력 화상(141) 전체의 스캐너 판독 해상도로 한다.
이하, RGB 독립의 처리이므로, R을 예로 들어 보다 구체적으로 설명한다.
우선, R 테이블의 해상도치를 어느 값으로 고정하여, R 테이블의 R 휘도치를 스캔해 가서, 평균 휘도치 Rm이 Ri≤Rm<Ri+1이 되는 R 휘도치 Ri를 R 테이블로부터 검색한다. 이 때, R 휘도치 Ri에 대한 인접 화소와의 휘도치의 최대치가 Rdi, R 휘도치 Ri+1에 대한 인접 화소와의 휘도치의 최대치가 Rdi+1이라고 하면, 평균 휘도치 Rm이 R 휘도치 Ri와 R 휘도치 Ri+1 간의 선형 보간으로 나타낸다고 해서, 그 관계를 인접 화소와의 휘도치의 최대치로도 적응하여, 추정되는 인접 화소와의 휘도치의 최대치 infered_delta를 구한다. 즉,
rl=Ri-Ri
rm=Rm-Ri
rn=Ri+1-Rm
infered_delta
=Rri*rn/rl+Rri+1*rm/r1
이다.
이 추정되는 인접 화소와의 휘도치의 최대치 infered_delta와 실제로 화상으로부터 구한 휘도치의 최대치 Rd와의 차 delta_r을,
delta_r=|Rd_infered_delta|
로서 구한다. 이와 마찬가지의 처리를 G, B에서도 행하고 delta_g, delta_b를 구한다. 그리고, 그 합 delta를,
delta=delta_r+delta_g+delta_b
로서 구한다.
해상도 파라메터를 스캔하여, 이 delta의 값이 가장 작아지는 해상도 resol과, 그 때의 delta의 값 delta_min을 구하고, 그 값 delta min_delta가
delta_min>TH_SUB(TH_SUB는 고정 임계치)
이면, 이 3×3 메쉬는 모델에 적응하지 않았다고 해서, 리젝트 부호(-1)를 되돌려 주고, 그 이외는 적합 부호(0)를 되돌려 주도록 한다. 그리고, 전 입력 화상 중의 3×3 메쉬 중에서 적합 부호가 붙은 메쉬만을 대상으로, 그 메쉬의 해상도 resol을 평균하고 이 값을 입력 화상의 해상도 resolution으로 한다.
resolution=(Σ 적합 부호의 메쉬의 resol)
/ 적합 부호의 메쉬의 수
또, 이 해상도라는 말은 입력 화상이 실제로 스캐너로 판독할 때의 해상도가 아니고, 이 화상을 미리 준비한 모델에 적합시켰을 때의 모델 상의 판독 해상도를 나타낸다.
다음에, 색 라벨링 처리를 행한다(스텝 S13). 이 색 라벨링 처리에서는 인접하는 화소의 색이 가까운 경우에 동일 라벨을 부여하고, 라벨 화상과 동일 라벨의 연결 영역의 외접 구형을 구한다. 외접 구형의 정보에는 외접 구형의 좌표치, 외접 구형 내의 연결 영역의 평균색(R, G, B), 외접 구형 내의 연결 영역의 라벨 번호, 연결 영역의 면적(화소수) 등을 저장한다.
구체적으로는, 입력 화상의 좌측 상으로부터 라스터 스캔을 행하고, 라벨 부여가 되어 있지 않은 화소에 주목한다. 이 화소의 RGB 휘도치와 추정 해상도 resolution을 이용하여 색차 테이블을 검색하고, 인접 화소와의 휘도치의 최대치를 RGB 각각에 대해 구한다. 인접 화소와의 휘도치의 최대치를 구하면, 이 인접 화소와의 휘도치의 최대치를 주목 화소에 라벨 부여할 때의 임계치로 한다.
이 라벨링 처리 시에, 1화소로부터 시작되어 점차로 확장해가는 동일 라벨 영역에 대해서 1화소 추가할 때마다, 라벨 영역 내의 평균색(R, G, B)을 구한다. 그리고, 이 라벨 영역과 동일한 라벨을 이 라벨 영역의 주위 화소에 붙이는지의 여부를 판단할 때에 새롭게 라벨 부여하는 주위 화소의 색이 이미 라벨 부여된 라벨 영역의 평균색과 임계치 이상으로 떨어져 있는 경우에는, 인접 화소 간에서의 색차가 임계치 이내에 있어도, 새롭게 라벨 부여하는 주위 화소에, 이미 라벨 부여된 라벨 영역과 다른 라벨을 부여하도록 한다. 이 처리에 의해, 문자 영역과 배경 영역의 경계의 점차적으로 색이 변화한 경우에도 정확하게 문자 영역을 추출하는 것이 가능해진다.
도 23은 본 발명의 한 실시예에 따른 색 라벨링 처리를 설명하는 도면이다.
도 23에서, 화소 e의 색이 흑으로, 이 화소 e로부터 멀어짐에 따라서, 색이 흑색에서부터 적색으로 서서히 변화하는 것으로 한다. 그리고, 화소 e와 화소 a 내지 d, f 내지 i는, 화소 e와 화소 a 내지 d, f 내지 i의 색차가 임계치 이내의 경우는 화소 e와 화소a 내지 d, f 내지 1에 대해 동일한 라벨이 부여된다.
다음에, 화소 j의 라벨 부여를 행하는 경우, 화소 f와 화소 j의 색차가 임계치 이내인지의 여부가 판단됨과 동시에, 화소 a 내지 i의 색의 평균치와 화소 j의 색의 차가 임계치 이내인지의 여부가 판단된다. 그리고, 화소 f와 화소 j의 색차가 임계치 이내라도 화소 a 내지 i의 색의 평균치와 화소 j의 색의 차가 임계치를 넘는 경우는 화소 j에는 화소 f와 다른 라벨이 부여된다.
여기서, 화소 e로부터 멀어짐에 따라서, 색이 서서히 변화하고 있는 경우에는, 화소 j의 색과 화소 f의 색은 닮아 있지만, 화소 j의 색과 화소 e의 색의 차이는 현저해져 왔다. 이 때문에, 이미 라벨이 붙어 있는 화소 a 내지 i의 색의 평균치를 화소 j의 색과 비교하면, 화소 a 내지 i의 색의 평균치에는 화소 e의 색의 영향이 반영되기 때문에, 화소 f와 화소 j의 색차에 비교한 경우에 대해서 색에 차가 커진다.
이 결과, 색이 서서히 변화하고 있는 경우에서도, 화소 f와 화소 j 간에서 경계를 구획짓는 것이 가능하며, 흑색 영역과 적색 영역에 동일한 라벨이 부여되는 것을 방지할 수 있다.
이하, 구체적인 구하는 방법을 휘도치 R을 예로 들어 설명한다.
R 테이블의 해상도치를 추정 해상도에 고정하여, R 테이블의 R 휘도치를 스캔해가며 주목 화소의 휘도치 R이 R1≤R<Ri+1이 되는 R 휘도치 Ri를 R 테이블로부터 검색한다. 이 때, R 휘도치 Ri에 대한 인접 화소와의 휘도치의 최대치를 Rdi, R 휘도치 Ri+1에 대한 인접 화소와의 휘도치의 최대치를 Rdi+1로 하면, 주목 화소의 휘도치 R이 R 테이블의 R 휘도치 Ri와 R 테이블의 R 휘도치 Ri+1 간의 선형 보간으로 나타냄으로서, 그 관계를 인접 화소와의 휘도치의 최대치에도 적응하여 추정되는 인접 화소와의 휘도치의 최대치 delta_r을 구한다. 즉,
rl=Ri-Ri+1
rm=R-Ri
rn=Ri+1-R
delta_r=Rri*rn/rl+Rri+1*rm/rl
로서 구한다. G, B에 대해서도 마찬가지이다.
이와 같이 해서, 미처리의 주목 화소의 (R, G, B)값으로부터 인접 화소와의 휘도차의 최대치(delta_r, delta_g, delta_b)를 구하고, 이 인접 화소와의 휘도차의 최대치(delta_r, delta_g, delta_b)를 라벨링 시의 임계치로 한다.
다음에, 이 미처리의 주목 화소의 주위 8화소를 주사하여 주목 화소의 주위에 이미 라벨 부여된 화소가 있으며, 그 이미 라벨 부여된 화소의 RGB 휘도치(Rs, Gs, Bs)가,
|R-Rs|<=delta_r
또는
|G-Gs|<=delta_g
또는
|B-Bs|<=delta_b
의 경우에, 주목 화소는 그 주위 화소와 가까운 색이므로, 주위 화소의 라벨을 전류 라벨 region으로서 보존하고, 주목 화소의 라벨로서 전류 라벨 region을 부여한다. 또한, 동시에, 전류 라벨 region이 부여되어 있는 영역의 평균색(Rm, Gm, Bm)으로서 주위의 라벨의 평균색에 주목 화소의 색을 가미한 새로운 평균색을 구한다.
그 이외의 경우는 전류 라벨로서, 지금까지 부여된 라벨치+1의 라벨치를 설정하고, 주목 화소의 라벨에도 그 라벨치를 부여한다. 이 경우에도, 영역의 평균색(Rm, Gm, Bm)으로서 주목 화소의 RGB치를 설정한다.
어느쪽의 경우에도, 주목 화소의 좌표치를 처리 대상 좌표 배열에 보존한다.
다음에, 주목 화소의 주위에 동일 색 영역을 확장하는 처리를 행한다. 이 처리에서는 처리 대상 좌표 배열 중으로부터 선두의 좌표치를 추출하고, 그 좌표의 화소를 주목 화소로 한다. 주목 화소의 RGB 휘도치로부터 RGB 각 색의 인접 화소의 휘도치의 차의 추정 임계치(delta_r, delta_g, delta_b)를 구한다.
또한, 지금까지의 이 영역의 평균색의 (Rm, Gm, Bm)값과 추정 해상도로부터 평균색의 각 RGB의 휘도차 임계치(delta_rm, elta_gm, elta_bm)를 구한다.
다음에, 도 10의 (a)에 도시한 바와 같이 주목 화소의 주위 8화소를 주사하여, 주목 화소의 주위의 각 화소의 (Ri, Gi, Bi)치 (i=1 내지 8)을 구하고 주목 화소의 (Rc, Gc, Bc)값이나 평균색의 (Rm, Gm, Bm)치와의 RGB 각 색의 휘도차를 구하고 그것이,
|Ri-Rc|<=delta_r
또는
|Gi-Gc|<=delta_g
또는
|Bi-Bc|<=delta_b
|Ri-Rm|<=delta_rm
또는
|Gi-Gm|<=delta_gm
또는
|Bi-Bm|<=delta_bm
의 경우에, 주목 화소와 동일 라벨을 부여하고, 주위 화소의 좌표를 처리 대상좌표 배열에 추가한다. 지금 처리한 주목 화소는 처리 대상 좌표 배열로부터 삭제한다.
다음에, 처리 좌표의 x, y의 최대치, 최소치를 구하고 그것을 이 라벨 영역의 외접 구형으로서 보존한다. 또한, 이 라벨 영역의 평균색을 외접 구형의 속성으로서 보존한다.
이 처리를 처리 대상 배열의 내용이 없어지기까지 계속한다.
라벨링의 결과, 라벨 화상(동일 영역은 동일한 라벨치가 부여되어 있는 화상)과 동일한 라벨을 갖는 영역을 둘러싸는 외접 구형이 획득된다.
또한, 라벨링 처리의 출력 정보로서 이하의 데이타가 출력된다.
·라벨 화상 : 4바이트/1화소
·외접 구형
구형수 : maxcount
구형 정보 : lbtbl
내포하는 라벨 화상의 라벨 번호 : label
구형 좌측 상 좌표: (xmin, ymin)
구형 우측 하 좌표: (xmax, ymax)
구형 내의 대표색: (r, g, b)
소속하는 그룹 번호: string_label
윤곽 길이: contour
다음에, 주목 구형 추출 처리를 행한다(스텝 S14). 이 주목 구형 추출 처리에서는 모든 색의 외접 구형을 대상으로 하여, 어느 사전에 결정한 범위에 들어 가는 사이즈의 외접 구형을 주목 구형으로서 추출한다.
구체적으로는 x 방향 길이가 23dot(100dpi 시간) 이상, 화상의 폭의 1/2 이하, 또한 y 방향 길이가 23dot(l00dpi 시) 이상, 화상의 높이의 1/2 이하의 외접 구형을 주목 구형으로서 추출한다.
이 주목 구형 추출 처리에 의해, 외접 구형끼리를 그룹핑할 때의 기준으로 하는 외접 구형의 크기를 한정하는 것이 가능하며, 예를 들면 타이틀 영역을 추출하는 경우에, 타이틀이 되는 문자의 크기에 적합한 외접 구형을 기준으로서 외접 구형끼리를 그룹핑하는 것이 가능해지며, 노이즈나 배경 등의 타이틀에는 포함되지 않은 외접 구형이 기준이 되며, 그룹핑 처리가 행해지는 것을 방지하는 것이 가능해지기 때문에, 불필요한 처리를 생략하여 처리 속도를 향상시키는 것이 가능해진다.
다음에, 주목 구형의 주위의 탐색 범위와 거기에 관한 구형 추출을 행한다(스텝 S15). 이 탐색 범위에 관한 구형 추출 처리에서는 주목 구형의 주위에 어느 사이즈의 탐색 범위를 설정하고 그 범위에 관한 구형을 추출한다.
도 24는 본 발명의 한 실시예에 따른 주목 구형의 주위의 탐색 범위의 설정 방법의 설명도이다.
도 24에서, 구형 번호(1 내지 30)의 외접 구형이 추출되며, 구형 번호(1)의 외접 구형(151)을 주목 구형으로 한 것으로 한다. 그리고, 이 외접 구형(151)의 주위에 탐색 범위(152)가 설정된 것으로 하면, 외접 구형(151)에 대한 그룹핑의 처리 대상으로서, 탐색 범위(152)에 관한 구형 번호(2 내지 24)의 외접 구형만을 선택하고, 탐색 범위(152)에 상관없는 구형 번호(25 내지 30)의 외접 구형에 대해서는 외접 구형(151)의 그룹핑의 처리 대상으로 하지 않는다.
이와 같이, 외접 구형끼리를 그룹핑할 때에 외접 구형의 탐색 범위를 주목 구형의 주위에 한정함으로써, 소정의 범위 내에 통합하여 존재하고 있는 문자열만을 추출하는 것이 가능하며, 예를 들면 타이틀 영역을 추출하는 경우에, 타이틀에 포함되지 않도록 떨어진 위치에 존재하는 문자를 고려할 필요가 없어지기 때문에, 타이틀 영역의 추출을 효율적으로 행하는 것이 가능해진다.
구체적으로는, 탐색 범위(152)는 주목 구형(151)의 종횡의 길이 중 긴 쪽을 len으로서, len과 100dpi에서 35dot가 작은 쪽을 주목 구형의 주위의 탐색 범위 길이range_size로서 구한다.
주목 구형의 주위 range_size의 범위에 관한 외접 구형을 고속으로 구하기 위해서 이하의 방법을 이용한다.
도 25는 본 발명의 한 실시예에 따른 주목 구형의 주위의 탐색 범위에 관한 구형의 추출 방법의 설명도이다.
도 25에서, 구형 번호(1 내지 4)의 외접 구형(161 내지 164)이 추출된 것으로 하면, XY의 각 좌표치에 존재하는 구형 번호 및 구형수를 구하고, 이들의 구형 번호 및 구형수를 XY의 각 좌표치마다 등록한다.
예를 들면, X 좌표치(1 내지 4)의 위치에는 외접 구형(161 내지 164)이 존재하지 않으므로, 구형수 n=0, 구형 번호=공백이 등록되며, X 좌표치(5 내지 13)의 위치에는 구형 번호(4)의 외접 구형(164)이 존재하고 있으므로, 구형수 n=1, 구형 번호=4가 등록되며, X 좌표치(14)의 위치에는 구형 번호(3)의 외접 구형(163) 및 구형 번호(4)의 외접 구형(164)이 존재하고 있으므로, 구형수 n=2, 구형 번호=3, 4가 등록되며, X 좌표치(15, 16)의 위치에는 구형 번호(4)의 외접 구형(164)이 존재하고 있으므로, 구형수 n=1, 구형 번호=4가 등록된다. 이하, 동일하다.
다음에, 구형 번호(3)의 외접 구형(163)을 주목 구형으로 하고, 이 외접 구형(163)의 주위에 탐색 범위(165)가 설정된 것으로 하면, 이 탐색 범위(165)에 포함되는 XY의 각 좌표치를 구한다. 그리고, XY의 각 좌표치의 구형 번호를 XY 각각에 대해서 구하고, XY의 양쪽에 포함되는 구형 번호를 탐색 범위(165)에 관한 외접 구형으로 한다. 예를 들면, 탐색 범위(165)의 X 좌표에 포함되는 외접 구형의 구형 번호는 2 내지 4, 탐색 범위(165)의 Y 좌표에 포함되는 외접 구형의 구형 번호는 1 내지 4이므로, XY의 양쪽에 포함되는 구형 번호는 2 내지 4가 된다. 이 결과, 탐색 범위(165)에 관한 외접 구형으로서, 구형 번호(2 내지 4)에 대응하는 외접 구형(162 내지 164)이 얻어진다.
구체적으로는, 이하의 a) 내지 d)의 처리를 행한다.
a) 화상 전체의 X, Y축으로 구형 번호를 투영한다.
화상 전체의 X, Y축의 1화소마다 그에 속하는 구형수와 구형 번호의 집합을 등록한다. 예를 들면, 구형 번호 i가 X축의 (x1, x2)의 범위에 있다고 한다면, X축의 x1 내지 x2의 좌표에는 번호 i가 구형 번호의 집합에 들어가게 된다. 동일한 것을 전 구형에 대해서 종횡 좌표에 대해서 행한다.
b) 주목 구형의 주위에 range_size의 범위를 설정한다.
c) range_size의 범위의 X축의 좌표마다의 구형 종류를 논리 OR하여 구형 번호의 집합을 추출한다.
마찬가지로 Y축이라도 추출한다.
d) X축으로부터 구한 구형 번호의 집합과, Y축으로부터 구한 구형 번호의 집합을 논리 AND하고, 이 주목 구형의 주위에 있는 구형 집합을 결정한다.
또, 도 25의 구형 번호의 저장 방법으로는 화상 전체에 존재하는 모든 구형 번호를 저장하는 용량이 각 좌표치마다 필요하며 기억 용량이 커진다.
그래서, 상술한 좌표마다의 구형수 및 구형 번호를 고속으로 또는 필요 메모리를 최소로 구하기 때문에, 이하와 같은 방식을 취한다.
도 26은 본 발명의 한 실시예에 따른 주목 구형의 주위의 탐색 범위에 관한 구형 정보의 저장 방법의 설명도.
도 26의 (a)에서, 구형 번호(1, 2)의 외접 구형(171, 172)이 추출된 것으로 하고, 외접 구형(171)은 X 좌표가 155 내지 165의 범위 내에 있으며, 외접 구형(172)은 X 좌표가 160 내지 163의 범위 내에 있는 것으로 한다. 이 때문에, 도 26의 (b)에 도시한 바와 같이, 외접 구형(171)에 대해서는 X 좌표가 155 내지 165의 위치에 구형 번호(1)가 등록되며, 외접 구형(172)에 대해서는 X 좌표가 160 내지 163의 위치에 구형 번호(2)가 등록된다.
다음에, 도 26의 (c)에 도시한 바와 같이, 추출된 구형 번호(1, 2)를 X 좌표(155 내지 165)의 순서로 구형 번호(1, 2) 순으로 재배열하고, X 좌표치가 동일한 값을 나타내는 구형 번호가 몇개 있는지를 셈으로써 각 좌표치의 구형수를 구할 수 있다.
구체적으로는 이하의 i) 내지 v)의 처리를 행한다.
i) 모든 구형의 옆폭을 합계하여, 그 길이의 수만큼 구형 번호, 좌표의 정보를 갖는 데이타 구조를 준비한다.
ii) 구형의 좌표와 구형 번호를 준비된 데이타 구조의 데이타에 셋트한다.
iii) 이 데이타 구조의 데이타를 좌표치로 소트한다.
iv) 데이타의 좌표치를 순서대로 보아가며, 좌표치가 같은 것의 수를 좌표치마다 세어서, 그것을 그 좌표에 속하는 구형수로 한다. 또한, 그 좌표마다의 구형수분만큼 구형 번호를 넣는 기록 영역을 확보한다. 소트한 데이타 구조를 선두로부터 스캔해가며, 좌표가 동일한 동안은 수를 카운트해가며, 좌표치가 변한 곳에서 수를 확정하여 그것을 보존한다.
v) 소트한 데이타 구조로 좌표치가 동일한 물건의 구형 번호를 위에서 확보한 영역에 저장한다. 이것도 소트한 데이타 구조를 선두로부터 스캔해가며, 좌표가 동일한 동안에는 구형 번호를 저장 영역에 셋트한다.
다음에, 동일 색 그룹 추출 처리를 행한다(스텝 S16). 이 동일 색 그룹 추출로는 1개의 주목 구형에 주목하여, 그 주목 구형 내의 패턴의 평균색으로부터 라벨링 시와 마찬가지로 RGB 각 색의 휘도차 임계치를 구한다. 주목 구형의 탐색 범위에 관한 외접 구형 중에서 주목 구형과의 RGB 휘도차가 임계치 이내의 것을 동일 그룹으로서 추출하고 그룹 정보 영역으로 저장한다. 또한, 새롭게 그룹에 추가된 외접 구형을 기준으로 해서 마찬가지의 처리를 행하고, 그룹에 추가 구형이 없어지기까지 반복 처리한다.
구체적으로는, 1개의 주목 구형의 값(Rc, Gc, Bc)과 그 주위 구형의 집합 중의 1개의 외접 구형i의 값(Ri, Gi, Bi)의 RGB 공간 상의 거리를 이하와 같이 정의한다.
dist=|Rc-Ri|+|Gc-Gi|+|Bc-Bi|
또한, 주목 구형의 값(Rc, Gc, Bc)과 해상도 resolution으로부터 구해진 RGB의 각 휘도차를 delta_r, delta_g, delta_b로 한다. 주목 구형의 값(Rc, Gc, Bc)과 그 주위의 외접 구형의 집합 중 1개의 외접 구형(i)의 값(Ri, Gi, Bi)이 이하의 조건을 만족할 때, 주목 구형의 주위의 외접 구형은 주목 구형의 그룹에 속한다고 판정하여 주위의 외접 구형(i)을 주목 구형의 그룹에 저장한다.
dist<TH_RGB(TH_RGB=20)
또는
(|Rc-Ri|<delta_r
또는
|Gc-Gi|<delta_g
또는
|Bc-Bi|<delta_b)
또한, 동시에 이 새롭게 그룹에 더해진 구형 번호를 신규 추가 구형 영역에 저장해 둔다.
다음에, 신규 추가 구형 영역의 선두의 구형 번호를 추출하고, 그것을 새로운 주목 구형으로서, 그 주위에 있는 외접 구형을 구하고 위의 순서를 반복하여, 그룹에 속하는 외접 구형을 구한다. 이 순서를 그룹에 새롭게 더해지는 구형이 없어지기까지 반복한다.
이상의 처리에 의해, 이하의 추출하는 그룹 정보의 데이타 구조가 얻어진다.
그룹 내의 구형수 : num
그룹을 구성하는 구형 번호 : child
중복 구형 통합 후의 구형수 : over Lap_num
중복 구형 통합 후의 구형 정보 : overlap
(데이타 타입은 구형 정보 lbtbl형)
그룹 내 문자열의 방향 코드 : orient
그룹 내의 문자열수 : gyou_num
문자열의 구형 정보 : gyou
다음에, 그룹 내 평균 문자선 굵기 추출 처리를 행한다(스텝 S17). 이 그룹 내 평균 문자선 굵기 추출 처리에서는 그룹 내의 외접 구형에 대응하는 라벨 화상의 패턴에 대해서, 윤곽 추적 처리를 행하고 윤곽 길이를 구한다. 즉, 그룹에 속하는 1개의 외접 구형의 구형 범위 내에서, 그 외접 구형의 라벨 번호에 주목하여 라벨 화상 상에서 윤곽 추적 처리를 행한다. 추출한 윤곽의 길이를 그 구형의 윤곽 길이의 속성에 셋트한다. 그리고, 그 패턴의 면적을 윤곽 길이로 나누어, 문자의 선이 평균적인 굵기를 구하고, 그 값을 구형의 속성으로서 구형 정보에 등록한다.
도 27은 본 발명의 한 실시예에 따른 문자선의 굵기의 산출 방법의 설명도이다.
도 27의 (a)에서, 예를 들면 「フ」라는 패턴이 추출된 것으로 하면, 「フ」라는 패턴에 포함되는 화소수를 셈으로써 「フ」라는 패턴의 면적 S를 산출한다.
다음에, 도 27의 (b)에 도시한 바와 같이 「フ」라는 패턴의 윤곽을 추출하고, 이 윤곽 길이 L을 산출한다. 그리고, 「フ」라는 패턴의 면적 S를 윤곽 길이 L로 나누어서 「フ」라는 패턴이 평균적인 굵기 W를 구한다.
다음에, 문자선 굵기에 의한 재그룹화 처리를 행한다(스텝 S18). 이 재그룹화 처리에서는 그룹 내의 외접 구형을 대상으로 외접 구형의 평균 문자선 굵기를 이용하여 그룹화를 행하고, 새로운 그룹 정보를 구축한다. 즉, 그룹 내의 외접 구형을 대상으로 해서, 도 21의 스텝 S14 내지 S16의 처리를 반복한다. 여기에서 스텝 S16의 그룹화 시에, 스텝 S15에서 사용한 색 정보뿐만아니라, 추정 문자선 굵기(= 구형 내의 패턴 면적/ 패턴의 윤곽 길이)도 사용한다.
도 28은 본 발명의 한 실시예에 따른 문자선의 굵기에 의한 재그룹핑 처리의 설명도이다.
도 28에서, 「그룹 1」이라는 문자열과 「그룹 2」라는 문자열이 동일 색으로 기술되며 서로 근접하여 배치되어 있기 때문에, 「그룹 1」이라는 문자열과 「그룹 2」라는 문자열이 동일한 그룹(181)에 그룹핑된 것으로 한다.
여기서, 「그룹 1」이라는 문자열에 포함되는 문자의 굵기 「그룹 2」라는 문자열에 포함되는 문자의 굵기를 산출하고, 다른 굵기의 문자를 별도의 그룹으로 분할한다. 이 결과, 「그룹 1」이라는 문자열은 그룹(182)에 그룹핑되며, 「그룹 2」라는 문자열은 그룹(183)에 그룹핑된다.
이 처리에 의해, 원래의 그룹에서 배경 등의 문자 패턴과 동일 색인 것이 있으며, 배경과 문자 패턴이 동일한 그룹에 속해 있던 것을 별도의 그룹으로 하거나 문자 패턴만의 그룹에서도 폰트나 사이즈가 다른 것을 별도의 그룹으로 하거나 할 수 있다.
구체적으로는 2개의 외접 구형 중 제1 외접 구형의 추정 문자선 굵기 thick1 및 제2 외접 구형의 추정 문자선 굵기 thick2로부터 문자선 굵기의 비 thick_rate를 이하와 같이 구한다.
thick_rate=max(thick1, thick2)
/min(thick1, thick2)
그리고, 도 21의 스텝 S15와 동일하게, 이하의 조건을 만족할 때에 2개의 외접 구형을 동일한 그룹으로서 기록한다.
thick_rate < TH_THICK_RATE
또는
(dist<TH_RGB
또는
(|Rc-Ri|<delta_r
또는
|Gc-Gi|<delta_g
또는
|Bc-Bi|<delta_b))
다만, TH_THICK_RATE는 2.5로 설정하고 있다.
이 처리를 원래의 그룹 내 모든 외접 구형에 대해 행하고, 그룹 내의 새로운 그룹핑을 행한다.
문자선 굵기를 구하는 경우, 패턴의 윤곽을 구할 필요가 있지만, 윤곽 추적을 고속화하기 위해서 이하의 처리를 행한다.
도 29는 본 발명의 한 실시예에 따른 윤곽 추적에서의 화소의 탐색 개시점의 설정 방법의 설명도이다.
도 29의 (a)에서 화소a 내지 i에서 구성되는 패턴의 윤곽을 구하는 것으로 하면, 라벨 화상의 좌측 상으로부터 래스터 스캔을 행함으로써, 화소 a가 발견된다. 화소 a가 발견되면, 화소 a에 인접하는 8개의 화소 중 화소 a의 직전에 탐색된 화소의 다음 화소 a'를 탐색 개시점으로서, 화소 a에 인접하는 화소를 시계 방향으로 탐색한다. 그리고, 화소 e가 발견되면, 도 29의 (b)에 도시한 바와 같이, 화소 e에 인접하는 8개의 화소 중, 화소 e의 직전에 윤곽으로서 탐색된 화소 a의 다음의 화소 e'를 탐색 개시점으로서 화소 e에 인접하는 화소를 시계 방향으로 탐색한다. 그리고, 화소 i가 발견되면, 도 29의 (c)에 도시한 바와 같이, 화소 i에 인접하는 8개의 화소 중, 화소 i의 직전에 윤곽으로서 탐색된 화소 e의 다음의 화소 1'를 탐색 개시점으로서, 화소 i에 인접하는 화소를 시계 방향으로 탐색한다. 이하, 마찬가지로 해서, 도 29의 (d)에 도시한 바와 같이, 화소 a→화소 e→화소 i→화소 g→화소 g→화소 f→화소 b→화소 c가 화소a 내지 i에서 구성되는 패턴의 윤곽으로서 추출된다.
구체적으로는 이하의 a) 내지 f)의 처리가 행해진다.
a) 구형 사이즈의 처리 완료 플래그를 준비하고, 초기치로서 전부 미처리 플래그로서 0를 셋트한다
b) 구형 범위 내를 처리 완료 플래그와 라벨 화상으로 동시에 좌측 상부로부터 래스트 스캔하여, 화소가 처리 완료 플래그가 0으로 또는 라벨 번호가 전류 구형의 라벨 번호인 화소 i를 찾는다. 윤곽 길이를 0으로 설정한다.
c) 화소 i로부터 주위의 8화소를 도 30의 0으로부터 순서대로 시계 방향으로 탐색하고, 화소가 처리 완료 플래그가 0이며 또는 라벨 번호가 전류 구형의 라벨 번호인 화소가 있는 경우에는 그 화소의 방향 코드 DC를 추출한다.
도 30은 본 발명의 한 실시예에 따른 전류 화소로부터 본 방향 코드를 나타내는 도면이다.
도 30에서 C는 전류 화소, 0 내지 7은 전류 화소로부터 본 주위 화소로 C로부터 본 방향 코드 DC이다. 화소 i로부터 주위의 8화소를 탐색하는 경우, 이 순서로 탐색한다
d) 윤곽을 구성하는 다음 화소로서, 전류 화소 C로부터 검출한 방향 코드 DC의 화소로 이동한다. 이 때, 윤곽 길이로서 이미 계산한 윤곽 길이를 1개만 인크리멘트한다. 그리고, 이동처의 화소를 새로운전류 화소 C'로서 다시 그 주위의 8화소에 대해서, 처리 완료 플래그가 0이며 또한 라벨 번호가 전류 구형의 라벨 번호인 화소를 찾는다. 이 때, 새로운 전류 화소 C'의 주위의 8화소를 탐색하는 개시 방향 코드는 전회의 방향 코드(DC+5)를 8로 이고 나눈 나머지의 DC'로부터 개시하여 시계 방향으로 탐색한다.
이에 따라, 전 화소의 윤곽 추적 처리로 이미 탐색 완료의 화소를 이중에 탐색하는 것을 피하고 고속인 윤곽 추적 처리가 가능해진다.
e) 화소 이동에 의한 윤곽 추적 처리를 최초로 발견한 개시 좌표가 되기까지 계속하고, 이 때의 윤곽 길이를 이 구형 내에 있는 라벨치의 패턴의 1개의 윤곽의 윤곽 길이로서 추출한다.
f) c) 내지 f)의 처리를 동일한 패턴의 다른 윤곽에도 행하고, 모든 윤곽 길이를 서로 더해서 최종적으로 이 패턴의 윤곽 길이로 추출한다.
다음에, 그룹 내의 큰 구형 삭제 처리를 행한다(스텝 S19). 이 그룹 내의 큰 구형 삭제 처리에서는 노이즈 제거를 위해 그룹 내에서 평균적인 구형 사이즈를 구하고, 그것을 기준으로 극단적으로 큰 사이즈의 구형을 삭제한다.
도 31은 본 발명의 한 실시예에 따른 그룹 내의 큰 구형 삭제 처리를 설명하는 도면이다.
도 31의 (a)에서, 외접 구형(192 내지 201)이 그룹(191)에 그룹핑되어 있는 것으로 하면, 그룹(191) 내의 외접 구형(192 내지 201)의 크기를 구한다. 그리고, 외접 구형(192)의 크기가 외접 구형(193 내지 201)의 크기에 비교하여 현격하게 차이나는 것으로 하면, 도 31의 (b)에 도시한 바와 같이 그룹(191)으로부터 외접 구형(192)을 삭제하고 외접 구형(193 내지 201)으로 이루어지는 그룹(202)을 생성한다.
구체적으로는 이하의 a) 내지 d)의 처리를 행한다.
a) 그룹 내의 외접 구형의 높이의 막대 그래프를 작성하여, 최대 빈도치를 나타내는 구형 높이 freq_height를 이하의 방법으로 구한다.
i) 막대 그래프에 바림용 윈도우를 이용하여 컨볼루션 연산(이동합)을 행하고 막대 그래프를 바림한다. 구체적인 바림용 윈도우는 예를 들면 「11111」 5화소로 이루어진다.
ii) 최소 높이치(구체적으로는 100dpi에서 23dot)를 미리 결정해두고, 그 이상으로 최대 빈도를 나타내는 구형 높이 freq_height를 구한다.
도 32는 본 발명의 한 실시예에 따른 최대 빈도치를 나타내는 구형 높이의 산출 방법의 설명도이다.
도 32의 (a)에서, 도 31의 외접 구형(192 내지 201)의 높이의 빈도를 구하면 바림용 윈도우(205)를 이용하여 도 32의 (b)에 도시한 바와 같이, 도 32의 (a)에서 구하고 있는 구형 높이의 빈도의 이동합을 산출한다. 구형 높이의 빈도의 이동합을 구하면, 외접 구형(192 내지 201)의 높이 중, 최대 빈도를 나타내는 구형 높이 freq_height를 구한다.
b) 최대 빈도치를 나타내는 구형 높이 freq_height가 최소 높이치(구체적으로는, 100dpi에서 23dot)보다 작을 때는, 최소 높이치를 최대 빈도치를 나타내는 구형 높이 freq_height로 한다.
c) 큰 구형이라고 판정하는 임계치 th_large를 th_large=freq_height*10으로 한다.
d) 그룹 내의 외접 구형으로 종횡 사이즈와도 th_large보다 작은 것만을 남기고 후는 노이즈로서 그 그룹으로부터 삭제한다.
다음에, 그룹 내의 중복 구형 통합 처리를 행한다(스텝 S20). 이 그룹 내의 중복 구형 통합 처리에서는 그룹 내에 있는 외접 구형 내에서 중복이 있는 외접 구형에 대해서, 이들의 외접 구형을 둘러싸는 구형을 새롭게 만들고 그룹 정보에 새롭게 등록한다.
즉, 그룹 내의 외접 구형 중, 일부에서도 중복이 있는 외접 구형끼리를 통합하여 이들을 둘러싸는 외접 구형으로 한다.
도 33은 본 발명의 한 실시예에 따른 그룹 내의 중복 구형 통합 처리의 설명도이다.
도 33의 (a)에서, 외접 구형(211)은 외접 구형(212)과 중복되어 있으며, 외접 구형(212)은 외접 구형(213)과 부분적으로 중복되어 있다. 이 경우, 외접 구형(211 내지 213)을 통합하고 외접 구형(211 내지 214)을 생성한다.
이 처리에 의해, 예를 들면, 「畵」나 「關」 등과 같이, 1개의 문자가 서로 분리한 복수의 패턴으로 이루어지는 경우에 이들의 복수의 패턴을 일체적으로 취급할 수 있으며 그 후의 처리를 효율적으로 행하는 것이 가능해진다.
다음에, 그룹 내 문자열 추출 처리를 행한다(스텝 S21). 이 그룹 내의 문자열 추출 처리에서는 그룹 내에서 문자열 방향을 추정하고, 그 방향에 대해 문자열을 추출한다. 추출한 문자열의 방향, 좌표 등의 정보는 그룹마다 보존한다.
도 34는 본 발명의 한 실시예에 따른 그룹 내 문자열 추출 처리의 설명도이다.
도 34의 (a)에서, 구형 번호(1 내지 29)의 외접 구형이 그룹(221)으로 그룹핑되어 있는 것으로 하면, 가장 좌측으로 있는 구형 번호(1)의 외접 구형으로부터, 우측 방향으로 구형 번호(1)의 외접 구형과 인접하는 외접 구형이 있는지의 여부를 찾는다. 그리고, 구형 번호(1)의 외접 구형과 인접하는 외접 구형으로서, 구형 번호(2)의 외접 구형이 발견되면, 발견된 외접 구형에 구형 번호(1)을 지정하고, 발견된 외접 구형의 구형 번호(2)를 구형 번호(1)로 변경한다. 마찬가지로 해서, 우측 방향으로 인접하는 외접 구형이 있는지의 여부를 찾고 인접하는 외접 구형이 발견되면, 주로 인접하는 외접 구형의 구형 번호를 우측의 외접 구형으로 지정한다.
구형 번호(1)의 외접 구형으로부터 우측 방향으로 인접하는 외접 구형이 없어지면, 구형 번호(15)의 외접 구형으로부터, 우측 방향으로 구형 번호(15)의 외접 구형과 인접하는 외접 구형이 있는지의 여부를 찾는다. 구형 번호(15)의 외접 구형과 인접하는 외접 구형이 발견되면, 발견된 외접 구형에 구형 번호(15)를 지정한다.
이상의 처리에 의해, 도 34의 (b)에 도시한 바와 같이, 구형 번호(1)의 외접 구형에 우측 방향으로 인접하는 외접 구형에 구형 번호(1)가 첨부되며, 구형 번호(15)의 외접 구형에 우측 방향으로 인접하는 외접 구형에 구형 번호(15)가 첨부된다. 구형 번호의 지정 처리가 종료하면, 동일한 구형 번호(1)가 첨부된 외접 구형을 둘러싸는 외접 구형(222)을 생성하고, 동일한 구형 번호(15)가 첨부된 외접 구형을 둘러싸는 외접 구형(223)을 생성한다.
구체적으로는 이하의 a) 내지 e)의 처리를 행한다.
a) 그룹 내의 외접 구형의 좌표로부터 문자열 방향을 추정한다.
b) 외접 구형의 상하 좌우의 가장 가까이에 있는 구형의 내향과, 외향의 양 방향의 인접 관계를 구한다.
c) 가로 방향의 문자열의 경우, 좌측으로부터의 인접 관계가 없는 구형을 개시 구형으로서, 우측으로 구형이 없어질 때까지 개시 구형 번호를 우측에 있는 구형으로 전파해간다. 세로 방향도 마찬가지이다.
d) 좌측으로부터의 인접 관계가 없이, 좌측으로의 인접 관계가 있는 구형은 좌측의 구형 번호를 획득하여, 그것을 우측으로 전파하고, 인접 관계가 없어지기까지 반복한다.
e) 여기까지의 처리를 그룹 내 모든 구형에 대해서 행한 후에, 동일한 구형 번호가 붙어 있는 구형을 구하고, 동일한 구형 번호가 붙어 있는 구형의 외접 구형을 문자열 구형으로서 추출한다.
다음에, 문자열 내 분리 문자 통합 처리를 행한다(스텝 S22). 이 문자열 내 분리 문자 통합 처리에서는 횡서의 상하 분리 문자 통합 처리(종서로는, 좌우 분리 문자 통합 처리)를 문자열 구형에 적응하여 분리 구형을 통합한 외접 구형로 대체한다. 여기서는, 추출된 문자열 내의 구형에 대해서 문자열 방향과 직각의 방향으로 구형 통합을 행한다. 이것은 횡서의 문자열이면, 예를 들면 「こ」라는 문자의 상부 스트로크와 하부 스트로크를 각각 둘러싸는 구형을 통합하여 1개의 구형으로 하는 처리이다.
도 35는 본 발명의 한 실시예에 따른 문자열 내 분리 문자 통합 처리의 설명도이다.
도 35의 (a)에서 그룹(221) 내에서 서로 가로 방향으로 인접하는 외접 구형을 둘러싸는 외접 구형(222, 223)이 생성되며, 외접 구형(222) 내에는 세로 방향으로 서로 인접하는 외접 구형(224, 225) 및 세로 방향으로 서로 인접하는 외접 구형(226, 227)이 존재하고 외접 구형(223) 내에는 세로 방향으로 서로 인접하는 외접 구형(228, 229) 및 세로 방향으로 서로 인접하는 외접 구형(230, 231)이 존재하고 있는 것으로 한다.
이 경우, 도 35의 (b)에 도시한 바와 같이 외접 구형(222, 223)을 둘러싸는 외접 구형(232)을 생성하여, 외접 구형(222, 223)을 통합하고, 외접 구형(226, 227)을 둘러싸는 외접 구형(233)을 생성하여, 외접 구형(226, 227)을 통합하고, 외접 구형(228, 229)을 둘러싸는 외접 구형(234)을 생성하여, 외접 구형(228, 229)을 통합하고, 외접 구형(230, 231)을 둘러싸는 외접 구형(235)을 생성하여, 외접 구형(230, 231)을 통합한다.
구체적으로는 이하의 a) 내지 c)의 처리를 행한다. 또, 이하의 예에서는 가로 문자열인 경우에 대해서 설명하지만, 세로 문자열의 경우에 대해서도 마찬가지이다.
a) 문자열 내 구형을 x 좌표로 올라가는 순서로 소트한다.
b) 최초의 구형을 전류 구형으로서 다음 그 이후의 구형이 전류 구형의 x 좌표의 범위에 중복되는 경우는 통합하고, 전류 구형의 x 좌표의 범위도 통합 결과인 것으로 한다. 이 처리를 통합하는 구형이 없어지기까지 반복한다. 통합하는 구형이 없어지면 분리 통합 후의 구형으로서 보존한다.
c) 통합하는 구형이 없어지면, 다음 구형을 새로운 전류 구형으로서, b) 및 c)의 처리를 반복한다.
다음에, 그룹 내의 문자열 사이즈에 의한 재그룹화를 행한다(스텝 S23). 그룹 내의 문자열 사이즈에 의한 재그룹화 처리로는 그룹 내의 문자열 정보로부터 문자열 방향으로 직각의 사이즈에 주목하여, 그 크기로 재그룹화를 행하고 그 결과를 새로운 그룹 정보에 저장한다.
이에 의해, 동일 색 그룹 내에서, 문자 사이즈가 다른 문자열을 별도의 그룹으로 할 수 있으며 동시에 노이즈와 문자열의 별도의 그룹화도 가능해진다.
도 36은 본 발명의 한 실시예에 따른 그룹 내의 문자열 사이즈에 의한 재그룹화 처리의 설명도이다.
도 36의 (a)에서 그룹 221 내에서 서로 가로 방향으로 인접하는 외접 구형을 둘러싸는 외접 구형(222, 223)이 생성되어 있는 것으로 하면, 외접 구형(222)의 높이 H1 및 외접 구형(223)의 높이 H2를 산출하고, 외접 구형(222)의 높이 H1과 외접 구형(223)의 높이 H2의 차가 임계치 보다 큰 경우는 외접 구형(222)과 외접 구형(223)을 별도의 그룹으로 한다.
구체적으로는 2개의 문자열 구형의 높이(횡서인 경우. 종서이면 폭)의 차이가 임계치보다 작으며 또한 2개의 문자열 구형이 중복 혹은 2개의 문자열 구형 간의 거리가 임계치보다 작은 경우에, 이 2개의 문자열 구형은 동일한 그룹에 속하는 것으로 하고 동일한 그룹 번호를 부여한다. 이 처리를 모든 그룹에서 행한다.
다음에, 그룹 내에서 동일한 그룹 번호의 문자열을 1개의 그룹으로 하는 새로운 그룹을 작성한다. 이 처리는 도 21의 스텝 S18에서 동일한 그룹이 된 문자 사이즈가 다른 문자열을 별도의 그룹으로 하는 기능이 있다.
다음에, 그룹 내의 큰 구형재 삭제 처리를 행한다(스텝 S24). 이 그룹 내의 큰 구형재 삭제 처리로는 노이즈 제거를 위해 그룹 내에서 평균적인 구형 사이즈를 구하고, 그 구형 사이즈를 기준으로서 극단적으로 큰 사이즈의 구형을 다시 삭제한다. 즉, 지금까지의 처리로 변화한 그룹에 대해서 도 21의 스텝 S19의 처리를 재차행하고 그룹 내의 노이즈를 삭제한다.
다음에, 그릅 통합 처리를 행한다(스텝 S25). 이 그릅 통합 처리로는 좌우 또는 상하의 가까운데에 동일색의 그룹을 통합한다. 즉, 2개의 그룹이 거의 동일한 색으로 또한 가까운 곳에 있으며, 그룹의 외접 구형이 나란히 배열되어 있는 경우에, 그 2개의 외접 구형을 통합하고, 1개의 그룹으로 한다. 이것은 후에 행하는 문자 구형 열에 의한 그룹의 문자열과 같은 판정을 안정화시키기 위해서 행한다.
도 37은 본 발명의 한 실시예에 따른 그릅 통합 처리의 설명도이다.
도 37의 (a)에서, 그룹 1의 외접 구형(241)과 그룹 2의 외접 구형(242)이 서로 가로로 나란히 배열되어 있는 것으로 하면, 외접 구형(241)과 외접 구형(242)의 거리 L1, 외접 구형(241)과 외접 구형(242)의 상단끼리의 좌표의 차 E1 및 외접 구형(241)과 외접 구형(242)의 하단끼리의 좌표의 차 E2를 구한다. 그리고, 외접 구형(241)과 외접 구형(242)의 거리 L1, 외접 구형(241)과 외접 구형(242)의 상단끼리의 좌표의 차 E1 및 외접 구형(241)과 외접 구형(242)의 하단끼리의 좌표의 차 E2가 각 임계치 보다 작으며, 그룹 1의 대표색과 그룹 2의 대표색의 차가 소정의 임계치 이내에 있는 경우, 외접 구형(241)과 외접 구형(242)을 통합하고 외접 구형(241) 및 외접 구형(242)을 둘러싸는 외접 구형(243)을 생성한다.
구체적으로는 2개의 그룹의 외접 구형에 있어서 좌표가 가깝고, 또한 가까운 거리에 있으며, 2개의 외접 구형을 통합하여 1개의 문자열과 볼 수 있을 것과 같은 것을 1개의 그룹으로 통합한다. 통합의 조건은 이하와 같다.
· 2개의 그룹의 평균 RGB의 각 RGB의 휘도차가 있는 고정 임계치보다 작다.
· 횡 정렬인 경우, 가로 방향의 거리가 고정 임계치 보다 작다(종 정렬인 경우는 세로 방향의 거리가 고정 임계치보다 작다).
· 횡 정렬인 경우, 2개의 그룹 외접 구형의 상단끼리의 좌표의 차가 고정 임계치보다 작으며, 또한 하단끼리의 좌표의 차가 고정 임계치보다 작다(종 정렬인 경우, 2개의 그룹 외접 구형의 우단끼리의 좌표의 차가 고정 임계치보다 작으며 또는 좌단끼리의 좌표의 차가 고정 임계치보다 작다).
이 처리를 통합하는 그룹이 없어지기까지 반복한다.
다음에, 구형 정렬에 의한 문자와 같은 그룹의 추출 처리를 행한다(스텝 S26). 이 구형 정렬에 의한 문자와 같은 그룹의 추출 처리에서는, 그룹 내의 구형 중에서 사이즈 또는 형태 등 일정한 조건을 만족하는 구형을 대상으로 상하단 좌표의 어느쪽인지가 이웃하는 구형과 가까운 경우, 이 양자의 구형이 나란히 배열되어 있다고 판정하고, 나란히 플래그를 셋트한다. 그 일정 조건을 만족하는 그룹 내의 대상 구형 중에서 나란히 배열되어 있는 구형의 수가 어느 정도의 비율인지를 나타낸 열 구형율을 구하고, 그 열 구형율이 일정한 임계치 이상의 그룹을 문자열이라고 간주하고 추출한다.
도 38은 본 발명의 한 실시예에 따른 구형 정렬에 의한 문자열과 유사한 그룹의 추출 처리의 설명도이다.
도 38의 (a)에서 외접 구형(252 내지 256) 및 외접 구형(258 내지 269)이 입력 화상으로부터 생성되며, 외접 구형의 그룹핑에 의해, 외접 구형(252 내지 256)이 1개의 그룹이 된 결과, 이들의 외접 구형(252 내지 256)을 둘러싸는 외접 구형(251)이 생성되며, 외접 구형(258 내지 269)이 1개의 그룹이 된 결과, 이들의 외접 구형(258 내지 269)을 둘러싸는 외접 구형(257)이 생성되어 있는 것으로 한다.
다음에, 각 그룹 내의 외접 구형의 사이즈이나 위치 관계를 조사하고, 가로 방향으로 나란히 배열되어 있는 외접 구형에 대해 횡 정렬 플래그(1)를 부여하고, 세로 방향으로 나란히 배열되어 있는 외접 구형에 대해서 종 정렬 플래그(2)를 부여한다. 이 결과, 외접 구형(251) 내의 외접 구형(252 내지 256)은 랜덤으로 나란히 배열되어 있으므로, 외접 구형(252 내지 256)에는 횡 정렬 플래그(1)도 종 정렬 플래그(2)도 붙지 않는다. 한편, 외접 구형(257) 내의 외접 구형(258 내지 269)은 가로 일렬로 나란하게 배열되어 있으므로, 외접 구형(258 내지 269)에는 횡 정렬 플래그(1)가 부여된다.
외접 구형(252 내지 256) 및 외접 구형(258 내지 269)에 대한 플래그 처리가 종료하면, 각 그룹마다 플래그가 첨부된 구형의 비율을 산출하고, 플래그가 첨부된 구형의 비율이 많은 그룹을 문자열로서 추출하고, 플래그가 첨부된 구형의 비율이 적은 그룹을 노이즈로서 버린다.
이 결과, 도 38의 (b)에 도시한 바와 같이 외접 구형(252 내지 256)으로 이루어지는 그룹은 외접 구형(252 내지 256)에 대해서 플래그가 1개도 첨부되지 않으므로, 노이즈로서 버려지며, 외접 구형(258 내지 269)으로 이루어지는 그룹은 외접 구형(258 내지 269)에 대해서 횡 정렬 플래그(1)가 부여되고 있으므로, 문자열로서 추출된다.
구체적으로는, 이하의 a) 내지 e)의 처리를 행한다.
a) 그룹 내의 인접하는 사이즈 또는 형태의 일정 조건을 만족하는 2개의 구형의 상단 좌표끼리 또는 하단 좌표끼리의 차가 임계치[높이의 WID_RATE(=0.2)배]보다 작은 경우, 그 2개의 구형에 횡 정렬 플래그를 부여한다.
여기서, 인접하는 것은 기준 구형의 폭의 WID_RATE_DIST(=0. 5)배의 주위 범위 이내에 구형이 있는 것을 말한다.
b) 그룹 내의 인접하는 사이즈 또는 형태의 일정 조건을 만족하는 2개의 구형의 좌단 좌표끼리 또는 우단 좌표끼리의 차가 임계치(폭의 WID_RATE배)보다 작은 경우, 그 2개의 구형에 종 정렬 플래그를 부여한다.
여기서, 인접하는 것은 기준 구형의 높이의 WID_RATE_DIST배의 주위 범위 이내에 구형이 있는 것을 말한다.
c) 그룹 내의 구형으로 횡 정렬 플래그와 종 정렬 플래그의 수가 많은 쪽을 문자열 방향으로서 채용하고, 그 수를 나란히 배열되어 있는 구형수로 한다.
d) 그룹 내의 구형 중에서 나란히 배열되어 있는 구형의 비율을 「나란히 배열되어 있는 구형수/그룹 내의 사이즈 또는 형태의 일정 조건을 만족하는 구형의 총수」를 산출함으로써 구한다.
또, 대상으로 하는 그룹 내 구형의 조건은 그룹 내의 구형의 최대 빈도치를 나타내는 높이를 도 32에 도시한 수법으로 구하고 그 3배를 large_rect로서,
구형 높이가 고정 사이즈(23dot, 100dpi에서)보다 크며, large_rect보다 작은것으로 한다.
e) 나란히 배열되어 있는 구형의 비율이 일정 임계치 NUM_RATE(=0. 8)보다 큰 경우에, 그 그룹을 문자열과 유사한 그룹으로서 남기고 다른 것을 노이즈로서 버린다.
또, 「·」이나 「―」는 문자로서 남기도록 한다.
다음에, 노이즈 그룹의 삭제 처리를 행한다(스텝 S27). 이 노이즈 그룹의 삭제 처리에서는 그룹 내가 2개의 구형만으로 구성되어 있는 그룹에 대해서, 그 형상, 좌표로부터 노이즈라고 생각되는 그룹을 추출하여, 그 그룹을 삭제한다. 즉, 그룹 내의 구형수가 2개인 것에 대해서, 그 2개의 구형이 상하(또는 좌우)단과도 가까운 것으로 2개의 구형이 나란히 배열되어 있다고 판단되는 이외의 그룹을 노이즈로서 삭제한다.
도 39는 본 발명의 한 실시예에 따른 노이즈 그룹의 삭제 처리의 설명도이다.
도 39에서, 2개의 외접 구형(272, 273)이 1개의 그룹으로서 추출되며, 이 2개의 외접 구형(272, 273)을 둘러싸는 외접 구형(271)이 생성되어 있는 것으로 한다. 이 경우, 외접 구형(272)과 외접 구형(273)의 하단 좌표는 일치하고 있지만, 외접 구형(272)과 외접 구형(273)의 상단 좌표는 극단적으로 다르므로, 이들의 외접 구형(272, 273)은 노이즈라고 간주하여, 외접 구형(272, 273)으로 이루어지는 그룹을 문자열과 유사한 그룹으로부터 삭제한다.
구체적으로는 이하의 처리를 행한다.
그룹 내의 2개의 구형의 높이의 평균을 hei, 폭의 평균을 wid로 한다. 임계치를 결정하는 비율 DEL_RATE=0.1로서,
(|제1 구형의 상단 좌표-제2 구형의 상단 좌표|
<hei×DEL_RATE
또는
|제1 구형의 하단 좌표-제2 구형의 하단 좌표|
<hei×DEL_RATE
또는
|제1 구형의 좌단 좌표-제2 구형의 좌단 좌표|
<wid×DEL_RATE
또는
|제1 구형의 우단 좌표-제2 구형의 우단 좌표|
<wid×DEL_RATE)
를 만족하는 그룹만 남기고 후는 노이즈로 해서 삭제한다.
다음에, 그룹 내 동일색 패턴 추출 처리를 행한다(스텝 S28). 이 그룹 내 동일색 패턴의 추출로는 그룹의 대표색을 그룹 내부의 구형의 대표색의 평균으로서 구한다. 그룹의 내부에 상당하는 범위에서 원화상을 탐색하여 그 색에 가까운 패턴으로 이미 문자 패턴으로서 추출되어 있는 것 이외의 것을 2치 화상으로서 추출한다. 추출한 패턴에 2치 화상용 라벨링을 걸쳐서 연결 성분의 외접 구형을 구하고, 그것의 크기가 일정 임계치 보다 큰 물건만을 문자 패턴의 일부로서 그룹에 추가한다.
예를 들면, 그룹 내의 패턴의 평균색(RGB)을 구하고 그 색에 가까운 화소를 그룹의 외접 구형의 범위 내에서 구하여 2치 화상을 작성한다. 그 중으로부터 패턴 부분을 제거하여 남은 2치 화상에 2치 화상의 라벨링 처리를 실시하고, 새로운 외접 구형을 구한다. 그리고, 새로운 외접 구형의 크기 및 형태가 일정한 임계치 이상인 경우에, 새로운 외접 구형 내의 패턴을 그룹에 추가한다.
이 처리에 의해, 지금까지의 처리에서 누락되지만, 실은 문자의 일부인 패턴, 예를 들면 「ば」의 탁점 부분과 같이 문자폭 정보나 색 어긋남 등으로 빠진 패턴을 재추출할 수 있다.
도 40은 본 발명의 한 실시예에 따른 그룹 내 동일색 패턴 추출 처리의 설명도이다.
도 40의 (a)에서 도 21의 스텝 S11 내지 S27의 처리에 의해 「クロ-ハル化への3つの成功モデル」이라는 문자열이 입력 화상으로부터 추출되며, 이들의 문자열을 둘러싸는 외접 구형(280)이 생성되어 있는 것으로 한다. 이 경우, 「ク」라는 문자의 탁점 및 「ハ」라는 문자의 탁점이 누락되어 있다.
여기서, 「ク」라는 문자의 탁점이 누락한 것은 「ク」라는 문자의 탁점의 색과 「ク」라는 문자의 색의 차가 임계치 범위 내에 없기 때문에, 「ク」라는 문자의 탁점이 「ク」라는 문자와 다른 그룹으로 그룹핑되었기 때문이다.
또한, 「ハ」라는 문자의 탁점이 누락한 것은 「ハ」라는 문자의 탁점의 색과 「ハ」라는 문자의 색의 차가 임계치 범위 내에 없기 때문에, 「ハ」라는 문자의 탁점이 「ハ」라는 문자와 다른 그룹에 그룹핑되었기 때문이다.
이와 같이, 스텝 S16의 동일색 그룹 추출 처리로는 추출 대상이 되는 문자열 중 국소적인 부분의 색끼리가 비교되므로, 추출 대상이 되는 문자열의 색이 색 어긋남 등으로 국소적으로 변화하고 있는 경우에는 문자의 일부가 누락하거나 한다.
그래서, 「ク」라는 문자의 탁점 및 「ハ」라는 문자의 탁점의 재추출을 행한다. 여기서, 재추출을 행할 때는 이미 추출되어 있는 「クロ-ハル化への3つの成功モデル」이라는 문자열 전체를 고려하여, 그 대표색을 구하고 이 대표색에 가까운 색을 갖는 패턴을 라벨 화상으로부터 추출한다. 이미 추출되어 있는 문자열 전체를 고려하여 대표색을 구함으로써, 그 문자열이 국소적인 색의 변화의 영향이 경감되며, 「ク」라는 문자의 탁점 및 「ハ」라는 문자의 탁점을 추출하는 것이 가능해진다. 또한, 재추출을 행할 때는 재추출의 대상이 되는 패턴이 존재하는 범위를 외접 구형(280)의 범위로 한정한다. 이 범위의 한정을 행함으로써 재추출이 되는 문자의 탁점이 그 범위로부터 밀려 나오지 않도록 하여 처리 대상이 되는 패턴의 범위를 좁게 하는 것이 가능하며, 추출 정밀도를 손상하는 일 없이 처리를 고속화하는 것이 가능해진다.
이 결과, 도 40의 (b)에 도시한 바와 같이 「ク」라는 문자의 탁점과 「ハ」라는 문자의 탁점이 정확하게 추출되며, 「グロ-バル化への3つの成功モデル」이라는 문자열을 입력 화상으로부터 추출할 수 있다.
또, 이 재추출의 결과 「グロ-バル化への3つの成功モデル」이라는 문자열과 동일색의 노이즈가 외접 구형(280)의 범위 내에 있는 경우, 이 노이즈도 함께 추출되므로, 재추출된 패턴 중 미소인 것은 노이즈라고 간주하여 제거하도록 한다.
구체적으로는 이하의 a) 내지 h)의 처리를 행한다.
a) 그룹 내의 구형 정보에 보존되어 있는 대표색 정보를 그룹 내의 구형 전부에 대해서 평균하고 그룹의 대표색(Rm, Gm, Bm)을 구한다.
b) 그룹 내의 구형 사이즈의 최대 빈도치를 폭과 높이에 대해서 구하고, 이들을 mfw, mfh로 한다. 최대 빈도치의 폭 mfw와 높이 mfh가 최소 구형 사이즈 임계치 minsize(=2)보다 큰 경우에는 최대 빈도치의 폭 mfw와 높이 mfh를 각각 minsize에서 치환한다.
c) 그룹의 외접 구형을 구하고, 그 외접 구형의 범위에서 2치 화상을 작성한다. 2치 화상은 전부 0으로 둔다.
d) 그룹의 외접 구형의 범위 내에서 원화상의 화소의 색을 체크하여, 원화상의 화소의 색(R, G, B)과 그룹의 대표색이,
|Rm-R|+|Gm-G|+|Bm-B|<THR×10
(THR=10)
을 만족하는 화소의 위치를 기록하고, 2치 화상의 동일한 위치의 화소를 1로 한다.
e) 2치 화상 중에서부터 그룹 내의 구형을 구성한다. 이미 추출되어 있는 패턴을 제거하여, 2치 화상을 그룹의 대표색에 가까운 색이며 또는 지금까지의 처리에서 누설되어 있던 패턴만으로 한다.
f) 2치 화상에 대해서 2치 화상용 라벨링을 행하고 연결 영역의 외접 구형을 구한다
g) 외접 구형의 폭 w 및 높이 h가,
w<mfw/2 또한 h<mfh/2
를 만족하는 구형만을 남기고 다른 것을 삭제한다.
h) 남은 구형을 구성하는 연결 구형의 패턴을 그룹에 추가한다.
다음에, 그룹의 출력 순위 결정 처리를 행한다(스텝 S29). 이 그룹의 출력 순위 결정 처리로서는 문자열을 포함하고 있는 그룹이 복수 추출된 경우, 그룹의 외접 구형으로부터 면적을 계산하여 전 화상 중의 그룹의 면적의 큰 순서로 그룹을 소트하고, 이 소트한 결과를 출력 순서로 한다.
다음에, 2치 패턴 생성 처리를 행한다(스텝 S30). 이 2치 패턴 생성 처리에서는 그룹을 구성하는 패턴을 문자 인식할 수 있는 것과 같은 2치 화상으로서 작성한다.
구체적으로는 이하의 a) 내지 c)의 처리를 행한다.
a) 그룹의 외접 구형 사이즈의 2치 화상을 작성하고, 그것을 전부 0으로 설정한다.
b) 그룹 내의 구형의 라벨 번호를 추출하고, 대응하는 구형 영역의 내부에서 라벨 화상을 탐색하고, 그 라벨 번호의 화소를 추출하고, 2치 화상 상에서 그 좌표의 화소를 1로 한다.
c) b)의 처리를 모든 구형에 대해서 행하고, 그룹을 구성하는 패턴을 2치 화상 상에 작성한다.
이하, 이상의 처리를 실제의 컬러 화상을 예로 들어 설명한다.
도 41의 (a)는 입력된 원화상의 예를 나타내는 도면이며, 이 원화상은 표제 문자(301, 302), 무늬(303), 본문 문자(304), 프레임(305) 등이 컬러로 인쇄되어 있다. 그리고, 이 원화상으로부터 표제 문자(301, 302)를 타이틀로서 추출하는 것으로 한다. 또, 표제 문자(301, 302)는 각각 한색으로 인쇄되게 된다.
도 41의 (b)는 도 41의 (a)의 라벨 화상을 나타내는 도면이다.
도 41의 (b)에서, 이 라벨 화상은 도 21의 스텝 S13의 색 라벨링 처리에 의해 얻어진 것이다. 이 색 라벨링 처리에 의해, 동일색의 연결 영역에 대해 동일 라벨이 부여되며, 동일 라벨이 부여된 패턴의 외접 구형이 생성된다. 이 때, 외접 구형의 갯수는 수천 내지 수만 정도가 된다.
도 41의 (c)는 도 41의 (b)의 라벨 화상으로부터 얻어진 주목 구형을 나타내는 도면이다.
도 41의 (c)에서 이 주목 구형은 도 21의 스텝 S14의 주목 구형 추출 처리에 의해 얻어진 것이며, 도 41의 (c)의 예는 구형 번호 1 내지 64의 주목 구형이 추출되어 있다.
또, 스텝 S14의 주목 구형 추출 처리로서는 라벨 화상으로부터 얻어지는 외접 구형 중 소정의 범위 내의 크기의 외접 구형이 주목 구형이 되므로, 도 41의 (c)의 영역(311, 312)에 원래 추출되어 있어야만 하는 표제 문자(301, 302)의 외접 구형이 빠져 있다. 이것은, 예를 들면 도 41의 (c)의 영역(312)에 원래 추출되어 있지 않으면 안되는 표제 문자(302)는 도 41의 (a)의 「に」의 문자에 대응하는 외접 구형이지만, 도 41의 (b)의 라벨 화상으로는 「に」를 구성하는 3개의 스트로크에 다른 라벨이 부여되므로, 각 스트로크의 외접 구형의 크기가 작아졌기 때문이다.
이 주목 구형 추출 처리에 의해 본문 문자(304)에 대응하는 도시되지 않는 외접 구형(313)이나 노이즈의 외접 구형이나 프레임(305)의 외접 구형 등을 그룹핑 시의 탐색 범위의 기준이 되는 외접 구형으로부터 제거할 수 있으며, 처리를 고속화하는 것이 가능해진다. 예를 들면, 도 41의 (b)의 상태에서는 외접 구형의 갯수가 수천 내지 수만 정도 있는 것이 도 41의 (c)의 상태에서는 외접 구형의 갯수가 수십개로 줄어 들고 있다.
도 41의 (d)는 그룹 추출 결과를 나타내는 도면이다.
도 41의 (d)에서 이 그룹 추출 결과는 도 21의 스텝 S16의 동일 색 그룹 추출 처리에 의해 얻어진 것이며, 구형 번호가 1 내지 21의 그룹의 외접 구형이 생성되어 있다. 이 처리에 의해, 도 41의 (b)의 라벨 화상으로부터 얻어진 외접 구형 중 도 41의 (c)에서 설정된 주목 구형으로부터 소정의 범위 내에 있으며, 대표색의 색이 가까운 것은 동일한 그룹에 그룹핑되며, 동일한 그룹에 그룹핑된 외접 구형을 둘러싸는 외접 구형이 생성된다.
이 결과, 도 41의 (a)의 「닛케이 400사 경영자 앙케이트」라는 표제 문자(301)에 대응한 그룹의 외접 구형(321)이 생성되며, 도 41의 (a)의 「무역 불균형의 요인에 미묘한 차」라는 표제 문자(302)에 대응한 그룹의 외접 구형(322)이 생성된다. 이 그룹핑에 의해, 표제 문자(301, 302)를 구성하는 문자열을 각각 1개로 통합할 수 있다. 또한, 도 41의 (c)의 영역(311, 312)에 원래 추출되어 있지 않으면 안되는 표제 문자(301, 302)의 외접 구형(323, 324)도 정확하게 추출하는 것이 가능해진다.
또, 도 41의 (c)의 주목 구형으로부터 소정의 범위 내에 대표색의 색이 가까운 다른 외접 구형이 도 41의 (b)의 라벨 화상으로부터 발견되지 않은 경우는 그 주목 구형은 그룹을 만들지 않기 때문에 그 주목 구형은 소멸한다.
도 42의 (a)는 도 41의 (d)의 그룹 추출 결과를 문자선 굵기로 재그룹화한 결과를 나타내는 도면이다.
도 42의 (a)에서 이 재그룹은 도 21의 스텝 S18의 문자선 굵기에 의한 재그룹화 처리에 의해 얻어진 것이며, 구형 번호가 0 내지 12의 그룹의 외접 구형이 생성되어 있다. 이 처리에 의해, 도 41의 (a)의 「닛케이 400사 경영자 앙케이트」라는 표제 문자(301)에 대응한 그룹의 외접 구형(331)이 생성되며, 도 41의 (a)의 「무역 불균형의 요인에 미묘한 차」라는 표제 문자(302)에 대응한 그룹의 외접 구형(332)이 생성된다.
또, 도 41의 (d)의 외접 구형 중 패턴의 선의 굵기에 의해서 그룹을 만들 수 없는 것은 소멸한다.
도 42의 (b)는 도 42의 (a)의 구형의 중복 통합 후의 결과를 나타내는 도면이다.
도 42의 (b)에서 이 구형의 중복 통합 후의 결과는 도 21의 스텝 S20의 그룹 내중복 구형 통합 처리에 의해 얻어진 것이며, 구형 번호가 0 내지 12의 그룹의 외접 구형이 생성되어 있다. 이 처리에서는 도 41의 (a)의 무늬(303)에 대응하는 영역(333)의 외접 구형은 서로 중복되어 있는 경우가 많으며, 이들의 외접 구형은 통합되어 소멸하고 있다. 이 통합 처리에 의해, 이 이후의 처리의 대상이 되는 외접 구형의 수가 줄어들므로 처리를 고속화할 수 있다.
도 42의 (c)는 도 42의 (b)의 화상으로부터 구형 정렬에 따른 문자열과 유사한 그룹을 추출한 결과를 나타내는 도면이다.
도 42의 (c)에서 이 문자열과 유사한 그룹은 도 21의 스텝 S26의 구형 정렬에 의한 문자열과 유사한 그룹의 추출 처리에 의해 얻어진 것이며, 구형 번호가 0, 1의 그룹의 외접 구형이 추출되어 있다. 이 처리에 의해, 도 42의 (b)의 영역(342)의 그룹의 외접 구형은 랜덤으로 나란히 배열되어 있으므로, 삭제되며 도 42의 (b)의 영역(341)의 그룹의 외접 구형만이 추출된다.
도 42의 (d)는 도 42의 (c)의 화상으로부터 그룹 내 패턴을 추출한 결과를 나타내는 도면이다.
도 42의 (d)에서, 이 그룹 내 패턴은 도 21의 스텝 S28의 그룹 내 동일색 패턴 추출 처리에 의해 얻어진 것이며, 도 42의 (c)에서 얻어진 그룹의 외접 구형의 영역 내의 패턴이 추출되며, 도 41의 (a)의 「닛케이 400사 경영자 앙케이트」라는 표제 문자(301) 및 「무역 불균형의 요인에 미묘한 차」라는 표제 문자(302)가 얻어진다.
도 43의 (a)는 도 41의 (a)의 화상으로부터 추출된 타이틀의 제1 후보의 패턴을 나타내는 도면, 도 43의 (b)는 도 41의 (a)의 화상으로부터 추출된 타이틀의 제2 후보의 패턴을 나타내는 도면이다.
도 43의 예에서는 추출된 패턴의 외접 구형(402, 402)의 면적에 의해, 도 41의 (a)의 원화상으로부터 추출된 타이틀의 출력 순위를 결정하고 있다.
이 결과, 도 41의 (a)의 「무역 불균형의 요인에 미묘한 차」라는 표제 문자(302)가 타이틀의 제2 후보로서 제시되며, 도 41의 (a)의 「닛케이 400사 경영자 앙케이트」라는 표제 문자(301)가 타이틀의 제2 후보로서 제시된다.
이상 설명한 바와 같이, 본 발명에 따르면, 인접하는 화소가 동일 라벨을 부여하는지의 여부를 판정하는 거리 임계치를 고정치가 아닌, 주목 화소의 색 정보에 따라서 설정했으므로, 동일 범위인지의 여부의 판별을 정확하게 할 수 있으며 원하는 영역의 추출이 정확하게 얻어진다.
또한, 본 발명의 한 형태에 의하면, 축소 화상에 의해 동일한 색이라고 간주할 수 있는 영역을 구하도록 했으므로, 동일한 색이라고 간주할 수 있는 영역을 추출하는 처리를 빠르게 행할 수 있다.
또한, 본 발명의 한 형태에 따르면 축소 화상에 의해 라벨 화상과 라벨의 외접 구형, 그 대표색, 동일 라벨 영역 내의 색의 정도의 수, 색의 종류를 구하고, 그에 대응하는 원화상의 구형을 구하고, 그 구형 내부에서 라벨링 처리를 행하므로, 라벨링 처리를 빠르게 행할 수 있다.
또한, 본 발명의 한 형태에 따르면, 축소 화상으로부터 요구한 모든 색의 종류와의 가까움을 조사하여, 그것이 임계치 보다도 작았을 때 동일 라벨을 부여하도록 했으므로, 인간의 본 상태와 거의 동일한 상태에서의 영역 추출이 가능하다.
또한, 본 발명의 한 형태에 따르면, 색의 3요소에 대해 각각 독립적으로 임계치를 설치하고, 이 3요소의 전부가 각각의 임계치 이내에 존재할 때 동일하다고 간주하므로, 임계치의 테이블의 용량을 작게 할 뿐만아니라 매우 정확한 라벨 부여를 할 수 있다.
또한, 본 발명의 한 형태에 따르면, 입력 화상 내의 패턴의 색 정보 및 기하학 정보에 기초하여, 상기 패턴의 분류를 행함으로써 컬러 입력 화상 내로부터 동일 색이 첨부된 표제 영역을 추출하는 경우 등에서 컬러 입력 화상 내의 일부의 영역으로 범위를 한정하여, 동일 색의 패턴의 추출을 행하고 표제 영역과 관계없는 빠진 영역에 존재하는 동일 색의 패턴을 분류 대상으로부터 제외하거나 표제 문자가 되지 않은 것 같은 노이즈 등의 작은 패턴이나 배경 등의 큰 패턴을 처리 대상으로부터 제거하거나 하는 것이 가능해지기 때문에, 표제 영역의 추출 처리의 속도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 입력 화상 내의 화소의 클러스터링을 행할 때는, 자기의 화소의 이웃하는 화소와의 색 정보를 비교하여 클러스터링을 행함으로써, 입력 화상 내의 모든 화소끼리를 비교하면, 화소끼리의 색 정보의 비교 횟수가 입력 화상 내의 화소수의 2승의 오더가 되는데 대해서, 자기의 화소의 이웃하는 화소와 비교한 경우에는, 화소끼리의 색 정보의 비교 횟수가 입력 화상 내의 화소수의 오더로 끝내는 것이 가능해지기 때문에, 클러스터링 처리의 고속화가 가능해진다.
또한, 입력 화상 내의 화소의 그룹핑을 행할 때는 클러스터링된 클러스터로부터 소정의 범위 내의 클러스터를 그룹핑 시의 처리 대상으로 함으로써, 동일 클러스터 내에 존재하는 화소를 일체적으로 취급하여 처리하는 것이 가능해지며, 개개의 화소를 처리 대상으로 할 필요가 없어지기 때문에, 그룹핑 처리를 고속으로 행하는 것이 가능해짐과 동시에, 입력 화상 내의 일부의 영역으로 범위를 한정하여 클러스터의 그룹핑을 행하는 것이 가능해지기 때문에, 그룹핑 처리의 보다 한층 더 고속화를 달성하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면 소정의 해상도로 판별한 색의 변동의 범위 내의 영역을 동일 색의 영역으로서 추출함으로써, 기본이 되는 색의 도트의 크기 및 이들의 조합으로 입력 화상의 패턴의 색이 표현되어 있기 때문에, 그 입력 화상 내에서는 동일 색으로서 표현되어 있음에도 불구하고, 판독 시의 해상도에 의해서는, 다른 색의 집합으로서 검출되는 경우에서도 입력 화상의 판독 시에 동일 색의 범위로서 추출을 행하는 것이 가능해지며, 입력 화상 내에서 동일 색으로서 표현되어 있는 영역으로부터 패턴의 일부가 빠지거나 부족하거나 하는 것을 방지하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 라벨 화상으로부터 생성된 외접 구형 중 탐색 영역을 설정할 때의 기준이 되는 외접 구형을 소정의 범위의 크기의 외접 구형에 한정함으로써 입력 화상으로부터 문자 영역을 추출할 때에, 노이즈 등이 미세한 패턴이나 배경 등의 큰 패턴의 외접 구형이 문자열을 탐색할 때의 탐색 영역의 기준으로서 선택되는 것을 방지하는 것이 가능해지며, 문자열이 아닌 패턴에 대한 그룹핑 처리가 행해지는 것을 저감하고 문자열만의 추출을 효율적으로 행하는 것이 가능해진다.
또한, 문자열을 탐색할 때의 탐색 영역을 주목하는 외접 구형으로부터 일정한 범위 내로 설정함으로써 주목한 외접 구형 근방의 문자만을 탐색하는 것이 가능하며, 입력 화상으로부터 타이틀을 추출할 때에, 그 타이틀과 떨어진 위치에 존재하고, 그 타이틀을 구성하지 않은 문자가 동일 그룹에 속함으로서 추출되는 것을 방지하는 것이 가능해지기 때문에, 타이틀에 포함되는 일련의 문자만을 효율적으로 추출하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 입력 화상의 인접 화소 간의 색 정보를 비교하여 라벨 화상을 생성할 때에, 이미 라벨이 붙어 있는 라벨 화상의 색 정보도 고려함으로써, 색의 차이의 누적치도 고려하면서 라벨 부여를 행하는 것이 가능해지기 때문에, 색이 서서히 변화하는 경우에, 서로 인접하는 화소의 색 정보를 비교하는 것뿐이므로, 서로 인접하는 화소 간에서는 색이 닮아 있기 때문에, 이들의 화소에 동일한 라벨이 부여되며, 이들의 화소를 찾아간 결과, 색의 차이가 누적하여, 전연 다른 색의 화소에 동일한 라벨이 부여되는 것을 방지하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면 소정의 색으로 표현된 영역의 인접 화소 간의 색차에 기초하여 라벨링 시의 임계치를 설정함으로써 입력 화상이 망점 인쇄법 등으로 인쇄되어 있기 때문에, 입력 화상 내에서는 동일 색으로서 표현되어 있음에도 불구하고, 판독 시의 해상도에 의해서는, 다른 색의 집합으로서 검출되는 경우에서도 입력 화상의 판독 시에 동일 색의 범위로서 추출을 행하는 것이 가능하며, 입력 화상 내에서 동일 색으로서 표현되어 있는 영역으로부터 패턴의 일부가 빠졌거나 부족하거나 하는 것을 방지하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 망점 인쇄법으로 생성되는 색을 컴퓨터 상에서 가상적으로 생성함으로써, 망점 인쇄법에 의한 색의 변동을 실제의 인쇄물을 이용하여 해석하는 일 없이, 망점 인쇄법에 의한 색의 변동을 인식하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면 인쇄 모델로 표현된 색의 휘도치 및 상기 휘도치에서의 인접 화소와의 색차를 상기 인쇄 모델에서의 판독 시의 해상도마다 등록한 색차 테이블을 생성함으로써, 실제의 인쇄물을 판독하는 디바이스의 해상도가 어떠한 것이어도 실제의 인쇄물로부터 판독된 색이 동일 색인지의 여부를 판단할 때의 임계치를 용이하게 취득하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면 인쇄 모델에서의 판독 시의 해상도를 입력 화상에 대해서 추정함으로써, 디바이스로 판독된 실제의 인쇄물을 컴퓨터 상에서 가상적으로 생성된 인쇄 모델 상으로 다루는 것이 가능하며, 디바이스로 판독된 실제의 인쇄물에 대해서, 인쇄 모델로 생성된 임계치를 적용하여 라벨링 처리를 행하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면 색차 테이블에 등록되어 있는 색의 휘도치 및 색차가 입력 화상 전체로 가장 맞는 해상도를 입력 화상에서의 인쇄 모델에서의 판독 시의 해상도와 추정함으로써, 디바이스로 판독된 실제의 인쇄물에 대해서 인쇄 모델로 생성된 알맞은 임계치를 입력 화상 전체에 적용하여 라벨링 처리를 행하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 색차 테이블에 등록되어 있는 색의 휘도치 및 색차가 입력 화상의 국소적인 영역에서 가장 맞는 해상도를 입력 화상이 국소적인 영역에서의 인쇄 모델에서의 판독 시의 해상도로 추정함으로써, 디바이스로 판독된 실제의 인쇄물에 대해서 입력 화상 전체의 임계치와 맞지 않은 영역에 대해서는 그 영역에 알맞은 임계치를 이용하여 라벨링 처리를 행하는 것이 가능해지며, 라벨링 처리의 정밀도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면 인쇄 모델에서의 판독 시의 해상도를 고정치로 함으로써, 실제의 인쇄물에 대한 모델 해상도 추정 처리를 생략하는 것이 가능해지며 처리 속도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 라벨링된 라벨 화상끼리를 그룹핑함으로써, 라벨링에 의해 추출된 문자 영역을, 문자열 영역으로서 통합하는 것이 가능해지며 타이틀의 추출을 효율적으로 행하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면 라벨 화상의 외접 구형에 대한 색 정보 및 상기 기하학 정보에 기초해서, 그룹핑을 행함으로써 컬러 입력 화상 내로부터 동일 색이 첨부된 표제 영역을 추출하는 경우 등에서 컬러 입력 화상 내의 일부의 영역에 범위를 한정하여 패턴의 추출을 행하고 표제 영역과 관계없이 떨어진 영역에 존재하는 패턴을 분류 대상으로부터 제외하거나 표제 문자가 되지 않은 노이즈 등의 작은 패턴이나 배경 등의 큰 패턴을 처리 대상으로부터 생략하는 것이 가능해지기 때문에, 표제 영역의 추출 처리의 속도를 향상시키는 것이 가능해진다.
또한, 라벨링된 패턴을 외접 구형으로 표현함으로써 문자 등을 구성하는 복잡한 패턴을 단순한 형태로 나타내는 것이 가능하며, 패턴을 기억하는 기억 용량을 삭감하는 것이 가능해짐과 동시에 패턴의 위치 관계등을 구하는 경우에서도 처리를 단순화하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면 외접 구형에 포함되는 패턴의 대표색을 비교하여 그룹핑을 행함으로써, 라벨링된 패턴을 외접 구형끼리 비교하는 것이 가능해지며 색 정보를 이용한 패턴의 그룹핑을 행할 때에, 그 패턴을 구성하는 각 화소끼리를 비교할 필요가 없어지기 때문에, 비교 대상이 되는 요소의 갯수를 저감시켜서 그룹핑 처리를 고속으로 행하는 것이 가능해진다.
또한, 본 발명의 한 형태에 의하면 주목하는 외접 구형으로부터 소정의 범위 내에 있는 다른 외접 구형을 대상으로서 그룹핑을 행함으로써, 입력 화상으로부터 타이틀 영역 등을 추출할 때에, 그룹핑의 대상이 되는 외접 구형의 존재하는 범위를 타이틀 영역으로서 상응하는 범위로 한정하는 것이 가능해지며, 타이틀 영역으로부터 밀려 나온 영역에 대해서는, 그룹핑 처리를 생략하는 것이 가능해지기 때문에, 처리를 고속으로 행하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면 주목하는 외접 구형으로부터 소정의 범위 내의 종횡의 각 좌표에 포함되는 구형 번호를 추출함으로써 주목하는 외접 구형으로부터 소정의 범위 내에 있는 다른 외접 구형을 효율적으로 찾아 내기 시작하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 외접 구형의 구형 번호를 좌표치의 순서로 저장하고, 가장 작은 좌표치로부터 순서대로 구형 번호를 탐색하고, 좌표치가 변화하기까지의 사이에 포함되는 구형 번호를 그 좌표에 속하는 구형 번호로서 추출함으로써, 실제로 존재하는 외접 구형에 대응하여 그 좌표치를 저장하는 것이 가능해지기 때문에, 주목하는 외접 구형으로부터 소정의 범위 내로 존재할 가능성이 있는 다른 외접 구형의 갯수분만 기억 용량을 각 좌표치마다 미리 준비 해 두는 것이 불필요해지며, 외접 구형의 구형 번호를 저장하기 위해서 필요한 기억 용량을 삭감하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면 주목하는 외접 구형으로부터 소정의 범위 내에 있는 다른 외접 구형에 있어서, 색차 테이블로부터 구한 색차보다도 2개의 외접 구형 간의 대표색의 색차가 작은 경우에, 2개의 외접 구형을 동일한 그룹에 넣도록 함으로써, 입력 화상으로부터 타이틀 영역 등을 추출할 때에, 그룹핑의 대상이 되는 외접 구형의 존재하는 범위를 타이틀 영역으로서 상응한 범위로 한정하는 것이 가능해짐과 동시에, 외접 구형끼리를 비교하여 색 정보를 이용한 패턴의 그룹핑을 행할 때에 실제의 인쇄물의 판독 시에 발생하는 동일 색에서의 색의 변동을 고려하는 것이 가능해지며, 처리를 고속으로 행하는 것이 가능해짐과 동시에 판독 정밀도도 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 굵기가 다른 문자를 별도의 그룹에 넣음으로써 입력 화상으로부터 타이틀 등을 추출할 때에 굵기가 일치하는 문자로 이루어지는 문자열만을 1개의 타이틀로 하는 것이 가능해지며, 타이틀을 추출할 때의 정밀도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면 패턴의 면적과 상기 패턴의 윤곽 길이와의 비에 기초하여, 상기 패턴의 굵기를 구함으로써 패턴의 굵기를 정밀도 좋게 구하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면 패턴의 윤곽이 되는 화소를 탐색할 때에 이미 패턴의 윤곽으로서 탐색된 화소에 대해서는 탐색하지 않도록 함으로써, 패턴의 윤곽과 화소가 재차 추출되는 것을 방지하고, 윤곽 추적 처리의 속도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면 문자 사이즈로부터 정한 소정의 범위를 넘는 외접 구형을 그 외접 구형의 그룹으로부터 삭제함으로써 모양이나 그림 등의 패턴이 타이틀의 근처에 존재하고, 타이틀을 구성하는 문자와 모양이나 그림 등의 패턴이 동일한 그룹으로 분류된 경우에서도 모양이나 그림 등의 패턴을 그 그룹에서 제거하는 것이 가능해지며 타이틀을 추출할 때의 정밀도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면 외접 구형의 배치 상태에 기초하여, 문자열을 추출함으로써 외접 구형이 불규칙하게 배치되어 있는 영역과, 외접 구형이 규칙적으로 배치되어 있는 영역을 구별하는 것이 가능해지며, 외접 구형이 규칙적으로 배치되어 있는 영역을 타이틀 영역으로 함으로써 타이틀 영역만을 효율적으로 추출하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면 크기가 다른 문자를 별도의 그룹에 넣음으로써 입력 화상으로부터 타이틀 등을 추출할 때에, 크기가 일치하는 문자로 이루어지는 문자열만을 1개의 타이틀로 하는 것이 가능해지며, 타이틀을 추출할 때의 정밀도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면 그룹 내의 외접 구형이 일렬로 일치하여 배치되어 있는지의 여부를 판별함으로써, 일열로 일치하여 배치되어 있는 외접 구형이 많은 그룹을 타이틀 영역이라고 간주하는 것이 가능해지며 입력 화상으로부터 타이틀을 효율적으로 추출하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면 그룹 내의 패턴의 대표색에 기초하여, 그룹의 대표색을 산출함으로써 타이틀 영역에 존재하는 모든 색을 고려하여 타이틀의 색을 산출하는 것이 가능해지며, 타이틀 영역에 국소적인 색의 차이가 존재하는 경우에서도, 그 국소적인 색의 차이의 영향을 저감하는 것이 가능해지기 때문에, 타이틀 색에 기초하여 타이틀 영역을 추출할 때의 정밀도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 그룹의 대표색에 기초하여 서로 인접하여 존재하는 그룹의 외접 구형을 통합함으로써 동일한 타이틀을 구성하는 문자임에도 불구하고, 색이 미묘하게 다르기 때문에, 이들의 문자가 별도의 그룹에 속하는 것으로 이루어진 경우에서도 이들의 문자를 동일한 그룹에 통합하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 서로 인접하여 존재하는 그룹의 외접 구형의 크기의 차가 소정의 범위 내에 있으며 또한 그룹의 대표색의 차가 일정한 범위 내에 있는 경우에, 그룹의 외접 구형을 통합함으로써 동일한 타이틀을 구성하는 문자로 이루어지는 그룹만을 효율적으로 통합하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 그룹의 대표색에 기초하여 원화상의 화소를 그룹의 외접 구형의 범위 내로부터 재추출함으로써 타이틀을 구성하는 문자에 탁점이나 반탁점 등이 포함되어 있으며, 타이틀 영역이 국소적인 색의 차이의 영향으로 이들의 탁점이나 반탁점 등이 타이틀의 그룹으로부터 누락된 경우에서도 타이틀 영역의 전체적인 색과 비교하여, 이들의 탁점이나 반탁점 등을 재추출하는 것이 가능해지기 때문에, 타이틀을 추출할 때의 정밀도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면, 재추출된 패턴의 외접 구형이 임계치 보다 큰 것을 그룹에 추가함으로써 탁점이나 반탁점 등을 타이틀 영역으로부터 재추출할 때에 타이틀과 동일 색의 미세한 노이즈가 타이틀 영역 내에 존재하는 경우에서도 이들의 노이즈만을 삭제하는 것이 가능하며 타이틀을 추출할 때의 정밀도를 향상시키는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면 그룹핑된 그룹의 외접 구형의 면적, 위치 및 위치 관계의 정보에 기초하여, 그룹 내의 패턴의 출력 순서를 결정함으로써 입력 화상으로부터 복수의 타이틀 후보가 추출된 경우에서도 타이틀과 같은 것을 평가하는 것이 가능해지며, 타이틀로서의 우선도가 높은 것으로부터 순서대로 출력하는 것이 가능해진다.
또한, 본 발명의 한 형태에 따르면 그룹핑된 그룹의 외접 구형 내의 라벨 화상으로부터 2치 패턴을 생성함으로써 컬러 화상으로부터 추출된 패턴의 인식 처리를 효율적으로 행하는 것이 가능해진다.

Claims (54)

  1. 컬러 화상을 입력하여 컬러 화상 신호를 출력하는 컬러 화상 입력 수단과, 이 컬러 화상 신호를 유지하는 유지 수단과, 상기 컬러 화상 신호를 처리하는 연산 수단을 구비한 컬러 화상 처리 장치에 있어서,
    주목 화소의 색 정보에 따라서 정해지는 임계치를 설정하는 임계치 설정 수단과,
    인접하는 화소의 색 정보를 비교하여, 그 거리가 상기 임계치 이내일 때 동일 라벨을 부여하는 라벨링을 행하는 라벨링 수단을 구비한 것을 특징으로 하는 컬러 화상 처리 장치.
  2. 제1항에 있어서,
    동일 라벨이 부여된 화소의 평균색을 구하는 평균색 산출 수단과,
    상기 주목 화소에 인접하는 화소의 색과 상기 평균색을 비교하는 평균색 비교 수단을 더욱 구비하고,
    상기 라벨링 수단은, 상기 비교 결과가 소정의 범위 내에 있는 경우에만, 동일 라벨을 부여하는 것을 특징으로 하는 컬러 화상 처리 장치.
  3. 컬러 화상을 입력하여 컬러 화상 신호를 출력하는 컬러 화상 입력 수단과, 이 컬러 화상 신호를 유지하는 유지 수단과, 상기 컬러 화상 신호를 처리하는 연산 수단을 구비한 컬러 화상 처리 장치에 있어서,
    상기 컬러 화상 신호를 축소하여 축소 화상을 작성하는 화상 축소 수단을 설치하고, 이 축소 화상으로 동일한 색으로 간주할 수 있는 영역을 구하고, 그 영역에 대응하는 원화상의 영역을 축소 화상으로 추출한 색만에 주목하여 추출하는 것을 특징으로 하는 컬러 화상 처리 장치.
  4. 제3항에 있어서,
    상기 라벨링 수단에 있어서, 상기 축소 화상으로 라벨 화상과 라벨 영역의 외접 구형, 그 대표색, 동일 라벨 영역 내의 색의 종류의 수, 색의 종류 등을 구하고, 그것에 대응하는 원화상의 구형을 구하고, 그 구형 내부에서 대표색에 가까운 화소를 탐색하여, 그것을 기점으로 하여 라벨 처리를 행하는 것을 특징으로 하는 컬러 화상 처리 장치.
  5. 제3항에 있어서,
    상기 라벨링 수단에 있어서, 원화상의 라벨링을 행할 때에, 축소 화상으로부터 요구한 모든 색의 종류와 유사성을 조사하고, 그것이 임계치보다도 작은 경우에 동일 라벨을 부여하는 것을 특징으로 하는 컬러 화상 처리 장치.
  6. 제1항에 있어서,
    상기 임계치 설정 수단에 있어서, 색의 유사성을 색의 3요소에 독립한 가변 임계치를 이용하여 판단함과 동시에, 색의 차의 거리로서 3요소에 대해 전부 각각의 가변 임계치보다도 작은 경우에 색의 차의 거리를 0으로 간주하고, 그 이외일 때, 임계치보다도 큰 값의 거리라고 판단하는 것을 특징으로 하는 컬러 화상 처리 장치.
  7. 컬러 화상을 구성하는 제1 색에 대해, 제1 임계치를 설정하는 제1 임계치 설정 수단과,
    상기 컬러 화상을 구성하는 제2 색에 대해, 제2 임계치를 설정하는 제2 임계치 설정 수단과,
    상기 제1 색의 화소를 상기 컬러 화상의 제1 주목 화소에 설정하는 제1 주목 화소 설정 수단과,
    상기 제2 색의 화소를 상기 컬러 화상의 제2 주목 화소에 설정하는 제2 주목 화소 설정 수단과,
    상기 제1 주목 화소에 인접하는 제1 인접 화소를 검출하는 제1 인접 화소 검출 수단과,
    상기 제2 주목 화소에 인접하는 제2 인접 화소를 검출하는 제2 인접 화소 검출 수단과,
    상기 제1 주목 화소의 색과 상기 제1 인접 화소의 색과의 차가 상기 제1 임계치의 범위 내에 있는 경우, 상기 제1 인접 화소에 대해, 상기 제1 주목 화소와 동일한 라벨을 부여하는 제1 라벨링 수단과,
    상기 제2 주목 화소의 색과 상기 제2 인접 화소의 색과의 차가 상기 제2 임계치의 범위 내에 있는 경우, 상기 제2 인접 화소에 대해, 상기 제2 주목 화소와 동일한 라벨을 부여하는 제2 라벨링 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  8. 입력 화상 내의 패턴에 대한 색 정보를 산출하는 색 정보 산출 수단과,
    상기 패턴에 대한 기하학 정보를 산출하는 기하학 정보 산출 수단과,
    상기 색 정보 및 상기 기하학 정보에 기초하여, 상기 패턴의 분류를 행하는 분류 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  9. 인접하는 화소끼리의 색 정보에 기초하여, 입력 화상 내의 화소의 클러스터링을 행하는 클러스터링 수단과,
    상기 클러스터링 수단으로 얻어진 클러스터끼리의 색 정보 및 기하학 정보에 기초하여, 상기 클러스터의 그룹핑을 행하는 그룹핑 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  10. 제1 해상도에서는 동일색으로 간주되는 영역이, 제2 해상도에서는 다른 색의 집합으로 판별되는 경우에 있어서,
    상기 제2 해상도로 판별한 색의 변동의 범위 내의 영역을, 동일색의 영역으로서 추출하는 것을 특징으로 하는 패턴 추출 장치.
  11. 입력 화상의 색 정보에 기초하여, 라벨 화상을 생성하는 라벨 화상 생성 수단과,
    상기 라벨 화상의 외접 구형을 생성하는 외접 구형 생성 수단과,
    상기 외접 구형 생성 수단으로 생성된 외접 구형 중, 소정의 범위의 크기의 외접 구형을 추출하는 제1 외접 구형 추출 수단과,
    상기 제1 외접 구형 추출 수단으로 추출된 외접 구형으로부터 일정한 범위 내의 탐색 영역을 설정하는 탐색 영역 설정 수단과,
    상기 탐색 영역에 관한 외접 구형을 상기 외접 구형 생성 수단으로 생성된 외접 구형 중으로부터 추출하는 제2 외접 구형 추출 수단과,
    상기 제1 외접 구형 추출 수단으로 추출된 외접 구형 내의 영역의 색 정보 및 상기 제2 외접 구형 추출 수단으로 추출된 외접 구형 내의 영역의 색 정보에 기초하여, 상기 제1 외접 구형 추출 수단으로 추출된 외접 구형 및 상기 제2 외접 구형 추출 수단으로 추출된 외접 구형을 그룹핑하는 그룹핑 수단과,
    상기 그룹핑 결과에 기초하여, 문자열을 추출하는 문자열 추출 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  12. 입력 화상의 인접 화소 사이의 색 정보를 비교하는 제1 색 정보 비교 수단과,
    상기 제1 색 정보 비교 수단으로 비교 대상이 된 화소의 색 정보와, 상기 화소에 인접하는 라벨 화상의 색 정보를 비교하는 제2 색 정보 비교 수단과,
    상기 제1 색 정보 비교 수단의 비교 결과 및 상기 제2 색 정보 비교 수단의 비교 결과에 기초하여, 라벨링을 행하는 라벨링 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  13. 제12항에 있어서,
    상기 라벨 화상의 색 정보는, 동일 라벨이 부여된 화소의 색 정보의 평균치인 것을 특징으로 하는 패턴 추출 장치.
  14. 소정의 색으로 표현된 영역의 인접 화소 사이의 색차를 산출하는 색차 산출 수단과,
    상기 색차에 기초하여, 임계치를 설정하는 임계치 설정 수단과,
    상기 임계치에 기초하여, 상기 소정의 색으로 표현된 화소에 인접하는 화소의 라벨링을 행하는 라벨링 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  15. 제14항에 있어서,
    기본이 되는 색의 도트를 격자점에 배치한 메쉬를 상호 회전하여 중합시키고, 또한, 상기 도트의 크기를 변화시킴으로써, 인쇄 모델로서의 색을 생성하는 인쇄 모델 생성 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  16. 제15항에 있어서,
    상기 인쇄 모델 생성 수단으로 생성된 색의 휘도치 및 상기 휘도치에 있어서의 인접 화소와의 색차를, 상기 인쇄 모델에 있어서의 판독 시의 해상도마다 등록한 색차 테이블을 생성하는 색차 테이블 생성 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  17. 제16항에 있어서,
    상기 인쇄 모델에서의 판독 시의 해상도를, 입력 화상에 대해 추정하는 모델 해상도 추정 처리부를 구비하는 것을 특징으로 하는 패턴 추출 장치.
  18. 제17항에 있어서,
    상기 모델 해상도 추정 처리부는, 상기 색차 테이블에 등록되어 있는 색의 휘도치 및 색차가 입력 화상 전체에서 가장 알맞는 해상도를, 상기 입력 화상에 있어서의 상기 인쇄 모델에서의 판독 시의 해상도로 추정하는 것을 특징으로 하는 패턴 추출 장치.
  19. 제17항에 있어서,
    상기 모델 해상도 추정 처리부는, 상기 색차 테이블에 등록되어 있는 색의 휘도치 및 색차의 입력 화상의 국소적인 영역에서 가장 알맞는 해상도를 상기 입력 화상이 국소적인 영역에서의 상기 인쇄 모델에서의 판독 시의 해상도로 추정하는 것을 특징으로 하는 패턴 추출 장치.
  20. 제17항에 있어서,
    상기 모델 해상도 추정 처리부는, 상기 인쇄 모델에서의 판독 시의 해상도를 고정치로 하는 것을 특징으로 하는 패턴 추출 장치.
  21. 제14항 내지 제20항 중 어느 한항에 있어서,
    상기 라벨링 수단으로 라벨링된 라벨 화상끼리를 그룹핑하는 그룹핑 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  22. 제21항에 있어서,
    상기 그룹핑 수단은,
    상기 라벨링 수단으로 라벨링된 라벨 화상의 패턴의 외접 구형을 산출하는 외접 구형 산출 수단과,
    상기 라벨 화상의 패턴의 색 정보를 산출하는 색 정보 산출 수단과,
    상기 외접 구형의 기하학 정보를 산출하는 기하학 정보 산출 수단과,
    상기 색 정보 및 상기 기하학 정보에 기초하여, 상기 라벨 화상의 패턴을 동일한 그룹에 넣는지의 여부를 판별하는 판별 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  23. 제22항에 있어서,
    상기 색 정보는 상기 외접 구형에 포함되는 패턴의 대표색인 것을 특징으로 하는 패턴 추출 장치.
  24. 제22항 또는 제23항에 있어서,
    상기 기하학 정보는 주목하는 외접 구형으로부터 소정의 범위 내에 있는 다른 외접 구형인 것을 특징으로 하는 패턴 추출 장치.
  25. 제24항에 있어서,
    상기 기하학 정보 산출 수단은,
    각 외접 구형이 속하는 종횡의 좌표에 대응하여 구형 번호를 저장하는 구형 번호 저장 수단과,
    주목하는 외접 구형으로부터 소정의 범위 내의 종횡의 각 좌표에 포함되는 구형 번호를 추출하는 구형 번호 추출 수단과,
    상기 추출된 구형 번호 중 종횡의 좌표의 양쪽에 포함되는 것을, 주목하는 외접 구형으로부터 소정의 범위 내에 있는 다른 외접 구형으로서 추출하는 근방 구형 추출 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  26. 제25항에 있어서,
    상기 구형 번호 저장 수단은 외접 구형의 구형 번호를 좌표치의 순서로 저장하고,
    상기 구형 번호 추출 수단은 가장 작은 좌표치로부터 순서대로 구형 번호를 탐색하고, 좌표치가 변화할 때까지의 동안에 포함되는 구형 번호를 그 좌표에 속하는 구형 번호로서 추출하는 것을 특징으로 하는 패턴 추출 장치.
  27. 제23항에 있어서,
    상기 판별 수단은 주목하는 외접 구형으로부터 소정의 범위 내에 있는 다른 외접 구형으로서, 상기 색차 테이블로부터 구한 색차보다도, 2개의 외접 구형 사이의 대표색의 색차가 작은 경우에, 상기 2개의 외접 구형을 동일한 그룹에 넣는 것을 특징으로 하는 패턴 추출 장치.
  28. 제21항에 있어서,
    상기 그룹핑 수단은 상기 라벨 화상의 패턴의 굵기에 기초하여, 상기 라벨 화상의 그룹핑을 행하는 것을 특징으로 하는 패턴 추출 장치.
  29. 제28항에 있어서,
    상기 그룹핑 수단은,
    상기 패턴의 윤곽 길이를 구하는 윤곽 추적 수단과,
    상기 패턴의 면적을 구하는 면적 산출 수단과,
    상기 패턴의 면적과 상기 패턴의 윤곽 길이와의 비에 기초하여, 상기 패턴의 굵기를 구하는 굵기 산출 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  30. 제29항에 있어서,
    상기 윤곽 추적 수단은 패턴의 윤곽이 되는 제1 화소로부터 상기 패턴의 윤곽이 되는 제2 화소를 탐색할 때에 상기 제1 화소에 인접하는 8개의 화소 중 상기 제1 화소의 이동원의 화소에 인접하는 화소로부터 상기 제2 화소를 탐색하는 것을 특징으로 하는 패턴 추출 장치.
  31. 제22항에 있어서,
    상기 그룹핑 수단으로 그룹핑된 외접 구형의 크기에 기초하여 문자 사이즈를 추정하는 문자 사이즈 추정 수단과,
    상기 문자 사이즈로부터 정한 소정의 범위를 넘는 외접 구형을 상기 외접 구형의 그룹으로부터 삭제하는 구형 삭제 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  32. 제22항에 있어서,
    상기 그룹핑 수단으로 그룹핑된 외접 구형의 배치 상태에 기초하여 문자열 방향을 추정하는 문자열 방향 추정 수단과,
    상기 그룹핑 수단으로 그룹핑된 외접 구형의 배치 상태에 기초하여 문자열을 추출하는 문자열 추출 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  33. 제22항에 있어서,
    상기 그룹핑 수단으로 그룹핑된 외접 구형의 그룹 내의 사이즈에 기초하여 상기 그룹 내의 외접 구형을 재그룹핑하는 재그룹핑 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  34. 제22항에 있어서,
    상기 그룹핑 수단으로 그룹핑된 그룹의 외접 구형으로부터 소정의 크기를 만족시키는 외접 구형을 추출하는 외접 구형 추출 수단과,
    상기 추출된 외접 구형 중 상호 인접하는 외접 구형의 상단 좌표 또는 하단 좌표가 가까운 것에, 횡 정렬로 플래그를 부여하는 횡 정렬 플래그 부여 수단과,
    상기 추출된 외접 구형 중 상호 인접하는 외접 구형의 좌단 좌표 또는 우단 좌표가 가까운 것에, 종 정렬 플래그를 부여하는 종 정렬 플래그 부여 수단과,
    상기 횡 정렬 플래그 및 상기 종 정렬 플래그의 갯수에 기초하여 상기 그룹의 문자열 방향을 결정하는 문자열 방향 결정 수단과,
    상기 결정된 문자열 방향에 대응하는 플래그가 부여된 상기 그룹 내의 외접 구형의 갯수의 비율에 기초하여 상기 그룹의 외접 구형이 문자열의 외접 구형인지의 여부를 결정하는 문자열 결정 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  35. 제22항에 있어서,
    상기 그룹핑 수단으로 그룹핑된 그룹의 외접 구형을 생성하는 외접 구형 생성 수단과,
    상기 그룹핑 수단으로 그룹핑된 그룹 내의 패턴의 대표색에 기초하여, 상기 그룹의 대표색을 산출하는 대표색 산출 수단을 구비하는 것을 특징으로 패턴 추출 장치.
  36. 제35항에 있어서,
    상기 그룹의 대표색에 기초하여 상호 인접하여 존재하는 상기 그룹의 외접 구형을 통합하는 그룹 통합 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  37. 제36항에 있어서,
    상기 그룹 통합 수단은 상호 인접하여 존재하는 그룹의 외접 구형의 크기의 차가 소정의 범위 내에 있고, 또한, 상기 그룹의 대표색의 차가 일정한 범위 내에 있는 경우에, 상기 그룹의 외접 구형을 통합하는 것을 특징으로 하는 패턴 추출 장치.
  38. 제35항에 있어서,
    상기 그룹의 대표색에 기초하여 원화상의 화소를 상기 그룹의 외접 구형의 범위 내로부터 재추출하는 재추출 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  39. 제38항에 있어서,
    상기 재추출된 화소를 2치화하는 2치화 수단과,
    상기 2치 화상의 라벨링을 행하는 제2 라벨링 수단과,
    상기 제2 라벨링 수단에 의해 라벨링된 패턴의 외접 구형이 임계치보다 큰 것을 상기 그룹에 추가하는 추가 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  40. 제22항에 있어서,
    상기 그룹핑 수단으로 그룹핑된 그룹의 외접 구형의 면적, 위치 및 위치 관계의 정보에 기초하여 그룹 내의 패턴의 출력 순서를 결정하는 출력 순서 결정 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  41. 제22항에 있어서,
    상기 그룹핑 수단으로 그룹핑된 그룹의 외접 구형 내의 라벨 화상에 1의 레벨을 부여한 2치 패턴을 생성하는 2치 패턴 생성 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  42. 입력 화상에 포함되는 패턴에 대한 외접 구형을 생성하는 외접 구형 생성 수단과,
    상기 외접 구형 생성 수단으로 생성된 외접 구형 중 소정의 범위의 크기 또는 위치의 외접 구형을 추출하는 제1 외접 구형 추출 수단과,
    상기 제1 외접 구형 추출 수단으로 추출된 외접 구형으로부터 일정한 범위 내의 탐색 영역을 설정하는 탐색 영역 설정 수단과,
    상기 탐색 영역에 대한 외접 구형을 상기 외접 구형 생성 수단으로 생성된 외접 구형 중으로부터 추출하는 제2 외접 구형 추출 수단과,
    상기 제2 외접 구형 추출 수단에 의한 추출 결과에 기초하여 상기 입력 화상으로부터 특정한 패턴을 추출하는 패턴 추출 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  43. 제42항에 있어서,
    상기 제2 외접 구형 추출 수단은,
    상기 외접 구형 생성 수단으로 생성된 외접 구형이 속하는 종횡의 좌표에 대응하여 구형 번호를 저장하는 구형 번호 저장 수단과,
    상기 제1 외접 구형 추출 수단으로 추출된 외접 구형으로부터 소정의 범위 내의 종횡의 각 좌표에 포함되는 구형 번호를 추출하는 구형 번호 추출 수단과,
    상기 추출된 구형 번호 중 종횡의 좌표의 양쪽에 포함되는 것을 상기 탐색 영역에 관한 외접 구형으로서 추출하는 근방 구형 추출 수단을 구비하는 것을 특징으로 하는 패턴 추출 장치.
  44. 제43항에 있어서,
    상기 구형 번호 저장 수단은 외접 구형의 구형 번호를 좌표치의 순서로 저장하고,
    상기 구형 번호 추출 수단은 가장 작은 좌표치로부터 순서대로 구형 번호를 탐색하고, 좌표치가 변화할 때까지 동안에 포함되는 구형 번호를 그 좌표에 속하는 구형 번호로서 추출하는 것을 특징으로 하는 패턴 추출 장치.
  45. 컬러 화상의 주목 화소의 색 정보에 기초하여 상기 주목 화소의 인접 화소에 상기 주목 화소와 동일한 라벨을 부여하는지의 여부를 판정하는 임계치를 제어하는 것을 특징으로 하는 패턴 추출 방법.
  46. 컬러 화상의 색이 색 요소의 도트의 조합으로 표현되어 있는 경우에 있어서,
    상기 컬러 화상의 판독 해상도에 대응한 인접 화소 사이의 색차의 범위 내의 영역을 동일색의 영역으로서 추출하는 것을 특징으로 하는 패턴 추출 방법.
  47. 기본이 되는 색의 도트를 조합시켜 컬러 화상을 구성하는 스텝과,
    상기 컬러 화상을 소정의 해상도로 판독하는 스텝과,
    상기 컬러 화상을 구성하는 색에 대해 상기 소정의 해상도로 판독된 인접 화소 사이의 휘도차를 산출하는 스텝과,
    상기 휘도차에 기초하여 입력 화상의 동일색의 범위를 추출하는 스텝을 구비하는 것을 특징으로 하는 패턴 추출 방법.
  48. 확대하면 다른 색의 집합에 보이는 경우에서도, 육안으로 동일색에 보이는 영역에 대해서는 이들의 영역을 동일한 영역에 속하는 것으로 하여 추출하는 것을 특징으로 하는 패턴 추출 방법.
  49. 제1 해상도로 동일색으로 판별되는 영역의 색의 차이를 제2 해상도로 검출하는 스텝과,
    상기 제2 해상도로 검출된 색의 차이에 기초하여 동일색인지의 여부를 판별하는 임계치를 설정하는 스텝과,
    상기 임계치에 기초하여 상기 제1 해상도로 동일색이라 판별되는 영역을 추출하는 스텝을 구비하는 것을 특징으로 하는 패턴 추출 방법.
  50. 입력 화상의 색 정보에 기초하여 라벨 화상을 생성하는 스텝과,
    상기 라벨 화상 중 소정의 범위의 크기를 갖는 제1 패턴을 추출하는 스텝과,
    상기 제1 패턴으로부터 일정한 범위 내에 있는 제2 패턴을 추출하는 스텝과,
    상기 제1 패턴의 색 정보 및 상기 제2 패턴의 색 정보에 기초하여, 상기 제1 패턴 및 상기 제2 패턴을 그룹핑하는 스텝과,
    상기 그룹핑된 패턴으로부터 문자열을 추출하는 스텝을 구비하는 것을 특징으로 하는 패턴 추출 방법.
  51. 색의 차가 소정의 범위 내에 있는 연결된 화소에 동일 라벨을 부여하는 스텝과,
    소정의 범위 내의 크기를 갖는 제1 라벨이 부여된 패턴을 추출하는 스텝과,
    상기 제1 라벨이 부여된 패턴으로부터 소정의 범위 내에 있는 제2 라벨이 부여된 패턴을 추출하는 스텝과,
    상기 제1 라벨이 부여된 패턴의 색과 상기 제2 라벨이 부여된 패턴의 색을 비교하는 스텝과,
    상기 제1 라벨이 부여된 패턴의 색과 상기 제2 라벨이 부여된 패턴의 색의 차가 소정의 범위 내에 있는 경우, 제1 라벨이 부여된 패턴과 제2 라벨이 부여된 패턴을 동일 그룹으로 분류하는 스텝을 구비하는 것을 특징으로 하는 패턴 추출 방법.
  52. 컬러 화상의 주목 화소의 색 정보에 따라서 정해지는 임계치를 설정하는 기능과,
    인접하는 화소의 색 정보를 비교하여 그 거리가 상기 임계치 이내일 때 동일 라벨을 부여하는 기능을 실행하는 프로그램을 저장한 컴퓨터 판독 가능한 기억 매체.
  53. 입력 화상 내의 패턴에 대한 색 정보를 산출하는 기능과,
    상기 패턴에 대한 기하학 정보를 산출하는 기능과,
    상기 색 정보 및 상기 기하학 정보에 기초하여 상기 패턴의 분류를 행하는 기능을 실행하는 프로그램을 저장한 컴퓨터 판독 가능한 기억 매체.
  54. 제1 해상도로 동일색으로 판별되는 영역의 색의 차이를 제2 해상도로 검출하는 기능과,
    상기 제2 해상도로 검출된 색의 차이에 기초하여 동일색인지의 여부를 판별하는 임계치를 설정하는 기능과,
    상기 임계치에 기초하여 상기 제1 해상도로 동일색으로 판별되는 영역을 추출하는 기능을 실행하는 프로그램을 저장한 컴퓨터 판독 가능한 기억 매체.
KR10-1999-0002796A 1998-02-06 1999-01-28 컬러 화상 처리 장치 및 패턴 추출 장치 KR100525692B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2541998 1998-02-06
JP1998-025419 1998-02-06
JP1998-146420 1998-05-27
JP14642098A JP3748164B2 (ja) 1998-02-06 1998-05-27 パターン抽出装置

Publications (2)

Publication Number Publication Date
KR19990072314A true KR19990072314A (ko) 1999-09-27
KR100525692B1 KR100525692B1 (ko) 2005-11-03

Family

ID=26363018

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-1999-0002796A KR100525692B1 (ko) 1998-02-06 1999-01-28 컬러 화상 처리 장치 및 패턴 추출 장치

Country Status (5)

Country Link
US (2) US6701010B1 (ko)
EP (1) EP0935216A3 (ko)
JP (1) JP3748164B2 (ko)
KR (1) KR100525692B1 (ko)
CN (2) CN1136516C (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100539943B1 (ko) * 1999-05-04 2005-12-28 삼성전자주식회사 디지털 텔레비젼 수신기에서 고화질 비디오 이미지 축소처리방법

Families Citing this family (84)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6707572B1 (en) * 1997-09-12 2004-03-16 Tesseron, Ltd. Filtering method to reduce pixel density
US6304339B1 (en) * 1998-11-16 2001-10-16 Hewlett-Packard Company Compound document page data processing
US20020001096A1 (en) * 2000-04-28 2002-01-03 Kenro Hama Image processor for detecting specified pattern
JP4337251B2 (ja) 2000-09-04 2009-09-30 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体
US7899243B2 (en) 2000-11-06 2011-03-01 Evryx Technologies, Inc. Image capture and identification system and process
US8224078B2 (en) 2000-11-06 2012-07-17 Nant Holdings Ip, Llc Image capture and identification system and process
US7680324B2 (en) 2000-11-06 2010-03-16 Evryx Technologies, Inc. Use of image-derived information as search criteria for internet and other search engines
US7565008B2 (en) 2000-11-06 2009-07-21 Evryx Technologies, Inc. Data capture and identification system and process
US6972868B1 (en) 2000-11-09 2005-12-06 Hewlett-Packard Development Company, L.P. Image data compression method
WO2002087258A2 (en) * 2001-04-20 2002-10-31 Koninklijke Philips Electronics N.V. Image processing apparatus for and method of improving an image and an image display apparatus comprising the image processing apparatus
US6580824B2 (en) 2001-05-14 2003-06-17 Hewlett-Packard Development Company, L.P. Classification of photos with sepia tones
JP2003141548A (ja) 2001-10-22 2003-05-16 Ge Medical Systems Global Technology Co Llc 3次元ラベリング装置及びその方法
US7415153B2 (en) * 2002-09-20 2008-08-19 International Business Machines Corporation Color naming, color categorization and describing color composition of images
DE10261221A1 (de) * 2002-12-20 2004-07-15 Océ Document Technologies GmbH Verfahren und Vorrichtung zur Echtzeitkontrolle von Druckbildern
WO2004081887A1 (ja) * 2003-03-14 2004-09-23 Fujitsu Limited 紙葉類識別方法及び紙葉類識別装置
JP4131205B2 (ja) * 2003-07-23 2008-08-13 セイコーエプソン株式会社 画像処理装置及び画像処理をコンピュータに実行させる画像処理プログラム
JP4196782B2 (ja) * 2003-08-26 2008-12-17 セイコーエプソン株式会社 画像処理装置及び画像処理をコンピュータに実行させる画像処理プログラム
US8462244B2 (en) * 2003-08-27 2013-06-11 Hewlett-Packard Development Company, L.P. Adaptively reading one or more but fewer than all pixels of image sensor
JP4339675B2 (ja) * 2003-12-24 2009-10-07 オリンパス株式会社 グラデーション画像作成装置及びグラデーション画像作成方法
US20090046953A1 (en) * 2004-04-29 2009-02-19 Koninklijke Philips Electronics N V Image Processing Apparatus And Method
US7480417B2 (en) * 2004-10-19 2009-01-20 Microsoft Corp. System and method for encoding mosaiced image data employing a reversible color transform
US7630544B1 (en) * 2005-04-06 2009-12-08 Seiko Epson Corporation System and method for locating a character set in a digital image
US7783117B2 (en) * 2005-08-12 2010-08-24 Seiko Epson Corporation Systems and methods for generating background and foreground images for document compression
US7899258B2 (en) * 2005-08-12 2011-03-01 Seiko Epson Corporation Systems and methods to convert images into high-quality compressed documents
US7557963B2 (en) * 2005-08-12 2009-07-07 Seiko Epson Corporation Label aided copy enhancement
KR100679052B1 (ko) * 2006-01-04 2007-02-06 삼성전자주식회사 최적 선호색 편집 장치 및 방법
JP4745830B2 (ja) * 2006-01-05 2011-08-10 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP2008085695A (ja) * 2006-09-28 2008-04-10 Fujitsu Ltd 電子透かし埋め込み装置および検出装置
US8098936B2 (en) * 2007-01-12 2012-01-17 Seiko Epson Corporation Method and apparatus for detecting objects in an image
JP4872780B2 (ja) * 2007-04-25 2012-02-08 富士ゼロックス株式会社 画像処理システム及び画像処理プログラム
US7894689B2 (en) * 2007-05-31 2011-02-22 Seiko Epson Corporation Image stitching
US7873215B2 (en) * 2007-06-27 2011-01-18 Seiko Epson Corporation Precise identification of text pixels from scanned document images
US8014596B2 (en) * 2007-10-30 2011-09-06 Sharp Laboratories Of America, Inc. Methods and systems for background color extrapolation
JP4549400B2 (ja) * 2008-03-04 2010-09-22 富士通株式会社 文書認識プログラム、文書認識装置、および文書認識方法
JP4586891B2 (ja) * 2008-06-10 2010-11-24 コニカミノルタビジネステクノロジーズ株式会社 減色方法、減色処理装置、画像形成装置、およびコンピュータプログラム
JP5197239B2 (ja) * 2008-08-29 2013-05-15 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP5023036B2 (ja) * 2008-10-21 2012-09-12 大日本スクリーン製造株式会社 プロファイル生成装置、プロファイル生成プログラム、プロファイル生成方法、画像処理装置、画像処理プログラム、および画像処理方法
US20100124372A1 (en) * 2008-11-12 2010-05-20 Lockheed Martin Corporation Methods and systems for identifying/accessing color related information
US8290255B2 (en) 2009-02-06 2012-10-16 Canon Kabushiki Kaisha Image processing method, image processing apparatus, and program
JP5123870B2 (ja) 2009-02-10 2013-01-23 キヤノン株式会社 画像処理方法および画像処理装置およびプログラム
JP5173898B2 (ja) * 2009-03-11 2013-04-03 キヤノン株式会社 画像処理方法、画像処理装置、及びプログラム
JP4821869B2 (ja) * 2009-03-18 2011-11-24 富士ゼロックス株式会社 文字認識装置、画像読取装置、およびプログラム
JP5206525B2 (ja) * 2009-03-19 2013-06-12 富士ゼロックス株式会社 画像処理装置、画像読取装置、画像形成装置及びプログラム
JP5188429B2 (ja) * 2009-03-24 2013-04-24 富士重工業株式会社 環境認識装置
JP5188430B2 (ja) * 2009-03-24 2013-04-24 富士重工業株式会社 画像処理装置
TWI384427B (zh) * 2009-04-29 2013-02-01 Utechzone Co Ltd Background establishment method and device
JP2011013898A (ja) 2009-07-01 2011-01-20 Canon Inc 画像処理装置、画像処理方法、及び、プログラム
JP5276539B2 (ja) 2009-07-23 2013-08-28 キヤノン株式会社 画像処理方法および画像処理装置およびプログラム
JP5276541B2 (ja) 2009-07-27 2013-08-28 キヤノン株式会社 画像処理方法及び画像処理装置及びプログラム
JP5377148B2 (ja) * 2009-08-03 2013-12-25 キヤノン株式会社 クラスタリング処理方法、クラスタリング処理装置、およびプログラム
JP4868046B2 (ja) * 2009-08-31 2012-02-01 カシオ計算機株式会社 画像処理装置、画像処理方法及びプログラム
US8600171B2 (en) * 2009-12-10 2013-12-03 Canon Kabushiki Kaisha Image labeling using parallel processing
JP5577763B2 (ja) * 2010-03-09 2014-08-27 富士ゼロックス株式会社 画像処理装置、画像処理システム、及び画像処理プログラム
JP5333787B2 (ja) 2010-07-20 2013-11-06 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US8600158B2 (en) 2010-11-16 2013-12-03 Hand Held Products, Inc. Method and system operative to process color image data
US8571307B2 (en) 2010-11-16 2013-10-29 Hand Held Products, Inc. Method and system operative to process monochrome image data
JP6019285B2 (ja) * 2010-11-25 2016-11-02 ソニー株式会社 電子書籍再生装置、履歴取得装置、電子書籍生成装置、電子書籍提供システム、電子書籍再生方法、履歴取得方法、電子書籍生成方法、電子書籍再生プログラム、履歴取得プログラム、電子書籍生成プログラム
JP4893861B1 (ja) * 2011-03-10 2012-03-07 オムロン株式会社 文字列検知装置、画像処理装置、文字列検知方法、制御プログラムおよび記録媒体
US9174609B2 (en) 2011-04-21 2015-11-03 Pylon Manufacturing Corp. Wiper blade with cover
WO2013021889A1 (ja) * 2011-08-05 2013-02-14 楽天株式会社 色名決定装置、色名決定方法、情報記録媒体、ならびに、プログラム
JP5974589B2 (ja) 2012-03-30 2016-08-23 ブラザー工業株式会社 画像処理装置およびプログラム
CN102663398A (zh) * 2012-03-31 2012-09-12 上海博康智能信息技术有限公司 一种彩色图像颜色特征提取方法及装置
KR20150024650A (ko) * 2013-08-27 2015-03-09 삼성전자주식회사 전자 장치에서 사운드를 시각적으로 제공하기 위한 방법 및 장치
JP6232906B2 (ja) * 2013-10-09 2017-11-22 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
KR101503213B1 (ko) 2014-04-04 2015-03-17 경주대학교 산학협력단 영상 이미지의 지리정보 및 패턴인식 기술을 이용한 시정거리 측정 장치 및 그 측정 방법
CN104021774B (zh) * 2014-05-29 2016-06-15 京东方科技集团股份有限公司 一种图像处理的方法及装置
WO2016076163A1 (ja) * 2014-11-14 2016-05-19 コニカミノルタ株式会社 測色装置および測色方法
JP5992567B1 (ja) * 2015-03-20 2016-09-14 株式会社Pfu 日付識別装置
CN105430218B (zh) * 2015-11-27 2018-07-24 优渊商贸(上海)有限公司 图像色彩识别方法及装置
CN106897965B (zh) * 2015-12-14 2020-04-28 国基电子(上海)有限公司 彩色图像处理系统及彩色图像处理方法
US20170178341A1 (en) * 2015-12-21 2017-06-22 Uti Limited Partnership Single Parameter Segmentation of Images
WO2017138088A1 (ja) * 2016-02-09 2017-08-17 楽天株式会社 色分類装置、色分類方法、プログラム、ならびに、非一時的なコンピュータ読取可能な情報記録媒体
CN109690625A (zh) * 2016-05-03 2019-04-26 莱尼电缆有限公司 用于操作员增强查看的采用颜色分段的视觉系统
CN107346580B (zh) * 2016-05-05 2019-11-05 腾讯科技(深圳)有限公司 票据信息识别方法及装置
JP6516103B2 (ja) * 2016-06-16 2019-05-22 京セラドキュメントソリューションズ株式会社 画像処理装置、画像処理方法及び画像処理プログラム
US10140728B1 (en) * 2016-08-11 2018-11-27 Citrix Systems, Inc. Encoder with image filtering and associated methods
CN107784301B (zh) * 2016-08-31 2021-06-11 百度在线网络技术(北京)有限公司 用于识别图像中文字区域的方法和装置
TWI616843B (zh) * 2016-09-12 2018-03-01 粉迷科技股份有限公司 動態影像去背方法、系統與電腦可讀取儲存裝置
CN108269260B (zh) * 2016-12-30 2021-08-27 粉迷科技股份有限公司 动态影像去背方法、系统与计算机可读取存储装置
KR101979879B1 (ko) * 2017-12-12 2019-05-17 현대건설(주) 항공 사진 측량 결과 후처리 장치 및 방법
CN110378927B (zh) * 2019-04-29 2022-01-04 北京佳讯飞鸿电气股份有限公司 一种基于肤色的目标检测与跟踪方法
CN110619331A (zh) * 2019-09-20 2019-12-27 江苏鸿信系统集成有限公司 一种基于颜色距离的彩色影像字段定位方法
CN111768469A (zh) * 2019-11-13 2020-10-13 中国传媒大学 一种基于图像聚类的数据可视化配色的提取方法
CN115623120B (zh) * 2021-07-13 2024-02-06 海信视像科技股份有限公司 叠屏显示设备和图像显示清晰度的调整方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3310802A1 (de) * 1983-03-22 1984-10-04 Klaus Priv.-Doz. Dr. 1000 Berlin Richter Verfahren und vorrichtung zur herstellung von farbbildern aus teilbildern
US4958217A (en) * 1986-02-27 1990-09-18 Canon Kabushiki Kaisha Image processing apparatus and method capable of extracting a particular image area using either hue or brightness
EP0461817A3 (en) * 1990-06-15 1993-11-18 American Telephone & Telegraph Image segmenting apparatus and methods
JPH05298443A (ja) 1992-04-20 1993-11-12 Takaoka Electric Mfg Co Ltd カラー画像領域抽出装置
JPH06103371A (ja) 1992-09-18 1994-04-15 Daikin Ind Ltd カラー画像処理方法およびその装置
JPH06162180A (ja) 1992-11-25 1994-06-10 Fujitsu Ltd 領域抽出方式
US5454070A (en) * 1993-01-15 1995-09-26 Canon Kabushiki Kaisha Pixel to spline based region conversion method
US5572600A (en) 1993-06-22 1996-11-05 Nec Corporation Color image processing apparatus capable of suppressing moire
JPH0721379A (ja) 1993-06-22 1995-01-24 Matsushita Electric Ind Co Ltd 画像色領域認識装置
EP1158453B1 (en) * 1993-12-10 2008-08-27 Ricoh Company, Ltd. Image extraction method and apparatus, and image recognition method and apparatus, for extracting/recognizing specific image from input image signal
JPH08167028A (ja) 1994-12-13 1996-06-25 Toppan Printing Co Ltd 画像処理方法
JP3624013B2 (ja) 1995-06-08 2005-02-23 キヤノン株式会社 画像処理方法及び装置
JPH08202878A (ja) 1995-01-27 1996-08-09 Advantest Corp 画像処理装置
EP0730248A1 (en) 1995-03-01 1996-09-04 Hewlett-Packard Company Method and system for interlaced printing
JPH08339421A (ja) 1995-06-13 1996-12-24 Kobe Steel Ltd 画像の文字領域決定方法
US6317220B1 (en) * 1996-12-06 2001-11-13 Seiko Epson Corporation Image forming apparatus capable of preventing linear nonuniformity and improving image quality
JP3189870B2 (ja) * 1996-12-24 2001-07-16 シャープ株式会社 画像処理装置
US5767978A (en) * 1997-01-21 1998-06-16 Xerox Corporation Image segmentation system
KR100239357B1 (ko) * 1997-04-17 2000-01-15 구자홍 영상 표시 장치의 문자 처리 방법 및 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100539943B1 (ko) * 1999-05-04 2005-12-28 삼성전자주식회사 디지털 텔레비젼 수신기에서 고화질 비디오 이미지 축소처리방법

Also Published As

Publication number Publication date
KR100525692B1 (ko) 2005-11-03
CN1291352C (zh) 2006-12-20
US6990235B2 (en) 2006-01-24
JPH11288465A (ja) 1999-10-19
US20040165773A1 (en) 2004-08-26
EP0935216A3 (en) 2003-01-02
CN1234569A (zh) 1999-11-10
US6701010B1 (en) 2004-03-02
CN1516073A (zh) 2004-07-28
JP3748164B2 (ja) 2006-02-22
CN1136516C (zh) 2004-01-28
EP0935216A2 (en) 1999-08-11

Similar Documents

Publication Publication Date Title
KR100525692B1 (ko) 컬러 화상 처리 장치 및 패턴 추출 장치
JP3748172B2 (ja) 画像処理装置
JP2951814B2 (ja) 画像抽出方式
EP1091320A2 (en) Processing multiple digital images
Türkyılmaz et al. License plate recognition system using artificial neural networks
EP1081648B1 (en) Method for processing a digital image
JP2002024836A (ja) ディジタルイメージから表題を抽出する方法
JP2005518722A (ja) デジタル画像における赤目特徴の検出および補正
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
JP3851742B2 (ja) 帳票処理方法及び装置
JP4149464B2 (ja) 画像処理装置
JP3228938B2 (ja) 分布マップを用いる画像の分類方法及び装置
JP2002288589A (ja) 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4275866B2 (ja) カラー画像から文字列パターンを抽出する装置および方法
JP4062987B2 (ja) 画像の領域分割方法、画像の領域分割装置、画像の領域分割プログラム
JP4211941B2 (ja) パターン抽出装置
JP3606500B2 (ja) 矩形分類方法
US20050271260A1 (en) Device, method and program for removing pores
JP5929282B2 (ja) 画像処理装置及び画像処理プログラム
CN102682308B (zh) 图像处理方法和图像处理设备
JP4228592B2 (ja) 文字認識装置
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
JP2006065581A (ja) 文字・図形の認識方法および検査方法
JP2003271973A (ja) 画像処理方法および画像処理プログラム
US20080187229A1 (en) Method For Recognizing and Indexing Digital Media

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B601 Maintenance of original decision after re-examination before a trial
J301 Trial decision

Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20030723

Effective date: 20050719

S901 Examination by remand of revocation
GRNO Decision to grant (after opposition)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121002

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20131001

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee