KR0152695B1 - 이미지 처리 장치 및 방법, 라우팅 정보 추출 장치 및 소화물 분류방법 - Google Patents

이미지 처리 장치 및 방법, 라우팅 정보 추출 장치 및 소화물 분류방법

Info

Publication number
KR0152695B1
KR0152695B1 KR1019950002647A KR19950002647A KR0152695B1 KR 0152695 B1 KR0152695 B1 KR 0152695B1 KR 1019950002647 A KR1019950002647 A KR 1019950002647A KR 19950002647 A KR19950002647 A KR 19950002647A KR 0152695 B1 KR0152695 B1 KR 0152695B1
Authority
KR
South Korea
Prior art keywords
pixel
label
pixels
image
package
Prior art date
Application number
KR1019950002647A
Other languages
English (en)
Inventor
즈로트닉 아비아드
좀머 지바
Original Assignee
윌리암 티. 엘리스
인터내셔널 비지네스 머신즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from SG1995000583A external-priority patent/SG45100A1/en
Application filed by 윌리암 티. 엘리스, 인터내셔널 비지네스 머신즈 코포레이션 filed Critical 윌리암 티. 엘리스
Application granted granted Critical
Publication of KR0152695B1 publication Critical patent/KR0152695B1/ko

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B07SEPARATING SOLIDS FROM SOLIDS; SORTING
    • B07CPOSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
    • B07C3/00Sorting according to destination
    • B07C3/10Apparatus characterised by the means used for detection ofthe destination
    • B07C3/14Apparatus characterised by the means used for detection ofthe destination using light-responsive detecting means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document
    • G06V30/424Postal images, e.g. labels or addresses on parcels or postal envelopes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

본 발명은 열 및 행으로 배열된 화소들로 구성된 소화물 이미지를 디지탈 형태로 생성 및 저장하는 수단과 화소의 색상에 근거하여 각각의 화소를 레이블 화소(label pixel), 배경화소(background pixel) 또는 레이블도 배경도 아닌 화소로서 분류하는 분류 로직 수단(classification logic)과, 각각의 화소를 이 화소의 원래의 분류 및 그 화소의 이웃 화소의 분류에 근거하여 레이블 화소 또는 배경화소로서 재분류하는 분할 로직 수단(segmentation logic)과, 모든 화소들이 레이블 화소로서 분류된 영역의 경계를 식별하는 식별 로직 수단(identification logic)을 포함하는 소화물 이미지상의 레이블의 위치를 알아내는 이미지 처리 장치에 관한 것이다.

Description

이미지 처리 장치 및 방법, 라우팅 정보 추출 장치 및 소화물 분류 방법
제1도는 선적 레이블 분석 시스템을 전체적으로 도시한 도면.
제2도는 이미지 처리 장치이 개략도.
제3a,3b,3c도는 저 해상도 소화물의 이미지를 예시한 도면.
* 도면의 주요부분에 대한 부호의 설명
100 : 컨베이어 시스템 110 : 컴퓨터
120 : OCR 서브시스템 130 : 도입 컨베이어
140 : 처리 컨베이어 150 : 일직선 엣지
160,170 : 이미지 포착 스테이션 180 : 프로그램 가능한 로직 제어기
190 : 갭 포토아이 200 : 표준 TV 카메라
210 : 스트로브 전구 220 : 표준 2048 요소 라인 스캐너
230 : 광원
본 발명은 컴퓨터를 이용하여 우편물을 분류하는 방안(computerized mail sor ting)에 관한 것으로서, 특히, 소화물의 디지탈 이미지(digitized images of parcel) 상의 레이블(labels)을 식별하여 그 위치를 알아내는 이미지 처리 방법 및 장치에 관한 것이다.
소화물의 우편량이 증가함에 따라, 전세계의 우체국 및 운송 분야에서 소화물의 자동 분류 방안의 중요성이 점차 더해가고 있다.
일반적으로, 소화물을 자동적으로 분류하기 위해서는 소화물의 디지탈 이미지를 포착(capture)하고 이 이미지로부터 목적지 주소와 같은 라우팅 정보(routing information)를 추출하는 것이 필요하다. 이러한 라우팅 정보는 절적한 장치를 이용하여 소화물을 적절하게 분류하거나, 혹은 예를 들어, 소화물상에 인쇄되고 차후의 분류 공정에서 사용되는 바 코드(bar code)를 생성하는 데 이용될 수 있다.
그렇지만, 레이블은 소화물상의 어느 곳이든지 위치될 수 있으므로, 소화물의 디지탈 이미지내에 어디에나 위치될 수 있다. 일반적으로, 광학 문자 판독기(optical character reader : OCR) 기술은 레이블의 고 해상도 이미지로부터 라우팅 정보를 추출하는 데 사용된다. 이러한 기술을 효과적으로 이용하면서 소화물의 이미지 전체를 처리하지 않도록 하기 위해, 소화물 이미지상의 레이블의 위치를 파악하는 것이 필요하다. 일단 레이블의 위치가 파악되면, 레이블에 대응하는 이미지 부분만 처리하는 것이 필요하다.
독일 공개공보 제3,942,932호에는 이미지 특징부 선택시 패키지상의 주소 스티커(address sticker) 또는 주소 영역(address region)의 모델과 일치하는 영역에 대한 이미지를 검사하므로서 거친 스캐닝 동작(rough scanning operation)을 이용하여 생성된 소화물 이미지의 분류 정보(sorting information)를 자동적으로 검출하는 시스템이 개시되어 있다. 이러한 유형의 특징들은 색상콘트라스트(colour contrast) 또는 그레이 값 콘트라스트(grey value contrast)를 포함하는 것으로 제시되고 있다.
본 발명의 목적은 소화물 이미지의 주소 레이블의 위치를 알아내는 이미지 처리 장치를 제공하는데 있다.
이러한 레이블을 검출하기 위해서는 다음과 같이 두가지 문제점들을 해결해야 한다. 첫번째 문제는 요구된 속도를 성취하는 것이 매우 어렵다는 점이다. 이미지 처리는 현행 기술을 이용하여 실시간적으로 수행되어야 한다. 두번째 문제점은 이미지 데이타가 이상적이지 않다는 점이다. 즉, 레이블은 오염에 의해 더럽혀질 수도 있고, 레이블이 투명하면 레이블은 소화물의 배경(parcel background)에 의해 전와(corrupt)될 수도 있고, 문자는 레이블 위에 나타날 수도 있고 소화물 위에서도 나타날 수 있다. 또한, 레이블은 소화물 위의 어디든지 나타날 수도 있다.
전술한 문제들을 해결하기 위해, 본 발명은 소화물 이미지상의 레이블의 위치를 알아내는 이미지 처리 장치를 제공하며, 이러한 이미지 처리장치는 소화물의 이미지를 디지탈 형태로 생성 및 저장하는 수단과(소화물의 이미지는 열과 행(rows and colu mns)으로 배열된 화소를 포함한다), 각각의 화소를 화소의 색상에 근거하여 레이블 화소(label pixel), 배경화소(background pixel) 또는 레이블도 배경도 아닌 화소로서 분류 로직 수단(classification logic)과, 전술한 화소의 원래의 분류와 이웃 화소의 분류에 근거하여 화소를 레이블 화소 또는 배경 화소로서 재분류(reclassify)하는 분할 로직 수단(segmentation logic)과, 화소의 재분류로부터 이미지의 레이블 영역을 식별하는 수단을 포함한다.
본 발명은 거의 모든 소화물이 백색 레이블에 흑색 문자(text)를 가지며, 어떠한 소화물도 백색 레이블만큼 백색의 띄지 않는다는 발명자의 관찰에 근거한 것이다. 따라서, 색상 정보는 소화물 배경으로부터 레이블을 분리시키는데 사용될 수 있다.
먼저, 화소는 레이블, 배경, 또는 레이블도 배경도 아닌 것으로서 분류된다. 전형적으로, 배경도 아니고 레이블도 아닌 것으로 분류된 화소는 레이블 또는 소화물 몸체상의 문자이거나, 혹은 오염으로 인해 야기된 화소일 수 있다. 그후, 분할 기법(segmentation technique)을 사용하여 화소의 내용(context)에 근거하여 화소를 레이블 또는 배경 화소로 재분류한다. 분할 기법은 예를 들어, 문자의 공지의 특징들을 이용한다. 즉, 예를 들면, 문자에 대응하는 화소가 이미지에서 수평 또는 수직으로 길지 않게 나타나는 사실을 이용한다. 또한, 분할 로직 수단은 레이블의 화소가 비교적 길게 발생되고 레이블내에서 배경 화소가 발생될 가능성이 거의 없다는 사실을 이용한다.
하나의 실시예에 있어서, 분류 로직 수단은 백색 화소들을 레이블 화소로서 분류하고, 흑색 화소를 레이블 화소도 배경 화소도 아닌 화소로서 분류하고, 다른 모든 화소들을 배경 화소로서 분류한다. 그렇지만, 다른 방안도 가능하다. 예를 들어, 사전설정된 특정한 색상의 레이블을 이용하는 방안도 고려될 수 있다. 이 경우, 전술한 장치는 소화물 이미지로부터 특정한 색상의 레이블을 식별하여 그 위치를 파악할 수 있어야 한다. 또한, 둘 이상의 색상의 화소들을 모두 레이블 화소로서 분류하는 방안도 가능하다.
또한, 본 발명은 차후에 소화물을 분류하는데 사용하기 위해 소화물로투버 라우팅 정보를 추출하는 장치를 제공하며, 이 장치는 소화물 이미지를 포착하는 카메라와, 카메라를 통과하여 소화물을 운반하는 수단과, 전술한 이미지 처리 장치와, 모든 화소가 레이블 화소로서 분류된 영역의 위치를 이용하여 소화물 레이블의 이미지를 생성하는 수단과, 레이블 이미지로부터 라우팅 정보를 추출하는 수단을 포함한다.
본 발명의 다른 실시예에 있어서, 본 발명은 소화물 이미지상에서 레이블의 위치를 알아내는 이미지 처리 방법을 제공하며, 이 방법은.
(a) 열과 행으로 배열된 화소로 구성된 소화물 이미지를 디지탈 형태로 생성 및 저장하는 단계와.
(b) 화소의 색상에 근거하여 각각의 화소를 레이블 화소, 배경 화소, 또는 레이블도 배경도 아닌 화소로서 분류하는 단계와.
(c) 이 화소의 원래의 분류 및 이 화소의 이웃 화소의 분류에 근거하여, 각각의 화소를 레이블 또는 배경 화소로서 재분류하는 단계와.
(d) 화소의 재분류에 근거하여 소화물 이미지의 레이블 영역을 식별하는 단계를 포함한다.
또한, 본 발명은 전술한 단계들을 포함하는 소화물 분류 방법도 제공한다.
이하, 본 발명의 실시예를 첨부한 도면을 참조하여 설명할 것이다.
본 발명은 이미지 포착, 이미지 처리 및 광학 문자 인식(OCR) 기술을 사용하여 소화물상의 레이블로부터 선적 정보(shipping information)를 추출하는 선적 레이블 분석 시스템(shipping label translation system)에서 구현된다.
제1도는 본 발명의 시스템을 도시한 것으로서.
(a) 저 해상도 및 고 해상도 이미지 포착 스테이션(image capture station)(160 및 170)을 갖는 컨베이어 시스템(conveyor system)(100)과.
(b) 사용자 인터페이스(user interface), 전체 시스템 제어 및 이미지 처리기능을 제공하는 적절한 프로그램의 제어에 따라 동작하는 컴퓨터(110)와.
(c) OCR 서브시스템(subsystem)(120)과.
(d) 컴퓨터(110)가 컨베이어 및 이미지 포착 카메라의 기능을 제어할 수 있도록 하는 프로그램가능한 로직 제어기(programmable logic controller : PLC)(180)와 같은 주요 구성요소를 포함한다.
제1도에 도시된 데이타 흐름 및 주요 구성요소는 이하 기술되는 패키지(packages) 처리에 대한 설명을 통해 개시될 것이다.
선적 레이블 해석 시스템의 컨베이어 시스템(100)은 두개의 분리된 컨베이어 모듈, 즉, 도입 컨베이어(induction conveyor)(130) 및 처리 컨베이어(process conveyor)(140)로 구성된다.
도입 컨베이어(130)는 패키지를 시스템으로 로딩(loading)시킨다.
패키지는 컨베이어 벨트의 하방으로 이동할 때 정렬 에지(150)를 따라 컨베이어의 일측으로 기울어지게 된다(skewed). 이것은 패키지가 시스템을 따라 이동할 때 패키지가 정해진 장소에 위치하도록 하기 위해서이다. 컨베이어의 일측으로 패키지가 기울어지게 하는 것은 수평면에 각진 벨트 컨베이어(angled belt conveyor)를 제공하거나 혹은 경사 벨트 컨베이어(decline belt conveyor)를 제공함으로써 성취될 수 있으며, 패키지는 중력으로 인해 컨베이어의 일측으로 이동될 것이다. 각진 수평 벨트는 제1도에 예시되어 있다.
처리 컨베이어(140)는 지속적으로 작동하는 벨트 컨베이어로서, 두개의 이미지 포착 스테이션(160 및 170)을 통해서 패키지를 운반한다.
컨베이어의 속도는 프로그램가능한 로직 제어기(PLC)(180)에 의해 제어된다. PLC(180)는 컴퓨터(110)에 접속되어 이 컴퓨터(110)의 제어에 따라 동작한다. 이러한 제어 시스템 설계(control system design)는 컴퓨터(110)에서 실행되는 제어 프로그램에 의해 제공된 옵션(options)을 통해 컨베이어 속도를 선택하는 수단을 제공한다.
보존(maintenance), 테스트(test) 등과 같은 시스템의 다른 동작 모드를 지원하기 위하여 컨베이어의 속도를 조절할 수 있어야 함을 이해할 것이다. 제어기(180)는 또한 시스템을 통해 패키지를 추적하기 위해 일련의 포토아이(photoeyes)를 감시하고, 또한 패키지의 잼(jam)을 검출한다. 제1도에 도시된 갭 포토아이(gap photoeye) (190)는 패키지들 사이의 간격에 대한 피드백을 제공하며, 컨베이어 모듈들 사이의 게이트로서 작용한다.
오퍼레이터(operator)는 컨베이어(100)상에 레이블이 부착된 소화물을 하나씩 올려 놓는다. 오퍼레이터는 레이블이 고정된 방향으로 향하도록 소화물을 돌려 놓을 필요는 없다.
본 발명은 패키지들 사이의 간격에 대한 제어를 제공하여, 고 해상도 카메라가 상이한 높이를 갖는 패키지에 대해 촛점을 조절할 수 있는 시간을 갖도록 하고, 패키지 운송 속도(package feed rate)가 시스템의 이미지 처리능력과 일치되도록 한다.
이러한 간격을 제공하기 위해 패키지 로딩 포인트(package loading point)에서 중단/시작 컨베이어 섹션(stop/start conveyor section)(130)이 사용된다. 패키지는 프로그램가능한 로직 제어기(180)를 통해 컨베이어 센서(conveyor sensors)를 감시하는 컴퓨터(110)내의 적절한 프로그램의 제어에 따라 컨베이어(130)로부터 컨베이어(140)에 일정 속도로 이동된다.
갭 메카니즘(gap mechanism)은 예를 들어, 불량 패키지를 제거하기 위해 지연이 필요할 때 패키지의 운송을 일시적으로 중단시키는데 사용될 수 있다. 오퍼레이터가 패키지를 좀더 떨어지게 배치하면 이러한 메카니즘이 배제될 수도 있지만, 이 경우 처리량이 감소되는 것을 감수해야 한다.
패키지는 컨베이어 벨트위에 고정된 높이로 장착된 표준 TV 카메라(200)가 패키지 상부면의 색상 이미지를 포착하는 스테이지(stage)를 통과한다.
스트로브 전구(strobe light)(210)를 통해 조명을 제공하여, 패키지의 이동으로 인한 흐림 현상(blur)이 발생되지 않도록 한다. 카메라 렌즈는 패키지 사이즈의 범위를 처리하기에 충분한 필드 깊이(depth of field)를 가지므로, 촛점을 제어할 필요가 없다.
TV 카메라는 컴퓨터(110)내에 공지의 비디오 포착 기관(video capture board)에 접속되고, 포착된 이미지는 컴퓨터내의 저장 장치에 디지탈 형태로 저장된다. 컴퓨터(110)내의 적절한 소프트웨어가 디지탈 형태의 저 해상도 이미지를 분석하여.
(a) 패키지의 차수 및 벨트상에서의 방향 결정하는 기능과.
(b) 레이블을 검출하는 기능과.
(c) 차후에 레이블을 부착하기 위해 패키지상의 개방 영역(open area)의 위치를 알아내는 기능을 수행한다.
TV 이미지 그 자체로부터 패키지의 높이를 판정하는 기술이 다수 존재한다. 예를 들면, 패키지의 길이는 간단한 광 센서에 의해 벨트 경로를 따라 측정되며, TV 이미지의 화소의 패키지 길이와 다를 수 있다. 즉, 패키지의 상부면이 카메라에 가까울수록 TV 이미지에서 패키지는 더욱 길게 나타난다. 이와 달리, 패키지의 높이는 예를 들면, 벨트를 가로질러 관찰하는 광전지 배열(photocell array) 혹은 TV 카메라를 포함하는 프레임의 상부에 장착된 음파 센서(sonic sensors) 등과 같은 개별 센서(discrete sensors)를 통해 판정될 수 있다.
패키지의 경계는 TV 이미지내에서 패키지와 벨트간의 색상 변화를 검출함으로써 용이하게 판정될 수 있다. 그후, 패키지 상부면의 치수 및 방향이 판정될 수 있다. 패키지의 상부면 치수와 함께 패키지의 높이 정보는 소화물을 둘러싸는 가장 작은 경계 박스(bounding box)를 계산하는데 사용된다.
소화물의 레이블은 소화물의 라우팅에 필요한 정보를 포함하고 있다. 이 정보를 용이하게 액세스하기 위해, 컴퓨터(110)는 소화물의 저 해상도 이미지로부터 레이블 위치를 검출할 수 있도록 프로그램된다.
레이블은 소화물 배경과의 색상차 분석을 통해 소화물의 저 해상도 이미지에서 그 위치가 식별된다. 본 발명의 실시예에서, 위치 및 방향 정보는 하부에서 고 해상도 이미지가 포착될 때 그 대상 영역을 정의하는데 사용된다.
본 발명의 실시예에서, 소화물은 이 시스템에 의해 초당 하나의 속도 또는 시간당 3600의 속도로 처리된다. 이러한 처리는 이미지 포착과, 레이블 검출과, 회전 검출과, 디-스큐잉(de-skewing)과, 레이블 이미지로부터의 라우팅 정보를 OCR 또는 매뉴얼적으로 추출하는 것을 포함한다. 이들 모든 동작을 완료하기 위해서는 이미지 포착 및 레이블 검출 시간이 200ms를 초과해서는 안된다.
현재 이용되는 기술을 사용하여 저렴한 비용으로 실시간 레이블을 검출하기 위해 다음과 같이 두가지 문제점을 해결하였다. 첫번째 문제는 프로세싱을 위해 이미지 데이타를 이미지 포착 기판으로부터 처리 호스트로 전송하는데 200ms이상의 시간이 소요되므로, 요구된 속도를 성취하기가 매우 어렵다는 점이다. 두번째 문제는 이미지 데이타가 이상적이지 않다는 점이다. 즉, 레이블의 백색 색상은 오염에 의해 더럽혀질 수도 있고, 레이블이 투명하면 레이블은 소화물 배경에 의해 백색 색상이 전화될 수도 있고, 레이블상의 문자의 흑색 색상은 레이블이외의 곳에서도 나타날 수도 있다. 또한, 레이블은 소화물상의 어느 곳에서든지 나타날 수 있다.
저 해상도 소화물 이미지의 처리는 다음과 같이 진행된다.
TV 카메라(200)는 640×480개의 화소 이미지를 생성한다. 이 이미지에서 매 10번째 라인이 비디오 포착 기판에서 컴퓨터 메모리로 전송되며, 전체적으로 약 50ms 정도의 시간이 소요된다. 그 결과, 적절한 시간내에 상당량의 서브샘플링된 이미지가 생성된다.
전술한 검출에 대한 문제점을 해결하기 위해, 이미지내의 매 화소(every pixel)가 레이블내에 존재하게 되는 가능성을 측정하는 함수를 발견하였다. 1차원 분할 알고리즘은 이미지의 두가지 주축 각각에 대해 적용되어 레이블과 소화물의 나머지 부분 사이를 뚜렷하게 구별한다.
이러한 기술은 이하 더욱 상세히 기술될 것이다.
서브샘플링된 소화물 이미지의 처리는 제2도에 개략적으로 도시되어 있다. 먼저, 분류(400)가 수행된다. 이미지내의 화소들은 3개의 클래스(class), 즉, 레이블 클래스, 배경 클래스 및 레이블도 배경도 아닌 클래스로서 분류된다. 다음과 같이 각각의 화소는 3개의 클래스들중 하나로 먼저 분류되며, 이웃하는 화소들은 무시된다.
(a) 레이블 유형의 화소(label type pixels) : 이들 화소는 백색 화소이다. 이들 화소는 소화물의 어느 장소에서도 나타날 수 있지만, 이들 화소는 레이블 영역내에 길게 연속적으로(수평적 및 수직적으로) 나타나는 것으로 가정한다.
(b) 레이블도 배경도 아닌 유형의 화소(neither type pixels) : 이들 화소는 흑색 화소이다. 이들 화소는 레이블 영역 및 배경 영역 모두에서 나타날 수 있지만, 이들 화소는 레이블 영역에서 수평적 또는 수직적으로, 혹은 수평 및 수직 모두로 길게 연속적으로 형성되지 않는 것으로 가정한다.
(c) 배경 유형의 화소(background type pixels) : 이들 화소는 다른 모든 화소이다. 이들 화소는 레이블내에서는 거의 나타나지 않는 것으로 가정한다.
분류(400)는 다음과 같은 두 단계로 구성된다.
(a) 색상 공간 변환(colour space transformation) :
원래의 RGB는 YUV 이미지로 변환된다. 여기서, Y는 휘도 성분(luminance component)이고, U,V는 색도 성분(chrominance components)이다. 변환 방정식은 다음과 같다.
Y = 0.299 × R + 0.587 × G + 0.114 × B
U = B - Y
V = R -Y
(b) 색상 분류 :
YUV 공간에서 회색 레벨(grey levels)은 색도 성분(U,V)의 로우값으로 지정된다. 이들 색상중에서, 백색은 휘도 성분 Y의 하이값으로 정의되고, 흑색은 로우값으로 정의된다.
각각의 화소에 대해, 색도 성분이 먼저 검사된다. 만약 이들 두개의 색도 성분중 적어도 하나가 하이이면, 화소의 색상은 회색이 아니며, 화소는 배경으로서 분류된다. 만약 이들 두개의 색도 성분이 모두 로우값을 가지면 휘도값이 검사된다. 휘도값이 하이이면, 화소의 색상은 백색이며, 화소는 레이블로서 분류된다. 휘도값이 로우이면, 화소이 색상은 흑색이며, 화소는 배경도 레이블도 아닌 유형의 화소로서 분류된다. 휘도의 중간 영역의 값을 갖는 화소들은 배경으로서 또한 분류된다.
이어서, 분할 처리(410)가 각각의 열에 대해 먼적 적용되고, 이후 각각의 행에 대해 적용된다. 이러한 분할 처리는 열/행을 레이블 영역, 배경 영역 또는 레이블도 배경도 아닌 영역으로 분할하며, 영역 측정시 제한 조건에 종속된다. 이러한 분할의 결과, 화소들은 전술한 범주로 재분류되지만, 이번에는 주위의 상황(surrounding context)이 고려되어야 한다. 제3a,3b,3c도에서, 0은 레이블(백색 화소)을 나타내고, 1은 배경화소를 나타내고, 2는 레이블도 배경도 아닌 유형의 화소를 나타낸다.
제3a도는 분할 이전의 화소 분류를 도시한 도면이다.
제3b도는 열 분할(row segmentation) 이후의 분류를 도시한 도면이다. 제3c도는 행 분할(column segmentation) 이후의 분류를 도시한 도면이다. 본 발명의 실시예에서, 분할 제한 조건(segmentation constraint)은 임의의 유형의 화소들로 구성된 연속(a run of pixels of any type)이 적어도 3개의 화소 길이 이상인 것으로 가정하였다.
이하, 본 발명의 바람직한 실시예에 사용되는 분할 로직이 기술될 것이다.
본 알고리즘은 심볼 어레이(array of symbols) A()를 프로세싱한다. 본 알고리즘은 3개의 심볼을 사용하는데, 여기서 배경 화소 및 레이블 화소(이 경우에는 백색 화소)는 각기 1 및 0 심볼로 표기되고, 배경도 레이블도 아닌 화소(이 경우에는 흑색 화소)는 *로 표기된다.
A()는 분류 프로세스에 의해 생성되고, 100% 정확하지는 않다. 분할 프로세스는 100% 정확한 화소의 분류에서 심볼은 고립하여 발생되지 않고 연속적으로 발생된다라는 가정에 의존한다.
분할 로직은 A()를 주사(scan)하여, A()에 나타나는 연속(run) 유형에 대한 3가지 가설을 보유한다. 각각의 이들 가설에는 점수가 주어지며, 가설 점수가 실험적으로 결정된 임계값보다 클 경우, 이 가설은 수용되어 출력을 생성한다.
특히, 각각의 가설은 다음의 변수들을 포함한다.
type : - 0, 1, 또는 *.
score : - 분할 결과와 A()의 데이타 사이의 정합의 품질(quality)를 나타낸다.
run-score : 최종 분할된 연속(run)과 이에 대응하는 A()의 대응하는 엘리먼트(element) 사이의 정합의 품질을 나타낸다.
increment : A()의 다음 엘리먼트가 가설 유형과 정합하면 스코어가 증가된다.
start : 가설 유형의 연속이 시작된 것으로 가정되는 A()의 인덱스.
prev_len : 이 유형의 최종 연속의 길이.
A()는 a(0) ... a(n-1)이라고 가정하자. 이 처리 과정은 다음과 같이 진행한다.
1. 초기화(initialize) :
score(0) = run_score(0) = increment(0) = start(0) = prev_len(0) = 0.
score(1) = run_score(1) = increment(1) = start(1) = prev_len(1) = 0.
score(*) = run_score(*) = increment(*) = start(*) = prev_len(*) = 0.
current_state = 2.
2. 단계3 내지 7의 모든 A() 엘리먼트에 대한 루프 :
for i in (0 ... n-1)
3. 점수 발생 및 이전의 길이 보유 :
4. 시작 포인트 갱신
5. 가설 수용(hypothesis acceptance)
6. 정규화(normalization)
7. 점수 추적(score tracking)
8. 루프의 끝(end of loop)
전술한 알고리즘에서 a(i) matches x은 a(i) = *, a(i) != current_state 및 increment(a(i)) prev_len(x) for x != a(i)인 경우를 포함한다.
본 발명의 실시예에서 수행된 매 10번째 라인에서 이미지를 서브샘플링하는 것과 다른 방법으로 이미지를 서브샘플링하는 것이 가능함을 이해하여야 한다. 또한, 예약된 레이블 유형의 화소에 따라 샘플링 밀도를 변경하는 것도 가능하다. 즉, 이러한 레이블 유형의 화소 부근에서는 높은 밀도로 샘플링하고 그밖의 다른 곳에서는 낮은 밀도로 샘플링하는 것이 가능하다.
레이블 검출 분석시 소화물의 상부면상에 특징없는 영역(featureless areas)이 부산물(by-product)로서 식별되며, 이들 영역중 하나는 레이블이 부착될 개방 영역으로 보고된다.
그후, 패키지는 표준 2048 엘리먼트 라인 스캐너(standard 2048 element line scanner)(220)를 사용하므로서 레이블 영역의 고 해상도 이미지가 포착되는 스테이지를 통과한다. 단일 라인 스캐너의 시계(field of view)는 약 10인치(2048/200 DPI)이므로, 다음과 같이 전체 패키지 폭을 커버(cover)하는 두가지 카메라, 즉 3개의 라인 스캐닝 카메라와 다중 라인 스캐닝 카메라가 제공될 수 있다.
(a) 3개의 라인 스캐닝 카메라는 제각기 벨트 폭의 1/3씩을 커버하고, 약간 중첩된 시계를 가지고, 렌즈를 제각기 구비한다. 이러한 배열에서, 후보(candidate)레이블의 수는 스캐너의 구성에 의해 제한되지 않는다. 그렇지만, 이러한 구성은 두 스캐너를 가로질러 분리된 레이블 이미지에 대해 수행되는 소프트웨어 스티칭(stitching)동작을 필요로 한다.
(b) 다중 라인 스캐닝 카메라는 후보 레이블을 포함하는 10인치 영역을 보기 위해 피봇 운동(pivot)한다. 두대의 카메라는 레이블의 위치에 관계없이 두 후보 레이블로부터의 이미지를 모두 포착할 수 있도록 보장된다. 동일한 10인치 영역내에 부가적인 후보 레이블이 또한 제공될 수 있다. 카메라가 피봇운동하면서 몇몇 예측가능한 이미지가 왜곡(distortion)될 수 있지만, 소프트웨어가 이를 보상한다.
상이한 패키지의 높이를 보상하기 위해, 어느 한 방안을 이용하여 모터에 의해 구동되는 카메라 렌즈의 촛점을 조정한다.
라인 카메라의 조명은 벨트를 가로질러 연속적인 광 스트립(continuous strip of light)(230)으로서 제공된다.
각각의 레이블의 200 DPI 4 비트의 그레이 스케일 이미지는 저 해상도 이미지로부터 획득된 레이블의 위치에 대한 지식에 근거하여 적절한 스캐너로부터 OCR 서브시스템(120)으로 전달된다.
OCR 서브시스템(120)은 고 해상도 레이블 이미지를 공지의 방법으로 처리하여 레이블에 인쇄된 문자로부터 라우팅 정보를 추출한다.
마지막으로, 라우팅 정보는 컨베이어 시스템상의 하류에 위치한 메카니즘을 사용하여 레이블을 부착하는 애플리케이션(application)으로 전달된다.
본 발명은 디지탈화된 소화물 이미지상의 레이블을 식별하여 그 위치를 알아내는 이미지 처리 장치가 구비된 컴퓨터화된 소화물 분류 장치 분야에 적용될 수 있다.
본 발명은 전술한 실시예로 기술되었지만, 본 발명은 전술한 실시예로 한정되는 것은 아니며, 그 요지를 이탈하지 않는 범위내에서 여러가지로 변경될 수 있음을 이해할 것이다.

Claims (9)

  1. 소화물 이미지(images of parcels)상의 레이블(labels)의 위치를 알아내는 이미지 처리장치(image processing appratus)에 있어서. ① 열 및 행으로 배치된 화소(pixels)를 포함하는 소화물 이미지를 디지탈 형태로 생성 및 저장하는 수단(240)과. ② 상기 화소의 색상에 근거하여, 각각의 화소를 레이블 화소(label pixel), 배경 화소(background pixel) 또는 레이블도 배경도 아닌 화소로서 분류하는 분류 로직 수단(classification logic)(400)과. ③ 각각의 화소를 이 화소의 원래의 분류(original classification) 및 이 화소의 이웃 화소의 분류에 근거하여, 레이블 화소 또는 배경 화소로서 재분류(reclassify)하는 분할 로직 수단(segmentation logic)(410)과. ④ 상기 화소의 재분류에 근거하여 상기 소화물 이미지의 레이블 영역을 식별하는 수단을 포함하는 이미지 처리장치.
  2. 제1항에 있어서. 상기 분할 로직 수단은 동일하게 분류되어야 하는 화소들의 선형 배열(a linear array of pixels)에서 화소의 연속(runs of pixels)을 식별하고, 상기 화소들의 분류에 근거하여 상기 연속적인 모든 화소가 레이블 화소로서 분류되는지 혹은 배경 화소로서 분류되는지의 여부를 판정하고, 분류되지 않은 상기 연속적인 화소들을 레이블 화소 혹은 배경 화소로서 재분류(reclassify)하도록 배열되는 이미지 처리 장치.
  3. 제2항에 있어서. 상기 분할 로직 수단(410)은 이미지를 행 단위(row by row)로 먼저 처리하고 이후에 열 단위(column by column)로 처리하도록 배열되거나, 혹은 이미지를 열 단위로 먼저 처리하고 이후에 행 단위로 처리하도록 배열되는 이미지 처리 장치.
  4. 제1항 내지 제3항에 있어서. 상기 분류 로직 수단(400)은 백색 화소(white pixels)를 레이블 화소로서 분류하고, 흑색 화소(black pixels)를 레이블 화소도 아니고 배경 화소도 아닌 화소로서 분류하고, 다른 모든 화소를 배경 화소로서 분류하도록 배열되는 이미지 처리 장치.
  5. 제1항 내지 제3항에 있어서. 상기 이미지를 포착(capture)하는 카메라(200)를 포함하는 이미지 처리 장치.
  6. 제5항에 있어서. 상기 카메라에 의해 포착된 이미지를 서브샘플링(subsampling)하는 수단을 포함하는 이미지 처리 장치.
  7. 차후에 소화물을 분류하는데 사용하기 위해 상기 소화물로부터 라우팅 정보(routing inforamtion)를 추출하는 장치에 있어서. ① 소화물 이미지를 포착하는 카메라(200)와. ② 상기 소화물을 상기 카메라를 통과하여 운반하는 수단(100)과. ③ 청구항 1 내지 8항중 어느 한 항에서 청구된 이미지 처리 장치와. ④ 모든 화소들이 레이블 화소로서 분류된 영역의 위치를 이용하여 상기 소화물 레이블의 이미지를 생성하는 수단(220)과. ⑤ 상기 레이블 이미지로부터 라우팅 정보를 추출하는 수단을 포함하는 라우팅 정보 추출 장치.
  8. 소화물 이미지상의 레이블의 위치를 알아내는 이미지 처리 방법에 있어서. ① 열 및 행으로 배열된 화소를 포함하는 상기 소화물 이미지를 디지탈 형태로 생성 및 저장하는 단계와. ② 상기 화소의 색상에 근거하여, 각각의 화소를 레이블 화소, 배경 화소 또는 레이블도 배경도 아닌 화소로서 분류하는 단계와. ③ 각각의 화소를 이 화소의 원래의 분류 및 이 화소의 이웃 화소의 분류에 근거하여, 레이블 화소 또는 배경 화소로서 재분류하는 단계와. ④ 상기 화소의 재분류에 근거하여 상기 이미지의 레이블 영역(label regions)을 식별하는 단계를 포함하는 이미지 처리 방법.
  9. 소화물을 분류(sort)하는 방법에 있어서. 소화물을 카메라를 통과하여 운반하는 단계와. 청구항 8에 청구된 바와 같은 방법을 이용하여 상기 소화물의 이미지상의 레이블 위치를 알아내는 단계와. 상기 레이블 영역의 위치를 이용하여 상기 소화물 레이블의 이미지를 생성하는 단계와. 상기 레이블의 이미지로부터 라우팅 정보를 추출하는 단계와. 상기 라우팅 정보를 이용하여 상기 소화물을 분류하는 단계를 포함하는 소화물 분류 방법.
KR1019950002647A 1994-03-07 1995-02-14 이미지 처리 장치 및 방법, 라우팅 정보 추출 장치 및 소화물 분류방법 KR0152695B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
BR9408547A BR9408547A (pt) 1994-03-07 1994-03-07 Aparelho e método para extrair informaçÕes de encaminhamento a partir de embrulho para uso subsequente na triagem dos embrulhos que compreendem aparelho e método de processamento de imagens para localizar rótulos em imagens de embrulho
SG1995000583A SG45100A1 (en) 1994-03-07 1994-03-07 Improvements in image processing
PCT/EP1994/000667 WO1995024278A1 (en) 1994-03-07 1994-03-07 Improvements in image processing
EP94/00667 1994-03-07

Publications (1)

Publication Number Publication Date
KR0152695B1 true KR0152695B1 (ko) 1998-10-15

Family

ID=27160116

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950002647A KR0152695B1 (ko) 1994-03-07 1995-02-14 이미지 처리 장치 및 방법, 라우팅 정보 추출 장치 및 소화물 분류방법

Country Status (6)

Country Link
EP (1) EP0749362B1 (ko)
KR (1) KR0152695B1 (ko)
CN (2) CN1052322C (ko)
BR (1) BR9408547A (ko)
DE (1) DE69421293T2 (ko)
WO (1) WO1995024278A1 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100207426B1 (ko) * 1996-05-08 1999-07-15 전주범 무늬의 크기와 방향성을 이용한 텍스쳐 분류 장치
US6292582B1 (en) * 1996-05-31 2001-09-18 Lin Youling Method and system for identifying defects in a semiconductor
JP4077919B2 (ja) * 1998-01-30 2008-04-23 キヤノン株式会社 画像処理方法及び装置及びその記憶媒体
US6343139B1 (en) * 1999-03-12 2002-01-29 International Business Machines Corporation Fast location of address blocks on gray-scale images
DE10017081A1 (de) * 2000-04-06 2001-10-11 Cgk Comp Ges Konstanz Mbh Verfahren und Vorrichtung zur automatischen Zeichenerkennung
CN1270834C (zh) * 2001-01-18 2006-08-23 联邦快递公司 对包裹上的信息进行读取和解码的方法及系统
US7111787B2 (en) 2001-05-15 2006-09-26 Hand Held Products, Inc. Multimode image capturing and decoding optical reader
US6834807B2 (en) 2001-07-13 2004-12-28 Hand Held Products, Inc. Optical reader having a color imager
JP4251312B2 (ja) * 2002-03-08 2009-04-08 日本電気株式会社 画像入力装置
US7637430B2 (en) 2003-05-12 2009-12-29 Hand Held Products, Inc. Picture taking optical reader
US7293712B2 (en) 2004-10-05 2007-11-13 Hand Held Products, Inc. System and method to automatically discriminate between a signature and a dataform
WO2019003686A1 (ja) 2017-06-30 2019-01-03 パナソニックIpマネジメント株式会社 荷物認識装置、荷物仕分けシステムおよび荷物認識方法
CN115512231B (zh) * 2022-11-15 2023-02-28 山东省国土空间数据和遥感技术研究院(山东省海域动态监视监测中心) 适用于国土空间生态修复的遥感解译方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4782238A (en) * 1987-10-20 1988-11-01 Eastman Kodak Company Apparatus for generating edge position signals for use in locating an address element on a mailpiece
DE3942932A1 (de) * 1989-12-23 1991-06-27 Licentia Gmbh Verfahren zum verteilen von paketen o. ae.

Also Published As

Publication number Publication date
EP0749362A1 (en) 1996-12-27
CN1254901A (zh) 2000-05-31
CN1052322C (zh) 2000-05-10
BR9408547A (pt) 1997-08-19
DE69421293T2 (de) 2000-04-13
WO1995024278A1 (en) 1995-09-14
CN1115064A (zh) 1996-01-17
CN1151467C (zh) 2004-05-26
EP0749362B1 (en) 1999-10-20
JPH10509089A (ja) 1998-09-08
DE69421293D1 (de) 1999-11-25

Similar Documents

Publication Publication Date Title
US5737438A (en) Image processing
CA2231450C (en) System and method for reading package information
KR0152695B1 (ko) 이미지 처리 장치 및 방법, 라우팅 정보 추출 장치 및 소화물 분류방법
US5642442A (en) Method for locating the position and orientation of a fiduciary mark
EP0723247B1 (en) Document image assessment system and method
JP2713911B2 (ja) 郵便物処理装置
US7004393B2 (en) Method and apparatus for processing and determining the orientation of documents
US6014450A (en) Method and apparatus for address block location
CZ278655B6 (en) Process of distributing parcels, and apparatus for making the same
US20060269102A1 (en) Method and apparatus for detecting doubles in a singulated stream of flat articles
JPH09131573A (ja) イメージ記録システム、同システムによる宛名自動認識方法及びカラーピクチャーセグメンテーション方法
US6934413B2 (en) Segmentation of text lines in digitized images
EP1371424B1 (en) Optically-guided indicia reader system
IL98293A (en) A method for distinguishing between text and graphics
JP3028510B2 (ja) 画像処理装置,小包から経路指定情報を抽出するための装置,画像処理方法及び小包仕分けの方法
KR100586312B1 (ko) 우편물 분류 방법 및 시스템
US20230370724A1 (en) Recording and brightness adjustment of an image
JPH06111060A (ja) 光学的文字読取装置
JPH06201346A (ja) 銘柄識別装置
Appleby Array processor speeds postcode reading
Linneberg et al. Detecting danger labels with ram based neural networks
JP2001312695A (ja) ラベル領域検出装置、ラベル領域検出方法及び記録媒体
JPH04181392A (ja) 光学的文字読取装置
JPS61238379A (ja) 区分装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110502

Year of fee payment: 14

LAPS Lapse due to unpaid annual fee