KR100536509B1 - 우편물에 대한 분배 정보를 인식하기 위한 방법 및 장치 - Google Patents

우편물에 대한 분배 정보를 인식하기 위한 방법 및 장치 Download PDF

Info

Publication number
KR100536509B1
KR100536509B1 KR10-2000-7003270A KR20007003270A KR100536509B1 KR 100536509 B1 KR100536509 B1 KR 100536509B1 KR 20007003270 A KR20007003270 A KR 20007003270A KR 100536509 B1 KR100536509 B1 KR 100536509B1
Authority
KR
South Korea
Prior art keywords
ocr
distribution information
video encoding
characters
mail
Prior art date
Application number
KR10-2000-7003270A
Other languages
English (en)
Other versions
KR20010030737A (ko
Inventor
발터 로젠바움
Original Assignee
지멘스 악티엔게젤샤프트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 지멘스 악티엔게젤샤프트 filed Critical 지멘스 악티엔게젤샤프트
Publication of KR20010030737A publication Critical patent/KR20010030737A/ko
Application granted granted Critical
Publication of KR100536509B1 publication Critical patent/KR100536509B1/ko

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B07SEPARATING SOLIDS FROM SOLIDS; SORTING
    • B07CPOSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
    • B07C3/00Sorting according to destination
    • B07C3/20Arrangements for facilitating the visual reading of addresses, e.g. display arrangements coding stations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/987Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Sorting Of Articles (AREA)

Abstract

본 발명은 비디오 부호화 영역(40)을 이용해 우편물에 대한 분배 정보를 인식하기 위한 방법 및 장치에 관한 것이며, OCR-유닛(100)에서 분배 정보들의 자동적인 평가 후에 그 내용이 불명확한 경우, 상기 분배 정보들을 포함하는 우편물 겉면의 화상이 기록되고 디지탈화되며 저장되어 비디오 부호화 영역에 전달된다. 이 때, 언어 입력 유닛(60, 70)을 이용해 적어도 이름이 입력된다. 그 다음에, 언어 인식 후보들이 상기 자동적인 OCR-평가의 불명확한 결과에 기초해서 선택된다(120). 이와 같은 과정은, 개별적으로 검출된 문자의 수를 비교하거나 또는 신뢰도를 고려하여 상기 OCR-유닛에서 검출된 문자와 상기 후보 문자의 위치를 비교함으로써 이루어진다.

Description

우편물에 대한 분배 정보를 인식하기 위한 방법 및 장치 {METHOD AND DEVICE FOR RECOGNITION OF DELIVERY DATA ON MAIL MATTER}
본 발명은 독립항들의 전제부에 따른 방법 및 장치에 관한 것으로, 특히 비알파벳 문자로 기록된 우편물에 대한 분배 정보를 인식하는 데 매우 바람직하게 사용될 수 있다.
분배 정보들, 특히 주소를 자동 판독하기 위한 시스템(OCR)은 편지 처리 분야에서 잘 알려져 있으며, 예를 들어 DE 195 31 392에 기술되어 있다. 현대식 OCR-편지 분류 장치에서 처리율은 초당 10개의 편지, 즉 시간당 36,000개의 편지이며, 그 이상도 달성될 수 있다. 그러나, 인식에 대한 신뢰도는 문자의 종류 및 편지의 겉면에 기록된 주소 정보의 전체 품질에 따라 심하게 변동된다. 인식이 성공적으로 이루어진 경우에는 해당 편지가 기계적으로 판독 가능한 바코드를 제공받을 수 있다. 상기 바코드는 원하는 임의의 분류 순서를 포함하는 기계적인 다른 처리도 가능하게 한다. 특히 바코드를 사용하면, 집배원의 편지 배달 순서에 기초한 배달 루트의 분류 레벨까지 편지가 분류될 수 있다.
아시아권에서의 경제적인 추세 및 우편물 발생의 증가는, 비용을 제한하고 우편 서비스를 향상시키기 위하여, 동양 문자의 자동 인식에 대한 노력들을 강구시켰다. 상기 우편 자동화가 이미 정착된 기술로 나타나는 서구 국가들에서의 상황에 비해, 상기 인식 시스템에 대한 새로운 요구들이 나타나고 있으며, 이와 같은 요구는 아시아권의 대부분의 국가들에서 중국 문자가 우편물의 지역적 주소를 기입하는데 사용되고 있다는 사실에서 출발한다. 서구의 알파벳 문자의 철자와 달리, 중국 문자는 표의 문자로 구성되어 있다. 각각의 표의 문자는 하나의 단어를 나타낸다. 30개 내지 60개의 철자로 구성된 알파벳 대신, 3,000개 내지 6,000개의 다양한 중국 문자들이 일상적으로 사용되고 있으며, 그 각각은 고유한 특징적 형상을 갖는다. 중국 문자 시스템의 현실적인 불완전성과 개별 문자의 표의적인 구조는 서구의 알파벳 문자 시스템과 비교할 때 OCR-시스템의 효율을 감소시킨다. 더 나아가, 우편물에서 주소가 수직 방향으로 또는 수평 방향으로 배열되고, 중국 문자와 서구 문자가 혼용됨으로써 문제점들이 야기된다.
서구 문자 뿐만 아니라 중국 문자에 대해서도 상기 자동 판독 시스템의 인식율이 일반적으로 상당히 가변적이기 때문에, 다양한 형태의 수작업 개입을 통해 상기 자동 판독 시스템을 지원할 필요가 있다. 가장 단순한 개입은 자동으로 판독 불가능한 편지가 거부되는 경우에 수작업으로 이루어지는 분류 방법이다. 그러나, 그로 인한 비용은 작업 비용의 증가와 함께 비경제적으로 높다. 그에 부가하여, 상기와 같은 수작업으로 분류된 우편물은 나중 시점에서도 더이상 기계적으로 분류될 수 없기 때문에, 결국 서로 분리된 2가지 송출 흐름이 만들어지고, 상기 흐름은 다시 일정 시점에서 수작업으로 합쳐질 수밖에 없다.
OCR에 의해 거부된 우편물의 수작업 분류의 상기 단점들을 피하기 위해, 우편물을 수작업으로 부호화 하기 위한 다양한 방법들이 개발되었다. 이 모든 방법들은, OCR에 의해 판독되고 바코드가 부여된 우편물을 처리하는 동일한 기계를 통해 기계식 분류를 실행해야 한다는 요구에 부합되는 방식으로 우편물에 바코드를 부여하기 위해서, 작업자에 의한 개입을 이용한다.
거부된 우편물을 부호화 하기 위해, 다른 방법은 소위 수작업 부호화 영역(manual coding field)을 이용한다. 상기 수작업 부호화 영역들에서 우편물들은 물리적으로 연속으로 작업자 앞을 지나게 되며, 이 경우 작업자는 목적지를 명확하게 식별하기 위해 각각의 우편물에 대해서 필요한 만큼의 정보를 부호화 한다. 이 경우 입력된 주소는 목록에 의해서 분류용 바코드로 변환되고, 이 바코드가 우편물에 제공된다. 상기 부호화된 우편물들은 OCR에 적합한 바코드 선별기와 기계적으로 일치하는 바코드 선별기(BCS)에 의해서 계속 처리된다. 상기와 같은 수작업 부호화 영역은 US Post와 Royal Mail에 의해서 70년대에 처음으로 도입되었다. 그와 같은 장치의 주된 단점은, 상기 OCR-우편물 흐름으로부터 우편물을 반드시 제거해야 한다는 것과 작업자 앞을 지나는 우편물을 인식할 때 작업자에게서 나타나는 인체 공학적인 어려움(ergonomic difficulties)이다.
OCR에 의해 거부된 우편물을 처리하는 과정에서 이루어진 다음 발전은 온-라인-비디오 부호화 시스템(OVS)의 개발이었다. OVS에서는, 수작업 부호화 영역들에서의 물리적 우편물 대신, 우편물의 비디오 화상이 부호화를 위해 작업자 앞을 지나가게 된다. 비디오 화상이 작업자에게 보여지는 동안, 물리적 우편물은 지체 구간에 머무르게 된다. 통상적으로, 상기 지체 구간에서는 상기 OVS-작업자가 해당 화상에 필요한 분류 정보를 입력할 수 있기에 충분한 시간 동안 우편물이 계속 움직인다. 일반적인 지체 구간들은 10초 내지 30초의 지체를 허용한다. 지체 구간이 길면 길수록, 비용 그리고 관리에 대한 요구 사항 및 상기 장치의 물리적 크기는 그만큼 더 커진다.
OVS를 사용할 때의 주된 문제점은, 비실용적으로 긴 지체 구간이 사용되지 않는다면, 이용가능한 시간은 다만 우편번호(ZIP) 또는 우편코드(PC)를 세심하게 입력하기에만 충분하다는 것이다. ZIP 또는 PC가 존재하는 한, OVS는 주소에 중국 문자가 들어 있는 우편물에 대해서도 효과적으로 사용될 수 있다. 그러나, 동양의 많은 국가들에서 그와 같은 우편물의 비중은 매우 작으며, 예견 가능한 가까운 장래에도 그럴 것이다. 그렇기 때문에, 필요한 온-라인-지체 시간을 가능한 작게 유지하기 위해서 특수한 부호화 방법이 개발되었다.
부호화 생산성(coding productivity)을 높이고, 전체 주소 요소들, 즉, ZIP/PC, 거리(street)/사서함, 수신자/사서함, 수신자/회사와 같은 모든 요소의 표시를 가능하게 하기 위해, 종래 기술에서는 다양한 방법들이 개발되었다. 중요한 것은 다음과 같다 :
예비 검사-부호화 (Preview-coding)
이 예비 검사 부호화에서는 하나의 화상이 다른 화상 위에 겹쳐서 2개 우편물의 화상이 동시에 디스플레이 된다. 이 경우에는 아래에 있는 화상이 액티브 화상이다. 즉, 아래에 있는 화상의 데이터가 부호화 된다. 적당한 훈련 후에 작업자는 하측 화상에 대한 정보를 부호화 하는 한편, 상측 화상에 대한 주소 정보를 미리 파악할 수 있다. 이어서, 상측 화상이 액티브 되어 상기 처리 과정이 속행된다. 이와 같은 예비 검사-부호화에 의해서는, 연속 화상들을 부호화 할 때 인식 기능과 운동 기능이 완전히 중첩되어 작업자-생산성이 배가될 수 있다.
추출 부호화 (Extraction coding)
온-라인-지체-시간이 실제로 달성 가능한 경우에는 단지 ZIP/PC 주소 요소들만이 확실하게 작업자에 의해서 입력될 수 있기 때문에, 추출 부호화 작업에서는 거리(street)와 연관되는 주소 구성 요소들 중에서 특정한 주요 구성 요소들이 입력된다. 상기 추출 부호화는 특수하게 개발된 규칙들(rules)에 근거하는 것이 일반적이며, 이 규칙에서는 고정된 길이의 하나의 코드가 주소 목록에 대한 액세스 키(access key)로서 사용된다. 예를 들어, Royal Mail은 첫번째 3개의 철자와 마지막 2개의 철자에 기초한 추출 공식을 사용한다. 이 때 특수한 규칙들은 작업자에 의해서 암기되기 때문에, 불필요한 주소 정보를 피하고, 예를 들어 동, 서와 같은 방향 또는 스트리트(street), 레인(lane), 로드(road)와 같은 카테고리처럼 구분되는 소정의 특징들이 고려된다.
추출 부호화는 자체의 일정한 효과에도 불구하고 몇가지 큰 단점들을 갖는다; 거리 이름의 끝 부분을 빈번히 고려해야 하는 특히 복잡한 추출 규칙들이 존재하는 한편, 수기된 우편물의 경우에는 그 구성요소들이 통상적으로 매우 불분명하게 기록되어 있다는 것이다. 그 외에도 목록에 있는 다수의 등록 내용이 추출 코드와 일치하는, 상당히 높은 비율의 불명확한 추출이 이루어짐으로써, 명확한 분류 결정이 이루어질 수 없게 된다. 또한, 단순히 반복적인 키보드 입력 대신에, 작업자에 의해서 결정이 이루어질 수밖에 없게 되면, 작업자의 입력 생산성(entry productivity)은 감소된다.
완성적 부호화 (completion coding)
이 완성적 부호화에서는 추출 부호화와 대조적으로, 부호화하려는 각각의 주소에 가변적인 입력이 실시된다. 중요한 점은, 주소 입력시에 분명한 일치가 이루어질 때까지 주소 목록과의 비교 작업이 실시된다. 분명한 부분적 일치가 식별되자마자, 주소의 나머지 부분을 표시함으로써 가속 효과가 달성된다. 그러나, 이 기술에서 나타나는 문제점은, 입력 정지-신호가 작업자에게 제공되어야 하며, 식별된 주소의 나머지 부분의 표시가 필요하다는 점이며, 이는 입력 생산성의 감소를 가져오고 예비 검사 부호화를 불가능하게 만든다.
중국 문자에 대한 신속한 입력 기술이 부족하기 때문에 상기 기술의 이용이 부수적 수준에 머문다 할지라도, 이론적으로 볼 때 전술한 모든 비디오 부호화 기술은 중국 문자가 기록된 우편물에도 이용될 수 있다.
작업자-보조 OCR-기술(operator-assisted OCR-Technic)주소 정보의 온-라인 처리를 향상시키기 위해, US Post는 작업자-보조 OCR-기술을 실험했다. 이 경우, 효율을 높이기 위해 OCR-인식이 거부된 주소 화상의 일부가 강조된다. 누락된 철자를 해독할 때에는 작업자의 속도가 느리고, 예를 들어 세그먼팅 문제와 같은 복잡한 인식 에러도 부분적으로 발생되기 때문에, 이 방법에서의 작업자 생산성은 관련 주소를 간단히 재입력할 때보다 더 낮다.
오프-라인 부호화(off-line coding)
위에서 언급한 부호화 기술 중에 어떠한 기술에 의해서도 순수한 온-라인-부호화에서는 충분히 높은 생산성이 달성될 수 없기 때문에, 미국 특허공보 제4,992,649호에 기술된 바와 같이, 최근에는 오프-라인 부호화 시스템이 도입되었다. 상기 시스템에서 인식되지 않은 주소가 있는 우편물에 대하여 부가의 정보, 즉 TID(tracking identification)가 제공된다. 인식되지 않은 우편물은 외부에 저장되는 반면, 이 우편물들의 화상은 작업자에게 부호화를 위해 보여지며, 이 경우에는 시간적 제한이 없다. 이어서, 우편물들이 TID-판독 장치에 제공된다. 상기 TID는 입력된 주소 정보와 연결된다. 그에 기초하여 통상의 바코드-분류 정보도 우편물에 제공될 수 있음으로써, 해당 우편물은 OCR-판독된 일반 우편물처럼 처리될 수 있다. 상기 오프-라인-비디오 부호화 방법이 주소의 전체 구성요소를 부호화하기 위한 효과적인 방법임에도 불구하고, 부가적으로 판독되지 않은 주소를 가진 우편물의 처리를 위한 용량 및 그에 상응하게 복잡한 로지스틱(logistic)이 요구된다.
상기 작업자-보조 OCR-기술 역시 중국 문자가 들어 있는 우편물의 처리에 적합하지만, 지금까지는 상기 문자의 신속한 입력이 불가능하다.
훈련의 필요와 인식의 필요라는 관점에서 상당히 높은 요구 조건이 작업자에게 제기됨으로써, 상기와 같은 불만족스러운 상황은 계속 악화되고 있다.
언어 입력 유닛을 이용하는 비디오 부호화의 경우에는 분배 정보의 신속한 입력이 이루어질 수 있지만, 부호화에 있어서 시간적인 문제는 다만 분배 정보 후보(delivery information candidate)의 선택 단계로만 옮겨진다.
독립 청구항 제1항 및 제9항에 제시된 본 발명은, 개인에 의한 선택이 거의 필요하지 않은 언어 입력 기술을 이용하여, 특히 우편물에 수기된 비알파벳 문자 주소의 형태로 된 분배 정보를 신속하게 부호화하는 문제에 기초한 것이다. 상기 OCR-평가를 통해 불완전한 또는 불명확한 결과를 갖는, 언어 입력을 통해 얻어진 후보들을 필터링 하는 과정은 올바른 후보들을 신속하게 자동으로 선택할 수 있도록 하며, 작업자가 상기와 같은 과정을 담당하지 않도록 한다. 상기 필터링 과정은 특히 중국 문자로 수기된 주소를 부호화할 때 이용하는 것이 바람직하다.
본 발명의 바람직한 실시예들은 종속항들에서 파악될 수 있다. 청구항 제2항에 따라 평가 비용을 줄이기 위해서는, 표시된 분배 정보들의 숫자 부분을 키(key)를 이용하여 입력하는 것이 유리하다.
청구항 제3항에 따르면, 언어 인식으로부터 후보들을 선택하기 위해, 상기 OCR-평가에서 검출된 문자의 수와 언어 인식으로부터 얻어진 문자의 수를 비교하고, 통계적으로 검출된 한계값 이상만큼 상기 OCR-평가에서 검출된 문자의 수에서 벗어나는 문자의 수를 갖는 후보들을 분류하는 것이 바람직하다. 이 목적을 위해서 청구항 제4항에 따라 세그먼팅 결과가 이용될 수 있다.
청구항 제5항에 따른 바람직한 다른 선택 방법의 경우에는, OCR-평가에서 신뢰도 있게 검출된 문자가 언어 인식 후보들의 문자와 위치적으로 비교되며, 한계값 이상인 가장 일치되는 후보가 선택된다.
청구항 제6항에 따라, 거리명을 검출하기 위해서는 다음의 방법 단계들을 순서대로 실시하는 것이 바람직하다:
- 주소 데이터/거리 목록에서 존재 여부를 체크하는 단계;
- 상기 OCR-평가에서 검출된 문자의 수와 비교하여 문자의 수를 선택하는 단계; 및
- 후보 문자와 OCR-평가 문자의 위치를 비교하는 단계.
분배 정보의 숫자 부분이 키에 의해서 입력되면, 청구항 제7항 및 청구항 제8항에 따라, 수를 위한 OCR-유닛을 이용하여 상기 수를 검색하고, 상기 유닛을 이용해서 주소 라인, 방향 및 상기 주소 라인에 있는 이름 영역(name field)의 위치를 검출하는 것이 바람직하다.
본 발명은 하기에서 도면을 참조하여 자세히 설명된다.
도 1은 본 발명에 따른 장치의 개략도,
도 2는 중국 문자가 기록된 우편물을 부호화할 때의 데이터 플로우.
도 1에는 본 발명에 따른 방법을 실시하기 위한 편지 분배 장치가 도시되어 있다. OCR-편지 분류기(10)는, 창고(12)로부터 우편물을 연속으로 인출하여 이 우편물의 화상을 얻기 위한 장치인 고해상 비디오 스캐너(1)에 초당 약 10개의 우편물을 제공하는 공급 장치(11)로 이루어진다. 그 다음에 우편물은 지체 구간(13)으로 이송된다. 우편물들은 그 겉면에 분배 정보, 특히 주소 정보를 갖는 것이 일반적이다. 상기 비디오 스캐너(1)로부터 얻어진 우편물의 화상에 있는 주소 정보가 OCR-유닛(20)에서 평가된다. 평가가 완료되면 바코드 인쇄기(14)가 시동되고, 우편물은 분류함(16)에서의 후속 분류를 위해 적절한 바코드를 제공 받는다. OCR-유닛(20)은 우편물의 화상을 저장하기 위해, 관련 메모리(22)를 갖는 하나 또는 다수의 마이크로 프로세서(21)로 이루어진다. 또한 상기 OCR-유닛은 ZIP-코드, 도시명 및 거리명 그리고 주소와 관련한 다른 정보가 수록된 사전(23)을 포함한다. 주소 정보를 갖고 있는 화상을 평가하는 경우에는, 주소 목록에서 얻어진 등록 내용이 특징 제어 과정에 의해 단축되기 때문에, 일종의 부분 사전이 만들어진다. 이 때 개별 등록 내용에는 신뢰도가 제공되기 때문에, 평가시에는 옳다고 인정된 주소에 대한 일정 수의 데이터가 만들어진다. 또한 상기 장치는 하나의 처리 유닛(30) 및 일정 수의 비디오 부호화 영역(40)을 포함하며, 상기 영역들은 직접 또는 LAN(31)을 통해 처리 유닛(30)과 연결되어 있다. 워크스테이션이 비디오 부호화 영역으로서 이용되는 것이 바람직하다. 화상에 대한 OCR-평가가 완전히 성공적이지 않았다면, 이 화상은 OCR-유닛(20)으로부터 처리 유닛(30)으로 전송되며, 상기 처리 유닛은 특히 TID 바코드 인쇄기(15)를 제어하고, 상응하는 화상을 상기 비디오 부호화 영역(40)들 중 하나로 전송한다. TID 바코드 인쇄기(15)는 상응하는 우편물에 식별 코드 TID를 제공하며, 상기 코드는 나중 시점에 물리적인 우편물과 상기 평가된 주소 정보의 결합을 가능하게 한다. 기본적으로 지체 구간이 충분히 긴 경우에는 또한 비디오 부호화를 통한 온-라인-평가도 가능하지만, 그 경우에는 상기 화상 평가가 오프-라인 방식으로 이루어지는 것이 바람직하다. 후자의 경우 TID는 나중 시점에서도, 즉 비디오 부호화가 미리 설정된 특정 시점 내에 평가를 완수하지 않더라도 우편물에 제공된다.
도면에 도시된 바와 같이, 각 비디오 부호화 영역(40)에는 키 입력을 위한 키보드(50)와 언어 입력 유닛이 접속되어 있으며, 상기 언어 입력 유닛은 마이크로폰(60) 및 언어 인식 모듈(70)로 이루어진다.
처리 유닛(30) 내에서는, 본 발명에 따라 언어 인식 모듈(70)로부터 후보가 선택된다. 중국 문자의 주소를 인식하는 것을 예로 다루고 있는 도 2에서 알 수 있는 바와 같이, 결과가 불완전하거나 또는 불명확한 경우에는 다시 한 번 실행되는 오프-라인 OCR-유닛(100)을 이용하는 것이 바람직하지만, 필수적인 것은 아니다. 결과가 분명하거나 완전한 경우에는, 그 결과가 받아들여지고(110), 부호화 과정이 종료된다. 그렇지 않으면, 상응하는 화상이 키보드(50), 마이크로폰(60) 및 언어 인식 모듈(70)로 이루어진 비디오 부호화 영역(40)으로 전송된다.
작업자는 주소를 읽어서 거리명을 마이크로폰(60)에 말한다. 그와 동시에 작업자는 키보드(50)를 이용해 번지를 입력한다. 그 후, 분명하게 또는 전자동적으로 평가되지 않은 주소를 갖는 새로운 화상이 스크린에 나타나고 새로운 부호화 과정이 실시된다.
도 2에 따르면, 각각 3개의 문자로 이루어진 3개의 후보가 언어 인식 모듈(70)을 통해 검출된다. 상기 오프-라인-OCR-유닛(100)에서의 불완전한 평가의 결과로 마찬가지로 3개의 문자가 검출되며, 이 경우 첫 번째 문자는 신뢰도가 높고, 두 번째 문자는 신뢰도가 낮으며, 세 번째 문자는 식별되지 않았다. 처리 유닛(30)에서는 언어 인식 모듈(70)의 후보 선택 과정(120)이 실행된다. 먼저, 상기 3개의 후보들이 거리 목록에 입력된 번지(301)를 갖고 있는지의 여부가 처리 유닛(30)을 통해 체크된다. 도 2의 예가 그 경우에 해당되기 때문에, 다음 과정으로서 문자의 수가 비교된다. 언어 인식으로부터 얻어진 후보가 3개인 경우 상기 문자의 수는 오프-라인-OCR-유닛(100)의 결과(3개의 문자)와 일치한다.
따라서 상기 비교 과정 후에는 상기 3개의 후보가 선택 과정에 남게 되고, 상기 문자들의 위치가 신뢰도를 고려하여 비교된다. 마지막 자리에서는 상기 OCR-유닛(100)이 개별 문자를 식별할 수 없기 때문에, 결과적으로 그 자리에 대해서는 어떠한 선택 비교도 실시될 수 없다. 두 번째 자리에서는 상기 OCR-유닛(100)을 통해 신뢰도가 낮은 문자가 검출되고, 후보들(2 및 3)도 마찬가지로 두 번째 자리에서는 상기와 같이 신뢰도가 낮은 문자를 갖는다. 따라서 결정은 아직 불가능하다. 높은 신뢰도를 갖는 것으로 상기 OCR-유닛(100)에서 인식된 첫 번째 자리의 문자와 상기 후보들의 문자를 비교하면, 후보(2)만이 상기 문자를 첫 번째 자리에 포함하므로, 결국 상기 후보는 분명한 해답으로서 받아들여진다. 통계적으로 확정된 신뢰도 문턱값을 갖는 후보를 명확하게 선택하는 것이 불가능하다면, 검색된 주소를 갖는 화상이 특수한 부호화 장치(130)에 제공된다. 키보드를 이용해 입력되는 숫자, 본 경우의 번지(301)는, 상기 OCR-유닛(100)의 결과가 특정 신뢰도 이하인 경우에 새로운 OCR-평가를 실시하기 위해서 이용될 수 있으며, 그 경우 입력된 숫자는 주소 라인(address line)의 위치 및 방향 그리고 거리명 영역을 검출하는데 이용된다.
물론 언어 입력을 이용해 이름과 숫자를 입력할 수 있으며, 검출된 후보들을 OCR-결과를 이용해서 필터링 또는 선택할 수 있다.

Claims (11)

  1. 비디오 부호화 영역을 이용해 우편물 분배 정보를 인식하기 위한 방법으로서,
    마이크로폰 및 언어 인식 모듈로 이루어진 언어 입력 유닛을 이용하여, 개별 비디오 부호화 영역의 스크린에 표시된 개별 분배 정보의 적어도 이름을 입력함으로써, 목록에서의 비교를 포함하여 하나 이상의 OCR-유닛 내에서 분배 정보가 불명확하다고 자동으로 평가된 후에는, 상기 분배 정보를 포함하는 우편물 겉면의 기록되고 디지털화 되었으며 저장된 화상이 상기 비디오 부호화 영역으로 전달되며,
    자동적인 OCR-평가의 불완전한 결과 또는 불명확한 결과, 또는 불완전하면서 불명확한 결과에 의해서 언어 인식 후보들이 선택되는,
    비디오 부호화 영역을 이용해 우편물 분배 정보를 인식하기 위한 방법.
  2. 제1항에 있어서,
    상기 표시된 분배 정보의 숫자 부분이 키에 의해 입력되는,
    비디오 부호화 영역을 이용해 우편물 분배 정보를 인식하기 위한 방법.
  3. 제1항 또는 제2항에 있어서,
    상기 OCR-평가시에는 문자의 수가 검출되어 언어 인식 후보들에 상응하는 문자의 수와 비교되며, 통계적으로 검출된 한계값 이상만큼 상기 OCR-평가에서 검출된 문자 수로부터 벗어나는 문자 수를 갖는 후보들이 분류되는,
    비디오 부호화 영역을 이용해 우편물 분배 정보를 인식하기 위한 방법.
  4. 제3항에 있어서,
    상기 OCR-평가의 세그먼팅의 결과로부터 문자의 수가 검출되는,
    비디오 부호화 영역을 이용해 우편물 분배 정보를 인식하기 위한 방법.
  5. 제1항 또는 제2항에 있어서,
    상기 OCR-평가에서 신뢰도 있게 검출된 문자가 위치와 관련하여 언어 인식 후보들의 문자와 비교되며, 통계적으로 검출된 한계값 이상의 가장 일치되는 후보가 선택되는,
    비디오 부호화 영역을 이용해 우편물 분배 정보를 인식하기 위한 방법.
  6. 제1항 또는 제2항에 있어서,
    거리명의 검출을 위해,
    첫 번째로, 해당 번지가 입력된 거리명 후보들이 거리 목록에 존재하는지의 여부에 따라 선택되고,
    두 번째로, 남겨진 후보들이 상기 OCR-평가로부터 검출된 수의 문자와 비교한 문자의 수에 따라 선택되며,
    세 번째로, 남겨진 후보들이 상기 OCR-평가의 문자와 상기 후보 문자의 위치 관련 비교 과정에서 선택되는,
    비디오 부호화 영역을 이용해 우편물 분배 정보를 인식하기 위한 방법.
  7. 제1항 또는 제2항에 있어서,
    키를 이용해 입력된 분배 정보의 숫자 부분이 수-OCR-유닛에 의해, 가능한 주소 영역-ROI 내에서 검색되며, 발견된 수를 참조하여 상기 검색된 주소 라인과 방향이 검출되는,
    비디오 부호화 영역을 이용해 우편물 분배 정보를 인식하기 위한 방법.
  8. 제7항에 있어서,
    상기 수-OCR-유닛을 이용해 발견된 수 및 위치를 참조하여 상기 주소 라인에 있는 이름 영역이 검출되는,
    비디오 부호화 영역을 이용해 우편물 분배 정보를 인식하기 위한 방법.
  9. 우편물 상에 있는 분배 정보를 인식하기 위한 장치로서,
    - 우편물의 화상을 얻기 위한 장치(1);
    - 목록에서의 비교 과정과 함께, 상기 분배 정보를 갖는 우편물 겉면의 화상을 자동으로 평가하기 위한 OCR-유닛(20, 100);
    - 상기 분배 정보들을 포함하는 우편물 겉면의 화상을 비디오 부호화 하기 위한 장치로서, 하나 이상의 비디오 부호화 영역(40)을 갖고, 상기 비디오 부호화 영역이 키보드(50), 스크린 그리고 마이크로폰(60) 및 언어 인식 모듈(70)로 이루어진 언어 입력 유닛을 각각 하나씩 갖는, 비디오 부호화 장치; 및
    - 상기 비디오 부호화 장치의 입출력 유닛과 OCR-유닛(20, 100) 사이에서 데이터 흐름을 제어하는 처리 유닛(30)으로서, 상기 OCR-유닛(20, 100)의 불완전한 결과 또는 불명확한 결과, 또는 불완전하면서 불명확한 결과를 기초로 해서 개별 언어 인식 모듈(70)의 후보들이 선택되도록 구성된 처리 유닛(30);을 포함하는,
    우편물 상에 있는 분배 정보를 인식하기 위한 장치.
  10. 제9항에 있어서,
    상기 처리 유닛(30)에서는 상기 OCR-유닛(20,100)에서 검출된 문자 수와 각각의 언어 인식 모듈(70)로부터 얻어진 후보들의 문자 수가 비교되며, 통계적으로 검출된 한계값 이상만큼 상기 OCR-평가의 문자 수로부터 벗어나는 문자 수를 갖는 후보들이 분류되는,
    우편물 상에 있는 분배 정보를 인식하기 위한 장치.
  11. 제9항에 있어서,
    상기 처리 유닛(30)에서는 상기 OCR-유닛(20,100)에서 신뢰도 있게 검출된 문자가 위치와 관련하여 개별 언어 인식 모듈(70)로부터 얻어진 후보들의 문자와 비교되며, 통계적으로 검출된 한계값 이상의 가장 일치되는 후보가 선택되는,
    우편물 상에 있는 분배 정보를 인식하기 위한 장치.
KR10-2000-7003270A 1997-09-27 1998-09-21 우편물에 대한 분배 정보를 인식하기 위한 방법 및 장치 KR100536509B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19742771.5 1997-09-27
DE19742771A DE19742771C1 (de) 1997-09-27 1997-09-27 Verfahren und Anordnung zum Erkennen von Verteilinformationen auf Sendungen

Publications (2)

Publication Number Publication Date
KR20010030737A KR20010030737A (ko) 2001-04-16
KR100536509B1 true KR100536509B1 (ko) 2005-12-14

Family

ID=7843870

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2000-7003270A KR100536509B1 (ko) 1997-09-27 1998-09-21 우편물에 대한 분배 정보를 인식하기 위한 방법 및 장치

Country Status (9)

Country Link
US (1) US6577749B1 (ko)
EP (1) EP1015138B1 (ko)
JP (1) JP2003510166A (ko)
KR (1) KR100536509B1 (ko)
CN (1) CN1120757C (ko)
CA (1) CA2304728A1 (ko)
DE (2) DE19742771C1 (ko)
TW (1) TW436331B (ko)
WO (1) WO1999016559A1 (ko)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19858229B4 (de) * 1998-12-17 2007-04-19 Fayad, Omar Ralf Vorrichtung zum Erfassen von Postgut
DE19933984C2 (de) * 1999-07-20 2001-05-31 Siemens Ag Verfahren zur Bildung und/oder Aktualisierung von Wörterbüchern zum automatischen Adreßlesen
US6539098B1 (en) * 1999-09-24 2003-03-25 Mailcode Inc. Mail processing systems and methods
JP2001134716A (ja) * 1999-11-09 2001-05-18 Toshiba Corp 所在情報認識方法と認識アプリケーションと記録媒体と所在情報認識装置
EP1534440B1 (de) * 2002-09-03 2006-04-19 Siemens Aktiengesellschaft Verfahren und vorrichtung zum lesen der adressen von sendungen
FR2844618B1 (fr) * 2002-09-16 2006-06-23 Solystic Procede pour le codage video d'images comportant une information d'adresse
FR2868711B1 (fr) * 2004-04-07 2006-06-09 Solystic Sa Procede pour retarder l'impression d'un code d'identification sur un envoi postal
DE102004030415A1 (de) * 2004-06-24 2006-01-19 Siemens Ag Verfahren zur automatischen Ermittlung operativer Leistungsdaten von Lesesystemen
JP2007004584A (ja) * 2005-06-24 2007-01-11 Toshiba Corp 情報処理装置
EP1951448A1 (de) * 2005-10-27 2008-08-06 Siemens Aktiengesellschaft Verfahren und vorrichtung zum lesen der adressen von sendungen
EP2021980A1 (en) * 2006-05-23 2009-02-11 Siemens Aktiengesellschaft System and method for sorting objects using ocr and speech recognition techniques
AU2008303513A1 (en) 2007-09-27 2009-04-02 Siemens Aktiengesellschaft Method and system for identifying information related to a good
US8260455B2 (en) 2008-12-05 2012-09-04 Siemens Industry, Inc. Address label re-work station
US8380501B2 (en) * 2009-08-05 2013-02-19 Siemens Industry, Inc. Parcel address recognition by voice and image through operational rules
DE102009052062B3 (de) * 2009-11-05 2011-04-14 Siemens Aktiengesellschaft Verfahren und Vorrichtung zum Transportieren von Gegenständen abhängig von Zielpunkt-Angaben
US20110150270A1 (en) * 2009-12-22 2011-06-23 Carpenter Michael D Postal processing including voice training
DE102010034356A1 (de) 2010-08-16 2012-02-16 Siemens Aktiengesellschaft Verfahren zur nachweisbaren Auslieferung eines Gegenstands
DE102012200576A1 (de) 2011-02-02 2012-08-02 Siemens Aktiengesellschaft Verfahren und Vorrichtung zum Transport eines Gegenstands unter Verwendung eines dreidimensionalen Modells dieses Gegenstands
DE102011007707A1 (de) 2011-04-19 2012-10-25 Siemens Aktiengesellschaft Verfahren und Vorrichtung zum Überwachen des Transports eines Gegenstandes
FR3081355B1 (fr) * 2018-05-24 2020-06-12 Solystic Procede de tri de bagages en aeroport avec videocodage optimise
CN112822539B (zh) * 2020-12-30 2023-07-14 咪咕文化科技有限公司 信息显示方法、装置、服务器及存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5855076A (ja) * 1981-09-29 1983-04-01 株式会社東芝 紙葉類の区分装置
FR2591512B3 (fr) * 1985-12-17 1988-03-11 Millet Jean Claude Procede d'indexation de courrier postal et systeme mettant en oeuvre un tel procede
US5022081A (en) * 1987-10-01 1991-06-04 Sharp Kabushiki Kaisha Information recognition system
US4921107A (en) * 1988-07-01 1990-05-01 Pitney Bowes Inc. Mail sortation system
US4992649A (en) 1988-09-30 1991-02-12 United States Postal Service Remote video scanning automated sorting system
EP0589119A1 (en) 1992-09-25 1994-03-30 International Business Machines Corporation System and method for improving processing of OCR scanned mail
US5558232A (en) * 1994-01-05 1996-09-24 Opex Corporation Apparatus for sorting documents
US5692225A (en) * 1994-08-30 1997-11-25 Eastman Kodak Company Voice recognition of recorded messages for photographic printers
EP0726540B1 (en) * 1995-02-08 2003-09-10 Kabushiki Kaisha Toshiba Apparatus and method for video coding
DE19531392C1 (de) * 1995-08-26 1997-01-23 Aeg Electrocom Gmbh Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen

Also Published As

Publication number Publication date
DE19742771C1 (de) 1998-12-10
CN1120757C (zh) 2003-09-10
WO1999016559A1 (de) 1999-04-08
DE59805335D1 (de) 2002-10-02
JP2003510166A (ja) 2003-03-18
US6577749B1 (en) 2003-06-10
EP1015138B1 (de) 2002-08-28
CA2304728A1 (en) 1999-04-08
CN1268076A (zh) 2000-09-27
EP1015138A1 (de) 2000-07-05
TW436331B (en) 2001-05-28
KR20010030737A (ko) 2001-04-16

Similar Documents

Publication Publication Date Title
KR100536509B1 (ko) 우편물에 대한 분배 정보를 인식하기 위한 방법 및 장치
KR100524477B1 (ko) 우편물 분배 정보를 인식하기 위한 방법 및 장치
EP0424728B2 (en) System and method for deferred processing of OCR scanned mail
JPH11226513A (ja) 郵便物宛先読取装置及び郵便物区分装置
US20100014706A1 (en) Method and apparatus for video coding by validation matrix
US20040117192A1 (en) System and method for reading addresses in more than one language
JPH0739820A (ja) 街区認識装置および宛名読取区分機
JP3162552B2 (ja) 郵便物あて名認識装置及びあて名認識方法
JPH07271899A (ja) 文字認識装置
JP3340612B2 (ja) 郵便物宛名認識区分装置
JP2001025713A (ja) 郵便区分システム
JP3557048B2 (ja) ビデオコーディング装置
JPH0793466A (ja) 文字種判別装置およびその判別方法
JP3302179B2 (ja) コーディングシステムと郵便物処理装置
CA2400391A1 (en) Method and apparatus for reading post codes of addresses on mail
JPH1034089A (ja) ビデオコーディング装置
JPH11207265A (ja) 情報処理装置および郵便物処理装置
JPH08164365A (ja) 宛名読取装置
JPH02242389A (ja) 郵便番号読取装置
JPH06208645A (ja) 文字認識装置
JPH10432A (ja) 郵便物の住所読取方法及び郵便物の住所読取装置
JPS6160188A (ja) 文字認識装置
JPH05169031A (ja) 宛名読取区分機
JP2005284502A (ja) ビデオコーディングシステム
JPS62103784A (ja) 文字読取装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20091110

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee