KR20060105756A - 스마트 폴링을 위한 시스템 및 방법 - Google Patents

스마트 폴링을 위한 시스템 및 방법 Download PDF

Info

Publication number
KR20060105756A
KR20060105756A KR1020067009699A KR20067009699A KR20060105756A KR 20060105756 A KR20060105756 A KR 20060105756A KR 1020067009699 A KR1020067009699 A KR 1020067009699A KR 20067009699 A KR20067009699 A KR 20067009699A KR 20060105756 A KR20060105756 A KR 20060105756A
Authority
KR
South Korea
Prior art keywords
image
ocr
classification
ocr process
relates
Prior art date
Application number
KR1020067009699A
Other languages
English (en)
Inventor
왈떼르 로젠봄므
Original Assignee
시에멘스 에이지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 시에멘스 에이지 filed Critical 시에멘스 에이지
Publication of KR20060105756A publication Critical patent/KR20060105756A/ko

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B07SEPARATING SOLIDS FROM SOLIDS; SORTING
    • B07CPOSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
    • B07C3/00Sorting according to destination
    • B07C3/10Apparatus characterised by the means used for detection ofthe destination
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B07SEPARATING SOLIDS FROM SOLIDS; SORTING
    • B07CPOSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
    • B07C3/00Sorting according to destination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07BTICKET-ISSUING APPARATUS; FARE-REGISTERING APPARATUS; FRANKING APPARATUS
    • G07B17/00Franking apparatus
    • G07B17/00185Details internally of apparatus in a franking system, e.g. franking machine at customer or apparatus at post office
    • G07B17/00362Calculation or computing within apparatus, e.g. calculation of postage value
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07BTICKET-ISSUING APPARATUS; FARE-REGISTERING APPARATUS; FRANKING APPARATUS
    • G07B17/00Franking apparatus
    • G07B17/00185Details internally of apparatus in a franking system, e.g. franking machine at customer or apparatus at post office
    • G07B17/00435Details specific to central, non-customer apparatus, e.g. servers at post office or vendor
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07BTICKET-ISSUING APPARATUS; FARE-REGISTERING APPARATUS; FRANKING APPARATUS
    • G07B17/00Franking apparatus
    • G07B17/00975Franking apparatus using mechanical accounting means
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07BTICKET-ISSUING APPARATUS; FARE-REGISTERING APPARATUS; FRANKING APPARATUS
    • G07B17/00Franking apparatus
    • G07B17/00185Details internally of apparatus in a franking system, e.g. franking machine at customer or apparatus at post office
    • G07B17/00362Calculation or computing within apparatus, e.g. calculation of postage value
    • G07B2017/00427Special accounting procedures, e.g. storing special information
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07BTICKET-ISSUING APPARATUS; FARE-REGISTERING APPARATUS; FRANKING APPARATUS
    • G07B17/00Franking apparatus
    • G07B17/00185Details internally of apparatus in a franking system, e.g. franking machine at customer or apparatus at post office
    • G07B17/00435Details specific to central, non-customer apparatus, e.g. servers at post office or vendor
    • G07B2017/00443Verification of mailpieces, e.g. by checking databases
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07BTICKET-ISSUING APPARATUS; FARE-REGISTERING APPARATUS; FRANKING APPARATUS
    • G07B17/00Franking apparatus
    • G07B17/00185Details internally of apparatus in a franking system, e.g. franking machine at customer or apparatus at post office
    • G07B17/00435Details specific to central, non-customer apparatus, e.g. servers at post office or vendor
    • G07B2017/00451Address hygiene, i.e. checking and correcting addresses to be printed on mail pieces using address databases
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07BTICKET-ISSUING APPARATUS; FARE-REGISTERING APPARATUS; FRANKING APPARATUS
    • G07B17/00Franking apparatus
    • G07B17/00459Details relating to mailpieces in a franking system
    • G07B17/00508Printing or attaching on mailpieces
    • G07B2017/00572Details of printed item
    • G07B2017/0058Printing of code
    • G07B2017/00588Barcode
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07BTICKET-ISSUING APPARATUS; FARE-REGISTERING APPARATUS; FRANKING APPARATUS
    • G07B17/00Franking apparatus
    • G07B17/00459Details relating to mailpieces in a franking system
    • G07B17/00661Sensing or measuring mailpieces
    • G07B2017/00709Scanning mailpieces
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07BTICKET-ISSUING APPARATUS; FARE-REGISTERING APPARATUS; FRANKING APPARATUS
    • G07B17/00Franking apparatus
    • G07B17/00459Details relating to mailpieces in a franking system
    • G07B17/00661Sensing or measuring mailpieces
    • G07B2017/00709Scanning mailpieces
    • G07B2017/00717Reading barcodes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Hardware Design (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Accounting & Taxation (AREA)
  • Information Transfer Between Computers (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)
  • Sorting Of Articles (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Computer And Data Communications (AREA)

Abstract

본 발명은 이미지 디코딩 방법에 관한 것이다. 본 발명의 방법은 적어도 제1 OCR(optical character recognition) 프로세스 및 제2 OCR 프로세스를 병렬로, 복수의 분류를 포함하는 이미지에 적용시키는 단계, 제1 OCR 프로세스 및 제2 OCR 프로세스가 거의 유사한 이미지 결과를 산출하는지 판정하는 단계, 이미지 결과가 유사하지 않다면, 가장 높은 가중치를 가지는 OCR 프로세스 분류 기반 결과를 선택하는 단계, 및 상기 가장 높은 가중치를 가지는 OCR 프로세스 분류 기반 결과를 분류별로 상기 이미지 결과에 할당하는 단계를 포함한다.
OCR, 디코딩, 폴링

Description

스마트 폴링을 위한 시스템 및 방법{SYSTEM AND METHOD FOR SMART POLLING}
<관련 출원의 상호 참조>
본 출원은 본원에 참조로서 포함되는 미국 가출원번호 60/520,658의 우선권을 주장한다.
이미지 인식은 일반적으로 OCR(optical character recognition) 처리에 의해 수행된다. 이러한 이미지 인식은 수신지 주소가 우편물의 주소 겉면으로부터 판독되는 우편물 처리 분야에 응용된다. 다른 응용들이 숙련된 당업자에 의해 계획될 수 있다. OCR 처리에 의한 정확한 이미지 판독 또는 디코딩을 보장하기 위해서, 동일한 이미지에 대하여 복수의 독립형 OCR 프로세스들이 동시에 실행되거나 서로 다른 시점에서 실행될 수 있다. 가장 신뢰되는, 스캐닝된 주소의 처리 결과 또는 디코드(decode)를 결정하려는 노력으로 이들 각각의 결과를 고려하고/거나 비교할 수 있다.
우편물 처리 응용에서의 OCR 처리는 4개의 거의 독립적인 프로세스: 주소 블록 위치 찾기, 2진화, OCR 처리, 및 데이터베이스 탐색의 조합이다. 간단히 말해서, 주소 블록 위치 찾기는 봉투의 주소 겉면의 정보의 위치를 찾는 것이다. 2진화는 계조-레벨(gray-level) 이미지를 2진으로 변환하는 것이다. OCR 처리는 영문 자 또는 숫자 문자와 같은 이미지의 식별 및 매핑이다. 데이터베이스 탐색은 프로세스 결과를, 수신지를 식별하는 데에 이용되는 우편번호, 시, 가, 및 수취인 정보를 포함하는 관계형 데이터베이스들의 정교한 집합과 대조(match)시킴으로써 OCR이 출력한 연속적인 문ㆍ숫자열의 체계화(rationalization)이다. 전술된 프로세스들은, 함께 채택되어, 주소 겉면 이미지를 스캔하고 이를 적당한 확신을 가지고, 분류 판정에 매핑시키는 데에 이용된다. 이런 응용의 목적상, 전술된 것들은 간단히 OCR 프로세스라 칭할 것이다.
수신지 주소의 불일치 및 OCR 프로세스가 복잡하면, 각각의 OCR 프로세스의 결과는 정확도에 관련하여 변한다. 이와 같이, 동작가능 수준 또는 작업 수준 또는 오차 응용 범위 내에서 모든 결과를 달성하기 위하여 각각의 OCR 프로세스의 결과를 비교하고 가중치를 부여하는 시스템 및 방법이 필요하다. 이러한 수준 또는 응용 범위는 응용에 따라 변경될 수 있다. 그러나, 비교 수준 및/또는 가중치의 할당은 다양한 응용 분야에 걸친 공지된 컴퓨터 수단에 의해 적용될 수 있는 통계한 상의 문제이다. 투표 및 폴링(polling)을 함으로써 우리는 복수의 독립된 OCR 결과를 폴링할 수 있고 그럼으로써 OCR 프로세스에 존재하는 오류율이 감소될 것이다.
OCR 프로세스를 향상시키는 일반 분야는 종래 기술에서 제시되어 왔다. 도 1은 몇몇의 OCR 프로세스(1 내지 3)가 일련으로(14) 배열되어 있는 구성을 개시한다. 이미지(10)는 제1 OCR 프로세스(1), 제2 OCR 프로세스(2), 제3 OCR 프로세스(3) 순서로, 앞의 프로세스가 이미지(10)를 판독하고 디코딩하는 것을 실패한다 면, 차례로 도입된다. 이미지가 3개의 OCR 프로세스 중 하나에 의해 효과적으로 판독되고 디코딩된다면, 결과(12)가 산출된다. 이러한 구성은 이미지를 디코딩할 때는 효과적이지만, 많은 응용 분야에서 너무 높을 수 있는 오류율 또한 유지한다. 높은 오류율에 대한 한가지 이유는 이미지 판독 및 디코딩에 모두 접근했거나 전혀 접근하지 않았기 때문이다. 여기서, 이미지는 3개의 OCR 프로세스 중 하나에 의해 디코딩되었거나 오류가 일어난다. 그 외의 경우는 일어나지 않는다.
도 2는 각각이 보우터(voter)(22)에 더 접속되는, 병렬로 배열된(20) 도 1의 3개의 OCR 프로세스(1 내지 3)를 도시한다. 보우터는 합의를 얻기 위한 시도를 하고 다수결의 규칙에 기초하여 이미지 판독 및 디코딩의 OCR 프로세스들의 결과 중에서 선택한다. 폴링을 효과적으로 하도록 수신지 주소를 디코딩하기 위해서는 3개의 OCR 프로세스 중 적어도 2개가 동의해야 한다. 이러한 방법의 문제점은 적어도 3개의 OCR 프로세스를 동작시키고, 신뢰성 등급화를 어렵게 하는, 종종 서로 호환되지 않는 OCR 프로세스의 내재적인 독점 프로세스들을 획득하고 이들과 함께 작업하는 데에 관련된 비용이다.
도 3은 2개의 OCR 프로세스들을 가지는 도 2의 병렬 보우터 구성을 도시한다. 이는 도 2에서, 각각 3개의 OCR 프로세스들이 필요한 것보다 경제적인 구성을 나타내거나 이 3개의 OCR 프로세스 중 하나가 완전하게 대상 주소를 분석할 수 없는 환경을 나타낼 것이다. 본질적으로 이 동작은 도 2에서와 같지만, 3개의 OCR 프로세스들과는 대조적으로 오직 2개의 프로세스들 만이 이용된다. 그러나, 다수결 투표에 기초하는 결정은 단지 2개의 OCR 프로세스들에서는 가능하지 않다.
종래 기술에서, 주소 디코드의 최대 깊이를 나타내는 결과가 어떤 것인지 선택하는 것 또는 각각의 OCR 프로세스에 내재된(일반적으로 OCR 프로세스와 제조업체 소유자 간에 고유한) 데이터들을 이용하여 관련된 신뢰 수준을 할당하고 이에 따라 경쟁하는 다른 주소 디코드들 간에서 선택하는 것과 같은 최종적인 거의 신뢰되는 디코드의 판별을 위한 몇 가지 접근법이 주어진다.
종래의 프로세스들에는 아직도 문제점이 있는데, 다시 말하면, 주소록 오류 또는 불충분한 임계치(thresholding)가 일으키는 디코드의 깊이에 기초하는 결함에 민감한 문제점들이 남아있다. 또한, 프로세스들은 OCR 프로세스 성능의 결정에 전적으로 의존하거나 전혀 의존하지 않는다. 또 다른 종래 기술 해결책은 OCR의 내재적인 프로세스들을 액세스하도록 하여 이용되고 있는 OCR 프로세스들의 내재적 성능 수준에 기초하여 신뢰 수준을 생성하는 것이다. 이러한 해결책은, 상술한 바와 같이, 추가적인 처리 및 OCR 내부 처리에 관련된 독점 정보로 종종 액세스하는 부담을 짊어진다. 또한, OCR 프로세스들의 다양한 벤더들이 이용하는 신뢰도 측정은 종종 서로 호환되지 않는다. 따라서, 가장 가능성이 높고 가능한 가장 정확한 결과에 도달하도록 정보를 최대한 이용하게 하는 OCR 프로세스들의 실질적인 폴링이 필요하다.
본 발명의 이점은 이미지를 판독하고 디코딩하는 것에 관련하여 2개 이상의 OCR 프로세스의 성능을 향상시킨다는 것이다. 이 목적 및 다른 목적은 특정 OCR 프로세스에 의한 특정한 판독 및 디코딩의 다양한 성능 성과의 가중된 일람표를 만드는 종래의 해결책의 접근법을 모두 줄이거나 전혀 줄이지 않음으로써 이루어진다. 이러한 가중은 시간에 따라 모아진 성능 데이터 및/또는 유사한 환경 하의 과거 OCR 프로세스 성능 평가에 기초하여 미리 알려질 수 있다. 이러한 과거 성능은 적절하게 액세스되는 저장된 데이터 레코드(record)를 통하여 이용가능하게 되거나 적절한 OCR 프로세스 애플리케이션에 의해 검색된다. 이러한 데이터 레코드는 또한 무작위로 선택된 폴링 결정을 진리화(truth)하기 위해 비디오 코딩 연산자를 이용함으로써 지속적으로 갱신되므로 스캐닝 및 OCR 프로세스 중에 명목상으로 명백한 카테고리에 한번 더 기초하여 소정의 OCR 프로세스의 상대 성능을 지속적으로 확인하고 정련할 수 있다. 이러한 정보는 전자적으로 저장되기 때문에, 지리적 제한 또는 언어 제한 - 후자는 표준 애플리케이션에 의해 극복된다 - 없이 다수의 응용에 이용될 수 있다.
데이터 레코드는 자동 처리 중에 명목상으로 평가될 수 있는 분류 또는 이벤트 설정에 적용되는 OCR 프로세스 성능에 관련된다. 이러한 분류는 편지 vs. 규격 소포(flat) vs. 소포, 투명한 창봉투(window envelope), 숫자 바탕 vs. 영문자 바탕, 문ㆍ숫자 피치(pitch) 및 폰트, 두드러지는 경사도(skew), 수기 vs. 기계 인쇄, 색 배경, 간섭 배경(전반적인 방해), 자모 인쇄(matrix print), 발신(outward) 주소, 수신(inward) 주소, 수취인, 이서 판독, 및 우표값 판독을 포함한다. 다른 고려사항 또한 이용될 수 있다.
전술된 기준에 기초하는 데이터 레코드는 OCR 프로세스 기반 성능 가중치를 제공하기 위해 통계적으로 정량화된다. 예로서, 우리가 규격 소포 vs 편지를 판독하고 있는지 등의 통계적으로 측정된 인자에 기초하여 디코드에 대하여 수락하도록 또는 통계적인 방식으로 숫자 및 창봉투를 가지는 규격 소포에 대한 장점의 각각의 인자를 결합하도록, OCR 프로세스를 선택할 수 있다.
일단 결정되면, 전술된 기준에 관련되는 그 OCR 프로세스의 결과가 주어질 것이며 다른 OCR 프로세스들의 결과에 대하여 폴링 선택이 고려된다. 따라서, 복수의 OCR 프로세스 각각의 강력한 점, 즉, 가장 성공적인 양태는 판독 및 디코딩이 합쳐지게 되도록 폴링되는 것이다.
본 발명의 상술된 이점 및 다른 이점은 이하의 명세서 및 첨부된 특허 청구 범위로부터 도면과 관련되어 설명될 때 명백하게 될 것이다.
도 1 및 도 3은 종래의 프로세스들을 도시하는 도면.
도 4는 복수의 OCR 프로세스의 성능 모니터링을 도시하는 도면.
도 5는 숫자 성능을 도시하는 도면.
도 6은 편지 성능을 도시하는 도면.
도 7은 규격 소포 성능을 도시하는 도면.
도 8은 결정에 가중치가 부여되는 동작 단계를 도시하는 도면.
도 9는 숫자 가중치를 도시하는 도면.
도 10은 편지 가중치를 도시하는 도면.
도 11은 본 방법의 흐름도를 도시하는 도면.
이제 본 발명이 상기 열거된 도면에 관련하여, 도 4를 시작으로, 기술될 것이며, 동일한 참조번호는 동일한 구성요소를 참조한다. 도 4는 성능 모니터링(40)을 도시하는데, 여기서는 데이터가 수동 인코딩 중에 제공되는, 두 OCR 프로세스들 모두에게 보편적인 미리 설정된 분류에 따른 개개의 결과들에 기초하여 폴링된다(42). 통계적인 분류는 편지 vs. 규격 소포 vs. 소포, 투명한 창봉투, 숫자 바탕 vs. 영문자 바탕, 문ㆍ숫자 피치(pitch) 및 폰트, 측정가능한 경사도, 수기 vs. 기계 인쇄, 색 배경, 간섭 배경(전반적인 방해), 자모 인쇄, 발신 주소, 수신 주소, 수취인, 이서, 및 우표값을 포함한다. 본 기술 분야에서 숙련된 기술을 가진 자에 의해 고려될 수 있는 다른 고려사항이 포함될 수 있다.
이러한 통계적 분류는 종래 기술의 테스팅에 의해 이루어지고 인코더에게, OCR 프로세스들이 서로 다른, 무작위로 선택된 폴링 이벤트를 진리화하게 함으로써 갱신하고 정련될 수 있다. 인코더는 모두, 거의 모두, 또는 다른 개수의 성공적이지 않게 디코딩된 이미지를 수신할 수 있다. 또한, 분류의 개수 및 유형은 응용 따라 달라질 수 있다. 전 세계적인 응용 및 이러한 분류의 통상적인 수치적인 응답을 고려하면, 분류 언어는 이치에 맞지 않고 인코더의 지리적인 위치 또한 마찬가지로 유동적이다. 오히려 상기 기준 중 적어도 하나에 관련하여 OCR 프로세스의 성능의 표시자를 찾게 된다. 본원의 목적을 위하여 (도 4에서) 이미지(24)가 3개의 OCR 프로세스(1 내지 3)에 제공되었다고 가정할 것이다. 본 발명은 경쟁하는 오직 2개의 (즉 짝수 개의) OCR 프로세스들에 대한 결정이 이루어져야 할 때의 특정 값을 가지지만, 인용된 예는 임의의 내부 사양 또는 독점 내부 정보를 요구하지 않음에 의하여 복수의 OCR 프로세스들의 융화의 용이성을 강조하기 위하여 3개의 OCR 프로세스들이 경쟁한다고 도시한다.
도 4는 성능 기초 OCR 처리(44)를 도시한다. 그러므로, OCR 프로세스들은 폴링되고 상술한 바와 같이 매 분류마다 전에 계산된 통계적 가중치에 기초하여 디코딩이 선택된다. 후속 도면에 도시될 바와 같이, 동작중에 일단 적어도 각 기준이나 분류마다 개개의 OCR 프로세스 성능에 관련하여 작업가능한 데이터 양이 축적된다면, 각각의 OCR 프로세스에는 결정 프로세스를 위하여 그에 따라 가중치가 부여될 수 있다. 또한, 무작위 폴링 결정을 통해 연산자를 진리화함으로써 분석 및 정련이 일어날 수 있으며, 그 결과에 의해 지시된 바와 같이 분류를 지원하는 통계를 갱신/정련할 수 있다.
예로서, 도 5에서, 각각의 OCR 프로세스(1 내지 3)는 그 높이가 성공적으로 숫자를 판독 및 디코딩하는 데에 대한 각각의 OCR 프로세스 성능(56)을 나타내는 바 그래프(50, 52, 54)를 포함한다. 도시된 바와 같이, OCR 프로세스(2)는 가장 높게 등급화되고(52), OCR 프로세스(1)가 그 다음으로 높게 등급화되며(50), OCR 프로세스(3)가 그 다음으로 높게 등급화된다(54). 동작 중에, 폴링 엘리먼트(42)는 (바 그래프로 도시된) 관련 데이터 레코드들을 찾기 위하여 데이터베이스를 검색하고, 가장 큰 값(여기서는 참조번호(52))을 전자적으로 판정하고 가중된 값을 OCR(2)에 제공한다. 이 값이 수락될 수 있는 응용 허용치 내에 있으면(다음으로 근접한 OCR 프로세스가 널(null)이라는 가설을 거부), 숫자를 읽고 코딩하는 OCR 2는 올바르다고 가정될 것이다. 이러한 데이터 검색 및 평가는 적절하게 프로그래 밍된 컴퓨터와 같은 적절한 전자적 수단에 의해 자동적으로 수행된다.
도 6은 이 예에서는 편지(66)를 포함하는 우편물의 판독 및 코딩에 적용되는 상술한 프로세스를 도시한다. OCR 프로세스들은 각각 편지들의 성능에 대한 등급(60, 62, 64)을 가진다.
도 7은 규격 소포(76)의 판독 및 코딩에 적용되는 다른 OCR 프로세스 등급(70, 72, 74)을 도시한다. 이러한 배치는 OCR 프로세스들에 공통적인 모든 고려 사항에 적용된다고 인식될 수 있다.
도 8은 폴링 엘리먼트(42)에 의해 자동적으로 수행되는 결정 프로세스(80)를 도시한다. 판정 프로세스에 영향을 미치도록 적절히 구성된 다른 수단이 폴링과 함께 이용되거나 폴링 대신에 이용될 수 있다. 적절한 판독 및 코딩을 위한 가중치 및 응용 요구사항을 지원하는 데이터의 요구량은 변한다.
도 9는 숫자(96)에 관련된 가중된 결정을 도시한다. 상술한 바와 같이, 가중된 결정은 바 그래프 형태로 도시된다. 도 9의 바 그래프(90, 92, 94)는 역시 숫자들을 처리하는 도 5의 바 그래프(50, 52, 54)의 값에 대응한다. 둘 다 편지를 처리하는 도 10(100, 102 및 104)과 도 6(60, 62, 64) 간의 관계와 동일한 관계임을 알 수 있다.
널 가정 테스팅(Null Hypotheses Testing)과 같은 공지된 통계적 기법은 오직 통계적으로 상당히 관련되는 차이만이 최종 폴링 결정 프로세스에 반영되도록 인코더 평가를 OCR의 가중치에 관련된 결정에 매핑시키는 데에 이용될 수 있다.
도 11은 적어도 2개의 OCR 프로세스를 가지는 이미지를 스캐닝하는 단 계(112)에 따른 방법의 흐름도이다. 본 발명은 임의의 개수의 OCR 프로세스와 함께 이용될 수 있다. 모든 OCR 프로세스가 성공적으로 이미지를 디코딩하였는지에 대한 판정이 이루어진다(114). OCR 프로세스가 성공적으로 이미지를 디코딩하지 않았다면(116), 방법은 종료하고(118), 이미지는 비디오 코딩으로 진행될 가능성이 가장 높을 것이다.
OCR 프로세스가 이미지를 성공적으로 판독하였다면(120), 다른 판정, 즉, OCR 프로세스가 거의 동일한 결과를 산출했는지 여부에 대한 판정이 이루어진다(122). OCR 프로세스가 현재 응용이 요구하는 충분한 신뢰성으로 거의 동일한 결과를 산출했다면(124), 폴링할 필요가 없어지며 방법은 종료한다(118).
OCR 프로세스가 거의 동일한 결과를 산출하지 않았다면(123), 방법은 폴링하기를 계속한다. 여기에서, 가장 가중치가 높은 OCR 프로세스 분류 기반 성능이 올바른 디코딩으로서 수락되고(136) 프로세스는 종료한다(118).
제2 폴링 관련 단계는 통계적 추론의 정확성을 더 향상시키도록 무작위로 선택된 폴링 결정을 수동으로 진리화하는 것(125)을 포함한다. 따라서, 연산자 비디오는 이미지를 코딩하고(126), 폴링 판정의 정확함을 나타내며, 관련 OCR 프로세스에 대한 통계가 더욱 향상되거나, 폴링에 오류가 있다면, 관련 OCR 프로세스 가중치는 감소한다(128). 그 다음 방법은 종료된다(118).

Claims (19)

  1. 이미지를 디코딩하는 방법으로서,
    적어도 제1 OCR(optical character recognition) 프로세스 및 제2 OCR 프로세스를 병렬로 이미지에 적용시키는 단계 - 상기 이미지는 복수의 분류(categorization)를 포함함 -,
    상기 제1 OCR 프로세스 및 제2 OCR 프로세스가 거의 유사한 이미지 결과를 산출하는지 판정하는 단계,
    상기 이미지 결과가 유사하지 않다면, 가장 높은 가중치를 가지는 OCR 프로세스 분류 기반 결과를 선택하는 단계, 및
    상기 가장 높은 가중치를 가지는 OCR 프로세스 분류 기반 결과를 분류별로 상기 이미지 결과에 할당하는 단계
    를 포함하는 방법.
  2. 제1항에 있어서,
    상기 분류들 중 적어도 하나는 상기 이미지가 인쇄되어진 봉투의 식별에 관한 것인 방법.
  3. 제2항에 있어서,
    상기 적어도 하나의 분류는 상기 이미지가 수기로 되어 있는지 기계 인쇄로 되어 있는지에 관한 것인 방법.
  4. 제3항에 있어서,
    상기 적어도 하나의 분류는 상기 이미지가 수기로 되어 있는지 기계 인쇄로 되어 있는지에 관한 것인 방법.
  5. 제3항에 있어서,
    상기 적어도 하나의 분류는 상기 봉투의 배경색을 식별하는 것에 관한 것인 방법.
  6. 제3항에 있어서,
    상기 적어도 하나의 분류는 상기 봉투가 창봉투(window envelope)인지 창봉투가 아닌지에 관한 것인 방법.
  7. 제3항에 있어서,
    상기 적어도 하나의 분류는 상기 이미지가 우편번호가 있는 주소인지 우편번호가 없는 주소인지에 관한 것인 방법.
  8. 제3항에 있어서,
    상기 적어도 하나의 분류는 상기 이미지가 기울어졌는지에 관한 것인 방법.
  9. 제3항에 있어서,
    상기 적어도 하나의 분류는 상기 봉투가 광택이 있는지에 관한 것인 방법.
  10. 제3항에 있어서,
    상기 적어도 하나의 분류는 상기 이미지가 규격 소포 상에 인쇄되었는지 규격 우편물 상에 인쇄되었는지에 관한 것인 방법.
  11. 제3항에 있어서,
    상기 적어도 하나의 분류는 숫자에 관한 것인 방법.
  12. 제3항에 있어서,
    상기 적어도 하나의 분류는 편지에 관한 것인 방법.
  13. 제3항에 있어서,
    상기 적어도 하나의 분류는 규격 소포에 관한 것인 방법.
  14. 제3항에 있어서,
    상기 적어도 하나의 분류는 수신 분류(inward sorting) 프로세스에 관한 것인 방법.
  15. 제3항에 있어서,
    상기 적어도 하나의 분류는 발신 분류(outward sorting) 프로세스에 관한 것인 방법.
  16. 제1항 내지 15항 기재의 방법의 단계를 수행하는 컴퓨터의 용도.
  17. 제1항 내지 15항 기재의 방법의 단계를 실행시키는 프로세서를 동작하는 소프트웨어의 용도.
  18. 이미지를 디코딩하는 방법으로서,
    적어도 제1 OCR 프로세스 및 제2 OCR 프로세스를 병렬로 이미지에 적용시키는 단계 - 상기 이미지는 복수의 분류를 포함함 -,
    상기 제1 OCR 프로세스 및 제2 OCR 프로세스가 거의 유사한 이미지 결과를 산출하는지 판정하는 단계,
    상기 이미지 결과가 유사하지 않다면, 상기 이미지를 수동으로 인코딩하는 단계, 및
    이미지 인코딩에 기초하여 OCR 프로세스의 가중치를 통계적으로 갱신하는 단계
    를 포함하는 디코딩 방법.
  19. 제18항 기재의 방법의 단계를 수행하는 컴퓨터의 용도.
KR1020067009699A 2003-11-18 2004-11-18 스마트 폴링을 위한 시스템 및 방법 KR20060105756A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US52065803P 2003-11-18 2003-11-18
US60/520,658 2003-11-18

Publications (1)

Publication Number Publication Date
KR20060105756A true KR20060105756A (ko) 2006-10-11

Family

ID=34619501

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020067009617A KR20060097129A (ko) 2003-11-18 2004-11-15 우편물을 전송하기 위한 방법 및 장치
KR1020067009699A KR20060105756A (ko) 2003-11-18 2004-11-18 스마트 폴링을 위한 시스템 및 방법

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020067009617A KR20060097129A (ko) 2003-11-18 2004-11-15 우편물을 전송하기 위한 방법 및 장치

Country Status (6)

Country Link
US (1) US20070144947A1 (ko)
EP (2) EP1684919A1 (ko)
JP (2) JP2007511840A (ko)
KR (2) KR20060097129A (ko)
CN (2) CN1882395B (ko)
WO (3) WO2005049232A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2918199B1 (fr) 2007-06-26 2009-08-21 Solystic Sas Procede de traitement d'envois postaux exploitant l'identification virtuelle des envois avec le readressage
US8875139B2 (en) * 2010-07-30 2014-10-28 Mavro Imaging, Llc Method and process for tracking documents by monitoring each document's electronic processing status and physical location
CN112667831B (zh) * 2020-12-25 2022-08-05 上海硬通网络科技有限公司 素材存储方法、装置及电子设备

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3634822A (en) * 1969-01-15 1972-01-11 Ibm Method and apparatus for style and specimen identification
JP3038344B2 (ja) * 1987-02-24 2000-05-08 株式会社東芝 郵便物読取処理装置
US4845761A (en) * 1987-04-17 1989-07-04 Recognition Equipment Incorporated Letter mail address block locator system
US5131053A (en) * 1988-08-10 1992-07-14 Caere Corporation Optical character recognition method and apparatus
US5146403A (en) * 1988-12-13 1992-09-08 Postal Buddy Corporation Change of address system and method of using same
US5703783A (en) * 1992-04-06 1997-12-30 Electrocom Automation, L.P. Apparatus for intercepting and forwarding incorrectly addressed postal mail
US5455872A (en) * 1993-04-26 1995-10-03 International Business Machines Corporation System and method for enhanced character recogngition accuracy by adaptive probability weighting
JP2977431B2 (ja) * 1993-12-27 1999-11-15 株式会社東芝 ビデオコーディング装置
US5737438A (en) * 1994-03-07 1998-04-07 International Business Machine Corp. Image processing
DE4407998C2 (de) * 1994-03-10 1996-03-14 Ibm Verfahren und Vorrichtung zur Erkennung eines Musters auf einem Beleg
US5519786A (en) * 1994-08-09 1996-05-21 Trw Inc. Method and apparatus for implementing a weighted voting scheme for multiple optical character recognition systems
US5612889A (en) * 1994-10-04 1997-03-18 Pitney Bowes Inc. Mail processing system with unique mailpiece authorization assigned in advance of mailpieces entering carrier service mail processing stream
US6246794B1 (en) * 1995-12-13 2001-06-12 Hitachi, Ltd. Method of reading characters and method of reading postal addresses
US6405243B1 (en) * 1996-04-05 2002-06-11 Sun Microsystems, Inc. Method and system for updating email addresses
DE19644163A1 (de) * 1996-10-24 1998-05-07 Siemens Ag Verfahren und Vorrichtung zur online-Bearbeitung von weiterzuleitenden Sendungen
DE10007897C1 (de) 2000-02-21 2001-06-28 Siemens Ag Verfahren zum Verteilen von Sendungen
US6741724B1 (en) * 2000-03-24 2004-05-25 Siemens Dematic Postal Automation, L.P. Method and system for form processing
US20020029202A1 (en) * 2000-04-18 2002-03-07 Lopez Steven W. System and methods for unified routing of mailpieces and processing sender notifications
WO2001084812A2 (en) * 2000-05-03 2001-11-08 Daniel Schoeffler Method of enabling transmission and reception of communication when current destination for recipient is unknown to sender
US7647231B2 (en) * 2000-10-13 2010-01-12 United States Postal Service Flexible mail delivery system and method
US20020107820A1 (en) * 2000-12-01 2002-08-08 Stephen Huxter Single courier model for the delivery of goods ordered by the internet
US7085811B2 (en) 2001-03-27 2006-08-01 Pitney Bowes Inc. Sender elected messaging services
WO2002080520A2 (en) * 2001-03-30 2002-10-10 Siemens Dematic Postal Automation, L.P. Method and system for image processing
CN1378363A (zh) * 2001-04-04 2002-11-06 英保达股份有限公司 转寄信息家电的电子邮件的方法及其装置
US6635872B2 (en) * 2001-04-05 2003-10-21 Applied Materials, Inc. Defect inspection efficiency improvement with in-situ statistical analysis of defect data during inspection
US6829369B2 (en) * 2001-05-18 2004-12-07 Lockheed Martin Corporation Coding depth file and method of postal address processing using a coding depth file
DE10149622A1 (de) * 2001-10-09 2003-04-30 Deutsche Post Ag Elektronische Paketfachanlage und Verfahren zu ihrem Betreiben
US6779714B2 (en) * 2001-10-29 2004-08-24 Honeywell International Inc. Biologically safe mail box
DE50300459D1 (de) * 2002-08-29 2005-05-25 Siemens Ag Verfahren und einrichtung zum lesen von sendungs- oder dokumentenaufschriften
US20050192913A1 (en) * 2003-07-29 2005-09-01 International Business Machies Corporation Postal services method and system
US7937333B2 (en) * 2003-09-19 2011-05-03 Pitney Bowes Inc. System and method for facilitating refunds of unused postage

Also Published As

Publication number Publication date
WO2005049234A2 (en) 2005-06-02
EP1684919A1 (en) 2006-08-02
JP2007511842A (ja) 2007-05-10
US20070144947A1 (en) 2007-06-28
EP1685523A1 (en) 2006-08-02
KR20060097129A (ko) 2006-09-13
CN1882954A (zh) 2006-12-20
JP2007511840A (ja) 2007-05-10
WO2005049232A1 (en) 2005-06-02
CN1882395B (zh) 2010-12-29
WO2005050545A1 (en) 2005-06-02
CN1882954B (zh) 2010-10-27
CN1882395A (zh) 2006-12-20
WO2005049234A3 (en) 2005-07-28

Similar Documents

Publication Publication Date Title
US9378433B2 (en) Method and system for address result arbitration
EP1312038B1 (en) Orthogonal technology for multi-line character recognition
US5933531A (en) Verification and correction method and system for optical character recognition
US7092561B2 (en) Character recognition, including method and system for processing checks with invalidated MICR lines
US5805747A (en) Apparatus and method for OCR character and confidence determination using multiple OCR devices
US7539326B2 (en) Method for verifying an intended address by OCR percentage address matching
US6295387B1 (en) Method and apparatus for determination of verified data
JP5003051B2 (ja) 郵便自動区分機及び郵便自動区分方法
US7694216B2 (en) Automatic assignment of field labels
US20040146200A1 (en) Segmenting touching characters in an optical character recognition system to provide multiple segmentations
US20100023490A1 (en) Method of, and Apparatus for, Controlling the Transportation of Articles, and Arrangement for Transporting a Plurality of Articles
CN113128504A (zh) 一种基于校验规则的ocr识别结果纠错方法、设备
KR20060105756A (ko) 스마트 폴링을 위한 시스템 및 방법
US7590260B2 (en) Method and apparatus for video coding by validation matrix
US6947574B1 (en) Method and system for interleaving OCR and ABL for automated mail sorting
CA2036274A1 (en) Document processor including method and apparatus for identifying and correcting errors
US20040024716A1 (en) Mail sorting processes and systems
US20070104370A1 (en) System and method for smart polling
EP0446633A2 (en) Document processor including method and apparatus for identifying and correcting errors
JP3243000B2 (ja) 郵便物処理装置および郵便物処理方法
JP2002536769A (ja) ドキュメントエントリおよびアドレス読出し方法
Leedham et al. Handwritten country name identification using vector quantisation and hidden Markov model
JP2000090190A (ja) 個別管理情報検査装置
JP3088036B2 (ja) 宛名読取区分機
US20020178408A1 (en) Method for ascertaining error types for incorrect reading results

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application