KR100498683B1 - 문자 인식장치 및 그 방법과 문자인식 프로그램을 기록한 컴퓨터 판독 가능한 기록매체 - Google Patents

문자 인식장치 및 그 방법과 문자인식 프로그램을 기록한 컴퓨터 판독 가능한 기록매체 Download PDF

Info

Publication number
KR100498683B1
KR100498683B1 KR10-1998-0056074A KR19980056074A KR100498683B1 KR 100498683 B1 KR100498683 B1 KR 100498683B1 KR 19980056074 A KR19980056074 A KR 19980056074A KR 100498683 B1 KR100498683 B1 KR 100498683B1
Authority
KR
South Korea
Prior art keywords
character
group
similarity
image
recognition
Prior art date
Application number
KR10-1998-0056074A
Other languages
English (en)
Other versions
KR19990063196A (ko
Inventor
마리코 다케노우치
사키 다카쿠라
이치로 나카오
Original Assignee
마츠시타 덴끼 산교 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마츠시타 덴끼 산교 가부시키가이샤 filed Critical 마츠시타 덴끼 산교 가부시키가이샤
Publication of KR19990063196A publication Critical patent/KR19990063196A/ko
Application granted granted Critical
Publication of KR100498683B1 publication Critical patent/KR100498683B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)

Abstract

문자화상 입력부는 정규화된 2값화 인식대상 문자화상을 입력한다. 화상영역 분할부는 문자화상의 존재영역을 16분할한다. 특징량 추출부는 분할된 각 영역마다의 특징량을 추출한다. 화상영역 분류부는 각 영역을 2군으로 분류한다. 인식부는 제 1군과 제 2군을 따로따로 인식대상 문자화상의 특징량과 인식사전의 표준 특징량과의 시가지 거리를 계산하고, 제 1군과 제 2군의 각각의 시가지 거리에 소정의 계수를 곱하여 합계하고, 가장 가까운 표준문자를 인식결과로 한다.

Description

문자 인식장치 및 그 방법과 문자인식 프로그램을 기록한 컴퓨터 판독 가능한 기록매체{A CHARACTER RECOGNITION APPARATUS, A CHARACTER RECOGNITION METHOD, AND A COMPUTER-READABLE STORAGE MEDIUM RECORDING A CHARACTER RECOGNITION APPARATUS}
본 발명은 입력된 인식대상 문자화상으로부터 문자를 인식하는 문자 인식장치 및 그 방법에 관한 것이다.
종래 문자인식의 정밀도를 향상시키기 위한 것으로서 일본국 특개소 61- 125688호 공보에 기재된 문자 인식장치가 있다. 이 장치는 정규화된 표준적인 문자화상을 종횡 각각 4등분의 16영역으로 분할하고, 각 영역마다의 표준 특징량과 문자코드를 등록한 인식사전을 갖고 있다. 이 표준 특징량은 문자요소 부분을 나타내는 흑 화소 부분의 나열방법 패턴을 횡/좌상/종/우상의 4방향으로 분류하고, 영역에 포함되는 문자요소 부분의 4패턴 각각의 수를 구한 것이다. 따라서 인식사전에는 문자코드마다 각 영역의 4차원의 표준 특징량이 기재되고, 「4×16」의 64차원의 표준 특징량이 등록되어 있다.
이 장치에서는 인식대상 문자화상을 문자요소 부분을「흑」, 배경부분을「백」의 2값 화상으로 하여 입력하고, 「16×16」화소의 영역으로 정규화한 후, 종횡 각각 4화소씩의 16영역으로 분할하고, 각 영역에서 인식사전과 같은 특징량을 추출하고 있다.
다음으로 인식대상의 문자화상과 인식사전에 등록되어 있는 문자코드로 표시되는 문자의 유사도로서, 표준 특징량(64차원)과 추출한 특징량(마찬가지로 64차원)의 시가지 거리를 계산한다. 계산한 시가지 거리가 작은 것이 유사도가 높은 것이므로 입력된 문자화상을 시가지 거리가 최소로 되는 표준 특징량을 갖는 문자코드로 나타내어지는 문자로서 인식한다.
이와 같이 영역을 분할함으로써, 예를 들면 분할을 행하지 않고 「횡/좌상/종/우상」의 4패턴의 수를 표준 특징량으로 하는 경우에, 정확하게 인식되지 않았던 「土」와 「士」를 구별하여 인식할 수 있게 된다.
그러나 이러한 종래의 문자 인식장치에서는 문자화상을 2값의 화상으로 하여 입력하는 경우에, 예를 들면 스캐너의 해상도 등에 의해, 입력된 문자화상이 변형되어 있을 때에는 아무리 영역을 세분화하더라도, 또한 특징요소를 4패턴에서 8패턴으로 하여 특징량의 정밀도를 높이고, 유사도 계산의 정밀도를 높이더라도 정확하게 문자를 인식할 수는 없다.
구체 예를 들어 설명하기로 한다.
도 1과 도 2는 함께 정규화 된 문자「電」의 2값의 문자화상이다. 도 1에 도시된 문자화상「電」(101)은 스캐너에 의한 판독이 정확하게 행해지고 있지만, 도 2에 도시된 문자화상「電」(201)은 스캐너에 의한 판독시에 문자가 변형된 상태로 되어 있다. 이 2개의 문자화상「電」(101, 201)을 종래의 문자 인식장치로 문자인식하면 문자화상「電」(101)은 정확하게 문자「電」이라고 인식되지만 문자화상「電」(201)은 문자「t」라고 오 인식된다.
본 발명의 목적은 인식대상의 문자화상이 변형되어 있는 경우에도, 정확하게 문자를 인식할 수 있는 인식 정밀도가 향상된 문자 인식장치를 제공하기 위한 것이다.
본 발명의 목적은 이하의 구성으로 달성된다. 즉 인식대상 문자화상을 문자코드로서 인식하는 문자 인식장치는, 문자의 표준적인 화상을 N(N≥2)의 부분 화상영역으로 분할하고, 각 부분 화상영역에 포함되는 부분 문자화상의 표준특징을 문자단위로 문자코드와 함께 미리 등록하고 있는 인식사전과, 인식대상 문자화상을 N의 부분 화상영역으로 분할하는 화상영역 분할수단과, 상기 화상영역 분할수단에서 분할된 부분 화상영역에 포함되는 부분 문자화상의 특징을 추출하는 특징 추출수단과, 상기 화상영역 분할수단에서 분할된 부분 화상영역을 복수군으로 분류하는 부분 화상영역 분류수단과, 각 군마다 상기 인식대상 문자화상의 부분 문자화상의 특징과 상기 인식사전이 대응하는 표준 특징과의 기초 유사도를 계산하고, 각 군의 기초 유사도에 소정의 가중을 하여, 인식대상 문자화상과 상기 인식사전 문자와의 유사도를 계산하는 유사도 계산수단과, 상기 유사도가 가장 높은 문자를 인식문자로서 그 문자 코드를 선출하는 인식문자 선출수단을 포함하는 것으로 달성할 수 있다.
이러한 구성에 의해, 각 군의 기초 유사도에 각 군의 문자인식으로의 기여에 따른 경중을 부가하여 전체 유사도가 계산되므로, 인식대상 문자화상이 변형되어 있는 경우라도 문자인식의 정밀도가 향상된 문자 인식장치를 얻을 수 있다.
여기에서 상기 부분 화상영역 분류수단은, 상기 부분 화상영역을 인식대상 문자화상의 주변부의 제 1군과 중앙부의 제 2군으로 분류하는 주변·중앙 분류부를 포함하며, 상기 유사도 계산수단은 상기 제 1군과 제 2군의, 상기 부분 문자화상의 특징과 상기 인식사전의 대응하는 표준특징과의 시가지 거리, 유클리드 거리 또는 마할라노비스 거리(Mahalanobis distance)인 기초 유사도를 따로따로 계산하는 기초 유사도 계산부와, 상기 제 1군의 유사도에의 기여가 제 2군의 유사도에의 기여보다 커지도록 제 1군과 제 2군의 기초 유사도에 각각 소정의 계수를 곱하여 합계하는 유사도 합계부를 포함할 수 있다.
이러한 구성에 의해 일반적으로 인식대상 문자화상에서 변형이 생기는 문자화상의 중앙부의 기초 유사도의 기여를 작게 하여 유사도를 계산함으로써 문자인식의 정밀도를 향상시킬 수 있다.
여기에서 상기 유사도 합계부에서 곱해지는 계수는 제 1군의 기초 유사도에 대하여 1.0이고, 제 2군의 기초 유사도에 대하여 0.5이며, 상기 인식문자 선출수단은 유사도가 가장 작은 값의 문자를 유사도가 최고인 문자로서 선출할 수 있다.
이러한 구성에 의해 인식대상 문자화상의 중앙부의 유사도에의 기여를 주변부의 1/2로 함으로써 문자 인식률이 비약적으로 향상된다.
여기에서 상기 부분 화상영역 분류수단은 상기 부분 화상영역을 인식대상 문자화상 주변부의 제 1군과 중앙부의 제 2군으로 분류하는 주변·중앙 분류부를 포함하며, 상기 유사도 계산수단은 상기 제 1군의, 상기 부분 문자화상의 특징과 상기 인식사전의 대응하는 표준특징과의 시가지 거리, 유클리드 거리 또는 마할라노비스 거리인 상기 기초 유사도를 계산하여, 기초 유사도가 상위인 문자군을 상기 인식사전으로부터 후보문자로서 선출하는 후보문자 선출부와, 상기 후보문자 선출부에서 선출된 후보문자에 대하여 제 2군의 기초 유사도를 계산하는 제 2군 기초 유사도 계산부와, 상기 제 1군의 유사도에의 기여가 제 2군의 유사도에의 기여보다 커지도록 제 1군과 제 2군의 기초 유사도에 각각 소정의 계수를 곱하여 합계하는 유사도 합계부를 포함할 수 있다.
이러한 구성에 의해, 일반적으로 인식대상 문자화상에서 그 형상 특징을 잘 나타내고 있는 주변부의 특징으로부터 후보문자를 선출하고, 선출한 후보문자에 대해서만 전체의 유사도를 계산하도록 하고 있으므로 인식 정밀도의 향상과 함께 처리속도의 고속화를 도모할 수 있다.
여기에서 상기 문자 인식장치는 또한 형상이 유사한 문자의 표준적인 화상 군을 N(N≥2)의 부분 화상영역으로 분할하고, 각 부분 화상영역에 포함되는 부분 문자화상의 문자군 표준특징을 유사문자 단위의 문자코드 군과 함께 미리 등록하고 있는 문자군 분류사전을 포함하며, 상기 부분 화상영역 분류수단은 상기 부분 화상영역을 인식대상 문자화상 주변부의 제 1군과 중앙부의 제 2군으로 분류하는 주변·중앙 분류부를 포함하며, 문자 인식장치는 또한 상기 제 1군으로 분류된 인식대상 문자화상의 부분 문자화상의 특징과 상기 문자군 분류사전에 등록된 대응하는 문자군 표준 특징과의 유사도를 계산하고, 유사도가 높은 문자군의 문자코드를 선출하는 문자군 선출수단을 추가로 포함하며, 상기 유사도 계산수단은 상기 문자군 선출수단에서 선출된 문자코드에 대응하는 상기 인식사전에 등록된 표준 특징과의 사이에서만 인식대상의 부분 문자화상의 특징과의 유사도를 계산하며, 상기 유사도 계산수단은 상기 제 1군과 제 2군의, 상기 부분 문자화상의 특징과 상기 인식사전의 대응하는 표준 특징의 시가지 거리, 유클리드 거리 또는 마할라노비스 거리인 기초 유사도를 따로따로 계산하는 기초 유사도 계산부와, 상기 제 1군의 유사도에의 기여가 제 2군의 유사도에의 기여보다 커지도록 제 1군과 제 2군의 기초 유사도에 각각 소정의 계수를 곱하여 합계하는 유사도 합계부를 포함할 수 있다.
이러한 구성에 의해, 인식대상 문자화상의 특징을 잘 나타내는 부분의 특징을 이용하여, 형상이 유사한 유사문자 단위의 문자군을 선출하고, 선출된 문자군에 대하여 정밀도가 향상된 유사도를 계산하므로 인식 정밀도의 향상과 함께 더욱 처리속도의 고속화를 도모할 수 있다.
여기에서, 상기 부분 화상영역 분류수단은 상기 부분 화상영역을 차지하는 부분 문자화상의 비율을 각 부분 화상영역마다 계산하는 부분 문자화상 비율계산부와, 상기 부분 문자화상의 비율이 임계값 미만인지 이상인지의 여부에 따라 상기 부분 화상영역을 정상부의 제 1군과 변형부의 제 2군으로 분류하는 정상·변형부 판정부를 포함할 수 있다.
이러한 구성에 의해, 개별의 인식대상 문자화상의 각 부분 화상영역마다 정상부인지 변형부인지를 판단하여 제 1군과 제 2군으로 분류하여, 제 1군과 제 2군의 부분 화상영역의 기초 유사도에 소정의 가중을 하기 때문에 유사도의 신뢰성이 높아지고, 문자인식의 정밀도가 더욱 향상된다.
여기에서 상기 유사도 계산수단은, 상기 제 1군과 제 2군의, 상기 부분 문자화상의 특징과 상기 인식사전의 대응하는 표준 특징과의 시가지 거리, 유클리드 거리 또는 마할라노비스 거리인 기초 유사도를 따로따로 계산하는 기초 유사도 계산부와, 상기 제 1군의 유사도에의 기여가 제 2군의 유사도에의 기여보다도 커지도록 제 1군과 제 2군의 기초 유사도에 각각 소정의 계수를 곱하여 합계하는 유사도 합계부를 포함할 수 있다.
이러한 구성에 의해, 부분 화상영역의 변형부의 유사도에의 기여를 작게 하므로 인식 정밀도의 향상을 도모할 수 있다.
여기에서 상기 유사도 계산수단은, 상기 제 1군의, 부분 문자화상의 특징과 상기 인식사전의 대응하는 표준 특징과의 시가지 거리, 유클리드 거리 또는 마할라노비스 거리인 기초 유사도를 계산하고, 기초 유사도가 상위인 문자군을 상기 인식사전으로부터 후보문자로서 선출하는 후보문자 선출부와, 상기 후보문자 선출부에서 선출된 후보문자에 대하여 제 2군의 기초 유사도를 계산하는 제 2군 기초 유사도 계산부와, 상기 제 1군의 유사도에의 기여가 제 2군의 유사도에의 기여보다도 커지도록 제 1군과 제 2군의 기초 유사도에 각각 소정의 계수를 곱하여 합계하는 유사도 합계부를 포함할 수 있다.
이러한 구성에 의해, 정상부라고 판단된 부분 화상영역의 제 1군만의 유사도로부터 후보문자를 선출하고, 선출된 후보문자에 대하여 유사도를 계산하므로 처리속도의 고속화와 인식 정밀도의 향상을 도모할 수 있다.
여기에서 문자 인식장치는 또한 형상이 유사한 문자의 표준적인 화상 군을 N(N≥2)의 부분 화상영역으로 분할하고, 각 부분 화상영역에 포함되는 부분 문자화상의 문자군 표준 특징을 유사문자 단위의 문자 코드 군과 함께 미리 등록하고 있는 문자군 분류사전과, 상기 제 1군에 분류된 인식대상 문자화상의 부분 문자화상의 특징과 상기 문자군 분류사전에 등록된 대응하는 문자군 표준 특징과의 유사도를 계산하고, 유사도가 높은 문자군의 문자코드를 선출하는 문자군 선출수단을 포함하며, 상기 유사도 계산수단은 상기 문자군 선출수단에서 선출된 문자코드에 대응하는 상기 인식사전에 등록된 표준 특징과의 사이에서만 인식대상의 부분 문자화상의 특징과의 유사도를 계산하고, 상기 유사도 계산수단은 상기 제 1군과 제 2군의, 상기 부분 문자화상의 특징과 상기 인식사전의 대응하는 표준 특징과의 시가지 거리, 유클리드 거리 또는 마할라노비스 거리인 기초 유사도를 따로따로 계산하는 기초 유사도 계산부와, 상기 제 1군의 유사도에의 기여가 제 2군의 유사도에의 기여보다 커지도록 제 1군과 제 2군의 기초 유사도에 각각 소정의 계수를 곱하여 합계하는 유사도 합계부를 포함할 수 있다.
이러한 구성에 의해, 정상부라고 판단된 부분 화상영역의 특징으로부터 인식대상 문자화상의 문자를 포함하는 문자 군을 좁힐 수 있으므로 유사도 계산의 고속화가 도모된다.
여기에서 상기 임계값은 75%라고 할 수 있다.
이러한 구성에 의해, 정상부와 변형부의 제 1군과 제 2군의 분류가 적절히 행해져, 문자인식의 정밀도가 향상된다.
또한 본 발명의 목적은 이하의 구성으로 달성된다. 즉 인식대상 문자화상을 문자코드로서 인식하는 문자인식장치의 문자 인식방법은, 인식대상 문자화상을 N(N≥2)의 부분 화상영역으로 분할하는 화상영역 분할단계와, 상기 부분 화상영역에 포함되는 부분 문자화상의 특징을 추출하는 특징 추출단계와, 상기 부분 화상영역을 복수군으로 분류하는 부분 화상영역 분류단계와, 각 군마다 상기 인식대상 문자화상의 부분 문자화상의 특징과, 문자의 표준적인 화상을 N의 부분 화상영역으로 분할하고, 각 부분 화상영역에 포함되는 부분 문자화상의 표준 특징을 문자단위로 문자코드와 함께 미리 등록하고 있는 인식 사전의 대응하는 표준 특징과의 기초 유사도를 계산하고, 각 군의 기초 유사도에 소정의 가중을 하여 인식대상 문자화상과 상기 인식사전의 문자와의 유사도를 계산하는 유사도 계산단계와, 상기 유사도가 가장 높은 문자를 인식문자로 하여 그 문자코드를 선출하는 인식문자 선출단계를 갖는 것으로 달성된다.
이러한 구성에 의해, 각 군의 기초 유사도에 각 군의 문자인식으로의 기여에 따른 경중을 부가하여 전체의 유사도가 계산되므로, 인식대상 문자화상이 변형되어 있는 경우라도 문자인식의 정밀도가 향상된 문자 인식방법을 얻을 수 있다.
또 본 발명의 목적은 이하의 구성으로 달성된다. 즉 문자인식장치에 적용되는 컴퓨터 판독 가능한 기록매체로서, 문자의 표준적인 화상을 N(N≥2)의 부분 화상영역으로 분할하고, 각 부분 화상영역에 포함되는 부분 문자화상의 표준 특징을 문자단위로 문자코드와 함께 미리 등록하고 있는 인식 사전이 기록되고, 인식대상 문자화상을 N의 부분 화상영역으로 분할하는 화상영역 분할단계와, 상기 화상영역 분할단계에서 분할된 부분 화상영역에 포함되는 부분 문자화상의 특징을 추출하는 특징 추출단계와, 상기 화상영역 분할단계에서 분할된 부분 화상영역을 복수군으로 분류하는 부분 화상영역 분류단계와, 각 군마다 상기 인식대상 문자화상의 부분 문자화상의 특징과 상기 인식사전이 대응하는 표준특징과의 기초 유사도를 계산하고, 각 군의 기초 유사도에 소정의 가중을 하여, 인식대상 문자화상과 상기 인식사전의 문자와의 유사도를 계산하는 유사도 계산단계와, 상기 유사도가 가장 높은 문자를 인식문자로 하여 그 문자코드를 선출하는 인식문자 선출단계를 갖는 프로그램이 기록되어 있는 것으로 달성할 수 있다.
이러한 구성에 의해, 종래의 문자 인식장치에 이 기록매체를 장착하여 프로그램을 판독시킴으로써 인식대상 문자화상이 변형되어 있는 경우라도 인식 정밀도가 향상된 문자 인식장치로서 이용할 수 있다.
상술한 목적 및 기타의 목적과 본 발명의 특징 및 이점은 첨부 도면과 관련한 다음의 상세한 설명을 통해 보다 분명해 질 것이다.
이하 본 발명에 관한 문자 인식장치의 실시예를 도면을 이용하여 설명하기로 한다.
( 제 1 실시예 )
도 3은 본 발명에 관한 문자 인식장치의 제 1 실시예의 구성도이다.
이 문자 인식장치는 인식사전(301), 문자화상 입력부(302), 화상영역 분할부(303), 특징량 추출부(304), 화상영역 분류부(305), 인식부(306) 및 인식결과 출력부(307)를 구비하고 있다.
인식사전(301)은 문자마다 문자코드와 문자의 표준적인 문자화상의 특징을 나타내는 표준 특징량을 미리 등록하고 있다.
도 4의 (a)는 인식사전(301)의 등록내용의 일례를 도시한 예시도이다. 등록내용(401)은 숫자「1」에 대한 문자코드(402)와 표준 특징량(403)을 포함하고 있다. 이 표준 특징량(403)의 추출 대상이 된 숫자「1」의 표준적인 문자화상을 도 4의 (b)에 도시한다.
문자화상(404)은 종횡 각각 16화소의 정규화된 영역에 문자요소부분을「흑」화소로, 배경부분을「백」화소로 나타내고 있다.
이 문자화상(404)의 표준 특징량(403)을 추출하기 위해 문자화상(404)을 N의 영역(여기에서는 N=16)으로 분할하고 있다. 도면에서는 점선으로 나타내는 바와 같이 종횡 각각「4」화소씩으로 등분할한 「16」영역으로 하고 있다.
표준 특징량(403)은 도 5에 도시된 바와 같은 문자화상(404)의「흑」화소와「백」화소의 경계점에서의「흑」화소의 나열방법의 패턴을 특징 요소로 하고, 그 패턴과 일치하는 수를 분할된 영역마다 계수한 것이다. 특징요소「횡」(501)은 「흑」화소의 횡방향의 나열방법의 패턴(502, 503)으로 나타내어진다. 화소에 부가되어 있는 「*」는 문자요소부분과 배경부분의 경계점을 주목화소로 하고 있는 것을 나타낸다. 특징요소「좌상」(504)은 흑화소의 좌상방향의 나열방법의 패턴(505, 506)으로 나타내어진다. 여기에서「◎」은「흑」화소여도 되고「백」화소여도 되는 것을 나타낸다. 특징요소 「종」(507)은 「흑」화소의 종방향의 나열방법의 패턴(508, 509)으로 나타내어진다. 특징요소 「우상」(510)은 「흑」화소의 우상 방향의 나열방법의 패턴(511, 512)으로 나타내어진다.
도 4의 (b)의 영역(405)에서 특징요소(501, 504, 507, 510)의 출현수를 계수하면 「횡」(501)은 「흑」화소(406)를 주목화소로 하여 나열방법의 패턴(502)이 1회, 「흑」화소(407)를 주목화소로 하여 나열방법의 패턴(503)이 1회 출현하고, 특징요소「횡」(501)의 표준 특징량은「2」가 된다. 또한 영역(405)의「백」화소(408)를 주목화소로 하면 「좌상」의 나열방법의 패턴(505)이 1회 출현한다. 이에 따라, 특징요소「좌상」(504)의 표준 특징량은 「1」이 된다. 특징요소「종」(507)의 나열방법의 패턴(508, 509)은 영역(405)에 출현하지 않으므로 표준 특징량은 「0」이 된다. 또한 영역(405)의「백」화소(409, 410)를 각각 주목화소로 하여 나열방법의 패턴(511)이 2회 출현한다. 이에 따라 특징요소「우상」(510)의 표준 특징량은 「2」가 된다. 도 4의 (a)의 표준 특징량(403)의 <횡 1> <종 1>로 특정되는(영역(405)에 대응하는) 표준 특징량은 「2, 1, 0, 2」이다.
마찬가지로, 영역(411)에서는 「흑」화소(412, 413, 414, 415)를 주목화소로 하여 나열방법의 패턴(502)이 4회 출현한다. 이에 따라 특징요소「횡」(501)의 표준 특징량은 「4」가 된다. 도 4의 (a)의 표준 특징량(403)의 <횡 1> <종 2>로 특정되는(영역(411)에 대응하는) 표준 특징량은 「4, 0, 0, 0」이다. 또 영역(411)의 상측(416)은 「백」화소인 것으로 하여 표준 특징량을 계수하고 있다.
나머지 14의 영역에서도 마찬가지로 표준 특징량이 계수되어 있다.
이와 같이 표준 특징량(403)은「흑」화소의 나열방법의 패턴으로부터 4종류의 특징요소「횡」(501), 「좌상」(504), 「종」(507), 「우상」(509)의 출현수를 분할된 「16」영역마다 계수한 것이며, 문자 코드(402)에 대하여「4×16」의 64차원량이 된다.
인식사전(301)의 등록내용이 다른 예와 대응하는 표준적인 문자화상을 도 6∼도 12에 각각 도시한다.
도 6의 (a)는 알파벳「i」의 등록 내용(601)을 도시한 것이고, 도 6의 (b)는 그 문자화상(602)을 도시한 것이다. 등록내용(601)은 도 4에 도시된 숫자「1」과 마찬가지로, 문자코드(603)와 문자화상(602)의 영역을 「16」분할하여 얻어진 표준 특징량(604)으로 이루어진다.
마찬가지로 도 7은 알파벳「t」, 도 8은 한자「雲」, 도 9는 한자「雷」, 도 10은 한자「宅」, 도 11은 한자「電」, 도 12는 한자 의 등록내용과 표준적인 문자화상을 각각 나타낸다.
문자화상 입력부(302)는 스캐너 등을 갖고, 인식대상의 문자화상을 문자요소부분을「흑」화소로, 배경부분을「백」화소로 한 2값의 화상을 입력하고, 「16×16」화소로 정규화한다. 인식대상의 문자화상은 종래 기술의 설명에서 이용한 도 1, 도 2에 도시한 문자화상「電」(101), 「電」(201)과 마찬가지이다.
화상영역 분할부(303)는 문자화상 입력부(302)에서 입력된 문자화상을 N의 영역(여기에서는 N=16)으로, 즉 종횡 각각 4등분의 16영역으로 분할한다. 도 13은 도 1에 도시된 문자화상(101)을 16영역으로 분할한 문자화상을 도시한 것이다.
특징량 추출부(304)는 도 5에 도시한 특징요소인 「흑」화소의 나열방법의 패턴「횡」(502, 503), 「좌상」(505, 506), 「종」(508, 509),「우상」(511, 512)을 그 주목 화소(도면에서 「*」로 표시)와 함께 기억하고 있다. 화상영역 분할부(303)에서 분할된 각 영역마다 차례로(예를 들면, <횡 1> <종 1>, <횡 1> <종 2>, <횡 1> <종3>,···,<횡 4> <종 3>, <횡 4> <종 4>의 차례로) 경계점의 「*」표시한 화소를 주목 화소로 하여 기억하고 있는 「흑」화소의 나열방법의 패턴과 일치하는 패턴이 있으면 각각의 특징량의 수를「1」씩 늘려 간다.
특징량 추출부(304)는 이러한 처리를 함으로써, 16의 각 영역에서 4차원의 특징량을 추출하고, 문자화상에 대하여 64차원의 특징량을 추출한다. 추출한 특징량을 기억한다.
도 14는 도 1에 도시한 문자화상「電」(101)으로부터 추출된 64차원의 특징량을 도시한다. 마찬가지로 도 2에 도시한 문자화상「電」(201)으로부터는 도 15에 도시한 64차원의 특징량이 추출된다.
화상영역 분류부(305)는 화상영역 분할부(303)에서 분할된 N의 각 영역(N=16 )을 복수의 군으로 분류한다. 여기에서는 제 1군과 제 2군의 2개의 군으로 분류한다.
도 16은 문자화상(101, 102)의 각 영역이 주변부의 제 1군(1601)과 중앙부(해칭부분)의 제 2군(1602)으로 분류된 상태를 도시한다.
따라서 제 1군(1601)에는 화상영역 분할부(303)에서 분할된 <횡 1> <종 1> ∼ <종 4>, <횡 2> <종 1>, <횡 2> <종 4>, <횡 3> <종 1>, <횡 3> <종 4>, <횡 4> <종 1> ∼ <종 4>의 12영역이 분류된다. 제 2군(1602)에는 마찬가지로 <횡 2> <종 2>, <횡 2> <종 3>, <횡 3> <종 2>, <횡 3> <종 3>의 4영역이 분류된다.
화상영역 분류부(305)는 각 화상영역의 분류가 종료되면 인식부(306)에 제 1군과 제 2군으로 분류한 각 화상영역을 통지한다.
인식부(306)는 화상영역 분류부(305)로부터 제 1군과 제 2군으로 분류된 각 화상영역의 통지를 받으면 각 군마다 특징량 추출부(304)에 기억되어 있는 특징량을 판독하고, 인식사전(301)에 등록되어 있는 모든 문자코드에 대하여 문자코드마다 대응하는 표준 특징량과의 시가지 거리를 계산한다.
인식부(306)는 화상영역 분류부(305)로부터 도 16에 도시된 바와 같은 제 1군(1601)과 제 2군(1602)의 통지를 받으면 제 1군(1601)에 대해서는 다음의 수학식 1을 이용하고, 제 2군에 대해서는 수학식 2를 이용하여 시가지 거리 d1, d2를 각각 계산한다.
여기에서 Foi는 특징량 추출부(304)에 기억된 제 1군으로 분류된 i번째의 특징량이고, Fsi는 인식사전(301)에 등록되어 있는 대응하는 i번째의 표준 특징량이다.
여기에서 Foj는 특징량 추출부(304)에 기억된 제 2군으로 분류된 j번째의 특징량이고, Fsj는 인식사전(301)에 등록되어 있는 대응하는 j번째의 표준 특징량이다.
다음으로 인식부(306)는 계산한 문자의 시가지 거리 d1을 α배하고 시가지 거리 d2를 β배하여 가산하고, 각 문자의 합계 시가지 거리 d를 계산한다. 인식사전(301)에 기억되어 있는 모든 문자에 대하여 합계 시가지 거리를 계산하여 합계 시가지 거리 d가 최소로 되는 문자가 인식대상의 문자화상과 가장 유사도가 높다고하여 인식결과 출력부(307)에 그 문자의 문자코드를 통지한다.
지금 α=1.0으로 하고, β=0.5로 하여 도 1에 도시한 문자화상「電」(101)에 대하여 합계 시가지 거리 d를 계산하면, 도 17의 (a)에 도시된 바와 같은 결과가된다. 이에 따라 문자「電」의 합계 시가지 거리 d가 「14」로 최소가 되어 있으므로 문자코드「4545」(도 11 참조)가 인식결과 출력부(307)에 통지된다.
도 2에 도시된 문자화상「電」(201)에 대하여 합계 시가지 거리 d를 계산하면, 도 17의 (b)에 도시된 바와 같은 결과가 된다. 이에 따라 마찬가지로 인식결과 출력부(307)에 문자코드「4545」가 통지된다. 도 2에 도시한 변형된 문자화상「電」(201)에서도 본 장치에서는 정확하게 문자인식할 수 있다.
또 상술한 종래 장치에서 계산된 문자화상「電」(101)과「電」(201)의 시가지 거리를 도시하면 도 17의 (c)에 도시된 바와 같이 되어 있다. 이에 따라 문자화상「電」(201)에서는 정확하게 인식되지 않았던 것이 명료하게 나타내어져 있다.
인식결과 출력부(307)는 CRT 등의 디스플레이를 갖고, 인식부(306)로부터 통지된 문자코드에 대응하는 표준 문자화상을 표시한다.
다음으로 본 실시예의 동작을 도 18에 도시된 흐름도를 이용하여 설명하기로 한다. 문자화상 입력부(302)는 인식대상의 문자화상을 정규화한 2값의 문자화상으로서 입력한다(S1802).
화상영역 분할부(303)는 문자화상의 존재영역을 N개의 영역으로 분할한다 (S1804).
특징량 추출부(304)는 분할된 각 영역마다 문자화상으로부터 특징 요소수 차원의 특징량을 추출한다(S1806).
화상영역 분류부(305)는 분할된 각 영역을 문자화상의 주변부인 제 1군과, 문자화상의 중앙부인 제 2군으로 분류한다(S1808).
인식부(306)는 특징량 추출부(304)에서 추출된 각 특징량이 주변부의 제 1군에 속하는지의 여부를 판단한다(S1810). 주변부에 속한다고 판단하였을 때는 인식사전(301)에 등록되어 있는 문자의 표준 특징량과의 시가지 거리 d1을 계산하고, 계수 1.0을 승산하고(S1812), S1816으로 옮긴다. 주변부에 속하지 않는다고 판단하였을 때는 중앙부이므로 인식사전(301)에 등록되어 있는 문자의 표준 특징량과의 시가지 거리 d2를 계산하고, 계수 0.5를 승산한다(S1814).
다음으로 인식부(306)는 S1812에서 얻어진 주변부의 시가지 거리 d1과, S1814에서 얻어진 중앙부의 시가지 거리 d2를 0.5배한 값을 가산하여 합계 시가지 거리 d를 계산하고, 이용한 표준 특징량의 문자코드와 합계 시가지 거리 d를 기억한다(S1816). 인식사전(301)에 등록되어 있는 전체문자와의 대조가 끝날 때까지 S1810부터 S1816를 반복한다(S1818). 합계 시가지 거리 d가 가장 작은 문자코드를 인식대상 문자화상의 문자로서 선출하여 인식결과 출력부(307)에 통지한다 (S1820).
인식결과 출력부(307)는 문자코드를 기억하며, 또한 문자코드에 대응하는 표준 문자화상을 표시하고 처리를 종료한다.
또 본 실시예에서는 제 1군(1601)과 제 2군(1602)을 문자화상의 주변부와 중앙부로 분류하였지만, 다른 분류방법으로서 문자화상의 좌측부와 우측부로 분류하여 문자 구성요소인「변(한자의 구성상의 왼쪽 부수)」에 주목하거나, 상측부와 하측부로 분류하여 문자 구성요소인「방」에 주목하여 문자인식의 정밀도를 높이도록 해도 된다.
( 제 2 실시예 )
도 19는 본 발명에 관한 문자 인식장치의 제 2 실시예의 구성도이다. 이 문자 인식장치는 인식사전(301), 문자화상 입력부(302), 화상영역 분할부(303), 특징량 추출부(304), 화상영역 분류부(305), 후보문자 인식부(1901), 인식부(1902) 및 인식결과 출력부(307)를 구비하고 있다. 또 상기 제 1 실시예의 문자 인식장치와 같은 구성부분에는 동일한 부호를 붙여 그 설명을 생략하고, 본 실시예 고유의 구성부분에 대해서만 설명하기로 한다.
후보문자 인식부(1901)는 화상영역 분류부(305)에서 제 1군의 주변부와 제 2군의 중앙부로 영역이 분류되면 제 1군의 주변부의 특징량과 인식사전(301)에 등록되어 있는 문자가 대응하는 표준 특징량의 시가지 거리 d1를 상기의 수학식 1을 이용하여 계산한다.
도 20의 (a)는 문자화상「電」(101)과「電」(201)의 시가지 거리 d1이 가까운, 즉 문자화상의 주변부의 유사도가 높은 문자를 나타낸다. 또 후보문자 인식부(1901)에서는 실제의 문자「電」,「雷」,「雲」,···등의 대신에 문자코드가 기억되어 있다.
후보문자 인식부(1901)는 인식사전(301)에 등록되어 있는 모든 문자에 대하여 인식대상의 문자화상과의 시가지 거리 d1의 계산이 종료되면 시가지 거리 d1이 작은, 예를 들면 상위 3문자의 문자코드와 시가지 거리 d1을 인식부(1902)에 통지한다.
인식부(1902)는 상기 실시예의 인식부(306)와 거의 같은 구성이지만, 시가지 거리 d1의 계산은 이미 후보문자 인식부(1901)에서 계산되어 있으므로 행하지 않는다. 또한 시가지 거리 d2의 계산에 대해서도, 후보문자 인식부(1901)로부터 통지된 문자코드의 문자에 대해서만 상기 수학식 2를 이용하여 계산한다. 계산된 시가지 거리 d2를 0.5배하여 시가지 거리 d1에 더한 합계 시가지 거리 d 중 최소의 것이 인식된 문자로서 인식결과 출력부(307)에 통지한다.
도 20의 (b)는 문자화상「電」(101)과 문자화상「電」(201)의 합계 시가지 거리 d를 도시한 것이다. 이 결과, 문자화상「電」(101, 201)이 모두 문자「電」이라고 정확하게 인식되어 있다.
본 실시예에서는 후보문자 인식부(1901)에 의해, 인식대상 문자화상의 중앙부의 특징량과 표준 특징량의 시가지 거리 d2의 계산 대상을 좁힐(인식사전(301)의 전체문자로부터 예를 들면 3문자로 좁힘) 수 있으므로 처리속도가 빨라진다.
다음으로 본 실시예의 동작을 도 21의 흐름도를 이용하여 설명하기로 한다. 또 S2102로부터 S2106까지는 제 1 실시예의 S1802로부터 S1806과 마찬가지이므로 설명을 생략한다. S2108에서 화상영역 분류부(305)는 각 영역을 제 1군의 주변부와 제 2군의 중앙부로 분류하고, 후보문자 인식부(1901)와 인식부(1902)에 그 분류를 통지한다.
후보문자 인식부(1901)는 통지된 주변부의 영역의 특징량과, 인식사전(301)에 등록되어 있는 대응하는 표준 특징량과의 시가지 거리 d1을 상기 수학식 1을 이용하여 계산한다(S2110). 인식사전(301)에 등록되어 있는 모든 문자에 대하여 S2110의 처리를 반복하고(S2112), 시가지 거리 d1이 작은 (가까운) 3문자를 선출하여 그들의 문자코드를 인식부(1902)에 통지한다(S2114).
인식부(1902)는 인식대상 문자화상의 제 2군에 분류된 중앙부의 영역의 특징량과 후보문자 인식부(1901)로부터 통지된 문자코드의 중앙부의 영역의 표준 특징량의 시가지 거리 d2를 상기 수학식 2를 이용하여 계산하고, 계수 0.5를 승산한다(S2116). 후보문자 인식부(1901)로부터 통지된 시가지 거리 d1에 계수 1.0을 승산한 값과 시가지 거리 d2에 계수 0.5를 승산한 값을 더하여 합계 시가지 거리 d를 구한다 (S2118). 통지된 3문자의 표준 특징량과의 시가지 거리 d의 산출이 끝날 때까지 S2116, S2118의 처리를 반복한다(S2120). 인식부(1902)는 합계 시가지 거리 d가 가장 작은 문자를 인식 결과로서 산출하고, 문자코드를 인식결과 출력부(307)에 통지하고(S2122), 처리를 종료한다.
( 제 3 실시예 )
도 22는 본 발명에 관한 문자 인식장치의 제 3 실시예의 구성도이다. 이 문자 인식장치는 인식사전(301), 문자화상 입력부(302), 화상영역 분할부(303), 특징량 추출부(304), 화상영역 분류부(305), 대분류 사전(2201), 대분류부(2202), 인식부(2203) 및 인식결과 출력부(307)를 구비하고 있다. 또 상기 제 1 실시예와 같은 구성부분에는 동일한 부호를 붙여 그에 대한 설명을 생략하고, 본 실시예 고유의 구성부분에 대해서만 설명하기로 한다.
대분류 사전(2201)은 문자를 표준 문자형상이 유사한 유사 문자단위로 그룹화하고, 유사 문자단위의 그룹 표준 특징량과 유사 문자단위에 속하는 문자의 문자코드군을 등록하고 있다.
도 23은 대분류 사전(2201)의 내용의 일례를 도시한 예시도이다. 도면에는 유사 문자단위의「D1」,「D2」,「D3」이 예시되어 있다. 유사 문자단위「D1」에는 숫자 「1」과 알파벳「i」「t」가 그룹화되어 있고, 그 문자코드군(도면에서는 문자코드로 바꾸어 실제의 문자「1」,「i」,「t」로 나타내고 있다)(2301)과 그룹 표준 특징량(2302)이 등록되어 있다.
유사 문자단위「D2」에는, 한자 「雲」, 「電」, 「雷」가 그룹화되어 있고, 그 문자코드군(2303)과 그룹 표준 특징량(2304)이 등록되어 있다. 유사 문자단위「D3」에는 한자「宅」,「電」, 이 그룹화되어 있고, 그 문자 코드군(2305)과 그룹 표준 특징량(2306)이 등록되어 있다.
이 유사 문자단위에서의 그룹화는 인식사전(301)의 표준 특징을 클러스터 분석하고, 소정의 유사 문자단위로 문자를 클러스터로 분류한 것이다. 또 클러스터 분석에 대해서는「다변량 통계 해석법」전중 풍(田中 豊)·협본 화창(脇本 和昌)저 , 현대수학사 p230∼244에 기재되어 있다.
여기에서는 유사 문자단위에서의 문자의 중복 등록을 허용하고 있다. 그룹 표준 특징량은 그룹화의 기초가 되는 문자의 표준 특징량의 단순평균으로 주어져 있다.
물론 유사 문자단위의 그룹화는 이 이외의 방법, 예를 들면 한자의「변」이나「방」이 동일한 것을 유사 문자단위로 그룹화해도 된다.
대분류부(2202)는 화상영역 분류부(305)에서 제 1군에 분류된 영역의 인식 대상의 문자화상의 특징량과 대분류 사전(2201)의 대응하는 그룹 표준 특징량과의 시가지 거리 d1을 상기 수학식 1을 이용하여 계산한다. 또 이 때 Fsi는 그룹 표준 특징량이다. 시가지 거리 d1을 대분류 사전(2201)에 등록되어 있는 모든 유사 문자단위에 대하여 계산하고, 시가지 거리 d1이 가장 가까운(유사도가 높은) 유사 문자단위를 선택하여 그 문자 코드군을 인식부(2203)에 통지한다.
도 24의 (a)는 대분류부(2202)에서의 인식대상 문자화상「電」(101, 201)의 시가지 거리 d1의 계산 결과를 도시한 도면이다. 유사도가 높은 순으로 유사 문자단위가 표시되어 있다.
문자화상「電」(101)에서는 유사 문자단위「D2」의「雲」,「電」,「雷」(2303)가 선택되고, 문자화상「電」(201)에서는 유사 문자단위「D3」의「宅」, 「電」, (2305)이 선택되어 그들의 문자코드가 인식부(2203)에 통지된다.
인식부(2203)는 대분류부(2202)로부터 문자 코드군의 통지를 받으면 인식대상 문자화상의 제 1군의 주변부의 특징량과, 인식사전(301)에 등록된 통지된 문자코드의 대응하는 표준 특징량과의 시가지 거리 d1을 상기 수학식 1을 이용하여 계산한다. 마찬가지로 제 2군의 중앙부의 특징량과 대응하는 표준 특징량과의 시가지 거리 d2를 상기 수학식 2를 이용하여 계산하고, 시가지 거리 d2에 계수 0.5를 승산한다. 시가지 거리 d1과 계수 0.5를 곱한 시가지 거리 d2를 합계한 합계 시가지 거리 d를 계산하여 문자코드와 동시에 기억한다. 통지된 문자코드군에 대하여 이 처리를 한 후 합계 시가지 거리 d가 가장 작은 문자코드를 인식결과 출력부(307)에 통지한다.
도 24의 (b)는 인식부(2203)에서의 인식대상 문자화상「電」(101, 201)의 합계 시가지 거리 d의 계산 결과를 도시한 도면이다. 문자화상「電」(101, 201) 모두 유사도가 가장 높은 문자는「電」이라고 인식되어 있다.
본 실시예에서는 인식대상의 문자화상의 화상영역 중 문자형상의 특징을 보다 명료히 반영하는 화상영역의 특징량으로부터 그룹화된 유사 문자단위를 선택하여 인식문자의 후보를 좁히고, 그 후 제 1 실시예와 마찬가지로 분류된 화상영역에 의해 다른 계수를 시가지 거리에 곱하여 유사도를 계산하고 있다. 이에 의해 인식사전(301)과의 대조에 필요한 시간이 대폭 단축된다.
다음으로 본 실시예의 동작을 도 25의 흐름도를 이용하여 설명하기로 한다. S2506까지는 제 1 실시예의 S1806과 마찬가지이므로 설명을 생략한다.
화상영역 분류부(305)는 각 영역을 주변부의 제 1군과 중앙부의 제 2군으로 분류하고, 대분류부(2202)와 인식부(2203)로 분류한 영역을 통지한다(S2508).
대분류부(2202)는 인식대상 문자화상의 주변부의 특징량과 대분류 사전(2201)의 대응하는 유사 문자단위의 그룹 표준 특징량과의 시가지 거리 d1을 계산한다(S2510). 대분류 사전(2201)에 등록되어 있는 모든 유사 문자단위와 대조할때까지 S2510를 반복한다(S2512).
다음으로 대분류부(2202)는 시가지 거리 d1이 가장 가까운, 즉 유사도가 높은 유사 문자단위를 선출하고, 그 유사 문자단위에 포함되는 문자의 문자코드군을 인식부(2203)에 통지한다(S2514).
인식부(2203)는 대분류부(2202)로부터 각 문자코드를 통지받으면 인식대상 문자화상의 특징량이 영역의 주변부에 속하는지의 여부를 판단하여(S2516), 주변부에 속할 때에는 특징량과 통지된 문자코드의 대응하는 표준 특징량과의 시가지 거리 d1을 인식사전(301)을 참조하고 상기 수학식 1을 이용하여 계산하고, 시가지 거리 d1에 계수 1.0을 승산한다(S2518). 주변부에 속하지 않는 특징량일 때에는 특징량이라고 통지된 문자코드의 대응하는 표준 특징량과의 시가지 거리 d2를 인식사전(301)을 참조하고 상기 수학식 2를 이용하여 계산하고, 시가지 거리 d2에 계수 0.5를 승산한다 (S2520). 다음으로 S2518과 S2520에서 얻어진 값을 합계한 합계 시가지 거리 d를 구하여 문자코드와 함께 기억한다(S2522). 통지된 문자코드에 대하여 인식사전(301)과의 대조를 S2516으로부터 S2522까지 반복하고(S2524), 합계 시가지 거리 d가 가장 가까운(유사도가 높은) 문자코드를 선출하고(S2526), 처리를 종료한다.
또 본 실시예의 대분류 사전(2201)은 유사 문자단위에 속하는 문자군의 그룹 표준특징을 화상영역의 전부에 대하여 등록하고 있지만, 제 1군으로 분류되는 주변부 영역의 그룹 표준 특징만을 문자 코드군과 함께 등록하도록 해도 된다.
( 제 4 실시예 )
도 26은 본 발명에 관한 문자 인식장치의 제 4 실시예의 구성도이다. 이 문자 인식장치는 인식사전(301), 문자화상 입력부(302)와, 화상영역 분할부(303), 특징량 추출부(304), 변형정도 산출부(2601), 인식부(2602) 및 인식결과 출력부(307)를 구비하고 있다. 상기 제 1 실시예와 같은 구성부분에는 동일한 부호를 붙여 그 설명을 생략하고, 본 실시예 고유의 구성부분에 대해서만 설명하기로 한다.
변형정도 산출부(2601)는 화상영역 분할부(303)에서 분할된 16의 각 영역에 대하여 영역에 차지하는 문자요소 부분의 비율을 계산한다. 구체적으로는 영역에 포함되는 「흑」화소의 수를 계수하고, 그 수를 영역의 전체 화소수「16」으로 제산하고, 「1O0」을 승산한다. 이 비율이 임계값 미만인 영역을 정상부로 간주하여 제 1군으로 분류하고, 임계값 이상의 영역을 변형부로 간주하여 제 2군으로 분류한다. 여기에서는 임계값을「75%」로 하고 있다.
도 27은 변형정도 산출부(2601)에서 분류된 제 1군의 정상부(2701)와 제 2군의 변형부(2702)를 도 1, 도 2의 문자화상「電」(101, 201)에 대하여 도시한 것이다. 이에 의하면 문자화상「電」(201)에 변형부가 문자화상「電」(101)보다 다수 존재하는 것을 알 수 있다.
변형정도 산출부(2601)는 제 1군과 제 2군으로 분류한 각 영역을 인식부(2602)에 통지한다.
인식부(2602)는 변형정도 산출부(2601)로부터 제 1군과 제 2군의 영역을 통지받으면 제 1군 영역의 인식대상 문자화상의 특징량과 인식사전(301)의 대응하는 표준 특징량과의 시가지 거리 d1을 계산하고, 계수 α를 승산하여 제 2군의 영역과 같은 양의 특징량과 인식사전(301)의 대응하는 표준 특징량과의 시가지 거리 d2를 계산하고, 계수 β를 승산한다. 얻어진 각각의 값을 합계하여 합계 시가지 거리 d를 구한다. 구한 합계 시가지 거리 d와 표준 특징량에 대응하는 문자코드를 기억하고, 인식사전(301)에 등록되어 있는 모든 문자에 대하여 이 처리를 행한다.
인식대상 문자화상「電」(101)에서는 제 1군의 영역이 13영역이므로 시가지 거리 d1은 다음의 수학식 3으로 계산된다.
제 2군의 영역이 3영역이므로 시가지 거리 d2는 다음의 수학식 4로 계산된다.
인식대상 문자화상「電」(201)에서는 제 1군의 영역이 8영역이고, 제 2군의 영역이 8영역이므로 상기 수학식 3에서 i는 i = 1∼i = 32가 되고, 상기 수학식 4에서는 j는 j = 1∼j = 32가 된다. 또 Foi, Fsi, Foj, Fsj, i, j에 대해서는 제 1 실시예의 설명과 마찬가지이다.
여기에서 α=1.0, β=0.5로서 합계 시가지 거리 d를 문자화상「電」(101, 201)에 대하여 구하면 인식대상 문자화상「電」(101, 201) 모두 문자「電」이 합계 시가지 거리 d가 최소로 되어, 즉 유사도가 최고로 되어, 인식결과로서 선택되고, 인식결과 출력부(307)에 통지된다.
다음으로 본 실시예의 동작을 설명하기로 한다.
또 본 실시예의 동작은 제 1 실시예의 동작과 S1808∼S1814(도 18 참조)가 다를 뿐이므로 그 부분만을 설명하기로 한다.
S1808에서는 화상영역 분류부(305)를 미리 설정된 주변부의 제 1군과 중앙부의 제 2군으로 분류하였지만, 본 실시예에서는 화상영역 분할부(303)에서 분할된 영역마다 영역을 차지하는 문자요소 부분에 상당하는「흑」화소의 비율을 계산하여, 그 값이 임계값 미만이면 정상부로서 제 1군으로 분류하고, 임계값 이상이면 변형부로서 제 2군으로 분류한다.
S1810에서는 인식대상 문자화상의 특징량이 주변부의 제 1군에 속하는지의 여부를 인식부(306)가 판단하였지만, 본 실시예에서 인식부(2602)는 정상부의 제 1군에 속하는지의 여부를 판단한다. 그 결과 정상부의 제 1군에 속할 때에는 S1812로 이동하고, 변형부의 제 2군에 속할 때에는 S1814로 이동한다. 인식부(2602)는 S1812, S1814에 있어서, 주변부를 정상부로 하고, 중앙부를 변형부로 하여 시가지 거리 d1, d2를 계산하고, 계수 1.0, 0.5를 각각 d1, d2에 승산한다.
이와 같이 본 실시예에서는 문자화상 입력부(302)로부터 입력되는 인식대상 문자화상에 따라 분할된 영역을 제 1군과 제 2군으로 분류하므로 미리 설정된 각각의 군으로 분류하는 것 보다도 인식 정밀도가 향상된다.
( 제 5 실시예 )
도 29는 본 발명에 관한 문자 인식장치의 제 5 실시예의 구성도이다. 이 문자 인식장치는 인식사전(301), 문자화상 입력부(302), 화상영역 분할부(303), 특징량 추출부(304), 변형정도 산출부(2601), 후보문자 인식부(2901), 인식부(2902) 및 인식결과 출력부(307)를 구비하고 있다. 또 상기 제 1 실시예 및 제 4 실시예와 동일한 구성부분에는 동일한 부호를 붙여 그 설명을 생략하기로 한다. 또한 본 실시예의 후보문자 인식부(2901)와 인식부(2902)는 상기 제 2 실시예의 후보문자 인식부(1901) 및 인식부(1902)와 거의 같은 구성이지만, 화상영역 분류부(305)와 변형정도 산출부(2601)의 차이 때문에 약간의 차이가 있다.
변형정도 산출부(2601)는 인식대상 문자화상의 각 영역의 문자요소 부분의 비율이 임계값, 예를 들면 75% 미만인지의 여부를 판단하여, 미만인 영역을 제 1군의 정상부로서 후보문자 인식부(2901)에 통지하고, 이상인 영역을 제 2군의 변형부로서 인식부(2902)에 통지한다. 후보문자 인식부(2901)는 변형정도 산출부(2601)로부터 통지된 제 1군으로 분류된 정상부 영역의 특징량을 특징량 추출부(304)로부터 판독하고, 인식사전(301)에 등록되어 있는 대응하는 표준 특징량과의 시가지 거리 d1을 계산한다.
지금 인식대상 문자화상「電」(101, 201)의 각 영역이 도 27에 도시된 바와 같이, 제 1군과 제 2군으로 분류되어 있을 때에는, 상기 수학식 3을 이용하여 제 1군의 정상부의 특징량과 인식사전(301)의 대응하는 표준 특징량과의 시가지 거리 d1을 계산한다. 인식사전(301)의 모든 문자에 대하여 시가지 거리 d1을 구하면 도 30의 (a)에 도시된 바와 같이 된다. 시가지 거리 d1이 가까운, 즉 유사도가 높은 상위 3개의 문자의 문자코드와 시가지 거리 d1을 조(組)로 편성하여 인식부(2902)에 통지한다.
인식부(2902)는 제 2군으로 분류된 특징량과 인식사전(301)에 등록되어 있는 통지된 문자코드의 대응하는 표준 특징량과의 시가지 거리 d2를 상기 수학식 4를 이용하여 계산한다.
인식부(2902)는 시가지 거리 d1에 계수 α를 곱한 값과 계산된 시가지 거리 d2에 계수 β를 곱한 값을 합계하여, 합계 시가지 거리 d를 구한다. α=1.0, β=0.5로 하였을 때, 인식대상 문자화상「電」(101, 201)의 합계 시가지 거리 d는 도 30의 (b)에 도시된 바와 같이 된다. 이 결과, 유사도가 가장 높은 문자「電」의 문자코드를 인식결과 출력부(307)에 통지한다.
본 실시예의 동작은 제 2 실시예의 동작과 약간 다를 뿐이므로 다른 부분을 도 21을 참조하여 간단히 설명하기로 한다.
S2108에서 변형정도 산출부(2601)는 정상부의 제 1군과 변형부의 제 2군으로 영역을 분류한다. S2110에서 후보문자 인식부(2901)는 제 1군의 특징량을 이용하여 시가지 거리 d1을 구한다. 이에 따라 S2114에서 인식사전(301)의 표준 특징량과의 시가지 거리 d2의 계산 대상을 3문자로 좁힌다.
( 제 6 실시예 )
도 31은 본 발명에 관한 문자 인식장치의 제 6 실시예의 구성도이다. 이 문자 인식장치는 인식사전(301), 문자화상 입력부(302), 화상영역 분할부(303), 특징량 추출부(304), 변형정도 산출부(2601), 대분류 사전(2201), 대분류부(3101), 인식부(3102) 및 인식결과 출력부(307)를 구비하고 있다.
제 1 실시예, 제 3 실시예 및 제 4 실시예와 동일한 구성부분에는 동일한 부호를 붙여 그 설명을 생략하기로 한다.
대분류부(3101)는 변형정도 산출부(2601)로부터 통지된 제 1군으로 분류된 영역의 특징량과 대분류 사전(2201)에 등록되어 있는 대응하는 그룹 표준 특징량과의 시가지 거리 d1을 계산한다. 대분류 사전(2201)에 등록되어 있는 모든 유사 문자단위에 대하여 시가지 거리 d1를 구하고, 가장 유사한 유사 문자단위를 선택하여 유사 문자단위에 포함되는 문자의 문자코드를 인식부(3102)에 통지한다.
지금 도 27에 도시된 바와 같이 영역이 제 1군의 정상부(2701)와 제 2군의 변형부(2702)로 분류되어 있는 경우, 대분류부(3101)는 제 4 실시예와 마찬가지로 상기 수학식 3 등을 이용하여 시가지 거리 d1을 계산한다. 이 때, Fsi는 대분류 사전(2201)의 그룹 표준 특징량이다.
도 32의 (a)는 이 시가지 거리 d1을 인식대상 문자화상「電」(101, 201) 각각에 대하여 도시한다. 가장 유사한 유사 문자단위는「電」(101)에서는「D2」이고, 「電」(201)에서는「D3」이다.
인식부(3102)는 대분류부(3101)로부터 문자코드군을 통지받으면, 인식대상 문자화상의 특징량이 제 1군으로 분류된 것일 때에는 인식사전(301)의 통지된 문자코드의 대응하는 표준 특징량과의 시가지 거리 d1을 상기 수학식 3 등을 이용하여 계산한다. 제 2군으로 분류된 것일 때에는 그 특징량과 인식사전(301)의 대응하는 표준 특징량과의 시가지 거리 d2를 상기 수학식 4 등을 이용하여 계산한다. 얻어진 시가지 거리 d1, d2에 각각 계수 α, β를 승산하여 합계 시가지 거리 d를 구한다. 이 처리를 통지받은 문자코드군의 문자에 대해서만 행한다. 합계 시가지 거리 d가 최소로 되는 문자의 문자코드를 인식결과 출력부(307)에 통지한다.
계수 α, β를 각각 1.0, 0.5로 하였을 때의 인식대상 문자화상「電」(101, 201)의 합계 시가지 거리를 도 32의 (b)에 도시한다. 인식결과는 모두 「電」으로 되어 있다.
이와 같이 대분류 사전(2201)의 그룹 표준 특징량과의 시가지 거리 d1을 계산함으로써, 인식사전(301)을 이용한 합계 시가지 거리 d를 구하는 처리대상을 좁힐 수 있고, 인식 정밀도의 향상과 인식처리에 필요한 시간을 단축할 수 있다.
다음으로 본 실시예의 동작을 제 3 실시예의 흐름도(도 25)를 이용하여 간단히 설명하기로 한다.
S2508로 바꾸어, 변형정도 산출부(2601)는 화상영역 분할부(303)에서 분할된 각 영역을 정상부의 제 1군과 변형부의 제 2군으로 분류한다. S2510에 있어서, 대분류부(3101)는 인식대상 문자화상의 제 1군의 특징량과 대분류사전(2201)의 그룹 표준 특징량과의 시가지 거리 d1을 계산한다.
S2516에 있어서, 인식부(3102)는 특징량이 제 1군의 정상부에 속하는지의 여부를 판정하고, 이하 제 3 실시예와 같은 처리를 한다.
또 상기 제 1 실시예∼제 6 실시예에서는 인식사전(301)에 등록된 표준적으로 정규화된 문자화상을 16×16화소로 하였지만, 물론 다른 사이즈로 해도 되며, 이 경우에는 문자화상 입력부(302)에서 입력되는 인식대상의 문자화상을 같은 크기로 하면 된다.
또한 표준적인 문자화상 영역의 분할을 종횡 4화소씩의 16등분으로 하였지만, 종횡 각각 다른 화소씩으로 분할하고, 물론 「p×q」분할로 해도 된다. 이 경우에는 인식대상의 문자화상도 화상영역 분할부(303)로, 마찬가지로「p×q」분할되면 된다.
또한 화상영역 분할부(303)는 정규화된 인식대상 문자화상을 각 영역으로 분할하였지만, 문자화상 입력부(302)에서 문자화상을 정규화하는 일 없이, 화상영역 분할부는 입력된 인식대상 문자화상을 중심이나 같은 피치로「p×q」의 영역으로 분할하고, 특징량 추출부가 각 영역마다 특징 요소의 수를 계수한 후에 각 영역의 면적이나 길이 등의 영역 크기로 특징 요소의 수를 정규화하여 특징량으로 해도 된다. 이 경우 인식사전에는 같은 방법으로 추출된 표준 문자화상의 표준 특징량이 등록되어 있다.
또한 상기 실시예에서는 영역을 제 1군과 제 2군의 2군으로 분류하여 유사도를 나타내는 시가지 거리에 2종류의 계수를 곱하여 유사도에 가중하였지만, 다른 실시예로서 3군 이상으로 분류하여 각각 다른 계수를 그들의 시가지 거리에 곱하도록 하여 더욱 문자인식 정밀도를 높일 수 있도록 해도 된다.
또한 상기 실시예에서는 유사도를 구하는 데 시가지 거리를 이용하였지만, 이것에 한정되는 것은 아니고, 유클리드 거리나 마할라노비스 거리를 이용해도 된다.
또한 상기 제 1 실시예∼제 6 실시예에서는 그 구성을 도 3, 도 19, 도 22, 도 26, 도 29, 도 31에 각각 나타내었지만, 본 발명의 다른 실시예로서, 각 도면에 도시한 구성요소의 기능이 발휘되는 프로그램을 컴퓨터 판독 가능한 기록매체에 기록해 두고, 이러한 기능이 없는 문자 인식장치에 장착하여 프로그램을 판독시켜 본 발명과 동일한 효과를 발휘시키도록 해도 된다.
상술한 바와 같이 본 발명에 의하면, 각 군의 기초 유사도에 각 군의 문자인식으로의 기여에 따른 경중을 부가하여 전체 유사도가 계산되므로, 인식대상 문자화상이 변형되어 있는 경우라도 문자인식의 정밀도가 향상된 문자 인식장치를 얻을 수 있다.
또 본 발명에 의하면, 일반적으로 인식대상 문자화상에서 변형이 생기는 문자화상의 중앙부의 기초 유사도의 기여를 작게 하여 유사도를 계산함으로써 문자인식의 정밀도를 향상시킬 수 있다.
또 본 발명에 의하면, 인식대상 문자화상의 중앙부의 유사도에의 기여를 주변부의 1/2로 함으로써 문자 인식률이 비약적으로 향상된다.
또 본 발명에 의하면, 일반적으로 인식대상 문자화상에서 그 형상 특징을 잘 나타내고 있는 주변부의 특징으로부터 후보문자를 선출하고, 선출한 후보문자에 대해서만 전체의 유사도를 계산하도록 하고 있으므로 인식 정밀도의 향상과 함께 처리속도의 고속화를 도모할 수 있다.
또 본 발명에 의하면, 인식대상 문자화상의 특징을 잘 나타내는 부분의 특징을 이용하여, 형상이 유사한 유사문자 단위의 문자군을 선출하고, 선출된 문자군에 대하여 정밀도가 향상된 유사도를 계산하므로 인식 정밀도의 향상과 함께 더욱 처리속도의 고속화를 도모할 수 있다.
또 본 발명에 의하면, 개별의 인식대상 문자화상의 각 부분 화상영역마다 정상부인지 변형부인지를 판단하여 제 1군과 제 2군으로 분류하여, 제 1군과 제 2군의 부분 화상영역의 기초 유사도에 소정의 가중을 하기 때문에 유사도의 신뢰성이 높아지고, 문자인식의 정밀도가 더욱 향상된다.
또 본 발명에 의하면, 부분 화상영역의 변형부의 유사도에의 기여를 작게 하므로 인식 정밀도의 향상을 도모할 수 있다.
또 본 발명에 의하면, 정상부라고 판단된 부분 화상영역의 제 1군만의 유사도로부터 후보문자를 선출하고, 선출된 후보문자에 대하여 유사도를 계산하므로 처리속도의 고속화와 인식 정밀도의 향상을 도모할 수 있다.
또 본 발명에 의하면, 정상부라고 판단된 부분 화상영역의 특징으로부터 인식대상 문자화상의 문자를 포함하는 문자군을 좁힐 수 있으므로 유사도 계산의 고속화가 도모된다.
또 본 발명에 의하면, 정상부와 변형부의 제 1군과 제 2군의 분류가 적절히 행해져, 문자인식의 정밀도가 향상된다.
상술한 본 발명의 바람직한 실시예들은 예시의 목적을 위해 개시된 것이며, 당업자라면 첨부된 특허청구의 범위에 개시된 본 발명의 사상과 범위를 통해 각종 수정, 변경, 대체 및 부가가 가능할 것이다.
도 1은 화상입력부에 입력된 인식대상 문자화상의 일례를 도시한 예시도
도 2는 화상입력부에 입력된 인식대상 문자화상의 다른 예를 도시한 예시도
도 3은 본 발명에 관한 문자 인식장치의 제 1 실시예의 구성도
도 4의 (a)는 상기 실시예의 인식사전의 숫자 「1」의 등록내용의 일례를 도시한 예시도
도 4의 (b)는 상기 도 4의 (a)의 등록내용의 기초가 되는 표준문자화상「1」을 도시한 도면
도 5는 표준특징량 추출을 위한 특징요소를 설명한 도면
도 6의 (a)는 상기 실시예의 인식사전의 알파벳 「i」의 등록내용의 일례를 도시한 예시도
도 6의 (b)는 상기 도 6의 (a)의 등록내용의 기초가 되는 표준문자화상 「i」를 도시한 도면
도 7의 (a)는 상기 실시예의 인식사전의 알파벳 「t」의 등록내용의 일례를 도시한 예시도
도 7의 (b)는 상기 도 7의 (a)의 등록내용의 기초가 되는 표준문자화상 「t」를 도시한 도면
도 8의 (a)는 상기 실시예의 인식사전의 한자「雲」의 등록내용의 일례를 도시한 예시도
도 8의 (b)는 상기 도 8의 (a)의 등록내용의 기초가 되는 표준문자화상「雲」을 도시한 도면
도 9의 (a)는 상기 실시예의 인식사전의 한자「雷」의 등록내용의 일례를 도시한 예시도
도 9의 (b)는 상기 도 9의 (a)의 등록내용의 기초가 되는 표준문자화상「雷」를 도시한 도면
도 1O의 (a)는 상기 실시예의 인식사전의 한자「宅」의 등록내용의 일례를 도시한 예시도
도 1O의 (b)는 상기 도 10의 (a)의 등록내용의 기초가 되는 표준문자화상「宅」을 도시한 도면
도 11의 (a)는 상기 실시예의 인식사전의 한자「電」의 등록내용의 일례를 도시한 예시도
도 11의 (b)는 상기 도 11의 (a)의 등록내용의 기초가 되는 표준문자화상「電」을 도시한 도면
도 12의 (a)는 상기 실시예의 인식사전의 한자 의 등록내용의 일례를 도시한 예시도
도 12의 (b)는 상기 도 12의 (a)의 등록내용의 기초가 되는 표준문자화상을 도시한 도면
도 13은 상기 실시예의 화상영역 분할부에서 도 1에 도시된 인식대상 문자화상「電」(101)을 영역 분할한 상태를 도시한 도면
도 14는 상기 실시예의 특징량 추출부에서 추출된 인식대상 문자화상「電」(101)의 특징량을 도시한 도면
도 15는 상기 실시예의 특징량 추출부에서 추출된 도 2에 도시된 인식대상 문자화상「電」(201)의 특징량을 도시한 도면
도 16은 상기 실시예의 화상영역 분류부에서 화상영역 분할부가 분할한 영역을 주변부의 제 1군과 중앙부의 제 2군으로 분류한 상태를 도시한 도면
도 17의 (a)는 상기 실시예의 인식부에 의해 계산된 인식대상 문자화상「電」(101)의 합계 시가지 거리가 가까운 문자를 도시한 도면
도 17의 (b)는 상기 실시예의 인식부에 의해 계산된 인식대상 문자화상「電」(201)의 합계 시가지 거리가 가까운 문자를 도시한 도면
도 17의 (c)는 종래의 문자 인식장치에서 얻어진 인식대상 문자화상「電」(101, 201)의 시가지 거리가 가까운 문자를 참고예로서 도시한 도면
도 18은 상기 실시예의 동작을 설명한 흐름도
도 19는 본 발명에 관한 문자 인식장치의 제 2 실시예의 구성도
도 20의 (a)는 상기 실시예의 후보문자 인식부에서 인식대상 문자화상「電」 (101, 201)의 제 1군의 특징량을 이용하여 시가지 거리가 가까운 후보문자가 선출되는 것을 도시한 도면
도 20의 (b)는 상기 실시예의 인식부에서 후보문자 인식결과를 이용하여 인식대상 문자화상「電」(101, 201)이 선출되는 것을 도시한 도면
도 21은 상기 실시예의 동작을 설명한 흐름도
도 22는 본 발명에 관한 문자 인식장치의 제 3 실시예의 구성도
도 23은 상기 실시예의 대분류 사전의 등록내용의 일례를 도시한 예시도
도 24의 (a)는 상기 실시예의 대분류부에서 인식대상 문자화상「電」(101, 201)의 제 1군의 특징량을 이용하여 유사문자 단위가 선택되는 것을 설명한 설명도
도 24의 (b)는 상기 실시예의 인식부에서 인식대상 문자화상「電」(101, 201)의 문자가 선출되는 것을 도시한 도면
도 25는 상기 실시예의 동작을 설명한 흐름도
도 26은 본 발명에 관한 문자 인식장치의 제 4 실시예의 구성도
도 27은 상기 실시예의 변형정도 산출부에서 인식대상 문자화상「電」(101, 201)이 정상부의 제 1군과 변형부의 제 2군으로 분류되는 것을 설명한 설명도
도 28은 상기 실시예의 인식부에서 인식대상 문자화상「電」(101, 201)의 문자가 선출되는 것을 도시한 도면
도 29는 본 발명에 관한 문자 인식장치의 제 5 실시예의 구성도
도 30의 (a)는 상기 실시예의 후보문자 인식부에서 인식대상 문자화상「電」(101, 201)의 정상부의 제 1군의 특징량을 이용하여 후보문자가 선출되는 것을 도시한 도면
도 30의 (b)는 상기 실시예의 인식부가 후보문자 인식부의 결과를 이용하여 인식대상 문자화상「電」(101, 201)의 문자를 선출하는 것을 도시한 도면
도 31은 본 발명에 관한 문자 인식장치의 제 6 실시예의 구성도
도 32의 (a)는 상기 실시예의 대분류부에서 인식대상 문자화상「電」(101, 201)의 정상부의 제 1군의 특징량을 이용하여 유사문자단위가 선출되는 것을 도시한 도면
도 32의 (b)는 상기 실시예의 인식부에서 인식대상 문자화상「電」(101, 201)의 문자가 선출되는 것을 도시한 도면

Claims (20)

  1. (정정)
    인식대상 문자화상을 문자코드로서 인식하는 문자 인식장치로서,
    문자의 표준적인 화상을 N(N≥2)의 부분 화상영역으로 분할하고, 각 부분 화상영역에 포함되는 부분 문자화상의 표준 특징을 문자단위로 문자코드와 함께 미리 등록하고 있는 인식사전과,
    인식대상 문자화상을 N의 부분 화상영역으로 분할하는 화상영역 분할수단과,
    상기 화상영역 분할수단에서 분할된 부분 화상영역에 포함되는 부분 문자화상의 특징을 추출하는 특징 추출수단과,
    상기 화상영역 분할수단에서 분할된 부분 화상영역을 복수의 군으로 분류하는 부분 화상영역 분류수단과,
    각 군마다 상기 인식대상 문자화상의 부분 문자화상의 특징과 상기 인식사전의 대응하는 표준 특징과의 기초 유사도를 계산하고, 각 군의 기초 유사도에 소정의 가중을 부여하여, 인식대상 문자화상과 상기 인식사전 문자와의 유사도를 계산하는 유사도 계산수단과,
    상기 유사도가 가장 높은 문자를 인식문자로 하여 그 문자코드를 선출하는 인식문자 선출수단을 포함하는 것을 특징으로 하는 문자 인식장치.
  2. (정정)
    제 1항에 있어서,
    상기 부분 화상영역 분류수단은,
    상기 부분 화상영역을 인식대상 문자화상 주변부의 제 1군과 중앙부의 제 2군으로 분류하는 주변 · 중앙 분류부를 포함하며,
    상기 유사도 계산수단은,
    상기 제 1군과 제 2군의 기초 유사도를 따로따로 계산하며 , 상기 기초 유사도는 상기 부분 문자화상의 특징과 상기 인식사전의 대응하는 표준특징과의 시가지 거리, 유클리드 거리 또는 마할라노비스 거리(Mahalanobis distance)인 기초 유사도 계산부와,
    상기 제 1군의 유사도에의 기여가 제 2군의 유사도에의 기여보다 크게 되도록 제 1군과 제 2군의 기초 유사도에 각각 소정의 계수를 곱하여 합계하는 유사도 합계부를 포함하는 것을 특징으로 하는 문자 인식장치.
  3. 제 2항에 있어서,
    상기 유사도 합계부에서 곱해지는 계수는 제 1군의 기초 유사도에 대하여 1.0이고, 제 2군의 기초 유사도에 대하여 0.5이며,
    상기 인식문자 선출수단은 유사도가 가장 작은 값의 문자를 유사도가 가장 높은 문자로서 선출하는 것을 특징으로 하는 문자 인식장치.
  4. (정정)
    제 1항에 있어서,
    상기 부분 화상영역 분류수단은,
    상기 부분 화상영역을 인식대상 문자화상 주변부의 제 1군과 중앙부의 제 2군으로 분류하는 주변 · 중앙 분류부를 포함하며,
    상기 유사도 계산수단은,
    기초 유사도가 상기 부분 문자화상의 특징과 상기 인식사전의 대응하는 표준특징과의 시가지 거리, 유클리드 거리 또는 마할라노비스 거리인 상기 제 1군의 기초 유사도를 계산하고, 기초 유사도가 상위인 문자 군을 상기 인식사전으로부터 후보문자로서 선출하는 후보문자 선출부와,
    상기 후보문자 선출부에서 선출된 후보문자에 대하여 제 2군의 기초 유사도를 계산하는 제 2군 기초 유사도 계산부와,
    상기 제 1군의 유사도에의 기여가 제 2군의 유사도에의 기여보다 크게 되도록 제 1군과 제 2군의 기초 유사도에 각각 소정의 계수를 곱하여 합계하는 유사도 합계부를 포함하는 것을 특징으로 하는 문자 인식장치.
  5. 제 4항에 있어서,
    상기 유사도 합계부에서 곱해지는 계수는 제 1군의 기초 유사도에 대하여 1.0이고, 제 2군의 기초 유사도에 대하여 0.5이며,
    상기 인식문자 선출수단은 유사도가 가장 작은 값의 문자를 유사도가 가장 높은 문자로서 선출하는 것을 특징으로 하는 문자 인식장치.
  6. (정정)
    제 1항에 있어서,
    상기 문자 인식장치는,
    형상이 유사한 문자의 표준적인 화상 군을 N(N≥2)의 부분 화상영역으로 분할하고, 각 부분 화상영역에 포함되는 부분 문자화상의 문자군 표준특징을 유사문자 단위의 문자코드 군과 함께 미리 등록하고 있는 문자군 분류사전을 더 포함하며,
    상기 부분 화상영역 분류수단은,
    상기 부분 화상영역을 인식대상 문자화상 주변부의 제 1군과 중앙부의 제 2군으로 분류하는 주변 · 중앙 분류부를 포함하며,
    문자 인식장치는,
    상기 제 1군으로 분류된 인식대상 문자화상의 부분 문자화상의 특징과 상기 문자군 분류사전에 등록된 대응하는 문자군 표준특징과의 유사도를 계산하고, 유사도가 높은 문자군의 문자코드를 선출하는 문자군 선출수단을 더 포함하며,
    상기 유사도 계산수단은 상기 문자군 선출수단에서 선출된 문자코드에 대응하는 상기 인식사전에 등록된 표준특징과의 사이에서만 인식대상의 부분 문자화상의 특징과의 유사도를 계산하며,
    상기 유사도 계산수단은,
    상기 제 1군과 제 2군의 기초 유사도를 따로따로 계산하되, 상기 기초 유사도는 상기 부분 문자화상의 특징과 상기 인식사전의 대응하는 표준특징의 시가지 거리, 유클리드 거리 또는 마할라노비스 거리인 기초 유사도 계산부와,
    상기 제 1군의 유사도에의 기여가 제 2군의 유사도에의 기여보다 크게 되도록 제 1군과 제 2군의 기초 유사도에 각각 소정의 계수를 곱하여 합계하는 유사도 합계부를 포함하는 것을 특징으로 하는 문자 인식장치.
  7. 제 6항에 있어서,
    상기 유사도 합계부에서 곱해지는 계수는 제 1군의 기초 유사도에 대하여 1.0이고, 제 2군의 기초 유사도에 대하여 0.5이며,
    상기 인식문자 선출수단은 유사도가 가장 작은 값의 문자를 유사도가 가장 높은 문자로서 선출하는 것을 특징으로 하는 문자 인식장치.
  8. 제 1항에 있어서,
    상기 부분 화상영역 분류수단은,
    상기 부분 화상영역을 차지하는 부분 문자화상의 비율을 각 부분 화상영역마다 계산하는 부분 문자화상 비율계산부와,
    상기 부분 문자화상의 비율이 임계값 미만인지 이상인지의 여부에 따라 상기 부분 화상영역을 정상부의 제 1군과 변형부의 제 2군으로 분류하는 정상 · 변형부 판정부를 포함하는 것을 특징으로 하는 문자 인식장치.
  9. (정정)
    제 8항에 있어서,
    상기 유사도 계산수단은,
    상기 제 1군과 제 2군의 기초 유사도를 따로따로 계산하되, 상기 기초 유사도는 상기 부분 문자화상의 특징과 상기 인식사전의 대응하는 표준특징의 시가지 거리, 유클리드 거리 또는 마할라노비스 거리인 기초 유사도 계산부와,
    상기 제 1군의 유사도에의 기여가 제 2군의 유사도에의 기여보다도 커지도록 제 1군과 제 2군의 기초 유사도에 각각 소정의 계수를 곱하여 합계하는 유사도 합계부를 포함하는 것을 특징으로 하는 문자 인식장치.
  10. 제 9항에 있어서,
    상기 유사도 합계부에서 곱해지는 계수는 제 1군의 기초 유사도에 대하여 1.0이고, 제 2군의 기초 유사도에 대하여 0.5이며,
    상기 인식문자 선출수단은 유사도가 가장 작은 값의 문자를 유사도가 가장 높은 문자로서 선출하는 것을 특징으로 하는 문자 인식장치.
  11. (정정)
    제 8항에 있어서,
    상기 유사도 계산수단은,
    상기 부분 문자화상의 특징과 상기 인식사전의 대응하는 표준 특징과의 시가지 거리, 유클리드 거리 또는 마할라노비스 거리인 상기 제 1군의 기초 유사도를 계산하고, 기초 유사도가 상위인 상위 문자 군을 상기 인식사전으로부터 후보문자로서 선출하는 후보문자 선출부와,
    상기 후보문자 선출부에서 선출된 후보문자에 대하여 제 2군의 기초 유사도를 계산하는 제 2군 기초 유사도 계산부와,
    상기 제 1군의 유사도에의 기여가 제 2군의 유사도에의 기여보다 커지도록 제 1군과 제 2군의 기초 유사도에 각각 소정의 계수를 곱하여 합계하는 유사도 합계부를 포함하는 것을 특징으로 하는 문자 인식장치.
  12. 제 11항에 있어서,
    상기 유사도 합계부에서 곱해지는 계수는 제 1군의 기초 유사도에 대하여 1.0이고, 제 2군의 기초 유사도에 대하여 0.5이며,
    상기 인식문자 선출수단은 유사도가 가장 작은 값의 문자를 유사도가 가장 높은 문자로서 선출하는 것을 특징으로 하는 문자 인식장치.
  13. (정정)
    제 8항에 있어서,
    형상이 유사한 문자의 표준적인 화상 군을 N(N≥2)의 부분 화상영역으로 분할하고, 각 부분 화상영역에 포함되는 부분 문자화상의 문자군 표준 특징을 유사문자 단위의 문자코드 군과 함께 미리 등록하고 있는 문자군 분류사전과,
    상기 제 1군에 분류된 인식대상 문자화상의 부분 문자화상의 특징과 상기 문자군 분류사전에 등록된 대응하는 문자군 표준 특징의 유사도를 계산하여 유사도가 높은 문자군의 문자코드를 선출하는 문자군 선출수단을 포함하며,
    상기 유사도 계산수단은 상기 문자군 선출수단에서 선출된 문자코드에 대응하는 상기 인식사전에 등록된 표준 특징과의 사이에서만 인식대상의 부분 문자화상의 특징과의 유사도를 계산하며,
    상기 유사도 계산수단은,
    상기 제 1군과 제 2군의 기초 유사도를 따로따로 계산하되, 상기 기초 유사도는 상기 부분 문자화상의 특징과 상기 인식사전의 대응하는 표준특징의 시가지 거리, 유클리드 거리 또는 마할라노비스 거리인 기초 유사도 계산부와,
    상기 제 1군의 유사도에의 기여가 제 2군의 유사도에의 기여보다 커지도록 제 1군과 제 2군의 기초 유사도에 각각 소정의 계수를 곱하여 합계하는 유사도 합계부를 포함하는 것을 특징으로 하는 문자 인식장치.
  14. 제 13항에 있어서,
    상기 유사도 합계부에서 곱해지는 계수는 제 1군의 기초 유사도에 대하여 1.0이고, 제 2군의 기초 유사도에 대하여 0.5이며,
    상기 인식문자 선출수단은 유사도가 가장 작은 값의 문자를 유사도가 가장 높은 문자로서 선출하는 것을 특징으로 하는 문자 인식장치.
  15. 제 8항에 있어서,
    상기 임계값은 75%인 것을 특징으로 하는 문자 인식장치.
  16. (정정)
    인식대상 문자화상을 문자코드로서 인식하는 문자인식장치의 문자 인식방법으로서,
    인식대상 문자화상을 N(N≥2)의 부분 화상영역으로 분할하는 화상영역 분할단계와,
    상기 부분 화상영역에 포함되는 부분 문자화상의 특징을 추출하는 특징 추출단계와,
    상기 부분 화상영역을 복수군으로 분류하는 부분 화상영역 분류단계와,
    각 군마다 상기 인식대상 문자화상의 부분 문자화상의 특징과, 문자의 표준적인 화상을 N의 부분 화상영역으로 분할하고, 각 부분 화상영역에 포함되는 부분 문자화상의 표준 특징을 문자단위로 문자코드와 함께 미리 등록하고 있는 인식 사전의 대응하는 표준 특징과의 기초 유사도를 계산하고, 각 군의 기초 유사도에 소정의 가중을 하여 인식대상 문자화상과 상기 인식사전의 문자와의 유사도를 계산하는 유사도 계산단계와,
    상기 유사도가 가장 높은 문자를 인식문자로 하여 그 문자코드를 선출하는 인식문자 선출단계를 포함하는 것을 특징으로 하는 문자 인식장치의 문자 인식방법.
  17. (정정)
    제 16항에 있어서,
    상기 부분 화상영역 분류단계는,
    상기 부분 화상영역을 인식대상 문자화상의 주변부의 제 1군과 중앙부의 제 2군으로 분류하는 주변·중앙분류 서브단계를 포함하며,
    상기 유사도 계산단계는,
    상기 제 1군과 제 2군의, 상기 부분 문자화상의 특징과 상기 인식사전의 대응하는 표준특징과의 시가지 거리, 유클리드 거리 또는 마할라노비스 거리인 기초 유사도를 따로따로 계산하는 기초 유사도 계산 서브단계와,
    상기 제 1군의 유사도에의 기여가 제 2군의 유사도에의 기여보다 커지도록 제 1군과 제 2군의 기초 유사도에 각각 소정의 계수를 곱하여 합계하는 유사도 합계 서브단계를 포함하는 것을 특징으로 하는 문자 인식장치의 문자 인식방법.
  18. (정정)
    제 16항에 있어서,
    상기 부분 화상영역 분류단계는,
    상기 부분 화상영역에 차지하는 부분 문자화상의 비율을 각 부분 화상영역마다 계산하는 부분 문자화상 비율계산 서브단계와,
    상기 부분 문자화상의 비율이 임계값 미만인지 이상인지의 여부에 따라 상기 부분 화상영역을 정상부의 제 1군과 변형부의 제 2군으로 분류하는 정상·변형부 판정 서브단계를 포함하는 것을 특징으로 하는 문자 인식장치의 문자 인식방법.
  19. (정정)
    문자인식장치에 적용되는 컴퓨터 판독 가능한 기록매체로서, 문자의 표준적인 화상을 N(N≥2)의 부분 화상영역으로 분할하고, 각 부분 화상영역에 포함되는 부분 문자화상의 표준 특징을 문자단위로 문자코드와 함께 미리 등록하고 있는 인식 사전이 기록되어 있고,
    인식대상 문자화상을 N의 부분 화상영역으로 분할하는 화상영역 분할단계와,
    상기 화상영역 분할단계에서 분할된 부분 화상영역에 포함되는 부분 문자화상의 특징을 추출하는 특징 추출단계와,
    상기 화상영역 분할단계에서 분할된 부분 화상영역을 복수군으로 분류하는 부분 화상영역 분류단계와.
    각 군마다 상기 인식대상 문자화상의 부분 문자화상의 특징과 상기 인식사전의 대응하는 표준특징과의 기초 유사도를 계산하고, 각 군의 기초 유사도에 소정의 가중을 하여 인식대상 문자화상과 상기 인식사전의 문자와의 유사도를 계산하는 유사도 계산단계와,
    상기 유사도가 가장 높은 문자를 인식문자로 하여 그 문자코드를 선출하는 인식문자 선출단계를 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 문자인식장치에 적용되는 컴퓨터 판독 가능한 기록매체.
  20. 제 19항에 있어서,
    상기 부분 화상영역 분류단계는,
    상기 부분 화상영역을 차지하는 부분 문자화상의 비율을 각 부분 화상영역마다 계산하는 부분 문자화상 비율계산 서브단계와,
    상기 부분 문자화상의 비율이 임계값 미만인지 이상인지의 여부에 따라 상기 부분 화상영역을 정상부의 제 1군과 변형부의 제 2군으로 분류하는 정상 · 변형부 판정 서브단계를 포함하는 것을 특징으로 하는 문자인식장치에 적용되는 컴퓨터 판독 가능한 기록매체.
KR10-1998-0056074A 1997-12-19 1998-12-18 문자 인식장치 및 그 방법과 문자인식 프로그램을 기록한 컴퓨터 판독 가능한 기록매체 KR100498683B1 (ko)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP35046097 1997-12-19
JP???9-350460 1997-12-19
JP9-350460 1997-12-19
JP???10-336918 1998-11-27
JP10336918A JPH11238099A (ja) 1997-12-19 1998-11-27 文字認識装置及びその方法並びに文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JP10-336918 1998-11-27

Publications (2)

Publication Number Publication Date
KR19990063196A KR19990063196A (ko) 1999-07-26
KR100498683B1 true KR100498683B1 (ko) 2005-09-09

Family

ID=26575617

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-1998-0056074A KR100498683B1 (ko) 1997-12-19 1998-12-18 문자 인식장치 및 그 방법과 문자인식 프로그램을 기록한 컴퓨터 판독 가능한 기록매체

Country Status (4)

Country Link
JP (1) JPH11238099A (ko)
KR (1) KR100498683B1 (ko)
CN (1) CN1153168C (ko)
TW (1) TW406246B (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005301664A (ja) * 2004-04-12 2005-10-27 Fuji Xerox Co Ltd 画像辞書作成装置、符号化装置、データファイル、画像辞書作成方法及びそのプログラム
KR100655916B1 (ko) * 2004-07-19 2006-12-08 한국과학기술원 방대한 데이터의 디지털화를 위한 문서영상처리 및검증시스템 및 그 방법
JP2006065477A (ja) * 2004-08-25 2006-03-09 Fuji Xerox Co Ltd 文字認識装置
US7844114B2 (en) * 2005-12-12 2010-11-30 Microsoft Corporation Logical structure layout identification and classification for offline character recognition
CN100535931C (zh) * 2006-09-06 2009-09-02 中国科学院自动化研究所 一种多分辨率退化字符自适应识别系统及方法
JP4872930B2 (ja) * 2008-01-21 2012-02-08 株式会社デンソー 文字認識装置、そのような装置を備えた燃料ポンプモジュールの組み付け装置及び文字認識方法
JP2010286353A (ja) * 2009-06-11 2010-12-24 Ricoh Elemex Corp 画像検査装置、画像検査方法およびプログラム
CN101944174B (zh) * 2009-07-08 2012-06-27 西安电子科技大学 车牌字符的识别方法
JP6327963B2 (ja) * 2014-06-09 2018-05-23 株式会社日立情報通信エンジニアリング 文字認識装置及び文字認識方法
CN108564079B (zh) * 2018-05-08 2022-07-19 东华大学 一种便携式字符识别装置及方法
CN109753967A (zh) * 2018-12-29 2019-05-14 北京师范大学 一种图片文字识别方法
CN109871847B (zh) * 2019-03-13 2022-09-30 厦门商集网络科技有限责任公司 一种ocr识别方法及终端

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108882A (ja) * 1991-10-17 1993-04-30 Matsushita Electric Ind Co Ltd 文字認識装置
JPH08123905A (ja) * 1994-10-28 1996-05-17 Canon Inc 文字認識装置及び方法
JPH09102014A (ja) * 1995-10-05 1997-04-15 Ricoh Co Ltd 文字認識方法
KR19980065813A (ko) * 1997-01-15 1998-10-15 이종수 문자 인식방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108882A (ja) * 1991-10-17 1993-04-30 Matsushita Electric Ind Co Ltd 文字認識装置
JPH08123905A (ja) * 1994-10-28 1996-05-17 Canon Inc 文字認識装置及び方法
JPH09102014A (ja) * 1995-10-05 1997-04-15 Ricoh Co Ltd 文字認識方法
KR19980065813A (ko) * 1997-01-15 1998-10-15 이종수 문자 인식방법

Also Published As

Publication number Publication date
CN1221927A (zh) 1999-07-07
KR19990063196A (ko) 1999-07-26
CN1153168C (zh) 2004-06-09
TW406246B (en) 2000-09-21
JPH11238099A (ja) 1999-08-31

Similar Documents

Publication Publication Date Title
CN111325203B (zh) 一种基于图像校正的美式车牌识别方法及系统
EP2943911B1 (en) Process of handwriting recognition and related apparatus
KR100498683B1 (ko) 문자 인식장치 및 그 방법과 문자인식 프로그램을 기록한 컴퓨터 판독 가능한 기록매체
US20090041361A1 (en) Character recognition apparatus, character recognition method, and computer product
US8229232B2 (en) Computer vision-based methods for enhanced JBIG2 and generic bitonal compression
JP3228938B2 (ja) 分布マップを用いる画像の分類方法及び装置
CN106372624A (zh) 人脸识别方法及系统
CN112990079A (zh) 基于大数据和人工智能的匹配度计算方法
JP2986074B2 (ja) 近傍点検出方法及びパターン認識装置
CN109726722B (zh) 一种字符分割方法及装置
Vaidya et al. Marathi numeral recognition using statistical distribution features
Van Phan et al. Collecting handwritten nom character patterns from historical document pages
KR101849933B1 (ko) 공분산 기술자와 퍼지 모델을 이용한 심볼 인식장치
JPS60153574A (ja) 文字読取方法
KR100449486B1 (ko) 수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법
Chanda et al. Font identification—In context of an Indic script
JP2832928B2 (ja) 文字認識方法
JP3790736B2 (ja) 文字認識用辞書作成装置及び文字認識装置
KR970002424B1 (ko) 후보문자분류방법
JP3372005B2 (ja) 文字認識装置
JP3442223B2 (ja) 文字認識方法
JP3104355B2 (ja) 特徴抽出装置
KR940007615B1 (ko) 문자인식에서 좌, 우 거리모양을 이용한 후보문자 분류방법
JP2001092921A (ja) 文字行領域抽出方法と文字行領域検出に用いられる学習方法
JP2747136B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130603

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20140603

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20150518

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20160517

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20170522

Year of fee payment: 13

LAPS Lapse due to unpaid annual fee