KR910000786B1 - 패턴인식방식 - Google Patents

패턴인식방식 Download PDF

Info

Publication number
KR910000786B1
KR910000786B1 KR1019870006252A KR870006252A KR910000786B1 KR 910000786 B1 KR910000786 B1 KR 910000786B1 KR 1019870006252 A KR1019870006252 A KR 1019870006252A KR 870006252 A KR870006252 A KR 870006252A KR 910000786 B1 KR910000786 B1 KR 910000786B1
Authority
KR
South Korea
Prior art keywords
pattern
character
matching
subdivision
librarian
Prior art date
Application number
KR1019870006252A
Other languages
English (en)
Other versions
KR880000876A (ko
Inventor
다찌가와 미찌요시
사또 겐
Original Assignee
주식회사 리코
히로시 하마다
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP61144486A external-priority patent/JPH0711819B2/ja
Priority claimed from JP61144488A external-priority patent/JPH0740288B2/ja
Application filed by 주식회사 리코, 히로시 하마다 filed Critical 주식회사 리코
Publication of KR880000876A publication Critical patent/KR880000876A/ko
Application granted granted Critical
Publication of KR910000786B1 publication Critical patent/KR910000786B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/469Contour-based spatial representations, e.g. vector-coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

내용 없음.

Description

패턴인식방식
제1도는 본 발명의 하나의 실시예에 의한 패턴인식방식의 기능적 블록다이어그램.
제2a도, 제2b도 및 제2c도는 제1도의 방식이 등록모드로 작동되는 경우 사서작성처리에 대한 일련의 스텝을 나타낸 플로우챠트.
제3도는 제1도의 방식이 인식모드로 작동되는 경우 패턴인식처리에 대한 일련의 스텝을 도시한 플로우챠트.
제4도는 본 발명의 다른 실시예에 있어서 패턴인식처리에 대한 일련의 스텝을 도시한 플로우챠트.
제5도는 본 발명의 또 다른 실시예에 있어서 패턴인식처리에 대한 일련의 플로우챠트.
제6도는 다층방향 히스토그램방식에 사용되는 특정벡터의 성질을 설명하기 위한 그래프.
제7도는 본 발명의 또 다른 실시예에 있어서 패턴인식방식의 기능적 블록다이어그램.
제8도는 제7도의 방식에 있어서 일련의 매칭처리 스텝을 설명하기 위한 플로우챠트.
제9도는 본 발명의 다른 실시예에 있어서 일련의 매칭처리 스텝을 나타낸 플로우챠트.
제10a도 및 제10b도는 특징벡터의 재배열(rearrangement)을 설명하기 위한 도식도.
제11도는 본 발명의 한 실시예에 있어서 일련의 문자인식방식스텝을 나타낸 플로우챠트.
제12도는 본 발명의 또 다른 실시예에 있어서 광학문자인식방식을 나타낸 기능적 블록다이어그램.
제13도는 본 발명의 패턴인식방식에 적절하게 사용되는 다수의 소정방향코드를 설명하기 위한 일례도.
제14도는 문자패턴의 일례도.
제15도는 제13도의 방향코드가 제14도의 문자패턴의 윤곽을 따라 위치되는 주변화소(peripheral pixel)에 할당된 상태를 나타낸 일례도.
제16도는 문자패턴의 주변을 결정하기 위하여 제14도의 문자패턴을 가로질러 광학주사하는 것을 설명하기 위한 일례도.
제17a도, 제17b도 및 제17c도는 제15도에 표시된 문자패턴을 주사한 주변테이블을 나타낸 일례도.
제18a도는 제18aa도와 제18ab도의 조합방법을 설명하는 일례도.
제18aa도, 제18ab도 및 제18b도는 주변판정처리에 대한 일련의 스텝을 나타낸 플로우챠트.
제19a도, 제19b도 및 제19c도는 제15도의 문자패턴에 있어서, 메쉬영역(mesh region)에 대해 얻은 관심층화소에 대한 방향코드의 히스토그램을 나타낸 그래프.
제20도는 제20a도와 제20b도의 조합방법을 나타낸 일례도.
제20a도 및 제20b도는 제20도에 표시된 대로 조합되는 경우 히스토그램 작성처리에 대한 일련의 플로우챠트.
제21도는 세분방식(subdivision method) #1에 대한 일련의 스텝을 나타낸 플로우챠트.
제22a도 및 제22b도는 세분방식 #1에 의해서 세분된 일례도.
제23a도 및 제23b도는 메쉬세분이 고정세분점을 사용하여 행하여지는 경우 야기될 수 있는 문제점을 설명하기 위한 일례도.
제24도는 세분방식 #2에 대한 일련의 스텝을 나타낸 플로우챠트.
제25a도 및 제25b도는 세분방식 #1과 #2에 의해서 얻어진 결과를 비교설명하기 위한 일례도.
제26도는 세분방식 #3에 대한 일련의 스텝을 나타낸 플로우챠트.
제27a도 및 제27b도는 세분방식 #2와 #3에 의해서 얻어진 결과를 비교설명하기 위한 일례도.
* 도면의 주요부분에 대한 부호의 설명
10, 414 : 패턴 판독부(pattern reading unit)
12, 416 : 전처리부(pre-processing unit)
14, 418, 726 : 특징 추출부(feature extracing unit)
16, 420 : 재배열부(rearranging unit)
18, 412 : 재배열테이블부(rearrangement table unit)
20 : 사서작성부(library forming unit)
22, 410 : 사서(library) 24, 442, 728 : 매칭부(matching unit)
26 : 재배열테이블작성부(rearrangement table forming unit)
28 : 임계값결정부(threshold determining unit)
30 : 임계값테이블부(threshold table unit)
424, 730 : 출력부(output unit) 721 : 주사장치(scanner)
722 : 문자추출부(character extracting unit)
723 : 노이즈제거부(noise eliminating unit)
724 : 정규화부(normalizing unit) 725 : 문자메모리(character memory)
727 : 작업메모리(work memory) 729 : 사서메모리(library memory)
본 발명은 2차원 평면내에 한정될 수 있는 패턴인식시스템 및 패턴인식방식에 관한 것이며, 특히, 패턴과 관련된 특징벡터(feature vector)를 사용하여 문자패턴(character pattern) 또는 음성패턴등의 패턴을 인식하기 위한 방식에 관한 것이다.
보다 상세히 설명하면, 본 발명은 수서(手書)문자를 인식하는데 특히 적합한 패턴인식방식(pattern recognition system)에 관한 것이다.
다층방향 히스토그램(multi-layer directionary histogram)을 사용하는 패턴인식방식은 일본특허출원 제59-202822 및 58-202825호에 제안되어 있다.
다층방향 히스토그램법에 의한 패턴인식방식에 있어서는 우선, 문자등의 패턴윤곽화소(輪郭畵素)에 방향코드를 붙이고, 그 문자등 패턴을 에워싸고 있는 프레임의 각 변에서 대향하는 변을 향해 패턴을 주사하여 백화소(white pixel, 배경)의 다음에 출현하는 방향코드를 검출하고, 그 방향코드를 그것이 주사선(scanning line)상에서 몇번째에 검출되었는가에 의하여 다수의 소정층 중의 하나로 분리한다.
다음에, 패턴프레임내의 분할영역마다 소정층까지의 층방향코드의 히스토그램을 구하고, 각각의 히스토그램을 성분(특징량)으로 한 벡터를 패턴의 특징벡터로 사용한다. 예를 들면, 방향코드로서 8종류의 코드를 붙이고, 패턴프레임을 4×4 메쉬영역(mesh region)으로 분할한다.
이 경우에 있어서, 제1층 및 2층방향 코드까지를 대상으로 한다면, 특징벡터의 차원수는 256(=4×4×2×8)으로 된다. 알려진 패턴에 대한 특징벡터의 집합인 사서(library)에 관해서는, 패턴종(種)마다에 대한 다수의 패턴으로부터 동일한 모양의 특징벡터를 추출하고, 그의 평균을 사서패턴(혹은 기준패턴)의 특징벡터로써 등록한다. 또한, 패턴프레임영역의 세분방식은 상기 출원명세서에 밝혀진 것에만 한정되지 않는다.
예를들면, 상기 출원명세서에 밝혀진 패턴인식방법과 동일하게, 방향코드가 균등하게 분배될 수 있도록 패턴프레임을 메쉬분할하고, 그 메쉬영역을 미리 설정된 파라메타에 따라 부분적으로 중합하여 세분영역의 수를 적게하도록 하는 방법을 채용할 수 있다. 이와 같은 영역분할방법을 이용한 다층방향 히스토그램법에 의한 패턴인식방식은 본 출원인에 의해 기히 제안된 것이나, 그와 같은 패턴인식방식에도 본 발명은 동일하게 사용될 수 있다.
상기와 같은 다층방향 히스토그램법에 의한 인식방식에 있어서는 미지패턴(unknown pattern)의 특징벡터와 사서패턴(library pattern)의 특징벡터와의 매칭거리를 연산하여 미지패턴 즉, 입력패턴을 인식하게 된다.
그러나, 상기와 같은 특징벡터의 차원수가 크게되면, 거리연산량이 많으면, 매칭처리시간이 길게 걸리는 문제점이 있다. 따라서, 본 발명의 목적은 종래방식의 문제점을 해결하고, 향상된 패턴인식방식을 제공하고자 하는 것이다.
본 발명의 다른 목적은 다층방향 히스토그램을 사용하여 문자패턴등 패턴을 인식하기 위한 향상된 방식을 제공하고자 하는 것이다.
본 발명의 또 다른 목적은 고속 및 고인식율로 패턴을 인식하기 위한 향상된 방식을 제공하고자 하는 것이다.
본 발명의 또 다른 목적은 매칭연산을 효율적으로 수행하기 위한 향상된 패턴인식방식을 제공하고자 하는 것이다.
본 발명의 또 다른 목적은 수서문자(hand written chracters), 편지 및 기호의 기계인식(machine recognition)에 적절하게 사용되는 향상된 패턴인식방식을 제공하고자하는 것이다.
본 발명의 또 다른 목적은 공지문자의 기준데이터를 등록하기 위해 사서에 요구되는 용량을 감소시킬 수 있는 향상된 패턴인식방식을 제공하고자 하는 것이다.
본 발명의 제1형태에 있어서, 패턴이 광학판독되는 경우, 다층방향 히스토그램이 작성된 다음 특징벡터가 추출된다. 다음에, 특징벡터의 성분은 기준패턴(reference pattern)으로 사서에 등록되기 전 또는 사서에 등록된 기준패턴중의 하나와 비교되기 전에 재배열된다.
다층방향 히스토그램방법에 있어서, 특징벡터는 패턴인식의 효과가 큰 차원의 성분 및 현저히 낮은 차원의 성분을 포함하게 된다. 이들 보다 상세히 설명하기 위하여 2차원의 특징벡터를 고려한다. 차원수를 2로하여 다층방향 히스토그램법에 의해 사서를 작성한 경우, 일본어로 문자인식을 의미하는 4개의 한자(Kanji characters)에 대한 특징벡터가 제6도의 g1, g2, g3및 g4와 같게된다.
상기예에 있어서, 그래프에서 알 수 있는 바와 같이 각 특징벡터는 수평방향의 제1성분 A를 갖는데, 이는 수직방향의 제2성분 B에 대해서 분산 또는 표준편차에 있어서 보다 큰 값을 갖는다.
다시 말해서, 특징벡터의 성분 A는 미지패턴을 인식함에 있어서, 성분 B보다 높은 인식능을 갖는다.
이와 같은 특징벡터의 성질에 착안하면, 패턴식별능력이 높은 성분부터 우선적으로 매칭처리를 연산하는 것에 의해 패턴식별능력이 높은 일부의 차원까지 매칭거리 연산을 실행하는 단계에서 후보로 될 수 없는 사서 패턴을 배제하고 후보로 될 수 있는 사서패턴을 조기 단계에서 끼워넣을 수 있다.
다층방향 히스토그램에 의해서 얻어진 특징벡터는 중요한 특징을 갖는데, 이는 각 차원의 성분순서가 재배열된다 할지라도 패턴의 특징이 보존된다는 것이다. 상기 특성에 착안하여 본 발명에서는 우선 모든 패턴종중에서 가(假) 사서패턴(provisional or temporary library pattern)의 특징벡터를 다층방향 히스토그램방식에 의해 얻은 다음 그 특징벡터의 성분을 표준편차 또는 분산이 큰 차원순서로 재배열한 새로운 벡터를 사서패턴의 특징벡터로서 사서에 등록한다.
본 발명의 패턴인식은 다음과 같이 수행된다. 즉, 미지(未知)(입력)패턴에서 다층방향 히스토그램법에 의해서 특징벡터를 추출하고, 그 성분을 표준편차 또는 분산의 크기순서로 재배열한 벡터를 각 패턴종(pattern species)에 사서패턴의 특징벡터와의 매칭(matching process)처리를 상위 N 차원까지 행하고 그 매칭거리와 문제의 패턴종에 해당하는 임계값(threshold)을 비교하고, 그 비교결과에 의해 당해 패턴종에 관한 매칭을 중단할 것인지 또는 하위차원까지의 상세매칭을 행할 것인지를 판정한다.
또한, 연산된 매칭거리와 비교되는 임계값은 다음과 같이 결정된다. 각 패턴종에 대해서, 복수의 패턴에서 다층방향 히스토그램법에 의해서 특징벡터를 각각 추출하여, 그 성분을 상기 표준편차 또는 분산이 큰 차원순서로 재배열한 벡터와 동일 패턴종의 전기 사서패턴의 특징벡터와의 상위 N 차원까지의 매칭거리에 대한 표준편차 또는 분산을 구하고 상기 표준편차 또는 분산에 근거하여 전기패턴종 각각에 대해 임계값을 결정한다.
이같은 본 발명에 의한 패턴인식방식에 의하면, 미지(입력패턴)과, 입력(미지)패턴의 후보로 될 수 없는 사서 또는 기준패턴사이의 매칭거리가 처리의 비교적 초기단계에서 중단되므로 매칭효율성이 향상되고 패턴인식속도가 증가된다. 게다가, 매칭처리의 중단을 결정하기 위한 임계값을 패턴종별로 세트함으로, 후보에서 배제되어서는 안되는 사서 또는 기준패턴과의 매칭처리가 잘못 중단되는 오류가 방지되므로, 다층방향 히스토그램을 사용하는 패턴인식방식의 근본적인 잇점은 상실되지 않으면서도 고인식율을 얻을 수 있는 것이다.
이하 본 발명의 실시예를 도면을 참조하여 상세히 설명한다.
제1도는 본 발명의 하나의 실시예를 기능적 구성을 간략하게 표시한 블록도이다. 또한, 상기 실시예에 있어서는 인식대상 패턴으로서 수서(手書) 한자등의 문자패턴을 상정하고 있다. 도면에 있어서 10은 원고에서 문자패턴을 판독하고 문자패턴정보를 전처리부 12에 입력하는 패턴판독부(pattern reading unit)이다.
전처리부 12는, 입력문자패턴을 각각 분리하고 각 분리된 문자에 대한 정규화등의 전처리를 행하고 처리후에 문자패턴을 1자마다 특징추출부 14에 입력하는 부분이다. 특징추출부 14는 입력문자패턴에서 전기다층방향 히스토그램법에 의해 특징벡터를 추출하는 부분이다.
제1도에 도시된 문자인식시스템은 다음 2개의 동작모드를 갖는다. 즉, (1) 사서 혹은 기준패턴을 형성하기 위한 등록모드(사서작성모드) 및 (2) 사서에 축적된 알려진 기준패턴과 비교함으로써 입력, 미지패턴을 인식하는 패턴인식모드이다.
먼저, 사서에 축적된 혹은 기준패턴을 형성하는 단계를 순차적으로 예시하고 있는 플로우챠트를 나타내는 제2a도 내지 제2c도를 참조하여 등록모드에 대하여 기술한다. 한 개의 문자종에 대하여 M개의 문자패턴이 패턴판독부 10에서 광학적으로 판독된다(스텝 50).
그 판독된 문자패턴은 전처리부 12에서 예정된 전처리를 받게되고(스텝 52) 특징추출부 14에 입력되어 다층방향 히스토그램법에 의해 특징벡터(예를 들어 256차원벡터)를 추출한다(스텝 54).
추출된 특징벡터를 재배열부 16를 통하여 사서작성부 20으로 입력된다. 그 사서작성부 20에 의해 M개의 입력문자패턴에서 추출된 특징벡터를 평균한 벡터가 구하여지고(스텝 56), 그 평균벡터는 그 문자종의 가(假) 사서패턴(provisional libtaty pattern)의 특징벡터로써 사서(22)에 가등록된다(스텝 58). 사서작성부 20에서는 최후의 문자종까지 처리가 종료되었는지를 조사하고(스텝 60), 미처리된 문자종이 남아있으면, 스텝 50으로 되돌아가 다음 문자종에 대하여 동일한 처리가 행하여진다.
모든 문자종에 관하여 처리가 종료되면 재배열테이블 작성부 26로 가서 사서 22에 가등록되어있는 상기 모든 가사서패턴의 특징벡터의 차원마다의 표준편차 또는 분산이 계산된다(스텝 62).
그리하여, 원래의 특징벡터를 표준편차 또는 분산의 크기차원순으로 재배열하기 위한 재배열테이블이 작성되어 재배열테이블 18에 등록된다(스텝 64). 여기까지는 재배열테이블을 작성하기 위한 처리단계이며 그 후의 실제 사서작성처리가 시작된다.
하나의 문자종 K에 관하여 M개의 문자패턴이 패턴판독부 10에서 순차입력된다(스텝 66).
그 입력문자패턴은 전처리부 12에서 전처리를 받아(스텝 68) 특징추출부 14에 입력되어 각층 방향 히스토그램법에 의한 특징벡터가 추출한다(스텝 70).
추출된 특징벡터의 성분은 재배열부 16에 의하여 재배열테이블부 18에 등록되어 있는 재배열테이블에 따라, 전기표준편차 또는 분산의 크기차원순으로 재배열된다(스텝 72).
이와 같이 성분이 재배열된 M개의 특징벡터는 사서작성부 20에 보내져 그것들의 평균벡터가, 그 문자종 K에 대한 사서패턴의 완성된 특징벡터로서 사서 20에 등록된다(스텝 74).
사서작성부 20에서는, 모든 문자종(K종)에 관하여 사서작성처리가 종료되었는가를 조사하여(스텝 76) 미처리의 문자종이 남아있으면, 미처리의 문자종에 관하여는 스텝 66에서 동일한 처리가 행하여진다. 모든 문자종에 관하여 처리가 완료하면 사서 그 자체의 작성은 종료하는 것이나 다음의 임계값결정처리가 행하여진다.
그 처리에 있어서는 문자종마다의 사서작성에 쓰여지는 것과 같은 M개의 문자패턴이 입력되어(스텝 78), 전처리(스텝 80)후, 각각 다층방향 히스토그램법에 의한 특징벡터를 추출한다(스텝 82).
그 M개의 문자패턴의 특징벡터는 각각 재배열부 16에 의해 재배열테이블에 따라 성분이 재배열되고(스텝 84), 매칭부 24에 입력된다. 다음 매칭부 24 및 임계값결정부 28의 협동에 의하여, 임계값결정이 행하여진다.
즉, 매칭부 24에 의하여, 그의 각 특징벡터와 문자종 K의 사서패턴의 특징벡터와의 매칭처리가 상위 N 차원까지 연산되어, 임계값결정부 28에 있어서, 그 연산결과로부터 상위 N 차원까지의 매칭처리 표준편차가 구하여진다(스텝 86).
그리하고, 그 표준편차가 문자종 K의 임계값으로서 임계값테이블부 30에 등록된다(스텝 88).
마찬가지 방법으로 기타 문자종의 임계값이 결정되어 임계값테이블 30에 등록된다. 모든 문자종에 관하여 임계값의 결정등록이 완료하였다고 판정되면(스텝 90), 사서작성모드의 처리전체가 종료한다.
다음에 제1도에서 도시된 본 발명에 의한 패턴인식방식의 패턴인식모드에 대하여 설명한다. 이 패턴인식모드의 연속단계가 제3도에 플로우챠트로써 도시되어 있다. 제3도에 도시된 바와 같이 인식대상의 미지의 문자패턴은, 패턴판독부 10에 입력되어(스텝 100), 전처리부 12에 의한 전처리(스텝 102)후, 특징추출부 14에서 다층방향 히스토그램법에 의하여 특징벡터(예를 들어 256차원의 벡터)을 추출한다(스텝 104).
이 특징벡터 성분은 재배열부 16에 의하여 재배열테이블에 따라 재배여된다. 재배열후에 특징벡터 Yn이 매칭부 24에 입력된다(스텝 106).
매칭부 24에서 문자종 K의 사서패턴의 특징벡터와 미지패턴의 특징벡터 Yn과의 상위 N 차원까지의 매칭거리 d가 연산된다(스텝 108).
그리하여, 그 매칭거리 d와 임계값테이블부 30에 등록되어 있는 대응문자종 K의 임계값 Thk와의 비교판정이 행하여진다(스텝 110).
비교결과 d > Thk 이면, 그 미지패턴의 문자종과 현재의 문자종 K일 가능성은 없으므로, 그의 사서패턴과의 매칭처리를 중단하고 종료판정을 행한다(스텝 116).
한편, d
Figure kpo00001
Thk 이면 현재의 문자종은 미지문자패턴의 문자종일 가능성이 높으므로, 상세매칭이 행하여진다.
즉, 이 경우, 전차원에 대하여 전매칭거리 D가 연산된다(스텝 112). 그리고 상기 거리 D와 그것가지의 후보의 거리가 비교되어, 거리가 적은 편의 문자종이 새로운 후보로서 남고(스텝 14), 종료판정의 스텝 116로 나간다. 스텝 116에 있어서 매칭하여야할 문자종이 남아있는 것으로 판정되면 다음의 문자종에 관하여 스텝 108이후 매칭처리가 행하여진다.
모든 문자종에 관하여 매칭처리가 행하여지면 스텝 116으로 종료라고 판정되어 최종적으로 남은 후보의 문자종의 문자코-드가 인식결과로서 출력된다.
그리하고, 한 개의 미지문자패턴의 인식처리를 완료한다. 이때, 수서한자종의 문자의 변형의 경향과 정도는 기입자(인식시스템의 사용자)에 따라 각양이다.
그것에 대처하기 위하여 각종의 문자변형을 고려한 문자패턴을 준비하고, 사서작성에 사용한다.
그러나, 그와 같이 하여도 문자인식시스템의 사용자에 따라 수서문자패턴과 사서패턴과의 매칭률은 달라진다. 또한, 동일의 사용자라도 인식시스템에 대하여 익숙정도에 따라서, 사서와의 매칭성이 향상되고 인식율이 높아지는 경향이 있다. 이와 같은 점에 착안하면 상세메칭을 행하느냐 아니하느냐의 판정을 위한 임계값을 변경할 수 있으면 바람직하다.
즉, 사서와의 매칭이 좋은 사용자의 경우 또는 익숙한 사용자의 경우 임계값을 내려서 상세매칭의 빈도를 줄임으로써 인식율을 저하시키지 않고 인식속도를 올릴 수가 있는 것이다.
다음에 그와 같은 임계값의 조정을 가능하게 한 본 발명의 제2 실시예에 관하여 설명한다.
본 실시예의 기능적 구성은 전기 실시예와 같은 것이므로 그의 블록도는 생략하고 이하의 설명에 있어서 필요에 따라 제1도를 참조한다.
그 실시예에 있어서는 사서작성모드에 있어서, 전기 실시예와 같이 재배열테이블과 사서가 작성된다. 단, 상세매칭을 행하느냐 아니하느냐의 판정을 위하여 복수의 임계값이 정해진다.
그점에 있어서 전기 제1실시예에 관련한 제2도의 플로우챠트를 참조하여 설명하면 스텝 88에 있어서 결정되는 임계값을 Thk로 하면, 그 실시예에 있어서는, Thk/1, Thk/2-Thk/L(L은 양의 정수)의 값이, 각각 문자종 K의 임계값 Thk(1), Thk(2)-Thk(L)로써 임계값 판정부 28에 의하여 결정되어, 임계값테이블부 30에 등록된다.
제4도는, 패턴인식모드 동작동안의 개략적인 플로우챠트이다. 제4도를 참조하여, 본 실시예의 패턴인식 모드에 관하여 설명한다. 본 실시예에 있어서는, 임계값 선택을 위한 파라메타인 유저레벨 UL(=1, 2, 3, …, L)이 최초의 스텝 200으로 설정된다. 그의 유저레벨 UL은, 패턴인식시스템의 사용자측에서 지정할 수 있는 것이다.
스텝 202에서 스텝 210까지는, 제3도의 스텝 100에서 스텝 108까지와 동일하다.
스텝 214에서 스텝 220까지는 제3도의 스텝 112에서 스텝 118까지와 동일하다. 스텝 212는, 상위 N 차원까지의 매칭거리에서 상세매칭을 행하는가 아닌가를 판정하기 위한 스텝이며 제3도의 스텝 110과 대응한다.
본 실시예의 경우 문자종 K의 복수의 임계값 Th(1)-Th(L)중에서, 유저레벨 UL에 대응하는 한 개의 임계값 Th(UL)가, 그의 판정의 임계값으로 쓰여진다. 즉, 본 실시예에 관한 패턴인식시스템에 익숙된 사용자의 경우, 유저레벨 UL을 높은 레벨(최고는 L)로 지정하면 보다 적은 임계값(최저는 Th(L))이 선택되어 판정에 쓰여지므로 상세매칭(스텝 214)에 나가는 빈도가 적게되어, 그만큼 매칭효율이 향상하여 문자인식속도가 높아진다. 역으로, 익숙하지 아니한 사용자 또는 사서와 매칭처리에 능숙하지 아니한 사용자의 경우, 낮은 유저레벨 UL(최저는 l)를 지정하면, 임계값(최고 Thk(1))가 선택되어 판정에 쓰여져, 상세매칭의 빈도가 오름으로 인식속도는 떨어지나 인식률을 올릴 수가 있다.
전술한 바와 같이 인식률은 사용자에 따라 변동되나 문자종에 의하여서도 변동한다. 이것은 사서작성용의 패턴과 같은 어떠한 경향을 가지는 패턴이 쓰여진 경우등에 현저하나, 그와 같은 점은 한자와 같이 문자종이 많은 경우, 사서작성단계에서는 체크가 곤란하다. 그와 같은 문자종마다의 인식율이 변동을 흡수할 수가 있다.
본 발명의 제3 실시예에 관하여 다음에 설명한다. 또한, 본 실시예에 관한 패턴인식시스템에 기능적 구성은 전기 제1 실시예와 같다. 또한, 사서작성모드의 처리는 전기 제2 실시예와 같으며 문자종마다 복수종류의 판정용 임계값 Th(1)-Th(L)가 결정된다.
제5도는 본 실시예에 있어서 패턴인식모드의 처리의 개략 플로우챠트이다. 제5도에서 스텝 300 내지 308은 제4도의 스텝 202-210과 동일내용이며 스텝 314-320도 제4도의 스텝 214-220과 동일내용이다.
스텝 310에서는, 문자종마다의 레벨 LV(k)가 임계값 선택용의 파라메타 V로서 설정된다. 레벨 LV(k)는 예를들어 패턴인식 시스템의 운용중에 문자종 K의 리젝트/인식률 Pk를 모아두어(蓄), 그의 Pk치를 어느 정수로 나누기 위한 값으로서 주어진다.
그리하여, 스텝 312는 제4도의 스텝 212에 대응하는 스텝이며 문자종 K의 복수의 임계값 Thk(1)-Th(L)중에서 파라메타 V에 대응하는 한 개의 임계값 Thk(V)를 선택하고 거리 d와 비교함으로 인하여 상세매칭(스텝 314)으로 나가는가 아닌가를 판정한다.
또한, 본 실시예와 전기 제2 실시예를 조합한 제4의 실시예에 관하여 편의상 제5의 플로우챠트를 참조하여 설명한다.
이 실시예에 있어서는 스텝 300의 전에 유저레벨 UL의 설정스텝(제4도의 스텝 200에 상당)이 추가된다. 또한 스텝 310에 있어서, 문자종 K의 레벨 LV(k)와 유저레벨 UL과의 총합이 파라메타 V로서 설정된다. 그리하여, 스텝 312에 있어서 파라메타 V에 대응하는 임계값 Thk(V)가 판정에 쓰여진다. 이것 이외에는 전기 각 실시예와 같다.
이의 실시예에 의하면 사용자 및 문자종에 의한 변동요인을 흡수하고, 최적임계값을 사용하여 상세매칭을 행하는가, 아닌가의 판정을 행할 수 있으므로 전기 제2 실시예와 제3 실시예의 양방의 잇점이 얻어진다.
이하, 본 발명의 다른 형태를 설명한다. 인식될 미지패턴(unknown pattern)과 비교되는 사서패턴(library pattern)을 매칭시킴에 있어서, 미지패턴과 사서패턴의 특징벡터의 대응차원성분간의 거리 또는 유사도가 연산되고, 거리의 최소합 또는 유사도의 최대합을 갖는 사서패턴이 인식결과로써 결정된다. 상기 한점에 착안하여 사서를 작성할 때 사서패턴의 특징벡터의 각 차원마다의 표준편차 또는 분산의 큰 차원순서로 재배열(rearrangement)하고, 상기와 같이 재배열한 후의 특징벡터를 사서에 등록해둔다.
다층방향 히스토그램에 의해 작성된 사서패턴의 특징벡터가 제10a도에 표시된 바와 같고, 모든 사서패턴에 있어서, 계산된 표준편차 또는 분산의 큰 차원순서가 X4, X1, X7, X5, X2, X8, X6…인 경우 예를 들어 설명한다.
다음에, 상기 특징벡터는 상기 차원 X1, X2, X3…의 성분이 제10b도에 표시된 바와 같이 재배열하여 사서에 등록된다. 즉, 원 특징벡터의차원 X4의 성분이 재배열된 후의 특징벡터의 최상위차원 Y1의 성분이 되고, 차원 X1의 성분이 차위의 차원 Y2의 성분이 된다.
그리고 미지패턴으로부터 추출된 특징벡터의 성분은 사서패턴의 특징벡터 성분의 재배열순서에 따라 재배열된 다음 사서패턴의 특징벡터의 대응차원성분과의 거리 또는 유사도의 연산이 우선적으로 행하여지고, 다음에, 미지패턴과 사서패턴사이의 매칭조각이 행하여진다.
이와 같이, 본 발명에 따라, 특징벡터의 패턴식별능력이 높은 성분을 우선적으로 이용하여 사서패턴과 미지패턴과의 매칭조각이 효과적으로 행하여지므로써 미지패턴이 인식된다.
본 발명에 의한 실시예인 문자패턴 인식방식의 블록계통도를 나타낸 제7도를 참조하여 설명한다. 제7도에 도시된 방식에 있어서, 410은 사서를 나타내고, 이 사서 410에는 다층방향 히스토그램법에 의해서 작성된 기준문자패턴의 특징벡터군이 등록되어 있어, 전기와 같이, 각 특징벡터 성분이 표준편차의 큰 차원순서로 재배열된다.
여기서, 사서에 등록된 다수(K)의 기준패턴중의 사서패턴
Figure kpo00002
, 차원 n, 성분 gkn의 표준편차 σn은 식
Figure kpo00003
Figure kpo00004
에 의해서 계산된다.
물론, 표준편차 대신에, 상기 평방근 인분산의 크기차원순으로 특징벡터의 성분을 재배열할 수 있다. 412는 사서작성시에 작성된 재배열테이블이다. 이 재배열테이블에는 상기한 사서패턴의 특징벡터 성분의 재배열 후의 차원대응표가 등록되어있다.
또한, 414는 원고로부터 문자패턴을 판독하고, 문자패턴정보를 전처리부 416에 입력하는 패턴판독부이다. 상기 전처리부 416는 판독부 414로부터 랫식된 문자패턴을 별개의 문자패턴으로 분리하고 정규화하는 등의 전처리를 행하고, 처리후의 문자패턴을 한자씩 특징추출부 418로 입력하는 부분이다.
상기 특징추출부 418는 입력문자패턴(이하, 미지패턴이라 칭함)으로부터 전기 다층방향 히스토그램법에 의해 특징벡터를 추출하는 부분이다. 추출된 특징벡터는 재배열부 420에 입력된다.
상기 재배열부 420는, 재배열테이블 412을 참조하여, 미지패턴으로부터 추출된 특징벡터의 각 성분을, 사서패턴의 특징벡터 성분의 재배열차원순서와 같은 순서로 재배열하고, 재배열후의 특징벡터를 매칭부 422에 입력한다.
상기 매칭부 422는 사서패턴의 특징벡터와 성분재배열 후의 미지패턴의 특징벡터와의 거리를 상위차원으로부터 우선적으로 연산하고 이에 의해 미지패턴의 매칭을 행하여 미지패턴 즉 문자를 인식하는 부분이다.
424는 매칭부 422의 인식결과를 출력하는 출력부이다. 여기서, 매칭부 422의 처리과정을 제8도에 표시된 플로우챠트를 참조하여 설명한다.
성분 재배열 후의 미지패턴의 특징벡터가 매칭부 422에 입력되면 사서패턴 번호
Figure kpo00005
가 "1" 세트되고(스텝 500) 사서패턴과 미지패턴과의 매칭이 행하여진다.
우선, 상위 N차원까지에 대해서, 상기 사서패턴의 특징벡터의 각 성분 fkn(n은 차원)과 미지패턴의 특징벡터 Yn와의 거리 총합 dk가 계산된다(스텝 502). 거리총합 dk가 임계값 Thd와 비교된다(스텝 504).
만약 dk > Th이면, 상기 사서패턴은 후보패턴(후보문자)으로 될 수 없으므로, 상기 매칭은 상기 단계에서 단절되고, 따라서, 사서패턴번호
Figure kpo00006
를 인크리멘트(increment)한 (스텝 506)후에 스텝 502로 복귀된다.
테이블 104에 있어서 dk
Figure kpo00007
Th인 경우 상기 사서패턴은 후보문자로 될 수 있으므로 상세매칭을 행한다. 상기 상세매칭공정은 상위 N차원의 다른 차원으로부터 최종차원(여기서는 256차원)까지 포함하여, 사서패턴과 미지패턴과의 거리 Dk를 계산하는 공정이다(스텝 508).
다음에, 후보패턴과 미지패턴과의 거리가 새롭게 얻어진 거리와 비교되고, 거리의 작은 순으로 배열될 때 일정수의 후보패턴이 얻어진다(스텝 510).
다음에, 스텝 506을 경유하여 502로 복귀된다. 최후 사서패턴까지의 매칭처리가 완료되면, 스텝 507에 있어서 k
Figure kpo00008
MAX로 되기 때문에 후보패턴(문자)의 코드를 출력하여(스텝 512) 미지패턴에 대한 매칭처리를 완료하게 된다.
이와 같이, 상기 실시예에서는 패턴인식능력이 높은 상위 N 차원에 관련하여 거리연산을 행하고, 그 거리를 임계값과 비교항 미지패턴에서 후보패턴으로 될 수 없는 사서패턴을 배제하고, 후보패턴으로 될 수 있는 사서패턴에 대해서만 모든 차원을 대상으로 한 거리연산을 행한다.
한편, 사서패턴의 분류는 단지 상위차원에서 N 차원까지의 상위차원을 매칭처리함으로써 수행되어, 후보패턴이 될 수 없는 사서패턴이 배제되므로 불필요한 거리계산이 생략된다. 이 구조에 있어서, 계산되는 거리값은 현저하게 감소되므로 인식속도 및 인식율이 현저하게 향상된다.
이하, 본 발명의 제2형태의 제2의 실시예를 설명한다. 본 실시예의 전체적인 기능적 구성은 전기실시예와 같고, 매칭부 422에 있어서의 매칭처리가 일부 상위할 뿐이다. 따라서, 상기 매칭부 422의 처리에 대해서만, 제9도을 참조항 설명한다.
성분의 재배열 후에 미지패턴의 특징벡터가 매칭부에 인입되면 사서패턴의 번호
Figure kpo00009
가 "1"로 세트되고(스텝 600), 그 사서패턴과 미지패턴과의 매칭처리가 행하여진다.
우선, 상위 N1차원까지에 대해서, 상기 사서패턴의 특징벡터의각 성분 fkn과 미지패턴의 특징벡터 Yn과의 거리총합 dk1이 계산된다(스텝 602). 그리고, 상기 거리의 총합 dk1은 임계값 Th1과 비교된다(스텝 604).
만약 dk > Th1이면, 상기 사서패턴은 후보패턴(문자)으로 될 수 없으므로 매칭처리를 그 단계에서 단절하고, 사서패턴번호
Figure kpo00010
를 인크리멘트하고(스텝 606), 스텝 602로 복귀된다. 즉, 사서패턴은 상기 N1차원까지의 거리연산에 의해서 분류되고, 상기 분류에 의해서 배제된 사서패턴에 대해서는 어떠한 상세매칭처리도 수행되지 않는다.
만약 스텝 604에서 dk1
Figure kpo00011
Th1이면, 상위차원(단, N2> N1임)까지의 거리총합 dk2가 구해진다(스텝 608). 그리고 dk2와 임계값 Th2와의 비교판정이 행하여진다(스텝 610). 만약, dk2> Th2이면, 상기 사서패턴은 후보패턴으로부터 배제되므로 스텝 606을 경유해서 스텝 602로 복귀된다. 결국, 사서패턴의 중간분류가 상위 N2차원까지의 거리연산에 의해 수행되고 후보패턴으로부터 배제된 사서패턴에 대해서는 어떠한 상세매칭처리도 더 이상 수행되지 않는다.
한편, 중간분류에서 배제되지 않은 남은 사서패턴에 대해서, 상위차원 N3(단, N3> N2)에 대한 거리총합 dk3이 계산되고(스텝 612), 임계값 Th3과 비교판정된다.
dk3> Th3이면, 상기 사서패턴은 후보패턴으로부터 배제되고 스텝 606을 경유해서 스텝 602로 복귀된다. 상기 분류에서도 배제되지 않은 사서패턴은 후보패턴의 가능성이 높기 때문에 전차원에 대한 거리총합 Dk가 구해지고(스텝 616) 스텝 618로 진행된다.
상기 스텝 618은 제8도에 있어서 스텝 510과 동일하다. 최종 사서패턴까지의 매칭처리가 종료되면, 스텝 607에서 종료라고 판정되고, 후보패턴(문자)의 코드가 출력되고(스텝 620), 미지패턴의 매칭처리가 완료된다.
이와 같이, 상기 실시예에 있어서, 미지패턴에 대한 후보패턴은 거리를 계산할 때 사용되는 차원을 점차적으로 증가시킴으로서 세단계에서 점차적으로 좁혀지고 후보될 수 없는 사서패턴은 각각의 좁힘단계(narrowing step)에서 배제되므로, 상세매칭처리가 상기 3-단계 좁힘처리에 의해서 잔류되는 사서패턴에 대해서만 수행된다.
따라서, 거리연산 값의 양이 현저하게 감소되므로 인식속도가 현저하게 증가되고 인식율이 증가된다. 또한, 전기 실시예에 있어서는 미지패턴과 사서패턴과의 매칭처리에 거리를 사용하지만 유사도를 구해서 동일한 매칭처리를 행할 수도 있다.
이하, 본 발명의 또 다른 개념에 대하여 서술된다. 일반적으로 문자인식에 있어서, 처리되는 문자종의 수가 증가함에 따라 인식율은 감소되는 경향이 있다. 이러한 문제를 해결하기 위하여 특징벡터의 차원수를 증가시키고 복소수알고리즘을 사용하려고 한 선행기술이 있었다. 그러나, 이러한 선행기술은 사서용량의 증가나 인식속도의 감소와 같은 결점을 간직하고 있었다.
뿐만아니라 수기(手記)문자를 처리하는 경우에는 단지 불충분한 인식율을 얻게된다는 문제도 있었다. 문자 인식방법의 한가지 유형으로서, 예정된 알고리즘에 따라서 문자이미지의 특정섹션으로 예정된 특징으로 할당하는 단계와, 문자이미지를 세분함으로써 정해진 각 메쉬영역에 대한 특징을 수집하는 단계를 포함하는 방법이 있었다.
메쉬영역을 정하기 위한 세분방법은 (1) 세분된 고정점들을 사용하는 방법과, (2) "오끼전기연구개발(Oki electrics research and development)" 1993.12.121, Vol.50, No.3,PP77-82에서 개시된 바와 같이 문자이미지의 주변분산 중심을 이용한 각 문자에 대해 가변적으로 정해진 세분점을 사용하는 방법을 포함하고 있다.
상기 방법(2)는 수기문자와 같이, 변형이 큰 문자를 인식함에 사용될 때, 특징을 안정화함에 있어서 이익적이다. 그러나, 그것은 주변분산의 중심을 이용하기 때문에 세분에 대한 메쉬점 결정을 위한 연산량이 커서 처리를 지연시키는 경향이 있다. 반면에, 방법(1)은 광범위한 연산을 요구하지는 않으나 수기문자와 같은 변형된 문자에 대하여 세분이 부적절하게 되기 때문에 이로 인하여 무자의 특징을 적절히 추출하는 것이 불가능하다.
이러한 문제는 수기인 "간지(Kanji) : 한자"와 같은, 변형이 큰 복잡한 문자에 대하여만 존재하는 것이 아니라 수기인 "가나"문자와 같이 변형도가 적은 간단한 문자에 대하여도 잘못인식되기 쉬운 것이다.
예를 들어 가나문자 "우(wu,ウ)와" 가나문자 "와(wa, ワ)"를 식별하는 키(key)는 머리부분에 한 획이 있으냐 없느냐에 달려이Td 이같은 부가적인 획에 대한 정보를 수집하는 것이 중요한 것이다.
이 경우 고정점 세분방법이 사용되면 이 부가적인 획은 변형이 적은 특정메쉬영역내에 어떤 때는 위치하고 어떤 때는 위치되지 않아 정보수집이 불안정되게 됨으로써 오류인식으로 이어지는 경향이 있다.
본 발명은 특히 상기와 같은 문제점을 제거하려는 것으로서, 어떠한 문자에 대하여도 고율, 고속으로 문자인식을 수행할 수 있는 문자인식방식과 방법을 제공하는 것이다.
이같은 목적을 위하여, 본 발명의 견지에 의하면 다음 단계로 이루어지는 패턴인식방법이 제공된다.
(a) 문자패턴의 주변흑화소(畵素)에 방향코드를 할당하는 단계; (b) 일측에서 이에 수직방향으로 문자패턴을 주사하여 백색에서 흑색으로 변하는 N 번째점인 N 주변화소를 검출하는 단계; (c) 문자패턴의 각 세분된 영역에 대한 N 번째 주변화소들의 방향성 코드의 히스토그램(histogram)을 작성하는 단계; 및 (d) 특징으로써 N 번째 주변화소들의 방향성코드 히스토그램코드를 이용하여 사서와 매칭시키는 단계.
본 발명의 이같은 견지에 따라, 다음 단계를 포함하는 패턴인식방법도 제공된다.
(a) 문자화상을 둘러싼 프레임의 각 측면에서 이에 수직인 방향으로 문자화상을 주사하고 주사선에 따른 출현순서에 따라 특징정보가 하나의 층으로 변하는 지점에서 관심화소(pixel of interest)를 분류하는 단계; (b) 부(副)주사방향으로써 세분방향을 이용하여 문자화상을 레스터(raster)주사하는 동안 관심화소를 카운팅하고, 이같이 카운트된 값을 기초로 하여 세분점을 정하고 그 세분점을 이용하여 문자화상을 메쉬영역으로 세분하는 단계; (c) 각각의 세분영역에 대하여 층으로 분류된 관심화소의 히스토그램을 작성하는 단계; (d) 그 히스토그램을 이용하여 사서와 매칭시키는단계.
여기서 용어 "특징(feature)"은 문자패턴의 농도(예를들어 2차원패턴의 경우 백색과 흑색)와 같이 문자패턴 자체에 밀접하게 관련되고, 각 화소 혹은 영역(인접한 화소의 모임)에 제공되는 파라메타를 가르킨다.
또한, 용어 "특징정보변화점"(feature information varying point)란 문자패턴의 배경부(2차원패턴의 경우 백색부)와 문자부(2차원패턴의 경우 흑색부)사이의 경계선과 같이 농도(특징이 변하거나 혹은 문자패턴에 할당된 방향코드(특징)가 변하는 점을 나타낸다.
제12도에는 본 발명의 제3견지의 일실시예에 따른 광학문자인식방식을 블록도로 도시되어 있다. 도시된 바와 같이 화상신호를 형성하기 위하여 원고상의 문자화상을 광학적으로 판독하기 위한 주사장치(scanner)721이 제공되며, 화상신호는 그후 입력화상신호로부터 각각의 문자화상신호가 분리되는 문자추출부 722로 가게된다.
분리된 각각의 문자화상은 노이즈제거부 723으로가서 문자화상으로부터 노이즈성분이 제거된다. 그후 문자화상은 정규화부 724에서 정규화된 후 문자기억부 725에 저장된다.
제12도의 방식에는 이로부터 추출된 특징을 갖기 위한 입력문자화상을 처리하는 특징추출부 726 및 특징추출부 726에 연결된 작업기억부(work memory)727이 제공된다.
특징추출부 726에 의해 추출된 입력문자화상의 특징과 사서기억부 729에 저장된 사서 혹은 기준문자 각각의 특징간을 매칭시키기 위해 매칭부 728이 또한 제공된다. 상기 매칭부 728에 의한 매칭동작결과를 출력하는 출력부 730이 또한 제공된다.
이하, 특징추출부 726에서의 처리과정을 제11도에 예시된 플로우챠트를 참고하여 기술한다. 특징추출부 726은 문자기억부 725로부터의 문자화상을 읽고, 제13도에 도시된 바와 같이, 복수의 정해진 방향코드를 문자화상에 할당한다. 예를 들어, 제14도에 도시된 간지문자(한문)(田)의 문자화상의 경우, 제15도에 도시된 바와 같이 문자화상의 주변을 따라 방향모드가 흑색화소로 할당된다.
그후 제16도에 화살표로 나타낸 바와 같이 문자화상이 특징추출부 726에서 매회 문자프레임을 이루는 4면중 하나로부터 그 반대면까지 최초면에 수직인 방향으로 4회 레지스터주사된다.
실시예에 있어서, 제1레스터주사는 주주사방향으로 상면에서 저면으로 수행되며, 이어서 주주사방향으로 좌측에서 우측으로 제2레스터주사되면, 제3레스터주사는 저면에서 상면으로 주주사방향으로 주사되며, 제4레스터주사는 주주사방향으로 우측에서 좌측으로 수행된다. 레스터주사동안 각 주사선을 따라, 백색에서 흑색으로의 N 번째 변화점에서 N 번째 주변화소가 검출된다(여기서 N은 양의 정수이다).
즉, 제1레스터주사의 주사선에서 만나는 제흑색화소는 제1주변화소를 이루며 제1흑색화소 다음에 나오는 하나 혹은 그 이상의 백색화소뒤의 다음 흑색화소는 제2주변화소를 이루며 또한 제2흑색화소 다음의 하나 혹은 그 이상의 백색화소뒤의 다음 흑색화소는 제3주변화소를 이룬다. 다시 말해서, 본 실시예에서는, N 번째 주변화소는 예를 들어 주사선에서 백색에서 흑색으로 바뀌는 주변화소가 특정정보가 바뀌는 관심화소로써 사용된다.
후술하는 바와 같이, 관심화소의 특징으로써 이에 할당된 방향코드가 사용된다. 이 방법으로 N 번째 주변화소를 검출시, 특징추출부 726은 작업기억부 727에 준비된 N 번째 주변테이블내의 상응하는 화소위치에 "1"을 기재한다. 제14도의 문자화상에 이처리를 함으로써 얻어진 결과는 제17a도 내지 제17c도에 예시되어 있는데 이들 각각은 제1, 2 및 3주변테이블을 이룬다.
제18aa도, 제18ab도 및 제18b도는 이같은 주변결정처리조작의 플로우챠트를 나타내며 이 처리의 각 스텝에 대하여 기술한다.
먼저 레스터주사수 JJ가 리세트된다(스텝 801). JJ에 "1"이 부가되며(스텝 802), JJ는 검사된다(스텝 803). 만일 JJ가 1 혹은 2이면, 즉 상부에서 저부로 제1레스터주사를 수행하는 경우나 혹은 좌에서 우로 제2레스터주사를 수행하는 경우, 단계 804로 진행하며, 여기서 ISTART, IEND, JSTART 및 JEND(I 및 J는 제18aa도의 우측상단에 예시된 바와 같이 사각형프레임의 각 코너를 어드레스한다)가 각각 레지스터 IS, IE, JS 및 JE에 세트되고 레지스터 STEP에 "1"에 세트된다.
JJ가 3 G혹은 4인 경우, 즉 하부에서 상부로의 제3레스터주사하거나 우측에서 좌측으로 제4레스터주사하는 경우, 이는 스텝 805로 진행하며 여기서 ISTART, IEND, JEND 및 JSTART가 각각 IS, IE, JS 및 JE에 세트되며, STEP에서 "-1"이 세트된다. JJ가 4를 초과하면 제4레스터주사가 완료되었음으로 처리는 종결된다.
단계 804 혹은 805 후에, IS로부터 "1"을 빼서 얻어진 값이 어드레스 카운터 I에 세트되며(스텝 806), 이에 따라 레스터주사가 초기화된다. I에 "1"이 더해지며, IDL IE + 1로 되었는지 여부를 검사한다(스텝 808).
이 결정결과가 YES이면 이는 스텝 802로 되돌아간다. 반면 그 결과가 NO이면 플랙(flag)IFLG와 카운터 ICOUNT 모두가 리세트된다(스텝 809).
그후 JS 값에서 STEP 값을 빼서 얻어진 값이 어드레스 카운터 J에 세트된다(스텝 810). 그후 STEP 값이 J에 더해지고(스텝 811), J값이 JE + STEP와 같은지 여부가 체크되며(스텝 812), 그 결과가 YES이면 스텝 807로 되돌아가고 NO이면 스텝 813으로 진행하다. 스텝 813에서, JJ가 1 혹은 3이었으면 I값이 어드레스레지스터 I1에 세트되며 J값이 어드레스레지스터 J1에 세트된다(단계 814). JJ가 2 또는 4이었다면, J값은 I1에 세트되고 I값은 J1에 세트된다(단계 815).
그후 문자화상의 어드레스(I1, J1)에서 화소의 데이터 IDATARK 문자기억부 725로부터 읽혀지고, "0(백색)"인가 아닌가가 체크된다(스텝 816). 사실 데이터가 0(백색)이면 플랙 IFLG는 리세트되고(스텝 817)이는 스텝 817로 되돌아간다.
데이터 1(흑색)인 경우 IFLG가 "1"인지 아닌지 여부를 체크한다(단계 818). IFLG가 "1"인 경우 그 화소는 앞의 흑색화소 다음의 흑색화소이고 주변화소는 아니므로 주변테이블로의 기재는 수행되지 않고 이는 스텝 811로 되돌아간다. 반면, IFLG가 "0"인 경우 그 화소는 주변화소이며 IFLG는 "1"로 세트되고 스텝 819에서 ICOUNT(앞서 언급한 주변차수 N을 나타내는 카운터)에 "1"이 더해진다. 그후 ICOUNT의 값으로 나타낸 주변차수를 갖는 주변테이블의 어드레스(I1, J1)내부에 "1"이 기재된다. 그후 이는 스텝 111로 돌아간다.
상술한 바와 같이, 주변테이블이 완료하면, 특징추출부 726은 문자화상을 메쉬영역으로 세분함을 수행하고, 제11도에 도시된 바와 같이 각 메쉬영역에 대하여 주변화소(즉, 주변차수에 따라 층으로 분류된 화소)의 각 순서에 대하여 방향코드의 히스토그램을 작성한다. 메쉬세분에 대하여는 후술하겠지만, 여기서는 문자화상이 3×3 메쉬영역으로 세분되고 각 메쉬는 제17a도 내지 제17c도에 예시된 바와 같이 8×8 화소를 가지고 각 메쉬영역은 서로 중첩되지 않는다고 가정한다.
특징추출부 726은 작업기억부 727에 형성된 각 주변테이블을 레스터주사하고 "1"이 기재된 어드레스에 해당하는 화소의 방향코드를 판독함으로써(방향코드가 할당된 문자화상은 작업기억부 727에 저장되어있다.) 방향코드의 함수로써 히스토그램이 각 주변차수에 형성된다.
제14도에 도시된 문자패턴의 경우에 있어서, 좌측상단코너에 메쉬영역(1, 1)에 대하여 형성된 히스토그램은 제1차수주변에 대한 제19a도에 도시된 바와 같이 될 것이다.
제19b도 및 제19c도는 각각 제2 및 제3차수주변에 대한 마찬가지 히스토그램을 나타낸다. 이하, 제20a도 및 제20b도를 참조하여 이같은 히스토그램 형성방법에 대하여 기술한다.
먼저, 히스토그램이 형성되는 주변의 차수 N이 레지스터 ICOUNT에 설정된다(단계 901). 그후 어드레스 ISTART에서 "1"을 빼서 얻은 값(제18참조)을 어드레스카운터 I에 설정한다(스텝 902). 그후 I에 "1"을 더하고(스텝 903)나서 I값이 어드레스 IEND(제18a도의 우측상단부 참조)보다 큰지 아닌지를 스텝 904에서 체크한다.
그결과 YES이면 현재의 차수주변에 대한 히스토그램의 형성이 완료된다. 반대로 결과가 NO이면 어드레스 JSTART(제18a의 우측상단 참조)로부터 "1"일 빼서 얻은 값을 어드레스 카운터 J에 세트한다(스텝 905).
그후 J에 "1"을 더하고(스텝 906), J값이 어드레스 JEND보다 큰지 여부를 체크한다(제18도의 우측상단부 참조).
그결과 YES이면 이는 한 선(line)의 주사가 완료되었음을 나타내므로 스텝 903으로 돌아간다. 반면 체크결과 NO이면, ICOUNT값으로 나타낸 차수를 갖는 주변테이블내의 어드레스(I, J)에서의 데이터가 판독되고 레지스터 ID에 세트되며, 방향코드가 할당된 문자화상내의 어드레스(I, J)에서의 데이터가 판독되어 레지스터 IV에 세트된다(스텝 908).
그후 ID가 "1"인지 여부가 체크되고(스텝 909), 그 결과가 NO이면 스텝 906으로 되돌아간다. 반면, 그 결과가 YES이면, IV값이 "1"과 "8"사이에 있는지 여부(즉, 그것이 방향코드인지)가 체크된다(스텝 910).
그 결과가 NO이면 스텝 906으로 되돌아간다. 반면 YES이면, 어드레스(I, J)에서 화소가 속하는 메쉬(IMES, JMES)가 검사된다(단계 911).
그후 메쉬(IMES, JMES)의 방향코드 IV에 상응하는 카운터 IHIST(IMES, JMES, IV)에 "1"이 더해진 후 스텝 906으로 돌아간다.
이같은 방법으로 카운터 IHISTSODP 히스토그램이 얻어진다. 특정차수의 주변에 대한 히스토그램작성이 완료되면, ICOUNT는 다시 갱신되고 다음 차수의 주변에 대한 히스토그램처리가 반복된다. 이와 같이 하여 얻어진 히스토그램은 입력문자화상의 특징으로 T용된다.
사서를 작성하는 경우에 있어서, 특징추출부 726은 복수의 문자패턴에 대한 히스토그램을 생성하며 이들은 예를 들어 그 평균값을 취함으로써 사서기억부 729에 기재된다. 문자인식을 수행하는 경우, 이같이 얻어진 히스토그램은 매칭부 728에 제공됨으로써 사서의 매칭을 지정한다. 매칭부 728에서 사서기억부 728에 저장된 사서는 특징추출부 726에 의해 형성된 히스토그램과 비교하여(예를 들어 유클리드거리(Euclidean distance), 주성분등에 관해), 이에 따라 최대거리문자가 결정된다. 후술되는 바와 같이 몇몇 매칭방법이 있는 것이 주목된다.
[매칭방법 #1]
문자의 인식율은 그 복잡성 때문에 인식을 위해 사용된 주변의 차수에 따라 변한다.
이와 같이 매칭을 위해 사용되는 최대 주변차수는 각 문자에 대하여 미리 결정되고 각 문자에 대한 최대차수(maximum order)를 선택함으로써 매칭이 수행된다.
[매칭방법 #2]
복수의 주변차수에 대한 거리가 연산되고, 최소거리항을 갖는 하나를 인식의 결과로써 선택한다.
예를 들어, 제1차수 내지, 제4차수의 주변을 합하는 경우, 주변과 사서의 각 차수에 있어서의 방향코드의 히스토그램간의 거리를 d1, d2, d3, d4로 각각 지정하고, 각 카테고리에 대하여 d = d1+ d2+ d3+ d4가 얻어짐으로써 최소카테고리가 인식결과로 선택된다.
[매칭방법 #3]
차수
Figure kpo00012
및 그 이상(n+1, n+2, …)의 주변히스토그램이 상기 매칭방법 #2에 기술된 것과 비슷하게 매칭을 수행함에 있어서 한 주변의 방향코드 히스토그램으로 사용된다.
예를 들어, 매칭방법 #2에 있어서, 제1 내지 4차수주변을 사용하는 경우, 제5, 67차 …차수의 주변히스토그램이 문자인식을 수행함에 있어서 제14차 주변의 히스토그램에 포함된다.
히스토그램을 이용한 이들 매칭방법에 의하면, 수기(手記)간지 문자는 높은 인식율로 비교적 적은 용량의 사서에 의해 인식될 수 있다.
다음에 여러 가지 메쉬세분법에 대하여 기술한다. 본 실시예에서는 메쉬영역으로의 세분은 다음 어느 한가지 방법에 따라 수행된다.
[세분법 #1]
방향코드가 할당된 문자화상에 대하여, X 방향으로의 세분점이 제21도에 플로우챠트가 도시된 절차에 따라 결정되고 문자화상이 X 방향으로 N 영역으로 세분된다.
비슷한 절차에 따라, Y 방향으로의 세분점 역시 결정되고, 문자화상 역시 Y 방향으로 N 영역으로 세분된다. 그 결과 문자화상은 N×M 메쉬영역으로 세분된다.
먼저 X 방향으로의 세분에 대하여 기술한다. 문자화상을 주사함에 의해 전체수 PE의 관심화소(본 실시예에서는 메쉬영역세분처리에 있어서 방향코드가 할당된 모든 주변흑색화소는 관심화소로써 처리된다)가 결정된다(스텝 1021).
세분점 검출을 위한 주사준비로써, 세분수 카운터
Figure kpo00013
에 "1"이 세트되며 X 방향으로의 어드레스를 지정하는 카운터
Figure kpo00014
가 리세트된다(스텝 1022).
여기부터,
Figure kpo00015
이 세분수 N(본 실시예에서는 "3")에 도달할 대까지 X 어드레스가 "1"만큼 증가하는 동안 문자화상의 Y 방향주사(주주사방향으로써 Y 방향을 취한 레스터주사)가 수행되며, 이에 따라 세분점 검출을 한다.
다시말해서,
Figure kpo00016
에 "1"이 첨가되고(스텝 1024),
Figure kpo00017
로 지정된 하나의 선이 Y 방향으로 주사되며, 이에 따라 첫 번째 선부터 끝라인까지 특징화소의 수 Px를 카운트한다(스텝 1025).
그후 Px가(PE/N)Xn과 같거나 큰가에 대하여 체크되며(스텝 1026), 그 결과 NO이면 이는 다음 라인으로 진행하기 위해 스텝 1024로 돌아간다. 반면 체크결과 YES이면 이는 스텝 1027로 진행한다. 이 단계에서,
Figure kpo00018
값이 n 번째 메쉬영역(영역에서 우측세분점)의 끝점의 X 어드레스로써 검출된다.
덧붙여서,
Figure kpo00019
값에서 T(인접세분영역의 중첩량)을 뺀값이 다음 메쉬영역(우측세분점)의 출발점 X 어드레스로써 검출된다. 제1메쉬영역의 출발점은 문자프레임의 좌측(X=1)에 해당하며, 마지막 메쉬영역의 끝점은 문자프레임의 우측(본 실시예에서는 32×32화소의 문자화상으로 가정했으므로 X=32)에 해당한다.
그후
Figure kpo00020
에 "1"이 더해지고(스텝 1028). 스텝 1023으로부터 처리가 반복된다. 이같은 처리는 n=N이 얻어지고 이 스텝 1023의 조건이 만족될 때까지 반복수행된다.
Y 방향으로의 세분점검출도 비슷한 방법으로 수행된다. 그러나, 관심화소 PE의 전체수가 이미 얻어졌기 때문에 이 스텝을 반복되지 않는다.
덧붙여서, 세분점검출을 위한 주사는 Y 어드레스가 "1"만큼 증감하는 동안 X 방향으로 수행되며, 관심화소 Py(앞서 기술된 Px와 동일)가 (PE/N)Xn인 Y 어드레스가 N 번째 메쉬영역의 끝점(저세분점)의 Y 어드레스로써 검출되며, 그 Y 어드레스에서 T를 밴 어드레스가 다음 메쉬영역의 출발점(상부세분점) 어드레스로서 검출된다.
결국, 제1메쉬영역의 출발점은 문자프레임의 상면(y=1)에 해당하며, 마지막 메쉬영역의 마지막점은 문자프레임의 저면(y=2)에 해당한다.
이같이 하여 얻어진 세분점을 이용하여, 문자화상은 X 및 Y 방향으로 세분되어, 문자화상은 n×N 메쉬영역으로 세분된다. 이같은 메쉬세분법에 의하면, 일본가나문자 "우(WU)(ウ)"의 문자화상은 제22a도 및 제22b도에 예시된 바와 같은 메쉬영역으로 세분될 수 있다. 어느 경우에서도, 중첩량 T는 "0"인 것으로 가정한다.
제22a도 및 제22b도의 어느 경우에 있어서, 상부중앙의 획에 대한 정보는 문자화상의 상부좌측코너 메쉬영역에 존재한다. 반면, 고정된 세분점을 사용하면, 제22a도 및 제22b도의 문자화상은 예를 들어 제23a도 및 제23b도에 각각 도시된 바와 같이 메쉬영역으로 세분된다.
제23b도의 경우, 상부중양의 획에 대한 정보는 상부좌측코너 메쉬영역에 존재하나, 이같은 정보는 제23a도의 경우에 있어서는 상부좌측코너 메쉬영역에 존재하지 않는다.
이 방법으로, 고정세분점을 사용하는 방법에서는, 이 문자의 주요부를 구성하는 일본가나문자(우)(ウ)의 상부중앙획은 특정메쉬영역에서는 존재하기도 하고 존재하지 않을 수도 있으며, 이는 데이터의 불안정성을 야기시켜 특징이 안정되게 추출되지 않게되고, 이에따라 인식율의 감소와 오류인식의 증가를 일으킨다. 이같은 문제점은 상기한 세분법 #1을 이용하면 해결될 수 있는 것이다.
[세분법 2]
앞서 언급한 세분법 #1과 비슷한 방법으로, 화상은 Y 방향으로 N 영역으로 세분된다. 그후, X 방향으로의 세분이 수행되며, 이 절차를 제24도에 도시된 플로우챠트를 참조하여 기술한다.
먼저, 세분수 카운터
Figure kpo00021
에 "1"을 설정하고 X 방향으로의 어드레스를 지정하는 카운터
Figure kpo00022
가 클리어된다(스텝 1131).
스텝 1132에서
Figure kpo00023
이 N과 같거나 적은지 여부(본 실시예에서 N=3)가 체크되고, 그 결과가 NO이면 세분처리는 종료된다. 만일 스텝 1132에서의 결과가 YES이면, X 어드레스를 "1"만큼 증가시키는 동안 Y 방향의 주사가 수행되며, 이에따라 각 Y 방향 세분영역내의 관심화소의 수
Figure kpo00024
가 카운트되고, Pix가 1133, 1134 및 1135스텝에서 xX 영역(Yis-Yie)영역내의 화소 Pix의 카운트수에 대하여 PE/(N×N)Xn와 같거나 적은지 여부에 대하여 체크한다. 여기서 Yis와 Yie는 방향 세분영역
Figure kpo00025
의 출발점은 끝점어드레스를 나타낸다.
스텝 1135의 체크결과가 YES이면,
Figure kpo00026
(X 어드레스)의 현재값이 N 번째 X 방향 세분영역의 끝점으로써 검출되고 다음 세분영역의 출발점으로서 X-T(Ti 영역중첩량)이 검출된다(스텝 1136). 그후
Figure kpo00027
에 "1"이 더해진 후 스텝 1132로 돌아간다.
이같이 하여 얻어진 X 방향으로의 세분점을 이용하여, 문자화상을 X 방향으로 N 영역으로 세분시킴으로써, 문자화상은 전체로서 n×N 메쉬영역으로 세분된다.
일본가나문자에서 "누(nu)(ヌ)"와 "스(su)(ス)"는 그 형상이 아주 비슷하며 상부좌측에서 우측하부로 연장되는 중앙의 경사진 획의 유무만 차이가 있을 뿐이므로, 이 획에 대한 정보가 두문자를 구별하는데 아주 중요하다.
"누"의 문자화상을 세분법 #1로 3×3 메쉬영역으로 세분하면 제25a도에 도시된 바와 같은 결과를 얻는다. 세분된 문자화상의 중간좌측메쉬영역(1, 2)를 보면, 중앙경사획에 대한 정보가 거의 없는 것으로 나타나 있다.
반면, 문자화상 "누"가 세분법 2로 세분될 때는 제25b도에 예시된 바와 같이 결과가 얻어진다. 제25b도에서는 간단함으로 위해 중간 T 방향 영역만이 세분됨이 주목된다. 덧붙여서, Y=0인 조건이 가정되었다.
세분영역(1, 2)를 보면, 중앙경사획에 관한 충분한 정보가 있는 것을 알 수 있다. 이 방법으로, 세분법 2에 의하면, 세분법 #1의 결점이 보완될 수 있는 것이다.
상술한 바와 같이, Y 방향세분은 세분법 #1에 의해 수행되었으나 X 방향으로의 세분이 먼저 수행되고 그후 Y 방향으로의 세분이 제24도의 플로우챠트에 도시된 것과 같은 절차에 따라 X 방향으로 세분된 영역 각각에 대하여 수행된다.
[세분법 3]
세분법 2에서 T가 0이 아니거나 관심화소가 세분점에서 X 혹은 Y 방향으로 몰려있는 경우, 세분은 부정확해질 수 있다. 이같은 문제점을 해결하기 위하여, 본 세분법에 의하면, 세분법 #1에 의해서 X(혹은 Y)방향으로 세분을 수행한 후 세분영역 i내의 관심화소의 수 PEi를 카운트하는 스텝과 세분법 2에서 PE/N2대신 PEi/N을 이용하여 세분영역
Figure kpo00028
의 Y(혹은 X)방향으로의 세분을 수행하는 스텝을 거치게 된다.
세분법 #1에 의해 X 방향으로의 세분을 수행하고 각 세분영역에 대하여 Y 방향으로의 세분을 수행하는 절차를 제26도에 도시된 플로우챠트를 참조하여 기술한다.
먼저, 문자화상을 주사함으로써, X 방향으로의 각 세분영역
Figure kpo00029
에 대한 관심화소의 수 PEi를 결정한다(스텝 1241).
카운터
Figure kpo00030
에 "1"을 세트한 후 Y 어드레스의 카운터
Figure kpo00031
가 클리어된다(스텝 1242).
Figure kpo00032
이 N(여기 N=5)과 같거나 적은지 여부가 체크되며 만일 체크결과가 NO이면 처리는 종료된다(스텝 1243). 반면, 체크결과가 YES이면, Y 어드레스를 "1"만큼 증가시키면서 X 방향으로 주사가 수행되고, 각 X 방향 세분된 영역
Figure kpo00033
내의 관심화소의 수가 카운트됨으로써 YX(Xis-Xie)의 영역내에서 화소의 카운트 수 Piy가 PEi/(N×N)Xn과 같거나 적은지를 스텝 1244, 1245 및 1246에서 체크한다. 여기서 Xis 및 Xie는 각각 Y 방향 세분영역
Figure kpo00034
의 출발점과 끝점의 X 어드레스이다.
스텝 1246에서의 체크결과가 YES이면, Y(Y 어드레스)의 현재값이 X 방향 세분영역에 대한 N 번째 Y 방향 세분영역의 끝점으로서 검출되며, 다음 세분영역의 출발점으로써 Y-T(T : 영역중첩량)이 검출된다(스텝 1247).
그후
Figure kpo00035
에 "1"이 추가되고(스텝 1248)이는 스텝 1243으로 되돌아간다. 이같이 하여 얻은 Y 방향으로의 세분점으로써, X 방향 세분영역이 Y 방향으로 N 영역 세분되고, 이에따라 전체문자화상은 N×N 메쉬영역으로 세분된다.
가나문자 "nu"의 문자화상이 T=1로써 세분법 #2에 의해 세분되면, 제27a도에 도시된 결괄르 얻는다. 반면, 동일한 문자에 대하여 T=1로서 세분법 #3으로 세분하면 제27b도에 도시된 결과를 얻는다.
그러나, 어느 경우에서도 Y 방향 세분이 수행된 후 X 방향 세분이 수행된다. 또한, 이들 도면에서, 중간 Y 방향 세분영역에 대한 X 방향 세분결과만이 간단히 하기위해 도시되었다.
제27a도 및 제27b도에서 메쉬영역(1, 2)를 보면, 중앙의 경사진 획에 대한 정보가 적절히 존재함으로 알 수 있다. 이 방법으로, T가 "0"이 아니거나 관심화소가 세분점에서 몰려있더라도 세분법 #3에 의해 항상 적절히 세분을 수행할 수 있는 것이다.
상술한 바와 같이, 본 발명의 이같은 견지에 의하면, 메쉬세분을 위한 세분점이 문자화상의 변형에 따라 적절히 조절됨으로써 수기간지문자 및 가나문자와 같이 모양이 변형된 문자에 대하여까지도 문자인식이 적절히 또한 신속히 수행될 수 있는 것이다.
또한, 본 발명의 이같은 견지는 세분점을 결정하기 위하여 복잡한 연산을 할 필요가 없기 때문에 전체처리과정이 아주 빨라진다.
상술된 본 발명의 바람직한 실시예에 따라 이 발명에서 숙련된 자라면 본 발명의 범위내에서 여러 가지 변형이 가능할 것이다.

Claims (13)

  1. 차원의 크기에 따라 그 성분이 재배열된 특징벡터를 갖는 복수의 기준패턴을 저장한 사서를 이용한 패턴인식방식에 있어서; 인식될 미지의 패턴을 입력하고; 그 미지의 패턴으로부터 특징벡터를 추출하고; 상기 사서에 저장된 기준패턴과 같은 크기차수로 상기 미지패턴의 추출된 특징성분을 재배열한 후; 상기 미지 패턴의 정해진 보다 높은 차원의 성분과 상기 기준패턴 각각의 정해진 보다 높은 차원성분을 매칭시켜 상기 미지패턴과 상기 기준패턴 각각간의 거리 혹은 유사도를 결정함을 특징으로 하는 패턴인식방식.
  2. 제1항에 있어서, 정해진 보다 높은 차원에 대한 매칭결과에 따라 남아있는 차원에 대한 매칭을 더 수행할 것인가 아니할 것인가를 결정함을 특징으로 하는 패턴인식방식.
  3. 제1항에 있어서, 상기 차원의 크기는 패턴성분이 갖는 표준편차 혹은 분산에 의해 결정됨을 특징으로 하는 패턴인식방식.
  4. 각각이 복수의 성분으로 구성된 특징벡터를 갖는 복수의 가(假)(provisional pattern)을 제공하기 위하여 복수의 선택된 패턴종(種)을 판독하는 단계; 차원의 정해진 크기순서에 따라 각 가패턴의 특징벡터 성분을 재배열함으로서 각각이 재배열된 성분의 특징벡터를 갖는 기준패턴을 형성하고 저장하는 단계; 상기 선택된 각 패턴종에 대한 임계값을 결정하는 단계; 미지패턴을 판독하는 단계; 상기 미지패턴으로부터 복수의 성분으로 구성된 특징벡터를 추출하는 단계; 상기 추출된 특징벡터 성분을 상기 정해진 차원크기순서로 재배열하는 단계; 정해진 수의 보다 높은 차원에 대하여 상기 미지패턴의 재배열된 특징벡터와 상기 저장된 기준패턴 각각의 재배열된 특징벡터를 매칭시켜 매칭거리를 제공하는 단계; 이같이 제공된 매칭거리를 상응하는 패턴종의 임계값과 비교하는 단계; 및 그 비교결과에 따라 상응하는 패턴종에 관하여 남아있는 치수에 대한 더 이상의 매칭을 수행할 것인가 아니할 것인가를 결정하는 단계로 이루어진 패턴인식방식.
  5. 제4항에 있어서, 상기 임계값 결정단계에 있어서, 상기 패턴종 각각에 대하여 복수의 임계값이 결정되고 더 이상의 매칭을 수행할 것인가를 결정하는데 사용되도록 상기 복수의 임계값중 하나가 선택됨을 특징으로 하는 패턴인식방식.
  6. 제5항에 있어서, 더 이상의 매칭을 수행할 것인가 여부를 결정하는데 사용되는 임계값 선택은 상기 선택된 패턴종 모두에 공통인 파라메타에 의해 수행됨을 특징으로 하는 패턴인식방식.
  7. 제5항에 있어서, 더 이상의 매칭을 수행할 것인가 여부를 결정하는데 사용되는 임계값 선택은 상기 선택된 패턴종 각각의 파라메타에 의해 수행됨을 특징으로 하는 패턴인식방식.
  8. 제5항에 있어서, 더 이상의 매칭을 수행할 것인가 여부를 결정하는데 사용되는 임계값 선택은 상기 선택된 패턴종 모두에 공통인 파라메타와 상기 선택된 패턴종 각각의 파라메타에 의해 수행됨을 특징으로 하는 패턴인식방식.
  9. 제4항에 있어서, 상기 정해진 차원크기의 순서는 상기 특징벡터를 이루는 요소의 표준편차 혹은 분산크기에 의해 결정됨을 특징으로 하는 패턴인식방식.
  10. 제1항에 있어서, 상기 특징벡터는, (a) 문자패턴의 윤곽흑색화소에 방향코드를 할당하고; (b) 그 문자패턴을 측면으로부터 이에 수직인 방향으로 주사함으로써 백색이 흑색으로 바뀌는 N 번째 변화점인 N 번째 주변화소를 검출하고; (c) 문자패턴의 각 세분영역에 대하여 N 번째 주변화소의 방향코드 히스토그램을 작성함으로써 얻어진 히스토그램으로 이루어짐을 특징으로 하는 패턴인식방식.
  11. 제1항에 있어서, 상기 특징벡터는 (a) 문자화상을 둘러싼 프레임의 각 측면으로부터 이에 수직인 방향으로 문자를 주사하고, 주사선을 따른 출현순서에 따라 특징정보가 층으로 바뀌는 지점에서 관심화소(a pixel of interest)를 분류하고; (b) 보조주사방향으로써 세분방향을 이용하여 문자화상을 레스터주사하는 동안 관심화소를 카운트함으로써, 이같이 카운트된 값을 기초로하여 세분점을 결정하며; (c) 이같이 하여 결정된 세분점을 이용하는 문자화상을 메쉬영역으로 세분하고; (d) 각 메쉬영역에 대하여 층으로 분류된 관심화소의 히스토그램을 작성함으로써 얻어진 히스토그램으로 이루어짐을 특징으로 하는 패턴인식방식.
  12. 제4항에 있어서, 상기 특징벡터는, (a) 문자패턴의 윤곽흑색화소에 방향코드를 할당하고; (b) 그 문자패턴을 측면으로부터 이에 수직인 방향으로 주사함으로써 백색이 흑색으로 바귀는 N 번째 변화점인 N 번째 주변화소를 검출하고; (c) 문자패턴의 각 세분영역에 대하여 N 번째 주변화소의 방향코드 히스토그램을 작성함으로써 얻은 히스토그램으로 이루어짐을 특징으로 하는 패턴인식방식.
  13. 제4항에 있어서, 상기 특징벡터는 (a) 문자화상을 둘러싼 프레임의 각 측면으로부터 이에 수직인 방향으로 문자를 주사하고, 주사선을 따른 출현순서에 따라 특징정보가 층으로 바뀌는 지점에서 관심화소(a pixel of interest)를 분류하고, (b) 보조주사방향으로써 세분방향으로 이용하여 문자화상을 레스터주사하는 동안 관심화소를 카운트함으로써, 이같이 카운트된 값을 기초로하여 세분점을 결정하며; (c) 이같이 하여 결정된 세분점을 이용하여 문자화상을 메쉬영역으로 세분하고; (d) 각 메쉬영역에 대하여 층으로 분류된 관심화소의 히스토그램을 작성함으로써 얻어진 히스토그램으로 이루어짐을 특징으로 하는 패턴인식방식.
KR1019870006252A 1986-06-20 1987-06-19 패턴인식방식 KR910000786B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP61144486A JPH0711819B2 (ja) 1986-06-20 1986-06-20 パターン認識方法
JP144488 1986-06-20
JP61144488A JPH0740288B2 (ja) 1986-06-20 1986-06-20 パターン認識方法
JP61-144488 1986-06-20
JP144486 1990-06-04

Publications (2)

Publication Number Publication Date
KR880000876A KR880000876A (ko) 1988-03-30
KR910000786B1 true KR910000786B1 (ko) 1991-02-08

Family

ID=26475883

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019870006252A KR910000786B1 (ko) 1986-06-20 1987-06-19 패턴인식방식

Country Status (2)

Country Link
KR (1) KR910000786B1 (ko)
CN (1) CN1010513B (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3649537B2 (ja) * 1996-11-27 2005-05-18 日本アイ・ビー・エム株式会社 データハイディング方法及びデータ抽出方法
JP2007233873A (ja) * 2006-03-02 2007-09-13 Toshiba Corp パターン認識装置及びその方法
KR101167765B1 (ko) 2009-11-06 2012-07-24 삼성전자주식회사 필기 데이터를 이용한 필기 메시지 재생 장치 및 방법

Also Published As

Publication number Publication date
CN87104862A (zh) 1988-01-27
CN1010513B (zh) 1990-11-21
KR880000876A (ko) 1988-03-30

Similar Documents

Publication Publication Date Title
Konidaris et al. Keyword-guided word spotting in historical printed documents using synthetic data and user feedback
US4757551A (en) Character recognition method and system capable of recognizing slant characters
US6970601B1 (en) Form search apparatus and method
CN110766017B (zh) 基于深度学习的移动终端文字识别方法及系统
JP2002024836A (ja) ディジタルイメージから表題を抽出する方法
CN103679187A (zh) 图像识别方法和系统
Akbari et al. Binarization of degraded document images using convolutional neural networks based on predicted two-channel images
JP4391704B2 (ja) 多値画像から二値画像を生成する画像処理装置および方法
Zhan et al. A robust split-and-merge text segmentation approach for images
Keaton et al. Keyword spotting for cursive document retrieval
Ntzios et al. An old greek handwritten OCR system based on an efficient segmentation-free approach
KR910000786B1 (ko) 패턴인식방식
Dai et al. Scene text detection based on enhanced multi-channels MSER and a fast text grouping process
Liu et al. Document image binarization based on texture analysis
Pach et al. A robust binarization and text line detection in historical handwritten documents analysis
JPH05342412A (ja) グラディエントベクトルの抽出方式及び文字認識用特徴抽出方式
Chen et al. Segmentation of handwritten connected numeral string using background and foreground analysis
JPH0795336B2 (ja) 文字認識方式
JPH09305707A (ja) 画像抽出方式
Ntzios et al. An old Greek handwritten OCR system
JPH031712B2 (ko)
KR940007935B1 (ko) 문자 인식을 위한 후보 분류 방법
Segu et al. Computer Vision Approach for Detection and Extraction of Text from Video Frames using Color Continuity, Color Variations and HV Projections Methods
JP2797523B2 (ja) 図面続取装置
Shabana et al. TEXT DETECTION AND RECOGNITION IN NATURAL IMAGES

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20070125

Year of fee payment: 17

EXPY Expiration of term