KR100308856B1 - 문자인식방법및장치 - Google Patents

문자인식방법및장치 Download PDF

Info

Publication number
KR100308856B1
KR100308856B1 KR1019940005611A KR19940005611A KR100308856B1 KR 100308856 B1 KR100308856 B1 KR 100308856B1 KR 1019940005611 A KR1019940005611 A KR 1019940005611A KR 19940005611 A KR19940005611 A KR 19940005611A KR 100308856 B1 KR100308856 B1 KR 100308856B1
Authority
KR
South Korea
Prior art keywords
character
vector
topological
feature
extracting
Prior art date
Application number
KR1019940005611A
Other languages
English (en)
Other versions
KR940022338A (ko
Inventor
기로라모갈로
플라비오루센티니
크리스티나랏타로
구일리오마롯타
구이셉페사바레세
Original Assignee
윌리엄 비. 켐플러
텍사스 인스트루먼츠 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윌리엄 비. 켐플러, 텍사스 인스트루먼츠 인코포레이티드 filed Critical 윌리엄 비. 켐플러
Publication of KR940022338A publication Critical patent/KR940022338A/ko
Application granted granted Critical
Publication of KR100308856B1 publication Critical patent/KR100308856B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/184Extraction of features or characteristics of the image by analysing segments intersecting the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures
    • G06V30/19013Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)

Abstract

본 발명은 수기 문자를 인식하기 위한 방법 및 장치에 관한 것이다.
문자는 문자 입력수단을 이용하여 입력되어 적절한 수단에 의해 디지털화된다. 이때, 디지털화된 문자는, 예를 들어, 메모리 내에 저장된다. 문자의 위상학적 벡터적 특징을 나타내는 코드가 문자로부터 추출된 다음, 문자의 위상학적 및 벡터적 특징이 메모리내에 저장된 한 셋트의 기준 위상학적 및 벡터적 특징과 비교된다. 각 셋트의 기준 문자는 특정한 수기 문자에 대응한다. 그 다음, 기준 특징 셋트들 중 어느 세트가 디지털화된 문자의 위상학적 특징과 가장 근접하게 대응하는지를 결정하여 수기 문자를 식별하기 위한 논리 처리가 수행된다. 보다 정확한 식별을 위하여 다른 종류의 수기 문자에 대해 위상학적 효과 및 벡터적 효과의 상대적 가중치는 변동될 수 있다.

Description

문자 인식 방법 및 장치
제1도는 본 발명의 한가지 특징에 따른 문자 인식 시스템의 블럭도.
제2도는 이 시스템의 스크린 상에 표시된 프로그램 메모리의 일예를 도시한 도면.
제3도는 프레임 제약 디폴트를 갖는 문자의 소정예를 도시한 도면.
제4도는 문자(A)의 STK 포맷을 도시한 도면.
제5도는 문자(A)의 패턴 포맷을 도시한 도면.
제6도는 소정 문자를 식별하는데 이용된 위상학적 특징 셋트를 도시한 도면.
제7도 및 제8도는 문자 인식 방법을 도시한 도면.
* 도면의 주요부분에 대한 부호의 설명
10 : 문자 인식 시스템 12 : 마이크로컴퓨터
14 : 모니터 16 : LCD 그래픽 디지타이저
20 : 프레임
본 발명은 문자 인식 방법 및 장치에 관한 것으로, 특히 일본어, 악보, 간단한 도형 등과 같은 문자, 숫자 및 부호의 인식 방법 및 장치에 관한 것이다.
컴퓨터 시스템의 키보드레스(키보드가 없는) 입력 구조에 있어서, 예를 들어 펜 유사 형 철필(stylus)로 입/출력 스크린 상에 컴퓨터 사용자가 명령어 또는 데이타를 입력할 수 있다. 이러한 스크린의 일예는 접촉 감응식 모니터이다. 입력된 명령 또는 데이타는 수기(handwritten) 문자의 스크립트, 숫자 또는 다른 형태의 것이 수기될 수 있다. 이러한 형태의 시스템에 있어서, 컴퓨터가 사용자에 의해 제공된 입력을 “이해”하여 입력 문자를 인식 및 판독하여야 한다.
다수의 공지된 시스템은 입력 문자를 인식 및 판독할 수 있다. 이러한 한가지 시스템은 미합중국 특허 제4,972,496호에 개시되어 있다. 이 특허에는 철필이 스크린에 접촉하는 위치에 대응하는 위치 정보(즉, 문자의 위치 정보)를 발생시켜, 제공된 입력을 사용자에게 알리도록 표시하는 투명 입력 스크린을 포함하는 시스템이 개시되어 있다. 또한, 이 시스템은 위치 정보를 철필에 의해 형성된 “스트로크(Stroke)”로 컴파일하도록 프로그램된 컴퓨터를 포함한다. 스트로크는 각 스트로크의 개시점, 각 스트로크의 종료점, 스트로크의 기울기, 스트로크 중심, 기울기의 변화율, 및 제1 스트로크, 제2 스트로크 등 이든지 하나 이상의 스트로크를 포함하는 문자를 식별하도록 분석된다. 스트로크만이 분석되었을 때, 특정한 사용자에게만 유일한 개인용 데이타 베이스가, 분석중인 문자에 최근접 대응하는 문자를 식별하도록 억세스된다.
이러한 시스템은 행해져야 할 상세 스트로크 분석으로 인해 스트로크 분석시의 전용 하드웨어를 이용하여 실행하기에는 상당히 복잡하였다. 부수적으로, 각각의 사용자는 개인용 데이타 베이스에 의존한다. 이것은 소정 시스템을 여러 사용자가 이용하는 경우 다량의 메모리가 소실된다는 것을 의미한다. 개인용 데이터 베이스가 전혀 설치되어 있지 않은 경우, 시스템의 인식 정도는 허용불가능한 레벨로 떨어질 수 있다. 이러한 시스템이 스트로크 분석에만 의존하기 때문에, 모든 사용자는 문자를 선정된 종래의 방식으로 기입하는 것이 중요하다. 스트로크가 선정된 종래의 방식과 상이한 기록 형태에 사용자가 적응할 때 인식이 개별적으로 억제된다. 자유로운 형태의 문자가 종래의 문자와 매우 유사하게 보일지라도, 스트로크 분석이 기입되었던 문자보다 상이한 문자를 나타내기 때문에 인식이 정확하게 이루어질 수 없다.
본 발명의 한가지 목적은 공지된 시스템의 최소한 몇가지 단점을 극복한 문자 인식 시스템을 제공하기 위한 것이다.
본 발명의 다른 목적은 개인용 데이타 베이스를 전혀 이용하지 않을 경우 인식율을 개선한 간단한 문자 인식 시스템을 제공하기 위한 것이다.
본 발명의 한가지 특징에 따르면, 수기 문자(script written character)를 인식하기 위한 방법에 있어서, 문자 입력 수단(character enter means)을 이용하여 상기 문자를 입력시키는 단계; 상기 문자를 디지털화하는 단계; 상기 디지털화된 문자를 저장하는 단계; 상기 문자의 위상학적 특징(topological features) 및 벡터적 특징(vector features)을 추출하는 단계; 상기 문자의 위상학적 및 벡터적 특징을 메모리 내에 저장되어 있는 기준 위상학적 및 벡터적 특징의 세트와 비교하는 단계- 상기 세트의 각각은 특정 문자에 대응함- ; 및 상기 기준 특징 세트 중 어느 기준 특징이 상기 디지털화된 문자의 위상학적 및 벡터적 특징에 가장 근접하게 대응하는지를 결정하기 위한 논리 처리를 수행하여, 상기 수기 문자를 인식하는 단계를 포함하고, 상기 추출 단계는 인식할 문자의 위상학적 및 벡터적 특징을 추출하는 단계를 포함하고, 상기 문자의 벡터적 특징을 추출하는 단계는 상기 문자의 점의 수를 지시하는 코드 Nd를 추출하는 단계를 포함하고, Nd + 1은 문자 포맷 (STK)내의 점의 수이며, 문자 포맷 (STK)은 상기 문자를 스트로크의 시퀀스로 표현함으로써 스트로크 포맷을 표현하고, 상기 스트로크 각각은 펜업 및 펜다운 조건 사이의 일련의 좌표로 정의 되는 수기 문자 인식 방법이 제공된다.
본 발명의 시스템은 문자의 복잡한 분석에 소요되는 시간이 전혀 필요하지 않고 사용자에 의해 입력된 모든 문자의 약 98% 이상을 데이타 베이스가 인식할 수 있는 장점을 갖고 있다.
이하, 첨부 도면을 참조하여 본 발명의 실시예 및 장점에 대해 상세하게 설명하고자 한다.
제1도에는 문자 인식 시스템(10)이 도시되어 있다. 이 시스템(10)은 모니터(14)를 갖고 있는 마이크로컴퓨터(12)를 포함한다. 컴퓨터(10)은, 예를 들어 LCD 그래픽 디지타이저(16)인 접촉 감응식 스크린에 접속된다. 모니터를 접촉 감응식 모니터로 교체하여 별도의 접촉 감응식 스크린으로 분리하는 것이 가능하다. 펜 유사형 철필(18)은 명령어, 데이타 등을 컴퓨터에 입력시키기 위한 접촉 감응식 스크린 상에서 이용될 수 있다. 사용자는 스크린 상에서 명령어를 직접 입력시킬 수 있다. 명령어를 가장 정확하게 인식하기 위해서는, 문자는 프레임(20) 내에 양호하게 공급되어야 한다. 제2도에는 사용자가 정보를 공급하는데 이용되는 접촉 감응식 스크린 메뉴가 도시되어 있다. 이용가능한 주요 옵션은 블럭(22)로 도시되어 있고 적절한 박스(24a-f) 상에 철필을 접촉시킴으로써 작동될 수 있다.
제3도에는 프레임(20)이 상세하게 도시되어 있다. 이 프레임(20)은 상부 프레임(26), 중앙 프레임(28) 및 저부 프레임(30)을 포함하고 있다. 각각의 문자는 하나의 열(32) 내에 공급된다. 문자의 위치는 문자를 인식하는데 도움을 주도록 사용된다. 예를 들면, a, c, e, m, n, o, r, s u, v, w, x 및 z와 같은 “짧은” 소문자 케이스의 문자는 중앙 프레임에 공급되어야 하고, 이들은 다른 프레임 내로 확장되지 못할 만큼의 크기인 것이 양호하다. b, d, f, h, i, k, l 및 t와 같은 “긴” 소문자 케이스의 문자는 최소 소문자 케이스의 문자보다 큰 수직 크기를 갖고 있고 상부 및 중앙에 공급된다. g, j, p, q 및 y와 같은 “꼬리”를 갖는 소문자 케이스의 문자는 꼬리가 저부 프레임으로 확장되도록 양호하게 공급되어야 한다. 대문자 케이스의 문자 및 숫자는 소정 열(32)의 상부 및 중앙 프레임내에 공급되는 것이 일반적이다. 예를 들면, 구두점과 같은 다른 문자는 문자 숫자 형태의 문자에 관련하여 통상적인 위치에 공급된다. 구두점의 인식은 본 발명에서는 취급하지 않겠지만, 본 발명의 출원인의 계류중인 출원에는 이를 언급하고 있음을 참고로 일러준다.
상술한 프레임 제한은 시스템이, 예를 들면 “c”와 “C” 사이의 차이점을 인식 할 수 있게 한다. 조작자가 프레임의 크기를 설정하거나 표준 프레임을 사용할 수 있다. 형태는 동일하지만 크기가 다른 부호를 갖고 있지 않는 일본어 문자와 같은 문자 이외에, 프레임 제한은 불필요하고, 사용자는 소정의 프레임 제한없이 박스내에 문자를 공급할 수 있다. 이러한 프레임은 시스템이 기하학적 부호 또는 도형의 인지용으로 이용되는 경우에 보유된다. 프레임의 제한이 인식에 어떤 도움을 줄것인지에 대한 상세한 설명을 하고자 한다.
수기 데이타가 LCD 그래픽 디지타이저(LCD graphic digitizer)(16)에 입력되면, 디지타이저의 출력은 스트로크 포맷 파일(STK 파일)이라고 불리는 형태로 컴퓨터에 다운로드된다. 이러한 포맷에 있어서, 문자는 일련의 스트로크에 의해 표현되고, 상기 스트로크는 펜 다운(pen down)과 펜 업(pen up) 상태 사이의 일련의 좌표(coordinate)로 구성된다. 제4도에는 스트로크 파일의 내용의 ASCII 포맷 번역이 문자(A)의 2진 형태로 도시되어 있다. 이때, 디지타이저로부터의 출력은 문자가 인식되기 전에 “선처리(pre-processed)”된다. 이러한 선처리는 소정 크기의 픽셀 매트릭스, 예를 들면 16 x 16 매트릭스내에 디지탈 정보의 문자를 크기 조정 처리(scaling), 중심을 맞추는 처리, 디지탈 잡음을 필터하는 처리 및 정보 삽입 처리를 포함한다.
선처리 이후에, 문자는 3가지 주요 단계, 즉
입력된 수기 문자의 위상학적 특성(특징)의 추출 단계,
문자 벡터 코드 결정 단계, 및
메모리 내에 저장된 한 셋트의 기준 문자와의 “퍼지(fuzzy)” 비교에 의한 인식 단계를 포함하는 인식 처리가 이루어진다.
수기 인식은 문자가 기록되었을 때 각각의 개별 문자에 대해 행해진다. 이것은 사용자의 필체에 따라 문자를 전적으로 자유롭게 기입할 수 있게 한다. 즉, 문자를 특정한 스트로크 수순으로서 공급하는 것이 불필요하다. 이것은 펜의 이동 방향으로 변할 수 있고, 문자가 초기에 기입된 후에 정정이 이루어질 수 있다. 인식은 부호의 광학 특성에 주로 기초를 두고 있다. “S” 및 “5”와 같은 문자의 광학 특성으로 인한 불명료함을 해결하기 위해, 벡터 코드는 각각의 문자에 대해 결정된다. 이러한 벡터 코드의 결정에 대해서는 이하에 상세하게 설명하고자 한다. 상술한 바와 같이, 동일 형태의 대문자 및 소문자(예를 들어, “c” 및 “C”)의 인식은 필드 또는 프레임 내에 사용자가 기입함으로써 개선된다.
이 특정의 시스템은 문자 뿐만 아니라 표준 컴퓨터 키보드에서 일반적으로 볼 수 있는 다른 기호에 대해서도 최적화되어 있다. 그러나, 이 시스템은 모든 알파벳, 일본어 문자, 기하학적 기호 및 간단한 도형에 대해서도 최적화되어 있다. 부수적으로 이러한 원리는 모든 다른 문자에도 유효하다. 시스템은 인식률을 보다 양호하게 하는 필기자 종속 모드(writer dependent mode)에 이용될 수 있다. 그러나, 필기자 독립 시스템, 즉 시스템을 트레이닝하지 않고 이용될 때에도 매우 양호한 인식이 이루어질 수 있다. 사용자는 자신의 익숙한 문자 모드로 설정한 자신의 기준 문자를 공급할 수 있다. 적절하게 트레이닝되었을 때, 시스템은 소정의 수기 필체를 인식할 수 있다. 예를 들면, 한 사용자가 다수의 문자 필체를 소정의 알파벳 문자, 또는 소정의 문자를 기입하는데 있어서 사용자의 특수한 방식으로 인식하기 위해 시스템을 트레이닝할 수 있다. 또는, 시스템은 표준 문자 셋트에 따라 “비훈련 모드(untrained mode)”로 이용될 수 있다.
선처리는 우선 상술한 STK 포맷을 정규화된 16 x 16 매트릭스의 패턴(PTN) 포맷으로 변환시킨다. 이러한 PTN 포맷은 제5도에 도시되어 있다. 나머지 문자의 선처리는 다음과 같이 달성된다.
디지타이저가 점들을 일정한 속도로 변환시킬 때 점 보간/평활화(Point Interplation/Smoothing)가 발생하고, 2개의 연속적인 점들 사이의 거리는 펜의 속도에 비례한다. 기입 속도가 느린 경우, 소정의 점들은 서로가 매우 밀접하게 될 수 있어서 디지타이징 잡음을 일으킨다. 또, 기입 속도가 비교적 빠른 경우, 점들은 서로 멀리 떨어져 있어서, 스트로크 내에 구멍이 남게 된다, 이러한 결점을 극복하기 위해, 점들이 너무 멀리 떨어져 있으면 보간점(interpolation points)을 삽입하고, 점들이 너무 밀접해 있으면 점들을 제거하기 위해 보간/평활화 루틴이 이용된다.
문자의 경계를 측정하고 점들이 정규화된 16 x 16 매트릭스내에 삽입되도록 크기 조정(scaling)된다. X 및 Y 성분은 매트릭스에 완전히 삽입하기 위해 상이한 계수 인자로 크기 조정된다. X-크기/Y-크기 또는 Y-크기/X-크기의 비가 소정의 임계치(전형적으로, 4)보다 큰 경우, 문자의 큰 성분(X 또는 Y)만이 크기 조정된다. 이것은 “I” 또는 “-”와 같은 “가느다란(slim)” 문자의 부적절한 확장을 방지하기 위한 것이다.
문자 맵핑은 계수되는 각각의 16 x 16 픽셀 및 계산된 평균치에 속하는 점의 수를 포함한다. 임계치(평균치의 약 1/8)은 매트릭스의 소정의 픽셀이 흑색(1) 또는 백색(0)인지를 설정하는데 사용된다. 소정 픽셀내의 점의 수가 임계치보다 큰 경우, 대응 비트는 1로 설정되고, 그렇지 않으면 0으로 설정된다. (문자가 다수의 기준 문자 셋트인 경우에만 이용할 수 있는) 문자 식별자를 특정하기 위해 문자 매트릭스에 추가 데이타가 추가되는 데, 이 데이타는 문자의 스트로크 수 및 프레임 위치를 포함한다 이러한 정보는 후술한 바와 같이 인식 과정(recognition process) 중에 이용될 수 있다. 프레임 위치는 3개의 기입 프레임의 각각에 대한 스코어: 상부 프레임(26)에 대해 1, 중앙 프레임(28)에 대해 2, 및 저부 프레임(30)에 대해 4를 할당함으로써 부호화된다. 예를 들어, 문자 ‘g’는 중앙 및 저부 프레임 내에 정상적으로 기입될 수 있으므로, 프레임의 수는 2 + 4 = 6일 수 있다. 프레임의 수는 기입 필드상의 문자 위치를 검사함으로써 평가된다. 사용자의 경미한 프레이밍 에러를 무시하기 위하여, 상부 및 저부 필드의 활성 영역은 프레임 라인에 의해 나타난 것보다 실제로 약간 작다. 이것은 중앙 프레임과 상부 프레임 사이의 실제 경계부는 도시된 것보다 약간 높고, 중앙 프레임 및 저부 프레임 사이의 경계부는 도시된 것보다 약간 낮다는 것을 의미한다. 이러한 조정의 크기(amount of this shift)sms 사용자가 조정할 수 있다.
문자 선처리 단계의 결과는 패턴 포맷의 16 x 16 매트릭스인데, 매트릭스의 각각의 요소는 문자 영상 픽셀이다. 제공된 요소에 대해 허용된 값은 제5도에 도시된 바와 같이 0(백색 픽셀) 및 1(흑색 픽셀)이다 매트릭스의 상부에는 다음 정보를 포함하는 헤더 데이타 라인이 있다.
(a) 문자 식별자(character identifier)(문자가 기준 문자 셋트의 멤버인 경우에만 이용가능함),
(b) 스트로크의 수(number of strokes), 및
(c) 프레임의 위치 설정(frame positioning)
또한, 헤더 데이타 라인은 문자 벡터 코드를 포함한다.
제1 인식 처리 단계는 초기 16 x 16 매트릭스 및 STK 문자 포맷으로부터 문자의 위상학적 및 동적(벡터) 기술 또는 코드를 추출하는 단계를 포함한다. 이때, 학습 단계(learning phase) 중에 사용자에 의해 수집되거나 메모리내의 표준 셋트로부터의 기준 문자 코드와 입력된 문자를 비교함으로써 인식이 행해진다. 코드는 4가지 형태의 정보를 기본적으로 포함한다.
(i) 특징 추출 코드(feature extraction code),
(ii) 교차 코드( Intersection code),
(iii) 프레임 위치, 스트로크수 및 문자 식별자(문자가 기준 문자 셋트의 멤버인 경우에만 문자를 이용가능함), 및
(iv) 문자 벡터 코드(character vector code)
특징 추출은 인식 알고리즘의 주요 단계이다. 이것은 매우 정확하게 인식하기 위한 문자 위상학적 기술을 충실히 행한다. 이러한 조작은 “위상학적 특징 셋트(topological feature set)”를 이용함으로써 행해진다. 이것은 요소의 기하학적 구조를 나타내는 제6도에 도시된 99개의 16 x 16 매트릭스로 구성된다. 이러한 매트릭스는 여러가지 문자 셋트를 다수의 다른 사람들이 이용하여 행해진 복잡한 최적 작업에 의해 얻어진다.
특징 추출은 문자를 i차(i = 1, …, 99) 특징 매트릭스에 중복 기입한 다음, 이들이 공통적으로 갖고 있는 흑색 픽셀의 수를 계수하는 단계를 기본적으로 포함한다. 이러한 조작은 비트와이즈(bitwise) AND 기능에 의해 용이하게 수행된다. 이때, 계수 결과(counting result)(X)는 3가지 임계치(T1, T2, T3)과 비교된다.
X 〈 = T1인 경우, i차 특징의 응답(fi)는 0으로 설정된다.
T1 〈 X 〈 = T2인 경우, i차 특징의 응답(fi)는 1로 설정된다.
T2 〈 X 〈 = T3인 경우, i차 특징의 응답(fi)는 2로 설정된다.
X 〉 T3인 경우, i차 특징의 응답(fi)는 3으로 설정된다.
이러한 처리는 제7도에 도시되어 있다. 그러므로, 상술한 조작의 결과는 주어진 문자에 대한 특징 셋트의 응답을 나타내는 특징 추출 코드(feature extraction code)라 칭해지는 99개의 정수 값을 갖는 어레이이다. T1, T2, T3은 시스템의 시뮬레이션으로부터 선택되고 T1=2, T2=3, T3=6이 되게 전형적으로 설정된다.
교차 코드(intersection code)는 문자 위상학적 특징에 대한 추가 정보를 포함한다. 이것은 32개의 정수(Ni)(i = 1, …, 32)를 포함하는데, 이 정수의 각각은 매트릭스의 16개 수평 라인 및 16개 수직 라인과 문자의 교차의 갯수이다. 이 조작의 예는 제8도에 도시되어 있다.
문자 코드의 다음 필드는 프레임 위치(frame positioning), 문자의 스트로크 수(the number of strokes of the character)를 포함하고, 문자가 학습 셋트의 멤버인 경우, 사용자에 의해 제공된 식별자를 포함한다.
최종 필드는 문자 벡터 코드 정보(character vector code information)이다. 이것은 다음과 같은 벡터 파라메터를 포함한다.
(i) 여기에서, Nd + 1은 STK 문자 포맷내의 정의 수인 Nd,
(ii) 이전 포맷에 관련하여 STK 문자 포맷내의 각 점의 위치를 기술하는 Nd 4 비트 값의 어레이인 DIN,
(iii) STK 문자 포맷의 제1, 중앙 및 최종 점의 X 좌표에 관련하여 STK 문자 포맷의 각 점의 X 좌표의 위치를 기술하는 Nd 3 비트값의 어레이인 APPX,
(iv) STK 문자 포맷의 제1, 중앙 및 최종 점의 Y 좌표에 관련하여 STK 문자 포맷의 각 점의 Y 좌표의 점을 기술하는 Nd 3 비트값의 어레이인 APPY, 및
(v) 문자의 극단(최대 및 최소)점의 상대 위치를 나타내는 12가지 2 비트값의 어레이인 REL 이전 포맷에 관련하여 STK 포맷내의 각 점의 위치를 기술하는 DIN 파라메터는 다음과 같은 방식으로 결정된다.
(X1, Y1)은 STK 포맷내의 소정점의 좌표이고, (X2, Y2)는 후속 점의 좌표이고, 이런 식으로 주어진다. STK 점 순차내의 펜업 및 펜 다운 좌표는 무시되므로, 2개의 점이 상이한 스트로크에 속할지라도 다음과 같은 방법이 적용될 수 있다. 2개의 점들의 상대 위치는 다음과 같은 플로우를 사용함으로써 나타난다.
(X1 〉 X2) 경우,
{(Y1 〉 Y2) 경우, DIN=1
(Y1 = Y2) 경우, DIN=2
(Y1 〈 Y2) 경우, DIN=3}
(X1 = X2) 경우,
{(Y1 〉 Y2) 경우, DIN=4
(Y1 = Y2) 경우, DIN=5
(Y1 〈 Y2) 경우, DIN=6}
(X1 〈 X2) 경우,
{(Y1 〉 Y2) 경우, DIN=7
(Y1 = Y2) 경우, DIN=9
(Y1 〈 Y2) 경우, DIN=10}
각각의 문자에 대한 DIN 값의 수는 Nd(점의 수-1)이다. DIN 값이 1과 10 사이의 범위에 있기 때문에 4비트 값이 각각의 DIN 값들을 나타내는데 필요하다.
예를 들면, 문자가 다음과 같은 5개 점으로 형성된 경우,
1:(3,6)
2:(3,8)
3:(4,7)
4:(3,7)
5:(3,8)
Nd=(점의 수-1)=4,
DIN〔0〕=6,
DIN〔1〕=7,
DIN〔2〕=2, 및
DIN〔3〕=6
이 얻어진다.
APPX 및 APPY 파라메터는 제1, 중앙 및 최종점에 관련하여 STK 문자 포맷내의 각 점의 위치를 나타낸다. 상술한 바와 같이, 펜업 및 펜 다운 좌표는 고려되지 않는다.
(X,Y)는 현재 점의 좌표이다.
(Xo,Yo)는 제1점의 좌표이다.
(Xc,Yc)는 중앙점의 좌표이다.
(Xn,Yn)은 최종점의 좌표이다.
이때, APPX 및 APPY 값은 다음과 같이 얻어진다.
(Xc〉X & Xn〉X & Xo〉X)인 경우, APPX=0,
(Xc〉X & Xn〉X & XoX)인 경우, APPX=1,
(Xc〉X & XnX & Xo〉X)인 경우, APPX=2,
(Xc〉X & XnX & XoX)인 경우, APPX=3,
(XcX & Xn〉X &Xo〉X)인 경우, APPX=4,
(XcX & Xn〉X & XoX)인 경우, APPX=5,
(XcX & XnX & Xo〉X)인 경우, APPX=6, 및
(XcX & XnX & XoX)인 경우, APPX=7.
그러나,
(Yc〉Y & Yn〉Y & Yo〉Y)인 경우, APPX=0,
(Yc〉Y & Yn〉Y &YoY)인 경우, APPX=1,
(Yc〉Y & YnY & Yo〉Y)인 경우, APPX=2,
(Yc〉Y & YnY & YoY)인 경우, APPX=3,
(YcY &Yn〉Y & Yo〉Y)인 경우, APPX=4,
(YcY &Yn〉Y & YoY)인 경우, APPX=5,
(YcY & YnY & Yo〉Y)인 경우, APPX=6, 및
(YcY &YnY & YoY)인 경우, APPX=7.
각 문자에 대한 APPX 및 APPY 값의 수는 DIN 파라메터에 대해서는 Nd이다. 가능한 값은 1과 8 사이의 범위에 있고, APPX/APPY 코드를 저장하는데 3비트가 필요하기 때문에 2*3*Nd 비트가 필요하다. 예를 들면, 이전 예에서의 문자에 대한 APP 코드는 다음과 같다.
(Xo,Yo) = (3,6)
(Xc,Yc) = (4,7)
(Xn,Yn) = (3,8)인 경우,
APPX〔0〕 = 3 APPX〔1〕=7 APPX〔2〕 = 3
APPX〔3〕 = 3
APPY〔0〕 = 7 APPY〔1〕=5 APPY〔2〕 = 3
APPX〔3〕 = 6
문자의 극단 점의 상대 위치를 나타내는 REL 파라메터는 다음과 같이 평가된다.
Xmax는 STK 문자 포맷내의 X 좌표의 최대치이다.
Xmax는 STK 문자 포맷내의 Y 좌표의 최대치이다.
Xmin는 STK 문자 포맷내의 X 좌표의 최소치이다.
Ymin는 STK 문자 포맷내의 Y 좌표의 최소치이다.
Y(Xmax)는 Xmax가 속하는 점의 y좌표이다.
X(Ymax)는 Ymax가 속하는 점의 x좌표이다.
Y(Xmin)은 Xmin이 속하는 점의 y좌표이다.
X(Ymin)는 Ymin가 속하는 점의 x좌표이다.
4개의 극단 점들은 사용자가 기입한 때의 시간을 고려한 것으로 이들의 좌표값은 비교된다. 이러한 비교 결과는 차가 포지티브인 경우 “+”, 차가 네가티브인 경우 “-”, 및 차가 0인 경우 “=”로 설정된다.
예를 들면, 한가지 예를 고려를 한 경우, 다음과 같이 얻어진다.
Xmax=4 Ymax=8 Xmin=3 Ymin=6
그리고, 시간 순서는
1. (Xmin, Y(Xmin)) = (3,6)
2, (X(Ymin), Ymin) = (3,6)
3. (X(Ymax), Ymax) = (3,8)
4. (Xmax, Y(Xmax)) = (4,7)
제1점을 얻어진 제2점과의 비교 = =
제1점을 얻어진 제3점과의 비교 = -
제1점을 얻어진 제4점과의 비교 - -
제2점을 얻어진 제3점과의 비교 = -
제2점을 얻어진 제4점과의 비교 - -
제3점을 얻어진 제4점과의 비교 - -
그러므로, 특정 문자에 관련된 REL 코드는 다음과 같다.
‘= = =_ _ _ = _ _ _ _ _’
REL 코드내의 각각의 부호가 3가지 상이한 값을 취할 수 있기 때문에, 이들을 각각 기억하는 데에는 4 비트가 필요하다. 그러므로, 각각 문자의 REL 코드는 212 = 24 비트를 필요로 한다.
DIN, APPX/APPY 및 REL 코드뿐만 아니라, Nd 값은 상술한 기하학적(또는 위상학적) 문자 코드에 추가된다. 그러므로, 갱신된 문자 코드는 다음과 같은 정보를 포함한다.
1. 특징 추출 코드
2. 교차 코드
3. 프레임 위치, 스트로크 수 및 문자 식별자 (문자가 기준 문자 셋트의 멤버인 경우에만 문자를 이용가능함)
4. Nd수
5. DIN코드
6. APPX/APPY 코드
7. REL 코드
그러므로, 코딩 처리 후, 소정의 문자는 특징 추출로부터 99, 교차로부터 32, 스트로크수에 대한 1, 프레임 위치에 대한 1, Nd에 대한 1, DIN에 대한 Nd, APPX/APPY에 대한 2Nd 및 REL에 대한 12개로 구성된 정수 어레이로 나타난다.
미지의 입력된 문자 코드를, 동일한 프레임 수를 갖고 있는 기준 문자 셋트내의 부호화 문자와 수치별로 비교함으로써 인식이 이루어진다. 입력 문자의 수와 상이한 프레임 수를 갖는 문자는 비교중에 무시된다. 이것은 2가지 중요한 장점을 갖는다. 첫째, 이것은 동일한 형태와 상이한 크기의 문자를 인식할 수 있다. 둘째, 소수의 비교를 포함하고 있는 관계로 인식 처리 속도는 상당히 빠르다. 결과적으로, 스코어(Sj)는 다음과 같이 주어지고,
Sj = WoSoj - Sdj
이 식으로 표현된 문자 데이타베이스 내의 미지의 입력 문자와 j번째 문자 사이의 비교로 지정된다. 이 식에 있어서 , Wo는 광학 및 벡터 정보의 상대적 중요성을 설명하는 가중치 계수이고, Soj는 소위 광학 또는 위상학적 스코어이며, Sdj는 소위 동적 스코어이다.
j번째 비교(j = 1, …, Ncar)로 지정된 “광학” 스코어(Soj)는 다음과 같이 주어진다.
99 32
Soj = SWS-Stj+SUMfi-fij+IWSUMNi-Nij
i=1 i=1
여기서,
S = 입력 문자의 스트로크 수
Stj = j번째 기준 문자의 스트로크 수
fi = 입력 문자에 대한 i번째 특징의 응답
fij = j번째 기준 문자에 대한 i번째 특징의 응답
Ni = 입력 문자와 i번째 라인의 교차수
Nij = j번째 기준 문자와 i번째 라인의 교차수
SW = 스트로크 가중치
IW = 교차 가중치
스코어는 각각의 Ncar 기준 문자에 대해 평가된다.
문자 스코어의 동적항(Sdj)는 3가지 상이한 항의 합으로서 표현된다.
Sdj = Aj + WrRj + Wp|Nd-Ndj|
여기서, Aj는 APP/DIN 스코어이고,
Rj는 REL 스코어이며,
Wp 및 Wr은 가중치 계수이다
가중치 계수(Wr 및 Wp)에 대한 최적치가 각 8 및 4인 시뮬레이션 결과가 나타난다.
Aj 스코어는 DIN 및 APPX/APPY 코드의 비교에 의해 평가된다.
파라메터(DIN, APPX, APPY 및 Nd)는 입력 문자에 관련되고 DINj, APPXj, APPYj 및 Ndj는 기준 문자 셋트내의 j번째 문자에 관련된다.
DIN, APPX, APPY는 Nd 요소(DINj, APPXj, APPYj)로 형성되고, Ndj는 Ndj 요소를 포함한다. 일반적으로, NdNdj 및 수기시 고변이성이 있기 때문에 2개의 어레이를 시프팅한 후 각각 행해지는 DIN 및 APPX/APPY를 비교하기가 불충분할 뿐만 아니라, 다중 비교가 하나의 어레이에 관련하여 다른 어레이에 요구된다. 최적 인식율이 7가지 상이한 상대 시프트를 고려하여 얻어지는 시뮬레이션 결과가 나타난다.
예를 들어,
DIN = {1,3,2,7,7,9,5,8,4,3} DINj = {3,4,3,3,2,7,6}
APPX = {4,4,6,5,3,7,6,6,4,5) APPXj = {4,6,7,4,4,5,5}
APPY = {4,4,6,5,3,7,6,6,6,7} APPXj = {2,5,6,3,4,7,6}
Nd= 10 Ndj =7
고려될 7회의 시프트는 다음과 같다.
1. DIN {1,3,2,7,5,9,5,8,4,3}
DINj {3,4,3,3,2,7,6}
APPX {4,4,6,5,3,7,6,6,4,5}
APPXj {4,6,7,4,4,5,5}
APPY {4,4,6,5,3,7,6,6,6,7}
APPYj {2,5,6,3,4,7,6}
2. DIN {1,3,2,7,5,9,5,8,4,3}
DINj {3,4,3,3,2,7,6}
APPX {4,4,6,5,3,7,6,6,4,5}
APPXj {4,6,7,4,4,5,5}
APPY {4,4,6,5,3,7,6,6,6,7}
APPYj {2,5,6,3,4,7,6}
3. DIN {1,3,2,7,5,9,5,8,4,3}
DINj {3,4,3,3,2,7,6}
APPX {4,4,6,5,3,7,6,6,4,5}
APPXj {4,6,7,4,4,5,5}
APPY {4,4,6,5,3,7,6,6,6,7}
APPYj {2,5,6,3,4,7,6}
4. DIN {1,3,2,7,5,9,5,8,4,3}
DINj {3,4,3,3,2,7,6}
APPX {4,4,6,5,3,7,6,6,4,5}
APPXj {4,6,7,4,4,5,5}
APPY {4,4,6,5,3,7,6,6,6,7}
APPYj {2,5,6,3,4,7,6}
5. DIN {1,3,2,7,5,9,5,8,4,3}
DINj {3,4,3,3,2,7,6}
APPX {4,4,6,5,3,7,6,6,4,5}
APPXj {4,6,7,4,4,5,5}
APPY {4,4,6,5,3,7,6,6,6,7}
APPYj {2,5,6,3,4,7,6}
6. BIN {1,3,2,7,5,9,5,8,4,3}
DINj {3,4,3,3,2,7,6}
APPX {4,4,6,5,3,7,6,6,4,5}
APPXj {4,6,7,4,4,5,5}
APPY {4,4,6,5,3,7,6,6,6,7}
APPYj {2,5,6,3,4,7,6}
7. DIN {1,3,2,7,5,9,5,8,4,3}
DINj {3,4,3,3,2,7,6}
APPX {4,4,6,5,3,7,6,6,4,5}
APPXj {4,6,7,4,4,5,5}
APPY {4,4,6,5,3,7,6,6,6,7}
APPYj {2,5,6,3,4,7,6}
각각의 7가지 언급한 케이스에 대해, 비교가 다음과 같이 행해진다.
APPX 어레이의 i 번째 소자인 APPX〔i〕는 Appxj〔j〕와 비교되고, APPY〔i〕는 APPYj〔i〕와 비교된다. 소정의 이러한 소자가 이용될 수 없는 경우 비교는 행해지지 않는다. 이때, 3가지 상이한 경우가 발생한다.
a) APPX〔i〕 = APPXj〔i〕 APPY〔i〕 = Appyj〔i〕
이러한 경우에, 비교결과 〔Cijk(k=1, …, 7)〕은 매트릭스의 (DIN〔i〕, DINj〔i〕) 위치내에 배치된 소자에 의해 제공된다.
(0,0,0,0,0,0,0,0,0,0,0)
(0,2,1,0,1,0,0,0,0,0,0)
(0,1,2,1,0,1,0,0,0,0,0)
(0,0,1,2,0,0,1,0,0,0,0)
(0,1,0,0,2,1,0,1,0,0,0)
(0,0,1,0,1,2,1,0,0,1,0)
(0,0,0,1,0,1,2,0,0,0,1)
(0,0,0,0,1,0,0,2,0,1,0)
(0,0,0,0,0,0,0,0,2,0,0)
(0,0,0,0,0,1,0,1,0,2,1)
(0,0,0,0,0,0,1,0,0,1,2)
b) APPX〔i〕APPXj〔i〕 APPY〔i〕=APPYj 〔i〕
이러한 경우에, 비교 결과(Cijk)는 매트릭스의 (DIN〔i〕, DINj〔i〕) 위치내에 배치된 소자에 의해 제공된다.
(0,0,0,0,0,0,0,0,0,0,0)
(0,1,0,0,1,0,0,0,0,0,0)
(0,0,1,0,0,1,0,0,0,0,0)
(0,0,0,1,0,0,1,0,0,0,0)
(0,1,0,0,1,0,0,1,0,0,0)
(0,0,1,0,0,1,0,0,0,1,0)
(0,0,0,1,0,0,1,0,0,0,1)
(0,0,0,0,1,0,0,1,0,0,0)
(0,0,0,0,0,0,0,0,1,0,0)
(0,0,0,0,0,1,0,0,0,1,0)
(0,0,0,0,0,0,1,0,0,0,1)
c) APPX〔i〕 = APPXj〔i〕 APPY〔i〕APPYj〔i〕
이러한 경우, 비교 결과(Cijk)는 매트릭스의 (DIN〔i〕, DINj〔i〕) 위치내에 배치된 소자에 의해 제공된다.
(0,0,0,0,0,0,0,0,0,0,0)
(0,1,1,0,0,0,0,0,0,0,0)
(0,1,1,1,0,0,0,0,0,0,0)
(0,0,1,1,0,0,0,0,0,0,0)
(0,0,0,0,1,1,0,0,0,0,0)
(0,0,0,0,1,1,1,0,0,0,0)
(0,0,0,0,0,1,1,0,0,0,0)
(0,0,0,0,0,0,0,1,0,1,0)
(0,0,0,0,0,0,0,0,1,0,0)
(0,0,0,0,0,0,0,1,0,1,1)
(0,0,0,0,0,0,0,0,0,1,1)
d) APPX〔i〕APPXj〔i〕 APPY〔i〕APPYj〔i〕
비교 결과는 Cijk=0이다.
소정의 시프트 위치에 관련된 전체 비교 결과는 Cjk=SUM Cijk인데, 여기에서 합은 APPX(i) 및 APPXj(i)이 동시에 정해지는 모든 i 값에 대해 행해진다.
최종적으로 APP/DIN 스코어는 다음과 같다.
Aj = max(Cjk)1000/max(Nd ,Ndj)
k=1, . .7
Rj 스코어를 평가하기 위해, 기준 문자 셋트내의 입력 문자의 REL 코드 및 j번째 문자의 RELj 코드는 소정값씩 비교된다. RELi 및 RELji(i=1,...,2)는 REL 및 RELj 코드의 i번째 값을 나타내고 Rj 스코어는 다음과 같다.
12
Rj = SUM aij
i=1
여기에서,
RELi=RELij인 경우, aij = 2
RELiRELj 및 RELi 또는 RLij가 ‘=’인 경우, aij = 1
그렇지 않으면, ail = 0
예를 들면, RELi =‘+ =_ _ _ = = + + + = =’ 및
RELji =‘+ + + = = _ _ + = _ _ =’, Rj = 13인 경우이다.
Aj 및 Rj가 평가될 때, 이들은 Sdj를 계산하기 위해 삽입될 수 있다.
이때, 기준 문자 데이타 베이스 내의 j번째 문자와의 비교로 지정된 전체 스코어(Sj)는 각각의 Ncar 기준 문자로 평가된다. 최소 스코어를 갖는 기준 문자 식별자는 미지의 입력 부호로 지정된다.
동적 가중치 계수(Wo, Wr, Wp) 및 스트로크 가중치 계수(SW)에 의해 행해지는 역할은 매우 중요하다. 실제로, 대형 인자(Wo)가 있는데, 인식 처리시 광학 정보의 가중치는 보다 중요한 것이다 Wr 및 Wp는 동적 스코어(Sdj)의 상이한 성분의 상대적인 중요성을 나타낸다. 다른 중요한 파라메터는 스트로크 가중치(SW)인데 대규모인 것은 스트로크 수의 영향이 크다. 따라서, 응용에 따라서, Wo, Wr, WP 및 SW 인자를 트리밍시킴으로써 광학 및 동적 알고리즘 부분의 상대적인 중요성을 가중시키는 것이 가능하다. 예를 들면, 인식 알고리즘이 동일한 스트로크 순서로 기입되는 것이 일반적인 일본 문자의 인식용으로 이용되는 경우, 동적 기여도는 매우 중요하게 되고, WO 파라메터는 로마 문자에 사용된 것보다 작아야 한다. 이와 마찬가지로, SW, Wr 및 Wp는 커야한다. 소정의 응용에 있어서, 이러한 가중치 계수는 사용자에 의해 트림될 수 있다. 가중치 계수의 최적치는 로마 문자에 대해 Wo=24, Wr=8, Wp=4, SW=15이고, 일본 문자에 대해 Wo=20, Wr=8, Wp=4, SW=50인 시뮬레이션 결과가 나타난다.
사용자의 필체 컴퓨터를 교육하는데 이용될 수 있는 학습 프로세스는 이하에 보다 상세히 설명되어 있다. 사용자가 시스템을 교육하고 싶지 않은 경우, 사용자는 시스템에 영구적으로 기억된 기준 문자 셋트 또는 다른 사용자의 문자 셋트에 의해 행해지는 인식에 의존할 수 있다.
학습 프로세스는 사용자가 인식하고자 하는 각각의 부호에 대한 예의 적절한 수를 수집하는 단계를 포함한다. 이러한 부호들은 인식 프로세스 중에 기준 문자 셋트를 형성할 수 있다. 2가지 상이한 학습(또는, 훈련) 모드가 이용될 수 있다.제1 모드는 내장 학습 모드로 공지되어 있다. 이러한 모드에 있어서, 사용자가 지령 파일 내에 목록된 부호의 예를 기입하기 위한 프로그램이 필요하다. 이러한 파일은 대응 프레임 제약 조건으로 인식될 부호의 완전한 리스트를 포함한다. 부호 및 프레임 제약 조건의 리스트는 사용자가 인식하고자 하는 부호 및 필체에 따라서 사용자에 의해 변경될 수 있다. 다중 프레임 제약치는 각각의 부호에 허용된다. 학습 문자 셋트내에 악필 문자의 삽입을 방지하기 위해, 프로그램은 파일내에 지정된 것과 상이한 프레임 위치를 갖는 문자를 기각할 수 있다.
제2 모드는 대화식 학습 모드이다. 사용자는 부호를 본인이 선호하는 순서로 기입한다. 이때, 인식이 행해진다. 인식자가 실패한 경우, 비인식 부호가 학습(또는, 기준) 문자 셋트내에 자동적으로 삽입된다. 또한, 프레임 위치를 허용할 수 없는 문자는 기각될 수 있다.
내장 학습 모드가 작동된 후, 그 밖의 다른 문자를 학습 문자 셋트에 대화식 학습 모드로 추가함으로써 인식 능력이 더욱 개선될 수 있다.
이러한 HPCR(핸드 프린트식 문자 인식) 프로젝트는 하드웨어로 개선될 수 있다. 필요한 경우 실리콘의 이동을 용이하게 하기 위해, 흑색 픽셀의 수는 일정하게 선택되어 16과 동일하다. 그러나, 이것은 단지 양호한 선택의 경우에 적용되지, 제한하고자 하는 의도는 아니다.
상술한 시스템에서 실리콘의 이동은 가장 관련이 있는 다음과 같은 장점을 제공한다.
전용 하드웨어가 수적 비교 연산을 행하기 위한 대량 병렬 아키텍처를 이용하는 것을 의미하는 속도면에서의 증가는 특징 추출과 관련 메모리를 최단 시간에 수행할 필요가 있다.
전략 소모는 최소화되고, 전용 하드웨어는 인식이 행해질 때에만 작동된다. 데이타 베이스 메모리는 칩상에 집적화될 수 있다. 그러므로, 외부 버스를 구동시키는 데 필요한 전력이 절약된다.
전용 칩으로는 강력한 최신 마이크로 칩이 이용되지 않는 저가 소비자 제품이 이용될 수 있다
본 발명의 시스템은 실리콘 수행에 매우 양호하다고 언급하였다. 실제로, 수적으로 행해질 연산은 이들 자체(기본적으로, AND 및 EXNOR) 면에서 매우 간단하다. 고속용으로 필요한 대형 병렬 아키텍처는 DRAM 자체의 내부 구조물 덕분에 DRAM 메모리 코어(데이타 베이스/특징 기억용으로 이용됨) 주변에 상대적으로 간단한 방식으로 설치된다.
본 발명의 시스템은 하나의 알파벳 또는 다른 알파벳의 일부를 형성하는 문자에 관련하여 설명하였지만, 다른 부호의 인식도 결정될 수 있다. 예를 들면, 간단한 기하학적 부호는 이들 코드를 기준 기하학적 부호의 코드와 비교함으로써 식별될 수 있다. 이러한 부호의 소정 예는 반도체 장치의 부호(즉, 저항기, 캐패시터, 트랜지스터, 다이오드 등), 악보(오선지, 샤프, 플랫 등), 간단한 도면(예를 들어, 고양이, 강아지, 태양, 달 등)을 포함한다. 기준 코드가 소정 부호로 발생되는 이러한 시스템의 범위를 제한하고자 하는 것은 아니다.

Claims (23)

  1. 수기 문자(script written character)를 인식하기 위한 방법에 있어서: 문자 입력 수단(character enter means)을 이용하여 상기 문자를 입력시키는 단계; 상기 문자를 디지털화하는 단계; 상기 디지털화된 문자를 저장하는 단계; 상기 문자의 위상학적 특징(topological features) 및 벡터적 특징(vector features)을 추출하는 단계; 상기 문자의 위상학적 및 벡터적 특징을 메모리 내에 저장되어 있는 기준 위상학적 및 벡터적 특징의 세트와 비교하는 단계- 상기 세트의 각각은 특정 문자에 대응함- ; 및 상기 기준 특징 세트 중 어느 기준 특징이 상기 디지털화된 문자의 위상학적 및 벡터적 특징에 가장 근접하게 대응하는지를 결정하기 위한 논리 처리를 수행하여, 상기 수기 문자를 인식하는 단계를 포함하고, 상기 추출 단계는 인식할 문자의 위상학적 및 벡터적 특징을 추출하는 단계를 포함하고, 상기 문자의 벡터적 특징을 추출하는 단계는 상기 문자의 점의 수를 지시하는 코드 Nd를 추출하는 단계를 포함하고, Nd + 1은 문자 포맷 (STK) 내의 점의 수이며, 문자 포맷 (STK)은 상기 문자를 스트로크의 시퀀스로 표현함으로써 스트로크 포맷을 표현하고, 상기 스트로크 각각은 펜업 및 펜다운 조건 사이의 일련의 좌표로 정의되는 수기 문자 인식 방법.
  2. 제1항에 있어서, 상기 위상학적 및 벡터적 특징을 추출하는 단계는 상기 문자의 속성(nature of the character)에 상관 없이 소정의 방식으로 다른 특징보다 상기 위상학적 또는 벡터적 특징에 더 가중치를 부여하는 단계를 포함하는 수기 문자 인식 방법 .
  3. 제1항 또는 제2항에 있어서, 상기 벡터적 특징을 추출하는 단계는 상기 문자의 특징을 하나 이상의 벡터 코드의 형태로 추출하는 단계- 상기 벡터 코드 각각은 상기 문자의 상기 벡터 특징 중 하나를 지시함- 를 포함하는 수기 문자 인식 방법.
  4. 제1항에 있어서, 상기 문자를 디지털화하는 단계는 1과 0으로 된 매트릭스 및 상기 문자를 나타내는 점들의 어레이를 구성하는 단계를 포함하는 수기 문자 인식 방법.
  5. 제3항에 있어서, 상기 벡터 코드를 추출하는 단계는 이전 점에 대한 어레이의 각 점의 위치를 기술하는 코드를 추출하는 단계를 더 포함하는 수기 문자 인식 방법.
  6. 제1항에 있어서, 상기 벡터적 특징은 상기 문자가 어떻게 형성되는지의 동적 특징에 의하여 결정되는 수기 문자 인식 방법.
  7. 제3항에 있어서, 상기 벡터 코드를 추출하는 단계는 상기 문자의 하나 이상의 선정된 X 좌표에 관하여 각 점에 대한 X 좌표를 기술하는 코드를 추출하는 단계를 더 포함하는 수기 문자 인식 방법.
  8. 제3항에 있어서, 상기 벡터 코드를 추출하는 단계는 상기 문자의 하나 이상의 선정된 Y 좌표에 관하여 각 점에 대한 Y 좌표를 기술하는 코드를 추출하는 단계를 더 포함하는 수기 문자 인식 방법.
  9. 제3항에 있어서, 상기 벡터 코드를 추출하는 단계는 상기 문자의 극단점(external points)의 상대 위치를 나타내는 코드를 추출하는 단계를 더 포함하는 수기 문자 인식 방법.
  10. 제1항에 있어서, 상기 논리 처리를 수행하는 단계는 각각의 기준 문자(Ncar)에 대한 스코어 Sj를 평가하여 가장 낮은 스코어 Sj를 갖는 기준 문자를 수기 문자로서 입력된 문자로 식별하는 단계를 포함하되,
    Sj = Wo*Soj - Sdj 이고,
    여기서, Wo는 가중치 계수(weighting factor)이고,
    Soj는 위상학적 스코어(topological score)이며,
    Sdj는 벡터적 스코어(vector score)인 수기 문자 인식 방법.
  11. 제10항에 있어서, 상기 스코어 Sj를 평가하는 단계는 Soj를 평가하는 단계를 포함하되,
    이고,
    여기서, S = 입력 문자의 스트로크 수
    Stj = j번째 기준 문자의 스트로크 수
    fi = 입력 문자에 대한 i번째 특징의 응답
    fij = j번째 기준 문자에 대한 i번째 특징의 응답
    Ni = 입력 문자와 i번째 라인의 교차수
    Nij = j번째 기준 문자와 i번째 라인의 교차수
    SW = 스트로크 가중치(stroke weight)
    IW = 교차 가중치(intersection weight)인 수기 문자 인식 방법.
  12. 제10항에 있어서, 상기 스코어의 평가 단계는 Sdj의 평가 단계를 포함하되,
    Sdj =Aj + Wr*Rj + Wp* |Nd-Ndj| 이고,
    여기서, Aj는 APP/DIN 스코어이고,
    Rj는 REL 스코어이고,
    Wp 및 Wr은 가중치 계수이고,
    Nd는 상기 입력 문자의 문자 점들의 개수 - 1이며,
    Ndj는 j번째 기준 문자의 문자 점들의 개수 - 1인 수기 문자 인식 방법.
  13. 수기 문자를 인식하기 위한 장치에 있어서: 상기 문자를 입력 및 수신하기 위한 문자 입력 수단; 상기 문자를 디지털화하기 위한 디지탈화 수단; 상기 디지털화된 문자를 저장하기 위한 저장 수단; 상기 문자를 나타내는 위상학적 특징(topological features) 및 벡터적 특징(vector features)을 추출하기 위한 특징 추출 수단; 상기 문자의 위상학적 및 벡터적 특징을 메모리 내에 저장되어 있는 기준 위상학적 및 벡터적 특징의 세트와 비교하기 위한 비교 수단- 상기 세트의 각각은 특정 문자에 대응함- ; 및 상기 기준 특징 세트 중 어느 기준 특징 세트가 상기 디지털화된 문자의 위상학적 특징에 가장 근접하게 대응하는지를 결정하기 위한 논리 처리를 수행하여, 상기 수기 문자를 인식하기 위한 논리 수단을 포함하고, 상기 문자의 벡터적 특징을 추출하기 위한 수단은 상기 문자의 점의 수를 지시하는 코드 Nd를 추출하기 위한 수단을 포함하고, Nd + 1은 문자 포맷 (STK) 내의 점의 수이며, 문자 포맷 (STK)은 상기 문자를 스트로크의 시퀀스로 표현함으로써 스트로크 포맷을 표현하고, 상기 스트로크 각각은 펜업 및 펜다운 조건 사이의 일련의 좌표로 정의되는 수기 문자 인식 장치.
  14. 제13항에 있어서, 문자의 속성(natu,e of the character)에 상관없이 소정의 방식으로 상기 위상학적 및 벡터적 특징 각각에 서로 다른 가중치 계수를 제공할 수 있는 상기 특징 추출 수단에 연관된 가중치 수단(weighting means)을 포함하는 수기 문자 인식 장치.
  15. 제14항에 있어서, 일본어 수기 문자에 대해서는 벡터적 특징 가중치 계수가 위상학적 특징 가중치 계수보다 높은 수기 문자 인식 장치.
  16. 제14항에 있어서, 로마자 수기 문자에 대해서는 벡터적 특징 가중치 계수가 위상학적 특징 가중치 계수보다 낮은 수기 문자 인식 장치.
  17. 제13항 내지 제16항 중 어느 한 항에 있어서, 상기 특징 추출 수단은 상기 벡터적 및 위상학적 특징을 나타내는 복수의 코드를 발생시키기 위한 코드 발생 수단을 포함하는 수기 문자 인식 장치.
  18. 제13항에 있어서, 상기 비교 수단은 상기 기준 세트의 코드와 상기 입력 문자에 대한 코드를 비교하는 수기 문자 인식 장치.
  19. 제13항에 있어서, 상기 논리 수단은 각각의 기준 문자(Nd)에 대한 스코어 Sj를 평가하고, 가장 낮은 스코어를 갖는 기준 문자를 상기 수기 문자에 대응하는 기준 문자로 식별하되, Sj = Wo*Soj - Sdj ol고, 여기서, Wo는 가중치 계수이고, Soj는 위상학적 스코어이며, Sdj는 벡터적 스코어인 수기 문자 인식 장치.
  20. 제19항에 있어서,
    이고,
    여기서, S = 입력 문자의 스트로크 수
    Stj = j번째 기준 문자의 스트로크 수
    fi = 입력 문자에 대한 i번째 특징의 응답
    fij = j번째 기준 문자에 대한 i번째 특징의 응답
    Ni = 입력 문자와 i번째 라인의 교차수
    Nij = j번째 기준 문자와 i번째 라인의 교차수
    SW = 스트로크 가중치
    IW = 교차 가중치인 수기 문자 인식 장치.
  21. 제19항에 또는 제20항에 있어서, Sdj = Aj + Wr*Rj + Wp* |Nd-Ndj|이고, 여기에서, Aj는 APP/DIN 스코어이고, Rj는 REL 스코어이며, Wp 및 Wr은 가중치 계수이고, Nd는 입력 문자의 문자 점들의 개수 - 1이며, Ndj는 j번째 기준 문자의 문자 점들의 개수 - 1인 수기 문자 인식 장치.
  22. 제13항에 있어서, 상기 장치와 컴퓨터 사이에 인터페이스를 제공하여 상기 인터페이스가 상기 식별된 문자를 상기 컴퓨터로 전송하여 상기 컴퓨터에 대한 명령의 일부를 형성하도록 하는 수기 문자 인식 장치.
  23. 제13항에 따른 장치를 포함하는 컴퓨터 기반 제품으로서, 상기 장치로부터 상기 컴퓨터로 명령을 전송하기 위한, 상기 장치와 상기 컴퓨터 사이의 인터페이스를 포함하는 컴퓨터 기반의 제품
KR1019940005611A 1993-03-22 1994-03-21 문자인식방법및장치 KR100308856B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IT93RM000179A IT1265673B1 (it) 1993-03-22 1993-03-22 Apparecchio e procedimento per il riconoscimento di caratteri manoscritti.
ITRM93A-000179 1993-03-22

Publications (2)

Publication Number Publication Date
KR940022338A KR940022338A (ko) 1994-10-20
KR100308856B1 true KR100308856B1 (ko) 2001-12-28

Family

ID=11401635

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940005611A KR100308856B1 (ko) 1993-03-22 1994-03-21 문자인식방법및장치

Country Status (7)

Country Link
US (1) US5757962A (ko)
EP (1) EP0617381B1 (ko)
JP (1) JPH06325212A (ko)
KR (1) KR100308856B1 (ko)
DE (1) DE69425009T2 (ko)
IT (1) IT1265673B1 (ko)
TW (1) TW321747B (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6144764A (en) * 1997-07-02 2000-11-07 Mitsui High-Tec, Inc. Method and apparatus for on-line handwritten input character recognition and recording medium for executing the method
WO1999010834A1 (en) * 1997-08-27 1999-03-04 Cybermarche, Inc. A method and apparatus for handwriting capture, storage, and ind exing
US6640337B1 (en) * 1999-11-01 2003-10-28 Koninklijke Philips Electronics N.V. Digital television (DTV) including a smart electronic program guide (EPG) and operating methods therefor
US7295193B2 (en) * 1999-12-23 2007-11-13 Anoto Ab Written command
US7298903B2 (en) * 2001-06-28 2007-11-20 Microsoft Corporation Method and system for separating text and drawings in digital ink
WO2003023696A1 (en) 2001-09-12 2003-03-20 Auburn University System and method of handwritten character recognition
AUPR824301A0 (en) * 2001-10-15 2001-11-08 Silverbrook Research Pty. Ltd. Methods and systems (npw001)
US9285983B2 (en) * 2010-06-14 2016-03-15 Amx Llc Gesture recognition using neural networks
US20130011066A1 (en) * 2011-07-07 2013-01-10 Edward Balassanian System, Method, and Product for Handwriting Capture and Storage
CN104866117B (zh) * 2015-06-02 2017-07-28 北京信息科技大学 基于图形拓扑特征进行识别的纳西东巴象形文字输入方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4773098A (en) * 1980-05-27 1988-09-20 Texas Instruments Incorporated Method of optical character recognition
DE3379611D1 (en) * 1982-04-15 1989-05-18 Toshiba Kk Pattern features extracting apparatus and method and pattern recognition system
JPS5975375A (ja) * 1982-10-21 1984-04-28 Sumitomo Electric Ind Ltd 文字認識装置
JPS63311583A (ja) * 1987-06-15 1988-12-20 Fuji Xerox Co Ltd 手書き文字認識システム
JPH01183793A (ja) * 1988-01-18 1989-07-21 Toshiba Corp 文字認識装置
US5058182A (en) * 1988-05-02 1991-10-15 The Research Foundation Of State Univ. Of New York Method and apparatus for handwritten character recognition
DE3822671A1 (de) * 1988-07-05 1990-01-11 Kromer Theodor Gmbh & Co Kg Verfahren und vorrichtung zum elektronischen vergleichen von linienzuegen
US5105468A (en) * 1991-04-03 1992-04-14 At&T Bell Laboratories Time delay neural network for printed and cursive handwritten character recognition

Also Published As

Publication number Publication date
DE69425009D1 (de) 2000-08-03
EP0617381A2 (en) 1994-09-28
KR940022338A (ko) 1994-10-20
TW321747B (ko) 1997-12-01
DE69425009T2 (de) 2001-03-08
JPH06325212A (ja) 1994-11-25
IT1265673B1 (it) 1996-11-22
ITRM930179A1 (it) 1994-09-22
ITRM930179A0 (it) 1993-03-22
US5757962A (en) 1998-05-26
EP0617381A3 (en) 1995-02-15
EP0617381B1 (en) 2000-06-28

Similar Documents

Publication Publication Date Title
US5673337A (en) Character recognition
KR100248917B1 (ko) 패턴인식장치및방법
US7653244B2 (en) Intelligent importation of information from foreign applications user interface
KR0163178B1 (ko) 중국문자를 부호화하고 해독하는 장치 및 방법
EP1630723A2 (en) Spatial recognition and grouping of text and graphics
US5923778A (en) Hierarchical representation of reference database for an on-line Chinese character recognition system
EP0539739A2 (en) Improving on-line handwriting recognition using a prototype confusability dialogue
US20060018544A1 (en) Method and apparatus for detecting an orientation of characters in a document image
JP3345224B2 (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
KR100308856B1 (ko) 문자인식방법및장치
CN111523622B (zh) 基于特征图像自学习的机械臂模拟手写笔迹方法
US5563959A (en) Character recognition
CN117152768A (zh) 用于扫读笔的离线识别方法及系统
CN115311666A (zh) 图文识别方法、装置、计算机设备及存储介质
JPH0516632B2 (ko)
EP0548030B1 (en) Character recognition
JP2956094B2 (ja) 手書き文字認識装置
JPH0830725A (ja) 画像処理装置及び方法
JP2002024765A (ja) 文字認識装置及び文字認識方法
JP5986051B2 (ja) アラビア語テキストを自動的に認識するための方法
JPH04138583A (ja) 文字認識装置
CN116129446A (zh) 基于深度学习的手写中文字体识别方法
JP2022041468A (ja) 識別方法、情報処理システム、方法、およびプログラム
JPH04336686A (ja) 手書文字認識装置
AU5196701A (en) Method and apparatuses for handwriting recognition

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20090716

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee