KR100232975B1 - 문자 인식 장치 및 그 방법과 컴퓨터 제어 장치 - Google Patents

문자 인식 장치 및 그 방법과 컴퓨터 제어 장치 Download PDF

Info

Publication number
KR100232975B1
KR100232975B1 KR1019960045584A KR19960045584A KR100232975B1 KR 100232975 B1 KR100232975 B1 KR 100232975B1 KR 1019960045584 A KR1019960045584 A KR 1019960045584A KR 19960045584 A KR19960045584 A KR 19960045584A KR 100232975 B1 KR100232975 B1 KR 100232975B1
Authority
KR
South Korea
Prior art keywords
strokes
stroke
character
dictionary
input
Prior art date
Application number
KR1019960045584A
Other languages
English (en)
Other versions
KR970022832A (ko
Inventor
히로또 요시이
쯔네까즈 아라이
에이지 다까스
Original Assignee
미다라이 후지오
캐논 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 미다라이 후지오, 캐논 가부시끼가이샤 filed Critical 미다라이 후지오
Publication of KR970022832A publication Critical patent/KR970022832A/ko
Application granted granted Critical
Publication of KR100232975B1 publication Critical patent/KR100232975B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Character Discrimination (AREA)

Abstract

본 발명의 목적은 메모리 용량 및 인식 시간을 증가시키지 않고 하나의 스트로크로서 다수의 스트로크가 연속적으로 입력된 문자를 올바르게 인식할 수 있는 문자 인식 장치, 그 방법 및 컴퓨터 제어 장치를 제공하는데 있다.
이러한 목적을 위해, 입력된 스트로크수가 카운트되고 카운트된 스트로크수의 딕셔너리 내의 문자와의 매칭의 결과, 양호한 결과를 얻지 못했을 때 카운트된 스트로크의 수보다 보다 큰 스트로크수의 딕셔너리 내의 패턴과 매칭을 행하여 매칭 결과에 따라 입력된 스트로크의 인식 결과를 결정한다.

Description

문자 인식 장치 및 그 방법과 컴퓨터 제어 장치{CHARACTER RECOGNIZING APPARATUS AND ITS METHOD AND COMPUTER CONTROL APPARATUS}
본 발명은 입력된 스트로크의 특징에 따라 문자를 인식하는 문자 인식 장치 및 그 방법과 컴퓨터 제어 장치에 관한 것이다.
종래, 디지타이저 등의 좌표 입력 장치를 사용하여 입력된 문자의 인식에 있어서, 프린트 핸드 문자(정규의 기입 방법)가 아닌 연속 형태의 문자 혹은 약자와 같은 수기 문자를 인식할 수 있는 문자 인식 장치가 있다. 이러한 형태의 장치에서는 정규의 기입 방법에 따른 문자 정보 외에 연속적인 형태의 문자 및 약자의 문자 정보를 메모리 매체 등에 기억된 인식을 위한 딕셔너리 내에 기억시켜 이 딕셔너리 내에 기억된 문자 정보와 입력된 수기 문자의 정보를 비교하여 입력된 문자를 인식하고 있다.
예를 들면, 도 10에 도시한 바와 같이 2 이상의 스트로크가 연속적으로 기입되지 않는 프린트 핸드 문자 문자 패턴(1010)이 포함된 4 스트로크의 딕셔너리에 본래 프린트 핸드 문자에 의해 기입될 때 5 스트로크로 기입되는 문자 패턴(1020)의 연속적인 형태의 문자의 패턴(1021)의 특징을 유지함으로써, 스트로크<3> 및 <4>가 문자 패턴(1021)과 같이 연속적으로 기입되고 문자 패턴(1010)이 문자 패턴(1021)의 스트로크<3'>와 같이 4 스트로크의 연속적인 형태의 문자로서 입력된 경우라도, 문자 패턴(1020)의 것과 동일한 문자 코드가 인식 결과로서 출력될 수 있다.
인식 속도를 떨어뜨리지 않고 약자 및 연속적인 형태의 문자를 인식하기 위해, 프린트 핸드 문자(정규의 기입 방법)용 딕셔너리 및 약자 혹은 연속적인 형태의 문자(비정규의 기입 방법)용 딕셔너리를 별도로 마련해 두고, 먼저 프린트 핸드 문자용 딕셔너리를 사용하여 입력된 문자를 매칭하고, 인식 결과가 좋지 않을 때는 약자 혹은 연속적인 형태의 문자용 딕셔너리에 기억된 문자와 입력된 문자를 매칭하는 방법도 있다.
그러나, 약자 혹은 연속적인 형태의 문자 모두가 인식될 수 있도록 하기 위해 약자 혹은 연속적인 형태의 문자 모두에 대응하는 문자를 딕셔너리에 기억시키는 구성으로 하면, 딕셔너리의 메모리 용량은 프린트 핸드 문자만의 딕셔너리의 메모리 용량과 비교할 때 현저하게 증가한다. 게다가, 다양한 패턴으로 입력된 문자에 맞출 필요성이 있어서 장시간의 인식 시간이 걸리고 인식 처리의 처리 속도가 저하되는 문제점이 있다. 특히, 온라인 수기 문자의 인식의 경우에서는 프린트 핸드 문자가 입력될 확률 및 약자 혹은 연속적인 형태의 문자가 입력될 확률이 거의 동일하여 사전에 이들 중 어느 하나를 우선적으로 인식시키면 인식율이 극단적으로 저하하는 문제가 있다.
본 발명은 상기한 문제를 고려하여 이루어진 것이며, 그 목적은 메모리 용량 및 인식 시간을 증가시키지 않고 프린트 핸드 문자 및 약자 혹은 연속적인 형태의 문자를 인식할 수 있는 문자 인식 장치 및 그 방법과 컴퓨터 제어 장치를 제공하는 것이다.
도 1은 일실시 형태의 문자 인식 장치의 구성을 나타내는 블럭도.
도 2는 일실시 형태의 CPU(203)의 제어에 의해 실행되는 기능의 구성을 나타내는 기능 블럭도.
도 3은 실시 형태의 처리 흐름을 나타내는 플로우챠트.
도 4A 내지 4C는 실시 형태의 플러스 스트로크수 매칭 유닛(103)에서의 매칭 방법을 설명하기 위한 다이어그램.
도 5A 내지 5C는 실시 형태의 다른 구성에 따른 플러스 스트로크수 매칭 유닛(103)에서의 매칭 방법을 설명하기 위한 다이어그램.
도 6은 실시 형태의 설정 메뉴의 구성을 나타내는 다이어그램.
도 7은 실시 형태의 다른 구성에 따른 설정 메뉴의 구성을 나타내는 다이어그램.
도 8은 실시 형태의 처리 흐름을 위한 프로그램이 기억되어 있는 FD의 메모리 맵의 구조를 나타내는 도면.
도 9는 실시 형태를 적용할 수 있는 영문자의 일례를 나타내는 도면.
도 10은 프린트 핸드 문자 패턴(print hand character pattern) 및 약자 혹은 연속 형태의 문자 패턴의 설명도.
<도면의 주요 부분에 대한 부호의 설명>
101 : 매칭 유닛
103 : 매칭 유닛
104 : 인식 조정 유닛
201 : 좌표 입력 장치
201a : 디지타이저
201b : 펜
202 : 디스플레이
203 : CPU
204 : 메모리
204a : ROM
204b : RAM
205 : FDD
206 : HDD
206a : 인식용 딕셔너리
이하, 도면을 참조하여 본 발명의 양호한 실시 형태에 대하여 상세히 설명한다.
도 1은 실시 형태의 문자 인식 장치의 구성을 나타내는 블럭도이다.
도면 참조 번호(201)는 디지타이저(201a) 및 펜(201b)으로 구성된 좌표 입력 장치이다. 문자 혹은 도형의 좌표 데이타가 디지타이저(201a) 상에 펜(201b)에 의해 입력될 수 있다. 입력된 좌표 데이타는 CPU(203)의 제어에 의해 디스플레이(202)에 의해 표시될 수 있다. 도면 참조 번호(202)는 CRT 등의 디스플레이를 포함하는 디스플레이이다. 디스플레이(202)는 입력 장치(201)에 의해 입력된 문자 혹은 도형의 좌표 데이타, 혹은 CPU(203)의 제어에 의해 메모리(204) 등으로부터 판독되는 문자 데이타를 표시한다.
도면 참조 번호(205)는 FDD(플로피 디스크 드라이브)이다. FD는 FDD로 로드되며 데이타는 FD로 기입되고 FD로부터 판독된다. 이것은 후술하는 처리 흐름(도 3)의 프로그램을 로드된 FD(도시 생략)로 기입하고, 장치의 RAM(204b)내의 프로그램을 판독함으로써 처리 실행이 가능하다. 실시 형태 1에서는 이러한 프로그램이 ROM(204a) 내에 기억되고, 후술하는 처리 흐름(도 3)이 CPU(203)의 제어에 의해 실행된다. 본 발명은 FDD(205)에 제한되지 않으며 이것이 프로그램을 기억할 수 있는 CD-ROM, MO 등과 같은 외부 메모리 매체가 로드되고 데이타를 판독 및 기입할 수 있는 드라이브이기만 하면 상술한 것과 유사한 기능이 실행될 수 있다.
도면 참조 번호(206)는 디지타이저(201a)로부터 입력된 문자를 인식하기 위한, 후술하는 인식용 딕셔너리(206a)를 내부에 갖는 HDD(하드 디스크 드라이브)이다. 인식용 딕셔너리(206a)는 대용량의 데이타를 저장할 수 있는 HD(하드 디스크) 등의 메모리 매체에 기억된다.
도면 참조 번호(203)는 입력된 문자를 인식하기 위한 CPU를 나타내며 다양한 제어를 실행한다. 도면 참조 번호(204)는 ROM(204a) 및 RAM(204b)으로 구성된 메모리를 나타낸다. CPU(203)에 의해 문자 인식에 사용되는 인식 프로그램 및 다양한 제어 프로그램은 ROM(204a) 내에 기억된다. 문자, 문자 코드 등의 폰트 정보도 ROM(204a) 내에 기억된다. RAM(204b)은 HDD(206)에 내장된 HD(도시 생략)에 기억된 딕셔너리로부터 판독된 데이타, 입력된 좌표 데이타, 및 인식 프로그램에 의해 사용되는 변수 등의 데이타를 일시적으로 기억하는 영역 혹은 다양한 데이타의 작업 영역이다.
이것은 또한 CPU(203)가 통신 라인(도시 생략)을 통해 실시 형태를 실행하는데 필요한 프로그램, 딕셔너리 및 다양한 파라미터를 입력하여 RAM(204b)에 기억시키고 처리를 실행하는 방식으로 구성하는 것도 가능하다.
도 2는 실시 형태에 따라 CPU(203)의 제어에 의해 실행되는 기능의 구성을 나타내는 기능 블럭도이다.
매칭 유닛(101; 동일한 스트로크수)이 먼저 CPU(203)의 제어에 의해 작동된다. 디지타이저(201a)로부터 입력된 문자 데이타에 대하여, 입력된 문자를 구성하는 스트로크의 수가 펜(201b)의 업/다운 정보에 의해 카운트된다. 입력 문자 데이타와 카운트된 스트로크수와 동일한 스트로크수의 딕셔너리 데이타간의 매칭이 행해진다. 매칭의 완료 후에, 매칭 검증 유닛(102)이 작동되어 매칭 결과가 양호한지의 여부를 알아 보기 위해 검증한다. 매칭 결과가 양호하면, 인식 조정 유닛(104)이 작동되어 인식 결과로서 조정 결과를 출력한다. 매칭 결과가 양호하지 못하면, 플러스 스트로크수 매칭 유닛(다른 스트로크수; 103)[이하, 간단히 매칭 유닛(103)이라 한다]가 작동되고 입력된 스트로크(이하, 입력 스트로크라고 한다)수와 동일하거나 그 이상의 소정의 스트로크수까지의 각 스트로크수에서의 딕셔너리 데이타와 입력 문자 데이타간의 매칭을 순차적으로 실행한다. 소정의 스트로크수까지의 매칭의 완료 후에, 인식 조정 유닛(104)이 작동되고 입력 스트로크의 수로부터 소정의 스트로크수의 각 스트로크수의 매칭 결과 중에서 최적의 매칭 결과를 결정하여 결정된 최적의 매칭 결과를 인식 결과로서 출력한다.
이하, 도 3의 플로우챠트를 참조하여 실시 형태의 처리 흐름에 대하여 설명한다.
도 3은 실시 형태의 처리 흐름을 나타내는 플로우챠트이다.
단계 S300에서, 특정한 스트로크수를 포함하는 문자가 펜(201b)을 사용하여 디지타이저(201a)로 입력된다. 단계 S301에서는 CPU(203)의 제어에 의해 매칭 유닛(101)이 작동되어, 입력 스트로크의 특징으로서의 스트로크 정보와 딕셔너리에 유지된 스트로크 정보(이하, 딕셔너리 스트로크라 한다)를 스트로크 단위, 부분 패턴, 문자 단위, 혹은 문자열 단위로 매칭한다.
매칭 방법으로서는 입력 스트로크의 순서 및 딕셔너리(206a)에 유지된 딕셔너리 스트로크의 순서를 1 대 1 대응 방식으로 매칭할 수 있고 혹은 이들 순서를 무시하고 모든 스트로크에 대하여 매칭을 행할 수도 있다.
입력 스트로크의 수와 동일한 스트로크수의 딕셔너리 스트로크는 매칭 유닛(101)에 의해 사용되는 딕셔너리(206a)에 유지되어 있다. 동일한 스트로크수의 스트로크 정보로서는 프린트 핸드 문자(정규 기입 방법)를 구성하는 스트로크의 정보와 함께, 예를 들면 사용 빈도가 높은 약자 혹은 연속적인 형태의 문자(비정규 기입 방법)를 구성하는 스트로크의 정보를 기억시킬 수도 있다. 이 경우, 약자 혹은 연속적인 형태의 문자의 스트로크 정보가 딕셔너리(206a) 내에 포함되어 있으므로, 약자 혹은 연속하는 형태의 문자에 대한 인식율이 이 시점에서 어느 정도 확보될 수 있다.
단계 S302에서, 매칭 유닛(101)에 의한 매칭이 완료되었을 때, 매칭 검증 유닛(102)이 작동되어 매칭 유닛(101)의 매칭 결과를 판정한다. 매칭 결과가 양호한 것으로 판정된 경우[단계 S302에서의 예(Yes)], 매칭 결과가 RAM(204b)에 기억되고 단계 S307로 진행한다. 매칭 결과가 양호하지 못한 것으로 판정된 경우[단계 S302에서 아니오(No)], 매칭 결과가 RAM(204b) 속에 기억되고 단계 S303으로 진행한다.
매칭 결과의 판정 방법으로서는, 예를 들면 매칭 유닛(101)의 결과로서 인식될 문자의 후보 문자의 관련 확율이 소정의 임계값 이상인지의 여부를 체크하여 매칭 결과를 판정한다. 예를 들면, RAM(204b) 내에 파라미터로서 기억되는 80%의 임계값을 설정하고 후보 문자의 관련 확율이 80%와 동일하거나 그 이상일 때 그 매칭 결과는 양호하다고 판정한다. 통상 약자 혹은 연속적인 형태의 문자가 프린트 핸드 문자보다 고속으로 기입되므로 입력 스트로크의 수가 많으면, 임계값을 크게 설정하고 입력 스트로크의 수가 적으면 임계값을 작게 설정하는 방식으로 구성하는 것도 가능하다. 이 경우, 스트로크수 마다의 임계값을 서로에 대응하여 RAM(204b) 내의 파라미터 기억 유닛으로 테이블로서 기억시켜 판정시에 사용하는 방식으로 구성하는 것도 가능하다. 테이블 내의 값들은 사용자에 의해 갱신될 수 있다.
또한, 예를 들면 임계값을 다음의 선형 함수로 표현될 식에 의해 결정할 수도 있다.
임계값 = 60 + 2 × (입력 스트로크의 수)
이 경우, 20 스트로크 이상의 문자를 입력하면, 무조건적으로 매칭 유닛(101)의 매칭 결과가 나쁜 것으로 판정되게 된다.
본 발명은 상기한 식에 의해 표시한 입력 스트로크의 수에 대한 선형 함수를 사용하여 임계값을 설정하는 방법에 한정되지 않으며 스트로크수에 대한 임의의 증가 함수(단조 증가로 제한될 필요는 없다)를 사용할 수 있다.
입력 스트로크의 수 외에, 입력 스트로크의 기입 시간, 입력 스트로크의 기입 속도 등을 사용하여 함수의 파라미터의 하나로서, 입력 스트로크의 기입 시간 혹은 기입 속도로 인해 변화되는 임계값을 용이하게 설정할 수 있다.
단계 S302에서의 매칭 결과가 좋지 않으면, 약자 혹은 연속적인 형태의 문자로 스트로크가 입력된 가능성이 있다. 따라서, 후속 처리 단계에서 매칭 대상의 스텝에서 스트로크의 수를 증가시켜 인식 처리를 실행한다.
단계 S303에서는 하나의 스트로크를 입력 스트로크의 수(i)에 추가시켜 스트로크수(i=양의 정수)를 갱신한다. 단계 S304에서는 갱신된 스트로크수(i)가 소정의 스트로크수(n) 보다 큰지(n=정의 정수: n>i)의 여부를 알아보는 검사가 행해진다. (n)의 값으로서는 RAM(204b)에 기억된 파라미터가 사용된다. 스트로크수(i)가 소정의 스트로크수(n)보다 클 경우[단계 S304에서 예(Yes)], 단계 S306으로 진행한다. 스트로크수(i)가 소정의 스트로크수(n) 이하이면[단계 S304에서 아니오(No)], 단계 S305로 진행한다. 단계 S305에서는 매칭 유닛(103)이 작동되고 갱신된 스트로크수(i)와 동일한 스트로크수의 딕셔너리(206a)에 유지된 딕셔너리 스트로크를 스트로크 단위, 부분 패턴 단위, 문자 단위, 혹은 문자열 단위로 매칭한다. 단계 S303 내지 S305까지의 처리는 스트로크수(i)가 소정의 스트로크수(n)에 이를 때까지 순차적으로 반복된다. 각 스트로크수(i)가 갱신될 때마다 얻어지는 매칭 결과는 순차적으로 RAM(204b) 내에 기억된다.
소정의 스트로크수(n)의 상한은, 예를 들면 매칭 검증 유닛(102)에 의해 설정되는 임계값과 유사한 방식으로 입력 스트로크의 스트로크수, 기입 시간, 혹은 기입 속도의 함수로서 결정된다.
단계 S305의 매칭 유닛(103)에서의 매칭 방법은, 예를 들면 입력된 스트로크의 순서 및 딕셔너리(206a)에 유지된 딕셔너리 스트로크의 순서를 1 대 1 대응하는 방법으로 매칭하거나 이들 순서를 무시하고 전체 스트로크에 대하여 매칭할 수 있다. 특히, 약자 혹은 연속하는 형태의 문자가 입력되고 어떤 스트로크가 생략되어 있는지에 대한 명백한 경향이 없는 경우에는, 도 4A 내지 4C를 참조하여 후술되는 매칭 방법을 행하는 것이 바람직하다.
도 4A 내지 4C는 실시 형태의 매칭 유닛(103)에서의 매칭 방법을 설명하기 위한 도면이다.
후술하는 바와 같이 실시 형태를 설명하기 위한 샘플로서, 2개의 스트로크가 도 4A에 도시하는 바와 같이 연속적으로 기입된 문자가 도 4B에 도시된 딕셔너리 패턴 대신에 사용된다. 그러나, 도 9에 도시한 딕셔너리 내의 패턴(92) 및 입력된 패턴(91)에 대하여 유사한 처리가 행해질 수 있다.
예를 들면, 도 4A에 도시된 바와 같이 펜(201b)에 의해 기입된 입력 스트로크로 구성되는 문자가 연속적인 형태의 문자이고 그 문자의 위치 구성을 갖는 입력 패턴과 기입 순서(1 내지 4)에 대하여 도 4B에 도시된 바와 같은 딕셔너리(206a)에 기억되어 있는 프린트 핸드 문자의 문자를 구성하는 딕셔너리 스트로크(1 내지 5)의 위치 구성을 가진 딕셔너리 패턴과 기입 순서에 대하여 매칭이 행해진다. 이 경우의 매칭 방법은, 도 4C에 각 직선 라인에 의해 매칭될 타켓을 표시한 바와 같이 입력 스트로크의 각 입력 순서(<1> 내지 <4>)에 대하여 각각 4B도에 도시한 딕셔너리 스트로크(<1> 내지 <5>)에 대하여 매칭이 실행된다. 도 4C에 도시된 숫자는 입력 스트로크의 입력 순서와 딕셔너리 스트로크의 입력 순서이며 매칭이 행해질 조합을 하나의 스트로크를 나타내는 숫자를 연결하는 성분으로 나타내고 있다. 이 경우는 입력 스트로크의 각 순서와 딕셔너리 스트로크의 모든 순서간의 매칭을 행하는 매칭 방법을 나타내고 있다.
일반적으로, 입력 스트로크에 의해 구성되는 문자 혹은 문자열의 입력 순서가 역순인 입력 스트로크가 생략되는 경향이 있다고 가정하면, 예를 들면 도 5C에 도시한 바와 같이 입력 순서가 최소인 쪽으로의 입력 스트로크에 대해서는, 요컨대 입력 스트로크의 제1 및 제2 스트로크는 각각 딕셔너리 스트로크의 제1 및 제2 스트로크의 동일한 스트로크수와 매칭을 행하고, 그후의 입력 스트로크의 제3 및 제4 스트로크는 딕셔너리 스트로크의 각 스트로크수와 매칭을 행하는 방식으로 매칭을 행할 수 있다.
단계 S306에서는 RAM(204b)에 기억된 매칭 유닛(101)에서의 매칭 결과와 매칭 유닛(103)의 각 스트로크수(i)에서의 매칭 결과로부터 최적의 매칭 결과가 결정된다.
단계 S306에서의 결정 방법으로서는 매칭 유닛(101)에서의 매칭 결과와 매칭 유닛(103)의 각 스트로크수(i)에서의 매칭 결과 중에서 가장 양호한 결과의 매칭 결과에 대응하는 문자를 인식 문자로 한다. 또한 소정의 바이어스값을 매칭 유닛(101)의 매칭 결과와 매칭 유닛(103)의 매칭 결과에 각각 가산하여 최종의 가산된 매칭 결과를 기초로 하여 가장 양호한 매칭 결과에 대응하는 문자를 인식 문자로서 선택하는 방식으로 구성할 수 있다.
일반적으로, 문자 혹은 문자열을 고속으로 기입한 경우 그 문자가 약자 혹은 연속적인 형태의 문자일 가능성이 높아서, 요컨대 매칭 유닛(103)의 결과가 올바른 가능성이 높게 된다. 한편, 문자 혹은 문자열이 느리게 기입된 경우에는 그 문자가 프린트 핸드 문자로 기입될 가능성이 높아서, 즉 매칭 유닛(101)의 결과가 올바를 가능성이 높다. 따라서, 특히 소정의 바이어스값을 가산하여 얻어진 매칭 결과로부터의 최적의 매칭 결과를 결정하는 방법에 있어서는 스트로크수, 기입 시간, 기입 속도 등의 문자 또는 문자열의 특징을 나타내는 지표(index)를 더 사용하여 소정의 바이어스값을 적절히 변경해도 좋다.
단계 S307에서는 결정된 최적의 매칭 결과에 대응하는 문자의 폰트 정보 및 문자 코드를 ROM(204a)으로부터 판독하여, 인식 결과로서 예를 들면 디스플레이(202)로 출력한다.
상기 플로우챠트에서 설명된 문자 인식은 사용자에 따라서는 프린트 핸드 문자로 문자를 기입하는 사람이 있는가 하면, 연속하는 형태의 문자로 문자를 기입하는 사람이 있다. 예를 들면, 실시 형태의 매칭 유닛(103)의 결과가 인식 결과로서 프린트 핸드 문자를 기입한 사용자에게 출력된 경우에, 잘못되어 있는 경우가 많다. 한편, 실시 형태의 매칭 유닛(101)의 매칭 결과가 인식 결과로서 연속적인 형태의 문자를 기입하는 사용자에게 출력된 경우에 잘못되어 있는 경우가 많다.
따라서, 상술한 플로우챠트에서 설명된 임계값과 바이어스값은 사용자가 펜(201b) 등을 사용하여 좌표 입력 장치에 의해 명령을 입력함으로써, 예를 들면, 도 6 혹은 도 7에 도시한 설정 메뉴를 디스플레이(202) 상에 표시하여 설정된 메뉴에 따라서 사용자가 자유롭게 RAM(204b) 내의 파라미터 기억 유닛 속으로 프레임(61 내지 66)에 입력되는 임계값 또는 바이어스값을 새롭게 설정가능하게 구성할 수 있다. 이러한 방법에 의해, 문자 인식의 인식율이 사용자의 요구에 더 매치되며 향상될 수 있다. 설정 메뉴는 그 작동 프로그램을 예를 들면 ROM(204a)에 기억시켜 두고 사용자의 조작에 의해 디스플레이(202) 상에 표시시키는 구성에 의해 용이하게 실현될 수 있다.
도 6에서는 임계값의 설정 항목으로서, 예를 들면 임계값의 디폴트값을 설정하는 "디폴트값" 항목(도 6에서는 디폴트값=60), 매칭 유닛(103)에서 임계값을 결정하기 위한 기준이 되는 문자의 특징을 나타내는 지표(예를 들면, 스트로크수, 기입 시간, 기입 속도)를 설정하는 "인크리멘트 지표" 항목(도 6에서는 인크리멘트 지표=스트로크수), 및 지표의 값을 한번에 소정값씩 갱신하기 위한 수를 설정하는 "인크리멘트 도수" 항목(도 6에서는 인크리멘트 도수=2)를 제공함으로써, 사용자의 취향에 따라 임계값을 설정할 수 있다.
한편, 바이어스값의 설정 항목으로서, 매칭 유닛(101)의 매칭 결과 및 매칭 유닛(103)의 매칭 결과에 가산되는 바이어스값의 디폴트값을 설정하는 "디폴트값" 항목[도 6에서는 2:1의 비율로 매칭 유닛(103)의 매칭 결과 및 매칭 유닛(101)의 매칭 결과에 인크리멘트 도수를 바이어스값으로서 가산한다], 매칭 유닛(103)에서 임계값을 결정하기 위한 기준이 되는 문자의 특징을 나타내는 지표(예를 들면, 스트로크수, 기입 시간, 기입 속도)를 설정하는 "인크리멘트 지표" 항목(도 6에서는 인크리멘트 지표=기입 속도), 및 스트로크수가 갱신될 때마다 바이어스값을 설정하는 "인크리멘트 도수" 항목(도 6에서는 인크리멘트 도수=0.1)를 제공함으로써, 사용자의 취향에 따라 임계값을 설정할 수 있다.
임계값은 도 7에 도시된 설정 메뉴를 사용하여 설정될 수 있다.
도 7의 설정 메뉴는, 예를 들면 문자가 프린트 핸드 문자로 기입된 경우와 문자가 연속적인 형태의 문자로 기입된 경우를 문자 인식의 지표로서 설정하는 방식으로 구성된 설정 메뉴이다. 도 7에 도시한 바와 같이, 사용자는 노브(knob; 701)를 조작함으로써 프린트 핸드 문자와 연속적인 형태의 문자간의 인식율을 자유롭게 설정할 수 있다. 극단적으로 약자 혹은 연속적인 형태의 문자를 기입하는 사용자에 대해서는 실시 형태 1에서의 매칭 유닛(101, 103)의 작동 순서를 교체하기 위한 모드를 사용자가 설정할 수 있도록 "반드시 프린트 핸드 문자를 기입하지 않는다"라는 메뉴가 제공된다. 체크 버튼(702)를 검사함으로써 사용자는 매칭 유닛(101, 103)의 작동 순서를 교체할 수 있다.
도 6 및 도 7은 설정 메뉴의 예인데, 본 발명은 이것들에 한정되지 않는다. 예를 들면 사용자의 응용에 따라 다양한 설정 메뉴를 제공하거나 이들을 적절하게 설정하는 것이 가능하다.
상술한 실시 형태에 따르면, 프린트 핸드 문자 및 약자 혹은 연속적인 형태의 문자를 인식하기 위해, 매칭 유닛(동일한 스트로크수)(101) 및 매칭 유닛(다른 스트로크수)(103)이 제공되며, 입력 스트로크와 딕셔너리 내의 스트로크간의 매칭 결과가 판정되고, 매칭 유닛(101, 103)이 판단 결과에 따라 선택적으로 사용됨으로써 문자를 인식할 수 있다. 따라서, 약자 혹은 연속적인 형태의 문자용 인식 딕셔너리를 제공할 필요가 없으므로, 메모리 매체에 약자 혹은 연속적인 형태의 문자용 인식 딕셔너리를 제공하지 않고 단지 프랜트 핸드 문자용 인식 딕셔너리만을 제공하여 프린트 핸드 문자 및 약자 혹은 연속적인 형태의 문자를 인식할 수 있다. 프린트 핸드 문자 및 약자 혹은 연속적인 형태의 문자의 인식 조건이 사용자의 기입 방식의 특징에 따라 적절히 설정될 수 있기 때문에 문자 인식의 인식율 및 처리 속도가 향상될 수 있다.
FDD의 기능 혹은 방법의 기능에 의해 달성되는 본 발명의 목적은 상술한 실시 형태를 실현하기 위한 프로그램이 기억되어 있는 FD 등의 메모리 매체에 의해 달성될 수도 있다. 즉, 상기 FDD에 메모리 매체를 장착하고 상기 메모리 매체로부터 판독된 프로그램 자체가 본 발명의 신규한 기능을 달성하기 때문이다. 이러한 목적을 위한 본 발명에 따른 상기한 프로그램의 구조적 특징이 도 8에 도시되어 있다.
이 실시 형태의 제어를 실현하기 위해, FD는 5개의 모듈로 구성되어 있다. 즉, 도면에 도시된 바와 같이, 딕셔너리(1011), 카운트 모듈(1012), 제1 비교 모듈(1013), 제2 비교 모듈(1014), 및 결정 모듈(1015)의 5개 모듈이다. 메모리 매체에 기억되는 모듈들에 따라서, 도 8에 도시한 바와 같이, "카운트", "제1 비교", "제2 비교", 및 "결정"의 단계 S1002 내지 단계 S1005의 순서에 따라 처리를 실행한다. 메모리 매체에 기억되는 각 모듈 중에서, 카운트 모듈(1012)에서 실행되는 "카운트"(단계 S1002)는 도 3의 플로우차트의 단계 S301에 대응한다.
제1 비교 모듈(1013)에서 실행되는 "제1 비교"(단계 S1003) 처리는 도 3의 플로우챠트의 단계 S302에 대응한다. 제2 비교 모듈(1014)에서 실행되는 "제2 비교"(단계 S1004) 처리는 도 3의 플로우챠트의 단계 S303 내지 S305에 대응한다. 결정 모듈(1015)에서 실행되는 "결정"(단계 S1005)는 도 3의 플로우챠트의 단계 S306 및 단계 S307에 대응한다.
본 발명은 복수의 장비로 이루어진 시스템 혹은 하나의 장비를 포함하는 장치에 적용될 수 있다. 본 발명이 프로그램을 시스템 혹은 장치에 제공함으로 구현되는 경우에 적용될 수 있음은 자명하다. 이 경우에, 본 발명에 따른 프로그램이 기억되는 메모리 매체는 본 발명을 구성한다. 메모리 매체로부터 그 프로그램을 시스템 혹은 장치로 판독함으로써 시스템 혹은 장치가 소정의 방법으로 동작한다.

Claims (30)

  1. 입력된 스트로크의 특징을 기초로 하여 문자를 인식하기 위한 문자 인식 장치에 있어서,
    표준 문자를 구성하는 스트로크의 특징을 기억하기 위한 딕셔너리,
    상기 입력된 스트로크의 수를 카운트하기 위한 카운터 수단,
    상기 입력된 스트로크의 특징과 상기 딕셔너리에 기억되어 있는, 상기 카운터 수단에 의해 카운트된 스트로크의 수와 동일한 수의 표준 문자의 스트로크의 특징을 비교하기 위한 제1 비교 수단,
    상기 제1 비교 수단의 결과 일치율이 소정의 값보다 작을 때, 상기 입력된 스트로크의 특징과 상기 딕셔너리에 기억되어 있는 동일한 스트로크수를 가진 상기 스트로크의 스트로크수보다 스트로크수가 큰 스트로크의 특징을 비교하기 위한 제2 비교 수단, 및
    상기 제1 및 제2 비교 수단의 결과를 기초로 하여 입력된 스트로크로 구성된 문자를 결정하기 위한 결정 수단
    을 구비하는 것을 특징으로 하는 문자 인식 장치.
  2. 제1항에 있어서, 상기 제2 비교 수단은, 상기 스트로크수에 소정의 수가 가산될 때마다 얻어져서, 상기 딕셔너리에 기억된 각각의 수의 스트로크 특징과 입력된 상기 스트로크의 특징을 순차 비교하고, 상기 소정의 수를 가산함으로써 얻어진 스트로크수가 소정의 스트로크수에 도달할 때까지 상기 비교를 반복하는 것을 특징으로 하는 문자 인식 장치.
  3. 제1항에 있어서, 상기 제1 비교 수단은 상기 입력된 스트로크의 특징과 상기 딕셔너리에 기억되어 있는, 상기 카운터 수단에 의해 카운트된 스트로크수와 동일한 스트로크수의 모든 표준 문자의 스트로크의 특징을 비교하는 것을 특징으로 하는 문자 인식 장치.
  4. 제1항에 있어서, 상기 딕셔너리는 상기 표준 문자의 표준 기입 순서에 따라서 상기 표준 문자를 구성하는 스트로크의 특징을 기억하는 것을 특징으로 하는 문자 인식 장치.
  5. 제1항에 있어서, 상기 제1 비교 수단은 상기 입력된 스트로크의 특징과 상기 딕셔너리에 기억되어 있는, 상기 카운터 수단에 의해 카운트된 스트로크수와 동일한 스트로크수를 갖고 있고 상기 입력된 스트로크의 입력 순서의 소정의 순서까지는 상기 입력 순서와 동일한 순서를 갖고 있는 스트로크의 특징을 비교하고, 상기 소정의 순서 이후에는, 상기 입력된 스트로크의 특징과 상기 딕셔너리에 기억되어 있는, 상기 카운터 수단에 의해 카운트된 스트로크수와 동일한 스트로크수를 가진 스트로크의 특징을 비교하는 것을 특징으로 하는 문자 인식 장치.
  6. 제1항에 있어서, 상기 소정의 값은 상기 입력된 스트로크의 수가 적어도 변수로서 사용되는 함수에 의해 얻어지는 값인 것을 특징으로 하는 문자 인식 장치.
  7. 제1항에 있어서, 상기 소정의 값은 상기 입력된 스트로크의 입력 시간이 적어도 변수로서 사용되는 함수에 의해 얻어지는 값인 것을 특징으로 하는 문자 인식 장치.
  8. 제1항에 있어서, 상기 소정의 값은 상기 입력된 스트로크의 입력 속도가 적어도 변수로서 사용되는 함수에 의해 얻어지는 값인 것을 특징으로 하는 문자 인식 장치.
  9. 제1항에 있어서, 상기 소정의 값은 상기 입력된 스트로크의 정보가 변수로서 사용되는 증가 함수에 의해 얻어지는 값인 것을 특징으로 하는 문자 인식 장치.
  10. 제1항에 있어서, 상기 결정 수단은 상기 입력된 스트로크의 특징이 상기 제1 및 제2 비교 수단에서 비교 대상으로서 사용되는 상기 딕셔너리 내의 스트로크의 특징과 일치하는 비율 중에서 가장 높은 비율을 가진 비교 대상에 대응하는 문자를인식 결과로서 결정하는 것을 특징으로 하는 문자 인식 장치.
  11. 제1항에 있어서, 상기 결정 수단은 소정의 바이어스값을 상기 제1 및 제2 비교 수단 각각에 의해 얻어진 비교 결과의 각각에 가산하기 위한 가산 수단을 갖고, 상기 입력된 스트로크로 구성된 문자를 상기 가산 수단에 의해 얻어진 새로운 결과를 기초로 하여 결정하는 것을 특징으로 하는 문자 인식 장치.
  12. 제11항에 있어서, 상기 바이어스값을 설정하기 위한 설정 메뉴를 표시하기 위한 표시 수단을 더 구비하는 것을 특징으로 하는 문자 인식 장치.
  13. 제1항에 있어서, 상기 제2 비교 수단에 의한 비교가 실행되고 있는지의 여부를 판단할 때 소정의 값을 설정하기 위한 설정 메뉴를 표시하기 위한 표시 수단을 더 구비하는 것을 특징으로 하는 문자 인식 장치.
  14. 제1항에 있어서, 상기 스트로크를 입력하기 위한 태블릿(tablet)을 더 구비하는 것을 특징으로 하는 문자 인식 장치.
  15. 제1항에 있어서, 상기 스트로크는 펜다운(pen-down) 내지 펜업(pen-up)으로부터의 정보인 것을 특징으로 하는 문자 인식 장치.
  16. 입력된 스트로크의 특징을 기초로 하여 문자를 인식하기 위한 문자 인식 방법에 있어서,
    상기 입력된 스트로크의 수를 카운트하는 카운팅 단계,
    상기 입력된 스트로크의 특징과 표준 문자를 구성하는 스트로크의 특징이 딕셔너리에 기억되어 있는, 상기 카운팅 단계에 의해 카운트된 스트로크의 수와 동일한 스트로크수의 상기 표준 문자의 스트로크의 특징을 비교하는 제1 비교 단계,
    상기 제1 비교 단계의 결과 일치율이 소정의 값보다 작을 때, 상기 입력된 스트로크의 특징과 상기 딕셔너리에 기억되어 있는, 동일한 수의 스트로크수 보다 스트로크수가 큰 스트로크의 특징을 비교하는 제2 비교 단계, 및
    상기 제1 및 제2 비교 단계의 결과를 기초로 하여 상기 입력된 스트로크로 구성된 문자를 결정하는 결정 단계
    을 포함하는 것을 특징으로 하는 문자 인식 방법.
  17. 제16항에 있어서, 상기 제2 비교 단계는, 상기 스트로크수에 소정의 수가 가산될 때마다 얻어지서, 상기 딕셔너리에 기억된 각각의 수의 스트로크의 특징과 입력된 상기 스트로크의 특징을 순차 비교하여, 상기 소정의 수를 가산함으로써 얻어진 스트로크수가 소정의 스트로크수에 도달할 때까지 상기 비교를 반복하는 것을 특징으로 하는 문자 인식 방법.
  18. 제16항에 있어서, 상기 제1 비교 단계는 상기 입력된 스트로크의 특징과 상기 딕셔너리에 기억되어 있는, 상기 카운팅 단계에서 카운트된 스트로크수와 동일한 스트로크수의 모든 표준 문자의 스트로크의 특징을 비교하는 것을 특징으로 하는 문자 인식 방법.
  19. 제16항에 있어서, 상기 딕셔너리는 상기 표준 문자의 표준 기입 순서에 따라서 상기 표준 문자를 구성하는 스트로크의 특징을 기억하는 것을 특징으로 하는 문자 인식 방법.
  20. 제16항에 있어서, 상기 제1 비교 단계는 상기 입력된 스트로크의 특징과 상기 딕셔너리에 기억되어 있는, 상기 카운팅 단계에서 카운트된 스트로크수와 동일한 스트로크수를 갖고 있고 상기 입력된 스트로크의 입력 순서의 소정의 순서까지는 상기 입력 순서와 동일한 순서를 갖고 있는 스트로크의 특징을 비교하고, 상기 소정의 순서 이후에는 상기 입력된 스트로크의 특징과 상기 딕셔너리에 기억되어 있는, 상기 카운팅 단계에서 카운트된 스트로크수와 동일한 수의 스트로크의 모든 특징을 비교하는 것을 특징으로 하는 문자 인식 방법.
  21. 제16항에 있어서, 상기 소정의 값은 상기 입력된 스트로크의 수가 적어도 변수로서 사용되는 함수에 의해 얻어지는 값인 것을 특징으로 하는 문자 인식 방법.
  22. 제16항에 있어서, 상기 소정의 값은 상기 입력된 스트로크의 입력 시간이 적어도 변수로서 사용되는 함수에 의해 얻어지는 값인 것을 특징으로 하는 문자 인식 방법.
  23. 제16항에 있어서, 상기 소정의 값은 상기 입력된 스트로크의 입력 속도가 적어도 변수로서 사용되는 함수에 의해 얻어지는 값인 것을 특징으로 하는 문자 인식 방법.
  24. 제16항에 있어서, 상기 소정의 값은 상기 입력된 스트로크의 정보가 변수로서 사용되는 증가 함수에 의해 얻어지는 값인 것을 특징으로 하는 문자 인식 방법.
  25. 제16항에 있어서, 상기 결정 단계는 상기 입력된 스트로크의 특징이 상기 제1 및 제2 비교 단계에서 비교 대상으로서 사용되는 상기 딕셔너리 내의 스트로크의 특징과 일치하는 비율 중에서 가장 높은 비율을 가진 비교 대상에 대응하는 문자를 인식 결과로서 결정하는 것을 특징으로 하는 문자 인식 방법.
  26. 제16항에 있어서, 상기 결정 단계는 소정의 바이어스값을 상기 제1 및 제2 비교 단계에서 얻어진 비교 결과의 각각에 가산하기 위한 가산 단계를 갖고, 상기 입력된 스트로크로 구성된 문자를 상기 가산 단계에서 얻어진 새로운 결과를 기초로 하여 결정하는 것을 특징으로 하는 문자 인식 방법.
  27. 제26항에 있어서, 상기 바이어스값을 설정하기 위한 설정 메뉴를 표시하기 위한 표시 단계를 더 포함하는 것을 특징으로 하는 문자 인식 방법.
  28. 제16항에 있어서, 상기 제2 비교 단계에 의한 비교가 실행되고 있는지의 여부를 판단할 때 소정의 값을 설정하기 위한 설정 메뉴를 표시하기 위한 표시 단계를 더 포함하는 것을 특징으로 하는 문자 인식 방법.
  29. 제16항에 있어서, 상기 스트로크를 태블릿에 의해 입력하는 단계를 더 포함하는 것을 특징으로 하는 문자 인식 방법.
  30. 제16항에 있어서, 상기 스트로크는 펜다운 내지 펜업으로부터의 정보인 것을 특징으로 하는 문자 인식 방법.
KR1019960045584A 1995-10-12 1996-10-12 문자 인식 장치 및 그 방법과 컴퓨터 제어 장치 KR100232975B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP95-263919 1995-10-12
JP7263919A JPH09106439A (ja) 1995-10-12 1995-10-12 文字認識装置及びその方法及びコンピュータ制御装置

Publications (2)

Publication Number Publication Date
KR970022832A KR970022832A (ko) 1997-05-30
KR100232975B1 true KR100232975B1 (ko) 1999-12-01

Family

ID=17396098

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960045584A KR100232975B1 (ko) 1995-10-12 1996-10-12 문자 인식 장치 및 그 방법과 컴퓨터 제어 장치

Country Status (3)

Country Link
JP (1) JPH09106439A (ko)
KR (1) KR100232975B1 (ko)
CN (1) CN1094221C (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110796917A (zh) * 2018-08-02 2020-02-14 义守大学 一种电脑化写字评估与训练方法
JP7298341B2 (ja) * 2019-06-28 2023-06-27 株式会社リコー 電子情報ボード、電子情報ボードシステム及びそれらの制御方法、プログラム

Also Published As

Publication number Publication date
CN1094221C (zh) 2002-11-13
JPH09106439A (ja) 1997-04-22
CN1155127A (zh) 1997-07-23
KR970022832A (ko) 1997-05-30

Similar Documents

Publication Publication Date Title
US5022081A (en) Information recognition system
US5586198A (en) Method and apparatus for identifying characters in ideographic alphabet
US6795579B2 (en) Method and apparatus for recognizing handwritten chinese characters
US7283126B2 (en) System and method for providing gesture suggestions to enhance interpretation of user input
US6986106B2 (en) Correction widget
US20030099398A1 (en) Character recognition apparatus and character recognition method
CN1205528C (zh) 计算机系统中提供提示的方法
US8015203B2 (en) Document recognizing apparatus and method
US5699455A (en) Information processing method and apparatus
US5828783A (en) Apparatus and method for input-processing hand-written data
US6922811B1 (en) Chinese character encoding input method and its input apparatus
EP1421696A2 (en) Component-based, adaptive stroke-order system
CN102866826A (zh) 一种字符输入方法及其装置
US6724936B1 (en) Handwriting input device and method using a single character set
US6697524B1 (en) Information processing method and apparatus
JPS60263256A (ja) 習熟度機能付き計算機
KR100232975B1 (ko) 문자 인식 장치 및 그 방법과 컴퓨터 제어 장치
US5991440A (en) Method and apparatus for recognizing input handwritten characters associated with title information
KR100320062B1 (ko) 손으로쓴입력표시장치
JP3153704B2 (ja) 文字認識装置
JPH10143501A (ja) 文字列予測方法及びこの文字列予測方法を用いた文書作成装置
JPS60217483A (ja) 文字認識装置
JPH0816571A (ja) 漢字入力装置
JP2003022417A (ja) 文字列認識装置
JPH10320107A (ja) 手書き文字認識機能を有する手書き文字入力装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130828

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20140826

Year of fee payment: 16

LAPS Lapse due to unpaid annual fee