KR940007932B1

KR940007932B1 - 표의문자 식별장치 및 처리방법

Info

Publication number: KR940007932B1
Application number: KR1019860004393A
Authority: KR
Inventors: 씨. 몬로 제임스
Original assignee: 씨. 몬로 제임스
Priority date: 1985-06-03
Filing date: 1986-06-03
Publication date: 1994-08-29
Also published as: JPS6254364A; EP0204536A3; KR870000657A; EP0204536A2; CA1259412A

Abstract

내용 없음.

Description

표의문자 식별장치 및 처리방법

제 1 도는 표본 문자를 갖는 고전의 트레이닝 스퀘어(9개의 스퀘어)를 도시한 도면.

제 2 도는 데이트를 입력시키기 위해 사용되는 표본 키보드.

제 3 도는 본 발명에 의한 방법을 사용한 시스템의 기본 동작을 나타낸 도면.

* 도면의 주요부분에 대한 부호의 설명

32 : 제 1 획의 모양에 대한 레지스터 34 : 제 1 획의 크기에 대한 레지스터

36 : 제 1 획의 시작 위치에 대한 레지스터

38 : 획 카운트에 대한 레지스터 40 : 제 2 획의 모양에 대한 레지스

42 : 제 2 획의 크기에 대한 레지스터 44 : 문자정의 레지스터

46 : 탐색논리회로 48 : 문자 정의 표시기

50 : 문자 형태 라이브러리 52 : 문자 출력 장치

중국어는 표의 문자(ideographic character)를 사용하는 몇몇 언어중 하나로서 알파벳으로 이루어져 있지 않으며 비선형적이고, 개개의 문자가 단일 의미의 워드를 구성하고 있다. 이러한 중국어에는 35,000개 이상의 문자가 존재한다. 또한, 많은 중국어는 두개 이상의 문자 결합에 의하여 형성된다. 중국어 문자에 있어서 각 문자는 다수의 기입 획(stroke)으로 이루어지며, 그 획의 수는 통상 1 내지 26개이다.

기입획은 통상 마크나 라인으로 형성되는데, 그 마크나 라인은 기입면으로부터 필기 도구를 떼지 않고 쉽게 쓸수 있다. 또한, 중국어 문자에는 거의 40개의 각각의 획모양이 있다. 그 40개의 획모양은 크기 변화에 따라 82개까지 획 형태의 수가 늘어난다.

프린팅을 하기 위해 타이프라이터나 컴퓨터 베이스 워드 프로세서등의 수단에 의해 중국어를 인코팅시키기 위한 몇가지 시도가 있어 왔다. 이러한 시스템으로부터 입, 출력 데이타를 제공하기 위한 시도에 있어서, 여러가지 방법이 사용되어 왔다. 이러한 방법은 불가능해 보이는 산더미같은 문자 파라미터를 다룰 수 있는 정리된 정보의 양으로 간단하게 하는데 치중을 두었다.

간소화 노력의 역사적인 예가 중국어의 "간소화 문자"에서 볼수 있다. 이러한 시스템에서, 통상 사용되는 문자는 20획에서 16 또는 18획까지 감소하게 된다.

다른 간소화 시스템의 한예는 거의 1세기전에 고안된 중국어 전신 시스템이다. 전산 시스템에서는, 전체 중국어로부터 선택된 9,999개의 문자로 이루어지며, 각각에는 인식 번호가 할당되어 선택되었다. 이러한 문자 시스템에서, 오퍼레이터는 이와 같은 문자 라이브러리(character library)의 번호를 기억 해야만 한다. 이러한 시스템의 한가지 단점은 전체의 새로운 정보세트가 개발되어야 한다는 것이다. 그러므로, 이러한 시스템에서는 오퍼레이터용의 작업 지식이 필요하다. 상기 시스템의 또 다른 단점은 전체적인 관지에서 그것이 발췌 시스템이라는 것이다. 상기 시스템의 발췌성 분석에 있어서, 인식 수와 문자의 인지 및 분류를 쉽게하는 의도된 문자의 수용 기능 사이에 어떠한 연계성이 없다는 것이다. 또한, 문자의 수를 제한함으로서 의사 소통에 있어서 언어의 뉘앙스, 활력(vigor), 의미 차이, 정도 및 음색이 한정되는 시스템에서의 문제점에 발생하였다. 이러한 특성은 무시한다면, 언어는 광범위한 스펙트럼 통신에 수용할 수 없는 미숙한 상태에까지 이르게 된다.

좀더 근대화된 시스템을 이용하여 "근본적인"인식에 의해 기존의 중국어에 대한 조사를 간단하게 컴퓨터화하기 위한 노력이 있었다. 오퍼레이터 처리량(operator through-put)은 증가시키기 위한 노력으로, 어근(radical)을 간략하게 하거나 그 수를 감소시켜 왔다. 어근은 중국어 문자의 고유한 부분이기는 하지만, 어근과 다른 획을 조합함으로서 중국어 문자를 형성하기 위한 모든 시도는 실패하였다. 왜냐하면, 이러한 형태의 의도된 문자에 대한 검색이 필연적으로 소망되는 정확한 문자를 얻는 동안 지루하고 산만하여, 시간 소모가 필연적이므로 오퍼레이터 출력은 기껏해야 분당 10 내지 15워드 만을 메뉴로부터 선택하여 처리할 수 있을 뿐이기 때문이다.

간소화 노력은 획 레벨에 대해서도 행해졌다. 그러한 몇가지 시도는 14나 더 작은 수까지 "기본"획의 수를 감소하였다. 하지만 이것은 효과에 있어서, 언어에 대하여 기계를 수용하기 보다는 언어를 기계에 수용시키는 방향으로 되었다. 이러한 형태의 간소화 작업은 오퍼레이터로 하여금 로마어를 배우도록 요구하며 언어의 개정된 규칙에 따라 중국어를 다시 매우도록 하고, 오퍼레이터 작업부분에서 수용 및 선택에 필요한 부수적인 코드를 기억하여 사용하게 된다.

워드프로세싱 사용을 위해 중국어를 음성 기호로 나타내기 위한 시도가 몇가지 있었다. 일반적으로 이러한 노력은 넘을 수 없는 장애로 인하여 실패하였다. 그 한예로서, 중국어에 있어서의 많은 동음이의어 부분으로 인한 장애가 있다. 다른 장애는 중국내의 다른 그룹에 의해 상이한 발음에서 연유한다. 예를 들면, 공식화된 표준 중국어로 쓰거나 읽지만 매우 다르게 발음하는 많은 그룹의 사람(300,000의 광동사람)들이 있다.

그러므로, 로마어의 워드프로세서나 컴퓨터로 실행되는 바와 비교할 만한 처리량 속도로 표의 문자를 인코드 및 디코드하는 표의 문자 처리 방법을 갖는 것이 바람직하다. 그러한 표의 문자 처리는 (가) 전체 문자 스펙트럼으로부터 임의의 문자를 제거 및 변경하지 않아야 하고, (나) 언어의 능력을 제한하지 않아야 하며, (다) 언어 시스템 자체의 영역을 부족하게 하지 않아야 하고, (라) 외국어, 발췌코드 또는 복잡한 절차를 배우지 않고서 이루어질 수 있어야 한다. 중국어 문자가 과거나 현재에도 의식주의로 흐르는 구조, 형식, 및 특정한 방식으로 가르쳐 졌다는 것은 주지의 사실이다. 중국어는 언어를 쓰기 위한 배움의 목적으로 트레이닝 스퀘어(training square)를 사용한다. 그 트레이닝 스퀘어는 9개의 부스퀘어(sub-square)로 나누어지며 각 부스퀘어는 다시 9개의 부-부스퀘어 (sub-sub-square)로 나누어진다.

이와 같은 기본적인 자리 및 배분 가이드로서 트레이닝 스퀘어를 사용하여, 문자를 획의 형태, 즉, 획 크기, 획 모양, 획 위치, 획 순서 및 획수의 여러가지로 가르쳐진다. 그 결과 모든 학식있는 중국인들은 커다란 특성을 가지고 각각의 문자가 적절히 형성된 정확한 방법 및 순서를 직관적으로 알수 있게 된다. 각 문자는 문자에 있어서의 모든 다른 획과 각각 특별한 위치적 관계를 가지고 특유하고 통상적이며 표준 순서로 쓰여진 정확한 수의 획을 갖는다.

각각의 문자에 대한 획 입력의 연속성은 선형 언어의 문자 입력 순서만큼이나 엄격하다.

그러므로, 학식있는 중국인은 문자, 각 획이 쓰여진 정밀하고 표준적인 연속성과 그 정확한 위치를 형성하는 획 수를 1 : 81 정도로 정밀하게 알 수 있다. 또한 학식있는 중국인은 모양 및 크기에 의해서 각 획의 시작, 종료, 동일성 및 종류를 알수 있다.

본 발명은 복잡한 중국어를 읽는데 있어서 신속하게 감지되고 해독되는 프로세서를 사용하여 특유한 효율성을 갖는 언어 처리기를 얻을 수 있게 하는 것이다. 그러므로, 모든 중국어 문자에는 하부 시각 구조 법칙이 있다. 간소화된 시각 패턴인지 식별방식으로 칭하는 이러한 법칙을 사용하여, 각 획을 시각적으로 추적할 필요없이 우측 형태의 작용에 의해 각각 알고 있는 문자를 인지할 수 있다. 이러한 간소화한 시각 패턴인지 식별 방식은 사람눈의 자연 생리현상 및 시력 활동을 충분히 활용하는 훌륭하게 구성된 가장 발전된 방식이다.

시력에 대한 복잡한 눈운동의 기본은 브리태니카 백과사전 제 7 권 사람 눈과 시력, 보다 상세히는 페이지 99-100(Macropa edia)에 상세히 기술되어 있다. 선형 로마어 시스템 보다 훨씬 능가하는 효과로 작용하는 눈의 생리 현상 및 시력활동르 사용하는 중국어 시각 조작은 중국어 문자에 있어서 유일하고 예외적인 것이다. 중국어 기록 구조의 전 시스템은 이러한 획기적인 시각 인코딩, 디코딩 시스템을 따른다. 그러므로 간소화한 시각 패턴인지 식별 방식은 복잡성에 관계없이 각각의 공지 문자를 순간적으로 인식할 수 있다.

눈이 어떻게 中과 같은 간단한 문자의 획을 조사하거나 고도로 복잡한 이미지 묘사를 개입시키지 않고서 인식할 수 있는가를 아는 것은 용이하다. 그러나 國과 같은 11획이나 讓과 같은 24회의 문자에 있어서 눈은 복잡한 시각 해독 및 지루한 눈운동에 의해서만 이해되는 것처럼 보이는 명백한 미로의 형식으로 나타난다. 그러나 실행에 있어서, 복잡한 문자는 가장 간단한 문자만큼 쉽게 인지된다. 또한 한번 배우면, 복잡한 문자의 인식은 간단한 문자보다 많은 시간, 눈운동 및 시각적 노력을 필요로 하지 않는다.

중국어 문자는 트레이닝 스퀘어내에 있는 획의 모양, 순서, 위치, 및 크기에 의해 특징 지워지는 기록 획에 의해 가르쳐졌다. 이러한 임의의 획 파라미터를 사용하면, 중국어 문자를 컴퓨터 사용 및 워드프로세싱에 적용될 수 있다. 그러므로, 눈에 의한 자연 시각적 인코딩 및 디코딩 프로세서가 쉽게 컴퓨터로 이전될 수 있다.

이러한 문자는 1 내지 26의 획수에 의해 문자 라이브러리로 분할된 데이타 베이스로 인입될 수 있다. 이들 라이브러리(libraries)는 서로 다른 크기를 가지지만 3,500 멤버 이상의 것은 없다.

또한, 문자는 실례로 첫번째 획을 사용하여 획 순서로 분할될 수 있다. 모든 획은 제한되며, 주어진 라이브러리내의 부-계층(sub-hierarchy)은 전체멤버의 1/7 이상을 갖는다. 즉, 3500-500이 된다.

초기 획의 시작점을 사용하면, 중국어 트레이닝 스퀘어에 결정되는 초기 획의 위치는 500개의 라이브러리를 175개의 가능한 목표 문자 라이브러리 이하로 감소시킨다. 9개의 부스퀘어에서, 획을 정의하는 9개의 부-부스퀘어는 175개의 가능한 타겟 문자를 90개 이하로 감소시킨다.

동일한 프로세스를 사용하여, 두번째 획으로 모든 문자중 98% 이상이 순간적으로 유일하게(uniquely) 인식된다.

그와 같은 두개의 획에 의해 정의되지 않은 문자는 세번째 획의 기입(실례로, 둘째 음질의 획) 또는 완전한 문자를 이루는 획수와 같은 제 3의 인식 특성에 의해 전형적으로 정의된다.

동일한 특정의 인식 프로세스는 일반적으로 임의의 획의 임의의 다른 획에 대한 형태-공간관계를 사용하게 하며, 획의 시작 위치뿐만 아니라 종료 위치를 포함한다.

본 발명의 방법을 실행하기 위한 장치에 있어서, 키보드가 제공되며, 오퍼레이터는 각 획의 모양을 인식하기 위한 키와, 각 획의 크기를 측정하기 위한 다른 키와, 문자를 이루는 최종 획을 인식하는 키와, 문자를 이루는 획수(1 내지 26)를 인식하기 위한 키와, 각각의 처음 및 마지막 획의 시작 위치(1 내지 81)를 정의하는 키를 친다(strike). 이러한 것을 모든 문자중 98% 이상을 인식하는데 필요한 모든 정보가 된다. 이와 같은 인식 정보는 단일의 리스트(wrist) 획 시퀀스로 모든 핑거(fingers)를 이용하여 동시에 인입될 수 있다. 남아있는 2%의 해독되지 못한 문자는 추가의 리스트 획으로 인식되는데, 이는 두번째 또는 마지막 전의 획과 같은 적어도 한개의 추가의 획으로 완전히 정의한다.

그러므로, 키보드된 정보는 키보드된 것과 동일한 처음 및 마지막 획을 가지며 동일한 전체 획 카운트를 갖는 동일한 단일 문자가 정보가 입력되는 때는 언제든지 유출될 수 있도록 기억된 획의 정의 및 획의 카운트 레지스터와 비교된다. 기억된 획의 정보 및 획의 카운트를 키잉(keying)하는 것은 각 문자에 대한 완전한 정의가 되어, 완전히 형성된 문자가 CRT 상에 또는 다른 영상 디스플레이 장치상에 디스플레이 되거나 프린터(도트 매트릭스, 레이저 또는 잉크-제트 프린터)로 전송될 수 있다. 시스템은 공지된 색인지정(indexing) 기술에 제공될 수 있으며 이를 통하여 정의된 문자가 신속히 검색되어 갓아 동시 궤환이 성공적인 부합(match)을 나타내게 하거나, 또는 오퍼레이터에게 실례로 추가의 리스트 획등의 더 많은 정보가 필요하다는 것을 알리도록 한다.

이러한 장치 및 방법은 전통적으로 수용되고 직관적인 언의의 지식을 활용하는 장점을 가지며, 동양 문자를 가르치며 훈련하는데 완전한 문자 셋으로 신속한 액세슬르 제공하는 완전한 정확도를 활용하는 장점을 갖는다. 상기 장치 및 방법의 다른 명백한 장점은 어떠한 외국어의 필요성도 요구되지 않고, 어떠한 낮설고 편협한 음성 시스템도 배울 필요가 없다는 것이며, 충분한 언어력, 언어범위를 가지고 아름다움, 효율성으로 실행할 필요가 없으며, 곡해될 수 있는 언어의 간략화가 발생되지 않는다는 점이다.

본 발명의 특징이 되는 장점을 갖는 키보드(입력-보드)는 로마어에 상응하는 시스템 및 오퍼레이터에 의해 얻을 수 있는 속도를 초과하는 속도에서 필요한 데이타가 입력될 수 있게 한다. 부가적으로, 상기 장치 및 방법이 이미 몸에 익숙한 기술 및 지식을 활용하기 때문에 트레이닝 시간이 짧으며, 순차적으로 선형적인 언어 시스템을 요구사지 않는다.

본 발명에 의한 실시예는 중국어(한자)에 특히 적합한 장치와 방법에 관해 언급될 것이다. 또한, 본 발명이 일본어 및 한국어를 포함한 표의 문자를 갖는 다른 언어에 동등하게 적용된다는 것을 쉽게 이해할 수 있을 것이다.

설명을 쉽게 하기 위해, 9개의 부스퀘어로 분할된 중국어 트레이닝 스퀘어(training square)는 다음 처럼 명명된다. 즉, 중앙부, 북쪽중앙부, 남쪽중앙부, 북동부, 동쪽중앙부, 남동부, 북서부, 서쪽중앙부, 남서부이다.

대부분의 문자는 북쪽중앙부, 북서부 또는 서쪽중앙부의 부스퀘어에서 시작하는 제 1 획에서 시작되어 북동부, 동쪽중앙부, 남동부 또는 남쪽중앙부 부스퀘어에서 시닥되는 마지막 획으로 종료된다. 많은 응용에서 제 1 획 및 마지막 획을 조합하는 방법을 사용하는 것이 바람직한데, 상기 방법은 동시의 위치 입력에 따라 적은 퍼센트의 전체 중국어 문자 세트를 제외하고는 모두를 상세히 인식하고 완전하게 정의한다.

제 1 도는 제 1 의 획(10), 다음의 획(12) 및 최종의 획(16)을 포함하는 문자의 예를 갖는 예전의 트레이닝 스퀘어(9개의 스퀘어)를 나타내고 있다. 도시된 문자는 "참다"에 대한 중국어(한자)의 표의 문자이다. 상기 문자는 ① 번호(14)로 지시되는 부-부스퀘어(부-부스퀘어 1로서 언급될 수도 있다)에서 시작되고, ② 인식된 모양 및 크기를 갖는 회로(큰 직각)을 이루며, ③ 중간 크기의 수직 획과 ④ 상기 수직 획으로 정의되어 인식된 최종획과, 마지막으로 ⑤ 6의 획 카운트를 삽입하는 바와 같이 획(10)을 정의함으로써 유일하게 인식될 수 있다. 이들 기준에 대응하는 정보를 삽입시키므로써, 문자는 유일하게 정의되어 인식되며, 전체의 중국어 문자 셋으로부터 유출된다.

제 2 도는 제 1 도의 언급된 데이타를 입력시키기 위해 사용되는 표본 키보드를 나타낸다. 제 1 입력소자(20)는 첫번째 획(번호(14)의 부스퀘어)에 대한 정확한 시작위치를 나타내는데 사용된다. 두개의 획의 형태를 갖는 키보드(22 및 24)는 문자상의 좌측 및 우측 변화에 대한 두개의 키를 갖는 44개의 문자를 수용하는 각 키보드에 제공된다. 5×5 문자의 키보드 매트릭스는 단일 키 획을 갖는 모든 44개의 문자를 형성할 수 있다. 그다음 완전한 89개의 문자 세트가 문자 형태의 키보드에 바로 인저반 문자 크기 키보드를 선택함으로써 규정되는데, 키보드(26)는 키보드(22)에 관련되고, 키보드(28)는 키보드(24)에 관련된다. 여러개의 키보드를 적당히 배열하여 시작 위치에 대해 1 핑거(finger)를, 문자 형태에 대해서는 1 또는 2 핑거를 크기에 대해서는 1 핑거를 사용하므로써, 양쪽 리스트(wrist)에 의한 단일 획으로서 완전한 중국러 문자가 정의될 수 있다(단일 획은 여러개의 키를 동시에 누름으로써 속기용 오퍼레이터에 의해 실행된다).

제 3 도에는 본 발명을 사용하는 시스템의 완전한 획이 실행될대까지 키 정보를 기억하며, 상기 레지스터에는 카운트에 대한 레지스터(38)와, 제 1 획의 모양에 대한 레지스터(32)와, 제 1 획 크기에 대한 레지스터(34)와, 제 1 획 시작위치에 대한 레지스터(36)와, 제 2 획에 대한 레지스터(40)와, 제 2 획의 크기에 대한 레지스터(42)와, 제 2 획 시작 위치에 대한 레지스터(39)가 포함된다. 각 레지스터가 각 레지스터내로 인입된 정보를 가질때, 그 정보는 문자 정의 레지스터(44)로 인입되며, 탐색 논리회로(46)에 입력된다. 탐색 논리 회로는 획 카운트, 처음과 마지막 획의 시작위치 및 처음과 마지막 획의 모양과 크기가 35,000 문자 셋이상의 각각의 유일한 문자를 일치시키는 번호와 더불어 검색되는 문자 정의 라이브러리(character definition library)를 참조한다.

탐색논리 회로는 문자 정의 레지스터가 35,000개의 문자중 특정의 하나를 확인하는 번호를 포함하는 것으 결정하자마자 오퍼레이터에게 문자가 성공적으로 정의 되었다는 것을 알리는 신호가 문자 정의 표시기(48)에 출력된다. 추가의 획이 문자를 형성하는데 필요한 경우에, 키는 동일한 방법으로 눌려져 즉시 또는 순차적으로 문자사에 복귀된다.

문자 표시기가 작동됨과 동시에, 탐색 논리회로는 확인된 문자 형태 라이브러리(50)로 확인된 문자에 대응하는 번호를 출력시킨다. 문자 형태 라이브러리(50)는 35,000자 각각의 문자에 대한 모든 획(반드시 최초 및 최종획은 아님)을 포함하는 완전한 문자 정의를 포함한다. 다음에 향성된 문자 정보가 문자 출력 장치(52)로 출력되는데, 상기 출력 장치는 완전한 문자를 표시하기 위한 프린터, 디스플레이 스크린 또는 이와 유사한 장치이다. 문자 출력 장치는 워드프로세싱중에 소정의 문자가 선택되었는가를 확인하는데 사용되며, 또한 프린팅 중에 완전한 문자의 세부를 충실히 재생시키는데 사용된다.

본 발명의 표의 문자 언어에 있어서 규정된 속기의 영상 패턴 판별기를 가지고 있기 때문에, 상기 판별기의 입력은 종래 "키의 획(key strokes)"으로 제한되는 것이 아니라 일련의 X-Y 픽셀점(pixel point)을 통해 입력될 수도 있다. 여기에 언급된 발명은 몇몇의 키나 모든 키를 대체하기 위해 마우스, 조이스틱 또는 철핀(stylus)과 같은 포인팅 장치의 다수의 유용한 상태중에서 어떠한 사용에도 적합하다. 손바닥 크기의 픽셀판은 언급된 키보드로 대체될 수 있으며, 동양에서의 사용을 위해 사용자에게 외국어를 배우게 할 필요없이, 단순히 상기 장치를 비-중국어 모드로 이동시켜 요구되는 로마문자를 추적하게 함으로써 로마-중국어 조합 워드프로세서의 중국어 텍스트내에 로마문자를 삽입하는데 활용될 수 있다.

본 기술에 대한 지식은 컴퓨터 및 교육용 기기에 설명된 방법을 적용시킬수 있다는 것을 쉽게 알도록 해 준다. 중국문화에 초보적인 사람들 조차도 중국어 문자를 배운다는 것은 음성으로 그리고 영상으로 디스플레이되는 형태의 사전 정보로의 순간적인 액세스를 통하여 지시 및 적용시간을 감소시킴으로써, 상당히 쉬어지고 매우 광범위해질 것이다.

본 발명의 시스템은 전체의 중국어 문자 셋을 이용할 수 있도록 기술되었으며, 간략화된 문자 셋으로 약 11,000자의 문자에도 동등하게 적용될 수 있다.

알수 있는 바와 같이, 워드프로세서 조작키, 컴퓨터 조작키와 학습장치 제어 및 조작키가 수직 및 수평 프린팅, 회수, 보정, 변형, 마진 공간, 모드, 크기, 삽입 및 다른 배열 명령에 필요한 보조관리 조작을 이루기 위해 종래대로 또는 픽셀형태로 사용될 수 있다.

Claims

다수의 획(multiple strokes)으로 형성된 표의 문자의 인코딩 및 디코딩 방법으로, 공지된 총 획의 카운트를 가지며, 획의 시작 위치와 획의 모양을 포함하고 유일한 획의 정의(unique stroke definition)를 규정하는 적어도 하나의 선택된 획에 대한 공지 된 특성을 갖는 표의 문자 인코딩 및 디코딩 방법에 있어서, 각각의 검색가능한 문자에 대하여 문자 라이브러리(library)의 모든 표의 문자를 규정하도록 문자획의 카운트, 제 1 획의 시작 위치, 제 1 획의 모양 정의 및 적어도 제 2 획의 모양 정의를 기억장치에 인입하는 문자 인코딩 단계와, 획의 카운트, 획의 정의, 획의 시작 위치 및 제 2 획의 정의를 입력하는 문자 디코딩 단계와, 인식된 획을 문자 정의 라이브러리에 기억된 정보와 비교하는 단계, 및 상기 입력된 정보로부터 완전한 표의 문자를 인식하는 단계를 구비하는 것을 특징으로 하는 표의 문자 인코딩 및 디코딩 방법.
획의 모양, 크기, 순서 및 대응 위치의 인식에 의해 전범위의 한자를 인코딩하는 방법에 있어서, 81개의 스퀘어 매트릭스로 이루어진 스퀘어내에 제 1 획의 위치를 설정하는 문자 인코딩 단계, 및 적어도 최종 획의 모양과 크기에서 끝나는 획의 모양과 크기 인코딩 단계를 구비하는 전범위의 한자 인코딩 방법.
표의 문자 식별장치에 있어서, 제 1 획의 모양 및 위치를 나타내는 신호와 적어도 제 2 획의 모양 및 위치를 나타내는 신호를 제공하고, 동일한 획의 특성을 갖는 제한된 배열의 문자를 인식하기 위해 상기 신호를 기억된 문자중 선택된 축적 문자내의 대응하는 획을 나타내는 기억신호의 라이브러리와 비교함으로써 표의 문자를 인식하는 수단을 구비하는 것을 특징으로 하는 표의 문자 식별장치.
완전한 표의 문자 정의를 유도하기 위한 방법에 있어서, 제 1 선택 획에 대한 획 모양, 획 크기, 획 순서, 획 시작 위치 및 획 종료위치와, 획 카운트를 구비하는 획 특성군으로부터 선택된 특성을 인식하는 단계와, 상기 선택된 특성군으로부터 제 2 선택 획의 적어도 하나의 특성을 인식하는 단계, 및 유출되어질 특정 문자를 포함하는 하나이상의 문자를 구비하는 문자열을 발생하기 위하여 제 2 선택 획의 특성에 역시 합체되는 문자에 대하여 상기 제 1 선택 획의 인식된 획 특성에 합체하는 모든 문자를 검색하는 단계를 구비하는 것을 특징으로 하는 완전한 표의 문자 정의 유도방법.
제 4 항에 있어서, 유출되어질 문자의 추가의 획 특성을 인식하는 단계와, 상기 추가의 획 특성을 단일 문자가 유일하게 정의될때까지 상기 문자열의 획 특성에 비교하는 단계를 더 구비하는 것을 특징으로 하는 것을 특징으로 하는 완전한 표의 문자 정의 유도방법.
제 5 항에 있어서, 유출된 완전한 단일 문자를 표시하는 선택된 중국어 문자에 대한 완전한 문자 정의를 기억시키는 단계를 더 포함하는 것을 특징으로 하는 완전한 표의 문자 정의 유도방법.