JPH03502841A - character recognition device - Google Patents

character recognition device

Info

Publication number
JPH03502841A
JPH03502841A JP1500666A JP50066688A JPH03502841A JP H03502841 A JPH03502841 A JP H03502841A JP 1500666 A JP1500666 A JP 1500666A JP 50066688 A JP50066688 A JP 50066688A JP H03502841 A JPH03502841 A JP H03502841A
Authority
JP
Japan
Prior art keywords
code
character
primitive
primitives
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1500666A
Other languages
Japanese (ja)
Inventor
ロー,シュー チャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of JPH03502841A publication Critical patent/JPH03502841A/en
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/17Image acquisition using hand-held instruments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • G06V30/373Matching; Classification using a special pattern or subpattern alphabet

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。 (57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 文字認識装置 (技術分野) 本発明は文字を識別する装置および方法(関する。[Detailed description of the invention] character recognition device (Technical field) The present invention relates to an apparatus and method for identifying characters.

(背景技術) 非英語国と西欧猪国間の貿易は劇的に拡大してきたので、コミエニケーシ璽ンの 重要性が増大してきた0例えば、過去において、英語国および漢字国間で通信す る時には、漢字国で受取られた英語で書かれた文書は、まず第一に政府の翻訳セ ンターへ転送される。そこで文書は翻訳されて、手で漢字に書き直され、最後に 文書の宛先へ配達される。翻訳された文書への返答が用意されると、その返答は 政府の翻訳センターで漢字から英語に翻訳され、英語国通信先へ転送される。し かしながら、英語から漢字へおよびその逆に書1!直すために翻訳者を使用する ことは、通俗の過程に重大な遅延tもたらすという点で問題があった・ このような難点を克服する九めに、漢字の表意文字を表示するキーを備え次タイ プライター装置が開発された。(Background technology) Trade between non-English and Western European countries has expanded dramatically, leading to For example, in the past, communication between English countries and Kanji countries has increased in importance. When a document written in English is received in a Kanji country, it must first be sent to the government's translation center. transferred to the center. There the document was translated, rewritten by hand into Kanji, and finally The document is delivered to its destination. Once a response to a translated document is prepared, the response is It is translated from kanji to English at the government's translation center and forwarded to the correspondent in the English country. death However, from English to Kanji and vice versa, calligraphy 1! Use translator to fix This was problematic in that it caused serious delays in the popular process. The ninth step to overcome this difficulty is to have a key that displays the ideograms of the kanji. A plyter device was developed.

この装置Fi、漢字に熟達し、タイプライタ−を使用する能力のあるオペレータ を雇用することによって、漢字で書かれた文書のハードコピーを作り出すことが できる。This device is equipped with an operator who is proficient in kanji and capable of using a typewriter. It is possible to produce hard copies of documents written in kanji by employing can.

しかしながら、漢字は51000 個以上の異なる表意文字を含んでいるので、 タイプライタ−装置VCは多数のキーが必要となるという点で問題がある0機能 キーを使用することによって、必要なキーの数を減少させるため、この種の装置 の改良が導入されたが、しかし上述した問題は未だ残っている。その上、タイプ ライタ−装置を使用する時には、キーボード装置を十分に使いこなす方法全習得 する几めに、オペレータに対して広範囲のトレーニングが要求され、その過程は 費用がかかりかつ時間を費やすという点で別の問題が残る。However, since Kanji contains over 51,000 different ideograms, Typewriter device VC has 0 functions that are problematic in that it requires a large number of keys. This type of device reduces the number of keys required by using keys. improvements have been introduced, but the problems described above still remain. Besides, type When using a writer device, learn how to fully use the keyboard device. This requires extensive training for operators, and the process is Another problem remains in that it is expensive and time consuming.

キーボード装置を使用する時に遭遇する問題を克服する友めに、手書きの表意文 字を受取りかつ識別する表意文字検出装置が開発された0本装置は、表意文字が 入力装置に書かれることおよび書かれた文字であることが必要であジ、表意文字 で書く人が誰でも使用する典型的な線素である予め決められた基本的線素すなわ ちプリミティブ(語根)によシ形成されることを必要とする。表意文字が装置内 に入力され念後に、装置は入力された表意文字の形成するプIJ ミティプ11 べて、入力されたプリミティブを索引テーブルのP3容と比較する。索引テーブ ルは、ユーザの手書きの多種多様さく対応するため、各々の予め決められた複数 の変化したプリミティブを記憶する。テーブルに記憶された各プリミティブが多 種多様である友め、文字を形成しているプリミティブは通常、装置によって決め られる。テーブルはまた、表意言語において各々の文字全形成するために使用さ れる数組のプリミティブも記憶する。入力された文字を形成している数組のプリ ミティブが索引テーブル内の数組のブリミテイブの1つと一致した場合、数組の プリミティブと組合せた出力コードが生成されて出力装置に伝えられる。これは 入力された表意文字のハードコピーイメージが形成されるのを可能にする。しか しながら、テーブルに記憶された各プリミティブが多種多様であるために、装置 の処理速度が非常に低下し、それが5J!時間通用を不適当にするという点で問 題がある。A handwritten ideogram for your friend who overcomes the problems encountered when using keyboard devices. An ideograph detection device has been developed that receives and identifies ideograms. Ideographic characters must be written on an input device and must be written characters. A predetermined basic line element that is a typical line element used by anyone writing in It needs to be formed from a primitive (word root). Ideographic characters are in the device After inputting the input ideograms, the device generates the input ideograms formed by the input ideograms. and compares the input primitive with the P3 content of the index table. index table In order to accommodate a wide variety of users' handwriting, each predetermined number of Remember the changed primitives. Each primitive stored in the table The primitives that form characters are usually determined by the device. It will be done. Tables are also used to form each letter in ideographic languages. It also remembers several sets of primitives. several pairs of preforms that form the input character If a primitive matches one of several sets of primitives in the index table, then Output code in combination with the primitives is generated and communicated to an output device. this is Allows a hardcopy image of the input ideogram to be formed. deer However, due to the large variety of each primitive stored in the table, the device The processing speed of 5J! The problem is that it makes timekeeping inappropriate. There is a problem.

その上、本装置に使用される予め決められた基本線素すなわちプリミティブの数 は、!rtgLとして5りま友はそれ以下、ま九は2oまたはそれ以上になるよ うに選択されてきた。言語のあらゆる表意文字を形成するために、サブセットの 5つの基本プリミティブのみを使用することにより、友とえ表意文字が外見上独 得なものであっても、多数の異なった表意文字が同一の組のプリミティブから形 成されるという点で問題がある。これは、種々の表意文字間で識別する本装置の 能力の低下を生ずる結果となる。Additionally, a predetermined number of basic line elements or primitives used in the device teeth,! As rtgL, 5 Rima friends will be lower than that, and Maku will be 2o or higher. sea urchins have been selected. of a subset to form any ideogram of a language. By using only five basic primitives, Tomoe ideographs appear unique. Although many different ideograms can be formed from the same set of primitives, There is a problem in that it is done. This allows the device to distinguish between various ideographs. This results in a decrease in performance.

この問題の克服を試みるために、サブセットに20またはそれ以上のプリミティ ブを含ませてみ次。しかしながら、1つ以上の表意文字を表示する一連のプリミ ティブの発生は減少したけれども、多様な表意文字が同一系列のプリミティブか らまだ形成されるという点で同じ問題がまだ存在する。しかしながら、サブセッ ト円のプリミティブの数を増加させることによシ、装置の処理時間がさらに延長 されるという点で別の問題が存在する。To try to overcome this problem, we can add 20 or more primitives to the subset. Next, include bu. However, a set of primitives that represent one or more ideograms Although the number of ideographs has decreased, it has become clear that various ideograms are primitives of the same family. The same problem still exists in that rays are formed. However, a subset By increasing the number of primitives in the circle, the processing time of the device is further extended. Another problem exists in that

さらに、これらの装置は1つの言語で書かれた文字を検出することは可能である が、複数言語文字検出は不可能であるという点でまた別の問題が存在する。従っ て、改良された文字認識装置が必要となる。Furthermore, these devices are capable of detecting characters written in one language. However, another problem exists in that multilingual character detection is not possible. follow Therefore, improved character recognition equipment is needed.

それ故、上記欠点を除去または緩和することが本発明の目的である。It is therefore an object of the present invention to eliminate or alleviate the above-mentioned disadvantages.

(発明の開示) 本発明に従って、幾つかのプリミティブで作られ九文字、即ち予め決められた組 の構成要素である該文字訃よびプリミティブt−識別する文字認識装置が提供さ れるが、該装置は 文字を形成するプリミティブの各々を連続的に受取り、この受取っ友プリミティ ブの各々に対して入力信号を発生する入力手段、 入力信号全受取り、前記入力手段によって受取られた該プリミティブの各々を識 別し、プリミティブの識別によって該文字を表示する文字コードを発生する処理 手段、 前記組の文字の各々に対する文字コードおよび組合された出力コードを記憶する 記憶手段、前記入力畜れた文字を識別するために、この入力された文字に対して 発生した文字コードを、記憶手段の前記文字コードの各々と比較する比較手段、 および比較手段と連続していて、この比較手段による文字の識別によって前記入 力された文字の再生を生じる出力手段、 を含んでいる。(Disclosure of invention) According to the invention, nine characters are made of several primitives, i.e. a predetermined set. A character recognition device is provided which identifies the character variant and the primitive t which are the constituent elements of However, the device successively receives each of the primitives forming a character, and this receiving primitive input means for generating an input signal for each of the blocks; receiving all input signals and identifying each of said primitives received by said input means; A process that generates a character code to display the character by identifying the primitive. means, storing a character code and a combined output code for each of said set of characters; storage means, for this inputted character in order to identify the inputted character; comparison means for comparing the generated character code with each of the character codes in the storage means; and is continuous with the comparison means, and the previous entry is made by character identification by this comparison means. output means resulting in the reproduction of input characters; Contains.

この装置には、さらにプリミティブの各々に対して発生した入力信号t−調べ、 文字コードが複数備の出力コードと組合せた文字コードに等しい時、文字と組合 せt出カコード管識別するためにオペレータ謬ンt−実行スる識別手段も備えら れることが望ましい。The apparatus further includes: examining the input signal t generated for each of the primitives; When the character code is equal to the character code combined with the output code of multiple features, the combination with the character An identification means is also provided for operator error to identify the output cord tube. It is desirable that

この装置は、入力文字コードが記憶手段に記憶された文字コードの論ずれとも等 しくない時に、入力された文字に対して発生した文字コードに等しくなる確率が 最も高い、記憶手段に記憶された文字コードを選択する置換手段を具備すること が望ましい。また、出力手段が受取られた表意文字の再生の形成または表意文字 の音声再生の形成を可能にするプリンター、オーディオシンセサイザーまたはビ デオ表示端末装置から成るグループから選択された少なくとも1つの装at−含 むことも望ましい。In this device, the input character code is the same as the character code stored in the storage means. The probability that the character code generated for the input character is equal to comprising replacement means for selecting the highest character code stored in the storage means; is desirable. Also, the output means is the formation of the reproduction of the received ideogram or ideogram. printer, audio synthesizer or video player that allows the formation of audio playback. at-include at least one device selected from the group consisting of video display terminal devices. It is also desirable to

文字認識装置は、あらゆる表意文字、大文字の英語文字、およびロシャ語文字で 書かれた文字をii!識できる能力のあることが望ましい。The character recognizer recognizes all ideograms, uppercase English characters, and Rocha characters. ii the written characters! It is desirable that you have the ability to understand.

予め決められた組の基本プリミティブが20個の特有なプリミティブを含むよう に選択されることもまた望ましく、それらのプリミティブの種々の組合せが、複 数の異なる言語の実質上全ての文字を形成することになシ、一方では、同一系列 のプリミティブから形成される多様な文字の発生を減少させることになる。従っ て、20個の個別のプリミティブを使用することは、1つ以上の国際出力コード と組合せた文字コードに等しい文字コードを表示する入力文字の発生を減少させ る。これは勿論、正確な表意文字を検出する確率を高めることになる。The predetermined set of basic primitives contains 20 unique primitives. It is also desirable that the various combinations of those primitives On the other hand, the same series of letters form virtually all the letters of languages with different numbers. This will reduce the occurrence of diverse characters formed from primitives. follow The use of 20 individual primitives means that one or more international output codes Reduces the occurrence of input characters that display a character code equal to the character code combined with Ru. This, of course, increases the probability of detecting the correct ideogram.

(図面の簡単な説明) 本発明の実施例について、添付図面を参照しながら、−例としてここに説明を行 なう。(Brief explanation of the drawing) Embodiments of the invention will now be described - by way of example only and with reference to the accompanying drawings. Now.

第1図は、文字識別のための装置の機能ブロックダイヤグラム、 第2図は、表意文字を示す図、 第3図は、第1図に示された装置に使用される基本プリミティブを示す図、 第4a−4c図は、第3図に示され九プリさティグから第2図に示きれた文字を 形成する方法上水す図、第5図は、第1図に示された装置のさらに詳細な基本ブ ロックダイヤグラム、 第6図は、jlE1図に示された装置の一部の詳細な基本ブロックダイヤグラム 、 第7図は、第1図に示された装置に使用されるコーディング方法を示す図、 第8aおよび8b図は、入力された基本ストロークを示す図、 第9暑および9bgは、さらに多くの表意文字を示す図、 第10図は、第1図に示された装置に使用される確率マトリックスを示す図、 第11図は、1つの英語文字を示す図、第12図は、さらに多くの英語文字を示 す図である。FIG. 1 is a functional block diagram of a device for character identification; Figure 2 is a diagram showing ideograms; FIG. 3 is a diagram showing the basic primitives used in the device shown in FIG. 1; Figures 4a-4c represent the letters shown in Figure 3 and from Nine Pleasatigue to Figure 2. Figure 5 shows a more detailed basic block diagram of the apparatus shown in Figure 1. lock diagram, Figure 6 is a detailed basic block diagram of a portion of the apparatus shown in Figure jlE1. , FIG. 7 is a diagram showing a coding method used in the device shown in FIG. 1; Figures 8a and 8b are diagrams showing input basic strokes; 9th heat and 9bg are diagrams showing more ideograms, FIG. 10 is a diagram showing a probability matrix used in the device shown in FIG. 1; Figure 11 shows one English character, Figure 12 shows more English characters. This is a diagram.

(発明を実施する九めの最良の形ta>第1図を参照すると、手書き文字の識別 をする装置1゜が示しである。装置1oはデータ処理装置14に接続され次入力 装置12を含む。入力*IH2は手書き文字を受取り、その文字を、一連の信号 に変えてデータ処理装置14へ伝達する。データ処理装置14#i、この受は取 っ比信号全処理して入方装!t12に入力され次文字を検出する。出力装置16 もデータ処理装置に接続されており、入力装置12によって受敗られた手書き文 字全表示する国際ASCII  出方コードを受取る。これは手書き文字の再生 が生成されるのを可能にする。(Ninth Best Mode for Carrying Out the Invention ta> With reference to Figure 1, handwritten character recognition A device 1° is shown. The device 1o is connected to the data processing device 14 and the next input includes device 12; Input * The IH2 receives handwritten characters and converts them into a series of signals. , and then transmits it to the data processing device 14. Data processing device 14#i, this receiver is All signals are processed and entered! The next character input at t12 is detected. Output device 16 is also connected to the data processing device, and the handwritten text accepted or rejected by the input device 12 is connected to the data processing device. Receive an international ASCII output code that displays all characters. This is reproduction of handwritten characters allows to be generated.

装置10は幾つかのモードで作動可能であり、各モードは、異なる言語の手書き 文字が認識され、再生されることを可能にする。選択手段18は、ユーザがどの 言語で装置jut操作するかを選択できるように設けられている。従って、処理 手段14は選択手段18W一応答し、6言F#に対する適当な情報が個別的に記 憶され、かつ選択手段18によって選択されたモードによってアクセス可能とな るように区分14a、 14b −−−14yaK区分けされる。The device 10 is operable in several modes, each mode being able to handle handwriting in a different language. Allows characters to be recognized and reproduced. The selection means 18 selects which It is provided so that you can choose how to operate the device jut by language. Therefore, processing The means 14 responds to the selection means 18W and records appropriate information for the six words F# individually. stored and accessible according to the mode selected by the selection means 18. It is divided into sections 14a, 14b---14yaK.

簡潔にする九めに、第1図に示された装置は、選択手段18を異なるモードに条 件付けすることによって類似の方法で、他の言語の文字を検出することができる ことが理解されねばならないが、それは表意文字を検出するために処理手段14 が条件付けされる時に説明を行なうことにする。For the sake of brevity, the apparatus shown in FIG. Characters in other languages can be detected in a similar way by subjecting It must be understood that the processing means 14 for detecting ideograms I will explain this when it is conditioned.

第2図に参照すると、表意文字ICが図示されている。Referring to FIG. 2, an ideographic IC is illustrated.

図で分かる通り、表意文字ICは幾つかの基本線素、即ちプリミティブで形成さ れて訃り、プリミティブはそれぞれPrlからPrsまでの名称が付けである。As can be seen in the figure, the ideogram IC is formed by several basic line elements, i.e. primitives. The primitives are named from Prl to Prs, respectively.

プリミティブPrlからPr3は、表意言語で書(時に使用される基本線素であ る。Primitives Prl to Pr3 are basic line elements that are sometimes used in writing in ideographic languages. Ru.

表意文字の線素の順序の書込み順序は王として論理効率、経験および人間本来の 習慣に基づく。幾つもの研究結果により、表意文字を書込む時には幾つかの基本 的ルールが存在し、それは次の通りである:水平 −垂直 左傾斜 −右傾斜 先入れ −後閉じ 各漢字は、文字の形成において、上記ルールの1つまたはそれ以上を使用し得る 。表意文字の基本線素順序の例が、下記第1表に示される: 表  −1 ユーザーが表意文字を形成する時に書くのに必要とするプリミティブの数を減す る友めに5またかり処理装置14によって処理されねばならないデータの量を減 らすために、装置10では第3図に示された20個のプリミティブのうち15個 のPr、からPr、を使用する。15個のプリミティブPr、からPr□は、表 意文字の形成に使用される基本線素、のセットの構成要素である1種々様々な言 語における表意文字の全ては、プリミティブPraからProの種々の組合せに よりて作ることができるので、プリミティブのこのようなサブセットが選択され る。装置が、以下で説明する別の言語で書かれた文字を検出するため作動してい る時は、プリミティブPrpからPrtがプリミティブPraからProのいく つかと共に使用される・ 第5図全参照すると、装置10が一層よく図解されている。入力装+112は、 スタイラス201を有するオンラインのディジタイザタブレット2ot−含む。The writing order of the ideographic line element order is the king of logical efficiency, experience and human innate Based on habit. Several research results show that there are some basic rules when writing ideograms. There is a rule of thumb and it is as follows: Horizontal - Vertical Left tilt - right tilt First-in - last-close Each Kanji may use one or more of the above rules in forming the character. . An example of the basic line element order of an ideogram is shown in Table 1 below: Table-1 Reduce the number of primitives users need to write when forming ideograms This reduces the amount of data that must be processed by the five processing units 14. In order to Use Pr, to Pr. The 15 primitives Pr, to Pr□ are the table A variety of words that are members of a set of basic line elements, which are used to form letters. All of the ideograms in the word are in various combinations from the primitives Pra to Pro. Such a subset of primitives is selected because it can be made by Ru. The device is working to detect characters written in another language as described below. When the primitive Prp to Prt goes from the primitive Pra to Pro Used with Tsuka 5, apparatus 10 is better illustrated. The input device +112 is Online digitizer tablet 2ot-includes stylus 201.

認識されるべき表意文字はスタイラス20aでタブレット20に書込まれる。こ rL#Cよりて、表意文字IC=i形底す形成力され友プリミティブPraから Proの各々に対して、一連のデカルト座標データポイント信号PNoからPN Nが生成される。データポイント信号の大文字°N′は、文字ICt形成する時 にプリミティブが入力された順序を指し、一方添字1N”はプリミティブに沿り た抽出ポインFの数を指す。データポイント信号は次いでデータ処理装置14へ 伝達される。The ideograms to be recognized are written on the tablet 20 with a stylus 20a. child From rL#C, ideogram IC=i-shaped base forming force and friend primitive Pra For each of Pro, a series of Cartesian coordinate data point signals PNo to PN N is generated. The capital letter °N' in the data point signal forms the letter ICt. refers to the order in which the primitives were input, while the subscript 1N” refers to the order in which the primitives are input along the primitives. indicates the number of extraction points F. The data point signal is then sent to data processing unit 14. communicated.

記憶装f122はデータ処理装置14内に位置決めされ、ディジタイザ−20に 接続されてhる。記憶装置22は生のデカルト座標データポイント信号を受取り 、処理前にその信号を記憶する。プリグロセッ?24は各々の入力されたプリミ ティブに対するデカルト座標データポイント信号PNoからPNNのコピーを受 取り、重複し九および偽のデータを除去する几めデータ処理全行なう、事前処理 され友デカルト座標データ信号は、プリプロセ、す24から機能抽出部26へ送 られ、同抽出部は入力されたプリミティブPrの各々に対するデカルト座標デー タポイント信号をベクトルコードおよび一連のヌカ2vc変換する。The storage device f122 is positioned within the data processing device 14 and is connected to the digitizer 20. Connected. Storage device 22 receives the raw Cartesian coordinate data point signal. , store that signal before processing. Preglosse? 24 is each input primitive receives a copy of PNN from Cartesian coordinate data point signal PNo for Perform pre-processing to remove redundant and false data, and perform thorough data processing. The Cartesian coordinate data signal is sent from the preprocessor 24 to the function extraction unit 26. The extraction unit extracts Cartesian coordinate data for each of the input primitives Pr. The data point signal is converted into a vector code and a series of Nuka2vc transforms.

機能抽出部26によって生成されたベクトルコードおよび一連のスカラは、プリ ミティブ検出部28へ付与され、同検出部は、文字ICI形底形成各々の入力さ れたプリミティブPraからProK対して生成されたベクトルコードを索引テ ーブルまたは辞書の内存と比較する。これは、処理装置14が、入力されたプリ ミティブが15個のプリミティブPriからProの構成要素であるかどうかを 検出することを可能にする。入力されたプリミティブPrが、プリミティブ検出 部28に記憶された15個のプリミティブの1つだけと組合せられたベクトルコ ードに等しいベクトルコードを形成する結果を生じt時、プリミティブコード1 からOが生成されて、記憶装置50へ送られる。この処理は、入力された表意文 字ICi形成する各プリミティブPr f表示する各ベクトルコードに対して行 なわれる。従って、一連のプリミティブコードまたは文字コードは、表意文字I Ct−Cポーる入力された文字に対して生成される。しかしながら、入力された プリミティブPr に対して生成されたベクトルコードが、もし15個のプIJ  ミティプPraからProの中の1個以上と組合わされたベクトルコードに等 しい場合は、正確な入力プリミティブを検出するために、検出部2Bが、生成さ れたベクトルコードと組合わされた一連のスカシについてテストヲ遂行する。The vector code and series of scalars generated by the feature extraction unit 26 are The input signal is given to the primitive detection unit 28, and the detection unit receives each input of the character ICI type bottom formation. The vector code generated from the primitive Pra to ProK is indexed. Compare with the existence of a table or dictionary. This means that the processing device 14 Whether the primitive is a component of the 15 primitives Pri to Pro enable detection. The input primitive Pr is the primitive detected A vector code combined with only one of the 15 primitives stored in section 28 primitive code 1 at time t which results in the formation of a vector code equal to the code O is generated from and sent to the storage device 50. This process For each primitive Pr f that forms the character ICi, a row for each vector code to be displayed. be called. Therefore, the set of primitive or character codes is the ideogram I Ct-C is generated for the input character. However, the input If the vector code generated for primitive Pr is  MitipPra to a vector code combined with one or more of Pro, etc. If the input primitive is correct, the detection unit 2B Tests are performed on a series of scans combined with the vector code.

生成された文字コードは記憶装置sOから文字検出部32へ送られて、第2索引 テーブルまたは辞書の内容と比較される。検出部32は、言語の表意文字の各々 を表示している文字コードを記憶する。記憶される文字コードは、表意文字が第 3図に示された15個のプリミティブの組合せにより作られ、これらの文字を前 述したルールによって決められた順序でタブレット20に入力することを必要条 件としている。前述したルールは表意言語で書込む時に概ね使用されるので、表 意文字を表示することはできるが、間違った方法で入力されたプリミティブから 形成されている文字コードは、索引テーブルから省略される。The generated character code is sent from the storage device sO to the character detection unit 32, and is stored in the second index. Compares with the contents of a table or dictionary. The detection unit 32 detects each of the ideograms of the language. Memorize the character code that is displayed. The character code to be memorized is It is made by combining the 15 primitives shown in Figure 3, and these characters are It is a necessary condition to input data into the tablet 20 in the order determined by the rules mentioned above. This is a matter of concern. The rules mentioned above are mostly used when writing in ideographic languages, so from a primitive typed in the wrong way. The formed character code is omitted from the index table.

入力された表意文字ICに対して生成されt文字コードが、文字検出部S2で見 出された文字コードと等しい時は、組合せた出力コードまたは国際A8CII出 力コードが記憶装置34に出ガされる。しかしながら、もし文字コードが1つ以 上の表意文字を表わす文字コード九等しい場合は、文字検出部32が記憶装置2 2に記憶された生のデカルト座標データポイント信号に関する操作を行ない、文 字コードが表示する正しい表意文字IC=i決定する。これは正確な国際ASC IIコードか記憶装置54へ出力されることを可能にする。The t character code generated for the input ideographic character IC is read by the character detection unit S2. If it is equal to the output character code, the combined output code or international A8CII output The power code is output to storage device 34. However, if there is more than one character code If the character codes representing the above ideograms are equal to 9, the character detection unit 32 stores the 2. Perform operations on the raw Cartesian coordinate data point signals stored in 2. Determine the correct ideogram IC=i displayed by the character code. This is an accurate international ASC II code can be output to storage device 54.

代替・訂正装置56本具備され、入力された文字コードが文字検出部28に記憶 された文字コードと等しくない時に、入力文字コードを調べる0代替装置56は 、入力され次文字コードに対して、入力された文字コードが表示するものと推測 され几最も確かな文字コード全代用し、上述した処理が遂行される文字検出部3 2へ送り戻す。Equipped with 56 substitution/correction devices, the input character code is stored in the character detection unit 28. The zero substitution device 56 checks the input character code when it is not equal to the input character code. , it is assumed that the input character code will be displayed for the next input character code. The character detection unit 3 performs the above-mentioned processing by substituting all the most reliable character codes. Send it back to 2.

記憶装置54に:記憶された表意文字工C1−表す国際A19CIIコードは、 出力装置または装置115[加えられており、この装置は表意文字の音声および /ま几は視覚的再生が形成され得るビデオ表示端末装置(VDT)16a。In the storage device 54: The international A19CII code stored in the ideogram C1 represents Output device or device 115 [has been added, which device outputs the ideograph phonetic and A video display terminal (VDT) 16a on which a visual reproduction can be formed.

プリンタ16bおよび/ま九はビデオシンセサイザー16c等を有して匹る。The printer 16b and/or printer 16b also have a video synthesizer 16c and the like.

第6図を参照すると、処理装置14が一層よく図解されている。プリプロセッサ 24は、余分なおよび偽のデカルト座標データポイント信号を削除するために説 明した方法で機能するコンパレータ24aおよび記憶装置24bを含んでいる。Referring to FIG. 6, processing device 14 is better illustrated. preprocessor 24 is explained to remove redundant and false Cartesian coordinate data point signals. It includes a comparator 24a and a storage device 24b which function in the manner described.

機能抽出部26は、各プリミティブPr全形成する隣接したデカルト座標データ ポイント信号に対してベクトルを生成するために機能する第2コンパレータおよ び索引テーブルまたは辞書1備えている。記憶装置26cはベクトルを受取り、 次にそのベクトルを第5コンバレー126dへ送る。コンパレータ26dハヘク トル1kg4べて余分な情報を除去し、各プリミティブに対する一連の単位ベク トルまたはベクトルコードおよび一連のスカシを形成する。スカシは、各プリミ ティブに対して生成されたベクトルコードにおける各々の単位ベクトルの長さを 表す、各プリミティブに対して生成されたベクトルコードおよび一連のスカシは 記憶装置26eへ送られて、プリミティブ検出部28へ送られる前に記憶される 。The function extraction unit 26 extracts adjacent Cartesian coordinate data that completely forms each primitive Pr. A second comparator and a second comparator function to generate a vector for the point signal. and an index table or dictionary. Storage device 26c receives the vector; Next, the vector is sent to the fifth combiner 126d. Comparator 26d hahek Remove redundant information and create a set of unit vectors for each primitive. form a tor or vector cord and a series of squash. Sukashi is a member of each Primi The length of each unit vector in the vector code generated for the The vector code and set of scats generated for each primitive represent It is sent to the storage device 26e and stored before being sent to the primitive detection unit 28. .

プリミティブ検出s28は、第2索引テーブルまたは辞書28bへ接続された第 4コンパレータ全備えている。Primitive detection s28 includes a second index table or dictionary connected to the second index table or dictionary 28b. Equipped with all 4 comparators.

テーブル28bは各プリミティブPraからProK対する予め決められたベク トルコードおよびプリミティブコードのりストを記憶する。ベクトルコードは1 5個のプリミティブPraからProのうちの1個またはそれ以上を表す。Table 28b contains predetermined vectors from each primitive Pra to ProK. Memorizes a list of torque codes and primitive chords. Vector code is 1 Represents one or more of the five primitives Pra to Pro.

プリミティブ検出部28はま九各ベクトルコードに対して生成されたスカシを保 持する記憶装置28cおよびテスト部28dも含んでいる。テスト部28dは、 スカシと組合せたベクトルコードが15個のプリミティブのうちの1つ以上を表 すベクトルコードに等しいかどうか、一連のスカシに関するオペレージ曹ンを行 なう、これは正確なプリミティブが決定されることを可能にする。入力されたプ リミティブPrの各々に対するベクトルコードが辞書28b内に位置決めされる と、組合されたプリミティブコードaから0が記憶装置に付与される。The primitive detection unit 28 stores the space generated for each vector code. It also includes a storage device 28c and a test section 28d. The test section 28d is The vector code in combination with the squash represents one or more of the 15 primitives. Performs an operation on a series of vectors to determine if the vector code is equal to Now, this allows the exact primitives to be determined. input program A vector code for each of the primitives Pr is located in the dictionary 28b. , and 0 is given to the storage device from the combined primitive code a.

入力された表意文字ICに対して生成された一連のプリミティブコードま友は文 字コードは、第5コンパレータS2aおよび第3索引テーブルまたは辞書52b lji−含む文字検出部52へ送られる。辞書52bは、言語の表意文字の各々 を形成している文字コードのリストおよび組合わされた国際出力コードを記憶す る。コンパレータ52aおよび辞書52bは、入力された表意文字IC1−表示 する文字コードが表意文字の1つまたはそれ以上を表示する文字コードに等しh かどうかを検出するため機能する。文字検出部52はま九、文字コードが1つま たはそれ以上の表意文字を表す文字コードに等しいかどうか、生のデカルト座標 データポイント信号に関してテストを行なう識別器52cも備えている。これは 正確な表意文字が検出されるの全可能にする。正しい表意文字の識別が完了する と、組合された国際ASCIIコードが記憶装置34へ送られ、次いで出力装置 16へと送られる。A series of primitive codes generated for the input ideogram IC. The character code is determined by the fifth comparator S2a and the third index table or dictionary 52b. lji- is sent to the character detection unit 52 containing the character. The dictionary 52b stores each of the ideograms of the language. memorizes the list of character codes forming the character code and the combined international output code. Ru. The comparator 52a and the dictionary 52b output the input ideogram IC1-display. is equal to the character code representing one or more of the ideograms. It works to detect whether or not. The character detection section 52 has only one character code. raw Cartesian coordinates, whether equal to the character code representing an ideograph or higher A discriminator 52c is also included to test for data point signals. this is Makes it possible for all accurate ideograms to be detected. Identification of the correct ideogram is complete and the combined international ASCII code are sent to the storage device 34 and then to the output device 34. Sent to 16.

前述した通り、文字コードが辞書32bに見出された文字コードと等しくない時 は、代替または訂正装@56が使用される。代替部36は入力された表意文字I CK:対する文字コードが成り得ると推測される確率が最も高い文字コードを決 めるために集合的に機能する確率マ) IJフックス6星、第5コンパレータS 6bおよび記憶装置S6cを備えている。これは、ディジタイザ−タブレット2 0に入力された表意文字を検出する確率を高める。As mentioned above, when the character code is not equal to the character code found in the dictionary 32b An alternative or correction @56 is used. The substitute part 36 is the input ideogram I CK: Determine the character code that has the highest probability of becoming the corresponding character code. Probability matrix that works collectively to determine 6b and a storage device S6c. This is digitizer tablet 2 Increases the probability of detecting ideograms input as 0.

表意文字ICがディジタイザ−タブレット20を経て装置10へ入力されるべき 時には、タブレット20の上にスタイラス20aが置かれ、表意文字ICを形成 するプリミティブPrの各々が別個に描かれる。上記で説明したように、表意文 字工C11−形成するために使用されるプリミティブは、15個のプリミティブ PraからProの1−1)K実質上等しくなければならない。しかしながら、 このような制限は、15個のプリミティブの各々が、表意言論で書込むことので きる実買上誰でもが使用する基本ストロークであるため、多くの問題を提起する ことはない。その上、プリミティブPr、11からProは、装置1Gに入力さ れ友時に同一文字コードを生成する入力文字の数を減らすためおよび処理装置部 14での処理を簡易化するために選択されたものである。プリミティブPrの入 力完了後、スタイラス2011は、予め決められた長さの時間、タブレット20 から取外される。これは、データプロセッサ14にプリミティブPr が完全に 入力し九〇とを認めさせるタイムアウト信号が発生している結果である。その後 、文字を形成する次のプリミティブが入力され、タイムアウト信号が発生する。The ideogram IC should be input to the device 10 via the digitizer tablet 20. Sometimes a stylus 20a is placed on top of the tablet 20 to form an ideographic IC. Each of the primitives Pr is drawn separately. As explained above, ideograms Glyph C11 - Primitives used to form 15 primitives 1-1) K from Pra to Pro must be substantially equal. however, Such a restriction is due to the fact that each of the 15 primitives can be written in ideographic terms. Since it is a basic stroke that everyone uses, it poses many problems. Never. Moreover, primitives Pr, 11 to Pro are input to device 1G. In order to reduce the number of input characters that generate the same character code when This was selected to simplify the processing in step 14. Inputting primitive Pr After completing the force, the stylus 2011 moves the tablet 20 for a predetermined length of time. removed from. This means that the data processor 14 has the primitive Pr completely This is the result of a timeout signal being generated that allows the input to be 90. after that , the next primitive forming the character is entered and a timeout signal is generated.

この過程は文字を形成する各プリミティブが装置10内への入力を完了するまで 継続する。This process continues until each primitive forming a character has been entered into the device 10. continue.

プリミティブPr f形成するために、スタイラス20a全タブレツト20t− 横切って移動させると、一連のデカルト座標データポイント信号が生ずる。デー タ処理装置14は各プリミティブに対して生成されたデカルト座標データポイン ト信号を1秒当りはx1ooサンプルのサンプリング率で抽出し、抽出された座 標データ信号を記憶装置22で記憶する。各プリミティブに対する抽出されたデ ータは、データ処理装置14が、完全なプリミティブを入力したことを意味する タイムアラ)信号を受取るまで、別々のレジスタに継続的に記憶される。タブレ ツ)20で次のプリミティブPrsが形成されている間、抽出されたデカルト座 標データポイント信号は、次のタイムアウト信号が処理装置14によって検出さ れるまで、記憶装置22内の種々のレジスタに別々に記憶される。In order to form the primitive Prf, the stylus 20a and the entire tablet 20t- Movement across produces a series of Cartesian coordinate data point signals. day The data processor 14 processes the Cartesian coordinate data points generated for each primitive. The extracted locus signal is extracted at a sampling rate of x1oo samples per second. The standard data signal is stored in the storage device 22. The extracted data for each primitive data means that the data processing unit 14 has input a complete primitive. are continuously stored in separate registers until a time-out signal is received. tabulet T) While the next primitive Prs is formed at 20, the extracted Cartesian locus The target data point signal indicates that the next timeout signal is detected by processing unit 14. are stored separately in various registers within storage device 22 until the

この過程は、表意文字を形成する各プリミティブが入力を完了し、プリミティブ に対して生成され友デカルト座標データ信号が記憶装置22へ別々に記憶され終 るまで継続する。全我意文字ICの入力が完了したことをデータ処理装置14に 指示するには、タブレットに位置決めされた文字終了(EOC)キーを押さねば ならない。これは、タブレット20に入力され九それ以上のデータが、前に入力 された表意文字と組合せたデータを乱すことを防止する。This process is completed until each primitive forming the ideograph completes its input, and the primitive The Cartesian coordinate data signals generated for each are stored separately in the storage device 22 and then Continue until Notify the data processing device 14 that the input of the Zengoi character IC has been completed. To command, you must press the End of Character (EOC) key located on the tablet. No. This is entered into the tablet 20 with nine more data entered before This prevents disturbing the data combined with the ideographs.

ディジタイザタブレット20が使用されるので、スタイラス2011とディジタ イザタブレットの面20の結合きスのために、抽出処理中一時的な、不規則な騒 音が生ずる。その上、オペレータの手の不均等な運動のために、小さい振幅脈音 が生じ、それは抽出されたデカルト座標データポイント信号と希望するデカルト 座標データポイント信号の間で喰い違いを導ひくことになる。また、処理装置1 4のサンプリング率に関して、ディジタイザ−タブレット面20i横切るスタイ ラス20aのゆっくりした運動は、次に大量の記憶スペースを要求し、かつ装置 10(1)処理時間を増加さセる大量の余分なデータポイント信号を導ひくこと になる。従りて、前述した通り、余分なかつ偽のデータを減少させるためにプリ プロセッサ24が使用される。Since digitizer tablet 20 is used, stylus 2011 and digitizer Due to the bonding spots on the surface 20 of the Iza tablet, temporary and irregular noises may occur during the extraction process. A sound is produced. Moreover, due to the uneven movement of the operator's hands, small amplitude pulse sounds occurs, which is the extracted Cartesian coordinate data point signal and the desired Cartesian This will lead to discrepancies between the coordinate data point signals. In addition, the processing device 1 For a sampling rate of 4, the digitizer-tablet surface 20i The slow movement of the lath 20a then requires a large amount of storage space and equipment 10(1) Introducing a large number of extra data point signals which increases processing time. become. Therefore, as mentioned above, preprocessing is performed to reduce redundant and false data. A processor 24 is used.

この機能を遂行するために、抽出されたデカルト座標データポイント信号のコピ ーがコンパレータ24aに付与される。スタイラス20aとディジタイザ−タブ レット20の不注意な結合ミスによりて引起こされる騒音を少なくするために、 抽出されたデカルト座標データポイント信号は別個に分析される。もし抽出され たデカルト座標データポイント信号がディジタイザ−タブレット20の境界を越 えて伸びる1組の座標を有することが分かった場合は、そのデカルト座標データ ポイント信号は削除される。第2に、余分なデータの量を減少させるために、従 って装置10の処理速度を高めるために、最初の2つのデカルト座標データポイ ント信号がコンパレータ24mで比較される。もし2つのデカルト座標データポ イント信号間の距離が予め決められたスレッシ曹ルド値より4小さい場合は、第 2の抽出されたデータポイント信号は削除されて、第1および第3の抽出された デカルト座標データポイント信号の間の距離が調べられる。この過程は、2つの データポイント信号間の距離がスレッショルド値よりも大きくなるまで継続する 。第1データポイント信号は記憶装置24bへ送られ、もう1つのデータポイン ト信号は次の先行データポイント信号と比較される。To accomplish this function, a copy of the extracted Cartesian coordinate data point signal is is applied to the comparator 24a. Stylus 20a and digitizer tab In order to reduce the noise caused by inadvertent coupling errors of the let 20, The extracted Cartesian coordinate data point signals are analyzed separately. If extracted The Cartesian coordinate data point signal crosses the digitizer-tablet 20 boundary. If you find that you have a set of coordinates that extend over Point signals are deleted. Second, to reduce the amount of redundant data, In order to increase the processing speed of the device 10, the first two Cartesian coordinate data points are The event signals are compared by a comparator 24m. If two Cartesian coordinate data points If the distance between the int signals is 4 less than the predetermined threshold value, the The two extracted data point signals are removed and the first and third extracted data point signals are The distance between Cartesian coordinate data point signals is determined. This process consists of two Continue until the distance between data point signals is greater than the threshold value . The first data point signal is sent to the storage device 24b and the first data point signal is sent to the storage device 24b. The point signal is compared to the next preceding data point signal.

さらに、もし2つのデカルト座標データポイント信号間の距離が、第2の予め決 められたスレッショルド値よりも大きい場合は、第2のデカルト座標データポイ ント信号は第3のデータポイント信号と比較される。もし第2および#I5デー タポイント信号信号圧離が第2スレツシヨルド値よりも大きい場合は、第2デー タポイント信号は、スタイラス20aおよびタプレッ)20の不注意な結合ミス のために生じたものとみなされ、削除される。Furthermore, if the distance between two Cartesian coordinate data point signals is If it is greater than the set threshold value, the second Cartesian coordinate data point The data point signal is compared to the third data point signal. If the 2nd and #I5 day If the point signal pressure separation is greater than the second threshold value, the second data The tap point signal may be caused by an inadvertent miscoupling of the stylus 20a and taplet 20. will be deemed to have occurred because of this and will be deleted.

しかしながら、もし第2データポイント信号と第5デ−タボインド信号間の距離 が第2スレツシヨルド値よりも小さい場合は、第1データポイント信号は不注意 に生じたものとみなされ、削除される。この処理は、入力された文字を形成する 入力され九プリミティブの各々に対する抽出されたデカルト座標データポイント 信号に関して遂行され、その結果、処Sを必要とするデータのtt減少させるこ とになる・ 例えば、第2図に示された表意文字ICが装置1oに入力され九場合、文字工C 1−形成しているプリミティブPr1から2口は別々(タブレット2oに入力さ れる。データ処理装置14は、第1プリミテイブPrlに対してタブレット20 により生成されたデカルト座標データを抽出し、第43から4c図に示されるよ うに、抽出されたデカルト座標データポイント信号P11からPl、 ’i記憶 装置22に記憶する。同様に、処理装置14は、次の2つのプリミティブPry およびPr3に対して生成されたデカルト座標データポイント信号P2.からP 2.およびP51からP3.t−それぞれ抽出して、記憶装置22に抽出された デカルト座標データポイント信号を記憶する。However, if the distance between the second data point signal and the fifth data point signal is less than the second threshold value, the first data point signal is inadvertently will be deemed to have occurred and will be deleted. This process forms the input characters Extracted Cartesian coordinate data points for each of the input nine primitives The reduction in data tt performed on the signal, resulting in the need for processing S. It becomes... For example, if the ideogram IC shown in FIG. 1-The two ports from the forming primitive Pr1 are separate (input on tablet 2o) It will be done. The data processing device 14 uses the tablet 20 for the first primitive Prl. Extract the Cartesian coordinate data generated by , the extracted Cartesian coordinate data point signal P11 to Pl, 'i memory The information is stored in the device 22. Similarly, the processing device 14 processes the following two primitives Pry and the Cartesian coordinate data point signal P2. generated for Pr3. From P 2. and P51 to P3. t- respectively extracted and extracted to the storage device 22 Stores Cartesian coordinate data point signals.

これVcvcいて、デカルト座標データポイント信号はプリプロセッサ24へ別 々に送られ、そこでは信号がコンパレータ24aで記憶される。第1#C1第1 プリミテイブPrlに対する抽出されたデカルト座標データポイント信号P1m が、ディジタイザ−タブレット2oの外側境界デカルト座標と比較される。もし 抽出され友データポイント信号がタブレット20の境界の外側にあるとみなされ た場合は、それに削除される。第2に、残りのデータポイント信号P1.からP l、が前のデータポイント信号P11と比較される。例えば、もしデータポイン トP1.およびPl、間の距離が予め決められた値よりも小さい場合は、データ ポイント信号P1.は削除され、データポイント信号P1mはデータポイント信 号P11と比較される。もしデータポイント信号PISおよびPlを間の距離が スレッショルド値よりも大きい場合は、データポイント信号Ptmは記憶装置2 4bに記憶され、上述した処理がデータポイント信号P1.およびP14の調査 を再開する。この処理は、入力されたプリミティブPr1t−表す座標データが 削減を完了するまで、第1プリミテイブPr1に対して抽出された各データポイ ント信号に対して遂行される。この処理けまた、その他の入力され友プIJ ミ ティブPryの各々に対する抽出されたデカルト座標データポイント信号に関し て遂行され、その結果、記憶装置24bは人力され定プリミティブの各々に対す る削減されたデカルト座標データポイント信号を記憶する。With this Vcvc, the Cartesian coordinate data point signal is sent separately to the preprocessor 24. The signals are then sent to each other, where the signals are stored in a comparator 24a. 1st #C1 1st Extracted Cartesian coordinate data point signal P1m for primitive Prl is compared with the outer boundary Cartesian coordinates of digitizer tablet 2o. if The extracted friend data point signal is considered to be outside the boundaries of the tablet 20. If so, it will be deleted. Second, the remaining data point signals P1. From P l, is compared with the previous data point signal P11. For example, if the data point P1. If the distance between and Pl is smaller than a predetermined value, then the data Point signal P1. is deleted, and data point signal P1m is replaced by data point signal P1m. It is compared with No. P11. If the distance between the data point signals PIS and Pl is If the data point signal Ptm is greater than the threshold value, the data point signal Ptm is 4b, and the above-described processing is performed on the data point signal P1. and P14 investigation resume. In this process, input primitive Pr1t-representing coordinate data is Each data point extracted for the first primitive Pr1 until the reduction is completed. performed on the event signal. In addition to this processing, other input friend pools For the extracted Cartesian coordinate data point signal for each of the As a result, the storage device 24b is manually stored for each of the fixed primitives. Store the reduced Cartesian coordinate data point signal.

各々の入力され友プリミティブに対する抽出された偽のかつ余分なデカルト座標 データポイント信号が取除かれると、その結果生じ次データポイント信号は記憶 装置24bから機能抽出部26へ送られる・機能抽出部26では、各入力された プリミティブに対するデカルト座標データポイント信号は、タブレット20に入 力されたプリミティブ金検出する処理を簡易化する丸めに、ベクトルコードおよ び一連のスカシに変換される。しかしながら、入力されたプリミティブに対する ベクトルコードおよびスカシを形成する前に、デカルト座標データがブリプロセ ッサ241Cよって1対の座標に削減されているかどうかを見つけるために調べ られる。これは、タブレット20にプリミティブPreが入力されている場合に 起こる。もし、このプリミティブが検出されると、プリミテブコードCは、それ 以上の処理を必要とすることな(記憶装置に出力される。機能抽出部26Fi、 他のプリミティブを決定するためにベクトルコードおよびスカシを形成する時、 第7図に示される変更例のフリーマンコーディングシステムFCの使用t−夷行 する。フリーマンコーディングシステムは、一連のデカルト座標データポイント 信号(Pa 、Pt 、−”・−・Pie Pint )が一連の単位ベクトル (各ベクトルは組合せた長さを有する)K変換されることを可能にする。但し、 この信号FiPoが(Xo、 Yo ) K’t l、 <、Pi カ(Xi、  Yi ) K等しイ。単位ベクトルは隣接し九デカルト座標データポイント信 号Piおよびpi+1の間に引かれた級を、フリーマンコードPCにおける8個 のフリーマン単位ベクトルFV1からFV、のうちの19と比較することによっ て形成される。Extracted false and extra Cartesian coordinates for each input primitive When a data point signal is removed, the resulting next data point signal is stored. Sent from the device 24b to the function extraction unit 26.In the function extraction unit 26, each input The Cartesian coordinate data point signal for the primitive enters the tablet 20. Vector code and rounding simplifies the process of detecting input primitives. and a series of squash. However, for the input primitives The Cartesian coordinate data is pre-processed before forming the vector code and grid. Investigate to find out whether the coordinates are reduced to a pair of coordinates by the sensor 241C. It will be done. This is when the primitive Pre is input to the tablet 20. happen. If this primitive is detected, the primitive code C is The above processing is not required (output to the storage device. Function extraction unit 26Fi, When forming vector codes and sketches to determine other primitives, Using the modified Freeman coding system FC shown in FIG. do. The Freeman coding system is a series of Cartesian coordinate data points The signal (Pa, Pt, −”・−・Pie Pint ) is a series of unit vectors (Each vector has a combined length) Allows to be K-transformed. however, This signal FiPo is (Xo, Yo) K’tl, <, Pi (Xi, Yi) K etc. Unit vectors are adjacent nine Cartesian coordinate data point signals. The class drawn between the numbers Pi and pi+1 is 8 in the Freeman code PC. By comparing with 19 of the Freeman unit vectors FV1 to FV, It is formed by

しかしながら、ディジタイザ−タブレット20上の入力され九プリミティブの形 状の中へ導入される角度のため、一対のデカルト座標データポイント信号Pi  およびPintの間に形成される、フリーマン単位ベクトルFVNとは一致しな い線が、正確なフリーマン単位ベクトルへ割り当てられることを可能にするため 許容誤差が必要とされる。入力されたプリミティブのこれらの製図の変動を適応 するために、フリーマンコーディングシステムFC1は、フリーマン単位ベクト ルPVNの各々に対して20°の許容誤差を使用し、その結果、境界線んからん の1つの中に含まれる一対のデカルト座標データポイント信号PiおよびPin tの間に形成されるいずれの線も、その境界線と組合された適当なフリーマン単 位ベクトルFVNに割シ当てられることが可能になる。However, the shape of the nine primitives entered on the digitizer tablet 20 Due to the angle introduced into the shape, a pair of Cartesian coordinate data point signals Pi and Pint, which is not coincident with the Freeman unit vector FVN. In order to allow the different lines to be assigned to exact Freeman unit vectors, Tolerance is required. Adapt these drafting variations of input primitives To do this, the Freeman coding system FC1 uses the Freeman unit vector Use a 20° tolerance for each of the PVNs, so that the border line is A pair of Cartesian coordinate data point signals Pi and Pin contained in one of Any line formed between t and the appropriate Freeman unit combined with that boundary It becomes possible to allocate the data to the position vector FVN.

プリミティブの各々に対する各々隣接したデカルト座標データポイント信号間に 形成される各線に対するフリーマン単位ベクトルFVN @生成するために、事 前処理されたデカルト座標データポイント信号がコンバラメータ26aへ送られ る。コンバラメータ26aでは、隣接し九テカルト座標データポイント信号が調 べられ、線がその間に形成される。オペレータによるスタイラス20aの不注意 な動きのために、抽出されたデカルト座標に導入されるエラーを減少させる友め 、各隣接データポイント信号間に形成される線の長さがスレッショルド値と比較 される。もし長さが予め決められたスレッショルド長さよりも短かい場合は、第 2データポイント信号はオペレータによる偽夛の手の動きの結果であるとみなさ れ、従って削除される。この処理は、わずかな非水平部分全備えているオペレー タによって引かれた水平線が、望ましい水平線を表示するデータ全作成するため に取除かれることを確実にする。Between each adjacent Cartesian coordinate data point signal for each of the primitives To generate the Freeman unit vector FVN for each line formed, The preprocessed Cartesian coordinate data point signal is sent to the conbalameter 26a. Ru. In the conbalameter 26a, the adjacent nine Tekart coordinate data point signals are measured. and a line is formed between them. Carelessness of the stylus 20a by the operator A method that reduces errors introduced into the extracted Cartesian coordinates due to , the length of the line formed between each adjacent data point signal is compared to the threshold value be done. If the length is less than the predetermined threshold length, then The two data point signals are considered to be the result of a false hand movement by the operator. and therefore deleted. This process is performed by an operator with only a small amount of non-horizontal parts. The horizontal line drawn by the data creates the desired horizontal line. to ensure that it is removed.

不注意なデータポイント信号を除去した後、線は残りの隣接したデータポイント 信号間に形成され、変更されたフリーマンコードFCと比較される。もし線が、 許容境界1!AsからA8の1つの中に含まれる場合は、それと組合せたフリー マン単位ベクトルPV1からFV、が記憶装置26cへ送られる。もし2つのデ カルト座標データポイント信号間に形成された線がフリーマンコードPCKおけ る無効な境界mX*からX8の1つの中和含まれる場合は、第2デカルト座標デ ータポイント信号が次の先行するデカルト座標データポイント信号によって置換 され、新しい線が間に形成される。同様に、新しい線は、その線が有効な境界線 A!からA、01つの中に位置するかどうかを見つけるために、もう1度フリー マンコードPCと比較される。もし結果的な線が有効境界組人N内に含まれる場 合は、境界JANと岨合わせたフ9− wン単位ベクトルFVNが記憶装置26 Cへ送られる。しかしながら、もし有効なフリーマン単位ベクトルが見出されな い場合は、対のうちの第2データボイツト信号は次の先行するデータポイント信 号によって置換され、同じ処理が繰り返される。もし有効境界線AN内にある線 が、入力されたプリミティブに対して生成され友残りのデカルト座標データポイ ントの各々を代用し友後もまだ見出されない場合は、デカルト座標は無効なフリ ーマン単位ベクトルU′によって表わされ、無効なフリーマンベクトルが記憶装 置26cへ送られる。After removing the inadvertent data point signal, the line represents the remaining adjacent data points is formed between the signals and compared with the modified Freeman code FC. If the line is Tolerance boundary 1! If it is included in one of As to A8, the free combination thereof Mann unit vectors PV1 to FV are sent to the storage device 26c. If two de The line formed between the cult coordinate data point signals is the Freeman code PCK. If the invalid boundary mX* to X8 contains one neutralization, then the second Cartesian coordinate data point signal is replaced by the next preceding Cartesian coordinate data point signal and a new line is formed between them. Similarly, the new line will be the border that the line is valid for. A! Free again to find out whether A, 01 is located from Compared with Mancode PC. If the resulting line is contained within the effective boundary group N In this case, the unit vector FVN of 9-wn combined with the boundary JAN is stored in the storage Sent to C. However, if a valid Freeman unit vector is not found If the second data point signal of the pair is The same process is repeated. If the line is within the effective boundary AN is the remaining Cartesian coordinate data point generated for the input primitive. If the coordinates are still not found after substituting each of the The invalid Freeman vector is represented by the unit vector U′, and the invalid Freeman vector is It is sent to the station 26c.

従って、入力されたプリミティブの各々に対する一連のフリーマン単位ベクトル PViからPvNまたはU’が形成され、記憶装置26c K別々に記憶される 。一連の単位ベクトルは、次にコンパレータ26dへ別々(送られる。コンパレ ータ26dは、各々の単位ベクトルFVi+uy前の単位ベクトルFViと比較 し、もしそれらが等しい場合は、その単位ベクトルに対するスカシカウントは増 加し、単位ベクトルPV i + tは削除される。この処理は、入力されたプ リミティブPrの各々に対して生成された単位ベクトルに関して遂行される。こ の操作は、文字を形成する各々の入力されたプリミティブ九対する削減された一 連の単位ベクトルまたはベクトルコードを形成する結果となり、各々のベクトル コードは組合せた一連のスカシを有し、そのスカシはベクトルコードにおける単 位ベクトルの各々の長さを表わす。Therefore, a set of Freeman unit vectors for each of the input primitives PvN or U' is formed from PVi and stored separately in the storage device 26c K . The series of unit vectors are then sent separately to comparator 26d. The data 26d compares each unit vector FVi+uy with the previous unit vector FVi. and if they are equal, the skasi count for that unit vector increases. In addition, the unit vector PV i + t is deleted. This process This is performed on the unit vectors generated for each of the primitives Pr. child The operation is a reduced one for each input primitive nine forming a character. The result is to form a series of unit vectors or vector codes, with each vector The code has a series of combinations of scales, and the scales are simple in the vector code. represents the length of each position vector.

例えば、もし第1および4図に示される表意文字ICが装置10に:入力された 場合は、コンパレータ26mは先ず第11C,第1プリミテイブPrlと組合さ れたデカルト座標データポイント信号調べ、各々瞬接し友データポイントP11 からPl、の間にそれぞれ@L1凰からLl、 t−形成する41紐L11から Ll4は次いで、フリーマンコードFCと比較され、組合されたフリーマンベク トルFViからFVMが線に割り当てられる。従りて、1a4図に示されるよう に、デカルト座標データポイン)Pl、からPl、により形成され、かつ1lL 1tからLl4 t−生成するプリミティブPrlは、IBLllからLl、が 境界組人、内にあるので(IIの各々の長さはスレッショルド値以上であるとみ なして)、7 リ−w y ヘ/ ) ルPV3 、FV3 、 FV3 、  FVm’t 割り ”1 テられる。For example, if the ideogram IC shown in FIGS. 1 and 4 is input into the device 10, In this case, the comparator 26m is first combined with the 11th C and the first primitive Prl. Examine the Cartesian coordinate data point signal, each instantaneous contact data point P11 to Pl, respectively @L1 凰 to Ll, t- form 41 strings L11 to Ll4 is then compared with the Freeman code FC and the combined Freeman vector FVi to FVM is assigned to the line. Therefore, as shown in Figure 1a4 , formed by Cartesian coordinate data points) Pl, to Pl, and 1lL 1t to Ll4 t-The generated primitive Prl is IBLll to Ll, Since the boundary is within (the length of each II is greater than or equal to the threshold value) None), 7 li-w y he/) le PV3, FV3, FV3, FVm't divided by "1".

プリミティブPr1K対して生成されたベクトルの各々と共に、一連のベクトル が記憶装置26cへ送られ、その中に記憶される。上述した処理は、次いで、プ リミティブPr2およびPrsと組合せたデカルト座標データポイン)KI$! 3して遂行され、その結果形成されたベクトルも記憶装置t 26Cへ送られる 。これに引続いて、各プリミティブPr に対スルフリーマンベクトルがコンパ レータ24dへ送られる。その後、各プリミティブに対して生じる隣接フリーマ ンベクトルが比較される。もし隣接するベクトルが同一である場合は、ベクトル の一方が削除され、スカシカウントが増加する。コンパレータ26dKよる結果 は、次に記憶装置26eへ送られる。A set of vectors, with each of the vectors generated for primitive Pr1K is sent to storage device 26c and stored therein. The process described above then Cartesian coordinate data point in combination with the primitives Pr2 and Prs) KI$! 3 and the resulting vector is also sent to the storage device t26C. . Following this, each primitive Pr has a comparably freeman vector. It is sent to the controller 24d. Then, the resulting adjacent free map for each primitive vectors are compared. If the adjacent vectors are identical, then the vector One of them will be deleted and the Sukasi count will increase. Results from comparator 26dK is then sent to storage device 26e.

例えば、第4a図に示されるプリミティブPrlが一連のフリーマンベクトルi ;’v、 、 FV、 、 pv、 、 FV、を形成すべく処理されると、コ ンパレータ2411は一連のベクトルを14のスカシを有するベクトルコードF V、 VC削減させる。For example, if the primitive Prl shown in Figure 4a is a series of Freeman vectors i ;’v, , FV, , pv, , FV, when processed to form the A comparator 2411 converts a series of vectors into a vector code F having 14 spaces. V, VC reduction.

もし、例えばプリミティブが入力されて、それに対してFVI −FVB 、  TVs −FV4 、FV4 、 FV4 、FVB −FVB −FVs K  ”I シい一連のフリーマンベクトルが生成された場合、一連の単位ベクトル はベクトルコードFVs、 FV4. FV、 、 FV、  K削減されS、  3.2.1に等しい一連のスカシが生成されることになる。For example, if a primitive is input and FVI - FVB, TVs -FV4, FV4, FV4, FVB -FVB -FVs K If a series of freeman vectors is generated, a series of unit vectors is vector code FVs, FV4. FV, , FV, K reduced S, A series of squash equal to 3.2.1 will be generated.

入力された文字を形成する各プリミティブに対するベクトルコードおよび組合せ た一連のスカシは、記憶g&置26eからプリミティブ検出部28へ送られる。Vector codes and combinations for each primitive forming the input character The series of search results are sent to the primitive detection unit 28 from the memory 26e.

ベクトルコードはコンパレータ281へ付与され、一連のスカシは記憶装置28 cに記憶される。コンパレータ28aによって受取られたベクトルコードは、プ リミティブの辞書28bに記憶されたベクトルコードと比較される。辞書28は 16のプリミティブコードの項に区分けされており、そのうちの最初の15の項 では15のプリミティブPraからPr6の1つと独自に組合わされ、そのプリ ミティブと独自に組合わされたベクトルコードを記憶する。第16項は1つ以上 のプリミティブを表わすことのできるあいまいなベクトルコードを含んでいる。The vector code is given to the comparator 281, and a series of vector codes are given to the storage device 28. It is stored in c. The vector code received by comparator 28a is It is compared with the vector code stored in the dictionary 28b of the primitive. Dictionary 28 is It is divided into 16 primitive code terms, of which the first 15 terms is uniquely combined with one of the 15 primitives Pra to Pr6, and the primitive Stores vector codes uniquely combined with primitives. Clause 16 is one or more contains ambiguous vector code that can represent primitives.

第16項はまえ、各あいまいなベクトルコードに対する独自のテスト情報も含ん でおり、正確な入カグリミティプが決められることを可能にする。Section 16 also contains unique test information for each ambiguous vector code. , which allows the exact input limit to be determined.

もし入力されたプリミティブに対するベクトルコードが、辞書28bが最初の1 5の項目の1つ(見出されるベクトルコードと等しい場合は、それと組合わされ たプリミティブコード1から0が記憶装置30へ送られる。この処理は、入力さ れた文字全形成する各プリミティブに対して生じるベクトルコードの各々に対し て遂行される。If the vector code for the input primitive is 5 (combined with the found vector code, if equal) The generated primitive codes 1 to 0 are sent to the storage device 30. This process For each vector code generated for each primitive forming the entire character will be carried out.

このようにして、一連のプリミティブコードま几は文字コードが生成されるが、 文字コードはディジタイザータブレッ)20に入力された表意文字を表わす。In this way, character codes are generated from a series of primitive codes, The character code represents the ideogram input into the digitizer tablet 20.

しかしながら、プリミティブの1つに対して生ずるベクトルコードが辞書28b の内容と比較され、それが第16項に記憶されたベクトルコードに等しい時は、 あいまいなベクトルコードと組合せたテスト情報はテスト部28dに付与される 。テスト部28dFiテスト情報を受取9、どのベクトルコードが調べられてい るかを決めるためにその情報を調べる。その後、テスト部28dは、調べられた ベクトルコードと組合わされた一連のスカシを受取り、それに関する操作を行な うが、その操作は独自のテスト情報によって決められる。テストの結果は、入力 されたプリミティブを表わす正確なプリミティブフードtv<に選択する辞@2 8bへ送り戻される。一連のスカシは、ベクトルコードはあいまいであるけれど も、連続している各スカシの値は非常に異なること全特徴とするので、各々のあ いまいなベクトルコード関で識別する之めに適当な情報を提供する。However, the resulting vector code for one of the primitives is and when it is equal to the vector code stored in the 16th term, The test information combined with the ambiguous vector code is given to the test section 28d. . Test part 28 Receives dFi test information 9 Which vector code is being examined? Examine that information to determine which Thereafter, the test section 28d was examined. Receive a sequence of vector codes combined with vector codes and perform operations on them. However, its operation is determined by proprietary test information. The results of the test are entered @2 Select the correct primitive food tv to represent the given primitive. Sent back to 8b. Although the vector code is ambiguous, Also, since the values of each successive square are very different from each other, Provide appropriate information to identify bad vector codes.

例えば、第8為図に示されるプリミティブPrBがタブレッ)20PC入力され た場合、FVl、 rv、 、 PVlに等しいベクトルコードが生成されるこ とになる。しかしながら、このベクトルコード#1jllb図に示されるプリミ ティブPrbt表わす友めにも使用されるので、そのベクトルは辞書28bの第 16項に見出されることになる。2つのプリミティブに対するベクトルコードは 同一であるけれども、それらと組合わされる一連のスカシは非常に異なる。For example, the primitive PrB shown in the 8th diagram is input with 20 PCs (Tablet). If It becomes. However, the primitive shown in this vector code #1jllb diagram It is also used to represent the vector Prbt, so its vector is the number one in the dictionary 28b. It will be found in Section 16. The vector code for the two primitives is Although identical, the series of squashes associated with them are very different.

プリミティブPr2と組合わされた一連のスカシは3.1゜5となり、一方プリ ミティブPrbと組合わされた一連のスカシは1.5. iとなる。従って、一 連の中の最初の2つのスカシ間の相対長さを比較することによって、正確なプリ ミティブコードを決定することができる拳もし、辞書28bの内容と比較される ベクトルコードがその中に位置決めされたベクトルコードと等しくない場合は、 ベクトルコードは、同様に記憶装置50に付与される未確認のプリミティブコー ドUを割り当てられる。The series of squares combined with primitive Pr2 is 3.1°5, while the A series of skis combined with Mitib Prb is 1.5. becomes i. Therefore, one The exact prefix can be determined by comparing the relative lengths between the first two squashes in the run. If the primitive code can be determined, it is compared with the contents of the dictionary 28b. If the vector code is not equal to the vector code positioned within it, then The vector code is also an unconfirmed primitive code assigned to the storage device 50. Assigned a deU.

従って、プリミティブ検出部2Bの出力は一連のプリミティブコードまたは入力 された表意文字ICQ表わす文字コードを含む。Therefore, the output of the primitive detection section 2B is a series of primitive codes or input Contains the character code representing the ideographic character ICQ.

記憶装置30に記憶された文字コードは文字コード認識部S2へ付与され、コン パレータ321によって受取られる。コンパレータS2xは文字コードを1人力 された文字のために生成された文字辞ii 32bの内容と比較される。The character code stored in the storage device 30 is given to the character code recognition section S2, and the character code is It is received by the parator 321. Comparator S2x can be coded by one person It is compared with the contents of the character dictionary ii 32b generated for the character.

前述した通り、辞書52bは対厄する国際ASCII出力コードと一緒に、可能 な表意文字の各々に対する文字コードを言語で記憶する。国際ASCII出力コ ードは表意文字を表わす友めに国際的に使用される。幾つもの表意文字が同一順 序で入力さ九几同−プリミティブによって形成されるので、入力され友プリミテ ィブ間の相対位置は非常に異なるけれども、いくつかの表意文字は同一の文字コ ードを有する。あいまいな文字コードが受取られた時に、装置10が適当な表意 文字を検出することを可能くする丸め、文字辞書32bFi各あいまいな文字コ ードと独自に組合わされたテスト情報も含んでいる。As mentioned above, the dictionary 52b can be used with the compatible international ASCII output code. The character code for each ideogram is stored in a language. International ASCII output code The code is used internationally to represent ideograms. several ideograms in the same order It is formed by the input nine primitives, so the input friend primitive Some ideograms are the same character code, although the relative positions between them are very different. It has a code. When an ambiguous character code is received, the device 10 generates an appropriate representation. Rounding that allows you to detect characters, character dictionary 32bFi each ambiguous character code It also includes test information uniquely combined with the code.

文字コードが記憶装置30から受取られると、それはコンバラメータ321ヲ経 て辞書52bの内容と比較される。When the character code is received from the storage device 30, it is passed through the conbalameter 321. The data is compared with the contents of the dictionary 52b.

もし受取られ丸文字コードが、1つだけの表意文字と独自に組合わされている辞 書S2bに見出される文字コード(等しい場合は、それと組合わされた国際A8 CII出力コードが辞書32bから出力されて、記憶装置54に記憶される。し かしながら、入力された表意文字に対して生じる文字コードが、1つ以上の表意 文字と組合わされているあいまいな文字コードに等しい時は、それと組合わされ た独自のテスト情報が文字識別器32cへ付与されるウテスト情報を受取ると、 識別器32cは記憶装置22から未処理のデカルト座標データを検索し、入力さ れ九表意文字を表わす国際A、90II出力コードを決めるために、テスト情報 によって決められたようにそのデータに関する操作を遂行する。テスト操作を遂 行する時、未処理デカルト座標データは、入力され友プリミティブの各々の相対 位置に関係する情報金倉んでいるので、未処理のデカルト座標データポイントが 、表意文字に対して形成され几一連のスカシに対立するものとして使用される。If the received round character code is a word uniquely combined with only one ideogram The character code found in document S2b (if equal, the international A8 combined with it) The CII output code is output from the dictionary 32b and stored in the storage device 54. death However, the character code that occurs for the input ideogram may be one or more ideograms. When it is equal to an ambiguous character code that is combined with a character, Upon receiving the test information in which unique test information is given to the character identifier 32c, The discriminator 32c searches the storage device 22 for unprocessed Cartesian coordinate data, and test information to determine the International A,90II output code representing the nine ideograms. perform operations on that data as determined by. Complete the test operation raw Cartesian coordinate data is entered relative to each of the friend primitives. Since the information related to the location is stored, the raw Cartesian coordinate data points are , formed for the ideogram and used as opposed to the 几 series of sqashi.

正確な国際ASCII出力コードが決定されると、それが同様に記憶装置34へ 送られる。Once the correct international ASCII output code is determined, it is also stored in storage 34. Sent.

例えば、もし第1図に示きれる表意文字が装置九入力された場合は、@!ba″ に等しい文字コードが生じ、辞書32bの内容と比較される。しかしながら、第 9mおよび9b図にそれぞれ示される表意文字IC2およびIC3もまた同じ文 字コード@abs ’によって表わされるので、文字コードはあいまいでおると みなされる。文字コード″aba”と組合わされた独自のテスト情報L1記憶装 置22からの未処理デカルト座標データと共に、微分器32cへ付与されること になる。この例では、テスト情報によって識別器S2cは、第2プリミテイブP rzが第1プリミティブPr11−通過するかどうかを決めるtめに、第1プリ ミテイブPrlに関して第2プリミテイブPr雪の位[’に調べる結果となる。For example, if the ideograms shown in Figure 1 are input into the device, @! ba″ A character code equal to is generated and compared with the contents of dictionary 32b. However, the first The ideograms IC2 and IC3 shown in figures 9m and 9b, respectively, also represent the same sentence. It is represented by the character code @abs, so the character code is ambiguous. It is regarded. Unique test information L1 storage device combined with character code "aba" along with the raw Cartesian coordinate data from the location 22 to the differentiator 32c. become. In this example, the test information causes the discriminator S2c to identify the second primitive P rz passes through the first primitive Pr11. The result is to check the position of the second primitive Pr with respect to the primitive Prl.

もしこのテストの結果が否定的である場合は、表意文字ICFi、その機能が文 字IC2に存在していないので、表意文字IC2ic等しくないことを認識する ことになる0表意文字ICおよびIC3間で識別するには、第3プリミテイブP r3が、入力表意文字ICを形成する第1プリミテイブPrlと比較され、双方 間の相対寸法が調べられる。このテストの結果は、プリミティブPr4がプリミ ティブPrSよりも小さいので、識別器52eが正確な国際ASCII出力コー ドを選択するのを可能にする。辞書32bF′i識別器32Cvcよりて生成さ れ定結果金受取り、正確な国際ASCII出力コードが記憶装置64へ送られる 。If the result of this test is negative, the ideogram ICFi, its function is It is recognized that the ideogram IC2ic is not equal because it does not exist in the character IC2. To distinguish between the corresponding 0 ideograms IC and IC3, the third primitive P r3 is compared with the first primitive Prl forming the input ideogram IC, and both The relative dimensions between are examined. The result of this test shows that primitive Pr4 is The discriminator 52e uses the correct international ASCII output code. allows you to select a mode. The dictionary 32bF'i is generated by the discriminator 32Cvc. After receiving the fixed result, the correct international ASCII output code is sent to the storage device 64. .

国際人8CII出力コードが決定され、記憶装置54に記憶された後に、それは 、プリンター16a、VDT端末装置16bま友はオーディオシンセサイザーI Sc等の出力装置へ、入力表意文字のイメージを作成するために付与される。After the International Person 8CII output code is determined and stored in storage device 54, it is , printer 16a, VDT terminal device 16b, audio synthesizer I It is given to an output device such as Sc in order to create an image of the input ideogram.

しかしながら、もし、プリミティブの1つまたはそれ以上が未確認のプリミティ ブコードUを割り当てられ九一連のプリミティブコードから文字コードが形成さ れる場合、あるいはもし文字コードが文字辞書52bに見出される文字コードの いずれにも等しくない場合は、文字コードは置換・訂正部56に付与される。置 換・訂正部36は確率マ) +7ツクス56at−備えており、それは横16行 、縦15行のレジスター361′ の配列の形になっている。However, if one or more of the primitives is an unidentified primitive A character code is formed from a series of nine primitive codes assigned a primitive code U. or if the character code is one of the character codes found in the character dictionary 52b. If neither is equal, the character code is given to the replacement/correction unit 56. Place The conversion/correction unit 36 is equipped with a probability matrix) +7x56at-, which has 16 horizontal lines. , in the form of an array of registers 361' with 15 vertical lines.

第10図に示されるように、マトリックスの各横列は未確認のプリミティブコー ドUも含めて、可能性のある16のプリミティブコードaからOの1つと組合わ され、マトリックスの各縦列1j15の可能性のあるプリミティブコード1から Oの1つと組合わされている。レジスター36a′ の各々は、横列のプリミテ ィブコードが縦列のプIJ ミティブコードと間違えられる確率を表わす数を含 んでいる。As shown in Figure 10, each row of the matrix represents an unidentified primitive code. combination with one of the 16 possible primitive codes a through O, including do U. and each column 1j15 of the matrix has a possible primitive code 1 to It is combined with one of O. Each of the registers 36a' is a row primitive. Contains a number representing the probability that a primitive code will be mistaken for a vertical primitive code. I'm reading.

従って、プリミティブコードがそれ自体として見出される確率が高いので、マト リックスsbaの左から右への対角−に沿ってレジスタに記憶され友確率値はす べて1の値を有する。2つの大して類似していないプリミティブが互いに間違え られる可能性は大して起こりそうもないので、2つの類似しないプリミティブと 組合わされたレジスタに記憶される確率値はゼロであることt−特徴とする0例 えば、マトリックス56mの、プリミティブPryと組合わされている第1列を 見ると、これらのプリミティブは形成される方法が非常に異なるので、プリミテ ィブPryがプリミティブPrcと実際に間違えられる確率は(LOである。他 のプリミティブに何らかの類似性を有するプリミティブは、双方間の類似点の数 によって、cLlないしLIL9の範囲の確IE[’kl14シ当てられる。Therefore, there is a high probability that primitive code will be found as such, so The friend probability values stored in registers along the diagonal from left to right of Rix sba are all All have a value of 1. Two dissimilar primitives can be mistaken for each other Since it is very unlikely that two dissimilar primitives The probability value stored in the combined register is zero. For example, the first column of matrix 56m, which is associated with primitive Pry, is As you can see, these primitives are formed in very different ways, so The probability that the primitive Pry is actually mistaken for the primitive Prc is (LO. A primitive that has some similarity to a primitive has the number of similarities between them. The exact IE['kl14 in the range cLl to LIL9 is assigned by.

文字コードが、少な(とも1つの未aNのプリミティブコードUt−含んでいる コンパレータsbbに受取られ九時は、プリミティブコードUと組合わされた横 列の確率が調べられる。横列に訃ける最高確率値が発見された時は、未確認のプ リミティブコードUを置換する友めに縦列のプリミティブコードが使用される。The character code contains a small number (and one un-aN primitive code Ut) The 9 o'clock received by comparator sbb is the horizontal You can check the probability of a column. When the highest probability value of dying in the row is discovered, the unconfirmed A column of primitive codes is used to replace the primitive code U.

その結果生じた文字コードはコンパレータ321に送り戻され、結果的な文字コ ードが辞書の中に見出される文字コードに等しいかどうか識別する几めに文字辞 書32bの内容と比較される。もし結果的な文字コードが辞書の中の文字コード と等しい場合は、国際ム8CII出力コードが辞書!2bから検索されて、それ を記憶する記憶装置34へ送られる。The resulting character code is sent back to comparator 321, which outputs the resulting character code. A character string used to identify whether a code is equal to a character code found in the dictionary. It is compared with the contents of Book 32b. If the resulting character code is a character code in the dictionary If it is equal to , the international module 8CII output code is a dictionary! Searched from 2b, it The data is sent to the storage device 34 where it is stored.

もし結果的な入力文字コードがあいまいな文字コードに等しい場合は、正確な国 際人、9CII出力コードを決めるために、前述し友ものと同じ方法で記憶装置 22に記憶されたデカルト座標データに関するテストが遂行される。If the resulting input character code is equal to the ambiguous character code, then the exact country In order to determine the 9CII output code, use the same method as mentioned above to store the storage device. A test is performed on the Cartesian coordinate data stored in 22.

しかしながら、もし結果的な文字コードが辞書S2bに見出される文字コードに 等しくない場合、またはもし初めから入力されt文字コードが辞書32bに見出 される文字コードと一致しない場合は、第2の置換が遂行される。上記の例の1 つが起こった時は、文字コードはコンパレータ36bへ送られ、文字コードを形 成するプリミティブコードの数を識別する友め調べられる。これに引続いて、同 数のプリミティブコードから形成された文字辞書52bにンける各文字コードが コンパレータ36bへ送られ、未確認文字コードと比較される。この比較中に、 文字コードの各々全形成するプリミティブコードおよび未確認文字コードを形成 するプリミティブコードの間の差の数が調べられる。もし文字コードと未確認文 字コード間で見出される差のaがスレッショルド値より大きい場合は、その文字 コードは破棄される。However, if the resulting character code is the character code found in dictionary S2b If they are not equal, or if they were entered from the beginning and the t character code is found in the dictionary 32b. If the character code does not match, a second substitution is performed. Example 1 above When a character code occurs, the character code is sent to comparator 36b to form a character code. It is possible to identify the number of primitive codes that make up the code. Following this, the same Each character code in the character dictionary 52b formed from numerical primitive codes is It is sent to the comparator 36b and compared with the unconfirmed character code. During this comparison, Each of the character codes forms a primitive code and an unidentified character code. The number of differences between the primitive codes is examined. If character code and unconfirmed sentence If the difference a found between the character codes is greater than the threshold value, then the character The code will be discarded.

しかしながら、あらゆる文字コードがスレッショルド須よりも小さい数の差を有 することに気づい几場合は、その文字コードと組合わされる国際人8CII出力 コードが記憶装置S6cに記憶される。記憶装置56cK記憶される国際出力コ ードの順序は、記憶装置内の第1の国際A8CII出力コードが未確認文字コー ドに最も類似した文字コードと組合わされるように決められる。記憶装置56C K記憶され九国際出力コードは、次いで記憶装置56cから検索され、さら1c VD’ll末装置へ送られ、それによって、入力された表意文字に量も等しいと 思われる表意文字の各々をユーザに表示する。そこでユーザー社、適当な編集用 ソフトウェアt−紐て装置10に入力された表意文字に一致する表意文字を選ぶ ことができる。もし置換部36が、望ましい表意文字を作成しない場合は、辞書 52bから正確な国際A8CII出力コードを検索するため(、編集プログラム が使用され得る・記憶装置54WC記憶され九表意文字信号は、入力された表意 文字の再生が生じるのを可能にするため、プリンター162に結合される。その 上、すでに装[I OK入力されている文字を1ユーザが見ることができるよう に、文字信号1i−VDTスクリーン16bへ送ることができる。装5110は まえ、ユーザが記憶装置34に記憶された表意文字信号を変えることができるよ うに、既知の編集プログラムで機能することも可能である。However, every character code has a difference in number less than the threshold value. If you notice that the character code is combined with the International 8CII output The code is stored in storage device S6c. International output code stored in storage device 56cK The order of the codes is such that the first international A8CII output code in storage is the unidentified character code. The code is determined to be combined with the character code most similar to the code. Storage device 56C K stored nine international output codes are then retrieved from storage device 56c, and further 1c is sent to the VD'll terminal device, thereby indicating that the amount is equal to the input ideogram. Each possible ideogram is displayed to the user. Therefore, User Company, for appropriate editing Software t-Select an ideogram that matches the ideogram input to the stringing device 10 be able to. If the replacement unit 36 does not create the desired ideogram, the dictionary To find the exact international A8CII output code from 52b (, editing program The nine ideogram signals stored in the storage device 54WC can be used to store input ideograms. It is coupled to a printer 162 to enable reproduction of characters to occur. the Above, one user can see the characters that have already been input The character signal 1i can then be sent to the VDT screen 16b. The equipment 5110 is Beforehand, the user can change the ideographic signals stored in the storage device 34. It is also possible to work with known editing programs.

装置が異なる言語の文字を認識すべく機能するように、装置10が他のモードの 1つに条件付けされた時は、第5図に示されたものと同じ組のプリミティブが文 字音形成するために使用される。第5図に示されるプリミティブは、覆々の言語 における文字の全てがこれらのプリミティブから形成され得るので、表意文字お よび大文字の英語文字を形成するのに:特に役立つことは明白なはずである。し かしながら、全ての言語における文字の全てが形成され得るように、他のプリミ ティブが加えられてもよいことが認められねばならないが、しかし、20個のプ リミティブがあらゆる言語の実質止金ての文字を形成することが可能でなければ ならないのて、このようなことが可能でなければならないので、このようなこと はめつ几にない。The device 10 may operate in other modes so that the device functions to recognize characters in different languages. When conditioned on one, the same set of primitives shown in Figure 5 is Used to form glyphs. The primitives shown in Figure 5 are Since all of the characters in can be formed from these primitives, ideograms and It should be obvious that it is particularly useful: for forming uppercase and uppercase English letters. death However, other primitives can be formed so that all letters in all languages can be formed. It must be recognized that more than 20 pts may be added; Unless it is possible for primitives to form virtually every character in any language Because something like this should be possible, something like this should be possible. It's not in Hametsuka.

前に述べたように、処理装置1i14内の辞書はその他の言語における各大文字 のための禮々のプリミティブコード、文字コードおよびASCII出力コードを 含むそれぞれの区画で区分けされている。大文字は言語に精通している誰もが同 じ方法および順序で書込まれることを特徴としているので、そのような文字が装 置に記憶される。As mentioned earlier, the dictionary in processing unit 1i14 contains each uppercase letter in other languages. Generous primitive codes, character codes and ASCII output codes for It is divided into sections including: Uppercase letters are the same for everyone familiar with the language. Characteristically, they are written in the same way and order, so such characters are stored in the location.

処理装置の各種の部にまた、同一文字コードを生成する多種多様の文字が認識さ れることを可能にする友め、テスト情報も備えている。Various parts of the processing unit also recognize a wide variety of characters that generate the same character code. It also includes testing information that will allow you to test your skills.

文字を形成する時にプリミティブPrpからPrtK@似し九糎素を使用する言 語に対しては、プリミティブP r pからPr<の中の1つがタブレット20 に入力される時以外は、フリーマンコーディングを使用する前述したものと同じ 方法で、プリミティブ検出およびプリミティブコード決定が行なわれる。従って 、プリミティブがタブレット20に人力されると、フリーマンコーディングも使 用する前に、プリミティブの湾aK(すなわ’f)1800゜270°、 56 0” )  を決めるために、プリミティブに沿って抽出されt点の間に形成さ れる級のタンジェントを機能抽出部26が調べる。Words that use the primitive Prp to PrtK@ similar nine elements when forming characters. For words, one of the primitives Prp to Pr< is the tablet 20 Same as above using Freeman coding except when input to The method performs primitive detection and primitive code determination. Therefore , when the primitives are manually input to Tablet 20, Freeman coding is also used. Before using the primitive bay aK (namely 'f) 1800° 270°, 56 0”), the The function extraction unit 26 examines the tangent of the class.

もしプリミティブが実質上270  またはs6o’″の湾曲[t−有すること が分かった場合は、入力されたプ9(ティグPr3ま友FiPrtと組合わされ たプリミティブコード$またはtが、それ以上の処理を行なうことなく直ちに決 定される。もしプリミティブの湾曲度がは’f180@であることが分かった場 合は、プリミティブの開始および終了座標データ信号が、タンジェントの方向( すなわち右′!iAりまたは左廻シ)に沿って調べられる。これは、プリミティ ブPrpからPrrがそれ以上の処理を行なうことなく識別されることを可能に する。そのほか、もしタンジェントを調べ皮時に、入力されたプリミティブが実 質上一定の勾配を有するとは見分けられなかり友場合は、処理済みの座標データ 信号を、正確なプリミティブコードを決定するためにフリーマンコーディングを 使って処理する。If the primitive has substantially 270 or s6o''' curvature [t- If it is found, the input Pr9 (combined with Tig Pr3 Mayu FiPrt) The primitive code $ or t determined immediately without further processing. determined. If the curvature of the primitive is found to be 'f180@ If the primitive start and end coordinate data signals are in the tangent direction ( In other words, right′! iA or counterclockwise direction). This is a primitive Allows Prr to be identified from Prp without further processing. do. In addition, if you check the tangent and the input primitive is If it cannot be determined that the gradient is qualitatively constant, use the processed coordinate data. Freeman coding the signal to determine the exact primitive code. Use and process.

例えば、第11図を参照すると、もし装置が英語の文字を認識すべく条件付けさ れ、文字1MIがタプレッ)20に入力された場合は、文字を形成するためにプ リミティブPrba Prg 、 Prc* Prbが使用される。これらのプ リミティブは、前に説明し友ものと同じ方法で、機能抽出部26およびプリミテ ィブ検出部によって処理される。For example, referring to Figure 11, if the device is conditioned to recognize English letters, If the character 1MI is entered in tuplet 20, then The primitives Prba Prg and Prc* Prb are used. These The primitives are connected to the feature extractor 26 and the primitives in the same way as the companions described earlier. processed by the live detection unit.

従って、’bgcd’に等しい文字コードが生じることになる。このコードは英 語の文字′M′と組合わされるだけであるから、組合わされた人5CIX出力コ ードが出力されることになる。Therefore, a character code equal to 'bgcd' will result. This code is Since it is only combined with the letter 'M' of the word, the combined person 5CIX output code The code will be output.

もし例えば、第12図に示されるように英語文字′D′および′P′がタブレッ )20に入力された場合は、各文字に対して生成される文字コードは、両方の文 字を形成するプリミティブがPrbおよびPrqになるので、′bqIとなる。For example, if the English letters 'D' and 'P' appear on the tablet as shown in Figure 12, )20, the character code generated for each character is Since the primitives forming the character are Prb and Prq, 'bqI' is obtained.

従って、もしこれらの文字の一方が入力されると、文字辞書に記憶され友テスト 情報が前に説明したものと類似した方法で使用され、プリミティブPrbの長さ およびプリミティブPrqの開始点と終了点の間の長さが調べられる。これは、 2つの文字に対して生成された文字コードがたとえ同じであっても、2つの文字 が識別されることを可能にする。Therefore, if one of these characters is entered, it will be stored in the character dictionary and the friend test The information is used in a manner similar to that described previously, and the length of the primitive Prb and the length between the start and end points of primitive Prq is checked. this is, Even if the character codes generated for the two characters are the same, be identified.

ドイツ語、フランス語等の他の言語に関しては、装置が手段18を蛙て適当なモ ード条件付けされねばならないけれども、手書き文字全検出する方法は同じでお る。For other languages such as German, French, etc., the device may override the means 18 and use a suitable module. Although the code must be conditioned, the method for detecting all handwritten characters is the same. Ru.

これは、人8CII出力コードは異なるけれど4言iit形成する文字が同一で あるドイツ語、フランス語および英語などの言語の場合には必要なことでさえあ る。置換マトリックスは、数少ない文字が非表意言語に使用されるため必要では ないけれども、他の言語の各々に対して使用することもできる。This means that although the human 8CII output code is different, the characters forming the 4 words are the same. In some languages such as German, French and English this may not even be necessary. Ru. A substitution matrix is not necessary since a small number of characters are used for non-ideographic languages. Although not available, it can also be used for each of the other languages.

また、装置10が言語の大文字を検出するように条件付けされている場合、もし 希望があれば、装置には検出された大文字に相当する小文字に対するASCII ?出力する友めのソフトウェアも備えられる。小文字は大文字と類似し友方法で 検出され得るけれども、小文字は個人1ツ人で違り良形で書かれることt−%黴 とするので、検出処理な一層困1IIK″し、文字が書かれる数多(の可能性の ある方法で文字の検出を可能にするため、さらに大きな記憶スペースを必要とす る。Also, if the device 10 is conditioned to detect uppercase letters in a language, If desired, the device will provide the ASCII equivalent of the lowercase letter for the uppercase letter detected. ? Companion software for output is also provided. Lowercase letters are similar to uppercase letters in a similar way. Although it can be detected, lowercase letters may vary from person to person and may be written in a good form. This makes the detection process even more difficult, and the possibility of a large number of characters being written. Requires more storage space to allow character detection in a certain way Ru.

本装置は、辞書のための情報を記憶すべく機能する20Mbバー)’デ4Xりを 具備した、IBMaOIBM PCXTパーソナルコンピュータに使用されてい る。上記に説明した識別処理を行なうために、コンビエータには、入力デカルト 座標データポイント信号が上述した方法で処理されることを可能にする適当なソ フトウェアが備えである。辞書32bには大量のデータ、すなわちおよそs c u o 。This device has a 20Mb bar)'de 4X function to store information for the dictionary. Used in the IBM PCXT personal computer equipped with Ru. In order to perform the identification process described above, the combiator has an input Cartesian A suitable software that allows the coordinate data point signals to be processed in the manner described above. Be prepared with your own software. The dictionary 32b contains a large amount of data, approximately s u o .

個の様々な表意文字に対する文字コードおよびそれと組合わされた国際出力コー ド、が記憶されているので、入力された表意文字に対して生成された文字コード および記憶された文字コードの間での検出速度を増加させるために、当業者が周 知のBツリー アルゴリズムが使用される。Bツリー アルゴリズムは処理速度 を増加させるけれども、インデックス用ファイルが必要である九め、メモリ必要 条件本増加する。character codes for various ideographs and their associated international output codes. Since the code is memorized, the character code generated for the input ideogram is and memorized character codes to increase the detection speed. A well-known B-tree algorithm is used. B-tree algorithm has high processing speed However, index files are required, and memory is required. Condition books increase.

本装置10は、従来型パーソナルコンビエータに連結することのできる小型集積 回路基板に製作することもでき、その集積回路基板は、多種多様な辞書内容を記 憶する友めのROMコンポーネントおよびデータ処理機能を行なう几めに適当な ソフトウェア金偏えたマイクロプロセッサを具備している。The device 10 is a small integrated unit that can be connected to a conventional personal comviator. It can also be fabricated on a circuit board, and the integrated circuit board can store a wide variety of dictionary contents. The ROM component of the storage friend and the appropriate structure to perform the data processing functions. Equipped with software gold-biased microprocessor.

従って、本装置は、同一順序で入力された同一プIJ (ティグから形成されて いる文字の間で識別することができるという利点を提供する。これは、正確な表 意文字を選択するためにオペレータがデータ入力操作を停止せねばならない事鰭 の発生ば減少させる。その上、置換手段が、もし入力文字が装置10に見出され ない場合は、本装置が、入力され九文字コードに最も類似している別の文字コー ドを選択することを可能和するので、上述した!j!態の発生tさらに減少させ る。さらに、本装置はノットウェアを使って生成されることができ、またはハー ドウェア構成要素全便って製造することができるので、本装置は汎用性がおり、 かつ種々様々な環境使用され得る。Therefore, the device receives the same input IJ (formed from TIG) input in the same order. This provides the advantage of being able to distinguish between characters that are present. This is the exact table The operator must stop the data entry operation to select the desired character. Reduce if this occurs. Additionally, substitution means are provided if an input character is found in the device 10. If not, the device will select another character code that is most similar to the nine-character code entered. As mentioned above, it is possible to select de! j! further reduce the occurrence of Ru. Additionally, the device can be generated using knotware or Since all hardware components can be manufactured individually, the device is versatile and and can be used in a wide variety of environments.

本発明の装置はまた、入力された線素を本装置において処理する方法VCよって 、あいまいな文字フードを生成するわずかな数の文字を除いて、線素をタブレッ トの面の実質上どこにでも書き込むことができるという利点をさらに提供する。The device of the invention also provides a method VC for processing input line elements in the device. , tablet the line elements except for a few characters that produce ambiguous character hoods. It provides the further advantage of being able to write virtually anywhere on the surface of the sheet.

また、文字を形成するプリミティブの決定に先立って適用される処理操作により 、わずかな例外金線いて、入力された文字が入力されたプリミティブの長さに不 適切であると決められることが可能になる。Also, processing operations applied prior to determining the primitives that form a character , there is a small exception, gold line, where the input character is unrelated to the length of the input primitive. It becomes possible to do what is determined to be appropriate.

さらに、簡単なアプローチおよび処理によって、実質止金ての言語での手書き文 字が迅速に昭識され、それによって本装置が実時間適用に使用されることが可能 となる。In addition, with a simple approach and process, handwritten text in virtually any language can be improved. The characters can be recognized quickly, which allows the device to be used in real-time applications. becomes.

本発明の装置は、検出されるべき文字K1m係する適当な情報が、装置内に位置 決めされ九辞書に記憶されるという条件で、入力され几あらゆる文字を検出すべ く変更され得るということは、当業者にとりて明白でらる。The device of the invention is such that suitable information relating to the character K1m to be detected is located within the device. It is possible to detect every character that is entered and stored in nine dictionaries. It will be obvious to those skilled in the art that many modifications may be made.

FIG、9a                FIG、9b国際調査報告 1mema鴎−^−−−轡’nPCT/GB8B10110゜国際調査報告    PCT/GB 88101100SA      25916FIG, 9a           FIG, 9b International Search Report 1mema seagull-^----轡’nPCT/GB8B10110゜International search report PCT/GB 88101100SA 25916

Claims (23)

【特許請求の範囲】[Claims] 1.幾つかのプリミティブから形成された文字を識別する文字認識装置において 、該文字およびプリミティブは予め決められた組の構成要素であり、該装置は、 前記文字を形成するプリミティブの各々を連続的に受取り、かつ受取ったプリミ ティブの各々に対して入力信号を発生する入力手段と、 前記入力信号を受取り、かつ入力手段によって受取られたプリミティブの各々を 識別し、プリミティブの識別によって該文字を表わす文字コードを発生する処理 手段と、 前記組の文字の各々に対する文字コードおよび組合わされた出力コードを記憶す る記憶手段と、前記入力された文字を識別するためにこの入力された文字に対し て発生した文字コードを前記記憶手段の文字コードの各々と比較する比較手段と 、 比較手段と接続され、この比較手段の識別に基づいて入力された文字の再生を生 じる出力手段、を含むことを特徴とする文字認識装置。1. In character recognition devices that identify characters formed from several primitives , the characters and primitives are members of a predetermined set, and the device: successively receives each of the primitives forming said character, and input means for generating an input signal for each of the input signals; receiving said input signal and each of the primitives received by the input means; A process that generates a character code representing the character by identifying the primitive. means and storing a character code and a combined output code for each of said set of characters; and a memory means for the input character to identify said input character. a comparison means for comparing the character code generated by each character code with each of the character codes in the storage means; , is connected to a comparison means and produces a reproduction of the input characters based on the identification of this comparison means. A character recognition device characterized in that it includes an output means for displaying. 2.プリミティブの各々に対して発生した入力信号を調べ、文字コードが複数個 の出力コードと組合わされた文字コードに等しい時、前記文字と組合わされた出 力コードを識別するために操作を実行ずる識別手段をさらに含むことを特徴とす る請求項1記載の文字認識装置。2. Examine the input signal generated for each primitive, and check if there are multiple character codes. When the output code of the character is equal to the character code combined with the output code of the character, the output code of the character is further comprising identification means for performing an operation to identify the power code. The character recognition device according to claim 1. 3.プリミティブは、複数の言語におけるわらゆる文字を形成することが可能で おり、記憶手段は、前記言語の全てにおける該文字の各々に対する文字コードお よび出力コードを記憶することを特徴とする請求項2記載の文字認識装置。3. Primitives can form any character in multiple languages. and the storage means stores character codes and character codes for each of the characters in all of the languages. 3. The character recognition device according to claim 2, wherein the character recognition device stores an output code and an output code. 4.記憶手段がさらに文字テスト情報を記憶し、テスト情報が、1つ以上の出力 コードと組合わされた各文字コードに対して与えられており、識別手段が、文字 テスト情報および入力信号を受取り、かつ該文字に対応する出力コードを検出す るために該文字テスト情報に従って操作を行なうプロセッサーを備えていること を特徴とする請求項3記載の文字認識装置。4. The storage means further stores character test information, and the test information is output to one or more outputs. It is given to each character code combined with the code, and the means of identification is Receives test information and input signal and detects output code corresponding to the character. be equipped with a processor that operates according to the character test information in order to The character recognition device according to claim 3, characterized in that: 5.プリミティブの予め決められた組が20個の別個のプリミティブを含み、こ の20個のプリミティブの種々の組合せが、言語におけるあらゆる文字の形成を 可能にすることを特徴とする請求項2記載の装置。5. The predetermined set of primitives contains 20 distinct primitives, and Various combinations of the 20 primitives form every letter in a language. 3. Device according to claim 2, characterized in that it enables. 6.処理手段は識別されたプリミティブの各々に対してプリミティブコードを発 生するものであり、さらに文字コードが記憶手段の文字コードのいずれとも等し くない時に文字コードを受取る置換手段であって、該文字コードを形成する各プ リミティブコードを、前記受取られた文字に対して生成された入力文字コードと 同数のプリミティブコードを有する前記記憶手段の文字コードの対応プリミティ ブコードと比較する比較器手段を備えているものと、 前記生成された文字コードと比較した時に、予め決められた数よりも少ない差を 有する前記記憶手段の文字コードの各々と組合わされた出力コードを記憶するメ モリと、 をさらに含むことを特徴とする請求項3記載の装置。6. The processing means emits a primitive code for each of the identified primitives. and the character code is equal to any of the character codes of the storage means. a replacement means that receives a character code when the character code is set the primitive code to the input character code generated for the received character. Corresponding primitives of character codes of the storage means having the same number of primitive codes comprising comparator means for comparing with the code; When compared with the generated character code, the difference is less than a predetermined number. a memory means for storing output codes combined with each of the character codes of the storage means having the storage means; Mori and 4. The apparatus of claim 3, further comprising: 7.置換手段が、確室マトリックスを有し、このマトリックスは、少女くとも1 つの未確認プリミティブコードを含んでいる文字コードをこり置換手段が受取っ たとき、未確認プリミティブコードに量も類似する代替プリミティブコードを生 成し、前記記憶手段に記憶された文字コードに等しい文字コードを形成し、かつ 該文字を量も類似する文字に表わすため、前記未確認のプリミティブコードを代 替プリミティブコードで代用することを特徴とする請求項6記載の装置。7. The substitution means has a definite room matrix, and this matrix has at least one girl. The replacement means receives a character code containing two unidentified primitive codes. generates an alternative primitive code similar in quantity to the unconfirmed primitive code. forming a character code equal to the character code stored in the storage means, and In order to represent the character with a character similar in quantity, the unidentified primitive code is substituted. 7. The apparatus according to claim 6, characterized in that the replacement primitive code is substituted. 8.入力手段が、該文字を形成するプリミティブの各々に対してデカルト座標デ ータを与えるオンラインのデイジタイザータブレットであり、処理手段が、前記 プリミティブり各々対するデカルト座標データを調べて、一連の単位ベクトルを 形成する符号化手段をさらに含むことを特徴とする請求項1記載の装置。8. The input means inputs Cartesian coordinate data for each of the primitives forming the character. an on-line digitizer tablet that provides data, and the processing means is Examine the Cartesian coordinate data for each primitive and derive a set of unit vectors. 2. The apparatus of claim 1, further comprising encoding means for forming. 9.符号化手段が、複数のフリーマン単位ベクトルを含んでいる修正フリーマン 符号器であることを特徴とする請求項8記載の装置。9. Modified Freeman encoding means includes multiple Freeman unit vectors 9. Device according to claim 8, characterized in that it is an encoder. 10.処理手段が、 プリミティブの各々に対する一連の単位ベクトルを受取り、前記プリミティブの 各々に対するベクトルコードおよび組合わされた一連のスカラを形成するために 余分な単位ベクトルを削除する機能抽出手段と、一組の各々のプリミティブを表 わすベクトルコードおよび組合わされたプリミティブコードを、未確認プリミテ ィブコードと共に記憶する保持手段と、文字に対して生成された前記ベクトルコ ードを、保持手段に記憶されたベクトルコードと比験する比較器手段であって、 前記ベクトルコードが前記保持手段に記憶されたベクトルコードに等しい時はプ リミティブコードを出力し、かつ前記ベクトルコードが保持手段に記憶されベク トルコードに等しくない時は未確認プリミティブコードを出力するものと、 を含むことを特徴とする請求項9記載の装置。10. The processing means Receive a set of unit vectors for each of the primitives, and to form a vector code for each and a series of scalars combined A feature extractor that removes redundant unit vectors and represents each primitive in a set. The vector code and the combined primitive code are the vector code generated for the character; comparator means for comparing the code with a vector code stored in the holding means; When the vector code is equal to the vector code stored in the holding means, the A primitive code is output, and the vector code is stored in a storage means and a vector is stored. When it is not equal to the torque code, it outputs an unconfirmed primitive code, 10. The device according to claim 9, characterized in that it comprises: 11.保持手段がプリミティブテスト情報をさらに具備し、この情報が、1つ以 上のプリミティブを表わすベクトルコードと独自に組合わされ、処理手段が、プ リミティブテスト情報およびベクトルコードと組合わされた一連のスカラを受取 り、前記ベクトルコードが1つ以上のプリミティブコードを表わすベクトルコー ドに等しい時に、前記ベクトルコードと組合わされた正確なプリミティブコード を検出するため操作を行なうテスト部をさらに含むことを特徴とする請求項10 記載の装置。11. The holding means further comprises primitive test information, the information being one or more Uniquely combined with the vector code representing the above primitive, the processing means Receives a series of scalars combined with primitive test information and vector code and the vector code represents one or more primitive codes. The exact primitive code combined with said vector code when equal to Claim 10 further comprising a test section that performs an operation to detect the The device described. 12.出力手段が、プリンター、オーディオシンセサイザーおよびビデオ表示端 末装置を含むグループから選択されることを特徴とする請求項11記載の装置。12. The output means is a printer, audio synthesizer, and video display end. 12. The device according to claim 11, wherein the device is selected from a group comprising terminal devices. 13.デカルト座標データを受取る事前処理手段をさらに備え、この手段が第1 および隣接する第2の座標間の距離を比較し、この距離が予め決められたスレッ シヨルド値よりも小さい場合には第2座標を除去することによって、余分なデー タの量を減少させることを特徴とする請求項8記載の装置。13. further comprising pre-processing means for receiving the Cartesian coordinate data, the means for receiving the Cartesian coordinate data; and the distance between adjacent second coordinates, and this distance is determined by a predetermined thread. Extra data is removed by removing the second coordinate if it is smaller than the shjord value. 9. Apparatus according to claim 8, characterized in that it reduces the amount of data. 14.幾つかのプリミティブから作られた文字を識別する方法において、前記文 字およびプリミティブが予め決められた組の構成要素であり、該方法が文字を形 成するプリミティブの各々を連続的に受取り、前記プリミティブの各々に対する 入力信号を発生し、前記文字を形成する入力されたプリミティブの各々を識別す るために前記入力信号を調べ、 前記文字を形成するプリミティブを識別することによって文字コードを形成する ため前記プリミティブの各々に対してプリミティブコードを生成し、 前記組をなす文字の各々に対する文字コードおよび組合わされた出力コードを記 憶し、 前記文字コードがただ1つの出力コードと組合わされた文字コードに等しい時に 前記出力コードを検出するため、前記文字コードを記憶された文字コードと比較 し、前記入力された文字と組合わされた出力コードを検出するために、前記文字 コードが1つ以上の出力コードと組合わされた文字コードに等しい時は、前記文 字に対して生成された該プリミティブコードを調べて、それに関する操作を実行 し、さらに組合わされた出力コードの削除によって前記文字の画像を生成する、 各ステップを含むことを特徴とする文字識別方法。14. In a method for identifying characters made from several primitives, characters and primitives are members of a predetermined set, and the method successively receive each of the primitives that constitute the generate an input signal and identify each of the input primitives forming said character. examine said input signal in order to Forming a character code by identifying the primitives that form said character generate primitive code for each of said primitives for Record the character code and combined output code for each of the characters in the set. Remember, when said character code is equal to the character code combined with only one output code Compare the character code with the stored character code to detect the output code and detect the output code combined with the input character. When the code is equal to the character code combined with one or more output codes, the above statement Examine the primitive code generated for the character and perform operations on it. and further generating an image of the character by deleting the combined output code; A character identification method characterized by comprising each step. 15.文字テスト情報が備えられ、該情報が1つ以上の文字信号と組合わされた 文字コードと独自に組合わされ、該方法が、 前記文字テスト情報および入力信号を受取り、前記文字に対応する出力コードを 検出するために、前記文字テスト情報に従って操作を実行するステップをさらに 含むことを特徴とする請求項14記載の方法。15. Character test information is provided and the information is combined with one or more character signals. Uniquely combined with a character code, the method receives said character test information and input signal, and outputs an output code corresponding to said character; further steps of performing operations according to said character test information to detect 15. The method of claim 14, comprising: 16.20個の別個のプリミティブから該プリミティブの組を形成するステップ をさらに含み、この20個のプリミティブの種々の組合せで、複数の言語のあら ゆる文字を形成することが可能であることを特徴とする請求項15記載の方法。16. Forming the set of primitives from 20 distinct primitives Furthermore, various combinations of these 20 primitives can be used to create synonyms in multiple languages. 16. A method according to claim 15, characterized in that it is possible to form any character. 17.文字コードが記憶された文字コードのいずれとも等しくない時に前記文字 コードを受取り、前記文字コードを形成するプリミティブコードの各々を、入力 された文字に対して生成された前記文字コードと同じ数のプリミティブコードを 有している前記記憶された文字コードの対応するプリミティブコードと比較し、 前記文字コードと比較した時に、前記記憶された文字コードが予め決められた数 より少ない差を有する時、前記記憶された文字コードの各々と組合わされた出力 コードを配憶する、 各ステップをさらに含むことを特徴とする請求項16記載の方法。17. The character code is not equal to any of the stored character codes. code and enter each of the primitive codes forming said character code. the same number of primitive codes as the character codes generated for the character Compare the stored character code with the corresponding primitive code having The stored character code is a predetermined number when compared with the character code. the output combined with each of the stored character codes when having less difference; memorize the code, 17. The method of claim 16, further comprising the steps of: 18.少なくとも1つの未確認プリミティブコードを含んでいる入力文字コード を受取り、 前記未確認プリミティブコードを、記憶された文字コードに等しい文字コードを 形成するために、未確認プリミティブコードに最も類似していると思われるプリ ミティブコードと置換する、 各ステップをさらに含むことを特徴とする請求項17記載の方法。18. Input character code containing at least one unconfirmed primitive code Receive the Set the unconfirmed primitive code to a character code equal to the stored character code. to form a primitive that appears most similar to the unidentified primitive code. Replace with primitive code, 18. The method of claim 17, further comprising the steps of: 19.表意文字を形放するプリミティブの各々に対してデカルト座標データを生 成するディジタイザータブレットを備え、 前記プリミティブの各々に対する一連の単位ベクトルを形成するため、該デカル ト座標データを符号化する、各ステップをさらに含むことを特徴とする請求項1 8記載の方法。19. Generates Cartesian coordinate data for each primitive that represents an ideogram. Equipped with a digitizer tablet that the decal to form a series of unit vectors for each of the primitives. Claim 1, further comprising the steps of encoding the coordinate data. 8. The method described in 8. 20.符号化が、複数個のフリーマンベクトルを含む修正フリーマン符号器によ って実行されることを特徴とする請求項19記載の方法。20. The encoding is performed using a modified Freeman encoder containing multiple Freeman vectors. 20. A method according to claim 19, characterized in that it is carried out by: 21.プリミティブの各々に対する該一連の単位ベクトルを調べ、該プリミティ ブの各々に対する組合わされた一連のスカラのベクトルコードを形成するために 、余分な単位ベクトルを削除し、 予め決められた組のプリミティブの各々を表わすベクトルコードおよび組合わさ れたプリミティブコードを記憶し、 各プリミティブに対するベクトルコードを記憶されたベクトルコードと比較し、 前記ベクトルコードが記憶されたベクトルコードと等しい時は該プリミティブコ ードを生成し、前記ベクトルコードが記憶されたベクトルコードのいずれとも等 しくない時は、未確認のプリミティブコードを生成する、各ステップをさらに含 むことを特徴とする請求項20に記載の方法。21. Examine the set of unit vectors for each of the primitives and to form a combined series of scalar vector codes for each of the , remove the extra unit vector, Vector codes and combinations representing each of a predetermined set of primitives memorize the primitive code that was Compare the vector code for each primitive with the stored vector code, When the vector code is equal to the stored vector code, the primitive code is generate a vector code and make the vector code equal to any of the stored vector codes. If not, each step that generates unverified primitive code can be further included. 21. The method according to claim 20, characterized in that: 22.1つ以上のプリミティブコードを表わすベクトルコードと組合わされたプ リミティブテスト情報を用意し、前記ベクトルコードが1つ以上のプリミティブ コードを表わす1つのベクトルコードに等しい時、ベクトルコードと組合わされ た正確なプリミティブコードを検出するために、前記ベクトルコードと組合わさ れた一連のスカラについてのテスト情報に従って操作を実行する、各ユテップを さらに含むことを特徴とする請求項21記載の方法。22. Prints combined with vector codes representing one or more primitive codes Prepare primitive test information, and set the vector code to one or more primitives. When combined with a vector code, it is equal to one vector code representing the code. combined with the vector code to find the exact primitive code. Each Utep performs an operation according to test information about a set of scalars. 22. The method of claim 21, further comprising: 23.第1および隣接した第2のデカルト座標データポイント間の距離を測定し 、 該距離を予め決められたスレッシヨルド値と比較し、該距離が予め決められたス レッショルド値より小さい場合は、前記第2の隣接したデカルト座標データポイ ントを取除く 各ステップをさらに含むことを特徴とする請求項22記載の方法。23. Measure the distance between first and adjacent second Cartesian coordinate data points , Compare the distance with a predetermined threshold value and If it is smaller than the threshold value, the second adjacent Cartesian coordinate data point remove the 23. The method of claim 22, further comprising the steps of:
JP1500666A 1987-12-11 1988-12-12 character recognition device Expired - Lifetime JPH03502841A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13173487A 1987-12-11 1987-12-11
US131,734 1987-12-11

Publications (1)

Publication Number Publication Date
JPH03502841A true JPH03502841A (en) 1991-06-27

Family

ID=22450781

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1500666A Expired - Lifetime JPH03502841A (en) 1987-12-11 1988-12-12 character recognition device

Country Status (6)

Country Link
EP (1) EP0396593A1 (en)
JP (1) JPH03502841A (en)
KR (1) KR900700973A (en)
CN (1) CN1019612B (en)
CA (1) CA1309774C (en)
WO (1) WO1989005494A1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6128409A (en) * 1991-11-12 2000-10-03 Texas Instruments Incorporated Systems and methods for handprint recognition acceleration
JP6491438B2 (en) * 2014-08-29 2019-03-27 株式会社日立社会情報サービス Migration support device

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61264000A (en) * 1985-03-21 1986-11-21 イミユネツクス コ−ポレイシヨン Synthesis of protein by labelled peptide

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS51118333A (en) * 1975-04-11 1976-10-18 Hitachi Ltd Pattern recognition system
US4365235A (en) * 1980-12-31 1982-12-21 International Business Machines Corporation Chinese/Kanji on-line recognition system
JPS5975375A (en) * 1982-10-21 1984-04-28 Sumitomo Electric Ind Ltd Character recognizer
US4561105A (en) * 1983-01-19 1985-12-24 Communication Intelligence Corporation Complex pattern recognition method and system
JPS60217477A (en) * 1984-04-12 1985-10-31 Toshiba Corp Handwritten character recognizing device
JPS621086A (en) * 1985-06-26 1987-01-07 Toshiba Corp Character input device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61264000A (en) * 1985-03-21 1986-11-21 イミユネツクス コ−ポレイシヨン Synthesis of protein by labelled peptide

Also Published As

Publication number Publication date
KR900700973A (en) 1990-08-17
CN1035195A (en) 1989-08-30
WO1989005494A1 (en) 1989-06-15
CN1019612B (en) 1992-12-23
EP0396593A1 (en) 1990-11-14
CA1309774C (en) 1992-11-03

Similar Documents

Publication Publication Date Title
US5034989A (en) On-line handwritten character recognition apparatus with non-ambiguity algorithm
US5467407A (en) Method and apparatus for recognizing cursive writing from sequential input information
US5187480A (en) Symbol definition apparatus
EP0028533B1 (en) Method and apparatus for producing ideographic text
EP1564675B1 (en) Apparatus and method for searching for digital ink query
US5161245A (en) Pattern recognition system having inter-pattern spacing correction
JPH02289100A (en) Kanji coding and decoding equipment
JPS59161778A (en) Pattern processor
JPH03161891A (en) Table type document reader
US5131766A (en) Method for encoding chinese alphabetic characters
JPH07509576A (en) How to recognize characters
US5137383A (en) Chinese and Roman alphabet keyboard arrangement
JPH03502841A (en) character recognition device
Bataineh A Printed PAW Image Database of Arabic Language for Document Analysis and Recognition.
JPH0896081A (en) Character recognizing device and character recognizing method
JP3233803B2 (en) Hard-to-read kanji search device
JP2680845B2 (en) Character input coding method
JPS60247793A (en) On-line recognition device for handwritten character
JPH0689368A (en) Method for forming prototype assembly for specified user for handwritten character recognition
JPH0724054B2 (en) Data processing device
KR960001102B1 (en) Resolution of case confusions by majority voting rule in on-line
JPS6224382A (en) Method for recognizing handwritten character
JPS60217483A (en) Recognizer of character
AU665293B2 (en) Apparatus for encoding and defining symbols and assembling text in ideographic languages
JPH01287774A (en) Japanese data input processor

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080620

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080620

Year of fee payment: 11