JP6275840B2 - How to identify handwritten characters - Google Patents

How to identify handwritten characters Download PDF

Info

Publication number
JP6275840B2
JP6275840B2 JP2016532526A JP2016532526A JP6275840B2 JP 6275840 B2 JP6275840 B2 JP 6275840B2 JP 2016532526 A JP2016532526 A JP 2016532526A JP 2016532526 A JP2016532526 A JP 2016532526A JP 6275840 B2 JP6275840 B2 JP 6275840B2
Authority
JP
Japan
Prior art keywords
stroke
character
template
index number
incomplete
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2016532526A
Other languages
Japanese (ja)
Other versions
JP2016537728A (en
Inventor
ジアン,シュホン
ウ,ボ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JP2016537728A publication Critical patent/JP2016537728A/en
Application granted granted Critical
Publication of JP6275840B2 publication Critical patent/JP6275840B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • G06V30/373Matching; Classification using a special pattern or subpattern alphabet
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/293Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of characters other than Kanji, Hiragana or Katakana

Description

本発明は、ヒューマンコンピュータインタラクション技術に関し、より具体的には手書き文字の識別方法とシステムに関する。 The present invention relates to a heat-menu man computer interactor sucrose emissions technology, and more particularly to identification methods and systems for handwriting.

コンピュータのビジュアルアプリケーションの発展に伴って、ヒューマンコンピュータインタラクション技術に対する需要は日増しに幅広く、要求もさらに高くなっている。手書き文字の識別技術もヒューマンコンピュータインタラクションの一部である。多くの手書き文字識別システムはユーザが文字のすべての筆画を書き終わった後に識別を行うが、この種のシステムは画数の多い文字を入力する時の入力速度が遅く、また、ユーザから言っても、複雑な文字のすべての筆画を入力するのは難しさがある。該問題を解決するために、手書き文字を予測するいくつかの識別方法が提案されている。それらは文字の筆画の一部を入力すれば文字の識別が可能である。これらの方法の中のいくつかの方法は文字予測データベースを基にして、システムが、与えられた筆画を含むデータベース内に記憶保管されているすべての文字の使用頻度に基づいて、与えられた1つまたは複数の筆画を含む文字候補を提供するものである。他のタイプの方法は、ユーザが文字の部首を入力すると予測結果が出されるものである。同じように、このタイプの方法も使用頻度に基づいて文字候補が提供される。 With the development of computer visual applications, the demand for human computer interaction technology is increasing widely and demands are increasing. Handwriting recognition technology is also part of human computer interaction . Many handwritten character recognition systems perform identification after the user finishes writing all strokes of a character, but this type of system is slow in inputting characters with a large number of strokes. It's difficult to input all strokes of complex characters. In order to solve this problem, several identification methods for predicting handwritten characters have been proposed. The characters can be identified by inputting a part of the strokes of the characters. Some of these methods are based on a character prediction database, and the system is given one based on the frequency of use of all characters stored and stored in a database containing a given stroke. A character candidate including one or a plurality of strokes is provided. In another type of method, a prediction result is output when a user inputs a radical of a character. Similarly, this type of method also provides character candidates based on frequency of use.

「単語の不完全識別に基づく快速入力方法」と題する特許文献1は、予測率に基づいて予測候補を出すための手書き文字の識別方法、を提案している。該方法は漢字文字ごとに完全テンプレートと一連の派生サブテンプレートとを生成する。派生サブテンプレートは、漢字文字の文字部首または任意の他の不完全部分であってよい。サブテンプレートごとに、完全漢字文字に対するその相対的な完全度のレベルに基づいて「完全性ウェイト」を備えている。入力筆画と漢字文字ごとのすべてのサブテンプレートとの間で、テンプレートマッチングを行ない、その後、得られた整合率を、対応するサブテンプレートの完全性ウェイトに掛け算し、その後に、重み付けされた整合率の最大値を完全漢字文字の予測率とし、最後に、予測率に基づいて予測候補を表す。   Patent Document 1 entitled “Rapid Input Method Based on Incomplete Identification of Words” proposes a method for identifying handwritten characters for generating prediction candidates based on a prediction rate. The method generates a complete template and a series of derived sub-templates for each Kanji character. The derived sub-template may be the character head of a Chinese character or any other incomplete part. Each sub-template has a “completeness weight” based on its relative level of completeness relative to the complete Kanji character. Template matching is performed between the input stroke and all sub-templates for each Kanji character, and then the obtained matching rate is multiplied by the integrity weight of the corresponding sub-template, followed by the weighted matching rate. Is the prediction rate of complete kanji characters, and finally, a prediction candidate is represented based on the prediction rate.

中国特許出願No.201210284415号公報Chinese patent application no. 201210284415 gazette

しかしながら、従来の予測手書き文字識別方法にとって、使用頻度に基づいて文字候補を表示するのは不正確なものである。たとえば、ユーザが常用ではない文字を入力した場合、常用ではない文字は使用頻度が低いことにより、システムは予測候補の中から正しい識別結果を得ることができない。   However, it is inaccurate for the conventional predictive handwritten character identification method to display the character candidates based on the frequency of use. For example, when the user inputs a non-usual character, the system cannot obtain a correct identification result from the prediction candidates because the non-usual character is used less frequently.

特許文献1の問題点は、「完全性ウェイト」をどのように測定するかの明確な規則を打ち出していないことにある。「完全性ウェイト」は該方法において正しい予測候補を出すうえで非常に重要である。しかし、該特許出願の中では、該ウェイトを如何に測定し且つ確定するかの記述がなされていない。該ウェイト測定の合理的規則を定義することは曖昧としていて且つ複雑なものであるが、これは予測効果に非常に大きな影響を与える。また、該特許出願は、漢字文字ごとの完全テンプレートを複数の一級派生テンプレートに分けることを提案している。一級派生テンプレートをさらに多くの二級派生テンプレートに分け、いくつかの一級派生テンプレートといくつかの二級派生テンプレートとを組み合わせて新しい派生テンプレート等を生成することができるとしている。この種の方式にしたがえば、すべての漢字文字のテンプレートの数量が非常に大きくなり、それにより大きな文字集合体のすべてのテンプレートを記憶するのに大きな記憶空間が必要となり、且つテンプレートマッチングのプロセスがすべてのテンプレートをマッチングさせるために非常に煩雑で且つ複雑なものになる。   The problem of Patent Document 1 is that no clear rule is set for how to measure the “integrity weight”. The “integrity weight” is very important for producing a correct prediction candidate in the method. However, the patent application does not describe how to measure and determine the weight. Defining rational rules for the weight measurement is ambiguous and complex, but this has a huge impact on the prediction effect. The patent application also proposes dividing the complete template for each Kanji character into a plurality of first-order derived templates. The primary derivation template is further divided into a number of secondary derivation templates, and a new derivation template or the like can be generated by combining several primary derivation templates and some secondary derivation templates. According to this type of scheme, the quantity of all Kanji character templates becomes very large, which requires a large storage space to store all the templates of a large character set, and the template matching process Becomes very cumbersome and complicated to match all templates.

従って、本発明の目的は、手書き入力結果を正確に予測できるような方法を提供することにある。   Accordingly, an object of the present invention is to provide a method capable of accurately predicting a handwritten input result.

本発明による手書き文字識別方法とシステムは、一部の筆画で手書き文字を予測する識別方法とシステムを提案しており、予測候補を正確に出すことができるので、ユーザが手書きで文字の一部の筆画を入力すると、入力しようとしている文字を識別することができる。   The handwritten character identification method and system according to the present invention proposes an identification method and system for predicting a handwritten character by a part of a stroke, and can predict prediction candidates accurately, so that a user can write a part of the character by handwriting When the stroke is input, the character to be input can be identified.

本発明の一面は、手書き文字識別方法を提案するものである。該方法はまず、ユーザの入力した手書きの軌跡を受信し、その後、手書き軌跡を少なくとも1つの筆画テンプレートにマッチングさせて、筆画テンプレートの整合度を確定する。最後に、整合度にしたがって、マッチングさせた筆画テンプレートに対応する標準文字を出力する。前記筆画テンプレートは標準文字のマッチングテンプレートであり、且つ少なくとも1つの標準文字のマッチングテンプレートは、前記少なくとも1つの標準文字の完全筆画テンプレートと、前記少なくとも1つの標準文字の不完全筆画標準文字の不完全筆画テンプレートと、を有し、前記少なくとも1つの標準文字の不完全筆画テンプレートの対応する不完全筆画標準文字は、如何なる他の標準文字の一部または全部を構成するものではない。 One aspect of the present invention proposes a handwritten character identification method. The method first receives a handwritten trajectory input by the user, and then matches the handwritten trajectory to at least one stroke template to determine the degree of matching of the stroke template. Finally, according to the degree of matching, a standard character corresponding to the matched stroke template is output . Before SL stroke template is a standard character matching templates, matching templates one standard character even without least one且, wherein the full stroke templates of at least one standard character, incomplete stroke standard of the at least one standard character has a incomplete strokes template character, the corresponding incomplete stroke standard character before Symbol least one standard character incomplete stroke template does not constitute a part or all of any other standard character .

好ましくは、1つの筆画が入力されるのを受信するごとにマッチングと出力のステップを実行する。   Preferably, the matching and output steps are executed each time one stroke is input.

好ましくは、手書き軌跡にマッチングさせる少なくとも1つの筆画テンプレートが、すべての標準文字のすべてのマッチングテンプレートである。   Preferably, at least one stroke template matched with the handwriting trajectory is all matching templates of all standard characters.

好ましくは、手書き軌跡を少なくとも1つの筆画テンプレートにマッチングさせて筆画テンプレートの整合度を確定するステップが、さらに、すでに入力した筆画数と、マッチングさせる筆画テンプレートに対応する標準文字の筆画数と、の差に基づいて整合度に重み付けをするステップを有する。   Preferably, the step of matching the handwriting trajectory with at least one stroke template to determine the degree of consistency of the stroke template further includes: the number of strokes already input and the stroke count of a standard character corresponding to the stroke template to be matched. And weighting the degree of matching based on the difference.

好ましくは、さらに、手書き軌跡の背景に整合度の最も高い筆画テンプレートに対応する標準文字を表示する。   Preferably, a standard character corresponding to the stroke template having the highest degree of matching is further displayed on the background of the handwriting locus.

好ましくは、前記不完全筆画テンプレートが、
基本筆画と部首を定義するステップと、
基本筆画と部首の中の筆画/部首ごとに1つの索引番号を割り当てるステップと、
標準文字の筆画/部首ごとに対応している索引番号と、該標準文字の筆画順序組合せにしたがって取得した索引番号序列と、を用いて各標準文字を表示するステップと、
標準文字の索引番号序列を順に並べるステップと、
前記少なくとも1つの標準文字と他の標準文字とで異なる索引番号を識別するステップと、
前記少なくとも1つの標準文字の、索引番号序列の中の開始索引番号から前記異なる索引番号までの部分の索引番号序列である、前記少なくとも1つの標準文字の固有索引番号序列、を確定するステップと、
前記固有索引番号序列に対応する不完全筆画標準文字を生成して、前記少なくとも1つの標準文字の不完全筆画標準文字とするステップと、
記少なくとも1つの標準文字の完全筆画サンプルに基づいて、前記不完全筆画標準文字に対応する該標準文字の不完全筆画サンプルを取得するステップと、
前記少なくとも1つの標準文字の不完全筆画サンプルに基づいて、前記少なくとも1つの標準文字の不完全筆画テンプレートを取得するステップと、により生成されるものである。
Preferably, the incomplete stroke template is
Defining basic strokes and radicals;
Assigning one index number for each basic stroke and each stroke / radical in the radical;
Displaying each standard character using an index number corresponding to each stroke / radical of the standard character and an index number sequence obtained according to the stroke order combination of the standard character;
Ordering the standard character index number sequence,
Identifying index numbers that differ between the at least one standard character and other standard characters;
Determining the unique index number sequence of the at least one standard character, which is the index number sequence of the portion of the at least one standard character from the starting index number to the different index number in the index number sequence;
Generating incomplete stroke standard characters corresponding to the unique index number sequence to be incomplete stroke standard characters of the at least one standard character;
A step of, based on the full stroke sample before Symbol least one standard character, acquires an incomplete stroke samples of the standard character corresponding to said incomplete stroke standard characters,
Obtaining an incomplete stroke template of the at least one standard character based on the incomplete stroke sample of the at least one standard character.

好ましくは、前記固有索引番号序列が、さらに、前記異なる索引番号の後の索引番号を有する。   Preferably, the unique index number sequence further has an index number after the different index number.

好ましくは、前記異なる索引番号に対応する筆画/部首が少なくとも2つの筆画を有する時、前記固有索引番号序列に対応する不完全筆画標準文字が、さらに、開始索引番号から前記異なる索引番号の1つ前の索引番号までの部分の索引番号序列に対応する筆画/部首と、それに加えて前記異なる索引番号に対応する筆画/部首の筆画1つ1つの部分と、を有する不完全筆画標準文字、を有する。   Preferably, when a stroke / radical corresponding to the different index number has at least two strokes, an incomplete stroke standard character corresponding to the unique index number sequence is further set to one of the different index numbers from the start index number. Incomplete stroke standard having strokes / radicals corresponding to the index number sequence of the portion up to the previous index number, and in addition each stroke / radical stroke corresponding to the different index number Character.

好ましくは、取得した不完全筆画テンプレートの中から、前記異なる索引番号に対応する筆画/部首が特定筆画/部首の中の1つである不完全筆画テンプレートを破棄する。   Preferably, from the acquired incomplete stroke template, the incomplete stroke template whose stroke / radical corresponding to the different index number is one of the specific strokes / radical is discarded.

好ましくは、特定筆画/部首は下記文字Nと下記文字Oの中の1つであってよい。   Preferably, the specific stroke / radical may be one of the following letter N and the following letter O.

好ましくは、前記少なくとも1つの標準文字の不完全筆画テンプレートが、さらに、
少なくとも2つの標準文字の、それぞれの不完全筆画部分である同一筆画部分、を確定するステップと、
該同一筆画部分を中間標準文字とし、前記中間標準文字について、その不完全筆画テンプレートを生成するステップと、
生成された不完全筆画テンプレートと、前記中間標準文字に対応する筆画テンプレートと、を前記少なくとも2つの標準文字の中の標準文字ごとの不完全筆画テンプレートとするステップと、により生成されるテンプレート、を有する。
Preferably, the at least one standard character incomplete stroke template further comprises:
Determining at least two standard characters, the same stroke portion being each incomplete stroke portion;
The same stroke portion as an intermediate standard character, and for the intermediate standard character, generating an incomplete stroke template;
The generated incomplete stroke template and the stroke template corresponding to the intermediate standard character as an incomplete stroke template for each standard character in the at least two standard characters, and a template generated by Have.

好ましくは、前記標準文字が、中国語、日本語、韓国語の中の1つ、の文字であってよい。   Preferably, the standard character may be one of Chinese, Japanese, and Korean.

本発明の他の一面によれば、手書き文字識別システムがさらに提案され、ユーザが入力した手書き軌跡を受信するための手書き入力ユニットと、標準文字のマッチングテンプレートを記憶保管するテンプレートデータベースと、手書き軌跡を少なくとも1つのテンプレートにマッチングさせて、テンプレートの整合度を確定するように配置されるテンプレートマッチングユニットと、テンプレートマッチングユニットが確定した整合度にしたがって、マッチングさせたテンプレートに対応する標準文字を出力するように配置される出力ユニットと、を有し、少なくとも1つの標準文字のマッチングテンプレートが前記少なくとも1つの標準文字の完全筆画テンプレートと前記少なくとも1つの標準文字の不完全筆画標準文字の不完全筆画テンプレートとを有し、前記少なくとも1つの標準文字の不完全筆画テンプレートが対応する不完全筆画標準文字が、如何なる他の標準文字の一部または全部を構成するものではない。 According to another aspect of the present invention, a handwritten character identification system is further proposed, a handwriting input unit for receiving a handwritten locus input by a user, a template database for storing and storing a standard character matching template, and a handwritten locus Is matched with at least one template, and a template matching unit arranged so as to determine the matching degree of the template and a standard character corresponding to the matched template are output according to the matching degree determined by the template matching unit. has an output unit arranged to, one imperfect standard character matching template is incomplete strokes standard character of the at least one of the standard character full stroke template said at least one standard character even without least Stroke ten And a rate, incomplete strokes standard characters incomplete stroke template corresponding prior Symbol least one standard character, does not constitute a part or all of any other standard characters.

本発明実施例によれば、中国語、日本語または韓国語の文字について、一連の「筆画/部首索引番号」により各文字を表示し、且つ各文字の「固有索引(筆画/部首)」を記録して、該文字を表示するための固有筆画または部首とする。そして、前記「固有索引」に基づいて文字の不完全筆画テンプレートを生成する。このようにすれば、ユーザが1つの文字の1つまたは複数の筆画を入力した時、入力された筆画と不完全筆画テンプレートとの間のテンプレートマッチングが実行されて、識別結果が正確に取得される。   According to the embodiment of the present invention, for a Chinese, Japanese or Korean character, each character is displayed by a series of “stroke / radical index numbers”, and each character's “unique index (stroke / radical)” ”Is recorded as a unique stroke or radical for displaying the character. Then, an incomplete stroke template of characters is generated based on the “unique index”. In this way, when the user inputs one or more strokes of one character, template matching between the input stroke and the incomplete stroke template is executed, and the identification result is accurately acquired. The

従来の技術と異なり、本発明の手書き文字識別方法及びシステムによれば文字の「固有索引」に基づいて予測候補が出され、したがって文字ごとの予測候補が他の文字と混淆されることがない。しかも、ユーザが文字の1つまたは複数の筆画を入力すれば該文字が識別される。このように、作業の負担が省かれ且つ入力効率が改善される。   Unlike the prior art, according to the handwritten character identification method and system of the present invention, a prediction candidate is issued based on the “unique index” of the character, so that the prediction candidate for each character is not confused with other characters. . Moreover, if the user inputs one or more strokes of the character, the character is identified. In this way, the work burden is reduced and the input efficiency is improved.

つぎに附属図面と結んで本発明の好ましい実施例を説明することにより、本発明の上記及び他の目的、特徴、メリットをさらに明確なものにする。   The above and other objects, features, and advantages of the present invention will be further clarified by describing preferred embodiments of the present invention in conjunction with the accompanying drawings.

本発明実施例による手書き文字識別システムを説明するブロック図を示している。1 is a block diagram illustrating a handwritten character identification system according to an embodiment of the present invention. 本発明実施例による不完全筆画テンプレート生成方法のフローチャートを示している。3 shows a flowchart of a method for generating an incomplete stroke template according to an embodiment of the present invention. 本発明実施例による基本筆画と部首の例を示している。3 shows an example of basic strokes and radicals according to an embodiment of the present invention. 本発明実施例による「筆画索引表」の一部分を示している。A part of the “stroke index table” according to the embodiment of the present invention is shown. 本発明実施例による文字筆画情報排列表の例を示している。The example of the character stroke information arrangement table by the Example of this invention is shown. 図5に示した文字筆画情報排列表内の同一の索引番号と固有索引番号とを示している。The same index number and unique index number in the character stroke information arrangement table shown in FIG. 5 are shown. 「鞭」の完全筆画文字の演習サンプルを示している。An exercise sample of a complete stroke character of "Whip" is shown. 図7に示した「鞭」の完全筆画テンプレート中から取得した「鞭」の不完全筆画テンプレートの演習サンプルを示している。FIG. 8 shows an exercise sample of an incomplete stroke template of “whipping” obtained from the complete stroke template of “whipping” shown in FIG. 7. 本発明実施例による手書き文字識別方法のフローチャートを示している。5 shows a flowchart of a handwritten character identification method according to an embodiment of the present invention. 本発明実施例による手書き文字識別方法の運用結果の1つの例を示し、(a)は、ユーザの入力した手書き軌跡を示し、(b)は、手書き軌跡の高度にマッチングする不完全筆画テンプレートを示し、(c)は、手書き軌跡の背景に、識別した文字が出力されるのを示している。FIG. 5 shows one example of the operation result of the handwritten character identification method according to the embodiment of the present invention, where (a) shows a handwritten locus inputted by a user, and (b) shows an incomplete stroke template that highly matches the handwritten locus (C) shows that the identified character is output in the background of the handwritten trajectory. 本発明実施例による下記文字Dという文字の不完全筆画テンプレートと完全筆画テンプレートの例を示している。The example of the incomplete stroke template and the perfect stroke template of the following character D by the Example of this invention is shown. 本発明実施例による中間文字構築の例を示している。An example of intermediate character construction according to an embodiment of the present invention is shown. 説明のための1つの筆画サンプルを示している。One stroke sample for illustration is shown.

つぎに附属図面を参照して、本発明の例示した実施例を詳しく述べる。以下の記述の中で、いくつかの具体的な実施例は記述目的のためのみに用いられるものであり、本発明に対する如何なる制限とも理解すべきではない。ただ本発明の例を示したものに過ぎない。本発明に対する理解に混淆をもたらす可能性のある場合、通常の仕組みまたは構造を省略する。   Reference will now be made in detail to the exemplary embodiments of the present invention, examples of which are illustrated in the accompanying drawings. In the following description, some specific examples are used for descriptive purposes only and should not be understood as any limitation to the present invention. It is merely an example of the present invention. Where the understanding of the present invention may be chaotic, normal mechanisms or structures are omitted.

Figure 0006275840
図1は本発明実施例による手書き文字識別システム100を説明したブロック図を示している。該システム100は、手書き入力ユニット110、テンプレートデータベース120、テンプレートマッチングユニット130、出力ユニット140、の4ユニットを有する。各ユニットの機能は以下に記述するとおりである。
Figure 0006275840
FIG. 1 is a block diagram illustrating a handwritten character identification system 100 according to an embodiment of the present invention. The system 100 includes four units of a handwriting input unit 110, a template database 120, a template matching unit 130, and an output unit 140. The function of each unit is as described below.

・ 手書き入力ユニット110:該ユニットはユーザからの手書き入力データを受信するのに用いられる。たとえば、ユーザがタッチスクリーン式電子装置に手書き入力した時、該ユニットはユーザの手指とタッチパッドとの接触を識別するセンサであってよい。ユーザが赤外線等を利用して電子装置に入力した時、該ユニットは赤外線センサであってよい。   Handwriting input unit 110: This unit is used to receive handwritten input data from the user. For example, the unit may be a sensor that identifies contact between the user's finger and the touch pad when the user inputs handwriting into the touch screen electronic device. The unit may be an infrared sensor when the user inputs to the electronic device using infrared or the like.

・ テンプレートデータベース120:該ユニットは標準文字ごとのマッチングテンプレートを記憶保管するのに用いられる。本発明実施例によれば、テンプレートデータベース内に標準文字の完全筆画テンプレートと不完全筆画テンプレートとが記憶保管されている。まず標準文字ごとの不完全筆画標準文字を定義する。いくつかの複雑な標準文字は複数の不完全筆画標準文字を有するかもしれない。だが、1つの標準文字の不完全筆画標準文字は他の如何なる標準文字の一部または全部を構成することはない。その後、標準文字ごとの不完全筆画標準文字と完全筆画標準文字について演習を行い、標準文字ごとの完全筆画テンプレートと不完全筆画テンプレートとを取得する。少し後の方で図2と結び付けて、不完全筆画テンプレートの生成方法について詳しく述べる。   Template database 120: The unit is used to store and store matching templates for each standard character. According to the embodiment of the present invention, the standard character complete stroke template and the incomplete stroke template are stored in the template database. First, incomplete stroke standard characters are defined for each standard character. Some complex standard characters may have multiple incomplete stroke standard characters. However, an incomplete stroke standard character of one standard character does not constitute a part or all of any other standard character. Thereafter, exercises are performed on incomplete stroke standard characters and complete stroke standard characters for each standard character, and a complete stroke template and an incomplete stroke template for each standard character are acquired. A method for generating an incomplete stroke template will be described in detail later in connection with FIG.

・ テンプレートマッチングユニット130:該ユニットは手書き入力データを不完全筆画テンプレート及び/または完全筆画テンプレートにマッチングさせることにより、マッチングテンプレートの整合度を確定する。 Template matching unit 130: The unit matches the handwritten input data to an incomplete stroke template and / or a complete stroke template to determine the matching degree of the matching template.

・ 出力ユニット140:該ユニットはユーザに識別結果を出力する。1つの実施例によれば、該ユニットは整合度の最も高いテンプレートに対応する標準文字を出力できる。該ユニットは、あらゆるマッチング結果の最適化も行って、予め定められた規則に基づいて候補を順に並べることも選択できる。たとえば、携帯電話のタイプの、表示スクリーンサイズに制限のある電子装置について、出力ユニット140は整合度の高い上位10個のマッチング結果だけを出力する。1つの実施例で、たとえば整合度にしたがって順に並べて出力されてもよい。   Output unit 140: This unit outputs the identification result to the user. According to one embodiment, the unit can output standard characters corresponding to the template with the highest degree of matching. The unit can also perform optimization of any matching result and select to order candidates based on a predetermined rule. For example, for an electronic device of the mobile phone type with a limited display screen size, the output unit 140 outputs only the top 10 matching results with a high degree of matching. In one embodiment, for example, the data may be output in order according to the degree of matching.

図1は、該システムがさらに、予備処理ユニット150を有してもよいことを示している。   FIG. 1 shows that the system may further include a preprocessing unit 150.

・ 予備処理ユニット150:該ユニットは、手書き入力データに対し、平滑化や直線の標準化及び/または非直線の標準化等の処理を行うために用いられる。該ユニットの目的は、手書き入力データをより滑らかなものにして、テンプレートマッチングユニット130内でのマッチングを利することにある。   Preliminary processing unit 150: This unit is used to perform processing such as smoothing, straight line standardization and / or non-straight line standardization on handwritten input data. The purpose of the unit is to make handwritten input data smoother and to make matching within the template matching unit 130 possible.

本発明の鍵となる技術は不完全筆画テンプレートの定義にある。中国語、日本語、韓国語等の文字(すなわち、漢字、日本文字等)については、各文字は筆画及び/または部首で組み立てられている。異なる文字が同一の筆画と部首とを有する可能性がある。しかし、文字ごとに他の文字と異なる固有筆画または部首の序列を必ず含んでいる。本発明の実施例によれば、この固有筆画と部首を利用して文字ごとの不完全筆画テンプレートを定義する。すなわち、その対応する不完全筆画文字が該固有筆画/部首序列を有して、如何なる他の文字の一部または全部を構成することがないように、すなわち他の文字との区別ができるように、文字の不完全筆画テンプレートを構築する。   The key technology of the present invention is the definition of an incomplete stroke template. For characters such as Chinese, Japanese, Korean, etc. (ie, kanji, Japanese characters, etc.), each character is assembled with a stroke and / or radical. Different characters may have the same stroke and radical. However, each character always includes a unique stroke or radical order different from other characters. According to the embodiment of the present invention, an incomplete stroke template for each character is defined using the unique stroke and the radical. That is, the corresponding incomplete stroke character has the unique stroke / group order so that it does not constitute part or all of any other character, that is, can be distinguished from the other character. Secondly, an incomplete stroke template of characters is constructed.

GB2312文字集合の漢字を例とする。図2は本発明実施例による不完全筆画テンプレート生成方法200のフローチャートを示している。   Take the Chinese character of GB2312 character set as an example. FIG. 2 shows a flowchart of an incomplete stroke template generation method 200 according to an embodiment of the present invention.

まず、ステップS210において、図3に示すように、基本筆画と部首とを定義する。   First, in step S210, a basic stroke and a radical are defined as shown in FIG.

Unicodeの定義するところに基づけば、総計36個の基本筆画が存在する。いくつかの筆画を破棄して、図3に示すように最終的に26個の基本筆画を残す。図3における部首の最初の5行はユーザによる定義であり、図3における部首の最後の2行はGB2312の中の基本部首である。図3は合計で152個の部首を示し、これらの部首が、本発明実施例の中で漢字GB2312によって定義される基本筆画/部首であることを意味している。当然、本出願に応用できる部首は図3に示すものに限定されるものではなく、必要に基づいてその他の部首の集合を用いることができる。漢字、韓国語または日本語については、その必要とする部首は同じではない。 Based on the definition of Unicode, there are a total of 36 basic strokes. Some strokes are discarded and 26 basic strokes are finally left as shown in FIG. The first five lines of the radical in FIG. 3 are user-defined, and the last two lines of the radical in FIG. 3 are basic radicals in GB 2312. FIG. 3 shows a total of 152 radicals, meaning that these radicals are the basic strokes / radicals defined by the Chinese character GB2312 in the embodiment of the present invention. Of course, the radicals applicable to the present application are not limited to those shown in FIG. 3, and other radical sets can be used as needed. The required radicals are not the same for kanji, Korean or Japanese.

索引を行うために、ステップS220において、定義された基本筆画と部首について、「筆画索引表」を定義して、基本筆画と部首の中の筆画/部首ごとに1つの索引番号を割り当てる。図4は該「筆画索引表」の一部分を示している。各基本筆画と部首について索引を行うと、各文字は、該文字の筆画/部首ごとに対応する索引番号筆画順序組合せにしたがって得られた一連の索引番号により、表示できる。   In order to perform indexing, in step S220, a “stroke index table” is defined for the defined basic strokes and radicals, and one index number is assigned to each stroke / radical in the basic strokes and radicals. . FIG. 4 shows a part of the “stroke index table”. When each basic stroke and radical are indexed, each character can be displayed by a series of index numbers obtained according to the index number / stroke order combination corresponding to each stroke / radical of the character.

その後、ステップS230において、文字の筆画/部首ごとに対応する索引番号と、該文字の筆画順序組合せにしたがって得られた索引番号序列と、を用いて各文字を表示し、且つ各文字の索引番号を順に並べ、文字の筆画情報が得られる。したがって、文字ごとの筆画情報を順に並べた表が定義される。図5は該表の一部分が説明的に示されたものである。   Thereafter, in step S230, each character is displayed using an index number corresponding to each stroke / radical of the character and an index number sequence obtained according to the stroke order combination of the character, and the index of each character. Numbers are arranged in order, and character stroke information is obtained. Therefore, a table in which the stroke information for each character is arranged in order is defined. FIG. 5 shows a part of the table in an explanatory manner.

その後、ステップS240において、各文字の固有筆画/部首を見つけて、「固有索引番号序列」を取得する。すなわち、まず、文字ごとに他の文字と異なる索引番号を識別する。図6は図5と同一の文字筆画情報排列表を示しているが、その中の同一部分について説明的に示している。   Thereafter, in step S240, the unique stroke / radical of each character is found, and “unique index number order” is acquired. That is, first, an index number different from other characters is identified for each character. FIG. 6 shows the same character and stroke information arrangement table as that in FIG.

図6の表から見てわかるが、左側の破線枠には、示された6つの文字の共通筆画が含まれている。中の破線枠には前5文字の共通筆画が含まれる。また、右側の破線枠は「晋」と上記文字Aの共通部首を表示している。最後に、第2、第3、第5、第6文字の最後の筆画/部首(その索引番号はそれぞれ211、226、233、201)は、対応する文字の固有筆画/部首を表示している。したがって、「固有索引表」が取得されている。すなわち、上記文字Bについて、その索引番号序列は「1−3−3−7−6−1−211」であり、この中の「211」がその固有筆画/部首を表す。「晋」については、その索引番号序列は「1−3−3−7−6−1−236」であるが、固有筆画/部首はない。上記文字Aについては、その索引番号序列は「1−3−3−7−6−1−236−233」であり、この中の「233」がその固有筆画/部首を表す。上記文字Cについては、その索引番号序列は「1−3−3−7−6−201」であり、この中の「201」がその固有筆画/部首を表す。   As can be seen from the table in FIG. 6, the broken line on the left side includes a common stroke of the six characters shown. The middle broken line frame includes a common stroke of the previous five characters. Further, the broken line frame on the right side displays “晋” and the common radical of the character A. Finally, the last stroke / radical of the second, third, fifth, and sixth characters (whose index numbers are 211, 226, 233, and 201, respectively) display the unique stroke / radical of the corresponding character. ing. Therefore, the “unique index table” is acquired. That is, with respect to the letter B, the index number sequence is “1-3-7-7-1-211”, and “211” therein represents the unique stroke / radical. For “晋”, the index number sequence is “1-3-7-7-6-1-236”, but there is no unique stroke / radical. For the letter A, the index number sequence is “1-3-7-7-6-1236-233”, and “233” in the index number indicates the unique stroke / radical. For the letter C, the index number sequence is “1-3-7-7-201”, and “201” in the index C represents the unique stroke / radical.

その後、文字の固有索引番号序列を確定し、固有索引番号序列は1つの文字の索引番号序列の中の開始索引番号から異なる索引番号までの部分の索引番号序列である。図6から見て取れるように、6つの文字の中で上記文字B、上記文字D、上記文字A、上記文字Cだけが他の文字と異なる固有索引番号を備えている。   Thereafter, the unique index number order of the character is determined, and the unique index number order is the index number order of the part from the start index number to the different index number in the index number order of one character. As can be seen from FIG. 6, among the six characters, only the character B, the character D, the character A, and the character C have unique index numbers different from those of other characters.

他の1つの例として、仮に「鞭」の索引番号序列をたとえば「302−104−1−3−10−1−1−5−8」とすると、この中の3番目の索引番号「1」がその固有筆画/部首を表している。「鞭」の固有索引番号序列は「302−104−1」、「302−104−1−3」、「302−104−1−3−10」、「302−104−1−3−10−1」、「302−104−1−3−10−1−1」、「302−104−1−3−10−1−1―5」、「302−104−1−3−10−1−1−5−8」であってよい。言い換えれば、「302−104−1」のほかに、固有索引番号序列は固有索引番号の後の索引番号もさらに有している。   As another example, if the index number sequence of “Whiz” is “302-104-1-3-10-1-1-1-5-8”, for example, the third index number “1” in the index number “1” Represents the unique stroke / radical. The unique index number sequence of “Whip” is “302-104-1”, “302-104-1-3”, “302-104-1-3-10”, “302-104-1-3-10-”. 1 "," 302-104-1-3-10-1-1 "," 302-104-1-3-10-1-1-5 "," 302-104-1-3-10-1- " 1-5-8 ". In other words, in addition to “302-104-1”, the unique index number sequence further has an index number after the unique index number.

ステップS250において、取得した「固有索引番号序列」に基づいて標準文字ごとの不完全筆画文字を生成する。   In step S250, an incomplete stroke character for each standard character is generated based on the acquired “unique index number order”.

1つの実施例において、前記固有索引番号に対応する筆画/部首が少なくとも2つの筆画を有しているかもしれない。該実施例において、固有索引番号序列に対応する不完全筆画文字は、開始索引番号から前記固有索引番号の1つ前の索引番号までの部分の索引番号序列に対応する筆画/部首と、それに加えて該固有索引番号に対応する筆画/部首の筆画1つ1つの部分と、を含む不完全筆画文字、を有している。   In one embodiment, the stroke / radical corresponding to the unique index number may have at least two strokes. In the embodiment, the incomplete stroke character corresponding to the unique index number sequence includes the stroke / radical corresponding to the index number sequence of the portion from the start index number to the index number one before the unique index number, and In addition, it has incomplete stroke characters including strokes / parts of each stroke corresponding to the unique index number.

ステップS260において、文字ごとの不完全筆画文字に基づいて、標準文字の完全筆画サンプルによりその不完全筆画サンプルを取得し、それにより該標準文字の不完全筆画テンプレートを取得する。   In step S260, based on the incomplete stroke character for each character, the incomplete stroke sample is obtained from the complete stroke sample of the standard character, thereby obtaining the incomplete stroke template of the standard character.

図7は「鞭」の完全筆画文字の演習サンプルを示している。ステップS240に基づいて、「鞭」の索引番号序列、たとえば「302−104−1−3−10−1−1−5−8」、を取得することができ、この中の3番目の索引番号「1」がその固有筆画/部首を表している。したがって、ステップS250に基づき「鞭」の不完全筆画文字の索引番号序列を「302−104−1」、「302−104−1−3」、「302−104−1−3―10」、「302−104−1−3−10−1」、「302−104−1−3−10−1−1」、「302−104−1−3−10−1−1−5」と確定することができる。図8は図7に示した「鞭」の完全筆画サンプルから取得された「鞭」の不完全筆画サンプルを示している。 FIG. 7 shows an exercise sample of a complete stroke character of “Whip”. Based on step S240, an index number sequence of “Whip”, for example, “302-104-1-3-10-1-1-5-8”, can be obtained, and the third index number among them is obtained. “1” represents the unique stroke / radical. Therefore, based on the step S250, the index number sequence of the incomplete stroke character of “Whip” is set to “302-104-1”, “302-104-1-3”, “302-104-1-3-10”, “ "302-104-1-3-10-1", "302-104-1-3-10-1-1", "302-104-1-3-10-1-1-5" Can do. FIG. 8 shows an incomplete stroke sample of “whipping” obtained from the complete stroke sample of “whipping” shown in FIG.

図9は本発明実施例による手書き文字識別方法900のフローチャートを示している。   FIG. 9 shows a flowchart of a handwritten character identification method 900 according to an embodiment of the present invention.

図9に示すように、ステップS910において、ユーザが入力した手書き軌跡を受信する。該ステップにおいて、ユーザは手書き入力ユニットを利用して手書き軌跡を入力する。   As shown in FIG. 9, in step S910, a handwritten locus input by the user is received. In this step, the user inputs a handwriting locus using the handwriting input unit.

その後、ステップ920において、手書き軌跡に対し予備処理を行う。予備処理の目的は手書き軌跡をより平滑にして、後続の操作を利することである。   Thereafter, in step 920, preliminary processing is performed on the handwritten trajectory. The purpose of the preliminary processing is to make the handwriting trajectory smoother and use subsequent operations.

その後、ステップ930において、入力した手書き軌跡と筆画テンプレートとのマッチングを行い、筆画テンプレートの整合度を確定する。最後に、ステップ940において、マッチングさせた筆画テンプレートに対応する標準文字を出力する。すなわち、手書き軌跡に対応する標準文字が識別される。   Thereafter, in step 930, the input handwriting trajectory and the stroke template are matched to determine the degree of matching of the stroke template. Finally, in step 940, standard characters corresponding to the matched stroke template are output. That is, a standard character corresponding to the handwritten locus is identified.

本発明の実施例によれば、システムは不完全筆画テンプレートを記憶保管している。したがって、1つの筆画の入力を受信するごとに、ステップS920〜S940を実行して、識別結果を調整することができる。たとえば、ユーザが上記文字Dという文字を入力しようと考えた場合、上記文字Eを入力し終えると、ステップS930で、整合度の高低にしたがって筆画テンプレートの対応する文字を順にたとえば上記文字E、「巫」、上記文字D、「丑」、「正」と確定し、それによりステップS940において、順に上記文字E、「巫」、上記文字D、「丑」、「正」と出力する。しかしユーザが続いて後続の2画を入力すると、この時ステップS930は、整合度の高低にしたがって筆画テンプレートの対応している文字を順にたとえば上記文字D、「悉」、「恐」、「恋」、「晋」と確定し、それによりステップS940において順に上記文字D、「悉」、「恐」、「恋」、「晋」と出力する。   According to an embodiment of the present invention, the system stores and stores incomplete stroke templates. Therefore, every time an input of one stroke is received, steps S920 to S940 can be executed to adjust the identification result. For example, when the user thinks to input the character D, when the character E has been input, in step S930, for example, the characters E, “ “巫”, the character D, “丑”, and “correct” are determined, and in step S940, the character E, “巫”, the character D, “丑”, and “correct” are sequentially output. However, when the user continues to input the subsequent two strokes, step S930 at this time sequentially changes the characters corresponding to the stroke template in accordance with the degree of matching, for example, the characters D, “悉”, “fear”, “love”. ”And“ 晋 ”are determined, and the characters D,“ 悉 ”,“ fear ”,“ love ”, and“ 晋 ”are sequentially output in step S940.

1つの実施例において、ユーザが筆画を入力すると、現時点での入力筆画の識別結果の中の前10の候補を出力し、且つ入力筆画の背景に最も可能性のある識別結果、すなわち整合度の最も高い文字、を表示することができる。たとえば、ユーザが漢字の文字「鞭」の、図10(a)に示したような不完全筆画、を入力する。本発明実施例による手書き文字識別システムは、現時点での入力筆画を、すべての文字のすべての不完全筆画テンプレートにマッチングさせ、不完全筆画テンプレート「鞭」が最も可能性の高い候補であることを発見する。図10(b)に示すように。最後に手書き軌跡の背景に1番目の識別結果、図10(c)に示した「鞭」、を表示する。   In one embodiment, when a user inputs a stroke, the previous ten candidates among the input stroke identification results at the present time are output, and the most likely identification result on the background of the input stroke, that is, the degree of consistency is output. The highest character can be displayed. For example, the user inputs an incomplete stroke as shown in FIG. The handwritten character identification system according to the embodiment of the present invention matches the current input stroke with all incomplete stroke templates of all characters, and determines that the incomplete stroke template “whip” is the most likely candidate. Discover. As shown in FIG. Finally, the first identification result, “Whip” shown in FIG. 10C, is displayed in the background of the handwritten locus.

いくつかの実施例においては、不完全筆画文字が全筆画文字に混淆されるのを避けるため、全筆画文字に類似するいくつかの不完全筆画文字を破棄、すなわち全筆画文字と区別される部分が特定筆画/部首である不完全筆画文字を破棄する。たとえば、文字である上記文字Dについては、その固有部首は226(心)であるが、これはそれが3つの不完全筆画文字、すなわち上記文字Gを備えていることを意味している。しかし、1番目の不完全筆画文字である上記文字Hは上記文字Eと混淆されるかもしれない。なぜなら区別される筆画である上記文字Nは文字上記文字Eを入力する時に入力スクリーン上の雑音または汚れにより間違って識別されたものの可能性があるからである。したがって、文字である上記文字Dについては、1番目の不完全筆画文字を破棄し、他の2つの不完全筆画文字だけを残す。図11は上記文字Dの中から抽出した2つの不完全筆画サンプルと完全筆画サンプルとを示している。本発明実施例によれば、前記特定筆画/部首は上記文字Nと上記文字Oの中の1つであってよい。 In some embodiments, to avoid incomplete strokes characters are conflation fully stroke character, discarding a number of incomplete strokes character similar to full stroke character, i.e. distinguished from full stroke character The incomplete stroke character whose specified portion is a specific stroke / radical is discarded. For example, the character D, which is a character, has a unique radical of 226 (heart), which means that it has three incomplete stroke characters, that is, the character G. However, the character H, which is the first incomplete stroke character, may be confused with the character E. This is because the character N, which is a stroke to be distinguished, may be erroneously identified due to noise or dirt on the input screen when the character E is input. Therefore, for the character D, which is a character, the first incomplete stroke character is discarded and only the other two incomplete stroke characters are left. FIG. 11 shows two incomplete stroke samples and complete stroke samples extracted from the character D. According to an embodiment of the present invention, the specific stroke / radical may be one of the character N and the character O.

本発明のいくつかの実施例によれば、文字を効果的に予測するために、いくつかの中間文字を構築して、類似する文字の共通部分とする。たとえば、「醒」、上記文字F、「醍」については、上記文字Iがこの3つの文字の共通部分である。このことは、該共通部分をこの3つの文字の中間文字とすることができることを意味し、且つ該中間文字について、不完全筆画テンプレートを生成する。たとえば図13に示すサンプルから抽出したテンプレートのように、上記文字K、上記文字L、上記文字Mを「醒」、上記文字F、「醍」の不完全筆画文字とする。こうすれば、ユーザが手書き文字を入力する場合、一旦、上記文字Jを入力すれば、「醒」、上記文字F、「醍」を識別することができるのである。図12は中間文字構築の1つの例を示している。図12に示すように、「醒」、上記文字F、「醍」の索引番号序列中の共通部分は「293−236」であって上記文字Mに対応している。該共通部分について、不完全筆画テンプレートを生成し、このように生成された不完全筆画テンプレートと共通部分の筆画テンプレートとを「醒」、上記文字F、「醍」の不完全筆画テンプレートとする。   According to some embodiments of the present invention, in order to effectively predict a character, several intermediate characters are constructed to be the intersection of similar characters. For example, for “Awake”, the character F, and “醍”, the character I is the common part of these three characters. This means that the common part can be an intermediate character of the three characters, and an incomplete stroke template is generated for the intermediate character. For example, as in the template extracted from the sample shown in FIG. 13, the character K, the character L, and the character M are assumed to be incomplete stroke characters of “Awake”, the character F, and “醍”. In this way, when the user inputs a handwritten character, once the character J is input, “Awake”, the character F, and “醍” can be identified. FIG. 12 shows one example of intermediate character construction. As shown in FIG. 12, the common part in the index number sequence of “Awake”, the character F, and “、” is “293-236” and corresponds to the character M. An incomplete stroke template is generated for the common portion, and the incomplete stroke template generated in this way and the stroke template of the common portion are set as the incomplete stroke templates of “Awake” and the characters F and “醍”.

本発明の実施例によれば、さらに、各標準文字を識別するための最大筆画数の表を定義する。そして、整合度を計算する時に、筆画数によって異なるウェイトを与えて、入力筆画数とマッチングテンプレートの筆画数との間の差に基づいて識別結果を調整できるようにする。   According to the embodiment of the present invention, a table of the maximum number of strokes for identifying each standard character is further defined. When calculating the degree of matching, a different weight is given depending on the number of strokes so that the identification result can be adjusted based on the difference between the number of input strokes and the number of strokes of the matching template.

本発明の実施例により提案された手書き文字識別方法とシステムは、中国語、日本語、韓国語等の文字を識別できる。   The handwritten character identification method and system proposed by the embodiment of the present invention can identify characters such as Chinese, Japanese, and Korean.

つぎに、識別率と入力筆画数を使用して本発明による手書き文字識別予測システムの性能を評価する。高い識別率を有し比較的少ない筆画しか入力する必要のないシステムは高性能システムである。そうでなければ、低い識別率を有し或いは大量の筆画の入力を必要とするシステムは低性能システムである。 Next, the performance of the handwritten character identification prediction system according to the present invention is evaluated using the identification rate and the number of input strokes. A system that has a high identification rate and that requires input of relatively few strokes is a high-performance system. Otherwise, walk has a low recognition rate is system that requires input of large amounts of stroke low performance system.

予測性能を算出するために、各文字の予測比率を次のように定義する:
PR=省かれた筆画数/総筆画数 (1)
この中で、「省かれた筆画数」とは、「総筆画数」とユーザが実際に入力した筆画数との差であり、「総筆画数」は該標準文字の総筆画数である。
In order to calculate the prediction performance, the prediction ratio of each character is defined as follows:
PR = Number of strokes omitted / Total number of strokes (1)
In this, the “number of strokes omitted” is the difference between the “total number of strokes” and the number of strokes actually input by the user, and the “total number of strokes” is the total number of strokes of the standard character.

表2に基づけば、大量の筆画数を備える文字については、本発明による手書き文字識別システムと方法が大量の入力筆画と入力時間とを省くことができることが分かる。この中で、「1候補正確」とは1番目の候補文字が正しかったという識別結果を表し、「前2候補正確」とは1番目または2番目の候補文字が正しかったという識別結果を表している。以下同様に類推する。

Figure 0006275840
Based on Table 2, it can be seen that for characters having a large number of strokes, the handwritten character identification system and method according to the present invention can save a large amount of input strokes and input time. In this, “1 candidate correct” represents the identification result that the first candidate character was correct, and “previous 2 candidate correct” represents the identification result that the first or second candidate character was correct. Yes. The same applies to the following.
Figure 0006275840

本発明実施例に基づく手書き文字識別方法とシステムは、電子ホワイトボード、タブレットPC、デスクトップPC、携帯電話、PDA、手書き入力をサポートしている他の電子装置などに応用可能である。これらの装置に、ユーザが手指やスタイラスペンなどを用いてスクリーンに入力すると、本発明実施例による手書き文字識別方法とシステムが、それに応じてスクリーン上に識別結果を出力することができる。   The handwritten character identification method and system according to embodiments of the present invention can be applied to electronic whiteboards, tablet PCs, desktop PCs, mobile phones, PDAs, and other electronic devices that support handwriting input. When a user inputs to these devices using a finger or a stylus pen on the screen, the handwritten character identification method and system according to the embodiment of the present invention can output the identification result on the screen accordingly.

ここで開示した本発明実施例の他のセッティングには、先に概述した方法による実施例のステップと操作を実行するソフトウェアプログラムが含まれる。より具体的には、コンピュータプログラム製品とは、コンピュータプログラムロジックがコード化されて存在するコンピュータ読取媒体を備えていて、それが計算装置上で実行される時、コンピュータプログラムロジックが関係操作を提供して、それにより上記の技術手段が提供されるという実施例である。計算システムの少なくとも1つのプロセッサ上で実行される時、コンピュータプログラムロジックがプロセッサに本発明実施例に述べる操作(方法)を実行させることができるものである。本発明のこの種のセッティングは典型的には、たとえば光媒体(たとえばCD−ROM)、フロッピー(登録商標)ディスク、ハードディスク等のコンピュータ読取媒体上のソフトウェア、コード及び/または他のデータ構造、あるいは1つまたは複数のROMまたはRAMまたはPROMチップ上などのファームウェアまたはマイクロコードのその他媒体、または特定用途向け集積回路(ASIC)、または1つか複数のモジュール内のダウンロード可能なソフトウェア画像、共有データベース等、でのセッティングまたはコードとして提供される。ソフトウェアまたはファームウェアまたはこの種の配置が、計算装置に装着されて、計算装置内の1つまたは複数のプロセッサに本発明実施例に述べる技術を実行させることができる。1組のデータ通信装置または他の実体内などの計算装置に連結されて操作を行なうソフトウェアプロセスも本発明による装置を提供することができる。本発明による装置は複数のデータ通信装置上の複数のソフトウェアプロセス、あるいは1組の特定用途向け小型コンピュータ上で運用されるすべてのソフトウェアプロセス、あるいは単独のコンピュータ上で運用されるすべてのソフトウェアプロセスの間でも応用され得る。   Other settings of the embodiment of the invention disclosed herein include software programs that perform the steps and operations of the embodiment according to the method outlined above. More specifically, a computer program product comprises a computer readable medium on which computer program logic is encoded and when the computer program logic is executed on a computing device, the computer program logic provides related operations. In this way, the above technical means are provided. When executed on at least one processor of a computing system, computer program logic is capable of causing the processor to perform the operations (methods) described in the embodiments of the present invention. This type of setting of the present invention is typically software, code and / or other data structures on a computer readable medium such as an optical medium (eg, CD-ROM), floppy disk, hard disk, or the like, or Firmware or other medium of microcode, such as on one or more ROM or RAM or PROM chips, or application specific integrated circuits (ASICs), or downloadable software images in one or more modules, shared databases, etc. Provided as a setting or code in Software or firmware or such an arrangement can be mounted on the computing device to cause one or more processors in the computing device to perform the techniques described in the embodiments of the present invention. A software process coupled to a computing device, such as in a set of data communication devices or other entities, can also provide a device according to the present invention. The apparatus according to the present invention can be used for a plurality of software processes on a plurality of data communication devices, or for all software processes operating on a set of special purpose small computers, or for all software processes operating on a single computer. It can also be applied between.

厳密に言えば、本発明の実施例はコンピュータ装置上のソフトウェアプログラム、ソフトウェアとハードウェア、あるいは単独のソフトウェア及び/または単独の回路として実現できるということを理解すべきである。   Strictly speaking, it should be understood that embodiments of the present invention can be implemented as a software program on software, software and hardware, or a single software and / or a single circuit.

以上の記述において、例示の方式でのみ、本発明の技術手段を示したのであるが、本発明が上記のステップやユニット構造に限定されることを決して意味するのではないことに、留意すべきである。可能な場合において、必要に基づいてステップやユニット構造について調整や取捨することができる。したがって、あるステップやユニットが本発明を実施する発明構想全体に必要な要素であるというわけでは決してない。したがって、本発明に必要な技術的特徴は、本発明を実現させることのできる発明構想全体の最低限の要求の限定を受けるのみであって、上記の具体的な実例の制限を受けるものではない。   In the above description, the technical means of the present invention is shown only by way of example, but it should be noted that the present invention is in no way meant to be limited to the above steps and unit structures. It is. Where possible, steps and unit structures can be adjusted and discarded as needed. Thus, a step or unit is by no means a necessary element of the overall inventive concept implementing the present invention. Accordingly, the technical features necessary for the present invention are limited only to the minimum requirements of the entire inventive concept capable of realizing the present invention, and not limited to the specific examples described above. .

ここまで、好ましい実施例に結び付けて本発明に対し記述を行なってきた。本分野の当業者は本発明の精神と範囲を逸脱しない情況下で、各種他の変更、置き換えや添加を行うことができることを理解すべきである。したがって、本発明の範囲は上述した特定の実施例に限定されずに、附属の請求の範囲によって限定されるべきである。   Thus far, the present invention has been described in connection with the preferred embodiment. It should be understood by those skilled in the art that various other modifications, substitutions and additions can be made without departing from the spirit and scope of the present invention. Accordingly, the scope of the invention should not be limited to the specific embodiments described above, but should be limited by the appended claims.

Claims (11)

ユーザが入力した手書き軌跡を受信するステップと、
手書き軌跡を少なくとも1つの筆画テンプレートにマッチングさせて筆画テンプレートの整合度を確定するステップと、
整合度にしたがって、マッチングさせた筆画テンプレートに対応する標準文字を出力するステップと、を有する手書き文字識別方法であって、
前記筆画テンプレートが標準文字のマッチングテンプレートであり、且つ、
少なくとも1つの標準文字のマッチングテンプレートが、前記少なくとも1つの標準文字の完全筆画テンプレートと、前記少なくとも1つの標準文字の不完全筆画標準文字の不完全筆画テンプレートと、を有し、前記少なくとも1つの標準文字の不完全筆画テンプレートが対応している不完全筆画標準文字が、如何なる他の標準文字の一部または全部を構成するものではなく、
前記不完全筆画テンプレートが、
基本筆画と部首を定義するステップと、
基本筆画と部首の中の筆画/部首ごとに1つの索引番号を割り当てるステップと、
標準文字の筆画/部首ごとに対応している索引番号と、該標準文字の筆画順序組合せにしたがって取得した索引番号序列と、を用いて各標準文字を表示するステップと、
標準文字の索引番号序列を順に並べるステップと、
前記少なくとも1つの標準文字と他の標準文字とで異なる索引番号を識別するステップと、
前記少なくとも1つの標準文字の、索引番号序列の中の開始索引番号から前記異なる索引番号までの部分の索引番号序列である、前記少なくとも1つの標準文字の固有索引番号序列、を確定するステップと、
前記固有索引番号序列に対応する不完全筆画標準文字を生成して、前記少なくとも1つの標準文字の不完全筆画標準文字とするステップと、
前記少なくとも1つの標準文字の完全筆画サンプルに基づいて、前記不完全筆画標準文字に対応する該標準文字の不完全筆画サンプルを取得するステップと、
前記少なくとも1つの標準文字の不完全筆画サンプルに基づいて、前記少なくとも1つの標準文字の不完全筆画テンプレートを取得するステップと、により生成されるものであ
る手書き文字識別方法。
Receiving a handwritten trajectory input by the user;
Matching the handwriting trajectory to at least one stroke template to determine the consistency of the stroke template;
Outputting a standard character corresponding to the matched stroke template according to the degree of matching, comprising:
The stroke template is a standard character matching template, and
At least one standard character matching template comprises the at least one standard character complete stroke template and the at least one standard character incomplete stroke standard character incomplete stroke template, wherein the at least one standard The incomplete stroke standard characters supported by the incomplete stroke template of characters do not constitute part or all of any other standard characters,
The incomplete stroke template is
Defining basic strokes and radicals;
Assigning one index number for each basic stroke and each stroke / radical in the radical;
Displaying each standard character using an index number corresponding to each stroke / radical of the standard character and an index number sequence obtained according to the stroke order combination of the standard character;
Ordering the standard character index number sequence,
Identifying index numbers that differ between the at least one standard character and other standard characters;
Determining the unique index number sequence of the at least one standard character that is the index number sequence of the portion of the at least one standard character from the starting index number to the different index number in the index number sequence;
Generating incomplete stroke standard characters corresponding to the unique index number sequence to be incomplete stroke standard characters of the at least one standard character;
Obtaining an incomplete stroke sample of the standard character corresponding to the incomplete stroke standard character based on the complete stroke sample of the at least one standard character;
Obtaining an incomplete stroke template of the at least one standard character based on the incomplete stroke sample of the at least one standard character.
1つの筆画が入力されるのを受信するごとに前記マッチングと出力のステップを実行する、請求項1に記載の方法。   The method of claim 1, wherein the matching and outputting steps are performed each time a stroke is received. 前記手書き軌跡にマッチングさせる少なくとも1つの筆画テンプレートが、すべての標準文字のすべてのマッチングテンプレートである、請求項1に記載の方法。   The method of claim 1, wherein the at least one stroke template that matches the handwriting trajectory is all matching templates for all standard characters. 手書き軌跡を少なくとも1つの筆画テンプレートにマッチングさせて筆画テンプレートの整合度を確定するステップが、さらに、
すでに入力した筆画数と、マッチングさせる筆画テンプレートに対応する標準文字の筆画数と、の差に基づいて整合度に重み付けするステップを有する、請求項1に記載の方法。
Matching the handwriting trajectory with at least one stroke template to determine the consistency of the stroke template;
The method according to claim 1, further comprising the step of weighting the degree of matching based on a difference between the number of strokes already input and the number of strokes of a standard character corresponding to a stroke template to be matched.
手書き軌跡の背景に整合度の最も高い筆画テンプレートに対応する標準文字を表示するステップをさらに有する、請求項1に記載の方法。   The method according to claim 1, further comprising displaying a standard character corresponding to the stroke template having the highest degree of matching on the background of the handwriting trajectory. 前記固有索引番号序列が、さらに、前記異なる索引番号の後の索引番号を有する、請求項1に記載の方法。   The method of claim 1, wherein the unique index number order further comprises an index number after the different index number. 前記異なる索引番号に対応する筆画/部首が少なくとも2つの筆画を有する時、前記固有索引番号序列に対応する不完全筆画標準文字が、さらに、
開始索引番号から前記異なる索引番号の1つ前の索引番号までの部分の索引番号序列に対応する筆画/部首と、それに加えて前記異なる索引番号に対応する筆画/部首の筆画1つ1つの部分と、を有する不完全筆画標準文字、を有する、請求項6に記載の方法。
When the stroke / radical corresponding to the different index number has at least two strokes, the incomplete stroke standard character corresponding to the unique index number sequence further includes:
A stroke / radical corresponding to the index number order of the portion from the start index number to the index number one before the different index number, and in addition, a stroke / radical stroke corresponding to the different index number The method according to claim 6, further comprising: an incomplete stroke standard character having two parts.
取得した不完全筆画テンプレートの中から、前記異なる索引番号に対応する筆画/部首が特定筆画/部首の中の1つである不完全筆画テンプレートを破棄する、請求項1に記載の方法。   The method according to claim 1, wherein an incomplete stroke template whose stroke / radical corresponding to the different index number is one of the specific strokes / radicals is discarded from the acquired incomplete stroke templates. 前記特定筆画/部首が下記文字Nと下記文字O
Figure 0006275840
とを有する、請求項8に記載の方法。
The specific stroke / radical is the following letter N and the following letter O
Figure 0006275840
9. The method of claim 8, comprising:
前記少なくとも1つの標準文字の不完全筆画テンプレートが、さらに、
少なくとも2つの標準文字の、それぞれの不完全筆画部分である同一筆画部分、を確定するステップと、
該同一筆画部分を中間標準文字とし、前記中間標準文字について、その不完全筆画テンプレートを生成するステップと、
生成された不完全筆画テンプレートと、前記中間標準文字に対応する筆画テンプレートと、を前記少なくとも2つの標準文字の中の標準文字ごとの不完全筆画テンプレートとするステップと、により生成されるテンプレート、を有する、請求項1に記載の方法。
The incomplete stroke template of the at least one standard character further comprises:
Determining at least two standard characters, the same stroke portion being each incomplete stroke portion;
The same stroke portion as an intermediate standard character, and for the intermediate standard character, generating an incomplete stroke template;
The generated incomplete stroke template and the stroke template corresponding to the intermediate standard character as an incomplete stroke template for each standard character in the at least two standard characters, and a template generated by The method of claim 1, comprising:
前記標準文字が、中国語、日本語、韓国語の中の1つ、の文字である、請求項1〜10のいずれか1項に記載の方法 The method according to claim 1, wherein the standard character is one of Chinese, Japanese, and Korean .
JP2016532526A 2013-11-27 2014-11-27 How to identify handwritten characters Expired - Fee Related JP6275840B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201310616121.4 2013-11-27
CN201310616121.4A CN104680196A (en) 2013-11-27 2013-11-27 Handwriting character recognizing method and system
PCT/CN2014/092366 WO2015078383A1 (en) 2013-11-27 2014-11-27 Handwritten character recognition method and system

Publications (2)

Publication Number Publication Date
JP2016537728A JP2016537728A (en) 2016-12-01
JP6275840B2 true JP6275840B2 (en) 2018-02-07

Family

ID=53198379

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016532526A Expired - Fee Related JP6275840B2 (en) 2013-11-27 2014-11-27 How to identify handwritten characters

Country Status (3)

Country Link
JP (1) JP6275840B2 (en)
CN (1) CN104680196A (en)
WO (1) WO2015078383A1 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106355630B (en) * 2015-07-21 2021-06-29 鸿合科技股份有限公司 Feature-based dynamic entity generation method and device
CN110969165B (en) * 2019-11-28 2024-04-09 中国科学院半导体研究所 Handwritten character recognition method, handwritten character recognition device, electronic equipment and storage medium
CN111310548B (en) * 2019-12-04 2023-09-19 武汉汉德瑞庭科技有限公司 Method for identifying stroke types in online handwriting
CN111143541B (en) * 2020-03-07 2023-11-03 合肥煜极网络科技有限公司 Font generation system for deep learning based on handwriting
CN112215175B (en) * 2020-10-19 2024-01-30 北京乐学帮网络技术有限公司 Handwritten character recognition method, device, computer equipment and storage medium
CN112925470B (en) * 2021-05-10 2021-10-01 广州朗国电子科技股份有限公司 Touch control method and system of interactive electronic whiteboard and readable medium

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS603238B2 (en) * 1977-11-28 1985-01-26 富士通株式会社 Handwritten character online identification method
JP2924040B2 (en) * 1990-01-25 1999-07-26 ソニー株式会社 Handwritten character recognition device
TW338815B (en) * 1995-06-05 1998-08-21 Motorola Inc Method and apparatus for character recognition of handwritten input
JPH0950490A (en) * 1995-08-07 1997-02-18 Sony Corp Handwritten character recognizing device
JPH09330377A (en) * 1996-06-10 1997-12-22 Hitachi Ltd Device and method for recognizing handwritten character
JPH10162101A (en) * 1996-11-28 1998-06-19 Hitachi Ltd Device and method for recognizing handwritten character
JPH10269315A (en) * 1997-03-26 1998-10-09 Toshiba Corp Character recognition device, character recognition method and dictionary registration method
CN1881994A (en) * 2006-05-18 2006-12-20 北京中星微电子有限公司 Method and apparatus for hand-written input and gesture recognition of mobile apparatus
CN100587660C (en) * 2007-03-30 2010-02-03 北京三星通信技术研究有限公司 Method and device for forecasting and discriminating hand-written characters
CN101354749B (en) * 2007-07-24 2013-01-09 夏普株式会社 Method for making dictionary, hand-written input method and apparatus
CN102221976A (en) * 2011-07-06 2011-10-19 上海驿创信息技术有限公司 Method for quickly inputting words based on incomplete identification
CN102937837A (en) * 2012-08-10 2013-02-20 上海驿创信息技术有限公司 Method for inputting words on the basis of incomplete recognition quickly

Also Published As

Publication number Publication date
CN104680196A (en) 2015-06-03
WO2015078383A1 (en) 2015-06-04
JP2016537728A (en) 2016-12-01

Similar Documents

Publication Publication Date Title
JP6275840B2 (en) How to identify handwritten characters
US20190012076A1 (en) Typing assistance for editing
KR102326395B1 (en) System and method and product for recognizing multiple object inputs
JP5211334B2 (en) Handwritten symbol recognition method and apparatus
US9298365B2 (en) Storage medium, information processing apparatus and character recognition method
JP5270027B1 (en) Information processing apparatus and handwritten document search method
US20180300542A1 (en) Drawing emojis for insertion into electronic text-based messages
US10325018B2 (en) Techniques for scheduling language models and character recognition models for handwriting inputs
JP2014139809A (en) Shared language model
US20140184610A1 (en) Shaping device and shaping method
US20210350122A1 (en) Stroke based control of handwriting input
WO2017005207A1 (en) Input method, input device, server and input system
CN103713845A (en) Method for screening candidate items and device thereof, text input method and input method system
CN110532415A (en) Picture search processing method, device, equipment and storage medium
KR20220038477A (en) Extract line of text
JP2020087112A (en) Document processing apparatus and document processing method
CN112560459B (en) Sample screening method, device, equipment and storage medium for model training
JP2019148859A (en) Device and method supporting discovery of design pattern in model development environment using flow diagram
JP6655331B2 (en) Electronic equipment and methods
JP6430011B2 (en) Kanji input method and apparatus
KR101349967B1 (en) Method of Improving Logic to Propose Query for Mobile Keyboard Typo Pattern and the Device Thereof
WO2018054127A1 (en) Handwriting input method and device
JP2011237993A (en) Information input device and information input program
CN111104886A (en) Gesture recognition method, device, equipment and storage medium
JP2017097451A (en) Information processing method, information processing program, and information processing device

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160519

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160519

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170725

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180110

R150 Certificate of patent or registration of utility model

Ref document number: 6275840

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees