JP2011028722A - Character search method using stroke order - Google Patents

Character search method using stroke order Download PDF

Info

Publication number
JP2011028722A
JP2011028722A JP2010053133A JP2010053133A JP2011028722A JP 2011028722 A JP2011028722 A JP 2011028722A JP 2010053133 A JP2010053133 A JP 2010053133A JP 2010053133 A JP2010053133 A JP 2010053133A JP 2011028722 A JP2011028722 A JP 2011028722A
Authority
JP
Japan
Prior art keywords
character
stroke order
code
stroke
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2010053133A
Other languages
Japanese (ja)
Inventor
Tetsuya Kagami
徹也 加賀美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2010053133A priority Critical patent/JP2011028722A/en
Publication of JP2011028722A publication Critical patent/JP2011028722A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Input From Keyboards Or The Like (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a character search method that improves accuracy of character search according to the level of knowledge about stroke order for a character such as Kanji (Chinese character), Kana character, or numeric character, and also improve search efficiency by additionally inputting a correct stroke order. <P>SOLUTION: In the character search method, in addition to a method for coding a search character by vertically and horizontally dividing a space between components of a search character and using codes showing whether the character can be divided or not, a method for coding the character by sequentially replacing the strokes of the character by codes starting with "5" of a numerical keypad or as a node, is stored in a classification storage means together with the corresponding character. The two types of codes are used in combination for input, thereby improving accuracy of searching and displaying the character from the storage means as compared with a conventional search method using a single code. Information as to whether the character can be divided or not and the vertical and horizontal direction of the stroke order are binarized, whereby achieving integrated processing. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、漢字やハングル等の文字のほか、数字やアルファベットや仮名文字などを含む幅広い文字を簡易な方法で正確、迅速に検索する検索方法に関するものである。   The present invention relates to a search method for accurately and quickly searching a wide range of characters including numbers, alphabets, kana characters and the like in addition to characters such as kanji and hangul.

文字に関する検索方法として特許文献1に示すものは文字を構成する要素間の間隙の有無に注目して文字をコード化して検索するものである。
この発明によれば、たとえば、パソコンや携帯電話で広く普及しているフロントエンドプロセッサー(漢字変換ソフト)のユーザー辞書やシステム辞書に「読み(発音)」の代わりに上述した文字分割コードを登録することにより、日本人が発音の分からない中国漢字などを検索変換することができる。
As a search method related to characters, the one disclosed in Patent Document 1 is a method in which characters are coded and searched by paying attention to the presence or absence of gaps between elements constituting the characters.
According to the present invention, for example, the character division code described above is registered in place of “reading (pronunciation)” in the user dictionary or system dictionary of a front-end processor (kanji conversion software) widely used in personal computers and mobile phones. By doing so, it is possible to search and convert Chinese kanji characters that the Japanese does not know how to pronounce.

特許文献1は、たとえば漢字検索方法に限定して比較しても、1716年に刊行された『康煕字典』以来約300年にわたって踏襲されてきた漢字検索方法と工学的応用とは一線を画す画期的な特長が2つあった。 For example, Patent Document 1 shows a distinction between the Kanji search method and the engineering application that have been followed for about 300 years since the “Kangzung Character Dictionary” published in 1716, even when compared to the Kanji search method. There were two periodic features.

第1の特長は、従来の漢字検索方法が文字の構成要素である線などの図形情報自体をコード化したものであったのに対し、特許文献1は線と線の間隙(すきま)が有るか無いかという空間の有無をコード化した点である。つまり線などの図形情報自体ではなく、従来見逃されていた空間情報の有無をコード化した点に新規性が認められた。 The first feature is that the conventional kanji search method encodes graphic information itself such as lines that are constituent elements of characters, whereas Patent Document 1 has a gap between lines. It is the point which coded the presence or absence of the space of whether or not. In other words, the novelty was recognized in that it encoded the presence or absence of spatial information that had been missed in the past, not the graphic information itself such as lines.

第2の特長は、従来の漢字検索方法が文字の構成要素をたとえば中国の五筆字型入力方法では100以上の構成要素に分類し、その構成要素を人間が記憶した上で、組み合わせて漢字を再構成または検索するという複雑なコード化を必要としていたため、人間が直接2値化できなかったのに対し、特許文献1は漢字を構成する線と線の間に、すきまが有るか無いかという判断を人間が即座に行うことが可能なため、直接2値化によるコード化が可能である点に新規性が認められた。 The second feature is that the conventional kanji search method classifies the character components into, for example, 100 or more components in the Chinese five-stroke type input method, and the components are memorized by humans and then combined into kanji. Since humans were not able to directly binarize because complicated encoding such as reconstruction or search was required, Patent Document 1 has a gap between lines constituting kanji. Therefore, novelty has been recognized in that it is possible to code directly by binarization because it is possible for humans to make an immediate determination.

上記2つの特長を有する特許文献1は、過去300年にわたって踏襲されてきた漢字字典の部首などの伝統的漢字検索方法や、その延長線上に応用された中国式五筆字型入力方法などの工学的漢字検索方法とは一線を画す画期的な新規性が認められた。 Patent Document 1 having the above two features is related to engineering such as the traditional Chinese character search method such as radicals of the Chinese character dictionary that has been followed for the past 300 years, and the Chinese-style five-stroke input method applied on the extension line. A revolutionary novelty that is different from the traditional Kanji search method was recognized.

特開2008−262248号公報JP 2008-262248 A

前記特許文献1に記載の発明は3つの課題があった。
第1は、文字知識の全く無い欧米人などが中国語の漢字を検索する場合などには文字分割コードによる検索法は有効だが、漢字知識を持つ日本人などが文字分割コードに習熟してくると、フロントエンドプロセッサーなどを利用して漢字変換する際に、たとえば漢字の「仁」も「倍」も「1101」という同じ分割コードに分類されるため、こうした文字の検索変換精度を向上させたいという希望が出てきた。
The invention described in Patent Document 1 has three problems.
First, when Westerners who have no knowledge of characters search Chinese kanji characters, the search method using character division codes is effective, but Japanese people with kanji knowledge are proficient in character division codes. When converting Kanji using a front-end processor, etc., for example, “Jin” and “Double” of Kanji are classified into the same division code of “1101”, so we want to improve the search conversion accuracy of these characters. The hope came out.

第2は、アルファベットやかな文字が漢字と一緒に用いられる日本語などの場合、隙間が少ないアルファベットやかな文字の多くが「0000」という同じ分割コードに分類されるため、漢字部分に較べて精度の劣る数字やアルファベットや仮名文字などの検索精度を向上させたいという希望が出てきた。 Secondly, in the case of Japanese characters where alphabetic characters are used together with kanji, many alphabetic characters with few gaps are classified into the same division code “0000”, so the accuracy is higher than that of the kanji part. There is a desire to improve the search accuracy of numbers, alphabets, and kana characters that are inferior.

第3は、文字4分割コードを利用した漢字などの検索方法は便利だが、かえって漢字の筆順などを覚える必要がないと学習者が誤解する恐れがあり教育上の影響が心配されるという感想が出てきた。 Third, although the search method for kanji using a 4-part character code is convenient, there is a possibility that the learner may misunderstand that there is no need to learn the stroke order of kanji, and the impact on education is concerned. It came out.

本発明は上記の点に鑑みなされたものであり、漢字や仮名や数字などの文字に対する筆順知識を有する度合いに応じて上記方法を単独で使用した場合よりも精度を向上させ、しかも正しい筆順を追加入力すれば文字検索精度が向上し検索効率もよいという利点が動機付けとなり教育的効果も期待できる文字検索方法を提供するものである。しかも、パソコンや携帯電話のテンキーなどの一般的で必要最小限の入力装置を利用するため、直感的で利用しやすいという利便性も提供できる。   The present invention has been made in view of the above points, and improves accuracy compared with the case where the above method is used alone depending on the degree of stroke order knowledge for characters such as kanji, kana and numbers, and correct stroke order. It provides a character search method that is motivated by the advantage that the additional character input improves the character search accuracy and the search efficiency is good, and can be expected to have an educational effect. In addition, since a general and necessary minimum input device such as a numeric keypad of a personal computer or a mobile phone is used, the convenience of being intuitive and easy to use can be provided.

しかも本発明は、テンキーなどの入力装置に好適な数字の0から9までの10種類の数字などの組合せからなる「詳細式の筆順コード」をさらに簡易化でき、たとえば筆順を時系列に縦方向であれば、その部分をたとえば数字の1に置換でき、横方向であればたとえば数字の0に置換できるため、特許文献1の第2の特長である人間が直接文字の筆順を1か0の組合せからなる2値化できるという「簡易式の筆順コード」に置換することも可能であるため、従来の筆順コード化にない単純なコード化が可能であるという特長を有することにより、特許文献1と同じ構成の文字検索装置において、特許文献1の文字分割コードと本発明の筆順コードを組み合わせて記憶装置に記憶させることにより、特許文献1以上の精度を向上できる。 In addition, the present invention can further simplify the “detailed stroke order code” composed of combinations of 10 numbers from 0 to 9, which are suitable for an input device such as a numeric keypad. If this is the case, the part can be replaced with, for example, the number 1 and if it is in the horizontal direction, for example, the number 0 can be replaced. Since it is possible to replace it with a “simple stroke order code” that can be binarized, it is possible to perform simple coding that is not possible with conventional stroke order coding. In the character search device having the same configuration as the above, the character division code of Patent Document 1 and the stroke order code of the present invention are combined and stored in the storage device, so that the accuracy of Patent Document 1 or higher can be improved.

本発明の要旨とするところは、検索文字の構成要素の間隙を、縦方向と横方向に分割して、この分割の可否をコードに置き換えることで文字をコード化する方法に加え、文字の筆順をパソコンなどのテンキーの「5」を起点あるいは結節点として順番に筆順をコードに置き換えることで文字をコード化する方法を対応する文字と一緒に分類記憶手段に記憶せしめ、前記2種類のコードを入力の際に併用することにより前記記憶手段から文字を検索表示する精度を単独のコードを利用した検索方法よりも向上させることを可能とした文字検索方法である。   The gist of the present invention is that, in addition to the method of coding characters by dividing the gap between the constituent elements of the search character in the vertical direction and the horizontal direction and replacing the possibility of division with a code, the stroke order of the characters The method of coding characters by sequentially replacing the stroke order with a code starting from “5” of the numeric keypad of a personal computer or the like is stored in the classification storage means together with the corresponding characters, and the two types of codes are stored. This is a character search method that can improve the accuracy of searching and displaying characters from the storage means when compared with a search method using a single code.

さらに、数字0から9までの10種類の数字からなる詳細式筆順コードを数字0と1の2種類の数字からなる簡易式筆順コードに2値化できることを特徴とするため、特許文献1と同じ装置を利用しつつ、本発明筆順コードを追加するだけで特許文献1の精度を向上させることができる。 Furthermore, since the detailed stroke order code consisting of 10 types of numbers from 0 to 9 can be binarized into a simple stroke order code consisting of 2 types of numbers 0 and 1, the same as in Patent Document 1 The accuracy of Patent Document 1 can be improved only by adding the stroke order code of the present invention while using the apparatus.

簡易式筆順2値化コードは、従来の筆順コードとは異なる新規性を有する。
すなわち、本発明は筆順の時系列な線などの組合せを、全て縦か横かに2値化するため、究極的な文字の分解可能要素を厳密に規定している。
The simple stroke order binarization code has novelty different from the conventional stroke order code.
That is, the present invention strictly defines the ultimate character decomposable element in order to binarize all combinations of time-series strokes in the stroke order, either vertically or horizontally.

たとえば、パソコンや電卓のテンキーの数字5キーを座標軸の原点とみなす。原点である5キーから上下方向にある8キーや2キーを座標軸のy軸とみなし、原点である5キーの左右方向にある4キーや6キーを座標軸のx軸とみなす。 For example, the number 5 on the numeric keypad of a personal computer or calculator is regarded as the origin of the coordinate axes. The 8 keys and 2 keys in the vertical direction from the 5 keys that are the origin are regarded as the y axis of the coordinate axis, and the 4 keys and 6 keys that are in the left and right directions of the 5 keys that are the origin are regarded as the x axis of the coordinate axis.

本発明の上記規定により、キー5と6というプラスx軸と5と8というプラスy軸から構成されるキー9を含む平面は第1象限に相当する。以下反時計回りにキー5と4というマイナスx軸とキー5と8というプラスy軸から構成されるキー7を含む平面は第2象限に相当する。キー5と4というマイナスx軸とキー5と2というマイナスy軸から構成される1キーを含む平面は第3象限に相当する。キー5と6というプラスx軸とキー5と2というマイナスy軸から構成されるキー3を含む平面は第4象限に相当する。 According to the above definition of the present invention, the plane including the key 9 constituted by the plus x axis of the keys 5 and 6 and the plus y axis of 5 and 8 corresponds to the first quadrant. Hereinafter, the plane including the key 7 composed of the minus x-axis of the keys 5 and 4 and the plus y-axis of the keys 5 and 8 counterclockwise corresponds to the second quadrant. A plane including one key composed of the minus x-axis of keys 5 and 4 and the minus y-axis of keys 5 and 2 corresponds to the third quadrant. A plane including the key 3 constituted by the plus x-axis of the keys 5 and 6 and the minus y-axis of the keys 5 and 2 corresponds to the fourth quadrant.

上記規定を前提に、本発明はキー5を原点とするキー8ならびにキー2のプラスとマイナス方向のy軸を含む第2象限内の5を起点とする直線ならびに曲線と、第3象限内の5を起点とする直線ならびに曲線を「縦方向の筆順」と規定し、たとえば数字の1で簡易式にコード化する。また、キー5を原点とするキー8ならびにキー2のプラスとマイナス方向のy軸を含まない第1象限内の5を起点とする直線ならびに曲線と、第4象限内の5を起点とする直線ならびに曲線を「横方向の筆順」と規定し、たとえば数字の0で簡易式にコード化する。これにより、2値化した筆順コードが厳密に規定できる。 On the premise of the above definition, the present invention provides a straight line and a curve starting from 5 in the second quadrant including the y axis in the positive and negative directions of the key 8 and the key 2 having the key 5 as the origin, and in the third quadrant. A straight line and a curve starting from 5 are defined as “longitudinal stroke order”, and for example, the number 1 is coded in a simplified manner. Also, a straight line and a curve starting from 5 in the first quadrant not including the y-axis in the plus and minus directions of the key 8 and the key 2 starting from the key 5, and a straight line starting from 5 in the fourth quadrant In addition, the curve is defined as “the stroke order in the horizontal direction”, and is coded in a simplified form, for example, with the numeral 0. Thereby, the binarized stroke order code can be strictly defined.

これに対し、従来の筆順コードは全て約300年以前に刊行された『康煕字典』で定められた部首や筆順や画数を踏襲しているため、厳密な2値化による筆順コードが実現できなかった。たとえば、日本のJISコードや中国の国家標準GBコードは、伝統的な『康煕字典』以来の部首や筆順や画数を踏襲しているため、漢字の「口」(くちへん、くにがまえ)を3画という画数に規定している。 On the other hand, all the conventional stroke order codes follow the radicals, stroke order and stroke number specified in the “Kangzung Character Dictionary” published about 300 years ago. There wasn't. For example, the Japanese JIS code and the Chinese national standard GB code follow the traditional radical, stroke order, and stroke count since the traditional Kang Yin Dictionary, so the kanji "mouth" (Kuchigen, Kunigae) The number of strokes is defined as 3 strokes.

本発明であれば、2値化が厳密に規定されているため、漢字の「口」の第1画の筆順は縦1が起筆であり、第2画が横0であり、第3画が縦1であり、第4画が横0であるため、2値化した筆順コードの結果は1010となる。 Since binarization is strictly defined in the present invention, the stroke order of the first stroke of the Chinese character “Mouth” is vertical one, the second stroke is horizontal 0, and the third stroke is Since the length is 1 and the fourth image is width 0, the binarized stroke order code result is 1010.

しかし、伝統的な筆順を踏襲したJISコードやGBコードでは、第1画の筆順は縦方向の起筆なので仮に本発明同様に数字1で置換できたとしても、第2画は横方向と縦方向を統合した「フ」(折れ)という複合的な筆順要素が最小構成単位であるため、最後の第3画の横方向の数字0と識別するためにたとえば、数字の2や3などの2値化以外のコードを導入する必要があった。 However, in the JIS code and GB code that follow the traditional stroke order, the stroke order of the first stroke is vertical, so even if it can be replaced with the number 1 as in the present invention, the second stroke is horizontal and vertical. Since the combined stroke order element “F” (break), which is an integrated unit, is the minimum structural unit, for example, binary numbers such as the numbers 2 and 3 are used to distinguish them from the horizontal number 0 in the last third stroke. It was necessary to introduce a code other than the code.

中華人民共和国では政府が認定した「GB13000.1字符集漢字字序(筆画序)規範」という漢字の筆順と画数のコードブックを1999年10月1日に発布し、2000年1月1日に実施している。日本のJISコードに相当するGBコードと呼ばれる中国の筆順と画数を規定したコードブックには総数20902個の漢字が収録されている。
参考文献「国家語言文字工作委員会語言文字規範GF3003−1999『GB13000.1字符集漢字字序(筆画序)規範』」上海教育出版社2000年5月刊行
In the People's Republic of China, the code book of stroke order and stroke number of the Chinese character “GB13000.1 Character Collection Kanji Character Order (stroke order) norm” which was approved by the government was promulgated on October 1, 1999, and on January 1, 2000 We are carrying out. A total of 20902 kanji characters are recorded in a codebook that defines Chinese stroke order and stroke count, which is called GB code, which corresponds to Japanese JIS code.
Reference: “National Language and Character Work Committee Language Character Code GF3003-1999“ GB13000.1 Character Collection Kanji Character Order ”(Shanghai Education Publishing Co., Ltd.) May 2000

この情報処理などを目的とした漢字筆順コードは、2値化ではなく5値化による筆順と画数を規定している。筆順と画数の最小単位は本発明のごとき縦か横かという厳密な2値化規定ではなく、伝統的であいまいな「一」(横)、「|」(縦)、「ノ」(払い)、「、」(点)、「フ」(折れ)という複合的な最小単位であり、順に1(横)、2(縦)、3(払い)、4(点)、5(折れ)という数字によって置換コード化している。 This kanji stroke order code for the purpose of information processing and the like defines the stroke order and the number of strokes by quinarization instead of binarization. The minimum unit of stroke order and stroke number is not a strict binarization rule such as vertical or horizontal as in the present invention, but the traditional ambiguous “one” (horizontal), “|” (vertical), “no” (payment) , “,” (Point), “F” (break), the smallest unit, and the numbers 1 (horizontal), 2 (vertical), 3 (payment), 4 (point), and 5 (fold) Is replaced with a code.

さらに、5値化された5種類の筆順コードの各分類には、さらに類似構成要素が同一視されて5つの分類に所属している。たとえば、コード3には「、」(点)のほかに「へ」なども類似構成要素として含まれる。さらにコード5には「フ」(折れ)のほかに「乙」「L」「く」などの14種類もの類似構成要素とされるものも含まれる。
その結果、厳密な5値化とはいえず、たとえば前述した「口」(くちへん、くにがまえ)は251つまり2(縦)の次に5(折れ)1(横)という筆順コードと3画という画数に分類される。これでは本発明のごとき厳密かつ直感的な2値化を行うことはできない。したがって、誰もが普遍的かつ直感的に理解することは難しく、どのような筆順と画数の組合せが妥当かを学習するのが難しいという欠点が300年間続いてきた。
Further, in each of the five types of quinary stroke order codes, similar components are identified and belong to the five categories. For example, the code 3 includes “he” in addition to “,” (points) as similar components. Further, the code 5 includes not only “F” (fold) but also 14 types of similar components such as “B”, “L”, and “KU”.
As a result, it cannot be said that it is strictly quinary. For example, the above-mentioned “mouth” (Kuchigen, Kunigae) has a stroke order code of 251, 2 (vertical), then 5 (folded), 1 (horizontal), and 3 It is classified into the number of strokes. In this case, it is impossible to perform binarization as strictly and intuitively as in the present invention. Accordingly, it has been difficult for anyone to understand universally and intuitively, and it has been difficult to learn what combination of stroke order and stroke number is appropriate for 300 years.

さらに、たとえば、「干」と「于」は異なる字形であるにもかかわらず、両方とも筆順コードで112(横横縦)と同一になってしまい識別が不能となる。理由は2(縦)にいわゆる第3画につづく実質的な第4画目に相当する「はね」を類似構成要素として同一視して同じ分類に含めてしまうからである。一方、本発明ならば「干」は001(横横縦)と「于」0011(横横縦縦)のごとく異なる筆順コード化が可能である上に、3画と4画というように画数からも厳密な識別が可能となる。このように2値化が厳密な規定により実現している。
もちろん、本発明の「簡易式の筆順コード」は、漢字の伝統的な「筆順と画数」の考え方に対しても適用できる。
漢字の伝統的な筆順と画数の考え方は「一筆書き区間内の連続した線の途中で方向が変化しても全て1画として扱う」というものであった。
そこで、一筆書き区間内の起点からの縦横方向情報のみをコード化し、それ以降に続く一筆書き区間内の終点までに変化した縦横方向情報は捨象してコード化しないという方法で2値化すれば、漢字の伝統的な筆順と画数の考え方に対しても本発明の「簡易式の筆順コード」が適用できる。
たとえば漢字の「口」の伝統的な画数は3画であり4画ではなかった。その理由は、筆順の第2番目の内、起点から右横方向に書き進む線が一筆書きで連続した線のまま筆を紙から離すことなくそのまま途中で下の縦方向に線を折れ曲げて書き進むため、この一筆書きの区間は2画ではなく1画として扱うためであった。
この特徴に着目し、漢字「口」の伝統的な筆順の第2番目の内、一筆書きで連続した線の起点から右横方向に書き進む線を横方向として数字の0にコード化し、それ以降に続く一筆書き区間の途中で下の縦方向に折れ曲げて書き進む線を縦方向として数字の1にコード化せずに捨象し、この一筆書きの区間を起点からの横方向の数字0で代表させてコード化すればこの一筆書き区間を1画として扱うことができる。
その結果、漢字の「口」を「簡易式の筆順コード」で100(縦横横)と伝統的な筆順と画数の考え方に対しても適用し2値化できる。
このコードは、一筆書きの第1画目の起点から書き進む線が1(縦方向)であり、第1画目の一筆書き区間内でそれ以降に続く終点までの方向の変化は捨象しているということを示す。漢字「口」の場合は、たまたま第1画目の起点から終点までは方向の変化はない。そして、第1画目の終点とは連続しない新たな第2画目の一筆書きの区間は起点から横方向を0とコード化したのみであることを示し、続く一筆書き区間内における縦方向(1)へ変化した終点までのコード化は捨象して採用していないことを示す。同様に、第3画目は漢字「口」の一筆書きの最終の筆順であると同時に第2画目までの一筆書き区間の線の終点とは連続しない新たな起点からの横方向(0)の線のみをコード化したものであることを示す。
同様に、たとえば漢字の「于」もこの方法で001(横横縦)と2値化でき、これらは伝統的な筆順と画数に対応している。
この場合、漢字「口」の2値化コード「100」や漢字「于」の2値化コード「001」の筆順コードの桁数の3桁が、伝統的な漢字画数の3画に対応する。
この方法の利点は伝統的な漢字字典や文字コードブックで踏襲されてきた漢字の筆順や画数をそのまま2値化でき、教育や実用の面で親和性が大きいということである。
しかし、筆記体のアルファベット文字やアラビア文字のごとく、文字全体が一筆書きの表記方法を中心に構成される文字の場合、こうした一筆書き区間の起点情報のみを利用する2値化では充分なコード識別効果が期待できない文字の存在も少なからず想定されるため、本発明では「簡易式の筆順コード」を説明するにあたって、伝統的な漢字の「筆順と画数」の考え方に対する適用の説明は省略し、文字の起筆と呼ばれる書き始めの起点から文字を完全に書き終わる最終的な終点までの「全区間」の「筆順」を縦横方向の情報にコード化する方法を主に説明することとする。
一般に世界的に利用されている文字の多くは「画数」という概念が存在しない場合が多い一方、文字が線で構成されるという普遍的な共通性を持つ以上、必ず世界中の文字は時系列的な「筆順」情報に基づけばコード化が可能であるため、「筆順」を利用したコード化による文字検索方法は漢字やハングルや仮名などの東アジア文化圏の文字にも例外なく適用が可能だからである。
Further, for example, although “dry” and “us” are different character shapes, both of them are the same in stroke order code 112 (horizontal and horizontal) and cannot be identified. The reason is that “splash” corresponding to a substantial fourth stroke following the so-called third stroke in 2 (vertical) is identified as a similar component and included in the same category. On the other hand, according to the present invention, “dry” can be encoded in different stroke order codes such as “001” (horizontal, horizontal, vertical) and “us” 0011 (horizontal, horizontal, vertical, and vertical). Can be strictly identified. In this way, binarization is realized by strict regulations.
Of course, the “simple stroke order code” of the present invention can also be applied to the traditional “stroke order and stroke count” concept of kanji.
The traditional Kanji stroke order and stroke count concept was “All strokes are treated as one stroke even if the direction changes in the middle of a continuous line within a stroke.”
Therefore, if only the vertical / horizontal direction information from the starting point in a single stroke writing section is coded, and the vertical / horizontal direction information changed up to the end point in the subsequent single stroke writing section is binarized, it is not coded. The “simple stroke order code” of the present invention can also be applied to the traditional stroke order and stroke count of Chinese characters.
For example, the traditional number of strokes for the Chinese character “Mouth” was three, not four. The reason for this is that, in the second stroke order, the line that goes from the starting point to the right lateral direction is a continuous line with a single stroke, and the line is bent in the vertical direction on the way without leaving the brush. In order to write, this one-stroke section was to be handled as one stroke instead of two strokes.
Focusing on this feature, the second line of the traditional stroke order of the Chinese character “Mouth” is coded to the number 0 as a horizontal line that goes from the starting point of the continuous line in a single stroke to the right, The line that is bent and written in the vertical direction in the middle of the subsequent one-stroke section is discarded as a vertical direction without encoding it into the number 1, and this one-stroke section is the number 0 in the horizontal direction from the starting point. This one-stroke section can be handled as one stroke if it is coded as a representative.
As a result, the kanji “mouth” can be binarized by applying it to the traditional stroke order and stroke number concept of 100 (vertical and horizontal) with a “simple stroke order code”.
In this code, the line drawn from the starting point of the first stroke of the first stroke is 1 (vertical direction), and the change in direction to the end point that follows in the first stroke of the first stroke is discarded. It shows that there is. In the case of the Chinese character “mouth”, there is no change in direction from the start point to the end point of the first stroke. Then, it is shown that the section of the new stroke of the second stroke that is not continuous with the end point of the first stroke is only coded as 0 in the horizontal direction from the starting point, and the vertical direction ( It shows that the coding up to the end point changed to 1) is not adopted. Similarly, the third stroke is the final stroke order of the first stroke of the Chinese character “mouth”, and at the same time, the horizontal direction from a new start point that is not continuous with the end point of the stroke of the first stroke section until the second stroke (0) Indicates that only the line is coded.
Similarly, for example, the Chinese character “U” can also be binarized to 001 (horizontal, horizontal, vertical) by this method, and these correspond to the traditional stroke order and the number of strokes.
In this case, the three digits of the stroke order code of the binary code “100” of the Chinese character “mouth” and the binary code “001” of the Chinese character “U” correspond to three strokes of the traditional Chinese character stroke number. .
The advantage of this method is that it can binarize the stroke order and number of strokes of Kanji characters that have been followed in traditional Kanji dictionaries and character codebooks, and has a great affinity for education and practical use.
However, in the case of characters that consist mainly of one-stroke writing notation, such as cursive alphabetic characters and Arabic characters, binarization that uses only the starting point information of such a one-stroke section is sufficient for code identification Since there are not a few characters that cannot be expected to have an effect, in the present invention, in describing the “simple stroke order code”, the description of the application of the traditional kanji “stroke order and stroke count” is omitted, The method of coding the “stroke order” of “all sections” from the starting point of writing, which is called character writing, to the final ending point where the character has been completely written, will be mainly described.
In general, most of the characters that are used worldwide do not have the concept of “number of strokes”. On the other hand, since there is a universal commonality that characters are composed of lines, characters around the world are always time-series. Because it is possible to code based on typical "stroke order" information, the character search method by coding using "stroke order" can be applied to East Asian cultural characters such as Kanji, Hangul and Kana without exception. That's why.

本発明はたとえば漢字の知識を持つ日本人が、発音のわからない中国語の漢字を検索する際に、使い慣れた日本語フロントエンドプロセッサー漢字変換ソフトを利用して文字分割コードを入力するだけで中国語に漢字変換する場合の精度を向上するのに役立つ。日本の常用漢字程度の筆順知識があれば中国の常用漢字の筆順もある程度類推できるので、文字分割コードに加え、筆順コードを追加入力することで効率よく中国語の検索や変換が可能となる。
また、パソコンや携帯電話の記憶装置内に日本語フロントエンドプロセッサー漢字変換ソフトのユーザー辞書登録の方法で文字分割コードと筆順コードを登録する方法のほかに、たとえばインターネット上に公開された上記コードと中国語の対応一覧が掲載されたホームページを閲覧ソフトの検索機能や当該ホームページのCGIによる文字検索機能により、目的とする中国語を検索することも可能なので、ホームページに表示されたアイコンやソフトキーをクリックするだけでも高精度の検索が可能となる。
The present invention, for example, allows a Japanese who has knowledge of kanji to search for Chinese kanji whose pronunciation is not known, and simply input a character division code using a familiar Japanese front-end processor kanji conversion software. Useful for improving accuracy when converting to Kanji. If you have the stroke order knowledge of Japanese common kanji, you can analogize the stroke order of Chinese common kanji to some extent, so you can efficiently search and convert Chinese by entering the stroke order code in addition to the character division code.
In addition to the method of registering the character division code and stroke order code by the user dictionary registration method of the Japanese front-end processor Kanji conversion software in the storage device of a personal computer or mobile phone, for example, the above code published on the Internet and It is possible to search the target Chinese using the search function of the browsing software and the CGI text search function of the home page, which lists the corresponding list of Chinese, so you can use the icons and soft keys displayed on the home page. High-precision search is possible just by clicking.

本発明の機能構成ブロック図である。It is a functional block diagram of the present invention. 本発明の検索処理フローチャートである。It is a search processing flowchart of the present invention. 従来の文字分割方法と本発明の文字筆順検索方法を比較した説明図である。It is explanatory drawing which compared the conventional character division method and the character stroke order search method of this invention. 本発明の文字データベース表である。It is a character database table | surface of this invention. 本発明の数字5キーを起点および結節点とする線の入力方法である。This is a method for inputting a line with the number 5 key of the present invention as a starting point and a nodal point. 本発明の縦方向の線から構成される文字の入力コード化方法である。It is the input encoding method of the character comprised from the vertical line of this invention. 本発明の横方向の線から構成される文字の入力コード化方法である。It is the input coding method of the character comprised from the line of the horizontal direction of this invention. 本発明の連続した線から構成される文字の入力コード化方法である。It is the input encoding method of the character comprised from the continuous line of this invention. 本発明の連続しない線を含む文字の入力コード化方法である。It is the input encoding method of the character containing the line which is not continuous of this invention. 本発明の左回りの円から構成される文字の入力コード化方法である。It is the input encoding method of the character comprised from the counterclockwise circle of this invention. 本発明の円から構成される文字と線から構成される文字の識別方法である。It is the identification method of the character comprised from the character and line comprised from the circle of this invention. 本発明の漢字「口」を再現した字形である。It is the character form which reproduced the Chinese character "mouth" of the present invention. 本発明の円と線の組合せから構成される文字の入力コード化方法である。It is the input coding method of the character comprised from the combination of the circle | round | yen and line | wire of this invention. 本発明の閉じない円弧から構成される文字の入力コード化方法である。It is the input coding method of the character comprised from the circular arc which does not close of this invention. 本発明の直線と半円の組合せから構成される文字の入力コード化方法である。It is the input coding method of the character comprised from the combination of the straight line and semicircle of this invention. 本発明のアルファベット「D」を再現した字形である。It is a character shape reproducing the alphabet “D” of the present invention. 本発明の複数の半円と線から構成される文字の入力コード化方法である。It is the input encoding method of the character comprised from the several semicircle and line of this invention. 本発明のアルファベット「S」を再現した字形である。It is a character shape reproducing the alphabet “S” of the present invention. 本発明の3つのキーでいろいろな円弧をあらわす入力コード化方法である。This is an input coding method that represents various arcs with the three keys of the present invention. 本発明の閉じた円と閉じない円弧の入力コード化方法である。FIG. 3 is an input coding method for a closed circle and a non-closed arc according to the present invention. FIG. 本発明の閉じた円から線へと移行する筆順を再現した字形である。It is the character form which reproduced the stroke order which shifts from a closed circle to a line of the present invention. 本発明の閉じない円弧から線へと移行する筆順を再現した字形である。It is the character form which reproduced the stroke order which shifts from a non-closed arc of the present invention to a line. 本発明のデータベースの内、「文字」と対応する「4分割2進(2値)コード」と「筆順2進(2値)コード」からなる事例であり、「1」から「s」までを示している。#は2進識別子である。In the database of the present invention, it is an example consisting of “quadrant binary (binary) code” and “stroke order binary (binary) code” corresponding to “character”, from “1” to “s”. Show. # Is a binary identifier. 本発明のデータベースの内、「文字」と対応する「4分割2進(2値)コード」と「筆順2進(2値)コード」からなる事例であり、「t」から「げ」までを示している。#は2進識別子である。In the database of the present invention, it is an example of “quadrant binary (binary) code” and “stroke order binary (binary) code” corresponding to “character”, from “t” to “ge”. Show. # Is a binary identifier. 本発明のデータベースの内、「文字」と対応する「4分割2進(2値)コード」と「筆順2進(2値)コード」からなる事例であり、「ご」ごから「ヤ」までを示している。#は2進識別子である。In the database of the present invention, it is an example of “quadrant binary (binary) code” and “stroke order binary (binary) code” corresponding to “character”, from “go” to “ya” Is shown. # Is a binary identifier. 本発明のデータベースの内、「文字」と対応する「4分割2進(2値)コード」と「筆順2進(2値)コード」からなる事例であり、「ユ」から「ポ」までを示している。#は2進識別子である。In the database of the present invention, it is an example of “quadrant binary (binary) code” and “stroke order binary (binary) code” corresponding to “character”, from “yu” to “po”. Show. # Is a binary identifier.

本発明の実施形態は、検索文字の構成要素の間隙を、縦方向と横方向に分割して、この分割の可否をコードに置き換えることで文字をコード化する方法に加え、文字の筆順をパソコンなどのテンキーの「5」を起点あるいは結節点として順番に筆順をコードに置き換えることで文字をコード化する方法を対応する文字と一緒に分類記憶手段に記憶せしめ、前記2種類のコードを入力の際に併用することにより前記記憶手段から文字を検索表示する精度を単独のコードを利用した検索方法よりも向上させることを可能とする。   In the embodiment of the present invention, in addition to the method of coding characters by dividing the gap between the constituent elements of the search character in the vertical direction and the horizontal direction and replacing the possibility of the division with a code, the stroke order of the characters is added to the personal computer. The character encoding method is stored in the classification storage means together with the corresponding characters by replacing the stroke order with the codes in order starting from “5” of the numeric keypad as a starting point or a nodal point, and the two kinds of codes are input. When used together, the accuracy of searching and displaying characters from the storage means can be improved as compared with a search method using a single code.

以下、本発明の実施形態を図に基づいて説明する。
本発明の図1は、パソコンや携帯電話に搭載された記憶手段30に予めフロントエンドプロセッサーと呼ばれる日本語の漢字変換ソフトなどが記憶されている一般的な実施形態を説明する機能構成ブロック図である。
入力手段10にはパソコンや携帯電話のテンキーと呼ばれる数字キーや、漢字変換ソフトの操作に必要なスペースキーやエンターキーなどを利用する。記憶手段30には、日本語変換ソフトのユーザー辞書やシステム辞書の形態で、文字分割コードに対応する文字と同じレコードに本発明の筆順コードが表テーブルの形態でデータベース化されて記憶されており、入力手段10から入力されたコード情報と、記憶装置30に記憶されたコードを演算装置20において照合処理を行う。
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
FIG. 1 of the present invention is a functional configuration block diagram illustrating a general embodiment in which Japanese kanji conversion software called a front-end processor is stored in advance in a storage means 30 mounted on a personal computer or a mobile phone. is there.
As the input means 10, a numeric key called a numeric keypad of a personal computer or a mobile phone, a space key or an enter key necessary for operating the kanji conversion software is used. In the storage means 30, the stroke order codes of the present invention are stored in the form of a table in the form of a table in the same record as the character corresponding to the character division code in the form of a user dictionary or system dictionary of Japanese conversion software. The code information input from the input means 10 and the code stored in the storage device 30 are collated in the arithmetic device 20.

入力された分割コードと筆順コードが記憶されたデータベースのコードと一致した場合には、対応する文字が表示手段40の液晶画面などに表示される。これにより、日本語の仮名読み発音の代わりに文字コードを利用することで、利用者は検索したい中国語などの文字をあたかも電話番号を入力するような感覚で変換表示することができる。   When the input divided code and the stroke order code match the stored database code, the corresponding character is displayed on the liquid crystal screen of the display means 40 or the like. Thus, by using a character code instead of Japanese kana reading, the user can convert and display characters such as Chinese that he / she wants to search as if he / she entered a phone number.

図2は本発明の検索処理フローチャートである。前記演算手段20における処理をあらわしている。S200で入力された分割コードと筆順コードは、S300でデータベースの分割コードと筆順コードと照合処理された結果、一致した文字をS400において表示する。引き続き文字検索変換する場合には、S200の入力操作から以下のステップを繰返す。   FIG. 2 is a flowchart of search processing according to the present invention. The processing in the computing means 20 is shown. The divided code and the stroke order code input in S200 are collated with the database divided code and the stroke order code in S300, and the matched characters are displayed in S400. If the character search conversion is to be continued, the following steps are repeated from the input operation in S200.

図3は、従来の文字分割方法と本発明の文字筆順検索方法を比較した説明図である。
たとえば、漢字の「仁」という文字も「倍」という文字も上下左右の順番に線と線の間の間隙があるか無いかの判断を利用者がすると、どちらも上下右の3方向に間隙があり、これらの漢字が3つに分割できることが分かる。その場合「1204」などと順番にコードに置き換える。「0」は間隙がないことをあらわす。また、順番通り「1101」と4ビットのコードに置き換えてもよい。この際、「0」は間隙がなく、「1」などは間隙があり文字を分割できることをあらわすが、「仁」も「倍」も同じ「1101」という分割コードに分類されるため、利用者が「1101」という同一のコードを入力するだけではどちらかの漢字に特定できない。
FIG. 3 is an explanatory diagram comparing the conventional character division method and the character stroke order search method of the present invention.
For example, when the user determines whether or not there is a gap between lines in the order of up, down, left, and right, the characters “jin” and “double” in the kanji are both spaced in three directions, up and down, right and left. It can be seen that these kanji characters can be divided into three. In that case, the codes are sequentially replaced with “1204” or the like. “0” indicates that there is no gap. In addition, it may be replaced with “1101” and a 4-bit code in order. At this time, “0” indicates that there is no gap and “1” indicates that there is a gap and characters can be divided. However, since “Jin” and “Double” are classified into the same division code “1101”, the user Can not be identified as either Kanji simply by inputting the same code “1101”.

これに対し、図5以下で説明する文字筆順コードならば、「仁」は「1100」に置き換えることができ、「倍」は「11100101010」に置き換えることができるので、分割コードでは確定できなかった検索変換文字をどちらか1つに特定できる。 On the other hand, in the character stroke order code described in FIG. 5 and the subsequent figures, “Jin” can be replaced with “1100” and “Double” can be replaced with “11100101010”. The search conversion character can be specified as either one.

この筆順コードは、図3右下のたとえばパソコンのテンキーを入力装置として利用した場合、次のように数字で置き換える。数字キー5を起点とした2つのキーで筆順通り線をどの方向に描いていって文字を完成するかを利用者が判断する。たとえば、「仁」の「人偏(にんべん)」は「51」が筆順の起筆となる。5を起点として左斜め下方向の線を意味する。 This stroke order code is replaced with a number as follows when, for example, the numeric keypad of the personal computer at the lower right of FIG. 3 is used as an input device. The user determines in which direction the line is drawn in the stroke order with the two keys starting from the number key 5 to complete the character. For example, “51” in “Nenben” is “51”, and the stroke order is written. This means a diagonally downward line starting at 5.

次に「人偏」の下縦方向に垂直に描く線は「52」と入力する。人偏を構成する「51」の左斜め下方向への線から「52」の真下方向へ伸びる線へ移行する際は、一筆書きと呼ばれる連続した線ではなく線が連続しないため、これを数字キーの「0」でコード化している。その結果、人偏は「51052」とコード化できる。「仁」の左側の人偏の次に右側の「二」に移行する際にも線は連続しないため、次の筆順では「510520」とコード化できる。「二」の上の線は「56」と右方向真横に筆順が移行する。次に「二」の下の線に移行する際も線は連続しないため、最終的には「51052056056」とコード化することができる。 Next, “52” is input as the line drawn vertically in the vertical direction of “People”. When shifting from the diagonally left-down line of “51”, which constitutes a human bias, to a line that extends right below “52”, this is not a continuous line called a stroke, but this is a number. It is coded with the key “0”. As a result, the bias can be encoded as “51052”. Since the line does not continue when shifting to the left side of “Jin” and then to “N” on the right side, it can be encoded as “510520” in the next stroke order. The stroke on the line above “2” is “56” and the stroke order shifts to the right. Next, since the line is not continuous when moving to the line below “2”, it can be finally encoded as “51052056056”.

これが文字筆順のうち線から構成される文字の筆順コード化の方法である。こうした詳細なコード情報を必要としない場面では、簡易的な筆順コードを利用することもできる。 This is a method for coding the stroke order of characters composed of lines in the stroke order. In situations where detailed code information is not required, a simple stroke order code can be used.

5を起点として「52」「51」「54」「57」「58」の5種類の方向の線を「たて方向の線」と定義し、たとえば数字キーの「1」で代用する。5を起点として「59」「56」「53」の3種類の方向の線を「横方向の線」と定義し、たとえば数字キーの「0」で代用する。線の連続性の可否は情報から捨象し、文字の筆順が「縦方向か横方向か」だけであらわすと「仁」は「1100」という単純な筆順コードに置き換えることができる。 The five types of direction lines “52”, “51”, “54”, “57”, and “58” with 5 as the starting point are defined as “vertical direction lines”, and for example, the numeric key “1” is substituted. A line of three types “59”, “56” and “53” starting from 5 is defined as a “horizontal line”, for example, “0” which is a numeric key is substituted. Whether the continuity of the line is possible or not is discarded from the information. If the stroke order of the character is only “whether vertical or horizontal”, “Jin” can be replaced with a simple stroke order code “1100”.

図3の「口」と「A」も分割コードでは「0000」と区別できない文字が、筆順コードでは「1010」と「100」に置き換えられるので区別できることを示している。
このように、文字分割コードと筆順コードを併用することにより、文字検索精度を向上させることができる。
“Mouth” and “A” in FIG. 3 also indicate that a character that cannot be distinguished from “0000” in the divided code is replaced with “1010” and “100” in the stroke order code, and thus can be distinguished.
Thus, the character search accuracy can be improved by using the character division code and the stroke order code together.

図4は、本発明の文字データベース表である。図1の記憶手段30に、図4のようなデータベースを記憶する。たとえば、「B」「C」「D」や「ム」「メ」「モ」「ヤ」といった文字を4分割コードであらわすと各々「0000」と間隙がない文字に全て分類されてしまうので、4分割コードと文字を対応させたデータベースでは、4分割コードからこれらのうちから目的とする1文字を検索特定することはできない。
これに対し、本発明の筆順コードを対応する文字と一緒にデータベース化すれば、図4で示された文字例の中から1文字を検索特定することができる。
FIG. 4 is a character database table of the present invention. A database as shown in FIG. 4 is stored in the storage means 30 of FIG. For example, if characters such as “B”, “C”, “D”, “M”, “M”, “M”, and “Y” are represented by a four-division code, they are all classified into “0000” and characters having no gap. In a database in which characters are associated with four-division codes, it is not possible to search for and specify a target character from among these four-division codes.
On the other hand, if the stroke order code of the present invention is made into a database together with the corresponding characters, one character can be searched and specified from the character examples shown in FIG.

図23、図24、図25、図26は、図1の記憶手段30に文字と4分割2進4桁コードに加え、筆順2進コードを併用した場合の精度向上を示している。図23、図24、図25、図26はパソコンで常用されるMSゴシック体フォントで2値化による筆順コード例を示す。たとえばゴシック体フォントの数字「1」から「0」までの10個の数字(図23参照)は、文字分割コードでは全て0000と4桁の同じコードになってしまうため、コードから数字を特定できない。しかし、2値化筆順コードを併用すれば、MSゴシック体フォントの「1」と「7」を除く全ての数字が一意に識別可能となり1つの筆順コードから1つの数字を特定でき検索精度が向上することがわかる。 23, FIG. 24, FIG. 25, and FIG. 26 show an improvement in accuracy when a stroke order binary code is used in addition to a character and a 4-split binary 4-digit code in the storage means 30 of FIG. FIG. 23, FIG. 24, FIG. 25, and FIG. 26 show examples of stroke order codes by binarization using MS Gothic fonts commonly used in personal computers. For example, 10 numbers (see FIG. 23) of Gothic font numbers “1” to “0” are all the same code of 0000 and 4 digits in the character division code, so the number cannot be specified from the code. . However, if binary stroke order codes are used in combination, all numbers except “1” and “7” in MS Gothic font can be uniquely identified, and one number can be identified from one stroke order code, improving search accuracy. I understand that

図4のごとく、2値化の簡易式筆順コードをさらに詳細化した詳細式筆順コードならば、2値化を上回る文字検索精度向上が実現する。たとえば2値化筆順コードでは識別できなかったMSゴシック体フォントの「1」と「7」を詳細筆順コードでコード化すると、MSゴシック体フォントの「1」は5952に置換でき、MSゴシック体フォントの「7」は5651と異なるコードに置換できるので、MSゴシック体フォントの「1」と「7」を識別特定できることになる。ゆえに、数字の検索や変換精度が2値化筆順コードよりもさらに向上する。以下に詳細式筆順コードのコード化の方法を説明する。 As shown in FIG. 4, if the detailed stroke order code is a more detailed version of the binarized simple stroke order code, the character search accuracy is improved over binarization. For example, if MS gothic fonts “1” and “7”, which could not be identified by the binary stroke order code, are coded by the detailed stroke order code, “1” of the MS gothic font can be replaced with 5952. Since “7” can be replaced with a code different from 5651, “1” and “7” of the MS Gothic font can be identified and specified. Therefore, the number search and conversion accuracy are further improved as compared with the binarized stroke order code. The method for coding the detailed stroke order code will be described below.

図5は本発明の数字5キーを起点および結節点とする線の入力方法である。数字の「5」というキーは起筆時の起点であるだけでなく、一筆書きと呼ばれる連続した線などの結節点ともなる。つまり、5から0以外の8方向のキーに線を描き、そのまま連続して次の筆順に移行するときには、5は再帰的な起点であるからこれを結節点(ノード)と考えることもできる。図5は線を5を起点あるいは結節点とする2つの数字キーであらわすことを示す。 FIG. 5 shows a method of inputting a line having the number 5 key of the present invention as a starting point and a nodal point. The number “5” key is not only the starting point at the time of writing, but also the nodal point of a continuous line called one-stroke writing. That is, when a line is drawn on keys in 8 directions other than 5 to 0 and the process proceeds to the next stroke order as it is, 5 can be considered as a node (node) since it is a recursive starting point. FIG. 5 shows that the line is represented by two numeric keys with 5 as the starting point or nodal point.

図6は、本発明の縦方向の線から構成される文字の入力コード化方法である。図3で説明したごとく、5を起点に角度的には180度以上360度以下の方向の線が「縦方向の線」に分類できる。たて方向の線は、「52」「51」「54」「57」「58」の6種類の方向の線を「たて方向の線」と定義する。「たての線」を「1」という数字で代用し、図7の「横の線」3種類を「0」(ゼロ)という数字で代用することにより、「たて方向の線か横方向の線か」の判定を「1」と「0」で2値的に識別してもよい。
この場合、「52」「51」「54」「57」「58」は各々「1」「1」「1」「1」「1」とあらわす。
FIG. 6 shows an input encoding method for characters composed of vertical lines according to the present invention. As described with reference to FIG. 3, lines in the direction of 180 degrees or more and 360 degrees or less can be classified as “vertical lines” with respect to 5 as a starting point. The vertical direction lines are defined as “vertical direction lines” in six types of directions of “52”, “51”, “54”, “57”, and “58”. By substituting the number “1” for the “vertical line” and substituting the number “0” (zero) for the three “horizontal lines” in FIG. "1" and "0" may be identified in a binary manner.
In this case, “52”, “51”, “54”, “57”, and “58” are represented as “1”, “1”, “1”, “1”, and “1”, respectively.

図7は、本発明の横方向の線から構成される文字の入力コード化方法である。横方向の線は、「59」「56」「53」の3種類の方向の線を「横方向の線」と定義する。
図6で説明した「たての線」を「1」という数字で代用し、「横の線」3種類を「0」(ゼロ)という数字で代用することにより、「たて方向の線か横方向の線か」の判定を「1」と「0」で2値的に識別してもよい。この場合、「59」「56」「53」は全て「0」「0」「0」とあらわす。
FIG. 7 shows an input encoding method for characters composed of horizontal lines according to the present invention. Regarding the horizontal line, three types of lines “59”, “56”, and “53” are defined as “horizontal lines”.
By substituting the number “1” for the “vertical line” described in FIG. 6 and substituting the number “0” (zero) for the three types of “horizontal lines”, The determination of “a horizontal line” may be binaryly identified by “1” and “0”. In this case, “59”, “56”, and “53” are all represented as “0”, “0”, and “0”.

図8は、本発明の連続した線から構成される文字の入力コード化方法である。たとえば線が連続した文字仮名「へ」は「5953」または「00」とあらわす。この場合数字キーの5は起点であり、結節点でもある。本発明は数字キーの「5」を起点とする方法により、巨大なキーやボタンの配列からなる入力装置を必要とせず、一般的なテンキーなどの入力装置で筆順コードを入力することができる。   FIG. 8 shows an input encoding method for characters composed of continuous lines according to the present invention. For example, the character kana “to” with continuous lines is represented as “5953” or “00”. In this case, the numeric key 5 is a starting point and a nodal point. According to the present invention, a stroke order code can be input by an input device such as a general numeric keypad without using an input device composed of a huge key or button arrangement by a method starting from the numeric key “5”.

図9は、本発明の連続しない線を含む文字の入力コード化方法である。たとえば線が連続しない漢字「十」は「56052」または「01」とコード化できる。正しい筆順では「十」の横方向の「一」の次に縦方向の「│」の線に移行する際、連続性を失う。こうした場合には詳細筆順コードでは「56052」と表す。簡易筆順コードでは連続性情報は捨象し単に「横方向の線の次に縦方向の線を描くのが筆順である」ことを「01」と表す。このコード化の場合は「0」には不連続性の意味はなく、単に横方向の線ということを示す。 FIG. 9 shows an input encoding method for characters including discontinuous lines according to the present invention. For example, the Chinese character “10” with no continuous lines can be coded as “56052” or “01”. In the correct stroke order, continuity is lost when moving to the line of “|” in the vertical direction after “1” in the horizontal direction of “10”. In such a case, the detailed stroke order code is represented as “56052”. In the simple stroke order code, the continuity information is discarded, and “01” indicates that “the stroke order is to draw the vertical line next to the horizontal line”. In the case of this encoding, “0” has no meaning of discontinuity and simply indicates a horizontal line.

図10は、本発明の左回りの円から構成される文字の入力コード化方法である。たとえば数字の「0」やアルファベット「O」などの左回りの円は「54125」と表す。線と曲線の違いは、線は5を起点とする2つのキーでコード化するのに対し、円や円弧などの曲線は5を起点とする3つか4つのキーでコード化することで識別する。
閉じた円は、図10の「54125」のように「5」という起点が終点にもなっているという特徴がある。
FIG. 10 shows an input encoding method for characters composed of counterclockwise circles according to the present invention. For example, a counterclockwise circle such as the numeral “0” or the alphabet “O” is represented as “54125”. The difference between a line and a curve is identified by coding a line such as a circle or an arc with three or four keys starting from 5, while a line is coded using two keys starting from 5. .
The closed circle is characterized in that the starting point “5” is also the end point as “54125” in FIG.

図11は、本発明の円から構成される文字と線から構成される文字の識別方法である。
漢字「口」は「5205652056」、アルファベット「O」は「54125」とコードが違うため、利用している数字キーは共通していても文字の違いを識別することができる。
FIG. 11 shows a method of identifying a character composed of a character composed of a circle and a line according to the present invention.
Since the Chinese character “mouth” has a different code from “5205652056” and the alphabet “O” has “54125”, it is possible to identify the difference in characters even if the number keys used are common.

図12は、本発明の漢字「口」を再現した字形である。●は数字キー「0」を指定した箇所を示す。連続した円の場合は、数字キー「0」を指定しない。 FIG. 12 is a character shape reproducing the Chinese character “mouth” of the present invention. ● indicates the location where the numeric key “0” is designated. For continuous circles, the numeric key “0” is not specified.

図13は、本発明の円と線の組合せから構成される文字の入力コード化方法である。
右回りの円と直線の組合せの例としてアルファベット「Q]は「54785053」と表す。円を描き終わった次の筆順である「53」方向の線に移行する前に、連続性が失われるため、数字キーの「0」が挿入されている。
FIG. 13 shows an input coding method for characters composed of a combination of a circle and a line according to the present invention.
As an example of a combination of a clockwise circle and a straight line, the alphabet “Q” is expressed as “5477853”. Before transitioning to the line of the “53” direction, which is the next stroke order after drawing a circle, the number key “0” is inserted because the continuity is lost.

図14は、本発明の閉じない円弧から構成される文字の入力コード化方法である。
閉じない円弧の例としてアルファベット「C」は「5412」で表す。これを図10の閉じた円「54125」と較べると、筆順の最後に「5」が指定されているかの違いがあることを示す。共通した4つの数字キーを利用しても、このような違いをあらわすことができる。
FIG. 14 shows an input encoding method for characters composed of non-closed arcs according to the present invention.
As an example of an arc that does not close, the alphabet “C” is represented by “5412”. When this is compared with the closed circle “54125” in FIG. 10, it is shown that there is a difference in whether “5” is specified at the end of the stroke order. Even if four common numeric keys are used, such a difference can be expressed.

図15は、本発明の直線と半円の組合せから構成される文字の入力コード化方法である。
アルファベット「D」は「5205632」と表すが、途中数字キー「0」が挿入された箇所で線の連続性が失われていることも示す。
FIG. 15 shows an input coding method for characters composed of a combination of a straight line and a semicircle according to the present invention.
The alphabet “D” is expressed as “5205632”, which also indicates that the continuity of the line is lost at the position where the numeric key “0” is inserted.

図16は、図15で示したアルファベット「D」を再現した字形である。 FIG. 16 is a character shape reproducing the alphabet “D” shown in FIG. 15.

図17は、本発明の複数の半円と線から構成される文字の入力コード化方法である。
2つの半円と線から構成されるアルファベット「S」は「5874535214」と表せる。「5874」と左まわりの半円を描いた次の「53」という線に移行する際に線の連続性が失われていないため、数字キーの「0」は挿入されていない。
FIG. 17 shows an input encoding method for characters composed of a plurality of semicircles and lines according to the present invention.
The alphabet “S” composed of two semicircles and a line can be expressed as “58745535214”. The number key “0” is not inserted because the continuity of the line has not been lost when moving to the next line “53” depicting a left-handed semicircle with “5874”.

図18は、本発明のアルファベット「S」を再現した字形である。 FIG. 18 is a character shape reproducing the alphabet “S” of the present invention.

図19は、本発明の3つの数字キーでいろいろな円弧をあらわす入力コード化方法である。起点5を含む3つの数字キーでいろいろな円弧をあらわす。仮名「つ」は「563」で表している。 FIG. 19 shows an input encoding method that represents various arcs with the three numeric keys of the present invention. Various arcs are represented by three numeric keys including the starting point 5. The pseudonym “tsu” is represented by “563”.

図20は、本発明の閉じた円と閉じない円弧の入力コード化方法の違いを示す。
「5412556」は「54125」と円が閉じた後の結節点5から「56」と右方向に横の直線が描かれる。
「541256」は「5412」と閉じない円つまり円弧の終点から「56」と右方向に横の直線が描かれる。
FIG. 20 shows the difference in the input coding method of the closed circle and the non-closed arc of the present invention.
As for “541556”, a horizontal straight line is drawn in the right direction from “54125” to “56” from the node 5 after the circle is closed.
“541256” is a circle that does not close with “5412”, that is, a horizontal straight line is drawn to the right of “56” from the end point of the arc.

図21は、本発明の閉じた円から線へと移行する筆順を再現した字形である。
「5412556」の「556」の筆順は、「5」が円の終点と線の起点を兼ねた結節点であることを示す。
これに対し、図22は、本発明の閉じない円弧から線へと移行する筆順を再現した字形である。「541256」の「256」の筆順は、「5」が円の終点ではなく、単に円弧の終点「2」から横方向の線の起点になっていることを示す。
FIG. 21 is a character shape reproducing the stroke order of transition from a closed circle to a line according to the present invention.
The stroke order of “556” in “541556” indicates that “5” is a nodal point that serves as the end point of a circle and the starting point of a line.
On the other hand, FIG. 22 is a character shape that reproduces the stroke order of the present invention from a non-closed arc to a line. The stroke order of “256” in “541256” indicates that “5” is not the end point of the circle but simply the starting point of the horizontal line from the end point “2” of the arc.

10 入力手段
20 演算手段
30 記憶手段
40 表示手段
10 Input means 20 Calculation means 30 Storage means 40 Display means

Claims (1)

検索文字の構成要素の間隙を、縦方向と横方向に分割して、この分割の可否をコードに置き換えることで文字をコード化する方法に加え、文字の筆順をテンキーの「5」を起点あるいは結節点として順番に筆順をコードに置き換えることで文字をコード化する方法を対応する文字と一緒に分類記憶手段に記憶せしめ、前記2種類のコードを入力の際に併用することにより前記記憶手段から文字を検索表示する精度を単独のコードを利用した検索方法よりも向上させることを可能とし、さらに、分割の可否と筆順の縦横方向をそれぞれ2値化することで統一的に処理することを可能とした文字検索方法。 In addition to the method of coding the character by dividing the gap between the constituent elements of the search character in the vertical direction and the horizontal direction and replacing the possibility of the division with the code, the stroke order of the character is set to “5” of the numeric keypad. A method of coding characters by sequentially replacing the stroke order with codes as knots is stored in the classification storage means together with the corresponding characters, and the two types of codes are used together at the time of input from the storage means. It is possible to improve the accuracy of searching and displaying characters compared to a search method using a single code, and further, it is possible to process uniformly by binarizing the possibility of division and the vertical and horizontal directions of the stroke order. Character search method.
JP2010053133A 2009-07-03 2010-03-10 Character search method using stroke order Withdrawn JP2011028722A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010053133A JP2011028722A (en) 2009-07-03 2010-03-10 Character search method using stroke order

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009158447 2009-07-03
JP2010053133A JP2011028722A (en) 2009-07-03 2010-03-10 Character search method using stroke order

Publications (1)

Publication Number Publication Date
JP2011028722A true JP2011028722A (en) 2011-02-10

Family

ID=43637341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010053133A Withdrawn JP2011028722A (en) 2009-07-03 2010-03-10 Character search method using stroke order

Country Status (1)

Country Link
JP (1) JP2011028722A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105068671A (en) * 2015-06-29 2015-11-18 曾子力 Chinese character input method
CN109857912A (en) * 2018-12-20 2019-06-07 广州企图腾科技有限公司 A kind of font recognition methods, electronic equipment and storage medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105068671A (en) * 2015-06-29 2015-11-18 曾子力 Chinese character input method
CN105068671B (en) * 2015-06-29 2018-01-05 曾子力 A kind of input method of Chinese character
CN109857912A (en) * 2018-12-20 2019-06-07 广州企图腾科技有限公司 A kind of font recognition methods, electronic equipment and storage medium

Similar Documents

Publication Publication Date Title
CN100550036C (en) Chinese character handwritten form recognition system
JP4558482B2 (en) National language character information optimization digital operation coding and input method and information processing system
KR100593993B1 (en) Apparatus and method for recognizing the character
US8077974B2 (en) Compact stylus-based input technique for indic scripts
KR102473543B1 (en) Systems and methods for digital ink interaction
JP2005092856A (en) System and method for chinese input using joystick
US20080158201A1 (en) Character input device
WO2016197265A1 (en) Method for inputting rarely-used characters
Kristensson Discrete and continuous shape writing for text entry and control
JP2011028722A (en) Character search method using stroke order
CN101286097A (en) Chinese characters input method
WO2000043861A1 (en) Method and apparatus for chinese character text input
CN105260124A (en) Sliding input method for six-key Chinese character and English letter touch screen
CN102053955A (en) Method and system for inputting symbols
Majeed et al. Construction of Alphabetic Character Recognition Systems: A Review
CN102156616B (en) Touch screen key-writing input method
JP4004060B1 (en) Character search method
JP3803253B2 (en) Method and apparatus for Kanji input
JP2006040263A (en) Handwritten input for asian language
WO2001093180A1 (en) World characters numerical coding input method and thereof its information handling system
Kurosu Human-Computer Interaction. Interaction Technologies: 20th International Conference, HCI International 2018, Las Vegas, NV, USA, July 15–20, 2018, Proceedings, Part III
KR20100027195A (en) Method for korean alphabet input apparatus for consonant note-recognition and vowel touch-recognition
CN101261564A (en) Dummy keyboard for inputting Chinese characters and operation method
JP3210778B2 (en) Handwritten character recognition device
Gothe et al. SAMNet: Semantic Aware Multimodal Network for Emoji Drawing Classification

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20130604