JP2011123788A - Online character recognition device - Google Patents
Online character recognition device Download PDFInfo
- Publication number
- JP2011123788A JP2011123788A JP2009282593A JP2009282593A JP2011123788A JP 2011123788 A JP2011123788 A JP 2011123788A JP 2009282593 A JP2009282593 A JP 2009282593A JP 2009282593 A JP2009282593 A JP 2009282593A JP 2011123788 A JP2011123788 A JP 2011123788A
- Authority
- JP
- Japan
- Prior art keywords
- character
- dictionary
- input
- kanji
- writing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
【課題】同形異文字を区別するオンライン文字認識装置を提供すること。
【解決手段】漢字辞書3には漢字を表す漢字文字群が格納され、かな文字辞書4には漢字文字群以外の文字群が格納されている。手書き文字入力部5は、利用者により書かれた文字(入力文字)を入力し、筆記速度検出部21は、そのときの筆記速度Vn−0を検出する。筆記速度格納部13は、m文字前までの筆記速度Vn−m、…、Vn−2、Vn−1を格納する。算出部22は、筆記速度Vn−m、…、Vn−2、Vn−1と筆記速度Vn−0とにそれぞれ重み付けを施し、その平均値である算出値Thnを算出する。筆記速度Vn−0に対する重み付けは筆記速度Vn−m、…、Vn−2、Vn−1に対する重み付けよりも高い。辞書選択部23は、算出値Thnが閾値Thよりも低い場合、漢字辞書3を選択辞書として選択する。文字認識部24は、選択辞書を参照して認識処理を行う。
【選択図】図1An on-line character recognition apparatus for distinguishing homomorphic and different characters is provided.
A kanji character group representing a kanji character is stored in the kanji dictionary, and a character group other than the kanji character group is stored in the kana character dictionary. The handwritten character input unit 5 inputs characters (input characters) written by the user, and the writing speed detection unit 21 detects the writing speed V n-0 at that time. The writing speed storage unit 13 stores writing speeds V n−m ,..., V n−2 , V n−1 up to m characters before. The calculation unit 22 weights the writing speeds V nm ,..., V n-2 , V n-1 and the writing speed V n-0 respectively, and calculates a calculated value Thn that is an average value thereof. The weighting for the writing speed Vn -0 is higher than the weighting for the writing speeds Vn -m , ..., Vn -2 , Vn -1 . Dictionary selection unit 23, when the calculated value T hn is lower than the threshold T h, selects the Chinese character dictionary 3 as the selected dictionary. The character recognition unit 24 performs recognition processing with reference to the selected dictionary.
[Selection] Figure 1
Description
本発明は、辞書を参照して、利用者により書かれた文字と一致する文字を認識するオンライン文字認識装置に関する。 The present invention relates to an on-line character recognition device that refers to a dictionary and recognizes a character that matches a character written by a user.
通常、情報処理装置に対して情報を文字で入力するにはキーボードやポインティングデバイス(例えばマウス)等の入力装置が広く使用されていた。これに対して、近年では、手書きにより文字を入力することができるデバイス(手書き文字入力部)によって同様の情報を取り込むオンライン文字認識装置が開発されている。オンライン文字認識装置が手書きによる文字を認識するために、複数の文字が格納された辞書が用意される。 In general, input devices such as a keyboard and a pointing device (for example, a mouse) have been widely used for inputting information to an information processing device using characters. On the other hand, in recent years, an on-line character recognition apparatus has been developed that captures similar information using a device (handwritten character input unit) that can input characters by handwriting. In order for the online character recognition apparatus to recognize handwritten characters, a dictionary storing a plurality of characters is prepared.
例えば、特開平9−106442号公報に記載されたオンライン文字認識装置(従来のオンライン文字認識装置)では、文字認識率の向上を図るために、筆記速度毎に複数の辞書を用意している。 For example, in an online character recognition device (conventional online character recognition device) described in Japanese Patent Application Laid-Open No. 9-106442, a plurality of dictionaries are prepared for each writing speed in order to improve the character recognition rate.
具体的には、従来のオンライン文字認識装置は、手書き文字入力部と、制御部と、記憶部とを具備している。制御部は、筆記速度検出部と、辞書選択部と、文字認識部とを備えている。記憶部は、複数の辞書を備えている。複数の辞書には、筆記速度毎に複数の文字が格納されている。 Specifically, the conventional online character recognition apparatus includes a handwritten character input unit, a control unit, and a storage unit. The control unit includes a writing speed detection unit, a dictionary selection unit, and a character recognition unit. The storage unit includes a plurality of dictionaries. A plurality of dictionaries store a plurality of characters for each writing speed.
利用者が、手書き文字入力部に対してペン又は自身の指を動かすことにより、文字を書く。このとき、手書き文字入力部は、利用者により書かれた文字を入力文字として入力する。筆記速度検出部は、手書き文字入力部に入力文字が入力されたときの筆記速度を入力筆記速度として検出する。辞書選択部は、複数の辞書の中から、入力筆記速度に対応する辞書を選択辞書として選択する。文字認識部は、選択辞書を参照して、入力文字と一致する文字を認識する。 The user writes a character by moving the pen or his / her finger with respect to the handwritten character input unit. At this time, the handwritten character input unit inputs characters written by the user as input characters. The writing speed detection unit detects the writing speed when the input character is input to the handwritten character input unit as the input writing speed. The dictionary selection unit selects a dictionary corresponding to the input writing speed as a selection dictionary from a plurality of dictionaries. The character recognition unit refers to the selected dictionary and recognizes a character that matches the input character.
従来のオンライン文字認識装置では、筆記速度毎に複数の辞書を用意することを目的としている。 The conventional on-line character recognition device aims to prepare a plurality of dictionaries for each writing speed.
しかし、入力文字と一致する文字を認識する上で重要な問題がある。 However, there are important problems in recognizing characters that match the input characters.
それは、複数の文字の中には、漢字の「力(ちから、りょく)」、カタカナの「カ」や、漢字の「夕(ゆう)」、カタカナの「タ」のように、漢字とカタカナとで形が似ている文字(以下、同形異文字と称する)が存在するということである。 There are several characters, such as kanji “power”, katakana “ka”, kanji “Yu”, and katakana “ta”. That is, there are characters that are similar in shape to katakana (hereinafter referred to as isomorphic different characters).
この場合、従来のオンライン文字認識装置では、同形異文字の区別をしていないため、利用者が手書き文字入力部に同形異文字を書いたときに、その同形異文字を誤って認識してしまう可能性がある。 In this case, the conventional on-line character recognition device does not distinguish between isomorphic and different characters, so when the user writes the isomorphic characters in the handwritten character input unit, the homomorphic and different characters are erroneously recognized. there is a possibility.
以下に、発明を実施するための形態で使用される符号を括弧付きで用いて、課題を解決するための手段を記載する。この符号は、特許請求の範囲の記載と発明を実施するための形態の記載との対応を明らかにするために付加されたものであり、特許請求の範囲に記載されている発明の技術的範囲の解釈に用いてはならない。 In the following, means for solving the problems will be described using the reference numerals used in the embodiments for carrying out the invention in parentheses. This symbol is added to clarify the correspondence between the description of the claims and the description of the mode for carrying out the invention, and the technical scope of the invention described in the claims. Must not be used to interpret
本発明のオンライン文字認識装置は、漢字辞書(3)と、かな文字辞書(4)と、手書き文字入力部(5)と、筆記速度検出部(21)と、筆記速度格納部(13)と、算出部(22)と、辞書選択部(23)と、文字認識部(24)とを具備している。漢字辞書(3)には、複数の文字のうちの、漢字を表す漢字文字群が格納されている。かな文字辞書(4)には、複数の文字のうちの、漢字文字群以外の文字群が格納されている。手書き文字入力部(5)は、利用者により書かれた文字を入力文字として入力する。筆記速度検出部(21)は、手書き文字入力部(5)に入力文字が入力されたときの筆記速度(Vn−0)を検出する。筆記速度格納部(13)は、m文字前(mは、1以上の整数)までの筆記速度であるm個の筆記速度(Vn−m、…、Vn−2、Vn−1)を格納する。算出部(22)は、m個の筆記速度(Vn−m、…、Vn−2、Vn−1)と筆記速度(Vn−0)とにそれぞれ重み付けを施し、その平均値である算出値(Thn)を算出する。ここで、筆記速度(Vn−0)に対する重み付けは、m個の筆記速度(Vn−m、…、Vn−2、Vn−1)に対する重み付けよりも高い。辞書選択部(23)は、算出値(Thn)が閾値(Th)よりも低い場合、漢字辞書(3)を選択辞書として選択し、算出値(Thn)が閾値(Th)以上である場合、かな文字辞書(4)を選択辞書として選択する。文字認識部(24)は、選択辞書を参照して、入力文字と一致する文字を認識する認識処理を行う。 The on-line character recognition device of the present invention includes a kanji dictionary (3), a kana character dictionary (4), a handwritten character input unit (5), a writing speed detection unit (21), and a writing speed storage unit (13). , A calculation unit (22), a dictionary selection unit (23), and a character recognition unit (24). The kanji dictionary (3) stores a kanji character group representing kanji among a plurality of characters. The kana character dictionary (4) stores character groups other than the kanji character group among a plurality of characters. The handwritten character input unit (5) inputs characters written by the user as input characters. The writing speed detection unit (21) detects a writing speed (V n-0 ) when an input character is input to the handwritten character input unit (5). The writing speed storage unit (13) has m writing speeds (V nm ,..., V n-2 , V n-1 ) that are writing speeds up to m characters before (m is an integer of 1 or more). Is stored. The calculation unit (22) weights the m writing speeds (Vn −m ,..., Vn −2 , Vn −1 ) and the writing speeds (Vn −0 ), and averages them. A certain calculated value (T hn ) is calculated. Here, the weighting for the writing speed (V n-0 ) is higher than the weighting for the m writing speeds (V n−m ,..., V n−2 , V n−1 ). When the calculated value (T hn ) is lower than the threshold value (T h ), the dictionary selection unit (23) selects the Chinese character dictionary (3) as the selection dictionary, and the calculated value (T hn ) is equal to or greater than the threshold value (T h ). If so, the kana character dictionary (4) is selected as the selection dictionary. The character recognition unit (24) performs a recognition process for recognizing a character that matches the input character with reference to the selected dictionary.
複数の文字の中には、漢字とカタカナとで形が似ている同形異文字が存在する。このため、複数の文字のうちの、漢字を表す漢字文字群を漢字辞書(3)に格納し、漢字文字群以外の文字群をかな文字辞書(4)に格納している。しかし、利用者が上述の同形異文字を書いた場合、筆記速度はほぼ同じである。そこで、本発明のオンライン文字認識装置では、辞書選択部(23)が、入力文字が漢字であるか否かを判定するために、あるいは、漢字が連続して書かれているか否かを判定するために、筆記速度(Vn−0)に対する重み付けは、m個の筆記速度(Vn−m、…、Vn−2、Vn−1)に対する重み付けよりも高くなるように設定される。この場合、m個の筆記速度(Vn−m、…、Vn−2、Vn−1)と筆記速度(Vn−0)とに対する重み付けは、それぞれm文字前の文字から入力文字までこの順に高くなるように設定されることが好ましい。これにより、算出値(Thn)が閾値(Th)よりも低い場合、入力文字が漢字である可能性がある。あるいは、入力文字が漢字であり、漢字が連続して書かれている可能性がある。このように、本発明のオンライン文字認識装置では、漢字辞書(3)、かな文字辞書(4)、筆記速度、重み付けにより、同形異文字を漢字とカタカナとで区別しているため、利用者が手書き文字入力部(5)に同形異文字を書いたときに、その同形異文字を正しく認識することができる。 Among the multiple characters, there are homomorphic characters whose shapes are similar between kanji and katakana. For this reason, a kanji character group representing a kanji character among a plurality of characters is stored in the kanji character dictionary (3), and character groups other than the kanji character group are stored in the kana character dictionary (4). However, when the user writes the above-mentioned isomorphic characters, the writing speed is almost the same. Therefore, in the on-line character recognition device of the present invention, the dictionary selection unit (23) determines whether or not the input character is a Chinese character, or determines whether or not the Chinese character is written continuously. Therefore, the weight for the writing speed (V n-0 ) is set to be higher than the weight for the m writing speeds (V n−m ,..., V n−2 , V n−1 ). In this case, m writing speeds (V nm ,..., V n-2 , V n-1 ) and writing speeds (V n-0 ) are weighted from m characters before the input character, respectively. It is preferable to set so as to increase in this order. Thereby, when the calculated value (T hn ) is lower than the threshold value (T h ), the input character may be a Chinese character. Alternatively, there is a possibility that the input characters are kanji and kanji are written continuously. Thus, in the on-line character recognition device of the present invention, the kanji character dictionary (3), the kana character dictionary (4), the writing speed, and the weight are used to distinguish homomorphic characters from kanji and katakana. When an isomorphic character is written in the character input section (5), the isomorphic character can be correctly recognized.
以下に添付図面を参照して、本発明の実施形態によるオンライン文字認識装置について詳細に説明する。 Hereinafter, an on-line character recognition apparatus according to an embodiment of the present invention will be described in detail with reference to the accompanying drawings.
図1は、本発明の実施形態によるオンライン文字認識装置の構成を示している。本発明の実施形態によるオンライン文字認識装置は、コンピュータ1と、記憶装置2と、手書き文字入力部5と、出力装置6とを具備している。
FIG. 1 shows a configuration of an on-line character recognition apparatus according to an embodiment of the present invention. The online character recognition device according to the embodiment of the present invention includes a
記憶装置2は、コンピュータ1に接続され、漢字辞書3、かな文字辞書4を備えている。
The
図2は、漢字辞書3を示している。漢字辞書3には、複数の文字のうちの、漢字を表す漢字文字群が格納されている。図2に示されるように、その漢字文字群には、カタカナの「カ」に形が似ている漢字の「力(ちから、りょく)」や、カタカナの「タ」に形が似ている漢字の「夕(ゆう)」が含まれている。図示しないが、その漢字文字群には、更に、カタカナの「ニ」に形が似ている漢字の「二(2)」や、カタカナの「ナ」に形が似ている漢字の「十(10)」なども含まれる。
FIG. 2 shows the
図3は、かな文字辞書4を示している。かな文字辞書4には、複数の文字のうちの、漢字文字群以外の文字群(ひらがな、カタカナ、数字、アルファベットなど)が格納されている。図3に示されるように、その文字群には、漢字の「力(ちから、りょく)」に形が似ているカタカナの「カ」や、漢字の「夕(ゆう)」に形が似ているカタカナの「タ」が含まれている。図示しないが、その文字群には、更に、漢字の「二(2)」に形が似ているカタカナの「ニ」や、漢字の「十(10)」に形が似ているカタカナの「ナ」なども含まれる。
FIG. 3 shows the
手書き文字入力部5は、コンピュータ1に接続され、利用者により書かれた文字を入力文字として入力する。手書き文字入力部5は、ペンがタブレット上で操作されることにより、ペンの先で押された点の座標(X、Y)が取り込まれる。これによって、ストローク毎に座標点列がデータとして入力される。また、手書き文字入力部5としては、ペンを用いるものの他に、指で字を描くタッチパネルや、表示装置上でカーソルを動かして文字を描くマウス等も例示される。
The handwritten character input unit 5 is connected to the
コンピュータ1は、漢字辞書3又はかな文字辞書4を参照して、手書き文字入力部5に入力された入力文字と一致する文字を認識し、その認識結果を出力装置6に出力する。
The
出力装置6は、コンピュータ1に接続された表示装置、情報処理装置を含んでいる。例えば、表示装置は、認識結果の出力として、入力文字と一致する文字を表示し、情報処理装置は、入力文字と一致する文字により所定の処理を実行する。
The output device 6 includes a display device and an information processing device connected to the
コンピュータ1は、実行部であるCPU(Central Processing Unit)10と、CPU10に実行させるためのコンピュータプログラム12が格納された記録媒体である記憶部11と、を備えている。CPU10は、コンピュータが起動するときなどにコンピュータプログラム12を記憶部11から読み取って実行する。
The
コンピュータプログラム12は、筆記速度検出部21、算出部22、辞書選択部23、文字認識部24を含んでいる。これらの動作については後述する。
The
記憶部11は、筆記速度格納部13を備えている。ここで、漢字辞書3とかな文字辞書4は、記憶装置2ではなく、コンピュータ1に内蔵されてもよい。即ち、コンピュータ1内の記憶部11に備えられていてもよい。また、情報処理装置は、コンピュータ1に内蔵されてもよい。即ち、コンピュータ1内に設けられ、その動作を実行するコンピュータプログラムが記憶部11に格納されていてもよい。
The
図4は、本発明の実施形態によるオンライン文字認識装置の動作を示すフローチャートである。 FIG. 4 is a flowchart illustrating the operation of the online character recognition apparatus according to the embodiment of the present invention.
利用者が、手書き文字入力部5に対してペン又は自身の指を動かすことにより、文字を書く。このとき、手書き文字入力部5は、利用者により書かれた文字を入力文字として入力する(ステップS1)。 A user writes a character by moving a pen or his / her finger with respect to the handwritten character input unit 5. At this time, the handwritten character input unit 5 inputs a character written by the user as an input character (step S1).
筆記速度検出部21は、手書き文字入力部5に入力文字が入力されたときの筆記速度Vn−0を検出し、筆記速度格納部13に格納する(ステップS2)。 The writing speed detection unit 21 detects the writing speed V n-0 when an input character is input to the handwritten character input unit 5 and stores it in the writing speed storage unit 13 (step S2).
筆記速度Vn−0の算出方法について具体的に説明する。 A method for calculating the writing speed V n-0 will be specifically described.
図5に示されるように、手書き文字入力部5に入力文字が入力されたときのLストローク目(Lは1以上の整数)の座標点数をP(L)とし、Lストローク目のk番目(kは1以上の整数)の座標点を(XL(k)、YL(k))とし、Lストローク目の筆記速度をVLとしたとき、Lストローク目の筆記速度VLは、
図6に示されるように、手書き文字入力部5に入力文字が入力されたときのストローク数をSMとし、筆記速度をVn−0としたとき、筆記速度Vn−0は、
この時点では、筆記速度格納部13には、筆記速度検出部21によってm文字前(mは、1以上の整数)までのm個の筆記速度が格納されていないものとする。即ち、利用者が最初の文字を書き始めている場合、この文字数に達していない(ステップS3−NO)。
At this time, it is assumed that the writing
この場合、辞書選択部23は、漢字辞書3を選択する(ステップS6)。文字認識部24は、漢字辞書3を参照する。このとき、文字認識部24は、漢字辞書3に格納された漢字文字群のうちの、入力文字と一致する文字を認識する認識処理を行う。認識処理において、文字認識部24は、入力文字と一致する文字を認識した場合(ステップS7−YES)、その認識結果を出力装置6に出力する(ステップS10)。
In this case, the
この時点では、文字認識部24が漢字辞書3を参照しても入力文字と一致する文字が存在しない場合も考えられる(ステップS7−NO)。この場合、文字認識部24は、かな文字辞書4を参照する(ステップS8)。このとき、文字認識部24は、かな文字辞書4に格納された文字群のうちの、入力文字と一致する文字を認識する認識処理を行う。認識処理において、文字認識部24は、入力文字と一致する文字を認識した場合(ステップS9)、その認識結果を出力装置6に出力する(ステップS10)。また、文字認識部24は、入力文字と一致する文字を認識できない場合、入力文字に類似する文字を認識し(ステップS9)、その認識結果を出力装置6に出力する(ステップS10)。
At this time, even if the
利用者が、手書き文字入力部5に対してペン又は自身の指を動かすことにより、再度、ステップS1、S2が実行される。 When the user moves the pen or his / her finger with respect to the handwritten character input unit 5, steps S1 and S2 are executed again.
いま、図7に示されるように、筆記速度格納部13には、筆記速度検出部21によってm文字前までのm個の筆記速度Vn−m、…、Vn−2、Vn−1が格納されているものとする。即ち、筆記速度格納部13に格納された筆記速度の個数は、mに達している(ステップS3−YES)。
Now, as shown in FIG. 7, the writing
算出部22は、m個の筆記速度Vn−m、…、Vn−2、Vn−1と筆記速度Vn−0とにそれぞれ重み付けを施し、その平均値である算出値Thnを算出する(ステップS4)。
The
ここで、重み付けについて具体的に説明する。 Here, the weighting will be specifically described.
複数の文字の中には、漢字の「力(ちから、りょく)」、カタカナの「カ」や、漢字の「夕(ゆう)」、カタカナの「タ」のように、漢字とカタカナとで形が似ている文字(同形異文字)が存在する。このため、複数の文字のうちの、漢字を表す漢字文字群を漢字辞書3に格納し、漢字文字群以外の文字群(ひらがな、カタカナ、数字、アルファベットなど)をかな文字辞書4に格納している。しかし、利用者が上述の同形異文字を書いた場合、筆記速度はほぼ同じである。
Some of the characters include kanji and katakana, such as the kanji “power”, the katakana “ka”, the kanji “yu”, and the katakana “ta”. There are characters that are similar in shape. Therefore, a kanji character group representing a kanji character among a plurality of characters is stored in the
そこで、後述の辞書選択部23が、入力文字が漢字であるか否かを判定するために、あるいは、漢字が連続して書かれているか否かを判定するために、筆記速度Vn−0に対する重み付けは、m個の筆記速度Vn−m、…、Vn−2、Vn−1に対する重み付けよりも高くなるように設定しておく。この場合、m個の筆記速度Vn−m、…、Vn−2、Vn−1と筆記速度Vn−0とに対する重み付けは、それぞれm文字前の文字から入力文字までこの順に高くなるように設定しておくことが好ましい。
Therefore, the writing speed V n-0 is determined by the
算出値Thnの算出方法について具体的に説明する。 A method for calculating the calculated value Thn will be specifically described.
筆記速度格納部13に格納されたm個の筆記速度をm文字前から1文字前までこの順にVn−m、…、Vn−2、Vn−1とし、手書き文字入力部5に入力文字が入力されたときの筆記速度をVn−0とし、(m+1)個の筆記速度Vn−m、…、Vn−2、Vn−1、Vn−0に対する重み付けをそれぞれan−m、…、an−2、an−1、an−0とし、算出値をThnとしたとき、算出値Thnは、
算出値Thnが閾値Thよりも低い場合(ステップS5−YES)、辞書選択部23は、入力文字が漢字であるか、漢字が連続して書かれているものとして、漢字辞書3を選択辞書として選択する(ステップS6)。文字認識部24は、その漢字辞書3を参照する。このとき、文字認識部24は、漢字辞書3に格納された漢字文字群のうちの、入力文字と一致する文字を認識する認識処理を行う。認識処理において、文字認識部24は、入力文字と一致する文字を認識した場合(ステップS7−YES)、その結果を出力装置6に出力する(ステップS10)。
When the calculated value T hn is less than the threshold value T h (step S5-YES), the
一方、算出値Thnが閾値Th以上である場合(ステップS5−NO)、辞書選択部23は、かな文字辞書4を選択辞書として選択する(ステップS8)。文字認識部24は、そのかな文字辞書4を参照する。このとき、文字認識部24は、かな文字辞書4に格納された文字群のうちの、入力文字と一致する文字を認識する認識処理を行う。認識処理において、文字認識部24は、入力文字と一致する文字を認識した場合(ステップS9)、その認識結果を出力装置6に出力する(ステップS10)。また、文字認識部24は、入力文字と一致する文字を認識できない場合、入力文字に類似する文字を認識し(ステップS9)、その認識結果を出力装置6に出力する(ステップS10)。
On the other hand, when the calculated value T hn is equal to or more than the threshold T h (step S5-NO),
また、文字認識部24が漢字辞書3を参照しても入力文字と一致する文字が存在しない場合も考えられる(ステップS7−NO)。この場合、文字認識部24は、かな文字辞書4を参照して(ステップS8)、認識処理を行い(ステップS9)、その認識結果を出力装置6に出力する(ステップS10)。
Moreover, even if the
算出値Thnが閾値Thよりも低い場合について具体的に説明する。 Specifically described when the calculated value T hn is lower than the threshold T h.
まず、入力文字が漢字である場合について説明する。 First, a case where the input character is a Chinese character will be described.
例えば、mが2であり、筆記速度Vn−2、Vn−1、Vn−0に対応する文字が「この間」であり、利用者が、入力文字として漢字の「間」を書いている場合、筆記速度Vn−0は筆記速度Vn−2、Vn−1よりも下がる。即ち、筆記速度Vn−0の値は、筆記速度Vn−2、Vn−1の値よりも小さくなる。この場合、重み付けan−2、an−1、an−0は、2文字前の文字から入力文字までこの順に高いため、an−0×Vn−0の値はan−1×Vn−1、an−2×Vn−2の値に比べて大きな差がない。従って、算出値Thnが閾値Thよりも低くなるように、重み付けan−2、an−1、an−0や閾値Thが設定される。 For example, when m is 2, the characters corresponding to the writing speeds V n-2 , V n-1 , V n-0 are “between”, and the user writes “between” kanji as input characters. If it is, the writing speed Vn -0 is lower than the writing speeds Vn -2 and Vn -1 . That is, the value of the writing speed V n-0 is smaller than the values of the writing speeds V n−2 and V n−1 . In this case, since the weights a n−2 , a n−1 and a n−0 are higher in this order from the character two characters before the input character, the value of a n− 0 × V n−0 is a n−1. There is no big difference compared with the value of * Vn -1 and an -2 * Vn -2 . Accordingly, the calculated value T hn is so lower than the threshold T h, weighting a n-2, a n- 1, a n-0 and threshold T h is set.
次に、入力文字が漢字であり、漢字が連続して書かれている場合について説明する。 Next, a case where the input characters are kanji and the kanji are written continuously will be described.
例えば、mが2であり、筆記速度Vn−2、Vn−1、Vn−0に対応する文字が「瞬発力」であり、利用者が、入力文字として漢字の「力(ちから、りょく)」を書いている場合、筆記速度Vn−0は筆記速度Vn−2、Vn−1よりも上がる。即ち、筆記速度Vn−0の値は、筆記速度Vn−2、Vn−1の値よりも大きくなる。この場合、重み付けan−2、an−1、an−0は、2文字前の文字から入力文字までこの順に高いため、an−0×Vn−0の値はan−1×Vn−1、an−2×Vn−2の値に比べて大きくなるが、an−1×Vn−1、an−2×Vn−2の値自体がan−0×Vn−0の値に比べて非常に小さい。従って、算出値Thnが閾値Thよりも低くなるように、重み付けan−2、an−1、an−0や閾値Thが設定される。 For example, when m is 2, the characters corresponding to the writing speeds V n-2 , V n-1 , V n-0 are “instantaneous power”, and the user inputs “kanji” In the case of writing "Ryo)", the writing speed Vn -0 is higher than the writing speeds Vn -2 and Vn -1 . That is, the value of the writing speed Vn -0 is larger than the values of the writing speeds Vn -2 and Vn -1 . In this case, since the weights a n−2 , a n−1 and a n−0 are higher in this order from the character two characters before the input character, the value of a n− 0 × V n−0 is a n−1. XV n-1 , an n-2 It becomes larger than the value of V n-2 , but the value of an n-1 × V n-1 , an n-2 × V n-2 itself is an n−. Very small compared to the value of 0 × V n−0 . Accordingly, the calculated value T hn is so lower than the threshold T h, weighting a n-2, a n- 1, a n-0 and threshold T h is set.
次に、入力文字がカタカナであり、カタカナが連続して書かれている場合について説明する。 Next, a case where the input character is katakana and katakana is continuously written will be described.
例えば、mが2であり、「ふりがなはカタカナで書くこと」のうちの、筆記速度Vn−2、Vn−1、Vn−0に対応する文字が「なはカ」であり、利用者が、入力文字としてカタカナの「カ」を書いている場合、筆記速度Vn−0は筆記速度Vn−2、Vn−1に比べて大幅に変化しない。即ち、筆記速度Vn−0の値は、筆記速度Vn−2、Vn−1の値に比べて大幅に変化しない。この場合、重み付けan−2、an−1、an−0は、2文字前の文字から入力文字までこの順に高いため、an−0×Vn−0の値はan−1×Vn−1、an−2×Vn−2の値に比べて大きくなる。従って、算出値Thnが閾値Th以上になるように、重み付けan−2、an−1、an−0や閾値Thが設定される。 For example, m is 2, and the letters corresponding to the writing speeds V n-2 , V n-1 , V n-0 of “Writing in Japanese with Katakana” are “Nahaka” and used. When a person writes “Ka” of katakana as an input character, the writing speed V n-0 does not change significantly compared to the writing speeds V n−2 and V n−1 . That is, the value of the writing speed V n-0 does not change significantly compared to the values of the writing speeds V n−2 and V n−1 . In this case, since the weights a n−2 , a n−1 and a n−0 are higher in this order from the character two characters before the input character, the value of a n− 0 × V n−0 is a n−1. × V n-1 , a n-2 × V n-2 is larger than the value. Accordingly, the calculated value T hn is such that more than the threshold T h, weighting a n-2, a n- 1, a n-0 and threshold T h is set.
このように、漢字は2文字や3文字が多く、四字熟語も考慮して、mは、1〜3が好ましい。従って、重み付けan−m、…、an−2、an−1、an−0は、m文字前の文字から入力文字までこの順に高くなるように設定されていることが好ましい。上述のように、mが2である場合、重み付けがan−2、an−1、an−0となる。例えば、10という値を3つの値に割り振る場合、重み付けan−2、an−1、an−0は、2文字前の文字から入力文字までこの順に高く設定され、それぞれ、2、3、5や、1、3、6などの値が設定されていることが好ましい。 Thus, there are many 2 or 3 kanji characters, and m is preferably 1 to 3 in consideration of four-character idioms. Therefore, it is preferable that the weights a n−m ,..., A n−2 , a n−1 , a n−0 are set so as to increase in this order from the m character before the input character. As described above, when m is 2, the weights are a n−2 , a n−1 , and a n−0 . For example, when a value of 10 is assigned to three values, the weights a n−2 , a n−1 and a n−0 are set higher in this order from the character two characters before the input character, It is preferable that values such as 5, 1, 1, 3, 6 are set.
以上の説明により、本発明のオンライン文字認識装置では、漢字辞書3、かな文字辞書4、筆記速度、重み付けにより、同形異文字を漢字とカタカナとで区別している。このため、利用者が手書き文字入力部5に同形異文字を書いたときに、その同形異文字を正しく認識することができる。
As described above, in the on-line character recognition apparatus of the present invention, homomorphic characters are distinguished from kanji and katakana by the
その理由として、上述のように、複数の文字の中には、漢字とカタカナとで形が似ている同形異文字が存在する。このため、複数の文字のうちの、漢字を表す漢字文字群を漢字辞書3に格納し、漢字文字群以外の文字群をかな文字辞書4に格納している。しかし、利用者が上述の同形異文字を書いた場合、筆記速度はほぼ同じである。そこで、本発明のオンライン文字認識装置では、辞書選択部23が、入力文字が漢字であるか否かを判定するために、あるいは、漢字が連続して書かれているか否かを判定するために、筆記速度Vn−0に対する重み付けは、m個の筆記速度Vn−m、…、Vn−2、Vn−1に対する重み付けよりも高くなるように設定される。この場合、m個の筆記速度Vn−m、…、Vn−2、Vn−1と筆記速度Vn−0とに対する重み付けは、それぞれm文字前の文字から入力文字までこの順に高くなるように設定される。これにより、算出値Thnが閾値Thよりも低い場合、入力文字が漢字である可能性がある。あるいは、入力文字が漢字であり、漢字が連続して書かれている可能性がある。このように、本発明のオンライン文字認識装置では、漢字辞書3、かな文字辞書4、筆記速度、重み付けにより、同形異文字を漢字とカタカナとで区別しているため、利用者が手書き文字入力部5に同形異文字を書いたときに、その同形異文字を正しく認識することができる。
The reason for this is that, as described above, among the plurality of characters, there are isomorphic characters whose shapes are similar between kanji and katakana. For this reason, a kanji character group representing a kanji character among a plurality of characters is stored in the
なお、本発明の実施形態によるオンライン文字認識装置では、本発明の効果を実現する構成であれば、更に、従来のオンライン文字認識装置の構成を具備してもよい。 Note that the on-line character recognition device according to the embodiment of the present invention may further include a configuration of a conventional on-line character recognition device as long as the effect of the present invention is realized.
1 コンピュータ、
2 記憶装置、
3 漢字辞書、
4 かな文字辞書、
5 手書き文字入力部、
6 出力装置、
10 CPU、
11 記憶部、
12 コンピュータプログラム、
13 筆記速度格納部、
21 筆記速度検出部、
22 算出部、
23 辞書選択部、
24 文字認識部
1 computer,
2 storage devices,
3 Kanji dictionary,
4 Kana character dictionary,
5 Handwritten input part,
6 output device,
10 CPU,
11 storage unit,
12 computer programs,
13 Writing speed storage,
21 Writing speed detector,
22 calculation unit,
23 Dictionary selection part,
24 character recognition part
Claims (9)
前記複数の文字のうちの、前記漢字文字群以外の文字群が格納されたかな文字辞書と、
利用者により書かれた文字を入力文字として入力するための手書き文字入力部と、
前記手書き文字入力部に前記入力文字が入力されたときの筆記速度を検出する筆記速度検出部と、
m文字前(mは、1以上の整数)までの筆記速度であるm個の筆記速度を格納する筆記速度格納部と、
前記m個の筆記速度と前記筆記速度とにそれぞれ重み付けを施し、その平均値である算出値を算出する算出部と、ここで、前記筆記速度に対する重み付けは、前記m個の筆記速度に対する重み付けよりも高く、
前記算出値が閾値よりも低い場合、前記漢字辞書を選択辞書として選択し、前記算出値が前記閾値以上である場合、前記かな文字辞書を前記選択辞書として選択する辞書選択部と、
前記選択辞書を参照して、前記入力文字と一致する文字を認識する認識処理を行う文字認識部と
を具備するオンライン文字認識装置。 A kanji dictionary in which a kanji character group representing a kanji among a plurality of characters is stored;
A character dictionary in which a character group other than the Kanji character group among the plurality of characters is stored,
A handwritten character input unit for inputting characters written by the user as input characters;
A writing speed detection unit that detects a writing speed when the input character is input to the handwritten character input unit;
a writing speed storage unit for storing m writing speeds that are writing speeds up to m characters before (m is an integer of 1 or more);
Weighting each of the m writing speeds and the writing speed and calculating a calculation value that is an average value thereof, wherein the weighting for the writing speed is based on the weighting for the m writing speeds Higher
A dictionary selection unit that selects the kanji dictionary as a selection dictionary when the calculated value is lower than a threshold; and a dictionary selection unit that selects the kana character dictionary as the selection dictionary when the calculated value is equal to or greater than the threshold;
An online character recognition device comprising: a character recognition unit that performs a recognition process for recognizing a character that matches the input character with reference to the selection dictionary.
請求項1に記載のオンライン文字認識装置。 2. The online character recognition device according to claim 1, wherein the m writing speeds and the writing speeds are weighted in this order from a character preceding m characters to the input character.
請求項2に記載のオンライン文字認識装置。 The m writing speeds stored in the writing speed storage unit are set to V nm ,..., V n-2 , V n-1 in this order from m characters before to 1 character, and the handwritten character input unit The writing speed when the input character is input is set to V n-0, and weighting is applied to (m + 1) writing speeds V nm , ..., V n-2 , V n-1 , V n-0 . When each of a nm ,..., A n-2 , a n-1 , a n-0 and the calculated value is Thn , the calculated value Thn is
前記手書き文字入力部に前記入力文字が入力されたときのストローク数をSMとし、前記筆記速度をVn−0としたとき、前記筆記速度Vn−0は、
請求項1〜3のいずれかに記載のオンライン文字認識装置。 The number of coordinate points of the Lth stroke (L is an integer of 1 or more) when the input character is input to the handwritten character input unit is P (L), and the kth of the L stroke (k is an integer of 1 or more). the coordinate point and (X L (k), Y L (k)), when the writing speed of the L-stroke th was V L, the writing speed V L of the L stroke th
When the stroke number when the input character is input to the handwritten character input unit is SM and the writing speed is Vn -0 , the writing speed Vn -0 is:
前記文字認識部は、前記漢字辞書を参照して、前記認識処理を行い、
前記漢字辞書を参照しても前記入力文字と一致する文字が存在しない場合、前記かな文字辞書を参照して、前記認識処理を行う
請求項1〜4のいずれかに記載のオンライン文字認識装置。 When the m writing speeds up to m characters before are not stored in the writing speed storage unit, the dictionary selection unit selects the Kanji dictionary,
The character recognition unit performs the recognition process with reference to the Chinese character dictionary,
The on-line character recognition device according to any one of claims 1 to 4, wherein if the character that matches the input character does not exist even if the kanji dictionary is referenced, the recognition process is performed with reference to the kana character dictionary.
m文字前(mは、1以上の整数)までの筆記速度であるm個の筆記速度を前記記憶部に格納し、前記手書き文字入力部に前記入力文字が入力されたときの筆記速度を検出する筆記速度検出部と、
前記m個の筆記速度と前記筆記速度とにそれぞれ重み付けを施し、その平均値である算出値を算出する算出部と、ここで、前記筆記速度に対する重み付けは、前記m個の筆記速度に対する重み付けよりも高く、
前記算出値が閾値よりも低い場合、複数の文字のうちの、漢字を表す漢字文字群が格納された漢字辞書を選択辞書として選択し、前記算出値が前記閾値以上である場合、前記複数の文字のうちの、前記漢字文字群以外の文字群が格納されたかな文字辞書を前記選択辞書として選択する辞書選択部と、
前記選択辞書を参照して、前記入力文字と一致する文字を認識する認識処理を行う文字認識部と
を具備するコンピュータ。 A computer connected to a handwritten character input unit for inputting a character written by a user as an input character, and having a storage unit;
The m writing speeds up to m characters before (m is an integer of 1 or more) are stored in the storage unit, and the writing speed when the input characters are input to the handwritten character input unit is detected. A writing speed detection unit,
Weighting each of the m writing speeds and the writing speed and calculating a calculation value that is an average value thereof, wherein the weighting for the writing speed is based on the weighting for the m writing speeds Higher
When the calculated value is lower than the threshold, a kanji dictionary storing a kanji character group representing a kanji is selected as a selection dictionary, and when the calculated value is equal to or greater than the threshold, A dictionary selection unit that selects, as the selection dictionary, a character dictionary in which characters other than the Kanji character group are stored,
A computer comprising: a character recognition unit that performs a recognition process for recognizing a character that matches the input character with reference to the selection dictionary.
請求項6に記載のコンピュータ。 The computer according to claim 6, wherein the kanji dictionary and the kana character dictionary are built in the storage unit.
m文字前(mは、1以上の整数)までの筆記速度であるm個の筆記速度を記憶部に格納するステップと、
前記手書き文字入力部に前記入力文字が入力されたときの筆記速度を検出するステップと、
前記m個の筆記速度と前記筆記速度とにそれぞれ重み付けを施し、その平均値である算出値を算出するステップと、ここで、前記筆記速度に対する重み付けは、前記m個の筆記速度に対する重み付けよりも高く、
前記算出値が閾値よりも低い場合、複数の文字のうちの、漢字を表す漢字文字群が格納された漢字辞書を選択辞書として選択するステップと、
前記算出値が前記閾値以上である場合、前記複数の文字のうちの、前記漢字文字群以外の文字群が格納されたかな文字辞書を前記選択辞書として選択するステップと、
前記選択辞書を参照して、前記入力文字と一致する文字を認識する認識処理を行うステップと
を具備するオンライン文字認識方法。 A method executed by a computer connected to a handwritten character input unit for inputting characters written by a user as input characters,
storing m writing speeds, which are writing speeds up to m characters before (m is an integer of 1 or more), in the storage unit;
Detecting a writing speed when the input character is input to the handwritten character input unit;
Weighting each of the m writing speeds and the writing speed and calculating a calculated value that is an average value thereof, wherein the weighting for the writing speed is more than the weighting for the m writing speeds high,
If the calculated value is lower than the threshold, a step of selecting, as a selection dictionary, a kanji dictionary storing a kanji character group representing a kanji among a plurality of characters;
When the calculated value is equal to or greater than the threshold, a character dictionary in which a character group other than the kanji character group among the plurality of characters is stored is selected as the selection dictionary;
An online character recognition method comprising: recognizing a character that matches the input character with reference to the selected dictionary.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009282593A JP2011123788A (en) | 2009-12-14 | 2009-12-14 | Online character recognition device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009282593A JP2011123788A (en) | 2009-12-14 | 2009-12-14 | Online character recognition device |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2011123788A true JP2011123788A (en) | 2011-06-23 |
Family
ID=44287598
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009282593A Withdrawn JP2011123788A (en) | 2009-12-14 | 2009-12-14 | Online character recognition device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2011123788A (en) |
-
2009
- 2009-12-14 JP JP2009282593A patent/JP2011123788A/en not_active Withdrawn
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN108710406B (en) | Gesture adaptive selection | |
| CN100437739C (en) | Continuous stroke word-based text input system and method | |
| US20180300542A1 (en) | Drawing emojis for insertion into electronic text-based messages | |
| US20120069027A1 (en) | Input device | |
| US20060055669A1 (en) | Fluent user interface for text entry on touch-sensitive display | |
| US20080163130A1 (en) | Gesture learning | |
| CN103870192B (en) | Input method and device based on touch screen, Chinese pinyin input method and system | |
| US9529448B2 (en) | Data entry systems and methods | |
| JPH11328312A (en) | Method and device for recognizing handwritten chinese character | |
| US20150248166A1 (en) | System for spontaneous recognition of continuous gesture input | |
| US7142715B2 (en) | Arabic handwriting recognition using feature matching | |
| US20060126936A1 (en) | System, method, and apparatus for triggering recognition of a handwritten shape | |
| Zhang et al. | Airtyping: A mid-air typing scheme based on leap motion | |
| CN102147706A (en) | Method for inputting full spellings of Chinese character in touching and sliding manner | |
| JP6081606B2 (en) | Electronic apparatus and method | |
| JP5897726B2 (en) | User interface device, user interface method, program, and computer-readable information storage medium | |
| KR101485679B1 (en) | Character input method using motion sensor and apparatus performing the same | |
| CN104898855A (en) | System and method for inputting texts on basis of devices with rockers | |
| JP5974576B2 (en) | Character recognition learning device, character recognition device, and program | |
| Evans et al. | VType: Entering text in a virtual world | |
| US20150089432A1 (en) | Quick data entry systems and methods | |
| JP2011123788A (en) | Online character recognition device | |
| KR100484128B1 (en) | Apparatus for inputting unistroke korean language | |
| Madhvanath et al. | GeCCo: Finger gesture-based command and control for touch interfaces | |
| CN107608533A (en) | A kind of Embedded Input Method of light-type |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20130305 |
