JP7095450B2 - Information processing device, character recognition method, and character recognition program - Google Patents
Information processing device, character recognition method, and character recognition program Download PDFInfo
- Publication number
- JP7095450B2 JP7095450B2 JP2018136748A JP2018136748A JP7095450B2 JP 7095450 B2 JP7095450 B2 JP 7095450B2 JP 2018136748 A JP2018136748 A JP 2018136748A JP 2018136748 A JP2018136748 A JP 2018136748A JP 7095450 B2 JP7095450 B2 JP 7095450B2
- Authority
- JP
- Japan
- Prior art keywords
- stroke
- score
- information processing
- group
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
本発明は、情報処理装置、文字認識方法、および文字認識プログラムに関する。 The present invention relates to an information processing device, a character recognition method, and a character recognition program.
従来、ユーザが手の指やスタイラスなどを利用して1つの入力欄に重ね書きした文字を認識する文字認識技術がある。 Conventionally, there is a character recognition technique in which a user recognizes characters overwritten in one input field by using a finger or a stylus.
先行技術としては、例えば、バッファ内の入力ストローク列に対する認識候補文字列を生成し、認識候補文字列ごとに文字列構造辞書を生成して入力ストローク列と照合するものがある。また、例えば、入力ストロークに基づいて、文字の推測に対応するノードから構成される分割グラフを生成し、分割グラフの各ノードに認識スコアを割り当て、認識スコアと言語モデルとに基づいて、入力ストロークの言語的意味を生成する技術がある。また、例えば、ユーザが複数の重なり合ったストロークを描くと、ストロークを自動的にセグメント化し、1つ以上の対応する文字に結合する技術がある。また、例えば、入力された手書き文字の各ストロークについて入力枠に対するストロークの開始・終了領域と方向とからストローク情報を求め、ストローク辞書に登録されたストローク情報と照合してストローク候補を検出する技術がある。また、例えば、ユーザが筆記中の字画がi番目の文字に帰属するのかi+1番目の文字に帰属するのかを判断し、ユーザがi+1番目の文字の筆記を開始すると、i番目の文字の字画の表示色を自動的に暗転する技術がある。 As a prior art, for example, there is one that generates a recognition candidate character string for an input stroke string in a buffer, generates a character string structure dictionary for each recognition candidate character string, and collates it with the input stroke string. Also, for example, based on the input stroke, a split graph consisting of nodes corresponding to character guesses is generated, a recognition score is assigned to each node of the split graph, and the input stroke is based on the recognition score and the language model. There is a technique to generate the linguistic meaning of. Further, for example, there is a technique in which when a user draws a plurality of overlapping strokes, the strokes are automatically segmented and combined with one or more corresponding characters. Further, for example, a technique for obtaining stroke information from the start / end area and direction of a stroke for an input frame for each stroke of an input handwritten character and collating it with the stroke information registered in the stroke dictionary to detect a stroke candidate. be. Further, for example, when the user determines whether the stroke being written belongs to the i-th character or the i + 1-th character and the user starts writing the i + 1-th character, the stroke of the i-th character There is a technology that automatically darkens the display color.
しかしながら、従来技術では、入力欄に重ね書きされる文字を正しく認識することができない場合がある。例えば、漢字、ひらがな、カタカナ、英数字、記号などの、認識する文字の種別が多くなるほど、入力欄に重ね書きされる文字を正しく認識することが難しくなる傾向がある。 However, in the prior art, it may not be possible to correctly recognize the characters overwritten in the input field. For example, the more types of characters to be recognized, such as Chinese characters, hiragana, katakana, alphanumericals, and symbols, the more difficult it tends to be to correctly recognize the characters overwritten in the input field.
1つの側面では、本発明は、文字の認識精度を向上することを目的とする。 In one aspect, the present invention aims to improve character recognition accuracy.
1つの実施態様によれば、入力欄に書き込まれた筆画の軌跡を示す筆画データを蓄積し、蓄積した前記筆画データを参照して、前記入力欄に書き込まれた、時系列順に連続する1以上の筆画を含む先行の筆画グループと、前記先行の筆画グループの直後に続く、時系列順に連続する1以上の筆画を含む後続の筆画グループとの特徴量に基づいて、前記先行の筆画グループと前記後続の筆画グループとの区切りが、文字間の区切りである妥当性の強さを示す妥当性スコアを算出し、蓄積した前記筆画データと、算出した前記妥当性スコアとに基づいて、前記入力欄に書き込まれた1以上の文字を認識する情報処理装置、文字認識方法、および文字認識プログラムが提案される。 According to one embodiment, stroke data indicating the trajectory of the stroke written in the input field is accumulated, and with reference to the accumulated stroke data, one or more consecutive strokes written in the input field are written in chronological order. The preceding stroke group and the said The input field is based on the stroke data accumulated by calculating the validity score indicating the strength of the validity that the division with the subsequent stroke group is the division between characters, and the calculated validity score. An information processing device, a character recognition method, and a character recognition program for recognizing one or more characters written in are proposed.
一態様によれば、文字の認識精度を向上することが可能になる。 According to one aspect, it becomes possible to improve the recognition accuracy of characters.
以下に、図面を参照して、本発明にかかる情報処理装置、文字認識方法、および文字認識プログラムの実施の形態を詳細に説明する。 Hereinafter, embodiments of the information processing apparatus, the character recognition method, and the character recognition program according to the present invention will be described in detail with reference to the drawings.
(実施の形態にかかる文字認識方法の一実施例)
図1は、実施の形態にかかる文字認識方法の一実施例を示す説明図である。図1において、情報処理装置100は、ユーザにより1つの入力欄に重ね書きされた文字を認識するためのコンピュータである。情報処理装置100は、例えば、PC(Personal Computer)、タブレット端末、スマートフォン、ウェアラブル端末などである。
(Example of character recognition method according to the embodiment)
FIG. 1 is an explanatory diagram showing an embodiment of a character recognition method according to an embodiment. In FIG. 1, the
ここで、1つの入力欄に文字を重ね書きする方式は、他の方式に比べて有用な点が存在するため、1つの入力欄に文字を重ね書きする方式を利用することが好ましい場合がある。他の方式は、例えば、複数の入力欄が用意され、ユーザがそれぞれの入力欄に1文字ずつ文字を書き込むような方式である。また、他の方式は、例えば、ユーザが1つの入力欄に1文字書き込む都度、確定操作を行うような方式である。 Here, since the method of overwriting characters in one input field has more useful points than the other methods, it may be preferable to use the method of overwriting characters in one input field. .. Another method is, for example, a method in which a plurality of input fields are prepared and a user writes one character in each input field. Further, another method is, for example, a method in which a confirmation operation is performed each time a user writes one character in one input field.
他の方式に比べて有用な点は、例えば、入力欄を大きくしやすいため、ユーザが文字を書き込みやすくなるという点が考えられる。また、他の方式に比べて有用な点は、例えば、ユーザが1文字ずつ書き込む入力欄を変更しなくてもよく、ユーザが1文字ずつ確定操作を行わなくてもよいため、ユーザが文字を書き込みやすくなるという点が考えられる。 A useful point as compared with other methods is that, for example, it is easy to make the input field large, so that it is easy for the user to write characters. Further, a useful point compared to other methods is that, for example, the user does not have to change the input field for writing characters one by one, and the user does not have to perform the confirmation operation one character at a time, so that the user writes characters. It is possible that it will be easier to write.
しかしながら、1つの入力欄に文字を重ね書きする方式で、入力欄に書き込まれた文字を正しく認識することができない場合がある。例えば、漢字、ひらがな、カタカナ、英数字、記号などの、認識する文字の種別が多くなるほど、入力欄に重ね書きされる文字を正しく認識することが難しくなる傾向がある。 However, there are cases where the characters written in the input field cannot be correctly recognized by the method of overwriting the characters in one input field. For example, the more types of characters to be recognized, such as Chinese characters, hiragana, katakana, alphanumericals, and symbols, the more difficult it tends to be to correctly recognize the characters overwritten in the input field.
ここで、1つの入力欄に文字を重ね書きする方式では、1つの入力欄に連続して書き込まれた複数の筆画のうち、いずれの筆画の集まりが、1つの文字分の筆画の集まりであるかは、ユーザから明示されない。そして、認識する文字の種別が多くなるほど、1つの文字を形成する筆画の集まりと、連続する2以上の文字を形成する筆画の集まりとが類似してしまう確率が増加する傾向がある。結果として、1つの文字と、連続する2以上の文字とを区別して認識することが難しくなる。例えば、「名(漢字)」と「タロ(カタカナ)」とを区別することが難しくなる。また、例えば、「夕(漢字)」と「タ(カタカナ)」と「クー(カタカナ)」とを区別することが難しくなる。 Here, in the method of overwriting characters in one input field, a collection of strokes among a plurality of strokes written consecutively in one input field is a collection of strokes for one character. Is not specified by the user. As the number of types of characters to be recognized increases, the probability that a group of strokes forming one character and a group of strokes forming two or more consecutive characters tend to be similar increases. As a result, it becomes difficult to distinguish and recognize one character and two or more consecutive characters. For example, it becomes difficult to distinguish between "name (kanji)" and "taro (katakana)". Further, for example, it becomes difficult to distinguish between "Yu (Kanji)", "Ta (Katakana)", and "Ku (Katakana)".
これに対し、例えば、認識する文字の種別をユーザが切り替え可能にし、認識する文字の種別を制限して、重ね書きされる文字を精度よく認識しようとする場合が考えられる。この場合では、ユーザが1つの入力欄に多種の文字を含む文字列を書き込もうとする際、認識する文字の種別を切り替える操作を、ユーザが行うことになるため、ユーザの負担の増大化を招いてしまうという問題がある。 On the other hand, for example, it is conceivable that the user can switch the type of the character to be recognized, the type of the character to be recognized is limited, and the overwritten character is recognized with high accuracy. In this case, when the user tries to write a character string containing various characters in one input field, the user performs an operation of switching the type of the character to be recognized, which increases the burden on the user. There is a problem that it will be gone.
また、例えば、連続する2つの文字の組み合わせごとに、連続する2つの文字の一方の文字を書き込んだ後、他方の文字の書き込みに移行する際、入力欄上で書き込み位置がどこからどこに移動するかの正しい軌跡を示す辞書情報を用意しておく場合が考えられる。そして、1つの入力欄に書き込まれた複数の筆画から文字の候補を特定した後、辞書情報を参照し、いずれの候補が妥当であるかを判断して、文字を精度よく認識しようとする。 Also, for example, when one character of two consecutive characters is written for each combination of two consecutive characters and then the writing of the other character is started, where the writing position moves on the input field. It is conceivable to prepare dictionary information showing the correct trajectory of. Then, after identifying character candidates from a plurality of strokes written in one input field, the dictionary information is referred to to determine which candidate is appropriate, and an attempt is made to accurately recognize the character.
この場合では、認識する文字の種別が多くなるほど、文字の組み合わせの数が増大するため、膨大な文字の組み合わせについての辞書情報を用意することになるという問題がある。また、この場合では、連続する2つの文字が斜めに傾けて書き込まれると、入力欄上で書き込み位置が移動した実際の軌跡が、辞書情報が示す正しい軌跡と一致しないことがあり、重ね書きされる文字を正しく認識することができないという問題がある。 In this case, as the number of types of characters to be recognized increases, the number of character combinations increases, so that there is a problem that dictionary information about a huge number of character combinations is prepared. Further, in this case, if two consecutive characters are written at an angle, the actual locus of the movement of the writing position on the input field may not match the correct locus indicated by the dictionary information, and the characters are overwritten. There is a problem that the characters cannot be recognized correctly.
また、例えば、1つの入力欄に書き込まれた複数の筆画から文字の候補を特定した後、文脈上いずれの候補が妥当であるかを判断して、重ね書きされる文字を精度よく認識しようとする場合が考えられる。この場合では、特定した候補のうち、文脈上妥当である候補が複数存在すると、重ね書きされる文字を正しく認識することができないという問題がある。 Also, for example, after identifying character candidates from a plurality of strokes written in one input field, it is determined which candidate is appropriate in the context, and an attempt is made to accurately recognize the overwritten character. It is possible that you will. In this case, if there are a plurality of candidates that are valid in the context among the specified candidates, there is a problem that the overwritten characters cannot be recognized correctly.
そこで、本実施の形態では、認識する文字の種別を制限しなくても、ユーザによって1つの入力欄に重ね書きされる文字を精度よく認識可能にすることができる文字認識方法について説明する。 Therefore, in the present embodiment, a character recognition method capable of accurately recognizing characters overwritten in one input field by the user without limiting the types of characters to be recognized will be described.
図1の例では、情報処理装置100は、文字が重ね書きされる1つの入力欄110を表示する。また、図1の例では、ユーザは、手書きで入力欄110に、50音順のひらがなの各文字「あいう…」を重ね書きしていく場合を例に挙げる。
In the example of FIG. 1, the
(1-1)情報処理装置100は、入力欄110に書き込まれた筆画の軌跡を示す筆画データを蓄積する。情報処理装置100は、例えば、入力欄110に筆画が書き込まれる都度、筆画を検出し、筆画の軌跡を示す筆画データを取得して蓄積する。図1の例では、情報処理装置100は、具体的には、入力欄110に書き込まれた筆画111~115を検出し、筆画111~115の軌跡を示す筆画データを取得して蓄積する。
(1-1) The
(1-2)情報処理装置100は、蓄積した筆画データを参照して、入力欄110に書き込まれた、先行の筆画グループと、後続の筆画グループとの特徴量に基づいて、先行の筆画グループと、後続の筆画グループとの区切りについての妥当性スコアを算出する。筆画グループは、時系列順に連続する1以上の筆画を含むグループである。後続の筆画グループは、先行の筆画グループの直後に続く筆画グループである。筆画グループの特徴量は、例えば、筆画グループに含まれる先頭の筆画および末尾の筆画の入力欄110での位置である。また、筆画グループの特徴量は、例えば、筆画グループ全体の入力欄110での位置であってもよい。また、筆画グループの特徴量は、例えば、筆画グループに含まれる筆画の数であってもよい。
(1-2) The
妥当性スコアは、先行の筆画グループと後続の筆画グループとの区切りが、文字間の区切りである妥当性の強さを示すスコアである。妥当性スコアは、例えば、先行の筆画グループと後続の筆画グループとの筆画の位置関係や画数などの特徴が、先行の筆画グループと後続の筆画グループとの区切りが正しい場合に対応する特徴を表している度合いを示す。情報処理装置100は、例えば、いずれかの筆画間を区切りとし、先行の筆画グループと後続の筆画グループとのペアを1つ特定する。情報処理装置100は、例えば、それぞれの筆画間を区切りとし、先行の筆画グループと後続の筆画グループとのペアを複数特定してもよい。
The validity score is a score indicating the strength of validity that the delimiter between the preceding stroke group and the subsequent stroke group is the delimiter between characters. The validity score represents, for example, the characteristics corresponding to the case where the characteristics such as the positional relationship and the number of strokes of the strokes between the preceding stroke group and the succeeding stroke group correspond to the case where the division between the preceding stroke group and the succeeding stroke group is correct. Indicates the degree of stroke. The
図1の例では、情報処理装置100は、具体的には、入力欄110に書き込まれた筆画111~115を、筆画111~113を含む先行の筆画グループG1と、筆画114,115を含む後続の筆画グループG2とにグループ化する。情報処理装置100は、先行の筆画グループG1と、後続の筆画グループG2との特徴量を、所定のモデルModに入力し、所定のモデルModを用いて妥当性スコアを算出する。所定のモデルModは、2つの筆画グループの特徴量を入力すると、2つの筆画グループの区切りの妥当性スコアを出力するモデルである。所定のモデルModは、例えば、ニューラルネットワークを用いて実現される。
In the example of FIG. 1, the
(1-3)情報処理装置100は、蓄積した筆画データと、算出した妥当性スコアとに基づいて、入力欄110に書き込まれた1以上の文字を認識する。図1の例では、情報処理装置100は、具体的には、算出した妥当性スコアが一定以上であるため、先行の筆画グループG1に含まれる筆画111~113の合成結果の筆跡121から、文字「あ」を認識する。また、情報処理装置100は、後続の筆画グループG2に含まれる筆画114,115の合成結果の筆跡122から、文字「い」を認識する。
(1-3) The
これにより、情報処理装置100は、認識する文字の種別を制限しなくても、ユーザによって1つの入力欄に重ね書きされる文字を精度よく認識可能にすることができる。情報処理装置100は、例えば、認識する文字の種別が増加しても、文字の区切りがユーザから明示されずとも、1つの文字を形成する筆画の集まりを精度よく特定することができ、重ね書きされる文字を精度よく認識可能にすることができる。
As a result, the
また、情報処理装置100は、例えば、先行の筆画グループと後続の筆画グループとの特徴量を基に妥当性スコアを算出するため、1文字ずつの筆画の位置関係と、文字間の筆画の位置関係とを考慮可能にすることができる。このため、情報処理装置100は、ユーザが文字を斜めに傾けて書き込む傾向があっても、重ね書きされる文字を精度よく認識可能にすることができる。
Further, the
また、情報処理装置100は、例えば、先行の筆画グループと後続の筆画グループとの特徴量を基に、所定のモデルModを用いて、妥当性スコアを算出することができる。このため、情報処理装置100は、2つの文字の組み合わせごとに、前方の文字から後方の文字の書き込みに移行する際、書き込み位置がどこからどこに移動するかの正しい軌跡を示す辞書情報を記憶する場合に比べて、メモリ使用量の低減化を図ることができる。
Further, the
また、情報処理装置100は、例えば、認識結果になりうる文字列の候補が複数あり、いずれの候補も文脈上妥当であっても、ユーザの書き方から、いずれの候補における文字間の区切りが妥当であるかを判断可能にすることができる。このため、情報処理装置100は、重ね書きされる文字を精度よく認識可能にすることができる。
Further, in the
ここでは、算出した妥当性スコアが一定以上である場合について説明したが、これに限らない。例えば、情報処理装置100は、算出した妥当性スコアが一定未満である場合に、先行グループと後続グループとの別のペアについて、同様に妥当性スコアを算出し、別のペアに基づいて文字を認識する場合があってもよい。
Here, the case where the calculated validity score is above a certain level has been described, but the present invention is not limited to this. For example, when the calculated validity score is less than a certain value, the
また、ここでは、情報処理装置100が、先行の筆画グループと後続の筆画グループとを組み合わせたいずれか1つのペアについて妥当性スコアを算出し、妥当性スコアを基に文字を認識する場合について説明したが、これに限らない。例えば、情報処理装置100が、先行の筆画グループと後続の筆画グループとを組み合わせて考え得るすべてのペアについて妥当性スコアを算出し、妥当性スコアを基に文字を認識する場合があってもよい。
Further, here, the case where the
また、例えば、情報処理装置100は、妥当性スコアの他に、筆画グループに含まれる1以上の筆画の合成結果の筆跡が示す文字の候補の妥当性の強さを示す認識スコアを利用して、入力欄110に書き込まれた文字を認識する場合があってもよい。認識スコアが高いほど、筆画グループが形成する文字の候補が正しい確率が高く、筆画グループの区切りが正しい確率が高いことを示すことになる。具体的には、情報処理装置100は、図3に後述する辞書データベースに基づいて、認識スコアを算出する。これによれば、情報処理装置100は、さらに、重ね書きされる文字を精度よく認識可能にすることができる。
Further, for example, the
また、例えば、情報処理装置100は、妥当性スコアの他に、2つの筆画グループが形成する文字の組み合わせが、文脈に沿った組み合わせである妥当性の強さを示す文脈スコアを利用して、入力欄110に書き込まれた文字を認識する場合があってもよい。文脈スコアが高いほど、2つの筆画グループが形成する文字の組み合わせが正しい確率が高く、2つの筆画グループの区切りが正しい確率が高いことを示すことになる。具体的には、情報処理装置100は、図4に後述する文脈データベースに基づいて、文脈スコアを算出する。これによれば、情報処理装置100は、さらに、重ね書きされる文字を精度よく認識可能にすることができる。
Further, for example, the
また、ここでは、情報処理装置100が、入力欄110を表示し、入力欄110に書き込まれた筆画の軌跡を示す筆画データを取得して蓄積する場合について説明したが、これに限らない。例えば、情報処理装置100とは異なる装置が、入力欄110を表示し、入力欄110に書き込まれた筆画の軌跡を示す筆画データを取得して情報処理装置100に送信し、情報処理装置100が、受信した筆画データを蓄積する場合があってもよい。
Further, although the case where the
(情報処理装置100のハードウェア構成例)
次に、図2を用いて、情報処理装置100のハードウェア構成例について説明する。
(Hardware configuration example of information processing device 100)
Next, a hardware configuration example of the
図2は、情報処理装置100のハードウェア構成例を示すブロック図である。図2において、情報処理装置100は、CPU(Central Processing Unit)201と、メモリ202と、ネットワークI/F(Interface)203と、記録媒体I/F204と、記録媒体205と、タッチパネル206とを有する。また、各構成部は、バス200によってそれぞれ接続される。
FIG. 2 is a block diagram showing a hardware configuration example of the
ここで、CPU201は、情報処理装置100の全体の制御を司る。メモリ202は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)およびフラッシュROMなどを有する。具体的には、例えば、フラッシュROMやROMが各種プログラムを記憶し、RAMがCPU201のワークエリアとして使用される。メモリ202に記憶されるプログラムは、CPU201にロードされることで、コーディングされている処理をCPU201に実行させる。また、メモリ202は、例えば、図1に示したモデルModを記憶してもよい。また、メモリ202は、例えば、図3~図5に後述する各種データベースを記憶してもよい。
Here, the
ネットワークI/F203は、通信回線を通じてネットワーク210に接続され、ネットワーク210を介して他のコンピュータに接続される。そして、ネットワークI/F203は、ネットワーク210と内部のインターフェースを司り、他のコンピュータからのデータの入出力を制御する。ネットワークI/F203は、例えば、モデムやLAN(Local Area Network)アダプタなどである。
The network I /
記録媒体I/F204は、CPU201の制御に従って記録媒体205に対するデータのリード/ライトを制御する。記録媒体I/F204は、例えば、ディスクドライブ、SSD(Solid State Drive)、USB(Universal Serial Bus)ポートなどである。記録媒体205は、記録媒体I/F204の制御で書き込まれたデータを記憶する不揮発メモリである。記録媒体205は、例えば、ディスク、半導体メモリ、USBメモリなどである。記録媒体205は、情報処理装置100から着脱可能であってもよい。また、記録媒体205は、例えば、図1に示したモデルModを記憶してもよい。また、記録媒体205は、例えば、図3~図5に後述する各種データベースを記憶してもよい。
The recording medium I /
タッチパネル206は、ディスプレイを有する。ディスプレイは、例えば、文字が重ね書きされる入力欄を表示する。また、ディスプレイは、例えば、カーソル、アイコン、ツールボックス、文書、画像、または、機能情報などを表示してもよい。タッチパネル206は、タッチパネル206上のユーザの接触位置を検出する検出装置を有する。ユーザの接触位置は、例えば、ユーザの指の接触位置、または、ユーザが所持するスタイラスの接触位置などである。検出装置は、例えば、ディスプレイ上、または、ディスプレイ外周部に設けられる。検出装置は、例えば、抵抗膜方式、静電容量方式、超音波方式、光学方式、または、電磁誘導方式などを用いて、接触位置を検出する。タッチパネル206は、ユーザの接触位置に応じて、ディスプレイに表示された入力欄に書き込まれた筆画を検出し、筆画の軌跡を示す筆画データを取得する。また、タッチパネル206は、各種指示などの入力を受け付けてもよい。
The
情報処理装置100は、上述した構成部の他、例えば、キーボード、プリンタ、スキャナ、マイク、スピーカーなどを有してもよい。また、情報処理装置100は、記録媒体I/F204や記録媒体205を複数有していてもよい。また、情報処理装置100は、記録媒体I/F204や記録媒体205を有していなくてもよい。
The
また、情報処理装置100は、タッチパネル206に代わり、入力欄を表示するディスプレイと、入力欄に筆画を書き込むことが可能なポインティングデバイスとを有し、入力欄に書き込まれた筆画を検出し、筆画データを取得してもよい。ポインティングデバイスは、例えば、マウスである。
Further, the
(辞書データベース300の記憶内容)
次に、図3を用いて、辞書データベース300の記憶内容の一例について説明する。辞書データベース300は、例えば、図2に示した情報処理装置100のメモリ202や記録媒体205などの記憶領域により実現される。
(Stored contents of dictionary database 300)
Next, an example of the stored contents of the
図3は、辞書データベース300の記憶内容の一例を示す説明図である。図3に示すように、辞書データベース300は、文字と特徴とのフィールドを有する。辞書データベース300は、文字ごとに各フィールドに情報を設定することにより、辞書情報がレコードとして記憶される。
FIG. 3 is an explanatory diagram showing an example of the stored contents of the
文字のフィールドには、文字が設定される。文字のフィールドには、例えば、文字を示す文字コードが設定されてもよい。特徴のフィールドには、文字の特徴を示す特徴情報が設定される。文字の特徴は、例えば、文字全体が存在する入力欄での領域の特徴である。文字の特徴は、例えば、文字の筆画の方向の特徴、または、文字の筆画間での方向の変化の特徴などである。特徴情報は、例えば、文字を解析して得られる特徴量を示す。 Characters are set in the character field. For example, a character code indicating a character may be set in the character field. In the feature field, feature information indicating the feature of the character is set. Character characteristics are, for example, the characteristics of the area in the input field where the entire character is present. Character features are, for example, the characteristics of the direction of the stroke of the character, or the characteristics of the change in direction between the strokes of the character. The feature information indicates, for example, a feature amount obtained by analyzing characters.
(文脈データベース400の記憶内容)
次に、図4を用いて、文脈データベース400の記憶内容の一例について説明する。文脈データベース400は、例えば、図2に示した情報処理装置100のメモリ202や記録媒体205などの記憶領域により実現される。
(Memory contents of context database 400)
Next, an example of the stored contents of the
図4は、文脈データベース400の記憶内容の一例を示す説明図である。図4に示すように、文脈データベース400は、文字列と、確率とのフィールドを有する。文脈データベース400は、文字列ごとに各フィールドに情報を設定することにより、文脈情報がレコードとして記憶される。
FIG. 4 is an explanatory diagram showing an example of the stored contents of the
文字列のフィールドには、文字列である2つの文字が設定される。文字列のフィールドには、例えば、文字列である2つの文字のそれぞれの文字を示す文字コードが設定されてもよい。確率のフィールドには、2つの文字の文脈上の連続しやすさを示す度合い情報が設定される。確率のフィールドには、例えば、2つの文字のバイグラム確率が設定される。バイグラム確率は、ある文字の隣にある文字が並ぶ確率である。文脈データベース400は、2以上の文字を含む文字列について、語句や活用形、語幹などを利用して、2以上の文字の文脈上の連続しやすさを示す度合い情報を記憶してもよい。
Two characters, which are character strings, are set in the character string field. In the field of the character string, for example, a character code indicating each character of the two characters which is a character string may be set. In the probability field, degree information indicating the degree of continuity in the context of the two characters is set. In the probability field, for example, the bigram probability of two characters is set. The bigram probability is the probability that the characters next to a character will line up. The
(候補データベース500の記憶内容)
次に、図5を用いて、候補データベース500の記憶内容の一例について説明する。候補データベース500は、例えば、図2に示した情報処理装置100のメモリ202や記録媒体205などの記憶領域により実現される。
(Memory contents of candidate database 500)
Next, an example of the stored contents of the
図5は、候補データベース500の記憶内容の一例を示す説明図である。図5に示すように、候補データベース500は、1画目~M画目のそれぞれの項目に対応付けて、1画~N画のフィールドを有する。j画のフィールドは、1以上の認識候補のフィールドを有する。候補データベース500は、筆画ごとに各フィールドに情報を設定することにより、候補情報がレコードとして記憶される。
FIG. 5 is an explanatory diagram showing an example of the stored contents of the
i画目の項目は、入力欄に書き込まれたM画の筆画のうちi番目の筆画に対応する。iは、1,2,・・・,Mである。j画のフィールドには、i番目の筆画からj画分の筆画を合成した合成結果である筆跡が形成する文字の候補が設定される。jは、1,2,・・・,min(M-i+1,N)である。iがMに近づくにつれ、i画目より後ろに存在する筆画の数が少なくなるため、jの最大値は小さくなる。Nは、例えば、一般的な文字の最大画数が設定される。 The item of the i-th stroke corresponds to the i-th stroke of the stroke strokes of the M stroke written in the input field. i is 1, 2, ..., M. In the field of the j-stroke, a candidate for a character formed by a handwriting, which is a composite result of synthesizing the strokes of the j-th stroke from the i-th stroke, is set. j is 1, 2, ..., Min (M-i + 1, N). As i approaches M, the number of strokes existing after the i-th stroke decreases, so that the maximum value of j becomes smaller. For N, for example, the maximum number of strokes of a general character is set.
認識候補のフィールドには、i番目の筆画からj画分の筆画を合成した合成結果の筆跡が形成する文字の候補、および、i番目の筆画からj画分の筆画を合成した合成結果の筆跡が形成する文字の候補の妥当性を示す認識スコアが設定される。 In the recognition candidate fields, there are character candidates formed by the handwriting of the composition result of synthesizing the strokes of j strokes from the i-th stroke, and the handwriting of the composition result of synthesizing the strokes of j strokes from the i-th stroke. A recognition score is set to indicate the validity of the candidate characters formed by.
(情報処理装置100の機能的構成例)
次に、図6を用いて、情報処理装置100の機能的構成例について説明する。
(Example of functional configuration of information processing device 100)
Next, an example of a functional configuration of the
図6は、情報処理装置100の機能的構成例を示すブロック図である。情報処理装置100は、記憶部600と、取得部601と、特定部602と、妥当性スコア算出部603と、認識スコア算出部604と、文脈スコア算出部605と、重畳文字認識部606と、出力部607と、学習部608とを含む。
FIG. 6 is a block diagram showing a functional configuration example of the
記憶部600は、例えば、図2に示したメモリ202や記録媒体205などの記憶領域によって実現される。以下では、記憶部600が、情報処理装置100に含まれる場合について説明するが、これに限らない。例えば、記憶部600が、情報処理装置100とは異なる装置に含まれ、記憶部600の記憶内容が情報処理装置100から参照可能である場合があってもよい。
The
取得部601~学習部608は、制御部の一例として機能する。取得部601~学習部608は、具体的には、例えば、図2に示したメモリ202や記録媒体205などの記憶領域に記憶されたプログラムをCPU201に実行させることにより、または、ネットワークI/F203により、その機能を実現する。各機能部の処理結果は、例えば、図2に示したメモリ202や記録媒体205などの記憶領域に記憶される。
The
記憶部600は、各機能部の処理において参照され、または更新される各種情報を記憶する。記憶部600は、例えば、筆画データを記憶してもよい。筆画データは、1つの入力欄に書き込まれた筆画の軌跡を示すデータである。入力欄は、文字が重ね書きされる領域である。また、記憶部600は、例えば、筆画グループを記憶してもよい。筆画グループは、時系列順に連続する1以上の筆画を含むグループである。
The
記憶部600は、例えば、所定のモデルを記憶してもよい。所定のモデルは、2つの筆画グループの特徴量を入力すると、2つの筆画グループの区切りの妥当性スコアを出力するモデルである。所定のモデルは、例えば、ニューラルネットワークを用いて実現される。筆画グループの特徴量は、例えば、筆画グループに含まれる少なくともいずれかの筆画に基づく特徴量である。
The
筆画グループの特徴量は、例えば、筆画グループに含まれる先頭の筆画および末尾の筆画の少なくともいずれかの筆画の入力欄での位置である。また、筆画グループの特徴量は、例えば、筆画グループ全体の入力欄での位置であってもよい。また、筆画グループの特徴量は、例えば、筆画グループに含まれる筆画の数であってもよい。妥当性スコアは、2つの筆画グループの区切りが、文字間の区切りである妥当性の強さを示すスコアである。 The feature amount of the stroke group is, for example, the position in the input field of at least one of the first stroke and the last stroke included in the stroke group. Further, the feature amount of the stroke group may be, for example, a position in the input field of the entire stroke group. Further, the feature amount of the stroke group may be, for example, the number of strokes included in the stroke group. The validity score is a score indicating the strength of validity in which the delimiter between two stroke groups is a delimiter between characters.
記憶部600は、例えば、妥当性スコアを記憶してもよい。記憶部600は、例えば、筆画グループが形成する文字の候補および認識スコアを記憶してもよい。認識スコアは、例えば、筆画グループが形成する文字の候補の妥当性の強さを示すスコアである。認識スコアは、例えば、認識スコア算出部604によって算出される。認識スコアは、具体的には、最高値を100、最低値を0として、文字としての確からしさが高いほど数値が高くなるようなスコアである。記憶部600は、具体的には、図5に示した候補データベース500を記憶してもよい。記憶部600は、例えば、筆画グループが形成する文字の候補を生成し、認識スコアを算出するための情報を記憶してもよい。記憶部600は、具体的には、図3に示した辞書データベース300を記憶してもよい。
The
記憶部600は、例えば、2つの筆画グループが形成する文字の候補の組み合わせの文脈スコアを記憶してもよい。文脈スコアは、例えば、文字の候補の組み合わせが、文脈に沿った組み合わせである妥当性の強さを示すスコアである。文脈スコアは、例えば、文脈スコア算出部605によって算出される。文脈スコアは、具体的には、日本語であれば、文字の並びの日本語としての尤度が高いほど、数値が高くなるようなスコアである。例えば、「好き」と「女子き」という文字の並びがあれば、「好き」は「女子き」よりも日本語としての尤度が高いため、「好き」は「女子き」よりも算出される文脈スコアが高くなる。文脈スコアは、具体的には、バイグラム確率に基づいて算出される。記憶部600は、例えば、文脈スコアを算出するための情報を記憶してもよい。記憶部600は、具体的には、図4に示した文脈データベース400を記憶してもよい。
The
記憶部600は、例えば、教師データを記憶してもよい。教師データは、例えば、ペアにされた2つの筆画グループと、ペアにされた2つの筆画グループの区切りが、文字間の区切りとして妥当であるか否かを示す回答データとを対応付けて表すデータである。教師データは、所定のモデルを学習するためのデータである。教師データは、具体的には、ペアにされた2つの筆画グループのそれぞれの筆画グループの特徴量と、回答データとを対応付けて表すデータであってもよい。教師データは、所定のモデルを学習するためのデータである。記憶部600は、情報処理装置100で所定のモデルを学習しない場合、教師データを記憶しなくてよい。
The
取得部601は、各機能部の処理に用いられる各種情報を取得する。取得部601は、取得した各種情報を、記憶部600に記憶し、または、各機能部に出力する。また、取得部601は、記憶部600に記憶しておいた各種情報を、各機能部に出力してもよい。取得部601は、例えば、ユーザの操作入力に基づき、各種情報を取得する。取得部601は、例えば、情報処理装置100とは異なる装置から、各種情報を受信してもよい。
The
取得部601は、例えば、筆画データを蓄積する。取得部601は、具体的には、入力欄に筆画が書き込まれる都度、筆画を検出し、筆画の軌跡を示す筆画データを取得して記憶部600に蓄積する。また、取得部601は、例えば、教師データを取得してもよい。また、取得部601は、例えば、情報処理装置100で所定のモデルを学習しない場合、所定のモデルを取得してもよい。
The
特定部602は、蓄積した筆画データを参照して、入力欄に書き込まれた、複数の筆画グループを特定する。特定部602は、例えば、入力欄に書き込まれた、M画の筆画のうち、i画目の筆画からj画分の筆画を含む筆画グループを特定する。iは、1,2,・・・,Mである。jは、1,2,・・・,min(M-i+1,N)である。iがMに近づくにつれ、i画目より後ろに存在する筆画の数が少なくなるため、jの最大値は小さくなる。Nは、予め設定される。Nは、例えば、一般的な文字の最大画数が設定される。
The specifying
ここで、特定部602は、特定しうる筆画グループを複数またはすべて特定してもよいため、一部の筆画が重複して含まれる2以上の筆画グループを特定してもよい。これにより、特定部602は、文字を形成しうる筆画グループを特定することができ、妥当性スコア算出部603、認識スコア算出部604、および、文脈スコア算出部605の処理を実行可能にすることができる。
Here, since the specifying
妥当性スコア算出部603は、蓄積した筆画データを参照して、入力欄に書き込まれた、先行の筆画グループと、後続の筆画グループとの特徴量に基づいて、先行の筆画グループと、後続の筆画グループとの区切りについての妥当性スコアを算出する。後続の筆画グループは、先行の筆画グループの直後に続く筆画グループである。妥当性スコア算出部603は、例えば、先行の筆画グループと、後続の筆画グループとの特徴量を、所定のモデルに入力することにより、妥当性スコアを算出する。これにより、妥当性スコア算出部603は、1つの文字を形成する筆画の集まりを特定する指標となる区切りの尤もらしさを取得することができる。
The validity
妥当性スコア算出部603は、先行の筆画グループと、後続の筆画グループとを組み合わせた2つの筆画グループのペアごとに、ペアにされた2つの筆画グループの区切りの妥当性スコアを算出してもよい。ここで、妥当性スコア算出部603は、ペアにされた2つの筆画グループのそれぞれの筆画グループの特徴量に基づいて、ペアにされた2つの筆画グループの区切りの妥当性スコアを算出する。妥当性スコア算出部603は、例えば、ペアにされた2つの筆画グループのそれぞれの筆画グループの特徴量を、所定のモデルに入力することにより、妥当性スコアを算出する。これにより、妥当性スコア算出部603は、文字を形成する筆画の集まりの区切りを網羅的に検証することができ、1つの文字を形成する筆画の集まりを特定する指標となる区切りの尤もらしさを取得することができる。
Even if the validity
妥当性スコア算出部603は、具体的には、先行の筆画グループに含まれる末尾の筆画と、後続の筆画グループに含まれる先頭の筆画と、後続の筆画グループに含まれる末尾の筆画との少なくともいずれかの筆画の入力欄での位置に基づいて、妥当性スコアを算出してもよい。妥当性スコア算出部603は、より具体的には、先行の筆画グループに含まれる末尾の筆画の入力欄での位置と、後続の筆画グループに含まれる先頭の筆画および末尾の筆画の入力欄での位置を、所定のモデルに入力することにより、妥当性スコアを算出する。これにより、妥当性スコア算出部603は、文字の区切りとしての正しさが表れやすい、筆画の特徴に基づいて、妥当性スコアを精度よく算出可能にすることができる。また、妥当性スコア算出部603は、先行の筆画グループに含まれるすべての筆画と、後続の筆画グループに含まれるすべての筆画とを考慮する場合に比べて、処理量の低減化を図ることができる。
Specifically, the validity
妥当性スコア算出部603は、具体的には、さらに、先行の筆画グループに含まれる先頭の筆画の入力欄での位置に基づいて、妥当性スコアを算出してもよい。妥当性スコア算出部603は、より具体的には、さらに、先行の筆画グループに含まれる先頭の筆画の入力欄での位置を、所定のモデルに入力することにより、妥当性スコアを算出する。これにより、妥当性スコア算出部603は、妥当性スコアを算出する精度の向上を図ることができる。
Specifically, the validity
妥当性スコア算出部603は、具体的には、さらに、先行の筆画グループに含まれる筆画の数と、後続の筆画グループに含まれる筆画の数とに基づいて、妥当性スコアを算出してもよい。妥当性スコア算出部603は、より具体的には、さらに、先行の筆画グループに含まれる筆画の数と、後続の筆画グループに含まれる筆画の数とを、所定のモデルに入力することにより、妥当性スコアを算出する。これにより、妥当性スコア算出部603は、妥当性スコアを算出する精度の向上を図ることができる。
Specifically, the validity
妥当性スコア算出部603は、具体的には、さらに、先行の筆画グループ全体の入力欄での位置と、後続の筆画グループ全体の入力欄での位置とに基づいて、妥当性スコアを算出してもよい。妥当性スコア算出部603は、より具体的には、さらに、先行の筆画グループ全体の入力欄での位置と、後続の筆画グループ全体の入力欄での位置とを、所定のモデルに入力することにより、妥当性スコアを算出する。これにより、妥当性スコア算出部603は、妥当性スコアを算出する精度の向上を図ることができる。
Specifically, the validity
認識スコア算出部604は、蓄積した筆画データを参照して、先行の筆画グループが形成する文字の候補を生成し、先行の筆画グループが形成する文字の候補の妥当性の強さを示す認識スコアを算出する。認識スコア算出部604は、例えば、辞書データベース300を参照して、先行の筆画グループに含まれる1以上の筆画を合成した合成結果の筆跡の特徴量に対応する文字の候補を生成し、認識スコアを算出する。
The recognition
また、認識スコア算出部604は、蓄積した筆画データを参照して、後続の筆画グループが形成する文字の候補を生成し、後続の筆画グループが形成する文字の候補の妥当性の強さを示す認識スコアを算出する。認識スコア算出部604は、例えば、辞書データベース300を参照して、後続の筆画グループに含まれる1以上の筆画を合成した合成結果の筆跡の特徴量に対応する文字の候補を生成し、認識スコアを算出する。これにより、認識スコア算出部604は、認識スコアに基づいて、ユーザが書き込んだ文字がいずれの候補であるかを判断可能にすることができ、ユーザが書き込んだ文字を認識可能にすることができる。
Further, the recognition
認識スコア算出部604は、ペアのうち、算出した妥当性スコアが条件を満たすペアごとに、条件を満たすペアにされた2つの筆画グループのそれぞれの筆画グループが形成する文字の候補を生成し、認識スコアを算出してもよい。条件は、例えば、妥当性スコアが一定以上であることである。認識スコア算出部604は、例えば、辞書データベース300を参照して、それぞれの筆画グループに含まれる1以上の筆画を合成した合成結果の筆跡の特徴量に対応する文字の候補を生成し、認識スコアを算出する。これにより、認識スコア算出部604は、ユーザが書き込んだ文字を表す確率が相対的に低いペアについての処理を省略し、文字を認識する精度の低下を抑制しつつ、処理量の低減化を図ることができる。
The recognition
文脈スコア算出部605は、蓄積した筆画データを参照して、先行の筆画グループが形成する文字の候補と、後続の筆画グループが形成する文字の候補との組み合わせの文脈スコアを算出する。文脈スコア算出部605は、例えば、文脈データベース400を参照して、先行の筆画グループが形成する文字の候補と、後続の筆画グループが形成する文字の候補との組み合わせに対応するバイグラム確率に基づいて、文脈スコアを算出する。これにより、文脈スコア算出部605は、文字の候補のうち、文脈上尤もらしい文字を特定可能にすることができ、文字を認識する精度の向上を図ることができる。
The context
文脈スコア算出部605は、ペアのうち、算出した妥当性スコアが条件を満たすペアごとに、条件を満たすペアにされた2つの筆画グループのそれぞれの筆画グループが形成する文字の候補の組み合わせの文脈スコアを算出してもよい。文脈スコア算出部605は、例えば、文脈データベース400を参照して、それぞれの筆画グループが形成する文字の候補との組み合わせに対応するバイグラム確率に基づいて、文脈スコアを算出する。これにより、文脈スコア算出部605は、ユーザが書き込んだ文字を表す確率が相対的に低いペアについての処理を省略し、文字を認識する精度の低下を抑制しつつ、処理量の低減化を図ることができる。
The context
重畳文字認識部606は、蓄積した筆画データと、算出した妥当性スコアとに基づいて、入力欄に書き込まれた1以上の文字を認識する。重畳文字認識部606は、例えば、いずれかの2つの筆画グループについて算出した妥当性スコアが一定以上であれば、それぞれの筆画グループに含まれる1以上の筆画の合成結果の筆跡が示す文字を、入力欄に書き込まれた文字として認識する。これにより、重畳文字認識部606は、認識する文字の種別を制限せず、認識する文字の種別が増加しても、文字の区切りがユーザから明示されずとも、ユーザによって1つの入力欄に重ね書きされる文字を精度よく認識することができる。
The superimposed
重畳文字認識部606は、例えば、生成した候補および認識スコアと、算出した妥当性スコアとに基づいて、入力欄に書き込まれた1以上の文字を認識してもよい。重畳文字認識部606は、具体的には、認識スコアと妥当性スコアとに基づいて、2つの筆画グループのペアにおける文字の候補の組み合わせごとに総合スコアを算出する。そして、重畳文字認識部606は、総合スコアが最大の組み合わせである文字の候補を、入力欄に書き込まれた文字として認識する。ここで、重畳文字認識部606は、総合スコアが一定以上の組み合わせである文字の候補を、入力欄に書き込まれた文字の候補として認識してもよい。これにより、重畳文字認識部606は、認識スコアに基づき、ユーザによって1つの入力欄に重ね書きされる文字を、さらに精度よく認識することができる。
The superimposed
重畳文字認識部606は、例えば、算出した文脈スコアと、生成した候補および認識スコアと、算出した妥当性スコアとに基づいて、入力欄に書き込まれた1以上の文字を認識してもよい。重畳文字認識部606は、具体的には、文脈スコアと認識スコアと妥当性スコアとに基づいて、2つの筆画グループのペアにおける文字の候補の組み合わせごとに総合スコアを算出する。そして、重畳文字認識部606は、総合スコアが最大の組み合わせである文字の候補を、入力欄に書き込まれた文字として認識する。ここで、重畳文字認識部606は、総合スコアが一定以上の組み合わせである文字の候補を、入力欄に書き込まれた文字の候補として認識してもよい。これにより、重畳文字認識部606は、文脈スコアに基づき、ユーザによって1つの入力欄に重ね書きされる文字を、さらに精度よく認識することができる。
The superimposed
出力部607は、各種情報を出力する。出力形式は、例えば、ディスプレイへの表示、プリンタへの印刷出力、ネットワークI/F203による外部装置への送信、または、メモリ202や記録媒体205などの記憶領域への記憶である。各種情報は、例えば、いずれかの機能部の処理結果である。出力部607は、例えば、重畳文字認識部606の認識結果を出力する。これにより、出力部607は、ユーザが書き込んだ文字を利用可能にすることができる。また、出力部607は、認識した文字をユーザが確認可能にすることができる。
The
学習部608は、取得した教師データを利用して、ペアにされた2つの筆画グループのそれぞれの筆画グループの特徴量を入力すると、ペアにされた2つの筆画グループの区切りの妥当性スコアを出力する所定のモデルを学習する。学習部608は、学習モデルを記憶部600に記憶する。学習部608は、例えば、教師データが示すペアにされた2つの筆画グループのそれぞれの筆画グループの特徴量と、2つの筆画グループの区切りの正しさを示す回答データとを、ニューラルネットワークに入力する。
The
ここで、学習部608は、例えば、筆画グループの特徴量としては、筆画グループに含まれる少なくともいずれかの筆画に基づく特徴量を利用する。学習部608は、具体的には、筆画グループに含まれる先頭または末尾の筆画の特徴量を利用する。特徴量は、例えば、入力欄での位置である。また、学習部608は、具体的には、筆画グループに含まれるすべての筆画の特徴量、または、筆画グループに含まれる筆画の数などを利用してもよい。これにより、学習部608は、教師データを利用して、妥当性スコアを精度よく算出可能なモデルを学習することができ、モデルの生成にかかる作業負担の低減化を図ることができる。
Here, the
ここでは、情報処理装置100が、学習部608を有する場合について説明したが、これに限らない。例えば、情報処理装置100が、学習部608を有さない場合があってもよい。この場合、情報処理装置100は、自装置で所定のモデルを学習せず、所定のモデルを学習する他の装置から、所定のモデルを取得する。
Here, the case where the
(情報処理装置100の動作例)
次に、図7~図16を用いて、情報処理装置100の動作例について説明する。まず、図7および図8を用いて、情報処理装置100がニューラルネットワークを生成する一例について説明する。
(Operation example of information processing device 100)
Next, an operation example of the
図7および図8は、情報処理装置100がニューラルネットワークを生成する一例を示す説明図である。図7において、情報処理装置100は、例えば、正解を示す教師データをニューラルネットワークに学習させる。図7の例では、教師データは、入力欄700に書き込まれた筆画701~709を、筆画701~704を含む先行の筆画グループと、筆画705~709を含む後続の筆画グループとに区切る場合に対応する。
7 and 8 are explanatory views showing an example in which the
教師データは、先行の筆画グループの先頭の筆画、末尾の筆画、筆画グループ全体の位置を示す位置データAを含む。また、教師データは、後続の筆画グループの先頭の筆画、末尾の筆画、筆画グループ全体の位置を示す位置データBを含む。教師データは、先行の筆画グループに含まれる筆画の数を示す画数データCを含む。また、教師データは、後続の筆画グループに含まれる筆画の数を示す画数データDを含む。 The teacher data includes the first stroke of the preceding stroke group, the last stroke, and the position data A indicating the position of the entire stroke group. Further, the teacher data includes the first stroke of the subsequent stroke group, the last stroke, and the position data B indicating the position of the entire stroke group. The teacher data includes stroke number data C indicating the number of strokes included in the preceding stroke group. Further, the teacher data includes stroke number data D indicating the number of strokes included in the subsequent stroke group.
また、先行の筆画グループに含まれる筆画701~704を合成した合成結果の筆跡711は正しく文字「文」を形成し、かつ、後続の筆画グループに含まれる筆画705~709を合成した合成結果の筆跡712は正しく文字「字」を形成する。このため、教師データは、例えば、先行の筆画グループと後続の筆画グループとの区切りが、文字の区切りとして正しいことを示す回答データEを含む。
In addition, the
これにより、情報処理装置100は、ニューラルネットワークに、2つの筆画グループの区切りが文字間の区切りとして正しい場合に、2つの筆画グループに含まれる筆画の特徴がどのような状態になるかを学習させることができる。次に、図8の説明に移行する。
As a result, the
図8において、情報処理装置100は、例えば、不正解を示す教師データをニューラルネットワークに学習させる。図8の例では、教師データは、入力欄700に書き込まれた筆画701~709を、筆画701~705を含む先行の筆画グループと、筆画706~709を含む後続の筆画グループとに区切る場合に対応する。
In FIG. 8, the
教師データは、先行の筆画グループの先頭の筆画、末尾の筆画、筆画グループ全体の位置を示す位置データAを含む。また、教師データは、後続の筆画グループの先頭の筆画、末尾の筆画、筆画グループ全体の位置を示す位置データBを含む。教師データは、先行の筆画グループに含まれる筆画の数を示す画数データCを含む。また、教師データは、後続の筆画グループに含まれる筆画の数を示す画数データDを含む。 The teacher data includes the first stroke of the preceding stroke group, the last stroke, and the position data A indicating the position of the entire stroke group. Further, the teacher data includes the first stroke of the subsequent stroke group, the last stroke, and the position data B indicating the position of the entire stroke group. The teacher data includes stroke number data C indicating the number of strokes included in the preceding stroke group. Further, the teacher data includes stroke number data D indicating the number of strokes included in the subsequent stroke group.
また、先行の筆画グループに含まれる筆画701~705を合成した合成結果の筆跡811は文字「文」を形成せず、かつ、後続の筆画グループに含まれる筆画706~709を合成した合成結果の筆跡812は文字「字」を形成しない。このため、教師データは、例えば、先行の筆画グループと後続の筆画グループとの区切りが、文字の区切りとして正しくないことを示す回答データEを含む。
In addition, the
これにより、情報処理装置100は、ニューラルネットワークに、2つの筆画グループの区切りが文字間の区切りとして誤っている場合に、2つの筆画グループに含まれる筆画の特徴がどのような状態になるかを学習させることができる。このように、情報処理装置100は、ニューラルネットワークに、2つの筆画グループに含まれる筆画の特徴と、2つの筆画グループの区切りが文字間の区切りとして正しいか否かの関係についての各種性質を学習させることができる。
As a result, the
そして、情報処理装置100は、ニューラルネットワークが、2つの筆画グループの特徴量が入力されると、2つの筆画グループの区切りが文字の区切りとして尤もらしいほど1に近い値になるように、0~1の範囲の値を出力可能にすることができる。ここで、0~1の範囲の値は、例えば、そのまま、妥当性スコアとして利用される。0~1の範囲の値は、例えば、一定値αを乗算してから、妥当性スコアとして利用されてもよい。一定値αは、予め、文字認識のテストを実施することにより設定される。
Then, in the
したがって、情報処理装置100は、文字の区切りとして正しい場合の他に、文字の区切りとして誤っている場合についても、ニューラルネットワークに反映した上で、妥当性スコアを算出可能にすることができる。このため、情報処理装置100は、認識する文字の種別を制限しない場合であっても、1つの文字を形成する筆画の集まりを精度よく特定可能にする基準を得ることができる。
Therefore, the
ここでは、教師データが、先行の筆画グループの先頭の筆画、末尾の筆画、筆画グループ全体の位置を示す位置データAと、後続の筆画グループの先頭の筆画、末尾の筆画、筆画グループ全体の位置を示す位置データBとを含む場合について説明したが、これに限らない。例えば、教師データが、先行の筆画グループのすべての筆画、筆画グループ全体の位置を示す位置データAと、後続の筆画グループのすべての筆画、筆画グループ全体の位置を示す位置データBとを含む場合があってもよい。 Here, the teacher data is the position data A indicating the position of the first stroke, the last stroke, and the entire stroke group of the preceding stroke group, and the first stroke, the last stroke, and the position of the entire stroke group of the subsequent stroke group. The case where the position data B indicating the above is included has been described, but the present invention is not limited to this. For example, when the teacher data includes position data A indicating the positions of all strokes in the preceding stroke group and the entire stroke group, and position data B indicating the positions of all strokes in the subsequent stroke group and the entire stroke group. There may be.
次に、図9~図11を用いて、ニューラルネットワークに学習される、2つの筆画グループに含まれる筆画の特徴と、2つの筆画グループの区切りが文字間の区切りとして正しいか否かの関係についての性質の一例について説明する。 Next, using FIGS. 9 to 11, the characteristics of the strokes included in the two stroke groups learned by the neural network and the relationship between whether or not the division between the two stroke groups is correct as the division between characters. An example of the property of is described.
図9~図11は、ニューラルネットワークに学習される性質の一例を示す説明図である。図9において、入力欄900に、文字911と文字912とが続けて書き込まれる場合を例に挙げる。
9 to 11 are explanatory views showing an example of the property learned by the neural network. In FIG. 9, a case where a
この場合、文字911は、入力欄900内で、左側から書き始められて右側で書き終えられる傾向があり、上側から書き始められて下側で書き終えられる傾向がある。そして、文字912を書き込む際、同様に、文字912は、入力欄900内で、左側から書き始められて右側で書き終えられる傾向があり、上側から書き始められて下側で書き終えられる傾向がある。
In this case, the
このため、2つの筆画グループのそれぞれの筆画グループを合成した合成結果の筆跡の組み合わせが示す文字の書き方が、図9に示すような文字の書き方であれば、区切りが正しい確率が高くなるという性質が、ニューラルネットワークに学習される傾向がある。次に、図10の説明に移行する。 For this reason, if the writing style of the characters indicated by the combination of the handwritings of the composite result obtained by synthesizing the stroke group of each of the two stroke groups is the writing style of the characters as shown in FIG. 9, the probability that the delimiter is correct is high. However, it tends to be learned by neural networks. Next, the description proceeds to FIG.
図10において、入力欄1000に、文字1010が書き込まれる場合、および、文字列1030が書き込まれる場合を例に挙げる。文字1010は、「名(漢字)」である。文字列1030は、「タロ(カタカナ)」である。
In FIG. 10, a case where a
この場合、文字1010を、誤って部分1021と部分1022とに区切ると、部分1021と部分1022とは入力欄1000内で偏った位置に存在する傾向がある。一方で、文字列1030を、正しく文字1041と文字1042とに区切れば、文字1041と文字1042とは、入力欄1000内で中央に存在する傾向がある。
In this case, if the
このため、2つの筆画グループのそれぞれの筆画グループ全体の位置が、入力欄1000の中央に存在すれば、区切りが正しい確率が高くなるという性質が、ニューラルネットワークに学習される傾向がある。次に、図11の説明に移行する。
Therefore, if the position of the entire stroke group of each of the two stroke groups exists in the center of the
図11において、入力欄1100に、筆画群1111が書き込まれる場合、および、筆画群1112が書き込まれる場合を例に挙げる。ここで、筆画群1111のように、入力欄1100の下側に存在する3画以下の筆画群は、句読点や3点リーダなどである可能性がある。一方で、入力欄1100の下側に存在しても4画以上の筆画群は、3画以下である場合に比べて、文字の一部である可能性が高い。
In FIG. 11, a case where the
また、筆画群1112のように、上側に存在する3画以上の筆画群は、下側に存在する場合に比べて、文字の一部である可能性が高い。一方で、上側に存在しても2画以下の筆画群は、引用符号である可能性がある。このため、2つの筆画グループのそれぞれの筆画グループ全体の位置、および、筆画グループに含まれる筆画の数が、区切りの正しさと関係するという性質が、ニューラルネットワークに学習される傾向がある。例えば、筆画グループ全体の位置に偏りがある場合、筆画グループに含まれる筆画の数が多いほど、区切りが正しい確率が低くなるという性質が、ニューラルネットワークに学習される傾向がある。
Further, the stroke group having three or more strokes existing on the upper side, such as the
次に、図12を用いて、情報処理装置100が入力画面1200を表示する一例について説明する。
Next, an example in which the
図12は、情報処理装置100が入力画面1200を表示する一例を示す説明図である。図12において、情報処理装置100は、入力画面1200を表示する。入力画面1200は、ユーザが文字を重ね書きする入力欄1201と、書き込まれた文字の認識結果を示す表示欄1202とを含む。これにより、情報処理装置100は、ユーザからの文字の書き込みを受け付ける。
FIG. 12 is an explanatory diagram showing an example in which the
次に、図13~図15を用いて、情報処理装置100が文字を認識する一例について説明する。
Next, an example in which the
図13~図15は、情報処理装置100が文字を認識する一例を示す説明図である。情報処理装置100は、入力欄1201に筆画が書き込まれる都度、書き込まれた筆画を検出し、筆画の軌跡を示す筆画データを取得する。情報処理装置100は、例えば、タッチパネル206から、時系列のポインティング座標を含む座標列情報を、筆画データとして取得する。座標列情報は、例えば、(x,y)のようなポインティング座標を示す座標情報の配列である。座標情報は、例えば、30m秒などの周期ごとに1点ずつ得られる。座標列情報は、例えば、タッチパネル206に指やスタイラスが押下されてから、離されるまでの軌跡を示す1以上の座標情報を含む。
13 to 15 are explanatory views showing an example in which the
図13~図15の例では、情報処理装置100が、入力欄1201に書き込まれた筆画1301~1305などの軌跡を示す筆画データを順に取得する場合において、筆画1305の軌跡を示す筆画データを取得した時点を例に挙げる。
In the example of FIGS. 13 to 15, when the
ここで、情報処理装置100は、特定しうる筆画グループをすべて特定し、それぞれの筆画グループが示す筆跡を特定する。情報処理装置100は、筆画1301を含む筆画グループを特定し、筆画1301が示す筆跡1310を特定する。また、情報処理装置100は、筆画1301,1302を含む筆画グループを特定し、筆画1301,1302が示す筆跡1320を特定する。
Here, the
また、情報処理装置100は、筆画1301~1303を含む筆画グループを特定し、筆画1301~1303が示す筆跡1330を特定する。また、情報処理装置100は、筆画1301~1304を含む筆画グループを特定し、筆画1301~1304が示す筆跡1340を特定する。また、情報処理装置100は、筆画1301~1305を含む筆画グループを特定し、筆画1301~1305が示す筆跡1350を特定する。
Further, the
また、情報処理装置100は、筆画1302を含む筆画グループを特定し、筆画1302が示す筆跡1360を特定する。また、情報処理装置100は、筆画1302,1303を含む筆画グループを特定し、筆画1302,1303が示す筆跡1370を特定する。また、情報処理装置100は、同様に、他の筆画グループを特定し、他の筆跡を特定する。次に、図14の説明に移行する。
Further, the
図14において、情報処理装置100は、辞書データベース300を参照して、特定した筆跡が示す文字の候補を特定して認識スコアを算出し、候補データベース500に記憶する。情報処理装置100は、例えば、筆跡1310が示す文字の候補として「─(罫線)」、「一(漢字)」、「-(記号)」などを特定して認識スコアを算出し、候補データベース500の1画目の項目の1画のフィールドに設定する。
In FIG. 14, the
また、情報処理装置100は、例えば、筆跡1320が示す文字の候補として「+(記号)」、「ナ(カタカナ)」、「十(漢字)」などを特定して認識スコアを算出し、候補データベース500の1画目の項目の2画のフィールドに設定する。また、情報処理装置100は、同様に、他の筆跡が示す文字の候補および認識スコアを、候補データベース500に記憶する。次に、図15の説明に移行する。
Further, the
図15において、情報処理装置100は、文脈データベース400を参照して、筆跡が示す文字の候補の組み合わせごとに、文脈スコアを算出する。組み合わせは、例えば、筆跡1310が示す文字の候補と、筆跡1360が示す文字の候補の組み合わせである。組み合わせは、例えば、筆跡1360が示す文字の候補と、筆跡1500が示す文字の候補の組み合わせである。組み合わせは、例えば、筆跡1320が示す文字の候補と、筆跡1500が示す文字の候補の組み合わせである。
In FIG. 15, the
情報処理装置100は、先頭の筆画から末尾の筆画までで形成される連続する1以上の筆跡が示す文字の候補を並べた候補列の、隣接する候補間のバイグラム確率を乗算して、一定値Cを乗算して、候補列全体での文脈スコアを算出する。そして、情報処理装置100は、候補列全体での文脈スコアを、候補列に含まれる文字の候補の組み合わせごとの文脈スコアとして利用する。情報処理装置100は、筆跡が示す文字の候補の組み合わせのバイグラム確率を、そのまま文脈スコアとして利用してもよい。
The
また、情報処理装置100は、ニューラルネットワークを利用して、筆跡の元である筆画グループのペアごとに、妥当性スコアを算出する。情報処理装置100は、ペアにされた筆画グループの特徴量を、ニューラルネットワークに入力することにより、妥当性スコアを算出する。
Further, the
そして、情報処理装置100は、筆跡が示す文字の候補の組み合わせごとの認識スコアおよび文脈スコアと、筆跡の元である筆画グループのペアの妥当性スコアとに基づいて、筆跡が示す文字の候補の組み合わせごとの総合スコアを算出する。総合スコアは、例えば、認識スコアと、文脈スコアと、妥当性スコアとの合計である。総合スコアは、総合的に、いずれの筆画グループが正しく区切られた筆画グループであるかを示し、いずれの候補が書き込まれた文字として相応しい候補であるかを示すことになる。
Then, the
情報処理装置100は、総合スコアが最大である文字の候補の組み合わせを、入力欄1201に書き込まれた文字として認識する。これにより、情報処理装置100は、入力欄1201に書き込まれた文字を、リアルタイムに、精度よく認識することができる。
The
ここで、情報処理装置100は、図13~図15に示す処理を実行する場合、ビタービアルゴリズムなどの効率的な最適化アルゴリズムを用いることが好ましい。これによれば、情報処理装置100は、必ずしもすべての組み合わせについて各種スコアを算出しなくてもよく、処理量の低減化を図ることができる。
Here, when the
ここで、情報処理装置100は、妥当性スコアに基づいて、一部の認識スコアおよび文脈スコアの算出を省略してもよい。これによれば、情報処理装置100は、ユーザが書き込んだ文字を表す確率が相対的に低いペアについての処理を省略し、文字を認識する精度の低下を抑制しつつ、処理量の低減化を図ることができる。
Here, the
ここでは、情報処理装置100が、筆画グループのペアに対応する2つの筆跡が示す文字の候補の組み合わせごとに文脈スコアを算出する場合について説明したが、これに限らない。例えば、情報処理装置100が、最初の筆画から最後の筆画までのうち、時系列に連続する複数の筆跡が示す文字の候補の組み合わせごとに、文脈スコアを算出する場合があってもよい。
Here, the case where the
次に、図16を用いて、情報処理装置100が文字を認識した結果の一例について説明する。
Next, an example of the result of the
図16は、情報処理装置100が文字を認識した結果の一例を示す説明図である。例えば、入力欄1201に「名」という字が書き込まれる場合と、入力欄1201に「タロ」という字が重ね書きされる場合との筆跡は類似する傾向がある。ここで、「名」という字を書いた場合、「タ」と「ロ」の領域は重なっており、領域が重なるか否かを考慮するだけでは、「タロ」という字と区別することが難しい。また、文脈上も、「名は右側です」と「タロは右側です」とのように、いずれの字と認識しても妥当である場合がある。
FIG. 16 is an explanatory diagram showing an example of the result of the
このため、従来では、「名」という字が書き込まれた場合、「名」という字を途中で誤って区切り、「名」という字の筆跡は「タロ(カタカナ)」として尤もらしいと誤って判断されることがある。このため、「名」という字が、誤って「タロ(カタカナ)」と認識されてしまうことがある。 For this reason, in the past, when the character "name" was written, the character "name" was mistakenly separated in the middle, and the handwriting of the character "name" was mistakenly judged to be plausible as "taro (katakana)". May be done. Therefore, the character "name" may be mistakenly recognized as "taro (katakana)".
これに対し、情報処理装置100は、ニューラルネットワークに、誤って文字を区切った場合についても反映させ、「タ」と「ロ」の重なりが浅い場合は「タ」と「ロ」の間の区切りが間違っていると学習させることができる。一方で、情報処理装置100は、ニューラルネットワークに、正しく文字を区切った場合についても反映させ、「タ」と「ロ」が重ね書きされ、「タ」と「ロ」の重なりが深い場合は、「タ」と「ロ」の区切りは正しいと学習させることができる。
On the other hand, the
これにより、情報処理装置100は、例えば、筆跡1601のように、「名」という字が書き込まれた場合であれば、妥当性スコアに基づき、筆跡1601を途中で区切らないことが好ましいと判断して、「名(漢字)」を認識することができる。一方で、情報処理装置100は、例えば、筆跡1602のように、「タロ」という字が書き込まれた場合であれば、筆跡1602を2文字分に区切ることが好ましいと判断して、「タロ(カタカナ)」を認識することができる。このように、情報処理装置100は、ニューラルネットワークに、誤って文字を区切った場合についても反映させており、精度よく文字を認識することができる。
As a result, the
また、認識する文字の種別を制限せずに、日本語の入力に対応する場合、認識する文字の数が7000以上になることがある。このため、従来では、文字の組み合わせごとに、入力欄上で書き込み位置がどこからどこに移動するかの正しい軌跡を示す辞書情報を用意しようとすると、辞書情報が膨大になってしまう。これに対し、情報処理装置100は、ニューラルネットワークを利用するため、数キロバイト程度にメモリ使用量を抑制することができる。また、情報処理装置100は、ニューラルネットワークを利用し、1文字ずつの筆画の位置関係と、文字間の筆画の位置関係とを総合的に考慮して、妥当性スコアを算出することができる。このため、情報処理装置100は、ユーザが文字を斜めに傾けて書き込む傾向があっても、重ね書きされる文字を精度よく認識可能にすることができる。
Further, when Japanese input is supported without limiting the types of characters to be recognized, the number of characters to be recognized may be 7,000 or more. For this reason, conventionally, if it is attempted to prepare dictionary information indicating a correct trajectory of where the writing position moves on the input field for each combination of characters, the dictionary information becomes enormous. On the other hand, since the
ここでは、情報処理装置100が、入力欄1201に筆画が書き込まれる都度、図13~図15に示す処理を実行する場合について説明したが、これに限らない。例えば、情報処理装置100が、筆画を検出してから数ミリ秒後までの間に、次の筆画が書き込まれない場合に、図13~図15に示す処理を実行する場合があってもよい。
Here, the case where the
ここでは、入力欄1201に文字が重ね書きされる場合について説明したが、これに限らない。例えば、入力欄1201に文字が並べて書き込まれる場合があってもよい。この場合、情報処理装置100は、ニューラルネットワークに、正しく文字を区切る場合と、誤って文字を区切る場合とを学習させる。具体的には、情報処理装置100は、入力欄1201に「タロ」という字が近づけて書き込まれた場合に、「タロ」を2文字に区切ることが正しいことを、ニューラルネットワークに学習させる。また、情報処理装置100は、入力欄1201に「名」という字が書き込まれた場合に、「名」を区切らないことが正しいことを、ニューラルネットワークに学習させる。
Here, the case where characters are overwritten in the
(全体処理手順)
次に、図17を用いて、情報処理装置100が実行する、全体処理手順の一例について説明する。全体処理は、例えば、図2に示したCPU201と、メモリ202や記録媒体205などの記憶領域と、ネットワークI/F203とによって実現される。
(Overall processing procedure)
Next, an example of the overall processing procedure executed by the
図17は、全体処理手順の一例を示すフローチャートである。図17において、情報処理装置100は、筆画データを取得する(ステップS1701)。そして、情報処理装置100は、取得した筆画データを蓄積する(ステップS1702)。
FIG. 17 is a flowchart showing an example of the overall processing procedure. In FIG. 17, the
次に、情報処理装置100は、蓄積した筆画データを参照して、時系列順に連続する1以上の筆画を含む筆画グループを、すべて特定する(ステップS1703)。そして、情報処理装置100は、特定した筆画グループごとに文字認識を実施し、それぞれの筆画グループに含まれる1以上の筆画の合成結果である筆跡が示す文字の候補および認識スコアを取得する(ステップS1704)。
Next, the
次に、情報処理装置100は、筆画グループの組み合わせごとに、筆画グループの組み合わせに対応する文字の候補の組み合わせの文脈スコアを算出する(ステップS1705)。そして、情報処理装置100は、ニューラルネットワークを利用して、筆画グループの組み合わせごとの妥当性スコアを算出する(ステップS1706)。
Next, the
次に、情報処理装置100は、筆画グループの組み合わせに対応する文字の候補の組み合わせごとに、認識スコアと文脈スコアと妥当性スコアとに基づく総合スコアを算出する(ステップS1707)。そして、情報処理装置100は、総合スコアが最大の文字の候補の組み合わせを出力する(ステップS1708)。その後、情報処理装置100は、ステップS1701の処理に戻る。
Next, the
ここで、情報処理装置100は、図17の一部ステップの処理の順序を入れ替えて実行してもよい。例えば、情報処理装置100は、ステップS1706の処理を、ステップS1704,S1705の処理より先に実行してもよい。また、情報処理装置100は、図17の一部ステップの処理を省略してもよい。例えば、情報処理装置100は、妥当性スコアが一定以下である筆画グループの組み合わせについては、ステップS1704,S1705の処理を省略してもよい。
Here, the
以上説明したように、情報処理装置100によれば、文字が重ね書きされる1つの入力欄に書き込まれた筆画の軌跡を示す筆画データを蓄積することができる。情報処理装置100によれば、蓄積した筆画データを参照して、入力欄に書き込まれた、先行の筆画グループと、後続の筆画グループとの特徴量に基づいて、先行の筆画グループと後続の筆画グループとの区切りの妥当性スコアを算出することができる。情報処理装置100によれば、蓄積した筆画データと、算出した妥当性スコアとに基づいて、入力欄に書き込まれた1以上の文字を認識することができる。これにより、情報処理装置100は、認識する文字の種別が増加しても、文字の区切りがユーザから明示されずとも、1つの文字を形成する筆画の集まりを精度よく特定することができ、重ね書きされる文字を精度よく認識可能にすることができる。
As described above, according to the
情報処理装置100によれば、蓄積した筆画データを参照して、先行の筆画グループが形成する文字の候補を生成し、先行の筆画グループが形成する文字の候補の認識スコアを算出することができる。情報処理装置100によれば、蓄積した筆画データを参照して、後続の筆画グループが形成する文字の候補を生成し、後続の筆画グループが形成する文字の候補の認識スコアを算出することができる。情報処理装置100によれば、生成した候補および算出した認識スコアと、算出した妥当性スコアとに基づいて、入力欄に書き込まれた1以上の文字を認識することができる。これにより、情報処理装置100は、認識スコアを利用して、重ね書きされる文字をさらに精度よく認識可能にすることができる。
According to the
情報処理装置100によれば、蓄積した筆画データを参照して、先行の筆画グループが形成する文字の候補と、後続の筆画グループが形成する文字の候補との組み合わせの文脈スコアを算出することができる。情報処理装置100によれば、算出した文脈スコアと、生成した候補および算出した認識スコアと、算出した妥当性スコアとに基づいて、入力欄に書き込まれた1以上の文字を認識することができる。これにより、情報処理装置100は、文脈スコアを利用して、重ね書きされる文字をさらに精度よく認識可能にすることができる。
According to the
情報処理装置100によれば、入力欄に書き込まれた、先行の筆画グループと後続の筆画グループとを組み合わせた2つの筆画グループのペアごとに、ペアにされた2つの筆画グループの区切りの妥当性スコアを算出することができる。これにより、情報処理装置100は、文字を形成する筆画の集まりの区切りを網羅的に検証することができ、1つの文字を形成する筆画の集まりを精度よく特定することができ、重ね書きされる文字を精度よく認識可能にすることができる。
According to the
情報処理装置100によれば、ペアのうち、算出した妥当性スコアが条件を満たすペアごとに、認識スコアを算出することができる。情報処理装置100によれば、ペアのうち、算出した妥当性スコアが条件を満たすペアごとに、文脈スコアを算出することができる。これにより、情報処理装置100は、ユーザが書き込んだ文字を表す確率が相対的に低いペアについての処理を省略し、文字を認識する精度の低下を抑制しつつ、処理量の低減化を図ることができる。
According to the
情報処理装置100によれば、先行の筆画グループに含まれる末尾の筆画の入力欄での位置と、後続の筆画グループに含まれる先頭の筆画および末尾の筆画の入力欄での位置とに基づいて、妥当性スコアを算出することができる。これにより、情報処理装置100は、先行の筆画グループに含まれるすべての筆画と、後続の筆画グループに含まれるすべての筆画とを考慮する場合に比べて、処理量の低減化を図ることができる。
According to the
情報処理装置100によれば、さらに、先行の筆画グループに含まれる先頭の筆画に基づいて、妥当性スコアを算出することができる。これにより、情報処理装置100は、妥当性スコアを算出する精度の向上を図ることができる。
Further, according to the
情報処理装置100によれば、さらに、先行の筆画グループに含まれる筆画の数と、後続の筆画グループに含まれる筆画の数とに基づいて、妥当性スコアを算出することができる。これにより、情報処理装置100は、妥当性スコアを算出する精度の向上を図ることができる。
Further, according to the
情報処理装置100によれば、さらに、先行の筆画グループ全体の入力欄での位置と、後続の筆画グループ全体の入力欄での位置とに基づいて、妥当性スコアを算出することができる。これにより、情報処理装置100は、妥当性スコアを算出する精度の向上を図ることができる。
Further, according to the
情報処理装置100によれば、ペアにされた2つの筆画グループと、ペアにされた2つの筆画グループの区切りが文字間の区切りとして妥当であるか否かとを対応付けて表す教師データを取得することができる。情報処理装置100によれば、取得した教師データを利用して、ペアにされた2つの筆画グループのそれぞれの筆画グループの特徴量を入力すると、ペアにされた2つの筆画グループの区切りの妥当性スコアを出力するモデルを学習することができる。情報処理装置100によれば、学習したモデルを利用して、先行の筆画グループと、後続の筆画グループとの特徴量に基づいて、先行の筆画グループと後続の筆画グループとの区切りの妥当性スコアを算出することができる。これにより、情報処理装置100は、文字の区切りの性質を学習したニューラルネットワークを利用して、妥当性スコアを精度よく算出可能にすることができる。
According to the
なお、本実施の形態で説明した文字認識方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。本実施の形態で説明した文字認識プログラムは、ハードディスク、フレキシブルディスク、CD-ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、本実施の形態で説明した文字認識プログラムは、インターネット等のネットワークを介して配布してもよい。 The character recognition method described in this embodiment can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. The character recognition program described in this embodiment is recorded on a computer-readable recording medium such as a hard disk, flexible disk, CD-ROM, MO, or DVD, and is executed by being read from the recording medium by the computer. Further, the character recognition program described in this embodiment may be distributed via a network such as the Internet.
上述した実施の形態に関し、さらに以下の付記を開示する。 The following additional notes are further disclosed with respect to the above-described embodiment.
(付記1)入力欄に書き込まれた筆画の軌跡を示す筆画データを蓄積し、
蓄積した前記筆画データを参照して、前記入力欄に書き込まれた、時系列順に連続する1以上の筆画を含む先行の筆画グループと、前記先行の筆画グループの直後に続く、時系列順に連続する1以上の筆画を含む後続の筆画グループとの特徴量に基づいて、前記先行の筆画グループと前記後続の筆画グループとの区切りが、文字間の区切りである妥当性の強さを示す妥当性スコアを算出し、
蓄積した前記筆画データと、算出した前記妥当性スコアとに基づいて、前記入力欄に書き込まれた1以上の文字を認識する、
制御部を有することを特徴とする情報処理装置。
(Appendix 1) Accumulate stroke data showing the trajectory of the stroke written in the input field.
With reference to the accumulated stroke data, the preceding stroke group containing one or more consecutive strokes written in the input field in chronological order and the preceding stroke group immediately following the preceding stroke group are continuous in chronological order. A validity score indicating the strength of validity that the division between the preceding stroke group and the subsequent stroke group is a division between characters based on the feature amount of the subsequent stroke group including one or more strokes. Is calculated,
Recognizes one or more characters written in the input field based on the accumulated stroke data and the calculated validity score.
An information processing device characterized by having a control unit.
(付記2)前記入力欄は、文字が重ね書きされる領域である、ことを特徴とする付記1に記載の情報処理装置。
(Supplementary Note 2) The information processing apparatus according to
(付記3)前記制御部は、
蓄積した前記筆画データを参照して、前記先行の筆画グループが形成する文字の候補および前記先行の筆画グループが形成する文字の候補の妥当性の強さを示す認識スコアと、前記後続の筆画グループが形成する文字の候補および前記後続の筆画グループが形成する文字の候補の妥当性の強さを示す認識スコアとを生成し、
生成した前記候補および前記認識スコアと、算出した前記妥当性スコアとに基づいて、前記入力欄に書き込まれた1以上の文字を認識する、ことを特徴とする付記1または2に記載の情報処理装置。
(Appendix 3) The control unit is
With reference to the accumulated stroke data, a recognition score indicating the strength of the validity of the character candidates formed by the preceding stroke group and the character candidates formed by the preceding stroke group, and the subsequent stroke group. Generates a recognition score that indicates the strength of the validity of the character candidates formed by and the character candidates formed by the subsequent stroke group.
The information processing according to
(付記4)前記制御部は、
蓄積した前記筆画データを参照して、前記先行の筆画グループが形成する文字の候補と、前記後続の筆画グループが形成する文字の候補との組み合わせが、文脈に沿った組み合わせである妥当性の強さを示す文脈スコアを算出し、
算出した前記文脈スコアと、生成した前記候補および前記認識スコアと、算出した前記妥当性スコアとに基づいて、前記入力欄に書き込まれた1以上の文字を認識する、ことを特徴とする付記3に記載の情報処理装置。
(Appendix 4) The control unit is
With reference to the accumulated stroke data, the combination of the character candidate formed by the preceding stroke group and the character candidate formed by the subsequent stroke group has a strong validity as a contextual combination. Calculate the context score to indicate
Addendum 3 characterized in that one or more characters written in the input field are recognized based on the calculated context score, the generated candidate and the recognition score, and the calculated validity score. The information processing device described in.
(付記5)前記制御部は、
前記入力欄に書き込まれた、時系列順に連続する1以上の筆画を含む先行の筆画グループと、前記先行の筆画グループの直後に続く、時系列順に連続する1以上の筆画を含む後続の筆画グループとを組み合わせた2つの筆画グループのペアごとに、前記ペアにされた2つの筆画グループのそれぞれの筆画グループの特徴量に基づいて、前記ペアにされた2つの筆画グループの区切りが、文字間の区切りである妥当性の強さを示す妥当性スコアを算出する、ことを特徴とする付記4に記載の情報処理装置。
(Appendix 5) The control unit is
A preceding stroke group containing one or more consecutive strokes in chronological order written in the input field, and a subsequent stroke group containing one or more consecutive strokes in chronological order immediately following the preceding stroke group. For each pair of two stroke groups in combination with, the division of the two stroke groups in the pair is between characters based on the feature amount of each stroke group of the two stroke groups in the pair. The information processing apparatus according to Appendix 4, wherein a validity score indicating the strength of validity, which is a delimiter, is calculated.
(付記6)前記制御部は、
前記ペアのうち、算出した前記妥当性スコアが条件を満たすペアごとに、前記条件を満たすペアにされた2つの筆画グループのそれぞれの筆画グループが形成する文字の候補および前記条件を満たすペアにされた2つの筆画グループのそれぞれの筆画グループが形成する文字の候補の妥当性を示す認識スコアを生成し、
前記ペアのうち、前記条件を満たすペアごとに、前記条件を満たすペアにされた2つの筆画グループのそれぞれの筆画グループが形成する文字の候補の組み合わせが、文脈に沿った組み合わせである妥当性の強さを示す文脈スコアを算出する、ことを特徴とする付記5に記載の情報処理装置。
(Appendix 6) The control unit is
Of the pairs, for each pair whose validity score is satisfied, the character candidates formed by each stroke group of the two stroke groups made into the pair satisfying the above condition and the pair satisfying the above condition are set. Generates a recognition score that indicates the validity of the character candidates formed by each of the two stroke groups.
Of the pairs, for each pair that satisfies the conditions, the combination of character candidates formed by each stroke group of the two stroke groups that satisfy the conditions is a contextual combination. The information processing apparatus according to Appendix 5, wherein a context score indicating strength is calculated.
(付記7)前記制御部は、
前記先行の筆画グループに含まれる末尾の筆画と、前記後続の筆画グループに含まれる先頭の筆画と、前記後続の筆画グループに含まれる末尾の筆画との少なくともいずれかの筆画の前記入力欄での位置に基づいて、前記先行の筆画グループと前記後続の筆画グループとの区切りが、文字間の区切りである妥当性の強さを示す妥当性スコアを算出する、ことを特徴とする付記1~6のいずれか一つに記載の情報処理装置。
(Appendix 7) The control unit is
In the input field of at least one of the last stroke included in the preceding stroke group, the first stroke included in the subsequent stroke group, and the last stroke included in the subsequent stroke group.
(付記8)前記制御部は、
さらに、前記先行の筆画グループに含まれる先頭の筆画の前記入力欄での位置に基づいて、前記先行の筆画グループと前記後続の筆画グループとの区切りが、文字間の区切りである妥当性の強さを示す妥当性スコアを算出する、ことを特徴とする付記7に記載の情報処理装置。
(Appendix 8) The control unit is
Further, based on the position of the first stroke included in the preceding stroke group in the input field, the division between the preceding stroke group and the subsequent stroke group has a strong validity as a division between characters. The information processing apparatus according to Appendix 7, wherein a validity score indicating the above is calculated.
(付記9)前記制御部は、
さらに、前記先行の筆画グループに含まれる筆画の数と、前記後続の筆画グループに含まれる筆画の数とに基づいて、前記先行の筆画グループと前記後続の筆画グループとの区切りが、文字間の区切りである妥当性の強さを示す妥当性スコアを算出する、ことを特徴とする付記7または8に記載の情報処理装置。
(Appendix 9) The control unit is
Further, based on the number of strokes included in the preceding stroke group and the number of strokes included in the succeeding stroke group, the division between the preceding stroke group and the succeeding stroke group is between characters. The information processing apparatus according to Appendix 7 or 8, wherein a validity score indicating the strength of validity as a delimiter is calculated.
(付記10)前記制御部は、
さらに、前記先行の筆画グループ全体の前記入力欄での位置と、前記後続の筆画グループ全体の前記入力欄での位置とに基づいて、前記先行の筆画グループと前記後続の筆画グループとの区切りが、文字間の区切りである妥当性の強さを示す妥当性スコアを算出する、ことを特徴とする付記7~9のいずれか一つに記載の情報処理装置。
(Appendix 10) The control unit is
Further, based on the position of the entire preceding stroke group in the input field and the position of the entire subsequent stroke group in the input field, the division between the preceding stroke group and the subsequent stroke group is established. , The information processing apparatus according to any one of Supplementary note 7 to 9, wherein a validity score indicating the strength of validity, which is a delimiter between characters, is calculated.
(付記11)前記制御部は、
ペアにされた2つの筆画グループと、前記ペアにされた2つの筆画グループの区切りが文字間の区切りとして妥当であるか否かとを対応付けて表す教師データを取得し、
取得した前記教師データを利用して、ペアにされた2つの筆画グループのそれぞれの筆画グループの特徴量を入力すると、前記ペアにされた2つの筆画グループの区切りが、文字間の区切りである妥当性の強さを示す妥当性スコアを出力するモデルを学習し、
学習した前記モデルを利用して、前記先行の筆画グループと、前記後続の筆画グループとの特徴量に基づいて、前記先行の筆画グループと前記後続の筆画グループとの区切りが、文字間の区切りである妥当性の強さを示す妥当性スコアを算出する、ことを特徴とする付記1~10のいずれか一つに記載の情報処理装置。
(Appendix 11) The control unit is
Acquire teacher data showing the correspondence between the two paired stroke groups and whether or not the delimiter between the two paired stroke groups is appropriate as a delimiter between characters.
When the feature amount of each stroke group of the two paired stroke groups is input by using the acquired teacher data, the division between the two paired stroke groups is appropriate as the division between characters. Learn a model that outputs a validity score that indicates sexual strength,
Using the learned model, the division between the preceding stroke group and the succeeding stroke group is a division between characters based on the feature amount of the preceding stroke group and the succeeding stroke group. The information processing apparatus according to any one of
(付記12)コンピュータが、
入力欄に書き込まれた筆画の軌跡を示す筆画データを蓄積し、
蓄積した前記筆画データを参照して、前記入力欄に書き込まれた、時系列順に連続する1以上の筆画を含む先行の筆画グループと、前記先行の筆画グループの直後に続く、時系列順に連続する1以上の筆画を含む後続の筆画グループとの特徴量に基づいて、前記先行の筆画グループと前記後続の筆画グループとの区切りが、文字間の区切りである妥当性の強さを示す妥当性スコアを算出し、
蓄積した前記筆画データと、算出した前記妥当性スコアとに基づいて、前記入力欄に書き込まれた1以上の文字を認識する、
処理を実行することを特徴とする文字認識方法。
(Appendix 12) The computer
Accumulates stroke data showing the trajectory of the stroke written in the input field,
With reference to the accumulated stroke data, the preceding stroke group containing one or more consecutive strokes written in the input field in chronological order and the preceding stroke group immediately following the preceding stroke group are continuous in chronological order. A validity score indicating the strength of validity that the division between the preceding stroke group and the subsequent stroke group is a division between characters based on the feature amount of the subsequent stroke group including one or more strokes. Is calculated,
Recognizes one or more characters written in the input field based on the accumulated stroke data and the calculated validity score.
A character recognition method characterized by performing processing.
(付記13)コンピュータに、
入力欄に書き込まれた筆画の軌跡を示す筆画データを蓄積し、
蓄積した前記筆画データを参照して、前記入力欄に書き込まれた、時系列順に連続する1以上の筆画を含む先行の筆画グループと、前記先行の筆画グループの直後に続く、時系列順に連続する1以上の筆画を含む後続の筆画グループとの特徴量に基づいて、前記先行の筆画グループと前記後続の筆画グループとの区切りが、文字間の区切りである妥当性の強さを示す妥当性スコアを算出し、
蓄積した前記筆画データと、算出した前記妥当性スコアとに基づいて、前記入力欄に書き込まれた1以上の文字を認識する、
処理を実行させることを特徴とする文字認識プログラム。
(Appendix 13) To the computer
Accumulates stroke data showing the trajectory of the stroke written in the input field,
With reference to the accumulated stroke data, the preceding stroke group containing one or more consecutive strokes written in the input field in chronological order and the preceding stroke group immediately following the preceding stroke group are continuous in chronological order. A validity score indicating the strength of validity that the division between the preceding stroke group and the subsequent stroke group is a division between characters based on the feature amount of the subsequent stroke group including one or more strokes. Is calculated,
Recognizes one or more characters written in the input field based on the accumulated stroke data and the calculated validity score.
A character recognition program characterized by executing processing.
100 情報処理装置
110,700,900,1000,1100,1201 入力欄
111~115,701~709,1301~1305 筆画
121,122,711,712,811,812,1310,1320,1330,1340,1350,1360,1370,1500,1601,1602 筆跡
200 バス
201 CPU
202 メモリ
203 ネットワークI/F
204 記録媒体I/F
205 記録媒体
206 タッチパネル
210 ネットワーク
300 辞書データベース
400 文脈データベース
500 候補データベース
600 記憶部
601 取得部
602 特定部
603 妥当性スコア算出部
604 認識スコア算出部
605 文脈スコア算出部
606 重畳文字認識部
607 出力部
608 学習部
911,912,1010,1041,1042 文字
1021,1022 部分
1030 文字列
1111,1112 筆画群
1200 入力画面
1202 表示欄
100
202
204 Recording medium I / F
205 Recording medium 206
Claims (10)
蓄積した前記筆画データを参照して、前記入力欄に書き込まれた、時系列順に連続する1以上の筆画を含む先行の筆画グループと、前記先行の筆画グループの直後に続く、時系列順に連続する1以上の筆画を含む後続の筆画グループとを組み合わせた2つの筆画グループのペアごとに、前記ペアにされた2つの筆画グループのそれぞれの筆画グループの特徴量に基づいて、前記ペアにされた2つの筆画グループの区切りが、文字間の区切りである妥当性の強さを示す妥当性スコアを算出し、
前記ペアのうち、算出した前記妥当性スコアが条件を満たすペアごとに、前記条件を満たすペアにされた2つの筆画グループのそれぞれの筆画グループが形成する文字の候補および前記条件を満たすペアにされた2つの筆画グループのそれぞれの筆画グループが形成する文字の候補の妥当性を示す認識スコアを生成し、
生成した前記候補および前記認識スコアと、算出した前記妥当性スコアとに基づいて、前記入力欄に書き込まれた1以上の文字を認識する、
制御部を有することを特徴とする情報処理装置。 Accumulates stroke data showing the trajectory of the stroke written in the input field,
With reference to the accumulated stroke data, the preceding stroke group containing one or more consecutive strokes written in the input field in chronological order and the preceding stroke group immediately following the preceding stroke group are continuous in chronological order. For each pair of two stroke groups combined with a subsequent stroke group containing one or more strokes, the pair was made into the pair based on the feature quantity of each stroke group of the two stroke groups made into the pair. Calculate the validity score, which indicates the strength of the validity that the break of one stroke group is the break between characters.
Of the pairs, for each pair whose validity score is satisfied, the character candidates formed by each stroke group of the two stroke groups made into the pair satisfying the above condition and the pair satisfying the above condition are set. Generates a recognition score that indicates the validity of the character candidates formed by each of the two stroke groups.
Recognizes one or more characters written in the input field based on the generated candidate and the recognition score and the calculated validity score.
An information processing device characterized by having a control unit.
前記ペアのうち、前記条件を満たすペアごとに、前記条件を満たすペアにされた2つの筆画グループのそれぞれの筆画グループが形成する文字の候補の組み合わせが、文脈に沿った組み合わせである妥当性の強さを示す文脈スコアを算出し、Of the pairs, for each pair that satisfies the conditions, the combination of character candidates formed by each stroke group of the two stroke groups that satisfy the conditions is a contextual combination. Calculate a context score that indicates strength,
算出した前記文脈スコアと、生成した前記候補および前記認識スコアと、算出した前記妥当性スコアとに基づいて、前記入力欄に書き込まれた1以上の文字を認識する、ことを特徴とする請求項1または2に記載の情報処理装置。A claim characterized in that one or more characters written in the input field are recognized based on the calculated context score, the generated candidate and the recognition score, and the calculated validity score. The information processing apparatus according to 1 or 2.
前記ペアごとに、前記ペアにされた2つの筆画グループのうち前記先行の筆画グループに含まれる末尾の筆画と、前記ペアにされた2つの筆画グループのうち前記後続の筆画グループに含まれる先頭の筆画と、前記ペアにされた2つの筆画グループのうち前記後続の筆画グループに含まれる末尾の筆画との少なくともいずれかの筆画の前記入力欄での位置に基づいて、前記ペアにされた2つの筆画グループの区切りが、文字間の区切りである妥当性の強さを示す妥当性スコアを算出する、ことを特徴とする請求項1~3のいずれか一つに記載の情報処理装置。For each pair, the last stroke included in the preceding stroke group of the two paired stroke groups and the first stroke included in the subsequent stroke group of the two paired stroke groups. Two of the paired strokes based on the position in the input field of at least one of the strokes and the last stroke in the subsequent stroke group of the two paired stroke groups. The information processing apparatus according to any one of claims 1 to 3, wherein the stroke group delimiter calculates a validity score indicating the strength of the validity of the delimiter between characters.
前記ペアごとに、さらに、前記ペアにされた2つの筆画グループのうち前記先行の筆画グループに含まれる先頭の筆画の前記入力欄での位置に基づいて、前記ペアにされた2つの筆画グループの区切りが、文字間の区切りである妥当性の強さを示す妥当性スコアを算出する、ことを特徴とする請求項4に記載の情報処理装置。For each pair, further, the two stroke groups made into the pair based on the position of the first stroke included in the preceding stroke group in the input field among the two stroke groups made into the pair. The information processing apparatus according to claim 4, wherein the delimiter calculates a validity score indicating the strength of validity as a delimiter between characters.
ペアにされた2つの筆画グループと、前記ペアにされた2つの筆画グループの区切りが文字間の区切りとして妥当であるか否かとを対応付けて表す教師データを取得し、Acquire teacher data showing the correspondence between the two paired stroke groups and whether or not the delimiter between the two paired stroke groups is appropriate as a delimiter between characters.
取得した前記教師データを利用して、ペアにされた2つの筆画グループのそれぞれの筆画グループの特徴量を入力すると、前記ペアにされた2つの筆画グループの区切りが、文字間の区切りである妥当性の強さを示す妥当性スコアを出力するモデルを学習し、When the feature amount of each stroke group of the two paired stroke groups is input by using the acquired teacher data, the delimiter between the two paired stroke groups is appropriate as the delimiter between characters. Learn a model that outputs a validity score that indicates sexual strength,
学習した前記モデルを利用して、前記先行の筆画グループと、前記後続の筆画グループとを組み合わせた2つの筆画グループのペアごとに、前記ペアにされた2つの筆画グループのそれぞれの筆画グループの特徴量に基づいて、前記ペアにされた2つの筆画グループの区切りが、文字間の区切りである妥当性の強さを示す妥当性スコアを算出する、Using the learned model, for each pair of two stroke groups in which the preceding stroke group and the subsequent stroke group are combined, the characteristics of each stroke group of the two stroke groups paired. Based on the quantity, the validity score indicating the strength of the validity that the separation of the two stroke groups paired is the separation between characters is calculated.
ことを特徴とする請求項1~7のいずれか一つに記載の情報処理装置。The information processing apparatus according to any one of claims 1 to 7.
入力欄に書き込まれた筆画の軌跡を示す筆画データを蓄積し、Accumulates stroke data showing the trajectory of the stroke written in the input field,
蓄積した前記筆画データを参照して、前記入力欄に書き込まれた、時系列順に連続する1以上の筆画を含む先行の筆画グループと、前記先行の筆画グループの直後に続く、時系列順に連続する1以上の筆画を含む後続の筆画グループとを組み合わせた2つの筆画グループのペアごとに、前記ペアにされた2つの筆画グループのそれぞれの筆画グループの特徴量に基づいて、前記ペアにされた2つの筆画グループの区切りが、文字間の区切りである妥当性の強さを示す妥当性スコアを算出し、With reference to the accumulated stroke data, the preceding stroke group containing one or more consecutive strokes written in the input field in chronological order and the preceding stroke group immediately following the preceding stroke group are continuous in chronological order. For each pair of two stroke groups combined with a subsequent stroke group containing one or more strokes, the pair was made into the pair based on the feature quantity of each stroke group of the two stroke groups made into the pair. Calculate the validity score, which indicates the strength of the validity that the break of one stroke group is the break between characters.
前記ペアのうち、算出した前記妥当性スコアが条件を満たすペアごとに、前記条件を満たすペアにされた2つの筆画グループのそれぞれの筆画グループが形成する文字の候補および前記条件を満たすペアにされた2つの筆画グループのそれぞれの筆画グループが形成する文字の候補の妥当性を示す認識スコアを生成し、Of the pairs, for each pair whose validity score is satisfied, the character candidates formed by each stroke group of the two stroke groups made into the pair satisfying the above condition and the pair satisfying the above condition are set. Generates a recognition score that indicates the validity of the character candidates formed by each of the two stroke groups.
生成した前記候補および前記認識スコアと、算出した前記妥当性スコアとに基づいて、前記入力欄に書き込まれた1以上の文字を認識する、Recognizes one or more characters written in the input field based on the generated candidate and the recognition score and the calculated validity score.
処理を実行することを特徴とする文字認識方法。A character recognition method characterized by performing processing.
入力欄に書き込まれた筆画の軌跡を示す筆画データを蓄積し、Accumulates stroke data showing the trajectory of the stroke written in the input field,
蓄積した前記筆画データを参照して、前記入力欄に書き込まれた、時系列順に連続する1以上の筆画を含む先行の筆画グループと、前記先行の筆画グループの直後に続く、時系列順に連続する1以上の筆画を含む後続の筆画グループとを組み合わせた2つの筆画グループのペアごとに、前記ペアにされた2つの筆画グループのそれぞれの筆画グループの特徴量に基づいて、前記ペアにされた2つの筆画グループの区切りが、文字間の区切りである妥当性の強さを示す妥当性スコアを算出し、With reference to the accumulated stroke data, the preceding stroke group containing one or more consecutive strokes written in the input field in chronological order and the preceding stroke group immediately following the preceding stroke group are continuous in chronological order. For each pair of two stroke groups combined with a subsequent stroke group containing one or more strokes, the pair was made into the pair based on the feature quantity of each stroke group of the two stroke groups made into the pair. Calculate the validity score, which indicates the strength of the validity that the break of one stroke group is the break between characters.
前記ペアのうち、算出した前記妥当性スコアが条件を満たすペアごとに、前記条件を満たすペアにされた2つの筆画グループのそれぞれの筆画グループが形成する文字の候補および前記条件を満たすペアにされた2つの筆画グループのそれぞれの筆画グループが形成する文字の候補の妥当性を示す認識スコアを生成し、Of the pairs, for each pair whose validity score is satisfied, the character candidates formed by each stroke group of the two stroke groups made into the pair satisfying the above condition and the pair satisfying the above condition are set. Generates a recognition score that indicates the validity of the character candidates formed by each of the two stroke groups.
生成した前記候補および前記認識スコアと、算出した前記妥当性スコアとに基づいて、前記入力欄に書き込まれた1以上の文字を認識する、Recognizes one or more characters written in the input field based on the generated candidate and the recognition score and the calculated validity score.
処理を実行させることを特徴とする文字認識プログラム。A character recognition program characterized by executing processing.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018136748A JP7095450B2 (en) | 2018-07-20 | 2018-07-20 | Information processing device, character recognition method, and character recognition program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018136748A JP7095450B2 (en) | 2018-07-20 | 2018-07-20 | Information processing device, character recognition method, and character recognition program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020013460A JP2020013460A (en) | 2020-01-23 |
JP7095450B2 true JP7095450B2 (en) | 2022-07-05 |
Family
ID=69169929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018136748A Active JP7095450B2 (en) | 2018-07-20 | 2018-07-20 | Information processing device, character recognition method, and character recognition program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7095450B2 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6124364B2 (en) | 2012-11-16 | 2017-05-10 | エルジー・ケム・リミテッド | Manufacturing method of thin polarizer |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2940747B2 (en) * | 1992-10-13 | 1999-08-25 | 三洋電機株式会社 | Character segmentation device |
-
2018
- 2018-07-20 JP JP2018136748A patent/JP7095450B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6124364B2 (en) | 2012-11-16 | 2017-05-10 | エルジー・ケム・リミテッド | Manufacturing method of thin polarizer |
Non-Patent Citations (1)
Title |
---|
梁建娟 他,文字位置自由オンライン手書き文字列認識方式,電子情報通信学会技術研究報告,一般社団法人電子情報通信学会,2015年06月11日,第115巻,第100号,第53-58頁,WIT2015-10 |
Also Published As
Publication number | Publication date |
---|---|
JP2020013460A (en) | 2020-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6513005B1 (en) | Method for correcting error characters in results of speech recognition and speech recognition system using the same | |
JP5071914B2 (en) | Recognition graph | |
Bharath et al. | HMM-based lexicon-driven and lexicon-free word recognition for online handwritten Indic scripts | |
JP4787275B2 (en) | Segmentation-based recognition | |
US7428516B2 (en) | Handwriting recognition using neural networks | |
EP1564675B1 (en) | Apparatus and method for searching for digital ink query | |
KR20120011010A (en) | Handwriting recognition method and device | |
JPH0684006A (en) | Method of online handwritten character recognition | |
JP4649512B2 (en) | Character string search method and apparatus | |
CN113779970A (en) | Text error correction method and related equipment thereof | |
CN113469163B (en) | Medical information recording method and device based on intelligent paper pen | |
Sundaram et al. | Bigram language models and reevaluation strategy for improved recognition of online handwritten Tamil words | |
KR20070090188A (en) | Method and device for recognition of handwritten patterns | |
JP6735775B2 (en) | System and method for superimposed handwriting input recognition technology | |
JP7095450B2 (en) | Information processing device, character recognition method, and character recognition program | |
JP5594134B2 (en) | Character string search device, character string search method, and character string search program | |
NAKJAI et al. | Automatic Thai finger spelling transcription | |
US20220375244A1 (en) | Systems and methods for handwriting recognition | |
K Jabde et al. | A Comprehensive Literature Review on Air-written Online Handwritten Recognition | |
JP3970075B2 (en) | Character recognition apparatus, character recognition method, execution program thereof, and recording medium recording the same | |
Nguyen et al. | Semi-incremental recognition of on-line handwritten Japanese text | |
Sevilla et al. | Automatic signwriting recognition: Combining machine learning and expert knowledge to solve a novel problem | |
JP7285018B2 (en) | Program, erroneous character detection device, and erroneous character detection method | |
Mengkaw et al. | Thai Spelling Correction Investigation Framework Based on OCR Word Extraction | |
Sevillaa et al. | Automatic SignWriting Recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210408 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220315 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220511 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220524 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220606 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7095450 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |