JP5974576B2 - Character recognition learning device, character recognition device, and program - Google Patents
Character recognition learning device, character recognition device, and program Download PDFInfo
- Publication number
- JP5974576B2 JP5974576B2 JP2012069779A JP2012069779A JP5974576B2 JP 5974576 B2 JP5974576 B2 JP 5974576B2 JP 2012069779 A JP2012069779 A JP 2012069779A JP 2012069779 A JP2012069779 A JP 2012069779A JP 5974576 B2 JP5974576 B2 JP 5974576B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- character recognition
- information
- recognition result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Discrimination (AREA)
Description
本発明は、文字認識学習装置、文字認識装置、およびプログラムに関する。 The present invention relates to a character recognition learning device, a character recognition device, and a program.
特許文献1には、入力枠内に手書きされた文字の認識において、座標補正の方式を、入力枠内の位置に応じて切り替える文字認識装置が記載されている。特許文献2には、手書き文字の認識において、濁点、半濁点等、記入枠からはみ出して記入される可能性がある文字を予め登録し、登録された文字が認識された場合に、隣接する記入枠における濁点、半濁点等の有無を判定する文字認識装置が開示されている。特許文献3には、オンライン認識の結果と、オフライン認識の結果と、を正規化したうえで、これらの結果に基づく文字認識処理を行う手書き文字認識装置が記載されている。特許文献4には、複数の文字認識手段による認識結果を統合し、統合された結果を基に最終認識結果を生成する文字認識方式が記載されている。特許文献5には、複数の文字認識プログラムによる文字認識を行ったうえで、それぞれの出力を比較して文字認識結果を出力する文字認識方法が記載されている。特許文献6には、オンラインで入力されるストロークの時系列およびオフラインで入力される文字全体の形状に基いて文字認識を行う文字認識装置が記載されている。
本発明の目的の1つは、複数の文字認識手段を用いた文字認識処理において、複数の文字認識手段による認識結果の組み合わせを用いて学習データを生成する文字認識学習装置、および複数の文字認識手段による認識結果の組み合わせを用いて文字認識処理を行う文字認識装置を提供することにある。 One of the objects of the present invention is a character recognition learning device that generates learning data using a combination of recognition results obtained by a plurality of character recognition means in a character recognition process using a plurality of character recognition means, and a plurality of character recognitions. An object of the present invention is to provide a character recognition device that performs character recognition processing using a combination of recognition results obtained by means.
上記目的を達成するために、請求項1に記載の発明は、学習用書面に含まれる複数の文字のそれぞれの文字種を示す教師情報を取得する教師情報取得手段と、前記複数の文字のそれぞれに対する、第1の文字認識手段による文字認識処理の結果を示す第1認識結果情報を取得する第1認識結果情報取得手段と、前記複数の文字のそれぞれに対する、前記第1の文字認識手段とは異なる処理方式を用いる第2の文字認識手段による文字認識処理の結果を示す第2認識結果情報を取得する第2認識結果情報取得手段と、前記複数の文字のそれぞれについて、前記教師情報に含まれる該文字の文字種を示す情報と、当該文字について取得される前記第1認識結果情報及び前記第2認識結果情報の組み合わせとを入力データとして用いて機械学習を実行し、実行結果を文字認識用学習データとして出力する学習データ出力手段と、を含むことを特徴とする文字認識学習装置である。
In order to achieve the above object, the invention according to
また、請求項2に記載の発明は、請求項1に記載の文字認識学習装置であって、前記第1認識結果情報は、前記複数の文字のそれぞれについて、該文字の認識結果として、前記第1の文字認識手段により認識された文字種を示す情報と、その尤度を示す情報と、を含み、前記第2認識結果情報は、前記複数の文字のそれぞれについて、該文字の認識結果として、前記第2の文字認識手段により認識された文字種を示す情報と、その尤度を示す情報と、を含む、ことを特徴とする文字認識学習装置である。
Further, the invention according to
また、請求項3に記載の発明は、請求項1に記載の文字認識学習装置であって、前記第1認識結果情報は、前記複数の文字のそれぞれについて、該文字の認識結果として、予め定められる複数の文字種候補のそれぞれについて、該文字の文字種が該文字種候補であるとの尤度を示す情報を含み、前記第2認識結果情報は、前記複数の文字のそれぞれについて、該文字の認識結果として、予め定められる複数の文字種候補のそれぞれについて、該文字の文字種が該文字種候補であるとの尤度を示す情報を含む、ことを特徴とする文字認識学習装置である。
The invention according to claim 3 is the character recognition learning device according to
また、請求項4に記載の発明は、請求項3に記載の文字認識学習装置であって、前記学習データ出力手段は、前記第1認識結果情報において、予め定められる値より小さい尤度を0に置き換え、前記第2認識結果情報において、予め定められる値より小さい尤度を0に置き換えて、前記機械学習を実行する、ことを特徴とする文字認識学習装置である。 The invention according to claim 4 is the character recognition learning device according to claim 3, wherein the learning data output means sets a likelihood smaller than a predetermined value in the first recognition result information to 0. In the second recognition result information, the machine learning is performed by replacing the likelihood smaller than a predetermined value with 0 and executing the machine learning.
また、請求項5に記載の発明は、判定対象書面に含まれる判定対象文字に対する、第1の文字認識手段による文字認識処理の結果を示す第1認識結果情報を取得する第1認識結果情報取得手段と、前記判定対象文字に対する、前記第1の文字認識手段とは異なる処理方式を用いる第2の文字認識手段による文字認識処理の結果を示す第2認識結果情報を取得する第2認識結果情報取得手段と、学習用書面に含まれる複数の文字のそれぞれの文字種を示す教師情報と、前記学習用書面に対する前記第1の文字認識手段による認識結果と前記学習用書面に対する前記第2の文字認識手段による認識結果との組み合わせと、を用いて生成される文字認識用学習データを取得する文字認識用学習データ取得手段と、前記判定対象文字について、当該判定対象文字について取得される前記第1認識結果情報及び前記第2認識結果情報の組み合わせと、前記文字認識用学習データと、を用いて当該判定対象文字の文字種を判定する文字種判定処理を実行する文字種判定手段と、を含むことを特徴とする文字認識装置である。 The invention according to claim 5 is the first recognition result information acquisition for acquiring the first recognition result information indicating the result of the character recognition processing by the first character recognition means for the determination target character included in the determination target document. 2nd recognition result information which acquires the 2nd recognition result information which shows the result of the character recognition process by the 2nd character recognition means using the processing method different from a said 1st character recognition means with respect to the said determination object character Acquisition means; teacher information indicating character types of a plurality of characters included in the learning document; a recognition result of the first character recognition unit for the learning document; and the second character recognition for the learning document. A character recognition learning data acquisition means for acquiring character recognition learning data generated using a combination of the recognition result by the means, and the determination target character. Character type for executing a character type determination process for determining a character type of the determination target character using the combination of the first recognition result information and the second recognition result information acquired for the target character and the learning data for character recognition. A character recognition device including a determination unit.
また、請求項6に記載の発明は、コンピュータを、学習用書面に含まれる複数の文字のそれぞれの文字種を示す教師情報を取得する教師情報取得手段と、前記複数の文字のそれぞれに対する、第1の文字認識手段による文字認識処理の結果を示す第1認識結果情報を取得する第1認識結果情報取得手段と、前記複数の文字のそれぞれに対する、前記第1の文字認識手段とは異なる処理方式を用いる第2の文字認識手段による文字認識処理の結果を示す第2認識結果情報を取得する第2認識結果情報取得手段と、前記複数の文字のそれぞれについて、前記教師情報に含まれる該文字の文字種を示す情報と、当該文字について取得される前記第1認識結果情報及び前記第2認識結果情報の組み合わせとを入力データとして用いて機械学習を実行し、実行結果を文字認識用学習データとして出力する学習データ出力手段と、として機能させるためのプログラムである。 According to a sixth aspect of the present invention, there is provided a teacher information acquisition means for acquiring teacher information indicating a character type of each of a plurality of characters included in a learning document, and a first information for each of the plurality of characters. A first recognition result information acquisition means for acquiring first recognition result information indicating a result of character recognition processing by the character recognition means, and a processing method different from the first character recognition means for each of the plurality of characters. Second recognition result information acquisition means for acquiring second recognition result information indicating a result of character recognition processing by the second character recognition means to be used; and for each of the plurality of characters, the character type of the character included in the teacher information And machine learning using the combination of the first recognition result information and the second recognition result information acquired for the character as input data A learning data output means for outputting the execution result as a character recognition training data is a program for functioning as a.
また、請求項7に記載の発明は、コンピュータを、判定対象書面に含まれる判定対象文字に対する、第1の文字認識手段による文字認識処理の結果を示す第1認識結果情報を取得する第1認識結果情報取得手段と、前記判定対象文字に対する、前記第1の文字認識手段とは異なる処理方式を用いる第2の文字認識手段による文字認識処理の結果を示す第2認識結果情報を取得する第2認識結果情報取得手段と、学習用書面に含まれる複数の文字のそれぞれの文字種を示す教師情報と、前記学習用書面に対する前記第1の文字認識手段による認識結果と前記学習用書面に対する前記第2の文字認識手段による認識結果との組み合わせと、を用いて生成される文字認識用学習データを取得する文字認識用学習データ取得手段と、前記判定対象文字について、当該判定対象文字について取得される前記第1認識結果情報及び前記第2認識結果情報の組み合わせと、前記文字認識用学習データと、を用いて当該判定対象文字の文字種を判定する文字種判定処理を実行する文字種判定手段と、として機能させるためのプログラムである。 According to the seventh aspect of the present invention, the computer recognizes the first recognition result information indicating the result of the character recognition processing by the first character recognition means for the determination target character included in the determination target document. A second recognition result information indicating a result of a character recognition process performed by a second character recognition unit using a result information acquisition unit and a processing method different from the first character recognition unit for the determination target character; Recognition result information acquisition means, teacher information indicating the character types of a plurality of characters included in the learning document, recognition results by the first character recognition means for the learning document, and the second for the learning document. A character recognition learning data acquisition means for acquiring character recognition learning data generated using the combination of the recognition result by the character recognition means, and the determination target character About the character type determination process for determining the character type of the determination target character using the combination of the first recognition result information and the second recognition result information acquired for the determination target character and the learning data for character recognition. Is a program for functioning as a character type determination means for executing.
請求項1,6に係る発明によれば、教師情報に含まれる文字種を示す情報と、第1の文字認識手段による認識結果及び第2の文字認識手段による認識結果の組み合わせと、に基づいて文字認識用学習データが生成される。 According to the first and sixth aspects of the present invention, the character is based on the information indicating the character type included in the teacher information and the combination of the recognition result by the first character recognition unit and the recognition result by the second character recognition unit. Learning data for recognition is generated.
請求項2に係る発明によれば、第1認識結果情報として、第1の文字認識手段により認識された文字種を示す情報と、その尤度を示す情報と、が取得され、第2認識結果情報として、第2の文字認識手段により認識された文字種を示す情報と、その尤度を示す情報と、が取得される。 According to the second aspect of the present invention, information indicating the character type recognized by the first character recognition means and information indicating the likelihood are acquired as the first recognition result information, and the second recognition result information As such, information indicating the character type recognized by the second character recognition means and information indicating the likelihood thereof are acquired.
請求項3に係る発明によれば、第1認識結果情報として、学習用書面に含まれる文字について、該文字の認識結果として、予め定められる複数の文字種候補のそれぞれについて、該文字の文字種が該文字種候補であるとの尤度を示す情報が取得され、第2認識結果情報として、学習用書面に含まれる文字について、該文字の認識結果として、予め定められる複数の文字種候補のそれぞれについて、該文字の文字種が該文字種候補であるとの尤度を示す情報、が取得される。 According to the invention of claim 3, as the first recognition result information, the character type of the character for each of a plurality of predetermined character type candidates as the character recognition result for the character included in the learning document is Information indicating the likelihood of being a character type candidate is acquired, and as the second recognition result information, for each of a plurality of character type candidates determined in advance as a character recognition result, Information indicating the likelihood that the character type of the character is the character type candidate is acquired.
請求項4に係る発明によれば、第1認識結果情報において予め定められる値より小さい尤度が0に置き換えられ、第2認識結果情報において予め定められる値より小さい尤度が0に置き換えられる。 According to the invention of claim 4, the likelihood smaller than the predetermined value in the first recognition result information is replaced with 0, and the likelihood smaller than the predetermined value in the second recognition result information is replaced with 0.
請求項5,7に係る発明によれば、判定対象文字について、当該判定対象文字について取得される前記第1認識結果情報及び前記第2認識結果情報の組み合わせと、前記文字認識用学習データと、を用いて文字種が判定される。 According to the inventions according to claims 5 and 7, for the determination target character, a combination of the first recognition result information and the second recognition result information acquired for the determination target character, the learning data for character recognition, Is used to determine the character type.
以下、本発明の実施形態について図面に基づき詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[第1の実施形態]
図1は、本発明の第1の実施形態に係る文字認識学習装置100の構成を示す図である。文字認識学習装置100は、タブレットPC、電子ペン等のユーザの手書き動作を認識する入力受付装置200と接続される。
[First Embodiment]
FIG. 1 is a diagram showing a configuration of a character
文字認識学習装置100は、制御部110、外部I/F部120、第1文字認識部130、第2文字認識部140、認識結果情報統合部150、学習データ生成部160、および記憶部170を有する。制御部110、外部I/F部120、第1文字認識部130、第2文字認識部140、認識結果情報統合部150、および学習データ生成部160は、記憶部170に記憶されるプログラムにより動作するCPUの一機能として実現される。記憶部170は、ハードディスク、メモリー等の記憶装置からなる。
The character
入力受付装置200は、筆記道具(タッチペン、電子ペン、指先等)が記録媒体(タブレットPCのディスプレイ、紙等)に降ろされて(ペンダウン、接触の開始)から離される(ペンアップ、接触の終了)までの、筆記道具の先端部の動きを示す電気信号を生成して、文字認識学習装置100に出力する。
In the
ここで、筆記用具により入力されるのは、予め与えられる例えば数百〜数千の文字からなる学習用書面のデータである。 Here, what is input by the writing instrument is data of a written document for learning composed of, for example, several hundred to several thousand characters given in advance.
また、入力受付装置200は、学習用書面に記載されている複数の文字のそれぞれの、実際の文字種を示す教師情報を取得し、文字認識学習装置100に出力する。教師情報は、例えば学習用書面に記載されている複数の文字のそれぞれの文字コードからなる。
Further, the
文字認識学習装置100の制御部110は、文字認識学習装置100の各部の動作を制御する。制御部110は、外部I/F部120を介して、入力受付装置200から入力される、入力受付装置200における入力内容を示す入力情報および教師情報を取得する。制御部110は、この入力内容を示す情報および教師情報を、記憶部170に保存する。
The
外部I/F部120は、入力受付装置200から入力される信号を取得して、制御部110に出力する。
The external I /
第1文字認識部130、および第2文字認識部140は、入力受付装置200から取得されて記憶部170に記憶されている、複数の文字からなる学習用書面を示す入力情報に対し、これらの複数の文字のそれぞれの文字種を認識(判定)する文字認識処理を行う。第1文字認識部130、および第2文字認識部140は、既知の文字認識技術により文字認識処理を行う。ここで、第1文字認識部130、および第2文字認識部140は、互いに異なる処理方式により文字認識処理を行う。第1文字認識部130は、複数の文字のそれぞれについて、予め定められる複数の文字種候補のそれぞれであるとの尤度を示す第1認識結果情報を生成する。また、第2文字認識部140は、複数の文字のそれぞれについて、予め定められる複数の文字種候補のそれぞれであるとの尤度を示す第2認識結果情報を生成する。なお、本実施形態では2つの文字認識部(第1文字認識部130、第2文字認識部140)が設けられる構成が示されているが、文字認識部は3つ以上設けられてもよい。
The first
ここで、予め定められる複数の文字種候補とは、例えば日本語であれば全ての平仮名、片仮名、漢字、記号からなり、英語であれば全てのアルファベットおよび記号からなる。図2は、本発明の第1の実施形態に係る第1認識結果情報および第2認識結果情報の例を示す図である。図2の第1認識結果情報および第2認識結果情報は、学習用書面のある文字について、予め定められる文字種のそれぞれとする認識の尤度を示している。 Here, the plurality of predetermined character type candidates include, for example, all hiragana, katakana, kanji, and symbols in Japanese, and all alphabets and symbols in English. FIG. 2 is a diagram illustrating an example of first recognition result information and second recognition result information according to the first embodiment of the present invention. The first recognition result information and the second recognition result information in FIG. 2 indicate the likelihood of recognition as a predetermined character type for a character with a learning document.
認識結果情報統合部150は、第1文字認識部130により生成された第1認識結果情報、および第2文字認識部140により生成された第2認識結果情報を組み合わせて、統合認識結果情報を生成する。具体的には、認識結果情報統合部150は、複数の文字のそれぞれについて、同じ文字種の尤度として出力された値を成分とするm次元のベクトルを生成する。ここでmは文字認識部を識別する番号であり、2つの文字認識部が設けられる本実施形態ではm=0,1である。図3は、本発明の第1の実施形態に係る統合認識結果情報の一例を示す図である。
The recognition result
学習データ生成部160は、複数の文字のそれぞれについて、教師情報に含まれる該文字の文字種を示す情報と、当該文字について取得される第1認識結果情報及び第2認識結果情報の組み合わせた統合認識結果情報と、を入力データとして用いて機械学習を実行し、実行結果を文字認識用学習データとして出力する。学習データ生成部160は、例えばBoosting、ニューラルネットワーク、SVM(サポートベクタマシン)等の既知の学習手法を用いて学習処理を実行する。学習データ生成部160により生成された学習データは記憶部170に記憶され、文字認識処理に使用される。
For each of a plurality of characters, the learning
次に、文字認識学習装置100の動作をフローチャートを用いて説明する。図4は、本発明の第1の実施形態に係る文字認識学習装置100の動作を示すフローチャートである。ここでは、学習用書面に記載されている文字の個数をL、文字種の数をNとする。
Next, operation | movement of the character
まず、制御部110は、認識結果情報統合部150において保持されている、統合認識結果情報であるベクトルを格納する配列W[l][n][m]を初期化する(S401)。ここでlは学習用書面における文字を識別する番号(0≦l<L)、nは文字種を識別する番号(0≦n<N)、mは第1文字認識部130および第2文字認識部140を識別する番号(0≦m<2)である。
First, the
次に、制御部110は、入力受付装置200から入力される入力情報および教師情報を取得する(S402)。制御部110は、取得された入力情報および教師情報を記憶部170に保存する。
Next, the
次に、第1文字認識部130、および第2文字認識部140は、文字認識処理を実行する(S403)。第1文字認識部130、および第2文字認識部140による文字認識処理の結果は、認識結果情報統合部150に出力される。
Next, the first
次に、認識結果情報統合部150は、第1文字認識部130、および第2文字認識部140から入力される文字認識結果を組み合わせて、統合認識結果情報を生成する(S404)。具体的には、文字認識結果に含まれる値を前述の配列W[l][n][m]に割り当てる。図3に示される統合認識結果情報の例では、W[0][0][0]=0.8、W[0][0][1]=0.7、W[0][1][0]=0.005、W[0][1][1]=0.08である。認識結果情報統合部150は、配列W[l][n][m]への値の割り当てを、0≦l<L、0≦n<N、0≦m<2の各値について実行する。
Next, the recognition result
そして学習データ生成部160は、S403で生成された統合認識結果情報を用いて学習処理を行う(S405)。生成された学習データは、記憶部170に記憶される。以上で、文字認識学習装置100の動作は終了する。
Then, the learning
[第2の実施形態]
図5は、本発明の第2の実施形態に係る文字認識装置500の構成を示す図である。文字認識装置500は、タブレットPC、電子ペン等のユーザの手書き動作を認識する入力受付装置600と接続される。
[Second Embodiment]
FIG. 5 is a diagram showing a configuration of a
文字認識装置500は、制御部510、外部I/F部520、第1文字認識部530、第2文字認識部540、認識結果情報統合部550、文字識別部560、および記憶部570を有する。制御部510、外部I/F部520、第1文字認識部530、第2文字認識部540、認識結果情報統合部550、および文字識別部560は、記憶部570に記憶されるプログラムにより動作するCPUの一機能として実現される。記憶部570は、ハードディスク、メモリー等の記憶装置からなる。
The
入力受付装置600は、筆記道具(タッチペン、電子ペン、指先等)が記録媒体(タブレットPCのディスプレイ、紙等)に降ろされて(ペンダウン、接触の開始)から離される(ペンアップ、接触の終了)までの、筆記道具の先端部の動きを示す電気信号を生成して、文字認識装置500に出力する。ここで、筆記用具により入力されるのは、判定対象書面のデータである。
In the
文字認識装置500の制御部510は、文字認識装置500の各部の動作を制御する。制御部510は、外部I/F部520を介して、入力受付装置600から入力される、入力受付装置600における入力内容を示す入力情報および教師情報を取得する。制御部510は、この入力内容を示す情報および教師情報を、記憶部570に保存する。
The
外部I/F部520は、入力受付装置600から入力される信号を取得して、制御部510に出力する。
External I /
第1文字認識部530、および第2文字認識部540は、入力受付装置600から取得されて記憶部570に記憶されている、判定対象書面を示す入力情報に対し、判定対象書面上の文字の文字種を認識(判定)する文字認識処理を行う。第1文字認識部530、および第2文字認識部540は、既知の文字認識技術により文字認識処理を行う。ここで、第1文字認識部530、および第2文字認識部540は、互いに異なる処理方式により文字認識処理を行う。第1文字認識部530は、判定対象書面に含まれる文字(判定対象文字)について、予め定められる複数の文字種候補のそれぞれであるとの尤度を示す第1認識結果情報を生成する。また、第2文字認識部540は、判定対象書面に含まれる文字について、予め定められる複数の文字種候補のそれぞれであるとの尤度を示す第2認識結果情報を生成する。なお、本実施形態では2つの文字認識部(第1文字認識部530、第2文字認識部540)が設けられる構成が示されているが、文字認識部は3つ以上設けられてもよい。
The first
ここで、予め定められる複数の文字種候補とは、例えば日本語であれば全ての平仮名、片仮名、漢字、記号からなり、英語であれば全てのアルファベットおよび記号からなる。図6は、本発明の第2の実施形態に係る第1認識結果情報および第2認識結果情報の例を示す図である。図6の第1認識結果情報および第2認識結果情報は、判定対象書面上の文字について、予め定められる文字種のそれぞれとする認識の尤度を示している。 Here, the plurality of predetermined character type candidates include, for example, all hiragana, katakana, kanji, and symbols in Japanese, and all alphabets and symbols in English. FIG. 6 is a diagram illustrating an example of the first recognition result information and the second recognition result information according to the second embodiment of the present invention. The first recognition result information and the second recognition result information in FIG. 6 indicate the likelihood of recognition for each of the predetermined character types for the characters on the determination target document.
認識結果情報統合部550は、第1文字認識部530により生成された第1認識結果情報、および第2文字認識部540により生成された第2認識結果情報を組み合わせて、統合認識結果情報を生成する。具体的には、認識結果情報統合部550は、複数の文字のそれぞれについて、同じ文字種の尤度として出力された値を成分とするm次元のベクトルを生成する。ここでmは文字認識部を識別する番号であり、2つの文字認識部が設けられる本実施形態ではm=0,1である。図7は、本発明の第2の実施形態に係る統合認識結果情報の一例を示す図である。
The recognition result
文字識別部560は、判定対象文字について、当該判定対象文字について取得される前記第1認識結果情報及び前記第2認識結果情報の組み合わせた統合認識結果情報と、文字認識用学習データと、を用いて当該判定対象文字の文字種を判定する文字種判定処理を実行する。ここで、文字認識用学習データとは、学習用書面に含まれる複数の文字のそれぞれの文字種を示す教師情報と、学習用書面に対する第1文字認識部530による認識結果と学習書面に対する第2文字認識部540による認識結果との組み合わせと、を用いて予め生成される文字認識用学習データであり、記憶部570に記憶されている。この文字認識用学習データは、例えば第1の実施形態に係る文字認識学習装置100と同様の構成によって生成された学習データとしてもよい。文字識別部560は、例えばBoosting、ニューラルネットワーク、SVM(サポートベクタマシン)等の既知の識別手法を用いて文字識別処理を実行する。
The
次に、文字認識装置500の動作をフローチャートを用いて説明する。図8は、本発明の第2の実施形態に係る文字認識装置500の動作を示すフローチャートである。
Next, the operation of the
まず、制御部110は、認識結果情報統合部550において保持されている、統合認識結果情報であるベクトルを格納する配列W[n][m]を初期化する(S801)。ここでnは文字種を識別する番号(0≦n<N)、mは第1文字認識部530および第2文字認識部540を識別する番号(0≦m<2)である。
First, the
次に、第1文字認識部530、および第2文字認識部540は、文字認識処理を実行する(S802)。第1文字認識部530、および第2文字認識部540による文字認識処理の結果は、認識結果情報統合部550に出力される。
Next, the first
次に、認識結果情報統合部550は、第1文字認識部530、および第2文字認識部540から入力される文字認識結果を組み合わせて、統合認識結果情報を生成する(S803)。具体的には、文字認識結果に含まれる値を前述の配列W[n][m]に割り当てる。図7に示される統合認識結果情報の例では、W[0][0]=0.85、W[0][1]=0.8、W[1][0]=0.006、W[1][1]=0.075である。認識結果情報統合部550は、配列W[n][m]への値の割り当てを、0≦n<N、0≦m<2の各値について実行する。
Next, the recognition result
そして文字識別部560は、S803で生成された統合認識結果情報を用いて文字識別処理を行う(S804)。以上で、文字認識装置500の動作は終了する。
The
以上の構成により、複数の文字認識手段を用いた文字認識処理において、複数の文字認識手段による認識結果の組み合わせを用いて学習データを生成する文字認識学習装置100、および複数の文字認識手段による認識結果の組み合わせを用いて文字認識処理を行う文字認識装置500が提供される。
With the above configuration, in character recognition processing using a plurality of character recognition means, the character
なお、上記の実施形態では2つの文字認識手段(第1文字認識部130,530、第2文字認識部140,540)が設けられる構成が示されたが、本発明はこれに限定されず、2つ以上の複数の文字認識手段が設けられる構成してもよい。
In the above embodiment, a configuration in which two character recognition means (first
また、上記の実施形態では、2つの文字認識手段において、全ての文字種とする認識の尤度が取得される構成が示されたが、尤度が予め設定される値より小さい文字種についての尤度を0に置き換える構成としてもよいし、尤度が大きいものから並べて、予め定められる順位以下の文字種についての尤度を0に置き換える構成としてもよい。また、必ずしも全ての文字種について尤度を取得する文字認識手段を用いる必要はなく、例えば尤度が予め定められる値以上である文字種についてのみ文字認識結果を出力するものを用いてもよい。これらの構成とした場合、扱われる情報の量が削減され、処理負荷が軽減されるとともに処理速度の向上が実現される。 In the above embodiment, the configuration is shown in which the likelihood of recognition for all character types is acquired by the two character recognition means. However, the likelihood for character types whose likelihood is smaller than a preset value is shown. May be replaced with 0, or may be arranged in descending order of likelihood, and the likelihood for character types below a predetermined order may be replaced with 0. In addition, it is not always necessary to use character recognition means for acquiring likelihoods for all character types. For example, a device that outputs character recognition results only for character types whose likelihood is equal to or greater than a predetermined value may be used. With these configurations, the amount of information to be handled is reduced, the processing load is reduced, and the processing speed is improved.
また、上記の実施形態では、電子ペン等を用いた、いわゆるオンライン処理による入力処理を行う入力受付装置200,600を用いる構成が示されたが、例えばスキャナ等のいわゆるオフライン処理による入力装置を用いる構成としてもよい。
Further, in the above-described embodiment, the configuration using the
なお、ここで述べた文字認識学習装置100および文字認識装置500の動作は、文字認識学習装置100および文字認識装置500のそれぞれの記憶部170,570に記憶されるプログラムを動作させることで実現される。このプログラムは通信によって提供されてもよいし、コンピュータによる読み取りが可能な、CD−ROM等の記憶媒体に格納されて提供されてもよい。
The operations of the character
100 文字認識学習装置、110 制御部、120 外部I/F部、130 第1文字認識部、140 第2文字認識部、150 認識結果情報統合部、160 学習データ生成部、170 記憶部、200 入力受付装置、500 文字認識装置、510 制御部、520 外部I/F部、530 第1文字認識部、540 第2文字認識部、550 認識結果情報統合部、560 文字識別部、570 記憶部、600 入力受付装置。 100 character recognition learning device, 110 control unit, 120 external I / F unit, 130 first character recognition unit, 140 second character recognition unit, 150 recognition result information integration unit, 160 learning data generation unit, 170 storage unit, 200 input Reception device, 500 character recognition device, 510 control unit, 520 external I / F unit, 530 first character recognition unit, 540 second character recognition unit, 550 recognition result information integration unit, 560 character identification unit, 570 storage unit, 600 Input reception device.
Claims (5)
前記複数の文字ごとに、第1の文字認識手段による前記教師情報に含まれる複数の文字種のそれぞれに対する文字認識処理の結果を示す第1認識結果情報を取得する第1認識結果情報取得手段と、
前記複数の文字ごとに、前記第1の文字認識手段とは異なる処理方式を用いる前記教師情報に含まれる複数の文字種のそれぞれに対する第2の文字認識手段による文字認識処理の結果を示す第2認識結果情報を取得する第2認識結果情報取得手段と、
前記複数の文字ごとに、前記教師情報に含まれる該文字の文字種を示す情報と、当該文字について取得される、前記教師情報に含まれる複数の文字種のそれぞれに対する前記第1認識結果情報及び前記第2認識結果情報の組み合わせとを入力データとして用いて機械学習を実行し、実行結果を文字認識用学習データとして出力する学習データ出力手段と、
を含むことを特徴とする文字認識学習装置。 Teacher information acquisition means for acquiring teacher information including each character type of a plurality of characters included in the learning document;
For each of the plurality of characters, the first recognition result information obtaining means for obtaining a first recognition result information indicating the result of the character recognition processing for each of a plurality of character types contained in the instruction information by the first character recognition means,
For each of the plurality of characters, the second recognition indicating the result of the character recognition processing by the second character recognition means for each of a plurality of character types contained in the instruction information using different processing schemes and the first character recognition means Second recognition result information acquisition means for acquiring result information;
For each of the plurality of characters , information indicating the character type of the character included in the teacher information, the first recognition result information for each of the plurality of character types included in the teacher information acquired for the character, and the first Learning data output means for executing machine learning using a combination of two recognition result information as input data, and outputting the execution result as learning data for character recognition;
A character recognition learning apparatus comprising:
前記第1認識結果情報は、前記複数の文字のそれぞれについて、
該文字の認識結果として、前記第1の文字認識手段により認識された文字種を示す情報と、その尤度を示す情報と、を含み、
前記第2認識結果情報は、前記複数の文字のそれぞれについて、
該文字の認識結果として、前記第2の文字認識手段により認識された文字種を示す情報と、その尤度を示す情報と、を含む、
ことを特徴とする文字認識学習装置。 The character recognition learning device according to claim 1,
The first recognition result information is about each of the plurality of characters.
The character recognition result includes information indicating the character type recognized by the first character recognition means, and information indicating the likelihood,
The second recognition result information is about each of the plurality of characters.
The character recognition result includes information indicating the character type recognized by the second character recognition means, and information indicating the likelihood.
A character recognition learning device characterized by that.
前記第1認識結果情報は、前記複数の文字のそれぞれについて、
該文字の認識結果として、予め定められる複数の文字種候補のそれぞれについて、該文字の文字種が該文字種候補であるとの尤度を示す情報を含み、
前記第2認識結果情報は、前記複数の文字のそれぞれについて、
該文字の認識結果として、予め定められる複数の文字種候補のそれぞれについて、該文字の文字種が該文字種候補であるとの尤度を示す情報を含む、
ことを特徴とする文字認識学習装置。 The character recognition learning device according to claim 1,
The first recognition result information is about each of the plurality of characters.
As the recognition result of the character, for each of a plurality of predetermined character type candidates, including information indicating the likelihood that the character type of the character is the character type candidate,
The second recognition result information is about each of the plurality of characters.
For each of a plurality of predetermined character type candidates, the character recognition result includes information indicating the likelihood that the character type of the character is the character type candidate.
A character recognition learning device characterized by that.
前記学習データ出力手段は、
前記第1認識結果情報において、予め定められる値より小さい尤度を0に置き換え、
前記第2認識結果情報において、予め定められる値より小さい尤度を0に置き換えて、
前記機械学習を実行する、
ことを特徴とする文字認識学習装置。 The character recognition learning device according to claim 3,
The learning data output means includes
In the first recognition result information, a likelihood smaller than a predetermined value is replaced with 0,
In the second recognition result information, the likelihood smaller than a predetermined value is replaced with 0,
Performing the machine learning;
A character recognition learning device characterized by that.
学習用書面に含まれる複数の文字のそれぞれの文字種を含む教師情報を取得する教師情報取得手段、
前記複数の文字ごとに、第1の文字認識手段による前記教師情報に含まれる複数の文字種のそれぞれに対する文字認識処理の結果を示す第1認識結果情報を取得する第1認識結果情報取得手段、
前記複数の文字ごとに、前記第1の文字認識手段とは異なる処理方式を用いる第2の文字認識手段による前記教師情報に含まれる複数の文字種のそれぞれに対する文字認識処理の結果を示す第2認識結果情報を取得する第2認識結果情報取得手段、
前記複数の文字ごとに、前記教師情報に含まれる該文字の文字種を示す情報と、当該文字について取得される、前記教師情報に含まれる複数の文字種のそれぞれに対する前記第1認識結果情報及び前記第2認識結果情報の組み合わせとを入力データとして用いて機械学習を実行し、実行結果を文字認識用学習データとして出力する学習データ出力手段、
として機能させるためのプログラム。 Computer
Instruction information acquiring means to acquire the teaching information containing the respective character types of a plurality of characters included in the learning writing,
Wherein for each of a plurality of characters, the first recognition result information acquiring means to acquire the first recognition result information indicating the result of the character recognition processing for each of a plurality of character types contained in the instruction information by the first character recognition means,
For each of the plurality of characters, the second recognition indicating the result of the character recognition processing for each of a plurality of character types contained in the instruction information by the second character recognition means using different processing schemes and the first character recognition means second recognition result information acquiring means to acquire the result information,
For each of the plurality of characters , information indicating the character type of the character included in the teacher information, the first recognition result information for each of the plurality of character types included in the teacher information acquired for the character, and the first second recognition results using a combination of information as input data to perform machine learning, learning data output means to output the execution result as a character recognition training data,
Program to function as.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012069779A JP5974576B2 (en) | 2012-03-26 | 2012-03-26 | Character recognition learning device, character recognition device, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012069779A JP5974576B2 (en) | 2012-03-26 | 2012-03-26 | Character recognition learning device, character recognition device, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013200796A JP2013200796A (en) | 2013-10-03 |
JP5974576B2 true JP5974576B2 (en) | 2016-08-23 |
Family
ID=49520969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012069779A Active JP5974576B2 (en) | 2012-03-26 | 2012-03-26 | Character recognition learning device, character recognition device, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5974576B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107346448B (en) * | 2016-05-06 | 2021-12-21 | 富士通株式会社 | Deep neural network-based recognition device, training device and method |
JP6590355B1 (en) * | 2019-04-26 | 2019-10-16 | Arithmer株式会社 | Learning model generation device, character recognition device, learning model generation method, character recognition method, and program |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3110552B2 (en) * | 1992-05-07 | 2000-11-20 | 三菱電機株式会社 | Character recognition device |
JPH07271899A (en) * | 1994-03-31 | 1995-10-20 | Toshiba Corp | Character recognition device |
JPH08272907A (en) * | 1995-03-28 | 1996-10-18 | Toshiba Corp | Device and method for character recognition |
JP3095069B2 (en) * | 1998-03-26 | 2000-10-03 | 日本電気株式会社 | Character recognition device, learning method, and recording medium storing character recognition program |
-
2012
- 2012-03-26 JP JP2012069779A patent/JP5974576B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013200796A (en) | 2013-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6542870B2 (en) | Superimposed handwritten character recognition technology system and superimposed handwritten character recognition technology method | |
CN102449640B (en) | Recognizing handwritten words | |
EP2802975B1 (en) | Intelligent touchscreen keyboard with finger differentiation | |
Mathew et al. | Multilingual OCR for Indic scripts | |
US9286527B2 (en) | Segmentation of an input by cut point classification | |
EP1854047A1 (en) | Segmentation-based recognition | |
WO2006061852A1 (en) | System, method, and apparatus for triggering recognition of a handwritten shape | |
KR20210017090A (en) | Method and electronic device for converting handwriting input to text | |
KR20130057930A (en) | Image processing apparatus and image processing method | |
KR20180104678A (en) | System and method for recognizing multiple object structures | |
JP6600973B2 (en) | Character recognition device, character recognition processing system, and program | |
KR20220038477A (en) | Extract line of text | |
CN110414622B (en) | Classifier training method and device based on semi-supervised learning | |
US9536180B2 (en) | Text recognition based on recognition units | |
JP2017090998A (en) | Character recognizing program, and character recognizing device | |
JP5974576B2 (en) | Character recognition learning device, character recognition device, and program | |
US9224038B2 (en) | Partial overlap and delayed stroke input recognition | |
US7979795B2 (en) | System and method for inputting syllables of a phonetic script into a computer | |
US9251412B2 (en) | Segmentation of devanagari-script handwriting for recognition | |
CN107912062B (en) | System and method for overlaying handwriting | |
US20230084641A1 (en) | Math detection in handwriting | |
US11508139B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP6310155B2 (en) | Character recognition device, character recognition method, and character recognition program | |
KR102212994B1 (en) | Method and apparatus for automatically generating font | |
US9342739B2 (en) | Character recognition apparatus, non-transitory computer readable medium, and character recognition method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160621 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160704 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5974576 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |