JP5974576B2 - Character recognition learning device, character recognition device, and program - Google Patents

Character recognition learning device, character recognition device, and program Download PDF

Info

Publication number
JP5974576B2
JP5974576B2 JP2012069779A JP2012069779A JP5974576B2 JP 5974576 B2 JP5974576 B2 JP 5974576B2 JP 2012069779 A JP2012069779 A JP 2012069779A JP 2012069779 A JP2012069779 A JP 2012069779A JP 5974576 B2 JP5974576 B2 JP 5974576B2
Authority
JP
Japan
Prior art keywords
character
recognition
character recognition
information
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012069779A
Other languages
Japanese (ja)
Other versions
JP2013200796A (en
Inventor
英人 織田
英人 織田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2012069779A priority Critical patent/JP5974576B2/en
Publication of JP2013200796A publication Critical patent/JP2013200796A/en
Application granted granted Critical
Publication of JP5974576B2 publication Critical patent/JP5974576B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

本発明は、文字認識学習装置、文字認識装置、およびプログラムに関する。   The present invention relates to a character recognition learning device, a character recognition device, and a program.

特許文献1には、入力枠内に手書きされた文字の認識において、座標補正の方式を、入力枠内の位置に応じて切り替える文字認識装置が記載されている。特許文献2には、手書き文字の認識において、濁点、半濁点等、記入枠からはみ出して記入される可能性がある文字を予め登録し、登録された文字が認識された場合に、隣接する記入枠における濁点、半濁点等の有無を判定する文字認識装置が開示されている。特許文献3には、オンライン認識の結果と、オフライン認識の結果と、を正規化したうえで、これらの結果に基づく文字認識処理を行う手書き文字認識装置が記載されている。特許文献4には、複数の文字認識手段による認識結果を統合し、統合された結果を基に最終認識結果を生成する文字認識方式が記載されている。特許文献5には、複数の文字認識プログラムによる文字認識を行ったうえで、それぞれの出力を比較して文字認識結果を出力する文字認識方法が記載されている。特許文献6には、オンラインで入力されるストロークの時系列およびオフラインで入力される文字全体の形状に基いて文字認識を行う文字認識装置が記載されている。   Patent Document 1 describes a character recognition device that switches a coordinate correction method according to a position in an input frame in recognition of a character handwritten in the input frame. In Patent Document 2, in recognition of handwritten characters, characters that may be written out of the entry frame, such as muddy and semi-voiced dots, are registered in advance, and when the registered characters are recognized, adjacent entries are entered. A character recognition device that determines the presence or absence of a cloudy point, a semi-cloudy point, or the like in a frame is disclosed. Patent Document 3 describes a handwritten character recognition device that normalizes the result of online recognition and the result of offline recognition and performs character recognition processing based on these results. Patent Document 4 describes a character recognition method in which recognition results obtained by a plurality of character recognition means are integrated and a final recognition result is generated based on the integrated results. Patent Document 5 describes a character recognition method that performs character recognition using a plurality of character recognition programs, compares the respective outputs, and outputs a character recognition result. Patent Document 6 describes a character recognition device that performs character recognition based on the time series of strokes input online and the shape of the entire characters input offline.

特開平8−96082号公報JP-A-8-96082 特開平9−190497号公報JP-A-9-190497 特開2000−105798号公報JP 2000-105798 A 特開2001−22883号公報JP 2001-22883 A 特開平7−114620号公報Japanese Patent Laid-Open No. 7-114620 特開平9−288717号公報JP-A-9-288717

本発明の目的の1つは、複数の文字認識手段を用いた文字認識処理において、複数の文字認識手段による認識結果の組み合わせを用いて学習データを生成する文字認識学習装置、および複数の文字認識手段による認識結果の組み合わせを用いて文字認識処理を行う文字認識装置を提供することにある。   One of the objects of the present invention is a character recognition learning device that generates learning data using a combination of recognition results obtained by a plurality of character recognition means in a character recognition process using a plurality of character recognition means, and a plurality of character recognitions. An object of the present invention is to provide a character recognition device that performs character recognition processing using a combination of recognition results obtained by means.

上記目的を達成するために、請求項1に記載の発明は、学習用書面に含まれる複数の文字のそれぞれの文字種を示す教師情報を取得する教師情報取得手段と、前記複数の文字のそれぞれに対する、第1の文字認識手段による文字認識処理の結果を示す第1認識結果情報を取得する第1認識結果情報取得手段と、前記複数の文字のそれぞれに対する、前記第1の文字認識手段とは異なる処理方式を用いる第2の文字認識手段による文字認識処理の結果を示す第2認識結果情報を取得する第2認識結果情報取得手段と、前記複数の文字のそれぞれについて、前記教師情報に含まれる該文字の文字種を示す情報と、当該文字について取得される前記第1認識結果情報及び前記第2認識結果情報の組み合わせとを入力データとして用いて機械学習を実行し、実行結果を文字認識用学習データとして出力する学習データ出力手段と、を含むことを特徴とする文字認識学習装置である。   In order to achieve the above object, the invention according to claim 1 is directed to teacher information acquisition means for acquiring teacher information indicating each character type of a plurality of characters included in a learning document, and to each of the plurality of characters. The first recognition result information acquisition means for acquiring the first recognition result information indicating the result of the character recognition processing by the first character recognition means is different from the first character recognition means for each of the plurality of characters. Second recognition result information acquisition means for acquiring second recognition result information indicating a result of character recognition processing by the second character recognition means using the processing method; and each of the plurality of characters is included in the teacher information. Machine learning is performed using information indicating the character type of a character and a combination of the first recognition result information and the second recognition result information acquired for the character as input data. And a character recognition learning device characterized by comprising a learning data output means for outputting the execution result as a character recognition training data.

また、請求項2に記載の発明は、請求項1に記載の文字認識学習装置であって、前記第1認識結果情報は、前記複数の文字のそれぞれについて、該文字の認識結果として、前記第1の文字認識手段により認識された文字種を示す情報と、その尤度を示す情報と、を含み、前記第2認識結果情報は、前記複数の文字のそれぞれについて、該文字の認識結果として、前記第2の文字認識手段により認識された文字種を示す情報と、その尤度を示す情報と、を含む、ことを特徴とする文字認識学習装置である。   Further, the invention according to claim 2 is the character recognition learning device according to claim 1, wherein the first recognition result information includes the first recognition result information for each of the plurality of characters as a recognition result of the character. Information indicating the character type recognized by one character recognition means, and information indicating the likelihood, and the second recognition result information includes, as the character recognition result for each of the plurality of characters, The character recognition learning apparatus includes information indicating a character type recognized by the second character recognition means and information indicating the likelihood.

また、請求項3に記載の発明は、請求項1に記載の文字認識学習装置であって、前記第1認識結果情報は、前記複数の文字のそれぞれについて、該文字の認識結果として、予め定められる複数の文字種候補のそれぞれについて、該文字の文字種が該文字種候補であるとの尤度を示す情報を含み、前記第2認識結果情報は、前記複数の文字のそれぞれについて、該文字の認識結果として、予め定められる複数の文字種候補のそれぞれについて、該文字の文字種が該文字種候補であるとの尤度を示す情報を含む、ことを特徴とする文字認識学習装置である。   The invention according to claim 3 is the character recognition learning device according to claim 1, wherein the first recognition result information is predetermined as a recognition result of each of the plurality of characters. Each of the plurality of character type candidates includes information indicating the likelihood that the character type of the character is the character type candidate, and the second recognition result information includes the recognition result of the character for each of the plurality of characters. For each of a plurality of predetermined character type candidates, the character recognition learning device includes information indicating the likelihood that the character type of the character is the character type candidate.

また、請求項4に記載の発明は、請求項3に記載の文字認識学習装置であって、前記学習データ出力手段は、前記第1認識結果情報において、予め定められる値より小さい尤度を0に置き換え、前記第2認識結果情報において、予め定められる値より小さい尤度を0に置き換えて、前記機械学習を実行する、ことを特徴とする文字認識学習装置である。   The invention according to claim 4 is the character recognition learning device according to claim 3, wherein the learning data output means sets a likelihood smaller than a predetermined value in the first recognition result information to 0. In the second recognition result information, the machine learning is performed by replacing the likelihood smaller than a predetermined value with 0 and executing the machine learning.

また、請求項5に記載の発明は、判定対象書面に含まれる判定対象文字に対する、第1の文字認識手段による文字認識処理の結果を示す第1認識結果情報を取得する第1認識結果情報取得手段と、前記判定対象文字に対する、前記第1の文字認識手段とは異なる処理方式を用いる第2の文字認識手段による文字認識処理の結果を示す第2認識結果情報を取得する第2認識結果情報取得手段と、学習用書面に含まれる複数の文字のそれぞれの文字種を示す教師情報と、前記学習用書面に対する前記第1の文字認識手段による認識結果と前記学習用書面に対する前記第2の文字認識手段による認識結果との組み合わせと、を用いて生成される文字認識用学習データを取得する文字認識用学習データ取得手段と、前記判定対象文字について、当該判定対象文字について取得される前記第1認識結果情報及び前記第2認識結果情報の組み合わせと、前記文字認識用学習データと、を用いて当該判定対象文字の文字種を判定する文字種判定処理を実行する文字種判定手段と、を含むことを特徴とする文字認識装置である。   The invention according to claim 5 is the first recognition result information acquisition for acquiring the first recognition result information indicating the result of the character recognition processing by the first character recognition means for the determination target character included in the determination target document. 2nd recognition result information which acquires the 2nd recognition result information which shows the result of the character recognition process by the 2nd character recognition means using the processing method different from a said 1st character recognition means with respect to the said determination object character Acquisition means; teacher information indicating character types of a plurality of characters included in the learning document; a recognition result of the first character recognition unit for the learning document; and the second character recognition for the learning document. A character recognition learning data acquisition means for acquiring character recognition learning data generated using a combination of the recognition result by the means, and the determination target character. Character type for executing a character type determination process for determining a character type of the determination target character using the combination of the first recognition result information and the second recognition result information acquired for the target character and the learning data for character recognition. A character recognition device including a determination unit.

また、請求項6に記載の発明は、コンピュータを、学習用書面に含まれる複数の文字のそれぞれの文字種を示す教師情報を取得する教師情報取得手段と、前記複数の文字のそれぞれに対する、第1の文字認識手段による文字認識処理の結果を示す第1認識結果情報を取得する第1認識結果情報取得手段と、前記複数の文字のそれぞれに対する、前記第1の文字認識手段とは異なる処理方式を用いる第2の文字認識手段による文字認識処理の結果を示す第2認識結果情報を取得する第2認識結果情報取得手段と、前記複数の文字のそれぞれについて、前記教師情報に含まれる該文字の文字種を示す情報と、当該文字について取得される前記第1認識結果情報及び前記第2認識結果情報の組み合わせとを入力データとして用いて機械学習を実行し、実行結果を文字認識用学習データとして出力する学習データ出力手段と、として機能させるためのプログラムである。   According to a sixth aspect of the present invention, there is provided a teacher information acquisition means for acquiring teacher information indicating a character type of each of a plurality of characters included in a learning document, and a first information for each of the plurality of characters. A first recognition result information acquisition means for acquiring first recognition result information indicating a result of character recognition processing by the character recognition means, and a processing method different from the first character recognition means for each of the plurality of characters. Second recognition result information acquisition means for acquiring second recognition result information indicating a result of character recognition processing by the second character recognition means to be used; and for each of the plurality of characters, the character type of the character included in the teacher information And machine learning using the combination of the first recognition result information and the second recognition result information acquired for the character as input data A learning data output means for outputting the execution result as a character recognition training data is a program for functioning as a.

また、請求項7に記載の発明は、コンピュータを、判定対象書面に含まれる判定対象文字に対する、第1の文字認識手段による文字認識処理の結果を示す第1認識結果情報を取得する第1認識結果情報取得手段と、前記判定対象文字に対する、前記第1の文字認識手段とは異なる処理方式を用いる第2の文字認識手段による文字認識処理の結果を示す第2認識結果情報を取得する第2認識結果情報取得手段と、学習用書面に含まれる複数の文字のそれぞれの文字種を示す教師情報と、前記学習用書面に対する前記第1の文字認識手段による認識結果と前記学習用書面に対する前記第2の文字認識手段による認識結果との組み合わせと、を用いて生成される文字認識用学習データを取得する文字認識用学習データ取得手段と、前記判定対象文字について、当該判定対象文字について取得される前記第1認識結果情報及び前記第2認識結果情報の組み合わせと、前記文字認識用学習データと、を用いて当該判定対象文字の文字種を判定する文字種判定処理を実行する文字種判定手段と、として機能させるためのプログラムである。   According to the seventh aspect of the present invention, the computer recognizes the first recognition result information indicating the result of the character recognition processing by the first character recognition means for the determination target character included in the determination target document. A second recognition result information indicating a result of a character recognition process performed by a second character recognition unit using a result information acquisition unit and a processing method different from the first character recognition unit for the determination target character; Recognition result information acquisition means, teacher information indicating the character types of a plurality of characters included in the learning document, recognition results by the first character recognition means for the learning document, and the second for the learning document. A character recognition learning data acquisition means for acquiring character recognition learning data generated using the combination of the recognition result by the character recognition means, and the determination target character About the character type determination process for determining the character type of the determination target character using the combination of the first recognition result information and the second recognition result information acquired for the determination target character and the learning data for character recognition. Is a program for functioning as a character type determination means for executing.

請求項1,6に係る発明によれば、教師情報に含まれる文字種を示す情報と、第1の文字認識手段による認識結果及び第2の文字認識手段による認識結果の組み合わせと、に基づいて文字認識用学習データが生成される。   According to the first and sixth aspects of the present invention, the character is based on the information indicating the character type included in the teacher information and the combination of the recognition result by the first character recognition unit and the recognition result by the second character recognition unit. Learning data for recognition is generated.

請求項2に係る発明によれば、第1認識結果情報として、第1の文字認識手段により認識された文字種を示す情報と、その尤度を示す情報と、が取得され、第2認識結果情報として、第2の文字認識手段により認識された文字種を示す情報と、その尤度を示す情報と、が取得される。   According to the second aspect of the present invention, information indicating the character type recognized by the first character recognition means and information indicating the likelihood are acquired as the first recognition result information, and the second recognition result information As such, information indicating the character type recognized by the second character recognition means and information indicating the likelihood thereof are acquired.

請求項3に係る発明によれば、第1認識結果情報として、学習用書面に含まれる文字について、該文字の認識結果として、予め定められる複数の文字種候補のそれぞれについて、該文字の文字種が該文字種候補であるとの尤度を示す情報が取得され、第2認識結果情報として、学習用書面に含まれる文字について、該文字の認識結果として、予め定められる複数の文字種候補のそれぞれについて、該文字の文字種が該文字種候補であるとの尤度を示す情報、が取得される。   According to the invention of claim 3, as the first recognition result information, the character type of the character for each of a plurality of predetermined character type candidates as the character recognition result for the character included in the learning document is Information indicating the likelihood of being a character type candidate is acquired, and as the second recognition result information, for each of a plurality of character type candidates determined in advance as a character recognition result, Information indicating the likelihood that the character type of the character is the character type candidate is acquired.

請求項4に係る発明によれば、第1認識結果情報において予め定められる値より小さい尤度が0に置き換えられ、第2認識結果情報において予め定められる値より小さい尤度が0に置き換えられる。   According to the invention of claim 4, the likelihood smaller than the predetermined value in the first recognition result information is replaced with 0, and the likelihood smaller than the predetermined value in the second recognition result information is replaced with 0.

請求項5,7に係る発明によれば、判定対象文字について、当該判定対象文字について取得される前記第1認識結果情報及び前記第2認識結果情報の組み合わせと、前記文字認識用学習データと、を用いて文字種が判定される。   According to the inventions according to claims 5 and 7, for the determination target character, a combination of the first recognition result information and the second recognition result information acquired for the determination target character, the learning data for character recognition, Is used to determine the character type.

本発明の第1の実施形態に係る文字認識学習装置の構成を示す図である。It is a figure which shows the structure of the character recognition learning apparatus which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る第1認識結果情報および第2認識結果情報の例を示す図である。It is a figure which shows the example of the 1st recognition result information which concerns on the 1st Embodiment of this invention, and 2nd recognition result information. 本発明の第1の実施形態に係る統合認識結果情報の一例を示す図である。It is a figure which shows an example of the integrated recognition result information which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る文字認識学習装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the character recognition learning apparatus which concerns on the 1st Embodiment of this invention. 本発明の第2の実施形態に係る文字認識装置の構成を示す図である。It is a figure which shows the structure of the character recognition apparatus which concerns on the 2nd Embodiment of this invention. 本発明の第2の実施形態に係る第1認識結果情報および第2認識結果情報の例を示す図である。It is a figure which shows the example of the 1st recognition result information which concerns on the 2nd Embodiment of this invention, and 2nd recognition result information. 本発明の第2の実施形態に係る統合認識結果情報の一例を示す図である。It is a figure which shows an example of the integrated recognition result information which concerns on the 2nd Embodiment of this invention. 本発明の第2の実施形態に係る文字認識装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the character recognition apparatus which concerns on the 2nd Embodiment of this invention.

以下、本発明の実施形態について図面に基づき詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

[第1の実施形態]
図1は、本発明の第1の実施形態に係る文字認識学習装置100の構成を示す図である。文字認識学習装置100は、タブレットPC、電子ペン等のユーザの手書き動作を認識する入力受付装置200と接続される。
[First Embodiment]
FIG. 1 is a diagram showing a configuration of a character recognition learning apparatus 100 according to the first embodiment of the present invention. The character recognition learning device 100 is connected to an input reception device 200 that recognizes a user's handwriting action such as a tablet PC or an electronic pen.

文字認識学習装置100は、制御部110、外部I/F部120、第1文字認識部130、第2文字認識部140、認識結果情報統合部150、学習データ生成部160、および記憶部170を有する。制御部110、外部I/F部120、第1文字認識部130、第2文字認識部140、認識結果情報統合部150、および学習データ生成部160は、記憶部170に記憶されるプログラムにより動作するCPUの一機能として実現される。記憶部170は、ハードディスク、メモリー等の記憶装置からなる。   The character recognition learning device 100 includes a control unit 110, an external I / F unit 120, a first character recognition unit 130, a second character recognition unit 140, a recognition result information integration unit 150, a learning data generation unit 160, and a storage unit 170. Have. The control unit 110, the external I / F unit 120, the first character recognition unit 130, the second character recognition unit 140, the recognition result information integration unit 150, and the learning data generation unit 160 operate according to programs stored in the storage unit 170. This is realized as one function of the CPU. The storage unit 170 includes a storage device such as a hard disk or a memory.

入力受付装置200は、筆記道具(タッチペン、電子ペン、指先等)が記録媒体(タブレットPCのディスプレイ、紙等)に降ろされて(ペンダウン、接触の開始)から離される(ペンアップ、接触の終了)までの、筆記道具の先端部の動きを示す電気信号を生成して、文字認識学習装置100に出力する。   In the input receiving device 200, a writing tool (touch pen, electronic pen, fingertip, etc.) is lowered to a recording medium (tablet PC display, paper, etc.) and released from (pen down, start of contact) (end of pen up, contact end). The electric signal indicating the movement of the tip of the writing tool up to) is generated and output to the character recognition learning device 100.

ここで、筆記用具により入力されるのは、予め与えられる例えば数百〜数千の文字からなる学習用書面のデータである。   Here, what is input by the writing instrument is data of a written document for learning composed of, for example, several hundred to several thousand characters given in advance.

また、入力受付装置200は、学習用書面に記載されている複数の文字のそれぞれの、実際の文字種を示す教師情報を取得し、文字認識学習装置100に出力する。教師情報は、例えば学習用書面に記載されている複数の文字のそれぞれの文字コードからなる。   Further, the input reception device 200 acquires teacher information indicating the actual character type of each of the plurality of characters described in the learning document and outputs the teacher information to the character recognition learning device 100. The teacher information is composed of, for example, character codes of a plurality of characters described in a learning document.

文字認識学習装置100の制御部110は、文字認識学習装置100の各部の動作を制御する。制御部110は、外部I/F部120を介して、入力受付装置200から入力される、入力受付装置200における入力内容を示す入力情報および教師情報を取得する。制御部110は、この入力内容を示す情報および教師情報を、記憶部170に保存する。   The control unit 110 of the character recognition learning device 100 controls the operation of each unit of the character recognition learning device 100. The control unit 110 acquires input information and teacher information indicating the input content in the input receiving device 200 input from the input receiving device 200 via the external I / F unit 120. The control unit 110 stores information indicating the input content and teacher information in the storage unit 170.

外部I/F部120は、入力受付装置200から入力される信号を取得して、制御部110に出力する。   The external I / F unit 120 acquires a signal input from the input reception device 200 and outputs the signal to the control unit 110.

第1文字認識部130、および第2文字認識部140は、入力受付装置200から取得されて記憶部170に記憶されている、複数の文字からなる学習用書面を示す入力情報に対し、これらの複数の文字のそれぞれの文字種を認識(判定)する文字認識処理を行う。第1文字認識部130、および第2文字認識部140は、既知の文字認識技術により文字認識処理を行う。ここで、第1文字認識部130、および第2文字認識部140は、互いに異なる処理方式により文字認識処理を行う。第1文字認識部130は、複数の文字のそれぞれについて、予め定められる複数の文字種候補のそれぞれであるとの尤度を示す第1認識結果情報を生成する。また、第2文字認識部140は、複数の文字のそれぞれについて、予め定められる複数の文字種候補のそれぞれであるとの尤度を示す第2認識結果情報を生成する。なお、本実施形態では2つの文字認識部(第1文字認識部130、第2文字認識部140)が設けられる構成が示されているが、文字認識部は3つ以上設けられてもよい。   The first character recognizing unit 130 and the second character recognizing unit 140 are provided for the input information indicating the document for learning composed of a plurality of characters acquired from the input receiving device 200 and stored in the storage unit 170. Character recognition processing for recognizing (determining) each character type of a plurality of characters is performed. The first character recognition unit 130 and the second character recognition unit 140 perform character recognition processing using a known character recognition technique. Here, the 1st character recognition part 130 and the 2nd character recognition part 140 perform a character recognition process by a mutually different processing system. The first character recognition unit 130 generates first recognition result information indicating the likelihood that each of the plurality of characters is a plurality of predetermined character type candidates. Moreover, the 2nd character recognition part 140 produces | generates the 2nd recognition result information which shows the likelihood that it is each of several predetermined character type candidates about each of several characters. In the present embodiment, a configuration is shown in which two character recognition units (first character recognition unit 130 and second character recognition unit 140) are provided, but three or more character recognition units may be provided.

ここで、予め定められる複数の文字種候補とは、例えば日本語であれば全ての平仮名、片仮名、漢字、記号からなり、英語であれば全てのアルファベットおよび記号からなる。図2は、本発明の第1の実施形態に係る第1認識結果情報および第2認識結果情報の例を示す図である。図2の第1認識結果情報および第2認識結果情報は、学習用書面のある文字について、予め定められる文字種のそれぞれとする認識の尤度を示している。   Here, the plurality of predetermined character type candidates include, for example, all hiragana, katakana, kanji, and symbols in Japanese, and all alphabets and symbols in English. FIG. 2 is a diagram illustrating an example of first recognition result information and second recognition result information according to the first embodiment of the present invention. The first recognition result information and the second recognition result information in FIG. 2 indicate the likelihood of recognition as a predetermined character type for a character with a learning document.

認識結果情報統合部150は、第1文字認識部130により生成された第1認識結果情報、および第2文字認識部140により生成された第2認識結果情報を組み合わせて、統合認識結果情報を生成する。具体的には、認識結果情報統合部150は、複数の文字のそれぞれについて、同じ文字種の尤度として出力された値を成分とするm次元のベクトルを生成する。ここでmは文字認識部を識別する番号であり、2つの文字認識部が設けられる本実施形態ではm=0,1である。図3は、本発明の第1の実施形態に係る統合認識結果情報の一例を示す図である。   The recognition result information integration unit 150 generates integrated recognition result information by combining the first recognition result information generated by the first character recognition unit 130 and the second recognition result information generated by the second character recognition unit 140. To do. Specifically, the recognition result information integration unit 150 generates, for each of a plurality of characters, an m-dimensional vector whose component is a value output as the likelihood of the same character type. Here, m is a number for identifying a character recognition unit, and m = 0, 1 in the present embodiment in which two character recognition units are provided. FIG. 3 is a diagram illustrating an example of the integrated recognition result information according to the first embodiment of the present invention.

学習データ生成部160は、複数の文字のそれぞれについて、教師情報に含まれる該文字の文字種を示す情報と、当該文字について取得される第1認識結果情報及び第2認識結果情報の組み合わせた統合認識結果情報と、を入力データとして用いて機械学習を実行し、実行結果を文字認識用学習データとして出力する。学習データ生成部160は、例えばBoosting、ニューラルネットワーク、SVM(サポートベクタマシン)等の既知の学習手法を用いて学習処理を実行する。学習データ生成部160により生成された学習データは記憶部170に記憶され、文字認識処理に使用される。   For each of a plurality of characters, the learning data generation unit 160 performs integrated recognition combining information indicating the character type of the character included in the teacher information, and the first recognition result information and the second recognition result information acquired for the character. Machine learning is executed using the result information as input data, and the execution result is output as learning data for character recognition. The learning data generation unit 160 executes learning processing using a known learning method such as Boosting, neural network, SVM (support vector machine), or the like. The learning data generated by the learning data generation unit 160 is stored in the storage unit 170 and used for character recognition processing.

次に、文字認識学習装置100の動作をフローチャートを用いて説明する。図4は、本発明の第1の実施形態に係る文字認識学習装置100の動作を示すフローチャートである。ここでは、学習用書面に記載されている文字の個数をL、文字種の数をNとする。   Next, operation | movement of the character recognition learning apparatus 100 is demonstrated using a flowchart. FIG. 4 is a flowchart showing the operation of the character recognition learning apparatus 100 according to the first embodiment of the present invention. Here, the number of characters described in the learning document is L, and the number of character types is N.

まず、制御部110は、認識結果情報統合部150において保持されている、統合認識結果情報であるベクトルを格納する配列W[l][n][m]を初期化する(S401)。ここでlは学習用書面における文字を識別する番号(0≦l<L)、nは文字種を識別する番号(0≦n<N)、mは第1文字認識部130および第2文字認識部140を識別する番号(0≦m<2)である。   First, the control unit 110 initializes an array W [l] [n] [m] stored in the recognition result information integration unit 150 that stores vectors that are integrated recognition result information (S401). Here, l is a number for identifying the character in the learning document (0 ≦ l <L), n is a number for identifying the character type (0 ≦ n <N), m is the first character recognition unit 130 and the second character recognition unit. 140 is a number for identifying 140 (0 ≦ m <2).

次に、制御部110は、入力受付装置200から入力される入力情報および教師情報を取得する(S402)。制御部110は、取得された入力情報および教師情報を記憶部170に保存する。   Next, the control unit 110 acquires input information and teacher information input from the input receiving device 200 (S402). The control unit 110 stores the acquired input information and teacher information in the storage unit 170.

次に、第1文字認識部130、および第2文字認識部140は、文字認識処理を実行する(S403)。第1文字認識部130、および第2文字認識部140による文字認識処理の結果は、認識結果情報統合部150に出力される。   Next, the first character recognition unit 130 and the second character recognition unit 140 execute a character recognition process (S403). The result of the character recognition processing by the first character recognition unit 130 and the second character recognition unit 140 is output to the recognition result information integration unit 150.

次に、認識結果情報統合部150は、第1文字認識部130、および第2文字認識部140から入力される文字認識結果を組み合わせて、統合認識結果情報を生成する(S404)。具体的には、文字認識結果に含まれる値を前述の配列W[l][n][m]に割り当てる。図3に示される統合認識結果情報の例では、W[0][0][0]=0.8、W[0][0][1]=0.7、W[0][1][0]=0.005、W[0][1][1]=0.08である。認識結果情報統合部150は、配列W[l][n][m]への値の割り当てを、0≦l<L、0≦n<N、0≦m<2の各値について実行する。   Next, the recognition result information integration unit 150 combines the character recognition results input from the first character recognition unit 130 and the second character recognition unit 140 to generate integrated recognition result information (S404). Specifically, the value included in the character recognition result is assigned to the array W [l] [n] [m] described above. In the example of the integrated recognition result information shown in FIG. 3, W [0] [0] [0] = 0.8, W [0] [0] [1] = 0.7, W [0] [1] [0] = 0.005 and W [0] [1] [1] = 0.08. The recognition result information integration unit 150 assigns values to the array W [l] [n] [m] for each value of 0 ≦ l <L, 0 ≦ n <N, and 0 ≦ m <2.

そして学習データ生成部160は、S403で生成された統合認識結果情報を用いて学習処理を行う(S405)。生成された学習データは、記憶部170に記憶される。以上で、文字認識学習装置100の動作は終了する。   Then, the learning data generation unit 160 performs learning processing using the integrated recognition result information generated in S403 (S405). The generated learning data is stored in the storage unit 170. Thus, the operation of the character recognition learning device 100 ends.

[第2の実施形態]
図5は、本発明の第2の実施形態に係る文字認識装置500の構成を示す図である。文字認識装置500は、タブレットPC、電子ペン等のユーザの手書き動作を認識する入力受付装置600と接続される。
[Second Embodiment]
FIG. 5 is a diagram showing a configuration of a character recognition device 500 according to the second embodiment of the present invention. The character recognition device 500 is connected to an input reception device 600 that recognizes a user's handwriting action such as a tablet PC or an electronic pen.

文字認識装置500は、制御部510、外部I/F部520、第1文字認識部530、第2文字認識部540、認識結果情報統合部550、文字識別部560、および記憶部570を有する。制御部510、外部I/F部520、第1文字認識部530、第2文字認識部540、認識結果情報統合部550、および文字識別部560は、記憶部570に記憶されるプログラムにより動作するCPUの一機能として実現される。記憶部570は、ハードディスク、メモリー等の記憶装置からなる。   The character recognition device 500 includes a control unit 510, an external I / F unit 520, a first character recognition unit 530, a second character recognition unit 540, a recognition result information integration unit 550, a character identification unit 560, and a storage unit 570. Control unit 510, external I / F unit 520, first character recognition unit 530, second character recognition unit 540, recognition result information integration unit 550, and character identification unit 560 operate according to a program stored in storage unit 570. This is realized as a function of the CPU. The storage unit 570 includes a storage device such as a hard disk or a memory.

入力受付装置600は、筆記道具(タッチペン、電子ペン、指先等)が記録媒体(タブレットPCのディスプレイ、紙等)に降ろされて(ペンダウン、接触の開始)から離される(ペンアップ、接触の終了)までの、筆記道具の先端部の動きを示す電気信号を生成して、文字認識装置500に出力する。ここで、筆記用具により入力されるのは、判定対象書面のデータである。   In the input receiving device 600, a writing tool (touch pen, electronic pen, fingertip, etc.) is lowered to a recording medium (tablet PC display, paper, etc.) and released from (pen down, contact start) (pen up, contact end) The electric signal indicating the movement of the tip of the writing tool up to) is generated and output to the character recognition device 500. Here, the data of the determination target document is input by the writing instrument.

文字認識装置500の制御部510は、文字認識装置500の各部の動作を制御する。制御部510は、外部I/F部520を介して、入力受付装置600から入力される、入力受付装置600における入力内容を示す入力情報および教師情報を取得する。制御部510は、この入力内容を示す情報および教師情報を、記憶部570に保存する。   The control unit 510 of the character recognition device 500 controls the operation of each unit of the character recognition device 500. Control unit 510 acquires input information and teacher information indicating input contents in input receiving device 600 input from input receiving device 600 via external I / F unit 520. Control unit 510 stores information indicating the input content and teacher information in storage unit 570.

外部I/F部520は、入力受付装置600から入力される信号を取得して、制御部510に出力する。   External I / F unit 520 acquires a signal input from input reception device 600 and outputs the signal to control unit 510.

第1文字認識部530、および第2文字認識部540は、入力受付装置600から取得されて記憶部570に記憶されている、判定対象書面を示す入力情報に対し、判定対象書面上の文字の文字種を認識(判定)する文字認識処理を行う。第1文字認識部530、および第2文字認識部540は、既知の文字認識技術により文字認識処理を行う。ここで、第1文字認識部530、および第2文字認識部540は、互いに異なる処理方式により文字認識処理を行う。第1文字認識部530は、判定対象書面に含まれる文字(判定対象文字)について、予め定められる複数の文字種候補のそれぞれであるとの尤度を示す第1認識結果情報を生成する。また、第2文字認識部540は、判定対象書面に含まれる文字について、予め定められる複数の文字種候補のそれぞれであるとの尤度を示す第2認識結果情報を生成する。なお、本実施形態では2つの文字認識部(第1文字認識部530、第2文字認識部540)が設けられる構成が示されているが、文字認識部は3つ以上設けられてもよい。   The first character recognizing unit 530 and the second character recognizing unit 540 obtain characters from the determination target document with respect to the input information indicating the determination target document acquired from the input receiving device 600 and stored in the storage unit 570. Character recognition processing for recognizing (determining) the character type is performed. The first character recognition unit 530 and the second character recognition unit 540 perform character recognition processing using a known character recognition technique. Here, the 1st character recognition part 530 and the 2nd character recognition part 540 perform a character recognition process by a mutually different processing system. The first character recognition unit 530 generates first recognition result information indicating the likelihood that each character (determination target character) included in the determination target document is a plurality of predetermined character type candidates. Moreover, the 2nd character recognition part 540 produces | generates the 2nd recognition result information which shows the likelihood that it is each of several predetermined character type candidates about the character contained in the determination object document. In the present embodiment, a configuration is shown in which two character recognition units (first character recognition unit 530 and second character recognition unit 540) are provided, but three or more character recognition units may be provided.

ここで、予め定められる複数の文字種候補とは、例えば日本語であれば全ての平仮名、片仮名、漢字、記号からなり、英語であれば全てのアルファベットおよび記号からなる。図6は、本発明の第2の実施形態に係る第1認識結果情報および第2認識結果情報の例を示す図である。図6の第1認識結果情報および第2認識結果情報は、判定対象書面上の文字について、予め定められる文字種のそれぞれとする認識の尤度を示している。   Here, the plurality of predetermined character type candidates include, for example, all hiragana, katakana, kanji, and symbols in Japanese, and all alphabets and symbols in English. FIG. 6 is a diagram illustrating an example of the first recognition result information and the second recognition result information according to the second embodiment of the present invention. The first recognition result information and the second recognition result information in FIG. 6 indicate the likelihood of recognition for each of the predetermined character types for the characters on the determination target document.

認識結果情報統合部550は、第1文字認識部530により生成された第1認識結果情報、および第2文字認識部540により生成された第2認識結果情報を組み合わせて、統合認識結果情報を生成する。具体的には、認識結果情報統合部550は、複数の文字のそれぞれについて、同じ文字種の尤度として出力された値を成分とするm次元のベクトルを生成する。ここでmは文字認識部を識別する番号であり、2つの文字認識部が設けられる本実施形態ではm=0,1である。図7は、本発明の第2の実施形態に係る統合認識結果情報の一例を示す図である。   The recognition result information integration unit 550 generates integrated recognition result information by combining the first recognition result information generated by the first character recognition unit 530 and the second recognition result information generated by the second character recognition unit 540. To do. Specifically, the recognition result information integration unit 550 generates an m-dimensional vector whose component is a value output as the likelihood of the same character type for each of a plurality of characters. Here, m is a number for identifying a character recognition unit, and m = 0, 1 in the present embodiment in which two character recognition units are provided. FIG. 7 is a diagram showing an example of integrated recognition result information according to the second exemplary embodiment of the present invention.

文字識別部560は、判定対象文字について、当該判定対象文字について取得される前記第1認識結果情報及び前記第2認識結果情報の組み合わせた統合認識結果情報と、文字認識用学習データと、を用いて当該判定対象文字の文字種を判定する文字種判定処理を実行する。ここで、文字認識用学習データとは、学習用書面に含まれる複数の文字のそれぞれの文字種を示す教師情報と、学習用書面に対する第1文字認識部530による認識結果と学習書面に対する第2文字認識部540による認識結果との組み合わせと、を用いて予め生成される文字認識用学習データであり、記憶部570に記憶されている。この文字認識用学習データは、例えば第1の実施形態に係る文字認識学習装置100と同様の構成によって生成された学習データとしてもよい。文字識別部560は、例えばBoosting、ニューラルネットワーク、SVM(サポートベクタマシン)等の既知の識別手法を用いて文字識別処理を実行する。   The character identification unit 560 uses, for the determination target character, the integrated recognition result information obtained by combining the first recognition result information and the second recognition result information acquired for the determination target character, and character recognition learning data. Then, character type determination processing for determining the character type of the determination target character is executed. Here, the learning data for character recognition includes teacher information indicating each character type of a plurality of characters included in the learning document, a recognition result by the first character recognition unit 530 for the learning document, and a second character for the learning document. Character recognition learning data generated in advance using a combination with a recognition result obtained by the recognition unit 540 and stored in the storage unit 570. The learning data for character recognition may be learning data generated by the same configuration as the character recognition learning device 100 according to the first embodiment, for example. The character identification unit 560 executes character identification processing using a known identification method such as Boosting, neural network, SVM (support vector machine), or the like.

次に、文字認識装置500の動作をフローチャートを用いて説明する。図8は、本発明の第2の実施形態に係る文字認識装置500の動作を示すフローチャートである。   Next, the operation of the character recognition device 500 will be described using a flowchart. FIG. 8 is a flowchart showing the operation of the character recognition device 500 according to the second embodiment of the present invention.

まず、制御部110は、認識結果情報統合部550において保持されている、統合認識結果情報であるベクトルを格納する配列W[n][m]を初期化する(S801)。ここでnは文字種を識別する番号(0≦n<N)、mは第1文字認識部530および第2文字認識部540を識別する番号(0≦m<2)である。   First, the control unit 110 initializes an array W [n] [m] stored in the recognition result information integration unit 550 that stores vectors that are integrated recognition result information (S801). Here, n is a number for identifying the character type (0 ≦ n <N), and m is a number for identifying the first character recognition unit 530 and the second character recognition unit 540 (0 ≦ m <2).

次に、第1文字認識部530、および第2文字認識部540は、文字認識処理を実行する(S802)。第1文字認識部530、および第2文字認識部540による文字認識処理の結果は、認識結果情報統合部550に出力される。   Next, the first character recognition unit 530 and the second character recognition unit 540 perform a character recognition process (S802). The result of the character recognition processing by the first character recognition unit 530 and the second character recognition unit 540 is output to the recognition result information integration unit 550.

次に、認識結果情報統合部550は、第1文字認識部530、および第2文字認識部540から入力される文字認識結果を組み合わせて、統合認識結果情報を生成する(S803)。具体的には、文字認識結果に含まれる値を前述の配列W[n][m]に割り当てる。図7に示される統合認識結果情報の例では、W[0][0]=0.85、W[0][1]=0.8、W[1][0]=0.006、W[1][1]=0.075である。認識結果情報統合部550は、配列W[n][m]への値の割り当てを、0≦n<N、0≦m<2の各値について実行する。   Next, the recognition result information integration unit 550 generates the integrated recognition result information by combining the character recognition results input from the first character recognition unit 530 and the second character recognition unit 540 (S803). Specifically, the value included in the character recognition result is assigned to the array W [n] [m] described above. In the example of the integrated recognition result information illustrated in FIG. 7, W [0] [0] = 0.85, W [0] [1] = 0.8, W [1] [0] = 0.006, W [1] [1] = 0.075. The recognition result information integration unit 550 assigns values to the array W [n] [m] for each value of 0 ≦ n <N and 0 ≦ m <2.

そして文字識別部560は、S803で生成された統合認識結果情報を用いて文字識別処理を行う(S804)。以上で、文字認識装置500の動作は終了する。   The character identification unit 560 performs character identification processing using the integrated recognition result information generated in S803 (S804). Thus, the operation of the character recognition device 500 ends.

以上の構成により、複数の文字認識手段を用いた文字認識処理において、複数の文字認識手段による認識結果の組み合わせを用いて学習データを生成する文字認識学習装置100、および複数の文字認識手段による認識結果の組み合わせを用いて文字認識処理を行う文字認識装置500が提供される。   With the above configuration, in character recognition processing using a plurality of character recognition means, the character recognition learning device 100 that generates learning data using a combination of recognition results obtained by the plurality of character recognition means, and recognition by the plurality of character recognition means. A character recognition device 500 that performs character recognition processing using a combination of results is provided.

なお、上記の実施形態では2つの文字認識手段(第1文字認識部130,530、第2文字認識部140,540)が設けられる構成が示されたが、本発明はこれに限定されず、2つ以上の複数の文字認識手段が設けられる構成してもよい。   In the above embodiment, a configuration in which two character recognition means (first character recognition unit 130, 530, second character recognition unit 140, 540) are provided is shown, but the present invention is not limited to this, Two or more character recognition means may be provided.

また、上記の実施形態では、2つの文字認識手段において、全ての文字種とする認識の尤度が取得される構成が示されたが、尤度が予め設定される値より小さい文字種についての尤度を0に置き換える構成としてもよいし、尤度が大きいものから並べて、予め定められる順位以下の文字種についての尤度を0に置き換える構成としてもよい。また、必ずしも全ての文字種について尤度を取得する文字認識手段を用いる必要はなく、例えば尤度が予め定められる値以上である文字種についてのみ文字認識結果を出力するものを用いてもよい。これらの構成とした場合、扱われる情報の量が削減され、処理負荷が軽減されるとともに処理速度の向上が実現される。   In the above embodiment, the configuration is shown in which the likelihood of recognition for all character types is acquired by the two character recognition means. However, the likelihood for character types whose likelihood is smaller than a preset value is shown. May be replaced with 0, or may be arranged in descending order of likelihood, and the likelihood for character types below a predetermined order may be replaced with 0. In addition, it is not always necessary to use character recognition means for acquiring likelihoods for all character types. For example, a device that outputs character recognition results only for character types whose likelihood is equal to or greater than a predetermined value may be used. With these configurations, the amount of information to be handled is reduced, the processing load is reduced, and the processing speed is improved.

また、上記の実施形態では、電子ペン等を用いた、いわゆるオンライン処理による入力処理を行う入力受付装置200,600を用いる構成が示されたが、例えばスキャナ等のいわゆるオフライン処理による入力装置を用いる構成としてもよい。   Further, in the above-described embodiment, the configuration using the input receiving devices 200 and 600 for performing input processing by so-called online processing using an electronic pen or the like has been shown. However, for example, an input device by so-called offline processing such as a scanner is used. It is good also as a structure.

なお、ここで述べた文字認識学習装置100および文字認識装置500の動作は、文字認識学習装置100および文字認識装置500のそれぞれの記憶部170,570に記憶されるプログラムを動作させることで実現される。このプログラムは通信によって提供されてもよいし、コンピュータによる読み取りが可能な、CD−ROM等の記憶媒体に格納されて提供されてもよい。   The operations of the character recognition learning device 100 and the character recognition device 500 described here are realized by operating programs stored in the storage units 170 and 570 of the character recognition learning device 100 and the character recognition device 500, respectively. The This program may be provided by communication, or may be provided by being stored in a storage medium such as a CD-ROM that can be read by a computer.

100 文字認識学習装置、110 制御部、120 外部I/F部、130 第1文字認識部、140 第2文字認識部、150 認識結果情報統合部、160 学習データ生成部、170 記憶部、200 入力受付装置、500 文字認識装置、510 制御部、520 外部I/F部、530 第1文字認識部、540 第2文字認識部、550 認識結果情報統合部、560 文字識別部、570 記憶部、600 入力受付装置。   100 character recognition learning device, 110 control unit, 120 external I / F unit, 130 first character recognition unit, 140 second character recognition unit, 150 recognition result information integration unit, 160 learning data generation unit, 170 storage unit, 200 input Reception device, 500 character recognition device, 510 control unit, 520 external I / F unit, 530 first character recognition unit, 540 second character recognition unit, 550 recognition result information integration unit, 560 character identification unit, 570 storage unit, 600 Input reception device.

Claims (5)

学習用書面に含まれる複数の文字のそれぞれの文字種を含む教師情報を取得する教師情報取得手段と、
前記複数の文字ごとに、第1の文字認識手段による前記教師情報に含まれる複数の文字種のそれぞれに対する文字認識処理の結果を示す第1認識結果情報を取得する第1認識結果情報取得手段と、
前記複数の文字ごとに、前記第1の文字認識手段とは異なる処理方式を用いる前記教師情報に含まれる複数の文字種のそれぞれに対する第2の文字認識手段による文字認識処理の結果を示す第2認識結果情報を取得する第2認識結果情報取得手段と、
前記複数の文字ごとに、前記教師情報に含まれる該文字の文字種を示す情報と、当該文字について取得される、前記教師情報に含まれる複数の文字種のそれぞれに対する前記第1認識結果情報及び前記第2認識結果情報の組み合わせとを入力データとして用いて機械学習を実行し、実行結果を文字認識用学習データとして出力する学習データ出力手段と、
を含むことを特徴とする文字認識学習装置。
Teacher information acquisition means for acquiring teacher information including each character type of a plurality of characters included in the learning document;
For each of the plurality of characters, the first recognition result information obtaining means for obtaining a first recognition result information indicating the result of the character recognition processing for each of a plurality of character types contained in the instruction information by the first character recognition means,
For each of the plurality of characters, the second recognition indicating the result of the character recognition processing by the second character recognition means for each of a plurality of character types contained in the instruction information using different processing schemes and the first character recognition means Second recognition result information acquisition means for acquiring result information;
For each of the plurality of characters , information indicating the character type of the character included in the teacher information, the first recognition result information for each of the plurality of character types included in the teacher information acquired for the character, and the first Learning data output means for executing machine learning using a combination of two recognition result information as input data, and outputting the execution result as learning data for character recognition;
A character recognition learning apparatus comprising:
請求項1に記載の文字認識学習装置であって、
前記第1認識結果情報は、前記複数の文字のそれぞれについて、
該文字の認識結果として、前記第1の文字認識手段により認識された文字種を示す情報と、その尤度を示す情報と、を含み、
前記第2認識結果情報は、前記複数の文字のそれぞれについて、
該文字の認識結果として、前記第2の文字認識手段により認識された文字種を示す情報と、その尤度を示す情報と、を含む、
ことを特徴とする文字認識学習装置。
The character recognition learning device according to claim 1,
The first recognition result information is about each of the plurality of characters.
The character recognition result includes information indicating the character type recognized by the first character recognition means, and information indicating the likelihood,
The second recognition result information is about each of the plurality of characters.
The character recognition result includes information indicating the character type recognized by the second character recognition means, and information indicating the likelihood.
A character recognition learning device characterized by that.
請求項1に記載の文字認識学習装置であって、
前記第1認識結果情報は、前記複数の文字のそれぞれについて、
該文字の認識結果として、予め定められる複数の文字種候補のそれぞれについて、該文字の文字種が該文字種候補であるとの尤度を示す情報を含み、
前記第2認識結果情報は、前記複数の文字のそれぞれについて、
該文字の認識結果として、予め定められる複数の文字種候補のそれぞれについて、該文字の文字種が該文字種候補であるとの尤度を示す情報を含む、
ことを特徴とする文字認識学習装置。
The character recognition learning device according to claim 1,
The first recognition result information is about each of the plurality of characters.
As the recognition result of the character, for each of a plurality of predetermined character type candidates, including information indicating the likelihood that the character type of the character is the character type candidate,
The second recognition result information is about each of the plurality of characters.
For each of a plurality of predetermined character type candidates, the character recognition result includes information indicating the likelihood that the character type of the character is the character type candidate.
A character recognition learning device characterized by that.
請求項3に記載の文字認識学習装置であって、
前記学習データ出力手段は、
前記第1認識結果情報において、予め定められる値より小さい尤度を0に置き換え、
前記第2認識結果情報において、予め定められる値より小さい尤度を0に置き換えて、
前記機械学習を実行する、
ことを特徴とする文字認識学習装置。
The character recognition learning device according to claim 3,
The learning data output means includes
In the first recognition result information, a likelihood smaller than a predetermined value is replaced with 0,
In the second recognition result information, the likelihood smaller than a predetermined value is replaced with 0,
Performing the machine learning;
A character recognition learning device characterized by that.
コンピュータを、
学習用書面に含まれる複数の文字のそれぞれの文字種を含む教師情報を取得する教師情報取得手段、
前記複数の文字ごとに、第1の文字認識手段による前記教師情報に含まれる複数の文字種のそれぞれに対する文字認識処理の結果を示す第1認識結果情報を取得する第1認識結果情報取得手段、
前記複数の文字ごとに、前記第1の文字認識手段とは異なる処理方式を用いる第2の文字認識手段による前記教師情報に含まれる複数の文字種のそれぞれに対する文字認識処理の結果を示す第2認識結果情報を取得する第2認識結果情報取得手段、
前記複数の文字ごとに、前記教師情報に含まれる該文字の文字種を示す情報と、当該文字について取得される、前記教師情報に含まれる複数の文字種のそれぞれに対する前記第1認識結果情報及び前記第2認識結果情報の組み合わせとを入力データとして用いて機械学習を実行し、実行結果を文字認識用学習データとして出力する学習データ出力手段、
として機能させるためのプログラム。
Computer
Instruction information acquiring means to acquire the teaching information containing the respective character types of a plurality of characters included in the learning writing,
Wherein for each of a plurality of characters, the first recognition result information acquiring means to acquire the first recognition result information indicating the result of the character recognition processing for each of a plurality of character types contained in the instruction information by the first character recognition means,
For each of the plurality of characters, the second recognition indicating the result of the character recognition processing for each of a plurality of character types contained in the instruction information by the second character recognition means using different processing schemes and the first character recognition means second recognition result information acquiring means to acquire the result information,
For each of the plurality of characters , information indicating the character type of the character included in the teacher information, the first recognition result information for each of the plurality of character types included in the teacher information acquired for the character, and the first second recognition results using a combination of information as input data to perform machine learning, learning data output means to output the execution result as a character recognition training data,
Program to function as.
JP2012069779A 2012-03-26 2012-03-26 Character recognition learning device, character recognition device, and program Active JP5974576B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012069779A JP5974576B2 (en) 2012-03-26 2012-03-26 Character recognition learning device, character recognition device, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012069779A JP5974576B2 (en) 2012-03-26 2012-03-26 Character recognition learning device, character recognition device, and program

Publications (2)

Publication Number Publication Date
JP2013200796A JP2013200796A (en) 2013-10-03
JP5974576B2 true JP5974576B2 (en) 2016-08-23

Family

ID=49520969

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012069779A Active JP5974576B2 (en) 2012-03-26 2012-03-26 Character recognition learning device, character recognition device, and program

Country Status (1)

Country Link
JP (1) JP5974576B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107346448B (en) * 2016-05-06 2021-12-21 富士通株式会社 Deep neural network-based recognition device, training device and method
JP6590355B1 (en) * 2019-04-26 2019-10-16 Arithmer株式会社 Learning model generation device, character recognition device, learning model generation method, character recognition method, and program

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3110552B2 (en) * 1992-05-07 2000-11-20 三菱電機株式会社 Character recognition device
JPH07271899A (en) * 1994-03-31 1995-10-20 Toshiba Corp Character recognition device
JPH08272907A (en) * 1995-03-28 1996-10-18 Toshiba Corp Device and method for character recognition
JP3095069B2 (en) * 1998-03-26 2000-10-03 日本電気株式会社 Character recognition device, learning method, and recording medium storing character recognition program

Also Published As

Publication number Publication date
JP2013200796A (en) 2013-10-03

Similar Documents

Publication Publication Date Title
JP6542870B2 (en) Superimposed handwritten character recognition technology system and superimposed handwritten character recognition technology method
CN102449640B (en) Recognizing handwritten words
EP2802975B1 (en) Intelligent touchscreen keyboard with finger differentiation
Mathew et al. Multilingual OCR for Indic scripts
US9286527B2 (en) Segmentation of an input by cut point classification
EP1854047A1 (en) Segmentation-based recognition
WO2006061852A1 (en) System, method, and apparatus for triggering recognition of a handwritten shape
KR20210017090A (en) Method and electronic device for converting handwriting input to text
KR20130057930A (en) Image processing apparatus and image processing method
KR20180104678A (en) System and method for recognizing multiple object structures
JP6600973B2 (en) Character recognition device, character recognition processing system, and program
KR20220038477A (en) Extract line of text
CN110414622B (en) Classifier training method and device based on semi-supervised learning
US9536180B2 (en) Text recognition based on recognition units
JP2017090998A (en) Character recognizing program, and character recognizing device
JP5974576B2 (en) Character recognition learning device, character recognition device, and program
US9224038B2 (en) Partial overlap and delayed stroke input recognition
US7979795B2 (en) System and method for inputting syllables of a phonetic script into a computer
US9251412B2 (en) Segmentation of devanagari-script handwriting for recognition
CN107912062B (en) System and method for overlaying handwriting
US20230084641A1 (en) Math detection in handwriting
US11508139B2 (en) Information processing apparatus and non-transitory computer readable medium
JP6310155B2 (en) Character recognition device, character recognition method, and character recognition program
KR102212994B1 (en) Method and apparatus for automatically generating font
US9342739B2 (en) Character recognition apparatus, non-transitory computer readable medium, and character recognition method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160621

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160704

R150 Certificate of patent or registration of utility model

Ref document number: 5974576

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350