JP5807342B2 - 文字認識装置及びプログラム - Google Patents

文字認識装置及びプログラム Download PDF

Info

Publication number
JP5807342B2
JP5807342B2 JP2011034900A JP2011034900A JP5807342B2 JP 5807342 B2 JP5807342 B2 JP 5807342B2 JP 2011034900 A JP2011034900 A JP 2011034900A JP 2011034900 A JP2011034900 A JP 2011034900A JP 5807342 B2 JP5807342 B2 JP 5807342B2
Authority
JP
Japan
Prior art keywords
character
characters
recognition
unit
composite
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011034900A
Other languages
English (en)
Other versions
JP2012173959A (ja
Inventor
英人 織田
英人 織田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2011034900A priority Critical patent/JP5807342B2/ja
Priority to US13/190,224 priority patent/US8731298B2/en
Priority to CN2011102719561A priority patent/CN102646201A/zh
Publication of JP2012173959A publication Critical patent/JP2012173959A/ja
Application granted granted Critical
Publication of JP5807342B2 publication Critical patent/JP5807342B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/268Lexical context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Character Discrimination (AREA)

Description

本発明は、文字認識装置及びプログラムに関する。
手書きの文字をテキストデータに変換する文字認識技術が知られている。例えば、特許文献1には、濁点又は半濁点付き文字が隣接する2個の文字枠に記入されたときに、その文字を濁点又は半濁点付きの1個の文字に変換する技術が記載されている。特許文献2には、手書きで入力された文字が大文字であるか小文字であるかを判別する技術が記載されている。特許文献3には、濁点又は半濁点を正確に識別する技術が記載されている。特許文献4には、同じ形状で大きさの異なる文字を認識候補として表示する技術が記載されている。
特開平6−76098号公報 特開平5−12245号公報 特開平7−262314号公報 特開平9−231316号公報
本発明は、文字列に複合文字が含まれる場合であっても、文字列を精度よく認識することを目的とする。
本発明は、一の態様において、枠間に間隔がある枠に記入された文字列を表すデータを取得する取得部と、前記取得されたデータが表す文字列から、複数の構成要素により構成される複合文字の一の構成要素を判別するために予め決められた条件を満たす文字を特定する特定部と、前記特定された文字と、当該文字が前記複合文字の一の構成要素である場合に当該複合文字の他の構成要素となる文字とが近づくように、当該特定された文字を移動する移動部とを備える文字認識装置を提供する。
好ましい態様において、前記文字認識装置は、文字の形及び隣接する文字間の関連性に基づいて、前記移動部により文字の移動が行われた後の文字列を認識する認識部をさらに備える
好ましい態様において、前記文字認識装置は、文字列において一の文字に続いて他の文字が現れる可能性の程度を示す値を記憶する記憶部を備え、前記認識部は、前記移動が行われた後の文字列を認識するときに、認識の対象となる文字の形に基づいて複数の文字を認識候補として特定し、前記記憶部に記憶された値に基づき、当該特定された複数の文字の中から、当該認識の対象となる文字の直前にある文字に続いて現れる可能性が最も高い文字を選択する。
好ましい態様において、前記文字列は、複数の区切られた領域の中に記載されたものであり、前記移動された文字が記載された領域と、前記他の構成要素となる文字が記載された領域とを統合する統合部を備え、前記認識部は、前記認識の対象となる文字が、前記統合部により統合されていない領域に記載されている場合には、当該文字の形に基づいて1字の文字を認識候補として特定し、当該認識の対象となる文字が、前記統合部により統合された領域に記載されている場合には、当該文字の形に基づいて1字又は複数字の文字を認識候補として特定する。
好ましい態様において、前記特定部は、濁点又は半濁点を判別するために予め決められた条件を満たす文字を特定し、前記移動部は、前記特定された文字と、当該特定された文字の直前にある文字とが近づくように、当該特定された文字を移動する。
好ましい態様において、前記条件は、文字の位置及び画数である。
本発明は、他の観点において、コンピュータに、文字列を表すデータを取得するステップと、前記取得されたデータが表す文字列から、複数の構成要素により構成される複合文字の一の構成要素を判別するために予め決められた条件を満たす文字を特定するステップと、前記特定された文字と、当該文字が前記複合文字の一の構成要素である場合に当該複合文字の他の構成要素となる文字とが近づくように、当該特定された文字を移動するステップとを実行させるためのプログラムを提供する
請求項1に係る発明によれば、文字列に複合文字が含まれる場合であっても、文字の移動を行わずに文字列の認識を行う場合に比べて、文字列を精度よく認識することができる。
請求項2に係る発明によれば、記憶部に記憶された値を用いずに文字列を認識する場合に比べて、文字列の認識精度が向上する。
請求項3に係る発明によれば、認識候補として特定される文字の字数に全く制限がない場合に比べて、文字列の認識精度が向上する。
請求項4に係る発明によれば、濁点又は半濁点とその他の構成要素により構成される複合文字を認識することができる。
請求項5に係る発明によれば、文字の位置及び画数以外の条件が用いられる場合に比べて、濁点又は半濁点を判別するために予め決められた条件を満たす文字を特定する処理にかかる時間が短くなる。
請求項6に係る発明によれば、文字列に複合文字が含まれる場合であっても、文字の移動を行わずに文字列の認識を行う場合に比べて、文字列を精度よく認識することができる。
文字認識装置の構成を示す図。 辞書に記述された遷移確率の一例を示す図。 制御部の機能構成を示す図。 文字列の一例を示す図。 制御部が行う処理を示すフローチャート。 文字の移動を説明する図。 統合された枠の一例を示す図。 文字列を認識する処理を説明する図。 文字列を認識する処理を説明する図。 変形例に係る複合文字を構成する文字を示す図。 変形例に係る複合文字を構成する文字を示す図。
図1は、本実施形態に係る文字認識装置1の構成を示す図である。文字認識装置1は、制御部11と、記憶部12と、入出力部13とを備える。制御部11は、CPU(Central Processing Unit)とメモリを備える。CPUは、メモリに記憶されているプログラムを実行することにより、各種の処理を行う。記憶部12は、例えば不揮発性のメモリを備え、文字認識に用いられる辞書120を記憶する。入出力部13は、外部の装置とデータのやり取りを行う。
辞書120には、複数の人名が登録されている。また、辞書120には、人名において一の文字に続いて他の文字が現れる可能性の程度を示す遷移確率が記述されている。なお、この一の文字と他の文字とは、それぞれ一字であってもよいし複数字であってもよい。図2は、辞書120に記述された遷移確率の一例を示す図である。図2では、文字「エ」から文字「ビ」への遷移確率として0.6が記述され、文字「ヒハ」への遷移確率として0.2が記述され、文字「ヒリ」への遷移確率として0.1が記述されている。これは、文字「エ」の後には、文字「ヒハ」や文字「ヒリ」が現れるよりも、文字「ビ」が現れる方が、より確からしい文字列になることを意味する。
図3は、制御部11の機能構成を示す図である。制御部11は、取得部21と、特定部22と、移動部23と、統合部24と、認識エンジン25として機能する。取得部21は、文字列を表すデータを取得する。この文字列は、例えば複数の区切られた領域の中に記載されたものである。特定部22は、取得部21により取得されたデータが表す文字列から、複数の構成要素により構成される複合文字の一の構成要素を判別するために予め決められた条件を満たす文字を特定する。移動部23は、特定部22により特定された文字と、この文字が複合文字の一の構成要素である場合にこの複合文字の他の構成要素となる文字とが近づくように、この特定された文字を移動する。統合部24は、移動部23により移動された文字が記載された領域と、移動された文字が複合文字の一の構成要素である場合にこの複合文字の他の構成要素となる文字が記載された領域とを統合する。認識エンジン25は、文字の形及び隣接する文字間の関連性に基づいて、移動部23により文字の移動が行われた後の文字列を認識する。例えば、認識エンジン25は、認識の対象となる文字が、統合部24により統合されていない領域に記載されている場合には、文字の形に基づいて1字の文字を認識候補として特定し、認識の対象となる文字が、統合部24により統合された領域に記載されている場合には、文字の形に基づいて1字又は複数字の文字を認識候補として特定する。続いて、認識エンジン25は、認識の対象となる文字の形に基づいて複数の文字を認識候補として特定し、記憶部12に記憶された遷移確率に基づき、この特定された複数の文字の中から、認識の対象となる文字の直前の文字に続いて現れる可能性が最も高い文字を選択する。
次に、文字認識装置1の動作について説明する。文字認識装置1には、入出力部13を介して文字列を示すデータが入力される。図4は、入力されたデータが表す文字列の一例を示す図である。文字列に含まれる文字は、それぞれ枠31〜39の中に記載されている。この枠31〜39は、それぞれ区切られた領域である。枠31〜39の大きさ及び位置は予め決められている。この文字列には、複数の構成要素により構成される複合文字「ビ」及び「ジ」が含まれる。複合文字「ビ」は、文字「ヒ」と濁音とで構成される。図4に示すように、この文字「ヒ」と濁音とは異なる枠に記載されている。同様に、複合文字「ジ」は、文字「シ」と濁点とで構成される。図4に示すように、この文字「シ」と濁点とは異なる枠に記載されている。制御部11は、入出力部13を介して入力されたデータを取得すると、以下の処理を行う。
図5は、制御部11が行う処理を示すフローチャートである。ステップS1において、制御部11は、変数iを初期値の1に設定する。また、制御部11は、変数Nを設定する。具体的には、制御部11は、入力されたデータに基づき、枠に記載された文字の数を算出する。そして、算出した数に1を加えた数を変数Nとして設定する。図4では、枠31〜39に9個の文字が記載されている。したがって、9に1を加えた10が変数Nとして設定される。制御部11は、変数iがNよりも小さい間、変数iに1を加えてステップS1からS6までの処理を繰り返す。
ステップS2において、制御部11は、入力されたデータに基づき、i番目の文字が濁点又は半濁点である可能性があるか否かを判定する。なお、このi番目とは、文字列における文字の並び順を示す。したがって、文字列において先頭の文字が1番目の文字となり、その次の文字が2番目の文字となる。制御部11は、濁点又は半濁点を判別するために予め決められた条件を用いて、濁点又は半濁点である可能性がある文字を特定する。ここでは、文字が枠の3分の2よりも上側に位置し、且つ文字の画数が2以下であるという条件を用いて、濁点又は半濁点である可能性がある文字が特定される。図4では、枠33に記載された文字が、枠33の3分の2よりも上側に位置し、且つ文字の画数が2以下である。同様に、枠39に記載された文字は、枠39の3分の2よりも上側に位置し、且つ文字の画数が2以下である。この場合、枠33及び枠39に記載された文字は、それぞれ濁点又は半濁点である可能性があると判定される。一方、これ以外の文字については、この条件に当てはまらないため、濁点又は半濁点である可能性がないと判定される。
i番目の文字が濁点又は半濁点である可能性がない場合(ステップS2;NO)、制御部11は、ステップS3に進む。ステップS3において、制御部11は、i番目の文字を認識するときに用いる方法として、孤立文字認識を指定する。これにより、図4に示す枠33及び39以外の枠に記載された文字については、この孤立文字認識が適用される。孤立文字認識とは、1つの枠に1字の文字が記載されていることを前提として、文字認識を行う方法である。したがって、孤立文字認識では、1つの枠から1字の文字が認識される。一方、i番目の文字が濁点又は半濁点である可能性がある場合(ステップS2;YES)、制御部11は、ステップS4に進む。
ステップS4において、制御部11は、i番目の文字とi−1番目の文字とが近づくように、i番目の文字を移動する。図4では、枠33に記載された文字と枠39に記載された文字とがそれぞれ移動される。図6は、この文字の移動を説明する図である。図6では、枠33に記載された文字がi番目の文字であり、枠32に記載された文字がi−1番目の文字である。まず、制御部11は、枠33に記載された文字の外接矩形43と、枠32に記載された文字の外接矩形42とを求める。次に、制御部11は、外接矩形43が外接矩形42に接するまで、枠33に記載された文字を移動する。これにより、枠33に記載された文字と、枠32に記載された文字との間の距離が縮まり、これらの文字を単一の複合文字であると認識し易くなる。
ステップS5において、制御部11は、i番目の文字が記載された枠とi−1番目の文字が記載された枠とを統合する。図4では、枠32と枠33とが統合され、さらに枠38と枠39とが統合される。図7は、統合された枠の一例を示す図である。図7では、図4に示す枠32と枠33とが統合されて、統合枠32aが生成されている。また、図4に示す枠38と枠39とが統合されて、統合枠38aが生成されている。なお、この枠の統合とは、文字認識を行うときに、統合前の複数の枠に記載された文字を1まとまりとして扱うことを意味する。したがって、統合枠の大きさ及び形状は、1まとまりとして扱う文字を含むものであればよい。次に、制御部11は、統合枠に記載された文字を認識するときに用いる方法として、枠なし文字列認識を指定する。これにより、図7に示す統合枠32a及び統合枠38aに記載された文字については、この枠なし文字列認識が適用される。枠なし文字列認識とは、1つの枠に記載されている文字の数が決まっていないことを前提として、文字認識を行う方法である。したがって、枠なし文字列認識では、1つの枠から1字又は複数字の文字が認識される。なお、枠なし文字列認識では、枠に記載された文字の字数に制限がないため、一般的には、孤立文字認識よりも文字認識の精度が低くなる。ステップS6において、制御部11は、変数iが変数Nになると、処理の繰り返しを終了する。
ステップS7において、制御部11は、記憶部12に記憶された辞書120を用いて、文字の移動が行われた後の文字列を認識する処理を行う。図8は、文字列を認識する処理を説明する図である。まず、制御部11は、各枠に記載された文字の形に基づき、認識候補となる文字を特定する。このとき、制御部11は、枠31及び枠34〜37に記載された文字については、孤立文字認識により1字の文字を特定する。一方、制御部11は、統合枠32a及び統合枠38aに記載された文字については、枠なし文字列認識により1字又は複数字の文字を特定する。
次に、制御部11は、文脈処理を行って、認識候補として特定された文字の中から、隣接する文字との関連性が高い文字を選択する。図8では、枠32aに記載された文字の認識候補として、文字「ビ」、文字「ヒハ」、及び文字「ヒリ」が特定されている。この場合、制御部11は、枠31に記載された文字からこれら各文字への遷移確率に基づき、認識候補として特定された文字の中から、枠31に記載された文字に続いて現れる可能性が最も高い文字を選択する。ここでは、枠31に記載された文字として、「エ」が認識された場合を想定する。図2では、文字「エ」から文字「ビ」への遷移確率として0.6が記述され、文字「ヒハ」への遷移確率として0.2が記述され、文字「ヒリ」への遷移確率として0.1が記述されている。この場合、文字「エ」から文字「ビ」への遷移確率が最も高いため、文字「ビ」が選択される。
このようにして文字列を認識した後、制御部11は、認識した文字列を表すテキストデータを生成する。生成されたテキストデータは、入出力部13から外部の装置へ出力される。例えば、テキストデータは、画像形成装置に出力される。この場合、画像形成装置は、文字認識装置1から出力されたテキストデータが表す文字列を用紙に形成する。あるいは、テキストデータは、表示装置に出力されてもよい。この場合、表示装置は、文字認識装置1から出力されたテキストデータが表す文字列を表示する。
なお、図4に示す枠35に記載された文字は濁点でも半濁点でもないが、画数が2以下であるため、例えばこの文字が枠35の3分の2よりも上側の位置に記載された場合には、ステップS2において、濁点又は半濁点である可能性があると誤判定されることがある。この場合、ステップS4では、枠35に記載された文字と枠34に記載された文字とが近づくように、枠35に記載された文字が移動される。ステップS5では、枠34と枠35とが統合され、統合枠34aが生成される。そして、この統合枠34aに記載された文字を認識するときに用いられる方法として、枠なし文字列認識が指定される。
そして、ステップS7では、統合枠34aに記載された文字の形に基づき、図9に示すような文字が認識候補として特定される。統合枠34aに記載された文字「ニ」は、濁点と形状が類似している。したがって、図9では、統合枠34aに記載された文字の認識候補として、文字「ダ」、及び文字「タニ」が特定されている。ここでは、枠32aに記載された文字として、「ビ」が認識された場合を想定する。図2では、文字「ビ」から文字「ダ」への遷移確率として0.1が記述され、文字「タニ」への遷移確率として0.3が記述されている。この場合、文字「ビ」から文字「タニ」への遷移確率が最も高いため、文字「タニ」が選択される。
このように、この実施形態では、濁点又は半濁点である可能性がある文字が特定された場合に、その文字と、その文字の直前にある文字とを組み合わせて1つの複合文字とするか否かを、文脈処理により決定する。したがって、濁点又は半濁点ではない文字が濁点又は半濁点である可能性があると誤判定された場合にも、文脈処理により正しい文字に修正される。
本発明は、上述した実施形態に限定されるものではなく、変形して実施されてもよい。以下、変形例をいくつか説明する。また、以下の変形例は、それぞれ組み合わせて実施されてもよい。
(変形例1)
文字列には、記号や数字が含まれてもよい。記号や数字には、例えばセルシウス度の記号、分数、括弧つきの数字のように、複数の構成要素により構成されるものがある。これらの記号又は数字は、濁点又は半濁点が付加された文字と同様に、複合文字として扱われてもよい。また、文字列には、日本語以外の言語の文字が含まれていてもよい。日本語以外の言語の文字には、例えばアクセント記号付きのラテン文字、ハングル文字のように、複数の構成要素により構成されるものがある。これらの文字は、濁点又は半濁点が付加された文字と同様に、複合文字として扱われてもよい。さらに、文字列には、漢字が含まれていてもよい。漢字には、偏(左側に配置される構成要素)とつくり(右側に配置される構成要素)とで構成されるものがある。これらの漢字は、濁点又は半濁点が付加された文字と同様に、複合文字として扱われてもよい。
このように、複合文字は、濁点又は半濁点が付加された文字に限らない。複合文字は、複数の構成要素により構成される文字(記号、数字を含む。)であればよい。この構成要素とは、複合文字の一部であり、複合文字の他の部分から離れて記載される可能性があるものをいう。したがって、一般的に、単一の複合文字を構成する複数の構成要素は、それぞれ分離したものである。また、各構成要素は、単独でも使用される文字であってもよい。
ここで、文字列にこのような複合文字が含まれる場合の処理の概念について説明する。図10は、複合文字40を構成する文字41及び42を示す図である。文字41は、複合文字40において左側に配置される構成要素である。文字42は、複合文字40において右側に配置される構成要素である。この文字41及び42は、それぞれ1つの枠の中に記載されている。この場合、制御部11は、入力されたデータが表す文字列から、複合文字40の一の構成要素を判別するために予め決められた条件を満たす文字を特定する。この条件は、構成要素の特徴であり、例えば構成要素の位置及び画数である。あるいは、制御部11は、パターンマッチングを行うことにより、複合文字40の一の構成要素と類似する文字を特定してもよい。次に、制御部11は、特定した文字と他の構成要素となる文字とが近づくように、特定した文字を移動する。例えば、複合文字40の左側の構成要素の特徴が条件として用いられた場合には、文字41が特定される。この場合、図10(b)に示すように、特定された文字41と文字42とが近づくように、文字41が右側に移動される。一方、複合文字40の右側の構成要素の特徴が条件として用いられた場合には、文字42が特定される。この場合、図10(a)に示すように、特定された文字42と文字41とが近づくように、文字42が左側に移動される。
この処理によれば、例えば文字列にセルシウス度の記号が含まれている場合には、この記号において右側に配置される文字「C」と左上に配置される丸とが近づくように、文字「C」又は丸が移動される。これにより、セルシウス度の記号を構成する丸と文字「C」との間の距離が縮まり、これらの文字が単一の複合文字であると認識され易くなる。また、文字列に偏とつくりとで構成される漢字が含まれている場合には、この漢字において左側に配置される偏と右側に配置されるつくりとが近づくように、偏又はつくりが移動される。これにより、この漢字を構成する偏とつくりとの間の距離が縮まり、これらの文字が単一の複合文字であると認識され易くなる。
図11は、複合文字50を構成する文字51及び52を示す図である。文字51は、複合文字50において上側に配置される構成要素である。文字52は、複合文字50において下側に配置される構成要素である。この文字51及び52は、それぞれ1つの枠の中に記載されている。この場合、制御部11は、入力されたデータが表す文字列から、複合文字50の一の構成要素を判別するために予め決められた条件を満たす文字を特定する。この条件は、構成要素の特徴であり、例えば構成要素の位置及び画数である。あるいは、制御部11は、パターンマッチングを行うことにより、複合文字50の一の構成要素と類似する文字を特定してもよい。次に、制御部11は、特定した文字と他の構成要素となる文字とが近づくように、特定した文字を移動する。例えば、複合文字50の上側の構成要素の特徴が条件として用いられた場合には、文字51が特定される。この場合、図11(a)に示すように、特定された文字51と文字52とが近づくように、文字51が下側に移動される。一方、複合文字50の下側の構成要素の特徴が条件として用いられた場合には、文字52が特定される。この場合、図11(b)に示すように、特定された文字52と文字51とが近づくように、文字52が上側に移動される。
この処理によれば、例えば文字列にアクセント記号付きのラテン文字が含まれている場合には、このラテン文字において上側に配置されるアクセント記号と下側に配置される文字とが近づくように、例えばアクセント記号が移動される。これにより、このラテン文字を構成する文字とアクセント記号との間の距離が縮まり、これらの文字が単一の複合文字であると認識され易くなる。
なお、複合文字は、3つ以上の構成要素により構成されてもよい。この場合、制御部11は、構成要素の数をMとしたときに、少なくともM−1個の構成要素となる可能性がある文字を特定し、特定した文字と他の構成要素となる文字とが近づくように、特定した文字をそれぞれ移動する。
(変形例2)
実施形態では、ステップS4において、i番目の文字の外接矩形がi−1番目の文字の外接矩形に接するまで、i番目の文字が移動されていた。しかしながら、これらの外接矩形が接する前に文字の移動を止めてもよい。また、i番目の文字とi−1番目の文字とが重ならなければ、これらの外接矩形が重なるまで文字の移動を行ってもよい。また、i番目の文字とi−1番目の文字とが両方とも移動されてもよい。要するに、制御部11は、複合文字の一の構成要素である可能性がある文字と、その複合文字の他の構成要素となる文字とが近づくように、文字を移動すればよい。
(変形例3)
実施形態では、文字が枠の3分の2よりも上側に位置し、且つ文字の画数が2以下であるという条件を用いて、濁点又は半濁点である可能性がある文字を特定していた。しかしながら、例えばi番目の文字と濁点又は半濁点とをパターンマッチングすることにより、濁点又は半濁点である可能性がある文字を特定してもよい。ただし、この場合には、処理量が増えるため、濁点又は半濁点である可能性がある文字を特定する処理にかかる時間が長くなる。
(変形例4)
辞書120に登録される情報は、人名に限らない。例えば、インターネット上で公開されている文章に含まれる文字列であってもよい。また、辞書120に記述される遷移確率は、予め大量の文章を学習して求めたものであってもよい。
(変形例5)
実施形態では、認識の対象となる文字の1つ前にある文字と、認識の対象となる文字との関連性に基づいて、文脈処理が行われていた。しかしながら、認識の対象となる文字の1つ後ろにある文字と、認識の対象となる文字との関連性に基づいて、文脈処理が行われてもよい。この場合、辞書120には、文字列において一の文字の直前に他の文字が現れる可能性の程度を示す値が記述される。また、制御部11は、文脈処理を行うときに、文字列を後ろから認識していく。要するに、制御部11は、隣接する文字間の関係性に基づき、文字列を認識すればよい。
(変形例6)
文字認識装置1は、用紙に記載された文字列を認識するものであってもよい。この用紙には、予め複数の枠がプリントされている。ユーザは、この複数の枠の中に手書きで文字列を記入する。スキャナ装置は、用紙に記載された文字列を光学的に読み取り、この文字列を表すデータを文字認識装置1に入力する。文字認識装置1は、スキャナ装置から入力されたデータに基づき、上述した処理を行う。なお、スキャナ装置は、上述した画像形成装置と一体に設けられてもよい。この場合、文字認識装置1は、この画像形成装置の内部に設けられてもよい。
(変形例7)
文字認識装置1は、タブレットやタッチパネルなどの座標入力装置を用いて入力された文字列を認識するものであってもよい。この座標入力装置は、複数の枠を表示する。ユーザは、例えば専用のペンを用いて、この複数の枠の中に手書きで文字列を書き込む。座標入力装置は、このペンの動きを検出し、検出した動きを示す時系列座標データを文字認識装置1に入力する。文字認識装置1は、座標入力装置から入力された時系列座標データに基づき、上述した処理を行う。この場合、文字認識装置1は、文字の形に加え、文字の筆順を利用して文字認識を行ってもよい。
(変形例8)
実施形態では、枠によって区切られた領域の中に文字が記載されていたが、この枠はなくてもよい。例えば、他の領域とは異なる色を有する、区切られた領域の中に文字が記載されてもよい。
(変形例9)
取得部21、特定部22、移動部23及び統合部24と、認識エンジン25とは、別の筐体に設けられていてもよい。この場合、移動部23により文字が移動された後の文字列を示すデータが認識エンジン25に送られる。認識エンジン25は、ステップS3又はS5において指定された文字認識の方法に従って、送られてきたデータが表す文字列を認識する。
(変形例10)
制御部11は、ASIC(Application Specific Integrated Circuit)を備えてもよい。この場合、制御部11の機能は、ASICにより実現されてもよいし、CPUとASICの両方で実現されてもよい。
(変形例11)
制御部11の機能を実現するプログラムは、磁気媒体(磁気テープ、磁気ディスク(HDD(Hard Disk Drive)、FD(Flexible Disk))など)、光媒体(光ディスク(CD(Compact Disc)、DVD(Digital Versatile Disk))など)、光磁気媒体、半導体メモリなどのコンピュータ読み取り可能な媒体に記憶した状態で提供し、文字認識装置1にインストールしてもよい。また、通信回線を介してダウンロードしてインストールしてもよい。
1…文字認識装置、11…制御部、12…記憶部、13…入出力部、21…取得部、22…特定部、23…移動部、24…統合部、25…認識エンジン、120…辞書

Claims (7)

  1. 枠間に間隔がある枠に記入された文字列を表すデータを取得する取得部と、
    前記取得されたデータが表す文字列から、複数の構成要素により構成される複合文字の
    一の構成要素を判別するために予め決められた条件を満たす文字を特定する特定部と、
    前記特定された文字と、当該文字が前記複合文字の一の構成要素である場合に当該複合文字の他の構成要素となる文字とが近づくように、当該特定された文字を移動する移動部と
    を備えることを特徴とする文字認識装置。
  2. 文字の形及び隣接する文字間の関連性に基づいて、前記移動部により文字の移動が行われた後の文字列を認識する認識部をさらに備える
    ことを特徴とする請求項1に記載の文字認識装置。
  3. 文字列において一の文字に続いて他の文字が現れる可能性の程度を示す値を記憶する記憶部を備え、
    前記認識部は、前記移動が行われた後の文字列を認識するときに、認識の対象となる文字の形に基づいて複数の文字を認識候補として特定し、前記記憶部に記憶された値に基づき、当該特定された複数の文字の中から、当該認識の対象となる文字の直前にある文字に続いて現れる可能性が最も高い文字を選択する
    ことを特徴とする請求項に記載の文字認識装置。
  4. 前記文字列は、複数の区切られた領域の中に記載されたものであり、
    前記移動された文字が記載された領域と、前記他の構成要素となる文字が記載された領域とを統合する統合部を備え、
    前記認識部は、
    前記認識の対象となる文字が、前記統合部により統合されていない領域に記載されている場合には、当該文字の形に基づいて1字の文字を認識候補として特定し、当該認識の対象となる文字が、前記統合部により統合された領域に記載されている場合には、当該文字の形に基づいて1字又は複数字の文字を認識候補として特定する
    ことを特徴とする請求項3に記載の文字認識装置。
  5. 前記特定部は、濁点又は半濁点を判別するために予め決められた条件を満たす文字を特定し、
    前記移動部は、前記特定された文字と、当該特定された文字の直前にある文字とが近づくように、当該特定された文字を移動する
    ことを特徴とする請求項1から4のいずれか1項に記載の文字認識装置。
  6. 前記条件は、文字の位置及び画数である
    ことを特徴とする請求項5に記載の文字認識装置。
  7. コンピュータに、
    枠間に間隔がある枠に記入された文字列を表すデータを取得するステップと、
    前記取得されたデータが表す文字列から、複数の構成要素により構成される複合文字の一の構成要素を判別するために予め決められた条件を満たす文字を特定するステップと、
    前記特定された文字と、当該文字が前記複合文字の一の構成要素である場合に当該複合文字の他の構成要素となる文字とが近づくように、当該特定された文字を移動するステップと
    を実行させるためのプログラム。
JP2011034900A 2011-02-21 2011-02-21 文字認識装置及びプログラム Active JP5807342B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2011034900A JP5807342B2 (ja) 2011-02-21 2011-02-21 文字認識装置及びプログラム
US13/190,224 US8731298B2 (en) 2011-02-21 2011-07-25 Character recognition apparatus, character recognition method, and computer readable medium storing program
CN2011102719561A CN102646201A (zh) 2011-02-21 2011-09-09 字符识别设备和字符识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011034900A JP5807342B2 (ja) 2011-02-21 2011-02-21 文字認識装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2012173959A JP2012173959A (ja) 2012-09-10
JP5807342B2 true JP5807342B2 (ja) 2015-11-10

Family

ID=46652784

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011034900A Active JP5807342B2 (ja) 2011-02-21 2011-02-21 文字認識装置及びプログラム

Country Status (3)

Country Link
US (1) US8731298B2 (ja)
JP (1) JP5807342B2 (ja)
CN (1) CN102646201A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5647919B2 (ja) * 2011-03-07 2015-01-07 株式会社Nttドコモ 文字認識装置、文字認識方法、文字認識システム、および文字認識プログラム
JP6003705B2 (ja) * 2013-02-14 2016-10-05 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
US9430702B2 (en) * 2014-07-10 2016-08-30 Korea Electronics Technology Institute Character input apparatus and method based on handwriting
JP6390501B2 (ja) * 2015-04-15 2018-09-19 京セラドキュメントソリューションズ株式会社 学習支援装置および学習支援方法
CN105894475B (zh) * 2016-04-21 2018-09-28 上海师范大学 一种国际音标图像字符细化方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4611346A (en) * 1983-09-29 1986-09-09 International Business Machines Corporation Method and apparatus for character recognition accommodating diacritical marks
JPH0676098A (ja) 1990-12-12 1994-03-18 Toshiba Corp データ処理装置
JPH0512245A (ja) 1991-07-05 1993-01-22 Kyocera Corp 手書入力方法
JPH07129717A (ja) * 1993-11-01 1995-05-19 Oki Electric Ind Co Ltd オンライン文字切出し装置
JP3344062B2 (ja) 1994-03-18 2002-11-11 富士通株式会社 カタカナ手書き文字切り出し回路
JPH09190497A (ja) * 1995-12-15 1997-07-22 Oki Electric Ind Co Ltd 文字認識装置
JPH09231316A (ja) 1996-02-28 1997-09-05 Casio Comput Co Ltd 手書き文字認識装置
TW490643B (en) * 1996-05-21 2002-06-11 Hitachi Ltd Estimated recognition device for input character string
JP3275704B2 (ja) * 1996-05-21 2002-04-22 株式会社日立製作所 入力文字列推測認識装置
US6243701B1 (en) * 1998-06-29 2001-06-05 Microsoft Corporation System and method for sorting character strings containing accented and unaccented characters
JP2000353215A (ja) * 1999-06-11 2000-12-19 Nec Corp 文字認識装置および文字認識プログラムを記録した記録媒体
CN1303564C (zh) * 2003-06-12 2007-03-07 摩托罗拉公司 改进的电子设备中字符输入的识别方法

Also Published As

Publication number Publication date
CN102646201A (zh) 2012-08-22
JP2012173959A (ja) 2012-09-10
US20120213442A1 (en) 2012-08-23
US8731298B2 (en) 2014-05-20

Similar Documents

Publication Publication Date Title
JP5647919B2 (ja) 文字認識装置、文字認識方法、文字認識システム、および文字認識プログラム
EP1564675B1 (en) Apparatus and method for searching for digital ink query
Mathew et al. Multilingual OCR for Indic scripts
EP3522038A1 (en) Method for translating characters and apparatus therefor
KR101685473B1 (ko) 화상 처리 장치 및 화상 처리 방법
JP5807342B2 (ja) 文字認識装置及びプログラム
US11475688B2 (en) Information processing apparatus and information processing method for extracting information from document image
JPH11120293A (ja) 文字認識/修正方式
JP2018055255A (ja) 情報処理装置、情報処理方法及びプログラム
EP3772015B1 (en) Text line extraction
CN108062301B (zh) 文字翻译方法及其装置
US9250802B2 (en) Shaping device
JP6081606B2 (ja) 電子機器および方法
US20120281919A1 (en) Method and system for text segmentation
EP3295292B1 (en) System and method for superimposed handwriting recognition technology
US20210019554A1 (en) Information processing device and information processing method
KR20160053544A (ko) 후보 문자의 추출 방법
US20170091596A1 (en) Electronic apparatus and method
Kaur et al. Adverse conditions and techniques for cross-lingual text recognition
JP2018018366A (ja) 情報処理装置、文字入力プログラムおよび文字入力方法
KR101727953B1 (ko) 문자를 번역하는 방법 및 그 장치
JP5867227B2 (ja) 文字認識用学習データ生成装置、文字認識装置、およびプログラム
JP2020013460A (ja) 情報処理装置、文字認識方法、および文字認識プログラム
JP2012008980A (ja) 情報処理装置およびプログラム
JPH10254871A (ja) 文書入力方法およびその装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140121

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141007

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150519

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150714

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150811

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150824

R150 Certificate of patent or registration of utility model

Ref document number: 5807342

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350