JP2007058304A - 文字認識装置及び文字認識方法 - Google Patents

文字認識装置及び文字認識方法 Download PDF

Info

Publication number
JP2007058304A
JP2007058304A JP2005239916A JP2005239916A JP2007058304A JP 2007058304 A JP2007058304 A JP 2007058304A JP 2005239916 A JP2005239916 A JP 2005239916A JP 2005239916 A JP2005239916 A JP 2005239916A JP 2007058304 A JP2007058304 A JP 2007058304A
Authority
JP
Japan
Prior art keywords
character
cutting
frame
attribute
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005239916A
Other languages
English (en)
Other versions
JP4834351B2 (ja
Inventor
Takuma Akagi
琢磨 赤木
Toshio Sato
俊雄 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2005239916A priority Critical patent/JP4834351B2/ja
Priority to EP06014917A priority patent/EP1758048A2/en
Priority to US11/497,330 priority patent/US7680329B2/en
Publication of JP2007058304A publication Critical patent/JP2007058304A/ja
Application granted granted Critical
Publication of JP4834351B2 publication Critical patent/JP4834351B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】紙葉類に記載された複数の文字記入枠に記入された文字列に対する文字切出しを高精度に行うことができる。
【解決手段】文字認識装置は、帳票などの紙葉類に記載された複数の文字記入枠に記入された文字列から個々の文字候補を生成して文字認識を行うものである。行画像分離部32は、複数の文字記入枠および前記文字列を含む画像を取得する。各種の処理部33〜37を含む文字切出処理部は、前記画像に含まれる前記文字列において複数の線が互いに接触または交差する個々の点を検出し、当該点と該当する文字記入枠との配置関係に基づいて前記文字列を切断もしくは再結合させるべき点を決定した上で当該切断もしくは再結合を行うことによって前記文字列を構成する個々の文字候補を生成する。文字認識部38は、文字切出処理部によって生成された個々の文字候補に対して文字認識を行う。
【選択図】図5

Description

本発明は、帳票などの紙葉類に記載された複数の文字記入枠に記入された文字列に対する文字認識を行う文字認識装置及び文字認識方法に関する。
文字認識装置が文字認識対象とする紙葉類の例としては、複数の文字記入枠が予め記載された帳票が挙げられる。このような帳票に記入された個々の文字は、それぞれ対応する文字記入枠内にきれいに収まっているとは限らない。ある文字記入枠に記入された文字の一部が、その文字記入枠からはみ出し、はみ出した部分がさらに隣接する文字記入枠内の他の文字の一部と接触したりすることがある。このような場合に、文字認識装置において文字記入枠毎に個々の文字に対する文字切出処理を行い、文字認識処理を行うと、正しい文字認識結果が得られないことが多い。
また、記入された文字列に「00」が含まれる場合、文字記入枠からはみ出したリガチャ(0と0を続けて書く場合の0と0の上部に渡される横線など)も含まれていることがよくある。このようなリガチャを文字記入枠との位置関係から検知し、切り離すという手法も採られるようになってきた。しかしながら、このような手法では、文字と文字とが複雑に接触しているような場合には効果を発揮することができないうえ、文字記入枠の形や大きさが変わった場合には、その変更に応じて切断場所などの決定方法やアルゴリズムを大幅に書き換えなければならないという問題がある。
なお、複数の文字記入枠に記入された文字列に対する文字切出処理の手法には、様々なものがある。例えば、特許文献1には、文字列の縦方向投影および横方向投影を求め、これらと閾値とを比較することで文字間の続き線があるか否かを判定し、その判定結果に応じた文字切出処理を行うことが記載されている。
特開2000−113101号公報(図1等)
しかしながら、特許文献1は訂正線を検出するための技術であるため、文字同士が複雑に接触しているような場合には精度の良い文字切出しを行うことができない。
本発明は上記実情に鑑みてなされたものであり、紙葉類に記載された複数の文字記入枠に記入された文字列に対する文字切出しを高精度に行うことができる文字認識装置及び文字認識方法を提供することを目的とする。
本発明に係る文字認識装置は、紙葉類に記載された複数の文字記入枠に記入された文字列から個々の文字候補を生成して文字認識を行う文字認識装置であって、前記複数の文字記入枠および前記文字列を含む画像を取得する画像取得手段と、前記画像に含まれる前記文字列において複数の線が互いに接触または交差する個々の点を検出し、当該点と該当する文字記入枠との配置関係に基づいて前記文字列を切断もしくは再結合させるべき点を決定した上で当該切断もしくは再結合を行うことによって前記文字列を構成する個々の文字候補を生成する文字切出処理手段と、前記文字切出処理手段によって生成された個々の文字候補に対して文字認識を行う文字認識手段とを具備することを特徴とする。
本発明に係る文字認識方法は、紙葉類に記載された複数の文字記入枠に記入された文字列から個々の文字候補を生成して文字認識を行う文字認識方法であって、前記複数の文字記入枠および前記文字列を含む画像を取得する画像取得ステップと、前記画像に含まれる前記文字列において複数の線が互いに接触または交差する個々の点を検出し、当該点と該当する文字記入枠との配置関係に基づいて前記文字列を切断もしくは再結合させるべき点を決定した上で当該切断もしくは再結合を行うことによって前記文字列を構成する個々の文字候補を生成する文字切出ステップと、前記文字切出ステップにおいて生成された個々の文字候補に対して文字認識を行う文字認識ステップとを含むことを特徴とする。
本発明によれば、紙葉類に記載された複数の文字記入枠に記入された文字列に対する文字切出しを高精度に行うことができる。
本発明の実施の形態を図面に基づいて詳細に説明する。
図1は、本発明の一実施形態に係る文字認識装置に適用される基本的な処理の流れを示す概念図である。
帳票には、複数の文字記入枠が記載されており、個々の文字記入枠には文字が記入されている。まず、スキャナによって帳票上の情報の読取処理11が行われ、その画像データが取得される。次いで、スキャナを用いて取得された画像データの中から、文字記入枠の情報を除去する枠除去処理12が行われ、文字列の情報が残される。文字記入枠がドロップアウトカラー(dropout color)で形成されているような場合には、事前に用意された色情報を用いることによって文字記入枠の情報の除去が行われ、文字列の情報だけが黒い画素情報として取得される。
次に、文字記入枠が除去された後の情報に対し、帳票上の各記載項目に対応する個々の画像の切出処理13が行われる。この処理13は、事前に登録されている各記載項目の位置の情報を用いることによって行われる。
この後、帳票上の各記載項目に対応する個々の画像に対し、文字切出処理14、文字認識処理15、及び項目内結果決定処理16を含む処理20が実行される。すなわち、記載項目毎に、事前に登録されている各文字記入枠の位置の情報を用いることによって各文字の文字切出処理14が行われ、切出された各文字の文字認識処理15が行われ、その文字認識結果に基づいて当該記載項目内の文字列の内容を決定する項目内結果決定処理16が行われる。
最後に、各記載項目内の文字列の内容を編集するとともに編集した内容をファイルや紙などに出力する項目編集出力処理17が行われる。
ところで、一般的な文字切出処理においては、文字記入枠の位置を基に、一つの文字記入枠の中の画像を一文字の画像と仮定して切出している。この場合の文字画像の切出しの例を図2に示す。図2(a)には、3つの連続する文字記入枠に対して「180」という3桁の文字列が書かれた例が示されており、文字「8」の一部が該当する文字記入枠内から隣接する文字記入枠内へとはみ出していることがわかる。文字切出の際には、各文字記入枠の中の文字画像をそれぞれ切り出しているため、図2(b)に示されるように、文字「8」の一部が両側の文字画像の中に入った形で切り出される。そのため、これらの文字画像に対して個々に文字認識処理を行っても、正しい文字認識結果は得られない。
こうしたことから、文字と文字とが複雑に接触しているような場合でも文字切断を正確に行うことができ、文字記入枠の種類が変わっても文字切断のアルゴリズムを大幅に変更する必要の無いような手法を提案することが望まれる。
複数の文字記入枠がある帳票に記入された文字と文字との接触について発明者が分析した結果、その多くは自由手書における文字同士の接触に酷似していることがわかった。自由手書とは、郵便物における宛名の記載のように記入枠の全く無い紙に自由に文字列を記入したり、記入枠はあっても一文字一文字の仕切り線や文字記入枠が無い記入枠に文字列を記入したりする形態での手書を指す。自由手書文字における文字接触は、大きく分けて「接触」と「交差」とに分類され、例えば図3に示されるようなものがある。このような文字接触は、英文字筆記体を除き、数字・アルファベット・カナ・漢字に共通するものである。
このように、複数の文字記入枠に対して記入された文字同士の接触は、自由手書における文字同士の接触に酷似しているため、自由手書の文字列に対して適用されている文字接触位置判定処理や文字位置切出処理を、文字記入枠に記入された文字列にも適用することが考えられる。その場合の例を図4に示す。
図4(a)には、図2(a)と同じように、3つの連続する文字記入枠に対して「180」という3桁の文字列が書かれた例が示されており、文字「8」の一部が該当する文字記入枠内から隣接する文字記入枠内へとはみ出している。ここで、自由手書の文字列に対して適用されている文字位置切出処理等を適用すれば、文字記入枠の位置情報を全く使わずに、「1」と「8」、「8」と「0」の両方の文字接触位置を検知でき、これらの位置にて文字列を分離させることができることになる。ところが、こうした手法を単純に適用した場合、本来は文字接触に該当しない部分まで文字接触として検知されるため、間違った文字候補も生成されてしまい、不要な文字候補が増えてしまう。すなわち、図4(a)に示される文字列から、文字パーツ「1」「○」「○」「0」が生成され、更に、それらを組み合わせた文字候補が生成される。これにより、図4(b)に示されるように、合計10個もの文字候補が生成される。この結果、帳票認識において最も時間のかかる処理の一つである文字認識処理の負荷が大きくなり、ますます文字認識処理に時間がかかってしまうばかりか、誤認識が発生しやすくなる。例えば、生成された文字候補を文字認識すると、「8」を分離して生成される「○」「○」を「0」「0」と誤認識されてしまう可能性がある。
そこで、本実施形態では、上記問題を生じさせず、高精度な文字切出しを行う手法を提案する。その文字切出手法の詳細については後で詳しく述べる。
図5は、本実施形態における文字認識装置の機能構成を示すブロック図である。
本実施形態における文字認識装置は、帳票に記載された複数の文字記入枠に記入された文字列から個々の文字候補を生成して文字認識を行うものであり、情報データベース30、スキャナ31、行画像分離部(画像取得手段)32、文字切断候補点検出部(検出手段)33、文字切断点決定部(決定手段)34、文字パーツ生成部(生成手段)35、文字パーツ属性付与部(属性付与手段)36、文字候補生成部(文字候補生成手段)37、文字認識部(文字認識手段)38、文字列認識結果編集部39、帳票認識結果出力部40、全体画像保存メモリ41、各行画像保存メモリ42、文字パーツ画像保存メモリ43、文字候補画像保存メモリ44、及びプリンタ45を備えている。
なお、少なくとも上記の処理部33〜37は、文字切出処理を実現する文字切出処理部(文字切出処理手段)を構成している。
情報データベース30は、個々の文字記入枠の配置位置(罫線情報や座標情報を含む)や種類を示す枠情報や、個々の文字パーツから個々の文字候補を生成するための規則である文字候補生成規則を格納している。
スキャナ31は、入力される帳票から文字記入枠及び文字列を含む情報を読み取り、その全体画像を生成するものである。スキャナ31によって生成された全体画像は、全体画像保存メモリ41に保存される。
行画像分離部32は、全体画像保存メモリ41に格納されている全体画像から、帳票上における個々の記載項目の行の位置に該当する行画像を分離して取得するものである。行画像分離部32によって取得された個々の行画像は、各行画像保存メモリ42に保存される。
文字切断候補点検出部33は、各行画像保存メモリ42に保存された個々の行画像に含まれる文字列において複数の線が互いに接触または交差する点を検出し、これにより検出した点を切断候補点とするものである。なお、ここで検出された切断候補点のすべてが切断点として採用されるとは限らない。
文字切断点決定部34は、文字切断候補点検出部33により検出された点と当該点に最も近いところにある文字記入枠との配置関係に基づき、当該点の位置で文字列を切断すべきか否かを決定するものである。すなわち、文字切断候補点検出部33により得られた個々の切断候補点の中から、実際に切断されるべき切断候補点の絞込みが行われる。
上記文字切断点決定部34は、例えば、文字切断候補点検出部33により検出された点と当該点に最も近いところにある文字記入枠の縦線との距離が所定値以上あれば、その点の位置での切断は行わないことを決定し、所定値未満であれば、その点の位置での切断を行うことを決定する、といった機能を備えていても良い。
また、上記文字切断点決定部34は、例えば、1)文字切断候補点検出部33により検出された点の位置で切断を行った場合に生成されることになる文字パーツの中心座標が該当する文字記入枠の中の所定の範囲内にあり、2)当該文字パーツの大きさが所定値以上あり、且つ、3)当該文字パーツの中心座標と当該中心座標の位置に最も近いところにある文字記入枠の縦線との距離が所定値以上あれば、その点の位置での切断を行うことを決定する、といった機能を備えていても良い。
文字パーツ生成部35は、文字切断候補点検出部33から得られる切断候補点の位置で文字列を切断して、当該文字列を構成する個々の文字パーツを生成するものである。文字パーツ生成部35によって切り出された個々の文字パーツの画像は、文字パーツ画像保存メモリ43に保存される。
文字パーツ属性付与部36は、文字パーツ画像保存メモリ43に保存された個々の文字パーツに対し、当該文字パーツが属する文字記入枠を識別するための枠属性(例えば、枠番号)などの属性情報を付与するものである。なお、当該文字パーツが属する文字記入枠は、情報データベース30に格納されている枠情報(枠の種類の情報や配置位置の情報を含む)に基づいて判定される。文字パーツ属性付与部36によって属性が付与された文字パーツは、文字パーツ画像保存メモリ43に保存される。
文字候補生成部37は、情報データベース30に格納されている文字候補生成規則に従い、文字パーツ画像保存メモリ43に保存されている個々の文字パーツから個々の文字候補を生成するものである。なお、文字候補の生成においては、必要に応じて、情報データベース30に格納されている枠情報も参照される。文字候補生成部37によって生成された個々の文字候補の画像は、文字候補画像保存メモリ44に保存される。
上記文字候補生成部37は、同じ枠属性を付与された複数の文字パーツがある場合に、当該複数の文字パーツを再結合して生成される新たな文字パーツを一つの文字候補として生成するといった機能を備えている。また、文字候補生成部37は、文字パーツ属性付与部36が枠属性を付与することができなかった文字パーツがある場合に(例えば、どの枠に属するのか不明であることを示す属性が付与された文字パーツがある場合に)、当該文字パーツを隣の文字パーツと再結合して生成される新たな文字パーツを一つの文字候補として生成する機能や、文字パーツ属性付与部36が枠属性を付与することができなかった文字パーツがある場合に当該文字パーツの縦方向の大きさが所定値未満であれば、その文字パーツをリガチャ等とみなして破棄する機能なども備えている。
文字認識部38は、文字候補画像保存メモリ44に保存されている個々の文字候補の画像に対して文字認識を行うものである。
文字列認識結果編集部39は、文字認識部38を通じて得られた各項目の文字認識結果を編集し、一つの帳票に関する文字認識結果として生成するものである。
帳票認識結果出力部40は、文字列認識結果編集部39によって生成された文字認識結果をプリンタ45などの出力装置を通じて出力するものである。
以下、本実施形態における文字切出手法の詳細について説明する。
<第1の文字切出手法>
図6及び図7を参照して、第1の文字切出手法について説明する。なお、必要に応じて図5も参照するものとする。
図6(a)に示されるように、各行画像保存メモリ42には、3つの連続する文字記入枠に対して「180」という3桁の文字列が書かれた画像が保存されているものとする。この文字列においては、文字「8」の一部が該当する文字記入枠から左側にはみ出して文字「1」に接触している。また、文字「8」の他の一部が該当する文字記入枠から右側にはみ出して文字「0」に接触している。
文字切断候補点検出部33では、この文字列において複数の線が互いに接触または交差する点(切断候補点)を検出する。これにより、図6(b)に示されるように、3つの切断候補点P11,P12,P13が得られる。
次に、文字切断点決定部34において、各切断候補点の位置の検証を行う。具体的には、文字切断候補点検出部33により検出された3つの切断候補点P11,P12,P13の各々と当該切断候補点に最も近いところにある文字記入枠の縦線との距離をそれぞれ求め、当該距離が所定値以上あれば、その切断候補点の位置での切断は行わないことを決定し、所定値未満であれば、その切断候補点の位置での切断を行うことを決定する。
すなわち、切断候補点P11についてはその右側の文字記入枠縦線との距離を求め、切断候補点P12についてはその右側の文字記入枠縦線との距離を求め、切断候補点P13についてはその左側の文字記入枠縦線との距離を求める。
3つの切断候補点のうち、切断候補点P12については、最も近い文字記入枠の縦の線の位置との距離が予め定めた所定値以上であるため、切断候補点P12は3つの切断候補点から外される。この結果、切断候補点P11と切断候補点P13のみが切断すべき点として残る。
これにより、文字パーツ生成部35は、切断候補点P11と切断候補点P13の位置で文字列を切断することになるため、図6(c)に示されるように3つの文字パーツが得られる。そして、文字候補生成部37においては、上記3つの文字パーツをそれぞれ文字候補とするため、文字認識部38においては、文字認識結果として文字「1」「8」「0」が得られることとなる。
なお、各切断候補点の位置の検証に関しては、文字記入枠の縦線からの距離のほか、文字記入枠の中心からのズレ幅などを用いるようにしてもよい。
次に、図7を参照して、第1の文字切出手法による動作の一例を説明する。
複数の文字記入枠に記入された文字列に含まれる全ての切断候補点(複数の線が互いに接触または交差する点)が検出され(ステップS11)、検出された各切断候補点の検証が順次行われる(ステップS12)。
すなわち、対象の切断候補点と当該切断候補点に最も近いところにある文字記入枠の縦線との距離が所定値以上あるか否かが判定される(ステップS13)。距離が所定値以上あれば、その切断候補点の位置での切断は行われない。一方、所定値未満であれば、その切断候補点の位置での切断が行われ、生成された文字パーツから文字候補が作成される(ステップS14)。
こうして全ての文字候補の作成が完了すると、各文字候補に対する文字認識が行われることとなる。
<第2の文字切出手法>
図8及び図9を参照して、第2の文字切出手法について説明する。なお、必要に応じて図5も参照するものとする。
図8(a)に示されるように、各行画像保存メモリ42には、3つの連続する文字記入枠に対して「145」という3桁の文字列が書かれた画像が保存されているものとする。この文字列においては、文字「4」の一部が該当する文字記入枠から左側にはみ出して文字「1」に接触している。また、文字「5」の一部が該当する文字記入枠から左側にはみ出して文字「4」に接触している。
文字切断候補点検出部33では、この文字列において複数の線が互いに接触または交差する点(切断候補点)を検出する。これにより、図8(b)に示されるように、3つの切断候補点P21,P22,P23が得られる。
次に、文字切断点決定部34において、各切断候補点の位置で切断を行った場合に生成されることになる文字パーツの位置や大きさの検証を行う。具体的には、切断候補点P21,P22,P23の位置で順次切断を行った場合に生成されることになる個々の文字パーツの中心座標や縦方向の大きさに基づき、各切断候補点の位置での切断を行うべきか否かをそれぞれ決定する。
切断候補点P21の位置で切断した場合には、図8(c)中に示される文字パーツ1が生成されることになる。この文字パーツ1については、次のような検証結果が得られる。
・文字パーツ1の中心座標が文字記入枠の中心付近にある(所定の矩形範囲内にある)
・文字パーツ1の縦方向の大きさが文字記入枠の大きさに対比して小さくない(所定値以上である)
・文字パーツ1の中心座標が一番近い文字記入枠の縦線の位置から離れている(所定値以上である)
この結果、文字切断点決定部34では、文字パーツ1は文字候補に成り得るとみなし、切断候補点P21の位置での切断を行うべきと決定する。文字パーツ生成部35では、実際に当該切断を行って文字パーツ1を生成し、文字候補生成部37ではその文字パーツ1を文字候補とする。
次に、切断候補点P22の位置で切断した場合には、図8(c)中に示される文字パーツ2が生成されることになる。この文字パーツ2については、次のような検証結果が得られる。
・文字パーツ2の中心座標が枠の中心付近に無く、1つ目の文字記入枠と2つ目の文字記入枠との間にある(所定の矩形範囲内に無い)
・文字パーツ2の縦方向の大きさが枠の大きさに対比して小さい(所定値未満である)
・文字パーツ2の中心座標が一番近い文字記入枠の縦線の位置に近い(所定の距離以内である)
この結果、文字切断点決定部34では、文字パーツ2は文字候補に成り得ないとみなし、切断候補点P22の位置での切断を行うべきでないと決定する。このため、文字パーツ2は単体では文字候補とはならない。
次に、切断候補点P23の位置で切断した場合には、図8(c)中に示される文字パーツ3が生成されることになる。この文字パーツ3については、文字パーツ1と同様な検証結果が得られる。
この結果、文字切断点決定部34では、文字パーツ3は文字候補に成り得るとみなし、切断候補点P23の位置での切断を行うべきと決定する。文字パーツ生成部35では、実際に当該切断を行って文字パーツ3を生成し、文字候補生成部37ではその文字パーツ3を文字候補とする。
同様に、文字パーツ4についても検証を行うと、文字パーツ1,3と同様な検証結果が得られ、文字パーツ4も文字候補となる。
これにより、文字候補生成部37においては、図8(c)に示されるように、3つの文字パーツ1,3,4を文字候補とするため、文字認識部38においては、文字認識結果として文字「1」「4」「5」が得られることとなる。
次に、図9を参照して、第2の文字切出手法による動作の一例を説明する。
複数の文字記入枠に記入された文字列に含まれる全ての切断候補点(複数の線が互いに接触または交差する点)が検出され(ステップS21)、検出された各切断候補点の位置で切断を行った場合に生成されることになる文字パーツの検証が順次行われる(ステップS22)。
すなわち、1)対象の切断候補点の位置で切断を行った場合に生成されることになる文字パーツの中心座標が文字記入枠の中心付近にあるか(所定の矩形範囲内にあるか)、2)その文字パーツの縦方向の大きさが文字記入枠の大きさに対比して小さくないか(所定値以上であるか)、3)その文字パーツの中心座標が一番近い文字記入枠の縦線の位置から離れているか(所定の距離以上であるか)、が判定される(ステップS23〜S25)。
上記3つの条件を満たしていなければ、その切断候補点の位置での切断は行われない。一方、上記3つの条件を満たしていれば、その切断候補点の位置での切断が行われ、生成された文字パーツから文字候補が作成される(ステップS26)。
こうして全ての文字候補の作成が完了すると、各文字候補に対する文字認識が行われることとなる。
<第3の文字切出手法>
図10〜図13を参照して、第3の文字切出手法について説明する。なお、必要に応じて図5も参照するものとする。
前述した文字切出処理(特に、切断すべき点を決定する処理や、文字候補を生成する処理)は、文字記入枠の種類に依存する。文字記入枠の形としては、図10に示されるように種々なものがある。もし文字記入枠の形が変わると、切断すべき点を決定する処理や文字候補を生成する処理に対して変更を施す必要が生じてしまう。当該変更のための処理は一般的に開発工数がかかるため、文字記入枠の形が変わる度に変更を行うと、開発費がかさむことになる。以下に説明する文字切出手法は、そのような問題を解消する。
図11(a)に示されるように、各行画像保存メモリ42には、3つの連続する文字記入枠に対して「180」という3桁の文字列が書かれた画像が保存されているものとする。この文字列においては、「8」の文字の一部が該当する文字記入枠から左側にはみ出して「1」に接触している。また、「8」の文字の他の一部が該当する文字記入枠から右側にはみ出して「0」に接触している。なお、3つの文字記入枠には、識別のためにそれぞれ枠番号が付されているものとする。ここでは、これら3つの文字記入枠を左側から順に、枠番号として「0」「1」「2」が付されているものとする。
前述の2つの手法と同様に、文字切断候補点検出部33では、この文字列において複数の線が互いに接触または交差する点(切断候補点)を検出する。これにより、3つの切断候補点が得られる。なお、ここでは文字切断点決定部34による切断候補点の絞込みは行われないものとする。
次に、文字パーツ生成部35において、文字切断候補点検出部33により検出された個々の切断候補点の位置で文字列を切断して、当該文字列を構成する個々の文字パーツを生成する。すなわち、文字記入枠の位置を考慮しない柔軟な切断により、図11(b)に示されるように、4つの文字パーツ「1」「○」「○」「0」が生成される。
次に、文字パーツ属性付与部36において、生成された4つの文字パーツ「1」「○」「○」「0」に対して該当する属性を付与する。
個々のパーツに付与される属性の例としては、以下のようなものが挙げられる。
・そのパーツの位置と該当する文字記入枠の位置との相対関係を示す情報
・そのパーツがどの文字記入枠に属するかを示す情報
・そのパーツがどの文字記入枠に属するか不明であることを示す情報
・そのパーツの大きさを示す情報
・そのパーツの形状を示す情報
・そのパーツが切断候補点の位置で切断して生成されたものであるか否かを示す情報
・そのパーツがどの切断候補点の位置で切断して生成されたものであるかを示す情報
・上記の各情報を選択的に組み合わせて得られる情報
図11(b)の例では、各文字パーツが属する文字記入枠の枠番号「0」「1」「1」「2」が属性として付与されている(枠属性が付与されている)。すなわち、文字「1」のパーツは中心座標が枠番号「0」の文字記入枠の中にあるため、属性として枠番号「0」が付与され、文字「8」が分離されて出来上がった2つのパーツ「○」「○」は中心座標がそれぞれ枠番号「1」の文字記入枠の中にあるため、属性として枠番号「1」が付与され、文字「0」のパーツは中心座標が枠番号「2」の文字記入枠の中にあるため、属性として枠番号「2」が付与されている。
なお、文字候補の生成作業を行う際にパーツを結合するかどうか、結合したパーツを文字候補として採用するか、の基準となる文字候補生成規則を予め情報データベース30に予め保存しておく。これにより、文字候補生成部37では、文字候補生成規則に従って個々の文字候補を作成することになる。
例えば、「同じ枠番号を持つパーツ同士は結合し、結合前のパーツは文字候補から外す」という文字候補生成規則を用意しておき、これに従って個々の文字候補が作成される。
これにより、文字候補生成部37においては、図11(c)に示されるように、3つの文字パーツを文字候補とするため、文字認識部38においては、文字認識結果として文字「1」「8」「0」が得られることとなる。
すなわち、図4に示される手法と比較すると、枠情報から得られる簡単な属性と生成規則を与えるだけで、文字候補の数を10個から3個へと大幅に削減できる上、図4のようなあいまいな文字候補(認識結果を「1000」ともしてしまいかねない候補)の発生を防ぐことができる。
なお、属性や文字候補生成規則の例としては、以下のようなものも挙げられる。
・大きさが小さいパーツは他の文字候補と結合しない限り文字候補として残さない
・同じ枠属性のパーツを結合してできる新しいパーツには、結合したパーツと同じ枠属性を付与する
・どのパーツに属するかわからないパーツは、枠属性をもつパーツと結合しない限り文字候補として残さない
・どのパーツに属するかわからないパーツで、しかも所定の大きさ未満の小さいパーツは左右のパーツのどちらとも結合し文字候補を生成するか、どちらにも結合せず除去する
次に、図12及び図13を参照して、第3の文字切出手法による動作の一例を説明する。当該動作については、個々の文字パーツに属性を付加する属性付加処理と、属性付加処理の終了後に文字候補を作成する文字候補作成処理とに分けて説明する。
まず、図12を参照して、属性付加処理の動作の一例を説明する。
複数の文字記入枠に記入された文字列に含まれる全ての切断候補点(複数の線が互いに接触または交差する点)が検出され、全ての切断候補点の位置での切断が行われ、複数の文字パーツが生成される(ステップS31)。
複数の文字パーツが生成されると、個々の文字パーツに対して属性を順次付加するための処理が行われる(ステップS32)。
対象の文字パーツの位置と個々の文字記入枠の位置とを比較して(ステップS33)、対象の文字パーツとの距離が所定値未満となる中心位置をもつ文字記入枠(すなわち、対象の文字パーツに近い文字記入枠)が検出され(ステップS34)、その文字記入枠の位置との相対関係を示す属性(文字記入枠を識別するための枠番号などを含む)が対象の文字パーツに付加され、その文字記入枠の縦の罫線と対象の文字パーツの中心との距離や、その文字記入枠の中心と対象の文字パーツの中心との距離などの情報の登録が行われる(ステップS35)。
なお、対象の文字パーツに近い文字記入枠が検出されなかった場合には、その枠にも属さないことを示す属性が対象の文字パーツに付加される(ステップS36,S37)。
さらに、対象の文字パーツの大きさ・形状の情報が属性として付加され(ステップS38,S39)、切断により生成された文字パーツであれば切断候補点の登録が行われ、一方、最初から孤立した文字パーツであればその旨を示す属性が付加される(ステップS41〜S43)。
こうして全ての文字パーツに対する属性付加が完了すると、文字候補作成処理が行われることとなる。
次に、図13を参照して、文字候補作成処理の動作の一例を説明する。
切断により全ての文字パーツが生成され、属性付与が完了した後は、一番左の文字パーツから順に、右隣の文字パーツとの結合を行うべきか否かに関する検証が順次行われる(ステップS51)。
すなわち、右隣の文字パーツと対象のパーツとが同じ枠番号の属性を有するか否かが判定され、同じ枠番号を示していれば、右隣の文字パーツと対象のパーツとを結合して新たな文字パーツが作成され、結合に使用した基の文字パーツが廃棄される(ステップS52〜S54)。一方、同じ枠番号を示していなければ、結合処理は行われず、右隣に文字パーツがあれば当該右隣の文字パーツに処理の対象が移され、検証が繰り返される(ステップS55,S56)。
こうして再構成された個々の文字パーツはそれぞれ文字候補とされ、全ての文字候補の作成が完了する。全ての文字候補の作成が完了すると、各文字候補に対する文字認識が行われることとなる。
次に、図14〜図18を参照して、リガチャを含む文字列に上記第3の文字切出手法を適用した場合の例を説明する。
図14(a)に示されるように、各行画像保存メモリ42には、3つの連続する文字記入枠に対して「000」という3桁の文字列が書かれた画像が保存されているものとする。この文字列においては、隣接する「0」の間がリガチャ「−」で結ばれている。
文字切断候補点検出部33では、前述の場合と同様、この文字列において複数の線が互いに接触または交差する点(切断候補点)を検出する。これにより、図14(b)に示されるように、3つの切断候補点P31,P32,P33が得られる。
次に、文字パーツ生成部35において、文字切断候補点検出部33により検出された個々の切断候補点の位置で文字列を切断して、当該文字列を構成する個々の文字パーツを生成する。すなわち、図14(c)に示されるように、2つのリガチャを含む5つの文字パーツ「0」「−」「0」「−」「0」が生成される。
次に、文字パーツ属性付与部36において、生成された5つの文字パーツ「0」「−」「0」「−」「0」に対して該当する属性を付与する。この場合、リガチャに相当する文字パーツ「−」に対しては、「その文字パーツがどの文字記入枠に属するか不明であることを示す情報」が属性として付加されるものとする。
次に、文字候補生成部37では、文字候補生成規則に従って個々の文字候補を作成することになる。
ここで使用する文字候補生成規則の例としては、次のようなものが挙げられる。
・同じ枠に属するパーツは結合する
・どの枠に属するかわからないパーツは、枠属性をもつパーツと結合する
・どの枠に属するかわからないパーツは、単体では文字候補となりえない
このような文字候補生成規則を採用した場合、文字候補生成部37においては、図15に示されるように、リガチャに相当する文字パーツ「−」が隣接する文字パーツ「0」に結合したものを含む文字候補が生成される。文字認識部38においては、リガチャ付きの「0」を通常の「0」として認識するため、文字認識結果として文字「0」「0」「0」が得られることとなる。
もしリガチャ付きの「0」が文字認識において誤読される恐れがある場合には、文字候補生成規則を、例えば次のようにする。
・どの枠に属するかわからないパーツで高さ方向の大きさが小さいもの(所定値未満のもの)は結合しない
・どの枠に属するかわからないパーツは、単体では文字候補となりえない
このような文字候補生成規則を採用した場合、文字候補生成部37においては、図16に示されるように、リガチャに相当する文字パーツ「−」を破棄し、3つの文字パーツ「0」「0」「0」だけを残すため、文字認識部38においては、文字認識結果として文字「0」「0」「0」が得られることとなる。
次に、図17を参照して、リガチャを含む文字列に図15に対応する規則を適用した場合の動作の一例を説明する。
切断により全ての文字パーツが生成され、属性付与が完了した後は、一番左の文字パーツから順に、隣接する文字パーツとの結合を行うべきか否かに関する検証が順次行われる(ステップS61)。
すなわち、枠属性を持たない文字パーツが検証の対象とされ(ステップS62)、左隣に枠属性を持つ文字パーツがあれば、その文字パーツと対象のパーツとを結合した文字パーツが作成され、左隣の文字パーツと同じ枠属性が付加され(ステップS63,S64)、一方、右隣に枠属性を持つ文字パーツがあれば、その文字パーツと対象のパーツとを結合した文字パーツが作成され、右隣の文字パーツと同じ枠属性が付加される(ステップS65,S66)。また、枠属性を持たない該パーツは破棄される(ステップS67)。
その後、対象の文字パーツの右隣に文字パーツがあれば当該右隣の文字パーツに処理の対象が移され、検証が繰り返される(ステップS68,S69)。
こうして再構成された個々の文字パーツはそれぞれ文字候補とされ、全ての文字候補の作成が完了する。全ての文字候補の作成が完了すると、各文字候補に対する文字認識が行われることとなる。
次に、図18を参照して、リガチャを含む文字列に図16に対応する規則を適用した場合の動作の一例を説明する。
切断により全ての文字パーツが生成され、属性付与が完了した後は、一番左の文字パーツから順に、隣接する文字パーツとの結合を行うべきか否かに関する検証が順次行われる(ステップS71)。
すなわち、枠属性を持たない文字パーツが検証の対象とされ(ステップS72)、対象の文字パーツの高さ方向の長さが所定値未満であれば、その文字パーツは破棄される(ステップS73,S74)。
その後、対象の文字パーツの右隣に文字パーツがあれば当該右隣の文字パーツに処理の対象が移され、検証が繰り返される(ステップS75,S76)。
こうして再構成された個々の文字パーツはそれぞれ文字候補とされ、全ての文字候補の作成が完了する。全ての文字候補の作成が完了すると、各文字候補に対する文字認識が行われることとなる。
ところで、文字記入枠の種類が変わった場合には、文字候補作成ルールを変更することにより、容易に対応することが可能である。例えば、隣り合う文字記入枠同士が接近している場合や、文字と文字の間が枠線一本で区切られている場合などは、文字接触の可能性が高く、しかも文字が隣の枠にはみ出す可能性が高い。そのような場合、次のような文字候補生成規則を用いると、枠と枠の間にある文字も正しく生成されやすくなる。
・同じ枠に属するパーツは結合する
・どの枠に属するかわからないパーツは、枠属性をもつパーツと結合する
・同じ枠に属するパーツを結合してできたパーツには同じ枠属性を付与する
・違う枠属性を持つパーツでも隣り合っている場合には結合し、枠属性を2つ付与する
・結合するパーツの枠属性が3つ以上になる場合には結合しない
次に、図19を参照して、このような文字候補生成規則を用いた場合の動作の一例を説明する。
切断により全ての文字パーツが生成され、属性付与が完了した後は、一番左の文字パーツから順に、隣接する文字パーツとの結合を行うべきか否かに関する検証が順次行われる(ステップS81)。
まず、対象の文字パーツが枠属性を持たない文字パーツであるか否かが判定され(ステップS82)、枠属性を持たない文字パーツであれば、次のような処理が行われる。すなわち、左隣に枠属性を持つ文字パーツがあれば、その文字パーツと対象のパーツとを結合した文字パーツが作成され、左隣の文字パーツと同じ枠属性が付加され(ステップS83,S84)、一方、右隣に枠属性を持つ文字パーツがあれば、その文字パーツと対象のパーツとを結合した文字パーツが作成され、右隣の文字パーツと同じ枠属性が付加される(ステップS85,S86)。
一方、対象の文字パーツが枠属性を持つ文字パーツであれば、その文字パーツが右隣の文字パーツと同じ枠属性を持つか否かが判定され(ステップS89)、同じ枠属性を持つものであれば、文字パーツ同士が結合され、結合した文字パーツの枠属性の全てが付加される(ステップS91)。また、同じ枠属性を持つものでない場合であっても、右隣の文字パーツの枠属性の数と該文字パーツの枠属性の数との合計が3つ以上になる場合には、文字パーツ同士が結合され、結合した文字パーツの枠属性の全てが付加される(ステップS91)。このような処理は、右隣の文字パーツの枠属性の数と該文字パーツの枠属性の数との合計が3つ以上になるまで繰り返される。
その後、対象の文字パーツの右隣に文字パーツがあれば当該右隣の文字パーツに処理の対象が移され、検証が繰り返される(ステップS87,S88)。
こうして再構成された個々の文字パーツはそれぞれ文字候補とされ、全ての文字候補の作成が完了する。全ての文字候補の作成が完了すると、各文字候補に対する文字認識が行われることとなる。
ところで、文字記入枠の形状によっては、文字接触しにくい場合がある。例えば文字記入枠同士が一定間隔を置いて離れているような場合は文字接触が起こりにくい。そのような場合、次のような文字候補生成規則を用いると、無駄な文字候補の生成を減らすことができ、誤読や処理時間を削減できる。
・同じ枠に属するパーツは結合する
・どの枠に属するかわからないパーツは、枠属性を持つパーツと結合する
・どの枠に属するかわからないパーツは、単体では文字候補としない
・違う枠属性を持つパーツは結合しない
・どの枠に属するかわからないパーツで、小さいものは結合もせず除去する
次に、図20を参照して、このような文字候補生成規則を用いた場合の動作の一例を説明する。
切断により全ての文字パーツが生成され、属性付与が完了した後は、一番左の文字パーツから順に、隣接する文字パーツとの結合を行うべきか否かに関する検証が順次行われる(ステップS101)。
まず、対象の文字パーツが枠属性を持たない所定値未満の小さな文字パーツであるか否かが判定される(ステップS102)。該当する場合にはその文字パーツは破棄され(ステップS111)、該当しない場合には、対象の文字パーツが枠属性を持たない文字パーツであるか否かが判定される(ステップS103)。
枠属性を持たない文字パーツであれば、次のような処理が行われる。すなわち、左隣に枠属性を持つ文字パーツがあれば、その文字パーツと対象のパーツとを結合した文字パーツが作成され、左隣の文字パーツと同じ枠属性が付加され(ステップS104,S105)、一方、右隣に枠属性を持つ文字パーツがあれば、その文字パーツと対象のパーツとを結合した文字パーツが作成され、右隣の文字パーツと同じ枠属性が付加される(ステップS106,S107)。また、枠属性を持たない該パーツは破棄される(ステップS108)。
一方、対象の文字パーツが枠属性を持つ文字パーツであれば、その文字パーツが右隣の文字パーツと同じ枠属性を持つか否かが判定され(ステップS112)、同じ枠属性を持つものであれば、文字パーツ同士が結合され、結合した文字パーツの枠属性が付加される(ステップS113)。このような処理は、右隣の文字パーツが違う枠属性になるまで繰り返される。
その後、対象の文字パーツの右隣に文字パーツがあれば当該右隣の文字パーツに処理の対象が移され、検証が繰り返される(ステップS109,S110)。
こうして再構成された個々の文字パーツはそれぞれ文字候補とされ、全ての文字候補の作成が完了する。全ての文字候補の作成が完了すると、各文字候補に対する文字認識が行われることとなる。
このように、本実施形態によれば、文字記入枠の位置に縛られない複数の文字切断候補点を生成し、これらの文字切断候補点に対して文字記入枠の情報を基に絞り込みを行うことによって、従来の文字認識手法では認識できなかった複雑な接触文字も切出して認識できる。また、本実施形態の手法では、多くの文字切出候補を作成しないため、処理時間を削減できるうえ、誤った文字候補の認識による誤読を削減できる。また、文字切断候補点を基に文字をばらばらな文字パーツに分けた後に、各文字パーツに対して文字記入枠の情報を元にした属性を付加し、予め設定された生成規則を用いて文字パーツを結合することにより、正しい文字候補を効率よく生成できる。また、文字記入枠の形が変わった場合でも、文字候補生成規則を変更することにより、各文字記入枠の形に応じた最適な文字候補の生成を実現できる。
上述した実施形態で述べた各種の処理手順は、コンピュータプログラムとして、コンピュータにより読み取り可能な記憶媒体(例えば磁気ディスク,光ディスク,半導体メモリ)に記憶させておき、必要に応じてそれをプロセッサにより読み出して実行するようにしてもよい。また、このようなコンピュータプログラムは、通信媒体を介してあるコンピュータから他のコンピュータに伝送することにより配布することも可能である。
本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
本発明の一実施形態に係る文字認識装置に適用される基本的な処理の流れを示す概念図。 文字記入枠の位置を基に一つの文字記入枠の中の画像を一文字の画像と仮定して切出す手法を説明するための図。 自由手書文字における文字接触の類型を説明するための図。 自由手書の文字列に対して適用されている文字接触位置判定処理や文字位置切出処理を、文字記入枠に記入された文字列に適用した手法を説明するための図。 本実施形態における文字認識装置の機能構成を示すブロック図。 第1の文字切出手法を説明するための図。 第1の文字切出手法による動作の一例を示すフローチャート。 第2の文字切出手法を説明するための図。 第2の文字切出手法による動作の一例を示すフローチャート。 文字記入枠の各種の形を示す図。 第3の文字切出手法を説明するための図。 第3の文字切出手法による属性付加処理の動作の一例を示すフローチャート。 第3の文字切出手法による文字候補作成処理の動作の一例を示すフローチャート。 リガチャを含む文字列に第3の文字切出手法を適用した一例を示す図。 リガチャを含む文字列に1つ目の文字候補生成規則を適用した場合に得られる画像の一例を示す図。 リガチャを含む文字列に2つ目の文字候補生成規則を適用した場合に得られる画像の一例を示す図。 リガチャを含む文字列に図15に対応する規則を適用した場合の動作の一例を示すフローチャート。 リガチャを含む文字列に図16に対応する規則を適用した場合の動作の一例を示すフローチャート。 別の文字候補生成規則を用いた場合の動作の一例を示すフローチャート。 別の文字候補生成規則を用いた場合の動作の一例を示すフローチャート。
符号の説明
11…読取処理、12…枠除去処理、13…各項目画像切出処理、14…文字切出処理、15…文字認識処理、16…項目内結果決定処理、17…項目編集出力処理、30…情報データベース、31…スキャナ、32…行画像分離部、33…文字切断候補点検出部、34…文字切断点決定部、35…文字パーツ生成部、36…文字パーツ属性付与部、37…文字候補生成部、38…文字認識部、39…文字列認識結果編集部、40…帳票認識結果出力部、41…全体画像保存メモリ、42…各行画像保存メモリ、43…文字パーツ画像保存メモリ、44…文字候補画像保存メモリ、45…プリンタ。

Claims (12)

  1. 紙葉類に記載された複数の文字記入枠に記入された文字列から個々の文字候補を生成して文字認識を行う文字認識装置であって、
    前記複数の文字記入枠および前記文字列を含む画像を取得する画像取得手段と、
    前記画像に含まれる前記文字列において複数の線が互いに接触または交差する個々の点を検出し、当該点と該当する文字記入枠との配置関係に基づいて前記文字列を切断もしくは再結合させるべき点を決定した上で当該切断もしくは再結合を行うことによって前記文字列を構成する個々の文字候補を生成する文字切出処理手段と、
    前記文字切出処理手段によって生成された個々の文字候補に対して文字認識を行う文字認識手段と、
    を具備することを特徴とする文字認識装置。
  2. 前記文字切出処理手段は、
    検出された点と当該点に最も近いところにある文字記入枠の縦線との距離が所定値以上あれば、その点の位置での切断は行わないことを決定し、所定値未満であれば、その点の位置での切断を行うことを決定する決定手段を具備することを特徴とする請求項1記載の文字認識装置。
  3. 前記文字切出処理手段は、
    1)検出された点の位置で切断を行った場合に生成されることになる文字パーツの中心座標が該当する文字記入枠の中の所定の範囲内にあり、2)当該文字パーツの大きさが所定値以上あり、且つ、3)当該文字パーツの中心座標と当該中心座標の位置に最も近いところにある文字記入枠の縦線との距離が所定値以上あれば、その点の位置での切断を行うことを決定する決定手段を具備することを特徴とする請求項1記載の文字認識装置。
  4. 前記文字切出処理手段は、
    前記文字列において複数の線が互いに接触または交差する個々の点の位置で切断を行って生成される個々の文字パーツに対し、当該文字パーツが属する文字記入枠を識別するための枠属性を付与する属性付与手段と、
    前記属性付与手段により同じ枠属性を付与された複数の文字パーツがある場合に、当該複数の文字パーツを再結合して生成される新たな文字パーツを一つの文字候補として生成する文字候補生成手段と、
    を具備することを特徴とする請求項1記載の文字認識装置。
  5. 前記文字候補生成手段は、前記属性付与手段が枠属性を付与することができなかった文字パーツがある場合に、当該文字パーツを隣の文字パーツと結合して生成される新たな文字パーツを一つの文字候補として生成する手段を具備することを特徴とする請求項4記載の文字認識装置。
  6. 前記文字候補生成手段は、前記属性付与手段が枠属性を付与することができなかった文字パーツがある場合に、当該文字パーツの縦方向の大きさが所定値未満であれば、その文字パーツを破棄する手段を具備することを特徴とする請求項4記載の文字認識装置。
  7. 紙葉類に記載された複数の文字記入枠に記入された文字列から個々の文字候補を生成して文字認識を行う文字認識方法であって、
    前記複数の文字記入枠および前記文字列を含む画像を取得する画像取得ステップと、
    前記画像に含まれる前記文字列において複数の線が互いに接触または交差する個々の点を検出し、当該点と該当する文字記入枠との配置関係に基づいて前記文字列を切断もしくは再結合させるべき点を決定した上で当該切断もしくは再結合を行うことによって前記文字列を構成する個々の文字候補を生成する文字切出ステップと、
    前記文字切出ステップにおいて生成された個々の文字候補に対して文字認識を行う文字認識ステップと、
    を含むことを特徴とする文字認識方法。
  8. 前記文字切出ステップは、
    検出された点と当該点に最も近いところにある文字記入枠の縦線との距離が所定値以上あれば、その点の位置での切断は行わないことを決定し、所定値未満であれば、その点の位置での切断を行うことを決定する決定ステップを含むことを特徴とする請求項7記載の文字認識方法。
  9. 前記文字切出ステップは、
    1)検出された点の位置で切断を行った場合に生成されることになる文字パーツの中心座標が該当する文字記入枠の中の所定の範囲内にあり、2)当該文字パーツの大きさが所定値以上あり、且つ、3)当該文字パーツの中心座標と当該中心座標の位置に最も近いところにある文字記入枠の縦線との距離が所定値以上あれば、その点の位置での切断を行うことを決定する決定ステップを含むことを特徴とする請求項7記載の文字認識方法。
  10. 前記文字切出ステップは、
    前記文字列において複数の線が互いに接触または交差する個々の点の位置で切断を行って生成される個々の文字パーツに対し、当該文字パーツが属する文字記入枠を識別するための枠属性を付与する属性付与ステップと、
    前記属性付与ステップにおいて同じ枠属性を付与された複数の文字パーツがある場合に、当該複数の文字パーツを再結合して生成される新たな文字パーツを一つの文字候補として生成する文字候補生成ステップと、
    を含むことを特徴とする請求項7記載の文字認識方法。
  11. 前記文字候補生成ステップは、前記属性付与ステップにおいて枠属性を付与することができなかった文字パーツがある場合に、当該文字パーツを隣の文字パーツと結合して生成される新たな文字パーツを一つの文字候補として生成するステップを含むことを特徴とする請求項10記載の文字認識方法。
  12. 前記文字候補生成ステップは、前記属性付与ステップにおいて枠属性を付与することができなかった文字パーツがある場合に、当該文字パーツの縦方向の大きさが所定値未満であれば、その文字パーツを破棄するステップを含むことを特徴とする請求項10記載の文字認識方法。
JP2005239916A 2005-08-22 2005-08-22 文字認識装置及び文字認識方法 Expired - Fee Related JP4834351B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005239916A JP4834351B2 (ja) 2005-08-22 2005-08-22 文字認識装置及び文字認識方法
EP06014917A EP1758048A2 (en) 2005-08-22 2006-07-18 Character recognition apparatus and character recognition method
US11/497,330 US7680329B2 (en) 2005-08-22 2006-08-02 Character recognition apparatus and character recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005239916A JP4834351B2 (ja) 2005-08-22 2005-08-22 文字認識装置及び文字認識方法

Publications (2)

Publication Number Publication Date
JP2007058304A true JP2007058304A (ja) 2007-03-08
JP4834351B2 JP4834351B2 (ja) 2011-12-14

Family

ID=37441560

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005239916A Expired - Fee Related JP4834351B2 (ja) 2005-08-22 2005-08-22 文字認識装置及び文字認識方法

Country Status (3)

Country Link
US (1) US7680329B2 (ja)
EP (1) EP1758048A2 (ja)
JP (1) JP4834351B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101109329B1 (ko) * 2008-02-20 2012-01-31 가부시끼가이샤 도시바 패턴 인식 방법, 및 패턴 인식 프로그램을 기억하는 기억 매체
JP2019113860A (ja) * 2019-03-15 2019-07-11 富士通株式会社 正誤判定ルール設定プログラム、正誤判定ルール設定方法および正誤判定ルール設定装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080099385A (ko) * 2007-05-09 2008-11-13 유니챌(주) 문자 인식을 통한 미디어 컨텐츠 검색 및 출력 시스템과 그방법
US9600731B2 (en) * 2015-04-08 2017-03-21 Toshiba Tec Kabushiki Kaisha Image processing apparatus, image processing method and computer-readable storage medium
US9563812B2 (en) 2015-04-08 2017-02-07 Toshiba Tec Kabushiki Kaisha Image processing apparatus, image processing method and computer-readable storage medium
US10395133B1 (en) * 2015-05-08 2019-08-27 Open Text Corporation Image box filtering for optical character recognition
JP6903966B2 (ja) * 2017-03-16 2021-07-14 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム及びプログラム
US10402673B1 (en) * 2018-10-04 2019-09-03 Capital One Services, Llc Systems and methods for digitized document image data spillage recovery

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5449034A (en) * 1977-09-27 1979-04-18 Nec Corp Eraser for unneeded part of pattern
JPS5953983A (ja) * 1982-09-21 1984-03-28 Toshiba Corp 文字の検出切出方法
JPH0676114A (ja) * 1992-08-25 1994-03-18 Ricoh Co Ltd 文字認識方法
JPH08202822A (ja) * 1995-01-26 1996-08-09 Fujitsu Ltd 文字切り出し装置、及び文字切り出し方法
JP2000339408A (ja) * 1999-05-26 2000-12-08 Matsushita Electric Ind Co Ltd 文字切り出し装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4024500A (en) 1975-12-31 1977-05-17 International Business Machines Corporation Segmentation mechanism for cursive script character recognition systems
IL75117A (en) 1985-05-07 1990-08-31 Reuven Nir Symmetrical optical resonator and laser comprising same
KR930001416B1 (ko) 1990-07-13 1993-02-27 금성일렉트론 주식회사 셀 플레이트 전압 발생방법 및 회로
US5491758A (en) * 1993-01-27 1996-02-13 International Business Machines Corporation Automatic handwriting recognition using both static and dynamic parameters
JP3345224B2 (ja) * 1995-03-06 2002-11-18 富士通株式会社 パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
US5768414A (en) * 1995-12-22 1998-06-16 Canon Kabushiki Kaisha Separation of touching characters in optical character recognition
JP3830998B2 (ja) * 1995-12-28 2006-10-11 株式会社東芝 罫線除去方法及びこれを用いた文字認識装置
JP2000113101A (ja) 1998-09-30 2000-04-21 Matsushita Electric Ind Co Ltd 文字切り出し方法および装置
JP2002063548A (ja) 2001-06-18 2002-02-28 Hitachi Software Eng Co Ltd 手書き文字認識方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5449034A (en) * 1977-09-27 1979-04-18 Nec Corp Eraser for unneeded part of pattern
JPS5953983A (ja) * 1982-09-21 1984-03-28 Toshiba Corp 文字の検出切出方法
JPH0676114A (ja) * 1992-08-25 1994-03-18 Ricoh Co Ltd 文字認識方法
JPH08202822A (ja) * 1995-01-26 1996-08-09 Fujitsu Ltd 文字切り出し装置、及び文字切り出し方法
JP2000339408A (ja) * 1999-05-26 2000-12-08 Matsushita Electric Ind Co Ltd 文字切り出し装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101109329B1 (ko) * 2008-02-20 2012-01-31 가부시끼가이샤 도시바 패턴 인식 방법, 및 패턴 인식 프로그램을 기억하는 기억 매체
JP2019113860A (ja) * 2019-03-15 2019-07-11 富士通株式会社 正誤判定ルール設定プログラム、正誤判定ルール設定方法および正誤判定ルール設定装置

Also Published As

Publication number Publication date
EP1758048A2 (en) 2007-02-28
JP4834351B2 (ja) 2011-12-14
US7680329B2 (en) 2010-03-16
US20070041643A1 (en) 2007-02-22

Similar Documents

Publication Publication Date Title
JP4834351B2 (ja) 文字認識装置及び文字認識方法
JP4787275B2 (ja) セグメント化ベースの認識
JP5125573B2 (ja) 領域抽出プログラム、文字認識プログラム、および文字認識装置
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JP2008532176A (ja) 認識グラフ
JPH08171614A (ja) 文字列読み取り装置
JPH08305796A (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
JP2008204226A (ja) 帳票認識装置およびそのプログラム
JP2010157107A (ja) 業務文書処理装置
JP4704601B2 (ja) 文字認識方法,プログラム及び記録媒体
JP6221220B2 (ja) 画像処理装置及び画像処理プログラム
KR100834602B1 (ko) 문자 인식 장치 및 문자 인식 방법
JP2009223612A (ja) 画像認識装置及びプログラム
JP6201838B2 (ja) 情報処理装置及び情報処理プログラム
JPH1063744A (ja) 文書のレイアウト解析方法及びシステム
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP5712415B2 (ja) 帳票処理システム及び帳票処理方法
JP2009087378A (ja) 帳票処理装置
JP4213558B2 (ja) 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置
JP4521377B2 (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JP4117648B2 (ja) 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置
JPH10207981A (ja) 帳票認識方法
JP4221960B2 (ja) 帳票識別装置及びその識別方法
JP4882929B2 (ja) 画像処理装置及び画像処理プログラム
JP2009223391A (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080812

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100803

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101004

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110708

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110830

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110926

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140930

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees