JP2017033438A

JP2017033438A - 帳票識別装置、帳票識別方法及びプログラム

Info

Publication number: JP2017033438A
Application number: JP2015154970A
Authority: JP
Inventors: 福留　憲治; Kenji Fukutome; 憲治福留
Original assignee: Konica Minolta Inc
Current assignee: Konica Minolta Inc
Priority date: 2015-08-05
Filing date: 2015-08-05
Publication date: 2017-02-09
Anticipated expiration: 2035-08-05
Also published as: JP6544124B2

Abstract

【課題】帳票に含まれる罫線が文字と誤認識されてしまうことを低減し、文字認識処理による文字認識率を向上させる。【解決手段】罫線を含む帳票に記載された文字を認識する帳票識別装置１０は、文字が記載された記入済帳票画像６を取得する記入済画像取得部３１と、記入済帳票画像６において罫線で囲まれた読取領域Ｒに記載された文字を認識する文字認識部３４と、読取領域Ｒから認識された文字列の先頭又は後尾に特定の文字が含まれるか否かを判定する文字列判定部３５と、文字列の先頭又は後尾に特定の文字が含まれると判定された場合に、記入済帳票画像６において読取領域Ｒに含まれる罫線を検出する罫線検出部３６と、罫線検出部３６によって検出される罫線を１本の実線に補正する罫線補正部３７と、罫線が補正された記入済帳票画像６に対して文字認識処理を再度実行させる制御部３８と、を備える構成である。【選択図】図３

Description

本発明は、罫線を含む帳票に記載された文字を認識する帳票識別装置、帳票識別方法及びそのプログラムに関する。

顧客からＦＡＸや郵便などで送られてくる注文書などの帳票に記載された文字をＯＣＲ（Optical Character Recognition）処理で読み取り、読み取った注文内容などをデータ化して管理する帳票識別システムが知られている。この種の帳票識別システムでは、注文内容などのデータ化の際に、人手による修正作業をなるべく生じさせないようにするためにＯＣＲ処理による文字認識率の向上が求められる。

従来、上記のような帳票識別システムでは、罫線で囲まれた枠内の文字をＯＣＲ処理で読み取るのが一般的である（例えば特許文献１）。また、従来のＯＣＲ処理では罫線を文字と誤認識してしまうことがあるため、ＯＣＲ処理の結果、コロンやセミコロン、ハイフンなどの特定の文字が連続しているときには、それら特定の文字のコードを罫線コードに置き換えて出力する技術が提案されている（例えば特許文献２）。

特開２０１４−１２３２６４号公報特開平８−２９７７２０号公報

ところで、注文書などの帳票をＦＡＸなどで受信する場合、帳票に含まれる画像が斜め方向に傾いていることが多い。この場合、罫線枠の形状が歪んでしまっているため、ＯＣＲ処理で文字の読取対象となる読取領域を適切に設定することが難しい。そこで、従来は、帳票画像に含まれる罫線の傾きを検知し、ＯＣＲ処理の前に傾き補正などの画像処理を実施して帳票画像の傾きを補正することが行われている。

しかし、傾き補正などの画像処理が行われると、帳票画像に含まれる罫線がジグザグになってしまったり、欠損部分を有する不連続な線となってしまったりする。そのため、画像処理を行った後に罫線で囲まれた矩形枠の内側を読取領域として設定した場合であっても、破断した罫線の端部などが読取領域内に入り込んでしまっていると、ＯＣＲ処理によって罫線の一部が文字として誤認識されてしまうという現象が生じ得る。

図１５は、罫線の一部を文字として誤認識する場合の一例を示す図である。図１５に示すように、例えば傾き補正によって縦方向の罫線１０１が斜め方向に傾いた線分の集合に置き換えられてしまうことがある。この場合、縦方向の罫線１０１と横方向の罫線１０２とで囲まれた矩形状の読取領域Ｒ１００が設定されると、その読取領域Ｒ１００の内側に破断した罫線１０１の端部１０３が入り込んでしまうことがある。図１５の例では読取領域Ｒ１００の左右両端の２箇所において罫線１０１の端部１０３が読取領域Ｒ１００に入り込んでいる場合を示している。このような読取領域Ｒ１００に対してＯＣＲ処理を実施すると、罫線１０１の端部１０３が例えば「１」として誤認識されるため、読取領域Ｒ１００を読み取った文字列として「１２１」が出力される。したがって、正確な文字列が出力されないので、問題となる。

一方、特許文献２の従来技術のように「１」の文字を罫線コードに置き換えると、図１５に示す読取領域Ｒ１００にＯＣＲ処理を実施した結果として「２」が出力されるため、読取領域Ｒ１００に記載された文字を正確に出力することができる。しかし、特許文献２のように「１」の文字を一律に罫線コードに置き換えてしまうと、読取領域Ｒ１００に仮に「１２１」の文字が記載されている場合であっても、ＯＣＲ処理の結果として「２」が出力されてしまうため、正確な文字列を出力することができない。

そこで本発明は、上記課題を解決することを目的としてなされたものであり、帳票に含まれる罫線が文字と誤認識されてしまうことを低減し、ＯＣＲ処理による文字認識率を向上させることができるようにした帳票識別装置、帳票識別方法及びプログラムを提供することを目的とする。

上記目的を達成するため、請求項１に係る発明は、罫線を含む帳票に記載された文字を認識する帳票識別装置であって、帳票に文字が記載された記入済帳票画像を取得する画像取得手段と、前記記入済帳票画像において罫線で囲まれた読取領域に記載された文字を認識する文字認識処理を実行する文字認識手段と、前記文字認識手段によって前記読取領域から認識された文字列の先頭又は後尾に特定の文字が含まれるか否かを判定する文字列判定手段と、前記文字列判定手段によって文字列の先頭又は後尾に特定の文字が含まれると判定された場合に、前記記入済帳票画像において前記読取領域に含まれる罫線を検出する罫線検出手段と、前記罫線検出手段によって検出される罫線を１本の実線に補正する罫線補正手段と、前記罫線補正手段によって罫線が補正された前記記入済帳票画像に対して前記文字認識手段による文字認識処理を再度実行させる制御手段と、を備えることを特徴とする構成である。

請求項２に係る発明は、請求項１に記載の帳票識別装置において、前記罫線検出手段は、前記読取領域から画素濃度のヒストグラムを算出し、該ヒストグラムに基づいて前記読取領域の端部近傍に位置する罫線を検出することを特徴とする構成である。

請求項３に係る発明は、請求項２に記載の帳票識別装置において、前記罫線検出手段は、前記文字列判定手段によって前記特定の文字が検出された位置に対応する前記読取領域の端部近傍から罫線を検出することを特徴とする構成である。

請求項４に係る発明は、請求項２又は３に記載の帳票識別装置において、前記罫線検出手段は、前記読取領域の横軸方向に対してヒストグラムを算出し、前記文字列判定手段によって前記特定の文字が検出された位置に応じて前記ヒストグラムの左端近傍又は右端近傍から罫線に対応する画素濃度分布を検出することにより縦方向の罫線を検出することを特徴とする構成である。

請求項５に係る発明は、請求項２又は３に記載の帳票識別装置において、前記罫線検出手段は、前記読取領域の縦軸方向に対してヒストグラムを算出し、前記文字列判定手段によって前記特定の文字が検出された位置に応じて前記ヒストグラムの上端近傍又は下端近傍から罫線に対応する画素濃度分布を検出することにより横方向の罫線を検出することを特徴とする構成である。

請求項６に係る発明は、請求項２乃至５のいずれかに記載の帳票識別装置において、前記罫線検出手段は、前記ヒストグラムの端部近傍に、罫線に対応する画素濃度分布が存在しないとき、前記読取領域の端部近傍から罫線を検出しないことを特徴とする構成である。

請求項７に係る発明は、請求項１乃至６のいずれかに記載の帳票識別装置において、前記罫線検出手段は、前記文字列判定手段によって文字列の先頭又は後尾に前記特定の文字が含まれていることが検出された複数の読取領域が前記記入済帳票画像において所定方向に連続的又は断続的に配置されているとき、前記複数の読取領域に含まれる罫線を検出することを特徴とする構成である。

請求項８に係る発明は、請求項７に記載の帳票識別装置において、前記罫線検出手段は、前記複数の読取領域のそれぞれから画素濃度のヒストグラムを算出し、該ヒストグラムに基づいて前記複数の読取領域のそれぞれの端部近傍に位置する共通の罫線を検出することを特徴とする構成である。

請求項９に係る発明は、請求項１乃至８のいずれかに記載の帳票識別装置において、前記罫線補正手段は、前記罫線検出手段によって検出される罫線に対して太線化処理を行うことを特徴とする構成である。

請求項１０に係る発明は、請求項９に記載の帳票識別装置において、前記太線化処理は、前記罫線検出手段によって検出される罫線が互いに平行な複数の細線によって構成される場合に前記複数の細線の隙間を埋める処理を含むことを特徴とする構成である。

請求項１１に係る発明は、請求項９又は１０に記載の帳票識別装置において、前記太線化処理は、前記罫線検出手段によって検出される罫線が欠損部分を有する不連続な罫線である場合に前記欠損部分を補完して連続な罫線に補正する処理を含むことを特徴とする構成である。

請求項１２に係る発明は、請求項１乃至１１のいずれかに記載の帳票識別装置において、前記画像取得手段によって取得される前記記入済帳票画像に対して画像の傾きを補正するための画像処理を行う画像処理手段を更に備え、前記文字認識手段は、前記画像処理手段よって前記記入済帳票画像に対する画像処理が行われた後に、前記文字認識処理を実行することを特徴とする構成である。

請求項１３に係る発明は、請求項１乃至１２のいずれかに記載の帳票識別装置において、前記制御手段は、前記罫線補正手段によって罫線が補正された前記記入済帳票画像に対して前記文字認識手段による文字認識処理を再度実行させた後、前記文字認識手段によって前記読取領域から認識された文字列の先頭又は後尾に前記特定の文字が含まれるか否かを前記文字列判定手段に再度判定させ、文字列の先頭又は後尾に前記特定の文字が含まれると判定された場合に、前記罫線検出手段及び前記罫線補正手段のそれぞれによる処理を再度実行させることを特徴とする構成である。

請求項１４に係る発明は、請求項１３に記載の帳票識別装置において、前記制御手段は、前記罫線補正手段による処理を再度実行させる際、前記罫線検出手段によって検出される罫線を前回よりも太い実線に補正する処理を行わせることを特徴とする構成である。

請求項１５に係る発明は、請求項１乃至１４のいずれかに記載の帳票識別装置において、前記特定の文字は、「１」、「Ｉ」、「ｌ」又は「−」を含む文字であることを特徴とする構成である。

請求項１６に係る発明は、帳票識別方法であって、罫線を含む帳票に文字が記載された記入済帳票画像を取得する第１ステップと、前記記入済帳票画像において罫線で囲まれた読取領域に記載された文字を認識する文字認識処理を実行する第２ステップと、前記第２ステップによって前記読取領域から認識された文字列の先頭又は後尾に特定の文字が含まれるか否かを判定する第３ステップと、前記第３ステップによって文字列の先頭又は後尾に前記特定の文字が含まれると判定された場合に、前記記入済帳票画像において前記読取領域に含まれる罫線を検出する第４ステップと、前記第４ステップによって検出される罫線を１本の実線に補正する第５ステップと、前記第５ステップによって罫線が補正された前記記入済帳票画像に対して前記第２ステップによる文字認識処理を再度実行させる第６ステップと、を有することを特徴とする構成である。

請求項１７に係る発明は、プログラムであって、コンピュータに、罫線を含む帳票に文字が記載された記入済帳票画像を取得する第１ステップと、前記記入済帳票画像において罫線で囲まれた読取領域に記載された文字を認識する文字認識処理を実行する第２ステップと、前記第２ステップによって前記読取領域から認識された文字列の先頭又は後尾に特定の文字が含まれるか否かを判定する第３ステップと、前記第３ステップによって文字列の先頭又は後尾に前記特定の文字が含まれると判定された場合に、前記記入済帳票画像において前記読取領域に含まれる罫線を検出する第４ステップと、前記第４ステップによって検出される罫線を１本の実線に補正する第５ステップと、前記第５ステップによって罫線が補正された前記記入済帳票画像に対して前記第２ステップによる文字認識処理を再度実行させる第６ステップと、を実行させることを特徴とする構成である。

本発明によれば、帳票に含まれる罫線が文字と誤認識されてしまうことを低減することができるようになり、ＯＣＲ処理などの文字認識処理による文字認識率を向上させることができる。

帳票識別システムの構成概念を示す図である。オリジナル帳票画像の一例を示す図である。帳票識別装置のハードウェア構成及び機能構成の一例を示すブロック図である。画像処理部による画像処理の概念を示す図である。読取領域検出部によって設定される読取領域の一例を示す図である。読取領域を設定するための罫線探索の概要を説明する図である。縦方向の罫線の一部が読取領域の内側にある場合を例示する図である。特定の文字が検出された複数の読取領域が縦方向に連続的に配置されている場合の一例を示す図である。罫線補正として行われる処理の例を示す図である。縦方向の罫線に対して罫線補正を施した状態の一例を示す図である。帳票識別装置で行われる具体的な処理手順の一例を示すフローチャートである。誤認識判定処理の詳細な処理手順の一例を示すフローチャートである。罫線補正処理の詳細な処理手順の一例を示すフローチャートである。横方向の罫線の一部が読取領域の内側に入り込んでいる状態を例示する図である。罫線の一部を文字として誤認識する場合の一例を示す図である。

以下、本発明に関する好ましい実施形態について図面を参照しつつ詳細に説明する。尚、以下に説明する実施形態において互いに共通する部材には同一符号を付しており、それらについての重複する説明は省略する。

図１は、本発明における帳票識別システム１の構成概念を示す図である。この帳票識別システム１は、ＭＦＰ（Multifunction Peripherals）などで構成される画像入力装置２と、コンピュータ３で構成される帳票識別装置１０とを備え、これらが相互にデータ通信を行うことができる構成である。

画像入力装置２は、スキャン機能やＦＡＸ機能などを有する。画像入力装置２は、装置本体の上部にスキャナ部２ａを備えており、そのスキャナ部２ａを動作させることにより、顧客からＦＡＸや郵便などで送られてきた注文書などの帳票５を読み取って記入済帳票画像６を生成する。帳票５は、罫線で囲まれた矩形枠の内側に、顧客によって任意の文字が記入された用紙である。そのため、画像入力装置２は、顧客によって書き込まれた文字を含む記入済帳票画像６を生成する。画像入力装置２は、帳票５を読み取って記入済帳票画像６を生成すると、その記入済帳票画像６を帳票識別装置１０へ出力する。また画像入力装置２は、ＦＡＸで帳票画像を受信した場合、その帳票画像を、記入済帳票画像６として帳票識別装置１０へ出力することも可能である。

帳票識別装置１０は、記入済帳票画像６に記載されている文字を認識するための装置である。帳票識別装置１０は、画像入力装置２から記入済帳票画像６を取得すると、まずその記入済帳票画像６に対して傾き補正などの画像処理を行い、傾き補正などを行った記入済帳票画像６に対してＯＣＲ処理などの文字認識処理を実行するように構成される。

この帳票識別装置１０は、ハードディスクドライブなどで構成される記憶装置１５を有しており、その記憶装置１５に、顧客による記入が行われていないブランク状態の帳票５に関するオリジナル帳票画像７が予め記憶されている。図２は、オリジナル帳票画像７の一例を示す図である。図２に示すようにオリジナル帳票画像７は、縦方向及び横方向の複数の罫線が予め付されており、それら罫線で囲まれた複数の矩形枠のうち、ブランクの矩形枠が顧客によって注文内容などの文字が記入される領域となっている。

帳票識別装置１０は、傾き補正などを行った記入済帳票画像６に対して文字認識処理を実行する際、記憶装置１５からオリジナル帳票画像７を読み出し、記入済帳票画像６をオリジナル帳票画像７に対してパターンマッチングさせる。そして帳票識別装置１０は、記入済帳票画像６においてオリジナル帳票画像７のブランクの矩形枠が含まれている領域の近傍で罫線探索を行うことにより、記入済帳票画像６から文字認識の対象となる読取領域を検出し、その読取領域に対して文字認識処理を行うことにより顧客によって記入された文字を認識するように構成される。以下、このような帳票識別装置１０について詳しく説明する。

図３は、帳票識別装置１０のハードウェア構成及び機能構成の一例を示すブロック図である。図３（ａ）に示すように、帳票識別装置１０は、ハードウェア構成として、ＣＰＵとメモリとを備えて構成される制御部１１と、ユーザーに対して各種情報を表示する表示部１２と、ユーザーによる入力操作を受け付ける操作入力部１３と、帳票識別装置１０をＬＡＮ（Local Area Network）などのネットワークに接続するためのネットワークインタフェース１４と、上述した記憶装置１５とを備えている。記憶装置１５には、制御部１１のＣＰＵによって実行されるプログラム１６が予めインストールされている。このプログラム１６は、コンピュータ３を帳票識別装置１０として機能させるためのプログラムである。例えば、コンピュータ３のユーザーが、操作入力部１３を介してプログラム１６の実行を指示すると、制御部１１のＣＰＵは記憶装置１５からプログラム１６を読み出して起動する。これにより、コンピュータ３が帳票識別装置１０として機能するようになる。

制御部１１のＣＰＵがプログラム１６を実行することにより、制御部１１は、図３（ａ）に示すように、オリジナル画像登録部２１及び帳票識別部２２として機能する。オリジナル画像登録部２１は、記憶装置１５にオリジナル帳票画像７を記憶させる処理部である。このオリジナル画像登録部２１は、ユーザーによって新たな帳票５の登録操作が行われた場合に動作し、指定された新たな帳票５のオリジナル帳票画像７を記憶装置１５へ格納する。したがって、記憶装置１５には、複数種類の帳票５のオリジナル帳票画像７が記憶されることもある。

帳票識別部２２は、ネットワークインタフェース１４を介して画像入力装置２から受信する記入済帳票画像６を取得し、その記入済帳票画像６に記入された文字を認識する処理部である。図３（ｂ）は、帳票識別部２２の詳細な機能構成を示す図である。帳票識別部２２は、記入済画像取得部３１と、画像処理部３２と、読取領域検出部３３と、文字認識部３４と、文字列判定部３５と、罫線検出部３６と、罫線補正部３７と、制御部３８とを備えている。制御部３８は、記入済画像取得部３１、画像処理部３２、読取領域検出部３３、文字認識部３４、文字列判定部３５、罫線検出部３６及び罫線補正部３７のそれぞれの動作を制御するものであり、上記各部を順に動作させることにより、記入済帳票画像６に含まれる文字を認識して得られる文字情報を出力するように制御する。

記入済画像取得部３１は、ネットワークインタフェース１４を介して記入済帳票画像６を取得する処理部である。画像処理部３２は、記入済画像取得部３１によって取得された記入済帳票画像６に対して傾き補正などの画像処理を施す処理部である。

図４は、画像処理部３２による画像処理の概念を示す図である。記入済画像取得部３１によって取得される記入済帳票画像６は、図４（ａ）に示すように帳票画像が傾いた状態となっていることが多い。これは、顧客が帳票５のＦＡＸ送信などを行う際に、帳票５が自動原稿搬送装置の内部で斜行してしまうことなどが原因であり、画像入力装置２において帳票５の画像を読み取るときには既に傾いた状態となっていることもある。そのため、画像処理部３２は、記入済帳票画像６に含まれる罫線の傾きを検知し、その検知した傾きに基づいて記入済帳票画像６に対する傾き補正を行うことにより、図４（ａ）に示すように傾いた状態の帳票画像を、図４（ｂ）に示すように傾きのない帳票画像に補正する。画像処理部３２は、文字認識処理に先立って記入済帳票画像６の傾き補正を行っておくことにより、記入済帳票画像６をオリジナル帳票画像７にマッチングさせるときに画像の回転などを行うことなく、マッチングさせることができる。

また画像処理部３２は、傾き補正の他にも、例えば記入済帳票画像６に含まれる孤立点を除去するための孤立点除去処理、記入済帳票画像６の天地が逆である場合に天地反転を行う天地補正処理、裏面の文字などが表面側に裏写りしている場合に裏写り画像を除去する裏写り除去処理などの画像処理を実行する。画像処理部３２は、それらの画像処理を予め実行しておくことにより、孤立点や裏写りなどが影響して文字認識率が低下してしまうことを抑制することができる。

読取領域検出部３３は、記入済帳票画像６に対する文字認識処理を実行する際の読取領域を検出する処理部である。読取領域検出部３３は、画像処理部３２によって画像処理が施された記入済帳票画像６を取得すると、オリジナル帳票画像７を読み出し、オリジナル帳票画像７に対して記入済帳票画像６をマッチングさせることにより、オリジナル帳票画像７において予め読取領域として設定されているブランクの矩形枠の領域が記入済帳票画像６においてどの部分に相当する位置するかを特定し、記入済帳票画像６に対して文字認識の対象となる読取領域を設定する。図５は、読取領域検出部３３によって設定される読取領域の一例を示す図である。読取領域検出部３３は、例えば図５において斜線で示す部分を文字認識処理による読取領域として設定する。

また記入済帳票画像６をオリジナル帳票画像７にマッチングさせたとき、記入済帳票画像６に含まれる矩形枠と、オリジナル帳票画像７に含まれる矩形枠とが完全に一致するとは限らない。寧ろ、オリジナル帳票画像７に含まれる矩形枠に対し、記入済帳票画像６に含まれる矩形枠の位置やサイズに若干のずれが生じているのが一般的である。そのため、読取領域検出部３３は、記入済帳票画像６をオリジナル帳票画像７にマッチングさせることによって特定される矩形枠に相当する部分の近傍領域で罫線探索を行う。図６は、その罫線探索の概要を説明する図である。例えば読取領域検出部３３は、図６に示すように記入済帳票画像６において矩形枠に相当する部分を含む罫線探索領域ＲＸを設定し、その罫線探索領域ＲＸの内側において縦方向及び横方向の罫線４０を探索する。そして読取領域検出部３３は、罫線探索によって検出した縦方向及び横方向の罫線４０に囲まれた領域の内側に読取領域Ｒを設定する。上記のようにして読取領域検出部３３は、罫線４０で囲まれた領域ごとに、文字認識の対象となる読取領域Ｒを設定する。

文字認識部３４は、読取領域検出部３３によって設定された読取領域Ｒに対して文字認識処理を実行する処理部である。この文字認識部３４は、ＯＣＲ処理などの公知の文字認識処理を行うことにより、読取領域Ｒに含まれる画像成分から１文字ずつ文字を検出する。読取領域検出部３３によって複数の読取領域Ｒが設定された場合、文字認識部３４は、それら複数の読取領域Ｒのそれぞれに対して文字認識処理を実行する。その結果、文字認識部３４は、記入済帳票画像６に設定される複数の読取領域Ｒのそれぞれに記入されている文字を検出する。読取領域Ｒの内部に文字と認識し得る画像成分が含まれない場合、文字認識部３４は、文字認識処理を行っても文字を検出しない。そして文字認識部３４は、各読取領域Ｒから読み取った文字又は文字列を文字列判定部３５へ出力する。

文字列判定部３５は、文字認識部３４によって認識される文字又は文字列に罫線を誤認識した可能性のある文字が含まれるか否かを判定する処理部である。例えば読取領域Ｒの内側に罫線の一部が含まれていると、文字認識部３４によって罫線の一部が文字として誤認識される可能性がある。文字列判定部３５は、そのような誤認識された可能性のある文字の有無を判定する。

図７は、罫線４０の一部４１が読取領域Ｒの内側にある場合を例示する図である。例えば記入済帳票画像６に含まれる縦方向の罫線４０は、図７（ａ）に示すように文字認識処理に先立って行われる画像処理によって斜め方向に傾いた線分の集合に置き換えられてしまうことがある。この場合、罫線探索によって設定される読取領域Ｒの内側に斜め方向に罫線４０の一部４１（例えば傾いた線分の端部）が入り込んでしまうことがある。そのような読取領域Ｒに対して文字認識部３４が文字認識を行うと、読取領域Ｒの左右両端にある罫線４０の一部４１を「１」として認識するため、読取領域Ｒ１００を読み取った結果、「１２１」の文字列が得られる。つまり、罫線４０の一部４１が「１」と誤認識された文字は、文字認識部３４によって認識される文字列の先頭又は後尾に含まれる。文字認識部３４によって認識された文字が一文字だけである場合、文字列の先頭と後尾が同じ文字であるため、文字列の先頭と後尾の双方に誤認識された文字が含まれることになる。したがって、文字列判定部３５は、文字認識部３４によって認識された文字列の先頭又は後尾に「１」などの特定の文字が含まれるか否かを検査することにより、誤認識の可能性を判定する。

図７（ａ）に示すように縦方向の罫線４０の一部４１が読取領域Ｒの内側に入り込むことによって誤認識され得る文字としては、上述した「１」の他にも、例えば「Ｉ」や「ｌ」、「ｉ」、「／」、「！」などの文字があり、更には特殊文字なども存在する。したがって、文字列判定部３５は、それらの文字を誤認識される可能性のある特定の文字として予め登録しており、文字列の先頭又は後尾に予め登録されている特定の文字が含まれる否かを検査するように構成される。そして文字列判定部３５による判定の結果、誤認識の可能性があると判定されると、次に罫線検出部３６が機能する。

罫線検出部３６は、文字認識部３４による文字認識が行われた読取領域Ｒに含まれる罫線４０を検出する処理部である。この罫線検出部３６は、文字列判定部３５によって誤認識の可能性があると判定された読取領域Ｒから画素濃度のヒストグラムを算出することにより、その読取領域Ｒに罫線４０の一部４１が含まれているか否かを検出するように構成される。

例えば図７（ａ）に示したように読取領域Ｒの左端及び右端の双方において罫線４０の一部４１が読取領域Ｒの内側に入り込んでいる場合において、罫線検出部３６が読取領域Ｒの横軸方向に対してヒストグラムを算出すると、そのヒストグラムは図７（ｂ）に示すような濃度分布として得られる。すなわち、読取領域Ｒの左端に罫線４０の一部４１が存在する場合、ヒストグラムの左端近傍に罫線４０の一部４１に対応する画素濃度分布のピークＰａが検出される。また読取領域Ｒの右端に罫線４０の一部４１が存在する場合、ヒストグラムの右端近傍に罫線４０の一部４１に対応する画素濃度分布のピークＰｂが検出される。このような罫線４０の一部４１に対応する画素濃度分布のピークＰａ，Ｐｂは、ヒストグラムの左端近傍又は右端近傍の所定領域Ｒａ，Ｒｂに出現する。これに対し、顧客が矩形枠の内側に記入した文字に対応する画素濃度分布のピークＰｃは、図７（ｂ）に示すようにヒストグラムのほぼ中央に現れる。

そのため、罫線検出部３６は、文字列判定部３５によって文字列の先端又は後尾に特定の文字が検出された場合、ヒストグラムの左端近傍又は右端近傍の所定領域Ｒａ，Ｒｂに罫線４０に対応する濃度分布のピークＰａ，Ｐｂが存在するか否かを判定する。その結果、ヒストグラムの左端近傍又は右端近傍の所定領域Ｒａ，Ｒｂに罫線４０に対応する濃度分布のピークＰａ，Ｐｂが存在する場合、罫線検出部３６は、その濃度分布のピークＰａ，Ｐｂを構成する画素を罫線４０として検出する。これにより、読取領域Ｒの左端又は右端において読取領域Ｒの内側に入り込んだ状態となっている罫線４０を検出することができる。

一方、ヒストグラムの左端近傍又は右端近傍の所定領域Ｒａ，Ｒｂに罫線４０に対応する濃度分布のピークＰａ，Ｐｂが存在しない場合には、特定の文字は罫線の誤認識によって得られたものではなく、正常な文字認識によって得られた文字であることが判明する。そのため、罫線検出部３６は、ヒストグラムの端部近傍に、罫線４９に対応する画素濃度分布のピークＰａ，Ｐｂが存在しないとき、読取領域Ｒの端部近傍から罫線４０を検出する処理を行わない。

罫線検出部３６は、文字列の先端及び後端の双方から特定の文字が検出された場合には、読取領域Ｒの左端及び右端の双方において読取領域Ｒの内側に入り込んだ状態となっている罫線４０を検出する。これに対し、文字列の先端及び後端のいずれか一方から特定の文字が検出された場合、罫線検出部３６は、読取領域Ｒの左端及び右端の一方において読取領域Ｒの内側に入り込んだ状態となっている罫線４０だけを検出する。例えば、文字列の先端のみから特定の文字が検出された場合には読取領域Ｒの左端において読取領域Ｒの内側に入り込んだ状態となっている罫線４０だけを検出し、文字列の後尾のみから特定の文字が検出された場合には読取領域Ｒの右端において読取領域Ｒの内側に入り込んだ状態となっている罫線４０だけを検出する。これにより、誤認識の可能性のない罫線については検出処理が行われないため、処理効率が向上する。

また罫線検出部３６は、文字列判定部３５によって文字列の先頭又は後尾に特定の文字が含まれていることが検出された複数の読取領域Ｒが記入済帳票画像６において一定の方向に連続的又は断続的に配置されているとき、それら複数の読取領域Ｒに含まれている共通の罫線４０を検出する。図８は、特定の文字が検出された複数の読取領域Ｒ１〜Ｒ９が縦方向に連続的に配置されている場合の一例を示す図である。例えば図８（ａ）に示すように縦方向に並んだ９つの読取領域Ｒ１〜Ｒ９のそれぞれから検出された文字列の後尾に特定の文字である「１」が含まれている場合、罫線検出部３６は、それら９つの読取領域Ｒ１〜Ｒ９の右端に縦方向の罫線４０が含まれているか否かを判断する。このとき、罫線検出部３６は、図８（ｂ）に示すように９つの読取領域Ｒ１〜Ｒ９のそれぞれからヒストグラム５１〜５９を個別に算出する。尚、図８（ｂ）では、ヒストグラム５１が読取領域Ｒ１に、ヒストグラム５２が読取領域Ｒ２に、ヒストグラム５３が読取領域Ｒ３に、ヒストグラム５４が読取領域Ｒ４に、ヒストグラム５５〜５９が読取領域Ｒ５〜Ｒ９にそれぞれ対応する。そして９つの読取領域Ｒ１〜Ｒ９のそれぞれから検出された文字列の後尾に特定の文字である「１」が含まれているため、罫線検出部３６は、それらのヒストグラム５１〜５９の右端近傍の所定領域に罫線４０に対応する濃度分布のピークが共通して存在するか否かを判定する。そして罫線検出部３６は、複数のヒストグラム５１〜５９のそれぞれの右端近傍の所定領域に共通のピークが存在する場合、そのピークを構成する画素を縦方向の共通した罫線４０として検出する。図８（ｂ）の例では、９つのヒストグラム５１〜５９のそれぞれの右端近傍の所定領域から共通のピークが検出されるため、９つの読取領域Ｒ１〜Ｒ９のそれぞれの右端において共通した縦方向の罫線４０を構成する画素が検出されることになる。このように特定の文字が検出された複数の読取領域Ｒが記入済帳票画像６において一定の方向に連続的又は断続的に配置されている場合には、罫線検出部３６がそれら複数の読取領域Ｒのそれぞれに含まれる共通した罫線４０を検出することにより、１つの読取領域Ｒから単独で罫線４０を検出する場合よりも罫線検出の信頼性を向上させることができる。つまり、顧客によって矩形枠の端に文字が記入されている場合であっても、その文字を罫線として誤検出してしまうことを抑制することができるのである。

上記のようにして罫線検出部３６によって読取領域Ｒの端部にある罫線４０が検出されると、次に罫線補正部３７が機能する。罫線補正部３７は、罫線検出部３６によって読取領域Ｒの端部で検出された罫線４０を所定幅以上の１本の実線に補正することで、文字と誤認識されない罫線に補正する処理部である。罫線補正部３７によって行われる罫線補正には、様々な処理が含まれる。

図９は、罫線補正として行われる処理の一例を示す図である。図９（ａ）は、罫線４０の太線化処理を示している。罫線補正部３７は、太線化処理を行うとき、元の罫線４０を幅方向に所定画素数分だけ太くする処理を実行する。したがって、補正後の罫線４２は、元の罫線４０よりも幅広の１本の実線として表されるため、罫線として識別し易くなる。

図９（ｂ）は、元の罫線４０が欠損部分Ａを有する不連続な罫線である場合の欠損部分補完処理を示している。罫線補正部３７は、欠損部分補完処理を行うとき、元の罫線４０において途切れた２つの端部を繋げるように黒色の画素を補完する処理を実行する。したがって、補正後の罫線４２は、欠損部分Ａがなくなり、連続した１本の実線として表されるため、罫線として識別し易くなる。

図９（ｃ）は、元の罫線４０が互いに平行な複数の細線によって構成される場合にそれら複数の細線の隙間を埋める処理を示している。罫線補正部は、この処理を行うとき、元の罫線４０に含まれる複数の細線の隙間を黒色の画素で埋める処理を実行する。したがって、補正後の罫線４２では、元の罫線４０に含まれる複数の細線が１本の実線として表されるため、罫線として識別し易くなる。

罫線補正部３７は、上述した３つの処理のうちから１つの処理を選択して罫線補正を行うものであっても良いし、また３つの処理を複合的に組み合わせた罫線補正を行うものであっても良い。そのような罫線補正により、画像処理部３２で行われた傾き補正などの影響によってジグザグになってしまっていたり、欠損部分を有する不連続な線となってしまっていたりする罫線４０が、識別し易い罫線４２に変換されるのである。

図１０は、例えば図７（ａ）に示した縦方向の罫線４０に対して罫線補正を施した状態の一例を示す図である。図１０に示すように罫線検出部３６によって罫線補正が行われることで読取領域Ｒの左右近傍において縦方向に延びる罫線４２は、それ以前の罫線４０よりも太い１本の実線として表されるようになる。そのため、罫線補正が行われると、罫線４２は、それ以前よりも鮮明になるため、識別し易くなる。したがって、記入済帳票画像６に含まれる罫線４０は、識別し易い罫線４２に置き換えられる。

上記のようにして罫線補正部３７によって特定の文字と誤認識された罫線４０に対する罫線補正が行われると、制御部３８は、読取領域検出部３３を再度機能させ、識別し易い罫線４２に置き換えられた記入済帳票画像６に対して再び読取領域Ｒを設定する処理を行わせる。これにより、読取領域検出部３３は、記入済帳票画像６に対して再び罫線探索を行い、縦方向及び横方向の罫線４０に囲まれた領域の内側に読取領域Ｒを再設定する。このとき、前回の処理で特定の文字と誤認識された罫線４０は、識別し易い罫線４２に置き換えられている。そのため、読取領域検出部３３によって再設定される読取領域Ｒは、図１０に示すような領域となり、読取領域Ｒの内側に、罫線４２の一部が入り込んでしまうことを抑制することができる。そして制御部３８は、読取領域検出部３３によって読取領域Ｒが再設定されると、文字認識部３４を再度機能させ、再設定された読取領域Ｒに対する文字認識処理を再度実行させる。これにより、文字認識率を向上させることができる。

そして制御部３８は、文字列の先頭又は後尾に特定の文字が含まれる場合、読取領域Ｒの左端近傍又は右端近傍に誤認識された罫線が検出されなくなるまで上述した処理を繰り返すことにより、罫線の誤認識を解消することができるようになる。

図１１は、上記のような帳票識別装置１０で行われる具体的な処理手順の一例を示すフローチャートである。この処理は、帳票識別装置１０の制御部１１がプログラム１６を実行することによって行われる処理であり、制御部１１が帳票識別部２２として機能する場合の処理手順を示している。帳票識別装置１０は、この処理を開始すると、まず記入済帳票画像６を取得するまで待機する（ステップＳ１０）。そして記入済帳票画像６を取得すると（ステップＳ１０でＹＥＳ）、帳票識別装置１０は、その記入済帳票画像６に対する傾き補正などの画像処理を行い、傾きのない記入済帳票画像６に変換する（ステップＳ１１）。そして帳票識別装置１０は、オリジナル帳票画像７を読み出し（ステップＳ１２）、記入済帳票画像６をオリジナル帳票画像７にマッチングさせた状態で罫線探索を行うことにより、記入済帳票画像６から文字認識のための読取領域Ｒを検出する（ステップＳ１３）。

帳票識別装置１０は、記入済帳票画像６から検出された読取領域Ｒに対して文字認識処理を実行し、読取領域Ｒに含まれる文字列を検出する（ステップＳ１４）。このとき、帳票識別装置１０は、記入済帳票画像６から検出された複数の読取領域Ｒの全てに対して文字認識処理を実行する。

続いて帳票識別装置１０は、文字列判定処理を実行し（ステップＳ１５）、文字認識処理によって複数の読取領域Ｒのそれぞれから認識された文字列の先頭又は後尾に特定の文字が含まれているか否かを判定する（ステップＳ１６）。その結果、文字列の先頭又は後尾に特定の文字が含まれている場合（ステップＳ１６でＹＥＳ）、帳票識別装置１０は、誤認識判定処理を実行する（ステップＳ１７）。この誤認識判定処理では、読取領域Ｒのヒストグラムを算出することにより、読取領域Ｒの端部に罫線４０が存在するか否かが判断され、罫線４０が存在する場合には特定の文字が罫線４０の誤認識であると判定される。尚、誤認識判定処理（ステップＳ１７）の詳細については後述する。そして帳票識別装置１０は、特定の文字が誤認識であるか否かを判断し（ステップＳ１８）、誤認識である場合（ステップＳ１８でＹＥＳ）、罫線補正処理を実行する（ステップＳ１９）。この罫線補正処理では、特定の文字と誤認識された可能性のある罫線４０が識別し易い罫線４２に補正される。尚、罫線補正処理（ステップＳ１９）の詳細については後述する。そして帳票識別装置１０は、罫線補正が行われた後にステップＳ１３に戻り、識別し易い罫線４２に置き換えられた記入済帳票画像６から文字認識のための読取領域Ｒを再度検出する処理を実行すると共に、上述したステップＳ１３以降の処理を繰り返す。

また帳票識別装置１０は、文字認識処理によって複数の読取領域Ｒのそれぞれから認識された文字列の先頭又は後尾に特定の文字が含まれていない場合（ステップＳ１６でＮＯ）、罫線の誤認識は生じていないと判断し、文字認識処理によって認識された文字列を出力するための文字列出力処理を実行する（ステップＳ２０）。またステップＳ１８において誤認識でないと判断された場合（ステップＳ１８でＮＯ）にも、帳票識別装置１０は、文字列出力処理を実行する（ステップＳ２０）。そして文字列出力処理が終了すると、記入済帳票画像６に対する全ての処理が終了する。

図１２は、誤認識判定処理（ステップＳ１７）の詳細な処理手順の一例を示すフローチャートである。帳票識別装置１０は、この処理を開始すると、文字列の先頭又は後尾に特定の文字を含む複数の読取領域Ｒが一定方向に沿って配置されているか否かを判断する（ステップＳ３０）。その結果、複数の読取領域Ｒが一定方向に沿って配置されている場合（ステップＳ３０でＹＥＳ）、帳票識別装置１０は、それらの一定方向に沿って配置されている複数の読取領域Ｒのそれぞれからヒストグラムを算出する（ステップＳ３１）。そして帳票識別装置１０は、特定の文字が文字列の先頭にあるかを判断し（ステップＳ３２）、文字列の先頭にある場合（ステップＳ３２でＹＥＳ）、複数のヒストグラムのそれぞれの左端近傍に罫線４０に対応する濃度分布が存在するか否かを判断する（ステップＳ３３）。そして複数のヒストグラムの左端近傍に罫線４０に対応する濃度分布が存在する場合（ステップＳ３３でＹＥＳ）、帳票識別装置１０は、それらの濃度分布を構成する画素を抽出し、複数の読取領域Ｒの左端近傍にある共通の罫線４０を検出する（ステップＳ３４）。そして帳票識別装置１０は、文字列の先頭にある特定の文字がその共通の罫線４０を誤認識したものであると判定する（ステップＳ３５）。

続いて帳票識別装置１０は、特定の文字が文字列の後尾にあるかを判断し（ステップＳ３６）、文字列の後尾にある場合（ステップＳ３６でＹＥＳ）、複数のヒストグラムのそれぞれの右端近傍に罫線４０に対応する濃度分布が存在するか否かを判断する（ステップＳ３７）。そして複数のヒストグラムの右端近傍に罫線４０に対応する濃度分布が存在する場合（ステップＳ３７でＹＥＳ）、帳票識別装置１０は、それらの濃度分布を構成する画素を抽出し、複数の読取領域Ｒの右端近傍にある共通の罫線４０を検出する（ステップＳ３８）。そして帳票識別装置１０は、文字列の後尾にある特定の文字がその共通の罫線４０を誤認識したものであると判定する（ステップＳ３９）。

一方、複数の読取領域Ｒが一定方向に沿って配置されていない場合（ステップＳ３０でＮＯ）、帳票識別装置１０は、文字列の先頭又は後尾から特定の文字が検出された１つ１つの読取領域Ｒに対して個別に誤認識であるか否かの判定を行う。すなわち、帳票識別装置１０は、単独の読取領域Ｒからヒストグラムを算出する（ステップＳ４１）。そして帳票識別装置１０は、特定の文字が文字列の先頭にあるかを判断し（ステップＳ４２）、文字列の先頭にある場合（ステップＳ４２でＹＥＳ）、ヒストグラムの左端近傍に罫線４０に対応する濃度分布が存在するか否かを判断する（ステップＳ４３）。そしてヒストグラムの左端近傍に罫線４０に対応する濃度分布が存在する場合（ステップＳ４３でＹＥＳ）、帳票識別装置１０は、その濃度分布を構成する画素を抽出し、その読取領域Ｒの左端近傍にある１つの罫線４０を検出する（ステップＳ４４）。そして帳票識別装置１０は、文字列の先頭にある特定の文字がその罫線４０を誤認識したものであると判定する（ステップＳ４５）。

続いて帳票識別装置１０は、特定の文字が文字列の後尾にあるかを判断し（ステップＳ４６）、文字列の後尾にある場合（ステップＳ４６でＹＥＳ）、ヒストグラムの右端近傍に罫線４０に対応する濃度分布が存在するか否かを判断する（ステップＳ４７）。そしてヒストグラムの右端近傍に罫線４０に対応する濃度分布が存在する場合（ステップＳ３７でＹＥＳ）、帳票識別装置１０は、その濃度分布を構成する画素を抽出し、その読取領域Ｒの右端近傍にある１つの罫線４０を検出する（ステップＳ４８）。そして帳票識別装置１０は、文字列の後尾にある特定の文字がその罫線４０を誤認識したものであると判定する（ステップＳ４９）。

以上で、誤認識判定処理（ステップＳ１７）が終了する。尚、顧客が矩形枠の左端や右端に文字を記入していた場合に、その文字を罫線と誤検出してしまうことを防止するためには、単独の読取領域Ｒに対して行われる上述したステップＳ４１〜Ｓ４９の処理は行わないようにしても良い。

次に図１３は、罫線補正処理（ステップＳ１９）の詳細な処理手順の一例を示すフローチャートである。帳票識別装置１０は、この処理を開始すると、まず誤認識判定処理（ステップＳ１７）で検出された罫線４０を解析する（ステップＳ５０）。そして帳票識別装置１０は、罫線４０が平行な複数の細線によって構成されるか否かを判断し（ステップＳ５１）、複数の細線によって構成される場合（ステップＳ５１でＹＥＳ）、複数の細線の隙間を黒色の画素で埋める処理を実行する（ステップＳ５２）。尚、罫線４０が平行な複数の細線によって構成されていない場合（ステップＳ５１でＮＯ）、ステップＳ５２の処理はスキップする。次に帳票識別装置１０は、罫線４０に欠損部分があるか否かを判断し（ステップＳ５３）、欠損部分がある場合（ステップＳ５３でＹＥＳ）、その欠損部分を補完する処理を実行する（ステップＳ５４）。尚、罫線４０に欠損部分がない場合（ステップＳ５３でＮＯ）、ステップＳ５４の処理はスキップする。次に帳票識別装置１０は、罫線４０に対する太線化処理を行う際の画素幅を決定し（ステップＳ５５）、罫線４０の幅方向に黒色の画素を付加することにより、罫線４０を太くする太線化処理を実行する（ステップＳ５６）。

以上で罫線補正処理（ステップＳ１９）が終了する。上述の罫線補正処理（ステップＳ１９）は、図１１に示したステップＳ１３〜Ｓ１９のループ処理が繰り返し行われることによって複数回実行される処理である。そのため、帳票識別装置１０は、罫線補正処理（ステップＳ１９）を実行する度に、例えば太線化処理を行う際の画素幅を１画素ずつ増やすなど、罫線補正処理を行う際のパラメータをその都度変更する。これにより、罫線補正処理が実行される度に、記入済帳票画像６に含まれる罫線４２がより識別し易い状態に加工されるようになり、ループ処理を繰り返すことによってステップＳ１６又はＳ１８においてＮＯと判断されるケースが生じることになる。

上記においては、主として記入済帳票画像６において縦方向の罫線４０を特定の文字と誤認識する場合を例示したが、文字認識部３４が誤認識する罫線４０は縦方向のものだけに限られない。すなわち、文字認識部３４は、横方向の罫線４０の一部４１が読取領域Ｒに入り込んでいる場合にもその罫線４０の一部４１を文字として誤認識する可能性がある。図１４は、横方向の罫線４０の一部４１が読取領域Ｒの内側に入り込んでいる場合を例示する図である。図１４（ａ）に示すように読取領域Ｒの上部にある横方向の罫線４０の一部４１が読取領域Ｒの内側に入り込んでいる場合、文字認識部３４がその読取領域Ｒに対して文字認識処理を行うと、例えば「−２−」という文字列が検出される。この文字列に含まれる「−」は罫線４０の一部４１を文字として誤認識したものである。横方向の罫線４０の一部４１が誤認識され得る文字としては、「−」の他にも、例えば「ー」や「＿」などの文字があり、更には特殊文字なども存在する。したがって、文字列判定部３５は、それらの文字を誤認識される可能性のある特定の文字として予め登録しておくことにより、縦方向の罫線４０だけでなく、横方向の罫線４０が文字として誤認識された場合にも罫線補正を行うことができるようになる。

この場合、罫線検出部３６は、図１４（ｂ）に示すように読取領域Ｒの縦軸方向に対してヒストグラムを算出し、文字列判定部３５によって特定の文字が検出された位置に応じてヒストグラムの上端近傍又は下端近傍の所定領域Ｒｃから罫線４０に対応する画素濃度分布のピークＰｃを検出することにより横方向の罫線４０を検出する。その結果、横方向の罫線４０が検出されれば、「−」や「ー」、「＿」などの特定の文字として認識された文字が罫線４０の誤認識であることが判明する。したがって、本実施形態の帳票識別装置１０は、縦方向及び横方向のいずれの罫線４０が文字と誤認識された場合にも、その罫線４０を補正したうえで再度文字認識を行うことにより、文字認識の精度を自動的に向上させることができるものである。

以上のように本実施形態の帳票識別装置１０は、帳票５に文字が記載された記入済帳票画像６を取得する記入済画像取得部３１と、記入済帳票画像６において罫線４０で囲まれた読取領域Ｒに記載された文字を認識する文字認識処理を実行する文字認識部３４と、文字認識部３４によって読取領域Ｒから認識された文字列の先頭又は後尾に特定の文字が含まれるか否かを判定する文字列判定部３５と、文字列判定部３５によって文字列の先頭又は後尾に特定の文字が含まれると判定された場合に、記入済帳票画像６において読取領域Ｒに含まれる罫線４０を検出する罫線検出部３６と、罫線検出部３６によって検出される罫線４０を１本の実線に補正する罫線補正部３７と、罫線補正部３７によって罫線４０が補正された記入済帳票画像６に対して文字認識部３４による文字認識処理を再度実行させる制御部３８と、を備える構成である。このような構成によれば、読取領域Ｒの内側にある罫線４０が特定の文字と誤認識された場合に、その誤認識された罫線４０を特定したうえでその罫線４０が文字と誤認識されないように補正することができる。そして罫線４０が補正された状態で文字認識処理を再度実行することにより、罫線４０の誤認識を低減させることができるようになる。その結果、本実施形態の帳票識別装置１０は、従来よりも文字認識率を向上させることができるようになる。

以上、本発明に関する一実施形態について説明したが、本発明は、上記実施形態において説明した内容のものに限られるものではなく、種々の変形例が適用可能である。

例えば上記実施形態では、帳票５が注文書である場合を例示したが、帳票５は注文書に限られるものではない。すなわち、帳票５は、罫線を含むものであれば、どのようなものであっても構わない。

３コンピュータ
５帳票
６記入済帳票画像
１０帳票識別装置
３１記入済画像取得部（画像取得手段）
３２画像処理部（画像処理手段）
３３読取領域検出部（読取領域検出手段）
３４文字認識部（文字認識手段）
３５文字列判定部（文字列判定手段）
３６罫線検出部（罫線検出手段）
３７罫線補正部（罫線補正手段）
３８制御部（制御手段）

Claims

罫線を含む帳票に記載された文字を認識する帳票識別装置であって、
帳票に文字が記載された記入済帳票画像を取得する画像取得手段と、
前記記入済帳票画像において罫線で囲まれた読取領域に記載された文字を認識する文字認識処理を実行する文字認識手段と、
前記文字認識手段によって前記読取領域から認識された文字列の先頭又は後尾に特定の文字が含まれるか否かを判定する文字列判定手段と、
前記文字列判定手段によって文字列の先頭又は後尾に特定の文字が含まれると判定された場合に、前記記入済帳票画像において前記読取領域に含まれる罫線を検出する罫線検出手段と、
前記罫線検出手段によって検出される罫線を１本の実線に補正する罫線補正手段と、
前記罫線補正手段によって罫線が補正された前記記入済帳票画像に対して前記文字認識手段による文字認識処理を再度実行させる制御手段と、
を備えることを特徴とする帳票識別装置。
前記罫線検出手段は、前記読取領域から画素濃度のヒストグラムを算出し、該ヒストグラムに基づいて前記読取領域の端部近傍に位置する罫線を検出することを特徴とする請求項１に記載の帳票識別装置。
前記罫線検出手段は、前記文字列判定手段によって前記特定の文字が検出された位置に対応する前記読取領域の端部近傍から罫線を検出することを特徴とする請求項２に記載の帳票識別装置。
前記罫線検出手段は、前記読取領域の横軸方向に対してヒストグラムを算出し、前記文字列判定手段によって前記特定の文字が検出された位置に応じて前記ヒストグラムの左端近傍又は右端近傍から罫線に対応する画素濃度分布を検出することにより縦方向の罫線を検出することを特徴とする請求項２又は３に記載の帳票識別装置。
前記罫線検出手段は、前記読取領域の縦軸方向に対してヒストグラムを算出し、前記文字列判定手段によって前記特定の文字が検出された位置に応じて前記ヒストグラムの上端近傍又は下端近傍から罫線に対応する画素濃度分布を検出することにより横方向の罫線を検出することを特徴とする請求項２又は３に記載の帳票識別装置。
前記罫線検出手段は、前記ヒストグラムの端部近傍に、罫線に対応する画素濃度分布が存在しないとき、前記読取領域の端部近傍から罫線を検出しないことを特徴とする請求項２乃至５のいずれかに記載の帳票識別装置。
前記罫線検出手段は、前記文字列判定手段によって文字列の先頭又は後尾に前記特定の文字が含まれていることが検出された複数の読取領域が前記記入済帳票画像において所定方向に連続的又は断続的に配置されているとき、前記複数の読取領域に含まれる罫線を検出することを特徴とする請求項１乃至６のいずれかに記載の帳票識別装置。
前記罫線検出手段は、前記複数の読取領域のそれぞれから画素濃度のヒストグラムを算出し、該ヒストグラムに基づいて前記複数の読取領域のそれぞれの端部近傍に位置する共通の罫線を検出することを特徴とする請求項７に記載の帳票識別装置。
前記罫線補正手段は、前記罫線検出手段によって検出される罫線に対して太線化処理を行うことを特徴とする請求項１乃至８のいずれかに記載の帳票識別装置。
前記太線化処理は、前記罫線検出手段によって検出される罫線が互いに平行な複数の細線によって構成される場合に前記複数の細線の隙間を埋める処理を含むことを特徴とする請求項９に記載の帳票識別装置。
前記太線化処理は、前記罫線検出手段によって検出される罫線が欠損部分を有する不連続な罫線である場合に前記欠損部分を補完して連続な罫線に補正する処理を含むことを特徴とする請求項９又は１０に記載の帳票識別装置。
前記画像取得手段によって取得される前記記入済帳票画像に対して画像の傾きを補正するための画像処理を行う画像処理手段を更に備え、
前記文字認識手段は、前記画像処理手段よって前記記入済帳票画像に対する画像処理が行われた後に、前記文字認識処理を実行することを特徴とする請求項１乃至１１のいずれかに記載の帳票識別装置。
前記制御手段は、前記罫線補正手段によって罫線が補正された前記記入済帳票画像に対して前記文字認識手段による文字認識処理を再度実行させた後、前記文字認識手段によって前記読取領域から認識された文字列の先頭又は後尾に前記特定の文字が含まれるか否かを前記文字列判定手段に再度判定させ、文字列の先頭又は後尾に前記特定の文字が含まれると判定された場合に、前記罫線検出手段及び前記罫線補正手段のそれぞれによる処理を再度実行させることを特徴とする請求項１乃至１２のいずれかに記載の帳票識別装置。
前記制御手段は、前記罫線補正手段による処理を再度実行させる際、前記罫線検出手段によって検出される罫線を前回よりも太い実線に補正する処理を行わせることを特徴とする請求項１３に記載の帳票識別装置。
前記特定の文字は、「１」、「Ｉ」、「ｌ」又は「−」を含む文字であることを特徴とする請求項１乃至１４のいずれかに記載の帳票識別装置。
罫線を含む帳票に文字が記載された記入済帳票画像を取得する第１ステップと、
前記記入済帳票画像において罫線で囲まれた読取領域に記載された文字を認識する文字認識処理を実行する第２ステップと、
前記第２ステップによって前記読取領域から認識された文字列の先頭又は後尾に特定の文字が含まれるか否かを判定する第３ステップと、
前記第３ステップによって文字列の先頭又は後尾に前記特定の文字が含まれると判定された場合に、前記記入済帳票画像において前記読取領域に含まれる罫線を検出する第４ステップと、
前記第４ステップによって検出される罫線を１本の実線に補正する第５ステップと、
前記第５ステップによって罫線が補正された前記記入済帳票画像に対して前記第２ステップによる文字認識処理を再度実行させる第６ステップと、
を有することを特徴とする帳票識別方法。
コンピュータに、
罫線を含む帳票に文字が記載された記入済帳票画像を取得する第１ステップと、
前記記入済帳票画像において罫線で囲まれた読取領域に記載された文字を認識する文字認識処理を実行する第２ステップと、
前記第２ステップによって前記読取領域から認識された文字列の先頭又は後尾に特定の文字が含まれるか否かを判定する第３ステップと、
前記第３ステップによって文字列の先頭又は後尾に前記特定の文字が含まれると判定された場合に、前記記入済帳票画像において前記読取領域に含まれる罫線を検出する第４ステップと、
前記第４ステップによって検出される罫線を１本の実線に補正する第５ステップと、
前記第５ステップによって罫線が補正された前記記入済帳票画像に対して前記第２ステップによる文字認識処理を再度実行させる第６ステップと、
を実行させることを特徴とするプログラム。