JP2004185129A - Image processor and image processing method - Google Patents

Image processor and image processing method Download PDF

Info

Publication number
JP2004185129A
JP2004185129A JP2002348711A JP2002348711A JP2004185129A JP 2004185129 A JP2004185129 A JP 2004185129A JP 2002348711 A JP2002348711 A JP 2002348711A JP 2002348711 A JP2002348711 A JP 2002348711A JP 2004185129 A JP2004185129 A JP 2004185129A
Authority
JP
Japan
Prior art keywords
image
paper
sheet
area
detecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002348711A
Other languages
Japanese (ja)
Inventor
Hiroko Eto
裕子 江藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2002348711A priority Critical patent/JP2004185129A/en
Publication of JP2004185129A publication Critical patent/JP2004185129A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide an image processor capable of performing image reading processing to an attached sheet in addition to a main paper in a ledger sheet of specific specification, for example, a receipt with a continued paper. <P>SOLUTION: In this image processor for performing the reading processing of the ledger sheet of specific specification such as the receipt with the continuous paper, an image processing part 100 separately detects the respective image areas of the main paper and the continued paper, and cuts out them on the basis of the edge detection result for an input image. A recognition part 120 executes character recognition processing on each remarks column of the main paper and the continued paper. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、一般的には画像処理装置の分野に関し、特に、付属用紙を付加した用紙上の画像を検出する画像検出技術に関する。
【0002】
【従来の技術】
従来、例えば光学的文字読取装置(OCR)などの画像処理装置は、スキャナにより帳票などの用紙上を走査して、当該用紙上に記録された画像(文字又は図形などのパターン)を入力する。
【0003】
ところで、OCRでは、読取対象としてサイズやフォーマットが異なる各種の帳票が取り扱われている。このような各種の帳票を読取対象とするためには、帳票上に記録されている画像領域を検出し、切り出す画像検出技術が特に重要である。
【0004】
従来においても、各種の帳票を識別し、認識する技術が提供されている(例えば、特許文献1を参照)。また、特にフリーフォーマットの帳票を処理する先行技術も提案されている(例えば、特許文献2を参照)。この先行技術は、2値画像上における横方向の黒ランの上側又は下側の境界画像を横方向に連結して横方向セグメントを抽出する。また同様に、縦方向の黒ランの左側又は右側の境界画像を縦方向に連結して縦方向セグメントを抽出する枠認識に関する技術である。
【0005】
【特許文献1】
特開2002−109468号公報
【0006】
【特許文献2】
特公平4−18351号公報)
【0007】
【発明が解決しようとする課題】
前述の各種の帳票に中には、例えばレセプト(診療報酬明細書)と称する医療関係で使用される帳票がある。レセプトは、通常では所定のフォーマットからなるA4サイズの用紙であり、医療機関が医療費を請求するために、市町村や保険組合に提出するための書類の一種である。このレセプトをOCRにより読取処理するためのシステムは、既に開発されて利用されている。
【0008】
ところで、レセプトには、本紙(A4サイズの用紙)に続紙とよばれる付属用紙が付加された特殊仕様の帳票の形態で取り扱われることがある。一般的に、レセプトのフォーマット中には、摘要欄と呼ばれる項目が含まれている。この摘要欄は、A4サイズの本紙に含まれる記入欄に書ききれない場合には、当該本紙に糊付けされる続紙まで拡張できるようになっている。
【0009】
従来では、この摘要欄をOCRで読取処理する場合に、所定のA4サイズの本紙に含まれるものに限定されている。従って、レセプトの付属用紙である続紙上の摘要欄については、OCRでの読取処理は不可能であった。
【0010】
そこで、本発明の目的は、例えば続紙が付加されたレセプトのような特殊仕様の帳票などにおいて、本紙と共に付属用紙に対する画像読取処理を行なうことができる画像処理装置及び画像処理方法を提供することにある。
【0011】
【課題を解決するための手段】
本発明の観点は、続紙が付加されたレセプトのような特殊仕様の帳票において、当該続紙などに相当する付属用紙上の画像領域と、本紙上の画像領域とを区別して検出する画像検出手段を備えた画像処理装置に関する。
【0012】
本発明の観点に従った画像処理装置は、本紙に付属用紙が付加された用紙を走査して画像を入力する画像入力手段と、前記画像入力手段により入力された画像から一定の直線成分を含むエッジを検出するエッジ検出手段と、前記エッジ検出手段の検出結果に基づいて、前記本紙上の画像領域と、前記付属用紙上の画像領域とを区別して検出する画像検出手段とを備えたものである。
【0013】
このような構成により、例えばレセプトの本紙に付加された続紙などの付属用紙上の画像領域を検出できるため、本紙に記録された例えば摘要欄と共に、続紙上に記録された摘要欄に対してもOCRによる読取処理が可能となる。従って、本紙のみのレセプトだけでなく、続紙が付加されたレセプトに対してもOCRによる読取処理が可能となるため、レセプト処理の効率化を向上することができる。要するに、付属用紙が付加された特殊仕様の帳票に対するOCRの読取処理が可能となるような有用な画像処理装置を提供することができる。
【0014】
【発明の実施の形態】
以下図面を参照して、本発明の実施の形態を説明する。
【0015】
図1は、本実施形態に関する画像処理装置(ここではOCRを想定する)の構成を示すブロック図である。
【0016】
(OCRの構成)
本OCRは、図1に示すように、大別してスキャナ20と、例えばパーソナルコンピュータなどのコンピュータ30とから構成される。スキャナ20は、通常では、多数枚の帳票10から搬送される1枚毎の帳票上を走査して、当該帳票上に記録された情報(文字や図形などのパターン)を画像(画像データ)に変換して、コンピュータ30に入力する画像入力装置である。
【0017】
コンピュータ30は、OCR本体に相当し、OCRソフトウェアを実行するマイクロプロセッサ(CPU)100と、ハードディスクドライブなどの記憶装置200とを含む。本実施形態は、便宜的に、CPU100が実行するOCRソフトウェアの機能を、画像処理部110及び認識部120として説明する。
【0018】
画像処理部110は、スキャナ20から入力される画像を処理して、認識部120での文字認識処理に必要な画像データを出力する。認識部120は、画像処理部110から得られる画像データから文字認識処理を実行し、認識結果210を記憶装置200に出力する。さらに、画像処理部110は、後述する帳票10の本紙と付属用紙のそれぞれの画像領域を区別して検出する(切り出す)画像検出機能を実現する。
【0019】
なお、コンピュータ30は、有線又は無線の通信回線を介して、認識部120から出力された認識結果を外部システムに転送することが可能である。
【0020】
(画像処理方法)
以下、図1以外に図2から図13を参照して、本実施形態の画像処理方法を説明する。
【0021】
本実施形態は、図2に示すように、帳票10としては、本紙50とその付属用紙である続紙60とからなるレセプトを想定する。本紙50は、通常ではA4サイズのフォーマットからなり、各種の記録項目を有する。この項目の中には、薬剤名、規格、単位、数量などの処置に関する詳細な内容が記入される摘要欄(図2に示す本紙50の右側中央部分)が設けられている。一方、続紙60は、通常では左端辺で本紙50に糊付けされており、本紙の摘要欄では書ききれない傷病名などが記入される摘要欄の拡張部分に相当する。
【0022】
ここで、図2に示すように、続紙60は、縦方向のA4サイズの本紙50に対して、高さ(縦サイズ)が例えば50mm程度小さいサイズであることが規定されている。但し、続紙60の長さ(横サイズ)は任意であるが、後述するように、カラム単位の摘要欄領域を有する。図2では、続紙60は、縦罫線を境界として2つのカラムから構成されている。図5は、同図(A)に示すような本紙50のみからなるレセプトや、また同図(I)に示すような続紙60のみの場合を含めて各種サイズの続紙60が付加されたレセプトの具体例を示す。
【0023】
(画像検出処理)
以下、主として図3のフローチャートを参照して、レセプトの読取処理を行なう場合の画像検出処理の手順を説明する。
【0024】
まず、スキャナ20によりレセプト上が走査されて、レセプト上の画像が入力される(ステップS1)。ここで、図5に示すように、読取対象であるレセプト画像の外側には、スキャナ20のベース(ベッド)に相当する黒領域(斜線の部分)が存在することが前提である。
【0025】
また、ここでは、図5(B)または(C)に示すように、本紙50と続紙60とが一度に走査されて、画像入力処理がなされる場合を想定する。但し、図5(D)から(H)に示すように、続紙60の長さやスキャナ20の走査範囲によっては、複数回の走査での画像入力処理がなされる場合もある。また、同図(I)に示すように、本紙50に糊付けされていない続紙60の場合には、当然ながら単独で走査されることになる。
【0026】
次に、画像処理部110は、入力された画像全体に対するエッジ検出処理を実行する(ステップS2)。エッジ検出処理は、帳票イメージの平面形状である矩形領域(画像領域)を構成する各エッジを検出する。エッジ検出方法は、通常では基準線から白画素を検出するまで走査し、一定間隔で検出した白画素点を結ぶ直線(座標x,yの1次関数)を求める。このとき、直線性が最も高い線分をエッジ(上下端及び左右端)として決定する。
【0027】
本実施形態のエッジ検出方法は、例えば図6に示すように、本紙50と続紙60の各部分(矩形領域)を検出するために、2段階方法によるエッジ検出処理を実行する。即ち、上端と下端でプロットする点のx座標を同一にして、上端と下端の点の距離が一定以上短くなる位置を検出する。そして、その点の前後で検出点を分けて、上下それぞれ2つの直線を求めて、レセプトの上下エッジとして決定する。同様にして左右の2つの直線を求めて、レセプトの左右エッジとして決定する。ここで、レセプトの傾きを考慮して、最初と最後の白画素検出点や、上下端点間の距離が変化する検出点の前後ひとつずつを除いて、直線を求めることによりレセプトのエッジを正確に決定することが可能である。
【0028】
画像処理部110は、前記のようなエッジ検出結果に基づいて、矩形領域を検出する(ステップS3)。さらに、画像処理部110は、矩形領域の高さなどを測定して、当該領域のサイズを判定する(ステップS4)。即ち、画像処理部110は、検出した矩形領域のサイズがA4サイズであれば、本紙50であると判定する(ステップS5のYES)。従って、この場合には、画像処理部110は、本紙50の画像領域を除く領域を、続紙60の画像領域として区別する(ステップS6)。具体的には、図5(B)から(H)に示すようなレセプト形態である。
【0029】
一方、画像処理部110は、検出した矩形領域のサイズがA4サイズでない場合には、入力画像の全てを続紙60の画像領域として判定する(ステップS5のNO,S7)。
【0030】
ここで、画像処理部110は、入力画像が本紙50と続紙60の各画像領域からなる場合に、図7に示すように、続紙60の画像領域の左端の座標を、本紙50の画像領域の所定の範囲70(例えば10mm程度)まで拡張する処理を実行する。これは、続紙60の左端部分(接続辺部)が本紙50上に貼り付けられているため、当該部分を考慮した処理である。
【0031】
以上のようにして、本実施形態は、本紙50に付加された続紙60を有するレセプトに対して、本紙50と続紙60とのサイズ差を利用した2段階エッジ検出処理により、本紙50と続紙60の各画像領域を区別して検出する。これにより、画像処理部110は、スキャナ20からの入力画像から、レセプトを構成する本紙50と続紙60の各画像領域をそれぞれ切り出すことが可能となる。
【0032】
従って、OCRの認識部120は、画像処理部110により切り出された本紙50上の画像領域(摘要欄を含む)に対する文字認識処理を実行して、当該認識結果を記憶部200に出力する。また、認識部120は、画像処理部110により切り出された続紙60上の画像領域である摘要欄に対する文字認識処理を実行して、当該認識結果を記憶部200に出力する。
【0033】
(続紙の画像検出処理)
前述したように、続紙60は、本紙50の摘要欄を拡張したものであり、通常では、カラムと呼ぶ領域単位に分割されている。そこで、以下、主として図4のフローチャート、図8、図9、図11、図12及び図13を参照して、本実施形態のカラム単位の画像検出(切り出し)処理を説明する。
【0034】
まず、続紙60は、図11に示すように、上下端の横罫線600と、左右端の縦罫線601とにより、各カラム(ここでは2カラム)の範囲を規定している。画像処理部110は、続紙60の画像領域に対して罫線検出処理を実行する(ステップS11)。この罫線検出処理での横罫線600の検出結果に基づいて、摘要欄の上下端を設定する(ステップS12のYES,S13)。
【0035】
さらに、画像処理部110は、縦罫線601の検出結果に基づいて、摘要欄の左右端を設定する(ステップS15のYES)。そして、画像処理部110は、設定した上下端と左右端とに基づいて、摘要欄をカラムに分割する(ステップS16)。画像処理部110は、分割したカラムに対して一定幅以上のカラムのみを、摘要欄を構成するカラムとして選択する(ステップS18)。これにより、例えば図13に示すように、左端の部分が走査されなかったカラムを除去することができる。
【0036】
ここで、画像処理部110は、前記の縦罫線の検出処理において、図8に示すように、続紙60の糊付け作業などの影響で複数の分裂している罫線80a〜80cを1本の罫線として統合する処理を実行する。なお、横罫線の検出処理においても、同様に複数の分裂している罫線を1本の罫線として統合する処理を実行する。
【0037】
また、画像処理部110は、罫線検出処理での横罫線600を検出できない場合には、通常では、続紙60の画像領域の上から下までの全てを摘要欄として決定する(ステップS12のNO)。但し、図12に示すように、続紙60の中には、上部分に医療機関コードなどの摘要欄の記載事項とは異なる記載があり、かつ一定幅の空白610が存在するものがある。この場合には、画像処理部110は、横罫線の変わりに、空白610の下を摘要欄の上端として設定する(ステップS14)。なお、この場合、摘要欄の下端は、画像領域の下までとして設定する。
【0038】
さらに、図12に示すように、続紙60の中に縦罫線601が存在しない場合には、画像処理部110は、縦罫線601の代わりに空白を検出して、カラムごとの分割処理を実行する(ステップS15のNO,S17)。具体的には、画像処理部110は、図9に示すように、所定の1カラム分の幅より大きい範囲内に含まれる空白90を検出し、当該空白90をカラムの境界として設定する。なお、画像処理部110は、最左端又は最右端の縦罫線が存在する場合には、当該縦罫線を基準として1カラム分の範囲に含まれる空白90を検出する。また、当該縦罫線が存在しない場合には、画像領域の左端又は右端を基準として1カラム分の範囲に含まれる空白90を検出する。
【0039】
ここで、続紙60の摘要欄を分割する1カラム分の幅は、通常では、A4サイズ領域の半分程度の幅である。画像処理部110は、前述のように、摘要欄の上下端を決定した後に、画像領域の左端又は右端を基準として、当該1カラム分の幅の範囲に含まれる画像をカラム単位の画像として切り出す処理を実行してもよい。このような方法であれば、空白90を検出できない場合でも、カラム単位の画像を検出して切り出すことが可能である。
【0040】
以上のようにして本実施形態の方法であれば、入力画像から検出した続紙60の画像領域から、摘要欄を構成するカラム単位の画像領域を分割して切り出すことができる。これにより、OCRの認識部120は、本紙50上の摘要欄と共に、続紙60上の摘要欄に対してカラム単位の文字認識処理を実行することができる。そして、OCRは、本紙50及び続紙60の両者に含まれる摘要欄の認識結果を記憶部200に出力できる。
【0041】
(カラム分割処理の変形例)
図10は、続紙60の画像領域から、摘要欄を構成するカラム単位の画像領域を分割するカラム分割処理の変形例を示す図である。本変形例は、DP(dynamic programming)マッチング方式を適用し、続紙60上の摘要欄をカラムに分割する処理方法である。
【0042】
当該方法は、図10に示すように、各罫線間にコストを設定し、当該コストとして罫線間の距離を対応付けする。そして、1カラム分の罫線間に最も小さなコストを設定し、2カラム、3カラムの間隔にある罫線間のコストを考慮して設定する。この方法により、ノイズなどの罫線ではないものを罫線として検出した場合に、その影響を受けないようなカラム分割処理を行なうことができる。
【0043】
【発明の効果】
以上詳述したように本発明によれば、例えば続紙等の付属用紙が付加されたレセプトのような特殊仕様の帳票などにおいて、本紙と付属用紙のそれぞれの画像領域を別々に検出して切り出すことができる。従って、本紙と共に付属用紙に対する画像読取処理を行なうことができる。特に続紙が付加されたレセプトのような特殊仕様の帳票を、OCRなどにより一括して読取処理を行なうことが可能となるため、実用的観点からも有用である。
【図面の簡単な説明】
【図1】本発明の実施形態に関するOCRの構成を示すブロック図。
【図2】同実施形態に関するレセプトの具体例を示す図。
【図3】同実施形態に関する画像検出処理の手順を説明するためのフローチャート。
【図4】同実施形態に関する続紙の画像切り出し処理の手順を説明するためのフローチャート。
【図5】同実施形態に関する各種のレセプトの具体例を示す図。
【図6】同実施形態に関するエッジ検出処理を説明するための図。
【図7】同実施形態に関する続紙の画像領域の拡張処理を説明するための図。
【図8】同実施形態に関する続紙のカラム分割処理を説明するための図。
【図9】同カラム分割処理を説明するための図。
【図10】同実施形態のカラム分割処理の変形例を説明するための図。
【図11】同実施形態に関する続紙上のカラムの具体例を説明するための図。
【図12】同実施形態に関する続紙のカラム分割処理を説明するための図。
【図13】同実施形態に関する続紙のカラム分割処理を説明するための図。
【符号の説明】
10…帳票(用紙)
20…スキャナ
30…コンピュータ
50…本紙(レセプト)
60…続紙(付属用紙)
100…マイクロプロセッサ(CPU)
110…画像処理部
120…認識部
200…記憶装置
600…横罫線
601…縦罫線
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates generally to the field of image processing devices, and more particularly, to an image detection technique for detecting an image on a sheet to which an attached sheet is added.
[0002]
[Prior art]
2. Description of the Related Art Conventionally, an image processing apparatus such as an optical character reader (OCR) scans a sheet such as a form with a scanner and inputs an image (a pattern such as a character or a figure) recorded on the sheet.
[0003]
By the way, in OCR, various forms having different sizes and formats are handled as reading targets. In order to read such various forms, it is particularly important to use an image detection technique for detecting and cutting out an image area recorded on the form.
[0004]
Conventionally, a technology for identifying and recognizing various forms has been provided (for example, see Patent Document 1). In addition, a prior art for processing a free format form has also been proposed (for example, see Patent Document 2). In this prior art, a horizontal segment is extracted by connecting a boundary image above or below a horizontal black run on a binary image in the horizontal direction. Similarly, the present invention relates to a technique related to frame recognition in which a boundary image on the left or right side of a vertical black run is vertically connected to extract a vertical segment.
[0005]
[Patent Document 1]
JP-A-2002-109468
[Patent Document 2]
Japanese Patent Publication No. 4-18351)
[0007]
[Problems to be solved by the invention]
Among the various forms described above, there is a form used in medical relations called, for example, a claim (medical fee statement). The receipt is usually A4 size paper in a predetermined format, and is a type of document that a medical institution submits to a municipal government or an insurance union in order to claim medical expenses. A system for reading this receipt by OCR has already been developed and used.
[0008]
By the way, the receipt may be handled in a form of special specification in which an attached sheet called a continuous sheet is added to the main sheet (A4 size sheet). Generally, the format of the receipt includes an item called a summary field. If this summary field cannot be filled in the entry field included in the A4 size book, it can be extended to a continued sheet glued to the book.
[0009]
Conventionally, when this summary field is read by OCR, it is limited to those included in a predetermined A4 size book. Therefore, it was impossible to perform the reading process by the OCR for the summary column on the continuation sheet, which is a sheet attached to the receipt.
[0010]
Therefore, an object of the present invention is to provide an image processing apparatus and an image processing method that can perform image reading processing on attached paper together with the actual paper in a form of special specification such as a receipt with a continuous paper added. It is in.
[0011]
[Means for Solving the Problems]
An aspect of the present invention is to provide an image detection method for distinguishing and detecting an image area on an attached sheet corresponding to a continuous sheet and the like and an image area on the book sheet in a special specification form such as a receipt with a continuous sheet added thereto. The present invention relates to an image processing apparatus provided with means.
[0012]
An image processing apparatus according to an aspect of the present invention includes an image input unit that scans a sheet with an attached sheet added to a book sheet and inputs an image, and includes a certain linear component from the image input by the image input unit. Edge detection means for detecting an edge, and image detection means for distinguishing and detecting an image area on the book paper and an image area on the accessory paper based on a detection result of the edge detection means. is there.
[0013]
With such a configuration, for example, since it is possible to detect an image area on an attached sheet such as a continuous sheet added to the book sheet of the receipt, together with, for example, a summary field recorded on the book sheet, Also, the reading process by the OCR becomes possible. Therefore, since the reading process by the OCR can be performed not only for the receipt of the book sheet but also for the receipt to which the continuous sheet is added, the efficiency of the receipt process can be improved. In short, it is possible to provide a useful image processing apparatus capable of performing an OCR reading process for a special specification form to which an attached sheet is added.
[0014]
BEST MODE FOR CARRYING OUT THE INVENTION
Embodiments of the present invention will be described below with reference to the drawings.
[0015]
FIG. 1 is a block diagram illustrating a configuration of an image processing apparatus (here, OCR is assumed) according to the present embodiment.
[0016]
(Configuration of OCR)
As shown in FIG. 1, the present OCR is roughly composed of a scanner 20 and a computer 30 such as a personal computer. Normally, the scanner 20 scans each sheet conveyed from many sheets 10 and converts information (patterns such as characters and figures) recorded on the sheet into an image (image data). This is an image input device that converts and inputs the converted data to the computer 30.
[0017]
The computer 30 corresponds to an OCR main body, and includes a microprocessor (CPU) 100 that executes OCR software, and a storage device 200 such as a hard disk drive. In this embodiment, the functions of the OCR software executed by the CPU 100 will be described as an image processing unit 110 and a recognition unit 120 for convenience.
[0018]
The image processing unit 110 processes an image input from the scanner 20 and outputs image data necessary for the character recognition processing in the recognition unit 120. The recognition unit 120 performs a character recognition process on the image data obtained from the image processing unit 110 and outputs a recognition result 210 to the storage device 200. Further, the image processing unit 110 realizes an image detection function of detecting (cutting out) the image areas of the regular paper and the attached paper of the form 10 to be described later separately.
[0019]
Note that the computer 30 can transfer the recognition result output from the recognition unit 120 to an external system via a wired or wireless communication line.
[0020]
(Image processing method)
Hereinafter, the image processing method of the present embodiment will be described with reference to FIGS. 2 to 13 in addition to FIG.
[0021]
In the present embodiment, as shown in FIG. 2, the form 10 is assumed to be a receipt including a main sheet 50 and a continuous sheet 60 that is an attached sheet thereof. The book paper 50 usually has an A4 size format and has various recording items. In this item, there is provided a summary column (the central part on the right side of the book 50 shown in FIG. 2) in which detailed contents regarding treatment such as a drug name, a standard, a unit, and a quantity are entered. On the other hand, the continuation sheet 60 is normally glued to the book sheet 50 on the left end side, and corresponds to an extended portion of the summary field in which a name of a disease or the like that cannot be written in the summary field of the paper sheet is entered.
[0022]
Here, as shown in FIG. 2, it is specified that the continuous paper 60 is smaller in height (vertical size) by, for example, about 50 mm than the A4 size book paper 50 in the vertical direction. However, the length (horizontal size) of the continuous sheet 60 is arbitrary, but has a summary column area in column units as described later. In FIG. 2, the continuation sheet 60 is composed of two columns with a vertical ruled line as a boundary. FIG. 5 shows a case in which a receipt consisting of only the main sheet 50 as shown in FIG. 5A and a continuous sheet 60 of various sizes are added, including the case of only the continued sheet 60 as shown in FIG. A specific example of the receipt will be described.
[0023]
(Image detection processing)
Hereinafter, the procedure of the image detection processing when the reception reading processing is performed will be described mainly with reference to the flowchart of FIG.
[0024]
First, the receipt 20 is scanned by the scanner 20, and an image on the receipt is input (step S1). Here, as shown in FIG. 5, it is assumed that a black area (shaded area) corresponding to the base (bed) of the scanner 20 exists outside the receipt image to be read.
[0025]
Here, as shown in FIG. 5B or 5C, it is assumed that the main sheet 50 and the continuation sheet 60 are scanned at a time and the image input processing is performed. However, as shown in FIGS. 5D to 5H, the image input processing may be performed in a plurality of scans depending on the length of the continuous sheet 60 and the scanning range of the scanner 20. Further, as shown in FIG. 1I, in the case of the continuous sheet 60 that is not glued to the main sheet 50, it is naturally scanned alone.
[0026]
Next, the image processing unit 110 performs an edge detection process on the entire input image (step S2). The edge detection process detects each edge forming a rectangular area (image area) that is a planar shape of the form image. In the edge detection method, usually, scanning is performed from a reference line until a white pixel is detected, and a straight line (a linear function of coordinates x and y) connecting white pixel points detected at regular intervals is obtained. At this time, a line segment having the highest linearity is determined as an edge (upper / lower end and left / right end).
[0027]
In the edge detection method according to the present embodiment, for example, as shown in FIG. 6, in order to detect each portion (rectangular area) of the main sheet 50 and the continuous sheet 60, an edge detection process is performed by a two-step method. That is, the x-coordinates of the points to be plotted at the upper end and the lower end are set to be the same, and a position at which the distance between the upper end and the lower end is shorter than a certain value is detected. Then, the detection point is divided before and after that point, and two straight lines are obtained for the upper and lower lines, respectively, and are determined as the upper and lower edges of the receipt. Similarly, two right and left straight lines are obtained and determined as the left and right edges of the receipt. Here, taking into account the slope of the receptor, the edge of the receptor can be accurately determined by obtaining a straight line except for the first and last white pixel detection points and one before and after the detection point at which the distance between the upper and lower points changes. It is possible to decide.
[0028]
The image processing unit 110 detects a rectangular area based on the edge detection result as described above (Step S3). Further, the image processing unit 110 determines the size of the rectangular area by measuring the height or the like of the rectangular area (step S4). That is, if the size of the detected rectangular area is the A4 size, the image processing unit 110 determines that the sheet is the real paper 50 (YES in step S5). Therefore, in this case, the image processing unit 110 distinguishes an area other than the image area of the book sheet 50 as the image area of the continued sheet 60 (step S6). Specifically, it is in the form of a receipt as shown in FIGS.
[0029]
On the other hand, when the size of the detected rectangular area is not the A4 size, the image processing unit 110 determines that all of the input images are image areas of the continuous sheet 60 (NO in step S5, S7).
[0030]
Here, when the input image is composed of the image areas of the main sheet 50 and the continuous sheet 60, the image processing unit 110 converts the coordinates of the left end of the image area of the continuous sheet 60 into the image of the main sheet 50 as shown in FIG. A process for expanding the area to a predetermined range 70 (for example, about 10 mm) is executed. This is a process in which the left end portion (connection side portion) of the continuation sheet 60 is adhered to the main sheet 50, and thus the portion is considered.
[0031]
As described above, in the present embodiment, the two-step edge detection process using the size difference between the original paper 50 and the continuous paper 60 is performed on the receipt having the continuous paper 60 added to the original paper 50, Each image area of the continuation sheet 60 is detected separately. Accordingly, the image processing unit 110 can cut out the image areas of the main sheet 50 and the continuous sheet 60 constituting the receipt from the input image from the scanner 20.
[0032]
Therefore, the OCR recognition unit 120 performs a character recognition process on the image area (including the summary column) on the book 50 cut out by the image processing unit 110 and outputs the recognition result to the storage unit 200. In addition, the recognition unit 120 performs a character recognition process on a summary column, which is an image area on the continuous sheet 60 cut out by the image processing unit 110, and outputs the recognition result to the storage unit 200.
[0033]
(Image detection processing of continued paper)
As described above, the continued sheet 60 is an extension of the summary field of the book sheet 50, and is usually divided into area units called columns. Therefore, hereinafter, the image detection (cutout) processing in units of columns according to the present embodiment will be described mainly with reference to the flowchart in FIG. 4 and FIGS. 8, 9, 11, 12, and 13.
[0034]
First, as shown in FIG. 11, the range of each column (here, two columns) of the continuous sheet 60 is defined by horizontal ruled lines 600 at the upper and lower ends and vertical ruled lines 601 at the left and right ends. The image processing unit 110 performs a ruled line detection process on the image area of the continued sheet 60 (step S11). Based on the detection result of the horizontal ruled line 600 in the ruled line detection processing, the upper and lower ends of the summary field are set (YES in step S12, S13).
[0035]
Further, the image processing unit 110 sets the left and right ends of the summary column based on the detection result of the vertical ruled line 601 (YES in step S15). Then, the image processing unit 110 divides the summary column into columns based on the set upper and lower ends and the left and right ends (step S16). The image processing unit 110 selects only columns having a certain width or more from the divided columns as columns constituting the summary column (step S18). Thereby, for example, as shown in FIG. 13, a column whose left end portion has not been scanned can be removed.
[0036]
Here, in the above-described vertical ruled line detection processing, the image processing unit 110 converts the plurality of divided ruled lines 80a to 80c into one ruled line due to the gluing operation of the continuous sheet 60, as shown in FIG. Execute the integration process. In the horizontal ruled line detection process, similarly, a process of integrating a plurality of divided ruled lines as one ruled line is executed.
[0037]
When the horizontal ruled line 600 cannot be detected in the ruled line detection process, the image processing unit 110 normally determines all of the image area of the continuous sheet 60 from the top to the bottom as the summary column (NO in step S12). ). However, as shown in FIG. 12, some of the continuous sheets 60 include a description different from the description in the summary column such as a medical institution code in the upper part and a blank 610 having a certain width. In this case, the image processing unit 110 sets the lower part of the blank 610 as the upper end of the summary column instead of the horizontal ruled line (step S14). In this case, the lower end of the summary field is set to be below the image area.
[0038]
Further, as shown in FIG. 12, when the vertical ruled line 601 does not exist in the continuous sheet 60, the image processing unit 110 detects a blank instead of the vertical ruled line 601 and executes a division process for each column. (No in step S15, S17). Specifically, as shown in FIG. 9, the image processing unit 110 detects a blank 90 included in a range larger than a predetermined width of one column, and sets the blank 90 as a column boundary. When the leftmost or rightmost vertical ruled line exists, the image processing unit 110 detects a blank 90 included in the range of one column based on the vertical ruled line. If the vertical ruled line does not exist, a blank 90 included in the range of one column is detected based on the left end or the right end of the image area.
[0039]
Here, the width of one column that divides the summary column of the continuous sheet 60 is usually about half the width of the A4 size area. After determining the upper and lower ends of the summary field as described above, the image processing unit 110 cuts out an image included in the range of the width of one column as an image in column units based on the left end or right end of the image area. Processing may be performed. According to such a method, even when the blank 90 cannot be detected, it is possible to detect and cut out an image in column units.
[0040]
As described above, according to the method of the present embodiment, it is possible to divide and cut out the image area of each column constituting the summary column from the image area of the continuous sheet 60 detected from the input image. Thus, the OCR recognizing unit 120 can execute the column-based character recognition process on the summary column on the continuous sheet 60 together with the summary column on the main sheet 50. Then, the OCR can output the recognition result of the summary field included in both the main sheet 50 and the continued sheet 60 to the storage unit 200.
[0041]
(Modified example of column division processing)
FIG. 10 is a diagram showing a modified example of the column division processing for dividing the image area of the column constituting the summary field from the image area of the continuous sheet 60. The present modified example is a processing method in which a dynamic programming (DP) matching method is applied to divide a summary column on the continuous sheet 60 into columns.
[0042]
In this method, as shown in FIG. 10, a cost is set between the ruled lines, and the cost is associated with the distance between the ruled lines. Then, the smallest cost is set between the ruled lines for one column, and the cost is set in consideration of the cost between the ruled lines at intervals of two columns and three columns. According to this method, when a ruled line other than a ruled line such as noise is detected as a ruled line, a column dividing process not affected by the ruled line can be performed.
[0043]
【The invention's effect】
As described in detail above, according to the present invention, for example, in a special specification form such as a receipt to which an attached sheet such as a continuous sheet is added, the image areas of the original sheet and the attached sheet are separately detected and cut out. be able to. Therefore, the image reading process can be performed on the attached paper together with the real paper. In particular, a form with a special specification such as a receipt to which a continuation sheet is added can be collectively read by OCR or the like, which is useful from a practical viewpoint.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of an OCR according to an embodiment of the present invention.
FIG. 2 is an exemplary view showing a specific example of a receipt according to the embodiment;
FIG. 3 is an exemplary flowchart for explaining the procedure of an image detection process according to the embodiment;
FIG. 4 is an exemplary flowchart for explaining the procedure of a continuous sheet image cutting process according to the embodiment;
FIG. 5 is an exemplary view showing specific examples of various receipts according to the embodiment;
FIG. 6 is an exemplary view for explaining edge detection processing according to the embodiment;
FIG. 7 is an exemplary view for explaining extension processing of an image area of a continuous sheet according to the embodiment;
FIG. 8 is an exemplary view for explaining a continuous sheet column dividing process according to the embodiment;
FIG. 9 is a view for explaining the column division processing.
FIG. 10 is an exemplary view for explaining a modification of the column dividing process of the embodiment.
FIG. 11 is an exemplary view for explaining a specific example of a column on a continuation sheet according to the embodiment;
FIG. 12 is an exemplary view for explaining a continuous sheet column dividing process according to the embodiment;
FIG. 13 is an exemplary view for explaining a continuous sheet column dividing process according to the embodiment;
[Explanation of symbols]
10… Form (paper)
20 scanner 30 computer 50 book (recept)
60 ... continued paper (attached paper)
100 ... Microprocessor (CPU)
110 image processing unit 120 recognition unit 200 storage device 600 horizontal ruled line 601 vertical ruled line

Claims (14)

本紙に付属用紙が付加された用紙を走査して画像を入力する画像入力手段と、
前記画像入力手段により入力された画像から一定の直線成分を含むエッジを検出するエッジ検出手段と、
前記エッジ検出手段の検出結果に基づいて、前記本紙上の画像領域と、前記付属用紙上の画像領域とを区別して検出する画像検出手段と
を具備したことを特徴とする画像処理装置。
Image input means for inputting an image by scanning a sheet on which an attached sheet is added to the main sheet;
Edge detection means for detecting an edge including a certain linear component from the image input by the image input means,
An image processing apparatus, comprising: an image detecting unit that distinguishes and detects an image region on the book and an image region on the attached paper based on a detection result of the edge detecting unit.
前記画像検出手段は、前記本紙と前記付属用紙とのサイズ差に基づいて、前記本紙上の画像領域と前記付属用紙上の画像領域とを検出し、当該各画像領域をそれぞれ切り出す手段を有することを特徴とする請求項1に記載の画像処理装置。The image detecting means includes means for detecting an image area on the main paper and an image area on the auxiliary paper based on a size difference between the main paper and the attached paper, and cutting out each of the image areas. The image processing apparatus according to claim 1, wherein: 前記画像検出手段により検出された前記付属用紙上の画像から、所定の認識対象領域に分割する画像分割手段をさらに有することを特徴とする請求項1に記載の画像処理装置。2. The image processing apparatus according to claim 1, further comprising an image dividing unit that divides the image on the attached paper detected by the image detecting unit into a predetermined recognition target area. 前記画像分割手段は、前記付属用紙上に記録された横罫線又は縦罫線に対応する画像に基づいて、所定の認識対象領域に分割することを特徴とする請求項3に記載の画像処理装置。4. The image processing apparatus according to claim 3, wherein the image dividing unit divides the image into a predetermined recognition target area based on an image corresponding to a horizontal ruled line or a vertical ruled line recorded on the attached paper. 前記画像分割手段は、前記付属用紙上に記録された横罫線又は縦罫線に対応する画像及び空白領域に基づいて、所定の認識対象領域に分割することを特徴とする請求項3に記載の画像処理装置。4. The image according to claim 3, wherein the image dividing unit divides the image into a predetermined recognition target area based on an image corresponding to a horizontal ruled line or a vertical ruled line recorded on the attached paper and a blank area. Processing equipment. 前記画像検出手段は、前記付属用紙上の画像領域を検出したときに、当該画像領域を前記本紙の接続部分に相当する所定の範囲まで拡張して切り出す手段を有することを特徴とする請求項1に記載の画像処理装置。2. The image detecting device according to claim 1, further comprising a unit that, when detecting an image area on the attached paper, expands and cuts the image area to a predetermined range corresponding to a connection portion of the book. An image processing apparatus according to claim 1. 前記本紙は所定サイズのレセプトであり、
前記付属用紙は当該レセプト上に記録される摘要欄を拡張するための続紙であり、当該摘要欄を所定のカラム単位で分割可能であることを特徴とする請求項1または請求項3のいずれか1項に記載の画像処理装置。
The book is a predetermined size receipt,
4. The attached sheet is a continuation sheet for expanding a summary field recorded on the receipt, and the summary field can be divided in a predetermined column unit. The image processing apparatus according to claim 1.
本紙に付属用紙が付加された用紙を走査して入力する画像を処理する画像処理装置に適用する画像処理方法であって、
入力された画像から一定の直線成分を含むエッジを検出するエッジ検出ステップと、
前記エッジ検出ステップによる検出結果に基づいて、前記本紙上の画像領域と、前記付属用紙上の画像領域とを区別して検出する画像検出ステップと
を有することを特徴とする画像処理方法。
An image processing method applied to an image processing apparatus that processes an input image by scanning a sheet to which an attached sheet is added to a main sheet,
An edge detection step of detecting an edge including a certain linear component from the input image,
An image processing method, comprising: an image detecting step of distinguishing and detecting an image area on the main paper and an image area on the attached paper based on a detection result by the edge detecting step.
前記画像検出ステップは、前記本紙と前記付属用紙とのサイズ差に基づいて、前記本紙上の画像領域と前記付属用紙上の画像領域とを検出し、当該各画像領域をそれぞれ切り出すことを特徴とする請求項8に記載の画像処理方法。The image detecting step detects an image area on the main paper and an image area on the auxiliary paper based on a size difference between the main paper and the attached paper, and cuts out each image area. The image processing method according to claim 8, wherein: 前記画像手段により検出された前記付属用紙上の画像から、所定の認識対象領域に分割する画像分割ステップをさらに有することを特徴とする請求項8に記載の画像処理方法。The image processing method according to claim 8, further comprising an image dividing step of dividing an image on the attached paper detected by the image unit into a predetermined recognition target area. 前記画像分割ステップは、前記付属用紙上に記録された横罫線又は縦罫線に対応する画像に基づいて、所定の認識対象領域に分割することを特徴とする請求項10に記載の画像処理方法。The image processing method according to claim 10, wherein the image dividing step divides the image into a predetermined recognition target area based on an image corresponding to a horizontal ruled line or a vertical ruled line recorded on the attached paper. 前記画像分割ステップは、前記付属用紙上に記録された横罫線又は縦罫線に対応する画像及び空白領域に基づいて、所定の認識対象領域に分割することを特徴とする請求項10に記載の画像処理方法。The image according to claim 10, wherein the image dividing step divides the image into a predetermined recognition target area based on an image corresponding to a horizontal ruled line or a vertical ruled line recorded on the attached paper and a blank area. Processing method. 前記画像検出ステップは、前記付属用紙上の画像領域を検出したときに、当該画像領域を前記本紙の接続部分に相当する所定の範囲まで拡張して切り出すことを特徴とする請求項8に記載の画像処理方法。9. The image detecting method according to claim 8, wherein, when detecting the image area on the attached paper, the image detecting step cuts out the image area by expanding the image area to a predetermined range corresponding to a connection portion of the book. Image processing method. 前記本紙は所定サイズのレセプトであり、
前記付属用紙は当該レセプト上に記録される摘要欄を拡張するための続紙であり、当該摘要欄を所定のカラム単位で分割可能であることを特徴とする請求項8または請求項10のいずれか1項に記載の画像処理方法。
The book is a predetermined size receipt,
11. The attached sheet is a continuation sheet for expanding a summary field recorded on the receipt, and the summary field can be divided in a predetermined column unit. 2. The image processing method according to claim 1.
JP2002348711A 2002-11-29 2002-11-29 Image processor and image processing method Pending JP2004185129A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002348711A JP2004185129A (en) 2002-11-29 2002-11-29 Image processor and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002348711A JP2004185129A (en) 2002-11-29 2002-11-29 Image processor and image processing method

Publications (1)

Publication Number Publication Date
JP2004185129A true JP2004185129A (en) 2004-07-02

Family

ID=32751553

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002348711A Pending JP2004185129A (en) 2002-11-29 2002-11-29 Image processor and image processing method

Country Status (1)

Country Link
JP (1) JP2004185129A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007264833A (en) * 2006-03-27 2007-10-11 Oki Electric Ind Co Ltd Document classification process system, method for creating electronic medium receipt, and delivery method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007264833A (en) * 2006-03-27 2007-10-11 Oki Electric Ind Co Ltd Document classification process system, method for creating electronic medium receipt, and delivery method

Similar Documents

Publication Publication Date Title
JP3962891B2 (en) Document image processing apparatus, document image processing method, and storage medium
JP5084718B2 (en) Combination detection of position coding pattern and barcode
US9848104B1 (en) Image-processing apparatus, method, and computer program product for correcting skew in scanned images
JPH113430A (en) Method and device for associating input image with reference image, and storage medium storing program realizing the method
US7965293B2 (en) Image processing device, image processing method, and image processing program for reconstructing data
JP4574503B2 (en) Image processing apparatus, image processing method, and program
JP2000278514A (en) Device and method for connecting document image and recording medium recording document image connection program
US6163623A (en) Method and apparatus for recognizing images of documents and storing different types of information in different files
JP4752694B2 (en) Image extraction device
JP2004185129A (en) Image processor and image processing method
JP2004166062A (en) Document reader
JP3660661B2 (en) Image processing apparatus and double feed detection method
JP3604909B2 (en) Image registration method
JP6639257B2 (en) Information processing apparatus and control method therefor
JPH10222587A (en) Method and device for automatically discriminating slip or the like
JP3299873B2 (en) Image processing apparatus and image processing method
JP2001005831A (en) Filing method and recording medium storing the method
JPH0469788A (en) Optical information reader
JPH0250513B2 (en)
JPH11250179A (en) Character reocognition device and its method
JP2008210327A (en) Character image output system and character image output method
JP3463300B2 (en) Mark sheet and mark sheet direction detecting method and apparatus
JP3334369B2 (en) Selection item recognition device
JP3006294B2 (en) Optical character reader
JP2823350B2 (en) Multimedia input device

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060127

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060509