JP2018067096A - 文字認識装置及び文字認識方法 - Google Patents

文字認識装置及び文字認識方法 Download PDF

Info

Publication number
JP2018067096A
JP2018067096A JP2016204356A JP2016204356A JP2018067096A JP 2018067096 A JP2018067096 A JP 2018067096A JP 2016204356 A JP2016204356 A JP 2016204356A JP 2016204356 A JP2016204356 A JP 2016204356A JP 2018067096 A JP2018067096 A JP 2018067096A
Authority
JP
Japan
Prior art keywords
image
character recognition
character
characters
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016204356A
Other languages
English (en)
Inventor
遠航 蔡
Enko Sai
遠航 蔡
和章 横田
Kazuaki Yokota
和章 横田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Digital Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Digital Solutions Corp filed Critical Toshiba Corp
Priority to JP2016204356A priority Critical patent/JP2018067096A/ja
Publication of JP2018067096A publication Critical patent/JP2018067096A/ja
Pending legal-status Critical Current

Links

Abstract

【課題】本発明が解決しようとする課題は、文字「年月日」が少ない文字認識対象物や、横方向の地紋がある文字認識対象物であっても、安定かつ高速に読み取れる文字認識装置、文字認識方法を提供することである。【解決手段】上記した課題を解決するために、本発明の文字認識装置は、帳票より画像を取得する画像情報取得手段と、前記画像情報取得手段により取得された帳票の画像の中から黒ピクセルと白ピクセルが所定方向に特定の配置比で出現する画像領域を検出し、前記画像領域における文字認識を行い、帳票内の特徴文字を複数検出する特徴文字検出手段と、前記特徴文字検出手段により検出された帳票の複数の特徴文字の位置と予め設定された帳票の特徴文字の基準位置とに基づいて、前記取得した帳票の画像の中から帳票の領域を抽出する画像抽出手段と、を備える。【選択図】 図1

Description

本発明は、帳票の画像を処理する業務に用いられる文字認識装置及び文字認識方法に関
する。
近年、スマートフォンの普及によりその活用の場面が広がり、スマートフォンで撮影し
た写真画像に含まれている文字を認識する文字認識の需要がますます増えてきている。光
学的文字読取技術(以下、OCR技術)を備えた各種スマートフォンアプリも登場してい
る。例えば、免許証を撮影して各種個人情報を読み取る銀行口座開設アプリや、ドキュメ
ントを撮影してそのテキストを読み取るドキュメント管理アプリ、名刺を撮影してそのテ
キストを読み取る名刺管理アプリなどがある。また、電気、水道、ガスの検針票やレシー
ト、領収書を撮影して読み取る機能の実現に向けた動きもある。
スマートフォンで撮影した各種文字認識対象物は、必ずしも原寸大撮影され、かつ正規
の方向で撮影されているとは限らない。写真内の文字認識対象物の部分だけが、任意の倍
率で撮影されていたり、正規の方向でない向きで撮影されていることがほとんどである。
このような撮影画像から、文字認識対象物の部分だけを検出し、その部分に含まれている
テキスト情報を読み取る必要がある。
従来の認識技術として、例えば文字認識対象物と背景の色差が十分である状態で撮影し
て、色差を頼りに文字認識対象物の部分を検出する技術が知られている。また、画像の向
きを判定して文字を読み取る技術として、文字認識対象物の4つのシート角のうち3つの
シート角の所定部分に基準マークを印刷しておき、画像から基準マークを検出することで
帳票画像の向きを検出および修正し、その修正した画像から文字を認識する技術が既にあ
る。さらに、身分証に特化した技術として、文字認識対象物に含まれている特徴文字「年
」、「月」、「日」という、黒ピクセルと白ピクセルが所定方向に特定の配置比で出現す
る画像領域を検出し、画像領域における文字認識を行い、特徴文字を複数検出して、検出
された複数の特徴文字の位置と予め設定された身分証の特徴文字の基準位置とに基づいて
身分証の画像の伸縮率および向きを求め、身分証の画像を高速に抽出する技術がある。
特開平2−12479号公報 特許第4309881号
背景との色差や基準マークを利用して文字認識対象物を検出方法では、専用の帳票を用
意する必要があったり、画像をすべてスキャンして文字の位置を割り出し、文字認識しな
ければならず、処理時間が多くかかる。また、特徴文字「年」、「月」、「日」を利用す
る文字認識方法では、身分証に限定しており、「年」、「月」、「日」が少ないレシート
や領収書などの文字認識対象物には適さない。「年」、「月」、「日」の文字が少ないと
、検出精度が落ち、検出できない場合もある。さらに、特徴文字「年」、「月」、「日」
を利用した身分証認識方法では、「年」、「月」、「日」の黒ピクセルと白ピクセルの配
置方向が同じになっており、この方向と同じ方向の地紋などのノイズが存在する場合、検
出精度が落ち、検出できない場合もある。
本発明が解決しようとする課題は、「年月日」が少ない文字認識対象物や、横方向の地
紋がある文字認識対象物であっても、安定かつ高速に読み取れる文字認識装置、文字認識
方法を提供することである。
上記した課題を解決するために、本発明の文字認識装置は、帳票より画像を取得する画
像情報取得手段と、前記画像情報取得手段により取得された帳票の画像の中から黒ピクセ
ルと白ピクセルが所定方向に特定の配置比で出現する画像領域を検出し、前記画像領域に
おける文字認識を行い、帳票内の特徴文字を複数検出する特徴文字検出手段と、前記特徴
文字検出手段により検出された帳票の複数の特徴文字の位置と予め設定された帳票の特徴
文字の基準位置とに基づいて、前記取得した帳票の画像の中から帳票の領域を抽出する画
像抽出手段と、を備える。
本実施形態の文字認識システムの構成を示す図。 領収書の一例を示す図。 本実施形態の文字認識システムの概要動作を示すフローチャート。 領収書画像認識処理の詳細を示すフローチャート。 特徴文字「円」の検出方法を説明するための図。 特徴文字「円」の検出方法を説明するための図。 領収書画像の文字認識結果の一例を示す図。
以下、本発明の実施の形態を図面を参照して詳細に説明する。
図1は本発明に係る一つの実施の形態の文字認識システムの構成を示す図、図2は領収
書を示す図である。図1に示すように、この文字認識システムは、帳票としての領収書1
を例えばカメラで撮影する等して画像情報(イメージデータ)を取得(生成)するユーザ
端末2と、このユーザ端末2と接続され、領収書1から読み取った画像情報(イメージデ
ータ)に対して文字認識処理を行うコンピュータ10とから構成されている。ユーザ端末
2は、領収書1の画像情報(イメージデータ)を取得する画像情報取得手段として機能す
る。なお、他の画像取得手段として、領収書の表面をCCDなどで走査(スキャン)しても
よい。
コンピュータ10は、操作部11、通信I/F12、記憶手段としてのメモリ13、表
示部14、ハードディスク装置15、CPU16とを備えている。操作部11は、キーボ
ート、マウスなどのユーザが操作を行う入力手段である。
メモリ13には、領収書に予め複数印字されている特徴文字である「年」、「月」、「
日」、「円」、「用」のうちのいずれか1種類、この例では「円」という文字種と、基準
文字「円」の複数の位置関係のデータ(領収書1のある点(左上角など)を基準(0,0
)とした「円」という文字のX座標・Y座標と各文字間の距離データなど)が記憶されて
いる。また、メモリ13には、文字を認識するための標準文字イメージとテキストデータ
とを対応付けた辞書が記憶されている。
表示部14は、ユーザ端末2が取り込んだ領収書1の画像や、領収書1の画像から文字
認識処理するための画面、文字認識結果のテキストデータなどを表示する。ハードディス
ク装置15には、オペレーティングシステム(以下OSと称す)と、CPU16に各部の
制御動作を行わせる制御ソフトウェアとがインストールされており、これらが協動して本
システムの動作を実現する。動作説明ではコンピュータ起動後のCPU16の動作として
説明する。すなわち、CPU16は、ユーザ端末2により取得された領収書1の画像の中
から領収書にプリントされている特徴文字、例えば「年」、「月」、「日」、「円」、「
用」などのうちの少なくとも1つの種類の複数の文字を検出する特徴文字検出手段と、こ
の特徴文字検出手段により検出された複数の文字の位置関係データとあらかじめ基準とな
る領収書1に複数印刷された文字種の特徴文字「年」、「月」、「日」、「円」、「用」
それぞれの位置関係データのうちの1つに基づいて、領収書画像の伸縮率および・または
方向(縦・横・正規方向・上下反転方向など)を求め、領収書1の画像に対して文字認識
を行う文字認識手段として機能する。
図2に示すように、帳票、例えば領収書1には、氏名、金額、住所などの記入欄が設け
られている。記入欄には、ボールペンなどにより自筆で該当事項が記入されたり、専用の
印刷機によって印刷される等している。ユーザ端末2やスキャナー等によって取得された
画像情報において、領収書1の位置が横向き、縦向きなど、その方向がバラバラになって
いることがある。また、画像情報において、領収書1のイメージの大きさが縮尺されたり
、拡大されたりしていることがある。まが、画像情報において、領収書1と関係のない背
景が写りこんでいることがある。
画像内の領収書1の方向としては、横長方向に取り込むことを正規の方向とすると、領
収書1の上下が逆に取り込まれる第1ケースと、領収書1が縦長方向(正規方向と直交す
る方向)に取り込まれる第2ケースと、それぞれの方向について傾斜した状態で取り込ま
れる第3のケースが考えられる。
図2に示すように、領収書1には、ほぼ同じ大きさの「円」という文字が4個印刷され
ている。そこで、本システムでは、領収書1の位置や向きを検出するための基準となる4
個の「円」という文字の中心点の位置情報をメモリ13に登録しておき、認識対象の領収
書1のイメージを含む画像情報から検出された「円」という文字の中心点の位置がそれぞ
れどの基準となる文字「円」の位置に対応するかを総当りで調べ、最も確からしい組み合
わせを求める。
このように、組み合わせの中から最適な組み合わせを見つける問題のことを、「組み合
わせ最適化問題」と呼び、その解決方法には幅優先探索法、深さ優先探索法、遺伝的アル
ゴリズム、シミュレーテッド・アニーリング法など、多くの方法が知られており、このシ
ステムでは、いずれかの方法を利用する。
最も確からしい組み合わせが求められれば、その位置から画像情報内における領収書1
のイメージの位置(領収書1の四辺の位置とその方向)が求められる。この求められた領
収書1のイメージの位置に基づいて、領収書1のイメージ内における氏名、金額、住所等
の記載項目のイメージの位置が算出できる。本システムは、この算出結果に基づいて領収
書イメージから氏名、金額、住所等の記載項目のイメージを切り出し、文字認識処理を実
行する。
ここで、図3を参照してこの文字認識システムの概要動作を説明する。この文字認識シ
ステムの場合、ユーザ端末2は付属のカメラ等で領収書1を含むイメージデータを取得し
、取得した領収書1を含むイメージデータをコンピュータ10へ送る。
コンピュータ10では、CPU16が、ユーザ端末2から受信された画像情報(イメー
ジデータ)を一定方向(横方向)に走査して複数の特徴文字「円」を検出し(S101)
、各特徴文字の位置関係から、検出した複数の「円」の組み合わせを最適化し(S102
)、領収書1の画像情報の伸縮率および領収書イメージの方向を検出する。
CPU16は、検出した画像情報の伸縮率および領収書イメージの方向に基づいて領収
書イメージの認識対象部分を切り出して(S103)、個々の項目に対して文字読取処理
を実行することで(S104)、領収書1の内容をテキストデータに変換してメモリ13
に記憶すると共に、表示部14に表示する。
その後、ユーザにより操作部11が保存操作あるいは出力操作されると、CPU16は
、メモリ13のテキストデータと領収書画像とを対応付けて保存場所または出力先である
ハードディスク装置へ保存あるいは出力する。
以下、図4,図5を参照してこの文字認識システムにおける領収書画像認識処理の詳細
について説明する。文字認識処理を行う場合、CPU16は、まず、ユーザ端末2により
取り込まれた領収書1の画像を一定方向(横方向)に走査する(図4のS101)。
そして、CPU16は、画像を走査して得た白ピクセルと黒ピクセルの連続数を計数し
(S112)、白ピクセルと黒ピクセルの連続数の比がほぼ黒:白:黒:白:黒=a:b
:a:b:aとなる場所(図5の着目ライン31)を探索し、「円」という文字がある場
所(画像領域)を検出する(S113)。
次に、CPU16は、検出した着目ライン31における真ん中の黒ピクセルを縦方向に
追跡し、縦方向に連続する黒ピクセルの範囲32を検出する(S114)。また、CPU
16は、縦方向に連続する黒ピクセルの範囲32の端部の黒ピクセルから、左右に黒ピク
セルを追跡し、横方向に連続する黒ピクセルの範囲33を検出する(S115)。
そして、CPU16は、検出した黒ピクセルの横方向の範囲33の両端で、縦方向に連
続する黒ピクセルを追跡し、同方向に延びる同程度の長さの黒部分36、37が存在する
か否かを判定する(S116)。
この判定の結果、条件を満たしている場合(S116のYes)、CPU16は、検出
した縦方向の範囲(32+34)および横方向の範囲33内の画像に対して文字認識処理
を行い、その文字認識結果が「円」である領域を選定する(S117)。
CPU16は、黒ピクセルと白ピクセルとが連続する数の比がa:b:a:b:aとな
る場所がなくなるまで上記処理を繰り返し行う(S118)。つまり、CPU16は、黒
ピクセルaと白ピクセルbとの配置比がa:b:a:b:aとなる画像領域から特徴文字
を検出する。黒ピクセルaと白ピクセルbとの配置比とはピクセルの並び順とピクセルの
数の比をいう。
このように画像から特徴文字を探索する場合、従来は全ての文字を認識するため、画像
全体の文字を全て認識すると、認識する文字数が数百〜数千にも及ぶ場合があり、処理速
度が著しく低下してしまう。そこで、本実施形態では、特徴文字の「円」の字体が、線が
均等間隔に並ぶことを利用して、白・黒のピクセルの並び方から予め「円」という文字が
あるらしい範囲を特定し、その特定した範囲だけを文字認識することで、領収書1内の特
徴的な文字である「円」を極めて高速に検出できる。
CPU16は、上記処理を繰り返すことで、複数の「円」という文字を検出し、それぞ
れの文字間の距離(間隔)を計算により求め、予めメモリ13に記憶されている各文字間
の基準の距離(間隔)に基づいて領収書画像の拡大率または縮小率などの伸縮率を求める
CPU16は、検出した4つの文字「円」の位置からイメージの伸縮率を求める。この
4つの文字「円」の位置と伸縮率に基づいて領収書1のイメージの位置(領収書1の四辺
の位置とその方向)が求められるため、伸縮率に応じて領収書の領域を抽出してメモリ1
3に一時記憶する。そして、CPU16は、メモリ13の領収書の領域を抽出した画像に
対して辞書を参照して文字認識処理を実行し、文字認識結果をメモリ13に記憶する。C
PUは、この文字認識処理の結果であるテキストデータとメモリ13に一時記憶しておい
た領収書の領域を抽出した画像とを対応させて、ハードディスク装置15に構築されたデ
ータベースに登録する。
次に、図2を参照して上記文字認識処理の具体例について説明する。入力部より入力さ
れたこの領収書を含むイメージデータに対して、特徴文字検出手段が特徴文字検出処理を
行う。まず、横方向に走査し、白ピクセルと黒ピクセルの連続数を計数して、黒ピクセル
と白ピクセルとが連続する数の比がa:b:a:b:aの場所を探索する。探索できると
、検出した場所の真ん中の黒ピクセルを追跡し、図2に示す丸1の領域を検出する。また
、画像の向きも正規方向であることが分かり、この丸1の領域に対して文字認識を行い、
「円」として特定する。この処理を繰り返し、丸2の部分の3つの「円」も特定、検出す
る。
検出した特徴文字「円」が4個あるので、このまま、検出した特徴文字の座標と、メモ
リに登録されている基準となる座標とで、対象部分画像にある個々の特徴文字と基準とな
る特徴文字の対応を調べ、最も確からしい組み合わせを求める。その最も確からしい組み
合わせの特徴文字間の距離と、この領収書の実物の実寸から算出した基準距離とで、写真
の中にある領収書の伸縮率を求め、画像内の領収書の領域を抽出する。この時、領収書の
他の場所にある「年」、「月」、「日」等も特徴文字に加えて処理してもよい。
最後に、抽出した領収書の領域から、記載項目「宛名」、「金額」、「但し書き」、「
内訳」、「税抜金額」、「消費税額」の位置を計算してこれらの記載項目を切り出し、文
字認識処理を実行する。抽出した領収書の領域と記載項目の文字認識処理結果をユーザ端
末の画面上に表示する(図7参照)。
従来、領収書を専用スキャナー等で読み取り、読み取った領収書1のイメージから罫線
を検出しそれを頼りに領収書1を認識していたが、このように罫線を検出する技術の場合
、領収書1のコピーやファクシミリ装置で受信された帳票などの場合、罫線が途切れてし
まうことが多く、領収書が認識できない場合がしばしば生じる問題があった。しかし、本
実施形態の文字認識システムでは、罫線の代わりに、領収書に太く印刷された複数の文字
「円」を検出することで、領収書イメージをより安定して認識できる。
また、領収書1が正規方向または正規方向と上下逆の方向(ほぼ0度または180度)
に取り込まれた場合にも、領収書1の画像部分についての認識が可能となる。さらに、初
めの縦方向の走査で特徴文字の「円」が検出されなかった場合、続いて、画像を90度回
転して、上記文字認識処理を行うことで、正規方向と直交する方向(90度もしくは27
0度)に配置された領収書1の画像部分についても認識可能となる。
通常、文字認識機能は、文字の画像が±5度程度まで傾いていても、文字を認識するこ
とができる。従って、上記実施形態の文字認識方法によれば、領収書1が0度±5度、9
0度±5度、180度±5度、270度±5度の範囲で置かれていた場合に認識すること
が可能となる。
さらに、画像を0度と90度だけでなく、10度、20度…170度のように10度刻
みで回転して上記領収書画像認識処理を行えば、10度±5度、20度±5度…170度
±5度も対象とすることができ、さらに「円」が上下反転していても文字認識できる特徴
により190度±5度、200度±5度…350度±5度も対象とすることができるから
、あらゆる方向に置かれた領収書を認識することが可能となる。
また、従来の方式では、罫線が均等間隔で並んでいることにより、ときどき1行ずれた
認識結果が得られる場合があったが、本実施形態では、「円」という文字が画像上に均等
に並んでいないため、ずれた認識結果が得られにくいという効果もある。
さらに、横方向の地紋が存在している場合、「日」や「月」の検出ができなくなるため
、安定性が落ちる問題があった。これに対し、本発明では「円」を特徴文字として使用す
ることで、横方向の地紋がある帳票でも、影響を受けにくくなるため、安定した検出を行
うことができる。また、「年」、「月」、「日」は、横線の間隔がa:b:a:b:aの
比率となる文字であるが、明朝体で印刷されている場合、しばしば横線の印刷が薄くなり
、a:b:a:b:aの比率で検出できない問題があった。本発明によれば、「円」は、
縦線の間隔がa:b:a:b:aの比率を持つ文字であるから、明朝体で印刷されており
横線の印刷が薄い場合でも、安定して検出できる。
なお、本発明は、上記実施形態のみに限定されるものではない。上記実施形態では、領
収書の「円」という文字で説明したが、この他、例えば出納帳、入出金伝票、仕訳帳、請
求書、領収書、納品書、売上伝票等でも同様の方法で認識できる。文字は、「円」だけで
なく、認識対象の帳票中に複数存在すれば、例えば「用」などを用いても良い。また、文
字の一部に「月」、「日」、「円」、「用」と同じ図形を含む、「請」、「期」、「間」
、「量」、「書」、「備」などを用いても良い。これらの文字は請求書などに非常に頻繁
に利用されるため、これらの文字を用いることで、幅広い請求書の読み取りが行える。同
じ原理で、英文の文書では「E」、「B」、「m」を用いても良い。
なお、上記の実施形態に記載した手法は、コンピュータに実行させることのできるプロ
グラムとして、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、
光ディスク(CD−ROM、DVD等)、光磁気ディスク(MO)、半導体メモリ等の記憶媒体に格
納して頒布することもできる。ここで、記憶媒体としては、プログラムを記憶でき、且つ
コンピュータが読み取り可能な記憶媒体であれば、その記憶形式は何れの形態であっても
よい。
また、記憶媒体からコンピュータにインストールされたプログラムの指示に基づきコン
ピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト
、ネットワークソフト等のMW(ミドルウェア)等が本実施形態を実現するための各処理の
一部を実行しても良い。さらに、本実施形態における記憶媒体は、コンピュータと独立し
た媒体に限らず、LANやインターネット等により伝送されたプログラムをダウンロードし
て記憶または一時記憶した記憶媒体も含まれる。また、記憶媒体は1つに限らず、複数の
媒体から本実施形態における処理が実行される場合も本実施形態における記憶媒体に含ま
れ、媒体構成は何れの構成であっても良い。
なお、本実施形態におけるコンピュータとは、記憶媒体に記憶されたプログラムに基づ
き、本実施形態における各処理を実行するものであって、パソコン等の1つからなる装置
、複数の装置がネットワーク接続されたシステム等の何れの構成であっても良い。また、
本実施形態の各記憶装置は1つの記憶装置で実現しても良いし、複数の記憶装置で実現し
ても良い。
そして、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含
まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態の機能を実現す
ることが可能な機器、装置を総称している。
1…領収書
2…ユーザ端末
10…コンピュータ
11…操作部
12…通信I/F
14…表示部
15…ハードディスク装置
16…CPU

Claims (6)

  1. 帳票より画像を取得する画像情報取得手段と、
    前記画像情報取得手段により
    取得された帳票の画像の中から黒ピクセルと白ピクセルが所定方向に特定の配置比で出現
    する画像領域を検出し、前記画像領域における文字認識を
    行い、帳票内の特徴文字を複数検出する特徴文字検出手段と、
    前記特徴文字検出手段により検出された帳票の複数の特徴文字の位置と予め設定された
    帳票の特徴文字の基準位置とに基づいて、前記取得した帳票の画像の中から帳票の領域を
    抽出する画像抽出手段と、
    を具備した文字認識装置。
  2. 帳票より画像を取得する画像情報取得手段と、
    前記画像情報取得手段により取得された帳票の画像の中から黒ピクセルと白ピクセルが所
    定方向に特定の配置比で出現する画像領域を検出し、前記画像領域における文字認識を行
    い、「円」、「用」の少なくとも1つの種類の複数の文字を検出する特徴文字検出手段と

    前記特徴文字検出手段により検出された複数の文字の位置関係と予め設定された帳票の
    文字の基準位置とに基づいて、前記取得した帳票の画像の中から帳票の領域を抽出する画
    像抽出手段と、
    を具備した文字認識装置。
  3. 前記特徴文字検出手段は、前記画像をピクセル単位に所定方向に走査して検出された黒
    ピクセルaと白ピクセルbとの配置比がa:b:a:b:aとなる画像領域から特徴文字
    を検出する手段を具備した請求項1記載の文字認識装置。
  4. 帳票より画像を取得する画像情報取得手段を備えた文字認識装置による文字認識方法に
    おいて、
    前記画像情報取得手段により取得された帳票の画像の中から黒ピクセルと白ピクセルが
    所定方向に特定の配置比で出現する画像領域を検出し、前記画像領域における文字認識を
    行い、帳票の特徴文字を複数検出するステップと、
    前記検出した帳票の複数の特徴文字の位置と予め設定された帳票の特徴文字の基準位置
    とに基づいて帳票の画像の伸縮率および・または方向を求め、前記取得した帳票の画像の
    中から帳票の領域を抽出するステップと、
    を有する文字認識方法。
  5. 帳票より画像を取得する画像情報取得手段を備えた文字認識装置による文字認識方法に
    おいて、
    前記画像情報取得手段により取得された帳票の画像の中から黒ピクセルと白ピクセルが
    所定方向に特定の配置比で出現する画像領域を検出し、前記画像領域における文字認識を
    行い、「円」、「用」の少なくとも1つの種類の複数の文字を検出するステップと、
    前記検出した複数の文字の位置関係と予め設定された帳票の文字の基準位置とに基づい
    て帳票の画像の伸縮率および・または方向を求め、前記取得した帳票の画像の中から帳票
    の領域を抽出するステップと
    を有する文字認識方法。
  6. 前記帳票の画像をピクセル単位に所定方向に走査して検出した黒ピクセルaと白ピクセ
    ルbとの配置比がa:b:a:b:aとなる画像領域から特徴文字を検出するステップを
    有する請求項4記載の文字認識方法。
JP2016204356A 2016-10-18 2016-10-18 文字認識装置及び文字認識方法 Pending JP2018067096A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016204356A JP2018067096A (ja) 2016-10-18 2016-10-18 文字認識装置及び文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016204356A JP2018067096A (ja) 2016-10-18 2016-10-18 文字認識装置及び文字認識方法

Publications (1)

Publication Number Publication Date
JP2018067096A true JP2018067096A (ja) 2018-04-26

Family

ID=62086142

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016204356A Pending JP2018067096A (ja) 2016-10-18 2016-10-18 文字認識装置及び文字認識方法

Country Status (1)

Country Link
JP (1) JP2018067096A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111898602A (zh) * 2020-08-10 2020-11-06 赞同科技股份有限公司 一种图像中的凭证号码区域识别方法、装置及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111898602A (zh) * 2020-08-10 2020-11-06 赞同科技股份有限公司 一种图像中的凭证号码区域识别方法、装置及设备
CN111898602B (zh) * 2020-08-10 2024-04-16 赞同科技股份有限公司 一种图像中的凭证号码区域识别方法、装置及设备

Similar Documents

Publication Publication Date Title
US20200065601A1 (en) Method and system for transforming handwritten text to digital ink
JP5620244B2 (ja) 画像比較および文書認証のための画像位置合わせの方法及びプログラム
US8605982B2 (en) Check boundary detection by string literal analysis
JP2015060448A (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
TWI725465B (zh) 影像處理系統、影像處理方法及程式產品
US11321558B2 (en) Information processing apparatus and non-transitory computer readable medium
JP2018055255A (ja) 情報処理装置、情報処理方法及びプログラム
US10503993B2 (en) Image processing apparatus
JP4594952B2 (ja) 文字認識装置及び文字認識方法
US11881043B2 (en) Image processing system, image processing method, and program
RU2656573C2 (ru) Методы обнаружения введенных пользователем контрольных меток
JP2018042067A (ja) 画像処理システム、画像処理方法、情報処理装置
US20130050765A1 (en) Method and apparatus for document authentication using image comparison on a block-by-block basis
EP3151159A1 (en) Information processing apparatus, information processing method and program
US11410442B2 (en) Information processing apparatus and non-transitory computer readable medium
US10049269B2 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
JP2018067096A (ja) 文字認識装置及び文字認識方法
JP4309881B2 (ja) 身分証認識装置及び身分証認識方法
KR101001693B1 (ko) 지로 장표 수납기의 문자인식방법
US20210089813A1 (en) Information processing apparatus and non-transitory computer readable medium
JP5277750B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム
JP5298830B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム
US20230273952A1 (en) Image processing apparatus, image processing method, and storage medium
JP2023086023A (ja) 画像処理装置とその方法およびプログラム
JP2006119942A (ja) 文字列領域切り出し装置