JP2008084105A - 文字切出方法及び文字認識装置 - Google Patents

文字切出方法及び文字認識装置 Download PDF

Info

Publication number
JP2008084105A
JP2008084105A JP2006264710A JP2006264710A JP2008084105A JP 2008084105 A JP2008084105 A JP 2008084105A JP 2006264710 A JP2006264710 A JP 2006264710A JP 2006264710 A JP2006264710 A JP 2006264710A JP 2008084105 A JP2008084105 A JP 2008084105A
Authority
JP
Japan
Prior art keywords
character
pattern
rectangle
dictionary data
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006264710A
Other languages
English (en)
Other versions
JP5041775B2 (ja
Inventor
Mitsuru Takiguchi
充 瀧口
Tomonori Mimura
友則 三村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2006264710A priority Critical patent/JP5041775B2/ja
Publication of JP2008084105A publication Critical patent/JP2008084105A/ja
Application granted granted Critical
Publication of JP5041775B2 publication Critical patent/JP5041775B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】他の文字矩形と結合しない文字矩形パターンを辞書データとして登録し、該辞書データとマッチングした文字矩形を他の文字矩形と結合させずに文字切出を行うようにして、文字切出の困難な文字画像からでも正確でかつ高速に文字パターンを切り出すことができ、誤読文字を低減させることができるようにする。
【解決手段】全角文字又は幅の広い文字及び半角文字又は幅の細い文字を含む文字パターンから成る文字列の画像から各文字パターンを1文字単位で切り出す文字切出方法であって、誤って結合する半角文字又は幅の細い文字、及び、1文字で他の文字とは結合しない文字の文字パターンを辞書データとして登録し、射影によって検出された文字矩形とパターンマッチングを行い、マッチングした文字矩形を他の文字矩形とは結合させずに文字パターンを切り出す。
【選択図】図1

Description

本発明は、文字認識において文字を1文字毎に正しく切り出す文字切出方法、及び、該文字切出方法を用いる文字認識装置に関するものである。
従来、入力された画像に含まれる文字を認識する光学式文字認識装置(OCR:Optical Character Reader)等の文字認識装置が業務分野で用いられている(例えば、特許文献1〜3参照。)。
このような文字認識装置では、1文字ずつの文字記入枠が印刷された帳票が用いられ、記入者は、前記文字記入枠に文字を1文字ずつ記入するようになっている。この場合、文字認識装置は、検出した帳票端等に基づいて記入枠が有るべき位置を算出することができる。そのため、記入された文字の位置を確定し、文字を1文字ずつ正しく切り出し、切り出した文字のパターンを認識辞書と照合して認識を行うことができる。また、文字記入枠が設定されているので、隣接する文字同士の接触も少なく、また、文字同士が接触した場合も、文字記入枠の位置に基づいて、文字を正確に分離して切り出すことが可能である。
また、印刷された文字を認識する場合は、OCR−B、マルチフォント等のような特定のフォントによって、かつ、隣り合う文字同士が接触しないように印刷したOCR処理用の帳票が用いられる。この場合、文字認識装置は、文字列の射影から、l文字当たりの文字サイズや文字ピッチ(文字が記入される間隔)を算出し、1文字ずつを正しく切り出し、切出認識辞書と照合しながら文字認識を行うことができる。
しかし、OCR用の帳票ではない通常の帳票等が用いられた場合、一般的な伝票に手書きで記入された場合と同様に、フリーピッチで印刷された文字列や、不特定のプリンタや不特定の字種/字体によって印刷された文字列を認識する必要がある。このような場合に、隣り合う文字同士が接触したり、入り組んだりしていることが多く、正確に文字を切り出すことができなくなってしまう。
そこで、次のような第1〜第3の方法が提案されている。
第1の方法では、まず、1行の文字列の黒画素を行方向に投影し、行を構成する文字の平均高さを求める。次に、文字列の黒画素を行方向に垂直な方向に射影して黒画素の行方向の頻度をヒストグラムとして表し、該ヒストグラムから頻度が0の位置、すなわち、文字列が途切れている位置、及び、ヒストグラムの極小点の位置、すなわち、接触文字又は重なり文字を切り離すべき切断候補位置を求める。そして、該切断候補位置に基づき、先に求めた文字列の平均高さから、全角文字又は半角文字の列として妥当と見られる位置を文字切出位置とする。
また、第2の方法では、1行の文字列の黒画素を行方向に垂直な方向に射影して黒画素の行方向の頻度をヒストグラムとして表し、該ヒストグラムから頻度が0の位置又はヒストグラムの極小点の位置を求め、文字切出位置と推定される位置を前記文字列に対して複数通り求める。そして、複数通りの文字切り出位置の中から、いずれがもっともらしい文字切出位置であるかの判定を認識結果から行う。前記判定は、文字高さを見ないで行われる。
さらに、第3の方法では、1行の文字列について黒画素の連結領域を求め、該連結領域の並びについて、小さな連結領域同士を統合し、大きな連結領域を複数に分離して、1文字の領域を決め、文字の切出を行なう。その際、小さい連結領域及び大きな連結領域の判断は、文字列の高さを基準にして行われる。
特開平8−101885号公報 特開平5−81478号公報 特開平5−143776号公報
しかしながら、前記従来の文字切出方法においては、ある程度の文字切出を行うことができるが、正確な文字切出を行うことができなかった。通常の帳票においては、漢字、カタカナ、数字、記号等の複数種類の文字が混在したり、全角文字、半角文字、倍角文字、プロポーショナル文字等の各種の文字幅の文字が混在したりする。しかも、分離文字(例えば、横書きの場合、「川」、「い」、「ハ」等の文字)、偏と旁(つくり)とから成る漢字のように分離した部分を備える文字、隣接する文字同士が互いに入り組んだ文字、隣接する文字同士が互いに接触している文字、プレ印刷上の印字及び記入、文字の掠(かす)れ/潰(つぶ)れ等があった場合、正確な文字切出を行うことが困難である。
例えば、前記第1の方法では、1行の文字列がすべて全角文字で構成されている場合、全角文字は文字幅と文字高さがすべて等しいと考えられるので、平均文字高さから文字幅を正確に推定することができ、1文字ずつ正確に切り出すことができる。しかし、半角文字と全角文字とが混在している場合、例えば、全角の仮名交じり漢字文字列に半角の英数字又はカタカナが混入している場合、文字位置が半角分だけずれたり、半角二文字が1文字分に認識されることがあり、正しい文字切出位置を求めることができないことがある。
また、通常の帳票の場合、強調のために一部分を倍角文字で印字したり、プレ印刷上に文字のサイズやピッチの異なる文字を印字したりするので、文字幅を正確に求めることができず、正しい文字切出位置を求めることができない。手書きの場合も、癖によって文字のサイズやピッチが不規則に変化したりするので、文字幅を正確に求めることができず、正しい文字切出位置を求めることができない。さらに、文字を切断する方法によっては、隣接する文字が該当する文字パターンに進入し、切出認識辞書と照合を誤る原因になることがある。
また、例えば、前記第2の方法では、1行の文字列に対して複数通りの切出結果が得られるので、1行の認識処理に複数行分の処理時間がかかってしまう。特に、隣接する文字と接触する文字が多数ある場合には、非常に多くの切出結果が得られるので、認識処理速度が著しく低下してしまう。また、切出位置が適切に得られないと、組み合わせ数が増加し、誤認識の原因ともなる。さらに、漢字の偏や旁のように、単独でも文字として成立するものは、複数通りの切出結果の中から正しい切出結果を選択することが困難である。また、誤った切出でも文字矩(く)形として意味のある文字矩形になる文字についても、同様である。さらに、複数通りの切出結果に正しい候補が存在しない場合も考えられる。
図2は従来の文字切出方法において切出が正しく行われない例を示す図である。
図に示される例においては、隣り合う文字同士が接近又は接触し、かつ、半角文字や分離文字が多く存在するので、文字の幅が正しく推定できず、前記第1及び第2の方法では、正確な文字切出を行うことができない。例えば、「触」の旁である「虫」と、隣接する文字である「文」とを結合すると、「蚊」と認識することができるので、前記第2の方法では、正しく切り出すことができない。
さらに、例えば、前記第3の方法では、求められた黒画素の連結領域の結合条件及び分離条件が確立されていない。そのため、文字同士が接触したり隣接したりしている場合、文字列部分の分離に関して認識精度上多くの問題があり、正確に文字認識を行うことは困難である。また、入り組んだ文字の分離には有効であるが、接触している文字の分離には有効でない。
このように、前記従来の文字切出方法においては、誤切出による誤読、不読(認識候補が無い)、処理速度低下等の問題点がある。
本発明は、前記従来の文字切出方法の問題点を解決して、他の文字矩形と結合しない文字矩形パターンを辞書データとして登録し、該辞書データとマッチングした文字矩形を他の文字矩形と結合させずに文字切出を行うようにして、文字切出の困難な文字画像からでも正確でかつ高速に文字パターンを切り出すことができ、誤読文字を低減させることができる文字切出方法及び文字認識装置を提供することを目的とする。
そのために、本発明の文字切出方法においては、全角文字又は幅の広い文字及び半角文字又は幅の細い文字を含む文字パターンから成る文字列の画像から各文字パターンを1文字単位で切り出す文字切出方法であって、誤って結合する半角文字又は幅の細い文字、及び、1文字で他の文字とは結合しない文字の文字パターンを辞書データとして登録し、射影によって検出された文字矩形とパターンマッチングを行い、マッチングした文字矩形を他の文字矩形とは結合させずに文字パターンを切り出す。
本発明の他の文字切出方法においては、分離文字を含む文字パターン、又は、1文字が分離した文字パターンから成る文字列の画像から各文字パターンを1文字単位で切り出す文字切出方法であって、複数の文字矩形を結合して1文字となる文字パターンを辞書データとして登録し、射影によって検出された隣り合う文字矩形を結合した状態で登録した辞書データとパターンマッチングを行い、マッチングした文字矩形を他の文字矩形と結合させて文字パターンを切り出す。
本発明の更に他の文字切出方法においては、接触文字又は隣り合う文字と結合している文字を含む文字パターンから成る文字列の画像から各文字パターンを1文字単位に切り出す文字切出方法であって、入り組み又は接触によって複数文字が射影上1文字の文字矩形として検出される文字矩形パターンを登録した辞書データとパターンマッチングを行い、マッチングした文字矩形を分割する。
本発明の更に他の文字切出方法においては、さらに、前記辞書データに分割位置の情報を登録し、射影によって検出された文字矩形を結合した状態で前記辞書データとパターンマッチングを行い、マッチングした文字矩形を前記分割位置の情報に基づいて分割し、文字パターンを切り出す。
本発明の更に他の文字切出方法においては、さらに、前記辞書データに、隣り合う文字の文字矩形が進入しないように分割情報の間隔を空けて登録するとともに、文字が入り組んだ情報を登録し、前記辞書データに基づいて文字パターンを切り出すことにより、文字矩形に隣接の文字矩形が進入しないようにする。
本発明の更に他の文字切出方法においては、分離文字が接触し、射影によって検出された文字矩形が文字としての意味を持たない文字パターン、又は、1文字に分離文字の一部が接触し、射影によって検出された文字矩形が1文字の文字矩形と隣接文字の一部の文字矩形とから成る文字パターンを含む文字列の画像から各文字パターンを1文字単位で切り出す文字切出方法であって、入り組み又は接触によって複数文字が射影上1文字の文字矩形として検出される文字矩形パターンを登録した辞書データに、分割位置の情報、及び、分割後の文字矩形が1文字の文字矩形になるか又は1文字に満たない文字矩形になるかの情報を更に登録し、射影によって検出された文字矩形を結合した状態で前記辞書データとパターンマッチングを行い、マッチングした文字矩形を前記分割位置の情報に基づいて分割し、文字パターンを切り出す。
本発明の文字認識装置においては、さらに、文字パターンを切り出すための情報を利用し、辞書データとマッチングしない文字矩形も、前後関係又は文字列の位置関係に基づいて、正しく切り出す手段と、前記辞書データとマッチングして切り出された文字パターンの情報の矛盾に基づいて、誤マッチングして切り出された文字パターンの誤りを訂正する手段とを有する。
本発明の他の文字認識装置においては、さらに、前記辞書データに切出で問題のある文字パターンの文字コードを登録し、切出で問題のある文字パターンの文字コードと、文字認識用の辞書データによる認識結果とに基づいて複合的に矛盾をチェックし、矛盾がある場合は不読とすることによって誤読を低減させる手段を有する。
本発明の更に他の文字認識装置においては、さらに、前記辞書データを実現する手段であって、文字矩形に基づく多値階調の正規化されたデータを辞書データとして、該辞書データと文字矩形とが一致するか否かを判定する手段を有する。
本発明の更に他の文字認識装置においては、さらに、前記辞書データに登録されたパターンと特徴がほぼ同様の文字矩形に関しては、パターンの特徴が異なる部分に注目し、パターン全体とパターンの一部分とのマッチングを別個に行い、両者がともにマッチングすると、前記文字矩形がマッチングしたものと判定する。
本発明の更に他の文字認識装置においては、さらに、手書き文字に対し、文字矩形の重心によって正規化した文字切出用の辞書データを作成する。
本発明の更に他の文字認識装置においては、さらに、オペレータによる読取結果の訂正に基づいて学習することによって文字切出用の辞書データを作成する。
本発明の更に他の文字認識装置においては、さらに、前記文字切出用の辞書データに特定のIDを付加し、文字切出用の辞書データの履歴を作成することにより、文字切出用の辞書データをスリム化して処理速度を向上させる。
本発明によれば、文字切出方法においては、他の文字矩形と結合しない文字矩形パターンを辞書データとして登録し、該辞書データとマッチングした文字矩形を他の文字矩形と結合させずに文字切出を行う。これにより、文字切出の困難な文字画像からでも正確でかつ高速に文字パターンを切り出すことができ、誤読文字を低減させることができる。
以下、本発明の実施の形態について図面を参照しながら詳細に説明する。
図3は本発明の第1の実施の形態における文字認識装置のシステム構成を示す図である。
図において、10は本実施の形態における文字認識装置であり、例えば、汎(はん)用のパーソナルコンピュータ等のコンピュータから成るシステムである。そして、前記文字認識装置10は、プロセッサから成る演算手段としてのCPU11、半導体メモリ等から成る記憶手段としてのメモリ12、表示手段としてのCRT13、HDD(Hard Disc Drive)等から成る記憶装置14、入力手段としてのマウス15及びキーボード16、並びに、画像入力装置17を有する。なお、前記文字認識装置10の各部は、システムバス18によって相互に通信可能に接続されている。
ここで、前記画像入力装置17は、フラットベッドスキャナ、シートフィードスキャナ、ドラムスキャナ等のスキャナ装置等であるが、画像を入力することができる装置であれば、いかなる種類の装置であってもよい。また、前記画像入力装置17は、カラー画像の読取が可能なカラースキャナであってもモノクロスキャナであってもよい。前記画像入力装置17は、文字認識装置10が認識すべき文字列が記載された帳票等の記録媒体に光を照射する蛍光灯等から成る光源、及び、前記記録媒体の表面からの反射光を受光するCCD(Charge Coupled Device:電荷結合素子)等から成るライン型イメージセンサのようなイメージセンサを備える。さらに、前記画像入力装置17は、記録媒体の画像を走査しながら読み取る画像読取部、ホッパ、搬送経路、スタッカ等を有し、複数枚の記録媒体を順次読み取ることができるものであるものとするが、フラットベッドタイプのものであってもよい。
なお、前記記録媒体は、文字列が記載された媒体であればいかなる種類のものであってもよいが、ここでは、帳票であるものとして説明する。
次に、前記文字認識装置10の機能構成について説明する。
図1は本発明の第1の実施の形態における文字認識装置の機能構成を示す図、図4は本発明の第1の実施の形態における文字パターン切出部の構成を示す図、図5は本発明の第1の実施の形態における誤結合パターン辞書の構成を示す図、図6は本発明の第1の実施の形態における誤分離パターン辞書の構成を示す図、図7は本発明の第1の実施の形態における矩形パターン辞書の1パターン矩形分の構成要素を示す図である。
図1に示されるように、文字認識装置10は、領域抽出処理部39、文字パターン切出部20、矩形パターン辞書30、文字認識部34、文字認識辞書36及び読取対象指定部37を有する。そして、画像入力装置17から帳票画像38が入力されると、領域抽出処理部39は、前記帳票画像38から読取対照としての文字記載領域を抽出する。続いて、文字パターン切出部20は、矩形パターン辞書30及び文字認識辞書36を参照して、前記文字記載領域から1文字毎の文字パターンを切り出す。続いて、文字認識部34は、文字認識辞書36及び読取対象指定部37を参照して、切り出された文字パターンの文字認識を行い、その結果を認識結果出力部35が出力する。
ここで、前記文字パターン切出部20は、図4に示されるように、文字記載領域から文字列を切り出す文字列切出部21、切り出された文字列の特徴を抽出する文字列特徴抽出部22、文字列の特徴から文字の外接矩形、すなわち、文字矩形を分離する矩形分離部25、文字切出を支援する第1矩形パターン照合部27、分離している文字矩形を結合する矩形結合部29、及び、文字矩形のパターンを照合する第2矩形パターン照合部28を有する。
なお、前記矩形パターン辞書30は、単独パターン辞書31、誤結合パターン辞書32及び誤分離パターン辞書33から成る。
前記単独パターン辞書31は、他の文字の部品とならない文字、すなわち、単独で文字として成立する文字の文字矩形データの特徴の集合であって、隣り合う文字矩形と結合しやすい文字矩形(例えば、縦に細長い文字矩形等)が登録されているデータの集合、すなわち、辞書である。
また、前記誤結合パターン辞書32は、図5に示されるように、隣り合った文字が結合したり、隣り合った文字の一部等が誤って結合した文字矩形データの特徴の集合であって、各文字矩形データにおける本来分離すべき位置が登録されているデータの集合、すなわち、辞書である。
さらに、前記誤分離パターン辞書33は、図6に示されるように、分離しやすい文字の文字矩形データ特徴の集合である。例えば、「い」、「ハ」、「川」等、漢字の偏と旁とで離れやすい文字、偏や旁だけで文字と成り得るもの等のように、文字の特徴で分離しやすいパターンが登録されているデータの集合、すなわち、辞書である。
なお、矩形パターン辞書30は、図7に示されるように、登録パターン毎に登録されている文字コード(341)も有している。
そして、文字パターン切出部20によって切り出された文字パターンは、文字認識部34によって文字コードに変換され、認識結果出力部35によって、認識結果として出力される。なお、文字認識辞書36は、文字認識処理部34が参照する認識辞書である。また、読取対象指定部37は、読取を行う領域のどんな文字を読み取るのかを文字コードで保有している。
次に、前記構成の文字認識装置10の動作について説明する。
図8は本発明の第1の実施の形態における文字列の切出の例を示す図、図9は本発明の第1の実施の形態における文字矩形の論理チェックの結果を示す図である。なお、図8(a)は文字列画像例、図8(b)は投影のヒストグラム、図8(c)は分離後の文字矩形、図8(d)は切出結果を示す図である。
まず、領域抽出処理部39は、画像入力装置17から入力された帳票画像38の帳票レイアウトを解析することによって、又は、オペレータ等に指示された帳票のフォーマット情報(例えば、帳票のどこに文字領域が指定されているか等の情報)により、文字領域を抽出する。
続いて、文字パターン切出部20の文字列切出部21は、抽出された文字領域から文字列を切り出す。この場合、文字列切出部21は、文字列において文字の並んでいる方向、すなわち、行方向に投影を行うことによって、文字列を検出して切り出すことができる。ここでは、図8(a)に示されるような文字列が切り出されたものとする。
続いて、文字列特徴抽出部22は、図8(b)に示されるような射影のヒストグラムを取得する。そして、矩形分離部25は、文字高さ、ヒストグラムの凹み、ヒストグラムが0の位置等に基づいて文字の最大幅を想定し、想定した文字の最大幅やヒストグラムに基づき、ヒストグラムの凹みやヒストグラムが0の位置で、文字矩形を分割する。ここでは、図8(c)に示されるように、文字矩形が分割されたものとする。
第1矩形パターン照合部27は、まず、読取対象指定部37を参照し、単独パターン辞書31、誤結合パターン辞書32及び誤分離パターン辞書33の登録パターン毎の登録されている文字コード341を、読取対象指定部37に登録されている読取対象文字コードと照合して、読取対象以外の矩形パターン辞書30をマスクして照合不可とする。
続いて、前記第1矩形パターン照合部27は、誤結合パターン辞書32を参照して前記文字列内の各文字矩形に関して照合を行う。この場合、第1矩形パターン照合部27は、各文字矩形を誤結合パターン辞書32と照合する。照合の結果、誤結合パターン辞書32と一致した文字矩形を、誤結合パターン辞書32に登録されている分割位置で、分割する。
図8(c)に示される例においては、“3)”、「接触」における“接角”の部分等が、誤結合パターン辞書32にあらかじめ登録されている。そのため、各文字矩形を誤結合パターン辞書32と照合し、登録されているデータと一致している場合、登録されている分割位置に従って、“3)”は“3”と“)”とに分離され、“接角”は“接”と“角”とに分離される。
この場合、“3)”の分離されたもの、すなわち、“3”及び“)”は、いずれも1文字として正しいので、他の文字矩形とは結合しない確定した文字矩形として扱われる。また、“接角”は“接”と“角”とに分離されるが、“角”は、文字として成立しないので、誤結合パターン辞書32を参照して、他の文字矩形と結合する文字矩形として扱われる。
次に、前記第1矩形パターン照合部27は、誤分離パターン辞書33を参照して前記文字列内の各文字矩形に関して照合を行う。
図8(c)に示される例においては、“川”及び“い”が、誤分離パターン辞書33にあらかじめ登録されている。この場合、文字列の高さに基づいて、最大の文字幅を、例えば、文字列の高さの1.5倍に設定し、結合しても最大の文字幅範囲に収まる範囲で分離された文字矩形を結合する。そして、結合した文字矩形を誤分離パターン辞書33と照合し、登録されているデータと一致している場合、前記結合した文字矩形を確定する。
次に、前記第1矩形パターン照合部27は、単独パターン辞書31を参照して前記文字列内の各文字矩形に関して照合を行う。
図8(c)に示される例においては、“(”、“な”等の部分が、単独パターン辞書31にあらかじめ登録されている。この場合、単独パターン辞書31と照合し、登録されているデータと一致していると判断された文字矩形は、確定した文字矩形として扱われ、他の文字矩形とは結合されないようにする。これにより、後の処理、例えば、矩形結合部29による処理等において、前記文字矩形を隣接する文字矩形と結合してしまうことが確実に防止される。
前記第1矩形パターン照合部27は、矩形パターン辞書30との照合、すなわち、マッチングが完了した時点で、各文字矩形の状態に応じた論理的な確認、すなわち、文字矩形の論理チェックを行い、誤ったマッチング結果の修正、及び、矩形パターン辞書30とマッチングしなかった文字矩形に関する確定を行う。前記文字矩形の論理チェックの結果は、例えば、図9に示されるようになる。
図5に示されるように、誤結合パターン辞書32には、「接触」における“接角”部分等が登録されている。そして、“文”が単独パターン辞書31に登録されているので、“接”及び“文”は確定するが、“触”の偏である“角”は不確定であり、“触”の旁である“虫”は不定であってどのパターンにも一致しない。そのため、図9におけるNo.3のケースとして、“触”の偏である“角”と旁である“虫”とは結合され、“触”として画定される。
そして、第1矩形パターン照合部27によって全文字矩形と矩形パターン辞書30との照合が完了すると、隣り合う文字同士が接触した接触文字は分離され、1文字が複数の部分に分離していた文字は結合されるので、文字のピッチ(文字が記入される間隔)や1文字当たりの文字サイズを文字矩形に基づいて想定することが容易となる。
そこで、矩形結合部29は、第1矩形パターン照合部27による照合が完了した各文字矩形の最大幅や文字列高さに基づき、最大文字幅を推測し、推測した最大文字幅の範囲内で文字矩形を結合することが可能か否かを判断する。そして、最大文字幅の範囲内で結合した文字矩形を文字認識辞書36と照合して一致した場合(例えば、一定の距離、差分内にある場合)には、結合が必要と考えられるので、文字矩形を結合する。
ただし、単独パターン辞書31及び誤分離パターン辞書33とのマッチングを行って、第1矩形パターン照合部27が確定した文字矩形は、矩形結合部29による結合対象とはしない。
続いて、第2矩形パターン照合部28は、矩形結合部29によって誤って結合されてしまった文字矩形がないか否かを、誤結合パターン辞書32を参照して、確認する。そして、誤結合パターン辞書32に登録されたものと一致する文字矩形は、誤って結合されたものと判断され、誤結合パターン辞書32に従って分離される。
これにより、文字パターン切出部20の処理は完了し、図8(d)に示されるような切出結果を得ることができる。なお、矩形パターン辞書30に登録されているものと一致した文字矩形には、矩形パターン辞書30に登録されている文字コード341が、情報として付加される。
そして、文字認識部34は、文字パターン切出部20が切り出した図8(d)に示されるような文字矩形を、読取対象指定部37に従って文字認識辞書36と照合する。そして、照合の結果、文字認識辞書36に登録されたものと一致した文字矩形を文字コードに変換する。ただし、変換された文字コードが、前記矩形パターン辞書30に登録されているものと一致したことによって付加された文字コードと相違する場合には、誤読の可能性が高いと判断し、認識結果を不読とする。
続いて、認識結果出力部35は、文字パターン切出部20が切り出した文字矩形と文字認識部34によって変換された文字コードとを、認識結果出力として、CRT13に表示したり記憶装置14に格納したりして、出力する。
このように、本実施の形態においては、結合文字、分離文字、全角、半角、プロポーショナルフォント等の混在、手書き文字の入り組み、接触文字等の正しく切り出すことができないパターンと文字矩形の切出方、すなわち、分離位置とを矩形パターン辞書30にあらかじめ登録し、該矩形パターン辞書30とのマッチングを行うことによって、文字矩形を切り出すようになっている。そのため、結合文字、分離文字、全角、半角、プロポーショナルフォント等の混在、手書き文字の入り組み、接触文字等の正しく切り出すことができないパターンを正確に切り出すことができる。
また、従来の技術においては、切出と認識とを同時に行い、複数の切出位置の中からより正しいと思われるものを選択するので、何度も文字認識を行い、処理速度が低下してしまうが、本実施の形態においては、誤って切り出した部分、又は、誤って切り出す可能性のある部分を見つけ出して処理するので、処理速度を向上させることができる。
さらに、従来の技術においては、誤読をチェックすることができなかったが、本実施の形態においては、切出に問題がある部分の照合結果と認識結果とを照合し、複合的に判断して不一致部分、すなわち、矛盾部分を不読とするので、誤読を低減することが期待できる。
次に、本発明の第2の実施の形態について説明する。なお、第1の実施の形態と同じ構造を有するものについては、同じ符号を付与することによってその説明を省略する。また、前記第1の実施の形態と同じ動作及び同じ効果についても、その説明を省略する。
図10は本発明の第2の実施の形態における誤分離パターンの例を示す第1の図、図11は本発明の第2の実施の形態における誤分離パターンの例を示す第2の図、図12は本発明の第2の実施の形態における誤分離パターンの例を示す第3の図、図13は本発明の第2の実施の形態における矩形パターン辞書の管理データを示す図である。
前記第1の実施の形態で説明したように、矩形パターン辞書30は、単独パターン辞書31、誤結合パターン辞書32及び誤分離パターン辞書33から成る。また、矩形パターン辞書30は、複数の矩形パターンの情報から成り、1パターン矩形分の構成は図7に示されるようになっている。ここで、管理ID310は、矩形パターン辞書30を管理するための番号であり、各パターン矩形毎に別の番号が付与される。矩形パターン特徴320は、接触文字や入り組みのような文字切出を行う上での問題となる文字矩形のパターンの特徴である。
前記矩形パターン特徴320は、次のようにして作成することができる。
問題となる文字矩形を縦横、例えば、8×8のセルに分割し、各セル内の黒と白の割合を特徴とするデータを作成する。例えば、二値画像から矩形パターン特徴320を作成する場合、縦横8×8のセルに分割された各セル内の黒と白の割合を、以下の式(1)によって数値化することにより実現することができる。
((白画素数合計)×255 )/(セル内全画素数) ・・・式(1)
また、手書き文字の場合、文字矩形のパターンのばらつきが多くなるため、文字矩形内の黒で重心を算出し、重心部分を前記分割させたセルの中央に位置させて正規化を行い、上記式(1)によって算出することも可能である。
そして、一致判定閾(しきい)値330は、矩形パターン特徴320と矩形イメージとが一致していると判断するための閾値であり、矩形パターン特徴320の特徴等から算出することも可能である。
また、分割個数340は、矩形パターン特徴320が何文字分の文字矩形を含んでいるかを示す個数である。単独パターン辞書31及び誤分離パターン辞書33の場合、矩形パターン特徴320に1文字分の矩形パターン特徴が登録されるので、分割個数340は1個となる。また、誤結合パターン辞書32の場合、矩形パターン特徴320に誤って結合してしまった文字矩形が登録されるので、分割個数340は誤って結合してしまった文字矩形の数が登録される。
さらに、文字コード341は、矩形パターン特徴320が何かを示す文字コードであり、分割個数340の個数分の文字コードである。
さらに、確定/不確定342は、矩形パターン特徴320の含んでいる文字が文字矩形として成立しているか否かを示す。例えば、前記第1の実施の形態で説明した図8に示される例における“接触”のような場合であって、“接触”の“接”+“角”(“触”の偏)によって形成された文字矩形パターンのとき、1分割目の“接”は「確定」、“角”(“触”の偏)を不確定として登録する。
さらに、分割位置343は、誤結合パターン辞書32のように複数の文字矩形を含む場合の文字の分割位置を示す。分割位置は、垂直に分割することも、文字の入り組みに合わせて設定することも可能とする。
また、分割位置343の分割位置は、各文字矩形間を多少離すように設定すると、分割の際に、隣り合った文字の文字矩形の一部が入り込むことを防止することができる。文字の記入線には多少の太さがあるため、文字線幅以内の文字欠けは、文字認識の際に影響を与えにくいので、問題はない。
図10には、このようにして作成された、図8に示される例における“接触”に対応した誤結合パターン辞書32の例が示されている。
また、図11には、図8に示される例における“い”に対応した誤分離パターン辞書33の例が示されている。“い”は、図10に示される“接触”の矩形パターン特徴320と比較して単純(全体の白密度等から単純さを判断する)なため、似かよった単純な矩形と判断が難しい(例えば、“し・”等)。そのため、一致判定閾値330は、図10に示されるような“接触”の場合と比較して、小さな値となる。
このような構成の矩形パターン辞書30との一致、すなわち、マッチングの判断は、文字切出の際に、矩形パターン辞書30作成と同様に、矩形パターン特徴320を作成し、各セル毎の差分の絶対値の和が一致判定閾値330以下であるか否かを判断することによって可能である。すなわち、前記絶対値の和が一致判定閾値330以下であれば、一致と判断することができる。
また、図12には、“急性”が“急”と“性”における「りっしんべん」の左端の点とが誤結合した場合に対応する誤結合パターン辞書32の例が示されている。このような場合、“急”の単独文字と区別がつきにくいため、図12に示されるように、詳細チェックセル350と該当セルとの一致を判断するための閾値としての詳細チェックセル閾値351を設けて、誤分離パターン辞書33を作成する。文字切出の際における文字矩形の一致の判断は、矩形パターン特徴320を作成し、各セル毎の差分の絶対値の和が一致判定閾値330以下であり、かつ、詳細チェックセル350に対応するセルの差分の絶対値の和が詳細チェックセル閾値351以下の場合に一致と判断することで解決することができる。
また、図13に示されるような単独パターン辞書登録禁止文字群360には、単独パターン辞書31において登録を禁止している文字の文字コードが登録されている。これは、漢字の偏や旁で文字として意味を持つもの、及び、“レ”、“し”、“・”“カ”等のように、他の文字や文字の−部で似かよった部位が存在する文字が登録されており、単独パターン辞書31に登録する際に誤って登録しないための確認データである。
さらに、矩形パターン辞書30のパターン毎の管理ID310毎に照合して一致した履歴を残すために、矩形パターン辞書一致履歴370が用意されている。辞書の作成でなく、読取の際に、第1矩形パターン照合部27及び第2矩形パターン照合部28の照合によって、矩形パターン辞書30と一致した場合、前記矩形パターン辞書一致履歴370に、パターンの管理ID毎に照合して一致した回数、最後に−致した日時等が登録される。また、処理制限がある場合、矩形パターン辞書30に登録することができる最大パターン数としての矩形パターン最大登録数380を設定し、一定量のマッチング、すなわち、照合を行わないようにする。
次に、本実施の形態における矩形パターン辞書30の成作手順について説明する。
図14は本発明の第2の実施の形態における矩形パターン辞書の学習の例を示す図である。
「発明が解決しようとする課題」の項において、図2に示される例に基づいて説明したように、矩形パターン辞書30が存在しなかったり、読取対象の切出に問題がある部分に該当する文字矩形パターンが登録されていなかったりする場合には、正しく文字切出を行うことができない。そこで、オペレータは、不読、誤読した文字を修正し、修正された箇所に注目して自動的に矩形パターン辞書30を学習させ、文字切出性能を向上させ、切出読取性能を向上させることが可能である。
まず、図12に示されるような文字切出の認識結果(100)が得られると、オペレータは誤読部分や不読部分(?で示す)を訂正する(101)。
そして、訂正内容を受けて、図4に示されるような矩形分離部25が分割した後の文字矩形を再現する(102)。
このとき、訂正結果(101)と、認識結果(100)によって訂正された箇所において、認識結果(100)と分割後矩形(102)でサイズの異なる部分に関しては、矩形パターン辞書30による影響か否かを確認するために認識結果(100)、訂正結果(101)が矩形パターン辞書30に一致しないことを確認する。確認した結果、一致してしまった場合は、矩形パターン辞書30に登録済みのパターンに問題があると判断して、一致判定閾値330や詳細チェックセル閾値351を一致しない値まで小さくし、誤一致を解消させる。
次に、分割後矩形(102)を用いて、文字認識部34によって認識結果を求める(103)。
訂正結果(101)と認識結果(100)とで矩形が異なる箇所で分割後矩形(102)の認識結果(103)では、正しく認識できている箇所を単独パターン辞書31の登録候補(104)とする。
この単独パターン辞書31の登録候補(104)で、単独パターン辞書登録禁止文字群360に登録されていない文字は、単独パターン辞書31に登録される(105)。
訂正結果(101)と認識結果(100)で訂正された箇所で、分割後矩形(102)の認識結果(103)では、正しく認識できていない箇所については、図8(b)に示されるようなヒストグラムより凹み位置を見つけ、文字矩形の組み合わせを試み、認識結果が訂正結果(101)と一致した場合、又は、一部が一致した場合は、誤結合パターン辞書32に登録する文字矩形とする(106)。図14に示される例では、“3)”、“接触”(接角)が該当する。“3)”は、分割個数340は2個で文字コード341は“3)”、確定/不確定は、2つともに「確定」となる。“接触”(接角)は分割個数340は2個で文字コード341は“接触”、確定/不確定は、“接”は「確定」、“触”(角)は「不確定」となる。
さらに、訂正結果(101)と認識結果(100)とで訂正された箇所において、分割後矩形での認識結果(103)が訂正結果(101)よりも認識結果が多い部分に関して、文字矩形を結合し訂正結果(101)と一致する文字矩形を誤分離パターン辞書33に登録する(107)。
この時点までの矩形パターン辞書30を用いて、分離後矩形(102)に対して第1矩形パターン照合部27において矩形パターン辞書30と照合処理し、矩形結合部29において処理を行い、この時の切出結果によって文字認識部34により認識結果を出す。誤結合していた矩形が分離されるため、認識結果(100)の“ナ、”は解消し、“カタカ”が“カタ”、“川”が分離してしまったと仮定した場合、訂正結果(101)から、“カタ”の誤結合、“川”の誤分離を判断し、“カタ”は誤結合パターン辞書32、“川”は誤分離パターン辞書33に登録する。
また、矩形パターン辞書30登録時に矩形パターン最大登録数380に達してしまった場合、矩形パターン辞書一致履歴370を参照し、使用頻度の少ない登録パターン、最近は一致することがないパターンを削除することによって、矩形パターン辞書30の登録パターン数増大による処理速度の低下を抑えることができる。
このように、本実施の形態においては、オペレータが誤読、不読を訂正することによって矩形パターン辞書30を作成することができ、以降、同様のケースでは正しい文字切出が可能となり、自動的に学習され文字切出性能が向上する。
また、処理速度に関しても一定速度を維持することが可能である。
なお、第2の実施の形態において説明した矩形パターン辞書30の形式は、文字切出が正しく行えない場合を登録する手段で説明をしたが、通常の文字認識にも用いることもでき、また、解像度の低い多値(諧(かい)調を持った)画像の文字認識でも用いることが可能である。
また、第2の実施の形態において説明した矩形パターン辞書の形式は、濃淡(黒、白の密度)を特徴としているため、文字認識以外の立体物、凹凸面等の認識にも応用可能である。
さらに、本発明は前記実施の形態に限定されるものではなく、本発明の趣旨に基づいて種々変形させることが可能であり、それらを本発明の範囲から排除するものではない。
本発明の第1の実施の形態における文字認識装置の機能構成を示す図である。 従来の文字切出方法において切出が正しく行われない例を示す図である。 本発明の第1の実施の形態における文字認識装置のシステム構成を示す図である。 本発明の第1の実施の形態における文字パターン切出部の構成を示す図である。 本発明の第1の実施の形態における誤結合パターン辞書の構成を示す図である。 本発明の第1の実施の形態における誤分離パターン辞書の構成を示す図である。 本発明の第1の実施の形態における矩形パターン辞書の1パターン矩形分の構成要素を示す図である。 本発明の第1の実施の形態における文字列の切出の例を示す図である。 本発明の第1の実施の形態における文字矩形の論理チェックの結果を示す図である。 本発明の第2の実施の形態における誤分離パターンの例を示す第1の図である。 本発明の第2の実施の形態における誤分離パターンの例を示す第2の図である。 本発明の第2の実施の形態における誤分離パターンの例を示す第3の図である。 本発明の第2の実施の形態における矩形パターン辞書の管理データを示す図である。 本発明の第2の実施の形態における矩形パターン辞書の学習の例を示す図である。
符号の説明
10 文字認識装置
341 文字コード

Claims (13)

  1. (a)全角文字又は幅の広い文字及び半角文字又は幅の細い文字を含む文字パターンから成る文字列の画像から各文字パターンを1文字単位で切り出す文字切出方法であって、
    (b)誤って結合する半角文字又は幅の細い文字、及び、1文字で他の文字とは結合しない文字の文字パターンを辞書データとして登録し、射影によって検出された文字矩形とパターンマッチングを行い、マッチングした文字矩形を他の文字矩形とは結合させずに文字パターンを切り出すことを特徴とする文字切出方法。
  2. (a)分離文字を含む文字パターン、又は、1文字が分離した文字パターンから成る文字列の画像から各文字パターンを1文字単位で切り出す文字切出方法であって、
    (b)複数の文字矩形を結合して1文字となる文字パターンを辞書データとして登録し、射影によって検出された隣り合う文字矩形を結合した状態で登録した辞書データとパターンマッチングを行い、マッチングした文字矩形を他の文字矩形と結合させて文字パターンを切り出すことを特徴とする文字切出方法。
  3. (a)接触文字又は隣り合う文字と結合している文字を含む文字パターンから成る文字列の画像から各文字パターンを1文字単位に切り出す文字切出方法であって、
    (b)入り組み又は接触によって複数文字が射影上1文字の文字矩形として検出される文字矩形パターンを登録した辞書データとパターンマッチングを行い、マッチングした文字矩形を分割することを特徴とする文字切出方法。
  4. 前記辞書データに分割位置の情報を登録し、射影によって検出された文字矩形を結合した状態で前記辞書データとパターンマッチングを行い、マッチングした文字矩形を前記分割位置の情報に基づいて分割し、文字パターンを切り出す請求項3に記載の文字切出方法。
  5. 前記辞書データに、隣り合う文字の文字矩形が進入しないように分割情報の間隔を空けて登録するとともに、文字が入り組んだ情報を登録し、前記辞書データに基づいて文字パターンを切り出すことにより、文字矩形に隣接の文字矩形が進入しないようにする請求項3に記載の文字切出方法。
  6. (a)分離文字が接触し、射影によって検出された文字矩形が文字としての意味を持たない文字パターン、又は、1文字に分離文字の一部が接触し、射影によって検出された文字矩形が1文字の文字矩形と隣接文字の一部の文字矩形とから成る文字パターンを含む文字列の画像から各文字パターンを1文字単位で切り出す文字切出方法であって、
    (b)入り組み又は接触によって複数文字が射影上1文字の文字矩形として検出される文字矩形パターンを登録した辞書データに、分割位置の情報、及び、分割後の文字矩形が1文字の文字矩形になるか又は1文字に満たない文字矩形になるかの情報を更に登録し、
    (c)射影によって検出された文字矩形を結合した状態で前記辞書データとパターンマッチングを行い、マッチングした文字矩形を前記分割位置の情報に基づいて分割し、文字パターンを切り出すことを特徴とする文字切出方法。
  7. (a)請求項1〜6のいずれか1項に記載の文字切出方法を用いる文字認識装置であって、
    (b)文字パターンを切り出すための情報を利用し、辞書データとマッチングしない文字矩形も、前後関係又は文字列の位置関係に基づいて、正しく切り出す手段と、
    (c)前記辞書データとマッチングして切り出された文字パターンの情報の矛盾に基づいて、誤マッチングして切り出された文字パターンの誤りを訂正する手段とを有する文字認識装置。
  8. (a)請求項1〜4のいずれか1項に記載の文字切出方法を用いる文字認識装置であって、
    (b)前記辞書データに切出で問題のある文字パターンの文字コードを登録し、切出で問題のある文字パターンの文字コードと、文字認識用の辞書データによる認識結果とに基づいて複合的に矛盾をチェックし、矛盾がある場合は不読とすることによって誤読を低減させる手段を有する文字認識装置。
  9. (a)請求項1〜6のいずれか1項に記載の文字切出方法を用いる文字認識装置であって、
    (b)前記辞書データを実現する手段であって、文字矩形に基づく多値階調の正規化されたデータを辞書データとして、該辞書データと文字矩形とが一致するか否かを判定する手段を有する文字認識装置。
  10. 前記辞書データに登録されたパターンと特徴がほぼ同様の文字矩形に関しては、パターンの特徴が異なる部分に注目し、パターン全体とパターンの一部分とのマッチングを別個に行い、両者がともにマッチングすると、前記文字矩形がマッチングしたものと判定する請求項9に記載の文字認識装置。
  11. 手書き文字に対し、文字矩形の重心によって正規化した文字切出用の辞書データを作成する請求項9に記載の文字認識装置。
  12. オペレータによる読取結果の訂正に基づいて学習することによって文字切出用の辞書データを作成する請求項9に記載の文字認識装置。
  13. 前記文字切出用の辞書データに特定のIDを付加し、文字切出用の辞書データの履歴を作成することにより、文字切出用の辞書データをスリム化して処理速度を向上させる請求項11又は12に記載の文字認識装置。
JP2006264710A 2006-09-28 2006-09-28 文字切出方法及び文字認識装置 Active JP5041775B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006264710A JP5041775B2 (ja) 2006-09-28 2006-09-28 文字切出方法及び文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006264710A JP5041775B2 (ja) 2006-09-28 2006-09-28 文字切出方法及び文字認識装置

Publications (2)

Publication Number Publication Date
JP2008084105A true JP2008084105A (ja) 2008-04-10
JP5041775B2 JP5041775B2 (ja) 2012-10-03

Family

ID=39354906

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006264710A Active JP5041775B2 (ja) 2006-09-28 2006-09-28 文字切出方法及び文字認識装置

Country Status (1)

Country Link
JP (1) JP5041775B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101650779A (zh) * 2008-08-11 2010-02-17 欧姆龙株式会社 字符识别装置、字符识别程序以及字符识别方法
JP2015176267A (ja) * 2014-03-14 2015-10-05 オムロン株式会社 画像処理装置、画像処理方法、画像処理プログラム
US9977976B2 (en) 2016-06-29 2018-05-22 Konica Minolta Laboratory U.S.A., Inc. Path score calculating method for intelligent character recognition
JP2020170515A (ja) * 2019-04-02 2020-10-15 三星電子株式会社Samsung Electronics Co.,Ltd. 映像処理装置及びその映像処理方法

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6139171A (ja) * 1984-07-31 1986-02-25 Mitsubishi Electric Corp 文字認識方式
JPH01277989A (ja) * 1988-04-28 1989-11-08 Nippon Telegr & Teleph Corp <Ntt> 文字列パターン読み取り装置
JPH04372086A (ja) * 1991-06-21 1992-12-25 Matsushita Electric Ind Co Ltd 文字認識装置
JPH0520500A (ja) * 1991-07-10 1993-01-29 Fuji Xerox Co Ltd 文書認識装置
JPH0581479A (ja) * 1991-07-25 1993-04-02 Omron Corp 文字認識に於ける文字画像の正規化方法
JPH05298487A (ja) * 1992-04-21 1993-11-12 Matsushita Electric Ind Co Ltd 英文字認識装置
JPH0773273A (ja) * 1994-08-16 1995-03-17 Hitachi Ltd パターン切出しおよび認識方法とそのシステム
JPH08129608A (ja) * 1994-10-28 1996-05-21 Oki Electric Ind Co Ltd 文字認識装置
JPH08293000A (ja) * 1995-04-21 1996-11-05 Canon Inc 画像処理装置及び方法
JPH096920A (ja) * 1995-06-19 1997-01-10 Nippon Steel Corp 手書き文字認識方法及びその装置
JP2000315247A (ja) * 1999-05-06 2000-11-14 Fujitsu Ltd 文字認識装置
JP2003296662A (ja) * 2002-03-29 2003-10-17 Konica Corp 文字認識方法及び文字認識装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6139171A (ja) * 1984-07-31 1986-02-25 Mitsubishi Electric Corp 文字認識方式
JPH01277989A (ja) * 1988-04-28 1989-11-08 Nippon Telegr & Teleph Corp <Ntt> 文字列パターン読み取り装置
JPH04372086A (ja) * 1991-06-21 1992-12-25 Matsushita Electric Ind Co Ltd 文字認識装置
JPH0520500A (ja) * 1991-07-10 1993-01-29 Fuji Xerox Co Ltd 文書認識装置
JPH0581479A (ja) * 1991-07-25 1993-04-02 Omron Corp 文字認識に於ける文字画像の正規化方法
JPH05298487A (ja) * 1992-04-21 1993-11-12 Matsushita Electric Ind Co Ltd 英文字認識装置
JPH0773273A (ja) * 1994-08-16 1995-03-17 Hitachi Ltd パターン切出しおよび認識方法とそのシステム
JPH08129608A (ja) * 1994-10-28 1996-05-21 Oki Electric Ind Co Ltd 文字認識装置
JPH08293000A (ja) * 1995-04-21 1996-11-05 Canon Inc 画像処理装置及び方法
JPH096920A (ja) * 1995-06-19 1997-01-10 Nippon Steel Corp 手書き文字認識方法及びその装置
JP2000315247A (ja) * 1999-05-06 2000-11-14 Fujitsu Ltd 文字認識装置
JP2003296662A (ja) * 2002-03-29 2003-10-17 Konica Corp 文字認識方法及び文字認識装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101650779A (zh) * 2008-08-11 2010-02-17 欧姆龙株式会社 字符识别装置、字符识别程序以及字符识别方法
JP2010044485A (ja) * 2008-08-11 2010-02-25 Omron Corp 文字認識装置、文字認識プログラム、および文字認識方法
JP2015176267A (ja) * 2014-03-14 2015-10-05 オムロン株式会社 画像処理装置、画像処理方法、画像処理プログラム
US9977976B2 (en) 2016-06-29 2018-05-22 Konica Minolta Laboratory U.S.A., Inc. Path score calculating method for intelligent character recognition
JP2020170515A (ja) * 2019-04-02 2020-10-15 三星電子株式会社Samsung Electronics Co.,Ltd. 映像処理装置及びその映像処理方法

Also Published As

Publication number Publication date
JP5041775B2 (ja) 2012-10-03

Similar Documents

Publication Publication Date Title
KR101122854B1 (ko) 스캔된 문서들로부터 전자 서식들을 채우기 위한 방법 및장치
US8565474B2 (en) Paragraph recognition in an optical character recognition (OCR) process
CN105229669B (zh) 图像处理装置及图像处理方法
US7580571B2 (en) Method and apparatus for detecting an orientation of characters in a document image
US8340425B2 (en) Optical character recognition with two-pass zoning
US6614929B1 (en) Apparatus and method of detecting character writing area in document, and document format generating apparatus
JP4280355B2 (ja) 文字認識装置
US7680329B2 (en) Character recognition apparatus and character recognition method
JP2008021068A (ja) 帳票認識装置及び帳票認識プログラム
Hesham et al. Arabic document layout analysis
JP5041775B2 (ja) 文字切出方法及び文字認識装置
US7149352B2 (en) Image processing device, program product and system
US8989485B2 (en) Detecting a junction in a text line of CJK characters
JP5630689B2 (ja) 文字認識方法及び文字認識装置
JP5601027B2 (ja) 画像処理装置及び画像処理プログラム
Kumar et al. Line based robust script identification for indianlanguages
US11551461B2 (en) Text classification
US20200242390A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
CN117475453B (zh) 一种基于ocr的文书检测方法、装置及电子设备
EP4036871A1 (en) Image processing apparatus, image processing method, program and storage medium
JP3428504B2 (ja) 文字認識装置
Leishman Shape-free statistical information in optical character recognition
Raza Algorithms for the recognition of poor quality documents
JP2004013188A (ja) 帳票読取り装置および帳票読取り方法ならびプログラム
JP2023002090A (ja) 情報処理システム、表示制御方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090609

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120322

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120710

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120710

R150 Certificate of patent or registration of utility model

Ref document number: 5041775

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150720

Year of fee payment: 3