JP2002109470A - 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体 - Google Patents

画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体

Info

Publication number
JP2002109470A
JP2002109470A JP2000294881A JP2000294881A JP2002109470A JP 2002109470 A JP2002109470 A JP 2002109470A JP 2000294881 A JP2000294881 A JP 2000294881A JP 2000294881 A JP2000294881 A JP 2000294881A JP 2002109470 A JP2002109470 A JP 2002109470A
Authority
JP
Japan
Prior art keywords
image
character
arranged along
angle
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000294881A
Other languages
English (en)
Other versions
JP4281236B2 (ja
Inventor
Masahiro Ozawa
昌裕 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Minolta Co Ltd
Original Assignee
Minolta Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Minolta Co Ltd filed Critical Minolta Co Ltd
Priority to JP2000294881A priority Critical patent/JP4281236B2/ja
Publication of JP2002109470A publication Critical patent/JP2002109470A/ja
Application granted granted Critical
Publication of JP4281236B2 publication Critical patent/JP4281236B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 画像の一部に存在する傾斜配置された文字を
も精度よく認識し得る画像認識技術を提供する。 【解決手段】 画像認識装置10は、第1方向に沿って
配置された文字と、第1方向とは異なる第2方向に沿っ
て配置された文字とが混在する画像から、第2方向に沿
って配置された文字を含む画像領域を抽出する。画像認
識装置は、第1方向に対して第2方向がなす角度を検出
し、検出した角度に基づいて、文字認識方向と第2方向
に沿って配置された文字とがなす相対的な角度を補正し
た後に、第2方向に沿って配置された文字の文字認識を
行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像の一部に存在
する傾斜配置された文字を文字認識する画像認識技術に
関する。
【0002】
【従来の技術】従来から、スキャナなどで読み取って得
られた画像から文字や表のレイアウトを認識する光学式
文字読取(OCR)技術が知られている。この技術にお
いて文字の認識率を高めるためには、文字の並んでいる
向き、あるいは、文字自体の向きを文字認識方向に応じ
て所定の方向に含わせる必要がある。このため、文字認
識を行う前に画像全体の向きを補正して、画像内の文字
の向きと文字認識方向との関係を調整する技術が提案さ
れている(例えば、特開平11−96298号、特開平
11−96299号、特開平11−39428号、特開
平8−44819号、および、特開平6−208652
号の各公報を参照)。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
技術においては、図3、図10に示すように画像の一部
に他の文字に対して傾斜して配置される文字が存在する
場合、この傾斜配置された文字に対する文字認識を充分
に行うことができなかった。
【0004】本発明の目的は、画像の一部に存在する傾
斜配置された文字をも精度よく認識し得る画像認識技術
を提供することである。
【0005】
【課題を解決するための手段】上記目的を達成するため
の本発明は、各請求項ごとに次のように構成される。
【0006】(1)第1方向に沿って配置された文字
と、前記第1方向とは異なる第2方向に沿って配置され
た文字とが混在する画像から、前記第2方向に沿って配
置された文字を含む画像領域を抽出する抽出部と、前記
第1方向に沿って文字認識を行う文字認識部と、前記第
1方向に対して前記第2方向がなす角度を検出する角度
検出部と、検出した角度に基づいて、前記文字認識部の
文字認識方向と前記第2方向に沿って配置された文字と
がなす相対的な角度を補正する角度補正部と、を有し、
角度補正後に前記第2方向に沿って配置された文字の文
字認識を行うことを特徴とする画像認識装置である。
【0007】(2)前記抽出部は、前記文字認識部の認
識対象となる領域を外接矩形領域として抽出し、抽出さ
れた外接矩形領域のサイズが所定サイズよりも大きい場
合に、前記第2方向に沿って配置された文字を含む画像
領域とする上記(1)に記載の画像認識装置である。
【0008】(3)前記角度検出部は、外接矩形領域に
おける2つの対角線に沿った方向に画素の分布を表すヒ
ストグラムを作成し、前記ヒストグラムに応じて角度を
検出する上記(1)に記載の画像認識装置である。
【0009】(4)前記抽出部は、前記第2方向に沿っ
て配置された個々の文字の外接矩形領域を複数個抽出
し、前記角度検出部は、複数個の前記外接矩形領域が並
ぶ方向に応じて角度を検出する上記(1)に記載の画像
認識装置である。
【0010】(5)前記第2方向に沿って配置された文
字を含む画像領域に含まれると共に前記第1方向に対し
て傾斜する線分を抽出する線分抽出部を、さらに有し、
前記角度検出部は、前記線分の傾きに応じて角度を検出
する上記(1)に記載の画像認識装置である。
【0011】(6)前記第2方向に沿って配置された文
字の認識結果を、検出した角度に基づいて、前記第2方
向に沿って配置した画像を形成する形成部と、前記形成
部により形成した画像を出力する出力部と、をさらに有
する上記(1)に記載の画像認識装置である。
【0012】(7)第1方向に沿って配置された文字
と、前記第1方向とは異なる第2方向に沿って配置され
た文字とが混在する画像から、前記第2方向に沿って配
置された文字を含む画像領域を抽出するステップと、前
記第1方向に沿って文字認識を行うステップと、前記第
1方向に対して前記第2方向がなす角度を検出するステ
ップと、検出した角度に基づいて、前記文字認識部の文
字認識方向と前記第2方向に沿って配置された文字とが
なす相対的な角度を補正するステップと、角度補正後に
前記第2方向に沿って配置された文字の文字認識を行う
ステップと、を有する画像認識方法である。
【0013】(8)第1方向に沿って配置された文字
と、前記第1方向とは異なる第2方向に沿って配置され
た文字とが混在する画像から、前記第2方向に沿って配
置された文字を含む画像領域を抽出する手順と、前記第
1方向に沿って文字認識を行う手順と、前記第1方向に
対して前記第2方向がなす角度を検出する手順と、検出
した角度に基づいて、前記文字認識部の文字認識方向と
前記第2方向に沿って配置された文字とがなす相対的な
角度を補正する手順と、角度補正後に前記第2方向に沿
って配置された文字の文字認識を行う手順と、を有する
画像認識プログラムを記憶したコンピュータ読取り可能
な記録媒体である。
【0014】
【発明の実施の形態】以下、本発明の実施の形態を、図
面を参照しつつ説明する。
【0015】(第1の実施の形態)図1は、画像認識装
置の概略構成を示すブロック図である。
【0016】画像認識装置10は、原稿を読み取り、画
像を入力する画像入力部11と、入力された画像に対し
て文字認識処理などを行う画像処理部12と、画像処理
された画像を用紙上に印刷出力する画像出力部13と、
ユーザが画像認識装置10を操作するための操作パネル
部14と、上記各部を制御する制御部15と、を有す
る。
【0017】操作パネル14は、操作に関する各種情報
などを表示する表示部と、操作キーからなる指示入力部
と、を有する。ユーザは、表示部の各種情報に応じ、指
示入力部を用いて、画像の入力指示や画像出力方法の選
択指示などを行う。
【0018】制御部15は、画像入力部11、操作パネ
ル部14、画像出力部13および画像処理部12とのデ
ータ通信を行うための入力I/F部22、パネルI/F
部23、出力I/F部24を有しており、これらI/F
部を介して、CPU21が各部の制御を行う。
【0019】なお、画像入力部11は第1の実施の形態
においてはスキャナなどの画像読取装置であるが、通信
回線から画像を入力するファクシミリ等の装置であって
もよい。また、画像出力部13は、画像を表示するディ
スプレイであってもよい。
【0020】次に、画像処理部12について説明する。
【0021】画像処理部12は、文書認識部31と、領
域分離部32と、ビットマップ処理部33と、ベクタ変
換部34と、2値化処理部35と、合成部36と、メモ
リ37と、フォーマット変換部38と、を有する。
【0022】文書認識部31は、入力された画像から文
字画像を抽出し、抽出された文字画像を文字コードデー
タに変換する。具体的には、画像の濃度差(エッジ)に
応じて、さまざまな大きさの矩形領域として切り出しを
行い、矩形領域内で文字コードを認識し、文字コードが
認識された矩形領域内の画像を文字画像として抽出し、
文字コードデータに変換する。また、矩形領域として切
り出されたが、文字画像として抽出されなかった画像、
あるいは、認識確度の低い画像は、別途、2値化処理部
35にて2値化処理される。さらに、文書認識部31
は、文字画像のフォント種類、フォントサイズを認識す
る。なお、文書認識部31で抽出可能な文字は、文字コ
ードが割り当てられた、文字、記号、および、ユーザが
作成・登録した外字などである。
【0023】領域分離部32は、入力された画像から矩
形領域として切り出された画像を消去し、さらに写真・
網点写真画像と図形画像とに分離する。
【0024】ビットマップ処理部33は、領域分離部3
2にて分離された写真・網点写真画像に対して、スムー
ジングやエッジ強調などの画像処理を行う。
【0025】ベクタ変換部34は、領域分離部32にて
分離された図形画像をベクタデータに変換する。
【0026】合成部36は、文書認識部31から出力さ
れた文字コードデータと、ビットマップ処理部33から
出力された写真・網点写真画像と、ベクタ変換部から出
力された図形画像と、2値化処理部35から出力された
2値化画像とを合成する。
【0027】メモリ37は、合成部36にて合成された
画像を一時的に蓄積する。
【0028】フォーマット変換部38は、画像出力部1
3の出力フォーマットに応じて合成画像を任意のフォー
マットに変換する。
【0029】次に、文書認識部31における処理手順
を、図2に示すフローチャートを用いて説明する。
【0030】まず、文書認識部31に、画像入力部11
から、例えば原稿1枚分を読み取って得られた画像デー
タが入力され、文書認識部31内の画像メモリ(図示せ
ず)に記億される(S201)。文字認識の認識率を上
げるため、画像データに対し、2値化処理およびノイズ
除去処理を行う(S202、S203)。2値化処理、
ノイズ除去処理を施され、文字画像が鮮明となった画像
データに対し、画像データの矩形の各辺に対して平行な
辺で構成される矩形(例えば、図3に示す外接矩形4
4、外接矩形45、外接矩形46)にて外接矩形を作成
する(S204)。
【0031】図3に、第1方向(横方向)に沿って配置
された文字41と、第1方向とは異なる第2方向(右斜
め上がり方向)に沿って配置された文字42、43とが
混在する画像40の一例が示される。外接矩形44は、
第1方向に沿って配置された個々の文字41に外接し、
外接矩形45は、第2方向に沿って配置された複数個の
文字42からなる文字列を含む画像領域に外接し、外接
矩形46は、第2方向に沿って配置された複数個の文字
43からなる文字列を含む画像領域に外接する。
【0032】図示するように、第1の実施の形態では、
傾斜配置された個々の文字42、43の外接矩形を抽出
せずに、複数個の傾斜配置文字42、43からなる文字
列(以下、「傾斜文字列」とも言う)の外接矩形45、
46を抽出する。
【0033】次に、各外接矩形44〜46内の画像デー
タに対して特徴抽出、あるいはパターンマッチングなど
の手法により、文字認識を行い、矩形内の画像データを
文字コードデータに変換する(S205)。この矩形内
の文字認識において、文字認識の確からしさが認識確度
として矩形領域ごとに出力される。第1の実施の形態に
おいて、認識確度は1〜5の5段階あり、「5」が最も
文字認識が確からしいとする数値である。この認識確度
の値が小さい場合には、図3の外接矩形45、外接矩形
46に示すように、傾斜文字列である可能性がある。
【0034】そこで、第1の実施の形態においては、認
識確度が「4」未満のときに(S206:NO)、傾斜
文字列検出処理(S207)を行う。認識確度が「4」
以上のときには(S206:YES)、S205の文字
コード変換処理で得られた文字コードデータを出力する
(S208)。
【0035】全ての矩形領域に対して文字コードデータ
の出力が終了であれば(S209:YES)、文書認識
処理を終了し、未出力の矩形領域があれば(S209:
NO)、S205に戻り、文字コードデータ変換処理を
行う。
【0036】次に、傾斜文字列検出処理(S207)
を、図4に示すフローチャートを用いて説明する。
【0037】まず、外接矩形の面積が大きい場合に傾斜
文字列である可能性が高いことから、所定面積Sと外接
矩形の面積とを比較する(S401)。所定面積Sは、
例えば全矩形領域の面積の平均面積とする。外接矩形面
積が所定面積S以下の場合には、認識確度が低くとも、
傾斜文字列とはせず、傾斜文字列検出処理から抜ける
(S401:NO)。外接矩形面積が所定面積Sよりも
大きい場合には(S401:YES)、外接矩形の対角
線を横軸Xとする濃度ヒストグラムを作成する(S40
2)(図5参照)。
【0038】図5(A)に、図3に示した外接矩形46
が示され、同図(B)および(C)に、当該外接矩形4
6の対角線に沿って作成した濃度ヒストグラム47、4
8が示される。図5(B)および(C)に示されるよう
に、2つの濃度ヒストグラム47、48のうちの一方が
横軸Xの中央に濃度が集中し、他方が横軸Xの全体に断
続的な濃度分布を示すという特徴を有する場合には、外
接矩形46内の画像データは傾斜文字列であると判断す
る(S403:YES)。上記の特徴がない場合には、
傾斜文字列とはせず、傾斜文字列検出処理から抜ける
(S403:NO)。
【0039】次に、断続的な濃度分布を有する濃度ヒス
トグラム48の横軸Xすなわち外接矩形の対角線が元の
画像データとなす角度を傾斜文字列の傾斜角度と決定す
る(S404)。決定した傾斜角度に基づいて、外接矩
形46内の画像データの傾きを補正する(S405)。
傾きが補正された傾斜文字列に対して外接矩形を再度作
成する(S406)。このときは図6に示すように、外
接矩形49の大きさは一文宇の大きさとして作成され
る。作成された新しい外接矩形49内の画像データを文
字コードデータに変換する(S407)。そして、元の
外接矩形46内の画像データと一致するように認識結果
を再配置するために必要なデータ、つまり、変換後の文
字コードデータの出力位置および傾きを算出する(S4
08)。
【0040】上記のとおり、傾斜文字列の場合には、外
接矩形領域の2つの対角線に沿う濃度ヒストグラムに応
じて傾斜角度を求め、文字認識方向と傾斜文字列の配置
方向とがなす相対的な角度を補正した後に傾斜文字列の
文字認識を行うため、画像の一部に存在する傾斜文字列
をも精度よく認識することが可能となる。
【0041】なお、文書認識部31の認識対象となる領
域を外接矩形領域として抽出するとき、傾斜文字列に外
接する矩形できちんと切り出すことができずに、外接矩
形から傾斜文字列の一部がはみ出ることが生じ得る。こ
のような場合、外接矩形領域からはみ出ている画像デー
タについても、ヒストグラム47、48の対象とすれ
ば、傾斜文字列の検出精度が向上する。
【0042】そこで、第1の実施の形態では、外接矩形
45、46の内部の黒画素と連結ないし連続する黒画素
についても、濃度ヒストグラム47、48を作成する際
のデータとして採用する。さらに、外接矩形45、46
内の画像データの傾きを補正するときには(S40
5)、外接矩形45、46内の画像データと連結した画
像データについても、傾き補正の対象としてある。これ
により、傾斜文字列をさらに精度よく認識することがで
きる。
【0043】第1の実施の形態では、傾斜文字列である
か否かの判断に要する時間を短くする観点から、外接矩
形における2つの対角線に沿った方向に濃度ヒストグラ
ム47、48を作成した。但し、傾斜文字列の傾斜角度
の検出精度を高めるために、次のように改変してもよ
い。濃度ヒストグラムを作成する方向を対角線の方向か
ら一定の角度ずつ変化させ、得られた複数の濃度ヒスト
グラムの中から、図5(B)のような形状を示す濃度ヒ
ストグラムの傾きを、傾斜文字列の傾斜角度としてもよ
い。同様に、濃度ヒストグラムを作成する方向を水平方
向または垂直方向から一定の角度ずつ変化させ、得られ
た複数の濃度ヒストグラムの中から、図5(B)のよう
な形状を示す濃度ヒストグラムの傾きを、傾斜文字列の
傾斜角度としてもよい。
【0044】所定面積Sは、文字認識により得られたフ
ォントサイズからフォントサイズの平均値を算出し、こ
の平均値に基づいて決定してもよい。
【0045】(第2の実施の形態)図7は、第2の実施
の形態における傾斜文字列検出処理を示すフローチャー
ト、図8は、個々の傾斜配置文字43の外接矩形51を
示す図である。なお、第2の実施の形態における画像認
識装置の構成および文書認識処理手順は、図1および図
2に示したものと同じであるため、図示を省略する。
【0046】図7に示すフローチャートを参照して、ま
ず、ステップS204(図2)において作成された外接
矩形46内の画像データから、個々の傾斜配置文字43
の外接矩形51を作成する(S701)。
【0047】図8に、複数個の外接矩形51が、その一
部が重なりながら、一定の方向に並んでいる状態が示さ
れる。このように複数個の外接矩形51が一定の方向に
並んでいる場合には、外接矩形46内の画像データは傾
斜文字列であると判断する(S702:YES)。複数
個の外接矩形51の並び方向が一定でない場合には、認
識確度が低くとも、傾斜文字列とはせず、傾斜文字列検
出処理から抜ける(S702:NO)。
【0048】次に、複数個の外接矩形51が並ぶ方向に
基づいて、傾斜文字列の傾斜角度を決定する(S70
3)。具体的には、個々の外接矩形51における対角線
の傾きを平均した値、あるいは、個々の外接矩形51に
おける一の角部(例えば、右下の角部)を接続してなる
線分の傾きに基づいて、傾斜角度を決定する。決定した
傾斜角度に基づいて、それぞれの外接矩形51内の画像
データの傾きを補正し(S704)、傾きが補正された
個々の傾斜配置文字43に対して外接矩形を再度作成す
る(S705)。図6に示したように、外接矩形49の
大きさは一文宇の大きさとして作成される。そして、作
成された新しい外接矩形49内の画像データを文字コー
ドデータに変換し(S706)、認識結果を再配置する
ために必要な変換後の文字コードデータの出力位置およ
び傾きを算出する(S707)。
【0049】上記のとおり、傾斜文字列の場合には、個
々の傾斜配置文字の複数個の外接矩形領域が並ぶ方向に
応じて傾斜角度を求め、文字認識方向と傾斜文字列の配
置方向とがなす相対的な角度を補正した後に傾斜文字列
の文字認識を行うため、画像の一部に存在する傾斜文字
列をも精度よく認識することが可能となる。
【0050】なお、前述したように、個々の外接矩形5
1から傾斜配置文字43の一部がはみ出ることがあるの
で、外接矩形51内の画像データと連結した画像データ
についても、傾き補正の対象とし、個々の傾斜配置文字
43の文字認識精度を高めるのが好ましい。
【0051】(第3の実施の形態)図9は、第3の実施
の形態における傾斜文字列検出処理を示すフローチャー
ト、図10は、第1方向(横方向)に沿って配置された
文字61と、第1方向とは異なる第2方向(右斜め上が
り方向)に沿って配置された文字62と、第1方向に対
して傾斜する線分63とを含む画像60の一例を示す図
である。なお、第3の実施の形態における画像認識装置
の構成および文書認識処理手順は、図1および図2に示
したものと同じであるため、図示を省略する。
【0052】図9に示すフローチャートを参照して、ま
ず、ステップS204(図2)において作成された外接
矩形46内の画像データから、傾斜線分63を抽出する
(S901)。
【0053】図10に示すように、一般的な文書中に傾
斜配置文字62が存在する場合において、当該傾斜配置
文字62は、傾斜線分63の説明として、当該傾斜線分
63の近傍に記載されていることが多い。第3の実施の
形態ではこの点に着目し、外接矩形46内の画像データ
から傾斜線分63を抽出できた場合には、傾斜文字列で
あると判断する(S902:YES)。傾斜線分63を
抽出できなかった場合には、認識確度が低くとも、傾斜
文字列とはせず、傾斜文字列検出処理から抜ける(S9
02:NO)。
【0054】次に、抽出した傾斜線分63が元の画像デ
ータとなす角度を傾斜文字列の傾斜角度と決定する(S
903)。決定した傾斜角度に基づいて、外接矩形46
内の画像データの傾きを補正し(S904)、傾きが補
正された傾斜文字列に対して外接矩形を再度作成する
(S905)。このときは図6に示したように、外接矩
形49の大きさは一文宇の大きさとして作成される。そ
して、作成された新しい外接矩形49内の画像データを
文字コードデータに変換し(S906)、認識結果を再
配置するために必要な変換後の文字コードデータの出力
位置および傾きを算出する(S907)。
【0055】上記のとおり、傾斜線分63の近傍に存在
する傾斜文字列の場合に、傾斜線分63の傾きを傾斜文
字列の傾斜角度とし、文字認識方向と傾斜文字列の配置
方向とがなす相対的な角度を補正した後に傾斜文字列の
文字認識を行うため、画像の一部に存在する傾斜文字列
をも精度よく認識することが可能となる。
【0056】(第3の実施の形態の変形例)ベクタ変換
部34により変換されたベクタデータに基づいて傾斜線
分が含まれるか否かを判断し、傾斜線分を抽出した場合
に、文書認識部31により文書認識を再度行うようにし
てもよい。この場合、文書認識部31は、まず、抽出さ
れた傾斜線分を対角線とする外接矩形を形成し、ベクタ
データから検出された傾斜線分の傾きを、傾斜文字列の
傾斜角度と決定する。以後は、上述したステップS90
4〜S907と同様の処理を行う。
【0057】(その他の変形例)傾斜配置文字を含む画
像領域を自動的に抽出する実施形態を示したが、操作パ
ネル部14を操作することにより、抽出すべき画像の領
域を、ユーザが設定できるようにしてもよい。
【0058】出力処理として印刷や表示する形態を示し
たが、印刷/表示とともに、または印刷/表示に代え
て、認識結果を例えばPDFファイル形式などで記憶媒
体に出力し保存してもよい。この場合、記憶媒体に保存
した認識結果は、ユーザからの使用要求に応じ、当該ユ
ーザに対してメールなどで送信される。これにより、ユ
ーザは、認識結果を後編集できる。
【0059】さらに、本発明による画像認識技術は、例
えば、OCR処理を行うアプリケーションソフトに搭載
することも可能である。
【0060】
【発明の効果】以上説明した本発明によれば、請求項ご
とに以下のような効果を奏する。
【0061】請求項1〜5に記載の画像認識装置によれ
ば、第1方向に沿って配置された文字列と、第1方向と
は異なる第2方向に沿って配置された文字とが混在する
画像から、第2方向に沿って配置された文字をも精度よ
く認識することができる。
【0062】請求項6に記載の画像認識装置によれば、
認識した傾斜配置された文字を元の画像どおりのレイア
ウトで再現した画像を形成し、出力することができる。
【0063】請求項7に記載の画像認識方法によれば、
第1方向に沿って配置された文字列と、第1方向とは異
なる第2方向に沿って配置された文字とが混在する画像
から、第2方向に沿って配置された文字をも精度よく認
識することができる。
【0064】請求項8に記載の画像認識プログラムを記
憶したコンピュータ読取り可能な記録媒体によれば、こ
の記録媒体に記憶されたプログラムをコンピュータによ
り読取って実行することで、第1方向に沿って配置され
た文字列と、第1方向とは異なる第2方向に沿って配置
された文字とが混在する画像から、第2方向に沿って配
置された文字をも精度よく認識することができる。
【図面の簡単な説明】
【図1】 画像認識装置の概略構成を示すブロック図で
ある。
【図2】 文書認識部における処理手順を示すフローチ
ャートである。
【図3】 第1方向に沿って配置された文字と、第1方
向とは異なる第2方向に沿って配置された文字とが混在
する画像の一例を示す図である。
【図4】 第1の実施の形態における傾斜文字列検出処
理を示すフローチャートである。
【図5】 図5(A)は、複数個の傾斜配置文字からな
る文字列の外接矩形を示す図、同図(B)(C)は、当
該外接矩形の対角線に沿って作成した濃度ヒストグラム
を示す図である。
【図6】 傾きが補正された傾斜文字列に対して再度作
成する外接矩形を示す図である。
【図7】 第2の実施の形態における傾斜文字列検出処
理を示すフローチャートである。
【図8】 個々の傾斜配置文字の外接矩形を示す図であ
る。
【図9】 第3の実施の形態における傾斜文字列検出処
理を示すフローチャートである。
【図10】 第1方向に沿って配置された文字と、第1
方向とは異なる第2方向に沿って配置された文字と、第
1方向に対して傾斜する線分とを含む画像の一例を示す
図である。
【符号の説明】
10…画像認識装置 11…画像入力部 12…画像処理部 13…画像出力部 15…制御部 40、60…画像 41、61…第1方向に沿って配置された文字 42、43、62…傾斜配置文字(第1方向とは異なる
第2方向に沿って配置された文字) 44、45、46…外接矩形 47、48…ヒストグラム 49…傾きが補正された傾斜文字列に対して再度作成す
る外接矩形 51…個々の傾斜配置文字の外接矩形 63…傾斜線分(第1方向に対して傾斜する線分)

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 第1方向に沿って配置された文字と、前
    記第1方向とは異なる第2方向に沿って配置された文字
    とが混在する画像から、前記第2方向に沿って配置され
    た文字を含む画像領域を抽出する抽出部と、 前記第1方向に沿って文字認識を行う文字認識部と、 前記第1方向に対して前記第2方向がなす角度を検出す
    る角度検出部と、 検出した角度に基づいて、前記文字認識部の文字認識方
    向と前記第2方向に沿って配置された文字とがなす相対
    的な角度を補正する角度補正部と、を有し、 角度補正後に前記第2方向に沿って配置された文字の文
    字認識を行うことを特徴とする画像認識装置。
  2. 【請求項2】 前記抽出部は、前記文字認識部の認識対
    象となる領域を外接矩形領域として抽出し、抽出された
    外接矩形領域のサイズが所定サイズよりも大きい場合
    に、前記第2方向に沿って配置された文字を含む画像領
    域とする請求項1に記載の画像認識装置。
  3. 【請求項3】 前記角度検出部は、外接矩形領域におけ
    る2つの対角線に沿った方向に画素の分布を表すヒスト
    グラムを作成し、前記ヒストグラムに応じて角度を検出
    する請求項1に記載の画像認識装置。
  4. 【請求項4】 前記抽出部は、前記第2方向に沿って配
    置された個々の文字の外接矩形領域を複数個抽出し、 前記角度検出部は、複数個の前記外接矩形領域が並ぶ方
    向に応じて角度を検出する請求項1に記載の画像認識装
    置。
  5. 【請求項5】 前記第2方向に沿って配置された文字を
    含む画像領域に含まれると共に前記第1方向に対して傾
    斜する線分を抽出する線分抽出部を、さらに有し、 前記角度検出部は、前記線分の傾きに応じて角度を検出
    する請求項1に記載の画像認識装置。
  6. 【請求項6】 前記第2方向に沿って配置された文字の
    認識結果を、検出した角度に基づいて、前記第2方向に
    沿って配置した画像を形成する形成部と、 前記形成部により形成した画像を出力する出力部と、を
    さらに有する請求項1に記載の画像認識装置。
  7. 【請求項7】 第1方向に沿って配置された文字と、前
    記第1方向とは異なる第2方向に沿って配置された文字
    とが混在する画像から、前記第2方向に沿って配置され
    た文字を含む画像領域を抽出するステップと、 前記第1方向に沿って文字認識を行うステップと、 前記第1方向に対して前記第2方向がなす角度を検出す
    るステップと、 検出した角度に基づいて、前記文字認識部の文字認識方
    向と前記第2方向に沿って配置された文字とがなす相対
    的な角度を補正するステップと、 角度補正後に前記第2方向に沿って配置された文字の文
    字認識を行うステップと、を有する画像認識方法。
  8. 【請求項8】 第1方向に沿って配置された文字と、前
    記第1方向とは異なる第2方向に沿って配置された文字
    とが混在する画像から、前記第2方向に沿って配置され
    た文字を含む画像領域を抽出する手順と、 前記第1方向に沿って文字認識を行う手順と、 前記第1方向に対して前記第2方向がなす角度を検出す
    る手順と、 検出した角度に基づいて、前記文字認識部の文字認識方
    向と前記第2方向に沿って配置された文字とがなす相対
    的な角度を補正する手順と、 角度補正後に前記第2方向に沿って配置された文字の文
    字認識を行う手順と、を有する画像認識プログラムを記
    憶したコンピュータ読取り可能な記録媒体。
JP2000294881A 2000-09-27 2000-09-27 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体 Expired - Fee Related JP4281236B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000294881A JP4281236B2 (ja) 2000-09-27 2000-09-27 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000294881A JP4281236B2 (ja) 2000-09-27 2000-09-27 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2002109470A true JP2002109470A (ja) 2002-04-12
JP4281236B2 JP4281236B2 (ja) 2009-06-17

Family

ID=18777397

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000294881A Expired - Fee Related JP4281236B2 (ja) 2000-09-27 2000-09-27 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP4281236B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008100680A (ja) * 2007-12-06 2008-05-01 Denso Corp 車載操作装置
JP2009003937A (ja) * 2007-06-21 2009-01-08 Sharp Corp デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体
JP2009048499A (ja) * 2007-08-21 2009-03-05 Canon Inc 画像処理装置、画像処理方法、及び、画像処理プログラム
JP2010072826A (ja) * 2008-09-17 2010-04-02 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラムおよびコンピュータ読み取り可能な記憶媒体
US8208725B2 (en) 2007-06-21 2012-06-26 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
JP2012221183A (ja) * 2011-04-08 2012-11-12 Fujitsu Marketing Ltd レシートデータ認識装置およびそのプログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009003937A (ja) * 2007-06-21 2009-01-08 Sharp Corp デジタル画像におけるテキスト方向判定方法およびシステム、ならびに、制御プログラムおよび記録媒体
US8144989B2 (en) 2007-06-21 2012-03-27 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
US8208725B2 (en) 2007-06-21 2012-06-26 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
JP2009048499A (ja) * 2007-08-21 2009-03-05 Canon Inc 画像処理装置、画像処理方法、及び、画像処理プログラム
JP2008100680A (ja) * 2007-12-06 2008-05-01 Denso Corp 車載操作装置
JP4591501B2 (ja) * 2007-12-06 2010-12-01 株式会社デンソー 車載操作装置
JP2010072826A (ja) * 2008-09-17 2010-04-02 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラムおよびコンピュータ読み取り可能な記憶媒体
JP2012221183A (ja) * 2011-04-08 2012-11-12 Fujitsu Marketing Ltd レシートデータ認識装置およびそのプログラム

Also Published As

Publication number Publication date
JP4281236B2 (ja) 2009-06-17

Similar Documents

Publication Publication Date Title
US7454060B2 (en) Image processor for character recognition
US7391917B2 (en) Image processing method
US7664321B2 (en) Image processing method, system, program, program storage medium and information processing apparatus
US7831107B2 (en) Image processing apparatus, image processing method, and program
EP2264995B1 (en) Image processing apparatus, image processing method, and computer program
US7421124B2 (en) Image processing system and image processing method
JP2001351066A (ja) 文書認識処理のための装置、方法及び記録媒体
US20060008113A1 (en) Image processing system and image processing method
JP4655335B2 (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2004046632A (ja) 画像処理装置
JP4730775B2 (ja) 画像処理装置
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP4275973B2 (ja) 加筆画像抽出装置、プログラム、記憶媒体及び加筆画像抽出方法
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
US11288536B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP4804433B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JPH10171920A (ja) 文字認識装置、その文字認識方法およびその記録媒体
JP2008193234A (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
JP2002027228A (ja) 画像処理のための装置、方法及び記録媒体
JP2002049890A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JPH0535914A (ja) 画像傾き検出方法
JPH09269970A (ja) 文字認識方法とその装置
JP2007174523A (ja) 画像処理装置、画像処理方法、プログラムコード及び記憶媒体
JP2003346083A (ja) 文字認識装置、文字認識方法、プログラムおよび記憶媒体、および文字認識システム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20040423

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050920

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20061011

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080703

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080821

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081028

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081127

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090224

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090309

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120327

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120327

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130327

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140327

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees