JP2003288588A - 画像処理装置及び画像処理方法 - Google Patents

画像処理装置及び画像処理方法

Info

Publication number
JP2003288588A
JP2003288588A JP2002089496A JP2002089496A JP2003288588A JP 2003288588 A JP2003288588 A JP 2003288588A JP 2002089496 A JP2002089496 A JP 2002089496A JP 2002089496 A JP2002089496 A JP 2002089496A JP 2003288588 A JP2003288588 A JP 2003288588A
Authority
JP
Japan
Prior art keywords
image
character
transformation matrix
perspective transformation
inverse perspective
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002089496A
Other languages
English (en)
Other versions
JP3866600B2 (ja
Inventor
Tatsuaki Iwata
達明 岩田
Yasuto Ishitani
康人 石谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2002089496A priority Critical patent/JP3866600B2/ja
Publication of JP2003288588A publication Critical patent/JP2003288588A/ja
Application granted granted Critical
Publication of JP3866600B2 publication Critical patent/JP3866600B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】 撮影した画像の撮影位置や種類を問わず、自
動的に擬似的な正面画像を得ることのできる画像処理装
置及び方法を提供する。 【解決手段】 デジタルカメラ等で取得した画像(変換
元画像)の文字行(文字の連なり)を検出し、この文字
行の分布に基づいて変換元画像の透視歪みを検出する。
検出された透視歪みに基づいて、変換元画像の変換元四
辺形領域41を変換先画像の変換先矩形領域42に変換
するための逆透視変換行列を算出する。この逆透視変換
行列に基づいて、変換元画像を補正して変換先画像とす
る。この変換先画像内の文字を文字認識し、文字認識結
果の良否に基づき前記逆透視変換行列の採用の適否が判
定される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、デジタルカメラな
どの画像入力機器により光学的に取得された被写体の画
像から、擬似的な正面画像を取得し、文字認識処理を行
う画像処理装置、画像処理方法に関する。
【0002】
【従来の技術】近年のデジタル機器の発展により、例え
ば展示会会場などに展示される展示パネルや掲示された
ポスター、看板などに書かれた文字を、デジタルカメラ
などで撮影し、その画像にOCRをかけて文字認識し、
テキストデータとして記録する、ということが可能とな
っている。このように文字を撮影しようとする場合に
は、できる限り正面から撮影するのが望ましい。斜め方
向から撮影した画像では、撮影した画像内の文字に透視
歪み(射影歪み)が発生し、文字認識に用いる辞書デー
タとの類似度が低下してしまい、結果として文字認識率
が低下してしまうためである。
【0003】しかし、展示会会場などでは、被写体とし
てのパネルが高所や遠方に設けられていたり、近くにあ
っても人込みがあったりすることにより、正面から撮影
することが困難な場合がある。このため、斜め方向から
撮影した画像を補正し、擬似的な正面画像を取得する方
法が提案されている。例えば、特開平9−289611号公報
には、撮影の際に被写体面と撮像面とがなす角度と被写
体までの距離を測定し、その後擬似的な正面画像に自動
的に変換するデジタルカメラが提案されている。
【0004】しかし、この装置では、撮像面と被写体面
が水平方向にずれた場合に生じる台形に歪んだ矩形領域
に補正対象が限定されるため、撮影時にガイドに従って
撮像面と被写体面との垂直方向の傾きを合わせる必要が
生じる。別の提案として、特開2000−293627号公報に
は、複数枚の撮影画像の中から最も正面で撮影された画
像を選択し、逆透視変換により補正することで擬似的な
正面画像を取得する技術が開示されている。
【0005】
【発明が解決しようとする課題】しかし、この手法で
は、複数枚の撮影が常に必要になり利用者の負担が増加
する他、これらの方法は被写体においてパネルなどの矩
形の領域を定義するための線分が存在する場合のみに処
理が制限されてしまうという問題がある。このように、
従来の装置においては、斜め方向から撮影した画像につ
いて、垂直方向、水平方向の両方向同時に撮影位置がず
れている場合や、画面内にパネルなどの矩形の領域を定
義する線分が存在しない場合には、自動的に擬似的な正
面画像を得ることが出来ないという問題があった。
【0006】この発明は、上記のような従来技術の問題
を解消するためになされたものであり、撮影した画像の
撮影位置や種類を問わず、自動的に擬似的な正面画像を
得ることのできる画像処理装置及び方法を提供すること
を目的とする。
【0007】
【課題を解決するための手段】上記目的を達成するた
め、本出願の第1の発明に係る画像処理装置は、光学的
に取得された画像を変換元画像として入力する画像入力
手段と、入力された変換元画像から文字行を抽出する文
字行抽出手段と、前記文字行の分布から変換元画像の透
視歪みを検出する透視歪み検出手段と、前記透視歪みを
補正して変換先画像を生成するための逆透視変換行列を
算出する逆透視変換行列算出手段と、前記逆透視変換行
列を用いて前記変換元画像を補正して前記変換先画像と
する補正手段と、前記変換先画像に含まれる文字を文字
認識する文字認識手段と、前記変換先画像と文字認識結
果とを関連付けて構造化する構造化手段と、構造化した
データを記憶する記憶手段とを備えたことを特徴とす
る。
【0008】この第1の発明によると、画像入力手段よ
り入力された変換元画像から文字行が文字行抽出手段に
より抽出される。この文字行の分布から変換元画像の透
視歪みが検出される。検出された透視歪みに基づいて逆
透視変換行列が逆透視変換行列算出手段において算出さ
れ、この逆透視変換行列に基づいて前記変換元画像が補
正されて変換先画像とされる。この変換画像中に含まれ
る文字が、文字認識手段において文字認識され、この文
字認識結果と変換先画像とが構造化手段において関連付
けて構造化され、この構造化したデータが記憶手段に記
憶される。文字行の分布に基づいて透視歪みが検出され
るため、変換元画像が、垂直方向、水平方向の両方向同
時に撮影位置がずれている場合であっても、擬似的な正
面画像を得ることができ、また、パネルなどの矩形領域
を定義する線分が存在しない場合であっても、自動的に
擬似的な正面画像を得ることが出来る。
【0009】前記透視歪み検出手段は、前記文字行抽出
手段により抽出された1つの文字行又は一対の文字行の
領域を示す変換元四辺形領域を推定する変換元四辺形領
域推定手段と、この変換元四辺形領域を用いて変換先画
像の矩形領域を推定する変換先矩形領域推定手段とを備
え、前記逆透視変換行列算出手段は、変換元四辺形領域
と変換先矩形領域とを用いて前記逆透視変換行列を算出
するようにすることができる。また、前記第1の発明に
おいて、前記逆透視変換行列算出手段により算出された
前記逆透視変換行列を評価し、該逆透視変換行列の採用
の可否を判定する逆透視変換行列評価手段を備えるよう
にすることもできる。この逆透視変換行列評価手段は、
前記文字認識手段による文字認識結果に基づき前記逆透
視変換行列を評価するように構成することもできる。ま
た、この逆透視変換行列評価手段は、前記変換先画像に
おける白画素の分布状況に基づき前記逆透視変換行列を
評価するように構成することもできる。
【0010】前記第1の発明において、前記文字行抽出
手段は、入力された変換元画像を二値化処理する二値化
処理手段と、二値化された画像から文字矩形を抽出する
文字矩形抽出手段と、予め設定された結合条件に従って
隣接する前記文字矩形同士を連結する文字矩形連結手段
と、文字矩形を連結してなる連結文字矩形から連結誤り
部分を検出して該連結誤り部分を棄却する連結誤り部分
棄却手段と、前記連結文字矩形を統合する連結文字矩形
統合手段とを備えるようにすることができる。また、前
記第1の発明において、前記変換元画像と前記変換先画
像を表示する画像表示手段と、オペレータに画像表示手
段に表示された画像に基づいて前記変換元四辺形領域を
手動で補正させる手動補正手段とを更に備えるようにす
ることもできる。
【0011】上記目的を達成するため、本出願の第2の
発明に係る画像処理方法は、光学的に取得された画像を
変換元画像として入力する画像入力ステップと、入力さ
れた変換元画像から文字行を抽出する文字行抽出ステッ
プと、前記文字行の分布から変換元画像の透視歪みを検
出する透視歪み検出ステップと、前記透視歪みを補正し
て変換先画像を生成するための逆透視変換行列を算出す
る逆透視変換行列算出ステップと、前記逆透視変換行列
を用いて前記変換元画像を補正して前記変換先画像とす
る補正ステップと、前記変換先画像に含まれる文字を文
字認識する文字認識ステップと、前記変換先画像と文字
認識結果とを関連付けて構造化する構造化ステップと、
構造化したデータを記憶する記憶ステップとを備えたこ
とを特徴とする。
【0012】
【発明の実施の形態】〔第1の実施の形態〕次に、本発
明の第1の実施の形態に係る画像処理装置を、図面に基
づいて説明する。 (全体構成)図1は、本実施の形態に係る画像処理装置
のハードウエア構成を示すブロック図である。本実施の
形態に係る画像処理装置は、例えば、通常のパーソナル
コンピュータ(PC)に本実施の形態に係るコンピュー
タプログラムを読み込むことにより構成することができ
る。すなわち、本実施の形態に係る画像処理装置1は、
CPU11により全体の制御がなされるように構成され
る。CPU11は、ROM12に格納されたコンピュー
タプログラムに従って後述する各種のデータ処理を行
う。ROM12には、コンピュータプログラムの他、各
種データ処理を行うためのテーブル等が記憶される。
【0013】また、RAM13は、ROM12に格納さ
れたプログラムをロードしたり、データ処理を行うため
の作業領域を提供したりするための記憶装置である。ハ
ードディスクドライブ(HDD)14は、RAM13の
代替記憶装置として機能する他、補正された画像データ
等を記憶する記憶部として機能する記憶装置であり、I
/F19を介してCPUと接続されている。
【0014】画像処理装置1は、デジタルカメラ等の画
像入力装置からの画像データを入力するためのインター
フェース(I/F)16を備えており、また、この画像
データを記憶するための画像メモリ17を備えている。
また、画像処理装置1は、表示制御部18と、表示部1
9とを備えている。表示部19は、例えばCRTや液晶
ディスプレイなどであり、表示制御部18は、画像デー
タをCPU11からの命令に基づき処理して、表示部1
9にデジタルカメラの撮影画像等を表示させる。
【0015】(ソフトウエア構成)図2は、図1に示す
ハードウエア構成をソフトウエア上の機能別にブロック
図として示したものである。すなわち、画像処理装置1
は、画像入力部31、文字行抽出部32、透視歪み検出
部33、画像補正部34、文字認識部35、画像構造化
部36、構造化データ記憶部37とから大略構成され
る。画像入力部31は、デジタルカメラ等からの画像デ
ータを画像処理装置1に入力するための部分であり、イ
ンターフェース16、画像メモリ17がこの役割を果た
している。この入力された画像データが、後述するよう
に画像補正部34で補正されて、これにより斜め方向か
ら撮影された画像が擬似的な正面画像に変換される。以
下では、この変換前の画像を「変換元画像」と、変換後
の画像を「変換先画像」と称する。
【0016】文字行抽出部32以降の機能は、CPU1
1及びROM12に格納されたプログラムにより達成さ
れるものである。文字行抽出部32は、画像入力部31
により入力された変換元画像データの中から、文字の連
なりとしての文字行を抽出する部分である。
【0017】透視歪み検出部33は、文字行抽出部32
で抽出した文字行の分布状況に基づいて透視歪みを検出
し、この透視歪みを補正する逆透視変換行列Hを算出す
る部分である。画像補正部34は、算出された逆透視変
換行列により、画像入力部で入力された変換元画像を補
正して、これを変換先画像とする。文字認識部35は、
この変換先画像に対して公知の文字認識装置を用いて文
字認識を行う部分である。
【0018】画像構造化部36は、変換先画像と文字認
識結果とを関連付けて構造化した構造化データを作成す
る部分である。変換先画像を、擬似正面画像内の文字を
文字認識した結果と関連付けて、構造化し記憶すること
で、画像内の文字情報の活用や画像の検索などが容易に
なる。構造化データ記憶部36は、この構造化データを
記憶する部分であり、例えばRAM13がこの役割を果
たす。
【0019】(文字行抽出部32)図3は、文字行抽出
部32の処理動作を示すフローチャートである。最初に
S1で、公知の二値化処理手法を用いて、入力された画
像を白と黒の二値のデータへと変換する。以降、この二
値化データを入力画像とする。続くS2では、黒連結成
分の抽出処理を行う。ここで黒連結成分とは、連結され
た複数の黒画素の塊のことである。例えば、平仮名の
「こ」からは、第1画(上の横棒)と第2画(下の横
棒)により2つの黒連結成分が抽出される、平仮名の
「め」からは、第1画と第2画とが一体化されているの
で、1つの黒連結成分だけが抽出される。次にS3に
て、文字矩形の抽出を行う。ここで文字矩形とは、黒連
結成分のまとまりに外接する矩形のことである。図4
は、このS3における文字矩形の抽出の手順の詳細を示
したものである。最初に、S2で抽出された黒連結成分
の外接矩形を抽出する(S3−1)。次に、この外接矩
形の併合処理を行う(S3−2)。すなわち、2つの外
接矩形が一定の併合条件を満たすときには、両外接矩形
を併合して新しい外接矩形を生成する。併合条件として
は、1つの外接矩形が別の外接矩形を内包する、2つの
文字矩形が一定の割合以上交差している、などの条件を
用いる。こうして併合された外接矩形が文字矩形として
扱われる。図5は、S3で抽出される文字矩形の1例を
示している。
【0020】S3の文字矩形の抽出が完了すると、次は
S4において文字行の抽出処理が行われる。すなわち、
S3で抽出された文字矩形のうち、直線状に並んでいる
と判定されるものを連結して、この連結されたものを文
字行として抽出するものである。この文字行の抽出処理
の手順の詳細を図6に示す。まず、S4−1において、
文字矩形を連結する。各文字矩形の中心位置同士の距離
を求め、特定の閾値内にある文字矩形を順に連結してい
く。このとき、他の保持矩形と連結済みの文字矩形とは
連結しないものとする。
【0021】続いて、S4−1における連結手順におい
て、連結の誤りが生じた部分(連結誤り部分)の棄却処
理を行う(S4−2)。例えば、図7(a)のように、
別の行の文字矩形に誤って連結することが生じ得る。こ
の処理では、ある文字矩形の中心点Ciと、この文字矩
形とS4−1で連結された前後の文字矩形の中心点Ci-
1、Ci+1とがある場合、線分CiCi-1 と線分CiCi+1
とがなす角度θiを求め、一定の範囲を外れた角度で連
結している部分を連結誤り部分として棄却する(図7
(b))。
【0022】次に、S4−3において、このS4−2で
の棄却により不連続となった文字矩形の連結部(連結文
字矩形)を統合処理する。統合処理に際しては、一定の
結合条件を設定しておき、この結合条件に基づき、連結
文字矩形同士を結合させていく。結合条件としては、例
えば、連結文字矩形同士の傾きの差が閾値以下である
こと、一方の連結文字矩形の端にある文字矩形と、も
う一方の連結文字矩形の端にある文字矩形とを結ぶ線分
の傾きと、各連結文字矩形の傾きとの差が閾値以下であ
る、などの条件を組み合わせて用いる。このようにし
て、図8(a)に示すような不連続な連結文字矩形同士
が、同図(b)に示すように統合される。こうして文字
行の抽出が完了する。なお、各文字行は、文字行を構成
する各文字矩形の4隅及び中心点の座標、大きさ(縦
幅、横幅)、文字行の長さ、傾きなどの属性を持つ。ま
た文字行の傾きに基づいて、縦書きの文書か横書きの文
書かが判定される。例えば、文字行の傾きが所定の閾値
以上である場合には縦書きと、所定の閾値未満の場合に
は横書きと判定し、このデータも文字行の属性として記
憶される。
【0023】(透視歪み検出部33)図9は、透視歪み
検出部33の機能を更に詳細に示す機能ブロック図であ
る。透視歪み検出部33は、変換元四辺形領域推定部3
3a、変換先矩形領域推定部33b、逆透視変換行列算
出部33c、逆透視変換行列評価部33dとを備えてい
る。変換元四辺形領域33aは、透視的に歪んだ変換元
画像において、文字を囲う四辺形領域を推定する。詳細
な推定の手順は後述する。この以下では、この推定され
た四辺形領域を「変換元四辺形領域」と称する。
【0024】変換先矩形領域推定部33bは、変換元四
辺形領域推定部33aにおいて推定された変換元四辺形
領域に基づいて、この変換元四辺形領域に対応する変換
先画像内の矩形領域を推定する部分である。詳細な推定
の手順は後述する。以下では、この推定された矩形領域
を、「変換先矩形領域」と称する。
【0025】逆透視変換行列算出部33cは、変換元四
辺形領域を変換先矩形領域に変換するための逆透視変換
行列Hを算出する部分である。逆透視変換行列Hの算出
方法の概要を図10に基づいて説明する。逆透視変換行
列Hと、変換元四辺形領域41中の画素P(x、y)
と、変換先矩形領域42中の画素P´(x´、y´)と
の関係は、以下の式により表わされる。
【0026】
【数1】
【0027】この逆透視変換行列のパラメータc1−c
8を、例えば図10に示すような変換元四辺形領域41
の四隅の座標P1(x1、y1)〜P4(x4、y
4)、変換先矩形領域42の四隅の座標P1´(x1
´、y1´)〜P4´(X4´、y4´)を式(1.
1)に代入することで得られる連立方程式を解くことに
より算出することができる。なお、逆透視変換について
は、「テレビジョン画像工学ハンドブック」(テレビジ
ョン学会編、オーム社)の462頁に詳述されている。
【0028】逆透視変換行列評価部33dは、逆透視変
換行列算出部33cで算出された逆透視変換行列によ
り、正しく透視歪みの補正ができるか否かを評価値を用
いて評価する部分である。評価の結果が評価値を満たし
ていれば、その逆透視変換行列を採用し、評価値を満た
さない場合には、この評価の結果に基づき、再度変換元
四辺形領域推定部33aにより、新たな変換元四辺形領
域を推定し、評価値を満たす逆透視変換行列が得られる
まで繰り返す。詳細な手順は後述する。(変換元四辺形
領域推定部33a)
【0029】次に、変換元四辺形領域推定部33aにお
ける変換元四辺形領域の推定処理の詳細を、図11に基
づいて説明する。まず、変換元四辺形領域11aを設定
する際の基準となる基準文字行を選択する(S33
1)。文字行抽出部32で抽出された文字行の集合の中
から、横書きの属性を持つ任意の2つの文字行をピック
アップし、この2つの文字行を基準文字行として評価値
Vを計算する。この評価値Vは、文字行の長さの平均を
L、文字行同士の間隔をI、文字行に含まれる文字矩形
の高さの分散をH、文字行内の各文字矩形において、近
接する文字矩形の中心を結んだ線分のなす角度の平均を
Aとした場合、次の式で表わされる。
【0030】
【数2】V=(w1*L+w2*I)/(w3*H+w
4*A) (ただし、w1−w4は重み係数)
【0031】この評価値Vは、L、Iが大きくなるほ
ど、大きくなる。この評価値Vを、すべての文字行の組
合せに対して計算し、評価値Vが最大となるような一対
の文字行を選択する。なお、評価値Vが特定の閾値以上
となる一対の文字行が存在しない場合には、文字行の長
さなどを基づいて1つだけ文字行を選択し、これを基準
文字行とする。
【0032】S331で基準文字行が選択されると、次
は変換元四辺形領域の上辺、下辺の推定手順に移行する
(S332)。この手順は、基準文字行が一対の文字行
の場合と、1つの文字行である場合とで、処理方法が異
なっている。基準文字行が一対の文字行の場合には、図
12に示すように、一対の文字行43,44のそれぞれ
に近似する直線LO,LUを、Hough変換や最小自
乗法などの公知の手法により求める。基準文字行が1つ
の文字行である場合には、図13に示すように、基準文
字行としての当該1つの文字行の上方、下方に接する直
線を求め、これをLU,LOとする。
【0033】続くS333では、変換元四辺形領域の左
辺LL,右辺LRを推定する。図14は、この左辺L
L、右辺LRの推定処理の詳細を示すフローチャートで
ある。この手順は、基準文字行が2つの場合でも(図1
2)1つの場合でも(図13)略同一であるので、ここ
では、基準文字行が2つであるものとして説明する。こ
のステップでは、図15に示すように、左辺LL、右辺
LRを、回転基準点PL(xL、yL)、PR(xR、
yR)を中心に回転させることにより設定している。具
体的には、まず、回転基準点PL、PRの有無を確認し
(S333−1)、無い場合には、回転基準点PL、P
Rを定義する(S333−2)。
【0034】PL、PRの定義は、以下のようにして行
う。まず、画像の縦方向に平行な2本の直線LLO、L
ROを定義する。直線LLO、LROは、基準文字行が
2つあるときは、基準文字行のいずれか1つに接するよ
うに定義される。次に、この直線LLO,LROと、直
線LO,LUとの交点P1(x1、y1)、P2(x
2、y2)、P3(x3、y3)、P4(x4、y4)
を求める。そして、この交点P1とP4の中点、交点P
2とP3の中点をそれぞれPL(xL、yL)、PR
(xR、yR)として定義する。
【0035】次に、直線LL、LRを、回転基準点P
L,PRを中心に回転させて(S333−3)これによ
り、直線LL、LRが画面縦方向(具体的には直線LL
O,LRO)と為す角度θL、θRを変化させて、交点
P1〜P4を更新する。これにより、左辺LL、LRが
決定される。
【0036】(変換先矩形領域推定部33b)次に、変
換先矩形領域推定部33bの機能を、図16に示すフロ
ーチャートに基づいて説明する。まず、変換元四辺形領
域の各辺の長さh1、h2(縦方向の辺の長さ、図10
参照)、w1、w2(横方向の辺の長さ、図10参照)
を計算する(S334)。次に、変換元四辺形領域の縦
横比w/hを計算する(S335)。
【0037】続いて、変換先矩形領域の幅w´、高さh
´(図10参照)を推定し、その縦横比w´/h´を計
算する(S336)。w´、h´の推定は、次のように
して行われる。max(w1、w2)>max(h1,h2)の
ときは、w´、h´は次の式により推定される。
【0038】
【数2】w´=max(w1、w2) h´=max(h1,h2)×(min(w1、w2)/max
(w1、w2))
【0039】一方、max(w1、w2)<max(h1,h
2)のときは、w´、h´は次の式により推定される。
【数3】w´=max(w1、w2)×(min(h1、h
2)/max(h1、h2)) h´=max(h1,h2)
【0040】次に、変換後矩形領域の四隅の座標P1´
(x1´、y1´)、P2´(x2´、y2´)、P3
´(x3´、y3´)、P4´(x4´、y4´)を、
以下のようにして決定する。 P1´(x1´、y1´)=(x1、y1) P2´(x2´、y2´)=(x1+w´、y1) P3´(x3´、y3´)=(x1+w´、y1+h
´) P4´(x4´、y4´)=(x1、y1+h´)
【0041】(逆透視変換行列算出部33c)こうして
変換元四辺形領域、変換先矩形領域が推定されると、逆
透視変換行列算出部33cは、この推定の結果に基づい
て、上述の〔数1〕の要領により、逆透視変換行列Hを
算出する。
【0042】(逆透視変換行列評価部33d)次に、逆
透視変換行列評価部33dでの処理の詳細を、図17に
示すフローチャートに基づいて説明する。まず、変換元
画像中の、基準文字行の部分の画像のみを取り出した部
分画像を作成し、これを基準文字行画像とする(S33
d−1)。次に、この基準文字行画像を、逆透視変換行
列算出部33cで求めた逆透視変換行列Hで逆透視変換
する(33d−2)。そして、この逆透視変換後の画像
中に含まれる文字に対し、文字認識を実行する(S33
d−3)。文字認識処理手法には公知のものを使用する
ことができ、例えば、次のような手順で文字認識を行
い、評価値Vを計算することができる。 1.基準文字行画像の黒連結画素全体に外接矩形を検出
する。 2.この外接矩形を1文字単位で切り分ける。 3.各文字と文字認識辞書との類似度を計算する。 4.各文字の類似度を平均したものを評価値Vとする。
【0043】そして、この算出された評価値Vを判定
し、最適な値と判断されれば、その逆透視変換行列Hを
採択し、画像補正部34に渡す(S33d−6)。評価
基準を満たさない場合には、変換元四辺形領域推定部3
3aにて、再度四辺形領域の左辺LL、右辺LRの設定
を行わせる。最適の逆透視変換行列Hか否かの判定にお
いては、総当りで処理してその評価値Vが最大となる行
列Hを選択するようにしてもよいし、公知のアルゴリズ
ムである山登り法などの手法を用いて計算コストを削減
してもよい。
【0044】上述の図17では、基準文字行画像に文字
認識を実行し、その結果に基づいて、逆透視変換行列H
の適否を判断していたが、図18に示すように、白画素
連結数の計算を行い(S33d−3´)、連結数の評価
を示す評価値V2を算出し(S33d−4´)、この評
価値V2に基づいて逆透視変換行列Hの適否を判定する
ようにしてもよい。ここで最大白画素連結数とは、画像
を垂直方向に1列ずつ分割し、各列において連結してい
る白画素数の最大値を表わす。図18において、S33
d−3´、S33d−4´以外のステップは図17と共
通であるので、図17と同一の符号を付してその説明は
省略する。
【0045】図19(a)は、正しく透視歪みの補正が
された場合の変換先画像、及び位置と最大白画素連結数
との関係を示すグラフを、同図(b)は正しく透視歪み
の補正がされなかった場合の変換先画像、及び位置と最
大白画素連結数との関係を示すグラフを示している。図
19中のグラフに示すように、前者と後者とでは、最大
白画素連結数の分布が異なってくる。このため、画像の
垂直方向の各列における最大白画素連結数の平均及び分
散、又は最大白画素連結数が閾値を超えた列の数などを
用いて評価値V2を算出する。なお、図17に示すよう
な文字認識による方法と、図18に示すような最大白画
素連結数による判断方法とを併用するようにしてもよ
い。
【0046】〔第2の実施の形態〕次に、本発明の第2
の実施の形態を、図20に基づいて説明する。図20
は、この第2の実施の形態のソフトウエア構成を示すブ
ロック図である。第1の実施の形態と同一の部分につい
ては同一の番号を付し、その説明は省略する。この第2
の実施の形態の画像処理装置は、画像入力部31より入
力された変換元画像の中から、さらに画像を選択する画
像選択部38を備えており、この画像選択部38で選択
された画像を、文字行抽出部32、透視歪み検出部3
3、画像補正部34の処理の対象とする。そして、この
画像補正部34により補正された変換先画像、及び補正
前の変換先画像とは、画像表示部39において表示され
る。
【0047】また、本実施の形態の画像処理装置は、こ
の画像表示部39で表示された画像を目視で評価し、補
正誤りを起こした変換先画像に対して手動で透視歪みを
補正する手動補正部40を備えている。手動補正部とし
ては、変換元画像中の変換元四辺形領域の四隅の座標値
を数値入力するキーボード、マウスなどの入力装置が採
用できる。
【0048】この手動歪み補正部40での処理の詳細
を、図21のフローチャートにより説明する。まず、画
像表示部39に、画像補正部34で補正された変換先画
像を表示させ、オペレータに表示された画像を目視させ
る。オペレータは、表示内容に基づき、否かを判定する
(S11)。正しいと判定された場合には、その変換先
画像を文字認識部35へ渡す。一方、目視の結果、正し
く補正されたものでない(補正誤りがある)と判定され
た場合には、その透視歪みの補正を手動歪み補正部40
により行う。まず、オペレータにより、変換元四辺形領
域の四隅の座標が指定される(S12)。この四隅の座
標の指定により、変換元四辺形領域の形状が決定される
ので、次のS13において、この変換元四辺形領域のデ
ータに基づいて、第1の実施の形態で説明したのと同一
の手法により変換先矩形領域が推定され(S13)、続
いて逆透視変換行列Hが算出される(S14)。
【0049】そして、この算出された逆透視変換行列H
に基づき画像の補正がなされる(S15)。この補正結
果としての変換先画像が画像表示部39に表示されるの
で、オペレータは、再度この表示画像を目視により判定
し(S16)、正しく補正されていると判定される場合
には、その補正結果を文字認識部35に渡す(S1
7)。補正されていないと判定される場合には、S12
に戻って同様の手順を繰り返す。
【0050】この第2の実施の形態によれば、デジタル
カメラなどで撮影した画像から認識したい任意の画像を
画像選択部38により選択して処理するため、入力デー
タの大きさを小さくすることができ、処理時間が短縮化
される。また、もともと歪んでいない変換元画像を無理
に透視歪み補正してしまい、文字認識精度が逆に悪化さ
せてしまうことを防ぐことができる。また、補正誤りの
画像についても簡単な操作により手動で補正し、正しい
補正画像で入力できるため、構造化データ記憶部37に
格納されるデータの信頼性を向上させることができる。
【0051】〔第3の実施の形態〕次に、本発明の第3
の実施の形態を、図22乃至図26に基づいて説明す
る。本実施の形態では、図22に示すように、文字行抽
出部32において、文字矩形の抽出(S3)の後、文字
行の抽出(S4)に移行する前に、文字矩形密度が最大
となるような文章領域を抽出し(S5)、この抽出結果
に基づいて文字行の抽出を行うようにしている点が、第
1の実施の形態(図3参照)と異なる。この文章領域の
抽出処理の詳細を、図23に基づいて説明する。まず、
S3で抽出された多数の文字矩形の高さ・幅の平均・分
散を算出する(S5−1)。次に、この結果に基づい
て、文章領域サイズを設定するとともに(S5−2)、
文章領域の位置を設定する(S5−3)。続いて、設定
された文章領域内の文字矩形密度の算出する(S5−
4)。ここでの密度は、例えば以下のような式により求
められる。 密度=(文章領域内の文字矩形の面積の和)/(文章領
域の面積) このようにして、この密度が最大となるような文章領域
を選択して終了する(S5−5)。
【0052】また、本実施の形態では、透視歪み検出部
34での処理内容が第1の実施の形態と異なっている。
すなわち、第1の実施の形態では、図9に示すように、
まず変換元四辺形領域、変換先矩形領域を推定し、この
推定結果に基づいて逆透視変換行列Hを算出し、この行
列Hを逆透視変換行列評価部33dにおいて評価するよ
うにしていた。そして、評価の結果が基準を満たさない
場合に、再度変換元四辺形領域推定部33aに戻り、同
じ手順をループ的に繰り返す、ということを行ってい
る。これに対し、本実施の形態では、この逆透視変換行
列の評価やループの手順を行わず、大きく分けて2つの
ステップ(図25に示すS100、S200)により最
適な逆透視変換がなされるようにしている。また、図2
4に示すように、変換先画像の文字間の余白に描くこと
のできる直線(以下、「文字間余白曲線」という)に基
づいて、変換元四辺形領域の適否が判断される。
【0053】すなわち、図25に示すように、この実施
の形態では、最初に基準文字行のみに基づいて推定され
る「初期変換元四辺形領域」を推定する(S21)。こ
の初期変換元四辺形推定領域の推定手順を図26で更に
詳細に説明する。まず、初期変換元四辺形領域を設定す
る際の基準となる基準文字行を変換元画像上で選択する
(S21−1)。次に、この基準文字行に基づいて、初
期変換元四辺形領域の上辺・右辺を推定する(S21−
2)。続いて、初期変換元四辺形領域の左辺・右辺を画
面に垂直な線に設定する(S21−3)。
【0054】図25に戻って、推定された初期変換元四
辺形領域に基づいて、変換先矩形領域を推定し(S2
2)、次いでこの初期変換元四辺形領域及び変換先矩形
領域に基づき、逆透視変換行列Hを算出する(S2
3)。そして、この行列Hにより、実際に変換元画像を
逆透視変換して変換先画像を取得する(S24)。そし
て、この変換先画像の文章領域内において、文字間余白
直線(図24)を推定する(S25)。そして、変換先
画像の左側、右側のそれぞれにおいて、文字間余白直線
の傾きの平均値を算出し、この算出値に基づいて、変換
元四辺形領域の左辺、右辺を推定する(S26)。こう
して新たに推定された変換元四辺形領域に基づき、新た
な変換先矩形領域を推定し(S27)、さらにこの変換
元推定領域、変換先矩形領域に基づき逆透視変換行列H
も新たに算出され(S28)、逆透視変換がなされる
(S29)。この図25に示す手順では、S100にお
いてまず変換元四辺形領域の上辺、下辺方向を基準文字
行のみに基づいて確定し、続くS200において、一旦
仮に取得した変換先画像の文字間余白直線を推定するこ
とにより、変換元四辺形領域の左辺、右辺も確定する、
という手順をとっている。このため、同じ手順を何度も
繰り返す必要がなく、短時間で擬似正面画像を得ること
ができる。
【0055】以上、横書きの文章に関する画像処理の例
を示したが、本発明は縦書きの文章にも適用可能である
ことはいうまでもない。この場合、図11に示す変換元
四辺形領域の推定の処理は、まず変換元四辺形領域の右
辺、左辺を推定し、その後、変換元四辺形領域の上辺、
下辺を推定することになり、S333がS332に先行
して実行されることになる。また、上記の実施の形態で
はパーソナルコンピュータ(PC)を利用して画像処理
装置を構成しているが、PC以外でも、例えばカメラ付
き携帯電話やPDAなどによっても実現可能である。
【0056】
【発明の効果】以上説明したように、本発明によれば、
垂直、水平方向の両方向にずれて撮影したような場合で
も、擬似正面画像を自動的に得られることがから、画像
撮影位置の自由性を高めることができる。また、一枚の
撮影画像のみで擬似正面画像に変換できるため、撮影時
の負担を最小限に抑えることが出来る。さらに、パネル
の一部の文章など、画像中に矩形領域を示す明確な線分
が存在しない様々な撮影対象に対して適応することが可
能になる。
【図面の簡単な説明】
【図1】 本発明の第1の実施の形態に係る画像処理装
置のハードウエア構成を示すブロック図である。
【図2】 本発明の第1の実施の形態に係る画像処理装
置の機能を示す機能ブロック図である。
【図3】 図2に示す文字行抽出部32での処理の詳細
を示すフローチャートである。
【図4】 図3に示すS3(文字矩形の抽出)での処理
を更に詳細に示すフローチャートである。
【図5】 図3に示すS3(文字矩形の抽出)で抽出さ
れた文字矩形の例を示す。
【図6】 図3に示すS4(文字行の抽出)での処理を
更に詳細に示すフローチャートである。
【図7】 図3に示すS4(文字行の抽出)における不
連続な文字矩形連結誤り部分の棄却処理を概念的に示し
た図である。
【図8】 図3に示すS4(文字行の抽出)における不
連続な連結文字矩形の統合処理を概念的に示した図であ
る。
【図9】 図2に示す透視歪み検出部33の詳細な構成
を示すブロック図である。
【図10】 透視歪み検出部33での処理を概念的に示
した図である。
【図11】 図9に示す変換元四辺形領域推定部33a
での処理の詳細を示すフローチャートである。
【図12】 図11に示すS332(変換元四辺形領域
の上辺・下辺の推定)の手順を概念的に示した図であ
る。
【図13】 図11に示すS332(変換元四辺形領域
の上辺・下辺の推定)の手順を概念的に示した図であ
る。
【図14】 図11に示すS333(変換元四辺形領域
の左辺・右辺の推定)の手順を更に詳細に示すフローチ
ャートである。
【図15】 図15のフローチャートに示す手順を概念
的に示したものである。
【図16】 図9に示す変換先矩形領域推定部33bで
の処理の詳細を示すフローチャートである。
【図17】 図9に示す逆透視変換行列評価部33dに
おける処理の詳細の一例を示すフローチャートである。
【図18】 図9に示す逆透視変換行列評価部33dに
おける処理の詳細の他の例を示すフローチャートである
【図19】 図18に関連して、最大白画素連結数の変
化と画像の歪み具合との関連を示す図である。
【図20】 本発明の第2の実施の形態に係る画像処理
装置のソフトウエア構成を示す機能ブロック図である。
【図21】 図20に示す手動歪み補正部40での処理
の詳細を示すフローチャートである。
【図22】 本発明の第3の実施の形態に係る画像処理
装置における文字行抽出部32での処理の詳細を示すフ
ローチャートである。
【図23】 図22のS5(文章領域抽出)での処理を
更に詳細に示すフローチャートである。
【図24】 文字間余白直線の一例を概念的に示す。
【図25】 本発明の第3の実施の形態に係る画像処理
装置におけるデータ処理の手順の詳細を示すフローチャ
ートである。
【図26】 図25のS21(初期変換元四辺形領域推
定)の手順の詳細を示すフローチャートである。
【符号の説明】
11・・・I/F、 12・・・ROM、 13・・・RAM、
14・・・HDD、 15・・・I/F、 16・・・I/
F、 17・・・画像メモリ、 18・・・表示制御部、19
・・・表示部、 20・・・I/F、 31・・・画像入力部、
32・・・文字行抽出部、 33・・・透視歪み検出部、
34・・・画像補正部、 35・・・文字認識部、36・・・画
像構造化部、 37・・・構造化データ記憶部、33a・・・
変換元四辺形領域推定部、33b・・・変換先矩形領域推
定部、 33c・・・逆透視変換行列算出部、 33d・・・
逆透視変換行列評価部、 41・・・変換元四辺形領域、
42・・・変換先矩形領域、LO・・・上辺直線、 LU・・
・下辺直線・・・、 LL・・・左辺直線、 LR・・・右辺直線
P1−P4・・・交点
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B029 BB02 EE01 5B057 BA02 CA12 CA16 CB12 CB16 CD12

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 光学的に取得された画像を変換元画像と
    して入力する画像入力手段と、 入力された変換元画像から文字行を抽出する文字行抽出
    手段と、 前記文字行の分布から変換元画像の透視歪みを検出する
    透視歪み検出手段と、 前記透視歪みを補正して変換先画像を生成するための逆
    透視変換行列を算出する逆透視変換行列算出手段と、 前記逆透視変換行列を用いて前記変換元画像を補正して
    前記変換先画像とする補正手段と、 前記変換先画像に含まれる文字を文字認識する文字認識
    手段と、 前記変換先画像と文字認識結果とを関連付けて構造化す
    る構造化手段と、 構造化したデータを記憶する記憶手段とを備えたことを
    特徴とする画像処理装置。
  2. 【請求項2】 前記透視歪み検出手段は、 前記文字行抽出手段により抽出された1つの文字行又は
    一対の文字行の領域を示す変換元四辺形領域を推定する
    変換元四辺形領域推定手段と、 この変換元四辺形領域を用いて変換先画像の矩形領域を
    推定する変換先矩形領域推定手段とを備え、 前記逆透視変換行列算出手段は、変換元四辺形領域と変
    換先矩形領域とを用いて前記逆透視変換行列を算出する
    ようにされた請求項1に記載の画像処理装置。
  3. 【請求項3】 前記逆透視変換行列算出手段により算出
    された前記逆透視変換行列を評価し、該逆透視変換行列
    の採用の可否を判定する逆透視変換行列評価手段を備え
    た請求項1に記載の画像処理装置。
  4. 【請求項4】 前記逆透視変換行列評価手段は、前記文
    字認識手段で文字認識した文字認識結果に基づき前記逆
    透視変換行列を評価するように構成された請求項3に記
    載の画像処理装置。
  5. 【請求項5】 前記逆透視変換行列評価手段は、前記変
    換先画像における白画素の分布状況に基づき前記逆透視
    変換行列を評価するように構成された請求項3に記載の
    画像処理装置。
  6. 【請求項6】 前記文字行抽出手段は、入力された変換
    元画像を二値化処理する二値化処理手段と、 二値化された画像から文字矩形を抽出する文字矩形抽出
    手段と、 予め設定された結合条件に従って隣接する前記文字矩形
    同士を連結する文字矩形連結手段と、 文字矩形を連結してなる連結文字矩形から連結誤り部分
    を検出して該連結誤り部分を棄却する連結誤り部分棄却
    手段と、 前記連結文字矩形を統合する連結文字矩形統合手段とを
    備えた請求項1に記載の画像処理装置。
  7. 【請求項7】 前記変換元画像と前記変換先画像を表示
    する画像表示手段と、 オペレータに画像表示手段に表示された画像に基づいて
    前記変換元四辺形領域を手動で補正させる手動補正手段
    とを備えた請求項2に記載の画像処理装置。
  8. 【請求項8】 光学的に取得された画像を変換元画像と
    して入力する画像入力ステップと、 入力された変換元画像から文字行を抽出する文字行抽出
    ステップと、 前記文字行の分布から変換元画像の透視歪みを検出する
    透視歪み検出ステップと、 前記透視歪みを補正して変換先画像を生成するための逆
    透視変換行列を算出する逆透視変換行列算出ステップ
    と、 前記逆透視変換行列を用いて前記変換元画像を補正して
    前記変換先画像とする補正ステップと、 前記変換先画像に含まれる文字を文字認識する文字認識
    ステップと、 前記変換先画像と文字認識結果とを関連付けて構造化す
    る構造化ステップと、 構造化したデータを記憶する記憶ステップとを備えたこ
    とを特徴とする画像処理方法。
  9. 【請求項9】 前記透視歪み検出ステップは、 前記文字行抽出ステップで抽出された1つの文字行又は
    一対の文字行の領域を示す変換元四辺形領域を推定する
    変換元四辺形領域推定ステップと、 この変換元四辺形領域を用いて変換先画像の矩形領域を
    推定する変換先矩形領域推定ステップとを備え、 前記逆透視変換行列算出ステップは、変換元四辺形領域
    と変換先矩形領域とを用いて前記逆透視変換行列を算出
    するようにされた請求項8に記載の画像処理方法。
  10. 【請求項10】 前記逆透視変換行列算出ステップにお
    いて算出された前記逆透視変換行列を評価し、該逆透視
    変換行列の採用の可否を判定する逆透視変換行列評価ス
    テップを備えた請求項8に記載の画像処理方法。
  11. 【請求項11】 前記逆透視変換行列評価ステップは、
    前記文字認識ステップでの文字認識結果に基づき前記逆
    透視変換行列を評価するように構成された請求項9に記
    載の画像処理方法。
  12. 【請求項12】 前記逆透視変換行列評価ステップは、
    前記変換先画像における白画素の分布状況に基づき前記
    逆透視変換行列を評価するように構成された請求項9に
    記載の画像処理方法。
  13. 【請求項13】 前記文字行抽出ステップは、入力され
    た変換元画像を二値化処理する二値化処理ステップと、 二値化された画像から文字矩形を抽出する文字矩形抽出
    ステップと、 予め設定された結合条件に従って隣接する前記文字矩形
    同士を連結する文字矩形連結ステップと、 文字矩形を連結してなる連結文字矩形から連結誤り部分
    を検出して該連結誤り部分を棄却する連結誤り部分棄却
    ステップと、 前記連結文字矩形を統合する連結文字矩形統合ステップ
    とを備えた請求項8に記載の画像処理方法。
JP2002089496A 2002-03-27 2002-03-27 画像処理装置及び画像処理方法 Expired - Lifetime JP3866600B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002089496A JP3866600B2 (ja) 2002-03-27 2002-03-27 画像処理装置及び画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002089496A JP3866600B2 (ja) 2002-03-27 2002-03-27 画像処理装置及び画像処理方法

Publications (2)

Publication Number Publication Date
JP2003288588A true JP2003288588A (ja) 2003-10-10
JP3866600B2 JP3866600B2 (ja) 2007-01-10

Family

ID=29235065

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002089496A Expired - Lifetime JP3866600B2 (ja) 2002-03-27 2002-03-27 画像処理装置及び画像処理方法

Country Status (1)

Country Link
JP (1) JP3866600B2 (ja)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005122323A (ja) * 2003-10-14 2005-05-12 Casio Comput Co Ltd 撮影装置、画像処理装置、撮影装置の画像処理方法及びプログラム
JP2005122320A (ja) * 2003-10-14 2005-05-12 Casio Comput Co Ltd 撮影装置、その画像処理方法及びプログラム
JP2007172227A (ja) * 2005-12-21 2007-07-05 Mitsubishi Electric Corp 文字読取装置
US7619663B2 (en) 2004-03-19 2009-11-17 Casio Computer Co., Ltd. Image processing apparatus for correcting distortion of image and image shooting apparatus for correcting distortion of shot image
JP2012022575A (ja) * 2010-07-15 2012-02-02 Canon Inc 画像処理装置、画像処理方法及びプログラム
JP2013020302A (ja) * 2011-07-07 2013-01-31 Takanao Handa 帳票認識システム
KR101259550B1 (ko) * 2010-06-03 2013-04-30 한국전자통신연구원 원근왜곡 보정을 통한 영상대조 방법 및 장치
WO2014033848A1 (ja) * 2012-08-29 2014-03-06 株式会社日立製作所 キャリブレーション装置及びキャリブレーション方法
KR101878256B1 (ko) * 2016-12-15 2018-07-13 서울대학교산학협력단 문자를 포함하는 영상의 평활화 방법 및 장치
CN109948135A (zh) * 2019-03-26 2019-06-28 厦门商集网络科技有限责任公司 一种基于表格特征归一化图像的方法及设备
JP2020030576A (ja) * 2018-08-22 2020-02-27 株式会社両備システムソリューションズ 画像処理装置
CN111243081A (zh) * 2020-01-08 2020-06-05 广西医科大学附属口腔医院 一种数字化椅旁树脂充填导板的制作方法及导板
WO2020228593A1 (zh) * 2019-05-15 2020-11-19 阿里巴巴集团控股有限公司 确定图片中目标物类别的方法及装置
WO2023241495A1 (zh) * 2022-06-17 2023-12-21 维沃移动通信有限公司 拍摄方法及其装置
JP7444822B2 (ja) 2021-08-27 2024-03-06 Kddi株式会社 コード提供装置、コード提供方法及びコード提供プログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101267493B (zh) 2007-03-16 2011-01-19 富士通株式会社 透视变形文档图像的校正装置和校正方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000357287A (ja) * 1999-06-15 2000-12-26 Matsushita Electric Ind Co Ltd ナンバープレート認識方法および認識装置
JP2002015283A (ja) * 2000-04-26 2002-01-18 Fujitsu Ltd 分離文字列統合方法および装置
JP2002057879A (ja) * 2000-08-10 2002-02-22 Ricoh Co Ltd 画像処理装置と画像処理方法及びコンピュータ読み取り可能な記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000357287A (ja) * 1999-06-15 2000-12-26 Matsushita Electric Ind Co Ltd ナンバープレート認識方法および認識装置
JP2002015283A (ja) * 2000-04-26 2002-01-18 Fujitsu Ltd 分離文字列統合方法および装置
JP2002057879A (ja) * 2000-08-10 2002-02-22 Ricoh Co Ltd 画像処理装置と画像処理方法及びコンピュータ読み取り可能な記録媒体

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
野嶽圭宏: "幾何学的歪みをうけた文字の認識", 1999年電子情報通信学会総合大会講演論文集, JPN4006010265, 1999, JP, pages 206, ISSN: 0000748369 *
野嶽圭宏: "幾何学的歪みをうけた文字の認識", 1999年電子情報通信学会総合大会講演論文集, JPNX006045170, 1999, JP, pages 206, ISSN: 0000777024 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005122323A (ja) * 2003-10-14 2005-05-12 Casio Comput Co Ltd 撮影装置、画像処理装置、撮影装置の画像処理方法及びプログラム
JP2005122320A (ja) * 2003-10-14 2005-05-12 Casio Comput Co Ltd 撮影装置、その画像処理方法及びプログラム
US7607783B2 (en) 2003-10-14 2009-10-27 Casio Computer Co., Ltd. Imaging apparatus, image processing apparatus, image processing method of imaging apparatus and computer program
US7619663B2 (en) 2004-03-19 2009-11-17 Casio Computer Co., Ltd. Image processing apparatus for correcting distortion of image and image shooting apparatus for correcting distortion of shot image
JP2007172227A (ja) * 2005-12-21 2007-07-05 Mitsubishi Electric Corp 文字読取装置
KR101259550B1 (ko) * 2010-06-03 2013-04-30 한국전자통신연구원 원근왜곡 보정을 통한 영상대조 방법 및 장치
JP2012022575A (ja) * 2010-07-15 2012-02-02 Canon Inc 画像処理装置、画像処理方法及びプログラム
JP2013020302A (ja) * 2011-07-07 2013-01-31 Takanao Handa 帳票認識システム
WO2014033848A1 (ja) * 2012-08-29 2014-03-06 株式会社日立製作所 キャリブレーション装置及びキャリブレーション方法
JPWO2014033848A1 (ja) * 2012-08-29 2016-08-08 株式会社日立製作所 キャリブレーション装置及びキャリブレーション方法
KR101878256B1 (ko) * 2016-12-15 2018-07-13 서울대학교산학협력단 문자를 포함하는 영상의 평활화 방법 및 장치
JP2020030576A (ja) * 2018-08-22 2020-02-27 株式会社両備システムソリューションズ 画像処理装置
CN109948135A (zh) * 2019-03-26 2019-06-28 厦门商集网络科技有限责任公司 一种基于表格特征归一化图像的方法及设备
CN109948135B (zh) * 2019-03-26 2022-11-08 厦门商集网络科技有限责任公司 一种基于表格特征归一化图像的方法及设备
WO2020228593A1 (zh) * 2019-05-15 2020-11-19 阿里巴巴集团控股有限公司 确定图片中目标物类别的方法及装置
CN111243081A (zh) * 2020-01-08 2020-06-05 广西医科大学附属口腔医院 一种数字化椅旁树脂充填导板的制作方法及导板
JP7444822B2 (ja) 2021-08-27 2024-03-06 Kddi株式会社 コード提供装置、コード提供方法及びコード提供プログラム
WO2023241495A1 (zh) * 2022-06-17 2023-12-21 维沃移动通信有限公司 拍摄方法及其装置

Also Published As

Publication number Publication date
JP3866600B2 (ja) 2007-01-10

Similar Documents

Publication Publication Date Title
JP2003288588A (ja) 画像処理装置及び画像処理方法
US7095432B2 (en) Image processing apparatus and method
US9547791B2 (en) Image processing system, image processing apparatus, image processing method, and program
JP4525519B2 (ja) 四辺形評価方法及び装置及びプログラム
US8170368B2 (en) Correcting device and method for perspective transformed document images
US20120092329A1 (en) Text-based 3d augmented reality
WO2006131967A1 (ja) 画像処理装置
US7415140B2 (en) Method of correcting deviation of detection position for human face, correction system, and correction program
US20170193322A1 (en) Optical reading of external segmented display
TWI571828B (zh) 光學導航方法以及相關裝置
JP5251410B2 (ja) カメラワーク算出プログラム、撮像装置及びカメラワーク算出方法
JP5171421B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2018092354A (ja) 物体検出装置および物体検出方法
JP3659426B2 (ja) エツジ検出方法及びエツジ検出装置
JP2006318151A (ja) デジタル画像表示機器及びデジタル画像表示方法
JP6304619B2 (ja) 像振れ補正システム、プログラム及び方法
JP4145014B2 (ja) 画像処理装置
JP2005011097A (ja) 顔有無判定装置及び顔有無判定プログラム
JP4970385B2 (ja) 2次元コード読取装置とそのプログラム
CN111354088A (zh) 环境地图建立方法以及其系统
CN111698411A (zh) 脸部影像自动检测与拍摄方法
CN115827812A (zh) 重定位方法、装置、设备及其存储介质
KR101524074B1 (ko) 영상 처리 방법
CN111563883B (zh) 屏幕视觉定位方法、定位设备及存储介质
JP4696239B2 (ja) 文字列の傾斜補正方法及び装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060627

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060828

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061003

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061005

R151 Written notification of patent or utility model registration

Ref document number: 3866600

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091013

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101013

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111013

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111013

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121013

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121013

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131013

Year of fee payment: 7

EXPY Cancellation because of completion of term