JPH1069537A - 画像合成方法及び画像合成装置 - Google Patents
画像合成方法及び画像合成装置Info
- Publication number
- JPH1069537A JPH1069537A JP8226879A JP22687996A JPH1069537A JP H1069537 A JPH1069537 A JP H1069537A JP 8226879 A JP8226879 A JP 8226879A JP 22687996 A JP22687996 A JP 22687996A JP H1069537 A JPH1069537 A JP H1069537A
- Authority
- JP
- Japan
- Prior art keywords
- image
- resolution
- super
- images
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
な機械的走査機構を用いずに広範囲の高解像度画像を取
得する。 【解決手段】 低解像度の画像入力デバイスを手動で走
査して、画像入力部10から複数枚のフレーム画像を取
得し、入力された複数枚の前記フレーム画像のそれぞれ
に対して、レイアウト構造解析部31においてレイアウ
ト解析処理を行う。レイアウト構造対応づけ部41で
は、前記レイアウト構造をフレーム画像間で対応づけ、
これに基づきフレーム画像間の相対的なずれを位置ずれ
量として検出する。各物体ごとに画素の大きさ未満の位
置ずれ量を検出し、超解像処理部80において超解像処
理により高解像度の超解像画像を取得する。画像合成部
60において、レイアウト構造に基づき、超解像画像を
つなぎあわせることで広範囲にわたる高解像度画像を生
成する。
Description
えばCCDカメラのような画像入力装置を利用して高解
像度の画像を取得する画像取得方法に関し、特に文書認
識システムにおける文字画像の高解像度化を行う方法に
関する。
るために、複数の画像からひとつの画像を合成する画像
合成方法が用いられている。従来の高解像度画像取得方
法としては、(1)高解像度の部分画像を撮像範囲をオ
ーバラップさせて複数枚入力し、重複部分から画像間の
位置ずれを検出し、画像を接続する方法、(2)低解像
度の全体画像を複数枚入力し、各画像間の位置ずれを検
出することで、画素を内挿する方法が提案されている。
17に記載されている。この論文では、CCDカメラを
手動で移動させながら、入力対象を部分ごとに分けて接
写することで高解像度の部分画像を複数枚入力し、これ
らを接続して広範囲にわたる高解像度画像を取得する方
法を提案している。
部分画像間の位置のずれを検出して、部分画像を接続す
る。ここで、部分画像間の位置ずれ量は、画像を平行移
動しながら画像を重ねあわせて残差の計算を行い、残差
が最小になったときの移動量として検出する。
ー・アイ・エー・ピー予稿、387ページから392ペ
ージ(Proceedings of 8th ICI
AP,pp.387−392)に記載されている。この
論文では、入力対象全体を低解像度の画像として複数枚
入力し、複数の画像を用いて画素間の輝度値を内挿する
ことで、広範囲にわたる高解像度画像を再構成する方法
が提案されている。
挿するためには、各低解像度画像どうしの位置ずれを画
素単位未満(以降で、サブピクセルと呼ぶ)の精度で検
出する必要がある。この論文の方法では位置ずれを検出
する方法として、画像の部分領域どうしの相関値が最大
になるように部分領域の画像を移動、変形して局所的な
対応づけを行う。このとき、局所領域の変形は、最急降
下法を用いて逐次的に最適な変形を探索する。
(1)には下記の2つの問題がある。
め、残差値が最小になる移動量を全ての可能な重ねあわ
せ方について全探索しなければならない。このためには
膨大な計算量が必要となる。
を接続して広範囲にわたる画像を取得するが、全ての部
分画像が所望の解像度を保って高解像度に撮影されてい
る必要がある。このためには、CCDカメラと対象間の
距離を一定距離以内に保った手動走査を行わなくてはな
らない。これにより、手軽で自由度が大きいという手動
走査の利点が損なわれる。
題がある。
相関値が大きくなるように逐次局所画像を変形して画像
間の位置ずれを検出するが、対象の画像が空間的な周期
を持つ場合、正しい位置ずれ量が算出される保証がな
い。たとえば、文書画像を対象とする場合、文字列、文
字、文字のストロークの周期性により、位置ずれ量が誤
って検出される可能性がある。
いような画像にこの手法を適用する場合に検出される位
置ずれ量の精度が劣化しやすい。例えば、文書画像のよ
うに、行間、段間等画像領域のほとんどを背景部の白画
素が占めている場合には、残差、相関の値に極値が現れ
ず位置ずれの検出ができない。
することで解像度の改善を行うが、2枚の画像の移動量
が画素間隔の1/2の場合には解像度を2倍にあげられ
る可能性がある。しかし、2枚の画像の位置ずれ量が0
の場合には解像度は全く改善されない。CCDカメラを
手動により移動した場合には、画素未満の位置ずれ量を
随意に制御することが不可能であり、解像度の改善の度
合いは不安定となる。
カメラ走査を行った場合でも広範囲にわたる高解像度画
像を手軽に取得できる高解像度画像取得方式を提供する
ことにある。
像のような高周波のテクスチャが局在するような画像に
おいても、高速かつ安定に画像の対応づけが行え、広範
囲かつ高解像度な画像を取得可能な高解像度画像取得方
式を提供することにある。
度の改善処理の効果の不安定さを補い、安定に解像度の
向上を実現できる。
度画像取得方式は、まず画像の構造解析を行い、構造情
報の対応づけを行うことで、フレーム画像間の相対的な
位置ずれを検出し、画像の接続を行う。
画像内の物体の特徴と物体間の位置関係を抽出する構造
解析部(図1の30)と、各フレーム画像から抽出され
た構造情報を対応づけ、フレーム画像間の相対的な位置
関係を算出する構造情報対応づけ部(図1の40)とを
有する。
は、文書画像に適用する場合には、構造情報としてレイ
アウト構造を用いる。
列、文字といった物体とその配置の情報からなるレイア
ウト構造を抽出するレイアウト解析部(図3の31)
と、各フレーム画像から抽出されたレイアウト構造を対
応づけ、フレーム画像間の相対的な位置関係を算出する
レイアウト構造対応づけ部(図3の41)とを有する。
は、対応づけられた構造情報に基づき、画像の接続を行
うとともに、画像を構成する物体ごとに画像の解像度を
改善する。
ーム画像から抽出した物体間の画素の大きさ未満の位置
ずれ量であるサブピクセル位置ずれ量を算出する位置ず
れ残差検出部(図5の60)と、サブピクセル位置ずれ
量を考慮して画素間を内挿することで画像の解像度を向
上させる超解像処理部(図5の70)とを有する。
は、対応づけられたレイアウト構造情報に基づき、文書
画像の接続を行うとともに、文書画像を構成する物体ご
とに画像の解像度を改善する。
各フレーム画像から抽出した物体間の画素の大きさ未満
の位置ずれ量であるサブピクセル位置ずれ量を算出する
位置ずれ残差検出部(図7の60)と、サブピクセル位
置ずれ量を考慮して画素間を内挿することで画像の解像
度を向上させる超解像処理部(図5の70)とを有す
る。
は、解像度の改善された物体の画像ごとに文字を認識
し、接続されたレイアウト構造に基づき、文字認識結果
を並び替えることで文書全体の認識を行う。
画像を入力し文字コードに変換する個別文字認識部(図
8の90)と、統合されたレイアウト構造に基づき、文
字コードを文書での記載の順序に並び替える文字認識結
果結合部(図8の81)とを有する。
て抽出された各フレーム画像ごとの構造情報どうしの対
応関係を抽出し、対応関係をもとにフレーム画像どうし
の位置ずれ量を算出する。
析部において抽出された各フレーム画像ごとのレイアウ
ト構造どうしの対応関係を抽出し、対応関係をもとにフ
レーム画像どうしの位置ずれ量を算出する。
基づき、画像の接続を行うのと同時に、画像を構成する
物体ごとに画像の解像度を改善する。
文字画像が入力され、対応する文字コードが出力され
る。
づけ部において対応づけられたレイアウト構造に基づ
き、文字コードを文書の読み取り順に並び替えること
で、文書全体にわたる認識結果を得る。
て説明する。
を示すブロック図である。本発明の第1の実施の形態
は、画像入力デバイスを手動により走査することで得ら
れる画像信号をディジタル化して複数枚の多値のフレー
ム画像として計算機に入力する画像入力部10、計算機
に入力されたフレーム画像を記憶する画像記憶部20、
画像に含まれる物体の構造情報を解析する構造解析部3
0、各フレーム画像から抽出された構造情報どうしの対
応づけを行う構造情報対応づけ部40、構造解析の結果
およびフレーム間で構造情報を構造情報記憶部50及び
対応づけられた構造情報をもとに複数のフレーム画像を
合成する画像合成部60とからなる。
実施の形態の動作について説明する。
て、例えば同図に示した点線のように画像入力デバイス
を移動して、画像入力部10より分割して入力する。
1)(b−2)のようになり、画像記憶部20に記録さ
れる。
される。構造解析部30は、画像の構造情報を解析す
る。例えば、画像を2値化して、黒画素連結成分を抽出
し物体を分離して抽出する。
の位置関係を構造情報として、構造情報記憶部50に出
力し記憶する。
部50に記憶された各フレーム画像の構造情報を入力
し、構造情報を用いて、各フレーム内の対応する物体ど
うしを対応づける。
情報は、対応関係から統合され、統合された構造情報は
構造情報記憶部50に出力される。
もとにフレーム画像を画像記憶部20から取り出して接
合する。
枚の画像が本発明の第1の実施の形態によって合成され
る過程を説明する。
体が同図(b−1)(b−2)のように分割して撮影さ
れ、画像入力部10より入力される。
−2)に示したように構造情報が抽出される。構造情報
として、例えば、個々の物体の形状情報、2つの物体の
相互の位置関係を用いる。
て、「○」、「△」、「□」の各カテゴリを用いる。形
状情報の抽出は、画像上に出現すると考えられる物体の
テンプレート「○」、「△」、「□」等を用意してお
き、各テンプレートを回転、拡大縮小しながら画像とマ
ッチングし、最もよくマッチするテンプレートのカテゴ
リを物体の形状とする。
を同一であると識別できればよく、必ずしも物体とテン
プレートが完全に一致する必要はないので、この例のよ
うに「○」、「△」、「□」といった代表的な形状のテ
ンプレートがあれば良い。例えば、一方の画像で歪んだ
五角形がテンプレート「△」を回転、拡大縮小したもの
と最も良くマッチしたとしても、もう一方の画像の同じ
五角形がテンプレート「△」を同様に回転、拡大縮小し
たものと認識出来ればよく、五角形のテンプレートを用
意する必要はない。
ては、両物体を結ぶ線分の長さ・線分の向き、両物体の
モーメントを用いる。
回転量を回転角として各物体ごとに記憶する。物体内部
に含まれる画素の数を面積として記憶する。各物体の重
心点をもとめ、フレーム画像内に含まれる全ての物体の
うちの2物体の全ての組み合わせについて重心点間を結
ぶベクトルを記憶する。最後に、各フレーム画像の原点
を基準とした各物体の重心点の座標をベクトルとして記
憶する。
角、面積、重心点間のベクトル、重心点のベクトルから
なる情報を構造情報とし、構造情報記憶部50に出力す
る。図2を参照すると、物体は1フレーム目で左から
「△」101、「□」102、「○」103の3個、2
フレーム目では「□」104、「○」105、「□」1
06の3個がそれぞれ検出され、各構造情報は同図(c
−1)(c−2)および図3のようになる。
一方のフレーム画像上に存在する物体のなかから2つの
物体の組を選び、他方の画像上に2つの物体と同じ形状
の物体が含まれる場合には、両フレーム画像から抽出し
た物体の組の相対位置の絶対値の差を計算する。
組について、同様の処理を行い、相対位置の絶対値の差
が最小および2番目に最小となる物体の組をそれぞれ検
索する。各組に関して、フレーム画像の間の相対的な平
行移動量、回転量を計算する。
(c−1)のフレーム画像における物体102の形状お
よび面積は、(c−2)のフレーム画像の物体104と
一致する。また、(c−1)のフレーム画像における物
体103の形状および面積は、(c−2)のフレーム画
像の物体105と一致する。
る物体102と物体103を結ぶベクトルv102の長
さは、(c−2)のフレーム画像の物体104と物体1
03を結ぶベクトルv102の長さと一致する。
て矛盾がないため、物体102と物体104、および物
体103と物体105が一致すると判定する。フレーム
画像間の位置ずれ量sは(x104−x102)、また
は(x105−x103)となり、この値は構造情報記
憶部50に出力される。量子化誤差の影響も考慮して、
例えば両者の平均をとってもいい。この位置ずれ量に基
づき、(c−2)の2枚目のフレーム画像を(c−1)
の1枚目のフレーム画像の座標系に変換して、構造情報
記憶部50に出力する。
ように変換される。ここで、一致する物体は1つの物体
として記憶される。
像および位置ずれ量sを入力し、位置ずれ量を考慮して
2枚のフレーム画像を接続する。この結果、図2(d)
の接続画像が得られる。
される場合は、3枚目に関して構造解析部30におい
て、前記と同様な構造解析処理が施され、構造解析結果
が構造情報記憶部50に出力される。構造情報対応づけ
部40ではこの構造情報と、1枚目と2枚目を統合して
得られた構造情報の間で対応づけを行い、画像合成部6
0でのフレーム画像の接続処理を行う。4枚目以降も同
様に逐次接続処理を行っていく。
によれば、入力された各フレーム画像の構造を解析し構
造情報どうしの対応づけを行うため、フレーム画像の位
置ずれを検出するための相関計算の回数を削減でき、位
置ずれ量の検出精度の向上も実現できる。
参照して詳細に説明する。
書に限定する。図5を参照すると、本発明の第2の実施
の形態の構成は、第1の実施の形態における構造解析部
30はレイアウト構造解析部31に、第1の実施の形態
の構造情報対応づけ部40はレイアウト構造対応づけ部
41に、第1の実施の形態における構造情報記憶部50
はレイアウト構造記憶部51に置換される点で異なる。
力される文書のフレーム画像に、段・文字列・文字等が
どの位置にどのような方向で記述されているかを解析
し、例えば、フレーム−段−文字列−文字というような
階層構造で表現されるレイアウト構造を生成し、これを
レイアウト構造記憶部51に出力する。
造記憶部51に記憶されている複数のフレーム画像から
生成されたレイアウト構造内の一致する物体どうしを対
応づける。ここで、物体とはレイアウト構造の各階層に
相当するフレーム、段、文字列、文字である。
造を1つのレイアウト構造に統合し、構造情報記憶部5
0に出力する。
アウト構造の対応関係から算出し、構造情報記憶部50
に出力する。
造解析部31の出力するレイアウト構造情報を一時記憶
し、レイアウト構造対応づけ部に出力する。
いて複数のフレーム画像から生成されたレイアウト構造
を統合した結果のレイアウト構造を入力し記憶する。
出力するフレーム画像間の位置ずれ情報を入力し記憶す
る。
合成部60に出力される。
参照して詳細に説明する。
10において入力された文書を部分的に撮影して得られ
たフレーム画像に対してレイアウト解析処理を施し、レ
イアウト構造情報を得る。レイアウト解析処理の方法と
しては、例えば、電子情報通信学会論文誌、Vol.J
74−D−II,No.4、491ページから499ペ
ージに記載されている方法を用いることができる。
情報は、レイアウト構造記憶部51に出力され記憶され
る。
ト構造記憶部51に記憶された複数のフレーム画像から
生成されたレイアウト構造情報を入力し、レイアウト構
造の対応づけを行う。
れ、レイアウト構造記憶部51に出力される。このと
き、レイアウト構造の対応関係から、フレーム画像間の
位置ずれ量を算出し、レイアウト構造記憶部51に出力
する。
れた複数枚のフレーム画像と、レイアウト構造記憶部5
1に記憶された位置ずれ量を入力し、フレーム画像を重
ね合わせて一枚の画像に合成する。
本発明の第2の実施の形態によって合成される過程を説
明する。
たように撮像デバイスを移動させながら、(b−1)〜
(b−3)のように分割して撮影された部分的なフレー
ム画像が画像入力部10より入力される。
たフレーム画像に対してレイアウト解析処理が施され、
同図(c−1)〜(c−3)に示したように領域分割さ
れ、各分割領域の属性、各分割領域間の関係が抽出され
る。具体的には、1枚のフレーム画像が複数の「段」
に、1つの「段」が複数の「文字列」に、1つの「文字
列」が複数の「文字」に分割され、それぞれの包含関
係、隣接関係が抽出される。
おけるレイアウト構造と呼ぶ。図6に示した例では、フ
レーム画像内には「段」の数は1である。また、各フレ
ーム画像において含まれる文字列の数は3である。各文
字列に含まれる文字の数は7〜8である。
字どうしの隣接関係を木構造を用いて表現したのが、図
7(d−1)〜(d−3)である。同木構造において、
各ノードは画像内における物体のフレーム画像上での位
置の情報を格納している。また、各ノードの格納順序
は、横書きの場合、左から右、上から下の順に、文書を
読み取る順序に合わせられており、ノードの格納順序で
画像中の物体の隣接関係が表現される。
第1の実施の形態における構造情報対応づけ部40にお
いて構造情報を対応づけるのと同様に物体の対応づけ、
フレーム画像間の位置ずれ検出が行われる。図7(e)
は同図(d−2)と(d−3)の間で行われるレイアウ
ト構造の対応づけを示したものである。この結果とし
て、複数枚のフレーム画像から生成されたレイアウト構
造の木構造情報が統合され、レイアウト構造記憶部51
に出力される。また、フレーム画像間の位置ずれ量も同
時に出力される。以降の処理は本発明の第1の実施の形
態と同様に行われる。
によれば、入力対象を文書としてフレーム画像の構造解
析をレイアウト解析により行っている。レイアウト構造
は印刷文書において安定した構造特徴であり、高速に構
造情報の抽出が可能である。このため、フレーム画像の
位置ずれを検出するための相関計算の回数を削減できる
とともに、位置ずれ量の検出精度を安定に向上させるこ
とができる。
参照して詳細に説明する。
の実施の形態の構成に加えて、位置ずれ残差検出部70
と超解像処理部80とを含んで構成される点で異なる。
部50に記憶されているフレーム画像間の位置ずれ量、
構造情報と、それらの算出に用いられた複数のフレーム
画像を入力し、対応する物体の画像に関して画素の大き
さ未満の精度で位置ずれ量を算出する。これを以降でサ
ブピクセル位置ずれ量と呼ぶ。サブピクセル位置ずれ量
は超解像処理部80に出力される。
置ずれ量、構造情報、フレーム画像、サブピクセル位置
ずれ量を入力する。フレーム画像間の位置ずれ量および
サブピクセル位置ずれ量を考慮してフレーム画像どうし
を重畳し、画素の間を各フレーム画像の輝度値に基づき
内挿することで、解像度を改善した画像を生成する。
参照して詳細に説明する。
応づけ、記憶するまでの処理は本発明の第1の実施の形
態の動作と同じであるためここでは省略する。
を統合して生成された構造情報に基づき、各フレーム画
像から対応する個々の物体の画像を取り出す(図9(a
−1)(a−2))。取り出された物体は所望の解像度
になるように拡大され、位置ずれ残差検出部70におい
て、再度位置ずれ量を検出し、サブピクセル位置ずれ量
とする。サブピクセル位置ずれ量の検出は構造情報の対
応づけを行った方法と同様に、拡大された物体の画像ど
うしを平行移動しながら重畳し、距離値が最も小さくな
ったときの移動量を位置ずれ量とする。
部70で検出されたサブピクセル位置ずれ量を考慮し
て、各フレーム画像の対応する物体の拡大画像を重ねあ
わせ、画素値の内挿処理を行い、物体ごとの高解像度画
像を生成する。これを超解像画像と呼ぶ。
E90−54、23ページから28ページに記載された
方法を用いることができる。
れた超解像画像を構造情報に基づいて配置して全体の画
像を生成する。
の形態により超解像画像を生成する過程を説明する。
である図2を用いる。図2の各フレーム画像を構造解析
し、図9(a−1)(a−2)に示すようにそれぞれの
フレーム画像から対応する物体を取り出す。それぞれの
取り出した物体を拡大すると、同図(b−1)(b−
2)のようになる。拡大された画像どうしでサブピクセ
ル位置ずれ量を検出し、これに基づき両画像を重畳し、
内挿輝度値を内挿することで、図9(c)のような、解
像度が改善された超解像画像を生成する。以上の処理を
画像内の全物体に対して行い画像全域にわたる高解像度
画像を生成する。
によれば、内挿による解像度の改善処理の効果の不安定
さを補い、安定に解像度の向上を実現できる。
を参照して詳細に説明する。
と同様に入力する対象を文書に限定する。本発明の第4
の実施の形態と第2の実施の形態の構成を図10と図5
で比較すると、第4の実施の形態は第2の実施の形態に
加えて位置ずれ残差検出部70と超解像処理部80とを
含んで構成される点で異なる。
0は第3の実施の形態の構成と同様であるため省略す
る。
を参照して詳細に説明する。
造を対応づけ、記憶するまでの処理は本発明の第2の実
施の形態の動作と同じであるためここでは省略する。
た文字を両フレーム画像から取りだし、第3の実施の形
態と同様にサブピクセル位置ずれ量を検出する。
画像をサブピクセル位置ずれ量だけ平行移動して重畳し
た後、内挿処理を行い、超解像画像を生成する。
の形態の一実施例の動作を詳細に説明する。
る。図2の各フレーム画像を構造解析し、図9(a−
1)(a−2)に示すようにそれぞれのフレーム画像か
ら対応する物体を取り出す。(図9では「○」で示され
ているが、本実施の形態の入力対象は文書であるので、
この「○」は本実施例では文字一般を表わす。)それぞ
れの取り出した物体を拡大すると、同図(b−1)(b
−2)のようになる。拡大された画像どうしでサブピク
セル位置ずれ量を検出し、これに基づき両画像を重畳
し、内挿輝度値を内挿することで、図9(c)のよう
な、解像度が改善された超解像画像を生成する。
画像全域にわたる高解像度画像を生成する。
によれば、本発明の第3の実施の形態に加えて、入力対
象を文書とし、フレーム画像の構造解析をレイアウト解
析により行っている。レイアウト構造は印刷文書におい
て安定した構造特徴であり、高速に構造情報の抽出が可
能である。このため、フレーム画像の位置ずれを検出す
るための相関計算の回数を削減できるとともに、位置ず
れ量の検出精度を安定に向上させることができる。
ム画像間の位置ずれ量が画素のサイズの精度で検出され
ているため、超解像処理のためのサブピクセル位置ずれ
量の検出を画像全体に対して行う必要がなく、高速化が
実現される。
それらを処理の対象から外すことができ、高速な超解像
処理が可能となる。
を参照して詳細に説明する。
と同様に文書を処理対象とし、文書内に書かれた文字列
の認識を目的とする場合に限定する。図11を参照する
と、本発明の第4の実施の形態の構成は、第2の実施の
形態の構成に加えて、個別文字認識部90と、文字認識
結果結合部61とを含んで構成される点で異なる。
説明する。
までの処理により解像度が改善された文字の超解像画像
を生成する部分までは第4の実施の形態の構成と同様で
あるため省略する。
の出力する文字ごとの超解像画像を入力し、各文字を対
応する文字コードに変換する。文字認識の方法として
は、例えば、信学技報PRU90−20に記載された方
法を用いることができる。
部90の出力する文字認識結果の文字コードと、レイア
ウト構造対応づけ部41の出力する統合されたレイアウ
ト構造を入力し、文書全面を文字コードに変換したテキ
スト情報を出力する。統合されたレイアウト構造は文字
画像がどのフレームのどの位置に書かれていたものかを
表現しているため、これに従って文字コードを配置し直
す。
文書を入力対象として用いた場合の本発明の第5の実施
の形態の動作を説明する。
より、解像度が改善された超解像文字画像を生成する。
これらはそれぞれ個別文字認識部90に入力され、それ
ぞれ個別文字認識処理によりそれぞれ対応する文字コー
ドに変換される。変換された文字コードをレイアウト構
造対応づけ部41において統合されたレイアウト構造に
したがって図12のように文書の読み取り順に文字コー
ドを配置し直し、文書の認識結果とする。
施の形態によれば、統合したレイアウト構造を用いて文
字認識結果の文字コードを配置し、文書の認識結果とす
る。このため、本発明の第4の実施の形態の効果に加え
て、文字認識処理を文書の全面の画像を再構成すること
なく、広範囲にわたる文書の認識を少ないメモリで行う
ことができる。
る他の処理に比較して、一般に大量の処理時間を必要と
する。このため、個々のフレーム画像を高解像度に取得
し、各フレーム画像内の文字画像をそれぞれ文字認識
し、文字列の接続を行う場合に比較して、処理時間を短
縮することができる。
ではまず第1の実施の形態に基づく実施例を説明し、そ
の後これを元に第2、3、4及び5に基づく実施例を説
明する。
ラ、デジタルビデオカメラ、CCDカメラなどである。
カメラ300を用いて撮像対象を走査するが、走査は一
定の方向、速さで行う必要がなく、手動で行うことが出
来る。
像は複数枚のフレーム画像からなり、これらフレーム画
像はビデオキャプチャボード301を介してパーソナル
コンピュータ302に取り込まれる。
0としての外部記憶装置303に記憶される一方、構造
解析部30として働くパーソナルコンピュータ302に
より図3のような構造情報を抽出され、各フレーム画像
の構造情報は構造情報記憶部50として働く外部記憶装
置303に記憶される。
ナルコンピュータ302は、同一物体を含むフレーム画
像の構造情報を統合して図4のような構造情報を生成す
る。
ピュータ302は、統合して得られた構造情報と、画像
記憶部20として働く外部記憶装置303に記憶された
フレーム画像をもとに、フレーム画像を合成して合成画
像を得る。
イ装置、プリンタなどの出力装置304により表示され
る。
においては、撮像対象が文書に限定されるため、上記の
説明で構造解析部30、構造情報対応づけ部40、構造
情報記憶部50はそれぞれレイアウト構造解析部31、
レイアウト構造対応づけ部41、レイアウト構造記憶部
51に置き換えられる。
においては、超解像画像の挿入が行われるため、上記に
付け加えて、パーソナルコンピュータ302は位置ずれ
残差検出部70および超解像処理部80として機能す
る。
は、超解像処理部80として機能したパーソナルコンピ
ュータ302により、文書中の各文字についての超解像
画像を生成し、これを個別文字認識部90として働くパ
ーソナルコンピュータ302により対応する文字コード
に変換する。文字認識結果結合部61として働くパーソ
ナルコンピュータ302により、文字コードとレイアウ
ト情報から撮像対象の文書が復元され、出力装置304
から出力される。
1と第2の実施例の違いは、カメラ300とビデオキャ
プチャボード301の間にビデオデッキ、DVD(デジ
タルビデオディスク)等の動画像記録装置305が接続
されていることである。このため本実施例はリアルタイ
ムの画像だけではなく、録画された画像についても処理
を行うことが出来る。
を検出するための相関計算の回数を削減でき、位置ずれ
量の検出精度の向上も実現できる。
構造を解析し構造情報どうしの対応づけを行うためであ
る。
検出するための相関計算の回数を削減できるとともに、
位置ずれ量の検出精度が劣化しやすい文書画像に対して
も安定に検出精度を向上させることができる。
おいて安定した構造特徴であり、高速に構造情報の抽出
が可能であるためである。
クセル位置ずれ量の検出を画像全体に対して行う必要が
なく、高速化が実現される。高速な超解像処理が可能と
なる。
フレーム画像間の位置ずれ量が画素のサイズの精度で検
出されているためである。また、文書には多くの空白が
含まれるが、効率よくそれらを処理の対象から外すこと
ができるためである。
善処理の高速化、高精度化が実現される。
フレーム画像間の位置ずれ量が画素のサイズの精度で検
出されているため、超解像処理のためのサブピクセル位
置ずれ量の検出を画像全体に対して行う必要がなく、ま
た、文書には多くの空白が含まれるが、それらを処理の
対象から外すことができるためである。
を少ないメモリで行うことができることである。また、
各フレーム画像内の文字画像をそれぞれ文字認識し、文
字列の接続を行う場合に比較して、処理時間を短縮する
ことができる。
いて文字認識結果の文字コードを配置し、文書の認識結
果とし、文字認識処理を文書の全面の画像を再構成する
ことなく文書の認識処理が行えるためである。
る。
を表す説明図である。
である。
る。
程を表わす図である。
程を表わす図である。
る。
る。
る。
る。
明図である。
Claims (10)
- 【請求項1】 複数の画像からひとつの画像を合成する
画像合成方法において、 前記複数枚のフレーム画像のそれぞれに対して、フレー
ム画像内の各物体の検出及び検出された各物体について
物体の特徴と物体相互の位置関係からなる構造情報の抽
出を行う構造解析段階と、 前記構造情報を前記複数枚のフレーム画像の間で対応づ
け、これに基づきフレーム画像間の相対的な位置ずれ量
を検出する構造情報対応づけ段階と、 前記複数枚のフレーム画像を前記位置ずれ量に基づいて
繋ぎ合わせる画像合成段階とを含むことを特徴とする画
像合成方法。 - 【請求項2】 請求項1記載の画像合成方法において、
前記フレーム画像は文書の画像であり、前記構造情報と
して段組み、文字列及び文字からなる文書のレイアウト
構造を抽出することを特徴とする画像合成方法。 - 【請求項3】 請求項1記載の画像合成方法において、 前記複数枚のフレーム画像の中の同一物体に対して、前
記構造情報を基に一画素の大きさ以下の精度の位置ずれ
量であるサブピクセル位置ずれ量を検出する位置ずれ残
差検出段階と、 前記サブピクセル位置ずれ量に基づき、画素間を内挿す
るように画像をずらして重ねあわせた超解像画像を生成
する超解像処理段階と、 前記構造情報に基づき前記超解像画像を画像上に配置し
て画像を生成する超解像画像合成段階とを含むことを特
徴とする画像合成方法。 - 【請求項4】 請求項2記載の画像合成方法において、 前記複数枚のフレーム画像の中の同一物体について、前
記構造情報を基に前記サブピクセル位置ずれ量を検出す
る位置ずれ残差検出段階と、 前記サブピクセル位置ずれ量に基づき、画素間を内挿す
るように画像をずらして重ねあわせた超解像画像を各物
体について生成する超解像処理段階と、 前記構造情報に基づき前記超解像画像を画像上に配置し
て画像を生成する超解像画像合成段階とを含むことを特
徴とする画像合成方法。 - 【請求項5】 請求項4記載の画像合成方法において、 前記超解像画像を文字単位に生成した超解像文字画像を
出力する超解像文字画像出力段階と、 前記超解像文字画像を文字コードに変換する個別文字認
識段階と、 前記構造情報と前記位置ずれ量に基づき、前記文字コー
ドを文字の記載順にしたがって配置し、文書の認識結果
を再構成する文字認識結果結合段階とを含むことを特徴
とする画像合成方法。 - 【請求項6】 複数の画像からひとつの画像を合成する
画像合成装置において、 入力対象に対して画像入力デバイスを走査して複数枚の
フレーム画像を取得する画像入力手段と、 入力された前記複数枚のフレーム画像を記憶する画像記
憶手段と、 前記複数枚のフレーム画像のそれぞれに対して、フレー
ム画像内の各物体の検出及び検出された各物体について
前記構造情報の抽出を行う構造解析手段と、 前記構造解析手段により前記複数枚のフレーム画像から
抽出された前記構造情報を記憶する構造情報記憶手段
と、 前記構造情報記憶手段に記憶された前記構造情報を前記
複数枚のフレーム画像の間で対応づけ、これに基づき各
フレーム画像間の相対的な位置ずれ量を検出し、前記構
造情報記憶手段に出力する構造情報対応づけ手段と、 前記画像記憶手段に記憶されている前記複数枚のフレー
ム画像を、前記構造情報記憶手段に記憶されたフレーム
画像間の位置ずれ量に基づき、フレーム画像を繋ぎ合わ
せる画像合成手段とを含むことを特徴とする画像合成装
置。 - 【請求項7】 請求項6記載の画像合成装置において、
入力対象は文書であり、前記構造情報として段組み、文
字列及び文字からなる文書のレイアウト構造を抽出する
ことを特徴とする画像合成装置。 - 【請求項8】 請求項6記載の画像合成装置において、 前記複数枚のフレーム画像の中の同一物体に対して、前
記構造情報を基に前記サブピクセル位置ずれ量を検出す
る位置ずれ残差検出手段と、前記サブピクセル位置ずれ
量に基づき、画素間を内挿するように画像をずらし て重ねあわせた超解像画像を生成する超解像処理手段
と、 前記構造情報に基づき前記超解像画像を画像上に配置し
て画像を生成する超解像画像合成手段とを含むことを特
徴とする画像合成装置。 - 【請求項9】 請求項7記載の画像合成装置において、 前記複数枚のフレーム画像の中の同一物体について、前
記構造情報を基に前記サブピクセル位置ずれ量を検出す
る位置ずれ残差検出手段と、 前記サブピクセル位置ずれ量に基づき、画素間を内挿す
るように画像をずらして重ねあわせた超解像画像を各物
体について生成する超解像処理手段と、 前記構造情報に基づき前記超解像画像を画像上に配置し
て画像を生成する超解像画像合成手段とを含むことを特
徴とする画像合成装置。 - 【請求項10】 請求項9記載の画像合成装置におい
て、 前記超解像文字画像を出力する超解像文字画像出力手段
と、 前記超解像文字画像を文字コードに変換する個別文字認
識手段と、 前記構造情報と前記位置ずれ量に基づき、前記文字コー
ドを文字の記載順にしたがって配置し、文書の認識結果
を再構成する文字認識結果結合手段とを含むことを特徴
とする画像合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8226879A JP2828138B2 (ja) | 1996-08-28 | 1996-08-28 | 画像合成方法及び画像合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8226879A JP2828138B2 (ja) | 1996-08-28 | 1996-08-28 | 画像合成方法及び画像合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1069537A true JPH1069537A (ja) | 1998-03-10 |
JP2828138B2 JP2828138B2 (ja) | 1998-11-25 |
Family
ID=16852012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8226879A Expired - Fee Related JP2828138B2 (ja) | 1996-08-28 | 1996-08-28 | 画像合成方法及び画像合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2828138B2 (ja) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003050714A1 (fr) * | 2001-12-10 | 2003-06-19 | Mitsubishi Denki Kabushiki Kaisha | Systeme de traitement d'image de terminal cellulaire, terminal cellulaire et serveur |
JP2004242048A (ja) * | 2003-02-06 | 2004-08-26 | Hitachi Ltd | 広視野角・高解像度映像撮影装置 |
WO2004093011A1 (ja) * | 2003-04-17 | 2004-10-28 | Seiko Epson Corporation | 複数のフレーム画像からの静止画像の生成 |
WO2005024723A1 (ja) * | 2003-09-08 | 2005-03-17 | Nec Corporation | 画像合成システム、画像合成方法及びプログラム |
US6891978B1 (en) | 1999-07-16 | 2005-05-10 | Minolta Co., Ltd. | Image processing device and method of processing picture data |
WO2005122083A1 (ja) * | 2004-06-10 | 2005-12-22 | Olympus Corporation | 撮像装置および画像の高解像度化方法 |
WO2006046493A1 (ja) * | 2004-10-29 | 2006-05-04 | Tokyo Institute Of Technology | 超解像処理の高速化方法 |
JP2006119843A (ja) * | 2004-10-20 | 2006-05-11 | Olympus Corp | 画像生成方法およびその装置 |
CN1305292C (zh) * | 2003-09-15 | 2007-03-14 | 北京中星微电子有限公司 | 对连续图像帧间偏移的估计方法 |
US7203381B2 (en) | 2004-01-09 | 2007-04-10 | Matsushita Electric Industrial Co., Ltd. | Image processing method, image processing apparatus, and image processing program |
WO2007102377A1 (ja) * | 2006-03-03 | 2007-09-13 | Olympus Corporation | 撮像装置、高解像度化処理方法、高解像度化処理プログラム、及び記録媒体 |
WO2007122911A1 (ja) * | 2006-03-30 | 2007-11-01 | Nec Corporation | 画像処理装置、画像処理システム、画像処理方法および画像処理用プログラム |
JP2007305113A (ja) * | 2006-04-11 | 2007-11-22 | Matsushita Electric Ind Co Ltd | 画像処理方法および画像処理装置 |
WO2008032590A1 (en) * | 2006-09-11 | 2008-03-20 | Olympus Corporation | Image distribution system, server, and client terminal |
EP1921568A2 (en) | 2006-11-13 | 2008-05-14 | NEC Corporation | Label area detecting apparatus, label area detecting method used in same, and label area detection control program |
JP2009505297A (ja) * | 2005-08-18 | 2009-02-05 | メンタル イメージズ ゲーエムベーハー | 画像合成の方法とシステム |
JP2009109666A (ja) * | 2007-10-29 | 2009-05-21 | Toshiba Corp | 解像度変換装置、方法およびプログラム |
JP2009177798A (ja) * | 2007-12-28 | 2009-08-06 | Canon Inc | 画像処理装置及び画像処理方法並びに画像処理方法を実行するプログラム |
JP2009231988A (ja) * | 2008-03-19 | 2009-10-08 | Sanyo Electric Co Ltd | 画像処理装置 |
US7778493B2 (en) | 2003-10-09 | 2010-08-17 | The Henry M. Jackson Foundation For The Advancement Of Military Medicine Inc. | Pixelation reconstruction for image resolution and image data transmission |
US7990428B2 (en) | 2004-11-15 | 2011-08-02 | Olympus Corporation | Imaging device and high-resolution processing method of image |
US8849029B2 (en) | 2010-02-26 | 2014-09-30 | Nec Corporation | Image processing method, image processing device and program |
JP2014228456A (ja) * | 2013-05-24 | 2014-12-08 | 川崎重工業株式会社 | 軌道の高精細画像作成方法、高精細画像作成装置および高精細画像作成システム |
CN114697533A (zh) * | 2020-12-30 | 2022-07-01 | 深圳Tcl数字技术有限公司 | 图像处理方法、装置、计算机可读存储介质及智能电视 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4964541B2 (ja) | 2006-09-11 | 2012-07-04 | オリンパス株式会社 | 撮像装置、画像処理装置、撮像システム及び画像処理プログラム |
-
1996
- 1996-08-28 JP JP8226879A patent/JP2828138B2/ja not_active Expired - Fee Related
Cited By (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6891978B1 (en) | 1999-07-16 | 2005-05-10 | Minolta Co., Ltd. | Image processing device and method of processing picture data |
WO2003050714A1 (fr) * | 2001-12-10 | 2003-06-19 | Mitsubishi Denki Kabushiki Kaisha | Systeme de traitement d'image de terminal cellulaire, terminal cellulaire et serveur |
JP2004242048A (ja) * | 2003-02-06 | 2004-08-26 | Hitachi Ltd | 広視野角・高解像度映像撮影装置 |
US7672538B2 (en) | 2003-04-17 | 2010-03-02 | Seiko Epson Corporation | Generation of still image from a plurality of frame images |
WO2004093011A1 (ja) * | 2003-04-17 | 2004-10-28 | Seiko Epson Corporation | 複数のフレーム画像からの静止画像の生成 |
WO2005024723A1 (ja) * | 2003-09-08 | 2005-03-17 | Nec Corporation | 画像合成システム、画像合成方法及びプログラム |
US7686454B2 (en) | 2003-09-08 | 2010-03-30 | Nec Corporation | Image combining system, image combining method, and program |
CN1305292C (zh) * | 2003-09-15 | 2007-03-14 | 北京中星微电子有限公司 | 对连续图像帧间偏移的估计方法 |
US7778493B2 (en) | 2003-10-09 | 2010-08-17 | The Henry M. Jackson Foundation For The Advancement Of Military Medicine Inc. | Pixelation reconstruction for image resolution and image data transmission |
US7203381B2 (en) | 2004-01-09 | 2007-04-10 | Matsushita Electric Industrial Co., Ltd. | Image processing method, image processing apparatus, and image processing program |
WO2005122083A1 (ja) * | 2004-06-10 | 2005-12-22 | Olympus Corporation | 撮像装置および画像の高解像度化方法 |
JP2006119843A (ja) * | 2004-10-20 | 2006-05-11 | Olympus Corp | 画像生成方法およびその装置 |
US8009933B2 (en) | 2004-10-29 | 2011-08-30 | Tokyo Institute Of Technology | Fast method of super-resolution processing |
WO2006046493A1 (ja) * | 2004-10-29 | 2006-05-04 | Tokyo Institute Of Technology | 超解像処理の高速化方法 |
US7990428B2 (en) | 2004-11-15 | 2011-08-02 | Olympus Corporation | Imaging device and high-resolution processing method of image |
JP4749470B2 (ja) * | 2005-08-18 | 2011-08-17 | メンタル イメージズ ゲーエムベーハー | 画像合成の方法、コンピュータグラフィックシステム及びコンピュータプログラム |
JP2009505297A (ja) * | 2005-08-18 | 2009-02-05 | メンタル イメージズ ゲーエムベーハー | 画像合成の方法とシステム |
WO2007102377A1 (ja) * | 2006-03-03 | 2007-09-13 | Olympus Corporation | 撮像装置、高解像度化処理方法、高解像度化処理プログラム、及び記録媒体 |
US7978234B2 (en) | 2006-03-03 | 2011-07-12 | Olympus Corporation | Image acquisition apparatus, resolution enhancing method, and recording medium |
KR100972764B1 (ko) | 2006-03-30 | 2010-07-28 | 닛본 덴끼 가부시끼가이샤 | 이미지 처리 장치, 이미지 처리 방법 및 이미지 처리 프로그램을 포함하는 기록 매체 |
WO2007122911A1 (ja) * | 2006-03-30 | 2007-11-01 | Nec Corporation | 画像処理装置、画像処理システム、画像処理方法および画像処理用プログラム |
JP2007305113A (ja) * | 2006-04-11 | 2007-11-22 | Matsushita Electric Ind Co Ltd | 画像処理方法および画像処理装置 |
WO2008032590A1 (en) * | 2006-09-11 | 2008-03-20 | Olympus Corporation | Image distribution system, server, and client terminal |
EP1921568A2 (en) | 2006-11-13 | 2008-05-14 | NEC Corporation | Label area detecting apparatus, label area detecting method used in same, and label area detection control program |
JP2009109666A (ja) * | 2007-10-29 | 2009-05-21 | Toshiba Corp | 解像度変換装置、方法およびプログラム |
JP2009177798A (ja) * | 2007-12-28 | 2009-08-06 | Canon Inc | 画像処理装置及び画像処理方法並びに画像処理方法を実行するプログラム |
JP2009231988A (ja) * | 2008-03-19 | 2009-10-08 | Sanyo Electric Co Ltd | 画像処理装置 |
US8849029B2 (en) | 2010-02-26 | 2014-09-30 | Nec Corporation | Image processing method, image processing device and program |
JP2014228456A (ja) * | 2013-05-24 | 2014-12-08 | 川崎重工業株式会社 | 軌道の高精細画像作成方法、高精細画像作成装置および高精細画像作成システム |
CN114697533A (zh) * | 2020-12-30 | 2022-07-01 | 深圳Tcl数字技术有限公司 | 图像处理方法、装置、计算机可读存储介质及智能电视 |
Also Published As
Publication number | Publication date |
---|---|
JP2828138B2 (ja) | 1998-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2828138B2 (ja) | 画像合成方法及び画像合成装置 | |
US6633303B2 (en) | Method, system and record medium for generating wide-area high-resolution image | |
JP5555706B2 (ja) | 高解像度映像獲得装置およびその方法 | |
KR100415266B1 (ko) | 물체영역정보 기술방법과 물체영역정보 생성장치 및 기록매체 | |
JPH07264603A (ja) | 動き量検出方法及び動き量検出装置 | |
JP2002305647A (ja) | 画像結合装置 | |
JPWO2010095460A1 (ja) | 画像処理システム、画像処理方法および画像処理プログラム | |
JP6061502B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
Lu et al. | Superthermal: Matching thermal as visible through thermal feature exploration | |
JPH05174149A (ja) | 画像認識装置 | |
US20020012468A1 (en) | Document recognition apparatus and method | |
KR100569194B1 (ko) | 카메라 문서영상의 기하학적 왜곡 보정방법 | |
KR101558573B1 (ko) | 스테레오 카메라 영상 합성 방법 | |
CN113033559A (zh) | 一种基于目标检测的文本检测方法及装置、存储介质 | |
KR102496362B1 (ko) | 인공지능 기반 영상 콘텐츠 제작 시스템 및 방법 | |
JP3269222B2 (ja) | 距離測定装置 | |
JP4321251B2 (ja) | 合成画像を生成・表示する装置及び方法 | |
Meddeber et al. | Efficient photometric and geometric stitching approach for remote sensing images based on wavelet transform and local invariant | |
WO2000049569A1 (fr) | Procede servant a extraire les caracteristiques d'une image binaire | |
JP3016687B2 (ja) | 画像処理装置 | |
CN112419208A (zh) | 一种基于施工图审查矢量图纸编译方法及系统 | |
Nakajima et al. | Document reconstruction and recognition from an image sequence | |
Körber | Improving Camera-based Document Analysis with Deep Learning | |
JP4243577B2 (ja) | 類似画像検索装置、方法およびプログラム | |
Mahakud et al. | Bias Removal Blending to Create Panorama |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19980819 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080918 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080918 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090918 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090918 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100918 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110918 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120918 Year of fee payment: 14 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130918 Year of fee payment: 15 |
|
LAPS | Cancellation because of no payment of annual fees |