JP4444545B2 - 画像結合装置 - Google Patents

画像結合装置 Download PDF

Info

Publication number
JP4444545B2
JP4444545B2 JP2002013954A JP2002013954A JP4444545B2 JP 4444545 B2 JP4444545 B2 JP 4444545B2 JP 2002013954 A JP2002013954 A JP 2002013954A JP 2002013954 A JP2002013954 A JP 2002013954A JP 4444545 B2 JP4444545 B2 JP 4444545B2
Authority
JP
Japan
Prior art keywords
image
character recognition
pattern matching
character
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002013954A
Other languages
English (en)
Other versions
JP2003216944A (ja
Inventor
裕幸 ▲高▼倉
憲一郎 酒井
嗣男 野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2002013954A priority Critical patent/JP4444545B2/ja
Publication of JP2003216944A publication Critical patent/JP2003216944A/ja
Application granted granted Critical
Publication of JP4444545B2 publication Critical patent/JP4444545B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Character Discrimination (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、スキャナ等の画像入力装置より複数回に分けて取り込んだ多値画像を合成するための装置に関する。
【0002】
【従来の技術】
近年、据え置き型のフラットヘッドスキャナに加え、持ち運びが容易な手動操作型の小型ハンドヘルドスキャナが開発、製品化されている。ハンドヘルドスキャナは本体が小型であるため一度にスキャンできる画像の幅が狭い。従って、スキャナ幅を超える大きな画像を取り込むためには、画像を複数回に分けて取り込み、合成する必要がある。
【0003】
複数回に分けて取り込んだ画像を結合する技術は幾つか存在する。例えば、デジタルカメラなどを用いて画像を複数回に分けて取り込み、その後、アプリケーション上で画像を結合することで、大きな画像を生成するパノラマ写真などがある。
【0004】
【発明が解決しようとする課題】
フルカラーの画像を結合するには、処理に必要なメモリ容量、処理時間が大きいといった問題がある。例えば、スキャナを用いて300dpi、フルカラー、A6サイズの設定で読み取った画像のデータサイズは約6Mbyteにもなり、2枚の画像を結合するには多くのメモリ容量と処理時間を要する。PCの処理能力は向上しているが、より画質を向上するため、画像のデータ量も増加しており、メモリ容量、処理時間の低減は必須である。
【0005】
本発明の課題は、入力画像がフルカラーであっても、処理に必要なメモリ容量を削減し、高速かつ自動的に2以上の画像を結合することができる画像結合装置を提供することである。
【0006】
【課題を解決するための手段】
本発明の画像結合装置は、複数回に分けて取り込まれた画像を結合して1つの画像にする画像結合装置であって、入力された複数の画像に文字が含まれているか否かを検出し、文字が含まれている場合には、文字認識を行う文字検出認識手段と、該入力された複数の画像に文字が含まれている場合に、文字認識の結果得られた文字コードのパターンマッチングによって画像をどのように結合すべきかを決定する文字コードパターンマッチング手段と、該入力された複数の画像に文字が含まれていない場合に、画素の色成分のパターンマッチングにより画像をどのように結合すべきかを決定する画素パターンマッチング手段と、該文字コードパターンマッチング手段あるいは、画素パターンマッチング手段のパターンマッチングの結果に基づいて、該入力された複数の画像を結合する画像結合手段とを備えることを特徴とする。
【0007】
本発明によれば、画像を結合する際に、画像に文字が含まれているか否かを自動で検出し、文字が含まれている場合には、文字認識をして、文字認識の結果の文字コードについてパターンマッチングをして、画像を結合するので、入力された画像に一律に、画素毎の色成分のパターンマッチングを行う従来の装置に比べ、必要とされるメモリ容量や、処理時間を節約できる。また、構成もシンプルに構成できるので、安価な装置を提供できる。
【0008】
【発明の実施の形態】
本発明の実施形態では、画像結合装置を以下のように構成する。
すなわち、画像結合装置は、光学的に読み取られた情報を光電変換して画像データとして入力する画像入力手段と、読み取った画像データ中に、文字データが存在するか否かを検出する文字検出手段と、文字データが存在すれば、文字データを利用したパターンマッチングを行い、複数個の画像を結合する含文字画像結合手段と、文字データが存在しなければ、画素同士のパターンマッチングを行い、複数個の画像を結合する非含文字画像結合手段とを備える。
【0009】
スキャナやデジタルカメラなどから読み取った画像データの多くは、RGB色成分を持つ多値画像(フルカラー)もしくは、階調成分を持つモノクロ多値画像(グレースケール)であり、これら多値画像を画像処理するには非常に多くのメモリ容量と処理時間を要する。
【0010】
例えば、画像処理の一つに、スキャナ幅を超える大きな紙面を読み取るため、紙面を複数回に分けて取り込み、アプリケーション上で自動合成するといった処理が挙げられる。また、最近では、デジタルカメラを用いて、より大きな景色を取り込むため、景色を複数回に分けて取り込み、アプリケーション上で自動合成するパノラマ撮影などがある。これらの処理は、複数の多値画像を自動結合する処理であり、非常に多くのメモリ容量と処理時間が必要となる。
【0011】
本発明の実施形態では、入力画像がフルカラーであっても処理に必要なメモリ容量を削減し、高速かつ自動的に2つの画像を結合する画像結合装置を提供する。
【0012】
図1は、本実施形態による画像結合装置の基本構成を示す図である。
ハンドヘルドスキャナ等で読み取った画像は画像入力手段1によって画像結合装置に入力される。入力された画像に対しては、文字検出手段2によって、文字が存在するか否かが調べられる。ここで、入力された画像は、文字を含む文書画像と、文字を含まない写真画像に分類される。雑誌や新聞、報告書など、スキャナで読み取る画像の多くは、文字データが含まれている。また、従来デジタルカメラで入力した文書画像などは、接写距離にもよるが大抵の場合、画素数が足りないため、見にくいと言った問題や、文字認識などの処理には適さないといった問題があった。しかし、近年、デジタルカメラの高画素化により文書画像の入力が増加してきている。
【0013】
文字検出された画像に対しては、補正情報検出手段3において、分割されて入力された画像をどのように結合すべきかを決定する情報が取得される。入力された画像が文字を含む文書画像である場合には、文字認識を行い、各画像における認識された文字を対応させることによって、どのように結合させるかを決定する。また、入力された画像が写真画像である場合には、各画像の画素毎の色成分のパターンマッチングを行い、どのように各画像を結合するかを決定する。このようにして決定された画像をどのように結合すべきかを示す補正情報は、画像結合手段4に、各画像と共に入力され、実際に画像結合が行われる。画像結合手段4の処理結果が求める結合画像である。
【0014】
文書画像を自動結合する方法として、特願平11−111708号に記載された技術が挙げられる。この手法は、入力画像に含まれる文字データを文字認識し、得られた文字コードの順序、一致度を比較することで、高速に2つの画像の重なり位置を検出することができる。そのため、画素の色成分のパターンマッチングから画像の重なり位置を自動検出する写真画像の自動結合機能と比較すると、処理に必要なメモリ容量を低減し、処理時間を大きく短縮することができる。
【0015】
図2は、写真画像の結合方法を説明する図である。
デジタルカメラやスキャナで複数に分割して読み取った写真画像の結合の仕方は、図2が示すように4通りとなる。4通りの全てに対して画素の色成分のパターンマッチングを行って、重なり位置の検出を行うと、非常に多くのメモリ容量、処理時間を要する。そこで、従来のアプリケーションに搭載されている多くの画像結合機能では、処理時間の問題から、ユーザが結合面を指定する手法を取っている。しかし、画像結合装置としては、画像結合するための結合面の検出は、自動であることが望ましい。そこで、本実施形態が示すように、画像が文字を含む場合には、文字認識を利用した重なり位置の検出手法を用いれば、高速処理が可能となる。
【0016】
そこで、本実施形態に於いては、入力した画像の中から文字データを検出し、文字データを含んでいれば、文字データを利用したパターンマッチング(文書画像結合)を行い、2つの画像の重なり位置の検出を行う。文字データを含んでいなければ、画素の色成分のパターンマッチングから2つの画像の重なり位置の検出及び結合(写真画像結合)を行うようにする。
【0017】
以上の処理により、写真画像の場合には、文字が含まれていようがいまいが、一律に画素毎の色成分のパターンマッチングを行う、従来の画像結合に比べて、本実施形態の場合には、高速に画像の自動結合を行うことができる。
【0018】
文書画像の自動結合機能には、特願平11−111708号等に記載されている技術を用いる。写真画像の自動結合機能には、特願2001−107532号などに記載されている技術を用いる。
【0019】
文書画像の結合では、画像に含まれる文字データを文字認識を利用して文字コードに変換し、2つの画像から検出した文字コードを比較することで、画像の重なり位置を高速に検出することができる。しかし、入力画像によっては、文字認識した結果、高い認識精度を得られず、重なり位置を検出することができない場合がある。
【0020】
そこで、文字認識を利用した重なり位置検出で重なり位置を検出できなければ、画素の色成分のパターンマッチングから2つの画像の重なり位置の検出を行うことで、画像結合の成功率の低下を防ぐようにする。
【0021】
多値画像の画像処理は、非常に多くのメモリ容量、処理時間を要するため、文字を含む画像における文字データの検出には2値画像を用いる。入力画像が多値(フルカラー、グレースケール)画像であれば、2値化し、2値画像から文字データの検出を行うことで、低メモリ、高速動作を実現する。
【0022】
画像中に含まれる文字データの検出には、文字認識を用いる。文字認識した結果、確信度がある一定値以上となる文字数をカウントする。
文書画像の自動結合機能では、2つの画像に含まれる文字を文字認識し、文字認識から得られた文字コードの一致を取り、両画像の重なり部分を検出する。また、このとき、文字コードの一致判定を文字領域毎(本実施形態では行単位)で行う。ここで、認識結果の高い文字コードを、ある一定個数以上含んでいなければ、一致判定を行うことができないと判断することとする。
【0023】
そのため、抽出した領域を文字認識し、確信度がある一定値以上となる文字の個数をカウントし、文字の個数がある一定個以上となるかを判別する。文字の個数がある一定個以上となれば、文書画像自動結合機能を利用可能となるため、入力画像が文書画像であるか、写真画像であるかの判別を行うことができる。
【0024】
次に、画像の中から特定の条件を満たす画像領域を抽出する。領域抽出に用いる画像は多値画像でも白黒2値画像でもどちらでもよい。2値画像を用いれば、低メモリ、高速動作を実現できる。
【0025】
特定の条件を満たす領域として、例えば、2値画像の中から、ある一定幅を持つ、白画素に囲まれた領域を抽出する。
図3は、特定条件を満たす領域の文字認識への利用方法を説明する図である。
【0026】
図3に示すように、抽出した領域の横幅をa、縦幅bとする。このとき、h min<a<h max、v min<b<v maxの範囲にある領域を抽出する。ここで、h minは、抽出した領域の横幅の下限閾値であり、h maxは、抽出した領域の横幅の上限閾値である。同様に、v min、v maxは、それぞれ、抽出した領域の縦幅の下限及び上限閾値である。例えば、図3中の、行1は範囲の中にあり、行2は範囲外となり、行1のみを抽出する。
【0027】
すなわち、この領域の判定処理により、行2のように罫線など、文字ではない部分を文字認識を行う領域から排除し、正しく文字を含む領域のみに対して文字認識を行うようにする。これにより、罫線などについて文字認識処理を行うなどの無駄な処理を排除することができるので、処理データ量を削減することができる。
【0028】
また、このように文字認識を行う前に前処理として領域抽出を行うと、抽出した領域がなければ、文字データが存在しないとみなすことができるため、高速に文字データの検出を行うことができる。
【0029】
また、領域の中に含まれる黒画素の数と白画素の数を求め、領域中の黒画素の割合を求めるようにする。図3に示すように、行単位で領域を抽出した場合、行1の中には黒画素がある一定の割合で存在する。仮に、罫線を文字領域とみなして抽出したとしても、黒画素の割合を求めれば、文字領域ではないことが分かる。そのため、領域検出精度を向上することができる。この場合には、黒画素の割合として、適切な閾値を設定しておき、閾値で示される範囲内に黒画素の割合が入った場合に文字領域であると判断することができる。
【0030】
そして、前述の手法で抽出した領域を文字認識すれば、画像全体を文字認識する必要がないため、高速かつ高精度に画像に含まれる文字データの存在を検出することができる。
【0031】
図4は、文字データを利用したパターンマッチングによる画像結合処理の説明をする図である。
本実施形態では、入力画像に含まれる文字データを文字認識し、得られた文字コードを比較することで、画像の重なり位置を検出する。文字コードを利用して重なり位置を検出することで、画素(色成分)のパターンマッチングによる重なり位置検出方法と比較し、処理に必要なメモリ容量を低減し、非常に高速な処理を行うことができる。文書画像を自動結合する方法として、特願平11−111708号に記載の技術を用いる。
【0032】
図5は、画素の色成分を用いたパターンマッチングによる重なり位置検出処理を説明する図である。
この手法は、画素の色成分を用いてパターンマッチングを行うため、図4の画像結合処理と比較して、非常に多くのメモリ容量と処理時間を要する。しかし、図4の画像結合処理では文字データを含んだ画像のみ対応しており、図5の手法ならば文字データを含まない画像であっても結合することができる。また、図5の手法では、文字データを含んでいても、重なり位置の検出は可能であるため、文字データを利用したパターンマッチングによる画像結合手法で、重なり位置の検出に失敗したとしても、図5の画像結合手法を用いて重なり位置を検出することができる。
【0033】
図6は、本発明の実施形態に従った画像結合処理の全体の流れを示すフローチャートである。
まず、ステップS101において、読み取った画像から文字データの抽出を行う。この処理は図7に詳細を示す。次に定数doc flagを用意し、文字データを抽出できたならば、文書画像の結合処理による高速処理を行うためにdoc flag=TRUEとする。文字データを抽出できなければ、写真画像の結合処理を行うためにdoc flag=FALSEとする。
【0034】
ステップS102において、doc flagを判別する。doc flag=TRUEであれば、文字画像データから画像の重なり位置を検出するためステップS103に進む。doc flag=FALSEであれば、画素毎の色成分のパターンマッチングから重なり位置を検出するためステップS106に進む。
【0035】
ステップS103において、画像の重なり位置を検出する。ここでは、特願平11−111708号に記載の文書画像結合手法を用いる。この処理は低メモリ容量で、高速に処理することができる。
【0036】
ステップS104において、重なり位置検出の合否を判別する。検出に成功したならば、ステップS108に進む。検出に失敗したならば、ステップS105に進み、画素毎の色成分のパターンマッチングから重なり位置を検出する。
【0037】
ステップS105において、文字画像データを用いた重なり位置検出に失敗したと判断されたので、doc flag=FALSEとする。
ステップS106において、画像の重なり位置を検出する。ここでは、写真画像の結合処理のために特願2001−107532号に記載の画像結合手法を用いる。
【0038】
ステップS107において、重なり位置検出の合否を判別する。検出に成功したならば、ステップS108に進む。検出に失敗したならば処理を終了する。
ステップS108において、画像の結合処理を行う。結合処理は、特願平11−111708号、もしくは特願2001−107532号の手法を用いる。
【0039】
結合処理が完了すれば全体の処理を終了する。
図7は、図6のステップS101の詳細を示すフローチャートである。
ステップS201において、入力画像から2値画像を作成する。2値画像の作成は、特願2000−259573号に記載の手法を用いる。
【0040】
ステップS202において、2値画像から文字領域の抽出を行う。文字領域の抽出の仕方は、図3に示すようにする。抽出した領域の横幅をaとし、
min<a<h max
の範囲にある領域を抽出する。ここで、h minは横幅の最小値、h maxは横幅の最大値である。
【0041】
ステップS203において、抽出した領域の黒画素の割合を調べる。領域に含まれる黒画素の数をb num、白画素の数をw numとし、下記の条件を満たす領域のみを抽出する。なお、b per minは黒画素の割合の最小値、b per maxは黒画素の割合の最大値を示す。
【0042】
per min<(b num/(b num+w num))<b per max
ステップS204において、抽出した領域の数area numが最低個数 area threshよりも大きければステップS205に進み、小さければステップS209に進む。
area thresh<area num
ステップS205において、抽出した領域を文字認識する。
【0043】
ステップS206において、認識結果の確信度(認識結果の確からしさ:特願平10−140871号を参照)をocr concとし、
valu conc<ocr conc
となる個数cet numをカウントする。ここで、valu concは文字認識が成功したと判断するための確信度の最小値である。
【0044】
ステップS207において、cet numがある一定個数以上となれば、文字認識に成功したとみなしステップS208に進む。ステップS207において、条件を満たさなければ、失敗したとみなしステップS209に進む。ここで、succ num minは所定値以上の確信度のある認識文字の個数に対して、文字認識が成功したと判断するための認識成功文字数の最小個数を表す。
succ num min<cet num
ステップS208において、入力画像は文書画像とみなし、doc flag=TRUEとする。
【0045】
ステップS209において、文字データが検出できなかったため、doc flag=FALSEとする。
以上より処理を終了する。
【0046】
以上の処理により、入力画像に文字データを含んでいれば、入力画像が多値画像であっても、処理に必要なメモリ容量を削減し、高速かつ自動的に2つの画像を結合することができる。
【0047】
入力機器より読み込んだ画像から文字データの有無を検出し、文字データを含んでいれば文字認識を利用した画像結合手段により、処理に必要なメモリ容量を削減し、高速かつ高精度に複数個の画像を結合する。また、文字データを含んでいなくても、画素毎の色差のパターンマッチングを利用した画像結合手段により、複数個の画像を結合する。
【0048】
以上の処理により、小型のハンドヘルドスキャナのように一度にスキャンできる幅が狭い場合であっても、スキャナ幅を超える大きな画像を取り込むことが可能となる。また、入力画像がフルカラーであっても、処理に必要なメモリ容量を抑え、高速かつ高精度に処理することが可能である。
【0049】
以上のことから、本発明はハンドヘルドスキャナによる画像入力の操作性及び、ユーザインターフェースの改善に寄与するところが大きい。
図8は、本実施形態の処理をプログラムで実現する場合に必要とされるハードウェア環境を説明する図である。
【0050】
当該プログラムを情報処理装置31で実行する場合には、CPU21は、バス20を介して、ハードディスクなどの記憶装置27から当該プログラムをRAM23にコピーして実行する。ROM22は、BIOSなどの基本プログラムが格納されるが、当該プログラムを格納するようにしても良い。
【0051】
あるいは、フレキシブルディスク、DVD、CD−ROMなどの可搬記録媒体29に当該プログラムを記録して頒布することが可能であり、頒布された当該プログラムを可搬記録媒体29から読み取り装置28で読み取り、RAM23にコピーしてCPU21が実行するようにしても良い。あるいは、可搬記録媒体29から当該プログラムを情報処理装置31にインストールして使用しても良い。
【0052】
入出力装置30は、ユーザの指示をCPU21に伝えたり、CPU21の演算結果を出力するもので、ディスプレイ、キーボード、マウス、テンプレートなどや画像を読み取るためのスキャナ、画像を印刷するためのプリンタなどからなる。
【0053】
通信インターフェース24は、ネットワーク25を介して、情報処理装置31を情報提供者26に接続し、情報提供者26が持っているであろう当該プログラムを情報処理装置31にダウンロードして、CPU21が実行可能とするものである。あるいは、ダウンロードするのではなく、情報提供者26とネットワーク25を介して接続したまま、ネットワーク環境の下で当該プログラムを実行しても良い。
【0054】
(付記1)複数回に分けて取り込まれた画像を結合して1つの画像にする画像結合装置であって、
入力された複数の画像に文字が含まれているか否かを検出し、文字が含まれている場合には、文字認識を行う文字検出認識手段と、
該入力された複数の画像に文字が含まれている場合に、文字認識の結果得られた文字コードのパターンマッチングによって画像をどのように結合すべきかを決定する文字コードパターンマッチング手段と、
該入力された複数の画像に文字が含まれていない場合に、画素の色成分のパターンマッチングにより画像をどのように結合すべきかを決定する画素パターンマッチング手段と、
該文字コードパターンマッチング手段あるいは、画素パターンマッチング手段のパターンマッチングの結果に基づいて、該入力された複数の画像を結合する画像結合手段と、
を備えることを特徴とする画像結合装置。
【0055】
(付記2)前記文字認識は、入力された画像から文字の含まれていると考えられる、抽出された領域についてのみ行われることを特徴とする付記1に記載の画像結合装置。
【0056】
(付記3)前記文字コードパターンマッチング手段が、文字コードによるパターンマッチングに失敗した場合には、前記画素パターンマッチング手段が画素パターンマッチングにより、前記入力された複数の画像をどのように結合すべきかを決定することを特徴とする付記1に記載の画像結合装置。
【0057】
(付記4)前記文字認識は、入力画像を2値化した画像について行うことを特徴とする付記1に記載の画像結合装置。
(付記5)前記文字検出は、抽出した領域を文字認識し、文字認識から得られた確信度の値が一定値以上となる文字の個数を計数し、該計数された文字の個数が一定値以上となったとき、前記入力画像に文字が存在すると判断することを特徴とする付記1に記載の画像結合装置。
【0058】
(付記6)前記文字検出は、前記入力画像から特定条件を満たす領域を抽出する処理を行い、結果として特定条件を満たす領域が抽出されなかった場合には、文字が存在しないと判断することを特徴とする付記1に記載の画像結合装置。
【0059】
(付記7)前記領域中の黒画素の占める割合が、特定の範囲内になる領域を文字を含む領域として抽出することを特徴とする付記6に記載の画像結合装置。
(付記8)複数回に分けて取り込まれた画像を結合して1つの画像にする画像結合方法であって、
入力された複数の画像に文字が含まれているか否かを検出し、文字が含まれている場合には、文字認識を行う文字検出認識ステップと、
該入力された複数の画像に文字が含まれている場合に、文字認識の結果得られた文字コードのパターンマッチングによって画像をどのように結合すべきかを決定する文字コードパターンマッチングステップと、
該入力された複数の画像に文字が含まれていない場合に、画素の色成分のパターンマッチングにより画像をどのように結合すべきかを決定する画素パターンマッチングステップと、
該文字コードパターンマッチング手段あるいは、画素パターンマッチング手段のパターンマッチングの結果に基づいて、該入力された複数の画像を結合する画像結合ステップと、
を備えることを特徴とする画像結合方法。
【0060】
(付記9)複数回に分けて取り込まれた画像を結合して1つの画像にする画像結合方法であって、
入力された複数の画像に文字が含まれているか否かを検出し、文字が含まれている場合には、文字認識を行う文字検出認識ステップと、
該入力された複数の画像に文字が含まれている場合に、文字認識の結果得られた文字コードのパターンマッチングによって画像をどのように結合すべきかを決定する文字コードパターンマッチングステップと、
該入力された複数の画像に文字が含まれていない場合に、画素の色成分のパターンマッチングにより画像をどのように結合すべきかを決定する画素パターンマッチングステップと、
該文字コードパターンマッチング手段あるいは、画素パターンマッチング手段のパターンマッチングの結果に基づいて、該入力された複数の画像を結合する画像結合ステップと、
を備えることを特徴とする画像結合方法を情報処理装置に実現させるプログラム。
【0061】
(付記10)複数回に分けて取り込まれた画像を結合して1つの画像にする画像結合方法であって、
入力された複数の画像に文字が含まれているか否かを検出し、文字が含まれている場合には、文字認識を行う文字検出認識ステップと、
該入力された複数の画像に文字が含まれている場合に、文字認識の結果得られた文字コードのパターンマッチングによって画像をどのように結合すべきかを決定する文字コードパターンマッチングステップと、
該入力された複数の画像に文字が含まれていない場合に、画素の色成分のパターンマッチングにより画像をどのように結合すべきかを決定する画素パターンマッチングステップと、
該文字コードパターンマッチング手段あるいは、画素パターンマッチング手段のパターンマッチングの結果に基づいて、該入力された複数の画像を結合する画像結合ステップと、
を備えることを特徴とする画像結合方法を情報処理装置に実現させるプログラムを格納する、情報処理装置読み取り可能な記録媒体。
【0062】
【発明の効果】
本発明によれば、小型のスキャナで画像を複数に分けて取り込んだ場合にも、ユーザが取り込んだ文書の種類を指定することなく、自動で最適な文書結合方法を選択し、高速かつ使用メモリ容量をできるだけ少なくして画像結合することができる。
【図面の簡単な説明】
【図1】本実施形態による画像結合装置の基本構成を示す図である。
【図2】写真画像の結合方法を説明する図である。
【図3】特定条件を満たす領域の文字認識への利用方法を説明する図である。
【図4】文字データを利用したパターンマッチングによる画像結合処理の説明をする図である。
【図5】画素の色成分を用いたパターンマッチングによる重なり位置検出処理を説明する図である。
【図6】本発明の実施形態に従った画像結合処理の全体の流れを示すフローチャートである。
【図7】図6のステップS101の詳細を示すフローチャートである。
【図8】本実施形態の処理をプログラムで実現する場合に必要とされるハードウェア環境を説明する図である。
【符号の説明】
1 画像入力手段
2 文字検出手段
3 補正情報検出手段
4 画像結合手段

Claims (4)

  1. 複数回に分けて取り込まれた画像を結合して1つの画像にする画像結合装置であって、
    入力された複数の画像から、黒画素の占める割合が特定の範囲内になる領域を抽出する領域抽出手段と、
    前記領域抽出手段により抽出された領域について、文字認識を行う文字認識手段と、
    前記文字認識手段による文字認識が成功した場合、該文字認識の結果得られた文字コードのパターンマッチングによって画像をどのように結合すべきかを決定する文字コードパターンマッチング手段と、
    前記領域抽出手段による領域の抽出がなされなかった場合、または、前記文字認識手段による文字認識が失敗した場合に、画素の色成分のパターンマッチングにより画像をどのように結合すべきかを決定する画素パターンマッチング手段と、
    前記文字コードパターンマッチング手段あるいは、前記画素パターンマッチング手段のパターンマッチングの結果に基づいて、前記入力された複数の画像を結合する画像結合手段と、
    を備えることを特徴とする画像結合装置。
  2. 前記文字認識手段は、入力した画像を文字認識し、文字認識から得られた確信度の値が一定値以上となる文字の個数を計数し、該計数された文字の個数が一定値以上となったとき、文字認識が成功した前記入力画像に文字が存在すると判断することを特徴とする請求項1に記載の画像結合装置。
  3. 複数回に分けて取り込まれた画像を結合して1つの画像にする画像結合方法であって、
    入力された複数の画像から、黒画素の占める割合が特定の範囲内になる領域を抽出する領域抽出ステップと、
    前記領域抽出ステップにより抽出された領域について、文字認識を行う文字認識ステップと、
    前記文字認識ステップによる文字認識が成功した場合、該文字認識の結果得られた文字コードのパターンマッチングによって画像をどのように結合すべきかを決定する文字コードパターンマッチングステップと、
    前記領域抽出ステップによる領域の抽出がなされなかった場合、または、前記文字認識ステップによる文字認識が失敗した場合に、画素の色成分のパターンマッチングにより画像をどのように結合すべきかを決定する画素パターンマッチングステップと、
    前記文字コードパターンマッチングステップ、あるいは、前記画素パターンマッチングステップのパターンマッチングの結果に基づいて、前記入力された複数の画像を結合する画像結合ステップと、
    を備えることを特徴とする画像結合方法。
  4. 複数回に分けて取り込まれた画像を結合して1つの画像にする画像結合方法をコンピュータに実現させるプログラムであって、
    入力された複数の画像から、黒画素の占める割合が特定の範囲内になる領域を抽出する領域抽出ステップと、
    前記領域抽出ステップにより抽出された領域について、文字認識を行う文字認識ステップと、
    前記文字認識ステップによる文字認識が成功した場合、該文字認識の結果得られた文字コードのパターンマッチングによって画像をどのように結合すべきかを決定する文字コードパターンマッチングステップと、
    前記領域抽出ステップによる領域の抽出がなされなかった場合、または、前記文字認識ステップによる文字認識が失敗した場合に、画素の色成分のパターンマッチングにより画像をどのように結合すべきかを決定する画素パターンマッチングステップと、
    前記文字コードパターンマッチングステップ、あるいは、前記画素パターンマッチングステップのパターンマッチングの結果に基づいて、前記入力された複数の画像を結合する画像結合ステップと、
    を備えることを特徴とする画像結合方法をコンピュータに実現させるプログラム。
JP2002013954A 2002-01-23 2002-01-23 画像結合装置 Expired - Fee Related JP4444545B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002013954A JP4444545B2 (ja) 2002-01-23 2002-01-23 画像結合装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002013954A JP4444545B2 (ja) 2002-01-23 2002-01-23 画像結合装置

Publications (2)

Publication Number Publication Date
JP2003216944A JP2003216944A (ja) 2003-07-31
JP4444545B2 true JP4444545B2 (ja) 2010-03-31

Family

ID=27650781

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002013954A Expired - Fee Related JP4444545B2 (ja) 2002-01-23 2002-01-23 画像結合装置

Country Status (1)

Country Link
JP (1) JP4444545B2 (ja)

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2667430B2 (ja) * 1988-03-08 1997-10-27 株式会社東芝 画像つなぎ合せ装置
JPH04290066A (ja) * 1991-03-18 1992-10-14 Canon Inc 画像形成装置
JPH05122501A (ja) * 1991-03-18 1993-05-18 Canon Inc 画像処理装置および画像処理方法
JPH04316180A (ja) * 1991-04-15 1992-11-06 Oki Electric Ind Co Ltd 文書画像の属性判別方法
JPH0628520A (ja) * 1992-07-10 1994-02-04 Matsushita Electric Ind Co Ltd 文字認識装置
JPH0822507A (ja) * 1994-07-08 1996-01-23 Matsushita Electric Ind Co Ltd 文書認識装置
JPH07284013A (ja) * 1995-02-15 1995-10-27 Olympus Optical Co Ltd 画像取り扱い装置
JP3530653B2 (ja) * 1995-09-26 2004-05-24 キヤノン株式会社 パノラマ画像合成装置
JP3773011B2 (ja) * 1997-06-20 2006-05-10 シャープ株式会社 画像合成処理方法
JP3368184B2 (ja) * 1997-08-27 2003-01-20 日本電信電話株式会社 画像処理方法及びその方法を記録した記録媒体及び画像処理装置
JP2000175106A (ja) * 1998-12-08 2000-06-23 Minolta Co Ltd 画像合成処理装置、画像合成処理方法および画像合成処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3821267B2 (ja) * 1999-01-18 2006-09-13 富士通株式会社 文書画像結合装置、文書画像結合方法及び文書画像結合プログラムを記録した記録媒体
JP2000293624A (ja) * 1999-04-09 2000-10-20 Canon Inc 画像処理方法、装置及び記憶媒体
JP3849385B2 (ja) * 2000-02-03 2006-11-22 コニカミノルタホールディングス株式会社 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JP4551018B2 (ja) * 2001-04-05 2010-09-22 富士通株式会社 画像結合装置

Also Published As

Publication number Publication date
JP2003216944A (ja) 2003-07-31

Similar Documents

Publication Publication Date Title
US9137417B2 (en) Systems and methods for processing video data
KR101126466B1 (ko) 사진 문서 이미징 시스템
US7751648B2 (en) Image processing apparatus, image processing method, and computer program
US7660014B2 (en) Image processing apparatus capable of extracting rule from document image with high precision
KR101399709B1 (ko) 모델-기반 디워핑 방법 및 장치
US7321688B2 (en) Image processor for character recognition
US20100149322A1 (en) System and method of improving the legibility and applicability of document pictures using form based image enhancement
Bhattacharjya et al. Data embedding in text for a copier system
EP1510963A2 (en) Image processing apparatus, image processing method, program and storage medium
JP2011008549A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
US8773733B2 (en) Image capture device for extracting textual information
US8768058B2 (en) System for extracting text from a plurality of captured images of a document
US11430235B2 (en) Image processing apparatus, image processing method, and storage medium
US20130315485A1 (en) Textual information extraction method using multiple images
JP4444545B2 (ja) 画像結合装置
US11288536B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP4396710B2 (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2007156918A (ja) 文字認識装置、文字認識方法、文字認識プログラム、および記録媒体
JP2003060894A (ja) 画像合成装置、画像合成システム、画像合成機能付きカメラおよび画像合成サービス方法
JP2010218106A (ja) 画像処理装置、画像処理方法及びプログラム
JP2877548B2 (ja) 文書画像の属性判別方法
JP2646642B2 (ja) 画像の内外領域判定システム
JPH04276888A (ja) 文字読取装置
JP2001134773A (ja) 画像処理装置およびその方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070925

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080421

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080603

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080714

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100114

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130122

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130122

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140122

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees