JP2003216944A - 画像結合装置 - Google Patents

画像結合装置

Info

Publication number
JP2003216944A
JP2003216944A JP2002013954A JP2002013954A JP2003216944A JP 2003216944 A JP2003216944 A JP 2003216944A JP 2002013954 A JP2002013954 A JP 2002013954A JP 2002013954 A JP2002013954 A JP 2002013954A JP 2003216944 A JP2003216944 A JP 2003216944A
Authority
JP
Japan
Prior art keywords
image
character
images
pattern matching
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002013954A
Other languages
English (en)
Other versions
JP4444545B2 (ja
Inventor
裕幸 ▲高▼倉
Hiroyuki Takakura
Kenichiro Sakai
憲一郎 酒井
Tsuguo Noda
嗣男 野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2002013954A priority Critical patent/JP4444545B2/ja
Publication of JP2003216944A publication Critical patent/JP2003216944A/ja
Application granted granted Critical
Publication of JP4444545B2 publication Critical patent/JP4444545B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】入力画像がフルカラーであっても、処理に必要
なメモリ容量を削減し、高速かつ自動的に2以上の画像
を結合することができる画像結合装置を提供する。 【解決手段】画像入力手段1が画像を入力を受け付け、
文字検出手段2で、画像の中に文字が存在するか否かを
判定する。そして、補正情報検出手段3が画像が、文字
を含む文書画像の場合には、文字認識を行い、文字コー
ドのパターンマッチングによって、どのように画像を結
合すべきかの補正情報を得る。画像が文字を含まない場
合には、写真画像であるとして、画素の色成分のパター
ンマッチングによってどのように画像を結合すべきかの
補正情報を得る。画像結合手段4は、補正情報に基づい
て、画像を結合する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、スキャナ等の画像
入力装置より複数回に分けて取り込んだ多値画像を合成
するための装置に関する。
【0002】
【従来の技術】近年、据え置き型のフラットヘッドスキ
ャナに加え、持ち運びが容易な手動操作型の小型ハンド
ヘルドスキャナが開発、製品化されている。ハンドヘル
ドスキャナは本体が小型であるため一度にスキャンでき
る画像の幅が狭い。従って、スキャナ幅を超える大きな
画像を取り込むためには、画像を複数回に分けて取り込
み、合成する必要がある。
【0003】複数回に分けて取り込んだ画像を結合する
技術は幾つか存在する。例えば、デジタルカメラなどを
用いて画像を複数回に分けて取り込み、その後、アプリ
ケーション上で画像を結合することで、大きな画像を生
成するパノラマ写真などがある。
【0004】
【発明が解決しようとする課題】フルカラーの画像を結
合するには、処理に必要なメモリ容量、処理時間が大き
いといった問題がある。例えば、スキャナを用いて30
0dpi、フルカラー、A6サイズの設定で読み取った
画像のデータサイズは約6Mbyteにもなり、2枚の
画像を結合するには多くのメモリ容量と処理時間を要す
る。PCの処理能力は向上しているが、より画質を向上
するため、画像のデータ量も増加しており、メモリ容
量、処理時間の低減は必須である。
【0005】本発明の課題は、入力画像がフルカラーで
あっても、処理に必要なメモリ容量を削減し、高速かつ
自動的に2以上の画像を結合することができる画像結合
装置を提供することである。
【0006】
【課題を解決するための手段】本発明の画像結合装置
は、複数回に分けて取り込まれた画像を結合して1つの
画像にする画像結合装置であって、入力された複数の画
像に文字が含まれているか否かを検出し、文字が含まれ
ている場合には、文字認識を行う文字検出認識手段と、
該入力された複数の画像に文字が含まれている場合に、
文字認識の結果得られた文字コードのパターンマッチン
グによって画像をどのように結合すべきかを決定する文
字コードパターンマッチング手段と、該入力された複数
の画像に文字が含まれていない場合に、画素の色成分の
パターンマッチングにより画像をどのように結合すべき
かを決定する画素パターンマッチング手段と、該文字コ
ードパターンマッチング手段あるいは、画素パターンマ
ッチング手段のパターンマッチングの結果に基づいて、
該入力された複数の画像を結合する画像結合手段とを備
えることを特徴とする。
【0007】本発明によれば、画像を結合する際に、画
像に文字が含まれているか否かを自動で検出し、文字が
含まれている場合には、文字認識をして、文字認識の結
果の文字コードについてパターンマッチングをして、画
像を結合するので、入力された画像に一律に、画素毎の
色成分のパターンマッチングを行う従来の装置に比べ、
必要とされるメモリ容量や、処理時間を節約できる。ま
た、構成もシンプルに構成できるので、安価な装置を提
供できる。
【0008】
【発明の実施の形態】本発明の実施形態では、画像結合
装置を以下のように構成する。すなわち、画像結合装置
は、光学的に読み取られた情報を光電変換して画像デー
タとして入力する画像入力手段と、読み取った画像デー
タ中に、文字データが存在するか否かを検出する文字検
出手段と、文字データが存在すれば、文字データを利用
したパターンマッチングを行い、複数個の画像を結合す
る含文字画像結合手段と、文字データが存在しなけれ
ば、画素同士のパターンマッチングを行い、複数個の画
像を結合する非含文字画像結合手段とを備える。
【0009】スキャナやデジタルカメラなどから読み取
った画像データの多くは、RGB色成分を持つ多値画像
(フルカラー)もしくは、階調成分を持つモノクロ多値
画像(グレースケール)であり、これら多値画像を画像
処理するには非常に多くのメモリ容量と処理時間を要す
る。
【0010】例えば、画像処理の一つに、スキャナ幅を
超える大きな紙面を読み取るため、紙面を複数回に分け
て取り込み、アプリケーション上で自動合成するといっ
た処理が挙げられる。また、最近では、デジタルカメラ
を用いて、より大きな景色を取り込むため、景色を複数
回に分けて取り込み、アプリケーション上で自動合成す
るパノラマ撮影などがある。これらの処理は、複数の多
値画像を自動結合する処理であり、非常に多くのメモリ
容量と処理時間が必要となる。
【0011】本発明の実施形態では、入力画像がフルカ
ラーであっても処理に必要なメモリ容量を削減し、高速
かつ自動的に2つの画像を結合する画像結合装置を提供
する。
【0012】図1は、本実施形態による画像結合装置の
基本構成を示す図である。ハンドヘルドスキャナ等で読
み取った画像は画像入力手段1によって画像結合装置に
入力される。入力された画像に対しては、文字検出手段
2によって、文字が存在するか否かが調べられる。ここ
で、入力された画像は、文字を含む文書画像と、文字を
含まない写真画像に分類される。雑誌や新聞、報告書な
ど、スキャナで読み取る画像の多くは、文字データが含
まれている。また、従来デジタルカメラで入力した文書
画像などは、接写距離にもよるが大抵の場合、画素数が
足りないため、見にくいと言った問題や、文字認識など
の処理には適さないといった問題があった。しかし、近
年、デジタルカメラの高画素化により文書画像の入力が
増加してきている。
【0013】文字検出された画像に対しては、補正情報
検出手段3において、分割されて入力された画像をどの
ように結合すべきかを決定する情報が取得される。入力
された画像が文字を含む文書画像である場合には、文字
認識を行い、各画像における認識された文字を対応させ
ることによって、どのように結合させるかを決定する。
また、入力された画像が写真画像である場合には、各画
像の画素毎の色成分のパターンマッチングを行い、どの
ように各画像を結合するかを決定する。このようにして
決定された画像をどのように結合すべきかを示す補正情
報は、画像結合手段4に、各画像と共に入力され、実際
に画像結合が行われる。画像結合手段4の処理結果が求
める結合画像である。
【0014】文書画像を自動結合する方法として、特願
平11−111708号に記載された技術が挙げられ
る。この手法は、入力画像に含まれる文字データを文字
認識し、得られた文字コードの順序、一致度を比較する
ことで、高速に2つの画像の重なり位置を検出すること
ができる。そのため、画素の色成分のパターンマッチン
グから画像の重なり位置を自動検出する写真画像の自動
結合機能と比較すると、処理に必要なメモリ容量を低減
し、処理時間を大きく短縮することができる。
【0015】図2は、写真画像の結合方法を説明する図
である。デジタルカメラやスキャナで複数に分割して読
み取った写真画像の結合の仕方は、図2が示すように4
通りとなる。4通りの全てに対して画素の色成分のパタ
ーンマッチングを行って、重なり位置の検出を行うと、
非常に多くのメモリ容量、処理時間を要する。そこで、
従来のアプリケーションに搭載されている多くの画像結
合機能では、処理時間の問題から、ユーザが結合面を指
定する手法を取っている。しかし、画像結合装置として
は、画像結合するための結合面の検出は、自動であるこ
とが望ましい。そこで、本実施形態が示すように、画像
が文字を含む場合には、文字認識を利用した重なり位置
の検出手法を用いれば、高速処理が可能となる。
【0016】そこで、本実施形態に於いては、入力した
画像の中から文字データを検出し、文字データを含んで
いれば、文字データを利用したパターンマッチング(文
書画像結合)を行い、2つの画像の重なり位置の検出を
行う。文字データを含んでいなければ、画素の色成分の
パターンマッチングから2つの画像の重なり位置の検出
及び結合(写真画像結合)を行うようにする。
【0017】以上の処理により、写真画像の場合には、
文字が含まれていようがいまいが、一律に画素毎の色成
分のパターンマッチングを行う、従来の画像結合に比べ
て、本実施形態の場合には、高速に画像の自動結合を行
うことができる。
【0018】文書画像の自動結合機能には、特願平11
−111708号等に記載されている技術を用いる。写
真画像の自動結合機能には、特願2001−10753
2号などに記載されている技術を用いる。
【0019】文書画像の結合では、画像に含まれる文字
データを文字認識を利用して文字コードに変換し、2つ
の画像から検出した文字コードを比較することで、画像
の重なり位置を高速に検出することができる。しかし、
入力画像によっては、文字認識した結果、高い認識精度
を得られず、重なり位置を検出することができない場合
がある。
【0020】そこで、文字認識を利用した重なり位置検
出で重なり位置を検出できなければ、画素の色成分のパ
ターンマッチングから2つの画像の重なり位置の検出を
行うことで、画像結合の成功率の低下を防ぐようにす
る。
【0021】多値画像の画像処理は、非常に多くのメモ
リ容量、処理時間を要するため、文字を含む画像におけ
る文字データの検出には2値画像を用いる。入力画像が
多値(フルカラー、グレースケール)画像であれば、2
値化し、2値画像から文字データの検出を行うことで、
低メモリ、高速動作を実現する。
【0022】画像中に含まれる文字データの検出には、
文字認識を用いる。文字認識した結果、確信度がある一
定値以上となる文字数をカウントする。文書画像の自動
結合機能では、2つの画像に含まれる文字を文字認識
し、文字認識から得られた文字コードの一致を取り、両
画像の重なり部分を検出する。また、このとき、文字コ
ードの一致判定を文字領域毎(本実施形態では行単位)
で行う。ここで、認識結果の高い文字コードを、ある一
定個数以上含んでいなければ、一致判定を行うことがで
きないと判断することとする。
【0023】そのため、抽出した領域を文字認識し、確
信度がある一定値以上となる文字の個数をカウントし、
文字の個数がある一定個以上となるかを判別する。文字
の個数がある一定個以上となれば、文書画像自動結合機
能を利用可能となるため、入力画像が文書画像である
か、写真画像であるかの判別を行うことができる。
【0024】次に、画像の中から特定の条件を満たす画
像領域を抽出する。領域抽出に用いる画像は多値画像で
も白黒2値画像でもどちらでもよい。2値画像を用いれ
ば、低メモリ、高速動作を実現できる。
【0025】特定の条件を満たす領域として、例えば、
2値画像の中から、ある一定幅を持つ、白画素に囲まれ
た領域を抽出する。図3は、特定条件を満たす領域の文
字認識への利用方法を説明する図である。
【0026】図3に示すように、抽出した領域の横幅を
a、縦幅bとする。このとき、h min<a<h ma
x、v min<b<v maxの範囲にある領域を抽
出する。ここで、h minは、抽出した領域の横幅の
下限閾値であり、h maxは、抽出した領域の横幅の
上限閾値である。同様に、v min、v maxは、
それぞれ、抽出した領域の縦幅の下限及び上限閾値であ
る。例えば、図3中の、行1は範囲の中にあり、行2は
範囲外となり、行1のみを抽出する。
【0027】すなわち、この領域の判定処理により、行
2のように罫線など、文字ではない部分を文字認識を行
う領域から排除し、正しく文字を含む領域のみに対して
文字認識を行うようにする。これにより、罫線などにつ
いて文字認識処理を行うなどの無駄な処理を排除するこ
とができるので、処理データ量を削減することができ
る。
【0028】また、このように文字認識を行う前に前処
理として領域抽出を行うと、抽出した領域がなければ、
文字データが存在しないとみなすことができるため、高
速に文字データの検出を行うことができる。
【0029】また、領域の中に含まれる黒画素の数と白
画素の数を求め、領域中の黒画素の割合を求めるように
する。図3に示すように、行単位で領域を抽出した場
合、行1の中には黒画素がある一定の割合で存在する。
仮に、罫線を文字領域とみなして抽出したとしても、黒
画素の割合を求めれば、文字領域ではないことが分か
る。そのため、領域検出精度を向上することができる。
この場合には、黒画素の割合として、適切な閾値を設定
しておき、閾値で示される範囲内に黒画素の割合が入っ
た場合に文字領域であると判断することができる。
【0030】そして、前述の手法で抽出した領域を文字
認識すれば、画像全体を文字認識する必要がないため、
高速かつ高精度に画像に含まれる文字データの存在を検
出することができる。
【0031】図4は、文字データを利用したパターンマ
ッチングによる画像結合処理の説明をする図である。本
実施形態では、入力画像に含まれる文字データを文字認
識し、得られた文字コードを比較することで、画像の重
なり位置を検出する。文字コードを利用して重なり位置
を検出することで、画素(色成分)のパターンマッチン
グによる重なり位置検出方法と比較し、処理に必要なメ
モリ容量を低減し、非常に高速な処理を行うことができ
る。文書画像を自動結合する方法として、特願平11−
111708号に記載の技術を用いる。
【0032】図5は、画素の色成分を用いたパターンマ
ッチングによる重なり位置検出処理を説明する図であ
る。この手法は、画素の色成分を用いてパターンマッチ
ングを行うため、図4の画像結合処理と比較して、非常
に多くのメモリ容量と処理時間を要する。しかし、図4
の画像結合処理では文字データを含んだ画像のみ対応し
ており、図5の手法ならば文字データを含まない画像で
あっても結合することができる。また、図5の手法で
は、文字データを含んでいても、重なり位置の検出は可
能であるため、文字データを利用したパターンマッチン
グによる画像結合手法で、重なり位置の検出に失敗した
としても、図5の画像結合手法を用いて重なり位置を検
出することができる。
【0033】図6は、本発明の実施形態に従った画像結
合処理の全体の流れを示すフローチャートである。ま
ず、ステップS101において、読み取った画像から文
字データの抽出を行う。この処理は図7に詳細を示す。
次に定数doc flagを用意し、文字データを抽出
できたならば、文書画像の結合処理による高速処理を行
うためにdoc flag=TRUEとする。文字デー
タを抽出できなければ、写真画像の結合処理を行うため
にdoc flag=FALSEとする。
【0034】ステップS102において、doc fl
agを判別する。doc flag=TRUEであれ
ば、文字画像データから画像の重なり位置を検出するた
めステップS103に進む。doc flag=FAL
SEであれば、画素毎の色成分のパターンマッチングか
ら重なり位置を検出するためステップS106に進む。
【0035】ステップS103において、画像の重なり
位置を検出する。ここでは、特願平11−111708
号に記載の文書画像結合手法を用いる。この処理は低メ
モリ容量で、高速に処理することができる。
【0036】ステップS104において、重なり位置検
出の合否を判別する。検出に成功したならば、ステップ
S108に進む。検出に失敗したならば、ステップS1
05に進み、画素毎の色成分のパターンマッチングから
重なり位置を検出する。
【0037】ステップS105において、文字画像デー
タを用いた重なり位置検出に失敗したと判断されたの
で、doc flag=FALSEとする。ステップS
106において、画像の重なり位置を検出する。ここで
は、写真画像の結合処理のために特願2001−107
532号に記載の画像結合手法を用いる。
【0038】ステップS107において、重なり位置検
出の合否を判別する。検出に成功したならば、ステップ
S108に進む。検出に失敗したならば処理を終了す
る。ステップS108において、画像の結合処理を行
う。結合処理は、特願平11−111708号、もしく
は特願2001−107532号の手法を用いる。
【0039】結合処理が完了すれば全体の処理を終了す
る。図7は、図6のステップS101の詳細を示すフロ
ーチャートである。ステップS201において、入力画
像から2値画像を作成する。2値画像の作成は、特願2
000−259573号に記載の手法を用いる。
【0040】ステップS202において、2値画像から
文字領域の抽出を行う。文字領域の抽出の仕方は、図3
に示すようにする。抽出した領域の横幅をaとし、 h min<a<h max の範囲にある領域を抽出する。ここで、h minは横
幅の最小値、h maxは横幅の最大値である。
【0041】ステップS203において、抽出した領域
の黒画素の割合を調べる。領域に含まれる黒画素の数を
num、白画素の数をw numとし、下記の条件
を満たす領域のみを抽出する。なお、b per mi
nは黒画素の割合の最小値、b per maxは黒画
素の割合の最大値を示す。
【0042】b per min<(b num/(b
num+w num))<b per max ステップS204において、抽出した領域の数area
numが最低個数area threshよりも大き
ければステップS205に進み、小さければステップS
209に進む。 area thresh<area num ステップS205において、抽出した領域を文字認識す
る。
【0043】ステップS206において、認識結果の確
信度(認識結果の確からしさ:特願平10−14087
1号を参照)をocr concとし、 valu conc<ocr conc となる個数cet numをカウントする。ここで、v
alu concは文字認識が成功したと判断するため
の確信度の最小値である。
【0044】ステップS207において、cet nu
mがある一定個数以上となれば、文字認識に成功したと
みなしステップS208に進む。ステップS207にお
いて、条件を満たさなければ、失敗したとみなしステッ
プS209に進む。ここで、succ num min
は所定値以上の確信度のある認識文字の個数に対して、
文字認識が成功したと判断するための認識成功文字数の
最小個数を表す。 succ num min<cet num ステップS208において、入力画像は文書画像とみな
し、doc flag=TRUEとする。
【0045】ステップS209において、文字データが
検出できなかったため、doc flag=FALSE
とする。以上より処理を終了する。
【0046】以上の処理により、入力画像に文字データ
を含んでいれば、入力画像が多値画像であっても、処理
に必要なメモリ容量を削減し、高速かつ自動的に2つの
画像を結合することができる。
【0047】入力機器より読み込んだ画像から文字デー
タの有無を検出し、文字データを含んでいれば文字認識
を利用した画像結合手段により、処理に必要なメモリ容
量を削減し、高速かつ高精度に複数個の画像を結合す
る。また、文字データを含んでいなくても、画素毎の色
差のパターンマッチングを利用した画像結合手段によ
り、複数個の画像を結合する。
【0048】以上の処理により、小型のハンドヘルドス
キャナのように一度にスキャンできる幅が狭い場合であ
っても、スキャナ幅を超える大きな画像を取り込むこと
が可能となる。また、入力画像がフルカラーであって
も、処理に必要なメモリ容量を抑え、高速かつ高精度に
処理することが可能である。
【0049】以上のことから、本発明はハンドヘルドス
キャナによる画像入力の操作性及び、ユーザインターフ
ェースの改善に寄与するところが大きい。図8は、本実
施形態の処理をプログラムで実現する場合に必要とされ
るハードウェア環境を説明する図である。
【0050】当該プログラムを情報処理装置31で実行
する場合には、CPU21は、バス20を介して、ハー
ドディスクなどの記憶装置27から当該プログラムをR
AM23にコピーして実行する。ROM22は、BIO
Sなどの基本プログラムが格納されるが、当該プログラ
ムを格納するようにしても良い。
【0051】あるいは、フレキシブルディスク、DV
D、CD−ROMなどの可搬記録媒体29に当該プログ
ラムを記録して頒布することが可能であり、頒布された
当該プログラムを可搬記録媒体29から読み取り装置2
8で読み取り、RAM23にコピーしてCPU21が実
行するようにしても良い。あるいは、可搬記録媒体29
から当該プログラムを情報処理装置31にインストール
して使用しても良い。
【0052】入出力装置30は、ユーザの指示をCPU
21に伝えたり、CPU21の演算結果を出力するもの
で、ディスプレイ、キーボード、マウス、テンプレート
などや画像を読み取るためのスキャナ、画像を印刷する
ためのプリンタなどからなる。
【0053】通信インターフェース24は、ネットワー
ク25を介して、情報処理装置31を情報提供者26に
接続し、情報提供者26が持っているであろう当該プロ
グラムを情報処理装置31にダウンロードして、CPU
21が実行可能とするものである。あるいは、ダウンロ
ードするのではなく、情報提供者26とネットワーク2
5を介して接続したまま、ネットワーク環境の下で当該
プログラムを実行しても良い。
【0054】(付記1)複数回に分けて取り込まれた画
像を結合して1つの画像にする画像結合装置であって、
入力された複数の画像に文字が含まれているか否かを検
出し、文字が含まれている場合には、文字認識を行う文
字検出認識手段と、該入力された複数の画像に文字が含
まれている場合に、文字認識の結果得られた文字コード
のパターンマッチングによって画像をどのように結合す
べきかを決定する文字コードパターンマッチング手段
と、該入力された複数の画像に文字が含まれていない場
合に、画素の色成分のパターンマッチングにより画像を
どのように結合すべきかを決定する画素パターンマッチ
ング手段と、該文字コードパターンマッチング手段ある
いは、画素パターンマッチング手段のパターンマッチン
グの結果に基づいて、該入力された複数の画像を結合す
る画像結合手段と、を備えることを特徴とする画像結合
装置。
【0055】(付記2)前記文字認識は、入力された画
像から文字の含まれていると考えられる、抽出された領
域についてのみ行われることを特徴とする付記1に記載
の画像結合装置。
【0056】(付記3)前記文字コードパターンマッチ
ング手段が、文字コードによるパターンマッチングに失
敗した場合には、前記画素パターンマッチング手段が画
素パターンマッチングにより、前記入力された複数の画
像をどのように結合すべきかを決定することを特徴とす
る付記1に記載の画像結合装置。
【0057】(付記4)前記文字認識は、入力画像を2
値化した画像について行うことを特徴とする付記1に記
載の画像結合装置。 (付記5)前記文字検出は、抽出した領域を文字認識
し、文字認識から得られた確信度の値が一定値以上とな
る文字の個数を計数し、該計数された文字の個数が一定
値以上となったとき、前記入力画像に文字が存在すると
判断することを特徴とする付記1に記載の画像結合装
置。
【0058】(付記6)前記文字検出は、前記入力画像
から特定条件を満たす領域を抽出する処理を行い、結果
として特定条件を満たす領域が抽出されなかった場合に
は、文字が存在しないと判断することを特徴とする付記
1に記載の画像結合装置。
【0059】(付記7)前記領域中の黒画素の占める割
合が、特定の範囲内になる領域を文字を含む領域として
抽出することを特徴とする付記6に記載の画像結合装
置。 (付記8)複数回に分けて取り込まれた画像を結合して
1つの画像にする画像結合方法であって、入力された複
数の画像に文字が含まれているか否かを検出し、文字が
含まれている場合には、文字認識を行う文字検出認識ス
テップと、該入力された複数の画像に文字が含まれてい
る場合に、文字認識の結果得られた文字コードのパター
ンマッチングによって画像をどのように結合すべきかを
決定する文字コードパターンマッチングステップと、該
入力された複数の画像に文字が含まれていない場合に、
画素の色成分のパターンマッチングにより画像をどのよ
うに結合すべきかを決定する画素パターンマッチングス
テップと、該文字コードパターンマッチング手段あるい
は、画素パターンマッチング手段のパターンマッチング
の結果に基づいて、該入力された複数の画像を結合する
画像結合ステップと、を備えることを特徴とする画像結
合方法。
【0060】(付記9)複数回に分けて取り込まれた画
像を結合して1つの画像にする画像結合方法であって、
入力された複数の画像に文字が含まれているか否かを検
出し、文字が含まれている場合には、文字認識を行う文
字検出認識ステップと、該入力された複数の画像に文字
が含まれている場合に、文字認識の結果得られた文字コ
ードのパターンマッチングによって画像をどのように結
合すべきかを決定する文字コードパターンマッチングス
テップと、該入力された複数の画像に文字が含まれてい
ない場合に、画素の色成分のパターンマッチングにより
画像をどのように結合すべきかを決定する画素パターン
マッチングステップと、該文字コードパターンマッチン
グ手段あるいは、画素パターンマッチング手段のパター
ンマッチングの結果に基づいて、該入力された複数の画
像を結合する画像結合ステップと、を備えることを特徴
とする画像結合方法を情報処理装置に実現させるプログ
ラム。
【0061】(付記10)複数回に分けて取り込まれた
画像を結合して1つの画像にする画像結合方法であっ
て、入力された複数の画像に文字が含まれているか否か
を検出し、文字が含まれている場合には、文字認識を行
う文字検出認識ステップと、該入力された複数の画像に
文字が含まれている場合に、文字認識の結果得られた文
字コードのパターンマッチングによって画像をどのよう
に結合すべきかを決定する文字コードパターンマッチン
グステップと、該入力された複数の画像に文字が含まれ
ていない場合に、画素の色成分のパターンマッチングに
より画像をどのように結合すべきかを決定する画素パタ
ーンマッチングステップと、該文字コードパターンマッ
チング手段あるいは、画素パターンマッチング手段のパ
ターンマッチングの結果に基づいて、該入力された複数
の画像を結合する画像結合ステップと、を備えることを
特徴とする画像結合方法を情報処理装置に実現させるプ
ログラムを格納する、情報処理装置読み取り可能な記録
媒体。
【0062】
【発明の効果】本発明によれば、小型のスキャナで画像
を複数に分けて取り込んだ場合にも、ユーザが取り込ん
だ文書の種類を指定することなく、自動で最適な文書結
合方法を選択し、高速かつ使用メモリ容量をできるだけ
少なくして画像結合することができる。
【図面の簡単な説明】
【図1】本実施形態による画像結合装置の基本構成を示
す図である。
【図2】写真画像の結合方法を説明する図である。
【図3】特定条件を満たす領域の文字認識への利用方法
を説明する図である。
【図4】文字データを利用したパターンマッチングによ
る画像結合処理の説明をする図である。
【図5】画素の色成分を用いたパターンマッチングによ
る重なり位置検出処理を説明する図である。
【図6】本発明の実施形態に従った画像結合処理の全体
の流れを示すフローチャートである。
【図7】図6のステップS101の詳細を示すフローチ
ャートである。
【図8】本実施形態の処理をプログラムで実現する場合
に必要とされるハードウェア環境を説明する図である。
【符号の説明】
1 画像入力手段 2 文字検出手段 3 補正情報検出手段 4 画像結合手段
フロントページの続き (72)発明者 野田 嗣男 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 Fターム(参考) 5B057 AA11 BA02 CA01 CA08 CA12 CA16 CB01 CB08 CB12 CB16 CE10 CE12 DA07 DB02 DB06 DB08 DB09 DC25 DC32 5B064 AA07 5C076 AA12 BA06 CA10 5L096 AA02 AA06 DA01 EA43 FA44 FA45 FA69 GA08 GA41

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】複数回に分けて取り込まれた画像を結合し
    て1つの画像にする画像結合装置であって、 入力された複数の画像に文字が含まれているか否かを検
    出し、文字が含まれている場合には、文字認識を行う文
    字検出認識手段と、 該入力された複数の画像に文字が含まれている場合に、
    文字認識の結果得られた文字コードのパターンマッチン
    グによって画像をどのように結合すべきかを決定する文
    字コードパターンマッチング手段と、 該入力された複数の画像に文字が含まれていない場合
    に、画素の色成分のパターンマッチングにより画像をど
    のように結合すべきかを決定する画素パターンマッチン
    グ手段と、 該文字コードパターンマッチング手段あるいは、画素パ
    ターンマッチング手段のパターンマッチングの結果に基
    づいて、該入力された複数の画像を結合する画像結合手
    段と、を備えることを特徴とする画像結合装置。
  2. 【請求項2】前記文字コードパターンマッチング手段
    が、文字コードによるパターンマッチングに失敗した場
    合には、前記画素パターンマッチング手段が画素パター
    ンマッチングにより、前記入力された複数の画像をどの
    ように結合すべきかを決定することを特徴とする請求項
    1に記載の画像結合装置。
  3. 【請求項3】前記文字検出は、抽出した領域を文字認識
    し、文字認識から得られた確信度の値が一定値以上とな
    る文字の個数を計数し、該計数された文字の個数が一定
    値以上となったとき、前記入力画像に文字が存在すると
    判断することを特徴とする請求項1に記載の画像結合装
    置。
  4. 【請求項4】前記文字検出は、前記入力画像から特定条
    件を満たす領域を抽出する処理を行い、結果として特定
    条件を満たす領域が抽出されなかった場合には、文字が
    存在しないと判断することを特徴とする請求項1に記載
    の画像結合装置。
  5. 【請求項5】前記領域中の黒画素の占める割合が、特定
    の範囲内になる領域を文字を含む領域として抽出するこ
    とを特徴とする請求項4に記載の画像結合装置。
JP2002013954A 2002-01-23 2002-01-23 画像結合装置 Expired - Fee Related JP4444545B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002013954A JP4444545B2 (ja) 2002-01-23 2002-01-23 画像結合装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002013954A JP4444545B2 (ja) 2002-01-23 2002-01-23 画像結合装置

Publications (2)

Publication Number Publication Date
JP2003216944A true JP2003216944A (ja) 2003-07-31
JP4444545B2 JP4444545B2 (ja) 2010-03-31

Family

ID=27650781

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002013954A Expired - Fee Related JP4444545B2 (ja) 2002-01-23 2002-01-23 画像結合装置

Country Status (1)

Country Link
JP (1) JP4444545B2 (ja)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01228069A (ja) * 1988-03-08 1989-09-12 Toshiba Corp 画像つなぎ合せ装置
JPH04290066A (ja) * 1991-03-18 1992-10-14 Canon Inc 画像形成装置
JPH04316180A (ja) * 1991-04-15 1992-11-06 Oki Electric Ind Co Ltd 文書画像の属性判別方法
JPH05122501A (ja) * 1991-03-18 1993-05-18 Canon Inc 画像処理装置および画像処理方法
JPH0628520A (ja) * 1992-07-10 1994-02-04 Matsushita Electric Ind Co Ltd 文字認識装置
JPH07284013A (ja) * 1995-02-15 1995-10-27 Olympus Optical Co Ltd 画像取り扱い装置
JPH0822507A (ja) * 1994-07-08 1996-01-23 Matsushita Electric Ind Co Ltd 文書認識装置
JPH0993431A (ja) * 1995-09-26 1997-04-04 Canon Inc パノラマ画像合成装置
JPH1117924A (ja) * 1997-06-20 1999-01-22 Sharp Corp 画像合成処理方法
JPH1166234A (ja) * 1997-08-27 1999-03-09 Nippon Telegr & Teleph Corp <Ntt> 画像処理方法及びその方法を記録した記録媒体及び画像処理装置
JP2000175106A (ja) * 1998-12-08 2000-06-23 Minolta Co Ltd 画像合成処理装置、画像合成処理方法および画像合成処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000278514A (ja) * 1999-01-18 2000-10-06 Fujitsu Ltd 文書画像結合装置、文書画像結合方法及び文書画像結合プログラムを記録した記録媒体
JP2000293624A (ja) * 1999-04-09 2000-10-20 Canon Inc 画像処理方法、装置及び記憶媒体
JP2001216501A (ja) * 2000-02-03 2001-08-10 Minolta Co Ltd 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JP2002305647A (ja) * 2001-04-05 2002-10-18 Fujitsu Ltd 画像結合装置

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01228069A (ja) * 1988-03-08 1989-09-12 Toshiba Corp 画像つなぎ合せ装置
JPH04290066A (ja) * 1991-03-18 1992-10-14 Canon Inc 画像形成装置
JPH05122501A (ja) * 1991-03-18 1993-05-18 Canon Inc 画像処理装置および画像処理方法
JPH04316180A (ja) * 1991-04-15 1992-11-06 Oki Electric Ind Co Ltd 文書画像の属性判別方法
JPH0628520A (ja) * 1992-07-10 1994-02-04 Matsushita Electric Ind Co Ltd 文字認識装置
JPH0822507A (ja) * 1994-07-08 1996-01-23 Matsushita Electric Ind Co Ltd 文書認識装置
JPH07284013A (ja) * 1995-02-15 1995-10-27 Olympus Optical Co Ltd 画像取り扱い装置
JPH0993431A (ja) * 1995-09-26 1997-04-04 Canon Inc パノラマ画像合成装置
JPH1117924A (ja) * 1997-06-20 1999-01-22 Sharp Corp 画像合成処理方法
JPH1166234A (ja) * 1997-08-27 1999-03-09 Nippon Telegr & Teleph Corp <Ntt> 画像処理方法及びその方法を記録した記録媒体及び画像処理装置
JP2000175106A (ja) * 1998-12-08 2000-06-23 Minolta Co Ltd 画像合成処理装置、画像合成処理方法および画像合成処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000278514A (ja) * 1999-01-18 2000-10-06 Fujitsu Ltd 文書画像結合装置、文書画像結合方法及び文書画像結合プログラムを記録した記録媒体
JP2000293624A (ja) * 1999-04-09 2000-10-20 Canon Inc 画像処理方法、装置及び記憶媒体
JP2001216501A (ja) * 2000-02-03 2001-08-10 Minolta Co Ltd 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JP2002305647A (ja) * 2001-04-05 2002-10-18 Fujitsu Ltd 画像結合装置

Also Published As

Publication number Publication date
JP4444545B2 (ja) 2010-03-31

Similar Documents

Publication Publication Date Title
US7835589B2 (en) Photographic document imaging system
KR101399709B1 (ko) 모델-기반 디워핑 방법 및 장치
JP4631133B2 (ja) 文字認識処理のための装置、方法及び記録媒体
US8086031B2 (en) Region detection
US7751648B2 (en) Image processing apparatus, image processing method, and computer program
JP4189506B2 (ja) 画像処理のための装置、方法及び記録媒体
EP1569170A1 (en) Characteristic region extraction device, characteristic region extraction method, and characteristic region extraction program
US7437002B2 (en) Image recognition system utilizing an edge image and a binary image
US8077910B2 (en) Digital watermark embedding and detection
CN110647882A (zh) 图像校正方法、装置、设备及存储介质
US20040096121A1 (en) Image processing method and apparatus
CN114283156B (zh) 一种用于去除文档图像颜色及手写笔迹的方法及装置
JP2011008549A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
CN110210467B (zh) 一种文本图像的公式定位方法、图像处理装置、存储介质
JP2004165969A (ja) 画像処理装置および画像処理プログラム
JP2003216944A (ja) 画像結合装置
US11288536B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
AU2020273367A1 (en) Photographic document imaging system
JP2010287178A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP2008193234A (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
JP2007328652A (ja) 画像処理装置および画像処理プログラム
JP2023026170A (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム
JPH04276888A (ja) 文字読取装置
JP2023021595A (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム
JPH03217993A (ja) 文字サイズ認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070925

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080421

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080603

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080714

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100114

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130122

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130122

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140122

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees