JP3504585B2 - 画像取り込み装置及び画像取り込み方法 - Google Patents

画像取り込み装置及び画像取り込み方法

Info

Publication number
JP3504585B2
JP3504585B2 JP2000175628A JP2000175628A JP3504585B2 JP 3504585 B2 JP3504585 B2 JP 3504585B2 JP 2000175628 A JP2000175628 A JP 2000175628A JP 2000175628 A JP2000175628 A JP 2000175628A JP 3504585 B2 JP3504585 B2 JP 3504585B2
Authority
JP
Japan
Prior art keywords
image
distortion
character strings
character
control points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000175628A
Other languages
English (en)
Other versions
JP2001053966A (ja
Inventor
利行 海老原
和則 塩野谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP04109733A external-priority patent/JP3093869B2/ja
Application filed by Olympus Corp filed Critical Olympus Corp
Priority to JP2000175628A priority Critical patent/JP3504585B2/ja
Publication of JP2001053966A publication Critical patent/JP2001053966A/ja
Application granted granted Critical
Publication of JP3504585B2 publication Critical patent/JP3504585B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像取り込み装置
及び画像取り込み方法に係り、特に歪みのない平面画像
を得るための画像取り込み装置及び画像取り込み方法
関する。
【0002】
【従来の技術】従来の画像取り込み装置の代表例として
はゼログラフィーが挙げられる。
【0003】本技術では静電潜像を作成するための光導
電体を使用しており、高導電体面上をコロナチャージな
どによって帯電させる。そして、原稿台にセットした原
稿の像を光導電体面上に結像し、光導電体の電気抵抗を
低下させることによって原稿の非画線部の帯電を放電さ
せることによって静電潜像が形成する。
【0004】通常、上記原稿台はガラスなどの透明な材
質で出来ており、原稿はこの原稿台の上に伏せた状態で
セットし、原稿は原稿台を通して下面から読み取られ
る。
【0005】そして、光導電体面上のうち、原稿の画線
部の像が結像した部分は帯電が残っており、次の現像行
程で画線部にはクーロン力によってトナーが付着し、静
電潜像が現像され付着したトナーは紙に転写される。こ
のトナーは熱溶融性であるため加熱することによって溶
け、続いて常温まで冷却することによって紙面上に定着
する。こうして、紙面上に原稿の画像の複製が形成され
る。
【0006】一方、画像取り込み装置には、撮像素子と
してラインセンサやエリアセンサを用いたものがある。
上記ラインセンサを用いた画像取り込み装置の代表的な
ものとしてはスキャナーがあり、該複写機ではガラス面
上に被写体を置き、ガラス面の下からラインセンサを副
走査方向に移動させながら順次主走査方向に撮像を行う
ことで平面画像を得ている。
【0007】そして、上記エリアセンサを用いた画像取
り込み装置の代表的なものとしては電子スチルカメラが
あり、該電子スチルカメラではエリアセンサを用いるこ
とで被写体を1度に撮像し平面画像を得ている。
【0008】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の画像取り込み装置では、原稿台に原稿が密着
していない場合、均等であった原稿の字間が複製により
狭まったり行が曲がったりといった問題が生じる。
【0009】例えば、タイトバックの厚い本の見開きの
コピーを取る場合には、書籍中央のぺージ綴じ部分が書
籍の厚みのため原稿台に密着せずに、撮像装置からの距
離が一定とならないため撮影された文字が歪んでしま
う。
【0010】本発明は上記問題に鑑みてなされたもの
で、その目的とする所は、曲りによる歪みをもった文字
等を撮像するときに、その歪みを補正することで平面に
伸ばしたような歪みのない平面画像を得ることにある。
【0011】
【課題を解決するための手段】上記目的を達成するため
に、本発明の第1の態様による画像取り込み装置は、複
数の文字列を有する画像を撮像する撮像手段と、予め歪
みの分かっている複数の画像とそれらの歪みを反映した
複数の制御点の座標の組みとを学習した結果に基づき、
上記撮像手段により撮像された画像の上記複数の文字列
に、上記複数の文字列全体の歪みの状態に応じた所定の
数の制御点を少なくとも上記複数の文字列の内部に各々
生成する制御点座標生成手段と、上記各制御点の位置
それぞれ対応する、上記複数の文字列が歪む前の複数の
制御点位置をそれぞれ参照し、上記画像の各制御点の位
置を上記複数の文字列が歪む前の上記各制御点位置に移
動させて、上記複数の文字列全体の歪みを補正する歪み
補正手段と、を具備することを特徴とする。第2の態様
による画像取り込み装置は、上記第1の態様において、
撮像された上記画像を縮小する画像縮小処理手段を更に
備え、上記制御点座標生成手段は、上記画像縮小処理手
段によって縮小された上記複数の文字列に、所定の数の
上記制御点を生成することを特徴とする。第3の態様に
よる画像取り込み装置は、上記第1の態様において、
記複数の制御点によって複数の領域が形成され、上記歪
み補正手段は、上記各領域毎に上記複数の文字列の歪み
を補正することを特徴とする。第4の態様による画像取
り込み装置は、上記第1の態様において、上記画像を複
数のブロックに分割する手段を更に具備し、上記歪み補
正手段は、上記各ブロック毎に上記複数の文字列の歪み
を補正することを特徴とする。第5の態様による画像取
り込み装置は、上記第1の態様において、上記画像取り
込み装置は、複数の文字パターン候補を持つ文字認識を
行う手段を更に備え、上記文字認識を行う手段は、上記
画像から認識される上記文字列の文字と上記各文字パタ
ーン候補を比べて、最大の類似度を得た上記文字パター
ン候補を出力し、上記歪み補正手段は、上記画像のうち
文字として認識されなかった部分に対して更に上記歪み
の補正を行う、ことを特徴とする。第6の態様による画
像取り込み装置は、複数の文字列を有する画像を撮像す
る撮像手段と、上記撮像手段により撮像された上記画像
を縮小する画像縮小処理手段と、上記画像縮小処理手段
により縮小された画像の上記複数の文字列に、上記複数
の文字列全体の歪みの状態に応じた所定の数の制御点を
少なくとも上記複数の文字列の内部に各々生成する制御
点座標生成手段と、上記各制御点の位置と、予め設定し
た、上記複数の文字列が歪む前の複数の制御点位置とに
基づいて、上記複数の文字列全体の歪みを補正する歪み
補正手段と、を具備することを特徴とする。第7の態様
による画像取り込み装置は、複数の文字列を有する画像
を撮像する撮像手段と、上記撮像手段により撮像された
画像の上記複数の文字列に、上記複数の文字列全体の歪
みの状態に応じた所定の数の制御点を少なくとも上記複
数の文字列の内部に各々生成する制御点座標生成手段
と、上記各制御点の位置と、予め設定した、上記複数の
文字列が歪む前の複数の制御点位置とに基づいて、上記
複数の文字列全体の歪みを補正する歪み補正手段と、を
具備し、上記複数の制御点によって複数の領域が形成さ
れ、上記歪み補正手段は、上記各領域毎に上記複数の文
字列の歪みを補正することを特徴とする。第8の態様に
よる画像取り込み方法は、複数の文字列を有する画像を
撮像し、予め歪みの分かっている複数の画像とそれらの
歪みを反映した複数の制御点の座標の組みとを学習した
結果に基づき、撮像された上記画像の上記複数の文字列
に、上記複数の文字列全体の歪みの状態に応じた所定の
数の制御点を少なくとも上記複数の文字列の内部に各々
生成し、 上記各制御点の位置にそれぞれ対応する、上
記複数の文字列が歪む前の複数の制御点位置をそれぞれ
参照し、上記画像の各制御点の位置を上記複数の文字列
が歪む前の上記各制御点位置に移動させて、上記複数の
文字列全体の歪みを補正する、ことを特徴とする。第9
の態様による画像取り込み方法は、複数の文字列を有す
る画像を撮像し、撮像された上記画像を縮小し、縮小さ
れた上記画像の上記複数の文字列に、上記複数文字列全
体の 歪みの状態に応じた所定の数の制御点を少なくとも
上記複数の文字列の内部に各々生成し、上記各制御点の
位置と、予め設定した、上記複数の文字列が歪む前の複
数の制御点位置とに基づいて、上記複数の文字列全体の
歪みを補正する、ことを特徴とする。第10の態様によ
る画像取り込み方法は、複数の文字列を有する画像を撮
像し、撮像された上記画像の上記複数の文字列に、上記
複数の文字列全体の歪みの状態に応じた所定の数の制御
点を少なくとも上記複数の文字列の内部に各々生成し、
上記複数の制御点によって複数の領域を形成し、上記各
制御点の位置と、予め設定した、上記複数の文字列が歪
む前の複数の制御点位置とに基づいて、上記複数の文字
列全体の歪みを上記各領域毎に補正する、ことを特徴と
する。
【0012】
【作用】即ち、本発明の第1の態様による画像取り込み
装置では、撮像手段により複数の文字列を有する画像が
撮像され、制御点座標生成手段により、予め歪みの分か
っている複数の画像とそれらの歪みを反映した複数の制
御点の座標の組みとを学習した結果に基づき、上記撮像
手段により撮像された画像の上記複数の文字列に、上記
複数の文字列全体の歪みの状態に応じた所定の数の制御
点が少なくとも上記複数の文字列の内部に各々生成さ
れ、歪み補正手段により、上記各制御点の位置にそれぞ
れ対応する、上記複数の文字列が歪む前の複数の制御点
位置がそれぞれ参照され、上記画像の各制御点の位置が
上記複数の文字列が歪む前の上記各制御点位置に移動さ
れ、上記複数の文字列全体の歪みが補正される。第2の
態様による画像取り込み装置では、上記第1の態様にお
いて、画像縮小処理手段により撮像された上記画像が縮
小され、上記制御点座標生成手段により、上記画像縮小
処理手段によって縮小された上記複数の文字列に、所定
の数の上記制御点が生成される。第3の態様による画像
取り込み装置では、上記第1の態様において、上記複数
の制御点によって複数の領域が形成され、上記歪み補正
手段により、上記各領域毎に上記複数の文字列の歪みが
補正される。第4の態様による画像取り込み装置では、
上記第1の態様において、上記画像が複数のブロックに
分割され、上記歪み補正手段により、上記各ブロック毎
に上記複数の文字列の歪みが補正される。第5の態様に
よる画像取り込み装置では、上記第1の態様において、
複数の文字パターン候補を持つ文字認識を行う文字認識
を行う手段により、上記画像から認識される上記文字列
の文字と上記各文字パターン候補が比べられて、最大の
類似度を得た上記文字パターン候補が出力され、上記歪
み補正手段により、上記画像のうち文字として認識され
なかった部分に対して更に上記歪みの補正が行われる。
第6の態様による画像取り込み装置では、撮像手段によ
り複数の文字列を有する画像が撮像され、画像縮小処理
手段により上記撮像手段により撮像された上記画像が縮
小され、制御点座標生成手段により、上記画像縮小処理
手段により縮小された画像の上記複数の文字列に、上記
複数の文字列全体の歪みの状態に応じた所定の数の制御
点が少なくとも上記複数の文字列の内部に各々生成さ
れ、歪み補正手段により、上記各制御点の位置と、予め
設定した、上記複数の文字列が歪む前の複数の制御点位
置とに基づいて、上記複数の文字列全体の歪みが補正さ
れる。第7の態様による画像取り込み装置では、撮像手
段により複数の文字列を有する画像が撮像され、制御点
座標生成手段により、上記撮像手段により撮像された画
像の上記複数の文字列に、上記複数の文字列全体の歪み
の状態に応じた所定の数の制御点が少なくとも上記複数
の文字列の内部に各々生成され、歪み補正手段により、
上記各制御点の位置と、予め設定した、上記複数の文字
列が歪む前の複数の制御点位置とに基づいて、上記複数
の文字列全体の歪みが補正され、特に上記複数の制御点
によって複数の領域が形成され、上記歪み補正手段によ
り、上記各領域毎に上記複数の文字列の歪みが補正され
る。第8の態様による画像取り込み方法では、複数の文
字列を有する画像が撮像され、予め歪みの分かっている
複数の画像とそれらの歪みを反映した複数の制御点の座
標の組みとを学習した結果に基づき、撮像された上記画
像の上記複数の文字列に、上記複数の文字列全体の歪み
の状態に応じた所定の数の制御点が少なくとも上記複数
の文字列の内部に各々生成され、上記各制御点の位置に
それぞれ対応する、上記複数の文字列が歪む前の複数の
制御点位置がそれぞれ参照され、上記画像の各制御点の
位置が上記複数の文字列が歪む前の上記各制御点位置に
移動され、上記複数の文字列全体の歪みが補正される。
第9の態様による画像取り込み方法では、複数の文字列
を有する画像を撮像され、撮像された上記画像が縮小さ
れ、縮小された上記画像の上記複数の文字列に、上記複
数文字列全体の歪みの状態に応じた所定の数の制御点が
少なくとも上記複数の文字列の内部に各々生成され、上
記各制御点の位置と、予め設定した、上記複数の文字列
が歪む前の複数の制御点位置とに基づいて、上記複数の
文字列全体の歪みが補正される。 第10の態様による画
像取り込み方法では、複数の文字列を有する画像が撮像
され、撮像された上記画像の上記複数の文字列に、上記
複数の文字列全体の歪みの状態に応じた所定の数の制御
点が少なくとも上記複数の文字列の内部に各々生成さ
れ、上記複数の制御点によって複数の領域が形成され、
上記各制御点の位置と、予め設定した、上記複数の文字
列が歪む前の複数の制御点位置とに基づいて、上記複数
の文字列全体の歪みが上記各領域毎に補正される。
【0013】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態について説明する。
【0014】図1は、本実施の形態の構成を示すブロッ
ク図である。
【0015】同図に示すように、原稿読み取り部1はア
ナログ/ディジタル(A/D)変換器2を介して入力画
像メモリ3に接続されており、該入力画像メモリ3は画
像縮小処理部4及び画像変換部7に接続されている。そ
して、この画像縮小処理部4は縮小画像メモリ5に接続
されており、該縮小画像メモリ5は制御点座標生成部6
に接続されている。
【0016】さらに、この制御点座標生成部6は画像変
換部7に接続されており、該画像変換部7は補正画像メ
モリ8に接続されている。そして、この補正画像メモリ
8は画像記録部9に接続されている。
【0017】このような構成において、原稿読取り部1
により原稿の濃度が電気信号に変換されると、この電気
信号に変換された原稿の濃度情報はA/D変換部2によ
ってディジタル信号に変換され、入力画像メモリ3に記
憶される。そして、この入力画像メモリ3に記憶された
画像データは、画像縮小処理部4により縮小され、縮小
画像メモリ5に記憶される。
【0018】さらに、縮小画像メモリ5に記憶された画
像は制御点座標生成部6により読み出されて歪みの分析
が行われ、その歪みの状態に応じた16個の制御点各々
のx,y座標が算出される。この制御点とは、面像の変
換のために使われるものであり、画像の歪みを反映した
位置に生成される。本実施の形態では、これらの制御点
の位置を規則正しく配列した位置に移動する変換を行う
ことにより画像の歪み補正を行う。
【0019】上記制御点座標生成部6により算出された
16個の制御点のx,y座標は画像変換部7に出力され
る。そして、画像変換部7において、これらの座標デー
タを基に入力画像メモリ3から読み込んだ画像データの
歪み補正が行われ、歪みが補正された画像データは補正
画像メモリ8に書き込まれる。
【0020】こうして、画像記録部9により出力画像メ
モリ8から歪み補正された画像が読み出され、例えば紙
に複写記録される。
【0021】次に、上記画像の歪み補正の方法について
詳述する。
【0022】入力画像メモリ3に記録された画像を模式
的に表すと図2に示す様になる。画素数は例えば102
4×1024である。この画像は画像縮小処理部4によ
って縮小されて縮小画像メモリ5に記憶される。縮小画
像の画素数は例えば24×24である。
【0023】図3は、この縮小画像メモリに記憶された
画像を模式的に示した図であり、同図において、斜線で
示した画素は文字を含んでいる画素、即ち縮小前は文字
が有った画素が縮小されて出来た画素であり、これらの
画素は縮小前の文字の並びに従って、殆ど連続して示さ
れる。
【0024】図4は、制御点座標生成部6を構成してい
るニューラルネットワークを示す図であり、同図に示す
ように、ニューラルネットワークは制御点のx座標出力
用とy座標出力用の2つで1組となっており、組みの数
は制御点の数だけ用意し、1つのニューラルネットワー
クが1つの座標を担当する。
【0025】例えば、制御点の数を16個とした場合
は、ニューラルネットワークは32個必要となる。この
16個の制御点をP1,P2,P3・・・P16とする
と、1番目のニューラルネットはP1のx座標を出力
し、2番目のニューラルネットワークはP1のy座標を
出力する。そして、3番目のニューラルネットワークは
P2のx座標を出力し、4番目のニューラルネットワー
クはP2のy座標を出力する。
【0026】ニューラルネットワークの入力ユニットに
は縮小画像が入力される。
【0027】尚、図4では入力ユニットは5つだけしか
示していないが、実際には縮小画像の画素の数、即ち2
4×24個ある。
【0028】さらに、このニューラルネットワークは予
め学習をさせてあり、画像を入力するとその画像の歪み
に応じた位置に制御点を生成する。そして、上記学習は
誤差逆伝播学習(back propagation error learnin
g)などによって行う。
【0029】即ち、予め歪みの分かってる複数の画像
とそれらの歪みを反映している制御点Pi(i=1,
2,・・・16)の座標(xまたはy)を組みにしてニ
ューラルネットワークに繰り返して提示して学習をさせ
る。
【0030】以下、歪んだ画像と制御点の座標の算出方
法について詳述する。
【0031】まず、図5(a)に示すように、歪む前の
原画の上に等間隔に縦横それぞれ4本の平行線を仮想的
に引く。これらの平行線は16か所で交又する。平行線
は、この16個の交又点が囲む範囲が原稿の範囲をカバ
ーするように引く。ただし、平行線の歪んだ像は仮想的
に引くだけで、ニューラルネットワークに提示する画像
には実際には引かない。
【0032】次に、図5(b)に示すように、この画像
を任意の変形により歪ませる。
【0033】このとき、画像の歪み方は任意で良い。そ
して、歪んだ画像を更に前述した画像縮小処理部4と同
じ特性によって縮小する。ニューラルネットワークに
は、この縮小画像を提示する。
【0034】また、制御点の座標は歪んだ平行線が交又
する16か所の座標となる。即ち、制御点の座標は歪み
前の原画において一定間隔で均等に配置しておいた座標
が歪みによって移動した位置の座標である。
【0035】このように学習させたニューラルネットワ
ークに、図3に示すような縮小画像を読み込ませると、
図6中に黒点で示したような制御点の座標が出力され、
各点を図のようにP1,P2,P3…P16とする。
【0036】一方、補正画像メモリ8において、図7に
示すように格子点を設定し、その位置をQ1,Q2,Q
3・・・Q16とする。
【0037】画像変換部7は制御点の座標を参照し、補
正画像メモリ8のQ1,Q2,Q3・・・Q16に当たる
位置に入力画像メモリ3のP1,P2,P3・・・P16
の位置にある画像データを書き込む。また、補正画像メ
モリ8のうち、Q1,Q2,Q3・・・Q16の間にある
各画素位置には、入力画像メモリ3のP1,P2,P3
・・・P16の位置にある画像データから補間を行って対
応する値を求めて書き込む。
【0038】上記補間には様々な手法があるが、例えば
次のような手法を用いればよい。
【0039】即ち、図8(a),(b)のように画像メ
モリの領域を制御点及び格子点によって3角形の小領域
に分割する。問題は、図8(b)の中の任意の位置の画
像に対応する画素を図8(a)の中から探すことであ
る。
【0040】図9(b)は図8(b)の1つの3角形を
取り出して表したものである。
【0041】この3角形内部の画素をQとすると、ベク
トルQiQはベクトルQiQjとベクトルQiQkの一
次結像で表すことができる。そして、ベクトルQiQj
とベクトルQiQkの係数をそれぞれs,tとすれば、
次式のように表すことができる。
【0042】QiQ=s×QiQj+t×QiQk これを成分で表せば、s,tに関する連立1次方程式で
あるので、これを解いてs,tを、求めることができ
る。
【0043】一方、図9(b)の3角形に対応する図8
(a)内の3角形を取り出して表したものが、図9
(a)の3角形である。上述の方法で求めたs,tを用
い、次式によって定まる画素Pを求める。
【0044】PiP=s×PiPj+t×PiPk このように、画素Qに対応して画素Pが必ず1つ定ま
る。従って、画素Qには画素Pのデータ値を与えれぱよ
い。
【0045】以上説明したような補間により、出力画像
メモリの全ての画素の画像データを求めると、図10に
示すような歪が補正され文字配列の整った画像が完成
する。
【0046】本実施の形態では、歪む前の原画の上に仮
想的に引いた平行線は等間隔としたが、間隔は任意でよ
い。例えば、画像が大きく歪む可能性の高い画像の周辺
部で平行線の間隔が密になるように設定することで、同
じ数の制御点で一層効果的に歪み補正を行うことができ
る。
【0047】また、本実施の形態では、図17に示すよ
うな一般的な複写機ように原稿台の上に原稿を伏せる形
で原稿の読取りを行う方式を想定したが、図18に示す
ように遠隔撮影するようにしてもよい。
【0048】次に、図11は本発明の第2実施の形態に
係る画像取り込み装置の構成を示す図である。
【0049】同図に示すように、レンズ11に対面する
位置には撮像素子12が設けられており、該撮像素子1
2はビデオ処理部13に接続されている。そして、上記
ビデオ処理部13はA/D変換器14に接続されてお
り、該A/D変換器14は文字認識回路15に接続され
ている。
【0050】 さらに、上記文字認識回路15は補正回
路16、演算回路17、歪み記憶回路18にそれぞれ接
続されており、該歪み記憶回路18は補正回路16に接
されている。そして、上記補正回路16は演算回路1
7に接続されていると共に、該演算回路17は記憶媒体
19に接続されている。
【0051】このような構成において、上記レンズ11
により集光された光信号を受けると、撮像素子12によ
り該元信号は電気信号に変換される。そして、ビデオ処
理部13によりこの電気信号に変換された画像信号に対
してホワイトバランス調整、γ補正などの処理が行われ
る。そして、A/D変換器14により上記処理がされた
画像信号がアナログ信号からディジタル信号に変換さ
れ、文字認識回路15へ出力される。
【0052】上記文字認識回路15では、入力文字パタ
ーンと複数の文字パターン候補とのパターンマッチング
によりそれぞれの類似度が算出され、その中で最大類似
度を得た文字パターン候補を最終的な文字認識結果とし
て判定し出力することで文字認識が行われる。
【0053】或いは、更にニューラルネットワークを組
み合わせ、ある入力文字パターンの認識結果に誤りが生
じた場合、その入力文字パターンに対する次回からの文
字認識において正解の文字パターン候補が得られるよう
な方向性を持ってニューラルネットワークや重み付けを
補正することで安定な文字認識を行う事もできる。
【0054】上記文字認識回路15において、文字とし
て認識された信号は演算回路17へ出力され、文字とし
て認識されなかった信号は補正回路16に出力される。
また、文字認識する際に得られる歪情報信号、つまり認
識した文字に対して入力した文字がどの方向にどの位の
割合で歪んでいるかという情報は、その文字位置と同時
に歪記憶回路18に記憶される。
【0055】ここで、歪み情報を得るために文字認識を
行う際、撮像する対象が見開きの書籍であるということ
に着目する。見開きの書籍では歪みが生じるのは主に綴
代に近い中心部であり、しかも歪みの方向は書籍を開く
方向だけである。
【0056】このため、文字認識を行う際、書籍の中心
部に近い部分では精度の高い認識を行い、周辺の歪みの
少ない部分では精度を落とした認識を行ったり、一定方
向のみの文字認識を行うことで回路規模を縮小すること
ができる。
【0057】上記補正回路16では、この歪記憶回路1
8に記憶された情報を基に、補正回路16に送られてき
た文字認識されなかった信号に対して、その近傍にある
先に記憶した歪情報成分を打ち消すように補正が行われ
る。
【0058】具体的には、文字認識されなかった信号が
補正回路16に送られると、まず補正回路16によりそ
の信号の空間的位置が算出される。これは、撮像時の画
素位置から容易に計算することができる。
【0059】そして、この算出された位置の近傍にある
文字認識された文字が抽出される。
【0060】このとき抽出する文字は1つだけでなく複
数あっても良いし、さらに複数の摘出文字に対して文字
認識されなかった信号位置からの各々の距離に応じて重
み付けをしたものでも良い。
【0061】こうして抽出された1つ以上の文字につい
ては、これら文字が文字認識された際に得られた歪情報
信号が歪記憶回路8から読み出される。そして、文字認
識されなかった信号に対して、この歪情報信号を加算あ
るいは乗算することで歪が補正される。
【0062】上記演算回路17では、文字認識された信
号、即ち文字と、文字認識されず歪み情報信号を基に歪
補正された信号、例えば画像信号が加算され歪のない
平面画像が出力されフロッピー(登録商標)ディスクや
メモリカードといった記録媒体19に記録される。この
時、直接プリンタに出力することもできる、尚、これら
全ての動作はコントローラ20により制御される。
【0063】本実施の形態では、撮像素子12にエリア
センサを用いた例を挙げたが、撮像素子12はラインセ
ンサを用いたスキャナであってもよい。
【0064】図12は本実施の形態の使用例を示す図で
あり、図中、符号100は例えば電子スチルカメラなど
の画像取り込み装置、101は見開きになっている書
籍、102は書籍中央にある写真、104は写真の説明
文などを示す。
【0065】同図に示すように、書籍101には中央部
に写真102があり、書籍の厚みのため写真及びその付
近の文字は曲がってしまっている為、該書籍101を画
像取り込み装置100により普通に撮像しても得られる
画像には歪が現れてしまう。
【0066】本実施の形態によれば、このような画像の
歪みを解消することができる。
【0067】次に、図13は本発明第3の実施の形態に
係る画像取り込み装置のブロック図である。尚、本実施
の形態の使用例は先に図12に示した通りである。
【0068】同図に示すように、撮像部Aにおいて、レ
ンズ11aに対面する位置には撮像素子12aが設けら
れている。そして、上記撮像素子12aにはビデオ処理
部13aが接続されており、該ビデオ処理部13aはA
/D変換器14aに接続されている。
【0069】同様に、撮像部Bにおいて、レンズ11b
に対面する位置には撮像素子12bが設けられている。
そして、上記撮像素子12bにはビデオ処理部13bが
接続されており、該ビデオ処理部13bはA/D変換器
14bに接続されている。
【0070】そして、上記撮像部A及び撮像部Bはパタ
ーンマッチング回路21に接続されており、該パターン
マッチング回路21は補正回路16に接続されている。
さらに、補正回路16は記録媒体19に接続されてい
る。
【0071】このような構成において、撮像部A及び撮
像部Bにより撮像された画像は、パターンマッチング回
路21に出力される。
【0072】上記パターンマッチング回路21では、撮
像部Aで撮像された画像Aが図14(a)に示すように
複数のブロックに分割される。そして、分割された各
ロック毎に撮像部Bで撮像された画像Bとの相関を取ら
れ、相関値の最も高いところが算出される。
【0073】そして、画像Aの分割されたブロックの座
標と画像Bの相関値の一番高い座標とから、画像Aと画
像Bの各ブロック毎のずれ量が算出される。そして、こ
の各ブロック毎のずれ量と撮像部A,Bとの間隔から、
撮像部から被写体ロック部分までの距離が算出され
る。これにより各ブロック毎の撮像部からの距離が分か
り、この距離情報を基に補正回路16により歪が補正
される。
【0074】上記補正回路16では次のような処理が行
われる。即ち、まず被写体が平面であった場合には、撮
像部から被写体各ブロック部分までの距離は各ブロック
部分毎にある決まった一定値を持つ。ところが紙面が湾
曲したために、各ロック部分までの距離が変化してし
まう。この変化した後の距離が先にパターンマッチング
により算出された距離である。よって、この算出された
距離が本来平面であるときの距離に比べて遠いか近いか
を算出し、遠い場合には、その距離に比例してそのブロ
ックを拡大し、近い場合には、縮小することで距離の
さによる歪みを補正する。
【0075】こうして歪が補正された画像は記録媒体
19に記録される。この時、記録単位をブロックより細
かくすれぱ、ブロック化によるロック歪みの影響を抑
えることができる。
【0076】図15は、本発明の第4の実施の形態の構
成を示す図である。
【0077】同図に示すように、レンズ11に対面する
位置には撮像素子12が設けられており、該撮像素子1
2はビデオ処理部13に接続されている。そして、この
ビデオ処理部13はA/D変換器14を介して距離演算
回路22に接続されており、該距離演算回路22は距離
補正回路23に接続されている。さらに、距離補正回路
23は記録媒体19に接続されている。この他、レーザ
ー照射部24及びコントローラ20が設けられている。
【0078】このような構成において、レーザ照射部2
4からは、平面あるいは紙面に対してレーザー光が照射
される。そして撮像された画像はA/D変換された後、
距離演算回路22に送られて後述するような演算が行わ
れ、次に距離補正回路23に送られて距離の補正が行わ
れる。
【0079】以下、図16を参照して本実施の形態によ
る距離演算、補正について詳述する。
【0080】図16(a)に示すように、光源からのレ
ーザー光を平面に対して等間隔に照射する場合におい
て、上記平面上に書籍が置かれると、書籍の紙面に対し
てレーザー光は図16(b)に示すように当たることに
なる。
【0081】そして、図16(b)において、点124
a,124b,124cは平面上でレーザー光が当たる
位置、点125a,125b,125cは紙面に対して
レーザー光が当たる位置を示す。
【0082】さらに、図16(c)は、図16(b)の
一部を拡大した様子を示す図であり、同図において、点
126a,126b,126cは、それぞれ点125
a,125b,125cから平面に垂線を引いた場合の
接点を示す。
【0083】図16(c)より明らかなように、紙面を
真上から撮像したときレーザー光の当たる3点126
a,126b,126cの間隔は容易に求められるが等
間隔にはならない。そこで、一度レーザー光を照射しな
がら書籍を撮像し、レーザー光の当たる点124aと点
126aとの間隔Aを求める。そして、レーザーの位置
と平面の位置とからレーザー光が平面に当たる3点12
5a,124a,126aが成す角θを求める。
【0084】ここで、点124aと点125aとの間隔
B、点125aと点126aとの間隔Cは下記のように
表すことができる。
【0085】Bcosθ=A…(1) Bsinθ=C…(2) この両式よりBを消去すると以下のよう示される。
【0086】Atanθ=C…(3) 上記式(3)において、間隔A、角θの各値は先に求め
られているので、各値を代入することで点125aの高
さCを求めることができる。
【0087】同様の計算を3点124b,125b,1
26bについても行うことで、点125bの高さC'を
求めることができる。
【0088】そして、点126aと点126bとの間隔
Dは分かっているので、C−C’=Eを用いることで、
点125aと点125bとの間隔Fは、以下のように表
すことができる。
【0089】F=(D+E1/2 …(4) 上記式(4)より、間隔Dが小さくなれぱ間隔Fは紙面
上の点125aと点125bとの距離により近似される
ことが示され、本実施の形態では、この間隔Dを上記間
隔Fに広げることにより画像の歪を補正する。
【0090】尚、本実施の形態ではレーザー光を例に挙
げたが、レーザー光以外でも位置を特定できるものであ
れぱ良い事は明らかである。
【0091】以上詳述したように、本発明の画像取り込
み装置では、例えば百科辞典などのような厚い書籍を見
開きでコピーするような場合でも、書籍の厚みのため書
籍中央のぺ一ジ綴じ部分で文字が歪んで読みにくくなっ
てしまうことを防止できる。
【0092】さらに、文字認識を行う際に、書籍の中心
部に近い歪みの生じやすい部分では精度の高い認識を行
い、周辺の歪みの少ない部分では精度を落とした認識を
行ったり、一定方向のみの文字認識を行うことで回路規
模を縮小することもできる。
【0093】
【発明の効果】本発明によれば、曲りなどによる歪みを
もった文字等を撮像するときに、その歪みを補正し平面
に伸ばしたような歪みのない平面画像を得ることができ
る画像取り込み装置及び画像取り込み方法を提供するこ
とができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係る画像読み取り
装置の構成を示す図である。
【図2】入力画像メモリ3に記録された画像を模式的に
示す図である。
【図3】画像縮小処理部4によって縮小されて縮小画像
メモリ5に記憶された画像を模式的に示す図である。
【図4】制御点座標生成部6を構成しているニューラル
ネットワークを示す図である。
【図5】(a)は歪む前の原画の上に等間隔に縦横それ
ぞれ4本の平行線を仮想的に引いた様子を示す図で、
(b)は(a)に示す画像を任意の変形により歪ませた
様子を示す図である。
【図6】縮小画像メモリ5に記憶された縮小画像におけ
る制御点の座標を示す図である。
【図7】補正画像メモリ8において設定された格子点を
示す図である。
【図8】(a)及び(b)は画像メモリの領域を制御点
及び格子点によって3角形の小領域に分割した様子を示
す図である。
【図9】(a)は図8(a)に示す3角形を取り出した
様子を示す図で、(b)は図8(b)の1つの3角形を
取り出した様子を示す図である。
【図10】歪が補正され文字配列の整った画像を示す
図である。
【図11】本発明の第1の実施の形態に係る画像取り込
み装置のロック図である。
【図12】第1の実施の形態の使用例を示す図である。
【図13】本発明の第2の実施の形態に係る画像取り込
み装置のブロック図である。
【図14】(a)及び(b)は、それぞれ撮像部A,B
により撮影された画像を示す図である。
【図15】本発明の第3の実施の形態に係る画像取り込
み装置のブロック図である。
【図16】(a)乃至(c)は本発明の第3の実施の形
態の動作について説明するための図である。
【図17】従来のコピー機の外観を示す図である。
【図18】従来の電子写真機の外観を示す図である。
【符号の説明】
1 画像読取り部 2 A/D変換部 3 入力画像メモリ 4 画像縮小処理部 5 縮小画像メモリ 6 制御点座標生成部 7 画像変換部 8 補正画像メモリ 9 画像記憶部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) H04N 1/387 G06K 9/34

Claims (10)

    (57)【特許請求の範囲】
  1. 【請求項1】 複数の文字列を有する画像を撮像する撮
    像手段と、予め歪みの分かっている複数の画像とそれらの歪みを反
    映した複数の制御点の座標の組みとを学習した結果に基
    づき、 上記撮像手段により撮像された画像の上記複数の
    文字列に、上記複数の文字列全体の歪みの状態に応じた
    所定の数の制御点を少なくとも上記複数の文字列の内部
    に各々生成する制御点座標生成手段と、 上記各制御点の位置にそれぞれ対応する、上記複数の文
    字列が歪む前の複数の制御点位置をそれぞれ参照し、上
    記画像の各制御点の位置を上記複数の文字列が歪む前の
    上記各制御点位置に移動させて、上記複数の文字列全体
    の歪みを補正する歪み補正手段と、を具備することを特
    徴とする画像取り込み装置。
  2. 【請求項2】 撮像された上記画像を縮小する画像縮小
    処理手段を更に備え、 上記制御点座標生成手段は、上記画像縮小処理手段によ
    って縮小された上記複数の文字列に、所定の数の上記制
    御点を生成することを特徴とする請求項1に記載の画像
    取り込み装置。
  3. 【請求項3】 上記複数の制御点によって複数の領域が
    形成され、 上記歪み補正手段は、上記各領域毎に上記複数の文字列
    の歪みを補正することを特徴とする請求項1に記載の画
    像取り込み装置。
  4. 【請求項4】 上記画像を複数のブロックに分割する手
    段を更に具備し、 上記歪み補正手段は、上記各ブロック毎に上記複数の文
    字列の歪みを補正することを特徴とする請求項1に記載
    の画像取り込み装置。
  5. 【請求項5】 上記画像取り込み装置は、複数の文字パ
    ターン候補を持つ文字認識を行う手段を更に備え、 上記文字認識を行う手段は、上記画像から認識される上
    記文字列の文字と上記各文字パターン候補を比べて、最
    大の類似度を得た上記文字パターン候補を出力し、 上記歪み補正手段は、上記画像のうち文字として認識さ
    れなかった部分に対して更に上記歪みの補正を行う、こ
    とを特徴とする請求項1に記載の画像取り込み装置。
  6. 【請求項6】 複数の文字列を有する画像を撮像する撮
    像手段と、 上記撮像手段により撮像された上記画像を縮小する画像
    縮小処理手段と、 上記画像縮小処理手段により縮小された画像の上記複数
    の文字列に、上記複数の文字列全体の歪みの状態に応じ
    た所定の数の制御点を少なくとも上記複数の文字列の内
    部に各々生成する制御点座標生成手段と、 上記各制御点の位置と、予め設定した、上記複数の文字
    列が歪む前の複数の制御点位置とに基づいて、上記複数
    の文字列全体の歪みを補正する歪み補正手段と、を具備
    することを特徴とする画像取り込み装置。
  7. 【請求項7】 複数の文字列を有する画像を撮像する撮
    像手段と、 上記撮像手段により撮像された画像の上記複数の文字列
    に、上記複数の文字列全体の歪みの状態に応じた所定の
    数の制御点を少なくとも上記複数の文字列の内部に各々
    生成する制御点座標生成手段と、 上記各制御点の位置と、予め設定した、上記複数の文字
    列が歪む前の複数の制御点位置とに基づいて、上記複数
    の文字列全体の歪みを補正する歪み補正手段と、を具備
    し、 上記複数の制御点によって複数の領域が形成され、 上記歪み補正手段は、上記各領域毎に上記複数の文字列
    の歪みを補正することを特徴とする画像取り込み装置。
  8. 【請求項8】 複数の文字列を有する画像を撮像し、 予め歪みの分かっている複数の画像とそれらの歪みを反
    映した複数の制御点の座標の組みとを学習した結果に基
    づき、撮像された上記画像の上記複数の文字列に、上記
    複数の文字列全体の歪みの状態に応じた所定の数の制御
    点を少なくとも上記複数の文字列の内部に各々生成し、 上記各制御点の位置にそれぞれ対応する、上記複数の文
    字列が歪む前の複数の制御点位置をそれぞれ参照し、 上記画像の各制御点の位置を上記複数の文字列が歪む前
    の上記各制御点位置に移動させて、上記複数の文字列全
    体の歪みを補正する、ことを特徴とする画像取り込み方
    法。
  9. 【請求項9】 複数の文字列を有する画像を撮像し、 撮像された上記画像を縮小し、 縮小された上記画像の上記複数の文字列に、上記複数文
    字列全体の歪みの状態に応じた所定の数の制御点を少な
    くとも上記複数の文字列の内部に各々生成し、 上記各制御点の位置と、予め設定した、上記複数の文字
    列が歪む前の複数の制御点位置とに基づいて、上記複数
    の文字列全体の歪みを補正する、ことを特徴とする画像
    取り込み方法。
  10. 【請求項10】 複数の文字列を有する画像を撮像し、 撮像された上記画像の上記複数の文字列に、上記複数の
    文字列全体の歪みの状態に応じた所定の数の制御点を少
    なくとも上記複数の文字列の内部に各々生成し、 上記複数の制御点によって複数の領域を形成し、 上記各制御点の位置と、予め設定した、上記複数の文字
    列が歪む前の複数の制御点位置とに基づいて、上記複数
    の文字列全体の歪みを上記各領域毎に補正する、ことを
    特徴とする画像取り込み方法。
JP2000175628A 1992-04-28 2000-06-12 画像取り込み装置及び画像取り込み方法 Expired - Fee Related JP3504585B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000175628A JP3504585B2 (ja) 1992-04-28 2000-06-12 画像取り込み装置及び画像取り込み方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP04109733A JP3093869B2 (ja) 1992-04-28 1992-04-28 画像取り込み装置
JP2000175628A JP3504585B2 (ja) 1992-04-28 2000-06-12 画像取り込み装置及び画像取り込み方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP04109733A Division JP3093869B2 (ja) 1992-04-28 1992-04-28 画像取り込み装置

Publications (2)

Publication Number Publication Date
JP2001053966A JP2001053966A (ja) 2001-02-23
JP3504585B2 true JP3504585B2 (ja) 2004-03-08

Family

ID=32044521

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000175628A Expired - Fee Related JP3504585B2 (ja) 1992-04-28 2000-06-12 画像取り込み装置及び画像取り込み方法

Country Status (1)

Country Link
JP (1) JP3504585B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6837880B2 (ja) 2017-03-15 2021-03-03 株式会社東芝 画像処理装置、画像処理システム、画像処理方法、およびプログラム

Also Published As

Publication number Publication date
JP2001053966A (ja) 2001-02-23

Similar Documents

Publication Publication Date Title
JP3093869B2 (ja) 画像取り込み装置
JP3376077B2 (ja) 歪修正装置、歪修正方法及び画像処理装置
US5581637A (en) System for registering component image tiles in a camera-based scanner device transcribing scene images
EP1145568B1 (en) Software correction of image distortion in digital cameras
US6554431B1 (en) Method and apparatus for image projection, and apparatus controlling image projection
US7418126B2 (en) Image distortion correcting method and apparatus, and storage medium
KR101399709B1 (ko) 모델-기반 디워핑 방법 및 장치
US6256411B1 (en) Image processing device and method for detecting objects in image data
EP0701225A2 (en) System for transcribing images on a board using a camera based board scanner
JP5229050B2 (ja) 画像からの文書領域抽出装置、方法、及びプログラム
JP2000020682A (ja) 画像補正装置
JPS5814270A (ja) 画像走査記録方法
US6996290B2 (en) Binding curvature correction
US6366360B2 (en) Method and a system for correcting distortion aberrations in high resolution images
US20200327410A1 (en) Apparatus and process for visual recognition
JP2002074351A (ja) 歪み補正装置およびその方法ならびに歪み補正プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3175250B2 (ja) 原稿読み取り装置
JP3504585B2 (ja) 画像取り込み装置及び画像取り込み方法
JP3582988B2 (ja) 非接触型画像読取装置
JP2002165083A (ja) 画像処理方法及び、それを用いた非接触画像入力装置
JP6697726B1 (ja) 画像処理装置、スキャナ、プロジェクタ、画像処理方法、プログラム
CN102843479A (zh) 文件扫描方法、文件扫描装置及便携式电子装置
JPH10173905A (ja) 画像読取り装置
JP3852247B2 (ja) 画像形成装置及び転写画像歪み補正方法
JP3240899B2 (ja) 文書画像入力装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20031202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20031210

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081219

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081219

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091219

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees