JP3608955B2 - 非接触型画像読取装置及びそれを用いたシステム - Google Patents

非接触型画像読取装置及びそれを用いたシステム Download PDF

Info

Publication number
JP3608955B2
JP3608955B2 JP27695398A JP27695398A JP3608955B2 JP 3608955 B2 JP3608955 B2 JP 3608955B2 JP 27695398 A JP27695398 A JP 27695398A JP 27695398 A JP27695398 A JP 27695398A JP 3608955 B2 JP3608955 B2 JP 3608955B2
Authority
JP
Japan
Prior art keywords
unit
image
reading
distance
reading apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP27695398A
Other languages
English (en)
Other versions
JP2000115510A (ja
Inventor
啓介 中島
敏明 中村
伸一 篠田
義治 小西
光成 加納
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP27695398A priority Critical patent/JP3608955B2/ja
Priority to KR10-1999-0041687A priority patent/KR100402043B1/ko
Priority to TW088116689A priority patent/TW468331B/zh
Priority to US09/409,223 priority patent/US6721465B1/en
Publication of JP2000115510A publication Critical patent/JP2000115510A/ja
Application granted granted Critical
Publication of JP3608955B2 publication Critical patent/JP3608955B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Facsimile Scanning Arrangements (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、紙などの媒体に書かれた文書,印字された文字や図形,画像、または押印された印影等の情報を読み取り認識したり、照合したり、画像データとして入力する非接触型画像読取装置と、それに好適な制御方式および、それを用いたシステムに関するものである。
【0002】
【従来の技術】
現在製品化されている画像の入力装置としては、フラットベッドスキャナ,シートスキャナ,デジタルカメラ,書画カメラなどがある。しかし、フラットベッドスキャナは、解像度が高いが、設置面積が大きく,読取速度が遅い,シートスキャナは設置面積が小さいが、シート形状のものしか読めない。デジタルカメラは立体物が撮れるが、文書などの高解像度の画像が撮れないし、書画カメラは解像度が高く、立体物を読み取れるものもあるが大掛かりな装置でコストが高いというように、一長一短があり、ユーザーのニーズを満たしていなかった。
【0003】
非接触で文書を読むための発明としては、例えば特開平8−9102号(従来例1),特開平8−274955号(従来例2),特開平8−154153号(従来例3:ミラー)特開平8−97975号(従来例4:ブックコピー),特開平10−13622 号(従来例5:ホワイトボード),特開平9−275472 号(従来例6アクティブ照明)に記載されている方法がある。
【0004】
文献として紹介されているものでは、松山他、「多重フォーカス画像を用いたエッジ検出と距離 計測」,電子情報通信学会論文誌,Vol.J77−D−II,pp.1048−1058,1994,(文献1),児玉他、「焦点の異なる複数画像からの視差を含む任意焦点画像生成焦点外れ画像の生成を利用した全焦点画像の強調的取得」信学論Vol.J79−D−II,No.6,pp.1046−1053,1996/6,(文献2),Seong Ik CHO etc.”Shape Recovery of Book Surface Using Two Shade Images Under Perspective Condition”,T.IEE JAPAN,Vol.117−C,No.10,pp.1384−1390,1997(文献3)などがある。
【0005】
【発明が解決しようとする課題】
しかしながら、上記従来例では、略上方からの平面上の文書読み取りを前提としており(従来例1〜3)、また自由な位置からの読み取りができるわけではなかった。
【0006】
また、キャリブレーションマーカを読み取り測定位置を補正(従来例5:ホワイトボード)する提案もあるが、操作が複雑であると言う問題があった。
【0007】
また、センサから読取面の距離の測定も、観測物体を横から眺めるもの(従来例4:ブックコピー),アクティブ照明を用いるもの(従来例6:アクティブ照明),ステレオカメラを用いるものなどが提案されていたが、精度が悪かったり、コストがかかりすぎると言う問題があった。
【0008】
また、得た距離データから、正面画像を再構成する提案(文献1〜3)もあるが、計算機によるシミュレーションで、実際の商品として実用化するためには処理速度を改善する必要があった。
【0009】
本発明の目的は、折れ曲がった帳票や厚い本などの表面に書かれた文字などを操作性良く、高画質に読取可能な非接触型画像読取装置を提供することにある。
また、簡易で自由度の高い非接触型画像読取装置を提供することにある。
【0010】
【課題を解決するための手段】
上記問題点を解決するために、本発明は、画像を読み取る読取部と、その読取部の読取条件を変更する読取条件変更部と、変更された少なくとも2つの異なる読取条件で読み取った少なくとも2つの読取画像を記憶する記憶部と、記憶された少なくとも2つの読取画像を合成し、平面に展開する画像補正部とを有した構成にする。
【0011】
このように読み取り条件を変更して読み取ることで、その画像の変位を解析し、距離を測定できる。その距離から平面へ展開できる。また、原稿の上部だけではなく、様々な角度からの読み取りが可能となる。従って、折れた帳票や厚い本などを押さえることなく高画質に画像を読み取ることが可能となり、自由度が高く、操作性の良い簡易な構成の非接触画像読取装置を提供できる。
【0012】
また、本発明は、画像を読み取る読取部と、その読取部の読取条件を変更する読取条件変更部と、変更された少なくとも2つの異なる読取条件で読み取った少なくとも2つの読取画像を記憶する記憶部と、記憶された少なくとも2つの読取画像を合成し、平面に展開する画像補正部とを有するスキャナ部と、スキャナ部からの出力される画像補正信号を認識し、画像処理を行う画像処理部と、画像処理されたデータを表示する画像表示部と、画像処理されたデータを出力する画像記録部とを有したシステムとする。
【0013】
このようなシステム構成を有することにより、さらに操作性が良く、高画質な画像の読取が可能になることはもちろんのこと、パソコン等の画像処理部や、スキャナ部等を直接接続できることから、机上等の接地スペースが小さく、簡易な非接触型画像読取システムを提供できる。
【0014】
【発明の実施の形態】
以下、本発明の一実施例について図面を参照して説明する。
【0015】
図1は本発明の一実施例である非接触型画像読取装置の機能ブロック図を示したものである。本発明の装置は、スキャナ1で、机上などに置かれた文書を読み込み、画像の補正を行った後、パーソナルコンピュータ2にデータ転送し、文字や図形の認識,画像の処理などを実施し、認識結果や対象画像をディスプレイ3や補助ディスプレイ4に表示し、必要に応じてプリンタ5に出力する。
【0016】
本発明のスキャナ1は、読取部10で画像を読み取り、ディジタル化し、入力メモリ11に記憶する。この読み取りは、焦点位置制御部17の信号に基づき焦点を変更させたり、読み取りのあおり角を変えるなど読取条件を変更し、複数回読取処理を実施し、入力メモリ11には、複数枚の画像を蓄積する。ここで、焦点位置制御部17では、あらかじめ光学系と原稿の置かれる位置関係から求まる適正な複数の焦点位置、あおり角を設定しておき、順次このパラメータを組み合わせ、ユーザーの読取指示に基づきパルスモータを用いてスキャンしていく。これは例えば、ユーザーが読取指示すると、原稿台に焦点が合った状態で行きのスキャンを実行し、次に原稿台から上方3センチメートルの位置に焦点が合った状態で帰りのスキャンを行うというような往復のスキャンによる読取処理を行うことができる。
【0017】
この複数枚の画像を用いて、特徴点毎距離測定部12にて、画像間の偏差を計算し、特徴点を抽出する。ここでは、読取条件によって画像が異なる部分を特徴点と読んでいる。この特徴点の画像の異なり方によって距離を計測する。
【0018】
次に前記距離を用いて焦点補正係数計算部13で、焦点位置による「ボケ」の補正を行い、テクスチャーマッピング部15で焦点位置の近い画像の比率を大きくして画像の合成を行う。
【0019】
次に、透視補正道程計算部14で、読取時の幾何学補正,傾き補正,原稿が厚みを持っていたり、折れ曲がったりすることにより生じる画像歪みの補正量計算し、テクスチャーマッピング部15で画像を変形補正し、補正画像をフレームメモリ16に格納する。その後、パーソナルコンピュータ2にデータ転送する。
【0020】
このような構成にすることにより、特別な距離測定センサを必要としないため低価格な装置が提供できるという効果がある。また、特徴点毎に距離を計測できるので、たとえば副走査読取方向に歪んでいる物体だけではなく、複雑に折れ曲がった帳票や三次元物体表面の読み取りが可能にできるという効果がある。また、複数の焦点で読み取った画像を用いて画像を合成するために、ノイズやボケの少ない画像を得られるという効果がある。また、幾何学補正と距離補正を同時に実行するため画質劣化の少ない画像を提供できるという効果がある。また、パーソナルコンピュータとスキャナを直接接続できるため、机上の設置スペースが小さいという効果がある。以下、各機能に関し、詳細に説明する。
【0021】
図2は、本発明のスキャナ1のハードウエアブロック図を示したものである。先に説明した機能は、実際は図2の構成で実現する。処理範囲が大域的で、処理内容が単純で高速処理が必要な部分はハードウエアで、処理範囲が限定され、複雑であるが処理時間がかかっても良いものはCPU20によるソフトウエアで実現する。対象の文書画像は、レンズ171を介して読取部10のリニアセンサ101で光電変換し、入力メモリ11に転送する。CPU20で距離計算,係数計算を実施し、テクスチャーマッピング部15へパラメータを設定し、フレームメモリ16へ処理後の画像を展開する。フレームメモリ16は複数の領域に分割されており、SCSI等のインターフェイス部40を経由して非同期にパーソナルコンピュータ2へ転送を可能としている。これらの処理の起動は、取り込みボタン199で起動指示する。
【0022】
このような構成にすることにより、複雑な計算をCPU20で、処理速度が必要な処理をハードウエアで実行できるため、低価格なシステムを提供できるという効果がある。また、フレームメモリ16を用いて、スキャン処理とパーソナルコンピュータ2への読み出し処理を同期化する必要がなくなるため、SCSIなど標準インターフェイスを利用でき、パーソナルコンピュータ2と直結できるという効果がある。
【0023】
図3は、スキャナ1の外観図を示している。スキャナ1は、原稿台174上の原稿175をレンズ171を介して読むことが目的で、球形などの筐体に収められ、リニアセンサ101はパルスモータ179で駆動される可動部172上に取り付けられリニアセンサ101を移動することで副走査移動を実現している。ここで、読み取りが原稿の真上から読み取れば原稿とセンサの移動面は平行となるが、真上では利用者の邪魔になるし、設置も一般的に困難な場合が多いので斜め上方からの読み取りを行っている。このため、焦点位置を平面上にあわせるため、リニアセンサ101の移動は原稿に対し「あおり角θ」を有している。処理部のハードウエアは制御基板18に搭載し同一筐体内に収められている。支持棒
173は、スキャナ1を固定しており、これに沿ってパーソナルコンピュータ2へのインターフェイスケーブルが敷設されている。このような構成とすることにより、原稿の真上に読取部がないため、利用者があやまって頭などを接触させる可能性が少なくなり操作性が向上するという効果がある。
【0024】
図4は、読取部10を含むスキャナ1の読取動作のフローを示している。取り込みボタンが押下されたら1001、初期化が必要かどうか判定し1002、必要であれば初期化を行う。初期化は、パーソナルコンピュータ2内のスキャナドライバを起動したり1007、シェーディング波形を記憶したり1008、読取位置を基準マークなどで正規化1009する等である。正規化が済めば正規化終了をフラグとして記憶しておく。
【0025】
次に、パルスモータ179を正回転1003し、第1の焦点位置で読み取りを行う1004。これで、原稿面上に焦点を合わせた画像を入力する。読取領域をスキャンしたら、今度は、パルスモータを逆転し1005、第2の焦点位置にて読取1006を行う。これで、厚みのある原稿を読めるよう焦点位置に調整しておく。必要に応じ、焦点位置やあおり角などの読取条件を変化させ画像を入力する。これらの画像から距離測定し、三次元補正1010を実施し、パーソナルコンピュータ2へデータ送信する1011。
【0026】
このような構成とすることにより、往復で読取条件を違えて画像を読み取ることができ、距離測定のためのオーバーヘッドを削減できるという効果がある。また、取り込みボタンをスキャナに装着することでスキャナの読取位置を調整した直後に位置合わせ構成が可能となり操作性が向上できるという効果がある。
【0027】
図5は、読取部10の詳細ブロック図を示している。リニアセンサ101で原稿の光学的な信号を1ライン単位でアナログ電気信号に光電変換し、アンプ102で増幅し、A/D変換器103でディジタルデータに変換し、歪み補正LSI104にデータ転送する。歪み補正LSI104は、あらかじめ白紙の画像データを歪み補正メモリ105に記憶しておき、読取時に読み出しながらシェーディング補正部107にて歪み補正を行う。次に、ガンマ補正部108でガンマメモリ106に記憶している変換テーブルに従いリニアリティーの補正を行う。このガンマメモリ106の内容は、センサで徐々に濃度を変化させたグレーチャートを読み取り、その信号から、濃度に比例した信号が出力できるように逆変換したテーブルを設定している。その後、ピーク値検出部109でライン内の最大輝度値をピーク値110として記憶し、DMAC(Direct Memory Access Control)111を経由して、ラインデータとともに入力メモリ11に書き込む。ここでDMAC111 は、処理したデータに対しメモリへの格納アドレスを発行し、所定領域にデータ書き込みを実行する。
【0028】
このような構成とすることで、蛍光燈のチラツキをピーク値として取り込み、補正することができ、高精度な画像を得ることができるという効果がある。
【0029】
図6は、シェーディング補正部107の原理を示している。シェーディング補正とは、たとえば白紙を読み取った信号を参照白レベルとして正規化する処理である。これは、原稿読み取りを行うと、中央部が明るく、周辺部が暗い、また、センサのドット毎に感度のバラツキを補正するために実施している。
【0030】
図6(a)は原稿読取時の入力データSiを白紙読取信号であるシェーディングデータPiで補正する際の概念図である。Poは、正規化参照値で、最大レンジと考えて良い。正規化後のデータSoはSi*Po/Piと表現できる。ここで1回の乗算と、1回の除算が発生するため、演算で処理すると時間がかかってしまう。このため、(b)に示す、変換テーブルを用いて、1回のテーブル索引で補正を実施した。このテーブルは、入力データSi,シェーディングデータ
Piに対して、結果Soをすべて計算し記憶しておけば、処理時は、入力データSi,シェーディングデータPiの2つのパラメータでテーブルを検索するだけですむ。このような構成とすることで、除算器等大きな論理を用いることなく、高速に補正が実現できるという効果がある。
【0031】
図7は、読取部10の歪み補正メモリ105内の変換テーブルの構成を示している。図7(a)は、そのアドレスマップの一例を示している。例えば、8ビット/8ビットの除算結果を格納する64kワードの除算テーブル領域(0−64kワード)と、ライン毎の白画像の読取データを示すシェーディングデータを記憶する領域(64k−128kワード)に別れているとする。シェーディングデータの領域は、さらに細かく分割し、図7(b)に示すように、副走査ブロック位置毎の波形を記憶している。たとえばシェーディング波形SD0は、読取開始ライン付近のシェーディング波形を示し、SD7は、読取終了ライン付近のシェーディング波形を三次元的に表示している。SD2〜SD5は、これらの中間位置のラインでのシェーディング波形を示している。これらの分割量は、事前に光学系の特性等から決定している。これにより、非接触読取のため、照明の当り方やレンズの特性などによりラインによって大きくシェーディング波形が異なっていることを補正している。図7(c)では、テーブルアクセスのタイミングチャートを示している。このシェーディングデータ読み出しと除算テーブル検索は、50nS単位で交互に繰り返され、10MHzのセンサデータ入力に対応している。これらの複数のシェーディング波形は、読取ライン位置に応じて切り替えて読み出すことにより、読取ラインに近いシェーディング波形を用いて補正が可能になった。
【0032】
このような構成とすることにより、複数のシェーディング波形を記憶し、これを切り替えて読み出すことにより、二次元的に光量分布となっている読取条件下でも、高精度な補正が実現でき、高画質な画像が得られるという効果がある。
【0033】
次に、三次元補正の説明を行う。
【0034】
図8は、三次元補正の特徴点毎距離測定部12の概要を示した機能ブロック図である。入力メモリ11内の複数の画像データA,Bを用いて、座標位置補正部121により座標位置の補正を行い、分散画像作成部122により画像間の偏差を検出するため分散画像を作成し、これから特徴点抽出部123により特徴点を抽出し、この特徴点に関して距離計測部124によって距離の計測を行い、特徴点毎の距離データDを作成し、入力メモリ11に格納する。
【0035】
まず、座標位置補正部121は、焦点の変化に伴う、拡大縮小率の変化を補正する。これらを求めるには、あらかじめ作成した基準点列を、焦点を変化させて画像を読み取って、そのボケ特性,分散値などを比較しておけば、容易に特性を把握できる。次に分散画像作成部122は、複数枚の画像間の分散値を計算する。ここで分散画像は、複数の画像間の同じ画素位置での画素データの差を定量化するために用いている。具体的には、画像のデータ間の差を二乗したものと、画素のデータを二乗したものの差を比較することで定量化する手法である。次に特徴点抽出部123で、分散値を特定の閾値で比較すれば、容易に特徴点をこの分散画像データが、あらかじめ設定した閾値を越えるもの、つまり画像間の偏差の大きいものが特徴点として抽出できる。これは、たとえば浮き上がった紙片の端部などが候補としてあげられる。
【0036】
このような構成とすることにより、読取条件が異なる複数の画像のみから、距離測定が実現でき、特殊な距離センサが不要にできるという効果がある。
【0037】
図9(a)は、特徴点毎距離測定部12内の距離計測部124の詳細なブロック図を示している。まず、特徴点の並びと直交する法線方向輝度変化直線を作成し1021、これらを用いて同じ輝度をむすんだ等輝度直線を作成し1022、焦点が結ばれる位置からのカメラからの距離を計算し1023、これらの位置関係から三次元の位置情報を計算する1024。図9(b),(c)光学系の焦点位置と原稿読取位置によって画像がどのように観測されるかを概念的に示した図である。PA,PBは原稿を置く位置で、図示していない左側からこれらの原稿を読み取っている。図中の点線は光軸を示しており、実線は光束の一部を示しており、焦点位置で集約している。図9(b)の、原稿が読取位置PAに置かれており、光学系の焦点がPAの位置にあっている場合の画像で、白と黒の境界を読取画像1026のようにボケなく読み取ることができる。同じ焦点位置で、原稿がPBの位置にあった場合は、原稿の白と黒の境界が、ボケが発生し、読取画像は1025のように境界がはっきりしない画像となる。この場合は、読取画像1026をそのまま用いれば良い画像を得ることができる。図9(c)は、焦点位置が原稿の読取位置PBに近い点で焦点の合う場合を示しており、原稿の読取位置PAでもPBでも、読取画像1027,1028のようにボケている。この場合は、これらの二つの読取画像1027,1028を用いて画像を合成することで高画質な出力画像を提供する。
【0038】
このような構成とすることで、焦点の異なる画像から精度高く距離データを計測できるという効果がある。
【0039】
次に、焦点補正係数計算部13の機能に付いて詳しく述べる。
【0040】
図10(a)は、画像の高さ位置Zによって線のボケf(Z)が、どのように変化するかの概念図である。ここでボケf(Z)は、あらかじめ設定した閾値で分散画像を二値化した際の線の幅と考えられる。単位は画素のドット数である。第1の焦点位置の高さをZ0(距離データ),第2の焦点位置の高さをZ1とすると、第1の焦点位置での画像は実線でのグラフのようにボケ幅が変化し、単調増加となる。第2の焦点位置での画像は破線でのグラフのようにボケ幅が変化し、Z1で最小値を取る二次曲線に似た形状になる。このグラフを用いて、複数の画像のボケ量から距離が推定できる。図10(b)は、副走査位置Yによる焦点位置Z0,Z1の変化の様子である。あおり角のある読取系のため、Z0は、Y位置に依存しないが、焦点位置を変化させるとZ1は曲面を描いて変化する。このため、副走査位置Yに応じて距離計算の補正が必要である。
【0041】
次に透視補正道程計算部14に関して述べる。
【0042】
図11(a)は、透視補正道程計算部14における道程計算の概念図を示している。これは、ある副走査位置における特徴点の距離データをマッピングした図である。本来は、前述したように二次元的に分布する特徴点(分散画像で変位が大きいと判定された点)のそれぞれに対し距離データZを計算しているが、ここでは説明を簡単にするためX方向に関し距離データZを丸印で示し、測定点の分布を表している。まず、この測定点を直線近似し、(b)のように直線の端点P,Q,R,S,Tのみを抽出し、道程距離としての端点間の距離を測定する。これは、たとえば端点間P,Qの距離は読取画像データ上ではP,Q間の距離はX軸上に写像した形で観測されるが、実際は紙が傾いているため、短く見えている。これを紙上での端点P,Qの距離を、たとえば三平方の定理などを用いて測定することで道程を把握できる。この距離に基づいて、(c)のように基準点P′を基に、それぞれの道程距離に応じて端点Q′,R′,S′,T′のように、端点毎に展開した位置情報を引き継ぎながら、平面に並べて展開する。これは、三次元グラフィックスで用いられているテクスチャーマッピングの技術の適用が可能である。
【0043】
図12は、図11を平面に拡張した概念図の一例を示す。図12(a)のように折れ曲がった帳票を、上方から観測した場合、図12(b)のように見えるが、図11で説明した二次元の道程計算を三次元に拡張し、距離情報に基づき道程計算し、平面に展開すると図12(c)のような合成画像が得られる。このようにすれば、折れ曲がった帳票や曲がった曲面に書かれた文字も、平面に押し付けて、正面から観測した合成画像を得ることができる。
【0044】
図13に、透視補正道程計算部14の処理フローを示す。特徴点の距離データを入力し、図11で説明したように、特徴点を直線近似1401し、不要な特徴点を削除した距離データを生成する。次に、図12で説明したように、これらの特徴点が作る平面を近似作成する1402。これは近接する3点を選び、これから構成される平面と、上記3点の周辺特徴点の距離を計算し、あらかじめ設定した閾値よりも小さければ、上記平面に近似し併合するという処理を繰り返す。これらを三角形に近似しポリゴンとして記述し1403、その座標関係や接続関係の整合性をチェックし、修正し、距離データで作成した三次元モデルから二次元の原稿台平面へテクスチャーマッピングするための座標位置や拡大縮小率などの展開係数を計算する1404。
【0045】
いわゆる、凹凸のある原稿の特徴点を直線近似し、傾きのある直線を道程計算し、平面に引き伸ばして、水平な凹凸の無い原稿を真上から読み取ったような状態に展開することを、ポリゴン毎に行い、高画質な画像とする。
【0046】
このような構成とすることで、特徴点について求めた距離データを用いて画像を平面展開でき、折れ曲がった帳票や厚い本の表面でも正しく原稿を補正して読むことができるという効果がある。
【0047】
次に、透視変換について述べる。本実施例では、透視変換を上述した透視補正道程計算部14にて計算され、テクスチャーマッピング部15にて実行される。これは、読み取りを文書の正面上方ではなく、斜め上方から読むため、近くは大きく、遠くは小さく観測される。これを正面から見たように変更するのが透視変換である。
【0048】
図14(a)は、透視変換の概念図を示している。正面から観測した画像を矩形PBCQとすると、斜め上方から観測すると矩形ABCDのように見える。辺ADが近くの辺で、辺BCが遠くの辺である。斜め読みの光学系は、遠くの辺でも読取解像度を保証できるように設計されるため、辺BCを共通に揃えるとすると、辺ADは、辺PQに比べ長く、また、辺ABも辺PBに比べ長い。透視変換の目的は、観測した矩形ABCDを矩形PBCQに変換することにある。図15(b)は、変換のための変数定義を示している。辺ADの長さをSrc_Width ,辺BCの長さをDest_Width,座標Aと座標Bのx方向の差をDx_Left ,y方向の差をDy_Leftとする。このハッチがかかった部分が読取領域である。
【0049】
図15は、透視変換のフローを示している。まず、入力メモリ11内の読取領域の画像取り出しスタート位置を計算する1501。このスタート位置xiは、始めはA点であるが、副走査ラインyの関数であり、y*Dx_Left/Dy_Leftと表現できる。次にライン単位に長さをDest_Width に揃える必要があるため、ライン毎に縮小率を計算する1502。これは、まず注目ラインの長さx_widthを計算する。これは、簡単な比例計算により、
x_width=(Dest_Width+((Src_Width−Dest _Width)*(Dest_Length−y) /Dest_Length))
と表現できる。縮小率は、Dest_Width/x_widthとなる。しかし、小数点を用いる計算は、時間がかかるので、実際の処理はDDA(Digital Differential Analyzer)を用いる1503。その後縮小処理を終了するか否かを判断し1504、否の場合は、再び上記工程を繰り返す。
【0050】
このような構成とすることで、処理時間のかかるテクスチャーマッピング処理を簡単なハードウエアで実現でき低価格で高速な処理システムが提供できるという効果がある。
【0051】
図16は、テクスチャーマッピング部15における画像合成の方式とハードウエア構成図を示している。図16(a)は、計測されたレンズ位置から原稿の特徴点までの距離データZによって、第1の焦点距離Z0での画像g0(Z)と第2の焦点距離Z1での画像とg1(Z)の混合比率を表わすグラフである。Z軸のZ1からgn(Z)軸上の1までの破線は距離データZに対する第1の焦点距離Z1での画像g1(Z)の混合比率を示し、Z軸のZ0からgn(Z)軸上の0までの直線は距離データZに対する第2の焦点距離Z0での画像g0(Z)の混合比率を示している。焦点距離がZ0にあっていれば、第1の焦点距離Z0での画像g0(Z)だけを用いれば良く、焦点距離がZ1にあっていれば、第2の焦点距離Z1での画像g1(Z)だけを用いれば良い。もし、焦点距離がZ0とZ1の中間にあっていれば、第1の焦点距離Z0での画像g0(Z)と第2の焦点距離Z1での画像g1(Z)を半分ずつ用いれば良い。一般的にいえば、測定距離がZpであった際、第1の焦点距離での画像はg0(Zp)、第2の焦点距離での画像はg1(Zp)で混合することで、出力画像を生成している。
【0052】
上記実施例では、2つの異なる焦点距離での画像を読み取り、画像合成した例を示したが、本発明は、2つのみだけではなく、複数、異なった焦点距離にて画像を読み取っても適応できる。複数の異なった読取条件である焦点距離にて、複数の画像を読み取った場合、望ましくは、実際の原稿のある焦点位置を挟む焦点距離2つを用いて上述したような画像合成を行うほうがノイズの少ない高画質な画像を得られる。
【0053】
また、上記例では、読取条件に焦点距離を用いたが、あおり角θを用いて行っても上記と同様な効果を得ることができる。
【0054】
図16(b)は、画像合成部のハードウエア構成図である。入力メモリ11内の第1の焦点距離での画像1301を読み込み、画像1301のボケを補正するボケ補正フィルタ1304を通して、配分器1307で比率調整し、入力メモリ11内の第2の焦点距離での画像1302を読み込み、画像1302のボケを補正するボケ補正フィルタ1305を通して、配分器1308で比率調整し、調整された2つの画像を加算器1310で合成し、ラッチ1311でタイミング調整し出力信号G_Out1312を出力する。ここで、ボケ補正フィルタ1304,
1305は、距離に応じて画像に生じたボケを修復するフィルタであり、一般的にはエッジ強調フィルタで代用が可能である。このフィルタの係数は、距離に応じて変化する必要があり、中心値と周辺値の係数を距離に応じて変化させることで実現している。このボケ補正フィルタ係数設定部1306のみならず、配分器の比率設定部1309はCPU20で図10,図16(a)のテーブルに基づき計算され、バス1303を介して設定される。
【0055】
このような構成とすることで、複数の画像をボケ修正した画像を距離に応じて合成することによりホワイトノイズを削減し、高画質な画像を合成できるという効果がある。
【0056】
図17は、テクスチャーマッピング部15を実行するハードウエア構成を示す。画像合成部の出力信号G_Out1312 は、透視変換の縮小時にデータが失われないように多値データで平均化しながらデータを生成し出力データMW_DATを得ている。これは、縮小率に応じて、入力データを配分器1331で比率調整し、加算器1332で合成する。この出力は入力データと同様配分器1333で比率調整し一時、記憶部1334で記憶し、加算器1332で蓄積加算する。図14(b)で示した変数パラメータは、図17のレジスタ1341,1343,1345,1351,1349にセットすると、ハードウエア透視変換を実行する。まず、注目ラインの長さx_Width が格納されたレジスタ1343は、1ライン単位に、レジスタ1341に格納された変位DX_Width ずつ減算器1342で減算し作成する。これに対して、1クロック毎にDDA用の一時記憶レジスタX_DDA1348を用いてレジスタ1345に格納された出力長さDest_Widthを加算器1346で加算する。ただし、レジスタX_DDA1348の出力からX_Widthを減算器1344で減算しレジスタX_DDA1348 を減算できれば、減算結果をセレクタ1347を介してレジスタX_DDA1348 にセットする。減算器1344のボローを制御信号X_Skip として用いる。読み出し開始アドレスX_Startが格納されたレジスタ1351は、レジスタ1349に格納された1ラインごとの変位DX_Startずつ加算器1350で加算し、X方向カウンタX_Count1352へロードする。このカウンタは読み込みアドレスとして用いる。メモリへの書き込みアドレスは、他のメモリカウンタM_Count1355 を用いて出力されるアドレスMW_ADRを管理する。このカウントアップ制御をX_Skipを用いてコントロールすることで出力長さを均一に揃えることができる。
【0057】
このような構成とすることで、CPUから数個のレジスタを設定するだけで透視変換機能付きテクスチャーマッピング処理が実現できるという効果がある。
【0058】
図18は、補正後のデータを受け取ったパーソナルコンピュータ2での処理の概要フローを示す。まず、受け取った多値データを二値化し2002、認識処理2003の後、ディスプレイ3に表示する。さらに認識できなかった文字などを、修正する2004。このような構成とすることで、パーソナルコンピュータ2で二値化、ノイズ除去などの処理を行うことで、スキャナの処理を軽減し、トータルなシステムコストを低減できるという効果がある。
【0059】
図19は、二値化2002の概念図(a)の一例と詳細フロー(b)を示している。ここでの二値化は、背景濃度の影響を受けにくく、安定した二値化が可能な浮動閾値二値化方式を用いている。主走査方向XWIN画素,副走査方法YWIN画素のブロックで合計値を求め、これから平均値を算出する。ここで、計算結果を利用することで、処理時間を短縮している。つまり、図19(b)に示す通り、合計値SUMは、スティックStick[x],Stick[x−XWIN]を用いて、SUM=SUM+Stick[x]−Stick[x−XWIN]:4061と記述でき、スティクも同様に、Stick[x]=Stick「x」+pImg[x+y_old_adr]− pImg[x+y_old_adr]:4060と表すことができる。このため、ウインドウサイズに依存すること無く、1ウインドウにつき、4メモリアクセス,4加減算で合計値を求めることができる。この合計値に、係数をかけて閾値を作成し、入力値と比較することで二値化を実行する。
【0060】
このような構成とすることで、ウインドウを移動しながら平均値を求める処理を、タイル形状に画像を分割し、このタイル内の平均値を求めて二値化する場合と同程度のメモリアクセス量で処理が実現可能となるという効果がある。
【0061】
図20は、スキャナ1の光学系の詳細構成の一実施例を示している。リニアセンサ101は、ブリッジ176,177でオピニオン178に接続され、レール183上を移動する。オピニオン178は、パルスモータ179で駆動され、正転,逆転させることでセンサを移動できる。レンズ171は、パルスモータ184でギア185を回転させることで前後させることができ、これにより焦点を調節する。リニアセンサ101の支持体182はパルスモータ180,ギア181によりあおり角を変化させることができる。ここでは、3つのパルスモータを用いたが、それぞれ同時に動く必要性はないため、一つのモータでクラッチを用いて構成することは可能である。また、処理部のハードウエアは制御基板18に搭載し同一筐体内に収められている。
【0062】
スキャナ部1を上述のように構成することで、あおり角、焦点距離を自由に制御できるため、スキャナ部をスタンドタイプのように読取距離を固定されることなく、自由な位置から読み取りすることができるという効果がある。この例では、リニアセンサ101を副走査方向に移動するスキャナ1を例に用いたが、リニアセンサ101は固定し、ミラーでスキャンを行うスキャナに適用も可能である。
【0063】
図21は、本発明の他の実施形態を示している。図21(a)は、スキャナ1の可動支持体1901が腕のように自在に動く構造になっていて、原稿175を様々な角度から読み取ることが可能になっている。スキャナ1に備えている画像取り込みボタン199を操作することで、原稿台174上に形成された基準座標マーカ1913a〜1913dを用いて、あおり角,焦点位置を自動調節する。これは、基準座標マーカ1913a〜1913dを画像入力し、パーソナルコンピュータ2で基準位置を計算する。この位置が正しく読めるように、焦点位置とあおり角の変化をスキャナ1に指示し、再度画像入力し、これを繰り返す。このようにすれば、読取位置がどこであっても、正しく焦点の合った画像を入力することができる。図21(b)は、スキャナ1をパーティション1914にクリップなどで固定するタイプのものである。このような構成とすることで、机上のスペースを有効に利用できるという効果がある。
【0064】
図22は、本発明のスキャナ1をディスプレイ3と一体化させた一実施例である。ディスプレイ下部にセンサおよびセンサ筐体1920を取り付け、ディスプレイ上部に回転ミラー1921を取り付け、原稿台174上に置かれた画像を回転ミラー1921に反射させセンサ1920で読み取る。この時、キーボード
1923等の操作手段によって、原稿の読み取りを行う。このようにすることで、従来のフラットベッドスキャナのように場所を取ることなく、簡易に高速に画像入力ができるようになった。
【0065】
図23は、本発明のスキャナを携帯電話,PHS,PDAなど携帯端末1925に適用した一実施例である。携帯端末1925の上部にセンサ1920を設け、そのセンサ1920から原稿台174に置かれた原稿を読み取る。斜めからの読み取りでも、歪みが補正できるため、従来のデジタルカメラのように正面から構えてとる必要がなく、手軽に画像入力できる。また、携帯電話等の持ち運び可能な小型な携帯端末に本発明の画像読取を適応すれば、環境にとらわれずに手軽に原稿等を読み取ることが可能となる。
【0066】
更には、この携帯端末に外部との通信機能を有していれば、読み取った画像を他の携帯端末等に、簡易に高速に送信できる。
【0067】
【発明の効果】
本発明によれば、折れ曲がった帳票や厚い本などの表面に書かれた文字などを操作性良く、高画質に読取可能な非接触型画像読取装置を提供できる。
【0068】
また、簡易で自由度の高い非接触型画像読取装置を提供できる。
【図面の簡単な説明】
【図1】本発明からなる非接触型画像読取装置の一実施例を示す図である。
【図2】本発明のスキャナのハードウェアの一実施例を示す図である。
【図3】本発明からなる非接触型画像読取装置の外観図を示す図である。
【図4】本発明のスキャナによる読取動作を説明する図である。
【図5】本発明の読取部の一実施例を示す図である。
【図6】本発明の読取部のシェーディング補正部の原理を説明する図である。
【図7】本発明の読取部の歪み補正メモリの変換テーブルの一実施例を示す図である。
【図8】本発明の特徴点毎距離測定部の一実施例を示す図である。
【図9】本発明の特徴点毎距離測定部の距離計測部を説明する図である。
【図10】本発明の焦点補正係数計算部の原理を説明する図である。
【図11】本発明の透視補正道程計算部の二次元概念図の一例を示す図である。
【図12】本発明の透視補正道程計算部の三次元概念図の一例を示す図である。
【図13】本発明の透視補正道程計算部の処理手順を説明する図である。
【図14】本発明の透視変換の原理を説明する図である。
【図15】本発明の透視変換の処理手順を説明する図である。
【図16】本発明のテクスチャーマッピング部の一実施例を示す図である。
【図17】本発明のテクスチャーマッピング部のブロック図を示す図である。
【図18】本発明のパーソナルコンピュータの処理手順を説明する図である。
【図19】本発明のパーソナルコンピュータの二値化処理を説明する図である。
【図20】本発明のスキャナの光学系の一実施例を示す図である。
【図21】本発明からなる非接触型画像読取装置の他の実施例を示す図である。
【図22】本発明からなる非接触型画像読取装置の他の実施例を示す図である。
【図23】本発明からなる非接触型画像読取装置の他の実施例を示す図である。
【符号の説明】
1…スキャナ、2…パーソナルコンピュータ、3…ディスプレイ、4…補助ディスプレイ、5…プリンタ、10…読取部、11…入力メモリ、12…特徴点毎距離測定部、13…焦点補正係数計算部、14…透視補正道程計算部、15…テクスチャーマッピング部、16…フレームメモリ、17…焦点位置制御部、18…制御基板、20…CPU、40…インターフェイス部、101…リニアセンサ、102…アンプ、103…A/D変換器、104…歪み補正LSI、105…歪み補正メモリ、106…ガンマメモリ、107…シェーディング補正部、108…ガンマ補正部、109…ピーク値検出部、110…ピーク値、111…DMAC、121…座標位置補正部、122…分散画像作成部、123…特徴点抽出部、
124…距離計測部、171…レンズ、172…可動部、173…支持棒、174…原稿台、175…原稿、176,177…ブリッジ、178…オピニオン、
179,180,184…パルスモータ、182…支持体、183…レール、
181,185…ギア、199…取り込みボタン、1001…取り込みボタン押下、1002…初期化判定、1003…パルスモータ正回転、1004…第1の焦点位置読取、1005…パルスモータ逆回転、1006…第2の焦点位置読取、1007…スキャナドライバ起動、1008…シェーディング波形記憶、1009…読取位置正規化、1010…三次元補正、1011…データ送信、1021…法線方向輝度変化直線作成、1022…等輝度直線作成、1023…距離計算、1024…位置情報計算、1025〜1028…読取画像、1301…第1の焦点距離画像、1302…第2の焦点距離画像、1303…バス、1304,1305…ボケ補正フィルタ、1306…ボケ補正フィルタ係数設定部、1307,1308,1331,1333…配分器、1309…比率設定部、1310,1332, 1346,1350…加算器、1311…ラッチ、1312…出力信号G_Out 、1334…記憶部、1341,1343,1345,1348,1349,
1351…レジスタ、1342,1344…減算器、1347…セレクタ、1352,1355…カウンタ、1401…直線近似、1402…平面近似、1403…ポリゴン分割、1404…展開係数計算、1501…スタート位置計算、1502…縮小値計算、1503…DDA縮小処理、1504…処理終了判断、1901…可動支持体、1913a〜1913d…基準座標マーカ、1914…パーティション、1920…センサ、1921…回転ミラー、1923…キーボード、1925…携帯端末、2002…二値化、2003…認識処理、2004…修正処理、
4060…スティックの更新、4061…合計値の更新、θ…あおり角、Si…入力データ、Pi…シェーディングデータ、Po…正規化参照値、So…正規化後データ、SD0〜SD7…シェーディング波形、A,B…画像データ、D…距離データ、PA,PB…読取位置。

Claims (6)

  1. 画像を読み取る読取部と、
    前記読取部の読取条件を変更する読取条件変更部と、
    前記読取条件変更部で変更された少なくとも2つの異なる読取条件で読み取った少なくとも2つの読取画像を記憶する記憶部と、
    前記記憶部で記憶した少なくとも2つの読取画像間の輝度値の偏差から特徴点を抽出する特徴点抽出部と、
    前記特徴点抽出部で抽出した特徴点周辺の輝度変化を用いてレンズから特徴点までの距離を測定する距離測定部と、
    隣接する特徴点間の距離を求める道程計算部と、
    平面補正後に隣接する特徴点間の距離を前記道程計算部で求めた距離に変換し、前記距離測定部で求めた距離と前記異なる読取条件の焦点距離に応じて前記読み取った画像の混合比率を計算し、合成画像を生成する合成部と、
    を有することを特徴とする非接触画像読取装置。
  2. 請求項1の非接触型画像読取装置において、
    前記読取条件変更部の前記読取条件は、焦点位置、またはあおり角である非接触型画像読取装置。
  3. 請求項1の非接触型画像読取装置において、
    前記読取条件変更部は、前記読取部の走査動作の往復で前記読取条件を少なくとも2つ変更する非接触型画像読取装置。
  4. 請求項1の非接触型画像読取装置において、
    前記画像補正部は、前記読取部が、前記画像に対して斜め上方から読み取る場合、前記読取画像の歪みを補正する幾何学補正をする非接触型画像読取装置。
  5. 近接する特徴点3点を結ぶステップと、
    前記特徴点3点で形成される平面を求めるステップと、
    前記特徴点3点の周辺の特徴点で前記平面との距離が所定の閾値よりも小さい場合、平面に属すると判定するステップと、
    上記ステップを繰り返すことで、距離データを持つ特徴点から複数の平面を作成し、これらの平面をポリゴンで近似するステップと、
    前記ポリゴン単位で平面修復処理を実施することを特徴とする請求項1記載の非接触画像読取装置。
  6. 原稿上の画像を読み取る非接触画像読取装置において、
    前記合成部と平面に展開する画像補正部とを有するスキャナ部と、
    前記スキャナ部を支える支持部と、
    前記原稿を置く原稿台とを有し、
    前記原稿台に、前記原稿を置く目安となるマークを設けることを特徴とする請求項1記載の非接触型画像読取装置。
JP27695398A 1998-09-30 1998-09-30 非接触型画像読取装置及びそれを用いたシステム Expired - Fee Related JP3608955B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP27695398A JP3608955B2 (ja) 1998-09-30 1998-09-30 非接触型画像読取装置及びそれを用いたシステム
KR10-1999-0041687A KR100402043B1 (ko) 1998-09-30 1999-09-29 비접촉형 화상 판독 장치 및 그것을 이용한 시스템
TW088116689A TW468331B (en) 1998-09-30 1999-09-29 Non-contact image reading device and the system using the same
US09/409,223 US6721465B1 (en) 1998-09-30 1999-09-30 Non-contact image reader and system using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27695398A JP3608955B2 (ja) 1998-09-30 1998-09-30 非接触型画像読取装置及びそれを用いたシステム

Publications (2)

Publication Number Publication Date
JP2000115510A JP2000115510A (ja) 2000-04-21
JP3608955B2 true JP3608955B2 (ja) 2005-01-12

Family

ID=17576723

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27695398A Expired - Fee Related JP3608955B2 (ja) 1998-09-30 1998-09-30 非接触型画像読取装置及びそれを用いたシステム

Country Status (1)

Country Link
JP (1) JP3608955B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2375675A (en) * 2001-05-17 2002-11-20 Hewlett Packard Co System for automatically detecting and masking device features in the field of view of an imaging device.
JP2003004441A (ja) * 2001-06-18 2003-01-08 Hitachi Ltd 距離計測方法および距離計測機能を有する画像入力装置
JP3622729B2 (ja) 2002-01-30 2005-02-23 株式会社日立製作所 画像入力装置
JP5224976B2 (ja) * 2008-08-29 2013-07-03 三菱電機株式会社 画像補正装置、および、画像補正方法、および、プログラム、および、記録媒体
JP2011151681A (ja) * 2010-01-22 2011-08-04 Toshiba Corp 情報処理装置、情報処理プログラム、情報処理システムおよび情報処理方法
JP5875248B2 (ja) * 2011-04-27 2016-03-02 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP5459337B2 (ja) * 2012-03-21 2014-04-02 カシオ計算機株式会社 撮像装置、画像処理方法及びプログラム
JP5527491B2 (ja) * 2014-01-10 2014-06-18 カシオ計算機株式会社 画像処理装置、画像処理方法及びプログラム
CN112991646A (zh) * 2020-12-31 2021-06-18 网银在线(北京)科技有限公司 收款方法、收款装置、及收款设备

Also Published As

Publication number Publication date
JP2000115510A (ja) 2000-04-21

Similar Documents

Publication Publication Date Title
US6721465B1 (en) Non-contact image reader and system using the same
JP4327080B2 (ja) 画像を復元する方法
US5581637A (en) System for registering component image tiles in a camera-based scanner device transcribing scene images
EP0701225B1 (en) System for transcribing images on a board using a camera based board scanner
CN105979117B (zh) 基于激光线的弯曲书页图像展平方法
US7418126B2 (en) Image distortion correcting method and apparatus, and storage medium
CN105872291B (zh) 带有激光校正的智能互联网高清扫描仪
JP3837710B2 (ja) デジタルカメラ
US5930411A (en) Image processing apparatus for adjusting scanning position
JP2000020682A (ja) 画像補正装置
US20050196070A1 (en) Image combine apparatus and image combining method
JP3608955B2 (ja) 非接触型画像読取装置及びそれを用いたシステム
JP2003004441A (ja) 距離計測方法および距離計測機能を有する画像入力装置
TW338868B (en) Image scanner and fast positioning method
JP2003283804A (ja) 綴じ部の湾曲の補正方法およびシステム
US20030001867A1 (en) Image processing apparatus and its processing method
JP4095768B2 (ja) 画像処理方法及び、それを用いた非接触画像入力装置
JP3175250B2 (ja) 原稿読み取り装置
CN110533769B (zh) 一种翻开书本图像的平整化方法及终端
Brown et al. Beyond 2D images: effective 3D imaging for library materials
Zhang et al. Restoringwarped document images using shape-from-shading and surface interpolation
RU2368091C2 (ru) Система и способ сканирования и копирования
TWI300839B (ja)
JP3684479B2 (ja) デジタルカメラ
JP2000261653A (ja) 画像処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040120

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040322

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040928

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041012

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees