JP5722482B2 - 画像処理システムおよび画像処理方法 - Google Patents

画像処理システムおよび画像処理方法 Download PDF

Info

Publication number
JP5722482B2
JP5722482B2 JP2014064460A JP2014064460A JP5722482B2 JP 5722482 B2 JP5722482 B2 JP 5722482B2 JP 2014064460 A JP2014064460 A JP 2014064460A JP 2014064460 A JP2014064460 A JP 2014064460A JP 5722482 B2 JP5722482 B2 JP 5722482B2
Authority
JP
Japan
Prior art keywords
image
mesh
document
distortion
processing system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014064460A
Other languages
English (en)
Other versions
JP2014192901A (ja
Inventor
シャオ−シェン チェン ローレンス
シャオ−シェン チェン ローレンス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JP2014192901A publication Critical patent/JP2014192901A/ja
Application granted granted Critical
Publication of JP5722482B2 publication Critical patent/JP5722482B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/06Topological mapping of higher dimensional structures onto lower dimensional surfaces

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Character Input (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Geometry (AREA)

Description

本発明は、原稿を読み取って得られる原稿画像における上記原稿の歪み状態を示す歪みモデルを作成する画像処理システムおよび画像処理方法に関するものである。
従来、見開き書籍(例えば、本、雑誌、冊子などの綴じ部で綴じられた書籍)をユーザが画像読取装置の原稿台に載置し、読み取られた画像データに基づいて書籍の厚さに起因する歪みを補正する技術が知られている。
例えば、非特許文献1には、以下の(1)〜(3)の処理を行う技術が開示されている。
(1)本の綴じ部とスキャナの主走査方向が平行な場合において、読み取られた画像より、主走査方向については、ページ外形、罫線、文字行をこの優先順位で抽出し、抽出した歪み形状を基に画像の伸長率を求めて補正する。
(2)読み取られた画像にページ外形、罫線、文字行が存在するかは、画像を適応二値化し、主走査方向に対する黒画素ヒストグラムを、綴じ部の左右で構成し、作成されたヒストグラムを解析することにより判断する。
(3)副走査方向については、文字外接矩形のアスペクト比を利用し、綴じ部付近の矩形アスペクト比が平坦部のアスペクト比と等しくなるように補正を行う。また、上記形状の補正を行う前に、綴じ部の抽出処理、スキュー補正処理を行う。
荒木禎史,関海克,小島啓嗣,「製本原稿スキャン画像の歪み補正技術」、Ricoh Technical Report No.29、2003年12月、p.31-40
しかしながら、上記非特許文献1の技術では、形状補正を行う際に以下の(A)〜(C)の処理を行う必要があるので、処理が複雑であるという問題がある。
(A)前処理として、綴じ部の抽出処理およびスキュー補正処理を行う必要がある。
(B)ページ外形、罫線、文字行の何れが存在するのかの判定を行い、判定結果に基づいて抽出対象を決定した後に抽出処理を行う必要がある。
(C)主走査方向の歪みを補正した後に副走査方向の歪みの補正を行う必要がある。
さらに、上記非特許文献1の技術は、製本原稿をフラットベッド型のスキャナで取り込む場合のスキャン画像に対して補正を行うものであり、卓上で上向きに開かれた製本原稿を撮像した画像のように、見開き頁が曲面となり直線部分の検出が困難な場合には当該非特許文献1の技術を適用できないという問題もある。
本発明は、上記の問題に鑑みて成されたものであり、その目的は、原稿画像を撮像して取得した原稿画像の歪み状態を示す歪みモデルを簡易な処理により適切に作成することのできる画像処理システムおよび画像処理方法を提供することにある。
また、本発明の他の目的は、原稿画像がフラットベッド型のスキャナにより読み取られた画像ではない場合(例えば上向きに開かれた状態で卓上等に載置された製本原稿を撮像して取得した原稿画像の場合)であっても、原稿画像の歪みモデルを適切に作成することにある。
本発明の一態様にかかる画像処理システムは、原稿を読み取って取得した原稿画像における上記原稿の歪み状態を示す歪みモデルを作成する画像処理システムであって、表示装置と、上記表示装置の表示を制御する表示制御部と、上記歪みモデルを作成する歪みモデル作成部と、ユーザからの指示入力を受け付ける入力受付部とを備え、上記表示制御部は、矩形形状のメッシュ画像を上記原稿画像に重畳させて上記表示装置に表示させ、上記歪みモデル作成部は、矩形形状の上記メッシュ画像の形状をユーザからの指示入力に応じて上記原稿画像の形状に近づけるように変形させることにより、上記歪みモデルを作成することを特徴としている。
上記の本発明の一態様にかかる画像処理システムによれば、ユーザの指示入力に応じてメッシュ画像の形状を原稿画像の形状に近づけるように変形させることで、原稿の歪み状態を示す歪みモデルを簡易な処理で適切に作成することができる。また、原稿画像がフラットベッド型のスキャナにより読み取られた画像ではない場合(例えば上向きに開かれた状態で卓上等に載置された製本原稿を撮像して取得した原稿画像の場合)であっても、原稿画像の歪みモデルを適切に作成することができる。
見開き書籍におけるページ画像の一例を示す説明図である。 本発明の一実施形態にかかる画像処理システムにおいて用いられる3次ベジェ曲線の一例を示す説明図である。 本発明の一実施形態にかかる画像処理システムにおける処理の流れを示すフローチャートである。 本発明の一実施形態にかかる画像処理システムにおいてページ画像に重畳表示される矩形形状のメッシュの一例を示す説明図である。 図4に示したメッシュに対して角部の調整処理を施したメッシュの一例を示す説明図である。 図5に示したメッシュに対して辺(エッジ)の調整処理を施したメッシュの一例を示す説明図である。 本発明の一実施形態にかかる画像処理システムにおける歪み補正処理の流れを示すフローチャートである。 本発明の一実施形態にかかる画像処理システムの概略構成を示す説明図である。 本発明の一実施形態にかかる画像処理システムにおける歪み補正処理で用いられる消失点を示す説明図である。 本発明の一実施形態にかかる画像処理システムにおける、逆射影変換前の原稿画像とメッシュの一例を示す説明図である。 本発明の一実施形態にかかる画像処理システムにおける、逆射影変換後の原稿画像とメッシュの一例を示す説明図である。 本発明の一実施形態にかかる画像処理システムにおいて行われる逆変換処理の処理方法の一例を示す説明図である。 本発明の一実施形態にかかる画像処理システムにおいて行われる一致度の算出処理で用いられるベジェ曲線と代表点との関係を示す説明図である。
〔実施形態1〕
本発明の一実施形態について説明する。なお、各図面において、同様の部材には同じ符号を付している。
図8は、本実施形態にかかる画像処理システム1の構成を示す説明図である。この図に示すように、画像処理システム1は、表示装置10、画像読取装置20、および画像処理装置30を備えている。なお、画像処理システム1は、表示装置10、画像読取装置20、および画像処理装置30を備えた単体の装置(例えば複写機あるいは複合機)であってもよく、表示装置10、画像読取装置20、および画像処理装置30の一部または全部が別々に備えられ、互いに通信を行う構成であってもよい。
表示装置10は、表示部11と操作入力部12とを備えている。表示装置10としては、例えば、パーソナルコンピュータ等のコンピュータ装置、タブレット端末、モバイル機器、あるいはその他の表示装置を用いることができる。
表示部11は、画像処理装置30の指示に応じた画像を表示画面に表示させる。表示部11としては、例えば、液晶表示パネル、有機EL(electroluminescence)パネル、プラズマディスプレイなどを用いることができる。
操作入力部12は、ユーザからの操作入力を受け付けて画像処理装置30に伝達する。本実施形態では、操作入力部12として、ユーザによる表示部11の表示画面に対するタッチ操作に基づいてユーザからの指示入力を検出するタッチパネルを用いている。ただし、操作入力部12の構成は、ユーザからの操作入力を検出可能な構成であれば特に限定されるものではなく、例えば、マウスやデジタルペン等のポインティングデバイス、各種キー操作装置などを用いてもよい。
画像読取装置20は、原稿を読み取って当該原稿の画像データ(原稿画像)を生成し、画像処理装置30に伝達する。画像読取装置20の構成は特に限定されるものではなく、従来から公知の画像読取装置を用いることができる。
画像処理装置30は、制御部31と記憶部37とを備えている。また、制御部31は、表示制御部32、入力受付部33、メッシュ制御部(歪みモデル作成部)34、画像補正部35、および画像取得部36を備えている。
記憶部37は、画像処理装置30で扱われる各種データ(画像データ、各種制御情報等)を記憶する記憶手段である。記憶部37の構成は特に限定されるものではなく、例えばハードディスク、半導体メモリなど、従来から公知の記憶手段を用いることができる。
制御部31は、CPUや専用プロセッサなどの演算処理部、および、RAM、ROM、HDDなどの記憶部(いずれも図示せず)などにより構成されるコンピュータ装置であり、記憶部37に記憶されている各種情報および各種制御を実施するためのプログラムを読み出して実行することで画像処理装置30の機能を実現する。
表示制御部32は、表示装置10の動作を制御し、表示部11の表示画面に画像を表示させる。
入力受付部33は、表示装置10の操作入力部12を介して入力されるユーザからの指示入力を操作入力部12から取得する。
メッシュ制御部34は、画像データの歪み補正処理を行う際に、原稿画像の歪み状態を示すメッシュ画像(歪みモデル)の作成処理および更新処理を行う。歪み補正処理およびメッシュ画像の詳細については後述する。
画像補正部35は、入力受付部33が受け付けたユーザからの指示入力に基づいて画像データに対する歪み補正処理を行う。画像補正部35において歪み補正処理が施された画像データは、記憶部37に保存されるか、あるいは他の装置(図示せず)に出力される。歪み補正処理の詳細については後述する。
画像取得部36は、画像読取装置20の動作を制御して原稿の読取処理を行わせ、画像読取装置20から原稿の画像データを取得し、取得した画像データを記憶部37に記憶させる。
次に、画像処理システム1において行われる歪み補正処理について説明する。
図1は、見開き書籍(原稿、見開き原稿)を読み取って取得したページ画像(原稿画像)100の例を示しており、あるページ102の全体と、他のページ104の一部とが示されている。図1におけるページ102とページ104との結合部分の領域106は、上記見開き書籍の綴じ部に対応している。なお、見開き書籍は、綴じ部を中心として開閉可能に綴じられた書籍である。画像読取時に見開き書籍の物理的な歪み(湾曲)が生じると、ページ画像100におけるページ102およびページ104の辺(境界線)108,110,112,114,116,118,120は矩形形状ではなくなる。その結果、ページ102および104の画像は、湾曲した(歪んだ)ページの画像となる。
湾曲したページ102および104は可展面なので、本実施形態では、ページ102および104を、(i)当該ページの上辺および下辺の湾曲状態に応じた3次ベジェ曲線(ベジェ曲線とも呼ばれる)と、(ii)基準方向に沿って延伸し、上記の2つの3次ベジェ曲線を接続する複数の直線とからなるメッシュ(編目)によってモデル化する。なお、本実施形態では、ページの上辺および下辺に対応する辺を3次ベジェ曲線でモデル化したメッシュ(歪みモデル)を用いているが、これに限るものではない。例えば、ページの上辺および下辺を、2次ベジェ曲線、あるいは他の関数で示される曲線によってモデル化してもよい。
本実施形態では、ページ画像100におけるページ102の上辺(上端エッジ)108を第1の3次ベジェ曲線によってモデル化し、下辺(下端エッジ)112を第2の3次ベジェ曲線によってモデル化する。すなわち、本実施形態では、メッシュ上における互いに対向する2辺のうち、綴じ部の延伸方向に交差する方向に延伸する辺である上辺および下辺を、ベジェ曲線を用いてモデル化する。
図2は3次ベジェ曲線の一例を示している。3次ベジェ曲線は、4つの制御点P,P,P,Pによって定義されるパラメータ曲線であり、下記式で表される。
B(t)=(1−t)+3(1−t)tP+3(1−t)t+t
t∈[0,1]
ここで、tはパラメータ曲線B(t)のパラメータであり、P,P,P,Pは平面上の点である。上記パラメータ曲線B(t)は、接線Pに続く点P(t=0に対応)から始まり、接線Pに続く点P(t=1に対応)で終わる制御点の凸包(convex hull)によって表される。PおよびPは中間制御点と呼ばれる。図2に示した典型的なベジェ曲線200には、4つの平面上の点P202、P204、P206、P208と、接線P210およびP212が示されている。
次に、ページ画像にメッシュを適合させるためのメッシュ適合方法300について、図3〜図6を参照しながら説明する。
まず、図3および図4に示すように、メッシュ制御部34が見開き書籍(原稿)を読み取って取得したページ画像(原稿画像)402のサイズに応じた矩形形状のメッシュ400を生成し、表示制御部32が、上記ページ画像402と上記メッシュ400とを表示部11に重畳表示させる(ステップ302)。
上記の矩形形状のメッシュ400は、4つの角部(左上角部404、右上角部406、右下角部408、および左下角部410)と、上辺412と、下辺414とを含んでいる。上辺412の左端(左上角部404)と下辺414の左端(左下角部410)とは、左辺(左端エッジ)416によって接続されている。また、上辺412の右端(上角部406)と下辺414の右端(右下角部408)とは、間の右辺(右端エッジ)418によって接続されている。上辺412をパラメータtによって等間隔に分割する点である等間隔点428,430,432,434は、複数の直線(4本の直線420,422,424,426)によって、下辺414を上記パラメータtによって等間隔に分割する点である等間隔点436,438,440,442のうちの対応する点にそれぞれ接続されている。すなわち、点428と点436、点430と点438、点432と点440、点434と点442がそれぞれ直線によって接続されている。矩形形状のメッシュ400内の区画(例えば符号454,456で示される2つの区画)は、矩形形状のメッシュ400における互いに隣接する垂直方向の直線を等間隔に分割する点である等間隔点を接続することにより形成されている。本実施形態では、矩形形状のメッシュ400内における6本の垂直方向の直線のそれぞれが11本の線分で分割されており、それによって50個の区画が形成されている。
次に、入力受付部33は、ユーザからの矩形形状のメッシュ400の角部の調整指示(角部の移動指示、第1指示入力)を取得する(ステップ304)。なお、本実施形態では、ユーザが操作入力部12を用いてドラッグ操作を行うことにより、矩形形状のメッシュ400の角部404,406,408,410を、ページ画像402におけるページ452の角部444,446,448,450に一致させるための調整指示(移動指示)を行うようになっている。具体的には、入力受付部33は、表示画面に対するタッチ操作の開始点がページ画像の角部の表示位置から所定範囲内の位置であり、かつ当該開始点からドラッグ操作が行われた場合に、当該タッチ操作を角部の調整指示として検出する。なお、入力受付部33は、上記所定範囲内に複数の角部が存在する場合には上記開始点から最も近い角部を操作対象の角部として選択する。
入力受付部33が取得した角部の調整指示はメッシュ制御部34に伝達され、メッシュ制御部34は、伝達された調整指示に応じて矩形形状のメッシュ400の角部の位置を調整(ページ画像402の角部に近づけるように移動(変形))したメッシュ500を生成する。すなわち、メッシュ制御部34は、矩形形状のメッシュ400の各角部をユーザからの指示入力に応じてページ画像の角部に近づけるように移動させる第1処理を行う。
次に、図5に示すように、表示制御部32が、角部を調整したメッシュ500を、ページ画像(原稿画像)502に重畳表示させる(ステップ306)。角部を調整したメッシュ500は、4つの角部(ページ画像452の左上角部444に対応する左上角部504、ページ画像452の右上角部446に対応する右上角部506、ページ画像452の右下角部448に対応する右下角部508、およびページ画像452の左下角部350に対応する左下角部510)と、上辺512と、下辺514とを含んでいる。上辺512と下辺514とは、左上角部504と左下角部510との間の左辺516によって接続されている。また、上辺512と下辺514とは、右上角部506と右下角部508との間の右辺518によって接続されている。上辺512をパラメータtに基づいて等間隔に分割する点である等間隔点528,530,532,534は、複数の直線(4本の直線520,522,524,526)によって、下辺514をパラメータtに基づいて等間隔に分割する点である等間隔点536,538,540,542のうちの対応する点にそれぞれ接続されている。すなわち、点528と点536とが直線520により接続され、点530と点538とが直線522により接続され、点532と点540とが直線524により接続され、点534と点542とが直線526により接続されている。角部を調整したメッシュ500内の区画(例えば符号544,546で示される2つの区画)は、角部を調整したメッシュ500における互いに隣接する垂直方向の直線(516,520,522,524,526,518)を等間隔に分割した等間隔点を接続することにより形成されている。本実施形態では、角部を調整したメッシュ500内における6本の垂直方向の直線のそれぞれが11本の線分で分割されており、それによって50個の区画が形成されている。なお、角部を調整したメッシュを重畳表示させるときに、調整前の矩形形状のメッシュを表示画面から消去するようにしてもよい。
次に、メッシュ制御部34は、操作入力部12を介して入力されるユーザからの指示入力に基づいて、上辺512に対応する第1の3次ベジェ曲線、および下辺514に対応する第2の3次ベジェ曲線のそれぞれについて、中間制御点を決定する(ステップ308)。
なお、本実施形態では、ユーザが角部をドラッグ操作すると、メッシュ制御部34が当該ドラッグ操作に応じて角部(ドラッグ操作に対応する角部)を移動させるとともに中間制御点を再設定したメッシュ(角部を調整中のメッシュ)を順次生成し、表示制御部32がメッシュ制御部34により生成された上記メッシュを表示部11に順次表示させるようになっている。これにより、ドラッグ操作中に、当該ドラッグ操作に応じたメッシュが順次作成されて連続的に表示される。
次に、入力受付部33が、操作入力部12を介して入力される中間制御点を移動させるためのタッチ移動操作(第2指示入力)を示す情報を取得する(ステップ310)。上記タッチ移動操作は、最初に接触した位置から始まり、最後に接触した位置で終了する。具体的には、入力受付部33は、表示画面に対するタッチ操作の開始点が中間制御点のうちのいずれかから所定範囲内の位置であり、かつ当該開始点からドラッグ操作が行われた場合に、当該タッチ操作を、上記中間制御点を操作対象とするエッジ(上辺または下辺)の調整指示として検出する。なお、入力受付部33は、上記所定範囲内に存在する中間制御点が複数存在する場合には上記開始点から最も近い中間制御点を操作対象とする。
メッシュ制御部34は、ユーザが最初に接触した位置に最も近い中間制御点を決定し(ステップ312)、当該中間制御点に対応するメッシュのエッジ(上辺あるいは下辺)を、取得したタッチ移動操作を示す情報に応じて当該中間制御点を移動させることにより調整(メッシュ画像を変形)する(ステップ314)。すなわち、入力受付部33がユーザの中間制御点に対するドラッグ操作の移動方向および移動距離を検出し、メッシュ制御部34が、角部が調整されたメッシュ画像における上記中間制御点を、上記移動方向および上記移動距離に応じてページ画像452の上辺または下辺に近づけるように変形させる第2処理を行う。例えば、第1方向への第1長さのタッチ移動操作が行われると、メッシュ制御部34は、上記の最も近い中間制御点を第1方向に第1長さだけ移動させる。この際、上辺または下辺のうちの一方の中間制御点を移動させることにより、当該中間制御点の移動量に応じてメッシュの上辺または下辺が変化し、メッシュの各区画の形状が変化する(歪む)。
その後、図6に示すように、表示制御部32は、エッジ(上辺および下辺)を調整したメッシュ(歪みモデル)600をページ画像(原稿画像)602に重畳表示させる(ステップ316)。上記のエッジを調整したメッシュ600は、4つの角部(ページ画像452の左上角部444に対応する左上角部604、ページ画像452の右上角部446に対応する右上角部606、ページ画像452の右下角部448に対応する右下角部608、およびページ画像452の左下角部450に対応する左下角部610)と、上辺(3次ベジェ曲線)612と、下辺(3次ベジェ曲線)614とを含んでいる。上辺612の左上角部604と下辺614の左下角部610とは、左辺616によって接続されている。また、上辺612の右上角部606と下辺614の右下角部608とは、右辺618によって接続されている。上辺612をパラメータtに基づいて等間隔に分割する点である等間隔点628,630,632,634は、複数の直線(4本の直線620,622,624,626)によって、下辺614をパラメータtに基づいて等間隔に分割する点である等間隔点636,638,640,642のうちの対応する点にそれぞれ接続されている。すなわち、点628と点636とが直線620により接続され、点630と点638とが直線622により接続され、点632と点640とが直線624により接続され、点634と点642とが直線626により接続されている。本実施形態では、4つの直線620,622,624,626に対して、パラメータtとして値0.2,0.4,0.6,0.8がそれぞれ対応付けられている。すなわち、各直線同士の間隔は、上辺の長さを1とすると、それぞれ0.2に設定されている。
エッジ(上辺および下辺)を調整したメッシュ600内の区画(例えば符号644,646で示される2つの区画)は、当該メッシュ600における互いに隣接する垂直方向の直線に沿った等間隔点を接続することにより形成されている。本実施形態では、上記メッシュ600内における6本の垂直方向の直線のそれぞれが11本の線分で分割されており、それによって50個の区画が形成されている。なお、エッジを調整したメッシュを重畳表示させるときに、角部を調整したメッシュを表示画面から消去するようにしてもよい。
本実施形態では、ユーザが分割されたメッシュの上辺または下辺をドラッグ操作すると、メッシュ制御部34が当該ドラッグ操作により移動させたメッシュ(エッジを調整中のメッシュ)を順次生成し、表示制御部32がメッシュ制御部34により生成された上記メッシュを表示部11に順次表示させるようになっている。これにより、ドラッグ操作中に、当該ドラッグ操作に応じたメッシュが連続的に表示される。
なお、本実施形態では、メッシュの間隔を、上辺および下辺をそれぞれ長さに応じて等間隔に分割しているが、これに限るものではない。
例えば、消失点に対する角度が等間隔(等角度)になるように設定してもよい。消失点とは、図9に示すように、左上角部と左下角部とを結ぶ直線L1と、右上角部と右下角部を結ぶ直線L2との交点である。
また、ユーザがドラッグさせた点628、630、632、634、636、638、640、642の位置に対応する点で分割するようにしてもよい。例えば、上辺または下辺のエッジ強度を求め、ユーザがドラッグさせた点の位置の近傍における、(1)エッジ強度が高い点(例えばエッジ強度が所定値以上である点)またはその近傍の点、あるいは、(2)ユーザがドラッグさせた位置と消失点とを結ぶ直線とエッジ強度が高い点におけるエッジ勾配を示す直線との交点で分割するようにしてもよい。なお、エッジ強度の算出方法は特に限定されるものではなく、例えば、ソーベルフィルタやプリビットフィルタ等のフィルタを用いて算出してもよく、隣接画素の差分の絶対値等を用いて算出してもよい。
その後、入力受付部33がステップ310に戻ってタッチ移動操作を示す情報を取得し(矢印318)、メッシュ制御部34がエッジ(上辺および下辺)を調整したメッシュを更新する。
図7は、見開き書籍を読み取って取得したページ画像の歪みを補正するための方法(方法700)をより詳細に示したフローチャートである。
まず、表示制御部32は、歪み補正処理対象とするページ画像を記憶部37から読み出し、表示装置10の表示部11に表示させる(ステップ702)。なお、記憶部37には、画像読取装置20によって読み取られた画像が画像取得部36を介して保存されている。
次に、メッシュ制御部34が上記ページ画像のサイズに応じた矩形形状のメッシュ(メッシュ画像)を生成し、表示制御部32が上記ページ画像と上記メッシュとを表示部11に重畳表示させる(ステップ704)。上記の矩形形状のメッシュは、4つの角部(左上角部、右上角部、右下角部、および左下角部)と、上辺と、下辺とを含んでいる。上辺の左上角部と下辺の左下角部とは左辺(左端エッジ)によって接続されている。また、上辺の右上角部と下辺の右下角部とは右辺(右端エッジ)によって接続されている。上辺を等間隔に分割した等間隔点は、複数の直線によって下辺を等間隔に等間隔点のうちの対応する点にそれぞれ接続されている。本実施形態では、左辺および右辺に加えて、4本の直線によって上辺を等間隔に分割した等間隔点と下辺を等間隔に分割した等間隔点とが接続されている。矩形形状のメッシュ内の区画は、矩形形状のメッシュにおける互いに隣接する垂直方向の直線を等間隔に分割した等間隔点を接続することにより形成されている。本実施形態では、矩形形状のメッシュ内における6本の垂直方向の直線のそれぞれが11本の線分で分割されており、それによって50個の区画が形成されている。
次に、入力受付部33が、操作入力部12に対するユーザのタッチ操作(角部調整のためのドラッグ操作)を示す情報を取得する(ステップ706)。なお、本実施形態では、操作入力部12が表示部11の表示画面に対する入力操作(ジェスチャ操作)を検出するジェスチャ処理部を備えており、このジェスチャ処理部がユーザの入力操作の検出結果に応じた信号を生成して入力受付部33に出力するようになっている。
次に、メッシュ制御部34が、入力受付部33の取得した上記情報に基づいてユーザのタッチ操作内容を解析し、当該タッチ操作が上記矩形形状のメッシュの角部に対するドラッグ操作であるか否かを判断する(ステップ708)。入力受付部33(あるいは操作入力部12)は、タッチ操作の開始点と当該タッチ操作の終了点とに基づいてドラッグ操作を検出する。メッシュ制御部34は、矩形形状のメッシュの角部の近傍(角部の座標から所定範囲内の位置)でドラッグ操作が開始された場合に、当該ドラッグ操作を矩形形状のメッシュの角部に対するドラッグ操作であると判断する。
取得したタッチ操作が矩形形状のメッシュの角部に対するドラッグ操作であると判断した場合(矢印710)、メッシュ制御部34は、ユーザのドラッグ操作に応じて角部を調整したメッシュを生成する(ステップ712)。具体的には、メッシュ制御部34は、ドラッグ操作の開始点に近接する矩形形状のメッシュの角部をドラッグ操作の終了点に対応する位置に移動させ、対応するエッジ(上辺または下辺)と、左辺と、右辺と、上辺を等間隔に分割した点と下辺を等間隔に分割した点とを接続する複数の直線とを、角部の移動量に応じて調整することにより、矩形形状のメッシュの角部を調整したメッシュを生成する。
次に、表示制御部32は、メッシュ制御部34によって角部が調整されたメッシュをページ画像に重畳表示させる(ステップ714)。なお、最新のメッシュを重畳させるときに、それ以前に重畳されていたメッシュを消去するようにしてもよい。
その後、入力受付部33は、ステップ706の処理に戻り(矢印716)、次のタッチ操作を示す情報を取得する。
一方、ステップ708において、取得したタッチ操作が矩形形状のメッシュの角部に対するドラッグ操作ではないと判断した場合(矢印718)、メッシュ制御部34は、当該タッチ操作を解析し、現在重畳されているメッシュにおける全ての角部のページ画像の角部に対する対応付けが完了したか否かを判断する(ステップ720)。本実施形態では、ユーザがダブルタップ操作を行うことにより、現在重畳されているメッシュにおける全ての角部の、ページ画像の角部に対する対応付けが完了した旨の指示を行う。ただし、これに限らず、例えば、ユーザが角部の選択を完了するために設けられたメニュー項目をタッチ操作することにより、上記対応付けが完了した旨の指示を行うようにしてもよい。
ステップ720において対応付けを完了していない角部が残っていると判断した場合、入力受付部33は、ステップ706の処理に戻り(矢印722、角部ドラッグ操作ループ)、次のタッチ操作を示す情報を取得する。
ステップ720において角部の調整が完了したと判断した場合(矢印724)、入力受付部33は、メッシュの上辺および下辺をページ画像の上辺および下辺にそれぞれ適合させるメッシュ適合処理(メッシュフィッティング処理)のためのタッチ操作を示す情報を取得する(ステップ726)。ステップ726において入力受付部33がタッチ操作を示す情報を取得すると、メッシュ制御部34は当該タッチ操作を解析し、メッシュ適合処理が完了したか否かを判断する(ステップ728)。本実施形態では、ユーザがダブルタップ操作を行うことにより、メッシュ適合処理が完了した旨の指示を行う。ただし、これに限らず、例えば、ユーザがメッシュ適合処理を完了するために設けられたメニュー項目をタッチ操作することにより、メッシュ適合処理が完了した旨の指示を行うようにしてもよい。
ステップ728において取得したタッチ操作がメッシュ適合処理の完了を示すものであると判断した場合(矢印730)、画像補正部35は、メッシュ適合処理が完了したメッシュ(歪みモデル)内の各画像領域に対して当該画像領域の歪みを補正する処理を施し、平坦化されたページ画像を生成する(ステップ732)。具体的には、メッシュ適合処理が完了したメッシュにおける上辺の3次ベジェ曲線、下辺の3次ベジェ曲線、および上辺と下辺とを接続する各直線を算出し、歪みを有する各区画の形状を歪みのない矩形形状に変換するための逆射影変換処理を行う。
例えば、各メッシュ領域を、上辺または下辺の3次ベジェ曲線あるいはメッシュを分割する点同士を結ぶ直線で囲まれた四辺形として扱い、各メッシュ領域が逆射影変換後に長方形となる当該各メッシュ領域の各角部(各角点)の変換後の座標を求め、変換後の画素毎に変換前の座標を補間演算により算出する。変換後の座標は、消失点および画像のアスペクト比、出力画像サイズ等から求めればよい。例えば、日本国内で広く使用されている印刷用紙のアスペクト比はほぼ1.41:1である。本実施形態では、アスペクト比1.41:1の画像を10×5のメッシュ領域に分割しているので、各メッシュ領域のアスペクト比は7:10の長方形で近似することができる。このように、画像の大きさに応じて、メッシュ適合処理が完了したメッシュを、メッシュと同数の7:10の矩形領域からなる長方形にマッピングすることで逆射影変換処理を行うことができる。
図10は逆射影変換前の原稿画像とメッシュを示す説明図であり、図11は逆射影変換後の原稿画像とメッシュを示す説明図である。なお、図11は、逆写像変換後の座標の出力サイズが700画素×500画素である場合の例を示している。また、図11では、左上の角部の座標を[0,0]としている。
例えば、図10に示したメッシュ領域Aを逆射影変換する場合を考える。
図11における各長方形の交点が、変換前の各メッシュの交点(各メッシュ領域の角部)に対応づけられる。逆射影変換後の各画素の座標値は、変換前の座標を、例えば直線補間により算出し、算出した座標値をさらに補間することにより算出される。
図12は、図10に示したメッシュ領域Mを、図11に示した出力サイズ(700画素×500画素)に対応する座標系の長方形のメッシュ領域M’に逆射影変換処理する場合の演算方法を示す説明図である。
図12に示したように、変換前の座標系におけるメッシュ領域Mの各角部A,B,C,Dの座標は、A(100,150),B(200,160),C(105,255),D(210,275)である。また、上記各角部A,B,C,Dに対応する、変換後の座標系(出力サイズに対応する座標系)におけるメッシュ領域M’の各角部A’,B’,C’,D’の座標はA’(300,0),B’(400,0),C’(300,70),D’(400,70)である。
この例において、変換後の座標系におけるE’(320,40)に対応する変換前の座標系における点E(x,y)の座標は以下に示す演算により求められる。
変換後の座標系における、点E’を通りy軸方向に平行な直線と角部A’ と角部B’とを結ぶ直線A’B’との交点F’は直線A’B’を2:8に内分する点であるから、一般的な線形補間により、点E’の座標はF’=(8×A’+2×B’)/10である。同様に、変換後の座標系における、点E’を通りy軸方向に平行な直線と角部C’ と角部D’とを結ぶ直線C’D’との交点G’の座標はG’=(8×C’+2×D’)/10である。
また、変換前の座標系における上記点F’,G’に対応する点F,Gの座標は、F=(8×A+2×B)/10、G=(8×C+2×D)/10で表される。したがって、変換前の座標系における各角部A,B,C,Dの座標は、A(100,150),B(200,160),C(105,255),D(210,275)であるから、F(120,152)、G(126,259)が算出される。
また、変換後の座標系における点E’は直線F’G’を4:3に内分する点であるから、E’=(3×F’+4×G’)/7である。したがって、変換前の座標系における点Eの座標はE=(3×F+4×G)/7であり、F(120,152)、G(126,259)より、E=(123.43,213.14)が算出される。
このような演算方法により、変換後の座標系におけるメッシュ領域M’内の複数の点に対応する変換前の座標系における座標を算出する。また、上記複数の点以外の各点について、当該対応する変換前の座標系における座標を補間演算により算出する。補間演算の方法は特に限定されるものではなく、例えば、線形補間、バイキュービック補間などを用いることができる。これにより、変換前の歪みのあるメッシュ領域Mを変換後の歪みのないメッシュ領域M’に逆射影変換処理することができる。
なお、逆射影変換後の各画素の画素値(RGB値)を、逆変換処理前の座標系における当該画素に対応する位置の近傍の画素の画素値を用いた補間演算により算出してもよい。
また、逆射影変換処理の演算方法は上述した方法に限るものではない。例えば、各点についての変換後の座標と変換前の座標との対応関係を算出する際に、消失点からの距離に応じた係数(例えば消失点に近い領域ほど大きい値に設定される係数)を乗算するようにしてもよい。これにより、より正確な逆射影変換処理を行うことができ、また、歪みの度合いが大きい画像の場合であっても正確な逆射影変換処理を行うことができる。
なお、本実施形態では、メッシュ適合処理が完了したメッシュ内における所定方向に沿った所定幅の細長い片(画像領域)毎に逆射影変換を適用する。ただし、これに限らず、例えば、メッシュ適合処理が完了したメッシュ内の区画(画像領域)毎に逆射影変換を適用してもよい。また、メッシュ適合処理が完了したメッシュ内の区画のうち、外縁部の曲率(屈曲の度合)が大きい区画を、より小さい区画(小区画)に細分化(再分割)し、再分割した区画毎に逆射影変換を施すようにしてもよい。
その後、表示制御部32は、平坦化されたページ画像を表示部11に表示させ(ステップ734)、歪み補正処理を終了する。なお、平坦化されたページ画像の印刷処理を行ったり、他の装置に送信する処理を行ったり、所定の保存先に保存する処理を行ったりするようにしてもよい。
一方、ステップ728において取得したタッチ操作がメッシュ適合処理の完了を示すものではないと判断した場合(矢印736)、メッシュ制御部34は、ユーザのタッチ操作位置に最も近い中間制御点を決定し(ステップ738)、タッチ操作の開始点からタッチ操作の終了点までのタッチ移動操作を解析する。また、メッシュ制御部34は、上記の最も近い中間制御点に対応するエッジ曲線(上辺または下辺)を、タッチ移動操作に対応する上記中間制御点をタッチ移動操作に応じて移動させることにより調整する(ステップ740)。例えば、第1方向への第1長さのタッチ移動操作が最も近い中間制御点に適用される。この際、上辺または下辺のうちの一方の中間制御点を移動させることにより、当該中間制御点の移動量に応じてメッシュの上辺または下辺が変化し、メッシュの各区画の形状が変化する。
次に、表示制御部32は、メッシュ制御部34によってエッジ調整されたメッシュ(上辺および/または下辺が調整されたメッシュ)をページ画像に重畳表示させる(ステップ742)。上記のエッジ調整されたメッシュは、4つの角部(ページ画像の左上角部に対応する左上角部、ページ画像の右上角部に対応する右上角部、ページ画像の右下角部に対応する右下角部、およびページ画像の左下角部に対応する左下角部)と、上辺(上部3次ベジェ曲線エッジ)と、下辺(下部3次ベジェ曲線エッジ)とを含んでいる。上辺の左上角部と下辺の左下角部とは左辺によって接続されている。また、上辺の右上角部と下辺の右下角部とは右辺によって接続されている。上辺をパラメータtに基づいて等間隔に分割した各等間隔点は、下辺をパラメータtに基づいて等間隔に分割した等間隔点のうちの対応する点に対して複数の直線によりそれぞれ接続されている。本実施形態では、4つの直線に対して、パラメータtとして値0.2,0.4,0.6,0.8がそれぞれ対応付けられている。パラメータtは、上辺および下辺の左端を0、右端を1とした場合の各等間隔点の位置を示している。エッジを調整したメッシュ内の区画は、当該メッシュにおける互いに隣接する垂直方向の直線を等間隔に分割した等間隔点を接続することにより形成されている。本実施形態では、上記メッシュ内における6本の垂直方向の直線のそれぞれが11本の線分で分割されており、それによって50個の区画が形成されている。なお、最新のメッシュを重畳表示させたときに、それ以前に重畳表示されていたメッシュを消去するようにしてもよい。
本実施形態では、ユーザがエッジ(上辺または下辺)をドラッグ操作すると、メッシュ制御部34が当該ドラッグ操作に対応する中間制御点を当該ドラッグ操作に応じて移動させたメッシュ(エッジを調整中のメッシュ)を順次生成し、表示制御部32がメッシュ制御部34により生成された上記メッシュを表示部11に順次表示させるようになっている。これにより、ドラッグ操作に応じたメッシュが連続的に表示される。
ステップ742においてエッジ調整したメッシュをページ画像に重畳表示させた後、入力受付部33は、ステップ726に戻り(矢印744)、タッチ操作を示す情報を再取得する。
〔実施形態2〕
上述した実施形態1では、メッシュ適合処理が完了したか否かを、ユーザの操作入力に基づいて判断していたが(図7のステップ728)、これに限るものではない。例えば、メッシュ制御部34が、ページ画像の上辺および下辺と、メッシュ適合処理により生成されたメッシュの上辺および下辺に対応する3次ベジェ曲線との一致度を算出し、算出した一致度が所定の閾値以上である場合にメッシュ適合処理が完了したと判断するようにしてもよい。
上記一致度の算出方法は特に限定されるものではないが、例えば、画像より抽出したエッジ画素の各点(あるいはエッジ画素の代表点)とベジェ曲線との間の距離をそれぞれ求め、各点について求められた上記距離の総和を一致度としてもよい。
図13は、x方向についての10画素毎の代表点(図中の+印参照)とベジェ曲線とを示している。各代表点とベジェ曲線との間の距離の算出方法は特に限定されるものではないが、例えば、(1)一次微分の法線を算出し、代表点を通りベジェ曲線と直交する直線を算出し、算出した直線に基づいて代表点とベジェ曲線との最短距離を上記距離として算出する方法や、(2)代表点とベジェ曲線とのy座標の差の絶対値を上記距離として算出する簡易的な方法などを用いることができる。
〔実施形態3〕
上述した実施形態1では、画像補正部35が逆射影変換によりページ画像の平坦化を行った後、平坦化されたページ画像を表示部11に表示させて処理を終了しているが、これに限るものではない。例えば、平坦化されたページ画像を表示部11に表示させた後、ユーザの指示に応じて(例えば対話的処理により)、処理を終了するか(図7のステップ726、あるいはステップ706)に戻ってメッシュの調整処理を再度行うかを判断するようにしてもよい。
〔実施形態4〕
上述した実施形態1では、見開き書籍の1ページ毎について歪み補正処理を行う構成について説明したが、これに限るものではない。例えば、見開き書籍を開いた状態で撮像される2ページ(綴じ部を介して互いに接続された2ページ)毎にメッシュの生成処理および調整処理を行い、これら2ページに対して歪み補正処理を施すようにしてもよい。この際、例えば、制御部31が上記2ページの中央部(綴じ部)を検出し、中央部を挟んで両側に存在するページ毎にメッシュの生成処理および調整処理を行うようにしてもよい。上記中央部の検出方法は特に限定されるものではないが、例えば、原稿領域の中央付近にあるエッジを抽出することにより検出する方法を用いることができる。
〔実施形態5〕
上記各実施形態において、表示制御部32が処理の進行状態に応じた操作入力をユーザに促すメッセージを表示部11に表示させ、ユーザが表示部11に表示されるメッセージを参照して操作入力を行えるようにしてもよい。また、メッセージを表示させるか否かをユーザが設定できるようにしてもよい。
〔実施形態6〕
上述した各実施形態における制御部31の各ブロックは、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
後者の場合、制御部31の各ブロックは、各機能を実現するソフトウェアであるプログラムの命令を実行するCPU、上記プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する)、上記プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(またはCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
〔まとめ〕
本発明の態様1にかかる画像処理システム1は、原稿を読み取って取得した原稿画像における上記原稿の歪み状態を示す歪みモデル(メッシュ、メッシュ画像)を作成する画像処理システム1であって、表示装置10と、上記表示装置10の表示を制御する表示制御部32と、上記歪みモデルを作成する歪みモデル作成部(メッシュ制御部34)と、ユーザからの指示入力を受け付ける入力受付部33とを備え、上記表示制御部32は、矩形形状のメッシュ画像を上記原稿画像に重畳させて上記表示装置10に表示させ、上記歪みモデル作成部(メッシュ制御部34)は、矩形形状の上記メッシュ画像の形状をユーザからの指示入力に応じて上記原稿画像の形状に近づけるように変形させることにより、上記歪みモデルを作成することを特徴としている。
上記の構成によれば、ユーザの指示入力に応じてメッシュ画像の形状を原稿画像の形状に近づけるように変形させることで、原稿の歪み状態を示す歪みモデルを簡易な処理で適切に作成することができる。また、原稿画像がフラットベッド型のスキャナにより撮像された画像ではない場合(例えば上向きに開かれた状態で卓上等に載置された製本原稿を撮像して取得した原稿画像の場合)であっても、原稿画像の歪みモデルを適切に作成することができる。
本発明の態様2にかかる画像処理システム1は、態様1において、上記歪みモデル作成部(メッシュ制御部34)は、矩形形状の上記メッシュ画像の各角部をユーザからの第1指示入力に応じて上記原稿の角部に近づけるように移動させる第1処理と、上記第1処理が施されたメッシュ画像における互いに対向する2辺をユーザからの第2指示入力に応じて上記原稿における上記2辺に対応する各辺にそれぞれ近づけるように変形させる第2処理とを行うことにより、上記歪みモデルを作成する構成である。
上記の構成によれば、ユーザは、矩形形状のメッシュ画像の角部を原稿の角部に近づけるための第1指示入力と、メッシュ画像の2辺を原稿における対応する辺に近づけるための第2指示入力とを行うことにより、画像処理システムに容易に歪みモデルを作成させることができる。
本発明の態様3にかかる画像処理システム1は、態様2において、上記原稿は綴じ部を中心として開閉可能に綴じられた見開き原稿であり、上記原稿における上記各辺は、上記綴じ部の延伸方向に交差する方向に延伸する辺である構成である。
上記の構成によれば、見開き原稿を読み取る際に原稿画像に歪みが生じた場合であっても、当該歪みの状態を示す歪みモデルを適切に作成することができる。
本発明の態様4にかかる画像処理システム1は、態様2または3において、上記入力受付部33は、上記表示装置10の表示画面に対するユーザのタッチ操作による指示入力を受け付けるものであり、上記第1指示入力は、上記表示画面における上記原稿の角部の近傍にタッチしてドラッグ操作を行うことにより入力され、上記第2指示入力は、上記2辺に設けられた複数の中間制御点のうちの操作対象の中間制御点の近傍にタッチしてドラッグ操作を行うことにより入力される構成である。
上記の構成によれば、ユーザは、表示画面に対するタッチ操作によって画像処理システムに容易に歪みモデルを作成させることができる。
本発明の態様5にかかる画像処理システム1は、態様2から4のいずれかにおいて、上記歪みモデル作成部(メッシュ制御部34)は、上記第2処理において上記メッシュ画像における上記2辺をベジェ曲線によりモデル化する構成である。
上記の構成によれば、原稿画像に生じた歪みを適切にモデル化することできる。
本発明の態様6にかかる画像処理システム1は、態様4において、上記入力受付部33は、上記表示画面に対するタッチ操作の開始点が上記原稿の角部の表示位置から所定範囲内の位置であり、かつ当該開始点からドラッグ操作が行われた場合に、当該タッチ操作を上記第1指示入力として検出する構成である。
上記の構成によれば、入力受付部33が、矩形形状のメッシュ画像の各角部を原稿の角部に近づけるためのユーザからの第1指示入力を適切に検出することができる。
本発明の態様7にかかる画像処理システム1は、態様4において、上記入力受付部33は、上記表示画面に対するタッチ操作の開始点が上記中間制御点のいずれかから所定範囲内の位置であり、かつ当該開始点からドラッグ操作が行われた場合に、当該タッチ操作を、当該中間制御点を操作対象とする上記第2指示入力として検出し、上記歪みモデル作成部(メッシュ制御部34)は、操作対象の上記中間制御点を、上記ドラッグ操作の移動方向および移動距離に応じて移動させる構成である。
上記の構成によれば、入力受付部33が、メッシュ画像における互いに対向する2辺を原稿における対応する辺に近づけるためのユーザからの第2指示入力を適切に検出することができる。
本発明の態様8にかかる画像処理システム1は、態様2から7のいずれかにおいて、上記歪みモデル作成部(メッシュ制御部34)は、上記第2処理を施したメッシュ画像の各区画のうち、境界部の曲率が所定の閾値以上である区画をさらに複数の小区画に細分化し、細分化後のメッシュ画像を上記歪みモデルとする構成である。
上記の構成によれば、メッシュ画像の区画のうち境界部の曲率が所定の閾値以上である区画をさらに細分化することで、原稿画像における歪みの程度が大きい箇所をより適切にモデル化することができる。
本発明の態様9にかかる画像処理システム1は、態様2から8のいずれかにおいて、上記歪みモデル作成部は(メッシュ制御部34)、上記第1指示入力が行われている期間中に、入力済みの当該第1指示入力に応じた上記第1処理を順次行い、上記表示制御部は、上記原稿画像に重畳表示させる上記メッシュ画像を、上記歪みモデル作成部によって上記第1処理が行われたメッシュ画像に順次更新する構成である。
上記の構成によれば、ユーザがドラッグ操作中に当該ドラッグ操作に応じて更新されるメッシュ画像を順次確認しながら操作を行うことができるので、操作を容易かつ適切に行うことができる。
本発明の態様10にかかる画像処理システム1は、態様1から9のいずれかにおいて、上記歪みモデル作成部(メッシュ制御部34)の作成した歪みモデルに基づいて上記原稿画像に対して歪み補正処理を施す画像補正部35を備えている構成である。
上記の構成によれば、作成された歪みモデルに基づいて原稿画像の歪みを補正することができる。
本発明の態様11にかかる画像処理システム1は、態様10において、上記画像補正部35は、上記原稿の画像データに対して上記歪みモデルに基づく逆射影変換を施すことにより、上記歪み補正処理を行う構成である。
上記の構成によれば、歪みモデルに基づく逆射影変換により原稿画像の歪みを適切に補正することができる。
本発明の態様12にかかる画像処理方法は、原稿を読み取って取得した原稿画像における上記原稿の歪みを示す歪みモデルを作成する画像処理方法であって、矩形形状のメッシュ画像を上記原稿画像に重畳させて表示装置に表示させる工程と、上記メッシュ画像の形状を上記原稿画像の形状に近づけるためのユーザからの指示入力を受け付ける工程と、上記メッシュ画像の形状をユーザからの指示入力に応じて上記原稿画像の形状に近づけるように変形させることにより、上記歪みモデルを作成する工程とを含むことを特徴としている。
上記の方法によれば、ユーザの指示入力に応じてメッシュ画像の形状を原稿画像の形状に近づけるように変形させることで、原稿の歪み状態を示す歪みモデルを簡易な処理で適切に作成することができる。また、原稿画像がフラットベッド型のスキャナにより読み取られた画像ではない場合(例えば上向きに開かれた状態で卓上等に載置された製本原稿を撮像して取得した原稿画像の場合)であっても、原稿画像の歪みモデルを適切に作成することができる。
なお、各図面に示した構成は一般的な構成であり、本発明の構成は様々な異なる形態に変形あるいは設計可能である。すなわち、上述した本発明の方法、システム、および装置は、単に本発明の好ましい実施形態の一例を示したものであり、本発明の概念を制限することを意図したものではない。
また、上述した実施形態において、フローチャートや図面には処理の順序を特定の順序で記載しているが、これに限るものではなく、他の順序に変更してもよい。例えば、各処理の順序を図示されている順序から変更してもよい。また、図面において連続して示されている2つ以上の処理を並行して行ってもよく、部分的に並行して行ってもよい。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。
本発明は、原稿を読み取って得られる原稿画像における上記原稿の歪み状態を示す歪みモデルを作成する画像処理システムおよび画像処理方法に適用することができ、見開き書籍(見開き原稿)の原稿画像における上記歪みモデルの作成に特に適している。
1 画像処理システム
10 表示装置
11 表示部
12 操作入力部
20 画像読取装置
30 画像処理装置
31 制御部
32 表示制御部
33 入力受付部
34 メッシュ制御部(歪みモデル作成部)
35 画像補正部
36 画像取得部
37 記憶部

Claims (10)

  1. 原稿を読み取って取得した原稿画像における上記原稿の歪み状態を示す歪みモデルを作成する画像処理システムであって、
    上記原稿は綴じ部を中心として開閉可能に綴じられた見開き原稿であり、
    表示装置と、
    上記表示装置の表示を制御する表示制御部と、
    上記歪みモデルを作成する歪みモデル作成部と、
    ユーザからの指示入力を受け付ける入力受付部とを備え、
    上記表示制御部は、上記原稿画像における上記綴じ部の延伸方向に交差する方向に延伸する2辺を含む矩形形状のメッシュ画像を上記原稿画像に重畳させて上記表示装置に表示させ、
    上記メッシュ画像は、所定のパラメータt(t∈[0,1])と上記パラメータtに応じて上記2辺をそれぞれ等間隔に分割する複数の第1等間隔点とによって上記2辺を表した3次ベジェ曲線と、上記2辺における互いに対応する第1等間隔点同士をそれぞれ接続する第1直線と、上記各第1直線をそれぞれ等間隔に分割する複数の第2等間隔点のうち隣接する上記第1直線における互いに対応する第2等間隔点同士を接続する第2直線とによりモデル化されており、
    上記歪みモデル作成部は、矩形形状の上記メッシュ画像の形状をユーザからの上記各第1等間隔点を上記原稿画像における上記2辺に近づけるための指示入力に応じて上記原稿画像の形状に近づけるように変形させることにより、上記歪みモデルを作成することを特徴とする画像処理システム。
  2. 上記歪みモデル作成部は、
    矩形形状の上記メッシュ画像の各角部をユーザからの第1指示入力に応じて上記原稿の角部に近づけるように移動させる第1処理と、
    上記第1処理が施されたメッシュ画像における互いに対向する2辺をユーザからの第2指示入力に応じて上記原稿における上記2辺に対応する各辺にそれぞれ近づけるように変形させる第2処理とを行うことにより、上記歪みモデルを作成することを特徴とする請求項1に記載の画像処理システム。
  3. 上記入力受付部は、上記表示装置の表示画面に対するユーザのタッチ操作による指示入力を受け付けるものであり、
    上記第1指示入力は、上記表示画面における上記原稿の角部の近傍にタッチしてドラッグ操作を行うことにより入力され、
    上記第2指示入力は、上記2辺に設けられた複数の中間制御点のうちの操作対象の中間制御点の近傍にタッチしてドラッグ操作を行うことにより入力されることを特徴とする請求項に記載の画像処理システム。
  4. 上記入力受付部は、上記表示画面に対するタッチ操作の開始点が上記原稿の角部の表示位置から所定範囲内の位置であり、かつ当該開始点からドラッグ操作が行われた場合に、当該タッチ操作を上記第1指示入力として検出することを特徴とする請求項に記載の画像処理システム。
  5. 上記入力受付部は、
    上記表示画面に対するタッチ操作の開始点が上記中間制御点のいずれかから所定範囲内の位置であり、かつ当該開始点からドラッグ操作が行われた場合に、当該タッチ操作を、当該中間制御点を操作対象とする上記第2指示入力として検出し、
    上記歪みモデル作成部は、操作対象の上記中間制御点を、上記ドラッグ操作の移動方向および移動距離に応じて移動させることを特徴とする請求項に記載の画像処理システム。
  6. 上記歪みモデル作成部は、上記第2処理を施したメッシュ画像の各区画のうち、境界部の曲率が所定の閾値以上である区画をさらに複数の小区画に細分化し、細分化後のメッシュ画像を上記歪みモデルとすることを特徴とする請求項2からのいずれか1項に記載の画像処理システム。
  7. 上記歪みモデル作成部は、上記第1指示入力が行われている期間中に、入力済みの第1指示入力に応じた上記第1処理を順次行い、
    上記表示制御部は、上記原稿画像に重畳表示させる上記メッシュ画像を、上記歪みモデル作成部によって上記第1処理が行われたメッシュ画像に順次更新することを特徴とする請求項2からのいずれか1項に記載の画像処理システム。
  8. 上記歪みモデル作成部の作成した歪みモデルに基づいて上記原稿画像に対して歪み補正処理を施す画像補正部を備えていることを特徴とする請求項1からのいずれか1項に記載の画像処理システム。
  9. 上記画像補正部は、上記原稿の画像データに対して上記歪みモデルに基づく逆射影変換を施すことにより、上記歪み補正処理を行うことを特徴とする請求項に記載の画像処理システム。
  10. 原稿を読み取って取得した原稿画像における上記原稿の歪みを示す歪みモデルを作成する画像処理方法であって、
    上記原稿は綴じ部を中心として開閉可能に綴じられた見開き原稿であり、
    上記原稿画像における上記綴じ部の延伸方向に交差する方向に延伸する2辺を含む矩形形状のメッシュ画像であって、所定のパラメータt(t∈[0,1])と上記パラメータtに応じて上記2辺をそれぞれ等間隔に分割する複数の第1等間隔点とによって上記2辺を表した3次ベジェ曲線と、上記2辺における互いに対応する第1等間隔点同士をそれぞれ接続する第1直線と、上記各第1直線をそれぞれ等間隔に分割する複数の第2等間隔点のうち隣接する上記第1直線における互いに対応する第2等間隔点同士を接続する第2直線とによりモデル化されたメッシュ画像を、上記原稿画像に重畳させて表示装置に表示させる工程と、
    上記メッシュ画像の形状を上記原稿画像の形状に近づけるためのユーザからの上記各第1等間隔点を上記原稿画像における上記2辺に近づける指示入力を受け付ける工程と、
    上記メッシュ画像の形状をユーザからの指示入力に応じて上記原稿画像の形状に近づけるように変形させることにより、上記歪みモデルを作成する工程とを含むことを特徴とする画像処理方法。

JP2014064460A 2013-03-26 2014-03-26 画像処理システムおよび画像処理方法 Active JP5722482B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/851,056 US9317893B2 (en) 2013-03-26 2013-03-26 Methods and systems for correcting a document image
US13/851,056 2013-03-26

Publications (2)

Publication Number Publication Date
JP2014192901A JP2014192901A (ja) 2014-10-06
JP5722482B2 true JP5722482B2 (ja) 2015-05-20

Family

ID=51620346

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014064460A Active JP5722482B2 (ja) 2013-03-26 2014-03-26 画像処理システムおよび画像処理方法

Country Status (2)

Country Link
US (1) US9317893B2 (ja)
JP (1) JP5722482B2 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102205906B1 (ko) * 2013-12-09 2021-01-22 삼성전자주식회사 이미지 내 오브젝트 윤곽선의 수정 방법 및 시스템
JP6143199B2 (ja) * 2015-03-18 2017-06-07 カシオ計算機株式会社 画像補正装置、画像補正方法、及びプログラム
US10275863B2 (en) * 2015-04-03 2019-04-30 Cognex Corporation Homography rectification
JP6728615B2 (ja) * 2015-09-30 2020-07-22 ヤマハ株式会社 画像補正装置、画像補正方法およびプログラム
JP6213903B2 (ja) * 2016-03-11 2017-10-18 カシオ計算機株式会社 画像補正装置、画像補正方法、及びプログラム
CN107608619A (zh) * 2017-09-20 2018-01-19 广州视源电子科技股份有限公司 用于触控屏的笔迹曲线生成方法、装置、设备和存储介质
CN112001851B (zh) * 2019-05-27 2023-08-04 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机设备及存储介质
IT201900007281A1 (it) * 2019-05-27 2020-11-27 West Systems Srl Apparato e metodo per l’acquisizione di misure lineari, angolari e di superficie di animali vivi o di carcasse di animali macellati
CN110553630B (zh) * 2019-09-09 2021-07-06 南昌工程学院 一种基于图片处理的挑射流冲坑地形演变实时监测方法
CN110996081B (zh) * 2019-12-06 2022-01-21 北京一数科技有限公司 一种投影画面校正方法、装置、电子设备及可读存储介质
WO2021155575A1 (en) * 2020-02-07 2021-08-12 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Electric device, method of controlling electric device, and computer readable storage medium
CN111586385B (zh) * 2020-05-29 2022-04-01 燕山大学 一种基于b样条曲线的投影图像颜色校正方法
US10991081B1 (en) 2020-12-31 2021-04-27 VoyagerX, Inc. Book scanning using machine-trained model
US11030488B1 (en) 2020-12-31 2021-06-08 VoyagerX, Inc. Book scanning using machine-trained model
US11568634B2 (en) * 2021-04-28 2023-01-31 Intuit Inc. Machine learning pipeline for document image quality detection and correction
CN115082935A (zh) * 2022-07-04 2022-09-20 网易有道信息技术(北京)有限公司 用于对文档图像进行矫正的方法、设备及存储介质
CN116883461B (zh) * 2023-05-18 2024-03-01 珠海移科智能科技有限公司 一种用于获取清晰文档图像的方法及其终端装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1067757A1 (en) 1999-07-09 2001-01-10 Hewlett-Packard Company Curled surface imaging system
EP1067362A1 (en) 1999-07-09 2001-01-10 Hewlett-Packard Company Document imaging system
EP1096777A1 (en) 1999-10-28 2001-05-02 Hewlett-Packard Company, A Delaware Corporation Document imaging system
JP2004040395A (ja) * 2002-07-02 2004-02-05 Fujitsu Ltd 画像歪み補正装置、方法及びプログラム
JP4508553B2 (ja) 2003-06-02 2010-07-21 カシオ計算機株式会社 撮影画像投影装置、及び撮影画像の補正方法
US7586655B1 (en) 2003-06-30 2009-09-08 Google Inc. Acquiring and using three-dimensional information in a document scanning system
JP4082303B2 (ja) 2003-07-25 2008-04-30 富士ゼロックス株式会社 画像補正装置
US7593595B2 (en) 2004-08-26 2009-09-22 Compulink Management Center, Inc. Photographic document imaging system
US7660458B1 (en) 2004-12-14 2010-02-09 Google Inc. Three-dimensional model construction using unstructured pattern
US7623274B1 (en) 2004-12-22 2009-11-24 Google Inc. Three-dimensional calibration using orientation and position sensitive calibration pattern
US7576738B2 (en) 2005-05-27 2009-08-18 California Institute Of Technology Method for constructing surface parameterizations
US7330604B2 (en) 2006-03-02 2008-02-12 Compulink Management Center, Inc. Model-based dewarping method and apparatus
US20070247458A1 (en) * 2006-04-11 2007-10-25 Samsung Electronics Co., Ltd. Adaptive computation of subdivision surfaces
JP4975679B2 (ja) * 2008-04-18 2012-07-11 株式会社Pfu ノート型情報処理装置、および、射影変換パラメータ算出方法
GB2472179B (en) 2008-05-06 2013-01-30 Compulink Man Ct Inc Camera-based document imaging
JP4913911B1 (ja) * 2011-02-16 2012-04-11 パナソニック株式会社 画像処理装置およびこれを備えた原稿読取システム
JP4918167B1 (ja) 2011-03-31 2012-04-18 パナソニック株式会社 画像処理装置およびこれを備えた原稿読取システム
JP2012170049A (ja) 2011-12-27 2012-09-06 Panasonic Corp 画像処理装置およびこれを備えた原稿読取システム
KR20130114336A (ko) * 2012-04-09 2013-10-17 삼성전자주식회사 단말기에서 페이지 표시 방법 및 장치
US20140098142A1 (en) * 2012-10-09 2014-04-10 School Yourself, Inc. System and method for generation and manipulation of a curve in a dynamic graph based on user input

Also Published As

Publication number Publication date
JP2014192901A (ja) 2014-10-06
US20140292802A1 (en) 2014-10-02
US9317893B2 (en) 2016-04-19

Similar Documents

Publication Publication Date Title
JP5722482B2 (ja) 画像処理システムおよび画像処理方法
US9305211B2 (en) Method, apparatus, and computer-readable recording medium for converting document image captured by using camera to dewarped document image
JP6010870B2 (ja) 画像補正装置、及び画像補正方法、プログラム
GB2559446A (en) Generating a three-dimensional model from a scanned object
JP5644461B2 (ja) 画像処理装置及びプログラム
JP2011129114A (ja) 検出装置、検出方法、検出プログラム、および記録媒体
JP2007241356A (ja) 画像処理装置および画像処理プログラム
GB2578947A (en) Unified digital content selection system for vector and raster graphics
US20230162413A1 (en) Stroke-Guided Sketch Vectorization
US20160357395A1 (en) Information processing device, non-transitory computer-readable recording medium storing an information processing program, and information processing method
JP2015176251A (ja) 画像処理装置および画像処理方法
JP2017120503A (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
JP2009146150A (ja) 特徴位置検出方法及び特徴位置検出装置
US10430963B2 (en) Image processing apparatus, image reading apparatus, and non-transitory computer readable medium storing program
JP6137464B2 (ja) 画像処理装置および画像処理プログラム
US20160035062A1 (en) Electronic apparatus and method
JP6973524B2 (ja) プログラム
JP4628406B2 (ja) 画像処理装置、方法およびプログラム
US20180211366A1 (en) Flattening and Rectifying A Curved Image
WO2016024375A1 (ja) 画像処理装置及び画像処理方法
AU2019213404B2 (en) Unified selection model for vector and raster graphics
EP4343679A1 (en) Image processing method and apparatus, and readable storage medium
JP6665575B2 (ja) プログラム
JP5636966B2 (ja) 誤差検出装置及び誤差検出プログラム
US20090033654A1 (en) System and method for visually representing an object to a user

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150325

R150 Certificate of patent or registration of utility model

Ref document number: 5722482

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150