JP2017028462A - 画像処理装置、画像処理方法、コンピュータプログラム - Google Patents

画像処理装置、画像処理方法、コンピュータプログラム Download PDF

Info

Publication number
JP2017028462A
JP2017028462A JP2015144409A JP2015144409A JP2017028462A JP 2017028462 A JP2017028462 A JP 2017028462A JP 2015144409 A JP2015144409 A JP 2015144409A JP 2015144409 A JP2015144409 A JP 2015144409A JP 2017028462 A JP2017028462 A JP 2017028462A
Authority
JP
Japan
Prior art keywords
image
correction
quadrilateral
image processing
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015144409A
Other languages
English (en)
Other versions
JP6676299B2 (ja
Inventor
伊藤 直樹
Naoki Ito
直樹 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015144409A priority Critical patent/JP6676299B2/ja
Priority to CN201610554782.2A priority patent/CN106373154B/zh
Priority to US15/211,914 priority patent/US9871947B2/en
Priority to DE102016113163.6A priority patent/DE102016113163A1/de
Priority to GB1612487.7A priority patent/GB2542666B/en
Priority to KR1020160091846A priority patent/KR102038741B1/ko
Publication of JP2017028462A publication Critical patent/JP2017028462A/ja
Application granted granted Critical
Publication of JP6676299B2 publication Critical patent/JP6676299B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/33Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00005Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to image data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00007Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to particular apparatus or devices
    • H04N1/00018Scanning arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00026Methods therefor
    • H04N1/00037Detecting, i.e. determining the occurrence of a predetermined state
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00236Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server using an image reading or reproducing device, e.g. a facsimile reader or printer, as a local input to or local output from a computer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00236Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server using an image reading or reproducing device, e.g. a facsimile reader or printer, as a local input to or local output from a computer
    • H04N1/00241Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server using an image reading or reproducing device, e.g. a facsimile reader or printer, as a local input to or local output from a computer using an image reading device as a local input to a computer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/0044Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00567Handling of original or reproduction media, e.g. cutting, separating, stacking
    • H04N1/0066Aligning or positioning related to handling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00684Object of the detection
    • H04N1/00708Size or dimensions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00742Detection methods
    • H04N1/00748Detecting edges, e.g. of a stationary sheet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3872Repositioning or masking
    • H04N1/3873Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/58Edge or detail enhancement; Noise or error suppression, e.g. colour misregistration correction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Geometry (AREA)
  • Human Computer Interaction (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】 複数の画像の入力を行った際、入力した画像に含まれる原稿画像の四辺形領域を構成する辺の位置を修正する場合、入力画像それぞれに対して修正を行うと、処理に手間がかかる。【解決手段】 上記課題を解決すべく本画像処理装置は、第1及び第2の画像を含む複数の画像を取得する取得手段と、前記取得手段により取得された複数の画像のうちの第1の画像から四辺形領域を検出する検出手段と、前記検出手段により検出された四辺形領域を構成する辺の位置を修正する修正手段と、前記取得手段により取得された前記第1の画像以外の前記複数の画像のそれぞれに含まれる四辺形領域を前記検出手段により検出する際に、前記修正手段により前記第1の画像に対して施された修正結果を反映させる反映手段と、を有することを特徴とする。【選択図】 図10

Description

本発明は、画像中に含まれる原稿領域を抽出して歪み補正することが可能な画像処理装置、画像処理方法、コンピュータプログラムに関するものである。
近年、スマートフォンやタブレットPCといった高度な画像処理機能を持つ携帯端末が普及してきている。これら携帯端末は、カメラを備え、撮影機能(カメラ機能)を有している。このような携帯端末のカメラ機能を用いて紙媒体の原稿を撮影して得られた原稿画像を、携帯端末のメモリ上に画像データとして保存する機会が増えてきた。これに伴い、撮影した画像データをプリンタへ送信してプリントするように、原稿を複写するために携帯端末とプリンタとを組み合わせて使用する機会も増えてきた。このように、ユーザがスキャナ機能とプリンタ機能との両方を備えたMFP(Multi Function Peripheral)を持っていなくても、携帯端末とプリンタとがあれば、原稿の複写ができるようになっている。
携帯端末のカメラ機能を用いた原稿の撮影では、MFPにおける原稿のスキャンとは異なり、撮影画像全面に原稿全体を正面から歪みなく写すことが難しい。台座や三脚などを用意して携帯端末と撮影対象である原稿を固定しなければ、カメラと原稿の距離や角度を正確に保つことは難しいためである。また、このようにして得られた撮影画像をそのままコピーしたりデータファイル化したりするのは好ましくない。撮影時に原稿画像以外の余計なものが写ってしまう場合や、斜め方向から撮影したために原稿画像が幾何学的に歪んでしまう場合があるためである。このような場合には、コピーやデータファイル化を行う前に撮影画像から原稿画像の領域(原稿領域)だけを切り出し、切り出した原稿領域に対して歪み補正(台形補正と呼ばれる場合もある)を施して幾何科学的歪みを取り除く必要がある。
撮影画像から原稿領域を切り出す方法として、できるだけユーザの負担を減らすために、撮影画像中のエッジ情報を利用して原稿領域の四辺(原稿の端部を構成する辺)を自動検出する方法がある。しかしながら、原稿領域と原稿以外の背景領域のコントラストが低いために原稿領域の辺のエッジが検出できない場合や、原稿領域の四辺以外で多くのエッジが検出されてエッジが適切に判定できない場合など、原稿領域の辺の自動検出が失敗してしまう場合がある。
この場合には、原稿領域の辺として検出されたエッジの集合体である線分のうち、原稿領域の辺である可能性が一番高いと判断された線分で構成される四辺形を入力画像に重ねて表示する。この場合、ユーザからのこの四辺の位置の修正操作を受け付けることで、正しい原稿領域を指定させる必要がある。
また、ユーザに四辺形の領域を指定させる方法としては、四辺形の頂点や辺の中点に修正操作用のハンドルを設定し、マウスやタッチによる操作を受け付ける方法がある。この方法では、ユーザがハンドルを操作することにより、頂点や辺をユーザの任意の位置に移動させることができる。
また、頂点や辺の位置をユーザが直接指定するのではなく、予め取得された候補の中からユーザに所望の頂点や辺の位置を選択させる方法がある。特許文献1では、輪郭の候補を複数求め、ユーザが輪郭候補を切替える操作を行うことで一つずつ輪郭候補を提示し、ユーザ所望の輪郭を確定させることで、輪郭の指定を行う方法について開示している。
特開2007−52670号公報
しかし上記の技術では、複数の画像を入力して各画像に含まれる原稿画像の四辺の位置に対して修正のための操作(修正操作)をする場合、それぞれの画像に含まれる原稿画像に対して四辺の位置の修正操作を行う必要がある。
よって、ユーザは複数の画像それぞれに含まれる原稿画像に対して正しい領域の指定をする処理を行う必要があるため修正操作に手間がかかり、修正操作が煩雑になる。
上記課題を解決するために、本発明の画像処理装置は、第1及び第2の画像を含む複数の画像を取得する取得手段と、前記取得手段により取得された複数の画像のうちの第1の画像から四辺形領域を検出する検出手段と、前記検出手段により検出された四辺形領域を構成する辺の位置を修正する修正手段と、前記取得手段により取得された前記第1の画像以外の前記複数の画像のそれぞれに含まれる四辺形領域を前記検出手段により検出する際に、前記修正手段により前記第1の画像に対して施された修正結果を反映させる反映手段と、を有することを特徴とする。
複数の画像を入力した場合、そのうち1枚の画像に含まれる原稿画像(四辺形画像)に対して四辺の位置の修正をすることで、それ以外の画像に含まれる原稿画像の検出結果も修正することが可能になる。これにより入力した画像のうち他の画像に含まれる原稿画像の四辺の修正を減らすことが可能になり、ユーザの操作が煩雑にならない。
実施例1における携帯端末の概観図である。 実施例1における携帯端末の概略構成を示すブロック図である。 実施例1における処理手順のフローチャートである。 実施例1における原稿領域特定処理を表す図である。 実施例1における領域指定処理手順のフローチャートである。 実施例1における辺選択による領域指定処理手順のフローチャートである。 実施例1における辺選択による領域指定処理を表す図である。 実施例1における歪み補正処理を表す図である。 実施例1における候補線分群を保持している候補線分群管理テーブルの例を示す図である。 実施例1における候補辺群の更新処理手順のフローチャートである。 実施例2における処理手順のフローチャートである。 実施例2における領域指定処理手順のフローチャートである。 実施例3における領域指定処理手順のフローチャートである。 実施例4における領域指定処理手順のフローチャートである。
(実施例1)
以下に、本発明を実施するための形態について図面を用いて説明する。
<携帯端末の構成>
図1に本実施例で利用する携帯端末(画像処理装置)101の外観を示す。図1(a)は、携帯端末101を表側の外観図であり、表側には、タッチパネルディスプレイ102、操作ボタン103が含まれる。図1(b)は、携帯端末101の裏側の外観図であり、裏側には、カメラ104が配置されている。また、カメラ104には図示しないオートフォーカス機構が搭載されており、これにより焦点距離や被写体距離を測定することもできる。
なお、本実施例はカメラ機能を持つ画像処理装置ならば利用が可能である。例えば、カメラ機能を有するスマートフォン(携帯電話)やタブレット端末やパソコン(PC)のみならず、タッチパネルディスプレイを有するデジタルカメラでも構わない。また、有線または無線でカメラと接続されたPC等でも実施可能である。また、カメラ等で撮影された画像データが保存されている保存装置(メモリカード等)から、携帯端末やPC等が画像データを読み込んで本実施例の処理を行うことも可能である。
図2に携帯端末101の内部の構成を示す。但し、この構成図は本実施例を実施するための構成の一例であり、この構成に限るものではない。
図2において、CPU201、RAM202、ROM203がデータバス211を介してプログラムやデータを送受信する。データバス211には、記憶部204、データ送受信部205、撮像部206、表示部207、操作部208、画像処理部209、モーションセンサ210が接続される。さらに、CPU201、RAM202、ROM203も併せて、互いにプログラムやデータの送受信を行う。
記憶部204は、フラッシュメモリであり、画像データや各種プログラムを格納する。データ送受信部205は、無線LANコントローラを有し、外部とのデータの送受信を実現する。
撮像部206は、カメラであり、原稿の撮影を行って撮影画像を取得する。取得された撮影画像のデータには、携帯端末のメーカー名やモデル名・画像解像度・絞り(F値)・焦点距離などのヘッダー情報が付与され、後述のように各部に送信される。
表示部207は、ディスプレイであり、カメラ機能を用いて原稿を撮影する際にライブビューによる表示や、本実施例の処理終了通知などの各種情報を表示する。操作部208は、タッチパネルや操作ボタンであり、ユーザからの操作を受け付け、各部へこの操作の情報を送信する。
画像処理部209は、撮影画像から原稿画像(四辺形領域)を抽出する原稿抽出を行う。モーションセンサ210は、3軸加速度センサ、電子コンパス、3軸角速度センサを搭載しており、公知の技術を利用することにより、携帯端末101の姿勢や移動を検知することが可能である。
なお、CPU201がROM203または記憶部204で保持されているコンピュータプログラムを実行することで、これらの携帯端末101内の構成要素の制御を行う。
<フローチャートを用いた本実施例の詳細説明>
図3は、本実施例における携帯端末101が実行する歪み補正処理(台形補正処理と呼ばれる場合もある)を説明するフローチャートである。携帯端末101は、ROM203に格納されている入力画像または撮像部206で取得した入力画像に対して、歪み補正を行う基準となる四辺形領域をユーザに指定させて、指示された四辺形領域が矩形になるように補正する歪み補正処理を実行する。なお、携帯端末101のCPU201(コンピュータ)がROM203に格納されている処理プログラムをRAM202にロードして実行することにより、図3の各ステップの処理を実行する処理部として機能する。
ステップS301においてCPU201は、ユーザによって選択または撮影された入力画像を取得する。入力画像を格納済の画像から選択することで取得する場合は、ROM203やメモリカード等のメモリに格納されている画像の中から、操作部208によって指示された画像を選択し、データバス211を経由して取得する。また、入力画像を撮影することで取得する場合は、撮像部206で取得された画像を、データバス211を経由して取得する。
ステップS306においてCPU201は、追加して画像の選択を指示する、または追加して画像の撮影を指示するための表示を表示部207に示す。
CPU201は表示部207に表示された内容に対して、操作部208で操作された情報を取得する。ここでの操作部208で操作された情報とは、処理対象の画像の追加を行うために、さらに画像をメモリから選択する、またはさらに画像を撮像部により撮影する、または画像の追加をしないという情報である。
入力画像を選択することで画像を追加する場合は、ステップS301で説明したように、ROM203やメモリカード等に格納されている画像の中から、操作部208によって指示された画像を選択し、データバス211を経由して取得する。また、入力画像を撮影することで画像を追加する場合には、ステップS301で説明したように撮像部206で取得された画像を、データバス211を経由して取得する。
ステップS302においてCPU201は、ステップS301で取得した入力画像から、原稿領域の各辺の候補となる候補線分群(候補辺群)を検出する。そして、その複数検出された線分である候補線分群の中から各辺において辺となりうる可能性が一番高い辺で構成される原稿領域の四辺を表す四辺形領域を特定する原稿領域特定処理を実行する。原稿領域特定処理の詳細については、図4を用いて後述する。ステップS306において、追加される画像があった場合には、追加された全ての画像のそれぞれに対してステップS302で説明した原稿領域特定処理を行う。
ステップS307においてCPU201は、ステップS301で取得した入力画像全てに対してステップS302の原稿領域特定処理を完了したか否か判断処理を行う。
ステップS303においてCPU201は、ステップS302で検出された四辺形領域を入力画像に重ねて表示し、表示された四辺形領域に対してユーザからの指示を受けて四辺形領域の形状を変更(修正)する領域指定処理を実行する。
なお、最初にこの修正を受けた入力画像を基準画像(第1の画像)とする。この基準画像は最初に入力された画像に限らず、最初にこの修正処理を施された画像を基準画像とする。
領域指定処理の詳細については、図5を用いて後述する。
ステップS304においてCPU201は、ステップS303で指定された四辺形領域を基準に、入力画像に含まれる四辺形領域の画像を抽出し、この画像が矩形画像になるように歪みを補正する歪み補正処理を実行する。歪み補正処理の詳細については後述する。
ステップS308においてCPU201は、ステップS301で取得した入力画像全てに対してそれぞれステップS304の歪み補正処理が完了したか否かの判断を行う。
ステップS305においてCPU201は、ステップS304で得られた歪み補正が施された原稿画像のプレビュー画像を表示部207に表示する。CPU201は、ステップS304で得られた歪み補正が施された原稿画像が複数の場合には、全ての原稿画像のプレビュー画像を表示部207に表示を行う。CPU201が表示部207に表示する例としては、プレビュー画像を縮小して表示部207に複数表示することや、プレビュー画像を1画像ごとに表示するなど表示の仕方は限定されるものではない。
なお、上記した処理(画像取得〜台形補正)について、携帯端末101が実行したが、これらの処理をMFPが実行してもよい。すなわち、MFPにより画像をスキャンして、スキャンした画像をMFPが有するUIに表示、台形補正をおこなってもよい。
<原稿領域特定処理(S302)の詳細説明>
ステップS302にて実行される原稿領域特定処理は画像処理部209で行われる。入力画像が取得された場合に、原稿領域の四辺の候補である候補線分群と、原稿領域の四辺を示す四辺形領域を特定する。図4(a)は、入力画像400であり、この画像内に原稿画像の領域(四辺形領域)を示す原稿領域401を含む。
図4(b)は、入力画像400上に候補線分群を重ねて表示した画像である。候補線分群は、入力画像400から検出されたエッジ情報を検出するHough変換アルゴリズムなどの公知の方法によって検出される。検出された候補線分群には、候補線分402をはじめとした、原稿領域の四辺以外を表す線分も含まれる。この中から、原稿領域の上辺、右辺、下辺、左辺のそれぞれに対して各辺を構成する可能性が最も高いと判断される候補線分403、404、405、406を特定する。原稿領域の各辺として候補線分403、404、405、406を候補線分群の中から第1の候補として特定する手段としては、任意の4本の候補線分で構成される四辺形に対して評価を行うことで特定する。任意の4本の候補線分で構成される四辺形の評価は、例えば、対辺の長さの比や内角の大きさ、アスペクト比などの幾何学的な情報に基づいて行われてもよい。または、四辺形を構成する線分について、内側と外側の色味や分散を比較するなどの画像情報に基づいて行われてもよい。
図4(c)は、候補線分群の中から特定された原稿領域である四辺形領域407を、入力画像400上に表示した画像である。四辺形領域407は、候補線分403、404、405、406を四辺として特定された場合に構成される四辺形領域であり、頂点408、409、410、411を結ぶ線分によって囲まれた四辺形領域である。
図9(a)は、候補線分群についての情報を保持している候補線分群管理テーブルの例を示す。この例では、候補線分の各辺に対して四辺形領域を構成する辺の可能性が高い順に上位6位の線分まで保持されている。四辺形領域を構成する各辺に対して候補線分の両端、例えば上辺の左端(X1、Y1)、右端(X2、Y2)の座標を保持している。右辺の上端(X1、Y1)、下端(X2、Y2)、下辺の左端(X1、Y1)、右端(X2、Y2)、左辺の上端(X1、Y1)、下端(X2、Y2)の座標を保持している。
<領域指定処理(S303)の詳細説明>
ステップS303にて実行される領域指定処理では、歪み補正を行う基準となる四辺形領域をユーザからの指定に基づいて変更(修正)させる。領域指定処理の詳細を、図5に示すフローチャートに従って説明する。
なお、携帯端末101のCPU201(コンピュータ)がROM203に格納されている処理プログラムをRAM202にロードして実行することにより、図5の各ステップの処理を実行する処理部として機能する。
ステップS501においてCPU201は、ステップS302の原稿領域特定処理によって特定した四辺形領域およびユーザからの操作を受け付ける辺ハンドルを、表示部207に表示されている入力画像の上に重ねて表示する。ハンドルの表示形態については、図7を用いて後述する。
ステップS502においてCPU201は、操作部208によって、ユーザから辺の選択または領域の確定のいずれかの指示を受け付ける。なお、表示部207に表示されている辺のハンドルが選択されることで、四辺形のうちの一辺が選択指示(辺選択指示)されたとする。
ステップS503においてCPU201は、ステップS502で辺選択が指示されたか否か(ユーザの指示に基づき四辺形のうちの一辺が選択されたか否か)を判断する。
ステップS504においてCPU201は、辺選択による領域指定処理を実行する。辺選択による領域指定処理の詳細は、図6および図7を用いて後述する。
ステップS505においてCPU201は、ステップS502で領域確定が指示された否かを判断する。領域確定が指示された場合には、その時点での四辺形領域を保持してステップS506へ進む。領域確定が指示されていない場合には、ステップS502に戻り再度ユーザからの指示を受け付ける。
ステップS506において、CPU201は、ステップS502、ステップS503、ステップS504において、辺が選択されて領域の変更が行われたか否かを判断する。領域の変更が行われていた場合にはステップS507へ進み、領域の変更が行われていない場合には、その時点での四辺形領域を保持して処理を完了する。
ステップS507においてCPU201は、ステップS505で確定した領域についての情報を用いて、他の入力画像に対して候補辺群の各評価値を更新する処理を行う。候補辺群の更新処理についての詳細は、図10を用いて後述する。
図5のフローにより複数画像のうち1画像(基準画像)に対して検出された四辺形領域(原稿領域)を構成する辺の位置が変更され四辺形領域の形状が修正されると、他の画像に含まれる四辺形画像を検出する際に用いられる候補辺群の評価値を更新することができる。
<候補辺群の更新処理(S507)の詳細説明>
ステップS507にて実行される候補辺群の更新処理では、辺選択においてユーザからの指示を受けて四辺形領域の形状が修正された場合、この修正された基準画像以外の画像に対しても候補辺群の評価値を再評価し、候補辺群の評価値を更新させる。
この候補辺群の更新処理の詳細を、図10に示すフローチャートに従って説明する。
なお、携帯端末101のCPU201(コンピュータ)がROM203に格納されている処理プログラムをRAM202にロードして実行することにより、図10の各ステップの処理を実行する処理部として機能する。
ステップS1001においてCPU201は、ステップS504で修正された四辺形領域の辺のデータの取得を行う。例えば、図9(a)の候補線分群管理テーブルにおいて、上辺は候補辺群のうち2番目の順位の辺が選択された、右辺は候補辺群のうち3番目の順位の辺が選択された、左辺と下辺は修正されていない、といったデータを取得する。
ステップS1002において、CPU201は、ステップS1001で取得した辺のデータが候補辺群の中に存在する辺であるか否かの判断を行う。この判断は四辺全てに対してそれぞれ行う。
ステップS1002で候補辺群の中に存在する辺が選択されたと判断した場合、ステップS1003においてCPU201は、候補辺群の中における順位が1位となるように選択された辺の評価値を変更する。
この評価値は、ステップS302の説明で前述した対辺の長さの比や内角の大きさ、アスペクト比などの幾何学的な情報に基づいて評価された値でもよいし、四辺形を構成する線分について、内側と外側の色味や分散を比較して得られた値でもよい。選択された辺の評価値が他の辺よりも高くなるように重みづけ等を行うことで、評価値を変更・決定する。
ステップS1004においてCPU201は、ステップS1003で決定した評価値を用いて候補辺群に対して再評価を行い、再評価値を取得する。
ステップS1005においてCPU201は、ステップS1004で取得した再評価値に基づいて候補辺群の更新処理を行う。この候補辺群の更新処理とは、図9に示す候補線分管理テーブルにおいて、各候補線分の順位を変更することである。
ステップS1006においてCPU201は、辺の修正処理を行った基準画像以外の入力画像全てに対して候補辺群の更新を行ったか否か判断を行う。辺の修正処理を行った画像以外の入力画像全てに対して候補辺群の更新が行われていた場合、処理を完了する。
図9(b)にステップS1005において、図9(a)に示した候補線分群が更新された候補線分群管理テーブルの例を示す。図9(b)の候補線分群は、図9(a)の候補線分が変わる(座標が変わる)のではなく、順位が変わっていることを示している。図9(b)は、図9(a)の順位3位が1位に更新されており、図9(a)の2位は図9(b)と変わりがない。また、図9(a)の4位が図9(b)の6位へ更新され、図9(a)の5位は、図9(b)の5位と変わりがない。図9(a)の6位は、図9(b)の4位へ更新されている。
図10のフローにより、基準画像に含まれる四辺形領域(原稿画像)の形状が修正された場合、基準画像以外の画像に含まれるし四辺形領域に対しても候補辺群の評価値を再評価し、候補辺群の評価値を更新させることができる。
これにより、基準画像以外の画像から原稿画像を検出する際に、ある1画像に含まれる原稿画像に対して施された修正結果を反映することが可能になる。
<辺選択による領域指定処理(S504)の詳細説明>
ステップS504にて実行される辺選択による領域指定処理は、辺が選択されている場合に、ユーザからの指示を受けて四辺形領域を変形させる。
図7は、辺選択による領域指定処理の概念図である。図7(a)に、四辺形領域701と、辺の選択に使用する辺ハンドル702、703、704、705、および頂点の選択に利用する頂点のハンドル706、707、708、709を示す。
ここでは、辺ハンドル702、703、704、705は、各辺の中点位置に丸形のハンドルを配置しているが、辺ハンドルの形状および位置はこれに限ることはなく、辺自体をハンドルとして選択できるようにしても良い。
図6は、辺選択による領域指定処理のフローチャートである。
ハンドルの辺選択による領域指定処理の詳細を、図6に示すフローチャートに従って、図7を用いながら説明する。
なお、携帯端末101のCPU201(コンピュータ)がROM203に格納されている処理プログラムをRAM202にロードして実行することにより、図6の各ステップの処理を実行する処理部として機能する。
ステップS601において、ユーザが表示画面の辺ハンドル(または辺自体)をタッチして選択すると、選択中の辺およびそのハンドルの表示形態(例えば色)を他のハンドルの表示形態とは別の表示形態に変更して選択中の辺およびそのハンドル表示する。これによって、ユーザはどの辺を選択しているかを確認することができる。図7(b)では、辺710の辺ハンドル711が選択され、辺710と辺ハンドル711の色が変更された場合を示している。
ステップS602において、選択中の辺に対応する候補辺群を表示する。選択中の辺に対応する候補辺群は、原稿領域特定処理において検出された候補線分群の中から、選択中の辺に代替しうる線分の候補となる線分だけを抜粋することで得られる。これによって、ユーザは、候補辺群の中に、選択中の辺に代替しうる線分として所望する線分が含まれているか否かを容易に確認することができる。また、辺を選択中にだけこの辺に対応する候補辺群を表示することで、辺を選択していない場合の表示画面における視認性を保つことができる。複数の候補線分群の中から選択中の辺に対応する候補辺群だけを抜粋する方法としては、選択中の辺の長さや角度、位置など幾何学的な情報を用いる。図7(b)に、辺710が選択された場合の候補辺群として、線分712、713、714を示す。なお、候補辺群712、713、714は、四辺形の領域701や選択中の辺710と区別できるように、それらとは異なる色または異なる表示形態(例えば破線)で表示する。
ステップS603において、ユーザからの辺の移動指示または辺の選択解除を受け付ける。辺の移動指示は、ユーザによって辺ハンドルの位置が変更されたことにより行われる。例えば、ユーザが表示画面上にて指で辺の位置をタッチしたまま、指の位置をスライドさせると、辺ハンドルの位置が変更され辺の移動指示がされたと判断する。また、辺の選択解除は、辺ハンドルの選択が解除されることにより行われる。例えば、ユーザが表示画面上にて辺の位置をタッチしている指を画面から離すと、選択解除されたと判断する。
ステップS604において、ステップS603でのユーザの指示が、辺の移動指示であるか否かを判断する。辺の移動指示であると判断された場合、ステップS605へ進む。そして、ステップS605において、変形を適用する前の四辺形領域をメモリに一時保存する。
次にステップS606において、選択中の辺を移動中の辺ハンドルの現在位置に最も近い位置にある候補線分の位置に移動させるか否か(位置を置換するか否か)を判定する。
図7(b)では、辺ハンドル711に最も近い位置にある線分712が判定対象である。置換するか否かは、選択中の辺ハンドルの移動位置(移動指示された位置)と判定対象の候補線分との距離や、選択中の辺と判定対象の候補線分の長さや角度の違いなどの幾何学的な情報に基づいて判定する。例えば、移動指示を受けた後のハンドルの位置と判定対象の線分との距離が所定閾値以内に近づいたと判定されれば、選択中の辺を判定対象の線分の位置に合わせる(置換する)指示を受けたと判定する。
ステップS606で選択中の辺を候補線分に置換しないと判定された場合、ステップS607において、ステップS603でユーザに指示された位置に、選択中の辺を平行移動させる。
図7(c)は、辺714を移動させたときの図である。辺715が移動後の辺である。移動させる際には、選択中の辺714の傾きを保ったまま、辺714に隣り合う2辺である辺716、717の間を、辺ハンドルの移動に追従して移動させる。変形後の四辺形領域は、辺716を延長させた直線と移動後の辺との交点718と、辺717を延長させた直線と移動後の辺との交点719を新たな頂点とすることで得ることができる。
ステップS606で選択中の辺を置換すると判定された場合、ステップS608において、選択中の辺の位置を、判定対象の候補線分の位置に合うように移動させて表示する。これによって、ユーザが選択中の辺を、表示されている候補線分に近づける操作を行うだけで、選択中の辺と候補線分との間の距離が所定閾値内であれば、選択中の辺を近づけた候補線分の位置に移動させることができる。したがって、候補辺群の中に、原稿領域の四辺を表す線分が含まれている際には、容易に正しい原稿領域の辺を指定することができる。
図7(d)に、辺720を候補辺722の方へ移動させたときに、辺720と候補辺722の距離が所定閾値内になったと判断した時点で、辺720の位置と傾きが候補辺722の位置と傾きに置換されて、辺721に置換された場合を示す。置換結果の辺721は、選択した辺720に隣り合う2辺である辺723、724と、線分722との交点を求めることで得ることができる。
ステップS609において、ステップS607およびステップS608で得られた四辺形領域が不正であるか否かの判定を行う。不正であるか否かは、変形後の四辺形領域の頂点間の距離や頂点の位置、内角の角度に基づいて判定する。判定基準の例としては、撮影画像中に占める原稿領域の最小の大きさを設定することで決まる頂点間の距離や、操作性や視認性を損なわないように頂点ハンドルの表示の大きさに基づいて頂点間が近づき過ぎないように判定する方法がある。また、すべての頂点が画像表示領域内に入っているか否かという頂点位置に基づく判定や、内角の大きさから原稿を斜め方向から撮影しても起こり得ない四辺形を判定する方法がある。
ステップS610ではステップS609での判定結果に基づいて判定が行われる。これにより、ステップS609で不正な四辺形領域であると判定された場合には、現在の四辺形領域をステップS607またはステップS608で得られた四辺形領域に更新せず、ユーザからの変形指示を受け付けない。
ステップS610での判定でステップS609での判定結果が不正でないと判定された場合、ステップS611に進む。そしてステップS611にて現在の四辺形領域をステップS607またはステップS608で得られた四辺形領域に更新し、ユーザからの変形指示を適用する。
ステップS612において、ステップS603でユーザに辺の選択解除が指示され、ステップS604で辺の移動指示がなかったと判断された場合に、四辺形領域の形状を判定する。四辺形領域の形状判定としては、たとえば内角の大きさから凸型の四辺形領域になっていないかを判定したり、対辺が交差していないかを判定したりする方法がある。
ステップS613において、選択中の辺およびそのハンドルの表示形態(色)を元に戻す。これによって、ユーザは辺の選択が解除されたことを確認することができる。
ステップS614において、候補線分の表示を解除する。これによって、ユーザが辺の選択を解除した際には、表示画面で入力画像上に重ねて表示されるのは、図7(a)のような、四辺形領域とハンドルだけであるため、四辺形領域を確認する際に視認性を低下させることはない。
<歪み補正処理(S304)の詳細説明>
ステップS304にて実行される歪み補正処理は、画像処理部209で行なわれる。原稿画像を含む入力画像から、原稿画像の領域である原稿領域特定処理および領域指定処理から得ることができた四辺形領域を基準にして歪み補正処理を行う。入力画像上に、四辺形領域を重ねて表示したのが、図8(a)である。四辺形領域801は、領域指定処理の結果によって得ることができた四辺形領域であるとする。画像処理部209は、撮影画像内の原稿領域のサイズに基づいて変倍パラメータを算出する。ここで、算出する変倍パラメータは、撮影画像内の四辺形領域が、出力してファイル化する際の画像サイズである出力画像サイズに変倍されるような変倍パラメータである。例えば、A4やレターサイズ等の出力画像サイズになるように変倍される。この変倍パラメータは予め設定されていても良いしユーザが選択してもよい。
四辺形領域が台形に歪んでいる場合も考慮し、この変倍パラメータは射影変換行列になる。射影変換行列は、入力画像内の四辺形領域の頂点情報(頂点802、803、804、805)と、出力画像の四隅の座標情報(806、807、808、809)から公知の方法により算出することが可能である。なお、処理速度を優先する場合には、アフィン変換行列や単純な変倍率を変倍パラメータとして用いて算出しても良い。変倍パラメータが決定すると、画像処理部209は、入力画像の四辺形領域だけに対して変倍処理を施すことで、入力画像内から四辺形領域だけを取り出した画像をディスプレイ102などの表示部にて出力ことができる。歪み補正処理の出力結果が画像を示したのが、図8(b)である。
以上、本実施例によれば、複数の画像を入力した場合、そのうち1枚の画像(基準画像)に含まれる四辺形領域(原稿画像)を構成する四辺の位置の修正し、四辺形領域の形状を修正することで、基準画像以外の画像に含まれる四辺形領域の検出結果も修正することが可能になる。これにより入力した画像のうち他の画像に含まれる原稿画像の四辺の修正を減らすことが可能になり、ユーザの操作が煩雑にならない。
また、領域指定処理における辺の選択時にだけその辺の候補辺群を表示することで、ユーザの所望する辺が候補として得られているか否かを容易に確認することができる。このため、処理中の画面表示が煩雑にならない。
また、辺を選択して操作した際のハンドルの位置に基づいて、候補辺群の中から辺を選択できるため、頂点位置を手動で指定する場合と比べて、容易かつ効率的に四辺形領域を指定することができる。
(実施例2)
実施例1では、ユーザによる画像データの追加(連続撮影あるいは複数枚画像入力)を行ってから、原稿領域特定処理、領域指定処理、歪み補正処理を行っていた。
本実施例では、ユーザが処理対象である基準画像を入力し、この基準画像に含まれる原稿画像(四辺形領域)に対して原稿領域特定処理、領域指定処理、歪み補正処理を行ってから、追加で画像を入力(または撮影)する。そして、後から追加された画像に含まれる原稿の四辺の候補線分群の評価結果を変更し、辺候補としての順位の更新を可能にする。
これによって、基準画像を入力し、この基準画像に含まれる原稿画像(四辺形領域)に対し四辺形領域を構成する辺の位置を修正した後に入力した別の画像に含まれる原稿画像にも基準画像に対して施した修正処理の内容を反映することが可能になる。
なお、本実施例においては、実施例1と差分がある部分についてのみ説明する。
図11は、実施例2における携帯端末101が実行する歪み補正処理(台形補正処理と呼ばれる場合もある)を説明するフローチャートである。なお、図3で説明したものと同じ処理に関しては、説明は省略する。
なお、携帯端末101のCPU201(コンピュータ)がROM203に格納されている処理プログラムをRAM202にロードして実行することにより、図6の各ステップの処理を実行する処理部として機能する。
ステップS1102において、CPU201は、追加される画像があるか否かの判断を行う。画像追加の指示があると判断された場合には、ステップS301へ進む。追加される画像がないと判断された場合には、処理を完了する。
<領域指定処理(S1101)の詳細説明>
図12は、実施例2における候補線分群の更新を説明するフローチャートである。なお、図5で説明したものと同じ処理に関しては、説明を省略する。
なお、携帯端末101のCPU201(コンピュータ)がROM203に格納されている処理プログラムをRAM202にロードして実行することにより、図12の各ステップの処理を実行する処理部として機能する。
ステップS1201において、CPU201は、追加される次の入力画像の候補線分群の評価へ反映をさせる処理を行う。これにより各画像における候補辺群の順位が更新される。
よってユーザの指示により四辺形領域を構成する辺の位置の修正を行い、その結果を次の入力画像に対して反映させることが可能になる。
これにより、基準画像を入力し、この基準画像に含まれる原稿画像に対し四辺形領域を構成する辺の位置を修正した後に入力した別の画像に含まれる原稿画像にも基準画像に対して施した修正処理の内容を反映することが可能になる。
よって、基準画像に含まれる原稿画像に対する補正処理が終わった後から追加した画像に対しても基準画像に含まれる原稿画像に対する補正処理を反映することが可能になる。
(実施例3)
本実施例では、四辺形領域を構成する辺のうちユーザからどの辺に対して修正を行ったか否かについての情報を取得し、修正を行った辺に対してのみ他の画像に含まれる原稿画像に対して候補線分群の評価の更新を可能にする。これによって、ユーザが修正した四辺形領域をより絞ることが出来るため、修正する候補線分群の評価が減り、高速に処理することが可能になる。
<領域指定処理(S1101)の詳細説明>
図13は、実施例3における候補辺群の更新を説明するフローチャートである。
なお、携帯端末101のCPU201(コンピュータ)がROM203に格納されている処理プログラムをRAM202にロードして実行することにより、図13の各ステップの処理を実行する処理部として機能する。
図10のフローチャートで説明した処理と同じ処理に関しては説明を省略する。
ステップS1303において、CPU201は、ステップS1002で候補辺群の中に存在する辺が選択されたと判断した場合、選択された辺の場所と候補辺群の順位が1位となる評価値の取得を行う。ここで選択された辺の場所とは、四辺の上辺、右辺、下辺、左辺を指す。また、評価値とは、ステップS302の説明で前述した対辺の長さの比や内角の大きさ、アスペクト比などの幾何学的な情報に基づいて評価してもよいし、四辺形を構成する線分について、内側と外側の色味や分散を比較するなどである。
ステップS1304において、CPU201は、ステップS1303で取得した辺の場所に対応する辺の評価値から該当する辺の場所の候補辺群に対して再評価する処理を行う。
ステップS1305において、CPU201は、ステップS1304で算出した評価値に基づいて修正した辺の場所に該当する候補辺群のみに対して更新処理を行う。
これによって、原稿の四辺のうちユーザが修正した四辺形領域をより絞ることが出来るため、他の画像に含まれる原稿画像に対して修正する候補線分群の評価を行うための処理が減る。よって、他の画像に含まれる原稿画像に対する原稿領域特定処理、領域指定処理、を高速に処理することが可能になる。
(実施例4)
本実施例では、ユーザが修正した四辺形領域を構成する辺の位置に対して、他の画像に対して候補線分群の評価の更新する場合、画像に応じて更新を適用するか否かの判断を行ってから候補線分群の更新を行うことを可能にする。これによって、ユーザが四辺形領域を構成する辺の位置を修正した画像と他の画像を比較して候補線分群の評価を更新するか否かの判断をすることで、ユーザの煩雑な操作を減らすことが可能になる。
<領域指定処理(S1101)の詳細説明>
図14は、実施例4における候補辺群の更新を説明するフローチャートである。
なお、携帯端末101のCPU201(コンピュータ)がROM203に格納されている処理プログラムをRAM202にロードして実行することにより、図14の各ステップの処理を実行する処理部として機能する。
図10のフローチャートで説明した処理と同じ処理関しては説明を省略する。
ステップS1401において、CPU201は、連続撮影して入力された他の画像に対して画像の特徴量についての情報を取得する。特徴量とは、例えば、画像全体の輝度値や色のヒストグラム、原稿と背景の輝度差など、入力された画像の特徴量が、基準画像の特徴量と異なるか否かを判断するための処理である。なお、ここで示したもの以外を用いても特徴量についての判断は可能である。また、基準画像とは、入力された画像のうちユーザにより最初に四辺形領域を構成する辺の位置を修正された原稿画像を含む画像である。
ステップS1402において、CPU201は、ステップS1401で取得した情報を用いて基準画像と特徴量が変わるか否かの判断を行う。例えば、この判断は、予め閾値を設定しておき、取得した情報と基準画像との差分が閾値以内か否かによって判断を行う。その閾値は、外部から指定や設定が出来るようにしても構わない。
これによって、ユーザが四辺形領域を構成する辺の位置を修正した原稿画像を含む画像と他の画像を比較して候補線分群の評価を更新するか否か判断できるので、ユーザの煩雑な操作を減らすことが可能になる。
(その他の実施例)
本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施例の機能を実現するソフトウェア(プログラム)をネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム又は装置のコンピュータ(又はCPUやMPU等)がプログラムコードを読み出して実行する処理である。この場合、そのプログラム、及び該プログラムを記憶した記憶媒体は本発明を構成することになる。

Claims (23)

  1. 第1及び第2の画像を含む複数の画像を取得する取得手段と、
    前記取得手段により取得された複数の画像のうちの第1の画像から四辺形領域を検出する検出手段と、
    前記検出手段により検出された四辺形領域を構成する辺の位置を修正する修正手段と、
    前記取得手段により取得された前記第1の画像以外の前記複数の画像のそれぞれに含まれる四辺形領域を前記検出手段により検出する際に、前記修正手段により前記第1の画像に対して施された修正結果を反映させる反映手段と、
    を有することを特徴とする画像処理装置。
  2. 第1の画像を取得し、該第1の画像に含まれる四辺形領域を構成する四辺形領域を検出する検出手段と、
    前記検出手段により検出された四辺形領域を構成する辺の位置を修正する修正手段と、
    前記第1の画像とは別の第2の画像を取得する取得手段と、
    前記取得手段により取得された前記第2の画像に含まれる四辺形領域を前記検出手段により検出する際に、前記修正手段により前記第1の画像に対して施された修正結果を反映する反映手段と、
    を有することを特徴とする画像処理装置。
  3. 前記第1の画像に含まれ、前記検出手段により検出された辺の位置が前記修正手段により修正された四辺形領域と
    前記反映手段により前記修正結果を反映して検出された四辺形領域とに対して、
    歪み補正を行う補正手段を有することを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記修正手段により辺の位置が修正されると、前記検出された四辺形領域の形状が変更されることを特徴とする請求項1又は2に記載の画像処理装置。
  5. 前記検出手段は、前記四辺形領域を構成する辺の候補となる線分を複数検出し、
    該検出された複数の線分のそれぞれの評価値に基づき四辺形領域を検出することを特徴とする請求項1又は2に記載の画像処理装置。
  6. 前記修正手段により辺の位置が修正されると、該修正に基づいて前記候補となる線分の評価値が更新されることを特徴とする請求項5に記載の画像処理装置。
  7. 前記反映手段は、前記修正手段により位置が修正された辺に対応する辺に対してのみ修正結果を反映することを特徴とする請求項1又は2に記載の画像処理装置。
  8. 前記取得手段により取得した画像のうち前記第1の画像の特徴量が近い画像に対してのみ、前記反映手段による修正結果の反映を行うことを特徴とする請求項1又は2に記載の画像処理装置。
  9. 前記取得された画像は撮像部で原稿を撮像することで得られる画像である請求項1乃至8のいずれか1項に記載の画像処理装置。
  10. 前記四辺形領域は前記撮像部により撮像された原稿の画像であることを特徴とする請求項9に記載の画像処理装置。
  11. 第1及び第2の画像を含む複数の画像を取得する取得手段と、
    前記取得手段により取得された複数の画像のうちの第1の画像から四辺形領域を検出する検出手段と、
    前記検出手段により検出された四辺形領域を構成する辺の位置を修正する修正手段と、
    前記修正手段により修正された四辺形領域に基づいて、前記第1及び前記第2の画像を修正する修正手段と、
    を有することを特徴とする画像処理装置。
  12. 第1及び第2の画像を含む複数の画像を取得する取得ステップと、
    前記取得ステップにて取得された複数の画像のうちの第1の画像から四辺形領域を検出する検出ステップと、
    前記検出ステップにて検出された四辺形領域を構成する辺の位置を修正する修正ステップと、
    前記取得ステップにて取得された前記第1の画像以外の前記複数の画像のそれぞれに含まれる四辺形領域を前記検出ステップにて検出する際に、前記修正ステップにて前記第1の画像に対して施された修正結果を反映させる反映ステップと、
    を有することを特徴とする画像処理方法。
  13. 第1の画像を取得し、該第1の画像に含まれる四辺形領域を構成する四辺形領域を検出する検出ステップと、
    前記検出ステップにて検出された四辺形領域を構成する辺の位置を修正する修正ステップと、
    前記第1の画像とは別の第2の画像を取得する取得ステップと、
    前記取得ステップにて取得された前記第2の画像に含まれる四辺形領域を前記検出ステップにて検出する際に、前記修正ステップにて前記第1の画像に対して施された修正結果を反映する反映ステップと、
    を有することを特徴とする画像処理方法。
  14. 前記第1の画像に含まれ、前記検出ステップにて検出された辺の位置が前記修正ステップにより修正された四辺形領域と
    前記反映ステップにて前記修正結果を反映して検出された四辺形領域とに対して、
    歪み補正を行う補正ステップを有することを特徴とする請求項12又は13に記載の画像処理方法。
  15. 前記修正ステップにて辺の位置が修正されると、前記検出された四辺形領域の形状が変更されることを特徴とする請求項12又は13に記載の画像処理方法。
  16. 前記検出ステップは、前記四辺形領域を構成する辺の候補となる線分を複数検出し、
    該検出された複数の線分のそれぞれの評価値に基づき四辺形領域を検出することを特徴とする請求項12又は13に記載の画像処理方法。
  17. 前記修正ステップにて辺の位置が修正されると、該修正に基づいて前記候補となる線分の評価値が更新されることを特徴とする請求項16に記載の画像処理方法。
  18. 前記反映ステップは、前記修正ステップにて位置が修正された辺に対応する辺に対してのみ修正結果を反映することを特徴とする請求項12又は13に記載の画像処理方法。
  19. 前記取得ステップにて取得した画像のうち前記第1の画像の特徴量が近い画像に対してのみ、前記反映ステップにて修正結果の反映を行うことを特徴とする請求項12又は13に記載の画像処理方法。
  20. 前記取得された画像は撮像部で原稿を撮像することで得られる画像である請求項12乃至19のいずれか1項に記載の画像処理方法。
  21. 前記四辺形領域は前記撮像部により撮像された原稿の画像であることを特徴とする請求項20に記載の画像処理方法。
  22. 第1及び第2の画像を含む複数の画像を取得する取得ステップと、
    前記取得ステップにて取得された複数の画像のうちの第1の画像から四辺形領域を検出する検出ステップと、
    前記検出ステップにて検出された四辺形領域を構成する辺の位置を修正する修正ステップと、
    前記修正ステップにて修正された四辺形領域に基づいて、前記第1及び前記第2の画像を修正する修正ステップと、
    を有することを特徴とする画像処理方法。
  23. コンピュータを、請求項1から11のいずれか1項に記載の画像処理装置として機能させるためのプログラム。
JP2015144409A 2015-07-21 2015-07-21 画像処理装置、画像処理方法、コンピュータプログラム Expired - Fee Related JP6676299B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2015144409A JP6676299B2 (ja) 2015-07-21 2015-07-21 画像処理装置、画像処理方法、コンピュータプログラム
CN201610554782.2A CN106373154B (zh) 2015-07-21 2016-07-14 图像处理装置及图像处理方法
US15/211,914 US9871947B2 (en) 2015-07-21 2016-07-15 Image processing apparatus, image processing method, and storage medium
DE102016113163.6A DE102016113163A1 (de) 2015-07-21 2016-07-18 Bildverarbeitungsvorrichtung, Bildverarbeitungsverfahren und Speichermedium
GB1612487.7A GB2542666B (en) 2015-07-21 2016-07-19 Image processing apparatus, image processing method, and storage medium
KR1020160091846A KR102038741B1 (ko) 2015-07-21 2016-07-20 화상 처리 장치, 화상 처리 방법 및 저장 매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015144409A JP6676299B2 (ja) 2015-07-21 2015-07-21 画像処理装置、画像処理方法、コンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2017028462A true JP2017028462A (ja) 2017-02-02
JP6676299B2 JP6676299B2 (ja) 2020-04-08

Family

ID=56890582

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015144409A Expired - Fee Related JP6676299B2 (ja) 2015-07-21 2015-07-21 画像処理装置、画像処理方法、コンピュータプログラム

Country Status (6)

Country Link
US (1) US9871947B2 (ja)
JP (1) JP6676299B2 (ja)
KR (1) KR102038741B1 (ja)
CN (1) CN106373154B (ja)
DE (1) DE102016113163A1 (ja)
GB (1) GB2542666B (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6584076B2 (ja) 2015-01-28 2019-10-02 キヤノン株式会社 情報処理装置、情報処理方法、コンピュータプログラム
US11012608B2 (en) * 2016-09-12 2021-05-18 Huawei Technologies Co., Ltd. Processing method and mobile device
WO2018112788A1 (zh) * 2016-12-21 2018-06-28 华为技术有限公司 图像处理方法及设备
KR102280239B1 (ko) * 2019-11-19 2021-07-21 네이버 주식회사 문서 이미지의 변환 장치 및 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007058634A (ja) * 2005-08-25 2007-03-08 Ricoh Co Ltd 画像処理方法及び装置、デジタルカメラ装置、並びに画像処理プログラムを記録した記録媒体
JP2007166009A (ja) * 2005-12-09 2007-06-28 Casio Hitachi Mobile Communications Co Ltd 撮像装置、撮像画像処理方法及びプログラム
JP2011123567A (ja) * 2009-12-08 2011-06-23 Sharp Corp 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7129947B1 (en) * 2000-07-26 2006-10-31 California Institute Of Technology Use of normal meshes in three-dimensional imaging
GB0104664D0 (en) 2001-02-23 2001-04-11 Hewlett Packard Co Improvements relating to document capture
JP4525519B2 (ja) 2005-08-18 2010-08-18 日本電信電話株式会社 四辺形評価方法及び装置及びプログラム
WO2009157946A1 (en) 2008-06-27 2009-12-30 Mako Surgical Corp. Automatic image segmentation using contour propagation
JP4630936B1 (ja) * 2009-10-28 2011-02-09 シャープ株式会社 画像処理装置、画像処理方法、画像処理プログラム、画像処理プログラムを記録した記録媒体
US9047531B2 (en) 2010-05-21 2015-06-02 Hand Held Products, Inc. Interactive user interface for capturing a document in an image signal
CN103079467B (zh) 2010-06-23 2016-06-29 瓦里安医疗系统国际股份公司 用于高级结构生成和编辑的机制
US8805045B2 (en) 2010-10-12 2014-08-12 Siemens Aktiengesellschaft Interaction method for regions of-interest in time series images
US9390342B2 (en) 2011-10-17 2016-07-12 Sharp Laboratories Of America, Inc. Methods, systems and apparatus for correcting perspective distortion in a document image
JP5871571B2 (ja) 2011-11-11 2016-03-01 株式会社Pfu 画像処理装置、矩形検出方法及びコンピュータプログラム
JP5951367B2 (ja) * 2012-01-17 2016-07-13 シャープ株式会社 撮像装置、撮像画像処理システム、プログラムおよび記録媒体
JP2013162181A (ja) * 2012-02-01 2013-08-19 Canon Inc 画像読み取り装置及びその制御方法と画像形成装置
US9007633B2 (en) * 2012-08-15 2015-04-14 Fuji Xerox Co., Ltd. Systems and methods for efficiently capturing high-quality scans of multi-page documents with hand-held devices
GB201217372D0 (en) 2012-09-28 2012-11-14 Ucl Business Plc A system and method for annotating images by propagating information

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007058634A (ja) * 2005-08-25 2007-03-08 Ricoh Co Ltd 画像処理方法及び装置、デジタルカメラ装置、並びに画像処理プログラムを記録した記録媒体
JP2007166009A (ja) * 2005-12-09 2007-06-28 Casio Hitachi Mobile Communications Co Ltd 撮像装置、撮像画像処理方法及びプログラム
JP2011123567A (ja) * 2009-12-08 2011-06-23 Sharp Corp 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体

Also Published As

Publication number Publication date
JP6676299B2 (ja) 2020-04-08
GB2542666B (en) 2018-12-05
GB201612487D0 (en) 2016-08-31
DE102016113163A1 (de) 2017-01-26
KR102038741B1 (ko) 2019-10-30
GB2542666A (en) 2017-03-29
US9871947B2 (en) 2018-01-16
CN106373154A (zh) 2017-02-01
US20170026546A1 (en) 2017-01-26
CN106373154B (zh) 2020-03-24
KR20170012079A (ko) 2017-02-02

Similar Documents

Publication Publication Date Title
JP6584076B2 (ja) 情報処理装置、情報処理方法、コンピュータプログラム
EP3089102B1 (en) User feedback for real-time checking and improving quality of scanned image
EP3092790B1 (en) Adaptive camera control for reducing motion blur during real-time image capture
JP2011055467A (ja) 撮像画像処理システム、画像出力方法、プログラムおよび記録媒体
JP6270325B2 (ja) 情報処理装置およびその制御方法
JP2005122320A (ja) 撮影装置、その画像処理方法及びプログラム
JP6426815B2 (ja) 画像処理装置および画像処理方法
KR102038741B1 (ko) 화상 처리 장치, 화상 처리 방법 및 저장 매체
US20120120099A1 (en) Image processing apparatus, image processing method, and storage medium storing a program thereof
JP2019110407A (ja) 投写制御装置およびその制御方法、ならびに投写システム
JP2013257643A (ja) 画像処理システム及びプログラム
JP6067040B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP6973524B2 (ja) プログラム
JP2019179461A (ja) 手帳管理装置、手帳管理プログラム及び手帳管理方法
JP7206739B2 (ja) 撮影装置およびプログラム
JP6267520B2 (ja) 画像処理装置およびその制御方法、画像処理システム
JP6665575B2 (ja) プログラム
JP6512829B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP6203070B2 (ja) スキャンシステムおよびその制御方法、並びにプログラム
JP2014059678A (ja) 画像出力装置、画像出力システム、画像出力プログラム
JP2016118850A (ja) 画像処理装置、画像寸法算出方法及び画像寸法算出プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180705

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190604

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191001

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191018

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200312

R151 Written notification of patent or utility model registration

Ref document number: 6676299

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees