JP2013235418A - Image processing device and manuscript reading system - Google Patents
Image processing device and manuscript reading system Download PDFInfo
- Publication number
- JP2013235418A JP2013235418A JP2012107366A JP2012107366A JP2013235418A JP 2013235418 A JP2013235418 A JP 2013235418A JP 2012107366 A JP2012107366 A JP 2012107366A JP 2012107366 A JP2012107366 A JP 2012107366A JP 2013235418 A JP2013235418 A JP 2013235418A
- Authority
- JP
- Japan
- Prior art keywords
- line segment
- image
- unit
- captured image
- tilt
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Input (AREA)
- Image Processing (AREA)
- Facsimile Scanning Arrangements (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
Description
本発明は、書籍などの原稿を読み取って得られた画像を処理する画像処理装置およびこれを備えた原稿読取システムに関する。 The present invention relates to an image processing apparatus that processes an image obtained by reading a document such as a book, and a document reading system including the image processing apparatus.
書籍のページを自然に開いた状態で上方から撮影してページの画像を読み取ることができる書画カメラ(ブックスキャナ)が普及している(特許文献1参照)。このような書画カメラを用いると、ページをめくりながらページの画像を次々に読み取ることができるため、書籍を電子化する作業を効率良く行うことができる。また、この書画カメラを用いた原稿読取システムでは、正規の読取位置(すなわち、水平・垂直等の基準方向)に対して傾いた状態で原稿がセットされた場合でも、読み取られた原稿の画像(原稿綴じ部や原稿エッジの位置等)に基づき傾斜角度を推定することにより、画像の傾きを自動的に補正することができる。 2. Description of the Related Art Document cameras (book scanners) that can take a picture of a page and read an image of the page while the page of the book is naturally opened are widely used (see Patent Document 1). When such a document camera is used, the images on the page can be read one after another while turning the page, so that the work of digitizing the book can be performed efficiently. Further, in the document reading system using the document camera, even when the document is set in an inclined state with respect to a normal reading position (that is, a reference direction such as horizontal or vertical), an image of the read document ( The inclination of the image can be automatically corrected by estimating the inclination angle based on the document binding portion and the position of the document edge.
画像の傾斜角度を推定する技術に関しては、例えば、エッジ部分の画素濃度を強調するエッジ処理後に二値化した画像データをハフ変換処理(直線成分抽出)してパラメータ図表を生成するハフ変換手段と、そのパラメータ図表における座標の度数を角度θ毎に積算してヒストグラムを生成するヒストグラム生成手段と、そのヒストグラムから座標の度数が最大の角度θを特定することにより傾斜角度を推定する傾斜角度検出手段とを備えたデータ処理装置が知られている(特許文献2参照)。 With respect to the technique for estimating the inclination angle of an image, for example, a Hough transforming unit that generates a parameter chart by performing Hough transform processing (linear component extraction) on binarized image data after edge processing that emphasizes the pixel density of an edge portion , A histogram generating means for generating a histogram by integrating the frequency of coordinates in the parameter chart for each angle θ, and an inclination angle detecting means for estimating the inclination angle by specifying the angle θ having the maximum frequency of coordinates from the histogram Is known (see Patent Document 2).
ところで、上述のような画像の傾斜角度を精度良く推定するためには、原稿の水平・垂直等の基準方向に沿った外形輪郭、文字列、及び図形枠等から検出した有効な直線成分を用いることが必要となる。一方、例えば原稿の紙面の広範囲にわたって写真や複雑な図形等が存在すると、傾斜角度推定ではノイズとなる直線成分が混在してしまい、有効な直線成分を検出することが難しくなり、そのような場合には、画像の傾斜角度の推定に大きな誤差が生じるという問題がある。 By the way, in order to accurately estimate the inclination angle of the image as described above, effective linear components detected from the outer contour, the character string, the figure frame, and the like along the reference direction such as the horizontal / vertical direction of the document are used. It will be necessary. On the other hand, for example, if there are photographs, complex figures, etc. over a wide area of the original, the linear component that becomes noise is mixed in the estimation of the tilt angle, making it difficult to detect effective linear components. However, there is a problem that a large error occurs in the estimation of the tilt angle of the image.
しかしながら、上記特許文献2に記載された従来技術は、紙面の内容等を考慮するものではないため、上記のような問題に対応することは困難であった。したがって、そのような従来技術により、有効な直線成分の検出が難しい画像を適宜傾き補正して連続的に表示や記録を行う場合には、一連の傾き補正後の画像の向きが不自然に変化して見難い画像となってしまう。
However, since the prior art described in
本発明は、このような従来技術の課題を鑑みて案出されたものであり、簡易な構成により、撮影画像から有効な直線成分の検出が難しい場合に不適当な傾き補正が実行されることを防止可能とする画像処理装置およびこれを備えた原稿読取システムを提供することを主目的とする。 The present invention has been devised in view of such problems of the prior art, and with a simple configuration, inappropriate tilt correction is performed when it is difficult to detect an effective linear component from a captured image. It is a main object of the present invention to provide an image processing apparatus that can prevent such a situation and a document reading system including the same.
本発明の画像処理装置は、原稿の紙面を順次撮影した撮影画像における複数のエッジ画素を抽出するエッジ抽出部と、前記エッジ画素に基づき複数の直線成分を抽出する直線抽出部と、前記直線成分の交差状態を判定することにより、前記複数の直線成分のうち相互に交差する直線成分の割合である交差線分率を算出する交差線分率算出部と、前記複数の直線成分の傾斜角度について統計的処理を行うことによって前記撮影画像の傾斜角度を推定する傾斜角度推定部と、前記傾斜角度推定部が推定した前記傾斜角度に基づき、前記撮影画像を回転させることにより当該撮影画像の傾き補正を行う画像回転部とを備え、前記画像回転部が前記傾き補正を行う第1の動作モードと、前記画像回転部が前記傾き補正を行わない第2の動作モードとを有し、前記交差線分率が所定の閾値以上の場合、前記第2の動作モードを実行することを特徴とする。 An image processing apparatus according to the present invention includes an edge extraction unit that extracts a plurality of edge pixels in a captured image obtained by sequentially photographing a paper surface of a document, a straight line extraction unit that extracts a plurality of straight line components based on the edge pixels, and the straight line component An intersection line segment calculation unit that calculates an intersection line segment ratio that is a ratio of linear components intersecting each other among the plurality of linear components, and an inclination angle of the plurality of linear components A tilt angle estimation unit that estimates the tilt angle of the captured image by performing statistical processing; and the tilt correction of the captured image by rotating the captured image based on the tilt angle estimated by the tilt angle estimation unit A first operation mode in which the image rotation unit performs the tilt correction, and a second operation mode in which the image rotation unit does not perform the tilt correction. And, the intersecting line segment ratio is equal to or greater than a predetermined threshold value, and executes the second operation mode.
このように本発明によれば、簡易な構成により、撮影画像から有効な直線成分の検出が難しい場合に不適当な傾き補正が実行されることを防止可能とするという優れた効果を奏する。 As described above, according to the present invention, it is possible to prevent an inappropriate inclination correction from being performed when it is difficult to detect an effective linear component from a captured image with a simple configuration.
上記課題を解決するためになされた第1の発明は、原稿の紙面を順次撮影した撮影画像における複数のエッジ画素を抽出するエッジ抽出部と、前記エッジ画素に基づき複数の直線成分を抽出する直線抽出部と、前記直線成分の交差状態を判定することにより、前記複数の直線成分のうち相互に交差する直線成分の割合である交差線分率を算出する交差線分率算出部と、前記複数の直線成分の傾斜角度について統計的処理を行うことによって前記撮影画像の傾斜角度を推定する傾斜角度推定部と、前記傾斜角度推定部が推定した前記傾斜角度に基づき、前記撮影画像を回転させることにより当該撮影画像の傾き補正を行う画像回転部とを備え、前記画像回転部が前記傾き補正を行う第1の動作モードと、前記画像回転部が前記傾き補正を行わない第2の動作モードとを有し、前記交差線分率が所定の閾値以上の場合、前記第2の動作モードを実行する構成とする。 According to a first aspect of the present invention, there is provided an edge extracting unit that extracts a plurality of edge pixels in a photographed image obtained by sequentially photographing a paper surface of a document, and a straight line that extracts a plurality of linear components based on the edge pixels. An intersecting line segment calculating unit that calculates an intersecting line segment ratio that is a ratio of linear components intersecting each other among the plurality of linear components by determining an intersecting state of the linear components; A tilt angle estimator for estimating the tilt angle of the captured image by performing statistical processing on the tilt angle of the linear component, and rotating the captured image based on the tilt angle estimated by the tilt angle estimator. An image rotation unit that performs tilt correction of the captured image, wherein the image rotation unit performs the tilt correction, and the image rotation unit does not perform the tilt correction. And a second operating mode, the cross-line rate is equal to or greater than a predetermined threshold, and configured to execute the second operation mode.
これによると、簡易な構成により、撮影画像から有効な直線成分の検出が難しい場合に不適当な傾き補正が実行されることを防止することができる。特に、有効な直線成分の割合(換言すれば、ノイズ成分の割合)の指標として直線成分の交差線分率を用いるため、画像の種別(写真、図形、及び文字等)を判定する等の複雑な処理を不要としつつ、傾き補正の可否を高速かつ高精度に決定できるという利点がある。 According to this, with a simple configuration, it is possible to prevent inappropriate inclination correction from being performed when it is difficult to detect an effective linear component from a captured image. In particular, since the intersection line segment ratio of the straight line component is used as an index of the effective straight line component ratio (in other words, the noise component ratio), the type of image (photo, graphic, character, etc.) is determined. There is an advantage that whether or not tilt correction can be performed can be determined at high speed and with high accuracy, while eliminating the need for simple processing.
また、第2の発明は、上記第1の発明において、前記閾値は、第1の値と、当該第1の値よりも大きい第2の値とからなり、一連の前記撮像画像において、今回の撮影画像における前記交差線分率が前記第1の値よりも大きな前回の撮影画像の前記交差線分率から減少して前記第1の値を下回った場合、前記第2の動作モードを前記第1の動作モードに切り替える一方、今回の撮影画像における前記交差線分率が前記第2の値よりも小さな前回の撮影画像の前記交差線分率から増大して前記第2の値を上回った場合、前記第1の動作モードを前記第2の動作モードに切り替える構成とする。 In a second aspect based on the first aspect, the threshold value includes a first value and a second value that is larger than the first value. When the intersecting line segment ratio in the photographed image decreases from the intersecting line segment ratio of the previous photographed image that is larger than the first value and falls below the first value, the second operation mode is changed to the first operation mode. When switching to the first operation mode, the intersecting line segment ratio in the current photographed image increases from the intersecting line segment ratio in the previous photographed image smaller than the second value and exceeds the second value. The first operation mode is switched to the second operation mode.
これによると、2つの閾値によりヒステリシスを持たせて2つの動作モードを切り替える構成としたため、撮影画像を順次傾き補正する際に、原稿が静止状態であるにも拘わらず何らかの不安定化要因(照明の変化、紙面の僅かな揺れ、イメージセンサのノイズ、確率的ハフ変換のランダム性等)により、直線成分の交差線分率が変動して不適当な傾き補正が実行されることを防止することができる。 According to this, since the two operation modes are switched by providing hysteresis with two threshold values, when the captured image is sequentially tilt-corrected, some destabilization factor (illumination) is used even though the document is stationary. ), Slight fluctuations in the paper surface, image sensor noise, randomness of stochastic Hough transform, etc. Can do.
また、第3の発明は、上記第1または第2の発明において、前記傾斜角度推定部は、前記交差状態の判定により、判定対象である直線成分が1または複数の他の線分と交差する場合、当該判定対象である直線成分を前記統計的処理の対象から除外する構成とする。 In a third aspect based on the first aspect or the second aspect, the inclination angle estimating unit intersects one or more other line segments with a straight line component to be determined by determining the intersection state. In this case, the straight line component that is the determination target is excluded from the statistical processing target.
これによると、判定対象である直線成分が1または複数の他の直線成分と交差する場合には、当該判定対象である直線成分を統計的処理の対象から除外する構成としたため、統計的処理の対象からノイズ成分(すなわち、原稿の基準方向と一致しない不適切な直線成分)を効果的に除去することができ、その結果、撮影画像の傾斜角度を精度良く推定することが可能となる。 According to this, when the straight line component that is the determination target intersects with one or more other linear components, the straight line component that is the determination target is excluded from the statistical processing target. Noise components (that is, inappropriate linear components that do not match the reference direction of the document) can be effectively removed from the target, and as a result, the tilt angle of the captured image can be estimated with high accuracy.
また、第4の発明は、上記第1から第3の発明のいずれかに係る画像処理装置と、前記撮影画像を生成するカメラ部を有する画像入力装置とを備えた原稿読取システムである。 According to a fourth aspect of the present invention, there is provided a document reading system including the image processing apparatus according to any one of the first to third aspects of the present invention and an image input apparatus having a camera unit that generates the captured image.
以下、本発明の実施の形態について図面を参照しながら説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図1は本発明に係る原稿読取システム1を示す全体構成図であり、図2は原稿読取システム1において書籍Bを正規の読取位置にセットした状態を示す平面図である。この原稿読取システム1は、書籍(原稿)Bの紙面の画像を読み取って、紙面の画像データを取得するものであり、紙面を撮影して映像信号に変換する書画カメラ(画像入力装置)2と、この書画カメラ2と通信可能に接続されたPC3とから構成される。
FIG. 1 is an overall configuration diagram showing a
書画カメラ2は、撮影機能を有するカメラ部4と、このカメラ部4を保持するスタンド部5とを備えている。カメラ部4は、CCDやCMOS等からなるイメージセンサと、LEDや蛍光ランプ等からなる照明用光源(共に図示せず)とを内蔵する。スタンド部5は、机上面などの載置面6に載置される略V字状に開いた脚7と、この脚7に支持されたアーム8とを有している。脚7の上面には、書籍Bの撮影位置を規定するための一対のガイド部材9が突設されている。アーム8は、脚7から斜め上方に伸縮自在に設けられる一方、ヒンジ部8aによってカメラ部4を回動可能に保持しており、これにより、カメラ部4の画角や光軸方向(撮影方向)の調整が可能となっている。また、カメラ部4は、画角や倍率を連続的に可変させる公知のズーム機能を有している。
The
PC3は、書画カメラ2の各種動作条件をユーザが設定したり、書画カメラ2で撮像した撮影画像をユーザが確認したりするための入出力装置として機能すると共に、撮影画像の画像処理や記録等を行う画像処理装置としても機能する。
The PC 3 functions as an input / output device for the user to set various operating conditions of the
なお、原稿読取システム1において書画カメラ2と共に用いられる装置としては、PC(Personal Computer)に限らず同様の機能を実現可能な任意の情報処理装置を用いることができる。また、PC3の機能の一部を書画カメラ2に付加することや、PC3と書画カメラ2とを一体的に構成することも可能である。さらに、書画カメラ2とPC3は直接的に接続されている必要はなく、例えば図示しないネットワークを介して接続されていてもよい。このように構成した場合、書画カメラ2が撮像のためのトリガ信号を発生させ(具体的には、例えばイメージキャプチャを指示するスイッチやボタン)、遠隔のPC3(例えば、サーバ)に対してプッシュ型のデータ伝送をすることになる。
The apparatus used together with the
書画カメラ2による撮影では、ユーザがカメラ部4の真下(光軸方向)の載置面6上に書籍Bを開いた状態で載置することにより、書籍Bの見開き2ページと書籍Bの周囲の載置面6の一部を含む撮影画像(動画または静止画)が得られる。このときユーザは、図2に示すように、書籍Bの上縁Baを左右方向に延びるガイド部材9に突き当てて前後方向位置および傾きを調節することにより、書籍Bを読取位置に精度良くセットすることが可能である。撮影画像は、PC3に適宜送信され、そこで必要な画像処理がなされた後、所定の記録媒体に保存されると共にユーザに対してディスプレイ表示される。
In photographing with the
なお、原稿読取システム1が読み取る原稿は、書籍に限らず、文字、図面、写真その他これに類する情報を含む任意の情報伝達媒体とすることができる。更に、この情報伝達媒体はポジフィルム、ネガフィルム等の透過原稿であってもよく、この場合は、例えば透明な導光板の側面に光源を配置した光源ユニットにより背面から光を照射し、透過光を撮像するように構成すればよい。
The document read by the
図3は、図1中の書画カメラ2およびPC3の概略構成を示すブロック図である。
FIG. 3 is a block diagram showing a schematic configuration of the
書画カメラ2は、カメラ部4を備えた撮像処理部11と、ユーザが設定した動作条件に基づいて撮像処理部11に所要の動作を行わせる操作指示部12と、PC3との接続のためのUSB規格等に準拠する外部インタフェイス13とを有している。
The
PC3は、書画カメラ2との接続のためのUSB規格等に準拠する外部インタフェイス21と、書画カメラ2からの撮影画像データが入力される画像データ入力部22と、撮影画像の記録や表示に際して必要な画像処理を行う画像処理部23と、キーボード等からなる入力操作部24においてユーザが設定した動作条件を書画カメラ2に対して送信する操作系制御部25と、画像処理後の撮影画像をLCDやプロジェクタ等からなる表示部26に表示するためのデータを生成する表示データ生成部27と、画像処理後の撮影画像データを保存するデータ格納部28とを有している。画像処理部23は、撮影画像の傾き補正を行う画像傾斜補正部30を有している。画像傾斜補正部30によって処理される撮影画像データは画像データ記憶部37から読み出される。また、後述する画像傾斜補正部30での交差線分率の算出や統計的処理等に用いられる各種パラメータの情報はパラメータ記憶部38から読み出される。
The
PC3における画像データ入力部22、画像処理部23、操作系制御部25および表示データ生成部27等における処理機能は、画像処理アプリケーションなどのプログラムをCPUで実行するソフトウェア処理によって実現することができる。もちろんPC3を画像処理装置と解釈して、特定の処理を高速に実行するハードウェアを備える構成としてもよい。画像データ記憶部37およびパラメータ記憶部38は汎用のメモリからなる。
The processing functions of the image
PC3において、画像データ入力部22は、書画カメラ2から送信される撮影画像データを画像処理部23の画像データ記憶部37に順次格納し、必要に応じてその撮影画像データを画像傾斜補正部30に順次出力する。そして、画像傾斜補正部30は、撮影画像データの画像処理の際に撮影画像の傾斜角度を推定すると共に、その推定した傾斜角度に基づき撮影画像の傾き補正を行う。傾き補正された撮影画像データは、データ格納部28に格納されると共に、表示データ生成部27に送られて表示部26に表示される。
In the
画像傾斜補正部30は、撮影画像のグレースケール変換や2値化を行うグレースケール変換部31と、グレースケール変換された撮影画像について複数のエッジ画素を抽出する(エッジ検出を行う)エッジ抽出部32と、抽出された複数のエッジ画素に基づき当該エッジ画素を結ぶ複数の線分(直線成分)の抽出を行う線分抽出部(直線抽出部)33と、抽出された各線分の相互の交差状態を判定し、全ての線分のうち他の線分と相互に交差する線分が占める割合である交差線分率を算出する交差線分率算出部34と、抽出された複数の線分の傾斜角度について統計的処理を行うことによって撮影画像の傾斜角度を推定すると共に、当該傾斜角度に基づき撮影画像の傾き補正角度を設定する傾き補正角度設定部(傾斜角度推定部)35と、傾き補正角度に基づき撮影画像を回転させる画像回転部36とを有している。
The image
また、PC3において、ユーザは入力操作部24を操作することにより、書画カメラ2で撮影される画像の解像度、フレームレート、シャッタスピード、照明用光源の発光量などの動作条件を適宜入力することができる。この動作条件は、操作系制御部25から書画カメラ2に対して制御信号として送信され、書画カメラ2では、PC3からの制御信号に基づき操作指示部12が送出した処理命令にしたがって撮像処理部11が撮影動作を実行する。
In the
図4は図1に示した原稿読取システム1による画像表示手順の要部を示すフロー図であり、図5は図4中の交差線分率取得(ST105)で取得される交差線分率の例を示す説明図である。
FIG. 4 is a flowchart showing the main part of the image display procedure by the
原稿読取システム1を利用するユーザは、まず、読取位置(書画カメラ2の撮影可能位置)に書籍Bを開いた状態でセットし、書画カメラ2を起動させると共に、PC3で所要のアプリケーションを起動させる。その後、書画カメラ2による撮像が開始され、PC3の画像データ入力部22において書画カメラ2からの画像の入力が検出される(ST101)。この撮影画像の入力は、所定のフレームレートで実施され、各撮影画像に対して以下で示すような処理が順次実行される。
A user who uses the
次に、PC3では、書画カメラ2から受信した撮影画像データを画像データ入力部22が画像データ記憶部37に格納した後、グレースケール変換部31が撮影画像をRGBのカラー画像から白黒画像に変換する(ST102)。このグレースケール変換処理は、中間値法等の周知の方法を用いて行うことができる。書画カメラ2がYC分離後の信号を直接出力する構成であれば、Y(輝度)信号をそのまま用いるとよい。
Next, in the
続いて、エッジ抽出部32は、グレースケール変換された撮影画像において輝度が急激に変化する部位をエッジ画素として抽出する(ST103)。このエッジ抽出処理は、キャニー(Canny)法等の周知の方法を用いて行うことができる。更に、線分抽出部33は、取得された複数のエッジ画素から線分(直線成分)の抽出を行う(ST104)。この線分抽出処理は、確率的ハフ(Hough)変換等の周知の方法を用いて行うことができる。確率的ハフ変換は、画像の中から端点を持つ線分を検出する際に用いられ、検出された線分について始点,終点の座標値を取得することができる。
Subsequently, the
ここで抽出された端点の座標値等の各線分の情報(以下、「線分情報」という。)はパラメータ記憶部38に格納される。この線分情報には、各線分における両端点の座標等のデータのみならず、後述する交差線分であるか否かを示すフラグ(以下、「交差線分フラグ」と称する。2つの線分が交差しないとき交差線分フラグは「false」を、交差するときは「true」の値をとるものとする。)などの所定の動作条件の成立の有無や、データの状態を確認するための標識が含まれる。なお、撮影画像から抽出される直線成分としては、少なくともそれらの傾斜角度についての統計的処理により書籍Bの傾斜の度合いを推定可能なものであればよく、本実施形態に示す線分に限定されるものではない。
Information of each line segment such as the coordinate value of the end point extracted here (hereinafter referred to as “line segment information”) is stored in the
次に、交差線分率算出部34は、各線分の相互の交差状態を判定し、入力された撮像画像について交差線分率を算出する(ST105)。ここで「交差線分」を他線分との交点を持つ線分と、「非交差線分」を他線分との交点を持たない線分と定義すると、交差線分率=交差線分の数/(交差線分の数+非交差線分の数)で示される。なお、交差線分の数+非交差線分の数=全線分の数である。また、「交差線分」には、自身の端点が他の線分の端点と一致するものや、自身の端点が他の線分上に位置するものを含ませてもよい。
Next, the intersection line
ここで、図5に示すように、撮影画像41の交差線分率は、見開きページである紙面の内容(すなわち、画像の種別)によって大きく変化する。例えば図5(A)に示す教科書B1では、文字や記号等が表示される文章領域43が紙面の大半を占め、一部に表、図面、写真等を含む図形領域44が存在する。この教科書B1における外形輪郭、文章領域43、及び図形領域44の枠線等からは、非交差線分(画像の傾斜角度の推定に有効な直線成分)が多く抽出されるため、ここでの交差線分は20〜30%程度である。また、図5(B)に示す動物図鑑B2では、交差線分(ノイズ成分)が多く抽出される写真等の図形領域44が文章領域43よりも紙面において多くを占めるようになり、ここでの交差線分は60〜70%程度である。さらに、図5(C)に示す動物図鑑B2の一部(写真部分)を拡大して撮影した画像では、撮影画像41全体を図形領域44が占めており、また書籍の外形輪郭等も存在しないため、ここでの交差線分率は略100%である。なお、ここでは、図5(A)に示すように、原稿(教科書B1)の基準方向(線C1参照)が撮影画像の基準方向(線C2参照)に対してα°傾いた例を示している。また、図5(C)では、図示の便宜上、図5(B)に示した動物図鑑B2に対して撮影画像41を縮小して示している。
Here, as shown in FIG. 5, the intersection line segment ratio of the captured
再び図4を参照して、次に、傾き補正角度設定部35は、ST105で算出された交差線分率に基づき、現在の撮影画像についてデスキュー実施の可否(画像回転部による傾き補正の可否)を判定する(ST106)。詳細は後述するが、このデスキュー実施の判定では、交差線分率が所定の閾値以下の場合には、デスキューON(ST106:YES)と判定し、PC3では傾き補正を行う第1動作モードが実行される。一方、交差線分率が所定の閾値以上の場合には、デスキューOFF(ST106:NO)と判定し、これにより、PC3では傾き補正を行わない第2動作モードが実行される。
Referring to FIG. 4 again, next, the inclination correction
傾き補正を実行する場合(ST106:YES)、傾き補正角度設定部35は、線分抽出部33により検出された複数の線分の傾斜角度に関する情報について統計的処理(以下、線分情報統計処理という。)を行うことによって撮影画像の傾斜角度を推定して傾き補正角度を設定する(ST107)。この線分情報統計処理では、線分の傾斜角度に関するヒストグラムの情報が生成される。
When the inclination correction is executed (ST106: YES), the inclination correction
さらに、その傾き補正角度に基づき、画像回転部36は、矩形の撮影画像を回転させて撮影画像の傾き補正を行う(ST108)。これにより、正規の読取位置にて(すなわち、傾きなしで)書籍Bの紙面が読み取られた場合と同等の撮影画像を生成することができる。なお、傾き補正された撮影画像は、画像傾斜補正部30から表示データ生成部27およびデータ格納部28に送られる。そして、表示データ生成部27は傾き補正後の撮影画像に対して、例えばそのページ全体からコンテンツが記載されている領域を抽出し、書籍Bの高さに起因する湾曲を補正してフラットな画像を生成して表示部26に表示する(ST109)。一方、傾き補正を実行しない場合(ST106:NO)、傾き補正されていない撮影画像が表示部26に表示される。
Further, based on the tilt correction angle, the
PC3では、上記一連の処理ST101〜ST109が繰り返し実行されることにより、傾き補正された一連の画像(映像)が表示部26に順次表示される。なお、ST106においてデスキュー実施を不可と判定した場合には、ST107及びST108を省略する構成としたが、これに限らず、例えばST107で設定される傾き補正角度に拘わらず、ST106と同様の判定処理をST108において画像回転部36に実行させる構成としてもよい。
In the
このような処理を実行することにより、原稿読取システム1では、簡易な構成により、撮影画像から検出される有効な線分の割合が低い場合、つまり撮像画像から有効な直線成分の検出が難しい場合でも不適当な傾き補正が実行されることを防止することができる。特に、有効な線分の割合(換言すれば、ノイズ成分の割合)の指標として交差線分率を用いるため、画像の種別(写真、図形、及び文字等)を判定する等の複雑な処理を不要としつつ、傾き補正の可否を高速かつ高精度に決定できるという利点がある。
By executing such processing, the
図6は、図4中の交差線分率取得(ST105)の詳細を示すフロー図である。まず、交差線分率算出部34は、他の線分と交差する線分の数を示す交差線分カウンタiを初期化してi=0とし(ST201)、続いて各線分の相互の交差状態を判定するために、線分情報として取得された全ての線分から交差状態について未判定の1つの線分を判定対象線分として抽出する(ST202)。
FIG. 6 is a flowchart showing details of the intersection line segment acquisition (ST105) in FIG. First, the intersection line
ST202において未判定の線分が抽出された場合(ST203:YES)、その線分の交差状態を示す交差線分フラグを初期化して「false」(交差なし)とし(ST204)、更に、線分情報として取得された全ての線分から判定対象線分以外の1つの線分を比較対象線分(他の線分)として抽出する(ST205)。このST205では、線分情報において今回の判定対象線分と未だ比較されていない他の1つの線分が比較対象線分として順次選択される。 When an undetermined line segment is extracted in ST202 (ST203: YES), an intersection line segment flag indicating the intersection state of the line segment is initialized to “false” (no intersection) (ST204). One line segment other than the determination target line segment is extracted as a comparison target line segment (another line segment) from all the line segments acquired as information (ST205). In ST205, another line segment that has not been compared with the current determination target line segment in the line segment information is sequentially selected as a comparison target line segment.
ST205において比較対象線分が抽出された場合(ST206:YES)、交差線分率算出部34は、ST202で抽出した判定対象線分がステップST205で抽出した比較対象線分と交差するか否かの判定を実行する(ST207)。各線分の交差状態は、線分の両端点の座標に基づき公知の方法を用いて判定することができる。そこで、判定対象線分が比較対象線分と交差する場合(ST208:YES)、交差線分率算出部34では、交差線分フラグを「true」(交差あり)に変更する(ST209)と共に、交差線分カウンタiをカウントアップしてi=i+1とする(ST210)。その後、交差線分率算出部34は、今回の判定対象線分をST202の抽出候補から除外し(ST211)、更に、ST205で抽出されるべき比較対象線分の情報をリセットする(ST212)。その後は、ST202に戻って上記と同様の処理を実施する。
When the comparison target line segment is extracted in ST205 (ST206: YES), the intersection line segment
一方、ST208において交差しないと判定された場合(NO)、交差線分率算出部34は、今回の比較対象線分をST205の抽出候補から除外し(ST213)、ST205に戻って次の比較対象線分を抽出して上記と同様の処理を実施する。なお、今回の判定対象線分を全ての比較対象線分と比較し終えて、ST205で新たな比較対象線分が抽出されない場合には(ST206:NO)、当該判定対象線分は、他のいずれの線分とも交差しないため、ST209およびST210の処理が省略されてST211に進む。
On the other hand, if it is determined in ST208 that they do not intersect (NO), the intersection line
最終的に全ての線分について交差状態の判定が終了すると(ST203:NO)、交差線分率算出部34は、交差線分カウンタiの値を線分情報として取得された全線分数で除算することにより、交差線分率(%)を算出する(ST214)。
When the determination of the intersection state is finally completed for all the line segments (ST203: NO), the intersection line
なお、交差線分率取得の過程で各線分に付与された交差線分フラグの値(false又はtrue)は、原稿の傾斜角度を推定するために生成される、ヒストグラムの度数カウントにおいて参照される。 Note that the value (false or true) of the intersection line segment flag assigned to each line segment in the process of acquiring the intersection line segment ratio is referred to in the histogram frequency count generated to estimate the inclination angle of the document. .
図7は図4中の交差線分率取得(ST105)およびデスキュー実施の可否判定(ST106)の具体例を示す説明図であり、図8は図7におけるデスキュー実施の可否判定の処理の概略を示す状態遷移図である。 FIG. 7 is an explanatory diagram showing a specific example of crossing line segment acquisition (ST105) and deskew execution feasibility determination (ST106) in FIG. 4, and FIG. 8 shows an outline of the deskew execution feasibility judgment process in FIG. FIG.
図7に示すように、ここではデスキュー実施の可否を判定するための交差線分率の閾値として閾値TL1(第1の値)と、この閾値TL1よりも大きい閾値TL2(第2の値)とを用いる。ここでは、閾値TL1=70%、閾値TL2=80%とするが、これらの値は撮影する原稿の内容に応じて適宜変更することができる。また、図7では、デスキュー実施の可否判定(ST106)の結果が切り替わる(デスキューON→OFFまたはデスキューOFF→ON)点を白抜きの丸印で表示して他の点(黒塗りの丸印)と区別している。 As shown in FIG. 7, here, a threshold TL1 (first value) and a threshold TL2 (second value) larger than the threshold TL1 are used as the threshold of the intersection line segment ratio for determining whether or not deskew can be performed. Is used. Here, the threshold value TL1 = 70% and the threshold value TL2 = 80%, but these values can be appropriately changed according to the content of the document to be photographed. Further, in FIG. 7, the result of the determination on whether or not deskew can be performed (ST106) is switched (deskew ON → OFF or deskew OFF → ON) is displayed as a white circle and other points (black circle) It is distinguished from.
まず、時間T1〜T2では、図5(A)に示したような文章領域43が比較的多いページを撮影している。この間において算出された全ての交差線分率は閾値TL1以下であり、図4のST106においてデスキューONと判断され、また、この状態は、図8における「Non-Threshold Status」51にある。時間T1〜T2では、同一ページを撮影しているため、理想的には同一の交差線分率が算出されるべきであるが、実際には、照明の変化、紙面の僅かな揺れ、イメージセンサのノイズ、確率的ハフ変換のランダム性等により、交差線分率が変動(図8中の変動幅D1参照)している。なお、時間T1における点P1は、撮影開始直後の交差線分率を示すものではなく、一連の撮影の途中段階のものである。
First, at time T1 to T2, a page having a relatively
次に、時間T2〜T3では、ユーザによりページめくり(撮影する紙面の変更)が行われる。このとき、交差線分率は、時間T2における点P7から時間T3における点P10まで次第に増大する。ここで、点P8から点P9へ移行(上昇)した際に、交差線分率は閾値TL1を上回るが、依然として閾値TL2未満であり、図8における「Threshold1 Status」52に移行してデスキューONの状態が継続される。そして、点P9から点P10へ更に移行(上昇)した際に、交差線分率は閾値TL2を上回り、これにより、図4のST106においてデスキューOFF(図8中デスキューOFF53を併せて参照)と判断された後、再び図8における「Non-Threshold Status」51に戻る。
Next, at time T2 to T3, the user turns the page (changes the shooting paper). At this time, the intersection line segment gradually increases from point P7 at time T2 to point P10 at time T3. Here, when the point P8 is shifted (increased) to the point P9, the crossing line segment ratio exceeds the threshold value TL1, but is still less than the threshold value TL2, and the process shifts to “Threshold1 Status” 52 in FIG. The state continues. When the point P9 further shifts (increases) from the point P9 to the point P10, the intersection line segment ratio exceeds the threshold TL2, thereby determining that the deskew is OFF (see also the
次に、時間T3〜T4では、図5(B)に示したような図形領域44が文章領域43よりも多くを占めるページ(同一ページ)を撮影している。この間においても時間T1〜T2の場合と同様に、交差線分率が変動(図8中の変動幅D2参照)しており、点P13から点P14へ移行(下降)した際に、交差線分率は閾値TL2未満となるが、依然として閾値TL1を超えており、図8における「Threshold2 Status」54に移行してデスキューOFFの状態が継続される。そして、その直後に点P14から点P15へ移行(上昇)した際に、交差線分率は閾値TL2以上となり、再び図8における「Non-Threshold Status」51に戻る。
Next, at time T3 to T4, a page (same page) in which the
次に、時間T4〜T5では、時間T2〜T3の場合と同様に、ユーザによりページめくりが行われる。このとき、交差線分率は、時間T4における点P17から時間T5における点P19まで次第に減少する。ここで、点P17から点P18へ移行(下降)した際に、交差線分率は閾値TL2未満となるが、依然として閾値TL1を超えており、図8における「Threshold2 Status」54に移行してデスキューOFFの状態が継続される。そして、点P18から点P19へ更に移行(下降)した際に、交差線分率は閾値TL1以下となり、これにより、図4のST106においてデスキューON(図8中デスキューON55を併せて参照)と判断された後、再び図8における「Non-Threshold Status」51に戻る。 Next, at time T4 to T5, the page is turned by the user as in the case of time T2 to T3. At this time, the crossing line segment gradually decreases from the point P17 at time T4 to the point P19 at time T5. Here, when the point P17 is shifted (lowered) from the point P17 to the point P18, the intersection line segment ratio is less than the threshold value TL2, but still exceeds the threshold value TL1, and the process proceeds to “Threshold2 Status” 54 in FIG. The OFF state is continued. When the point P18 further shifts (lowers) from the point P18, the intersection line segment ratio becomes equal to or less than the threshold value TL1, thereby determining that the deskew is ON (see also the deskew ON 55 in FIG. 8) in ST106 of FIG. Then, the process returns to “Non-Threshold Status” 51 in FIG.
次に、時間T5〜T6では、時間T1〜T2の場合と同様に、交差線分率が変動(図8中の変動幅D3参照)しており、点P23から点P24へ移行(上昇)した際に、交差線分率は閾値TL1を超えるが、依然として閾値TL2未満であり、図8における「Threshold1 Status」52に移行してデスキューONの状態が継続される。そして、その直後に点P24から点P25へ移行(下降)した際に、交差線分率は閾値TL1以下となり、再び図8における「Non-Threshold Status」51に戻る。 Next, at time T5 to T6, as in the case of time T1 to T2, the cross line segment ratio fluctuates (see fluctuation width D3 in FIG. 8), and shifts (rises) from point P23 to point P24. In this case, the intersection line segment ratio exceeds the threshold value TL1, but is still less than the threshold value TL2, and the process proceeds to “Threshold1 Status” 52 in FIG. 8 to continue the deskew ON state. Then, immediately after that, when the point P24 is shifted (lowered) from the point P24, the intersection line segment ratio becomes equal to or less than the threshold value TL1, and the processing returns to the “Non-Threshold Status” 51 in FIG. 8 again.
このように、上記デスキュー実施の可否判定(ST106)では、一連の撮像画像において、今回の撮影画像における交差線分率が閾値TL1よりも大きな前回の撮影画像の交差線分率から減少して閾値TL1を下回った場合、第2の動作モード(デスキューON)を第1の動作モード(デスキューOFF)に切り替える一方、今回の撮影画像における交差線分率が閾値TL2よりも小さな前回の撮影画像の交差線分率から増大して閾値TL2を通過した場合、第1の動作モードを第2の動作モードに切り替える。つまり、2つの閾値TL1、TL2によりヒステリシスを持たせて2つの動作モード(デスキューON/OFF)を切り替える構成としたため、撮影画像を順次傾き補正する際に、原稿が静止状態であるにも拘わらず何らかの不安定化要因により、直線成分の交差線分率が変動して不適当に動作モード(デスキューON、OFF)の切替えが実行されることを防止することができる。 As described above, in the determination of whether or not deskew can be performed (ST106), in a series of captured images, the crossing line segment ratio in the current captured image is decreased from the cross line segment ratio of the previous captured image larger than the threshold value TL1, and the threshold value is reached. When it falls below TL1, the second operation mode (deskew ON) is switched to the first operation mode (deskew OFF), while the intersection of the previous captured images in which the intersecting line segment ratio in the current captured image is smaller than the threshold value TL2 When increasing from the line segment ratio and passing the threshold TL2, the first operation mode is switched to the second operation mode. In other words, since the two thresholds TL1 and TL2 are provided with hysteresis to switch between the two operation modes (deskew ON / OFF), when the captured image is sequentially tilt corrected, the original is in a stationary state. It is possible to prevent the switching of the operation mode (deskew ON / OFF) from being improperly performed due to fluctuations in the intersection line segment of the linear component due to some destabilizing factor.
なお、ここでは2つの閾値TL1、TL2を用いたが、これに限らず、例えば、閾値TL2のみを用いて、交差線分率が閾値TL2未満の場合に第1の動作モードを実行する一方、交差線分率が閾値TL2以上の場合に第2の動作モードを実行する構成も可能である。 Here, the two threshold values TL1 and TL2 are used. However, the present invention is not limited to this. For example, the first operation mode is executed when only the threshold value TL2 is used and the intersection line segment ratio is less than the threshold value TL2. A configuration in which the second operation mode is executed when the intersection line segment ratio is equal to or greater than the threshold TL2 is also possible.
図9は図4中のデスキュー実施の可否判定(ST106)の詳細を示すフロー図である。まず、傾き補正角度設定部35は、初期状態として図8における「Non-Threshold Status」51とすると共にデスキューOFFに設定する(ST301)。続いて、ST105で交差線分率が取得されると(ST302:YES)、「Non-Threshold Status」であるか否かを判定する(ST303)。
FIG. 9 is a flowchart showing details of the deskew execution feasibility determination (ST106) in FIG. First, the inclination correction
そこで、「Non-Threshold Status」において閾値を通過すると(ST304:YES)、その通過した閾値がTL1の場合には(ST305:TL1)には図8における「Threshold1 Status」52にあると判断する(ST306)。一方、通過した閾値がTL2の場合(ST304:TL2)には図8における「Threshold2 Status」54にあると判断する(ST307)。その後は、再びST302に戻る。 Therefore, when the threshold value is passed in “Non-Threshold Status” (ST304: YES), when the passed threshold value is TL1 (ST305: TL1), it is determined that “Threshold1 Status” 52 in FIG. ST306). On the other hand, when the threshold value passed is TL2 (ST304: TL2), it is determined that it is in “Threshold2 Status” 54 in FIG. 8 (ST307). After that, it returns to ST302 again.
ST303において、「Non-Threshold Status」にない場合、続いて「Threshold1 Status」であるか否かを判定する(ST308)。そこで、「Threshold1 Status」において閾値を通過すると(ST309:YES)、その通過した閾値がTL1の場合には(ST310:TL1)には「Non-Threshold Status」にあると判断する(ST311)。一方、通過した閾値がTL2の場合(ST310:TL2)にはデスキューOFF(図8中符号53を参照)とした後(ST312)、「Non-Threshold Status」にあると判断する(ST311)。その後は、再びST302に戻る。
In ST303, when it is not in “Non-Threshold Status”, it is subsequently determined whether or not it is “Threshold1 Status” (ST308). Therefore, if the threshold value is passed in “Threshold1 Status” (ST309: YES), if the passed threshold value is TL1 (ST310: TL1), it is determined that “Non-Threshold Status” exists (ST311). On the other hand, if the threshold value passed is TL2 (ST310: TL2), after deskew is turned off (see
ST308において、「Threshold1 Status」にない場合、続いて「Threshold2 Status」であるか否かを判定する(ST313)。そこで、「Threshold2 Status」において閾値を通過すると(ST314:YES)、その通過した閾値がTL2の場合(ST315:TL2)には「Non-Threshold Status」にあると判断する(ST316)。一方、通過した閾値がTL1の場合には(ST315:TL1)にはデスキューON(図8中符号55を参照)とした後(ST316)、「Non-Threshold Status」にあると判断する(ST317)。その後は、再びST302に戻る。
If it is not in “Threshold1 Status” in ST308, it is subsequently determined whether it is “Threshold2 Status” (ST313). Therefore, if the threshold value is passed in “Threshold2 Status” (ST314: YES), if the passed threshold value is TL2 (ST315: TL2), it is determined that “Non-Threshold Status” exists (ST316). On the other hand, when the threshold value passed is TL1 (ST315: TL1), after deskew is turned on (see
図10は図4中の線分情報統計処理(ST107)の詳細を示すフロー図である。まず、傾き補正角度設定部35は、パラメータ記憶部38から画像処理の対象となる撮影画像についての線分情報を取得する(ST401)。この線分情報には、図6のST207における各線分の交差判定結果が含まれる。
FIG. 10 is a flowchart showing details of the line segment information statistical processing (ST107) in FIG. First, the inclination correction
次に、傾き補正角度設定部35は、各線分についての交差の有無を判定するために、線分情報における全ての線分から1つの線分(未判定の線分)を判定対象線分として抽出し(ST402)、その判定対象線分の交差線分フラグを参照して交差の有無を判定する(ST404)。なお、少なくとも線分情報統計処理の開始時には、比較が終了していない判定対象線分が存在するため、全線分の交差判定が終了したか否かの判定(ST403)ではNoと判定される。
Next, the inclination correction
次に、傾き補正角度設定部35は、判定対象線分について交差なし(交差線分フラグ=false)と判定した場合(ST404:NO)には、当該判定対象線分の座標データに基づきその傾斜角度θを算出し(ST405)、その算出結果をヒストグラム情報に追加(すなわち、統計的処理の対象として抽出)する(ST406)。つまり、横軸を傾斜角度θ、縦軸を度数として、θに対応する度数をカウントアップする。その後、当該判定対象線分をST402の抽出候補から除外し(ST407)、再びST402に戻る。
Next, when the inclination correction
一方、傾き補正角度設定部35は、判定対象線分について交差あり(交差線分フラグ=true)と判定した場合(ST404:YES)には、ST405およびST406を実行せずに(ヒストグラム情報に追加しない)当該判定対象線分をST402の抽出候補から除外し(ST407)、再びST402に戻る。
On the other hand, when the inclination correction
最終的に全ての判定対象線分の交差状態の判定が終了すると(ST403:Yes)、傾き補正角度設定部35は、ST406において追加されたヒストグラム情報に基づきヒストグラムを生成し、このヒストグラムの傾斜角度分布における最大度数を検索する(ST408)。そして、傾き補正角度設定部35は、検索した最大度数の値(例えば、階級の間隔の中間値)を撮影画像の傾斜角度(つまり、傾き補正角度)として推定する(ST409)。
When the determination of the intersection state of all the determination target line segments is finished (ST403: Yes), the inclination correction
このように、ST407において判定対象である線分が他の線分と交差する場合には、当該判定対象である線分を統計的処理の対象から除外する構成としたため、統計的処理の対象からノイズ成分(すなわち、原稿の基準方向と一致しない不適切な線分)を効果的に除去することができ、その結果、撮影画像の傾斜角度を精度良く推定することが可能となる。また、各線分の交差の有無の判定についてはST105における交差線分率取得の処理結果を用いるため、処理を簡略化することができる。 In this way, when the line segment that is the determination target intersects with other line segments in ST407, the line segment that is the determination target is excluded from the statistical processing target. Noise components (that is, inappropriate line segments that do not match the reference direction of the document) can be effectively removed, and as a result, the tilt angle of the captured image can be accurately estimated. Further, the determination of the presence / absence of the intersection of each line segment can be simplified because the process result of the intersection line segment rate acquisition in ST105 is used.
本発明を特定の実施形態に基づいて説明したが、これらの実施形態はあくまでも例示であって、本発明はこれらの実施形態によって限定されるものではない。例えば、上記実施形態では、他の1つの線分と交差する線分を統計的処理の対象から除外する構成としたが、2以上の所定数の他の線分と交差する場合に除外する構成としてもよい。なお、上記実施形態に示した本発明に係る画像処理装置およびこれを備えた原稿読取システムの各構成要素は、必ずしも全てが必須ではなく、少なくとも本発明の範囲を逸脱しない限りにおいて適宜取捨選択することが可能である。 Although the present invention has been described based on specific embodiments, these embodiments are merely examples, and the present invention is not limited to these embodiments. For example, in the above-described embodiment, the line segment that intersects with another line segment is excluded from the target of statistical processing, but is excluded when the line segment intersects with a predetermined number of other line segments of 2 or more. It is good. Note that not all of the components of the image processing apparatus according to the present invention and the document reading system including the image processing apparatus according to the present invention shown in the above-described embodiments are necessarily selected as long as they do not depart from the scope of the present invention. It is possible.
本発明に係る画像処理装置およびこれを備えた原稿読取システムは、簡易な構成により、撮影画像から有効な直線成分の検出が難しい場合に不適当な傾き補正が実行されることを防止可能とし、書籍などの原稿を読み取って得られた画像を処理する画像処理装置およびこれを備えた原稿読取システムなどとして有用である。 The image processing apparatus according to the present invention and the document reading system including the image processing apparatus can prevent an inappropriate inclination correction from being performed when it is difficult to detect an effective linear component from a captured image with a simple configuration. The present invention is useful as an image processing apparatus that processes an image obtained by reading a document such as a book, and a document reading system including the image processing apparatus.
1 原稿読取システム
2 書画カメラ(画像入力装置)
3 PC(画像処理装置)
26 表示部
27 表示データ生成部
28 データ格納部
30 画像傾斜補正部
32 エッジ抽出部
33 線分抽出部(直線抽出部)
34 交差線分率算出部
35 傾き補正角度設定部(傾斜角度推定部)
36 画像回転部
41 撮影画像
B 書籍(原稿)
1
3 PC (image processing device)
26
34 Crossing line
36
Claims (4)
前記エッジ画素に基づき複数の直線成分を抽出する直線抽出部と、
前記直線成分の交差状態を判定することにより、前記複数の直線成分のうち相互に交差する直線成分の割合である交差線分率を算出する交差線分率算出部と、
前記複数の直線成分の傾斜角度について統計的処理を行うことによって前記撮影画像の傾斜角度を推定する傾斜角度推定部と、
前記傾斜角度推定部が推定した前記傾斜角度に基づき、前記撮影画像を回転させることにより当該撮影画像の傾き補正を行う画像回転部と
を備え、
前記画像回転部が前記傾き補正を行う第1の動作モードと、前記画像回転部が前記傾き補正を行わない第2の動作モードとを有し、前記交差線分率が所定の閾値以上の場合、前記第2の動作モードを実行することを特徴とする画像処理装置。 An edge extraction unit that extracts a plurality of edge pixels in a photographed image obtained by sequentially photographing the paper surface of the document;
A line extraction unit that extracts a plurality of line components based on the edge pixels;
By determining the crossing state of the straight line components, a cross line segment calculating unit that calculates a cross line segment ratio that is a ratio of straight line components crossing each other among the plurality of straight line components;
A tilt angle estimating unit that estimates the tilt angle of the captured image by performing statistical processing on the tilt angles of the plurality of linear components;
An image rotation unit that performs tilt correction of the captured image by rotating the captured image based on the tilt angle estimated by the tilt angle estimation unit;
The image rotation unit has a first operation mode in which the tilt correction is performed and the image rotation unit has a second operation mode in which the tilt correction is not performed, and the intersection line segment ratio is equal to or greater than a predetermined threshold value An image processing apparatus that executes the second operation mode.
一連の前記撮像画像において、今回の撮影画像における前記交差線分率が前記第1の値よりも大きな前回の撮影画像の前記交差線分率から減少して前記第1の値を下回った場合、前記第2の動作モードを前記第1の動作モードに切り替える一方、今回の撮影画像における前記交差線分率が前記第2の値よりも小さな前回の撮影画像の前記交差線分率から増大して前記第2の値を上回った場合、前記第1の動作モードを前記第2の動作モードに切り替えることを特徴とする請求項1に記載の画像処理装置。 The threshold is composed of a first value and a second value that is greater than the first value,
In a series of the captured images, when the intersecting line segment ratio in the current captured image decreases from the intersecting line segment ratio of the previous captured image larger than the first value and falls below the first value, While the second operation mode is switched to the first operation mode, the intersecting line segment ratio in the current photographed image is increased from the intersecting line segment ratio in the previous photographed image smaller than the second value. The image processing apparatus according to claim 1, wherein when the second value is exceeded, the first operation mode is switched to the second operation mode.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012107366A JP2013235418A (en) | 2012-05-09 | 2012-05-09 | Image processing device and manuscript reading system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012107366A JP2013235418A (en) | 2012-05-09 | 2012-05-09 | Image processing device and manuscript reading system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013235418A true JP2013235418A (en) | 2013-11-21 |
Family
ID=49761498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012107366A Pending JP2013235418A (en) | 2012-05-09 | 2012-05-09 | Image processing device and manuscript reading system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2013235418A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020144719A (en) * | 2019-03-08 | 2020-09-10 | 国立大学法人秋田大学 | Page space area classification device and program therefor |
-
2012
- 2012-05-09 JP JP2012107366A patent/JP2013235418A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020144719A (en) * | 2019-03-08 | 2020-09-10 | 国立大学法人秋田大学 | Page space area classification device and program therefor |
JP7243981B2 (en) | 2019-03-08 | 2023-03-22 | 国立大学法人秋田大学 | Paper area classification device and its program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6467787B2 (en) | Image processing system, imaging apparatus, image processing method, and program | |
JP4341629B2 (en) | Imaging apparatus, image processing method, and program | |
KR101180900B1 (en) | Imaging apparatus, processing method of the apparatus and program making computer execute the method | |
US20070183652A1 (en) | Method for detecting a code with the aid of a mobile station | |
JP7059054B2 (en) | Image processing equipment, image processing methods and programs | |
JP2010224987A (en) | Image processing apparatus, image processing method, program and recording medium | |
JP2019087945A (en) | Information processing apparatus, program, and information processing method | |
JP2019109624A (en) | Information processing apparatus, program, and information processing method | |
JP6564136B2 (en) | Image processing apparatus, image processing method, and program | |
JP2006211046A (en) | Photographing apparatus, image processing method for photographing apparatus, and program | |
WO2019196240A1 (en) | Photographing method, apparatus, computer device, and storage medium | |
JP4182937B2 (en) | Image capturing apparatus, image processing method for image capturing apparatus, and program | |
JP2005275447A (en) | Image processing device, image processing method and program | |
US10373329B2 (en) | Information processing apparatus, information processing method and storage medium for determining an image to be subjected to a character recognition processing | |
JP2013242826A (en) | Image processing device and document reading system including the same | |
US20210281742A1 (en) | Document detections from video images | |
JP2013218411A (en) | Image processing apparatus and document reading system provided with the same | |
JP2013235418A (en) | Image processing device and manuscript reading system | |
JP2005122609A (en) | Device for recognizing photographed object | |
JP2013225819A (en) | Image processing device and manuscript reading system having the same | |
TWI620147B (en) | Image synthesis method for synthesizing people | |
JP2013247531A (en) | Image processing apparatus and document reading system comprising the same | |
JP2013029996A (en) | Image processing device | |
JP5068883B1 (en) | Image processing apparatus and document reading system having the same | |
JP2013207525A (en) | Image processing device, and document reading system having the same |