JP2013242826A - 画像処理装置およびこれを備えた原稿読取システム - Google Patents

画像処理装置およびこれを備えた原稿読取システム Download PDF

Info

Publication number
JP2013242826A
JP2013242826A JP2012117131A JP2012117131A JP2013242826A JP 2013242826 A JP2013242826 A JP 2013242826A JP 2012117131 A JP2012117131 A JP 2012117131A JP 2012117131 A JP2012117131 A JP 2012117131A JP 2013242826 A JP2013242826 A JP 2013242826A
Authority
JP
Japan
Prior art keywords
point
line segment
document
candidate
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012117131A
Other languages
English (en)
Inventor
Fumio Nakamura
文夫 中村
Yae Wakahara
八重 若原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2012117131A priority Critical patent/JP2013242826A/ja
Publication of JP2013242826A publication Critical patent/JP2013242826A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Editing Of Facsimile Originals (AREA)
  • Image Analysis (AREA)

Abstract

【課題】書画カメラ等で読み取られた製本された原稿の画像において、上下の外形輪郭全体を精度良く検出する。
【解決手段】書画カメラ2は、撮影画像からエッジ画素を抽出するエッジ抽出部32と、原稿の外形輪郭の角点およびのど点を検出する角点・のど点検出部33と、角点とのど点と間の検索領域Rsにおいて、原稿の外形輪郭を構成する線分抽出する線分抽出部34とを備え、線分抽出部は、角点とのど点とを通る直線の方向を基準方向とし、外形画素の候補を端点とする線分の候補の基準方向に対する角度が所定の許容角度範囲に収まるか否かにより、当該外形画素の候補の有効性を判定し、線分の候補において、角点側の端点を基点とした半直線が基準方向に対して原稿の内側に向かう場合において、中心領域Rs1に対する許容角度範囲がページ中央領域Rs2よりも大きくなるように設定された構成とする。
【選択図】図2

Description

本発明は、書籍などの原稿を読み取って得られた画像を処理する画像処理装置およびこれを備えた原稿読取システムに関する。
書籍のページを自然に開いた状態で上方から撮影してページの画像を読み取ることができる書画カメラ(ブックスキャナ)が普及している(特許文献1参照)。このような書画カメラを用いると、ページをめくりながらページの画像を次々に読み取ることができるため、書籍を電子化する作業を効率良く行うことができる。
特開2001−103240号公報
ところで、この種の画像処理装置においては、製本された原稿の外形輪郭の情報は、撮影画像における原稿領域の認識や種々の画像処理(例えば、平面化処理)の際に重要となる。しかしながら、製本された原稿の上下の外形輪郭は、左右の外形輪郭に比べて湾曲の度合いが高いため、精度良く検出することが難しいという問題があった。
本発明は、このような従来技術の課題を鑑みて案出されたものであり、製本された原稿における上下の外形輪郭(すなわち、原稿の綴じ中心線に略直交する方向に延在する外形輪郭)全体を精度良く検出することを可能とした画像処理装置およびこれを備えた原稿読取システムを提供することを主目的とする。
本発明の画像処理装置は、製本された原稿の左右の紙面を撮影した撮影画像における複数のエッジ画素を抽出してエッジ画像を取得するエッジ抽出部と、前記エッジ画像において、前記原稿の外形における少なくとも1つの角点を検出する角点検出部と、前記エッジ画像において、前記原稿の綴じ中心線における少なくとも一方の端点であるのど点を検出するのど点検出部と、前記角点と前記のど点との間の検索領域において、前記複数のエッジ画素のうち前記原稿の外形輪郭を画定する外形画素を順次検索し、これら検索された外形画素から構成される線分を抽出する線分抽出部とを備え、前記検索領域は、前記のど点側に位置する第1領域と、この第1領域よりも前記角点側に位置する第2領域とを含み、前記線分抽出部は、前記角点と前記のど点とを通る直線の方向を基準方向とし、前記外形画素の候補を端点とする前記線分の候補の前記基準方向に対する角度が所定の許容角度範囲に収まるか否かにより、当該外形画素の候補の有効性を判定し、前記線分の候補において、前記角点側の端点を基点とした半直線が前記基準方向に対して前記原稿の内側に向かう場合において、前記第1領域に対する前記許容角度範囲が前記第2領域よりも大きくなるように設定されたことを特徴とする。
このように本発明によれば、製本された原稿における上下の外形輪郭全体を精度良く検出することが可能となるという優れた効果を奏する。
実施形態に係る原稿読取システム1を示す全体構成図 図1中の書画カメラ2およびPC3の概略構成を示すブロック図 図1中の原稿読取システム1による原稿読取手順の要部を示すフロー図 図3中の画像入力(ST101)により取得された撮影画像の一例を示す模式図 図3中の角点検出(ST103)およびのど点検出(ST104)の結果を示す模式図 図3中の線分抽出(ST105)の詳細を示すフロー図 図6中の頂点判定(ST204)の処理の概要を示す説明図 図6中の線分のエッジの有効性判定(ST205)の詳細を示すフロー図 図8に示すエッジの有効性判定における外形画素の検索領域を示す説明図 図8中の直線の角度θbの算出(ST302)の処理における基準方向とのなす角度についての説明図
上記課題を解決するためになされた第1の発明に係る画像処理装置は、製本された原稿の左右の紙面を撮影した撮影画像における複数のエッジ画素を抽出してエッジ画像を取得するエッジ抽出部と、前記エッジ画像において、前記原稿の外形における少なくとも1つの角点を検出する角点検出部と、前記エッジ画像において、前記原稿の綴じ中心線における少なくとも一方の端点であるのど点を検出するのど点検出部と、前記角点と前記のど点との間の検索領域において、前記複数のエッジ画素のうち前記原稿の外形輪郭を画定する外形画素を順次検索し、これら検索された外形画素から構成される線分を抽出する線分抽出部とを備え、前記検索領域は、前記のど点側に位置する第1領域と、この第1領域よりも前記角点側に位置する第2領域とを含み、前記線分抽出部は、前記角点と前記のど点とを通る直線の方向を基準方向とし、前記外形画素の候補を端点とする前記線分の候補の前記基準方向に対する角度が所定の許容角度範囲に収まるか否かにより、当該外形画素の候補の有効性を判定し、前記線分の候補において、前記角点側の端点を基点とした半直線が前記基準方向に対して前記原稿の内側に向かう場合において、前記第1領域に対する前記許容角度範囲が前記第2領域よりも大きくなるように設定されたことを特徴とする。
これによると、製本された原稿における上下の外形輪郭を構成する線分を抽出する際に、角点とのど点とを通る直線の方向(基準方向)に対する角度によって外形画素の候補(線分の候補)の有効性を判定する構成とし、線分の候補の角点側の端点を基点とした半直線が基準方向に対して原稿の内側に向かう場合において、第1領域に対する許容角度範囲を第2領域よりも大きくなるように設定したため、原稿の内側に向かって湾曲の度合いが高くなるのど点付近の線分を安定的に抽出することが可能となり、その結果、上下の外形輪郭全体を精度良く検出することができる。
また、第2の発明は、前記第1の発明において、前記線分抽出部は、前記線分の候補における両端点の前記原稿の上下方向の距離が所定の許容距離範囲内にない場合、前記外形画素の候補を無効と判定する構成とする。
これによると、外形画素の候補(線分の候補)の有効性をより適切に判定することが可能となり、上下の外形輪郭全体をより精度良く検出することができる。
また、第3の発明は、前記第2の発明において、前記線分の候補において、前記角点側の端点を基点とした半直線が前記基準方向に対して前記原稿の内側に向かう場合において、前記許容距離範囲は、前記第1領域において前記第2領域よりも大きく設定された構成とする。
これによると、原稿の内側に向かって湾曲の度合いが高くなる(上下方向における線分の候補の両端点の距離が大きくなる)のど点付近について、外形画素の候補(線分の候補)をより安定的に抽出することが可能となる。
また、第4の発明は、前記第1から第3の発明のいずれかにおいて、前記線分抽出部は、新たに検索された前記外形画素の候補を無効と判定した場合、既に有効と判定されている複数の外形画素の候補に基づき前記線分を抽出する構成とする。
これによると、同様の抽出処理の繰り返しにより、外形輪郭を画定する複数の有効な線分を容易に取得することができる。
また、第5の発明は、前記第1から第4の発明のいずれかに係る画像処理装置と、前記撮影画像を生成するカメラ部を備えた画像入力装置とを備えた原稿読取システムである。
以下、本発明の実施の形態について図面を参照しながら説明する。
図1は本発明に係る原稿読取システム1を示す全体構成図である。この原稿読取システム1は、書籍(原稿)Bの紙面の画像を読み取って、紙面の画像データを取得するものであり、紙面を撮影して映像信号に変換する書画カメラ(画像入力装置)2と、この書画カメラ2と通信可能に接続されたPC3とから構成される。
書画カメラ2は、撮影機能を有するカメラ部4と、このカメラ部4を保持するスタンド部5とを備えている。カメラ部4は、CCDやCMOS等からなるイメージセンサと、LEDや蛍光ランプ等からなる照明用光源(共に図示せず)とを内蔵する。スタンド部5は、机上面などの載置面6に載置される略V字状に開いた脚7と、この脚7に支持されたアーム8とを有している。脚7の上面には、書籍Bの撮影位置を規定するための一対のガイド部材9が突設されている。アーム8は、脚7から斜め上方に伸縮自在に設けられる一方、ヒンジ部8aによってカメラ部4を回動可能に保持しており、これにより、カメラ部4の画角や光軸方向(撮影方向)を調整可能となっている。また、カメラ部4は、画角や倍率を連続的に可変させる公知のズーム機能を有している。
PC3は、書画カメラ2の各種動作条件をユーザが設定したり、書画カメラ2で撮像した撮影画像をユーザが確認したりするための入出力装置として機能すると共に、撮影画像の画像処理や記録等を行う画像処理装置としても機能する。
なお、原稿読取システム1において書画カメラ2と共に用いられる装置としては、PC(Personal Computer)に限らず同様の機能を実現可能な任意の情報処理装置を用いることができる。また、PC3の機能の一部を書画カメラ2に付加することや、PC3と書画カメラ2とを一体的に構成することも可能である。さらに、書画カメラ2とPC3は直接的に接続されている必要はなく、例えば図示しないネットワークを介して接続されていてもよい。このように構成した場合、書画カメラ2が撮像のためのトリガ信号を発生させ(具体的には、例えばイメージキャプチャを指示するスイッチやボタン)、遠隔のPC3(例えば、サーバ)に対してプッシュ型のデータ伝送をすることになる。
書画カメラ2による撮影では、ユーザがカメラ部4の真下(光軸方向)の載置面6上に書籍Bを開いた状態で載置することにより、書籍Bの見開き2ページと書籍Bの周囲の載置面6の一部を含む撮影画像(動画または静止画)が得られる。このときユーザは、指で左右のページの浮き上がりを押さえると共に、書籍Bの上縁を左右方向に延びるガイド部材9に突き当てて前後方向位置および傾きを調節することにより、書籍Bを読取位置に精度良くセットすることが可能である。撮影画像は、PC3に適宜送信され、そこで必要な画像処理がなされた後、所定の記録媒体に保存されると共にユーザに対してディスプレイ表示される。
なお、原稿読取システム1が読み取る原稿は、書籍に限らず、文字、図面、写真その他これに類する情報を含む任意の情報伝達媒体とすることができる。更に、この情報伝達媒体はポジフィルム、ネガフィルム等の透過原稿であってもよく、この場合は、例えば透明な導光板の側面に光源を配置した光源ユニットにより背面から光を照射し、透過光を撮像するように構成すればよい。
図2は、図1中の書画カメラ2およびPC3の概略構成を示すブロック図である。
書画カメラ2は、カメラ部4を備えた撮像処理部11と、ユーザが設定した動作条件に基づいて撮像処理部11に所要の動作を行わせる操作指示部12と、PC3との接続のためのUSB規格等に準拠する外部インタフェイス13とを有している。
PC3は、書画カメラ2との接続のためのUSB規格等に準拠する外部インタフェイス21と、書画カメラ2からの撮影画像データが入力される画像データ入力部22と、撮影画像の記録や表示に際して必要な画像処理を行う画像処理部23と、キーボード等からなる入力操作部24においてユーザが設定した動作条件を書画カメラ2に対して送信する操作系制御部25と、画像処理後の撮影画像をLCDやプロジェクタ等からなる表示部26に表示するためのデータを生成する表示データ生成部27と、画像処理後の撮影画像データを保存するデータ格納部28とを有している。画像処理部23は、撮影画像データの画像処理の際に書籍Bの外形輪郭を検出する外形輪郭検出部31を有している。外形輪郭検出部31によって処理される撮影画像データは画像データ記憶部37から読み出され、また、後述する外形輪郭検出部31での処理に用いられる各種パラメータの情報はパラメータ記憶部38から読み出される。
PC3における画像データ入力部22、画像処理部23、操作系制御部25および表示データ生成部27等における処理機能は、画像処理アプリケーションなどのプログラムをCPUで実行するソフトウェア処理によって実現することができる。或いは、PC3を画像処理装置と解釈して、特定の処理を高速に実行するハードウェアを備える構成としてもよい。画像データ記憶部37およびパラメータ記憶部38は汎用のメモリからなる。
PC3において、画像データ入力部22は、書画カメラ2から送信される撮影画像データを画像処理部23の画像データ記憶部37に順次格納し、必要に応じてその撮影画像データを外形輪郭検出部31に順次出力する。そして、外形輪郭検出部31によって検出された外形輪郭に関するデータは、画像処理部23が実行する周知の画像処理(例えば、平面化処理)に必要な情報となる。所定の画像処理がなされた撮影画像データは、データ格納部28に格納されると共に、表示データ生成部27に送られて表示部26に表示される。
外形輪郭検出部31は、撮影画像について複数のエッジ画素を抽出して二値化したエッジ画像を取得するエッジ抽出部32と、製本された(背の部分が綴じられた)書籍Bの4つの角点(以下、単に「角点」と記した場合には書籍Bの角点(一般には、背表紙についての角点をいう)を示すものとする。)および書籍Bの左右のページの境界線をなす綴じ中心線の上下の端点(以下、のど点という。)を検出する角点・のど点検出部33と、角点とのど点との間に設定された検索領域において、複数のエッジ画素のうち原稿の上下の外形輪郭39Lt、39Rt、39Lb、39Rb(後述する図4参照。総称する場合には外形輪郭39という。)を画定するエッジ画素(以下、外形画素という。)を順次検索し、これら検索された外形画素から構成される線分を抽出する線分抽出部34と、抽出された線分で構成された外形輪郭39における欠落部分に対して線分補間を行う線分補間部35とを有している。
なお、説明は省略するが、線分補間された外形輪郭39は、原稿画像の平面化処理等に用いられる。また、書籍Bの左右の外形輪郭については、エッジ画像から周知の方法により直線成分を抽出することで取得することが可能である。また、エッジ画像については、二値化は必ずしも必要ではなく、少なくとも後述するエッジトレース処理が可能であればよい。
また、PC3において、ユーザは入力操作部24を操作することにより、書画カメラ2で撮影される画像の解像度、フレームレート、シャッタスピード、照明用光源の発光量などの動作条件を適宜入力することができる。この動作条件は、操作系制御部25から書画カメラ2に対して制御信号として送信され、書画カメラ2では、PC3からの制御信号に基づき操作指示部12が送出した処理命令にしたがって撮像処理部11が撮影動作を実行する。
図3は図1の原稿読取システム1による原稿読取手順の要部を示すフロー図であり、図4は図3中の画像入力(ST101)により取得された撮影画像の一例を示す模式図であり、図5は図3中の角点検出(ST103)およびのど点検出(ST104)の結果を示す模式図である。
まず、ユーザは、読取位置(書画カメラ2の撮影可能位置)に書籍Bを見開き状態でセットし、書画カメラ2を起動させると共に、PC3にて所要のアプリケーションを起動させる。その後、書画カメラ2による撮像が開始され、PC3の画像データ入力部22において書画カメラ2からの画像の入力が検出される(ST101)。この撮影画像の入力は、所定のフレームレートで実施され、各撮影画像に対して以下で示すような処理が順次実行される。
ここで、撮影画像は、例えば図4(A)、(B)に示すように、書画カメラ2の矩形の撮影エリア40により画定され、この撮影エリア40内には書籍Bの画像とその背景となる載置面6の画像とが含まれる。中央の綴じ中心線42によって仕切られた左右の紙面(見開き)41L、41Rには、ここでは図示しないが、文字や記号等が表示される文章領域や、図面や写真等が表示される図形枠等がそれぞれ含まれている。
書籍Bのような製本された原稿を読み取る場合、図4(A)に示すように、書籍Bを自然に開いたままの状態では、ページが浮き上がるなどして読み取られた画像にずれや歪みが生じ得る。そこで、ユーザは、図4(B)に示すように、手指F1、F2により紙面41L、41Rの外周縁部を押さえてページの反りを解消することができる。なお、書籍Bを押さえてページの浮き上がりを防止する手段としては、手指に限らず、例えば書画カメラ2に設けられた押さえ治具(図示せず)等でもよい。
再び図3を参照して、PC3では、書画カメラ2から受信した撮影画像データを画像データ入力部22が画像データ記憶部37に格納した後、エッジ抽出部32は、撮影画像において輝度が急激に変化する部位を二値化したエッジ画素として抽出することによりエッジ画像を取得する(ST102)。このエッジ抽出処理は、キャニー(Canny)法等の周知の方法を用いて行うことができる。
次に、角点・のど点検出部33は、略矩形をなす書籍Bの外形における4つの角点C1〜C4(図5参照)を検出する(ST103)。ここで検出される角点は、通常は紙面41L、41Rよりもややサイズの大きい表紙の四隅となる。角点検出では、例えば撮影エリア40の四方から対角線上に角点の候補(エッジ画素)を検索し、検索された複数の角点の候補の列から構成される直線成分(直角に近い状態で2方向に分かれるように現れる)の交点として角点を設定することができる。つまり、撮像エリア40の4隅のうち1点を含む直角三角形を規定し、この直角三角形を徐々に大きくしながら、その斜辺が書籍Bを横切る2点の軌跡(通常2つのラインとなる)を抽出する。そして、この2つのラインの交点を角点としている。この手法を用いることで、矩形である撮像エリア40に対して書籍Bが平行シフト、又は若干回転して配置されていたとしても、角点を容易に検出できる(ただし、書籍Bの一辺が上述した三角形の斜辺と水平になる程度まで回転している場合は、角点を検出できない)。更に図4(A)のように書籍Bの上下の外形輪郭が歪んでいても、角点近傍は比較的直線性が良好であるため、角点の検出が可能である。
さらに、角点・のど点検出部33は、検出した角点C1〜C4の情報に基づき、書籍Bの2つののど点D1、D2(図5参照)を検出する(ST104)。のど点検出では、例えば確率的ハフ変換等を用いてエッジ画像における縦方向の直線を複数検出した後、上側の左右の角点C3、C4の中間位置と下側の左右の角点C1、C2の中間位置の座標との比較から綴じ中心線から検出された直線を選択し、この直線の上下端の位置(外形輪郭の上辺、下辺との交点)をのど点D1、D2として設定することができる。この場合、予めのど点候補とその周辺のエッジ画素との形状(接続関係)を想定した複数の画像パターンを準備しておき、直線およびその周辺画素をそれらの画素パターンと比較することにより、のど点の検出が容易となる。また、角点C1とC3を結ぶ線分と、同C2とC4を結ぶ線分の交点をD3(図示せず)として、D1,D2,D3のいずれか2点を通る直線群が含まれる範囲を綴じ中心線の存在範囲とみなして、当該範囲又は当該範囲を若干広げた探索範囲を規定し、当該探索範囲に対してパラメータを変更したハフ変換を繰り返す等して綴じ中心線を抽出するようにしてもよい。
なお、ST103、ST104における角点およびのど点の検出は、任意の周知の方法を用いて実行することが可能である。
次に、線分抽出部34は、後に詳述するように、外形画素を順次検索し、それら外形画素から構成される線分を抽出する(ST105)。この線分抽出の処理では、1つの角点と、1つののど点との間の検索領域において、所定の条件に基づき無効な外形画素を排除しながらエッジトレース処理を行うことにより有効な外形画素から構成される複数の有効な線分を抽出する。ここで抽出された各線分に関する端点の座標値等のデータは、パラメータ記憶部38に格納される。なお、エッジトレース処理におけるエッジ画素の探索方法については周知の方法を用いることができる。
次に、線分補間部35は、抽出された複数の線分で構成された上下の外形輪郭39について、欠落部分(線分同士の端点が接続していない領域)が存在する場合には、この欠落部分に対して線分補間を行う(ST106)。この線分補間処理では、線形補間により端点間を直線で結ぶことにより、外形輪郭を補完することができるが、これに限らず、例えば高次のスプライン補間を実施して端点間を曲線で結んでもよい。なお、線分補間部35は、線分抽出部34によって抽出された線分によって形成した外形輪郭の形状を判定(例えば、予め準備した複数の形状パターンとマッチング)し、形状が適切でないと判定した場合には、該当線分について排除することが可能である。その場合、排除された線分の領域については、再度補間処理を実施する。
図6は図3中の線分抽出(ST105)の詳細を示すフロー図であり、図7は図6中の頂点判定(ST204)の処理の概要を示す説明図である。
図6に示すように、まず線分抽出部34は、エッジ画像における1つの角点と1つののど点との間の検索領域において検索開始点を決定する(ST201)。検索開始点としては、検索領域において抽出した任意のエッジ画素(角点やのど点を含む)を用いることができるが、ここでは、のど点から書籍の角点に向けてX方向に所定の距離だけ移動した位置で抽出されたエッジ画素を検索開始点とする。
次に、線分抽出部34は、検索開始点から角点およびのど点に向けてそれぞれエッジトレース処理を開始する(ST202)。以降、説明を簡単にするために、検索開始点から角点の方向にエッジトレースを実行する過程を中心に説明するが、逆方向のトレース、即ちのど点に向けてエッジトレースを実行する場合は、後述する頂点判定が含まれない点を除き、技術的本質は変わらない。
エッジトレース処理では、線分抽出部34は、外形画素の候補となる点を検索し(ST203)、続いて、その検索した点が頂点(ページの角点を形成する点)であるか否かを判定する(ST204)。なお、「ページの角点」とは、いわゆる版面を有するページの角点のうち、見開きページの角点(即ち、ユーザが目視しているページの角点)を意味する。
この頂点判定では、例えば図7に示すように、線分抽出部34は、既に検索した外形画素(または外形画素の候補)に基づく隣接する3つの点(ここでは、図7中の端点1〜3)を端点とする線分同士のなす角度(ここでは、図7中の端点1および端点2を結ぶ線分と、端点2および端点3を結ぶ線分とのなす角度θa)を順次算出する。そして、算出された複数の角度θaにおいて極小値に相当する点(端点2)を頂点と推定する。図7では、2つの基点BP1、BP2が極小値をとる例を示しており、これらを頂点と推定する。また、複数の頂点が推定された場合、より内側(のど部側)に位置する頂点(図7では、基点BP1)をページの角点と推定することができる。
なお、検索開始点から角点に向けてエッジトレースを行った場合に、複数の基点BP1、BP2・・・が現れる場合とは、典型的には比較的厚手の書籍を開いたときに、角点の近傍で複数のページが少しずつずれて重なっているような状況が該当する。そして、このような基点が書籍の角点の内側である限り、(特にぶ厚い書籍等では)多数の基点が抽出されることになるが、上述のようにページの角点としては、最ものど部側に位置する頂点が抽出されることになる。
再び図6を参照して、次に、線分抽出部34は、ST203において新たに検索した外形画素の候補を端点とする線分の候補について所定の条件に基づきエッジとしての有効性(エッジらしいか否か)を判定する(ST205)。この線分の候補は、ST205の判定において先に有効である(エッジらしい)と判定された外形画素(または検索開始点)と、その後、新たに検索した外形画素の候補とを両端点とする線分である。詳細は後述するが、エッジの有効性は、線分の候補が所定の基準方向(のど点と書籍の角点とを結ぶ直線の方向)となす角度が所定の許容角度範囲内にあるか否か、また、Y方向(書籍Bの上下方向)における線分の候補の両端点の距離(Y座標の差分)が所定の許容距離範囲内にあるか否かによって判定される。このエッジの有効性の判定により、新たに検索された外形画素の候補の有効性が判定される。
上記ST203〜ST205は、最終的に検索範囲を終了した(すなわち、検索により角点またはのど点(これまでの説明においては、角点)まで到達した)と判定されるか、または、ST205において外形画素の候補が無効である(エッジらしくない)と判定される(ST206)まで繰り返し実行される。
エッジトレース処理のループ(ST202〜ST206)が終了すると、線分抽出部34はその終了条件を判定する。終了条件について、最後に検索された外形画素の候補が無効であることによる場合(ST207:YES)、更に、線分抽出部34は、ST204の頂点判定の結果に基づき、最後に有効であると判定された外形画素がページの角点より内側(のど点側)か否かを判定する(ST208)。そこで、最後に検索された外形画素がページの角点より内側にある場合(YES)には、切出すべき外形輪郭が残存していると判断し、線分抽出部34は、検索した一連の外形画素(ST205で無効と判定されたものを除く)から構成される線分を切り出し(ST209)、その後、再びST201に戻って切り出した線分の周辺領域から次の検索開始点を決定し、上記と同様の処理を実行する。
一方、終了条件について、検索範囲が終了したことによる場合(ST207:NO)、或いは、最後に検索された外形画素がページの角点より内側にない場合(ST208:NO)には、線分抽出部34は、ST209と同様に線分を切り出し(ST210)、一連の処置が終了する。なお、本実施形態では、上下の外形輪郭におけるページ角点の外側(書籍の角点まで)の未検索の領域については、上記ST205のようなエッジらしさの判定を行わずに、上記ST203と同様に検索した外形画素を全て有効とし、それら外形画素から構成される線分を抽出する。
図8は図6中の線分のエッジの有効性判定(ST205)の詳細を示すフロー図であり、図9は図8に示すエッジの有効性判定における外形画素の検索領域を示す説明図であり、図10は図8中の直線の角度θbの算出(ST302)の処理における基準方向とのなす角度についての説明図である。以下では、図9に示す書籍Bの右下の外形輪郭39Rb(外形輪郭の形状については、図4(A)を参照。以下同じ)を対象として説明するが、他の外形輪郭についても同様に処理することができる。即ち、書籍Bの右上の外形輪郭39Rfを処理対象とする場合は図9をX軸について線対称に反転(つまり上下反転)した状態、同左下の外形輪郭39Lbを処理対象とする場合は図9をY軸について線対称に反転(左右対称)した状態、同左上の外形輪郭39Lfを処理対象とする場合は図9をX,Y軸について線対称(上下反転した後に左右反転)した状態を想定すればよい。
図8に示すように、線分抽出部34は、判定対象となる2点(線分の候補の両端点)の座標の情報を取得する(ST301)。これら2点は、既に有効であると判定された点P1(または検索開始点)と、図6中のST203において新たに外形画素の候補として検索された点P2とからなる。これら点P1及び点P2については、以下のST302〜ST306において、角度を用いた有効性の判定がなされ、更に、ST307〜ST309において互いのY座標の位置を用いた有効性の判定がなされる。
次に、線分抽出部34は、のど点D1と角点C1とを結ぶ直線Lsの方向を基準方向とし、点P1及び点P2を結ぶ直線がその基準方向に対してなす角度θbを算出する(ST302)。後述するように、この角度θbが予め設定した許容角度範囲に収まることが、点P2(外形画素の候補)が有効であることの判定条件の1つとなる。
ここで、図9に示すように、外形画素の検索領域Rsは、のど点D1と角点C1の間に帯状に延びる平行四辺形の領域として設定される。のど点D1および角点C1は、平行四辺形においてY方向に延びる一対の対辺上に位置する。検索領域Rsは、直線Lsの下側(書籍Bの外側)の領域が上側(書籍Bの内側)の領域よりも広くなるように設定されている。また、検索領域Rsは、X方向に並ぶ3つの領域に分割されており、のど点D1側に位置する中心領域Rs1と、ページ中央に位置するページ中央領域Rs2と、角点C1側に位置する外部領域Rs3とを有している。より詳細には、中心領域Rs1は、のど点D1からこののど点D1と角点C1との間の距離の10%の位置まで広がる。また、ページ中央領域Rs2は、中心領域Rs1の外側に連なり、X方向においてページの角点の位置まで広がる。さらに、外部領域Rs3は、ページ中央領域Rs2の外側に連なり、ページの角点から書籍の角点まで広がる。
また、ST302で算出される角度θbについては、図10(A)に示すように、角点側の点(ここでは、点P1)を基点としてのど点側の点(ここでは、点P2)を通る半直線Liが線Eで示す基準方向に対して書籍Bの内側(原稿の内側)に向かう場合に「内側の角度」とする。一方、図10(B)に示すように、角点側の点(ここでは、点P1)を基点としてのど点側の点(ここでは、点P2)を通る半直線Liが線Eで示す基準方向に対して書籍Bの外側(原稿の外側)に向かう場合に「外側の角度」とする。ここでは、基準方向を0°とし、内側の角度を0°〜180°とし、外側の角度を0°〜180°とする。角度θbに対する許容角度範囲は、内側の角度および外側の角度のそれぞれに対して設定された内側閾値(角度)および外側閾値(角度)によって定められる。
なお、内側閾値(角度)および外側閾値(角度)としては、検索領域Rsを構成する各領域Rs1〜Rs3のそれぞれに対して異なる値を設定することができる。ここでは、外側閾値(角度)は全ての領域Rs1〜Rs3に対して同じ値(例えば、22°)が設定されている。一方、内側閾値(角度)は、ページ中央領域Rs2および外部領域Rs3に対して同じ値が設定され(例えば、22°)、中心領域Rs1に対しては少なくともページ中央領域Rs2よりも大きな値(例えば、75°)が設定される。ここでは、内側閾値(角度)および外側閾値(角度)を個別に設定したが、場合によっては同一の値を用いることも可能である。
また、後述するY座標の位置を用いた有効性の判定においては、点P1及び点P2の各々について、互いのY方向の距離(Y座標の差分)が所定の許容距離範囲に収まるか否かの判定がなされる。ここで、図10(A)に示すように、角度θbが内側の角度となる場合、Y方向の距離は「内側の距離」とする。また、図10(B)に示すように、角度θbが外側の角度となる場合、Y方向の距離は「外側の距離」とする。許容距離範囲は、内側の距離および外側の距離のそれぞれに対して設定された内側閾値(距離)および外側閾値(距離)によって定められる。これらの閾値は、原稿の種類やサイズ(外形、厚さ)等によって適切な値を設定するとよい。
なお、内側閾値(距離)および外側閾値(距離)としては、上述の角度の場合と同様に検索領域Rsを構成する各領域Rs1〜Rs3のそれぞれに対して異なる値を設定することができる。ここでは、外側閾値(距離)は全ての領域Rs1〜Rs3に対して同じ値が設定されている。一方、内側閾値(距離)は、ページ中央領域Rs2および外部領域Rs3に対して同じ値が設定され、中心領域Rs1に対しては少なくともページ中央領域Rs2よりも大きな値が設定される。ここでは、内側閾値(距離)および外側閾値(距離)を個別に設定したが、場合によっては同一の値を用いることも可能である。
再び図8を参照して、次に、線分抽出部34は、点P1及び点P2の位置が共に中心領域Rs1内にあるか否かを判定し(ST303)、中心領域Rs1内にある場合(YES)、内側閾値(角度)として中心領域Rs1用の大きな値を設定する(ST304)。一方、点P1及び点P2の少なくとも一方の点の位置が中心領域Rs1内にない場合(ST303:NO)、内側閾値(角度)としてページ中央領域Rs2または外部領域Rs3用の小さな値が設定される。
次に、線分抽出部34は、角度θbが外側の角度の場合、角度θbが外側閾値未満であるか否かを判定し(ST305)、外側閾値未満である場合(角度θbが内側の角度である場合を含む)(YES)には、更に、角度θbが内側閾値未満であるか否かを判定する(ST306)。そこで、内側閾値未満である場合(角度θbが外側の角度である場合を含む)(YES)には、ST303と同様に点P1及び点P2の位置が共に中心領域Rs1内にあるか否かを判定する(ST307)。
ST307において、点P1及び点P2の位置が共に中心領域Rs1内にある場合(YES)、内側閾値(距離)として中心領域Rs1用の大きな値を設定する(ST308)。一方、点P1及び点P2の少なくとも一方の点の位置が中心領域Rs1内にない場合(ST307:NO)、内側閾値(距離)としてページ中央領域Rs2または外部領域Rs3用の小さな値が設定される。
次に、線分抽出部34は、点P1及び点P2のY方向(綴じ中心線42方向)の距離が許容距離範囲内であるか否かを判定し(ST309)、許容距離範囲内である場合(YES)には、点P2について有効(エッジらしい)と判定する(ST310)。なお、ここでは説明を省略したが、ST309では、上述の角度の場合と同様に、内側の距離(内側閾値)および外側の距離(外側閾値)についてそれぞれ判定が行われる。
また、上記ST305において角度θbが外側閾値以上(許容角度範囲外)である場合(NO)、上記ST306において角度θbが内側閾値以上(許容角度範囲外)である場合(NO)、上記ST309において点P1及び点P2のY方向の距離が許容距離範囲内にない場合(NO)には、点P2について無効(エッジらしくない)と判定する(ST311)。
このように、原稿読取システム1では、書籍Bにおける上下の外形輪郭を構成する線分を抽出する際に、角点とのど点とを通る直線の方向(基準方向)に対する角度によって外形画素の候補(線分の候補)の有効性を判定する構成とし、線分の候補の角点側の端点を基点とした半直線が基準方向に対して書籍Bの内側に向かう場合において、中心領域Rs1に対する許容角度範囲を少なくともページ中央領域Rs2よりも大きくなるように設定したため、比較的湾曲の度合いが高くなるのど点付近の線分を安定的に抽出することが可能となり、その結果、上下の外形輪郭全体を精度良く検出することができる。図4(B)に示したように、ページの浮き上がりを防止するために手指等により紙面を押さえた場合には、のど点付近の外形輪郭の湾曲の度合いが顕著となるため特に有効である。
また、原稿読取システム1では、線分抽出部34は、線分の候補における両端点の原稿の上下方向の距離が所定の許容距離範囲内にない場合、外形画素の候補をエッジらしくない(無効)と判定する構成としたため、外形画素の候補(線分の候補)の有効性をより適切に判定することが可能となり、上下の外形輪郭全体をより精度良く検出することができる。
この場合、線分の候補において、角点側の端点を基点とした半直線が基準方向に対して書籍Bの内側に向かう場合において、内側閾値(距離)を、中心領域Rs1においてページ中央領域Rs2よりも大きく設定するとよい。これにより、比較的湾曲の度合いが高くなるのど点付近の外形画素の候補(線分の候補の端点)をより安定的に抽出することが可能となる。
本発明を特定の実施形態に基づいて説明したが、これらの実施形態はあくまでも例示であって、本発明はこれらの実施形態によって限定されるものではない。例えば、エッジトレース処理における検索領域については、実施形態に示したものに限らず種々の変更が可能である。なお、上記実施形態に示した本発明に係る画像処理装置およびこれを備えた原稿読取システムの各構成要素は、必ずしも全てが必須ではなく、少なくとも本発明の範囲を逸脱しない限りにおいて適宜取捨選択することが可能である。
本発明に係る画像処理装置およびこれを備えた原稿読取システムは、撮製本された原稿における上下の外形輪郭全体を精度良く検出することを可能とし、書籍などの原稿を読み取って得られた画像を処理する画像処理装置およびこれを備えた原稿読取システムなどとして有用である。
1 原稿読取システム
2 書画カメラ(画像入力装置)
3 PC(画像処理装置)
32 エッジ抽出部
33 角点・のど点検出部
34 線分抽出部
35 線分補間部
39 外形輪郭
41L 左紙面
41R 右紙面
42 綴じ中心線
B 書籍(原稿)
C1〜C4 角点
D1、D2 のど点
Rs 検索領域
Rs1 中心領域(第1領域)
Rs2 ページ中央領域(第2領域)

Claims (5)

  1. 製本された原稿の左右の紙面を撮影した撮影画像における複数のエッジ画素を抽出してエッジ画像を取得するエッジ抽出部と、
    前記エッジ画像において、前記原稿の外形における少なくとも1つの角点を検出する角点検出部と、
    前記エッジ画像において、前記原稿の綴じ中心線における少なくとも一方の端点であるのど点を検出するのど点検出部と、
    前記角点と前記のど点との間の検索領域において、前記複数のエッジ画素のうち前記原稿の外形輪郭を画定する外形画素を順次検索し、これら検索された外形画素から構成される線分を抽出する線分抽出部と
    を備え、
    前記検索領域は、前記のど点側に位置する第1領域と、この第1領域よりも前記角点側に位置する第2領域とを含み、
    前記線分抽出部は、前記角点と前記のど点とを通る直線の方向を基準方向とし、前記外形画素の候補を端点とする前記線分の候補の前記基準方向に対する角度が所定の許容角度範囲に収まるか否かにより、当該外形画素の候補の有効性を判定し、
    前記線分の候補において、前記角点側の端点を基点とした半直線が前記基準方向に対して前記原稿の内側に向かう場合において、前記第1領域に対する前記許容角度範囲が前記第2領域よりも大きくなるように設定されたことを特徴とする画像処理装置。
  2. 前記線分抽出部は、前記線分の候補における両端点の前記原稿の上下方向の距離が所定の許容距離範囲内にない場合、前記外形画素の候補を無効と判定することを特徴とする請求項1に記載の画像処理装置。
  3. 前記線分の候補において、前記角点側の端点を基点とした半直線が前記基準方向に対して前記原稿の内側に向かう場合において、前記許容距離範囲は、前記第1領域において前記第2領域よりも大きく設定されたことを特徴とする請求項2に記載の画像処理装置。
  4. 前記線分抽出部は、新たに検索された前記外形画素の候補を無効と判定した場合、既に有効と判定されている複数の外形画素の候補に基づき前記線分を抽出することを特徴とする請求項1から請求項3のいずれかに記載の画像処理装置。
  5. 請求項1から請求項4のいずれかに記載の画像処理装置と、前記撮影画像を生成するカメラ部を備えた画像入力装置とを備えた原稿読取システム。
JP2012117131A 2012-05-23 2012-05-23 画像処理装置およびこれを備えた原稿読取システム Pending JP2013242826A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012117131A JP2013242826A (ja) 2012-05-23 2012-05-23 画像処理装置およびこれを備えた原稿読取システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012117131A JP2013242826A (ja) 2012-05-23 2012-05-23 画像処理装置およびこれを備えた原稿読取システム

Publications (1)

Publication Number Publication Date
JP2013242826A true JP2013242826A (ja) 2013-12-05

Family

ID=49843626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012117131A Pending JP2013242826A (ja) 2012-05-23 2012-05-23 画像処理装置およびこれを備えた原稿読取システム

Country Status (1)

Country Link
JP (1) JP2013242826A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101761641B1 (ko) * 2015-10-20 2017-08-08 주식회사 셀바스에이아이 엣지 라인을 검출하여 분할선을 획득하는 장치 및 방법
JP2018205002A (ja) * 2017-05-31 2018-12-27 株式会社キーエンス 画像検査装置
JP2022089389A (ja) * 2020-12-04 2022-06-16 日本化薬株式会社 アナログメータの指針の指示値の読み取り方法およびアナログメータの指針の指示値の読み取りシステム
WO2022169123A1 (ko) * 2021-02-04 2022-08-11 주식회사 네오랩컨버전스 필기 데이터 문자 인식 방법 및 그 장치

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101761641B1 (ko) * 2015-10-20 2017-08-08 주식회사 셀바스에이아이 엣지 라인을 검출하여 분할선을 획득하는 장치 및 방법
JP2018205002A (ja) * 2017-05-31 2018-12-27 株式会社キーエンス 画像検査装置
JP7188870B2 (ja) 2017-05-31 2022-12-13 株式会社キーエンス 画像検査装置
JP2022089389A (ja) * 2020-12-04 2022-06-16 日本化薬株式会社 アナログメータの指針の指示値の読み取り方法およびアナログメータの指針の指示値の読み取りシステム
JP7116770B2 (ja) 2020-12-04 2022-08-10 日本化薬株式会社 アナログメータの指針の指示値の読み取り方法およびアナログメータの指針の指示値の読み取りシステム
WO2022169123A1 (ko) * 2021-02-04 2022-08-11 주식회사 네오랩컨버전스 필기 데이터 문자 인식 방법 및 그 장치

Similar Documents

Publication Publication Date Title
US20180255287A1 (en) Generating hi-res dewarped book images
US10303969B2 (en) Pose detection using depth camera
JP2008084014A (ja) 画像領域検出方法、該プログラム、及び該装置
JP5975281B2 (ja) 画像処理装置及びプログラム
JP2013242826A (ja) 画像処理装置およびこれを備えた原稿読取システム
JP2019087945A (ja) 情報処理装置、プログラム及び情報処理方法
JP6098784B2 (ja) 画像処理装置及びプログラム
JP2019109624A (ja) 情報処理装置、プログラム及び情報処理方法
US20210281742A1 (en) Document detections from video images
JP2019050030A (ja) 画像抽出装置、画像抽出装置の制御方法及びプログラム
JP6563084B1 (ja) カード番号認識装置およびカード番号認識方法
JP2013192101A (ja) 画像処理装置およびこれを備えた原稿読取システム
JP2013247531A (ja) 画像処理装置およびこれを備えた原稿読取システム
JP2013225819A (ja) 画像処理装置およびこれを備えた原稿読取システム
JP2013218411A (ja) 画像処理装置およびこれを備えた原稿読取システム
JP6161874B2 (ja) 撮像装置、長さ計測方法及びプログラム
JP6255819B2 (ja) 計測用コンピュータプログラム、計測装置及び計測方法
JP6447890B2 (ja) 線分抽出装置、線分抽出装置の制御方法及びプログラム
JP2013192100A (ja) 画像処理装置およびこれを備えた原稿読取システム
US20220198814A1 (en) Image dewarping with curved document boundaries
JP2013029996A (ja) 画像処理装置
JP2020149184A (ja) 情報処理装置、その制御方法及びプログラム
JP2006319820A (ja) 画像歪み補正装置
JP2013235418A (ja) 画像処理装置およびこれを備えた原稿読取システム
JP2013206405A (ja) 連絡操作支援システム、連絡操作支援装置および連絡操作方法