JP6728615B2 - 画像補正装置、画像補正方法およびプログラム - Google Patents

画像補正装置、画像補正方法およびプログラム Download PDF

Info

Publication number
JP6728615B2
JP6728615B2 JP2015194928A JP2015194928A JP6728615B2 JP 6728615 B2 JP6728615 B2 JP 6728615B2 JP 2015194928 A JP2015194928 A JP 2015194928A JP 2015194928 A JP2015194928 A JP 2015194928A JP 6728615 B2 JP6728615 B2 JP 6728615B2
Authority
JP
Japan
Prior art keywords
line
shape
image
document
line segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015194928A
Other languages
English (en)
Other versions
JP2017068679A (ja
Inventor
山本 和彦
山本  和彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2015194928A priority Critical patent/JP6728615B2/ja
Priority to PCT/JP2016/079016 priority patent/WO2017057679A1/ja
Publication of JP2017068679A publication Critical patent/JP2017068679A/ja
Priority to US15/936,102 priority patent/US10600161B2/en
Application granted granted Critical
Publication of JP6728615B2 publication Critical patent/JP6728615B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/80Geometric correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/30Character recognition based on the type of data
    • G06V30/304Music notations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/13Type of disclosure document
    • G06V2201/131Book

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Geometry (AREA)

Description

本発明は、書類を撮影した画像を補正する技術に関する。
各種の情報が表記された書籍や印刷物等の書類を撮影した画像では、書類の表面の変形(典型的には湾曲)に起因して紙面の表記に歪みが発生し得る。特許文献1には、撮影範囲内の複数点で書籍の表面との距離を測距装置により測定し、書籍の表面の変形に起因した表記の歪みを測距結果に応じて補正する技術が開示されている。
特開2013−93704号公報
しかし、特許文献1の技術では、書籍の表面との距離を複数点にて測定するための測距装置が必要であるから、装置構成が複雑化する(ひいては製造コストや装置規模が増大する)という問題がある。以上の事情を考慮して、本発明は、書類の表面の変形に起因した画像の歪みを簡便な構成および処理で補正することを目的とする。
以上の課題を解決するために、本発明の好適な態様に係る画像補正装置は、書類を撮影した撮影画像から、当該書類の表面の表記に対応する複数の線分を検出する線分検出部と、書類の表面形状を近似する形状近似線を複数の線分から特定する形状特定部と、形状特定部が特定した形状近似線を利用して撮影画像を補正する画像補正部とを具備する。以上の態様では、書類を撮影した撮影画像から検出された複数の線分の分布に応じた形状近似線が特定され、当該形状近似線を利用して撮影画像が補正される。したがって、書類との距離を複数点で測距する特許文献1の測距装置を必要とせずに、書類の表面の変形に起因した画像の歪みを簡便な構成および処理で補正することが可能である。
本発明の好適な態様において、形状特定部は、線分上の特定点を通過する直線が形状近似線に交差する交点と当該特定点との距離を複数の線分について加算した距離指標が最小化されるように形状近似線を特定する。以上の態様では、線分上の特定点を通過する直線が形状近似線に交差する交点と当該特定点との距離を複数の線分について加算した距離指標が最小化されるように形状近似線が特定される(すなわち複数の線分の分布が形状近似線に反映される)から、書類の表面形状を高精度に近似する適切な形状近似線を特定できるという利点がある。
本発明の好適な態様において、線分検出部は、相互に間隔をあけて並列された複数の譜表を含む楽譜を撮影した撮影画像から複数の線分を検出し、形状特定部は、相互に隣合う2段の譜表に対応する複数の線分から形状近似線を特定する。以上の態様では、相互に隣合う2段の譜表に対応する複数の線分から形状近似線が特定されるから、譜表の1段分のみから形状近似線を特定する構成と比較して、書類の表面形状を高精度に近似する適切な形状近似線を特定できるという利点がある。
本発明の好適な態様において、形状特定部は、複数の線分を複数のクラスタに分類する分類処理と、複数の線分の各々について、当該線分が属するクラスタを表象する楕円が当該楕円の短軸と交差する地点での接線と、当該線分との距離に応じた調整値を算定する演算処理と、特定点を通過する直線が形状近似線に交差する交点と当該特定点との距離と調整値とを複数の線分について加算した距離指標が最小化されるように形状近似線を特定する近似処理とを実行する。以上の態様では、各線分が分類されたクラスタの楕円の接線と当該線分との距離に応じて調整値が算定され、特定点を通過する直線が形状近似線に交差する交点と当該特定点との距離と調整値とを複数の線分について加算した距離指標が最小化されるように形状近似線が特定される。したがって、2段の譜表のうち一方側に複数の線分が偏在する場合でも、書類の表面形状を高精度に近似する形状近似線を特定することが可能である。
本発明の好適な態様において、形状特定部は、演算処理において、接線と線分との距離に所定の係数を乗算することで調整値を算定する。以上の態様では、クラスタを表象する楕円の接線と当該クラスタ内の線分との距離に所定の係数を乗算する簡便な演算で調整値を算定できるという利点がある。
本発明の第1実施形態に係る画像補正装置の構成図である。 撮影画像の説明図である。 線分検出処理のフローチャートである。 線分検出処理の説明図である。 線分検出処理の説明図である。 形状近似線を特定する処理の説明図である。 撮影画像を補正する処理の説明図である。 画像補正処理のフローチャートである。 複数の線分の偏在による問題の説明図である。 第2実施形態の形状特定部が形状近似線を特定する処理の説明図である。 第2実施形態における形状近似線を特定する処理のフローチャートである。 調整値の説明図である。 第3実施形態における画像補正処理のフローチャートである。 変形例における線分検出処理のフローチャートである。
<第1実施形態>
図1は、第1実施形態に係る画像補正装置100の構成図である。図1に例示される通り、第1実施形態の画像補正装置100は、撮影装置12と制御装置14と記憶装置16と表示装置18とを具備するコンピュータシステムで実現される。例えば携帯電話機またはスマートフォン等の可搬型の情報処理装置、あるいはパーソナルコンピュータ等の可搬型または据置型の情報処理装置が画像補正装置100として利用され得る。また、静止画や動画像の撮影に専用される撮影機器(例えばデジタルカメラやデジタルカムコーダ等)で画像補正装置100を実現することも可能である。
撮影装置12は、書籍や印刷物等の書類の撮影により当該書類の画像(以下「撮影画像」という)GAを生成する画像入力装置であり、被写体からの入射光を電気信号に変換する撮像素子を含んで構成される。なお、第1実施形態では撮影装置12が画像補正装置100に搭載された構成を例示するが、画像補正装置100とは別体の撮影装置12を画像補正装置100に有線または無線で接続することも可能である。また、撮影画像GAを表す画像データの形式は任意である。
第1実施形態の撮影装置12は、任意の楽曲の楽譜が記譜された書籍や印刷物等の書類を撮影した撮影画像GAを生成する。図2は、撮影画像GAの模式図である。図2に例示される通り、撮影装置12が撮影する楽譜は、縦方向に相互に間隔をあけて並列された複数の譜表54(図2の例示では五線譜)を包含する。複数の譜表54の各々は、相異なる音高を表象する横方向の複数の直線で構成される。複数の譜表54の各々に対して所定の位置(例えば左端付近)にト音記号やヘ音記号等の楽譜記号(音部記号)52が配置され、楽曲を表現する音符や休符や変化記号等の符号は各譜表54の任意の位置に配置される。
図2に例示される通り、撮影装置12が撮影した撮影画像GAの楽譜には、書類の表面の変形(例えば湾曲)に起因した歪みが発生し得る。図2では、撮影対象の書類のうち横方向の途中の部分が縦方向の全域にわたり手前側に凸となるように曲面状に湾曲した状態が例示されている。画像補正装置100は、撮影装置12が撮影した撮影画像GAの楽譜の歪みを補正した画像(以下「補正画像」という)GBを生成する画像処理装置である。すなわち、撮影画像GAと比較して楽譜の歪みが低減(理想的には解消)された補正画像GBが生成される。
図1の表示装置18(例えば液晶表示パネル)は、制御装置14が指示した画像を表示する。具体的には、楽譜の歪みが補正された補正画像GBが表示装置18に表示される。記憶装置16は、磁気記録媒体や半導体記録媒体等の公知の記録媒体または複数種の記録媒体の組合せで構成され、制御装置14が実行するプログラムや制御装置14が使用する各種のデータを記憶する。
制御装置14は、例えばCPU(Central Processing Unit)等の演算処理装置で構成され、記憶装置16に記憶されたプログラムを実行することで、図1に例示される通り、撮影画像GAに対する補正で補正画像GBを生成するための複数の機能(線分検出部22,形状特定部24,画像補正部26,表示制御部28)を実現する。なお、制御装置14の一部の機能を画像処理の専用の電子回路で実現した構成や、制御装置14の機能を複数の装置に分散した構成も採用され得る。
線分検出部22は、撮影装置12が書類を生成した撮影画像GAから、当該書類の表面の表記(すなわち楽譜)に対応する複数の線分Lを検出する。線分検出部22による線分Lの検出には、例えば確率的ハフ変換等の公知の特徴抽出(直線検出)が任意に採用される。
図3は、線分検出部22が撮影画像GAから複数の線分Lを検出する処理(以下「線分検出処理」という)のフローチャートであり、図4および図5は、線分検出処理の説明図である。例えば撮影装置12による撮影画像GAの生成後に利用者からの指示を契機として図3の線分検出処理が開始される。
線分検出処理を開始すると、線分検出部22は、撮影画像GAから複数の線分Lを検出する(SA11)。図4に例示される通り、撮影画像GAの楽譜内の各譜表54を構成する多数の線分Lが検出される。実際には各音符の譜幹および譜尾や小節線等の直線部分も検出されるが、各譜表54を構成する線分Lが多数である。線分検出部22は、撮影画像GAから検出した複数の線分Lを譜表54毎に分類する(SA12)。複数の線分Lを分類する方法は任意であるが、各譜表54に対して所定の位置に配置された楽譜記号52を利用して複数の線分Lを譜表54毎に分類する方法が好適である。具体的には、線分検出部22は、撮影画像GAに対する公知の画像認識で複数の楽譜記号52(ト音記号およびヘ音記号)を認識し、撮影画像GAから検出した複数の線分Lを公知のクラスタリング技術(例えばk-means法)で楽譜記号52と同数の集合(クラスタ)に分類する。楽譜記号52は基本的に譜表54毎に配置されるから、分類数を楽譜記号52と同数に設定することで、撮影画像GAの複数の線分Lを譜表54毎に高精度に分類することが可能である。
線分検出部22は、撮影画像GAの楽譜内で縦方向に相互に隣合う2段の譜表54の組に対応する複数の領域(以下「単位領域」という)Uを画定する(SA13)。第1実施形態の単位領域Uは、図4に例示される通り、ト音記号が配置された譜表54Aとへ音記号が配置された譜表54Bとの2段を相互に間隔をあけて縦方向に並列した大譜表に相当する領域である。以上の説明から理解される通り、第1実施形態の線分検出部22は、撮影画像GA内の複数の単位領域Uの各々に包含される複数の線分Lを検出する。
線分検出部22は、図5に例示される通り、相互に直交するx軸とy軸とを各単位領域U内に設定する(SA14)。y軸は、撮影画像GAの縦方向に平行な軸線であり、x軸は、撮影画像GAの横方向に平行な軸線である。図5に例示される通り、単位領域Uのうち左端に位置するy軸に平行な縁辺における中点が、x軸とy軸との交差点(すなわち原点)に設定される。したがって、ト音記号が配置された譜表54Aに対応する線分Lの多数はx軸からみてy軸の正側の領域に分布し、ヘ音記号が配置された譜表54Bに対応する線分Lの多数はx軸からみてy軸の負側の領域に分布する。すなわち、ト音記号が配置された譜表54Aの線分Lとへ音記号が配置された譜表54Bの線分Lとはx軸を挟んで相互に反対側に位置する傾向がある。以上に例示した線分検出処理を線分検出部22が実行することで、撮影画像GAの複数の単位領域Uの各々について(すなわち大譜表毎に)、x-y平面に分布する複数の線分Lが特定される。なお、以下の説明では、任意の1個の単位領域UにN本の線分Lが包含される場合を想定する。線分Lの総数Nは単位領域U毎に相違し得る。
図1の形状特定部24は、撮影装置12が撮影した書類の表面形状を近似する形状近似線Qを、線分検出部22が検出した複数の線分Lから特定する。形状近似線Qは、楽譜内で横方向に延在する1本の直線が湾曲した状態を表象する曲線である。第1実施形態の形状特定部24は、撮影画像GAの複数の単位領域Uの各々について当該単位領域U内の複数の線分Lから形状近似線Qを特定する。任意の1個の単位領域Uの形状近似線Qは、当該単位領域U内の楽譜の表面形状を近似する。
形状近似線Qは、x-y平面内の関数f(x)で表現される。関数f(x)の具体的な形式は任意であるが、例えば三角関数を含む以下の数式(1)の関数f(x)で形状近似線Qが表現され得る。なお、数式(1)の変数θk(k=0,1,2,……)は、所定の範囲内の数値(例えば−1<θk<1)に制限される。
Figure 0006728615
図6は、形状特定部24が形状近似線Q(関数f(x))を特定する処理の説明図である。図6は、関数f(x)で表現される形状近似線Qと単位領域U内の任意の1個の線分Lとが図示されている。線分Lの一方の端点E1は座標(xE1,yE1)に位置し、他方の端点E2は座標(xE2,yE2)に位置する。
図6に例示される通り、任意の1個の線分L上の特定の地点(以下「特定点」という)Mを通過する直線Vが、形状近似線Qに交点Pで交差する場合を想定する。直線Vは、具体的には線分Lの垂線である。また、第1実施形態の特定点Mは、線分Lの中点であり、座標(xM,yM)に位置する(xM=(xE1+xE2)/2,yM=(yE1+yE2)/2)。直線Vと形状近似線Qとの交点Pは、座標(xP,f(xP))に位置する。
第1実施形態の形状特定部24は、線分L上の特定点Mと形状近似線Q上の交点Pとの間の距離Dを単位領域U内のN個の線分Lについて加算した指標(以下「距離指標」という)Z(x)が最小化されるように形状近似線Q(関数f(x))を特定する。すなわち、形状特定部24は、形状近似線Qに対する各線分Lの隔たり(距離D)が複数の線分Lについて全体的に低減されるように形状近似線Qを特定する。具体的には、第1実施形態の形状特定部24が形状近似線Qを特定する処理は、以下の数式(2)および数式(3)で表現される。
Figure 0006728615
以上の説明から理解される通り、第1実施形態の形状特定部24は、数式(3)の条件のもとで距離指標Z(x)が最小化されるように交点Pの座標(xP,f(xP))と関数f(x)の変数θkとを選定することで、形状近似線Qを表現する関数f(x)を特定する。数式(2)の右辺の第1項は、N個の線分Lにわたる距離D(D=(xP−xM)2+(f(xP)−yM)2)の総和であり、第2項は、距離指標Z(x)の最適解の発散を抑制するための正規化項である。また、数式(3)は、図6の線分Lと直線Vとが直交するという条件を意味する。形状近似線Qの特定(数式(2)および数式(3)の演算)には公知の最適化方法が任意に採用され得るが、ラグランジュ(Lagrange)の未定乗数法等の解析的な最適化方法が好適である。
図1の画像補正部26は、形状特定部24が特定した形状近似線Q(関数f(x))を利用して撮影画像GAを補正する。例えば、画像補正部26は、各単位領域Uの形状近似線QがX軸に平行な直線に変換される(すなわち、各譜表54の湾曲が解消される)ように撮影画像GAのうち当該単位領域U内の各画素をx-y平面内で移動することで、補正画像GBを生成する。具体的には、例えば図7に例示される通り、関数f(x)の関数値(関数f(x)と直線y=0との差分)に相当する距離だけ撮影画像GAの単位領域U内の各画素をy軸の方向に移動することで補正画像GBが生成される。ただし、形状近似線Qを利用した撮影画像GAの補正方法は以上の例示に限定されない。図1の表示制御部28は、画像補正部26が生成した補正画像GBを表示装置18に表示させる。
図8は、画像補正装置100が撮影画像GAを補正する処理(以下「画像補正処理」という)のフローチャートである。撮影装置12による撮影画像GAの生成後に利用者からの指示を契機として図8の画像補正処理が開始される。
画像補正処理を開始すると、制御装置14(線分検出部22)は、図3に例示した線分検出処理により、撮影装置12が撮影した書類の表面に表記された楽譜に対応する複数の線分Lを撮影画像GAから検出する(SA1)。具体的には、楽譜内の大譜表に対応する複数の単位領域Uの各々に包含される複数の線分Lが検出される。
制御装置14は、撮影画像GA内の複数の単位領域Uから1個の単位領域(以下「選択単位領域」という)Uを選択する(SA2)。そして、制御装置14(形状特定部24)は、選択単位領域U内の複数の線分Lを利用して、選択単位領域U内の書類の表面形状を近似する形状近似線Q(関数f(x))を特定する(SA3)。また、制御装置14(画像補正部26)は、形状特定部24が選択単位領域Uについて特定した形状近似線Qを利用して撮影画像GAのうち当該選択単位領域Uを補正する(SA4)。
制御装置14は、撮影画像GAの全部の単位領域Uについて以上の処理が完了したか否かを判定する(SA5)。判定結果が否定である場合(SA5:NO)、制御装置14は、未処理の単位領域Uを新たな選択単位領域Uとして選択したうえで(SA2)、当該選択単位領域U内の複数の線分Lを利用した形状近似線Qの特定(SA3)と当該形状近似線Qを利用した撮影画像GAの補正(SA4)とを実行する。すなわち、撮影画像GAの単位領域U毎(楽譜の大譜表毎)に形状近似線Qの特定と撮影画像GAの補正とが順次に実行される。他方、形状近似線Qの特定(SA3)と撮影画像GAの補正(SA4)とを全部の単位領域Uについて実行すると(SA5:YES)、制御装置14(表示制御部28)は、撮影画像GAの各単位領域Uを当該単位領域の形状近似線Qで補正した補正画像GBを表示装置18に表示させる(SA6)。
以上に説明した通り、第1実施形態では、楽譜が表記された書類を撮影した撮影画像GAから複数の線分Lが検出され、複数の線分Lの分布に応じた形状近似線Qが特定されて、当該形状近似線Qを利用して撮影画像GAが補正される。したがって、書類との距離を複数点で測距する特許文献1の測距装置を必要とせずに、書類の表面の変形に起因した楽譜の歪みを簡便な構成および処理で補正することが可能である。
また、第1実施形態では、線分Lと形状近似線Qとの距離DをN個の線分Lについて加算した距離指標Z(x)が最小化されるように形状近似線Qが特定される(すなわち複数の線分Lの分布が形状近似線Qに反映される)から、書類の表面形状を高精度に近似する適切な形状近似線Qを特定できるという利点がある。第1実施形態では、相互に隣合う2段の譜表54(すなわち大譜表)に対応する複数の線分Lから形状近似線Qが特定されるから、譜表54の1段分のみから形状近似線Qを特定する構成と比較して、書類の表面形状を高精度に近似する適切な形状近似線Qを特定することが可能である。
<第2実施形態>
本発明の第2実施形態を説明する。なお、以下に例示する各形態において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。
第1実施形態では、縦方向に相互に隣合う2段の譜表54に対応する複数の線分Lの分布に応じた形状近似線Qを特定した。前掲の図5の例示の通り、大譜表のうちト音記号に対応する譜表54Aとへ音記号に対応する譜表54Bとについて線分Lが均等に検出される場合には、書類の表面形状を適切に近似する形状近似線Qが譜表54Aと譜表54Bとの間に特定される。しかし、線分検出処理による線分Lの高精度な検出は実際には困難である。例えば、図9に例示される通り、単位領域Uのうちx軸方向の特定の区間u1では、譜表54Aの線分Lは検出されるが譜表54Bの線分Lは適切に検出されず、x軸方向の他の区間u2では、譜表54Bの線分Lは検出されるが譜表54Aの線分Lは適切に検出されないという具合に、線分Lの偏在が発生し得る。以上に例示した線分Lの偏在が第1実施形態のもとで発生すると、図9に例示される通り、線分Lの局所的な分布が反映されるように形状近似線Qが特定され、書類の表面形状を適切に近似する形状近似線Q(図9の鎖線)を特定できない可能性がある。以上の事情を考慮して、第2実施形態では、線分Lが譜表54A側および譜表54B側の一方に偏在する場合でも、書類の表面形状を適切に近似する形状近似線Qが特定されるように、距離指標Z(x)を調整する。
図10は、第2実施形態の形状特定部24が選択単位領域Uの形状近似線Qを特定する処理の説明図であり、図11は、第2実施形態の形状特定部24の動作のフローチャートである。図8のステップSA3にて図11の処理が実行される。
図11の処理を開始すると、第2実施形態の形状特定部24は、選択単位領域U内で線分検出部22が検出した複数の線分Lを複数のクラスタに分類する分類処理を実行する(SA31)。具体的には、形状特定部24は、図10に例示される通り、各線分L上の特定の地点(以下「解析点」という)Aを、x-y平面内で相互に近接するもの同士で複数のクラスタに分類するとともに、各クラスタを表象する楕円Cを画定する。解析点Aは、例えば特定点Mと同様に線分Lの中点である。また、任意の1個のクラスタを表象する楕円Cは、当該クラスタに分類された複数の線分Lの解析点Aを最小面積で内包するように画定される。図10から理解される通り、譜表54A側(y軸の正側)および譜表54B側(y軸の負側)の一方に偏在する複数の線分Lの集合が1個のクラスタに分類される。複数の線分Lの分類には、k-means法等の公知のクラスタリング技術が任意に採用され得る。
形状特定部24は、選択単位領域U内の複数の線分Lの各々について調整値δを算定する演算処理を実行する(SA32)。任意の1個の線分Lの調整値δは、図10に例示される通り、当該線分Lが属するクラスタの楕円Cの接線Tと当該線分Lとの距離Rに応じた数値に設定される。楕円Cの接線Tは、当該楕円Cが自身の短軸と交差する地点における接線(すなわち楕円Cの長軸に平行な接線)であり、楕円Cの中心からみてx軸側に位置する。楕円Cの接線Tと線分Lとの距離Rは、当該線分L上の解析点Aから接線Tまでの距離である。具体的には、形状特定部24は、所定の係数αを距離Rに乗算した数値を調整値δとして算定する(δ=αR)。係数αは、1を上回る所定の正数である。
選択単位領域U内の各線分Lについて調整値δを算定すると、形状特定部24は、距離指標Z(x)が最小化されるように形状近似線Qを特定する近似処理を実行する(SA33)。第2実施形態の距離指標Z(x)は、以下の数式(4)で表現される。
Figure 0006728615

数式(4)から理解される通り、第2実施形態の距離指標Z(x)は、線分Lの特定点Mと形状近似線Q上の交点Pとの距離D(D=(xP−xM)2+(f(xP)−yM)2)と、演算処理(SA32)で算定した当該線分Lの調整値δとを、N個の線分Lについて加算した数値を包含する。形状特定部24は、前掲の数式(3)の条件のもとで数式(4)の距離指標Z(x)が最小化されるように交点Pの座標(xP,f(xP))と数式(1)の関数f(x)の変数θkとを選定することで、形状近似線Q(関数f(x))を特定する。
図12に例示される通り、任意の1個の譜表54Aにおけるy軸の方向の中点PC1から譜表54Aと譜表54Bとの間の中点PC2までの距離YAは、中点PC1から譜表54Aのy軸の負側の外縁までの距離(すなわち譜表54Aの幅の半分)YBの2倍程度である(YA=2YB)。以上の仮定のもとでは、調整値δ(δ=αR)の算定時に距離Rに乗算される係数αを例えば2に設定することで、譜表54Aと譜表54Bとの間に位置する適切な形状近似線Qを特定することが可能である。線分検出部22による線分検出処理(SA1)や画像補正部26が形状近似線Qを利用して撮影画像GAを補正する処理(SA4)は第1実施形態と同様である。
第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態では、距離Dと調整値δとをN個の線分Lについて加算した距離指標Z(x)が最小化されるように形状近似線Qが特定されるから、譜表54A側および譜表54B側の一方に複数の線分Lが偏在する場合(例えば線分検出処理の精度が低い場合)でも、書類の表面形状を高精度に近似する形状近似線Qを特定できるという利点がある。また、第2実施形態では、クラスタを表象する楕円Cの接線Tと当該クラスタ内の線分Lとの距離Rに所定の係数αを乗算する簡便な演算で調整値δを算定できるという利点もある。
<第3実施形態>
第1実施形態では、撮影装置12が生成した1個の撮影画像GAについて図8の画像補正処理を実行した。第3実施形態では、撮影装置12が撮影する動画像を構成する複数の撮影画像GAの各々について、撮影装置12による撮影に並行して画像補正処理が実行される。
図13は、第3実施形態における画像補正処理のフローチャートである。利用者からの指示を契機として、撮影装置12による動画像の撮影が開始されるとともに図13の画像補正処理が開始される。第3実施形態の撮影装置12は、動画像を構成する複数の撮影画像GAを順次に生成および出力する。撮影装置12から1個の撮影画像GAが供給されると、第1実施形態と同様に、当該撮影画像GAを対象として線分検出処理が実行され(SA1)、複数の単位領域Uの各々について形状近似線Qの特定(SA3)と撮影画像GAの補正(SA4)とが順次に実行されたうえで補正画像GBが表示装置18に表示される(SA6)。
利用者は、任意の時点で撮影の終了を指示することが可能である。利用者が撮影の終了を指示しない場合(SA7:NO)、撮影装置12から直後に供給される撮影画像GAについて、同様にステップSA1からステップSA6までの処理が実行される。すなわち、撮影装置12による動画像の撮影に並行して、各撮影画像GAから補正画像GBが順次に生成され、表示装置18に表示される補正画像GBは順次に更新される。利用者から撮影の終了が指示された場合(SA7:YES)、撮影装置12による撮影と画像補正処理とは終了する。
第3実施形態においても第1実施形態と同様の効果が実現される。なお、第2実施形態の構成を第3実施形態に適用することも可能である。
<変形例>
以上に例示した各態様は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2個以上の態様は、相互に矛盾しない範囲で適宜に併合され得る。
(1)前述の各形態では、撮影画像GAの全域を対象として複数の線分Lを検出したが、撮影画像GAの単位領域U毎に線分検出部22が線分Lを検出することも可能である。例えば、図14に例示される通り、撮影画像GAの全域を対象として検出した複数の線分Lを分類する(SA11,SA12)ことで譜表54毎の単位領域Uを画定すると(SA13,SA14)、線分検出部22は、複数の単位領域Uの各々について、撮影画像GAのうち当該単位領域Uを探索対象として複数の線分Lを順次に検出する(SA15)。すなわち、撮影画像GAの全域を対象とした線分Lの検出(SA11)と各単位領域Uを対象とした線分Lの検出(SA15)との2段階で複数の線分Lが検出される。単位領域Uを探索対象とした線分Lの検出によれば、撮影画像GAの全域を対象とした検出と比較して高精度に線分Lを検出することが可能である。もっとも、単位領域Uの画定(SA13)に線分Lの検出は必須ではない。例えば、利用者からの指示に応じて単位領域Uを画定する等の任意の方法(線分Lを利用しない方法)で複数の単位領域Uを画定し、線分検出部22が単位領域U毎に複数の線分Lを検出することも可能である。
(2)形状近似線Qを表現する関数f(x)の形式は前述の数式(1)に限定されない。例えば、一次関数や二次関数等の任意の形式の関数f(x)を形状近似線Qの記述に採用することが可能である。また、複数種の関数のうち利用者が選択した関数f(x)を形状近似線Qに利用することも可能である。
(3)前述の各形態では、譜表54の2段分(すなわち大譜表)に相当する単位領域Uを例示したが、例えば譜表54の1段分に相当する単位領域U毎に形状近似線Qの特定(SA3)と撮影画像GAの補正(SA4)とを実行することも可能である。
(4)前述の各形態では、楽譜が表記された書類を撮影する場合を例示したが、画像補正装置100による処理対象となる画像は楽譜に限定されない。例えば、各種の文章が記載された書類を撮影した撮影画像GAを撮影装置12が生成することも可能である。線分検出部22は、例えば文字列や罫線に相当する複数の線分Lを撮影画像GAから検出し、複数の線分Lを利用した形状近似線Qの特定(SA3)と形状近似線Qを利用した撮影画像GAの補正(SA4)とが順次に実行される。以上の説明から理解される通り、線分検出部22は、各種の書類の表面の表記(例えば楽譜や文章)に対応する複数の線分Lを検出する要素として包括的に表現され、撮影装置12による撮影対象となる書類の種類は任意である。
(5)移動体通信網やインターネット等の通信網を介して端末装置(例えば携帯電話機やスマートフォン)と通信するサーバ装置で画像補正装置100を実現することも可能である。具体的には、画像補正装置100は、端末装置に搭載された撮影装置12が生成した撮影画像GAを端末装置から受信し、当該撮影画像GAに対する画像補正処理(SA1〜SA5)で生成された補正画像GBを端末装置に送信する。以上の説明から理解される通り、撮影装置12は画像補正装置100に必須の要素ではない。また、相互に別体で構成された複数の装置の集合(例えば端末装置とサーバ装置とを含むシステム)で画像補正装置100を実現することも可能であり、画像補正装置100を構成する複数の装置にわたる機能の分担は任意である。
(6)前述の各形態で例示した画像補正装置100は、前掲の例示の通り、制御装置14とプログラムとの協働で実現される。本発明の好適な態様に係るプログラムは、書類を撮影した撮影画像GAから、当該書類の表面の表記に対応する複数の線分Lを検出する線分検出部22、書類の表面形状を近似する形状近似線Qを複数の線分Lから特定する形状特定部24、および、形状特定部24が特定した形状近似線Qを利用して撮影画像GAを補正する画像補正部26としてコンピュータを機能させる。以上に例示したプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体や磁気記録媒体等の公知の任意の形式の記録媒体を包含し得る。また、通信網を介した配信の形態でプログラムをコンピュータに配信することも可能である。
(7)本発明の好適な態様は、前述の各形態に係る画像補正装置100の動作方法(画像補正方法)としても特定される。例えば、本発明の好適な態様に係る画像補正方法は、書類を撮影した撮影画像GAから、当該書類の表面の表記に対応する複数の線分Lを検出し(SA1)、書類の表面形状を近似する形状近似線Qを複数の線分Lから特定し(SA3)、形状近似線Qを利用して撮影画像GAを補正する(SA4)。
100……画像補正装置、12……撮影装置、14……制御装置、16……記憶装置、18……表示装置、22……線分検出部、24……形状特定部、26……画像補正部、28……表示制御部。

Claims (6)

  1. 書類を撮影した撮影画像から、当該書類の表面の表記に対応する複数の線分を検出する線分検出部と、
    前記線分上の特定点を通過する直線が、前記書類の表面形状を近似する形状近似線に交差する交点と、当該特定点との距離を前記複数の線分について加算した距離指標が最小化されるように前記形状近似線を特定する形状特定部と、
    前記形状特定部が特定した形状近似線を利用して前記撮影画像を補正する画像補正部と
    を具備する画像補正装置。
  2. 前記線分検出部は、相互に間隔をあけて並列された複数の譜表を含む楽譜を撮影した前記撮影画像から前記複数の線分を検出し、
    前記形状特定部は、相互に隣合う2段の譜表に対応する複数の線分から前記形状近似線を特定する
    請求項の画像補正装置。
  3. 前記形状特定部は、
    前記複数の線分を複数のクラスタに分類する分類処理と、
    前記複数の線分の各々について、当該線分が属するクラスタを表象する楕円が当該楕円の短軸と交差する地点での接線と、当該線分との距離に応じた調整値を算定する演算処理と、
    前記特定点を通過する直線が前記形状近似線に交差する交点と当該特定点との距離と前記調整値とを前記複数の線分について加算した距離指標が最小化されるように前記形状近似線を特定する近似処理とを実行する
    請求項の画像補正装置。
  4. 前記形状特定部は、前記演算処理において、前記接線と前記線分との距離に所定の係数を乗算することで前記調整値を算定する
    請求項の画像補正装置。
  5. 書類を撮影した撮影画像から、当該書類の表面の表記に対応する複数の線分を検出し、
    前記線分上の特定点を通過する直線が、前記書類の表面形状を近似する形状近似線に交差する交点と、当該特定点との距離を前記複数の線分について加算した距離指標が最小化されるように前記形状近似線を特定し、
    前記特定された形状近似線を利用して前記撮影画像を補正する
    コンピュータにより実現される画像補正方法。
  6. 書類を撮影した撮影画像から、当該書類の表面の表記に対応する複数の線分を検出する線分検出部、
    前記線分上の特定点を通過する直線が、前記書類の表面形状を近似する形状近似線に交差する交点と、当該特定点との距離を前記複数の線分について加算した距離指標が最小化されるように前記形状近似線を特定する形状特定部、および、
    前記形状特定部が特定した形状近似線を利用して前記撮影画像を補正する画像補正部
    としてコンピュータを機能させるプログラム。
JP2015194928A 2015-09-30 2015-09-30 画像補正装置、画像補正方法およびプログラム Active JP6728615B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2015194928A JP6728615B2 (ja) 2015-09-30 2015-09-30 画像補正装置、画像補正方法およびプログラム
PCT/JP2016/079016 WO2017057679A1 (ja) 2015-09-30 2016-09-30 画像補正装置
US15/936,102 US10600161B2 (en) 2015-09-30 2018-03-26 Image correction device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015194928A JP6728615B2 (ja) 2015-09-30 2015-09-30 画像補正装置、画像補正方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2017068679A JP2017068679A (ja) 2017-04-06
JP6728615B2 true JP6728615B2 (ja) 2020-07-22

Family

ID=58427566

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015194928A Active JP6728615B2 (ja) 2015-09-30 2015-09-30 画像補正装置、画像補正方法およびプログラム

Country Status (3)

Country Link
US (1) US10600161B2 (ja)
JP (1) JP6728615B2 (ja)
WO (1) WO2017057679A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017057694A1 (ja) * 2015-09-30 2017-04-06 ヤマハ株式会社 楽譜画像解析装置
CN110942064B (zh) * 2019-11-25 2023-05-09 维沃移动通信有限公司 图像处理方法、装置和电子设备
WO2022222047A1 (zh) * 2021-04-20 2022-10-27 Oppo广东移动通信有限公司 文档扫描方法及装置、存储介质及电子设备

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6315373A (ja) * 1986-07-05 1988-01-22 Kan Oteru 楽譜五線検出方式
JPH0437968A (ja) * 1990-06-01 1992-02-07 Fuji Electric Co Ltd 図書の文字読取方法
JPH05219323A (ja) * 1991-12-16 1993-08-27 Tokyo Electric Power Co Inc:The 書籍読取方法および装置
US5497236A (en) * 1993-06-23 1996-03-05 Ricoh Company Ltd. Method and apparatus for distortion correction of scanned images
US20040218069A1 (en) * 2001-03-30 2004-11-04 Silverstein D Amnon Single image digital photography with structured light for document reconstruction
WO2005041123A1 (ja) 2003-10-24 2005-05-06 Fujitsu Limited 画像歪み補正プログラム,画像歪み補正装置並びに画像歪み補正方法
JP2009151712A (ja) * 2007-12-21 2009-07-09 Canon Inc 楽譜作成方法及び画像処理システム
JP4585015B2 (ja) * 2008-07-07 2010-11-24 株式会社リコー 画像歪み補正装置、画像読取装置、画像形成装置及びプログラム
US8285077B2 (en) * 2008-07-15 2012-10-09 Nuance Communications, Inc. Automatic correction of digital image distortion
US11403739B2 (en) * 2010-04-12 2022-08-02 Adobe Inc. Methods and apparatus for retargeting and prioritized interpolation of lens profiles
JP5909990B2 (ja) 2011-10-25 2016-04-27 株式会社リコー 撮像装置および撮像方法
US8855419B2 (en) * 2012-11-20 2014-10-07 Eastman Kodak Company Image rectification using an orientation vector field
US9317893B2 (en) * 2013-03-26 2016-04-19 Sharp Laboratories Of America, Inc. Methods and systems for correcting a document image

Also Published As

Publication number Publication date
JP2017068679A (ja) 2017-04-06
WO2017057679A1 (ja) 2017-04-06
US20180218479A1 (en) 2018-08-02
US10600161B2 (en) 2020-03-24

Similar Documents

Publication Publication Date Title
US10255496B2 (en) Method and device for capturing a document
JP6728615B2 (ja) 画像補正装置、画像補正方法およびプログラム
KR102094506B1 (ko) 피사체 추적 기법을 이용한 카메라와 피사체 사이의 거리 변화 측정방법 상기 방법을 기록한 컴퓨터 판독 가능 저장매체 및 거리 변화 측정 장치.
EP3416099A1 (en) Image processing apparatus, image processing method, and a program
US11727729B2 (en) Signature verification apparatus, system, method, and program
JPWO2018158812A1 (ja) 点検支援装置、点検支援方法およびプログラム
RU2673015C1 (ru) Способы и системы оптического распознавания символов серии изображений
WO2019230593A1 (ja) 画像処理方法および画像処理装置
WO2017057690A1 (ja) 画像処理装置
JP2018124918A (ja) 画像処理装置、画像処理方法及びプログラム
US20160343142A1 (en) Object Boundary Detection in an Image
JP5983781B2 (ja) 画像解像度認識装置、画像の解像度を認識する方法および画像解像度認識プログラム
JP6540436B2 (ja) 画像補正装置
JP2012065247A (ja) 情報処理装置、方法およびプログラム
WO2017057694A1 (ja) 楽譜画像解析装置
JP2012022413A (ja) 画像処理装置、画像処理方法、およびプログラム
WO2019159415A1 (ja) 読取システム
JP6105179B1 (ja) 画像処理装置、画像処理方法、および、画像処理プログラム
WO2018158818A1 (ja) 点検支援装置、点検支援方法および記録媒体
WO2023042248A1 (ja) 情報処理システム、情報処理装置、情報処理方法、及び記録媒体
KR100988431B1 (ko) 영상 특징 추출 방법, 이를 기록한 기록매체 및 이를 수행하는 장치
JP6562109B1 (ja) 画像入力装置及び画像入力方法
JP6586846B2 (ja) 楽譜画像解析装置
JP2017022489A (ja) 電子透かし検出方法、装置、及びプログラム
JP2019145181A (ja) 読取システム、読取方法、プログラム、及び記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191001

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200602

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200615

R151 Written notification of patent or utility model registration

Ref document number: 6728615

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151