JP7163356B2 - ディープラーニングに基づく画像補正方法及びシステム - Google Patents

ディープラーニングに基づく画像補正方法及びシステム Download PDF

Info

Publication number
JP7163356B2
JP7163356B2 JP2020211742A JP2020211742A JP7163356B2 JP 7163356 B2 JP7163356 B2 JP 7163356B2 JP 2020211742 A JP2020211742 A JP 2020211742A JP 2020211742 A JP2020211742 A JP 2020211742A JP 7163356 B2 JP7163356 B2 JP 7163356B2
Authority
JP
Japan
Prior art keywords
image
viewpoint transformation
character
deep learning
transformation matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020211742A
Other languages
English (en)
Other versions
JP2022039895A (ja
Inventor
冠徳 李
名嘉 黄
宏軒 林
宇哲 李
佳玲 羅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial Technology Research Institute ITRI
Original Assignee
Industrial Technology Research Institute ITRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial Technology Research Institute ITRI filed Critical Industrial Technology Research Institute ITRI
Publication of JP2022039895A publication Critical patent/JP2022039895A/ja
Application granted granted Critical
Publication of JP7163356B2 publication Critical patent/JP7163356B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/625License plates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/60Rotation of whole images or parts thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/80Geometric correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/54Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1463Orientation detection or correction, e.g. rotation of multiples of 90 degrees
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30204Marker
    • G06T2207/30208Marker matrix
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2628Alteration of picture size, shape, position or orientation, e.g. zooming, rotation, rolling, perspective, translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)

Description

本開示は一般に、画像補正方法およびシステムに関し、より詳細には、ディープラーニング(deep learning)に基づく画像補正方法およびシステムに関する。
画像認識の分野では、特に画像内の文字の認識において、最初に画像から対象文字を含む部分画像の位置を特定し、その後の認識モデルのために正面像として補正されて文字認識が行われる。画像補正手順は異なる視野角(view angle)と距離を持つ画像を、同じ角度と距離を持つ正面像に変換して、認識モデルの学習を高速化し、認識精度を高める。
しかしながら、現在の技術では、回転パラメータを手動で見つけ、画像補正手順の精度を高めるためにパラメータを繰り返し調整する従来の画像処理方法に依っている。画像補正手順は人工知能(AI:artificial intelligence)の技術を用いて実行することができるが、画像補正手順は時計回りまたは反時計回りの回転角度しか見つけることができず、画像を一定の縮尺にし、シフトまたは傾斜させるための複雑な画像処理において使用することができない。例えば、学習されたニューラルネットワークを利用するナンバープレート認識は、米国特許公開第9785855号に開示されている。
そのため、産業界では、様々な画像を正面像として効率的かつ正確に補正することが重要な課題となっている。
本開示は、ディープラーニングに基づく画像補正方法およびシステムを対象とする。画像補正手順のための始点変換(perspective transformation)パラメータはディープラーニングモデルによって見つけられ、様々な画像を正面像に効率的に補正し、さらに、認識精度を高めるために損失値を使用してディープラーニングモデルを更新するために使用される。
一実施形態によれば、ディープラーニングに基づく画像補正方法が提供される。画像補正方法は、以下のステップを含む。少なくとも1つの文字を含む画像がディープラーニングモデルによって受け取られ、視点変換行列(perspective transformation matrix)が画像に従って生成される。画像に対する視点変換は、視点変換行列に従って実行され、少なくとも1つの文字の正面像を含む補正画像が得られる。少なくとも1つの文字の正面像を含む最適化された補正画像が、画像に従って生成される。画像と最適化した補正画像に対応する最適化視点変換行列が得られる。最適化視点変換行列と視点変換行列との間の損失値が計算される。ディープラーニングモデルは、損失値を用いて更新される。
別の実施形態によれば、ディープラーニングに基づく画像補正システムが提供される。画像補正システムは、ディープラーニングモデル、処理部およびモデル調整部を備える。ディープラーニングモデルは少なくとも1つの文字を含む画像を受け取り、その画像に従って視点変換行列を生成するように構成される。処理部は画像および視点変換行列を受け取り、視点変換行列に従って画像に対して視点変換を実行して、少なくとも1つの文字の正面像を含む補正画像を取得するように構成される。モデル調整部は画像を受け取り、画像に従って少なくとも1つの文字の正面像を含む最適化された補正画像を生成し、画像および最適化された補正画像に対応する最適化された視点変換行列を取得し、最適化された視点変換行列と視点変換行列との間の損失値を計算し、損失値を使用してディープラーニングモデルを更新するように構成される。
本開示の上記および他の態様は、好ましいが非限定的な実施形態の以下の詳細な説明に関してより良く理解されるのであろう。以下、図面を参照して説明する。
本開示の一実施形態によるディープラーニングに基づく画像補正システムの概略図である。 本開示によるディープラーニングに基づく画像補正方法の一実施形態のフローチャートである。 本開示の一実施形態による車両プレートを含む画像の概略図である。 本開示の別の実施形態による道路標識を含む画像の概略図である。 本発明の一実施形態による補正画像の概略図である。 本開示の一実施形態によるステップS130のサブステップのフローチャートである。 本開示の一実施形態によるマークを含む画像の概略図である。 本開示の一実施形態による画像及び拡張画像の概略図である。 本開示の一実施形態による最適化された補正画像の概略図である。 本開示の一実施形態によるディープラーニングに基づく画像補正システムの概略図である。 本開示の他の実施形態によるディープラーニングに基づく画像補正方法のフローチャートである。
以下の詳細な説明において、説明の目的のために、開示された実施形態の完全な理解を提供するために、多数の特定の詳細が記載される。しかしながら、これらの特定の詳細なしに、1つ以上の実施形態が実施されてもよいことは明らかであろう。他の例では、図面を簡略化するために、周知の構造およびデバイスが概略的に示されている。
〔実施形態1〕
図1を参照すると、本開示の一実施形態によるディープラーニングに基づく画像補正システム100の概略図が示されている。画像補正システム100は、ディープラーニングモデル110と、処理部120と、モデル調整部130とを備えている。ディープラーニングモデル110は、CNN(convolutional neural network)モデルによって実現することができる。処理部120及びモデル調整部130は、チップ、回路基板又は回路によって実現することができる。
図1と図2を同時に参照されたい。図2は、本開示によるディープラーニングに基づく画像補正方法の一実施形態のフローチャートである。
ステップS110において、少なくとも1つの文字を含む画像IMG1がディープラーニングモデル110によって受信され、画像IMG1に従って視点変換行列Tが生成される。画像IMG1は、車両プレート、道路標識、シリアル番号、または標識板の画像など、少なくとも1つの文字を含む任意の画像とすることができる。少なくとも1つの文字は、数字、英語文字、ハイフン、句読点、またはそれらの組み合わせなどである。図3及び図4参照されたい。図3は、本開示の一実施形態による車両プレートを含む画像IMG1の概略図である。図3に示すように、画像IMG1は文字「ABC-5555」を含み、図4は本開示の別の実施形態による道路標識を含む画像IMG1の概略図であり、図4に示すように、画像IMG1は文字「WuXing St.」を含む。ディープラーニングモデル110は事前に学習されたモデル(pre-trained model)であり、画像IMG1がディープラーニングモデル110に入力されると、ディープラーニングモデル110はそれに対応して画像IMG1に対応する視点変換行列Tを出力する。視点変換行列Tには、式1に示すように、いくつかの視点変換パラメータT11、T12、T13、T21、T22、T23、T31、T32 と1が含まれている。
Figure 0007163356000001

ステップS120において、視点変換行列Tに従って、処理部120によって画像IMG1に対して視点変換が実行され、少なくとも1つの文字の正面像を含む補正画像IMG2が得られる。処理部120は視点変換行列Tに従って画像IMG1に対して視点変換を実行し、画像IMG1を、少なくとも1つの文字の正面像を含む補正画像IMG2に変換する。図5を参照すると、本開示の一実施形態による補正画像IMG2の概略図が示されている。例えば、図3の画像IMG1を例に取る。画像IMG1は車両プレートを含む。視点変換行列Tに従って画像IMG1に対して視点変換を行った後、図5に示すような補正画像IMG2を得ることができる。
ステップS130では、損失値Lを用いてモデル調整部130によってディープラーニングモデル110が更新される。図6を参照すると、本開示の一実施形態によるステップS130のサブステップのフローチャートが示されている。ステップS130は、ステップS131~S135を含む。
ステップS131において、画像IMG1はモデル調整部130によってマークされ、マークは文字をカバーするマーク範囲を含む。図7を参照すると、本開示の一実施形態によるマークを含む画像IMG1の概略図が示されている。画像IMG1上のマークは、文字をカバーするマーク範囲Rを形成するマーク点A、B、C及びDを含む。本実施形態では、画像IMG1は車両プレートを含む画像であり、マーク点A,B,C,Dは車両プレートの四隅に位置させることができ、マーク範囲Rは四辺形である。別の実施形態において、画像IMG1が図4に示されるような道路標識を含む画像であり、マーク点A、B、CおよびDを道路標識の四隅に位置させることができる場合、マーク範囲は四辺形である。別の実施形態では画像IMG1内の文字が車両プレートまたは道路標識などの幾何学的オブジェクト上に位置しない場合、モデル調整部130はマーク範囲が文字をカバーすることを可能にするだけでよい。別の実施形態ではモデル調整部130がマークされた画像を直接受け取ることができるが、マークを実行しない。
図8を参照すると、本開示の一実施形態による画像IMG3および拡張画像IMG4の概略図が示されている。一実施形態では、マーク範囲が画像IMG3内の文字をカバーできない場合、または画像IMG3内の文字が画像IMG3を超える場合、モデル調整部130はマーク範囲R’が文字をカバーできるように、画像IMG3を拡張して拡張画像IMG4を取得し、拡張画像IMG4をマークする。本実施形態では、モデル調整部130が画像IMG3に空白画像BLKを付加して、拡張画像IMG4を得る。
再び図7を参照する。ステップS132では、モデル調整部130により、画像IMG1に応じて、文字の正面像を含む最適化補正画像が生成される。本実施の形態では、モデル調整部130が画像IMG1のマーク点A,B,C,Dにおける画素を画像の四隅に位置合わせして、最適化された補正画像を得る。図9を参照すると、本開示の一実施形態による最適化された補正画像の概略図が示されている。図9に示すように、最適化された補正画像は、文字の正面像を含む。
ステップS133において、モデル調整部130により、画像IMG1及び最適化された補正画像に対応する最適化視点変換マトリクスが得られる。画像IMG1と最適化された補正画像との視点変換関係により、モデル調整部130は画像IMG1及び最適化された補正画像を用いて視点変換行列を計算し、計算された視点変換行列を最適化視点変換行列として使用することができる。
ステップS134では、モデル調整部130により、最適化視点変換行列と視点変換行列Tとの間の損失値Lが算出される。ステップS135において、ディープラーニングモデル110は損失値Lを用いてモデル調整部130により更新される。図5に示すように、視点変換行列Tに従って画像IMG1に対して視点変換を行って得られた補正画像IMG2が最良の結果と一致しないため、損失値Lを用いてモデル調整部130によりディープラーニングモデル110を更新することができる。
本開示のディープラーニングに基づく画像補正システム100および方法によれば、画像補正手順のための視点変換パラメータはディープラーニングモデルによって求められ、様々な画像を正面像に効率的に補正し、さらに損失値を使用してディープラーニングモデルを更新し、認識精度を向上させる。
図10を参照すると、本開示の一実施形態によるディープラーニングに基づく画像補正システム1100の概略図が示されている。画像補正システム1100は、画像補正システム1100がカメラによって実現可能な撮像部1140をさらに含む点で、画像補正システム100と異なる。図10と図11を同時に参照する。図11は、本発明の他の実施形態によるディープラーニングによる画像補正方法を示すフローチャートである。
ステップS1110において、少なくとも1つの文字を含む画像IMG5が、撮像部1140によって撮影される。
ステップS1120において、画像IMG5がディープラーニングモデル1110によって受信され、画像IMG5に従って視点変換行列T’が生成される。ステップS1120は図2のステップS110と同様であり、類似点はここでは繰り返さない。
ステップS1130では、ディープラーニングモデル1110で撮影情報SIを受信し、撮影情報SIに応じて視点変換行列T’の視点変換パラメータをいくつか制限する。撮影情報SIは、撮影場所、撮影方向、撮影角度である。撮影場所、撮影方向、撮影角度は、それぞれ3つのパラメータ、2つのパラメータ、1つのパラメータで表すことができる。視点変換行列T’は式2に示すように、いくつかの視点変換パラメータT’11、T’12、T’13、T’21、T’22、T’23、T’31、T’32、および1を含む。視点変換パラメータT’11、T’13、T’21、T’22、T’32は、撮影場所、撮影方向、撮影角度の6つのパラメータにより決定できる。
Figure 0007163356000002

まず、ディープラーニングモデル1110は撮影位置、撮影方向、撮影角度の6つのパラメータのそれぞれに合理的な範囲を割り当て、グリッドサーチアルゴリズム(grid search algorithm)を用いて視点変換パラメータT’mnを計算し、視点変換パラメータT’mnの最大値Lmn及び最小値Smnを得る。そして、ディープラーニングモデル1110は、式3に従って、それぞれの視点変換パラメータT’mnを算出する。
Figure 0007163356000003

式3で、Zmnは制限を受けない値であり、σは0~1の範囲の論理関数である。したがって、ディープラーニングモデル1110は、視点変換パラメータT’11、T’12、T’13、T’21、T’22、T’23、T’31、T’32 の各々が合理的な範囲内に収まることを保証することができる。
ステップS1140において、視点変換行列T’に従って、処理部1120によって画像IMG5に対して視点変換が実行され、少なくとも1つの文字の正面像を含む補正画像IMG6が得られる。ステップS1140は図2のステップS120と同様であり、類似点はここでは繰り返さない。
ステップS1150では損失値L’を用いてディープラーニングモデル1110を更新するが、ステップS1150は図2のステップS130と同様であり、ここでは類似点は繰り返さない。
したがって、本開示の画像補正システム1100およびディープラーニングに基づく方法はディープラーニングモデル精度を高め、ディープラーニングモデルの学習をより容易にするために、撮影情報SIに従って視点変換パラメータの範囲を制限することができる。
当業者には、開示された実施形態に対して様々な修正および変形を行うことができることが明らかであろう。明細書および実施例は単に例示的なものとみなされ、開示の真の範囲は以下の特許請求の範囲およびその均等の範囲によって示されることが意図される。

Claims (8)

  1. ディープラーニングに基づく画像補正方法であって、
    撮像部によって、少なくとも1つの文字を含む画像を撮像するステップと、
    ディープラーニングモデルによって前記画像を受け取り、前記画像に従って視点変換行列を生成するステップと、
    前記撮像部の撮影情報に応じて、前記視点変換行列の複数の視点変換パラメータについて最大値及び最小値を計算するステップと、
    前記視点変換パラメータのそれぞれを、前記最大値と最小値との間の範囲内に制限するステップと、
    前記少なくとも1つの文字の正面像を含む補正画像を得るために、前記視点変換行列に従って前記画像に対して視点変換を実行するステップと、
    前記画像に従って、前記少なくとも1つの文字の正面像を含む最適化された補正画像を生成するステップと、
    前記画像及び前記最適化された補正画像に対応する最適化視点変換行列を取得するステップと、
    前記最適化視点変換行列と前記ディープラーニングモデルによって生成される前記視点変換行列との間の損失値を計算するステップと、
    前記損失値を使用して前記ディープラーニングモデルを更新するステップと、を含む
    画像補正方法。
  2. 前記画像に従って、前記少なくとも1つの文字の正面像を含む前記最適化された補正画像を生成するステップは、前記少なくとも1つの文字をカバーするマーク範囲を含む前記画像にマークするステップを含む、
    請求項1に記載の画像補正方法。
  3. 前記マーク範囲が前記少なくとも1つの文字をカバーできない場合、拡張画像を得るために前記画像を拡張するステップと、
    前記マーク範囲が前記少なくとも1つの文字をカバーするように前記拡張画像をマーキクするステップを、更に含む
    請求項2に記載の画像補正方法。
  4. 前記撮影情報は、撮影場所、撮影方向及び撮影角度を含む
    請求項に記載の画像補正方法。
  5. ディープラーニングに基づく画像補正システムであって、
    少なくとも1つの文字を含む画像を撮像する撮像部と、
    前記画像を受け取り、前記画像に従って視点変換行列を生成するように構成されたディープラーニングモデルと、
    前記画像および前記視点変換行列を受信し、前記撮像部の撮影情報に応じて、前記視点変換行列の複数の視点変換パラメータについて最大値及び最小値を計算し、前記視点変換パラメータのそれぞれを前記最大値と最小値との間の範囲内に制限し、前記視点変換行列に従って前記画像に対して視点変換を実行し、前記少なくとも1つの文字の正面像を含む補正画像を取得するように構成された処理部と、
    前記画像を受信し、前記画像に従って少なくとも1つの文字の正面像を含む最適化された補正画像を生成し、前記画像および前記最適化された補正画像に対応する最適化された視点変換行列を取得し、前記最適化された視点変換行列と前記ディープラーニングモデルによって生成される前記視点変換行列との間の損失値を計算し、前記損失値を使用して前記ディープラーニングモデルを更新するように構成されたモデル調整部と、備える
    画像補正システム。
  6. 前記モデル調整部は、前記少なくとも1つの文字をカバーするマーク範囲を含む前記画像をさらにマークする、
    請求項に記載の画像補正システム。
  7. 前記マーク範囲が前記少なくとも1つの文字をカバーできない場合、前記モデル調整部は前記画像をさらに拡張して拡張画像を取得し、前記マーク範囲が前記少なくとも1つの文字をカバーするように前記拡張画像をマークする
    請求項に記載の画像補正システム。
  8. 前記撮影情報は、撮影場所、撮影方向及び撮影角度を含む
    請求項記載に記載の画像補正システム。
JP2020211742A 2020-08-26 2020-12-21 ディープラーニングに基づく画像補正方法及びシステム Active JP7163356B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW109129193A TWI790471B (zh) 2020-08-26 2020-08-26 基於深度學習的影像校正方法及系統
TW109129193 2020-08-26

Publications (2)

Publication Number Publication Date
JP2022039895A JP2022039895A (ja) 2022-03-10
JP7163356B2 true JP7163356B2 (ja) 2022-10-31

Family

ID=80221137

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020211742A Active JP7163356B2 (ja) 2020-08-26 2020-12-21 ディープラーニングに基づく画像補正方法及びシステム

Country Status (7)

Country Link
US (1) US20220067881A1 (ja)
JP (1) JP7163356B2 (ja)
CN (1) CN114119379A (ja)
DE (1) DE102020134888A1 (ja)
IL (1) IL279443A (ja)
NO (1) NO20210058A1 (ja)
TW (1) TWI790471B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11908100B2 (en) * 2021-03-15 2024-02-20 Qualcomm Incorporated Transform matrix learning for multi-sensor image capture devices
CN115409736B (zh) * 2022-09-16 2023-06-20 深圳市宝润科技有限公司 医用数字x射线摄影系统的几何校正方法及相关设备
WO2024130515A1 (en) * 2022-12-19 2024-06-27 Maplebear Inc. Subregion transformation for label decoding by an automated checkout system

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111223065A (zh) 2020-01-13 2020-06-02 中国科学院重庆绿色智能技术研究院 图像矫正方法、不规则文本识别方法、装置、存储介质和设备

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2135240A1 (en) * 1993-12-01 1995-06-02 James F. Frazier Automated license plate locator and reader
CN101398894B (zh) * 2008-06-17 2011-12-07 浙江师范大学 机动车车牌自动识别方法及其实现装置
CA2747337C (en) * 2008-12-17 2017-09-26 Thomas D. Winkler Multiple object speed tracking system
US9317764B2 (en) * 2012-12-13 2016-04-19 Qualcomm Incorporated Text image quality based feedback for improving OCR
US9785855B2 (en) * 2015-12-17 2017-10-10 Conduent Business Services, Llc Coarse-to-fine cascade adaptations for license plate recognition with convolutional neural networks
CN107169489B (zh) * 2017-05-08 2020-03-31 北京京东金融科技控股有限公司 倾斜图像校正的方法和装置
US10810465B2 (en) * 2017-06-30 2020-10-20 Datalogic Usa, Inc. Systems and methods for robust industrial optical character recognition
CN108229470B (zh) * 2017-12-22 2022-04-01 北京市商汤科技开发有限公司 文字图像处理方法、装置、设备及存储介质
CN108229474B (zh) * 2017-12-29 2019-10-01 北京旷视科技有限公司 车牌识别方法、装置及电子设备
CN113302915A (zh) * 2019-01-14 2021-08-24 杜比实验室特许公司 在视频会议中共享物理书写表面
US20200388068A1 (en) * 2019-06-10 2020-12-10 Fai Yeung System and apparatus for user controlled virtual camera for volumetric video
US11544916B2 (en) * 2019-11-13 2023-01-03 Battelle Energy Alliance, Llc Automated gauge reading and related systems, methods, and devices

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111223065A (zh) 2020-01-13 2020-06-02 中国科学院重庆绿色智能技术研究院 图像矫正方法、不规则文本识别方法、装置、存储介质和设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
鈴木 まり 他,高環境耐性なCNN回帰モデルのメモリ削減検討,2019年度人工知能学会全国大会(第33回) [online],日本,一般社団法人人工知能学会,2019年06月04日,pp.1-4

Also Published As

Publication number Publication date
DE102020134888A1 (de) 2022-03-03
IL279443A (en) 2022-03-01
TWI790471B (zh) 2023-01-21
NO20210058A1 (en) 2022-02-28
CN114119379A (zh) 2022-03-01
TW202209175A (zh) 2022-03-01
JP2022039895A (ja) 2022-03-10
US20220067881A1 (en) 2022-03-03

Similar Documents

Publication Publication Date Title
JP7163356B2 (ja) ディープラーニングに基づく画像補正方法及びシステム
WO2020151212A1 (zh) 车载相机系统相机外参的标定方法及标定系统
CN109903331B (zh) 一种基于rgb-d相机的卷积神经网络目标检测方法
US8811744B2 (en) Method for determining frontal face pose
JP6688277B2 (ja) プログラム、学習処理方法、学習モデル、データ構造、学習装置、および物体認識装置
JP2006252473A (ja) 障害物検出装置、キャリブレーション装置、キャリブレーション方法およびキャリブレーションプログラム
US7903840B2 (en) Image processing method, image processing apparatus, image processing program and program recording medium
CN109074499B (zh) 用于对象重识别的方法和系统
US11030488B1 (en) Book scanning using machine-trained model
JP2020161129A5 (ja)
CN111508025A (zh) 三维位置估计装置以及程序
CN108550167B (zh) 深度图像生成方法、装置及电子设备
CN110443245A (zh) 一种非限制场景下的车牌区域的定位方法、装置及设备
KR20230043668A (ko) 딥러닝 네트워크 기반의 파노라마 영상 생성 방법 및 장치
CN112749664A (zh) 一种手势识别方法、装置、设备、系统及存储介质
US11145037B1 (en) Book scanning using machine-trained model
CN110288633B (zh) 目标追踪方法、装置、可读存储介质及电子设备
KR20210007234A (ko) 이미지 보정 방법 및 이미지 보정 시스템
JPH11190611A (ja) 3次元計測方法およびその方法を用いた3次元計測処理装置
CN110569865A (zh) 识别车体方向的方法和装置
JP7296799B2 (ja) 領域分割装置、領域分割方法、及び領域分割プログラム
CN112053406B (zh) 成像装置参数标定方法、装置及电子设备
CN117812466B (zh) 一种大场景双机联动相机校准方法、设备及系统
WO2022113349A1 (ja) 骨格認識装置、学習方法および学習プログラム
CN113344830B (zh) 基于多张单通道温度图片的融合方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220111

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220408

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220603

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221019

R150 Certificate of patent or registration of utility model

Ref document number: 7163356

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150