TWI790471B - 基於深度學習的影像校正方法及系統 - Google Patents

基於深度學習的影像校正方法及系統 Download PDF

Info

Publication number
TWI790471B
TWI790471B TW109129193A TW109129193A TWI790471B TW I790471 B TWI790471 B TW I790471B TW 109129193 A TW109129193 A TW 109129193A TW 109129193 A TW109129193 A TW 109129193A TW I790471 B TWI790471 B TW I790471B
Authority
TW
Taiwan
Prior art keywords
image
perspective transformation
character
transformation matrix
deep learning
Prior art date
Application number
TW109129193A
Other languages
English (en)
Other versions
TW202209175A (zh
Inventor
李冠德
黃名嘉
林宏軒
李宇哲
羅佳玲
Original Assignee
財團法人工業技術研究院
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 財團法人工業技術研究院 filed Critical 財團法人工業技術研究院
Priority to TW109129193A priority Critical patent/TWI790471B/zh
Priority to CN202011241410.7A priority patent/CN114119379A/zh
Priority to US17/104,781 priority patent/US20220067881A1/en
Priority to IL279443A priority patent/IL279443A/en
Priority to JP2020211742A priority patent/JP7163356B2/ja
Priority to DE102020134888.6A priority patent/DE102020134888A1/de
Priority to NO20210058A priority patent/NO20210058A1/en
Publication of TW202209175A publication Critical patent/TW202209175A/zh
Application granted granted Critical
Publication of TWI790471B publication Critical patent/TWI790471B/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/625License plates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/80Geometric correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/60Rotation of whole images or parts thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/54Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1463Orientation detection or correction, e.g. rotation of multiples of 90 degrees
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30204Marker
    • G06T2207/30208Marker matrix
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2628Alteration of picture size, shape, position or orientation, e.g. zooming, rotation, rolling, perspective, translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)

Abstract

一種基於深度學習的影像校正方法及系統。影像校正方法包括以下步驟。透過一深度學習模型接收具有至少一字元之一影像,並根據影像產生一透視變換矩陣。根據透視變換矩陣對影像執行一透視變換,以獲得包含此至少一字元之正面視角之一校正影像。根據影像產生包含此至少一字元之正面視角之一最佳校正影像。獲得對應影像與最佳校正影像之一最佳透視變換矩陣。計算最佳透視變換矩陣與透視變換矩陣之間之一損失值。使用損失值更新深度學習模型。

Description

基於深度學習的影像校正方法及系統
本發明是有關於一種影像校正方法及系統,且特別是有關於一種基於深度學習的影像校正方法及系統。
在影像辨識領域中,特別是影像中的字元辨識,通常需要在影像中先找出具有字元的區域影像,並將此區域影像校正成正面視角的影像,以便後續的辨識模型進行字元辨識。影像校正程序可將各種不同視角、距離的影像,轉成同一角度與距離之正面視角的影像,此程序可加快辨識模型的學習以及提高辨識正確率。
然而,在目前的技術中,影像校正程序仍需依靠傳統影像處理方法,以人工找出旋轉參數,並反覆調整參數才可提升影像校正程序的正確率。此外,影像校正程序也可由人工智慧(AI)執行,但是僅能找出順時針/逆時針旋轉角度,無法適用於複雜的影像縮放、位移、傾斜等。
因此,如何有效率地並正確地將各種影像校正成正面視角的影像,已成為產業界致力研究的一項目標。
本發明係有關於一種基於深度學習的影像校正方法及系統,其利用深度學習模型找出影像校正程序中的透視變換參數以有效率地將各種影像校正成正面視角的影像,並透過損失值更新深度學習模型以提高正確率。
根據本發明之一實施例,提出一種基於深度學習的影像校正方法。影像校正方法包括以下步驟。透過一深度學習模型接收具有至少一字元之一影像,並根據影像產生一透視變換矩陣。根據透視變換矩陣對影像執行一透視變換,以獲得包含此至少一字元之正面視角之一校正影像。根據影像產生包含此至少一字元之正面視角之一最佳校正影像。獲得對應影像與最佳校正影像之一最佳透視變換矩陣。計算最佳透視變換矩陣與透視變換矩陣之間之一損失值。使用損失值更新深度學習模型。
根據本發明之另一實施例,提出一種基於深度學習的影像校正系統。影像校正系統包括一深度學習模型、一處理單元及一模型調整單元。深度學習模型用以接收具有至少一字元之一影像,並根據影像產生一透視變換矩陣。處理單元用以接收影像及透視變換矩陣,並根據透視變換矩陣對影像執行一透視變換,以獲得包含此至少一字元之正面視角之一校正影像。模型訓練單元用以接收影像、根據影像產生包含此至少一字元之正面視角之一最佳校正影像、獲得對應影像與最佳校正影像之一最佳透視變換矩陣、計算最佳透視變換矩陣與透視變換矩陣之間之一損失值、並使用損失值更新深度學習模型。
為了對本發明之上述及其他方面有更佳的瞭解,下文特舉實施例,並配合所附圖式詳細說明如下:
100,1100:影像校正系統
110,1110:深度學習模型
120,1120:處理單元
130,1130:模型調整單元
1140:影像擷取單元
IMG1,IMG3,IMG5:影像
IMG2,IMG6:校正影像
IMG4:延伸影像
L,L’:損失值
T,T’:透視變換矩陣
S110,S120,S130,S131,S132,S133,S134,S135,S1110,S1120,S1130,S1140,S1150:步驟
A,B,C,D,A’,B’,C’,D’:標記點
R,R’:標記範圍
BLK:空白影像
SI:拍攝資訊
第1圖繪示根據本發明一實施例之基於深度學習的影像校正系統的示意圖;第2圖繪示根據本發明一實施例之基於深度學習的影像校正方法的流程圖;第3圖繪示根據本發明一實施例之具有車牌之影像的示意圖;第4圖繪示根據本發明另一實施例之具有路標之影像的示意圖;第5圖繪示根據本發明一實施例之校正影像的示意圖;第6圖繪示根據本發明一實施例之步驟S130的子步驟的流程圖;第7圖繪示根據本發明一實施例之影像上之標記的示意圖;第8圖繪示根據本發明一實施例之影像及延伸影像的示意圖;第9圖繪示根據本發明一實施例之最佳校正影像之示意圖;第10圖繪示根據本發明一實施例之基於深度學習的影像校正系統的示意圖;及第11圖繪示根據本發明另一實施例之基於深度學習的影像校正方法的流程圖。
請參照第1圖,其繪示根據本發明一實施例之基於深度學習的影像校正系統100的示意圖。影像校正系統100包括一深度學習模型110、一處理單元120及一模型調整單元130。深度學習模型110例如是卷積神經網路模型(CNN)。處理單元120及模型調整單元130例如是一晶片、一電路板或一電路。
請同時參照第1及2圖。第2圖繪示根據本發明一實施例之基於深度學習的影像校正方法的流程圖。
步驟S110,透過深度學習模型110接收具有至少一字元之影像IMG1,並根據影像IMG1產生透視變換矩陣T。影像IMG1可為包含一車牌、一路標、一序號或一招牌等任何具有至少一字元之影像。字元例如包括數字、英文字、橫槓、標點符號或上述之組合。請參照第3及4圖。第3圖繪示根據本發明一實施例之具有車牌之影像IMG1的示意圖。在第3圖中,影像IMG1具有字元「ABC-5555」。第4圖繪示根據本發明另一實施例之具有路標之影像IMG1的示意圖。在第4圖中,影像IMG1中具有字元「WuXing St.」。深度學習模型110為已預先訓練之模型,可以影像IMG1作為深度學習模型110的輸入,接著深度學習模型110輸出對應影像IMG1之透視變換矩陣T。透視變換矩陣T包含多個透視變換參數T11、T12、T13、T21、T22、T23、T31、T32以及1,如式一所示。
Figure 109129193-A0305-02-0006-1
步驟S120,處理單元120根據透視變換矩陣T對影像IMG1執行一透視變換,以獲得包含此至少一字元之正面視角之校正影像IMG2。處理單元120根據透視變換矩陣T對影像IMG1執行透視變換,以將影像IMG1轉換成包含此至少一字元之正面視角之校正影像IMG2。請參照第5圖,其繪示根據本發明一實施例之校正影像IMG2的示意圖。以第3圖之具有車牌之影像IMG1為例,根據透視變換矩陣T對影像IMG1執行透視變換之後,可獲得如第5圖所示之校正影像IMG2。
步驟S130,模型調整單元130使用損失值L更新深度學習模型110。請參照第6圖,其繪示根據本發明一實施例之步驟S130的子步驟的流程圖。步驟S130包括步驟S131至S135。
步驟S131,模型調整單元130標記影像IMG1,此標記具有涵蓋字元之一標記範圍。請參照第7圖,其繪示根據本發明一實施例之影像IMG1上之標記的示意圖。影像IMG1上之標記包括標記點A、B、C及D,且標記點A、B、C及D可形成標記範圍R涵蓋字元。在此實施例中,影像IMG1為具有車牌之影像,標記點A、B、C及D可位於車牌的四個角落,且標記範圍R為一四邊形。在另一實施例中,若影像IMG1為如第4圖所示之具有路標之影像,標記點A、B、C及D可位於路標的四個角落,且標記範圍為一四邊形。在另一實施例中,若影像IMG1中的字元並非位於如車牌、路標等幾何圖形的物件上時,則模型調整單元130只需使標記範圍涵蓋字元即可。在另一實施例中,模型調整單元130也可直接接收已標記之影像,而不執行標記。
請參照第8圖,其繪示根據本發明一實施例之影像IMG3及延伸影像IMG4的示意圖。在一實施例中,當無法透過標記範圍涵蓋影像IMG3中的字元時,或是當影像IMG3中的字元部分超出影像IMG3時,模型調整單元130延伸影像IMG3以獲得延伸影像IMG4,並標記延伸影像IMG4,使標記範圍R’涵蓋字元。在此實施例中,模型調整單元130係增加空白影像BLK至影像IMG3以獲得延伸影像IMG4。
請再次參照第7圖。接著,步驟S132,模型調整單元130根據影像IMG1產生包含字元之正面視角之最佳校正影像。在此實施例中,模型調整單元130將影像IMG1上位於標記點A、B、C及D之像素分別對齊至影像之四個角落;而後,對於影像IMG1執行透視變換以得到具有正面視角的校正影像IMG2,而後再獲得最佳校正影像。請參照第9圖,其繪示根據本發明一實施例之最佳校正影像之示意圖。如第9圖所示,最佳校正影像具有字元之正面視角。
步驟S133,模型調整單元130獲得對應影像IMG1與最佳校正影像之一最佳透視變換矩陣。由於影像IMG1與最佳校正影像之間具有透視變換的關係,因此模型調整單元130可由影像IMG1與最佳校正影像推算一透視變換矩陣作為最佳透視變換矩陣。
步驟S134,模型調整單元130計算最佳透視變換矩陣與透視變換矩陣T之間之一損失值L。接著,步驟S135,模型調整單元130使用損失值L更新深度學習模型110。如第5圖所示,由於根據透視變換矩陣T對影像IMG1執行透視變換所獲得之校正影像IMG2未達到一 最佳結果,因此可透過模型調整單元130使用損失值L對深度學習模型110進行更新。
如此一來,本案所揭露之深度學習的影像校正系統100及方法,可利用深度學習模型找出影像校正程序中的透視變換參數以有效率地將各種影像校正成正面視角的影像,並透過損失值更新深度學習模型以提高正確率。
請參考第10圖,其繪示根據本發明一實施例之基於深度學習的影像校正系統1100的示意圖。影像校正系統1100與影像校正系統100不同的是更包括一影像擷取單元1140。影像擷取單元1140例如是一相機。請同時參照第10及11圖。第11圖繪示根據本發明另一實施例之基於深度學習的影像校正方法的流程圖。
步驟S1110,透過影像擷取單元1140拍攝具有至少一字元之影像IMG5。
步驟S1120,透過深度學習模型1110接收影像IMG5,並根據影像IMG5產生透視變換矩陣T’。步驟S1120類似於第2圖之步驟S110,在此不多贅述。
步驟S1130,透過深度學習模型1110接收拍攝資訊SI,並依據拍攝資訊SI限縮透視變換矩陣T’之複數個透視變換參數。拍攝資訊SI為一拍攝位置、一拍攝方向及一拍攝角度。拍攝位置、拍攝方向及拍攝角度可分別由3個參數、2個參數及1個參數表示。透視變換矩陣T’包含多個透視變換參數T’11、T’12、T’13、T’21、T’22、T’23、T’31、T’32以及1,如式二所示。其中透視變換參數T’11、T’12、T’13、T’21、 T’22、T’23、T’31、T’32可由拍攝位置、拍攝方向及拍攝角度的6個參數所決定。
Figure 109129193-A0305-02-0010-2
首先,深度學習模型1110給定拍攝位置、拍攝方向及拍攝角度的6個參數的合理範圍,並以網格搜尋演算法計算透視變換參數T’mn,並得到T’mn的最大值Lmn及最小值Smn。接著,深度學習模型1110透過式三計算每個透視變換參數T’mn
T’mn=Smn+(Lmn-Smn)σ(Zmn) (式三)其中Zmn為無範圍限制的數值,以及σ為值域介於0到1的邏輯函數。如此,深度學習模型1110可確保透視變換參數T’11、T’12、T’13、T’21、T’22、T’23、T’31、T’32落於合理範圍。
步驟S1140,處理單元1120根據透視變換矩陣T’對影像IMG5執行一透視變換,以獲得包含此至少一字元之正面視角之校正影像IMG6。步驟S1140類似於第2圖之步驟S120,在此不多贅述。
步驟S1150,使用損失值L’更新深度學習模型1110。步驟S1150類似於第2圖之步驟S130,在此不多贅述。
如此一來,本案所揭露之深度學習的影像校正系統1100及方法,可利用拍攝資訊SI限縮透視變換參數的範圍,以提高深度學習模型1110的正確率,以及使深度學習模型1110更易於訓練。
綜上所述,雖然本發明已以實施例揭露如上,然其並非用以限定本發明。本發明所屬技術領域中具有通常知識者,在不脫離 本發明之精神和範圍內,當可作各種之更動與潤飾。因此,本發明之保護範圍當視後附之申請專利範圍所界定者為準。
S110,S120,S130:步驟

Claims (8)

  1. 一種基於深度學習的影像校正方法,包括:透過一深度學習模型接收具有至少一字元之一影像,並根據該影像產生一透視變換矩陣;透過一處理單元根據該透視變換矩陣對該影像執行一透視變換,以獲得包含該至少一字元之正面視角之一校正影像;透過一模型調整單元根據該影像產生包含該至少一字元之正面視角之一最佳校正影像;當一標記範圍無法涵蓋該至少一字元時,透過該模型調整單元增加一空白影像至該影像以獲得一延伸影像;透過該模型調整單元標記該延伸影像,使該標記範圍涵蓋該至少一字元;透過該模型調整單元獲得對應該影像與該最佳校正影像之一最佳透視變換矩陣;透過該模型調整單元計算該最佳透視變換矩陣與該透視變換矩陣之間之一損失值;以及透過該模型調整單元使用該損失值更新該深度學習模型。
  2. 如請求項1所述之影像校正方法,其中在根據該影像產生包含該至少一字元之正面視角之該最佳校正影像的步驟中包括: 透過該模型調整單元標記該影像,該標記具有涵蓋該至少一字元之一標記範圍。
  3. 如請求項1所述之影像校正方法,其中更包括:透過一影像擷取單元擷取該影像;以及透過該處理單元根據該影像擷取單元之一拍攝資訊限縮該透視變換矩陣之複數個透視變換參數。
  4. 如請求項3所述之影像校正方法,其中該拍攝資訊包括一拍攝位置、一拍攝方向及一拍攝角度。
  5. 一種基於深度學習的影像校正系統,包括:一深度學習模型,用於執行以下動作:接收具有至少一字元之一影像,並根據該影像產生一透視變換矩陣;一處理單元,用於執行以下動作:接收該影像及該透視變換矩陣,並根據該透視變換矩陣對該影像執行一透視變換,以獲得包含該至少一字元之正面視角之一校正影像;以及一模型調整單元,用於執行以下動作:接收該影像,並根據該影像產生包含該至少一字元之正面視角之一最佳校正影像; 當一標記範圍無法涵蓋該至少一字元時,增加一空白影像至該影像以獲得一延伸影像;標記該延伸影像,使該標記範圍涵蓋該至少一字元;獲得對應該影像與該最佳校正影像之一最佳透視變換矩陣;計算該最佳透視變換矩陣與該透視變換矩陣之間之一損失值;以及使用該損失值更新該深度學習模型。
  6. 如請求項5所述之影像校正系統,其中該模型調整單元更標記該影像,該標記具有涵蓋該至少一字元之一標記範圍。
  7. 如請求項5所述之影像校正系統,其中更包括:一影像擷取單元,用以擷取該影像;其中該處理單元根據該影像擷取單元之一拍攝資訊限縮該透視變換矩陣之複數個透視變換參數。
  8. 如請求項7所述之影像校正系統,其中該拍攝資訊包括一拍攝位置、一拍攝方向及一拍攝角度。
TW109129193A 2020-08-26 2020-08-26 基於深度學習的影像校正方法及系統 TWI790471B (zh)

Priority Applications (7)

Application Number Priority Date Filing Date Title
TW109129193A TWI790471B (zh) 2020-08-26 2020-08-26 基於深度學習的影像校正方法及系統
CN202011241410.7A CN114119379A (zh) 2020-08-26 2020-11-09 基于深度学习的图像校正方法及系统
US17/104,781 US20220067881A1 (en) 2020-08-26 2020-11-25 Image correction method and system based on deep learning
IL279443A IL279443A (en) 2020-08-26 2020-12-14 A deep learning based method and system for image correction
JP2020211742A JP7163356B2 (ja) 2020-08-26 2020-12-21 ディープラーニングに基づく画像補正方法及びシステム
DE102020134888.6A DE102020134888A1 (de) 2020-08-26 2020-12-23 Bildkorrekturverfahren und system basierend auf deep learning
NO20210058A NO20210058A1 (en) 2020-08-26 2021-01-19 Image correction method and system based on deep learning

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW109129193A TWI790471B (zh) 2020-08-26 2020-08-26 基於深度學習的影像校正方法及系統

Publications (2)

Publication Number Publication Date
TW202209175A TW202209175A (zh) 2022-03-01
TWI790471B true TWI790471B (zh) 2023-01-21

Family

ID=80221137

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109129193A TWI790471B (zh) 2020-08-26 2020-08-26 基於深度學習的影像校正方法及系統

Country Status (7)

Country Link
US (1) US20220067881A1 (zh)
JP (1) JP7163356B2 (zh)
CN (1) CN114119379A (zh)
DE (1) DE102020134888A1 (zh)
IL (1) IL279443A (zh)
NO (1) NO20210058A1 (zh)
TW (1) TWI790471B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11908100B2 (en) * 2021-03-15 2024-02-20 Qualcomm Incorporated Transform matrix learning for multi-sensor image capture devices
CN115409736B (zh) * 2022-09-16 2023-06-20 深圳市宝润科技有限公司 医用数字x射线摄影系统的几何校正方法及相关设备
WO2024130515A1 (en) 2022-12-19 2024-06-27 Maplebear Inc. Subregion transformation for label decoding by an automated checkout system

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101398894A (zh) * 2008-06-17 2009-04-01 浙江师范大学 机动车车牌自动识别方法及其实现装置
CN107169489A (zh) * 2017-05-08 2017-09-15 北京京东金融科技控股有限公司 倾斜图像校正的方法和装置
CN108229474A (zh) * 2017-12-29 2018-06-29 北京旷视科技有限公司 车牌识别方法、装置及电子设备

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2135240A1 (en) * 1993-12-01 1995-06-02 James F. Frazier Automated license plate locator and reader
CA2747337C (en) * 2008-12-17 2017-09-26 Thomas D. Winkler Multiple object speed tracking system
US9317764B2 (en) * 2012-12-13 2016-04-19 Qualcomm Incorporated Text image quality based feedback for improving OCR
US9785855B2 (en) * 2015-12-17 2017-10-10 Conduent Business Services, Llc Coarse-to-fine cascade adaptations for license plate recognition with convolutional neural networks
US10810465B2 (en) * 2017-06-30 2020-10-20 Datalogic Usa, Inc. Systems and methods for robust industrial optical character recognition
CN108229470B (zh) * 2017-12-22 2022-04-01 北京市商汤科技开发有限公司 文字图像处理方法、装置、设备及存储介质
US11695812B2 (en) * 2019-01-14 2023-07-04 Dolby Laboratories Licensing Corporation Sharing physical writing surfaces in videoconferencing
US20200388068A1 (en) * 2019-06-10 2020-12-10 Fai Yeung System and apparatus for user controlled virtual camera for volumetric video
US11544916B2 (en) * 2019-11-13 2023-01-03 Battelle Energy Alliance, Llc Automated gauge reading and related systems, methods, and devices
CN111223065B (zh) * 2020-01-13 2023-08-01 中国科学院重庆绿色智能技术研究院 图像矫正方法、不规则文本识别方法、装置、存储介质和设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101398894A (zh) * 2008-06-17 2009-04-01 浙江师范大学 机动车车牌自动识别方法及其实现装置
CN107169489A (zh) * 2017-05-08 2017-09-15 北京京东金融科技控股有限公司 倾斜图像校正的方法和装置
CN108229474A (zh) * 2017-12-29 2018-06-29 北京旷视科技有限公司 车牌识别方法、装置及电子设备

Also Published As

Publication number Publication date
DE102020134888A1 (de) 2022-03-03
IL279443A (en) 2022-03-01
TW202209175A (zh) 2022-03-01
US20220067881A1 (en) 2022-03-03
CN114119379A (zh) 2022-03-01
NO20210058A1 (en) 2022-02-28
JP2022039895A (ja) 2022-03-10
JP7163356B2 (ja) 2022-10-31

Similar Documents

Publication Publication Date Title
TWI790471B (zh) 基於深度學習的影像校正方法及系統
US8811744B2 (en) Method for determining frontal face pose
CN109903331B (zh) 一种基于rgb-d相机的卷积神经网络目标检测方法
JP2018506788A (ja) 物体の再同定の方法
US8340433B2 (en) Image processing apparatus, electronic medium, and image processing method
CN111784747A (zh) 一种基于关键点检测和校正的车辆多目标跟踪系统及方法
CN108197567B (zh) 用于图像处理的方法、装置和计算机可读介质
CN108846855A (zh) 目标跟踪方法及设备
CN113763569A (zh) 一种在三维仿真中使用的图像标注方法及装置、电子设备
CN115147488B (zh) 一种基于密集预测的工件位姿估计方法与抓取系统
CN116030519A (zh) 一种直播教学平台的学习注意力检测与评估方法
CN103218820A (zh) 一种基于多维特征的相机标定误差补偿方法
JP7151742B2 (ja) 画像変換装置、画像変換方法及び画像変換用コンピュータプログラム
JP5080416B2 (ja) 入力画像から検出対象物の像を検出する画像処理装置
CN111145221A (zh) 一种基于多层深度特征提取的目标跟踪算法
CN113486879B (zh) 图像区域建议框检测方法、装置、设备及存储介质
CN111444777A (zh) 一种同时标记阴影的前视声呐目标检测标记方法
CN112784843A (zh) 产生一物件侦测模型的计算装置及方法及物件侦测装置
CN112950621B (zh) 图像处理方法、装置、设备及介质
JP4639044B2 (ja) 輪郭形状抽出装置
CN106611161B (zh) 一种交通标志包围盒的优化方法
CN113506332B (zh) 目标对象识别的方法、电子设备及存储介质
CN111047604B (zh) 一种高清图像的透明度遮罩提取方法、装置及存储介质
TWI807935B (zh) 深度識別模型訓練方法、圖像深度識別方法及相關設備
CN115376119B (zh) 一种车牌识别方法、装置、车牌识别设备及存储介质