JP7163356B2 - ディープラーニングに基づく画像補正方法及びシステム - Google Patents
ディープラーニングに基づく画像補正方法及びシステム Download PDFInfo
- Publication number
- JP7163356B2 JP7163356B2 JP2020211742A JP2020211742A JP7163356B2 JP 7163356 B2 JP7163356 B2 JP 7163356B2 JP 2020211742 A JP2020211742 A JP 2020211742A JP 2020211742 A JP2020211742 A JP 2020211742A JP 7163356 B2 JP7163356 B2 JP 7163356B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- viewpoint transformation
- character
- deep learning
- transformation matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003702 image correction Methods 0.000 title claims description 36
- 238000000034 method Methods 0.000 title claims description 23
- 238000013135 deep learning Methods 0.000 title claims description 18
- 230000009466 transformation Effects 0.000 claims description 63
- 239000011159 matrix material Substances 0.000 claims description 40
- 238000013136 deep learning model Methods 0.000 claims description 30
- 238000003384 imaging method Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 230000000916 dilatatory effect Effects 0.000 claims 1
- 101150013335 img1 gene Proteins 0.000 description 27
- 238000010586 diagram Methods 0.000 description 10
- 101150071665 img2 gene Proteins 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 240000001973 Ficus microcarpa Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/625—License plates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/60—Rotation of whole images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/80—Geometric correction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/54—Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1463—Orientation detection or correction, e.g. rotation of multiples of 90 degrees
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/80—Camera processing pipelines; Components thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30204—Marker
- G06T2207/30208—Marker matrix
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/2628—Alteration of picture size, shape, position or orientation, e.g. zooming, rotation, rolling, perspective, translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Character Input (AREA)
Description
図1を参照すると、本開示の一実施形態によるディープラーニングに基づく画像補正システム100の概略図が示されている。画像補正システム100は、ディープラーニングモデル110と、処理部120と、モデル調整部130とを備えている。ディープラーニングモデル110は、CNN(convolutional neural network)モデルによって実現することができる。処理部120及びモデル調整部130は、チップ、回路基板又は回路によって実現することができる。
ステップS120において、視点変換行列Tに従って、処理部120によって画像IMG1に対して視点変換が実行され、少なくとも1つの文字の正面像を含む補正画像IMG2が得られる。処理部120は視点変換行列Tに従って画像IMG1に対して視点変換を実行し、画像IMG1を、少なくとも1つの文字の正面像を含む補正画像IMG2に変換する。図5を参照すると、本開示の一実施形態による補正画像IMG2の概略図が示されている。例えば、図3の画像IMG1を例に取る。画像IMG1は車両プレートを含む。視点変換行列Tに従って画像IMG1に対して視点変換を行った後、図5に示すような補正画像IMG2を得ることができる。
まず、ディープラーニングモデル1110は撮影位置、撮影方向、撮影角度の6つのパラメータのそれぞれに合理的な範囲を割り当て、グリッドサーチアルゴリズム(grid search algorithm)を用いて視点変換パラメータT’mnを計算し、視点変換パラメータT’mnの最大値Lmn及び最小値Smnを得る。そして、ディープラーニングモデル1110は、式3に従って、それぞれの視点変換パラメータT’mnを算出する。
式3で、Zmnは制限を受けない値であり、σは0~1の範囲の論理関数である。したがって、ディープラーニングモデル1110は、視点変換パラメータT’11、T’12、T’13、T’21、T’22、T’23、T’31、T’32 の各々が合理的な範囲内に収まることを保証することができる。
Claims (8)
- ディープラーニングに基づく画像補正方法であって、
撮像部によって、少なくとも1つの文字を含む画像を撮像するステップと、
ディープラーニングモデルによって前記画像を受け取り、前記画像に従って視点変換行列を生成するステップと、
前記撮像部の撮影情報に応じて、前記視点変換行列の複数の視点変換パラメータについて最大値及び最小値を計算するステップと、
前記視点変換パラメータのそれぞれを、前記最大値と最小値との間の範囲内に制限するステップと、
前記少なくとも1つの文字の正面像を含む補正画像を得るために、前記視点変換行列に従って前記画像に対して視点変換を実行するステップと、
前記画像に従って、前記少なくとも1つの文字の正面像を含む最適化された補正画像を生成するステップと、
前記画像及び前記最適化された補正画像に対応する最適化視点変換行列を取得するステップと、
前記最適化視点変換行列と前記ディープラーニングモデルによって生成される前記視点変換行列との間の損失値を計算するステップと、
前記損失値を使用して前記ディープラーニングモデルを更新するステップと、を含む
画像補正方法。 - 前記画像に従って、前記少なくとも1つの文字の正面像を含む前記最適化された補正画像を生成するステップは、前記少なくとも1つの文字をカバーするマーク範囲を含む前記画像にマークするステップを含む、
請求項1に記載の画像補正方法。 - 前記マーク範囲が前記少なくとも1つの文字をカバーできない場合、拡張画像を得るために前記画像を拡張するステップと、
前記マーク範囲が前記少なくとも1つの文字をカバーするように前記拡張画像をマーキクするステップを、更に含む
請求項2に記載の画像補正方法。 - 前記撮影情報は、撮影場所、撮影方向及び撮影角度を含む
請求項1に記載の画像補正方法。 - ディープラーニングに基づく画像補正システムであって、
少なくとも1つの文字を含む画像を撮像する撮像部と、
前記画像を受け取り、前記画像に従って視点変換行列を生成するように構成されたディープラーニングモデルと、
前記画像および前記視点変換行列を受信し、前記撮像部の撮影情報に応じて、前記視点変換行列の複数の視点変換パラメータについて最大値及び最小値を計算し、前記視点変換パラメータのそれぞれを前記最大値と最小値との間の範囲内に制限し、前記視点変換行列に従って前記画像に対して視点変換を実行し、前記少なくとも1つの文字の正面像を含む補正画像を取得するように構成された処理部と、
前記画像を受信し、前記画像に従って少なくとも1つの文字の正面像を含む最適化された補正画像を生成し、前記画像および前記最適化された補正画像に対応する最適化された視点変換行列を取得し、前記最適化された視点変換行列と前記ディープラーニングモデルによって生成される前記視点変換行列との間の損失値を計算し、前記損失値を使用して前記ディープラーニングモデルを更新するように構成されたモデル調整部と、備える
画像補正システム。 - 前記モデル調整部は、前記少なくとも1つの文字をカバーするマーク範囲を含む前記画像をさらにマークする、
請求項5に記載の画像補正システム。 - 前記マーク範囲が前記少なくとも1つの文字をカバーできない場合、前記モデル調整部は前記画像をさらに拡張して拡張画像を取得し、前記マーク範囲が前記少なくとも1つの文字をカバーするように前記拡張画像をマークする
請求項6に記載の画像補正システム。 - 前記撮影情報は、撮影場所、撮影方向及び撮影角度を含む
請求項5記載に記載の画像補正システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109129193A TWI790471B (zh) | 2020-08-26 | 2020-08-26 | 基於深度學習的影像校正方法及系統 |
TW109129193 | 2020-08-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022039895A JP2022039895A (ja) | 2022-03-10 |
JP7163356B2 true JP7163356B2 (ja) | 2022-10-31 |
Family
ID=80221137
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020211742A Active JP7163356B2 (ja) | 2020-08-26 | 2020-12-21 | ディープラーニングに基づく画像補正方法及びシステム |
Country Status (7)
Country | Link |
---|---|
US (1) | US20220067881A1 (ja) |
JP (1) | JP7163356B2 (ja) |
CN (1) | CN114119379A (ja) |
DE (1) | DE102020134888A1 (ja) |
IL (1) | IL279443A (ja) |
NO (1) | NO20210058A1 (ja) |
TW (1) | TWI790471B (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11908100B2 (en) * | 2021-03-15 | 2024-02-20 | Qualcomm Incorporated | Transform matrix learning for multi-sensor image capture devices |
CN115409736B (zh) * | 2022-09-16 | 2023-06-20 | 深圳市宝润科技有限公司 | 医用数字x射线摄影系统的几何校正方法及相关设备 |
WO2024130515A1 (en) * | 2022-12-19 | 2024-06-27 | Maplebear Inc. | Subregion transformation for label decoding by an automated checkout system |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111223065A (zh) | 2020-01-13 | 2020-06-02 | 中国科学院重庆绿色智能技术研究院 | 图像矫正方法、不规则文本识别方法、装置、存储介质和设备 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2135240A1 (en) * | 1993-12-01 | 1995-06-02 | James F. Frazier | Automated license plate locator and reader |
CN101398894B (zh) * | 2008-06-17 | 2011-12-07 | 浙江师范大学 | 机动车车牌自动识别方法及其实现装置 |
CA2747337C (en) * | 2008-12-17 | 2017-09-26 | Thomas D. Winkler | Multiple object speed tracking system |
US9317764B2 (en) * | 2012-12-13 | 2016-04-19 | Qualcomm Incorporated | Text image quality based feedback for improving OCR |
US9785855B2 (en) * | 2015-12-17 | 2017-10-10 | Conduent Business Services, Llc | Coarse-to-fine cascade adaptations for license plate recognition with convolutional neural networks |
CN107169489B (zh) * | 2017-05-08 | 2020-03-31 | 北京京东金融科技控股有限公司 | 倾斜图像校正的方法和装置 |
US10810465B2 (en) * | 2017-06-30 | 2020-10-20 | Datalogic Usa, Inc. | Systems and methods for robust industrial optical character recognition |
CN108229470B (zh) * | 2017-12-22 | 2022-04-01 | 北京市商汤科技开发有限公司 | 文字图像处理方法、装置、设备及存储介质 |
CN108229474B (zh) * | 2017-12-29 | 2019-10-01 | 北京旷视科技有限公司 | 车牌识别方法、装置及电子设备 |
CN113302915A (zh) * | 2019-01-14 | 2021-08-24 | 杜比实验室特许公司 | 在视频会议中共享物理书写表面 |
US20200388068A1 (en) * | 2019-06-10 | 2020-12-10 | Fai Yeung | System and apparatus for user controlled virtual camera for volumetric video |
US11544916B2 (en) * | 2019-11-13 | 2023-01-03 | Battelle Energy Alliance, Llc | Automated gauge reading and related systems, methods, and devices |
-
2020
- 2020-08-26 TW TW109129193A patent/TWI790471B/zh active
- 2020-11-09 CN CN202011241410.7A patent/CN114119379A/zh active Pending
- 2020-11-25 US US17/104,781 patent/US20220067881A1/en not_active Abandoned
- 2020-12-14 IL IL279443A patent/IL279443A/en unknown
- 2020-12-21 JP JP2020211742A patent/JP7163356B2/ja active Active
- 2020-12-23 DE DE102020134888.6A patent/DE102020134888A1/de active Pending
-
2021
- 2021-01-19 NO NO20210058A patent/NO20210058A1/en unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111223065A (zh) | 2020-01-13 | 2020-06-02 | 中国科学院重庆绿色智能技术研究院 | 图像矫正方法、不规则文本识别方法、装置、存储介质和设备 |
Non-Patent Citations (1)
Title |
---|
鈴木 まり 他,高環境耐性なCNN回帰モデルのメモリ削減検討,2019年度人工知能学会全国大会(第33回) [online],日本,一般社団法人人工知能学会,2019年06月04日,pp.1-4 |
Also Published As
Publication number | Publication date |
---|---|
DE102020134888A1 (de) | 2022-03-03 |
IL279443A (en) | 2022-03-01 |
TWI790471B (zh) | 2023-01-21 |
NO20210058A1 (en) | 2022-02-28 |
CN114119379A (zh) | 2022-03-01 |
TW202209175A (zh) | 2022-03-01 |
JP2022039895A (ja) | 2022-03-10 |
US20220067881A1 (en) | 2022-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7163356B2 (ja) | ディープラーニングに基づく画像補正方法及びシステム | |
WO2020151212A1 (zh) | 车载相机系统相机外参的标定方法及标定系统 | |
CN109903331B (zh) | 一种基于rgb-d相机的卷积神经网络目标检测方法 | |
US8811744B2 (en) | Method for determining frontal face pose | |
JP6688277B2 (ja) | プログラム、学習処理方法、学習モデル、データ構造、学習装置、および物体認識装置 | |
JP2006252473A (ja) | 障害物検出装置、キャリブレーション装置、キャリブレーション方法およびキャリブレーションプログラム | |
US7903840B2 (en) | Image processing method, image processing apparatus, image processing program and program recording medium | |
CN109074499B (zh) | 用于对象重识别的方法和系统 | |
US11030488B1 (en) | Book scanning using machine-trained model | |
JP2020161129A5 (ja) | ||
CN111508025A (zh) | 三维位置估计装置以及程序 | |
CN108550167B (zh) | 深度图像生成方法、装置及电子设备 | |
CN110443245A (zh) | 一种非限制场景下的车牌区域的定位方法、装置及设备 | |
KR20230043668A (ko) | 딥러닝 네트워크 기반의 파노라마 영상 생성 방법 및 장치 | |
CN112749664A (zh) | 一种手势识别方法、装置、设备、系统及存储介质 | |
US11145037B1 (en) | Book scanning using machine-trained model | |
CN110288633B (zh) | 目标追踪方法、装置、可读存储介质及电子设备 | |
KR20210007234A (ko) | 이미지 보정 방법 및 이미지 보정 시스템 | |
JPH11190611A (ja) | 3次元計測方法およびその方法を用いた3次元計測処理装置 | |
CN110569865A (zh) | 识别车体方向的方法和装置 | |
JP7296799B2 (ja) | 領域分割装置、領域分割方法、及び領域分割プログラム | |
CN112053406B (zh) | 成像装置参数标定方法、装置及电子设备 | |
CN117812466B (zh) | 一种大场景双机联动相机校准方法、设备及系统 | |
WO2022113349A1 (ja) | 骨格認識装置、学習方法および学習プログラム | |
CN113344830B (zh) | 基于多张单通道温度图片的融合方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220111 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220408 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220603 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221004 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221019 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7163356 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |