JP7396076B2 - 番号認識装置、方法及び電子機器 - Google Patents
番号認識装置、方法及び電子機器 Download PDFInfo
- Publication number
- JP7396076B2 JP7396076B2 JP2020011823A JP2020011823A JP7396076B2 JP 7396076 B2 JP7396076 B2 JP 7396076B2 JP 2020011823 A JP2020011823 A JP 2020011823A JP 2020011823 A JP2020011823 A JP 2020011823A JP 7396076 B2 JP7396076 B2 JP 7396076B2
- Authority
- JP
- Japan
- Prior art keywords
- training
- image
- digit
- detected
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 28
- 238000012549 training Methods 0.000 claims description 130
- 230000009466 transformation Effects 0.000 claims description 34
- 238000001514 detection method Methods 0.000 claims description 31
- 238000010586 diagram Methods 0.000 description 22
- 238000013527 convolutional neural network Methods 0.000 description 12
- 238000012986 modification Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
- G06V20/42—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items of sport video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/293—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of characters other than Kanji, Hiragana or Katakana
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Description
本発明の実施例は番号認識方法を提供する。図1は本発明の実施例の番号認識方法を示す図であり、図1に示すように、該方法は以下のステップを含む。
本発明の実施例は番号認識装置を提供する。実施例1と同様な内容について、説明を省略する。
本発明の実施例は、実施例2に記載の番号認識装置を含む電子機器をさらに提供し、ここでその内容を援用する。該電子機器は例えばコンピュータ、サーバ、ワークステーション、ラップトップコンピュータ、スマートフォンなどであってもよく、本発明の実施例はこれに限定されない。
Claims (9)
- 番号認識装置であって、
訓練画像を用いて番号認識のための訓練モデルを訓練する訓練部であって、訓練画像に対して座標変換を行い、1つ又は複数の座標変換後の画像を訓練データの正のサンプルとする、訓練部と、
前記訓練モデルを用いて検出すべき画像における番号に対して1桁数字の検出を行う検出部と、
前記1桁数字の検出により取得された1つ又は複数の数字を併合し、前記検出すべき画像における番号を取得する併合部と、
検出された1つ又は複数の番号枠の面積及び信頼度に基づいて、前記1つ又は複数の数字が誤認識されたものであるか否かを決定する決定部と、を含む、装置。 - 前記訓練部は、前記訓練画像を所定の角度だけ回転させ、角度だけ回転した番号の境界枠を用いて外側境界枠を取得し、前記外側境界枠を調整して前記座標変換後の画像を取得し、
前記訓練画像における前記番号の境界枠も前記角度だけ回転する、請求項1に記載の装置。 - 前記訓練部は、前記訓練画像における番号のサイズを拡大/縮小し、サイズが変更された前記番号を取得し、前記サイズが変更された前記番号のために背景領域を追加して前記座標変換後の画像を取得する、請求項1又は2に記載の装置。
- 前記訓練部は、非番号領域の誤認識の影響を排除するように、前記訓練モデルのために訓練データの負のサンプルを追加する、請求項1乃至3の何れかに記載の装置。
- 前記訓練部は、事前学習済みモデルを有しない番号モデルを訓練し、訓練後の前記番号モデルの畳み込み層を番号認識のための事前学習済みモデルとする、請求項1乃至4の何れかに記載の装置。
- 番号認識方法であって、
訓練画像を用いて番号認識のための訓練モデルを訓練するステップであって、訓練画像に対して座標変換を行い、1つ又は複数の座標変換後の画像を訓練データの正のサンプルとする、ステップと、
前記訓練モデルを用いて検出すべき画像における番号に対して1桁数字の検出を行うステップと、
前記1桁数字の検出により取得された1つ又は複数の数字を併合し、前記検出すべき画像における番号を取得するステップと、
検出された1つ又は複数の番号枠の面積及び信頼度に基づいて、前記1つ又は複数の数字が誤認識されたものであるか否かを決定するステップと、を含む、方法。 - 請求項1乃至7の何れかに記載の装置を含む電子機器。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910288456.5A CN111814514A (zh) | 2019-04-11 | 2019-04-11 | 号码识别装置、方法以及电子设备 |
CN201910288456.5 | 2019-04-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020173781A JP2020173781A (ja) | 2020-10-22 |
JP7396076B2 true JP7396076B2 (ja) | 2023-12-12 |
Family
ID=72831668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020011823A Active JP7396076B2 (ja) | 2019-04-11 | 2020-01-28 | 番号認識装置、方法及び電子機器 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7396076B2 (ja) |
CN (1) | CN111814514A (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112949624B (zh) * | 2021-01-25 | 2024-02-13 | 西安电子科技大学 | 基于水尺的水位检测方法、装置、电子设备及存储介质 |
CN113627210A (zh) * | 2021-08-19 | 2021-11-09 | 南京华捷艾米软件科技有限公司 | 条形码图像的生成方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007148537A (ja) | 2005-11-24 | 2007-06-14 | Fujifilm Corp | 画像処理方法および画像処理プログラムならびに画像処理装置 |
JP2016119059A (ja) | 2014-12-22 | 2016-06-30 | キヤノンイメージングシステムズ株式会社 | 画像処理装置および画像処理方法 |
JP2017084299A (ja) | 2015-10-30 | 2017-05-18 | 株式会社シーイーシー | 画像処理装置および画像処理方法 |
JP2018503201A (ja) | 2015-10-30 | 2018-02-01 | 小米科技有限責任公司Xiaomi Inc. | 領域抽出方法、モデル訓練方法及び装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2532075A (en) * | 2014-11-10 | 2016-05-11 | Lego As | System and method for toy recognition and detection based on convolutional neural networks |
CN107690659B (zh) * | 2016-12-27 | 2021-08-10 | 达闼机器人有限公司 | 一种图像识别系统及图像识别方法 |
CN108022238B (zh) * | 2017-08-09 | 2020-07-03 | 深圳科亚医疗科技有限公司 | 对3d图像中对象进行检测的方法、计算机存储介质和系统 |
CN109472274B (zh) * | 2017-09-07 | 2022-06-28 | 富士通株式会社 | 深度学习分类模型的训练装置和方法 |
CN108376235A (zh) * | 2018-01-15 | 2018-08-07 | 深圳市易成自动驾驶技术有限公司 | 图像检测方法、装置及计算机可读存储介质 |
CN109446961B (zh) * | 2018-10-19 | 2020-10-30 | 北京达佳互联信息技术有限公司 | 姿势检测方法、装置、设备及存储介质 |
-
2019
- 2019-04-11 CN CN201910288456.5A patent/CN111814514A/zh active Pending
-
2020
- 2020-01-28 JP JP2020011823A patent/JP7396076B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007148537A (ja) | 2005-11-24 | 2007-06-14 | Fujifilm Corp | 画像処理方法および画像処理プログラムならびに画像処理装置 |
JP2016119059A (ja) | 2014-12-22 | 2016-06-30 | キヤノンイメージングシステムズ株式会社 | 画像処理装置および画像処理方法 |
JP2017084299A (ja) | 2015-10-30 | 2017-05-18 | 株式会社シーイーシー | 画像処理装置および画像処理方法 |
JP2018503201A (ja) | 2015-10-30 | 2018-02-01 | 小米科技有限責任公司Xiaomi Inc. | 領域抽出方法、モデル訓練方法及び装置 |
Non-Patent Citations (2)
Title |
---|
A New Convolutional Architecture for Vietnamese Car Plate Recognition,2018 10th International Conference on Knowledge and Systems Engineering (KSE),2018年11月01日,https://ieeexplore.ieee.org/document/8573375 |
カメラモニタリングによるガス使用量読み取りシステムの開発,システム制御情報学会論文誌 第29巻 第9号,2016年09月15日 |
Also Published As
Publication number | Publication date |
---|---|
JP2020173781A (ja) | 2020-10-22 |
CN111814514A (zh) | 2020-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106650662B (zh) | 目标对象遮挡检测方法及装置 | |
CN109934115B (zh) | 人脸识别模型的构建方法、人脸识别方法及电子设备 | |
CN110060237B (zh) | 一种故障检测方法、装置、设备及系统 | |
TW202006602A (zh) | 三維臉部活體檢測方法、臉部認證識別方法及裝置 | |
CN111476827B (zh) | 目标跟踪方法、系统、电子装置及存储介质 | |
CN108875517B (zh) | 视频处理方法、装置和系统及存储介质 | |
CN108875731B (zh) | 目标识别方法、装置、系统及存储介质 | |
TWI667621B (zh) | 人臉辨識方法 | |
TWI712980B (zh) | 理賠資訊提取方法和裝置、電子設備 | |
CN112329881B (zh) | 车牌识别模型训练方法、车牌识别方法及装置 | |
CN108875750B (zh) | 物体检测方法、装置和系统及存储介质 | |
CN111079536B (zh) | 基于人体关键点时序的行为分析方法、存储介质及设备 | |
CN110263680B (zh) | 图像处理方法、装置和系统及存储介质 | |
CN110287862B (zh) | 基于深度学习的防偷拍检测方法 | |
JP2019029002A (ja) | パノラマ画像を用いる再位置決め方法、装置及び電子機器 | |
JP7396076B2 (ja) | 番号認識装置、方法及び電子機器 | |
CN111079519B (zh) | 多姿态人体检测方法、计算机存储介质及电子设备 | |
CN109598298B (zh) | 图像物体识别方法和系统 | |
WO2018058573A1 (zh) | 对象检测方法、对象检测装置以及电子设备 | |
CN114821274A (zh) | 一种用于识别分合指示牌的状态的方法和设备 | |
CN112949516A (zh) | 踢被子行为的识别方法和装置 | |
CN112328822B (zh) | 图片预标注方法、装置及终端设备 | |
CN109389628A (zh) | 图像配准方法、设备和存储介质 | |
CN112287905A (zh) | 车辆损伤识别方法、装置、设备及存储介质 | |
CN111753796A (zh) | 图像中关键点的识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221006 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230808 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230815 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230925 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231031 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231113 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7396076 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |