JP6688970B2 - 画像認識システム - Google Patents
画像認識システム Download PDFInfo
- Publication number
- JP6688970B2 JP6688970B2 JP2016140341A JP2016140341A JP6688970B2 JP 6688970 B2 JP6688970 B2 JP 6688970B2 JP 2016140341 A JP2016140341 A JP 2016140341A JP 2016140341 A JP2016140341 A JP 2016140341A JP 6688970 B2 JP6688970 B2 JP 6688970B2
- Authority
- JP
- Japan
- Prior art keywords
- computer
- recognition
- image
- recognition system
- image recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 claims description 79
- 238000012545 processing Methods 0.000 claims description 56
- 230000006854 communication Effects 0.000 claims description 51
- 238000004891 communication Methods 0.000 claims description 51
- 230000005540 biological transmission Effects 0.000 claims description 38
- 238000000034 method Methods 0.000 claims description 31
- 238000013528 artificial neural network Methods 0.000 claims description 20
- 210000002569 neuron Anatomy 0.000 claims description 13
- 210000000225 synapse Anatomy 0.000 claims description 12
- 230000000946 synaptic effect Effects 0.000 claims description 2
- 238000004422 calculation algorithm Methods 0.000 description 11
- 238000013135 deep learning Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000013461 design Methods 0.000 description 8
- 238000012546 transfer Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000007175 bidirectional communication Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/95—Hardware or software architectures specially adapted for image or video understanding structured as a network, e.g. client-server architectures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Traffic Control Systems (AREA)
Description
図1は、第1の実施の形態に係る画像認識システム100の構成を示す図である。画像認識システム100は、第1のコンピュータ101と、第2のコンピュータ102と、通信路111と、を備える。第1のコンピュータ101は、例えば車載カメラである。第2のコンピュータ102は、例えばECUである。
本開示の画像認識システム100において、画像認識アルゴリズムに関連して、ディープラーニングを用いることもできる。画像認識システムを構築する際には、認識率を高めるために、検出領域、特徴量の抽出、辞書データの作成、パターンマッチング等について、それぞれ、独自にチューニングされた認識パラメータ群がある。認識パラメータ群は、認識を行う対象画像および動作条件などを想定しながら、画像認識システムを構築する設計者がマニュアルで作成している。また、使用するカメラや状況に応じた認識パラメータ群の設定により、認識対象の認識率も異なってくる。
リアルタイムに行われる認識処理において認識率を向上させようとすると、辞書の辞書データの量も増やす必要があり、認識パラメータ群を算出するために用いられる学習データのデータ量も増える。そこで、例えば、学習データ等の大量のデータを、サーバなどにビッグデータとして蓄積することがある。画像データの認識アルゴリズムの認識パラメータ群を、大量のデータを用いてマニュアルで最適化することは困難である。そこで、画像認識システムを構築する設計者が意図的に認識パラメータ群を設定することに代えて、蓄積された大量のデータを用いて認識アルゴリズムと認識用ルールの自動生成を行う。そして、自動生成された認識アルゴリズムとルールを使って、入力した画像が何を意味するのかの推論を自動で行う。
図9は、第3の実施の形態に係る画像認識システム500を示す。画像認識システム500は、第1のコンピュータ501と、第2のコンピュータ102と、カメラ530とを備える。第3の実施の形態に係る第2のコンピュータ102は、第1の実施の形態に係る第2のコンピュータ102と、その構成が同じであるので、説明を省略する。
図10は、第4の実施の形態に係る画像認識システム500’を示す。画像認識システム500’は、第1のコンピュータ101と、第2のコンピュータ561と、サーバ592とを備える。第4の実施の形態に係る第1のコンピュータ101は、第1の実施の形態に係る第1のコンピュータ101と、その構成が同じであるので、説明を省略する。第2のコンピュータ561は、認識パラメータ群を認識対象識別部104のメモリに格納することに代えて、認識パラメータ群の一部または全部を、第2のコンピュータ561に接続されたサーバ592から取得する。必要に応じて、第2のコンピュータ561は、第2のコンピュータ561による画像認識の結果を、サーバ592に送信する。
図11は、第5の実施の形態に係る画像認識システム600を示す。画像認識システム600は、第1のコンピュータとしての第1のカメラ601、第2のカメラ603、第3のカメラ605、および第4のカメラ604と、第2のコンピュータとしてのECU602と、測距センサー610と、を備える。第1のカメラ601、第2のカメラ603、第3のカメラ605、第4のカメラ604、および測距センサー610とは、それぞれECU602と接続される。
第1の実施の形態に係る第1のコンピュータ101は、検出処理を行っているが、これに加えて識別処理の一部を、第2のコンピュータ102に代わって実行してもよい。
102 第2のコンピュータ
103 認識対象検出部
104 認識対象識別部
105 第1の送信部
106 第2の送信部
107 第1の受信部
108 第2の受信部
109 第1の制御部
110 第2の制御部
111 通信路
120 記憶部
130 画像データ
131 画像データ
132 画像データ
141 制御信号
142 制御信号
151 特徴点データ
152 特徴点データ
230 特徴点データ
231 特徴点データ
232 特徴点データ
260 画像データ
261 画像データ
262 画像データ
263 画像データ
301 認識結果
302 特徴点データ
303 画像データ
401 ニューラルネットワーク
402 ニューラルネットワーク
410 認識データ
420 シナプス荷重の変更データ
430 シナプス
440 ニューロン
501 第1のコンピュータ
561 第2のコンピュータ
592 サーバ
601 第1のカメラ
602 ECU
603 第2のカメラ
604 第4のカメラ
605 第3のカメラ
610 測距センサー
1005 辞書データ作成部
1006 辞書
1007 特徴ベクトル
1040 画像
1050 探索領域
1060 画像データ
2001 車載カメラ
2001’車載カメラ
2002 車両
2003 ECU
2003’ ECU
2004 相互通信路
2005 辞書
2006 認識対象検出部
2007 認識対象識別部
2010 第1の画像処理部
2040 第2の画像処理部
3003 第1のスイッチ
3004 第2のスイッチ
3023 第1のモデム
3024 第2のモデム
Claims (11)
- カメラにより生成された画像データから認識対象の特徴点を検出する第1のコンピュータと、
前記第1のコンピュータが検出した前記認識対象の識別を行う第2のコンピュータと、
を備え、
前記第1のコンピュータと前記第2のコンピュータとは、物理的に分離されて配置され、
前記第1のコンピュータは、前記画像データを、当該画像データから検出された前記認識対象の特徴点データと共に、前記第2のコンピュータに送信し、
前記第2のコンピュータは、前記第1のコンピュータから受信した前記画像データ及び前記認識対象の特徴点データに基づいて、前記認識対象の識別を行い、
前記第1のコンピュータが前記第2のコンピュータに前記画像データを送信する時に、前記画像データの画像認識処理に用いられ、動的に変更される認識パラメータ群のうち、前記検出に用いる検出パラメータ群を、前記第2のコンピュータが通信路を介して前記第1のコンピュータに送信する、画像認識システム。 - 前記通信路の通信方式が全二重通信方式であり、前記画像データの送信および前記検出パラメータ群の送信が並行して行われる、請求項1に記載の画像認識システム。
- 前記認識パラメータ群は、認識すべき認識対象を特徴づけるパラメータ群の少なくとも一部である請求項1または2に記載の画像認識システム。
- 前記認識対象の前記検出は、ニューラルネットワークを用いて行われ、
前記検出パラメータ群は、前記ニューラルネットワークを構成するニューロンのシナプス荷重、関数、および閾値の少なくとも1つである、請求項1から3のいずれかに記載の画像認識システム。 - 前記シナプス荷重のいくつかをゼロに設定することにより、前記ニューラルネットワークの構成が変更される、請求項4に記載の画像認識システム。
- 前記画像データの前記送信は、フレーム毎に行われ、
前記フレーム毎に、前記認識パラメータ群が変更される、請求項1から5のいずれかに記載の画像認識システム。 - 前記第1のコンピュータは、物理的に離れた位置にあり、前記画像データを取得するセンサと接続されている、請求項1から6のいずれかに記載の画像認識システム。
- 前記第2のコンピュータは、サーバと接続され、
前記第2のコンピュータは、前記サーバから前記認識パラメータ群の少なくとも1つのパラメータを取得し、前記サーバに前記第2のコンピュータによる認識結果の情報を送信する、請求項1から7のいずれかに記載の画像認識システム。 - 前記第2のコンピュータが前記認識対象との間の距離を測定するセンサに接続される、請求項1から8のいずれかに記載の画像認識システム。
- 前記第1のコンピュータは複数である、請求項1から9のいずれかに記載の画像認識システム。
- 前記通信路を介する通信が無線通信である、請求項1から10のいずれかに記載の画像認識システム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016140341A JP6688970B2 (ja) | 2016-07-15 | 2016-07-15 | 画像認識システム |
PCT/JP2017/016516 WO2018012084A1 (ja) | 2016-07-15 | 2017-04-26 | 画像認識システム |
EP17827218.3A EP3428878A4 (en) | 2016-07-15 | 2017-04-26 | IMAGE DETECTION SYSTEM |
US16/088,472 US10853964B2 (en) | 2016-07-15 | 2017-04-26 | Image recognition system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016140341A JP6688970B2 (ja) | 2016-07-15 | 2016-07-15 | 画像認識システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018010568A JP2018010568A (ja) | 2018-01-18 |
JP6688970B2 true JP6688970B2 (ja) | 2020-04-28 |
Family
ID=60952930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016140341A Active JP6688970B2 (ja) | 2016-07-15 | 2016-07-15 | 画像認識システム |
Country Status (4)
Country | Link |
---|---|
US (1) | US10853964B2 (ja) |
EP (1) | EP3428878A4 (ja) |
JP (1) | JP6688970B2 (ja) |
WO (1) | WO2018012084A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020020997A (ja) * | 2018-08-02 | 2020-02-06 | 古河電気工業株式会社 | 融着接続システム、融着接続機及び光ファイバ種判別方法 |
WO2020141588A1 (ja) * | 2019-01-02 | 2020-07-09 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 情報処理装置、情報処理方法及びプログラム |
JP7240916B2 (ja) * | 2019-03-22 | 2023-03-16 | ソニーセミコンダクタソリューションズ株式会社 | 情報処理装置、情報処理方法、および情報処理プログラム |
WO2020196165A1 (ja) * | 2019-03-25 | 2020-10-01 | ソニーセミコンダクタソリューションズ株式会社 | 情報処理装置、情報処理方法、情報処理プログラム、および情報処理システム |
JP7287650B2 (ja) * | 2019-03-27 | 2023-06-06 | Necソリューションイノベータ株式会社 | 画像認識装置、画像認識方法、及びプログラム |
US11858143B1 (en) * | 2020-03-02 | 2024-01-02 | Amazon Technologies, Inc. | System for identifying a user with an autonomous mobile device |
JP7318809B2 (ja) * | 2020-04-13 | 2023-08-01 | 日本電気株式会社 | 映像分析装置、映像分析システム及び映像分析方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3246764B2 (ja) | 1992-05-11 | 2002-01-15 | 株式会社東芝 | ニューロチップ |
JP2001333428A (ja) | 2000-05-19 | 2001-11-30 | Oki Electric Ind Co Ltd | 動画送受信システム |
JP3659914B2 (ja) | 2000-10-31 | 2005-06-15 | 松下電器産業株式会社 | 物体認識装置、物体を認識する方法、プログラムおよび記録媒体 |
EP1202214A3 (en) | 2000-10-31 | 2005-02-23 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for object recognition |
WO2013118491A1 (ja) * | 2012-02-06 | 2013-08-15 | パナソニック株式会社 | カメラ装置、サーバ装置、画像監視システム、画像監視システム制御方法及び画像監視システム制御プログラム |
US9208432B2 (en) * | 2012-06-01 | 2015-12-08 | Brain Corporation | Neural network learning and collaboration apparatus and methods |
JP6024952B2 (ja) | 2012-07-19 | 2016-11-16 | パナソニックIpマネジメント株式会社 | 画像送信装置、画像送信方法、画像送信プログラム及び画像認識認証システム |
JP6398347B2 (ja) * | 2013-08-15 | 2018-10-03 | 株式会社リコー | 画像処理装置、認識対象物検出方法、認識対象物検出プログラム、および、移動体制御システム |
JP6471934B2 (ja) * | 2014-06-12 | 2019-02-20 | パナソニックIpマネジメント株式会社 | 画像認識方法、カメラシステム |
US20170323472A1 (en) * | 2014-10-26 | 2017-11-09 | Galileo Group, Inc. | Methods and systems for surface informatics based detection with machine-to-machine networks and smartphones |
JP6828587B2 (ja) * | 2017-05-22 | 2021-02-10 | トヨタ自動車株式会社 | 画像処理システム、画像処理方法、情報処理装置及び記録媒体 |
-
2016
- 2016-07-15 JP JP2016140341A patent/JP6688970B2/ja active Active
-
2017
- 2017-04-26 US US16/088,472 patent/US10853964B2/en active Active
- 2017-04-26 EP EP17827218.3A patent/EP3428878A4/en active Pending
- 2017-04-26 WO PCT/JP2017/016516 patent/WO2018012084A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US20190114799A1 (en) | 2019-04-18 |
JP2018010568A (ja) | 2018-01-18 |
WO2018012084A1 (ja) | 2018-01-18 |
EP3428878A1 (en) | 2019-01-16 |
US10853964B2 (en) | 2020-12-01 |
EP3428878A4 (en) | 2019-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6688970B2 (ja) | 画像認識システム | |
US10451712B1 (en) | Radar data collection and labeling for machine learning | |
US10037471B2 (en) | System and method for image analysis | |
US10896342B2 (en) | Spatio-temporal action and actor localization | |
US10964033B2 (en) | Decoupled motion models for object tracking | |
US20190026917A1 (en) | Learning geometric differentials for matching 3d models to objects in a 2d image | |
US11042999B2 (en) | Advanced driver assist systems and methods of detecting objects in the same | |
US20190332935A1 (en) | System and method for siamese instance search tracker with a recurrent neural network | |
US10776642B2 (en) | Sampling training data for in-cabin human detection from raw video | |
WO2020185209A1 (en) | Radar data collection and labeling for machine-learning | |
CN111532225A (zh) | 车辆胶囊网络 | |
US20220335258A1 (en) | Systems and methods for dataset and model management for multi-modal auto-labeling and active learning | |
CN113454692B9 (zh) | 驾驶信息提供方法以及车辆地图提供服务器和方法 | |
CN114764909A (zh) | 增强的对象检测 | |
EP4341913A2 (en) | System for detection and management of uncertainty in perception systems, for new object detection and for situation anticipation | |
US12100221B2 (en) | Methods and electronic devices for detecting objects in surroundings of a self-driving car | |
Alajlan et al. | Automatic lane marking prediction using convolutional neural network and S-Shaped Binary Butterfly Optimization | |
Juyal et al. | Multiclass Objects Localization Using Deep Learning Technique in Autonomous Vehicle | |
EP4050510A1 (en) | Object information calculation method and system | |
Liu et al. | An IMM-enabled adaptive 3D multi-object tracker for autonomous driving | |
Lee et al. | Multi-task UNet architecture for end-to-end autonomous driving | |
US20240169183A1 (en) | Method for performing a perception task of an electronic device or a vehicle using a plurality of neural networks | |
CN113837270B (zh) | 一种目标识别方法、装置、设备及存储介质 | |
US20230234580A1 (en) | Computationally efficient trajectory representation for traffic participants | |
CN113496268B (zh) | 一种轨迹预测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180725 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20190625 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190910 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20191018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191024 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200310 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200318 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6688970 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
SZ03 | Written request for cancellation of trust registration |
Free format text: JAPANESE INTERMEDIATE CODE: R313Z03 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |