JP6671028B2 - 学習方法 - Google Patents
学習方法 Download PDFInfo
- Publication number
- JP6671028B2 JP6671028B2 JP2016034784A JP2016034784A JP6671028B2 JP 6671028 B2 JP6671028 B2 JP 6671028B2 JP 2016034784 A JP2016034784 A JP 2016034784A JP 2016034784 A JP2016034784 A JP 2016034784A JP 6671028 B2 JP6671028 B2 JP 6671028B2
- Authority
- JP
- Japan
- Prior art keywords
- neural network
- coarse
- learning
- classifier
- classes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24317—Piecewise classification, i.e. whereby each classification requires several discriminant rules
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
- G06K7/10—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
- G06K7/14—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
- G06K7/1404—Methods for optical code recognition
- G06K7/146—Methods for optical code recognition the method including quality enhancement steps
- G06K7/1482—Methods for optical code recognition the method including quality enhancement steps using fuzzy logic or natural solvers, such as neural networks, genetic algorithms and simulated annealing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Biodiversity & Conservation Biology (AREA)
- Automation & Control Theory (AREA)
- Fuzzy Systems (AREA)
- Quality & Reliability (AREA)
- Electromagnetism (AREA)
- Toxicology (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
画像認識技術は、一般的に、1)画像から特徴量を抽出する抽出処理と、2)特徴量から物体を判別する判別処理の2段階に分かれる。例えば、抽出処理では、画像中の認識対象物体から、輝度の分布や輝度の差分(エッジ)など認識に利用する特徴量を抽出する。また、例えば判別処理では、抽出した特徴量から、BoostingやSVM(Support Vector Machine)などの統計的機械学習手法によって認識対象であるか否かを判別する。
以下では、図面を参照しながら、実施の形態1の分類器10の学習方法等の説明を行う。
図1は、実施の形態1の学習システム1の構成の一例を示すブロック図である。図2Aは、実施の形態1の学習システム1が行う学習処理に用いる粗クラス分類器10aの構成を説明するための図である。図2Bは、実施の形態1の学習システム1が行う学習処理に用いる詳細クラス分類器10bの構成を説明するための図である。図3Aは、図2Aに示す粗クラス分類器10aを構成する第1ニューラルネットワークの一例を示す図である。図3Bは、図2Bに示す詳細クラス分類器10bを構成する第2ニューラルネットワークの一例を示す図である。
次に、以上のように構成された学習システム1の学習処理について、図を用いて説明する。
以上のように、本実施の形態1によれば、従来技術と比べ、画像認識の処理速度を低下させることなく、画像認識を高精度に行うことができる分類器の学習方法等を実現できる。具体的には、実施の形態1の学習方法によれば、詳細クラス分類器10bと最終層以外同一のニューラルネットワークで構成される粗クラス分類器10aに行った粗クラス学習の結果を初期値として、詳細クラス分類器10bに詳細クラス学習させる(多段階学習させる)。つまり、粗クラス学習と詳細クラス学習とで、出力数(最終層のニューロンの数)のみが入れ替えられるニューラルネットワークで構成される分類器10(粗クラス分類器10a、詳細クラス分類器10b)が使用される。さらに、詳細クラス学習では、最終層以外の層では粗クラス学習で得たパラメータが設定されたニューラルネットワークで構成される詳細クラス分類器10b)を使用する。このように、分類器10のニューラルネットワークの最終層以外の構造を変えず(サイズを維持したまま)、多段階学習させる。それにより、誤った詳細クラスで分類されるといったことが抑制できるので画像認識の精度を向上できるだけでなく、ニューラルネットワークのサイズも小さくできるので従来と比較して4倍程度に画像認識の処理速度を向上することができる。
実施の形態1では、学習システム1は、詳細クラスを示すラベルの内容に基づき作成された粗クラスを用いて、粗クラス分類器10aを設計する場合について説明したがそれに限らない。学習システム1が詳細クラスを示すラベルの内容に基づき粗クラスを作成してもよい。以下、この場合の一例を変形例1として説明する。
図9Aは、変形例1における学習システム1Aの構成の一例を示すブロック図である。図9Bは、図9Aに示す粗クラス作成部6の詳細構成の一例を示すブロック図である。図1と同様の要素には同一の符号を付しており、詳細な説明は省略する。
本変形例では、粗クラス作成部6は、図9Bに示すように、例えば粗クラス作成処理部61と、粗クラスラベル付加部62とを備える。
次に、以上のように構成された学習システム1Aの学習処理について、図を用いて説明する。学習システム1Aの2段階学習処理については、図5に示した通りであり、詳細クラス学習(ステップS2)の詳細処理については、図8に示した通りであるので、説明を省略する。以下、実施の形態1とは異なる部分を中心に説明する。
実施の形態1では、第1ニューラルネットワークの最終層を入れ替える(置き換える)ことにより、第2ニューラルネットワークの最終層を設計する場合の例について説明したがそれに限らない。同一の第3ニューラルネットワークの最終層を構成するニューロンうち使用するニューロンを第1ニューラルネットワークと第2ニューラルネットワークとで変更するとしてもよい。以下、この場合の例について変形例2として説明する。
図11は、変形例2における第3ニューラルネットワークの一例を示す図である。図12Aは、変形例2における粗クラス分類器を構成する第1ニューラルネットワーク10cの一例を示す図である。図12Bは、変形例2における詳細クラス分類器を構成する第2ニューラルネットワーク10dの一例を示す図である。なお、図2Aおよび図2Bと同様の要素には同一の符号を付しており、詳細な説明は省略する。
本変形例では、学習システム1は、以上のように構成された粗クラス分類器10cと詳細クラス分類器10dとを用いて例えば図5で説明したような学習処理を行う。
実施の形態1では、第2ニューラルネットワークの最終層の重みをランダム値に設定する場合を例に挙げて説明したが、それに限らない。粗クラス学習させた第1ニューラルネットワークの最終層の重みと、詳細クラスおよび粗クラスの関係性とに基づいて、第2ニューラルネットワークの最終層の重みを設定してもよい。以下、この場合について、実施の形態1と異なる部分について説明する。
図13は、実施の形態2における学習システム1Bの構成の一例を示すブロック図である。図14は、実施の形態2における学習システム1Bが行う学習処理に用いる詳細クラス分類器10eの構成を説明するための図である。図14におけるa、b、k、a1〜al、b1〜bm、k1〜knは正の整数である。なお、図1等と同様の要素には同一の符号を付しており、詳細な説明は省略する。
次に、以上のように構成された学習システム1Bの学習処理について説明する。学習システム1Bの2段階学習処理については、図5に示した通りであり、粗クラス学習(ステップS1)の詳細処理については、図7に示した通りであるので、説明を省略する。以下では、実施の形態1とは異なる部分を中心に説明する。
以上のように、本実施の形態によれば、従来技術に比べ、画像認識の処理速度を低下させることなく、画像認識を高精度に行うことができる分類器の学習方法等を実現できる。
2 情報取得部
3 分類器設計部
4 分類器学習部
5 保存部
6 粗クラス作成部
7 重み設定部
10 分類器
10a、10c 粗クラス分類器
10b、10d、10e 詳細クラス分類器
61 粗クラス作成処理部
62 粗クラスラベル付加部
Claims (7)
- 画像を分類するための分類器の学習方法であって、
第1ニューラルネットワークで構成される粗クラス分類器に、それぞれの詳細クラスを示すラベルが付与された複数の画像である画像群を、複数の詳細クラスを包含する複数の粗クラスに分類させて当該複数の粗クラス毎の共通の特徴である第1特徴を学習させる第1ステップと、
前記第1ステップにおいて学習させた前記第1ニューラルネットワークの最終層以外同一で当該最終層のみが異なる第2ニューラルネットワークで構成される詳細クラス分類器に、前記画像群を詳細クラスに分類させて当該詳細クラス毎の共通の特徴である第2特徴を学習させることで、前記分類器の学習を行う第2ステップとを含み、
前記第1ステップは、
前記第1ニューラルネットワークの最終層のニューロンを、前記詳細クラスを示すラベルの内容に基づき作成された前記粗クラスの数と同一数のニューロンで設計する第1設計ステップと、
設計された前記第1ニューラルネットワークで構成された前記粗クラス分類器に前記画像群を取得させ、前記第1特徴を学習させる第1学習ステップとを含み、
前記第2ステップでは、
前記第1ステップにおいて学習させた前記第1ニューラルネットワークの最終層のニューロンを、前記詳細クラスの数と同一数のニューロンに変更することにより、前記第2ニューラルネットワークを設計する第2設計ステップと、
設計された前記第2ニューラルネットワークで構成される前記詳細クラス分類器に前記画像群を取得させ、前記第2特徴を学習させることで、前記分類器の学習を行う第2学習ステップと、を含み、
前記詳細クラス分類器と前記粗クラス分類器とは第3ニューラルネットワークを使用して構成され、
前記学習方法では、
さらに、前記第1ステップの前に、前記第3ニューラルネットワークの最終層のニューロンを、前記粗クラスの数と前記詳細クラスの数とを加えた数と同一数以上のニューロンで設計する第3設計ステップを含み、
前記第1設計ステップでは、
前記第3ニューラルネットワークの最終層のニューロンのうち、前記粗クラスの数と同一数のニューロンを使用する前記第3ニューラルネットワークを前記第1ニューラルネットワークとして設計することで、前記第1ニューラルネットワークの最終層のニューロンを、前記詳細クラスを示すラベルの内容に基づき作成された前記粗クラスの数と同一数のニューロンに設計し、
前記第2設計ステップでは、
前記第3ニューラルネットワークの最終層のニューロンのうち、前記第1ニューラルネットワークの最終層のニューロンと異なり、かつ、前記詳細クラスの数と同一数のニューロンを使用する前記第3ニューラルネットワークを前記第2ニューラルネットワークとして設計することで、前記第1ステップにおいて学習させた前記第1ニューラルネットワークの最終層のニューロンを、前記詳細クラスの数と同一数のニューロンに変更して、前記第2ニューラルネットワークとして設計する、
学習方法。 - 前記第2設計ステップでは、
さらに、
前記第2ニューラルネットワークの最終層と当該最終層の1つ前の層との結合効率を示す前記第2ニューラルネットワークの最終層の重みをランダム値に設定するステップを含む、
請求項1に記載の学習方法。 - 画像を分類するための分類器の学習方法であって、
第1ニューラルネットワークで構成される粗クラス分類器に、それぞれの詳細クラスを示すラベルが付与された複数の画像である画像群を、複数の詳細クラスを包含する複数の粗クラスに分類させて当該複数の粗クラス毎の共通の特徴である第1特徴を学習させる第1ステップと、
前記第1ステップにおいて学習させた前記第1ニューラルネットワークの最終層以外同一で当該最終層のみが異なる第2ニューラルネットワークで構成される詳細クラス分類器に、前記画像群を詳細クラスに分類させて当該詳細クラス毎の共通の特徴である第2特徴を学習させることで、前記分類器の学習を行う第2ステップとを含み、
前記第1ステップは、
前記第1ニューラルネットワークの最終層のニューロンを、前記詳細クラスを示すラベルの内容に基づき作成された前記粗クラスの数と同一数のニューロンで設計する第1設計ステップと、
設計された前記第1ニューラルネットワークで構成された前記粗クラス分類器に前記画像群を取得させ、前記第1特徴を学習させる第1学習ステップとを含み、
前記第2ステップでは、
前記第1ステップにおいて学習させた前記第1ニューラルネットワークの最終層のニューロンを、前記詳細クラスの数と同一数のニューロンに変更することにより、前記第2ニューラルネットワークを設計する第2設計ステップと、
設計された前記第2ニューラルネットワークで構成される前記詳細クラス分類器に前記画像群を取得させ、前記第2特徴を学習させることで、前記分類器の学習を行う第2学習ステップと、を含み、
前記第2設計ステップでは、
さらに、
前記第1学習ステップで学習した際に得た前記第1ニューラルネットワークの最終層と当該最終層の1つ前の層との結合効率を示す前記第1ニューラルネットワークの最終層の第1重みを、前記複数の粗クラスおよび当該複数の粗クラスに包含される複数の詳細クラスの関係性に基づき案分した値を用いて、
前記第2ニューラルネットワークの最終層と当該最終層の1つ前の層との結合効率を示す前記第2ニューラルネットワークの最終層の第2重みを設定するステップを含む、
学習方法。 - 前記学習方法では、
さらに、前記第2ステップにおいて前記第2特徴を学習させた前記詳細クラス分類器を前記分類器として保存するステップを含む、
請求項1〜3のいずれか1項に記載の学習方法。 - 前記第1ステップでは、さらに、
前記複数の画像それぞれに付与された前記詳細クラスを示すラベルの内容に基づいて、
前記複数の粗クラスを作成するステップを含む、
請求項1〜4のいずれか1項に記載の学習方法。 - 前記第1ステップでは、さらに、
前記複数の画像それぞれの画像の類似度に基づき、
前記複数の粗クラスを作成するステップを含む、
請求項1〜4のいずれか1項に記載の学習方法。 - 画像を分類するための分類器の学習方法であって、
第1ニューラルネットワークで構成される粗クラス分類器に、それぞれの詳細クラスを示すラベルが付与された複数の画像である画像群を、複数の詳細クラスを包含する複数の粗クラスに分類させて当該複数の粗クラス毎の共通の特徴である第1特徴を学習させる第1ステップと、
前記第1ステップにおいて学習させた前記第1ニューラルネットワークの最終層以外同一で当該最終層のみが異なる第2ニューラルネットワークで構成される詳細クラス分類器に、前記画像群を詳細クラスに分類させて当該詳細クラス毎の共通の特徴である第2特徴を学習させることで、前記分類器の学習を行う第2ステップとを含み、
前記学習方法は、さらに、
第3ニューラルネットワークで構成される第3粗クラス分類器に、前記画像群を、複数の詳細クラスを包含する複数の第3粗クラスに分類させて当該複数の第3粗クラス毎の共通の特徴である第3特徴を学習させる第3ステップを含み、
前記第1ステップでは、
前記第3ステップにおいて学習させた前記第3ニューラルネットワークの最終層以外同一で当該最終層のみが異なる前記第1ニューラルネットワークで構成される前記粗クラス分類器に、前記画像群を、前記粗クラスに分類させて当該粗クラス毎の前記第1特徴を学習させる学習ステップとを含み、
前記複数の粗クラスはそれぞれ、複数の第3粗クラスを包含することで、当該複数の第3粗クラスに包含される複数の詳細クラスを包含する、
学習方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015044838 | 2015-03-06 | ||
JP2015044838 | 2015-03-06 | ||
JP2015214657 | 2015-10-30 | ||
JP2015214657 | 2015-10-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017084320A JP2017084320A (ja) | 2017-05-18 |
JP6671028B2 true JP6671028B2 (ja) | 2020-03-25 |
Family
ID=55453033
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016034784A Active JP6671028B2 (ja) | 2015-03-06 | 2016-02-25 | 学習方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9779354B2 (ja) |
EP (1) | EP3065090B1 (ja) |
JP (1) | JP6671028B2 (ja) |
CN (1) | CN105938558B (ja) |
Families Citing this family (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9971958B2 (en) * | 2016-06-01 | 2018-05-15 | Mitsubishi Electric Research Laboratories, Inc. | Method and system for generating multimodal digital images |
JP6633462B2 (ja) * | 2016-06-29 | 2020-01-22 | 株式会社東芝 | 情報処理装置および情報処理方法 |
US10140979B2 (en) * | 2016-08-10 | 2018-11-27 | Conduent Business Services, Llc | Modeling a class posterior probability of context dependent phonemes in a speech recognition system |
KR20180027887A (ko) * | 2016-09-07 | 2018-03-15 | 삼성전자주식회사 | 뉴럴 네트워크에 기초한 인식 장치 및 뉴럴 네트워크의 트레이닝 방법 |
CN110088797B (zh) * | 2016-12-19 | 2023-04-21 | 株式会社安川电机 | 工业设备图像识别处理器及控制器 |
KR20180092778A (ko) | 2017-02-10 | 2018-08-20 | 한국전자통신연구원 | 실감정보 제공 장치, 영상분석 서버 및 실감정보 제공 방법 |
WO2018159666A1 (en) * | 2017-03-01 | 2018-09-07 | Omron Corporation | Learning apparatus, learning result using apparatus, learning method and learning program |
WO2018170028A1 (en) * | 2017-03-14 | 2018-09-20 | Tupl, Inc | Automated decision making using staged machine learning |
JP6725452B2 (ja) * | 2017-05-26 | 2020-07-22 | 日本電信電話株式会社 | 分類装置、分類方法および分類プログラム |
US10346724B2 (en) * | 2017-06-22 | 2019-07-09 | Waymo Llc | Rare instance classifiers |
EP3660753A4 (en) * | 2017-07-25 | 2021-05-12 | The University Of Tokyo | LEARNING PROCEDURE, LEARNING PROGRAM, LEARNING DEVICE AND LEARNING SYSTEM |
JP6729516B2 (ja) | 2017-07-27 | 2020-07-22 | トヨタ自動車株式会社 | 識別装置 |
JP7294768B2 (ja) * | 2017-08-04 | 2023-06-20 | オムロン株式会社 | 画像処理システム |
GB2570433A (en) * | 2017-09-25 | 2019-07-31 | Nissan Motor Mfg Uk Ltd | Machine vision system |
JP7224757B2 (ja) | 2017-10-13 | 2023-02-20 | キヤノン株式会社 | 診断支援装置、情報処理方法、診断支援システム及びプログラム |
US11132605B2 (en) | 2017-11-20 | 2021-09-28 | International Business Machines Corporation | Cardinal sine as an activation function for universal classifier training data |
CN108229543A (zh) * | 2017-12-22 | 2018-06-29 | 中国科学院深圳先进技术研究院 | 图像分类模型设计方法及装置 |
US11829866B1 (en) * | 2017-12-27 | 2023-11-28 | Intuit Inc. | System and method for hierarchical deep semi-supervised embeddings for dynamic targeted anomaly detection |
KR102329592B1 (ko) * | 2017-12-30 | 2021-11-19 | 미디어 그룹 코 엘티디 | 재료 인식을 기반으로 하는 음식 준비 방법 및 시스템 |
US10679330B2 (en) * | 2018-01-15 | 2020-06-09 | Tata Consultancy Services Limited | Systems and methods for automated inferencing of changes in spatio-temporal images |
JP6766839B2 (ja) | 2018-03-14 | 2020-10-14 | オムロン株式会社 | 検査システム、画像識別システム、識別システム、識別器生成システム、及び学習データ生成装置 |
EP3779805A4 (en) * | 2018-03-26 | 2021-05-05 | Panasonic Intellectual Property Management Co., Ltd. | TREATMENT PROCESS AND TREATMENT DEVICE USING IT |
JP7166784B2 (ja) * | 2018-04-26 | 2022-11-08 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP7048423B2 (ja) | 2018-06-07 | 2022-04-05 | 大日本印刷株式会社 | 商品特定装置、プログラム及び学習方法 |
JP7056406B2 (ja) * | 2018-06-22 | 2022-04-19 | 日本電信電話株式会社 | センサノード及びデータセンタとして機能する装置、センサネットワーク、通信方法及びプログラム |
CN112384892A (zh) * | 2018-07-09 | 2021-02-19 | 富士通株式会社 | 信息处理装置、信息处理方法以及信息处理程序 |
JP6757378B2 (ja) | 2018-08-28 | 2020-09-16 | 株式会社モルフォ | 画像識別装置、画像識別方法及び画像識別プログラム |
JP6986503B2 (ja) * | 2018-09-10 | 2021-12-22 | 日立Astemo株式会社 | 電子制御装置、ニューラルネットワーク更新システム |
CN109190643A (zh) * | 2018-09-14 | 2019-01-11 | 华东交通大学 | 基于卷积神经网络中药识别方法及电子设备 |
CN109406118B (zh) * | 2018-10-15 | 2020-05-19 | 华中科技大学 | 一种基于层次卷积神经网络的机械故障预测方法 |
US10474713B1 (en) * | 2018-10-26 | 2019-11-12 | StradVision, Inc. | Learning method and learning device using multiple labeled databases with different label sets and testing method and testing device using the same |
CN109766928B (zh) * | 2018-12-21 | 2020-04-17 | 创新奇智(重庆)科技有限公司 | 一种基于图像的物体分类方法、系统和电子设备 |
US10867210B2 (en) * | 2018-12-21 | 2020-12-15 | Waymo Llc | Neural networks for coarse- and fine-object classifications |
JP6991960B2 (ja) * | 2018-12-28 | 2022-01-13 | Kddi株式会社 | 画像認識装置、画像認識方法及びプログラム |
JP7111088B2 (ja) * | 2019-01-24 | 2022-08-02 | カシオ計算機株式会社 | 画像検索装置、学習方法及びプログラム |
JP7286333B2 (ja) * | 2019-02-06 | 2023-06-05 | キヤノン株式会社 | 情報処理装置、情報処理装置の制御方法およびプログラム |
KR102312657B1 (ko) * | 2019-11-18 | 2021-10-15 | 아이브스 주식회사 | 인공지능을 이용한 음원 분류 장치 및 그 방법 |
US20230081648A1 (en) * | 2020-01-15 | 2023-03-16 | Rensselaer Polytechnic Institute | Trackerless 2d ultrasound frame to 3d image volume registration |
EP4156092A4 (en) * | 2020-05-21 | 2024-04-10 | IHI Corporation | IMAGE CLASSIFICATION DEVICE, IMAGE CLASSIFICATION METHOD AND IMAGE CLASSIFICATION PROGRAM |
CN111680753A (zh) * | 2020-06-10 | 2020-09-18 | 创新奇智(上海)科技有限公司 | 一种数据标注方法、装置、电子设备及存储介质 |
JP7227188B2 (ja) * | 2020-07-01 | 2023-02-21 | 株式会社モリタ製作所 | 識別装置、識別システム、識別方法、および識別用プログラム |
KR102236615B1 (ko) * | 2020-07-31 | 2021-04-06 | 주식회사 웨이센 | 복합 특성 분류와 공통 국소화를 위한 신경망 모델의 학습 방법 및 장치 |
CN114071106B (zh) * | 2020-08-10 | 2023-07-04 | 合肥君正科技有限公司 | 一种低功耗设备冷启动快速白平衡方法 |
CN112183639B (zh) * | 2020-09-30 | 2022-04-19 | 四川大学 | 一种矿物图像识别与分类方法 |
US20220172024A1 (en) * | 2020-11-30 | 2022-06-02 | Oracle International Corporation | Information Technology Service Incident Ticket Assignment |
US20220254144A1 (en) * | 2021-02-05 | 2022-08-11 | Home Depot Product Authority, Llc | Product image classification |
CN113642679B (zh) * | 2021-10-13 | 2021-12-28 | 山东凤和凰城市科技有限公司 | 多种类数据识别方法 |
KR102635607B1 (ko) * | 2021-11-04 | 2024-02-08 | 중앙대학교 산학협력단 | 코스-투-파인 컨볼루션 뉴럴 네트워크 기반 다중 레이블 클래스 분류 방법 및 장치 |
KR20230105303A (ko) | 2022-01-03 | 2023-07-11 | 주식회사 에스아이에이 | 모호한 라벨을 이용한 객체 예측 모델 학습 방법 |
KR102437285B1 (ko) * | 2022-01-03 | 2022-08-29 | 주식회사 에스아이에이 | 모호한 라벨을 이용한 객체 예측 모델 학습 방법 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5313532A (en) * | 1990-01-23 | 1994-05-17 | Massachusetts Institute Of Technology | Recognition of patterns in images |
DE4100500A1 (de) * | 1991-01-10 | 1992-07-16 | Bodenseewerk Geraetetech | Signalverarbeitungsanordnung zur klassifizierung von objekten aufgrund der signale von sensoren |
US5359699A (en) * | 1991-12-02 | 1994-10-25 | General Electric Company | Method for using a feed forward neural network to perform classification with highly biased data |
JP2722906B2 (ja) * | 1991-12-27 | 1998-03-09 | ダイキン工業株式会社 | 未知数量推定方法およびその装置 |
US5311600A (en) * | 1992-09-29 | 1994-05-10 | The Board Of Trustees Of The Leland Stanford Junior University | Method of edge detection in optical images using neural network classifier |
US5619619A (en) * | 1993-03-11 | 1997-04-08 | Kabushiki Kaisha Toshiba | Information recognition system and control system using same |
KR0170656B1 (ko) * | 1994-08-17 | 1999-03-30 | 김광호 | 필기체문자 인식방법 및 장치 |
US5835633A (en) * | 1995-11-20 | 1998-11-10 | International Business Machines Corporation | Concurrent two-stage multi-network optical character recognition system |
US6009418A (en) * | 1996-05-02 | 1999-12-28 | Cooper; David L. | Method and apparatus for neural networking using semantic attractor architecture |
US5995651A (en) * | 1996-07-11 | 1999-11-30 | Duke University | Image content classification methods, systems and computer programs using texture patterns |
US6549661B1 (en) * | 1996-12-25 | 2003-04-15 | Hitachi, Ltd. | Pattern recognition apparatus and pattern recognition method |
US6650779B2 (en) * | 1999-03-26 | 2003-11-18 | Georgia Tech Research Corp. | Method and apparatus for analyzing an image to detect and identify patterns |
US7016885B1 (en) * | 2001-08-28 | 2006-03-21 | University Of Central Florida Research Foundation, Inc. | Self-designing intelligent signal processing system capable of evolutional learning for classification/recognition of one and multidimensional signals |
US7752151B2 (en) * | 2002-06-05 | 2010-07-06 | Knowmtech, Llc | Multilayer training in a physical neural network formed utilizing nanotechnology |
KR100442835B1 (ko) * | 2002-08-13 | 2004-08-02 | 삼성전자주식회사 | 인공 신경망을 이용한 얼굴 인식 방법 및 장치 |
US7440600B2 (en) * | 2003-04-23 | 2008-10-21 | Carestream Health, Inc. | System and method for assigning mammographic view and laterality to individual images in groups of digitized mammograms |
US7272261B2 (en) * | 2004-06-04 | 2007-09-18 | Xerox Corporation | Method and system for classifying scanned-media |
US7620819B2 (en) * | 2004-10-04 | 2009-11-17 | The Penn State Research Foundation | System and method for classifying regions of keystroke density with a neural network |
CN101916359B (zh) * | 2005-01-27 | 2012-06-20 | 剑桥研究和仪器设备股份有限公司 | 把样本的不同区域分类到相应类别的方法和设备 |
CN101082836A (zh) * | 2007-06-29 | 2007-12-05 | 华中科技大学 | 一种整合语音输入和手写输入功能的汉字输入系统 |
US20090110062A1 (en) * | 2007-10-30 | 2009-04-30 | The Hong Kong University Of Science And Technology | Optimal heegard-berger coding schemes |
US8199999B2 (en) * | 2008-06-17 | 2012-06-12 | Cambridge Research & Instrumentation, Inc. | Image classifier training |
CN101667252B (zh) * | 2009-10-15 | 2011-07-20 | 哈尔滨工业大学 | 基于art2a-dwnn的通信信号调制方式的分类识别方法 |
CN101957920B (zh) * | 2010-09-08 | 2012-07-11 | 中国人民解放军国防科学技术大学 | 基于数字视频的车牌查找方法 |
CN103310227A (zh) * | 2012-03-16 | 2013-09-18 | 上海联影医疗科技有限公司 | 基于神经网络的自动窗宽窗位提取方法 |
CN102855479A (zh) * | 2012-07-24 | 2013-01-02 | 苏州工业园区七星电子有限公司 | 一种印刷体汉字识别系统 |
CN104346622A (zh) * | 2013-07-31 | 2015-02-11 | 富士通株式会社 | 卷积神经网络分类器及其分类方法和训练方法 |
US9129190B1 (en) * | 2013-12-04 | 2015-09-08 | Google Inc. | Identifying objects in images |
-
2016
- 2016-02-19 CN CN201610094433.7A patent/CN105938558B/zh active Active
- 2016-02-24 EP EP16157040.3A patent/EP3065090B1/en active Active
- 2016-02-25 US US15/053,642 patent/US9779354B2/en active Active
- 2016-02-25 JP JP2016034784A patent/JP6671028B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US20160260014A1 (en) | 2016-09-08 |
EP3065090B1 (en) | 2020-11-04 |
CN105938558A (zh) | 2016-09-14 |
EP3065090A2 (en) | 2016-09-07 |
US9779354B2 (en) | 2017-10-03 |
EP3065090A3 (en) | 2017-01-25 |
CN105938558B (zh) | 2021-02-09 |
JP2017084320A (ja) | 2017-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6671028B2 (ja) | 学習方法 | |
CN108805170B (zh) | 形成用于全监督式学习的数据集 | |
US10438091B2 (en) | Method and apparatus for recognizing image content | |
JP6397986B2 (ja) | 画像オブジェクト領域の認識方法及び装置 | |
KR101942219B1 (ko) | 컨볼루션 뉴럴 네트워크를 이용한 폐기물 이미지 식별 장치 및 방법 | |
US11886990B2 (en) | Classification device, classification method, and computer program product | |
JP5782037B2 (ja) | 排他的分類器による一般物体の画像認識装置及び方法 | |
US11443514B2 (en) | Recognizing minutes-long activities in videos | |
GB2555136A (en) | A method for analysing media content | |
JP2018205920A (ja) | 学習プログラム、学習方法および物体検知装置 | |
JP2021184299A (ja) | 学習用データ作成装置、学習用モデル作成システム、学習用データ作成方法、及びプログラム | |
US11526708B2 (en) | Information processing device, information processing method, and recording medium | |
US20150139546A1 (en) | Image segmenting apparatus and method | |
CN117992765B (zh) | 基于动态新兴标记的偏标签学习方法、装置、设备及介质 | |
Cogswell et al. | Combining the best of graphical models and convnets for semantic segmentation | |
CN104899544A (zh) | 图像处理装置和图像处理方法 | |
US12073602B2 (en) | Automated key frame selection | |
KR102342967B1 (ko) | 문맥 정보를 활용하는 분류기 및 이의 분류 방법 | |
KR20150103443A (ko) | 멀티클래스 분류 장치, 그 방법 및 컴퓨터 프로그램이 기록된 기록매체 | |
JP2016018421A (ja) | 画像分類装置、ナンバープレート読取装置、ナンバープレート読取システムおよび画像分類方法 | |
US20240135708A1 (en) | Permutation invariant convolution (pic) for recognizing long-range activities | |
CN115049889A (zh) | 存储介质和推理方法 | |
CN103150574B (zh) | 基于最邻近标签传播算法的图像型垃圾邮件检测方法 | |
CN109325521B (zh) | 用于虚拟人物的检测方法及装置 | |
US20240233328A1 (en) | Non-transitory computer-readable recording medium, determination method, and information processing apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180910 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190710 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190723 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190913 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200214 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6671028 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |