JP2023128430A - 画像認識装置、プログラム、画像認識方法、及び機械学習方法 - Google Patents
画像認識装置、プログラム、画像認識方法、及び機械学習方法 Download PDFInfo
- Publication number
- JP2023128430A JP2023128430A JP2022032769A JP2022032769A JP2023128430A JP 2023128430 A JP2023128430 A JP 2023128430A JP 2022032769 A JP2022032769 A JP 2022032769A JP 2022032769 A JP2022032769 A JP 2022032769A JP 2023128430 A JP2023128430 A JP 2023128430A
- Authority
- JP
- Japan
- Prior art keywords
- processing unit
- image
- support
- prototype
- prototypes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000010801 machine learning Methods 0.000 title claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 301
- 238000004364 calculation method Methods 0.000 claims abstract description 112
- 238000006243 chemical reaction Methods 0.000 claims description 30
- 238000010606 normalization Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 15
- 238000000926 separation method Methods 0.000 abstract description 6
- 238000003384 imaging method Methods 0.000 abstract 1
- 238000000605 extraction Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 10
- 239000000284 extract Substances 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000012795 verification Methods 0.000 description 6
- 230000005484 gravity Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000003709 image segmentation Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 241001522296 Erithacus rubecula Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
[先行技術文献]
[非特許文献]
[非特許文献1]Lihe Yang, Wei Zhuo, Lei Qi, Yinghuan Shi, Yang Gao: Mining Latent Classes for Few-shot Segmentation (2021), The IEEE International Conference on ComputerVision(ICCV)
機械学習方法。
Claims (19)
- 認識対象が撮影されたサポート画像、及び前記サポート画像における被写体の位置を示すアノテーションデータを含むサポートデータを取得するサポートデータ取得部と、
前記サポートデータ取得部が取得したサポートデータを用いて、クエリ画像に含まれる認識対象の位置を推定する照合推論処理部と
を備え、
前記照合推論処理部は、
前記サポートデータに含まれる前記サポート画像及び前記アノテーションデータに基づいて、前記被写体の特徴を表すプロトタイプを算出するプロトタイプ算出処理部と、
前記プロトタイプ算出処理部によって算出された複数の前記プロトタイプ同士の距離を算出する距離算出処理部と、
を有する、
画像認識装置。 - 前記サポートデータは、複数の前記サポート画像及び前記アノテーションデータの組み合わせを含み、
前記プロトタイプ算出処理部は、前記複数のサポート画像に含まれる複数の被写体のそれぞれについて、前記プロトタイプを算出する、請求項1に記載の画像認識装置。 - 前記サポートデータ取得部は、複数の前記サポートデータ及び前記クエリ画像を含むバッチに含まれる当該複数のサポートデータを取得し、
前記プロトタイプ算出処理部は、前記バッチに含まれる前記複数のサポートデータの前記複数のサポート画像に含まれる複数の被写体のそれぞれについて、前記プロトタイプを算出する、請求項2に記載の画像認識装置。 - 前記照合推論処理部は、
前記距離算出処理部によって算出された前記複数のプロトタイプ同士の距離を用いて、前記クエリ画像に含まれる認識対象の位置を推定するプロトタイプ照合処理部
を有する、請求項1から3のいずれか一項に記載の画像認識装置。 - 前記照合推論処理部は、
前記距離算出処理部によって算出された前記複数のプロトタイプ同士の距離に基づいて、前記プロトタイプ算出処理部によって算出された前記サポート画像の前記認識対象のプロトタイプを変換するデータ変換処理部と、
前記データ変換処理部によって変換された前記プロトタイプを用いて、前記クエリ画像に含まれる認識対象の位置を推定するプロトタイプ照合処理部と
を有する、請求項1から3のいずれか一項に記載の画像認識装置。 - 前記データ変換処理部は、
前記距離算出処理部によって算出された前記複数のプロトタイプ同士の距離に対して統計計算を行うことによって、前記プロトタイプ算出処理部によって算出されたプロトタイプを正規化するデータ正規化処理部
を有する、請求項5に記載の画像認識装置。 - 前記データ正規化処理部は、前記複数のプロトタイプ同士の距離の標準偏差及び平均を算出して、算出結果に基づいて前記複数のプロトタイプを正規化する、請求項6に記載の画像認識装置。
- 前記データ正規化処理部は、前記複数のプロトタイプ同士の距離の最大値及び最小値を算出して、算出結果に基づいて前記複数のプロトタイプを正規化する、請求項6に記載の画像認識装置。
- 前記距離算出処理部は、前記プロトタイプ算出処理部によって算出された前記複数のプロトタイプ同士のユークリッド距離を算出する、請求項1から8のいずれか一項に記載の画像認識装置。
- 前記距離算出処理部は、前記プロトタイプ算出処理部によって算出された前記複数のプロトタイプ同士のコサイン類似度を算出する、請求項1から8のいずれか一項に記載の画像認識装置。
- 前記照合推論処理部は、
前記プロトタイプ算出処理部によって算出された複数の前記プロトタイプを用いて、複数の前記被写体毎の前記クエリ画像における位置を推定する多段推定処理部と、
前記多段推定処理部による前記複数の被写体毎の推定結果を統合して、前記クエリ画像に含まれる認識対象の位置を推定する位置推定処理部と
を有する、請求項1から10のいずれか一項に記載の画像認識装置。 - 前記多段推定処理部は、前記クエリ画像の複数の領域のそれぞれについて、前記複数のプロトタイプのそれぞれとの類似度を算出し、
前記位置推定処理部は、前記クエリ画像の前記複数の領域のそれぞれについて、前記複数のプロトタイプのそれぞれとの類似度に基づいて、当該領域が認識対象であるか否かを判定することによって、前記クエリ画像に含まれる認識対象の位置を推定する、請求項11に記載の画像認識装置。 - 認識対象の被写体を含む複数の被写体が撮影されたサポート画像、及び前記サポート画像における被写体の位置を示すアノテーションデータを含むサポートデータを取得するサポートデータ取得部と、
前記サポートデータ取得部が取得したサポートデータを用いて、クエリ画像に含まれる認識対象の位置を推定する照合推論処理部と
を備え、
前記照合推論処理部は、
前記サポートデータに含まれる前記サポート画像及び前記アノテーションデータを用いて、それぞれが前記複数の被写体の特徴を表す複数のプロトタイプを算出するプロトタイプ算出処理部と、
前記複数のプロトタイプを用いて、前記複数の被写体毎の前記クエリ画像における位置を推定する多段推定処理部と、
前記多段推定処理部による前記複数の被写体毎の推定結果を統合して、前記クエリ画像に含まれる認識対象の位置を推定する位置推定処理部と
を有する、画像認識装置。 - 前記多段推定処理部は、前記クエリ画像の複数の領域のそれぞれについて、前記複数のプロトタイプのそれぞれとの類似度を算出し、
前記位置推定処理部は、前記クエリ画像の前記複数の領域のそれぞれについて、前記複数のプロトタイプのそれぞれとの類似度に基づいて、当該領域が認識対象であるか否かを判定することによって、前記クエリ画像に含まれる認識対象の位置を推定する、請求項13に記載の画像認識装置。 - コンピュータを、請求項1から14のいずれか一項に記載の画像認識装置として機能させるためのプログラム。
- コンピュータによって実行される画像認識方法であって、
認識対象が撮影されたサポート画像、及び前記サポート画像における被写体の位置を示すアノテーションデータを含むサポートデータを取得するサポートデータ取得段階と、
前記サポートデータ取得段階において取得したサポートデータを用いて、クエリ画像に含まれる認識対象の位置を推定する照合推論処理段階と
を備え、
前記照合推論処理段階は、
前記サポートデータに含まれる前記サポート画像及び前記アノテーションデータを用いて、前記被写体の特徴を表すプロトタイプを算出するプロトタイプ算出処理段階と、
前記プロトタイプ算出処理段階において算出された複数の前記プロトタイプ同士の距離を算出する距離算出段階と、
を有する、
画像認識方法。 - コンピュータによって実行される画像認識方法であって、
認識対象の被写体を含む複数の被写体が撮影されたサポート画像、及び前記サポート画像における被写体の位置を示すアノテーションデータを含むサポートデータを取得するサポートデータ取得段階と、
前記サポートデータ取得段階において取得したサポートデータを用いて、クエリ画像に含まれる認識対象の位置を推定する照合推論処理段階と
を備え、
前記照合推論処理段階は、
前記サポートデータに含まれる前記サポート画像及び前記アノテーションデータを用いて、それぞれが前記複数の被写体の特徴を表す複数のプロトタイプを算出するプロトタイプ算出処理段階と、
前記複数のプロトタイプを用いて、前記複数の被写体毎の前記クエリ画像における位置を推定する多段推定処理段階と、
前記多段推定処理段階における前記複数の被写体毎の推定結果を統合して、前記クエリ画像に含まれる認識対象の位置を推定する位置推定処理段階と
を有する、画像認識方法。 - コンピュータによって実行される機械学習方法であって、
認識対象が撮影されたサポート画像、及び前記サポート画像における被写体の位置を示すアノテーションデータを含むサポートデータを取得するサポートデータ取得段階と、
前記サポートデータ取得段階において取得したサポートデータを用いて、クエリ画像に含まれる認識対象の位置を推定する照合推論処理段階と
を備え、
前記照合推論処理段階は、
前記サポートデータに含まれる前記サポート画像及び前記アノテーションデータを用いて、前記被写体の特徴を表すプロトタイプを算出するプロトタイプ算出処理段階と、
前記プロトタイプ算出処理段階において算出された複数の前記プロトタイプ同士の距離を算出する距離算出段階と、
を有する、
機械学習方法。 - コンピュータによって実行される機械学習方法であって、
認識対象の被写体を含む複数の被写体が撮影されたサポート画像、及び前記サポート画像における被写体の位置を示すアノテーションデータを含むサポートデータを取得するサポートデータ取得段階と、
前記サポートデータ取得段階において取得したサポートデータを用いて、クエリ画像に含まれる認識対象の位置を推定する照合推論処理段階と
を備え、
前記照合推論処理段階は、
前記サポートデータに含まれる前記サポート画像及び前記アノテーションデータを用いて、それぞれが前記複数の被写体の特徴を表す複数のプロトタイプを算出するプロトタイプ算出処理段階と、
前記複数のプロトタイプを用いて、前記複数の被写体毎の前記クエリ画像における位置を推定する多段推定処理段階と、
前記多段推定処理段階における前記複数の被写体毎の推定結果を統合して、前記クエリ画像に含まれる認識対象の位置を推定する位置推定処理段階と
を有する、機械学習方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022032769A JP7313501B1 (ja) | 2022-03-03 | 2022-03-03 | 画像認識装置、プログラム、画像認識方法、及び機械学習方法 |
JP2023066653A JP7502518B2 (ja) | 2022-03-03 | 2023-04-14 | 画像認識装置、プログラム、画像認識方法、及び機械学習方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022032769A JP7313501B1 (ja) | 2022-03-03 | 2022-03-03 | 画像認識装置、プログラム、画像認識方法、及び機械学習方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023066653A Division JP7502518B2 (ja) | 2022-03-03 | 2023-04-14 | 画像認識装置、プログラム、画像認識方法、及び機械学習方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7313501B1 JP7313501B1 (ja) | 2023-07-24 |
JP2023128430A true JP2023128430A (ja) | 2023-09-14 |
Family
ID=87428159
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022032769A Active JP7313501B1 (ja) | 2022-03-03 | 2022-03-03 | 画像認識装置、プログラム、画像認識方法、及び機械学習方法 |
JP2023066653A Active JP7502518B2 (ja) | 2022-03-03 | 2023-04-14 | 画像認識装置、プログラム、画像認識方法、及び機械学習方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023066653A Active JP7502518B2 (ja) | 2022-03-03 | 2023-04-14 | 画像認識装置、プログラム、画像認識方法、及び機械学習方法 |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP7313501B1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7447221B1 (ja) | 2022-11-10 | 2024-03-11 | ソフトバンク株式会社 | 画像認識装置、プログラム、及び画像認識方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004062505A (ja) * | 2002-07-29 | 2004-02-26 | Fuji Xerox Co Ltd | 画像処理装置 |
JP2021089730A (ja) * | 2019-12-03 | 2021-06-10 | アイデミア・アイデンティティ・アンド・セキュリティー・フランス | 畳み込みニューラルネットワークによって、入力画像内で可視である少なくとも1つの対象要素を検出する方法 |
JP2021111299A (ja) * | 2020-01-16 | 2021-08-02 | 沖電気工業株式会社 | 学習装置、学習方法、学習プログラム、識別装置、識別方法および識別プログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113673607A (zh) | 2021-08-24 | 2021-11-19 | 支付宝(杭州)信息技术有限公司 | 图像标注模型的训练及图像标注的方法及装置 |
-
2022
- 2022-03-03 JP JP2022032769A patent/JP7313501B1/ja active Active
-
2023
- 2023-04-14 JP JP2023066653A patent/JP7502518B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004062505A (ja) * | 2002-07-29 | 2004-02-26 | Fuji Xerox Co Ltd | 画像処理装置 |
JP2021089730A (ja) * | 2019-12-03 | 2021-06-10 | アイデミア・アイデンティティ・アンド・セキュリティー・フランス | 畳み込みニューラルネットワークによって、入力画像内で可視である少なくとも1つの対象要素を検出する方法 |
JP2021111299A (ja) * | 2020-01-16 | 2021-08-02 | 沖電気工業株式会社 | 学習装置、学習方法、学習プログラム、識別装置、識別方法および識別プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7313501B1 (ja) | 2023-07-24 |
JP2023129401A (ja) | 2023-09-14 |
JP7502518B2 (ja) | 2024-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11610384B2 (en) | Zero-shot object detection | |
CN110020592B (zh) | 物体检测模型训练方法、装置、计算机设备及存储介质 | |
US11941845B2 (en) | Apparatus and method for estimating camera pose | |
US9384385B2 (en) | Face recognition using gradient based feature analysis | |
US9910847B2 (en) | Language identification | |
JP5565190B2 (ja) | 学習モデル作成プログラム、画像識別情報付与プログラム、学習モデル作成装置及び画像識別情報付与装置 | |
CN111079785A (zh) | 一种图像识别方法、装置及终端设备 | |
WO2016015621A1 (zh) | 人脸图片人名识别方法和系统 | |
US20220180369A1 (en) | Fraud detection device, fraud detection method, and fraud detection program | |
JP7502518B2 (ja) | 画像認識装置、プログラム、画像認識方法、及び機械学習方法 | |
JP2018045302A (ja) | 情報処理装置、情報処理方法及びプログラム | |
KR20190018274A (ko) | 이미지에 포함된 특징 포인트의 시간 또는 공간의 움직임에 기초하여 이미지에 존재하는 피사체를 인식하는 장치 및 방법 | |
CN112101483B (zh) | 图像聚类方法、装置电子设备、计算机可读存储介质 | |
JP7447221B1 (ja) | 画像認識装置、プログラム、及び画像認識方法 | |
CN116844006A (zh) | 一种目标识别方法、装置、电子设备及可读存储介质 | |
WO2016149937A1 (en) | Neural network classification through decomposition | |
KR102399673B1 (ko) | 어휘 트리에 기반하여 객체를 인식하는 방법 및 장치 | |
JP2017084006A (ja) | 画像処理装置およびその方法 | |
CN113177479B (zh) | 图像分类方法、装置、电子设备及存储介质 | |
JP6341843B2 (ja) | 画像検索装置、及び画像検索システム | |
CN114299509A (zh) | 一种获取信息的方法、装置、设备及介质 | |
JP7382479B1 (ja) | 画像処理装置、プログラム、及び画像処理方法 | |
CN107735800B (zh) | 一种图像处理方法以及相关装置 | |
US20230035922A1 (en) | Identification method, storage medium, and identification device | |
US20220318359A1 (en) | Method and apparatus for deep learning-based real-time on-device authentication |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220303 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230414 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230620 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230711 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7313501 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |