JP7447221B1 - 画像認識装置、プログラム、及び画像認識方法 - Google Patents
画像認識装置、プログラム、及び画像認識方法 Download PDFInfo
- Publication number
- JP7447221B1 JP7447221B1 JP2022180500A JP2022180500A JP7447221B1 JP 7447221 B1 JP7447221 B1 JP 7447221B1 JP 2022180500 A JP2022180500 A JP 2022180500A JP 2022180500 A JP2022180500 A JP 2022180500A JP 7447221 B1 JP7447221 B1 JP 7447221B1
- Authority
- JP
- Japan
- Prior art keywords
- image
- support
- images
- candidate images
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000004364 calculation method Methods 0.000 claims description 60
- 238000000605 extraction Methods 0.000 claims description 38
- 239000000284 extract Substances 0.000 claims description 23
- 238000006243 chemical reaction Methods 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 11
- 238000010586 diagram Methods 0.000 abstract description 9
- 238000013500 data storage Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 3
- 230000005484 gravity Effects 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 241001522296 Erithacus rubecula Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007616 round robin method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
[先行技術文献]
[非特許文献]
[非特許文献1]Lihe Yang, Wei Zhuo, Lei Qi, Yinghuan Shi, Yang Gao: Mining Latent Classes for Few-shot Segmentation (2021), The IEEE International Conference on ComputerVision(ICCV)
Claims (11)
- クエリ画像を取得するクエリ画像取得部と、
認識対象が撮影された複数の候補画像のそれぞれと前記クエリ画像とを比較することによって、前記複数の候補画像の一部をサポート画像として選択するサポート画像選択部と、
前記サポート画像選択部によって選択された前記サポート画像と、前記サポート画像における被写体の位置を示すアノテーションデータとを含むサポートデータを用いて、前記クエリ画像に含まれる認識対象の位置を推定する照合推論処理部と
を備え、
前記照合推論処理部は、
前記サポートデータに含まれる前記サポート画像及び前記アノテーションデータに基づいて、前記被写体の特徴を表すプロトタイプを算出するプロトタイプ算出処理部と、
前記クエリ画像の複数の領域のそれぞれについて、前記プロトタイプ算出処理部によって算出された前記プロトタイプとの類似度に基づいて、当該領域が認識対象であるか否かを判定することによって、前記クエリ画像に含まれる認識対象の位置を推定するプロトタイプ照合処理部と
を有し、
前記サポート画像選択部は、前記複数の候補画像のそれぞれと前記クエリ画像との類似度を判定し、判定した前記類似度に基づいて、前記複数の候補画像から複数の前記サポート画像を選択し、
前記照合推論処理部は、前記サポート画像選択部によって選択された前記複数のサポート画像と、当該複数のサポート画像のそれぞれの前記アノテーションデータとを含む前記サポートデータを用いて、前記クエリ画像に含まれる認識対象の位置を推定する、
画像認識装置。 - 前記サポート画像選択部は、
前記複数の候補画像及び前記クエリ画像のそれぞれを統計情報に変換する画像変換処理部と、
前記複数の候補画像のそれぞれの前記統計情報と、前記クエリ画像の前記統計情報との比較演算を実行することによって前記複数の候補画像のそれぞれと前記クエリ画像との類似度を判定する比較計算部と
を有する、請求項1に記載の画像認識装置。 - 前記画像変換処理部は、前記複数の候補画像及び前記クエリ画像のそれぞれに対して、HSV変換、ヒストグラム算出、フィルタ処理、及び特徴点抽出の少なくともいずれかを施すことによって、前記統計情報に変換する、請求項2に記載の画像認識装置。
- 前記比較計算部は、前記複数の候補画像のそれぞれの前記統計情報と、前記クエリ画像の前記統計情報とに対して、SSIM(Structual SIMilarity)、PSNR(Peak Signal to Noise Ratio)、及びデータ間距離計算の少なくともいずれかを実行することによって、前記複数の候補画像のそれぞれと前記クエリ画像との類似度を判定する、請求項2に記載の画像認識装置。
- 前記サポート画像選択部は、前記複数の候補画像から、前記類似度が高い順に予め定められた数の候補画像を特定し、特定した複数の前記候補画像を前記複数のサポート画像として選択する、請求項1に記載の画像認識装置。
- 認識対象が撮影された複数の画像を含むデータセットから、前記複数の候補画像を抽出する候補抽出部
を更に備え、
前記サポート画像選択部は、前記候補抽出部によって抽出された前記複数の画像のそれぞれと前記クエリ画像とを比較する、請求項1に記載の画像認識装置。 - 前記候補抽出部は、前記データセットから、予め定められた数の前記候補画像をランダムに抽出する、請求項6に記載の画像認識装置。
- 前記サポート画像選択部は、前記複数の候補画像のうち前記類似度が予め定められた類似度閾値より高い複数の前記候補画像の数が予め定められた数よりも多い場合、当該複数の候補画像から前記予め定められた数の前記候補画像を特定し、特定した複数の前記候補画像を前記複数のサポート画像として選択する、請求項7に記載の画像認識装置。
- 前記複数の候補画像のうち前記類似度が前記類似度閾値より高い前記候補画像の数が前記予め定められた数よりも少ない場合、前記サポート画像選択部は、前記類似度が前記類似度閾値より高い候補画像を前記複数のサポート画像の一部として選択し、前記候補抽出部は、前記データセットから抽出した前記複数の候補画像以外の複数の候補画像を前記データセットから改めて抽出し、前記サポート画像選択部は、前記候補抽出部が改めて抽出した前記複数の候補画像のそれぞれと前記クエリ画像との類似度を判定し、前記類似度が前記類似度閾値より高い候補画像を、前記複数のサポート画像の他の一部として選択する、請求項8に記載の画像認識装置。
- コンピュータを、請求項1から9のいずれか一項に記載の画像認識装置として機能させるためのプログラム。
- コンピュータによって実行される画像認識方法であって、
クエリ画像を取得するクエリ画像取得段階と、
認識対象が撮影された複数の候補画像のそれぞれと前記クエリ画像とを比較することによって、前記複数の候補画像の一部をサポート画像として選択するサポート画像選択段階と、
前記サポート画像選択段階において選択された前記サポート画像と、前記サポート画像における被写体の位置を示すアノテーションデータとを含むサポートデータを用いて、前記クエリ画像に含まれる認識対象の位置を推定する照合推論処理段階と
を備え、
前記照合推論処理段階は、
前記サポートデータに含まれる前記サポート画像及び前記アノテーションデータに基づいて、前記被写体の特徴を表すプロトタイプを算出するプロトタイプ算出処理段階と、
前記クエリ画像の複数の領域のそれぞれについて、前記プロトタイプ算出処理段階において算出された前記プロトタイプとの類似度に基づいて、当該領域が認識対象であるか否かを判定することによって、前記クエリ画像に含まれる認識対象の位置を推定するプロトタイプ照合処理段階と
を有し、
前記サポート画像選択段階は、前記複数の候補画像のそれぞれと前記クエリ画像との類似度を判定し、判定した前記類似度に基づいて、前記複数の候補画像から複数の前記サポート画像を選択し、
前記照合推論処理段階は、前記サポート画像選択段階において選択された前記複数のサポート画像と、当該複数のサポート画像のそれぞれの前記アノテーションデータとを含む前記サポートデータを用いて、前記クエリ画像に含まれる認識対象の位置を推定する、
画像認識方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022180500A JP7447221B1 (ja) | 2022-11-10 | 2022-11-10 | 画像認識装置、プログラム、及び画像認識方法 |
JP2024023167A JP7564392B2 (ja) | 2022-11-10 | 2024-02-19 | 画像認識装置、プログラム、及び画像認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022180500A JP7447221B1 (ja) | 2022-11-10 | 2022-11-10 | 画像認識装置、プログラム、及び画像認識方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024023167A Division JP7564392B2 (ja) | 2022-11-10 | 2024-02-19 | 画像認識装置、プログラム、及び画像認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7447221B1 true JP7447221B1 (ja) | 2024-03-11 |
JP2024070105A JP2024070105A (ja) | 2024-05-22 |
Family
ID=90183482
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022180500A Active JP7447221B1 (ja) | 2022-11-10 | 2022-11-10 | 画像認識装置、プログラム、及び画像認識方法 |
JP2024023167A Active JP7564392B2 (ja) | 2022-11-10 | 2024-02-19 | 画像認識装置、プログラム、及び画像認識方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024023167A Active JP7564392B2 (ja) | 2022-11-10 | 2024-02-19 | 画像認識装置、プログラム、及び画像認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP7447221B1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7564392B2 (ja) | 2022-11-10 | 2024-10-08 | ソフトバンク株式会社 | 画像認識装置、プログラム、及び画像認識方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112364870A (zh) | 2020-10-22 | 2021-02-12 | 中国科学院大学 | 一种基于特征和谐激活的小样本语义分割方法 |
JP7313501B1 (ja) | 2022-03-03 | 2023-07-24 | ソフトバンク株式会社 | 画像認識装置、プログラム、画像認識方法、及び機械学習方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7447221B1 (ja) | 2022-11-10 | 2024-03-11 | ソフトバンク株式会社 | 画像認識装置、プログラム、及び画像認識方法 |
-
2022
- 2022-11-10 JP JP2022180500A patent/JP7447221B1/ja active Active
-
2024
- 2024-02-19 JP JP2024023167A patent/JP7564392B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112364870A (zh) | 2020-10-22 | 2021-02-12 | 中国科学院大学 | 一种基于特征和谐激活的小样本语义分割方法 |
JP7313501B1 (ja) | 2022-03-03 | 2023-07-24 | ソフトバンク株式会社 | 画像認識装置、プログラム、画像認識方法、及び機械学習方法 |
Non-Patent Citations (6)
Title |
---|
Hongsheng Wang et al.,Few-Shot Segmentation via Rich Prototype Generation and Recurrent Prediction Enhancement,[online],2022年10月03日,[retrieved on 2024-02-05], <URL: https://arxiv.org/abs/2210.00765> |
Nanqing Dong et al.,Few-Shot Semantic Segmentation with Prototype Learning,[online],2018年,[retrieved on 2023-12-14],<URL: http://bmvc2018.org/contents/papers/0255.pdf> |
OKAZAWA, Atsuro,Interclass Prototype Relation for Few-Shot Segmentation,[online],2022年10月23日,[retrieved on 2023-12-14], <URL:https://www.ecva.net/papers/eccv_2022/papers_ECCV/papers/136890358.pdf> |
Pinzhuo Tian et al.,Differentiable Meta-learning Model for Few-shot Semantic Segmentation,[online],2019年11月23日,[retrieved on 2023-12-14],<URL: https://arxiv.org/abs/1911.10371> |
Xiaolin Zhang et al.,SG-One: Similarity Guidance Network for One-Shot Semantic Segmentation,[online],2020年05月12日,[retrieved on 2023-12-14],<URL: https://arxiv.org/abs/1810.09091> |
本部勇真 柳井啓司,食事画像に対するFew/Zero-shotSegmentation,[online],2021年07月21日,[retrieved on 2023-12-14],<URL: https://mm.cs.uec.ac.jp/pub/conf21/210602honbu_0.pdf> |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7564392B2 (ja) | 2022-11-10 | 2024-10-08 | ソフトバンク株式会社 | 画像認識装置、プログラム、及び画像認識方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2024070105A (ja) | 2024-05-22 |
JP2024070271A (ja) | 2024-05-22 |
JP7564392B2 (ja) | 2024-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110020592B (zh) | 物体检测模型训练方法、装置、计算机设备及存储介质 | |
US9384385B2 (en) | Face recognition using gradient based feature analysis | |
JP7564392B2 (ja) | 画像認識装置、プログラム、及び画像認識方法 | |
US11301509B2 (en) | Image search system, image search method, and program | |
WO2017133188A1 (zh) | 一种特征集确定的方法及装置 | |
WO2016170965A1 (ja) | オブジェクト検出方法及び画像検索システム | |
CN110807473A (zh) | 目标检测方法、装置及计算机存储介质 | |
US20220180369A1 (en) | Fraud detection device, fraud detection method, and fraud detection program | |
JP7502518B2 (ja) | 画像認識装置、プログラム、画像認識方法、及び機械学習方法 | |
KR20170055393A (ko) | 사용자 인증을 위한 등록 데이터베이스의 적응적 갱신 방법 및 장치 | |
CN113963197A (zh) | 图像识别方法、装置、电子设备和可读存储介质 | |
Korytkowski | Novel visual information indexing in relational databases | |
JP2014010633A (ja) | 画像認識装置、画像認識方法、及び画像認識プログラム | |
US10509986B2 (en) | Image similarity determination apparatus and image similarity determination method | |
KR102399673B1 (ko) | 어휘 트리에 기반하여 객체를 인식하는 방법 및 장치 | |
Yang et al. | Scene classification-oriented saliency detection via the modularized prescription | |
Liang et al. | Sketch-based retrieval using content-aware hashing | |
JP2017084006A (ja) | 画像処理装置およびその方法 | |
JP2016081472A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP6341843B2 (ja) | 画像検索装置、及び画像検索システム | |
CN114399791A (zh) | 一种行人检测方法、装置、设备和介质 | |
JP7382479B1 (ja) | 画像処理装置、プログラム、及び画像処理方法 | |
CN107735800B (zh) | 一种图像处理方法以及相关装置 | |
WO2020065953A1 (en) | Empirical risk estimation system, empirical risk estimation method, and empirical risk estimation program | |
Ge et al. | Active contour evolved by joint probability classification on Riemannian manifold |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230208 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20231016 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240228 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7447221 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |