JP6905603B2 - 画像検索方法、装置、機器および読み取り可能な記憶媒体 - Google Patents
画像検索方法、装置、機器および読み取り可能な記憶媒体 Download PDFInfo
- Publication number
- JP6905603B2 JP6905603B2 JP2019571060A JP2019571060A JP6905603B2 JP 6905603 B2 JP6905603 B2 JP 6905603B2 JP 2019571060 A JP2019571060 A JP 2019571060A JP 2019571060 A JP2019571060 A JP 2019571060A JP 6905603 B2 JP6905603 B2 JP 6905603B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- image
- features
- cluster
- searched
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 52
- 230000009467 reduction Effects 0.000 claims description 65
- 238000004590 computer program Methods 0.000 claims description 22
- 230000015654 memory Effects 0.000 claims description 20
- 238000013527 convolutional neural network Methods 0.000 claims description 14
- 230000004927 fusion Effects 0.000 claims description 9
- 230000002087 whitening effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000005286 illumination Methods 0.000 description 5
- 238000000513 principal component analysis Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Library & Information Science (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Description
本願は2017年09月27日に中国特許局へ提出された、出願番号201710891875.9、名称「画像検索方法、装置およびコンピュータ読み取り可能な記憶媒体」の中国特許出願の優先権を主張しており、その全ての内容が引用により本願に組み込まれる。
Claims (13)
- 検索対象の画像の各畳み込み層特徴をそれぞれ次元削減し、各次元削減特徴を得ることであって、前記次元削減特徴は前記畳み込み層特徴よりも次元が小さいことと、
前記各次元削減特徴に基づいてクラスタリングし、複数のクラスタ特徴を得ることと、
前記複数のクラスタ特徴を融合し、グローバル特徴を得ることと、
前記グローバル特徴に基づき、データベースから前記検索対象の画像を検索することと、を含み、
前記複数のクラスタ特徴を融合し、グローバル特徴を得ることは、
前記複数のクラスタ特徴の各々をそれぞれ回帰し、各回帰クラスタ特徴を得ることと、
前記各回帰クラスタ特徴を加算し、前記グローバル特徴を得ることと、を含む、画像検索方法。 - 前記検索対象の画像の各畳み込み層特徴をそれぞれ次元削減する前に、さらに、
前記検索対象の画像を畳み込みニューラルネットワークに入力し、前記各畳み込み層特徴を得ることを含む、請求項1に記載の画像検索方法。 - 各前記畳み込み層特徴は前記検索対象の画像における対応する画素領域の特徴をそれぞれ特徴付ける、請求項2に記載の画像検索方法。
- 前記各次元削減特徴に基づいてクラスタリングし、複数のクラスタ特徴を得ることは、
前記各次元削減特徴間の距離に基づき、前記次元削減特徴をクラスタリングし、複数の特徴クラスタ中心を得ることと、
前記複数の特徴クラスタ中心の各々について、対応する畳み込み層特徴の最大値を、各特徴クラスタ中心の前記クラスタ特徴としてそれぞれサンプリングすることと、を含む、請求項1に記載の画像検索方法。 - 前記複数のクラスタ特徴の各々をそれぞれ回帰し、各回帰クラスタ特徴を得ることは、
前記複数のクラスタ特徴の各々をそれぞれ順に正規化、ホワイトニング、再正規化し、前記各回帰クラスタ特徴を得ることを含む、請求項1に記載の画像検索方法。 - 前記グローバル特徴に基づき、データベースから前記検索対象の画像を検索することは、
前記グローバル特徴に基づき、前記データベースから前記検索対象の画像との類似度が最も高いK個の画像を取得することを含み、前記Kは1以上の整数である、請求項1に記載の画像検索方法。 - 前記グローバル特徴に基づき、前記データベースから前記検索対象の画像との類似度が最も高いK個の画像を取得することは、
前記グローバル特徴と前記データベースにおける各画像特徴との間の距離を計算することと、
前記グローバル特徴と前記データベースにおける各画像特徴との間の距離に基づき、前記データベースから前記グローバル特徴との距離が最も小さいK個の画像を、検索対象の画像との類似度が最も高い前記K個の画像として取得することと、を含む、請求項6に記載の画像検索方法。 - 前記K個の画像および前記検索対象の画像とのそれぞれの類似度を提示することをさらに含む、請求項6または7に記載の画像検索方法。
- 前記次元削減特徴の次元は5である、請求項1に記載の画像検索方法。
- 前記クラスタ特徴の数は32個である、請求項1に記載の画像検索方法。
- 検索対象の画像の各畳み込み層特徴をそれぞれ次元削減し、各次元削減特徴を得るように構成された次元削減モジュールであって、前記次元削減特徴は前記畳み込み層特徴よりも次元が小さい次元削減モジュールと、
前記各次元削減特徴に基づいてクラスタリングし、複数のクラスタ特徴を得るように構成されたクラスタリングモジュールと、
前記複数のクラスタ特徴を融合し、グローバル特徴を得るように構成された融合モジュールと、
前記グローバル特徴に基づき、データベースから前記検索対象の画像を検索するように構成された検索モジュールと、を含み、
前記融合モジュールは、複数のクラスタ特徴の各々をそれぞれ回帰し、各回帰クラスタ特徴を得るように構成された回帰ユニット、および、各回帰クラスタ特徴を加算し、グローバル特徴を得るように構成された加算ユニットを含む、画像検索装置。 - メモリ、プロセッサおよび前記メモリに記憶されかつ前記プロセッサにおいて実行可能なコンピュータプログラムを含み、前記プロセッサは前記コンピュータプログラムを実行する時に請求項1から10のいずれか一項に記載の方法のステップを実現する、機器。
- プロセッサにより実行される時に請求項1から10のいずれか一項に記載の方法のステップを実現するコンピュータプログラムが記憶されている、コンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710891875.9A CN108205580B (zh) | 2017-09-27 | 2017-09-27 | 一种图像检索方法、装置及计算机可读存储介质 |
CN201710891875.9 | 2017-09-27 | ||
PCT/CN2018/104891 WO2019062534A1 (zh) | 2017-09-27 | 2018-09-10 | 一种图像检索方法、装置、设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020525908A JP2020525908A (ja) | 2020-08-27 |
JP6905603B2 true JP6905603B2 (ja) | 2021-07-21 |
Family
ID=62603639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019571060A Active JP6905603B2 (ja) | 2017-09-27 | 2018-09-10 | 画像検索方法、装置、機器および読み取り可能な記憶媒体 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11256737B2 (ja) |
JP (1) | JP6905603B2 (ja) |
KR (1) | KR102363811B1 (ja) |
CN (2) | CN113536019A (ja) |
SG (1) | SG11202000081XA (ja) |
WO (1) | WO2019062534A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536019A (zh) * | 2017-09-27 | 2021-10-22 | 深圳市商汤科技有限公司 | 一种图像检索方法、装置及计算机可读存储介质 |
CN109086437B (zh) * | 2018-08-15 | 2021-06-01 | 重庆大学 | 一种融合Faster-RCNN和Wasserstein自编码器的图像检索方法 |
CN110502659B (zh) * | 2019-08-23 | 2022-07-15 | 深圳市商汤科技有限公司 | 图像特征提取及网络的训练方法、装置和设备 |
CN112882686B (zh) * | 2019-11-29 | 2024-07-30 | 中国商用飞机有限责任公司 | 紧固件孔特征库的建立方法、装置、计算机以及存储介质 |
KR102475177B1 (ko) * | 2020-11-04 | 2022-12-07 | 한국전자기술연구원 | 영상 처리 방법 및 장치 |
CN112766265B (zh) * | 2021-01-27 | 2023-11-14 | 厦门树冠科技有限公司 | 一种任意形状roi截取方法、系统、介质及设备 |
CN112800258B (zh) * | 2021-03-11 | 2024-05-31 | 上海依图网络科技有限公司 | 图像检索方法、装置、电子设备及计算机可读存储介质 |
CN112669320B (zh) * | 2021-03-22 | 2021-08-13 | 四川大学 | 一种基于深度神经网络的spect甲状腺显像智能识别方法 |
JP2024120121A (ja) * | 2021-07-09 | 2024-09-04 | パナソニックIpマネジメント株式会社 | 評価システム、評価方法、生成システム、生成方法、推論システム、推論方法、学習済みモデル、プログラム、及び、情報処理システム |
CN114387619A (zh) * | 2021-12-31 | 2022-04-22 | 歌尔科技有限公司 | 行人检测方法、装置、电子设备及计算机可读存储介质 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101211355B (zh) * | 2006-12-30 | 2010-05-19 | 中国科学院计算技术研究所 | 一种基于聚类的图像查询方法 |
CN102004786B (zh) * | 2010-12-02 | 2012-11-28 | 上海交通大学 | 图像检索系统中的加速方法 |
US9075824B2 (en) * | 2012-04-27 | 2015-07-07 | Xerox Corporation | Retrieval system and method leveraging category-level labels |
CN106462940A (zh) * | 2014-10-09 | 2017-02-22 | 微软技术许可有限责任公司 | 图像中通用对象检测 |
US9786036B2 (en) * | 2015-04-28 | 2017-10-10 | Qualcomm Incorporated | Reducing image resolution in deep convolutional networks |
WO2017006648A1 (ja) * | 2015-07-03 | 2017-01-12 | Necソリューションイノベータ株式会社 | 画像判別装置、画像判別方法、及びコンピュータ読み取り可能な記録媒体 |
US20170039469A1 (en) * | 2015-08-04 | 2017-02-09 | Qualcomm Incorporated | Detection of unknown classes and initialization of classifiers for unknown classes |
JP6364387B2 (ja) * | 2015-08-17 | 2018-07-25 | 日本電信電話株式会社 | 特徴量生成装置、方法、及びプログラム |
WO2017151759A1 (en) * | 2016-03-01 | 2017-09-08 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Category discovery and image auto-annotation via looped pseudo-task optimization |
CN105574215B (zh) | 2016-03-04 | 2019-11-12 | 哈尔滨工业大学深圳研究生院 | 一种基于多层特征表示的实例级图像搜索方法 |
CN106127725B (zh) * | 2016-05-16 | 2019-01-22 | 北京工业大学 | 一种基于多分辨率cnn的毫米波雷达云图分割方法 |
CN106202338B (zh) * | 2016-06-30 | 2019-04-05 | 合肥工业大学 | 基于多特征多关系的图像检索方法 |
CN106250812B (zh) * | 2016-07-15 | 2019-08-20 | 汤一平 | 一种基于快速r-cnn深度神经网络的车型识别方法 |
CN106228185B (zh) * | 2016-07-20 | 2019-10-15 | 武汉盈力科技有限公司 | 一种基于神经网络的通用图像分类识别系统及方法 |
CN106649665A (zh) * | 2016-12-14 | 2017-05-10 | 大连理工大学 | 一种面向图像检索的对象级深度特征聚合方法 |
CN106886553B (zh) * | 2016-12-27 | 2020-07-28 | 浙江宇视科技有限公司 | 一种图像检索方法及服务器 |
CN106649853A (zh) * | 2016-12-30 | 2017-05-10 | 儒安科技有限公司 | 一种基于深度学习的短文本聚类方法 |
CN106709875B (zh) * | 2016-12-30 | 2020-02-18 | 北京工业大学 | 一种基于联合深度网络的压缩低分辨率图像复原方法 |
CN106886599B (zh) * | 2017-02-28 | 2020-03-03 | 北京京东尚科信息技术有限公司 | 图像检索方法以及装置 |
CN113536019A (zh) * | 2017-09-27 | 2021-10-22 | 深圳市商汤科技有限公司 | 一种图像检索方法、装置及计算机可读存储介质 |
CN107679250B (zh) * | 2017-11-01 | 2020-12-01 | 浙江工业大学 | 一种基于深度自编码卷积神经网络的多任务分层图像检索方法 |
-
2017
- 2017-09-27 CN CN202110818454.XA patent/CN113536019A/zh active Pending
- 2017-09-27 CN CN201710891875.9A patent/CN108205580B/zh active Active
-
2018
- 2018-09-10 SG SG11202000081XA patent/SG11202000081XA/en unknown
- 2018-09-10 WO PCT/CN2018/104891 patent/WO2019062534A1/zh active Application Filing
- 2018-09-10 JP JP2019571060A patent/JP6905603B2/ja active Active
- 2018-09-10 KR KR1020197038763A patent/KR102363811B1/ko active IP Right Grant
-
2019
- 2019-12-31 US US16/732,241 patent/US11256737B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN108205580A (zh) | 2018-06-26 |
KR20200011988A (ko) | 2020-02-04 |
KR102363811B1 (ko) | 2022-02-16 |
SG11202000081XA (en) | 2020-02-27 |
CN108205580B (zh) | 2021-08-31 |
JP2020525908A (ja) | 2020-08-27 |
US20200133974A1 (en) | 2020-04-30 |
WO2019062534A1 (zh) | 2019-04-04 |
US11256737B2 (en) | 2022-02-22 |
CN113536019A (zh) | 2021-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6905603B2 (ja) | 画像検索方法、装置、機器および読み取り可能な記憶媒体 | |
Zhang et al. | Ranking saliency | |
Quoc Bao et al. | Plant species identification from leaf patterns using histogram of oriented gradients feature space and convolution neural networks | |
JP7266668B2 (ja) | ビデオ物体の高速検出方法、装置、サーバ及び記憶媒体 | |
CN106485196B (zh) | 视觉搜索方法、对应的系统、设备和计算机程序产品 | |
Tu | Probabilistic boosting-tree: Learning discriminative models for classification, recognition, and clustering | |
CN110019876B (zh) | 数据查询方法、电子设备及存储介质 | |
CN103927387A (zh) | 图像检索系统及其相关方法和装置 | |
Li et al. | Hybrid shape descriptor and meta similarity generation for non-rigid and partial 3D model retrieval | |
US10943098B2 (en) | Automated and unsupervised curation of image datasets | |
CN111027507A (zh) | 基于视频数据识别的训练数据集生成方法及装置 | |
Yao et al. | Spatio-temporal information for human action recognition | |
CN107315984B (zh) | 一种行人检索的方法及装置 | |
Etezadifar et al. | Scalable video summarization via sparse dictionary learning and selection simultaneously | |
Lin et al. | Adaptive scene category discovery with generative learning and compositional sampling | |
Trad et al. | Large scale visual-based event matching | |
WO2021136981A1 (en) | Image processing method and apparatus, and electronic device | |
Chamasemani et al. | Video abstraction using density-based clustering algorithm | |
Sultana et al. | A study on food value estimation from images: taxonomies, datasets, and techniques | |
Cuffaro et al. | Segmentation free object discovery in video | |
Saremi et al. | Efficient encoding of video descriptor distribution for action recognition | |
Kim et al. | Classification and indexing scheme of large-scale image repository for spatio-temporal landmark recognition | |
Perina et al. | Capturing spatial interdependence in image features: the counting grid, an epitomic representation for bags of features | |
Gao et al. | Video imprint | |
CN113191401A (zh) | 基于视觉显著性共享的用于三维模型识别的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191220 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210224 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210521 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210601 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210625 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6905603 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |