JP2021117969A - ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法 - Google Patents
ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法 Download PDFInfo
- Publication number
- JP2021117969A JP2021117969A JP2020138754A JP2020138754A JP2021117969A JP 2021117969 A JP2021117969 A JP 2021117969A JP 2020138754 A JP2020138754 A JP 2020138754A JP 2020138754 A JP2020138754 A JP 2020138754A JP 2021117969 A JP2021117969 A JP 2021117969A
- Authority
- JP
- Japan
- Prior art keywords
- person
- learning
- network
- training
- branch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
Description
基準データセットを取得し、基準データセットに対してデータ拡張を行うステップS1と、
データ拡張後の基準データセットを訓練セット及びテストセットに分けるステップS2と、
ResNet50畳み込みニューラルネットワークに基づいて、順次接続されたアテンション学習モジュール、特徴抽出モジュール及び同定出力モジュールを含む人物再同定訓練ネットワークを構築し、特徴抽出モジュールは特徴処理ブランチ、マルチスケール表現学習ブランチ及びランダムバッチマスクブランチを含み、前記特徴処理ブランチはグローバル平均プーリング及びバッチ正規化処理を含むステップS3と、
訓練セットを人物再同定訓練ネットワークに入力し、予め設定された訓練パラメータでネットワークハイパーパラメータ調整を行い、人物再同定学習ネットワークを得るステップS4と、
人物再同定学習ネットワーク中の特徴抽出モジュールのマルチスケール表現学習ブランチ及びランダムバッチマスクブランチをブロックし、人物再同定テストネットワークを得て、テストセットを人物再同定テストネットワークに入力し、対応するテスト同定結果を出力するステップS5と、
テスト同定結果の正確率を計算し、同定結果の正確率が所定値以上であるか否かを判断し、YESと判断すると、ステップS7を実行し、さもないと、ステップS4に戻るステップS6と、
実際のデータセットを取得し、実際のデータセットを人物再同定学習ネットワークに入力し、実際のデータセットに対応する画像特徴を学習するステップS7と、
人物再同定学習ネットワーク中の特徴抽出モジュールのマルチスケール表現学習ブランチ及びランダムバッチマスクブランチをブロックし、人物再同定応用ネットワークを得て、照会画像を人物再同定応用ネットワークに入力し、該照会対象に対応する同定結果を出力するステップS8と、を含む。
基準データセットから複数の画像をランダムに抽出して水平反転処理を行うステップS11と、
基準データセットから複数の画像をランダムに抽出してガウス、ごま塩ノイズ処理を行うステップS12と、を含む。
前記特徴処理ブランチはラベル損失・ランク付けリスト損失合同訓練を採用し、画像のグローバル情報を取得し、
前記マルチスケール表現学習ブランチは2組のラベル損失訓練を採用し、画像中のローカル詳細特徴及び空間情報の相関性を取得し、
前記ランダムバッチマスクブランチはラベル損失訓練を採用し、画像中の抑制されるローカル特徴を捕捉する。
前記空間アテンションモジュールは2個の1*1畳み込み層及び2個の3*3畳み込み層を含み、前記1*1畳み込み層は畳み込み特徴マップの次元を減少させることに用いられ、前記3*3畳み込み層は特徴を効果的に抽出することに用いられる。
図1に示すように、ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法は、
基準データセットを取得し、基準データセットに対してデータ拡張を行うステップS1と、
データ拡張後の基準データセットを訓練セット及びテストセットに分けるステップS2と、
ResNet50畳み込みニューラルネットワークに基づいて、順次接続されたアテンション学習モジュール、特徴抽出モジュール及び同定出力モジュールを含む人物再同定訓練ネットワークを構築し、特徴抽出モジュールは特徴処理ブランチ、マルチスケール表現学習ブランチ及びランダムバッチマスクブランチを含み、前記特徴処理ブランチはグローバル平均プーリング及びバッチ正規化処理を含むステップS3と、
訓練セットを人物再同定訓練ネットワークに入力し、予め設定された訓練パラメータでネットワークハイパーパラメータ調整を行い、人物再同定学習ネットワークを得るステップS4と、
人物再同定学習ネットワーク中の特徴抽出モジュールのマルチスケール表現学習ブランチ及びランダムバッチマスクブランチをブロックし、人物再同定テストネットワークを得て、テストセットを人物再同定テストネットワークに入力し、対応するテスト同定結果を出力するステップS5と、
テスト同定結果の正確率を計算し、同定結果の正確率が所定値以上であるか否かを判断し、YESと判断すると、ステップS7を実行し、さもないと、ステップS4に戻るステップS6と、
実際のデータセットを取得し、実際のデータセットを人物再同定学習ネットワークに入力し、実際のデータセットに対応する画像特徴を学習するステップS7と、
人物再同定学習ネットワーク中の特徴抽出モジュールのマルチスケール表現学習ブランチ及びランダムバッチマスクブランチをブロックし、人物再同定応用ネットワークを得て、照会画像を人物再同定応用ネットワークに入力し、該照会対象に対応する同定結果を出力するステップS8と、を含む。
2)データセットから複数の画像をランダムに抽出してガウス、ごま塩ノイズ処理を行う。
その後、高さマスク比率値Rhと入力特徴マップの高さHを乗算してマスク高さHmを得て、幅マスク比率値Rwと入力特徴マップの幅Wを乗算してマスク幅Wnを得て、
さらに0〜(H−Hm)数値の間にある整数Xa、及び0〜(W−Wn)数値の間にある整数Ybをランダムに生成し、
H行W列の数値がすべて1のマトリックスPを生成し、マトリックスP中のXa〜Xa+Hm及びYb〜Yb+Wnの領域にすべて0を付値し、マスクマトリックスP’を得て、
最後に、得られたマスクマトリックスP’を入力されたN個の特徴マップと対応付けて乗算し、すなわち、入力されたN個の特徴マップに対応付けてマスク処理を行う。
Claims (10)
- ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法であって、
基準データセットを取得し、基準データセットに対してデータ拡張を行うステップS1と、
データ拡張後の基準データセットを訓練セット及びテストセットに分けるステップS2と、
ResNet50畳み込みニューラルネットワークに基づいて、順次接続されたアテンション学習モジュール、特徴抽出モジュール及び同定出力モジュールを含む人物再同定訓練ネットワークを構築し、特徴抽出モジュールは特徴処理ブランチ、マルチスケール表現学習ブランチ及びランダムバッチマスクブランチを含み、前記特徴処理ブランチはグローバル平均プーリング及びバッチ正規化処理を含むステップS3と、
訓練セットを人物再同定訓練ネットワークに入力し、予め設定された訓練パラメータでネットワークハイパーパラメータ調整を行い、人物再同定学習ネットワークを得るステップS4と、
人物再同定学習ネットワーク中の特徴抽出モジュールのマルチスケール表現学習ブランチ及びランダムバッチマスクブランチをブロックし、人物再同定テストネットワークを得て、テストセットを人物再同定テストネットワークに入力し、対応するテスト同定結果を出力するステップS5と、
テスト同定結果の正確率を計算し、同定結果の正確率が所定値以上であるか否かを判断し、YESと判断すると、ステップS7を実行し、さもないと、ステップS4に戻るステップS6と、
実際のデータセットを取得し、実際のデータセットを人物再同定学習ネットワークに入力し、実際のデータセットに対応する画像特徴を学習するステップS7と、
人物再同定学習ネットワーク中の特徴抽出モジュールのマルチスケール表現学習ブランチ及びランダムバッチマスクブランチをブロックし、人物再同定応用ネットワークを得て、照会画像を人物再同定応用ネットワークに入力し、該照会対象に対応する同定結果を出力するステップS8と、を含むことを特徴とするランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法。 - 前記ステップS1では、データ拡張は具体的には、
基準データセットから複数の画像をランダムに抽出して水平反転処理を行うステップS11と、
基準データセットから複数の画像をランダムに抽出してガウス、ごま塩ノイズ処理を行うステップS12と、を含むことを特徴とする請求項1に記載のランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法。 - 前記ステップS3では、アテンション学習モジュールは対象の特徴表現を強化するように、3段階に分けられ、
前記特徴処理ブランチはラベル損失・ランク付けリスト損失合同訓練を採用し、画像のグローバル情報を取得し、
前記マルチスケール表現学習ブランチは2組のラベル損失訓練を採用し、画像中のローカル詳細特徴及び空間情報の相関性を取得し、
前記ランダムバッチマスクブランチはラベル損失訓練を採用し、画像中の抑制されるローカル特徴を捕捉することを特徴とする請求項1に記載のランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法。 - 前記ランダムバッチマスクブランチは具体的には、サイズがランダムで且つ位置領域がランダムな遮蔽ブロックを設定し、該遮蔽ブロックで画像の一部を遮蔽することによって、遮蔽されていないローカル情報を捕捉することを特徴とする請求項3に記載のランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法。
- 前記アテンション学習モジュールはチャネルアテンションモジュール及び空間アテンションモジュールを含み、前記チャネルアテンションモジュールは1層の平均プーリング演算、1層の多層パーセプトロン、1層の線形層及び1層のバッチ正規化層からなり、有効チャネルの重みを大きくし、無効チャネルの重みを小さくすることに用いられ、
前記空間アテンションモジュールは2個の1*1畳み込み層及び2個の3*3畳み込み層を含み、前記1*1畳み込み層は畳み込み特徴マップの次元を減少させることに用いられ、前記3*3畳み込み層は特徴を効果的に抽出することに用いられることを特徴とする請求項3に記載のランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法。 - 前記マルチスケール表現学習ブランチでは、2組のラベル損失訓練はそれぞれ小スケール特徴訓練及び大スケール特徴訓練であることを特徴とする請求項3に記載のランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010076639.3 | 2020-01-23 | ||
CN202010076639.3A CN111259850B (zh) | 2020-01-23 | 2020-01-23 | 一种融合随机批掩膜和多尺度表征学习的行人重识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6830707B1 JP6830707B1 (ja) | 2021-02-17 |
JP2021117969A true JP2021117969A (ja) | 2021-08-10 |
Family
ID=70949122
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020138754A Active JP6830707B1 (ja) | 2020-01-23 | 2020-08-19 | ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6830707B1 (ja) |
CN (1) | CN111259850B (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113868449A (zh) * | 2021-09-22 | 2021-12-31 | 西安理工大学 | 基于多尺度特征与空间注意力机制融合的图像检索方法 |
CN114937199A (zh) * | 2022-07-22 | 2022-08-23 | 山东省凯麟环保设备股份有限公司 | 一种基于判别性特征增强的垃圾分类方法与系统 |
JP2022173321A (ja) * | 2021-10-15 | 2022-11-18 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | オブジェクトの検出方法、装置、デバイス、媒体及びプログラム |
CN116958148A (zh) * | 2023-09-21 | 2023-10-27 | 曲阜师范大学 | 输电线路关键部件缺陷的检测方法、装置、设备、介质 |
Families Citing this family (119)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111814854B (zh) * | 2020-06-28 | 2023-07-28 | 北京交通大学 | 一种无监督域适应的目标重识别方法 |
CN111814705B (zh) * | 2020-07-14 | 2022-08-02 | 广西师范大学 | 一种基于批次分块遮挡网络的行人再辨识方法 |
CN112084338B (zh) * | 2020-09-18 | 2024-02-06 | 达而观数据(成都)有限公司 | 一种文档自动归类方法、系统、计算机设备及存储介质 |
CN112183295A (zh) * | 2020-09-23 | 2021-01-05 | 上海眼控科技股份有限公司 | 行人重识别方法、装置、计算机设备及存储介质 |
CN112200111B (zh) * | 2020-10-19 | 2022-05-17 | 厦门大学 | 一种全局与局部特征融合的遮挡鲁棒行人重识别方法 |
CN112464775A (zh) * | 2020-11-21 | 2021-03-09 | 西北工业大学 | 一种基于多分支网络的视频目标重识别方法 |
CN112434599B (zh) * | 2020-11-23 | 2022-11-18 | 同济大学 | 一种基于噪声通道的随机遮挡恢复的行人重识别方法 |
CN112434796B (zh) * | 2020-12-09 | 2022-10-25 | 同济大学 | 一种基于局部信息学习的跨模态行人再识别方法 |
CN112396036B (zh) * | 2020-12-09 | 2023-08-08 | 中山大学 | 一种结合空间变换网络和多尺度特征提取的遮挡行人重识别方法 |
CN112749667B (zh) * | 2021-01-15 | 2023-04-07 | 中国科学院宁波材料技术与工程研究所 | 一种基于深度学习的线虫分类识别方法 |
CN112785479B (zh) * | 2021-01-21 | 2023-05-23 | 南京信息工程大学 | 一种基于少样本学习的图像隐形水印通用检测方法 |
CN112801008B (zh) * | 2021-02-05 | 2024-05-31 | 电子科技大学中山学院 | 行人重识别方法、装置、电子设备及可读存储介质 |
CN112883880B (zh) * | 2021-02-25 | 2022-08-19 | 电子科技大学 | 基于人体结构多尺度分割的行人属性识别方法、存储介质和终端 |
CN112990007B (zh) * | 2021-03-13 | 2022-08-09 | 山东大学 | 基于区域分组与内部关联融合的人脸表情识别方法及系统 |
CN113191386B (zh) * | 2021-03-26 | 2023-11-03 | 中国矿业大学 | 基于网格重构学习的染色体分类模型 |
CN113158815B (zh) * | 2021-03-27 | 2023-05-12 | 复旦大学 | 一种无监督行人重识别方法、系统及计算机可读介质 |
CN113312961A (zh) * | 2021-04-03 | 2021-08-27 | 国家计算机网络与信息安全管理中心 | 一种logo识别加速方法 |
CN113177579A (zh) * | 2021-04-08 | 2021-07-27 | 北京科技大学 | 一种基于注意力机制的特征融合方法 |
CN113156376B (zh) * | 2021-04-15 | 2023-08-11 | 中国人民解放军空军航空大学 | 基于sacnn的雷达辐射源信号识别方法 |
CN113050042B (zh) * | 2021-04-15 | 2023-08-15 | 中国人民解放军空军航空大学 | 基于改进UNet3+网络的雷达信号调制类型识别方法 |
CN113158905A (zh) * | 2021-04-23 | 2021-07-23 | 佛山市南海区广工大数控装备协同创新研究院 | 一种基于注意力机制的行人重识别方法 |
CN114782977B (zh) * | 2021-04-28 | 2024-07-05 | 河南大学 | 一种基于拓扑信息和亲和度信息引导行人重识别方法 |
CN113204977B (zh) * | 2021-04-29 | 2023-09-26 | 北京有竹居网络技术有限公司 | 信息翻译方法、装置、设备和存储介质 |
CN113239776B (zh) * | 2021-05-10 | 2023-06-06 | 北方工业大学 | 一种基于能量模型的行人重识别方法 |
CN113128466B (zh) * | 2021-05-11 | 2023-12-05 | 深圳大学 | 行人重识别方法、系统、电子装置及存储介质 |
CN113239784B (zh) * | 2021-05-11 | 2022-09-30 | 广西科学院 | 一种基于空间序列特征学习的行人重识别系统及方法 |
CN113192085A (zh) * | 2021-05-11 | 2021-07-30 | 联想(北京)有限公司 | 三维器官图像分割方法、装置及计算机设备 |
CN113283320B (zh) * | 2021-05-13 | 2024-09-06 | 桂林安维科技有限公司 | 一种基于通道特征聚合的行人重识别方法 |
CN113255495A (zh) * | 2021-05-17 | 2021-08-13 | 开放智能机器(上海)有限公司 | 一种养猪场生猪清点方法以及清点系统 |
CN113656628B (zh) * | 2021-05-24 | 2023-03-28 | 江苏省特种设备安全监督检验研究院 | 一种基于注意力机制和特征融合的起重机图像检索方法 |
CN113313173B (zh) * | 2021-06-01 | 2023-05-30 | 中山大学 | 基于图表示和改进Transformer的人体解析方法 |
CN113377985A (zh) * | 2021-06-08 | 2021-09-10 | 南京工业大学 | 一种基于金字塔网络的中药图像的分类和检索方法 |
CN113591545B (zh) * | 2021-06-11 | 2024-05-24 | 北京师范大学珠海校区 | 一种基于深度学习的多级特征提取网络行人再识别方法 |
CN113221854B (zh) * | 2021-06-11 | 2024-07-09 | 公安部物证鉴定中心 | 一种基于多尺度深度特征的赤足足迹图像人身识别方法 |
CN113297624B (zh) * | 2021-06-23 | 2023-04-18 | 支付宝(杭州)信息技术有限公司 | 图像的预处理方法及装置 |
CN113673303B (zh) * | 2021-06-28 | 2024-02-02 | 中国科学院大学 | 一种人脸面部动作单元强度回归方法、装置和介质 |
CN113627093B (zh) * | 2021-07-01 | 2023-11-21 | 武汉大学 | 一种基于改进Unet网络的水下机构跨尺度流场特征预测方法 |
CN113625227B (zh) * | 2021-07-05 | 2023-07-04 | 西安电子科技大学 | 基于注意力变换网络的雷达高分辨距离像目标识别方法 |
CN113378791B (zh) * | 2021-07-09 | 2022-08-05 | 合肥工业大学 | 基于双注意力机制和多尺度特征融合的宫颈细胞分类方法 |
CN113537032B (zh) * | 2021-07-12 | 2023-11-28 | 南京邮电大学 | 一种基于图片分块丢弃的分集多支路行人重识别方法 |
CN113627259A (zh) * | 2021-07-12 | 2021-11-09 | 西安理工大学 | 基于图卷积网络的细微动作识别方法 |
CN113627266B (zh) * | 2021-07-15 | 2023-08-18 | 武汉大学 | 基于Transformer时空建模的视频行人重识别方法 |
CN113723447B (zh) * | 2021-07-15 | 2024-03-08 | 西北工业大学 | 一种多模态影像的端到端的模板匹配方法 |
CN113537111A (zh) * | 2021-07-26 | 2021-10-22 | 南京信息工程大学 | 基于双支路深度卷积网络的虹膜分割方法 |
CN113869105B (zh) * | 2021-08-09 | 2024-09-10 | 华北电力大学(保定) | 一种人体行为识别方法 |
CN113706406B (zh) * | 2021-08-11 | 2023-08-04 | 武汉大学 | 基于特征空间多分类对抗机制的红外可见光图像融合方法 |
CN113610026A (zh) * | 2021-08-13 | 2021-11-05 | 广联达科技股份有限公司 | 基于掩膜注意力的行人重识别方法及重识别装置 |
CN113569990B (zh) * | 2021-08-25 | 2024-03-05 | 浙江工业大学 | 面向强噪声干扰环境的演艺装备故障诊断模型构建方法 |
CN113705476A (zh) * | 2021-08-30 | 2021-11-26 | 国网四川省电力公司营销服务中心 | 一种基于神经网络的现场作业违章行为分析方法及系统 |
CN113689517B (zh) * | 2021-09-08 | 2024-05-21 | 云南大学 | 一种多尺度通道注意力网络的图像纹理合成方法及系统 |
CN113689356B (zh) * | 2021-09-14 | 2023-11-24 | 三星电子(中国)研发中心 | 一种图像修复的方法和装置 |
CN113792744B (zh) * | 2021-09-14 | 2023-09-05 | 东北农业大学 | 一种低功耗广域网内农作物生长数据传输系统及方法 |
CN113763373B (zh) * | 2021-09-17 | 2023-10-13 | 上海交通大学 | 域泛化的尺度对齐翻拍图片检测系统 |
CN113837080B (zh) * | 2021-09-24 | 2023-07-25 | 江西理工大学 | 一种基于信息增强与感受野增强的小目标检测方法 |
CN113888501B (zh) * | 2021-09-29 | 2024-02-06 | 西安理工大学 | 一种基于注意力定位网络的无参考型图像质量评价方法 |
CN113780241B (zh) * | 2021-09-29 | 2024-02-06 | 北京航空航天大学 | 一种显著物体检测的加速方法与装置 |
CN113869418B (zh) * | 2021-09-29 | 2024-07-02 | 哈尔滨工程大学 | 一种基于全局注意力关系网络的小样本船舶目标识别方法 |
CN113780243B (zh) * | 2021-09-29 | 2023-10-17 | 平安科技(深圳)有限公司 | 行人图像识别模型的训练方法、装置、设备以及存储介质 |
CN113947204A (zh) * | 2021-10-13 | 2022-01-18 | 北京百度网讯科技有限公司 | 图像识别方法、装置、存储介质和计算机程序产品 |
CN113947782B (zh) * | 2021-10-14 | 2024-06-07 | 哈尔滨工程大学 | 一种基于注意力机制的行人目标对齐方法 |
CN113920472B (zh) * | 2021-10-15 | 2024-05-24 | 中国海洋大学 | 一种基于注意力机制的无监督目标重识别方法及系统 |
CN114022930B (zh) * | 2021-10-28 | 2024-04-16 | 天津大学 | 一种人像证件照自动生成方法 |
CN114021458B (zh) * | 2021-11-05 | 2022-11-04 | 西安晟昕科技发展有限公司 | 基于并行原型网络的小样本雷达辐射源信号识别方法 |
CN114005096B (zh) * | 2021-11-09 | 2024-05-10 | 河北工业大学 | 基于特征增强的车辆重识别方法 |
CN113963150B (zh) * | 2021-11-16 | 2022-04-08 | 北京中电兴发科技有限公司 | 一种基于多尺度孪生级联网络的行人重识别方法 |
CN113963422B (zh) * | 2021-11-22 | 2024-07-19 | 上海电力大学 | 基于多注意力融合Transformer架构的不确定性人脸表情识别方法 |
CN114170635A (zh) * | 2021-12-06 | 2022-03-11 | 佳都科技集团股份有限公司 | 基于网络模型的图像识别方法、装置、设备及存储介质 |
CN114187275B (zh) * | 2021-12-13 | 2024-07-02 | 贵州大学 | 一种基于多阶段和多尺度注意力融合网络及图像去雨方法 |
CN114201993B (zh) * | 2021-12-13 | 2024-09-13 | 厦门大学 | 一种检测超声缺陷的三分支注意力特征融合方法与系统 |
CN114332701B (zh) * | 2021-12-27 | 2024-05-28 | 北京航空航天大学 | 一种基于任务区分检测再识别联合网络的目标跟踪方法 |
CN114332007B (zh) * | 2021-12-28 | 2024-06-28 | 福州大学 | 一种基于Transformer的工业缺陷检测和识别方法 |
CN114529717A (zh) * | 2021-12-29 | 2022-05-24 | 宁波大学 | 一种基于多模态多时间尺度的步态识别方法 |
CN114387580B (zh) * | 2022-01-06 | 2024-10-18 | 厦门大学 | 基于联邦学习的模型训练方法及装置 |
CN114419671B (zh) * | 2022-01-18 | 2024-03-26 | 北京工业大学 | 一种基于超图神经网络的遮挡行人重识别方法 |
CN114596218B (zh) * | 2022-01-25 | 2023-11-07 | 西北大学 | 基于卷积神经网络的古代绘画图像修复方法、模型和装置 |
CN114519796A (zh) * | 2022-01-27 | 2022-05-20 | 厦门大学 | 一种基于深度神经网络的机器人材质识别方法及系统 |
CN114419026B (zh) * | 2022-02-10 | 2024-07-19 | 北京航空航天大学 | 基于视觉注意力的航空发动机保险丝绕向识别系统及方法 |
CN114548132A (zh) * | 2022-02-22 | 2022-05-27 | 广东奥普特科技股份有限公司 | 条形码检测模型的训练方法、装置及条形码检测方法、装置 |
CN114638256B (zh) * | 2022-02-22 | 2024-05-31 | 合肥华威自动化有限公司 | 基于声波信号及注意力网络的变压器故障检测方法及其系统 |
CN114694089B (zh) * | 2022-02-28 | 2024-09-20 | 郑州大学 | 一种新型的多模态融合的行人重识别方法 |
CN114581560B (zh) * | 2022-03-01 | 2024-04-16 | 西安交通大学 | 基于注意力机制的多尺度神经网络红外图像彩色化方法 |
CN114821699B (zh) * | 2022-03-02 | 2024-03-08 | 西北工业大学 | 一种基于抑制模糊度自训练的人脸表情识别方法 |
CN114743128B (zh) * | 2022-03-09 | 2024-08-09 | 华侨大学 | 一种基于异种神经网络的多模态东北虎再辨识方法及装置 |
CN114842324A (zh) * | 2022-03-16 | 2022-08-02 | 南京邮电大学 | 一种基于学习神经网络的伪装目标检测方法及系统 |
CN114821704B (zh) * | 2022-03-16 | 2024-05-24 | 桂林理工大学 | 一种基于关键点注意力机制的口罩人脸识别方法 |
CN114764787A (zh) * | 2022-03-18 | 2022-07-19 | 杭州电子科技大学 | 一种基于深度学习的单细胞质谱系统自动聚焦方法 |
CN114782859B (zh) * | 2022-03-28 | 2024-07-19 | 华中科技大学 | 一种目标行为感知时空定位模型的建立方法及应用 |
CN114693693A (zh) * | 2022-03-31 | 2022-07-01 | 四川大学华西医院 | 一种基于卷积神经网络的胎儿胼胝体超声图像分割方法 |
CN115050044B (zh) * | 2022-04-02 | 2023-06-23 | 广西科学院 | 一种基于MLP-Mixer的跨模态行人重识别方法 |
CN114757904B (zh) * | 2022-04-07 | 2024-08-02 | 河南大学 | 一种基于ai深度学习算法的表面缺陷检测方法 |
CN114742800B (zh) * | 2022-04-18 | 2024-02-20 | 合肥工业大学 | 基于改进Transformer的强化学习电熔镁炉工况识别方法 |
CN114882590B (zh) * | 2022-05-06 | 2024-04-02 | 中国科学技术大学 | 一种基于事件相机的多粒度时空特征感知的唇读方法 |
CN114926877B (zh) * | 2022-05-10 | 2024-02-20 | 西北工业大学 | 一种基于对比域差异的跨域人脸表情识别方法 |
CN114973317B (zh) * | 2022-05-13 | 2023-04-28 | 杭州像素元科技有限公司 | 一种基于多尺度邻接交互特征的行人重识别方法 |
CN115035170B (zh) * | 2022-05-17 | 2024-03-05 | 合肥工业大学 | 基于全局纹理与结构的图像修复方法 |
CN114898158A (zh) * | 2022-05-24 | 2022-08-12 | 杭州电子科技大学 | 基于多尺度注意力耦合机制的小样本交通异常图像采集方法及系统 |
CN115050048B (zh) * | 2022-05-25 | 2023-04-18 | 杭州像素元科技有限公司 | 一种基于局部细节特征的跨模态行人重识别方法 |
CN115115648B (zh) * | 2022-06-20 | 2024-07-19 | 北京理工大学 | 一种结合UNet和体绘制先验知识的脑组织分割方法 |
CN115082966B (zh) * | 2022-07-22 | 2022-12-06 | 中国科学院自动化研究所 | 行人重识别模型训练方法、行人重识别方法、装置和设备 |
CN115546223A (zh) * | 2022-12-05 | 2022-12-30 | 南京天创电子技术有限公司 | 一种列车车下设备紧固螺栓的缺失检测方法和系统 |
CN115950888B (zh) * | 2023-01-09 | 2024-04-09 | 湖南艾科瑞生物工程有限公司 | qPCR孔板的质量检测方法及相关设备 |
CN115862120B (zh) * | 2023-02-21 | 2023-11-10 | 天度(厦门)科技股份有限公司 | 可分离变分自编码器解耦的面部动作单元识别方法及设备 |
CN116188436B (zh) * | 2023-03-03 | 2023-11-10 | 合肥工业大学 | 基于局部特征和全局特征融合的膀胱镜图像分类方法 |
CN116563615B (zh) * | 2023-04-21 | 2023-11-07 | 南京讯思雅信息科技有限公司 | 基于改进多尺度注意力机制的不良图片分类方法 |
CN116311483B (zh) * | 2023-05-24 | 2023-08-01 | 山东科技大学 | 基于局部面部区域重构和记忆对比学习的微表情识别方法 |
CN116311387B (zh) * | 2023-05-25 | 2023-09-01 | 浙江工业大学 | 一种基于特征交集的跨模态行人重识别方法 |
CN116342363B (zh) * | 2023-05-31 | 2023-07-28 | 齐鲁工业大学(山东省科学院) | 基于两阶段深度神经网络的可见水印去除方法 |
CN116824695B (zh) * | 2023-06-07 | 2024-07-19 | 南通大学 | 一种基于特征去噪的行人再识别非局部防御方法 |
CN116432870B (zh) * | 2023-06-13 | 2023-10-10 | 齐鲁工业大学(山东省科学院) | 一种城市流量预测方法 |
CN116758631B (zh) * | 2023-06-13 | 2023-12-22 | 杭州追形视频科技有限公司 | 大数据驱动的行为智能分析方法及系统 |
CN116721351B (zh) * | 2023-07-06 | 2024-06-18 | 内蒙古电力(集团)有限责任公司内蒙古超高压供电分公司 | 一种架空线路通道内道路环境特征遥感智能提取方法 |
CN116630639B (zh) * | 2023-07-20 | 2023-12-12 | 深圳须弥云图空间科技有限公司 | 对象图像的识别方法及装置 |
CN116612122B (zh) * | 2023-07-20 | 2023-10-10 | 湖南快乐阳光互动娱乐传媒有限公司 | 图像显著性区域的检测方法及装置、存储介质及电子设备 |
CN117496245A (zh) * | 2023-11-08 | 2024-02-02 | 深圳市眼科医院(深圳市眼病防治研究所) | 基于自监督预训练的白内障图像分类方法及系统 |
CN117252892B (zh) * | 2023-11-14 | 2024-03-08 | 江西师范大学 | 基于轻量化视觉自注意力网络的双分支人像自动抠图装置 |
CN117636057B (zh) * | 2023-12-13 | 2024-06-11 | 石家庄铁道大学 | 基于多分支跨空间注意力模型的列车轴承损伤分类识别方法 |
CN118230398B (zh) * | 2024-05-24 | 2024-07-26 | 中国科学技术大学 | 一种微表情识别模型的训练方法、识别方法及相关设备 |
CN118334045B (zh) * | 2024-06-07 | 2024-10-11 | 南京理工大学 | 基于双注意力机制和多尺度融合的小样本医学图像分割方法 |
CN118314335B (zh) * | 2024-06-11 | 2024-09-13 | 西安邮电大学 | 一种基于多层注意力融合的小目标检测方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018506788A (ja) * | 2015-04-03 | 2018-03-08 | 三菱電機株式会社 | 物体の再同定の方法 |
WO2018170421A1 (en) * | 2017-03-17 | 2018-09-20 | Magic Leap, Inc. | Room layout estimation methods and techniques |
JP2018160200A (ja) * | 2017-03-24 | 2018-10-11 | 富士通株式会社 | ニューラルネットワークの学習方法、ニューラルネットワークの学習プログラム及びニューラルネットワークの学習装置 |
JP2019056966A (ja) * | 2017-09-19 | 2019-04-11 | 株式会社東芝 | 情報処理装置、画像認識方法および画像認識プログラム |
JP2019083002A (ja) * | 2017-10-27 | 2019-05-30 | アドビ インコーポレイテッド | トリプレット損失ニューラル・ネットワーク・トレーニングを使用するフォント認識の改善 |
JP2019185483A (ja) * | 2018-04-12 | 2019-10-24 | 富士通株式会社 | 機械学習プログラム、機械学習方法および機械学習装置 |
JP2019197445A (ja) * | 2018-05-11 | 2019-11-14 | 日本電信電話株式会社 | 画像認識装置、画像認識方法、およびプログラム |
US20200005122A1 (en) * | 2018-06-27 | 2020-01-02 | International Business Machines Corporation | Multiscale feature representations for object recognition and detection |
JP2020009435A (ja) * | 2018-07-03 | 2020-01-16 | 株式会社神戸製鋼所 | 鋼材成分学習装置、鋼材成分推定装置、鋼種判定装置、鋼材成分学習方法、鋼材成分推定方法、鋼種判定方法、及びプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108427927B (zh) * | 2018-03-16 | 2020-11-27 | 深圳市商汤科技有限公司 | 目标再识别方法和装置、电子设备、程序和存储介质 |
CN110188611A (zh) * | 2019-04-26 | 2019-08-30 | 华中科技大学 | 一种引入视觉注意力机制的行人重识别方法及系统 |
CN110070073A (zh) * | 2019-05-07 | 2019-07-30 | 国家广播电视总局广播电视科学研究院 | 基于注意力机制的全局特征和局部特征的行人再识别方法 |
CN110533024B (zh) * | 2019-07-10 | 2021-11-23 | 杭州电子科技大学 | 基于多尺度roi特征的双二次池化细粒度图像分类方法 |
CN110647794B (zh) * | 2019-07-12 | 2023-01-03 | 五邑大学 | 基于注意力机制的多尺度sar图像识别方法及装置 |
CN110598654B (zh) * | 2019-09-18 | 2022-02-11 | 合肥工业大学 | 多粒度交叉模态特征融合行人再识别方法和再识别系统 |
-
2020
- 2020-01-23 CN CN202010076639.3A patent/CN111259850B/zh active Active
- 2020-08-19 JP JP2020138754A patent/JP6830707B1/ja active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018506788A (ja) * | 2015-04-03 | 2018-03-08 | 三菱電機株式会社 | 物体の再同定の方法 |
WO2018170421A1 (en) * | 2017-03-17 | 2018-09-20 | Magic Leap, Inc. | Room layout estimation methods and techniques |
JP2018160200A (ja) * | 2017-03-24 | 2018-10-11 | 富士通株式会社 | ニューラルネットワークの学習方法、ニューラルネットワークの学習プログラム及びニューラルネットワークの学習装置 |
JP2019056966A (ja) * | 2017-09-19 | 2019-04-11 | 株式会社東芝 | 情報処理装置、画像認識方法および画像認識プログラム |
JP2019083002A (ja) * | 2017-10-27 | 2019-05-30 | アドビ インコーポレイテッド | トリプレット損失ニューラル・ネットワーク・トレーニングを使用するフォント認識の改善 |
JP2019185483A (ja) * | 2018-04-12 | 2019-10-24 | 富士通株式会社 | 機械学習プログラム、機械学習方法および機械学習装置 |
JP2019197445A (ja) * | 2018-05-11 | 2019-11-14 | 日本電信電話株式会社 | 画像認識装置、画像認識方法、およびプログラム |
US20200005122A1 (en) * | 2018-06-27 | 2020-01-02 | International Business Machines Corporation | Multiscale feature representations for object recognition and detection |
JP2020009435A (ja) * | 2018-07-03 | 2020-01-16 | 株式会社神戸製鋼所 | 鋼材成分学習装置、鋼材成分推定装置、鋼種判定装置、鋼材成分学習方法、鋼材成分推定方法、鋼種判定方法、及びプログラム |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113868449A (zh) * | 2021-09-22 | 2021-12-31 | 西安理工大学 | 基于多尺度特征与空间注意力机制融合的图像检索方法 |
CN113868449B (zh) * | 2021-09-22 | 2024-05-28 | 西安理工大学 | 基于多尺度特征与空间注意力机制融合的图像检索方法 |
JP2022173321A (ja) * | 2021-10-15 | 2022-11-18 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | オブジェクトの検出方法、装置、デバイス、媒体及びプログラム |
JP7387847B2 (ja) | 2021-10-15 | 2023-11-28 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | オブジェクトの検出方法、装置、デバイス、媒体及びプログラム |
CN114937199A (zh) * | 2022-07-22 | 2022-08-23 | 山东省凯麟环保设备股份有限公司 | 一种基于判别性特征增强的垃圾分类方法与系统 |
CN116958148A (zh) * | 2023-09-21 | 2023-10-27 | 曲阜师范大学 | 输电线路关键部件缺陷的检测方法、装置、设备、介质 |
CN116958148B (zh) * | 2023-09-21 | 2023-12-12 | 曲阜师范大学 | 输电线路关键部件缺陷的检测方法、装置、设备、介质 |
Also Published As
Publication number | Publication date |
---|---|
JP6830707B1 (ja) | 2021-02-17 |
CN111259850A (zh) | 2020-06-09 |
CN111259850B (zh) | 2022-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6830707B1 (ja) | ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法 | |
CN110084292B (zh) | 基于DenseNet和多尺度特征融合的目标检测方法 | |
CN111783576B (zh) | 基于改进型YOLOv3网络和特征融合的行人重识别方法 | |
CN108830188A (zh) | 基于深度学习的车辆检测方法 | |
CN105389562B (zh) | 一种时空约束的监控视频行人重识别结果的二次优化方法 | |
Li et al. | A multi-scale cucumber disease detection method in natural scenes based on YOLOv5 | |
CN109559320A (zh) | 基于空洞卷积深度神经网络实现视觉slam语义建图功能的方法及系统 | |
Kiratiratanapruk et al. | Using deep learning techniques to detect rice diseases from images of rice fields | |
CN106529499A (zh) | 基于傅里叶描述子和步态能量图融合特征的步态识别方法 | |
CN108154159B (zh) | 一种基于多级检测器的具有自恢复能力的目标跟踪方法 | |
Zhao et al. | Using adversarial network for multiple change detection in bitemporal remote sensing imagery | |
CN112507853B (zh) | 一种基于互注意力机制的跨模态行人重识别方法 | |
CN110348437A (zh) | 一种基于弱监督学习与遮挡感知的目标检测方法 | |
CN109271848A (zh) | 一种人脸检测方法及人脸检测装置、存储介质 | |
CN108460336A (zh) | 一种基于深度学习的行人检测方法 | |
Bondre et al. | Review on leaf diseases detection using deep learning | |
CN109033321A (zh) | 一种图像与自然语言特征提取及基于关键词的语言指示图像分割方法 | |
CN109325407A (zh) | 基于f-ssd网络滤波的光学遥感视频目标检测方法 | |
Wang et al. | IFTSDNet: An interact-feature transformer network with spatial detail enhancement module for change detection | |
Raj et al. | Steel strip quality assurance with yolov7-csf: a coordinate attention and siou fusion approach | |
CN112465821A (zh) | 一种基于边界关键点感知的多尺度害虫图像检测方法 | |
Moparthi et al. | Paddy Leaf Disease Detection using CNN | |
CN113420660B (zh) | 一种红外图像目标检测模型构建方法、预测方法及系统 | |
CN112597842B (zh) | 基于人工智能的运动检测面瘫程度评估系统 | |
CN112417961B (zh) | 一种基于场景先验知识的海面目标检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200819 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200819 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201210 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20201216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210113 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6830707 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |