JP2021117969A - ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法 - Google Patents

ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法 Download PDF

Info

Publication number
JP2021117969A
JP2021117969A JP2020138754A JP2020138754A JP2021117969A JP 2021117969 A JP2021117969 A JP 2021117969A JP 2020138754 A JP2020138754 A JP 2020138754A JP 2020138754 A JP2020138754 A JP 2020138754A JP 2021117969 A JP2021117969 A JP 2021117969A
Authority
JP
Japan
Prior art keywords
person
learning
network
training
branch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020138754A
Other languages
English (en)
Other versions
JP6830707B1 (ja
Inventor
徳双 黄
Deshuang Huang
徳双 黄
永 伍
Yong Wu
永 伍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Application granted granted Critical
Publication of JP6830707B1 publication Critical patent/JP6830707B1/ja
Publication of JP2021117969A publication Critical patent/JP2021117969A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

【課題】ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法を提供する。【解決手段】人物再同定方法は、人物再同定訓練ネットワークを構築するステップと、予め設定された訓練パラメータでネットワークハイパーパラメータ調整を行い、学習ネットワークを得るステップと、マルチスケール表現学習及びランダムバッチマスクブランチをブロックし、テストネットワークを得て、テストセットをテストネットワークに入力して、対応するテスト同定結果を得るステップと、テスト同定結果の正確率が所定値以上であるか否かを判断し、YESと判断すると実際のデータセットを学習ネットワークに入力し、さもないとネットワークを再訓練するステップと、マルチスケール表現学習及びランダムバッチマスクブランチをブロックし、応用ネットワークを得て、照会画像を応用ネットワークに入力して、対応する同定結果を得るステップと、を備える。【選択図】図1

Description

本発明はコンピュータのパターン同定及び画像処理の技術分野に関し、特にランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法に関する。
人物再同定(Person Re−identification、PReID)は、コンピュータビジョン技術を使用して画像又はビデオシーケンスに特定の人物が存在するか否かを判断する技術であり、画像検索のサブ課題の一つとして広く考えられており、1つの監視人物画像を与えると、機器間を跨いで該人物画像を自動で検索することができる。現在、都市では、公共治安分野で使用されるカメラは多数配置されており、ほぼ数十メートル〜数百メートルあたり1個程度になり、それにもかかわらず、異なるカメラの間にカバレッジできない領域が存在する。人物再同定の目的は、1つのカメラで撮影された対象が、カメラの視野を離れた後、どこへ行ったかを決定することであり、ややビデオ検索と似ており、つまり、ほかのカメラで収集されたビデオから対象を見つかることであり、人物再同定のタスクは、重複視野領域のない異なるカメラで収集された人物画像又はビデオサンプル同士の接続関係を構築する処理プロセスであり、すなわち、異なる位置のカメラで異なる時刻に撮影された人物が同一人物であるか否かを同定する。
従来の人物再同定研究はデータセットに基づいて行われ、つまり、複数のカメラを設置し、人物画像を収集し、その後、手動マーク又は自動マークを行う。これらの画像の一部は訓練及び学習用、一部は同定用である。同定精度を向上させるために、同定アルゴリズムは主に2つの部分に分けられ、一方は、より良好な画像特徴を抽出するためのものであり、他方は異なる特徴間の距離を効果的に計算比較するためのものである。
画像特徴を抽出する際に、従来の方式は、深層学習モデルを使用し、畳み込みニューラルネットワークに基づいて特徴を自動で学習し、且つアテンションメカニズムを使用して特徴を抽出することが多いが、このような方式は通常、画像中の顔特徴又はほかの突出した特徴のみを重点的に抽出し、手又は足等の抑制されたローカル特徴を抽出しない結果、これらの抑制された重要なローカル詳細特徴を効果的に抽出できないため、後続同定の正確率を確保できない。
中国特許出願公開第108647588号明細書
本発明は物品カテゴリ同定方法、装置、コンピュータ機器及び記憶媒体に関する。方法は、被同定物品画像を取得し、前記被同定物品画像のエッジマスク情報を抽出するステップと、前記エッジマスク情報に応じて、前記被同定物品画像をカット処理し、前記カット処理された被同定物品画像及び予め設定された物品カテゴリ同定モデルに応じて、前記被同定物品画像のカテゴリを同定し、同定結果を出力するステップと、を含み、前記予め設定された物品カテゴリ同定モデルは、訓練サンプル画像を訓練及び転移学習して得られたモデルであり、事前訓練及び転移学習して得られた物品カテゴリ同定モデルによって、物品の正確度の制御要件を向上させ、物品カテゴリ同定モデルを使用して被同定物品画像を同定することで、物品同定結果を正確に取得することができる。
本発明は、上記従来技術の欠陥を克服するためにランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法を提供することを目的とする。
本発明の目的は、以下の技術案によって実現できる。ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法であって、
基準データセットを取得し、基準データセットに対してデータ拡張を行うステップS1と、
データ拡張後の基準データセットを訓練セット及びテストセットに分けるステップS2と、
ResNet50畳み込みニューラルネットワークに基づいて、順次接続されたアテンション学習モジュール、特徴抽出モジュール及び同定出力モジュールを含む人物再同定訓練ネットワークを構築し、特徴抽出モジュールは特徴処理ブランチ、マルチスケール表現学習ブランチ及びランダムバッチマスクブランチを含み、前記特徴処理ブランチはグローバル平均プーリング及びバッチ正規化処理を含むステップS3と、
訓練セットを人物再同定訓練ネットワークに入力し、予め設定された訓練パラメータでネットワークハイパーパラメータ調整を行い、人物再同定学習ネットワークを得るステップS4と、
人物再同定学習ネットワーク中の特徴抽出モジュールのマルチスケール表現学習ブランチ及びランダムバッチマスクブランチをブロックし、人物再同定テストネットワークを得て、テストセットを人物再同定テストネットワークに入力し、対応するテスト同定結果を出力するステップS5と、
テスト同定結果の正確率を計算し、同定結果の正確率が所定値以上であるか否かを判断し、YESと判断すると、ステップS7を実行し、さもないと、ステップS4に戻るステップS6と、
実際のデータセットを取得し、実際のデータセットを人物再同定学習ネットワークに入力し、実際のデータセットに対応する画像特徴を学習するステップS7と、
人物再同定学習ネットワーク中の特徴抽出モジュールのマルチスケール表現学習ブランチ及びランダムバッチマスクブランチをブロックし、人物再同定応用ネットワークを得て、照会画像を人物再同定応用ネットワークに入力し、該照会対象に対応する同定結果を出力するステップS8と、を含む。
さらに、前記ステップS1では、データ拡張は具体的には、
基準データセットから複数の画像をランダムに抽出して水平反転処理を行うステップS11と、
基準データセットから複数の画像をランダムに抽出してガウス、ごま塩ノイズ処理を行うステップS12と、を含む。
さらに、前記ステップS3では、アテンション学習モジュールは対象の特徴表現を強化するように、3段階に分けられ、
前記特徴処理ブランチはラベル損失・ランク付けリスト損失合同訓練を採用し、画像のグローバル情報を取得し、
前記マルチスケール表現学習ブランチは2組のラベル損失訓練を採用し、画像中のローカル詳細特徴及び空間情報の相関性を取得し、
前記ランダムバッチマスクブランチはラベル損失訓練を採用し、画像中の抑制されるローカル特徴を捕捉する。
さらに、前記ランダムバッチマスクブランチは具体的には、サイズがランダムで且つ位置領域がランダムな遮蔽ブロックを設定し、該遮蔽ブロックで画像の一部を遮蔽することによって、遮蔽されていないローカル情報を捕捉する。
さらに、前記アテンション学習モジュールはチャネルアテンションモジュール及び空間アテンションモジュールを含み、前記チャネルアテンションモジュールは1層の平均プーリング演算、1層の多層パーセプトロン、1層の線形層及び1層のバッチ正規化層からなり、有効チャネルの重みを大きくし、無効チャネルの重みを小さくすることに用いられ、
前記空間アテンションモジュールは2個の1*1畳み込み層及び2個の3*3畳み込み層を含み、前記1*1畳み込み層は畳み込み特徴マップの次元を減少させることに用いられ、前記3*3畳み込み層は特徴を効果的に抽出することに用いられる。
さらに、前記アテンション学習モジュールは具体的には、
Figure 2021117969
さらに、前記マルチスケール表現学習ブランチでは、2組のラベル損失訓練はそれぞれ小スケール特徴訓練及び大スケール特徴訓練である。
さらに、前記ラベル損失訓練は交差エントロピー損失関数
Figure 2021117969
さらに、前記ランク付けリスト損失訓練はランク付けリスト損失トリプレット関数
Figure 2021117969
さらに、前記特徴抽出モジュールの融合損失関数は具体的には、
Figure 2021117969
従来技術に比べて、本発明は以下の利点を有する。
1、本発明はランダムバッチマスク方式を採用し、画像中の抑制されるローカル詳細特徴を学習することができ、マルチスケール表現学習方式を採用し、多スケール特徴ベクトル中の小スケール特徴及び大スケール特徴を分離訓練し、空間情報の相関性を効果的に強化でき、さらに特徴抽出の包括性及び信頼性を確保させ、後続同定の正確度の向上に寄与する。
2、本発明は特徴抽出モジュールに識別損失及びランク付けリストトリプレット損失の2種の損失関数を組み合わせて、特徴間の距離を計測し、画像の訓練又は学習中、クラス間距離を大きくするとともにクラス内距離を小さくすることができ、それにより画像特徴の有効性を向上させる。
3、本発明は、訓練又は学習では、特徴処理、ランダムバッチマスク及びマルチスケール表現学習の3ブランチの方式を採用して、画像特徴を効果的かつ全面的に抽出し、テスト又は実際の応用では、ブロックランダムバッチマスク及びマルチスケール表現学習ブランチの方式を採用して、同定正確率を確保するうえにネットワークオーバーヘッドを節約し、同定速度を向上させることができる。
本発明の方法の概略フローチャートである。 本発明のネットワークの全体ブロック図である。 人物再同定ネットワークの訓練又は学習の概略フローチャートである。 ランダムバッチマスクの設計アルゴリズムの概略図である。 人物再同定ネットワークのテスト又は応用の概略フローチャートである。
以下、図面及び具体的な実施例を参照しながら本発明を詳細説明する。
実施例
図1に示すように、ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法は、
基準データセットを取得し、基準データセットに対してデータ拡張を行うステップS1と、
データ拡張後の基準データセットを訓練セット及びテストセットに分けるステップS2と、
ResNet50畳み込みニューラルネットワークに基づいて、順次接続されたアテンション学習モジュール、特徴抽出モジュール及び同定出力モジュールを含む人物再同定訓練ネットワークを構築し、特徴抽出モジュールは特徴処理ブランチ、マルチスケール表現学習ブランチ及びランダムバッチマスクブランチを含み、前記特徴処理ブランチはグローバル平均プーリング及びバッチ正規化処理を含むステップS3と、
訓練セットを人物再同定訓練ネットワークに入力し、予め設定された訓練パラメータでネットワークハイパーパラメータ調整を行い、人物再同定学習ネットワークを得るステップS4と、
人物再同定学習ネットワーク中の特徴抽出モジュールのマルチスケール表現学習ブランチ及びランダムバッチマスクブランチをブロックし、人物再同定テストネットワークを得て、テストセットを人物再同定テストネットワークに入力し、対応するテスト同定結果を出力するステップS5と、
テスト同定結果の正確率を計算し、同定結果の正確率が所定値以上であるか否かを判断し、YESと判断すると、ステップS7を実行し、さもないと、ステップS4に戻るステップS6と、
実際のデータセットを取得し、実際のデータセットを人物再同定学習ネットワークに入力し、実際のデータセットに対応する画像特徴を学習するステップS7と、
人物再同定学習ネットワーク中の特徴抽出モジュールのマルチスケール表現学習ブランチ及びランダムバッチマスクブランチをブロックし、人物再同定応用ネットワークを得て、照会画像を人物再同定応用ネットワークに入力し、該照会対象に対応する同定結果を出力するステップS8と、を含む。
本発明はランダムバッチマスク(Random Batch Feature Mask、RBFM)訓練戦略及びマルチスケール表現学習(Multi−scale Feature Representations Learning)方法を採用して人物画像中の、人物の空間相関性を含むより顕著で詳細な特徴情報を抽出し、ランダムバッチマスク学習ブランチ及びマルチスケール表現学習方法ブランチはネットワークの訓練及び学習段階のみで使用され、ネットワークのテスト及び実用段階ではブロックして使用せず、図2に示すように、本発明はResNet−50を特徴抽出ネットワークとして採用し、ResNet50の特徴抽出プロセスの段階1(Stage 1)、段階2(Stage 2)、段階3(Stage 3)では、まず、アテンション学習モジュール(Attention Learning Module)を導入して対象の特徴表現を強化し、その後、ResNet50の段階4(Stage 4)の特徴ベクトルを特徴処理ブランチ、ランダムバッチマスク訓練学習ブランチ及びマルチスケール表現学習方法ブランチを経過させ、特徴処理ブランチは識別損失(Identification Loss)・ランク付けリスト損失(Ranked List Loss)合同訓練を採用して人物のグローバル情報を取得し、主にGAP(グローバル平均プーリング)及びBN(バッチ正規化処理)を含み、ランダムバッチマスク学習ブランチはラベル損失訓練を採用して、抑制されるローカル特徴を捕捉し、それによって特徴抽出能力を向上させ、マルチスケール表現学習はラベル損失訓練を採用して人物画像中のローカル詳細特徴及び空間情報の相関性を取得し、このような革新的な学習戦略は、特徴抽出能力及び同定性能をさらに向上させることができ、3本のブランチは合計で4個の識別損失及び1個のランク付けリスト損失を採用して特徴間の距離を計測する。
具体的な応用では、まず、基準データセットを使用してネットワーク訓練及びテストを順次行い、ネットワーク訓練によって学習ネットワークを得て、学習ネットワーク中のランダムバッチマスクブランチ及びマルチスケール表現学習ブランチをブロックし、テストネットワークを得て、テストネットワークが同定正確度の所定値に達した後、実際のデータセットを学習ネットワークに入力して特徴学習を行い、その後、学習ネットワーク中のランダムバッチマスクブランチ及びマルチスケール表現学習ブランチをブロックし、応用ネットワークを得て、最後に、応用ネットワークによって被照会画像に対して人物再同定を行う。人物再同定ネットワークの訓練プロセスは図3に示され、基準データセットについて、以下のデータ前処理方式によってデータ拡張を行う必要がある。
1)データセットから複数の画像をランダムに抽出して水平反転処理を行う。
2)データセットから複数の画像をランダムに抽出してガウス、ごま塩ノイズ処理を行う。
基準データセットに対して、対応する組織及び上記データ処理を行った後、画像を畳み込みニューラルネットワーク中(ResNet50)に入力して特徴抽出を行う。
ネットワーク訓練の全過程について、特徴抽出部分では、identification loss(識別損失)とranked list loss(ランク付けリスト損失)を融合する方式を使用して合同訓練を行い、3つのブランチの特徴学習構造を含み、各ブランチ特徴によって画像の特徴マップを抽出し、その後、合同した損失関数によってネットワーク訓練、重み更新を行う。
アテンション学習モジュール(Attention Learning Module)について、チャネルアテンションモジュール及び空間アテンションモジュールを含み、チャネルアテンションの主なアイデアは有効チャネルの重みを大きくし、無効チャネルの重みを小さくすることであり、チャネルアテンションモジュールは1層の平均プーリング演算、1層の多層パーセプトロン、1層の線形層及び1層のバッチ正規化層からなり、平均プーリング演算は以下の式に示される。
Figure 2021117969
採用される平均プーリング層、多層パーセプトロン及び線形層は各チャネルアテンション及び調整チャネルアテンションの寸法を評価するためのものであり、チャネルアテンションの式は以下のように示される。
Figure 2021117969
一方、空間アテンションモジュールは画像中の位置情報に着目し、ネットワークに、特徴マップ中のどの部分が空間的により高い応答を有する可能性があるかを理解させ、空間アテンションモジュールは4個の畳み込み層を含み、そのうち、2個の畳み込み層は1*1畳み込みで畳み込み特徴マップの次元を削減し、2個の3*3畳み込みは次元削減後、特徴を効果的に抽出することに用いられ、空間アテンションは以下のように示される。
Figure 2021117969
最終的なアテンション学習モジュールはチャネルアテンションと空間アテンションを組み合わせて、
Figure 2021117969
ランダムバッチマスクブランチは主に、抑制されるローカル詳細特徴を学習し、モデルの特徴抽出能力を向上させ、ランダムバッチマスク訓練戦略は主に特徴ベクトルの訓練中、サイズがランダムで、位置領域がランダムな遮蔽ブロックを設定してローカル詳細情報を捕捉することであり、その設計アルゴリズムは図4に示される。
ネットワーク訓練及びネットワーク学習段階では、まず、ネットワークにおいて第4段階で出力されるN個の次元サイズがC×H×W(Cは特徴マップのチャネル数、H、Wはそれぞれ特徴マップの高さ及び幅である)の特徴マップに応じて、高さマスク比率値R及び幅マスク比率値Rをランダムに生成し、
その後、高さマスク比率値Rと入力特徴マップの高さHを乗算してマスク高さHを得て、幅マスク比率値Rと入力特徴マップの幅Wを乗算してマスク幅Wを得て、
さらに0〜(H−H)数値の間にある整数X、及び0〜(W−W)数値の間にある整数Yをランダムに生成し、
H行W列の数値がすべて1のマトリックスPを生成し、マトリックスP中のX〜X+H及びY〜Y+Wの領域にすべて0を付値し、マスクマトリックスP’を得て、
最後に、得られたマスクマトリックスP’を入力されたN個の特徴マップと対応付けて乗算し、すなわち、入力されたN個の特徴マップに対応付けてマスク処理を行う。
ネットワークテスト及び実用段階では、ランダムバッチマスク学習ブランチをブロックする。
マルチスケール表現学習ブランチは、マルチスケールグループ畳み込み戦略を採用し、ResNet50中のStage−4中の特徴ベクトルを分割し、複数のグループの畳み込みカーネルのサイズ3*3でグループ特徴に対して特徴抽出を行い、マルチスケール特徴ベクトル中の小スケール特徴及び大スケール特徴を分離訓練し、それにより人物画像中のより顕著で詳細な特徴を抽出し、空間情報の相関性を強化することができる。
identification loss(識別損失)は、一般な識別タスクで使用される損失関数と同じであり、一般には交差エントロピー損失関数を使用し、具体的な式は以下のように示される。
Figure 2021117969
人物データセット中の訓練セットとテストセットが共通部分を有さないため、人物再同定はone−shot学習タスクとして考えられ、その結果、モデル訓練の過剰適合現象を引き起こしてしまう。一方、Label smoothingは識別タスクで過剰適合を回避する一般的な方法である。
Figure 2021117969
ranked list loss(ランク付けリスト損失)について、陽性サンプルと陰性サンプルを区別するために、陰性サンプル間の距離をある閾値αよりも大きく設定し、且つ陽性サンプル間の距離をα−dよりも小さく設定し、すなわち、陽性サンプルと陰性サンプルの間に少なくとも間隔dを有する。
Figure 2021117969
トリプレット損失、交差エントロピー損失を使用してネットワークの特徴抽出エネルギーを合同訓練し、融合された損失関数は以下のように表現される。
Figure 2021117969
本実施例では、ネットワーク訓練プロセスの訓練パラメータは、訓練エポック(epoch)を120、重み減衰パラメータ(weight decay)を0.0005、バッチサイズ(batch size)を32に設定し、学習率更新方式は以下の通りである。
Figure 2021117969
ネットワーク訓練を経て学習ネットワークを得て、学習ネットワーク中のランダムバッチマスクブランチ及びマルチスケール表現学習ブランチをブロックし、テストネットワークを得て、具体的なテストプロセスは5に示され、特徴抽出時、特徴処理ブランチのみを使用して特徴抽出を行う。本発明に係る方法を採用し、本実施例はCUHK03−Labeledデータセットにおいてほかの同定方法と比較し、対応する同定結果は表1に示される。
Figure 2021117969
表1のデータからわかるように、本発明に係る人物再同定方法は、従来のほかの同定方法よりもRank−1正確率値及びmAP値がいずれも優れ、本発明は画像特徴、特に画像中の抑制される重要なローカル詳細特徴を全面的かつ効果的に抽出することで、後続同定の正確度を向上させることができる。

Claims (10)

  1. ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法であって、
    基準データセットを取得し、基準データセットに対してデータ拡張を行うステップS1と、
    データ拡張後の基準データセットを訓練セット及びテストセットに分けるステップS2と、
    ResNet50畳み込みニューラルネットワークに基づいて、順次接続されたアテンション学習モジュール、特徴抽出モジュール及び同定出力モジュールを含む人物再同定訓練ネットワークを構築し、特徴抽出モジュールは特徴処理ブランチ、マルチスケール表現学習ブランチ及びランダムバッチマスクブランチを含み、前記特徴処理ブランチはグローバル平均プーリング及びバッチ正規化処理を含むステップS3と、
    訓練セットを人物再同定訓練ネットワークに入力し、予め設定された訓練パラメータでネットワークハイパーパラメータ調整を行い、人物再同定学習ネットワークを得るステップS4と、
    人物再同定学習ネットワーク中の特徴抽出モジュールのマルチスケール表現学習ブランチ及びランダムバッチマスクブランチをブロックし、人物再同定テストネットワークを得て、テストセットを人物再同定テストネットワークに入力し、対応するテスト同定結果を出力するステップS5と、
    テスト同定結果の正確率を計算し、同定結果の正確率が所定値以上であるか否かを判断し、YESと判断すると、ステップS7を実行し、さもないと、ステップS4に戻るステップS6と、
    実際のデータセットを取得し、実際のデータセットを人物再同定学習ネットワークに入力し、実際のデータセットに対応する画像特徴を学習するステップS7と、
    人物再同定学習ネットワーク中の特徴抽出モジュールのマルチスケール表現学習ブランチ及びランダムバッチマスクブランチをブロックし、人物再同定応用ネットワークを得て、照会画像を人物再同定応用ネットワークに入力し、該照会対象に対応する同定結果を出力するステップS8と、を含むことを特徴とするランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法。
  2. 前記ステップS1では、データ拡張は具体的には、
    基準データセットから複数の画像をランダムに抽出して水平反転処理を行うステップS11と、
    基準データセットから複数の画像をランダムに抽出してガウス、ごま塩ノイズ処理を行うステップS12と、を含むことを特徴とする請求項1に記載のランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法。
  3. 前記ステップS3では、アテンション学習モジュールは対象の特徴表現を強化するように、3段階に分けられ、
    前記特徴処理ブランチはラベル損失・ランク付けリスト損失合同訓練を採用し、画像のグローバル情報を取得し、
    前記マルチスケール表現学習ブランチは2組のラベル損失訓練を採用し、画像中のローカル詳細特徴及び空間情報の相関性を取得し、
    前記ランダムバッチマスクブランチはラベル損失訓練を採用し、画像中の抑制されるローカル特徴を捕捉することを特徴とする請求項1に記載のランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法。
  4. 前記ランダムバッチマスクブランチは具体的には、サイズがランダムで且つ位置領域がランダムな遮蔽ブロックを設定し、該遮蔽ブロックで画像の一部を遮蔽することによって、遮蔽されていないローカル情報を捕捉することを特徴とする請求項3に記載のランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法。
  5. 前記アテンション学習モジュールはチャネルアテンションモジュール及び空間アテンションモジュールを含み、前記チャネルアテンションモジュールは1層の平均プーリング演算、1層の多層パーセプトロン、1層の線形層及び1層のバッチ正規化層からなり、有効チャネルの重みを大きくし、無効チャネルの重みを小さくすることに用いられ、
    前記空間アテンションモジュールは2個の1*1畳み込み層及び2個の3*3畳み込み層を含み、前記1*1畳み込み層は畳み込み特徴マップの次元を減少させることに用いられ、前記3*3畳み込み層は特徴を効果的に抽出することに用いられることを特徴とする請求項3に記載のランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法。
  6. 前記アテンション学習モジュールは具体的には、
    Figure 2021117969
    であることを特徴とする請求項5に記載のランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法。
  7. 前記マルチスケール表現学習ブランチでは、2組のラベル損失訓練はそれぞれ小スケール特徴訓練及び大スケール特徴訓練であることを特徴とする請求項3に記載のランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法。
  8. 前記ラベル損失訓練は交差エントロピー損失関数
    Figure 2021117969

    を採用することを特徴とする請求項7に記載のランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法。
  9. 前記ランク付けリスト損失訓練は、ランク付けリストトリプレット損失関数
    Figure 2021117969
    を採用することを特徴とする請求項8に記載のランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法。
  10. 前記特徴抽出モジュールの融合損失関数は具体的には、
    Figure 2021117969
    であることを特徴とする請求項9に記載のランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法。
JP2020138754A 2020-01-23 2020-08-19 ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法 Active JP6830707B1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010076639.3 2020-01-23
CN202010076639.3A CN111259850B (zh) 2020-01-23 2020-01-23 一种融合随机批掩膜和多尺度表征学习的行人重识别方法

Publications (2)

Publication Number Publication Date
JP6830707B1 JP6830707B1 (ja) 2021-02-17
JP2021117969A true JP2021117969A (ja) 2021-08-10

Family

ID=70949122

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020138754A Active JP6830707B1 (ja) 2020-01-23 2020-08-19 ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法

Country Status (2)

Country Link
JP (1) JP6830707B1 (ja)
CN (1) CN111259850B (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113868449A (zh) * 2021-09-22 2021-12-31 西安理工大学 基于多尺度特征与空间注意力机制融合的图像检索方法
CN114937199A (zh) * 2022-07-22 2022-08-23 山东省凯麟环保设备股份有限公司 一种基于判别性特征增强的垃圾分类方法与系统
JP2022173321A (ja) * 2021-10-15 2022-11-18 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド オブジェクトの検出方法、装置、デバイス、媒体及びプログラム
CN116958148A (zh) * 2023-09-21 2023-10-27 曲阜师范大学 输电线路关键部件缺陷的检测方法、装置、设备、介质

Families Citing this family (119)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111814854B (zh) * 2020-06-28 2023-07-28 北京交通大学 一种无监督域适应的目标重识别方法
CN111814705B (zh) * 2020-07-14 2022-08-02 广西师范大学 一种基于批次分块遮挡网络的行人再辨识方法
CN112084338B (zh) * 2020-09-18 2024-02-06 达而观数据(成都)有限公司 一种文档自动归类方法、系统、计算机设备及存储介质
CN112183295A (zh) * 2020-09-23 2021-01-05 上海眼控科技股份有限公司 行人重识别方法、装置、计算机设备及存储介质
CN112200111B (zh) * 2020-10-19 2022-05-17 厦门大学 一种全局与局部特征融合的遮挡鲁棒行人重识别方法
CN112464775A (zh) * 2020-11-21 2021-03-09 西北工业大学 一种基于多分支网络的视频目标重识别方法
CN112434599B (zh) * 2020-11-23 2022-11-18 同济大学 一种基于噪声通道的随机遮挡恢复的行人重识别方法
CN112434796B (zh) * 2020-12-09 2022-10-25 同济大学 一种基于局部信息学习的跨模态行人再识别方法
CN112396036B (zh) * 2020-12-09 2023-08-08 中山大学 一种结合空间变换网络和多尺度特征提取的遮挡行人重识别方法
CN112749667B (zh) * 2021-01-15 2023-04-07 中国科学院宁波材料技术与工程研究所 一种基于深度学习的线虫分类识别方法
CN112785479B (zh) * 2021-01-21 2023-05-23 南京信息工程大学 一种基于少样本学习的图像隐形水印通用检测方法
CN112801008B (zh) * 2021-02-05 2024-05-31 电子科技大学中山学院 行人重识别方法、装置、电子设备及可读存储介质
CN112883880B (zh) * 2021-02-25 2022-08-19 电子科技大学 基于人体结构多尺度分割的行人属性识别方法、存储介质和终端
CN112990007B (zh) * 2021-03-13 2022-08-09 山东大学 基于区域分组与内部关联融合的人脸表情识别方法及系统
CN113191386B (zh) * 2021-03-26 2023-11-03 中国矿业大学 基于网格重构学习的染色体分类模型
CN113158815B (zh) * 2021-03-27 2023-05-12 复旦大学 一种无监督行人重识别方法、系统及计算机可读介质
CN113312961A (zh) * 2021-04-03 2021-08-27 国家计算机网络与信息安全管理中心 一种logo识别加速方法
CN113177579A (zh) * 2021-04-08 2021-07-27 北京科技大学 一种基于注意力机制的特征融合方法
CN113156376B (zh) * 2021-04-15 2023-08-11 中国人民解放军空军航空大学 基于sacnn的雷达辐射源信号识别方法
CN113050042B (zh) * 2021-04-15 2023-08-15 中国人民解放军空军航空大学 基于改进UNet3+网络的雷达信号调制类型识别方法
CN113158905A (zh) * 2021-04-23 2021-07-23 佛山市南海区广工大数控装备协同创新研究院 一种基于注意力机制的行人重识别方法
CN114782977B (zh) * 2021-04-28 2024-07-05 河南大学 一种基于拓扑信息和亲和度信息引导行人重识别方法
CN113204977B (zh) * 2021-04-29 2023-09-26 北京有竹居网络技术有限公司 信息翻译方法、装置、设备和存储介质
CN113239776B (zh) * 2021-05-10 2023-06-06 北方工业大学 一种基于能量模型的行人重识别方法
CN113128466B (zh) * 2021-05-11 2023-12-05 深圳大学 行人重识别方法、系统、电子装置及存储介质
CN113239784B (zh) * 2021-05-11 2022-09-30 广西科学院 一种基于空间序列特征学习的行人重识别系统及方法
CN113192085A (zh) * 2021-05-11 2021-07-30 联想(北京)有限公司 三维器官图像分割方法、装置及计算机设备
CN113283320B (zh) * 2021-05-13 2024-09-06 桂林安维科技有限公司 一种基于通道特征聚合的行人重识别方法
CN113255495A (zh) * 2021-05-17 2021-08-13 开放智能机器(上海)有限公司 一种养猪场生猪清点方法以及清点系统
CN113656628B (zh) * 2021-05-24 2023-03-28 江苏省特种设备安全监督检验研究院 一种基于注意力机制和特征融合的起重机图像检索方法
CN113313173B (zh) * 2021-06-01 2023-05-30 中山大学 基于图表示和改进Transformer的人体解析方法
CN113377985A (zh) * 2021-06-08 2021-09-10 南京工业大学 一种基于金字塔网络的中药图像的分类和检索方法
CN113591545B (zh) * 2021-06-11 2024-05-24 北京师范大学珠海校区 一种基于深度学习的多级特征提取网络行人再识别方法
CN113221854B (zh) * 2021-06-11 2024-07-09 公安部物证鉴定中心 一种基于多尺度深度特征的赤足足迹图像人身识别方法
CN113297624B (zh) * 2021-06-23 2023-04-18 支付宝(杭州)信息技术有限公司 图像的预处理方法及装置
CN113673303B (zh) * 2021-06-28 2024-02-02 中国科学院大学 一种人脸面部动作单元强度回归方法、装置和介质
CN113627093B (zh) * 2021-07-01 2023-11-21 武汉大学 一种基于改进Unet网络的水下机构跨尺度流场特征预测方法
CN113625227B (zh) * 2021-07-05 2023-07-04 西安电子科技大学 基于注意力变换网络的雷达高分辨距离像目标识别方法
CN113378791B (zh) * 2021-07-09 2022-08-05 合肥工业大学 基于双注意力机制和多尺度特征融合的宫颈细胞分类方法
CN113537032B (zh) * 2021-07-12 2023-11-28 南京邮电大学 一种基于图片分块丢弃的分集多支路行人重识别方法
CN113627259A (zh) * 2021-07-12 2021-11-09 西安理工大学 基于图卷积网络的细微动作识别方法
CN113627266B (zh) * 2021-07-15 2023-08-18 武汉大学 基于Transformer时空建模的视频行人重识别方法
CN113723447B (zh) * 2021-07-15 2024-03-08 西北工业大学 一种多模态影像的端到端的模板匹配方法
CN113537111A (zh) * 2021-07-26 2021-10-22 南京信息工程大学 基于双支路深度卷积网络的虹膜分割方法
CN113869105B (zh) * 2021-08-09 2024-09-10 华北电力大学(保定) 一种人体行为识别方法
CN113706406B (zh) * 2021-08-11 2023-08-04 武汉大学 基于特征空间多分类对抗机制的红外可见光图像融合方法
CN113610026A (zh) * 2021-08-13 2021-11-05 广联达科技股份有限公司 基于掩膜注意力的行人重识别方法及重识别装置
CN113569990B (zh) * 2021-08-25 2024-03-05 浙江工业大学 面向强噪声干扰环境的演艺装备故障诊断模型构建方法
CN113705476A (zh) * 2021-08-30 2021-11-26 国网四川省电力公司营销服务中心 一种基于神经网络的现场作业违章行为分析方法及系统
CN113689517B (zh) * 2021-09-08 2024-05-21 云南大学 一种多尺度通道注意力网络的图像纹理合成方法及系统
CN113689356B (zh) * 2021-09-14 2023-11-24 三星电子(中国)研发中心 一种图像修复的方法和装置
CN113792744B (zh) * 2021-09-14 2023-09-05 东北农业大学 一种低功耗广域网内农作物生长数据传输系统及方法
CN113763373B (zh) * 2021-09-17 2023-10-13 上海交通大学 域泛化的尺度对齐翻拍图片检测系统
CN113837080B (zh) * 2021-09-24 2023-07-25 江西理工大学 一种基于信息增强与感受野增强的小目标检测方法
CN113888501B (zh) * 2021-09-29 2024-02-06 西安理工大学 一种基于注意力定位网络的无参考型图像质量评价方法
CN113780241B (zh) * 2021-09-29 2024-02-06 北京航空航天大学 一种显著物体检测的加速方法与装置
CN113869418B (zh) * 2021-09-29 2024-07-02 哈尔滨工程大学 一种基于全局注意力关系网络的小样本船舶目标识别方法
CN113780243B (zh) * 2021-09-29 2023-10-17 平安科技(深圳)有限公司 行人图像识别模型的训练方法、装置、设备以及存储介质
CN113947204A (zh) * 2021-10-13 2022-01-18 北京百度网讯科技有限公司 图像识别方法、装置、存储介质和计算机程序产品
CN113947782B (zh) * 2021-10-14 2024-06-07 哈尔滨工程大学 一种基于注意力机制的行人目标对齐方法
CN113920472B (zh) * 2021-10-15 2024-05-24 中国海洋大学 一种基于注意力机制的无监督目标重识别方法及系统
CN114022930B (zh) * 2021-10-28 2024-04-16 天津大学 一种人像证件照自动生成方法
CN114021458B (zh) * 2021-11-05 2022-11-04 西安晟昕科技发展有限公司 基于并行原型网络的小样本雷达辐射源信号识别方法
CN114005096B (zh) * 2021-11-09 2024-05-10 河北工业大学 基于特征增强的车辆重识别方法
CN113963150B (zh) * 2021-11-16 2022-04-08 北京中电兴发科技有限公司 一种基于多尺度孪生级联网络的行人重识别方法
CN113963422B (zh) * 2021-11-22 2024-07-19 上海电力大学 基于多注意力融合Transformer架构的不确定性人脸表情识别方法
CN114170635A (zh) * 2021-12-06 2022-03-11 佳都科技集团股份有限公司 基于网络模型的图像识别方法、装置、设备及存储介质
CN114187275B (zh) * 2021-12-13 2024-07-02 贵州大学 一种基于多阶段和多尺度注意力融合网络及图像去雨方法
CN114201993B (zh) * 2021-12-13 2024-09-13 厦门大学 一种检测超声缺陷的三分支注意力特征融合方法与系统
CN114332701B (zh) * 2021-12-27 2024-05-28 北京航空航天大学 一种基于任务区分检测再识别联合网络的目标跟踪方法
CN114332007B (zh) * 2021-12-28 2024-06-28 福州大学 一种基于Transformer的工业缺陷检测和识别方法
CN114529717A (zh) * 2021-12-29 2022-05-24 宁波大学 一种基于多模态多时间尺度的步态识别方法
CN114387580B (zh) * 2022-01-06 2024-10-18 厦门大学 基于联邦学习的模型训练方法及装置
CN114419671B (zh) * 2022-01-18 2024-03-26 北京工业大学 一种基于超图神经网络的遮挡行人重识别方法
CN114596218B (zh) * 2022-01-25 2023-11-07 西北大学 基于卷积神经网络的古代绘画图像修复方法、模型和装置
CN114519796A (zh) * 2022-01-27 2022-05-20 厦门大学 一种基于深度神经网络的机器人材质识别方法及系统
CN114419026B (zh) * 2022-02-10 2024-07-19 北京航空航天大学 基于视觉注意力的航空发动机保险丝绕向识别系统及方法
CN114548132A (zh) * 2022-02-22 2022-05-27 广东奥普特科技股份有限公司 条形码检测模型的训练方法、装置及条形码检测方法、装置
CN114638256B (zh) * 2022-02-22 2024-05-31 合肥华威自动化有限公司 基于声波信号及注意力网络的变压器故障检测方法及其系统
CN114694089B (zh) * 2022-02-28 2024-09-20 郑州大学 一种新型的多模态融合的行人重识别方法
CN114581560B (zh) * 2022-03-01 2024-04-16 西安交通大学 基于注意力机制的多尺度神经网络红外图像彩色化方法
CN114821699B (zh) * 2022-03-02 2024-03-08 西北工业大学 一种基于抑制模糊度自训练的人脸表情识别方法
CN114743128B (zh) * 2022-03-09 2024-08-09 华侨大学 一种基于异种神经网络的多模态东北虎再辨识方法及装置
CN114842324A (zh) * 2022-03-16 2022-08-02 南京邮电大学 一种基于学习神经网络的伪装目标检测方法及系统
CN114821704B (zh) * 2022-03-16 2024-05-24 桂林理工大学 一种基于关键点注意力机制的口罩人脸识别方法
CN114764787A (zh) * 2022-03-18 2022-07-19 杭州电子科技大学 一种基于深度学习的单细胞质谱系统自动聚焦方法
CN114782859B (zh) * 2022-03-28 2024-07-19 华中科技大学 一种目标行为感知时空定位模型的建立方法及应用
CN114693693A (zh) * 2022-03-31 2022-07-01 四川大学华西医院 一种基于卷积神经网络的胎儿胼胝体超声图像分割方法
CN115050044B (zh) * 2022-04-02 2023-06-23 广西科学院 一种基于MLP-Mixer的跨模态行人重识别方法
CN114757904B (zh) * 2022-04-07 2024-08-02 河南大学 一种基于ai深度学习算法的表面缺陷检测方法
CN114742800B (zh) * 2022-04-18 2024-02-20 合肥工业大学 基于改进Transformer的强化学习电熔镁炉工况识别方法
CN114882590B (zh) * 2022-05-06 2024-04-02 中国科学技术大学 一种基于事件相机的多粒度时空特征感知的唇读方法
CN114926877B (zh) * 2022-05-10 2024-02-20 西北工业大学 一种基于对比域差异的跨域人脸表情识别方法
CN114973317B (zh) * 2022-05-13 2023-04-28 杭州像素元科技有限公司 一种基于多尺度邻接交互特征的行人重识别方法
CN115035170B (zh) * 2022-05-17 2024-03-05 合肥工业大学 基于全局纹理与结构的图像修复方法
CN114898158A (zh) * 2022-05-24 2022-08-12 杭州电子科技大学 基于多尺度注意力耦合机制的小样本交通异常图像采集方法及系统
CN115050048B (zh) * 2022-05-25 2023-04-18 杭州像素元科技有限公司 一种基于局部细节特征的跨模态行人重识别方法
CN115115648B (zh) * 2022-06-20 2024-07-19 北京理工大学 一种结合UNet和体绘制先验知识的脑组织分割方法
CN115082966B (zh) * 2022-07-22 2022-12-06 中国科学院自动化研究所 行人重识别模型训练方法、行人重识别方法、装置和设备
CN115546223A (zh) * 2022-12-05 2022-12-30 南京天创电子技术有限公司 一种列车车下设备紧固螺栓的缺失检测方法和系统
CN115950888B (zh) * 2023-01-09 2024-04-09 湖南艾科瑞生物工程有限公司 qPCR孔板的质量检测方法及相关设备
CN115862120B (zh) * 2023-02-21 2023-11-10 天度(厦门)科技股份有限公司 可分离变分自编码器解耦的面部动作单元识别方法及设备
CN116188436B (zh) * 2023-03-03 2023-11-10 合肥工业大学 基于局部特征和全局特征融合的膀胱镜图像分类方法
CN116563615B (zh) * 2023-04-21 2023-11-07 南京讯思雅信息科技有限公司 基于改进多尺度注意力机制的不良图片分类方法
CN116311483B (zh) * 2023-05-24 2023-08-01 山东科技大学 基于局部面部区域重构和记忆对比学习的微表情识别方法
CN116311387B (zh) * 2023-05-25 2023-09-01 浙江工业大学 一种基于特征交集的跨模态行人重识别方法
CN116342363B (zh) * 2023-05-31 2023-07-28 齐鲁工业大学(山东省科学院) 基于两阶段深度神经网络的可见水印去除方法
CN116824695B (zh) * 2023-06-07 2024-07-19 南通大学 一种基于特征去噪的行人再识别非局部防御方法
CN116432870B (zh) * 2023-06-13 2023-10-10 齐鲁工业大学(山东省科学院) 一种城市流量预测方法
CN116758631B (zh) * 2023-06-13 2023-12-22 杭州追形视频科技有限公司 大数据驱动的行为智能分析方法及系统
CN116721351B (zh) * 2023-07-06 2024-06-18 内蒙古电力(集团)有限责任公司内蒙古超高压供电分公司 一种架空线路通道内道路环境特征遥感智能提取方法
CN116630639B (zh) * 2023-07-20 2023-12-12 深圳须弥云图空间科技有限公司 对象图像的识别方法及装置
CN116612122B (zh) * 2023-07-20 2023-10-10 湖南快乐阳光互动娱乐传媒有限公司 图像显著性区域的检测方法及装置、存储介质及电子设备
CN117496245A (zh) * 2023-11-08 2024-02-02 深圳市眼科医院(深圳市眼病防治研究所) 基于自监督预训练的白内障图像分类方法及系统
CN117252892B (zh) * 2023-11-14 2024-03-08 江西师范大学 基于轻量化视觉自注意力网络的双分支人像自动抠图装置
CN117636057B (zh) * 2023-12-13 2024-06-11 石家庄铁道大学 基于多分支跨空间注意力模型的列车轴承损伤分类识别方法
CN118230398B (zh) * 2024-05-24 2024-07-26 中国科学技术大学 一种微表情识别模型的训练方法、识别方法及相关设备
CN118334045B (zh) * 2024-06-07 2024-10-11 南京理工大学 基于双注意力机制和多尺度融合的小样本医学图像分割方法
CN118314335B (zh) * 2024-06-11 2024-09-13 西安邮电大学 一种基于多层注意力融合的小目标检测方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018506788A (ja) * 2015-04-03 2018-03-08 三菱電機株式会社 物体の再同定の方法
WO2018170421A1 (en) * 2017-03-17 2018-09-20 Magic Leap, Inc. Room layout estimation methods and techniques
JP2018160200A (ja) * 2017-03-24 2018-10-11 富士通株式会社 ニューラルネットワークの学習方法、ニューラルネットワークの学習プログラム及びニューラルネットワークの学習装置
JP2019056966A (ja) * 2017-09-19 2019-04-11 株式会社東芝 情報処理装置、画像認識方法および画像認識プログラム
JP2019083002A (ja) * 2017-10-27 2019-05-30 アドビ インコーポレイテッド トリプレット損失ニューラル・ネットワーク・トレーニングを使用するフォント認識の改善
JP2019185483A (ja) * 2018-04-12 2019-10-24 富士通株式会社 機械学習プログラム、機械学習方法および機械学習装置
JP2019197445A (ja) * 2018-05-11 2019-11-14 日本電信電話株式会社 画像認識装置、画像認識方法、およびプログラム
US20200005122A1 (en) * 2018-06-27 2020-01-02 International Business Machines Corporation Multiscale feature representations for object recognition and detection
JP2020009435A (ja) * 2018-07-03 2020-01-16 株式会社神戸製鋼所 鋼材成分学習装置、鋼材成分推定装置、鋼種判定装置、鋼材成分学習方法、鋼材成分推定方法、鋼種判定方法、及びプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108427927B (zh) * 2018-03-16 2020-11-27 深圳市商汤科技有限公司 目标再识别方法和装置、电子设备、程序和存储介质
CN110188611A (zh) * 2019-04-26 2019-08-30 华中科技大学 一种引入视觉注意力机制的行人重识别方法及系统
CN110070073A (zh) * 2019-05-07 2019-07-30 国家广播电视总局广播电视科学研究院 基于注意力机制的全局特征和局部特征的行人再识别方法
CN110533024B (zh) * 2019-07-10 2021-11-23 杭州电子科技大学 基于多尺度roi特征的双二次池化细粒度图像分类方法
CN110647794B (zh) * 2019-07-12 2023-01-03 五邑大学 基于注意力机制的多尺度sar图像识别方法及装置
CN110598654B (zh) * 2019-09-18 2022-02-11 合肥工业大学 多粒度交叉模态特征融合行人再识别方法和再识别系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018506788A (ja) * 2015-04-03 2018-03-08 三菱電機株式会社 物体の再同定の方法
WO2018170421A1 (en) * 2017-03-17 2018-09-20 Magic Leap, Inc. Room layout estimation methods and techniques
JP2018160200A (ja) * 2017-03-24 2018-10-11 富士通株式会社 ニューラルネットワークの学習方法、ニューラルネットワークの学習プログラム及びニューラルネットワークの学習装置
JP2019056966A (ja) * 2017-09-19 2019-04-11 株式会社東芝 情報処理装置、画像認識方法および画像認識プログラム
JP2019083002A (ja) * 2017-10-27 2019-05-30 アドビ インコーポレイテッド トリプレット損失ニューラル・ネットワーク・トレーニングを使用するフォント認識の改善
JP2019185483A (ja) * 2018-04-12 2019-10-24 富士通株式会社 機械学習プログラム、機械学習方法および機械学習装置
JP2019197445A (ja) * 2018-05-11 2019-11-14 日本電信電話株式会社 画像認識装置、画像認識方法、およびプログラム
US20200005122A1 (en) * 2018-06-27 2020-01-02 International Business Machines Corporation Multiscale feature representations for object recognition and detection
JP2020009435A (ja) * 2018-07-03 2020-01-16 株式会社神戸製鋼所 鋼材成分学習装置、鋼材成分推定装置、鋼種判定装置、鋼材成分学習方法、鋼材成分推定方法、鋼種判定方法、及びプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113868449A (zh) * 2021-09-22 2021-12-31 西安理工大学 基于多尺度特征与空间注意力机制融合的图像检索方法
CN113868449B (zh) * 2021-09-22 2024-05-28 西安理工大学 基于多尺度特征与空间注意力机制融合的图像检索方法
JP2022173321A (ja) * 2021-10-15 2022-11-18 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド オブジェクトの検出方法、装置、デバイス、媒体及びプログラム
JP7387847B2 (ja) 2021-10-15 2023-11-28 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド オブジェクトの検出方法、装置、デバイス、媒体及びプログラム
CN114937199A (zh) * 2022-07-22 2022-08-23 山东省凯麟环保设备股份有限公司 一种基于判别性特征增强的垃圾分类方法与系统
CN116958148A (zh) * 2023-09-21 2023-10-27 曲阜师范大学 输电线路关键部件缺陷的检测方法、装置、设备、介质
CN116958148B (zh) * 2023-09-21 2023-12-12 曲阜师范大学 输电线路关键部件缺陷的检测方法、装置、设备、介质

Also Published As

Publication number Publication date
JP6830707B1 (ja) 2021-02-17
CN111259850A (zh) 2020-06-09
CN111259850B (zh) 2022-12-16

Similar Documents

Publication Publication Date Title
JP6830707B1 (ja) ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法
CN110084292B (zh) 基于DenseNet和多尺度特征融合的目标检测方法
CN111783576B (zh) 基于改进型YOLOv3网络和特征融合的行人重识别方法
CN108830188A (zh) 基于深度学习的车辆检测方法
CN105389562B (zh) 一种时空约束的监控视频行人重识别结果的二次优化方法
Li et al. A multi-scale cucumber disease detection method in natural scenes based on YOLOv5
CN109559320A (zh) 基于空洞卷积深度神经网络实现视觉slam语义建图功能的方法及系统
Kiratiratanapruk et al. Using deep learning techniques to detect rice diseases from images of rice fields
CN106529499A (zh) 基于傅里叶描述子和步态能量图融合特征的步态识别方法
CN108154159B (zh) 一种基于多级检测器的具有自恢复能力的目标跟踪方法
Zhao et al. Using adversarial network for multiple change detection in bitemporal remote sensing imagery
CN112507853B (zh) 一种基于互注意力机制的跨模态行人重识别方法
CN110348437A (zh) 一种基于弱监督学习与遮挡感知的目标检测方法
CN109271848A (zh) 一种人脸检测方法及人脸检测装置、存储介质
CN108460336A (zh) 一种基于深度学习的行人检测方法
Bondre et al. Review on leaf diseases detection using deep learning
CN109033321A (zh) 一种图像与自然语言特征提取及基于关键词的语言指示图像分割方法
CN109325407A (zh) 基于f-ssd网络滤波的光学遥感视频目标检测方法
Wang et al. IFTSDNet: An interact-feature transformer network with spatial detail enhancement module for change detection
Raj et al. Steel strip quality assurance with yolov7-csf: a coordinate attention and siou fusion approach
CN112465821A (zh) 一种基于边界关键点感知的多尺度害虫图像检测方法
Moparthi et al. Paddy Leaf Disease Detection using CNN
CN113420660B (zh) 一种红外图像目标检测模型构建方法、预测方法及系统
CN112597842B (zh) 基于人工智能的运动检测面瘫程度评估系统
CN112417961B (zh) 一种基于场景先验知识的海面目标检测方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200819

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20200819

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201210

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20201216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210113

R150 Certificate of patent or registration of utility model

Ref document number: 6830707

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150