JP7498863B2

JP7498863B2 - 異常の検出および位置特定を行うための自己教師あり学習

Info

Publication number: JP7498863B2
Application number: JP2023528523A
Authority: JP
Inventors: ソン，キヒョク; リー，チュン－リィアン; ユン，ジンソン; フィスター，トーマス・ジョン
Original assignee: Google LLC
Current assignee: Google LLC
Priority date: 2020-11-13
Filing date: 2021-11-11
Publication date: 2024-06-12
Anticipated expiration: 2041-11-11
Also published as: US20220156521A1; KR20230104253A; JP2023549606A; WO2022103993A1; US11941084B2; EP4244826A1; CN116508069A

Description

技術分野
本開示は、異常の検出および位置特定を行うための自己教師あり学習に関する。

背景
機械学習モデルを用いた異常検出は、正常なインスタンスで見られるものとは異なる異常パターンおよび欠陥パターンを含むインスタンスを検出することを目的とする。製造欠陥の検出、医用画像の解析およびビデオ監視を含む異常検出に対して、コンピュータビジョンの異なる応用領域からの多くの問題が存在している。典型的な教師あり分類問題とは異なり、異常検出問題は、いくつかの特別な課題に直面している。第１に、問題の性質によって、ラベルされたまたはラベルされていない大量の異常データを得ることが困難である。第２に、高解像度の画像において欠陥部分が小さく、微妙であり得るため、正常パターンと異常パターンとの違いは、しばしば微小である。

概要
本開示の一態様は、機械学習モデルを訓練するための方法を提供する。方法は、データ処理ハードウェアにおいて、訓練サンプルのセットを取得することを含む。方法は、１つ以上の訓練反復の各訓練反復中に、訓練サンプルのセット内の各訓練サンプルに対して、データ処理ハードウェアが、訓練サンプルをトリミングすることによって、第１のトリミング画像を生成することを含む。また、方法は、データ処理ハードウェアが、訓練サンプルをトリミングすることによって、第１のトリミング画像とは異なる第２のトリミング画像を生成することと、データ処理ハードウェアが、第２のトリミング画像の第１の部分を複製することとを含む。また、方法は、データ処理ハードウェアが、第２のトリミング画像の複製された第１の部分を第２のトリミング画像の第２の部分に重ねることによって、増強された第２のトリミング画像を形成することを含む。第１の部分は、第２の部分とは異なる。また、モデルは、データ処理ハードウェアが、第１のトリミング画像および増強された第２のトリミング画像を用いて機械学習モデルを訓練することを含む。

本開示の実装形態は、以下の任意選択の特徴のうちの１つ以上を含むことができる。いくつかの実装形態において、第２のトリミング画像の複製された第１の部分は、可変の長さおよび可変の幅を有する矩形の形状を有する。いくつかの実装形態において、第２のトリミング画像の複製された第１の部分を第２のトリミング画像の第２の部分に重ねることは、第２のトリミング画像の第２の部分に対して第２のトリミング画像のランダムな位置を選択することと、選択されたランダムな位置で、第２のトリミング画像の複製された第１の部分を重ねることとを含む。

いくつかの例において、第１のトリミング画像および増強された第２のトリミング画像を用いて機械学習モデルを訓練することは、第１のトリミング画像の第１の交差エントロピー損失を決定することと、増強された第２のトリミング画像の第２の交差エントロピー損失を決定することと、第１の交差エントロピー損失および第２の交差エントロピー損失に基づいて総交差エントロピー損失を決定することとを含む。総交差エントロピー損失は、第１の交差エントロピー損失と第２の交差エントロピー損失との合計を含むことができる。

必要に応じて、各訓練サンプルは、ラベルされていなくてもよい。いくつかの実装形態において、機械学習モデルは、畳み込みニューラルネットワークを含む。いくつかの実装形態において、機械学習モデルは、画像データ内の異常パターンを検出するように構成されている。方法は、第２のトリミング画像の複製された第１の部分を第２のトリミング画像の第２の部分に重ねる前に、データ処理ハードウェアが、第２のトリミング画像の複製された第１の部分を回転させることをさらに含むことができる。いくつかの実装形態において、方法は、第２のトリミング画像の複製された第１の部分を第２のトリミング画像の第２の部分に重ねる前に、データ処理ハードウェアが、カラージッタを第２のトリミング画像の複製された第１の部分に適用することをさらに含む。

本開示の別の態様は、機械学習モデルを訓練するためのシステムを提供する。システムは、データ処理ハードウェアと、データ処理ハードウェアと通信するメモリハードウェアとを含む。メモリハードウェアは、データ処理ハードウェア上で実行されると、データ処理ハードウェアに動作を実行させる命令を記憶する。動作は、訓練サンプルのセットを取得することを含む。１つ以上の訓練反復の各訓練反復中に、訓練サンプルのセット内の各訓練サンプルに対して、動作は、訓練サンプルをトリミングすることによって第１のトリミング画像を生成することと、訓練サンプルをトリミングすることによって、第１のトリミング画像とは異なる第２のトリミング画像を生成することとを含む。また、動作は、第２のトリミング画像の第１の部分を複製することと、第２のトリミング画像の複製された第１の部分を第２のトリミング画像の第２の部分に重ねることによって、増強された第２のトリミング画像を形成することとを含む。第１の部分は、第２の部分とは異なる。また、動作は、第１のトリミング画像および増強された第２のトリミング画像を用いて機械学習モデルを訓練することを含む。

本開示の実装形態は、以下の任意選択の特徴のうちの１つ以上を含むことができる。いくつかの実装形態において、第２のトリミング画像の複製された第１の部分は、可変の長さおよび可変の幅を有する矩形の形状を有する。いくつかの例において、第２のトリミング画像の複製された第１の部分を第２のトリミング画像の第２の部分に重ねることは、第２のトリミング画像の第２の部分に対して第２のトリミング画像のランダムな位置を選択することと、選択されたランダムな位置で、第２のトリミング画像の複製された第１の部分を重ねることとを含む。

必要に応じて、第１のトリミング画像および増強された第２のトリミング画像を用いて機械学習モデルを訓練することは、第１のトリミング画像の第１の交差エントロピー損失を決定することと、増強された第２のトリミング画像の第２の交差エントロピー損失を決定することと、第１の交差エントロピー損失および第２の交差エントロピー損失に基づいて総交差エントロピー損失を決定することとを含むことができる。総交差エントロピー損失は、第１の交差エントロピー損失と第２の交差エントロピー損失との合計を含むことができる。

いくつかの実装形態において、各訓練サンプルは、ラベルされていない。いくつかの実装形態において、機械学習モデルは、畳み込みニューラルネットワークを含む。いくつかの実装形態において、機械学習モデルは、画像データ内の異常パターンを検出するように構成されている。動作は、第２のトリミング画像の複製された第１の部分を第２のトリミング画像の第２の部分に重ねる前に、データ処理ハードウェアが、第２のトリミング画像の複製された第１の部分を回転させることをさらに含むことができる。いくつかの実装形態において、動作は、第２のトリミング画像の複製された第１の部分を第２のトリミング画像の第２の部分に重ねる前に、データ処理ハードウェアが、カラージッタを第２のトリミング画像の複製された第１の部分に適用することをさらに含む。

本開示の１つ以上の実装形態の詳細は、添付の図面および以下の詳細な説明に記載されている。他の態様、特徴、および利点は、詳細な説明および図面、ならびに特許請求の範囲から明らかになるであろう。

異常の検出および位置特定を行うためのモデルを訓練するためのシステムを示す概略図である。異常の検出および位置特定を行うための学習方法を示す概略図である。異常の検出および位置特定を行うためのモデルを訓練するための別のシステムを示す概略図である。傷痕（scar）技術を用いて異常の検出および位置特定を行うための学習方法を示す概略図である。異常の検出および位置特定を行うためのモデルを訓練する方法の動作の例示的な構成を示すフローチャートである。傷痕技術を使用して異常の検出および位置特定を行うためのモデルを訓練する方法の動作の例示的な構成を示すフローチャートである。本明細書に記載されたシステムおよび方法を実装するために使用され得る例示的なコンピューティング装置を示す概略図である。

様々な図面おいて、同様の参照符号は、同様の要素を示す。
詳細な説明
機械学習モデルを用いた異常検出は、正常なインスタンスで見られるものとは異なる異常パターンおよび欠陥パターンを含むインスタンスを検出することを目的とする。製造欠陥の検出、医用画像の解析およびビデオ監視を含む異常検出に対して、コンピュータビジョンの異なる応用領域からの多くの問題が存在している。典型的な教師あり分類問題とは異なり、異常検出問題は、いくつかの特別な課題に直面している。第１に、問題の性質によって、ラベルされたまたはラベルされていない大量の異常データを得ることが困難である。第２に、高解像度の画像において欠陥部分が小さく、微妙であり得るため、正常パターンと異常パターンとの違いは、しばしば微小である。

異常データへのアクセスが限られているため、異常検出器の構築は、正常データのみ（すなわち、非異常データ）を用いて、半教師ありまたは１クラス分類設定の下で行われることが多い。一般的には異常パターンの分布が事前に知られていないため、モデルは、正常なインスタンスのパターンを学習し、試験サンプルがこれらのモデルによってうまく表現されていないときに異常を検出するように訓練されることが多い。例えば、正常なデータを再構成するように訓練されたオートエンコーダは、データの再構成誤差が大きいときに異常を宣言するように使用されている。生成モデルは、確率密度が特定の閾値を下回るときにサンプルが異常であることを宣言する。しかしながら、ピクセルごとの再構成誤差の集合体または負の確率密度として定義されている異常スコアは、高レベルの意味情報を捕捉することができない。

本明細書の実装形態は、異常の検出および位置特定を行うために構成された機械学習モデルのロバストな訓練を提供するモデル訓練器に関する。モデル訓練器は、大量の異常データを必要としない半教師あり学習技術を使用する一方で、きめ細かい異常領域の正確な検出を提供する。

図１を参照して、いくつかの実装形態において、例示的なシステム１００、１００Ａは、処理システム１０を含む。処理システム１０は、固定または拡張可能な／順応性のある計算リソース１２（例えば、データ処理ハードウェア）および／または記憶リソース１４（例えば、メモリハードウェア）を有する単一のコンピュータ、複数のコンピュータ、または分散システム（例えば、クラウド環境）であってもよい。処理システム１０は、モデル訓練器１１０を実行する。モデル訓練器１１０は、入力データに基づいて予測を行う機械学習モデル１５０（例えば、ディープニューラルネットワーク（ＤＮＮ））を訓練する。例えば、モデル訓練器１１０は、機械学習モデル１５０の畳み込みニューラルネットワーク（ＣＮＮ）を訓練する。モデル訓練器１１０は、訓練サンプル１１２のセットを用いて機械学習モデル１５０を訓練する。いくつかの実装形態において、訓練サンプル１１２のセットは、記憶リソース１４に記憶されている。訓練サンプル１１２の各訓練サンプルは、通常パターン（すなわち、異常を含まないパターン）の画像を含むことができる。例えば、通常パターンの画像は、２５６×２５６ピクセルの解像度を有する。以下でより詳細に説明するように、モデル訓練器１１０は、いくつかの実装形態に従って、正常パターンの画像に基づいて、異常を有する１つ以上の増強画像を生成するように構成されている。モデル訓練器１１０によって生成された１つ以上の異常画像は、機械学習モデル１５０の訓練を強化または改善するための増強入力データとして提供されてもよい。

いくつかの実装形態において、モデル訓練器１１０は、記憶リソース１４または訓練サンプル１１２を記憶するのに適した他の装置から訓練サンプル１１２を取得する。訓練サンプル１１２は、ラベルされていなくてもよい。言い換えれば、訓練サンプル１１２のセット内の１つ以上の訓練サンプル（画像）または各訓練サンプルは、対応する訓練サンプル１１２内の異常または欠陥を示すラベルを含まなくてもよい。

いくつかの実装形態において、モデル訓練器１１０は、画像トリミング部１２０を含む。画像トリミング部１２０は、（元の画像のピクセルの一部を除去することによって）訓練サンプル１１２の各画像をより小さいサイズの画像にトリミングする。いくつかの実装形態において、画像トリミング部１２０は、２５６×２５６画像（すなわち、２５６行および２５６列のピクセルを有する画像）を６４×６４画像または３２×３２画像にトリミングするように構成されている。画像トリミング部１２０は、訓練サンプル１１２を１つ以上のトリミング画像にトリミングすることができる。例えば、画像トリミング部は、各訓練サンプル１１２を第１のトリミング画像１４０Ａおよび第２のトリミング画像１４０Ｂにトリミングすることができる。第１のトリミング画像１４０Ａは、第２のトリミング画像１４０Ｂとは異なってもよい。例えば、画像トリミング部１２０は、２つの異なる部分を第１トリミング画像１４０Ａおよび第２トリミング画像１４０Ｂにそれぞれトリミングする。以下でより詳細に説明するように、画像トリミング部１２０がトリミングするために選択した画像の部分は、擬似ランダムまたはランダムであってもよい。第１のトリミング画像１４０Ａと第２のトリミング画像１４０Ｂとは、同じサイズであってもよく、異なるサイズであってもよい。

いくつかの実装形態において、モデル訓練器１１０は、サンプル増強部２００を含む。サンプル増強部２００は、訓練サンプル１１２の各訓練サンプルの第２のトリミング画像１４０Ｂを受信し、増強された第２のトリミング画像１４０ＢＡを生成する。いくつかの実装形態において、サンプル増強部２００は、増強された第２のトリミング画像１４０ＢＡを生成するために、第２のトリミング画像１４０Ｂの第１の部分２１０を複製（すなわち、コピー）し、第２のトリミング画像１４０Ｂの複製された第１の部分２１０を第２のトリミング画像１４０Ｂの第２の部分２２０に重ねることによって、増強された第２のトリミング画像１４０ＢＡを形成する（図２）。

図２を参照して、サンプル増強部２００は、第２のトリミング画像１４０Ｂの第１の部分２１０を「カット」またはコピーまたは複製し、コピーされた第１の部分２１０を同じ第２のトリミング画像１４０Ｂの異なる第２の部分２２０の上に「貼り付ける」ことによって、元の第２のトリミング画像１４０Ｂの増強された第２のトリミング画像１４０ＢＡを生成することができる。いくつかの実装形態において、第２のトリミング画像１４０Ｂのコピーまたは複製された第１の部分２１０は、特定の形状または予め選択された形状を有する。第２のトリミング画像１４０Ｂの複製された第１の部分２１０のサイズおよび形状は、変更されてもよい。例えば、第２のトリミング画像１４０Ｂの複製された第１の部分２１０は、矩形の形状を有する。矩形の長さおよび幅は、サンプル１１２またはモデル１５０のユーザ設定および／またはパラメータに基づいて変更されてもよい。いくつかの実装形態において、矩形の形状は、以下でより詳細に説明する「傷痕」部分と同様である。

いくつかの例において、増強された第２のトリミング画像１４０ＢＡを生成するために、サンプルオーガ入力２００は、第２のトリミング画像１４０Ｂ上の第１のランダムな位置で第１の部分２１０を選択し、第２のトリミング画像１４０Ｂの第１の部分２１０を複製し、第２のトリミング画像１４０Ｂ上の第２のランダムな位置で第２のトリミング画像１４０Ｂの複製された第１の部分２１０を第２の部分２２０に重ねるか、または配置する。第２のトリミング画像１４０Ｂを増強するために、２つのランダムな位置は、第２のトリミング画像１４０Ｂ上の異なる位置であってもよい。その結果、増強されていない訓練サンプル１１２のみで訓練されたものと比較して、増強された第２のトリミング画像１４０ＢＡは、機械学習モデル１５０の訓練を強化または改善するために提供されている。

再び図１を参照して、いくつかの例において、モデル訓練器１１０は、第１のトリミング画像１４０Ａと増強された第２のトリミング画像１４０ＢＡの両方を用いて、機械学習モデル１５０を訓練する。いくつかの実装形態において、機械学習モデル１５０は、交差エントロピー損失を用いて訓練されている。例えば、機械学習モデル１５０の訓練目標は、以下のように表現されてもよい。

再び図２を参照して、いくつかの実装形態において、サンプル増強部２００は、第２のトリミング画像１４０Ｂに基づいて、増強された第２のトリミング画像１４０ＢＡを生成する。図２に示す例において、第１トリミング画像１４０Ａおよび第２トリミング画像１４０Ｂの各々は、メッシュパターンを含む。増強部２００は、第２のトリミング画像１４０Ｂの第１の部分２１０（すなわち、第２トリミング画像１４０Ｂの右下隅の矩形部分）を「カット」または複製し、複製された第１の部分２１０を第２のトリミング画像１４０Ｂの第２の部分２２０（すなわち、第２トリミング画像１４０Ｂの左上隅の矩形部分）に重ねるか、または配置することによって、第２のトリミング画像１４０Ｂの第２の部分２２０に「貼り付けられた」第１の部分２１０によって引き起こされた不整合メッシュパターンを含む増強された第２のトリミング画像１４０ＢＡを形成または生成する。

第２のトリミング画像１４０Ｂの第１の部分２１０および第２のトリミング画像１４０Ｂの第２の部分２２０の場所（位置または向き）は、本明細書に記載された特定の場所（位置または向き）に限定されない。例えば、サンプル増強部２００は、第２のトリミング画像１４０Ｂ上のランダムな位置（例えば、中央部分）で第１の部分２１０をコピーまたは複製し、複製された第１の部分２１０を第２のトリミング画像１４０Ｂ上のランダムな位置（例えば、右上隅）に位置する第２の部分２２０に重ねるか、または配置することによって、増強された第２のトリミング画像１４０ＢＡを生成する。いくつかの実装形態において、第１の部分２１０および第２の部分２２０は、機械学習モデル１５０を訓練するために使用され得る増強された第２のトリミング画像１４０ＢＡを生成するために、第２のトリミング画像１４０Ｂ内の異なるランダムな位置で選択されている。いくつかの実装形態において、矩形（すなわち、第１の部分および第２の部分）の長さおよび幅は、変更されてもよい。図２の例において、第１の部分２１０および第２の部分２２０のサイズは同じであるが、いくつかの実装形態において、第１の部分２１０および第２の部分２２０のサイズは異なる。図２に示すように、増強された第２のトリミング画像１４０ＢＡに含まれる複製された第１の部分２１０は、第２のトリミング画像１４０ＢＡのメッシュパターンに異常（すなわち、不整合メッシュパターン）を与える。

追加的にまたは代替的に、モデル訓練器１１０は、増強された第２のトリミング画像１４０ＢＡをさらに増強することによって、機械学習モデル１５０に貴重な訓練をさらに提供することができる。いくつかの実装形態において、モデル訓練器１１０のサンプル増強部２００は、第２のトリミング画像１４０Ｂの複製された第１の部分２１０を第２のトリミング画像１４０Ｂの第２の部分２２０に重ねる前に、予め選択された回転度（すなわち、時計回りまたは反時計回り方向）またはランダムな回転度（すなわち、時計回りまたは反時計回り方向）で、複製された第１の部分２１０を回転させる。追加的にまたは代替的に、モデル訓練器１１０の増強部２００は、第２のトリミング画像１４０Ｂの複製された第１の部分２１０を第２のトリミング画像１４０Ｂの第２の部分２２０に重ねる前に、カラージッタを複製された第１の部分２１０に適用する。例えば、モデル訓練器１１０の増強部２００は、第２トリミング画像１４０Ｂの複製された第１の部分２１０の輝度、コントラスト、または彩度の少なくとも１つをランダムに変更することによって、カラージッタを適用する。カラージッタおよび回転を適用することは、単に複製および被覆技術からの増強に抵抗するパターンを含み、貴重な訓練を提供するためにさらなる増強を必要とするいくつかの画像にとって有用である。

いくつかの実装形態において、モデル訓練器１１０のサンプル増強部２００は、予め選択された回転度（時計回りまたは反時計回り方向）またはランダムな回転度（時計回りまたは反時計回り方向）で第２のトリミング画像１４０Ｂの複製された部分を回転させた後、第２のトリミング画像１４０Ｂの複製された第１の部分を第２のトリミング画像１４０Ｂの第２の部分に重ねる前に、カラージッタを複製された第１の部分に適用することができる。いくつかの実装形態において、モデル訓練器１１０のサンプル増強部２００は、カラージッタを第２のトリミング画像１４０Ｂの複製された第１の部分に適用した後、複製された第１の部分を第２のトリミング画像１４０Ｂの第２の部分に重ねる前に、予め選択された回転度（時計回りまたは反時計回り方向）またはランダムな回転度（時計回りまたは反時計回り方向）で第２のトリミング画像１４０Ｂの複製された部分を回転させることができる。

複製および被覆技術は、（カラージッタおよび／または回転特徴と共に）空間的な不規則性を導入する。例えば、異なるサイズ、アスペクト比および回転角度の「矩形パッチ」（例えば、第２のトリミング画像１４０Ｂの第１の部分２１０）を第２のトリミング画像１４０Ｂの第２の部分２２０に重ねることによって、機械学習モデル１５０の訓練を強化するための増強データは、より多様化になる。

図３を参照して、いくつかの実装形態において、例示的なシステム１００、１００Ｂは、１つ以上の訓練サンプル１１２の画像を、第１のトリミング画像１４０Ａ、第２のトリミング画像１４０Ｂおよび第３のトリミング画像１４０Ｃを含む複数のトリミング画像にトリミングするための画像トリミング部１２０、１２０Ｂを含む。第１のトリミング画像１４０Ａ、第２のトリミング画像１４０Ｂおよび第３のトリミング画像１４０Ｃの各々は、互いに異なってもよい。すなわち、画像トリミング部１２０は、元の画像の３つの異なる部分を第１のトリミング画像１４０Ａ、第２のトリミング画像１４０Ｂおよび第３のトリミング画像１４０Ｃにトリミングする。画像トリミング部１２０がトリミングするために選択した訓練サンプル１１２内の画像の部分は、擬似ランダムまたはランダムであってもよい。第１のトリミング画像１４０Ａ、第２のトリミング画像１４０Ｂおよび第３のトリミング画像１４０Ｃは、同じサイズであってもよく、または異なるサイズであってもよい。

モデル訓練器１１０は、サンプル増強部２００、２００Ｂを含むことができる。サンプル増強部２００Ｂは、第３のトリミング画像１４０Ｃに基づいて、増強された第２のトリミング画像１４０ＢＡと増強された第３のトリミング画像１４０ＣＡとを生成するように構成されている。上述したように、いくつかの例において、画像トリミング部１２０は、訓練サンプル１１２内の各画像に対して、訓練サンプル１１２の画像を第１のトリミング画像１４０Ａ、第２のトリミング画像１４０Ｂおよび第３のトリミング画像１４０Ｃを含む複数のトリミング画像にトリミングする。サンプル増強部２００Ｂは、他の数のトリミング画像１４０を生成してもよい。

図４を参照して、いくつかの実装形態において、サンプル増強器２００は、各訓練サンプル１１２の第３のトリミング画像１４０Ｃを受信し、増強された第３のトリミング画像１４０ＣＡを生成する。必要に応じて、増強された第３のトリミング画像１４０ＣＡを生成するために、サンプル増強部２００は、部分２１０、２２０と同様に、第３のトリミング画像１４０Ｃの第１の部分２３０を複製（すなわち、コピー）し、第３のトリミング画像１４０Ｃの複製された第１の部分２３０を第３のトリミング画像１４０Ｃの第２の部分２４０に重ねることによって、増強された第３のトリミング画像１４０ＣＡを形成する。すなわち、サンプル増強部２００は、第３のトリミング画像１４０Ｃの部分２３０を「カット」またはコピーし、コピーされた部分２３０を同じ第３のトリミング画像１４０Ｃの異なる部分２４０上に「貼り付ける」ことによって、元の第３のトリミング画像１４０Ｃを増強することができる。具体的には、第３のトリミング画像１４０Ｃのコピーまたは複製された部分２３０は、細長い矩形の形状を有し、これは、「傷痕」部分２３０と呼ばれてもよい。いくつかの実装形態において、「傷痕」部分２３０は、増強された第２のトリミング画像１４０ＢＡに含まれる第１の部分２１０（すなわち、「矩形パッチ」）よりも小さい。

いくつかの例において、増強された第３のトリミング画像１４０ＣＡを生成するために、サンプル増強部２００は、第３のトリミング画像１４０Ｃ上のランダムな位置で第１の部分２３０（すなわち、細長い矩形の第１の部分２３０）を選択して複製し、第３のトリミング画像１４０Ｃの複製された部分２３０を第３のトリミング画像１４０Ｃ上のランダムな位置に位置する第２の部分２４０に重ねるか、または配置する。いくつかの実装形態において、第１の部分２３０および第２の部分２４０は、異なる位置に位置している。その結果、「傷痕」部分２３０を有する増強された第３のトリミング画像１４０ＣＡは、機械学習モデル１５０の訓練を強化または改善するために提供されている。

追加的にまたは代替的に、モデル訓練器１１０のサンプル増強部２００は、第２のトリミング画像１４０ＢＡと同じまたは同様の方法で、増強された第３のトリミング画像１４０ＣＡをさらに増強することによって、機械学習モデル１５０にさらなる貴重な訓練を提供することができる。いくつかの実装形態において、モデル訓練器１１０のサンプル増強部２００は、第３のトリミング画像１４０Ｃの複製された第１の部分２３０を第３のトリミング画像１４０Ｃの第２の部分２４０に重ねる前に、予め選択された回転度（時計回りまたは反時計回り方向）またはランダムな回転度（時計回りまたは反時計回り方向）で、複製された第１の部分２３０（例えば、「傷痕」部分）を回転させる。いくつかの実装形態において、モデル訓練器１１０は、第３のトリミング画像１４０Ｃの複製された第１の部分２３０を第３のトリミング画像１４０Ｃの第２の部分２４０に重ねる前に、カラージッタを複製された第１の部分２３０（例えば、「傷痕」部分）に適用してもよい。

例えば、モデル訓練器１１０のサンプル増強部２００は、第３のトリミング画像１４０Ｃの複製された第１の部分２３０の輝度、コントラスト、または彩度の少なくとも１つをランダムに変更することによって、カラージッタを適用する。いくつかの実装形態において、モデル訓練器１１０のサンプル増強部２００は、第３のトリミング画像１４０Ｃの複製された第１の部分２３０を第３のトリミング画像１４０Ｃの第２の部分２４０に重ねる前に、予め選択された回転度（時計回りまたは反時計回り方向）またはランダムな回転度（時計回りまたは反時計回り方向）で、第３のトリミング画像１４０Ｃの複製された第１の部分２３０（例えば、「傷痕」部分）を回転させ、カラージッタを第３のトリミング画像１４０Ｃの複製された第１の部分２３０に適用することができる。カラージッタおよび回転を適用することは、単に複製および被覆技術からの増強に抵抗するパターンを含み、貴重な訓練を提供するためにさらなる増強を必要とするいくつかの画像にとって有用である。重複および被覆技術は、（カラージッタおよび／または回転特徴と共に）空間不規則性を導入する。例えば、サンプル増強器２００は、異なるサイズ、アスペクト比、および回転角度の細長い矩形の「傷痕」（すなわち、第３のトリミング画像１４０Ｃの第１の部分）を第３のトリミング画像１４０Ｃのランダムな第２の部分に重ねることによって、多様な増強データを生成する。

引き続き図４を参照して、いくつかの実装形態において、サンプル増強部２００は、第２のトリミング画像１４０Ｂおよび第３のトリミング画像１４０Ｃに基づいて、増強された第２のトリミング画像１４０ＢＡおよび増強された第３のトリミング画像１４０ＣＡをそれぞれ生成する。上述したように、第１のトリミング画像１４０Ａおよび増強された第２のトリミング画像１４０ＢＡは、追加の訓練画像を機械学習モデル１５０（図２および図４）に提供するために生成されている。概略図４００に示すように、第１のトリミング画像１４０Ａおよび増強された第２のトリミング画像１４０ＢＡに加えて、増強された第３のトリミング画像１４０ＣＡは、さらに追加の訓練画像を機械学習モデル１５０に提供する。

ここで、第１トリミング画像１４０Ａ、第２トリミング画像１４０Ｂおよび第３トリミング画像１４０Ｃの各々は、メッシュパターンを含む。図４に示すように、増強部２００は、第３のトリミング画像１４０Ｃの第１の部分２３０（例えば、第３のトリミング画像１４０Ｃの右下隅に約１：６の幅対長さの比を有する細長い矩形部分）を「カット」またはコピーし、複製された第１の部分２３０を第３のトリミング画像１４０Ｃの第２の部分２４０（すなわち、第３のトリミング画像１４０Ｃの左上隅に約１：６の幅対長さの比を有する細長い矩形部分）に重ねるか、または配置することによって、第３のトリミング画像１４０Ｃの第１の部分２３０の「貼り付け」によって引き起こされた不整合メッシュパターンを含む増強された第３のトリミング画像１４０ＣＡを形成または生成する。第３のトリミング画像１４０Ｃの第１の部分２３０および第３のトリミング画像１４０Ｃの第２の部分２４０の場所（または位置）は、上述した特定の場所（または位置）に限定されない。

例えば、サンプル増強部２００は、第３のトリミング画像１４０Ｃ上のランダムな位置（例えば、中央部分）で第１の部分２３０をコピーまたは複製し、複製された第１の部分２３０を第３のトリミング画像１４０Ｃ上のランダムな位置（例えば、右上隅）に位置する第２の部分２４０に重ねるか、または配置することによって、増強された第３のトリミング画像１４０ＣＡを生成する。いくつかの実装形態において、ランダムな位置は、機械学習モデル１５０を訓練するために使用され得る増強された第３のトリミング画像１４０ＣＡを生成するための第３のトリミング画像１４０Ｃ内の異なる位置である。いくつかの実装形態において、細長い矩形の幅対長さの比（例えば、約１：６以上）は、変更されてもよい。この例において、増強された第３のトリミング画像１４０ＣＡに含まれる複製された第１の部分２０３は、第３のトリミング画像１４０ＣＡのメッシュパターンに「傷痕」のような異常（すなわち、「傷痕」メッシュパターン）を与える。いくつかの実装形態において、「傷痕」部分は、増強された第２のトリミング画像１４０ＢＡに含まれる第１の部分２１０よりも小さい。

図５は、異常の検出および位置特定を行うためのモデル１５０を訓練するための方法５００の動作の例示的な構成を示すフローチャートである。方法５００は、動作５０２において、データ処理ハードウェア１２が、訓練サンプル１１２のセットを取得することを含む。上述したように、機械学習モデル１５０（例えば、畳み込みニューラルネットワーク（ＣＮＮ））は、訓練サンプル１１２のセットで訓練されている。訓練サンプル１１２の各々は、正常パターン（すなわち、異常を含まないパターン）の画像を含むことができる。例えば、通常パターンの画像は、２５６×２５６画像である。

動作５０４において、方法５００は、１つ以上の訓練反復の各訓練反復中に、データ処理ハードウェア１２が、訓練サンプル１１２内の訓練サンプル（画像）をトリミングすることによって、第１のトリミング画像１４０Ａを生成することを含む。方法５００は、動作５０６において、データ処理ハードウェア１２が、訓練サンプル１１２内の訓練サンプル（画像）をトリミングすることによって、第１のトリミング画像１４０Ａとは異なる第２のトリミング画像１４０Ｂを生成することを含む。上述したように、訓練サンプル１１２からの各画像は、より小さいサイズの画像にトリミングされる。いくつかの実装形態において、訓練サンプル１１２内の各２５６×２５６画像は、６４×６４画像または３２×３２画像にトリミングされる。第１のトリミング画像１４０Ａは、第２のトリミング画像１４０Ｂとは異なってもよい。すなわち、画像トリミング部１２０は、異なる２つの部分を第１トリミング画像１４０Ａおよび第２トリミング画像１４０Ｂにトリミングする。トリミングするために訓練サンプル１１２から選択された訓練サンプル（画像）の部分は、擬似ランダムまたはランダムであってもよい。第１のトリミング画像１４０Ａと第２のトリミング画像１４０Ｂとは、同じサイズであってもよく、または異なるサイズであってもよい。

動作５０８において、方法５００は、データ処理ハードウェア１２が、第２のトリミング画像１４０Ｂの第１の部分２１０を複製することと、動作５１０において、データ処理ハードウェア１２が、第２のトリミング画像１４０Ｂの複製された第１の部分２１０を第２のトリミング画像１４０Ｂの第２の部分２２０に重ねることによって、増強された第２のトリミング画像１４０ＢＡを形成することとを含む。第１の部分２１０は、第２の部分２２０とは異なる。上述したように、いくつかの実装形態において、第２のトリミング画像１４０Ｂのコピーまたは複製された第１の部分は、特定の形状または予め選択された形状を有する。第２のトリミング画像１４０Ｂの複製された第１の部分のサイズおよび形状は、変更されてもよい。例えば、第２トリミング画像１４０Ｂの複製された第１の部分は、矩形である。矩形の長さおよび幅は、いくつかの実装形態に従って変更されてもよい。いくつかの実装形態において、増強された第２のトリミング画像１４０ＢＡを生成するために、第２のトリミング画像１４０Ｂの第１の部分２１０の位置および第２のトリミング画像１４０Ｂの第２の部分２２０の位置は、ランダムに決定されている。いくつかの実装形態において、方法５００は、データ処理ハードウェア１２が第２のトリミング画像１４０Ｂの複製された第１の部分２１０を回転させること、またはデータ処理ハードウェア１２がカラージッタを第２のトリミング画像１４０Ｂの複製された第１の部分２１０に適用することのうち、少なくとも１つをさらに含む。

動作５１２において、方法５００は、データ処理ハードウェア１２が、第１のトリミング画像１４０Ａおよび増強された第２のトリミング画像１４０ＢＡを用いて機械学習モデル１５０を訓練することを含む。

図６は、異常の検出および位置特定を行うためのモデル１５０を訓練するための方法６００の動作の例示的な構成を示すフローチャートである。方法６００は、図５を参照して上記で詳細に説明した動作５０２～５１０（図５）と一致する動作６０２～６１０を含むいくつかの動作を含むため、それらの詳細な説明がここでは繰り返さない。動作６１２から開始して、方法６００は、データ処理ハードウェア１２が、訓練サンプル１１２内の訓練サンプル（画像）をトリミングすることによって、第１のトリミング画像１４０Ａと第２のトリミング画像１４０Ｂとは異なる第３のトリミング画像１４０Ｃを生成することを含む。上述したように、訓練サンプル１１２からの各画像は、より小さいサイズの画像にトリミングされる。いくつかの実装形態において、任意の解像度画像は、任意のより小さい解像度画像部分にトリミングされてもよいが、訓練サンプル１１２内の各２５６×２５６画像は、６４×６４画像または３２×３２画像にトリミングされる。第１のトリミング画像１４０Ａ、第２のトリミング画像１４０Ｂおよび第３のトリミング画像１４０Ｃは、互いに異なってもよい。すなわち、画像トリミング部１２０は、３つの異なる部分を第１トリミング画像１４０Ａ、第２トリミング画像１４０Ｂおよび第３トリミング画像１４０Ｃにトリミングする。トリミングするために訓練サンプル１１２から選択された訓練サンプル（画像）の部分は、擬似ランダムまたはランダムであってもよい。第１のトリミング画像１４０Ａと第２のトリミング画像１４０Ｂと第３のトリミング画像１４０Ｃとは、同じサイズであってもよく、または異なるサイズであってもよい。

動作６１４において、方法６００は、データ処理ハードウェア１２が、第３のトリミング画像１４０Ｃの第１の部分２３０を複製することと、動作６１６において、データ処理ハードウェア１２が、第３のトリミング画像１４０Ｃの複製された第１の部分２３０を第３のトリミング画像１４０Ｃの第２の部分２４０に重ねることによって、増強された第３のトリミング画像１４０ＣＡを形成することとを含む。第１の部分２３０は、第２の部分２４０とは異なる。上述したように、いくつかの実装形態において、第３のトリミング画像１４０Ｃのコピーまたは複製された第１の部分２３０は、細長い矩形の形状を有する。いくつかの実装形態において、第１の部分２３０および第２の部分２４０は、機械学習モデル１５０をさらに訓練するために使用され得る増強された第３のトリミング画像１４０ＣＡを生成するために、第３のトリミング画像１４０Ｃ内の異なるランダムな位置で選択される。いくつかの実装形態において、細長い矩形の幅対長さの比（例えば、約１：６以上）は、変更されてもよい。例えば、図４に示すように、増強された第３のトリミング画像１４０ＣＡに含まれる複製された第１の部分２３０は、第３のトリミング画像１４０ＣＡのメッシュパターンに「傷痕」のような異常（すなわち、「傷痕」メッシュパターン）を与える。いくつかの実装形態において、「傷痕」部分は、増強された第２のトリミング画像１４０ＢＡに含まれる第１の部分よりも小さい。いくつかの実装形態において、方法６００は、データ処理ハードウェア１２が第３のトリミング画像１４０Ｃの複製された部分を回転させること、またはデータ処理ハードウェア１２がカラージッタを第３のトリミング画像１４０Ｃの複製された部分に適用することのうち、少なくとも１つをさらに含む。

動作６１８において、方法６００は、データ処理ハードウェア１２が、第１のトリミング画像１４０Ａ、増強された第２のトリミング画像１４０ＢＡ、および増強された第３のトリミング画像１４０ＣＡを用いて、機械学習モデル１５０を訓練することを含む。

図７は、本明細書に記載のシステムおよび方法を実装するために使用され得る例示的なコンピューティング装置７００を示す概略図である。コンピューティング装置７００は、ラップトップ、デスクトップ、ワークステーション、ＰＤＡ（Personal Digital Assistant）、サーバ、ブレードサーバ、メインフレームおよび他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すように意図されている。図示された要素、それらの接続および関係並びにそれらの機能は、例示的なものに過ぎず、本明細書に記載および／または請求された発明の実施を限定するものではない。

コンピューティング装置７００は、プロセッサ７１０と、メモリ７２０と、記憶装置７３０と、メモリ７２０および高速拡張ポート７５０に接続する高速インターフェイス／コントローラ７４０と、低速バス７７０および記憶装置７３０に接続する低速インターフェイス／コントローラ７６０とを含む。要素７１０、７２０、７３０、７４０、７５０および７６０は、様々なバスを使用して相互に接続され、共通のマザーボード上に実装されてもよく、または適切な他の方法で実装されてもよい。プロセッサ７１０は、メモリ７２０または記憶装置７３０に記憶された命令を含むコンピューティング装置７００内に実行される命令を処理することによって、外部入力／出力装置のグラフィカルユーザインターフェイス（ＧＵＩ）に、例えば高速インターフェイス７４０に接続されたディスプレイ７８０にグラフィック情報を表示することができる。他の実施態様において、複数のプロセッサおよび／または複数のバスは、複数のメモリおよび複数種類のメモリと共に、適切に使用されることができる。また、各装置が（例えば、サーババンク、一群のブレードサーバ、またはマルチプロセッサシステムとして）必要な動作の一部を実行するように、複数のコンピューティング装置７００を接続することができる。

メモリ７２０は、情報をコンピューティング装置７００に非一時的に格納する。メモリ７２０は、コンピュータ可読媒体、揮発性メモリユニット、または不揮発性メモリユニットであってもよい。非一時的なメモリ７２０は、コンピューティング装置７００によって使用されるように、プログラム（例えば、一連の命令）またはデータ（例えば、プログラム状態情報）を一時的または永続的に格納するための物理装置であってもよい。不揮発性メモリの例として、フラッシュメモリおよび読み取り専用メモリ（ＲＯＭ）／プログラマブル読み取り専用メモリ（ＰＲＯＭ）／消去可能なプログラマブル読み取り専用メモリ（ＥＰＲＯＭ）／（通常ブートプログラムなどのファームウェアに使用される）電子的に消去可能なプログラマブル読み取り専用メモリ（ＥＥＰＲＯＭ）を含むが、これらに限定されない。揮発性メモリの例として、ランダムアクセスメモリ（ＲＡＭ）、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）、スタティックランダムアクセスメモリ（ＳＲＡＭ）、相変化メモリ（ＰＣＭ）およびディスクまたはテープを含むが、これらに限定されない。

記憶装置７３０は、コンピューティング装置７００に大容量の記憶を提供することができる。いくつかの実現形態において、記憶装置７３０は、コンピュータ可読媒体である。様々な異なる実現例において、記憶装置７３０は、例えば、フロッピー（登録商標）ディスク装置、ハードディスク装置、光学ディスク装置、テープディスク装置、フラッシュメモリまたは他の同様の固体メモリ装置、または記憶エリアネットワークまたは他の構成内の装置を含むアレイ記憶装置などのコンピュータ可読媒体を含むことができる。追加の実現例において、コンピュータプログラム製品は、情報担体に有形的に具体化される。また、コンピュータプログラム製品は、命令を含むことができる。これらの命令は、実行されると、上述したような１つ以上の方法を実行することができる。情報担体は、例えば、メモリ７２０、記憶装置７３０、またはプロセッサ７１０上のメモリなどのコンピュータ可読媒体または機械可読媒体である。

高速コントローラ７４０は、コンピューティング装置７００の高速の帯域幅集約動作を管理し、低速コントローラ７６０は、低速の帯域幅集約動作を管理する。このような機能の割り当ては、例示に過ぎない。いくつかの実現例において、高速コントローラ７４０は、メモリ７２０に、（例えば、グラフィックプロセッサまたはアクセラレータを介して）ディスプレイ７８０に、および様々な拡張カード（図示せず）を挿入できる高速拡張ポート７１０に連結される。いくつかの実現例において、低速コントローラ７６０は、記憶装置７３０および低速拡張ポート７９０に連結される。様々な通信ポート（例えば、ＵＳＢ、ブルートゥース（登録商標）、イーサネット（登録商標）、無線イーサネット）を含み得る低速拡張ポート７９０は、例えば、キーボード、ポインティング装置、スキャナなどの１つ以上の入出力装置に連結されてもよく、またはネットワークアダプタを介して、スイッチまたはルータなどのネットワーキング装置に連結されてもよい。

図示のように、コンピューティング装置７００は、いくつかの異なる形態で実装されてもよい。例えば、コンピューティング装置７００は、標準サーバ７００ａとして実装されてもよく、またはラップトップコンピュータ７００ｂとしてまたはラックサーバシステム７００ｃの一部として一群の標準サーバ７００ａに複数回実装されてもよい。

本明細書に記載されたシステムおよび技術の様々な実装は、デジタル電子および／または光回路、集積回路、特別に設計されたＡＳＩＣ（特定用途向け集積回路）、コンピュータハードウェア、ファームウェア、ソフトウェアおよび／またはそれらの組み合わせで実現することができる。これらの様々な実装は、プログラム可能なシステム上で実行可能および／または解釈可能な１つ以上のコンピュータプログラムにおける実装を含むことができる。このプログラム可能なシステムは、記憶システムからデータおよび命令を受信し、データおよび命令を記憶システムに送信するように記憶システムに連結された少なくとも１つのプログラム可能な専用または汎用のプロセッサ、少なくとも１つの入力要素、および少なくとも１つの出力装置を含む。

ソフトウェアアプリケーション（すなわち、ソフトウェアリソース）は、コンピューティングデバイスにタスクを実行させるコンピュータソフトウェアを指してもよい。いくつかの例において、ソフトウェアアプリケーションは、「アプリケーション」、「アプリ」、または「プログラム」と称されることもある。例示的なアプリケーションは、システム診断アプリケーション、システム管理アプリケーション、システム保守アプリケーション、ワードプロセッシングアプリケーション、スプレッドシートアプリケーション、メッセージングアプリケーション、メディアストリーミングアプリケーション、ソーシャルネットワーキングアプリケーション、およびゲームアプリケーションを含むが、これらに限定されない。

（プログラム、ソフトウェア、ソフトウェアアプリケーションまたはコードとしても知られている）これらのコンピュータプログラムは、プログラム可能なプロセッサ用の機械命令を含み、高度な手続き型プログラミング言語および／または高度な目標物指向プログラミング言語で実装することができ、および／またはアセンブリ言語／機械言語で実装することができる。「機械可読媒体」および「コンピュータ可読媒体」という用語は、本明細書に使用された場合、プログラム可能なプロセッサに機械命令および／またはデータを提供するために使用された機械可読信号としての機械命令を受け取る機械可読媒体を含む任意のコンピュータプログラム製品、非一時的コンピュータ可読媒体、機械および／または装置（例えば、磁気ディスク、光学ディスク、メモリ、プログラム可能な論理装置（ＰＬＤ））を指す。「機械可読信号」という用語は、機械命令および／またはデータをプログラム可能なプロセッサに提供するために使用された任意の信号を指す。

本明細書に記載のプロセスおよびロジックフローは、データ処理ハードウェアとも呼ばれる１つ以上のコンピュータプログラムを実行する１つ以上のプログラム可能なプロセッサによって、入力データを処理して出力を生成する機能を実行することによって実行されてもよい。プロセスおよびロジックフローは、専用ロジック回路、例えば、ＦＰＧＡ（フィールドプログラマブルゲートアレイ）またはＡＳＩＣ（特定用途向け集積回路）によって実行されてもよい。コンピュータプログラムの実行に適したプロセッサは、例として、汎用マイクロプロセッサ、専用マイクロプロセッサ、およびあらゆる種類のデジタルコンピュータの１つ以上のプロセッサを含む。一般的に、プロセッサは、読み取り専用メモリまたはランダムアクセスメモリもしくはその両方から、命令およびデータを受け取る。コンピュータの重要な要素は、命令を実行するためのプロセッサと、命令およびデータを格納するための１つ以上のメモリ装置である。一般的に、コンピュータは、データを格納するための１つ以上の大容量記憶装置、例えば磁気ディスク、光磁気ディスクまたは光ディスクを含むまたはデータを受信または転送するように動作可能に結合される。しかしながら、コンピュータは、このような装置を備えなくてもよい。コンピュータプログラム命令およびデータの格納に適したコンピュータ可読媒体は、例として、例えばＥＰＲＯＭ、ＥＥＰＲＯＭおよびフラッシュメモリ装置などの半導体メモリ装置、内蔵ハードディスクまたはリムーバブルディスクなどの磁気ディスク、光磁気ディスク、ＣＤＲＯＭおよびＤＶＤ－ＲＯＭディスクを包括する全ての不揮発性メモリ、媒体およびメモリ装置を含む。プロセッサおよびメモリは、専用ロジック回路によって補足されてもよく、または専用ロジック回路に組み込まれてもよい。

ユーザとの情報交換を行うために、本開示の１つ以上の態様は、例えばＣＲＴ（ブラウン管）モニタ、ＬＣＤ（液晶ディスプレイ）モニタ、またはタッチ画面などの、ユーザに情報を表示するためのディスプレイ素子、および必要に応じて、ユーザがコンピュータに入力を提供することができるキーボードおよびポインティング装置（例えば、マウスまたはトラックボール）を含むコンピュータ上で実装することができる。他の種類の装置を使用して、ユーザと情報交換を行うこともできる。例えば、ユーザに与えるフィードバックは、任意の形の感覚フィードバック（例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック）であってもよく、ユーザから受け入れる入力は、音響入力、音声入力、または触覚入力を含む任意の形態であってもよい。さらに、コンピュータは、ユーザが使用している装置との間で文書を送受信することによって、例えば、Ｗｅｂブラウザから受信した要求に応答して、ユーザのクライアント装置上のＷｅｂブラウザにＷｅｂページを送信することによって、ユーザと情報交換することができる。

いくつかの実装形態を説明した。これにもかかわらず、本開示の精神および範囲から逸脱することなく、様々な変更をなし得ることが理解されるであろう。したがって、他の実装形態は、以下の特許請求の範囲内に含まれる。

Claims

機械学習モデルを訓練するための方法であって、前記方法は、
データ処理ハードウェアにおいて、訓練サンプルのセットを取得することと、
１つ以上の訓練反復の各訓練反復中に、前記訓練サンプルのセット内の各訓練サンプルに対して、
前記データ処理ハードウェアが、前記訓練サンプルをトリミングすることによって、第１のトリミング画像を生成することと、
前記データ処理ハードウェアが、前記訓練サンプルをトリミングすることによって、前記第１のトリミング画像とは異なる第２のトリミング画像を生成することと、
前記データ処理ハードウェアが、前記第２のトリミング画像の第１の部分を複製することと、
前記データ処理ハードウェアが、前記第２のトリミング画像の前記複製された第１の部分を前記第２のトリミング画像の第２の部分に重ねることによって、増強された第２のトリミング画像を形成することとを含み、前記第１の部分は、前記第２の部分とは異なり、前記方法はさらに、
前記データ処理ハードウェアが、前記第１のトリミング画像および前記増強された第２のトリミング画像を用いて前記機械学習モデルを訓練することを含む、方法。
前記第２のトリミング画像の前記複製された第１の部分は、可変の長さおよび可変の幅を有する矩形の形状を有する、請求項１に記載の方法。
前記第２のトリミング画像の前記複製された第１の部分を前記第２のトリミング画像の前記第２の部分に重ねることは、
前記第２のトリミング画像の前記第２の部分に対して前記第２のトリミング画像のランダムな位置を選択することと、
前記選択されたランダムな位置で、前記第２のトリミング画像の前記複製された第１の部分を重ねることとを含む、請求項１または２に記載の方法。
前記第１のトリミング画像および前記増強された第２のトリミング画像を用いて前記機械学習モデルを訓練することは、
前記第１のトリミング画像の第１の交差エントロピー損失を決定することと、
前記増強された第２のトリミング画像の第２の交差エントロピー損失を決定することと、
前記第１の交差エントロピー損失および前記第２の交差エントロピー損失に基づいて、総交差エントロピー損失を決定することとを含む、請求項１から３のいずれかに記載の方法。
前記総交差エントロピー損失は、前記第１の交差エントロピー損失と前記第２の交差エントロピー損失との合計を含む、請求項４に記載の方法。
前記訓練サンプルのセット内の各訓練サンプルは、ラベル付けされていない、請求項１から５のいずれかに記載の方法。
前記機械学習モデルは、畳み込みニューラルネットワークを含む、請求項１から６のいずれかに記載の方法。
前記機械学習モデルは、画像データ内の異常パターンを検出するように構成されている、請求項１から７のいずれかに記載の方法。
前記第２のトリミング画像の前記複製された第１の部分を前記第２のトリミング画像の前記第２の部分に重ねる前に、前記データ処理ハードウェアが、前記第２のトリミング画像の前記複製された第１の部分を回転させることをさらに含む、請求項１から８のいずれかに記載の方法。
前記第２のトリミング画像の前記複製された第１の部分を前記第２のトリミング画像の前記第２の部分に重ねる前に、前記データ処理ハードウェアが、カラージッタを前記第２のトリミング画像の前記複製された第１の部分に適用することをさらに含む、請求項１から９のいずれかに記載の方法。
データ処理ハードウェアと、
前記データ処理ハードウェアと通信するメモリハードウェアとを備え、前記メモリハードウェアは、前記データ処理ハードウェア上で実行されると、前記データ処理ハードウェアに請求項１から１０のいずれか１項に記載の方法を実行させる命令を記憶する、システム。