JP7302752B2

JP7302752B2 - ラベリング訓練方法およびそれを実施するためのシステム

Info

Publication number: JP7302752B2
Application number: JP2022552539A
Authority: JP
Inventors: 航介吉見
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2020-03-13
Filing date: 2021-03-11
Publication date: 2023-07-04
Anticipated expiration: 2041-03-11
Also published as: WO2021182564A1; US11410443B2; JP2023516331A; US20210287058A1

Description

本開示は、ラベリング訓練方法およびラベリング訓練方法を実施するためのシステムに関する。

画像を解析して画像内の物体を識別するために、学習モデルが使用される。学習モデルは、画像内の識別された物体をタグ付けまたは強調表示し、識別された物体を含む画像をユーザに出力する。ユーザは、識別された物体を含む画像を使用して、人物などの画像内の物体を監視することができる。

モデルは、解析された画像におけるエラーを識別することによって更新される。モデルを更新することは、画像内の物体の識別の正確性および精度を改善するのに役立つ。エラーはユーザによって識別され、識別されたエラーはモデルにフィードバックされる。場合によっては、ユーザは、識別された物体を含むすべての画像に目を通して、識別された物体を含む画像内に偽陰性（ｆａｌｓｅｎｅｇａｔｉｖｅ）または偽陽性（ｆａｌｓｅｐｏｓｉｔｉｖｅ）などのエラーが存在するか否かを判定する。偽陽性は、物体が存在しないときにモデルが物体を識別した場合である。偽陰性は、物体が存在するときにモデルが物体を識別し損なう場合である。ユーザによって識別されたエラーに基づいて、モデルは、将来の画像解析のために、モデルの先行する反復において誤って除外された類似の物体を識別するように学習する。

本開示の第１の態様によれば、モデルを訓練する方法が提供される。本方法は、処理データを生成することであって、処理データを生成することが、事前に訓練されたモデルを使用して画像に関連する入力を解析して、入力内の物体を検出することを含む、ことと、移動領域検出データを生成することであって、移動領域検出データを生成することが、入力を解析して、入力内に移動を示す領域が存在するか否かを判定することを含む、ことと、時間的不整合データを生成することであって、時間的不整合データを生成することが、処理データを解析して、処理データ内に時間的不整合を示す領域が存在するか否かを判定することを含む、ことと、移動領域検出データおよび時間的不整合データに基づいて、入力がエラー候補を含むか否かを識別することと、エラー候補が入力内の未検出物体であるか否かに関する確認情報を受信することと、エラー候補が入力内の未検出物体であることを示す確認情報を受信したことに応じて、事前に訓練されたモデルを更新することとを含む。

本開示の第２の態様によれば、モデルを訓練するためのシステムが提供される。本システムは、画像受信機と、ディスプレイと、命令を記憶するように構成されたメモリと、画像受信機、ディスプレイ、およびメモリに接続されたプロセッサとを備える。プロセッサは、処理データを生成することであって、処理データを生成することが、事前に訓練されたモデルを使用して画像に関連する入力を解析して、入力内の物体を検出することを含む、ことと、移動領域検出データを生成することであって、移動領域検出データを生成することが、入力を解析して、入力内に移動を示す領域が存在するか否かを判定することを含む、ことと、時間的不整合データを生成することであって、時間的不整合データを生成することが、処理データを解析して、処理データ内に時間的不整合を示す領域が存在するか否かを判定することを含む、ことと、移動領域検出データおよび時間的不整合データに基づいて、入力がエラー候補を含むか否かを識別することと、エラー候補が入力内の未検出物体であるか否かに関する確認情報を受信することと、エラー候補が入力内の未検出物体であることを示す確認情報を受信したことに応じて、事前に訓練されたモデルを更新することとのための命令を実行するように構成されている。

本開示の第３の態様によれば、プログラムが提供される。プログラムは、プロセッサによって実行されると、プロセッサに、処理データを生成することであって、処理データを生成することが、事前に訓練されたモデルを使用して画像に関連する入力を解析して、入力画像内の物体を検出することを含む、ことと、移動領域検出データを生成することであって、移動領域検出データを生成することが、入力を解析して、入力内に移動を示す領域が存在するか否かを判定することを含む、ことと、時間的不整合データを生成することであって、時間的不整合データを生成することが、処理データを解析して、処理データ内に時間的不整合を示す領域が存在するか否かを判定することを含む、ことと、移動領域検出データおよび時間的不整合データに基づいて、入力がエラー候補を含むか否かを識別することと、エラー候補が入力内の未検出物体であるか否かに関する確認情報を受信することと、エラー候補が入力内の未検出物体であることを示す確認情報を受信したことに応じて、事前に訓練されたモデルを更新することとを行わせる。

本開示の態様は、添付の図面と併せて以下の詳細な説明を読めば最もよく理解される。業界の標準的な慣行にしたがって、様々な特徴は縮尺通りに描かれていないことに留意されたい。実際、様々な特徴の寸法は、説明を明確にするために任意に増減することがある。

いくつかの実施形態による、画像を解析する方法のフローチャートである。いくつかの実施形態による、ラベリングされた画像の図である。いくつかの実施形態による、エラー候補を識別するためのシステムのブロック図である。いくつかの実施形態による、複数の探索窓を含む画像の図である。いくつかの実施形態による、複数の探索窓および物体を含む画像の図である。いくつかの実施形態による、エラー候補を識別するためのシステムのブロック図である。いくつかの実施形態による、エラー候補を識別する方法のフローチャートである。いくつかの実施形態による、エラー候補を識別する方法のフローチャートである。いくつかの実施形態による、エラー候補を識別する方法のフローチャートである。いくつかの実施形態による、複数の探索窓および物体の図である。いくつかの実施形態による、複数の画像および物体の図である。いくつかの実施形態による、識別された物体および識別された候補物体を含む画像を含むユーザインターフェースの図である。いくつかの実施形態による、識別された物体および識別された候補物体を含む画像を含むユーザインターフェースの図である。いくつかの実施形態による、エラー候補の識別を実施するためのシステムのブロック図である。

以下の開示は、提供される主題の様々な特徴を実施するための多くの様々な実施形態または例を提供する。以下、本開示を簡略化するために、構成要素、値、動作、材料、配置などの具体例を説明する。当然のことながら、これらは単なる例であり、限定することを意図するものではない。他の構成要素、値、動作、配置なども企図される。加えて、本開示は、様々な例において参照番号および／または文字を繰り返すことがある。この繰り返しは、単純化および明確化の目的での繰り返しであり、それ自体は、論じられている様々な実施形態および／または構成の間の関係を規定するものではない。

さらに、「真下（ｂｅｎｅａｔｈ）」、「下（ｂｅｌｏｗ）」、「下（ｌｏｗｅｒ）」、「上（ａｂｏｖｅ）」、「上（ｕｐｐｅｒ）」などの空間的に相対的な用語が、図に示すように、１つの要素または特徴の、別の要素（複数可）または特徴（複数可）に対する関係を説明するための説明を容易にするために本明細書で使用されることがある。空間的に相対的な用語は、図面に示す向きに加えて、使用中または動作中のデバイスの様々な向きを包含することが意図されている。装置は、他の方向に向けられてもよく（９０度または他の向きに回転されてもよく）、本明細書で使用される空間的に相対的な記述子は、それに応じて同様に解釈されてもよい。

物体検出システムは、監視カメラなどから入力画像を受信し、入力画像を解析して物体を検出し、そして結果を出力する。場合によっては、結果はユーザに出力される。結果は、検出された物体を識別し、検出された物体を追跡して、人物や車両などの検出された物体の移動、または設置されている標識などの検出された物体の状態の変化を判定することを可能にする。物体を正確かつ精密に識別することは、監視領域のセキュリティ、監視領域を移動するための交通予測などを改善するのに役立つ。

物体識別の正確性および精度を改善することは、物体識別においてエラーを識別すること、エラーを修正すること、および修正されたエラーを訓練モデルにフィードバックすることに基づく。訓練モデルは、エラーフィードバックを使用して、将来の解析においてそのようなエラーを低減または排除するようにモデルを更新することができる。

場合によっては、エラー検出はユーザによって実行される。ユーザは、訓練モデルを使用して解析された画像を精査し、次いで、ユーザは、訓練モデルによって実行された解析におけるエラーを識別する。これは時間のかかるプロセスであり、エラーのない画像の解析はモデルの改善の助けにならない。モデルによって処理された画像を解析して、エラーを含む尤度が高い画像を識別することにより、モデルは他の手法よりも速く改善される。すべての画像を精査することを回避することはまた、ユーザの作業負荷を軽減する。

本開示では、ユーザの作業負荷を低減し、受信された画像を解析するために使用されるモデルをより迅速に改善するために、ユーザによる精査のための候補画像を識別するための実施形態が説明される。いくつかの実施形態では、候補画像は、画像が偽陰性を含む尤度に基づいて選択される。つまり、モデルは、解析中、受信された画像内の物体を正確に識別し損なっている。処理画像が偽陰性を含む尤度が高いと判定された場合、処理画像は、モデルの改善を助けるためにユーザに提供される候補画像として識別される。対照的に、処理画像が偽陰性を含む尤度が低いと判定された場合、処理画像は、ユーザの作業負荷を軽減し、モデルの改善に役立つ可能性がより高い処理画像の評価にユーザが集中することを可能にするために、ユーザに提供されない。

図１は、いくつかの実施形態による、画像を解析する方法１００のフローチャートである。方法１００は、物体が検出される動作１１０を含む。動作１１０において、入力画像「Ｘ」が受信される。いくつかの実施形態では、入力画像「Ｘ」は、監視カメラ、交通カメラ、スマートフォン、または別の適切な画像検出器などの画像検出器から受信される。動作１１０において、入力画像「Ｘ」は、事前に訓練されたモデルを使用して解析される。いくつかの実施形態では、事前に訓練されたモデルは、サンプルデータに基づいて生成される。いくつかの実施形態では、事前に訓練されたモデルは、経験的データに基づいて生成される。いくつかの実施形態では、事前に訓練されたモデルは、サンプルデータおよび経験的データの両方に基づいて生成される。

本説明は、入力画像「Ｘ」および処理画像「Ｙ」、ならびにパラメータの名前に「画像」という用語を含む他のパラメータに言及する。「画像」という用語は、当業者が本説明内の様々なパラメータの関係の理解するのを助けるために、明確にするためにその名前で使用される。いくつかの実施形態では、パラメータ内に含まれる情報がデータ列であることが当業者には認識されよう。例えば、いくつかの実施形態では、画像は、本説明内の異なるデバイス間で送信されない。代わりに、いくつかの実施形態では、物体の位置を示すデータ列が使用される。いくつかの実施形態では、データ列は、一連の数字または別の適切なデータ列を含む。

動作１１０において、事前に訓練されたモデルが、入力画像「Ｘ」に適用され、物体が識別される。処理画像「Ｙ」が、動作１１０から出力される。処理画像「Ｙ」は、検出された物体の識別情報を伴う入力画像「Ｘ」を含む。上述のように、いくつかの実施形態では、入力画像「Ｘ」は画像として受信される。いくつかの実施形態では、入力画像「Ｘ」はデータ列として受信される。いくつかの実施形態では、処理画像「Ｙ」は、変更された画像として受信される。いくつかの実施形態では、処理画像「Ｙ」は、変更されたデータ列として受信される。

動作１２０において、処理画像「Ｙ」がラベリングされる。いくつかの実施形態では、検出された物体は、物体を囲む外枠、物体の陰影付け、物体に接続されたタグライン、物体に近接して画像に重ね合わされた情報、または別の適切な識別形態を使用してラベリングされる。簡単のために、本開示は、識別された物体のラベリングを示すために物体を囲む外枠を使用する。外枠の使用は、本開示の範囲を限定することを意図するものではない。

動作１３０において、ラベリングされた画像は、再学習プロセスを実行するために解析される。再学習プロセスは、ラベリングされた画像におけるエラーの識別を含む。いくつかの実施形態では、識別されたエラーは、偽陽性または偽陰性のうちの少なくとも一方を含む。誤ったラベル（またはラベルの欠落）は、ユーザによって修正される。修正された情報は、入力画像「Ｘ」内の物体を識別するために使用されるモデルを改善するために、動作１１０における物体検出にフィードバックされる。いくつかの実施形態では、ラベリングされた画像は画像として送信される。いくつかの実施形態では、ラベリングされた画像はデータ列として送信される。

図２は、いくつかの実施形態による、ラベリングされた画像２００の図である。いくつかの実施形態では、ラベリングされた画像２００は、データ列に基づいて生成された画像である。ラベリングされた画像２００は、検出された物体２１０を含む。検出された物体２１０は、外枠２２０を使用してラベリングされる。外枠２２０は、検出された物体２１０を囲む。外枠２２０は矩形である。いくつかの実施形態では、外枠２２０の形状は、矩形ではなく、例えば、円形、楕円形、多角形、自由形状、または別の適切な形状である。いくつかの実施形態では、上述のように、外枠２２０は、異なる種類のラベリングで置き換えられる。

ラベリングされた画像２００は、外枠２３０をさらに含む。外枠２３０は、ラベリングされた画像２００内の空きスペースを囲む。外枠２３０は偽陽性を示す。つまり、モデルは、外枠２３０によって囲まれた場所に存在するとして物体を誤って識別した。いくつかの実施形態では、外枠２３０に関する偽陽性のエラーは、再学習動作、例えば方法１００（図１）の動作１３０の一部として識別される。

ラベリングされた画像２００は、未検出物体２４０をさらに含む。未検出物体は、モデルが未検出物体２４０を検出し損なったため、外枠によって囲まれていない。未検出物体２４０は偽陰性である。つまり、モデルは、ラベリングされた画像２００内に物体が実際に存在しているにもかかわらず、未検出物体２４０を検出し損なった。いくつかの実施形態では、未検出物体２４０に関する偽陰性のエラーは、再学習動作、例えば方法１００（図１）の動作１３０の一部として識別される。

図３は、いくつかの実施形態による、エラー候補を識別するためのシステム３００のブロック図である。システム３００は、入力画像を受信するように構成された画像受信機３１０を備える。いくつかの実施形態では、画像受信機３１０はプロセッサを備える。いくつかの実施形態では、画像受信機３１０はまた、入力画像を取り込むように構成される。いくつかの実施形態では、画像受信機３１０は、カメラまたは画像検出器を備える。いくつかの実施形態では、画像受信機３１０は、プロセッサと、カメラまたは画像検出器とを備える。

画像受信機３１０によって受信または取り込まれた入力画像は、ラベリング推奨プロセッサ３２０に送信される。ラベリング推奨プロセッサ３２０は、入力画像がエラー候補であるか否かを判定するように構成される。エラー候補は、エラーを含む尤度が高い画像である。エラー候補を識別することにより、他の手法と比較して、画像を解析するために使用されるモデルを改善するためのユーザの作業負荷が軽減される。ラベリング推奨プロセッサ３２０は、プロセッサを備える。いくつかの実施形態では、ラベリング推奨プロセッサ３２０は、画像受信機３１０と一体化される。いくつかの実施形態では、ラベリング推奨プロセッサ３２０は、画像受信機３１０とは別体にされる。いくつかの実施形態では、入力画像は、無線でラベリング推奨プロセッサ３２０に送信される。いくつかの実施形態では、入力画像は、有線接続を使用してラベリング推奨プロセッサ３２０に送信される。

ラベリング推奨プロセッサ３２０によって識別されたエラー候補は、推奨出力ディスプレイ３３０に送信される。推奨出力ディスプレイ３３０は、エラー候補をユーザに表示し、エラー候補が偽陰性または偽陽性などのエラーを実際に含むか否かに関する入力をユーザから受信するように構成される。推奨出力ディスプレイ３３０は、ディスプレイと、ユーザからの入力を受け付けるインターフェースとを備える。いくつかの実施形態では、推奨出力ディスプレイ３３０はタッチスクリーンを備える。いくつかの実施形態では、推奨出力ディスプレイ３３０は、キーボード、マウス、またはユーザ入力を受け付けるための別の適切なインターフェースを備える。いくつかの実施形態では、推奨出力ディスプレイ３３０のユーザインターフェースは、ユーザインターフェース１２００（図１２）またはユーザインターフェース１３００（図１３）と同様である。

ラベリング推奨プロセッサ３２０は、事前に訓練されたモデルを使用して物体検出を実行するための動作３２２を実施するように構成される。入力画像「Ｘ」は、画像受信機３１０から受信され、事前に訓練されたモデルは、入力画像「Ｘ」内の物体を検出するために使用される。処理画像「Ｙ」は、事前に訓練されたモデルを使用して検出された物体に基づいて生成される。いくつかの実施形態では、事前に訓練されたモデルは、サンプルデータに基づいて生成される。いくつかの実施形態では、事前に訓練されたモデルは、経験的データに基づいて生成される。いくつかの実施形態では、事前に訓練されたモデルは、サンプルデータおよび経験的データの両方に基づいて生成される。いくつかの実施形態では、事前に訓練されたモデルは、システム３００を使用した先行する画像解析に基づいて少なくとも１回の更新を経ている。

ラベリング推奨プロセッサ３２０は、移動領域を検出するための動作３２４を実施するように構成される。入力画像「Ｘ」および処理画像「Ｙ」は、入力画像「Ｘ」が物体が移動している領域を含むか否かを判定するために使用される。入力画像「Ｘ」が移動領域を含むか否かを判定するために、ラベリング推奨プロセッサ３２０は探索窓に依拠する。上述のように、いくつかの実施形態では、入力画像「Ｘ」は画像として受信される。いくつかの実施形態では、入力画像「Ｘ」はデータ列として受信される。いくつかの実施形態では、処理画像「Ｙ」は、変更された画像として受信される。いくつかの実施形態では、処理画像「Ｙ」は、変更されたデータ列として受信される。

図４は、いくつかの実施形態による、複数の探索窓４１０を含む画像４００の図である。探索窓４１０は、画像４００の解析を管理するために解析される、画像４００の個々の領域である。探索窓４１０は、画像４００においては可視でない。代わりに、探索窓４１０は、画像４００が移動領域を含むか否かを判定するための解析のための場所および境界を判定するために、ラベリング推奨プロセッサ３２０などのプロセッサによって使用される。画像４００内の探索窓４１０のすべてが矩形形状を有する。いくつかの実施形態では、少なくとも１つの探索窓４１０が異なる形状を有する。いくつかの実施形態では、探索窓４１０のうちの少なくとも１つの形状が、円形、楕円形、多角形、自由形状、または別の適切な形状である。画像４００内の探索窓４１０は、異なるサイズを有する。いくつかの実施形態では、探索窓４１０のすべてが同じサイズを有する。いくつかの実施形態では、探索窓４１０のそれぞれのサイズおよび位置が、ユーザなどによって事前に決定される。いくつかの実施形態では、探索窓４１０のそれぞれのサイズまたは位置が、探索窓４１０を使用して解析を実行するプロセッサによって決定される。いくつかの実施形態では、探索窓４１０のサイズおよび場所が、入力画像「Ｘ」のサイズおよび入力画像「Ｘ」内の検出された物体の数に基づいて決定される。

プロセッサは、連続する入力画像「Ｘ」について探索窓４１０内の画素を解析して、画素の変化が対応する探索窓４１０の領域内の移動を示すか否かを判定する。いくつかの実施形態では、画素の変化は、輝度、色、コントラスト、または別の適切なパラメータに関連する。例えば、いくつかの実施形態では、連続する入力画像「Ｘ」において、探索窓４１０内の画素が低輝度から高輝度に変化する場合、プロセッサは、探索窓４１０内の移動領域を検出する。

図５は、いくつかの実施形態による、複数の探索窓５１０ａ～５１０ｃおよび物体５２０を含む画像５００の図である。入力画像「Ｘ」の解析中、いくつかの移動領域が、複数の探索窓と重なる場所にある。例えば、物体５２０が画像５００内の移動領域であると判定される状況では、物体５２０は探索窓５１０ａ、５１０ｂ、および５１０ｃと重なる。いくつかの実施形態では、プロセッサは、画像５００内の物体５２０の場所を判定するために探索窓５１０ａ～５１０ｃのいずれを使用するかを決定するためにｎｏｎｍａｘｓｕｐｐｒｅｓｓｉｏｎを使用する。Ｎｏｎｍａｘｓｕｐｐｒｅｓｓｉｏｎは、探索窓５１０ａ～５１０ｃのうちのどれが物体５２０と最も大きい重なりを含むかを判定し、入力画像「Ｘ」の解析のためにその探索窓を使用する。画像５００では、探索窓５１０ｂが物体５２０と最も大きい重なりを有している。したがって、プロセッサは、画像５００内の探索窓５１０ｂを使用して物体５２０を解析する。

動作３２４に戻ると、入力画像「Ｘ」と処理画像「Ｙ」との両方を受信することによって、ラベリング推奨プロセッサ３２０は、入力画像「Ｘ」を解析するための計算量を削減することができる。ラベリング推奨プロセッサ３２０は、物体が動作３２２中に既に検出された場所において、探索窓、例えば探索窓４１０を除外することができる。これにより、ラベリング推奨プロセッサ３２０によって解析すべき入力画像「Ｘ」内の場所が削減され、入力画像「Ｘ」の解析の速度が上がる。動作３２４は、処理画像「Ｙ」内の移動領域をさらに識別するように変更された処理画像「Ｙ」を含む移動領域検出画像「Ｙ_ＭＡＤ」を出力する。いくつかの実施形態では、動作３２４は、逆処理画像「Ｙ－」（「Ｙ－」は、上線付きのＹを示す。）を受信する。逆処理画像「Ｙ－」は、処理画像「Ｙ」の逆元（ｉｎｖｅｒｓｅ）である。つまり、逆処理画像「Ｙ－」は、モデルによって検出された物体と重なる探索窓を除外する。逆処理画像「Ｙ－」を使用することは、処理画像「Ｙ」の使用と同様に計算作業負荷を軽減するのに役立つ。いくつかの実施形態では、移動領域検出画像「Ｙ_ＭＡＤ」は、変更された画像として受信される。いくつかの実施形態では、移動領域検出画像「Ｙ_ＭＡＤ」は、変更されたデータ列として受信される。いくつかの実施形態では、逆処理画像「Ｙ－」は、変更された画像として受信される。いくつかの実施形態では、逆処理画像「Ｙ－」は、変更されたデータ列として受信される。

ラベリング推奨プロセッサ３２０は、処理画像「Ｙ」を使用して時間情報検出が実行される動作３２６を実行するように構成される。時間情報検出は、一連の処理画像「Ｙ」内の整合性または完全性の喪失に関連する。いくつかの実施形態では、時間情報検出は、探索窓、例えば探索窓４１０（図４）を使用して実行される。ラベリング推奨プロセッサ３２０は、処理画像「Ｙ」を解析して、処理画像「Ｙ」内に事前に訓練されたモデルによって解析不可能である部分が存在するか否かを判定する。例えば、処理画像「Ｙ」のある部分がかなりの量のノイズを含む場合、または処理画像「Ｙ」の光レベルが低い場合、事前に訓練されたモデルは、処理画像「Ｙ」の当該部分内の物体を検出することができない。

時間情報検出は、ラベリング推奨プロセッサ３２０によって実行される解析内での時間的整合性を維持するのに役立つ。例えば、第１の時刻における第１の処理画像「Ｙ」内の特定の場所で物体が検出された場合、第１の時刻の直後の第２の時刻における第２の処理画像「Ｙ」内の同様の場所で同じ物体が検出されると予期される。ノイズまたは光レベルが予期される物体の正確な検出を妨げる場合、時間情報検出が、将来の画像を解析するためのモデルを強化するために使用可能なエラーを含む可能性が高いとして処理画像「Ｙ」を識別する。

システム３００では、時間情報検出は、処理画像「Ｙ」のみに基づいて、ラベリング推奨プロセッサ３２０によって実行される。いくつかの実施形態では、時間情報検出は、処理画像「Ｙ」と入力画像「Ｘ」との組み合わせに基づいて実行される。いくつかの実施形態では、時間情報検出は、入力画像「Ｘ」のみに基づいて実行される。

いくつかの実施形態では、ラベリング推奨プロセッサ３２０は、処理画像「Ｙ」を使用して計算量を削減する。いくつかの実施形態では、ラベリング推奨プロセッサ３２０は、物体が動作３２２中に既に検出された場所において、探索窓、例えば探索窓４１０を除外する。これにより、ラベリング推奨プロセッサ３２０によって解析すべき処理画像「Ｙ」内の場所が削減され、処理画像「Ｙ」の解析の速度が上がる。動作３２６は、処理画像「Ｙ」内の時間的不整合を有する領域またはモデルにとって物体検出が困難な領域をさらに識別するように変更された処理画像「Ｙ」を含む時間情報検出画像「Ｙ_ＴＭＰ」を出力する。いくつかの実施形態では、動作３２６は、逆処理画像「Ｙ－」を使用して実行される。いくつかの実施形態では、時間情報検出画像「Ｙ_ＴＭＰ」は、変更された画像として受信される。いくつかの実施形態では、時間情報検出画像「Ｙ_ＴＭＰ」は、変更されたデータ列として受信される。

ラベリング推奨プロセッサ３２０は、検出エラー候補が識別される動作３２８を実行するように構成される。検出エラー候補は、処理画像「Ｙ」と、移動領域検出画像「Ｙ_ＭＡＤ」と、時間情報検出画像「Ｙ_ＴＭＰ」との比較に基づいて識別される。ラベリング推奨プロセッサ３２０は、移動領域検出画像「Ｙ_ＭＡＤ」または時間情報検出画像「Ｙ_ＴＭＰ」のいずれかが、処理画像「Ｙ」で検出されなかった潜在的な物体、例えば移動領域または時間的不整合の領域を含む場合、入力画像「Ｘ」をエラー検出候補として識別する。ラベリング推奨プロセッサ３２０は、移動領域検出画像「Ｙ_ＭＡＤ」および時間情報検出画像「Ｙ_ＴＭＰ」が処理画像「Ｙ」に一致する場合、すなわち、追加の潜在的な物体が検出されない場合、入力画像「Ｘ」をエラー検出候補として識別しない。移動領域検出画像「Ｙ_ＭＡＤ」および時間情報検出画像「Ｙ_ＴＭＰ」は、物体が入力画像「Ｘ」内に実際にあることを特に識別しない。代わりに、移動領域検出画像「Ｙ_ＭＡＤ」および時間情報検出画像「Ｙ_ＴＭＰ」は、存在し得る物体の場所を識別する。ラベリング推奨プロセッサ３２０は、移動領域検出画像「Ｙ_ＭＡＤ」および時間情報検出画像「Ｙ_ＴＭＰ」によって識別された場所に物体が実際に存在するか否かをユーザが最終判断できるようにするために、未検出物体の可能性に基づくエラー検出候補を推奨出力ディスプレイ３３０に出力する。

エラー検出候補のみをユーザに提供することによって、システム３００は、精査のためにエラーを含む尤度が高い画像のみをユーザに提供することによって、ユーザの作業負荷を軽減する。このことは、他の手法と比較して、モデル内でより多量のフィードバック識別エラーがより短い期間で提供されるため、入力画像「Ｘ」を解析するためのモデルをより迅速に改善するのに役立つ。ユーザの作業負荷が軽減されること、およびユーザによって精査される画像にエラーが高度に集中することはまた、ユーザが画像の精査中にエラーを見逃す可能性を低減するのに役立つ。場合によっては、ユーザがエラーのない多数の連続的な画像を精査した場合、ユーザは無関心になってしまい、同レベルの精度で画像を精査しなくなり得る。その結果、その後で精査される画像のエラーがユーザによって見過ごされる可能性が高くなり、これによりモデルに改善フィードバックを提供し損なう。この無関心は、精査される画像においてエラーを含む割合が高い場合に低減または回避される。したがって、システム３００は、他の手法と比較して、エラー検出候補を使用することによってモデルをより速く改善することができる。

図６は、いくつかの実施形態による、エラー候補を識別するためのシステム６００のブロック図である。システム６００は、入力画像を受信するように構成された画像受信機６１０を備える。画像受信機６１０は画像受信機３１０（図３）と同様であり、簡潔にするために画像受信機６１０の詳細な説明は省略する。

画像受信機６１０によって受信または取り込まれた入力画像は、ラベリング推奨プロセッサ６２０に送信される。ラベリング推奨プロセッサ６２０は、入力画像がエラー候補であるか否かを判定するように構成される。エラー候補は、エラーを含む尤度が高い画像である。エラー候補を識別することにより、他の手法と比較して、画像を解析するために使用されるモデルを改善するためのユーザの作業負荷が軽減される。ラベル付与推奨プロセッサ６２０は、プロセッサを備える。いくつかの実施形態では、ラベリング推奨プロセッサ６２０は、画像受信機６１０と一体化される。いくつかの実施形態では、ラベリング推奨プロセッサ６２０は、画像受信機６１０とは別体にされる。いくつかの実施形態では、入力画像は、無線でラベリング推奨プロセッサ６２０に送信される。いくつかの実施形態では、入力画像は、有線接続を使用してラベリング推奨プロセッサ６２０に送信される。

ラベリング推奨プロセッサ６２０によって識別されたエラー候補は、推奨出力ディスプレイ６３０に送信される。推奨出力ディスプレイ６３０は、推奨出力ディスプレイ３３０（図３）と同様であり、簡潔にするために、推奨出力ディスプレイ６３０の詳細な説明は省略する。

ラベリング推奨プロセッサ６２０は、事前に訓練されたモデルを使用して物体検出を実行するための動作６２２を実施するように構成される。動作６２２は動作３２２（図３）と同様であり、簡潔にするために動作６２２の詳細な説明は省略する。動作６２２は、動作６２８で使用される処理画像「Ｙ」または逆処理画像「Ｙ－」のいずれかを出力する。画像６５０は、処理画像「Ｙ」の一例である。画像６５０では、物体のすべてが人物アイコンで示されている。いくつかの実施形態では、物体は、人物以外の物体を含む。画像６５０では、画像６５０の左側の物体のみが検出された物体として識別される。画像６５０内の他の物体は、動作６２２において検出されていない。画像６６０は、逆処理画像「Ｙ－」の一例である。画像６６０は、画像６５０内の未検出物体に対応する画像６６０の部分に複数の探索窓を含む。

ラベリング推奨プロセッサ６２０は、移動領域を検出するための動作６２４を実施するように構成される。動作３２４とは対照的に、動作６２４は処理画像「Ｙ」を受信しない。システム６００では、動作６２４は、入力画像「Ｘ」のみを使用して実行されて、入力画像「Ｘ」が物体が移動している領域を含むか否かを判定する。入力画像「Ｘ」が移動領域を含むか否かを判定するために、ラベリング推奨プロセッサ６２０は探索窓に依拠しており、このことは上で詳述している。動作６２４は、識別された移動領域を含む移動領域検出画像「Ｙ_ＭＡＤ」を出力する。画像６７０は、移動領域検出画像「Ｙ_ＭＡＤ」の一例である。画像６７０では、中央の物体が、動作６２４中に移動領域として検出されている。したがって、中央の物体は、移動領域検出画像「Ｙ_ＭＡＤ」内で識別される。画像６７０の左側および右側にある物体は、移動領域を含むものとして検出されていない。したがって、左側および右側にある物体は、移動領域検出画像「Ｙ_ＭＡＤ」内で識別されていない。

ラベリング推奨プロセッサ６２０は、処理画像「Ｙ」を使用して時間情報検出が実行される動作６２６を実行するように構成される。動作６２６は動作３２６（図３）と同様であり、簡潔にするために動作６２６の詳細な説明は省略する。画像６８０は、時間情報検出画像「Ｙ_ＴＭＰ」の一例である。画像６８０において、右側にある物体は、動作６２６中に情報の不整合を有するものとして検出されている。したがって、右側にある物体が、時間情報検出画像「Ｙ_ＴＭＰ」内で識別される。画像６８０の左側および中央にある物体は、情報の整合性を有していた。したがって、左側および中央にある物体は、時間情報検出画像「Ｙ_ＴＭＰ」内で識別されていない。

ラベリング推奨プロセッサ６２０は、検出エラー候補が識別される動作６２８を実行するように構成される。検出エラー候補は、処理画像「Ｙ」と、移動領域検出画像「Ｙ_ＭＡＤ」と、時間情報検出画像「Ｙ_ＴＭＰ」との比較に基づいて識別される。ラベリング推奨プロセッサ６２０は、移動領域検出画像「Ｙ_ＭＡＤ」または時間情報検出画像「Ｙ_ＴＭＰ」のいずれかが、処理画像「Ｙ」で検出されなかった潜在的な物体、例えば移動領域または時間的不整合の領域を含む場合、入力画像「Ｘ」をエラー検出候補として識別する。ラベリング推奨プロセッサ６２０は、移動領域検出画像「Ｙ_ＭＡＤ」および時間情報検出画像「Ｙ_ＴＭＰ」が処理画像「Ｙ」に一致する場合、すなわち、追加の潜在的な物体が検出されない場合、入力画像「Ｘ」をエラー検出候補として識別しない。移動領域検出画像「Ｙ_ＭＡＤ」および時間情報検出画像「Ｙ_ＴＭＰ」は、物体が入力画像「Ｘ」内に実際にあることを特に識別しない。代わりに、移動領域検出画像「Ｙ_ＭＡＤ」および時間情報検出画像「Ｙ_ＴＭＰ」は、存在し得る物体の場所を識別する。ラベリング推奨プロセッサ６２０は、移動領域検出画像「Ｙ_ＭＡＤ」および時間情報検出画像「Ｙ_ＴＭＰ」によって識別される場所に物体が実際に存在するか否かをユーザが最終判断できるようにするために、未検出物体の可能性に基づくエラー検出候補を推奨出力ディスプレイ３３０に出力する。画像６９０は、エラー候補を含む画像の一例である。画像６９０では、中央の物体および右側の物体が、動作６２８中の処理画像「Ｙ」または逆処理画像「Ｙ－」との比較に基づいて潜在的なエラーとして識別されている。したがって、画像６９０では、中央の物体および右側の物体はエラー候補として識別される。左側の物体は、処理画像「Ｙ」または逆処理画像「Ｙ－」において識別されている。したがって、画像６９０において、左側の物体は識別されていない。

エラー検出候補のみをユーザに提供することによって、システム６００は、精査のためにエラーを含む尤度が高い画像のみをユーザに提供することによって、ユーザの作業負荷を軽減する。このことは、他の手法と比較して、モデル内でより多量のフィードバック識別エラーがより短い期間で提供されるため、入力画像「Ｘ」を解析するためのモデルをより迅速に改善するのに役立つ。ユーザの作業負荷が軽減されること、およびユーザによって精査される画像にエラーが高度に集中することはまた、ユーザが画像の精査中にエラーを見逃す可能性を低減するのに役立つ。場合によっては、ユーザがエラーのない多数の連続的な画像を精査した場合、ユーザは無関心になってしまい、同レベルの精度で画像を精査しなくなり得る。その結果、その後で精査される画像のエラーがユーザによって見過ごされる可能性が高くなり、これによりモデルに改善フィードバックを提供し損なう。この無関心は、精査される画像においてエラーを含む割合が高い場合に低減または回避される。したがって、システム６００は、他の手法と比較して、エラー検出候補を使用することによってモデルをより速く改善することができる。

図７は、いくつかの実施形態による、エラー候補を識別する方法７００のフローチャートである。方法７００は、入力画像「Ｘ」を受信する。動作７１０において、入力画像「Ｘ」は、入力画像「Ｘ」内の物体を検出するために、事前に訓練されたモデルを使用して解析される。処理画像「Ｙ」は、事前に訓練されたモデルを使用して検出された物体に基づいて生成される。いくつかの実施形態では、事前に訓練されたモデルは、サンプルデータに基づいて生成される。いくつかの実施形態では、事前に訓練されたモデルは、経験的データに基づいて生成される。いくつかの実施形態では、事前に訓練されたモデルは、サンプルデータおよび経験的データの両方に基づいて生成される。いくつかの実施形態では、事前に訓練されたモデルは、システム３００を使用した先行する画像解析に基づいて少なくとも１回の更新を経ている。

動作７１５において、動作７１０中に物体が検出されたか否かに関する判定が行われる。動作７１０で検出された物体は、動作７１５からの「ｙｅｓ」によって示されるように、陽性（ｐｏｓｉｔｉｖｅ）、例えば真陽性（ｔｒｕｅｐｏｓｉｔｉｖｅ）であると判定される。陽性と識別された物体はエラー候補ではない。処理画像「Ｙ」の部分のうち検出された物体を含まない部分は、「ｎｏ」の選択肢に沿って動作７１５から動作７２０に進む。

動作７２０において、処理画像「Ｙ」は、入力画像「Ｘ」が物体が移動している領域を含むか否かを判定するために使用される。処理画像「Ｙ」か否かを判定するために探索窓が使用される。探索窓の詳細については、図４および図５に関連して上で論じてある。

処理画像「Ｙ」に依拠することにより、処理画像「Ｙ」内の検出された物体が含まれていない部分のみに解析を集中させることにより移動領域を識別することを試みるための計算量が削減される。動作７２０は、動作７１０中に物体が既に検出された場所における探索窓、例えば探索窓４１０を除外する。動作７２０は移動領域検出画像「Ｙ_ＭＡＤ」を出力する。いくつかの実施形態では、動作７２０は逆処理画像「Ｙ－」を使用する。

動作７２５において、動作７２０中に移動領域が識別されたか否かに関する判定が行われる。動作７２０で検出された移動領域は、潜在的な偽陰性であると判定され、動作７２５からの「ｙｅｓ」によって示されるようにエラー候補として識別される。移動領域検出画像「Ｙ_ＭＡＤ」内の移動領域を含まない部分は、「ｎｏ」の選択肢に沿って動作７２５から動作７３０に進む。

動作７３０において、移動領域検出画像「Ｙ_ＭＡＤ」を使用して時間情報検出が実行される。時間情報検出は、一連の処理画像「Ｙ」内の整合性または完全性の喪失に関連する。いくつかの実施形態では、時間情報検出は、探索窓、例えば探索窓４１０（図４）を使用して実行される。移動領域検出画像「Ｙ_ＭＡＤ」は、移動領域検出画像「Ｙ_ＭＡＤ」内に事前に訓練されたモデルによって解析不可能である部分が存在するか否かを判定するために解析される。例えば、移動領域検出画像「Ｙ_ＭＡＤ」のある部分がかなりの量のノイズを含む場合、または移動領域検出画像「Ｙ_ＭＡＤ」の光レベルが低い場合、事前に訓練されたモデルは、移動領域検出画像「Ｙ_ＭＡＤ」の当該部分内の物体または移動領域を検出することができない。

時間情報検出は、時間的整合性を維持するのに役立つ。例えば、第１の時刻における第１の移動領域検出画像「Ｙ_ＭＡＤ」内の特定の場所で物体が検出された場合、第１の時刻の直後の第２の時刻における第２の移動領域検出画像「Ｙ_ＭＡＤ」内の同様の場所で同じ物体が検出されると予期される。ノイズまたは光レベルが予期される物体の正確な検出を妨げる場合、時間情報検出が、将来の画像を解析するためのモデルを強化するために使用可能なエラーを含む可能性が高いとして移動領域検出画像「Ｙ_ＭＡＤ」を識別する。

動作７３５において、動作７３０中に時間的不整合が識別されたか否かに関する判定が行われる。動作７３０で検出された時間的不整合は、潜在的な偽陰性であると判定され、動作７３５からの「ｙｅｓ」によって示されるようにエラー候補として識別される。時間情報検出画像「Ｙ_ＴＭＰ」内の移動領域または時間的不整合を含まない部分は、動作７３５からの「ｎｏ」の選択肢に沿って進み、事前に訓練されたモデルによる初期検出におけるエラーの尤度が低いため、エラー候補ではないと判定される。

動作７２５または動作７３５のいずれかにおいて識別されたエラー候補は、精査のためにユーザに報告される。事前に訓練されたモデルによる初期検出においてエラーの尤度が高い場合にのみエラー候補をユーザに提供することによって、方法７００は、精査のためにエラーを含む尤度が高い画像のみをユーザに提供することによってユーザの作業負荷を軽減する。この作業負荷の軽減の利点については、上で論じてある。

図８は、いくつかの実施形態による、エラー候補を識別する方法８００のフローチャートである。方法８００は、方法７００の動作７１０、７１５、７２０、７２５、７３０、および７３５とそれぞれ同様の動作８１０、８１５、８２０、８２５、８３０、および８３５を含み、簡潔にするために、これらの動作の詳細は省略する。

方法７００と比較して、方法８００は動作８４０を含む。方法８００では、動作８３５において時間的不整合が存在するとの判定がなされた場合、動作８４０において偽陰性尤度スコア（ＦＮＳ）が計算される。ＦＮＳは、時間的不整合の重大度に関連する。時間的不整合の重大度が高まるにつれて、エラーの尤度も高まる。重大度とは、時間情報検出画像「Ｙ_ＴＭＰ」内の予期される情報からの逸脱の大きさを意味する。

動作８４０は、ある持続時間にわたって時間情報検出画像「Ｙ_ＴＭＰ」を利用する。いくつかの実施形態では、持続時間は事前に決定された持続時間である。いくつかの実施形態では、持続時間は、時間情報検出画像「Ｙ_ＴＭＰ」の時間的不整合の重大度に基づいて調整される。動作８４０は、時間情報検出画像「Ｙ_ＴＭＰ」内の情報を比較して、ＦＮＳを計算するために時間情報検出画像「Ｙ_ＴＭＰ」内の異なる場所におけるノイズまたは光レベルなどの値の間の差分を決定する。差分は、時間情報検出画像「Ｙ_ＴＭＰ」における画素値のベクトルを持続時間を通して計算することにより決定される。

ＦＮＳ値の範囲は、０．０～１．０である。０．０のＦＮＳ値は、時間的不整合がないか、または最小であることを示す。１．０のＦＮＳ値は、少なくとも１つの著しい時間的不整合を示す。時間的不整合の大きさは、ＦＮＳ値の一因子である。明るかった場所が暗く遷移する時間的不整合は、画像内に物体が存在する確率が高いことを示す。対照的に、光レベルのわずかな変化は、画像内の物体の存在を示す可能性が低い。時間的不整合が存在する時間の長さもＦＮＳ値の一因子である。短時間の時間的不整合は、撮像デバイスによって監視された場所に極めて短い時間内に物体が入ったり出たりすることはできない可能性が高いため、撮像デバイスの欠陥に起因する可能性がより高い。対照的に、長時間の時間的不整合は、物体の存在を示す可能性がより高い、または少なくとも潜在的に、撮像デバイスの欠陥が潜在的な物体を見えにくくしていることを示す可能性が高い。例えば、時間情報検出画像「Ｙ_ＴＭＰ」の持続時間にわたるノイズ（または光レベル）の変化が極めて小さいかまたは短い場合、動作８４０は０．０のＦＮＳ値を返す。
対照的に、持続時間における時間情報検出画像「Ｙ_ＴＭＰ」にわたるノイズ（または光レベル）の変化が劇的である、または長引く場合、動作８４０は例えば１．０のＦＮＳ値を返す。時間的不整合の期間または時間情報検出画像「Ｙ_ＴＭＰ」における変化の大きさが変化すると、動作８４０は、０．０と１．０との間の中間ＦＮＳ値を返す。

ＦＮＳ値に基づいて、方法８００は、時間的不整合がエラー候補と見なされるか否かを判定する。ＦＮＳ値が第１の閾値Ｔ_１以下である場合、時間情報検出画像「Ｙ_ＴＭＰ」は潜在的な物体を含まないと見なされ、エラー候補は識別されない。ＦＮＳ値が第２の閾値Ｔ_２以上である場合、時間情報検出画像「Ｙ_ＴＭＰ」は潜在的な物体を含むと見なされ、エラー候補が識別される。ＦＮＳ値が第１の閾値Ｔ_１と第２の閾値Ｔ_２との間にある場合、時間情報検出画像「Ｙ_ＴＭＰ」は、潜在的な物体の尤度が高いと考えられ、エラー候補が識別される。いくつかの実施形態では、第１の閾値Ｔ_１は０．０である。０．０の第１の閾値Ｔ_１は、事前に訓練されたモデルによって検出されなかった潜在的な物体を見落とすリスクを最小化するのに役立つ。いくつかの実施形態では、第２の閾値Ｔ_２の範囲は、０．５から０．８である。第２の閾値Ｔ_２が高すぎる場合、事前に訓練されたモデルによって検出されなかった潜在的な物体を見落とすリスクが高まる。いくつかの実施形態では、ＦＮＳ値が第１の閾値Ｔ_１以下でない限り、時間情報検出画像「Ｙ_ＴＭＰ」は潜在的な物体を含むと見なされ、エラー候補が識別される。

動作８２５で識別されたエラー候補または第１の閾値を上回るＦＮＳ値を有するエラー候補は、精査のためにユーザに報告される。事前に訓練されたモデルによる初期検出においてエラーの尤度が高い場合にのみエラー候補をユーザに提供することによって、方法８００は、精査のためにエラーを含む尤度が高い画像のみをユーザに提供することによってユーザの作業負荷を軽減する。この作業負荷の軽減の利点については、上で論じてある。

図９は、いくつかの実施形態による、エラー候補を識別する方法９００のフローチャートである。方法９００は、方法８００の動作８１０、８１５、８２０、８２５、８３０、８３５、および８４０とそれぞれ同様の動作９１０、９１５、９２０、９２５、９３０、９３５、および９４０を含み、簡潔にするために、これらの動作の詳細は省略する。

方法８００と比較して、方法９００は動作９５０を含む。方法８００では、動作９２５で移動領域が検出されたとの判定がなされた場合、時間情報検出が、移動領域検出画像「Ｙ_ＭＡＤ」内の検出された移動領域に対して実行される。動作９５０における時間情報検出は、検出された移動領域に対して解析が実行されることを除いて、上述した動作７３０と同様である。

図１０は、いくつかの実施形態による、複数の探索窓１０１０および物体１０２０の図１０００である。図１０の複数の探索窓１０１０は、異なる時間に取り込まれた画像内の探索窓である。図１０の複数の探索窓１０１０のそれぞれの場所は、それぞれの取り込まれた画像内で同じである。物体は、時刻ｔ－３、ｔ－２、およびｔ－１において探索窓内で検出される。しかしながら、時刻ｔにおいて、探索窓内で物体は検出されない。３つの以前に取り込まれた画像における物体の整合性のある検出に基づいて、物体が時間ｔにおいても探索窓に存在すると高いレベルで予期される。時刻ｔにおける探索窓で物体１０２０を検出し損なうことは、時間的不整合である。移動領域検出画像「Ｙ_ＭＡＤ」に対して時間的整合性解析を実行することによって、方法９００は、入力画像を解析するために使用されるモデルへのフィードバックを改善することを助けることができる。

図１１は、いくつかの実施形態による、複数の画像１１０５ａ～１１０５ｃおよび物体の図１１００である。複数の探索画像１１０５ａ～１１０５ｃは、異なる時間に取り込まれた順次的な入力画像である。物体は、画像１１０５ａの第１の位置から画像１１０５ｃの第２の位置に移動する。探索窓１１１０は、画像１１０５ａの探索窓に対応する。探索窓１１１５は、画像１１０５ｂの探索窓に対応する。探索窓１１２０は、画像１１０５ｃの探索窓に対応する。明確にするために、潜在的なエラー候補の検出の理解を助けるために、探索窓１１１０、１１１５、および１１２０が一緒に示されている。物体が、時刻ｔ－２における探索窓１１１０内で検出され、時刻ｔにおける探索窓１１２０内で検出される。しかしながら、時刻ｔ－１における探索窓１１１５内で物体は検出されない。ｔ－１の前後の時刻において物体が一貫して検出されていることに基づいて、物体が時間ｔ－１における探索窓１１１５に存在するはずであると高いレベルで予期される。時刻ｔ－１における探索窓１１１５での物体を検出し損なうことは、時間的不整合である。

画像１１０５ｂ内の探索窓１１１５の場所は、探索窓１１１０で検出された物体の第１の位置および探索窓１１２０で検出された物体の第２の位置の変化に基づいて決定される。予測経路線１１３０は、第１の位置から第２の位置への移動の予測経路を示す。これらの予測経路線１１３０を使用して、画像１１０５ｂ内における物体の予期される位置が決定される。予測経路線１１３０を使用することは、エラー候補および時間的不整合を識別するための計算量を削減するのに役立つ。移動領域検出画像「Ｙ_ＭＡＤ」に対して時間的整合性解析を実行することによって、方法９００は、入力画像を解析するために使用されるモデルへのフィードバックを改善することを助けることができる。

方法９００に戻ると、動作９５０に続いて、方法９００は動作９４０に進む。方法８００と比較して、エラー候補の識別は、動作９４０からのＦＮＳ値に基づいており、動作９２５における検出された移動領域の決定は、必ずしもエラー候補の識別をもたらさない。

第１の閾値を上回るＦＮＳ値を有するエラー候補が、精査のためにユーザに報告される。事前に訓練されたモデルによる初期検出におけるエラーの尤度が高い場合にのみエラー候補をユーザに提供することによって、方法９００は、精査のためにエラーを含む尤度が高い画像のみをユーザに提供することによってユーザの作業負荷を軽減する。この作業負荷の軽減の利点については、上で論じてある。

図１２は、いくつかの実施形態による、識別された物体１２２０ａならびに識別された候補物体１２２０ｂおよび１２２０ｃを含む画像１２１０を含むユーザインターフェース（ＵＩ）１２００の図である。ＵＩ１２００は、画像１２１０および入力フィールド１２４０を含む。

画像１２１０は、撮像デバイスによって取り込まれた入力画像「Ｘ」に対応する。画像１２１０は、実線ラベル１２３０ａによって囲まれた検出された物体１２２０ａを含む。検出された物体１２２０ａは、例えば動作３２２または動作７１０において、事前に訓練されたモデルによって検出されている。検出された物体１２２０ａが事前に訓練されたモデルによって検出されているという事実は、実線ラベル１２３０ａによってユーザに明らかにされる。

画像１２１０は、点線ラベル１２３０ｂによって囲まれた移動領域の検出された物体１２２０ｂをさらに含む。移動領域の検出された物体１２２０ｂは、例えば動作３２４または動作７２０において、事前に訓練されたモデルによって検出されなかった入力画像「Ｘ」内の潜在的な物体に対応するエラー候補として識別されている。移動領域解析によって移動領域の検出された物体１２２０ｂがエラー候補として検出されているという事実は、点線ラベル１２３０ｂによってユーザに明らかにされる。実線ラベルの代わりに点線ラベル１２３０ｂを使用することは、移動領域検出によって識別された潜在的な物体を確認または拒否するためにユーザのアクションが要求されているとユーザが判断するのに役立つ。

画像１２１０は、破線ラベル１２３０ｃによって囲まれた時間的不整合の検出された物体１２２０ｃをさらに含む。時間的不整合の検出された物体１２２０ｃは、例えば動作３２６または動作７３０において、事前に訓練されたモデルによって検出されなかった入力画像「Ｘ」内の潜在的な物体に対応するエラー候補として識別されている。いくつかの実施形態では、時間的不整合の検出された物体１２２０ｃもまた、移動領域解析によって識別されていない。時間的不整合解析によって時間的不整合の検出された物体１２２０ｃがエラー候補として検出されているという事実は、破線ラベル１２３０ｃによってユーザに明らかにされる。実線ラベルの代わりに破線ラベル１２３０ｃを使用することは、移動領域検出によって識別された潜在的な物体を確認または拒否するためにユーザのアクションが要求されているとユーザが判断するのに役立つ。

未検出物体の確認のためにユーザ入力を求めるためのエラー候補を明確に示すことは、事前に訓練されたモデルによって検出された物体とは異なるラベルを示すことを目的とする。いくつかの実施形態では、すべてのエラー候補が、同じ種類のラベル、例えば点線を有する。いくつかの実施形態では、エラー候補は、色、ハイライト、テキストボックス、または他の適切な識別情報を使用して画像１２１０内で識別される。

入力フィールド１２４０は、ユーザが画像１２１０に関連付けるべき情報を入力することを可能にする。いくつかの実施形態では、情報は、検出された物体の種類、エラー候補の種類、画像１２１０の光の状態、検出された物体の位置、エラー候補の位置、または他の適切な情報を含む。

ユーザは、ＵＩ１２００を使用して、物体１２２０ｂまたは物体１２２０ｃが画像１２１０内の実際の物体であるか否かを確認することができる。次いで、この情報は、取り込まれた画像内の識別された物体に使用されるアルゴリズムを改善するために、事前に訓練されたモデルにフィードバックされる。いくつかの実施形態では、ＵＩ１２００はタッチスクリーンを含み、ユーザはタッチスクリーンを使用して物体１２２０ｂまたは物体１２２０ｃが実際の物体であるか否かを確認することができる。いくつかの実施形態では、ユーザは、マウスなどのカーソルを使用して、物体１２２０ｂまたは物体１２２０ｃが実際の物体であるか否かを確認する。

図１３は、いくつかの実施形態による、識別された物体１３２０ａならびに識別された候補物体１３２０ｂおよび１３２０ｃを含む画像１３１０を含むユーザインターフェース（ＵＩ）１３００の図である。ＵＩ１３００は、画像１３１０と、第１の入力フィールド１３４０および第２の入力フィールド１３５０とを含む。画像１３１０は画像１２１０と同様であり、簡潔にするためにこの要素の詳細な説明は省略する。第１の入力フィールド１３４０は入力フィールド１２４０と同様であり、簡潔にするためにこの要素の詳細な説明は省略する。

ＵＩ１２００と比較して、ＵＩ１３００は第２の入力フィールド１３５０を含む。第２の入力フィールド１３５０は、エラー候補または検出された物体に関する物体の種類に関連する情報を受け付けるフィールド１３５２を含む。図１３では、フィールド１３５２は、「人物」という種類が部分的に入力されている。物体のカテゴリの他の種類は、物体１３２０ａと同様の標識、車両、道路、建物、または他の適切なカテゴリを含む。

第２の入力フィールド１３５０は、エラー候補または検出された物体の場所を受け付けるためのフィールド１３５４をさらに含む。エラー候補または検出された物体の場所は、画像１３１０内のラベル、例えば点線ラベル１３３０ｂの位置に基づく。いくつかの実施形態では、エラー候補または検出された物体の場所は、入力画像「Ｘ」を解析するために使用されるシステムによって自動的に決定される。いくつかの実施形態では、エラー候補または検出された物体の場所は、ユーザからの入力に基づく。いくつかの実施形態では、ユーザからの入力はタッチスクリーンを介して受け付けられる。いくつかの実施形態では、ユーザからの入力はカーソルの使用を介して受け付けられる。いくつかの実施形態では、ユーザからの入力は情報のタイピングを介して受け付けられる。いくつかの実施形態では、場所はシステムによって自動的に決定され、次いでユーザ入力に基づいて調整される。例えば、画像１３１０では、システムは点線ラベル１３３０ｂ’の場所を決定したが、ユーザは、物体の場所を変更して点線ラベル１３３０ｂを確立した。点線ラベル１３３０ｂが点線ラベル１３３０ｂ’よりも小さいことは、事前に訓練されたモデルにより正確なフィードバックを提供して、将来の画像解析の精度を高めるのに役立つ。

第２の入力フィールド１３５０は、エラー候補が画像の解析中に検出すべき物体であるか否かを確認するためのフィールド１３５６を含む。ユーザは、エラー候補が物体であることを示す「Ｙｅｓ」を選択したり、エラー候補が物体ではないことを示す「Ｎｏ」を選択したりすることができる。いくつかの実施形態では、ユーザからの入力はタッチスクリーンを介して受け付けられる。いくつかの実施形態では、ユーザからの入力はカーソルの使用を介して受け付けられる。いくつかの実施形態では、ユーザからの入力は情報のタイピングを介して受け付けられる。

図１４は、いくつかの実施形態による、エラー候補の識別を実施するためのシステム１４００のブロック図である。システム５００は、ハードウェアプロセッサ１４０２と、コンピュータプログラムコード１４０６、すなわち一式の実行可能命令で符号化された、すなわちこれを記憶している非一時的コンピュータ可読記憶媒体１４０４とを備える。コンピュータ可読記憶媒体１４０４はまた、命令を実施し、撮像デバイスやサーバなどの外部デバイスとインターフェースするためのパラメータ１４０７で符号化される。プロセッサ１４０２は、バス１４０８を介してコンピュータ可読記憶媒体１４０４に電気的に結合される。プロセッサ１４０２はまた、バス１４０８によってＩ／Ｏインターフェース１４１０に電気的に結合される。ネットワークインターフェース１４１２はまた、バス１４０８を介してプロセッサ１４０２に電気的に接続される。ネットワークインターフェース１４１２はネットワーク１４１４に接続され、その結果、プロセッサ１４０２およびコンピュータ可読記憶媒体１４０４がネットワーク１４１４を介して外部要素に接続することができる。プロセッサ１４０２は、システム３００もしくはシステム６００について説明した動作、または方法７００、方法８００、もしくは方法９００において説明した動作の一部または全部を実行するようにシステム１４００を使用可能にするために、コンピュータ可読記憶媒体１４０４に符号化されたコンピュータプログラムコード１４０６を実行するように構成される。

いくつかの実施形態では、プロセッサ１４０２は、中央処理装置（ＣＰＵ）、マルチプロセッサ、分散処理システム、特定用途向け集積回路（ＡＳＩＣ）、および／または適切な処理ユニットである。

いくつかの実施形態では、コンピュータ可読記憶媒体１４０４は、電子、磁気、光学、電磁、赤外線、および／または半導体システム（または装置もしくはデバイス）である。例えば、コンピュータ可読記憶媒体１４０４は、半導体メモリもしくはソリッドステートメモリ、磁気テープ、リムーバブルコンピュータディスケット、ランダムアクセスメモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、硬質な磁気ディスク、および／または光ディスクを含む。光ディスクを使用するいくつかの実施形態では、コンピュータ可読記憶媒体１４０４は、コンパクトディスク読み出し専用メモリ（ＣＤ－ＲＯＭ）、コンパクトディスク－リード／ライト（ＣＤ－Ｒ／Ｗ）、および／またはデジタルビデオディスク（ＤＶＤ）を含む。

いくつかの実施形態では、記憶媒体１４０４は、システム３００もしくはシステム６００について説明した動作、または方法７００、方法８００、もしくは方法９００において説明した動作をシステム１４００に実行させるように構成されたコンピュータプログラムコード１４０６を記憶する。いくつかの実施形態では、記憶媒体１４０４はまた、システム３００もしくはシステム６００について説明した動作、または方法７００、方法８００、もしくは方法９００において説明した動作を実行するために必要な情報、および方法７００、方法８００、もしくは方法９００を実行する間に生成された情報、例えば、訓練されたモデルパラメータ１４１６、入力画像パラメータ１４１８、移動領域パラメータ１４２０、時間的不整合パラメータ１４２２、エラー候補パラメータ１４２４、および／あるいはシステム３００もしくはシステム６００について説明した動作、または方法７００、方法８００、もしくは方法９００において説明した動作を実行するための一式の実行可能命令を記憶する。

いくつかの実施形態では、記憶媒体１４０４は、外部マシンとインターフェースし、システム３００もしくはシステム６００について説明した動作、または方法７００、方法８００、もしくは方法９００において説明した動作を実施するための命令１４０７を記憶する。命令１４０７は、システム３００もしくはシステム６００について説明した動作、または方法７００、方法８００、もしくは方法９００において説明した動作を効果的に実施するために、外部マシンによって読み取り可能な命令をプロセッサ１４０２が生成することを可能にする。

システム１４００は、Ｉ／Ｏインターフェース１４１０を備える。Ｉ／Ｏインターフェース１４１０は、外部回路に結合される。いくつかの実施形態では、Ｉ／Ｏインターフェース１４１０は、情報およびコマンドをプロセッサ１４０２に伝達するためのキーボード、キーパッド、マウス、トラックボール、トラックパッド、および／またはカーソル方向キーを含む。

システム１４００はまた、プロセッサ１４０２に結合されたネットワークインターフェース１４１２を備える。ネットワークインターフェース１４１２は、システム１４００が、１つまたは複数の他のコンピュータシステムが接続されているネットワーク１４１４と通信することを可能にする。ネットワークインターフェース１４１２は、ＢＬＵＥＴＯＯＴＨ（登録商標）、ＷＩＦＩ、ＷＩＭＡＸ、ＧＰＲＳ、もしくはＷＣＤＭＡ（登録商標）などの無線ネットワークインターフェース、またはＥＴＨＥＲＮＥＴ、ＵＳＢ、ＩＥＥＥ－１３９４などの有線ネットワークインターフェースを含む。いくつかの実施形態では、方法７００、方法８００、または方法９００は、２つ以上のシステム１４００において実施され、情報は、ネットワーク１４１４を介して異なるシステム１４００間で交換される。

システム１４００は、Ｉ／Ｏインターフェース１４１０またはネットワークインターフェース１４１２を介して訓練されたモデルに関連する情報を受信するように構成される。情報は、バス１４０８を介してプロセッサ１４０２に送信される。次いで、訓練されたモデルは、訓練されたモデルパラメータ１４１６としてコンピュータ可読媒体１４０４に記憶される。システム１４００はまた、物体であると確認されたエラー候補に関連するフィードバックに基づいて、訓練されたモデルパラメータ１４１６を更新するように構成される。システム１４００は、Ｉ／Ｏインターフェース１４１０またはネットワークインターフェース１４１２を介して入力画像に関連する情報を受信するように構成される。情報は、入力画像パラメータ１４１８としてコンピュータ可読媒体１４０４に記憶される。システム１４００は、Ｉ／Ｏインターフェース１４１０またはネットワークインターフェース１４１２を介して移動領域に関連する情報を受信するように構成される。情報は、移動領域パラメータ１４２０としてコンピュータ可読媒体１４０４に記憶される。システム１４００は、Ｉ／Ｏインターフェース１４１０またはネットワークインターフェース１４１２を介して時間的不整合に関連する情報を受信するように構成される。情報は、時間的不整合パラメータ１４２２としてコンピュータ可読媒体１４０４に記憶される。システム１４００は、Ｉ／Ｏインターフェース１４１０またはネットワークインターフェース１４１２を介してエラー候補に関連する情報を受信するように構成される。情報は、エラー候補パラメータ１４２４としてコンピュータ可読媒体１４０４に記憶される。いくつかの実施形態では、訓練されたモデルパラメータ１４１６、入力画像パラメータ１４１８、移動領域パラメータ１４２０、時間的不整合パラメータ１４２２、またはエラー候補パラメータ１４２４に関連する情報は、プロセッサ１４０２によって生成または更新され、コンピュータ可読媒体１４０４に書き込まれる。

（付記１）

モデルを訓練する方法が、処理データを生成することを含み、処理データを生成することが、事前に訓練されたモデルを使用して画像に関連する入力を解析して、入力内の物体を検出することを含む。本方法は、移動領域検出データを生成することをさらに含み、移動領域検出データを生成することが、入力を解析して、入力内に移動を呈する領域が存在するか否かを判定することを含む。本方法は、時間的不整合データを生成することをさらに含み、時間的不整合データを生成することが、処理データを解析して、処理データ内に時間的不整合を示す領域が存在するか否かを判定することを含む。本方法は、移動領域検出データおよび時間的不整合データに基づいて、入力がエラー候補を含むか否かを識別することをさらに含む。本方法は、エラー候補が入力内の未検出物体であるか否かに関する確認情報を受信することをさらに含む。本方法は、エラー候補が入力内の未検出物体であることを示す確認情報を受信したことに応じて、事前に訓練されたモデルを更新することをさらに含む。

（付記２）

いくつかの実施形態では、移動領域検出データを生成することが、入力および処理データの両方を解析することを含む。

（付記３）

いくつかの実施形態では、入力がエラー候補を含むか否かを識別することが、処理データに基づいて入力がエラー候補を含むか否かを識別することを含む。

（付記４）

いくつかの実施形態では、入力がエラー候補を含むか否かを識別することが、逆処理データに基づいて入力がエラー候補を含むか否かを識別することを含み、逆処理データが、処理データの生成中に検出された物体を除く処理データに対応する。

（付記５）

いくつかの実施形態では、本方法は、時間的不整合データに基づいて偽陰性尤度スコア（ＦＮＳ）を決定することをさらに含む。

（付記６）

いくつかの実施形態では、入力がエラー候補を含むか否かを識別することが、ＦＮＳの値に基づいて入力がエラー候補を含むか否かを識別することを含む。

（付記７）

いくつかの実施形態では、入力がエラー候補を含むか否かを識別することが、ＦＮＳの値が閾値を超えることに基づいて入力がエラー候補を含むか否かを識別することを含む。

（付記８）

いくつかの実施形態では、ＦＮＳを決定することが、移動領域検出データに基づいてＦＮＳを決定することを含む。

（付記９）

いくつかの実施形態では、本方法は、物体、エラー候補、第１のラベル、および第２のラベルを表示するステップであって、物体に関連付けられた第１のラベルが、エラー候補に関連付けられた第２のラベルとは異なる、ステップをさらに含む。

（付記１０）

いくつかの実施形態では、本方法は、第２のラベルのサイズまたは場所を調整するための命令を受信することと、第２のラベルの調整されたサイズまたは場所に基づいて事前に訓練されたモデルを更新することとをさらに含む。

（付記１１）

モデルを訓練するためのシステムが、画像受信機と、ディスプレイと、命令を記憶するように構成されたメモリと、画像受信機、ディスプレイ、およびメモリに接続されたプロセッサとを備える。プロセッサは、処理データを生成することであって、処理データを生成することが、事前に訓練されたモデルを使用して画像に関連する入力を解析して、入力内の物体を検出することを含む、ことのための命令を実行するように構成されている。プロセッサは、移動領域検出データを生成することであって、移動領域検出データを生成することが、入力を解析して、入力内に移動を示す領域が存在するか否かを判定することを含む、ことのための命令を実行するようにさらに構成されている。プロセッサは、時間的不整合データを生成することであって、時間的不整合データを生成することが、処理データを解析して、処理データ内に時間的不整合を示す領域が存在するか否かを判定することを含む、ことのための命令を実行するようにさらに構成されている。プロセッサは、移動領域検出データおよび時間的不整合データに基づいて、入力がエラー候補を含むか否かを識別することのための命令を実行するようにさらに構成される。プロセッサは、エラー候補が入力内の未検出物体であるか否かに関する確認情報を受信することのための命令を実行するようにさらに構成されている。プロセッサは、エラー候補が入力内の未検出物体であることを示す確認情報を受信したことに応じて、事前に訓練されたモデルを更新することのための命令を実行するようにさらに構成されている。

（付記１２）

いくつかの実施形態では、プロセッサが、入力および処理データの両方を解析することによって、移動領域検出データを生成することのための命令を実行するように構成されている。

（付記１３）

いくつかの実施形態では、プロセッサが、処理データに基づいて入力がエラー候補を含むか否かを識別することによって、入力がエラー候補を含むか否かを識別することのための命令を実行するように構成されている。

（付記１４）

いくつかの実施形態では、プロセッサが、逆処理データに基づいて入力がエラー候補を含むか否かを識別することによって、入力がエラー候補を含むか否かを識別することのための命令を実行するように構成され、逆処理データが、処理データの生成中に検出された物体を除く処理データに対応する。

（付記１５）

いくつかの実施形態では、プロセッサが、時間的不整合データに基づいて偽陰性尤度スコア（ＦＮＳ）を決定することのための命令を実行するように構成されている。

（付記１６）

いくつかの実施形態では、プロセッサが、ＦＮＳの値に基づいて入力がエラー候補を含むか否かを識別することのための命令を実行するように構成されている。

（付記１７）

いくつかの実施形態では、プロセッサが、移動領域検出データに基づいてＦＮＳを決定することのための命令を実行するように構成されている。

（付記１８）

いくつかの実施形態では、プロセッサが、物体、エラー候補、第１のラベル、および第２のラベルを表示するようにディスプレイに命令することのための命令を実行するように構成され、物体に関連付けられた第１のラベルが、エラー候補に関連付けられた第２のラベルとは異なる。

（付記１９）

いくつかの実施形態では、プロセッサが、第２のラベルのサイズまたは場所を調整することのための命令を受信することと、第２のラベルの調整されたサイズまたは場所に基づいて事前に訓練されたモデルを更新することとのための命令を実行するように構成されている。

（付記２０）

プロセッサによって実行されると、プロセッサに、処理データを生成することであって、処理データを生成することが、事前に訓練されたモデルを使用して画像に関連する入力を解析して、入力内の物体を検出することを含む、ことと、移動領域検出データを生成することであって、移動領域検出データを生成することが、入力を解析して、入力内に移動を示す領域が存在するか否かを判定することを含む、ことと、時間的不整合データを生成することであって、時間的不整合データを生成することが、処理データを解析して、処理データ内に時間的不整合を示す領域が存在するか否かを判定することを含む、ことと、移動領域検出データおよび時間的不整合データに基づいて、入力がエラー候補を含むか否かを識別することと、エラー候補が入力内の未検出物体であるか否かに関する確認情報を受信することと、エラー候補が入力内の未検出物体であることを示す確認情報を受信したことに応じて、事前に訓練されたモデルを更新することとを行わせる命令を記憶する、非一時的コンピュータ可読媒体。

以上、当業者が本開示の態様をよりよく理解し得るように、いくつかの実施形態の特徴を概説した。当業者は、本明細書に提示した実施形態と同じ目的を実行する、および／または同じ利点を実現するための他のプロセスおよび構造を設計または修正するための基礎として本開示を容易に使用できることを理解するはずである。当業者はまた、そのような均等な構成が本開示の趣旨および範囲から逸脱するものではないこと、ならびに本開示の趣旨および範囲から逸脱することなく本明細書において様々な変更、置換、および改変を行うことができることを理解するはずである。

本出願は、２０２０年３月１３日に出願された米国特許出願第１６／８１７，６１７号に基づくものであり、かつその優先権の利益を主張するものであり、同米国特許出願の開示内容はその全体が本明細書に組み込まれる。

Claims

処理データを生成することであって、前記処理データを生成することが、事前に訓練されたモデルを使用して画像に関連する入力を解析して、前記入力内の物体を検出することを含む、ことと、
移動領域検出データを生成することであって、前記移動領域検出データを生成することが、前記入力を解析して、前記入力内に移動を示す領域が存在するか否かを判定することを含む、ことと、
時間的不整合データを生成することであって、前記時間的不整合データを生成することが、前記処理データを解析して、前記処理データ内に時間的不整合を示す領域が存在するか否かを判定することを含む、ことと、
前記移動領域検出データおよび前記時間的不整合データに基づいて、前記入力がエラー候補を含むか否かを識別することと、
前記エラー候補が前記入力内の未検出物体であるか否かに関する確認情報を受信することと、
前記エラー候補が前記入力内の前記未検出物体であることを示す前記確認情報を受信したことに応じて、前記事前に訓練されたモデルを更新することと
を含む、モデルを訓練する方法。
前記移動領域検出データを生成することが、前記入力および前記処理データの両方を解析することを含む、請求項１に記載の方法。
前記入力が前記エラー候補を含むか否かを識別することが、前記処理データに基づいて前記入力が前記エラー候補を含むか否かを識別することを含む、請求項１に記載の方法。
前記入力が前記エラー候補を含むか否かを識別することが、逆処理データに基づいて前記入力が前記エラー候補を含むか否かを識別することを含み、前記逆処理データが、前記処理データの生成中に検出された前記物体を除く前記処理データに対応する、請求項１に記載の方法。
前記時間的不整合データに基づいて偽陰性尤度スコア（ＦＮＳ）を決定することをさらに含む、請求項１に記載の方法。
前記入力が前記エラー候補を含むか否かを識別することが、前記ＦＮＳの値に基づいて前記入力が前記エラー候補を含むか否かを識別することを含む、請求項５に記載の方法。
前記入力が前記エラー候補を含むか否かを識別することが、前記ＦＮＳの値が閾値を超えることに基づいて前記入力が前記エラー候補を含むか否かを識別することを含む、請求項５に記載の方法。
前記物体、前記エラー候補、第１のラベル、および第２のラベルを表示することをさらに含み、前記物体に関連付けられた前記第１のラベルが、前記エラー候補に関連付けられた前記第２のラベルとは異なる、請求項１に記載の方法。
画像受信機と、
ディスプレイと、
命令を記憶するように構成されたメモリと、
前記画像受信機、前記ディスプレイ、および前記メモリに接続されたプロセッサと
を備える、モデルを訓練するためのシステムであって、
前記プロセッサが、
処理データを生成することであって、前記処理データを生成することが、事前に訓練されたモデルを使用して画像に関連する入力を解析して、前記入力内の物体を検出することを含む、ことと、
移動領域検出データを生成することであって、前記移動領域検出データを生成することが、前記入力を解析して、前記入力内に移動を示す領域が存在するか否かを判定することを含む、ことと、
時間的不整合データを生成することであって、前記時間的不整合データを生成することが、前記処理データを解析して、前記処理データ内に時間的不整合を示す領域が存在するか否かを判定することを含む、ことと、
前記移動領域検出データおよび前記時間的不整合データに基づいて、前記入力がエラー候補を含むか否かを識別することと、
前記エラー候補が前記入力内の未検出物体であるか否かに関する確認情報を受信することと、
前記エラー候補が前記入力内の前記未検出物体であることを示す前記確認情報を受信したことに応じて、前記事前に訓練されたモデルを更新することと
のための前記命令を実行するように構成されている、
システム。
プロセッサによって実行されると、前記プロセッサに、
処理データを生成することであって、前記処理データを生成することが、事前に訓練されたモデルを使用して画像に関連する入力を解析して、前記入力画像内の物体を検出することを含む、ことと、
移動領域検出データを生成することであって、前記移動領域検出データを生成することが、前記入力を解析して、前記入力内に移動を示す領域が存在するか否かを判定することを含む、ことと、
時間的不整合データを生成することであって、前記時間的不整合データを生成することが、前記処理データを解析して、前記処理データ内に時間的不整合を示す領域が存在するか否かを判定することを含む、ことと、
前記移動領域検出データおよび前記時間的不整合データに基づいて、前記入力がエラー候補を含むか否かを識別することと、
前記エラー候補が前記入力内の未検出物体であるか否かに関する確認情報を受信することと、
前記エラー候補が前記入力内の前記未検出物体であることを示す前記確認情報を受信したことに応じて、前記事前に訓練されたモデルを更新することと
を行わせるためのプログラム。