WO2023089888A1

WO2023089888A1 - 機械学習方法、機械学習プログラム、機械学習装置、および情報処理装置

Info

Publication number: WO2023089888A1
Application number: PCT/JP2022/031342
Authority: WO
Inventors: 岳彦指田
Original assignee: コニカミノルタ株式会社
Priority date: 2021-11-18
Filing date: 2022-08-19
Publication date: 2023-05-25
Also published as: CN118251684A

Abstract

機械学習方法は、系列データを取得し、系列データに対して、所定条件に基づいて、系列方向のサイズ調整の前処理を行うことにより、１つの系列データにより、系列方向の間隔が互いに異なる複数の調整後系列データを生成し、生成した複数の調整後系列データを用いて、教師あり学習し、学習モデルを生成する。

Description

機械学習方法、機械学習プログラム、機械学習装置、および情報処理装置

　本発明は、機械学習方法、機械学習プログラム、機械学習装置、および情報処理装置に関する。

　ディープラーニング等の機械学習により、物体の認識精度を一定以上にするためには、一般に質の高い大量の教師データを用いた学習が必要となる。そのためには、非特許文献１のように、解析結果に応じてサンプリンレートを設定することで、質を保ったままデータを増やす手法がある。
この非特許文献１の手法では、発音の違い（会話、読み上げ、スピーチ）による認識精度低下を抑制するために、音声データに対して、１５ｍｓｅｃ周期でエントロピーを解析し、解析結果に応じて、サンプリングレートを設定し、学習用のトレーニングデータを生成する。

Amber Afshan, Jinxi Guo, Soo Jin Park, Vijay Ravi, Alan McCree, Abeer Alwan," Variable frame rate-based data augmentation to handle speaking-style variability for automatic speaker verification",米国,コーネル大学, Sat, 8 Aug 2020,インターネット（URL: https://arxiv.org/abs/2008.03616）

非特許文献１の技術では、音声データに関するものであり、前処理として高度な補間処理が必要となる。

　本発明は、このような問題を解決するためになされたものである。すなわち、高度な前処理を必要とせずに、簡便に学習用データを生成し、これを用いて学習することで、系列方向の条件変化に対するロバストネス性を向上させた学習モデルを生成する機械学習装置、および機械学習方法を提供することを目的とする。

　本発明の上記課題は、以下の手段によって解決される。

　（１）対象の特徴を抽出するための学習モデルを生成する機械学習方法であって、
　系列データを取得するステップ（ａ）と、
　前記系列データに対して、所定条件に基づいて、系列方向のサイズ調整の前処理を行うことにより、１つの系列データにより、系列方向の間隔が互いに異なる複数の調整後系列データを生成する、ステップ（ｂ）と、
　前記ステップ（ｂ）で生成した複数の前記調整後系列データを用いて、教師あり学習し、学習モデルを生成するステップ（ｃ）と、を含む処理を実行する機械学習方法。

　（２）前記ステップ（ａ）では、前記系列データとともに、該系列データのラベルを取得し、
　前記ステップ（ｃ）では、前記系列データの１つの前記ラベルを、前記複数の調整後系列データに適用して、教師あり学習を行う、上記（１）に記載の機械学習方法。

　（３）前記ステップ（ｂ）では、前記所定条件に基づいて、サイズ調整の条件を自動的に設定する、上記（１）、または上記（２）に記載の機械学習方法。

　（４）前記ステップ（ａ）で取得した前記系列データは、撮影領域内の対象の物体を撮影して得られた、時系列の画像データであり、
　前記学習モデルは、対象の物体の特徴を抽出するための学習モデルである、上記（１）から上記（３）のいずれかに記載の機械学習方法。

　（５）前記ステップ（ｂ）では、前記所定条件として、前記系列データのサンプリングレート、またはフレーム数に応じて、前記サイズ調整の条件を設定する、上記（４）に記載の機械学習方法。

　（６）さらに、撮影環境に関する外部情報を取得するステップ（ｄ）を含み、
　前記ステップ（ｂ）では、前記所定条件として、前記外部情報に基づいて、前記サイズ調整の条件を設定する、上記（４）、または上記（５）に記載の機械学習方法。

　（７）前記外部情報は、前記物体の移動速度、前記撮影領域を撮影するカメラのスペックに関する情報である、上記（６）に記載の機械学習方法。

　（８）予め定められた条件に基づいて、前記系列データを解析し、系列データを構成する複数のフレームの中から、対象の物体の注目箇所が存在する１つ以上のキーフレームを検出するステップ（ｅ）を、さらに含み、
　前記ステップ（ｂ）では、前記ステップ（ｅ）で検出したキーフレームの中から一つの基準フレームを設定するとともに、前記サイズ調整を、該基準フレームを基準に実行する、上記（４）から上記（７）のいずれかに記載の機械学習方法。

　（９）前記ステップ（ｂ）では、前記ステップ（ｅ）で検出した前記キーフレームの数に応じて、サイズ調整の条件を設定する、上記（８）に記載の機械学習方法。

　（１０）前記ステップ（ｂ）では、前記キーフレームのみを対象として、前記サイズ調整の対象とする、上記（８）または上記（９）に記載の機械学習方法。

　（１１）前記ステップ（ｂ）では、前記系列データの並び方向において、前記基準フレームの前後で、前記サイズ調整の方法を異ならせる、上記（８）から上記（１０）のいずれかに記載の機械学習方法。

　（１２）対象の特徴を抽出するための学習モデルを生成する機械学習装置であって、
　系列データを取得する取得部と、
　前記系列データに対して、所定条件に基づいて、系列方向のサイズ調整の前処理を行うことにより、１つの系列データにより、系列方向の間隔が互いに異なる複数の調整後系列データを生成する前処理部と、
　前記前処理部が生成した複数の前記調整後系列データを用いて、教師あり学習し、学習モデルを生成する学習部と、
を備える機械学習装置。

　（１３）前記取得部は、前記系列データとともに、該系列データのラベルを取得し、
　前記学習部は、前記系列データの１つの前記ラベルを、前記複数の調整後系列データに適用して、教師あり学習を行う、上記（１２）に記載の機械学習装置。

　（１４）前記前処理部は、前記所定条件に基づいて、サイズ調整の条件を自動的に設定する、上記（１２）、または上記（１３）に記載の機械学習装置。

　（１５）前記取得部が取得した前記系列データは、撮影領域内の対象の物体を撮影して得られた、時系列の画像データであり、
　前記学習モデルは、対象の物体の特徴を抽出するための学習モデルである、上記（１２）から上記（１４）のいずれかに記載の機械学習装置。

　（１６）前記前処理部は、前記所定条件として、前記系列データのサンプリングレート、またはフレーム数に応じて、前記サイズ調整の条件を設定する、上記（１５）に記載の機械学習装置。

　（１７）前記取得部は、さらに、撮影環境に関する外部情報を取得し、
　前記前処理部は、前記所定条件として、前記外部情報に基づいて、前記サイズ調整の条件を設定する、上記（１５）、または上記（１６）に記載の機械学習装置。

　（１８）前記外部情報は、前記物体の移動速度、前記撮影領域を撮影するカメラのスペックに関する情報である、上記（１７）に記載の機械学習装置。

　（１９）予め定められた条件に基づいて、前記系列データを解析し、系列データを構成する複数のフレームの中から、対象の物体の注目箇所が存在する１つ以上のキーフレームを検出する検出部を、さらに含み、
　前記前処理部は、前記検出部が検出したキーフレームの中から一つの基準フレームを設定するとともに、前記サイズ調整を、該基準フレームを基準に実行する、上記（１５）から上記（１８）のいずれかに記載の機械学習装置。

　（２０）前記前処理部は、前記検出部が検出した前記キーフレームの数に応じて、サイズ調整の条件を設定する、上記（１９）に記載の機械学習装置。

　（２１）前記前処理部は、前記キーフレームのみを対象として、前記サイズ調整の対象とする、上記（１９）または上記（２０）に記載の機械学習装置。

　（２２）前記前処理部は、前記系列データの並び方向において、前記基準フレームの前後で、前記サイズ調整の方法を異ならせる、上記（１９）から上記（２１）のいずれかに記載の機械学習装置。

　（２３）上記（１）から上記（１１）の何れかに記載の機械学習方法を、コンピューターに実行させるための機械学習プログラム。

　（２４）系列データを取得する取得部と、
　上記（１）から上記（１１）の何れかに記載の機械学習方法で学習した学習モデルを用いて対象の特徴を抽出する抽出部と、
　抽出結果を出力する出力部と、を備える情報処理装置。

　本発明の機械学習方法、および機械学習装置によれば、系列データを取得し、系列データに対して、所定条件に基づいて、系列方向のサイズ調整の前処理を行うことにより、１つの系列データにより、系列方向の間隔が互いに異なる複数の調整後系列データを生成し、生成した複数の調整後系列データを用いて、教師あり学習し、学習モデルを生成する。これにより、高度な前処理を必要とせずに、簡便に、系列データの間隔が異なる複数の学習用データを生成し、これを用いて学習するので、系列方向の条件変化に対するロバストネス性を向上させた学習モデルを生成できる。

本発明の実施形態に係る情報処理装置の概略構成を示す図である。図１に示した情報処理装置によって検査される対象の物体の一例を示す側面図である。情報処理装置の構成を示すブロック図である。制御部が機能することで実現する機械学習装置におけるデータの流れを示す機能ブロック図である。系列データの一例である。機械学習装置の機械学習処理を示すフローチャートである。ステップＳ５３のサイズ調整条件の設定処理を示すサブルーチンフローチャートである。別の例におけるステップＳ５３のサイズ調整条件の設定処理を示すサブルーチンフローチャートである。前処理により生成した複数の調整後系列データの例である。別のサイズ調整条件により生成した調整後系列データの例である。調整後系列データを用いた機械学習方法を説明するための模式図である。機械学習により生成した学習モデルを使用した、情報処理装置の検査処理におけるデータの流れを示す機能ブロック図である。情報処理装置の検査処理を示すフローチャートである。

　以下、添付した図面を参照して、本発明の実施形態を説明する。しかしながら、本発明の範囲は、開示される実施形態に限定されない。なお、図面の説明において同一の要素には同一の符号を付し、重複する説明を省略する。また、図面の寸法比率は、説明の都合上誇張されており、実際の比率とは異なる場合がある。

　図１は、本実施形態に係る情報処理装置を含む、検査システム１の概略構成を示す図である。

　検査システム１は、系列データ入力装置３０、および情報処理装置１０で構成され、これらは、ＬＡＮ等のネットワーク９０を介して、相互に通信可能に接続される。系列データ入力装置３０は、系列データを生成したり、入力したりする。系列データ入力装置３０には、カメラ３１０が含まれる。系列データ入力装置３０にはカメラ３１０の他に、ＬｉＤａｒ（Ｌｉｇｈｔ　Ｄｅｔｅｃｔｉｏｎ　Ａｎｄ　Ｒａｎｇｉｎｇ）等の３次元測距センサー、工場等に配置された温度センサー、圧力センサー等の連続して、観測を行い、その検知データを出力する検出装置、これらの装置から得られた系列データを記録したＨＤＤ（ハードディスクドライブ等が含まれていてもよい。情報処理装置１０は、機械学習装置として機能し、系列データ入力装置３０からの系列データを用いて機械学習し、機械学習モデルを生成する。

　（系列データ）
　系列データは、複数のデータが、所定の順序情報に従って並べられたデータ群である。例えば、カメラ３１０の撮影により得られた撮影データ（時系列の画像データ）、２次元画像データを、その２次元に垂直な方向の位置情報により並べた３次元データ、人が発した音声を時系列に並べた音声データ、３次元測距センサーから得られた測距点群データ等がある。以下においては、系列データとしてカメラ３１０の撮影により得られた撮影データ（動画）を例にして説明する。

　図２は、検査システム１により検査される所定の対象物の一例を表している。図２に示す例では、対象物としては、長尺の板金部材であり、図２において、搬送方向に沿って、右手側から左手側にベルトコンベア（図示せず）により搬送される。本実施形態では、検査システム１の情報処理装置１０は、対象（対象物）の特徴として、板金部材の表面塗装の欠陥（図２においては、注目箇所として示している）を抽出し、抽出結果を出力する。なお、対象物としてはこれに限られず、複数の車両等の製品自体、またはこの製品用の一部の構成部品を、連続してベルトコンベアにより搬送されたものであってもよく、対象の形状的な特徴（製品不良、欠品等）を抽出し、抽出結果を出力するようにしてもよい。

　図３は、情報処理装置１０の構成を示すブロック図である。情報処理装置１０は、制御部１１、記憶部１２、操作表示部１３、および通信部１４を備える。これらは信号をやり取りするためのバス等の信号線を介して相互に接続される。

　制御部１１は、機械学習装置として機能し、複数のＣＰＵ、複数のＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＲＡＭ、ＲＯＭ等を含みプログラムにしたがって、各装置の制御や、機械学習を行う。情報処理装置１０は、オンプレミスサーバーであってもよく、あるいは商用のクラウドサービスを利用したクラウドサーバーであってもよい。また、情報処理装置１０の一部の機能（例えば機械学習装置の機能のみ）を、クラウドサーバーにより実現してもよい。

　　記憶部１２は、予め各種プログラムや各種データを格納しておく半導体メモリや、ハードディスク等の磁気メモリから構成される。機械学習により学習し、生成、更新された機械学習モデル２００（学習済みモデルとも称される）は、この記憶部１２に記憶される。また、記憶部１２には、この他に以下の３種類のデータｄ１～ｄ３が記憶されている。（ｄ１）系列データ入力装置３０により生成された多数の系列データ、（ｄ２）外部情報、（ｄ３）注目箇所の抽出条件である。この各系列データ（ｄ１）には、ラベル（正解ラベル）が紐付けられて記憶されている。ここで外部情報（ｄ２）は、撮影環境に関する情報であり、例えば、カメラ３１０のサンプリングレート、もしくはフレーム数（ＦＰＳ）、または、対象物の移動速度、すなわち、ベルトコンベアの搬送速度である。または系列データが音声データであればサンプリングレートである。また抽出条件（ｄ３）は、予め設定されたルールであり、これを用いたルールベースアルゴリズムとしては、、例えば、パターンマッチング、またはエッジ検出処理等の注目箇所を検出するための画像処理アルゴリズムを適用できる。この抽出条件（ｄ３）もしくは、これを用いたアルゴリズムは、後述の検出部１１２の検出処理に用いられる。

　操作表示部１３は、例えば、タッチパネル式のディスプレイであり、各種情報を表示すると共に、ユーザーからの各種入力を受け付ける。ユーザーは、操作表示部１３を介して、上述の撮影環境（外部情報）を設定できる。各系列データへのラベルの付与は、この操作表示部１３を介して行われてもよく、またはルールベースアルゴリズム、または機械学習モデルを用いたラベル付けの前工程により行われてもよい。これらの設定、または付与された情報は、記憶部１２に記憶される。

　通信部１４は、ネットワークを経由したデータの送受信を行うインターフェースである。例えば、Ｅｔｈｅｒｎｅｔ、Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＩＥＥＥ８０２．１１（Ｗｉ－Ｆｉ）等の規格による通信を行う。

　図４は、制御部１１が機能することで実現する機械学習装置におけるデータの流れを示す機能ブロック図である。制御部１１は、通信部１４と協働することで取得部１１１として機能する。また制御部１１は、検出部１１２、前処理部１１３、および学習部１１４として機能する。

　（取得部１１１）
　取得部１１１は、系列データ入力装置３０から、または記憶部１２から、外部情報、および複数の訓練データを取得する。訓練データは、複数の系列データとラベルのセットで構成される。

　（検出部１１２）
　検出部１１２は、取得部１１１から系列データを受け取る。図５は、系列データの一例である。ここでの系列データは、所定区間（時刻ｔ―α～ｔ＋β）に撮影された撮影データである。例えば３０、６０、または１２０ＦＰＳのカメラ３１０で撮影された１秒間の動画データであれば、１つの系列データは、３０、６０、または１２０枚のフレーム（静止画像）により構成される。所定区間、ＦＰＳは、適宜設定され得る。以下においては、１つの系列データは、６０個のフレームにより構成されたものとして説明する。訓練データとして用いられる系列データは、予め、検査の対象となる注目箇所（例えば一部に塗装ムラの欠陥）が存在する対象物をベルトコンベアにより移動させながら撮影することにより生成される。図５に示す例では、わかりやすさのために、注目箇所（塗布ムラ）の部分を白塗りで示している。

　また、検出部１１２は、予め設定されている抽出条件（ｄ３）に基づいて、系列データを構成する複数のフレームの中から注目箇所が含まれるフレーム（以下、キーフレームともいう）を検出する。検出結果は、前処理部１１３に送られる。例えば、６０フレーム（１～６０番）で構成される系列データであれば、キーフレームのフレーム番号を送出する。

　（前処理部１１３）
　前処理部１１３は、系列データに対して、所定条件に基づいて系列方向のサイズ調整を行って、系列方向の間隔が互いに異なる複数の調整後系列データを生成する。所定条件としては、下記の所定条件Ａ１～Ａ３（以下、これらを総称して所定条件Ａともいう）がある。

　（Ａ１）サンプリングレート、またはフレーム数、（Ａ２）外部情報（例えば移動速度、またはカメラのスペック）、（Ａ３）キーフレーム情報である。

　（Ａ１）は、予め記憶部１２に記憶された、系列データの特性を示す情報であり、例えばユーザーにより設定される。（Ａ２）外部情報は、系列データ入力装置３０から取得したものである。（Ａ３）キーフレーム情報は、キーフレーム数および／または基準フレームの位置（下記参照）の情報であり、検出部１１２から取得したキーフレームの情報に基づいて判定する。

　また、前処理部１１３は、系列データの中から基準フレームを設定する。この基準フレームは、検出部１１２が検出したキーフレームの中から設定する。例えば、図５の例では、時刻ｔにおけるキーフレームを基準フレームに設定する。この基準フレームの設定は、予め設定された所定条件（以下、所定条件Ｂともいう）により設定される。例えば所定条件Ｂとしては、複数のキーフレームが検出された場合には、その並びの中央位置を基準フレームに設定する手法、または、注目箇所のエッジ（図では、黒と白の境界）が画像の中央付近に達した時点（位置）を基準フレームに設定する手法がある。

　前処理部１１３は、所定条件Ａ１、Ａ２からサイズ調整条件を設定する。例えば、検査装置において、対象物の移動の速度範囲が予め決まっている場合、その速度範囲内で発生しうる画像のバリエーションを増やす（調整後系列データの種類を増やす）。同様にカメラのスペックに応じて、フレームレートを網羅するように速度範囲内で発生しうる画像のバリエーションを増やす、また、別の例として、所定条件Ａ１、Ａ２から、注目箇所の大きさ（移動方向における、注目箇所の撮影領域に対する大きさ）、および移動速度に基づいて、注目箇所が撮影領域に存在するフレーム数（以下、存在フレーム、および存在フレーム数という）を判定し、そのフレーム数に応じて、サイズ調整を行い、複数の調整後系列データを生成する。なお、この存在フレーム数は、多くの場合、キーフレーム数と一致する。例えば、前処理部１１３は、基準フレームの前後数フレームを抽出するサイズ調整を行ったり、基準フレームの前後数フレームの範囲内で、１フレーム間引き、２フレーム間引き等でサイズ調整を行ったりする。

　また、サイズ調整の対象としては、存在フレームのみを対象としてもよく、また、系列データの並び方向において、基準フレームの前後でサイズ調整の方法を異ならせてもよい。また、サイズ調整としては、間引き処理以外に、補間処理をしたり、外挿処理してもよい。例えば、存在フレームの数が所定以下の場合には、前後のフレームにより補間することで中間のフレームを生成する。サイズ調整の具体例については後述する。

　（学習部１１４）
　学習部１１４は、サイズ調整後の系列方向の間隔が互いに異なる複数の調整後系列データと、これ付与されたラベルを訓練データとして、教師あり学習により機械学習を行い、機械学習モデル２００を生成、または更新する。ここで、１つの系列データに付与されていた１つのラベルは、この系列データを元に生成された複数の調整後系列データに共通に適用される。

　（機械学習処理）
　以下、図６から図１１を参照し、本実施形態に係る機械学習方法について説明する。本実施形態では、系列データとして、６０個の時系列の画像データで構成される撮影データにおいて、系列方向のサイズ調整として、時間方向の間引き処理により１つ当たりのデータ量を削減した場合を例として説明する。

　図６は、機械学習装置として機能する制御部１１により実行される機械学習処理を示すフローチャートである。図６の処理においては、ステップＳ５１～Ｓ５５までの処理により、複数の系列データそれぞれから、間隔の異なる複数の調整後系列データを生成する。これにより、サンプル数（訓練データ数）を増加させるとともに、それぞれのデータ量を削減する。そしてステップＳ５６では、調整後系列データを用いて、機械学習することで学習モデルを生成、更新する。

　（ステップＳ５１）
　ここでは、制御部１１の取得部１１１は、外部情報を取得する。外部情報は、上述のように系列データ入力装置から直接取得した、または、ユーザーにより操作表示部１３を介して設定され記憶部１２に記憶されたものである。

　（ステップＳ５２）
　ここでは、取得部１１１は、系列データ入力装置３０から直接、または記憶部１２に記憶されている訓練データを取得する。訓練データは、複数の系列データで構成され、各系列データにはラベルが付与されている。

　（ステップＳ５３）
　ここでは、前処理部１１３は、単独で、または検出部１１２と協働とすることで、サイズ調整の条件を自動的に設定する。図７Ａは、一例におけるこのステップＳ５３のサイズ調整条件の設定処理を示すサブルーチンフローチャートであり、図７Ｂは別の例におけるステップＳ５３のサイズ調整条件の設定処理を示すサブルーチンフローチャートである。

　（第１の例）
　（ステップＳ６１１）
　図７Ａに示すように前処理部１１３は、所定条件Ａに基づいて、複数のサイズ調整条件を設定する。例えば、所定条件Ａは、系列データを構成するフレーム数（所定条件Ａ３）であり、フレーム数が大きいほど、間引き率を多くする。例えば３０フレームであれば、例えば、１および２フレーム間引きに設定し、６０フレームの場合には、１～３フレーム間引きに設定する。例えば、６０フレーム（０～５９）で１フレーム間引きであれば、奇数番目を削除し、偶数番目（０、２、４、６…）のフレームによりデータ量を半分にした調整後系列データを生成する。また２フレーム間引きであれば、２つ置きのフレームによりデータ量を１／３にした調整後系列データを生成する（０、３、６、９…）。以上で、図７Ａの処理を終了し、図６の処理に戻る（リターン）。

　（別の例）
　（ステップＳ６２１）
　図７Ｂに示す別の例では、ここでは、検出部１１２は、系列データから抽出条件（ｄ３）に基づいてキーフレームを抽出する。

　（ステップＳ６２２）
　ここでは、前処理部１１３は、基準フレームを設定する。この基準フレームは、ステップＳ６２１で検出部１１２が検出したキーフレームの中から設定する。例えば図５においては、上述の所定条件Ｂに基づき時刻ｔのフレームを基準フレームに設定する。

　（ステップＳ６２３）
　前処理部１１３は、所定条件Ａ１またはＡ２により判定した存在フレーム数と、所定条件Ａ３（キーフレーム情報）の組み合わせ、または所定条件Ａ３のみに基づいて、複数のサイズ調整条件を設定する（後述の図８参照）。以上で、図７Ｂの処理を終了し、図６の処理に戻る（リターン）。

　（ステップＳ５４）
　再び図６を参照する。ここでは、前処理部１１３は、ステップＳ５３で設定されたサイズ調整条件に基づき、サイズ調整を実行し、１つの系列データから、複数の間隔が互いに異なる複数の調整後系列データを生成する。

　図８は、前処理により生成した複数の調整後系列データの例である。図８に示すフレームは、図５に対応し、また図８においては、調整後のフレームを実線四角枠で囲みこれ以外（すなわち、削除するフレーム）は、薄い濃度（グレイ）で表記している。図８（ａ）に示す調整後系列データｘ１では、ステップＳ６２３により設定された調整条件として、破線四角枠で囲んだ基準フレーム（時刻ｔ）を中心に、存在フレーム数の範囲内で、連続した所定区間（図では３個）のフレームを抽出している（時刻ｔ－１、ｔ、ｔ＋１のフレーム）。

　また、図８（ｂ）の調整後系列データｘ２では、ステップＳ６２３により設定された別の調整条件として、基準フレームを中心に、１フレーム間引きで３個のフレームを抽出している（時刻ｔ－２、ｔ、ｔ＋２）。なお、図８に示す例では、調整後系列データの例として３個のフレームで構成した例を示しているが、これに限られず、３個よりも多いフレームで構成されていてもよい。また、調整後系列データは、注目箇所が撮影領域に存在する存在フレーム（またはキーフレーム）だけで構成してもよいが、存在フレーム以外のフレームが含まれていてもよい。

　図９は、別のサイズ調整条件により生成した調整後系列データの例である。図９（ａ）では、基準フレーム（ｔ）を中心とした１フレーム間引き、図９（ｂ）は同２フレーム間引き、図９（ｃ）は、基準フレーム（ｔ）の前後で調整の方法を異ならせた手法（ランダム間引き）により生成した調整後系列データである。具体的には、図９（ｃ）の例では、基準フレームの前後で、間引き率を異ならせている。図９に示すような調整条件を、図８に示すような調整条件と組み合わせことで、または図８に換えて適用してもよい。

　（ステップＳ５５）
　制御部１１は、全ての訓練データに対する、サイズ調整が終了していなければ、処理をステップＳ５２に戻し、以降の処理を繰り返す。訓練データの全データセットに対するサイズ調整が終了すれば、処理をステップＳ５６に進める。

　（ステップＳ５６）
　機械学習装置である制御部１１は、サンプル調整後の調整後系列データとラベルを、訓練データとして読み込んで、機械学習を行う。図１０は、調整後系列データを用いた機械学習方法を説明するための模式図である。ステップＳ５５までの処理により、ラベルＸが紐付けられている１つの系列データｘから、複数の調整後系列データｘ１、ｘ２を生成する。またこれらの調整後系列データｘ１、ｘ２には、元となる系列データｘに紐付けられていたラベルＸを共通して適用する。なお、図１０では、２つの調整後系列データｘ１，ｘ２を生成した例を示すが、３つ以上の互いに間隔が異なる調整後系列データを生成し、これを用いて機械学習してもよい。例えば、図８、図９に示した、互いに系列方向の間隔が互いにｋとなる４つの調整後系列データｘ１～ｘ４を生成してもよい。

　多数の他の系列データに対しても同様なサイズ調整を施すことで、系列データのサイズ調整、およびサンプル数の割り増しを行う。そして、これらの調整後系列データを機械学習装置の訓練データとして、ニューラルネットワークに入力する。そして、機械学習装置（制御部１１）は、調整後系列データのニューラルネットワークの推定結果と、ラベルを比較し、比較結果からパラメータを調整する。例えば、バックプロパゲーション（Ｂａｃｋ－ｐｒｏｐａｇａｔｉｏｎ、誤差逆伝搬法）という処理を行うことにより、比較結果の誤差が小さくなるように、パラメータを調整し、更新する。これを対象の訓練データ（調整後系列データ）に対して、繰り返し行い、機械学習を進める。対象の訓練データを用いた機械学習が終わったところで、学習モデル２００を記憶部１２に記憶して処理を終了する（エンド）。

　なお、パーセプトロンを組み合わせて構成したニューラルネットワークを用いた機械学習方法について説明したが、これに限られず、教師あり学習であれば、種種の手法を取り得る。例えば、例えば、ランダムフォレスト、サポートベクターマシン（ＳＶＭ）、ブースティング（Ｂｏｏｓｔｉｎｇ）、ベイジアン（Ｂｓｙｓｉａｎ）ネットワーク線形判別法、非線形判別法等を適用できる。

　このように、本実施形態に係る機械学習方法または機械学習装置では、系列データ、およびラベルを取得し、前記系列データに対して、所定条件に基づいて、系列方向のサイズ調整の前処理を行うことにより、１つの系列データにより、系列方向の間隔が互いに異なる複数の調整後系列データを生成し、前記ラベルと、前記前処理部が生成した複数の前記調整後系列データを用いて、教師あり学習し、学習モデルを生成する。これにより、高度な前処理を必要とせずに、簡便に、系列データの間隔が異なる複数の学習用データを生成し、これを用いて学習するので、系列方向の条件変化に対するロバストネス性を向上させた学習モデルを生成できる。

　例えば、ある工場の生産ラインにおいてベルトコンベア上を製造物が移動している状況下で学習した学習モデルを他の工場の生産ラインに適用する場合には、速度が異なるベルトコンベア毎に機械学習しないと精度が低下するという状況が想定されていた。このような状況であっても本実施形態のような機械学習を行うことで、１つの速度のベルトコンベアにより移動する対象物により得られて系列データを用いて、間隔が異なる複数の調整後系列データを用いて学習することで、速度が異なるという多様な状況であっても、１つの学習モデルで対応できるようになる。特に本実施形態に係る機械学習装置、または機械学習方法は、移動速度や動き自体が主要なパラメータとならない対象物に対する特徴を抽出するための学習モデルの生成に好ましく適用できる。

　（学習モデルを用いた検査処理）
　以下、図１１、図１２を参照し、図６の機械学習処理で生成された機械学習モデル２００を用いた、検査処理について説明する。図１１は、情報処理装置１０の検査処理におけるデータの流れを示す機能ブロック図であり、図１２は、情報処理装置１０の検査処理を示すフローチャートである。

　図１１に示すように、情報処理装置１０の制御部１１は、取得部１１６、抽出部１１７、および出力部１１８として機能する。取得部１１６は、取得部１１１と同等の機能であり、系列データ入力装置３０のカメラ３１０から、図２のような対象物を撮影して得られた系列データを取得する。抽出部１１７は、系列データから学習モデル６００を使用して、対象（対象物）の特徴を抽出する。また、出力部１１８は、抽出結果を出力する。

　（ステップＳ７１）
　取得部１１６は、系列データを取得する。図２の例では、リアルタイムでカメラ３１０から撮影画像が送られ、これを所定期間毎の系列データに分割する。

　（ステップＳ７２）
　抽出部１１７は、記憶部１２に記憶されている機械学習モデル２００を展開し、これを用いて外観検査を行う。検査結果は、スコアとして出力される。

　（ステップ７３）
　出力部１１８は、スコアに応じた判定結果を出力する。例えば、対象物のスコアに応じて、不良または良品の判定結果を操作表示部１３等に出力する。

　このようにして、本実施形態に係る情報処理装置１０は、対象物が含まれる系列データに対して学習モデルを用いて、特徴を抽出し、抽出結果を出力する。これにより対象物の特徴、すなわち良品／不良品の判定を高精度に行える。

　以上に説明した機械学習装置、および情報処理装置の構成は、上述の実施形態の特徴を説明するにあたって主要構成を説明したのであって、上述の構成に限られず、特許請求の範囲内において、種種改変できる。また、一般的な機械学習装置、もしくは情報処理装置が備える構成を排除するものではない。

　また、上述したフローチャートは、一部のステップを省略してもよく、他のステップが追加されてもよい。また各ステップの一部は順序を変えたり、同時に実行されたりしてもよく、一つのステップが複数のステップに分割されて実行されてもよい。

　また、上述した情報処理装置１０における各種処理を行う手段および方法は、専用のハードウェア回路、またはプログラムされたコンピューターのいずれによっても実現することが可能である。上記プログラムは、例えば、ＵＳＢメモリやＤＶＤ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｃ）－ＲＯＭ等のコンピューター読み取り可能な記録媒体によって提供されてもよいし、インターネット等のネットワークを介してオンラインで提供されてもよい。この場合、コンピューター読み取り可能な記録媒体に記録されたプログラムは、通常、ハードディスク等の記憶部に転送され記憶される。また、上記プログラムは、単独のアプリケーションソフトとして提供されてもよいし、装置の一機能としてその装置のソフトウエアに組み込まれてもよい。

　本出願は２０２１年１１月１８日に出願された日本特許出願（特願２０２１－１８７５８４号）に基づいており、その開示内容は、参照され、全体として組み入れられている。

１　　検査システム、
１０　情報処理装置
　１１　制御部（機械学習装置）
　　１１１　取得部
　　１１２　検出部
　　１１３　前処理部
　　１１４　学習部
　　１１６　取得部
　　１１７　抽出部
　　１１８　出力部
　１２　記憶部
　１３　操作表示部
　１４　通信部
２００　学習モデル
３０　系列データ入力装置
　３１０　カメラ

Claims

　対象の特徴を抽出するための学習モデルを生成する機械学習方法であって、
　系列データを取得するステップ（ａ）と、
　前記系列データに対して、所定条件に基づいて、系列方向のサイズ調整の前処理を行うことにより、１つの系列データにより、系列方向の間隔が互いに異なる複数の調整後系列データを生成する、ステップ（ｂ）と、
　前記ステップ（ｂ）で生成した複数の前記調整後系列データを用いて、教師あり学習し、学習モデルを生成するステップ（ｃ）と、を含む処理を実行する機械学習方法。
　前記ステップ（ａ）では、前記系列データとともに、該系列データのラベルを取得し、
　前記ステップ（ｃ）では、前記系列データの１つの前記ラベルを、前記複数の調整後系列データに適用して、教師あり学習を行う、請求項１に記載の機械学習方法。
ｃ２
　前記ステップ（ｂ）では、前記所定条件に基づいて、サイズ調整の条件を自動的に設定する、請求項１、または請求項２に記載の機械学習方法。
　前記ステップ（ａ）で取得した前記系列データは、撮影領域内の対象の物体を撮影して得られた、時系列の画像データであり、
　前記学習モデルは、対象の物体の特徴を抽出するための学習モデルである、請求項１から請求項３のいずれかに記載の機械学習方法。
　前記ステップ（ｂ）では、前記所定条件として、前記系列データのサンプリングレート、またはフレーム数に応じて、前記サイズ調整の条件を設定する、請求項４に記載の機械学習方法。
　さらに、撮影環境に関する外部情報を取得するステップ（ｄ）を含み、
　前記ステップ（ｂ）では、前記所定条件として、前記外部情報に基づいて、前記サイズ調整の条件を設定する、請求項４、または請求項５に記載の機械学習方法。
　前記外部情報は、前記物体の移動速度、前記撮影領域を撮影するカメラのスペックに関する情報である、請求項６に記載の機械学習方法。
　予め定められた条件に基づいて、前記系列データを解析し、系列データを構成する複数のフレームの中から、対象の物体の注目箇所が存在する１つ以上のキーフレームを検出するステップ（ｅ）を、さらに含み、
　前記ステップ（ｂ）では、前記ステップ（ｅ）で検出したキーフレームの中から一つの基準フレームを設定するとともに、前記サイズ調整を、該基準フレームを基準に実行する、請求項４から請求項７のいずれかに記載の機械学習方法。
　前記ステップ（ｂ）では、前記ステップ（ｅ）で検出した前記キーフレームの数に応じて、サイズ調整の条件を設定する、請求項８に記載の機械学習方法。
　前記ステップ（ｂ）では、前記キーフレームのみを対象として、前記サイズ調整の対象とする、請求項８または請求項９に記載の機械学習方法。
　前記ステップ（ｂ）では、前記系列データの並び方向において、前記基準フレームの前後で、前記サイズ調整の方法を異ならせる、請求項８から請求項１０のいずれかに記載の機械学習方法。
　対象の特徴を抽出するための学習モデルを生成する機械学習装置であって、
　系列データを取得する取得部と、
　前記系列データに対して、所定条件に基づいて、系列方向のサイズ調整の前処理を行うことにより、１つの系列データにより、系列方向の間隔が互いに異なる複数の調整後系列データを生成する前処理部と、
　前記前処理部が生成した複数の前記調整後系列データを用いて、教師あり学習し、学習モデルを生成する学習部と、
を備える機械学習装置。
　前記取得部は、前記系列データとともに、該系列データのラベルを取得し、
　前記学習部は、前記系列データの１つの前記ラベルを、前記複数の調整後系列データに適用して、教師あり学習を行う、請求項１２に記載の機械学習装置。
　前記前処理部は、前記所定条件に基づいて、サイズ調整の条件を自動的に設定する、請求項１２、または請求項１３に記載の機械学習装置。
　前記取得部が取得した前記系列データは、撮影領域内の対象の物体を撮影して得られた、時系列の画像データであり、
　前記学習モデルは、対象の物体の特徴を抽出するための学習モデルである、請求項１２から請求項１４のいずれかに記載の機械学習装置。
　前記前処理部は、前記所定条件として、前記系列データのサンプリングレート、またはフレーム数に応じて、前記サイズ調整の条件を設定する、請求項１５に記載の機械学習装置。
　前記取得部は、さらに、撮影環境に関する外部情報を取得し、
　前記前処理部は、前記所定条件として、前記外部情報に基づいて、前記サイズ調整の条件を設定する、請求項１５、または請求項１６に記載の機械学習装置。
　前記外部情報は、前記物体の移動速度、前記撮影領域を撮影するカメラのスペックに関する情報である、請求項１７に記載の機械学習装置。
　予め定められた条件に基づいて、前記系列データを解析し、系列データを構成する複数のフレームの中から、対象の物体の注目箇所が存在する１つ以上のキーフレームを検出する検出部を、さらに含み、
　前記前処理部は、前記検出部が検出したキーフレームの中から一つの基準フレームを設定するとともに、前記サイズ調整を、該基準フレームを基準に実行する、請求項１５から請求項１８のいずれかに記載の機械学習装置。
　前記前処理部は、前記検出部が検出した前記キーフレームの数に応じて、サイズ調整の条件を設定する、請求項１９に記載の機械学習装置。
　前記前処理部は、前記キーフレームのみを対象として、前記サイズ調整の対象とする、請求項１９または請求項２０に記載の機械学習装置。
　前記前処理部は、前記系列データの並び方向において、前記基準フレームの前後で、前記サイズ調整の方法を異ならせる、請求項１９から請求項２１のいずれかに記載の機械学習装置。
　請求項１から請求項１１の何れかに記載の機械学習方法を、コンピューターに実行させるための機械学習プログラム。
　系列データを取得する取得部と、
　請求項１から請求項１１の何れかに記載の機械学習方法で学習した学習モデルを用いて対象の特徴を抽出する抽出部と、
　抽出結果を出力する出力部と、を備える情報処理装置。