JP7249444B1 - 情報処理装置、情報処理方法、プログラム、及び情報処理システム - Google Patents

情報処理装置、情報処理方法、プログラム、及び情報処理システム Download PDF

Info

Publication number
JP7249444B1
JP7249444B1 JP2022020269A JP2022020269A JP7249444B1 JP 7249444 B1 JP7249444 B1 JP 7249444B1 JP 2022020269 A JP2022020269 A JP 2022020269A JP 2022020269 A JP2022020269 A JP 2022020269A JP 7249444 B1 JP7249444 B1 JP 7249444B1
Authority
JP
Japan
Prior art keywords
image data
work
series
worker
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022020269A
Other languages
English (en)
Other versions
JP2023117614A (ja
Inventor
眞人 徳竹
和喜 森屋
聖 佐藤
紀宏 高畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NS Solutions Corp
Original Assignee
NS Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NS Solutions Corp filed Critical NS Solutions Corp
Priority to JP2022020269A priority Critical patent/JP7249444B1/ja
Priority to PCT/JP2022/042033 priority patent/WO2023153036A1/ja
Application granted granted Critical
Publication of JP7249444B1 publication Critical patent/JP7249444B1/ja
Publication of JP2023117614A publication Critical patent/JP2023117614A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B9/00Simulators for teaching or training purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Analysis (AREA)

Abstract

【課題】技能伝承をより好適な態様で支援可能とする。【解決手段】異なるグループに分類された複数の作業者それぞれによる一連の作業の実施状況の動画像の第1の画像データから分割された、当該一連の作業を構成する作業単位に対応する動画像の第2の画像データを利用した機械学習に基づき、共通のグループに属する作業者間において特徴量の差がより小さくなり、異なるグループに属する作業者間において特徴量の差がより大きくなるように、複数の画像データ間の関係性に関する特徴量空間を学習することで第1の学習済モデルを構築し、評価対象となる第1の作業者による一連の作業の実施状況の撮像結果に応じた一連の動画像の前記第1の画像データと、前記第1の学習済モデルと、に基づき当該作業者の当該一連の作業に関する熟練度が評価される、情報処理装置。【選択図】図1

Description

本開示は、情報処理装置、情報処理方法、プログラム、及び情報処理システムに関する。
近年では、技術者の高齢化に伴い、製造業等における熟練者の育成や後継者不足が課題となっている。熟練の技術は、一般的には、熟練者が未熟者に対して直接指導を行うことで当該未熟者に経験を積ませることにより熟練度(換言すると、習熟度)を向上させることで伝承されていくが、このような手法は必ずしも効率が良いとは限らず、技能伝承として十分な効果が認められるとは限らない。また、近年では、対象となる技術者(例えば、未熟者)に技術を効率よく習得させるための仕組みも各種検討されている。例えば、特許文献1には、技術者が効率よく技術を習得できるように支援する学習支援システムの一例が開示されている。
特開2020-144233号公報
上記のように、近年では技能伝承を効率よくより効果的に実現する仕組みの実現が求められており、特に情報処理技術の応用により技能伝承をより効果的に支援可能とする技術の導入が期待されている。
本発明は上記の問題を鑑み、技能伝承をより好適な態様で支援可能とする技術を提案する。
本実施形態に係る情報処理装置は、互いに異なる複数のグループそれぞれに分類された複数の作業者それぞれによる一連の作業の実施状況の撮像結果に応じた一連の動画像の第1の画像データから分割された、当該一連の作業を構成する作業単位それぞれに対応する部分的な動画像の第2の画像データを学習データとした機械学習に基づき、共通のグループに属する作業者間において、共通の作業単位に対応する複数の前記第2の画像データ間の特徴量の差がより小さくなり、それぞれが異なるグループに属する作業者間において、共通の作業単位に対応する複数の前記第2の画像データ間の特徴量の差がより大きくなるように、複数の画像データ間の関係性に関する特徴量空間を学習することで第1の学習済モデルを構築する第1のモデル構築手段と、前記複数のグループそれぞれに分類された前記複数の作業者それぞれに対応する前記第1の画像データから分割された、当該一連の作業を構成する作業単位それぞれに対応する前記第2の画像データに対して、当該作業単位を示す付帯情報を関連付ける関連付け手段と、前記付帯情報が関連付けられた前記第2の画像データを学習データとした機械学習に基づき、入力された画像データが示す動画像に撮像された一連の作業を構成する作業単位を推論する第2の学習済モデルを構築する第2のモデル構築手段と、評価対象となる第1の作業者による一連の作業の実施状況の撮像結果に応じた一連の動画像の前記第1の画像データを前記第2の学習済モデルに入力することで、当該第1の画像データを当該一連の作業を構成する作業単位ごとの前記第2の画像データに分割し、当該第1の画像データから分割された作業単位ごとの当該第2の画像データを前記第1の学習済モデルに入力することで得られる第1の特徴量と、前記複数のグループのうちの所定のグループに属する第2の作業者による当該作業単位に対応する前記第2の画像データを前記第1の学習済モデルに入力することで得られる第2の特徴量と、に基づき、前記第1の作業者が実施した前記一連の作業に関する当該第1の作業者の熟練度を評価する評価手段と、を備える
これにより、例えば、熟練者が未熟者に対して直接指導を行わずとも、当該未熟者自身または作業の管理に係る管理者に対して各種作業の熟練度の評価結果をフィードバックすることで、当該未熟者の当該作業に関する熟練度を向上させる効果を期待することが可能となる。
本発明によれば、技能伝承をより好適な態様で支援することが可能となる。
情報処理システムのシステム構成の一例を示した図である。 情報処理装置のハードウェア構成の一例を示した図である。 情報処理システムの機能構成の一例を示した機能ブロック図である。 モデル構築装置の処理の一例を示した図である。 作業動画を入力単位動画に分割した結果の一例を示した図である。 作業動画に対するラベル付けの結果の一例を示した図である。 モデル構築装置の処理の一例を示した図である。 熟練度評価モデルの構築に係る処理の一例について説明するための図である。 評価装置の処理の一例を示した図である。 作業動画を作業単位動画に分割した結果の一例を示した図である。 評価装置の処理の一例を示した図である。 熟練度に関する評価値の算出方法の一例を示した図である。 熟練度に関する評価値の算出方法の他の一例を示した図である。 一連の作業を対象とした熟練度の評価方法の一例を示した図である。 差異領域の抽出結果に応じた情報の出力方法の一例を示した図である。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
<システム構成>
図1を参照して、本開示の一実施形態に係る情報処理システムのシステム構成の一例について説明する。本実施形態に係る情報処理システム1は、モデル構築装置110と、評価装置150と、1以上の端末装置200と、1以上の撮像装置310とを含む。なお、図1に示す端末装置200a及び200bは、それぞれが端末装置200の一例を示している。以降の説明では、端末装置200a及び200bのそれぞれを特に区別しない場合には、単に端末装置200と称するものとする。また、図1に示す撮像装置310a及び310bは、それぞれが撮像装置310の一例を示している。撮像装置310aは、ユーザU1に装着された状態で使用されるウェアラブルデバイス300(例えば、メガネ型のデバイス等)に支持された撮像装置を模式的に示している。また、撮像装置310bは、ユーザU1を第三者的な視点で撮像するように設置された撮像装置(例えば、所定の位置に設置された撮像装置)を模式的に示している。なお、以降の説明では、撮像装置310a及び310bのそれぞれを特に区別しない場合には、単に撮像装置310と称するものとする。
撮像装置310は、対象となるユーザU1の周囲の状況を撮像し、撮像結果に応じた画像(例えば、静止画像や動画像)のデータを所定の出力先に出力する。
なお、撮像装置310は、対象となるユーザU1の周囲の状況を撮像することが可能であれば、設置される位置や設置方法等は特に限定はされず、当該ユーザU1の行動範囲や、当該ユーザU1が行う作業の特性等に応じて適宜変更されてもよい。
例えば、図1に示す撮像装置310aは、ウェアラブルデバイス300に支持されており、当該ウェアラブルデバイス300がユーザU1に装着された状態で使用される。このような構成とすることで、例えば、ユーザU1が視線を向けている方向を撮像した、所謂一人称視点の画像を得ることが可能となる。
また、他の一例として、図1に示す撮像装置310bは、例えば、所定の位置に設置された状態で使用される。このような構成とすることで、例えば、ユーザU1や当該ユーザU1の周囲の状況を第三者的な視点から撮像することが可能となる。
また、撮像装置310の数は1台に限らず複数台が使用されてもよい。なお、本実施形態では、情報処理システム1の特徴をよりわかりやすくするために、撮像装置310の数は1台であるものとする。
モデル構築装置110と、評価装置150と、端末装置200と、撮像装置310とは、ネットワークN1を介して互いに情報を送受信可能に接続されている。
なお、ネットワークN1の種別は特に限定はされない。具体的な一例として、ネットワークN1は、インターネット、専用線、LAN(Local Area Network)、または、WAN(Wide Area Network)等により構成されていてもよい。また、ネットワークN1は、有線のネットワークにより構成されていてもよいし、5G、LTE(Long Term Evolution)、及びWi-Fi(登録商標)等の通信規格に基づくネットワークのような無線のネットワークにより構成されていてもよい。また、ネットワークN1は、複数のネットワークを含んでもよく、一部のネットワークとして、他のネットワークと異なる種別のネットワークが適用されてもよい。また、上述した各種情報処理装置間の通信が論理的に確立されていればよく、物理的には各種情報処理装置間の通信が他の通信装置等により中継されてもよい。
端末装置200は、ユーザからの入力(例えば、各種指示)の受け付けや、ユーザへの各種情報(例えば、フィードバック等)の提示に係るインタフェースとしての役割を担う。具体的な一例として、端末装置200は、ネットワークを介して後述するモデル構築装置110や評価装置150からデータを受信し、当該データに基づく情報を、所定の出力装置(例えば、ディスプレイ等)を介してユーザに提示してもよい。また、端末装置200は、所定の入力装置(例えば、タッチパネル等)を介してユーザから受け付けた操作に基づき、当該ユーザからの指示を認識し、ネットワークを介して当該指示に応じた情報をモデル構築装置110や評価装置150に送信してもよい。これにより、モデル構築装置110や評価装置150は、ユーザからの指示を認識し、当該指示に応じた処理を実行することが可能となる。
端末装置200は、例えば、所謂スマートフォン、タブレット端末、及びPC(Personal Computer)等のような通信機能を有する情報処理装置により実現され得る。
モデル構築装置110及び評価装置150のそれぞれは、所謂サーバ装置により実現され、評価対象となる作業者の所定の作業に関する熟練度の評価に係る各種機能を提供する。なお、熟練度評価の対象については、作業の特性、分析の対象、及び評価の基準等に応じて適宜設定され得る。具体的な一例として、作業の安全性(自己安全確保、他者安全確保等)、作業スピード、作業品質(製品加工精度、選別精度等)が熟練度評価の対象として設定され得る。
モデル構築装置110は、所謂機械学習に基づき認識器や識別器等のような所謂学習済モデルの構築に係る各種処理を実行する。
具体的には、本実施形態に係るモデル構築装置110は、一連の作業の実施状況の撮像結果に応じた動画像を、当該一連の作業を構成する個々の作業(以下、作業単位とも称する)それぞれに対応する部分的な動画像に分割するために使用される学習済モデルの構築に係る処理を実行する。以降では、当該学習済モデルを、便宜上「作業動画分割モデル」とも称する。作業動画分割モデルは、所望の作業の実施状況の撮像結果に応じた動画像の画像データを入力することで、当該動画像に撮像されたシーンがいずれの作業単位の実施状況を示しているかを推論し、当該推論の結果に応じた情報を出力する学習済モデルである。当該作業動画分割モデルが、「第2の学習済モデル」の一例に相当する。
また、モデル構築装置110は、評価対象となる作業者による作業の熟練度の評価に使用される学習済モデルの構築に係る処理を実行する。以降では、当該学習済モデルを、便宜上「熟練度評価モデル」とも称する。熟練度評価モデルは、各作業者による作業の実施状況の撮像結果に応じた動画像の画像データ間の関係性に関する特徴量空間の学習結果に基づき構築される。このような熟練度評価モデルを利用することで、例えば、評価対象となる作業者がどのようなグループの作業者(例えば、熟練者や未熟者等)に属するかの評価や、異なる複数の作業者間における作業の実施状況の差の評価(例えば、定量的な評価)が可能となる。当該熟練度評価モデルが、「第1の学習済モデル」の一例に相当する。また、評価対象となる作業者が「第1の作業者」の一例に相当する。
なお、作業動画分割モデル及び熟練度評価モデルの特性や、モデル構築装置110によるこれらのモデルの構築に係る処理については、詳細を別途後述する。
評価装置150は、モデル構築装置110により構築された学習済モデルを利用して各種の判定や評価を行う。
具体的には、本実施形態に係る評価装置150は、評価対象となる作業者による一連の作業の実施状況の撮像結果に応じた動画像の画像データを取得し、当該画像データと熟練度評価モデルとを利用して、当該作業者の当該作業の熟練度を評価する。また、この際に、評価装置150は、取得した画像データに対応する動画像を、当該動画像に撮像された一連の作業を構成する作業単位ごとの部分的な動画像に分割したうえで、分割された当該動画像の画像データに基づき作業単位ごとの熟練度を評価してもよい。また、評価装置150は、取得した画像データが示す動画像を作業単位ごとの部分的な動画像に分割する際に、作業動画分割モデルを利用してもよい。
なお、評価装置150の処理については、詳細を別途後述する。
なお、図1に示す構成はあくまで一例であり、必ずしも本実施形態に係る情報処理システム1のシステム構成を限定するものではない。具体的な一例として、モデル構築装置110と評価装置150とが一体的に構成されていてもよい。また、モデル構築装置110や評価装置150が端末装置200の役割を担ってもよい。すなわち、モデル構築装置110や評価装置150に相当するサーバ装置が、ユーザから各種情報の入力を受け付けてもよく、ユーザに対して各種情報の提示を行ってもよい。また、モデル構築装置110と評価装置150に相当する構成要素が、複数の装置が協働することで実現されてもよい。具体的な一例として、モデル構築装置110と評価装置150に相当する構成要素が、所謂クラウドサービスとして実現されてもよい。この場合には、当該クラウドサービスが、複数のサーバ装置が協働することにより実現されてもよい。
<ハードウェア構成>
図2を参照して、図1に示した本実施形態に係る情報処理システム1を構成する各種装置(例えば、モデル構築装置110、評価装置150、端末装置200、及びウェアラブルデバイス300等)として適用可能な情報処理装置900のハードウェア構成の一例について説明する。情報処理装置900は、CPU(Central Processing Unit)910と、ROM(Read Only Memory)920と、RAM(Random Access Memory)930と、補助記憶装置940と、ネットワークI/F970とを含む。また、情報処理装置900は、出力装置950と、入力装置960とのうち少なくともいずれかを含んでもよい。CPU910と、ROM920と、RAM930と、補助記憶装置940と、出力装置950と、入力装置960と、ネットワークI/F970とは、バス980を介して相互に接続されている。
CPU910は、情報処理装置900の各種動作を制御する中央演算装置である。例えば、CPU910は、情報処理装置900全体の動作を制御してもよい。ROM920は、CPU910で実行可能な制御プログラムやブートプログラムなどを記憶する。RAM930は、CPU910の主記憶メモリであり、ワークエリア又は各種プログラムを展開するための一時記憶領域として用いられる。
補助記憶装置940は、各種データや各種プログラムを記憶する。補助記憶装置940は、HDD(Hard Disk Drive)や、SSD(Solid State Drive)に代表される不揮発性メモリ等のような、各種データを一時的または持続的に記憶可能な記憶デバイスにより実現される。
出力装置950は、各種情報を出力する装置であり、ユーザに対する各種情報の提示に利用される。例えば、出力装置950は、ディスプレイ等の表示デバイスにより実現され、各種表示情報を表示させることで、ユーザに対して情報を提示してもよい。また、他の一例として、出力装置950は、音声や電子音等の音を出力する音響出力デバイスにより実現され、音声や電信等の音を出力することで、ユーザに対して情報を提示してもよい。このように、出力装置950として適用されるデバイスは、ユーザに対して情報を提示するために利用する媒体に応じて適宜変更されてもよい。なお、出力装置950が、各種情報の提示に利用される「出力部」の一例に相当する。
入力装置960は、ユーザからの各種指示の受け付けに利用される。例えば、入力装置960は、マウス、キーボード、タッチパネル等の入力デバイスを含んでもよい。また、他の一例として、入力装置960は、マイクロフォン等の集音デバイスを含み、ユーザが発話した音声を集音してもよい。この場合には、集音された音声に対して音響解析や自然言語処理等の各種解析処理が施されることで、この音声が示す内容がユーザからの指示として認識されてもよい。このように、入力装置960として適用されるデバイスは、ユーザからの指示を認識する方法に応じて適宜変更されてもよい。また、入力装置960として複数種類のデバイスが適用されてもよい。
ネットワークI/F970は、外部の装置とのネットワークを介した通信に利用される。なお、ネットワークI/F970として適用されるデバイスは、通信経路の種別や適用される通信方式に応じて適宜変更されてもよい。
情報処理装置900のプログラムは、例えば、CD-ROM等の記録媒体によって情報処理装置900に提供されるか、またはネットワーク等を介してダウンロードされてもよい。記録媒体によって情報処理装置900のプログラムが提供される場合には、記録媒体が所定のドライブ装置にセットされることで、当該記録媒体に記録されたプログラムが補助記憶装置940にインストールされる。
また、図2に示す構成はあくまで一例であり、必ずしも本実施形態に係る情報処理システム1を構成する情報処理装置のハードウェア構成を限定するものではない。具体的な一例として、入力装置960や出力装置950等のような一部の構成が含まれていなくてもよい。また、他の一例として、情報処理装置900が実現する機能に応じた構成が適宜追加されてもよい。
以上、図2を参照して、図1に示した本実施形態に係る情報処理システム1を構成する各種装置として適用可能な情報処理装置900のハードウェア構成の一例について説明した。
<機能構成>
図3を参照して、本実施形態に係る情報処理システム1の機能構成の一例について、特にモデル構築装置110及び評価装置150の構成に着目して説明する。
まず、モデル構築装置110の構成について説明する。モデル構築装置110は、通信部111と、入出力制御部112と、モデル構築部113と、記憶部117とを含む。
通信部111は、モデル構築装置110の各構成要素が、他の装置(例えば、端末装置200、撮像装置310、及び評価装置150等)とネットワークN1を介して情報を送受信するための通信インタフェースである。通信部111は、例えば、ネットワークI/F970により実現され得る。なお、以降の説明では、モデル構築装置110の各構成要素が他の装置との間で情報の送受信を行う場合には、特に説明がない限りは、通信部111を介して当該情報の送受信が行われるものとする。
記憶部117は、各種データや各種プログラム等を記憶するための記憶領域を模式的に示している。例えば、記憶部117は、モデル構築装置110の各構成要素が処理を実行するためのデータやプログラムを記憶してもよい。
また、記憶部117は、各種学習済モデル(例えば、作業動画分割モデルや熟練度評価モデル等)の構築に使用されるデータ(例えば、教師データ)を記憶してもよい。また、記憶部117は、各種学習済モデルの構築の過程において生成されるデータ等を記憶してもよいし、構築された各種学習済モデルのデータを記憶してもよい。
入出力制御部112は、ユーザ(例えば、管理者)に対する各種情報の提示や、ユーザからの情報の入力(例えば、指示等)の受け付けに係る各種処理を実行する。例えば、入出力制御部112は、端末装置200を介した所定のUI(User Interface)の提示に係る処理や、当該UIを介した入力の受け付けに係る処理を実行してもよい。これにより、モデル構築装置110は、ユーザからの指示を認識し、当該指示に応じた処理の結果を当該ユーザに提示することが可能となる。
モデル構築部113は、前述した作業動画分割モデルや熟練度評価モデル等のような学習済モデルの構築に係る処理を実行する。モデル構築部113は、ラベル付処理部114と、作業動画分割モデル構築部115と、熟練度評価モデル構築部116とを含む。
ラベル付処理部114は、対象となるデータ(たとえば、動画像の画像データ)に対して、当該データが示す情報を付帯情報として関連付ける。換言すると、ラベル付処理部114は、対象となるデータに対して当該データを示す情報のラベル付けを行う。
具体的な一例として、ラベル付処理部114は、作業の実施状況の撮像結果に応じた動画像の画像データに対して、当該作業を示す情報(例えば、作業単位を示す情報)を付帯情報として関連付けてもよい。この際に、ラベル付処理部114は、管理者からの指示に応じて、対象となる画像データに対して、指定されたラベル(例えば、作業単位を示す情報)を関連付けてもよい。
ラベル付処理部114により付帯情報が関連付けられたデータ(すなわち、ラベル付けが行われたデータ)は、例えば、学習済モデルの構築に係る教師データとして使用される。
作業動画分割モデル構築部115は、被写体として撮像された作業者が実施している作業を示す情報のラベル付けが行われた動画像の画像データを教師データとした教師ありの機械学習に基づく、作業動画分割モデルの構築に係る処理を実行する。
具体的には、作業動画分割モデル構築部115は、作業動画分割モデルに対して動画像の画像データを入力することで当該作業動画分割モデルから推論の結果として出力される情報と、ラベル付処理部114による当該画像データに対するラベル付けの結果とを比較する。そのうえで、作業動画分割モデル構築部115は、作業動画分割モデルから推論の結果として出力される上記情報が、ラベル付処理部114による上記ラベル付の結果により近づくように、当該作業動画分割モデルのパラメータ(例えば、作業単位の推論に係るパラメータ)を更新する。
作業動画分割モデル構築部115により構築された作業動画分割モデルは、後述する評価装置150による動画像の画像データの分割に使用される。
なお、作業動画分割モデル構築部115により構築された作業動画分割モデルを評価装置150が参照可能であれば、当該作業動画分割モデルのデータが配置される位置や、当該作業動画分割モデルの組み込み方法等は特に限定はされない。
具体的な一例として、作業動画分割モデル構築部115により構築された作業動画分割モデルのデータが、ネットワークN1を介して評価装置150に送信され、当該評価装置150の記憶部157に記憶されてもよい。また、他の一例として、モデル構築装置110に外付け可能な記録媒体に作業動画分割モデルのデータを記憶させることで、当該記録媒体を利用して評価装置150の記憶部157に当該作業動画分割モデルのデータが記憶されてもよい。これにより、評価装置150は、記憶部157にデータとして記憶された作業動画分割モデルを参照することが可能となる。
また、他の一例として、評価装置150が、他の装置の記憶領域にデータとして記憶された作業動画分割モデルを、ネットワークN1を介して当該他の装置にアクセスすることで参照してもよい。この場合には、作業動画分割モデルのデータは、モデル構築装置110(評価装置150とは異なる他の装置の一例に相当)の記憶部117に記憶されてもよいし、ネットワークストレージやデータベースシステム等として構成された他の装置の記憶領域に記憶されてもよい。
また、上記作業動画分割モデルは、後述する熟練度評価モデル構築部116による熟練度評価モデルの構築時に、対象となる動画像の画像データの分割に使用されてもよい。
熟練度評価モデル構築部116は、メトリックラーニング(Metric Learning)とも称される機械学習に基づく、熟練度評価モデルの構築に係る処理を実行する。具体的には、熟練度評価モデルは、各作業者による作業(作業単位)の実施状況の撮像結果に応じた動画像の画像データを学習データとした、複数の当該画像データ間の関係性に関する特徴量空間の学習結果に基づき構築される。
この際に、熟練度評価モデル構築部116は、共通のグループに属する作業者間においては、共通の作業単位に対応する複数の画像データ間の特徴量の差がより小さくなるように、熟練度評価モデルの構築を行う。また、熟練度評価モデル構築部116は、それぞれが異なるグループに属する作業者間においては、共通の作業単位に対応する複数の画像データ間の特徴量の差がより大きくなるように、上記熟練度評価モデルの構築を行う。
これにより、例えば、熟練者に相当する複数の作業者それぞれによる共通の作業の実施状況の撮像結果に応じた複数の画像データ間においては、各画像データを入力として熟練度評価モデルから出力される特徴量(換言すると、特徴量ベクトル)の差がより小さくなる。また、共通の作業者による共通の作業の実施状況の撮像結果に応じた複数の画像データ間においても、各画像データを入力として熟練度評価モデルから出力される特徴量の差がより小さくなる。
これに対して、熟練者と未熟者とのように互いに異なるグループに属する複数の作業者それぞれによる共通の作業の実施状況の撮像結果に応じた複数の画像データ間においては、各画像データを入力として熟練度評価モデルから出力される特徴量の差がより大きくなる。
熟練度評価モデル構築部116により構築された熟練度評価モデルは、後述する評価装置150による評価対象となる作業者の各種作業に関する熟練度の評価に利用される。
なお、熟練度評価モデル構築部116により構築された熟練度評価モデルを評価装置150が参照可能であれば、当該作熟練度評価モデルのデータが配置される位置や、当該作業動画分割モデルの組み込み方法等は特に限定はされない。これは、前述した作業動画分割モデルの場合と同様のため詳細な説明は省略する。
次いで、評価装置150の構成について説明する。評価装置150は、通信部151と、入出力制御部152と、分割処理部153と、評価処理部154と、寄与率算出部155と、画像処理部156と、記憶部157とを含む。
通信部151は、評価装置150の各構成要素が、他の装置(例えば、端末装置200、撮像装置310、及びモデル構築装置110等)とネットワークN1を介して情報を送受信するための通信インタフェースである。通信部111は、例えば、ネットワークI/F970により実現され得る。なお、以降の説明では、評価装置150の各構成要素が他の装置との間で情報の送受信を行う場合には、特に説明がない限りは、通信部151を介して当該情報の送受信が行われるものとする。
記憶部157は、各種データや各種プログラム等を記憶するための記憶領域を模式的に示している。例えば、記憶部157は、評価装置150の各構成要素が処理を実行するためのデータやプログラムを記憶してもよい。
また、記憶部157は、撮像装置310による撮像結果に応じた動画像の画像データを記憶してもよい。また、記憶部157は、モデル構築装置110により機械学習に基づき構築された学習済モデル(例えば、作業動画分割モデルや熟練度評価モデル等)のデータを記憶してもよい。また、記憶部117は、評価対象となる作業者の作業の熟練度の評価の過程で生成されるデータ等を記憶してもよいし、当該評価の結果に応じた情報等を記憶してもよい。
入出力制御部152は、ユーザ(例えば、管理者)に対する各種情報の提示や、ユーザからの情報の入力(例えば、指示等)の受け付けに係る各種処理を実行する。例えば、入出力制御部152は、端末装置200を介した所定のUI(User Interface)の提示に係る処理や、当該UIを介した入力の受け付けに係る処理を実行してもよい。これにより、評価装置150は、ユーザからの指示を認識し、当該指示に応じた処理の結果を当該ユーザに提示することが可能となる。
分割処理部153は、一連の作業の実施状況の撮像結果に応じた動画像の画像データを、当該一連の作業を構成する作業単位ごとの画像データに分割する。この際に、分割処理部153は、前述した作業動画分割モデル構築部115により構築された作業動画分割モデルを、一連の作業の実施状況の撮像結果に応じた動画像の画像データの分割に利用してもよい。以上のようにして動画像の画像データの分割が行われることで、例えば、一連の作業の実施状況の撮像結果に応じた動画像の画像データのうち、所望の作業単位の実施状況に対応する動画像の画像データを抽出することも可能となる。なお、一連の作業(例えば、1以上の作業単位を含む一連の作業)の実施状況の撮像結果に応じた動画像の画像データが「第1の画像データ」の一例に相当し、当該第1の画像データから分割された作業単位ごとの画像データが「第2の画像データ」の一例に相当する。
評価処理部154は、評価対象となる作業者による一連の作業の実施状況の撮像結果に応じた動画像の画像データと、前述した熟練度評価モデル構築部116により構築された熟練度評価モデルとに基づき、当該作業者の当該一連の作業に関する熟練度の評価を行う。
具体的な一例として、評価処理部154は、評価対象となる作業者と、評価の基準となる作業者(例えば、熟練者)との間で、それぞれに対応する画像データの特徴量の特徴量空間における位置関係に基づき、評価対象となる作業者の一連の作業に関する熟練度の評価を行ってもよい。
また、他の一例として、評価処理部154は、評価対象となる作業者に対応する画像データの特徴量が、特徴量空間中においてどのグループに属する作業者に対応する特徴量により近いかに応じて、評価対象となる作業者の一連の作業に関する熟練度の評価を行ってもよい。
また、評価処理部154は、作業単位ごとに評価対象となる作業者の熟練度を評価してもよいし、一連の作業単位それぞれの評価結果に基づき当該一連の作業単位を含む一連の作業全体について評価対象となる作業者の熟練度を評価してもよい。
なお、評価処理部154による評価対象となる作業者の一連の作業に関する熟練度の評価に係る処理の一例については、詳細を別途後述する。
寄与率算出部155は、評価処理部154による上記熟練度の評価に際して、当該評価に使用された画像データが示す画像(例えば、動画像中の少なくとも一部のフレームに対応する静止画像)中の各領域における当該評価への寄与率(特に、同評価の要因となった熟練度評価モデルの出力への寄与率)を算出する。
具体的な一例として、未熟者を評価対象となる作業者とし、熟練者を評価基準とする作業者としたうえで、未熟者が未熟であると評価された場合における、当該評価への寄与率が算出されるものとする。この場合には、例えば、寄与率算出部155は、未熟者と熟練者との間で動きの異なる部分(例えば、静止画像中において異なるビット値を示す部分)が上記評価により寄与しているとの判定に基づき、対象となる画像の各部における寄与率を算出してもよい。
また、他の一例として、未熟者を評価対象となる作業者とし、熟練者を評価基準とする作業者としたうえで、未熟者が熟練していると評価された場合における、当該評価への寄与率が算出されるものとする。この場合には、例えば、寄与率算出部155は、未熟者と熟練者との間で動きがより類似する部分(例えば、静止画像中においてより近似するビット値を示す部分)が上記評価により寄与しているとの判定に基づき、対象となる画像の各部における寄与率を算出してもよい。
なお、上述のような寄与率の評価については、例えば、GradCAM(Gradient-weighted Class Activation Mapping)と称される技術のように、公知の技術を利用することが可能である。
画像処理部156は、対象となる画像に対して各種の画像処理を施す。例えば、画像処理部156は、寄与率算出部155が処理の対象とした画像に対して、当該寄与率算出部155による寄与率の算出結果に応じた情報を重畳させてもよい。より具体的な一例として、画像処理部156は、寄与率算出部155による寄与率の算出元となった画像中の領域に対して、当該寄与率の算出結果が識別可能に重畳表示されるように、当該画像に対して画像処理を施してもよい。
そして、画像処理部156は、画像処理の結果に応じた情報を所定の出力先に出力する。例えば、画像処理部156は、画像処理後の画像を入出力制御部152に出力してもよい。これにより、入出力制御部152は、画像処理後の画像をUI上の所定の領域に表示させることで、当該画像をユーザ(例えば、管理者)に提示することも可能となる。
なお、上述した構成はあくまで一例であり、情報処理システム1の機能構成(特に、モデル構築装置110や評価装置150の機能構成)を必ずしも図3に示す例には限定されない。
例えば、モデル構築装置110の一連の構成要素が、複数の装置が協働することで実現されてもよい。具体的な一例として、モデル構築装置110の一連の構成要素のうち、一部の構成要素が当該モデル構築装置110に対して外付けされていてもよい。また、他の一例として、モデル構築装置110の一連の構成要素のうち、少なくとも一部の構成要素の処理に係る負荷が、複数の装置に分散されてもよい。これらは、評価装置150についても同様である。
また、他の一例として、モデル構築装置110と評価装置150とが一体的に構成されていてもよい。すなわち、モデル構築装置110及び評価装置150それぞれの一連の構成要素が、共通のサーバ装置の構成要素として実現されてもよい。
以上、図3を参照して、本実施形態に係る情報処理システム1の機能構成の一例について、特にモデル構築装置110及び評価装置150の構成に着目して説明した。
<処理>
本実施形態に係る情報処理システムの処理の一例について、モデル構築装置110により実行される学習済モデルの構築に係る前処理段階と、評価装置150により実行される構築された学習済モデルを利用した評価に係る本処理段階とに分けてそれぞれ説明する。
(前処理段階)
前処理段階における処理の一例として、作業動画分割モデルの構築に係る処理と、熟練度評価モデルの構築に係る処理とのそれぞれについて個別に説明する。
まず、図4を参照して、モデル構築装置110による作業動画分割モデルの構築に係る処理の一例について説明する。図4は、モデル構築装置110による作業動画分割モデルの構築に係る処理の一例を示した図である。
S101において、モデル構築装置110は、作業動画分割モデルの構築に利用される画像データ(所謂サンプルデータ)が示す動画像を、時系列に沿って所定の期間ごと(例えば、固定フレーム数ごと)の部分的な動画像に分割し、当該部分的な動画像ごとの画像データを生成する。なお、以降の説明では、便宜上、分割前の動画像を「作業動画」とも称し、作業動画から分割された所定の期間ごとの部分的な動画像を「入力単位動画」とも称する。例えば、図5は、作業動画を入力単位動画に分割した場合の一例を示している。また、図4に示すD102は、S101において作業動画から分割された一連の入力単位動画それぞれの画像データを示している。
S103において、モデル構築装置110は、S101において作業動画から分割された一連の入力単位動画それぞれの画像データD102を作業動画分割モデルに入力する。これにより、作業動画分割モデルにより、作業動画から分割された一連の入力単位動画それぞれの画像データD102について、当該入力単位動画に撮像されたシーンがいずれの作業単位の実施状況を示しているかの推論結果を示す情報が出力される。この際に、作業動画分割モデルは、入力単位動画を構成するフレームごとに、当該フレームに撮像されたシーンがいずれの作業単位の実施状況を示しているかの推論結果を示す情報を出力してもよい。このように、フレームごとに推論結果が出力されることで、熟練度の評価に係る精度をより向上させる効果が期待できる。具体的な一例として、1つの入力単位動画において、複数の作業のシーンが撮像されている場合において、フレームごとに推論結果が出力されることで、当該複数の作業それぞれに対して推論結果を得ることが可能となる。このような場合には、入力単位動画ごとに推論結果が出力される場合に比べて、より詳細に熟練度の評価を行うことが可能となる。D104は、作業動画分割モデルによる推論結果に応じた情報、すなわち、入力単位動画に対する当該入力単位動画に撮像されたシーンが示す作業単位の推論結果に応じた情報がラベル付けされた、当該入力単位動画の画像データを模式的に示している。
また、S103の処理とは別に、モデル構築装置110は、作業動画分割モデルに入力された画像データに対して、当該画像データが示す入力単位動画に撮像されたシーンがいずれの作業単位の実施状況を示しているかの正解を示す情報(以下、正解情報とも称する)をラベル付けする。当該ラベル付けの処理、換言すると、入力単位動画の画像データに対するアノテーションの付与に係る処理については、例えば、管理者からの指示に基づき行われる。D105は、正解情報のラベル付けが行われた上記入力単位動画の画像データを模式的に示している。また、正解情報がラベル付けされた上記入力単位動画の画像データD105が、作業動画分割モデルの構築に係る教師あり学習の教師データの一例に相当する。
ここで、図6を参照して、作業動画(すなわち、一連の入力単位動画)に対するラベル付けの結果の一例について、具体的な例を挙げて説明する。図6は、入力単位動画の分割元となる作業動画に対するラベル付けの結果(アノテーションの付与結果)の一例を示している。図6に示す例では、PC(Personal Computer)の組み立てに係る一連の作業の作業動画に対するラベル付けの処理の結果の一例を示している。具体的には、PCの組み立てに係る一連の作業には、作業単位として「ボード取付」、「CPU取付」、「メモリ取付」、及び「SATAケーブル接続」の作業が含まれている。なお、図6に示す例のように、同様の作業が行われている状況下においても、作業動画の長さや作業単位動画の長さは、動画像ごとに異なる場合がある。
ここで、改めて図4を参照する。S106において、モデル構築装置110は、作業動画分割モデルによる推論結果がラベル付けされた入力単位動画の画像データD104と、正解情報がラベル付けされた画像データD105とに基づき、当該正解情報に対する当該作業動画分割モデルによる推論のずれを算出する。具体的な一例として、モデル構築装置110は、画像データD104及びD105に対して所謂損失関数を適用することで、正解情報に対する作業動画分割モデルによる推論結果のずれの大きさ(すなわち、Loss:損失)を算出してもよい。
S107において、モデル構築装置110は、S106において算出した正解情報に対する作業動画分割モデルによる推論結果のずれに基づき、当該作業動画分割モデルを更新する。具体的には、モデル構築装置110は、作業動画分割モデルによる推論結果が正解情報により近づくように、当該作業動画分割モデルのパラメータ(すなわち、作業単位の推論に係るパラメータ)を更新する。
S108において、モデル構築装置110は、終了条件を満たしたか否かを判定する。具体的な一例として、モデル構築装置110は、一連の入力単位動画の画像データ(例えば、S101にて作業動画から分割された一連の入力単位動画それぞれの画像データ)を、S103~S107の処理の対象とした場合に、終了条件を満たしたと判定してもよい。
モデル構築装置110は、S108において終了条件を満たしていないと判定した場合には、処理をS103に進める。この場合には、モデル構築装置110は、まだ処理対象となっていない入力単位動画の画像データD102について、S103~S107の処理を実行する。
そして、モデル構築装置110は、S108において終了条件を満たしたと判定した場合には、図4に示す一連の処理を終了する。
次いで、図7を参照して、モデル構築装置110による熟練度評価モデルの構築に係る処理の一例について説明する。図7は、モデル構築装置110による熟練度評価モデルの構築に係る処理の一例を示した図である。
S201において、モデル構築装置110は、熟練度評価モデルの構築に利用される一連の画像データ(所謂サンプルデータ)それぞれが示す作業動画から、作業単位動画を抽出することで、当該作業単位動画に対応する画像データを生成する。なお、図7に示す例では、M個の画像データを対象として、当該M個の画像データそれぞれが示す作業動画から作業単位動画が個別に抽出されたものとする。D202は、M個の画像データそれぞれが示す作業動画から抽出された作業単位動画の画像データを模式的に示している。すなわち、図7に示す例の場合には、所望の作業単位に着目した場合に、M個の画像データそれぞれが示す作業動画から当該作業単位に対応する作業単位動画が抽出されることとなる。そこで、以降では、M個の画像データ1~Mそれぞれが示す作業動画から抽出された作業単位動画を、便宜上、作業単位動画1~Mとも称する。すなわち、作業単位動画Mは、画像データMが示す作業動画から抽出された作業単位動画を示すものとする。
なお、作業動画の画像データからの作業単位動画の画像データの抽出が可能であればその方法は特に限定はされない。具体的な一例として、ユーザからの指示に応じて所望の画像データが示す作業動画からの作業単位動画の抽出が行われることで、当該作業単位動画の画像データが生成されてもよい。また、他の一例として、図4に示す処理により構築された作業動画分割モデルを利用して作業動画の画像データを作業単位動画の画像データに分割した結果を利用することで、所望の作業単位に対応する作業単位動画の画像データの抽出が行われてもよい。
S203において、モデル構築装置110は、共通の作業単位に対応する作業単位動画1~Mを対象として、各作業単位動画から熟練度評価モデルに入力するフレームを抽出する。この際に、モデル構築装置110は、作業単位動画1~M間において熟練度評価モデルへの入力次元(換言すると、フレーム数)が固定されるように、作業単位動画1~Mのそれぞれから所定数のフレームを抽出してもよい。この場合には、モデル構築装置110は、作業単位動画1~Mのそれぞれから所定数のフレームを抽出するために、抽出対象とするフレームの間隔を制御してもよい。
具体的には、作業単位動画1~Mのそれぞれは、必ずしもフレーム数(換言すると、動画像の長さ)が同じとは限らない。そのため、モデル構築装置110は、例えば、フレーム数が多い作業単位動画ほど、抽出対象とするフレーム間の間隔がより広くなるように制御することで、作業単位動画1~Mのそれぞれから同数のフレームを抽出してもよい。より具体的な一例として、各作業単位動画から10フレームが抽出されるものとする。この場合には、抽出対象となる作業単位動画の総フレーム数が30の場合には、モデル構築装置110は、3フレームごとにフレームを抽出することで、計10フレームを抽出してもよい。また、他の一例として、抽出対象となる作業単位動画の総フレーム数が20の場合には、モデル構築装置110は、2フレームごとにフレームを抽出することで、計10フレームを抽出してもよい。
S204において、モデル構築装置110は、作業単位動画1~Mそれぞれから抽出した一連のフレームに対応する画像データを熟練度評価モデルに入力する。これにより、当該熟練度評価モデルからは、作業単位動画1~Mそれぞれについて、当該作業単位動画の特徴量に応じた特徴量空間における位置を示す情報(以下、特徴量ベクトルD205とも称する)が出力される。
S206において、モデル構築装置110は、作業単位動画1~Mそれぞれについて熟練度評価モデルから出力された特徴量ベクトルD205それぞれの間の差分を算出する。具体的な一例として、モデル構築装置110は、所謂損失関数を利用することで、作業単位動画1~Mそれぞれに対応する特徴量ベクトルD205間のずれの大きさ(損失)を上記差分として算出してもよい。
S207において、モデル構築装置110は、S206において算出した作業単位動画1~Mそれぞれに対応する特徴量ベクトルD205間の差分に基づき、S204において特徴量ベクトルD205の導出に利用した熟練度評価モデルを更新する。具体的には、前述したように、モデル構築装置110は、メトリックラーニングとも称される機械学習に基づき、共通のグループに属する作業者間において特徴量ベクトルD205間の差がより小さくなり、異なるグループに属する作業者間において特徴量ベクトルD205間の差がより大きくなるように熟練度評価モデルを更新する。
例えば、図8は、熟練度評価モデルの構築に係る処理の一例について説明するための説明図である。図8において、同様の形状のマーカは、同じグループに属するサンプルから抽出された特徴量に応じた特徴量空間中の位置(例えば、同じグループに属する作業者に対応する特徴量ベクトルD205)を模式的に示している。また、左側の図は、メトリックラーニングによる学習が行われる前の入力データの特徴量空間の状態を模式的に示している。また、右側の図は、メトリックラーニングによる学習が行われた後の特徴量空間の状態を模式的に示している。
図8の左側の図に示すように、学習前においては、特徴量空間中における各サンプルの位置が、当該サンプルが属するグループに関わらず無作為に散らばっている。これに対して、図8の右側の図に示すように、学習後においては、同じグループに属するサンプルが、特徴量空間中においてより近傍に位置し、互いに異なるグループに属するサンプルがより離間するように位置している。
このように、モデル構築装置110は、共通のグループに属するサンプル間において特徴量ベクトル間の差がより小さくなり、異なるグループに属するサンプル間において特徴量ベクトルの差がより大きくなるように特徴量空間を学習することで、熟練度評価モデルを更新する。なお、上記に例示したような、熟練度評価モデルの更新については、例えば、確率的勾配降下法と称される手法を適用することが可能である。
ここで、改めて図7を参照する。S208において、モデル構築装置110は、終了条件を満たしたか否かを判定する。具体的な一例として、モデル構築装置110は、対象となる画像データ(サンプルデータ)が示す作業動画から抽出された一連の作業単位動画を、S203~S207の処理の対象とした場合に、終了条件を満たしたと判定してもよい。
モデル構築装置110は、S208において終了条件を満たしていないと判定した場合には、処理をS203に進める。この場合には、モデル構築装置110は、まだ処理対象となっていない入力単位動画の画像データD102について、S203~S207の処理を実行する。
そして、モデル構築装置110は、S208において終了条件を満たしたと判定した場合には、図7に示す一連の処理を終了する。
以上、図4~図8を参照して、前処理段階における処理の一例として、作業動画分割モデルの構築に係る処理と、熟練度評価モデルの構築に係る処理とのそれぞれについて個別に説明した。
(後処理段階)
後処理段階における処理の一例として、作業動画分割モデルを利用した作業動画からの作業単位動画の分割に係る処理と、熟練度評価モデルを利用した作業者の熟練度の評価に係る処理とのそれぞれについて個別に説明する。
まず、図9を参照して、評価装置150による作業動画分割モデルを利用した作業動画からの作業単位動画の分割に係る処理の一例について説明する。図9は、評価装置150による作業動画分割モデルを利用した作業動画からの作業単位動画の分割に係る処理の一例を示した図である。
評価装置150は、処理対象となる画像データD301を取得し、S302において、当該画像データD301が示す作業動画を所定の期間(例えば、所定のフレーム数)ごとの入力単位動画に分割する。D303は、S302において作業動画から分割された一連の入力単位動画それぞれの画像データを示している。
S304において、評価装置150は、S302において作業動画から分割された一連の入力単位動画それぞれの画像データD303を順次抽出して作業動画分割モデルに入力する。これにより、作業動画分割モデルにより、画像データD301が示す作業動画から分割された一連の入力単位動画それぞれの画像データD303について、当該入力単位動画に撮像されたシーンがいずれの作業単位の実施状況を示しているかの推論結果を示す情報が出力される。D305は、作業動画分割モデルによる推論結果に応じた情報、すなわち、入力単位動画に対する当該入力単位動画に撮像されたシーンが示す作業単位の推論結果に応じた情報がラベル付けされた、当該入力単位動画の画像データを模式的に示している。
これにより、共通の作業単位を示す情報がラベル付けされた一連の入力単位動画を時系列に沿ってまとめることで、当該作業単位に対応する作業単位動画を生成することが可能となる。
例えば、図10は、作業動画分割モデルを利用した作業動画からの作業単位動画の分割に係る処理の結果の一例を示した図であり、PCの組み立てに係る一連の作業の実施状況の撮像結果に応じた作業動画の画像データを対象とした場合における処理結果の一例について示している。
作業動画を入力単位動画に分割したうえで、分割後の一連の入力単位動画それぞれの画像データを作業動画分割モデルに入力することで、作業単位に対応する入力単位動画の画像データについて当該作業単位の推論結果を示す情報が出力される。
図10に示す例では、分割後の一連の入力単位動画のうち、PCの組み立て作業の作業単位である「ボード取付」、「CPU取付」、及び「メモリ取付」の作業状況が撮像された入力単位動画を対象として、対応する作業単位を示す情報が推論結果として出力されている。また、図10に示す例では、時系列に沿って連続する2つの入力単位動画に対して、当該入力単位動画に撮像されたシーンが、「ボード取付」の作業状況を示しているとの推論結果が出力されている。そのため、この場合には、当該2つの入力単位動画を時系列に沿ってまとめた動画像が、「ボード取付」に対応する作業単位動画となる。これは、「メモリ取付」として示された作業単位についても同様である。
以上のようにして、PCの組み立てに係る一連の作業の実施状況の撮像結果に応じた作業動画の画像データから、「ボード取付」、「CPU取付」、及び「メモリ取付」それぞれに対応する作業単位動画を分割して抽出することが可能となる。
ここで、改めて図9を参照する。S306において、評価装置150は、S302において作業動画から分割された一連の入力単位動画のうちの最後の入力単位動画までS304の処理の対象としたか否かを判定する。
評価装置150は、S306において最後の入力単位動画までS304の処理の対象としていないと判定した場合には、処理をS304に進める。この場合には、評価装置150は、まだ処理対象となっていない入力単位動画の画像データD303について、S304の処理を実行する。
そして、評価装置150は、S306において最後の入力単位動画までS304の処理の対象としたと判定した場合には、図9に示す一連の処理を終了する。
次いで、図11を参照して、評価装置150による熟練度評価モデルを利用した作業者の所定の作業に関する熟練度の評価に係る処理の一例について説明する。図11は、評価装置150による熟練度評価モデルを利用した作業者の所定の作業に関する熟練度の評価に係る処理の一例を示した図である。また、図11は、評価基準とする作業者をあらかじめ設定したうえで、評価対象となる作業者と評価基準とする作業者とのそれぞれの作業の実施状況を比較することで、評価対象となる作業者の当該作業に関する熟練度の評価を行う場合の一例について示している。なお、評価基準とする作業者については、例えば、熟練者に相当する作業者を設定するとよい。なお、評価基準とする作業者が「第2の作業者」の一例に相当する。
評価装置150は、評価対象となる作業者による一連の作業の実施状況の撮像結果に応じた作業動画の画像データを取得し、当該画像データを対象としてS402~S405の処理と、S408~S409の処理と、を実行したうえで、S411~S412の処理を実行する。そこで、以降では、S402~S405の処理とS408~S409の処理とのそれぞれについて説明したうえで、S411~S412の処理について説明する。
まず、S402~S405の処理について説明する。S402~S405の処理は、評価対象となる作業者による作業の実施状況の撮像結果に応じた作業動画の画像データを対象とした特徴量ベクトル(すなわち、特徴量空間中の位置)の導出に係る処理の一例を示している。
評価装置150は、評価対象となる作業者の作業動画の画像データD401を取得し、S402において、当該画像データD401が示す作業動画を作業単位動画に分割する。そのうえで、評価装置150は、上記作業動画から分割された一連の作業単位動画それぞれに対応する画像データのうち、評価の対象となる作業単位に対応する作業単位動画の画像データD403を抽出する。なお、図11に示す例では、作業単位Aを対象として、評価対象となる作業者の当該作業単位Aに関する熟練度の評価が行われるものとする。そのため、図11に示す例では、評価装置150は、S402の処理の結果に基づき、作業単位Aに対応する作業単位動画の画像データD403を抽出している。
S404において、評価装置150は、抽出した画像データD403が示す作業単位Aの作業単位動画から、熟練度評価モデルに入力するフレームを抽出する。この際に、評価装置150は、熟練度評価モデルへの入力次元(換言すると、フレーム数)が固定されるように、作業単位動画Aから所定数のフレームを抽出してもよく、当該所定数のフレームを抽出するために抽出対象とするフレームの間隔を制御してもよい。
S405において、評価装置150は、S404において作業単位Aの作業単位動画から抽出したフレームに対応する画像データを熟練度評価モデルに入力する。これにより、当該熟練度評価モデルからは、評価対象となる作業者による作業単位Aの実施状況の撮像結果に応じた作業単位動画の特徴量に応じた特徴量空間における位置を示す情報(以下、特徴量ベクトルD406とも称する)が出力される。
次いで、S408~S409の処理について説明する。S408~S409の処理は、評価基準とする作業者による作業の実施状況の撮像結果に応じた作業動画の画像データを対象とした特徴量ベクトルの導出に係る処理の一例を示している。
S408において、評価装置150は、評価基準となる作業単位動画、すなわち評価基準とする作業者による作業単位Aの実施状況の撮像結果に応じた画像データD407が示す当該作業単位Aの作業単位動画から、熟練度評価モデルに入力するフレームを抽出する。この際に、評価装置150は、S404の処理と同様に、熟練度評価モデルへの入力次元(換言すると、フレーム数)が固定されるように、作業単位動画Aから所定数のフレームを抽出してもよく、当該所定数のフレームを抽出するために抽出対象とするフレームの間隔を制御してもよい。
S409において、評価装置150は、S408において評価基準となる作業単位動画(作業単位Aの作業単位動画)から抽出したフレームに対応する画像データを熟練度評価モデルに入力する。これにより、当該熟練度評価モデルからは、評価基準となる作業単位動画の特徴量、すなわち、評価基準とする作業者による作業単位Aの実施状況の撮像結果に応じた作業単位動画の特徴量に応じた特徴量空間における位置を示す情報(以下、特徴量ベクトルD410とも称する)が出力される。
なお、評価基準となる作業単位動画については、1つであってもよいし複数であってもよい。また、複数の作業単位動画を評価基準として使用する場合には、所定の作業者に対応する複数の作業単位動画が使用されてもよいし、共通のグループに属する複数の作業者(例えば、熟練者に相当する複数の作業者)それぞれに対応する作業単位動画が使用されてもよい。
次いで、S411~S412の処理について説明する。S411~S412の処理は、評価対象となる作業者の作業単位Aの熟練度の評価や、当該評価の結果に応じた情報の提示に係る処理の一例を示している。
S411において、評価装置150は、S405における熟練度評価モデルからの出力に基づく、評価対象となる作業者に対応する特徴量ベクトルD406に基づき、当該作業者の作業単位Aに関する熟練度を評価するための評価値を算出する。具体的な一例として、評価処理部154は、評価対象となる作業者に対応する特徴量ベクトルD406と、評価基準とする作業者に対応する特徴量ベクトルD410と、の特徴量空間中における位置関係に応じて上記評価値を算出してもよい。ここで、図12及び図13を参照して、評価対象となる作業者による所定の作業に関する熟練度の評価値の算出方法について具体的な例を挙げて説明する。
まず、図12に示す例について説明する。図12に示す例では、所定のグループに属する一連の作業者(例えば、熟練者)それぞれを評価基準として、所定の作業(例えば、作業単位)に関する、評価対象となる作業者の熟練度の評価に係る評価値の算出方法の一例について示している。
前述したように、メトリックラーニングにより特徴量空間の学習が行われることで、共通のグループに属する作業者間においては、共通の作業単位に対応する複数の画像データ間の特徴量の差がより小さくなる。すなわち、この場合には、共通のグループに属する作業者間においては、それぞれに対応する特徴量ベクトルが示す特徴量空間中の位置の間の距離がより短くなる。一方で、それぞれが異なるグループに属する作業者間においては、共通の作業単位に対応する複数の画像データ間の特徴量の差がより大きくなる。すなわち、この場合には、それぞれが異なるグループに属する作業者間においては、それぞれに対応する特徴量ベクトルが示す特徴量空間中の位置の間の距離がより長くなる。
このような特性を利用し、評価装置150は、評価対象となる作業者に対応する特徴量ベクトルD406に基づき、当該作業者の所定の作業(例えば、作業単位A)に関する熟練度の評価に係る評価値を算出する。
具体的には、図12に示す例では、まず評価装置150は、評価基準とするグループ(例えば、熟練者のグループ)に属する複数の作業者それぞれに対応する特徴量ベクトルD410が示す特徴量空間中の位置の重心P12を算出する。次いで評価装置150は、算出した重心P12と、評価対象となる作業者に対応する特徴量ベクトルD406が示す特徴量空間中の位置P11と、の間の特徴量空間中における距離(例えば、ユークリッド距離、マハラノビス距離等)L13を算出する。次いで、評価装置150は、重心P12と位置P11との間の特徴量空間中における距離L13の算出結果を、シグモイド関数等を利用して0~1の範囲の値に正規化し、当該値に100を乗算して0~100の点数で表現する。例えば、上記正規化に使用されるシグモイド関数は、以下に(式1)として示すような関係式で表される。なお、(式1)におけるパラメータa(ゲイン)については、評価の対象となる作業単位の特性に応じてあらかじめ決定されるとよい。
Figure 0007249444000002
これにより、評価対象となる作業者の所定の作業に関する熟練度が、100点を上限とした0~100の点数で表されることとなる。具体的には、重心P12と位置P11との距離がより近いほど、評価基準とするグループに属する作業者と、評価対象となる作業者との間で特徴量ベクトルの差がより小さくなり、熟練度の評価に係る点数が100点を上限としたより高い値となる。これに対して、重心P12と位置P11との距離がより遠いほど、評価基準とするグループに属する作業者と、評価対象となる作業者との間で特徴量ベクトルの差がより大きくなり、熟練度の評価に係る点数が0点を下限としたより低い値となる。
次いで、図13に示す例について説明する。図13に示す例では、所定の作業者(例えば、熟練者)を評価基準として、所定の作業(例えば、作業単位)に関する、評価対象となる作業者の熟練度の評価に係る評価値の算出方法の一例について示している。
図13に示す例では、評価装置150は、評価基準とする作業者(例えば、熟練者)に対応する特徴量ベクトルD410が示す特徴量空間中の位置P22と、評価対象となる作業者に対応する特徴量ベクトルD406が示す特徴量空間中の位置P21と、の間の特徴量空間中における距離L23を算出する。そのうえで、評価装置150は、位置P22と位置P21との間の特徴量空間中における距離L23の算出結果を、シグモイド関数等を利用して0~1の範囲の値に正規化し、当該値に100を乗算して0~100の点数で表現する。なお、正規化の方法については、図12を参照して説明した例と実質的に同様のため、詳細な説明は省略する。
これにより、評価対象となる作業者の所定の作業に関する熟練度が、100点を上限とした0~100の点数で表されることとなる。具体的には、位置P22と位置P21との距離がより近いほど、評価基準とする作業者と、評価対象となる作業者との間で特徴量ベクトルの差がより小さくなり、熟練度の評価に係る点数が100点を上限としたより高い値となる。これに対して、位置P22と位置P21との距離がより遠いほど、評価基準とする作業者と、評価対象となる作業者との間で特徴量ベクトルの差がより大きくなり、熟練度の評価に係る点数が0点を下限としたより低い値となる。
以上により、評価装置150は、例えば、作業単位ごとに、評価対象となる作業者の当該作業単位に関する熟練度を、S411において算出した点数に基づき評価することが可能となる。
また、上記のような仕組みにより、例えば、一連の作業を構成する1以上の作業単位それぞれについて熟練度の評価結果を得ることで、当該一連の作業全体を対象とした熟練度の評価を行うことも可能である。
例えば、図14は、一連の作業を対象とした熟練度の評価方法の一例について説明するための説明図であり、PCの組み立てに係る一連の作業を対象とした熟練度の評価結果の一例を示している。具体的には、図14に示す例では、熟練度の評価に利用された作業動画には、PCの組み立てに係る作業を構成する一連の作業単位のうち、「ボード取付」、「CPU取付」、及び「メモリ取付」それぞれの実施状況が撮像されている。そのため、「ボード取付」、「CPU取付」、及び「メモリ取付」それぞれに対応する作業単位動画が抽出され、当該作業単位動画に基づき各作業単位について熟練度の評価に係る点数が算出されている。これにより、例えば、評価装置150は、「ボード取付」、「CPU取付」、及び「メモリ取付」それぞれの熟練度の評価結果に基づき、これらの作業単位を含むPCの組み立てに係る一連の作業全体に関する熟練度を評価することが可能となる。
以上のようにして、評価装置150は、評価対象となる作業者の所定の作業に関する熟練度を評価し、当該評価の結果に応じた情報を所定の出力先に出力する。例えば、評価装置150は、評価対象となる作業者の所定の作業に関する熟練度の評価結果に応じた情報を、ネットワークを介して接続された端末装置200に送信することで、当該端末装置200を介して管理者に当該評価の結果に応じた情報を提示してもよい。
ここで、改めて図11を参照する。S412において、評価装置150は、評価対象となる作業者の熟練度の評価に利用した画像データが示す画像のうち、評価対象となる作業者と評価基準とする作業者との間で作業の実施状況が異なる領域を、差異領域として検出する。
具体的には、評価装置150は、評価対象となる作業者の熟練度の評価に利用した画像データが示す動画像の各フレームに対応する静止画像中の各領域における、当該評価への寄与率を算出する。この際に、評価装置150は、熟練度評価モデルによる、評価対象となる作業者と評価基準とする作業者とのそれぞれについて出力する特徴量ベクトル間の差の評価に係る寄与率を算出する。なお、上記寄与率の算出については、前述したようにGradCAM等の公知の技術を利用することが可能である。以上のようにして寄与率が算出されることで、上記各フレームに対応する静止画像中の各領域のうち、当該寄与率がより高い値を示す領域を、評価対象となる作業者と評価基準とする作業者との間で作業の実施状況が異なる領域として抽出することが可能となる。
以上のようにして、評価装置150は、対象となる画像(例えば、各フレームに対応する静止画像)から差異領域が抽出された場合には、当該画像に対して当該差異領域の抽出結果に応じた情報を重畳させてもよい。
例えば、図15は、差異領域の抽出結果に応じた情報の出力方法の一例を示した図である。図15に示す例では、評価装置150は、差異領域の抽出元となる静止画像中の当該差異領域に対応する位置に、当該差異領域を示す表示情報V31を重畳表示させている。また、この際に、評価装置150は、差異領域の抽出に利用した上記寄与率に応じて、当該寄与率の算出元となった部分(例えば、画素)に重畳させる表示情報V31の表示態様(例えば、色の違いや輝度の違い等)を制御してもよい。具体的な一例として、図15に示す例では、評価装置150は、表示情報V31の各領域の色を、当該領域について算出された寄与率に応じて制御している。これにより、例えば、管理者は、対象となる画像に重畳表示された表示情報V31の表示態様の違い(例えば、色の違い)に応じて、当該画像中の各領域のうち、対象となる作業者の熟練度の評価により寄与した領域を識別することが可能となる。
以上、図4~図15を参照して、本実施形態に係る情報処理システムの処理の一例について、前処理段階と本処理段階とに分けてそれぞれ説明した。
<変形例>
本実施形態に係る情報処理システムの変形例について説明する。本変形例では、評価対象となる作業者(例えば、未熟者)が所定の作業を実施する際の、当該作業を構成する一連の作業単位の実施順序(換言すると、当該作業の手順)を評価可能とするための仕組みの一例について説明する。
図9及び図10を参照して説明したように、作業動画を入力単位動画に分割したうえで、分割後の一連の入力単位動画それぞれの画像データを作業動画分割モデルに入力することで、作業単位に対応する入力単位動画の画像データについて当該作業単位の推論結果を示す情報が出力される。例えば、図10に示す例では、分割後の一連の入力単位動画のうち、PCの組み立て作業の作業単位である「ボード取付」、「CPU取付」、及び「メモリ取付」の作業状況が撮像された入力単位動画を対象として、対応する作業単位を示す情報が推論結果として出力されている。すなわち、図10に示す例では、PCの組み立て作業として、「ボード取付」、「CPU取付」、及び「メモリ取付」として示された各作業単位がこの順序で実施されていることがわかる。
本変形例に係る評価装置150は、上述のような特性を利用することで、例えば、評価対象となる作業者による所定の作業の実施に係る手順が正しい手順か否かを評価してもよい。
具体的な一例として、評価装置150は、評価対象となる作業者(例えば、未熟者)と、評価基準とする作業者(例えば、熟練者)とのそれぞれについて、所定の作業の実施状況の撮像結果に応じた作業動画を、作業動画分割モデルを利用して作業単位動画に分割する。また、評価装置150は、評価対象となる作業者と評価基準とする作業者との間で、作業動画から分割された上記作業を構成する一連の作業単位それぞれに対応する作業単位動画が再生される順序を比較する。そのうえで、評価装置150は、上記比較の結果に基づき、評価対象となる作業者と評価基準とする作業者との間で上記一連の作業単位それぞれが実施される順序の違いの抽出を試みる。
これにより、評価装置150は、上記一連の作業単位それぞれが実施される順序の違いが抽出されるか否かに応じて、評価対象となる作業者による上記所定の作業の実施に係る手順が正しい手順か否かを評価することが可能となる。また、この際に、評価装置150は、評価対象となる作業者による作業の手順と、評価基準とする作業者による当該作業の手順と、の間における乖離の度合いに応じて、評価対象となる作業者による当該作業の熟練度を評価してもよい。
以上、変形例として、評価対象となる作業者が所定の作業を実施する際の、当該作業を構成する一連の作業単位の実施順序を評価可能とするための仕組みの一例について説明した。
<むすび>
以上説明したように、本開示の一実施形態に係る情報処理装置は、互いに異なる複数のグループそれぞれに分類された複数の作業者それぞれによる一連の作業の実施状況の撮像結果に応じた一連の動画像の第1の画像データから分割された、当該一連の作業を構成する作業単位それぞれに対応する部分的な動画像の第2の画像データを学習データとした機械学習に基づき、共通のグループに属する作業者間において、共通の作業単位に対応する複数の第2の画像データ間の特徴量の差がより小さくなり、それぞれが異なるグループに属する作業者間において、共通の作業単位に対応する複数の第2の画像データ間の特徴量の差がより大きくなるように、複数の画像データ間の関係性に関する特徴量空間を学習することで第1の学習済モデルを構築する。そのうえで、評価対象となる作業者による一連の作業の実施状況の撮像結果に応じた一連の動画像の第1の画像データと、上記第1の学習済モデルと、に基づき当該作業者の当該一連の作業に関する熟練度が評価される。
このような構成により、例えば、評価基準とする作業者(例えば、熟練者)と評価対象となる作業者(例えば、未熟者)との間で、共通の作業の実施状況の違いを、各作業者に対応する画像データ間における特徴量の差として定量的に評価することも可能となる。これにより、例えば、熟練者が未熟者に対して直接指導を行わずとも、当該未熟者(評価対象となる作業者)自身または作業の管理に係る管理者に対して各種作業の熟練度の評価結果をフィードバックすることで、当該未熟者の当該作業に関する熟練度を向上させる効果を期待することが可能となる。このように、本実施形態に係る情報処理システムに依れば、技能伝承をより好適な態様で支援することが可能となる。
なお、上述した実施形態はあくまで一例であり、必ずしも本発明の構成や処理を限定するものではなく、本発明の技術思想を逸脱しない範囲で種々の変形や変更が加えられてもよい。
また、本発明には、上述した実施形態の機能を実現するプログラム、および、該プログラムを格納したコンピュータが読み取り可能な記録媒体が含まれる。
1 情報処理システム
110 モデル構築装置
111 通信部
112 入出力制御部
113 モデル構築部
114 ラベル付処理部
115 作業動画分割モデル構築部
116 熟練度評価モデル構築部
117 記憶部
150 評価装置
151 通信部
152 入出力制御部
153 分割処理部
154 評価処理部
155 寄与率算出部
156 画像処理部
157 記憶部
200 端末装置
310 撮像装置

Claims (11)

  1. 互いに異なる複数のグループそれぞれに分類された複数の作業者それぞれによる一連の作業の実施状況の撮像結果に応じた一連の動画像の第1の画像データから分割された、当該一連の作業を構成する作業単位それぞれに対応する部分的な動画像の第2の画像データを学習データとした機械学習に基づき、共通のグループに属する作業者間において、共通の作業単位に対応する複数の前記第2の画像データ間の特徴量の差がより小さくなり、それぞれが異なるグループに属する作業者間において、共通の作業単位に対応する複数の前記第2の画像データ間の特徴量の差がより大きくなるように、複数の画像データ間の関係性に関する特徴量空間を学習することで第1の学習済モデルを構築する第1のモデル構築手段と、
    前記複数のグループそれぞれに分類された前記複数の作業者それぞれに対応する前記第1の画像データから分割された、当該一連の作業を構成する作業単位それぞれに対応する前記第2の画像データに対して、当該作業単位を示す付帯情報を関連付ける関連付け手段と、
    前記付帯情報が関連付けられた前記第2の画像データを学習データとした機械学習に基づき、入力された画像データが示す動画像に撮像された一連の作業を構成する作業単位を推論する第2の学習済モデルを構築する第2のモデル構築手段と、
    評価対象となる第1の作業者による一連の作業の実施状況の撮像結果に応じた一連の動画像の前記第1の画像データを前記第2の学習済モデルに入力することで、当該第1の画像データを当該一連の作業を構成する作業単位ごとの前記第2の画像データに分割し、当該第1の画像データから分割された作業単位ごとの当該第2の画像データを前記第1の学習済モデルに入力することで得られる第1の特徴量と、前記複数のグループのうちの所定のグループに属する第2の作業者による当該作業単位に対応する前記第2の画像データを前記第1の学習済モデルに入力することで得られる第2の特徴量と、に基づき、前記第1の作業者が実施した前記一連の作業に関する当該第1の作業者の熟練度を評価する評価手段と、
    を備える、情報処理装置。
  2. 前記第1のモデル構築手段は、
    前記複数のグループそれぞれに分類された複数の作業者それぞれに対応する前記第1の画像データを前記第2の学習済モデルに入力することで、当該第2の学習済モデルから出力される情報に基づき、当該第1の画像データを作業単位ごとの前記第2の画像データに分割し、
    分割された当該第2の画像データを学習データとした機械学習に基づき、前記第1の学習済モデルを構築する、
    請求項に記載の情報処理装置。
  3. 前記評価手段は、前記第1の作業者による一連の作業の実施状況の撮像結果に応じた一連の動画像の前記第1の画像データが所定の期間ごとに分割された第3の画像データそれぞれを前記第2の学習済モデルに入力することで、当該第2の学習済モデルから当該第3の画像データごとに出力される情報に基づき、当該第1の画像データを作業単位ごとの前記第2の画像データに分割する、
    請求項に記載の情報処理装置。
  4. 前記評価手段は、前記第1の作業者による前記一連の作業の実施状況の撮像結果に応じた前記第1の画像データに対応する前記第1の特徴量と、前記所定のグループに属する一連の前記第2の作業者それぞれによる当該一連の作業の実施状況の撮像結果に応じた前記第1の画像データに対応する前記第2の特徴量の前記特徴量空間中における重心と、に基づき、前記第1の作業者が実施した当該一連の作業に関する当該第1の作業者の熟練度を評価する、
    請求項1~3のいずれか1項に記載の情報処理装置。
  5. 前記評価手段は、前記第1の作業者による前記一連の作業の実施状況の撮像結果に応じた前記第1の画像データに対応する前記第1の特徴量と、前記所定のグループに属する作業者のうちの少なくとも一部の前記第2の作業者による当該一連の作業の実施状況の撮像結果に応じた前記第1の画像データに対応する前記第2の特徴量と、に基づき、前記第1の作業者が実施した当該一連の作業に関する当該第1の作業者の熟練度を評価する、
    請求項1~3のいずれか1項に記載の情報処理装置。
  6. 前記評価手段は、前記第1の特徴量と前記第2の特徴量との前記特徴量空間における距離に基づき、前記第1の作業者が実施した前記一連の作業に関する当該第1の作業者の熟練度を評価する、
    請求項1~5のいずれか1項に記載の情報処理装置。
  7. 前記第1の作業者による前記一連の作業の実施状況の撮像結果に応じた前記第1の画像データに対応する動画像の少なくとも一部のフレームに対応する静止画像の各部における、前記第1の特徴量と前記第2の特徴量とに基づく、前記第1の作業者が実施した前記一連の作業に関する当該第1の作業者の熟練度の評価結果に対する寄与率を算出する算出手段と、
    前記寄与率の算出結果に応じた情報が、前記静止画像中の当該寄与率の算出元となる領域に対応付けて出力されるように制御する出力制御手段と、
    を備える、請求項1~6のいずれか1項に記載の情報処理装置。
  8. 前記出力制御手段は、前記寄与率の算出結果に応じた表示情報が、前記静止画像中の当該寄与率の算出元となる領域に重畳表示されるように制御する、
    請求項に記載の情報処理装置。
  9. 情報処理装置が実行する情報処理方法であって、
    互いに異なる複数のグループそれぞれに分類された複数の作業者それぞれによる一連の作業の実施状況の撮像結果に応じた一連の動画像の第1の画像データから分割された、当該一連の作業を構成する作業単位それぞれに対応する部分的な動画像の第2の画像データを学習データとした機械学習に基づき、共通のグループに属する作業者間において、共通の作業単位に対応する複数の前記第2の画像データ間の特徴量の差がより小さくなり、それぞれが異なるグループに属する作業者間において、共通の作業単位に対応する複数の前記第2の画像データ間の特徴量の差がより大きくなるように、複数の画像データ間の関係性に関する特徴量空間を学習することで第1の学習済モデルを構築する第1のモデル構築ステップと、
    前記複数のグループそれぞれに分類された前記複数の作業者それぞれに対応する前記第1の画像データから分割された、当該一連の作業を構成する作業単位それぞれに対応する前記第2の画像データに対して、当該作業単位を示す付帯情報を関連付ける関連付けステップと、
    前記付帯情報が関連付けられた前記第2の画像データを学習データとした機械学習に基づき、入力された画像データが示す動画像に撮像された一連の作業を構成する作業単位を推論する第2の学習済モデルを構築する第2のモデル構築ステップと、
    評価対象となる第1の作業者による一連の作業の実施状況の撮像結果に応じた一連の動画像の前記第1の画像データを前記第2の学習済モデルに入力することで、当該第1の画像データを当該一連の作業を構成する作業単位ごとの前記第2の画像データに分割し、当該第1の画像データから分割された作業単位ごとの当該第2の画像データを前記第1の学習済モデルに入力することで得られる第1の特徴量と、前記複数のグループのうちの所定のグループに属する第2の作業者による当該作業単位に対応する前記第2の画像データを前記第1の学習済モデルに入力することで得られる第2の特徴量と、に基づき、前記第1の作業者が実施した前記一連の作業に関する当該第1の作業者の熟練度を評価する評価ステップと、
    を含む、情報処理方法。
  10. コンピュータに、
    互いに異なる複数のグループそれぞれに分類された複数の作業者それぞれによる一連の作業の実施状況の撮像結果に応じた一連の動画像の第1の画像データから分割された、当該一連の作業を構成する作業単位それぞれに対応する部分的な動画像の第2の画像データを学習データとした機械学習に基づき、共通のグループに属する作業者間において、共通の作業単位に対応する複数の前記第2の画像データ間の特徴量の差がより小さくなり、それぞれが異なるグループに属する作業者間において、共通の作業単位に対応する複数の前記第2の画像データ間の特徴量の差がより大きくなるように、複数の画像データ間の関係性に関する特徴量空間を学習することで第1の学習済モデルを構築する第1のモデル構築ステップと、
    前記複数のグループそれぞれに分類された前記複数の作業者それぞれに対応する前記第1の画像データから分割された、当該一連の作業を構成する作業単位それぞれに対応する前記第2の画像データに対して、当該作業単位を示す付帯情報を関連付ける関連付けステップと、
    前記付帯情報が関連付けられた前記第2の画像データを学習データとした機械学習に基づき、入力された画像データが示す動画像に撮像された一連の作業を構成する作業単位を推論する第2の学習済モデルを構築する第2のモデル構築ステップと、
    評価対象となる第1の作業者による一連の作業の実施状況の撮像結果に応じた一連の動画像の前記第1の画像データを前記第2の学習済モデルに入力することで、当該第1の画像データを当該一連の作業を構成する作業単位ごとの前記第2の画像データに分割し、当該第1の画像データから分割された作業単位ごとの当該第2の画像データを前記第1の学習済モデルに入力することで得られる第1の特徴量と、前記複数のグループのうちの所定のグループに属する第2の作業者による当該作業単位に対応する前記第2の画像データを前記第1の学習済モデルに入力することで得られる第2の特徴量と、に基づき、前記第1の作業者が実施した前記一連の作業に関する当該第1の作業者の熟練度を評価する評価ステップと、
    を実行させる、プログラム。
  11. 互いに異なる複数のグループそれぞれに分類された複数の作業者それぞれによる一連の作業の実施状況の撮像結果に応じた一連の動画像の第1の画像データから分割された、当該一連の作業を構成する作業単位それぞれに対応する部分的な動画像の第2の画像データを学習データとした機械学習に基づき、共通のグループに属する作業者間において、共通の作業単位に対応する複数の前記第2の画像データ間の特徴量の差がより小さくなり、それぞれが異なるグループに属する作業者間において、共通の作業単位に対応する複数の前記第2の画像データ間の特徴量の差がより大きくなるように、複数の画像データ間の関係性に関する特徴量空間を学習することで第1の学習済モデルを構築する第1のモデル構築手段と、
    前記複数のグループそれぞれに分類された前記複数の作業者それぞれに対応する前記第1の画像データから分割された、当該一連の作業を構成する作業単位それぞれに対応する前記第2の画像データに対して、当該作業単位を示す付帯情報を関連付ける関連付け手段と、
    前記付帯情報が関連付けられた前記第2の画像データを学習データとした機械学習に基づき、入力された画像データが示す動画像に撮像された一連の作業を構成する作業単位を推論する第2の学習済モデルを構築する第2のモデル構築手段と、
    評価対象となる第1の作業者による一連の作業の実施状況の撮像結果に応じた一連の動画像の前記第1の画像データを前記第2の学習済モデルに入力することで、当該第1の画像データを当該一連の作業を構成する作業単位ごとの前記第2の画像データに分割し、当該第1の画像データから分割された作業単位ごとの当該第2の画像データを前記第1の学習済モデルに入力することで得られる第1の特徴量と、前記複数のグループのうちの所定のグループに属する第2の作業者による当該作業単位に対応する前記第2の画像データを前記第1の学習済モデルに入力することで得られる第2の特徴量と、に基づき、前記第1の作業者が実施した前記一連の作業に関する当該第1の作業者の熟練度を評価する評価手段と、
    を備える、情報処理システム。
JP2022020269A 2022-02-14 2022-02-14 情報処理装置、情報処理方法、プログラム、及び情報処理システム Active JP7249444B1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022020269A JP7249444B1 (ja) 2022-02-14 2022-02-14 情報処理装置、情報処理方法、プログラム、及び情報処理システム
PCT/JP2022/042033 WO2023153036A1 (ja) 2022-02-14 2022-11-11 情報処理装置、情報処理方法、プログラム、及び情報処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022020269A JP7249444B1 (ja) 2022-02-14 2022-02-14 情報処理装置、情報処理方法、プログラム、及び情報処理システム

Publications (2)

Publication Number Publication Date
JP7249444B1 true JP7249444B1 (ja) 2023-03-30
JP2023117614A JP2023117614A (ja) 2023-08-24

Family

ID=85772188

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022020269A Active JP7249444B1 (ja) 2022-02-14 2022-02-14 情報処理装置、情報処理方法、プログラム、及び情報処理システム

Country Status (2)

Country Link
JP (1) JP7249444B1 (ja)
WO (1) WO2023153036A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018154709A1 (ja) 2017-02-24 2018-08-30 三菱電機株式会社 動作学習装置、技能判別装置および技能判別システム
WO2020235804A1 (ko) 2019-05-17 2020-11-26 네이버 주식회사 포즈 유사도 판별 모델 생성방법 및 포즈 유사도 판별 모델 생성장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018154709A1 (ja) 2017-02-24 2018-08-30 三菱電機株式会社 動作学習装置、技能判別装置および技能判別システム
WO2020235804A1 (ko) 2019-05-17 2020-11-26 네이버 주식회사 포즈 유사도 판별 모델 생성방법 및 포즈 유사도 판별 모델 생성장치

Also Published As

Publication number Publication date
JP2023117614A (ja) 2023-08-24
WO2023153036A1 (ja) 2023-08-17

Similar Documents

Publication Publication Date Title
US10529109B1 (en) Video stream customization using graphics
CN109547814B (zh) 视频推荐方法、装置、服务器及存储介质
US9721221B2 (en) Skill estimation method in machine-human hybrid crowdsourcing
WO2021027260A1 (zh) 处理交互序列数据的方法及装置
JP6684883B2 (ja) カメラエフェクトを提供する方法およびシステム
JP6248106B2 (ja) 広告ターゲティングのための否定的なシグナル
US20200050872A1 (en) People flow estimation device, display control device, people flow estimation method, and recording medium
JP2019527395A (ja) コンテンツを効果的に配信するための動的クリエイティブの最適化
JP2018534700A (ja) メディアコンテンツのパフォーマンスの即時予測のための方法及び装置
JP2022533690A (ja) 映画成功指数の予測
US20220366244A1 (en) Modeling Human Behavior in Work Environment Using Neural Networks
CN114742230A (zh) 信息处理系统、信息处理方法及信息处理装置
US20210295053A1 (en) Observed-object recognition system and method
US20210124740A1 (en) Information processing apparatus, information processing method, and computer program
JP2019040417A (ja) 情報処理装置及びプログラム
CN114245155A (zh) 直播方法、装置及电子设备
KR102150307B1 (ko) 온라인 창의학습 관리 서버
JP2018195133A (ja) 情報処理装置及び情報処理プログラム
JP7249444B1 (ja) 情報処理装置、情報処理方法、プログラム、及び情報処理システム
CN114399424A (zh) 模型训练方法及相关设备
US11210566B2 (en) Training apparatus, training method and recording medium
JP6367169B2 (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP5652694B2 (ja) 目的変数算出装置、目的変数算出方法、プログラムおよび記録媒体
US11042274B2 (en) Extracting demonstrations from in-situ video content
JP2019166592A (ja) ロボット制御システム、ロボット制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221216

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20221216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230317

R150 Certificate of patent or registration of utility model

Ref document number: 7249444

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150