WO2022009652A1

WO2022009652A1 - データ収集システム、センサ装置、データ収集装置、及びデータ収集方法

Info

Publication number: WO2022009652A1
Application number: PCT/JP2021/023319
Authority: WO
Inventors: 健二鈴木
Original assignee: ソニーグループ株式会社
Priority date: 2020-07-07
Filing date: 2021-06-21
Publication date: 2022-01-13
Also published as: US20230237774A1

Abstract

本開示に係るデータ収集システムは、データを収集するセンサ装置と、入力に対して学習結果に応じた出力を行う学習モデルと、前記学習モデルの学習に有効なデータまたは不足するデータを特定するデータ解析部を有するサーバ装置とを備え、前記サーバ装置は、前記データ解析部により特定された学習に有効なデータ、不足するデータ又は当該データに類似するデータを収集する要求信号を前記センサ装置に送信し、前記センサ装置は受信した前記要求信号に基づき前記学習に有効なデータ、前記不足するデータ又は類似するデータを収集し、収集した前記データを前記サーバ装置へ送信し、前記サーバ装置は、前記センサ装置から送信されたデータに基づき前記学習モデルの再学習を行う。

Description

データ収集システム、センサ装置、データ収集装置、及びデータ収集方法

　本開示は、データ収集システム、センサ装置、データ収集装置、及びデータ収集方法に関する。

　様々な技術分野において、深層学習（ディープラーニング）等の機械学習（単に「学習」ともいう）を利用した情報処理が活用されており、ニューラルネットワーク等のモデルを学習する技術が提供されてきている。このような学習においては、学習されるニューラルネットワーク等のモデル等の性能に学習に用いるデータが影響するため、学習に用いるデータが重要であり、学習に用いるデータに関する技術が提供されている（例えば、特許文献１参照）。

特開２０１９－１７９４５７号公報

　従来技術によれば、欠落した値を候補値から補完したデータを用いて学習を行う。

　しかしながら、従来技術は、適切なデータを用いて学習することができるとは限らない。例えば、従来技術では、学習に適していないデータが用いられる場合、そのデータがそのまま用いられるため、所望の性能を有するニューラルネットワーク等のモデルを学習することができない場合がある。そのため、学習に用いる所望のデータを収集することが望まれている。

　そこで、本開示では、機械学習に用いる所望のデータを収集することができるデータ収集システム、センサ装置、データ収集装置、及びデータ収集方法を提案する。

　上記の課題を解決するために、本開示に係る一形態のデータ収集システムは、データを収集するセンサ装置と、入力に対して学習結果に応じた出力を行う学習モデルと、前記学習モデルの学習に有効なデータまたは不足するデータを特定するデータ解析部を有するサーバ装置とを備え、前記サーバ装置は、前記データ解析部により特定された学習に有効なデータ、不足するデータ又は当該データに類似するデータを収集する要求信号を前記センサ装置に送信し、前記センサ装置は受信した前記要求信号に基づき前記学習に有効なデータ、前記不足するデータ又は類似するデータを収集し、収集した前記データを前記サーバ装置へ送信し、前記サーバ装置は、前記センサ装置から送信されたデータに基づき前記学習モデルの再学習を行う。

本開示の実施形態に係るデータ収集処理の一例を示す図である。本開示の実施形態に係るデータ収集システムの構成例を示す図である。本開示の実施形態に係るデータ収集装置の構成例を示す図である。本開示の実施形態に係るデータ情報記憶部の一例を示す図である。本開示の実施形態に係るモデル情報記憶部の一例を示す図である。本開示の実施形態に係る少数属性情報記憶部の一例を示す図である。モデルに対応するネットワークの一例を図である。本開示の実施形態に係るセンサ装置の構成例を示す図である。本開示の実施形態に係る収集条件記憶部の一例を示す図である。本開示の実施形態に係るデータ収集装置の処理を示すフローチャートである。本開示の実施形態に係るセンサ装置の処理を示すフローチャートである。本開示の実施形態に係るデータ収集システムの処理手順を示すシーケンス図である。少数属性のデータ収集及び学習の処理の一例を示すフローチャートである。判断の可視化を含む処理の概念図である。モデルのアップデート処理の一例を示すフローチャートである。データ収集装置やセンサ装置等の情報機器の機能を実現するコンピュータの一例を示すハードウェア構成図である。

　以下に、本開示の実施形態について図面に基づいて詳細に説明する。なお、この実施形態により本願にかかるデータ収集システム、センサ装置、データ収集装置、及びデータ収集方法が限定されるものではない。また、以下の各実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。

　以下に示す項目順序に従って本開示を説明する。
　　１．実施形態
　　　１－１．本開示の実施形態に係るデータ収集処理の概要
　　　　１－１－１．データ収集（同意、判断規準等）
　　　　１－１－２．少数属性データの取得
　　　　１－１－３．Influence　function
　　　　１－１－４．判断の可視化（Ｇｒａｄ－ＣＡＭ、ＬＩＭＥ等）
　　　１－２．実施形態に係るデータ収集システムの構成
　　　１－３．実施形態に係るデータ収集装置の構成
　　　　１－３－１．モデル（ネットワーク）例
　　　１－４．実施形態に係るセンサ装置の構成
　　　１－５．実施形態に係る情報処理の手順
　　　　１－５－１．データ収集装置に係る処理の手順
　　　　１－５－２．センサ装置に係る処理の手順
　　　　１－５－３．データ収集システムに係る処理の手順
　　　１－６．少数属性のデータ収集及び学習処理例
　　　１－７．判断根拠の表示等
　　２．その他の実施形態
　　　２－１．その他の構成例
　　　２－２．データ
　　　２－３．その他
　　３．本開示に係る効果
　　４．ハードウェア構成

［１．実施形態］
［１－１．本開示の実施形態に係るデータ収集処理の概要］
　図１は、本開示の実施形態に係るデータ収集処理の一例を示す図である。本開示の実施形態に係るデータ収集処理は、データ収集装置１００やセンサ装置１０を含むデータ収集システム１によって実現される。図１では、データ収集システム１によって実現されるデータ収集処理の概要を説明する。図１は、本開示の実施形態に係るデータ収集処理の一例を示す図である。

　データ収集装置１００は、機械学習に用いる学習データ（以下「保有データ」ともいう）において、学習に有効な効果あるいは影響を及ぼすデータをXAI（Explainable　AI）あるいはInfluence　function（影響関数）を用いて特定し、特定したデータ、保有データに不足するデータ、または、これらのデータのうち少なくとも１つのデータに類似するデータをセンサ装置１０に要求するサーバ装置である。そして、データ収集装置１００は、センサ装置１０から要求に対応するデータを取得することで、機械学習に用いるデータを収集する。図１では、データ収集装置１００は、センサ装置１０から取得したデータを、ディープニューラルネットワーク（ＤＮＮ：Deep　Neural　Network）の学習に用いるデータ（以下「学習データ」ともいう）に追加する場合を一例として示す。データ収集装置１００は、画像認識を行うＤＮＮである識別モデル（以下、単に「モデル」ともいう）を、学習データを用いて深層学習（以下「ディープラーニング」ともいう）を行う学習処理を実行する。なお、以下では、ディープニューラルネットワーク（ＤＮＮ）を単にニューラルネットワーク（ＮＮ：Neural　Network）と記載する場合がある。

　また、図１では、画像を撮像するカメラを、センサ装置１０の一例として説明する。なお、センサ装置１０は、データ収集装置１００が要求するデータをセンサにより収集しデータ収集装置１００に提供可能であれば、カメラに限らず、種々の装置であってもよい。例えば、センサ装置１０は、移動ロボット、ドローン等のＵＡＶ（Unmanned　Aerial　Vehicle）や自動車等の車両等である移動体や、イメージセンサ（イメージャ）や、イヤホン、ＡＲ（Augmented　Reality：拡張現実）グラス等のウェアラブル端末（Wearable　Device）、テレビ、携帯電話、冷蔵庫、エアコン等の家電製品であってもよいが、この点についての詳細は後述する。

　ここから、図１に示す処理の概要を説明する。まず、センサ装置１０は、センサ部１６（図８参照）のセンシング（検知）によりデータを取得する（ステップＳ１）。図１の例では、センサ装置１０は、画像センサ１６１（図８参照）により画像を撮像し、撮像した画像をデータＳＤ１として保有する。データＳＤ１は、データ記憶部１４２（図８参照）に記憶される。なお、センサ装置１０は、データ収集装置１００からの要求に応じて、その要求に対応する画像の撮影を行ってもよいが、この点については後述する。

　データ収集装置１００は、機械学習に用いる学習データＤＳ１に基づいて、センサ装置１０に要求するデータを特定する（ステップＳ２）。学習データＤＳ１は、データ情報記憶部１２１（図４参照）に記憶される。図１では、学習データＤＳ１は、大人が撮影された画像が多数（例えば全体の９８％等）含まれ、子供が撮影された画像が少数（例えば全体の２％等）しか含まれないものとする。このように、図１では、学習データＤＳ１に含まれる属性「子供」に該当するデータが他の属性「大人」に該当するデータよりも少ない。以下では、図１の属性「子供」のように該当するデータが少ない属性を「少数属性」と記載する場合がある。例えば、データ収集装置１００は、所定の閾値（例えば、０．１（１０％）や０．０５（５％）等）と、各属性に該当するデータの割合とを比較し、所定の閾値未満の属性を少数属性であると判定してもよい。

　データ収集装置１００は、学習データＤＳ１に含まれるデータ構成の偏りに応じて、センサ装置１０に要求するデータを特定する。データ収集装置１００は、少数属性に該当するデータをセンサ装置１０に要求するデータに特定する。図１の例では、データ収集装置１００は、要求情報ＭＣ１に示すように、少数属性「子供」に該当する画像をセンサ装置１０に要求する画像に特定する。なお、図１の例では、保有データに不足するデータを特定する場合を示すが、XAIあるいはInfluence　functionを用いて学習に有効な効果あるいは影響を及ぼすデータと特定されたデータを要求してもよいが、XAI、Influence　function等の点についての詳細は後述する。

　そして、データ収集装置１００は、データをセンサ装置１０に要求する（ステップＳ３）。データ収集装置１００は、要求情報ＭＣ１をセンサ装置１０へ送信することにより、少数属性「子供」に該当する画像をセンサ装置１０に要求する。データ収集装置１００は、必要とするデータの数（以下「要求数」ともいう）を示す情報を送信してもよい。例えば、データ収集装置１００は、必要とする少数属性「子供」に該当する画像の数（要求数）を示す情報を送信してもよい。

　データ収集装置１００からの要求を受信したセンサ装置１０は、要求情報に対応する収集用データＣＳＤ１を生成する（ステップＳ４）。センサ装置１０は、データＳＤ１と、収集条件ＣＤ１とを用いて、収集用データＣＳＤ１を生成する。収集条件ＣＤ１には、撮影された人（主体）のプライバシを考慮して、撮影された人の顔にモザイク加工を行うことを示すデータの収集基準が含まれる。なお、収集条件ＣＤ１には、上記の収集基準に限らず、撮影された人（主体）の同意や撮影された地点（国や行政区画等）の判断規準に関する条件が含まれてもよいが、この点については後述する。ここでいう、判断規準は、その地点の規則（法律や条例等）、規制、倫理観等、例えばその地点での（価値）判断の基となる様々なものが含まれる概念である。また、ここでいう行政区画は、条例等の規則を制定する権限を有するものであればどのようなものでもよく、例えば日本の場合、都道府県や市町村等が含まれる。

　センサ装置１０は、データＳＤ１から少数属性「子供」に該当する人が含まれる画像を対象画像として抽出する。例えば、センサ装置１０は、一般物体認識等の物体認識の技術等により画像中に子供が含まれるかを推定し、子供が含まれると推定される画像を対象画像として抽出する。また、センサ装置１０は、データＳＤ１中の各画像に対応付けられた属性を示すメタ情報を用いて、少数属性「子供」に該当する対象画像を抽出してもよい。

　そして、センサ装置１０は、抽出した各対象画像中の人の顔をモザイク加工する。なお、ここでいうモザイク加工には、画像中の人の顔の領域にモザイク処理を施す処理に限らず、人の顔による個人の特定を難しくする処理であればどのような処理であってもよく、例えば画像中の人の顔の領域の解像度を低くする編集も含まれる。センサ装置１０は、例えば、人工知能や機械学習モデルに基づき、顔認識の技術等により画像中から人物の顔が含まれる領域を特定し、特定した領域に対して適切なモザイク加工等の画像処理を施すことにより、人の顔にモザイク加工が施された編集済み画像データを生成する。これにより、センサ装置１０は、子供が撮像され、その子供の顔がモザイク加工された編集済み画像群を含む収集用データＣＳＤ１を生成する。

　なお、センサ装置１０は、要求に対応するデータが少ない場合、要求に対応するデータをセンシングしてもよい。例えば、センサ装置１０は、データＳＤ１中の少数属性「子供」に該当する対象画像の数が所定数（例えば要求数等）未満である場合、少数属性「子供」に該当する人の撮影を行い、要求数に達するまで少数属性「子供」に該当する画像を取得してもよい。但し、撮影する国や地域によって規制や倫理観が異なるため、例えば、人工知能や機械学習モデルあるいはエージェントが、子供の撮影に際して、適切な相手から同意を得る。例えば、そのような人工知能や機械学習モデルは、定期的に各国、各地域の法律、判例、規制、あるいはガイドラインを収集し、どのようなデータが適法でどのようなデータが違法であるかを学習することにより、学習済みモデルを用いてセンサ装置が収集したデータが違法であるか、適法であるかを判別することができる。

　そして、センサ装置１０は、収集用データＣＳＤ１をデータ収集装置１００へ提供する（ステップＳ５）。センサ装置１０は、子供の顔がモザイク加工された編集済み画像群を含む収集用データＣＳＤ１をデータ収集装置１００へ送信する。

　センサ装置１０から収集用データＣＳＤ１を取得したデータ収集装置１００は、取得した提供用データを学習データＤＳ１に追加する（ステップＳ６）。これにより、データ収集装置１００は、少数属性「子供」に該当する画像を学習データＤＳ１に追加する。これにより、データ収集装置１００は、少数属性「子供」に該当する画像が追加され、データ構成の偏りが改善された学習データＤＳ１を学習に用いることができる。

　そして、データ収集装置１００は、学習データＤＳ１を用いて、ニューラルネットワークであるモデルＭ１を学習する（ステップＳ７）。例えば、データ収集装置１００は、各画像に、その画像に含まれる物体を示す正解ラベルが対応付けられた学習データＤＳ１を用いて、モデルＭ１を学習する。例えば、データ収集装置１００は、学習データＤＳ１を用いて、設定した損失関数（ロス関数）を最小化するように学習処理を行い、モデルＭ１を学習する。なお、上記は一例であり、データ収集装置１００は、種々の方法によりモデルＭ１の学習処理を行ってもよい。

　上述したように、データ収集装置１００は、機械学習において、不足するデータ、または有効な効果あるいは影響を及ぼすデータを特定し、特定したデータをセンサ装置１０に要求することで、学習に用いる所望のデータを収集することができる。また、データ収集装置１００は、少数属性のデータをセンサ装置１０に要求し、少数属性のデータを収集することで、データ構成の偏りを改善することができる。

　また、センサ装置１０は、データ収集装置１００にデータを提供する際に、収集条件を満たすデータを提供することで、データの収集に関する条件を満たしつつ、学習に用いる所望のデータを収集することができる。図１の例では、センサ装置１０は、撮影された人（子供）のプライバシを考慮して、人の顔を編集することにより、人のプライバシを考慮しつつ、学習に用いる所望のデータを収集することができる。

［１－１－１．データ収集（同意、判断規準等）］
　図１の例では、人の顔などプライバシに関する収集基準を収集条件として、人の顔を編集してデータを収集する場合を示したが、収集条件は、上記に限らず、種々の条件であってもよい。例えば、データ収集システム１は、センサによりデータ収集の対象となった主体（人）やデータの所有者の同意や、センサによりセンシングを行う地域（国や行政区画等）の規則（法律や条例等）に関する収集条件を人工知能や機械学習により用いても予め設定してもよい。この点について以下説明する。

　データ収集システム１は、画像に含まれる人の同意の有無を収集条件として用いてもよい。例えば、データ収集システム１は、画像に含まれる人の同意がある、或は、エージェント機能等により同意を得た場合、人の顔の編集を不要とすることを収集条件としてもよい。この場合、センサ装置１０は、画像中の人の同意がある画像については、その画像が収集条件を満たすと判定し、画像を編集することなく、データ収集装置１００に送信してもよい。

　また、データ収集システム１は、センサ装置１０によりデータ収集を行う地域（国や行政区画等）の規則（法律や条例等）に基づく収集条件を用いてもよい。例えば、データ収集システム１は、センサ装置１０によりセンシングを行う地域のプライバシに関する規則に基づく収集条件を用いてもよい。例えば、データ収集システム１は、センサ装置１０によりデータ収集を行う国が人の顔を含む画像の利用を禁止している場合、人の顔を編集することを収集条件として用いてもよい。この場合、センサ装置１０は、画像中の人の顔をモザイク加工や別人の顔に変更して、データ収集装置１００に送信してもよい。

　法律や条例等の規則（GDPR（General　Data　Protection　Regulation）等含む）に基づく収集条件は、データ収集システム１の管理者等が設定してもよいし、データ収集システム１が対象となる規則を解析し自動で設定してもよい。法律や条例等の規則に基づく収集条件をデータ収集システム１の管理者等が設定する場合、管理者等が規則を基に収集条件を指定し、データ収集装置１００から指定した収集条件をセンサ装置１０に送信してもよい。収集条件を受信したセンサ装置１０は、受信した収集条件を収集条件記憶部１４１に格納し、その収集条件を用いて、データ収集装置１００へのデータの提供を行う。

　また、規則を解析または学習し自動で設定する場合、データ収集システム１は、例えば、人工知能や機械学習モデル、あるいは、自然言語処理技術を用いて、国や行政区画等の法律や条例等を解析または学習し、解析・学習結果に基づき収集条件を設定・変更してもよい。例えば、データ収集装置１００は、法律や条例等の文字情報を構文解析、AI等の種々の従来技術を適宜用いて解析や学習をすることにより、法律や条例等の内容を推定し、推定結果を基に特定した収集条件をセンサ装置１０に提供してもよい。

　例えば、データ収集装置１００が法律や条例等の内容を基に個人情報の保護が必要であると推定した場合、個人を特定できないことを含む収集条件をセンサ装置１０に送信する。データ収集装置１００が法律や条例等の内容を基に人の顔の編集が必要であると推定した場合、人の顔を編集することを含む収集条件をセンサ装置１０に送信する。なお、上記は一例であり、データ収集システム１は、種々の情報を適宜用いて、収集条件を設定する。

　データ収集装置１００は、データを収集した地点の規則（法律や条例等）、規制、倫理観等の判断規準を学習して、その学習結果を基に判断を行ってもよい。例えば、データ収集装置１００は、各国の規則、規制、倫理観等のデータを収集し、そのデータを基に判断規準モデルを学習してもよい。例えば、データ収集装置１００は、各国の規則（法律や条例等）、規制、倫理観等の判断規準で利用可能と判断された利用可データと、利用不可と判断された利用不可データを収集し、それらのデータを基に判断規準モデルを学習してもよい。例えば、データ収集装置１００は、利用可データが入力された場合に「１」を出力し、利用不可データが入力された場合に「０」を出力するように、判断規準モデルを学習してもよい。この場合、データ収集装置１００は、判断規準モデルを用いて、各データの利用可否を判断してもよい。データ収集装置１００は、対象データを判断規準モデルに入力し、判断規準モデルの出力した値が所定の閾値以上である場合、その対象データをそのまま利用可能と判断し、その対象データをそのまま学習データとして用いてもよい。また、データ収集装置１００は、対象データを判断規準モデルに入力し、判断規準モデルの出力した値が所定の閾値未満である場合、その対象データのそのまま利用不可能と判断し、その対象データを編集したり、学習に用いるデータから除外したりしてもよい。なお、上記は、一例であり、データ収集装置１００は、規則、規制、倫理観等の判断規準を基に種々の判断を行ってもよい。

　また、上記の例では、センサ装置１０がデータの編集を行う場合を示すが、データの編集は、データ収集装置１００が行ってもよい。例えば、データ収集装置１００は、画像中の人の顔を別人の顔に変更してもよい。また、例えば、データ収集システム１は、人の顔の編集を不要とするデータの収集基準を収集条件としてもよい。この場合、センサ装置１０は、画像が収集条件を満たすと判定し、画像を編集することなく、データ収集装置１００に送信してもよい。

　また、上述したようにセンサ装置１０は、データ収集装置１００が要求した属性に該当するデータの収集を行ってもよい。センサ装置１０は、データ収集装置１００が要求した少数属性「子供」に該当する人（「該当者」ともいう）を含む画像を撮影してもよい。そして、センサ装置１０は、該当者の同意がない場合、画像中の該当者の顔を編集し、編集後の画像をデータ収集装置１００に送信してもよい。

［１－１－２．少数属性データの取得］
　ここで、図１で一例として示した少数属性データの取得に関して記載する。人物・物体認識において、少数データ属性の認識率の低さが公平性を損なう恐れがある。例えば、認識しにくい肌の色、子供などの小さい人間など、データ数が少ない場合に、人物・物体認識での認識率が多数データ属性に比べて低くなるという不公平が生じてしまう。実用面において、ＡＩ倫理として望ましくなく、少数データ属性へ不利な結果を及ぼしてしまう恐れがある。

　そこで、図１に示すようなデータ収集システム１のような、少数属性データを積極的に収集するシステムが有用である。多数属性データは充分に存在し、データが不均衡なことが起因してデータバイアスが生じるケースがある。そこで、データ収集システム１は、少数属性データだけをデータ取得することによって、全体システムへの負担を軽減することができる。例えば、データ収集システム１が車載システムに適用された場合において、子供のデータが足りない場合、自動運転において背丈の低い子供の認識率が悪くなる恐れがある。車載システムのカメラ（例えばセンサ装置１０）は、子供を判定して積極的にデータを収集する。このデータ収集によって、データの不均衡が解消される。子供のデータが補充され、データバイアスが緩和されたデータセットによって、自動運転用のディープラーニングの学習を再度行う。その後、データバイアスが生じているかどうかをチェックする。少数データの認識率を測定することでもバイアスチェックをすることができるが、この点は図１３で示す。

［１－１－３．Influence　function］
　上述した例では、不足するデータを特定して、特定したデータを要求する場合を示しが、XAIあるいはInfluence　function等を用いて学習に有効な効果あるいは影響を及ぼすデータと特定して、特定したデータやその類似データを要求してもよい。以下では、有効な効果あるいは影響を及ぼすデータを特定する手法の一例として、Influence　functionについて記載するが、有効な効果あるいは影響を及ぼすデータを特定は、後述するＧｒａｄ－ＣＡＭ、ＬＩＭＥなどのXAIを用いて行われてもよい。

　データ収集装置１００は、Influence　functionにより、データセット中の各データが生成するモデル（パラメータ）に与える影響を定量的に解析する。例えば、データ収集装置１００は、Influence　functionを用いて、ある（学習）データの有無がモデルの精度（出力結果）に与える影響を定式化する。例えば、データ収集装置１００は、影響の測定対象となる各データを除いたデータセットを用いた再学習無しで、各データが学習に与えた影響度を測定する。そして、データ収集装置１００は、測定した各データの影響度を基に、有効な効果あるいは影響を及ぼすデータを特定する。データ収集装置１００は、測定した影響度が所定の条件を満たすデータを、有効な効果あるいは影響を及ぼすデータに特定する。例えば、データ収集装置１００は、測定した影響度が所定の閾値以上のデータを、有効な効果あるいは影響を及ぼすデータに特定する。

　以下、Influence　functionを用いた影響度の測定について、数式などを用いて記載する。Influence　functionは、例えば、機械学習のブラックボックスモデルを説明する方法としても用いられる。なお、Influence　functionについては例えば下記の文献に開示されている。
　・Understanding　Black-box　Predictions　via　Influence　Functions,　　Pang　Wei　Kho　and　Percy　Liang　<https://arxiv.org/abs/1703.04730>

　データ収集装置１００は、Influence　functionを用いることで、機械学習へのデータの寄与度を計算することができ、あるデータがどのくらいの好影響又は悪影響を与えているのかを測定する（知る）ことができる。例えば、データ収集装置１００は、以下に示すように、アルゴリズムやデータ等によって影響度を算出（測定）する。以下では、画像を入力データとする場合を一例として説明する。

　例えば、入力ｘ（画像）、を出力ｙ（ラベル）による機械学習における予測問題として捉える。各画像にはラベルが振られている、すなわち画像と正解ラベルとが対応付けられている。例えばｎ個（ｎは任意の自然数）の画像とラベルのセット（データセット）があるとすると、それぞれのラベル付き画像ｚ（単に「画像ｚ」と記載する場合がある）は、以下の式（１）のようになる。

　ここで、ある点ｚ（画像ｚ）におけるモデルのパラメータθ∈Θでの損失をＬ（ｚ，θ）とすると、全てのｎ個データでの経験損失は、以下の式（２）のように表すことができる。

　そして、この経験損失の最小化は、損失を最小化するパラメータを見つける（決定する）ことを意味するので、以下の式（３）のように表せる。

　例えば、データ収集装置１００は、式（３）を用いて損失を最小化するパラメータ（（式（３）の左辺））を算出する。ここで、経験損失は、二階微分が可能であり、パラメータθに対して凸関数であると仮定する。以下、機械学習モデルのトレーニングポイントであるデータの影響度を理解することを目標として、どのように計算をするのかを示していく。仮に、あるトレーニングポイントのデータが無い場合、機械学習モデルにどのような影響を与えるのかを考えていく。

　なお、式（３）の左辺に示す「θ」の上に「＾」（ハット）が付されたパラメータ（変数）のように、ある文字の上に「＾」が付されたパラメータ（変数）は、例えば予測値を示す。以下、式（３）の左辺に示す「θ」の上に「＾」が付されたパラメータ（変数）について文章中で言及する場合、「θ」に続けて「＾」を記載した「θ＾」で表記する。あるトレーニングポイントｚ（画像ｚ）を機械学習モデルから取り除いた場合は、以下の式（４）のように表すことができる。

　例えば、データ収集装置１００は、式（４）を用いてある学習データ（画像ｚ）を用いずに学習を行った場合のパラメータ（式（４）の左辺）を算出する。例えば、影響度は、トレーニングポイントｚ（画像ｚ）を取り除いたときと、トレーニングポイントｚを含めて全てのデータポイントがあるときとの差（差分）である。この差分は、以下の式（５）のように示される。

　ここで、画像ｚを取り除いたとき場合について再計算すると、計算コストが非常に高い。そこで、データ収集装置１００は、Influence　functionsを用いて、以下に示すように、効果的な近似よって、画像ｚを取り除いた場合を再計算（再学習）することなしに演算をする。

　この考え方は、画像ｚが微小なεによって重みづけられたとして、パラメータの変化を計算していく方法である。ここで、以下の式（６）を用いて、新たなパラメータ（式（６）の左辺）を定義する。

　１９８２年のCookとWeisbergによる先行研究の結果を利用することによって、パラメータθ＾（（式（３）の左辺））での重みづけられた画像ｚの影響度は、以下の式（７）、（８）のように書き表すことができる。

　なお、CookとWeisbergによる先行研究については例えば下記の文献に開示されている。
　・Residuals　and　Influence　in　Regression,　　Cook,　R.D.　and　Weisberg,　S　<https://conservancy.umn.edu/handle/11299/37076>

　例えば、式（７）は、ある画像ｚに対応する影響関数を示す。例えば、式（７）は、微小なεに対するパラメータの変化量を表す。また、例えば、式（８）は、ヘッシアン（ヘッセ行列）を示す。ここで、正定値を持つヘッセ行列であると仮定し、逆行列も存在する。ある点であるデータポイントｚ（画像ｚ）を取り除くことは、「ε＝－１／ｎ」によって重みづけられることと同じであると仮定すると、画像ｚを取り除いたときのパラメータ変化は近似的に、以下の式（９）のように表すことができる。

　つまり、データ収集装置１００は、再学習をすることなく、データポイントｚ（画像ｚ）を取り除いたときの影響度を測定する（求める）ことができる。

　次に、データ収集装置１００は、以下の式（１０－１）～式（１０－３）を用いて、あるテストポイントｚ_ｔｅｓｔでの損失への影響度を測定する（求める）。

　このように、あるテストポイントｚ_ｔｅｓｔでの重みづけられた画像ｚの影響度を定式化できる。そのため、データ収集装置１００は、この演算によって、機械学習モデルにおけるデータの影響度を測定する（求める）ことができる。例えば、式（１０－３）の右辺は、あるデータのロス（損失）に対する勾配、ヘッシアンの逆行列、ある学習データのロスの勾配等からなる。例えば、あるデータがモデルの予測（ロス）に与える影響は、式（１０－３）により求めることができる。なお、上記は一例であり、データ収集装置１００は、種々の演算を適宜実行し各画像が学習に与えた影響度を測定してもよい。

　また、データ収集装置１００は、後述するＧｒａｄ－ＣＡＭやＬＩＭＥについても定量的なスコアを算出し算出したスコアを基に、有効な効果あるいは影響を及ぼすデータを特定してもよい。例えば、データ収集装置１００は、Ｇｒａｄ－ＣＡＭで生成されたヒートマップの特徴を示す領域が所定の閾値以上のデータを、有効な効果あるいは影響を及ぼすデータに特定してもよい。例えば、データ収集装置１００は、ＬＩＭＥで生成された根拠用モデルの出力が所定の閾値以上のデータを、有効な効果あるいは影響を及ぼすデータに特定してもよい。なお、上記は一例であり、XAIあるいはInfluence　function等を用いて、有効な効果あるいは影響を及ぼすデータを特定可能であれば、どのような方法により学習に有効な効果あるいは影響を及ぼすデータを特定してもよい。

［１－１－４．判断の可視化（Ｇｒａｄ－ＣＡＭ、ＬＩＭＥ等）］
　更に、Ｇｒａｄ－ＣＡＭ（Gradient-weighted　Class　Activation　Mapping）、ＬＩＭＥ（Local　Interpretable　Model-agnostic　Explanations）などのExplainable　AI（XAI）と呼ばれるアルゴリズムを用いることで、ディープラーニングの判断根拠を人間が知ることができる。そのため、データ収集システム１は、Ｇｒａｄ－ＣＡＭ、ＬＩＭＥ等の手法を適宜用いて、モデルの出力（判断）に関する根拠を可視化してもよい。これによって、データ収集システム１を利用する利用者は、子供の認識が正しく行われているのかを知ることができる。以下、Ｇｒａｄ－ＣＡＭ、ＬＩＭＥ等を用いた可視化の例について簡単に記載する。

　まず、Ｇｒａｄ－ＣＡＭについて記載する。例えば、データ収集システム１は、Ｇｒａｄ－ＣＡＭにより、画像の入力後のモデルの出力（判断）に関する根拠を可視化する根拠情報を生成する。データ収集システム１は、Ｇｒａｄ－ＣＡＭにより、画像を認識するモデルＭ１が人の有無を判断した根拠を示す根拠情報を生成する。例えば、データ収集システム１は、下記の文献に開示されるようなＧｒａｄ－ＣＡＭに関する処理により、根拠情報を生成する。データ収集システム１は、ＣＮＮが含まれるネットワーク全般に適用可能な可視化手法であるＧｒａｄ－ＣＡＭの技術を用いて、モデルＭ１の出力に関する根拠を示す根拠情報を生成する。例えば、データ収集システム１は、ＣＮＮの最終層から各チャンネルの重みを計算し重みを掛け合わせることで各クラスに影響する部分を可視化することができる。このように、データ収集システム１は、ＣＮＮを含むニューラルネットワークにおいて画像のどの部分に注目して判断がなされたかを可視化することができる。

　・Grad-CAM:　Visual　Explanations　from　Deep　Networks　via　Gradient-based　Localization　<https://arxiv.org/abs/1610.02391>

　なお、Ｇｒａｄ－ＣＡＭの技術についての説明は適宜省略するが、データ収集システム１は、Ｇｒａｄ－ＣＡＭ（上記文献参照）の手法により、根拠情報を生成する。例えば、データ収集システム１は、対象とする種別（クラス）を指定して、指定したクラスに対応する情報（画像）を生成する。例えば、データ収集システム１は、Ｇｒａｄ－ＣＡＭの技術を用いて、逆誤差伝搬（Backpropagation）等の各種処理により、指定したクラスを対象に情報（画像）を生成する。例えば、データ収集システム１は、種別「子供」のクラスを指定して、種別「子供」に対応する根拠情報に関する画像を生成する。例えば、データ収集システム１は、種別「子供」の認識（分類）のために注視している範囲（領域）を、いわゆるヒートマップ（カラーマップ）の形式で示す画像を生成する。

　また、データ収集システム１は、入力となるデータ（画像）と、その判断結果の根拠を示す根拠情報とを対応付けて記憶部１２０（図３参照）にログ（履歴）として格納する。これにより、データ収集システム１がどのような入力に対する判断により、その後の動作を行ったのかを検証可能となる。また、例えば、データ収集システム１は、記憶部１２０に記憶された入力となるデータ（画像）と、その判断結果の根拠を示す根拠情報とのログを、種々の処理に利用してもよい。例えば、データ収集システム１は、入力となるデータ（画像）と、その判断結果の根拠を示す根拠情報とのログを用いて、データを生成してもよい。例えば、データ収集システム１は、根拠情報であるヒートマップが根拠として示す領域の画像を含むように、入力画像を変更した画像を生成してもよい。なお、上記は一例であり、データ収集システム１は、種々の手法を適宜用いて、ログからデータを生成してもよい。

　また、データ収集システム１は、ＬＩＭＥ等の手法により、根拠情報を生成してもよい。例えば、データ収集システム１は、下記の文献に開示されるようなＬＩＭＥに関する処理により、根拠情報を生成してもよい。

　・"Why　Should　I　Trust　You?":　Explaining　the　Predictions　of　Any　Classifier　<https://arxiv.org/abs/1602.04938>

　なお、ＬＩＭＥの技術についての説明は適宜省略するが、データ収集システム１は、ＬＩＭＥ（上記文献参照）の手法により、根拠情報を生成する。例えば、データ収集システム１は、モデルがなぜそのような判断を下したのかを理由（根拠）を示すために局所近似する他のモデル（根拠用モデル）を生成する。データ収集システム１は、入力情報とその入力情報に対応する出力結果との組合せを対象に、局所的に近似する根拠用モデルを生成する。そして、データ収集システム１は、根拠用モデルを用いて、根拠情報を生成する。

　例えば、データ収集システム１は、画像等の基となる入力情報（対象入力情報）を複製したり、変更を加えたりした複数の入力情報を生成する。そして、データ収集システム１は、根拠情報の生成対象となるモデル（説明対象モデル）に、複数の入力情報の各々を入力し、各入力情報に対応する複数の出力情報を説明対象モデルから出力させる。そして、データ収集システム１は、複数の入力情報の各々と、対応する複数の出力情報の各々との組合せ（ペア）を学習データとして、根拠用モデルを学習する。このように、データ収集システム１は、対象入力情報を対象として別の解釈可能なモデル（線形モデルとか）で局所近似する根拠用モデルを生成する。

　ここから、判断の可視化を含む処理について図１４を用いて説明する。図１４は、判断の可視化を含む処理の概念図である。である。図１４中の処理ＰＳは、データ収集システム１により実現される判断の可視化を含む処理の全体的な概念図を示す。以下に示すデータ収集システム１が処理の主体として記載されている処理については、データ収集装置１００やセンサ装置１０等のデータ収集システム１に含まれるいずれの装置が行ってもよい。

　まず、図１４中の処理ＰＳの全体的な処理概要を説明する。データ収集システム１による処理ＰＳにおいては、図１４中の入力ＩＮに示すように、学習されたモデルＮＮに入力画像ＴＤが入力される。データ収集システム１は、上述したＧｒａｄ－ＣＡＭ、ＬＩＭＥ等の可視化時術により可視化した画像判断結果や、その判断根拠のヒートマップ等の判断根拠情報ＲＳを出力装置ＯＤに表示する。出力装置ＯＤは、例えば、モニタ、ＡＲグラス、ＶＲ（Virtual　Reality：仮想現実）グラスなどである。出力装置ＯＤは、センサ装置１０と一体であってもよい。これにより、データ収集システム１では、人間が判断結果と根拠をリアルタイムに目視することができる。

　そして、データ収集システム１による処理ＰＳにおいては、図１４中の学習処理ＬＮに示すように、入力画像ＴＤや判断根拠情報ＲＳをクラウドセンター（データ収集装置１００）へ送信し、再学習を行うことでディープラーニング認識器（モデル）の認識精度を向上させることができる。そして、データ収集システム１は、再学習したモデルを、エッジ（例えば出力装置ＯＤやセンサ装置１０）へ配信して、エッジのモデルを更新する。

　なお、図１４の例では、１つのニューラルネットワークＮＮを示すが、人間の顔や体を認識する第１ディープラーニング認識器、一般物体認識用の第２ディープラーニング認識器の２つの第２ディープラーニング認識器（ニューラルネットワーク）を有してもよい。

　この場合、入力画像ＴＤは、先ず、人間の顔や体を認識する第１ディープラーニング認識器へ入力される。その結果が人物であった場合、画像判断結果とその判断根拠のヒートマップ表示をする。人物以外の場合は、一般物体認識用の第２ディープラーニング認識器にて判定され、同様に結果と判断根拠が表示される。一枚の画像に人物と物体が同時に映っていることもなるので、いずれの画像も物体認識器を通る。この場合も、出力装置ＯＤは、人間が判断結果と根拠をリアルタイムに目視することができる。

［１－２．実施形態に係るデータ収集システムの構成］
　図２に示すデータ収集システム１について説明する。データ収集システム１は、学習データを調整する調整処理を実現する情報処理システムである。図２に示すように、データ収集システム１は、データ収集装置１００と、複数のセンサ装置１０ａ、１０ｂ、１０ｃ、１０ｄとが含まれる。なお、センサ装置１０ａ、１０ｂ、１０ｃ、１０ｄ等を区別しない場合、センサ装置１０と記載する場合がある。また、図２では、４個のセンサ装置１０ａ、１０ｂ、１０ｃ、１０ｄを図示するが、データ収集システム１には、４個より多い数（例えば２０個や１００個以上）のセンサ装置１０が含まれてもよい。センサ装置１０と、データ収集装置１００とは所定の通信網（ネットワークＮ）を介して、有線または無線により通信可能に接続される。図２は、実施形態に係るデータ収集システムの構成例を示す図である。なお、図２に示したデータ収集システム１には、複数台のデータ収集装置１００が含まれてもよい。

　データ収集装置１００は、機械学習において有効な効果あるいは影響があると特定したデータ、不足すると特定したデータ、またはそれらのいずれかに類似するデータを、センサ装置１０に要求するサーバ装置（情報処理装置）である。また、データ収集装置１００は、データセットを用いて学習処理を実行する。

　センサ装置１０は、データ収集装置１００からの要求に応じてデータ収集装置１００にデータを提供する装置（コンピュータ）である。各センサ装置１０は、センサ部１６（図８参照）のセンシングによりデータを取得する。センサ装置１０は、センサ部１６によるデータ収集の対象となる主体あるいはデータの権利者の同意、センサ部１６によるセンシングを行う地点の判断規準、及びデータの収集基準のうち少なくとも１つを含む収集条件を満たすデータを、データ収集装置１００に送信する。

　図２の例では、センサ装置１０ａは、ドローン等のＵＡＶや自動車等の車両等の移動体である。例えば、センサ装置１０ａは、データ収集装置１００と通信する機能を有し、データ収集装置１００からの要求に応じた移動を行ってもよい。センサ装置１０ａは、イメージセンサ（イメージャ）等の撮像機能を有し、データ収集装置１００からの要求に応じた位置まで移動し、その位置で画像や動画を撮像し、撮像した画像や動画をデータ収集装置１００に送信する。その際、学習への効果あるいは影響に応じて、例えば、画像データの解像度、画角、輝度、フレームレートといった設定やデータの特性を変えてもよい。

　また、図２の例では、センサ装置１０ｂは、撮像機能を有するカメラである。センサ装置１０ｂは、動画や画像を撮像し、撮像したデータを保有するカメラである。例えば、センサ装置１０ｂは、データ収集装置１００からの要求に応じて、画像や動画を撮像し、撮像した画像や動画をデータ収集装置１００に送信する。

　図２の例では、センサ装置１０ｃは、撮像機能を有するイメージセンサ（イメージャ）である。例えば、センサ装置１０ｃは、データ収集装置１００と通信する機能を有し、撮像した画像や動画をデータ収集装置１００に送信する機能を有する。例えば、センサ装置１０ｃは、データ収集装置１００からの要求に応じて、画像や動画を撮像し、撮像した画像や動画をデータ収集装置１００に送信する。その際、学習への効果あるいは影響に応じて、例えば、画像データの解像度、画角、輝度、フレームレートといった設定やデータの特性を変えてもよい。

　図２の例では、センサ装置１０ｄは、ＡＲグラスである。センサ装置１０ｄは、情報を表示する機能を有するセンサ装置１０である。センサ装置１０ｄは、イメージセンサ（イメージャ）等の撮像機能を有し、データ収集装置１００からの要求に応じて、画像や動画を撮像し、撮像した画像や動画をデータ収集装置１００に送信する。例えば、センサ装置１０ｄは、画像が撮像された範囲に重畳させて、透過性を有する情報を重畳表示する。

　なお、センサ装置１０ｄは、情報を表示する機能を有すれば、どのような装置であってもよく、例えば、モニタ、ＶＲグラス、移動体（自動車等）のフロントガラスであってもよい。

　なお、センサ装置１０は、センサによるセンシングを行い、収集した情報をデータ収集装置１００へ提供可能であれば、どのような装置であってもよい。センサ装置１０は、例えば、スマートフォンや、タブレット型端末や、ノート型ＰＣ（Personal　Computer）や、デスクトップＰＣや、携帯電話機や、ＰＤＡ（Personal　Digital　Assistant）等の装置であってもよい。センサ装置１０は、上記のＡＲグラスのように、ユーザが身に着けるウェアラブル端末等であってもよい。例えば、センサ装置１０は、腕時計型端末やメガネ型端末等であってもよい。また、センサ装置１０は、テレビや冷蔵庫等のいわゆる家電製品であってもよい。例えば、センサ装置１０は、スマートスピーカやエンタテインメントロボットや家庭用ロボットと称されるような、人間（ユーザ）と対話するロボットであってもよい。また、センサ装置１０は、デジタルサイネージ等の所定の位置に配置される装置であってもよい。

［１－３．実施形態に係るデータ収集装置の構成］
　次に、実施形態に係るデータ収集処理を実行するデータ収集装置の一例であるデータ収集装置１００の構成について説明する。図３は、本開示の実施形態に係るデータ収集装置１００の構成例を示す図である。

　図３に示すように、データ収集装置１００は、通信部１１０と、記憶部１２０と、制御部１３０とを有する。なお、データ収集装置１００は、データ収集装置１００の管理者等から各種操作を受け付ける入力部（例えば、キーボードやマウス等）や、各種情報を表示するための表示部（例えば、液晶ディスプレイ等）を有してもよい。

　通信部１１０は、例えば、ＮＩＣ（Network　Interface　Card）等によって実現される。そして、通信部１１０は、ネットワークＮ（図２参照）と有線または無線で接続され、センサ装置１０等の他の情報処理装置との間で情報の送受信を行う。また、通信部１１０は、センサ装置１０との間で情報の送受信を行ってもよい。

　記憶部１２０は、例えば、ＲＡＭ（Random　Access　Memory）、フラッシュメモリ（Flash　Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部１２０は、図３に示すように、データ情報記憶部１２１と、モデル情報記憶部１２２と、少数属性情報記憶部１２３とを有する。

　実施形態に係るデータ情報記憶部１２１は、学習に用いるデータに関する各種情報を記憶する。データ情報記憶部１２１は、学習に用いる学習データ（データセット）を記憶する。図４は、本開示の実施形態に係るデータ情報記憶部の一例を示す図である。例えば、データ情報記憶部１２１は、学習に用いる学習データや精度評価（測定）に用いる評価用データ等の種々のデータに関する各種情報を記憶する。図４に、実施形態に係るデータ情報記憶部１２１の一例を示す。図４の例では、データ情報記憶部１２１は、「データセットＩＤ」、「データＩＤ」、「データ」、「属性＃１」、「属性＃２」といった項目が含まれる。

　「データセットＩＤ」は、データセットを識別するための識別情報を示す。「データＩＤ」は、オブジェクトを識別するための識別情報を示す。また、「データ」は、データＩＤにより識別されるオブジェクトに対応するデータを示す。すなわち、図４の例では、オブジェクトを識別するデータＩＤに対して、オブジェクトに対応するベクトルデータ（データ）が対応付けられて登録されている。

　「属性＃１」や「属性＃２」は、対応するデータの各対象に対応する属性を示す。「属性＃１」は、年齢に関する属性であり、各データが大人または子供のいずれに該当するかを示す。「属性＃２」は、性別に関する属性であり、各データが男性または女性のいずれに該当するかを示す。

　なお、図４の例では、属性（カテゴリ）の一例として、大人、子供、男性、女性等を例示するが、属性は上記に限らず、種々の属性であってもよい。「属性＃１」、「属性＃２」のみに限らず、「属性＃３」、「属性＃４」等、３つ以上の属性が記憶されてもよい。例えば、「属性＃３」は人種に関する属性であってもよい。また、属性は、外見に関するものに限らず、内面に関する属性であってもよく、種々のデモグラフィック属性やサイコグラフィック属性であってもよい。

　図４の例では、データセットＩＤ「ＤＳ１」により識別されるデータセット（データセットＤＳ１）には、データＩＤ「ＤＩＤ１」、「ＤＩＤ２」、「ＤＩＤ３」等により識別される複数のデータが含まれることを示す。

　データＩＤ「ＤＩＤ１」により識別されるデータＤＴ１は、大人の男性に該当するデータであることを示す。例えば、データＤＴ１は、大人の男性が撮像された画像である。

　また、データＩＤ「ＤＩＤ２」により識別されるデータＤＴ２は、子供の女性に該当するデータであることを示す。例えば、データＤＴ２は、子供の女性が撮像された画像である。図４の例では、データＤＴ２以外のデータＤＴ１、ＤＴ３～ＤＴ８は、大人が撮像された画像であり、子供が撮像された画像の割合が少ない場合を示す。

　なお、データ情報記憶部１２１は、上記に限らず、目的に応じて種々の情報を記憶してもよい。データ情報記憶部１２１は、各データに対応する正解情報（正解ラベル）を各データに対応付けて記憶する。例えば、データ情報記憶部１２１は、「属性＃１」、「属性＃２」に記憶された属性が正解情報として用いられてもよい。

　また、データ情報記憶部１２１は、各データが学習データであるか、評価用データであるか等を特定可能に記憶してもよい。例えば、データ情報記憶部１２１は、学習データと評価用データとを区別可能に記憶する。データ情報記憶部１２１は、各データが学習データや評価用データであるかを識別する情報を記憶してもよい。データ収集装置１００は、学習データとして用いられる各データと正解情報とに基づいて、モデルを学習する。データ収集装置１００は、評価用データとして用いられる各データと正解情報とに基づいて、モデルの精度を測定する。データ収集装置１００は、評価用データを入力した場合にモデルが出力する出力結果と、正解情報とを比較した結果を収集することにより、モデルの精度を測定する。

　実施形態に係るモデル情報記憶部１２２は、モデルに関する情報を記憶する。例えば、モデル情報記憶部１２２は、モデル（ネットワーク）の構造を示す情報（モデルデータ）を記憶する。図５は、本開示の実施形態に係るモデル情報記憶部の一例を示す図である。図５に、実施形態に係るモデル情報記憶部１２２の一例を示す。図５に示した例では、モデル情報記憶部１２２は、「モデルＩＤ」、「用途」、「モデルデータ」といった項目が含まれる。

　「モデルＩＤ」は、モデルを識別するための識別情報を示す。「用途」は、対応するモデルの用途を示す。「モデルデータ」は、モデルのデータを示す。図５では「モデルデータ」に「ＭＤＴ１」といった概念的な情報が格納される例を示したが、実際には、モデルに含まれるネットワークに関する情報や関数等、そのモデルを構成する種々の情報が含まれる。

　図５に示す例では、モデルＩＤ「Ｍ１」により識別されるモデル（モデルＭ１）は、用途が「画像認識」であることを示す。モデルＭ１は、画像認識に用いられるモデルである。例えば、モデルＭ１は、人の検出に用いられる。また、モデルＭ１のモデルデータは、モデルデータＭＤＴ１であることを示す。

　なお、モデル情報記憶部１２２は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、モデル情報記憶部１２２は、学習処理により学習（生成）されたモデルのパラメータ情報を記憶する。

　実施形態に係る少数属性情報記憶部１２３は、少数属性（少数カテゴリ）に関する各種情報を記憶する。図６は、実施形態に係る少数属性情報記憶部の一例を示す図である。図６に示す少数属性情報記憶部１２３には、「少数属性」、「割合」といった項目が含まれる。

　「少数属性」は、少数属性を示す。「少数属性」は、データ情報記憶部１２１に格納された保有データにおいて、割合が所定の閾値（例えば０．１や０．１５等）よりも少ない属性を示す。また、「割合」は、データ情報記憶部１２１に格納された保有データにおいて、少数属性に該当するデータの割合の具体的な値を示す。

　図６の例では、「子供」が少数属性に該当することを示す。少数属性「子供」の割合は、「０．０２」であることを示す。この場合、データ情報記憶部１２１に格納された保有データのうち、２％は子供が撮像された画像であり、残りの９８％は大人が撮像された画像であることを示す。

　なお、少数属性情報記憶部１２３は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

　図３に戻り、説明を続ける。制御部１３０は、例えば、ＣＰＵ（Central　Processing　Unit）やＭＰＵ（Micro　Processing　Unit）等によって、データ収集装置１００内部に記憶されたプログラム（例えば、本開示に係るデータ収集処理プログラム等の情報処理プログラム）がＲＡＭ（Random　Access　Memory）等を作業領域として実行されることにより実現される。また、制御部１３０は、コントローラ（controller）であり、例えば、ＡＳＩＣ（Application　Specific　Integrated　Circuit）やＦＰＧＡ（Field　Programmable　Gate　Array）等の集積回路により実現される。

　図３に示すように、制御部１３０は、選定部１３１と、送信部１３２と、受信部１３３と、情報処理部１３４と、学習部１３５とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１３０の内部構成は、図３に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部１３０が有する各処理部の接続関係は、図３に示した接続関係に限られず、他の接続関係であってもよい。

　選定部１３１は、各種の選定を行う選定処理を実行する。選定部は、データ解析部として機能する。選定部１３１は、各種情報を基に選定処理を行う。選定部１３１は、機械学習に用いるデータに含まれるデータ構成の偏りや機械学習における有効な効果や影響に応じて、センサ装置１０に要求するデータを選定する。選定部１３１は、データ情報記憶部１２１に格納済みの保有データに含まれるデータ構成の偏りやXAIにより特定された学習に有効な影響等があるデータに応じて、センサ装置１０に要求するデータを選定する。

　選定部１３１は、保有データを基に不足すると特定したデータを特定する。選定部１３１は、保有データに含まれるデータが他の属性よりも少ない少数属性のデータ又はそれに類似するデータをセンサ装置１０に要求するデータに選定する。選定部１３１は、データ情報記憶部１２１に格納済みの保有データに含まれるデータが該当する属性のうち、該当するデータが少ない少数属性のデータをセンサ装置１０に要求するデータに決定する。

　送信部１３２は、各種情報を送信する。送信部１３２は、学習モデルの学習に有効なデータ、不足するデータ又はそれらのいずれかに類似するデータを収集する要求信号をセンサ装置５０に送信する。送信部１３２は、センサ装置１０等の外部の装置へ各種情報を要求する。送信部１３２は、センサ装置１０へデータを指定する要求情報を送信することにより、センサ装置１０へデータを要求する。

　送信部１３２は、保有データを基に必要と選定したデータを、センサ部１６を有するセンサ装置１０に要求する。送信部１３２は、選定部１３１により選定されたデータをセンサ装置１０に要求する。送信部１３２は、画像を撮像する画像センサを有するセンサ装置１０にデータを要求する。

　受信部１３３は、各種情報を受信する。受信部１３３は、外部の情報処理装置から各種情報を受信する。受信部１３３は、センサ装置１０から各種情報を取得する。

　受信部１３３は、記憶部１２０から各種情報を取得する。受信部１３３は、データ情報記憶部１２１やモデル情報記憶部１２２や少数属性情報記憶部１２３から各種情報を取得する。

　受信部１３３は、センサ装置５０から要求信号に対応するデータを受信する。１３３は、センサ部１６によるデータ収集の対象となる主体のあるいはデータの権利者の同意、センサ部１６によるデータ収集を行う地点の判断規準、及びデータの収集基準のうち少なくとも１つを含む収集条件を満たすデータを、センサ装置１０から受信する。受信部１３３は、人を含む画像をセンサ装置１０から受信する。

　情報処理部１３４は、各種情報を変更処理する。情報処理部１３４は、画像を編集することにより、画像を変更する。情報処理部１３４は、元の画像を変更することにより、変更後の画像を生成する。情報処理部１３４は、画像中の人の顔を人とは異なる別人の顔に変更する。情報処理部１３４は、画像中の人の顔がモザイク加工されている場合、モザイク加工された領域を別人の顔に変更する。

　情報処理部１３４は、画像中の人の顔を別人の顔に変更する。情報処理部１３４は、顔認識の技術等により画像中から人物の顔が含まれる領域を特定し、特定した領域を別人の顔に置き換える編集を行うことにより、画像中の人の顔が別人の顔に変更された変更後の画像を生成する。情報処理部１３４は、ＧＡＮ（Generative　Adversarial　Network：敵対的生成ネットワーク）の技術を用いて、画像中の人の顔を別人の顔に変更する。情報処理部１３４は、記憶部１２０に記憶された顔画像の使用を許可した人（許可ユーザ）の顔の画像を用いて、画像中の人の顔を、許可ユーザの顔に変更してもよい。

　また、情報処理部１３４は、画像中にモザイク加工がされている領域がある場合、その領域に別人の顔を配置した変更後の画像を生成する。情報処理部１３４は、画像認識の技術等により画像中からモザイク加工が施された領域を特定し、特定した領域を別人の顔に置き換える編集を行うことにより、別人の顔が配置された変更後の画像を生成する。

　学習部１３５は、各種情報を学習する。学習部１３５は、外部の情報処理装置からの情報や記憶部１２０に記憶された情報に基づいて、各種情報を学習する。学習部１３５は、データ情報記憶部１２１に記憶された情報に基づいて、各種情報を学習する。学習部１３５は、学習により生成したモデルをモデル情報記憶部１２２に格納する。

　学習部１３５は、学習処理を行う。学習部１３５は、各種学習を行う。学習部１３５は、受信部１３３により受信された情報に基づいて、各種情報を学習する。学習部１３５は、モデルを学習（生成）する。学習部１３５は、モデル等の各種情報を学習する。学習部１３５は、学習によりモデルを生成する。学習部１３５は、種々の機械学習に関する技術を用いて、モデルを学習する。例えば、学習部１３５は、モデル（ネットワーク）のパラメータを学習する。学習部１３５は、種々の機械学習に関する技術を用いて、モデルを学習する。

　学習部１３５は、ネットワークのパラメータを学習する。例えば、学習部１３５は、モデルＭ１のネットワークのパラメータを学習する。学習部１３５は、モデルＭ１のネットワークのパラメータを学習する。

　学習部１３５は、データ情報記憶部１２１に記憶された学習データ（教師データ）に基づいて、学習処理を行う。学習部１３５は、データ情報記憶部１２１に記憶された学習データを用いて、学習処理を行うことにより、モデルＭ１を生成する。例えば、学習部１３５は、画像認識に用いられるモデルを生成する。学習部１３５は、モデルＭ１のネットワークのパラメータを学習することにより、モデルＭ１を生成する。

　学習部１３５による学習の手法は特に限定されないが、例えば、ラベル情報（画像中の物体や人を示すラベル等）と画像群とを紐づけた学習データを用意し、その学習データを多層ニューラルネットワークに基づいた計算モデルに入力して学習してもよい。また、例えばＣＮＮ（Convolutional　Neural　Network）、３Ｄ－ＣＮＮ等のＤＮＮ（Deep　Neural　Network）に基づく手法が用いられてもよい。学習部１３５は、映像等の動画像（動画）のような時系列データを対象とする場合、再帰型ニューラルネットワーク（Recurrent　Neural　Network：ＲＮＮ）やＲＮＮを拡張したＬＳＴＭ（Long　Short-Term　Memory　units）に基づく手法を用いてもよい。

　学習部１３５は、データセットを用いて学習処理を実行する。学習部１３５は、受信部１３３により受信されたデータを学習データに追加し、当該データが追加された学習データを用いて、ニューラルネットワークの学習処理を実行する。学習部１３５は、追加後のデータセットを用いて、学習処理を実行することにより、モデルＭ１を更新する。

［１－３－１．モデル（ネットワーク）例］
　上述したように、データ収集装置１００は、ディープニューラルネットワーク（ＤＮＮ）等のニューラルネットワーク（ＮＮ）の形式のモデル（ネットワーク）を用いてもよい。なお、データ収集装置１００は、ニューラルネットワークに限らず、ＳＶＭ（Support　Vector　Machine）等の回帰モデルや等の種々の形式のモデル（関数）を用いてもよい。このように、データ収集装置１００は、任意の形式のモデル（関数）を用いてもよい。データ収集装置１００は、非線形の回帰モデルや線形の回帰モデル等、種々の回帰モデルを用いてもよい。

　この点について、図７を用いて、モデルのネットワーク構造の一例を説明する。図７は、モデルに対応するネットワークの一例を図である。図７に示すネットワークＮＷ１は、入力層ＩＮＬと出力層ＯＵＴＬとの間に複数（多層）の中間層を含むニューラルネットワークを示す。図７に示すネットワークＮＷ１は、図１中のニューラルネットワークであるモデルＭ１に対応する。例えば、データ収集装置１００は、図７に示すネットワークＮＷ１のパラメータを学習してもよい。

　図７に示すネットワークＮＷ１は、モデルＭ１のネットワークに対応し、画像認識に用いられるニューラルネットワーク（モデル）を示す概念的な図である。例えば、ネットワークＮＷ１は、入力層ＩＮＬ側から例えば画像が入力された場合に、出力層ＯＵＴＬからその認識結果を出力する。例えば、データ収集装置１００は、ネットワークＮＷ１中の入力層ＩＮＬに情報を入力することにより、出力層ＯＵＴＬから入力に対応する認識結果を出力させる。

　なお、図７では、モデル（ネットワーク）の一例としてネットワークＮＷ１を示すが、ネットワークＮＷ１は、用途等に応じて種々の形式であってもよい。例えば、データ収集装置１００は、図７に示すネットワークＮＷ１の構造を有するモデルＭ１のパラメータ（重み）を学習することにより、モデルＭ１を学習する。

［１－４．実施形態に係るセンサ装置の構成］
　次に、実施形態に係る情報処理を実行するセンサ装置の一例であるセンサ装置１０の構成について説明する。図８は、本開示の実施形態に係るセンサ装置の構成例を示す図である。

　図８に示すように、センサ装置１０は、通信部１１と、入力部１２と、出力部１３と、記憶部１４と、制御部１５と、センサ部１６とを有する。なお、センサ装置１０は、データを収集し、データ収集装置１００へ提供可能な構成であれば、どのような装置構成であってもよい。例えば、センサ装置１０は、データ収集装置１００と通信する通信部１１と、データを収集する処理を行う制御部１５とを有すれば、その他の構成は任意であってもよい。センサ装置１０の種別によっては、例えば、センサ装置１０は、入力部１２や出力部１３や記憶部１４やセンサ部１６のいずれかを有しなくてもよい。

　例えば、センサ装置１０がイメージセンサ（イメージャ）である場合、センサ装置１０は、通信部１１と制御部１５とセンサ部１６のみを有する構成であってもよい。例えば、イメージセンサ（イメージャ）に用いられる撮像素子は、ＣＭＯＳ（Complementary　Metal　Oxide　Semiconductor：相補型金属酸化膜半導体）である。なお、イメージセンサ（イメージャ）に用いられる撮像素子は、ＣＭＯＳに限らず、ＣＣＤ（Charge　Coupled　Device：電荷結合素子）等、種々の撮像素子であってもよい。また、例えば、センサ装置１０がデータサーバである場合、センサ装置１０は、通信部１１と記憶部１４と制御部１５のみを有する構成であってもよい。また、例えば、センサ装置１０が移動体である場合、センサ装置１０は、駆動部（モータ）等の移動を実現するための機構を有する構成であってもよい。

　通信部１１は、例えば、ＮＩＣや通信回路等によって実現される。通信部１１は、ネットワークＮ（インターネット等）と有線又は無線で接続され、ネットワークＮを介して、データ収集装置１００等の他の装置等との間で情報の送受信を行う。

　入力部１２は、各種入力を受け付ける。入力部１２は、ユーザの操作を受け付ける。入力部１２は、ユーザが利用するセンサ装置１０への操作（ユーザ操作）をユーザによる操作入力として受け付けてもよい。入力部１２は、通信部１１を介して、リモコン（リモートコントローラー：remote　controller）を用いたユーザの操作に関する情報を受け付けてもよい。また、入力部１２は、センサ装置１０に設けられたボタンや、センサ装置１０に接続されたキーボードやマウスを有してもよい。

　例えば、入力部１２は、リモコンやキーボードやマウスと同等の機能を実現できるタッチパネルを有してもよい。この場合、入力部１２は、ディスプレイ（出力部１３）を介して各種情報が入力される。入力部１２は、各種センサにより実現されるタッチパネルの機能により、表示画面を介してユーザから各種操作を受け付ける。すなわち、入力部１２は、センサ装置１０のディスプレイ（出力部１３）を介してユーザから各種操作を受け付ける。例えば、入力部１２は、センサ装置１０のディスプレイ（出力部１３）を介してユーザの操作を受け付ける。

　出力部１３は、各種情報を出力する。出力部１３は、情報を表示する機能を有する。出力部１３は、センサ装置１０に設けられ各種情報を表示する。出力部１３は、例えば液晶ディスプレイや有機ＥＬ（Electro-Luminescence）ディスプレイ等によって実現される。なお、センサ装置１０がＡＲグラスである場合、出力部１３は、透過性を有するディスプレイを有する。出力部１３は、音声を出力する機能を有してもよい。例えば、出力部１３は、音声を出力するスピーカーを有する。

　記憶部１４は、例えば、ＲＡＭ、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部１４は、情報の表示に用いる各種情報を記憶する。記憶部１４は、収集条件記憶部１４１と、データ記憶部１４２とを有する。

　実施形態に係る収集条件記憶部１４１は、データの収集条件に関する各種情報を記憶する。収集条件記憶部１４１は、学習に用いるデータとして、収集するデータの条件を記憶する。図９は、本開示の実施形態に係る収集条件記憶部の一例を示す図である。図４の例では、収集条件記憶部１４１は、「条件ＩＤ」、「収集条件情報」といった項目が含まれる。

　「条件ＩＤ」は、収集条件を識別するための識別情報を示す。「収集条件情報」は、収集するデータの条件を示す。図９の例では、条件ＩＤ「ＣＤ１」により識別される収集条件は、収集条件情報ＩＮＦ１であることを示す。図９の例では「ＩＮＦ１」のように抽象的に図示するが、「収集条件情報」には、どのようなデータを収集するかを示す具体的な基準を示す情報が記憶されてもよい。

　「収集条件情報」には、プライバシに関する収集条件が記憶される。「収集条件情報」には、センサによるデータ収集の対象となる主体あるいはデータの権利者の同意、センサによるデータ収集を行う地点の判断規準、及びデータの収集基準のうち少なくとも１つを含む収集条件が記憶される。「収集条件情報」には、画像に含まれる人の同意が必要かどうかを示す収集条件が記憶される。「収集条件情報」には、センサによるデータ収集を行う国や行政区画の法律や条例に基づく収集基準を示す収集条件が記憶される。「収集条件情報」には、人の顔が含まれる画像の場合に、人の顔を編集するか否かを示す情報が記憶される。

　なお、収集条件記憶部１４１は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

　データ記憶部１４２には、センサ部１６のデータ収集により取得したデータに関する各種情報が記憶される。データ記憶部１４２には、画像センサ１６１により撮像された画像を記憶する。

　データ記憶部１４２は、取得した各データに、そのデータを識別するための識別情報（ＩＤ）や収集した日時を対応付けて記憶する。また、センサ部１６が画像や音声等の複数の種別のデータ収集を行う場合、各データに、そのデータの種別を対応付けて記憶する。また、データ記憶部１４２には、各データに、そのデータの収集対象となる主体（人）あるいはデータの権利者の同意の有無を示す情報を対応付けて記憶する。例えば、データ記憶部１４２には、データの学習への利用について、そのデータの収集対象となる主体（人）による同意がある場合、そのデータに人の同意を取得済みであることを示す情報を対応付けて記憶する。

　図８に戻り、説明を続ける。制御部１５は、例えば、ＣＰＵやＭＰＵ等によって、センサ装置１０内部に記憶されたプログラム（例えば、本開示に係るデータ提供プログラム等の情報処理プログラム）がＲＡＭ等を作業領域として実行されることにより実現される。また、制御部１５は、コントローラであり、例えば、ＡＳＩＣやＦＰＧＡ等の集積回路により実現されてもよい。

　図８に示すように、制御部１５は、受信部１５１と、取得部１５２と、データ処理部１５３と、送信部１５４とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１５の内部構成は、図８に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。

　受信部１５１は、各種情報を受信する。受信部１５１は、外部の情報処理装置から各種情報を受信する。受信部１５１は、データ収集装置１００等の他の情報処理装置から各種情報を受信する。

　受信部１５１は、データ収集装置１００が必要とするデータを示す情報を受信する。受信部１５１は、データ収集装置１００から要求情報を受信する。

　取得部１５２は、各種情報を取得する。取得部１５２は、記憶部１４から各種情報を取得する。取得部１５２は、収集条件記憶部１４１やデータ記憶部１４２から各種情報を取得する。

　取得部１５２は、受信部１５１により受信された要求情報に対応するデータを取得する。取得部１５２は、受信部１５１により受信された要求情報に対応するデータを、データ記憶部１４２から抽出する。取得部１５２は、属性「子供」に該当するデータを抽出する。

　データ処理部１５３は、情報を編集するデータ処理を行う。データ処理部１５３は、センサ部１６により収集されたセンサ情報を編集する。データ処理部１５３は、画像センサ１６１により収集された画像を編集する。

　データ処理部１５３は、センサ部１６により収集されたデータが収集条件を満たさない場合、収集条件を満たすように当該データを編集する。データ処理部１５３は、センサ部１６により撮像された画像がプライバシに関する収集条件を満たさない場合、プライバシを保護する修正により画像を編集する。

　データ処理部１５３は、画像がプライバシに関する収集条件を満たさない場合、画像に含まれる人の顔を加工する。データ処理部１５３は、人の顔をモザイク加工する。データ処理部１５３は、人の顔を人とは異なる別人の顔に変更する。データ処理部１５３は、該当者の同意がない場合、画像に含まれる該当者の顔を加工する。

　データ処理部１５３は、取得部１５２により抽出された各対象画像中の人の顔をモザイク加工する。データ処理部１５３は、顔認識の技術等により画像中から人物の顔が含まれる領域を特定し、特定した領域をモザイク加工することにより、人の顔にモザイク加工が施された編集済み画像を生成する。

　データ処理部１５３は、画像中の人の顔を別人の顔に変更する編集を行う。データ処理部１５３は、顔認識の技術等により画像中から人物の顔が含まれる領域を特定し、特定した領域を別人の顔に置き換える編集を行うことにより、画像中の人の顔が別人の顔に変更された編集済み画像を生成する。データ処理部１５３は、ＧＡＮの技術を用いて、画像中の人の顔を別人の顔に変更する。データ処理部１５３は、記憶部１４に記憶された顔画像の使用を許可した人（許可ユーザ）の顔の画像を用いて、画像中の人の顔を、許可ユーザの顔に変更してもよい。

　送信部１５４は、外部の情報処理装置へ各種情報を送信する。例えば、送信部１５４は、データ収集装置１００等の他の情報処理装置へ各種情報を送信する。送信部１５４は、記憶部１４に記憶された情報を送信する。送信部１５４は、データ収集装置１００等の他の情報処理装置からの要求に応じて、各種情報を送信する。送信部１５４は、記憶部１４に記憶された情報を、各種情報を送信する。

　送信部１５４は、センサ部１６により収集されたセンサ情報をデータ収集装置１００へ送信する。送信部１５４は、センサ部１６の画像センサ１６１（イメージセンサ）により撮像された画像をデータ収集装置１００へ送信する。

　送信部１５４は、要求情報に対応するデータとして収集された提供用データを外部装置へ送信する。送信部１５４は、要求情報に対応するデータとして収集された提供用データをデータ収集装置１００へ送信する。送信部１５４は、取得部１５２により取得されたデータをデータ収集装置１００へ送信する。送信部１５４は、データ処理部１５３により編集された編集済み画像群を含む収集用データをデータ収集装置１００へ送信する。

　送信部１５４は、センサ部１６によるデータ収集の対象となる主体の同意、センサ部１６によるデータ収集を行う地点の判断規準、及びデータの収集基準のうち少なくとも１つを含む収集条件を満たすデータを、データ収集装置１００に送信する。送信部１５４は、データ収集装置１００からのデータの要求に応じて、データをデータ収集装置１００に送信する。

　送信部１５４は、データ処理部１５３により編集され、収集条件を満たすデータをデータ収集装置１００に送信する。送信部１５４は、主体である人のプライバシに関する収集条件を満たすデータをデータ収集装置１００に送信する。送信部１５４は、データ処理部１５３により編集された画像をデータ収集装置１００に送信する。送信部１５４は、データ処理部１５３により該当者の顔が編集された画像をデータ収集装置１００に送信する。

　センサ部１６は、センサを有する。センサ部１６は、画像を撮像する画像センサ１６１を有する。センサ部１６は、画像センサ１６１により、データ収集装置１００が要求する属性に該当する該当者の画像を撮像する。

　なお、センサ部１６は、上記に限らず、種々のセンサを有してもよい。センサ部１６は、音センサ、位置センサ、加速度センサ、ジャイロセンサ、温度センサ、湿度センサ、照度センサ、圧力センサ、近接センサ、ニオイや汗や心拍や脈拍や脳波等の生体情報を受信のためのセンサ等の種々のセンサを有してもよい。また、センサ部１６における上記の各種情報を収集するセンサは共通のセンサであってもよいし、各々異なるセンサにより実現されてもよい。

［１－５．実施形態に係る情報処理の手順］
　次に、図１０～図１２を用いて、実施形態に係る各種情報処理の手順について説明する。

［１－５－１．データ収集装置に係る処理の手順］
　まず、図１０を用いて、本開示の実施形態に係るデータ収集装置に係る処理の流れについて説明する。図１０は、本開示の実施形態に係るデータ収集装置の処理を示すフローチャートである。具体的には、図１０は、データ収集装置１００による情報処理の手順を示すフローチャートである。

　図１０に示すように、データ収集装置１００は、データを要求する要求信号をセンサ装置に送信する（ステップＳ１０１）。例えば、データ収集装置１００は、入力に対して学習結果に応じた出力を行う学習モデルの学習に有効なデータ、不足するデータ又は当該データに類似するデータを収集する要求信号をセンサ装置１０に送信する。そして、データ収集装置１００は、要求に対応するデータをセンサ装置から受信する（ステップＳ１０２）。例えば、データ収集装置１００は、センサ装置１０から要求信号に対応するデータを受信する。

［１－５－２．センサ装置に係る処理の手順］
　次に、図１１を用いて、本開示の実施形態に係るデータ収集装置に係る処理の流れについて説明する。図１１は、本開示の実施形態に係るセンサ装置の処理を示すフローチャートである。具体的には、図１１は、センサ装置１０による情報処理の手順を示すフローチャートである。

　図１１に示すように、センサ装置１０は、データを要求する要求信号を受信する（ステップＳ２０１）。例えば、センサ装置１０は、データ収集装置１００より、データ収集装置１００が使用する学習モデルの学習に有効なデータ、不足するデータ又は当該データに類似したデータを要求する要求信号を受信する。そして、センサ装置１０は、収集したデータをサーバ装置へ送信する（ステップＳ２０２）。例えば、センサ装置１０は、要求信号に基づいて、有効なデータ、不足するデータ又は類似したデータを収集し、収集したデータをデータ収集装置１００へ送信する。

［１－５－３．データ収集システムに係る処理の手順］
　次に、図１２を用いて、データ収集システムに係る具体的な処理の一例について説明する。図１２は、本開示の実施形態に係るデータ収集システムの処理手順を示すシーケンス図である。

　図１２に示すように、センサ装置１０は、センサによりデータを取得する（ステップＳ３０１）。例えば、センサ装置１０は、画像センサ１６１により画像を取得する。

　データ収集装置１００は、機械学習に用いる保有データを基に必要なデータを決定する（ステップＳ３０２）。例えば、データ収集装置１００は、少数属性のデータを必要なデータに決定する。

　データ収集装置１００は、データをセンサ装置１０に要求する（ステップＳ３０３）。例えば、データ収集装置１００は、少数属性「子供」が撮影された画像をセンサ装置１０に要求する。

　センサ装置１０は、データを編集する（ステップＳ３０４）。例えば、センサ装置１０は、画像中の子供の顔をモザイク編集する。センサ装置１０は、編集後のデータをデータ収集装置１００へ送信する（ステップＳ３０５）。例えば、センサ装置１０は、画像中の子供の顔をモザイク加工した編集後の画像をデータ収集装置１００へ送信する。

　センサ装置１０からデータを受信したデータ収集装置１００は、受信したデータを学習データとして追加する（ステップＳ３０６）。例えば、データ収集装置１００は、受信した編集後の画像を学習に用いるデータセットに追加する。

［１－６．少数属性のデータ収集及び学習処理例］
　ここで、図１３を用いて少数属性のデータ収集及び学習処理例について説明する。図１３は、少数属性のデータ収集及び学習の処理の一例を示すフローチャートである。以下でデータ収集システム１が処理の主体として記載されている処理については、データ収集システム１に含まれるデータ収集装置１００とセンサ装置１０とのいずれの装置が行ってもよい。

　図１３に示すように、データ収集システム１は、少数属性のデータを収集する（ステップＳ４０１）。例えば、データ収集システム１は、センサ装置１０が子供の画像を撮影し、データ収集装置１００へ送信することにより、少数属性「子供」の画像を収集する。これにより、データ収集システム１は、少数属性「子供」の画像を蓄積データＡＤに追加する。

　そして、データ収集システム１は、再学習を行う（ステップＳ４０２）。例えば、データ収集システム１は、少数属性「子供」の画像を追加した蓄積データＡＤを学習データとして用いて、データ収集装置１００がモデル（ネットワーク）の再学習を行う。

　そして、データ収集システム１は、データバイアスのチェックを行う（ステップＳ４０３）。データ収集システム１は、データバイアスありと判定した場合（ステップＳ４０３：データバイアスあり）、ステップＳ４０１に戻って処理を繰り返す。また、データ収集システム１は、データバイアスなしと判定した場合（ステップＳ４０３：データバイアスなし）、再学習の処理を終了する。

　また、データ収集システム１は、ステップＳ４０２で再学習したネットワークにシステムのネットワークを入れ替える。データ収集システム１は、モデル（ネットワーク）のパラメータを、ステップＳ４０２での再学習後のパラメータに更新する。

　上述のように、データ収集システム１は、データバイアスがなければ、これ以上のデータ収集は行う必要がなく終了する。データバイアスが生じている場合には、データ収集システム１は、少数データのデータ収集を行う。このようなループによって構築された再学習ネットワークを自動運転に搭載することで、データに起因するＡＩ倫理問題を解決することができる。データ収集システム１では、今まで子供が認識し難かったが、再学習によって子供の認識率の向上を実現することができる。

［１－７．判断根拠の表示等］
　次に、判断根拠のリアルタイムな表示の点等について記載する。ディープラーニングの結果やその判断根拠をリアルタイムに動画を表示することに意義がある。しかしながら、ディープラーニングでの画像において、リアルタイムに動画を表示することは、非常に重い処理を強いられる。例えば、人物・物体認識において、４Ｋなどの高解像度の動画をリアルタイムに表示させることは難しい。そこで、ディープラーニングの結果や判断根拠だけをＡＲグラス又は透過型モニタ等の出力装置ＯＤ（図１４参照）へ表示させ、実世界の映像は画像表示せずに直接みることを構成するシステム（例えばデータ収集システム１）にて、高速動画処理が可能となる。

　例えば、車載カメラ等のセンサ装置１０を用いた人物や物体の認識を行うシステム（例えばデータ収集システム１）において、認識した人物や物体の結果と判断根拠（例えば、バウンディングボックスやヒートマップ）のみをＡＲグラス又は透過型モニタ等の出力装置ＯＤに表示させて、実世界と重畳させることができる。このような構成のシステム（例えばデータ収集システム１）は、実世界での車外の映像を表示デバイスへ取り込まないので、処理が非常に軽いという特徴がある。その他、ＶＲグラス等の出力装置ＯＤを用いた人物や物体の認識を行うシステム（例えばデータ収集システム１）は、３６０度の全天球での視野角を持つことから、より広範囲な認識を行うことができる。

　コンピュータ（情報処理装置）を用いた人物や物体の認識において、少数データ属性の認識率の低さが公平性を損なう恐れがある。例えば、認識しにくい肌の色、子供などの小さい人間など、データ数が少ない場合に、人物・物体認識での認識率が多数データ属性に比べて低くなるという不公平が生じてしまう。このような不公平は、実用面において、ＡＩ倫理として望ましくなく、少数データ属性へ不利な結果を及ぼしてしまう恐れがある。

　例えば、車載システムにおいて、認識しにくい肌の色、子供などの小さい人間の認識率が低ければ、そのような少数データ属性は、自動車事故に巻き込まれる確率が高くなってしまう。そこで、車載カメラにて撮影したデータを保存して、クラウドへアップするシステムが考えられる。クラウド上にて、新規に撮影されたデータを追加して再学習することで、ディープニューラルネットワークの精度を向上することができる。その際に問題となるのは、個人情報の保護である。

　例えば、車載カメラにて撮影されたデータは、鮮明な顔画像を含んだものもある。また、車載カメラにて撮影された通行人の承諾を得ることは、困難な場合がある。そこで、車載カメラで撮影された映像に顔認識をして、顔画像へ自動的にモザイクをかける処理、又は、顔画像の解像度を落とす処理を施す。個人を特定できない情報へ変換してから、クラウドへアップロードするという手順を踏むことによって、個人情報の保護とデータ活用を両立することが可能となる。クラウド上にて、追加データを含んだディープニューラルネットワークの再学習をする。そして、その再学習されたディープニューラルネットワークを車載システムへアップデート配信することによって、モデルの精度を向上させることができる。

　上述した処理をデータ収集システム１で行う場合の処理例について、図１５を用いて説明する。図１５は、モデルのアップデート処理の一例を示すフローチャートである。この場合、データ収集システム１は、少なくともセンサ装置１０として、移動体であるセンサ装置１０ａを有する。以下でデータ収集システム１が処理の主体として記載されている処理については、データ収集システム１に含まれるデータ収集装置１００とセンサ装置１０とのいずれの装置が行ってもよい。

　図１５に示すように、まず、データ収集システム１は、カメラで映像を取得する（ステップＳ５０１）。例えば、センサ装置１０は、画像センサ１６１の撮像により映像を取得する。

　そして、データ収集システム１は、人物の顔を検出する（ステップＳ５０２）。例えば、センサ装置１０は、映像に含まれる人物の顔を検出する。

　そして、データ収集システム１は、顔の部分にモザイクをかける、又は、解像度を落とす（ステップＳ５０３）。これにより、データ収集システム１は、個人を特定できないデータへ変換する。例えば、センサ装置１０は、顔の部分にモザイクをかける、又は、解像度を落とす処理を実行する。

　そして、データ収集システム１は、データを追加して再学習を行う（ステップＳ５０４）。例えば、データ収集装置１００は、センサ装置１０からデータを取得し、取得したデータを学習データに追加して、再学習を行う。

　そして、データ収集システム１は、再学習したモデルへアップデートを行う（ステップＳ５０５）。例えば、データ収集装置１００は、モデル（ネットワーク）のパラメータを、ステップＳ４０４での再学習後のパラメータに更新する。

［２．その他の実施形態］
　上述した各実施形態に係る処理は、上記各実施形態や変形例以外にも種々の異なる形態（変形例）にて実施されてよい。

［２－１．その他の構成例］
　なお、上記の例では、データ収集装置１００とセンサ装置１０とが別体である場合を示したが、これらの装置は一体であってもよい。例えば、データ収集装置１００は、センサ部１６を有し、必要なデータを自装置のセンサ部１６によりセンシングし取得する機能を有する装置であってもよい。データ収集装置１００は、カメラ、スマホ、テレビ、自動車、ドローン、ロボット、ＡＲグラス等であってもよい。このように、データ収集装置１００は、自律的に必要なデータを収集するセンサ装置であってもよい。

［２－２．データ］
　上述した例では、画像センサ１６１が撮像する画像をデータの一例として説明したが、データは画像に限らず、種々のセンサによりセンシングされたデータであってもよい。すなわち、センサは、画像センサ１６１に限らず、種々の種別のデータをセンシングするセンサであってもよい。例えば、センサは、マイク等の音をセンシングする音センサであってもよい。この場合、データ収集装置１００は、センサ装置１０に必要とする音声データを要求する。センサ装置１０は、音センサにより音声データを取得し、データ収集装置１００へ送信する。データ収集装置１００は、取得した音声データを学習データとして用いてニューラルネットワーク（モデル）を学習する。

［２－２．その他］
　また、上記各実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

　また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

　また、上述してきた各実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

　また、本明細書に記載された効果はあくまで例示であって限定されるものでは無く、他の効果があってもよい。

［３．本開示に係る効果］
　上述のように、本開示に係るデータ収集システム（実施形態ではデータ収集システム１）は、データを収集するセンサ装置（実施形態ではセンサ装置１０）と、入力に対して学習結果に応じた出力を行う学習モデルと、学習モデルの学習に有効なデータまたは不足するデータを特定するデータ解析部（実施形態では選定部１３１）を有するサーバ装置（実施形態ではデータ収集装置１００）とを備え、サーバ装置は、データ解析部により特定された学習に有効なデータ、不足するデータ又は当該データに類似するデータを収集する要求信号をセンサ装置に送信し、センサ装置は受信した要求信号に基づき学習に有効なデータ、不足するデータ又は類似するデータを収集し、収集したデータをサーバ装置へ送信し、サーバ装置は、センサ装置から送信されたデータに基づき学習モデルの再学習を行う。

　このように、本開示に係るデータ収集システムは、センサ装置にデータを要求し、センサ装置がサーバ装置に要求に対応するデータを送信することにより、機械学習に用いる所望のデータを収集することができる。

　また、データ取集システムは、センサ装置によるデータ収集において、少なくとも、データ収集の対象となる主体あるいは当該データの権利者の同意、又は、データ収集を行う地点の判断規準を満たすデータを選定してサーバ装置へ送信する。このように、センサ装置は、サーバ装置からのデータの要求に応じて、データをサーバ装置に送信することにより、機械学習に用いる所望のデータを収集することができる。

　上述のように、本開示に係るセンサ装置は、データを収集するセンサ装置において、外部装置より、サーバ装置が使用する学習モデルの学習に有効なデータ、不足するデータ又は当該データに類似したデータを要求する要求信号を受信する受信部（実施形態では受信部１５１）を備え、要求信号に基づいて、有効なデータ、不足するデータ又は類似したデータを収集し、収集したデータをサーバ装置へ送信する。

　このように、本開示に係るセンサ装置は、外部からの要求に応じて、データをサーバ装置に送信することにより、機械学習に用いる所望のデータを収集することができる。

　また、センサ装置は、少なくとも、データ収集の対象となる主体あるいは当該データの権利者の同意、又は、データ収集を行う地点の判断規準を満たすデータをサーバ装置へ送信する。このように、センサ装置は、所定の条件を満たすデータをサーバ装置に送信することにより、機械学習に用いる所望のデータを収集することができる。

　また、センサ装置は、イメージセンサ（実施形態では画像センサ１６１）を備え、要求信号に応じて、解像度、輝度、画角、又は、フレームレートを変更して、サーバ装置に送信する。このように、センサ装置は、要求信号に応じて、解像度、輝度、画角、又は、フレームレートを変更して送信することにより、機械学習に用いる所望のデータを収集することができる。

　また、本開示に係るセンサ装置は、データ処理部（実施形態ではデータ処理部１５３）を備え、データ処理部により、所定の処理がなされたデータをサーバ装置へ送信する。データ処理部は、収集したデータを編集する。このように、センサ装置は、収集したデータを編集することにより、所望のデータを収集することができる。

　また、データ処理部は、プライバシの保護に関する処理を行う。このように、センサ装置は、プライバシの保護に関する処理を行うことにより、データ収集の対象となる人のプライバシを保護しつつ、所望のデータを収集することができる。

　また、データ処理部は、データに含まれる人の顔を変形する。このように、センサ装置は、人の顔をモザイク加工することにより、プライバシに関する収集条件を満たしつつ、所望のデータを収集することができる。

　また、データ処理部は、人の顔を人とは異なる別人の顔に変更する。このように、センサ装置は、人の顔を別人の顔に変更することにより、プライバシに関する収集条件を満たしつつ、所望のデータを収集することができる。

　また、イメージセンサは、少数属性に該当する該当者の画像を取得する。このように、センサ装置は、少数属性に該当する該当者の画像を取得することで、サーバ装置が必要とする画像を取得することができるため、所望のデータを収集することができる。

　また、データ処理部は、該当者の同意がない場合、データ中の該当者の顔を編集する。このように、センサ装置は、サーバ装置の要求に応じて撮像した該当者の同意がない場合、該当者の顔を編集することにより、該当者のプライバシを保護しつつ、所望のデータを収集することができる。

　上述のように、本開示に係るデータ収集装置（実施形態ではデータ収集装置１００）は、送信部（実施形態では送信部１３２）と、受信部（実施形態では受信部１３３）とを備える。送信部は、入力に対して学習結果に応じた出力を行う学習モデルの学習に有効なデータ、不足するデータ又は当該データに類似するデータを収集する要求信号をセンサ装置に送信する。受信部は、センサ装置から要求信号に対応するデータを受信する。

　このように、本開示に係るデータ収集装置は、データをセンサ装置に要求し、センサ装置からデータを受信することにより、機械学習に用いる所望のデータを収集することができる。

　また、本開示に係るデータ収集装置は、データ解析部を備える。データ解析部は、学習に有効なデータまたは不足するデータを特定する。このように、データ収集装置は、必要なデータを特定し、センサ装置に要求することで、機械学習に用いる所望のデータを収集することができる。

　また、本開示に係るデータ収集装置は、学習部（実施形態では学習部１３５）を備える。学習部は、センサ装置から受信したデータを学習データに追加し、追加後の学習データを用いて、ニューラルネットワークの学習処理を実行する。このように、データ収集装置は、センサ装置からのデータ追加後の学習データを用いて、ニューラルネットワークの学習処理を実行することで、精度良いモデルが学習可能な学習データを用いて学習を行うことができる。

　また、送信部は、イメージセンサを有するセンサ装置にデータを要求する。このように、データ収集装置は、イメージセンサを有するセンサ装置にデータを要求することで、機械学習に用いる所望のデータを収集することができる。

　また、受信部は、人を含むデータをセンサ装置から受信する。このように、データ収集装置は、人を含むデータを収集することができる。

　また、本開示に係るデータ収集装置は、情報処理部（実施形態では情報処理部１３４）を備える。情報処理部は、人の顔を人とは異なる別人の顔に変更する。このように、データ収集装置は、データ中の人の顔を人とは異なる別人の顔に変更することにより、撮影された人のプライバシを保護しつつ、所望のデータを収集することができる。

　また、情報処理部は、人の顔がモザイク加工されている場合、モザイク加工された領域を別人の顔に変更する。このように、データ収集装置は、モザイク加工された領域を別人の顔に変更することにより、撮影された人ではない別人の顔が含まれるデータを学習に用いることができるため、撮影された人のプライバシを保護しつつ、精度良いモデルが学習可能になる。

［４．ハードウェア構成］
　上述してきた各実施形態や変形例に係るデータ収集装置１００やセンサ装置１０や出力装置ＯＤ等の情報機器は、例えば図１６に示すような構成のコンピュータ１０００によって実現される。図１６は、データ収集装置やセンサ装置等の情報機器の機能を実現するコンピュータの一例を示すハードウェア構成図である。以下、実施形態に係るデータ収集装置１００を例に挙げて説明する。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ（Read　Only　Memory）１３００、ＨＤＤ（Hard　Disk　Drive）１４００、通信インターフェイス１５００、及び入出力インターフェイス１６００を有する。コンピュータ１０００の各部は、バス１０５０によって接続される。

　ＣＰＵ１１００は、ＲＯＭ１３００又はＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。例えば、ＣＰＵ１１００は、ＲＯＭ１３００又はＨＤＤ１４００に格納されたプログラムをＲＡＭ１２００に展開し、各種プログラムに対応した処理を実行する。

　ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるＢＩＯＳ（Basic　Input　Output　System）等のブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

　ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を非一時的に記録する、コンピュータが読み取り可能な記録媒体である。具体的には、ＨＤＤ１４００は、プログラムデータ１４５０の一例である本開示に係る情報処理プログラムを記録する記録媒体である。

　通信インターフェイス１５００は、コンピュータ１０００が外部ネットワーク１５５０（例えばインターネット）と接続するためのインターフェイスである。例えば、ＣＰＵ１１００は、通信インターフェイス１５００を介して、他の機器からデータを受信したり、ＣＰＵ１１００が生成したデータを他の機器へ送信したりする。

　入出力インターフェイス１６００は、入出力デバイス１６５０とコンピュータ１０００とを接続するためのインターフェイスである。例えば、ＣＰＵ１１００は、入出力インターフェイス１６００を介して、キーボードやマウス等の入力デバイスからデータを受信する。また、ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやスピーカーやプリンタ等の出力デバイスにデータを送信する。また、入出力インターフェイス１６００は、所定の記録媒体（メディア）に記録されたプログラム等を読み取るメディアインターフェイスとして機能してもよい。メディアとは、例えばＤＶＤ（Digital　Versatile　Disc）、ＰＤ（Phase　change　rewritable　Disk）等の光学記録媒体、ＭＯ（Magneto-Optical　disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

　例えば、コンピュータ１０００が実施形態に係るデータ収集装置１００として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされた情報処理プログラムを実行することにより、制御部１３０等の機能を実現する。また、ＨＤＤ１４００には、本開示に係る情報処理プログラムや、記憶部１２０内のデータが格納される。なお、ＣＰＵ１１００は、プログラムデータ１４５０をＨＤＤ１４００から読み取って実行するが、他の例として、外部ネットワーク１５５０を介して、他の装置からこれらのプログラムを取得してもよい。

　なお、本技術は以下のような構成も取ることができる。
（１）
　データを収集するセンサ装置と、
　入力に対して学習結果に応じた出力を行う学習モデルと、前記学習モデルの学習に有効なデータまたは不足するデータを特定するデータ解析部を有するサーバ装置とを備え、
　前記サーバ装置は、前記データ解析部により特定された学習に有効なデータ、不足するデータ又は当該データに類似するデータを収集する要求信号を前記センサ装置に送信し、
　前記センサ装置は受信した前記要求信号に基づき前記学習に有効なデータ、前記不足するデータ又は類似するデータを収集し、収集した前記データを前記サーバ装置へ送信し、
　前記サーバ装置は、前記センサ装置から送信されたデータに基づき前記学習モデルの再学習を行うことを特徴とするデータ収集システム。
（２）
　前記データ取集システムは、前記センサ装置によるデータ収集において、少なくとも、前記データ収集の対象となる主体あるいは当該データの権利者の同意、又は、前記データ収集を行う地点の判断規準を満たすデータを選定して前記サーバ装置へ送信することを特徴とする（１）に記載のデータ収集システム。
（３）
　データを収集するセンサ装置において、
　外部装置より、サーバ装置が使用する学習モデルの学習に有効なデータ、不足するデータ又は当該データに類似したデータを要求する要求信号を受信する受信部を備え、
　前記要求信号に基づいて、前記有効なデータ、前記不足するデータ又は類似したデータを収集し、収集したデータを前記サーバ装置へ送信することを特徴とするセンサ装置。
（４）
　前記センサ装置は、少なくとも、前記データ収集の対象となる主体あるいは当該データの権利者の同意、又は、前記データ収集を行う地点の判断規準を満たすデータを前記サーバ装置へ送信することを特徴とする（３）に記載のセンサ装置。
（５）
　前記センサ装置は、イメージセンサを備え、前記要求信号に応じて、解像度、輝度、画角、又は、フレームレートを変更して、前記サーバ装置に送信することを特徴とする（３）または（４）に記載のセンサ装置。
（６）
　収集したデータを編集するデータ処理部、
　をさらに備え、
　前記データ処理部により、所定の処理がなされたデータを前記サーバ装置へ送信する
　ことを特徴とする（５）に記載のセンサ装置。
（７）
　前記データ処理部は、
　プライバシの保護に関する処理を行う、
　（６）に記載のセンサ装置。
（８）
　前記データ処理部は、
　データに含まれる人の顔を変形する
　（７）に記載のセンサ装置。
（９）
　前記データ処理部は、
　前記人の顔をモザイク加工する
　（８）に記載のセンサ装置。
（１０）
　前記データ処理部は、
　前記人の顔を前記人とは異なる別人の顔に変更する
　（９）に記載のセンサ装置。
（１１）
　前記イメージセンサは、
　少数属性に該当する該当者の画像を取得する
　（６）～（１０）のいずれか１つに記載のセンサ装置。
（１２）
　前記データ処理部は、
　前記該当者の同意がない場合、データ中の前記該当者の顔を編集する
　（１１）に記載のセンサ装置。
（１３）
　入力に対して学習結果に応じた出力を行う学習モデルの学習に有効なデータ、不足するデータ又は当該データに類似するデータを収集する要求信号をセンサ装置に送信する送信部と、
　前記センサ装置から前記要求信号に対応するデータを受信する受信部と、
　を備えるデータ収集装置。
（１４）
　前記学習に有効なデータまたは前記不足するデータを特定するデータ解析部、
　をさらに備え、
　前記送信部は、
　前記データ解析部により特定されたデータを前記センサ装置に要求する
　（１３）に記載のデータ収集装置。
（１５）
　前記センサ装置から受信したデータを学習データに追加し、追加後の前記学習データを用いて、ニューラルネットワークの学習処理を実行する学習部、
　をさらに備える（１３）または（１４）に記載のデータ収集装置。
（１６）
　前記送信部は、
　イメージセンサを有する前記センサ装置にデータを要求する
　（１３）～（１５）のいずれか１つに記載のデータ収集装置。
（１７）
　前記受信部は、
　人を含むデータを前記センサ装置から受信する
　（１６）に記載のデータ収集装置。
（１８）
　前記人の顔を前記人とは異なる別人の顔に変更する情報処理部、
　をさらに備える（１７）に記載のデータ収集装置。
（１９）
　前記情報処理部は、
　前記人の顔がモザイク加工されている場合、モザイク加工された領域を前記別人の顔に変更する
　（１８）に記載のデータ収集装置。
（２０）
　センサ装置がデータを収集し、
　入力に対して学習結果に応じた出力を行う学習モデルと、前記学習モデルの学習に有効なデータまたは不足するデータを特定するデータ解析部を有するサーバ装置が、前記データ解析部により特定された学習に有効なデータ、不足するデータ又は当該データに類似するデータを収集する要求信号を前記センサ装置に送信し、
　前記センサ装置が受信した前記要求信号に基づき前記学習に有効なデータ、前記不足するデータ又は類似するデータを収集し、収集した前記データを前記サーバ装置へ送信し、
　前記サーバ装置が前記センサ装置から送信されたデータに基づき前記学習モデルの再学習を行う、
　処理を実行するデータ収集方法。

　１　データ収集システム
　１００　データ収集装置（サーバ装置）
　１１０　通信部
　１２０　記憶部
　１２１　データ情報記憶部
　１２２　モデル情報記憶部
　１２３　少数属性情報記憶部
　１３０　制御部
　１３１　選定部（データ解析部）
　１３２　送信部
　１３３　受信部
　１３４　情報処理部
　１３５　学習部
　１０　センサ装置
　１１　通信部
　１２　入力部
　１３　出力部
　１４　記憶部
　１４１　収集条件記憶部
　１４２　データ記憶部
　１５　制御部
　１５１　受信部
　１５２　取得部
　１５３　データ処理部
　１５４　送信部
　１６　センサ部（センサ）

Claims

　データを収集するセンサ装置と、
　入力に対して学習結果に応じた出力を行う学習モデルと、前記学習モデルの学習に有効なデータまたは不足するデータを特定するデータ解析部を有するサーバ装置とを備え、
　前記サーバ装置は、前記データ解析部により特定された学習に有効なデータ、不足するデータ又は当該データに類似するデータを収集する要求信号を前記センサ装置に送信し、
　前記センサ装置は受信した前記要求信号に基づき前記学習に有効なデータ、前記不足するデータ又は類似するデータを収集し、収集した前記データを前記サーバ装置へ送信し、
　前記サーバ装置は、前記センサ装置から送信されたデータに基づき前記学習モデルの再学習を行うことを特徴とするデータ収集システム。
　前記データ取集システムは、前記センサ装置によるデータ収集において、少なくとも、前記データ収集の対象となる主体あるいは当該データの権利者の同意、又は、前記データ収集を行う地点の判断規準を満たすデータを選定して前記サーバ装置へ送信することを特徴とする請求項１に記載のデータ収集システム。
　データを収集するセンサ装置において、
　外部装置より、サーバ装置が使用する学習モデルの学習に有効なデータ、不足するデータ又は当該データに類似したデータを要求する要求信号を受信する受信部を備え、
　前記要求信号に基づいて、前記有効なデータ、前記不足するデータ又は類似したデータを収集し、収集したデータを前記サーバ装置へ送信することを特徴とするセンサ装置。
　前記センサ装置は、少なくとも、前記データ収集の対象となる主体あるいは当該データの権利者の同意、又は、前記データ収集を行う地点の判断規準を満たすデータを選定して前記サーバ装置へ送信することを特徴とする請求項３に記載のセンサ装置。
　前記センサ装置は、イメージセンサを備え、前記要求信号に応じて、解像度、輝度、画角、又は、フレームレートを変更して、前記サーバ装置へ送信することを特徴とする請求項３に記載のセンサ装置。
　収集したデータを編集するデータ処理部、
　をさらに備え、
　前記データ処理部により、所定の処理がなされたデータを前記サーバ装置へ送信する
　ことを特徴とする請求項５に記載のセンサ装置。
　前記データ処理部は、
　プライバシの保護に関する処理を行う、
　請求項６に記載のセンサ装置。
　前記データ処理部は、
　データに含まれる人の顔を変形する
　請求項７に記載のセンサ装置。
　前記データ処理部は、
　前記人の顔をモザイク加工する
　請求項８に記載のセンサ装置。
　前記データ処理部は、
　前記人の顔を前記人とは異なる別人の顔に変更する
　請求項９に記載のセンサ装置。
　前記イメージセンサは、
　少数属性に該当する該当者の画像を取得する
　請求項６に記載のセンサ装置。
　前記データ処理部は、
　前記該当者の同意がない場合、データ中の前記該当者の顔を変更する
　請求項１１に記載のセンサ装置。
　入力に対して学習結果に応じた出力を行う学習モデルの学習に有効なデータ、不足するデータ又は当該データに類似するデータを収集する要求信号をセンサ装置に送信する送信部と、
　前記センサ装置から前記要求信号に対応するデータを受信する受信部と、
　を備えるデータ収集装置。
　前記学習に有効なデータまたは前記不足するデータを特定するデータ解析部、
　をさらに備え、
　前記送信部は、
　前記データ解析部により特定されたデータを前記センサ装置に要求する
　請求項１３に記載のデータ収集装置。
　前記センサ装置から受信したデータを学習データに追加し、追加後の前記学習データを用いて、ニューラルネットワークの学習処理を実行する学習部、
　をさらに備える請求項１３に記載のデータ収集装置。
　前記送信部は、
　イメージセンサを有する前記センサ装置にデータを要求する
　請求項１３に記載のデータ収集装置。
　前記受信部は、
　人を含むデータを前記センサ装置から受信する
　請求項１６に記載のデータ収集装置。
　前記人の顔を前記人とは異なる別人の顔に変更する情報処理部、
　をさらに備える請求項１７に記載のデータ収集装置。
　前記情報処理部は、
　前記人の顔がモザイク加工されている場合、モザイク加工された領域を前記別人の顔に変更する
　請求項１８に記載のデータ収集装置。
　センサ装置がデータを収集し、
　入力に対して学習結果に応じた出力を行う学習モデルと、前記学習モデルの学習に有効なデータまたは不足するデータを特定するデータ解析部を有するサーバ装置が、前記データ解析部により特定された学習に有効なデータ、不足するデータ又は当該データに類似するデータを収集する要求信号を前記センサ装置に送信し、
　前記センサ装置が受信した前記要求信号に基づき前記学習に有効なデータ、前記不足するデータ又は類似するデータを収集し、収集した前記データを前記サーバ装置へ送信し、
　前記サーバ装置が前記センサ装置から送信されたデータに基づき前記学習モデルの再学習を行う、
　処理を実行するデータ収集方法。