JP2023535851A

JP2023535851A - プライバシー保護によるデータ処理モデルの取得方法、装置、ターミナル機器及び記憶媒体

Info

Publication number: JP2023535851A
Application number: JP2022520859A
Authority: JP
Inventors: 信黄
Original assignee: Ennew Digital Technology Co Ltd
Current assignee: Ennew Digital Technology Co Ltd
Priority date: 2020-08-05
Filing date: 2021-06-21
Publication date: 2023-08-22
Also published as: WO2022028131A1; US20220229904A1; CN114091090A

Abstract

プライバシー保護によるデータ処理モデルの取得方法、装置、ターミナル機器及び記憶媒体であって、該方法は、プリセットＩｏＴ機器のセンサデータを取得するステップと、センサデータにより各センサに対応する初期データモデルをトレーニングし、各センサに対応する中間データモデルを取得するとともに、各センサに対応する中間データモデルを集合して集合データモデルを形成するステップと、集合データモデル及びランダムノイズにより新たなデータを処理し、新たなデータに対応するタグ種別を取得するステップと、新たなデータ及び前記新たなデータのタグ種別に基づいて、集合データモデルをトレーニングし、データモデルを取得するステップと、を含む。本開示の提供するプライバシー保護によるデータ処理モデルの取得方法は、複数のセンサデータに複数のモデルを構築し、全てのモデルを統合するとともにノイズ外乱を加える方法であり、これによってモノのインターネットデータのプライバシー保護性が低いという技術的問題を解決する。【選択図】図１

Description

本発明はモノのインターネットの技術分野に属し、特にプライバシー保護によるデータ処理モデルの取得方法、装置、ターミナル機器及び記憶媒体に関する。

現在、モノのインターネットは既にインターネットの重要な構成要素となり、グローバルモノのインターネット機器の数が高速に増加しており、将来のモノのインターネットにおいて任意の個人、グループ、コミュニティ、組織、オブジェクト、製品、データ、サービス、プロセス及び活動は、モノのインターネットにより相互に接続され、モノのインターネットにおける個人データプライバシー及び営業秘密はモノのインターネットの発展を制限する重要な短所となり、現在、モノのインターネットのセキュリティ及びプライバシー技術に関する研究及び解決的手段は、良好な保障作用を果たしておらず、モノのインターネットのセキュリティ上の潜在的なリスクは、ますます多くの懸念を引き起こしている。従来の中心化の深層学習は、ユーザーがデータをデータセンターに提出してから、クラウドサーバにより統一的にトレーニングを行うように要求する。しかしながら、これらのデータは、モデルトレーニング者に悪用され、より多くの関連ユーザーのプライバシー情報が推定される可能性がある。

これに鑑みて、本発明の実施例は、プライバシー保護によるデータ処理モデルの取得方法、装置、ターミナル機器及びコンピュータ可読記憶媒体を提供し、モノのインターネットデータのプライバシー保護性が低いという技術的問題を解決することを目的とする。

本発明の実施例の第一態様は、プライバシー保護によるデータ処理モデルの取得方法を提供し、
プリセットＩｏＴ機器の複数のセンサのセンサデータを取得するステップと、
対応する初期データモデルをトレーニングし、各前記センサに対応する中間データモデルを取得するとともに、各前記センサに対応する中間データモデルを集合して集合データモデルを形成するステップと、
前記集合データモデル及びランダムノイズにより新たなデータを処理し、前記新たなデータに対応するタグ種別を取得するステップと、
前記新たなデータ及び前記新たなデータのタグ種別に基づいて、前記集合データモデルをトレーニングし、データモデルを取得するステップと、を含む。

本発明の実施例の第二態様は、プライバシー保護によるデータ処理モデルの取得装置を提供し、
プリセットＩｏＴ機器の複数のセンサのセンサデータを取得するデータ収集モジュールと、
前記センサに対応するセンサデータにより各前記センサに対応する初期データモデルをトレーニングし、各前記センサに対応する中間データモデルを取得するとともに、各前記センサに対応する中間データモデルを集合して集合データモデルを形成するデータ統合モジュールと、
前記集合データモデル及びランダムノイズにより新たなデータを処理し、前記新たなデータに対応するタグ種別を取得するノイズ追加モジュールと、
前記新たなデータ及び前記新たなデータのタグ種別に基づいて、前記集合データモデルをトレーニングし、データモデルを取得するデータ処理モジュールと、を含む。

本発明の実施例の第三態様は、ターミナル機器を提供し、メモリ、プロセッサ及び前記メモリに記憶され、且つ前記プロセッサで実行可能なコンピュータプログラムを含み、前記プロセッサが前記コンピュータプログラムを実行する時に、前記プライバシー保護によるデータ処理モデルの取得方法のステップを実現する。

本発明の実施例の第四態様は、コンピュータ可読記憶媒体を提供し、前記コンピュータ可読記憶媒体にコンピュータプログラムが記憶され、前記コンピュータプログラムがプロセッサにより実行される時に、前記プライバシー保護によるデータ処理モデルの取得方法のステップを実現する。

本発明の実施例が提供するプライバシー保護によるデータ処理モデルの取得方法の有益な効果は、少なくとも以下のとおりである。本発明の実施例はまずセンサデータを取得することにより、センサデータを用いて初期モデルをトレーニングし、対応する中間データモデルを取得し、集合して集合データモデルを形成し、次に集合データモデル及びランダムノイズにより新たなデータを処理し、新たなデータに対応するタグ種別を取得し、最後に新たなデータ及び対応するタグ種別を用いて、集合データモデルをトレーニングし、データモデルを取得することによって、複数の参加者は、データを共有する必要がなく機械学習モデルを構築することができる。本発明は複数のセンサデータに複数のモデルを構築し、全てのモデルを統合するとともにノイズ外乱を加える方法であり、最終的に１つの総合的な結果を取得し、これによって単一のセンサモデルより高い表現効果を取得する。モデルにノイズを加えて、ある程度の不確定性を導入することにより、任意の個人ユーザー、任意のＩｏＴ個人の貢献を十分にマスキングし、参加者のプライバシーを保護し、それによってモノのインターネットデータのプライバシー保護性が低いという技術的問題を解決する。

本発明の実施例における技術的解決手段をより明確に説明するために、以下、実施例又は従来技術の説明に必要な図面を簡単に紹介し、明らかに、以下に説明する図面は本発明のいくつかの実施例に過ぎず、当業者にとって、創造的作業の必要がない前提で、これらの図面に基づいて他の図面を取得することができる。

本発明の実施例が提供するプライバシー保護によるデータ処理モデルの取得方法の実現フローチャートである。本発明の実施例が提供する集合データモデル及びランダムノイズにより新たなデータを処理し新たなデータに対応するタグ種別を取得する実現フローチャートである。本発明の実施例が提供する新たなデータ及び新たなデータのタグ種別に基づいて、集合データモデルをトレーニングし、データモデルを取得する実現フローチャートである。本発明の実施例が提供するプライバシー保護によるデータ処理モデルの取得方法装置の実現フローチャートである。本発明の実施例が提供するターミナル機器の概略図である。

下記の説明において、限定ではなく、説明するために、例えば特定のシステム構造、技術のような具体的詳細を提供することにより、本発明の実施例を徹底的に理解する。しかしながら、当業者は、これらの具体的詳細がない他の実施例においても本発明を実現できることを分かるすべきである。他の場合には、周知のシステム、装置、回路及び方法についての詳細な説明を省略し、不要な詳細が本発明の説明を妨げることを回避する。説明される本発明の実施例により、当業者が取得した全ての他の実施例は、いずれも本発明の保護範囲に属する。特に明示しない場合、実施例で用いられる技術的手段は当業者によってよく知られている一般的な手段である。

本明細書及び添付する特許請求の範囲において使用される場合に、用語「含む」は説明される特徴、全体、ステップ、操作、要素及び／又はアセンブリの存在を表すが、１つ又は複数の他の特徴、全体、ステップ、操作、要素、アセンブリ及び／又はその組み合わせの存在又は追加を排除するものではないと理解すべきである。

さらに、ここで本願の明細書で使用される用語は特定の実施例を説明する目的だけで、本願を限定することを意図しない。本願の明細書及び添付する特許請求の範囲で使用されるように、コンテキストが他の状況を明確に明示しない限り、単数形式の「一」、「１つ」及び「該」は複数の形式を含むとも理解すべきである。

さらに、本願の明細書及び添付する特許請求の範囲において使用される用語「及び／又は」は関連して列挙された項のうちの１つ又は複数の任意の組み合わせ及び全ての可能な組み合わせを指し、かつこれらの組み合わせを含むとも理解すべきである。

本明細書及び添付する特許請求の範囲で使用されるように、用語「…すると…」については、コンテキストに基づいて「…時に」又は「一旦」あるいは「確定に応答する」又は「検出に応答する」と解釈することができる。同様に、フレーズ「確定すると」又は「［説明した条件又は事件］を検出すると」は、コンテキストに基づいて「確定したら」又は「確定に応答する」、あるいは「説明した条件又は事件］を検出したら」又は「［説明した条件又は事件］を検出したら」という意味と解釈することができる。
第一実施例

図１は本発明の一実施例で提供するプライバシー保護によるデータ処理モデルの取得方法の実現フローチャートである。

図１に示すように、該データ処理モデルの取得方法は、以下のステップを含む。

ステップＳ１０：プリセットＩｏＴ機器の複数のセンサのセンサデータを取得する。

本実施例では、プリセットＩｏＴ機器の複数のセンサは同じタイプのセンサであり、プリセットＩｏＴ機器はガスタービン、電気メーター、ボイラー又は他の機器であってもよい。センサは、温度センサ、煙センサ、心拍数センサ、距離センサ、光センサ、音センサ、気体センサ、化学センサ、感圧センサ、流体センサ又は他のタイプのセンサを含む。

本実施例において、センサデータは同一タイプ、統一モデルのＩｏＴ機器から由来し、例えば統一モデルガスタービン、電気メーター、ボイラー又は他の機器である。センサデータを取得する時に、センサ故障、電圧、電機故障又は他の予知できない原因で、各センサが完全なデータを収集することができるわけではなく、選択がある場合には、好ましくは複数の相対的に完全なデータである。

ステップＳ２０：前記センサに対応するセンサデータにより各前記センサに対応する初期データモデルをトレーニングし、各前記センサに対応する中間データモデルを取得するとともに、各前記センサに対応する中間データモデルを集合して集合データモデルを形成する。

本実施例において、複数のセンサは、同じ初期データモデルを採用してもよく、或いは、複数のセンサは同じタイプ、異なる超パラメータの初期データモデルを採用してもよく、或いは、複数の前記センサのうちの少なくとも２つのセンサの初期データモデルが異なる。

本実施例において、複数のセンサデータに複数のモデルを構築することにより、複数の参加者は機械学習モデルを構築することができるとともに、データを共有する必要がなく、それによって単一のセンサモデルよりも高い効果を得る。

本実施例において、初期データモデルはニューラルネットワークモデル、サポートベクターマシン、ロジスティック回帰モデル、決定木モデル又は他のデータモデルを含む。

ステップＳ３０：前記集合データモデル及びランダムノイズにより新たなデータを処理し、前記新たなデータに対応するタグ種別を取得する。

本実施例において、ランダムノイズにより新たなデータを処理し、ある程度の不確定性を導入することにより、任意の個人ユーザー、任意のＩｏＴ個人の貢献を十分にマスキングし、参加者のプライバシーを保護する。

ステップＳ４０：前記新たなデータ及び前記新たなデータのタグ種別に基づいて、前記集合データモデルをトレーニングし、データモデルを取得する。

本実施例において、前記新たなデータ及び前記新たなデータのタグ種別に基づいて、前記集合データモデルをトレーニングし、データセキュリティを保証する場合に、モデルのパフォーマンス効果を向上させる。

図２は、本発明の実施例が提供する集合データモデル及びランダムノイズにより新たなデータを処理し新たなデータに対応するタグ種別を取得する実現フローチャートである。

本実施例において、前記新たなデータに対応するタグ種別を取得するために、ステップＳ３０は具体的に四態様を含む。

ステップＳ３０１：新たなデータを集合データモデルにおける各中間データモデルにそれぞれ入力し、各中間データモデルから出力されたタグ種別を取得する。

本実施例において、新たなデータはセンサデータに属せず、且つ一般的に鈍感データ、例えば公開データセット又は他の相対的に鈍感なデータである。

ステップＳ３０２：タグ種別に基づいて、各タグ種別の初期投票数を確定する。

ステップＳ３０３：初期投票数に加えて、ランダムノイズを導入し、各タグ種別の投票数を取得する。

本実施例において、ランダムノイズはラプラシアンノイズを含み、ラプラシアンノイズはLap(1/ε)であり、εはプライバシーコストであり、その密度関数は、
であり、
ここで、ｘは新たなデータであり、ｂは1/εである。

好ましくは、タグ種別の最大投票数は、
であり、
ここで、ｘは新たなデータであり、
ｊはタグ種別であり、
は新たなデータｘがタグ種別ｊに属する初期投票数である。

例えば、１０個のセンサデータセットがあり、各データセットは１つのモデルをトレーニングし、モデル１～１０の入力ｘに対する出力タグは（２，３，２，１，２，３，２，４，１，２）であり、タグ種別は１～５であると、１０個のモデルのタグ種別（１，２，３，４，５）に対する投票結果は
である。

投票結果（２，５，２，１，０）をε＝０．１のラプラシアンノイズを加えると、投票結果は（２，５，２，１，０）から（２．２０，４．８９，１．８２，１．０７，０．０５）になり、ノイズ外乱を加えた後にｘが入力されたタグ種別は依然として２である（タグ２に対応する投票数は４．８９が最大である）。

ステップＳ３０４：各タグ種別の投票数に基づいて、投票数が所定の条件を満たすタグ種別を前記新たなデータのタグ種別として確定する。

図３は、本発明の実施例が提供する新たなデータ及び新たなデータのタグ種別に基づいて、集合データモデルをトレーニングし、データモデルを取得する実現フローチャートである。

図３に示すように、ステップＳ４０は具体的に四態様を含む。

ステップＳ４０１：所定のルールに基づいて、新たなデータ及び新たなデータのタグ種別を採用して、集合データモデルをトレーニングする。

本実施例において、所定のルールはモデル精度又はサイクル回数を含む。

ステップＳ４０２：所定のルールに達した後、トレーニングを停止し、対象データモデルを取得する。

ステップＳ４０３：センサデータ及び統合データモデルを廃棄する。

ステップＳ４０４：対象データモデルを配信する。

本実施例において、配信された対象モデルは元のセンサデータと分離されるため、攻撃者が配信モデルのモデルパラメータを入手しても、元のセンサデータを推定することができず、それによって我々の元のセンサデータに対して保護の役割を果たす。

本発明の実施例はまずセンサデータを取得することにより、センサデータを用いて初期モデルをトレーニングし、対応する中間データモデルを取得し、集合して集合データモデルを形成し、次に集合データモデル及びランダムノイズにより新たなデータを処理し、新たなデータに対応するタグ種別を取得し、最後に新たなデータ及び対応するタグ種別を用いて、集合データモデルをトレーニングし、データモデルを取得することによって、複数の参加者は、データを共有する必要がなく機械学習モデルを構築することができる。本発明は複数のセンサデータに複数のモデルを構築し、全てのモデルを統合するとともにノイズ外乱を加える方法であり、最終的に１つの総合的な結果を取得し、これによって単一のセンサモデルより高い表現効果を取得する。モデルにノイズを加えて、ある程度の不確定性を導入することにより、任意の個人ユーザー、任意のＩｏＴ個人の貢献を十分にマスキングし、参加者のプライバシーを保護し、それによってモノのインターネットデータのプライバシー保護性が低いという技術的問題を解決する。

理解すべきこととして、上記実施例における各ステップの番号の大きさは実行順序の前後を意味するものではなく、各プロセスの実行順序はその機能及び固有論理で確定されるべきであり、本発明の実施例の実施プロセスを任意に限定するものではない。
第二実施例

第一実施例における方法と同じ発明思想に基づき、それに応じて、本実施例はプライバシー保護によるデータ処理モデルの取得装置を更に提供する。

図４に示すように、本実施例において、プライバシー保護によるデータ処理モデル取得装置はデータ収集モジュール４１、データ統合モジュール４２、ノイズ追加モジュール４３及びデータ処理モジュール４４を含む。

ここで、前記データ収集モジュール４１は、プリセットＩｏＴ機器の複数のセンサのセンサデータを取得するためのものである。

前記データ統合モジュール４２は、前記センサに対応するセンサデータにより各前記センサに対応する初期データモデルをトレーニングし、各前記センサに対応する中間データモデルを取得するとともに、各前記センサに対応する中間データモデルを集合して集合データモデルを形成するためのものである。

前記ノイズ追加モジュール４３は、前記集合データモデル及びランダムノイズにより新たなデータを処理し、前記新たなデータに対応するタグ種別を取得するためのものである。

前記データ処理モジュール４４は、前記新たなデータ及び前記新たなデータのタグ種別に基づいて、前記集合データモデルをトレーニングし、データモデルを取得するためのものである。

一実施例において、前記ノイズ追加モジュール４３は、新たなデータを集合データモデルにおける各中間データモデルにそれぞれ入力し、各中間データモデルから出力されたタグ種別を取得するためのデータ取得モジュールと、タグ種別に基づいて、各タグ種別の初期投票数を確定するための第一確定モジュールと、初期投票数に加えてランダムノイズを導入し、各タグ種別の投票数を取得するためのノイズ追加サブモジュールと、各タグ種別の投票数に基づいて、投票数が所定の条件を満たすタグ種別を前記新たなデータのタグ種別として確定するための第二確定モジュールと、を含む。

一実施例において、前記データ処理モジュール４４は、所定のルールに基づいて、新たなデータ及び新たなデータのタグ種別を用いて、集合データモデルをトレーニングするためのデータトレーニングモジュールと、所定のルールに達した後、トレーニングを停止し、対象データモデルを取得するためのモデル取得モジュールと、センサデータ及び統合データモデルを廃棄するための廃棄モジュールと、対象データモデルを配信するための配信モデルモジュールと、を含む。

いくつかの実施例において、本開示実施例の提供する装置が有する機能又は含まれるモジュールは、上記方法の実施例に記載の方法を実行するために用いることができ、その具体的な実現について、上記方法の実施例の説明を参照することができ、簡潔のために、ここで説明を省略する。
第三実施例

上記方法及び装置は、例えばデスクトップコンピュータ、ノートパソコン、パームトップコンピュータ及びクラウドサーバのターミナル機器に適用することができる。

図５は本発明の一実施例が提供するターミナル機器の概略図である。図５に示すように、前記ターミナル機器５は、メモリ５１、プロセッサ５０及び前記メモリ５１に記憶され且つ前記プロセッサ５０で実行可能なコンピュータプログラム５２を含み、前記プロセッサ５０が前記コンピュータプログラム５２を実行する時に前記ＩｏＴ機器のデータシミュレーション方法のようなステップを実現する。例えば、図４にモジュール４１～４４の機能を示す。

前記ターミナル機器５は、デスクトップコンピュータ、ノートパソコン、パームトップコンピュータ及びクラウドサーバ等の計算機器であってもよい。前記ターミナル機器は、プロセッサ５０、前記メモリ５１を含むが、これらに限定されない。当業者であれば理解できるように、図５はターミナル機器５の例示に過ぎず、ターミナル機器５を限定するものではなく、図示より多いか又は少ない部品を含み、或いはある部品や異なる部品を組み合わせることができ、例えば前記ターミナル機器は、入出力機器、ネットワークアクセス機器、バスなどを含んでもよい。

前記プロセッサ５０は、中央処理ユニット（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ、ＣＰＵ）であってもよく、他の汎用プロセッサ、デジタル信号プロセッサ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ、ＤＳＰ）、特定用途向け集積回路（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ、ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（Ｆｉｅｌｄ－ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ、ＦＰＧＡ）又は他のプログラマブルロジックデバイス、ディスクリートゲート又はトランジスタ論理デバイス、ディスクリートハードウェアコンポーネント等であってもよい。汎用プロセッサはマイクロプロセッサであってもよく、任意の一般的なプロセッサ等であってもよい。

前記メモリ５１は前記ターミナル機器５の内部記憶ユニットであってもよく、例えばターミナル機器５のハードディスク又はＲＡＭである。前記メモリ５１はターミナル機器５の外部記憶機器であってもよく、例えば前記ターミナル機器５に配置されたプラグイン式ハードディスク、スマートメモリカード（ＳｍａｒｔＭｅｄｉａＣａｒｄ(登録商標)、ＳＭＣ）、セキュリティデジタル（ＳｅｃｕｒｅＤｉｇｉｔａｌ、ＳＤ）カード、フラッシュメモリカード（ＦｌａｓｈＣａｒｄ）等である。さらに、前記メモリ５１は、前記ターミナル機器５の内部記憶ユニットを含むだけでなく外部記憶機器も含むことができる。前記メモリ５１は、前記コンピュータプログラム及び前記ターミナル機器に必要な他のプログラム及びデータを記憶するためのものである。前記メモリ５１は、出力された、又は出力されるべきデータを一時的に記憶するために用いられてもよい。

前記統合されたモジュール／ユニットは、ソフトウェア機能ユニットの形式で実現されるとともに、独立した製品として販売されるか又は使用される場合に、コンピュータ読取可能な記憶媒体に記憶されてもよい。このような理解により、本願が上記実施例の方法における全部又は一部のフローを実現するのは、コンピュータプログラムにより関連するハードウェアを指令して完了させることもでき、前記コンピュータプログラムは、コンピュータ可読記憶媒体に記憶されることができ、該コンピュータプログラムはプロセッサにより実行される場合、上記各方法の実施例のステップを実現することができる。ここで、前記コンピュータプログラムは、コンピュータプログラムコードを含み、前記コンピュータプログラムコードはソースコード形式、オブジェクトコード形式、実行可能なファイル又はある中間形式等であってもよい。前記コンピュータ可読媒体は、前記コンピュータプログラムコードをキャリア可能な任意のエンティティ又は装置、記録媒体、Ｕディスク、リムーバブルハードディスク、磁気ディスク、光ディスク、コンピュータメモリ、リードオンリーメモリ（ＲＯＭ、Ｒｅａｄ－ＯｎｌｙＭｅｍｏｒｙ）、ランダムアクセスメモリ（ＲＡＭ、ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、電気搬送波信号、電気通信信号及びソフトウェア配布媒体等を含んでもよい。説明すべきこととして、前記コンピュータ可読媒体に含まれた内容は司法管轄エリア内立法及び特許実践の要求に応じて適当に増減を行うことができ、例えばある司法管轄エリアにおいて、立法及び特許実践に基づいて、コンピュータ可読媒体は電気搬送波信号及び電気通信信号を含まない。

具体的には以下のとおりであってもよく、本願実施例は、コンピュータ可読記憶媒体を更に提供し、該コンピュータ可読記憶媒体は、上記実施例におけるメモリに含まれるコンピュータ可読記憶媒体であってもよく、単独で存在し、ターミナル機器に組み立てられないコンピュータ可読記憶媒体であってもよい。前記コンピュータ可読記憶媒体に１つ又は複数のコンピュータプログラムが記憶される。

コンピュータ可読記憶媒体であって、前記コンピュータ可読記憶媒体にコンピュータプログラムが記憶され、前記コンピュータプログラムがプロセッサにより実行される時に前記ＩｏＴ機器のデータシミュレーション方法を実現するステップを含む。

当業者であれば、説明の利便性及び簡潔のために、上記各機能ユニット、モジュールの分割のみを例に挙げて説明したが、実際の適用において、必要に応じて上記機能を異なる機能ユニット、モジュールに割り当てて完成させることができ、すなわち前記装置の内部構造を異なる機能ユニット又はモジュールに分割することにより、以上に説明した全て又は一部の機能を完了することを明確に理解することができる。実施例における各機能ユニット、モジュールは１つの処理ユニットに統合されてもよく、各ユニットが単独で物理的に存在してもよく、２つ以上のユニットが１つのユニットに統合されてもよく、上記統合されたユニットはハードウェアの形式で実現されてもよく、ソフトウェア機能ユニットの形式で実現されてもよい。なお、各機能ユニット、モジュールの具体的な名称について互いに区別されやすいためのものであり、本願の保護範囲を限定するものではない。上記システムにおけるユニット、モジュールの具体的な動作過程については、前述方法の実施例における対応過程を参照することができ、ここで説明を省略する。

上記実施例において、各実施例に対する説明はそれぞれの重点を有し、ある実施例において詳しく説明又は記載されていない部分については、他の実施例の関連説明を参照することができる。

当業者であれば、本明細書に開示された実施例で説明された各例のユニット及びアルゴリズムステップを、電子ハードウェア、又はコンピュータソフトウェアと電子ハードウェアとの組み合わせで実現することができることを意識することができる。これらの機能がハードウェアで実行されるか、あるいはソフトウェアで実行されるかについては、技術的解決手段の特定の適用及び設計の制約条件に決められる。当業者は各特定の適用に対して異なる方法を用いて説明された機能を実現してもよいが、このような実現は本発明の範囲を超えると考えられるべきではない。

本発明の提供する実施例において、開示された装置／ターミナル機器及び方法は、他の方式で実現することができると理解すべきである。例えば、上記説明された装置／ターミナル機器の実施例は例示的なものに過ぎず、例えば、前記モジュール又はユニットの分けは、論理的機能分けに過ぎず、実際に実現時に他の分け方式があてもよく、例えば複数のユニット又はコンポーネントを結合するか又は他のシステムに統合することができ、又はいくつかの特徴を無視するか、あるいは実行しなくてもよい。また、表示されるか又は議論される相互間の結合又は直接結合又は通信接続はいくつかのインタフェース、装置又はユニットによる間接結合又は通信接続であってもよく、電気的、機械的又は他の形式であってもよい。

前記分離部材として説明されたユニットは物理的に分離されてもよいか又はそうでなくてもよく、ユニットとして表示される部材は物理的ユニットであってもよいか又はそうでなくてもよく、即ち１つの箇所に位置してもよく、又は複数のネットワークユニットに分布してもよい。実際な需要に応じてそのうちの一部又は全部のユニットを選択して本実施例の解決的手段の目的を達成することができる。

なお、本発明の各実施例における各機能ユニットは１つの処理ユニットに統合されてもよく、各ユニットが単独で物理的に存在してもよく、２つ以上のユニットが１つのユニットに統合されてもよい。上記統合されたユニットはハードウェアの形式で実現されてもよく、ソフトウェア機能ユニットの形式で実現されてもよい。

前記統合されたモジュール／ユニットは、ソフトウェア機能ユニットの形式で実現されるとともに、独立した製品として販売されるか又は使用される場合に、コンピュータ読取可能な記憶媒体に記憶されてもよい。このような理解により、本発明は上記実施例の方法における全部又は一部のプロセスの実現について、コンピュータプログラムにより関連するハードウェアを指令して完了することができ、上記したコンピュータプログラムをコンピュータ読み取り可能な記憶媒体に記憶することができ、該コンピュータプログラムがプロセッサにより実行される場合に、上記それぞれの方法の実施例のステップを実現することができる。ここで、前記コンピュータプログラムは、コンピュータプログラムコードを含み、前記コンピュータプログラムコードはソースコード形式、オブジェクトコード形式、実行可能なファイル又はある中間形式等であってもよい。前記コンピュータ可読媒体は、前記コンピュータプログラムコードをキャリア可能な任意のエンティティ又は装置、記録媒体、Ｕディスク、リムーバブルハードディスク、磁気ディスク、光ディスク、コンピュータメモリ、リードオンリーメモリ（ＲＯＭ、Ｒｅａｄ－ＯｎｌｙＭｅｍｏｒｙ）、ランダムアクセスメモリ（ＲＡＭ、ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、電気搬送波信号、電気通信信号及びソフトウェア配布媒体等を含んでもよい。説明すべきこととして、前記コンピュータ可読媒体に含まれた内容は司法管轄エリア内立法及び特許実践の要求に応じて適当に増減を行うことができ、例えばある司法管轄エリアにおいて、立法及び特許実践に基づいて、コンピュータ可読媒体は電気搬送波信号及び電気通信信号を含まない。

上記した実施例は本発明の技術的解決手段を説明するためのものに過ぎず、それを限定するものではない。前述の実施例を参照して本発明を詳細に説明したが、当業者であれば以下内容を理解すべきである。それは依然として前述の各実施例に記載の技術的解決手段を補正してもよく、又はそのうちの一部の技術的特徴を同等置換することができる。これらの補正又は置換により、対応する技術的解決手段の実質が本発明の各実施例の技術的解決手段の思想及び範囲から逸脱することがなく、いずれも本発明の保護範囲内に含まれるべきである。

Claims

プリセットＩｏＴ機器の複数のセンサのセンサデータを取得するステップと、
前記センサに対応するセンサデータにより各前記センサに対応する初期データモデルをトレーニングし、各前記センサに対応する中間データモデルを取得するとともに、各前記センサに対応する中間データモデルを集合して集合データモデルを形成するステップと、
前記集合データモデル及びランダムノイズにより新たなデータを処理し、前記新たなデータに対応するタグ種別を取得するステップと、
前記新たなデータ及び前記新たなデータのタグ種別に基づいて、前記集合データモデルをトレーニングし、データモデルを取得するステップと、を含む
ことを特徴とするプライバシー保護によるデータ処理モデルの取得方法。
前記プリセットＩｏＴ機器の複数のセンサは同じタイプのセンサであり、前記センサは、温度センサ、煙センサ、心拍数センサ、距離センサ、光センサ、音センサ、気体センサ、化学センサ、感圧センサ及び流体センサのうちの一種を含む
ことを特徴とする請求項１に記載のプライバシー保護によるデータ処理モデルの取得方法。
複数の前記センサの初期データモデルは同じであり、
或いは、複数の前記センサは同じタイプ、異なる超パラメータの初期データモデルを採用し、
或いは、複数の前記センサのうちの少なくとも２つのセンサの初期データモデルが異なる
ことを特徴とする請求項１に記載のプライバシー保護によるデータ処理モデルの取得方法。
前記初期データモデルは、ニューラルネットワークモデル、サポートベクターマシン、ロジスティック回帰モデル、又は決定木モデルを含む
ことを特徴とする請求項１に記載のプライバシー保護によるデータ処理モデルの取得方法。
前記集合データモデル及びランダムノイズにより新たなデータを処理し、前記新たなデータに対応するタグ種別を取得する前記ステップは、
新たなデータを集合データモデルにおける各中間データモデルにそれぞれ入力し、各中間データモデルから出力されたタグ種別を取得するステップと、
前記タグ種別に基づいて、各前記タグ種別の初期投票数を確定するステップと、
前記初期投票数に加えて、ランダムノイズを導入し、各前記タグ種別の投票数を取得するステップと、
各前記タグ種別の投票数に基づいて、投票数が所定の条件を満たすタグ種別を前記新たなデータのタグ種別として確定するステップと、を含む
ことを特徴とする請求項１に記載のプライバシー保護によるデータ処理モデルの取得方法。
前記ランダムノイズはラプラシアンノイズを含み、前記ラプラシアンノイズは、Lap(1/ε)であり、εはプライバシーコストであり、その密度関数は、
であり、
ここで、ｘは前記新たなデータであり、ｂは＝1/εである
ことを特徴とする請求項５に記載のプライバシー保護によるデータ処理モデルの取得方法。
前記タグ種別の最大投票数は、
であり、
ここで、ｘは前記新たなデータであり、
ｊは前記タグ種別であり、
は前記新たなデータｘが前記タグ種別ｊに属する初期投票数である
ことを特徴とする請求項６に記載のプライバシー保護によるデータモデルの取得方法。
プリセットＩｏＴ機器の複数のセンサのセンサデータを取得するためのデータ収集モジュールと、
前記センサに対応するセンサデータにより各前記センサに対応する初期データモデルをトレーニングし、各前記センサに対応する中間データモデルを取得するとともに、各前記センサに対応する中間データモデルを集合して集合データモデルを形成するためのデータ統合モジュールと、
前記集合データモデル及びランダムノイズにより新たなデータを処理し、前記新たなデータに対応するタグ種別を取得するためのノイズ追加モジュールと、
前記新たなデータ及び前記新たなデータのタグ種別に基づいて、前記集合データモデルをトレーニングし、データモデルを取得するためのデータ処理モジュールと、を含む
ことを特徴とするプライバシー保護によるデータ処理モデルの取得装置。
メモリ、プロセッサ及び前記メモリに記憶され、且つ前記プロセッサで実行可能なコンピュータプログラムを含むターミナル機器であって、
前記プロセッサが前記コンピュータプログラムを実行する時に、請求項１に記載のプライバシー保護によるデータ処理モデルの取得方法のステップを実現する
ことを特徴とするターミナル機器。
コンピュータプログラムが記憶されるコンピュータ可読記憶媒体であって、
前記コンピュータプログラムがプロセッサにより実行される時に請求項１に記載のプライバシー保護によるデータ処理モデルの取得方法のステップを実現する
ことを特徴とするコンピュータ可読記憶媒体。