JP7401677B2 - モデル更新システム、モデル更新方法及び関連装置 - Google Patents

モデル更新システム、モデル更新方法及び関連装置 Download PDF

Info

Publication number
JP7401677B2
JP7401677B2 JP2022531508A JP2022531508A JP7401677B2 JP 7401677 B2 JP7401677 B2 JP 7401677B2 JP 2022531508 A JP2022531508 A JP 2022531508A JP 2022531508 A JP2022531508 A JP 2022531508A JP 7401677 B2 JP7401677 B2 JP 7401677B2
Authority
JP
Japan
Prior art keywords
model
data
analysis device
site
site analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022531508A
Other languages
English (en)
Other versions
JP2023504103A (ja
Inventor
チャーン,チーンローン
ジャーン,イエンファーン
スゥン,シュイドーン
シュエ,リー
ジャーン,リヤーン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2023504103A publication Critical patent/JP2023504103A/ja
Application granted granted Critical
Publication of JP7401677B2 publication Critical patent/JP7401677B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Description

本願は、「モデル更新システム、モデル更新方法及び関連装置」と題する2019年11月30日に出願された中国特許出願第201911209129.2号の優先権を主張し、その全体は参照により本願に組み込まれる。
本願の実施形態はネットワーク制御の分野に関し、具体的にはモデル更新システム、モデル更新方法及び関連装置に関する。
人工知能(artificial intelligence、AI)の急速な発展に伴い、AIモデルは柔軟性や知能等の特徴によりネットワークで広く用いられている。
ネットワーク装置がAIモデルを設定した後、ネットワーク装置はAIモデルの入力としてネットワーク装置上の特徴データを用いる。ネットワーク装置上の特徴データは、ネットワーク装置のトラフィックシナリオによって決定され、異なる特徴データが異なるトラフィックシナリオで生成される。ネットワーク装置が特徴データをAIモデルに入力した後、ネットワーク装置はAIモデルに基づいて出力結果を取得し得る。ネットワーク装置は出力結果に基づいて対応する決定を行うか又は出力結果を他のネットワーク装置に送信して、他のネットワーク装置が出力結果に基づいて対応する決定を行うのを助ける。
AIモデルは訓練データに基づく訓練を介して得られるため、ネットワーク装置のシナリオが訓練データの収集シナリオと異なるか又はネットワーク装置のシナリオが本来は訓練データの収集シナリオと同じであるが、ネットワーク装置のシナリオがネットワーク装置のシナリオの変化により訓練データの収集シナリオと現在異なる場合、AIモデルの性能が劣化し得る。したがって、AIモデルの性能をどのように維持するかは解決すべき緊急の課題である。
本願の実施形態は、第1のモデルの更新に基づいてプライバシーを改善するために、モデル更新システム、モデル更新方法及び関連装置を提供する。
本願の実施形態の第1の態様は、サイト解析装置及び第1の解析装置を含む更新システムを提供する。第1の解析装置は第1のモデルを取得し、第1のモデルを取得した後に、第1の解析装置は第1のモデルをサイト解析装置に送信し得る。サイト解析装置は、ネットワーク装置によって送信される第1の特徴データを受信し得る。第1のモデルを受信した後で、サイト解析装置は第1の訓練サンプルを用いて該第1のモデルを訓練して第2のモデルを取得し得る。該第1の訓練サンプルは第1の特徴データを含む。第2のモデルを取得した後に、サイト解析装置は第1のモデルと第2のモデルとの差分データを取得し得る。サイト解析装置が差分データを取得した後で、サイト解析装置は差分データを第1の解析装置に送信する。第1の解析装置は差分データを受信し、差分データに基づいて第1のモデルを更新して第3のモデルを取得し得る。
本願のこの実施形態では、サイト解析装置は、第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを取得し得る。サイト解析装置は、第1のモデルと第2のモデルとの差分データを取得し、差分データを第1の解析装置に送信して、第1の解析装置に差分データに基づいて第1のモデルを更新するよう要求し、差分データは、第1のモデル及び第2のモデルに基づいてサイト解析装置によって取得され、第2のモデルは、第1の訓練サンプルを用いることにより第1のモデルを訓練することによりサイト解析装置によって取得される。第1の訓練サンプルは、ネットワーク装置の第1の特徴データを含み、差分データのプライバシーは、第1の特徴データのものよりも高い。したがって、第1の解析装置がモデル性能を維持するために第1のモデルを更新することに基づいて、プライバシーが改善される。
可能な設計では、本願の実施形態の第1の態様の第1の実施において、サイト解析装置は、第1のモデルが劣化しているかどうかを判定するようにさらに構成されている。サイト解析装置が第1のモデルは劣化していると判定した場合にのみ、サイト解析装置は第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを得る。
本願のこの実施形態では、サイト解析装置が第1のモデルは劣化していると判定した場合にのみ、サイト解析装置は、第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを得る。サイト解析装置が第1のモデルは劣化していると判定した場合、第1のモデルの性能が劣化していることを示す。したがって、サイト解析装置は、第1のモデルの性能が劣化した場合にのみ、第1の訓練サンプルを用いることにより第1のモデルを訓練して、サイト解析装置が第1のモデルの性能が劣化していない場合に第1の訓練サンプルを用いることにより第1モデルを訓練することを避けることにより、サイト解析装置のネットワークリソースが節約される。
可能な設計では、本願の実施形態の第1の態様の第2の実施では、システムは、N個のサイト解析装置を含む。この場合、第1の解析装置はN個のサイト解析装置に接続され、Nは1より大きい整数である。第1の解析装置が第1のモデルを取得した後で、第1の解析装置は、第1のモデルをN個のサイト解析装置に送信することと、L個のサイト解析装置によって送信される複数の差分データを受信することであって、Lは1より大きく且つN以下の整数であることと、複数の差分データに基づいて第1のモデルを更新して第3のモデルを得ることと、を行うように具体的に構成されている。
本願のこの実施形態では、第1の解析装置はN個のサイト解析装置に接続され得る。Nは1より大きい整数であるため、第1の解析装置は複数のサイト解析装置に接続され得る。これに基づいて、第1の解析装置は、L個のサイト解析装置によって送信される複数の差分データを受信してもよく、Lは1よりも大きく且つN以下の整数である。Lは1よりも大きいため、第1の解析装置は複数のサイト解析装置によって送信される複数の差分データを受信し、複数の差分データに基づいて第1のモデルを更新し得る。第1の解析装置は、複数のサイト解析装置によって送信される複数の差分データを受信し、複数の差分データに基づいて第1のモデルを更新し得るため、複数のサイト解析装置が存在する場合に、第1の解析装置はサイト解析装置の差分データのみを用い、その結果、差分データに基づいて第1の解析装置によって得られた第3のモデルが他のサイト解析装置と一致しない場合が回避される。具体的には、他のサイト解析装置上での第3のモデルの性能は、他のサイト解析装置上の第1のモデルの性能よりも劣る。
可能な設計では、本願の実施形態の第1の態様の第3の実施では、サイト解析装置は第2のモデルを第1の解析装置に送信しない。
本願のこの実施形態では、サイト解析装置は第2のモデルを第1の解析装置に送信しない。第1の解析装置は第1のモデルも記憶するため、サイト解析装置は、第1のモデルと第2のモデルとの差分データを送信するだけでよい。第1の解析装置は、差分データに基づいて第1のモデルを更新して第3のモデルを取得し得る。差分データのデータボリュームは第2のモデルのデータボリュームよりも小さいため、ネットワーク伝送リソースを節約できる。
可能な設計では、本願の実施形態の第1の態様の第4の実施において、第1の解析装置は、差分データを第1の解析装置に送信するL個のサイト解析装置に関する統計を収集することと、Nに対するLの比が閾値Kに達した場合に、差分データに基づいて第1のモデルを更新して第3のモデルを得ることであって、Kは0より大きく、1以下である、こととを行うようにさらに構成されている。
本願のこの実施形態では、第1の解析装置は、差分データを第1の解析装置に送信するL個のサイト解析装置に関する統計を収集し得る。Nに対するLの比が閾値Kに達した場合にのみ、第1の解析装置は差分データに基づいて第1のモデルを更新して第3のモデルを得る。特定の数のサイト解析装置が第1の解析装置に差分データを送信した場合にのみ、第1の解析装置は差分データに基づいて第1のモデルを更新して第3のモデルを得る。したがって、第1の解析装置は、閾値Kを設定することにより、第1の解析装置が第1のモデルを更新する頻度を柔軟に調整し得る。
可能な設計では、本願の実施形態の第1の態様の第5の実施では、システムは、ネットワーク装置をさらに含む。ネットワーク装置は、サイト解析装置によって送信される更新されたモデルを受信することであって、該更新されたモデルは第2のモデル又は第3のモデルを含む、ことと、更新されたモデルを用いることによりネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力することと、を行うように構成されている。サイト解析装置は、更新されたモデルをネットワーク装置に送信するようにさらに構成されている。
本願のこの実施形態では、更新されたモデルは第2のモデル又は第3のモデルを含む。第2のモデル又は第3のモデルがネットワーク装置上で設定されていることは限定されている。ネットワーク装置は、ネットワーク装置上の予測されるべき特徴データを直接収集し得る。したがって、ネットワークリソースを節約できる。
可能な設計では、本願の実施形態の第1の態様の第6の実施において、ネットワーク装置は、ネットワーク装置の予測されるべき特徴データをサイト解析装置に送信するように構成されている。サイト解析装置は、更新されたモデルを用いることにより、ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力するようにさらに構成されている。
本願のこの実施形態では、更新されたモデルは第2のモデル又は第3のモデルを含む。第2のモデル又は第3のモデルがサイト解析装置上で設定されていることは限定されている。サイト解析装置は、ネットワーク装置から送信される予測されるべき特徴データを取得し、サイト解析装置は、更新されたモデルを用いることにより、ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力する。したがって、遠隔予測を実施でき、予測をネットワーク装置上で局所的に行う必要がないため、推論結果がネットワーク装置上でリークされる可能性が低減される。
可能な設計では、本願の実施形態の第1の態様の第7の実施では、ネットワーク装置は、更新されたモデルを用いることにより、ネットワーク装置の予測されるべき特徴データに基づいて分類結果を予測するように具体的に構成されている。
本願のこの実施形態では、更新されたモデルは第2のモデル又は第3のモデルを含む。第2のモデル又は第3のモデルの機能は、分類予測を行うことに限定されている。したがって、解決策の実施可能性が改善される。
可能な設計では、本願の実施形態の第1の態様の第8の実施において、サイト解析装置は、更新されたモデルを用いることにより、ネットワーク装置の予測されるべき特徴データに基づいて分類結果を予測するように具体的に構成されている。
本願のこの実施形態では、更新されたモデルは第2のモデル又は第3のモデルを含む。第2のモデル又は第3のモデルの機能は、分類予測を行うことに限定されている。したがって、解決策の実施可能性が改善される。
可能な設計では、本願の実施形態の第1の態様の第9の実施形態において、予測されるべき特徴データは、キーパフォーマンスインジケータKPI特徴データを含み、該KPI特徴データは、KPI時系列の特徴データ又はKPIデータである。
本願のこの実施形態では、KPI特徴データがKPI時系列の特徴データ又はKPIデータであることは限定されているため、解決策の実施可能性が改善される。
可能な設計では、本願の実施形態の第1の態様の第10の実施では、差分データは勾配情報である。
本願のこの実施形態では、勾配情報はニューラルネットワークモデルの概念である。したがって、第1のモデル、第2のモデル及び第3のモデルの種類はニューラルネットワークモデルに属することに限定される。したがって、解決策の実施可能性が改善される。
本願の実施形態の第2の態様はモデル更新方法を提供し、以下を含む。
サイト解析装置は、第1の解析装置によって送信される第1のモデルを受信し得る。サイト解析装置が第1のモデルを受信した後で、サイト解析装置は、第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを取得し得る。第1の訓練サンプルは、サイト解析装置に対応するサイトネットワーク内のネットワーク装置の第1の特徴データを含む。サイト解析装置が第2のモデルを取得した後で、サイト解析装置は第1のモデルと第2のモデルとの差分データを取得し得る。サイト解析装置は差分データを第1の解析装置に送信して、第1の解析装置に、差分データに基づいて第1のモデルを更新して第3のモデルを得るように要求し得る。
を含む
本願のこの実施形態では、サイト解析装置は第1の解析装置によって送信第1のモデルを受信し、第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを取得し得る。第2のモデルを取得した後で、サイト解析装置は、第1のモデルと第2のモデルとの差分データを取得し、差分データを第1の解析装置に送信して、第1の解析装置に差分データに基づいて第1のモデルを更新するよう要求し得る。差分データは、第1のモデル及び第2のモデルに基づいてサイト解析装置によって取得され、第2のモデルは、第1の訓練サンプルを用いることにより第1のモデルを訓練することによってサイト解析装置によって取得される。第1の訓練サンプルはネットワーク装置の第1の特徴データを含み、差分データのプライバシーは第1の特徴データのものよりも高い。したがって、第1の解析装置がモデル性能を維持するために第1のモデルを更新することに基づいてプライバシーが改善される。
可能な設計では、本願の実施形態の第2の態様の第1の実施において、サイト解析装置は、第1のモデルが劣化しているかどうか判定する。サイト解析装置が第1のモデルは劣化していると判定した場合に、サイト解析装置は第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを得る。
本願のこの実施形態では、サイト解析装置が第1のモデルが劣化していると判定した場合にのみ、サイト解析装置は、第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを得る。サイト解析装置は第1のモデルが劣化していると判定した場合、それは第1のモデルの性能が劣化していることを示す。したがって、サイト解析装置は、第1のモデルの性能が劣化した場合にのみ、第1の訓練サンプルを用いることにより第1のモデルを訓練し、サイト解析装置が第1のモデルの性能が劣化しない場合に第1の訓練サンプルを用いることにより第1のモデルを訓練することを回避することにより、サイト解析装置のネットワークリソースを節約する。
可能な設計では、本願の実施形態の第2の態様の第2の実施において、サイト解析装置は、第1のモデルのパフォーマンス定量インジケータを取得し得る。サイト解析装置は、第1のモデルのパフォーマンス定量インジケータが目標閾値未満かどうか判定する。第1のモデルのパフォーマンス定量インジケータが目標閾値未満の場合、サイト解析装置は第1のモデルが劣化していると判定する。
本願のこの実施形態では、第1のモデルのパフォーマンス定量指インジケータが目標閾値未満の場合、サイト解析装置は第1のモデルが劣化していると判定する。サイト解析装置は、第1のモデルのパフォーマンス定量インジケータを得る方法において、第1のモデルが劣化しているかどうかを判定することに限定されているため、解決策の実施可能性が改善される。
可能な設計では、本願の実施形態の第2の態様の第3の実施において、サイト解析装置は、ネットワーク装置の第2の特徴データを取得し得る。サイト解析装置は、第2の特徴データに基づいて第1のモデルによって得られる第1の推論結果を取得し得る。サイト解析装置は、第1の推論結果及び第2の特徴データのプリセットラベルに基づいて、第1のモデルの精度を得て、該精度を第1のモデルのパフォーマンス定量インジケータとして用い得るか又はサイト解析装置は、第1の推論結果及び第2の特徴データのプリセットラベルに基づいて、第1のモデルの再現率を得て、該再現率を第1のモデルのパフォーマンス定量インジケータとして用いり得る。
本願のこの実施形態では、サイト解析装置は、第1の推論結果及び第2の特徴データのプリセットラベルに基づいて第1のモデルの精度を取得し、サイト解析装置は精度を第1のモデルのパフォーマンス定量インジケータとして用いり、第1の推論結果は第2の特徴データに基づいて第1のモデルによって得られるか又はサイト解析装置は、第1の推論結果及び第2の特徴データのプリセットラベルラに基づいて第1のモデルの再現率を取得し、サイト解析装置は、再現率を第1のモデルのパフォーマンス定量インジケータとして用い、第1の推論結果は第2の特徴データに基づいて第1のモデルによって得られる。第1の推論結果及び第2の特徴データのプリセットラベルの両方は第2の特徴データに関連し、第2の特徴データはネットワーク装置からのものであり、第1のモデルは、ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力するように構成されている。したがって、第2の特徴データに基づいて第1のモデルのパフォーマンス定量インジケータを決定することは、他の装置の特徴データに基づいて第1のモデルのパフォーマンス定量インジケータを決定することよりも精度が高い。
可能な設計では、本願の実施形態の第2の態様の第4の実施において、サイト解析装置は、第1のデータ要求をネットワーク装置に送信して、ネットワーク装置に第2の訓練サンプルをサイト解析装置に送信するよう要求し、第2の訓練サンプルは第2の特徴データ及び第1の推論結果を含み、第1の推論結果は、第2の特徴データに基づいて第1のモデルによって得られる。
本願のこの実施形態では、第2の特徴データ及び第1の推論結果のソースは限定され、解決策の実施可能性が改善される。
可能な設計では、本願の実施形態の第2の態様の第5の実施において、サイト解析装置は、更新されたモデルをネットワーク装置に送信し、更新されたモデルは第2のモデル又は第3のモデルを含み、ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力するように構成されている。
本願のこの実施形態では、更新されたモデルは第2のモデル又は第3のモデルを含む。第2のモデル又は第3のモデルがネットワーク装置上で設定されていることは限定されている。ネットワーク装置は、ネットワーク装置上で予測されるべき特徴データを直接収集し得る。したがって、ネットワークリソースを節約できる。
可能な設計では、本願の実施形態の第2の態様の第6の実施では、サイト解析装置は更新されたモデルをネットワーク装置に送信し、更新されたモデルは第2のモデル又は第3のモデルを含み、ネットワーク装置の予測されるべき特徴データに基づいて分類結果を予測するように構成され、予測されるべき特徴データはキーパフォーマンスインジケータKPI特徴データを含む。
本願のこの実施形態では、更新されたモデルは第2のモデル又は第3のモデルを含む。第2のモデル又は第3のモデルの機能は分類予測を行うことに限定され、予測されるべき特徴データはKPI特徴データを含む。したがって、解決策の実施可能性が改善される。
可能な設計では、本願の実施形態の第2の態様の第7の実施では、サイト解析装置はネットワーク装置の予測されるべき特徴データを受信する。サイト解析装置は、更新されたモデルを用いることにより、ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力し、更新されたモデルは第2のモデル又は第3のモデルを含む。
本願のこの実施形態では、更新されたモデルは第2のモデル又は第3のモデルを含む。第2のモデル又は第3のモデルがサイト解析装置上で設定されることは限定されている。サイト解析装置は、ネットワーク装置によって送信される予測されるべき特徴データを取得し、サイト解析装置は、更新されたモデルを用いることにより、ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力する。したがって、遠隔予測を実施でき、予測をネットワーク装置上で局所的に行う必要がないため、推論結果がネットワーク装置上にリークする可能性が低減される。
可能な設計では、本願の実施形態の第2の態様の第8の実施では、予測されるべき特徴データはKPI特徴データを含み、サイト解析装置は、更新されたモデルを用いることにより、ネットワーク装置の予測されるべき特徴データに基づいて分類結果を予測する。
本願のこの実施形態では、更新されたモデルは第2のモデル又は第3のモデルを含む。第2のモデル又は第3のモデルの機能は分類予測を行うことに限定され、予測されるべき特徴データはKPI特徴データを含む。したがって、解決策の実施可能性が改善される。
可能な設計では、本願の実施形態の第2の態様の第9の実施では、KPI特徴データはKPI時系列の特徴データ又はKPIデータである。
本願のこの実施形態では、KPI特徴データがKPI時系列の特徴データ又はKPIデータであることが限定されているため、解決策の実施可能性が改善される。
可能な設計では、本願の実施形態の第2の態様の第10の実施において、サイト解析装置はテストデータを用いることにより第2のモデルをテストし、該テストデータはグラウンドトゥルースラベルを含む。サイト解析装置は、劣化したデータを記憶して、サイト解析装置が該劣化したデータを用いることにより、サイト解析装置内のモデルを更新できるようにし、劣化したデータはテストデータに属し、劣化したデータの推論ラベルはグラウンドトゥルースラベルと等しくなく、該推論ラベルはテストデータを用いることにより、第2のモデルをテストすることによりサイト解析装置によって得られる。
本願のこの実施形態では、サイト解析装置が、第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを得た後で、サイト解析装置は、テストデータを用いることにより第2のモデルをテストして劣化したデータを記憶し、サイト解析装置が該劣化したデータを用いることにより、サイト解析装置内のモデルを更新できるようにし、劣化したデータは、サイト解析装置が劣化したデータを用いることによりサイト解析装置内のモデルを更新できるようにするために用いられる。したがって、サイト解析装置が劣化したデータを記憶した後で、サイト解析装置がモデルを更新する必要がある場合、サイト解析装置は、劣化したデータを用いることによりモデルを更新し得る。劣化したデータは第2のモデルで十分に学習されていないデータに属するため、サイト解析装置は、将来のモデル更新のためにデータを記憶するため、後続のモデルは十分に学習されていないデータを再学習できるため、後続のモデルの性能が改善される。
可能な設計では、本願の実施形態の第2の態様の第11の実施において、差分データは勾配情報である。
本願のこの実施形態では、勾配情報はニューラルネットワークモデルの概念である。したがって、第1のモデル、第2のモデル及び第3のモデルの種類はニューラルネットワークモデルに属することに限定される。したがって、解決策の実施可能性が改善される。
可能な設計では、本願の実施形態の第2の態様の第12の実施において、サイト解析装置は第2のモデルを第1の解析装置に送信しない。
本願のこの実施形態では、サイト解析装置は第2のモデルを第1の解析装置に送信しない。第1の解析装置は第1のモデルも記憶するため、サイト解析装置は、第1のモデルと第2のモデルとの差分データを送信するだけでよい。第1の解析装置は、差分データに基づいて第1のモデルを更新して第3のモデルを取得し得る。差分データのデータボリュームは第2のモデルのデータボリュームよりも小さいため、ネットワーク伝送リソースを節約できる。
本願の実施形態の第3の態様はモデル更新方法を提供し、以下を含む。
第1の解析装置は第1のモデルをサイト解析装置に送信し、第1のモデルは、ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力するように構成されている。第1の解析装置は第1のモデルと第2のモデルとの差分データを受信し、第2のモデルは第1の訓練サンプルを用いることにより第1のモデルを訓練することによりサイト解析装置によって得られ、第1の訓練サンプルは、サイト解析装置に対応するサイトネットワーク内のネットワーク装置の第1の特徴データを含む。第1の解析装置は、差分データに基づいて第1のモデルを更新して第3のモデルを得る。
本願のこの実施形態では、第1の解析装置は第1のモデルをサイト解析装置に送信し得る。第1の解析装置は、第1のモデルと第2のモデルとの差分データを受信し、差分データに基づいて第1のモデルを更新して第3のモデルを得る。差分データは、第1のモデル及び第2のモデルに基づいて、サイト解析装置によって得られ、第2のモデルは、第1の訓練サンプルを用いることにより、第1のモデルを訓練することによってサイト解析装置によって得られる。第1の訓練サンプルはネットワーク装置の第1の特徴データを含み、差分データのプライバシーは第1の特徴データのものよりも高い。したがって、第1の解析装置がモデル性能を維持するために第1のモデルを更新することに基づいてプライバシーが改善される。
可能な設計では、本願の実施形態の第3の態様の第1の実施において、第1の解析装置は、第1のモデルをN個のサイト解析装置に送信してもよく、Nは1より大きい整数である。第1の解析装置は、L個のサイト解析装置によって送信される複数の差分データを受信してもよく、Lは1より大きく且つN以下の整数である。第1の解析装置は、複数の差分データに基づいて第1のモデルを更新して第3のモデルを得る。第1の解析装置は、第3のモデルをN個のサイト解析装置に送信する。
本願のこの実施形態では、第1の解析装置は、第1のモデルをN個のサイト解析装置に送信し得る。Nは1よりも大きい整数であるため、第1の解析装置は複数のサイト解析装置に接続され得る。これに基づいて、第1の解析装置は、L個のサイト解析装置によって送信される複数の差分データを受信してもよく、Lは1よりも大きく且つN以下の整数である。Lは1よりも大きいため、第1の解析装置は複数のサイト解析装置によって送信される複数の差分データを受信し、複数の差分データに基づいて第1のモデルを更新し得る。第1の解析装置は、複数のサイト解析装置によって送信される複数の差分データを受信し、複数の差分データに基づいて第1のモデルを更新し得るため、複数のサイト解析装置が存在する場合に、第1の解析装置はサイト解析装置の差分データのみを用い、その結果、差分データに基づいて第1の解析装置によって得られた第3のモデルが他のサイト解析装置と一致しない場合が回避される。具体的には、他のサイト解析装置上での第3のモデルの性能は、他のサイト解析装置上の第1のモデルの性能よりも劣る。
可能な設計では、本願の実施形態の第3の態様の第2の実施において、第1の解析装置は、複数の差分データの平均値を取得し得る。第1の解析装置は、複数の差分データの平均値を用いることにより第1のモデルを更新して第3のモデルを得る。
本願のこの実施形態では、第1の解析装置は複数の差分データの平均値を用いることにより第1のモデルを更新する。第1の解析装置が、複数の差分データを用いる方法は限定され、解決策の実施可能性が改善される。
可能な設計では、本願の実施形態の第3の態様の第3の実施では、第1の解析装置は、複数の差分データの加重平均値を取得し得る。第1の解析装置は加重平均値を用いることにより第1のモデルを更新して第3のモデルを得る。
本願のこの実施形態では、第1の解析装置は加重平均値を用いることにより第1のモデルを更新する。第1の解析装置は、複数の差分データの加重平均値を取得する。したがって、第1の解析装置は、異なる差分データに基づいて異なる重み付け係数を設定することにより、解決策の柔軟性が改善される。
可能な設計では、本願の実施形態の第3の態様の第4の実施において、第1の解析装置は、差分データを第1の解析装置に送信するL個のサイト解析装置に関する統計を収集し得る。第1の解析装置は、Nに対するLの比が閾値Kに達した場合に、差分データに基づいて第1のモデルを更新して第3のモデルを得る。Kは0より大きく、1以下であり、Nは第1の解析装置によって送信される第1のモデルを受信するサイト解析装置の数である。
本願のこの実施形態では、第1の解析装置は、差分データを第1の解析装置に送信するL個のサイト解析装置に関する統計を収集し得る。Nに対するLの比が閾値Kに達した場合にのみ、第1の解析装置は差分データに基づいて第1のモデルを更新して第3のモデルを得る。特定の数のサイト解析装置が第1の解析装置に差分データを送信した場合にのみ、第1の解析装置は差分データに基づいて第1のモデルを更新して第3のモデルを得る。したがって、第1の解析装置は、閾値Kを設定することにより、第1の解析装置が第1のモデルを更新する頻度を柔軟に調整し得る。
可能な設計では、本願の実施形態の第3の態様の第5の実施において、差分データは勾配情報である。
本願のこの実施形態では、勾配情報はニューラルネットワークモデルの概念である。したがって、第1のモデル、第2のモデル及び第3のモデルの種類はニューラルネットワークモデルに属することに限定される。したがって、解決策の実施可能性が改善される。
可能な設計では、本願の実施形態の第3の態様の第6の実施において、第1の解析装置は、サイト解析装置によって送信される第2のモデルを受信しない。
本願のこの実施形態では、第1の解析装置は、サイト解析装置によって送信される第2のモデルを受信しない。第1の解析装置は第1のモデルも記憶するため、第1の解析装置は、第1のモデルと第2のモデルとの差分データを受信するだけでよい。第1の解析装置は、差分データに基づいて第1のモデルを更新して第3のモデルを取得し得る。差分データのデータボリュームは第2のモデルのデータボリュームよりも小さいため、ネットワーク伝送リソースを節約できる。
本願の実施形態の第4の態様は、
第1の解析装置によって送信される第1のモデルを受信するように構成された受信ユニットと、
第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを得るように構成された訓練ユニットであって、該第1の訓練サンプルは、サイト解析装置に対応するサイトネットワーク内のネットワーク装置の第1の特徴データを含む、訓練ユニットと、
第1のモデルと第2のモデルとの差分データを得るように構成された取得ユニットと、
差分データを第1の解析装置に送信して、第1の解析装置に、差分データに基づいて第1のモデルを更新して第3のモデルを得るように要求するように構成された送信ユニットと、
を含むモデル更新装置を提供する。
可能な設計では、装置は、
第1のモデルが劣化しているかどうか判定するように構成された判定ユニットであって、該判定ユニットが第1のモデルは劣化していると判定した場合に、訓練ユニットは、第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを得る、判定ユニット、をさらに含む。
可能な設計では、取得ユニットは、第1のモデルのパフォーマンス定量インジケータを得るようにさらに構成され、
判定ユニットは、第1のモデルのパフォーマンス定量インジケータが目標閾値未満かどうか判定するようさらに構成され、
第1のモデルのパフォーマンス定量インジケータが目標閾値未満の場合、判定ユニットは、第1のモデルが劣化していると判定するように具体的に構成されている。
可能な設計では、取得ユニットは、ネットワーク装置の第2の特徴データを得るようにさらに構成され、
取得ユニットは、第2の特徴データに基づいて第1のモデルによって得られた第1の推論結果を得るようにさらに構成され、
取得ユニットは、第1の推論結果及び第2の特徴データのプリセットラベルに基づいて、第1のモデルの精度を得て、精度を第1のモデルのパフォーマンス定量インジケータとして用いるように具体的に構成されているか又は取得ユニットは、第1の推論結果及び第2の特徴データのプリセットラベルに基づいて、第1のモデルの再現率を得て、該再現率を第1のモデルのパフォーマンス定量インジケータとして用いるように具体的に構成されている。
可能な設計では、送信ユニットは、第1のデータ要求をネットワーク装置に送信して、ネットワーク装置に第2の訓練サンプルをサイト解析装置に送信するように要求するようにさらに構成され、第2の訓練サンプルは、第2の特徴データ及び第1の推論結果を含み、第1の推論結果は、第2の特徴データに基づいて第1のモデルによって得られる。
可能な設計では、送信ユニットは、更新されたモデルを前記ネットワーク装置に送信するようにさらに構成され、該更新されたモデルは第2のモデル又は第3のモデルを含み、ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力するように構成されている。
可能な設計では、送信ユニットは、更新されたモデルをネットワーク装置に送信するようにさらに構成され、該更新されたモデルは第2のモデル又は第3のモデルを含み、ネットワーク装置の予測されるべき特徴データに基づいて分類結果を予測するように構成され、予測されるべき特徴結果はキーパフォーマンスインジケータKPI特徴データを含む
可能な設計では、受信ユニットは、ネットワーク装置の予測されるべき特徴データを受信するようにさらに構成され、
前記装置は、
更新されたモデルを用いることにより、ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力するように構成された推論ユニットであって、該更新されたモデルは第2のモデル又は第3のモデルを含む、推論ユニットをさらに含む。
可能な設計では、予測されるべき特徴データはKPI特徴データを含み、
推論ユニットは、更新されたモデルを用いることにより、ネットワーク装置の予測されるべき特徴データに基づいて分類結果を予測するように具体的に構成されている。
可能な設計では、KPI特徴データは、KPI時系列の特徴データ又はKPIデータである。
可能な設計では、前記装置は、
テストデータを用いることにより第2のモデルをテストするように構成されたテストユニットであって、該テストデータはグラウンドトゥルースラベルを含む、テストユニットと
劣化したデータを記憶して、サイト解析装置が該劣化したデータを用いることにより、サイト解析装置内のモデルを更新できるようにするように構成された記憶ユニットであって、該劣化したデータテストデータに属し、劣化したデータの推論ラベルはグラウンドトゥルースラベルと等しくなく、該推論ラベルはテストデータを用いることにより、第2のモデルをテストすることによりサイト解析装置によって得られる、記憶ユニットと、をさらに含む。
本願の実施形態の第5の態様は、
第1のモデルをサイト解析装置に送信するように構成された送信ユニットであって、該第1のモデルは、ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力するように構成されている、送信ユニットと、
第1のモデルと第2のモデルとの差分データを受信するように構成された受信ユニットであって、該第2のモデルは、第1の訓練サンプルを用いることにより第1のモデルを訓練することによりサイト解析装置によって得られ、該第1の訓練サンプルは、サイト解析装置に対応するサイトネットワーク内のネットワーク装置の第1の特徴データを含む、受信ユニットと、
差分データに基づいて第1のモデルを更新して第3のモデルを得るように構成された更新ユニットと、
を含む、モデル更新装置を提供する。
可能な設計では、送信ユニットは、第1のモデルをN個のサイト解析装置に送信するように具体的に構成され、Nは1より大きい整数であり
受信ユニットは、L個のサイト解析装置によって送信される複数の差分データを受信するように具体的に構成され、Lは1よりも大きく且つN以下の整数であり、
更新ユニットは、複数の差分データに基づいて第1のモデルを更新して第3のモデルを得るように具体的に構成され、
送信ユニットは、第3のモデルをN個のサイト解析装置に送信するようにさらに構成されている。
可能な設計では、前記装置は、
複数の差分データの平均値を得るように構成された取得ユニットをさらに含み、
更新ユニットは、複数の差分データの平均値を用いることにより第1のモデルを更新して第3のモデルを得るように具体的に構成されている。
可能な設計では、前記装置は、
複数の差分データの加重平均値を得るように構成された取得ユニットをさらに含み、
更新ユニットは、加重平均値を用いることにより第1のモデルを更新して第3のモデルを得るように具体的に構成されている。
可能な設計では、前記装置は、
差分データを第1の解析装置に送信するL個のサイト解析装置に関する統計を収集するように構成された統計収集ユニットをさらに含み、
Nに対するLの比が閾値Kに達した場合、更新ユニットは、差分データに基づいて第1のモデルを更新して第3のモデルを得るように具体的に構成され、Kは0より大きく1以下である。
本願の実施形態の第6の態様は、メモリ及びプロセッサを含むモデル更新装置を提供し、
メモリはプログラムを記憶するように構成され、
プロセッサは、第2の態様又は第2の態様の実施のいずれか1つに係る方法を行うこと又は第3の態様又は第3の態様の実施のいずれか1つに係る方法を行うことを含む、メモリ内の前記プログラムを実行するように構成されている。
本願の実施形態の第7の態様はコンピュータ記憶媒体を提供し、コンピュータ記憶媒体は命令を記憶し、該命令がコンピュータ上で実行された場合、該コンピュータは、第2の態様又は第2の態様の実施のいずれか1つに係る方法を行うことができるか又はコンピュータは、第3の態様又は第3の態様の実施のいずれか1つに係る方法を行うことができる。
本願の実施形態の第8の態様はコンピュータプログラム製品を提供し、コンピュータプログラム製品がコンピュータ上で実行され、命令がコンピュータ上で実行された場合、該コンピュータは、第2の態様又は第2の態様の実施のいずれか1つに係る方法を行うことができるか又は第3の態様又は第3の態様の実施のいずれか1つに係る方法を行うことができる。
図1は、本願の一実施形態に係る適用シナリオの概略図である。 図2は、本願の一実施形態に係る別の適用シナリオの概略図である。 図3は、本願の一実施形態に係るモデル更新方法の概略フローチャートである。 図4A及び図4Bは、本願の一実施形態に係るモデル更新方法の別の概略フローチャートである。 図5は、本願の一実施形態に係るモデル更新システムの構造の概略図である。 図6は、本願の一実施形態に係るモデル更新システムの構造の別の概略図である。 図7は、本願の一実施形態に係るモデル更新装置の構造の概略図である。 図8は、本願の一実施形態に係るモデル更新装置の構造の別の概略図である。 図9は、本願の一実施形態に係るモデル更新装置の構造の別の概略図である。 図10は、本願の一実施形態に係るモデル更新装置の構造の別の概略図である。 図11は、本願の一実施形態に係るモデル更新装置の構造の概略図である。 図12は、本願の一実施形態に係るモデル更新装置の構造の別の概略図である。
本願の実施形態は、第1モデルの更新に基づいてプライバシーを改善するために、ネットワーク制御の分野に適用されるモデル更新システム、モデル更新方法及び関連装置を提供する。
読者の理解を容易にするために、本願の実施形態は、提供されるモデル更新方法における機械学習アルゴリズムを簡単に説明する。
AI分野の重要な部門として、機械学習アルゴリズムは多くの分野で広く用いられている。学習方法の観点から、機械学習アルゴリズムは、教師あり学習アルゴリズム、教師なし学習アルゴリズム、半教師あり学習アルゴリズム及び強化学習アルゴリズムのいくつかの種類に分類できる。教師あり学習アルゴリズムは、訓練データに基づいてアルゴリズムを学習すること又はモードを確立すること及びアルゴリズム又はモードに基づき新たなインスタンスを推論することを意味する。訓練サンプルとも呼ばれる訓練データは、入力データ及び予測される出力を含む。機械学習アルゴリズムのモデルは機械学習モデルとも呼ばれ、そのモデルのラベルと呼ばれる予測される出力は、予測される分類結果(分類ラベルと呼ばれる)であり得る。教師なし学習アルゴリズムと教師あり学習アルゴリズムとの違いは、教師なし学習アルゴリズムの訓練サンプルは所与のラベルを有さない点である。機械学習アルゴリズムのモデルは、訓練サンプルを解析することにより特定の結果を得る。半教師あり学習アルゴリズムでは、訓練サンプルのいくつかはラベルを有し、残りの訓練サンプルはラベルを有さない。しかしながら、ラベルを有さないデータは、ラベルを有するデータよりもはるかに多い。強化学習アルゴリズムは、期待される利益を最大化するために、環境におけるポリシーを常に実験し、環境によって与えられる報酬又は罰則を用いることにより、最大の利益を得ることが可能な選択を行う。
なお、各訓練サンプルは、一次元又は多次元の特徴データを含む。すなわち、1つ以上の特徴の特徴データを含む。例えば、キーパフォーマンスインジケータ(key performance indicator、KPI)データに関する分類結果を予測するシナリオでは、特徴データは具体的にKPI特徴データであり得る。KPI特徴データは、KPIデータに基づいて生成された特徴データを指し、KPI特徴データは、KPI時系列の特徴データ、すなわち、KPI時系列の特徴を抽出することにより得られたデータであり得る。KPI特徴データは直接的にKPIデータであり得る。KPIは、具体的にはネットワークKPIであってもよく、ネットワークKPIは、中央処理装置(central processing unit、CPU)利用率、光パワー、ネットワークトラフィック、パケット損失率、遅延及び/又はアクセスされるユーザの数等の様々なカテゴリーのKPIを含み得る。KPI特徴データがKPI時系列の特徴データの場合、KPI特徴データは、前述のKPIカテゴリーのいずれか1つのKPIデータの時系列から抽出された特徴データであり得る。例えば、1つの訓練サンプルは、合計で2つの特徴、すなわち、対応するネットワークKPI時系列の最大値及び加重平均値を有するネットワークKPI特徴データを含む。KPI特徴データがKPIデータの場合、KPI特徴データは、具体的には、前述のKPIカテゴリーのうちのいずれか1つのKPIデータであり得る。例えば、1つの訓練サンプルは、CPU利用率、パケット損失率及び遅延の3つの特徴を有するネットワークKPI特徴データを含む。また、教師あり学習アルゴリズム又は半教師あり学習アルゴリズムが適用されるシナリオでは、訓練サンプルはラベルをさらに含み得る。例えば、KPIデータに関する分類結果を予測する前述のシナリオでは、分類結果がデータシーケンスが異常であるかどうかを示すために用いられると仮定した場合、1つの訓練サンプルは「異常」又は「正常」のラベルをさらに含む。
なお、前述の時系列は特殊なデータ系列であり、時系列は、時系列に従って配置されたデータ群のセットである。時系列は、通常、データ生成シーケンスであり、時系列内のデータはデータ点とも呼ばれる。通常、1つの時系列における2つのデータ点の時間間隔は定数値であるため、時系列を離散時間データとして使用して分析・処理することができます。
機械学習アルゴリズムの現在の訓練方法は、オフライン学習方法とオンライン学習方法に分類される。
オフライン学習(オフライン訓練とも呼ばれる)方法では、訓練サンプルセット内のサンプルを、モデル訓練を行うために機械学習モデルにバッチで入力する必要があり、訓練のために比較的大きなデータ量が必要になる。オフライン学習は、通常、大規模又は複雑なモデルを訓練するために用いられる。したがって、訓練プロセスは通常時間がかかり、大きなデータ量を処理する必要がある。
オンライン学習(オンライン訓練とも呼ばれる)方法では、訓練サンプルセットのサンプルを少ないバッチで又は1回ずつ用いることによりモデル訓練を行う必要があり、訓練のための少ないデータ量が必要である。オンライン学習は、通常、リアルタイムでの要求度が高いシナリオに適用される。インクリメンタル学習(インクリメンタル訓練とも呼ばれる)方法は特別なオンライン学習方法であり、これは、新たなモデルをリアルタイムで学習する能力を有するだけでなく、反忘却能力を有すること、すなわち、モデルが歴史的に学習されたモードを記憶するだけでなく、新たなモードを学習することも必要になる。
機械学習の実際的なタスクでは、機械学習モデルを構築するために代表的なサンプルを選択する必要がある。通常、ラベルを有するサンプルデータでは、カテゴリーと強い相関のあるサンプルがサンプルセットとして選択される。ラベルは、サンプルデータを識別するために、例えば、サンプルデータのカテゴリーを識別するために用いられる。本願の実施形態では、機械学習モデル訓練のために用いられる全てのデータは、サンプルデータである。以下では、一部の内容において訓練データを訓練サンプルと呼び、訓練サンプルデータを訓練サンプルセットと呼び、サンプルデータを省略してサンプルと呼ぶ。
機械学習モデルは、入力特徴データを推論して推論結果を得るように構成されている。機械学習モデルは、入力特徴データの分類を推論するように構成された分類予測モデルであってもよい。例えば、機械学習モデルは、特徴データが異常かどうかを検出するように構成された異常検出モデルであってもよい。機械学習モデルは、代替的に、入力特徴データに基づく推論を介して特定の値を得るように構成された数値予測モデルであってもよい。例えば、機械学習モデルは、現在のトラフィックの入力特徴データに基づいて将来のトラフィック量を予測するように構成されたトラフィック予測モデルであってもよい。通常、分類予測モデルは、代替的に、略して分類モデルと呼ばれることがあり、数値予測モデルは、略して予測モデルと呼ばれることがある。
添付の図面を参照しながら、本願の実施形態における技術的解決策を以下で説明する。
図1は、本願の一実施形態に係るモデル更新方法の適用シナリオの概略図である。図1に示すように、適用シナリオは複数の解析装置を含み、複数の解析装置は、第1の解析装置101及びサイト解析装置102を含む。各解析装置は、データマイニング及び/又はデータモデリング等の一連のデータ分析プロセスを行うように構成されている。図1における第1の解析装置101の数及びサイト解析装置102の数は一例として用いているに過ぎず、本願のこの実施形態に係るモデル更新方法の適用シナリオを限定することを意図したものではない。
第1の解析装置101は、具体的には、クラウド解析装置(以下、略してクラウド装置と呼ぶ)であり得る。クラウド解析装置は、コンピュータ、サーバ、複数のサーバを含むサーバクラスタ又はクラウドコンピューティングサービスセンターであってもよく、サービスネットワークのバックエンドに配置される。略してサイト装置と呼ばれるサイト解析装置102は、サーバ、複数のサーバを含むサーバクラスタ又はクラウドコンピューティングサービスセンターであり得る。適用シナリオでは、モデル更新方法に関連するモデル更新システムは複数のサイト装置を含む。すなわち、複数のサイトネットワークを含む。サイトネットワークは、コアネットワーク又はエッジネットワークであり得る。各サイトネットワークにおけるユーザは、キャリア又は企業顧客であり得る。異なるサイトネットワークは、対応する次元に基づいて分割される異なるネットワークであってもよく、例えば、異なる地域におけるネットワーク、異なるキャリアのネットワーク、異なるサービスネットワーク及び異なるネットワークドメインであり得る。複数のサイト解析装置102は、複数のサイトネットワークと1対1で対応し得る。各サイト解析装置102は、対応するサイトネットワークのためにデータ分析サービスを提供するように構成され、サイト解析装置102は、対応するサイトネットワーク内に位置し得るか又は対応するサイトネットワークの外に位置し得る。各サイト解析装置102は、有線ネットワーク又は無線ネットワークを用いることにより第1の解析装置101に接続される。本願のこの実施形態における通信ネットワークは、第2世代(2-nd Generation、2G)通信ネットワーク、第3世代(3rd generation、3G)通信ネットワーク、ロングタームエボリューション(Long Term Evolution、LTE)通信ネットワーク、第5世代(5th Generation、5G)通信ネットワーク等である。
サイト解析装置102の主な機能は、第1の解析装置101から送信された第1のモデルを受信し、第1の訓練サンプルを用いることにより第1のモデルを訓練し(例えば、第1のモデルに対してインリメンタル訓練を行う)て第2のモデルを得ることであって、第1の訓練サンプルは、サイト解析装置に対応するサイトネットワーク内のネットワーク装置の第1の特徴データを含む、ことと、第1のモデルと第2のモデルとの差分データを得て、差分データを第1の解析装置に送信することである。差分データは、具体的には、複数のパラメータの差分値を含むマトリクスであり得る。例えば、第1のモデルは4つのパラメータを含み、4つのパラメータの値を含むマトリクスは[a1、b1、c1、d1]である。第2のモデルも4つのパラメータも含む。値を含むマトリクスが[a2、b2、c2、d2]の場合、4つのパラメータの差分値を含むマトリクスは[a2-a1、b2-b1、c2-c1、d2-d1]である。
第1の解析装置101の主な機能は、収集された訓練データに基づく訓練を介して第1のモデルを得ることであって、第1のモデルは機械学習モデル(このプロセスでは前述のオフライン学習方法が用いられる)であり、次いで、第1のモデルを各サイト解析装置102に配備する。サイト解析装置102は、インクリメンタル訓練(前述のオンライン学習方法がこのプロセスで用いられる)を行う。第1の解析装置101は、サイト解析装置102によって送信される差分データを収集し、サイト解析装置102のためにモデル更新サービスを提供する。第1の解析装置101は、差分データに基づいて第1のモデルを更新して第3のモデルを得て、第3のモデルをサイト解析装置102に送信する。異なる訓練サンプルに基づいて、異なる機械学習モデルが訓練を通して得られてもよく、異なる機械学習モデルは異なる機能を実施し得る。例えば、異常検出、予測、ネットワークセキュリティ保護及びアプリケーション識別又はユーザ体験評価(すなわち、ユーザ体験に関する評価)等の機能が実施され得る。
また、図2は、本願の一実施形態に係るモデル更新方法の別の適用シナリオの概略図である。図1に基づいて、適用シナリオはネットワーク装置103をさらに含む。各サイト解析装置102は、ネットワーク(サイトネットワークとも呼ばれる)内のネットワーク装置103を管理し得る。ネットワーク装置103は、ルータ、スイッチ、基地局等であり得る。ネットワーク装置103は、有線ネットワーク又は無線ネットワークを用いることによりサイト解析装置102に接続されている。ネットワーク装置103は、収集された特徴データ、例えば、時系列の様々なカテゴリーのKPIをサイト解析装置102にアップロードするように構成され、サイト解析装置102は、ネットワーク装置103から特徴データを抽出し用いるように構成され、例えば、取得された時系列のラベルを特定し得る。任意で、ネットワーク装置103によって解析装置102にアップロードされるデータは、様々な種類のログデータ、装置状態データ等をさらに含み得る。
また、本願のこの実施形態に係るモデル更新方法は、異常検出シナリオで用いられ得る。異常検出は、期待に応えないモードを検出することである。異常検出のデータソースは、アプリケーション、プロセス、オペレーティングシステム、装置又はネットワークを含む。例えば、異常検出のオブジェクトは前述のKPIデータ系列であり得る。本願のこの実施形態に係るモデル更新方法が異常検出シナリオに適用される場合、サイト解析装置102はネットワークアナライザであり、サイト解析装置102によって維持される機械学習モデルは異常検出モデルであり、決定されたラベルは異常検出ラベルである。異常検出ラベルには、「正常」及び「異常」の2つの分類ラベルを含む。
異常検出シナリオにおいて、前述の機械学習モデルは、統計データ分布アルゴリズム(例えば、Nシグマアルゴリズム)、距離/密度アルゴリズム(例えば、局所異常因子アルゴリズム)に基づくモデル、ツリーモデル(例えば、孤立森(Isolation forest、Iforest))、予測指向アルゴリズム(例えば、自己回帰和分移動平均モデル(Autoregressive Integrated Moving Average model、ARIMA))に基づくモデルであり得る。
なお、実際の適用の間の機械学習モデルの性能は、機械学習モデルを訓練するために用いられる訓練データに大きく依存する。訓練データの収集シナリオとモデルの適用シナリオとの類似性が高いほど、機械学習モデルの性能がより良好であることを通常示す。しかしながら、ネットワークシナリオでは、サービス及びネットワークは絶えず変化し、異なるシナリオが生成される。したがって、異なるシナリオのために異なる訓練データを用いることにより機械学習モデルを訓練することは実用的ではない。したがって、1つの訓練データを用いることにより機械学習モデルが訓練され、機械学習モデルが異なるシナリオで用いられる場合が起こる。したがって、実際の適用の間に、機械学習モデルは、必然的に、モデル性能の劣化の問題、すなわち、モデルのシナリオの一般化の問題がもたらされる。とりわけ、訓練データの収集シナリオが機械学習モデルの適用シナリオと非常に類似し、モデルが良好に動作する場合でも、機械学習モデルの適用シナリオは変化し得る。その結果、訓練データの収集シナリオは、機械学習モデルの適用シナリオとは依然として異なる、すなわち、モデル性能の劣化の問題が生じる。したがって、モデル性能を維持をどのように維持するかはネットワークにおける重要な課題である。
関連技術において、クラウド装置はオフラインモデル訓練を行い、その後、オフライン訓練の後に得られたモデルをサイト装置又はネットワーク装置に直接配備する。しかしながら、訓練を介して得られたモデルは、サイト装置又はネットワーク装置の要件、例えば、予測性能(例えば、精度又は再現率)要件に効果的に適合しないことがある。一方では、クラウド装置によって用いられる歴史的な訓練サンプルセットの訓練サンプルは、通常、予め設定された固定の訓練サンプルであり、サイト装置又はネットワーク装置の要件を満たさない場合がある。他方で、訓練を介して得られた機械学習モデルがサイト装置又はネットワーク装置に機械学習モデルが新たに配備された際にサイト装置又はネットワーク装置の要件を満足したとしても、サイト装置又はネットワーク装置によって得られる特徴データのカテゴリー又はモードは変化するため、訓練を介して得られた機械学習モデルはサイト装置の要件をもう満たさない。
本願の一実施形態はモデル更新方法を提供する。後続の実施形態では、第1の解析装置101はクラウド装置であり、サイト解析装置102はサイト装置であり、第1のモデル、第2のモデル及び第3のモデルの全ては機械学習モデルに属するものと仮定する。サイト装置は、クラウド装置によって送信される第1のモデルを受信する。サイト装置は、第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを取得し得る。サイト装置は、第1のモデルと第2のモデルとの差分データを取得し、差分データをクラウド装置に送信して、クラウド装置に差分データに基づいて第1モデルを更新するよう要求し得る。差分データは、第1のモデル及び第2のモデルに基づいてサイト装置によって得られ、第2のモデルは、第1の訓練サンプルを用いることにより第1モデルを訓練することによりサイト装置によって得られる。第1の訓練サンプルはネットワーク装置の第1の特徴データを含み、差分データのプライバシーは第1の特徴データのものよりも高い。したがって、第1の解析装置がモデル性能を維持するために第1のモデルを更新することに基づいて、プライバシーが改善される。
また、クラウド装置は、L個のサイト装置から送信される複数の差分データを受信してもよく、クラウド装置は、複数の差分データに基づいて第1のモデルを更新して第3のモデルを取得し得る。第1の訓練サンプルを用いることにより第1のモデルにインクリメンタル訓練を行うことによってサイト装置により得られる第2のモデルと比較して、第3のモデルはより良い性能を有することができるため、モデルの一般化を改善できる。
本願の一実施形態はモデル更新方法を提供する。本方法は図1及び図2に示す任意の適用シナリオに適用され得る。第1のモデルは、分類結果を予測するために用いられ得る。例えば、第1のモデルはバイナリ分類モデルであり得る。
識別を容易にするために、本願の後続の実施形態では、マニュアル又はラベルのマイグレーション方法で決定される分類結果はプリセットラベルと呼ばれ、第1のモデルによる予測によって得られる結果を第1の推論結果と呼ぶ。2つの結果は実質的に同じであり、両方とも対応するサンプルのカテゴリーを特定するために用いられる。モデル更新方法の適用シナリオは、通常、複数のサイト装置を含む。
上記では本願の実施形態におけるネットワークフレームワークを説明したが、以下では、本願の実施形態におけるモデル更新方法を説明する。
本願の実施形態の技術的解決策では、第1のモデルはサイト装置上に設定され得るか又はネットワーク装置上で設定され得る。以下では、2つの設定シナリオを別々に説明する。
1.第1のモデルがサイト装置上で設定され得る。
図3を参照して、本願の実施形態におけるモデル更新方法の実施形態は以下のステップを含む。
301:クラウド装置は訓練データに基づいて第1のモデルを得る。
クラウド装置は訓練データを得て、その後に、訓練データに基づいて第1のモデルを取る。訓練データは、ネットワーク装置又は一部のネットワーク装置からクラウド装置によって収集された歴史的な特徴データであり得るか又は訓練データは、モデルの適用シナリオに基づいてモデル訓練装置によって別個に設定されたデータであり得る。これは、本明細書では具体的に限定されない。
302:クラウド装置は第1のモデルをサイト装置に送信する。
クラウド装置が履歴データに基づいて第1のモデルを得た後に、クラウド装置は第1のモデルをサイト装置に送信する。
303:サイト装置は、第1のモデルを用いることにより、ネットワーク装置の予測されるべき特徴データに関する分類結果を予測する。
上述のように、異なる機械学習モデルは異なる機能を実施し得る。第1のモデルが分類機能を実施する場合、クラウド装置によって送信される第1のモデルを受信した後に、サイト装置は第1のモデルを用いることにより分類結果を予測し得る。
例えば、ネットワーク装置のオンラインデータに対して分類結果の予測を行う必要がある場合、分類結果の予測を行う必要があるデータは、その特徴カテゴリーがCPUであるKPI及び/又はその特徴カテゴリーがメモリ(memory)であるKPIを含み得る。
ネットワーク装置のオンラインデータに対して異常検出を行う必要があると仮定する。すなわち、予測を介して得られた分類結果はデータが異常かどうかを示す。この場合、サイト装置は定期的に異常検出プロセスを行い、サイト装置は、ネットワーク装置の予測されるべき特徴データを取得し、第1のモデルを用いることにより、予測されるべき特徴データに対してオンライン検出を行い得る。第1のモデルの異常検出結果を表1、表2に示す。表1及び表2は異なる収集時点(データ生成時点とも呼ばれる)で得られた検出されるべきデータの異常検出結果を記録する。異なる収集時点はT1~TN(Nは1より大きい整数)を含み、異常検出結果は、対応する検出されるべきデータが異常かどうかを示す。表1の検出されるべきデータ及び表2の検出されるべきデータの両方は一次元特徴データを含む。表1は、その特徴カテゴリーがCPUであるKPIの検出されるべきデータの異常検出結果を記録する。表2は、その特徴カテゴリーがメモリであるKPIの検出されるべきデータの異常検出結果を記録する。0は正常を示し、1は異常を示すと仮定する。T1からTNまでの2つの収集時点の間隔の期間は予め設定された時間周期である。収集時点T1を一例として用いる。この時点で、その特徴カテゴリーがCPUである表1におけるKPIは0であり、その特徴カテゴリーがメモリである表2におけるKPIは1である。これは、その特徴カテゴリーがCPUである収集時点T1で収集されるKPIが正常であり、その特徴カテゴリーがメモリである収集時点T1で収集されるKPIは異常である。
Figure 0007401677000001
Figure 0007401677000002
第1のモデルを受信した後で、サイト装置が第1のモデルのパフォーマンス定量インジケータを直接取得し得るため、任意で、ステップ303は行われないことがある。第1のモデルのパフォーマンス定量インジケータが目標閾値未満の場合、サイト装置は第1の訓練サンプルを用いることにより第1のモデルを訓練する。すなわち、第1のモデルが使用される前に、サイト装置は先ず第1のモデルの性能が条件を満たすかどうか判定する。第1のモデルの性能が条件を満たさない場合、第1のモデルが先ず更新される。
304:ネットワーク装置は第1の特徴データをサイト装置に送信する。
第1のモデルは、ネットワーク装置の予測されるべき特徴データに基づいて推論を行い得るが、第1モデルはサイト装置上に設定されている。したがって、ネットワーク装置は第1の特徴データをサイト装置に送信する必要がある。
ネットワーク装置の機能データは、ネットワーク装置によって生成されるデータである。例えば、ネットワーク装置がカメラの場合、カメラの特徴データは、カメラによって収集され且つ生成された画像データであり得る。例えば、ネットワーク装置が音声レコーダの場合、音声レコーダの特徴データは、音声レコーダによって収集され且つ生成された音声データであり得る。例えば、ネットワーク装置がスイッチの場合、スイッチの特徴データはKPIデータであってもよく、KPIデータは、スイッチがトラフィックを転送するときに生成される統計情報であってもよく、例えば、出力パケットのバイト数、出力パケットの数、キュー深度、スループット情報及び損失パケット数であり得る。
305:ネットワーク装置はサイト装置に第2の特徴データを送信する。
第1のモデルは、ネットワーク装置の予測されるべき特徴データに基づいて推論を行い得るが、第1のモデルはサイト装置上で設定されている。したがって、ネットワーク装置は第2の特徴データをサイト装置に送信する必要がある。
306:サイト装置は、第2の特徴データに基づいて第1のモデルのパフォーマンス定量インジケータを得る。
サイト装置が第2の特徴データを得た後に、サイト装置は、第2の特徴データに基づいて第1のモデルのパフォーマンス定量インジケータを取得し得る。
第1のモデルはサイト装置上で設定され、サイト装置は、第2の特徴データを第1のモデルの入力として用いて第1のモデルにより出力される第1の推論結果出力を取得し得る。サイト装置は、第2の特徴データのプリセットラベルをさらに取得し得る。プリセットラベルは、別のモデルを用いることにより、第2の特徴データに基づいてサイト装置による推論を介して取得され得る。通常、他のモデルの複雑度は第1のモデルのものよりも高く、他のモデルの精度は第1のモデルのものよりも高い。他のモデルは、例えば、精度を除いて、例えば長い推論時間といった欠点を有し、その結果、オンラインのリアルタイム推論に適応できない。したがって、第1のモデルはサイト装置上で設定される。サイト装置は第1の推論結果及びプリセットラベルに基づいて第1のモデルの精度を取得し、サイト装置は第1のモデルのパフォーマンス定量インジケータとしてその精度を用いる。例えば、第2の特徴データは100個の画像サンプルを含む。第1の推論結果は、70個の画像サンプルがそれぞれ人物を含み、30個の画像サンプルは人物を含まないというものである。プリセットラベルは、80個の画像サンプルはそれぞれが人物を含み、20個の画像サンプルは人物を含まないというものである。加えて、第1の推論結果においてそれぞれが人物を含む70個の画像サンプルは、プリセットラベルにおけるそれぞれが人物を含む80個の画像サンプルに属する。したがって、サイト装置は、第1のモデルの精度は、(70+30-10)÷100×100%=90%であると判定する。
任意で、サイト装置は、第1のモデルのパフォーマンス定量インジケータとして精度を用いず、第1のモデルのパフォーマンス定量インジケータとして再現率を用いり得る。サイト装置は、第1の推論結果及びプリセットラベルに基づいて、第1のモデルの再現率を得る。サイト装置は、再現率を第1のモデルのパフォーマンス定量インジケータとして用いる。前述の例を依然として用いる。第2の特徴データは100個の画像サンプルを含む。第1の推論の結果は、70個の画像サンプルがそれぞれ人物を含み、30個の画像サンプルは人物を含まないというものである。プリセットラベルは、80個の画像サンプルはそれぞれが人物を含み、20個の画像サンプルは人物を含まないというものである。加えて、第1の推論結果においてそれぞれ人物を含む70個の画像サンプルは、プリセットラベルにおけるそれぞれが人物を含む80個の画像サンプルに属する。したがって、サイト装置は、第1のモデルの再現率は、70÷80×100%=87.5%であると判定する。
サイト装置は、第1のモデルのパフォーマンス定量インジケータとして精度を用いり得るか又はサイト装置は、第1のモデルのパフォーマンス定量インジケータとして再現率を用いり得ることが理解されよう。実際の適用の間に、サイト装置は、代替的に、第1のモデルのパフォーマンス定量インジケータとして別の特徴を用いり得る。これは、本明細書では具体的に限定されない。
任意で、サイト装置は、手動ラベリングによりプリセットラベルをさらに取得し得る。
サイト装置は、第1のモデルのパフォーマンス定量インジケータとして精度を用いり得るか又はサイト装置は、第1のモデルのパフォーマンス定量インジケータとして再現率を用いり得ることが理解されよう。実際の適用の間に、サイト装置は、代替的に、第1のモデルのパフォーマンス定量インジケータとして精度及び再現率のうちの1つを選択し得るか又はサイト装置は第1のモデルのパフォーマンス定量インジケータとして精度及び再現率の両方を選択し得る。これは、本明細書では具体的に限定されない。
任意で、サイト装置は第2の特徴データを取得しなくてもよく、サイト装置は、第1のモデルのパフォーマンス定量インジケータを得るために他のデータを取得し得る。つまり、サイト装置は、ネットワーク装置上の特徴データを得ることなく、他の装置上のデータを取得し得るか又はサイト装置の記憶空間内のデータを取得し、該データを用いることにより第1のモデルのパフォーマンス定量インジケータを取得し得る。
任意で、サイト装置は、他のモデルを用いることによりプリセットラベルを取得しなくてもよい。例えば、第2の特徴データは先月のネットワーク装置の特徴データであり、第1の推論結果は今月に第1のモデルにより得られた推論結果であり、サイト装置は先月の第2の特徴データに基づいて第1のモデルによって得られたプリセットラベルを取得し得る。
307:第1のモデルのパフォーマンス定量インジケータが目標閾値未満の場合、第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを取得し、第1のモデルと第2のモデルとの差分データを得る。
第1のモデルのパフォーマンス定量インジケータが目標閾値未満の場合、サイト装置は第1の訓練サンプルを用いることにより第1のモデルに対してインクリメンタル訓練を行って第の2モデルを取得し、第1のモデルと第2のモデルとの差分データを取得する。
任意で、サイト装置が第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを得た後に、サイト装置は、テストデータを用いることにより第2のモデルの性能をテストしてもよく、テストデータはグラウンドトゥルースラベルを含む。
任意で、サイト装置がテストデータを用いることにより第2のモデルの性能をテストする場合、サイト装置は劣化したデータを記憶してもよく、劣化したテストデータはテストデータの一部または全部に属する。サイト装置がテストデータを用いることにより第2のモデルの性能をテストする場合、サイト装置は第2のモデルを用いることによりテストデータの推論ラベルを取得し得る。劣化したデータは、その推論ラベルがグラウンドトゥルースラベルと等しくないテストデータを指す。例えば、第1の訓練サンプルは500個のサンプルデータを含み、400個のサンプルのグラウンドトゥルースラベルはそれぞれ1であり、100個のサンプルのグラウンドトゥルースラベルはそれぞれ0である。訓練プロセスでは、第2のモデルは、405個のサンプルの推論ラベルはそれぞれ1であり、95個のサンプルの推論ラベルはそれぞれ0であると推論する。第2のモデルによって推論される推論ラベルがそれぞれ1である405個のサンプルにおいて、10個のサンプルのグラウンドトゥルースラベルはそれぞれ0である。第2のモデルによって推論された推論ラベルがそれぞれ0である95個のサンプルにおいて、5つのサンプルのグラウンドトゥルースラベルはそれぞれ1である。サイト装置は、グラウンドトゥルースラベルがそれぞれ0であるが、第2のモデルによる推論を介して得られた推論ラベルがそれぞれ1である10個の劣化したデータと、グラウンドトゥルースラベルがそれぞれ1であるが、第2のモデルによる推論を介して得られた推論ラベルがそれぞれ0である5個の劣化したデータを取得する。サイト装置は劣化したデータを記憶する。将来、サイト装置が訓練サンプルを用いることによりモデルを訓練する場合、サイト装置は劣化したデータを訓練サンプルに加える。
サイト装置によって記憶される劣化したデータの数は、全ての劣化データのうちの一部の数であり得るか又は全ての劣化したデータの全ての数であり得ることが理解されよう。例えば、劣化したデータが合計で15個あり、サイト装置は劣化したデータを10個記憶し得るか又は劣化したデータを15個記憶し得る。これは、本明細書では具体的に限定されない。
任意で、第1の訓練サンプルは、時系列に基づいて決定されたデータを含み得る。例えば、第1の訓練サンプルは、KPI時系列に基づいて決定されたデータを含み得る。通常、第1の訓練サンプル内の各訓練サンプルは1つの時系列に対応し、訓練サンプルは、対応する時系列から抽出された1つ以上の特徴の特徴データを含み得る。各訓練サンプルに対応する特徴の数は、訓練サンプルの特徴データの数と同じである(すなわち、特徴は特徴データと1対1の対応関係にある)。訓練サンプル内の特徴は対応する時系列の特徴を参照し、データ特徴及び/又は抽出特徴を含み得る。
データ機能は、時系列内のデータの機能である。例えば、データ特徴は、データ配列の周期性、データ変化傾向又はデータ変動を含み、それに対応して、データ特徴の特徴データは、データ配列の周期性のデータ、データ変化傾向のデータ又はデータ変動のデータを含む。データ配列の周期性とは、時系列内のデータが周期的に配列されている場合に、時系列内のデータ配列に関連する周期性をいう。例えば、データ配列の周期性のデータは、周期性の期間(すなわち、2つの周期性が開始される時間間隔)及び/又は周期性の数を含む。データ変化傾向のデータは、時系列内のデータ配列の変化傾向(すなわち、データ変化傾向)を反映するために用いられる。例えば、データ変化傾向のデータは、継続的な成長、継続的な減少、最初の増加及びその後の減少、最初の減少及びその後の増加又は正規分布を満たすことを含む。データ変動のデータは、時系列におけるデータの変動状態(データ変動)を反映するために用いられる。例えば、データ変動のデータは、時系列の変動曲線又は時系列の特定の値、例えば、最大値、最小値又は平均値を表す関数を含む。
抽出機能は、時系列におけるデータを抽出するプロセスにおける機能である。例えば、抽出機能は、統計的特徴、フィッティング特徴又は周波数領域特徴を含み、これに対応して、抽出機能の特徴データは、統計的特徴データ、フィッティング特徴データ又は周波数領域特徴データを含む。統計的特徴は時系列の統計的特徴をいい、統計的特徴は定量的特徴及び属性特徴に分類され、定量的特徴は計量的特徴及び計数的特徴にさらに分類され、定量的特徴は数値を用いることにより直接表現され得る。例えば、CPU、メモリ及びIOリソース等の複数のリソースの消費は計量的特徴であり、異常の数及び正常に動作する装置の数は計数的特徴である。属性特徴、例えば、装置が異常であるか又は故障しているかは、数値を用いることにより直接表現することができない。統計的特徴内の特徴は、統計情報の収集の間に確認する必要がある指標です。例えば、統計的特徴データは移動平均値(Moving_average)及び加重平均値(Weigheted_mv)を含む。フィッティング特徴は、時系列のフィッティングの間に得られる特徴であり、フィッティング特徴データは、フィッティングのために用いられる時系列の特徴を反映するために用いられる。例えば、フィッティング特徴データは、フィッティングの間に用いられるアルゴリズム、例えばARIMAを含む。周波数領域特徴は周波数領域における時系列の特徴であり、周波数領域特徴は周波数領域における時系列の特徴を反映するために用いられる。例えば、周波数領域特徴データは、周波数領域内で分布すする時系列によって従われる規則、例えば、時系列における高周波成分の割合に関するデータを含む。任意で、周波数領域特徴データは、時系列に対してウェーブレット分解を行うことにより取得され得る。
訓練サンプル内の特徴データが第1の時系列から取得されたと仮定すると、データ取得プロセスは、抽出する必要があるターゲット特徴を決定し、決定されたターゲット特徴の特徴データを第1の時系列から抽出して、得られたターゲット特徴のデータを含む訓練サンプルを得ることを含み得る。例えば、抽出する必要があるターゲット特徴は、モデル訓練方法の適用シナリオに基づいて決定される。任意の例では、ターゲット機能は予め設定された特徴、例えば、ユーザによって設定された特徴である。別の任意の例では、ターゲット特徴は、特定の特徴のうちの1つ以上である。例えば、特定の特徴は統計特徴である。
なお、ユーザは特定の特徴を予め設定し得るが、第1の時系列は全ての特定の特徴を有さないことがあり、クラウド装置は、第1の時系列において、特定の特徴に属する特徴をターゲット特徴として選別し得る。例えば、ターゲット特徴は、時系列分解_周期性コンポーネント(例えば、時系列分解_季節性Tsd_seasonal)、移動平均値、加重平均値、時系列分類、最大値、最小値、分位点、分散、標準偏差、周期性対周期性比較(例えば、対前年比yoy、同じ周期性との比較をいう)、日内変動率、バケットエントロピー、サンプルエントロピー、移動平均、指数移動平均、ガウス分布特性、T分布特性等のうちの1つ以上を含む統計的特徴を含み、それに対応して、ターゲット特徴データは1つ以上の統計的特徴のデータを含み、
及び/又はターゲット特徴は、自己回帰フィッティング誤差、ガウスプロセス回帰フィッティング誤差又はニューラルネットワークフィッティング誤差のうちの1つ以上を含むフィッティング特徴を含み、それに対応して、ターゲット特徴データは1つ以上のフィッティング特徴のデータを含み、
及び/又はターゲット特徴は、周波数領域特徴、すなわち、時系列における高周波成分の割合を含み、それに対応して、ターゲット特徴データは、時系列における高周波成分の割合に関するデータを含み、該データは、時系列に対してウェーブレット分解を行うことにより得られ得る。
表3は、訓練サンプルセット内の1つのサンプルの概略説明である。表3において、訓練サンプルセット内の各訓練・サンプルは、1つ以上の特徴を有するKPI時系列の特徴データを含み、訓練サンプルは1つのKPI時系列に対応する。表3において、識別(identification、ID)がKPI_1である訓練サンプルは4つの特徴の特徴データを含み、4つの特徴の特徴データは、それぞれ、移動平均値(Moving_average)、加重平均値(Weighted_mv)、時系列分解_周期性コンポーネント及び周期性yoyである。訓練サンプルに対応するKPI時系列は(x1、x2、・・・xn)(時系列は、通常、KPIカテゴリーのデータをサンプリングすることにより得られる)であり、対応するラベルは「異常」である。
Figure 0007401677000003
第2の任意の方法では、クラウド装置によって得られた訓練サンプルは特定の特徴を有するデータを含んでもよく、訓練サンプルは得られたデータである。例えば、訓練サンプルにはKPIデータを含む。上述したように、KPIがネットワークKPIであると仮定すると、各サンプルは、1つ以上のネットワークKPIカテゴリーのネットワークKPIデータを含んでもよく、すなわち、サンプルに対応する特徴はKPIカテゴリーである。
表4は、訓練サンプルセット内の1つのサンプルの概略説明である。表4では、訓練サンプルセット内の各訓練サンプルは、1つ以上の特徴のネットワークKPIデータを含む。表4では、各訓練サンプルは、同じ収集時点で得られた複数のネットワークKPIデータに対応する。表4では、識別(ID)がKPI_2である訓練サンプルは4つの特徴の特徴データを含む。4つの特徴の特徴データは、それぞれネットワークトラフィック、CPU利用率、パケット損失率及び遅延であり、対応するラベルは「正常」である。
Figure 0007401677000004
表3及び表4の各特徴に対応する特徴データは、通常、数値データである。すなわち、各特徴は特徴値を有する。説明を容易にするために、表3及び表4には特徴値を示していない。訓練サンプルセットは、特徴データを固定のフォーマットで記憶すると仮定し、特徴データに対応する特徴は予め設定された特徴であり得る。この場合、訓練サンプルセットの特徴データは、表3又は表4のフォーマットで記憶され得る。本願のこの実施形態における実際の実施の間、訓練サンプルセット内のサンプルは、代替的に、別の形態を有し得る。これは、本願のこの実施形態では限定されない。
なお、オフライン訓練を行う前に、第1の解析装置は、訓練サンプルセット内の収集されたサンプルを前処理し、次いで、前処理された訓練サンプルセットに基づいてオフライン訓練を行い得る。前処理プロセスは、収集されたサンプルを、予め設定された条件を満たすサンプルに処理するために用いられる。前処理プロセスは、サンプル重複排除、データ洗浄及びデータ補完のうちの1つ以上を含み得る。
任意で、サイト装置が第1のモデルのパフォーマンス定量インジケータとして異なる特徴を用いる場合、目標閾値は異なり得る。例えば、サイト装置が第1のモデルのパフォーマンス定量インジケータとして精度を用いる場合、目標閾値は第1の目標閾値であり、サイト装置が第1のモデルのパフォーマンス定量インジケータとして再現率を用いる場合、目標閾値は第2の目標閾値であり、第1の目標閾値は第の目標閾値とは異なる場合がある。
任意で、サイト装置が第1のモデルのパフォーマンス定量インジケータとして複数の異なる特徴を同時に用いる場合、サイト装置は、第1のモデルのパフォーマンス定量インジケータが目標閾値を満たすかどうかを決定するために、少数派が多数派に従う原則を選択し得る。例えば、サイト装置が第1のモデルの第1のパフォーマンス定量インジケータとして精度を用いる場合、目標閾値は第1の目標閾値であり、第1のパフォーマンス定量インジケータは第1の目標閾値未満である。サイト装置が第1のモデルの第2のパフォーマンス定量インジケータとして再現率を用いる場合、目標閾値は第2の目標閾値であり、第2のパフォーマンス定量インジケータは第2の目標閾値よりも大きい。サイト装置が第1のモデルの第3のパフォーマンス定量インジケータとして精度を用いる場合、目標閾値は第3の目標閾値であり、第3のパフォーマンス定量インジケータは第3の目標閾値よりも大きい。第1のモデルは3つのパフォーマンス定量インジケータを有し、第1のパフォーマンス定量インジケータは第1の目標閾値未満であり、第2のパフォーマンス定量インジケータは第2の目標閾値よりも大きく、第3のパフォーマンス定量インジケータは第3の目標閾値よりも大きい。したがって、第1のモデルは、目標閾値よりも大きい2つのパフォーマンス定量インジケータを有し、目標閾値未満の1つのパフォーマンス定量インジケータを有する。多数派が少数派に従うという原則に基づいて、サイト装置は、第1のモデルのパフォーマンス定量インジケータは目標閾値よりも大きいと判定できる。
任意で、サイト装置が第1のモデルのパフォーマンス定量インジケータとして複数の異なる特徴を用いる場合、サイト装置は、異なるパフォーマンス定量インジケータの結果を決定する加重処理を行い得る。例えば、サイト装置が第1のモデルの第1のパフォーマンス定量インジケータとして精度を用いる場合、目標閾値は第1の目標閾値であり、第1のパフォーマンス定量インジケータは第1の目標閾値未満である。サイト装置が第1のモデルの第2のパフォーマンス定量インジケータとして再現率をさらに用いる場合、目標閾値は第2の目標閾値であり、第2のパフォーマンス定量インジケータは第2の目標閾値よりも大きい。サイト装置が第1のモデルの第3のパフォーマンス定量インジケータとして精度をさらに用いる場合、目標閾値は第3の目標閾値であり、第3のパフォーマンス定量インジケータは第3の目標閾値よりも大きい。サイト装置は、係数3を用いることにより、第1のパフォーマンス定量インジケータは第1の目標閾値未満であるという判定結果に対して加重処理を行い、サイト装置は、係数2を用いることにより、第2のパフォーマンス定量インジケータは第2の目標閾値より大きいという判定結果に対して加重処理を行い、サイト装置は、係数2を用いることにより、第3のパフォーマンス定量インジケータは第3の目標閾値よりも大きいという判定結果に対して加重処理を行う。サイト装置の最終的な判定結果は、-3+2+2=1であり、最終的な数値は正である。サイト装置は、第1のモデルのパフォーマンス定量インジケータは目標閾値より大きいと判定する。
任意で、サイト装置が第1のモデルのパフォーマンス定量インジケータを取得しない場合、サイト装置は第1のモデルが受信された時刻から現在の時刻までの時刻を取得し得る。クラウド装置が第1のモデルを受信した時間から現在の時間までの時間が閾値より大きい場合、サイト装置は第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを得る。
訓練サンプルは複数の形態を有し得る。これに対応して、サイト装置は、複数の方法で訓練サンプルを取得し得る。本実施形態では、以下の2つの任意の方法を説明のために一例として用いる。
第1の任意の方法では、サイト装置によって得られた第1の訓練サンプルセット内の訓練サンプルは、時系列に基づいて決定されたデータを含み得る。例えば、訓練サンプルは、KPI時系列に基づいて決定されたデータを含み得る。履歴訓練サンプルセットの構造を参照する。通常、第1の訓練サンプルセット内の各訓練サンプルは1つの時系列に対応し、訓練サンプルは、対応する時系列から抽出された1つ以上の特徴の特徴データを含み得る。各訓練サンプルに対応する特徴の数は、訓練サンプルの特徴データの数と同じである(すなわち、特徴は特徴データと1対1の対応関係にある)。訓練サンプル内の特徴は、対応する時系列の特徴を参照し、データ特徴及び/又は抽出特徴を含み得る。
任意の例では、サイト装置は、対応するサイトネットワーク内のサイト装置に接続されたネットワーク装置(すなわち、サイト装置によって管理されるネットワーク装置)によって送信される時系列を受信し得る。別の任意の例では、サイト装置は、入出力(I/O)インターフェイスを有し、I/Oインターフェイスを介して対応するサイトネットワークで時系列を受信する。さらに別の任意の例では、サイト装置は、サイト装置に対応する記憶装置から時系列を読み出し得る。記憶装置は、対応するサイトネットワークにおいて、サイト装置が予め取得した時系列を記憶するように構成されている。
第2の任意の方法では、サイト装置によって得られた訓練サンプルは、特定の特徴を有するデータを含んでもよく、訓練サンプルは得られたデータである。例えば、訓練サンプルはKPIデータを含む。上述のように、KPIはネットワークKPIであると仮定し、各サンプルは1つ以上のネットワークKPIカテゴリーのネットワークKPIデータを含み得る。すなわち、サンプルに対応する特徴はKPIカテゴリーである。
308:サイト装置は、第2のモデルを用いることによりネットワーク装置の予測されるべき特徴データについて分類結果を予測する。
ステップ308はステップ303と同様である。詳細については、ここでは再度説明しない。
309:サイト装置は差分データをクラウド装置に送信する。
サイト装置は、第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを得て、第1のモデルと第2のモデルの差分データを得た後に、サイト装置は差分データをクラウド装置に送信し得る。
310:クラウド装置は、差分データに基づいて第1のモデルを更新して第3のモデルを得る。
クラウド装置がサイト装置によって送信された差分データを受信した後に、クラウド装置は差分データに基づいて第1のモデルを更新して第3のモデルを得る。
任意で、クラウド装置に接続された複数のサイト装置がある場合、クラウド装置が複数のサイト装置によって送信される複数の差分データを受信した後に、クラウド装置は、複数の差分データに基づいて第1のモデルを更新して第3のモデルを得る。
任意で、クラウド装置に接続されたN個のサイト装置がある場合、クラウド装置は、クラウド装置に差分データを送信するL個のサイト装置に関する統計を収集し、LはN以下である。Nに対するLの比が閾値Kより大きく、Kが0より大きく且つ1以下であり、具体的には0.5より大きい値、例えば、0.8の場合、クラウド装置は受信した複数の差分データに基づいて第1のモデルを更新して第3のモデルを得る。
任意で、クラウド装置に接続された複数のサイト装置があり、クラウド装置が複数のサイト装置によって送信される複数の差分データを受信した場合、クラウド装置は複数の差分データの平均値を取得し、クラウド装置は平均値を用いることにより第1のモデルを更新して第3のモデルを得る。
例えば、第の1モデルは、サイト装置1によってアップロードされた差分データ及びサイト装置2によってアップロードされた差分データに基づいて更新される。サイト装置1によってアップロードされた差分データ及びサイト装置2によってアップロードされた差分データは、それぞれ[a2-a1、b2-b1、c2-c1、d2-d1]及び[a3-a1、b3-b1、c3-c1、d3-d1]であり、2つのサイト装置によってアップロードされた差分データの平均値は、[(a2-a1+a3-a1)/2、(b2-b1+b3-b1)/2、(c2-c1+c3-c1)/2、(d2-d1+d3-d1)/2]である。第1のモデルは平均値を用いることにより更新される。
任意で、クラウド装置に接続された複数のサイト装置があり、クラウド装置が複数のサイト装置によって送信される複数の差分データを受信した場合、クラウド装置は、複数の差分データの加重平均値を取得してもよく、クラウド装置は、複数の差分データの加重平均値を用いることにより第1のモデルを更新して第3のモデルを得る。
例えば、クラウド装置は、それぞれ第1のサイト装置の第1の差分データ、第2のサイト装置の第2の差分データ及び第3のサイト装置の第3の差分データである3つのサイト装置の差分データを受信する。第1のサイト装置のサービスデータ量と、第2のサイト装置のサービスデータ量と、第3のサイト装置のサービスデータ量との比は0.8/1/1.2である。クラウド装置は係数0.8を用いることにより第1の差分データに対して加重処理を行い、クラウド装置は係数1を用いることにより第2の差分データに対して加重処理を行い、クラウド装置は係数1.2を用いることにより第3の差分データに対して加重処理を行う。ネットワーク装置は、複数の差分データの加重平均値を用いることにより第1のモデルを更新して第3のモデルを得る。複数の差分データの加重平均値のアルゴリズムは、
A=(0.8×B1+1×B2+1.2×B3)÷3であり、
Aは、複数の差分データの加重平均値であり、B1は第1の差分データであり、B2は第2の差分データであり、B3は第3の差分データである。
別の例として、クラウド装置は、それぞれ第1のサイト装置の第1の差分データ、第2のサイト装置の第2の差分データ及び第3のサイト装置の第3の差分データである3つのサイト装置の差分データを受信する。第1のサイト装置のサービスデータ量と、第2のサイト装置のサービスデータ量と、第3のサイト装置のサービスデータ量との比は0.2/0.2/0.6である。クラウド装置は係数0.2を用いることにより第1の差分データに対して加重処理を行い、クラウド装置は係数0.2を用いることにより第2の差分データに対して加重処理を行い、クラウド装置は係数0.6を用いることにより第3の差分データに対して加重処理を行う。ネットワーク装置は、加重処理が既に行われた複数の差分データに基づいて第1のモデルを更新して第3のモデルを得る。複数の差分データの加重平均値のアルゴリズムは、
A=0.2×B1+0.2×B2+0.6×B3である。
複数の差分データの係数の和は1であるため、複数の差分データの加重和は、複数の差分データの加重平均値である。
Aは、複数の差分データの加重和であり、B1は第1の差分データであり、B2は第2の差分データであり、B3は第3の差分データである。
任意で、クラウド装置は、複数の差分データに対応するサイト装置のサービスデータ量に基づいて複数の差分データに対して加重処理を行わないが、複数の差分データに対応するサイト装置のサービス重要度に基づいて複数の差分データに対して加重処理を行い得る。サイト装置のサービスの重要度はオペレータの経験に基づいて設定され得る。
任意で、サイト装置のサービスの重要度は、サイト装置に接続されたネットワーク装置の数に基づいて決定され得る。例えば、第1のサイト装置に接続されたネットワーク装置の数が2であり、第2のサイト装置に接続されたネットワーク装置の数が2であり、第3のサイト装置に接続されたネットワーク装置の数が16の場合、第1のサイト装置のサービス重要と、第2のサイト装置のサービスの重要度と、第3のサイト装置のサービス重要度との比は0.1/0.1/0.8であり得る。
311:クラウド装置は第3のモデルをサイト装置に送信する。
クラウド装置が差分データに基づいて第1のモデルを更新して第3のモデルを得た後に、クラウド装置は第3モデルをサイト装置に送信し得る。
任意で、クラウド装置がL個のサイト装置によって送信される複数の差分データを受信した場合、クラウド装置は第3のモデルをL個のサイト装置に送信する。
任意で、クラウド装置がN個のサイト装置に接続され、クラウド装置がL個のサイト装置によって送信される複数の差分データを受信した場合、クラウド装置は第3のモデルをN個のサイト装置に送信する。
任意で、第1の訓練サンプルを用いることによるサイト装置による訓練を介して得られた第2のモデルが第3のモデルと同じである場合、クラウド装置は、第3のモデルをサイト装置に送信しないことがある。
312:サイト装置は、第3のモデルを用いることにより、ネットワーク装置の予測されるべき特徴データに関する分類結果を予測する。
ステップ312はステップ303と同様である。詳細については、ここでは再度説明しない。
2.第1のモデルはネットワーク装置上で設定され得る。
図4A及び図4Bを参照されたい。本願の実施形態におけるモデル更新方法の別の実施形態は以下のステップを含む。
401:クラウド装置は訓練データに基づいて第1のモデルを得る。
402:クラウド装置は第1のモデルをサイト装置に送信する。
ステップ401及びステップ402は、図3のステップ301及びステップ302と同様である。詳細についてはここでは再度説明しない。
403:サイト装置は第1のモデルをネットワーク装置に送信する。
サイト装置が第1のモデルを受信した後で、サイト装置は第1のモデルをネットワーク装置に送信し得る。
任意で、第1のモデルを受信した後に、サイト装置は第1のモデルのパフォーマンス定量インジケータを直接取得し得るため、ステップ403は行われないことがある。第1のモデルのパフォーマンス定量インジケータが目標閾値未満の場合、サイト装置は第1の訓練サンプルを用いることにより第1のモデルを訓練し得る。すなわち、第1のモデルが使用される前に、サイト装置は先ず第1のモデルの性能が条件を満たすかどうか判定する。第1のモデルの性能が条件を満たさない場合、第1のモデルは先ず更新される。
404:ネットワーク装置は、第1のモデルを用いることにより、ネットワーク装置の予測されるべき特徴データについて分類結果を予測する。
上述したように、異なる機械学習モデルは異なる機能を実施し得る。第1のモデルが分類機能を実施する場合、サイト装置によって送信された第1のモデルを受信した後に、ネットワーク装置は、第1のモデルを用いることにより分類結果を予測し得る。
例えば、ネットワーク装置のオンラインデータに対して分類結果予測を行う必要がある場合、分類結果の予測を行う必要があるデータは、その特徴カテゴリーがCPUであるKPI及び/又はその特徴カテゴリーがメモリ(memory)であるKPIを含み得る。
405:サイト装置は第2のデータ要求を送ネットワーク装置に送信する。
サイト装置が第1のモデルのパフォーマンス定量インジケータを得る必要がある場合、サイト装置は第2データ要求をネットワーク装置に送信して、ネットワーク装置に第2の訓練サンプルをサイト装置に送信するよう要求し得る。
406:ネットワーク装置は、第2の訓練サンプルをサイト装置に送信する。
ネットワーク装置がサイト装置によって送信された第2のデータ要求を受信した後に、ネットワーク装置は第2の訓練サンプルをサイト装置に送信し、第2の訓練サンプルは、ネットワーク装置の第2の特徴データ及び第1の推論結果を含み、第1の推論結果は、第1のモデルを用いることにより第2の特徴データに基づいてネットワーク装置によって得られる推論結果である。
任意で、サイト装置も第1のモデルを有しているため、ネットワーク装置はサイト装置に第1の推論結果を送信しないことがある。サイト装置は、受信した第2の特徴データに基づいて第1の推論結果を取得し得る。
任意で、ステップ404が行われない場合、ネットワーク装置は、第2のデータ要求が受信されないときに第2の訓練サンプルをサイト装置に送信し得る。例えば、ネットワーク装置及びサイト装置は、ネットワーク装置が定期的に第2の訓練サンプルをサイト装置に送信することについて事前に合意し得る。
407:サイト装置は、第2の訓練サンプルに基づいて第1のモデルのパフォーマンス定量インジケータを得る。
サイト装置が第2の訓練サンプルを得た後に、サイト装置は、第2の訓練サンプルに基づいて第1のモデルのパフォーマンス定量インジケータを取得し、サイト装置は、第2の特徴データのプリセットラベルを取得し得る。プリセットラベルは、別のモデルを用いることにより第2の特徴データに基づいてサイト装置による推論を介して得られ得る。通常、他のモデルの複雑度は第1のモデルものよりも高く、他のモデルの精度は第1のモデルのものよりも高い。他のモデルは、例えば、精度を除いて、長い推論時間等の欠点を有し、その結果、オンラインリアルタイム推論に適応できない。したがって、第1のモデルはサイト装置上で設定される。サイト装置は第1の推論結果及びプリセットラベルに基づいて第1のモデルの精度を得て、サイト装置は第1のモデルのパフォーマンス定量インジケータとして精度を用いる。
任意で、サイト装置は手動ラベリングを介してプリセットラベルをさらに取得し得る。
任意で、サイト装置がネットワーク装置によって送信される第1の推論結果を受信しない場合、サイト装置は第1の推論結果を取得し得る。第1のモデルはサイト装置上で設定され、サイト装置は第2の特徴データを第1のモデルの入力として用いて第1のモデルによって出力される第1の推論結果を得る。
任意で、サイト装置は、第1のモデルのパフォーマンス定量インジケータとして精度を用いず、第1のモデルのパフォーマンス定量インジケータとして再現率を使用し得る。サイト装置は、第1の推論結果及びプリセットラベルに基づいて、第1のモデルの精度を取得し得る。サイト装置は、第1のモデルのパフォーマンス定量インジケータとして再現率を用いる。
サイト装置は、第1のモデルのパフォーマンス定量インジケータとして精度を用いり得るか又はサイト装置は、第1のモデルのパフォーマンス定量インジケータとして再現率を用いり得ることが理解されよう。実際の適用の間に、サイト装置は、代替的に、第1のモデルのパフォーマンス定量インジケータとして別の特徴を用いり得る。これは、本明細書では具体的に限定されない。
サイト装置は、第1のモデルのパフォーマンス定量インジケータとして精度を用いり得るか又はサイト装置は、第1のモデルのパフォーマンス定量インジケータとして再現率を用いり得ることが理解されよう。実際の適用の間に、サイト装置は、代替的に、第1のモデルのパフォーマンス定量インジケータとして精度及び再現率のうちの1つを選択し得るか又はサイト装置は第1のモデルのパフォーマンス定量インジケータとして精度及び再現率の両方を選択し得る。本明細書では具体的に限定されない。
任意で、サイト装置は第2の特徴データを取得しなくてもよく、サイト装置は他のデータを得て第1のモデルのパフォーマンス定量インジケータを取得する。つまり、サイト装置は、ネットワーク装置上の特徴データを得ることなく、他の装置上のデータを取得し得るか又はサイト装置の記憶空間内のデータを取得し、該データを用いることにより第1のモデルのパフォーマンス定量インジケータを取得し得る。
任意で、サイト装置は、別のモデルを用いることによりプリセットラベルを取得しないことがある。例えば、第2の特徴データは先月のネットワーク装置の特徴データであり、第1の推論結果は今月の第1のモデルで得られた推論結果であり、サイト装置は先月の第2の特徴データに基づいて第1のモデルによって得られたプリセットラベルを取得し得る。
408:サイト装置は第1のデータ要求をネットワーク装置に送信する。
第1のモデルのパフォーマンス定量インジケータが目標閾値未満であるとサイト装置が判定した後に、サイト装置は第1のデータ要求をネットワーク装置に送信して、ネットワーク装置から第1の特徴データを要求し得る。
409:ネットワーク装置は第1の特徴データをサイト装置に送信する。
ネットワーク装置が第1のデータ要求を受信した後に、ネットワーク装置は第1の特徴データをサイト装置に送信し得る。
任意で、ステップ408が行われない場合、ネットワーク装置は、第1のデータ要求が受信されない場合に第1の特徴データをサイト装置に送信し得る。例えば、ネットワーク装置及びサイト装置は、ネットワーク装置が第1の特徴データをサイト装置に定期的に送信することについて予め合意していてもよい。
410:第1のモデルのパフォーマンス定量インジケータが目標閾値未満の場合、第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを取得し、第2のモデルと第1のモデルとの差分データを取得する。
ステップ410は図3のステップ307と同様である。詳細についてはここでは再度説明しない。
411:サイト装置は、第2のモデルをネットワーク装置に送信する。
サイト装置が第2のモデルを取得した後に、サイト装置は第2のモデルをネットワーク装置に送信し得る。
412:ネットワーク装置は、第2のモデルを用いることにより、ネットワーク装置の予測されるべき特徴データについての分類結果を予測する。
ステップ412はステップ404と同様である。詳細についてはここでは再度説明しない。
413:サイト装置は差分データをクラウド装置に送信する。
414:クラウド装置は、差分データに基づいて第1のモデルを更新して第3モデルを得る。
415:クラウド装置は第3のモデルをサイト装置に送信する。
ステップ413、ステップ414及びステップ415は、図3のステップ309、ステップ310及びステップ311と同様である。詳細についてはここでは再度説明しない。
416:サイト装置は第3のモデルをネットワーク装置に送信する。
サイト装置が第3のモデルを取得した後に、サイト装置は第3のモデルをネットワーク装置に送信し得る。
任意で、サイト装置が複数のネットワーク装置に接続されている場合、サイト装置は第3のモデルを複数のネットワーク装置に送信する。
417:ネットワーク装置は、第のモデルを用いることにより、ネットワーク装置の予測されるべき特徴データについての分類結果を予測する。
ステップ417はステップ404と同様である。詳細についてはここでは再度説明しない。
ステップ411、ステップ412及びステップ413~ステップ416の間には、制限された時系列関係がないことが理解されよう。
上記では本願の実施形態におけるモデル更新方法について説明し、以下では本願の実施形態におけるモデル更新システムについて説明する。
図5を参照されたい。本願の実施形態におけるモデル更新システムの実施形態は、
サイト解析装置502及び第1の解析装置501を含み、
サイト解析装置502は、第1の解析装置501によって送信される第1のモデルを受信することと、第1の訓練サンプルを用いて該第1のモデルを訓練して第2のモデルを得ることであって、該第1の訓練サンプルは、サイト解析装置502に対応するサイトネットワーク内のネットワーク装置の第1の特徴データを含む、ことと、第1のモデルと第2のモデルとの差分データを得ることと、該差分データを第1の解析装置501に送信することと、を行うように構成され、
第1の解析装置501は、第1のモデルをサイト解析装置502に送信することと、サイト解析装置502によって送信される差分データを受信することと、差分データに基づいて第1のモデルを更新して第3のモデルを得ることと、を行うように構成されている。
この実施形態では、サイト解析装置502は、第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを取得し得る。サイト解析装置502は、第1のモデルと第2のモデルとの差分データを取得し、差分データを第1の解析装置501に送信して、第1の解析装置501に差分データに基づいて第1のモデルを更新するよう要求し、差分データは、第1のモデル及び第2のモデルに基づいてサイト解析装置502によって取得され、第2のモデルは、第1の訓練サンプルを用いることにより、第1のモデルを訓練することによってサイト解析装置502によって得られる。第1の訓練サンプルはネットワーク装置の第1の特徴データを含み、差分データのプライバシーは第1の特徴データのものよりも高い。したがって、第1の解析装置501がモデルの性能を維持するために第1のモデルを更新することに基づいてプライバシーが改善される。
図6を参照されたい。本願の実施形態におけるモデル更新システムの別の実施形態は、
サイト解析装置602及び第1の解析装置601を含み、
サイト解析装置602は、第1の解析装置601によって送信される第1のモデルを受信することと、第1の訓練サンプルを用いて該第1のモデルを訓練して第2のモデルを得ることであって、該第1の訓練サンプルは、サイト解析装置602に対応するサイトネットワーク内のネットワーク装置の第1の特徴データを含む、ことと、第1のモデルと第2のモデルとの差分データを得ることと、該差分データを第1の解析装置601に送信することと、を行うように構成され、
第1の解析装置601は、第1のモデルをサイト解析装置602に送信することと、サイト解析装置602によって送信される差分データを受信することと、差分データに基づいて第1のモデルを更新して第3のモデルを得ることと、を行うように構成されている。
意で、サイト解析装置602は、第1のモデルが劣化しているかどうかを判定することと、サイト解析装置602が第1のモデルは劣化していると判定した場合に、第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを得ることと、を行うようにさらに構成されている。
任意で、前記システムは、N個のサイト解析装置602を含み、Nは1より大きい整数である。
第1の解析装置601は、第1のモデルをN個のサイト解析装置602に送信することと、L個のサイト解析装置602によって送信される複数の差分データを受信することであって、Lは1より大きく且つN以下の整数であることと、複数の差分データに基づいて第1のモデルを更新して第3のモデルを得ることと、を行うように具体的に構成されている。
任意で、第1の解析装置601は、差分データを第1の解析装置601に送信するL個のサイト解析装置に関する統計を収集することと、Nに対するLの比が閾値Kに達した場合に、差分データに基づいて第1のモデルを更新して第3のモデルを得ることであって、Kは0より大きく、1以下である、こととを行うようにさらに構成されている。
任意で、前記システムは、
ネットワーク装置603をさらに含み、
ネットワーク装置603は、サイト解析装置602によって送信される更新されたモデルを受信することであって、該更新されたモデルは第2のモデル又は第3のモデルを含む、ことと、更新されたモデルを用いることによりネットワーク装置603の予測されるべき特徴データに基づいて推論結果を出力することと、を行うように構成され、
サイト解析装置602は、更新されたモデルをネットワーク装置603に送信するようにさらに構成されているか、又は
ネットワーク装置603は、予測されるべき特徴データをサイト解析装置602に送信するように構成され、
サイト解析装置602は、更新されたモデルを用いることにより、ネットワーク装置603の予測されるべき特徴データに基づいて推論結果を出力するようにさらに構成されている。
任意で、ネットワーク装置603は、更新されたモデルを用いることにより、ネットワーク装置603の予測されるべき特徴データに基づいて分類結果を予測するように具体的に構成されているか、又は
サイト解析装置602は、更新されたモデルを用いることにより、ネットワーク装置603の予測されるべき特徴データに基づいて分類結果を予測するように具体的に構成されている。
任意で、予測されるべき特徴データはKPI特徴データを含み、該KPI特徴データは、KPI時系列の特徴データ又はKPIデータである。
任意で、差分データは勾配情報である。
この実施形態では、モデル更新システムにおける第1の解析装置601は、図3、図4A、及び図4Bに示す実施形態における説明したクラウド装置と同様であり、サイト解析装置602は、図3、図4A及び図4Bに示す実施形態で説明したサイト装置と同様であり、ネットワーク装置603は、図3、図4A及び図4Bに示す実施形態で説明したネットワーク装置と同様である。詳細については本明細書で説明しない。
上記では本願の実施形態におけるモデル更新システムについて説明し、以下では本願の実施形態におけるモデル更新装置について説明する。
図7を参照されたい。本願の実施形態におけるモデル更新装置の実施形態は、
第1の解析装置によって送信される第1のモデルを受信するように構成された受信ユニット701と、
第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを得るように構成された訓練ユニット702であって、該第1の訓練サンプルは、サイト解析装置に対応するサイトネットワーク内のネットワーク装置の第1の特徴データを含む、訓練ユニット702と、
第1のモデルと第2のモデルとの差分データを得るように構成された取得ユニット703と、
差分データを第1の解析装置に送信して、第1の解析装置に、差分データに基づいて第1のモデルを更新して第3のモデルを得るように要求するように構成された送信ユニット704と、を含む。
この実施形態では、受信ユニット701は第1の解析装置によって送信される第1のモデルを受信し得る。訓練ユニット702は第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを取得し得る。取得ユニット703は第1のモデルと第2のモデルとの差分データを取得し得る。送信ユニット704は差分データを第1の解析装置に送信して、第1の解析装置に、差分データに基づいて第1のモデルを更新して第3のモデルを得るように要求し得る。差分データは第1のモデル及び第2のモデルに基づいて取得ユニット703によって取得され、第2のモデルは第1の訓練サンプルを用いることにより第1のモデルを訓練することで訓練ユニット702によって得られる。第1の訓練サンプルはネットワーク装置の第1の特徴データを含み、差分データのプライバシーは第1の特徴データのものよりも高い。したがって、第1の解析装置がモデル性能を維持するために第1のモデルを更新することに基づいてプライバシーが改善される。
図8を参照されたい。本願の実施形態におけるモデル更新装置の別の実施形態は、
第1の解析装置によって送信される第1のモデルを受信するように構成された受信ユニット801と、
第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを得るように構成された訓練ユニット802であって、該第1の訓練サンプルは、サイト解析装置に対応するサイトネットワーク内のネットワーク装置の第1の特徴データを含む、訓練ユニット802と、
第1のモデルと第2のモデルとの差分データを得るように構成された取得ユニット803と、
差分データを第1の解析装置に送信して、第1の解析装置に、差分データに基づいて第1のモデルを更新して第3のモデルを得るように要求するように構成された送信ユニット804と、を含む。
任意で、モデル更新装置は、
第1のモデルが劣化しているかどうか判定するように構成された判定ユニット805であって、該判定ユニット805が第1のモデルは劣化していると判定した場合に、訓練ユニット802は、第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを得る、判定ユニット805、をさらに含む。
任意で、取得ユニット803は、第1のモデルのパフォーマンス定量インジケータを得るようにさらに構成され、
判定ユニット805は、第1のモデルのパフォーマンス定量インジケータが目標閾値未満かどうか判定するようさらに構成され、
第1のモデルのパフォーマンス定量インジケータが目標閾値未満の場合、判定ユニット805は、第1のモデルが劣化していると判定するように具体的に構成されている。
任意で、取得ユニット803は、ネットワーク装置の第2の特徴データを得るようにさらに構成され、
取得ユニット803は、第2の特徴データに基づいて第1のモデルによって得られた第1の推論結果を得るようにさらに構成され、
取得ユニット803は、第1の推論結果及び第2の特徴データのプリセットラベルに基づいて、第1のモデルの精度を得て、該精度を第1のモデルのパフォーマンス定量インジケータとして用いるように具体的に構成されているか又は取得ユニット803は、第1の推論結果及び第2の特徴データのプリセットラベルに基づいて、第1のモデルの再現率を得て、該再現率を第1のモデルのパフォーマンス定量インジケータとして用いるように具体的に構成されている。
任意で、送信ユニット804は、第1のデータ要求をネットワーク装置に送信して、ネットワーク装置に第2の訓練サンプルをサイト解析装置に送信するように要求するようにさらに構成され、第2の訓練サンプルは第2の特徴データ及び第1の推論結果を含み、第1の推論結果は、第2の特徴データに基づいて第1のモデルによって得られる。
任意で、送信ユニット804は、更新されたモデルをネットワーク装置に送信するようにさらに構成され、該更新されたモデルは第2のモデル又は第3のモデルを含み、ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力するように構成されている。
任意で、送信ユニット804は、更新されたモデルをネットワーク装置に送信するようにさらに構成され、該更新されたモデルは第2のモデル又は第3のモデルを含み、ネットワーク装置の予測されるべき特徴データに基づいて分類結果を予測するように構成され、予測されるべき特徴結果はKPI特徴データを含む。
任意で、受信ユニット801は、ネットワーク装置の予測されるべき特徴データを受信するようにさらに構成されている。
前記装置は、
更新されたモデルを用いることにより、ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力するように構成された推論ユニット806であって、該更新されたモデルは第2のモデル又は第3のモデルを含む、推論ユニット806をさらに含む。
任意で、予測されるべき特徴データはキーパフォーマンスインジケータKPI特徴データを含み、
推論ユニット806は、更新されたモデルを用いることにより、ネットワーク装置の予測されるべき特徴データに基づいて分類結果を予測するように具体的に構成されている。
任意で、KPI特徴データはKPI時系列の特徴データ又はKPIデータである。
任意で、前記装置は、
テストデータを用いることにより第2のモデルをテストするように構成されたテストユニット802であって、該テストデータはグラウンドトゥルースラベルを含む、テストユニット802と
劣化したデータを記憶して、サイト解析装置が該劣化したデータを用いることにより、サイト解析装置内のモデルを更新できるようにするように構成された記憶ユニット808であって、該劣化したデータはテストデータに属し、劣化したデータの推論ラベルはグラウンドトゥルースラベルと等しくなく、該推論ラベルはテストデータを用いることにより、第2のモデルをテストすることによりサイト解析装置によって得られる、記憶ユニット802と、
をさらに含む。
この実施形態では、モデル更新装置におけるユニットによって行われる動作は、図3、図4A及び図4Bに示す実施形態で説明したものと同様である。詳細についてはここでは再度説明しない。
図9を参照されたい。本願の実施形態におけるモデル更新装置の別の実施形態は、
第1のモデルをサイト解析装置に送信するように構成された送信ユニット901であって、該第1のモデルは、ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力するように構成されている、送信ユニット901と、
第1のモデルと第2のモデルとの差分データを受信するように構成された受信ユニット902であって、該第2のモデルは、第1の訓練サンプルを用いることにより第1のモデルを訓練することによりサイト解析装置によって得られ、該第1の訓練サンプルは、サイト解析装置に対応するサイトネットワーク内のネットワーク装置の第1の特徴データを含む、受信ユニット902と、
差分データに基づいて第1のモデルを更新して第3のモデルを得るように構成された更新ユニット903と、を含む。
この実施形態では、送信ユニット901は第1のモデルをサイト解析装置に送信し、受信ユニット902は、第1のモデルと第2のモデルとの差分データを受信し、更新ユニット903は、差分データを用いることにより第1のモデルを更新して第3のモデルを取得し得る。差分データは、第1のモデル及び第2のモデルに基づいてサイト解析装置によって得られ、第2のモデルは、第1の訓練サンプルを用いることにより、第1のモデルを訓練することによりサイト解析装置によって得られる。第1の訓練サンプルはネットワーク装置の第1の特徴データを含み、差分データのプライバシーは第1の特徴データのものよりも高い。したがって、更新ユニット903がモデル性能を維持するために第1のモデルを更新することに基づいてプライバシーが改善される。
図10を参照されたい。本願の実施形態におけるモデル更新装置の別の実施形態は、
第1のモデルをサイト解析装置に送信するように構成された送信ユニット1001であって、該第1のモデルは、ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力するように構成されている、送信ユニット1001と、
第1のモデルと第2のモデルとの差分データを受信するように構成された受信ユニット1002であって、該第2のモデルは、第1の訓練サンプルを用いることにより第1のモデルを訓練することによりサイト解析装置によって得られ、該第1の訓練サンプルは、サイト解析装置に対応するサイトネットワーク内のネットワーク装置の第1の特徴データを含む、受信ユニット1002と、
差分データに基づいて第1のモデルを更新して第3のモデルを得るように構成された更新ユニット1003と、を含む。
任意で、送信ユニット1001は、第1のモデルをN個のサイト解析装置に送信するように具体的に構成され、Nは1より大きい整数であり、
受信ユニット1002は、L個のサイト解析装置によって送信される複数の差分データを受信するように具体的に構成され、Lは1よりも大きく且つN以下の整数であり、
更新ユニット1003は、複数の差分データに基づいて第1のモデルを更新して第3のモデルを得るように具体的に構成され、
送信ユニット1001は、第3のモデルをN個のサイト解析装置に送信するように具体的に構成されている。
任意で、前記装置は、
複数の差分データの平均値を得るように構成された取得ユニット1004
をさらに含み、
更新ユニット1003は、複数の差分データの平均値を用いることにより第1のモデルを更新して第3のモデルを得るように具体的に構成されているか、又は
取得ユニット1004は、複数の差分データの加重平均値を得るように構成され、
更新ユニット1003は、加重平均値を用いることにより第1のモデルを更新して第3のモデルを得るように具体的に構成されている。
任意で、前記装置は、
差分データを第1の解析装置に送信するL個のサイト解析装置に関する統計を収集するように構成された統計収集ユニット、
をさらに含み、
Nに対するLの比が閾値Kに達した場合、更新ユニット1003は、差分データに基づいて第1のモデルを更新して第3のモデルを得るように具体的に構成され、Kは0より大きく1以下である。
この実施形態では、モデル更新装置におけるユニットによって行われる動作は、図3、図4A及び図4Bに示す実施形態で説明したものと同様である。詳細についてはここでは再度説明しない。
上記では本願の実施形態におけるモデル更新装置を説明し、以下では、本願の実施形態におけるモデル更新装置について説明する。
図11を参照されたい。本願の実施形態におけるモデル更新装置1100の実施形態が提供される
図11に示すように、モデル更新装置1100は、プロセッサ1110、プロセッサ1110に連結されたメモリ1120及びトランシーバ1130を含む。モデル更新装置1100は、図2及び図3のサイト装置であり得る。プロセッサ1110は、中央処理装置(英語:central processing unit、略称CPU)、ネットワークプロセッサ(英語:network processor、略称NP)又はCPUとNPとの組み合わせであり得る。あるいは、プロセッサは特定用途向け集積回路(英語:application-specific integrated circuit、略称ASIC)、プログラマブル論理デバイス(英語:programmable logic device、略称PLD)又はその組み合わせであり得る。PLDは複雑なプログラマブル論理デバイス(英語:complex programmable logic device、略称CPLD)、フィールドプログラマブルゲートアレイ(英語:field programmable gate array、略称FPGA)、汎用アレイロジック(英語:generic array logic、略称GAL)又はその任意の組み合わせであり得る。プロセッサ1110は1つのプロセッサであり得るか又は複数のプロセッサを含み得る。メモリ1120は、ランダムアクセスメモリ(英語:random access memory、略称RAM)等の揮発性メモリ(英語:volatile memory)を含み得るか又はメモリは、リードオンリーメモリ(英語:read only memory、略称ROM)、フラッシュメモリ(英語:flash memory)、ハードディスクドライブ(英語:hard disc drive、略称HDD)又は固体ドライブ(英語:solid state drive、略称SSD)等の不揮発性メモリを含み得る。あるいは、メモリは、前述の種類のメモリの組み合わせを含み得る。メモリ1120はコンピュータ読み取り可能命令を記憶する。コンピュータ読み取り可能命令は複数のソフトウェアモジュール、例えば、受信モジュール1122、訓練モジュール1124、取得モジュール1126及び送信モジュール1128を含む。各ソフトウェアモジュールを実行した後に、プロセッサ1110は、各ソフトウェアモジュールの表示に基づいて対応する動作を行い得る。この実施形態では、ソフトウェアモジュールによって行われる動作は、実際には、ソフトウェアモジュールの表示に基づいてプロセッサ1110によって行われる動作である。受信モジュール1122は、第1の解析装置によって送信される第1のモデルを受信するように構成されている。訓練モジュール1124は、第1の訓練サンプルを用いることにより第1のモデルを訓練して第2のモデルを得るように構成され、第1の訓練サンプルは、サイト解析装置に対応するサイトネットワーク内のネットワーク装置の第1の特徴データを含む。取得モジュール1126は、第1のモデルと第2のモデルとの差分データを取得するように構成されている。送信モジュール1128は差分データを第1の解析装置に送信して、第1の解析装置に差分データに基づいて第1のモデルを更新して第3のモデルを得るように要求するように構成されている。加えて、メモリ1120内のコンピュータ読み取り可能命令を実行した後に、プロセッサ1110は、コンピュータ読み取り可能命令の表示に従って、サイト装置によって行われ得る全ての動作、例えば、図3、図4A及び図4Bに対応する実施形態でサイト装置によって行われる動作を行い得る。
図12を参照されたい。本願の実施形態におけるモデル更新装置1200の実施形態が提供される
図12に示すように、モデル更新装置1200は、プロセッサ1210、プロセッサ1210に連結されたメモリ1220及びトランシーバ1230を含む。モデル更新装置1200は、図2及び図3のクラウド装置であり得る。プロセッサ1210は、中央処理装置(英語:central processing unit、略称CPU)、ネットワークプロセッサ(英語:network processor、略称NP)又はCPUとNPとの組み合わせであり得る。あるいは、プロセッサは特定用途向け集積回路(英語:application-specific integrated circuit、略称ASIC)、プログラマブル論理デバイス(英語:programmable logic device、略称PLD)又はその組み合わせであり得る。PLDは複雑なプログラマブル論理デバイス(英語:complex programmable logic device、略称CPLD)、フィールドプログラマブルゲートアレイ(英語:field programmable gate array、略称FPGA)、汎用アレイロジック(英語:generic array logic、略称GAL)又はその任意の組み合わせであり得る。プロセッサ1210は1つのプロセッサであり得るか又は複数のプロセッサを含み得る。メモリ1220は、ランダムアクセスメモリ(英語:random access memory、略称RAM)等の揮発性メモリ(英語:volatile memory)を含み得るか又はメモリは、リードオンリーメモリ(英語:read-only memory、略称ROM)、フラッシュメモリ(英語:flash memory)、ハードディスクドライブ(英語:hard disc drive、略称HDD)又は固体ドライブ(英語:solid state drive、略称SSD)等の不揮発性メモリを含み得る。あるいは、メモリは、前述の種類のメモリの組み合わせを含み得る。メモリ1220はコンピュータ読み取り可能命令を記憶する。コンピュータ読み取り可能命令は複数のソフトウェアモジュール、例えば、送信モジュール1222、受信モジュール1224及び更新モジュール1226を含む。各ソフトウェアモジュールを実行した後に、プロセッサ1210は、各ソフトウェアモジュールの表示に基づいて対応する動作を行い得る。この実施形態では、ソフトウェアモジュールによって行われる動作は、実際には、ソフトウェアモジュールの表示に基づいてプロセッサ1210によって行われる動作である。送信モジュール1222は第1のモデルをサイト解析装置に送信するように構成され、第1のモデルはネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力するように構成されている。受信モジュール1224は第1のモデルと第2のモデルとの差分データを受信するように構成され、第2のモデルは第1の訓練サンプルを用いることにより第1のモデルを訓練することによりサイト解析装置により得られ、第1の訓練サンプルは、サイト解析装置に対応するサイトネットワーク内のネットワーク装置の第1の特徴データを含む。更新モジュール1226は差分データに基づいて第1のモデルを更新して第3のモデルを得るように構成されている。
加えて、メモリ1220内のコンピュータ読み取り可能命令を実行した後に、プロセッサ1210は、コンピュータ読み取り可能命令の表示に従って、クラウド装置によって行われ得る全ての動作、例えば、図3、図4A及び図4Bに対応する実施形態においてクラウド装置によって行われ得る動作を行い得る。
なお、本願で提供されるいくつかの実施形態において、開示したシステム、装置、及び方法は、他の形で実施され得る。例えば、説明した装置の実施形態は一例にすぎない。例えば、ユニットへの分割は機能的な分割にすぎず、実際の実施の間に他の分割であってもよい。例えば、複数のユニット又はコンポーネントは組み合わされ得るか又は別のシステムに統合され得るか又は一部の特徴は無視され得るか又は実行されなくてもよい。加えて、表示又は説明した相互連結若しくは直接連結又は通信接続は、いくつかのインターフェイスを介して実施され得る。装置又はユニット間の間接連結又は通信接続は、電子的、機械的又は他の形態で実施され得る。
別個の部品として記載されるユニットは物理的に離れていても、離れていなくてもよく、ユニットとして表示される部品は物理的ユニットであっても、なくてもよく、1つの位置に位置していてもいいし、複数のネットワークユニット上に分散されていてもよい。ユニットの一部又は全ては、実施形態の解決策の目的を達成するために、実際の要件に基づいて選択され得る。
加えて、本願の実施形態における機能ユニットは、1つの処理ユニットに統合され得るか又は各ユニットは物理的に単独で存在し得るか又は2つ以上のユニットが1つのユニットに統合されてもよい。統合ユニットは、ハードウェアの形態で実施され得るか又はソフトウェア機能ユニットの形態で実施され得る。
統合ユニットがソフトウェア機能ユニットの形態で実施され、独立した製品として販売又は使用される場合、統合ユニットは、コンピュータ読み取り可能記憶媒体に記憶され得る。そのような理解に基づいて、本願の技術的解決策は、本質的に、従来技術に寄与する部分又は技術的解決策の全部若しくは一部を、ソフトウェア製品の形態で実施し得る。コンピュータソフトウェア製品は記憶媒体に記憶され、コンピュータ装置(パーソナルコンピュータ、サーバ、ネットワーク装置等であり得る)に、本願の実施形態で説明した方法の全て又は一部のステップを行うように指示するためのいくつかの命令を含む。前述の記憶媒体は、USBフラッシュドライブ、リムーバブルハードディスク、リードオンリーメモリ(ROM、read-only memory)、ランダムアクセスメモリ(RAM、random access memory)、磁気ディスク又は光ディスク等のプログラムコードを記憶可能な任意の媒体を含む。

Claims (37)

  1. サイト解析装置及び第1の解析装置を含むモデル更新システムであって、
    前記サイト解析装置は、前記第1の解析装置によって送信される第1のモデルを受信することと、第1の訓練サンプルを用いて該第1のモデルを訓練して第2のモデルを得ることであって、該第1の訓練サンプルは、前記サイト解析装置に対応するサイトネットワーク内のネットワーク装置の第1の特徴データを含む、ことと、前記第1のモデルと前記第2のモデルとの差分データを得ることと、該差分データを前記第1の解析装置に送信することと、を行うように構成され、
    前記第1の解析装置は、前記第1のモデルを前記サイト解析装置に送信することと、前記サイト解析装置によって送信される前記差分データを受信することと、前記差分データに基づいて前記第1のモデルを更新して第3のモデルを得ることと、を行うように構成されている、モデル更新システム。
  2. 前記サイト解析装置は、前記第1のモデルが劣化しているかどうかを判定することと、前記サイト解析装置が前記第1のモデルは劣化していると判定した場合に、前記第1の訓練サンプルを用いることにより前記第1のモデルを訓練して前記第2のモデルを得ることと、を行うようにさらに構成されている、請求項1に記載のシステム。
  3. 前記システムは、N個のサイト解析装置を含み、Nは1より大きい整数であり、
    前記第1の解析装置は、前記第1のモデルを前記N個のサイト解析装置に送信することと、L個のサイト解析装置によって送信される複数の差分データを受信することであって、Lは1より大きく且つN以下の整数であることと、前記複数の差分データに基づいて前記第1のモデルを更新して前記第3のモデルを得ることと、を行うように具体的に構成されている、請求項2に記載のシステム。
  4. 前記第1の解析装置は、前記差分データを前記第1の解析装置に送信するL個のサイト解析装置に関する統計を収集することと、Nに対するLの比が閾値Kに達した場合に、前記差分データに基づいて前記第1のモデルを更新して前記第3のモデルを得ることであって、Kは0より大きく、1以下である、こととを行うようにさらに構成されている、請求項3に記載のシステム。
  5. 前記システムは前記ネットワーク装置をさらに含み、
    前記ネットワーク装置は、前記サイト解析装置によって送信される更新されたモデルを受信することであって、該更新されたモデルは前記第2のモデル又は前記第3のモデルを含む、ことと、前記更新されたモデルを用いることにより前記ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力することと、を行うように構成され、
    前記サイト解析装置は、前記更新されたモデルを前記ネットワーク装置に送信するようにさらに構成されているか、又は
    前記ネットワーク装置は、前記ネットワーク装置の予測されるべき特徴データを前記サイト解析装置に送信するように構成され、
    前記サイト解析装置は、更新されたモデルを用いることにより、前記ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力するようにさらに構成されている、請求項1乃至4のいずれか一項に記載のシステム。
  6. 前記ネットワーク装置は、前記更新されたモデルを用いることにより、前記ネットワーク装置の予測されるべき特徴データに基づいて分類結果を予測するように具体的に構成されているか、又は
    前記サイト解析装置は、前記更新されたモデルを用いることにより、前記ネットワーク装置の予測されるべき特徴データに基づいて分類結果を予測するように具体的に構成されている、請求項5に記載のシステム。
  7. 前記予測されるべき特徴データは、キーパフォーマンスインジケータ(KPI)特徴データを含み、該KPI特徴データは、KPI時系列の特徴データ又はKPIデータである、請求項6に記載のシステム。
  8. 前記差分データは勾配情報である、請求項1乃至4のいずれか一項に記載のシステム。
  9. モデル更新方法であって、
    サイト解析装置により、第1の解析装置によって送信される第1のモデルを受信することと、
    前記サイト解析装置により、第1の訓練サンプルを用いることにより前記第1のモデルを訓練して第2のモデルを得ることであって、該第1の訓練サンプルは、前記サイト解析装置に対応するサイトネットワーク内のネットワーク装置の第1の特徴データを含む、ことと、
    前記サイト解析装置により、前記第1のモデルと前記第2のモデルとの差分データを得ることと、
    前記サイト解析装置により、前記差分データを前記第1の解析装置に送信して、前記第1の解析装置に、前記差分データに基づいて前記第1のモデルを更新して第3のモデルを得るように要求することと、
    を含む、方法。
  10. 前記方法は、
    前記サイト解析装置により、前記第1のモデルが劣化しているかどうか判定することと、前記サイト解析装置が前記第1のモデルは劣化していると判定した場合に、前記サイト解析装置により、前記第1の訓練サンプルを用いることにより前記第1のモデルを訓練して第2のモデルを得ることを行うことと、をさらに含む、請求項9に記載の方法。
  11. 前記方法は、
    前記サイト解析装置により、前記第1のモデルのパフォーマンス定量インジケータを得ることと、
    前記サイト解析装置により、前記第1のモデルのパフォーマンス定量インジケータが目標閾値未満かどうか判定することと、
    前記第1のモデルのパフォーマンス定量インジケータが前記目標閾値未満の場合、前記サイト解析装置により、前記第1のモデルは劣化していると判定することと、
    をさらに含む、請求項10に記載の方法。
  12. 前記方法は
    前記サイト解析装置により、前記ネットワーク装置の第2の特徴データを得ることと、
    前記サイト解析装置により、前記第2の特徴データに基づいて前記第1のモデルによって得られた第1の推論結果を得ることと、
    をさらに含み、
    前記サイト解析装置により、前記第1のモデルのパフォーマンス定量インジケータを得ることは、
    前記サイト解析装置により、前記第1の推論結果及び前記第2の特徴データのプリセットラベルに基づいて、前記第1のモデルの精度を得て、該精度を前記第1のモデルのパフォーマンス定量インジケータとして用いること又は前記サイト解析装置により、前記第1の推論結果及び前記第2の特徴データのプリセットラベルに基づいて、前記第1のモデルの再現率を得て、該再現率を前記第1のモデルのパフォーマンス定量インジケータとして用いること、
    を含む、請求項11に記載の方法。
  13. 前記方法は、
    前記サイト解析装置により、第1のデータ要求を前記ネットワーク装置に送信して、前記ネットワーク装置に第2の訓練サンプルを前記サイト解析装置に送信するよう要求することであって、該第2の訓練サンプルは、前記第2の特徴データ及び前記第1の推論結果を含み、前記第1の推論結果は、前記第2の特徴データに基づいて前記第1のモデルによって得られること、
    をさらに含む、請求項12に記載の方法。
  14. 前記方法は、
    前記サイト解析装置により、更新されたモデルを前記ネットワーク装置に送信することであって、該更新されたモデルは前記第2のモデル又は前記第3のモデルを含み、前記ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力するために用いられる、こと、
    をさらに含む、請求項9乃至13のいずれか一項に記載の方法。
  15. 前記方法は、
    前記サイト解析装置により、更新されたモデルを前記ネットワーク装置に送信することであって、該更新されたモデルは前記第2のモデル又は前記第3のモデルを含み、前記ネットワーク装置の予測されるべき特徴データに基づいて分類結果を予測するために用いられ、前記予測されるべき特徴データはキーパフォーマンスインジケータ(KPI)特徴データを含む、こと、
    をさらに含む、請求項9乃至13のいずれか一項に記載の方法。
  16. 前記方法は、
    前記サイト解析装置により、前記ネットワーク装置の予測されるべき特徴データを受信することと、
    前記サイト解析装置により、更新されたモデルを用いることにより、前記ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力することであって、該更新されたモデルは前記第2のモデル又は前記第3のモデルを含む、こと、
    をさらに含む、請求項9乃至13のいずれか一項に記載の方法。
  17. 前記予測されるべき特徴データはKPI特徴データを含み、
    前記サイト解析装置により、更新されたモデルを用いることにより前記ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力することは、
    前記サイト解析装置により、前記更新されたモデルを用いることにより、前記ネットワーク装置の予測されるべき特徴データに基づいて分類結果を予測すること、
    を含む、請求項16に記載の方法。
  18. 前記KPI特徴データは、KPI時系列の特徴データ又はKPIデータである、請求項15に記載の方法。
  19. 前記方法は、
    前記サイト解析装置により、テストデータを用いることにより前記第2のモデルをテストすることであって、該テストデータはグラウンドトゥルースラベルを含む、ことと、
    前記サイト解析装置により、劣化したデータを記憶して、前記サイト解析装置が該劣化したデータを用いることにより、前記サイト解析装置内のモデルを更新できるようにすることであって、該劣化したデータは前記テストデータに属し、前記劣化したデータの推論ラベルは前記グラウンドトゥルースラベルと等しくなく、該推論ラベルは前記テストデータを用いることにより、前記第2のモデルをテストすることにより前記サイト解析装置によって得られる、ことと、
    をさらに含む、請求項9乃至13のいずれか一項に記載の方法。
  20. モデル更新方法であって、
    第1の解析装置により、第1のモデルをサイト解析装置に送信することであって、該第1のモデルは、ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力するように構成されている、ことと、
    前記第1の解析装置により、前記第1のモデルと第2のモデルとの差分データを受信することであって、該第2のモデルは、第1の訓練サンプルを用いることにより前記第1のモデルを訓練することにより前記サイト解析装置によって得られ、該第1の訓練サンプルは、前記サイト解析装置に対応するサイトネットワーク内の前記ネットワーク装置の第1の特徴データを含む、ことと、
    前記第1の解析装置により、前記差分データに基づいて前記第1のモデルを更新して第3のモデルを得ることと、
    を含む、方法。
  21. 第1の解析装置により、第1のモデルをサイト解析装置に送信することは、
    前記第1の解析装置により、前記第1のモデルをN個のサイト解析装置に送信することであって、Nは1より大きい整数である、ことと、
    を含み、
    前記第1の解析装置により、前記第1のモデルと第2のモデルとの差分データを受信することは、
    前記第1の解析装置により、L個のサイト解析装置によって送信される複数の差分データを受信することであって、Lは1よりも大きく且つN以下の整数である、こと、
    を含み、
    前記第1の解析装置により、前記差分データに基づいて前記第1のモデルを更新して第3のモデルを得ることは、
    前記第1の解析装置により、前記複数の差分データに基づいて前記第1のモデルを更新して前記第3のモデルを得ること、
    を含み、
    前記方法は、
    前記第1の解析装置により、前記第3のモデルを前記N個のサイト解析装置に送信すること、
    をさらに含む、請求項20に記載の方法。
  22. 前記方法は、
    前記第1の解析装置により、前記複数の差分データの平均値を得ること、
    をさらに含み、
    前記第1の解析装置により、前記複数の差分データに基づいて前記第1のモデルを更新して前記第3のモデルを得ることは、
    前記第1の解析装置により、前記複数の差分データの平均値を用いることにより前記第1のモデルを更新して前記第3のモデルを得ること、
    を含む、請求項21に記載の方法。
  23. 前記方法は、
    前記第1の解析装置により、前記複数の差分データの加重平均値を得ること、
    をさらに含み、
    前記第1の解析装置により、前記複数の差分データに基づいて前記第1のモデルを更新して前記第3のモデルを得ることは、
    前記第1の解析装置により、前記加重平均値を用いることにより前記第1のモデルを更新して前記第3のモデルを得ること、
    を含む、請求項21に記載の方法。
  24. 前記方法は、
    前記第1の解析装置により、前記差分データを前記第1の解析装置に送信するL個のサイト解析装置に関する統計を収集することと、
    Nに対するLの比が閾値Kに達した場合、前記第1の解析装置により、前記差分データに基づいて前記第1のモデルを更新して第3のモデルを得ることを行うことであって、Kは0より大きく1以下である、ことと、
    をさらに含む、請求項20乃至23のいずれか一項に記載の方法。
  25. モデル更新装置であって、
    第1の解析装置によって送信される第1のモデルを受信するように構成された受信ユニットと、
    第1の訓練サンプルを用いることにより前記第1のモデルを訓練して第2のモデルを得るように構成された訓練ユニットであって、該第1の訓練サンプルは、サイト解析装置に対応するサイトネットワーク内のネットワーク装置の第1の特徴データを含む、訓練ユニットと、
    前記第1のモデルと前記第2のモデルとの差分データを得るように構成された取得ユニットと、
    前記差分データを前記第1の解析装置に送信して、前記第1の解析装置に、前記差分データに基づいて前記第1のモデルを更新して第3のモデルを得るように要求するように構成された送信ユニットと、
    を含む、モデル更新装置。
  26. 前記モデル更新装置は、
    前記第1のモデルが劣化しているかどうか判定するように構成された判定ユニットであって、該判定ユニットが前記第1のモデルは劣化していると判定した場合に、前記訓練ユニットは、前記第1の訓練サンプルを用いることにより前記第1のモデルを訓練して前記第2のモデルを得る、判定ユニット、をさらに含む、請求項25に記載のモデル更新装置。
  27. 前記取得ユニットは、前記第1のモデルのパフォーマンス定量インジケータを得るようにさらに構成され、
    前記判定ユニットは、前記第1のモデルのパフォーマンス定量インジケータが目標閾値未満かどうか判定するようさらに構成され、
    前記第1のモデルのパフォーマンス定量インジケータが前記目標閾値未満の場合、前記判定ユニットは、前記第1のモデルが劣化していると判定するように具体的に構成されている、請求項26に記載のモデル更新装置。
  28. 前記取得ユニットは、前記ネットワーク装置の第2の特徴データを得るようにさらに構成され、
    前記取得ユニットは、前記第2の特徴データに基づいて前記第1のモデルによって得られた第1の推論結果を得るようにさらに構成され、
    前記取得ユニットは、前記第1の推論結果及び前記第2の特徴データのプリセットラベルに基づいて、前記第1のモデルの精度を得て、該精度を前記第1のモデルのパフォーマンス定量インジケータとして用いるように具体的に構成されているか又は前記取得ユニットは、前記第1の推論結果及び前記第2の特徴データのプリセットラベルに基づいて、前記第1のモデルの再現率を得て、該再現率を前記第1のモデルのパフォーマンス定量インジケータとして用いるように具体的に構成されている、請求項27に記載のモデル更新装置。
  29. 前記送信ユニットは、更新されたモデルを前記ネットワーク装置に送信するようにさらに構成され、該更新されたモデルは前記第2のモデル又は前記第3のモデルを含み、前記ネットワーク装置の予測されるべき特徴データに基づいて分類結果を予測するように構成され、前記予測されるべき特徴結果はキーパフォーマンスインジケータ(KPI)特徴データを含む、請求項25乃至28のいずれか一項に記載のモデル更新装置。
  30. 前記受信ユニットは、前記ネットワーク装置の予測されるべき特徴データを受信するようにさらに構成され、
    前記モデル更新装置は、
    更新されたモデルを用いることにより、前記ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力するように構成された推論ユニットであって、該更新されたモデルは前記第2のモデル又は前記第3のモデルを含む、推論ユニット
    をさらに含む、請求項25乃至28のいずれか一項に記載のモデル更新装置。
  31. 前記モデル更新装置は、
    テストデータを用いることにより前記第2のモデルをテストするように構成されたテストユニットであって、該テストデータはグラウンドトゥルースラベルを含む、テストユニットと
    劣化したデータを記憶して、前記サイト解析装置が該劣化したデータを用いることにより、前記サイト解析装置内のモデルを更新できるようにするように構成された記憶ユニットであって、該劣化したデータは前記テストデータに属し、前記劣化したデータの推論ラベルは前記グラウンドトゥルースラベルと等しくなく、該推論ラベルは前記テストデータを用いることにより、前記第2のモデルをテストすることにより前記サイト解析装置によって得られる、記憶ユニットと、
    をさらに含む、請求項25乃至28のいずれか一項に記載のモデル更新装置。
  32. モデル更新装置であって、
    第1のモデルをサイト解析装置に送信するように構成された送信ユニットであって、該第1のモデルは、ネットワーク装置の予測されるべき特徴データに基づいて推論結果を出力するように構成されている、送信ユニットと、
    前記第1のモデルと第2のモデルとの差分データを受信するように構成された受信ユニットであって、該第2のモデルは、第1の訓練サンプルを用いることにより前記第1のモデルを訓練することにより前記サイト解析装置によって得られ、該第1の訓練サンプルは、前記サイト解析装置に対応するサイトネットワーク内の前記ネットワーク装置の第1の特徴データを含む、受信ユニットと、
    前記差分データに基づいて前記第1のモデルを更新して第3のモデルを得るように構成された更新ユニットと、
    を含む、モデル更新装置。
  33. 前記送信ユニットは、前記第1のモデルをN個のサイト解析装置に送信するように具体的に構成され、Nは1より大きい整数であり、
    前記受信ユニットは、L個のサイト解析装置によって送信される複数の差分データを受信するように具体的に構成され、Lは1よりも大きく且つN以下の整数であり、
    前記更新ユニットは、前記複数の差分データに基づいて前記第1のモデルを更新して前記第3のモデルを得るように具体的に構成され、
    前記送信ユニットは、前記第3のモデルを前記N個のサイト解析装置に送信するようにさらに構成されている、請求項32に記載のモデル更新装置。
  34. 前記モデル更新装置は取得ユニットをさらに含み、
    前記取得ユニットは、前記複数の差分データの平均値を得るように構成され、
    前記更新ユニットは、前記複数の差分データの平均値を用いることにより前記第1のモデルを更新して前記第3のモデルを得るように具体的に構成されているか、又は
    前記取得ユニットは、前記複数の差分データの加重平均値を得るように構成され、
    前記更新ユニットは、前記加重平均値を用いることにより前記第1のモデルを更新して前記第3のモデルを得るように具体的に構成されている、請求項33に記載のモデル更新装置。
  35. 前記モデル更新装置は、
    前記差分データを第1の解析装置に送信するL個のサイト解析装置に関する統計を収集するように構成された統計収集ユニット、
    をさらに含み、
    Nに対するLの比が閾値Kに達した場合、前記更新ユニットは、前記差分データに基づいて前記第1のモデルを更新して第3のモデルを得るように具体的に構成され、Kは0より大きく1以下である、請求項32乃至34のいずれか一項に記載のモデル更新装置。
  36. メモリ及びプロセッサを含むモデル更新装置であって、
    前記メモリはプログラムを記憶するように構成され、
    前記プロセッサは、前記メモリ内の前記プログラムを実行して、請求項9乃至19のいずれか一項に記載の方法を行うか又は請求項20乃至24のいずれか一項に記載の方法を行うように構成されている、モデル更新装置。
  37. コンピュータ記憶媒体であって、当該コンピュータ記憶媒体は命令を記憶し、該命令がコンピュータ上で実行された場合、該コンピュータは、請求項9乃至19のいずれか一項に記載の方法を行うことができるか又は前記コンピュータは、請求項20乃至24のいずれか一項に記載の方法を行うことができる、コンピュータ記憶媒体。
JP2022531508A 2019-11-30 2020-10-07 モデル更新システム、モデル更新方法及び関連装置 Active JP7401677B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201911209129.2A CN112884159A (zh) 2019-11-30 2019-11-30 模型更新系统、模型更新方法及相关设备
CN201911209129.2 2019-11-30
PCT/CN2020/119859 WO2021103823A1 (zh) 2019-11-30 2020-10-07 模型更新系统、模型更新方法及相关设备

Publications (2)

Publication Number Publication Date
JP2023504103A JP2023504103A (ja) 2023-02-01
JP7401677B2 true JP7401677B2 (ja) 2023-12-19

Family

ID=76039675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022531508A Active JP7401677B2 (ja) 2019-11-30 2020-10-07 モデル更新システム、モデル更新方法及び関連装置

Country Status (6)

Country Link
US (1) US20220284352A1 (ja)
EP (1) EP4050528A4 (ja)
JP (1) JP7401677B2 (ja)
KR (1) KR20220098011A (ja)
CN (1) CN112884159A (ja)
WO (1) WO2021103823A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11742901B2 (en) * 2020-07-27 2023-08-29 Electronics And Telecommunications Research Institute Deep learning based beamforming method and apparatus
CN115878991A (zh) * 2021-09-28 2023-03-31 华为技术有限公司 一种信任模型的训练方法及装置
CN113642260B (zh) * 2021-10-14 2021-12-24 江苏永佳电子材料有限公司 一种热封盖带的性能评估方法及系统
WO2024031246A1 (en) * 2022-08-08 2024-02-15 Nec Corporation Methods for communication

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010020444A (ja) 2008-07-09 2010-01-28 Sony Corp 学習装置、学習方法、およびプログラム
CN107992906A (zh) 2018-01-02 2018-05-04 联想(北京)有限公司 一种模型处理方法、系统、终端设备及服务器
WO2019090954A1 (zh) 2017-11-07 2019-05-16 华为技术有限公司 一种预测方法及终端、服务器
WO2019206196A1 (zh) 2018-04-27 2019-10-31 华为技术有限公司 一种模型更新方法、装置及系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9053436B2 (en) * 2013-03-13 2015-06-09 Dstillery, Inc. Methods and system for providing simultaneous multi-task ensemble learning
CN106909529B (zh) * 2015-12-22 2020-12-01 阿里巴巴集团控股有限公司 一种机器学习工具中间件及机器学习训练方法
CN107330516B (zh) * 2016-04-29 2021-06-25 腾讯科技(深圳)有限公司 模型参数训练方法、装置及系统
CN106250988B (zh) * 2016-07-28 2018-09-11 武汉理工大学 基于样本特性的相关向量回归增量学习算法及系统
CN107730087A (zh) * 2017-09-20 2018-02-23 平安科技(深圳)有限公司 预测模型训练方法、数据监控方法、装置、设备及介质
CN109840530A (zh) * 2017-11-24 2019-06-04 华为技术有限公司 训练多标签分类模型的方法和装置
CN109993300B (zh) * 2017-12-29 2021-01-29 华为技术有限公司 一种神经网络模型的训练方法及装置
CN109905268B (zh) * 2018-01-11 2020-11-06 华为技术有限公司 网络运维的方法及装置
CN110139325B (zh) * 2018-02-09 2021-08-13 华为技术有限公司 一种网络参数调优方法及装置
CN109902832B (zh) * 2018-11-28 2023-11-17 华为技术有限公司 机器学习模型的训练方法、异常预测方法及相关装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010020444A (ja) 2008-07-09 2010-01-28 Sony Corp 学習装置、学習方法、およびプログラム
WO2019090954A1 (zh) 2017-11-07 2019-05-16 华为技术有限公司 一种预测方法及终端、服务器
CN107992906A (zh) 2018-01-02 2018-05-04 联想(北京)有限公司 一种模型处理方法、系统、终端设备及服务器
WO2019206196A1 (zh) 2018-04-27 2019-10-31 华为技术有限公司 一种模型更新方法、装置及系统

Also Published As

Publication number Publication date
KR20220098011A (ko) 2022-07-08
US20220284352A1 (en) 2022-09-08
WO2021103823A1 (zh) 2021-06-03
CN112884159A (zh) 2021-06-01
EP4050528A1 (en) 2022-08-31
EP4050528A4 (en) 2022-12-28
JP2023504103A (ja) 2023-02-01

Similar Documents

Publication Publication Date Title
JP7401677B2 (ja) モデル更新システム、モデル更新方法及び関連装置
WO2021052394A1 (zh) 模型训练方法、装置及系统
WO2020077672A1 (zh) 一种服务质量评估模型的训练方法及装置
EP4020315A1 (en) Method, apparatus and system for determining label
CN111435463A (zh) 数据处理方法及相关设备、系统
CN109586950B (zh) 网络场景识别方法、网络管理设备、系统及存储介质
Cao et al. Load prediction for data centers based on database service
CN116881744B (zh) 一种基于物联网的运维数据分发方法、装置、设备及介质
CN114666224A (zh) 业务资源容量动态分配方法、装置、设备及存储介质
JP7422272B2 (ja) 産業オートメーション制御システムまたは電力システムからのデータの保存を促進するための方法および装置
Clemente et al. Traffic forecast in mobile networks: Classification system using machine learning
KR20200126766A (ko) Ict 인프라의 운용 관리 장치 및 방법
CN113891342B (zh) 基站巡检方法、装置、电子设备及存储介质
Celik et al. Sequential Monte Carlo-based fidelity selection in dynamic-data-driven adaptive multi-scale simulations
CN115883424A (zh) 一种高速骨干网间流量数据预测方法及系统
CN115409115A (zh) 基于用户日志的时序聚类异常终端识别方法
CN114757448A (zh) 一种基于数据空间模型的制造环节间最优价值链构建方法
CN114915563A (zh) 一种网络流量预测方法和系统
CN114429297A (zh) 项目的风险监控方法、装置、计算机设备及存储介质
Chakor et al. Proposing a Layer to Integrate the Sub-classification of Monitoring Operations Based on AI and Big Data to Improve Efficiency of Information Technology Supervision
Wang et al. Communication network time series prediction algorithm based on big data method
CN115484624A (zh) 数据处理方法、架构、电子设备及存储介质
Sharma et al. The fundamentals and strategies of maintenance, repair, and overhaul (MRO) in Industry 4.0
Jehangiri et al. Distributed predictive performance anomaly detection for virtualised platforms
Jerome et al. Anomaly detection and classification using a metric for determining the significance of failures: Case study: mobile network management data from LTE network

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220705

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220705

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230704

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231207

R150 Certificate of patent or registration of utility model

Ref document number: 7401677

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150