JP7245796B2 - 情報処理システム、及び情報処理システムの制御方法 - Google Patents
情報処理システム、及び情報処理システムの制御方法 Download PDFInfo
- Publication number
- JP7245796B2 JP7245796B2 JP2020010366A JP2020010366A JP7245796B2 JP 7245796 B2 JP7245796 B2 JP 7245796B2 JP 2020010366 A JP2020010366 A JP 2020010366A JP 2020010366 A JP2020010366 A JP 2020010366A JP 7245796 B2 JP7245796 B2 JP 7245796B2
- Authority
- JP
- Japan
- Prior art keywords
- inference
- information processing
- processing system
- unit
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
- G06F18/2178—Validation; Performance evaluation; Active pattern learning techniques based on feedback of a supervisor
- G06F18/2185—Validation; Performance evaluation; Active pattern learning techniques based on feedback of a supervisor the supervisor being an automated module, e.g. intelligent oracle
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/60—Software deployment
- G06F8/65—Updates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/60—Software deployment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/043—Distributed expert systems; Blackboards
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Computer Security & Cryptography (AREA)
- Debugging And Monitoring (AREA)
Description
記第1推論部と異なる第2の前記推論部に前記新たな推論モデルを適用するか否かを判定する配置決定部と、を備える。
れる。同図に示す通信ネットワークの構成は一例であり、保守や運用上の必要性、ユーザニーズ、セキュリティ等の観点から適宜適切な構成としてよい。例えば、管理ネットワーク800、データネットワーク810は、同一の通信ネットワークであってもよい。また例えば、端末装置4と推論サーバ500とを接続する通信ネットワークを、データネットワーク810とは別に設けてもよい。
バ600、管理サーバ700、及び端末装置4は、いずれも夫々が提供する機能を実現するために必要な構成を最低限備えていればよく、必ずしも例示する情報処理装置10の全ての構成を備えていなくてもよい。
terface)等を介して提供するサービスにより実現してもよい。
Only Memory)、RAM(Random Access Memory)、不揮発性メモリ(NVRAM(Non Volatile RAM))等である。補助記憶装置13は、例えば、SSD(Solid State Drive
)、ハードディスクドライブ、光学式記憶装置(CD(Compact Disc)、DVD(Digital Versatile Disc)等)、ストレージシステム、ICカード、SDカードや光学式記録媒体等の記録媒体の読取/書込装置、仮想サーバの記憶領域等である。補助記憶装置13には、記録媒体の読取装置や通信装置16を介してプログラムやデータを読み込むことができる。補助記憶装置13に格納(記憶)されているプログラムやデータは主記憶装置12に随時読み込まれる。
がある。
えば、URL(Uniform Resource Locator)やIP(Internet Protocol)アドレス等の
ネットワークアドレス)が設定される。APIは、推論サーバ500が提供してもよいし、推論サーバ500以外が提供してもよい。
イント5123には、推論モデルが実行される推論サーバ500が設置される推論環境を示すドメイン名の記述を含むURLが設定される。同図における「domain1」は推論環境
2aを、「domain2」は推論環境2bを示す。
、推論部520が、端末装置4から推論実施要求を受信した際、上記アクセス情報を用いて上記ストレージから推論データを取得するようにしてもよい。
バ700は、記憶部710、データ傾向判定部720、推論精度評価部730、MLコードデプロイ部740、要因判定部750、及び配置決定部760の各機能を有する。尚、管理サーバ700は、人(推論モデルの開発者等)によるMLコードの開発を支援する機能をさらに備えていてもよい。これらの機能は、管理サーバ700を構成する情報処理装置10のプロセッサ11が、当該情報処理装置10の主記憶装置12に格納されているプログラムを読み出して実行することにより、もしくは、当該情報処理装置10が備えるハードウェア(FPGA、ASIC、AIチップ等)により実現される。
末装置4から送信される推論データの傾向が、判定日時71113「2019/10/01 09:00:00」の時点においてはデータ傾向グループID7112「group001」で示されるデータ傾
向であり、判定日時7113「2019/10/02 13:00:00」の時点ではデータ傾向グループI
D7112「group002」で示されるデータ傾向であることを示している。これにより当該端末装置4から送信される推論データの傾向が変化していることを検出できる。
3「2019/10/01 11:00:00」の時点において推論精度7124「88%」であること(推論精
度が低下していること)を示している。
。
が「model001」の推論モデルがデプロイされ、当該推論モデルが推論モデルAPIエンドポイント7143が「https://model001.domain1」のAPIエンドポイントにて端末装置4から送信される推論実施要求及び推論データを受け付けることを示している。
習サーバ600にデプロイする。MLコードデプロイ部740は、MLコードとMLコードがデプロイされた学習サーバ600との関係をMLコード管理テーブル7130に管理する。
データ/結果群7150に推論データや推論結果を格納するためのAPIを提供して推論部520が当該APIを呼び出す方法、ファイル共有プロトコルなどを介して推論サーバ500と管理サーバ700とが推論データ/結果群7150を共有し、推論部520が推論データ及び推論結果をファイルとして書き込む方法等があるが、これに限らず他の方法としてもよい。以上で推論処理S1300は終了する。
にS1615で生成したモデルの推論モデルAPIエンドポイントを、夫々格納する。当該処理の実行後、精度低下対応決定処理S1600は終了し、図15の推論精度評価処理S1500も終了する。
ータ傾向判定処理S1400の途中にデータ傾向が変化したか否かを判定する処理ステップを設け、データ傾向が変化したと判定した場合に行うようにしてもよい。当該処理の実行後、精度低下対応決定処理S1600は終了し、図15の推論精度評価処理S1500も終了する。
割り当てられている。
向が変化した結果、推論モデルIDが「model002」の推論モデルの推論精度が低下し、その結果、図16のS1611において有効特徴量が変化したことが推論精度が低下した要因でないと判定された場合である。本例では、図16のS1614において、推論モデルIDが「model002’」の新たな推論モデルが生成され、生成された新たな推論モデルが推論環境2aの推論サーバ500にデプロイされる。また推論モデルIDとして「model002」に代えて「model002’」が「client002」に割り当てられている。ここで同図の例では
、端末装置IDが「client002」の端末装置4から送信される推論データの傾向変化とい
う当該端末装置4に限定された要因によって推論精度が低下しているため、新たな推論モデルは当該端末装置4にのみ割り当てられている(図中の下段左側の図)。またその後に端末装置IDが「client004」の端末装置4から送信される推論データに端末IDが「cli
ent002」の端末装置4から送信される推論データと同様の傾向変化が生じると、端末装置4に、推論モデルIDが「model002」の推論モデルの代わりに推論モデルIDが「model002’」の推論モデルが「client004」に割り当てられる(図中下段右側の図)。
0 推論データ/結果群、7160 MLコード群、7170 推論モデル群、720 データ傾向判定部、730 推論精度評価部、740 MLコードデプロイ部、750 要因判定部、760 配置決定部
Claims (15)
- 一つ以上の推論モデルにデータを入力して推論を行う複数の推論部と、
前記推論部による推論の精度を評価する推論精度評価部と、
第1の前記推論部において推論精度の低下が検出された場合に、当該第1の推論部に入力されたデータを学習した新たな推論モデルを生成する学習部と、
前記推論精度の低下の要因を判定する要因判定部と、
判定した前記要因に基づき、前記第1の推論部と異なる第2の前記推論部に前記新たな推論モデルを適用するか否かを判定する配置決定部と、
を備える、情報処理システム。 - 請求項1に記載の情報処理システムであって、
前記要因判定部が前記推論モデルの有効特徴量が変化したことを前記要因として判定した場合に、前記配置決定部は、前記複数の推論部のうち前記第1の推論部を含む一つ以上の前記推論部を前記新たな推論モデルの適用先として決定する、
情報処理システム。 - 請求項2に記載の情報処理システムであって、
前記要因判定部が前記推論モデルの有効特徴量が変化したことを前記要因として判定した場合に、前記配置決定部は、前記新たな前記推論モデルを利用する全ての前記推論部を当該新たな推論モデルの適用先として決定する、
情報処理システム。 - 請求項1に記載の情報処理システムであって、
前記要因判定部が前記第1の推論部に入力される前記データの傾向が変化したことを前記要因として判定した場合に、当該データと傾向の変化が類似するデータが入力される前記第2の推論部を特定する傾向判定部を更に備え、
前記配置決定部は、前記第1の推論部と、前記傾向判定部が特定した前記第2の推論部とを前記新たな推論モデルの適用先として決定する、
情報処理システム。 - 請求項4に記載の情報処理システムであって、
前記傾向判定部は、前記新たな推論モデルの適用先として決定しなかった他の前記第2の推論部に入力されるデータについて前記傾向の変化と類似する傾向の変化が生じているか否かの監視を継続し、
前記配置決定部は、前記他の第2の推論部に入力される前記データに前記傾向の変化と類似する傾向の変化が生じていることを検出した場合に、当該他の第2の推論部を前記新たな推論モデルの適用先として決定する、
情報処理システム。 - 請求項1乃至5のいずれか一項に記載の情報処理システムであって、
前記推論部は、入力される前記データを複数の前記推論モデルのうちの一つ以上に割り当てることにより推論を行う、
情報処理システム。 - 請求項6に記載の情報処理システムであって、
前記推論部は、入力される前記データを複数の前記推論モデルに割り当ててアンサンブルアルゴリズムを実行することにより推論を行う、
情報処理システム。 - 請求項1乃至5のいずれか一項に記載の情報処理システムであって、
複数の端末装置と通信可能に接続し、
前記推論部は、前記端末装置から取得した前記データを前記推論モデルに入力して推論を行い、
前記配置決定部は、前記端末装置の夫々と、夫々から取得したデータの入力先となる前記推論モデルとの対応を管理し、ある前記第1の推論部において推論精度の低下が検出された場合に、生成した前記新たな推論モデルが当該第1の推論部に入力されたデータの取得元の前記端末装置から取得したデータの入力先となるように前記対応を管理する、
情報処理システム。 - 一つ以上の推論モデルにデータを入力して推論を行う複数の推論部を備える情報処理システムの制御方法であって
前記情報処理システムが、
一つ以上の推論モデルを含むにデータを入力して推論を行う複数の推論部により推論を行うステップ、
前記推論部による推論の精度を評価するステップ、
第1の前記推論部において推論精度の低下が検出された場合に、当該第1の推論部に入力されたデータを学習した新たな推論モデルを生成するステップ、
前記推論精度の低下の要因を判定するステップ、及び、
判定した前記要因に基づき、前記第1の推論部と異なる第2の前記推論部に前記新たな推論モデルを適用するか否かを判定するステップ、
を実行する、情報処理システムの制御方法。 - 請求項9に記載の情報処理システムの制御方法であって、
前記情報処理システムが、前記推論モデルの有効特徴量が変化したことを前記要因として判定した場合に、前記複数の推論部のうち前記第1の推論部を含む一つ以上の前記推論部を前記新たな推論モデルの適用先として決定するステップ
をさらに実行する、情報処理システムの制御方法。 - 請求項10に記載の情報処理システムの制御方法であって、
前記情報処理システムが、前記推論モデルの有効特徴量が変化したことを前記要因として判定した場合に、前記新たな前記推論モデルを利用する全ての前記推論部を当該新たな推論モデルの適用先として決定するステップ
をさらに実行する、情報処理システムの制御方法。 - 請求項9に記載の情報処理システムの制御方法であって、
前記情報処理システムが、
前記第1の推論部に入力される前記データの傾向が変化したことを前記要因として判定した場合に、当該データと傾向の変化が類似するデータが入力される前記第2の推論部を特定するステップ、及び、
前記第1の推論部と、特定した前記第2の推論部とを前記新たな推論モデルの適用先として決定するステップ
をさらに実行する、情報処理システムの制御方法。 - 請求項12に記載の情報処理システムの制御方法であって、
前記情報処理システムが、
前記新たな推論モデルの適用先として決定しなかった他の前記第2の推論部に入力されるデータについて前記傾向の変化と類似する傾向の変化が生じているか否かの監視を継続するステップ、及び、
前記他の第2の推論部に入力される前記データに前記傾向の変化と類似する傾向の変化
が生じていることを検出した場合に、当該他の第2の推論部を前記新たな推論モデルの適用先として決定するステップ
をさらに実行する、情報処理システムの制御方法。 - 請求項9乃至13のいずれか一項に記載の情報処理システムの制御方法であって、
前記推論部は、入力される前記データを複数の前記推論モデルのうちの一つ以上に割り当てることにより推論を行う、
情報処理システムの制御方法。 - 請求項14に記載の情報処理システムの制御方法であって、
前記推論部は、入力される前記データを複数の前記推論モデルに割り当ててアンサンブルアルゴリズムを実行することにより推論を行う、
情報処理システムの制御方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020010366A JP7245796B2 (ja) | 2020-01-24 | 2020-01-24 | 情報処理システム、及び情報処理システムの制御方法 |
US17/066,522 US20210232950A1 (en) | 2020-01-24 | 2020-10-09 | Information processing system and method for controlling information processing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020010366A JP7245796B2 (ja) | 2020-01-24 | 2020-01-24 | 情報処理システム、及び情報処理システムの制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021117706A JP2021117706A (ja) | 2021-08-10 |
JP7245796B2 true JP7245796B2 (ja) | 2023-03-24 |
Family
ID=76969346
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020010366A Active JP7245796B2 (ja) | 2020-01-24 | 2020-01-24 | 情報処理システム、及び情報処理システムの制御方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20210232950A1 (ja) |
JP (1) | JP7245796B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004279211A (ja) | 2003-03-14 | 2004-10-07 | Omron Corp | 知識作成支援装置及びパラメータ探索方法並びにプログラム製品 |
JP2005523527A (ja) | 2002-04-19 | 2005-08-04 | コンピュータ アソシエイツ シンク,インコーポレイテッド | ローカルネットを介しての自動的モデルメインテナンス |
JP2010002815A (ja) | 2008-06-23 | 2010-01-07 | Ricoh Co Ltd | 状態判別方法、状態判別システム及び画像形成装置 |
WO2018173128A1 (ja) | 2017-03-21 | 2018-09-27 | 矢崎総業株式会社 | 中子及び成形装置並びに成形方法 |
-
2020
- 2020-01-24 JP JP2020010366A patent/JP7245796B2/ja active Active
- 2020-10-09 US US17/066,522 patent/US20210232950A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005523527A (ja) | 2002-04-19 | 2005-08-04 | コンピュータ アソシエイツ シンク,インコーポレイテッド | ローカルネットを介しての自動的モデルメインテナンス |
JP2004279211A (ja) | 2003-03-14 | 2004-10-07 | Omron Corp | 知識作成支援装置及びパラメータ探索方法並びにプログラム製品 |
JP2010002815A (ja) | 2008-06-23 | 2010-01-07 | Ricoh Co Ltd | 状態判別方法、状態判別システム及び画像形成装置 |
WO2018173128A1 (ja) | 2017-03-21 | 2018-09-27 | 矢崎総業株式会社 | 中子及び成形装置並びに成形方法 |
Non-Patent Citations (1)
Title |
---|
HUMMER Waldemar et al.,ModelOps:Cloud-based Lifecycle Management for Reliable and Trusted AI,2019 IEEE International Conference on Cloud Engineering(IC2E),2019年08月08日,インターネット:<URL:https://ieeexplore.ieee.org/document/8790192> |
Also Published As
Publication number | Publication date |
---|---|
US20210232950A1 (en) | 2021-07-29 |
JP2021117706A (ja) | 2021-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9612807B2 (en) | Code placement using a dynamic call graph | |
WO2016168476A1 (en) | A method to detect malicious behavior by computing the likelihood of data accesses | |
CN106104626B (zh) | 基于分析的数字内容的更新 | |
JP2017527929A (ja) | コンピュータ・インフラストラクチャの管理におけるポリシーの自己調整のための半教師あり機械学習の活用 | |
JP2017027601A (ja) | バックアップランタイム制約に基づいて仮想マシンをサーバ上に設置するシステム | |
JP6993495B2 (ja) | クラウド・ネットワーキングにおけるスケーラブルな統計及び分析メカニズム | |
JP2023500813A (ja) | 構成を使用したコンピューティング環境内のソフトウェア・アプリケーションの検出のための自動的な技術 | |
US11409552B2 (en) | Hardware expansion prediction for a hyperconverged system | |
JP2022531595A (ja) | リモートネットワーク管理プラットフォームのための集中型機械学習プレディクタ | |
JP7207009B2 (ja) | 異常検知装置、異常検知方法および異常検知プログラム | |
JP7245796B2 (ja) | 情報処理システム、及び情報処理システムの制御方法 | |
US11237890B2 (en) | Analytics initiated predictive failure and smart log | |
US10999159B2 (en) | System and method of detecting application affinity using network telemetry | |
EP3803770A1 (en) | Distributed computing system with a synthetic data as a service asset assembly engine | |
US11915060B2 (en) | Graphics processing management system | |
US11797353B2 (en) | Method and system for performing workloads in a data cluster | |
CN116368539A (zh) | 用于分区神经网络的具有省电和加密特征的媒体捕捉设备 | |
JP6816824B2 (ja) | 分散システム、データ管理装置、データ管理方法、及びプログラム | |
US20240020711A1 (en) | Methods and systems for customer accounts association in multilingual environments | |
EP3803721B1 (en) | Distributed computing system with a synthetic data as a service feedback loop engine | |
US20240168761A1 (en) | Content-aware auto-scaling of stream processing applications on container orchestration | |
US20240303341A1 (en) | Method to clone and/or migrate the applicable bios settings in a device twin/migration environment | |
US20240303529A1 (en) | Machine learning-based application management for enterprise systems | |
CN112527277B (zh) | 可视化的计算任务编排方法、装置、电子设备及存储介质 | |
US20240087250A1 (en) | Methods and systems for managing images in augmented reality (ar) environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220215 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230307 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230313 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7245796 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |