JP7029347B2 - 情報処理方法、プログラムおよび情報処理装置 - Google Patents

情報処理方法、プログラムおよび情報処理装置 Download PDF

Info

Publication number
JP7029347B2
JP7029347B2 JP2018092431A JP2018092431A JP7029347B2 JP 7029347 B2 JP7029347 B2 JP 7029347B2 JP 2018092431 A JP2018092431 A JP 2018092431A JP 2018092431 A JP2018092431 A JP 2018092431A JP 7029347 B2 JP7029347 B2 JP 7029347B2
Authority
JP
Japan
Prior art keywords
data
instance
subclass
data type
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018092431A
Other languages
English (en)
Other versions
JP2019197495A (ja
Inventor
蘭 王
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2018092431A priority Critical patent/JP7029347B2/ja
Priority to EP19160496.6A priority patent/EP3567492A1/en
Priority to US16/297,828 priority patent/US11934963B2/en
Priority to CN201910195680.XA priority patent/CN110471373B/zh
Publication of JP2019197495A publication Critical patent/JP2019197495A/ja
Application granted granted Critical
Publication of JP7029347B2 publication Critical patent/JP7029347B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/4185Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by the network communication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/31From computer integrated manufacturing till monitoring
    • G05B2219/31088Network communication between supervisor and cell, machine group

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Manufacturing & Machinery (AREA)
  • Quality & Reliability (AREA)
  • Automation & Control Theory (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明の実施形態は、情報処理方法、プログラムおよび情報処理装置に関する。
IoTやIndustrie4.0では、あらゆるデバイスやシステムを互いに接続し、あらゆるデータが交換可能なネットワークを構築することが提案されている。このようなネットワークでは、多数のセンサや異なるプロセスに係る複数のシステムが相互に接続されている。異なるソース(source)から収集されたデータを有効に活用し、各種のインフラ、工場、プラントなどの設備のオペレーションの自動化を推進し、コストの削減、安全性の向上、生産品の品質改善などを実現するためには、データが物理世界に実在する物理世界データまたは概念的に定義されるサイバー世界データのいずれのデータ種類に属するのかを正しく分類し、データ種類とデータ間の関係を明確にする必要がある。
複数のソースから得られたデータを処理する技術の例として、データ仕様を定義するオントロジーを用いるデータ処理手法や、各種の機械学習的手法が挙げられる。これらの技術では共通的な特徴に基づくデータ推定が可能であるが、データ種類の違いによるデータ間の関係の違いを考慮したデータ推定ができなかった。定義されていないデータ種類のデータのデータ種類を推定し、データ間の関係を推定する技術が求められている。
米国特許出願公開第2016/0224645号明細書 米国特許出願公開第2016/0335544号明細書
本発明の実施形態は、物理的な実体に基づいて定義される物理世界データと、概念的に定義されるサイバー世界データとを分類し、物理的な実体とサイバーシステムを跨った横断的なデータ推定と利用を実現する情報処理方法、プログラムおよび情報処理装置を提供する。
本発明の実施形態としての情報処理方法は、複数のデータ項目の値の組み合わせであるインスタンスを物理的な実体に基づいて定義される物理世界クラスまたは概念的に定義されるサイバー世界クラスのいずれかのサブクラスに分類する情報処理方法であって、前記インスタンスを含む第1データを取得するステップと、記憶装置に保存されている、過去に取得された前記第1データの集合であり、前記第1データの集合に含まれているインスタンスのデータ種類が特定されているログデータまたはログデータベースまたは、前記データ種類の前記サブクラスを定義する分類定義データの少なくともいずれかを参照し、前記インスタンスの分類される前記サブクラスを推定するステップとをコンピュータが実行する。
第1の実施形態に係るシステムの構成例を示す図。 メタモデルの例を示した図。 データ構造の呼称を示した図。 データ構造どうしの対応関係を示した図。 第1データと分類定義データの構造を示した図。 収集される第1データの構造の例を示した図。 第1の実施形態における全体の処理の例を示すフローチャート。 階層分類におけるクラス、スキーマ、インスタンスとの関係を示した図。 スキーマに基づきインスタンスのデータ種類を推定する処理の例を示したフローチャート。 最も類似しているスキーマを抽出する処理の例を示した図。 データの階層分類と形式記述を含むオントロジーの例を示した図。 オントロジーに基づき第1データのデータ種類を推定する処理を示したフローチャート。 インスタンスの類似度に基づきインスタンスのデータ種類を推定する処理の第1の方法を示すフローチャート。 インスタンスの値を用いた類似度の計算の第1の方法を示した図。 インスタンスの類似度に基づきインスタンスのデータ種類を推定する処理の第2の方法を示したフローチャート。 インスタンスの値を用いた類似度の計算の第2の方法を示した図。 第1データの分類の推定結果画面の例を示した図。 分類定義データの編集画面の例を示した図。 第2の実施形態に係る情報処理装置の構成例を示す図。
以下、図面を参照しながら、本発明の実施形態について説明する。また、図面において同一の構成要素は、同じ番号を付し、説明は、適宜省略する。
(第1の実施形態)
多数のセンサや異なるプロセスに係る複数のシステムから収集されるデータは、物理的な実体に基づいて定義されるデータ(物理世界データ)と、概念的に定義されるデータ(サイバー世界データ)、に分類することができる。物理世界データとサイバー世界データでは、データ間の関係が異なっている。そこで、物理世界データとサイバー世界データを分類し、データ間の関係に関する情報が取得できるようにデータの分類処理を実行すると、異なるソースから得られたデータの性質の違いやデータ間の関係が明らかになる。本実施形態に係る情報処理装置を使ってデータの分類処理を実行することにより、異なるソースから得られたデータの性質の違いやデータ間の関係に関する情報が得られるため、複数のシステムを跨った横断的なデータの利用が容易になる。
以下では、本実施形態に係る情報処理装置を含むシステムの構成例について説明する。
図1は、第1の実施形態に係るシステムの構成例を示す図である。図1のシステムは、情報処理装置1と、ネットワーク2と、ネットワーク2aと、センサシステム3と、制御システム4と、管理システム5と、記憶装置6とを備えている。情報処理装置1、センサシステム3、制御システム4、管理システム5、記憶装置6はネットワーク2によって互いに接続されている。
情報処理装置1は、異なるソースから取得された分類対象となるデータ(以降、第1データとよぶ)のうち、メタデータを除いた実データのデータ種類を推定する。そして、実データが分類データ種類およびクラス間の関係に関する情報を通知する。第1データは、既に分類定義データで定義されているデータ種類の実データを含む場合があれば、分類定義データで定義されていないデータ種類の実データを含む場合もある。また、前者と後者の実データが混在していることもある。
分類定義データとは、複数の観点から実データを定義するメタデータの集合である。本実施形態における分類定義データは、クラスとそのスキーマ、クラスおよびスキーマに対応するデータ種類、オントロジー、クラスの分類とクラス間の関係を定めるメタモデルの定義を含む。これらのメタデータの詳細については後述する。
情報処理装置1は未定義のクラスに係るデータを検出した場合、新しいクラス、そのスキーマ、対応するデータ種類の定義を分類定義データに追加する。また、オントロジーおよびメタモデルに対応するクラスの定義を追加する。さらに、情報処理装置1は、収集された実データのデータ種類、データ種類に対応するクラス、クラス間の関係に関する情報をユーザや外部の情報処理装置に通知する。
各クラスにはデータ種類とスキーマを対応付けることができる。後述するように、階層構造に基づいて複数のクラスを定義することができる。すなわち、クラスの階層構造はスキーマの集合を与えるといえる。実データはクラスの形式を定義するスキーマを利用して記述される。データのクラスには物理的な実体に基づいて定義される物理世界(Physical World:PW)クラスと、概念的に定義されるサイバー世界(Cyber World:CW)クラスが存在する。新しく定義されるクラスは物理世界(PW)クラスまたはサイバー世界(CW)クラスのいずれかのサブクラスとなる。したがって、それぞれの実データ(インスタンス)はいずれかのサブクラスに分類される。また、サブクラス間に存在する抽象的な関連性を表現するため、サブクラス間に関係を定義することができる。関係は、is-aの継承関係、has-aの包含関係、参照関係など、物理的な結びつきを示すものであってもよいし、概念的な結びつきを示すものであってもよい。
物理世界(PW)において定義されるデータの例としては、装置やデバイスの種類、装置の設置場所、装置の設置台数、装置の機械的な接続関係、デバイスの電気的な接続関係、装置どうしの位置関係、スイッチの配置などが挙げられる。一方、サイバー世界(CW)において定義されるデータの例としては、デバイスの性能指標、発電機や照明機器におけるエネルギー変換効率、装置の方式(例えば、照明機器における白熱電球とLED)、装置の耐久年数、概念間の継承関係、イベント間の因果関係、情報通信機器および情報システムにおけるユーザアカウントの設定情報、情報通信機器および情報システムにおける設定情報などが挙げられる。サイバー世界(CW)で定義されるデータは、物理的な実体のないサイバースペースにおけるユーザアカウント、ファイル、グループ、計算資源の割り当て設定、ストレージの割り当て設定、アクセス設定、ユーザのスコア、仮想現実(VR)環境における状態情報、拡張現実(AR)環境における状態情報、ユーザが有するポイント、ユーザが有する仮想通貨の額などをも包含する。
物理世界クラス(以降、PWクラスとよぶ)とサイバー世界(以降、CWクラスとよぶ)クラスの違いやクラス間の関係を考慮することにより、各種インフラ、工場、プラントなどの機器や設備などのオペレーションを統一的に実行することができる。オペレーションの例としては、運転、停止、制御、生産、診断、保守、出荷、梱包、データの分析、構成変更、動作モードの変更などが挙げられるが、どのような種類のものであってもよい。
図2は、第1の実施形態に係る情報処理方法および情報処理装置で利用されるメタモデルの例を示している。図2は、クラスのPW/CWの種類と、データ間の関係を定義したメタモデル20(Data Relationship Meta-Model:DRMM)である。メタモデル20を参照すると、各クラスはPWクラス(クラス22)またはCWクラス(クラス23)のいずれかに分類されていることがわかる。PWクラスとCWクラスにはそれぞれ複数のサブクラスが定義されている(クラス24~29)。各サブクラスはいずれかのスキーマとデータ種類に対応付けることができる。
図2の例ではPWクラスのサブクラスとして、機械クラス(クラス24)と、電気クラス(クラス25)と、ロケーションクラス(クラス26)と、PW関係タイプクラス(クラス30)が定義されている。PW関係タイプクラスはクラス間の関係を定義する。PW関係タイプクラスが定義する関係の例としては、機械接続、電気接続、位置接続、包含、分解、埋め込み、原材料、予防などが挙げられる。例えば、PWクラスのサブクラスとして“機器クラス”と“センサ機器クラス”が定義されている場合、“センサ機器クラス”は“機器クラス”に対して“包含”の関係を有する。
図2の例ではCWクラスのサブクラスとして、座標クラス(クラス27)と、設備クラス(クラス28)と、機能クラス(クラス29)と、CW関係タイプクラス(クラス31)が定義されている。CW関係タイプクラスは、PW関係タイプクラスと同様、クラス間の関係を定義する。CW関係タイプクラスが定義する関係の例としては、継承、包含、分解、因果、同等、参照などが挙げられる。例えば、CWクラスのサブクラスとして“システムクラス”と“補助電源システムクラス”が定義されている場合、“補助電源システムクラス”は“システムクラス”に対して“継承”の関係を有する。
また、PW関係タイプクラスとCW関係タイプクラスとの間にはアソシエーション(Association)32が定義されている。以降では、PW関係タイプクラスで定義されている関係(relation)とCW関係タイプクラスで定義されている関係(relation)との間の対応(関連性)をアソシエーションとよぶものとする。例えば、PW関係タイプクラスにおける“機械接続”はCW関係タイプクラスにおける“参照”は対応しており、アソシエーションを有する。なお、PW関係タイプクラスで定義されているすべての関係が必ずアソシエーションを有していなくてもよい。また、PW関係タイプクラスで定義されているひとつの関係が複数のアソシエーションを有していてもよい。CW関係タイプクラスで定義されている関係についても同様である。
ここで説明したPWクラスのサブクラス、CWクラスのサブクラス、関係、アソシエーションは一例にしか過ぎない。したがって、本実施形態に係る情報処理装置(情報処理方法)ではこれらとは異なるサブクラス、関係、アソシエーションが定義されていてもよい。分類定義データは、上述のようなデータ種類のサブクラスを定義している。なお、以降では単に「クラス」と述べた場合には、PWクラスまたはCWクラスのサブクラスを含む一般的なクラス(データ種類に対応付けられるデータの定義)を意味するものとする。
以下では、再び図1を参照しながら、第1の実施形態に係るシステムの説明を行う。
ネットワーク2は、情報処理装置1、センサシステム3、制御システム4、管理システム5、記憶装置6の間で、データの送受信をする手段を提供する。一方、ネットワーク2aは、情報処理装置1と外部の情報処理装置との間でデータの送受信をする手段を提供する。外部の情報処理装置はネットワーク2aを介して、収集した実データのデータ種類、クラス、関係に関する情報の通知を受信したり、情報処理装置1の記憶部9に保存された分類定義データを参照したりすることができる。
ネットワーク2、2aの通信媒体として、例えば光ファイバ、LANケーブル、電話回線、同軸ケーブル、無線またはこれらの組み合わせを用いることができる。通信規格として、イーサネット、IEEE802.11シリーズの無線LAN、NFC、Bluetooth、ZigBee、各種のLPWA(Low-Power Wide-Area)規格などを使うことができるが、規格の種類については特に問わない。
ネットワーク2、2aは図1の例のように独立したネットワークであってもよいし、互いに接続された、一体的なネットワークであってもよい。
センサシステム3は、複数のセンサによって物理情報の計測を行うシステムである。センサシステム3はワイヤレスセンサネットワークであってもよいし、各種インフラ、工場、プラントなどの機器や設備に備えられたセンサの集合であってもよい。センサシステム3におけるセンサの種類、個数については特に限定しない。情報処理装置1は、センサシステム3からセンサによって計測された物理情報を含むデータを取得することができる。
制御システム4は、各種インフラ、工場、プラントなどの機器や設備を制御するシステムである。制御システム4の制御対象については特に問わない。情報処理装置1は、制御システム4から制御対象の設定値、動作モード、状態などを含むデータを取得することができる。
管理システム5は、ユーザアカウントの設定、アクセス権限の設定、操作履歴の記録、計算資源のユーザへの割り当て、計算資源の使用状況のモニタリングなどを行う情報システムである。情報処理装置は、管理システム5からユーザのログイン後の活動、操作履歴、計算資源の使用状況などを含むデータを取得することができる。
記憶装置6は、第1データを蓄積可能な記憶領域を提供するストレージシステムである。記憶装置6に蓄積されるデータは、センサシステム3、制御システム4、管理システム5から取得されたデータであってもよいし、その他のシステムから取得されたデータであってもよい。第1データが大量に発生する場合には、第1データを一旦記憶装置6に蓄積してから、情報処理装置1にデータの分類処理を実行させることができる。
次に、情報処理装置1の内部の構成要素について説明する。
情報処理装置1は、データ収集部7と、データ処理部8と、記憶部9と、スキーマ更新部14と、オントロジー更新部15と、メタモデル更新部16と、データ関係取得部17と、通知部18と、表示部19aと、操作部19bとを備えている。
データ収集部7は、ネットワーク2を介してセンサシステム3、制御システム4、管理システム5、記憶装置6からデータを収集する。データ収集部7は収集したデータをログデータベース10に保存する。データ収集部7によって収集されるデータを第1データとよぶものとする。また、データ収集部7は第1データをデータ処理部8に転送する。第1データの構造については後述する。
データ処理部8は、第1データに含まれる実データ(インスタンス)のスキーマ、スキーマに対応するデータ種類、データ種類に対応するクラスを推定し、実データの分類および属性に関する情報を提供する。データ処理部8は、記憶部9に保存された分類定義データを参照し、上述の処理を実行する。また、分類定義データに未定義のデータ種類、スキーマ、サブクラスなどがあると判定された場合、データ処理部8はスキーマ更新部14、オントロジー更新部15、メタモデル更新部16に分類定義データの更新を指示する。なお、データ処理部8が実行する処理の詳細については後述する。データ処理部8は、例えばCPUなどのプロセッサ、ASIC、CPLDなどのハードウェア回路、OS(Operating System)やアプリケーションなどのプログラムまたはこれらの組み合わせによって実装される。
記憶部9は、収集された第1データ、分類定義データ、プログラムなどを保存するための記憶媒体である。記憶部9は、例えばSRAM、DRAMなどの揮発性メモリであってもよいし、NAND、MRAM、FRAMなどの不揮発性メモリでもよい。またハードディスク、SSDなどのストレージ装置や、外部の記憶装置であってもよく、デバイスの種類については特に限定しない。また、記憶部9は複数の種類のデバイスや記憶装置の組み合わせであってもよい。
記憶部9には、ログデータベース(ログDB)10と、スキーマデータベース(スキーマDB)11と、オントロジーデータベース(オントロジーDB)12と、メタモデル(メタモデルDB)13が保存されている。記憶部9に保存される各データベースの役割について説明する前に、本実施形態に係る情報処理方法および情報処理装置で使われるデータ構造について述べる。
図3は、本実施形態に係る情報処理方法および情報処理装置で使われるデータ構造の呼称を示している。また、図4は、データ構造どうしの対応関係を示している。図3には、メタモデルと、オントロジーと、スキーマと、インスタンスが示されている。図3上段のメタモデルの詳細については図2の説明で述べた。オントロジーは、概念間の関連性や属性を定義し、データの仕様を規定するメタデータである。図3中段に示されているように、オントロジーはクラスの階層分類を示したツリーと、クラスに割り当てられたコード(例えば、PW_E、G、GT、CW_S、Cなど)、コードを使ったクラスの識別子である形式記述(例えば、+B、=Bなど)を含む。後述するように、形式記述にシーケンス番号を結合させたコードは、各インスタンスの識別子として使われる。
メタモデルは、プログラムなどによって生成されたものであってもよいし、ユーザが定義したものであってもよい。図4に示されているように、メタモデルに準拠するよう、オントロジーが定義される。したがって、メタモデルにおけるクラスと、オントロジーにおけるクラスとの間には対応関係が存在する。
図3下段のスキーマは実データにおけるデータの形式を規定する。図3の例では、第1のスキーマが{コード、定格効率、種類、起動時間}、第2のスキーマが{コード、種類、値}と、複数のデータ項目(item)を含む形式で定義されている。また、図3下段のインスタンスはスキーマで規定された形式にしたがった実データであり、複数のデータ項目の組み合わせとなっている。スキーマは、クラスが有する属性(attribute)を定義する。図3の例におけるインスタンスは{B001、温度センサ、100℃}、{B002、流量センサ、300L/min}となっており、複数の値が組み合わされた形式となっている。
第1のインスタンスでは、第2のスキーマの各データ項目がコード=“B001”、種類=“温度センサ”、値=“100℃”の形で具体化されているといえる。同様に第2のインスタンスでは、第2のスキーマの各データ項目がコード=“B002”、種類=“流量センサ”、値=“300L/min”の形で具体化されている。このように、ひとつのスキーマの形式にしたがったインスタンスが複数個存在していてもよい。
なお、メタモデル、オントロジー、スキーマの定義を記述する方法については特に問わない。データ構造の定義に関する記述は例えばXML、JSON、CSV、テキストなどを使って行うことができるが、その他の方法によって行われてもよい。
図4に示されているように、スキーマはクラスごとに定義される。したがって、情報処理装置(情報処理方法)において複数のクラスが存在する場合、異なる形式のスキーマが複数個定義される。
図4に示されているように、スキーマとそのクラスはオントロジーに対応付けられて定義される。また、オントロジーとメタモデルとの間の対応関係があるため、取得されたインスタンス(実データ)の利用時に、メタモデルで定義されたクラスの分類やクラス間の関係に関する情報を参照することができる。
なお、スキーマおよび対応するクラスはプログラムなどによって定義されてもよいし、ユーザが定義してもよい。また、図3に示したスキーマとインスタンスは一例にしか過ぎず、例とは異なる形式のスキーマや、異なる内容のインスタンスが使われてもよい。また、定義されるスキーマおよびクラスについては特に限定しない。
次に、ログデータベース10と、スキーマデータベース11と、オントロジーデータベース12と、メタモデルデータベース13に保存されるデータについて説明する。図5は、第1データと分類定義データの構造を示している。以下では、図5を参照しながら説明をする。
ログデータベース10には、過去に取得されたインスタンス(実データ)を含む第1データの集合が保存される。第1データは、取得時刻または計測時刻、データのソース(取得元)を識別する情報などと組み合わされて保存されてもよい。データのソースを識別する情報の例としてはIPアドレス、MACアドレス、センサ名、システム名、モジュール名、住所、座標情報、緯度と経度の組み合わせ、各種の識別子があるが、どのような種類のものであってもよい。また、第1データに含まれる各インスタンスのデータ種類がスキーマデータベース11で定義済みのものであるか否かを識別するための情報を併せて保存してもよい。
インスタンスのデータ種類が定義済みのものである場合、ログデータベース10にスキーマデータベース11における、対応するデータ種類を定義した情報およびスキーマを定義した情報への参照(reference)70が保存される。参照70の例としては、ポインタ、ファイル名、オブジェクト名、識別子(ID)などが挙げられるが、該当するデータ種類またはスキーマが特定できるのであれば、実装方法については特に問わない。
スキーマデータベース11、オントロジーデータベース12、メタモデルデータベース13には各種の分類定義データが保存される。上述のように、分類定義データは複数の観点からデータに定義を与える。
スキーマデータベース11には、スキーマに対応するデータ種類の定義に関する情報と、データ種類ごとにインスタンスの形式を定義するスキーマ定義情報が保存される。データ種類およびスキーマに識別子を付与し、スキーマデータベース11に当該識別子を保存してもよい。識別子は、英数字であってもよいし、英数字と記号の組み合わせであってもよいし、データ種類およびスキーマの説明するもの(例えば、データ種類またはスキーマの名称)であってもよく、形式については特に問わない。
スキーマデータベース11に、それぞれのデータ種類およびスキーマに対応するクラスへの参照(reference)71を保存してもよい。参照71の例としては、ポインタ、ファイル名、オブジェクト名、識別子(ID)などが挙げられるが、該当するクラスを定義したデータが特定されるのであれば、実現方法については特に問わない。図5の例では、参照71はオントロジーデータベース12のオントロジーで定義されたクラスを示しているが、メタモデルデータベース13のメタモデルで定義されたクラスを示していてもよい。
オントロジーデータベース12には、オントロジーが保存される。上述のように、クラスの階層分類と、各クラスに割り当てられたコードと、形式記述に関する情報を含む。クラスに識別子を付与し、オントロジーデータベース12に当該識別子を保存してもよい。識別子は、英数字であってもよいし、英数字と記号の組み合わせであってもよいし、クラスを説明するもの(例えば、クラスの分類、クラスの属性、クラスの名称)であってもよく、形式については特に問わない。
オントロジーデータベース12に、それぞれのクラスに対応するデータ種類またはスキーマへの参照(reference)71aを保存してもよい。参照71aの例としては、ポインタ、ファイル名、オブジェクト名、識別子(ID)などが挙げられるが、該当するデータ種類またはスキーマを定義したデータが特定できるのであれば、実現方法については特に問わない。
メタモデルデータベース13には、メタモデルが保存される。メタモデルは、オントロジーと同様、各クラスの定義を与える。図2に示したように、メタモデルでは各クラスを物理世界(PW)クラスのサブクラスまたはサイバー世界(CW)のサブクラスとして分類している。したがって、メタモデルデータベース13を参照することにより、クラスが物理世界(PW)におけるデータを定義しているのか、サイバー世界(CW)におけるデータを定義しているのかを判定することができる。また、PW関係タイプクラスまたはCW関係タイプクラスを参照し、クラス間の関係に関する情報を得ることができる(対応関係73)。
なお、メタモデルデータベース13にクラスの識別子を保存してもよい。識別子は、英数字であってもよいし、英数字と記号の組み合わせであってもよいし、クラスを説明するもの(例えば、クラスの分類、クラスの属性、クラスの名称)であってもよく、形式については特に問わない。
なお、オントロジーデータベース12における各クラスを定義するデータと、メタモデルデータベース13における各クラスを定義するデータとの間に対応付けができるようにしてもよい。例えば、同一または対応するクラスを識別子によって特定できるようにしてもよいし、双方のデータベースで定義されたクラスをポインタ、ファイル名、オブジェクト名などによって相互に参照できるようにしてもよい(対応関係72)。その他の方法によって、対応関係72を実現してもよい。
図5で説明した参照または対応関係を使うことによって、データ処理部8は第1データに含まれるインスタンス(実データ)から、当該インスタンスのスキーマ、当該インスタンスに対応するクラス、クラス間の関係、当該インスタンスがサイバー世界(CW)または物理世界(PW)のいずれに属するのかなどの情報を得ることができる。分類定義データの完成度を高めることによって、次々に収集されるデータの属性、関連、分類などが取得でき、効率的な機器や設備の制御やデータ分析を行うことが可能となる。
次に、データ収集部7によって収集される第1データの構造について説明する。図6は、収集される第1データの構造の例を示している。収集される第1データはパターン#1(第1データ80)のように、インスタンス(実データ)と、当該インスタンスに対応する形式記述情報およびスキーマ情報の両方を含む場合がある。ここで、スキーマ情報とは、スキーマの定義、スキーマまたはデータ種類の識別子など、少なくともスキーマまたはデータ種類を特定するのに足りるデータのことをいう。
また、パターン#2(第1データ81)のように、インスタンス(実データ)が含まれているが、当該インスタンスに対応する形式記述情報が含まれていない場合がある。さらに、パターン#3(第1データ82)のように、インスタンス(実データ)が含まれているが、当該インスタンスに対応するスキーマ情報が含まれていない場合がある。パターン#4(第1データ83)のように、実データに相当するインスタンスが含まれているが、当該インスタンスに対応する形式記述情報およびスキーマ情報のいずれも含まれていない場合もある。このように、第1データの構造には複数のパターンが存在するため、データ処理部8は第1データの構造に応じて、異なる処理を実行する。
さらに、第1データはパターン#5(第1データ84)のように複数のインスタンスを含んでいてもよい。第1データ84では、インスタンス#1~#3の3つのインスタンスを含んでいる。インスタンス#2は対応するスキーマ情報#2を有し、インスタンス#3は対応する形式記述情報#3を有する。だが、インスタンス#1は対応するスキーマ情報および形式記述情報を有しない。
メタデータ、特定のビット列、特定のファイル名を使うことによって第1データに含まれるデータの種類(インスタンス、形式記述情報、スキーマ情報)や対応関係を判別できるようにしてもよいし、その他の方法によってデータを判別できるようにしてもよい。
以下では再び図1を参照し、情報処理装置1の内部の構成要素について説明する。
スキーマ更新部14は、スキーマデータベース11の更新処理を実行する。例えば、スキーマ更新部14は新しいデータ種類の定義と、当該データ種類に対応するスキーマ(スキーマ定義情報)とをスキーマデータベース11に追加する。また、スキーマ更新部14は、スキーマおよびデータ種類に対応するサブクラスへの参照に係るデータをスキーマデータベース11に書き込む。オントロジー更新部15は、オントロジーデータベース12の更新処理を実行する。オントロジー更新部15は例えば、新しいサブクラスや形式記述をオントロジーデータベース12に追加する。メタモデル更新部16は、メタモデルデータベース13の更新処理を実行する。メタモデル更新部16は例えば、新しいサブクラスをメタモデルデータベース13に追加する。
スキーマ更新部14、オントロジー更新部15、メタモデル更新部16はプログラムの処理が所定の条件を満たしたら自動的に分類定義データを更新してもよい。また、データ処理部8や操作部19bから送信された指令を受信し、当該指令に基づいて分類定義データを更新してもよい。
データ関係取得部17は、メタモデルデータベース13を参照し、特定のサブクラスが有する関係(Association)に関する情報を取得する。当該情報は通知部18を介して、ユーザや外部の情報処理装置に転送される。
通知部18は、データ処理部8によって推定された第1データのデータ種類、スキーマ、サブクラスおよびデータ関係取得部17によって取得された当該サブクラスが有する関係に関する情報をユーザや外部の情報処理装置に通知する。通知部18による情報の通知方法については特に問わない。例えば、通知部18は電子メールやショートメールによって通知を行ってもよいし、ウェブページで情報を公開してもよい。また、外部のストレージ装置などに結果の書き込みを行ってもよいし、制御装置やデータ分析を行うサーバなどに結果を送信してもよい。
表示部19aは、ユーザが情報処理装置1の操作時に利用するGUI(Graphical User Interface)やCLI(Command Line Interface)、分類定義データの編集画面、推定結果などを表示するディスプレイである。ディスプレイとして、例えば液晶ディスプレイ、有機エレクトロルミネッセンスディスプレイ、プロジェクタ、LEDディスプレイなどを使うことができるが、その他の種類のディスプレイを使ってもよい。なお、図1の例における表示部19aは情報処理装置1に内蔵されているが、表示部19aの位置については特に問わない。表示部19aは、情報処理装置1から離れた部屋や建物に設置されていてもよいし、タブレットやスマートフォン
などの無線通信端末のディスプレイであってもよい。
操作部19bは、ユーザに情報処理装置1の操作手段を提供するデバイスである。操作部19bは、例えば、キーボード、マウス、スイッチ、音声認識デバイスなどであるが、これに限られない。また、操作部19bは表示部19aと一体化したタッチパネルであってもよい。操作部19bの位置についても特に問わない。操作部19bは、情報処理装置1から離れた部屋や建物に設置されていてもよいし、タブレットやスマートフォンなどの無線通信端末のタッチパネルであってもよい。
次に、本実施形態に係る情報処理装置が実行する処理について説明する。図7は、第1の実施形態における全体の処理の例を示すフローチャートである。以下では、図7を参照しながら、処理について説明する。
まず、データ収集部7は分類対象となるデータ(第1データ)を取得する(ステップS101)。先に述べたように、実際に分類されるのは第1データに含まれる実データ(インスタンス)である。第1データに含まれるメタデータ(スキーマ情報、形式記述)は分類処理に必要な情報を提供する。
データ収集部7からデータ処理部8に第1データが転送されたら、当該第1データに含まれるインスタンスに対応するスキーマ情報が含まれているか否かを判定する(ステップS102)。該当するスキーマ情報が含まれている場合(ステップS102のYES)、データ処理部8はスキーマ情報に基づいて、インスタンスのデータ種類を推定する(ステップS104)。該当するスキーマ情報が含まれていない場合(ステップS102のNO)、インスタンスに対応する形式記述情報が含まれているか否かを判定する(ステップS103)。
該当する形式記述情報が第1データに含まれている場合(ステップS103のYES)、形式記述情報に基づき、データ種類を推定する(ステップS105)。該当する形式記述情報が第1データに含まれていない場合(ステップS103のNO)、類似度に基づき、データ種類を推定する(ステップS106)。
すなわち、データ処理部8は第1データに含まれているメタデータに応じ、データ種類の推定に使う方法を選択する。なお、ステップS104、ステップS105、ステップS106で実行される処理の詳細については後述する。図5のパターン#5(第1データ84)のように、同時に収集された第1データが複数のインスタンスを含んでいる場合には、それぞれのインスタンスについてステップS102~S106の処理が実行される。
ステップS104~S106の処理が実行されたら、データ処理部8は分類定義データ中に推定されたデータ種類と同一のデータ種類が定義されているか否かを確認する(ステップS107)。例えば、データ処理部8はスキーマデータベース11にアクセスし、該当するデータ種類の定義を探索する。
分類定義データ中に同一のデータ種類が定義されている場合(ステップS107のYES)、当該データ種類に対応するサブクラスおよびサブクラスが有する関係を通知する(ステップS108)。具体的には、データ処理部8はオントロジーデータベース12を参照してデータ種類に対応するサブクラスを特定する。そして、データ関係取得部17は、メタモデルデータベース13を参照し、当該サブクラスが有する関係に関する情報を取得する。最後に、通知部18はユーザや外部の情報処理装置にこれらの情報を通知する。併せてインスタンスが物理世界(PW)またはサイバー世界(CW)のいずれに係るものなのかを通知してもよい。また、通知部18は、データ種類に対応するサブクラスおよびサブクラスが有する関係に関する情報を表示部19aに表示してもよい。必要に応じて、データ種類に対応するスキーマの情報を通知してもよい。
分類定義データ中に同一のデータ種類が定義されていない場合(ステップS107のNO)、データ処理部8は該当するインスタンスが新しいデータ種類に係るものであると判定する。この新しいデータ種類に対応するスキーマの定義(スキーマ定義情報)は、スキーマデータベース11へ追加される(ステップS109)。新しいデータ種類と対応するスキーマの定義を追加する処理は、プログラムなどによって自動的に実行されてもよいし、ユーザが操作部19bを介して行ってもよい。
次に、新しいデータ種類に対応するサブクラスを定義し、サブクラスの定義とサブクラスの有する関係を分類定義データに追加する(ステップS110)。具体的には、オントロジーデータベース12と、メタモデルデータベース13に新しいサブクラスの定義を追加する。ここで、物理世界(PW)クラスまたはサイバー世界(CW)クラスのいずれかのサブクラスが追加される。また、メタモデルのPW関係タイプクラスまたはCW関係タイプクラスにサブクラス間の関係に関する情報を追加する。なお、当該サブクラスが他のサブクラスとの関係を特に有しない場合には、関係に関する情報を追加する処理をスキップしてもよい。ステップS110の処理はプログラムなどによって自動的に実行されてもよいし、ユーザが操作部19bを介して行ってもよい。
そして、インスタンスに対応するサブクラスおよびサブクラスが有する関係を通知する(ステップS111)。ステップS111で実行される処理はステップS108で実行される処理と同様である。ただし、分類定義データに新しいデータ種類、スキーマ、サブクラス、サブクラスが有する関係の定義を追加した場合には、分類定義データが更新された旨を表示部19aに表示したり、ユーザや外部の情報処理装置に通知したりしてもよい。これによって、ユーザや他のシステムはアップデートされた分類定義データを参照することができる。
以降では、データ種類を推定する処理の詳細について説明する。
まず、スキーマとその他のメタデータとの関係について述べる。図8は、階層分類におけるクラス、スキーマ、インスタンスとの関係を示している。図8上段にはクラスの階層分類の例が示されている。センサ機器クラス(クラス42)のスキーマ50は“{コード、種類、値}”と定義されている。また、補助電源システムクラス(クラス46)のスキーマ51は“{コード、定格効率、種類、起動時間}”と停止されている。
図8下段のテーブル52とテーブル53はスキーマとインスタンスの関係を示している。テーブル52の第1行目(塗りつぶされている部分)はスキーマ50に相当する。テーブル52の第2行目および第3行目にはスキーマ50を具体化した実データであるインスタンスの例が示されている。テーブル53の第1行目(塗りつぶされている部分)はスキーマ51に相当する。テーブル53の第2行目にはスキーマ51を具体化した実データであるインスタンスの例が示されている。
なお、クラスの階層分類の詳細については後述する。
次に、図7のステップS104で実行される処理の詳細について説明する。図9は、スキーマに基づきインスタンスのデータ種類を推定する処理の例を示したフローチャートである。
最初に、図9で使われる表記について説明をする。分類定義データにおいてm個のスキーマがスキーマ定義情報として定義されている場合、スキーマの集合ClsをCls=[p、p、p、・・・、p]と表記する。i=1、2、3、・・・、mとすると、各スキーマはp={x、x、x、x}と表記される。ここで、j=1、2、3、4とすると、xはスキーマにおけるそれぞれのデータ項目(item)である。例えば、図8におけるスキーマ51の場合、“コード”、“定格効率”、“種類”、“値”がスキーマにおけるデータ項目(item)に相当する。
データ収集部7が取得する第1データを同様の表記で表現することができる。第1データにn個のスキーマが含まれている場合、スキーマの集合SはS=[s、s、s、・・・、s]と表記する。k=1、2、3、・・・、nとすると、各スキーマはs={y、y、y、y}と表記される。yはスキーマにおけるそれぞれのデータ項目(item)である。なお、第1データには同一のスキーマ(データ種類)に対応する複数のインスタンスが含まれている可能性があるため、sに重複があってもよい。
なお、この例ではスキーマに含まれるデータ項目数が4となっているが、スキーマに含まれるデータ項目数を限定するものではない。
まず、スキーマの集合Sに含まれるそれぞれのスキーマsについて、集合Clsから最も類似しているスキーマpを抽出する(ステップS201)。ステップS201では類似度の計算が行われ、類似度に基づき、最も類似しているスキーマpが選択される。類似度の計算手法の例としては、Simpson係数、WORDNETや、TF-IDFなどがあるが、その他の手法を用いてもよい。なお、ステップS201の計算処理においてしきい値を設定し、類似度がしきい値に満たない場合には、計算結果に対し、同一または対応するスキーマに該当しない蓋然性が高いため、再チェックが必要である旨のラベルを付与してもよい。Simpson係数を使った具体的な処理の例については後述する。
次に、ステップS201で抽出されたスキーマpの集合をClsxと定義する(ステップS202)。集合Clsxはスキーマの集合Clsに対し、Clsx⊆Clsの関係となる。そして、集合Clsxに含まれる各スキーマが集合Sにおける各スキーマに相当していると推定する(ステップS203)。なお、ステップS203において推定されたスキーマの対応関係を表示部19aに表示したり、通知部18からユーザに通知したりしてもよい。推定された結果に再チェックが必要である旨のラベルが付与されていた場合、ユーザは操作部19bを使って結果を修正することができる。また、推定結果と合わせて類似度の値の表示または通知を行ってもよい。
図10は、最も類似しているスキーマを抽出する処理の例を示している。図10には、類似度の計算にSimpson係数が使われた場合の例が示されている。Simpson係数は集合Xと集合Yの共通部分(intersection)の要素数を、集合Xの要素数または集合Yの要素数の小さい方で除算することによって計算される。計算処理では、例えばテーブル54のようなデータ構造を用いることができる。
テーブル54の第1行目(塗りつぶされている部分)は集合Cls(分類定義データで定義されているスキーマの集合)を示している。テーブル54の第1列目(塗りつぶされている部分)は集合S(第1データに含まれているスキーマの集合)を示している。そして、テーブル54のそれぞれのフィールドにはスキーマpとsの組み合わせごとに計算された類似度に相当するSimpson係数の値が格納されている。
図10の例では、類似度のしきい値として、0.9が設定されている。したがって、Simpson係数の値が0.9に満たない場合、再チェックが必要である旨のラベルが付与される。
次に、クラスの階層分類と形式記述を含むオントロジーの例について説明する。図11は、データの階層分類と形式記述を含むオントロジーの例を示している。
図11上段には、クラスの階層分類が示されている。図11の例では、ROOTクラス(クラス40)のサブクラスとして機器クラス(クラス41)、システムクラス(クラス45)、位置クラス(クラス48)が規定されている。機器クラスはサブクラスとして、センサ機器クラス(クラス42)と発電機クラス(クラス43)を有する。発電機クラスはサブクラスとして、火力発電機クラス(クラス44)を有する。また、システムクラスはサブクラスとして補助電源システムクラス(クラス46)と、制御と管理システムクラス(クラス47)を有する。
このように、クラスの階層分類はクラスをノードとする木構造となっている。図11に示されているクラスの名称、クラスの数、木の形状は一例にしか過ぎない。したがって、情報処理装置1はこれとは異なる名称のクラスを使っていてもよいし、これとは異なる数のクラスを定義していてもよい。また、図11の階層分類に係る木の深さは4となっているが、実際の木の深さの値はこれとは異なっていてもよい。分類定義データにクラスを順次追加していくと、図11の例より多くの種類のクラスが定義され、階層分類の深さが4より大きな値となる場合がある。
それぞれのクラスを識別できるようにするため、各クラスにコードを割り当ててもよい。図11の例では、機器クラス(クラス41)にコード“PW_E”が割り当てられている。発電機クラス(クラス43)には、コード“G”が割り当てられている。火力発電機クラス(クラス44)には、コード“GT”が割り当てられている。コード“GT”がコード“G”を含んでいるため、コード“GT”の火力発電機クラスはコード“G”の発電機クラスとサブクラスの関係にあることを推定することができる。
図11下段には、データの形式記述を含むインスタンスの例が示されている。例えば、物理世界(PW)のクラスに属するインスタンスにはプリフィックス(Prefix)として“+”を付与し、サイバー世界(CW)のクラスに属するインスタンスにはプリフィックスとして“=”を付与すると規定したものとする。
テーブル49aに係るインスタンスはそれぞれ温度センサ、流量センサの計測値を示しており、いずれもセンサ機器クラス(コード“B”)に属している。センサ機器クラスは機器クラス(コード“PW_E”)のサブクラスであるため、物理世界(PW)のクラスであることがわかる。テーブル49aの第1列(塗りつぶされている部分)をみると、インスタンスの識別子として “+B001”および“+B002”が使われていることがわかる。これらの識別子は形式記述“+B”にシーケンス番号を結合させた形式となっている。なお、テーブル49aに示されたインスタンスはいずれも図8のスキーマ50を具体化させた実データに相当する。
一方、テーブル49bに係るインスタンスは補助電源システムに関する情報を示しており、補助電源クラスに属している。補助電源クラスはシステムクラス(コード“CW_S”)のサブクラスであるため、サイバー世界(CW)のクラスであることがわかる。テーブル49bの第1列(塗りつぶされている部分)をみると、インスタンスの識別子として“=B0001”が使われている。この識別子は形式記述“=B”にシーケンス番号を結合させた形式となっている。なお、テーブル49bに示されたインスタンスは図8のスキーマ51を具体化させた実データに相当する。
図11に示されたクラスのコードおよび形式記述は例にしか過ぎない。したがって、図11の例とは異なる形式でクラスのコードと形式記述を定義してもよい。クラスのコードと形式記述は、例えば数値、文字、記号またはこれらの組み合わせによって定義されてもよいし、特定のビット列によって定義されていてもよい。
図12は、オントロジーに基づき第1データのデータ種類を推定する処理を示したフローチャートである。図12は、図7のステップS105で実行される処理の詳細な説明となっている。以下では、図12を参照しながら、処理を説明する。
まず、第1データに含まれている形式記述情報(第1形式記述情報)をオントロジーデータベース12で定義されているそれぞれの形式記述(第2形式記述情報)と照合する(ステップS301)。オントロジーデータベース12で形式記述情報と一致する形式記述(第2形式記述情報)が定義されている場合(ステップS302のYES)、第1データに含まれているインスタンスのデータ種類を特定する(ステップS303)。オントロジーデータベース12で形式記述情報と一致する形式記述(第2形式記述情報)が定義されていない場合(ステップS302のNO)、図12の処理は終了し、図7のステップS106の処理が実行される。図11のテーブル49a、49bのインスタンスに対し、図12の処理が適用された場合、照合される形式記述はシーケンス番号を除いた“+B”や“=B”となる。
次に、図7のステップS106で実行される処理の詳細について説明する。ステップS106では類似度に基づいて、データ種類を推定する。類似度に基づくデータ種類の推定処理には、テキストベースの方法(第1の方法)と、機械学習的手法(第2の方法)が存在する。以下では、最初に第1の方法について説明した後、第2の方法について述べる。
図13は、インスタンスの類似度に基づきインスタンスのデータ種類を推定する処理の第1の方法を示すフローチャートである。以下では、図13を参照しながら、処理を説明する。
ここで、図13で使われる表記について説明をする。ログデータベース10に格納されたm個のインスタンスを含む、インスタンスの集合LをL=[a、a、a、・・・、a]と表記する。i=1、2、3、・・・、mとすると、各インスタンスはa={g、g、g、g}と表記される。ここで、j=1、2、3、4とすると、gはインスタンスにおけるそれぞれのデータ項目(item)の値である。例えば、図11におけるテーブル49bのインスタンスの場合、“=B0001”、“3000w”、“直流”、“2min”がインスタンスにおけるデータ項目(item)の値に相当する。
データ収集部7が取得する第1データも同様の表記を使った表現が可能である。第1データにn個のインスタンスが含まれている場合、インスタンスの集合NはN=[b、b、b、・・・、b]と表記する。k=1、2、3、・・・、nとすると、各インスタンスはb={h、h、h、h}と表記される。hはインスタンスにおけるそれぞれのデータ項目(item)の値である。なお、第1データにはデータ種類と値が同一であるインスタンスが含まれている可能性があるため、hに重複があってもよい。
なお、この例ではインスタンスに含まれるデータ項目数が4となっているが、インスタンスに含まれるデータ項目数を限定するものではない。
まず、ログデータベース10に含まれる複数のインスタンスaを抽出し、インスタンスの集合Lとする(ステップS401)。そして、第1データに含まれる各インスタンスbを抽出し、インスタンスの集合Nとする(ステップS402)。次に、集合Lに含まれるそれぞれのインスタンスaと集合Nに含まれるそれぞれのインスタンスbの類似度を計算する(ステップS403)。最後に、集合Lに含まれるインスタンスaのうち、最も類似度の高いものに係るデータ種類を集合Nに含まれる各インスタンスのbのデータ種類であると推定する(ステップS404)。
次に、第1の方法を用いた場合の具体的な処理の例について説明する。図14は、インスタンスの値を用いた類似度の計算の第1の方法を示している。
図14上段には、ログデータベース10に保存されているインスタンスaの具体的な例として、インスタンス60、61が示されている。一方、第1データに含まれているインスタンスbの具体的な例としてインスタンス62、63が示されている。
図14の例では、インスタンスどうしの類似度を求めるためにSimpson係数が計算されている。なお、Simpson係数は類似度を計算する方法の一例にしか過ぎない。例えば、WORDNETや、TF-IDFなど、その他の計算手法を使ってもよい。
図14下段には、Simpson係数の計算結果を格納したテーブル64、65が示されている。テーブル64には、インスタンス60とインスタンス62の組み合わせについてSimpson係数を計算した結果が示されている。一方、テーブル65にはインスタンス61とインスタンス62の組み合わせについてSimpson係数を計算した結果が示されている。類似度にしきい値を設定し、計算された類似度の値がしきい値に満たない場合には、推定されたデータ種類の再確認を求めるフラグが設定されるようにしてもよい。このフラグが設定されている場合、ユーザは推定されたデータ種類をチェックし、必要に応じて結果に対して修正を行うことができる。
次に、インスタンスの類似度を用いる第2の方法について説明する。図15は、インスタンスの類似度に基づきインスタンスのデータ種類を推定する処理の第2の方法を示したフローチャートである。以下では、図15を参照しながら処理を説明する。
ここで、図15で使われる表記について説明をする。ログデータベース10に格納されたm個のインスタンスから文字と記号を除去し、数値のみとしたデータa´の集合L´をL´=[a´、a´、a、・・・、a´]と表記する。i=1、2、3、・・・、mとすると、各データはa´={g´、g´、g´、g´}と表記される。ここで、j=1、2、3、4とすると、g´はデータa´におけるそれぞれのデータ項目(item)の値である。
データ収集部7が取得する第1データも同様の表記を使って表現することができる。第1データに含まれているn個のインスタンスから文字と記号を除去し、数値のみとしたデータb´の集合N´をN´=[b´、b´、b´、・・・、b´]と表記する。k=1、2、3、・・・、nとすると、各データはb´={h´、h´、h´、h´}と表記される。h´はデータb´におけるそれぞれのデータ項目(item)の値である。なお、hの値に重複があってもよい。
なお、この例ではデータb´に含まれるデータ項目数が4となっているが、データb´に含まれるデータ項目数を限定するものではない。
まず、ログデータベース10に格納された各インスタンスから文字と記号を除去した数値のみのデータa´の集合L´を用意する(ステップS501)。次に、第1データに含まれる各インスタンスから文字と記号を除去した数値のみのデータb´の集合N´を用意する(ステップS502)。なお、ステップS501およびステップS502の処理において、インスタンスの識別子(例えば、形式記述+シーケンス番号)については、識別性が損なわれないようにするため、例外的に文字と記号の除去処理をスキップしてもよい。
そして、集合L´に含まれるそれぞれのデータa´と、集合N´に含まれるそれぞれのデータb´の類似度を機械学習的手法によって計算する(ステップS503)。最後に、集合L´に含まれるそれぞれのデータa´のうち、最も類似度の高いものに対応するデータ種類を集合N´に含まれるそれぞれのデータb´に対応するインスタンスのデータ種類であると推定する(ステップS504)。
次に、第2の方法を用いた場合の具体的な処理の例について説明する。図16は、インスタンスの値を用いた類似度の計算の第2の方法を示している。
図16上段には、データa´の例としてデータ66、67が示されている。また、データb´の例としてデータ68が示されている。データ66~68はインスタンスの識別子(形式記述+シーケンス番号)を除く、各データ項目(item)から文字と記号を除去したものである。
機械学習的に類似度を計算する方法の例としては、階層クラスタリング、非階層クラスタリングなどのクラスタリングがある。クラスタの分類に使う距離の例としては、ユークリッド距離、マハラノビス距離、コサイン距離などが挙げられる。クラスタの合併方法の例としては、ウォード法、群平均法、最短距離法、最長距離法などが挙げられるが、どの方法であってもよい。クラスタリング以外には数値の相関を計算する方法などがあるが、手法の種類については特に問わない。
なお、上述では、類似度の計算が最も類似しているスキーマを探索するときに実行される場合(例えば、図9、図10)と、最も類似しているインスタンスを探索するときに実行される場合(例えば、図13~図16)について述べた。以降では、前者の場合に計算される類似度と後者の場合に計算される類似度を区別する必要がある場合には、前者を第1類似度、後者を第2類似度とよぶものとする。
図16の例では、階層クラスタリングが使われており、識別子が“C002”のインスタンスは識別子が“B002”のインスタンスに最も類似しているという判定結果が得られている。
なお、取得した第1データに含まれるインスタンスと、ログデータベースに含まれており、データ種類および分類されるサブクラスが特定されているインスタンスを区別する必要がある場合、前者を第1インスタンスとよび、後者を第2インスタンスとよぶものとする。
図7のフローチャートでは、第1データに含まれているメタデータ(具体的には、スキーマ情報および第1形式記述情報)によって、第1データに含まれているインスタンスのデータ種類の推定で適用される処理が異なっていた。ただし、図7のフローチャートは一例にしか過ぎない。したがって、適用される処理の優先度が必ずステップS104、ステップS105、ステップS106の順でなくてもよい。また、これらの処理が適用される基準が図7の例とは異なっていてもよい。情報処理装置1はデータ種類の推定処理において、ステップS104、ステップS105、ステップS106の処理の一部のみを実行してもよいし、いずれかのステップの処理のみを実行してもよい。
次に、本実施形態に係る情報処理装置が表示する画面の例について説明する。最初に、第1データの分類を推定した結果を示す画面の例について述べる。
図17は、図7のステップS108において、ディスプレイ(表示部19a)に表示される画面の例である。図17の画面は、第1データに含まれるインスタンスの分類(データ種類)の推定結果を示したGUI(Graphical User Interface)の一例である。
図17の画面は、インスタンスとして、火力発電所の“第2ガスタービン入口における燃焼ガス温度”が第1データに含まれていた場合を示している。データ種類の推定処理の結果、当該インスタンスのクラスは“ガスタービン”、スキーマは“温度”であると推定されている。また、“クラス:ガスタービン/スキーマ:温度”に相当するサブクラスは“温度センサ”サブクラスである。“温度センサ”サブクラスは複数の親子関係を経由して、物理世界(PW)クラスのサブクラスとなっている。
さらに、“温度センサ”サブクラスに関連するサブクラスとして、サイバー世界(CW)クラスのサブクラスである、“回転速度設定”サブクラスと、“排気ガス温度設定”サブクラスが示されている。図17の画面を参照すると、推定処理において類似度が使われており、類似度の値がしきい値以上であったことがわかる。したがって、図17の例では、ユーザに推定結果の確認を求めるメッセージは表示されていない。
図17の画面下部には、ボタン90、91が配置されている。ユーザはボタン90をクリックすると、図17の画面に示された推定結果を修正することができる。推定結果を修正する画面の例としては、後に説明する図18が挙げられる。また、ユーザはボタン91をクリックすると、図17の画面に示された推定結果が、ログデータベース10に保存される。
図18は、分類定義データの編集画面の例を示している。
図18は、分類定義データの編集を行うためのGUIの一例である。図18の画面では、クラスの追加、クラスの削除、クラスの編集の操作が行われる。クラスの追加または編集を行うときには、あわせて物理世界(PW)クラスとサイバー世界(CW)クラスの切り替え、クラスの記号の設定、対応するスキーマの定義、対応するデータ種類名の入力などの操作を行うことが可能である。また、画面左上のボックスにはクラスの階層分類が表示されているため、ユーザは分類定義データの構成を確認しながら、編集の作業を進めることができる。
図18の画面は、例えば、取得した第1データに含まれるインスタンスのデータ種類およびデータ種類の分類される前記サブクラスが分類定義データに定義されていないデータ種類およびサブクラスであると推定される場合に表示される。ただし、これとは異なるタイミングに図18の画面を表示してもよい。
なお、図17、図18の画面はGUIであるが、コマンドライン上(CLI)で分類定義データの編集が行われるようになっていてもよい。また、図18の画面が提供する機能を実現するためのAPIを提供し、APIを利用する外部のプログラムなどが分類定義データの編集操作を行ってもよい。すなわち、本実施形態に係る情報処理装置が生成する画面の種類や内容については特に限定しない。
また、図18の画面が表示される装置については特に問わない。例えば、情報処理装置1に内蔵されたディスプレイに画面が表示されてもよいし、リモートにあるパソコン、スマートフォン、タブレットなどの情報通信端末に当該画面が表示されていてもよい。
本実施形態に係る情報処理装置および情報処理方法では、物理世界のデータとサイバー世界のデータにおける違いをサブクラスの定義に反映させている。これにより、収集されるデータのソース、性質、データ間の関連性に関する情報を取得し、多数のセンサ、複数のプロセスに係る装置やシステムや装置から収集されるデータを正しく分類することが可能となる。
多数のソースから収集されたデータを正しく分類し、データのクラスやクラス間の関係に関する情報を得ることによって、複数のシステム間における横断的なデータの利用が容易となる。これにより、複数のプロセスに係るデータを有効に活用し、各種のインフラ、工場、プラントなどの設備のオペレーションの自動化、オペレーションの全体最適化や統一化を行うことができる。オペレーション面の改善によって、各種コストの削減、安全性の向上、生産品の高品質化などが実現される。
(第2の実施形態)
第2の実施形態では、情報処理装置のハードウェア構成について説明する。情報処理装置は、例えばコンピュータ100により構成される。コンピュータ100には、サーバ、クライアント端末、組み込み機器のマイコン、タブレット、スマートフォン、フィーチャーフォン、パソコンなどの各種の情報処理装置が含まれる。コンピュータ100は、仮想計算機(VM:Virtual Machine)やコンテナなどによって実現されていてもよい。
図19は、コンピュータ100の一例を示す図である。図19のコンピュータ100は、プロセッサ101と、入力装置102と、表示装置103と、通信装置104と、記憶装置105とを備える。プロセッサ101、入力装置102、表示装置103、通信装置104、記憶装置105は、バス106により相互に接続されている。
プロセッサ101は、コンピュータ100の制御装置と演算装置を含む電子回路である。プロセッサ101として、例えば、汎用目的プロセッサ、中央処理装置(CPU)、マイクロプロセッサ、デジタル信号プロセッサ(DSP)、コントローラ、マイクロコントローラ、状態マシン、特定用途向け集積回路、フィールドプログラマブルゲートアレイ(FPGA)、プログラム可能論理回路(PLD)またはこれらの組合せを用いることができる。
プロセッサ101は、バス106を介して接続された各装置(例えば、入力装置102、通信装置104、記憶装置105)から入力されたデータやプログラムに基づいて演算処理を行い、演算結果や制御信号を、バス106を介して接続された各装置(例えば、表示装置103、通信装置104、記憶装置105)に出力する。具体的には、プロセッサ101は、コンピュータ100のOS(オペレーティングシステム)や、プログラムなどを実行し、コンピュータ100に含まれるそれぞれの装置を制御する。
プログラムに、コンピュータ100に、第1の実施形態における情報処理装置1の各構成要素に係る処理を実装することができる。プログラムは、一時的でない有形のコンピュータ読み取り可能な記憶媒体に記憶される。上記の記憶媒体は、例えば、光ディスク、光磁気ディスク、磁気ディスク、磁気テープ、フラッシュメモリ、半導体メモリであるが、これに限られない。プロセッサ101がプログラムを実行することによって、コンピュータ100は第1の実施形態で述べた各種の機能を提供することができる。
入力装置102は、コンピュータ100に情報を入力するための装置である。入力装置102は、例えば、キーボード、マウス、タッチパネルなどであるが、これに限られない。ユーザは、入力装置102を用いることにより、メタモデル、クラスの階層分類、クラスのコード、スキーマの定義、データ種類の名称などを入力することができる。
表示装置103は、画像や映像を表示するための装置である。表示装置103は、例えば、LCD(液晶ディスプレイ)、CRT(ブラウン管)、有機EL(有機エレクトロルミネッセンス)ディスプレイ、プロジェクタ、LEDディスプレイなどであるが、これに限られない。表示装置103には、第1データに含まれるインスタンスのデータ種類を推定した結果や、分類定義データの編集画面などが表示される。
通信装置104は、コンピュータ100が外部装置と無線または有線で通信するために使用する装置である。通信装置104は、例えば、NIC(Network Interface Card)、通信モジュール、モデム、ハブ、ルータなどであるが、これに限られない。コンピュータ100は、通信装置104を介して、遠隔地のプラント、工場、施設の計測データや設定データなどを収集してもよい。また、コンピュータ100(情報処理装置1)がデータセンターやマシン室に設置されたサーバなどである場合、コンピュータ100は通信装置104を介して、リモートの情報通信端末から送信された指令を受け付けたり、画面表示の内容をリモートの情報通信端末に表示させたりしてもよい。
記憶装置105は、コンピュータ100のOSや、プログラム、プログラムの実行に必要なデータ、プログラムの実行により生成されたデータなどを記憶する記憶媒体である。記憶装置105には、主記憶装置と外部記憶装置が含まれる。主記憶装置は、例えば、RAM、DRAM、SRAMであるが、これに限られない。また、外部記憶装置は、例えば、ハードディスク、光ディスク、フラッシュメモリ、磁気テープなどであるが、これに限られない。上述のログデータベース10、スキーマデータベース11、オントロジーデータべース12、メタモデルデータベース13は、記憶装置105上に構築されてもよいし、外部のサーバやストレージ上に構築されてもよい。
なお、コンピュータ100は、プロセッサ101、入力装置102、表示装置103、通信装置104、記憶装置105を、それぞれ1つずつまたは複数備えてもよい。また、コンピュータ100にプリンタやスキャナなどの周辺機器が接続されていてもよい。
また、情報処理装置は、単一のコンピュータ100により構成されてもよいし、複数のコンピュータ100が相互に接続された情報システムによって構成されていてもよい。
さらに、プログラムは、コンピュータ100の記憶装置105に予め記憶されていてもよいし、コンピュータ100の外部の記憶媒体に記憶されていてもよいし、インターネット上にアップロードされていてもよい。いずれの場合にも、プログラムをコンピュータ100にインストールして実行することにより、第1の実施形態に係る情報処理装置の機能を実現することができる。
なお、本発明は上記各実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記各実施形態に開示されている複数の構成要素を適宜組み合わせることによって種々の発明を形成できる。また例えば、各実施形態に示される全構成要素からいくつかの構成要素を削除した構成も考えられる。さらに、異なる実施形態に記載した構成要素を適宜組み合わせてもよい。
1 情報処理装置
2 ネットワーク
3 センサシステム
4 制御システム
5 管理システム
6 記憶装置
6a 未分類DB
7 データ収集部
8 データ処理部
9 記憶部
10 ログDB
11 スキーマDB
12 オントロジーDB
13 メタモデルDB
14 スキーマ更新部
15 オントロジー更新部
16 メタモデル更新部
17 データ関係取得部
18 通知部
19a 表示部
19b 操作部
20 メタモデル
21、22、23、24、25、26、27、28、29、30、31、40、41、42、43、44、45、46,47、48 クラス
32 アソシエーション(Association)
49a、49b、52、53、54、64、65 テーブル
50、51 スキーマ
60、61 行
62、63 インスタンス
66、67、68 データ
70、71、71a 参照(reference)
72、73 対応関係
80、81、82、83、84 第1データ
90、91 ボタン
100 コンピュータ
101 プロセッサ
102 入力装置
103 表示装置
104 通信装置
105 記憶装置

Claims (15)

  1. 複数のデータ項目の値の組み合わせであるインスタンスを物理的な実体に基づいて定義される第1のクラスまたは概念的に定義される第2のクラスのいずれかのサブクラスに分類する情報処理方法であって、
    取得された前記インスタンスを含む第1データの集合に含まれているインスタンスのデータ種類が特定されているログデータ、ログデータベース、及び前記データ種類の前記サブクラスを定義する分類定義データの少なくともいずれかを参照し、前記インスタンスの分類される前記サブクラスを推定するステップと、
    前記分類定義データに定義されている前記サブクラス間の関係を参照し、前記データ種類の分類される前記サブクラスが他の前記サブクラスとの間に有する関係を特定するステップと、
    をコンピュータが実行する情報処理方法。
  2. 前記インスタンスを含む前記第1データを取得して記憶装置に保存するステップを備え、
    前記記憶装置に保存された前記第1データに基づいて、前記サブクラスを推定する、請求項1に記載の情報処理方法。
  3. 前記第1データが前記インスタンスの形式を規定したスキーマ情報を含む場合には、前記スキーマ情報と、前記データ種類ごとに前記インスタンスの形式を定義しているスキーマ定義情報との間の第1類似度を計算し、前記第1類似度が最も高い前記スキーマ定義情報に対応する前記データ種類を、前記第1データに含まれる前記インスタンスの前記データ種類であると推定する、
    請求項1または2に記載の情報処理方法。
  4. 前記第1類似度が最も高い前記スキーマ定義情報における前記第1類似度がしきい値に満たない場合には、ユーザに対し、前記第1データに含まれる前記インスタンスの前記データ種類および前記データ種類の分類される前記サブクラスの推定結果の確認を求めるメッセージを通知する、
    請求項3に記載の情報処理方法。
  5. 前記第1データが前記サブクラスの識別子である、第1形式記述情報を含む場合には、前記第1形式記述情報と、前記分類定義データに含まれている前記サブクラスの識別子である、第2形式記述情報とを照合し、前記第1形式記述情報と前記第2形式記述情報が一致している場合には、前記第1データに含まれる前記インスタンスの前記データ種類の分類される前記サブクラスが、前記第1形式記述情報の特定する前記サブクラスであると推定する、
    請求項1ないし4のいずれか一項に記載の情報処理方法。
  6. 取得した前記第1データに含まれる前記インスタンスである第1インスタンスと、前記ログデータベースに含まれており、前記データ種類および前記データ種類の分類される前記サブクラスが特定されている前記インスタンスである第2インスタンスとの間の第2類似度を計算し、前記第2類似度が最も高い前記第2インスタンスに対応する前記データ種類を、前記第1インスタンスの前記データ種類であると推定する、
    請求項1ないし5のいずれか一項に記載の情報処理方法。
  7. 前記第1データが前記インスタンスの形式を規定したスキーマ情報を含まないが、前記サブクラスの識別子である、第1形式記述情報を含む場合には、前記第1形式記述情報と、前記分類定義データに含まれている前記サブクラスの識別子である、第2形式記述情報とを照合し、前記第1形式記述情報と前記第2形式記述情報が一致している場合には、前記第1データに含まれる前記インスタンスの前記データ種類の分類される前記サブクラスが、前記第1形式記述情報の特定する前記サブクラスであると推定する、
    請求項1または2に記載の情報処理方法。
  8. 前記第1データが前記インスタンスの形式を規定したスキーマ情報も、前記インスタンスに対応する前記サブクラスの識別子である、第1形式記述情報のいずれも含まない場合に、取得した前記第1データに含まれる前記インスタンスである第1インスタンスと、前記ログデータベースに含まれており、前記データ種類および分類される前記サブクラスが特定されている前記インスタンスである第2インスタンスとの間の第2類似度を計算し、前記第2類似度が最も高い前記第2インスタンスに対応する前記データ種類を、前記第1インスタンスの前記データ種類であると推定する、
    請求項1または2に記載の情報処理方法。
  9. 取得した前記第1データに含まれる前記インスタンスの前記データ種類および前記データ種類の分類される前記サブクラスが前記分類定義データに定義されていない前記データ種類および前記サブクラスであると推定される場合には、前記分類定義データに新しい前記データ種類の定義、新しい前記データ種類に対応する前記インスタンスの形式の定義、新しい前記データ種類の分類される前記サブクラスの定義を追加するステップを含む、
    請求項1ないし8のいずれか一項に記載の情報処理方法。
  10. 新しい前記データ種類の分類される前記サブクラスが他の前記サブクラスと関係を有する場合には、新しい前記データ種類の分類される前記サブクラスが有する他の前記サブクラスとの関係に係る情報を前記分類定義データに追加する、
    請求項9に記載の情報処理方法。
  11. 取得した前記第1データに含まれる前記インスタンスの前記データ種類および前記データ種類の分類される前記サブクラスが前記分類定義データに定義されていない前記データ種類および前記サブクラスであると推定される場合に、ユーザが前記分類定義データを編集する画面を生成するステップを含む、
    請求項1ないし10のいずれか一項に記載の情報処理方法。
  12. 複数のデータ項目の値の組み合わせであるインスタンスを物理的な実体に基づいて定義される第1のクラスまたは概念的に定義される第2のクラスのいずれかのサブクラスに分類するプログラムであって、
    取得された前記インスタンスを含む第1データの集合に含まれているインスタンスのデータ種類が特定されているログデータ、ログデータベース、及び前記データ種類の前記サブクラスを定義する分類定義データの少なくともいずれかを参照し、前記データ種類の分類される前記サブクラスが他の前記サブクラスとの間に有する関係を特定するステップと、
    前記第1データに含まれる前記インスタンスについて、推定された前記データ種類、前記データ種類の分類される前記サブクラス、前記サブクラスが他の前記サブクラスとの間に有する関係をディスプレイに表示するステップと、
    をコンピュータに実行させるプログラム。
  13. 前記インスタンスを含む前記第1データを取得して記憶装置に保存するステップをさらにコンピュータに実行させ、
    前記記憶装置に保存された前記第1データに基づいて、前記サブクラスを推定する、請求項12に記載のプログラム。
  14. 複数のデータ項目の値の組み合わせであるインスタンスを物理的な実体に基づいて定義される第1のクラスまたは概念的に定義される第2のクラスのいずれかのサブクラスに分類する情報処理装置であって、
    取得された前記インスタンスを含む第1データの集合に含まれているインスタンスのデータ種類が特定されているログデータ、ログデータベース、及び前記インスタンスのデータ種類に対応する前記サブクラスを定義する分類定義データの少なくともいずれかを参照し、前記インスタンスの前記データ種類および前記データ種類の分類される前記サブクラスを推定するデータ処理部と、を備え、
    前記分類定義データを参照し、前記データ種類の分類される前記サブクラスが他の前記サブクラスとの間に有する関係を特定する、
    情報処理装置。
  15. 前記インスタンスを含む前記第1データを取得して保存する記憶装置を備え、
    前記データ処理部は、前記記憶装置に保存された前記第1データに基づいて、前記サブクラスを推定する、請求項14に記載の情報処理装置。
JP2018092431A 2018-05-11 2018-05-11 情報処理方法、プログラムおよび情報処理装置 Active JP7029347B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2018092431A JP7029347B2 (ja) 2018-05-11 2018-05-11 情報処理方法、プログラムおよび情報処理装置
EP19160496.6A EP3567492A1 (en) 2018-05-11 2019-03-04 Information processing method, non-transitory storage medium and information processing device
US16/297,828 US11934963B2 (en) 2018-05-11 2019-03-11 Information processing method, non-transitory storage medium and information processing device
CN201910195680.XA CN110471373B (zh) 2018-05-11 2019-03-15 信息处理方法、程序和信息处理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018092431A JP7029347B2 (ja) 2018-05-11 2018-05-11 情報処理方法、プログラムおよび情報処理装置

Publications (2)

Publication Number Publication Date
JP2019197495A JP2019197495A (ja) 2019-11-14
JP7029347B2 true JP7029347B2 (ja) 2022-03-03

Family

ID=65686716

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018092431A Active JP7029347B2 (ja) 2018-05-11 2018-05-11 情報処理方法、プログラムおよび情報処理装置

Country Status (4)

Country Link
US (1) US11934963B2 (ja)
EP (1) EP3567492A1 (ja)
JP (1) JP7029347B2 (ja)
CN (1) CN110471373B (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005513673A (ja) 2001-12-28 2005-05-12 トムソン ライセンシング ソシエテ アノニム データタイプ依存型処理のためにデータタイプを自動検知する方法及び機器
WO2011145374A1 (ja) 2010-05-17 2011-11-24 株式会社日立製作所 計算機システム、及び、規則生成方法
JP2014509004A (ja) 2011-02-07 2014-04-10 インテル・コーポレーション 新たな画像及びその情報を画像データベースに書き込むための方法、システム、及びプログラム
JP2014229016A (ja) 2013-05-21 2014-12-08 株式会社東芝 データ処理装置、方法およびプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5043735B2 (ja) * 2008-03-28 2012-10-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報分類システム、情報処理装置、情報分類方法およびプログラム
JP5514320B2 (ja) * 2010-09-14 2014-06-04 株式会社東芝 知的電力網のオントロジー更新装置
US9076152B2 (en) * 2010-10-20 2015-07-07 Microsoft Technology Licensing, Llc Semantic analysis of information
WO2013137903A1 (en) * 2012-03-16 2013-09-19 Orbis Technologies, Inc. Systems and methods for semantic inference and reasoning
US11625424B2 (en) * 2014-04-24 2023-04-11 Semantic Technologies Pty Ltd. Ontology aligner method, semantic matching method and apparatus
US20150347467A1 (en) * 2014-05-27 2015-12-03 International Business Machines Corporation Dynamic creation of domain specific corpora
US20160224645A1 (en) 2015-02-03 2016-08-04 Siemens Aktiengesellschaft System and method for ontology-based data integration
WO2016145480A1 (en) * 2015-03-19 2016-09-22 Semantic Technologies Pty Ltd Semantic knowledge base
US20160335544A1 (en) 2015-05-12 2016-11-17 Claudia Bretschneider Method and Apparatus for Generating a Knowledge Data Model
JP6594981B2 (ja) * 2015-07-13 2019-10-23 帝人株式会社 情報処理装置、情報処理方法およびコンピュータプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005513673A (ja) 2001-12-28 2005-05-12 トムソン ライセンシング ソシエテ アノニム データタイプ依存型処理のためにデータタイプを自動検知する方法及び機器
WO2011145374A1 (ja) 2010-05-17 2011-11-24 株式会社日立製作所 計算機システム、及び、規則生成方法
JP2014509004A (ja) 2011-02-07 2014-04-10 インテル・コーポレーション 新たな画像及びその情報を画像データベースに書き込むための方法、システム、及びプログラム
JP2014229016A (ja) 2013-05-21 2014-12-08 株式会社東芝 データ処理装置、方法およびプログラム

Also Published As

Publication number Publication date
CN110471373A (zh) 2019-11-19
US20190347561A1 (en) 2019-11-14
CN110471373B (zh) 2023-03-07
US11934963B2 (en) 2024-03-19
JP2019197495A (ja) 2019-11-14
EP3567492A1 (en) 2019-11-13

Similar Documents

Publication Publication Date Title
US10237295B2 (en) Automated event ID field analysis on heterogeneous logs
US11703826B1 (en) Monitoring asset hierarchies based on asset group metrics
CN108628929B (zh) 用于智能存档和分析的方法和装置
US11768875B2 (en) Monitoring system control interface for asset tree determination
US8782597B2 (en) Ontology updating apparatus, method and system
US8494996B2 (en) Creation and revision of network object graph topology for a network performance management system
CN110869920B (zh) 多维工业知识图形
US10902381B2 (en) Methods and systems for providing improved data access framework
US8626835B1 (en) Social identity clustering
Yamamoto et al. Using cloud technologies for large-scale house data in smart city
CN102291247A (zh) 告警关联图生成方法、装置及关联告警确定方法、装置
US20190005151A1 (en) Tag mapping process and pluggable framework for generating algorithm ensemble
CN105786950A (zh) 一种处理数据的方法及装置
CN106407075A (zh) 一种用于大数据平台的管理方法及系统
CN109582809A (zh) 一种基于数据库的三维模型管理系统及方法
US10163060B2 (en) Hierarchical probability model generation system, hierarchical probability model generation method, and program
CN110674231A (zh) 一种面向数据湖的用户id集成方法和系统
US10747941B2 (en) Tag mapping process and pluggable framework for generating algorithm ensemble
JP7029347B2 (ja) 情報処理方法、プログラムおよび情報処理装置
CN114556238A (zh) 用于在云计算环境中生成资产信息的数字表示的方法和系统
CN111737258B (zh) 表现、记录和自动生成产品设计方案的方法及装置
JP7381290B2 (ja) 計算機システム及びデータの管理方法
US11385954B2 (en) Graphical management of big data pipelines
CN104933623A (zh) 机械非标零部件设计服务平台
CN115599657B (zh) 软件设施异常判断方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200625

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210430

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210511

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210712

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220218

R151 Written notification of patent or utility model registration

Ref document number: 7029347

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151