JP2014215902A - データ名称抽出装置及びプログラム - Google Patents

データ名称抽出装置及びプログラム Download PDF

Info

Publication number
JP2014215902A
JP2014215902A JP2013094260A JP2013094260A JP2014215902A JP 2014215902 A JP2014215902 A JP 2014215902A JP 2013094260 A JP2013094260 A JP 2013094260A JP 2013094260 A JP2013094260 A JP 2013094260A JP 2014215902 A JP2014215902 A JP 2014215902A
Authority
JP
Japan
Prior art keywords
category
data name
data
type
terms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013094260A
Other languages
English (en)
Other versions
JP5940018B2 (ja
Inventor
米山 純一
Junichi Yoneyama
純一 米山
北上 眞二
Shinji Kitagami
眞二 北上
剛維 木村
Taketsuna Kimura
剛維 木村
誠 今村
Makoto Imamura
誠 今村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Mitsubishi Electric Building Solutions Corp
Original Assignee
Mitsubishi Electric Corp
Mitsubishi Electric Building Techno Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp, Mitsubishi Electric Building Techno Service Co Ltd filed Critical Mitsubishi Electric Corp
Priority to JP2013094260A priority Critical patent/JP5940018B2/ja
Publication of JP2014215902A publication Critical patent/JP2014215902A/ja
Application granted granted Critical
Publication of JP5940018B2 publication Critical patent/JP5940018B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • G06F17/30

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】複数のデータ名称から、分析対象のデータに付与されたデータ名称を正確に抽出することが可能なデータ名称抽出装置を提供する。
【解決手段】カテゴリ付与部14は、機器の種別に関する機器種別用語、センサーの出力値に関する信号種別用語及び機器の設置場所に関する設置場所用語を含んで構成され、複数のセンサーのそれぞれの出力値に付与されたデータ名称を取得し、カテゴリ辞書に基づき、各データ名称の機器種別用語、信号種別用語及び設置場所用語にカテゴリを付与する。抽出部18は、センサーの出力値を同一の分析対象とするためのカテゴリの組み合わせを定義するデータ名称組パターン130を取得し、カテゴリが付与された複数のデータ名称から、当該定義されているカテゴリと同一のカテゴリが付与されたデータ名称を抽出する。
【選択図】図2

Description

本発明は、複数のデータ名称情報から特定のデータ名称情報を抽出するデータ名称抽出装置及びプログラムに関する。
ビルやプラント等の建物には照明や空調器等の様々な機器が設置されており、それら機器に関するデータを取得し、当該データに基づいて機器の診断や省エネ向けの分析等を行う場合がある。例えば、設定温度、実測温度、空調状態、電圧値、電流値、圧力値等が、当該データに該当する。
機器に関するデータには、そのデータを識別するためのデータ名称が付与されている。例えば、機器が設置されている場所に関する用語、データの種別に関する用語、機器の種別に関する用語等が、データ名称として用いられることがある。このようなデータ名称は、建物の利用者が任意に作成することがあり、必ずしも、機器診断や分析等を行う分析者が作成するとは限らない。従って、同種の機器に関するデータや、同種のデータであっても、建物ごとにデータ名称が異なって作成される場合がある。例えば、温度を示すデータであったとしても、データ名称に「温度」と付与する場合もあれば、「Temp」等と付与する場合もある。このように、データ名称が建物によって異なる状況下で、分析者は、データに付与されたデータ名称を参照し、データ名称の意味を考慮しながら分析対象のデータの名称を選択し、選択したデータ名称が付与されたデータを抽出して分析や診断等を行う必要がある。
データ名称を自動的に分類する装置として、特許文献1には、データ名称を構成する用語の種別を辞書によって判定し、判定された用語の種別を用いて重要度の高い用語のみを抽出し、抽出された重要度の高い用語に基づき類似のデータ名称を分類する装置が開示されている。
特開平6−231188号公報
上記のように、同種の機器に関するデータや同種のデータであっても、異なるデータ名称が作成される場合があるため、分析者は、データ名称の意味を考慮しながら分析対象のデータの名称を選択する必要があった。従来、この選択作業は分析者が手動で行う必要があり、また、データ名称(データ項目)の数が数千から数万になる場合もあるため、そのような膨大な数のデータ名称から所望のデータ名称を選択して分類することは容易ではなく、分析者に過大な負担を課すことになる。また、分析対象となるデータの抽出にも多大な時間を要することになる。
また、機器に関するデータの名称は、温度や圧力等のデータの種別、機器の種別、設置場所等によって、その意味が大きく異なるため、重要度の高い用語が似ているからといって、データ名称が類似しているとは限らない。従って、上記の特許文献1に記載された発明のように重要度の高い用語に基づきデータ名称を分類したとしても、分析対象のデータに付与されたデータ名称を正確に分類できるとは限らず、データ分類の誤りが多くなるおそれがある。
本発明の目的は、複数のデータ名称から、分析対象のデータに付与されたデータ名称を正確に抽出することが可能なデータ名称抽出装置及びプログラムを提供することである。
請求項1に係る発明は、センサーの検出対象となる機器の種別に関する機器種別用語、センサーの出力値の種別に関する信号種別用語及び機器が設置されている場所に関する設置場所用語を含んで構成され、複数のセンサーのそれぞれの出力値に関連付けられているデータ名称情報を取得し、各データ名称情報の機器種別用語のうち互いに同義語となる機器種別用語に同一の機器種別カテゴリを付与し、各データ名称情報の信号種別用語のうち互いに同義語となる信号種別用語に同一の信号種別カテゴリを付与し、各データ名称情報の設置場所用語のうち互いに同義語となる設置場所用語に同一の設置場所カテゴリを付与するカテゴリ付与手段と、複数のセンサーの出力値を同一の分析対象とするための機器種別カテゴリ、信号種別カテゴリ及び設置場所カテゴリの組み合わせを定義する分析対象情報を取得し、カテゴリ付与手段によってカテゴリが付与された複数のデータ名称情報から、分析対象情報によって定義されているカテゴリと同一のカテゴリが付与されたデータ名称情報を抽出する抽出手段と、を有することを特徴とするデータ名称抽出装置である。
請求項2に係る発明は、請求項1に記載のデータ名称抽出装置であって、分析対象情報は、機器種別カテゴリ及び設置場所カテゴリが互いに共通し、信号種別カテゴリが互いに異なる複数の組み合わせを定義し、抽出手段は、機器種別カテゴリ及び設置場所カテゴリが互いに共通し、信号種別カテゴリが互いに異なる複数のデータ名称情報を抽出し、抽出した複数のデータ名称情報のうち、設置場所用語が示す場所が同一であるデータ名称情報を同一の組に分類する、ことを特徴とする。
請求項3に係る発明は、請求項1又は請求項2に記載のデータ名称抽出装置であって、抽出手段は、分析対象情報によって定義されている機器種別カテゴリ、信号種別カテゴリ及び設置場所カテゴリのすべてのカテゴリと同一のカテゴリが付与されたデータ名称情報が複数のデータ名称情報内に存在しない場合、分析対象情報によって定義されている機器種別カテゴリ、信号種別カテゴリ及び設置場所カテゴリのうちの一部のカテゴリと同一のカテゴリが付与されたデータ名称情報を複数のデータ名称情報から抽出する、ことを特徴とする。
請求項4に係る発明は、請求項1から請求項3のいずれか一項に記載のデータ名称抽出装置であって、抽出手段は、センサーの出力値の単位に基づき出力値の種別を特定し、特定した種別に対応する信号種別カテゴリに基づきデータ名称情報の抽出を行う、ことを特徴とする。
請求項5に係る発明は、請求項1から請求項3のいずれか一項に記載のデータ名称抽出装置であって、抽出手段は、センサーの出力値に基づき出力値の種別を特定し、特定した種別に対応する信号種別カテゴリに基づきデータ名称情報の抽出を行う、ことを特徴とする。
請求項6に係る発明は、コンピュータに、センサーの検出対象となる機器の種別に関する機器種別用語、センサーの出力値の種別に関する信号種別用語及び機器が設置されている場所に関する設置場所用語を含んで構成され、複数のセンサーのそれぞれの出力値に関連付けられているデータ名称情報を取得し、各データ名称情報の機器種別用語のうち互いに同義語となる機器種別用語に同一の機器種別カテゴリを付与し、各データ名称情報の信号種別用語のうち互いに同義語となる信号種別用語に同一の信号種別カテゴリを付与し、各データ名称情報の設置場所情報のうち互いに同義語となる設置場所用語に同一の設置場所カテゴリを付与するステップと、複数のセンサーの出力値を同一の分析対象とするための機器種別カテゴリ、信号種別カテゴリ及び設置場所カテゴリの組み合わせを定義する分析対象情報を取得し、カテゴリが付与された複数のデータ名称情報から、分析対象情報によって定義されているカテゴリと同一のカテゴリが付与されたデータ名称情報を抽出するステップと、を実行させることを特徴とするプログラムである。
本発明によると、データ名称情報にカテゴリを付与し、同一の分析対象とすべきデータの名称の組み合わせをカテゴリによって定義した分析対象情報を用いることで、分析対象のデータに付与されたデータ名称を正確に抽出ことが可能となる。本発明によると、用語の類似性のみでは分類することができないデータ名称を分類することが可能となる。
本発明の実施形態に係るデータ分析システムの一例を示すブロック図である。 本発明の実施形態に係るデータ名称抽出装置の一例を示すブロック図である。 データ名称リストの一例を示す図である。 分割済みデータ名称リストの一例を示す図である。 カテゴリ辞書の一例を示す図である。 カテゴリ付きデータ名称リストの一例を示す図である。 データ名称組パターンの一例を示す図である。 抽出されたデータ名称組の一例を示す図である。 変形例1に係るデータ名称リストの一例を示す図である。 変形例1に係る抽出されたデータ名称組の一例を示す図である。 データの単位及び値の一例を示す図である。
[データ分析システムの全体構成]
まず、本発明の実施形態に係るデータ名称抽出装置が用いられるデータ分析システムの全体構成を説明する。図1にデータ分析システムの一例を示す。本実施形態に係るデータ分析システムは、建物200に設置されている各種機器に関するデータを取得し、データに付与されているデータ名称に基づき分析対象のデータを抽出し、抽出されたデータに基づき分析や診断等を行う。なお、図1には1つの建物200のみが図示されているが、複数の建物200からデータを取得して分析や診断等を行ってもよい。
建物200は、例えばオフィスビルやプラント等である。建物200には、空調機202、照明204及び受変電設備206等の各種機器が設置されている。建物200に設置されている機器には、各種のデータを検出する各種のセンサーが設置されており、センサーによって検出されたデータは、ネットワーク等の通信経路Nを介してデータ収集装置210に送信される。データには、当該データを識別するためのデータ名称が関連付けられている。このデータ名称は、例えば、建物200の利用者によって作成される。
データ収集装置210によって収集された各種のデータは、データ管理システム220の記憶装置222に記憶される。また、データに関連付けられたデータ名称はリスト化され、データ名称リスト100としてデータ管理システム220に記憶される。
データ名称抽出装置10は、データ管理システム220に記憶されているデータ名称リスト100から、分析対象となるデータに付与されたデータ名称の組(分析対象データ名称組140)を抽出する。
データ抽出装置230は、データ名称抽出装置10によって抽出されたデータ名称が付与されたデータを分析対象データ240として、データ管理システム220の記憶装置222から抽出する。分析装置250は、この分析対象データ240に基づき、分析対象の機器の診断や分析等を行う。
[データ名称抽出装置10]
次に、図2を参照して、本実施形態に係るデータ名称抽出装置10を説明する。データ名称抽出装置10は、形態素解析部12、カテゴリ付与部14、カテゴリ記憶部16及び抽出部18を含む。
形態素解析部12は、データ管理システム220からデータ名称リスト100を取得し、データ名称リスト100に含まれる各データ名称を各用語に区分けし、分割されたデータ名称のリストである分割済みデータ名称リスト110を作成する。自然言語処理に関する従来技術(例えば、MeCab等の形態素解析ソフトウェア)を用いることで、区分け処理を行うことができる。
図3に、データ名称リスト100の一例を示す。データ名称リスト100は、例えば、(1)〜(19)のデータ名称を含んでいる。これらのデータ名称はデータ名称リスト100の一部であってもよいし、全部であってもよい。例えば、データ名称リスト100には、数千から数万のデータ名称が含まれていることがある。なお、(1)〜(19)の番号は説明の便宜上図示されたものであり、各データ名称には、当該番号は付与されていないものとする。各データ名称は、例えば、センサーの検出対象となる機器の種別に関する機器種別用語、センサーの出力信号の種別に関する信号種別用語及び機器が設置されている場所に関する設置場所用語を含んで構成されている。機器種別用語としては、例えば「空調機」や「照明」等が該当し、信号種別用語としては、例えば「温度」、「湿度」、「圧力」等の物理量が該当し、設置場所用語としては、例えば「B1F」、「2F」、[1階]等が該当する。例えば、データ名称(1)は「B1F系統空調機 SA温度計測」であり、このデータ名称は、B1F(地下1階)に設置されている空調機の給気(SA)の温度を計測するセンサーから出力されたデータの名称であることを示している。これらのデータ名称は、建物200の利用者によって作成される場合があるため、建物200ごとにデータ名称を作成するルールが異なることがある。従って、同じ意味のデータであっても、データ名称に異なる用語が使用されたり、用語の並び順が異なったりする場合がある。例えば、異なる用語が使用される場合として、(1)のデータ名称「B1F系統空調機 SA温度計測」が「地下1階系統空調機 SA温度計測」と作成されることが考えられ、用語の並び順が異なる場合として、「SA温度計測 B1F系統空調機」と作成される場合が考えられる。
図4に、分割済みデータ名称リスト110の一例を示す。例えばデータ名称(1)は、「B1F/系統空調機/SA/温度/計測」のように、各用語で分割されている。他のデータ名称も同様にして、各用語で分割されている。
カテゴリ付与部14は、カテゴリ記憶部16に記憶されているカテゴリ辞書を参照することで、分割済みデータ名称に含まれる各用語に、信号種別に関するカテゴリ(信号種別カテゴリ)、機器種別に関するカテゴリ(機器種別カテゴリ)又は設置場所に関するカテゴリ(設置場所カテゴリ)を付与し、カテゴリ付きデータ名称リスト120を作成する。例えば、カテゴリ付与部14は、各データ名称の信号種別用語のうち互いに同義語となる信号種別用語に同一の信号種別カテゴリを付与し、各データ名称の機器種別用語のうち互いに同義語となる機器種別用語に同一の機器種別カテゴリを付与し、各データ名称の設置場所用語のうち互いに同義語となる設置場所用語に同一の設置場所カテゴリを付与する。
図5にカテゴリ辞書の一例を示す。カテゴリ辞書は、データ名称に使用されると予想される標準用語とカテゴリとの対応関係を規定した情報であり、さらに、標準用語に対する同義語を定義した情報である。上記のように、データ名称には、信号種別用語、機器種別用語及び設置場所用語が含まれるため、標準用語は、信号種別用語、機器種別用語及び設置場所用語に分類されており、カテゴリとして、信号種別カテゴリ、機器種別カテゴリ及び設置場所カテゴリが定義されている。そして、各カテゴリには標準用語が対応付けられている。また、データ名称に含まれる用語には、重要度が相対的に高い主要語と、重要度が相対的に低い修飾語とが含まれるため、各カテゴリは、主要語に対するカテゴリと修飾語に対するカテゴリとに分けられている。
信号種別の標準用語として、例えば「温度」、「湿度」、「制御出力」、「給気」、「還気」、「設定」及び「計測」等が定義されている。標準用語「温度」、「湿度」及び「制御出力」はデータの物理量を示し、信号の種別に関する用語であるため、信号種別用語に分類されている。また、標準用語「温度」、「湿度」及び「制御出力」は、データの物理量を直接的に示す用語であるため、重要度が相対的に高い主要語であると定義され、信号種別カテゴリのうちの信号主要語(信主)カテゴリに分類されている。
標準用語「給気」、「還気」、「設定」及び「計測」はデータの物理量を直接的に示す用語ではないが、信号の種別に関する用語であるため、信号種別用語に分類されている。また、これらの用語は、データの物理量を直接的に示す用語でないため、重要度が相対的に低い修飾語であると定義され、信号種別カテゴリのうちの信号修飾語(信修)カテゴリに分類されている。図5に示す例では、用語「給気」の同義語として用語「SA」が定義され、用語「還気」の同義語として用語「RA」が定義されている。
機器種別の標準用語として、例えば「空調機」、「状態」及び「弁開度」等が定義されている。標準用語「空調機」は機器の種別を示しているため、機器種別用語に分類されており、機器の種別を直接的に示す用語であるため、重要度が相対的に高い主要語であると定義され、機器種別カテゴリのうちの機器主要語(機主)カテゴリに分類されている。
標準用語「状態」及び「弁開度」は機器の種別を直接的に示す用語ではないが、機器の種別に関する用語であるため、機器種別用語に分類されており、重要度が相対的に低い修飾語であると定義され、機器種別カテゴリのうちの機器修飾語(機修)カテゴリに分類されている。図5に示す例では、用語「状態」の同義語として用語「OAMD」が定義され、用語「弁開度」の同義語として用語「バルブ」が定義されている。
設置場所の標準用語として、標準用語「B1F」や「2F」等のような設置場所に関する用語が定義されている。これらの用語は、機器が設置されている場所を示す用語であるため、重要度が相対的に高い主要語であると定義され、場所主要語(場主)カテゴリに分類されている。なお、設置場所の同義語として、例えば「1階」や「地下1階」等のように階の数を示す用語が考えられる。
図6に、カテゴリ付きデータ名称リスト120の一例を示す。(1)のデータ名称「B1F系統空調機 SA温度計測」を例にして、付与されたカテゴリについて説明する。用語「B1F」は場所主要語であるため、「場主」カテゴリが付与されている。また、用語「B1F」には、標準用語「B1F」が付与されており、結果として、標準用語が含まれた「B1F:場主」カテゴリが付与されている。用語「系統空調機」は機器主要語であるため、「機主」カテゴリが付与されている。また、用語「系統空調機」には、標準用語「空調機」が付与されており、結果として、標準用語が含まれた「空調機:機主」カテゴリが付与されている。用語「SA」は信号修飾語であるため、「信修」カテゴリが付与されている。また、用語「SA」には、標準用語「給気」が付与されており、結果として、標準用語が含まれた「給気:信修」カテゴリが付与されている。用語「温度」は信号主要語であるため、「信主」カテゴリが付与されている。また、用語「温度」には、標準用語「温度」が付与されており、結果として、標準用語が含まれた「温度:信主」カテゴリが付与されている。用語「計測」は信号修飾語であるため、「信修」カテゴリが付与されている。また、用語「計測」には、標準用語「計測」が付与されており、結果として、標準用語が含まれた「計測:信修」カテゴリが付与されている。その他のデータ名称の用語にも、標準用語が含まれるカテゴリが付与されている。
抽出部18は、データ名称組パターン130を参照することで、カテゴリ付きデータ名称リスト120から、同一の分析対象とすべきデータに付与されたデータ名称の組を抽出し、当該組に含まれるデータ名称を示す分析対象データ名称組140を出力する。データ名称組パターン130は、同一の分析対象とすべきデータのデータ名称に付与されている機器種別カテゴリ、信号種別カテゴリ及び設置場所カテゴリの組み合わせを定義する情報である。例えば、抽出部18は、カテゴリ付きデータ名称リスト120から、データ名称組パターン130によって定義されているカテゴリと同一のカテゴリが付与されたデータ名称を抽出する。なお、データ名称組パターン130が分析対象情報の一例に相当する。
図7に、データ名称組パターン130の一例を示す。データ名称組パターン130は、例えば、同じ場所に設置された同じ種類の機器に関する複数のデータの名称であって、互いに異なる信号種別カテゴリが付与されたデータ名称を同一の組として抽出するための規則を定めた情報であり、同一の分析対象とすべきデータの名称に付与されているカテゴリの組み合わせを定義する情報である。換言すると、データ名称組パターン130は、機器種別カテゴリ及び設置場所カテゴリが互いに共通し、信号種別カテゴリが互いに異なる複数の組み合わせを定義する情報である。異なる信号種別カテゴリは、例えば、分析者等が予め指定すればよい。例えば、同一の分析対象とすべきデータの名称に付与される信号種別カテゴリを指定すればよい。図7に示すデータ名称組パターン130は、空調機における弁開時の給気温度を分析するためのデータの名称を抽出するためのカテゴリの組み合わせである。具体的には、図7に示すデータ名称組パターン130は、同じ場所に設置された空調機に関するデータの名称であって、「温度、給気、計測」のカテゴリが付与されたデータ名称、「温度、給気、設定」のカテゴリが付与されたデータ名称、「制御出力、弁開度」のカテゴリが付与されたデータ名称、「制御出力、状態」のカテゴリが付与されたデータ名称を抽出するための定義である。データ名称組パターン130は例えば定義(α)〜(δ)を含み、定義(α)〜(δ)は、変数A,B,C1,C2,D1,D2等の組み合わせによって構成されている。各変数は、設置場所カテゴリ、機器種別カテゴリ及び信号種別カテゴリのいずれかである。例えば、変数Aは設置場所カテゴリを示し、変数Bは機器種別カテゴリを示し、変数C1,C2,D1,E1等は信号種別カテゴリを示す。例えば、定義(α)は、変数A[場主]、変数B[空調機:機主]、変数C1[温度:信主]、変数D1[給気:信修]、変数E1[計測:信修]の組み合わせによって構成されている。他の定義(β)〜(δ)についても同様に、カテゴリに対応する変数の組み合わせによって構成されている。なお、変数A,Bは、定義(α)〜(δ)で共通している。変数は、分析者等が予め指定すればよい。
抽出部18は、図7に示すデータ名称組パターン130の定義(α)〜(δ)に該当するデータ名称を、カテゴリ付きデータ名称リスト120から抽出する。すなわち、複数のデータ名称のうち、カテゴリが各定義のカテゴリと一致するデータ名称を抽出する。このとき、同じ場所に設置された同じ種類の機器に関するデータの名称を、同一の組として抽出する。例えば、図6に示すカテゴリ付きデータ名称リスト120のうち、定義(α)に該当するデータ名称は、データ名称(1)とデータ名称(11)であるため、抽出部18は、データ名称(1)とデータ名称(11)とを抽出する。すなわち、データ名称(1)及びデータ名称(11)に付与されているカテゴリが、定義(α)を構成するカテゴリと一致するため、抽出部18は、データ名称(1),(11)を抽出する。データ名称(1)とデータ名称(11)とでは、空調機に関するデータの名称であるが設置場所が異なるため、抽出部18は、データ名称(1)とデータ名称(11)とを別の組に分類する。また、定義(β)に該当するデータ名称は、データ名称(6)とデータ名称(17)であるため、抽出部18は、データ名称(6)とデータ名称(17)とを抽出する。データ名称(6)とデータ名称(17)とでは、設置場所が異なるため、抽出部18は、データ名称(6)とデータ名称(17)とを別の組に分類する。定義(γ),(δ)についても同様に、該当するデータ名称を抽出して分類する。なお、抽出部18は、定義(α)〜(δ)に含まれる変数の順序や、各データ名称に含まれる用語(カテゴリ)の順序に関係なく、定義(α)〜(δ)に該当するデータ名称を抽出する。
図8に抽出結果を示す。図8(a)に示すように、データ名称(1),(6),(4),(5)は、同じ場所に設置された空調機に関するデータの名称であるため、抽出部18は、これらのデータ名称を同一のデータ名称組1に分類する。また、図8(b)に示すように、データ名称(11),(17),(15),(16)は、同じ場所に設置された空調機に関するデータの名称であるため、抽出部18は、これらのデータ名称を同一のデータ名称組2に分類する。
そして、抽出部18は、データ名称組1,2をそれぞれ分析対象データ名称組140として出力する。図1に示すデータ抽出装置230は、データ名称組1に含まれるデータ名称が付与されたデータを記憶装置222から抽出し、抽出したデータをデータ名称組1に係る分析対象データ240として分析装置250に出力する。同様に、データ抽出装置230は、データ名称組2に含まれるデータ名称が付与されたデータを記憶装置222から抽出し、抽出したデータをデータ名称組2に係る分析対象データ240として分析装置250に出力する。そして、分析装置250は、データ名称組1に係る分析対象データに基づき、建物200のB1Fに設置された空調機の給気に関する診断や分析を行う。同様に、分析装置250は、データ名称組2に係る分析対象データに基づき、建物200の2Fに設置された空調機の給気に関する診断や分析を行う。
以上のように、カテゴリ辞書を用いてデータ名称にカテゴリを付与し、抽出対象のデータ名称の組をカテゴリによって定義したデータ名称組パターン130を用いて設置場所が同じ機器に関するデータ名称を抽出することで、用語の類似性のみでは分類することができなかったデータ名称を分類することが可能となる。例えば、用語の類似性のみでデータ名称を分類しようとする場合、「B1F系統空調機 SA温度」、「B1F系統空調機 RA温度」及び「2F系統空調機 SA温度」は、1つの用語のみが異なるという意味で類似度は同じとなり、これらのデータ名称を区別して抽出することができない。これに対して本実施形態では、信号種別カテゴリをデータ名称に付与することで、「SA」と「RA」等のような信号種別に関する用語を区別することが可能となり、また、異なる場所に設置された機器に関するデータ名称を別の組に分類することで、用語の類似性のみでは分類することができないデータ名称を分類することが可能となる。上記の「SA(給気)」や「RA(還気)」等の信号修飾語も区別することができるため、信号修飾語を含むデータ名称を区別して抽出することが可能となる。その結果、データ分析に役に立つデータの名称のみを抽出することが可能となる。例えば、「SA(給気)」を含むデータ名称のデータと「RA(還気)」を含むデータ名称のデータとでは、分析の対象が異なるため、「SA」を含むデータ名称と「RA」を含むデータ名称とが同一の組に分類されると、データ分析の際に支障をきたし、データ分析の精度が低下するおそれがある。本実施形態では、信号修飾語が異なるデータ名称を別々の組に分類することができるため、データ分析の精度を向上させることが可能となる。このように、分析対象となるデータの名称を自動で分類することが可能となるため、分析者の手間が省け、分析対象となるデータの抽出に要する時間を削減することが可能となる。
(変形例1)
次に、変形例1について説明する。上述した実施形態では、データ名称組パターン130に含まれる定義(例えば定義(α)〜(δ)のそれぞれ)に完全に一致するデータ名称を、カテゴリ付きデータ名称リスト120から抽出する場合について説明した。変形例1では、データ名称組パターン130に含まれる定義に完全に一致しなくても、マッチ度(一致度)が高いデータ名称を抽出する。例えば、抽出部18は、データ名称組パターン130によって定義されている機器種別カテゴリ、信号種別カテゴリ及び設置場所カテゴリのうちの一部のカテゴリと同一のカテゴリが付与されたデータ名称をカテゴリ付きデータ名称リスト120から抽出する。
図9に、変形例1に係るデータ名称リスト100Aの一例を示す。データ名称リスト100Aは、図3に示すデータ名称リスト100と同様に、(1)〜(19)のデータ名称を含んでいるが、(1)〜(3)及び(11)〜(13)のデータ名称に、用語「計測」が含まれていない。この点が、データ名称リスト100とデータ名称リスト100Aとで異なる。
上述した実施形態と同様に、形態素解析部12は、データ名称リスト100Aに含まれる各データ名称を各用語で区分けし、カテゴリ付与部14は、分割済みデータ名称に含まれる各用語にカテゴリを付与する。これにより、図6に示すような、カテゴリが付与されたデータ名称リストが作成される。変形例1に係るカテゴリ付きデータ名称リストにおいては、図6に示すカテゴリ付きデータ名称リスト120と異なり、(1)〜(3)及び(11)〜(13)のデータ名称に、「計測」に関する信号種別カテゴリ(信号修飾語カテゴリ)が付与されない。
この場合、抽出部18は、データ名称組パターン130と、変形例1に係るカテゴリ付きデータ名称リストとを比較し、データ名称組パターン130の定義(α)〜(δ)に該当するデータ名称を、変形例1に係るカテゴリ付きデータ名称リストから抽出する。
図10(a)に、データ名称組パターン130の一例を示す。図10(a)に示すパターンは、図7に示すパターンと同じである。変形例1では、各データ名称に用語「計測」が含まれていないため、定義(α)〜(δ)のうち、「計測」に関する信号種別カテゴリを含む定義(α)に一致するデータ名称は抽出されず、定義(β)〜(δ)のそれぞれに一致するデータ名称のみが抽出されることになる。
図10(b)に、定義(β)〜(δ)のそれぞれに一致するデータ名称の組(データ名称組1)を示す。図8(a)に示すデータ名称組1と同様に、データ名称(4)〜(6)が抽出されて同じデータ名称組1に分類されている。
図10(c)に、定義(β)〜(δ)のそれぞれに一致するデータ名称の組(データ名称組2)を示す。図8(b)に示すデータ名称組2と同様に、データ名称(15)〜(16)が抽出されて同じデータ名称組2に分類されている。
変形例1では、抽出部18は、定義(α)に最も近いデータ名称を、カテゴリ付きデータ名称リストから抽出する。データ名称組1に含まれる候補となるデータ名称に着目すると、定義(α)は、変数[A:[場]]、変数[B:[空調機:機主]]、変数[C1:[温度:信主]]、変数[D1:[給気:信修]]、変数[E1:[計測:信修]]を含んでおり、データ名称(1)〜(10)のうちのデータ名称(1)は「B1F系統空調機 SA温度」であるため、データ名称(1)〜(10)の中で、定義(α)に対するデータ名称(1)のマッチ度(一致度)が最も高くなる。従って、抽出部18は、データ名称(1)を抽出し、データ名称組1に分類する。同様に、データ名称組2に含まれる候補となるデータ名称に着目すると、データ名称(11)〜(19)の中で、定義(α)に対するデータ名称(11)のマッチ度(一致度)が最も高くなる。従って、抽出部18は、データ名称(11)を抽出し、データ名称組2に分類する。
以上のように、抽出の基礎となるデータ名称組パターン130に完全に一致するデータ名称が存在しない場合であっても、マッチ度を考慮することで、抽出されるべきデータ名称を抽出することが可能となる。
(変形例2)
次に、変形例2について説明する。変形例2では、抽出部18は、データ名称に関連付けられているデータそのものの値やデータに付与されている単位に基づきデータの種別を特定し、特定した種別に対応する信号種別カテゴリに基づきデータ名称の抽出を行う。例えば、データ名称組パターン130に含まれる定義に完全に一致するデータ名称が存在しない場合、データそのものの値や単位を参照することで信号種別を特定し、特定した信号種別に対応する信号種別カテゴリをデータ名称に追加してデータ名称を分類する。または、データ名称組パターン130に含まれる定義に完全に一致するデータ名称が存在する場合であっても、データそのものの値や単位を参照することで信号種別を特定し、特定した信号種別に基づき信号種別カテゴリを修正してデータ名称の抽出を行ってもよい。このように信号種別カテゴリを修正することで、例えば、データ名称が誤って抽出されることを防止することができる。
図11(a)に、データに付与されると想定される単位の一例を示す。例えば、データに付与されている単位が「℃」であれば、そのデータの種別は「温度」であると推定される。従って、抽出部18は、単位「℃」が付与されているデータを温度データと推定し、そのデータの名称とデータ名称組パターン130とを照合することで抽出処理を行う。例えば、抽出部18は、データ名称組パターン130に含まれる定義に一致しないデータ名称のデータを記憶装置222から取得し、単位「℃」が付与されているデータを温度データと推定して抽出処理を行う。これにより、用語「温度」が含まれないデータ名称であっても、そのデータ名称が付与されたデータの単位が「℃」であれば、そのデータを温度データであると推定し、データ名称に用語「温度」が含まれるものとして抽出処理を行うことが可能となる。例えば、温度の用語の一種として「Temp」等の用語がデータ名称に付与されたために、温度に関する信号種別カテゴリが当該データ名称に付与されなかった場合、当該データ名称を「温度」のデータ名称として抽出することができないが、変形例2によると、データの単位に「℃」が含まれていれば、当該データ名称を「温度」のデータ名称として抽出することができる。
また、データ名称に「圧力」等のように「温度」とは異なる物理量の用語が含まれている場合であっても、データの単位が「℃」であれば、抽出部18は、当該データを温度データと推定して抽出処理を行う。これにより、データ名称が誤っている場合であっても、データ名称を正確に抽出することが可能となる。例えば、抽出部18は、データ名称に付与された「圧力」に関する信号種別カテゴリを、「温度」に関する信号種別カテゴリに修正し、修正後の信号種別カテゴリに基づき抽出処理を行う。
同様に、データに付与されている単位が「Pa」であれば、そのデータの種別は「圧力」であると推定され、単位が「V」であればデータの種別は「電圧」であると推定され、単位が「A」であればデータの種別は「電流」であると推定される。抽出部18は、その推定に基づき、データ名称とデータ名称組パターン130とを照合してデータ名称の抽出処理を行う。
また、図11(b)にデータ(値)を示す。例えば、データは一定時間ごとに取得されている。抽出部18は、データを記憶装置222から取得し、当該データの特徴に基づきデータの種別を推定し、その推定に基づきデータ名称を分類する。例えば、データのレンジに基づきデータの種別を推定してもよい。温度、圧力、電流値、電圧値では値そのものが異なり、またレンジも異なるため、そのレンジに基づきデータの種別を推定する。または、データが時間とともに変化するのであれば、季節変動、一日の変動、一月の変動等のように一定期間の変化に基づきデータの種別を推定してもよい。または、データが一定期間変化しないのであれば、計測値ではなく、設定値であると推定してもよい。計測値であれば時間とともに変動し、設定値であれば時間とともに変化しないと考えられるからである。このように、データの特徴に基づきデータ名称を分類することで、データ名称組パターン130に含まれる定義に完全に一致するデータ名称が存在しない場合であっても、データ名称を分類することができる。また、データ名称が誤っている場合であっても、データ名称を正確に抽出することが可能となる。
また別の例として、抽出部18は、データの特徴に基づき、機器が設置されている場所を推定してもよい。データの変化の傾向は機器の設置場所によって異なる場合があるため、抽出部18は、その変化の傾向に基づいて機器の設置場所を推定してもよい。例えば、データ名称に設置場所用語が含まれていないデータの変化の傾向が、機器の設置場所が既知のデータの変化の傾向と同じであれば、抽出部18は、当該設置場所を、データ名称に設置場所用語が含まれていないデータが取得された場所であると推定する。機器の設置場所が既知のデータとして、例えば、過去のデータを用いればよい。そして、抽出部18は、推定した設置場所に対応する設置場所カテゴリをデータ名称に付与し、データ名称の抽出を行う。一例として、温度、圧力、湿度等の計測値の変化の傾向が、建物100内の機器の設置場所によって異なる場合、計測値の変化の傾向に基づいて建物100内の機器の設置場所を推定し、データ名称の抽出処理を行う。また、建物100内の機器の設置場所によって設定値が異なる場合、設定値に基づいて建物100内の機器の設置場所を推定し、データ名称の抽出処理を行ってもよい。
上述したデータ名称抽出装置10は、図示しないCPU等のプロセッサを備えている。プロセッサは、図示しないメモリに記憶されたプログラムを実行することにより、形態素解析部12、カテゴリ付与部14及び抽出部18のそれぞれの機能を実現する。上記プログラムは、CDやDVD等の記録媒体を介して又はネットワーク等の通信経路を介してハードディスクドライブ(HDD)等の記憶装置に記憶される。なお、上記プログラムはハードディスクドライブ等の記憶装置に予め記憶されていてもよい。ハードディスクドライブ等の記憶装置に記憶されたプログラムがRAM等のメモリに読み出されてCPU等のプロセッサによって実行されることにより、データ名称抽出装置10の各部の機能が実現される。
10 データ名称抽出装置、12 形態素解析部、14 カテゴリ付与部、16 カテゴリ記憶部、18 抽出部。

Claims (6)

  1. センサーの検出対象となる機器の種別に関する機器種別用語、センサーの出力値の種別に関する信号種別用語及び機器が設置されている場所に関する設置場所用語を含んで構成され、複数のセンサーのそれぞれの出力値に関連付けられているデータ名称情報を取得し、各データ名称情報の機器種別用語のうち互いに同義語となる機器種別用語に同一の機器種別カテゴリを付与し、各データ名称情報の信号種別用語のうち互いに同義語となる信号種別用語に同一の信号種別カテゴリを付与し、各データ名称情報の設置場所用語のうち互いに同義語となる設置場所用語に同一の設置場所カテゴリを付与するカテゴリ付与手段と、
    複数のセンサーの出力値を同一の分析対象とするための機器種別カテゴリ、信号種別カテゴリ及び設置場所カテゴリの組み合わせを定義する分析対象情報を取得し、カテゴリ付与手段によってカテゴリが付与された複数のデータ名称情報から、分析対象情報によって定義されているカテゴリと同一のカテゴリが付与されたデータ名称情報を抽出する抽出手段と、
    を有することを特徴とするデータ名称抽出装置。
  2. 請求項1に記載のデータ名称抽出装置であって、
    分析対象情報は、機器種別カテゴリ及び設置場所カテゴリが互いに共通し、信号種別カテゴリが互いに異なる複数の組み合わせを定義し、
    抽出手段は、機器種別カテゴリ及び設置場所カテゴリが互いに共通し、信号種別カテゴリが互いに異なる複数のデータ名称情報を抽出し、抽出した複数のデータ名称情報のうち、設置場所用語が示す場所が同一であるデータ名称情報を同一の組に分類する、
    ことを特徴とするデータ名称抽出装置。
  3. 請求項1又は請求項2に記載のデータ名称抽出装置であって、
    抽出手段は、分析対象情報によって定義されている機器種別カテゴリ、信号種別カテゴリ及び設置場所カテゴリのすべてのカテゴリと同一のカテゴリが付与されたデータ名称情報が複数のデータ名称情報内に存在しない場合、分析対象情報によって定義されている機器種別カテゴリ、信号種別カテゴリ及び設置場所カテゴリのうちの一部のカテゴリと同一のカテゴリが付与されたデータ名称情報を複数のデータ名称情報から抽出する、
    ことを特徴とするデータ名称抽出装置。
  4. 請求項1から請求項3のいずれか一項に記載のデータ名称抽出装置であって、
    抽出手段は、センサーの出力値の単位に基づき出力値の種別を特定し、特定した種別に対応する信号種別カテゴリに基づきデータ名称情報の抽出を行う、
    ことを特徴とするデータ名称抽出装置。
  5. 請求項1から請求項3のいずれか一項に記載のデータ名称抽出装置であって、
    抽出手段は、センサーの出力値に基づき出力値の種別を特定し、特定した種別に対応する信号種別カテゴリに基づきデータ名称情報の抽出を行う、
    ことを特徴とするデータ名称抽出装置。
  6. コンピュータに、
    センサーの検出対象となる機器の種別に関する機器種別用語、センサーの出力値の種別に関する信号種別用語及び機器が設置されている場所に関する設置場所用語を含んで構成され、複数のセンサーのそれぞれの出力値に関連付けられているデータ名称情報を取得し、各データ名称情報の機器種別用語のうち互いに同義語となる機器種別用語に同一の機器種別カテゴリを付与し、各データ名称情報の信号種別用語のうち互いに同義語となる信号種別用語に同一の信号種別カテゴリを付与し、各データ名称情報の設置場所情報のうち互いに同義語となる設置場所用語に同一の設置場所カテゴリを付与するステップと、
    複数のセンサーの出力値を同一の分析対象とするための機器種別カテゴリ、信号種別カテゴリ及び設置場所カテゴリの組み合わせを定義する分析対象情報を取得し、カテゴリが付与された複数のデータ名称情報から、分析対象情報によって定義されているカテゴリと同一のカテゴリが付与されたデータ名称情報を抽出するステップと、
    を実行させることを特徴とするプログラム。
JP2013094260A 2013-04-26 2013-04-26 データ名称抽出装置及びプログラム Active JP5940018B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013094260A JP5940018B2 (ja) 2013-04-26 2013-04-26 データ名称抽出装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013094260A JP5940018B2 (ja) 2013-04-26 2013-04-26 データ名称抽出装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2014215902A true JP2014215902A (ja) 2014-11-17
JP5940018B2 JP5940018B2 (ja) 2016-06-29

Family

ID=51941581

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013094260A Active JP5940018B2 (ja) 2013-04-26 2013-04-26 データ名称抽出装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5940018B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015125664A (ja) * 2013-12-27 2015-07-06 三菱電機ビルテクノサービス株式会社 データ関連情報処理装置及びプログラム
WO2016098805A1 (ja) * 2014-12-19 2016-06-23 三菱電機株式会社 データ関連情報処理装置及びプログラム
WO2018225192A1 (ja) * 2017-06-07 2018-12-13 三菱電機ビルテクノサービス株式会社 データ名称分類支援装置及びデータ名称分類支援プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010027031A (ja) * 2008-06-18 2010-02-04 Yahoo Japan Corp 注記名寄せ装置、注記名寄せ方法、および、注記名寄せプログラム
JP2010122792A (ja) * 2008-11-18 2010-06-03 Nippon Telegr & Teleph Corp <Ntt> 製品名名寄せ装置、その方法及びプログラム
JP2011186738A (ja) * 2010-03-08 2011-09-22 Panasonic Electric Works Co Ltd 情報提供システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010027031A (ja) * 2008-06-18 2010-02-04 Yahoo Japan Corp 注記名寄せ装置、注記名寄せ方法、および、注記名寄せプログラム
JP2010122792A (ja) * 2008-11-18 2010-06-03 Nippon Telegr & Teleph Corp <Ntt> 製品名名寄せ装置、その方法及びプログラム
JP2011186738A (ja) * 2010-03-08 2011-09-22 Panasonic Electric Works Co Ltd 情報提供システム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015125664A (ja) * 2013-12-27 2015-07-06 三菱電機ビルテクノサービス株式会社 データ関連情報処理装置及びプログラム
WO2016098805A1 (ja) * 2014-12-19 2016-06-23 三菱電機株式会社 データ関連情報処理装置及びプログラム
JP2016118886A (ja) * 2014-12-19 2016-06-30 三菱電機ビルテクノサービス株式会社 データ関連情報処理装置及びプログラム
WO2018225192A1 (ja) * 2017-06-07 2018-12-13 三菱電機ビルテクノサービス株式会社 データ名称分類支援装置及びデータ名称分類支援プログラム
JPWO2018225192A1 (ja) * 2017-06-07 2019-11-07 三菱電機ビルテクノサービス株式会社 データ名称分類支援装置及びデータ名称分類支援プログラム
CN110753939A (zh) * 2017-06-07 2020-02-04 三菱电机大楼技术服务株式会社 数据名称分类辅助装置和数据名称分类辅助程序
CN110753939B (zh) * 2017-06-07 2024-03-01 三菱电机楼宇解决方案株式会社 数据名称分类辅助装置

Also Published As

Publication number Publication date
JP5940018B2 (ja) 2016-06-29

Similar Documents

Publication Publication Date Title
JP6741216B2 (ja) ログ分析システム、方法およびプログラム
CN107357902B (zh) 一种基于关联规则的数据表分类系统与方法
US20210263511A1 (en) Devices, methods, and systems for a distributed rule based automated fault detection
CN109934268B (zh) 异常交易检测方法及系统
US20230144809A1 (en) Model operation support system and method
JP5940018B2 (ja) データ名称抽出装置及びプログラム
US10877989B2 (en) Data conversion system and method of converting data
WO2018069950A1 (ja) ログ分析方法、システムおよびプログラム
WO2018142816A1 (ja) 支援装置および支援方法
JP6803540B2 (ja) 機器状態推定方法及び機器状態推定装置
JP6366852B2 (ja) 機器分類装置
JP2024054370A (ja) 要因分析装置及び要因分析方法
CN106991050A (zh) 一种静态测试空指针引用缺陷假阳性识别方法
JP6838150B2 (ja) データ名称分類支援装置及びデータ名称分類支援プログラム
JP6290777B2 (ja) データ関連情報処理装置及びプログラム
JP6880864B2 (ja) エネルギー管理システムおよびエネルギー管理方法
JP2020193847A (ja) 波形セグメンテーション装置及び波形セグメンテーション方法
CN110502669A (zh) 基于n边dfs子图的轻量级无监督图表示学习方法及装置
JP6756378B2 (ja) 異常検出方法、システムおよびプログラム
US10891332B2 (en) Instrumentation diagram data generation device, instrumentation diagram search system, and computer readable medium
JP2020166443A (ja) データ加工方法レコメンドシステム、データ加工方法レコメンド方法、及びデータ加工方法レコメンドプログラム
JP2016053871A (ja) データ生成装置、データ生成方法、及びプログラム
JP6017411B2 (ja) データ関連情報処理装置及びプログラム
JP7408911B2 (ja) 異常検知装置及び異常検知方法
JP6556297B1 (ja) データ分析支援装置およびデータ分析支援プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150525

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160411

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160419

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160517

R150 Certificate of patent or registration of utility model

Ref document number: 5940018

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250