JP2020042345A - データ処理装置、データ処理方法及びデータ処理プログラム - Google Patents

データ処理装置、データ処理方法及びデータ処理プログラム Download PDF

Info

Publication number
JP2020042345A
JP2020042345A JP2018167017A JP2018167017A JP2020042345A JP 2020042345 A JP2020042345 A JP 2020042345A JP 2018167017 A JP2018167017 A JP 2018167017A JP 2018167017 A JP2018167017 A JP 2018167017A JP 2020042345 A JP2020042345 A JP 2020042345A
Authority
JP
Japan
Prior art keywords
data
format
metadata
unit
sensing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018167017A
Other languages
English (en)
Other versions
JP7127440B2 (ja
Inventor
哲二 大和
Tetsuji Yamato
哲二 大和
泰司 吉川
Taiji Yoshikawa
泰司 吉川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP2018167017A priority Critical patent/JP7127440B2/ja
Priority to CN201980052969.4A priority patent/CN112567346A/zh
Priority to PCT/JP2019/006424 priority patent/WO2020049759A1/ja
Priority to US17/268,968 priority patent/US11468082B2/en
Publication of JP2020042345A publication Critical patent/JP2020042345A/ja
Application granted granted Critical
Publication of JP7127440B2 publication Critical patent/JP7127440B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】入力されるデータの形式に拘わらず後工程におけるデータ処理を簡易にする。【解決手段】第1データ形式は、実データを含む形式である。第2及び第3データ形式の各々は、実データと該実データの属性を示すメタデータとを含む形式である。第2データ形式においては、実データ及びメタデータの各々が異なるデータ単位を構成する。第3データ形式においては、実データ及びメタデータが1つのデータ単位を構成する。プログラムは、入力データの形式が第1及び第3データ形式である場合に、形式の変換処理を施すことによって、第2データ形式の出力データを生成するステップをプロセッサに実行させるように構成されている。【選択図】図1

Description

本発明は、データ処理装置、データ処理方法及びデータ処理プログラムに関する。
WO2014/041826(特許文献1)は、データ流通に適用可能なシステムを開示する。このシステムにおいては、たとえば、センシングデータが流通する。センシングデータには、センシングデータの属性を示すメタデータが対応付けられている。このシステムにおいては、メタデータを参照することによって、利用者の要求を満たすセンシングデータが探索される(特許文献1参照)。
WO2014/041826
何らかのデータ処理を考えた場合に、データ処理の対象となるデータの形式が複数種類存在することがあり得る。たとえば、上記特許文献1におけるメタデータが実データに対応づけられているデータ形式と、メタデータが対応付けられておらず実データのみを含むデータ形式との両方がデータ処理の対象となる場合が考えられる。しかしながら、複数種類のデータ形式がデータ処理の対象となると、データ処理が煩雑になる。
本発明は、このような問題を解決するためになされたものであって、その目的は、入力されるデータの形式に拘わらず後工程におけるデータ処理を簡易にすることが可能なデータ処理装置、データ処理方法及びデータ処理プログラムを提供することである。
本発明のある局面に従うデータ処理装置は、入力データに処理を施すことによって出力データを生成するように構成されている。データ処理装置は、メモリと、プロセッサとを備える。メモリは、プログラムを記憶するように構成されている。プロセッサは、プログラムを実行するように構成されている。入力データの形式としては、第1、第2及び第3データ形式がある。第1データ形式は、実データを含む形式である。第2及び第3データ形式の各々は、実データと該実データの属性を示すメタデータとを含む形式である。第2データ形式においては、実データ及びメタデータの各々が異なるデータ単位を構成する。第3データ形式においては、実データ及びメタデータが1つのデータ単位を構成する。プログラムは、入力データの形式が第1及び第3データ形式である場合に、形式の変換処理を施すことによって、第2データ形式の出力データを生成するステップをプロセッサに実行させるように構成されている。
このデータ処理装置においては、入力データの形式が第1及び第3データ形式であったとしても、第2データ形式の出力データが生成される。すなわち、このデータ処理装置においては、入力データの形式に拘わらず第2データ形式のデータが出力される。したがって、このデータ処理装置によれば、入力データの形式に拘わらず共通のデータ形式(第2データ形式)のデータが後工程に提供されるため、後工程におけるデータ処理を簡易にすることができる。
上記データ処理装置において、プログラムは、入力データの形式が第2データ形式である場合に、第2データ形式の出力データを生成するステップをさらにプロセッサに実行させるように構成されていてもよい。
また、上記データ処理装置において、プログラムは、出力データに含まれる実データをETL(Extract/Transform/Load)ツールに出力するステップをさらにプロセッサに実行させるように構成されていてもよい。
また、上記データ処理装置において、プログラムは、ETLツールにおいて実データに施された処理に応じた処理をメタデータに施すステップをプロセッサに実行させるように構成されていてもよい。
このデータ処理装置においては、ETLツールにおいて実データに施された処理に応じた処理がメタデータに施される。したがって、このデータ処理装置によれば、既存のETLツールを使用した場合であっても、実データとメタデータとの関係性を正常に保つことができる。
また、上記データ処理装置において、実データは、センサによって生成されたセンシングデータであってもよい。
本発明の別の局面に従うデータ処理方法は、入力データに処理を施すことによって出力データを生成する方法である。入力データの形式としては、第1、第2及び第3データ形式がある。第1データ形式は、実データを含む形式である。第2及び第3データ形式の各々は、実データと該実データの属性を示すメタデータとを含む形式である。第2データ形式においては、実データ及びメタデータの各々が異なるデータ単位を構成する。第3データ形式においては、実データ及びメタデータが1つのデータ単位を構成する。データ処理方法は、入力データの形式が第1及び第3データ形式である場合に、形式の変換処理を施すことによって、第2データ形式の出力データを生成するステップを含む。
このデータ処理方法においては、入力データの形式が第1及び第3データ形式であったとしても、第2データ形式の出力データが生成される。すなわち、このデータ処理方法においては、入力データの形式に拘わらず第2データ形式のデータが出力される。したがって、このデータ処理方法によれば、入力データの形式に拘わらず共通のデータ形式(第2データ形式)のデータが後工程に提供されるため、後工程におけるデータ処理を簡易にすることができる。
本発明の別の局面に従うデータ処理プログラムは、入力データに処理を施すことによって出力データを生成する処理をプロセッサに実行させるように構成されている。入力データの形式としては、第1、第2及び第3データ形式がある。第1データ形式は、実データを含む形式である。第2及び第3データ形式の各々は、実データと該実データの属性を示すメタデータとを含む形式である。第2データ形式においては、実データ及びメタデータの各々が異なるデータ単位を構成する。第3データ形式においては、実データ及びメタデータが1つのデータ単位を構成する。データ処理プログラムは、入力データの形式が第1及び第3データ形式である場合に、形式の変換処理を施すことによって、第2データ形式の出力データを生成するステップをプロセッサに実行させるように構成されている。
このデータ処理プログラムがプロセッサによって実行されると、入力データの形式が第1及び第3データ形式であったとしても、第2データ形式の出力データが生成される。すなわち、このデータ処理プログラムがプロセッサによって実行されると、入力データの形式に拘わらず第2データ形式のデータが出力される。したがって、このデータ処理プログラムによれば、入力データの形式に拘わらず共通のデータ形式(第2データ形式)のデータが後工程に提供されるため、後工程におけるデータ処理を簡易にすることができる。
本発明によれば、入力されるデータの形式に拘わらず後工程におけるデータ処理を簡易にすることが可能なデータ処理装置、データ処理方法及びデータ処理プログラムを提供することができる。
データ処理サーバの概要を説明するための図である。 データ処理サーバを含む分析用データ生成システムの構成の一例を示す図である。 センシングデータDBに記憶されているデータのデータ形式の種類を説明するための図である。 データ処理サーバのハードウェア構成の一例を示す図である。 データ処理サーバのソフトウェア構成の一例、及び、ETLサーバのソフトウェア構成の一例を示す図である。 データ形式変換部の詳細構成を示す図である。 データ形式変換部において実行されるデータ変換の内容を説明するための図である。 メタデータ変換部の詳細構成を示す図である。 値変換部におけるメタデータの変換の一例を示す図である。 データ形式変換部におけるデータ形式変換処理の手順の一例を示すフローチャートである。 メタデータ変換部におけるメタデータ変換処理の手順の一例を示すフローチャートである。
以下、本発明の一側面に係る実施の形態(以下、「本実施の形態」とも称する。)について、図面を用いて詳細に説明する。なお、図中同一又は相当部分には同一符号を付してその説明は繰り返さない。また、以下で説明する本実施の形態は、あらゆる点において本発明の例示にすぎない。本実施の形態は、本発明の範囲内において、種々の改良や変更が可能である。すなわち、本発明の実施にあたっては、実施の形態に応じて具体的構成を適宜採用することができる。
[1.概要]
図1は、本実施の形態に従うデータ処理装置(データ処理サーバ)100の概要を説明するための図である。図1に示されるように、データ処理サーバ100は、ネットワークを介してセンシングデータDB(database)200に接続されている。センシングデータDB200には、種々のセンシングデータが蓄積されている。データ処理サーバ100は、センシングデータDB200から入力されたセンシングデータに処理を施すことによって、出力データを生成する。データ処理サーバ100は、生成された出力データを後工程に出力する。
センシングデータDB200に蓄積されているセンシングデータのデータ形式は、必ずしも統一されていない。詳細については後述するが、たとえば、データ形式には、i)センシングデータを含む(該センシングデータの属性を示すメタデータ(以下、単に「メタデータ」とも称する。)を含まない。)第1データ形式、ii)センシングデータとメタデータとを含み、センシングデータ及びメタデータの各々が異なるデータ単位を構成する第2データ形式、iii)センシングデータとメタデータとを含み、センシングデータ及びメタデータが1つのデータ単位を構成する第3データ形式がある。
データ形式の異なるデータが後工程に入力されると、後工程におけるデータ処理が煩雑になる。詳細については後述するが、本実施の形態に従うデータ処理サーバ100は、データ形式変換部102を含んでいる。データ形式変換部102は、上記第1及び第3データ形式のデータが入力されたとしても、入力データにデータ形式の変換処理を施すことによって、上記第2データ形式の出力データを生成する。すなわち、このデータ処理サーバ100においては、入力データの形式に拘わらず第2データ形式のデータが出力される。
したがって、このデータ処理サーバ100によれば、入力データの形式に拘わらず共通のデータ形式(第2データ形式)のデータが後工程に提供されるため、後工程におけるデータ処理を簡易にすることができる。以下、システム全体の構成、データ処理サーバ100のハードウェア構成及びソフトウェア構成、並びに、データ処理サーバ100の動作について順に説明する。
[2.システム構成]
図2は、本実施の形態に従うデータ処理サーバ100を含む分析用データ生成システム10の構成の一例を示す図である。分析用データ生成システム10は、製造現場等に設置されたセンサが生成したセンシングデータに基づいて、データ分析担当者が利用する分析用データを生成するシステムである。
データ分析担当者の多くは、製造現場等の事情について詳しくない。したがって、データ分析担当者の多くは、センシングデータのみを参照したとしても、センシングデータが何を意味するのかを正確には把握できない。本実施の形態において、分析用データは、センシングデータ(実データ)と、データ分析担当者によるセンシングデータの理解を助けるためのメタデータとを含む。メタデータは、センシングデータの属性を示す。なお、メタデータは、製造現場等において生成されてもよいし、分析用データが生成される過程で生成されてもよい。
データ分析担当者は、センシングデータに対応付けられているメタデータを参照することによって、センシングデータを適切に扱うことができる。その結果、データ分析担当者は、適切なデータ分析を行なうことができる。
図2の例では、分析用データ生成システム10は、データ処理サーバ100と、センシングデータDB200と、分析用データDB300と、ETLサーバ400と、ID管理サーバ500とを含んでいる。
センシングデータDB200は、センサによって生成されたセンシングデータを記憶する。センシングデータDB200に記憶されているセンシングデータを生成するセンサとしては、たとえば、画像センサ(カメラ)、温度センサ、湿度センサ、照度センサ、力センサ、音センサ、RFID(Radio Frequency IDentification)センサ、赤外線センサ、姿勢センサ、降雨センサ、放射能センサ及びガスセンサ等がある。また、センサは、必ずしも固設型である必要はなく、携帯電話、スマートフォン及びタブレット等の移動型であってもよい。また、センサは、必ずしも単一のセンシングデバイスで構成されている必要はなく、複数のセンシングデバイスによって構成されていてもよい。また、センサは、どのような目的で設置されていてもよく、たとえば、工場におけるFA(Factory Automation)及び生産管理、都市交通制御、気象等の環境計測、ヘルスケア並びに防犯等のために設置されていてもよい。
このように、センシングデータDB200には、様々なセンサによって生成されたセンシングデータが記憶されている。したがって、センシングデータDB200に記憶されているデータの形式は、必ずしも統一されていない。たとえば、センシングデータDB200には、複数種類のデータ形式のデータが記憶されている。
図3は、センシングデータDB200に記憶されているデータのデータ形式の種類を説明するための図である。図3に示されるように、第1データ形式は、センシングデータ(実データ)を含む(メタデータを含まない)データ形式である。第1データ形式において、センシングデータは、センサによって生成された値V11を含む。
第2データ形式は、センシングデータとメタデータとを含み、センシングデータ及びメタデータの各々が異なるデータ単位を構成するデータ形式である。第2データ形式において、センシングデータは、ID(identification)と、センサによって生成された値V21とを含む。IDがどのように決定されるかについては、後程詳しく説明する。メタデータは、IDと、センシングデータの属性を示す値V22とを含む。なお、センシングデータとメタデータとは、共通のID(identification)を含むことによって、互いに対応付けられている。
第3データ形式は、センシングデータとメタデータとを含み、センシングデータ及びメタデータが1つのデータ単位を構成するデータ形式である。第3データ形式においては、センサによって生成された値V31が格納されるとともに、ヘッダ部にメタデータが格納される。
再び図2を参照して、ETLサーバ400は、いわゆるETLツールを実現する。すなわち、ETLサーバ400は、センシングデータDB200からデータを抽出し(E)、抽出されたデータを分析に適した状態に変換し(T)、変換後のデータを分析用データDB300へロードする(L)。ETLサーバ400については、後程詳しく説明する。
データ処理サーバ100は、ETLサーバ400がセンシングデータDB200に送信を要求したセンシングデータに事前に処理を施す。データ処理サーバ100は、センシングデータDB200から取得したセンシングデータ(実データ)をETLサーバ400へ出力するとともに、該センシングデータに対応付けられているメタデータに処理を施す。データ処理サーバ100は、処理後のメタデータを分析用データDB300へ出力する。データ処理サーバ100については、後程詳しく説明する。
分析用データDB300は、ETLサーバ400において処理が施されたセンシングデータと、データ処理サーバ100において処理が施されたメタデータとを記憶する。分析用データDB300に記憶されているセンシングデータ及びメタデータの各々は、データ分析担当者が容易に分析できるように加工されている。
ID管理サーバ500は、第2データ形式において、センシングデータ(実データ)及びメタデータの各々が含むIDを管理する。ID管理サーバ500は、たとえば、データ処理サーバ100及びETLサーバ400からの要求を受けて、発行済みのIDと重複しないIDを生成する。ID管理サーバ500は、たとえば、UUID(Universally Unique Identifier)を生成する。また、ID管理サーバ500は、各センシングデータ及び各メタデータに含まれるIDの変遷(履歴)を記憶する。すなわち、たとえば、あるセンシングデータに含まれているIDが変更された場合に、ID管理サーバ500は、変更前のIDと、変更後のIDとを該センシングデータに対応付けて記憶する。したがって、たとえば、センシングデータの提供者は、ID管理サーバ500にアクセスすることによって、自身が提供したセンシングデータがどのような使われ方をしているのかを確認することができる。
[3.ハードウェア構成]
図4は、データ処理サーバ100のハードウェア構成の一例を示す図である。なお、本実施の形態において、データ処理サーバ100は、たとえば、汎用コンピュータによって実現される。
図4の例では、データ処理サーバ100は、制御部170と、通信I/F(interface)190と、記憶部180とを含み、各構成は、バス195を介して電気的に接続されている。
制御部170は、CPU(Central Processing Unit)172、RAM(Random Access Memory)174及びROM(Read Only Memory)176等を含み、情報処理に応じて各構成要素の制御を行なうように構成されている。
通信I/F190は、インターネットを介して、データ処理サーバ100の外部に設けられた外部装置(たとえば、センシングデータDB200、分析用データDB300、ETLサーバ400及びID管理サーバ500(図2))と通信するように構成されている。通信I/F190は、たとえば、有線LAN(Local Area Network)モジュールや無線LANモジュールで構成される。
記憶部180は、たとえば、ハードディスクドライブ、ソリッドステートドライブ等の補助記憶装置である。記憶部180は、たとえば、制御プログラム181を記憶するように構成されている。
制御プログラム181は、制御部170によって実行されるデータ処理サーバ100の制御プログラムである。たとえば、制御部170が制御プログラム181を実行することによって、後述の各ソフトウェアモジュールが実現されてもよい。制御部170が制御プログラム181を実行する場合に、制御プログラム181は、RAM174に展開される。そして、制御部170は、RAM174に展開された制御プログラム181をCPU172によって解釈及び実行することにより、各構成要素を制御する。なお、ETLサーバ400のハードウェア構成は、データ処理サーバ100のハードウェア構成と同様とすることができる。
[4.ソフトウェア構成]
<4−1.データ処理サーバ及びETLサーバのソフトウェア構成>
図5は、データ処理サーバ100のソフトウェア構成の一例、及び、ETLサーバ400のソフトウェア構成の一例を示す図である。図5に示されるように、データ処理サーバ100は、データ形式変換部102と、データ分離部104と、メタデータ変換部106と、メタデータ送信部108とを含んでいる。データ形式変換部102、データ分離部104、メタデータ変換部106及びメタデータ送信部108の各々は、制御部170(図4)が制御プログラム181を実行することよって実現されるソフトウェアモジュールである。
ETLサーバ400は、データ抽出部402と、データ変換部404と、ロード部406とを含んでいる。データ抽出部402、データ変換部404及びロード部406の各々は、ETLサーバ400に含まれる不図示の制御部(プロセッサ)が不図示の制御プログラムを実行することによって実現されるソフトウェアモジュールである。
これらのソフトウェアモジュールは、ETLサーバ400に含まれるデータ抽出部402がセンシングデータDB200にデータの送信を要求することによって処理を開始する。すなわち、データ抽出部402がセンシングデータDB200にデータ送信を要求するAPI(Application Programming Interface)コマンドを送信することによって、センシングデータDB200に蓄積されているデータがデータ形式変換部102へ送信される。これにより、処理が開始される。
データ形式変換部102は、入力データのデータ形式を上述の第2データ形式に統一するソフトウェアモジュールである。データ形式変換部102は、入力データのデータ形式を判定し、判定結果に応じてデータ形式の変換処理を行なう。データ形式変換部102によって生成されたデータは、データ分離部104へ出力される。データ形式変換部102については、後程詳しく説明する。
データ分離部104は、入力データをセンシングデータ(実データ)とメタデータとに分離するソフトウェアモジュールである。ETLサーバ400は実データの処理のみを行なう場合が多いため、データ分離部104は、センシングデータをデータ抽出部402へ出力し、メタデータをメタデータ変換部106へ出力する。
データ抽出部402は、入力(抽出)されたセンシングデータをデータ変換部404へ出力する。
データ変換部404は、たとえばセンシングデータの種類毎に予め定められた変換ルールに従って、入力データに変換処理を施すソフトウェアモジュールである。たとえば、温度センサによって生成されたセンシングデータの値が電圧値(V)を示すとする。この場合に、変換ルールは、たとえば、電圧値(V)と温度(℃)との変換式を示す。データ変換部404は、たとえば、この変換式に従って、入力された電圧値(V)を温度(℃)に変換する。また、たとえば、センサによって生成されたセンシングデータの桁数が10桁であったとする。この場合に、たとえば、変換ルールとして、センシングデータの桁数を5桁に統一するというルールが規定されているとする。この場合には、データ変換部404は、変換ルールに従って、入力されたセンシングデータの桁数を5桁に変換する。
また、データ変換部404は、センシングデータの値が変換(変更)されると、センシングデータに含まれるIDを変更する。IDの変更を行なう場合に、データ変換部404は、ID管理サーバ500へ新たなIDの発行を要求する。データ変換部404は、ID管理サーバ500から新たなIDを受信すると、該IDをセンシングデータに付与する。データ変換部404は、変換後のセンシングデータをロード部406へ出力する。
ロード部406は、入力データを分析用データDB300へ出力するソフトウェアモジュールである。分析用データDB300においては、ロード部406から入力されたセンシングデータが記憶される。
メタデータ変換部106は、ETLサーバ400においてセンシングデータに施された変換処理に応じて、メタデータに変換処理を施すソフトウェアモジュールである。変換処理が施されたメタデータは、メタデータ送信部108へ出力される。メタデータ変換部106については、後程詳しく説明する。
メタデータ送信部108は、入力データを分析用データDB300へ出力するソフトウェアモジュールである。分析用データDB300においては、メタデータ送信部108から入力されたメタデータが記憶される。
<4−2.データ形式変換部の詳細構成>
図6は、データ形式変換部102の詳細構成を示す図である。図6に示されるように、データ形式変換部102は、データ形式判定部110と、第1変換部112と、第2変換部114とを含んでいる。
データ形式判定部110は、入力データのデータ形式を判定するソフトウェアモジュールである。データ形式判定部110は、入力データが上述の第1、第2及び第3データ形式のいずれのデータ形式であるかを判定する。具体的には、データ形式判定部110は、i)入力データがメタデータを含んでいるか、及び、ii)センシングデータ(実データ)とメタデータとが同一のデータ単位を構成しているか否かを判定する。
データ形式判定部110は、入力データがメタデータを含んでいないと判定すると、入力データの形式が第1データ形式であると判定する。データ形式判定部110は、入力データがメタデータを含んでおり、かつ、センシングデータ及びメタデータの各々が異なるデータ単位を構成していると判定すると、入力データの形式が第2データ形式であると判定する。データ形式判定部110は、入力データがメタデータを含んでおり、かつ、センシングデータ及びメタデータが1つのデータ単位を構成していると判定すると、入力データの形式が第3データ形式であると判定する。
データ形式判定部110は、入力データが第1データ形式であると判定すると、データを第1変換部112へ出力する。データ形式判定部110は、入力データが第2データ形式であると判定すると、データをデータ分離部104へ出力する。データ形式判定部110は、入力データが第3データ形式であると判定すると、データを第2変換部114へ出力する。すなわち、入力データが第2データ形式であると判定された場合には、データ形式の変換処理は行なわれない。
第1変換部112は、第1データ形式のデータを第2データ形式のデータへ変換するソフトウェアモジュールである。第2変換部114は、第3データ形式のデータを第2データ形式のデータへ変換するソフトウェアモジュールである。
図7は、データ形式変換部102において実行されるデータ変換の内容を説明するための図である。図7を参照して、上述のように、第1変換部112は、第1データ形式のデータを第2データ形式へ変換する。具体的には、第1変換部112は、予め定められたデフォルト値を示すメタデータを生成する。さらに、第1変換部112は、ID管理サーバ500(図5)へIDの発行を要求し、受信したIDをセンシングデータ及びメタデータの各々に付与する。これにより、各々に共通のIDが付与された、データ単位の異なる、センシングデータ及びメタデータが生成される。
また、上述のように、第2変換部114は、第3データ形式のデータを第2データ形式へ変換する。具体的には、第2変換部114は、センシングデータとメタデータとを異なるデータ単位に分離する。さらに、第2変換部114は、ID管理サーバ500(図5)へIDの発行を要求し、受信したIDをセンシングデータ及びメタデータの各々に付与する。これにより、各々に共通のIDが付与された、データ単位の異なる、センシングデータ及びメタデータが生成される。
再び図6を参照して、第1変換部112によってデータ形式が変換されたデータ、及び、第2変換部114によってデータ形式が変換されたデータの各々は、データ分離部104へ出力される。
このように、データ形式変換部102においては、入力データの形式が第1及び第3データ形式であったとしても、第2データ形式の出力データが生成される。すなわち、データ形式変換部102においては、入力データの形式に拘わらず第2データ形式のデータが出力される。したがって、データ形式変換部102によれば、入力データの形式に拘わらず共通のデータ形式(第2データ形式)のデータが後工程に提供されるため、後工程におけるデータ処理を簡易にすることができる。
<4−3.メタデータ変換部の詳細構成>
図8は、メタデータ変換部106の詳細構成を示す図である。図8に示されるように、メタデータ変換部106は、問合せ部120と、ID変換部122と、値変換部124とを含んでいる。
問合せ部120は、ETLサーバ400にセンシングデータへの処理内容を問い合わせるソフトウェアモジュールである。たとえば、問合せ部120は、ETLサーバ400に、i)センシングデータのID変更の有無、及び、変更後のID、並びに、ii)センシングデータの値の変換内容を問い合わせる。センシングデータの値の変換内容とは、たとえば、「単位の変換」や「桁数の変換」である。問合せ部120は、問合せに対する応答をETLサーバ400から受信する。
問合せ部120は、ETLサーバ400からの応答内容に応じて、ID変換部122及び値変換部124へ指示を出力する。すなわち、問合せ部120は、
ETLサーバ400においてセンシングデータのIDが変更されている場合には、変更後のIDにメタデータのIDを変更するようにID変換部122へ指示を出力する。また、問合せ部120は、ETLサーバ400においてセンシングデータの値が変更されている場合には、変更後の値と整合の取れる値にメタデータの値を変更するように値変換部124へ指示を出力する。
ID変換部122は、問合せ部120からの指示に従って、メタデータに処理を施すソフトウェアモジュールである。ID変換部122は、たとえば、ETLサーバ400においてセンシングデータのIDが変更されている場合に、センシングデータに含まれている変更後のIDにメタデータに含まれているIDを変更する。一方、ID変換部122は、たとえば、ETLサーバ400においてセンシングデータのIDが変更されていない場合には、メタデータに含まれているIDを変更しない。すなわち、ID変換部122においては、ETLサーバ400においてセンシングデータに含まれているIDが変更された場合にのみ、メタデータに含まれているIDが変更される。この構成によれば、IDも有限であるところ、IDを必要以上に発行する事態を回避することができる。
値変換部124は、問合せ部120からの指示に従って、メタデータに処理を施すソフトウェアモジュールである。値変換部124は、たとえば、ETLサーバ400においてセンシングデータの値が変換(変更)されている場合に、変更後の値と整合の取れる値にメタデータの値を変更する。
図9は、値変換部124におけるメタデータの変換の一例を示す図である。この一例においては、ETLサーバ400において、センシングデータの単位が電圧(V)から温度(℃)に変更されるのに伴ないセンシングデータの値が変換されており、かつ、センシングデータの桁数が10桁から5桁に変換されている。
図9に示されるように、このような場合には、メタデータに含まれる「単位」の項目が「V」から「℃」に変更され、メタデータに含まれる「桁数」の項目が「10桁」から「5桁」に変更される。
再び図8を参照して、値変換部124によって生成されたメタデータは、メタデータ送信部108へ出力される。
このように、メタデータ変換部106においては、ETLサーバ400(ETLツール)においてセンシングデータ(実データ)に施された処理に応じた処理がメタデータに施される。したがって、メタデータ変換部106によれば、既存のETLツールを使用した場合であっても、センシングデータ(実データ)とメタデータとの関係性を正常に保つことができる。
また、本実施の形態において、センシングデータと、該センシングデータの属性を示すメタデータとは、各々が共通のIDを含むことによって対応付けられている。したがって、ETLサーバ400においてセンシングデータのIDが変更された場合に、メタデータのIDが変更されないと、センシングデータとメタデータとの紐付けができなくなる。メタデータ変換部106においては、ETLサーバ400においてセンシングデータに含まれているIDが変更された場合に、メタデータに含まれているIDがセンシングデータに含まれている変更後のIDに変更される。したがって、メタデータ変換部106によれば、ETLサーバ400においてセンシングデータのIDが変更されたとしても、センシングデータとメタデータとの紐付けを維持することができる。
また、ETLサーバ400においてセンシングデータの値が変更された場合に、メタデータの値が変更されないと、センシングデータとメタデータとの整合が取れなくなる場合がある。メタデータ変換部106においては、ETLサーバ400においてセンシングデータに含まれている値が変更された場合に、メタデータに含まれている値が、センシングデータに含まれている変更後の値と整合の取れる値に変更される。したがって、メタデータ変換部106によれば、ETLサーバ400においてセンシングデータの値が変更されたとしても、センシングデータとメタデータとの整合を維持することができる。
[5.動作]
<5−1.データ形式変換処理>
図10は、データ形式変換部102におけるデータ形式変換処理の手順の一例を示すフローチャートである。このフローチャートに示される処理は、センシングデータDB200に蓄積されているデータがデータ形式変換部102に入力された場合に制御部170(データ形式変換部102)によって開始される。
図10を参照して、制御部170は、入力データのデータ形式が第2データ形式であるか否かを判定する(ステップS100)。入力データのデータ形式が第2データ形式であると判定されると(ステップS100においてYES)、処理はステップS140へ移行する。
一方、入力データの形式が第2データ形式でないと判定されると(ステップS100においてNO)、制御部170は、入力データのデータ形式が第1データ形式であるか否かを判定する(ステップS110)。入力データの形式が第1データ形式であると判定されると(ステップS110においてYES)、制御部170は、入力データの形式を第1データ形式から第2データ形式へ変換する(ステップS120)。
一方、入力データの形式が第1データ形式でないと判定されると(ステップS110においてNO)、制御部170は、入力データの形式を第3データ形式から第2データ形式へ変換する(ステップS130)。その後、制御部170は、第2データ形式のデータを出力する(ステップS140)。これにより、データ形式変換部102の出力データの形式が第2データ形式へ統一される。
<5−2.メタデータ変換処理>
図11は、メタデータ変換部106におけるメタデータ変換処理の手順の一例を示すフローチャートである。このフローチャートに示される処理は、メタデータ変換部106へメタデータが入力された場合に制御部170(メタデータ変換部106)によって開始される。
図11を参照して、制御部170は、入力されたメタデータに含まれているIDと同一のIDを含むセンシングデータ(実データ)への処理内容をETLサーバ400へ問い合わせる(ステップS200)。制御部170は、ETLサーバ400から回答を受信したか否かを判定する(ステップS210)。回答が受信されていないと判定されると(ステップS210においてNO)、制御部170は、ステップS210の処理を繰り返す。
一方、回答が受信されたと判定されると(ステップS210においてYES)、制御部170は、受信された回答に基づいて、ETLサーバ400においてセンシングデータのIDが変換されたか否かを判定する(ステップS220)。センシングデータのIDが変換されていないと判定されると(ステップS220においてNO)、処理はステップS240へ移行する。
一方、センシングデータのIDが変換されたと判定されると(ステップS220においてYES)、制御部170は、センシングデータに含まれている変換後のIDにメタデータのIDを変換する(ステップS230)。
制御部170は、ステップS210において受信された回答に基づいて、ETLサーバ400においてセンシングデータの値が変換されたか否かを判定する(ステップS240)。センシングデータの値が変換されていないと判定されると(ステップS240においてNO)、処理はステップS260へ移行する。
一方、センシングデータの値が変換されたと判定されると(ステップS240においてYES)、制御部170は、センシングデータに含まれている値と整合の取れる値にメタデータの値を変換する(ステップS250)。その後、制御部170は、変換後のメタデータを出力する(ステップS260)。これにより、ETLサーバ400において処理が施されたセンシングデータと整合の取れたメタデータが生成される。
[6.特徴]
以上のように、本実施の形態に従うデータ処理サーバ100において、制御部170は、入力データの形式が第1及び第3データ形式である場合に、形式の変換処理を施すことによって、第2データ形式の出力データを生成するように構成されている。すなわち、このデータ処理サーバ100においては、入力データの形式に拘わらず第2データ形式のデータが出力される。したがって、このデータ処理サーバ100によれば、入力データの形式に拘わらず共通のデータ形式(第2データ形式)のデータが後工程に提供されるため、後工程におけるデータ処理を簡易にすることができる。
なお、データ処理サーバ100は、本発明の「データ処理装置」の一例であり、記憶部180は、本発明の「メモリ」の一例であり、制御部170は、本発明の「プロセッサ」の一例である。
[7.変形例]
以上、実施の形態について説明したが、本発明は、上記実施の形態に限定されるものではなく、その趣旨を逸脱しない限りにおいて、種々の変更が可能である。以下、変形例について説明する。但し、以下の変形例は適宜組合せ可能である。
<7−1>
上記実施の形態においては、センシングデータDB200に記憶されているデータ、及び、データ処理サーバ100において処理されるデータがセンシングデータであるとした。しかしながら、センシングデータDB200に記憶されているデータ、及び、データ処理サーバ100において処理されるデータは、必ずしもセンシングデータである必要はない。たとえば、センシングデータDB200に記憶されているデータ、及び、データ処理サーバ100において処理されるデータは、ショッピングサイトにおける各ユーザの購買履歴データや、ゲームサイトにおける各ユーザのスコアデータ等のセンシングデータ以外のデータであってもよい。
<7−2>
また、上記実施の形態においては、データ処理サーバ100において分離されたセンシングデータがETLサーバ400へ出力された。しかしながら、センシングデータは、必ずしもETLサーバ400へ出力されなくてもよい。たとえば、データ処理サーバ100において生成された第2データ形式のデータが単に分析用データDB300へ出力されてもよい。
<7−3>
上記実施の形態においては、データ処理サーバ100において生成されたメタデータが分析用データDB300へ出力された。しかしながら、データ処理サーバ100において生成されたメタデータの出力先は、分析用データDB300に限定されない。たとえば、データ処理サーバ100において生成されたメタデータは、ETLサーバ400のロード部406へ出力されてもよい。この場合には、ロード部406がセンシングデータ及びメタデータを対応付けて、分析用データDB300へ出力する。
10 分析用データ生成システム、100 データ処理サーバ、102 データ形式変換部、104 データ分離部、106 メタデータ変換部、108 メタデータ送信部、110 データ形式判定部、112 第1変換部、114 第2変換部、120 問合せ部、122 ID変換部、124 値変換部、170 制御部、172 CPU、174 RAM、176 ROM、180 記憶部、181 制御プログラム、190 通信I/F、195 バス、200 センシングデータDB、300 分析用データDB、400 ETLサーバ、402 データ抽出部、404 データ変換部、406 ロード部、500 ID管理サーバ。

Claims (7)

  1. 入力データに処理を施すことによって出力データを生成するように構成されたデータ処理装置であって、
    プログラムを記憶するように構成されたメモリと、
    前記プログラムを実行するように構成されたプロセッサとを備え、
    前記入力データの形式としては、第1、第2及び第3データ形式があり、
    前記第1データ形式は、実データを含む形式であり、
    前記第2及び第3データ形式の各々は、前記実データと該実データの属性を示すメタデータとを含む形式であり、
    前記第2データ形式においては、前記実データ及び前記メタデータの各々が異なるデータ単位を構成し、
    前記第3データ形式においては、前記実データ及び前記メタデータが1つのデータ単位を構成し、
    前記プログラムは、前記入力データの形式が前記第1及び第3データ形式である場合に、形式の変換処理を施すことによって、前記第2データ形式の前記出力データを生成するステップを前記プロセッサに実行させるように構成されている、データ処理装置。
  2. 前記プログラムは、前記入力データの形式が前記第2データ形式である場合に、前記第2データ形式の前記出力データを生成するステップをさらに前記プロセッサに実行させるように構成されている、請求項1に記載のデータ処理装置。
  3. 前記プログラムは、前記出力データに含まれる前記実データをETL(Extract/Transform/Load)ツールに出力するステップをさらに前記プロセッサに実行させるように構成されている、請求項1又は請求項2に記載のデータ処理装置。
  4. 前記プログラムは、前記ETLツールにおいて前記実データに施された処理に応じた処理を前記メタデータに施すステップを前記プロセッサに実行させるように構成されている、請求項3に記載のデータ処理装置。
  5. 前記実データは、センサによって生成されたセンシングデータである、請求項1から請求項4のいずれか1項に記載のデータ処理装置。
  6. 入力データに処理を施すことによって出力データを生成するデータ処理方法であって、
    前記入力データの形式としては、第1、第2及び第3データ形式があり、
    前記第1データ形式は、実データを含む形式であり、
    前記第2及び第3データ形式の各々は、前記実データと該実データの属性を示すメタデータとを含む形式であり、
    前記第2データ形式においては、前記実データ及び前記メタデータの各々が異なるデータ単位を構成し、
    前記第3データ形式においては、前記実データ及び前記メタデータが1つのデータ単位を構成し、
    前記データ処理方法は、前記入力データの形式が前記第1及び第3データ形式である場合に、形式の変換処理を施すことによって、前記第2データ形式の前記出力データを生成するステップを含む、データ処理方法。
  7. 入力データに処理を施すことによって出力データを生成する処理をプロセッサに実行させるように構成されたデータ処理プログラムであって、
    前記入力データの形式としては、第1、第2及び第3データ形式があり、
    前記第1データ形式は、実データを含む形式であり、
    前記第2及び第3データ形式の各々は、前記実データと該実データの属性を示すメタデータとを含む形式であり、
    前記第2データ形式においては、前記実データ及び前記メタデータの各々が異なるデータ単位を構成し、
    前記第3データ形式においては、前記実データ及び前記メタデータが1つのデータ単位を構成し、
    前記データ処理プログラムは、前記入力データの形式が前記第1及び第3データ形式である場合に、形式の変換処理を施すことによって、前記第2データ形式の前記出力データを生成するステップを前記プロセッサに実行させるように構成されている、データ処理プログラム。
JP2018167017A 2018-09-06 2018-09-06 データ処理装置、データ処理方法及びデータ処理プログラム Active JP7127440B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2018167017A JP7127440B2 (ja) 2018-09-06 2018-09-06 データ処理装置、データ処理方法及びデータ処理プログラム
CN201980052969.4A CN112567346A (zh) 2018-09-06 2019-02-21 数据处理装置、数据处理方法和数据处理程序
PCT/JP2019/006424 WO2020049759A1 (ja) 2018-09-06 2019-02-21 データ処理装置、データ処理方法及びデータ処理プログラム
US17/268,968 US11468082B2 (en) 2018-09-06 2019-02-21 Data processing apparatus, data processing method, and data processing program stored on computer-readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018167017A JP7127440B2 (ja) 2018-09-06 2018-09-06 データ処理装置、データ処理方法及びデータ処理プログラム

Publications (2)

Publication Number Publication Date
JP2020042345A true JP2020042345A (ja) 2020-03-19
JP7127440B2 JP7127440B2 (ja) 2022-08-30

Family

ID=69721903

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018167017A Active JP7127440B2 (ja) 2018-09-06 2018-09-06 データ処理装置、データ処理方法及びデータ処理プログラム

Country Status (4)

Country Link
US (1) US11468082B2 (ja)
JP (1) JP7127440B2 (ja)
CN (1) CN112567346A (ja)
WO (1) WO2020049759A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005150882A (ja) * 2003-11-12 2005-06-09 Mitsubishi Electric Corp 機器遠隔監視制御システム
JP2008217160A (ja) * 2007-02-28 2008-09-18 Nippon Telegr & Teleph Corp <Ntt> センシングデータ変換システム、データ変換装置、およびデータ変換方法
JP2014096177A (ja) * 2014-01-22 2014-05-22 Fujitsu Ltd データ統合装置、データ統合方法およびデータ統合プログラムを記録したコンピュータ読み取り可能な記録媒体
WO2014122732A1 (ja) * 2013-02-06 2014-08-14 株式会社日立製作所 計算機システム、メタデータ管理方法及び記録媒体
WO2018011895A1 (ja) * 2016-07-12 2018-01-18 株式会社日立製作所 データ処理フロー管理システムおよび方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7002573B2 (en) * 2003-01-16 2006-02-21 1914 Holding Company Method and system for converting engineering data into 3D modeling data
US7555715B2 (en) * 2005-10-25 2009-06-30 Sonic Solutions Methods and systems for use in maintaining media data quality upon conversion to a different data format
US8898236B2 (en) * 2008-10-31 2014-11-25 Netapp, Inc. Automated conversion of versioned data collections
US9934244B2 (en) * 2010-08-13 2018-04-03 At&T Intellectual Property I, L.P. System and method for file format management
EP3067872B1 (en) 2012-09-12 2017-11-22 Omron Corporation Column traveling generating apparatus
US9098558B2 (en) * 2013-04-01 2015-08-04 Oracle International Corporation Enhanced flexibility for users to transform XML data to a desired format
JP5744953B2 (ja) * 2013-04-10 2015-07-08 東芝テック株式会社 取引データ処理装置、取引データ処理方法及びプログラム
CN103838837B (zh) * 2014-02-25 2017-08-15 浙江大学 基于语义模板的遥感元数据集成方法
JP6413258B2 (ja) * 2014-02-28 2018-10-31 キヤノンマーケティングジャパン株式会社 Ediシステム、ediシステムの制御方法、情報処理装置、情報処理装置の制御方法、およびプログラム
WO2015181902A1 (ja) * 2014-05-28 2015-12-03 株式会社日立製作所 計算機システムおよび計算機システム制御方法
US9965487B2 (en) * 2015-06-18 2018-05-08 International Business Machines Corporation Conversion of forms of user data segment IDs in a deduplication system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005150882A (ja) * 2003-11-12 2005-06-09 Mitsubishi Electric Corp 機器遠隔監視制御システム
JP2008217160A (ja) * 2007-02-28 2008-09-18 Nippon Telegr & Teleph Corp <Ntt> センシングデータ変換システム、データ変換装置、およびデータ変換方法
WO2014122732A1 (ja) * 2013-02-06 2014-08-14 株式会社日立製作所 計算機システム、メタデータ管理方法及び記録媒体
JP2014096177A (ja) * 2014-01-22 2014-05-22 Fujitsu Ltd データ統合装置、データ統合方法およびデータ統合プログラムを記録したコンピュータ読み取り可能な記録媒体
WO2018011895A1 (ja) * 2016-07-12 2018-01-18 株式会社日立製作所 データ処理フロー管理システムおよび方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
小田 利彦、他3名: "センシングデータ流通市場におけるメタデータの定義・生成・活用の一方式", 一般社団法人 人工知能学会 第32回全国大会論文集 1C3-OS-8B-01, JPN6021004812, 8 June 2018 (2018-06-08), JP, pages 1 - 2, ISSN: 0004700927 *

Also Published As

Publication number Publication date
US11468082B2 (en) 2022-10-11
JP7127440B2 (ja) 2022-08-30
CN112567346A (zh) 2021-03-26
WO2020049759A1 (ja) 2020-03-12
US20210311959A1 (en) 2021-10-07

Similar Documents

Publication Publication Date Title
EP3975474B1 (en) Methods and apparatuses for chaining service data
WO2020049758A1 (ja) データ処理装置、データ処理方法及びデータ処理プログラム
US20190266194A1 (en) Information analysis system, information analysis method, and recording medium
WO2020049759A1 (ja) データ処理装置、データ処理方法及びデータ処理プログラム
JP6558452B1 (ja) 品質チェック装置、品質チェック方法及びプログラム
WO2020049757A1 (ja) データ処理装置、データ処理方法及びデータ処理プログラム
CN112567348B (zh) 数据处理装置、数据处理方法和计算机可读存储介质
US11927928B2 (en) Output management apparatus, output management method, and program
JP6468377B1 (ja) 出力管理装置、出力管理方法及びプログラム
KR20210128096A (ko) 사물인터넷 플랫폼 간 연동 방법 및 장치
CN111597198A (zh) 一种对于异构资源接入的物联网数据查询方法及相关设备
KR20160127351A (ko) 모바일 단말의 사용자 정보를 이용한 맞춤형 콘텐츠 공유 방법 및 장치
JP6477936B1 (ja) データ処理装置、データ処理方法及びプログラム
JP6477935B1 (ja) 前処理判定装置、前処理判定方法及びプログラム
KR101948437B1 (ko) 모바일 단말의 사용자 정보를 이용한 맞춤형 콘텐츠 공유 방법 및 장치
EP3394819B1 (en) Processing of status data in an electronic device
WO2019159486A1 (ja) セッション制御装置、セッション制御方法及びプログラム
JP2019140558A (ja) 候補抽出装置、候補抽出方法及びプログラム
JP2019169946A (ja) 品質チェック装置、品質チェック方法及びプログラム
JP2019139552A (ja) セッション制御装置、セッション制御方法及びプログラム
KR100723616B1 (ko) 디지털 데이터베이스 공유 방법 및 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201214

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20210330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220328

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220719

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220801

R150 Certificate of patent or registration of utility model

Ref document number: 7127440

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150