CN112567346A - 数据处理装置、数据处理方法和数据处理程序 - Google Patents

数据处理装置、数据处理方法和数据处理程序 Download PDF

Info

Publication number
CN112567346A
CN112567346A CN201980052969.4A CN201980052969A CN112567346A CN 112567346 A CN112567346 A CN 112567346A CN 201980052969 A CN201980052969 A CN 201980052969A CN 112567346 A CN112567346 A CN 112567346A
Authority
CN
China
Prior art keywords
data
format
metadata
processing
data format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201980052969.4A
Other languages
English (en)
Other versions
CN112567346B (zh
Inventor
大和哲二
吉川泰司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Publication of CN112567346A publication Critical patent/CN112567346A/zh
Application granted granted Critical
Publication of CN112567346B publication Critical patent/CN112567346B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

第1数据格式包含实际数据。第2数据格式和第3数据格式均包含实际数据和表示实际数据的属性的元数据。在第2数据格式中,实际数据和元数据各自构成不同的数据单位。在第3数据格式中,实际数据和元数据构成一个数据单位。程序构成为使处理器执行如下步骤:在输入数据的格式为第1数据格式及第3数据格式的情况下,通过实施格式的转换处理,生成第2数据格式的输出数据。

Description

数据处理装置、数据处理方法和数据处理程序
技术领域
本发明涉及数据处理装置、数据处理方法和数据处理程序。
背景技术
WO2014/041826(专利文献1)公开了可适用于数据流通的系统。在该系统中,例如流通传感数据。表示传感数据的属性的元数据与传感数据相对应。在该系统中,通过参照元数据,搜索满足使用者要求的传感数据(参照专利文献1)。
在先技术文献
专利文献
专利文献1:WO2014/041826
发明内容
发明要解决的问题
在考虑某种数据处理的情况下,成为数据处理的对象的数据的格式可能存在多种。例如,可以考虑到如下情况:上述专利文献1中的元数据与实际数据相对应的数据格式和不与元数据对应而仅包含实际数据的数据格式双方成为数据处理对象。但是,如果多种数据格式成为数据处理的对象,则数据处理变得繁杂。
本发明是为了解决这样的问题而完成的,其目的在于提供一种无论所输入的数据的格式如何都能够简化后续处理中的数据处理的数据处理装置、数据处理方法以及数据处理程序。
用于解决问题的方案
本发明的一个方面的数据处理装置构成为通过对输入数据实施处理来生成输出数据。数据处理装置包含存储器和处理器。存储器构成为存储程序。处理器构成为执行程序。输入数据的格式包含第1数据格式、第2数据格式和第3数据格式。第1数据格式是包含实际数据的格式。第2数据格式和第3数据格式均是包含实际数据和表示该实际数据的属性的元数据的格式。在第2数据格式中,实际数据和元数据各自构成不同的数据单位。在第3数据格式中,实际数据和元数据构成一个数据单位。程序构成为使处理器执行如下步骤:在输入数据的格式为第1数据格式及第3数据格式的情况下,通过实施格式的转换处理,生成第2数据格式的输出数据。
在该数据处理装置中,即使输入数据格式是第1数据格式和第3数据格式,也生成第2数据格式的输出数据。即,在该数据处理装置中,无论输入数据的格式如何都输出第2数据格式的数据。因此,根据该数据处理装置,由于无论输入数据的格式如何都将相同数据格式(第2数据格式)的数据提供给后续处理,所以能够使后续处理中的数据处理变得简单。
在上述数据处理装置中,程序可以构成为还使处理器执行如下步骤:在输入数据的格式是第2数据格式的情况下,生成第2数据格式的输出数据。
另外,在上述数据处理装置中,程序可以构成为还使处理器执行将输出数据中包含的实际数据输出到ETL(Extract/Transform/Load)工具的步骤。
此外,在上述数据处理装置中,程序可以构成为使处理器执行对元数据实施与在ETL工具中对实际数据实施的处理对应的处理的步骤。
在该数据处理装置中,对元数据执行与在ETL工具中对实际数据执行的处理相对应的处理。因此,根据该数据处理装置,即使在使用现有的ETL工具的情况下,也能够正常地保持实际数据与元数据的关系性。
在上述数据处理装置中,实际数据可以是由传感器产生的传感数据。
本发明的另一个方面的数据处理方法是通过对输入数据实施处理来生成输出数据的方法。输入数据的格式包含第1数据格式、第2数据格式和第3数据格式。第1数据格式是包含实际数据的格式。第2数据格式和第3数据格式均是包含实际数据和表示实际数据的属性的元数据的格式。在第2数据格式中,实际数据和元数据各自构成不同的数据单位。在第3数据格式中,实际数据和元数据构成一个数据单位。数据处理方法包含如下步骤:当输入数据格式是第1数据格式和第3数据格式时,通过执行格式转换处理来生成第2数据格式的输出数据。
在该数据处理方法中,即使输入数据格式是第1数据格式和第3数据格式,也生成第2数据格式的输出数据。即,在该数据处理方法中,无论输入数据的格式如何都输出第2数据格式的数据。因此,根据该数据处理方法,由于无论输入数据的格式如何都将相同数据格式(第2数据格式)的数据提供给后续处理,所以能够使后续处理中的数据处理变得简单。
本发明的另一方面所涉及的数据处理程序构成为使处理器执行通过对输入数据实施处理来生成输出数据的处理。输入数据格式包含第1数据格式、第2数据格式和第3数据格式。第1数据格式是包含实际数据的格式。第2数据格式和第3数据格式均是包含实际数据和表示实际数据的属性的元数据的格式。在第2数据格式中,实际数据和元数据各自构成不同的数据单位。在第3数据格式中,实际数据和元数据构成一个数据单位。数据处理程序构成为使处理器执行如下步骤:在输入数据的格式为第1数据格式及第3数据格式的情况下,通过实施格式的转换处理,生成第2数据格式的输出数据。
当处理器执行该数据处理程序时,即使输入数据的格式为第1及第3数据格式,也生成第2数据格式的输出数据。即,当由处理器执行该数据处理程序时,无论输入数据的格式如何都输出第2数据格式的数据。因此,根据该数据处理程序,无论输入数据的格式如何都将相同数据格式(第2数据格式)的数据提供给后续处理,所以能够使后续处理中的数据处理变得简单。
发明效果
根据本发明,可以提供一种无论输入的数据的格式如何都能够简化后续处理中的数据处理的数据处理装置、数据处理方法和数据处理程序。
附图说明
图1是用于说明数据处理服务器的概要的图。
图2是表示包含数据处理服务器的分析用数据生成系统的结构的一例的图。
图3是用于说明存储在传感数据DB中的数据的数据格式的种类的图。
图4是表示数据处理服务器的硬件结构的一例的图。
图5是表示数据处理服务器的软件结构的一例和ETL服务器的软件结构的一例的图。
图6是表示数据格式转换部的详细结构的图。
图7是用于说明在数据格式转换部中执行的数据转换的内容的图。
图8是表示元数据转换部的详细结构的图。
图9是表示值转换部中的元数据转换的一例的图。
图10是表示数据格式转换部中的数据格式转换处理的过程的一例的流程图。
图11是表示元数据转换部中的元数据转换处理的过程的一例的流程图。
具体实施方式
以下,使用附图说明本发明的一个方面的实施方式(以下,也称为“本实施方式”)。另外,对图中的相同或对应部分标注相同标号并不再反复其说明。此外,以下说明的本实施方式在全部方面仅是本发明的例示。本实施方式能够在本发明的范围内进行各种改良、变更。即,在实施本发明时,能够根据实施方式适当地采用具体结构。
[1.概要]
图1是用于说明本实施方式的数据处理装置(数据处理服务器)100的概要的图。如图1所示,数据处理服务器100经由网络与传感数据DB(database:数据库)200连接。在传感数据DB 200中存储各种传感数据。数据处理服务器100通过对从传感数据DB 200输入的传感数据实施处理,生成输出数据。数据处理服务器100将所生成的输出数据输出到后续处理。
传感数据DB 200中存储的传感数据的数据格式不一定是统一的。详细内容如后所述,例如,在数据格式中包含:i)包含传感数据(不包含表示该传感数据的属性的元数据(以下也简称为“元数据”。)。)的第1数据格式;ii)包含传感数据和元数据,传感数据和元数据各自构成不同的数据单位的第2数据格式;以及iii)包含传感数据和元数据,传感数据和元数据构成一个数据单位的第3数据格式。
如果将不同数据格式的数据输入到后续处理,则后续处理中的数据处理变得复杂。详细内容如后所述,本实施方式的数据处理服务器100包含数据格式转换部102。即使输入上述第1数据格式和第3数据格式的数据,数据格式转换部102也对输入数据执行数据格式转换处理,从而生成上述第2数据格式的输出数据。即,在该数据处理服务器100中,无论输入数据的格式如何都输出第2数据格式的数据。
因此,根据数据处理服务器100,无论输入数据的格式如何,都将相同数据格式(第2数据格式)的数据提供给后续处理,因此可以简化后续处理中的数据处理。下面依次说明整个系统的结构、数据处理服务器100的硬件结构和软件结构以及数据处理服务器100的动作。
[2.系统结构]
图2是表示包含本实施方式的数据处理服务器100的分析用数据生成系统10的结构的一例的图。分析用数据生成系统10是根据设置在制造现场等的传感器所生成的传感数据,生成数据分析负责人利用的分析用数据的系统。
数据分析负责人大多不是很清楚制造现场等的情况。因此,数据分析负责人大多即使参照了传感数据,也不能正确地把握传感数据是何意义。在本实施方式中,分析用数据包含传感数据(实际数据)和用于帮助数据分析负责人理解传感数据的元数据。元数据表示传感数据的属性。另外,元数据可以在制造现场等生成,也可以在生成分析用数据的过程中生成。
数据分析负责人通过参照与传感数据对应的元数据,可以适当地处理传感数据。其结果,数据分析负责人能够进行适当的数据分析。
在图2的例子中,分析用数据生成系统10包含数据处理服务器100、传感数据DB200、分析用数据DB 300、ETL服务器400和ID管理服务器500。
传感数据DB 200存储由传感器生成的传感数据。作为生成存储在传感数据DB 200中的传感数据的传感器,例如有图像传感器(照相机)、温度传感器、湿度传感器、照度传感器、力传感器、声音传感器、RFID(RadioFrequencyIDentification:射频识别)传感器、红外线传感器、姿势传感器、降雨传感器、放射性传感器和气体传感器等。另外,传感器未必是固设型的,也可以是便携电话、智能手机及平板电脑等移动型的。另外,传感器未必由单一的传感设备构成,也可以由多个传感设备构成。另外,传感器可以以任何目的设置,例如,可以为了工厂中的FA(FactoryAutomation:工厂自动化)及生产管理、城市交通控制、气象等环境测量、保健及防范等而设置。
这样,在传感数据DB 200中存储有由各种传感器生成的传感数据。因此,在传感数据DB 200中存储的数据的格式不一定是统一的。例如,在传感数据DB 200中存储有多种数据格式的数据。
图3是用于说明存储在传感数据DB 200中的数据的数据格式的种类的图。如图3所示,第1数据格式是包含传感数据(实际数据)的(不包含元数据的)数据格式。在第1数据格式中,传感数据包含由传感器生成的值V11。
第2数据格式是包含传感数据和元数据并且传感数据和元数据各自构成不同的数据单位的数据格式。在第2数据格式中,传感数据包含ID(identification)和由传感器生成的值V21。稍后将详细描述如何确定ID。元数据包含ID和表示传感数据属性的值V22。此外,传感数据和元数据通过包含共同的ID(identification)而相互对应。
第3数据格式是包含传感数据和元数据并且传感数据和元数据构成一个数据单位的数据格式。在第3数据格式中,存储由传感器生成的值V31,并且在头部存储元数据。
再次参照图2,ETL服务器400实现所谓的ETL工具。即,ETL服务器400从传感数据DB200提取数据(E),将提取的数据转换为适合分析的状态(T),将转换后的数据加载到分析用数据DB 300(L)。后面将详细说明ETL服务器400。
数据处理服务器100对ETL服务器400向传感数据DB 200请求发送的传感数据事先实施处理。数据处理服务器100将从传感数据DB 200获取的传感数据(实际数据)输出到ETL服务器400,并且对与该传感数据相对应的元数据执行处理。数据处理服务器100将处理后的元数据输出到分析用数据DB 300。稍后将详细描述数据处理服务器100。
分析用数据DB 300存储在ETL服务器400中实施了处理的传感数据和在数据处理服务器100中实施了处理的元数据。存储在分析用数据DB 300中的传感数据以及元数据各自被加工成数据分析负责人能够容易分析。
ID管理服务器500管理第2数据格式中的传感数据(实际数据)和元数据各自包含的ID。ID管理服务器500例如接受来自数据处理服务器100和ETL服务器400的请求,生成与已发行的ID不重复的ID。ID管理服务器500例如生成UUID(Universally UniqueIdentifier)。ID管理服务器500存储各传感数据和各元数据中包含的ID的转变(历史)。即,例如,在某传感数据中包含的ID被变更的情况下,ID管理服务器500将变更前的ID和变更后的ID与该传感数据对应地存储。因此,例如,传感数据的提供者通过访问ID管理服务器500,可以确认自身提供的传感数据是如何使用的。
[3.硬件结构]
图4是表示数据处理服务器100的硬件结构的一例的图。在本实施方式中,数据处理服务器100例如由通用计算机实现。
在图4的例子中,数据处理服务器100包含控制部170、通信I/F(interface:接口)190和存储部180,各结构通过总线195电连接。
控制部170包含中央处理单元(CPU)172、随机存取存储器(RAM)174以及只读存储器(ROM)176等,构成为根据信息处理来控制各结构要素。
通信I/F 190经由因特网与设置在数据处理服务器100的外部的外部装置(例如,传感数据DB 200、分析用数据DB 300、ETL服务器400和ID管理服务器500(图2)进行通信。通信I/F 190例如包含有线LAN(局域网)模块或无线LAN模块。
存储部180例如是硬盘驱动器、固态驱动器等辅助存储装置。存储部180例如存储控制程序181。
控制程序181是由控制部170执行的数据处理服务器100的控制程序。例如,可以通过控制部170执行控制程序181来实现后述的各软件模块。在控制部170执行控制程序181的情况下,控制程序181在RAM 174中展开。并且,控制部170通过由CPU 172解释及执行在RAM174中展开的控制程序181,来控制各结构要素。ETL服务器400的硬件结构可以与数据处理服务器100的硬件结构相同。
[4.软件结构]
<4-1.数据处理服务器和ETL服务器的软件结构>
图5是示出数据处理服务器100的软件结构的一例和ETL服务器400的软件结构的一例的图。如图5所示,数据处理服务器100包含数据格式转换部102、数据分离部104、元数据转换部106和元数据发送部108。数据格式转换部102、数据分离部104、元数据转换部106和元数据发送部108各自是通过控制部170(图4)执行控制程序181而实现的软件模块。
ETL服务器400包含数据提取部402、数据转换部404和加载部406。数据提取部402、数据转换部404和加载部406各自是通过ETL服务器400中包含的未图示的控制部(处理器)执行未图示的控制程序而实现的软件模块。
当ETL服务器400中包含的数据提取部402请求传感数据DB 200发送数据时,这些软件模块开始处理。即,通过数据提取部402向传感数据DB 200发送请求数据发送的API(Application Programming Interface:应用编程接口)指令,将传感数据DB 200中存储的数据向数据格式转换部102发送。由此,开始处理。
数据格式转换部102是将输入数据的数据格式统一为第2数据格式的软件模块。数据格式转换部102判定输入数据的数据格式,根据判定结果执行数据格式的转换处理。由数据格式转换部102生成的数据被输出到数据分离部104。稍后将详细描述数据格式转换部102。
数据分离部104是将输入数据分离为传感数据(实际数据)和元数据的软件模块。由于ETL服务器400仅进行实际数据的处理的情况较多,所以数据分离部104将传感数据输出到数据提取部402,将元数据输出到元数据转换部106。
数据提取部402将输入(提取)的传感数据输出到数据转换部404。
数据转换部404例如是按照对传感数据的每个种类预先设定的转换规则对输入数据实施转换处理的软件模块。例如,假设由温度传感器生成的传感数据的值表示电压值(V)。在这种情况下,转换规则例如表示电压值(V)和温度(℃)的转换式。数据转换部404例如根据该转换式,将所输入的电压值(V)转换为温度(℃)。另外,例如,假设由传感器生成的传感数据的位数为10位。在这种情况下,例如,作为转换规则,规定将传感数据的位数统一为5位的规则。在这种情况下,数据转换部404根据转换规则将输入的传感数据的位数转换为5位。
另外,数据转换部404在传感数据的值被转换(变更)后,变更传感数据中包含的ID。在进行ID的变更的情况下,数据转换部404请求ID管理服务器500发布新的ID。当从ID管理服务器500接收到新ID时,数据转换部404将该ID赋予给传感数据。数据转换部404将转换后的传感数据输出到加载部406。
加载部406是将输入数据输出到分析用数据DB 300的软件模块。在分析用数据DB300中,存储从加载部406输入的传感数据。
元数据转换部106是根据在ETL服务器400中对传感数据执行的转换处理来对元数据执行转换处理的软件模块。将经过转换处理后的元数据输出到元数据发送部108。稍后将详细描述元数据转换部106。
元数据发送部108是将输入数据输出到分析用数据DB 300的软件模块。在分析用数据DB 300中,存储从元数据发送部108输入的元数据。
<4-2.数据格式转换部的详细结构>
图6是表示数据格式转换部102的详细结构的图。如图6所示,数据格式转换部102包含数据格式判定部110、第1转换部112和第2转换部114。
数据格式判定部110是用于判定输入数据的数据格式的软件模块。数据格式判定部110判定输入数据是上述第1、第2和第3数据格式中的哪一个数据格式。具体地,数据格式判定部110判定i)输入数据是否包含元数据以及ii)传感数据(实际数据)和元数据是否构成同一数据单位。
如果数据格式判定部110判定为输入数据不包含元数据,则判定为输入数据的格式是第1数据格式。当数据格式判定部110判定为输入数据包含元数据并且传感数据和元数据各自构成不同的数据单位时,数据格式判定部110判定为输入数据的格式是第2数据格式。当数据格式判定部110判定为输入数据包含元数据并且传感数据和元数据构成一个数据单位时,数据格式判定部110判定为输入数据的格式是第3数据格式。
如果数据格式判定部110判定为输入数据为第1数据格式,则数据格式判定部110将数据输出到第1转换部112。如果数据格式判定部110判定为输入数据为第2数据格式,则数据格式判定部110将数据输出到数据分离部104。如果数据格式判定部110判定为输入数据为第3数据格式,则数据格式判定部110将数据输出到第2转换部114。即,在判定为输入数据是第2数据格式的情况下,不执行数据格式的转换处理。
第1转换部112是将第1数据格式的数据转换为第2数据格式的数据的软件模块。第2转换部114是将第3数据格式的数据转换为第2数据格式的数据的软件模块。
图7是用于说明在数据格式转换部102中执行的数据转换的内容的图。参照图7,如上所述,第1转换部112将第1数据格式的数据转换为第2数据格式。具体而言,第1转换部112生成表示预先确定的默认值的元数据。此外,第1转换部112请求ID管理服务器500(图5)发出ID,将接收到的ID赋予给各个传感数据和元数据。由此,生成分别被赋予了共同的ID、数据单位不同的传感数据及元数据。
另外,如上所述,第2转换部114将第3数据格式的数据转换为第2数据格式。具体地说,第2转换部114将传感数据和元数据分离为不同的数据单位。此外,第2转换部114请求ID管理服务器500(图5)发出ID,并将接收到的ID赋予给各个传感数据和元数据。由此,生成分别被赋予了共同的ID、数据单位不同的传感数据及元数据。
再次参照图6,将数据格式已被第1转换部112转换的数据和数据格式已被第2转换部114转换的数据各自输出到数据分离部104。
这样,即使输入数据格式是第1数据格式和第3数据格式,数据格式转换部102也生成第2数据格式的输出数据。即,在数据格式转换部102中,无论输入数据的格式如何,均输出第2数据格式的数据。因此,根据数据格式转换部102,将与输入数据格式无关的具有共同的数据格式(第2数据格式)的数据提供给后续处理,从而可以简化后续处理中的数据处理。
<4-3.元数据转换部的详细结构>
图8是示出元数据转换部106的详细结构的图。如图8所示,元数据转换部106包含问询部120、ID转换部122和值转换部124。
问询部120是向ETL服务器400问询对传感数据的处理内容的软件模块。例如,问询部120向ETL服务器400问询i)有无传感数据的ID变更及变更后的ID、以及ii)传感数据的值的转换内容。所谓传感数据的值的转换内容,例如是“单位的转换”或“位数的转换”。问询部120从ETL服务器400接收对问询的应答。
问询部120根据来自ETL服务器400的应答内容,向ID转换部122及值转换部124输出指示。即,如果传感数据的ID在ETL服务器400中被变更,则问询部120向ID转换部122输出指示以将元数据的ID变更为变更后的ID。另外,当ETL服务器400中变更了传感数据的值时,问询部120向值转换部124输出指示,以将元数据的值变更为与变更后的值匹配的值。
ID转换部122是根据来自问询部120的指示对元数据进行处理的软件模块。例如,当在ETL服务器400中变更了传感数据的ID时,ID转换部122将元数据中包含的ID变更为传感数据中包含的变更后的ID。另一方面,例如在ETL服务器400中传感数据的ID未被变更时,ID转换部122不变更元数据中包含的ID。即,在ID转换部122中,只有当在ETL服务器400中变更了传感数据所包含的ID时,才变更元数据中包含的ID。根据该结构,鉴于ID也有限,能够避免发行必要以上的ID的情况。
值转换部124是根据来自问询部120的指示对元数据进行处理的软件模块。值转换部124例如在ETL服务器400中转换(变更)了传感数据的值的情况下,将元数据的值变更为与变更后的值匹配的值。
图9是表示值转换部124中的元数据的转换的一例的图。在这个例子中,在ETL服务器400中,随着传感数据的单位从电压(V)变更为温度(℃),传感数据的值被转换,并且传感数据的位数从10位转换为5位。
如图9所示,在这种情况下,元数据中包含的“单位”的项目从“V”变更为“℃”,元数据中包含的“位数”的项目从“10位”变更为“5位”。
再次参照图8,由值转换部124生成的元数据被输出到元数据发送部108。
因此,在元数据转换部106中,对元数据执行与在ETL服务器400(ETL工具)中对传感数据(实际数据)执行的处理相对应的处理。因此,根据元数据转换部106,即使在使用现有的ETL工具的情况下,也能够正常地保持传感数据(实际数据)和元数据的关系性。
此外,在本实施方式中,传感数据和表示该传感数据的属性的元数据通过各自包含共同的ID而对应起来。因此,在ETL服务器400中变更了传感数据的ID的情况下,如果不改变元数据的ID,则传感数据无法与元数据相关联。在ETL服务器400变更了传感数据中包含的ID的情况下,元数据转换部106将元数据中包含的ID变更为传感数据中包含的变更后的ID。因此,根据元数据转换部106,即使在ETL服务器400中变更了传感数据的ID,也可以维持传感数据与元数据的关联。
另外,在ETL服务器400中变更了传感数据的值的情况下,如果不改变元数据的值,则有时传感数据和元数据无法匹配。在ETL服务器400中变更了传感数据所包含的值的情况下,在元数据转换部106中将元数据所包含的值变更为与传感数据所包含的变更后的值匹配的值。因此,根据元数据转换部106,即使在ETL服务器400中变更了传感数据的值,也可以维持传感数据和元数据之间的匹配。
[5.动作]
<5-1.数据格式转换处理>
图10是示出数据格式转换部102中的数据格式转换处理的过程的一例的流程图。在传感数据DB 200中存储的数据被输入到数据格式转换部102的情况下,由控制部170(数据格式转换部102)开始该流程图所示的处理。
参照图10,控制部170判定输入数据的数据格式是否为第2数据格式(步骤S100)。如果判定为输入数据的数据格式是第2数据格式(步骤S100中是),则处理转移到步骤S140。
另一方面,若判定为输入数据的格式不是第2数据格式(步骤S100中否),则控制部170判定输入数据的数据格式是否为第1数据格式(步骤S110)。如果判定为输入数据格式是第1数据格式(步骤S110中是),则控制部170将输入数据格式从第1数据格式转换为第2数据格式(步骤S120)。
另一方面,如果判定为输入数据的格式不是第1数据格式(步骤S110中否),则控制部170将输入数据的格式从第3数据格式转换为第2数据格式(步骤S130)。之后,控制部170输出第2数据格式的数据(步骤S140)。由此,数据格式转换部102的输出数据的格式被统一为第2数据格式。
<5-2.元数据转换处理>
图11是示出元数据转换部106中的元数据转换处理的过程的一例的流程图。当将元数据输入到元数据转换部106时,控制部170(元数据转换部106)开始该流程图所示的处理。
参照图11,控制部170向ETL服务器400问询对包含与输入的元数据所包含的ID相同的ID的传感数据(实际数据)的处理内容(步骤S200)。控制部170判定是否从ETL服务器400接收到回答(步骤S210)。若判定为未接收到回答(步骤S210中否),则控制部170重复步骤S210的处理。
另一方面,若判定为接收到回答(步骤S210中是),则控制部170基于接收到的回答,判定在ETL服务器400中是否转换了传感数据的ID(步骤S220)。如果判定为传感数据的ID未被转换(步骤S220中否),则处理转移到步骤S240。
另一方面,如果判定为传感数据的ID被转换(步骤S220中是),则控制部170将元数据的ID转换为传感数据中包含的转换后的ID(步骤S230)。
控制部170根据在步骤S210中接收到的回答,判定在ETL服务器400中是否转换了传感数据的值(步骤S240)。当判定为传感数据的值未被转换时(在步骤S240中否),处理转移到步骤S260。
另一方面,如果判定为传感数据的值被转换(步骤S240中是),则控制部170将元数据的值转换为与传感数据中包含的值匹配的值(步骤S250)。之后,控制部170输出转换后的元数据(步骤S260)。由此,生成与在ETL服务器400中实施了处理后的传感数据匹配的元数据。
[6.特征]
如上所述,在本实施方式的数据处理服务器100中,控制部170构成为在输入数据的格式为第1数据格式及第3数据格式的情况下,实施格式的转换处理,生成第2数据格式的输出数据。即,在数据处理服务器100中,无论输入数据格式如何都输出第2数据格式的数据。因此,根据数据处理服务器100,无论输入数据的格式如何,都将相同数据格式(第2数据格式)的数据提供给后续处理,因此可以简化后续处理中的数据处理。
此外,数据处理服务器100是本发明的“数据处理装置”的一例,存储部180是本发明的“存储器”的一例,控制部170是本发明的“处理器”的一例。
[7.变形例]
以上,对本发明的实施方式进行了说明,但是,本发明不限于上述实施方式,能够在不脱离本发明的主旨的范围内进行各种变更。以下,对变形例进行说明。其中,以下的变形例可以适当组合。
<7-1>
在上述实施方式中,在传感数据DB 200中存储的数据和在数据处理服务器100中处理的数据是传感数据。然而,在传感数据DB 200中存储的数据和在数据处理服务器100中处理的数据无需一定是传感数据。例如,在传感数据DB 200中存储的数据和在数据处理服务器100中处理的数据也可以是购物网站中的各用户的购买历史数据、游戏网站中的各用户的分数数据等传感数据以外的数据。
<7-2>
此外,在上述实施方式中,在数据处理服务器100中分离出的传感数据被输出到ETL服务器400。然而,传感数据不一定要输出到ETL服务器400。例如,在数据处理服务器100中生成的第2数据格式的数据也可以仅输出到分析用数据DB 300。
<7-3>
在上述实施方式中,在数据处理服务器100中生成的元数据被输出到分析用数据DB 300。但是,在数据处理服务器100中生成的元数据的输出目的地不限于分析用数据DB300。例如,在数据处理服务器100中生成的元数据也可以输出到ETL服务器400的加载部406。在这种情况下,加载部406将传感数据和元数据对应起来并输出到分析数据DB 300。
标号说明
10:分析用数据生成系统;100:数据处理服务器;102:数据格式转换部;104:数据分离部;106:元数据转换部;108:元数据发送部;110:数据格式判定部;112:第1转换部;114:第2转换部;120:问询部;122:ID转换部;124:值转换部;170:控制部;172:CPU;174:RAM;176:ROM;180:存储部;181:控制程序;190:通信I/F;195:总线;200:传感数据DB;300:分析用数据DB;400:ETL服务器;402:数据提取部;404:数据转换部;406:加载部;500:ID管理服务器。

Claims (7)

1.一种数据处理装置,其构成为通过对输入数据实施处理而生成输出数据,该数据处理装置具备:
存储器,其构成为存储程序;以及
处理器,其构成为执行所述程序,
作为所述输入数据的格式,存在第1数据格式、第2数据格式和第3数据格式,
所述第1数据格式是包含实际数据的格式,
所述第2数据格式和所述第3数据格式各自是包含所述实际数据和表示该实际数据的属性的元数据的格式,
在所述第2数据格式中,所述实际数据和所述元数据各自构成不同的数据单位,
在所述第3数据格式中,所述实际数据和所述元数据构成一个数据单位,
所述程序构成为使所述处理器执行如下步骤:在所述输入数据的格式是所述第1数据格式和第3数据格式的情况下,通过实施格式的转换处理,生成所述第2数据格式的所述输出数据。
2.根据权利要求1所述的数据处理装置,其中,
所述程序构成为还使所述处理器执行如下步骤:在所述输入数据的格式是所述第2数据格式的情况下,生成所述第2数据格式的所述输出数据。
3.根据权利要求1或2所述的数据处理装置,其中,
所述程序构成为还使所述处理器执行将所述输出数据中包含的所述实际数据输出到ETL工具的步骤,所述ETL是Extract/Transform/Load即提取/转换/加载。
4.根据权利要求3所述的数据处理装置,其中,
所述程序构成为使所述处理器执行如下步骤:对所述元数据实施与在所述ETL工具中对所述实际数据实施的处理对应的处理。
5.根据权利要求1~4中的任一项所述的数据处理装置,其中,
所述实际数据是由传感器生成的传感数据。
6.一种数据处理方法,通过对输入数据实施处理来生成输出数据,
作为所述输入数据的格式,存在第1数据格式、第2数据格式和第3数据格式,
所述第1数据格式是包含实际数据的格式,
所述第2数据格式和所述第3数据格式各自是包含所述实际数据和表示该实际数据的属性的元数据的格式,
在所述第2数据格式中,所述实际数据和所述元数据各自构成不同的数据单位,
在所述第3数据格式中,所述实际数据和所述元数据构成一个数据单位,
所述数据处理方法包含如下步骤:在所述输入数据的格式是所述第1数据格式和所述第3数据格式的情况下,通过实施格式转换处理,生成所述第2数据格式的所述输出数据。
7.一种数据处理程序,构成为使处理器执行通过对输入数据实施处理来生成输出数据的处理,
作为所述输入数据的格式,存在第1数据格式、第2数据格式和第3数据格式,
所述第1数据格式是包含实际数据的格式,
所述第2数据格式和第3数据格式各自是包含所述实际数据和表示该实际数据的属性的元数据的格式,
在所述第2数据格式中,所述实际数据和所述元数据各自构成不同的数据单位,
在所述第3数据格式中,所述实际数据和所述元数据构成一个数据单位,
所述数据处理程序构成为使所述处理器执行如下步骤:在所述输入数据的格式是所述第1数据格式和所述第3数据格式的情况下,通过实施格式的转换处理,生成所述第2数据格式的所述输出数据。
CN201980052969.4A 2018-09-06 2019-02-21 数据处理装置、数据处理方法和计算机可读存储介质 Active CN112567346B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018-167017 2018-09-06
JP2018167017A JP7127440B2 (ja) 2018-09-06 2018-09-06 データ処理装置、データ処理方法及びデータ処理プログラム
PCT/JP2019/006424 WO2020049759A1 (ja) 2018-09-06 2019-02-21 データ処理装置、データ処理方法及びデータ処理プログラム

Publications (2)

Publication Number Publication Date
CN112567346A true CN112567346A (zh) 2021-03-26
CN112567346B CN112567346B (zh) 2024-07-30

Family

ID=69721903

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980052969.4A Active CN112567346B (zh) 2018-09-06 2019-02-21 数据处理装置、数据处理方法和计算机可读存储介质

Country Status (4)

Country Link
US (1) US11468082B2 (zh)
JP (1) JP7127440B2 (zh)
CN (1) CN112567346B (zh)
WO (1) WO2020049759A1 (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217160A (ja) * 2007-02-28 2008-09-18 Nippon Telegr & Teleph Corp <Ntt> センシングデータ変換システム、データ変換装置、およびデータ変換方法
CN103838837A (zh) * 2014-02-25 2014-06-04 浙江大学 基于语义模板的遥感元数据集成方法
US20140307271A1 (en) * 2013-04-10 2014-10-16 Toshiba Tec Kabushiki Kaisha Receipt data processing device and method for processing receipt data
US20140372561A1 (en) * 2012-09-12 2014-12-18 Omron Corporation Data flow control order generating apparatus and sensor managing apparatus
JP2015162159A (ja) * 2014-02-28 2015-09-07 キヤノンマーケティングジャパン株式会社 情報処理システム、およびその制御方法、プログラム
WO2018011895A1 (ja) * 2016-07-12 2018-01-18 株式会社日立製作所 データ処理フロー管理システムおよび方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7002573B2 (en) * 2003-01-16 2006-02-21 1914 Holding Company Method and system for converting engineering data into 3D modeling data
JP2005150882A (ja) 2003-11-12 2005-06-09 Mitsubishi Electric Corp 機器遠隔監視制御システム
US7555715B2 (en) * 2005-10-25 2009-06-30 Sonic Solutions Methods and systems for use in maintaining media data quality upon conversion to a different data format
US8898236B2 (en) * 2008-10-31 2014-11-25 Netapp, Inc. Automated conversion of versioned data collections
US9934244B2 (en) * 2010-08-13 2018-04-03 At&T Intellectual Property I, L.P. System and method for file format management
JPWO2014122732A1 (ja) 2013-02-06 2017-01-26 株式会社日立製作所 計算機システム、メタデータ管理方法及び記録媒体
US9098558B2 (en) * 2013-04-01 2015-08-04 Oracle International Corporation Enhanced flexibility for users to transform XML data to a desired format
JP6211693B2 (ja) * 2014-05-28 2017-10-11 株式会社日立製作所 計算機システムおよび計算機システム制御方法
US9965487B2 (en) * 2015-06-18 2018-05-08 International Business Machines Corporation Conversion of forms of user data segment IDs in a deduplication system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217160A (ja) * 2007-02-28 2008-09-18 Nippon Telegr & Teleph Corp <Ntt> センシングデータ変換システム、データ変換装置、およびデータ変換方法
US20140372561A1 (en) * 2012-09-12 2014-12-18 Omron Corporation Data flow control order generating apparatus and sensor managing apparatus
US20140307271A1 (en) * 2013-04-10 2014-10-16 Toshiba Tec Kabushiki Kaisha Receipt data processing device and method for processing receipt data
CN103838837A (zh) * 2014-02-25 2014-06-04 浙江大学 基于语义模板的遥感元数据集成方法
JP2015162159A (ja) * 2014-02-28 2015-09-07 キヤノンマーケティングジャパン株式会社 情報処理システム、およびその制御方法、プログラム
WO2018011895A1 (ja) * 2016-07-12 2018-01-18 株式会社日立製作所 データ処理フロー管理システムおよび方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐建辉, 胥兵: "MAPINFO数据格式和中国地球空间数据格式的转换实现", 工程地球物理学报, no. 01, 25 February 2005 (2005-02-25), pages 44 - 49 *

Also Published As

Publication number Publication date
JP7127440B2 (ja) 2022-08-30
CN112567346B (zh) 2024-07-30
JP2020042345A (ja) 2020-03-19
US20210311959A1 (en) 2021-10-07
WO2020049759A1 (ja) 2020-03-12
US11468082B2 (en) 2022-10-11

Similar Documents

Publication Publication Date Title
JP2019503537A (ja) ショートリンクを処理する方法及び装置並びにショートリンクサーバ
CN112567347B (zh) 数据处理装置、数据处理方法和计算机可读存储介质
CN104205071A (zh) 信息处理系统、信息处理方法、通信终端、服务器和控制方法以及其控制程序
EP1422958A1 (en) Permission token management system, permission token management method, program and recording medium
US20190266194A1 (en) Information analysis system, information analysis method, and recording medium
US11556604B2 (en) Electronic device and search keyword processing method thereof
CN112567346B (zh) 数据处理装置、数据处理方法和计算机可读存储介质
CN112567348B (zh) 数据处理装置、数据处理方法和计算机可读存储介质
JP7371410B2 (ja) 情報処理装置、及び、情報処理プログラム
CN111602123B (zh) 预处理判定装置、预处理判定方法以及程序
KR20210128096A (ko) 사물인터넷 플랫폼 간 연동 방법 및 장치
US11927928B2 (en) Output management apparatus, output management method, and program
CN111566630B (zh) 数据处理装置、数据处理方法及程序
US20230010098A1 (en) Network access via device identifier
US20220188435A1 (en) Access control method, apparatus and device, and storage medium
US20210382750A1 (en) Output management apparatus, output management method, and program
JP6759638B2 (ja) 文字変換装置、情報端末、文字変換システム、変換候補登録方法、および、変換候補登録プログラム
JP2020008928A (ja) ゲートウェイ装置及びデータ転送方法
CN115314160A (zh) 一种移动通信数据流量管理方法及装置
KR20040011072A (ko) 파일 업데이트 시스템 및 방법
JPH04182759A (ja) データ転送システムおよびデータ転送装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant