KR20130076062A - Management system and method for distributed data quality - Google Patents
Management system and method for distributed data quality Download PDFInfo
- Publication number
- KR20130076062A KR20130076062A KR1020110144472A KR20110144472A KR20130076062A KR 20130076062 A KR20130076062 A KR 20130076062A KR 1020110144472 A KR1020110144472 A KR 1020110144472A KR 20110144472 A KR20110144472 A KR 20110144472A KR 20130076062 A KR20130076062 A KR 20130076062A
- Authority
- KR
- South Korea
- Prior art keywords
- user
- data
- function
- target data
- heterogeneity
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/56—Provisioning of proxy services
- H04L67/565—Conversion or adaptation of application format or content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
본 발명은 분산 데이터 상호운용 방안에 관한 것으로, 더욱 상세하게는, 분산 데이터의 상호운용을 위하여 데이터 변환 및 정제에 필요한 업무규칙을 사용자 정의 기반으로 동적으로 생성 및 활용하여 데이터 변환 및 정제를 수행함으로써, 데이터의 품질을 향상시키기 위한 분산 데이터 품질 관리 시스템 및 그 방법에 관한 것이다.The present invention relates to a distributed data interoperability method, and more particularly, by performing data transformation and purification by dynamically generating and utilizing a business rule necessary for data transformation and purification based on user definition for interoperability of distributed data. In addition, the present invention relates to a distributed data quality management system and method for improving the quality of data.
정보시스템의 구축이 일반화되어 있는 환경에서, 업무 생산성 향상과 효율성 증대를 위한 데이터의 활용이 중요하다.In an environment where information system construction is common, it is important to use data to improve work productivity and efficiency.
즉, 데이터 분석 및 가공을 통해 업무 운영과 의사결정을 지원하므로 정보시스템에 구축되어 있는 데이터의 관리는 무척 중요하며, 특히 유효하지 못한 데이터가 업무에 활용되지 않도록 관리되어야 한다.In other words, the data management in the information system is very important because it supports business operation and decision-making through data analysis and processing, and especially, it must be managed so that invalid data is not utilized for work.
오류 데이터를 비롯하여 유효하지 못한 데이터의 정제나 제외 작업을 통해 데이터의 품질을 관리해야 하며, 이에 따라, 업무에 활용하기 위해서는 유효하고 정확한 데이터를 사용하고, 활용하기 위한 데이터의 중복을 제거하고 일관성을 유지할 수 있도록 데이터를 관리하는 것이 중요하다. The quality of the data must be managed through cleanup or exclusion of invalid data, including error data. Therefore, valid and accurate data must be used for business purposes. It's important to manage your data so you can maintain it.
IT 환경의 발달에 따라 정보시스템의 구축은 헤아릴 수 없이 증가되었으며, 업무 생산성 향상과 효율성 증대를 위해 적재된 데이터의 상호운용이 필요하다.With the development of the IT environment, the construction of information systems has increased innumerably, and the interoperability of the loaded data is needed to improve work productivity and efficiency.
다시 말해, 산재된 정보시스템에 적재된 분산 데이터의 상호운용을 위해서는 데이터 품질에 영향을 줄 수 있는 정확성, 중복성, 일관성을 고려하여 데이터 신뢰성을 보장해야 하며, 특히, 분산 환경으로 구축된 레거시 정보시스템들의 데이터 상호운용은 데이터 품질관리의 필요성이 강조된다.In other words, for interoperability of distributed data loaded in interspersed information systems, data reliability must be guaranteed in consideration of accuracy, redundancy, and consistency that can affect data quality. In particular, legacy information systems built as distributed environments Their data interoperability emphasizes the need for data quality control.
본 발명은 상기한 사정을 감안하여 창출된 것으로서, 본 발명에서 도달하고자 하는 목적은, 마스터운용장치가 가변 설정되는 사용자정의함수 및 내장함수 중 적어도 어느 하나를 포함하는 사용자정의규칙을 생성하여 저장하고, 특정 프로세스 처리에 따라 각각의 레거시 시스템을 운용하는 슬레이브운용장치를 대상으로 기준데이터와의 연계를 위한 대상데이터를 요청하며, 상기 슬레이브운용장치가 상기 요청에 따라 자체 데이터베이스에 저장된 상기 대상데이터를 제공하면, 상기 마스터운용장치가 상기 저장된 사용자정의규칙의 적용을 통해 하나 이상의 상기 슬레이브운용장치를 대상으로 수집된 대상데이터에 대한 데이터 값 조정을 수행하는 분산 데이터 품질 관리 시스템 및 그 방법을 제공함으로써, 데이터 변환 및 정제에 필요한 업무규칙을 사용자 정의 기반으로 동적으로 생성 및 활용하여 데이터 변환 및 정제를 수행하는데 있다.The present invention has been made in view of the above circumstances, and an object of the present invention is to generate and store a custom rule including at least one of a user-defined function and a built-in function in which the master operating apparatus is variably set. Requesting target data for linkage with reference data to a slave operating device operating each legacy system according to a specific process, and the slave operating device provides the target data stored in its own database according to the request. In this case, the master operating device provides a distributed data quality management system and method for performing data value adjustment on the collected target data for one or more of the slave operating devices through the application of the stored user-defined rule. Business rules for conversion and refining It is to perform data transformation and purification by dynamically generating and utilizing based on user definition.
본 발명에서 도달하고자 하는 또 다른 목적은, 가변 설정되는 사용자정의함수 및 내장함수 중 적어도 어느 하나를 포함하는 사용자정의규칙을 생성하여 저장하고, 각각의 레거시 시스템을 운용하는 하나 이상의 타 운용장치로부터 기준데이터와의 연계를 위한 대상데이터를 수집하며, 상기 저장된 사용자정의규칙의 적용을 통해 상기 수집된 대상데이터에 대한 데이터 값 조정을 수행하는 운용장치 및 그 동작 방법을 제공함으로써, 데이터 변환 및 정제에 필요한 업무규칙을 사용자 정의 기반으로 동적으로 생성 및 활용하여 데이터 변환 및 정제를 수행하는데 있다.Still another object of the present invention is to generate and store a custom rule including at least one of a variable and a user-defined function that is variablely set, and reference from one or more other operating devices that operate each legacy system. Collecting the target data for linkage with the data, and providing an operating device and an operation method for adjusting the data value for the collected target data through the application of the stored user-defined rules, necessary for data conversion and purification It is to perform data transformation and purification by dynamically creating and utilizing business rules based on user definition.
상기 목적을 달성하기 위한 본 발명의 제 1 관점에 따른 분산 데이터 품질 관리 시스템은, 자체 레거시 시스템의 운용을 위한 데이터베이스를 구비하며, 데이터연계요청에 따라 상기 데이터베이스에 저장된 대상데이터를 제공하는 슬레이브운용장치; 및 특정 프로세스 처리에 따라 하나 이상의 상기 슬레이브운용장치를 대상으로 상기 데이터연계요청을 전달하여 기준데이터와의 연계를 위한 상기 대상데이터를 수집하며, 가변 설정되는 사용자정의함수 및 내장함수 중 적어도 어느 하나를 포함하는 사용자정의규칙의 적용을 통해 상기 수집된 대상데이터에 대한 데이터 값 조정을 수행하는 마스터운용장치를 포함하는 것을 특징으로 한다.Distributed data quality management system according to the first aspect of the present invention for achieving the above object, the slave operating device having a database for operating its own legacy system, and provides the target data stored in the database in accordance with the data connection request ; And collecting the target data for linkage with reference data by transmitting the data linkage request to one or more slave operating devices according to a specific process, and selecting at least one of a user-defined function and a built-in function that are variably set. It characterized in that it comprises a master operating device for performing a data value adjustment for the collected target data through the application of a user-defined rule including.
바람직하게는, 상기 마스터운용장치는, 사용자인터페이스(UI: User Interface)를 통한 사용자 요청에 따라 상기 사용자정의함수를 설정하고, 상기 설정된 사용자정의함수에 대한 문법검증 및 실행검증을 통해 오류 검증을 수행하며, 상기 오류 검증이 완료된 사용자정의함수를 상기 사용자정의규칙으로 설정하여 저장하는 것을 특징으로 한다.Preferably, the master operating device sets the user defined function according to a user request through a user interface (UI), and performs error verification through grammar verification and execution verification of the set user defined function. The user-defined function of which error verification is completed is set as the user-defined rule and stored.
바람직하게는, 상기 마스터운용장치는, 상기 사용자인터페이스를 통한 사용자 요청에 따라, 상기 내장함수와 연동되는 상기 사용자정의함수를 설정하는 것을 특징으로 한다.Preferably, the master operating device, characterized in that for setting the user-defined function in conjunction with the built-in function, in response to a user request through the user interface.
바람직하게는, 상기 마스터운용장치는, 기 정의된 이질성판단기준을 통해 상기 대상데이터와 상기 기준데이터 간의 비교를 수행하여 상기 대상데이터에 대한 유효성을 판단하고, 상기 판단 결과 유효성이 없을 경우, 상기 사용자정의규칙을 적용하여 상기 대상데이터에 대한 데이터 값을 조정하는 것을 특징으로 한다.Preferably, the master operating device, by comparing the target data and the reference data through a predetermined heterogeneity determination criterion to determine the validity of the target data, if the determination result is not valid, the user It is characterized by adjusting a data value for the target data by applying a definition rule.
바람직하게는, 구조 이질성, 표현 이질성, 관계 이질성, 및 의미 이질성 중 적어도 어느 하나를 포함하는 상기 이질성판단기준을 통해 상기 대상데이터에 대한 유효성을 판단하는 것을 특징으로 한다.Preferably, the validity of the object data is determined through the heterogeneity determination criteria including at least one of structural heterogeneity, expression heterogeneity, relationship heterogeneity, and semantic heterogeneity.
바람직하게는, 상기 마스터운용장치는, 상기 사용자정의규칙의 적용을 통해, 데이터 유형 변환, 범위 한정, 표현 불일치 조정, 논리 오류 조정, 및 무의미 조정 중 적어도 어느 하나를 수행하여 상기 수집된 대상데이터에 대한 상기 데이터 값 조정을 수행하는 것을 특징으로 한다.Preferably, the master operating apparatus performs at least one of data type conversion, range limitation, expression mismatch adjustment, logic error adjustment, and meaningless adjustment through the application of the user-defined rule to the collected target data. And adjusting the data value for the data.
상기 목적을 달성하기 위한 본 발명의 제 2 관점에 따른 운용장치는, 가변 설정되는 사용자정의함수 및 내장함수 중 적어도 어느 하나를 포함하는 사용자정의규칙을 생성하여 저장하는 변환규칙설정부; 각각의 레거시 시스템을 운용하는 하나 이상의 타 운용장치로부터 기준데이터와의 연계를 위한 대상데이터를 수집하는 데이터수집부; 및 상기 저장된 사용자정의규칙을 적용하여 상기 수집된 대상데이터에 대한 데이터 값 조정을 수행하는 변환처리부를 포함하는 것을 특징으로 한다.Operation apparatus according to a second aspect of the present invention for achieving the above object, a conversion rule setting unit for generating and storing a user-defined rule including at least one of a variable and a user-defined function is set variable; A data collector for collecting target data for linkage with reference data from one or more other operating apparatuses for operating each legacy system; And a conversion processor configured to apply the stored user definition rule to adjust data values of the collected target data.
바람직하게는, 상기 변환규칙설정부는, 사용자인터페이스(UI: User Interface)를 통한 사용자 요청에 따라 상기 사용자정의함수를 설정하고, 상기 설정된 사용자정의함수에 대한 문법검증 및 실행검증을 통해 오류 검증을 수행하며, 상기 오류 검증이 완료된 사용자정의함수를 상기 사용자정의규칙으로 설정하여 저장하는 것을 특징으로 한다.Preferably, the conversion rule setting unit sets the user defined function according to a user request through a user interface (UI), and performs error verification through grammar verification and execution verification of the set user defined function. The user-defined function of which error verification is completed is set as the user-defined rule and stored.
바람직하게는, 상기 변환규칙설정부는, 상기 사용자인터페이스를 통한 사용자 요청에 따라, 상기 내장함수와 연동되는 상기 사용자정의함수를 설정하는 것을 특징으로 한다.Preferably, the conversion rule setting unit, according to the user request through the user interface, characterized in that for setting the user-defined function linked to the built-in function.
바람직하게는, 상기 변환처리부는, 기 정의된 이질성판단기준을 통해 상기 대상데이터와 상기 기준데이터 간의 비교를 수행하여 상기 대상데이터에 대한 유효성을 판단하고, 상기 판단 결과 유효성이 없을 경우, 상기 사용자정의규칙을 적용하여 상기 대상데이터에 대한 데이터 값을 조정하는 것을 특징으로 한다.Preferably, the conversion processor determines the validity of the target data by performing comparison between the target data and the reference data through a predetermined heterogeneity determination criterion, and when the determination result is not valid, the user definition. The data value for the target data is adjusted by applying a rule.
바람직하게는, 상기 변환처리부는, 구조 이질성, 표현 이질성, 관계 이질성, 및 의미 이질성 중 적어도 어느 하나를 포함하는 상기 이질성판단기준을 통해 상기 대상데이터에 대한 유효성을 판단하는 것을 특징으로 한다.Preferably, the conversion processing unit is characterized in that it determines the validity of the target data through the heterogeneity determination criteria including at least one of structural heterogeneity, expression heterogeneity, relationship heterogeneity, and semantic heterogeneity.
바람직하게는, 상기 변환처리부는, 상기 사용자정의규칙의 적용을 통해, 데이터 유형 변환, 범위 한정, 표현 불일치 조정, 논리 오류 조정, 및 무의미 조정 중 적어도 어느 하나를 수행하여 상기 수집된 대상데이터에 대한 상기 데이터 값 조정을 수행하는 것을 특징으로 한다.Preferably, the conversion processing unit performs at least one of data type conversion, range limitation, expression mismatch adjustment, logic error adjustment, and meaningless adjustment through the application of the user-defined rule to the collected target data. The data value adjustment is performed.
상기 목적을 달성하기 위한 본 발명의 제 3 관점에 따른 분산 데이터 품질 관리 방법이 제공되며: 이 방법은, 마스터운용장치가 가변 설정되는 사용자정의함수 및 내장함수 중 적어도 어느 하나를 포함하는 사용자정의규칙을 생성하여 저장하는 변환규칙설정단계; 상기 마스터운용장치가 특정 프로세스 처리에 따라 각각의 레거시 시스템을 운용하는 슬레이브운용장치를 대상으로 기준데이터와의 연계를 위한 대상데이터를 요청하는 데이터요청단계; 상기 슬레이브운용장치가 상기 요청에 따라 자체 데이터베이스에 저장된 상기 대상데이터를 제공하는 대상데이터제공단계; 및 상기 마스터운용장치가 상기 저장된 사용자정의규칙의 적용을 통해 하나 이상의 상기 슬레이브운용장치를 대상으로 수집된 대상데이터에 대한 데이터 값 조정을 수행하는 데이터변환처리단계를 포함하는 것을 특징으로 한다.A distributed data quality management method according to a third aspect of the present invention for achieving the above object is provided: The method includes a custom rule including at least one of a user-defined function and a built-in function in which the master operating apparatus is variably set. A conversion rule setting step of generating and storing a message; A data request step of requesting, by the master operating device, target data for linkage with reference data, to a slave operating device operating each legacy system according to a specific process process; A target data providing step of providing, by the slave operating apparatus, the target data stored in its own database according to the request; And a data conversion processing step of performing, by the master operating device, data value adjustment on the collected target data to one or more of the slave operating devices through the application of the stored user defined rule.
바람직하게는, 상기 변환규칙설정단계는, 사용자인터페이스(UI: User Interface)를 통한 사용자 요청에 따라 상기 사용자정의함수를 설정하는 함수설정단계; 상기 설정된 사용자정의함수에 대한 문법검증 및 실행검증을 통해 오류 검증을 수행하는 오류검증단계; 및 상기 오류 검증이 완료된 사용자정의함수를 상기 사용자정의규칙으로 설정하여 저장하는 함수저장단계를 포함하는 것을 특징으로 한다.Preferably, the conversion rule setting step includes: a function setting step of setting the user defined function according to a user request through a user interface (UI); An error verification step of performing error verification through grammar verification and execution verification of the set user defined function; And a function storage step of setting and storing the user-defined function whose error verification is completed as the user-defined rule.
바람직하게는, 상기 함수설정단계는, 상기 사용자인터페이스를 통한 사용자 요청에 따라, 상기 내장함수와 연동되는 상기 사용자정의함수를 설정하는 것을 특징으로 한다.Preferably, the function setting step, characterized in that for setting the user-defined function in conjunction with the built-in function, in response to a user request through the user interface.
바람직하게는, 상기 데이터변환처리단계는, 기 정의된 이질성판단기준을 통해 상기 대상데이터와 상기 기준데이터 간의 비교를 수행하여 상기 대상데이터에 대한 유효성을 판단하는 유효성판단단계; 및 상기 판단 결과 유효성이 없을 경우, 상기 사용자정의규칙을 적용하여 상기 대상데이터에 대한 데이터 값을 조정하는 데이터조정단계를 포함하는 것을 특징으로 한다.Preferably, the data conversion processing step, the validity determination step of determining the validity of the target data by performing a comparison between the target data and the reference data through a predefined heterogeneity determination criteria; And a data adjustment step of adjusting a data value for the target data by applying the user definition rule when the determination result is not valid.
바람직하게는, 상기 유효성판단단계는, 구조 이질성, 표현 이질성, 관계 이질성, 및 의미 이질성 중 적어도 어느 하나를 포함하는 상기 이질성판단기준을 통해 상기 대상데이터에 대한 유효성을 판단하는 것을 특징으로 한다.Preferably, the validity determining step is characterized by determining the validity of the target data through the heterogeneity determination criteria including at least one of structural heterogeneity, expression heterogeneity, relationship heterogeneity, and semantic heterogeneity.
바람직하게는, 상기 데이터조정단계는, 상기 사용자정의규칙의 적용을 통해, 데이터 유형 변환, 범위 한정, 표현 불일치 조정, 논리 오류 조정, 및 무의미 조정 중 적어도 어느 하나를 수행하여 상기 수집된 대상데이터에 대한 상기 데이터 값 조정을 수행하는 것을 특징으로 한다.Advantageously, the data adjustment step includes at least one of data type conversion, range limitation, expression mismatch adjustment, logic error adjustment, and meaningless adjustment through the application of the user-defined rule to the collected target data. And adjusting the data value for the data.
상기 목적을 달성하기 위한 본 발명의 제 3 관점에 따른 운용장치의 동작 방법은, 가변 설정되는 사용자정의함수 및 내장함수 중 적어도 어느 하나를 포함하는 사용자정의규칙을 생성하여 저장하는 변환규칙설정단계; 각각의 레거시 시스템을 운용하는 하나 이상의 타 운용장치로부터 기준데이터와의 연계를 위한 대상데이터를 수집하는 데이터수집단계; 및 상기 저장된 사용자정의규칙의 적용을 통해 상기 수집된 대상데이터에 대한 데이터 값 조정을 수행하는 변환처리단계를 포함하는 것을 특징으로 한다.A method of operating an operating apparatus according to a third aspect of the present invention for achieving the above object comprises: a conversion rule setting step of generating and storing a user defined rule including at least one of a variable and a user defined function to be variable set; A data collection step of collecting target data for linkage with reference data from one or more other operating apparatuses that operate each legacy system; And a conversion processing step of performing data value adjustment on the collected target data by applying the stored user defined rule.
바람직하게는, 상기 변환규칙설정단계는, 사용자인터페이스(UI: User Interface)를 통한 사용자 요청에 따라 상기 사용자정의함수를 설정하는 함수설정단계; 상기 설정된 사용자정의함수에 대한 문법검증 및 실행검증을 통해 오류 검증을 수행하는 오류검증단계; 및 상기 오류 검증이 완료된 사용자정의함수를 상기 사용자정의규칙으로 설정하여 저장하는 함수저장단계를 포함하는 것을 특징으로 한다.Preferably, the conversion rule setting step includes: a function setting step of setting the user defined function according to a user request through a user interface (UI); An error verification step of performing error verification through grammar verification and execution verification of the set user defined function; And a function storage step of setting and storing the user-defined function whose error verification is completed as the user-defined rule.
바람직하게는, 상기 함수설정단계는, 상기 사용자인터페이스를 통한 사용자 요청에 따라, 상기 내장함수와 연동되는 상기 사용자정의함수를 설정하는 것을 특징으로 한다.Preferably, the function setting step, characterized in that for setting the user-defined function in conjunction with the built-in function, in response to a user request through the user interface.
바람직하게는, 상기 변환처리단계는, 기 정의된 이질성판단기준을 통해 상기 대상데이터와 상기 기준데이터 간의 비교를 수행하여 상기 대상데이터에 대한 유효성을 판단하는 유효성판단단계; 및 상기 판단 결과 유효성이 없을 경우, 상기 사용자정의규칙을 적용하여 상기 대상데이터에 대한 데이터 값을 조정하는 데이터조정단계를 포함하는 것을 특징으로 한다.Preferably, the conversion processing step, the validity determination step of determining the validity of the target data by performing a comparison between the target data and the reference data through a predetermined heterogeneity determination criteria; And a data adjustment step of adjusting a data value for the target data by applying the user definition rule when the determination result is not valid.
바람직하게는, 상기 유효성판단단계는, 구조 이질성, 표현 이질성, 관계 이질성, 및 의미 이질성 중 적어도 어느 하나를 포함하는 상기 이질성판단기준을 통해 상기 대상데이터에 대한 유효성을 판단하는 것을 특징으로 한다.Preferably, the validity determining step is characterized by determining the validity of the target data through the heterogeneity determination criteria including at least one of structural heterogeneity, expression heterogeneity, relationship heterogeneity, and semantic heterogeneity.
바람직하게는, 상기 데이터조정단계는, 상기 사용자정의규칙의 적용을 통해, 데이터 유형 변환, 범위 한정, 표현 불일치 조정, 논리 오류 조정, 및 무의미 조정 중 적어도 어느 하나를 수행하여 상기 수집된 대상데이터에 대한 상기 데이터 값 조정을 수행하는 것을 특징으로 한다.Advantageously, the data adjustment step includes at least one of data type conversion, range limitation, expression mismatch adjustment, logic error adjustment, and meaningless adjustment through the application of the user-defined rule to the collected target data. And adjusting the data value for the data.
상기 목적을 달성하기 위한 본 발명의 제 5 관점에 따른 컴퓨터 판독 가능 기록매체는, 가변 설정되는 사용자정의함수 및 내장함수 중 적어도 어느 하나를 포함하는 사용자정의규칙을 생성하여 저장하는 변환규칙설정단계; 각각의 레거시 시스템을 운용하는 하나 이상의 타 운용장치로부터 기준데이터와의 연계를 위한 대상데이터를 수집하는 데이터수집단계; 및 상기 저장된 사용자정의규칙의 적용을 통해 상기 수집된 대상데이터에 대한 데이터 값 조정을 수행하는 변환처리단계를 실행하기 위한 명령어를 포함하는 것을 특징으로 한다.According to a fifth aspect of the present invention, there is provided a computer-readable recording medium comprising: a conversion rule setting step of generating and storing a user-defined rule including at least one of a variable and a user-defined function; A data collection step of collecting target data for linkage with reference data from one or more other operating apparatuses that operate each legacy system; And instructions for executing a conversion processing step of performing data value adjustment on the collected target data by applying the stored user defined rule.
바람직하게는, 상기 변환규칙설정단계는, 사용자인터페이스(UI: User Interface)를 통한 사용자 요청에 따라 상기 사용자정의함수를 설정하는 함수설정단계; 상기 설정된 사용자정의함수에 대한 문법검증 및 실행검증을 통해 오류 검증을 수행하는 오류검증단계; 및 상기 오류 검증이 완료된 사용자정의함수를 상기 사용자정의규칙으로 설정하여 저장하는 함수저장단계를 실행하기 위한 명령어를 포함하는 것을 특징으로 한다.Preferably, the conversion rule setting step includes: a function setting step of setting the user defined function according to a user request through a user interface (UI); An error verification step of performing error verification through grammar verification and execution verification of the set user defined function; And a command for executing a function storing step of setting and storing the user-defined function whose error verification is completed as the user-defined rule.
바람직하게는, 상기 함수설정단계는, 상기 사용자인터페이스를 통한 사용자 요청에 따라, 상기 내장함수와 연동되는 상기 사용자정의함수를 설정하는 것을 특징으로 한다.Preferably, the function setting step, characterized in that for setting the user-defined function in conjunction with the built-in function, in response to a user request through the user interface.
바람직하게는, 상기 변환처리단계는, 기 정의된 이질성판단기준을 통해 상기 대상데이터와 상기 기준데이터 간의 비교를 수행하여 상기 대상데이터에 대한 유효성을 판단하는 유효성판단단계; 및 상기 판단 결과 유효성이 없을 경우, 상기 사용자정의규칙을 적용하여 상기 대상데이터에 대한 데이터 값을 조정하는 데이터조정단계를 실행하기 위한 명령어를 포함하는 것을 특징으로 한다.Preferably, the conversion processing step, the validity determination step of determining the validity of the target data by performing a comparison between the target data and the reference data through a predetermined heterogeneity determination criteria; And a command for executing a data adjusting step of adjusting a data value for the target data by applying the user-defined rule when the determination result is not valid.
바람직하게는, 상기 유효성판단단계는, 구조 이질성, 표현 이질성, 관계 이질성, 및 의미 이질성 중 적어도 어느 하나를 포함하는 상기 이질성판단기준을 통해 상기 대상데이터에 대한 유효성을 판단하는 것을 특징으로 한다.Preferably, the validity determining step is characterized by determining the validity of the target data through the heterogeneity determination criteria including at least one of structural heterogeneity, expression heterogeneity, relationship heterogeneity, and semantic heterogeneity.
바람직하게는, 상기 데이터조정단계는, 상기 사용자정의규칙의 적용을 통해, 데이터 유형 변환, 범위 한정, 표현 불일치 조정, 논리 오류 조정, 및 무의미 조정 중 적어도 어느 하나를 수행하여 상기 수집된 대상데이터에 대한 상기 데이터 값 조정을 수행하는 것을 특징으로 한다.Advantageously, the data adjustment step includes at least one of data type conversion, range limitation, expression mismatch adjustment, logic error adjustment, and meaningless adjustment through the application of the user-defined rule to the collected target data. And adjusting the data value for the data.
이에, 본 발명에 따른 분산 데이터 품질 관리 시스템 및 그 방법에 의하면, 분산 데이터의 상호운용을 위하여 데이터 변환 및 정제에 필요한 업무규칙을 사용자 정의 기반으로 동적으로 생성 및 활용함으로써, 데이터 변환 및 정제에 폭넓게 사용하여 데이터의 품질을 향상시킬 수 있으며, 나아가 레거시(Legacy) 정보시스템의 변화를 최소화할 수 있다.Therefore, according to the distributed data quality management system and method according to the present invention, by dynamically generating and utilizing a business rule necessary for data conversion and purification for user-based basis for the interoperability of distributed data, it is widely used for data conversion and purification Use it to improve the quality of data and further minimize changes in legacy information systems.
도 1은 본 발명의 실시예에 따른 분산 데이터 품질 관리 시스템의 개략적인 구성도.
도 2는 본 발명의 실시예에 따른 운용장치의 개략적인 구성도.
도 3은 본 발명의 실시예에 따른 사용자인터페이스를 설명하기 위한 도면.
도 4는 본 발명의 실시예에 따른 사용자정의함수를 설명하기 위한 도면.
도 5는 본 발명의 실시예에 따른 데이터 값 조정 예를 설명하기 위한 도면.
도 6은 본 발명의 실시예에 따른 분산 데이터 품질 관리 시스템의 동작 방법을 설명하기 위한 개략적인 순서도.
도 7은 본 발명의 실시예에 따른 운용장치의 동작 방법을 설명하기 위한 개략적인 순서도.1 is a schematic configuration diagram of a distributed data quality management system according to an embodiment of the present invention.
2 is a schematic configuration diagram of an operation apparatus according to an embodiment of the present invention.
3 is a view for explaining a user interface according to an embodiment of the present invention.
4 is a view for explaining a user-defined function according to an embodiment of the present invention.
5 is a diagram for explaining an example of data value adjustment according to an embodiment of the present invention;
6 is a schematic flowchart illustrating an operating method of a distributed data quality management system according to an embodiment of the present invention.
7 is a schematic flowchart illustrating a method of operating an operating apparatus according to an embodiment of the present invention.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대하여 설명한다.Hereinafter, preferred embodiments of the present invention will be described with reference to the accompanying drawings.
도 1은 본 발명의 실시예에 따른 분산 데이터 품질 관리 시스템의 개략적인 구성도를 도시한다.1 is a schematic structural diagram of a distributed data quality management system according to an embodiment of the present invention.
도 1에 도시한 바와 같이, 상기 시스템은, 각각의 레거시 시스템을 운용하는 하나 이상의 슬레이브운용장치(200)를 대상으로 기준데이터와의 연계를 위한 대상데이터를 수집하여 데이터 값 조정을 수행하는 마스터운용장치(100); 및 마스터운용장치(100)로부터의 데이터연계요청에 따라 대상데이터를 제공하는 슬레이브장치(200)를 포함하는 구성을 갖는다. 여기서, 마스터운용장치(100) 및 슬레이브운용장치(200)의 경우, 동일한 도메인(Domain) 또는 상이한 도메인 상에서 각각의 레거시(Legacy) 시스템을 운용하는 서버를 지칭하는 것으로서, 분산 데이터 수집이 요구되는 프로세스를 처리하기 위한 에이전트(Agent)가 탑재된 동일한 구성을 가지나, 프로세스 처리 주체에 따라 마스터운용장치(100) 또는 슬레이브운용장치(200)로 구분될 수 있다. 이에, 이하의 설명에서는 에이전트를 통한 프로세스 처리에 따라 분산 데이터를 수집하는 운용장치를 마스터운용장치(100)로 상정하여 설명하며, 동시에 마스터운용장치(200)의 요청에 따라 자체 저장된 대상데이터를 제공하는 운용장치를 슬레이브운용장치(200)로 상정하여 설명하기로 한다.As shown in FIG. 1, the system collects target data for linkage with reference data to one or more
마스터운용장치(100)는 데이터 값 조정을 위한 사용자정의규칙을 생성하여 저장한다.The
보다 구체적으로, 마스터운용장치(100)는 사용자인터페이스(UI: User Interface)를 통한 사용자 요청에 따라 상기 사용자정의함수를 설정한다. 즉, 마스터운용장치(100)는 도 3에 도시한 바와 같이 사용자인터페이스를 제공하고, 제공된 사용자인터페이스를 통한 사용자 요청에 따라 사용자정의함수를 설정하게 된다. 여기서, 상기 사용자정의함수의 경우, 도 4에 도시한 바와 같이 예컨대, 업무규칙을 구분하기 위한 함수 유형, 함수명, 함수에 포함되는 매개변수, 함수 실행결과 값을 반환하는 데이터 유형, 함수에 대한 설명, 함수의 용례와 함수에서 실제 수행되는 알고리즘인 함수내용이 포함될 수 있으며, 상기 함수내용의 경우 자바 스크립트로 작성하여 자바 스크립트 실행 엔진에 의해서 실행되도록 함으로써, 데이터 변환 시스템에서 사용하기 위한 컴파일이나 재실행 없이 실행 도중에 사용이 가능하도록 한다. 한편, 사용자정의함수는 제공된 사용자인터페이스를 통한 사용자 요청에 따라, 내장함수와 연동되도록 설정될 수 있다. 여기서, 내장함수는, 시스템에서 자체 제공되는 함수를 지칭하는 것으로, 예컨대, 날짜/시간 함수, 수학/삼각 함수, 통계 함수, 논리 함수 등으로 구성될 수 있다. 또한, 마스터운용장치(100)는 사용자인터페이스를 통해 설정된 사용자정의함수에 대한 오류 검증을 수행한다. 즉, 마스터운용장치(100)는 사용자정의함수에 대해 문법적인 검증을 수행함과 아울러, 예컨대, 자바 스크립트에서 사용될 수 있도록 변수를 변환하고, 이에 대한 테스팅을 통해 함수의 오류를 검증하게 된다. 나아가, 마스터운용장치(100)는 오류 검증이 완료된 사용자정의함수를 상기 사용자정의규칙으로 설정하여 저장한다. 즉, 마스터운용장치(100)는 문법 검증 및 실행 검증을 통한 오류 검증이 완료된 사용자정의함수를 사용자정의규칙으로 저장함으로써, 이후, 데이터 변환 및 정제가 요구되는 시점에 해당 저장된 사용자정의규칙이 호출되어 적용될 수 있도록 한다.More specifically, the
또한, 마스터운용장치(100)는 하나 이상의 슬레이브운용장치(200)를 대상으로 기준데이터와의 연계를 위한 대상데이터를 요청하여 수집한다.In addition, the
보다 구체적으로, 마스터운용장치(100)는 에이전트 구동에 따른 특정 프로세스 처리에 따라 각각의 레거시 시스템을 운용하는 하나 이상의 슬레이브운용장치(200)를 대상으로 데이터연계요청을 전달함으로써, 기준데이터와의 연계를 위한 대상데이터를 수집하게 된다. 이와 관련하여, 슬레이브운용장치(100)는 마스터운용장치(100)로부터 데이터연계요청이 수신될 경우, 자체 저장된 대상데이터를 추출하여 제공함으로써, 마스터운용장치(100)의 프로세스 처리 동작을 지원하게 된다.More specifically, the
나아가, 마스터운용장치(100)는 저장된 사용자정의규칙의 적용을 통해 수집된 대상데이터에 대한 데이터 값 조정을 수행한다.In addition, the
보다 구체적으로, 마스터운용장치(100)는 하나 이상의 상기 슬레이브운용장치(200)로부터 수집된 대상데이터에 대한 유효성을 판단한다. 즉, 마스터운용장치(100)는 기 정의된 이질성판단기준 예컨대, 구조 이질성, 표현 이질성, 관계 이질성, 및 의미 이질성을 기준으로 상기 대상데이터와 상기 기준데이터 간의 비교를 수행하여 상기 대상데이터에 대한 유효성을 판단한다. 나아가, 마스터운용장치(100)는 상기 판단 결과 유효성이 없을 경우, 상기 사용자정의규칙을 적용하여 상기 대상데이터에 대한 데이터 값을 조정한다. 즉, 마스터운용장치(100)는 상기 대상데이터에 대한 유효성이 없는 것으로 판단될 경우, 저장된 사용자정의규칙을 호출하여 예컨대, 데이터 유형 변환, 범위 한정, 표현 불일치 조정, 논리 오류 조정, 및 무의미 조정 등을 수행하여 상기 대상데이터에 대한 데이터 값을 조정함으로써, 해당 대상데이터를 기준데이터와 연계하기 위한 유효한 데이터로 변환하게 된다. 예컨대, 도 5에 도시한 바와 같이, 운용장치1의 데이터 'Korea'와 운용장치2의 데이터 'KOR'와 연계될 경우, 운용장치1의 데이터 'Korea'와 운용장치2의 데이터 'KOR'은 자연어 처리에 의해 상이하지만, 의미적으로는 동일하다. 이때, 상술한 과정을 통해 생성된 사용자정의규칙을 호출하여 적용함으로써, 운용장치1의 'Korea'는 운용장치2로 연계시에는 'KOR'로 변환 및 정제가 수행되고, 운용장치2의 'KOR'은 운용장치1로 연계시 'Korea'로 변환 및 정제가 수행되게 된다.More specifically, the
이하에서는, 도 2를 참조하여, 본 발명의 실시예에 따른 마스터운용장치(100)의 구체적인 구성을 설명하도록 한다.Hereinafter, with reference to Figure 2, it will be described a specific configuration of the
즉, 도 2에 도시한 바와 같이 마스터운용장치(100)는 사용자정의규칙을 생성하여 저장하는 변환규칙설정부(110), 기준데이터와의 연계를 위한 대상데이터를 수집하는 데이터수집부(120), 및 사용자정의규칙을 적용하여 상기 수집된 대상데이터에 대한 데이터 값 조정을 수행하는 변환처리부(130)을 포함하는 구성을 갖는다.That is, as shown in FIG. 2, the
변환규칙설정부(110)는 사용자인터페이스(UI: User Interface)를 통한 사용자 요청에 따라 상기 사용자정의함수를 설정한다.The conversion
보다 구체적으로, 변환규칙설정부(110)는 도 3에 도시한 바와 같이 사용자인터페이스를 제공하고, 제공된 사용자인터페이스를 통한 사용자 요청에 따라 사용자정의함수를 설정하게 된다. 여기서, 상기 사용자정의함수의 경우, 도 4에 도시한 바와 같이 예컨대, 업무규칙을 구분하기 위한 함수 유형, 함수명, 함수에 포함되는 매개변수, 함수 실행결과 값을 반환하는 데이터 유형, 함수에 대한 설명, 함수의 용례와 함수에서 실제 수행되는 알고리즘인 함수내용이 포함될 수 있으며, 상기 함수내용의 경우 자바 스크립트로 작성하여 자바 스크립트 실행 엔진에 의해서 실행되도록 함으로써, 데이터 변환 시스템에서 사용하기 위한 컴파일이나 재실행 없이 실행 도중에 사용이 가능하도록 한다. 한편, 사용자정의함수는 제공된 사용자인터페이스를 통한 사용자 요청에 따라, 내장함수와 연동되도록 설정될 수 있다. 여기서, 내장함수는, 시스템에서 자체 제공되는 함수를 지칭하는 것으로, 예컨대, 날짜/시간 함수, 수학/삼각 함수, 통계 함수, 논리 함수 등으로 구성될 수 있다. More specifically, the conversion
또한, 변환규칙설정부(110)는 사용자인터페이스를 통해 설정된 사용자정의함수에 대한 오류 검증을 수행한다.In addition, the conversion
보다 구체적으로, 변환규칙설정부(110)는 사용자정의함수에 대해 문법적인 검증을 수행함과 아울러, 예컨대, 자바 스크립트에서 사용될 수 있도록 변수를 변환하고, 이에 대한 테스팅을 통해 함수의 오류를 검증하게 된다.More specifically, the conversion
나아가, 변환규칙설정부(110)는 오류 검증이 완료된 사용자정의함수를 상기 사용자정의규칙으로 설정하여 저장한다.Further, the conversion
보다 구체적으로, 변환규칙설정부(110)는 문법 검증 및 실행 검증을 통한 오류 검증이 완료된 사용자정의함수를 사용자정의규칙으로 저장함으로써, 이후, 데이터 변환 및 정제가 요구되는 시점에 해당 저장된 사용자정의규칙이 호출되어 적용될 수 있도록 한다.More specifically, the conversion
데이터수집부(120)는 하나 이상의 슬레이브운용장치(200)를 대상으로 기준데이터와의 연계를 위한 대상데이터를 요청하여 수집한다.The
보다 구체적으로, 데이터수집부(120)는 에이전트 구동에 따른 특정 프로세스 처리에 따라 각각의 레거시 시스템을 운용하는 하나 이상의 슬레이브운용장치(200)를 대상으로 데이터연계요청을 전달함으로써, 기준데이터와의 연계를 위한 대상데이터를 수집하게 된다.More specifically, the
변환처리부(130)는 하나 이상의 상기 슬레이브운용장치(200)로부터 수집된 대상데이터에 대한 유효성을 판단한다.The
보다 구체적으로, 변환처리부(130)는 기 정의된 이질성판단기준 예컨대, 구조 이질성, 표현 이질성, 관계 이질성, 및 의미 이질성을 기준으로 상기 대상데이터와 상기 기준데이터 간의 비교를 수행하여 상기 대상데이터에 대한 유효성을 판단한다.More specifically, the
나아가, 변환처리부(130)는 상기 판단 결과 유효성이 없을 경우, 상기 사용자정의규칙을 적용하여 상기 대상데이터에 대한 데이터 값을 조정한다.Further, when the determination result is not valid, the
보다 구체적으로, 변환처리부(130)는 상기 대상데이터에 대한 유효성이 없는 것으로 판단될 경우, 저장된 사용자정의규칙을 호출하여 예컨대, 데이터 유형 변환, 범위 한정, 표현 불일치 조정, 논리 오류 조정, 및 무의미 조정 등을 수행하여 상기 대상데이터에 대한 데이터 값을 조정함으로써, 해당 대상데이터를 기준데이터와 연계하기 위한 유효한 데이터로 변환하게 된다. 예컨대, 도 5에 도시한 바와 같이, 운용장치1의 데이터 'Korea'와 운용장치2의 데이터 'KOR'와 연계될 경우, 운용장치1의 데이터 'Korea'와 운용장치2의 데이터 'KOR'은 자연어 처리에 의해 상이하지만, 의미적으로는 동일하다. 이때, 상술한 과정을 통해 생성된 사용자정의규칙을 호출하여 적용함으로써, 운용장치1의 'Korea'는 운용장치2로 연계시에는 'KOR'로 변환 및 정제가 수행되고, 운용장치2의 'KOR'은 운용장치1로 연계시 'Korea'로 변환 및 정제가 수행되게 된다.More specifically, when it is determined that the validity of the target data is not valid, the
이상에서 살펴본 바와 같이, 본 발명에 따른 분산 데이터 품질 관리 시스템에 따르면, 분산 데이터의 상호운용을 위하여 데이터 변환 및 정제에 필요한 업무규칙을 사용자 정의 기반으로 동적으로 생성 및 활용함으로써, 데이터 변환 및 정제에 폭넓게 사용하여 데이터의 품질을 향상시킬 수 있으며, 나아가 레거시(Legacy) 정보시스템의 변화를 최소화할 수 있다.As described above, according to the distributed data quality management system according to the present invention, by dynamically generating and utilizing a business rule required for data conversion and purification for user interaction based on the user definition for distributed data interoperability, It can be used extensively to improve the quality of data and further minimize changes in legacy information systems.
이하에서는, 도 6 및 도 7을 참조하여, 본 발명의 실시예에 따른 분산 데이터 품질 관리 방법을 설명하기로 한다. 여기서, 전술한 도 1 내지 도 5에 도시된 구성은 설명의 편의를 위해 해당 참조번호를 언급하여 설명하기로 한다.Hereinafter, a distributed data quality management method according to an embodiment of the present invention will be described with reference to FIGS. 6 and 7. Here, the configurations shown in FIGS. 1 to 5 will be described with reference to corresponding reference numerals for convenience of explanation.
우선, 도 6을 참조하여 본 발명의 실시예에 따른 분산 데이터 품질 관리 시스템의 동작 방법을 설명하기로 한다.First, an operation method of a distributed data quality management system according to an embodiment of the present invention will be described with reference to FIG. 6.
먼저, 마스터운용장치(100)가 데이터 값 조정을 위한 사용자정의규칙을 생성하여 저장한다(S110-S120).First, the
바람직하게는, 마스터운용장치(100)는 사용자인터페이스(UI: User Interface)를 통한 사용자 요청에 따라 상기 사용자정의함수를 설정한다. 즉, 마스터운용장치(100)는 도 3에 도시한 바와 같이 사용자인터페이스를 제공하고, 제공된 사용자인터페이스를 통한 사용자 요청에 따라 사용자정의함수를 설정하게 된다. 여기서, 상기 사용자정의함수의 경우, 도 4에 도시한 바와 같이 예컨대, 업무규칙을 구분하기 위한 함수 유형, 함수명, 함수에 포함되는 매개변수, 함수 실행결과 값을 반환하는 데이터 유형, 함수에 대한 설명, 함수의 용례와 함수에서 실제 수행되는 알고리즘인 함수내용이 포함될 수 있으며, 상기 함수내용의 경우 자바 스크립트로 작성하여 자바 스크립트 실행 엔진에 의해서 실행되도록 함으로써, 데이터 변환 시스템에서 사용하기 위한 컴파일이나 재실행 없이 실행 도중에 사용이 가능하도록 한다. 한편, 사용자정의함수는 제공된 사용자인터페이스를 통한 사용자 요청에 따라, 내장함수와 연동되도록 설정될 수 있다. 여기서, 내장함수는, 시스템에서 자체 제공되는 함수를 지칭하는 것으로, 예컨대, 날짜/시간 함수, 수학/삼각 함수, 통계 함수, 논리 함수 등으로 구성될 수 있다. 또한, 마스터운용장치(100)는 사용자인터페이스를 통해 설정된 사용자정의함수에 대한 오류 검증을 수행한다. 즉, 마스터운용장치(100)는 사용자정의함수에 대해 문법적인 검증을 수행함과 아울러, 예컨대, 자바 스크립트에서 사용될 수 있도록 변수를 변환하고, 이에 대한 테스팅을 통해 함수의 오류를 검증하게 된다. 나아가, 마스터운용장치(100)는 오류 검증이 완료된 사용자정의함수를 상기 사용자정의규칙으로 설정하여 저장한다. 즉, 마스터운용장치(100)는 문법 검증 및 실행 검증을 통한 오류 검증이 완료된 사용자정의함수를 사용자정의규칙으로 저장함으로써, 이후, 데이터 변환 및 정제가 요구되는 시점에 해당 저장된 사용자정의규칙이 호출되어 적용될 수 있도록 한다.Preferably, the
그리고 나서, 마스터운용장치(100)는 하나 이상의 슬레이브운용장치(200)를 대상으로 기준데이터와의 연계를 위한 대상데이터를 요청하여 수집한다(S130-S160).Then, the
바람직하게는, 마스터운용장치(100)는 에이전트 구동에 따른 특정 프로세스 처리에 따라 각각의 레거시 시스템을 운용하는 하나 이상의 슬레이브운용장치(200)를 대상으로 데이터연계요청을 전달함으로써, 기준데이터와의 연계를 위한 대상데이터를 수집하게 된다. 이와 관련하여, 슬레이브운용장치(100)는 마스터운용장치(100)로부터 데이터연계요청이 수신될 경우, 자체 저장된 대상데이터를 추출하여 제공함으로써, 마스터운용장치(100)의 프로세스 처리 동작을 지원하게 된다.Preferably, the
이후, 마스터운용장치(100)는 저장된 사용자정의규칙의 적용을 통해 수집된 대상데이터에 대한 데이터 값 조정을 수행한다(S170-S190).Thereafter, the
바람직하게는, 마스터운용장치(100)는 하나 이상의 상기 슬레이브운용장치(200)로부터 수집된 대상데이터에 대한 유효성을 판단한다. 즉, 마스터운용장치(100)는 기 정의된 이질성판단기준 예컨대, 구조 이질성, 표현 이질성, 관계 이질성, 및 의미 이질성을 기준으로 상기 대상데이터와 상기 기준데이터 간의 비교를 수행하여 상기 대상데이터에 대한 유효성을 판단한다. 나아가, 마스터운용장치(100)는 상기 판단 결과 유효성이 없을 경우, 상기 사용자정의규칙을 적용하여 상기 대상데이터에 대한 데이터 값을 조정한다. 즉, 마스터운용장치(100)는 상기 대상데이터에 대한 유효성이 없는 것으로 판단될 경우, 저장된 사용자정의규칙을 호출하여 예컨대, 데이터 유형 변환, 범위 한정, 표현 불일치 조정, 논리 오류 조정, 및 무의미 조정 등을 수행하여 상기 대상데이터에 대한 데이터 값을 조정함으로써, 해당 대상데이터를 기준데이터와 연계하기 위한 유효한 데이터로 변환하게 된다. 예컨대, 도 5에 도시한 바와 같이, 운용장치1의 데이터 'Korea'와 운용장치2의 데이터 'KOR'와 연계될 경우, 운용장치1의 데이터 'Korea'와 운용장치2의 데이터 'KOR'은 자연어 처리에 의해 상이하지만, 의미적으로는 동일하다. 이때, 상술한 과정을 통해 생성된 사용자정의규칙을 호출하여 적용함으로써, 운용장치1의 'Korea'는 운용장치2로 연계시에는 'KOR'로 변환 및 정제가 수행되고, 운용장치2의 'KOR'은 운용장치1로 연계시 'Korea'로 변환 및 정제가 수행되게 된다.Preferably, the
다음으로, 도 7을 참조하여 본 발명의 실시예에 따른 마스터운용장치(100)의 동작 방법을 설명하기로 한다.Next, an operation method of the
먼저, 사용자인터페이스(UI: User Interface)를 통한 사용자 요청에 따라 상기 사용자정의함수를 설정한다(S210-S220).First, the user defined function is set according to a user request through a user interface (UI) (S210-S220).
바람직하게는, 변환규칙설정부(110)는 도 3에 도시한 바와 같이 사용자인터페이스를 제공하고, 제공된 사용자인터페이스를 통한 사용자 요청에 따라 사용자정의함수를 설정하게 된다. 여기서, 상기 사용자정의함수의 경우, 도 4에 도시한 바와 같이 예컨대, 업무규칙을 구분하기 위한 함수 유형, 함수명, 함수에 포함되는 매개변수, 함수 실행결과 값을 반환하는 데이터 유형, 함수에 대한 설명, 함수의 용례와 함수에서 실제 수행되는 알고리즘인 함수내용이 포함될 수 있으며, 상기 함수내용의 경우 자바 스크립트로 작성하여 자바 스크립트 실행 엔진에 의해서 실행되도록 함으로써, 데이터 변환 시스템에서 사용하기 위한 컴파일이나 재실행 없이 실행 도중에 사용이 가능하도록 한다. 한편, 사용자정의함수는 제공된 사용자인터페이스를 통한 사용자 요청에 따라, 내장함수와 연동되도록 설정될 수 있다. 여기서, 내장함수는, 시스템에서 자체 제공되는 함수를 지칭하는 것으로, 예컨대, 날짜/시간 함수, 수학/삼각 함수, 통계 함수, 논리 함수 등으로 구성될 수 있다. Preferably, the conversion
그리고 나서, 사용자인터페이스를 통해 설정된 사용자정의함수에 대한 오류 검증을 수행한다(S230).Then, error verification for the user-defined function set through the user interface is performed (S230).
바람직하게는, 변환규칙설정부(110)는 사용자정의함수에 대해 문법적인 검증을 수행함과 아울러, 예컨대, 자바 스크립트에서 사용될 수 있도록 변수를 변환하고, 이에 대한 테스팅을 통해 함수의 오류를 검증하게 된다.Preferably, the conversion
그런 다음, 오류 검증이 완료된 사용자정의함수를 상기 사용자정의규칙으로 설정하여 저장한다(S240).Thereafter, the user-defined function in which error verification is completed is set as the user-defined rule and stored (S240).
바람직하게는, 변환규칙설정부(110)는 문법 검증 및 실행 검증을 통한 오류 검증이 완료된 사용자정의함수를 사용자정의규칙으로 저장함으로써, 이후, 데이터 변환 및 정제가 요구되는 시점에 해당 저장된 사용자정의규칙이 호출되어 적용될 수 있도록 한다.Preferably, the conversion
다음으로, 하나 이상의 슬레이브운용장치(200)를 대상으로 기준데이터와의 연계를 위한 대상데이터를 요청하여 수집한다(S250).Next, the target data for linkage with the reference data is collected and collected at one or more slave operating apparatuses 200 (S250).
바람직하게는, 데이터수집부(120)는 에이전트 구동에 따른 특정 프로세스 처리에 따라 각각의 레거시 시스템을 운용하는 하나 이상의 슬레이브운용장치(200)를 대상으로 데이터연계요청을 전달함으로써, 기준데이터와의 연계를 위한 대상데이터를 수집하게 된다.Preferably, the
그리고 나서, 하나 이상의 상기 슬레이브운용장치(200)로부터 수집된 대상데이터에 대한 유효성을 판단한다(S260).Then, the validity of the target data collected from the one or more
바람직하게는, 변환처리부(130)는 기 정의된 이질성판단기준 예컨대, 구조 이질성, 표현 이질성, 관계 이질성, 및 의미 이질성을 기준으로 상기 대상데이터와 상기 기준데이터 간의 비교를 수행하여 상기 대상데이터에 대한 유효성을 판단한다.Preferably, the
이후, 상기 판단 결과 유효성이 없을 경우, 상기 사용자정의규칙을 적용하여 상기 대상데이터에 대한 데이터 값을 조정한다(S270-S290).Thereafter, if the determination result is not valid, the data value for the target data is adjusted by applying the user-defined rule (S270-S290).
바람직하게는, 변환처리부(130)는 상기 대상데이터에 대한 유효성이 없는 것으로 판단될 경우, 저장된 사용자정의규칙을 호출하여 예컨대, 데이터 유형 변환, 범위 한정, 표현 불일치 조정, 논리 오류 조정, 및 무의미 조정 등을 수행하여 상기 대상데이터에 대한 데이터 값을 조정함으로써, 해당 대상데이터를 기준데이터와 연계하기 위한 유효한 데이터로 변환하게 된다. 예컨대, 도 5에 도시한 바와 같이, 운용장치1의 데이터 'Korea'와 운용장치2의 데이터 'KOR'와 연계될 경우, 운용장치1의 데이터 'Korea'와 운용장치2의 데이터 'KOR'은 자연어 처리에 의해 상이하지만, 의미적으로는 동일하다. 이때, 상술한 과정을 통해 생성된 사용자정의규칙을 호출하여 적용함으로써, 운용장치1의 'Korea'는 운용장치2로 연계시에는 'KOR'로 변환 및 정제가 수행되고, 운용장치2의 'KOR'은 운용장치1로 연계시 'Korea'로 변환 및 정제가 수행되게 된다.Preferably, when it is determined that the validity of the target data is not valid, the
이상에서 살펴본 바와 같이, 본 발명에 따른 분산 데이터 품질 관리 방법에 따르면, 분산 데이터의 상호운용을 위하여 데이터 변환 및 정제에 필요한 업무규칙을 사용자 정의 기반으로 동적으로 생성 및 활용함으로써, 데이터 변환 및 정제에 폭넓게 사용하여 데이터의 품질을 향상시킬 수 있으며, 나아가 레거시(Legacy) 정보시스템의 변화를 최소화할 수 있다.As described above, according to the distributed data quality management method according to the present invention, by dynamically generating and utilizing a business rule necessary for data conversion and purification for user interaction based on the user definition for distributed data interoperability, It can be used extensively to improve the quality of data and further minimize changes in legacy information systems.
한편, 여기에 제시된 실시예들과 관련하여 설명된 방법 또는 알고리즘의 단계들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Meanwhile, the steps of the method or algorithm described in connection with the embodiments presented herein may be embodied in the form of program instructions that may be executed by various computer means and recorded on a computer readable medium. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. The program instructions recorded on the medium may be those specially designed and constructed for the present invention or may be available to those skilled in the art of computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like. The hardware device described above may be configured to operate as one or more software modules to perform the operations of the present invention, and vice versa.
지금까지 본 발명을 바람직한 실시 예를 참조하여 상세히 설명하였지만, 본 발명이 상기한 실시 예에 한정되는 것은 아니며, 이하의 특허청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 또는 수정이 가능한 범위까지 본 발명의 기술적 사상이 미친다 할 것이다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments, but, on the contrary, It will be understood by those skilled in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined by the appended claims.
본 발명에 따른 분산 데이터 품질 관리 시스템 및 그 방법에 따르면, 분산 데이터의 상호운용을 위하여 데이터 변환 및 정제에 필요한 업무규칙을 사용자 정의 기반으로 동적으로 생성 및 활용한다는 점에서 기존 기술의 한계를 뛰어 넘음에 따라 관련 기술에 대한 이용만이 아닌 적용되는 장치의 시판 또는 영업의 가능성이 충분할 뿐만 아니라 현실적으로 명백하게 실시할 수 있는 정도이므로 산업상 이용가능성이 있는 발명이다.According to the distributed data quality management system and method thereof according to the present invention, it overcomes the limitations of the existing technology in that it dynamically generates and utilizes business rules necessary for data transformation and purification for user interaction based on interoperability of distributed data. According to the present invention, there is not only the use of the related technology but also the possibility of marketing or sales of the applied device as well as the degree to which it can be clearly realized in reality.
100: 마스터운용장치
110: 변환규칙설정부 120: 데이터수집부
130: 변환처리부
200: 슬레이브운용장치100: master operation unit
110: conversion rule setting unit 120: data collection unit
130: conversion processing unit
200: slave operation device
Claims (30)
특정 프로세스 처리에 따라 하나 이상의 상기 슬레이브운용장치를 대상으로 상기 데이터연계요청을 전달하여 기준데이터와의 연계를 위한 상기 대상데이터를 수집하며, 가변 설정되는 사용자정의함수 및 내장함수 중 적어도 어느 하나를 포함하는 사용자정의규칙의 적용을 통해 상기 수집된 대상데이터에 대한 데이터 값 조정을 수행하는 마스터운용장치를 포함하는 것을 특징으로 하는 분산 데이터 품질 관리 시스템.A slave operating apparatus having a database for operating its own legacy system and providing target data stored in the database according to a data linkage request; And
The data linkage request is delivered to one or more slave operating devices according to a specific process to collect the target data for linkage with reference data, and includes at least one of a user-defined function and a built-in function that are variably set. And a master operating device configured to perform data value adjustment on the collected target data by applying a user-defined rule.
상기 마스터운용장치는,
사용자인터페이스(UI: User Interface)를 통한 사용자 요청에 따라 상기 사용자정의함수를 설정하고,
상기 설정된 사용자정의함수에 대한 문법검증 및 실행검증을 통해 오류 검증을 수행하며,
상기 오류 검증이 완료된 사용자정의함수를 상기 사용자정의규칙으로 설정하여 저장하는 것을 특징으로 하는 분산 데이터 품질 관리 시스템.The method of claim 1,
The master operating device,
Set the user defined function in response to a user request through a user interface (UI),
Error verification is performed through grammar verification and execution verification of the set user-defined function,
Distributed data quality management system, characterized in that for storing the user-defined function, the error verification is completed by setting the user-defined rule.
상기 마스터운용장치는,
상기 사용자인터페이스를 통한 사용자 요청에 따라, 상기 내장함수와 연동되는 상기 사용자정의함수를 설정하는 것을 특징으로 하는 분산 데이터 품질 관리 시스템.3. The method of claim 2,
The master operating device,
Distributed data quality management system according to the user request through the user interface, characterized in that for setting the user-defined function linked to the built-in function.
상기 마스터운용장치는,
기 정의된 이질성판단기준을 통해 상기 대상데이터와 상기 기준데이터 간의 비교를 수행하여 상기 대상데이터에 대한 유효성을 판단하고,
상기 판단 결과 유효성이 없을 경우, 상기 사용자정의규칙을 적용하여 상기 대상데이터에 대한 데이터 값을 조정하는 것을 특징으로 하는 분산 데이터 품질 관리 시스템.The method of claim 1,
The master operating device,
Determining the validity of the target data by performing a comparison between the target data and the reference data through a predefined heterogeneity determination criteria,
If the determination result is not valid, the distributed data quality management system, characterized in that for adjusting the data value for the target data by applying the user-defined rules.
상기 마스터운용장치는,
구조 이질성, 표현 이질성, 관계 이질성, 및 의미 이질성 중 적어도 어느 하나를 포함하는 상기 이질성판단기준을 통해 상기 대상데이터에 대한 유효성을 판단하는 것을 특징으로 하는 분산 데이터 품질 관리 시스템.The method of claim 4, wherein
The master operating device,
And a validity of the target data is determined through the heterogeneity determination criteria including at least one of structural heterogeneity, expression heterogeneity, relationship heterogeneity, and semantic heterogeneity.
상기 마스터운용장치는,
상기 사용자정의규칙의 적용을 통해, 데이터 유형 변환, 범위 한정, 표현 불일치 조정, 논리 오류 조정, 및 무의미 조정 중 적어도 어느 하나를 수행하여 상기 수집된 대상데이터에 대한 상기 데이터 값 조정을 수행하는 것을 특징으로 하는 분산 데이터 품질 관리 시스템.The method of claim 4, wherein
The master operating device,
Through the application of the user-defined rule, at least one of data type conversion, range limitation, expression mismatch adjustment, logic error adjustment, and meaningless adjustment is performed to perform the data value adjustment on the collected target data. Distributed data quality management system.
각각의 레거시 시스템을 운용하는 하나 이상의 타 운용장치로부터 기준데이터와의 연계를 위한 대상데이터를 수집하는 데이터수집부; 및
상기 저장된 사용자정의규칙을 적용하여 상기 수집된 대상데이터에 대한 데이터 값 조정을 수행하는 변환처리부를 포함하는 것을 특징으로 하는 운용장치.A conversion rule setting unit for generating and storing a user-defined rule including at least one of a user-defined function and a built-in function that are variably set;
A data collector for collecting target data for linkage with reference data from one or more other operating apparatuses for operating each legacy system; And
And a conversion processor configured to apply the stored user definition rule to adjust data values of the collected target data.
상기 변환규칙설정부는,
사용자인터페이스(UI: User Interface)를 통한 사용자 요청에 따라 상기 사용자정의함수를 설정하고,
상기 설정된 사용자정의함수에 대한 문법검증 및 실행검증을 통해 오류 검증을 수행하며,
상기 오류 검증이 완료된 사용자정의함수를 상기 사용자정의규칙으로 설정하여 저장하는 것을 특징으로 하는 운용장치.The method of claim 7, wherein
The conversion rule setting unit,
Set the user defined function in response to a user request through a user interface (UI),
Error verification is performed through grammar verification and execution verification of the set user-defined function,
Operating apparatus, characterized in that for storing the user-defined function, the error verification is completed by setting the user-defined rule.
상기 변환규칙설정부는,
상기 사용자인터페이스를 통한 사용자 요청에 따라, 상기 내장함수와 연동되는 상기 사용자정의함수를 설정하는 것을 특징으로 하는 운용장치.The method of claim 8,
The conversion rule setting unit,
And operating the user-defined function linked to the built-in function according to a user request through the user interface.
상기 변환처리부는,
기 정의된 이질성판단기준을 통해 상기 대상데이터와 상기 기준데이터 간의 비교를 수행하여 상기 대상데이터에 대한 유효성을 판단하고,
상기 판단 결과 유효성이 없을 경우, 상기 사용자정의규칙을 적용하여 상기 대상데이터에 대한 데이터 값을 조정하는 것을 특징으로 하는 운용장치.The method of claim 7, wherein
The conversion processing unit,
Determining the validity of the target data by performing a comparison between the target data and the reference data through a predefined heterogeneity determination criteria,
And when the determination result is not valid, adjusting the data value for the target data by applying the user-defined rule.
상기 변환처리부는,
구조 이질성, 표현 이질성, 관계 이질성, 및 의미 이질성 중 적어도 어느 하나를 포함하는 상기 이질성판단기준을 통해 상기 대상데이터에 대한 유효성을 판단하는 것을 특징으로 하는 운용장치.11. The method of claim 10,
The conversion processing unit,
And determining the validity of the target data through the heterogeneity determination criteria including at least one of structural heterogeneity, expression heterogeneity, relationship heterogeneity, and semantic heterogeneity.
상기 변환처리부는,
상기 사용자정의규칙의 적용을 통해, 데이터 유형 변환, 범위 한정, 표현 불일치 조정, 논리 오류 조정, 및 무의미 조정 중 적어도 어느 하나를 수행하여 상기 수집된 대상데이터에 대한 상기 데이터 값 조정을 수행하는 것을 특징으로 하는 운용장치.11. The method of claim 10,
The conversion processing unit,
Through the application of the user-defined rule, at least one of data type conversion, range limitation, expression mismatch adjustment, logic error adjustment, and meaningless adjustment is performed to perform the data value adjustment on the collected target data. Operating device.
상기 마스터운용장치가 특정 프로세스 처리에 따라 각각의 레거시 시스템을 운용하는 슬레이브운용장치를 대상으로 기준데이터와의 연계를 위한 대상데이터를 요청하는 데이터요청단계;
상기 슬레이브운용장치가 상기 요청에 따라 자체 데이터베이스에 저장된 상기 대상데이터를 제공하는 대상데이터제공단계; 및
상기 마스터운용장치가 상기 저장된 사용자정의규칙의 적용을 통해 하나 이상의 상기 슬레이브운용장치를 대상으로 수집된 대상데이터에 대한 데이터 값 조정을 수행하는 데이터변환처리단계를 포함하는 것을 특징으로 하는 분산 데이터 품질 관리 방법.A conversion rule setting step of generating and storing a user-defined rule including at least one of a user-defined function and a built-in function of which the master operating apparatus is variably set;
A data request step of requesting, by the master operating device, target data for linkage with reference data, to a slave operating device operating each legacy system according to a specific process process;
A target data providing step of providing, by the slave operating apparatus, the target data stored in its own database according to the request; And
Distributed data quality management, characterized in that the master operating device performs a data value adjustment for the target data collected for one or more of the slave operating device through the application of the stored user-defined rules. Way.
상기 변환규칙설정단계는,
사용자인터페이스(UI: User Interface)를 통한 사용자 요청에 따라 상기 사용자정의함수를 설정하는 함수설정단계;
상기 설정된 사용자정의함수에 대한 문법검증 및 실행검증을 통해 오류 검증을 수행하는 오류검증단계; 및
상기 오류 검증이 완료된 사용자정의함수를 상기 사용자정의규칙으로 설정하여 저장하는 함수저장단계를 포함하는 것을 특징으로 하는 분산 데이터 품질 관리 방법.The method of claim 13,
The conversion rule setting step,
A function setting step of setting the user defined function according to a user request through a user interface (UI);
An error verification step of performing error verification through grammar verification and execution verification of the set user defined function; And
And a function storing step of setting and storing the user-defined function whose error verification is completed as the user-defined rule.
상기 함수설정단계는,
상기 사용자인터페이스를 통한 사용자 요청에 따라, 상기 내장함수와 연동되는 상기 사용자정의함수를 설정하는 것을 특징으로 하는 분산 데이터 품질 관리 방법.15. The method of claim 14,
The function setting step,
And setting the user defined function linked with the embedded function according to a user request through the user interface.
상기 데이터변환처리단계는,
기 정의된 이질성판단기준을 통해 상기 대상데이터와 상기 기준데이터 간의 비교를 수행하여 상기 대상데이터에 대한 유효성을 판단하는 유효성판단단계; 및
상기 판단 결과 유효성이 없을 경우, 상기 사용자정의규칙을 적용하여 상기 대상데이터에 대한 데이터 값을 조정하는 데이터조정단계를 포함하는 것을 특징으로 하는 분산 데이터 품질 관리 방법.The method of claim 13,
The data conversion processing step,
A validity determination step of determining a validity of the target data by performing a comparison between the target data and the reference data through a predefined heterogeneity determination criterion; And
And a data adjustment step of adjusting a data value for the target data by applying the user-defined rule when the determination result is not valid.
상기 유효성판단단계는,
구조 이질성, 표현 이질성, 관계 이질성, 및 의미 이질성 중 적어도 어느 하나를 포함하는 상기 이질성판단기준을 통해 상기 대상데이터에 대한 유효성을 판단하는 것을 특징으로 하는 분산 데이터 품질 관리 방법.17. The method of claim 16,
The validity judgment step,
And determining validity of the target data through the heterogeneity determination criteria including at least one of structural heterogeneity, expression heterogeneity, relationship heterogeneity, and semantic heterogeneity.
상기 데이터조정단계는,
상기 사용자정의규칙의 적용을 통해, 데이터 유형 변환, 범위 한정, 표현 불일치 조정, 논리 오류 조정, 및 무의미 조정 중 적어도 어느 하나를 수행하여 상기 수집된 대상데이터에 대한 상기 데이터 값 조정을 수행하는 것을 특징으로 하는 분산 데이터 품질 관리 방법.17. The method of claim 16,
The data adjustment step,
Through the application of the user-defined rule, at least one of data type conversion, range limitation, expression mismatch adjustment, logic error adjustment, and meaningless adjustment is performed to perform the data value adjustment on the collected target data. Distributed data quality management.
각각의 레거시 시스템을 운용하는 하나 이상의 타 운용장치로부터 기준데이터와의 연계를 위한 대상데이터를 수집하는 데이터수집단계; 및
상기 저장된 사용자정의규칙의 적용을 통해 상기 수집된 대상데이터에 대한 데이터 값 조정을 수행하는 변환처리단계를 포함하는 것을 특징으로 하는 운용장치의 동작 방법.A conversion rule setting step of generating and storing a user-defined rule including at least one of a user-defined function and a built-in function that are variably set;
A data collection step of collecting target data for linkage with reference data from one or more other operating apparatuses that operate each legacy system; And
And a conversion processing step of performing data value adjustment on the collected target data by applying the stored user defined rule.
상기 변환규칙설정단계는,
사용자인터페이스(UI: User Interface)를 통한 사용자 요청에 따라 상기 사용자정의함수를 설정하는 함수설정단계;
상기 설정된 사용자정의함수에 대한 문법검증 및 실행검증을 통해 오류 검증을 수행하는 오류검증단계; 및
상기 오류 검증이 완료된 사용자정의함수를 상기 사용자정의규칙으로 설정하여 저장하는 함수저장단계를 포함하는 것을 특징으로 하는 운용장치의 동작 방법.The method of claim 19,
The conversion rule setting step,
A function setting step of setting the user defined function according to a user request through a user interface (UI);
An error verification step of performing error verification through grammar verification and execution verification of the set user defined function; And
And a function storing step of setting and storing the user-defined function whose error verification is completed as the user-defined rule.
상기 함수설정단계는,
상기 사용자인터페이스를 통한 사용자 요청에 따라, 상기 내장함수와 연동되는 상기 사용자정의함수를 설정하는 것을 특징으로 하는 운용장치의 동작 방법.21. The method of claim 20,
The function setting step,
And operating the user-defined function linked to the embedded function according to a user request through the user interface.
상기 변환처리단계는,
기 정의된 이질성판단기준을 통해 상기 대상데이터와 상기 기준데이터 간의 비교를 수행하여 상기 대상데이터에 대한 유효성을 판단하는 유효성판단단계; 및
상기 판단 결과 유효성이 없을 경우, 상기 사용자정의규칙을 적용하여 상기 대상데이터에 대한 데이터 값을 조정하는 데이터조정단계를 포함하는 것을 특징으로 하는 운용장치의 동작 방법.The method of claim 19,
The conversion processing step,
A validity determination step of determining a validity of the target data by performing a comparison between the target data and the reference data through a predefined heterogeneity determination criterion; And
And a data adjustment step of adjusting a data value for the target data by applying the user definition rule when the determination result is not valid.
상기 유효성판단단계는,
구조 이질성, 표현 이질성, 관계 이질성, 및 의미 이질성 중 적어도 어느 하나를 포함하는 상기 이질성판단기준을 통해 상기 대상데이터에 대한 유효성을 판단하는 것을 특징으로 하는 운용장치의 동작 방법.23. The method of claim 22,
The validity judgment step,
And determining validity of the target data through the heterogeneity determination criteria including at least one of structural heterogeneity, expression heterogeneity, relationship heterogeneity, and semantic heterogeneity.
상기 데이터조정단계는,
상기 사용자정의규칙의 적용을 통해, 데이터 유형 변환, 범위 한정, 표현 불일치 조정, 논리 오류 조정, 및 무의미 조정 중 적어도 어느 하나를 수행하여 상기 수집된 대상데이터에 대한 상기 데이터 값 조정을 수행하는 것을 특징으로 하는 운용장치의 동작 방법.23. The method of claim 22,
The data adjustment step,
Through the application of the user-defined rule, at least one of data type conversion, range limitation, expression mismatch adjustment, logic error adjustment, and meaningless adjustment is performed to perform the data value adjustment on the collected target data. Operation method of the operating device.
각각의 레거시 시스템을 운용하는 하나 이상의 타 운용장치로부터 기준데이터와의 연계를 위한 대상데이터를 수집하는 데이터수집단계; 및
상기 저장된 사용자정의규칙의 적용을 통해 상기 수집된 대상데이터에 대한 데이터 값 조정을 수행하는 변환처리단계를 실행하기 위한 명령어를 포함하는 것을 특징으로 하는 컴퓨터 판독 가능 기록매체.A conversion rule setting step of generating and storing a user-defined rule including at least one of a user-defined function and a built-in function that are variably set;
A data collection step of collecting target data for linkage with reference data from one or more other operating apparatuses that operate each legacy system; And
And instructions for executing a conversion processing step of performing data value adjustment on the collected target data by applying the stored user defined rule.
상기 변환규칙설정단계는,
사용자인터페이스(UI: User Interface)를 통한 사용자 요청에 따라 상기 사용자정의함수를 설정하는 함수설정단계;
상기 설정된 사용자정의함수에 대한 문법검증 및 실행검증을 통해 오류 검증을 수행하는 오류검증단계; 및
상기 오류 검증이 완료된 사용자정의함수를 상기 사용자정의규칙으로 설정하여 저장하는 함수저장단계를 실행하기 위한 명령어를 포함하는 것을 특징으로 하는 컴퓨터 판독 가능 기록매체.The method of claim 25,
The conversion rule setting step,
A function setting step of setting the user defined function according to a user request through a user interface (UI);
An error verification step of performing error verification through grammar verification and execution verification of the set user defined function; And
And a command for executing a function storing step of setting and storing the user-defined function whose error verification is completed as the user-defined rule.
상기 함수설정단계는,
상기 사용자인터페이스를 통한 사용자 요청에 따라, 상기 내장함수와 연동되는 상기 사용자정의함수를 설정하는 것을 특징으로 하는 컴퓨터 판독 가능 기록매체.The method of claim 26,
The function setting step,
And setting the user defined function linked with the embedded function according to a user request through the user interface.
상기 변환처리단계는,
기 정의된 이질성판단기준을 통해 상기 대상데이터와 상기 기준데이터 간의 비교를 수행하여 상기 대상데이터에 대한 유효성을 판단하는 유효성판단단계; 및
상기 판단 결과 유효성이 없을 경우, 상기 사용자정의규칙을 적용하여 상기 대상데이터에 대한 데이터 값을 조정하는 데이터조정단계를 실행하기 위한 명령어를 포함하는 것을 특징으로 하는 컴퓨터 판독 가능 기록매체.The method of claim 25,
The conversion processing step,
A validity determination step of determining a validity of the target data by performing a comparison between the target data and the reference data through a predefined heterogeneity determination criterion; And
And a command for executing a data adjusting step of adjusting a data value for the target data by applying the user-defined rule when the determination result is not valid.
상기 유효성판단단계는,
구조 이질성, 표현 이질성, 관계 이질성, 및 의미 이질성 중 적어도 어느 하나를 포함하는 상기 이질성판단기준을 통해 상기 대상데이터에 대한 유효성을 판단하는 것을 특징으로 하는 컴퓨터 판독 가능 기록매체.29. The method of claim 28,
The validity judgment step,
And determining the validity of the object data through the heterogeneity determination criteria including at least one of structural heterogeneity, expression heterogeneity, relationship heterogeneity, and semantic heterogeneity.
상기 데이터조정단계는,
상기 사용자정의규칙의 적용을 통해, 데이터 유형 변환, 범위 한정, 표현 불일치 조정, 논리 오류 조정, 및 무의미 조정 중 적어도 어느 하나를 수행하여 상기 수집된 대상데이터에 대한 상기 데이터 값 조정을 수행하는 것을 특징으로 하는 컴퓨터 판독 가능 기록매체.
29. The method of claim 28,
The data adjustment step,
Through the application of the user-defined rule, at least one of data type conversion, range limitation, expression mismatch adjustment, logic error adjustment, and meaningless adjustment is performed to perform the data value adjustment on the collected target data. A computer readable recording medium.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110144472A KR20130076062A (en) | 2011-12-28 | 2011-12-28 | Management system and method for distributed data quality |
PCT/KR2012/010247 WO2013100415A1 (en) | 2011-12-28 | 2012-11-29 | Distributed data quality management system and method for same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110144472A KR20130076062A (en) | 2011-12-28 | 2011-12-28 | Management system and method for distributed data quality |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20130076062A true KR20130076062A (en) | 2013-07-08 |
Family
ID=48697812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020110144472A KR20130076062A (en) | 2011-12-28 | 2011-12-28 | Management system and method for distributed data quality |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR20130076062A (en) |
WO (1) | WO2013100415A1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190067357A (en) * | 2017-12-07 | 2019-06-17 | 넷마블 주식회사 | System and method for processing data |
KR20190104111A (en) * | 2019-08-23 | 2019-09-06 | 넷마블 주식회사 | System and method for processing data |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110908984B (en) * | 2019-10-31 | 2022-06-10 | 北京浪潮数据技术有限公司 | Data processing method, device, equipment and storage medium |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL111154A0 (en) * | 1993-10-21 | 1994-12-29 | Martino Ii John A | Systems and methods for electronic messaging |
MXPA00007085A (en) * | 1998-11-18 | 2005-09-20 | Software Ag Inc | Extensible distributed enterprise application integration system. |
KR100728612B1 (en) * | 2004-07-29 | 2007-06-14 | (주)위세아이텍 | Method of managing data quality in data migration |
-
2011
- 2011-12-28 KR KR1020110144472A patent/KR20130076062A/en not_active Application Discontinuation
-
2012
- 2012-11-29 WO PCT/KR2012/010247 patent/WO2013100415A1/en active Application Filing
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190067357A (en) * | 2017-12-07 | 2019-06-17 | 넷마블 주식회사 | System and method for processing data |
KR20190104111A (en) * | 2019-08-23 | 2019-09-06 | 넷마블 주식회사 | System and method for processing data |
Also Published As
Publication number | Publication date |
---|---|
WO2013100415A1 (en) | 2013-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11321535B2 (en) | Hierarchical annotation of dialog acts | |
US8434070B2 (en) | Generating specifications of client-server applications for static analysis | |
US10318246B2 (en) | System, method, and recording medium for validating computer documentation | |
US20090049438A1 (en) | Method for Optimizing Migration of Software Applications to Address Needs | |
US20120102474A1 (en) | Static analysis of client-server applications using framework independent specifications | |
US9672084B2 (en) | Method of generating automatic code for remote procedure call | |
JP2014531076A (en) | System and method for generating a schema representing multiple data sources | |
RU2662405C2 (en) | Certification documents automatic generation | |
US20150006584A1 (en) | Managing a complex object in a cloud environment | |
KR20130076062A (en) | Management system and method for distributed data quality | |
US10268461B2 (en) | Global data flow optimization for machine learning programs | |
CN116601644A (en) | Providing interpretable machine learning model results using distributed ledgers | |
WO2016032616A1 (en) | Embedded domain specific languages as first class code artifacts | |
US20130013666A1 (en) | Monitoring data access requests to optimize data transfer | |
CN117242457A (en) | Locating neural network performance hot spots | |
JP6816824B2 (en) | Distributed systems, data management devices, data management methods, and programs | |
US9749281B2 (en) | Dynamic adaption of electronic routing slips for financial messaging | |
US11968088B1 (en) | Artificial intelligence for intent-based networking | |
CN109491987A (en) | Data managing method and device | |
CN113918664B (en) | Data processing method and device | |
WO2018142507A1 (en) | Simulation method, system, and program | |
WO2017090506A1 (en) | System construction assistance system, information processing device, method and storage medium for storing program | |
US20220353210A1 (en) | Altering automated conversation systems | |
CA3106998C (en) | System and method for executing operations in a performance engineering environment | |
KR20140068545A (en) | System and method of model checking for type-aware web service composition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |