KR102243794B1 - 데이터 통합 장치 및 데이터 통합 방법 - Google Patents

데이터 통합 장치 및 데이터 통합 방법 Download PDF

Info

Publication number
KR102243794B1
KR102243794B1 KR1020197003935A KR20197003935A KR102243794B1 KR 102243794 B1 KR102243794 B1 KR 102243794B1 KR 1020197003935 A KR1020197003935 A KR 1020197003935A KR 20197003935 A KR20197003935 A KR 20197003935A KR 102243794 B1 KR102243794 B1 KR 102243794B1
Authority
KR
South Korea
Prior art keywords
data
predetermined
data format
similarity
information
Prior art date
Application number
KR1020197003935A
Other languages
English (en)
Other versions
KR20190028485A (ko
Inventor
다케시 한다
유코 야마시타
히데노리 야마모토
겐지 가와사키
슈이치로우 사키카와
다카시 츠노
Original Assignee
가부시끼가이샤 히다치 세이사꾸쇼
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시끼가이샤 히다치 세이사꾸쇼 filed Critical 가부시끼가이샤 히다치 세이사꾸쇼
Publication of KR20190028485A publication Critical patent/KR20190028485A/ko
Application granted granted Critical
Publication of KR102243794B1 publication Critical patent/KR102243794B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F5/00Methods or arrangements for data conversion without changing the order or content of the data handled
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2205/00Indexing scheme relating to group G06F5/00; Methods or arrangements for data conversion without changing the order or content of the data handled
    • G06F2205/003Reformatting, i.e. changing the format of data representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0661Format or protocol conversion arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Human Computer Interaction (AREA)

Abstract

[과제] 변환 정의 등이 미정의된 데이터 간이어도 효율적인 데이터 변환 처리의 실현을 지원한다.
[해결수단] 데이터 통합 장치(100)에 있어서, 기억 장치(202)에 데이터 형식의 정보가 미저장인 소정 데이터에 관한 테이블의 데이터 형식과, 소정 테이블마다의 마스터 데이터 형식의 유사도를 산출하고, 당해 유사도가 소정 기준을 충족시키는 마스터 데이터 형식의 소정 테이블을 특정하고, 특정한 소정 테이블의 마스터 데이터 형식과, 각 시스템의 각 테이블의 데이터 형식의 유사도를 산출하고, 당해 유사도가 소정 기준을 충족시키는 소정 시스템의 소정 테이블을 특정하고, 특정한 마스터 데이터 형식의 소정 테이블과 소정 시스템의 소정 테이블에 대한 변환 처리 정의의 정보를 재이용 가능한 변환 처리 부품 후보의 정보로서 출력하는 연산 장치(201)를 포함하는 구성으로 한다.

Description

데이터 통합 장치 및 데이터 통합 방법
본 발명은 데이터 통합 장치 및 데이터 통합 방법에 관한 것이며, 구체적으로는, 변환 정의 등이 미정의된 데이터 간이어도 효율적인 데이터 변환 처리의 실현을 지원하는 기술에 관한 것이다.
다종 다양한 시스템에 걸쳐있는 데이터의 횡단적 이용 및 활용 촉진을 목적으로, 데이터 통합 장치가 개발되어 왔다. 이러한 데이터 통합 장치에서는, 데이터 소스가 되는 다양한 업무 시스템의 다종 다양한 데이터를 일원적으로 수집·축적하는 한편, 당해 축적된 데이터의 형식이나 구조를, 이용자의 요구에 따라서 변환하는 처리를 행한다.
전술한 바와 같은 변환 처리에 있어서는, 변환원 데이터의 데이터 구조와 변환처 데이터의 데이터 구조 사이에서 서로의 데이터 항목끼리의 대응 관계 부여를 행하는 처리가 미리 필요해진다. 처리 대상이 되는 데이터가 RDB 데이터이면, 그러한 처리의 로직을 테이블마다 설계할 필요가 있다.
이 변환 처리에 있어서 다종 다양한 시스템의 데이터를 처리 대상으로 했을 경우, 변환 대상이 되는 테이블수가 팽대해지는 케이스가 상정된다. 그 경우, 각 테이블의 데이터 항목끼리의 대응 관계 부여에 요하는 수고나 시간도 증대하고, 전술한 변환 처리의 로직 설계에 요하는 설계 개발자의 작업 공수·비용이 증대하는 것이 우려된다.
이러한 데이터 통합에 수반하는 설계자의 작업 공수 저감을 과제로 하는 종래 기술로서, 이하의 것이 제안되어 있다. 즉, 정보원으로부터 추출한 데이터를 변환해서 저장처에 등록하기 위한 정보 통합 프로그램으로서, 상기 정보원으로부터 취득한 제1 스키마 정보와, 당해 제1 스키마 정보의 변경 전에 상기 정보원으로부터 취득한 제2 스키마 정보를 비교하여, 상기 정보원의 스키마의 변경을 검출하는 스텝과, 상기 스키마의 변경에 관련된 항목의 속성값에서, 스키마 정보에 포함되는 속성값과 데이터 모델에 있어서의 항목 정보를 대응시켜서 저장하는 대응표 저장부를 탐색하는 스텝과, 상기 대응표 저장부에 있어서 상기 스키마의 변경에 관련된 항목의 속성값이 검출된 경우에는, 당해 스키마의 변경에 관련된 항목의 속성값에 대응하는 항목 정보를 이용해서, 상기 제2 스키마 정보에 대응하는 데이터 모델인 변경 전 데이터 모델을 저장하는 메타 정보 저장부에 저장되어 있는 상기 변경 전 데이터 모델을 개수(改修)해서 변경 후 데이터 모델을 생성하고, 기억 장치에 저장하는 스텝과, 상기 기억 장치에 저장된 상기 변경 후 데이터 모델을, 상기 저장처에 대응하는 데이터 모델로 변환하기 위한 변경 후 통합 로직을 생성하고, 상기 메타 정보 저장부에 저장하는 로직 개수 스텝을 컴퓨터에 실행시키기 위한 정보 통합 장치(특허문헌 1 참조) 등이 제안되어 있다.
일본 특개2012-27690호 공보
그러나 종래 기술에 있어서는, 전술한 변환 처리를 요구하는 소정 시스템이나 어플리케이션에 있어서 필요한 데이터 형식이, 통합된 데이터 형식과는 다른 경우가 있다. 여기서, 통합된 데이터 형식이란, 예를 들면, 다종 다양한 시스템에 있어서의 소정 데이터의 각 사이에서 가장 공통적으로 이용되고 있는 데이터 항목으로 이루어지는 데이터 형식이고, 각 시스템에 있어서의 데이터와의 사이에서, 전술한 데이터 항목끼리의 대응 관계 부여가 정의 완료된 것이다. 따라서, 전술한 소정 시스템 등이 필요로 하는 데이터 형식이, 통합된 데이터 형식과 다른 것은, 전술한 변환 처리를 위하여 필요한 정의 등이 미지의 상태인 것을 의미한다.
이 경우, 통합된 데이터 형식을, 소정 시스템 등이 필요한 데이터 형식으로 변환하기 위한, 변환 처리 로직의 설계 개발 작업이 발생한다. 또한, 전술한 통합된 데이터 형식에 있어서는 (각 시스템의 데이터 간에서 공통적으로 이용되지 않기 때문에) 변환 대상 외로 된 데이터에 대하여 요구가 있었을 경우, 예를 들면, 정보원의 시스템의 소정 데이터에 관해서 데이터 통합 장치에서 전술한 통합을 하기 위한 대응표나 변환 처리 로직 설계가 필요하게 되어 버린다.
그래서 본 발명의 목적은, 변환 정의 등이 미정의된 데이터 간이어도 효율적인 데이터 변환 처리의 실현을 지원하는 기술을 제공하는 것에 있다.
상기 과제를 해결하는 본 발명의 데이터 통합 장치는, 소정 사상(事象)의 데이터에 관해서 소정 시스템에서 이용하는 각 테이블의 데이터 형식, 및, 상기 데이터 사이에서 보편적인 데이터 형식으로서 소정 테이블마다 미리 정한 마스터 데이터 형식의 각 정보와, 상기 마스터 데이터 형식의 소정 테이블과 상기 소정 시스템의 소정 데이터 형식의 소정 테이블 사이에서의 데이터의 변환 처리 정의의 정보를 저장한 기억 장치와, 상기 기억 장치에 데이터 형식의 정보가 미저장인 소정 데이터에 관한 테이블의 데이터 형식과, 상기 소정 테이블마다의 마스터 데이터 형식의 유사도인 제1 유사도를 산출하고, 당해 제1 유사도가 소정 기준을 충족시키는 마스터 데이터 형식의 소정 테이블을 특정하는 처리와, 상기 특정한 소정 테이블의 마스터 데이터 형식과, 상기 기억 장치에 저장하고 있는 상기 시스템의 각 테이블의 데이터 형식의 유사도인 제2 유사도를 산출하고, 당해 제2 유사도가 소정 기준을 충족시키는 소정 시스템의 소정 테이블을 특정하는 처리와, 상기 특정한, 마스터 데이터 형식의 소정 테이블과 상기 소정 시스템의 소정 테이블에 대하여, 당해 테이블 사이에 관한 상기 변환 처리 정의의 정보를 기억 장치로부터 판독하고, 당해 정보를 재이용 가능한 변환 처리 부품 후보의 정보로서 소정 장치에 출력하는 처리를 실행하는 연산 장치를 구비하는 것을 특징으로 한다.
또한, 본 발명의 데이터 통합 방법은, 소정 사상의 데이터에 관해서 소정 시스템에서 이용하는 각 테이블의 데이터 형식, 및, 상기 데이터 사이에서 보편적인 데이터 형식으로서 소정 테이블마다 미리 정한 마스터 데이터 형식의 각 정보와, 상기 마스터 데이터 형식의 소정 테이블과 상기 소정 시스템의 소정 데이터 형식의 소정 테이블 사이에서의 데이터의 변환 처리 정의의 정보를 저장한 기억 장치를 구비하는 정보 처리 장치가, 상기 기억 장치에 데이터 형식의 정보가 미저장인 소정 데이터에 관한 테이블의 데이터 형식과, 상기 소정 테이블마다의 마스터 데이터 형식의 유사도인 제1 유사도를 산출하고, 당해 제1 유사도가 소정 기준을 충족시키는 마스터 데이터 형식의 소정 테이블을 특정하는 처리와, 상기 특정한 소정 테이블의 마스터 데이터 형식과, 상기 기억 장치에 저장하고 있는 상기 시스템의 각 테이블의 데이터 형식의 유사도인 제2 유사도를 산출하고, 당해 제2 유사도가 소정 기준을 충족시키는 소정 시스템의 소정 테이블을 특정하는 처리와, 상기 특정한, 마스터 데이터 형식의 소정 테이블과 상기 소정 시스템의 소정 테이블에 대하여, 당해 테이블 사이에 관한 상기 변환 처리 정의의 정보를 기억 장치로부터 판독하고, 당해 정보를 재이용 가능한 변환 처리 부품 후보의 정보로서 소정 장치에 출력하는 처리를 실행하는 것을 특징으로 한다.
본 발명에 따르면, 변환 정의 등이 미정의된 데이터 간이어도 효율적인 데이터 변환 처리의 실현을 지원 가능하게 된다.
도 1은 본 실시형태에 있어서의 데이터 통합 장치를 포함하는 네트워크 구성예를 나타내는 도면.
도 2는 본 실시형태의 데이터 구조 정의 테이블의 데이터 포맷예를 나타내는 도면.
도 3은 본 실시형태의 재이용 가능 부품 추출 결과 저장 테이블의 데이터 포맷예를 나타내는 도면.
도 4는 본 실시형태의 유사도 산출 파라미터 테이블의 데이터 포맷예를 나타내는 도면.
도 5는 본 실시형태에 있어서의 마스터 데이터 형식의 테이블과, 배신처 시스템이 요구하는 데이터 형식의 테이블 간의 유사도를 산출한 결과를 저장하는 데이터 포맷의 예를 나타내는 도면.
도 6은 본 실시형태에 있어서의 마스터 데이터 형식의 테이블과, 데이터 구조 정의 테이블에 정의되는 데이터 형식의 테이블 간의 유사도를 산출한 결과를 저장하는 데이터 포맷의 예를 나타내는 도면.
도 7은 본 실시형태의 데이터 변환 처리 부품 정의 테이블의 데이터 포맷예를 나타내는 도면.
도 8은 본 실시형태의 데이터 통합 장치에 있어서의 데이터 변환·배신 처리의 개념을 나타내는 도면.
도 9는 본 실시형태에 있어서의 데이터 통합 장치의 하드웨어 구성예를 나타내는 도면.
도 10은 본 실시형태에 있어서의 데이터 통합 방법의 플로우예 1을 나타내는 도면.
도 11은 본 실시형태의 배신처 시스템이 요구하는 데이터 형식의 데이터 구조의 데이터 포맷예를 나타내는 도면.
도 12a는 본 실시형태에 있어서의 데이터 통합 방법의 플로우예 2를 나타내는 도면.
도 12b는 본 실시형태에 있어서의 데이터 통합 방법의 플로우예 3을 나타내는 도면.
도 13은 본 실시형태의 배신처 시스템이 요구하는 데이터 형식의 데이터 구조와 마스터 데이터 형식의 데이터 구조의 유사도 산출 처리를 설명하는 도면.
도 14는 본 실시형태에 있어서의 데이터 통합 방법의 플로우예 4를 나타내는 도면.
도 15a는 본 실시형태의 배신처 시스템이 요구하는 데이터 형식으로 데이터 변환을 행하는 재이용 가능한 데이터 변환 처리 부품 후보를 추출하는 처리를 설명하는 도면(그 1).
도 15b는 본 실시형태의 배신처 시스템이 요구하는 데이터 형식으로 데이터 변환을 행하는 재이용 가능한 데이터 변환 처리 부품 후보를 추출하는 처리를 설명하는 도면(그 2).
도 16은 본 실시형태에 있어서의 화면예 1을 나타내는 도면.
도 17은 본 실시형태에 있어서의 화면예 2를 나타내는 도면.
---네트워크 구성---
이하에 본 발명의 실시형태에 대하여 도면을 이용해서 상세히 설명한다. 도 1은, 본 실시형태의 데이터 통합 장치(100)를 포함하는 네트워크 구성도이다. 도 1에서 나타내는 바와 같이, 본 실시형태의 데이터 통합 장치(100)는, 입력 단말(120), 배신원 시스템(130), 및 배신처 시스템(140)과, 전용 회선(150)을 통해서 통신 가능하게 접속되어 있다.
이 중, 배신원 시스템(130)은, 예를 들면 철도 사업자가 관리·운용하는 열차 다이어그램 데이터를 유지하는 시스템이다. 이 배신원 시스템(130)으로부터 데이터 통합 장치(100)에 배신되는 데이터가, 데이터 통합 장치(100)에 있어서의 소정의 데이터 변환 프로그램(변환 처리 정의)에 의해서, 배신처 시스템(140)에 있어서의 데이터 형식으로 변환되고, 당해 배신처 시스템(140)에 배신되는 것으로 된다.
또한, 배신처 시스템(140)은, 전술한 배신원 시스템(130) 유래의 소정 데이터에 의거하여, 적절한 업무나 서비스를 실행하는 철도 사업자가 관리·운용하는 시스템이다. 구체적으로는, 열차 운행 상황의 관측 데이터와 전술한 열차 다이어그램 데이터를 이용해서, 열차 운행 관리를 행하는 시스템 등을 상정할 수 있다.
또한, 입력 단말(120)은, 전술한 배신원 시스템(130)으로부터 얻어지는 데이터를, 배신처 시스템(140)이 요구하는 데이터 형식으로 변환하기 위한 데이터 변환 프로그램의 설계 개발자가 조작하는 단말이 된다.
이러한 네트워크 구성에 포함되는 본 실시형태의 데이터 통합 장치(100)는, 적절한 하드웨어 및 소프트웨어에 의해 실장되는 기능 부품으로서, 유저 인터페이스부(111), 데이터 구조 유사도 산출부(112), 재이용 가능 데이터 변환 부품 추출부(113), 및 통신부(114)를 구비한다. 또한 데이터 통합 장치(100)는, 이러한 기능부가 취급하는 데이터의 저장처로서, 데이터 저장부(101)를 구비한다.
전술한 기능부 중, 데이터 구조 유사도 산출부(112)는, 배신처 시스템(140)이 요구하는 데이터 형식의 테이블에 있어서의 데이터 구조와, 데이터 통합 장치(100)가 미리 유지하는 마스터 데이터 형식의 테이블에 있어서의 데이터 구조의, 유사도를 산출하는 것이다. 전술한 마스터 데이터 형식(통합된 데이터 형식)이란, 예를 들면, 소정 업무의 데이터에 관해서 복수의 배신처 시스템(140)에 걸쳐서 공통적으로 이용되고 있는 데이터 항목으로 이루어지는 소정 테이블의 데이터 형식을 상정한다.
또, 이러한 마스터 데이터 형식과 배신처 시스템(140)에 있어서의 데이터 형식(데이터 통합 장치(100)가 기지의 것)의 관계에 있어서, 각 데이터 항목끼리의 대응 관계 부여가 정의 완료, 즉, 해당 테이블의 데이터 항목 간에서 데이터 변환 처리를 행하기 위한 데이터 변환 프로그램이 데이터 통합 장치(100)에 이미 유지되어 있는 것으로 한다. 전술한 데이터 구조 유사도 산출부(112)에서 행하는 처리 수순의 상세는, 도 12a에 나타내는 플로우차트에서 후술한다.
또한, 재이용 가능 데이터 변환 부품 추출부(113)는, 배신원 시스템(130)으로부터 배신된 데이터를, 마스터 데이터 형식을 통하는 것에 의해서 배신처 시스템(140)이 요구하는 데이터 형식으로 변환하는, 데이터 변환 프로그램의 후보, 즉 「재이용 가능한 데이터 변환 처리 부품 후보」를 추출하는 것이다. 재이용 가능 데이터 변환 부품 추출부(113)에서 행하는 처리 수순의 상세는 도 14에 나타내는 플로우차트에서 후술한다.
또한, 통신부(114)는, 전용 회선(150)을 통해서 배신원 시스템(130)과 통신하고, 소정의 배신 데이터 및 이 배신 데이터에 관한 데이터 구조 정의 정보(131)의 송수신을 행하는 것이다. 전술한 배신 데이터(예 : 열차 다이어그램 데이터)는, 데이터 구조 정의 테이블(107)(도 2)에서 정의되는 데이터 구조를 가진 표 형식 데이터를 상정한다. 데이터 통합 장치(100)는, 이러한 표 형식 데이터를 배신원 시스템(130)으로부터 얻어 배신원 데이터 저장부(110)(도 8)에 저장하는 것으로 이루어진다.
한편, 전술한 데이터 구조 정의 정보(131)는, 배신 데이터의 데이터 형식, 테이블명, 당해 테이블에 있어서의 칼럼, 그 데이터형의 각 정보로 구성된 정보이다. 데이터 통합 장치(100)는, 이 데이터 구조 정의 정보(131)를, 데이터 구조 정의 테이블(107)에 저장한다.
전술한 데이터 구조 정의 테이블(107)은, 도 2에 나타내는 데이터 포맷을 갖고 있고, 그 데이터 항목으로서, 데이터 형식(1101), 테이블(1072), 칼럼(1103), 및, 데이터형(1104)을 포함하고 있다. 도 2에 나타내는 예에서는, 「마스터 데이터」, 「데이터 형식 X」, 「데이터 형식 Y」의 합계 3종류의 데이터 형식에 관한 구조 정의의 정보가 저장되어 있다.
계속해서, 유저 인터페이스부(111)는, 데이터 변환 프로그램의 설계 개발자를 향해서, 배신처 시스템(140)의 데이터 형식으로 데이터 변환 처리를 행하기 위해서 재이용 가능한 데이터 변환 프로그램(데이터 변환 부품)의 후보를 나타내는, 재이용 후보 변환 부품 제시 화면(1110)(도 16)을 생성한다.
이 재이용 후보 변환 부품 제시 화면(1110)은, 배신처 시스템(140)의 데이터 형식을 입력하기 위한 배신처 시스템 데이터 형식 입력 영역(11101)과, 재이용 가능 부품 추출 버튼(11102)과, 재이용 후보 변환 부품 일람 표시 영역(11103)에 의해 구성된다.
데이터 변환 프로그램의 설계 개발자가, 전술한 재이용 후보 변환 부품 제시 화면(1110)을 입력 단말(120)에서 열람하고, 배신처 시스템 데이터 형식 입력 영역(11101)에 배신처 시스템(140)에서 필요한 데이터 형식을 입력하고, 재이용 가능 부품 추출 버튼(11102)을 압하한 것으로 한다. 이 경우, 데이터 통합 장치(100)는, 배신처 시스템 데이터 형식 입력 영역(11101)에서 입력된 데이터 형식에 따라서, 데이터 구조 유사도 산출 처리, 및, 재이용 가능 데이터 변환 부품 추출 처리를 실행한다.
또, 전술한 재이용 후보 변환 부품 일람 표시 영역(11103)에는, 데이터 통합 장치(100)가, 재이용 가능 부품 추출 결과 저장 테이블(106)(도 3)로부터 판독한 재이용 후보 변환 부품(기지의 데이터 변환 프로그램)을 일람 표시한다.
이 재이용 가능 부품 추출 결과 저장 테이블(106)은, 도 3에 나타내는 데이터 포맷을 갖고 있으며, 그 데이터 항목으로서, 배신처 시스템(140)에 있어서의 데이터 형식(1081), 테이블(1062), 및 칼럼(1083)과, 데이터 변환의 기점이 되는 마스터 데이터 형식의 해당 테이블 및 칼럼을 나타내는 변환원 칼럼(1084)과, (마스터 데이터 형식의 소정 테이블의 소정 칼럼의 값을, 소정의 배신처 시스템에 있어서의 데이터 형식의 소정 테이블의 소정 칼럼의 값에 대응시키는, 즉 데이터 변환 처리를 행하는 데이터 변환 프로그램이 기지의) 변환처 칼럼(1085)을 포함하고 있다.
도 3에 나타내는 예에서는, 배신처 데이터 「데이터 형식 Z」의 데이터 테이블 「열차·역」의 칼럼 「열차 번호」에 관해서는, 「마스터 데이터 형식의 역 시각 테이블의 열차 번호 칼럼」을, 「데이터 형식 X의 열차 정보 테이블의 열차 번호 칼럼」으로 변환하는 데이터 변환 프로그램이 재이용 가능 후보인 것으로서, 해당 정보가 저장되어 있다.
또한, 데이터 저장부(101)에 있어서의 유사도 산출 파라미터 테이블(102)은, 도 4에 나타내는 데이터 포맷을 갖고 있으며, 데이터 구조 유사도 산출 처리에 있어서 이용하는 가중치값의 정보를 정의하고 있다. 그 데이터 항목으로서는, 항목명(1031)과, 유사도 산출 가중치(1032)를 포함한다.
이 중 항목명(1031)은, 테이블에 있어서의 칼럼명을 나타내고 있으며, 도 4의 예에서는, 「열차」나 「출발 시각」이라는 값이 저장되어 있다. 또한, 유사도 산출 가중치(1032)는, 데이터 구조 간의 유사도 산출에 있어서, 해당 칼럼의 일치 판정의 결과에 적용해야 할 가중치값을 나타내고 있으며, 도 4의 예에서는 유사도 산출 가중치로서 「2」나 「3」이라는 값이 저장되어 있다. 이러한 유사도 산출 파라미터 테이블(102)의 각 데이터는, 미리 유식자가 등록해 두는 것으로 한다.
또한, 데이터 저장부(101)에 있어서의 유사도 산출 결과 일시 저장부(103)는, 마스터 데이터 형식의 테이블과 배신처 시스템(140)이 요구하는 데이터 형식의 테이블 사이의 유사도를 산출한 결과를, 도 5에 나타내는 바와 같이 표 형식으로 저장하는 저장처로 이루어진다.
그 데이터 항목으로서는, 테이블(1041)과, 칼럼(1042)과, 테이블(1043)과, 칼럼(1044)과, 데이터형(1045)과, 테이블 간 유사도(1046)를 포함한다.
이 중 테이블(1041)은, 마스터 데이터 형식의 테이블명을 나타내고 있고, 칼럼(1042)은, 당해 테이블(1041)에 저장되는 테이블의 칼럼명을 나타내고 있다. 또한, 테이블(1043)은, 배신처 시스템(140)이 요구하는 데이터 형식의 테이블명을 나타내고 있고, 칼럼(1044)은, 당해 테이블(1043)에 저장되는 테이블의 칼럼명을 나타내고 있다.
또한, 데이터형(1045)은, 전술한 칼럼(1042)과 칼럼(1044)의 데이터형을 나타내고 있다. 또한, 테이블 간 유사도(1046)는, 전술한 테이블(1041)과 테이블(1043)에 저장되는 테이블 간의 유사도의 산출 결과를 나타낸다. 또, 칼럼 간의 일치도에 관한 산출 결과는, 일치도 저장 영역(1047)에 저장된다.
여기서, 칼럼의 명칭의 일치도를 산출한 결과가 N, 데이터형의 일치도를 산출한 결과가 M일 때, (N, M)과 같이 각각의 일치도 산출 결과의 세트로서 결과를 저장하는 것으로 한다.
또, 도 5에서 예시하는 표에 있어서의 종방향의 길이는, 테이블(1041)에 저장되는 테이블의 칼럼수분, 또한, 당해 표에 있어서의 횡방향의 길이는, 테이블(1043)에 저장되는 테이블의 칼럼수분으로 된다.
또한, 도 5의 예에서는, 마스터 데이터 형식의 「열차」 테이블과, 「데이터 형식 Z」의 「열차·역」 테이블의 유사도를 산출한 경우의 결과가 나타나 있다. 마스터 데이터 형식의 「열차」 테이블의 「열차 번호」 칼럼과 「데이터 형식 Z」의 「열차·역」 테이블의 「열차 번호」 칼럼은, 칼럼명이 모두 「열차 번호」이므로 칼럼명의 일치도는 1×유사도 산출 가중치(3)=3으로 산출된다. 또한, 데이터형은 어떠한 칼럼도 「Integer(정수형)」이므로, 데이터형의 일치도는 1이다.
또한, 데이터 저장부(101)에 있어서의 유사도 산출 결과 저장부(105)는, 마스터 데이터 형식의 테이블과 데이터 구조 정의 테이블에 정의되는 데이터 형식의 테이블 사이의 유사도를 산출한 결과를, 도 6에 나타내는 표 형식으로 저장하는 것이다. 그 데이터 항목으로서는, 테이블(1071)과, 칼럼(1072)과, 데이터 형식(1073)과, 테이블(1074)과, 칼럼(1075)과, 데이터형(1076)과, 테이블 간 유사도(1077)를 포함한다.
이 중 테이블(1071)과, 칼럼(1072)과, 테이블(1074)과, 칼럼(1075)과, 데이터형(1076)과, 테이블 간 유사도(1077)는, 전술한 도 5에서 예시한 유사도 산출 결과 일시 저장부(103)의 데이터 포맷예와 마찬가지의 구성이다. 또한, 데이터 형식(1073)은, 데이터 구조 정의 테이블(107)의 데이터 형식의 데이터 항목과 마찬가지의 구성이다. 또한, 일치도 저장 영역(1078)에 저장되는 값은, 전술한 도 5에서 예시한 유사도 산출 결과 일시 저장부(103)의 데이터 포맷예와 마찬가지의 구성이다. 도 6에 나타내는 예에서는, 마스터 데이터 형식의 「열차」 테이블과, 「데이터 형식 X」 및 「데이터 형식 Y」의 전(全)테이블의 각각의 유사도를 산출한 경우의 결과가 나타나 있다.
또한, 데이터 저장부(101)에 있어서의 데이터 변환 처리 부품 정의 테이블(104)은, 데이터 형식을 변환하기 위한 데이터 변환 프로그램의 정보를 정의하는 데이터 테이블이고, 도 7에 나타내는 데이터 포맷을 갖는다.
그 데이터 항목으로서는, 변환원 데이터 형식(1061)과, 변환원 테이블(1042)과, 변환원 칼럼(1063)과, 변환처 데이터 형식(1064)과, 변환처 테이블(1065)과, 변환처 칼럼(1066)과, 프로그램 파일명(1067)을 포함한다.
이 중 변환원 데이터 형식(1061)은, 변환원 데이터의 데이터 형식을 나타내고, 변환원 테이블(1042)은, 당해 변환원 데이터의 데이터 테이블명을 나타내고, 변환원 칼럼(1063)은, 변환원 데이터 테이블의 칼럼명을 나타낸다.
또한, 변환처 데이터 형식(1064)은, 변환처 데이터의 데이터 형식을 나타내고, 변환처 테이블(1045)은, 변환처 데이터의 데이터 테이블명을 나타내고, 변환처 칼럼(1066)은, 변환처 데이터 테이블의 칼럼명을 나타내고, 프로그램 파일명(1067)은, 변환원 칼럼(1063)을 변환처 칼럼(1066)으로 데이터를 변환하기 위한 프로그램의 파일명을 나타낸다.
도 7에 나타내는 데이터 변환 처리 부품 정의 테이블(104)의 예에서는, 마스터 데이터 형식의 테이블 「역 시각」의 칼럼 「열차 번호」를, 「데이터 형식 X」의 테이블 「열차 정보」의 칼럼 「열차 번호」로 데이터 변환하기 위한 프로그램 「prg00001.dat」의 이름이 저장되어 있다.
---데이터 변환 처리의 개념---
여기서, 본 실시형태의 데이터 통합 장치(100)에 있어서의 데이터 변환 처리의 원리에 대하여, 그 개념을 설명한다. 도 8은, 데이터 통합 장치(100)에 있어서의 데이터 변환 처리의 원리를 나타내는 설명도이다.
본 실시형태에 있어서의 데이터 통합 장치(100)는, 배신원 데이터 저장부(110)에 저장하는 배신원 데이터를, 마스터 데이터 형식으로 변환하고 마스터 데이터 저장부(109)에 저장한다. 또한, 데이터 통합 장치(100)는, 마스터 데이터 저장부(109)에 저장한 전술의 데이터를, 배신처 시스템(140)이 요구하는 데이터 형식으로 변환한다. 이 데이터 형식의 변환 처리 시에, 데이터 통합 장치(100)는, 변환원의 테이블에 있어서의 칼럼과 변환처의 테이블에 있어서의 칼럼의 대응, 형 변환, 연산 처리를 행하고, 그 결과를, 데이터 변환 부품 라이브러리(108)에 저장하는 데이터 변환 프로그램으로서 저장한다. 도 8에 나타내는 예에서는, 마스터 데이터 저장부(109)에 저장되는 마스터 데이터 형식의 데이터를, 데이터 변환 부품 라이브러리(108)에 있어서의 배신처 시스템(140)이 요구하는 데이터 형식으로의 데이터 변환 부품 그룹(데이터 변환 프로그램 그룹) 중, 「데이터 형식 X」의 전테이블의 전칼럼마다의 데이터 변환 프로그램을 이용함으로써, 「배신처 시스템 X」가 요구하는 「데이터 형식 X」로의 변환을 실현한다. 배신처 시스템(140)이 요구하는 데이터 형식으로의 데이터 변환 프로그램은, 미리 개발되어, 데이터 변환 부품 라이브러리(108)에 등록되어 있는 것으로 한다.
이들 기능부에 의한 처리의 상세는, 이후의 도 10, 도 12a, 도 12b, 도 14에 나타내는 플로우차트를 이용해서 후술한다.
---하드웨어 구성---
본 실시형태에 있어서의 데이터 통합 장치(100)의 하드웨어 구성은 이하와 같이 이루어진다. 도 9는, 데이터 통합 장치(100)의 하드웨어 구성예를 나타내는 도면이다.
본 실시형태의 데이터 통합 장치(100)는, CPU(201), HDD(202), 메모리(203), 입력 장치(204), 표시 장치(205), 및 통신 장치(206)를 구비한다. 이 중 CPU(201)는, 데이터의 입출력, 판독, 저장 및 각종 처리를 실행하는 연산 장치이다. 또한, HDD(202)는, 데이터를 기억하는 불휘발성의 기억 수단이다. 또한, 메모리(203)는, 프로그램 및 데이터를 일시적으로 기억하는 휘발성의 기억 수단이다.
또한, 입력 장치(204)는, 유저로부터의 조작 입력을 접수하는, 키보드나 마우스, 마이크 등의 장치이다. 또한, 표시 장치(205)는, 이용자에게 데이터를 표시하는, 디스플레이 등의 장치이다. 또한, 통신 장치(206)는, 배신원 시스템(130)이나 배신처 시스템(140)과 전용 회선(150)을 통해서 통신하고, 데이터를 송수신하는 네트워크 카드 등의 장치이다.
이러한 데이터 통합 장치(100)는, 예를 들면 전술한 HDD(202) 또는 메모리(203)에 유지하는 프로그램(207)을 CPU(201)가 실행함으로써, 전술한 각 기능부를 실장한다.
---메인플로우예---
이하, 본 실시형태에 있어서의 데이터 통합 방법의 실제 수순에 대하여 도면에 의거하여 설명한다. 이하에서 설명하는 데이터 통합 방법에 대응하는 각종 동작은, 데이터 통합 장치(100)가 메모리 등에 판독해서 실행하는 프로그램에 의해서 실현된다. 그리고, 이 프로그램은, 이하에 설명되는 각종 동작을 행하기 위한 코드로 구성되어 있다.
도 10은, 본 실시형태에 있어서의 데이터 통합 방법의 플로우예 1을 나타내는 도면이며, 구체적으로는, 데이터 통합 장치(100)에 있어서 데이터 구조 유사도를 산출하고, (배신원 시스템(130)의 데이터를, 배신처 시스템(140)이 요구하는 데이터 형식으로 변환하기 위하여) 재이용 가능한 데이터 변환 프로그램을 기존의 데이터 변환 프로그램 중에서 추출하는 일련의 수순을 나타내는 플로우차트이다.
여기서, 데이터 변환 프로그램의 설계 개발자가, 입력 단말(120)에 표시되는 도 16의 설계 개발자 제시 화면(1110)에 있어서, 배신처 시스템(140)이 요구하는 데이터 형식과, 데이터 구조와, 데이터 구조 유사도 산출 처리 요구를 입력한 것으로 한다.
이 경우, 데이터 통합 장치(100)는, 전술의 데이터 변환 프로그램의 설계 개발자가 입력한, 배신처 시스템(140)이 요구하는 데이터 형식 및 데이터 구조의 각 정보와, 데이터 구조 유사도 산출 처리 요구를, 입력 단말(120)로부터 수신한다(301). 물론, 데이터 통합 장치(100)가, 이러한 정보를 다른 수단, 경로에서 미리 취득 완료일 경우, 본 스텝은 불필요하다.
도 11에, 배신처 시스템(140)이 요구하는 데이터 형식 「데이터 형식 Z」의 「열차·역」 테이블에 관한 데이터 구조를 나타내는 데이터 포맷예를 나타낸다. 예시하는 데이터 구조에 있어서의 데이터 항목으로서는, 데이터 형식(1401)과, 테이블(1402)과, 칼럼(1403)과, 데이터형(1404)을 포함하고 있다. 이 데이터 항목의 구성은, 전술한 데이터 구조 정의 테이블(107)의 데이터 항목과 마찬가지의 구성이다.
계속해서, 데이터 통합 장치(100)의 데이터 구조 유사도 산출부(112)는, 배신처 시스템(140)이 요구하는 데이터 형식의 테이블에 있어서의 데이터 구조와, 마스터 데이터 형식의 각 테이블에 있어서의 데이터 구조의 유사도를 산출한다(302).
또한, 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 배신처 시스템(140)이 요구하는 데이터 형식으로 데이터 변환을 행하기 위한, 재이용 가능한 데이터 변환 처리 프로그램의 후보를 추출한다(303).
다음으로, 데이터 통합 장치(100)의 유저 인터페이스부(111)는, 도 3에 나타낸 재이용 가능 부품 추출 결과 저장 테이블(106)을 참조하여, 전술한 배신처 시스템(140)이 요구하는 데이터 형식으로 데이터 변환을 행하는 데이터 변환 프로그램으로서 재이용 가능한 프로그램 일람을 표시하는 화면을 생성하고, 당해 화면(도 16)을 표시 단말에 반환하고(304), 처리를 종료한다.
또, 전술한 데이터 구조 유사도 산출부(112)에서 행하는 처리 수순의 상세는 도 12a에 나타내는 플로우차트에서 후술한다. 또한, 재이용 가능 데이터 변환 부품 추출부(113)에서 행하는 처리 수순의 상세는 도 14에 나타내는 플로우차트에서 후술한다.
---상세 플로우예 1---
도 12a는, 데이터 구조 유사도 산출부(112)가, 배신처 시스템(140)이 요구하는 데이터 형식의 테이블에 있어서의 데이터 구조와, 마스터 데이터 형식의 각 테이블에 있어서의 데이터 구조의 유사도를 산출하는 수순의 상세를 나타내는 플로우차트이다.
우선, 데이터 통합 장치(100)의 데이터 구조 유사도 산출부(112)는, 데이터 구조 정의 테이블(107)에 있어서, 데이터 형식이 「마스터 데이터 형식」인 각 테이블의 데이터 레코드를 취득한다(3021).
다음으로, 데이터 통합 장치(100)의 데이터 구조 유사도 산출부(112)는, 스텝 3021에서 데이터 레코드를 취득한 마스터 데이터 형식의 테이블 모두에 대해서, 루프를 행한다(3022).
계속해서, 데이터 통합 장치(100)의 데이터 구조 유사도 산출부(112)는, 데이터 구조 정의 테이블(107)에 등록 완료된, 「마스터 데이터 형식」 이외의 데이터 형식, 즉 기지의 배신처 시스템(140)의 각 데이터 형식의 테이블 모두에 대해서 루프를 행한다(3023).
다음으로, 데이터 통합 장치(100)의 데이터 구조 유사도 산출부(112)는, 스텝 3021에서 얻은 마스터 데이터 형식의 테이블로서, 루프 대상 테이블의 칼럼과, 스텝 3023에서 루프 대상으로 한 배신처 시스템(140)의 데이터 형식의 테이블로서, 루프 대상 테이블의 칼럼의 일치도와, 당해 테이블 간의 유사도를 각각 산출한다(30231). 이 테이블 간의 유사도를 산출하는 처리 수순의 상세는, 도 12b에 나타내는 플로우차트에서 설명한다.
도 12b는, 데이터 구조 유사도 산출부(112)가, 전술한 마스터 데이터 형식의 루프 대상 테이블의 칼럼과, 배신처 시스템(140)의 데이터 형식의 루프 대상의 칼럼의 일치도와, 당해 테이블 간의 유사도를 각각 산출하는 수순의 상세를 나타내는 플로우차트이다.
이 플로우에 있어서, 우선, 데이터 통합 장치(100)의 데이터 구조 유사도 산출부(112)는, 전술한 스텝 3022에서 루프 대상 테이블로 한, 마스터 데이터 형식의 테이블의 전칼럼에 대해서 루프를 행한다(3024).
데이터 통합 장치(100)의 데이터 구조 유사도 산출부(112)는, 당해 루프 내에서, 전술한 스텝 3023에서 루프 대상 테이블로 한, 배신처 시스템(140)의 데이터 형식의 테이블의 전칼럼에 대해서 루프를 행한다(3025).
계속해서, 데이터 통합 장치(100)의 데이터 구조 유사도 산출부(112)는, 루프 대상인 마스터 데이터 형식의 테이블에 있어서의 루프 대상 칼럼의 칼럼명과, 루프 대상인 배신처 시스템(140)의 데이터 형식의 테이블의 루프 대상 칼럼의 칼럼명이 일치하여 있는지 판정한다(3026).
전술한 판정의 결과, 양 칼럼명이 일치하여 있지 않으면(3026 : NO), 데이터 통합 장치(100)의 데이터 구조 유사도 산출부(112)는, 「0」을 유사도 산출 결과 일시 저장부(103)의 일치도 저장 영역(1047)에 저장한다(30211).
한편, 전술한 판정의 결과, 양 칼럼명이 일치하여 있으면(3026 : YES), 데이터 통합 장치(100)의 데이터 구조 유사도 산출부(112)는, 유사도 산출 파라미터 테이블(102)을 참조하여, 당해 테이블에 있어서의 모든 항목명과 유사도 산출 가중치의 각 값을 취득한다(3027).
데이터 통합 장치(100)의 데이터 구조 유사도 산출부(112)는, 스텝 3027에서 얻은 항목명 중에, 스텝 3026에서 판정 결과가 「일치」로 된 대상 칼럼명이 정의되어 있는지 판정한다(3028).
전술한 판정의 결과, 전술한 대상 칼럼명이 정의되어 있지 않으면(3028 : NO), 데이터 통합 장치(100)의 데이터 구조 유사도 산출부(112)는, 「1」을 유사도 산출 결과 일시 저장부(103)의 일치도 저장 영역(1047)에 저장한다(30210).
한편, 전술한 판정의 결과, 전술한 대상 칼럼명이 정의되어 있으면(3028 : YES), 데이터 통합 장치(100)의 데이터 구조 유사도 산출부(112)는, 「1×유사도 산출 가중치」의 산출 결과를, 유사도 산출 결과 일시 저장부(103)의 일치도 저장 영역(1047)에 저장한다(3029).
계속해서, 데이터 통합 장치(100)의 데이터 구조 유사도 산출부(112)는, 루프 대상인 마스터 데이터 형식의 테이블에 있어서의 루프 대상 칼럼의 데이터형과, 루프 대상인 배신처 시스템(140)의 데이터 형식의 테이블에 있어서의 루프 대상 칼럼의 데이터형이 일치하여 있는지 판정한다(30212).
전술한 판정의 결과, 양 데이터형이 일치하여 있으면(30212 : YES), 데이터 통합 장치(100)의 데이터 구조 유사도 산출부(112)는, 「1」을, 유사도 산출 결과 일시 저장부(103)의 일치도 저장 영역(1047)에 저장한다(30213).
한편, 전술한 판정의 결과, 양 데이터형이 일치하여 있지 않으면(30212 : NO), 데이터 통합 장치(100)의 데이터 구조 유사도 산출부(112)는, 「0」을 유사도 산출 결과 일시 저장부(103)의 일치도 저장 영역(1047)에 저장한다(30214).
다음으로, 데이터 통합 장치(100)의 데이터 구조 유사도 산출부(112)는, 전술에서 루프 대상으로 한, 마스터 데이터 형식의 테이블과 배신처 시스템(140)의 데이터 형식의 테이블 사이의 유사도를, (일치도의 총합)/{2×(마스터 데이터 테이블의 칼럼수×비교하는 테이블의 칼럼수)}의 식으로 산출하고, 당해 산출 결과를 유사도 산출 결과 일시 저장부(103)의 테이블 간 유사도(1046)에 저장하고(30215), 처리를 종료한다.
여기서, 전술한 도 12a 및 도 12b의 각 플로우에서 나타낸 처리의, 구체적인 예에 대하여, 도 13을 근거로 하여 설명한다. 도 13은, 마스터 데이터 형식의 「열차」 테이블과, 「데이터 형식 Z」의 「열차·역」 테이블을 대상으로, 유사도 산출의 처리를 행하는 개념을 나타내는 설명도이다.
이 경우, 데이터 통합 장치(100)는, 마스터 데이터 형식의 「열차」 테이블과, 「데이터 형식 Z」의 「열차·역」 테이블의 「열차 번호」 칼럼은, 칼럼명이 일치하여 있다고 판정한다. 이 일치하는 칼럼명 「열차 번호」는, 유사도 산출 파라미터 테이블(102)의 항목명에 정의되어 있다. 따라서, 데이터 통합 장치(100)는, 이 「열차 번호」에 대응하는 유사도 산출 가중치 「3」을 취득한다.
그래서 데이터 통합 장치(100)는, 일치도 저장 영역(1047) 중 「열차 번호」 칼럼에 대응한 영역(10471)에, 칼럼명의 일치도 산출 결과인 「3」을 저장한다.
계속해서, 데이터 통합 장치(100)는, 이 「열차 번호」 칼럼의 데이터형은 모두 「Integer」로 일치하여 있으므로, 일치도 저장 영역(1047) 중 「열차 번호」 칼럼에 대응한 영역(10471)에, 데이터형의 일치도 산출 결과로서 「1」을 저장한다. 데이터 통합 장치(100)는, 전술의 처리를, 마스터 데이터 형식의 「열차」 테이블의 각 칼럼과 「데이터 형식 Z」의 「열차·역」 테이블의 각 칼럼의, 전조합에 대해서 행한다.
마지막으로, 데이터 통합 장치(100)는, 전술한 마스터 데이터 형식의 「열차」 테이블과, 「데이터 형식 Z」의 「열차·역」 테이블에 관해서, 테이블 간 유사도를 산출한다. 여기서, 도 7에 예시하는 일치도 저장 영역(1047)에서 저장하고 있는 각 칼럼의 일치도의 총합은, 3+1+1+1=6, 또한, 마스터 데이터 형식의 「열차」 테이블에 있어서의 칼럼수는 3, 또한, 「데이터 형식 Z」의 「열차·역」 테이블에 있어서의 칼럼수는 4이다.
이로부터, 데이터 통합 장치(100)는, 당해 테이블 간의 유사도를, (일치도의 총합)/{2×(마스터 데이터 테이블의 칼럼수×비교하는 테이블의 칼럼수)}=6/(2×3×4)=0.25로 산출한다.
---상세 플로우예 2---
도 14는, 배신원 시스템(130)의 소정 데이터를 배신처 시스템(140)이 요구하는 데이터 형식으로 데이터 변환할 때에 재이용 가능한, 데이터 변환 처리 프로그램의 후보를, 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)가 추출하는 수순(메인플로우에 있어서의 스텝 303)의 상세를 나타내는 플로우차트이다. 또, 이 「재이용 가능한 데이터 변환 프로그램」이란, 마스터 데이터 형식의 소정 테이블과의 관계에 있어서, 배신원 시스템(130)의 소정 테이블의 데이터를, 소정 배신처 시스템(140)의 데이터 형식용으로 데이터 변환을 행하기 위하여 정의 완료된, 즉 기지의 데이터 변환 프로그램이다.
즉, 본 실시형태의 데이터 통합 장치(100)는, 기지의 데이터 변환 프로그램을, 아직 데이터 변환 프로그램이 정의되어 있지 않은 배신처 시스템(140)의 데이터 형식용으로 재이용하기 위하여, 그 정보를 제공하는 것이다.
이 플로우에 있어서, 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 배신처 시스템(140)이 요구하는 데이터 형식의 해당 테이블(스텝 301에서 정보를 얻음) 모두에 대해서, 루프를 행한다(3031).
계속해서 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 당해 루프 내에서, 루프 대상인 테이블의 칼럼 모두에 대해서 루프를 행한다(3032).
여기서 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 마스터 데이터 형식의 각 테이블과 전술한 루프 대상인 배신처 시스템(140)의 데이터 형식의 테이블의 관계에 대하여, 유사도 산출 결과 저장부(105)(도 6)를 참조하여, 루프 대상 테이블의 칼럼과, 칼럼명 또는 데이터형이 일치하는 마스터 데이터 형식의 칼럼과 그 테이블의 정보를 취득한다(3033).
계속해서 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 전술한 스텝 3033의 결과, 칼럼명 또는 데이터형이 일치하는, 즉, 일치도가 (a, b)(a>0 또는 b>0)인 칼럼이 존재하는지 판정한다(3034).
이 판정의 결과, 해당 칼럼이 존재하지 않으면(3034 : NO), 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 재이용 가능 부품 추출 결과 저장 테이블(106)의 변환원 칼럼(1084)과 변환처 칼럼(1085)에, 「재이용 가능 후보 없음」의 값을 저장한다(3036).
한편, 전술한 판정의 결과, 해당 칼럼이 존재하면(3034 : YES), 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 해당 칼럼의 칼럼명과 데이터형의 각 일치도를 합계한 값이, 해당 칼럼 간에서 최대로 되는 칼럼을 특정한다(3035).
다음으로, 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 전술한 스텝 3035에서 특정한 칼럼이 복수 존재하는지 판정한다(3037).
전술한 판정의 결과, 해당 칼럼이 복수 존재하지 않을 경우(3037 : NO), 즉 하나뿐이었을 경우, 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 마스터 데이터 형식의 해당 테이블에 있어서의 해당 칼럼의 칼럼명과, 당해 칼럼을 갖는, 마스터 데이터 형식의 테이블의 테이블명을 취득한다(3039).
한편, 전술의 판정의 결과, 해당 칼럼이 복수 존재할 경우(3037 : YES), 재이용 가능 데이터 변환 부품 추출부(113)는, 해당하는 각 칼럼을 갖는 각 테이블의 유사도를 취득하고, 그 유사도가 테이블 간에서 최대로 되는, 마스터 데이터 형식의 테이블을 특정한다(3038). 또한, 이 스텝 3038에 있어서, 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 특정한 마스터 데이터 형식의 테이블에 있어서의, 해당 칼럼의 칼럼명과 당해 테이블명을 취득한다.
계속해서, 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 스텝 3038 또는 스텝 3039 중 어느 하나에서 칼럼명 및 테이블명을 취득한 해당 칼럼과 해당 테이블의 세트수분만큼 루프를 행한다(30310).
여기서 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 유사도 산출 결과 저장부(105)를 참조하여, 전술한 루프에서 대상으로 하는 마스터 데이터 형식의 테이블과, 당해 테이블의 유사도를 산출 완료한, 배신처 시스템(140)에 있어서의 전데이터 형식의 각 테이블에 관해서, 루프 대상의 칼럼에 관한 일치도 산출 결과를 취득한다(30311).
여기서 얻은 정보에 의거하여, 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 마스터 데이터 형식의 테이블과, 배신처 시스템(140)에 있어서의 전데이터 형식의 각 테이블 중 어느 하나의 사이에서, 칼럼명 혹은 데이터형이 일치하는, 즉, 일치도가 (a, b)(a>0 또는 b>0)인 칼럼이 존재하는지 판정한다(30312). 전술한 판정의 결과, 해당 칼럼이 존재하지 않으면(30312 : NO), 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 재이용 가능 부품 추출 결과 테이블 저장(106)의 변환원 칼럼(1084)과 변환처 칼럼(1085)에 「재이용 가능 후보 없음」의 값을 저장한다(30314).
한편, 전술한 판정의 결과, 해당 칼럼이 존재하면(30312 : YES), 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 해당 칼럼의 칼럼명과 데이터형의 일치도를 합계한 값이 최대로 되는, 배신처 시스템(140)의 데이터 형식, 해당 테이블, 및 칼럼명의 각 정보를 취득한다(30313).
계속해서 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 스텝 30313에서 취득한 칼럼이 복수 존재하는지 판정한다(30315).
전술한 판정의 결과, 해당 칼럼이 복수 존재하면(30315 : YES), 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 해당 칼럼을 포함하는 각 테이블의, 대응하는 마스터 데이터 형식의 테이블과의 유사도를 참조하여, 유사도가 해당 테이블 간에서 최대로 되는 테이블을 특정한다(30316).
한편, 해당 칼럼이 복수 존재하지 않으면(30315 : NO), 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 처리를 S30317로 진행한다.
다음으로, 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 전술한 마스터 데이터 형식의 소정 테이블에 있어서의 칼럼의 데이터를, 전술한 스텝 3016에서 특정한 (배신처 시스템(140)의) 데이터 형식의 해당 테이블의 칼럼의 데이터로 하는, 데이터 변환 프로그램이, 스텝 3031 및 스텝 3032에서 루프 대상으로 하는 테이블의 칼럼으로 변환하는 재이용 가능 후보 부품으로 판단하고, 재이용 가능 부품 추출 결과 저장 테이블(106)의 변환원 칼럼(1084)에 「스텝 3038 또는 스텝 3039에서 취득한 마스터 데이터 형식의 테이블의 칼럼」을, 변환처 칼럼(1085)에 「취득한 배신처 시스템(140)의 데이터 형식의 테이블의 칼럼」을 저장한다(30317).
여기서, 도 15a와 도 15b는, 배신처 시스템(140)이 요구하는 데이터 형식 「데이터 형식 Z」의 「열차·역」 테이블의 칼럼 「열차 번호」에 데이터 변환을 행하는 데이터 변환 프로그램으로서, 재이용 가능한 데이터 변환 처리 부품 후보를 추출하는, 구체적인 처리 개념을 나타낸다.
우선, 도 15a에 나타내는 바와 같이, 마스터 데이터 형식의 「열차」 테이블과, 「데이터 형식 Z」의 「열차·역」 테이블을 대상으로, 유사도를 산출하는 처리에 대하여 설명한다. 이 경우, 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 양 테이블 사이에서 칼럼명 혹은 데이터형이 일치하는 칼럼으로서, 마스터 데이터 형식의 「열차」 테이블의 「열차 번호」 칼럼과, 마스터 데이터 형식의 「역 시각」 테이블의 「열차 번호」 칼럼의 각 정보를 취득한다.
다음으로, 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 전술에서 취득한 칼럼의 칼럼명과 데이터형의 일치도 산출 결과를 합계한 값을, 마스터 데이터 형식의 「열차」 테이블의 「열차 번호」 칼럼과, 마스터 데이터 형식의 「역 시각」 테이블의 「열차 번호」 칼럼의 각각에 대하여, 3+1=4로 산정한다. 따라서, 일치도의 합계값이 같은 칼럼이 2개 특정되게 된다.
또, 이 2개의 칼럼을 갖는 마스터 데이터 형식의 각 테이블(「열차」 테이블과 「역 시각」 테이블)과 「데이터 형식 Z」의 「열차·역」 테이블 사이에 있어서의, 테이블 간 유사도는, 각각 「0.25」와 「0.47」이다.
따라서, 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 테이블 간 유사도가 「0.47」로 최대인, 마스터 데이터 형식의 「역 시각」 테이블을 특정하고, 이 마스터 데이터 형식의 「역 시각」 테이블의 이름과 「열차 번호」 칼럼의 이름을 취득한다.
계속해서, 도 15b에 나타내는 바와 같이, 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 마스터 데이터 형식의 「역 시각」 테이블의 「열차 번호」 칼럼과, 유사도 산출 완료인 「데이터 형식 X」와 「데이터 형식 Y」의 전테이블의 전칼럼의 일치도 산출 결과를 취득한다.
또한, 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 전술한 바와 같이 취득한 일치도 산출 결과에 대하여, 칼럼명과 데이터형의 일치도를 합계한 값을 산출하고, 최대값을 취하는 칼럼을 추출한다. 이 경우, 최대로 되는 것은 3+1=4이고, 「데이터 형식 X」의 「열차 정보」 테이블의 「열차 번호」 칼럼으로 특정된다.
따라서, 데이터 통합 장치(100)의 재이용 가능 데이터 변환 부품 추출부(113)는, 마스터 데이터 형식의 「역 시각」 테이블의 「열차 번호」 칼럼을, 「데이터 형식 X」의 「열차 정보」 테이블의 「열차 번호」 칼럼으로 변환하는 처리 부품이, 「데이터 형식 Z」의 「열차·역」 테이블의 「열차 번호」 칼럼으로 데이터 변환을 행하는 재이용 가능 부품 후보로서, 재이용 가능 부품 추출 결과 저장 테이블(106)에 저장한다.
---화면 표시예---
계속해서, 데이터 통합 장치(100)의 유저 인터페이스부(111)가 생성하고, 입력 단말(120)에 표시시키는 화면의 예에 대하여 설명한다. 도 16은, 유저 인터페이스부(111)가 생성하는 화면의 예로서, 입력 단말(120)을 통해서 데이터 변환 프로그램의 설계 개발자에게 제시하는, 재이용 후보 변환 부품 제시 화면(1110)의 예를 나타내는 도면이다.
이 재이용 후보 변환 부품 제시 화면(1110)은, 배신처 시스템 데이터 형식 입력 영역(11101)과, 재이용 가능 부품 추출 버튼(11102)과, 재이용 후보 변환 부품 표시 영역(11103)으로 구성된다.
이 중 재이용 후보 변환 영역(11103)에는, 배신처 시스템 데이터 형식 입력 영역(11101)에 입력된 값을 키(key)로 해서, 재이용 가능 부품 추출 결과 저장 테이블(106)의 배신처 데이터 형식의 데이터 항목이 일치하는 레코드의 정보와, 이 레코드 중 변환원 칼럼(1084)으로부터 변환처 칼럼(1085)으로 변환하는 데이터 변환 프로그램의 파일명이 표시된다. 또한, 데이터 변환 프로그램의 파일명은, 전술한 레코드의 변환원 칼럼(1084)과 변환처 칼럼(1085)의 값을 키로 해서, 데이터 변환 처리 부품 정의 테이블(104)로부터 추출한 레코드의 프로그램 파일명(1067)의 값이다.
도 16에 나타내는 예에서는, 배신처 데이터 형식 「데이터 형식 Z」의 「열차·역」 테이블의 칼럼인, 「열차 번호」, 「역명」, 「도착 시각」, 및 「출발 시각」의 각각에 대해서, 마스터 데이터 형식의 데이터를 변환하는 데이터 변환 프로그램의 재이용 가능 후보를 추출한 결과가 나타나 있다.
또한, 전술한 칼럼 중 「열차 번호」와 「역명」에 관해서, 각각, 마스터 데이터 형식의 「역 시각」 테이블의 「열차 번호」 칼럼으로부터, 「데이터 형식 X」의 「열차 정보」 테이블의 「열차 번호」 칼럼으로 변환하는, 데이터 변환 프로그램 「prg00001.dat」와, 마스터 데이터 형식의 「역 시각」 테이블의 「역명」 칼럼으로부터, 「데이터 형식 X」의 「열차 정보」 테이블의 「역명」 칼럼으로 변환하는, 데이터 변환 프로그램 「prg00005.dat」이, 재이용 가능 후보로서 표시되어 있다.
전술한 재이용 가능한 데이터 변환 프로그램의 후보를 추출하는 수단에는, 이미 기술한 각 플로우 등의 방법 외에, 그 밖의 공지의 기계 학습 기술에 의거한 방법, 예를 들면 뉴럴 네트워크나 서포트 벡터 머신 등의 분류기를 이용하는 것으로 해도 된다.
또, 전술한 재이용 후보 변환 부품 제시 화면(1110)에 있어서의, 변환원 칼럼 및 변환처 칼럼에서 표시하는 내용과 그 형태로서, 유저 인터페이스부(111)는, 해당 칼럼의 기재의 표시 형태를 하선(下線)부 부여의 굵은 문자 등, 클리커블(clickable)한 강조 표시로 하는 것으로 해도 된다. 도 17에 이 경우의 표시예를 나타낸다.
이와 같이, 클리커블한 강조 표시로 하는 것은, 칼럼 간의 일치 판정(스텝 3028∼3029, 스텝 30210)에서 일치가 특정되고, 유사도 산출 파라미터 테이블(102)의 유사도 산출 가중치의 값의 적용 대상으로 된 칼럼에 관한 기재로 한다.
도 17의 예이면, 데이터 통합 장치(100)의 유저 인터페이스부(111)는, 예를 들면, 마스터 데이터 형식의 「역 시각」 테이블의 칼럼 「열차 번호」의 문자를 굵은 문자의 하선부 부여로 하고, 또한, 「데이터 형식 X」의 「열차 정보」 테이블의 칼럼 「열차 번호」의 문자를 굵은 문자의 하선부 부여로 한다.
이 경우, 데이터 통합 장치(100)의 유저 인터페이스부(111)는, 전술한 설계 개발자가 입력 단말(120)을 조작하여, 이 하선부를 클릭한 이벤트에 따라서, 예를 들면 하선부 아래쪽에 풀다운 메뉴(111031)를 표시시킨다. 이 풀다운 메뉴(111031)는, 해당 칼럼에 관해서 전술의 일치 판정에서 이용한 유사도 산출 파라미터 테이블(102)의 유사도 산출 가중치의 값을, 설계 개발자가 변경 가능하게 하는 인터페이스이다. 도 17의 예에서는, 「열차 번호」 칼럼에 관해서 적용하고 있던 유사도 산출 가중치의 값을, 「3」 내지 「1」 사이에서 선택할 수 있는 메뉴로 되어 있다.
데이터 통합 장치(100)의 유저 인터페이스부(111)는, 이 풀다운 메뉴(111031)에서 설계 개발자로부터 접수한 유사도 산출 가중치의 값의 선택에 따라서, 선택된 유사도 산출 가중치의 값을 이용한 전술의 각 유사도의 산출을, 데이터 구조 유사도 산출부(112)에 지시한다.
한편, 데이터 구조 유사도 산출부(112)는, 이 지시에 따라서 유사도 산출(스텝 302)에 필요한 각 처리를 재실행한다. 또한, 이 재실행의 결과를 받은 재이용 가능 데이터 변환 부품 추출부(113)는, 유사도 산출의 결과 등에 의거한, 재이용 가능한 데이터 변환 프로그램의 추출 처리(스텝 303)에 필요한 각 처리를 재실행한다.
유저 인터페이스부(111)는, 이러한 재실행의 결과를 취득하고, 화면(1110)을 갱신하고, 입력 단말(120)에 표시시킨다. 따라서, 전술한 설계 개발자는, 유사도 산출의 가중치의 값을 변경한 경우의 결과에 대하여 확인 가능하게 되어 있다.
또, 전술에서는, 풀다운 메뉴(111031)를, 유사도 산출 가중치의 값의 변경을 접수하는 유저 인터페이스의 예로서 나타냈지만, 이것으로 한정하지 않으며, 소정 사상의 변경 지시를 받는 기존의 각종 인터페이스(예 : 슬라이더 바나 복수의 라디오 버튼 등)를 적절하게 채용해도 된다.
이상, 본 발명을 실시하기 위한 최적의 형태 등에 대하여 구체적으로 설명했지만, 본 발명은 이것으로 한정되는 것은 아니며, 그 요지를 일탈하지 않는 범위에서 각종 변경 가능하다.
이러한 본 실시형태에 따르면, 배신처의 시스템이나 어플리케이션이 요구하는 데이터 형식과 마스터 데이터의 데이터 형식의, 데이터 항목 간의 대응과 같은 작업을 생략하고, 이미 설계·개발된 데이터 변환 처리 부품 중에서 재이용 가능한 부품을, 데이터 통합 장치의 이용자 등에게 제시 가능하게 된다.
즉, 변환 정의 등이 미정의된 데이터 간이어도 효율적인 데이터 변환 처리의 실현을 지원 가능하게 된다.
본 명세서의 기재에 의해, 적어도 다음의 것이 명백하게 된다. 즉, 본 실시형태의 데이터 통합 장치에 있어서, 상기 연산 장치는, 상기 제1 및 제2 각 유사도의 산출에 있어서, 대상으로 하는 테이블 간에 있어서의 각 칼럼의 이름 및 데이터형의 각각의 일치 판정을 행하고, 당해 일치 판정의 결과를 소정 알고리즘에 적용함으로써 유사도를 산출하고, 상기 재이용 가능한 변환 처리 부품 후보의 정보의 출력 시에, 상기 특정한, 마스터 데이터 형식의 소정 테이블과 상기 소정 시스템의 소정 테이블에 대하여, 상기 일치 판정에서 일치가 특정되어 칼럼에 관한, 당해 테이블 사이에 관한 상기 변환 처리 정의의 정보를 기억 장치로부터 판독하고, 당해 정보를 재이용 가능한 변환 처리 부품 후보의 정보로서 소정 장치에 출력하는 것으로 해도 된다.
이것에 의하면, 전술의 유사도를 바람직한 정밀도로 효율적으로 산출하고, 또한, 이러한 유사도에 의거하여 특정된 테이블 간의 해당 칼럼에 관해서 재이용 가능한 변환 처리 부품 후보의 정보를, 소정의 담당자 등에게 제시하는 것이 가능하게 된다. 나아가서는, 변환 정의 등이 미정의된 데이터 간이어도, 정밀도 좋고 더 효율적인 데이터 변환 처리의 실현을 지원 가능하게 된다.
또한, 본 실시형태의 데이터 통합 장치에 있어서, 상기 연산 장치는, 상기 각 유사도의 산출 시에, 유사도에 대한 영향의 크기에 따라서 칼럼마다 정한 가중치 부여값을, 상기 일치 판정의 결과에 적용한 후에, 상기 소정 알고리즘에 의한 유사도의 산출을 행하는 것으로 해도 된다.
이것에 의하면, 전술의 유사도를 더 바람직한 정밀도로 효율적으로 산출하고, 또한, 이러한 유사도에 의거하여 특정된 테이블 간의 해당 칼럼에 관해서 재이용 가능한 변환 처리 부품 후보의 정보를, 소정의 담당자 등에게 제시하는 것이 가능하게 된다. 나아가서는, 변환 정의 등이 미정의된 데이터 간이어도, 더 정밀도 좋고 효율적인 데이터 변환 처리의 실현을 지원 가능하게 된다.
또한, 본 실시형태의 데이터 통합 장치에 있어서, 상기 연산 장치는, 상기 재이용 가능한 변환 처리 부품 후보의 정보를 출력할 시에, 상기 특정한, 마스터 데이터 형식의 소정 테이블과 상기 소정 시스템의 소정 테이블에 대하여, 상기 일치 판정에서 일치가 특정되고, 상기 가중치 부여값의 적용 대상으로 된 칼럼에 관한 정보와, 당해 칼럼에 관해서 적용된 상기 가중치 부여값의 변경용 인터페이스를 더 출력하고, 상기 변경용 인터페이스에서 접수한 가중치 부여값의 변경 지시에 따라서, 상기 각 유사도의 산출 및 당해 산출에 수반하는 각 처리를 재실행하는 것으로 해도 된다.
이것에 의하면, 유사도의 산출에 영향을 미치는 칼럼의 중요도 즉 전술의 가중치 부여값의 크기에 관해서, 소정 담당자 등에 의한 변경을 접수함으로써, 예를 들면 고(高)스킬의 담당자 등의 지견에 따른 바람직한 정밀도로의 유사도의 산출이 가능하게 된다. 또한, 이러한 가중치 부여값의 변경에 수반해서 변화할 수 있는 유사도에 의거해, 다시 특정되는 테이블, 및 해당 테이블 간의 해당 칼럼에 관한 재이용 가능한 변환 처리 부품 후보의 정보를, 소정의 담당자 등에게 제시하는 것이 가능하게 된다. 나아가서는, 변환 정의 등이 미정의된 데이터 간이어도, 더 정밀도 좋고 더 효율적이며 또한 유연한 데이터 변환 처리의 실현을 지원 가능하게 된다.
또한, 본 실시형태의 데이터 통합 방법에 있어서, 상기 정보 처리 장치가, 상기 제1 및 제2 각 유사도의 산출 시에, 대상으로 하는 테이블 간에 있어서의 각 칼럼의 이름 및 데이터형의 각각의 일치 판정을 행하고, 당해 일치 판정의 결과를 소정 알고리즘에 적용함으로써 유사도를 산출하고, 상기 재이용 가능한 변환 처리 부품 후보의 정보의 출력 시에, 상기 특정한, 마스터 데이터 형식의 소정 테이블과 상기 소정 시스템의 소정 테이블에 대하여, 상기 일치 판정에서 일치가 특정되어 칼럼에 관한, 당해 테이블 사이에 관한 상기 변환 처리 정의의 정보를 기억 장치로부터 판독하고, 당해 정보를 재이용 가능한 변환 처리 부품 후보의 정보로서 소정 장치에 출력하는 것으로 해도 된다.
또한, 본 실시형태의 데이터 통합 방법에 있어서, 상기 정보 처리 장치가, 상기 각 유사도의 산출 시에, 유사도에 대한 영향의 크기에 따라서 칼럼마다 정한 가중치 부여값을, 상기 일치 판정의 결과에 적용한 후에, 상기 소정 알고리즘에 의한 유사도의 산출을 행하는 것으로 해도 된다.
또한, 본 실시형태의 데이터 통합 방법에 있어서, 상기 정보 처리 장치가, 상기 재이용 가능한 변환 처리 부품 후보의 정보를 출력할 시에, 상기 특정한, 마스터 데이터 형식의 소정 테이블과 상기 소정 시스템의 소정 테이블에 대하여, 상기 일치 판정에서 일치가 특정되고, 상기 가중치 부여값의 적용 대상으로 된 칼럼에 관한 정보와, 당해 칼럼에 관해서 적용된 상기 가중치 부여값의 변경용 인터페이스를 더 출력하고, 상기 변경용 인터페이스에서 접수한 가중치 부여값의 변경 지시에 따라서, 상기 각 유사도의 산출 및 당해 산출에 수반하는 각 처리를 재실행하는 것으로 해도 된다.
100 : 데이터 통합 장치
101 : 데이터 저장부
102 : 유사도 산출 파라미터 테이블
103 : 유사도 산출 결과 일시 저장부
104 : 데이터 변환 처리 부품 정의 테이블
105 : 유사도 산출 결과 저장부
106 : 재이용 가능 부품 추출 결과 저장 테이블
107 : 데이터 구조 정의 테이블
108 : 데이터 변환 부품 라이브러리
109 : 마스터 데이터 저장부
110 : 배신원 데이터 저장부
111 : 유저 인터페이스부
112 : 데이터 구조 유사도 산출부
113 : 재이용 가능 데이터 변환 부품 추출부
114 : 통신부
120 : 입력 단말
130 : 배신원 시스템
131 : 데이터 구조 정의 정보
140 : 배신처 시스템
150 : 전용 회선
201 : CPU(연산 장치)
202 : HDD(기억 장치)
203 : 메모리
204 : 입력 장치
205 : 표시 장치
206 : 통신 장치
207 : 프로그램

Claims (8)

  1. 소정 사상의 데이터에 관해서 소정 시스템에서 이용하는 각 테이블의 데이터 형식, 및, 상기 데이터 사이에서 보편적인 데이터 형식으로서 소정 테이블마다 미리 정한 마스터 데이터 형식의 각 정보와, 상기 마스터 데이터 형식의 소정 테이블과 상기 소정 시스템의 소정 데이터 형식의 소정 테이블 사이에서의 데이터의 변환 처리 정의의 정보를 저장한 기억 장치와,
    상기 기억 장치에 데이터 형식의 정보가 미저장인 소정 데이터에 관한 테이블의 데이터 형식과, 상기 소정 테이블마다의 마스터 데이터 형식의 유사도인 제1 유사도를 산출하고, 당해 제1 유사도가 소정 기준을 충족시키는 마스터 데이터 형식의 소정 테이블을 특정하는 처리와, 상기 특정한 소정 테이블의 마스터 데이터 형식과, 상기 기억 장치에 저장하고 있는 상기 소정 시스템의 각 테이블의 데이터 형식의 유사도인 제2 유사도를 산출하고, 당해 제2 유사도가 소정 기준을 충족시키는 소정 시스템의 소정 테이블을 특정하는 처리와, 상기 특정한, 마스터 데이터 형식의 소정 테이블과 상기 소정 시스템의 소정 테이블에 대하여, 당해 테이블 사이에 관한 상기 변환 처리 정의의 정보를 기억 장치로부터 판독하고, 당해 정보를 재이용 가능한 변환 처리 부품 후보의 정보로서 소정 장치에 출력하는 처리를 실행하는 연산 장치
    를 구비하는 것을 특징으로 하는 데이터 통합 장치.
  2. 제1항에 있어서,
    상기 연산 장치는,
    상기 제1 및 제2 각 유사도의 산출 시에, 대상으로 하는 테이블 간에 있어서의 각 칼럼의 이름 및 데이터형의 각각의 일치 판정을 행하고, 당해 일치 판정의 결과를 소정 알고리즘에 적용함으로써 유사도를 산출하고,
    상기 재이용 가능한 변환 처리 부품 후보의 정보의 출력 시에, 상기 특정한, 마스터 데이터 형식의 소정 테이블과 상기 소정 시스템의 소정 테이블에 대하여, 상기 일치 판정에서 일치가 특정된 칼럼에 관한, 당해 테이블 사이에 관한 상기 변환 처리 정의의 정보를 기억 장치로부터 판독하고, 당해 정보를 재이용 가능한 변환 처리 부품 후보의 정보로서 소정 장치에 출력하는 것임
    을 특징으로 하는 데이터 통합 장치.
  3. 제2항에 있어서,
    상기 연산 장치는,
    상기 각 유사도의 산출 시에, 유사도에 대한 영향의 크기에 따라서 칼럼마다 정한 가중치 부여값을, 상기 일치 판정의 결과에 적용한 후에, 상기 소정 알고리즘에 의한 유사도의 산출을 행하는 것임
    을 특징으로 하는 데이터 통합 장치.
  4. 제3항에 있어서,
    상기 연산 장치는,
    상기 재이용 가능한 변환 처리 부품 후보의 정보를 출력할 시에, 상기 특정한, 마스터 데이터 형식의 소정 테이블과 상기 소정 시스템의 소정 테이블에 대하여, 상기 일치 판정에서 일치가 특정되고, 상기 가중치 부여값의 적용 대상으로 된 칼럼에 관한 정보와, 당해 칼럼에 관해서 적용된 상기 가중치 부여값의 변경용 인터페이스를 추가로 출력하고, 상기 변경용 인터페이스에서 접수한 가중치 부여값의 변경 지시에 따라서, 상기 각 유사도의 산출 및 당해 산출에 수반하는 각 처리를 재실행하는 것임
    을 특징으로 하는 데이터 통합 장치.
  5. 소정 사상의 데이터에 관해서 소정 시스템에서 이용하는 각 테이블의 데이터 형식, 및, 상기 데이터 사이에서 보편적인 데이터 형식으로서 소정 테이블마다 미리 정한 마스터 데이터 형식의 각 정보와, 상기 마스터 데이터 형식의 소정 테이블과 상기 소정 시스템의 소정 데이터 형식의 소정 테이블 사이에서의 데이터의 변환 처리 정의의 정보를 저장한 기억 장치를 구비하는 정보 처리 장치가,
    상기 기억 장치에 데이터 형식의 정보가 미저장인 소정 데이터에 관한 테이블의 데이터 형식과, 상기 소정 테이블마다의 마스터 데이터 형식의 유사도인 제1 유사도를 산출하고, 당해 제1 유사도가 소정 기준을 충족시키는 마스터 데이터 형식의 소정 테이블을 특정하는 처리와,
    상기 특정한 소정 테이블의 마스터 데이터 형식과, 상기 기억 장치에 저장하고 있는 상기 소정 시스템의 각 테이블의 데이터 형식의 유사도인 제2 유사도를 산출하고, 당해 제2 유사도가 소정 기준을 충족시키는 소정 시스템의 소정 테이블을 특정하는 처리와,
    상기 특정한, 마스터 데이터 형식의 소정 테이블과 상기 소정 시스템의 소정 테이블에 대하여, 당해 테이블 사이에 관한 상기 변환 처리 정의의 정보를 기억 장치로부터 판독하고, 당해 정보를 재이용 가능한 변환 처리 부품 후보의 정보로서 소정 장치에 출력하는 처리
    를 실행하는 것을 특징으로 하는 데이터 통합 방법.
  6. 제5항에 있어서,
    상기 정보 처리 장치가,
    상기 제1 및 제2 각 유사도의 산출 시에, 대상으로 하는 테이블 간에 있어서의 각 칼럼의 이름 및 데이터형의 각각의 일치 판정을 행하고, 당해 일치 판정의 결과를 소정 알고리즘에 적용함으로써 유사도를 산출하고,
    상기 재이용 가능한 변환 처리 부품 후보의 정보의 출력 시에, 상기 특정한, 마스터 데이터 형식의 소정 테이블과 상기 소정 시스템의 소정 테이블에 대하여, 상기 일치 판정에서 일치가 특정된 칼럼에 관한, 당해 테이블 사이에 관한 상기 변환 처리 정의의 정보를 기억 장치로부터 판독하고, 당해 정보를 재이용 가능한 변환 처리 부품 후보의 정보로서 소정 장치에 출력하는
    것을 특징으로 하는 데이터 통합 방법.
  7. 제6항에 있어서,
    상기 정보 처리 장치가,
    상기 각 유사도의 산출 시에, 유사도에 대한 영향의 크기에 따라서 칼럼마다 정한 가중치 부여값을, 상기 일치 판정의 결과에 적용한 후에, 상기 소정 알고리즘에 의한 유사도의 산출을 행하는
    것을 특징으로 하는 데이터 통합 방법.
  8. 제7항에 있어서,
    상기 정보 처리 장치가,
    상기 재이용 가능한 변환 처리 부품 후보의 정보를 출력할 시에, 상기 특정한, 마스터 데이터 형식의 소정 테이블과 상기 소정 시스템의 소정 테이블에 대하여, 상기 일치 판정에서 일치가 특정되고, 상기 가중치 부여값의 적용 대상으로 된 칼럼에 관한 정보와, 당해 칼럼에 관해서 적용된 상기 가중치 부여값의 변경용 인터페이스를 추가로 출력하고, 상기 변경용 인터페이스에서 접수한 가중치 부여값의 변경 지시에 따라서, 상기 각 유사도의 산출 및 당해 산출에 수반하는 각 처리를 재실행하는
    것을 특징으로 하는 데이터 통합 방법.
KR1020197003935A 2016-10-07 2017-03-21 데이터 통합 장치 및 데이터 통합 방법 KR102243794B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016198655A JP6723893B2 (ja) 2016-10-07 2016-10-07 データ統合装置およびデータ統合方法
JPJP-P-2016-198655 2016-10-07
PCT/JP2017/011163 WO2018066152A1 (ja) 2016-10-07 2017-03-21 データ統合装置およびデータ統合方法

Publications (2)

Publication Number Publication Date
KR20190028485A KR20190028485A (ko) 2019-03-18
KR102243794B1 true KR102243794B1 (ko) 2021-04-23

Family

ID=61831657

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197003935A KR102243794B1 (ko) 2016-10-07 2017-03-21 데이터 통합 장치 및 데이터 통합 방법

Country Status (4)

Country Link
US (1) US20200193343A1 (ko)
JP (1) JP6723893B2 (ko)
KR (1) KR102243794B1 (ko)
WO (1) WO2018066152A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11494688B2 (en) * 2018-04-16 2022-11-08 Oracle International Corporation Learning ETL rules by example
JP2022059247A (ja) * 2020-10-01 2022-04-13 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
WO2022157970A1 (ja) * 2021-01-25 2022-07-28 日本電気株式会社 情報処理装置、制御方法及び記憶媒体

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007083371A1 (ja) 2006-01-18 2007-07-26 Fujitsu Limited データ統合装置、方法、プログラムを記録した記録媒体
JP2009145972A (ja) 2007-12-11 2009-07-02 Hitachi Information Systems Ltd データべースシステム及びデータべースシステムの制御方法
JP2013225285A (ja) 2012-03-19 2013-10-31 Ricoh Co Ltd 情報処理装置、情報処理方法、およびプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5601066B2 (ja) 2010-07-23 2014-10-08 富士通株式会社 情報統合プログラム、装置及び方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007083371A1 (ja) 2006-01-18 2007-07-26 Fujitsu Limited データ統合装置、方法、プログラムを記録した記録媒体
JP2009145972A (ja) 2007-12-11 2009-07-02 Hitachi Information Systems Ltd データべースシステム及びデータべースシステムの制御方法
JP2013225285A (ja) 2012-03-19 2013-10-31 Ricoh Co Ltd 情報処理装置、情報処理方法、およびプログラム

Also Published As

Publication number Publication date
US20200193343A1 (en) 2020-06-18
WO2018066152A1 (ja) 2018-04-12
KR20190028485A (ko) 2019-03-18
JP2018060430A (ja) 2018-04-12
JP6723893B2 (ja) 2020-07-15

Similar Documents

Publication Publication Date Title
US20190251471A1 (en) Machine learning device
JP6764779B2 (ja) 同義カラム候補選出装置、同義カラム候補選出方法、及び同義カラム候補選出プログラム
US20180025092A1 (en) Modular memoization, tracking and train-data management of feature extraction
JP6874729B2 (ja) 画像処理装置、画像処理方法およびプログラム
KR102243794B1 (ko) 데이터 통합 장치 및 데이터 통합 방법
JP7015319B2 (ja) データ分析支援装置、データ分析支援方法およびデータ分析支援プログラム
JP2019185137A (ja) 画像処理装置、画像処理方法およびプログラム
CN102214091A (zh) 一种定位软件开发中需求变更影响范围的方法和系统
WO2019194026A1 (ja) 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体
US11010393B2 (en) Library search apparatus, library search system, and library search method
CN112308727A (zh) 保险理赔业务处理方法及装置
JP7015320B2 (ja) データ分析支援装置、データ分析支援方法およびデータ分析支援プログラム
US20110113006A1 (en) Business process control apparatus, businesses process control method and business process control program
CN115438995A (zh) 一种基于知识图谱的服装定制企业的业务处理方法及设备
JP6695847B2 (ja) ソフトウェア部品管理システム、計算機
JP5449438B2 (ja) ソフトウェア資産再利用支援装置およびソフトウェア資産再利用支援プログラム
CN111752927A (zh) 基于克隆的数据形态生成方法、装置、终端设备及介质
JP5081889B2 (ja) 入力支援装置、入力支援方法及び入力支援プログラム
WO2019193923A1 (ja) 画像処理装置、画像処理方法および記録媒体
US11886459B2 (en) Data management system and data management method
JP6852002B2 (ja) データ検索方法、データ検索装置及びプログラム
WO2018016001A1 (ja) データモデリングシステム、データモデリング方法
JP6664306B2 (ja) 類似文書抽出装置、類似文書抽出方法及び類似文書抽出プログラム
JP6498588B2 (ja) 情報配信システムおよび情報配信方法
JP2010271959A (ja) 業務プロセス間の類似度算出方法、プログラム及び装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant