KR101542605B1 - 온톨로지 매칭의 시멘틱 이질성 병렬 처리 장치 및 처리 방법 - Google Patents

온톨로지 매칭의 시멘틱 이질성 병렬 처리 장치 및 처리 방법 Download PDF

Info

Publication number
KR101542605B1
KR101542605B1 KR1020130122839A KR20130122839A KR101542605B1 KR 101542605 B1 KR101542605 B1 KR 101542605B1 KR 1020130122839 A KR1020130122839 A KR 1020130122839A KR 20130122839 A KR20130122839 A KR 20130122839A KR 101542605 B1 KR101542605 B1 KR 101542605B1
Authority
KR
South Korea
Prior art keywords
ontology
matching
parallel
model object
unit
Prior art date
Application number
KR1020130122839A
Other languages
English (en)
Other versions
KR20150043870A (ko
Inventor
이승룡
빌알 아민 무하마드
Original Assignee
경희대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 경희대학교 산학협력단 filed Critical 경희대학교 산학협력단
Priority to KR1020130122839A priority Critical patent/KR101542605B1/ko
Publication of KR20150043870A publication Critical patent/KR20150043870A/ko
Application granted granted Critical
Publication of KR101542605B1 publication Critical patent/KR101542605B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

본 발명에 따른 온톨로지 매칭의 시멘틱 이질성 병렬 처리 장치는 참여 클라우드 노드와 상호작용하여 온톨로지 매칭(Matching) 요청을 수신하는 시스템 상호작용부, 온톨로지 매칭을 위한 매칭 알고리즘을 포함하는 매칭 라이브러리를 제공하는 매칭부, 수신된 온톨로지 매칭 요청에 따라 후보 온톨로지를 병렬로 파싱하고, 파싱된 후보 온톨로지에 기초하여 온톨로지 모델 오브젝트를 생성하는 병렬 온톨로지 호출부 및 생성된 온톨로지 모델 오브젝트를 둘 이상의 부분 오브젝트로 분할하고, 분할된 둘 이상의 부분 오브젝트를 멀티코어 클라우드 플랫폼 상의 가용 연산 코어에 각각 할당하는 작업 분산부를 포함한다.

Description

온톨로지 매칭의 시멘틱 이질성 병렬 처리 장치 및 처리 방법{PARALLEL PROCESSING APPARATUS AND PROCESSING APPARATUS FOR SEMANTIC HETEROGENEITY OF ONTOLOGY MATCHING}
본 발명은 온톨로지 매칭에 관한 기술로서, 보다 상세하게는 온톨로지 매칭에서 시멘틱 이질성을 해결하기 위한 기술임.
과학기술의 발전에 따른 세계화 및 자동화의 시대는 매우 방대한 양의 정보가 생산 및 가공되고 있다. 이와 같은 빠르게 생산되는 방대한 정보를 효과적으로 이용하기 위해 정보 통합의 중요성이 대두되고 있으며, 정보 통합은 지식 기반 서비스(Knowledge Driven Service)를 제공하기 위한 중요한 도구이다. 웹 상에 존재하는 다양한 정보의 밀도가 증가함에 따라 정보 이질성(Information Heterogeneity)의 문제가 드러나고 있다. 정보 이질성은 크게 두 가지 유형으로 분류될 수 있다. 첫 번째는 데이터 이질성이다. 데이터 이질성은 데이터 정의, 데이터 유형, 데이터 형태 및 데이터 정밀로에 기반한 해법을 가진다. 두 번째는 시멘틱 이질성(Semantic Heterogeneity)이다. 시멘틱 이질성은 데이터 이질성과 달리 통합을 위한 기회를 만드는 데이터 의미를 포함한다.
이와 같은 시멘틱 이질성에 의해 다량의 데이터의 용량은 직접 일일이 분석하는 수동 주석(Manual Annotatoin)의 수행을 비현실적으로 만든다. 그 결과, 온톨로지에 기반한 자동화 솔루션은 소프트웨어 에이전트에 의해 사용된다. 시멘틱 이질성 해결을 위한 가장 중요한 솔루션은 시멘틱으로 연결된 온톨로지 사이의 규칙을 결정하는 온톨로지 매칭(Ontology Matching)이다. 온톨로지 매칭으로부터 그려진 매핑(Mapping)은 데이터베이스 통합, e-커머스 시스템, 시멘틱 웹 서비스 및 소셜 네트워크와 같은 정보 시스템에서 더 효과적으로 활용될 수 있다.
웹 상에서 시멘틱하게 관련된 정보의 존재는 결과적으로 시멘틱 이질성을 야기한다. 시멘틱 이질성을 해결하기 위해, 온톨로지 매칭 도구 및 온톨로지 매칭 기술은 시멘틱 웹 시스템에 의해 유용해진다. 그러나, 효과적인 온톨로지 매칭은 많은 연산을 필요로 한다. 중간 규모에서부터 큰 규모를 가지는 온톨로지는 제공된 연산 자원 및 활용된 매칭 알고리즘의 복잡성에 의해 많은 연산 시간을 필요로 한다.
온톨로지 매칭의 요구되는 결과를 생산하는데 소요되는 지연 시간은 시멘틱웹 기반 인터랙티브(Interactive) 및 세미-리얼 타임(Semi-Real Time) 시스템을 위한 온톨로지 매칭을 부적절하게 만든다. 지금까지 성능 관점에서, 온톨로지 매칭의 발전은 온톨로지 매칭 알고리즘의 향상 또는 매칭 알고리즘을 위한 온톨로지의 분할에 의해 이루어져 왔다.
그러나, 현재 사용되는 온톨로지 매칭 기술 및 온톨로지 매칭 도구중 어느 것도 분명히 더 나은 연산 자원의 이득을 가지지 못했다. 오늘날 마이크로프로세서의 멀티코어(Multicore)는 다중 프로세싱 코어, 가상 마이크로프로세서와 같이 각각의 코어를 처리할 수 있다. 게다가, 데스크탑, 랩탑 또는 스마트폰으로 국한시키면, 멀티코어 프로세서의 거대한 자원(리소스)는 클라우드 플랫폼의 형식에서 사용할 수 있다.
효과적인 온톨로지 매칭은 후보 온톨로지를 종료시키기 위한 리소스 기반의 대응 알고리즘을 요구하는 집중적인 연산 작업이다. 후보 온톨로지를 종료시키기 위한 리소스 기반의 대응 알고리즘은 이름 기반, 체계 기반, 주석 기반 및 재산 기반이 될 수 있다. 대량의 온톨로지가 발생할 때, 온톨로지 매칭의 연산 효율 및 메모리 효율은 온톨로지 크기 및 온톨로지 사이의 관계에 의해 최대 피크를 가질 수 있다. 온톨로지 매칭은 매칭 처리를 위한 연산 요구가 높을 뿐만 아니라, 메모리 요구 또한 매우 높다. 특히, 온톨로지 개념의 관계에 따른 매칭 알고리즘 평가는 실행하는 동안 기가바이트(Gigabytes)에서 메모리 변형을 생성하는 메인 메모리에서 개념 그래프를 요구한다. 온톨로지 매칭의 성능을 향상시키기 위해서는 가장 효과적으로 활용할 수 있는 연산 자원을 필요로 한다.
본 발명이 해결하고자 하는 과제는 시멘틱 이질성을 해결하기 위해 다양한 개념을 가지는 온톨로지 매칭의 시멘틱 이질성을 해결하는 과정에서 연산량 및 소요 메모리를 효과적으로 줄이기 위한 이질성 병렬 처리 장치 및 처리 방법을 제공하는 것이다.
본 발명에 따른 온톨로지 매칭의 시멘틱 이질성 병렬 처리 장치는 참여 클라우드 노드와 상호작용하여 온톨로지 매칭(Matching) 요청을 수신하는 시스템 상호작용부, 온톨로지 매칭을 위한 매칭 알고리즘을 포함하는 매칭 라이브러리를 제공하는 매칭부, 수신된 온톨로지 매칭 요청에 따라 후보 온톨로지를 병렬로 파싱하고, 파싱된 후보 온톨로지에 기초하여 온톨로지 모델 오브젝트를 생성하는 병렬 온톨로지 호출부 및 생성된 온톨로지 모델 오브젝트를 둘 이상의 부분 오브젝트로 분할하고, 분할된 둘 이상의 부분 오브젝트를 멀티코어 클라우드 플랫폼 상의 가용 연산 코어에 각각 할당하는 작업 분산부를 포함한다.
그리고, 생성된 온톨로지 모델 오브젝트를 저장하고, 수신된 온톨로지 매칭 요청과 동일한 요청이 수신되면 저장된 온톨로지 모델 오브젝트를 제공하는 온톨로지 저장부, 멀티코어 클라우드 플랫폼에 속한 참여 클라우드 노드의 초기 정보를 제공하는 장치 환경설정 파일을 저장하며 저장된 장치 환경설정 파일에 기초하여 참여 클라우드 노드를 구분하고, 참여 클라우드 노드와의 연결 IP를 설정하는 장치 환경설정부 및 가용 연산 코어에서 부분 오브젝트에 매칭 알고리즘을 적용하여 연산한 매칭 결과를 축적하여 브릿지 온톨로지(Bridge Ontology) 파일을 생성하고, 상기 생성된 브릿지 온톨로지 파일을 클라이언트(Client)에게 제공하는 브릿지 온톨로지 수집부를 더 포함할 수 있다.
생성된 온톨로지 모델 오브젝트는 런타임(Run Time) 동안 단일 매칭 알고리즘에 의해 요구된 정보를 요약할 수 있으며, 병렬 온톨로지 호출부는 후보 온톨로지를 파싱하는 과정에서 리던던시(Redundancy)를 제거하여 불필요하거나 중복된 데이터를 줄일 수 있다.
본 발명에 따른 온톨로지 매칭의 시멘틱 이질성 병렬 처리 방법은 먼저, 수신된 온톨로지 매칭 요청에 기초하여, 후보 온톨로지를 병렬로 파싱한다. 그리고, 파싱괸 파싱된 후보 온톨로지에 기초하여 온톨로지 모델 오브젝트를 생성한다. 온톨로지 모델 오브젝트가 생성되면, 수신된 온톨로지 매칭 요청에 기초하여 매칭 라이브러리를 검색한다. 그리고, 생성된 온톨로지 모델 오브젝트를 둘 이상의 부분 오브젝트로 분할하고, 분할된 둘 이상의 부분 오브젝트를 멀티코어 클라우드 플랫폼 상의 가용 연산 코어 각각에 배정한다. 부분 오브젝트가 배정된 연산 코어는 매칭 알고리즘을 적용하여 매칭 결과를 생성한다.
본 발명에 따른 온톨로지 매칭의 시멘틱 이질성 병렬 처리 장치 및 처리 방법을 통해 온톨로지 매칭 과정에서의 시멘틱 이질성을 처리시, 클라우드 플랫폼 상의 멀티코어 중에서 가용 연산 코어를 통해 분산 처리함으로써, 연산량 및 소요 메모리를 줄일 수 있으며, 분할 처리 과정에서 리던던시(Redundancy) 제거를 통해 높은 정확도를 가질 수 있다.
도 1은 본 발명에 따른 온톨로지 매칭의 시멘틱 이질성 병렬 처리 장치의 일 실시예를 나타내는 도면이다.
도 2는 본 발명의 일 실시예에 따른 온톨로지 매칭의 시멘틱 이질성 병렬 처리 방법을 나타내는 흐름도이다.
이하, 첨부된 도면들을 참조하여 본 발명의 실시예를 상세하게 설명한다. 본 명세서에서 사용되는 용어는 실시예에서의 기능 및 효과를 고려하여 선택된 용어들로서, 그 용어의 의미는 사용자 또는 운용자의 의도 또는 업계의 관례 등에 따라 달라질 수 있다. 따라서 후술하는 실시예들에서 사용된 용어의 의미는, 본 명세서에 구체적으로 명시된 경우에는 명시된 정의에 따르며, 구체적으로 명시하지 않는 경우, 당업자들이 일반적으로 인식하는 의미로 해석되어야 할 것이다.
도 1은 본 발명에 따른 온톨로지 매칭의 시멘틱 이질성 병렬 처리 장치의 일 실시예를 나타내는 도면이다.
도 1을 참조하면, 본 발명에 따른 온톨로지 매칭의 시멘틱 이질성 병렬 처리 장치(100)는 시스템 상호작용부(110), 병렬 온톨로지 호출부(120), 온톨로지 저장부(130), 매칭부(140), 작업 분산부(150), 장치 환경설정부(160), 브릿지 온톨로지 수집부(170), 작업 처리부(180) 및 브릿지 온톨로지 수집부(190)를 포함할 수 있다.
시스템 상호작용부(110)는 사용자 인터페이스부(111) 및 웹 서비스부(112)를 포함할 수 있다.
사용자 인터페이스부(111)는 본 발명에 따른 시멘틱 이질성 해결을 위한 멀티코어 클라우드 플랫폼을 이용한 온톨로지 매칭 병렬 처리 장치(100)와 사용자 사이를 연결하여 둘 사이의 상호작용을 가능하게 한다. 그리고, 사용자 인터페이스부(111)는 사용자 또는 멀티코어 클라우드 플랫폼 상의 다른 단말로부터 온톨로지 매칭 요청을 수신할 수 있다. 또한, 사용자 인터페이스부(111)는 사용자 또는 멀티코어 클라우드 플랫폼 상의 다른 단말로부터 후보 온톨로지를 수신할 수 있다.
웹 서비스부(112)는 네트워크 상에서 서로 다른 종류의 컴퓨터들 간에 상호작용을하기 위한 시스템으로 멀티코어 클라우드 플랫폼 상에 존재하는 다른 컴퓨터와 상호작용을 하기 위한 구성요소이다. 또한, 서드 파티 시스템(Third Party System)을 위해, 웹 서비스부(112)는 서드 파티와 상호작용을 할 수 있다. 웹 서비스부(112)에 의해 매칭 요구를 호출하는 참여 클라우드 노드는 주요 노드로 대접된다. 뿐만 아니라, 참여 클라우드 노드는 병렬 처리 환경에서 온톨로지 분할 및 매칭 작업 배정에 책임이 있다.
병렬 온톨로지 호출부(120)는 시스템 상호작용부(110)로부터 온톨로지 매칭 요청이 수신되면, 후보 온톨로지를 병렬로 파싱한다. 그리고, 병렬 온톨로지 호출부(120)는 파싱된 후보 온톨로지 리소스는 다중 쓰레드 안전 온톨로지 모델 오브젝트(Multiple Thread Safe Ontology Model Object)에 덧붙여진다.. 각각의 다중 쓰레드 안전 온톨로지 모델 오브젝트는 런타임(Run Time) 동안 단일 매칭 알고리즘에 의해 요구된 정보를 요약할 수 있다. 뿐만 아니라, 병렬 온톨로지 호출부(120)는 개념의 이름에 기반한 URI와 같은 리던던시(Redundancy)를 후보 온톨로지를 병렬로 파싱하는 과정에서 제거할 수 있다. 이를 통해, 병렬 온톨로지 호출부(120)는 런타임 중에 메모리 변형을 막아 실행하는 동안 메인 메모리에서 불필요한 정보를 로드하는 것을 막을 수 있다. 그리고, 병렬 온톨로지 호출부(120)는 후보 온톨로지를 파싱하여 생성된 온톨로지 모델 오브젝트와 매칭부(140)로부터 수신된 매칭 알고리즘 라이브러리를 작업 분산부(150)로 전달한다.
온톨로지 모델 오브젝트는 향후 수신되는 요청을 위해 온톨로지 저장부(130)에 직렬 오브젝트 형태로 저장된다. 만약 시스템 상호작용부(110)를 통해 동일한 매칭 요청이 수신되면, 병렬 온톨로지 호출부(120)는 후보 온톨로지를 병렬로 파싱하는 과정을 생략하고, 온톨로지 저장부(130)에 저장된 직렬 오브젝트를 호출한다. 이를 통해, 시스템이 불필요한 파싱 작업을 수행하는 것을 방지할 수 있다. 그 결과, 온톨로지 저장부(130)에 저장된 온톨로지와 관계된 매칭 요청 시, 더 작은 메모리 부하를 가지며, 더 빠르게 온톨로지 모델 오브젝트를 호출할 수 있다.
온톨로지 저장부(130)는 병렬 온톨로지 호출부(120)에 의해 후보 온톨로지를 파싱하여 생성된 온톨로지 모델 오브젝트를 직렬 오브젝트 형태로 저장한다. 그리고, 온톨로지 저장부(130)는 클라우드 데이터 동기화 서비스에 의해 시스템 인스턴스에 동기화된다.
매칭부(140)는 온톨로지 매칭 알고리즘을 위한 라이브러리를 병렬 온톨로지 호출부(120)에 제공한다. 매칭부(140)의 온톨로지 매칭 알고리즘은 크게 최우선(Primary), 차선(Secondary) 및 상호보완(Complementary) 유형으로 분류될 수 있다. 최우선 온톨로지 매칭 알고리즘은 모든 매칭 요청에 실행될 수 있으며, 차선 온톨로지 매칭 알고리즘은 높은 정확도를 필요로 할 때 실행될 수 있다. 그리고, 상호보완 유형의 온톨로지 매칭 알고리즘은 온톨로지 범위(Ontology Scope)의 측면에서 함께 실행된다.
작업 분산부(150)는 병렬 온톨로지 호출부(130)로부터 수신된 온톨로지 모델 오브젝트를 둘 이상의 부분 오브젝트로 분할한다. 그리고, 작업 분산부(150)는 둘 이상의 부분 오브젝트를 멀티코어 클라우드 플랫폼 내의 가용한 둘 이상의 연산 코어(183)에 각각 배정하여, 매칭 알고리즘을 수행할 수 있도록 한다. 작업 분산부(150)에 의해 분할된 둘 이상의 부분 오브젝트 중에서, 크기 기반 및 복잡성 기반 부분 오브젝트를 포함하는 몇몇의 부분 오브젝트 스키마(Scheme)가 사용될 수 있다. 근거리(Local) 리소스를 위해 쓰레드들은 병렬 매칭 호출 가능 코어를 수행하기 위해 배치된다. 그리고, 원거리(Remote) 리소스를 위해, 제어 메시지는 부분 오브젝트 및 실행을 위한 매칭 알고리즘로 여기는 참여 클라우드 노드를 위해 생성된다.
가용 리소스에 의한 부분 오브젝트는 예를 들어, 더 나은 리소스 활용과 같은 시스템의 확장성 측면을 보장한다. 그리고, 작업 분산부(150)에 의해 분할된 각각의 부분 오브젝트는 매칭부(150)의 매칭 라이브러리로부터의 표준 매칭 알고리즘의 인스턴스와 함께 연산 코어(183)에 배정된다. 이 과정은 예를 들어, 성능 및 정확도 사이에 발생할 수 있는 트레이드 오프(Trade-off)를 방지하여, 정확도의 레벨을 보장한다.
장치 환경설정부(160)는 온톨로지 매칭 병렬 처리 장치(100)의 매칭 과정을 시작하기에 앞서, 멀티코어 클라우드 플랫폼에 속한 참여 클라우드 노드의 초기 정보를 제공하는 장치 환경설정 파일을 로드(Load)한다. 멀티코어 클라우드 플랫폼에 속한 참여 클라우드 노드의 초기 정보를 제공하는 장치 환경설정 파일은 클라우드 노드 IP, 프로세스 포트 넘버 및 실행등급을 포함한다. 환경설정 파일을 사용하는 모든 프로세스는 각각의 ID가 입력된 소켓 오브젝트 생성을 야기하는 그들의 고유한 유니크 식별자(UUID)를 공유한다. 각각의 인스턴스(Instance)는 이 정보를 저장하는 소켓 테이블을 유지한다. 장치 환경설정부(160)는 후보 온톨로지의 가용성과 함께 가용 연산 자원에 관한 정보를 소켓 테이블과 함께 작업 분산부(150)로 전달한다.
멀티코어 클라우드 플랫폼에 속한 모든 참여 클라우드 노드는 그들 각각에 대응된 결과를 생성한다. 브릿지 온톨로지 수집부(190)는 멀티코어 클라우드 플랫폼에 속한 모든 참여 클라우드 노드에서 생성된 매칭 결과를 축적하여 브릿지 온톨로지(Bridge Ontology) 파일을 생성한다. 첫 번째 노드에서 브릿지 온톨로지 수집부(190)는 근거리 및 원거리 브릿지 온톨로지 파일을 하나의 파일로 컴파일하여 집계하는 추가적인 책임을 가진다. 집계된 브릿지 온톨로지는 생성되고, 시스템 상호작용부(110)에 의해 클라이언트에게 다시 되돌아간다. 집계된 브릿지 온톨로지는 차후 매칭 요청이 수신될 것을 대비하여 온톨로지 저장부(130)에 저장될 수 있다.
작업 처리부(180)는 넷 프레임워크(181), 클라우드 하이퍼바이저(182) 및 가용 연산 코어(183)을 포함한다.
병행 라이브러리(Concurrency Library)는 넷 프레임워크(181)로부터 클라우드 하이퍼바이저(182)를 경유하여 연산 지원을 통해 스레드를 생성하는데 이용된다. 각각의 생성된 스레드는 가용 연산 코어(183)와 1:1로 대응한다.
원거리(Remote) 리소스를 위해, 제어 메시지는 부분 오브젝트 및 실행을 위한 매칭 알고리즘로 여기는 참여 클라우드 노드를 위해 생성된다.
제어 메시지는 하이퍼바이저의 가상화층으로부터 통신 하드웨어(184)를 활용하는 넷 프레임워크(181)로부터 네트워킹 라이브러리(Networking Library) 활용에 의해 전송된다. 제어 메시지를 수신한 후, 각각의 참여 클라우드 노드는 온톨로지 저장부(130)로부터 가용 연산 코어(183)를 이용한 병렬 매칭을 위해 후보 온톨로지를 소유한 부분 오브젝트를 호출한다.
도 2는 본 발명의 일 실시예에 따른 온톨로지 매칭의 시멘틱 이질성 병렬 처리 방법을 나타내는 흐름도이다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 온톨로지 매칭의 시멘틱 이질성 병렬 처리 방법은 먼저, 멀티코어 클라우드 플랫폼 상의 참여 클라우드 노드로부터 온톨로지 매칭 요청이 수신(201)되면, 후보 온톨로지를 병렬로 파싱한다(202). 멀티코어 클라우드 플랫폼상에 존재하는 둘 이상의 노드 중에서 어느 하나의 참여 클라우드 노드로부터 서로 대응하는 온톨로지를 찾기 위한 온톨로지 매칭 요청이 수신되면, 다수의 온톨로지 중에서 수신된 온톨로지 매칭 요청에 대응하는 후보 온톨로지를 선택하여 파싱을 수행한다.
그리고, 파싱된 후보 온톨로지 리소스를 온톨로지 모델 오브젝트에 포함시킨다(203). 각각의 온톨로지 모델 오브젝트는 런타임 동안 단일 매칭 알고리즘에 의해 요구된 정보를 요약한다. 뿐만 아니라, 병렬 온톨로지 호출부(120)는 개념의 이름에 기반한 URI와 같은 리던던시(Redundancy)를 후보 온톨로지를 병렬로 파싱하는 과정에서 제거할 수 있다. 이를 통해, 병렬 온톨로지 호출부(120)는 런타임 중에 메모리 변형을 막아 실행하는 동안 메인 메모리에서 불필요한 정보를 로드하는 것을 막을 수 있다.
파싱된 후보 온톨로지로부터 온톨로지 모델 오브젝트가 생성되면, 생성된 온톨로지 모델 오브젝트를 저장한다(204). 생성된 온톨로지 모델 오브젝트는 향후 수신되는 요청을 위해 직렬 오브젝트 형태로 저장된다. 만약 참여 클라우드 노드로부터 동일한 매칭 요청이 수신되면, 후보 온톨로지를 병렬로 파싱하여 온톨로지 모델 오브젝트를 생성하는 과정을 생략하고, 기저장된 온톨로지 모델 오브젝트를 호출한다. 이를 통해, 시스템이 불필요한 파싱 작업을 수행하는 것을 방지할 수 있다. 그 결과, 저장된 온톨로지와 관계된 매칭 요청 시, 더 작은 메모리 부하를 가지며, 더 빠르게 온톨로지 모델 오브젝트를 호출할 수 있다. 저장된 온톨로지 모델 오브젝트는 클라우드 데이터 동기화 서비스에 의해 시스템 인스턴스에 동기화될 수 있다.
다음으로, 온톨로지 매칭 알고리즘을 위한 매칭 라이브러리를 검색한다(205). 온톨로지 매칭 알고리즘은 크게 최우선(Primary), 차선(Secondary) 및 상호보완(Complementary) 유형으로 분류될 수 있다. 최우선 온톨로지 매칭 알고리즘은 모든 매칭 요청에 실행될 수 있으며, 차선 온톨로지 매칭 알고리즘은 높은 정확도를 필요로 할 때 실행될 수 있다. 그리고, 상호보완 유형의 온톨로지 매칭 알고리즘은 온톨로지 범위(Ontology Scope)의 측면에서 함께 실행될 수 있다.
다음으로, 생성된 온톨로지 모델 오브젝트를 둘 이상의 부분 오브젝트로 분할한다(206). 온톨로지 모델 오브젝트 전체를 한번에 매칭 알고리즘에 적용한다면, 매칭 온톨로지를 찾기위한 매칭 알고리즘은 많은 양의 연산 자원을 필요로하며, 많은 메모리를 변형시키게 된다. 따라서, 소모되는 연산 자원 및 메모리를 줄이기 위해 먼저, 생성된 온톨로지 모델 오브젝트를 둘 이상의 부분 오브젝트로 분할한다. 온톨로지 모델 오브젝트를 부분 오브젝트로 분할하는 개수는 온톨로지 모델 오브젝트의 종류 또는 가용 연산 코어의 개수 등에 따라 달라질 수 있다.
온톨로지 모델 오브젝트를 분할하여 부분 오브젝트가 생성되면, 분할된 부분 오브젝트를 멀티코어 클라우드 플랫폼 내의 가용한 둘 이상의 연산 코어에 각각 배정한다(207). 온톨로지 모델 오브젝트를 분항하여 둘 이상의 부분 오브젝트가 생성되면, 각각의 부분 오브젝트에 매칭 알고리즘을 적용하여 처리하는 스레드(Thread)를 멀티코어를 구성하는 둘 이상의 연산 코어 각각에 배정한다. 각각의 연산 코어는 부분 오브젝트에 매칭 알고리즘을 적용하여 연산 처리를 수행하여 요청된 온톨로지 매칭 요청을 수행할 수 있다. 병행 라이브러리(Concurrency Library)는 넷 프레임워크로부터 클라우드 하이퍼바이저를 경유하여 연산 지원을 통해 스레드를 생성하는데 이용된다. 각각의 생성된 스레드는 가용 연산 코어와 1:1로 대응한다. 분할된 둘 이상의 부분 오브젝트 중에서, 크기 기반 및 복잡성 기반 부분 오브젝트를 포함하는 몇몇의 부분 오브젝트 스키마(Scheme)가 사용될 수 있다. 근거리(Local) 리소스를 위해 쓰레드들은 병렬 매칭 호출 가능 코어를 수행하기 위해 배치된다. 그리고, 원거리(Remote) 리소스를 위해, 제어 메시지는 부분 오브젝트 및 실행을 위한 매칭 알고리즘으로 여기는 참여 클라우드 노드를 위해 생성된다.
가용 리소스에 의한 부분 오브젝트는 예를 들어, 더 나은 리소스 활용과 같은 시스템의 확장성 측면을 보장한다. 그리고, 분할된 각각의 부분 오브젝트는 매칭 라이브러리로부터의 표준 매칭 알고리즘의 인스턴스와 함께 연산 코어에 배정된다. 이 과정은 예를 들어, 성능 및 정확도 사이에 발생할 수 있는 트레이드 오프(Trade-off)를 방지하여, 정확도의 레벨을 보장한다.
연산 코어에서 분할된 부분 오브젝트에 매칭 알고리즘을 적용하여 연산을 수행하면, 연산에 따른 매칭 결과를 축적한다(208). 멀티코어 클라우드 플랫폼에 속한 모든 참여 클라우드 노드는 그들 각각에 대응된 결과를 생성한다. 멀티코어 클라우드 플랫폼에 속한 모든 참여 클라우드 노드에서 생성된 매칭 결과를 축적하여 브릿지 온톨로지(Bridge Ontology) 파일을 생성한다. 첫 번째 노드에서 브릿지 온톨로지 수집부(190)는 근거리 및 원거리 브릿지 온톨로지 파일을 하나의 파일로 컴파일하여 집계하는 추가적인 책임을 가진다. 집계된 브릿지 온톨로지는 생성되고, 클라이언트에게 응답할 수 있다. 집계된 브릿지 온톨로지는 차후 매칭 요청이 수신될 것을 대비하여 저장될 수 있다.
201 단계 이전에, 온톨로지 매칭 과정을 개시하기에 앞서, 멀티코어 클라우드 플랫폼에 속한 참여 클라우드 노드의 초기 정보를 제공하는 장치 환경설정 파일을 로드(Load)하여 장치 환경을 설정할 수 있다. 멀티코어 클라우드 플랫폼에 속한 참여 클라우드 노드의 초기 정보를 제공하는 장치 환경설정 파일은 클라우드 노드 IP, 프로세스 포트 넘버 및 실행등급을 포함한다. 환경설정 파일을 사용하는 모든 프로세스는 각각의 ID가 입력된 소켓 오브젝트 생성을 야기하는 그들의 고유한 유니크 식별자(UUID)를 공유한다. 각각의 인스턴스(Instance)는 이 정보를 저장하는 소켓 테이블을 유지한다.
상술한 내용을 포함하는 본 발명은 컴퓨터 프로그램으로 작성이 가능하다. 그리고 상기 프로그램을 구성하는 코드 및 코드 세그먼트는 당분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 상기 작성된 프로그램은 컴퓨터가 읽을 수 있는 기록매체 또는 정보저장매체에 저장되고, 컴퓨터에 의하여 판독되고 실행함으로써 본 발명의 방법을 구현할 수 있다. 그리고 상기 기록매체는 컴퓨터가 판독할 수 있는 모든 형태의 기록매체를 포함한다.
이상 바람직한 실시예를 들어 본 발명을 상세하게 설명하였으나, 본 발명은 전술한 실시예에 한정되지 않고, 본 발명의 기술적 사상의 범위 내에서 당분야에서 통상의 지식을 가진자에 의하여 여러 가지 변형이 가능하다.
100: 온톨로지 매칭의 시멘틱 이질성 병렬 처리 장치
110: 시스템 상호작용부
120: 병렬 온톨로지 호출부
130: 온톨로지 저장부
140: 매칭부
150: 작업 분산부
160: 장치 환경설정부
170: 브릿지 온톨로지 수집부
180: 작업 처리부
190: 브릿지 온톨로지 수집부

Claims (10)

  1. 멀티코어 클라우드 플랫폼상에 존재하는 참여 클라우드 노드와 온톨로지 매칭을 수행하는 시멘틱 이질성 병렬 처리 장치에 있어서,
    상기 참여 클라우드 노드와 상호작용하여 온톨로지 매칭(Matching) 요청을 수신하는 시스템 상호작용부;
    온톨로지 매칭을 위한 매칭 알고리즘을 포함하는 매칭 라이브러리를 제공하는 매칭부;
    상기 수신된 온톨로지 매칭 요청에 따른 후보 온톨로지를 병렬로 파싱하고, 상기 파싱된 후보 온톨로지에 기초하여 온톨로지 모델 오브젝트를 생성하는 병렬 온톨로지 호출부; 및
    상기 생성된 온톨로지 모델 오브젝트를 둘 이상의 부분 오브젝트로 분할하고, 상기 분할된 둘 이상의 부분 오브젝트를 상기 멀티코어 클라우드 플랫폼 상의 가용 연산 코어에 각각 할당하는 작업 분산부;
    를 포함하며,
    상기 병렬 온톨로지 호출부는,
    상기 후보 온톨로지를 파싱하는 과정에서 리던던시(Redundancy)를 제거하는 것을 특징으로 하는 온톨로지 매칭의 시멘틱 이질성 병렬 처리 장치.
  2. 제 1항에 있어서,
    상기 생성된 온톨로지 모델 오브젝트를 저장하고, 상기 수신된 온톨로지 매칭 요청과 동일한 요청이 수신되면, 상기 저장된 온톨로지 모델 오브젝트를 제공하는 온톨로지 저장부;
    를 더 포함하는 것을 특징으로 하는 온톨로지 매칭의 시멘틱 이질성 병렬 처리 장치.
  3. 제 1항에 있어서,
    상기 멀티코어 클라우드 플랫폼에 속한 참여 클라우드 노드의 초기 정보를 제공하는 장치 환경설정 파일을 저장하며, 상기 저장된 장치 환경설정 파일에 기초하여 상기 참여 클라우드 노드를 구분하고, 상기 참여 클라우드 노드와의 연결 IP를 설정하는 장치 환경설정부;
    를 더 포함하는 것을 특징으로 하는 온톨로지 매칭의 시멘틱 이질성 병렬 처리 장치.
  4. 제 1항에 있어서,
    상기 가용 연산 코어에서 상기 부분 오브젝트에 상기 매칭 라이브러리에 포함된 매칭 알고리즘을 적용하여 연산한 매칭 결과를 축적하여 브릿지 온톨로지(Bridge Ontology) 파일을 생성하고, 상기 생성된 브릿지 온톨로지 파일을 클라이언트(Client)에게 제공하는 브릿지 온톨로지 수집부;
    를 더 포함하는 것을 특징으로 하는 온톨로지 매칭의 시멘틱 이질성 병렬 처리 장치.
  5. 제 1항에 있어서,
    상기 생성된 온톨로지 모델 오브젝트는 런타임(Run Time) 동안 단일 매칭 알고리즘에 의해 요구된 정보를 요약하는 것을 특징으로 하는 온톨로지 매칭의 시멘틱 이질성 병렬 처리 장치.
  6. 삭제
  7. 멀티코어 클라우드 플랫폼 상에 존재하는 참여 클라우드 노드와 온톨로지 매칭을 수행하는 시멘틱 이질성 병렬 처리 방법에 있어서,
    수신된 온톨로지 매칭 요청에 기초하여, 후보 온톨로지를 병렬로 파싱하는 단계;
    상기 파싱된 후보 온톨로지에 기초하여 온톨로지 모델 오브젝트를 생성하는 단계;
    상기 수신된 온톨로지 매칭 요청에 기초하여 매칭 라이브러리를 검색하는 단계;
    상기 생성된 온톨로지 모델 오브젝트를 둘 이상의 부분 오브젝트로 분할하는 단계; 및
    상기 분할된 둘 이상의 부분 오브젝트를 상기 멀티코어 클라우드 플랫폼 상의 가용 연산 코어 각각에 배정하는 단계;
    를 포함하며,
    상기 후보 온톨로지를 병렬로 파싱하는 단계에서 리던던시(Redundancy)를 제거하는 것을 특징으로 하는 온톨로지 매칭의 시멘틱 이질성 병렬 처리 방법.
  8. 제 7항에 있어서,
    상기 가용 연산 코어에서 상기 부분 오브젝트에 상기 매칭 라이브러리의 매칭 알고리즘을 적용하여 연산한 매칭 결과를 생성하는 단계; 및
    상기 생성된 매칭 결과를 축적하여 브릿지 온톨로지(Bridge Ontology) 파일을 생성하여 클라이언트(Client)에게 제공하는 단계;
    를 더 포함하는 것을 특징으로 하는 온톨로지 매칭의 시멘틱 이질성 병렬 처리 방법.
  9. 제 7항에 있어서,
    상기 생성된 온톨로지 모델 오브젝트를 저장하고, 상기 수신된 온톨로지 매칭 요청과 동일한 요청이 수신되면, 상기 저장된 온톨로지 모델 오브젝트를 제공하는 단계;
    를 더 포함하는 것을 특징으로 하는 온톨로지 매칭의 시멘틱 이질성 병렬 처리 방법.
  10. 삭제
KR1020130122839A 2013-10-15 2013-10-15 온톨로지 매칭의 시멘틱 이질성 병렬 처리 장치 및 처리 방법 KR101542605B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130122839A KR101542605B1 (ko) 2013-10-15 2013-10-15 온톨로지 매칭의 시멘틱 이질성 병렬 처리 장치 및 처리 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130122839A KR101542605B1 (ko) 2013-10-15 2013-10-15 온톨로지 매칭의 시멘틱 이질성 병렬 처리 장치 및 처리 방법

Publications (2)

Publication Number Publication Date
KR20150043870A KR20150043870A (ko) 2015-04-23
KR101542605B1 true KR101542605B1 (ko) 2015-08-06

Family

ID=53036283

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130122839A KR101542605B1 (ko) 2013-10-15 2013-10-15 온톨로지 매칭의 시멘틱 이질성 병렬 처리 장치 및 처리 방법

Country Status (1)

Country Link
KR (1) KR101542605B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536796B (zh) * 2018-04-02 2021-10-01 北京大学 一种基于图的异构本体匹配方法及系统

Also Published As

Publication number Publication date
KR20150043870A (ko) 2015-04-23

Similar Documents

Publication Publication Date Title
US11711420B2 (en) Automated management of resource attributes across network-based services
US10635664B2 (en) Map-reduce job virtualization
US20190377604A1 (en) Scalable function as a service platform
US11429442B2 (en) Parallel and distributed computing using multiple virtual machines
US11275622B2 (en) Utilizing accelerators to accelerate data analytic workloads in disaggregated systems
CN113243005A (zh) 按需网络代码执行系统中的基于性能的硬件仿真
US9350682B1 (en) Compute instance migrations across availability zones of a provider network
US20170024251A1 (en) Scheduling method and apparatus for distributed computing system
US20210389970A1 (en) Vnf lifecycle management method and apparatus
CN106817432B (zh) 云计算环境下虚拟资源弹性伸展的方法,系统和设备
WO2013114228A1 (en) Processing element management in a streaming data system
US9110695B1 (en) Request queues for interactive clients in a shared file system of a parallel computing system
KR101656360B1 (ko) 자동 분산병렬 처리 하둡 시스템을 지원하는 클라우드 시스템
CN109117252B (zh) 基于容器的任务处理的方法、系统及容器集群管理系统
KR20160087706A (ko) 가상화 플랫폼을 고려한 분산 데이터 처리 시스템의 자원 할당 장치 및 할당 방법
CN110166507B (zh) 多资源调度方法和装置
US9092272B2 (en) Preparing parallel tasks to use a synchronization register
WO2022111313A1 (zh) 一种请求处理方法及微服务系统
WO2018045541A1 (zh) 一种容器分配的优化方法及处理设备
US10944814B1 (en) Independent resource scheduling for distributed data processing programs
US10572313B2 (en) Container-based distributed application management system and method
KR101765725B1 (ko) 대용량 방송용 빅데이터 분산 병렬처리를 위한 동적 디바이스 연결 시스템 및 방법
US8458702B1 (en) Method for implementing user space up-calls on java virtual machine before/after garbage collection
WO2020057438A1 (zh) 云计算服务中的软件调试的方法和装置
US10579419B2 (en) Data analysis in storage system

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
FPAY Annual fee payment

Payment date: 20180508

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20190624

Year of fee payment: 5