KR102158120B1 - System for estimating entity dynamics in linked data cloud using poisson process and self-organizing maps - Google Patents
System for estimating entity dynamics in linked data cloud using poisson process and self-organizing maps Download PDFInfo
- Publication number
- KR102158120B1 KR102158120B1 KR1020190002617A KR20190002617A KR102158120B1 KR 102158120 B1 KR102158120 B1 KR 102158120B1 KR 1020190002617 A KR1020190002617 A KR 1020190002617A KR 20190002617 A KR20190002617 A KR 20190002617A KR 102158120 B1 KR102158120 B1 KR 102158120B1
- Authority
- KR
- South Korea
- Prior art keywords
- dynamics
- entity
- data
- cloud
- linked
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
본 발명은 링크된 데이터 클라우드(Linked data cloud)에서의 데이터 변화, 특히 변화 추정 및 자기 조직화 맵(self-organizing maps, SOM)에 대한 푸아송 프로세스를 고차원 데이터의 시각적 변화로 평가하기 위한 시맨틱 빅 데이터, 확률 및 기계 학습 모델의 분야에 관한 것으로서, 일실시예에 따른 연결된 데이터 클라우드에서 엔티티 역학 예측 방법은 푸아송 분포(Poisson distribution)를 기반으로 하는 변화 추정 모델(A change estimation model)을 생성하는 단계, 상기 생성된 변화 추정 모델을 이용하여 연결된 데이터 클라우드(Linked Data Cloud)의 엔티티별 역학을 측정하는 단계, 및 상기 측정된 엔티티별 역학을 고려하여 상기 연결된 데이터 클라우드(Linked Data Cloud)에 기록된 데이터 사본의 업데이트에 대한 우선순위를 결정하는 단계를 포함할 수 있다.The present invention is a semantic big data for evaluating data changes in a linked data cloud, particularly a Poisson process for change estimation and self-organizing maps (SOM) as a visual change of high-dimensional data. , Probability and machine learning models, wherein the method for predicting entity dynamics in a connected data cloud according to an embodiment comprises: generating an A change estimation model based on a Poisson distribution , Measuring the dynamics for each entity of a linked data cloud using the generated change estimation model, and data recorded in the linked data cloud in consideration of the measured dynamics for each entity. It may include determining a priority for updating the copy.
Description
본 발명은 링크된 데이터 클라우드(Linked data cloud)에서의 데이터 변화, 특히 변화 추정 및 자기 조직화 맵(self-organizing maps, SOM)에 대한 푸아송 프로세스를 고차원 데이터의 시각적 변화로 평가하기 위한 시맨틱 빅 데이터, 확률 및 기계 학습 모델의 분야에 관한 것이다.The present invention is a semantic big data for evaluating data changes in a linked data cloud, particularly a Poisson process for change estimation and self-organizing maps (SOM) as a visual change of high-dimensional data. , Probability and machine learning models.
Linked Open Data(LOD)는 구조적으로 표현하고 데이터를 연결하는 글로벌 정보 공간이다.Linked Open Data (LOD) is a global information space that structurally represents and connects data.
Linked Open Data(LOD)를 기반으로 하는 Linked Open Data(LOD) 클라우드는 LOD 규칙에 따라 데이터를 유연하게 통합할 수 있는 방법을 제공한다.Linked Open Data (LOD) cloud based on Linked Open Data (LOD) provides a flexible way to integrate data according to LOD rules.
Linked Open Data(LOD)가 눈에 띄게 성장했음에도 불구하고 새로운 콘텐츠들이 추가되거나 제거 됐다.Even though Linked Open Data (LOD) has grown remarkably, new content has been added or removed.
Linked Open Data(LOD)의 변경 동작은 데이터 캐싱, 웹 증분 크롤러 및 Linked Data Engineer에 대한 적절한 어휘 추천과 같은 응용 프로그램에서 매우 중요하다.The change behavior of Linked Open Data (LOD) is very important in applications such as data caching, web incremental crawlers, and appropriate vocabulary recommendations for Linked Data Engineer.
그러나 스케줄링 전략에 따라 해결해야 할 몇 가지 중요한 과제가 있다.However, depending on the scheduling strategy, there are some important challenges to be solved.
첫 번째 과제는 인덱스 모델의 민감도(sensitivity of the index model)이다.The first task is the sensitivity of the index model.
업데이트된 정보로 인해 색인 및 캐시가 정확하지 않을 수 있으므로 LOD(Linked Open Data) 원본에 대한 변경 내용이 로컬 복사본에 자동으로 전파되지 않는다.Changes to the Linked Open Data (LOD) source are not automatically propagated to the local copy because the index and cache may be inaccurate due to updated information.
한편, 통신 오버 헤드를 피하기 위해서 응용 프로그램의 대부분은 로컬 복사본을 사용하므로 응용 프로그램은 로컬 복사본을 원본 데이터와 동기화해야 한다.On the other hand, in order to avoid communication overhead, most applications use local copies, so applications must synchronize their local copies with the original data.
인덱스 모델은 네트워크 대역폭과 같은 다른 리소스에도 의존하기 때문에 업데이트 작업을 할 때 더 높은 정확도를 얻으려면 더 많은 대역폭이 필요하다.Because the index model also relies on other resources such as network bandwidth, more bandwidth is required to obtain higher accuracy when performing updates.
두 번째 과제는 불완전한 변경의 기록이다. 즉, 많은 시나리오에서 요소가 변경되면 완전한 정보가 제공되지 않는 문제와 관련된다.The second task is the record of incomplete changes. In other words, it is related to the problem of not providing complete information when an element changes in many scenarios.
LOD(Linked Open Data) 소스들의 많은 부분에서 자동으로 전파되지 않는 대신에, 스케쥴링 전략은 변경 사항을 식별해야만 한다.Rather than being automatically propagated across many of the linked open data (LOD) sources, the scheduling strategy must identify the changes.
Linked Open Data(LOD)가 변경될 때 업데이트를 감지하는데 도움이 되는 많은 품질 측정에 대한 기술이 제안되고 있다.Many quality measurement techniques have been proposed that help to detect updates when Linked Open Data (LOD) changes.
세 번째 과제에 따르면, 스케쥴링 전략이 소스 가용성(source availability)을 인식하지 못하는 문제와 관련된다.According to the third task, it is related to the problem that the scheduling strategy is not aware of the source availability.
Linked Open Data(LOD) 업데이트 전략 중 상당수는 소스의 가용성을 인식하지 못한다. 한편, 끊어진 링크(broken link)는 Linked Open Data(LOD)를 사용하는데 있어서 주요 과제 중 하나이다.Many of the linked open data (LOD) update strategies are unaware of the availability of the source. On the other hand, a broken link is one of the major challenges in using Linked Open Data (LOD).
따라서 업데이트 전략은 끊어진 링크 문제를 인식하지 못한다.Therefore, the update strategy is not aware of the broken link problem.
리소스는 종종 이동, 제거 또는 업데이트되므로 끊어진 링크(broken link) 문제와 리소스를 사용할 수 없다. Linked Open Data(LOD)를 사용하는데 있어서 주요 문제 중 하나이므로, Linked Open Data(LOD)에서 링크가 중요한 역할을 할 수 있다.Resources are often moved, removed, or updated, so broken link issues and resources are unavailable. Linked Open Data (LOD) can play an important role because it is one of the major problems in using Linked Open Data (LOD).
확인된 솔루션 전략은 HTTP 메타 데이터 모니터링 전략으로서, 이 접근 방식에서 변경 감지는 HTTP 메타 데이터 모니터링을 사용할 수 있다.The identified solution strategy is an HTTP metadata monitoring strategy, in which change detection can use HTTP metadata monitoring.
여기서 HTTP 응답 헤더는 datestamp 및 ETag를 포함하여 시간이 지났거나 시간이 변경되었는지 여부를 감지할 수 있다.Here, the HTTP response header includes datestamp and ETag to detect whether the time has passed or the time has changed.
변화를 예측하기 위한 또 다른 솔루션 전략은 전체 내용을 가져 와서 무언가가 변경되었는지를 지역적으로 결정하는 Dynamic Linked Data Observatory(DYLDO) 이다.Another solution strategy for predicting change is Dynamic Linked Data Observatory (DYLDO), which takes the entire content and determines locally whether something has changed.
매주 고정 크기의 문서를 크롤링하여 링크된 문서를 찾고 해당 구현은 Linked Data 용 다중 스레드 크롤링 프레임 워크인 Opensource java 프로젝트 LDSpider를 기반으로 한다.It crawls fixed-sized documents every week to find linked documents, and its implementation is based on the Opensource java project LDSpider, a multithreaded crawling framework for Linked Data.
알림으로는, DSNotify와 같은 데이터 집합 업데이트 알림에 사용할 수 있는 몇 가지 도구가 있다.As for notifications, there are several tools you can use to notify data set updates, such as DSNotify.
DSNotify는 휴먼 및 머신 행위자가 끊어진 링크를 수정하도록 지원할 수 있는 일반적인 프레임 워크로서, 인스턴스 일치 문제를 식별하기 위해 시간 차단 기술을 사용한다.DSNotify is a generic framework that can assist human and machine actors to fix broken links, and uses time blocking techniques to identify instance matching problems.
대부분의 알림 전략은 데이터 소스를 모니터링 하는 인덱싱 인프라를 기반으로 하는 반면, 기존 솔루션 전략은 LOD(Linked Open Data) 클라우드의 확장성과 역학에 대처할 수 없다.While most notification strategies are based on an indexing infrastructure that monitors data sources, existing solution strategies cannot cope with the scalability and dynamics of a linked open data (LOD) cloud.
본 발명은 확률 기반 모델을 기반으로 소스 가용성을 예측하고 로컬 복사본을 보다 효과적인 방식으로 업데이트하는 것을 목적으로 한다.An object of the present invention is to predict source availability based on a probability-based model and to update the local copy in a more effective manner.
본 발명은 웹 크롤러, 데이터 캐싱 응용 프로그램, 큰 그래프 데이터베이스 검색 및 건강 관리에서의 답변 응답 질문에 도움을 제공하는데 목적이 있다.It is an object of the present invention to provide assistance in answering and answering questions in web crawlers, data caching applications, large graph database searches, and health care.
본 발명은 연결된 데이터 클라우드(Linked Data Cloud)의 엔티티 역학을 측정하기 위해 푸아송 분포를 기반으로 하는 변경 추정 모델을 제안하는데 목적이 있다.An object of the present invention is to propose a change estimation model based on a Poisson distribution in order to measure the dynamics of an entity in a linked data cloud.
본 발명은 LOD(Linked Open Data) 클라우드의 동적 특성을 측정하기 위해 SOM(self-organizing map)은 일정 기간 동안의 변화를 시각화하는데 목적이 있다.In order to measure the dynamic characteristics of a linked open data (LOD) cloud, an object of the present invention is to visualize changes over a certain period of time in a self-organizing map (SOM).
본 발명은 LOD(Linked Data Cloud)의 확장성 문제와 역학 관계를 다루는 것을 목적으로 한다.An object of the present invention is to deal with the scalability problem and dynamics of a linked data cloud (LOD).
일실시예에 따른 연결된 데이터 클라우드에서 엔티티 역학 예측 방법은 푸아송 분포(Poisson distribution)를 기반으로 하는 변화 추정 모델(A change estimation model)을 생성하는 단계, 상기 생성된 변화 추정 모델을 이용하여 연결된 데이터 클라우드(Linked Data Cloud)의 엔티티별 역학을 측정하는 단계, 및 상기 측정된 엔티티별 역학을 고려하여 상기 연결된 데이터 클라우드(Linked Data Cloud)에 기록된 데이터 사본의 업데이트에 대한 우선순위를 결정하는 단계를 포함할 수 있다.The method for predicting entity dynamics in a connected data cloud according to an embodiment includes the steps of generating a change estimation model based on a Poisson distribution, and data connected using the generated change estimation model. Measuring the dynamics for each entity in the cloud (Linked Data Cloud), and determining a priority for updating the copy of data recorded in the linked data cloud in consideration of the measured dynamics for each entity. Can include.
일실시예에 따른 상기 엔티티별 역학을 측정하는 단계는, 상기 엔티티별 SOM(self-organizing map)를 통해 일정 기간 동안의 변화를 시각화하고, 상기 시각화 결과에 기초하여 상기 엔티티별 역학을 측정하는 단계를 포함할 수 있다.The step of measuring the dynamics for each entity according to an embodiment includes: visualizing changes over a certain period of time through the self-organizing map (SOM) for each entity, and measuring the dynamics for each entity based on the visualization result. It may include.
일실시예에 따른 상기 엔티티별 역학을 측정하는 단계는 푸아송 분포 모델(Poisson distribution model)을 사용하여 엔티티별 변화 추정치를 계산하되, 데이터 항목의 과거 변경 내역을 기반으로 상기 변화 추정치를 계산하는 단계를 포함하고, 상기 우선순위를 결정하는 단계는, 상기 과거 변경 내역을 기반으로 상기 데이터 사본의 업데이트 시기를 예측하는 단계를 포함할 수 있다.In the measuring the dynamics for each entity according to an embodiment, a change estimate for each entity is calculated using a Poisson distribution model, and the change estimate is calculated based on past changes in data items. Including, and determining the priority may include predicting an update timing of the data copy based on the past change details.
일실시예에 따른 상기 데이터 사본의 업데이트에 대한 우선순위를 결정하는 단계는, 상기 변화 추정치에 기초하여, 상기 엔티티별 변경되는 빈도를 추정하는 단계, 및 상기 추정된 빈도에 기초하여 다음 소스를 예약 할 시기를 결정하는 단계, 및 상기 예약 할 시기에 기초하여 상기 데이터 사본의 업데이트에 대한 우선순위를 결정하는 단계를 포함할 수 있다.Determining a priority for updating the data copy according to an embodiment includes: estimating a frequency of change for each entity based on the change estimate, and reserving a next source based on the estimated frequency Determining when to do so, and determining a priority for updating the data copy based on when to reserve.
일실시예에 따른 상기 데이터 사본의 업데이트에 대한 우선순위를 결정하는 단계는, 상기 측정된 엔티티별 역학에 기초하여, LOD (Linked Open Data) 클라우드의 항목 수가 각 스냅 샷에서 변경되는 횟수를 계산하는 단계, 및 상기 계산된 횟수에 기초하여 업데이트 할 데이터 사본의 우선순위를 결정하는 단계를 포함할 수 있다.The step of determining the priority for the update of the data copy according to an embodiment comprises calculating the number of times the number of items in the linked open data (LOD) cloud is changed in each snapshot based on the measured dynamics for each entity. And determining a priority of data copies to be updated based on the calculated number of times.
일실시예에 따른 상기 엔티티별 역학을 측정하는 단계는 데이터의 증감에 따라 LOD(linked open data)의 역학을 발생시키는 시맨틱 드리프트(semantic drift)를 측정하는 단계, 및 상기 측정된 시맨틱 드리프트(semantic drift)에 기초하여 LOD(Linked Open Data) 클라우드에서 발생하는 변경을 예측하는 단계를 포함할 수 있다.The measuring the dynamics for each entity according to an embodiment includes measuring a semantic drift that generates dynamics of linked open data (LOD) according to an increase or decrease of data, and the measured semantic drift. ) On the basis of a linked open data (LOD) cloud.
일실시예에 따른 엔티티의 역학을 예측하는 시스템은 푸아송 분포(Poisson distribution)를 기반으로 하는 변화 추정 모델(A change estimation model)을 생성하는 변화 추정 모델 생성부, 상기 생성된 변화 추정 모델을 이용하여 연결된 데이터 클라우드(Linked Data Cloud)의 엔티티별 역학을 측정하는 역학 측정부, 및 상기 측정된 엔티티별 역학을 고려하여 상기 연결된 데이터 클라우드(Linked Data Cloud)에 기록된 데이터 사본의 업데이트에 대한 우선순위를 결정하는 스케쥴러를 포함할 수 있다.The system for predicting the dynamics of an entity according to an embodiment uses a change estimation model generator that generates an A change estimation model based on a Poisson distribution, and uses the generated change estimation model. A dynamics measuring unit that measures the dynamics of each entity in the linked data cloud, and prioritization for updating the copy of data recorded in the linked data cloud in consideration of the measured dynamics of each entity. It may include a scheduler to determine.
일실시예에 따른 상기 역학 측정부는, 상기 엔티티별 SOM(self-organizing map)를 통해 일정 기간 동안의 변화를 시각화하고, 상기 시각화 결과에 기초하여 상기 엔티티별 역학을 측정할 수 있다.The dynamics measuring unit according to an embodiment may visualize a change over a certain period of time through the self-organizing map (SOM) for each entity, and measure the dynamics for each entity based on the visualization result.
일실시예에 따른 상기 역학 측정부는, 푸아송 분포 모델(Poisson distribution model)을 사용하여 엔티티별 변화 추정치를 계산하되, 데이터 항목의 과거 변경 내역을 기반으로 상기 변화 추정치를 계산하고, 상기 스케쥴러는 상기 과거 변경 내역을 기반으로 상기 데이터 사본의 업데이트 시기를 예측할 수 있다.The dynamics measurement unit according to an embodiment calculates a change estimate for each entity using a Poisson distribution model, calculates the change estimate based on past changes of data items, and the scheduler The update timing of the data copy can be predicted based on past changes.
일실시예에 따른 상기 스케쥴러는, 상기 변화 추정치에 기초하여, 상기 엔티티별 변경되는 빈도를 추정하고, 상기 추정된 빈도에 기초하여 다음 소스를 예약 할 시기를 결정하고, 상기 예약 할 시기에 기초하여 상기 데이터 사본의 업데이트에 대한 우선순위를 결정할 수 있다.The scheduler according to an embodiment estimates a frequency of change for each entity based on the change estimate, determines when to reserve a next source based on the estimated frequency, and based on the reservation time Priority for updating of the data copy can be determined.
일실시예에 따른 상기 스케쥴러는, 상기 측정된 엔티티별 역학에 기초하여, LOD(Linked Open Data) 클라우드의 항목 수가 각 스냅 샷에서 변경되는 횟수를 계산하고, 상기 계산된 횟수에 기초하여 업데이트 할 데이터 사본의 우선순위를 결정할 수 있다.The scheduler according to an embodiment calculates the number of times the number of items in the linked open data (LOD) cloud is changed in each snapshot based on the measured dynamics of each entity, and the data to be updated based on the calculated number of times You can prioritize your copies.
일실시예에 따른 상기 역학 측정부는, 데이터의 증감에 따라 LOD(linked open data)의 역학을 발생시키는 시맨틱 드리프트(semantic drift)를 측정하고, 상기 측정된 시맨틱 드리프트(semantic drift)에 기초하여 LOD(Linked Open Data) 클라우드에서 발생하는 변경을 예측할 수 있다.The dynamics measuring unit according to an embodiment measures a semantic drift that generates dynamics of linked open data (LOD) according to an increase or decreases in data, and based on the measured semantic drift, the LOD ( Linked Open Data) Can predict changes occurring in the cloud.
일실시예에 따르면 확률 기반 모델을 기반으로 소스 가용성을 예측하고 로컬 복사본을 보다 효과적인 방식으로 업데이트할 수 있다.According to an embodiment, source availability may be predicted based on a probability-based model and local copies may be updated in a more effective manner.
일실시예에 따르면 웹 크롤러, 데이터 캐싱 응용 프로그램, 큰 그래프 데이터베이스 검색 및 건강 관리에서의 답변 응답 질문에 도움을 제공할 수 있다.According to an embodiment, it may provide assistance with web crawlers, data caching applications, large graph database searches, and answer-response questions in health care.
일실시예에 따르면 연결된 데이터 클라우드(Linked Data Cloud)의 엔티티 역학을 측정하기 위해 푸아송 분포를 기반으로 하는 변경 추정 모델을 제안할 수 있다.According to an embodiment, a change estimation model based on a Poisson distribution may be proposed in order to measure the dynamics of an entity in a linked data cloud.
일실시예에 따르면 LOD(Linked Open Data) 클라우드의 동적 특성을 측정하기 위해 SOM(self-organizing map)은 일정 기간 동안의 변화를 시각화할 수 있다.According to an embodiment, in order to measure the dynamic characteristics of a linked open data (LOD) cloud, a self-organizing map (SOM) may visualize changes over a certain period of time.
일실시예에 따르면 LOD(Linked Data Cloud)의 확장성 문제와 역학 관계를 다룰 수 있다.According to an embodiment, it is possible to deal with the scalability problem and dynamics of a linked data cloud (LOD).
도 1은 LOD(linked open data) 소스의 변경을 추정하기 위해 제안된 접근법을 보여주는 도면이다.
도 2는 일실시예에 따른 엔티티 역학 예측 방법을 설명하는 도면이다.
도 3 및 4는 일실시예에 따른 엔티티별 역학 측정 방법을 설명하는 도면이다.
도 5 및 6은 일실시예에 따른 데이터 사본의 업데이트에 대한 우선순위를 결정하는 도면이다.
도 7은 일실시예에 따른 엔티티 역학 예측 시스템을 설명하는 도면이다.1 is a diagram showing a proposed approach for estimating a change in a linked open data (LOD) source.
2 is a diagram illustrating a method of predicting entity dynamics according to an embodiment.
3 and 4 are diagrams illustrating a method of measuring dynamics for each entity according to an embodiment.
5 and 6 are diagrams for determining priorities for updating data copies according to an exemplary embodiment.
7 is a diagram illustrating an entity dynamics prediction system according to an embodiment.
본 명세서에 개시되어 있는 본 발명의 개념에 따른 실시예들에 대해서 특정한 구조적 또는 기능적 설명들은 단지 본 발명의 개념에 따른 실시예들을 설명하기 위한 목적으로 예시된 것으로서, 본 발명의 개념에 따른 실시예들은 다양한 형태로 실시될 수 있으며 본 명세서에 설명된 실시예들에 한정되지 않는다.Specific structural or functional descriptions of the embodiments according to the concept of the present invention disclosed in this specification are exemplified only for the purpose of describing the embodiments according to the concept of the present invention, and embodiments according to the concept of the present invention They may be implemented in various forms and are not limited to the embodiments described herein.
본 발명의 개념에 따른 실시예들은 다양한 변경들을 가할 수 있고 여러 가지 형태들을 가질 수 있으므로 실시예들을 도면에 예시하고 본 명세서에 상세하게 설명하고자 한다. 그러나, 이는 본 발명의 개념에 따른 실시예들을 특정한 개시형태들에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 변경, 균등물, 또는 대체물을 포함한다.Since the embodiments according to the concept of the present invention can apply various changes and have various forms, the embodiments will be illustrated in the drawings and described in detail herein. However, this is not intended to limit the embodiments according to the concept of the present invention to specific disclosed forms, and includes changes, equivalents, or substitutes included in the spirit and scope of the present invention.
제1 또는 제2 등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만, 예를 들어 본 발명의 개념에 따른 권리 범위로부터 이탈되지 않은 채, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.Terms such as first or second may be used to describe various elements, but the elements should not be limited by the terms. The above terms are only for the purpose of distinguishing one component from other components, for example, without departing from the scope of rights according to the concept of the present invention, the first component may be named as the second component, Similarly, the second component may also be referred to as a first component.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 구성요소들 간의 관계를 설명하는 표현들, 예를 들어 "~사이에"와 "바로~사이에" 또는 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.When a component is referred to as being "connected" or "connected" to another component, it is understood that it may be directly connected or connected to the other component, but other components may exist in the middle. Should be. On the other hand, when a component is referred to as being "directly connected" or "directly connected" to another component, it should be understood that there is no other component in the middle. Expressions describing the relationship between components, for example, "between" and "just between" or "directly adjacent to" should be interpreted as well.
본 명세서에서 사용한 용어는 단지 특정한 실시예들을 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함으로 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terms used in the present specification are only used to describe specific embodiments and are not intended to limit the present invention. Singular expressions include plural expressions unless the context clearly indicates otherwise. In the present specification, terms such as "comprise" or "have" are intended to designate that the specified features, numbers, steps, actions, components, parts, or combinations thereof exist, but one or more other features or numbers, It is to be understood that the presence or addition of steps, actions, components, parts or combinations thereof does not preclude the possibility of preliminary exclusion.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless otherwise defined, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by a person of ordinary skill in the art to which the present invention belongs. Terms as defined in a commonly used dictionary should be interpreted as having a meaning consistent with the meaning in the context of the related technology, and should not be interpreted as an ideal or excessively formal meaning unless explicitly defined in this specification. Does not.
이하, 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 그러나, 특허출원의 범위가 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.Hereinafter, embodiments will be described in detail with reference to the accompanying drawings. However, the scope of the patent application is not limited or limited by these embodiments. The same reference numerals in each drawing indicate the same members.
도 1은 LOD(linked open data) 소스의 변경을 추정하기 위해 제안된 접근법을 보여주는 도면이다.1 is a diagram showing a proposed approach for estimating a change in a linked open data (LOD) source.
도 1에서 보는 바와 같이, 연결된 데이터가 계속 발전하고 새로운 소스가 추가되거나 제거될 수 있다. 본 발명에서의 제안된 접근 방식은 데이터의 역학에 대처하고 리소스를 예약할 수 있다.As shown in Fig. 1, connected data continues to evolve and new sources can be added or removed. The proposed approach in the present invention can cope with the dynamics of data and reserve resources.
도 1을 살펴보면, 코어 어드민 인터페이스(100)에는 구성 인터페이스(101, configuration Interface), 연결된 데이터 익스플로러(102, Linked Data Explorer)가 포함된다. 한편, 코어 어드민 인터페이스(100)에 인접하고, 확장된 코어 어드민 인터페이스(111)에는 sparql 인터페이스(112), 연결된 데이터 캐시(113, Linked Data Cache)가 포함된다.Referring to FIG. 1, the
코어 어드민 인터페이스(100)와 확장된 코어 어드민 인터페이스(111)는 접근 제어 룰(110)에 따라 코어 자원(103, core resource) 및 제안된 발명(proposed Methodology, 114)과 공유할 수 있다.The
일례로, 코어 자원(103, core resource)은 자원 웹 서비스(resource Web service, 104)와 임포트/익스포트 웹 서비스(Import/Export Web Service, 105), 엔드포인트 서비스(Endpoint Service, 106), SPARQL 서비스(SPARQL Service, 107), 트리플 스토어(Triple Store, 108), 구성(configuration, 109)를 포함할 수 있다. 또한, 코어 자원(103, core resource)은 데이터베이스(124)로부터 데이터의 입출력이 가능하다.For example, the
한편, 제안된 발명(proposed Methodology, 114)은 다음과 같이 설명될 수 있다.Meanwhile, the proposed methodology (114) can be described as follows.
연결된 데이터 클라우드(linked data cloud)에서 엔티티의 변경 추정은 공개적으로 사용 가능한 데이터를 사용하는 응용 프로그램에 중요하다.Estimating changes to entities in a linked data cloud is important for applications that use publicly available data.
제안된 방법은 웹 크롤러, 데이터 캐싱 응용 프로그램, 큰 그래프 데이터베이스 검색 및 건강 관리에서의 답변 응답 질문에 도움이 된다.The proposed method is helpful for answering questions in web crawlers, data caching applications, large graph database searches, and health care.
본 발명에서는 연결된 데이터 클라우드의 엔티티 역학을 측정하기 위해 푸아송(Poisson) 분포를 기반으로 하는 변경 추정 모델을 생성할 수 있다.In the present invention, a change estimation model based on a Poisson distribution may be generated to measure the entity dynamics of a connected data cloud.
확률에 기반하는 변경 추정 모델은 소스 가용성을 예측하고 로컬 복사본을 보다 효과적인 방식으로 업데이트할 수 있다.Probability-based change estimation models can predict source availability and update local copies in a more efficient manner.
LOD(Linked Open Data) 클라우드의 동적 특성을 측정하기 위해 SOM(self-organizing map)은 일정 기간 동안의 변화를 시각화할 수 있다.To measure the dynamic characteristics of a linked open data (LOD) cloud, a self-organizing map (SOM) can visualize changes over a period of time.
본 발명에서는 연결된 데이터 클라우드의 확장성 문제와 역학 관계를 다룰 수 있다.In the present invention, it is possible to deal with the scalability problem and dynamics of the connected data cloud.
일반적으로 LOD(Linked Open Data) 응용 프로그램은 소스에서 데이터를 프리패치(pre-fetch)하고, 빠른 응답 속도를 위해 캐시에 저장할 수 있다.In general, Linked Open Data (LOD) applications can pre-fetch data from the source and store it in a cache for fast response speed.
그러나 이 과정에서, LOD(Linked Open Data) 클라우드의 데이터는 계속 업데이트되고 캐시에서 유지 관리되는 복사본도 업데이트해야 한다.However, in the process, the data in the linked open data (LOD) cloud is constantly updated, and the cache-maintained copy must also be updated.
한편, 대역폭 및 계산 시간과 같은 제한으로 인해 LOD(Linked Open Data) 응용 프로그램은 업데이트 할 데이터 사본의 우선 순위를 결정해야만 한다.Meanwhile, due to limitations such as bandwidth and computation time, Linked Open Data (LOD) applications must prioritize copies of the data to be updated.
자원 가용성을 최상으로 사용하기 위해서는 데이터를 가져 와서 색인(121)을 갱신하기 위해 좋은 스케줄링 전략(122)이 필요하다.In order to make the best use of resource availability, a
또한, LOD(Linked Open Data) 클라우드에서 이상적인 경우 변경이 발생하면 캐시를 업데이트해야 한다.Also, ideally in the linked open data (LOD) cloud, the cache needs to be updated as changes occur.
본 발명에서는 푸아송 분포 모델(117, Poisson distribution model)을 사용하여 제안된 변화 추 정치(115) 전략은 데이터의 두 가지 스냅 샷에서의 변화를 추정할 수 있다.In the present invention, the proposed
본 발명에서는 데이터 항목의 과거 변경 내역을 기반으로 일정 계획은 LOD (Linked Open Data) 원본의 로컬 복사본을 업데이트 할 시기를 예측해야 한다. 이를 위한 스케줄링 전략은 LOD (Linked Open Data) 소스의 과거 변경 기록을 기반으로 한다.In the present invention, the schedule plan must predict when to update the local copy of the original linked open data (LOD) based on the past change history of the data item. The scheduling strategy for this is based on the history of past changes from Linked Open Data (LOD) sources.
이러한 전략은 항목이 변경되는 빈도를 추정 한 다음 소스를 예약 할 시기를 결정할 수 있다. 예를 들어 항목을 예약하고 네 가지 변경 사항을 감지 한 경우 이전에 관찰 된 항목 기록을 기준으로 소스가 얼마나 자주 변경되었는지 추정 할 수 있다.These strategies can estimate how often items change and then decide when to reserve the source. For example, if you schedule an item and detect four changes, you can estimate how often the source has changed based on the previously observed item history.
본 발명에 따른 ChangeRatio 전략은 LOD(Linked Open Data) 클라우드의 항목 수가 각 스냅 샷에서 변경되는 횟수를 계산할 수 있다.The ChangeRatio strategy according to the present invention can calculate the number of times the number of items in the linked open data (LOD) cloud is changed in each snapshot.
ChangeRatio는 LOD (Linked Open Data)의 변경 횟수를 정의하며 [수학식 1]과 같이 표시될 수 있다.ChangeRatio defines the number of changes to the LOD (Linked Open Data), and can be expressed as [Equation 1].
[수학식 1][Equation 1]
[수학식 1]에서 함수는 아이템 oi의 값이 변경되었을 때 값이 1이고 변경되지 않았을 때 값이 0 인 아이템에서 변경이 발생했음을 나타낸다.In [Equation 1], the function indicates that a change has occurred in an item whose value is 1 when the value of item oi is changed, and has a value of 0 when it is not changed.
[수학식 1]에 의해서 산출되는, ChangeRatio는 항목의 변경 내역을 LOD(Linked Open Data)에 저장하는 데 유용하다.The ChangeRatio, calculated by [Equation 1], is useful for storing the change history of an item in Linked Open Data (LOD).
한편, LOD(Linked Open Data) 소스는 두 스냅 샷 간의 변경 사항을 찾는 대신 자주 변경되므로 일정 기간 동안 동적 특성을 찾는 것이 좋다.On the other hand, Linked Open Data (LOD) sources change frequently instead of looking for changes between two snapshots, so it's good to look for dynamic characteristics over a period of time.
본 발명에서는 역학에 기반한 스케줄링 전략의 변화를 계량화하고 LOD(Linked Open Data) 클라우드의 다이나믹스를 측정할 수 있다.In the present invention, it is possible to quantify a change in a scheduling strategy based on dynamics and measure the dynamics of a linked open data (LOD) cloud.
Linked Open Data (LOD)의 역학(The dynamics, 118)은 위 [수학식 1]에서 언급된 것처럼 표현 될 수 있다. 이는 Linked Open Data(LOD) 소스의 다른 스냅 샷과 같은 두 데이터 세트 간의 변경을 정량화할 수 있다.The dynamics (118) of Linked Open Data (LOD) can be expressed as mentioned in [Equation 1] above. This can quantify changes between two data sets, such as different snapshots of Linked Open Data (LOD) sources.
역학 함수(The dynamic function)는 시간의 경과에 따른 LOD(Linked Open Data)의 진화를 정량화할 수 있다.The dynamic function can quantify the evolution of linked open data (LOD) over time.
이러한 역학(Dynamics)의 정량화는 다음의 [수학식 2]로 표현될 수 있다.The quantification of these dynamics can be expressed by the following [Equation 2].
[수학식 2][Equation 2]
데이터가 계속 증가하고 새로운 엔티티가 계속 추가되고 제거됨에 따라 LOD(Linked Open Data)의 역학(dynamics)은 데이터의 역학을 발생시키는 시맨틱 드리프트(semantic drift)를 측정할 수 있다.As data continues to grow and new entities are constantly added and removed, the dynamics of Linked Open Data (LOD) can measure the semantic drift that causes the dynamics of the data.
데이터의 규모를 관리하는 것은 다르지만, 본 발명에서는 규모의 문제를 해결하고 효과적인 방식으로 진화하는 데이터의 대규모를 시각화하는 차원을 줄이는 self-organizing maps (SOM)(120)을 제안한다.Although managing the scale of data is different, the present invention proposes self-organizing maps (SOM) 120 that solve the problem of scale and reduce the dimension to visualize the large scale of evolving data in an effective manner.
클라우드에서 크롤링되는 링크 된 데이터는 (Subject, Predicate, Object 및 Context) NQuads(108) 및 데이터 캐싱 애플리케이션(113)이 시간 t의 일정한 간격으로 검색된 형태이다.Linked data crawled in the cloud (Subject, Predicate, Object, and Context) is a form retrieved by
예를 들어, 전체 데이터 세트는 [수학식 3]과 같이 나타낼 수 있다. For example, the entire data set can be expressed as [Equation 3].
[수학식 3][Equation 3]
[수학식 3]에서 시간 t에서 컨텍스트 c에서 데이터 집합에 포함 된 트리플 수를 나타낸다.In [Equation 3], it represents the number of triples included in the data set in the context c at time t.
대부분의 스케줄링 전략에서 데이터 기능을 사용하여 캐시 데이터의 최신 성을 향상시킬 수 있다.Data features can be used in most scheduling strategies to improve the up-to-dateness of cached data.
본 발명에서 제안된 전략은 변경 비율 및 동적 특성과 같은 기능을 사용하여 LOD(Linked Open Data) 클라우드에서 발생하는 변경을 예측한다.The strategy proposed in the present invention predicts changes occurring in a linked open data (LOD) cloud using functions such as change rates and dynamic characteristics.
그러나, 변경이 일어날 때마다 SPARQL endpoint(106)가 업데이트될 수 있다. 따라서 캐시 및 쿼리 결과를 사용하는 장기 실행 응용 프로그램은 쿼리를 정기적으로 다시 제출하여 최신 결과를 보장해야만 한다.However, whenever a change occurs, the
본 발명에서는 새로 고침 쿼리 스케줄링 문제를 해결하고 과부하를 피하는 것이 가능하다.In the present invention, it is possible to solve the refresh query scheduling problem and avoid overload.
도 2는 일실시예에 따른 엔티티 역학 예측 방법을 설명하는 도면이다.2 is a diagram illustrating a method of predicting entity dynamics according to an embodiment.
일실시예에 따른 엔티티 역학 예측 방법은 푸아송 분포(Poisson distribution)를 기반으로 변화 추정 모델(A change estimation model)을 생성할 수 있다(단계 201).The entity dynamics prediction method according to an embodiment may generate an A change estimation model based on a Poisson distribution (step 201).
또한, 일실시예에 따른 엔티티 역학 예측 방법은 변화 추정 모델을 이용하여 연결된 데이터 클라우드(Linked Data Cloud)의 엔티티별 역학을 측정할 수 있다(단계 202).In addition, the entity dynamics prediction method according to an embodiment may measure entity-specific dynamics of a linked data cloud using a change estimation model (step 202).
또한, 일실시예에 따른 엔티티 역학 예측 방법은 연결된 데이터 클라우드(Linked Data Cloud)에 기록된 데이터 사본의 업데이트에 대한 우선순위를 결정할 수 있다(단계 203).In addition, the method for predicting entity dynamics according to an embodiment may determine a priority for updating a copy of data recorded in a linked data cloud (step 203).
도 3 및 4는 일실시예에 따른 엔티티별 역학 측정 방법을 설명하는 도면이다.3 and 4 are diagrams illustrating a method of measuring dynamics for each entity according to an embodiment.
먼저, 도 3을 살펴보면, 일실시예에 따른 엔티티 역학 예측 방법은 엔티티별 역학 측정을 위해 엔티티별 SOM(self-organizing map)를 통해 일정 기간 동안의 변화를 시각화할 수 있다(단계 301).First, referring to FIG. 3, the entity dynamics prediction method according to an embodiment may visualize changes over a certain period of time through a self-organizing map (SOM) for each entity in order to measure the dynamics for each entity (step 301).
또한, 일실시예에 따른 엔티티 역학 예측 방법은 시각화 결과에 기초하여 상기 엔티티별 역학을 측정할 수 있다(단계 302).In addition, the entity dynamics prediction method according to an embodiment may measure the entity-specific dynamics based on a visualization result (step 302).
다음으로, 도 4를 살펴보면, 일실시예에 따른 엔티티 역학 예측 방법은 데이터의 증감에 따라 LOD(linked open data)의 역학을 발생시키는 시맨틱 드리프트(semantic drift)를 측정할 수 있다(단계 401).Next, referring to FIG. 4, the method for predicting entity dynamics according to an embodiment may measure semantic drift that generates dynamics of linked open data (LOD) according to an increase or decrease in data (step 401).
또한, 일실시예에 따른 엔티티 역학 예측 방법은 측정된 시맨틱 드리프트(semantic drift)에 기초하여 LOD(Linked Open Data) 클라우드에서 발생하는 변경을 예측할 수 있다(단계 402).In addition, the entity dynamics prediction method according to an embodiment may predict a change occurring in a linked open data (LOD) cloud based on the measured semantic drift (step 402).
도 5 및 6은 일실시예에 따른 데이터 사본의 업데이트에 대한 우선순위를 결정하는 도면이다.5 and 6 are diagrams for determining priorities for updating data copies according to an exemplary embodiment.
먼저, 도 5에 따르면, 일실시예에 따른 엔티티 역학 예측 방법은 데이터 사본의 업데이트에 대한 우선순위를 결정하기 위해, 상기 엔티티별 변경되는 빈도를 추정할 수 있다(단계 501). First, according to FIG. 5, in the method for predicting entity dynamics according to an embodiment, in order to determine a priority for updating data copies, the frequency of changes for each entity may be estimated (step 501).
또한, 일실시예에 따른 엔티티 역학 예측 방법은 추정된 빈도에 기초하여 다음 소스를 예약 할 시기를 결정하고(단계 502), 연결된 데이터 클라우드(Linked Data Cloud)에 기록된 데이터 사본의 업데이트에 대한 우선순위를 결정할 수 있다(단계 503).In addition, the entity dynamics prediction method according to an embodiment determines when to reserve the next source based on the estimated frequency (step 502), and prioritizes the update of the data copy recorded in the linked data cloud. The ranking can be determined (step 503).
다음으로, 도 6에 따르면, 일실시예에 따른 엔티티 역학 예측 방법은 데이터 사본의 업데이트에 대한 우선순위를 결정하기 위해, LOD(Linked Open Data) 클라우드의 항목 수가 각 스냅 샷에서 변경되는 횟수를 계산할 수 있다(단계 601).Next, according to FIG. 6, the entity dynamics prediction method according to an embodiment calculates the number of times the number of items in the linked open data (LOD) cloud is changed in each snapshot in order to determine the priority for updating the data copy. Yes (step 601).
또한, 일실시예에 따른 엔티티 역학 예측 방법은 계산된 횟수에 기초하여 업데이트 할 데이터 사본의 우선순위를 결정할 수 있다(단계 602).In addition, the entity dynamics prediction method according to an embodiment may determine the priority of the data copy to be updated based on the calculated number of times (step 602).
도 7은 일실시예에 따른 엔티티 역학 예측 시스템(700)을 설명하는 도면이다.7 is a diagram illustrating an entity
일실시예에 따른 엔티티 역학 예측 시스템(700)은 확률 기반 모델을 기반으로 소스 가용성을 예측하고 로컬 복사본을 보다 효과적인 방식으로 업데이트할 수 있다. The entity
이를 위해, 일실시예에 따른 엔티티 역학 예측 시스템(700)은 변화 추정 모델 생성부(710), 역학 측정부(720), 및 스케쥴러(730)를 포함할 수 있다.To this end, the entity
구체적으로, 일실시예에 따른 변화 추정 모델 생성부(710)는 푸아송 분포(Poisson distribution)를 기반으로 하는 변화 추정 모델(A change estimation model)을 생성할 수 있다.Specifically, the change
다음으로, 일실시예에 따른 역학 측정부(720)는 생성된 변화 추정 모델을 이용하여 연결된 데이터 클라우드(Linked Data Cloud)의 엔티티별 역학을 측정할 수 있다.Next, the
일례에 따르면, 역학 측정부(720)는 엔티티별 SOM(self-organizing map)를 통해 일정 기간 동안의 변화를 시각화하고, 상기 시각화 결과에 기초하여 상기 엔티티별 역학을 측정할 수 있다.According to an example, the
마지막으로, 일실시예에 따른 스케쥴러(730)는 측정된 엔티티별 역학을 고려하여 상기 연결된 데이터 클라우드(Linked Data Cloud)에 기록된 데이터 사본의 업데이트에 대한 우선순위를 결정할 수 있다.Finally, the
한편, 역학 측정부(720)는 푸아송 분포 모델(Poisson distribution model)을 사용하여 엔티티별 변화 추정치를 계산하되, 데이터 항목의 과거 변경 내역을 기반으로 상기 변화 추정치를 계산할 수 있다. 이 경우, 스케쥴러(730)는 과거 변경 내역을 기반으로 데이터 사본의 업데이트 시기를 예측할 수 있다.Meanwhile, the
일실시예에 따르면, 역학 측정부(720)는 데이터의 증감에 따라 LOD(linked open data)의 역학을 발생시키는 시맨틱 드리프트(semantic drift)를 측정할 수도 있다. 이 경우, 역학 측정부(720)는 측정된 시맨틱 드리프트(semantic drift)에 기초하여 LOD(Linked Open Data) 클라우드에서 발생하는 변경을 예측할 수 있다.According to an embodiment, the
또한, 일실시예에 따른 스케쥴러(730)는 변화 추정치에 기초하여, 엔티티별 변경되는 빈도를 추정할 수 있다. 이 경우, 스케쥴러(730)는 추정된 빈도에 기초하여 다음 소스를 예약 할 시기를 결정하고, 예약 할 시기에 기초하여 데이터 사본의 업데이트에 대한 우선순위를 결정할 수 있다.In addition, the
뿐만 아니라, 일실시예에 따른 스케쥴러(730)는 측정된 엔티티별 역학에 기초하여, LOD(Linked Open Data) 클라우드의 항목 수가 각 스냅 샷에서 변경되는 횟수를 계산할 수 있다. 이 경우, 스케쥴러(730)는 계산된 횟수에 기초하여 업데이트 할 데이터 사본의 우선순위를 결정할 수 있다.In addition, the
결국 본 발명을 이용하면, 확률 기반 모델을 기반으로 소스 가용성을 예측하고 로컬 복사본을 보다 효과적인 방식으로 업데이트할 수 있다.In the end, using the present invention, it is possible to predict source availability based on a probability-based model and update the local copy in a more effective manner.
뿐만 아니라, 본 발명을 이용하는 경우 웹 크롤러, 데이터 캐싱 응용 프로그램, 큰 그래프 데이터베이스 검색 및 건강 관리에서의 답변 응답 질문에 도움을 제공할 수 있고, 연결된 데이터 클라우드(Linked Data Cloud)의 엔티티 역학을 측정하기 위해 푸아송 분포를 기반으로 하는 변경 추정 모델을 제안할 수 있다.In addition, when the present invention is used, it can provide assistance with web crawlers, data caching applications, large graph database searches, and answer-response questions in health care, and to measure entity dynamics in a linked data cloud. For this, we can propose a change estimation model based on the Poisson distribution.
또한, 본 발명을 이용하는 경우 LOD(Linked Open Data) 클라우드의 동적 특성을 측정하기 위해 SOM(self-organizing map)은 일정 기간 동안의 변화를 시각화할 수 있고, LOD(Linked Data Cloud)의 확장성 문제와 역학 관계를 다룰 수 있다.In addition, when using the present invention, in order to measure the dynamic characteristics of a linked open data (LOD) cloud, a self-organizing map (SOM) can visualize changes over a certain period of time, and scalability problems of a linked data cloud (LOD) And can deal with dynamics.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The apparatus described above may be implemented as a hardware component, a software component, and/or a combination of a hardware component and a software component. For example, the devices and components described in the embodiments include, for example, a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable array (FPA), It can be implemented using one or more general purpose computers or special purpose computers, such as a programmable logic unit (PLU), a microprocessor, or any other device capable of executing and responding to instructions. The processing device may execute an operating system (OS) and one or more software applications executed on the operating system. In addition, the processing device may access, store, manipulate, process, and generate data in response to the execution of software. For the convenience of understanding, although it is sometimes described that one processing device is used, one of ordinary skill in the art, the processing device is a plurality of processing elements and/or a plurality of types of processing elements. It can be seen that it may include. For example, the processing device may include a plurality of processors or one processor and one controller. In addition, other processing configurations are possible, such as a parallel processor.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may include a computer program, code, instructions, or a combination of one or more of these, configuring the processing unit to behave as desired or processed independently or collectively. You can command the device. Software and/or data may be interpreted by a processing device or to provide instructions or data to a processing device, of any type of machine, component, physical device, virtual equipment, computer storage medium or device. , Or may be permanently or temporarily embodyed in a transmitted signal wave. The software may be distributed over networked computer systems and stored or executed in a distributed manner. Software and data may be stored on one or more computer-readable recording media.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, and the like alone or in combination. The program instructions recorded on the medium may be specially designed and configured for the embodiment, or may be known and usable to those skilled in computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floptical disks. -A hardware device specially configured to store and execute program instructions such as magneto-optical media, and ROM, RAM, flash memory, and the like. Examples of the program instructions include not only machine language codes such as those produced by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like. The hardware device described above may be configured to operate as one or more software modules to perform the operation of the embodiment, and vice versa.
이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.As described above, although the embodiments have been described by the limited drawings, various modifications and variations are possible from the above description to those of ordinary skill in the art. For example, the described techniques are performed in a different order from the described method, and/or components such as a system, structure, device, circuit, etc. described are combined or combined in a form different from the described method, or other components Alternatively, even if substituted or substituted by an equivalent, an appropriate result can be achieved.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Therefore, other implementations, other embodiments, and claims and equivalents fall within the scope of the claims to be described later.
Claims (12)
상기 생성된 변화 추정 모델을 이용하여 연결된 데이터 클라우드(Linked Data Cloud)의 엔티티별 역학을 측정하는 단계; 및
상기 측정된 엔티티별 역학을 고려하여 상기 연결된 데이터 클라우드(Linked Data Cloud)에 기록된 데이터 사본의 업데이트에 대한 우선순위를 결정하는 단계를 포함하고,
상기 엔티티별 역학을 측정하는 단계는
푸아송 분포 모델(Poisson distribution model)을 사용하여 엔티티별 변화 추정치를 계산하되, 데이터 항목의 과거 변경 내역을 기반으로 상기 변화 추정치를 계산하는 단계
를 포함하고,
상기 우선순위를 결정하는 단계는,
상기 과거 변경 내역을 기반으로 상기 데이터 사본의 업데이트 시기를 예측하는 단계
를 포함하는 연결된 데이터 클라우드에서 엔티티의 역학을 예측하는 방법.Generating an A change estimation model based on a Poisson distribution;
Measuring the dynamics of each entity of a linked data cloud using the generated change estimation model; And
In consideration of the measured dynamics of each entity, determining a priority for updating a copy of data recorded in the linked data cloud,
The step of measuring the dynamics for each entity
Calculating a change estimate for each entity using a Poisson distribution model, but calculating the change estimate based on past changes in data items
Including,
The step of determining the priority,
Predicting an update timing of the data copy based on the past change details
A method for predicting the dynamics of an entity in a connected data cloud comprising a.
상기 엔티티별 역학을 측정하는 단계는,
상기 엔티티별 SOM(self-organizing map)를 통해 일정 기간 동안의 변화를 시각화하고, 상기 시각화 결과에 기초하여 상기 엔티티별 역학을 측정하는 단계
를 포함하는 연결된 데이터 클라우드에서 엔티티의 역학을 예측하는 방법.The method of claim 1,
The step of measuring the dynamics for each entity,
Visualizing changes over a certain period of time through the self-organizing map (SOM) for each entity, and measuring the dynamics for each entity based on the visualization result
A method for predicting the dynamics of an entity in a connected data cloud comprising a.
상기 데이터 사본의 업데이트에 대한 우선순위를 결정하는 단계는,
상기 변화 추정치에 기초하여, 상기 엔티티별 변경되는 빈도를 추정하는 단계; 및
상기 추정된 빈도에 기초하여 다음 소스를 예약 할 시기를 결정하는 단계; 및
상기 예약 할 시기에 기초하여 상기 데이터 사본의 업데이트에 대한 우선순위를 결정하는 단계
를 포함하는 연결된 데이터 클라우드에서 엔티티의 역학을 예측하는 방법.The method of claim 1,
The step of determining the priority for updating the data copy,
Estimating a frequency of change for each entity based on the change estimate value; And
Determining when to reserve a next source based on the estimated frequency; And
Determining a priority for updating the data copy based on the reservation time
A method for predicting the dynamics of an entity in a connected data cloud comprising a.
상기 생성된 변화 추정 모델을 이용하여 연결된 데이터 클라우드(Linked Data Cloud)의 엔티티별 역학을 측정하는 단계; 및
상기 측정된 엔티티별 역학을 고려하여 상기 연결된 데이터 클라우드(Linked Data Cloud)에 기록된 데이터 사본의 업데이트에 대한 우선순위를 결정하는 단계를 포함하고,
상기 데이터 사본의 업데이트에 대한 우선순위를 결정하는 단계는,
상기 측정된 엔티티별 역학에 기초하여, LOD (Linked Open Data) 클라우드의 항목 수가 각 스냅 샷에서 변경되는 횟수를 계산하는 단계; 및
상기 계산된 횟수에 기초하여 업데이트 할 데이터 사본의 우선순위를 결정하는 단계
를 포함하는 연결된 데이터 클라우드에서 엔티티의 역학을 예측하는 방법.Generating an A change estimation model based on a Poisson distribution;
Measuring the dynamics of each entity of a linked data cloud using the generated change estimation model; And
In consideration of the measured dynamics of each entity, determining a priority for updating a copy of data recorded in the linked data cloud,
The step of determining the priority for updating the data copy,
Calculating the number of times the number of items in the linked open data (LOD) cloud is changed in each snapshot based on the measured dynamics of each entity; And
Determining the priority of data copies to be updated based on the calculated number of times
A method for predicting the dynamics of an entity in a connected data cloud comprising a.
상기 생성된 변화 추정 모델을 이용하여 연결된 데이터 클라우드(Linked Data Cloud)의 엔티티별 역학을 측정하는 단계; 및
상기 측정된 엔티티별 역학을 고려하여 상기 연결된 데이터 클라우드(Linked Data Cloud)에 기록된 데이터 사본의 업데이트에 대한 우선순위를 결정하는 단계를 포함하고,
상기 엔티티별 역학을 측정하는 단계는
데이터의 증감에 따라 LOD(linked open data)의 역학을 발생시키는 시맨틱 드리프트(semantic drift)를 측정하는 단계; 및
상기 측정된 시맨틱 드리프트(semantic drift)에 기초하여 LOD(Linked Open Data) 클라우드에서 발생하는 변경을 예측하는 단계
를 포함하는 연결된 데이터 클라우드에서 엔티티의 역학을 예측하는 방법.Generating an A change estimation model based on a Poisson distribution;
Measuring the dynamics of each entity of a linked data cloud using the generated change estimation model; And
In consideration of the measured dynamics of each entity, determining a priority for updating a copy of data recorded in the linked data cloud,
The step of measuring the dynamics for each entity
Measuring a semantic drift that generates dynamics of linked open data (LOD) according to an increase or decrease in data; And
Predicting a change occurring in a linked open data (LOD) cloud based on the measured semantic drift
A method for predicting the dynamics of an entity in a connected data cloud comprising a.
상기 생성된 변화 추정 모델을 이용하여 연결된 데이터 클라우드(Linked Data Cloud)의 엔티티별 역학을 측정하는 역학 측정부; 및
상기 측정된 엔티티별 역학을 고려하여 상기 연결된 데이터 클라우드(Linked Data Cloud)에 기록된 데이터 사본의 업데이트에 대한 우선순위를 결정하는 스케쥴러를 포함하고,
상기 역학 측정부는,
푸아송 분포 모델(Poisson distribution model)을 사용하여 엔티티별 변화 추정치를 계산하되, 데이터 항목의 과거 변경 내역을 기반으로 상기 변화 추정치를 계산하고,
상기 스케쥴러는,
상기 과거 변경 내역을 기반으로 상기 데이터 사본의 업데이트 시기를 예측하는 것을 특징으로 하는 연결된 데이터 클라우드에서 엔티티의 역학을 예측하는 시스템.A change estimation model generator for generating an A change estimation model based on a Poisson distribution;
A dynamics measuring unit for measuring the dynamics of each entity of a linked data cloud using the generated change estimation model; And
And a scheduler that determines a priority for updating a copy of data recorded in the linked data cloud in consideration of the measured dynamics of each entity,
The dynamic measurement unit,
Calculate the change estimate for each entity using a Poisson distribution model, but calculate the change estimate based on the past change history of the data item,
The scheduler,
A system for predicting the dynamics of an entity in a connected data cloud, characterized in that predicting an update timing of the data copy based on the past change history.
상기 역학 측정부는,
상기 엔티티별 SOM(self-organizing map)를 통해 일정 기간 동안의 변화를 시각화하고, 상기 시각화 결과에 기초하여 상기 엔티티별 역학을 측정하는 것을 특징으로 하는 연결된 데이터 클라우드에서 엔티티의 역학을 예측하는 시스템.The method of claim 7,
The dynamic measurement unit,
A system for predicting the dynamics of an entity in a connected data cloud, characterized in that for visualizing changes over a certain period of time through the self-organizing map (SOM) for each entity, and measuring the dynamics for each entity based on the visualization result.
상기 스케쥴러는,
상기 변화 추정치에 기초하여, 상기 엔티티별 변경되는 빈도를 추정하고, 상기 추정된 빈도에 기초하여 다음 소스를 예약 할 시기를 결정하고, 상기 예약 할 시기에 기초하여 상기 데이터 사본의 업데이트에 대한 우선순위를 결정하는 것을 특징으로 하는 연결된 데이터 클라우드에서 엔티티의 역학을 예측하는 시스템.The method of claim 7,
The scheduler,
Based on the change estimate, estimate the frequency of change for each entity, determine when to reserve the next source based on the estimated frequency, and prioritize updating of the data copy based on the reservation time A system for predicting the dynamics of an entity in a connected data cloud, characterized in that to determine.
상기 생성된 변화 추정 모델을 이용하여 연결된 데이터 클라우드(Linked Data Cloud)의 엔티티별 역학을 측정하는 역학 측정부; 및
상기 측정된 엔티티별 역학을 고려하여 상기 연결된 데이터 클라우드(Linked Data Cloud)에 기록된 데이터 사본의 업데이트에 대한 우선순위를 결정하는 스케쥴러를 포함하고,
상기 스케쥴러는,
상기 측정된 엔티티별 역학에 기초하여, LOD(Linked Open Data) 클라우드의 항목 수가 각 스냅 샷에서 변경되는 횟수를 계산하고, 상기 계산된 횟수에 기초하여 업데이트 할 데이터 사본의 우선순위를 결정하는 것을 특징으로 하는 연결된 데이터 클라우드에서 엔티티의 역학을 예측하는 시스템.A change estimation model generator for generating an A change estimation model based on a Poisson distribution;
A dynamics measuring unit for measuring the dynamics of each entity of a linked data cloud using the generated change estimation model; And
And a scheduler that determines a priority for updating a copy of data recorded in the linked data cloud in consideration of the measured dynamics of each entity,
The scheduler,
Based on the measured dynamics of each entity, the number of times the number of items in the linked open data (LOD) cloud is changed in each snapshot, and determining the priority of the data copy to be updated based on the calculated number of times. A system that predicts the dynamics of an entity in a connected data cloud.
상기 생성된 변화 추정 모델을 이용하여 연결된 데이터 클라우드(Linked Data Cloud)의 엔티티별 역학을 측정하는 역학 측정부; 및
상기 측정된 엔티티별 역학을 고려하여 상기 연결된 데이터 클라우드(Linked Data Cloud)에 기록된 데이터 사본의 업데이트에 대한 우선순위를 결정하는 스케쥴러를 포함하고,
상기 역학 측정부는, 데이터의 증감에 따라 LOD(linked open data)의 역학을 발생시키는 시맨틱 드리프트(semantic drift)를 측정하고, 상기 측정된 시맨틱 드리프트(semantic drift)에 기초하여 LOD(Linked Open Data) 클라우드에서 발생하는 변경을 예측하는 것을 특징으로 하는 연결된 데이터 클라우드에서 엔티티의 역학을 예측하는 시스템.A change estimation model generator for generating an A change estimation model based on a Poisson distribution;
A dynamics measuring unit for measuring the dynamics of each entity of a linked data cloud using the generated change estimation model; And
And a scheduler that determines a priority for updating a copy of data recorded in the linked data cloud in consideration of the measured dynamics of each entity,
The dynamics measurement unit measures a semantic drift that generates dynamics of linked open data (LOD) according to an increase or decreases in data, and a linked open data (LOD) cloud based on the measured semantic drift. A system for predicting the dynamics of an entity in a connected data cloud, characterized in that predicting changes occurring in
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190002617A KR102158120B1 (en) | 2019-01-09 | 2019-01-09 | System for estimating entity dynamics in linked data cloud using poisson process and self-organizing maps |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190002617A KR102158120B1 (en) | 2019-01-09 | 2019-01-09 | System for estimating entity dynamics in linked data cloud using poisson process and self-organizing maps |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200092474A KR20200092474A (en) | 2020-08-04 |
KR102158120B1 true KR102158120B1 (en) | 2020-09-21 |
Family
ID=72048707
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190002617A KR102158120B1 (en) | 2019-01-09 | 2019-01-09 | System for estimating entity dynamics in linked data cloud using poisson process and self-organizing maps |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102158120B1 (en) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8949654B2 (en) | 2012-01-27 | 2015-02-03 | Empire Technology Development Llc | Parameterized dynamic model for cloud migration |
EP2680512B1 (en) | 2012-06-25 | 2019-07-24 | Alcatel Lucent | Network entity of a communication network |
-
2019
- 2019-01-09 KR KR1020190002617A patent/KR102158120B1/en active IP Right Grant
Non-Patent Citations (3)
Title |
---|
Akhtar, et al. "Evaluating scheduling strategies in LOD based application." 2017 19th Asia-Pacific Network Operations and Management Symposium (APNOMS). IEEE, (2017.09.29. 공개)* |
Umbrich, Jürgen, et al. "Towards dataset dynamics: Change frequency of linked open data sources." (2010.04. 공개)* |
Yue, Shihong, and Jianpei Wang. "Visualization of the electrical tomographic data distributions based on the self organization map neural tool."(2013.07.17. 공개)* |
Also Published As
Publication number | Publication date |
---|---|
KR20200092474A (en) | 2020-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11194809B2 (en) | Predicting performance of database queries | |
US9772934B2 (en) | Pluggable fault detection tests for data pipelines | |
US20230009836A1 (en) | Time series database processing system | |
Yamato | Automatic offloading method of loop statements of software to FPGA | |
EP2963563A1 (en) | Computing apparatus and method for managing a graph database | |
KR102025210B1 (en) | Queue monitoring and visualization | |
US10956214B2 (en) | Time frame bounded execution of computational algorithms | |
US11301348B2 (en) | Computer network with time series seasonality-based performance alerts | |
US20130036222A1 (en) | Inheritable dimensions in a service model | |
Barnawi et al. | On characterizing the performance of distributed graph computation platforms | |
JPWO2013024597A1 (en) | Distributed processing management apparatus and distributed processing management method | |
US11636377B1 (en) | Artificial intelligence system incorporating automatic model updates based on change point detection using time series decomposing and clustering | |
JP2009087190A (en) | Stream data analysis speed-up device, method and program | |
JP5803469B2 (en) | Prediction method and prediction program | |
EP3076289B1 (en) | Method, program, and apparatus, for managing a stored data graph | |
Liu et al. | Stream processing in IoT: Foundations, state-of-the-art, and future directions | |
KR102158120B1 (en) | System for estimating entity dynamics in linked data cloud using poisson process and self-organizing maps | |
Gao et al. | An edge-cloud collaboration architecture for pattern anomaly detection of time series in wireless sensor networks | |
US20230122781A1 (en) | Low-Latency Buffer Storage Of Static Datasets For Query Operation Optimization | |
US20230124100A1 (en) | Low-Latency Data Management And Query Processing Cross-Optimizations | |
US11770295B2 (en) | Platform for establishing computing node clusters in different environments | |
US10255565B2 (en) | Intelligent spatial enterprise analytics | |
Yamato | Study and evaluation of FPGA reconfiguration during service operation for environment-adaptive software | |
US9384069B2 (en) | Method for event processing using hierarchical structures and event processing system thereof | |
Ivanchikj et al. | On the performance overhead of bpmn modeling practices |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |