KR101965277B1 - 하이퍼그래프 데이터 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램 - Google Patents
하이퍼그래프 데이터 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램 Download PDFInfo
- Publication number
- KR101965277B1 KR101965277B1 KR1020180093961A KR20180093961A KR101965277B1 KR 101965277 B1 KR101965277 B1 KR 101965277B1 KR 1020180093961 A KR1020180093961 A KR 1020180093961A KR 20180093961 A KR20180093961 A KR 20180093961A KR 101965277 B1 KR101965277 B1 KR 101965277B1
- Authority
- KR
- South Korea
- Prior art keywords
- hypergraph
- data
- nodes
- hypergraph data
- line graph
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G06F17/277—
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
하이퍼그래프(hypergraph) 데이터 분석 시스템은, 복수 개의 제1 노드(node) 및 상기 제1 노드 사이의 복수 개의 제1 에지(edge)를 포함하는 하이퍼그래프 데이터가 저장된 저장부; 상기 저장부에 저장된 상기 하이퍼그래프 데이터에 대한 연관관계 생성 요청을 수용자로부터 수신하며, 상기 요청에 대한 응답으로, 군집 결과 데이터를 상기 사용자에게 제공하도록 구성된 요청 처리부; 및 상기 요청 처리부로부터 상기 하이퍼그래프 데이터를 수신하고, 상기 하이퍼그래프 데이터를 상기 제1 에지에 상응하는 복수 개의 제2 노드를 포함하는 선 그래프(line graph)로 변환하여 상기 복수 개의 제2 노드를 군집화하고, 상기 복수 개의 제2 노드의 군집 결과를 상기 복수 개의 제1 에지에 대한 상기 군집 결과 데이터로 상기 요청 처리부에 제공하도록 구성된 이벤트 처리부를 포함한다. 상기 하이퍼그래프 데이터 분석 시스템에 의하면, 하이퍼그래프 데이터를 선 그래프로 변환하여 선 그래프의 노드를 기준으로 커뮤티니 검출을 수행함으로써 에지를 대상으로 한 커뮤니티 검출(community detection)을 수행하기에 너무 복잡한 하이퍼그래프에 대해서도 근사적인 에지 커뮤니티 검출을 수행할 수 있는 이점이 있다.
Description
실시예들은 하이퍼그래프(hypergraph) 데이터 분석 시스템 및 방법과 이를 위한 컴퓨터 프로그램에 관한 것으로, 보다 상세하게는 하이퍼그래프 데이터의 에지(edge)에 대한 커뮤니티 검출(community detection)을 수행하는 새로운 알고리즘 기술에 대한 것이다.
빅 데이터 관련 기술들이 활발하게 연구되면서, 빅 데이터를 저장 관리하는 기술 및 데이터를 분류 및 예측하는 기계 학습 분야의 연구가 활발히 진행되고 있다. 패턴 분류 기술은 뉴스, 블로그, SNS 등의 문서 분류, 이슈 분류, 감성 분류 등에 활용되고 있다. 한편, 데이터를 저장 관리하는 기술로서 종래에는 테이블(table) 형태로 데이터를 저장하는 관계형 데이터베이스가 주로 사용되었다.
최근에는, 데이터의 저장 및 관리 기술로서 각 데이터 객체와 이 객체가 가진 연관 관계를 저장하는 솔루션인 그래프 데이터베이스가 등장하였다. 예를 들어, 등록특허공보 제10-1697875호는 그래프 모델에 기반한 문서 분석 기술을 개시한다. 테이블을 사전에 정의한 스키마(schema) 구조 형태에 맞추어 각 객체들을 저장하는 관계형 데이터베이스에 비하여, 그래프 데이터베이스는 각 데이터들을 하나의 객체로서 저장하기 때문에 정형 및 비정형 데이터의 통합적인 저장 관리에 유리하다.
그래프 데이터 모델은 다른 데이터 모델과 달리 데이터의 연결패턴을 기반으로 한 군집화가 가능하기에, 데이터의 군집화 영역에 있어서 다른 데이터 모델과 차별성을 가진다. 또한, 기존의 단입자(monoparticle) 형태에서 나아가, 멀티그래프(multigraph) 또는 하이퍼그래프(hypergraph) 형태의 데이터를 다룰 수 있는 방법론으로의 그래프 데이터 모델의 확장이 많이 연구되고 있다. 이 중 하이퍼그래프는 수학적으로는 복잡하게 연결된 도형과 숫자를 꼭지점(즉, 노드(node))와 선(즉, 에지(edge))으로 단순화시켜 연결한 일반화된 변환 그래프이다.
그래프 데이터의 대표적인 군집화 기술인 커뮤티니 검출(community detection)은 다양한 산업 군에서 보편적으로 사용할 수 있는 분석기반기술로, 군집화 기술에는 단순한 군집화뿐만 아니라 해당 결과에 대한 통계적 유의성 검출 등 군집화 기반으로 파생된 다양한 기법들이 존재한다. 종래의 커뮤니티 검출 기법은 일반적으로 노드를 기준으로 수행되며, 모듈러리티 최적화(modularity optimization), 스토캐스틱 블록 모델(stochastic block model) 등을 통하여 군집화하는 방법이 있다.
도 1은 종래 기술에 따른 노드 기반의 커뮤니티 검출 과정을 나타내는 개념도이다.
종래의 노드 기반의 커뮤니티 검출 기법에서는 도 1의 (a)에 도시된 것과 같은 원본 데이터에서 도 1의 (b)와 같이 구획을 정의하는 파티셔닝(partitioning) 과정을 수행하고, 이를 기반으로 도 1의 (c)에 도시된 군집(100)들을 커뮤니티 검출 결과로 얻을 수 있다. 이는 연결관계의 밀도에 따라 노드 간 연결이 성긴 부분을 파티셔닝하여 군집으로 묶는 것으로 직관적으로 이해될 수 있다.
그러나, 종래와 같이 노드 기준에서 군집화를 수행할 경우 군집의 경계에 있는 노드의 군집 분류가 정확하게 이루어지기 힘든 한계가 있다. 예를 들어, 도 1에 도시된 노드(200)의 경우 군집 간의 경계에 위치하고 있어 특정한 하나의 집단에 할당하는 것이 어려울 수 있다. 이러한 문제를 해결하기 위하여 그래프 데이터의 에지를 기준으로 커뮤니티 검출을 수행하고 각 노드는 해당 노드와 연결된 에지의 군집 분류에 따라 군집화하는 중첩 커뮤니티 검출(overlapping community detection) 방법이 있다.
도 2는 종래 기술에 따른 중첩 커뮤니티 검출 과정을 나타내는 개념도이다.
도 2는 중첩 커뮤니티 검출 중 링크(link) 커뮤니티 검출 과정을 나타내는 것으로서, 링크 커뮤니티 검출 과정에서는 도 2의 (a)에 도시된 원본 데이터를 도 2의 (b)와 같이 파티셔닝하고, 이를 통해 도 2의 (c)에 각 에지의 색상으로 도시되는 것과 같이 에지들을 군집화한다. 이는, 도 1에 도시된, 노드 간 연결이 성긴 부분을 파티셔닝하여 군집으로 묶는 기존의 기법을 단순히 에지를 기반으로 수행하는 것이므로 직관적이지만, 아직까지 이를 위한 수학적 체계가 잘 정립되어 있지 않고, 방법론 또한 표준이 마련되지 않은 문제가 있다.
본 발명의 일 측면에 따르면, 하이퍼그래프(hypergraph) 데이터의 에지(edge)에 대한 커뮤니티 검출(community detection)을 수행함에 있어서 하이퍼그래프 데이터를 선 그래프(line graph)로 변환하여 선 그래프의 노드(node)를 기준으로 커뮤니티 검출을 수행할 수 있는 하이퍼그래프 데이터 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램을 제공할 수 있다.
일 실시예에 따른 하이퍼그래프(hypergraph) 데이터 분석 시스템은, 복수 개의 제1 노드(node) 및 상기 제1 노드 사이의 복수 개의 제1 에지(edge)를 포함하는 하이퍼그래프 데이터가 저장된 저장부; 상기 저장부에 저장된 상기 하이퍼그래프 데이터에 대한 연관관계 생성 요청을 수용자로부터 수신하며, 상기 요청에 대한 응답으로, 군집 결과 데이터를 상기 사용자에게 제공하도록 구성된 요청 처리부; 및 상기 요청 처리부로부터 상기 하이퍼그래프 데이터를 수신하고, 상기 하이퍼그래프 데이터를 상기 제1 에지에 상응하는 복수 개의 제2 노드를 포함하는 선 그래프로 변환하여 상기 복수 개의 제2 노드를 군집화하고, 상기 복수 개의 제2 노드의 군집 결과를 상기 복수 개의 제1 에지에 대한 상기 군집 결과 데이터로 상기 요청 처리부에 제공하도록 구성된 이벤트 처리부를 포함한다.
일 실시예에서, 상기 이벤트 처리부는, 상기 제1 에지에 연결된 상기 제1 노드의 개수를 기반으로 상기 하이퍼그래프 데이터를 상기 선 그래프로 변환하도록 구성된 변환부; 커뮤니티 검출(community detection) 알고리즘을 이용하여 상기 선 그래프의 상기 복수 개의 제2 노드를 군집화하도록 구성된 커뮤니티 검출부; 및 상기 복수 개의 제2 노드의 군집 결과를 상기 복수 개의 제1 에지에 대한 상기 군집 결과 데이터로 변환하도록 구성된 반환부를 포함한다.
일 실시예에서, 상기 반환부는, 상기 군집 결과 데이터를 상기 저장부에 저장하도록 더 구성된다.
일 실시예에서, 상기 변환부는, 상기 하이퍼그래프 데이터의 상기 제1 노드 및 상기 제1 에지 사이의 연결을 정의하는 인접 행렬을 이용하여 상기 하이퍼그래프를 상기 선 그래프로 변환하도록 더 구성된다.
일 실시예에서, 상기 하이퍼그래프 데이터는 상기 복수 개의 제1 에지 각각에 대한 가중치 정보 또는 방향성 정보를 포함한다.
일 실시예에 따른 하이퍼그래프 데이터 분석 방법은, 하이퍼그래프 데이터 분석 시스템에, 복수 개의 제1 노드 및 상기 제1 노드 사이의 복수 개의 제1 에지를 포함하는 하이퍼그래프 데이터를 저장하는 단계; 상기 하이퍼그래프 데이터 분석 시스템이, 상기 하이퍼그래프 데이터에 대한 연관관계 생성 요청을 사용자로부터 수신하는 단계; 상기 하이퍼그래프 데이터 분석 시스템이, 수신된 상기 요청에 대한 응답으로, 상기 하이퍼그래프 데이터를 상기 제1 에지에 상응하는 복수 개의 제2 노드를 포함하는 선 그래프로 변환하는 단계; 상기 하이퍼그래프 데이터 분석 시스템이, 변환된 상기 선 그래프의 상기 복수 개의 제2 노드를 군집화하는 단계; 및 상기 하이퍼그래프 데이터 분석 시스템이, 상기 복수 개의 제2 노드의 군집 결과를 상기 복수 개의 제1 에지에 대한 군집 결과 데이터로 사용자에게 제공하는 단계를 포함한다.
일 실시예에 따른 하이퍼그래프 데이터 분석 방법은, 상기 하이퍼그래프 데이터 분석 시스템에 상기 군집 결과 데이터를 저장하는 단계를 더 포함한다.
일 실시예에서, 상기 선 그래프로 변환하는 단계는, 상기 하이퍼그래프 데이터 분석 시스템이, 상기 하이퍼그래프 데이터의 상기 제1 노드 및 상기 제1 에지 사이의 연결을 정의하는 인접 행렬을 이용하여 상기 하이퍼그래프를 상기 선 그래프로 변환하는 단계를 포함한다.
일 실시예에서, 상기 하이퍼그래프 데이터는 상기 복수 개의 제1 에지 각각에 대한 가중치 정보 또는 방향성 정보를 포함한다.
일 실시예에 따른 컴퓨터 프로그램은 하드웨어와 결합되어 전술한 실시예들에 따른 하이퍼그래프 데이터 분석 방법을 실행하기 위한 것으로서 컴퓨터로 판독 가능한 매체에 저장된 것일 수 있다.
본 발명의 일 측면에 따른 하이퍼그래프(hypergraph) 데이터 분석 시스템 및 방법에 의하면, 하이퍼그래프 데이터를 선 그래프(line graph)로 변환하여 선 그래프의 노드(node)를 기준으로 커뮤니티 검출을 수행함으로써 에지(edge)를 대상으로 한 커뮤니티 검출(community detection)을 수행하기에 너무 복잡한 하이퍼그래프에 대해서도 근사적인 에지 커뮤니티 검출을 수행할 수 있는 이점이 있다.
본 발명의 일 측면에 따른 하이퍼그래프 데이터 분석 시스템 및 방법은, 화학반응 경로, 가상화폐 거래 흐름, 공동 저자 네트워크, 상품 공동구매 네트워크 등 하나의 관계에 의하여 하나의 데이터 객체와 다수의 객체의 연관관계를 허용하여 하이퍼그래프 데이터 형태로 표현되는 데이터들의 군집화에 사용될 수 있다.
또한, 상기 하이퍼그래프 데이터 분석 시스템 및 방법은, 유사 구매패턴을 보이는 고객 군의 군집을 통한 구매패턴 분류나, 전문분야에서 유사 의미로 사용되는 전문용어들의 군집을 통한 유의어 사전 구축 등 비슷한 성격을 가지는 객체 군의 군집이나, 복잡한 생물종의 신진대사 회로망 데이터 등 데이터의 의미구조를 이해하지 못한 데이터의 기능 단위 추론을 위한 군집화 등에 유용하게 사용될 수 있다.
도 1은 종래 기술에 따른 노드(node) 기반의 커뮤니티 검출(community detection) 과정을 나타내는 개념도이다.
도 2는 종래 기술에 따른 중첩(overlapping) 커뮤니티 검출 과정을 나타내는 개념도이다.
도 3은 일 실시예에 따른 하이퍼그래프(hypergraph) 데이터 분석 시스템의 개략적인 블록도이다.
도 4는 하이퍼그래프 데이터를 저장을 위하여 이부 그래프(bipartite graph) 데이터 형태로 변환하는 것을 나타내는 개념도이다.
도 5는 일 실시예에 따른 하이퍼그래프 데이터 분석 시스템의 이벤트 처리부의 개략적인 블록도이다.
도 6은 일 실시예에 따른 하이퍼그래프 데이터 분석 방법의 순서도이다.
도 7은 일 실시예에 따라 하이퍼그래프 데이터를 선 그래프로 전환하여 노드 기반의 커뮤니티 검출을 수행하는 과정의 개념도이다.
도 2는 종래 기술에 따른 중첩(overlapping) 커뮤니티 검출 과정을 나타내는 개념도이다.
도 3은 일 실시예에 따른 하이퍼그래프(hypergraph) 데이터 분석 시스템의 개략적인 블록도이다.
도 4는 하이퍼그래프 데이터를 저장을 위하여 이부 그래프(bipartite graph) 데이터 형태로 변환하는 것을 나타내는 개념도이다.
도 5는 일 실시예에 따른 하이퍼그래프 데이터 분석 시스템의 이벤트 처리부의 개략적인 블록도이다.
도 6은 일 실시예에 따른 하이퍼그래프 데이터 분석 방법의 순서도이다.
도 7은 일 실시예에 따라 하이퍼그래프 데이터를 선 그래프로 전환하여 노드 기반의 커뮤니티 검출을 수행하는 과정의 개념도이다.
이하에서, 도면을 참조하여 본 발명의 실시예들에 대하여 상세히 살펴본다.
도 3은 일 실시예에 따른 하이퍼그래프(hypergraph) 데이터 분석 시스템의 개략적인 블록도이다.
일 실시예에서, 하이퍼그래프 데이터 분석 시스템(10)은 저장부(11), 요청 처리부(12) 및 이벤트(event) 처리부(13)를 포함한다. 일 실시예에서, 저장부(11)는 하이퍼그래프 데이터가 저장되는 데이터베이스(110)를 포함한다.
실시예들에 따른 하이퍼그래프 데이터 분석 시스템(10)은 전적으로 하드웨어이거나, 또는 부분적으로 하드웨어이고 부분적으로 소프트웨어인 측면을 가질 수 있다. 예컨대, 하이퍼그래프 데이터 분석 시스템(10)에 포함된 각 부(unit)는 특정 형식 및 내용의 데이터를 처리하거나 또는/또한 전자통신 방식으로 주고받기 위한 하드웨어 및 이에 관련된 소프트웨어를 통칭할 수 있다. 본 명세서에서 "부", "모듈", "장치", "단말기", "서버" 또는 "시스템" 등의 용어는 하드웨어 및 해당 하드웨어에 의해 구동되는 소프트웨어의 조합을 지칭하는 것으로 의도된다. 예를 들어, 하드웨어는 CPU 또는 다른 프로세서(processor)를 포함하는 데이터 처리 기기일 수 있다. 또한, 하드웨어에 의해 구동되는 소프트웨어는 실행중인 프로세스, 객체(object), 실행파일(executable), 실행 스레드(thread of execution), 프로그램(program) 등을 지칭할 수 있다.
또한, 본 실시예에 따른 하이퍼그래프 데이터 분석 시스템(10)을 구성하는 각각의 요소는 반드시 서로 물리적으로 구분되는 별개의 장치를 지칭하는 것으로 의도되지 않는다. 즉, 도 3의 저장부(11), 요청 처리부(12) 및 이벤트 처리부(13)는 하이퍼그래프 데이터 분석 시스템(10)을 구성하는 하드웨어를 해당 하드웨어에 의해 수행되는 동작에 따라 기능적으로 구분한 것일 뿐, 반드시 각각의 부가 서로 독립적으로 구비되어야 하는 것이 아니다. 물론, 실시예에 따라서는 저장부(11), 요청 처리부(12) 및 이벤트 처리부(13) 중 하나 이상이 서로 물리적으로 구분되는 별개의 장치로 구현되는 것도 가능하다.
저장부(11)는 하이퍼그래프 데이터가 저장되는 데이터베이스(110)를 포함한다. 데이터베이스(110)에 저장된 하이퍼그래프 데이터는, 데이터 객체에 각각 상응하는 복수 개의 노드(node) 및 각 노드 사이를 연결하고 데이터 객체 사이의 연관관계를 나타내는 에지(edge)를 포함하고, 하나의 에지에 복수 개의 노드가 동시에 연결될 수 있는 특성을 갖는다. 각각의 에지는 방향성을 가지는 벡터일 수 있다.
일 실시예에서, 저장부(11)에 저장되는 하이퍼그래프 데이터는 하이퍼그래프 데이터를 데이터베이스(110)에 적재하기 위하여 변환된 이부 그래프(bipartite graph) 데이터 형태를 가질 수도 있다. 도 4는 하이퍼그래프 데이터를 저장을 위하여 이부 그래프 데이터 형태로 변환하는 것을 나타내는 개념도이다.
도 4의 (a)는 [R1: A → B], [R2: A+B → C+D], [R3: D → E]의 관계를 가지는 화학반응을 하이퍼그래프 데이터로 나타낸 것이다. A 내지 E는 화학반응에 참여하는 반응 물질을 나타내고, 하이퍼그래프 데이터의 각 노드에 해당한다. R1 내지 R3는 화학 반응을 나타내고, 하이퍼그래프 데이터의 각 에지에 해당한다. 이때, 하이퍼그래프 데이터는 에지 R2와 같이 복수의 노드에 연결된 하이퍼에지(hyperedge)를 포함한다.
이때, 저장부(11)는 도 4의 (a)의 하이퍼그래프 데이터를 도 4의 (b)에 도시된 것과 같은 이부 그래프로 변환하여 저장할 수 있다. 이부 그래프에서 하이퍼그래프 데이터의 각 에지(R1 내지 R3)는 반응 물질에 해당하는 기존의 노드(A 내지 E)와 상이한 라벨을 가지는 노드로 표현되고, 이부 그래프에서 노드(A 내지 E)와 노드(R1 내지 R3) 사이의 연결에 의해 에지 및 하이퍼에지들이 정의하는 상관관계가 손실 없이 저장될 수 있다.
다시 도 3을 참조하면, 요청 처리부(12)는, 데이터베이스(110)에 저장된 하이퍼그래프 데이터에 대한 자동 연관관계 생성 요청을 사용자 장치로부터 수신한다. 이를 위하여, 요청 처리부(12)는 유선 및/또는 무선 네트워크를 통하여 사용자 장치(미도시)와 통신 가능하게 연결될 수 있다. 일 실시예에서, 요청 처리부(12)는 연관관계를 자동 생성하는 데에 사용되는 임계값을 사용자로부터 수신할 수도 있다. 요청 처리부(12)는 사용자로부터 제공받은 정보와 저장부(11)로부터 조회된 정보를 포함하여 하이퍼그래프 데이터의 분석에 필요한 각종 데이터를 이벤트 처리부(13)에 제공할 수 있다.
이벤트 처리부(13)는, 요청 처리부(12)로부터 하이퍼그래프 데이터를 수신하고 연관관계 자동 생성을 위한 군집화를 수행한다. 일 실시예에서, 이벤트 처리부(13)는 이를 위한 사용자 지정 임계값을 요청 처리부(12)로부터 더 수신할 수도 있다. 이벤트 처리부(13)는 노드(또는, 제1 노드) 및 에지(또는, 제1 에지)를 갖는 하이퍼그래프 데이터를 수신하고, 이를 하이퍼그래프 데이터의 각 에지(또는, 제1 에지)에 상응하는 노드(또는, 제2 노드)와 이들 사이의 에지를 포함하는 선 그래프(line graph)로 변환하여 군집 결과 데이터를 생성하고 이를 요청 처리부(12)에 반환할 수 있다.
도 5는 일 실시예에 따른 하이퍼그래프 데이터 분석 시스템의 이벤트 처리부의 개략적인 블록도이다.
도 5를 참조하면, 이벤트 처리부(13)는 변환부(131), 커뮤니티 검출(community detection)부(132) 및 반환부(133)를 포함한다. 도 3을 참조하여 전술한 것과 마찬가지로, 도 4에 도시된 변환부(131), 커뮤니티 검출부(132) 및 반환부(133)는 이벤트 처리부(13)의 구성을 기능적으로 구분한 것일 뿐, 반드시 변환부(131), 커뮤니티 검출부(132) 및 반환부(133)가 서로 물리적으로 구분되는 별개의 장치로 구현되어야 하는 것은 아니다.
변환부(131)는, 복수 개의 제1 노드와 이들 사이의 제1 에지를 포함하는 하이퍼그래프 데이터에서 제1 에지에 연결된 제1 노드의 개수를 기반으로 하이퍼그래프 데이터를 선 그래프로 변환한다. 이때, 원본 하이퍼그래프 데이터의 각각의 제1 에지는 선 그래프의 각 제2 노드에 상응한다.
커뮤니티 검출부(132)는, 변환부(131)에 의하여 변환된 선 그래프를 대상으로 커뮤니티 검출 알고리즘을 수행함으로써, 선 그래프에 포함된 복수 개의 제2 노드를 군집화하도록 구성된다. 노드의 군집화를 위한 커뮤니티 검출 알고리즘은 공지된 또는 향후 개발될 임의의 알고리즘이 사용될 수 있으며, 특정 기법에 의한 것으로 한정되지 않는다.
반환부(133)는, 커뮤니티 검출부(132)에 의하여 얻어진 복수 개의 제2 노드의 군집 결과를 원본 하이퍼그래프에 포함된 제1 에지에 대한 군집 결과 데이터로 변환하여 요청 처리부에 반환하는 역할을 한다.
변환부(131), 커뮤니티 검출부(132) 및 반환부(133)의 동작을 위한 구체적인 계산 과정에 대해서는 이하에서 상세히 설명한다.
도 6은 일 실시예에 따른 하이퍼그래프 데이터 분석 방법의 순서도이다. 설명의 편의를 위하여, 이하에서는 도 3 및 도 6을 참조하여 본 실시예에 따른 하이퍼그래프 데이터 분석 방법에 대하여 설명한다.
먼저, 하이퍼그래프 데이터 분석 장치(10)의 요청 처리부(12)는 사용자 장치(미도시)로부터 데이터 객체들에 대한 연관관계 생성 요청을 수신하고(S1), 저장부(11)의 데이터베이스(110)에서 필요한 데이터를 조회할 수 있다(S2). 예컨대, 요청 처리부(12)는 사용자 또는 미리 설정된 작업 스케쥴러로부터 요청을 수신하고, 데이터베이스(110)에 저장된 하이퍼그래프 데이터의 전체 또는 요청에 의해 정의된 일부 선택 부분을 조회할 수 있다. 요청은 특정 시간 또는 특정 이벤트 발생에 따라 생성되는 것일 수도 있다.
이벤트 처리부(13)는, 요청 처리부(12)가 조회한 하이퍼그래프 데이터를 전달받고 이를 기반으로 연관관계 생성, 즉, 군집화를 수행할 수 있다. 먼저, 이벤트 처리부(13)는 요청 처리부(12)로부터 전달받은 하이퍼그래프 데이터를 선 그래프로 변환할 수 있다(S3).
도 7은 일 실시예에 따라 하이퍼그래프를 선 그래프로 전환하여 노드 기반의 커뮤니티 검출을 수행하는 과정의 개념도이다.
도 7의 (a)에 도시된 것과 같이, 하이퍼그래프 데이터는 데이터 객체에 해당하는 복수 개의 노드(101 내지 108)와 이들 노드들 사이를 연결하는 에지(α, β, γ, δ, ε, ζ, η, θ)를 가지며, 에지(α, β, γ, δ, ε, ζ, η, θ)는 2개 이상의 노드에 연결된 하이퍼에지일 수도 있다.
이때, 이벤트 처리부(13)는 하이퍼그래프 데이터의 에지(α, β, γ, δ, ε, ζ, η, θ)가 각각 선 그래프의 노드가 되고 하이퍼그래프 데이터의 각 노드(101 내지 108)가 선 그래프의 노드 사이의 에지가 되도록 도5의 (b)와 같은 선 그래프를 생성할 수 있다. 변환된 선 그래프에서 노드와 에지들 사이의 연결은, 원본 하이퍼그래프 데이터에서 각 노드(101 내지 108)에 연결된 에지의 수(또는, 각 에지(α, β, γ, δ, ε, ζ, η, θ)에 연결된 노드의 수)를 기초로 결정될 수 있다.
구체적으로, 하이퍼그래프 데이터의 각 노드를 i, j, k 등으로 명명하고, 하이퍼그래프 데이터의 각 에지를 α, β, γ 등으로 명명할 경우, 하이퍼그래프 데이터의 노드와 에지 사이의 연결 관계를 정의하는 인접 행렬(adjacency matrix) A의 각 성분은 하기 수학식 1과 같이 표현될 수 있다.
[수학식 1]
이때, 하이퍼그래프 데이터의 기본 지표 중 하나인 차수(degree)는 노드 i에 연결된 에지의 개수를 ki, 에지 α 에 연결된 노드의 개수를 kα 라 할 경우 하기 수학식 2 및 수학식 3과 같이 정의될 수 있다.
[수학식 2]
[수학식 3]
일 실시예에서, 하이퍼그래프 데이터의 노드 i, j, k 등과 에지 α, β, γ 등의 연결이 연결의 강도나 특성을 나타내는 가중치를 갖는 경우, 노드 i와 에지 α 사이의 가중치를 wiα 라고 하면, 가중치가 적용된 인접 행렬 는 하기 수학식 4와 같이 표현될 수 있다.
[수학식 4]
본 실시예에서, 하이퍼그래프 데이터의 차수는 노드 i에 연결된 가중치의 총 합을 의미하는 강도(strength) si와 에지 α 에 연결된 가중치의 총 합을 의미하는 강도 sα 로 확장될 수 있고, 각각 하기 수학식 5 및 수학식 6과 같이 표현될 수 있다.
[수학식 5]
[수학식 6]
또한 일 실시예에서, 하이퍼그래프 데이터의 에지는 방향성을 가질 수 있고, 이 경우 인접 행렬은 하기 수학식 7과 같이 일반화되어 표현될 수 있다.
[수학식 7]
상기 수학식 7 에서 는 하이퍼그래프의 에지 α가 노드 i와 연결되어 있으며 에지의 방향이 노드 i로 향하는 방향인 경우를 나타내며, 는 에지 α가 노드 i와 연결되어 있으며 에지의 방향이 노드 i로부터 나가는 방향인 경우를 나타낸다.
한편 에지가 방향성을 가지는 경우, 차수를 나타내는 ki 및 kα 와 강도를 나타내는 si 및 sα 는 각 노드(또는 에지)로 들어오는 방향을 -in, 각 노드(또는 에지)에서 나가는 방향을 -out의 첨자로 표시할 경우 하기 수학식 8 내지 15와 같이 구분될 수 있다.
[수학식 8]
[수학식 9]
[수학식 10]
[수학식 11]
[수학식 12]
[수학식 13]
[수학식 14]
[수학식 15]
이상과 같이 하이퍼그래프 데이터가 정의된 상태에서, 에지에 가중치나 방향성이 없는 하이퍼그래프 데이터 A로부터 변환된 선 그래프 B의 각 성분은 하기 수학식 16과 같이 정의될 수 있다. 즉, 이벤트 처리부(13)는 하기 수학식 16을 적용함으로써 하이퍼그래프 데이터를 하이퍼그래프 게이터의 각 에지에 상응하는 각각의 노드를 갖는 선 그래프로 변환할 수 있다.
[수학식 16]
상기 수학식 16은 근사식인 하기 수학식 17로 대체되어 사용될 수도 있다. 수학식 16을 이용할 경우 수행시간이 오래 소요되는 반면 정확한 수행결과를 얻을 수 있고, 수학식 17을 이용할 경우에는 수행결과의 정확도를 일정 부분 희생하는 대신 상대적으로 단시간 내에 수행결과를 얻을 수 있다.
[수학식 17]
[수학식 18]
또한, 상기 수학식 18은 데이터 규모에 따라 근사식인 하기 수학식 19로 대체되어 사용될 수 있다.
[수학식 19]
나아가 일 실시예에서, 하이퍼그래프 데이터의 에지가 가중치 및 방향성을 갖는 경우 하이퍼그래프 데이터 로부터 선 그래프 로의 전환식은 하기 수학식 20과 같은 형태를 가질 수 있다.
[수학식 20]
또한, 상기 수학식 20은 데이터 규모에 따라 근사식인 하기 수학식 21로 대체되어 사용될 수 있다.
[수학식 21]
이벤트 처리부(13)는, 하이퍼그래프 데이터를 정의하는 인접 행렬을 기반으로 하여 하이퍼그래프 데이터가 각 에지의 가중치 정보를 포함하는지 여부 및/또는 각 에지의 방향성 정보를 포함하는지 여부에 따라 전술한 수학식 16 내지 21 중 상응하는 수학식을 적용함으로써 하이퍼그래프 데이터를 하이퍼그래프 데이터의 각 에지에 상응하는 노드를 갖는 선 그래프로 변환할 수 있다.
다음으로, 이벤트 처리부(13)는 선 그래프를 대상으로 커뮤니티 검출 알고리즘을 수행함으로써 선 그래프의 복수 개의 노드에 대한 군집 결과를 생성할 수 있다(S4). 도 7의 (c)는 변환된 선 그래프의 노드(α, β, γ, δ, ε, ζ, η, θ)에 대한 군집 결과를 나타내는 것으로서, 점선으로 표시된 노드(ε, ζ, η, θ)들은 서로 동일한 군집에 속하는 것을 나타낸다. 노드의 군집화를 위한 커뮤니티 검출 알고리즘은 공지된 또는 향후 개발될 임의의 알고리즘이 사용될 수 있으며, 특정 기법에 의한 것으로 한정되지 않는다.
일 실시예에서, 이벤트 처리부(13)는 모듈러리티 최적화(modularity optimization) 알고리즘을 이용하여 선 그래프의 노드(α, β, γ, δ, ε, ζ, η, θ)에 대한 커뮤니티 검출을 수행할 수 있다. 모듈러리티 최적화 기법은 동일한 그래프를 대상으로 하는 임의의 군집 구분 결과가 있을 경우 해당 그래프와 동일한 그래프 토폴로지(topology)를 가지는 임의의 그래프를 대조군으로 하고, 실험군인 해당 그래프에서 [군집 간 에지의 수] 대비 [군집 내 에지의 수]의 비율을 종속 변인으로 하여, 대조군과 실험군의 종속 변인을 비교하는 평가함수(quality function)인 모듈러리티를 정의하고 모듈러리티 값을 최적화하는 군집 구분을 최종 결과물로 반환하는 기법이다. 모듈러리티 최적화 알고리즘의 구체적인 계산은 본 발명의 기술분야에서 잘 알려져 있으므로 발명의 요지를 명확하게 하기 위하여 자세한 설명은 생략한다.
본 발명의 실시예들에 의하면, 하이퍼그래프 데이터의 각 에지를 노드로 변환하여 군집 결과를 산출하므로, 종래의 노드 기반의 군집화 기법과 관련하여 수학적으로 체계가 잘 정립되어 있으며 군집 결과물을 도출하는 합리적인 방법으로 받아들여지고 있는 모듈러리티 최적화 기법을 하이퍼그래프의 에지의 커뮤니티 검출에 적용할 수 있고, 또한 모듈러리티 최적화 기법에 따른 부 산출물을 얻어내는 기법 또한 적용이 가능한 이점이 있다. 그러나, 본 발명에서 선 그래프의 노드(α, β, γ, δ, ε, ζ, η, θ)에 대한 커뮤니티 검출을 수행하는 기법은 모듈러리티 최적화 알고리즘으로 한정되는 것은 아니다.
다음으로, 이벤트 처리부(13)는 선 그래프의 노드(α, β, γ, δ, ε, ζ, η, θ)에 대한 커뮤니티 검출 결과를 원본 하이퍼그래프 데이터의 에지(α, β, γ, δ, ε, ζ, η, θ)에 대한 군집 결과 데이터로 변환할 수 있다. 도 7의 (d)는 이상의 과정에 의하여 하이퍼그래프 데이터의 에지(ε, ζ, η, θ)가 동일한 군집에 속하는 것으로 검출된 결과를 점선으로 표시한 것이다.
또한 커뮤니티 검출 결과가 생성되면, 이벤트 처리부(13)는 자동으로 또는 사용자의 요청에 대한 응답으로 커뮤니티 검출 결과 데이터를 저장부(11)의 데이터베이스(110)에 저장할 수 있다(S5).
다음으로, 이벤트 처리부(13)는 군집 결과 데이터에 대한 사용자의 시각화 요청이 있는지 여부에 따라(S6), 시각화 요청이 있을 경우에는 군집 결과 데이터를 사용자가 설정한 시각화 옵션에 따라 사용자가 인지할 수 있는 형태로 출력하고(S7), 시각화 요청이 없는 경우에는 이벤트 처리 절차를 종료할 수 있다.
이상에서 설명한 실시예들에 따른 하이퍼그래프 데이터 분석 방법에 의한 동작은 적어도 부분적으로 컴퓨터 프로그램으로 구현되고 컴퓨터로 읽을 수 있는 기록매체에 기록될 수 있다. 실시예들에 따른 하이퍼그래프 데이터 분석 방법에 의한 동작을 구현하기 위한 프로그램이 기록되고 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수도 있다. 또한, 본 실시예를 구현하기 위한 기능적인 프로그램, 코드 및 코드 세그먼트(segment)들은 본 실시예가 속하는 기술 분야의 통상의 기술자에 의해 용이하게 이해될 수 있을 것이다.
이상에서 살펴본 본 발명은 도면에 도시된 실시예들을 참고로 하여 설명하였으나 이는 예시적인 것에 불과하며 당해 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 실시예의 변형이 가능하다는 점을 이해할 것이다. 그러나, 이와 같은 변형은 본 발명의 기술적 보호범위 내에 있다고 보아야 한다. 따라서, 본 발명의 진정한 기술적 보호범위는 첨부된 청구범위의 기술적 사상에 의해서 정해져야 할 것이다.
Claims (10)
- 복수 개의 제1 노드 및 상기 제1 노드 사이의 복수 개의 제1 에지를 포함하는 하이퍼그래프 데이터가 저장된 저장부;
상기 저장부에 저장된 상기 하이퍼그래프 데이터에 대한 연관관계 생성 요청을 수용자로부터 수신하며, 상기 요청에 대한 응답으로, 군집 결과 데이터를 상기 사용자에게 제공하도록 구성된 요청 처리부; 및
상기 요청 처리부로부터 상기 하이퍼그래프 데이터를 수신하고, 상기 하이퍼그래프 데이터를 상기 제1 에지에 상응하는 복수 개의 제2 노드를 포함하는 선 그래프로 변환하여 상기 복수 개의 제2 노드를 군집화하고, 상기 복수 개의 제2 노드의 군집 결과를 상기 복수 개의 제1 에지에 대한 상기 군집 결과 데이터로 상기 요청 처리부에 제공하도록 구성된 이벤트 처리부를 포함하되,
상기 이벤트 처리부는,
상기 제1 에지에 연결된 상기 제1 노드의 개수를 기반으로 상기 하이퍼그래프 데이터를 상기 선 그래프로 변환하도록 구성된 변환부;
커뮤니티 검출 알고리즘을 이용하여 상기 선 그래프의 상기 복수 개의 제2 노드를 군집화하도록 구성된 커뮤니티 검출부; 및
상기 복수 개의 제2 노드의 군집 결과를 상기 복수 개의 제1 에지에 대한 상기 군집 결과 데이터로 변환하도록 구성된 반환부를 포함하는 하이퍼그래프 데이터 분석 시스템. - 삭제
- 제1항에 있어서,
상기 반환부는, 상기 군집 결과 데이터를 상기 저장부에 저장하도록 더 구성된 하이퍼그래프 데이터 분석 시스템. - 제1항에 있어서,
상기 변환부는, 상기 하이퍼그래프 데이터의 상기 제1 노드 및 상기 제1 에지 사이의 연결을 정의하는 인접 행렬을 이용하여 상기 하이퍼그래프를 상기 선 그래프로 변환하도록 더 구성된 하이퍼그래프 데이터 분석 시스템. - 제4항에 있어서,
상기 하이퍼그래프 데이터는 상기 복수 개의 제1 에지 각각에 대한 가중치 정보 또는 방향성 정보를 포함하는 하이퍼그래프 데이터 분석 시스템. - 하이퍼그래프 데이터 분석 시스템에, 복수 개의 제1 노드 및 상기 제1 노드 사이의 복수 개의 제1 에지를 포함하는 하이퍼그래프 데이터를 저장하는 단계;
상기 하이퍼그래프 데이터 분석 시스템이, 상기 하이퍼그래프 데이터에 대한 연관관계 생성 요청을 사용자로부터 수신하는 단계;
상기 하이퍼그래프 데이터 분석 시스템이, 수신된 상기 요청에 대한 응답으로, 상기 제1 에지에 연결된 상기 제1 노드의 개수에 기반하여, 상기 하이퍼그래프 데이터를 상기 제1 에지에 상응하는 복수 개의 제2 노드를 포함하는 선 그래프로 변환하는 단계;
상기 하이퍼그래프 데이터 분석 시스템이, 커뮤니티 검출 알고리즘을 이용하여, 변환된 상기 선 그래프의 상기 복수 개의 제2 노드를 군집화하는 단계; 및
상기 하이퍼그래프 데이터 분석 시스템이, 상기 복수 개의 제2 노드의 군집 결과를 상기 복수 개의 제1 에지에 대한 군집 결과 데이터로 변환하여 사용자에게 제공하는 단계를 포함하는 하이퍼그래프 데이터 분석 방법. - 제6항에 있어서,
상기 하이퍼그래프 데이터 분석 시스템에 상기 군집 결과 데이터를 저장하는 단계를 더 포함하는 하이퍼그래프 데이터 분석 방법. - 제6항에 있어서,
상기 선 그래프로 변환하는 단계는, 상기 하이퍼그래프 데이터 분석 시스템이, 상기 하이퍼그래프 데이터의 상기 제1 노드 및 상기 제1 에지 사이의 연결을 정의하는 인접 행렬을 이용하여 상기 하이퍼그래프를 상기 선 그래프로 변환하는 단계를 포함하는 하이퍼그래프 데이터 분석 방법. - 제6항에 있어서,
상기 하이퍼그래프 데이터는 상기 복수 개의 제1 에지 각각에 대한 가중치 정보 또는 방향성 정보를 포함하는 하이퍼그래프 데이터 분석 방법. - 제1항에 따른 하이퍼그래프 데이터 분석 시스템과 결합되어 하이퍼그래프 데이터 분석 방법을 실행하도록 컴퓨터로 판독 가능한 매체에 저장된 컴퓨터 프로그램으로서,
상기 하이퍼그래프 데이터 분석 방법은,
상기 하이퍼그래프 데이터 분석 시스템에, 복수 개의 제1 노드 및 상기 제1 노드 사이의 복수 개의 제1 에지를 포함하는 하이퍼그래프 데이터를 저장하는 단계;
상기 하이퍼그래프 데이터 분석 시스템이, 상기 하이퍼그래프 데이터에 대한 연관관계 생성 요청을 사용자로부터 수신하는 단계;
상기 하이퍼그래프 데이터 분석 시스템이, 수신된 상기 요청에 대한 응답으로, 상기 제1 에지에 연결된 상기 제1 노드의 개수에 기반하여, 상기 하이퍼그래프 데이터를 상기 제1 에지에 상응하는 복수 개의 제2 노드를 포함하는 선 그래프로 변환하는 단계;
상기 하이퍼그래프 데이터 분석 시스템이, 커뮤니티 검출 알고리즘을 이용하여, 변환된 상기 선 그래프의 상기 복수 개의 제2 노드를 군집화하는 단계; 및
상기 하이퍼그래프 데이터 분석 시스템이, 상기 복수 개의 제2 노드의 군집 결과를 상기 복수 개의 제1 에지에 대한 군집 결과 데이터로 변환하여 사용자에게 제공하는 단계를 포함하는,
컴퓨터 프로그램.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180093961A KR101965277B1 (ko) | 2018-08-10 | 2018-08-10 | 하이퍼그래프 데이터 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180093961A KR101965277B1 (ko) | 2018-08-10 | 2018-08-10 | 하이퍼그래프 데이터 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101965277B1 true KR101965277B1 (ko) | 2019-04-03 |
Family
ID=66165344
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180093961A KR101965277B1 (ko) | 2018-08-10 | 2018-08-10 | 하이퍼그래프 데이터 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101965277B1 (ko) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102085161B1 (ko) * | 2019-07-22 | 2020-03-06 | 주식회사 비트나인 | 그래프 데이터 시각화 시스템 및 방법과, 이를 위한 컴퓨터 프로그램 |
KR102136222B1 (ko) * | 2019-09-27 | 2020-07-21 | 주식회사 비트나인 | 그래프 데이터 클러스터링 시스템 및 방법과, 이를 위한 컴퓨터 프로그램 |
CN113434737A (zh) * | 2021-07-23 | 2021-09-24 | 支付宝(杭州)信息技术有限公司 | 一种数据处理方法和系统 |
KR20220049953A (ko) | 2020-10-15 | 2022-04-22 | 고려대학교 산학협력단 | 키르히호프의 회로 법칙을 이용한 탐색 문제의 그래프 단순화 방법, 이를 수행하기 위한 기록 매체 및 장치 |
CN117038028A (zh) * | 2023-07-06 | 2023-11-10 | 长沙云享医康科技有限公司 | 一种医院医疗质量督查督办系统及方法 |
KR102659172B1 (ko) * | 2023-04-27 | 2024-04-22 | 한국과학기술원 | 그래프 및 하이퍼그래프 처리를 위한 등변적 하이퍼그래프 신경망을 갖는 컴퓨터 장치 및 그의 방법 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012008680A (ja) * | 2010-06-23 | 2012-01-12 | Fuji Xerox Co Ltd | プログラム及び情報分析装置 |
US20150339381A1 (en) * | 2014-05-22 | 2015-11-26 | Yahoo!, Inc. | Content recommendations |
US20160371271A1 (en) * | 2015-06-18 | 2016-12-22 | International Business Machines Corporation | Identification of Target Audience for Content Delivery in Social Networks by Quantifying Semantic Relations and Crowdsourcing |
KR101697875B1 (ko) | 2015-10-30 | 2017-01-18 | 아주대학교산학협력단 | 그래프 모델에 기반하는 문서 분석 방법 및 그 시스템 |
JP2017529590A (ja) * | 2014-07-30 | 2017-10-05 | サイオス テクノロジー コーポレーションSios Technology Corporation | グラフ理論を用いたアプリケーション、仮想化およびクラウド・インフラストラクチャ・リソースの集中型分析 |
-
2018
- 2018-08-10 KR KR1020180093961A patent/KR101965277B1/ko active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012008680A (ja) * | 2010-06-23 | 2012-01-12 | Fuji Xerox Co Ltd | プログラム及び情報分析装置 |
US20150339381A1 (en) * | 2014-05-22 | 2015-11-26 | Yahoo!, Inc. | Content recommendations |
JP2017529590A (ja) * | 2014-07-30 | 2017-10-05 | サイオス テクノロジー コーポレーションSios Technology Corporation | グラフ理論を用いたアプリケーション、仮想化およびクラウド・インフラストラクチャ・リソースの集中型分析 |
US20160371271A1 (en) * | 2015-06-18 | 2016-12-22 | International Business Machines Corporation | Identification of Target Audience for Content Delivery in Social Networks by Quantifying Semantic Relations and Crowdsourcing |
KR101697875B1 (ko) | 2015-10-30 | 2017-01-18 | 아주대학교산학협력단 | 그래프 모델에 기반하는 문서 분석 방법 및 그 시스템 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102085161B1 (ko) * | 2019-07-22 | 2020-03-06 | 주식회사 비트나인 | 그래프 데이터 시각화 시스템 및 방법과, 이를 위한 컴퓨터 프로그램 |
KR102136222B1 (ko) * | 2019-09-27 | 2020-07-21 | 주식회사 비트나인 | 그래프 데이터 클러스터링 시스템 및 방법과, 이를 위한 컴퓨터 프로그램 |
KR20220049953A (ko) | 2020-10-15 | 2022-04-22 | 고려대학교 산학협력단 | 키르히호프의 회로 법칙을 이용한 탐색 문제의 그래프 단순화 방법, 이를 수행하기 위한 기록 매체 및 장치 |
KR102433897B1 (ko) | 2020-10-15 | 2022-08-18 | 고려대학교 산학협력단 | 키르히호프의 회로 법칙을 이용한 탐색 문제의 그래프 단순화 방법, 이를 수행하기 위한 기록 매체 및 장치 |
CN113434737A (zh) * | 2021-07-23 | 2021-09-24 | 支付宝(杭州)信息技术有限公司 | 一种数据处理方法和系统 |
KR102659172B1 (ko) * | 2023-04-27 | 2024-04-22 | 한국과학기술원 | 그래프 및 하이퍼그래프 처리를 위한 등변적 하이퍼그래프 신경망을 갖는 컴퓨터 장치 및 그의 방법 |
CN117038028A (zh) * | 2023-07-06 | 2023-11-10 | 长沙云享医康科技有限公司 | 一种医院医疗质量督查督办系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101965277B1 (ko) | 하이퍼그래프 데이터 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램 | |
JP6643211B2 (ja) | 異常検知システム及び異常検知方法 | |
CN103513983B (zh) | 用于预测性警报阈值确定工具的方法和系统 | |
US10452702B2 (en) | Data clustering | |
EP3832487A1 (en) | Systems and methods driven by link-specific numeric information for predicting associations based on predicate types | |
US9164980B2 (en) | Name identification rule generating apparatus and name identification rule generating method | |
AU2013329525A1 (en) | System and method for recursively traversing the internet and other sources to identify, gather, curate, adjudicate, and qualify business identity and related data | |
EP1958034B1 (en) | Use of sequential clustering for instance selection in machine condition monitoring | |
CN102012936B (zh) | 基于云计算平台的海量数据聚合方法和系统 | |
JP2013120534A (ja) | 関連語分類装置及びコンピュータプログラム及び関連語分類方法 | |
CN112306820B (zh) | 一种日志运维根因分析方法、装置、电子设备及存储介质 | |
Zhang et al. | An affinity propagation clustering algorithm for mixed numeric and categorical datasets | |
CN116842099B (zh) | 一种多源异构数据处理方法和系统 | |
Xie et al. | Logm: Log analysis for multiple components of hadoop platform | |
CN110708285A (zh) | 流量监控方法、装置、介质及电子设备 | |
US10346450B2 (en) | Automatic datacenter state summarization | |
US11782918B2 (en) | Selecting access flow path in complex queries | |
CN101495978B (zh) | 减少总线连接的消费者和产生者之间的消息流 | |
US11741101B2 (en) | Estimating execution time for batch queries | |
CN117807121A (zh) | 基于知识图谱的电网知识关联方法、装置、设备及介质 | |
CN116483831B (zh) | 一种分布式数据库推荐索引生成方法 | |
Shafi et al. | [WiP] Web Services Classification Using an Improved Text Mining Technique | |
CN115408189A (zh) | 人工智能与大数据结合的异常检测方法及服务系统 | |
CN115204155A (zh) | 一种配置异常检测方法、装置、计算机设备和存储介质 | |
CN114330720A (zh) | 用于云计算的知识图谱构建方法、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GRNT | Written decision to grant |