KR101660584B1 - 그래프 압축 처리 방법 및 장치 - Google Patents

그래프 압축 처리 방법 및 장치 Download PDF

Info

Publication number
KR101660584B1
KR101660584B1 KR1020140095667A KR20140095667A KR101660584B1 KR 101660584 B1 KR101660584 B1 KR 101660584B1 KR 1020140095667 A KR1020140095667 A KR 1020140095667A KR 20140095667 A KR20140095667 A KR 20140095667A KR 101660584 B1 KR101660584 B1 KR 101660584B1
Authority
KR
South Korea
Prior art keywords
node
hub
nodes
graph
spoke
Prior art date
Application number
KR1020140095667A
Other languages
English (en)
Other versions
KR20150125511A (ko
Inventor
강유
임용섭
크리스토스 펄루소스
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Publication of KR20150125511A publication Critical patent/KR20150125511A/ko
Application granted granted Critical
Publication of KR101660584B1 publication Critical patent/KR101660584B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

그래프 압축 처리 방법 및 장치가 개시된다. 그래프 상에 존재하는 노드의 차수를 이용하여 허브 노드를 추출하는 단계; 상기 추출한 허브 노드 간의 연결을 고려하여 차수가 높은 순으로 허브 노드를 제거하는 단계; 상기 제거한 허브 노드로부터 분해되는 스포크(spoke) 노드를 식별하는 단계; 상기 제거한 허브 노드의 차수를 고려하여 그래프 상에 상기 스포크 노드를 배열하는 단계; 및 상기 스포크 노드의 배열에 따른 그래프의 압축을 처리하는 단계를 포함할 수 있다.

Description

그래프 압축 처리 방법 및 장치{METHOD AND APPARATUS FOR PROCESSING GRAPH COMPRESSION}
그래프 상에 존재하는 허브 노드를 선택적으로 제거함으로써, 허브 노드로부터 분해된 노드들을 재배열하여 그래프의 압축률을 높이는 압축 처리 방법 및 장치에 관한 것이다.
현재 그래프를 압축 하기 위한 기술은 그래프 클러스터링, 그래프 분할, 집단 검출 기법 등이 있다. 이와 같은 기법들은 그래프 상의 인접 행렬에 넌제로(nonzero) 값을 특정 영역으로 모으는 기법들에 해당하다. 그러나, 실제 그래프 상에서의 차수 분포는 power-law 또는 heavy-tailed 분포의 형태를 보이고 있다. 따라서, 실제 그래프 상에서는 허브 노드들이 존재한다. 허브 노드들은 다른 노드들에 비해 차수가 크기 때문에, 허브 노드들은 넌제로 값들을 그래프 상에서의 특정 영역으로 모으는 것을 방해한다.
그래프 상에 존재하는 허브 노드 간의 연결을 고려하여 허브 노드들을 제거하고, 허브 노드로부터 분해되는 스포크 노드를 배열할 때 허브 노드의 차수를 고려함으로써, 그래프 압축률을 상승 시킬 뿐만 아니라 그래프 마이닝 알고리즘의 수행 속도를 높일 수 있는 그래프 압축 처리 방법 및 장치에 관한 것이다.
일실시예에 따른 그래프 압축 처리 방법에 있어서, 그래프 상에 존재하는 노드의 차수를 이용하여 허브 노드를 추출하는 단계; 상기 추출한 허브 노드 간의 연결을 고려하여 차수가 높은 순으로 허브 노드를 제거하는 단계; 상기 제거한 허브 노드로부터 분해되는 스포크(spoke) 노드를 식별하는 단계; 상기 제거한 허브 노드의 차수를 고려하여 그래프 상에 상기 스포크 노드를 배열하는 단계; 및 상기 스포크 노드를 배열한 그래프의 압축을 처리하는 단계를 포함할 수 있다.
다른 일실시예에 따른 그래프 압축 처리 방법에 있어서, 상기 제거하는 단계는, 상기 추출한 허브 노드 중에서 어느 하나의 허브 노드를 제거할 경우, 상기 어느 하나의 허브 노드와 연결된 허브 노드의 차수 변화를 고려하여 허브 노드의 제거 순서를 결정하고, 상기 결정한 제거 순서를 기초로 허브 노드를 제거할 수 있다.
또 다른 일실시예에 따른 그래프 압축 처리 방법에 있어서, 상기 배열하는 단계는, 상기 제거한 허브 노드의 차수, 및 상기 스포크 노드의 크기를 고려하여 그래프 상에 상기 스포크 노드를 배열할 수 있다.
또 다른 일실시예에 따른 그래프 압축 처리 방법에 있어서, 상기 식별하는 단계는, 상기 제거한 허브 노드로부터 분해되는 스포크 노드와 자이언트 커넥티드 컴퍼넌트 노드(Giant Connected-Component, GCC)를 식별하고, 상기 자이언트 커넥티드 컴퍼넌트 노드 내에서의 허브 노드를 제거하는 단계를 더 포함할 수 있다.
또 다른 일실시예에 따른 그래프 압축 처리 방법에 있어서, 상기 식별하는 단계는, 상기 허브 노드로부터 분해되는 스포크 노드와 자이언트 커넥티드 컴퍼넌트 노드를 식별하고, 상기 자이언트 커넥티드 컴퍼넌트 노드 내의 노드의 개수가 상기 제거한 허브 노드의 개수보다 작거나 또는 동일할 때까지 상기 자이언트 커넥티드 컴퍼넌트 노드 내에서의 허브 노드를 제거하는 단계를 더 포함할 수 있다.
일실시예에 따른 압축 처리 방법에 있어서, 그래프 상에 존재하는 노드의 차수를 이용하여 추출한 허브 노드를 포함하는 허브 노드 집합을 생성하는 단계; 상기 허브 노드 집합에 포함된 허브 노드 간의 연결을 고려하여 허브 노드의 제거 순서를 계산하는 단계; 상기 제거 순서에 따라 상기 허브 노드 집합에 포함된 허브 노드를 제거하는 단계; 상기 제거한 허브 노드로부터 분해되는 스포크 노드의 배열 순서를 결정하는 단계; 및 상기 배열 순서에 따라 스포크 노드를 배열한 그래프의 압축을 처리하는 단계를 포함할 수 있다.
다른 일실시예에 따른 압축 처리 방법에 있어서, 상기 계산하는 단계는, 상기 허브 노드 집합에 포함된 어느 하나의 허브 노드를 제거하는 경우, 상기 어느 하나의 허브 노드와 연결된 허브 노드의 차수 변화를 고려하여 허브 노드의 제거 순서를 계산할 수 있다.
또 다른 일실시예에 따른 압축 처리 방법에 있어서, 상기 계산하는 단계는, 상기 허브 노드 집합에 포함된 허브 노드 간의 연결, 및 허브 노드의 차수를 고려하여 허브 노드의 제거 순서를 계산할 수 있다.
또 다른 일실시예에 따른 압축 처리 방법에 있어서, 상기 결정하는 단계는, 상기 제거한 허브 노드로부터 분해되는 스포크 노드와 자이언트 커넥티드 컴퍼넌트 노드를 식별하고, 상기 자이언트 커넥티드 컴퍼넌트 노드 내에서의 허브 노드를 제거하는 단계를 더 포함할 수 있다.
또 다른 일실시예에 따른 압축 처리 방법에 있어서, 상기 결정하는 단계는, 상기 제거한 허브 노드로부터 분해되는 스포크 노드와 자이언트 커넥티드 컴퍼넌트 노드를 식별하고, 상기 자이언트 커넥티드 컴퍼넌트 노드 내의 노드의 개수가 상기 제거한 허브 노드의 개수보다 작거나 또는 동일할 때까지 상기 자이언트 커넥티드 컴퍼넌트 노드 내에서의 허브 노드를 제거하는 단계를 더 포함할 수 있다.
일실시예에 따른 압축 처리 장치에 있어서, 그래프 상에 존재하는 노드들의 차수를 이용하여 허브 노드를 추출하는 추출부; 상기 추출한 허브 노드 간의 연결을 고려하여 차수가 높은 순으로 허브 노드를 제거하는 제거부; 상기 제거한 허브 노드로부터 분해되는 스포크(spoke) 노드를 식별하는 식별부; 상기 제거한 허브 노드의 차수를 고려하여 상기 스포크 노드를 배열하는 배열부; 및 상기 스포크 노드를 배열한 그래프의 압축을 처리하는 처리부를 포함할 수 있다.
다른 일실시예에 따른 압축 처리 장치에 있어서, 상기 제거부는, 상기 추출한 허브 노드 중에서 어느 하나의 허브 노드를 제거할 경우, 상기 어느 하나의 허브 노드와 연결된 허브 노드의 차수 변화를 고려하여 허브 노드의 제거 순서를 결정하고, 상기 결정한 제거 순서를 기초로 허브 노드를 제거할 수 있다.
일실시예에 따른 압축 처리 장치에 있어서, 그래프 상에 존재하는 노드의 차수를 이용하여 추출한 허브 노드를 포함하는 허브 노드 집합을 생성하는 생성부; 상기 허브 노드 집합에 포함된 허브 노드 간의 연결을 고려하여 허브 노드의 제거 순서를 계산하는 계산부; 상기 제거 순서에 따라 상기 허브 노드 집합에 포함된 허브 노드를 제거하는 제거부; 상기 제거한 허브 노드로부터 분해되는 스포크 노드의 배열 순서를 결정하는 결정부; 및 상기 배열 순서에 따라 스포크 노드를 배열한 그래프의 압축을 처리하는 처리부를 포함할 수 있다.
다른 일실시예에 따른 압축 처리 장치에 있어서, 상기 계산부는, 상기 허브 노드 집합에 포함된 어느 하나의 허브 노드를 제거하는 경우, 상기 어느 하나의 허브 노드와 연결된 허브 노드의 차수 변화를 고려하여 허브 노드의 제거 순서를 계산할 수 있다.
그래프 상에 존재하는 허브 노드 간의 연결을 고려하여 허브 노드들을 제거하고, 허브 노드로부터 분해되는 스포크 노드를 배열할 때 허브 노드의 차수를 고려함으로써, 그래프 압축률을 상승 시킬 뿐만 아니라 그래프 마이닝 알고리즘의 수행 속도를 높일 수 있는 그래프 압축 처리 방법 및 장치에 관한 것이다.
도 1은 일실시예에 따른 그래프 상에 존재한 노드들의 차수를 계산하여 허브 노드를 식별하고, 식별한 허브 노드를 제거함으로써 노드를 재배열(reordering)한 그래프를 도시한 도면이다.
도 2는 일실시예에 따른 압축 처리 방법에 따라 허브 노드를 제거하여 그래프 상의 노드를 재배열한 행렬을 도시한 도면이다.
도 3은 일실시예에 따른 허브 노드를 제거하여 스포크 노드를 배열한 그래프의 압축 처리 방법을 도시한 도면이다.
도 4는 일실시예에 따른 허브 노드를 선택하는 방법 및 노드를 배열하는 방법을 도시한 도면이다.
도 5는 일실시예에 따른 제거 순서에 따라 허브 노드를 제거하고, 허브 노드로부터 분해된 스포크 노드를 재배열함으로써 그래프 압축을 처리하는 그래프 압축 처리 방법을 도시한 도면이다.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 일실시예에 따른 그래프 상에 존재한 노드들의 차수를 계산하여 허브 노드를 식별하고, 식별한 허브 노드를 제거함으로써 노드를 재배열(reordering)한 그래프를 도시한 도면이다.
이하에서 설명되는 압축 처리 장치는 프로세서를 이용하여 그래프의 압축 연산을 수행할 수 있는 장치를 의미할 수 있다. 그래프는 엣지(edge)에 의해 연결된 복수의 노드(node)들로 구성된 수학적 모델을 의미할 수 있다. 예를 들어, 도 1(b)에 도시된 바와 같이, 그래프는 노드(1-4)로 구성될 수 있다. 또한, 노드(1-4) 간에는 엣지를 통해 연결될 수 있다. 예를 들어, 그래프 G는
Figure 112014070992040-pat00001
로 표현될 수 있다. 여기서, V는 노드 집합을 의미할 수 있고, E는 엣지 집합을 의미할 수 있다.
도 1(b)에서 노드 집합(set of nodes)은 V={1, 2, 3, 4}로 표현될 수 있다. 또한, 엣지 집합(set of edges)은 E={(1,2), (1,3), (1,4), (2,3)}으로 표현될 수 있다. 예를 들어, 도 1(b)의 오른쪽에 도시된 바와 같이, 노드 집합과 엣지 집합은 행렬(matrix)로 표현될 수 있다.
인접 행렬(adjacency matrix)은 인접하는 노드 집합과 엣지 집합을 행렬로 표현한 것일 수 있다. 압축 처리 장치는 인접 행렬을 블록으로 분리할 수 있다. 이에 따라, 압축 처리 장치는 다양한 압축 방법을 이용하여 블록 각각에 대해 압축할 수 있다. 이 때, 인접 행렬에 빈 공간(empty space)이 많도록 노드들을 배열할 경우, 압축 처리 장치는 인접 행렬에 빈 공간이 적게 노드들을 배열했을 때 보다 더 좋은 압축률로 그래프를 압축할 수 있다. 즉, 고밀도의 블록(denser block)이 특정 영역에 최대한 모이도록 할 경우, 압축 처리 장치는 그래프의 압축을 효과적으로 처리할 수 있다.
구체적으로, 고밀도의 블록이 적은 것이 저밀도의 블록(sparser block)이 많은 것보다 좋은 이유는 2가지를 들 수 있다. 첫 번째로, 고밀도의 블록의 적다는 것은 디스크 접근 횟수를 줄일 수 있다는 의미일 수 있다. 두 번째로, 고밀도의 블록의 적다는 것은 더 좋은 압축 기회를 제공할 수 있다.
도 1(c)는 노드의 배열을 나타낸 도면이다. 도 1(c)의 왼쪽에 도시된 인접 행렬은 무작위로 배열한 노드를 도시한 도면이다. 도 1(c)의 왼쪽, 및 오른쪽에 도시된 인접 행렬은 동일한 그래프를 표현한 것이지만, 도 1(c)의 오른쪽에 도시된 인접 행렬이 더 효율적으로 압축될 수 있다. 구체적으로, 도 1(c)의 오른쪽에 도시된 인접 행렬은 도 1(c)의 왼쪽에 도시된 인접 행렬보다 더 적은 블록을 요구할 수 있다. 또한, 도 1(c)의 오른쪽에 도시된 인접 행렬의 비어있지 않은 블록(non-empty block)들은 도 1(c)의 왼쪽 행렬 내의 비어있지 않은 블록보다 더 밀집되어 있다. 따라서, 도 1(c)의 오른쪽에 도시된 인접 행렬이 더 효율적으로 압축될 수 있다. 즉, 인접행렬 상에서 넌제로(nonzero) 값이 특정 영역에 모이도록 노드를 배열할수록, 압축 처리 장치는 그래프의 압축률을 높일 수 있다.
압축 처리 장치는 그래프 상에 존재하는 노드들의 차수(degree)를 계산할 수 있다. 이에 따라, 압축 처리 장치는 차수가 높은 k개의 허브 노드를 추출할 수 있다. 구체적으로, 노드의 차수는 하기 수학식으로 표현할 수 있다.
Figure 112014070992040-pat00002
여기서, u는 노드를 의미할 수 있다. 또한, v는 엣지를 의미할 수 있다.
예를 들어, 도 1(b)에 도시된 바를 살펴보면, 노드(1-4) 중에서 노드 1의 차수가 가장 클 수 있다. 노드(1-4) 중에서 차수가 가장 낮은 것은 노드 4일 수 있다.
이와 같은 방법으로, 그래프 상에 존재하는 노드들의 차수를 계산하면, 압축 처리 장치는 허브 노드를 식별할 수 있다. 도 1(a)에 도시된 바와 같이, 허브 노드는 중앙 집중도(centrality)가 높은 노드를 의미 할 수 있다. 허브 노드는 그래프 상에 존재하는 또는 인접 행렬 상에 존재하는 노드 중에서 높은 차수를 가진 노드를 의미할 수 있다. 예를 들어, 도 1(a)에 도시된 바와 같이, 압축 처리 장치는 그래프 상에서는 중앙 집중도(centrality)가 높은 k개의 허브 노드의 집합(k-hubs)을 제거할 수 있다. 중앙 집중도는 노드의 차수에 대응할 수 있다. 압축 처리 장치는 허브 노드를 제거함으로써 그래프 상에 존재하는 다른 노드를 제거하는 것보다 더 쉽게 노드들을 분해할 수 있다.
구체적으로, 압축 처리 장치는 허브 노드를 제거함으로써, 허브 노드에 연결되어 있는 엣지들도 제거할 수 있다. 예를 들어 도 1(a)에 도시된 바와 같이 압축 처리 장치는 k개의 허브 노드를 제거할 수 있다. k개의 허브 노드를 제거하면, 그래프 상에서 k개의 허브 노드와 연결되어 있던 커넥티드 컴퍼넌트 노드(connected components, CC)와 단일 노드(다른 노드와 엣지에 의해 연결되어 있지 않은 노드)가 k개의 허브 노드로부터 분해될 수 있다. 커넥티드 컴퍼넌트 노드는 엣지에 의해 연결된 복수의 노드를 의미할 수 있다. 커넥티드 컴퍼넌트 노드는 넌-자이언트 커넥티드 컴퍼넌트 노드와(non-giant connected components, CCs)와 자이언트 커넥티드 컴퍼넌트 노드(giant connected components, GCC)로 분류할 수 있다. 압축 처리 장치는 노드의 크기를 기준으로 넌-자이언트 커넥티드 컴퍼넌트 노드와 자이언트 커넥티드 컴퍼넌트 노드로 분류할 수 있다. 이하에서 설명되는 스포크 노드는 넌-자이언트 커넥티드 컴퍼넌트 노드와 단일 노드를 포함하는 노드를 의미할 수 있다.
구체적으로, 압축 처리 장치는 그래프 상의 노드를 차수 순으로 정렬한 후 차수가 가장 높은 k개의 노드를 선택할 수 있다. 이 때, 압축 처리 장치는 k개의 허브 노드 사이의 연결을 고려할 수 있다. 예를 들어, 압축 처리 장치가 k개의 허브 노드 중에서 n(1≤n≤k)번째 허브 노드를 제거할 수 있다(여기서, n번째 허브 노드는 n번째로 차수가 높은 허브 노드를 의미할 수 있다). n 번째 허브 노드를 제거한 후, n+1번째 허브 노드는 더 이상 n+1번째로 차수가 높은 허브 노드가 아닐 수 있다. 즉, n+1번째로 차수가 높았던 노드의 차수는 n번째로 차수가 높은 허브 노드를 제거함에 따라 변화할 수 있다. 따라서, 압축 처리 장치는 n번째 허브 노드를 제거함에 따라 변화하는 차수를 고려하여 n+1번째로 차수가 높은 허브 노드를 제거할 수 있다. 즉, 압축 처리 장치는 허브 노드를 제거할 때마다 제거한 허브 노드와 연결된 허브 노드들의 차수를 계산하여 업데이트할 수 있다. 이에 따라, 압축 처리 장치는 보다 효율적으로 허브 노드를 제거할 수 있다.
압축 처리 장치는 허브 노드를 제거함에 따라 발생된 자이언트 커넥티드 컴퍼넌트 노드와 스포크 노드를 배열할 수 있다. 이 때, 압축 처리 장치는 스포크 노드의 크기 및 스포크 노드가 연결되어 있던 허브 노드의 차수를 고려하여 스포크 노드를 배열할 수 있다. 예를 들어, 압축 처리 장치는 스포크 노드의 크기 작은 순서대로 어레이(array)의 뒷 부분에 배열할 수 있다. 이 때, 압축 처리 장치는 스포크 노드가 연결되어 있던 허브 노드의 배열 순서를 고려하여 스포크 노드를 배열할 수 있다.
또한, 압축 처리 장치는 자이언트 커넥티드 컴퍼넌트 노드에서의 허브 노드를 결정하여 제거할 수 있다. 이에 따라, 압축 처리 장치는 자이언트 커넥티드 컴퍼넌트 노드를 스포크 노드로 분해할 수 있다. 압축 처리 장치는 분해한 스포크 노드의 크기, 및 연결되어 있던 허브 노드의 차수(또는 배열 순서, 제거 순서)를 고려하여 스포크 노드를 배열할 수 있다. 이에 따라, 압축 처리 장치는 노드가 재배열된 그래프를 압축할 수 있다.
도 2는 일실시예에 따른 압축 처리 방법에 따라 허브 노드를 제거하여 그래프 상의 노드를 재배열한 행렬을 도시한 도면이다.
도 2를 참조하면, 압축 처리 장치는 그래프에 압축 처리 방법을 적용하여 인접 행렬에 최대한 넌 제로 값이 모이도록 노드를 배열할 수 있다. 압축 처리 방법을 1회 수행한 후, 그래프 상에 존재하는 노드는 k-허브 노드 집합, 자이언트 커넥티드 컴퍼넌트 노드, 및 스포크 노드로 분해될 수 있다. 이 때, 스포크 노드는 오직 k-허브 노드와 연결되어 있으나, 자이언트 커넥티드 컴퍼넌트 노드와는 연결되어 있지 않을 수 있다. 이 때, 압축 처리 장치는 자이언트 커넥티드 컴퍼넌트 노드에 대해 동일한 압축 처리 방법을 적용할 수 있다. 이에 따라, 넌 제로 요소들은 행렬 내의 왼쪽, 위, 행렬의 대각선으로 집중될 수 있다. 도 2(c)에 도시된 바와 같이, 행렬 내에서의 넌 제로 요소들은 화살 모양의 형태로 배열될 수 있다. 또한, 그래프 상의 허브 노드를 제거하여 그래프 상의 노드를 재배열하는 압축 처리 방법을 반복적으로 수행함에 따라 행렬에서의 빈 공간은 더 커질 수 있다. 이에 따라, 압축 처리 장치는 더 좋은 압축률을 제공할 수 있다.
도 3은 일실시예에 따른 허브 노드를 제거하여 스포크 노드를 배열한 그래프의 압축 처리 방법을 도시한 도면이다.
이하에서 설명되는 단계들은 압축 처리 장치에 의해 수행될 수 있다. 단계(300)에서, 압축 처리 장치는 그래프 상에 존재하는 노드들의 차수를 이용하여 허브 노드를 추출할 수 있다.
구체적으로, 그래프는 노드로 구성될 수 있고, 노드 간에는 엣지로 연결될 수 있다. 이에 따라, 그래프는 노드와 엣지를 이용하여 행렬로 표현할 수 있다. 이 때, 그래프 상에서 인접하는 노드 간의 행렬은 인접 행렬에 대응할 수 있다. 인접하는 노드 간에는 차수가 높은 허브 노드가 존재할 수 있다. 허브 노드는 중앙 집중도가 높은 노드를 의미할 수 있다.
압축 처리 장치는 그래프 상에 존재하는 노드들의 차수를 계산할 수 있다. 이에 따라, 압축 처리 장치는 차수가 가장 높은 허브 노드를 추출할 수 있다. 단계(310)에서, 압축 처리 장치는 차수가 높은 순으로 허브 노드를 제거할 수 있다. 이 때, 허브 노드 간에 엣지에 의해 연결되어 있는 경우, 어느 하나의 허브 노드를 제거함에 따라 어느 하나의 허브 노드에 연결된 허브 노드들의 차수가 변화할 수 있다. 따라서, 압축 처리 장치는 변화하는 허브 노드들의 차수를 업데이트하여 허브 노드의 제거 순서를 결정할 수 있다.
단계(320)에서, 압축 처리 장치는 허브 노드를 제거함에 따라 발생하는 스포크 노드와 자이언트 커넥티드 컴퍼넌트 노드를 식별할 수 있다. 여기서, 스포크 노드와 자이언트 커넥티드 컴퍼넌트 노드는 제거한 허브 노드에 연결되어 있던 노드를 의미할 수 있다. 스포크 노드와 자이언트 커넥티드 컴퍼넌트 노드는 크기에 따라 분류될 수 있다. 스포크 노드는 넌-자이언트 커넥티드 컴퍼넌트 노드와 단일 노드(엣지로 다른 노드와 연결되어 있지 않은 노드)를 포함할 수 있다. 일례로, 압축 처리 장치는 넓이 우선 탐색(Breadth First Search, BFS) 방법을 이용하여 그래프 상에 존재하는 스포크 노드 및 자이언트-커넥티드 컴퍼넌트 노드를 식별할 수 있다.
압축 처리 장치는 식별한 자이언트 커넥티드 컴퍼넌트 노드를 분해하여 스포크 노드로 만들 수 있다. 예를 들어, 압축 처리 장치는 자이언트 커넥티드 컴퍼넌트 노드에서의 허브 노드를 결정할 수 있다. 그러면, 압축 처리 장치는 앞서의 방법과 같이 허브 노드를 제거함으로써, 자이언트 커넥티드 컴퍼넌트 노드를 분해할 수 있다. 이에 따라, 자이언트 커넥티드 컴퍼넌트 노드는 스포크 노드로 분해될 수 있다. 일례로, 압축 처리 장치는 자이언트 커넥티드 컴퍼넌트 노드에 포함된 노드의 개수가 제거한 허브 노드의 개수와 같거나 또는 제거한 허브 노드의 개수보다 작아질 때까지 자이언트 커넥티드 컴퍼넌트 노드 내에서의 허브 노드를 제거할 수 있다.
단계(330)에서, 압축 처리 장치는 스포크 노드를 배열할 수 있다. 구체적으로, 압축 처리 장치는 특정 영역에 넌 제로 값을 포함하는 노드들이 모이도록 스포크 노드를 배열할 수 있다.
압축 처리 장치는 스포크 노드의 크기 순으로 어레이에 배열할 수 있다. 또한, 압축 처리 장치는 스포크 노드의 크기와 스포크 노드가 연결되어 있었던 허브 노드의 차수를 고려하여 어레이에 배열할 수 있다. 예를 들어, 제1 스포크 노드와 제2 스포크 노드의 크기가 동일한 경우, 압축 처리 장치는 스포크 노드가 연결되어 있었던 허브 노드의 차수를 고려하여 어레이에 배열할 수 있다. 일례로, 제1 스포크 노드와 연결되어 있던 허브 노드의 차수가 제 2스포크 노드와 연결되어 있던 허브 노드의 차수보다 높은 경우, 압축 처리 장치는 제2 스포크 노드의 배열 순서를 제1 스포크 노드의 배열 순서보다 앞서게 설정할 수 있다.
도 4는 일실시예에 따른 허브 노드를 선택하는 방법 및 노드를 배열하는 방법을 도시한 도면이다.
그래프 G상에서의 k-허브 노드 집합은 그래프 G 상에서 중앙 집중도가 높은 순으로 뽑은 k개의 허브 노드를 구성 요소로 포함한 집합을 의미할 수 있다. 중앙 집중도 스코어(centrality score)와 같은, 압축 처리 장치는 노드의 차수를 이용하지만, 이와는 다른 방법(예를 들어, closeness, betweenness, PageRank, eigendrop)도 사용할 수 있다.
압축 처리 장치는 그래프 G 상에서 k-분해(k-shattering)를 이용하여 k-허브 노드 집합을 제거할 수 있다. k는 제거하고자 하는 허브 노드의 개수를 의미할 수 있다. 압축 처리 장치는 k-분해를 이용하여 그래프 상에서 존재하는 k-허브 노드 집합 내의 노드를 제거할 뿐만 아니라 k-허브 노드 집합 내의 노드들과 연결된 엣지를 제거할 수 있다. k-허브 노드 집합 내에 포함된 허브 노드를 제거함에 따라, 제거한 허브 노드에 연결되어 있던 커넥티드 컴퍼넌트 노드가 생성될 수 있다. 커넥티드 컴퍼넌트 노드는 크기에 따라 넌-자이언트 커넥티드 컴퍼넌트 노드와 자이언트 커넥티드 컴퍼넌트 노드로 분류할 수 있다.
압축 처리 장치는 그래프 G상에 존재하는 커넥티드 컴퍼넌트 노드 중에서 자이언트 커넥티드 컴퍼넌트 노드를 선택하여 반복적으로 k-분해를 수행할 수 있다. 구체적으로, 압축 처리 장치는 자이언트 커넥티드 컴퍼넌트 노드의 크기가 k보다 작거나 또는 같아질 때까지 수행할 수 있다
이하에서는 압축 처리 방법의 기본 원리를 설명한다.
이하에서 설명되는 압축 처리 방법은 슬래쉬번(slashburn) 방법을 의미할 수 있다. 압축 처리 방법은 그래프의 배열(permutation) π: V(그래프 상에서의 노드의 집합) → [n] 로 정의함으로써, 그래프 G의 인접 매트릭스 내에 있는 넌제로 요소(nonzero element)들이 함께 묶이도록 유도할 수 있다.
압축 처리 방법은 하기 표 1에 기재된 알고리즘 1에 의해 설명될 수 있다.
Figure 112014070992040-pat00003
도 4(b)는 압축 처리 방법을 통해 허브 노드의 제거 전의 노드들의 연경 상태, 및 허브 노드의 제거 후의 노드들의 연결 상태를 도시한 도면이다. 압축 처리 방법을 수행하여 중심에 존재하는 허브 노드를 제거한 후, 그래프의 존재하는 노드들은 자이언트 커넥티드 컴퍼넌트 노드와 스포크 노드로 분해될 수 있다. 도 4(b)에 도시된 바와 같이, 허브 노드는 가장 낮은 번호(1, 2)가 할당 될 수 있다(즉, 차수가 높을수록 낮은 번호가 할당될 수 있다. 이 때, 차수가 더 높은 허브 노드에 1번이 할당될 수 있다.). 허브 노드의 차수가 높다는 의미는 배열 순서가 빠르다는 의미일 수 있다. 또한, 차수가 높다는 의미는 제거 순서가 빠르다는 의미일 수 있다. 스포크 노드는 크기 순으로 번호가 설정될 수 있다. 압축 처리 장치는 번호 순으로 노드를 배열할 수 있다. 즉, 번호는 배열 순서를 의미할 수 있다.
도 4(b)의 가운데 그림을 참조하면, 압축 처리 장치는 분해된 자이언트 커넥티드 컴퍼넌트 노드 및 스포크 노드의 차수 크기를 이용하여 자이언트 커넥티드 컴퍼넌트 노드 및 스포크 노드에 번호를 할당할 수 있다. 도 4(b)의 오른쪽 그림을 참조하면, 압축 처리 장치는 차수 크기뿐만 아니라 스포크 노드들이 연결되어 있던 허브 노드의 번호를 고려하여 스포크 노드에 번호를 할당할 수 있다.
압축 처리 장치는 자이언트 커넥티드 컴퍼넌트 노드에 동일한 프로세스를 반복적으로 적용할 수 있다. 실제 그래프 상에서 매우 드문 케이스이지만, 만약 그래프 상에서 동일한 크기를 갖는 하나 이상의 자이언트 커넥티드 컴퍼넌트 노드가 존재한다면, 압축 처리 장치는 그 중에서 하나를 무작위로 선택하여 동일한 프로세스(k-분해)를 적용할 수 있다. 압축 처리 방법은 그래프 상에서 노드의 배열을 위해 도메인-특정 지식(domain-specific knowledge) 또는 자연 배열(well defined natural ordering)을 요구하지 않으면서 어떠한 거듭제곱 법칙(power-law) 그래프에서도 수행될 수 있다.
이하에서는 k-허브 노드 집합을 선택하는 방법에 대해서 설명한다.
Figure 112014070992040-pat00004
는 그래프 G 상에 존재하는 노드 중에서 i번째로 높은 차수의 노드를 의미할 수 있다.
Figure 112014070992040-pat00005
일 때,
Figure 112014070992040-pat00006
Figure 112014070992040-pat00007
에 해당하는 노드를 제거함에 따라 생성되는 그래프를 의미할 수 있다. k > 1일 때,
Figure 112014070992040-pat00008
Figure 112014070992040-pat00009
에서 더 이상 가장 차수가 높은 노드가 아닐 수 있다. 예를 들어 도 4(a)에 도시된 바와 같이
Figure 112014070992040-pat00010
에서,
Figure 112014070992040-pat00011
Figure 112014070992040-pat00012
에서 고립될 수 있다. k=6일 때, 1-5번 노드들이 제거되었다면, 6번 노드는 더 이상 차수가 가장 높은 노드가 아닐 수 있다. 그러나, 6번 노드는 원래 그래프 상에서 높은 차수를 가지고 있었기 때문에 k-허브 노드 집합에 포함될 수 있다.
압축 처리 장치는 허브 노드를 선택하여 제거할 때마다 각 허브 노드들의 차수를 업데이트할 수 있다. 즉, 압축 처리 장치는
Figure 112014070992040-pat00013
대신에 i번 째 허브 노드로
Figure 112014070992040-pat00014
를 선택할 수 있다. 다시 말하면, 압축 처리 장치는 k개의 허브 노드 사이의 연결을 고려할 수 있다. 구체적으로, 압축 처리 장치는 허브 노드를 선택할 때 차수가 가장 높은 노드부터 뽑으나, 허브 노드 하나를 뽑을 때마다 그 노드와 연결되어있는 노드들의 차수를 업데이트할 수 있다. 결과적으로, k개의 허브 노드 집합을 선택하는 것은
Figure 112014070992040-pat00015
으로 표현할 수 있다.
이하에서는 스포크 노드의 배열 방법에 대해 설명한다.
스포크 노드의 배열 방법으로써, 제1 실시예로, 압축 처리 장치는 크기-배열을 통해 스포크 노드를 배열할 수 있다. 예를 들어, 압축 처리 장치는 스포크 노드에 포함된 노드의 크기가 작은 것부터 어레이의 뒷 부분에 배열할 수 있다. 도 4(b)의 가운데 그림을 참조하면, 압축 처리 장치는 스포크 노드의 크기를 기준으로 스포크 노드를 배열할 수 있다. 일례로, 압축 처리 장치는 스포크 노드 중에서 가장 큰 노드에 대해 8-10번을 설정할 수 있다.
이 때, 압축 처리 장치는 스포크 노드에 포함된 노드의 크기와 스포크 노드가 분해되기 전에 연결되어 있던 허브 노드의 차수(또는 배열 순서)를 고려하여 스포크 노드를 어레이에 배열할 수 있다. 예를 들어, 도 4(b)의 오른쪽 그림을 참조하면, 분해되기 전에 연결되어 있던 허브 노드의 차수를 고려하여 스포크 노드의 배열 순서는 변화될 수 있다. 일례로, 도 4(b)에 가운데 그림에서 8-10번이 할당된 노드는 허브 노드의 차수를 고려하여 도 4(b)의 오른쪽 그림과 같이 14-16번으로 변경될 수 있다. 즉, 압축 처리 장치는 스포크 노드에 포함된 노드들의 크기를 기준으로 배열할 뿐만 아니라 허브 노드를 기준으로 정렬할 수 있다.
도 5는 일실시예에 따른 제거 순서에 따라 허브 노드를 제거하고, 허브 노드로부터 분해된 스포크 노드를 재배열함으로써 그래프 압축을 처리하는 그래프 압축 처리 방법을 도시한 도면이다.
단계(500)에서, 압축 처리 장치는 그래프 상에 존재하는 노드의 차수를 이용하여 추출한 허브 노드를 포함하는 허브 노드 집합을 생성할 수 있다. 허브 노드 집합은 복수의 허브 노드를 포함하는 집합을 의미할 수 있다. 예를 들어, 허브 노드 집합은 차수가 높은 순으로 추출한 k개의 허브 노드를 포함할 수 있다.
단계(510)에서, 압축 처리 장치는 허브 노드 집합 내에 포함된 허브 노드 간의 연결을 고려하여 허브 노드의 제거 순서를 계산할 수 있다. 예를 들어, 서로 다른 허브 노드가 연결되어 있을 때, 어느 하나의 허브 노드가 제거된다면 다른 허브 노드는 차수가 변화할 수 있다. 이에 따라, 압축 처리 장치는 허브 노드를 제거함에 따라 허브 노드 집합 내에 발생하는 차수 변화를 고려하여 제거 순서를 계산할 수 있다. 압축 처리 장치는 허브 노드의 차수가 높은 순으로 제거되도록 제거 순서를 계산할 수 있다.
단계(520)에서, 압축 처리 장치는 제거 순서에 따라 허브 노드 집합에 포함된 허브 노드를 제거할 수 있다. 이 때, 압축 처리 장치는 적어도 하나의 허브 노드를 제거할 수 있다. 일례로, 압축 처리 장치는 제거 순서에 따라 k-분해 프로세스를 통해 허브 노드를 제거할 뿐만 아니라 허브 노드와 연결된 엣지도 제거할 수 있다. 이에 따라, 허브 노드와 연결되어 있던 노드들은 제거된 허브 노드로부터 분해될 수 있다.
단계(530)에서, 압축 처리 장치는 허브 노드를 제거함에 따라 허브 노드로부터 분해된 스포크 노드의 배열 순서를 결정할 수 있다. 압축 처리 장치는 스포크 노드의 크기, 및 스포크 노드와 연결되어 있던 허브 노드의 차수 중 적어도 하나를 고려하여 스포크 노드의 배열 순서를 결정할 수 있다.
허브 노드로부터 분해된 노드는 스포크 노드와 자이언트-커넥티드 노드로 분류할 수 있다. 스포크 노드와 자이언트-커넥티드 노드는 크기에 따라 분류될 수 있다. 분류 기준은 알고리즘에 의해 설정되거나 또는 압축 처리 장치의 운영자에 의해 설정될 수 있다.
압축 처리 장치는 허브 노드로부터 분해된 자이언트 커넥티드 컴퍼넌트 노드를 분해하여 스포크 노드로 만들 수 있다. 예를 들어, 압축 처리 장치는 자이언트 커넥티드 컴퍼넌트 노드에서의 허브 노드를 결정할 수 있다. 그러면, 압축 처리 장치는 앞서의 방법과 같이 허브 노드를 제거함으로써, 자이언트 커넥티드 컴퍼넌트 노드를 분해할 수 있다. 즉, 압축 처리 장치는 그래프 상에서 허브 노드 집합을 추출하는 방법을 자이언트 커넥티드 컴퍼넌트 노드에 적용함으로써 자이언트 커넥티드 컴퍼넌트 노드를 분해할 수 있다.
단계(540)에서, 압축 처리 장치는 결정한 배열 순서에 따라 노드를 배열할 수 있다. 행렬은 넌 제로 값이 특정 영역에 최대한 몰려 있는 형태로 표현될 수 있다. 압축 처리 장치는 행렬을 블록 단위로 분할하여 압축할 수 있다.
본 발명의 실시 예에 따른 방법들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.

Claims (14)

  1. 그래프 상에 존재하는 노드들을 각 노드의 차수 순으로 정렬하여 상기 정렬된 노드들 중에서 차수가 높은 k개의 노드를 허브 노드로 추출하는 단계;
    상기 추출한 허브 노드가 엣지로 연결된 경우, 상기 엣지로 연결된 허브 노드 간의 차수 변화를 고려하여 차수가 높은 순으로 허브 노드를 제거하는 단계;
    상기 제거한 허브 노드로부터 분해되는 스포크(spoke) 노드를 식별하는 단계;
    상기 제거한 허브 노드의 차수를 고려하여 그래프 상에 상기 스포크 노드를 배열하는 단계; 및
    상기 스포크 노드를 배열한 그래프의 압축을 처리하는 단계;
    를 포함하는 그래프 압축 처리 방법.
  2. 제1항에 있어서,
    상기 제거하는 단계는,
    상기 추출한 허브 노드 중에서 어느 하나의 허브 노드를 제거할 경우, 상기 어느 하나의 허브 노드와 연결된 허브 노드의 차수 변화를 고려하여 허브 노드의 제거 순서를 결정하고, 상기 결정한 제거 순서를 기초로 허브 노드를 제거하는 그래프 압축 처리 방법.
  3. 제1항에 있어서,
    상기 배열하는 단계는,
    상기 제거한 허브 노드의 차수, 및 상기 스포크 노드의 크기를 고려하여 그래프 상에 상기 스포크 노드를 배열하는 그래프 압축 처리 방법.
  4. 제1항에 있어서,
    상기 식별하는 단계는,
    상기 제거한 허브 노드로부터 분해되는 스포크 노드와 자이언트 커넥티드 컴퍼넌트 노드(Giant Connected-Component, GCC)를 식별하고, 상기 자이언트 커넥티드 컴퍼넌트 노드 내에서의 허브 노드를 제거하는 단계
    를 더 포함하는 그래프 압축 처리 방법.
  5. 제1항에 있어서,
    상기 식별하는 단계는,
    상기 허브 노드로부터 분해되는 스포크 노드와 자이언트 커넥티드 컴퍼넌트 노드를 식별하고, 상기 자이언트 커넥티드 컴퍼넌트 노드 내의 노드의 개수가 상기 제거한 허브 노드의 개수보다 작거나 또는 동일할 때까지 상기 자이언트 커넥티드 컴퍼넌트 노드 내에서의 허브 노드를 제거하는 단계
    를 더 포함하는 그래프 압축 처리 방법.
  6. 그래프 상에 존재하는 노드의 차수를 이용하여 추출한 허브 노드를 포함하는 허브 노드 집합을 생성하는 단계;
    상기 허브 노드 집합에 포함된 허브 노드 간의 연결을 고려하여 허브 노드의 제거 순서를 계산하는 단계;
    상기 제거 순서에 따라 상기 허브 노드 집합에 포함된 허브 노드를 제거하는 단계;
    상기 제거한 허브 노드로부터 분해되는 스포크 노드의 배열 순서를 결정하는 단계; 및
    상기 배열 순서에 따라 스포크 노드를 배열한 그래프의 압축을 처리하는 단계
    를 포함하는 그래프 압축 처리 방법.
  7. 제6항에 있어서,
    상기 계산하는 단계는,
    상기 허브 노드 집합에 포함된 어느 하나의 허브 노드를 제거하는 경우, 상기 어느 하나의 허브 노드와 연결된 허브 노드의 차수 변화를 고려하여 허브 노드의 제거 순서를 계산하는 그래프 압축 처리 방법.
  8. 제6항에 있어서,
    상기 계산하는 단계는,
    상기 허브 노드 집합에 포함된 허브 노드 간의 연결, 및 허브 노드의 차수를 고려하여 허브 노드의 제거 순서를 계산하는 그래프 압축 처리 방법.
  9. 제6항에 있어서,
    상기 결정하는 단계는,
    상기 제거한 허브 노드로부터 분해되는 스포크 노드와 자이언트 커넥티드 컴퍼넌트 노드를 식별하고, 상기 자이언트 커넥티드 컴퍼넌트 노드 내에서의 허브 노드를 제거하는 단계
    를 더 포함하는 그래프 압축 처리 방법.
  10. 제6항에 있어서,
    상기 결정하는 단계는,
    상기 제거한 허브 노드로부터 분해되는 스포크 노드와 자이언트 커넥티드 컴퍼넌트 노드를 식별하고, 상기 자이언트 커넥티드 컴퍼넌트 노드 내의 노드의 개수가 상기 제거한 허브 노드의 개수보다 작거나 또는 동일할 때까지 상기 자이언트 커넥티드 컴퍼넌트 노드 내에서의 허브 노드를 제거하는 단계
    를 더 포함하는 그래프 압축 처리 방법.
  11. 그래프 상에 존재하는 노드들을 각 노드의 차수 순으로 정렬하여 상기 정렬된 노드들 중에서 차수가 높은 k개의 노드를 허브 노드로 추출하는 추출부;
    상기 추출한 허브 노드가 엣지로 연결된 경우, 상기 엣지로 연결된 허브 노드 간의 차수 변화를 고려하여 차수가 높은 순으로 허브 노드를 제거하는 제거부;
    상기 제거한 허브 노드로부터 분해되는 스포크(spoke) 노드를 식별하는 식별부;
    상기 제거한 허브 노드의 차수를 고려하여 상기 스포크 노드를 배열하는 배열부; 및
    상기 스포크 노드를 배열한 그래프의 압축을 처리하는 처리부;
    를 포함하는 그래프 압축 처리 장치.
  12. 제11항에 있어서,
    상기 제거부는,
    상기 추출한 허브 노드 중에서 어느 하나의 허브 노드를 제거할 경우, 상기 어느 하나의 허브 노드와 연결된 허브 노드의 차수 변화를 고려하여 허브 노드의 제거 순서를 결정하고, 상기 결정한 제거 순서를 기초로 허브 노드를 제거하는 그래프 압축 처리 장치.
  13. 그래프 상에 존재하는 노드의 차수를 이용하여 추출한 허브 노드를 포함하는 허브 노드 집합을 생성하는 생성부;
    상기 허브 노드 집합에 포함된 허브 노드 간의 연결을 고려하여 허브 노드의 제거 순서를 계산하는 계산부;
    상기 제거 순서에 따라 상기 허브 노드 집합에 포함된 허브 노드를 제거하는 제거부;
    상기 제거한 허브 노드로부터 분해되는 스포크 노드의 배열 순서를 결정하는 결정부; 및
    상기 배열 순서에 따라 스포크 노드를 배열한 그래프의 압축을 처리하는 처리부
    를 포함하는 그래프 압축 처리 장치.
  14. 제13항에 있어서,
    상기 계산부는,
    상기 허브 노드 집합에 포함된 어느 하나의 허브 노드를 제거하는 경우, 상기 어느 하나의 허브 노드와 연결된 허브 노드의 차수 변화를 고려하여 허브 노드의 제거 순서를 계산하는 그래프 압축 처리 장치.
KR1020140095667A 2014-04-30 2014-07-28 그래프 압축 처리 방법 및 장치 KR101660584B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20140052401 2014-04-30
KR1020140052401 2014-04-30

Publications (2)

Publication Number Publication Date
KR20150125511A KR20150125511A (ko) 2015-11-09
KR101660584B1 true KR101660584B1 (ko) 2016-09-27

Family

ID=54605007

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140095667A KR101660584B1 (ko) 2014-04-30 2014-07-28 그래프 압축 처리 방법 및 장치

Country Status (1)

Country Link
KR (1) KR101660584B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101872241B1 (ko) * 2017-03-24 2018-06-28 경희대학교 산학협력단 정보를 압축하는 방법, 장치 및 컴퓨터 프로그램
KR102009216B1 (ko) * 2018-05-14 2019-08-09 경희대학교 산학협력단 그래프 요약 및 압축 방법 및 시스템
KR102115372B1 (ko) 2019-11-08 2020-05-27 한국인터넷진흥원 그래프 데이터 축약 방법 및 그 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012198873A (ja) 2011-03-22 2012-10-18 Nec (China) Co Ltd データセットからの情報取得方法およびシステム
JP2013156698A (ja) 2012-01-26 2013-08-15 Nippon Telegr & Teleph Corp <Ntt> クラスタリング装置及び方法及びプログラム
JP2013196201A (ja) 2012-03-16 2013-09-30 Nippon Telegr & Teleph Corp <Ntt> 類似ノード検索装置及び方法及びプログラム
JP2013257874A (ja) 2012-06-11 2013-12-26 Fujitsu Ltd 調整処理を実行する方法、制御部、プログラム及びデータ記憶システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012198873A (ja) 2011-03-22 2012-10-18 Nec (China) Co Ltd データセットからの情報取得方法およびシステム
JP2013156698A (ja) 2012-01-26 2013-08-15 Nippon Telegr & Teleph Corp <Ntt> クラスタリング装置及び方法及びプログラム
JP2013196201A (ja) 2012-03-16 2013-09-30 Nippon Telegr & Teleph Corp <Ntt> 類似ノード検索装置及び方法及びプログラム
JP2013257874A (ja) 2012-06-11 2013-12-26 Fujitsu Ltd 調整処理を実行する方法、制御部、プログラム及びデータ記憶システム

Also Published As

Publication number Publication date
KR20150125511A (ko) 2015-11-09

Similar Documents

Publication Publication Date Title
EP3490153B1 (en) Data compression coding method, device therefor, and program therefor
TW201303635A (zh) 應用圖形稽碼機制之認證方法與系統
KR101696338B1 (ko) 컬럼-인덱스 데이터 포맷을 이용하여 빅데이터를 효율적으로 처리 및 분석하는 시스템 및 방법
KR101660584B1 (ko) 그래프 압축 처리 방법 및 장치
CN103309975B (zh) 一种重复数据删除方法和设备
JP6681313B2 (ja) データを符号化するための方法、コンピュータ・プログラムおよびシステム
CN114330714B (zh) 卷积神经网络剪枝优化方法、装置、电子设备及存储介质
KR102018445B1 (ko) 캐스캐이딩 스타일 시트 파일들의 압축
CN105763886A (zh) 一种分布式转码方法和装置
US20240078330A1 (en) A method and system for lossy compression of log files of data
KR102352036B1 (ko) 확률적 경사 하강법을 이용한 변수 선택 장치 및 방법
KR101842420B1 (ko) 정보 처리 장치 및 데이터 관리 방법
JP5600693B2 (ja) クラスタリング装置及び方法及びプログラム
CN110209656B (zh) 数据处理方法及装置
KR102404982B1 (ko) 엘라스틱 넷 회귀를 이용한 변수 선택 장치 및 방법
KR101815968B1 (ko) 그룹 분리 기능을 제공하기 위한 악성코드 분류 시스템 및 그 방법
KR102404907B1 (ko) 라소를 이용한 변수 선택 장치 및 방법
KR102271261B1 (ko) 호출되는 함수를 그룹화하여 악성코드를 분류하는 악성코드 분류 장치, 방법 및 이를 수행하기 위한 프로그램을 기록한 기록매체
KR102404983B1 (ko) 릿지 회귀를 이용한 변수 선택 장치 및 방법
CN104967906A (zh) 一种随机播放方法及装置
Gulati et al. Efficiency Enhancement of Machine Learning Approaches through the Impact of Preprocessing Techniques
KR102480450B1 (ko) 데이터 압축 전송 방법 및 그 장치
CN116451771B (zh) 图像分类卷积神经网络压缩方法及芯粒器件数据分配方法
CN112990246B (zh) 孤立树模型建立的方法和装置
CN112541057A (zh) 分布式新词发现方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190826

Year of fee payment: 4