KR20110131094A - 정보 네트워크 내의 커뮤니티를 식별하는 방법 및 시스템 - Google Patents

정보 네트워크 내의 커뮤니티를 식별하는 방법 및 시스템 Download PDF

Info

Publication number
KR20110131094A
KR20110131094A KR1020110047316A KR20110047316A KR20110131094A KR 20110131094 A KR20110131094 A KR 20110131094A KR 1020110047316 A KR1020110047316 A KR 1020110047316A KR 20110047316 A KR20110047316 A KR 20110047316A KR 20110131094 A KR20110131094 A KR 20110131094A
Authority
KR
South Korea
Prior art keywords
nodes
node
patterns
information network
network
Prior art date
Application number
KR1020110047316A
Other languages
English (en)
Inventor
라제쉬 람크리쉬나 볼데위커
챠루 씨. 아갈왈
Original Assignee
인터내셔널 비지네스 머신즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인터내셔널 비지네스 머신즈 코포레이션 filed Critical 인터내셔널 비지네스 머신즈 코포레이션
Publication of KR20110131094A publication Critical patent/KR20110131094A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/30Scenes; Scene-specific elements in albums, collections or shared content, e.g. social network photos or video
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing
    • G06F11/263Generation of test inputs, e.g. test vectors, patterns or sequences ; with adaptation of the tested hardware for testability with external testers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/173Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/173Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
    • G06F15/17337Direct connection machines, e.g. completely connected computers, point to point communication networks
    • G06F15/17343Direct connection machines, e.g. completely connected computers, point to point communication networks wherein the interconnection is dynamically configurable, e.g. having loosely coupled nearest neighbor architecture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/322Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2323Non-hierarchical techniques based on graph theory, e.g. minimum spanning trees [MST] or graph cuts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Abstract

본 발명은 정보 네트워크 내의 하나 또는 그 이상의 커뮤니티들을 식별하는 기술들을 제공한다. 상기 기술들은 정보 네트워크로부터 하나 또는 그 이상의 노드들 및 하나 또는 그 이상의 엣지들을 수집하는 단계, 하나 또는 그 이상의 노드들의 시퀀스를 생성하도록 상기 하나 또는 그 이상의 노드들 상에 랜덤 워크를 수행하는 단계, 랜덤 워크를 통하여 생성된 하나 또는 그 이상의 시퀀스들로부터 시퀀스 데이터베이스를 생성하는 단계, 및 네트워크 내에 하나 또는 그 이상의 패턴들을 결정하도록 상기 시퀀스 데이터베이스를 마이닝하는 단계를 포함하되, 상기 하나 또는 그 이상의 패턴들은 상기 정보 네트워크 내에 하나 또는 그 이상의 커뮤니티들을 식별한다.

Description

정보 네트워크 내의 커뮤니티를 식별하는 방법 및 시스템{IDENTIFYING COMMUNITIES IN AN INFORMATION NETWORK}
본 발명의 실시 예들은 일반적으로 정보 기술에 관한 것이고, 더 상세하게는 네트워크 분석으로 커뮤니티를 탐지하는 것에 관한 것이다.
커뮤니티 탐지의 문제는 사회 및 정보 네트워크 분석분야에서 널리알려져 있다. 커뮤니티 탐지에 대한 기존의 많은 접근법들은 기본 네트워크(underlying network)내의 밀집 그래프들(dense graphs)을 정하는 것이었다. 본 명세서에서, 커뮤니티는, 하나의 예로서, 엣지(edge)들에 의해 밀집하게(densely) 연결된 노드들의 그룹을 말한다. 그래프들로 커뮤니티 탐지를 하는 기존의 많은 접근법들에는, 예를 들면, 슁글링(Shingling) 기술들, 매트릭스 코 클러스터링(matrix co-clustering) 기술들, 및 매트릭스들 내의 타일 결정(tile determination in matrices)을 사용하여 그래프들에 대해 노드 클러스터링(node clustering)하는 알고리즘들이 포함될 수 있다. 소셜 네트워크들 내에서 커뮤니티 탐지의 문제는 또한, 소셜 네트워킹 어플레이션들의 중요성이 증가함에 따라 점점 더 주목 받게 되었다(prominent). 하지만, 어떠한 기술도 산재된(sparse) 커뮤니티들의 결정에 관한 문제를 해결하도록 설계된 경우는 없었다.
본 발명의 원리들 및 실시 예들은 정보 네트워크 내의 커뮤니티들을 식별하는 것에 관한 기술들을 제공한다. 본 발명의 제1 목적은, 정보 네트워크 내에서 하나 또는 그 이상의 커뮤니티들을 식별하는 예시적 방법(컴퓨터에 의하여 구현 가능함)을 제공하는 것이며, 상기 방법은, 정보 네트워크로부터 하나 또는 그 이상의 노드들 및 하나 또는 그 이상의 엣지들을 수집하는 단계, 하나 또는 그 이상의 노드들의 시퀀스를 생성하도록 상기 하나 또는 그 이상의 노드들 상에 랜덤 워크(random walk)를 수행하는 단계, 랜덤 워크를 통해 생성된 하나 또는 그 이상의 시퀀스들로부터 시퀀스 데이터베이스를 생성하는 단계; 및 상기 네트워크 내의 하나 또는 그 이상의 패턴들을 결정하도록 상기 시퀀스 데이터베이스를 마이닝(mining)하는 단계 -상기 하나 또는 그 이상의 패턴들은 상기 정보 네트워크 내의 하나 또는 그 이상의 커뮤니티들을 식별함- 를 포함 할 수 있다.
본 발명의 하나 또는 그 이상의 실시 예들 또는 그들의 구성요소들은 상기 방법에서 예시한 단계들을 수행하기 위한 컴퓨터 사용 가능 프로그램 코드를 갖는 유형의(tangible) 컴퓨터 읽기 가능 스토리지 매체를 포함하는 컴퓨터 제품의 형태로 구현될 수 있다. 또한, 본 발명의 하나 또는 그 이상의 실시 예들 또는 그들의 구성요소들은 상기 방법에서 예시적 단계들을 수행하도록 동작하는 메모리 및, 상기 메모리에 결합된 적어도 하나의 프로세서를 포함하는 장치의 형태로 구현될 수 있다. 또한, 본 발명의 다른 목적은, 본 발명의 하나 또는 그 이상의 실시 예들 또는 그들의 구성요소들을 전술한 방법에서 하나 또는 그 이상의 단계들을 수행하는 수단들의 형태로 구현될 수 있게 하는 것이며, 상기 단계들을 수행하는 수단들은 (i)하드웨어 모듈(들), (ii)소프트웨어 모듈(들), 또는 (iii)하드웨어 및 소프트웨어 모듈들의 조합을 포함하되 ; 상기 (i) (iii) 중 어느 하나는 전술한 특정 기술들 실행하고, 상기 소프트웨어 모듈들은 유형의 컴퓨터 읽기 가능 스토리지 매체(또는 다수의 그러한 매체)에 저장된다.
본 발명의 이들 및 다른 목적들, 특징들 및 이점들은 이하 첨부되는 도면들을 참조하여 예시적인 실시 예들로 상세하게 설명되어 명확하게 이해 될 것이다.
도 1은 본 발명의 실시 예에 따른 예시적인 다이어그램 구조를 도시한다.
도 2는 본 발명의 실시 예에 따른 정보 네트워크 내의 산재된 커뮤니티를 결정하는 기술들의 플로우 다이어그램을 도시한다.
도 3은 본 발명의 실시 예에 따른 정보 네트워크의 상기 노드들 및 엣지들을 수집하는 기술들의 플로우 다이어그램을 도시한다.
도 4는 본 발명의 실시 예에 따른 샘플된 노드들로부터 시퀀스 데이터베이스를 생성하는 기술들의 플로우 다이어그램을 도시한다.
도 5는 본 발명의 실시 예에 따른 시퀀스 데이터베이스를 마이닝하는 기술들의 플로우 다이어그램을 도시한다.
도 6은 본 발명의 실시 예에 따른 정보 네트워크 내의 하나 또는 그 이상의 커뮤니티들을 식별하는 기술들의 플로우 다이어그램을 도시한다.
도 7은 적어도 하나의 본 발명의 실시 예가 구현될 수 있는 전형적인 컴퓨터 시스템의 시스템 다이어그램을 도시한다.
본 발명의 원리들은 정보 네트워크 내의 산재된 커뮤니티들을 식별하는 것을 포함한다. 본 발명의 하나 또는 그 이상의 실시 예들은 대규모 소셜 네트워크들 내의 숨겨진(hidden) 혹은 감춰진(surprising) 커뮤니티들을 확인하는(determine) 것(예를 들면 랜덤 워크 접근을 통하여)을 포함하는데, 이는 이하에서 상세히 기술된다. 그러한 커뮤니티들은 그들의 연결 수준과 비교하여 상대적으로 적은 엣지들을 사용하는 그래프의 고도로 연결된(highly connected) 영역들로 정의될 수 있다. 많은 숨겨진 커뮤니티들(예를 들면, 대립 네트워크들, 새로이 형성되는 커뮤니티들, 광범위하게 계획된 커뮤니티들 등)의 형태들은 그러한 기준으로 정렬될 수 있다.
예를 들면, 소셜 네트워크는 그래프로 표현될 수 있는데, 상기 그래프에서 노드들은 유저들을 나타내고, 링크들은 유저들간의 연결을 나타낸다. 커뮤니티 탐지는, 상기 기본 네트워크들(underlying network) 내의 밀집 영역을 결정하는 것을 포함하는, 네트워크 클러스터링과 밀접하게 관련된다. 통상적으로 그러한 밀집 영역들은 대규모 네트워크들 내의 커뮤니티 탐지 문제(challenge)와 관련되는데, 그 이유는 대부분의 커뮤니티들이 참가자들간에 높은 수준의 상호작용을 갖기 때문이다.
예를 들면, 커뮤니티들은 엣지-밀도(edge-density)보다 연결성에 기초하여 정의될 수 있다. 또한 대부분의 밀집한 그래프들은 고도로(higly) 연결되는 경향이 있다. 하지만 그렇지 않은 몇몇 케이스들이 존재하는데, 특히 커뮤니티들이 신중한 글로벌 계획(careful global planning)의 결과로서 조직된 경우에 그러하다. 또한, 이것은 커뮤니티들이 숨겨지는 가장 흥미로운 케이스들이 될 수 있고, 밀집 그래프 결정 알고리즘으로도 쉽게 결정될 수 없다. 그러한 시나리오들의 예들은 대립 네트워크들(adversarial networks) 내의 커뮤니티 결정, 네트워크 내의 커뮤니티들의 조기 결정, 및 글로벌 계획된 커뮤니티들을 포함할 수 있다.
하나의 가능한 전략으로 기본 네트워크 내의 상기 커뮤니티들을 결정하기 위해 직접 설계하는 연결성-기반의 접근 방식을 포함 할 수 있었다. 하지만, 이 접근 방식도, 또한, 그렇게 효과적이지 못할 수 있는데, 이는 고도로 연결된 영역들(highly connected regions)도 또한 밀집되려는(dense) 경향이 있고; 그 결과 그러한 알고리즘은 별로 흥미롭지 않은 밀집 커뮤니티들만 출력(output)으로 내어 놓을 수 있기(overwhelmed) 때문이다. 그래서 고도로 연결되었지만 산재된 네트워크의 영역들에 대하여 통찰력(insights)을 제공하는 기술들이 필요하다. 그러한 영역들은 찾기가 어려울 수 있는데, 그 이유는 네트워크의 많은 밀집 영역들에 의해 마스크된 고도로 연결된 구조들을 찾는 것과 동일 문제를 갖고 있기 때문이다. 게다가, 소셜 네트워크들의 대규모 크기는 조합의 관점(combinatorial perspective)에서 작업을 더욱 더 어렵게 만들 수 있다.
따라서, 본 발명의 하나 또는 그 이상의 실시 예들은 정보 네트워크 내의 산재된 커뮤니티들을 결정하는 것을 포함한다. 많은 실제 어플리케이션들에서, 그러한 산재된 커뮤니티들은 정보 네트워크 내의 클러스터들에 의해 마스크된다(masked). 산재된 커뮤니티들은 적은 수의 엣지들의 대가로 높은 높은 연결성을 갖는 커뮤니티들로 정의될 수 있다.
본 발명의 하나 또는 그 이상의 실시 예들은, 숨겨진 커뮤니티 결정 및 익스팬더(expander) 그래프들의 개념 사이에서 연결성을 조사하여, 대규모 그래프들 내에 숨겨진 커뮤니티들의 결정을 위한 디스크-민감(disk-sensitive) 알고리즘을 제공한다.
익스팬더 그래프들은, 비용이 너무 비싸 설계를 못할 만큼 밀집하지 않는, 튼튼하고 고도로 연결된(robust and highly connected) 네트워크들을 생성하기 위하여, 대규모 커뮤니케이션 네트워크의 설계에 주로 사용된다.
이와 유사한 개념은, 서치가, 미리 정의된 네트워크 상에서 익스팬더 특성들(expander properties)를 만족하는, 버텍스-서브세트 유도 서브 그래프들(vertex-subset induced sub-graphs)의 결정을 위한 것이라는 점을 제외하고는, 커뮤니티 탐지의 경우에도 관련된다.
통상적인 소셜 네트워크들은 아주 대규모라서, 이들 특성들을 만족시키는 대단히 많은(an exponential number of) 버텍스 서브셋들이 존재할 수 있다. 그러므로, 출력 크기 및 프로세싱의 복잡성을 더 감소시키기 위해서 최대 익스팬더 그래프들을 결정하는 데는 신중을 기해야한다. 주어진 시간에 주 메모리 내에 네트워크 데이터를 유지하기에는 데이터가 너무 클 수 있기 때문에 디스크 상주(Disk-resident) 알고리즘을 설계할 수 있는 것이 또한 유리하다. 이것은, 엣지 접근 순서가 임의로 정해지는 경향이 있는, 익스팬더 그래프 디스카버리와 같은 고유의 조합문제(inherently combinatorial problem)에 관해서는 특히 도전적이다. 그러한 임의의 엣지 접근들은 앨고리즘 설계에서의 도전들을 초래할 수 있는데, 특히 입력 데이터가 디스크- 상주일 경우 그러하다. 따라서, 본 발명의 하나 또는 그 이상의 실시 예들은, 신중히 설계된 디스크-민감 기술들을 사용하여 그러한 숨겨진 커뮤니티들을 결정하는 것에 관한 효율적인 알고리즘을 제공한다. 그러한 접근 방식은 밀집한(desnse) 서브 그래프들을 결정하는 기존의 기술들 보다 더 통찰력 있고(insightful), 또한 대규모 네트워크들에 대해서 높은 수준의 효율성을 유지하게 한다.
도 1은 본 발명의 실시 예에 따른 예시적 다이어그램 구조를 도시한다. 도면을 보면, 도 1은 디스크(110), 주 메모리(120) 및 중앙처리유닛(CPU)(130)을 포함하는 서버(100)상에 연산이 수행되는 것을 도시한다. 도 1에 도시된 것처럼, 상기 입력 (140)은 노드들 및 엣지들을 가진 네트워크이고, 상기 출력 (150)은 마이닝 프로세스에 의해 결정된 커뮤니티들의 세트이다. 추가적으로, 상기 입력은 예를 들면 도 3에 도시된 것처럼, 크롤링(crawling) 접근 방식을 사용하여 구성될 수 있다.
또한, 본 발명의 하나 또는 그 이상의 실시 예들은 CPU(예를 들면, 도 1의 CPU(130)) 상에 실행되는 알고리즘들(마이닝 프로세스에 사용됨)을 포함하며, 이하에서 상세히 설명한다. 또한 도 1에 도시된 것처럼, CPU(130)는 노드 데이터 구조 모듈(132), 엣지 데이터 구조 모듈(134), 및 경로 데이터 구조 모듈(136)과 같은 독립의 소프트웨어 모듈들을 포함 할 수 있다. 상기 네트워크(예를 들면, 도 3에 도시된 프로세스를 거쳐 크롤링된 것처럼)에 관한 모든 데이터는 디스크(예를 들면 도 1의 디스크(110)) 상에 저장된다. 또한, 주 메모리(예를 들면, 도 1의 주 메모리(120))는 중간 연산들에 사용될 수 있다.
도 2는 본 발명의 실시 예에 따른 정보 네트워크 내의 산재된 커뮤니티들을 결정하는 것에 관한 기술들의 플로우 다이어그램을 도시한다. 단계(200)는 프로세스를 시작하는 것을 포함한다. 단계(210)는 상기 정보 네트워크로부터 상기 노드들 및 엣지들을 수집하는 것을 포함한다. 이 단계는 도 3과 관련하여 추가적으로 상세히 설명된다. 단계(220)는 상기 샘플된 노드로부터 랜드워크를 시작하는 수행을 포함한다. 여기서, 랜덤 워크는 하나의 프로세서인데, 이 프로세스에 의해서 특정 노드(a given node)가 시작점으로 선택되고 그 다음 노드들이 트래버스(traversal) 프로세스를 위해 임의로 선택된다. 이 랜덤 워크는, 상기 워크의 출력을 형성하는 노드들의 시퀀스 샘플을 제공하고, 시퀀스 데이터베이스를 생성하도록 사용될 수 있다. 단계(220)는 도 4와 관련하여 추가적으로 설명된다.
단계(230)는, 상기 데이터베이스에 시퀀스들을 추가함으로써 샘플된 랜덤 워크들로부터 시퀀스 데이터베이스를 생성하는 것을 포함한다. 단계(240)는 상기 네트워크 내에서 관련 패턴들을 결정하도록 시퀀스 데이터베이스를 마이닝 하는 것을 포함한다. 이 단계는 도 5와 관련하여 추가적으로 상세히 설명된다. 또한, 단계(250)는 상기 프로세스를 종료하는 것을 포함한다.
도 3은 본 발명의 실시 예에 따른, 정보 네트워크의 상기 노드들 및 엣지들을 수집하는 기술들의 플로우 다이어그램을 도시한다. 또한, 도 3에 도시된 상기 단계들은 도 2 단계(210)의 상세한 설명이 될 수 있다.
도 3은 정보 프로세스의 상기 구조를 크롤링하는 프로세스를 도시한다. 예를 들면, 크롤링 프로세스는 정보 네트워크의 구조를 인터넷으로부터 다운로딩함에 의해서 접근하고 저장하는 기술을 말한다. 이 크롤링을 성공적으로 수행하기 위해서, 연결 구조는 중요한 역할을 한다. 본 발명의 하나 또는 그 이상의 실시 예들은 회귀적으로(recursively) 링크들을 추적하는 것을 포함하고 (그렇게 하여) 정보 네트워크 내의 노드들을 크롤한다(crawl).
도 3에 도시된 것처럼, 단계(300)는 상기 프로세스를 시작하는 것을 포함한다. 단계(310)는 노드 및 그것에 인접한 모든 엣지들을 크롤 한다. 단계(320)는 인접한 엣지들과 연결된 상기 모든 노드들을 크롤하는 것을 포함한다. 본 발명의 하나 또는 그 이상의 실시 예들에 있어서, 상기 정보 네트워크 내에 크롤될 노드가 남지 않을 때까지 이 프로세스는 회귀적으로 반복될 수 있다.
도 4는 본 발명의 실시 예에 따른, 샘플된 노드들로부터 시퀀스 데이터베이스를 생성하는 기술들의 플로우 다이어그램을 도시한다. 또한, 도 4에 도시된 상기 단계들은 도 2 단계(220)의 상세한 설명으로 고려될 수 있다. 도 4는 상기 정보 네트워크로부터 시퀀스 데이터베이스를 생성하는 프로세스를 도시한다.
시퀀스 데이터베이스는, 관련 커뮤니티들을 결정하기 위해서 마이닝될 수 있는 유용한 중간 표현(useful intermediate representation)을 제공하며, 이는 이하에서(예를 들면, 도 5와 관련하여) 상세히 설명한다. 상기 시퀀스들은 상기 크롤된 네트워크 내에 있는 랜덤 워크들의 샘플들을 포함할 수 있다. 예를 들면, 상기 샘플링은 임의로 한 노드를 선택하고, 임의적인 순서로 다른 노드들을 따라가는 방법으로 수행될 수 있다.
따라서, 단계(400)는 샘플된 노드들의 시퀀스들을 결정하는 것을 포함한다. 단계(410)는 임의로 한 노드를 샘플링하고 임의의 인접한 노드들로 트래버스하는 것을 포함한다. 본 발명의 하나 또는 그 이상의 실시 예들은, 상기 노드들의 이 순서를 이용함으로써, 상기 시퀀스 데이터베이스로부터 하나의 시퀀스를 생성하는 것을 포함 할 수 있다. 또한, 이 단계는, 단계(420)에 설명된 것과 같이, 다수의 샘플들을 보유하는 데이터베이스를 생성하기 위해서 반복 될 수 있다. 이 샘플들은 상기 마이닝 프로세스에 사용될 수 있고, 또한, 단계(430)는 상기 프로세스를 종료하는 것을 포함한다.
도 5는 본 발명의 실시 예에 따른, 시퀀스 데이터베이스를 마이닝하는 기술들의 플로우 다이어그램을 도시한다. 또한, 도 5에 도시된 상기 단계들은 도 2 단계(230)의 상세한 설명으로 고려될 수 있다. 도 5는 구성된 시퀀스 데이터베이스로부터 커뮤니티들을 마이닝하는 프로세스를 도시한다.
단계(500)는 상기 프로세스를 시작하는 것을 포함한다. 단계(510)는 상기 시퀀스 데이터베이스로부터 빈번한 패턴들을 마이닝하도록 패턴 마이닝 알고리즘(예를 들면, 빈발 패턴 마이닝 알고리즘(frequent pattern mining algorithm))을 사용하는 것을 포함한다. 본 발명의 하나 또는 그 이상의 실시 예들에서, 이 단계는 후보 커뮤니티들의 리스트를 제공한다. 또한, 예를 들면, 상기 시퀀스 데이터베이스를 생성하기 위한 상기 랜덤 워크 접근 방식은, 상기 시퀀스 데이터베이스내의 빈번한 패턴들이 통상적으로 높은 컨덕턴스(conductance)를 갖는 패턴들임을 보장 한다. 높은 컨덕턴스 패턴들은, 적은 수의 엣지들을 댓가로 고도의 연결성을 갖는 노드들의 세트들에 의해 정의된다. 예를 들면, 컨덕턴스는 노드 세트 내 엣지들의 총 수에 대하여 노드 세트의 임의의 분할(any partition) 사이 엣지들의 최소 수의 비율로 정의될 수 있다.
하지만, 이들 중 몇몇의 패턴들은 거짓 긍정들이 될 수 있고, 그러한 거짓 긍정들은 원본(original) 데이터베이스(즉, 상기 정보/크롤된 네트워크)와 비교하여 체크되고, 제거되는 것이 필요하다. 그러므로 본 발명의 하나 또는 그 이상의 실시 예들은, 상기 원본 데이터베이스로 되돌아 가 마인된(mined) 패턴들이 상기 컨덕턴스 제한을 만족하는지를 결정하는 것을 포함한다. 본 발명의 하나 또는 그 이상의 실시 예들은, 상기 컨덕턴스가 최소의 미리 정의된 유저 임계값 이상인지를 결정하는 것을 포함한다. 상기 컨덕턴스 제한을 만족하지 않는 패턴들은 제거된다. 도 5에서 도시된 것처럼, 전술한 내용은 단계(520)를 통하여 달성되고, 상기 남아있은 패턴들은 관련 커뮤니티들로 보고된다. 그 다음, 단계(530)는 상기 프로세스를 종료하는 것을 포함한다.
지금까지 설명된 것처럼, 본 발명의 하나 또는 그 이상의 실시 예들은 정보 네트워크들 내의 산재된 커뮤니티들을 결정하는 것을 포함한다. 예를 들면, 랜덤 워크 개념은 데이터 내에서 가장 관련성이 있는 패턴들을 결정하도록 사용될 수 있으며, 그리고 이들 랜덤 워크들은 상기 빈번한 패턴들을 결정하기 위해, 후속적으로(subsequently) 마인되는 시퀀스 데이터베이스를 생성하도록 사용될 수 있다. 여기서 설명된, 이들은 상기 정보 네트워크 내의 산재된 커뮤니티로 고려될 수 있다. 랜덤 워크 접근 방식의 사용은, 높은 수준의 믹싱(mixing)을 갖는 커뮤니티를 결정하는 능력을 갖게 한다.
또한, 그러한 커뮤니티들의 결정은, 진짜(true) 커뮤니티들이 네트워크 내의 다른 더 밀집한 커뮤니티들에 의해서 마스크되는 다양한 어플리케이션들에 관하여 유용할 수 있다.
예를 들면, 대립 구도(adversarial settings)로 생성된 커뮤니티들은 그러한 특성들을 가질 수 있는데, 즉, 적은 수의 엣지들을 사용하여 고도로 연결된 커뮤니티가 형성된다. 그러한 커뮤니티들은 정의에 의하여 작은 컨덕턴스를 갖는다.
도 6은 본 발명의 실시 예에 따른, 정보 네트워크 내의 하나 또는 그 이상의 커뮤니티들을 식별하는 기술들에 관한 플로우 다이어그램을 도시한다. 단계(602)는 정보 네트워크로부터, 하나 또는 그 이상의 노드들 및 하나 또는 그 이상의 엣지들을 수집하는 것을 포함한다. 정보 네트워크로부터 노드들 및 엣지들을 수집하는 것은 노드 및 상기 노드에 대응하는 인접 엣지들 각각을 크롤링하는 것을 포함할 뿐만 아니라, 예를 들어, 상기 노드에 대응하는 인접 엣지들 각각에 연결된 하나 또는 그 이상의 노드들 각각을 크롤링하는 것을 포함한다. 또한, 본 발명의 하나 또는 그 이상의 실시 예에서, 상기 정보 네트워크 내에서 크롤될 노드가 남지 않을 때까지, 이 단계들은 회귀적으로 반복 될 수 있다.
단계(604)는 하나 또는 그 이상의 노드들의 시퀀스를 생성하도록 상기 하나 또는 그 이상의 노드들 상에 랜덤 워크를 수행하는 것을 포함한다. 상기 노드들 상에 랜덤워크를 수행하는 것은 하나 또는 그 이상의 샘플된 노드들의 하나 또는 그 이상의 시퀀스들을 결정하는 것, 및 임의로 한 노드를 샘플링 하는 것과 임의로 하나 또는 그 이상의 인접한 노드들을 트래버스하는 것을 포함한다. 노드들의 시퀀스는 그러한 상기 노드들의 임의 순서를 사용하여 생성될 수 있다.
단계(606)는 랜덤 워크를 통해 생성된 하나 또는 그 이상의 시퀀스들로부터 시퀀스 데이터베이스를 생성하는 것을 포함한다. 단계(608)는 네트워크 내에서 하나 또는 그 이상의 패턴들을 결정하도록 상기 시퀀스 데이터베이스를 마이닝하는 것을 포함하되, 상기 하나 또는 그 이상의 패턴들은 정보 네트워크 내에서 하나 또는 그 이상의 커뮤니티들을 식별한다. 네트워크 내의 패턴들을 결정하도록 시퀀스 데이터베이스를 마이닝하는 것은 상기 시퀀스 데이터베이스로부터 빈번한 패턴들을 마이닝하도록 패턴 마이닝 알고리즘(예를 들면, 빈발 패턴 마이닝 알고리즘)을 사용하는 것을 포함할 수 있다.
나아가, 본 발명의 하나 또는 그 이상의 실시 예들은 하나 또는 그 이상의 거짓 긍정 패턴들을 제거하도록 상기 정보 네트워크에 대하여 하나 또는 그 이상의 패턴들을 체킹(checking)하는 것을 포함한다. 거짓 긍정 패턴들을 제거하도록 상기 정보 네트워크에 대하여 상기 패턴들을 체킹하는 것은, 상기 마이닝 된 패턴들이 정보 네트워크의 하나 또는 그 이상의 컨덕턴스 제한들을 만족하는지를 결정하는 것을 포함하고, 상기 컨덕턴스 제한들을 만족하지 않는 각각의 패턴들을 제거하는 것을 포함하고, 그리고 각각의 남은 패턴을 적절한 커뮤니티로 알리는 것을 포함한다.
도 6에 도시된 기술들은 또한, 설명된 것처럼, 독립의 소프트웨어 모듈들을 포함하는 시스템을 제공하는 것을 포함할 수 있다. 각각의 독립 소프트웨어 모듈들은 실제 컴퓨터로 읽기 및 기록 가능한 저장 매체에 내장된다. 예를 들면, 상기 독립의 소프트웨어 모듈들은 하드웨어 프로세서상에 실행되는 노드 데이터 구조 모듈, 엣지 데이터 구조 모듈, 및 경로 데이터 구조 모듈을 포함할 수 있다. 상기 노드 데이터 구조 모듈 내의 각 노드 데이터 구조는, 하나 또는 그 이상의 노드 특성들을 갖는 노드에 관한 노드 데이터를 포함한다. 상기 엣지 데이터 구조 모듈 내의 각 엣지 데이터 구조는, 두 개 노드 사이의 하나 또는 그 이상의 엣지 관계들을 정의한다. 또한, 상기 경로 데이터 구조 내의 각 경로 데이터 구조는 하나 또는 그 이상의 경로들에 관한 경로 데이터를 포함하되, 경로는 하나 또는 그 이상의 엣지 관계들에 의해 연관된 둘 또는 그 이상의 노드들을 포함한다.
본 발명의 하나 또는 그 이상의 실시 예들은 선택된 노드들의 서브셋(subset)을 식별하는 것을 더 포함할 수 있는데, 상기 선택된 노드들은 엣지 관계들을 통해 경로들에 연결되며, 경로 수는 경로 임계값보다 커야 하고 엣지 수는 엣지 임계값보다 작아야한다.
나아가, 본 발명의 하나 또는 그 이상의 실시 예들은 엣지 수를 최소화하면서 경로 수를 최대화 및/또는 엣지 가중치를 최소화하면서 상기 경로 수를 최대화할 수 있다. 상기 엣지 가중치는 링크(예를 들면, 메시지, 데이터 전송, 또는 프렌드쉽(friendship)동안의 길이)의 중요도를 정의한다. 예를 들어, 소셜 네트워크 내의 링크는 프렌드쉽 관계를 포함할 수 있고, 웹 상의 링크는 하이퍼링크가 될 수 있다.
본 발명의 하나 또는 그 이상의 실시 예들에서, 상기 선택된 노드들의 서브셋은 예를 들면, 최소 엣지 임계값 아래의 엣지 수, 또는 최소 임계값 아래의 비용으로 연결될 수 있다. 추가적으로, 상기 노드 속성들은, 예를 들면 하나 또는 그 이상의 추가 속성들, - 추가 속성들은 생성 시간에 관한 시간 정보, 소셜 네트워크에 관한 정보, 텔레폰 네트워크에 관한 정보, 컴퓨터 네트워크에 관한 정보 등을 포함할 수 있다 - 외에도 노드 아이덴티티(identity)를 포함할 수 있다. 또한, 노드들의 쌍 사이의 엣지 관계들은, 예를 들면 프렌드쉽(friendship), 메시지(message), 하이퍼링크(hyperlink), 데이터 전송(data transfer) 등을 포함 할 수 있다. 또한, 도 6에 도시된 상기 기술들은 컴퓨터 이용 가능 프로그램 코드를 포함하는 컴퓨터 프로그램 제품을 통하여 구현될 수 있는데, 상기 프로그램 코드는 데이터 처리 시스템 내의 컴퓨터 읽기 가능 스토리지 매체 내에 저장된다. 또한 상기 컴퓨터 이용 가능 프로그램 코드는 네트워크를 통하여 원격의 데이터 처리 시스템으로부터 다운로드 될 수 있다. 또한, 본 발명의 하나 또는 그 이상의 실시 예에서, 상기 컴퓨터 프로그램 제품은, 서버 데이터 처리 시스템내의 컴퓨터 읽기 가능 스토리지 매체 내에 저장되는 컴퓨터 이용 가능 프로그램코드를 포함 할 수 있다. 상기 컴퓨터 이용 가능 프로그램 코드는 네트워크를 통하여 원격의 데이터 처리 시스템으로 다운로드 될 수 있는데, 이는 상기 원격 시스템으로 컴퓨터 읽기 가능 스토리지 매체 내에서 사용하기 위함이다.
이 기술분야에서 통상의 지식을 갖는 자에게 본 발명의 목적들은 시스템, 방법 또는 컴퓨터 프로그램 제품으로써 구현될 수 있음이 이해될 것이다. 따라서, 본 발명의 목적들은 완전한 하드웨어 실시예, 완전한 소프트웨어 실시예(펌웨어, 상주 소프트웨어(resident software), 마이크로 코드(micro-code)등을 포함함) 또는 소프트웨어 및 하드웨어를 결합한 실시 예 -일반적으로 여기서는 “회로”, “모듈”, 또는 “시스템”으로 언급됨-의 형태를 가질 수 있다.
또한, 본 발명의 목적들은 하나 또는 그 이상의 컴퓨터 읽기 가능 매체(들)(컴퓨터 읽기 가능 프로그램 코드가 내장되어 있음)에 내장된 컴퓨터 프로그램 제품의 형태를 가질 수 있다.
본 발명의 하나 또는 그 이상의 실시 예들은, 또는 그들의 구성요소들은, 메모리, 및 적어도 하나의 프로세서(본 발명의 예시적 단계들을 수행하도록 상기 메모리 및 부품과 결합된)를 포함하는 장치의 형태로 구현될 수 있다.
하나 또는 그 이상의 실시 예들은, 일반용 컴퓨터 또는 워크스테이션 상에 실행되는 소프트웨어로 만들 수 있다. 도 7은 참조하면, 그러한 장치는 예를 들어, 프로세서(702), 메모리(704), 및 디스플레이(706) 및 키보드(708) 등의 형태를 갖는 입력/출력 인터페이스를 이용할 수 있다. 여기서 사용된 “프로세서”란 용어는 모든 처리 유닛, 예를 들면, CPU(중앙처리유닛), 및/또는 이와 다른 처리 회로 형태를 포함하도록 의도된다. 게다가 상기 “프로세서”란 용어는 하나의 프로세서 이상을 언급할 때 사용될 수 있다. “메모리”란 용어는 프로세서 또는 CPU와 연관된 메모리, 예를 들면, RAM(random access memory), ROM(read only memory), 고정된 메모리 장치(예를 들면, 하드 드라이브), 제거 가능한 메모리 장치(예를 들면, 디스켓), 플래시 메모리 및 그와 유사 장치를 포함한다. 또한, 여기서 사용된 “입력/출력 인터페이스”란 어구는, 예를 들면, 상기 처리 유닛으로 데이터를 입력하는 하나 또는 그 이상의 장치들(예를 들면, 마우스), 및 상기 처리 유닛과 연관된 결과를 제공하는 하나 또는 그 이상의 장치들(예를 들면, 프린터)를 포함한다. 프로세서(702), 메모리(704), 및 디스플레이(706)와 키보드(708) 같은 입력/출력 인터페이스는, 예를 들면, 데이터 처리 유닛(712)의 일부인 버스(710)를 통하여 상호 연결된다. 적절한 상호연결은 또한, 예를 들면 버스(710)을 통하여, 네트워크 카드와 같은 네트워크 인터페이스(714)(컴퓨터 네트워크를 제공함), 및 디스켓 또는 CD-ROM 드라이브와 같은 미디어 인터페이스(716)(미디어(718)를 제공함)에 제공된다.
따라서, 본 발명의 방법들을 수행하기 위한 명령들 또는 코드를 포함하는 컴퓨터 소프트웨어는, 여기에 설명된 것처럼, 상기 하나 또는 그 이상의 연관된 메모리 장치들에 저장될 수 있고, 사용될 준비가 되었을 때, 부분 또는 전체가 로드(load)되어(예를 들면, RAM내에). CPU에 의해 구현될 수 있다. 그러한 소프트웨어는 펌웨어, 상주 소프트웨어, 마이크로코드, 및 이와 유사장치들을 포함할 수 있지만, 이에 한정되지 않는다.
프로그램 코드를 저장 및/또는 실행하는 데이터 처리 시스템은, 시스템 버스(710)를 통하여 직접 또는 간접적으로 메모리 요소들(704)에 결합된 적어도 하나의 프로세서(702)를 포함할 것이다. 상기 메모리 요소들에는 프로그램 코드의 실제 실행 동안 사용되는 로컬 메모리, 벌크 스토리지, 및 캐쉬 메모리들이 포함되는데, 여기서 캐시 메모리들은 프로그램 코드의 실제 실행 동안 벌크 스토리지로부터 프로그램 코드를 검색해야 하는 횟수(the number of times)를 줄이기 위해 적어도 일부 프로그램 코드의 일시적 스토리지를 제공한다.
입력/출력 또는 I/O 장치들(키보드(708), 디스플레이들(706), 포인팅 장치들, 및 이와 유사한 장치를 포함하지만 이에 한정되지 않음)은 상기 시스템에 직접(예를 들면 버스(710)로) 또는 개재하는 I/O 컨트롤러들(도시 생략)을 통하여 결합될 수 있다.
네트워크 어댑터들, 예를 들면 네트워크 인터페이스(714)는 또한 시스템에 결합될 수 있는데, 이는 사설망이나 공중망을 통하여 데이터 처리 시스템이 다른 데이터 처리 시스템들 또는 원격 프린터들 또는 스토리지 디바이스들과 결합하도록 한다. 모뎀들, 케이블 모뎀 및 이더넷 카드들은 현재 네트워크 어댑터들로 이용 가능한 타입들이다.
여기서 사용된 것처럼, 청구범위를 포함하여, “서버”는 서버 프로그램을 실행하는 물리적 데이터 처리 시스템(도 7에 도시된 것처럼 예를 들면, 시스템(712))을 포함한다. 그러한 물리적 서버는 디스플레이 및 키보드를 포함하거나 포함하지 않을 수 있다.
주지하는 바와 같이, 본 발명의 실시 예들은 하나 또는 그 이상의 컴퓨터 읽기 가능 매체(들)(컴퓨터 읽기 가능 프로그램 코드가 내장됨)에 내장된 컴퓨터 프로그램 제품의 형태를 가질 수 있다. 하나 또는 그 이상의 컴퓨터 읽기 가능 매체(들)의 모든 조합도 이용될 수 있다. 상기 컴퓨터 읽기 가능 매체는 컴퓨터 읽기 가능 신호 매체 또는 컴퓨터 읽기 가능 스토리지 매체가 될 수 있다.
컴퓨터 읽기 가능 스토리지 매체는, 예를 들면, 전기, 자기, 광학, 전자기, 적외선, 또는 반도체 시스템, 장치, 또는 디바이스, 또는 적절한 이들의 모든 조합이 될 수 있지만 이에 한정되지 않는다. 미디어 블락(718)은 한정하는 예가 아니다. 상기 컴퓨터 읽기 가능 스토리지 매체의 더 많은 특정한 예들(모두 예시한 것이 아님)은 아래의 것들을 포함할 수 있다.
하나 또는 그 이상의 배선들을 갖는 전기적 연결, 이동 가능한 컴퓨터 디스켓, 하드 디스크, RAM, ROM, EPROM(erasable programmable read-only memory) 또는 플래시 메모리, 광섬유, 이동 가능한 CD-ROM, 광 스토리지 장치, 마그네틱 스토리지 장치, 또는 이들의 적절한 모든 조합을 포함한다. 본 명세서에서, 컴퓨터 읽기 가능 스토리지 매체는 명령 실행 시스템, 장치, 또는 디바이스와 연관되어 사용되는 프로그램을 보유, 또는 저장하는 모든 실제 매체가 될 수 있다.
컴퓨터 읽기 가능 신호 매체는, 베이스 밴드(baseband) 내 또는 캐리어 웨이브(carrier wave)의 일부로써, 컴퓨터 읽기 가능 프로그램 코드가 내장되어 전송된 데이터 신호를 포함할 수 있다.
그러한 전송된 신호는 어떠한 다양한 형태도 가질 수 있고, 전자기, 광학, 또는 이들의 모든 적절한 조합을 포함하지만 이에 한정되지 않는다. 컴퓨터 읽기 가능 신호 매체는 상기 컴퓨터 읽기 가능 매체는 컴퓨터 읽기 가능 스토리지 매체가 아닌, 그리고 명령 실행 시스템, 장치, 또는 디바이스에 의하여 혹은 연관되어 사용되는 프로그램을 전송, 전파 혹은 전달할 수 있는 모든 컴퓨터 읽기 가능 매체가 될 수 있다.
컴퓨터 읽기 가능 매체에 내장된 프로그램 코드는 적절한 모든 매체를 사용하여 전해질 수 있는데, 무선, 유선, 광학 섬유 케이블, 라디오 주파수(RF) 등 또는 이들의 모든 적절한 조합을 포함하지만 이에 한정되지 않는다. 본 발명의 목적을 위한 동작을 수행하는 컴퓨터 프로그램 코드는 하나 또는 그 이상의 프로그래밍 언어들의 모든 조합으로 기록될 수 있다. 상기 프로그래밍 언어는 객체 지향 프로그래밍 언어, 예를 들면 자바, Smalltalk, C++ 또는 이와 유사한 것들 과 종래의 절차적 프로그래밍 언어, 예를 들면 “C” 프로그래밍 언어 또는 유사한 프로그래밍 언어를 포함한다. 상기 프로그램 코드는 유저의 컴퓨터 상에 전체적으로, 유저의 컴퓨터 상에 부분적으로 실행할 수 있다. 또한 독립형 소프트웨어 패키지로써 유저의 컴퓨터 상에 부분적으로 실행할 수 있고, 원격 컴퓨터 상에 부분적으로, 또는 원격 컴퓨터나 서버상에 전체적으로 실행 할 수 있다.
위의 마지막 시나리오에서, 상기 원격 컴퓨터는 모든 타입의 네트워크 통하여 상기 유저의 컴퓨터에 연결될 수 있는데, 상기 네트워크는 LAN(local area network), 또는 WAN(wide area network)을 포함할 수 있다. 또한 상기 연결은 외부 컴퓨터에 만들어 질 수 있다.(예를 들면, 인터넷을 통하여 인터넷 서비스 제공자(ISP)를 사용한다.)
본 발명의 실시 예들은, 플로우 차트 도면 및/ 또는, 본 발명의 실시 예에 따른 방법, 장치(시스템들) 및 컴퓨터 프로그램 제품들의 블락 다이어그램들을 참조하여 설명되었다. 상기 플로우 차트 도면들 및/또는 블락 다이어그램들의 각 블락, 및 플로우 차트 도면들 및/또는 블락 다이어그램들 내의 블락 조합들은 컴퓨터 프로그램 명령들에 의하여 구현 가능하다. 이 컴퓨터 프로그램 명령들은 범용 컴퓨터, 특별용 컴퓨터, 또는 다른 프로그램 가능한 데이터 처리 장치의 프로세스에 머신(machine)을 생성하도록 제공된다. 그리하여 상기 컴퓨터 또는 다른 프로그램 가능한 데이터 처리 장치의 프로세서를 통하여 실행되는 명령들은, 상기 플로우차트 내에 및/또는 블락 다이어그램의 블락 또는 블락들에 명시된 상기 기능들/기술들을 구현하는 수단들을 생성한다.
이 컴퓨터 프로그램 명령어들 또한 컴퓨터 읽기 가능 매체에 저장될 수 있는데, 상기 컴퓨터 읽기 가능 매체는 컴퓨터, 다른 프로그램 가능한 데이터 처리 장치, 또는 다른 디바이스들이 특정한 방식으로 기능하도록 지시할 수 있다. 그리하여, 상기 컴퓨터 읽기 가능 매체에 저장된 명령들은 제품을 생성하는데, 이것은 플로우차트 내에 및/또는 블락 다이어그램의 블락 또는 블락들에 명시된 상기 기능/기술을 구현하는 명령들을 포함한다.
상기 컴퓨터 프로그램 명령들은 또한 컴퓨터, 다른 프로그램 가능한 데이터 처리 장치, 또는 다른 디바이스들 상으로 로드 될 수 있는데, 이는 일련의 동작 단계들이 상기 컴퓨터, 다른 프로그램 가능한 장치 또는 다른 디바이스들 상에 수행되어 프로세스가 구현되는 컴퓨터를 생성하기 위함이다. 그리하여, 컴퓨터 또는 다른 프로그램 가능한 장치 상에 실행하는 상기 명령들은, 플로우차트 내 및/또는 블락 다이어그램의 블락 또는 블락들에 명시된 상기 기능들/기술들을 구현하는 프로세스들을 제공한다.
도면들 내에 있는 상기 플로우차트 및 블락 다이어그램들은 본 발명의 다양한 실시 예에 따른 구조, 기능, 및 시스템, 방법 및 컴퓨터 프로그램 제품들의 가능한 동작 구현들을 설명한다.
이 점과 관련하여, 상기 플로우차트 내의 또는 블락 다이어그램의 각 블락은 모듈, 구성, 세그먼트, 또는 코드의 일부를 나타낼 수 있다. 상기 코드는 명시된 논리 기능(들)을 구현하는 하나 또는 그 이상의 실행 가능한 명령들을 포함한다. 또한, 몇몇의 다른 구현들에서, 상기 블락에 기재된 기능들은 상기 도면들에 기재된 순서와는 다르게 일어날 수 있다. 예를 들면, 연속적으로 도시된 두 블락은 사실, 실제 동시적으로 실행되거나, 상기 블락들은 수반된 기능에 따라 때때로 역순으로 실행 될 수 있다. 또한, 상기 블락 다이어그램들 및/또는 플로우차트 설명의 각 블락, 및 상기 블락 다이어그램들 및/또는 플로우차트 설명 내의 블락들의 조합은, 상기 명시된 기능들 또는 기술들, 또는 특별용 하드웨어 및 컴퓨터 명령어들의 조합들을 수행하는 특별용 하드웨어 기반의 시스템들에 의해 구현될 수 있다.
특히 주의해야 할 점은, 여기에 설명된 모든 방법들은, 컴퓨터 읽기 가능 스토리지 매체에 내장된 독립 소프트웨어 모듈들을 포함하는 시스템을 제공하는 추가적 단계를 포함할 수 있다는 것이다. 상기 모듈들은, 예를 들면, 도 1에 도시된 어떠한 또는 모든 구성들을 포함할 수 있다. 상기 방법 단계들은 또한, 독립 소프트웨어 모듈 및/또는 상기 시스템의 서브 모듈(전술한 것처럼 하나 또는 그 이상의 하드웨어 프로세서들(702)들 상에 실행하는)을 사용하여 수행될 수 있다. 나아가, 컴퓨터 프로그램 제품은 하나 또는 그 이상의 방법 단계들 -독립 소프트웨어 모듈들을 갖는 시스템을 제공하는 것을 포함함- 을 수행하도록 구현 적용된 코드와 함께, 컴퓨터 읽기 가능 스토리지 매체를 포함할 수 있다.
어떤 경우에서나, 도시된 상기 구성들은 다양한 형태의 하드웨어, 소프트웨어, 또는 그들의 조합들로 구현될 수 있다; 예를 들면, 어플리케이션 특정 집적회로(ASICS), 기능적 회로, 메모리와 연관된 하나 또는 그 이상의 적절히 프로그램된 범용 디지털 컴퓨터들, 및 이와 유사한 것들을 포함한다. 여기에 제공된 본 발명의 기술적 사상들로 부터, 이 기술분야의 통상의 지식을 갖는 자는 본 발명의 구성들의 다른 구현들을 예상할 수 있을 것이다.
여기서 사용된 전문 용어는 오직 특정한 실시 예들을 묘사하기 위함이지, 본 발명을 한정하기 위한 의도가 아니다. 이 설명에서 사용된 단수 형태의 단어들은 문맥상 명백하게 단수임을 표시하는 경우가 아닌 한 복수 형태도 포함한다. “포함하다” 및/또는 “포함하는”이란 용어는, 본 명세서의 특징들, 정수들, 단계들, 동작들, 요소들, 및/또는 구성들의 존재를 명시할 때 사용되지만, 하나 또는 그 이상의 다른 특징들, 정수들, 단계들, 동작들, 요소들, 구성들 및/또는 그들의 그룹들의 추가사항을 배제하는 것은 아니다.
아래의 청구항들의 대응 구조들, 재료들, 동작들, 및 모든 수단 혹은 단계 플러스 기능 요소들의 균등물들은 모든 구조, 재료, 혹은 구체적으로 청구된 다른 청구된 요소들과 조합으로 기능을 수행하기 위한 동작을 포함한다. 본 발명의 설명은 예시 및 설명의 목적으로 제공될 뿐이며, 개시된 형태로서 본 발명을 모두 포함하고 있다거나(exhaustive) 혹은 제한 하려 하는 것은 아니다. 많은 수정들 및 변형들은 이 기술분야에서 통상의 지식을 가진 자들에게 본 발명의 범위 및 취지를 벗어남이 없이 명백하게 이해될 것이다. 상기 실시 예들은 본 발명의 원리 및 명세서의 실시를 잘 설명하기 위해서 선택되고 기재되었다. 또한 이 기술분야의 통상의 지식을 가진 자가 특정 사용에 적합한 다양한 변형들을 갖는 다양한 실시 예들을 위해 본 발명을 이해하도록 기재되었다.
본 발명의 적어도 하나의 실시 예는 하나 또는 그 이상의 유익한 효과들, 예를 들면, 대규모 그래프들 내에 숨겨진 커뮤니티들을 결정하는 것, 을 제공한다.
또한, 전술한 본 발명의 상기 예시적 실시 예들은 다양한 형태들로 구현될 수 있다. 여기에 제공된 본 발명의 주어진 점들로, 이 기술분야의 통상의 지식을 갖는 자는 본 발명의 구성들의 다른 구현들을 예상할 수 있을 것이다. 또한, 첨부된 도면들을 참조하여 본 발명의 설명적 실시 예들이 설명되었더라도, 본 발명은 앞서 말한 명확한 실시 예들로 한정되는 것이 아니고, 이 기술분야의 통상의 지식을 가진 자에게 다양한 변형들과 수정들이 만들어 질 수 있다.

Claims (25)

  1. 정보 네트워크 내의 하나 또는 그 이상의 커뮤니티들을 식별하는 방법에 있어서, 상기 방법은:
    정보 네트워크로부터 하나 또는 그 이상의 노드들 및 하나 또는 그 이상의 엣지들을 수집하는 단계;
    하나 또는 그 이상의 노드들의 시퀀스를 생성하도록 상기 하나 또는 그 이상의 노드들 상에 랜덤 워크를 수행하는 단계;
    랜덤 워크를 통하여 생성된 하나 또는 그 이상의 시퀀스들로부터 시퀀스 데이터베이스를 생성하는 단계; 및
    상기 네트워크 내의 하나 또는 그 이상의 패턴들을 결정하도록 상기 시퀀스 데이터베이스를 마이닝하되, 상기 하나 또는 그 이상의 패턴들은 상기 정보 네트워크 내의 하나 또는 그 이상의 커뮤니티들을 식별하는 것을 포함하는,
    방법.
  2. 제 1항에 있어서,
    정보 네트워크로부터 하나 또는 그 이상의 노드들 및 하나 또는 그 이상의 엣지들을 수집하는 단계는 하나의 노드 및 상기 노드에 대응하는 각각의 인접한 엣지들을 크롤링하는(crawling) 단계를 포함하는,
    방법.
  3. 제 2항에 있어서, 상기 방법은
    상기 노드에 대응하는 각각의 인접한 엣지들과 연결된 각각의 하나 또는 그 이상의 노드들을 크롤링하는 단계를 더 포함하는,
    방법.
  4. 제 3항에 있어서, 상기 방법은
    상기 정보 네트워크 내에 크롤될 노드가 남아있지 않을 때까지 제 2항 및 제 3항의 상기 단계들을 회귀적으로 반복하는 단계를 더 포함하는,
    방법.
  5. 제 1항에 있어서,
    상기 하나 또는 그 이상의 노드들 상에 랜덤 워크(random walk)를 수행하는 단계는:
    하나 또는 그 이상의 샘플된 노드들의 하나 또는 그 이상의 시퀀스들을 결정하는 단계; 및
    임의로 하나의 노드를 샘플링하여 임의 순서로 하나 또는 그 이상의 인접한 노드들을 트래버싱(traversing)하는 단계를 포함하는,
    방법.
  6. 제 5항에 있어서,
    상기 방법은
    상기 노드들의 임의 순서를 이용하여 노드들의 시퀀스를 생성하는 단계를 더 포함하는,
    방법.
  7. 제 1항에 있어서,
    상기 네트워크 내의 하나 또는 그 이상의 패턴들을 결정하도록 상기 시퀀스 데이터베이스를 마이닝하는 단계는 상기 시퀀스 데이터베이스로부터 하나 또는 그 이상의 빈번한 패턴들을 마이닝 하도록 패턴 마이닝 알고리즘을 사용하는 단계를 포함하는,
    방법.
  8. 제 1항에 있어서,
    상기 방법은
    하나 또는 그 이상의 거짓 긍정 패턴들(false positive patterns)을 제거하도록 상기 정보 네트워크에 대하여 하나 또는 그 이상의 패턴들의 하나 또는 그 이상을 체킹하는 단계를 더 포함하는,
    방법.
  9. 제 8항에 있어서,
    하나 또는 그 이상의 거짓 긍정 패턴들을 제거하도록 상기 정보 네트워크에 대하여 하나 또는 그 이상의 패턴들의 하나 또는 그 이상을 체킹하는 단계는:
    상기 하나 또는 그 이상의 패턴들이 상기 정보 네트워크 내의 하나 또는 그 이상의 컨덕턴스 제한들(conductance constraints)을 만족하는지 결정하는 단계;
    상기 하나 또는 그 이상의 컨덕턴스 제한들을 만족하지 않는 각 패턴을 제거하는 단계; 및
    남아있는 각각의 패턴을 관련(relevant) 커뮤니티로서 보고하는 단계를 포함하는,
    방법.
  10. 제 1항에 있어서,
    상기 방법은
    하나 또는 그 이상의 독립(distinct) 소프트웨어 모듈들을 포함하는 시스템을 제공하는 단계를 더 포함하되, 상기 하나 또는 그 이상의 독립 소프트웨어 모듈들 각각은 유형의 컴퓨터 읽기 및 쓰기 가능 스토리지 매체 상에 구현되며, 상기 하나 또는 그 이상의 독립 소프트웨어 모듈들은 하드웨어 프로세서 상에 실행되는 노드 데이터 구조 모듈, 엣지 데이터 구조 모듈, 및 경로 데이터 구조 모듈를 포함하는
    방법.
  11. 제 10항에 있어서,
    상기 노드 데이터 구조 모듈 내의 각 노드 데이터 구조는 하나 또는 그 이상의 노드 속성들(attributes)을 갖는 노드에 관한 노드 데이터를 포함하고,
    상기 엣지 데이터 구조 모듈 내의 각 엣지 데이터 구조는 노드들의 쌍 사이의 하나 또는 그 이상의 엣지 관계들을 정의하며, 그리고
    상기 경로 데이터 구조 모듈 내의 각 경로 데이터 구조는 하나 또는 그 이상의 경로들 -경로는 하나 또는 그 이상의 엣지 관계들로 연관된 둘 또는 그 이상의 노드들을 포함함 - 에 관한 경로 데이터를 포함하는
    방법.
  12. 제 11항에 있어서,
    상기 방법은 수 많은 엣지 관계들을 통해 수 많은 경로 들에 연결되는 선택된 노드들의 서브셋(subset)을 식별하는 단계를 더 포함하되, 상기 경로들의 수는 경로 임계값 보다 크고 상기 엣지의 수는 엣지 임계값 보다 작은,
    방법.
  13. 제 12항에 있어서,
    상기 방법은 상기 경로들의 수를 최대화하는 단계 및 상기 엣지들의 수를 최소화하는 단계를 더 포함하는,
    방법.
  14. 제 12항에 있어서,
    상기 방법은 상기 경로들의 수를 최대화하는 단계 및 엣지 가중치를 최소화하는 단계를 포함하되, 상기 엣지 가중치는 링크의 중요도(significance)를 정의하는,
    방법.
  15. 제 12항에 있어서,
    상기 선택된 노드들의 서브셋은 최소 엣지 임계값 아래의 수 많은 엣지들과 연결되는
    방법.
  16. 제 12항에 있어서,
    상기 선택된 노드들의 서브셋은 최소 임계값 아래의 비용과 연결되는,
    방법.
  17. 제 11항에 있어서,
    상기 하나 또는 그 이상의 노드 속성들은 하나 또는 그 이상의 추가 속성들 외에 노드 아이덴티티(identity)를 포함하되, 상기 하나 또는 그 이상의 추가 속성들은 생성시간에 관한 일시적 정보(temporal information), 소셜 네트워크에 관한 정보, 텔레폰 네트워크에 관한 정보, 및 컴퓨터 네트워크에 관한 정보 중 적어도 하나를 포함하는.
    방법.
  18. 제 11항에 있어서,
    노드들 쌍 사이의 상기 하나 또는 그 이상의 엣지 관계들은 프렌드쉽(friendship), 메시지, 하이퍼링크 및 데이터 전송 중 적어도 하나를 포함하는,
    방법.
  19. 정보 네트워크 내에 하나 또는 그 이상의 커뮤니티들을 식별하는 컴퓨터 이용 가능 프로그램 코드를 포함하는 유형의 컴퓨터 읽기 및 쓰기 가능 스토리지 매체를 포함하는 컴퓨터 프로그램 제품에 있어서, 상기 컴퓨터 프로그램 제품은:
    정보 네트워크로부터 하나 또는 그 이상의 노드들 및 하나 또는 그 이상의 엣지들을 수집하는 컴퓨터 이용 가능 프로그램 코드;
    하나 또는 그 이상의 노드들의 시퀀스를 생성하도록 하나 또는 그 이상의 노드들 상에 랜덤 워크를 수행하는 컴퓨터 이용 가능 프로그램 코드;
    랜덤 워크를 통하여 생성된 하나 또는 그 이상의 시퀀스들로부터 시퀀스 데이터베이스를 생성하는 컴퓨터 이용 가능 프로그램 코드; 및
    상기 네트워크 내에 하나 또는 그 이상의 패턴들을 결정하도록 상기 시퀀스 데이터베이스를 마이닝하는 컴퓨터 이용 가능 프로그램 코드를 포함하되, 상기 하나 또는 그 이상의 패턴들은 상기 정보 네트워크 내의 하나 또는 그 이상의 커뮤니티들을 식별하는,
    컴퓨터 프로그램 제품.
  20. 제 19항에 있어서,
    정보 네트워크로부터 하나 또는 그 이상의 노드들 및 하나 또는 그 이상의 엣지들을 수집하는 컴퓨터 이용 가능 프로그램 코드는, 하나의 노드 및 상기 노드에 대응하는 각각의 인접한 엣지를 크롤링하는 컴퓨터 이용 가능 프로그램 코드를 포함하는,
    컴퓨터 프로그램 제품.
  21. 제 20항에 있어서,
    상기 컴퓨터 프로그램 제품은
    상기 노드에 대응하는 각각의 인접한 엣지들과 연결된 하나 또는 그 이상의 노드들 각각을 크롤링하는 컴퓨터 이용 가능 프로그램 코드를 더 포함하는,
    컴퓨터 프로그램 제품.
  22. 정보 네트워크 내의 하나 또는 그 이상의 커뮤니티들을 식별하는 시스템에 있어서, 상기 시스템은:
    메모리; 및
    상기 메모리에 결합된 적어도 하나의 프로세서를 포함하되, 상기 프로세서는
    정보 네트워크로부터 하나 또는 그 이상의 노드들 및 하나 또는 그 이상의 엣지들을 수집하고;
    하나 또는 그 이상의 노드들의 시퀀스를 생성하도록 상기 하나 또는 그 이상의 노드들 상에 랜덤 워크를 수행하며;
    랜덤 워크를 통하여 생성된 하나 또는 그 이상의 시퀀스들로부터 시퀀스 데이터베이스를 생성하고 ; 그리고 상기 네트워크 내의 하나 또는 그 이상의 패턴들을 결정하도록 상기 시퀀스 데이터베이스를 마이닝하는 동작을 수행하고, 상기 하나 또는 그 이상의 패턴들은 상기 정보 네트워크 내의 하나 또는 그 이상의 패턴들을 식별하는
    시스템.
  23. 제 22항에 있어서,
    정보 네트워크로부터 하나 또는 그 이상의 노드들 및 하나 또는 그 이상의 엣지들을 수집하도록 동작하는 상기 메모리에 결합된 상기 적어도 하나의 프로세서는 하나의 노드 및 상기 노드에 대응하는 각각의 인접한 엣지를 크롤링하도록 더 동작하는,
    시스템.
  24. 제 23항에 있어서,
    상기 메모리와 결합된 적어도 하나의 프로세서는 상기 노드에 대응하는 인접한 엣지들 각각에 연결된 하나 또는 그 이상의 노드들 각각을 크롤링하도록 더 동작하는,
    시스템.
  25. 정보 네트워크 내의 하나 또는 그 이상의 커뮤니티들을 식별하기 위한 장치에 있어서, 상기 장치는:
    정보 네트워크로부터 하나 또는 그 이상의 노드들 및 하나 또는 그 이상의 엣지들을 수집하는 수단;
    하나 또는 그 이상의 노드들의 시퀀스를 생성하도록 상기 하나 또는 그 이상의 노드들 상에 랜덤 워크를 수행하는 수단;
    랜덤 워크를 통하여 생성된 하나 또는 그 이상의 시퀀스들로부터 시퀀스 데이터베이스를 생성하는 수단; 및
    상기 네트워크 내의 하나 또는 그 이상의 패턴들을 결정하도록 상기 시퀀스 데이터베이스를 마이닝하는 수단을 포함하되, 상기 하나 또는 그 이상의 패턴들은 상기 정보 네트워크 내의 하나 또는 그 이상의 커뮤니티들을 식별하는,
    장치.
KR1020110047316A 2010-05-28 2011-05-19 정보 네트워크 내의 커뮤니티를 식별하는 방법 및 시스템 KR20110131094A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/790,128 US8396855B2 (en) 2010-05-28 2010-05-28 Identifying communities in an information network
US12/790,128 2010-05-28

Publications (1)

Publication Number Publication Date
KR20110131094A true KR20110131094A (ko) 2011-12-06

Family

ID=45022931

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110047316A KR20110131094A (ko) 2010-05-28 2011-05-19 정보 네트워크 내의 커뮤니티를 식별하는 방법 및 시스템

Country Status (2)

Country Link
US (1) US8396855B2 (ko)
KR (1) KR20110131094A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190040863A (ko) * 2017-10-11 2019-04-19 서울대학교산학협력단 네트워크에서의 랭킹 및 연결 예측을 위한 지도식 확장 랜덤 워크를 제공하는 방법 및 장치
KR20190040864A (ko) * 2017-10-11 2019-04-19 서울대학교산학협력단 부호화된 방향성 네트워크에서의 표현 학습 방법 및 장치

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011106897A1 (en) * 2010-03-05 2011-09-09 Chrapko Evan V Systems and methods for conducting more reliable assessments with connectivity statistics
US8700756B2 (en) * 2011-05-03 2014-04-15 Xerox Corporation Systems, methods and devices for extracting and visualizing user-centric communities from emails
JP5904082B2 (ja) * 2012-10-05 2016-04-13 富士ゼロックス株式会社 関連検索システム、検索窓口装置、データベース及びプログラム
CN103885832B (zh) * 2012-12-20 2018-07-03 华为技术有限公司 一种资源分配方法、设备和系统
CN103914493A (zh) * 2013-01-09 2014-07-09 北大方正集团有限公司 一种微博用户群体结构发现分析方法及系统
US9342854B2 (en) * 2013-05-08 2016-05-17 Yahoo! Inc. Identifying communities within a social network based on information propagation data
US20150134402A1 (en) * 2013-11-11 2015-05-14 Yahoo! Inc. System and method for network-oblivious community detection
US10210280B2 (en) * 2014-10-23 2019-02-19 Sap Se In-memory database search optimization using graph community structure
CN104462374B (zh) * 2014-12-09 2018-06-05 深圳大学 一种广义最大度随机游走图抽样方法
US11979309B2 (en) 2015-11-30 2024-05-07 International Business Machines Corporation System and method for discovering ad-hoc communities over large-scale implicit networks by wave relaxation
US10885131B2 (en) 2016-09-12 2021-01-05 Ebrahim Bagheri System and method for temporal identification of latent user communities using electronic content
US10826781B2 (en) * 2017-08-01 2020-11-03 Elsevier, Inc. Systems and methods for extracting structure from large, dense, and noisy networks
CN109614397B (zh) * 2018-10-30 2023-06-20 创新先进技术有限公司 基于分布式系统获取关系网络的节点序列的方法和装置
US11605004B2 (en) 2018-12-11 2023-03-14 Hiwave Technologies Inc. Method and system for generating a transitory sentiment community
US11030533B2 (en) 2018-12-11 2021-06-08 Hiwave Technologies Inc. Method and system for generating a transitory sentiment community
US11270357B2 (en) 2018-12-11 2022-03-08 Hiwave Technologies Inc. Method and system for initiating an interface concurrent with generation of a transitory sentiment community
JP7182264B2 (ja) * 2018-12-20 2022-12-02 国立研究開発法人情報通信研究機構 ランダムウォークを制御する制御方法および観光支援システム
CN110135890A (zh) * 2019-04-15 2019-08-16 深圳壹账通智能科技有限公司 基于知识关系挖掘的产品数据推送方法及相关设备
CN110110529B (zh) * 2019-05-20 2020-12-11 北京理工大学 一种基于复杂网络的软件网络关键节点挖掘方法
CN110377822B (zh) * 2019-06-25 2024-04-16 腾讯科技(深圳)有限公司 用于网络表征学习的方法、装置及电子设备
CN113822768B (zh) * 2020-12-29 2024-04-16 京东科技控股股份有限公司 社区网络的处理方法、装置、设备及存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5950189A (en) * 1997-01-02 1999-09-07 At&T Corp Retrieval system and method
AU2001253161A1 (en) * 2000-04-04 2001-10-15 Stick Networks, Inc. Method and apparatus for scheduling presentation of digital content on a personal communication device
US6981037B1 (en) * 2001-01-09 2005-12-27 International Business Machines Corporation Method and system for using access patterns to improve web site hierarchy and organization
US7028029B2 (en) * 2003-03-28 2006-04-11 Google Inc. Adaptive computation of ranking
US20050243736A1 (en) * 2004-04-19 2005-11-03 International Business Machines Corporation System, method, and service for finding an optimal collection of paths among a plurality of paths between two nodes in a complex network
US7478078B2 (en) * 2004-06-14 2009-01-13 Friendster, Inc. Method for sharing relationship information stored in a social network database with third party databases
US7640488B2 (en) * 2004-12-04 2009-12-29 International Business Machines Corporation System, method, and service for using a focused random walk to produce samples on a topic from a collection of hyper-linked pages
US7958120B2 (en) * 2005-05-10 2011-06-07 Netseer, Inc. Method and apparatus for distributed community finding
US10547698B2 (en) * 2006-11-08 2020-01-28 Cricket Media, Inc. Dynamic characterization of nodes in a semantic network for desired functions such as search, discovery, matching, content delivery, and synchronization of activity and information
US20080270549A1 (en) * 2007-04-26 2008-10-30 Microsoft Corporation Extracting link spam using random walks and spam seeds
US8965967B2 (en) * 2009-12-23 2015-02-24 The Board Of Trustees Of The University Of Illinois Tie strength prediction and social media filtration

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190040863A (ko) * 2017-10-11 2019-04-19 서울대학교산학협력단 네트워크에서의 랭킹 및 연결 예측을 위한 지도식 확장 랜덤 워크를 제공하는 방법 및 장치
KR20190040864A (ko) * 2017-10-11 2019-04-19 서울대학교산학협력단 부호화된 방향성 네트워크에서의 표현 학습 방법 및 장치

Also Published As

Publication number Publication date
US8396855B2 (en) 2013-03-12
US20110295832A1 (en) 2011-12-01

Similar Documents

Publication Publication Date Title
KR20110131094A (ko) 정보 네트워크 내의 커뮤니티를 식별하는 방법 및 시스템
CN110210227B (zh) 风险检测方法、装置、设备和存储介质
US8655805B2 (en) Method for classification of objects in a graph data stream
US9798882B2 (en) Real-time model of states of monitored devices
Lindner et al. Structure-preserving sparsification of social networks
US8825838B2 (en) Identification of business process application service groups
Gao et al. Android malware detection via graphlet sampling
US20210385251A1 (en) System and methods for integrating datasets and automating transformation workflows using a distributed computational graph
Erlandsson et al. Crawling online social networks
US10015190B2 (en) Forecasting and classifying cyber-attacks using crossover neural embeddings
US11546380B2 (en) System and method for creation and implementation of data processing workflows using a distributed computational graph
Zuo et al. The power of indirect ties
Rossi et al. Parallel maximum clique algorithms with applications to network analysis and storage
US10230751B2 (en) Forecasting and classifying cyber attacks using neural embeddings migration
JP2014225117A (ja) 伝達情報変動検知方法、伝達情報変動検知装置および伝達情報変動検知プログラム
KR20180079434A (ko) 바이러스 데이터베이스 획득 방법 및 기기, 장비, 서버 그리고 시스템
Keyvanpour A survey on community detection methods based on the nature of social networks
US20200004905A1 (en) System and methods for complex it process annotation, tracing, analysis, and simulation
VijayaChandra et al. Numerical formulation and simulation of social networks using graph theory on social cloud platform
CN110457903A (zh) 一种病毒分析方法、装置、设备及介质
WO2011114135A1 (en) Detecting at least one community in a network
Król On modelling social propagation phenomenon
Morshed et al. LeL-GNN: Learnable edge sampling and line based graph neural network for link prediction
Ostrowski An approximation of betweenness centrality for social networks
WO2015178758A1 (en) A system and method for analyzing concept evolution using network analysis

Legal Events

Date Code Title Description
E902 Notification of reason for refusal