KR102284436B1 - 인공 신경망을 이용한 소셜 네트워크 완성 방법 및 장치 - Google Patents

인공 신경망을 이용한 소셜 네트워크 완성 방법 및 장치 Download PDF

Info

Publication number
KR102284436B1
KR102284436B1 KR1020190126749A KR20190126749A KR102284436B1 KR 102284436 B1 KR102284436 B1 KR 102284436B1 KR 1020190126749 A KR1020190126749 A KR 1020190126749A KR 20190126749 A KR20190126749 A KR 20190126749A KR 102284436 B1 KR102284436 B1 KR 102284436B1
Authority
KR
South Korea
Prior art keywords
network
neural network
connection relationship
node
networks
Prior art date
Application number
KR1020190126749A
Other languages
English (en)
Other versions
KR20210043881A (ko
Inventor
신원용
트란콩
Original Assignee
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단 filed Critical 연세대학교 산학협력단
Priority to KR1020190126749A priority Critical patent/KR102284436B1/ko
Priority to US16/900,609 priority patent/US11669717B2/en
Publication of KR20210043881A publication Critical patent/KR20210043881A/ko
Application granted granted Critical
Publication of KR102284436B1 publication Critical patent/KR102284436B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • G06Q50/30

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Operations Research (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

인공 신경망을 이용한 소셜 네트워크 완성 방법 및 장치가 개시된다. 개시된 장치는, 미싱 노드가 노출되지 않은 대상 네트워크를 입력받아 미싱 노드의 연결 관계를 신경망을 통해 추론하며, 다양한 노드 순서에 따라 다수의 후보 완성 네트워크를 출력하는 신경망부; 및 상기 신경망부에서 출력하는 다수의 후보 완성 네트워크 중 어느 하나를 선정하는 선정하는 선정부를 포함하되, 상기 신경망부는 상기 대상 네트워크와 유사한 속성을 가지는 준거 네트워크들의 그래프 구조가 학습된 그래프 생성 신경망의 가중치를 이용하여 다수의 후보 완성 네트워크를 출력하며, 상기 선정부는 상기 학습된 그래프 생성 신경망으로부터 획득되는 연결 관계 확률 벡터를 이용하여 상기 연결 관계 확률 벡터에 기초할 때 상기 대상 네트워크와 확률적으로 가장 유사한 구조를 가지는 후보 완성 네트워크를 선정한다. 개시된 장치 및 방법에 의하면, 트루 데이터를 확보할 수 없는 소셜 네트워크의 한계를 극복하고 비교적 정확하게 미싱 노드를 추론할 수 있는 장점이 있다.

Description

인공 신경망을 이용한 소셜 네트워크 완성 방법 및 장치{Method and Device for Completing Social Network Using Artificial Neural Network}
본 발명은 소셜 네트워크 완성 방법에 관한 것으로서, 더욱 상세하게는 인공 신경망을 이용한 소셜 네트워크 완성 방법 및 장치에 관한 것이다.
근래에 들어 다양한 종류의 SNS 서비스가 제공되면서 사용자들은 SNS를 통해 다양한 친구 관계로 연결되어 있다. 이러한 소셜 네트워크에서의 사용자들과의 연결 관계는 다양한 용도로 유용하게 활용된다.
예를 들어, 사용자들 간의 친구 관계를 이용하여 사용자 커뮤니티를 파악할 수 있으며, 이러한 커뮤니티는 사용자들에 대한 타겟 마케팅 및 사용자들의 성향 분석, 다운스트림 마이닝 등의 용도로 활용될 수 있다.
그러나, 일부 사용자들은 친구 관계를 노출하지 않으며, 노출되지 않은 친구 관계로 인해 완벽한 소셜 네트워크 구조를 파악하는 것은 용이하지 않다. 노출되지 않은 친구 관계는 특정 소셜 네트워크가 가지는 구조적 특성을 명확히 파악하는데 장애 요인으로 작용하며, 이를 위해 노출되지 않은 친구 관계를 추론하려는 다양한 시도가 이루어졌다.
이와 같이 소셜 네트워크에서 노출되지 않은 친구 관계를 추론하여 트루(True) 네트워크를 예측하는 것을 네트워크 완성이라고 한다. 노출되지 않은 친구 관계는 참값을 알 수 없는 정보이기에 정확한 네트워크 완성에는 본질적인 한계가 존재한다.
네트워크 완성을 위한 다양한 알고리즘이 제시되었고, 대표적인 방법으로 크로네커 기반 네트워크 완성 방법이 있다. 그러나, 크로네커 기반 네트워크 완성 방법은 네트워크가 순수 멱 법칙(Power Law)을 따른다는 가정하에서 이루어지기에 네트워크가 이러한 멱 법칙 구조를 따르지 않는 속성을 가질 경우 매우 부정확한 네트워크 완성이 이루어지는 문제점이 있었다.
본 발명은 트루 데이터를 확보할 수 없는 소셜 네트워크의 한계를 극복하고 비교적 정확하게 미싱 노드를 추론할 수 있는 인공 신경망을 이용한 네트워크 복원 방법 및 장치를 제안한다.
상기와 같은 목적을 달성하기 위해, 본 발명의 일 측면에 따르면, 미싱 노드가 노출되지 않은 대상 네트워크를 입력받아 미싱 노드의 연결 관계를 신경망을 통해 추론하며, 다양한 노드 순서에 따라 다수의 후보 완성 네트워크를 출력하는 신경망부; 및 상기 신경망부에서 출력하는 다수의 후보 완성 네트워크 중 어느 하나를 선정하는 선정하는 선정부를 포함하되, 상기 신경망부는 상기 대상 네트워크와 유사한 속성을 가지는 준거 네트워크들의 그래프 구조가 학습된 그래프 생성 신경망의 가중치를 이용하여 다수의 후보 완성 네트워크를 출력하며, 상기 선정부는 상기 학습된 그래프 생성 신경망으로부터 획득되는 연결 관계 확률 벡터를 이용하여 상기 연결 관계 확률 벡터에 기초할 때 상기 대상 네트워크와 확률적으로 가장 유사한 구조를 가지는 후보 완성 네트워크를 선정하는 네트워크 완성 장치가 제공된다.
상기 신경망부로는 상기 대상 네트워크의 가시 노드 및 추론하려는 미싱 노드에 대해 임의의 순서를 설정한 순서 정보가 입력되고, 상기 신경망부는 상기 순서 정보별로 후보 완성 네트워크를 출력한다.
상기 학습되는 그래프 생성 신경망은 상기 준거 네트워크의 토폴로지에 관한 함수(ftrans)및 연결 관계 확률(fou)에 대한 함수를 학습하여 가중치를 설정한다.
상기 학습되는 그래프 생성 신경망은 상기 토폴로지에 관한 함수 및 연결 관계 확률에 대한 함수를 이용하여 순차적으로 노드를 페인팅하여 그래프를 생성한다.
상기 연결 관계 확률 벡터는 상기 그래프 생성 신경망을 통해 생성되는 그래프 토폴로지의 연결 관계들에 대한 확률 정보이다.
상기 선정부는 다음의 수학식에 기초하여 후보 완성 네트워크 중 하나를 선정한다.
Figure 112019104210215-pat00001
위 수학식에서 G는 후보 완성 네트워크들을 의미하고, GO는 입력되는 대상 네트워크를 의미하며, θ는 연결 관계 확률 벡터를 의미하고,
Figure 112019104210215-pat00002
는 선정되는 후보 완성 네트워크를 의미함.
본 발명의 다른 측면에 따르면, 미싱 노드가 노출되지 않은 대상 네트워크를 입력받아 미싱 노드의 연결 관계를 신경망을 통해 추론하며, 다양한 노드 순서에 따라 다수의 후보 완성 네트워크를 출력하는 단계(a); 및 상기 단계(a)에서 출력하는 다수의 후보 완성 네트워크 중 어느 하나를 선정하는 선정하는 단계(b)를 포함하되, 상기 단계(a)는 상기 대상 네트워크와 유사한 속성을 가지는 준거 네트워크들의 그래프 구조가 학습된 그래프 생성 신경망의 가중치를 이용하여 다수의 후보 완성 네트워크를 출력하며, 상기 단계(b)는 상기 학습된 그래프 생성 신경망으로부터 획득되는 연결 관계 확률 벡터를 이용하여 상기 연결 관계 확률 벡터에 기초할 때 상기 대상 네트워크와 확률적으로 가장 유사한 구조를 가지는 후보 완성 네트워크를 선정하는 네트워크 완성 방법이 제공된다.
본 발명의 일 실시예에 따르면, 트루 데이터를 확보할 수 없는 소셜 네트워크의 한계를 극복하고 비교적 정확하게 미싱 노드를 추론할 수 있는 장점이 있다.
도 1은 일반적인 소셜 네트워크의 구조를 나타낸 도면.
도 2는 도 1에 도시된 소셜 네트워크를 구성하는 노드들의 연결 관계를 나타낸 매트릭스.
도 3은 노출되지 않은 친구 관계를 포함하는 소셜 네트워크의 일례를 나타낸 도면.
도 4는 본 발명의 일 실시예에 따른 네트워크 완성을 설명하기 위한 도면.
도 5는 본 발명의 일 실시예에 따른 네트워크 완성 장치를 학습하기 위한 구조를 나타낸 도면.
도 6은 본 발명의 일 실시예에 따른 그래프 생성 신경망(500)의 추론 과정을 나타낸 개념도.
도 7은 본 발명의 일 실시에에 따른 네트워크 완성 신경망 모듈(510)의 개념적 구조를 나타낸 도면.
도 8은 본 발명의 일 실시예에 따른 신경망부(700)에서의 그래프 완성 과정의 일례를 나타낸 도면.
이하에서는 첨부한 도면을 참조하여 본 발명을 설명하기로 한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 따라서 여기에서 설명하는 실시예로 한정되는 것은 아니다.
그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 부재를 사이에 두고 "간접적으로 연결"되어 있는 경우도 포함한다.
또한 어떤 부분이 어떤 구성 요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 구비할 수 있다는 것을 의미한다.
이하 첨부된 도면을 참고하여 본 발명의 실시예를 상세히 설명하기로 한다.
도 1은 일반적인 소셜 네트워크의 구조를 나타낸 도면이고, 도 2는 도 1에 도시된 소셜 네트워크를 구성하는 노드들의 연결 관계를 나타낸 매트릭스이다.
도 1을 참조하면, 도 1에 표시된 각 노드들은 소셜 네트워크를 구성하는 사용자이다. 도 1에서, 특정 노드는 다른 노드와 연결되어 있다. 예를 들어, 1번 노드는 2번 노드, 3번 노드 및 4번 노드와 연결되어 있으며, 노드의 연결은 1번 노드의 사용자가 2번 노드 사용자, 3번 노드 사용자 및 4번 노드 사용자와 친구 관계라는 것을 의미한다.
페이스북이나 인스타그램과 같은 소셜 네트워크는 사용자들이 다양한 관계로 연결되어 있으며 이러한 사용자들간의 연결 관계를 사용자 커뮤니티를 탐지하는 유용한 정보로 작용한다. 사용자들간의 연결 관계를 통해 탐지되는 커뮤니티는 다양한 마케팅 및 정보 제공 대상으로 사용될 수 있다.
도 2에 도시된 사용자들간의 연결 관계를 네트워크는 매트릭스는 컬럼 및 로우 각각이 노드 번호를 나타내며, 1로 표시된 부분은 컬럼 및 로우에 해당되는 사용자들간의 관계가 친구 관계라는 것을 의미하고 0으로 표시된 부분은 컬럼 및 로우에 해당되는 사용자들간의 관계가 친구 관계가 아니라는 것을 의미한다.
도 1에 도시되 것과 같은 네트워크 연결 토폴로지는 도 2와 같은 연결 관계 매트릭스를 통해 벡터의 형태로 표현될 수도 있는 것이다.
그러나, 많은 소셜 네트워크의 사용자들은 다른 사용자와의 친구 관계를 노출시키지 않기도 한다. 이와 같이, 친구 관계를 노출시키지 않는 사용자들로 인해 정확한 소셜 네트워크를 파악하기 어려우며, 이는 부정확하게 커뮤니티를 탐지하는 주요한 요인이 된다. 부정확한 커뮤니티 탐지로 인해 부적절한 마케팅 및 정보 제공이 이루어질 수 있으며, 노출되지 않은 친구 관계를 파악하는 것은 다양한 이유로 필요할 수 있다.
도 3은 노출되지 않은 친구 관계를 포함하는 소셜 네트워크의 일례를 나타낸 도면이다.
도 3에서 실선으로 표시된 노드는 관찰 가능한 노드(사용자)들이고, 점선으로 표시된 노드는 친구 관계를 노출시키지 않아 숨겨진 노드이다. 본 명세서에서는 관찰 가능한 노드를 '가시 노드(Visible Node)'로 정의하고 숨겨진 노드를 미싱 노드(Missing Node)로 정의한다.
통상적으로 네트워크를 관찰할 때, 도 3에 도시된 노드들 중 가시 노드와 가시 노드들간의 관계만 관찰되며, 미싱 노드의 존재 및 미싱 노드들의 연결 관계는 관찰되지 않는다.
관찰되지 않는 미싱 노드 및 미싱 노드들의 연결 관계를 복원하는 것을 네트워크 완성이라고 하며, 본 발명은 이러한 네트워크 완성에 관한 것이다. 결국, 본 발명은 가시 노드만이 관찰되는 특정 소셜 네트워크로부터 해당 소셜 네트워크에 숨겨진 미싱 노드 및 미싱 노드들의 연결 관계를 복원하는 것이다.
도 4는 본 발명의 일 실시예에 따른 네트워크 완성을 설명하기 위한 도면이다.
도 4의 좌측에 표시된 네트워크는 트루 네트워크(GT)이며, 가시 노드 및 미싱 노드와 모든 노드들의 연결 관계가 표시된 네트워크이다. 중앙에 표시된 네트워크(GO)는 실제로 관찰되는 네트워크이다. 물음표로 표시된 미싱 노드는 실제로는 관찰할 수 없으며, 도 4에는 2개의 노드가 미싱 노드인 경우가 도시되어 있다.
본 발명이 의도하는 네트워크 완성은 미싱 노드가 관찰되지 않는 네트워크(GO)로부터 미싱 노드 및 미싱 노드들의 연결 관계를 추론하는 것이며, 완성된 네트워크는 도 4의 우측에 도시되어 있다.
본 발명은 인공 신경망을 통해 특정 소셜 네트워크의 미싱 노드 및 미싱 노드들의 연결 관계를 복원한다. 통상적인 인공 신경망의 학습은 ground truth로 명명되는 라벨 정보를 이용하여 이루어진다. 그러나, 미싱 노드 및 미싱 노드들의 연결 관계에 대한 라벨 정보는 현실적으로 획득하기 어려운 문제가 있다. 따라서, 본 발명은 ground truth를 사용하지 않으면서 숨겨진 미싱 노드들 및 미싱 노드들의 연결 관계를 복원하는 네트워크 완성 방법을 제안한다.
도 5는 본 발명의 일 실시예에 따른 네트워크 완성 장치를 학습하기 위한 구조를 나타낸 도면이다.
도 5를 참조하면, 본 발명의 네트워크 완성 장치는 그래프 생성 신경망(500)을 이용하여 학습을 수행한다. 그래프 생성 신경망(500)은 다양한 형태의 그래프들의 생성을 위해 기존에 이용되었던 신경망이다. 본 발명은 소셜 네트워크를 일종의 그래프로 간주하고, 그래프 생성 신경망(500)을 학습하여 네트워크를 완성하도록 한다.
또한, 그래프 생성 신경망(500)의 학습을 위한 학습 자료로 네트워크 복원 대상인 소셜 네트워크와 유사한 속성을 가지는 준거 소셜 네트워크를 활용한다. 예를 들어, 네트워크 복원 대상인 소셜 네트워크가 신촌 소재 제1 대학 남학생의 소셜 네트워크라고 가정하면, 이와 유사한 속성을 가지는 다른 소셜 네트워크를 학습 자료로 활용하는 것이다. 예를 들어, 신촌 소재 제2 대학 남학생의 소셜 네트워크를 준거 네트워크로 활용하여 그래프 생성 신경망(500)의 학습 자료로 활용할 수 있을 것이다.
그래프 생성 신경망(500)은 학습 자료로 입력되는 다양한 준거 소셜 네트워크를 이용하여 유사한 속성을 가지는 소셜 네트워크들의 구조를 학습한다. 구체적으로 그래프 생성 신경망(500)은 학습을 통해 연결 관계 확률 벡터(θ)를 출력한다. 연결 관계 확률 벡터는 네트워크를 구성하는 노드들의 연결 관계들의 확률 정보를 나타낸 벡터이다.
그래프 생성 신경망(500)의 학습을 통해 출력되는 연결 관계 확률 벡터의 구체적인 구조 및 상세한 학습 방법은 별도의 도면을 참조하여 설명한다.
그래프 생성 신경망(500)에서의 학습이 완료된 후, 미싱 노드를 포함하는 소셜 네트워크의 완성은 네트워크 완성 신경망 모듈(510)에 의해 이루어진다. 네트워크 완성 신경망 모듈(510)로는 완성 대상 소셜 네트워크(GO)가 입력된다. 입력되는 소셜 네트워크는 가시 노드 및 가시 노드들 간의 연결 관계 정보만을 포함하며, 네트워크 완성 신경망 모듈(510)은 입력된 소셜 네트워크로부터 미싱 노드 및 미싱 노드들의 연결 관계를 추론하여 네트워크 완성을 수행한다.
네트워크 완성 신경망 모듈(510)로는 그래프 생성 신경망(500)에서 학습을 통해 획득되는 연결 관계 확률 벡터가 입력되며, 네트워크 완성 신경망 모듈(510)은 연결 관계 확률 벡터에 기초하여 미싱 노드 및 미싱 노드들의 연결 관계를 추론한다.
앞서 설명한 바와 같이, 노출되지 않은 친구 관계에 대한 트루 데이터(True Data)는 획득하기 어려우며, 본 발명은 이러한 특성을 가지는 소셜 네트워크로부터 네트워크 완성을 수행하기 위해 그래프 생성 신경망(500)을 이용한다. 이를 위해, 소셜 네트워크를 그래프 생성을 위한 벡터 정보로 변환한 후 그래프 생성 신경망(500)에서 학습을 수행하도록 한다. 또한, 트루 데이터(True Data)가 획득되지 아니하므로 유사한 속성을 가지는 준거 집단의 소셜 네트워크를 그래프 생성 신경망(500)에서 그래프의 형태로 학습한다.
도 5를 참조하여 본 발명의 개괄적인 개요에 대해 설명하였으며, 이하에서는 그래프 생성 신경망(500) 및 네트워크 완성 신경망 모듈(510)의 구체적인 구조 및 동작에 대해 설명한다.
도 6은 본 발명의 일 실시예에 따른 그래프 생성 신경망(500)의 추론 과정을 나타낸 개념도이다.
그래프 생성 신경망(500)은 네트워크 구조를 학습하기 위한 신경망은 아니고, 그래프를 페인팅하기 위한 신경망이다. 그래프 생성 신경망(500)은 학습되는 그래프들의 특징 정보를 추론하고, 추론된 특징 정보에 기초하여 그래프 페인팅을 학습하는 신경망이다. 본 발명은 네트워크 구조와 그래프의 구조가 유사하다는 점에 착안하여 그래프 완성을 위해 그래프 생성 신경망(500)을 이용하며, 이와 같은 그래프 생성 신경망(500)의 이용은 본 발명의 주요한 특징 중 하나이다.
그래프 생성 신경망(500)은 입력되는 네트워크 구조에 기초하여 두 개의 정보를 추론하며, 추론하는 두 개의 정보는 그래프 토폴로지 벡터와 연결 관계 확률 벡터이다.
그래프 토폴로지 벡터는 그래프의 토폴로지 구조를 나타낸 벡터이다. 예를 들어, 도 6을 참조하면, 생성되는 최종 그래프가 1-2-4-3-1로 연결된 그래프인데 이와 같은 그래프 구조를 벡터의 형태로 나타낸 것이 그래프 토폴로지 벡터이다.
연결 관계 확률 벡터는 그래프를 구성하는 노드들의 연결 관계에 대한 확률 정보에 대한 벡터이다. 예를 들어, 도 6을 참조하면, 노드1과 노드2가 연결되어 있는데, 노드1과 노드2가 연결될 확률 정보가 연결 관계 확률 벡터에 포함되며, 연결 관계 확률 벡터는 그래프의 모든 연결 관계에 대한 확률 정보를 포함한다.
그래프 생성 신경망(500)은 그래프를 구성하는 노드들을 순차적으로 페인팅하는 방식으로 그래프 생성을 학습하며, 페인팅하는 노드의 순서는 미리 주어진다.
네트워크 완성 관점에서, 생성해야 하는 그래프의 총 노드 수는 가시 노드의 수(
Figure 112019104210215-pat00003
)와 미싱 노드의 수(
Figure 112019104210215-pat00004
)를 합친 값이다. 이때, 가능한 노드들의 순서에 대한 경우의 수는
Figure 112019104210215-pat00005
이다.
주어진 노드 순서에 대한 그래프 토폴로지 벡터는 다음의 수학식 1과 같이 표현된다.
Figure 112019104210215-pat00006
위 수학식 1에서,
Figure 112019104210215-pat00007
의 i는 순차적으로 페인팅(생성)하는 노드의 인덱스를 나타내며, 는
Figure 112019104210215-pat00008
는 i번째 순서에서 노드들간의 연결 관계를 나타내는 벡터이다.
도 6을 참조하면,
Figure 112019104210215-pat00009
는 공집합에서 시작한다. 첫번째 노드인 1번 노드가 h1에서 생성되고,
Figure 112019104210215-pat00010
에는 다음에 생성되는 노드의 연결 관계가 기록된다. 도 6에서,
Figure 112019104210215-pat00011
는 {1}로 정의되어 있으며, 이는 다음에 생성되는 노드가 1번 노드와 연결된다는 것을 의미한다. 또한, θ2에는
Figure 112019104210215-pat00012
의 연결 관계에 대한 확률 정보가 기록된다. 도 6에는 θ2가 0.9인 경우가 도시되어 있으며, 이는 1번 노드와 다음에 생성되는 노드가 연결될 확률이 0.9라는 것을 의미한다.
h2에는
Figure 112019104210215-pat00013
에 기초하여 다음 노드인 2번 노드가 생성된다.
Figure 112019104210215-pat00014
가 {1}이므로 다음에 생성되는 2번 노드는 1번 노드와 연결되어 생성되는 것을 h2로부터 확인할 수 있다.
Figure 112019104210215-pat00015
는 {1,0}으로 정의되어 있으며, 이는 다음에 생성되는 3번 노드와 기 생성된 노드들간의 연결 관계를 순차적으로 나타내며, {1,0}을 통해 다음에 생성되는 3번 노드가 1번 노드와는 연결되고 2번 노드와는 연결되지 않는 것을 의미한다. 한편, θ3는 {0.8, 0.1}로 설정되어 있으며, 이는 1번 노드와 3번 노드가 연결될 확률이 0.8이고 2번 노드와 3번 노드가 연결될 확률이 0.1이라는 것을 의미한다.
h3에는
Figure 112019104210215-pat00016
에 기초하여 1번 노드와는 연결되고 2번 노드와는 연결되지 않는 3번 노드가 도시되어 있다.
Figure 112019104210215-pat00017
는 {0, 1, 1}로 설정되어 있으며, 이는 다음에 생성되는 4번 노드와 기 생성된 노드들의 연결 관계를 나타낸 것이고, 4번 노드는 1번 노드와는 연결되지 않고 2번 노드 및 3번 노드와는 연결된다는 것을 의미한다. θ4는 {0.2, 0.7, 0.8}로 설정되어 있으며, 이는
Figure 112019104210215-pat00018
의 연결 관계에 대한 확률 정보이다.
h4에는
Figure 112019104210215-pat00019
에 기초하여 2번 및 3번 노드와 연결되며 1번 노드와 연결되지 않는 4번 노드가 도시되어 있다.
그래프 토폴로지 벡터를 구성하는
Figure 112019104210215-pat00020
는 다음의 수학식 2와 같이 표현될 수 있다.
Figure 112019104210215-pat00021
위 수학식 2에서,
Figure 112019104210215-pat00022
는 (u,v)번째 노드와의 연결 관계를 나타낸다.
또한, 그래프 토폴로지 벡터에 대한 확률 분포는 다음의 수학식 3과 같이 표현될 수 있다.
Figure 112019104210215-pat00023
위 수학식 3의 확률 분포는 그래프 토폴로지들에 대한 확률 분포로서, 특정 토폴로지의 그래프가 학습된 그래프 구조를 따를 확률로 정의할 수도 있을 것이며, 위 수학식 3과 같이 조건부 확률의 형태로 구해질 수 있을 것이다.
본 발명의 일 실시예에 따르면, 그래프 생성 신경망(500)은 RNN 구조의 네트워크를 포함할 수 있을 것이다.
RNN 구조의 그래프 생성 신경망(500)은 그래프 토폴로지와 그래프 토롤로지의 연결 관계에 대한 확률 정보를 학습하는 것이다. 구체적으로, 그래프 생성 신경망은 토폴로지에 관한 ftrans 및 연결 관계 확률에 대한 fout의 두가지 함수를 학습하는 것으로 정의할 수 있으며, ftrans 및 fout은 다음의 수학식 4 및 수학식 5와 같이 정의할 수 있다.
Figure 112019104210215-pat00024
Figure 112019104210215-pat00025
그래프 생성 신경망의 ftrans 및 fout은 학습에 의해 형성되며, 이들 함수의 가중치가 학습에 의해 결정되는 것이다.
준거 네트워크를 이용하여 학습된 그래프 생성 신경망으로부터 연결 관계 확률 벡터인 θ를 획득하고, 본 발명은 획득된 θ를 이용하여 대상 네트워크를 완성한다.
앞서 설명한 바와 같이, 본 발명은 네트워크 완성 신경망 모듈(510)을 이용하여 네트워크 완성을 수행하며, 네트워크 완성 신경망 모듈(510)로는 연결 관계 확률 벡터인 θ가 입력된다.
미싱 노드를 포함하는 대상 네트워크(GO)는 네트워크 완성 신경망 모듈(510)의 신경망과 연결 관계 확률 벡터 θ를 이용하여 이루어진다.
도 7은 본 발명의 일 실시에에 따른 네트워크 완성 신경망 모듈(510)의 개념적 구조를 나타낸 도면이다.
도 7을 참조하면, 본 발명의 일 실시예에 따른 네트워크 완성 신경망 모듈은 신경망부(700) 및 선정부(710)를 포함한다.
신경망부(700)는 기 학습된 그래프 생성 신경망(500)의 가중치를 따르는 신경망이다. 신경망부(700)로는 미싱 노드를 포함하는 노드 순서가 입력되며, 신경망부(700)는 학습된 가중치에 기초하여 그래프 구조를 완성한다.
도 8은 본 발명의 일 실시예에 따른 신경망부(700)에서의 그래프 완성 과정의 일례를 나타낸 도면이다.
도 8에는 A, B, C 세개의 노드가 가시 노드이고 D, E가 미싱 노드인 경우가 도시되어 있다. 본 발명의 신경망부(700)로는 미싱 노드의 수를 미리 설정하여 미싱 노드를 포함하는 특정 순서의 노드가 입력된다.
도 8에는 페인팅(생성)하는 노드 순서가 {E, D, A, C, B}인 경우가 도시되어 있다. 여기서, E 및 D는 연결 관계를 알 수 없는 미싱 노드이다.
도 8에 도시된 바와 같이, 신경망부(700)는 기 학습된 가중치를 따르는 ftrans 및 fout을 이용하여
Figure 112019104210215-pat00026
를 추론하면서 특정 순서의 네트워크를 완성한다. 도 8에서, 미싱 노드인 D 및 E의 연결 관계는 알 수 없으므로 초기에는 ?로 표시되어 있으나, 학습된 ftrans 및 fout을 이용하여
Figure 112019104210215-pat00027
를 추론하게 된다.
신경망부(700)은 미싱 노드를 포함하는 가능한 모둔 순서별로 네트워크 완성을 수행하여 후보 완성 네트워크를 출력한다. 도 8과 같이 3개의 가시 노드와 2개의 미싱 노드가 존재하는 경우 총 5!의 경우의 수가 존재하게 되며, 총 120개의 경우의 수가 존재하게 된다.
선정부(710)는 다수의 후보 완성 네트워크 중 하나를 선정하여 최종적인 네트워크 완성을 수행한다. 선정부(710)는 학습된 그래프 생성 신경망(500)으로부터 획득되는 연결 관계 확률 벡터 θ를 이용하여 최종적인 완성 네트워크를 선정한다.
선정부(710)는 각각의 후보 완성 네트워크들 중 연결 관계 확률 벡터에 기초할 때 입력되는 대상 네트워크(GO)와 유사도 확률이 가장 높은 후보 완성 네트워크를 선정한다. 이와 같은 완성 네트워크 선정은 다음의 수학식 6과 같이 표현될 수 있다.
Figure 112019104210215-pat00028
위 수학식 6과 같이, 선정부(710)는 출력되는 후보 완성 네트워크들(G) 중 연결 관계 확률 벡터(θ)에 기초할 때 대상 네트워크의 구조와 확률적으로 가장 유사한 구조를 가지는 특정 순서의 완성 네트워크(
Figure 112019104210215-pat00029
)를 선정하는 것이다.
도 7 및 도 8을 참조하여 설명한 본 발명의 네트워크 완성은 예시적인 것이며 다양한 방식으로 변경될 수 있을 것이다. 예를 들어, 후보 완성 네트워크는 모든 경우의 수에 대해 출력되지 않을 수도 있을 것이다. 가능성 있는 일부 경우의 수에 대해서만 후보 완성 네트워크가 출력된 후 선정 과정이 이루어질 수도 있을 것이다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다.
그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.
예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (13)

  1. 미싱 노드가 노출되지 않은 대상 네트워크를 입력받아 미싱 노드의 연결 관계를 신경망을 통해 추론하며, 다양한 노드 순서에 따라 다수의 후보 완성 네트워크를 출력하는 신경망부; 및
    상기 신경망부에서 출력하는 다수의 후보 완성 네트워크 중 어느 하나를 선정하는 선정하는 선정부를 포함하되,
    상기 신경망부는 상기 대상 네트워크와 유사한 속성을 가지는 준거 네트워크들의 그래프 구조가 학습된 그래프 생성 신경망의 가중치를 이용하여 다수의 후보 완성 네트워크를 출력하며,
    상기 선정부는 상기 학습된 그래프 생성 신경망으로부터 획득되는 연결 관계 확률 벡터를 이용하여 상기 연결 관계 확률 벡터에 기초할 때 상기 대상 네트워크와 확률적으로 가장 유사한 구조를 가지는 후보 완성 네트워크를 선정하고,
    상기 신경망부로는 상기 대상 네트워크의 가시 노드 및 추론하려는 미싱 노드에 대해 임의의 순서를 설정한 순서 정보가 입력되고, 상기 신경망부는 상기 순서 정보별로 후보 완성 네트워크를 출력하며,
    상기 연결 관계 확률 벡터는 상기 그래프 생성 신경망을 통해 생성되는 그래프 토폴로지의 연결 관계들에 대한 확률 정보인 것을 특징으로 하는 네트워크 완성 장치.
  2. 삭제
  3. 제1 항에 있어서,
    상기 학습되는 그래프 생성 신경망은 상기 준거 네트워크의 토폴로지에 관한 함수(ftrans)및 연결 관계 확률(fou)에 대한 함수를 학습하여 가중치를 설정하는 것을 특징으로 하는 네트워크 완성 장치.
  4. 제3 항에 있어서,
    상기 학습되는 그래프 생성 신경망은 상기 토폴로지에 관한 함수 및 연결 관계 확률에 대한 함수를 이용하여 순차적으로 노드를 페인팅하여 그래프를 생성하는 것을 특징으로 하는 네트워크 완성 장치.
  5. 삭제
  6. 제1항에 있어서,
    상기 선정부는 다음의 수학식에 기초하여 후보 완성 네트워크 중 하나를 선정하는 것을 특징으로 하는 네트워크 완성 장치.
    Figure 112019104210215-pat00030

    위 수학식에서 G는 후보 완성 네트워크들을 의미하고, GO는 입력되는 대상 네트워크를 의미하며, θ는 연결 관계 확률 벡터를 의미하고,
    Figure 112019104210215-pat00031
    는 선정되는 후보 완성 네트워크를 의미함.
  7. 네트워크 완성 장치에서 수행되는 네트워크 완성 방법으로서,
    미싱 노드가 노출되지 않은 대상 네트워크를 입력받아 미싱 노드의 연결 관계를 신경망을 통해 추론하며, 다양한 노드 순서에 따라 다수의 후보 완성 네트워크를 출력하는 단계(a); 및
    상기 단계(a)에서 출력하는 다수의 후보 완성 네트워크 중 어느 하나를 선정하는 선정하는 단계(b)를 포함하되,
    상기 단계(a)는 상기 대상 네트워크와 유사한 속성을 가지는 준거 네트워크들의 그래프 구조가 학습된 그래프 생성 신경망의 가중치를 이용하여 다수의 후보 완성 네트워크를 출력하며,
    상기 단계(b)는 상기 학습된 그래프 생성 신경망으로부터 획득되는 연결 관계 확률 벡터를 이용하여 상기 연결 관계 확률 벡터에 기초할 때 상기 대상 네트워크와 확률적으로 가장 유사한 구조를 가지는 후보 완성 네트워크를 선정하고,
    상기 단계(a)에서 상기 대상 네트워크의 가시 노드 및 추론하려는 미싱 노드에 대해 임의의 순서를 설정한 순서 정보가 입력되고, 상기 순서 정보별로 후보 완성 네트워크를 출력하며,
    상기 연결 관계 확률 벡터는 상기 그래프 생성 신경망을 통해 생성되는 그래프 토폴로지의 연결 관계들에 대한 확률 정보인 것을 특징으로 하는 네트워크 완성 방법.
  8. 삭제
  9. 제7 항에 있어서,
    상기 학습되는 그래프 생성 신경망은 상기 준거 네트워크의 토폴로지에 관한 함수(ftrans)및 연결 관계 확률(fou)에 대한 함수를 학습하여 가중치를 설정하는 것을 특징으로 하는 네트워크 완성 방법.
  10. 제9 항에 있어서,
    상기 학습되는 그래프 생성 신경망은 상기 토폴로지에 관한 함수 및 연결 관계 확률에 대한 함수를 이용하여 순차적으로 노드를 페인팅하여 그래프를 생성하는 것을 특징으로 하는 네트워크 완성 방법.
  11. 삭제
  12. 제7항에 있어서,
    상기 단계(b)는 다음의 수학식에 기초하여 후보 완성 네트워크 중 하나를 선정하는 것을 특징으로 하는 네트워크 완성 방법.
    Figure 112021059272428-pat00032

    위 수학식에서 G는 후보 완성 네트워크들을 의미하고, GO는 입력되는 대상 네트워크를 의미하며, θ는 연결 관계 확률 벡터를 의미하고,
    Figure 112021059272428-pat00033
    는 선정되는 후보 완성 네트워크를 의미함.



  13. 삭제
KR1020190126749A 2019-10-14 2019-10-14 인공 신경망을 이용한 소셜 네트워크 완성 방법 및 장치 KR102284436B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020190126749A KR102284436B1 (ko) 2019-10-14 2019-10-14 인공 신경망을 이용한 소셜 네트워크 완성 방법 및 장치
US16/900,609 US11669717B2 (en) 2019-10-14 2020-06-12 Method and device for completing social network using artificial neural network

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190126749A KR102284436B1 (ko) 2019-10-14 2019-10-14 인공 신경망을 이용한 소셜 네트워크 완성 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20210043881A KR20210043881A (ko) 2021-04-22
KR102284436B1 true KR102284436B1 (ko) 2021-07-30

Family

ID=75384034

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190126749A KR102284436B1 (ko) 2019-10-14 2019-10-14 인공 신경망을 이용한 소셜 네트워크 완성 방법 및 장치

Country Status (2)

Country Link
US (1) US11669717B2 (ko)
KR (1) KR102284436B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230069578A (ko) 2021-11-12 2023-05-19 연세대학교 산학협력단 그래프 신경망을 이용한 부호 인지 추천 장치 및 방법
KR20230171741A (ko) 2022-06-14 2023-12-21 연세대학교 산학협력단 프로토타입 유사도 기반 그래프 네트워크 해석 장치 및 방법

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102588389B1 (ko) 2021-08-25 2023-10-11 연세대학교 산학협력단 그래프 인공 신경망 기반 엣지리스 네트워크 임베딩 장치 및 방법
CN113850381A (zh) * 2021-09-15 2021-12-28 支付宝(杭州)信息技术有限公司 一种图神经网络训练方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11468262B2 (en) * 2017-10-30 2022-10-11 Nec Corporation Deep network embedding with adversarial regularization
US10693739B1 (en) * 2019-05-29 2020-06-23 Accenture Global Solutions Limited Network design platform

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Antonino Freno et al., "Learning to Recommend Links using Graph Structure and Node Content," Neural Information Processing Systems Workshop on Choice Models and Preference Learning (2011.11.16.)*
Jiaxuan You et al., "GraphRNN: Generating Realistic Graphs with Deep Auto-regressive Models," arXiv:1802.08773v3 [cs.LG] (2018.06.23.)*
Myunghwan Kim and Jure Leskovec, "The Network Completion Problem: Inferring Missing Nodes and Edges in Networks," Proceedings of the Eleventh SIAM International Conference on Data Mining, SDM 2011 (2011.04.28.)*

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230069578A (ko) 2021-11-12 2023-05-19 연세대학교 산학협력단 그래프 신경망을 이용한 부호 인지 추천 장치 및 방법
KR20230171741A (ko) 2022-06-14 2023-12-21 연세대학교 산학협력단 프로토타입 유사도 기반 그래프 네트워크 해석 장치 및 방법

Also Published As

Publication number Publication date
US11669717B2 (en) 2023-06-06
US20210110242A1 (en) 2021-04-15
KR20210043881A (ko) 2021-04-22

Similar Documents

Publication Publication Date Title
KR102284436B1 (ko) 인공 신경망을 이용한 소셜 네트워크 완성 방법 및 장치
Bouneffouf et al. Optimal exploitation of clustering and history information in multi-armed bandit
CN109033107B (zh) 图像检索方法和装置、计算机设备和存储介质
CN112861967B (zh) 基于异构图神经网络的社交网络异常用户检测方法及设备
CN110837602A (zh) 基于表示学习和多模态卷积神经网络的用户推荐方法
CN105677648B (zh) 一种基于标签传播算法的社团发现方法及系统
CN112256981B (zh) 一种基于线性和非线性传播的谣言检测方法
CN104462592A (zh) 基于不确定语义的社交网用户行为关系推演系统及方法
CN107391542A (zh) 一种基于文件知识图谱的开源软件社区专家推荐方法
CN112990385B (zh) 一种基于半监督变分自编码器的主动众包图像学习方法
Hanga et al. A graph-based approach to interpreting recurrent neural networks in process mining
CN103198432B (zh) 在线社会网络中网络群体的检测方法及系统
CN109447110A (zh) 综合邻居标签相关性特征和样本特征的多标签分类的方法
CN108710900A (zh) 一种基于d-s推理的多平台传感器测量数据融合方法
CN114510653B (zh) 社交群体推荐方法、系统、设备及存储介质
CN106777284A (zh) 一种基于标签信息的图游走表示方法
CN103559318B (zh) 对异质信息网络包含的对象进行排序的方法
Singh et al. Decision tree based mobile crowdsourcing for agriculture advisory system
CN114564648A (zh) 基于大数据的个性化服务内容优化方法及人工智能云系统
CN110765927A (zh) 一种植被群落中伴生杂草的识别方法
Chen Multiple criteria choice modeling using the grounds of T‐spherical fuzzy REGIME analysis
CN114218457A (zh) 一种基于转发社交媒体用户表征的假新闻检测方法
CN113361928A (zh) 一种基于异构图注意力网络的众包任务推荐方法
CN116304311A (zh) 一种在线社交网络垃圾评论用户检测方法
CN111833115A (zh) 一种操作识别方法、装置及存储介质和服务器

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant