KR102114765B1

KR102114765B1 - 타깃 객체의 소셜 계정을 발굴하는 방법, 서버 및 저장 매체

Info

Publication number: KR102114765B1
Application number: KR1020187013604A
Authority: KR
Inventors: 린 리; 페이쇈 천; 첸 천
Original assignee: 텐센트 테크놀로지(센젠) 컴퍼니 리미티드
Priority date: 2016-06-06
Filing date: 2016-11-22
Publication date: 2020-05-25
Also published as: EP3467675A1; EP3467675A4; CN106126521A; CN106126521B; WO2017211051A1; JP6574904B2; US20180262883A1; JP2019500685A; EP3467675B1; US11606671B2; KR20180069867A

Abstract

본 발명의 실시예는 타깃 객체의 소셜 계정을 발굴하는 방법, 서버 및 저장 매체를 개시한다. 상기 방법은, 상기 타깃 객체의 속성 정보를 사용하여 상기 타깃 객체가 속한 타깃 소셜 그룹의 위치를 파악하는 단계; 상기 타깃 소셜 그룹 내의 소셜 계정의 미리 설정된 정보를 파싱하여, 상기 소셜 계정에 대응하는 사용자의 제1 신원 정보를 획득하는 단계; 상기 제1 신원 정보를 상기 타깃 객체의 제2 신원 정보와 매칭시키는 단계; 및 상기 제2 신원 정보와 매칭되는 상기 제1 신원 정보의 소셜 계정을 상기 타깃 객체의 소셜 계정으로 결정하는 단계를 포함한다.

Description

타깃 객체의 소셜 계정을 발굴하는 방법, 서버 및 저장 매체

본 발명은 정보 기술 분야에 관한 것으로, 특히 타깃 객체(target object)의 소셜 계정을 발굴하는 방법, 서버 및 저장 매체에 관한 것이다.

모바일 인터넷의 보급에 따라, 소셜 네트워크를 이용하여 일상의 교류, 정보 동기화, 의견 표명 및 기타 행위를 수행하는 것은 사람들 사이에 매우 인기 있다. 사교 활동(social activity)을 위한 소셜 네트워크에 적용될 수 있는 일반적인 소셜 애플리케이션에는 WeChat, QQ, Douban 등이 있다.

사교적 과정에서, 종종 오피니언 리더(opinion leader)와 같은 사회적 영향력이 큰 사람들이 있다. 오피니언 리더는 자신의 소셜 계정을 사용하여 의견을 표명하고 기사를 공유하는 등으로, 다른 사용자에게 영향을 준다. 구체적인 구현 시에, 계정의 영향력을 통해 제한된 자원으로 최대의 활동 영향을 얻기 위해, 때로는 큰 영향을 미치는 소셜 계정을 발굴할 필요가 있다. 예를 들어, 광고가 특정 그룹의 사람들에게 제시되는 경우, 그 특정 그룹의 사람을 발굴하는 정확도는 클릭률(click rate)에 매우 중요하다. 다른 예를 들어, 은행 신용 보고 프로젝트에서 한 그룹의 속성은 매우 중요한 참조 인자이다. 안전 보장의 측면에서, 소셜 네트워크는 악의적인 사용자 또는 법률 위반자를 신속하게 찾아내는 데 도움이 된다. 광고를 위한 특정 그룹의 사람을 발굴하고, 한 그룹의 사람의 속성을 참조하고, 악의적인 사용자의 위치를 파악하는 것(locating)은 모두 타깃 객체의 소셜 계정의 발굴과 관련된다. 선행 기술에서는, 예를 들어 Facebook에 의해 제공되는 유사성 기반 발굴(similarity-based mining), 소셜 계정의 네트워크 행위(network behavior)에 따른 발굴, 및 사회 조직 구분(social organization division)에 따른 발굴과 같은, 타깃 객체의 소셜 계정을 발굴하는 복수의 방법이 제공된다. 그러나, 실제 적용 시에, 이 방법들은 정확도가 낮거나, 계산 복잡도가 높은 것으로 밝혀졌다.

이러한 관점에서, 본 발명의 실시예는 전술한 문제점의 적어도 일부를 해결하기 위해, 타깃 객체의 소셜 계정을 발굴하는 방법, 서버 및 저장 매체를 제공한다.

전술한 목적을 달성하기 위해, 본 발명의 기술적 방안은 다음과 같이 구현된다:

일 측면에 따르면, 본 발명의 일 실시예는 타깃 객체의 소셜 계정을 발굴하는 방법을 제공하며, 상기 방법은,

상기 타깃 객체의 속성 정보를 사용하여 상기 타깃 객체가 속한 타깃 소셜 그룹의 위치를 파악하는 단계;

상기 타깃 소셜 그룹 내의 소셜 계정의 미리 설정된 정보를 파싱(parsing)하여, 상기 소셜 계정에 대응하는 사용자의 제1 신원 정보(identity information)를 획득하는 단계;

상기 제1 신원 정보를 상기 타깃 객체의 제2 신원 정보와 매칭시키는 단계; 및

상기 제2 신원 정보와 매칭되는 상기 제1 신원 정보의 소셜 계정을 상기 타깃 객체의 소셜 계정으로 결정하는 단계를 포함한다.

다른 측면에 따르면, 본 발명의 일 실시예는 서버를 제공하며, 상기 서버는,

타깃 객체의 속성 정보를 사용하여 상기 타깃 객체가 속한 타깃 소셜 그룹의 위치를 파악하도록 구성된 위치 파악 유닛;

상기 타깃 소셜 그룹 내의 소셜 계정의 미리 설정된 정보를 파싱하여, 상기 소셜 계정에 대응하는 사용자의 제1 신원 정보를 획득하도록 구성된 파싱 유닛;

상기 제1 신원 정보를 상기 타깃 객체의 제2 신원 정보와 매칭시키도록 구성된 매칭 유닛; 및

상기 제2 신원 정보와 매칭되는 상기 제1 신원 정보의 소셜 계정을 상기 타깃 객체의 소셜 계정으로 결정하도록 구성된 결정 유닛을 포함한다.

본 발명의 일 실시예는 컴퓨터로 실행할 수 있는 명령어가 저장된 컴퓨터 저장 매체를 제공하며, 상기 컴퓨터로 실행할 수 있는 명령어는, 전술한 타깃 객체의 소셜 계정을 발굴하는 방법을 수행하는 데 사용된다.

본 발명의 실시예에 제공되는 타깃 객체의 소셜 계정을 발굴하는 방법, 서버 및 저장 매체에 따르면, 소셜 계정의 미리 설정된 정보로부터 사용자의 신원 정보를 추출하고, 추출된 신원 정보를 사용자의 오프라인 신원 정보와 매칭시켜, 타깃 사용자의 소셜 계정의 위치를 정확하게 파악할 수 있다. 온라인 신원 정보와 오프라인 신원 정보 사이의 매칭을 통해, 정확도를 향상시킬 수 있다. 또한, 타깃 사용자의 소셜 계정을 결정하기 위한 다른 방법, 예를 들어, 소셜 계정의 많은 행위에 따라, 신원 정보를 통해 직접 매칭시키는 방법에 비해, 처리해야 할 정보의 양이 적고, 계산 복잡도가 낮고, 계산이 간단한 이점이 있다.

도 1은 본 발명의 일 실시예에 따른 타깃 객체의 소셜 계정을 발굴하는 방법의 개략적 인 흐름도이다.
도 2는 본 발명의 일 실시예에 따른 커뮤니티 네트워크 설립 방법의 개략 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 서버의 개략 구성도이다.
도 4는 본 발명의 일 실시예에 따른 다른 서버의 개략 구성도이다.
도 5는 본 발명의 일 실시예에 따른 타깃 객체의 소셜 계정을 발굴하는 방법의 개략 흐름도이다.
도 6은 본 발명의 일 실시예에 따른 후보 소셜 그룹의 효과를 나타내는 개략도이다.
도 7은 본 발명의 일 실시예에 따른 타깃 소셜 그룹의 효과를 나타내는 개략도이다.
도 8은 본 발명의 일 실시예에 따른 소셜 계정의 사용자 정보 발굴 효과의 제1 개략도이다.
도 9는 본 발명의 일 실시예에 따른 소셜 계정의 사용자 정보 발굴 효과의 제2 개략도이다.
도 10은 본 발명의 실시예에 따라 타깃 객체가 가입한 다른 소셜 그룹의 효과를 나타내는 개략도이다.
도 11은 본 발명의 일 실시예에 따른 신원 정보를 발굴하는 방법의 개략 흐름도이다.
도 12는 본 발명의 일 실시예에 따른 관계 링크 확장에 기초하여 타깃 객체의 소셜 계정을 발굴하는 방법의 개략 흐름도이다.

다음은 첨부된 도면 및 구체적인 실시예를 참조하여 본 발명의 기술적 방안은 더 설명한다. 이하에 설명되는 바람직한 실시예는 단지 본 발명의 예시 및 설명을 위한 것일 뿐이며, 본 발명을 한정하는 것은 아니라는 것을 이해해야 한다.

도 1에 도시된 바와 같이, 일 실시예는 다음 단계를 포함하는 타깃 객체의 소셜 계정을 발굴하는 방법을 제공한다:

단계 S110: 타깃 객체의 속성 정보를 사용하여 타깃 객체가 속한 타깃 소셜 그룹의 위치를 파악한다.

단계 S120: 타깃 소셜 그룹 내의 소셜 계정의 미리 설정된 정보를 파싱하여, 소셜 계정에 대응하는 사용자의 제1 식원 정보를 획득한다.

단계 S130: 제1 신원 정보를 타깃 객체의 제2 신원 정보와 매칭시킨다.

단계 S140: 제2 신원 정보와 매칭되는 제1 신원 정보의 소셜 계정을 타깃 객체의 소셜 계정으로 결정한다.

본 실시예에 제공된 타깃 객체의 소셜 계정을 발굴하는 방법은 정보 처리 기능을 갖는 다양한 전자 기기에 적용될 수 있다. 구체적으로, 분산형 컴퓨터 네트워크(distributed computer network)에 적용되는 경우, 상기 방법은 복수의 기기에 의해 수행될 수 있다.

본 실시예에서의 타깃 객체는 타깃 사용자일 수 있다. 소셜 그룹은 사교 기능을 갖는 다양한 가상 조직일 수 있으며, 보통 적어도 2명의 멤버를 포함한다. 소셜 그룹으로는 WeChat 그룹 및 QQ 그룹과 같은 다양한 그룹을 포함할 수 있다.

타깃 객체의 속성 정보는 신원 정보, 직업 정보 및 연령 정보와 같은 다양한 특성 정보를 포함할 수 있다. 단계 S110에서, 타깃 객체의 상대적으로 유일한 속성 정보, 예를 들어 타깃 객체를 다른 객체와 유일하게 구별하는 데 사용될 수 있는 속성 정보가 보통 선택된다. 예를 들어, 타깃 객체가 기업 Y의 창업자 B씨이면, "기업 Y" 또는 "기업 Y의 고위 임원(senior executive)"과 같은 키워드, 또는 "B 씨" 또는 "기업 Y의 창업자"와 같은 어구(term)도 B씨의 속성 정보로서, 타깃 소셜 그룹을 결정하는 데 사용될 수 있다. 예를 들어, "기업 Y의 고위 임원"이 타깃 객체의 정보이면, 정보 매칭을 통해, 명칭이나 명칭 비고(name remark)가 "Y의 고위 임원"인 소셜 그룹을 찾아서 타깃 소셜 그룹으로서 사용될 수 있다. 이 경우, 일반적으로 타깃 객체의 소셜 계정이 타깃 소셜 그룹에 속할 확률이 비교적 높다.

단계 S120에서, 타깃 소셜 그룹 내의 소셜 계정의 미리 설정된 정보가 파싱된다. 여기서, 미리 설정된 정보는 그룹 별명 및 소셜 계정와 같은 정보를 포함할 수 있다. 사교적인 과정)에서의 인식을 용이하게 하기 위해, 어떤 사용자는 일반적으로 네트워크 명칭만을 사용하여 사교 활동을 수행하는 대신, 일상 생활에 사용되는 이름과 같은 신원 정보를 다양한 비고 정보에 추가한다. 예를 들어 Li Na는 그룹의 별명 필드에 있다. Li Na는 사용자의 일상 생활에 사용되는 호칭(appellation)이거나, 사용자의 신분증 또는 여권에 사용되는 호칭일 수도 있다. 제1 신원 정보는 사용자의 오프라인 호칭을 포함할 수 있다. 오프라인 호칭은 예를 들어, "Li Na"와 같은 성 및 이름을 포함할 수 있거나, 또는 예를 들어, "북경 대학교 총장(President of Peking University)"와 같은 직책을 포함할 수 있다. 모든 정보는 제1 신원 정보일 수 있으며, 사용자의 오프라인 신원을 나타낼 수 있다. 제2 신원 정보는 다른 전자 기기로부터, 또는 휴먼-컴퓨터 상호 작용 인터페이스(human-computer interaction interface)로부터 본 실시예에서의 방법을 수행하기 위해 전자 기기에 의해 수신되는 정보일 수 있다. 예를 들어, 현재 타깃 객체가 기업 Y의 고위 임원인 경우, "기업 Y의 고위 임원"이 검색 항목으로 사용되며, 기업 Y의 고위 임원의 디렉토리 및 대응하는 직책과 같은 정보를 찾을 수 있다.

단계 S130에서, 소셜 계정에서 추출된 제1 신원 정보를 제2 신원 정보와 매칭시킨다. 매칭이 성공하면, 대응하는 계정이 타깃 객체의 소셜 계정일 가능성이 높으므로, 타깃 객체의 소셜 계정이 발견된 것으로 간주될 수 있다. 명백히, 타깃 객체의 소셜 계정이 발굴된다. 사용자의 오프라인 신원 정보와 함께 사용자의 소셜 계정의 위치를 파악하는 방법은 낮은 복잡도 및 높은 정밀도를 갖는다.

이 실시예에서, 타깃 객체의 소셜 계정을 더욱 적절하게 발굴하기 위해, 먼저 타깃 소셜 그룹이 정확하게 위치될 필요가 있다. 그 다음은 타깃 소셜 그룹의 위치를 편리하고 신속하며 정확하게 파악할 수 있는 선택적인 방법을 제공한다. 구체적으로는, 단계 S110은,

후보 소셜 그룹의 그룹 속성을 속성 정보와 매칭시키는 단계; 및

속성 정보와 매칭되는 그룹 속성을 갖는 소셜 그룹을 타깃 소셜 그룹으로 선택하는 단계를 포함할 수 있다.

일반적으로, 소셜 그룹체에는 그룹 명칭이나 그룹 라벨 등이 설정된다. 그룹 명칭 또는 그룹 라벨은 그룹 속성이다. 그룹 명칭과 같은 그룹 속성은 소셜 그룹 내의 소셜 계정에 대응하는 사용자의 신원 정보를 어느 정도 반영할 수 있다. 본 실시예에서는, 그룹 명칭에 기초한 매칭을 통해 직접적으로, 어떤 타깃 소셜 그룹을 편리하고 신속하게 발견할 수 있다. 그러나 때로는 어떤 소셜 그룹의 그룹 며칭은 소셜 그룹 멤버의 신원 정보를 바람직하게 반영할 수 없다. 본 실시예에서는, 그룹 명칭이 그룹 내의 멤버의 신원 정보를 정확하게 반영할 수 없는 경우에 타깃 객체의 소셜 계정을 발굴하기 위해 다음의 방법을 사용한다. 상기 방법은,

미리 설정된 연관도(association degree)를 충족시키는 둘 이상의 소셜 그룹을 포함하는 그룹 커뮤니티를 설립하는 단계;

소셜 그룹의 속성 정보에 대해 정보 클러스터링(information clustering)을 수행하고, 클러스터링 주제(clustering subject)를 결정하고, 그 사이의 매칭도(matching degree)가 미리 설정된 매칭도를 충족시키는, 속성 정보와 매칭되는 타깃 클러스터링 주제(target clustering subject)를 결정하는 단계; 및

타깃 클러스터링 주제와 무관한 그룹 커뮤니티를 필터링하고, 타깃 클러스터링 주제와 관련된 타깃 그룹 커뮤니티를 획득하는 단계 - 타깃 그룹 커뮤니티 내의 소셜 그룹은 후보 소셜 그룹임 -를 더 포함한다.

타깃 객체가 복수의 소셜 그룹에 속하면, 소셜 그룹에 동일한 소셜 계정이 존재한다. 이 경우, 소셜 그룹은 미리 설정된 연관도를 충족시키는 것으로 간주될 수 있다.

본 실시예에서, 그룹 커뮤니티가 설립되고, 그룹 커뮤니티는 둘 이상의 소셜 그룹을 포함한다. 소셜 그룹 내의 그룹 멤버는 소셜 계정의 사용자에 대응한다.

정보 클러스터링은 그룹 커뮤니티 내의 소셜 그룹에 대해 수행된다. 정보 클러스터링은, 각각의 소셜 그룹의 그룹 명칭을 추출하는 것, 그룹 명칭을 문서로 사용하는 것 및 잠재적 디리클레 할당(latent dirichlet allocation, LDA)를 사용하여 주제 클러스터링을 수행하여 클러스터링 결과를 얻는 것을 포함할 수 있다. LDA는 3계층 구조(three-layer structure)를 포함하여, 3계층 베이지 확률 모델(three-layer Bayesian probability model)이라고 한다. 3계층은 각각 문구(phrase), 주제(subject) 및 문서(document)에 대응한다. LDA에 따르면, 문서 내의 문구 각각은 "주제는 확률로 선택되고, 문구는 주제에서 확률로 선택되는" 프로세스를 통해 획득된다. 문서와 주제 사이의 관계는 다항식 분포에 따르고, 주제와 구문 사이의 관계는 다항식 분포를 따른다. 또한 LDA는 감독되지 않은 머신 러닝 기술(unsupervised machine learning technology)이며, 대규모 문서 세트 또는 코퍼스(corpus)에 숨겨진 주제 정보를 인식하는 데 사용될 수 있다.

물론, 그룹 커뮤니티의 속성 정보는 그룹 명칭에 한정되는 것은 아니며, 그룹 내의 채팅 이력, 또는 소셜 그룹의 그룹 공간에 저장된 그룹 문서, 또는 소셜 그룹의 그룹 공간에 저장된 그룹 사진에서 추출된 정보를 더 포함할 수 있다.

결론적으로, 주제 클러스터링을 통해, 복수의 그룹 커뮤니티 사이의 연관도를 결정할 수 있다. 다음으로, 타깃 객체의 속성 정보를 따르는 타깃 클러스터링 객체를 선택하여 그룹 커뮤니티를 필터링한다. 예를 들어, 복수의 그룹 커뮤니티가 있다. 정보 클러스터링을 통해, 어떤 그룹 커뮤니티가 대학 A와 관련이 있고, 다른 그룹 커뮤니티는 대학 B와 관련이 있음을 알 수 있다. 타깃 객체는 대학 A의 교수이다. 다음으로, 대학 A가 타깃 클러스터링 주제로 선택되고, 대학 A와 무관한 그룹 커뮤니티를 필터링하여, 타깃 그룹 커뮤니티를 획득한다. 본 실시예에서, 타깃 클러스터링 주제에 따라 그룹 커뮤니티에 대해 필터링이 수행되는 경우, 타깃 클러스터링 주제와 그룹 커뮤니티의 커뮤니티 속성 사이에 퍼지 매칭(fuzzy matching)이 수행되어, 타깃 그룹의 위치를 파악할 수 있다. 퍼지 매칭은 타깃 클러스터링 주제를 완전히 포함하지 않고,타깃 클러스터링 주제의 동의어 등을 포함하여, 타깃 객체가 속한 타깃 그룹 커뮤니티가 선택되지 않는 가능성을 가능한 한 회피할 수 있다. 타깃 그룹 커뮤니티의 소셜 그룹은 후보 소셜 그룹이다.

후보 소셜 그룹이 선택된 후, 정확한 매칭을 통해 후보 소셜 그룹에서 타깃 객체의 속성 정보와 매칭되는 타깃 소셜 그룹을 선택한다. 정확한 매칭은 대개 두 두 항목 사이의 완전한 매칭을 필요로 하며, 두 동의어 항목 사이의 매칭은 정확한 매칭이 아니므로, 타깃 소셜 그룹의 위치를 정확하게 파악하기 위해, 타깃 객체가 없는 소셜 그룹의 수를 줄이거나, 후속하여 처리될어야 하는 데이터의 양을 감소시켜 처리 복잡도 및 계산량을 줄인다. 타깃 소셜 그룹을 결정하는 것은, 먼저, 타깃 객체의 속성 정보 및 후보 그룹 커뮤니티 내의 소셜 그룹의 그룹 속성을 사용하여, 정확한 매칭이 성공한 그룹 커뮤니티를 선택하한 다음; 타깃 그룹 커뮤니티 내의 소셜 그룹을 타깃 소셜 그룹으로 사용하는 것을 포함한다. 물론 타깃 사용자의 그룹 속성과 타깃 그룹 커뮤니티 내의 소셜 그룹을 사용하여 매칭이 다시 수행될 수도 있다. 매칭은 전술한 퍼지 매칭과 결합될 수 있다. 퍼지 매칭이 성공하면, 퍼지 매칭이 성공한 소셜 그룹이 타깃 소셜 그룹이다.

물론, 전술한 방법 이외에, 후보 소셜 그룹을 결정하는 방법은 소셜 도구(social tool) 내의 모든 소셜 그룹을 후보 소셜 그룹 등으로 직접 고려하는 것을 포함할 수 있다.

타깃 그룹 커뮤니티가 선택되기 전에, 각각의 독립적인 그룹은 그룹 커뮤니티로 분류될 필요가 있다. 분류는 그룹 명칭 또는 다른 그룹 정보 클러스터링을 통해 수행될 수 있다. 다음은 높은 클러스터링 정밀도를 갖는 다른 선택적인 방법을 제공한다.

그룹 커뮤니티를 설립하는 것은 다음을 포함한다:

먼저, 둘 이상의 소셜 그룹을 포함하는 커뮤니티 네트워크를 설립한다. 여기서 소셜 그룹은 커뮤니티 네트워크의 노드이다. 제1 노드와 제2 노드가 동일한 소셜 계정을 포함하면, 유향 에지(directed edge)가 제1 노드와 제2 노드 사이에 배치되고; 유향 에지의 에지 가중치(edge weight)는 제1 값과 제2 값의 비율과 동일하고, 여기서 제1 값은 제1 노드와 제2 노드에 모두 포함된 동일한 소셜 계정의 수이고, 제2 값은 제2 노드에 포함된 소셜 계정의 수이다. 본 실시예에서, 유향 에지는 방향을 갖는 에지이다. 본 실시예에서, 유향 노드는 하나의 노드에서 다른 노드로의 방향에 있는 에지이다.

도 2는 3개의 소셜 그룹을 보여주며, 각각 G1, G2, G3이다. G1은 5명의 멤버를 포함하고, 각각의 멤버는 소셜 계정에 대응한다. G2는 4명의 멤버를 포함한다. G3은 6명의 멤버를 포함한다. 도 2에서, 동일한 패턴으로 채워진 작은 원들은 동일한 소셜 계정을 나타낸다. 따라서, 도 2로부터 알 수 있는 바와 같이, G1 및 G2는 3개의 동일한 소셜 계정을 가지고 있고, G2 및 G3은 2개의 동일한 소셜 계정을 가지고 있고, G1 및 G3은 3개의 동일한 소셜 계정을 가지고 있다. 두 개의 소셜 그룹에 포함된 소셜 계정은 공유된 소셜 계정이라고 할 수 있다.

커뮤니티는 도 2의 G1, G2 및 G3을 사용하여 설립된다. 커뮤니티 네트워크는 도 2의 우측에 도시되어 있다. 커뮤니티 네트워크의 설립을 위해, 구체적으로 커뮤니티 네트워크는, 예를 들어 커뮤니티 다이어그램을 설립함으로써, 커뮤니티 네트워크를 설립될 수 있다.

커뮤니티 다이어그램은 다음과 같은 특성을 갖는다:

다이어그램 유형: 유향 다이어그램(Directed diagram).

다이어그램 노드: 소셜 그룹은 다이어그램 내의 노드에 대응한다.

다이어그램 에지: 동일한 그룹 멤버를 갖는 두 노드 사이의 연결선.

커뮤니티 네트워크가 설립된 후, 에지 가중치가 계산될 필요가 있다.

에지 가중치의 계산 시에, 공유된 소셜 계정의 제1 값이 노드에 포함된 소셜 계정의 제2 값과 비교되어, 에지 가중치를 구한다. 예를 들어, G1에서 G2까지의 유향 에지의 에지 가중치는 다음 공식을 사용하여 계산될 수 있다:

는 소셜 그룹

에서 소셜 그룹

까지의 에지 가중치를 나타낸다.

는 소셜 그룹

와 소셜 그룹

의 공유된 소셜 계정을 나타낸다.

는 소셜 그룹의 소셜 계정이다.

따라서, 도 2에 도시된 커뮤니티 다이어그램에 도시된 바와 같이, G1에서 G2까지의 에지 가중치는 3/4=0.75이고; G1에서 G3까지의 에지 가중치는 3/6=0.5이고; G2에서 G1까지의 에지 가중치는 3/5=0.6이고; G2에서 G3까지의 에지 가중치는 2/6=0.33이고; G3에서 G1까지의 에지 가중치는 3/5=0.6이고; G3에서 G2까지의 에지 가중치는 2/4=0.5이다.

그런 다음, 커뮤니티 네트워크를 탐색(traversing)하고, 각각의 노드를 타깃 노드로 사용하여, 타깃 노드의 이웃 노드의 노드 라벨 및 대응하는 인디그리 에지(indegree edge)의 인디그리 에지 가중치를 수집하며, 여기서 인디그리 에지 가중치는 이웃 노드에서 타깃 노드로의 방향에 있는 유향 에지의 에지 가중치이고, 타깃 노드는 커뮤니티 네트워크 내의 노드이다. 본 실시예에서, 커뮤니티 네트워크를 탐색하는 것은, 매번 각각의 노드를 타깃 노드로서 사용하는 것이다. 각각의 노드는 노드 라벨에 대응하고, 노드 라벨의 초기 값은 노드에 대응하는 노드 식별자일 수 있다. 예를 들어, G1이 타깃 노드이면, G1의 인디그리 에지는 각각 G2에서 G1로 향하는 유향 에지와 G3에서 G1로 향하는 유향 에지인 두 개의 유향 에지를 포함하고, 대응하는 인디그리 에지 가중치는 각각 0.5와 0.6이다. 명백히, G3에서 G1로 향하는 유향 에지는 에지 가중치가 더 크다. G1이 탐색되는 첫 번째 타깃 노드이면, G1의 노드 라벨은 G3의 노드 라벨로 대체된다. G3의 노드 식별자의 초기 값은 G3 자체의 노드 식별자이기 때문에, G1의 노드 라벨은, 갱신된 후에, G3의 노드 식별자이다.

그 후, 동일한 노드 라벨에 대응하는 인디그리 에지 가중치가 가산된다. 탐색하기 전에, 각각의 노드의 노드 라벨은 노드 자체이다. 일부 노드를 탐색한 후에, 노드의 노드 라벨은 다른 노드의 노드 식별자로 대체된다. 이 때, 타깃 노드의 유향 에지들 중 일부는 동일한 노드 식별자에 대응할 수 있다. 따라서 동일한 노드 라벨에 대응하는 인그리드 에지의 가중치를 가산해야 한다.

다음에, 타깃 노드의 노드 라벨이 최대 인디그리 에지 가중치에 대응하는 노드 라벨로 대체된다. 가산한 후, 타깃 노드의 모든 유향 에지의 에지 가중치 및 유향 에지에 대응하는 노드 라벨이 획득되고, 최대 에지 가중치에 대응하는 노드 라벨이 선택되어, 타깃 노드의 노드 라벨을 대체한다.

마지막으로, 커뮤니티 네트워크를 탐색한 후에, 동일한 노드 라벨을 갖는 소셜 그룹들은 그룹 커뮤니티로 분류된다. 커뮤니티 네트워크 내의 모든 노드를 탐색한 후에, 일부 또는 모든 노드 라벨이 갱신된다. 본 실시예에서, 동일한 노드 라벨을 갖는 소셜 그룹들은 동일한 그룹 커뮤니티로 분류된다. 명백히, 이 방식으로 획득된 그룹 커뮤니티 내의 소셜 그룹 중 어느 두 그룹은 동일한 소셜 계정을 갖는다. 따라서 미리 설정된 연관도를 충족시키는 소셜 그룹은, 그룹 커뮤니티 내의 소셜 그룹 중 어느 두 그룹은 적어도 동일한 소셜 계정을 포함한다는 것을 충족시킬 수 있다.

단계 S120은 다음 단계:

타깃 소셜 그룹 내의 각각의 소셜 계정의 비고 정보(remark information)를 추출하는 단계 - 여기서 비고 정보는 사용자의 신원을 표시하는 데 사용되는 정보임 -; 및

비고 정보로부터 제1 신원 정보를 추출하는 단계를 포함할 수 있다.

도 6은 WeChat 소셜 계정 인터페이스를 보여준다. 명백히, 소셜 계정의 사용자 정보가 소셜 계정의 비고 정보에 있다. 사용자 정보는 사용자 명칭과 같은 정보를 포함한다. 따라서, 비고 정보로부터 제1 신원 정보가 추출될 수 있다. 제1 신원 정보는 사용자의 명칭, 별명 등을 포함할 수 있다. 비고 정보는 소셜 계정에서 사용자의 신원을 나타낼 수 있는 복수의 필드 내의 정보에 대응할 수 있다.

구체적으로는, 예를 들면, 비고 정보는 친구 비고 정보, 그룹 비고 정보 및 계정 비고 정보 중 적어도 하나를 포함하고, 여기서 친구 비고 정보는 제1 소셜 계정의 친구 계정에 의해 제1 소셜 계정에 대해 이루진 비고 정보이고, 그룹 비고 정보는 소셜 그룹 내의 제1 소셜 계정의 비고 정보이고, 계정 비고 정보는 제1 소셜 계정에 의해 사용자의 신원에 대한 이루어진 비고 정보이다.

소셜 계정을 사용하는 경우, 사용자는 소셜 계정의 계정 명칭을 자신의 이름 또는 별명으로 직접 변경할 수 있다. 소셜 그룹에 가입한 후, 사용자는 소셜 그룹에 그룹 별명 또는 그룹 호칭과 같은 비고 정보 또는 라벨 정보를 설정할 수 있다. 소셜 계정이 다른 소셜 계정의 친구로서 추가된 후, 소셜 계정의 비고 정보는 사용자 친구에 의해 소셜 계정 사용자의 사용자 명칭 등으로 직접 설정될 수 있다. 따라서, 본 실시예에서는 상기 정보로부터 제1 신원 정보를 추출하여, S130 단계에서 매칭을 수행할 수 있다. 제1 신원 정보를 제2 신원 정보와 매칭시키는 경우, 매칭은 직접 수행될 수 있다. 본 실시예에서는, 제1 신원 정보에 명칭이 부정확하게 기록되는 것을 피하기 위해, 예를 들어 이름은 동음 이의어(homonym)로 기록된다. 본 실시예에서, 단계 S130은 제1 신원 정보의 발음 정보(articulation information)를 추출하는 단계를 포함하고; 단계 S140은 제1 신원 정보의 발음 정보를 제2 신원 정보의 발음 정보와 매칭시키는 단계를 포함한다.

발음 정보는 중국어 병음(Chinese pinyin)일 수 있다. 본 실시예에서, 중국어 병음에 기초한 매칭에 통해, 제1 신원 정보와 제2 신원 정보가 동일인을 나타내더라도, 일부 한자가 잘못 기입되기 때문에 매칭이 실패하는 문제를 피할 수 있어, 매칭 성공률을 높인다.

타깃 객체가 복수 존재하고 타깃 객체가 서로 연관되어 있는 경우, 상기 방법은,

소셜 계정이 결정된 타깃 객체의 친구 계정을 추출하는 단계; 및

친구 계정의 미리 설정된 정보를 파싱하여, 제1 신원 정보와 매칭될 제2 신원 정보를 획득하는 단계를 더 포함한다.

타깃 객체는 복수의 타깃 사용자에 대응할 수 있다. 예를 들어, 타깃 객체는 기업 Y의 고위 임원이고, 명백히히 복수의 타깃 객체가 존재할 수 있다. 또한, 복수의 타깃 객체는 기업 Y의 고위 임원과 연관된다. 연관 관계에 기초하여, 타깃 객체는 서로의 친구일 수 있다. 친구 관계는 소셜 계정의 친구 계정에 반영될 수 있다. 따라서, 본 실시예에서는, 소셜 계정이 결정된 타깃 객체가 시드된 사용자(seeded user)로서 사용된다. 시드된 사용자의 소셜 계정의 친구 계정이 추출되고, 친구 계정의 미리 설정된 정보가 다시 파싱된다. 이러한 방식으로, 타깃 객체의 소셜 계정의 위치가 확장된다. 예를 들어, 타깃 객체 A는 친구, 타깃 객체 B를 가지며, 타깃 객체 B는 타깃 소셜 그룹에 속하지 않을 수 있다. 친구들 사이의 관계 링크의 파싱을 통해, 타깃 객체 A는 시드된 사용자로서 사용되며, 타깃 객체 B의 소셜 계정의 위치가 파악될 될 수 있고, 이에 따라 타깃 객체의 소셜 계정을 결정하는 성공률을 증가시킨다.

도 3에 도시된 바와 같이 일 실시예는 위치 파악 유닛(110), 파싱 유닛(120), 매칭 유닛(130) 및 결정 유닛(140)을 포함하는 서버를 더 제공한다. 위치 파악 유닛(110)은 타깃 객체의 속성 정보를 사용하여 타깃 객체가 속한 타깃 소셜 그룹의 위치를 파악하도록 구성된다. 파싱 유닛(120)은 타깃 소셜 그룹 내의 소셜 계정의 미리 설정된 정보를 파싱하여, 소셜 계정에 대응하는 사용자의 제1 신원 정보를 획득하도록 구성된다. 매칭 유닛(130)은 제1 신원 정보를 타깃 객체의 제2 신원 정보와 매칭시키도록 구성된다.결정 유닛(140)은 제2 신원 정보와 매칭되는 제1 신원 정보의 소셜 계정을 타깃 객체의 소셜 계정으로 결정하도록 구성된다.

본 실시예에서, 위치 파악 유닛(110), 파싱 유닛(120), 매칭 유닛(130) 및 결정 유닛(140)은 모두 서버의 정보 처리 구성에 댕응할 수 있다. 정보 처리 구성은 중앙 처리 장치(central processing unit, CPU), 마이크로 프로세서(microprocessor, MCU), 디지털 신호 프로세서(digital signal processor, DSP), 프로그래머블 어레이 로직(programmable array logic , PLC) 또는 애플리케이션 프로세서(application processor, AP)와 같은 프로세서를 포함할 수 있다. 정보 처리 구성은 주문형 집적 회로(application-specific integrated circuit, ASIC)를 더 포함할 수 있다. 정보 처리 구성은 정보 처리를 수행할 수 있는 전자적인 구성일 수 있다.

본 실시예에서, 정보 처리 구성은 미리 설정된 코드를 실행함으로써 전술한 유닛들의 기능을 구현할 수 있다. 타깃 객체의 소셜 계정은 제1 신원 정보를 오프라인 제2 신원 정보와 매칭시킴으로써 정확하게 결정되어, 타깃 객체의 소셜 계정을 사용하여 정보 홍보(information promotion) 및 정보 발굴(information mining)과 같은 후속 작업을 수행할 수 있도록 한다. 예를 들어, 신원 특성 때문에, 타깃 사용자는 어떤 정보에 관심을 가질 수 있다. 따라서 광고 공개와 같은 직접적인 정보 홍보는 소셜 계정을 발굴함으로써 구현할 수 있다. 타깃 객체가 오피니언 리더이면, 오피니언 리더가 발표, 편집 또는 집중한 정보는, 다른 사용자가 자신의 오피니언 리더인 타깃 객체에 관해 집중된다. 따라서 소셜 계정에 의해 공개된 정보가 발굴될 수 있고, 그 후 다른 플랫폼에서 공개되거나 다른 소셜 계정으로 승격되어, 정확한 정보 전송을 구현할 수 있다.

어떤 실시예에서, 위치 파악 유닛(110)은 후보 소셜 그룹의 그룹 속성을 속성 정보와 매칭시키고; 속성 정보와 매칭되는 그룹 속성을 갖는 소셜 그룹을 타깃 소셜 그룹으로 선택하도록 구성된다. 예를 들어, 위치 파악 유닛(110)은 타깃 사용자의 속성 정보와 후보 소셜 그룹의 그룹 속성을 매칭시켜 타깃 소셜 그룹을 선택할 수 있다. 그룹 속성에는 그룹 명칭 또는 그룹 비고 또는 소셜 그룹의 그룹 멤버의 신원 특성을 반영할 수 있은 그룹 라벨과 같은 정보가 포함될 수 있다.

어떤 실시예에서, 서버는 설립 유닛, 클러스터링 유닛 및 필터링 유닛을 더 포함할 수 있다. 설립 유닛은 미리 설정된 연관도를 충족시키는 둘 이상의 소셜 그룹을 포함하는 그룹 커뮤니티를 설립하도록 구성되고; 클러스터링 유닛은 소셜 그룹의 속성 정보에 대해 정보 클러스터링을 수행하고, 클러스터링 주제를 결정하고, 그 사이의 매칭도가 미리 설정된 매칭도를 충족시키는, 속성 정보와 매칭되는 타깃 클러스터링 주제를 결정하도록 구성되고; 필터링 유닛은, 타깃 클러스터링 주제와 무관한 그룹 커뮤니티를 필터링하고, 타깃 클러스터링 주제와 관련된 타깃 그룹 커뮤니티를 획득하도록 구성된다. 타깃 그룹 커뮤니티 내의 소셜 그룹은 후보 소셜 그룹이다. 본 실시예에서, 설립 유닛, 클러스터링 유닛 및 필터링 유닛은 모두 전술한 정보 처리 구성에 대응할 수 있다. 타깃 그룹 커뮤니티는 정보 처리 구성의 정보 처리를 통해 위치가 파악되고, 타깃 그룹 커뮤니티 내의 소셜 그룹이 후보 소셜 그룹으로 결정된다. 이러한 방식으로, 명백히, 후보 소셜 그룹을 선택하기 위한 범위가 크게 줄어들어, 후소하는 소셜 그룹의 위치 파악을 단순화하고, 타깃 객체의 소셜 계정을 결정하는 효율을 향상시킨다.

예를 들어, 설립 유닛은, 둘 이상의 소셜 그룹을 포함하는 커뮤니티 네트워크를 설립하고 - 여기서 소셜 그룹은 커뮤니티 네트워크 내의 노드이고; 제1 노드와 제2 노드가 동일한 소셜 계정을 포함하면, 제1 노드와 제2 노드 사이에 유향 에지가 배치되고; 유향 에지의 에지 가중치는 제1 값과 제2 값의 비율과 동일하고, 제1 값은 제1 노드와 제2 노드에 모두 포함된 동일한 소셜 계정의 수이고, 제2 값은 제2 노드에 포함된 소셜 계정의 수임 -; 커뮤니티 네트워크를 탐색하고, 각각의 노드를 타깃 노드로 사용하여, 타깃 노드의 이웃 노드의 노드 라벨 및 대응하는 인디그리 에지의 인디그리 에지 가중치를 수집하고 - 여기서 인디그리 에지 가중치는 이웃 노드에서 타깃 노드로의 방향에 있는 유향 에지의 에지 가중치이고, 타깃 노드는 커뮤니티 네트워크 내의 노드이고, 노드 라벨의 초기 값은 대응하는 노드의 노드 식별자임 -; 동일한 노드 라벨에 대응하는 인디그리 에지 가중치들을 가산하고; 타깃 노드의 노드 라벨을 최대 인디그리 에지 가중치에 대응하는 노드 라벨로 대체하고; 커뮤니티 네트워크를 탐색한 후에, 동일한 노드 라벨을 갖는 소셜 그룹을 하나의 그룹 커뮤니티로 분류하도록 구성된다.

그룹 커뮤니티 분류를 통해, 타깃 사용자의 속성 정보에 따라, 타깃 사용자가 처음으로 있을 수 있는 소셜 그룹을 후속하여 선택하는 것이 편리하므로, 정보 처리량을 감소시킬 수 있고, 처리 효율을 향상시킬 수 있다.

어떤 실시예에서, 파싱 유닛(120)은, 타깃 소셜 그룹 내의 각각의 소셜 계정의 비고 정보를 추출하고 - 비고 정보는 사용자의 신원을 표시하는 데 사용되는 정보임 -; 비고 정보로부터 제1 신원 정보를 추출하도록 구성된다. 본 실시예에서, 파싱 유닛(120)은 소셜 그룹 내의 각각의 소셜 계정의 비고 정보를 추출하여, 신원 정보를 획득할 수 있다. 여기서, 특정 필드에 있는 정보 또는 특정 유형의 정보일 수 있다. 특정 필드에 있는 정보 또는 특정 유형의 정보에는 사용자에 의해 표시된 사용자 신원 정보가 존재할 수 있다. 따라서, 상기 정보를 파싱하여 제1 신원 정보를 획득할 수 있다.

비고 정보의 소스(source)에 따라, 비고 정보는 친구 비고 정보, 그룹 비고 정보 및 계정 비고 정보를 포함할 수 있다. 따라서, 비고 정보는 친구 비고 정보, 그룹 비고 정보 및 계정 비고 정보 중 적어도 하나를 포함하며, 여기서 친구 비고 정보는 제1 소셜 계정의 친구 계정에 의해 제1 소셜 계정에 대해 이루진 비고 정보이고, 그룹 비고 정보는 소셜 그룹 내의 제1 소셜 계정의 비고 정보이고, 계정 비고 정보는 제1 소셜 계정에 의해 사용자의 신원에 대한 이루어진 비고 정보이다.

네트워크 정보는 비교적 비공식적일 수 있으며, 사용자의 명칭은 종종 동음 이의어에 기록된다. 이 현상에 의해 야기되는 매칭 실패를 피하기 위해, 본 실시예에서, 파싱 유닛(120)은 구체적으로 제1 신원 정보의 발음 정보를 추출하도록 구성되고; 매칭 유닛(130)은 제1 신원 정보의 발음 정보와 제2 신원 정보의 발음 정보를 매칭시키도록 구성된다. 발음 정보에 기초한 매칭을 통해, 매칭 성공률이 증가될 수 있고, 그에 따라 타깃 객체의 소셜 계정을 결정하는 성공률을 더 증가시킬 수 있다.

또한, 결정 유닛(140)은, 타깃 객체가 복수 존재하고 타깃 객체가 서로 연관되어 있는 경우, 소셜 계정이 결정된 타깃 객체의 친구 계정을 추출하고; 친구 계정의 미리 설정된 정보를 파싱하여, 제1 신원 정보와 매칭될 제2 신원 정보를 획득하도록 구성된다. 본 실시예에서는, 타깃 사용자의 소셜 계정의 위치 파악의 성공률을 더 증가시키기 위해, 위치 파악 방식은 타깃 소셜 그룹의 소셜 계정에 기초한 매칭에 한정되지 않는다. 대신, 결정된 소셜 계정의 친구 관계 링크가 타깃 객체의 소셜 계정을 결정하는 성공률을 높이기 위해, 위치 파악에 사용된다.

도 4에 도시된 바와 같이, 본 발명의 실시예는 다른 서버를 더 제공한다. 이 서버는 프로세서(402), 저장 매체(404) 및 하나 이상의 외부 통신 인터페이스 (401)를 포함한다. 프로세서(402), 저장 매체(404) 및 외부 통신 인터페이스(401)는 버스(403)를 사용하여 연결된다. 프로세서(402)는 마이크로 프로세서, 중앙 처리 장치, 디지털 신호 프로세서, 또는 프로그램 가능 논리 어레이와 같은 처리 기능을 갖는 전자적인 구성요소일 수 있다.

저장 매체(404)는 컴퓨터로 실행할 수 있는 명령어를 저장한다. 프로세서(402)는 전술한 저장 매체(404)에 저장된 컴퓨터로 실행할 수 있는 명령어를 실행하여, 전술한 기술적 방안 중 어느 것에 제공된 타깃 객체의 소셜 계정에 대한 방법을 구현한다. 구체적으로는, 도 1에 도시된 방법이 수행될 수 있다.

본 발명의 일 실시예는 컴퓨터로 실행할 수 있는 명령어가 저장된 컴퓨터 저장 매체를 더 제공하며, 상기 컴퓨터로 실행할 수 있는 명령어는, 전술한 타깃 객체의 소셜 계정을 발굴하는 방법, 예를 들어 도 1, 도 2, 도 5, 도11, 및 도 12에 도시된 방법 중 적어도 하나를 수행하는 데 사용된다. 컴퓨터 저장 매체는 랜덤 저장 매체(RAM), 읽기 전용 저장 매체(ROM), 플래시 메모리 또는 자기 테이프일 수 있으며, 선택적으로 비일시적인 저장 매체일 수 있다.

다음은 전술한 실시예들 중 어느 것을 참조하여 몇 가지 예를 제공한다.

예 1:

도 5에 도시된 바와 같이, 이 예에서, WeChat이 소셜 도구로서 사용되며, 타깃 객체의 WeChat 계정을 발굴하는 방법이 제공된다. 이 방법은 5단계를 포함할 수 있으며 각각 다음과 같다:

단계 S1: WeChat 그룹 커뮤니티를 검색한다.

단계 S2: WeChat 그룹 커뮤니티에 대해 LDA 주제 클러스터링을 수행한다.

단계 S3: WeChat 그룹 텍스트를 발굴한다.

단계 S4: 사용자의 실제 명칭의 텍스트를 발굴하며, 여기서 실제 명칭은 사용자 오프라인의 사교 생활에 사용된 명칭을 포함한다.

단계 S5: 관계 링크 확산(relationship link scattering)을 수행하여, 타깃 객체의 소셜 계정을 획득한다.

단계 S1은 다음 단계를 포함할 수 있다:

단계 S11: WeChat 그룹 커뮤니티를 설립한다.

단계 S12: 그룹 커뮤니티를 획득하기 위해, 그룹 커뮤니티를 완전히 검색한다.

단계 S2는 다음 단계를 포함할 수 있다:

단계 S21: 각 그룹 커뮤니티에서 모든 그룹의 명칭을 수집한다.

단계 S22: 그룹 커뮤니티를 항목(article)으로 사용하고 수집된 그룹 명칭을 항목 내용(article content)으로 사용하여 LDA 주제 클러스터링을 수행한다.

단계 S3은 다음 단계를 포함할 수 있다:

단계 S31: 주제 모델을 통해 주제와 무관한 그룹 커뮤니티를 필터링한다.

단계 S32: 발굴할 필요가 있는 고위 임원에 대응하는 회사 명칭을 획득한다.

단계 S33: 그룹 커뮤니티 각각에 대해, 회사 명칭을 그룹 명칭과 매칭시킨다.

단계 S34: 그룹 커뮤니티에 대해, 매칭이 3회 이상 성공적이면, 그룹 커뮤니티가 유지되고 고위 임원 주제를 포함하는 그룹 커뮤니티로 사용된다.

단계 S35: 그룹 멤버 및 그룹 멤버의 실제 명칭을 획득하고, 발굴해야 하는 고위 임원과 실제 명칭을 매칭시키고, 그 그룹 멤버를 시드된 사람으로 사용한다.

단계 S4는 다음 단계를 포함할 수 있다:

단계 S41: 사용자의 오래된(old) 비고 정보를 수집한다.

단계 S42: 사용자 자신의 그룹 비고 정보를 수집한다.

단계 S43: 사용자의 실제 명칭을 발굴하며, 여기서 사용자의 실제 명칭은 전술한 제1 신원 정보에 대응하고, 사용자 오프라인의 명칭, 호칭, 직위(title), 등을 포함할 수 있다.

단계 S44: 실제 명칭 및 WeChat 계정에 따라 데이터를 발굴한다.

단계 S5는 다음 단계를 포함할 수 있다:

단계 S51: 시드된 사람의 친구 및 대응하는 실제 명칭을 풀(pull)하며, 여기서 시드된 사람은 전술한 실시예에서 소셜 계정이 이미 결정된 타깃 객체와 동등하다.

단계 S52: 발굴된 고위 임원과 Wechat 계정의 매칭이 완료되었는지를 판정하고, 매칭이 완료되지 않았으면 단계 S55를 수행하거나, 또는 매칭이 완료되었으면 단계 S53을 수행한다.

단계 S53: 고위 임원의 Wechat 계정 정보를 풀한다. 물론 구체적인 구현 프로세스에서, 소셜 계정은 QQ 계정, Facebook 계정 또는 Twitter 계정과 같은 소셜 계정일 수 있다. 풀된(pulled), 고위 임원의 WeChat 계정 정보에는 WeChat 계정이 포함될 수 있으며, 고위 임원의 WeChat 친구와 같은 기타 정보가 더 포함될 수 있다.

단계 S54: 온라인 데이터에 따라 매칭된 Wechat 계정이 정확한지를 결정한다.

예 2:

이하, M사의 최고 경영자(chief executive officer, CEO)에 대한 검색을 예로 들어 설명한다. 회사 M의 CEO가 사용하는 WeChat 계정의 위치가 파악된다. 이는, 회사 M의 CEO가 타깃 사용자의 직위 신원 정보이고, 회사 M은 인터넷 회사인, M 회사의 CEO의 속성 정보를 분석하여 알 수 있다. 먼저, 인터넷의 속성에 기초하여, 인터넷과 연관된 WeChat 그룹이 선택될 수 있다. Letv와 관련된 WeChat 그룹이 속성 정보로 Letv를 사용하여 선택된다. 그런 다음 Letv CEO의 오프라인 신원 정보가 WeChat에서 추출한 신원 정보와 매칭되어, Letv CEO WeChat 계정을 결정한다. 예를 들어 오프라인 신원 정보에는 Letv CEO의 이름 A가 포함될 수 있다. 이 예에서 상기 방법의 구체적인 절차는 다음과 같을 수 있다:

먼저, M사의 WeChat 그룹 커뮤니티가 검색된다.

1) 인터넷 관련 산업이 WeChat 그룹 커뮤니티 주제에 의해 필터링된 후, 키워드 "Letv"를 포함하는 그룹 명칭이 명칭 캐릭터를 통해 매칭되고, 매칭이 성공적인 그룹 명칭을 적어도 3개 포함하는 그룹 커뮤니티가 선택된다. 여기서, 그룹 커뮤니티의 매칭은 퍼지 매칭이고, 매칭 효과는 도 6에 도시되어 있다.

2) 고위 임원 주제를 충족시키는 그룹 커뮤니티가 필터링된다. 필터링 후, 나머지 소셜 그룹은 도 7에 도시되어 있다. 도 7은 도 6에 도시된 후보 소셜 그룹에 대해 필터링을 수행한 후의 타깃 소셜 그룹을 보여준다.

그 후, 각각의 WeChat 계정에 대응하는 사용자의 제1 신원 정보가 비고 정보를 파싱하여 획득된다. 예를 들어, 사용자의 기본 정보가 검색되고; 발견된 정보가 확인된다. 도 8 및도 9를 참조한다. 도 9는 WeChat 계정이 결정된 후에 WeChat 계정에 따라 결정된 제1 신원 정보를 보여준다.

그 후, 매칭을 통해 회사 M의 CEO에 의해 사용되는 WeChat 계정을 결정하기 위해, 제1 신원 정보를 다른 방식으로 획득된 제2 신원 정보와 매칭시킨다.

도 10에 도시된 바와 같이, A가 가입한 소셜 그룹은 A에 대응하는 소셜 계정에 따라 결정된다.

WeChat 그룹 커뮤니티 네트워크의 구성은 다음과 같다:

다이어그램 유형: 유향 다이어그램.

다이어그램 노드: WeChat 그룹은 다이어그램에서 노드에 대응한다.

다이어그램 에지: 동일한 그룹 멤버를 갖는 2개의 그룹 노드.

다이어그램 유향 에지 가중치:

는 소셜 그룹

및 소셜 그룹

의 공유된 소셜 계정의 수를 나타낸다.

는 소셜 그룹

의 소셜 계정의 수를 나타낸다.

는 소셜 그룹

및 소셜 그룹

로부터의 도면의 유향 에지 가중치이다.

전술한 커뮤니티 네트워크의 설립을 통해, 멤버 수가 적은 소규모 소셜 그룹과 멤버 수가 많은 대규모 소셜 그룹 사이의 관계가 수립될 수 있다. 예를 들어, 멤버 100명의 부서 그룹(department group)과 멤버 10명의 팀 그룹 사이에 관계가 수립된 경우, 멤버 10명은 멤버 100명의 부서 그룹에도 속한다. 명백히, 전술한 커뮤니티 네트워크를 설립하는 동안에, 멤버 10명의 팀 그룹의 노드 라벨은 멤버 100명의 부서 그룹의 대응하는 노드 라벨로 대체된다.

커뮤니티 검색과 관련된 많은 알고리즘이 있다. 간단한 계산의 라벨 전파 알고리즘(label propagation algorithm, LPA)을 사용하고, GAS(gather apply scatter) 방법을 사용하여 설정한다. 예를 들어, 커뮤니티 네트워크는 분산형 병렬 컴퓨팅(distributed parallel computing)을 사용하여 분류된다.

향상된 분산형 유향 다이어그램 LPA 커뮤니티 검색 알고리즘은 다음을 포함한다:

첫째, 초기화 작업이 수행된다: 각각의 노드의 노드 라벨을 노드 자체의 노드 식별자로 설정한다.

둘째, 노드 라벨이 갱신되며, 노드 라벨의 갱신은 다음을 포함한다:

수집 작업(collect operation): 각각의 타깃 노드에 대해, 인디그리 이웃 노드의 노드 식별자 및 대응하는 인디그리 에지 가중치를 수집한다.

적용 작업(application operation): 수집된 이웃 노드와 인디그리 에지 가중치를 동일한 노드 라벨에 대응하는 인디그리 에지 가중치에 별도로 가산하고, 마지막으로 최대 합에 대응하는 노드 라벨을 노드의 노드 라벨로 선택한다. 동일한 복수의 인디그리 에지 가중치가 동시에 존재하는 경우, 무작위로 선택된 인드리그 에지 가중치에 대응하는 노드 라벨이 대체된다.

확산 작업(scattering operation): 새로 계산된 노드 라벨이 최종 계산을 통해 획득된 노드 라벨과 상이한지 여부를 판정한다. 변화가 있으면, 모든 인접 노드에, 이 노드의 노드 라벨이 업데이트되었음을 통지하고, 다음 번에 대해 갱신 및 계산을 수행한다.

이 실시예에서, 수집 작업과 확산 작업은 비동기식으로 수행될 수 있다. 수집 작업 동안에 새로운 정보가 수신될 때마다, 적용 작업 및 확산 작업이 수행되고, 노드 라벨의 갱신이 다시 수행된다.

신원 정보 발굴:

먼저, 사용자의 비고 정보를 병음으로 변환한 후, 확률이 높은 성(姓)과 이름을 별도로 카운트하여 사용자의 명칭을 최종 결정한다. 여기서, 병음은 전술 한 발음 정보 중 하나이다.

예를 들면, 도 11에 도시된 바와 같이, 상기 방법은 다음 단계를 포함한다:

단계 S61: 친구에 의해 이루어진 사용자의 비고 정보를 수집한다.

단계 S62: 사용자의 룹 비고 정보를 수집한다.

단계 S63: 병음 처리: 동일한 병음을 갖는 명칭을 가장 빈번하게 사용된 명칭으로 치환한다.

단계 S64: 병음을 추출한다.

단계 S65: 성(姓) 리스트를 취득한다.

단계 S66: 가장 가능성이 높은 성에 매칭시킨다.

단계 S67: 실제 명칭 및 Wechat 계정에 따라 데이터를 발굴 한다. 이 예에서는, 병음 추출 및 성 매칭을 통해, 필기 실수를 바로 잡을 수 있다. 마지막으로, 제1 신원 정보와 제2 신원 정보를 매칭을 통해 취득된 성(姓)을 사용하여 매칭시켜, 매칭 성공률을 증가시킨다.

반복적 확산(iterative scattering):

획득된, 시드된 사용자에 대해, 시드된 사용자의 소셜 계정의 관계 링크가 풀되고, 그 후 N명의 시드된 사용자를 동시에 친구로 추가할 수 있는 후보 사용자가 선택되고, 전술한 단계가 획득된, 발굴된 실제 명칭 정보가 풀되며, 그 후 고위 임원의 명칭의 매핑이 수행된다. 매칭이 성공하면, 대응하는 고위 임원이 다음 번의 반복에 시드된 사용자로 사용된다.

예를 들면, 도 12에 도시 된 바와 같이, 상기 방법은 다음 단계를 포함한다:

단계 S71: 정확한 고위 임원을 매칭시키고 정확한 공위 임원을 다음 친구 확산의 시드된 사람으로서 사용한다.

단계 S72: 시드된 사람의 친구 및 대응하는 친구의 실제 명칭을 풀한다.

단계 S73: 발굴된 고위 임원의 매칭이 완료되었지를 판정하고, 매칭이 완료되지 않았으면, 단계 S71로 되돌아 가거나, 또는 매칭이 완료되었으면, 종료한다.

본 출원에 제공된 여러 실시예에서, 개시된 기기 및 방법은 다른 방식으로 구현될 수 있다는 것을 이해해야 한다. 설명된 기기 실시예는 예시적인 것에 불과하다. 예를 들어, 유닛의 분할은 논리적인 기능적 분할에 불과하고, 실제 구현 시에는 다른 분할일 수도 있다. 예를 들어, 복수의 유닛 또는 구성요소는 다른 시스템에 결합되거나 통합될 수 있거나, 또는 일부 특징은 무시되거나 수행되지 않을 수 있다. 또한, 구성 요소들 간의 표시되거나 논의된 상호 결합 또는 직접적인 결합 또는 통신 연결은 소정의 인터페이스, 기기 또는 유닛 간의 간접 연결이나 통신 연결, 또는 전기적 연결, 기계적 연결 또는 다른 형태의 연결을 통해 구현될 수 있다.

별개의 부분으로 기술된 유닛은 물리적으로 분리될 수도 있고 분리되지 않을 수도 있다. 디스플레이 유닛으로 사용되는 부분은 물리적인 유닛일 수도 있고 아닐 수도 있다. 즉, 유닛들은 동일한 장소에 위치하거나, 여러 네트워크 유닛에 분산될 수 있다. 유닛의 일부 또는 전부는 실시예의 방안의 목적을 구현하기 위해 실제 요구사항에 따라 선택될 필요가 있다.

또한, 본 발명의 실시예에서의 기능 유닛은 모두 처리 모듈에 일체화될 수도 있고, 각각의 유닛이 하나의 유닛으로 별개로 사용되거나, 2개 이상의 유닛이 하나의 유닛으로 통합된다. 통합된 유닛은 하드웨어의 형태로 구현될 수 있거나, 또는 하드드웨어와 소프트웨어 기능 유닛의 형태로 구현될 수 있다.

해당 기술의 당업자는 방법 실시예를 구현하기 위한 일부 또는 모든 단계가 프로그램 명령과 관련된 하드웨어를 사용하여 구현될 수 있다는 것을 이해할 수 있을 것이다. 프로그램은 컴퓨터로 판독할 수 있는 저장 매체에 저장될 수 있다. 프로그램이 실행될 때, 방법 실시예를 포함하는 단계들이 수행된다. 그러나, 저장 매체로는 예를 들어 모바일 저장 장치, ROM(read-only memory), RAM(random access memory), 자기 디스크 또는 광 디스크와 같은, 프로그램 코드를 저장할 수 있는 다양한 유형의 매체를 포함한다.

이상은 본 발명의 구체적인 구현예일 뿐이며, 본 발명의 보호 범위는 이에 한정되지 않는다. 본 발명의 원리에 따라 이루어진 수정은 본 발명의 보호 범위에 속해야 한다.

Claims

타깃 객체(target object)의 소셜 계정을 발굴하는 방법으로서,
상기 타깃 객체의 속성 정보를 사용하여 상기 타깃 객체가 속한 타깃 소셜 그룹의 위치를 파악하는 단계;
상기 타깃 소셜 그룹 내의 소셜 계정의 미리 설정된 정보를 파싱(parsing)하여, 상기 소셜 계정에 대응하는 사용자의 제1 신원 정보(identity information)를 획득하는 단계 - 상기 제1 신원 정보는 사용자의 오프라인 호칭을 포함함 - ;
상기 제1 신원 정보를 상기 타깃 객체의 제2 신원 정보와 매칭시키는 단계 - 상기 제2 신원 정보는 사전에 다른 전자 기기로부터 또는 휴먼-컴퓨터 상호 작용 인터페이스로부터 수신된 정보임 - ; 및
상기 제2 신원 정보와 매칭되는 상기 제1 신원 정보의 소셜 계정을 상기 타깃 객체의 소셜 계정으로 결정하는 단계
를 포함하는 소셜 계정을 발굴하는 방법.
제1항에 있어서,
상기 타깃 객체의 속성 정보를 사용하여 상기 타깃 객체가 속한 타깃 소셜 그룹의 위치를 파악하는 단계는,
후보 소셜 그룹의 그룹 속성을 상기 속성 정보와 매칭시키는 단계; 및
상기 속성 정보와 매칭되는 그룹 속성을 갖는 소셜 그룹을 상기 타깃 소셜 그룹으로 선택하는 단계를 포함하는, 소셜 계정을 발굴하는 방법.
제2항에 있어서,
상기 소셜 계정을 발굴하는 방법은,
미리 설정된 연관도(association degree)를 충족시키는 둘 이상의 소셜 그룹을 포함하는 그룹 커뮤니티를 설립하는 단계;
상기 소셜 그룹의 속성 정보에 대해 정보 클러스터링(information clustering)을 수행하고, 클러스터링 주제(clustering subject)를 결정하고, 상기 클러스터링 주제에서 상기 타깃 객체의 속성 정보와 매칭되는 타깃 클러스터링 주제(target clustering subject)를 결정하는 단계 - 상기 정보 클러스터링을 수행하는 것은 잠재적 디리클레 할당(latent dirichlet allocation, LDA)을 사용하여 주제 클러스터링을 수행하여 클러스터링 주제를 얻는 것을 포함함 - ; 및
상기 타깃 클러스터링 주제와 무관한 그룹 커뮤니티를 필터링하고, 상기 타깃 클러스터링 주제와 관련된 타깃 그룹 커뮤니티를 획득하는 단계 - 상기 타깃 그룹 커뮤니티 내의 소셜 그룹은 상기 후보 소셜 그룹임 -를 더 포함하는 소셜 계정을 발굴하는 방법.
제3항에 있어서,
상기 그룹 커뮤니티를 설립하는 단계는,
상기 둘 이상의 소셜 그룹을 포함하는 커뮤니티 네트워크를 설립하는 단계 - 상기 소셜 그룹은 커뮤니티 네트워크 내의 노드이고; 제1 노드와 제2 노드가 동일한 소셜 계정을 포함하면, 상기 제1 노드와 상기 제2 노드 사이에 유향 에지(directed edge)가 배치되고; 상기 유향 에지의 에지 가중치(edge weight)는 제1 값과 제2 값의 비율과 동일하고, 상기 제1 값은 상기 제1 노드와 상기 제2 노드에 모두 포함된 동일한 소셜 계정의 수이고, 상기 제2 값은 상기 제2 노드에 포함된 소셜 계정의 수임 -;
상기 커뮤니티 네트워크를 탐색(traversing)하고, 각각의 노드를 타깃 노드로 사용하여, 상기 타깃 노드의 이웃 노드의 노드 라벨 및 대응하는 인디그리 에지(indegree edge)의 인디그리 에지 가중치를 수집하는 단계 - 상기 인디그리 에지 가중치는 상기 이웃 노드에서 상기 타깃 노드로의 방향에 있는 유향 에지의 에지 가중치이고, 상기 타깃 노드는 상기 커뮤니티 네트워크 내의 노드이고, 상기 노드 라벨의 초기 값은 대응하는 노드의 노드 식별자임 -;
동일한 노드 라벨에 대응하는 인디그리 에지 가중치들을 가산하는 단계;
상기 타깃 노드의 노드 라벨을 최대 인디그리 에지 가중치에 대응하는 노드 라벨로 대체하는 단계; 및
상기 커뮤니티 네트워크를 탐색한 후에, 동일한 노드 라벨을 갖는 소셜 그룹을 하나의 그룹 커뮤니티로 분류하는 단계를 포함하는, 소셜 계정을 발굴하는 방법.
제1항에 있어서,
상기 타깃 소셜 그룹 내의 소셜 계정의 미리 설정된 정보를 파싱하여, 상기 소셜 계정에 대응하는 사용자의 제1 신원 정보를 획득하는 단계는,
상기 타깃 소셜 그룹 내의 각각의 소셜 계정의 비고 정보(remark information)를 추출하는 단계 - 상기 비고 정보는 상기 사용자의 신원을 표시하는 데 사용되는 정보임 -; 및
상기 비고 정보로부터 상기 제1 신원 정보를 추출하는 단계를 포함하는, 소셜 계정을 발굴하는 방법.
제5항에 있어서,
상기 비고 정보는 친구 비고 정보, 그룹 비고 정보 및 계정 비고 정보 중 적어도 하나를 포함하고;
상기 친구 비고 정보는 제1 소셜 계정의 친구 계정에 의해 상기 제1 소셜 계정에 대해 이루진 비고 정보이고;
상기 그룹 비고 정보는 상기 소셜 그룹 내의 상기 제1 소셜 계정의 비고 정보이고;
상기 계정 비고 정보는 상기 제1 소셜 계정에 의해 상기 사용자의 신원에 대한 이루어진 비고 정보인, 소셜 계정을 발굴하는 방법.
제5항에 있어서,
상기 비고 정보로부터 상기 제1 신원 정보를 추출하는 단계는,
상기 제1 신원 정보의 발음 정보(articulation information)를 추출하는 단계를 포함하고;
상기 제1 신원 정보를 상기 타깃 객체의 제2 신원 정보와 매칭시키는 단계는,
상기 제1 신원 정보의 발음 정보를 상기 제2 신원 정보의 발음 정보와 매칭시키는 단계를 포함하는, 소셜 계정을 발굴하는 방법.
제1항에 있어서,
상기 타깃 객체가 복수 존재하고 상기 타깃 객체가 서로 연관되어 있는 경우, 상기 소셜 계정을 발굴하는 방법은,
소셜 계정이 결정된 상기 타깃 객체의 친구 계정을 추출하는 단계; 및
상기 친구 계정의 미리 설정된 정보를 파싱하여, 상기 제1 신원 정보와 매칭될 상기 제2 신원 정보를 획득하는 단계를 더 포함 소셜 계정을 발굴하는 방법.
타깃 객체의 속성 정보를 사용하여 상기 타깃 객체가 속한 타깃 소셜 그룹의 위치를 파악하도록 구성된 위치 파악 유닛;
상기 타깃 소셜 그룹 내의 소셜 계정의 미리 설정된 정보를 파싱하여, 상기 소셜 계정에 대응하는 사용자의 제1 신원 정보를 획득하도록 구성된 파싱 유닛 - 상기 제1 신원 정보는 사용자의 오프라인 호칭을 포함함 - ;
상기 제1 신원 정보를 상기 타깃 객체의 제2 신원 정보와 매칭시키도록 구성된 매칭 유닛 - 상기 제2 신원 정보는 사전에 다른 전자 기기로부터 또는 휴먼-컴퓨터 상호 작용 인터페이스로부터 수신된 정보임 - ; 및
상기 제2 신원 정보와 매칭되는 상기 제1 신원 정보의 소셜 계정을 상기 타깃 객체의 소셜 계정으로 결정하도록 구성된 결정 유닛
을 포함하는 서버.
제9항에 있어서,
상기 위치 파악 유닛은,
후보 소셜 그룹의 그룹 속성을 상기 속성 정보와 매칭시키고; 상기 속성 정보와 매칭되는 그룹 속성을 갖는 소셜 그룹을 상기 타깃 소셜 그룹으로 선택하도록 구성되는, 서버.
제10항에 있어서,
상기 서버는,
미리 설정된 연관도를 충족시키는 둘 이상의 소셜 그룹을 포함하는 그룹 커뮤니티를 설립하도록 구성된 설립 유닛;
상기 소셜 그룹의 속성 정보에 대해 정보 클러스터링을 수행하고, 클러스터링 주제를 결정하고, 상기 클러스터링 주제에서 상기 타깃 객체의 속성 정보와 매칭되는 타깃 클러스터링 주제를 결정하도록 구성된 클러스터링 유닛 - 상기 정보 클러스터링을 수행하는 것은 잠재적 디리클레 할당(latent dirichlet allocation, LDA)을 사용하여 주제 클러스터링을 수행하여 클러스터링 주제를 얻는 것을 포함함 - ; 및
상기 타깃 클러스터링 주제와 무관한 그룹 커뮤니티를 필터링하고, 상기 타깃 클러스터링 주제와 관련된 타깃 그룹 커뮤니티를 획득하도록 구성된 필터링 유닛 - 상기 타깃 그룹 커뮤니티 내의 소셜 그룹은 상기 후보 소셜 그룹임 -을 더 포함하는 서버.
제11항에 있어서,
상기 설립 유닛은,
상기 둘 이상의 소셜 그룹을 포함하는 커뮤니티 네트워크를 설립하고 - 상기 소셜 그룹은 커뮤니티 네트워크 내의 노드이고; 제1 노드와 제2 노드가 동일한 소셜 계정을 포함하면, 상기 제1 노드와 상기 제2 노드 사이에 유향 에지가 배치되고; 상기 유향 에지의 에지 가중치는 제1 값과 제2 값의 비율과 동일하고, 상기 제1 값은 상기 제1 노드와 상기 제2 노드에 모두 포함된 동일한 소셜 계정의 수이고, 상기 제2 값은 상기 제2 노드에 포함된 소셜 계정의 수임 -;
상기 커뮤니티 네트워크를 탐색하고, 각각의 노드를 타깃 노드로 사용하여, 상기 타깃 노드의 이웃 노드의 노드 라벨 및 대응하는 인디그리 에지의 인디그리 에지 가중치를 수집하고 - 상기 인디그리 에지 가중치는 상기 이웃 노드에서 상기 타깃 노드로의 방향에 있는 유향 에지의 에지 가중치이고, 상기 타깃 노드는 상기 커뮤니티 네트워크 내의 노드이고, 상기 노드 라벨의 초기 값은 대응하는 노드의 노드 식별자임 -;
동일한 노드 라벨에 대응하는 인디그리 에지 가중치들을 가산하고;
상기 타깃 노드의 노드 라벨을 최대 인디그리 에지 가중치에 대응하는 노드 라벨로 대체하고;
상기 커뮤니티 네트워크를 탐색한 후에, 동일한 노드 라벨을 갖는 소셜 그룹을 하나의 그룹 커뮤니티로 분류하도록 구성되는, 서버.
제9항에 있어서,
상기 파싱 유닛은,
상기 타깃 소셜 그룹 내의 각각의 소셜 계정의 비고 정보를 추출하고 - 상기 비고 정보는 상기 사용자의 신원을 표시하는 데 사용되는 정보임 -;
상기 비고 정보로부터 상기 제1 신원 정보를 추출하도록 구성되는, 서버.
제13항에 있어서,
상기 비고 정보는 친구 비고 정보, 그룹 비고 정보 및 계정 비고 정보 중 적어도 하나를 포함하고;
상기 친구 비고 정보는 제1 소셜 계정의 친구 계정에 의해 상기 제1 소셜 계정에 대해 이루진 비고 정보이고;
상기 그룹 비고 정보는 상기 소셜 그룹 내의 상기 제1 소셜 계정의 비고 정보이고;
상기 계정 비고 정보는 상기 제1 소셜 계정에 의해 상기 사용자의 신원에 대한 이루어진 비고 정보인, 서버.
제13항에 있어서,
상기 파싱 유닛은 상기 제1 신원 정보의 발음 정보를 추출하도록 구성되고;
상기 매칭 유닛은 상기 제1 신원 정보의 발음 정보를 상기 제2 신원 정보의 발음 정보와 매칭시키도록 구성되는 서버.
제9항에 있어서,
상기 결정 유닛은, 상기 타깃 객체가 복수 존재하고 상기 타깃 객체가 서로 연관되어 있는 경우,
소셜 계정이 결정된 상기 타깃 객체의 친구 계정을 추출하고;
상기 친구 계정의 미리 설정된 정보를 파싱하여, 상기 제1 신원 정보와 매칭될 상기 제2 신원 정보를 획득하도록 구성되는, 서버.
컴퓨터로 실행할 수 있는 명령어가 저장된 컴퓨터 저장 매체로서,
상기 컴퓨터로 실행할 수 있는 명령어는, 제1항 내지 제8항 중 어느 한 항에 따른 타깃 객체의 소셜 계정을 발굴하는 방법 중 적어도 하나를 수행하는 데 사용되는,
컴퓨터 저장 매체.