KR20210040003A - 지식 그래프의 생성 방법, 관계 마이닝 방법, 장치, 기기 및 매체 - Google Patents
지식 그래프의 생성 방법, 관계 마이닝 방법, 장치, 기기 및 매체 Download PDFInfo
- Publication number
- KR20210040003A KR20210040003A KR1020210037307A KR20210037307A KR20210040003A KR 20210040003 A KR20210040003 A KR 20210040003A KR 1020210037307 A KR1020210037307 A KR 1020210037307A KR 20210037307 A KR20210037307 A KR 20210037307A KR 20210040003 A KR20210040003 A KR 20210040003A
- Authority
- KR
- South Korea
- Prior art keywords
- node
- knowledge graph
- attribute information
- mining
- relationship
- Prior art date
Links
- 238000005065 mining Methods 0.000 title claims abstract description 235
- 238000000034 method Methods 0.000 title claims abstract description 130
- 230000002123 temporal effect Effects 0.000 claims description 31
- 230000015654 memory Effects 0.000 claims description 19
- 238000012216 screening Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 18
- 238000003860 storage Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 abstract description 29
- 238000004458 analytical method Methods 0.000 abstract description 17
- 238000004364 calculation method Methods 0.000 abstract description 6
- 230000002708 enhancing effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 40
- 238000012546 transfer Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000000354 decomposition reaction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000035515 penetration Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000010223 real-time analysis Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012916 structural analysis Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000012098 association analyses Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000007794 visualization technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
본원발명은 지식 그래프의 생성 방법, 관계 마이닝 방법, 장치, 기기 및 매체를 개시하는바, 이는 지식 그래프 분야에 관한 것이다. 구체적인 실현 방안은, 복수의 연결 관계를 가지는 노드를 포함하는 초기 지식 그래프를 획득하고, 상기 초기 지식 그래프에서 설정된 속성 정보 요구를 만족시키는 복수의 타겟 지도 요소를 결정하되, 상기 지도 요소는 타겟 노드와 타겟 엣지에서의 적어도 하나를 포함하며, 상기 복수의 타겟 지도 요소를 병합하여 지식 그래프를 생성하는 것이다. 본 실시예는 노드와 엣지로 하여금 더 많은 속성 정보를 표달하도록 하여 지식 그래프의 표달 능력을 향상시키고, 그래프 구조를 감소시키며, 지식 그래프가 동적 관계 마이닝 등 비즈니스 시나리오에 응용될 때 분석 과정을 간략화하고, 계산량을 절감하며 계산 효율을 향상시킬 수 있다.
Description
본원발명은 컴퓨터 기술에 관한 것으로, 특히 지식 그래프 기술분야에 관한 것이다.
지식 그래프(Knowledge Graph)는 도서 정보 산업에서 지식 영역 시각화 또는 지식 영역 매핑 맵이라고 불리우는바, 지식 개발 프로세스와 구조 간의 관계를 보여주는 일련의 다양한 그래프로서, 시각화 기술을 사용하여 지식 소스와 그 캐리어를 설명하고, 지식과 이들 사이의 상호 연결을 마이닝, 분석, 구축, 제작 및 디스플레이한다.
사회적 관계 지식 그래프를 예로 들면, 그래프의 노드는 사람을 대표하고 노드 사이의 엣지는 사람 간의 관계를 대표하며, 금융 지식 그래프를 예로 들면, 그래프의 노드는 계정을 대표하고 노드 사이의 엣지는 계정과 계정 사이의 이체를 대표한다. 기존의 지식 그래프의 표현 능력이 부족하여 지식 그래프를 관계 마이닝 등 비즈니스 시나리오에 적용할 때 효과적인 작용을 발휘하기 어렵다.
본원발명의 실시예는 지식 그래프의 생성 방법, 관계 마이닝 방법, 장치, 기기 및 매체를 제공한다.
제1 양태에서, 본원발명의 실시예는,
복수의 연결 관계를 가지는 노드를 포함하는 초기 지식 그래프를 획득하는 단계;
상기 초기 지식 그래프에서 설정된 속성 정보 요구를 만족하는 복수의 타겟 지도 요소를 결정하는 단계 - 지도 요소는 타겟 노드와 타겟 엣지 중의 적어도 하나를 포함함 - ; 및
상기 복수의 타겟 지도 요소를 병합하여 지식 그래프를 생성하는 단계
를 포함하는 지식 그래프의 생성 방법을 제공한다.
제2 양태에서, 본원발명의 실시예는 임의의 한 지식 그래프의 생성 방법에 따라 생성되는 지식 그래프에 기반한 관계 마이닝 방법을 제공하는데, 당해 지식 그래프에 기반한 관계 마이닝 방법은,
상기 지식 그래프와 마이닝 대기 동적 관계를 획득하는 단계;
상기 동적 관계에 근거하여 마이닝 대기 노드와 마이닝 대기 속성 정보를 포함하는 마이닝 대기 정보를 결정하는 단계;
상기 마이닝 대기 정보에 근거하여 상기 지식 그래프에서의 시작 노드와 선별 조건을 결정하는 단계; 및
상기 시작 노드로부터 상기 지식 그래프를 순회하고, 상기 선별 조건에 따라 순회하여 얻은 노드를 선별함으로써 상기 동적 관계를 가지는 노드를 획득하는 단계
를 포함한다.
제3 양태에서, 본원발명의 실시예는,
복수의 연결 관계를 가지는 노드를 포함하는 초기 지식 그래프를 획득하기 위한 획득 모듈;
상기 초기 지식 그래프에서 설정된 속성 정보 요구를 만족하는 복수의 타겟 지도 요소를 결정하는 결정 모듈 - 지도 요소는 타겟 노드와 타겟 엣지 중의 적어도 하나를 포함함 - ; 및
상기 복수의 타겟 지도 요소를 병합하여 지식 그래프를 생성하기 위한 생성 모듈
을 포함하는 지식 그래프의 생성 장치를 제공한다.
제4 양태에서, 본원발명의 실시예는,
상기 지식 그래프와 마이닝 대기 동적 관계를 획득하기 위한 획득 모듈;
상기 동적 관계에 근거하여 마이닝 대기 노드와 마이닝 대기 속성 정보를 포함하는 마이닝 대기 정보를 결정하기 위한 제1 결정 모듈;
상기 마이닝 대기 정보에 근거하여 상기 지식 그래프에서의 시작 노드와 선별 조건을 결정하기 위한 제2 결정 모듈; 및
상기 시작 노드로부터 상기 지식 그래프를 순회하고 상기 선별 조건에 따라 순회하여 얻은 노드를 선별함으로써 상기 동적 관계를 가지는 노드를 획득하기 위한 순회와 선별 모듈
을 포함하는 지식 그래프에 기반한 관계 마이닝 장치를 제공한다.
제5 양태에서, 본원발명의 실시예는 전자 기기를 제공하는데,
적어도 하나의 프로세서; 및
상기 적어도 하나의 프로세서와 통신 연결하는 메모리
를 포함하고,
상기 메모리에는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령이 저장되며, 상기 명령이 상기 적어도 하나의 프로세서에 의해 실행될 경우, 상기 적어도 하나의 프로세서가 임의의 한 실시예에 따른 지식 그래프의 생성 방법 또는 지식 그래프에 기반한 관계 마이닝 방법을 수행한다.
제6 양태에서, 본원발명의 실시예는 컴퓨터 프로그램이 저장된 비일시적 컴퓨터 판독 가능 저장 매체를 더 제공하는데, 상기 컴퓨터 프로그램의 명령이 실행될 경우, 임의의 한 실시예에 따른 지식 그래프의 생성 방법 또는 지식 그래프에 기반한 관계 마이닝 방법이 수행된다.
제7 양태에서, 본원발명의 실시예는 컴퓨터 판독 가능 매체에 저장되어 있는 컴퓨터 프로그램을 제공하는바, 상기 컴퓨터 프로그램의 명령이 실행될 경우, 임의의 한 실시예에 따른 지식 그래프의 생성 방법 또는 지식 그래프에 기반한 관계 마이닝 방법이 수행된다.
본원발명의 기술에 따르면 지식 그래프의 표달 능력을 향상시키고, 지식 그래프를 관계 마이닝 등 비즈니스 시나리오에 응용할 때 효과적인 작용을 발휘한다.
본 명세서에서 설명한 내용은 본 발명의 실시예의 관건적이거나 중요한 특징을 표기하기 위한 것이 아니고, 본 발명의 범위를 한정하기 위한 것도 아님을 이해해야 한다. 본 발명의 기타 특징은 아래의 명세서를 통해 더 용이하게 이해할 수 있을 것이다.
도면은 본 해결수단을 더 잘 이해하기 위한 것으로 본원발명에 대해 한정하는 것이 아니다. 여기서,
도 1은 본원발명의 실시예에 따라 제공하는 첫 번째 지식 그래프의 생성 방법의 과정 모식도이다.
도 2a는 본원발명의 실시예에 따라 제공하는 두 번째 지식 그래프의 생성 방법의 과정 모식도이다.
도 2b는 본원발명의 실시예에 따라 제공하는 초기 지식 그래프의 구조 모식도이다.
도 2c는 본원발명의 실시예에 따라 제공하는 초기 지식 그래프에 대해 엣지 병합을 진행하는 구조 모식도이다.
도 2d는 본원발명의 실시예에 따라 제공하는 엣지 병합을 진행한 후의 지식 그래프에 대해 노드 병합을 진행하는 구조 모식도이다.
도 2e는 본원발명의 실시예에 따라 제공하는 슈퍼 노드의 구조 모식도이다.
도 2f는 본원발명의 실시예에 따라 제공하는 분해한 후의 노드의 모식도이다.
도 3a는 본원발명의 실시예에 따라 제공하는 세 번째 지식 그래프의 생성 방법의 과정 모식도이다.
도 3b는 본원발명의 실시예에 따라 제공하는 서브 그래프의 모식도이다.
도 3c는 본원발명의 실시예에 따라 제공하는 여러 장의 서브 그래프가 시공간 좌표계 내에 투영된 모식도이다.
도 3d는 본원발명의 실시예에 따라 제공하는 시공간 좌표계에서의 여러 장의 서브 그래프에서 동일한 노드의 모식도이다.
도 3e는 본원발명의 실시예에 따라 제공하는 초기 지식 그래프의 구조 모식도이다.
도 3f는 본원발명의 실시예에 따라 제공하는 신규 가상 노드가 기지국 노드와 카메라 노드를 연결하는 모식도이다.
도 3g는 본원발명의 실시예에 따라 제공하는 시공간 좌표계에서 신규 가상 노드가 고립된 서브 그래프를 연결하는 모식도이다.
도 3h는 본원발명의 실시예에 따라 제공하는 초기 지식 그래프의 구축 구조도이다.
도 4는 본원발명의 실시예에 따라 제공하는 첫 번째 지식 그래프에 기반한 관계 마이닝 방법의 과정 모식도이다.
도 5a는 본원발명의 실시예에 따라 제공하는 두 번째 지식 그래프에 기반한 관계 마이닝 방법의 과정 모식도이다.
도 5b는 본원발명의 실시예에 따라 제공하는 추상화 가능 노드와 엣지에 대해 추상화를 진행하는 모식도이다.
도 6은 본원발명의 실시예에 따라 제공하는 세 번째 지식 그래프에 기반한 관계 마이닝 방법의 과정 모식도이다.
도 7은 본원발명의 실시예에 따라 제공하는 네 번째 지식 그래프에 기반한 관계 마이닝 방법의 과정 모식도이다.
도 8은 본원발명의 실시예에서 제공하는 한 가지 지식 그래프의 생성 장치의 구조도이다.
도 9는 본원발명의 실시예에서 제공하는 한 가지 지식 그래프에 기반한 관계 마이닝 장치의 구조도이다.
도 10은 본원발명의 실시예에 따른 지식 그래프의 생성 방법 또는 지식 그래프에 기반한 관계 마이닝 방법을 실현하기 위한 전자 기기의 블록도이다.
도 1은 본원발명의 실시예에 따라 제공하는 첫 번째 지식 그래프의 생성 방법의 과정 모식도이다.
도 2a는 본원발명의 실시예에 따라 제공하는 두 번째 지식 그래프의 생성 방법의 과정 모식도이다.
도 2b는 본원발명의 실시예에 따라 제공하는 초기 지식 그래프의 구조 모식도이다.
도 2c는 본원발명의 실시예에 따라 제공하는 초기 지식 그래프에 대해 엣지 병합을 진행하는 구조 모식도이다.
도 2d는 본원발명의 실시예에 따라 제공하는 엣지 병합을 진행한 후의 지식 그래프에 대해 노드 병합을 진행하는 구조 모식도이다.
도 2e는 본원발명의 실시예에 따라 제공하는 슈퍼 노드의 구조 모식도이다.
도 2f는 본원발명의 실시예에 따라 제공하는 분해한 후의 노드의 모식도이다.
도 3a는 본원발명의 실시예에 따라 제공하는 세 번째 지식 그래프의 생성 방법의 과정 모식도이다.
도 3b는 본원발명의 실시예에 따라 제공하는 서브 그래프의 모식도이다.
도 3c는 본원발명의 실시예에 따라 제공하는 여러 장의 서브 그래프가 시공간 좌표계 내에 투영된 모식도이다.
도 3d는 본원발명의 실시예에 따라 제공하는 시공간 좌표계에서의 여러 장의 서브 그래프에서 동일한 노드의 모식도이다.
도 3e는 본원발명의 실시예에 따라 제공하는 초기 지식 그래프의 구조 모식도이다.
도 3f는 본원발명의 실시예에 따라 제공하는 신규 가상 노드가 기지국 노드와 카메라 노드를 연결하는 모식도이다.
도 3g는 본원발명의 실시예에 따라 제공하는 시공간 좌표계에서 신규 가상 노드가 고립된 서브 그래프를 연결하는 모식도이다.
도 3h는 본원발명의 실시예에 따라 제공하는 초기 지식 그래프의 구축 구조도이다.
도 4는 본원발명의 실시예에 따라 제공하는 첫 번째 지식 그래프에 기반한 관계 마이닝 방법의 과정 모식도이다.
도 5a는 본원발명의 실시예에 따라 제공하는 두 번째 지식 그래프에 기반한 관계 마이닝 방법의 과정 모식도이다.
도 5b는 본원발명의 실시예에 따라 제공하는 추상화 가능 노드와 엣지에 대해 추상화를 진행하는 모식도이다.
도 6은 본원발명의 실시예에 따라 제공하는 세 번째 지식 그래프에 기반한 관계 마이닝 방법의 과정 모식도이다.
도 7은 본원발명의 실시예에 따라 제공하는 네 번째 지식 그래프에 기반한 관계 마이닝 방법의 과정 모식도이다.
도 8은 본원발명의 실시예에서 제공하는 한 가지 지식 그래프의 생성 장치의 구조도이다.
도 9는 본원발명의 실시예에서 제공하는 한 가지 지식 그래프에 기반한 관계 마이닝 장치의 구조도이다.
도 10은 본원발명의 실시예에 따른 지식 그래프의 생성 방법 또는 지식 그래프에 기반한 관계 마이닝 방법을 실현하기 위한 전자 기기의 블록도이다.
이하 도면과 결부하여 본원발명의 예시적인 실시예를 설명하되, 여기서 본원발명의 실시예를 포함하는 여러 가지 세부절차는 이해를 돕기 위한 것으로 이들은 응당 예시적인 것으로 간주해야 한다. 따라서, 본 기술분야에서 통상의 지식을 가진 자들은 여기서 설명한 실시예에 대하여 여러 가지 변화와 수정을 진행할 수 있고, 이는 본원발명의 범위와 정신을 벗어나지 않는다는 것을 알 수 있다. 마찬가지로, 뚜렷함과 간결함을 위하여 아래의 설명에서는 공지 기능과 구조에 대한 설명을 생략하였다.
본원발명의 실시예에서, 도 1은 본원발명의 실시예에 따라 제공하는 첫 번째 지식 그래프의 생성 방법의 과정 모식도이고, 본 실시예는 초기 지식 그래프를 다시 처리하는 상황에 적용된다. 상기 방법은 지식 그래프의 생성 장치에 의해 수행될 수 있고, 상기 장치는 소프트웨어 및/또는 하드웨어의 방식으로 실현될 수 있으며 전자 기기에 집적될 수 있는데, 선택적으로 상기 전자 기기는 단말기 또는 서버일 수 있다. 도 1에 도시된 바와 같이, 본 실시예에서 제공하는 지식 그래프의 생성 방법은 단계 S110 내지 단계 S130을 포함할 수 있다.
단계 S110: 복수의 연결 관계를 가지는 노드를 포함하는 초기 지식 그래프를 획득한다.
초기 지식 그래프는 선행기술에서 제공하는 임의의 한 지식 그래프 또는 데이터 소스를 이용하여 구축한 지식 그래프일 수 있다. 초기 지식 그래프는 복수의 연결 관계를 가지는 노드를 포함한다. 여기서, 노드는 엔티티를 대표하고, 노드 사이의 엣지는 관계를 대표하며, 엔티티와 관계는 모두 속성 정보를 가진다.
선택적으로, 초기 지식 그래프에서의 임의의 두 개의 노드 사이는 모두 직접적이거나 간접적인 연결 관계가 구비되고 고립된 서브 그래프가 존재하지 않는바, 즉 초기 지식 그래프는 연통된 그래프로써 후속적으로 지식 그래프를 응용하는 과정에서 연통되지 않은 그래프로 인하여 정보를 분실하는 것을 방지할 수 있다.
단계 S120: 초기 지식 그래프에서 설정된 속성 정보 요구를 만족하는 복수의 타겟 지도 요소를 결정한다.
구체적으로, 속성 정보는 속성 정보의 값과 속성 정보의 유형을 포함하고, 설정된 속성 정보 요구는 속성 정보의 값과 속성 정보의 유형 중의 적어도 하나에 대한 요구를 포함한다. 타겟 지도 요소는 타겟 노드와 타겟 엣지 중의 적어도 하나를 포함한다. 구체적으로, 초기 지식 그래프의 각 노드와 각 엣지를 순회하여 설정된 속성 정보 요구를 만족하는 복수의 노드, 또는 복수의 엣지, 또는 복수의 노두와 복수의 엣지, 예를 들어 시간 속성과 공간 속성(이하 시공간 속성이라고 함)을 구비하는 노드를 검색한다. 설명과 구별의 편리를 위하여, 설정된 속성 정보 요구를 만족하는 노드와 엣지를 각각 타겟 노드와 타겟 엣지라고 부른다.
단계 S130: 복수의 타겟 지도 요소를 병합하여 지식 그래프를 생성한다.
한 가지 실시형태에서, 복수의 타겟 노드를 하나의 포인트로 병합하고, 병합한 후의 포인트에 복수의 타겟 노드의 속성 정보를 보류하며, 이와 동시에 복수의 타겟 노드와 각각 연결된 엣지를 당해 병합한 후의 노드에 연결한다.
다른 한 가지 실시형태에서, 복수의 타겟 엣지를 하나의 엣지로 병합하고, 병합한 후의 엣지에 복수의 엣지의 속성 정보를 보류한다. 선택적으로, 만약 상이한 타겟 엣지와 연결된 노드가 상이하면 상이한 노드를 병합하고, 병합한 후의 포인트에 상이한 노드의 속성 정보를 보류한다.
또 다른 한 가지 실시형태에서, 복수의 타겟 노드를 하나의 포인트로 병합하고, 이와 동시에 복수의 타겟 엣지를 하나의 엣지로 병합하는바, 구체적인 내용은 상기 설명을 참조하면 되므로 여기서 더 이상 설명하지 않는다.
본 실시예에서는, 초기 지식 그래프에서 설정된 속성 정보 요구를 만족하는 복수의 타겟 노드와 복수의 타겟 엣지 중의 적어도 하나를 병합하여 노드와 엣지가 더 많은 속성 정보를 표달하도록 하여 지식 그래프의 표달 능력을 향상한다. 또한 그래프 구조를 감소시키며 지식 그래프가 동적 관계 마이닝 등 비즈니스 시나리오에 응용될 때 분석 과정을 간략화하고 계산량을 절감하며 계산 효율을 향상시킬 수 있다.
본원발명의 실시예에서, 도 2a는 본원발명의 실시예에 따라 제공하는 두 번째 지식 그래프의 생성 방법의 과정 모식도이고, 본 실시예는 상기 실시예의 기초상에 진일보로 최적화한다.
선택적으로, "초기 지식 그래프에서 설정된 속성 정보 요구를 만족하는 복수의 타겟 지도 요소를 결정한다"는 동작을 "만약 타겟 지도 요소가 타겟 노드를 포함하면 초기 지식 그래프에서 임의의 두 개의 노드의 속성 정보의 값의 차이가 설정 범위 내에 있는 복수의 타겟 노드를 결정하고, 만약 타겟 지도 요소에 타겟 엣지가 포함되면 초기 지식 그래프에서 두 개의 노드 사이의 속성 정보의 유형이 동일한 복수의 타겟 엣지를 결정한다"로 최적화시켜 설정된 속성 정보 요구를 한정한다.
더 나아가, "복수의 타겟 지도 요소를 병합하여 지식 그래프를 생성한다" 다음에 "지식 그래프에서 슈퍼 노드를 결정하되, 슈퍼 노드가 연결하는 엣지의 수량이 설정값을 초과하고, 슈퍼 노드에 연결한 엣지의 속성 정보에 근거하여 슈퍼 노드가 연결하는 엣지를 복수의 엣지 집합으로 구획하며, 엣지 집합의 수량에 근거하여 슈퍼 노드를 상응한 수량의 노드로 분해하고 각 엣지 집합에서의 엣지를 분해한 후의 각 노드에 연결한다"를 최적화시켜 슈퍼 노드의 출현을 방지한다.
도 2a에서 제공하는 지식 그래프의 생성 방법은 단계 S210 내지 단계 S260을 포함할 수 있다.
단계 S210: 복수의 연결 관계를 가지는 노드를 포함하는 초기 지식 그래프를 획득한다.
도 2b는 본원발명의 실시예에 따라 제공하는 초기 지식 그래프의 구조 모식도로서, 도면에는 각각 P와 s로 시작되는 두 가지 유형의 노드가 포함되어 동일한 유형의 각 노드를 P 또는 s 뒤의 숫자로 구별한다. 노드 사이의 연결선은 노드 사이의 관계를 나타내고, 연결선에서의 t1 내지 t6은 시간 속성의 상이한 값, 통속적으로 말하면 상이한 시간을 나타낸다.
단계 S220: 만약 타겟 지도 요소가 타겟 노드를 포함하면 초기 지식 그래프에서 임의의 두 개의 노드의 속성 정보의 값의 차이가 설정 범위 내에 있는 복수의 타겟 노드를 결정하고, 만약 타겟 지도 요소가 타겟 엣지를 포함하면 초기 지식 그래프에서 두 개의 노드 사이의 속성 정보의 유형이 동일한 복수의 타겟 엣지를 결정한다.
설정 범위는 자체로 설정할 수 있는바, 속성 정보의 유형이 상이함에 따라 설정 범위도 상이할 수 있다. 예를 들면, 속성 정보의 유형이 시간이면 시간 차이의 설정 범위는 1분 내, 2분 내 등이고, 또 예를 들면, 속성 정보의 유형이 공간이면 공간 차이의 설정 범위는 100평방미터 내 등이다. 도 2b에서 s1과 s2가 타겟 노드이고, s3과 s4가 타겟 노드이며, s5와 s7이 타겟 노드이고, s6과 s7이 타겟 노드라고 가정한다.
도 2b에서, s1과 P1 사이의 3 개 엣지의 속성 정보의 유형이 시간이면 3개 엣지는 타겟 엣지이고, 같은 원리로, P1과 s2 사이의 2개 엣지가 타겟 엣지이며, s3과 P2 사이의 2개 엣지가 타겟 엣지이고, P2와 s5 사이의 2개 엣지가 타겟 엣지이며, s7과 P3 사이의 2개 엣지가 타겟 엣지이다.
단계 S230: 복수의 타겟 지도 요소를 병합하여 지식 그래프를 생성한다.
선택적으로, 타겟 노드와 타겟 엣지를 모두 병합할 경우, 먼저 복수의 타겟 노드를 병합한 다음 복수의 타겟 엣지를 병합하거나, 또는 먼저 복수의 타겟 엣지를 병합한 다음 복수의 타겟 노드를 병합한다.
복수의 타겟 엣지를 병합하는 것을 예로 들면, 도 2c는 본원발명의 실시예에 따라 제공하는 초기 지식 그래프에 대해 엣지 병합을 진행하는 구조 모식도이고, 도 2c는 도 2b의 타겟 엣지를 병합하는 것이고, 타겟 엣지는 단계 S220에 기록된 것을 참조하기 바란다. 병합한 후의 엣지는 각 타겟 엣지의 속성 정보를 이웃하는 테이블에 저장하고 이웃하는 테이블의 격식은 K(V)이며, K는 병합한 후의 엣지의 표시이고 T+숫자의 격식으로 나타내며, V는 각 타겟 엣지의 속성 정보이고, 구체적인 이웃하는 테이블은 도 2c에 도시된 바와 같다.
도 2d는 본원발명의 실시예에 따라 제공하는 엣지 병합을 진행한 후의 지식 그래프에 대해 노드 병합을 진행하는 구조 모식도이다. 도 2d는 도 2c의 타겟 노드를 병합하는 것이고, 타겟 엣지는 단계 S220에 기록된 것을 참조하기 바란다. 각 타겟 노드와 각각 연결되는 엣지도 병합된 후의 노드에 연결된다. 설명할 필요가 있는 것은, 타겟 노드를 병합한 후, 만약 두 개의 노드 사이의 속성 정보의 유형이 동일한 복수의 타겟 엣지가 다시 나타나면 복수의 타겟 엣지를 계속하여 병합함으로써 타겟 노드와 타겟 엣지가 교체되게 병합하여 지식 그래프의 충분한 압축을 담보하게 된다. 구체적으로, 타겟 노드s1과 s2를 병합하여 S1을 얻고, S1과 P1 사이에 2개의 타겟 엣지가 존재하며 점선으로 나타내고, 다음 당해 2개의 타겟 엣지를 병합하여 하나의 엣지를 얻으며 굵은 실선으로 나타낸다. 병합한 후의 노드는 각 타겟 노드와 연결된 엣지의 속성 정보를 이웃하는 테이블에 저장하고 이웃하는 테이블의 격식은 KV이며 K는 병합한 후의 엣지의 표시이고 ST+숫자의 격식으로 나타내며, V는 각 타겟 노드의 표시와 각 타겟 노드가 연결하는 엣지의 속성 정보이고, 구체적인 이웃하는 테이블은 도 2d에 도시된 바와 같다.
한 애플리케이션 시나리오에서, 동일한 모바일 핫스팟(WIFI) 기기가 동일한 사람의 대량의 정보를 수집하는데, 이러한 상황에서 당해 사람과 당해 WIFI 기기 사이에 대량의 엣지 정보가 형성할 수 있어 이러한 엣지를 동일한 하나의 엣지로 병합하고, 엣지의 속성에 당해 사람과 당해 WIFI 기기의 연결 시간 등 속성 정보를 기록함으로써, 대량의 엣지가 존재하는 것을 방지하여 지식 그래프의 규모를 압축시킬 수 있다.
다른 애플리케이션 시나리오에서, 어느 한 가게에 대량의 WIFI 기기가 있고 각 WIFI 기기는 모두 사람과 대량으로 연결되는데, 이러한 상황에서 대량의 노드와 엣지를 발생하게 된다. 당해 가계의 모든 WIFI 기기를 동일한 노드로 병합할 수 있다. 이렇게 되면 후속적인 분석에 영향을 미치지 않을 뿐만 아니라, 분석 과정을 간략화하고, 전체 지식 그래프의 규모를 더 압축할 수 있다.
단계 S240: 지식 그래프에서 슈퍼 노드를 결정하되, 슈퍼 노드가 연결하는 엣지의 수량이 설정값을 초과한다.
타겟 지도 요소를 병합한 후, 대량의 엣지와 연결되는 슈퍼 노드가 나타날 수 있다. 슈퍼 노드를 분석할 경우, 롱 테일 현상과 오버타임 현상이 나타난다.
여기서, 설정값은 100, 500 등과 같이 자체로 설정할 수 있다. 지식 그래프에서의 각 노드가 연결하는 엣지의 수량을 계산하고, 설정값을 초과하는 수량과 대응되는 노드를 슈퍼 노드라고 한다. 도 2e는 본원발명의 실시예에 따라 제공하는 슈퍼 노드의 구조 모식도이다. 상기 슈퍼 노드는 Sn으로 나타내고, 9개의 엣지, 7개의 노드와 연결되며, 엣지의 속성 정보는 이웃하는 테이블에 저장되는데, 간략화하기 위하여 이웃하는 테이블은 단지 K, 즉 엣지의 표시로 나타내고 ST+숫자의 격식으로 나타낸다. ST가 시공간 속성 정보를 나타낸다고 가정하면 숫자는 속성 정보의 값을 나타낸다.
단계 S250: 슈퍼 노드에 연결한 엣지의 속성 정보에 근거하여 슈퍼 노드가 연결하는 엣지를 복수의 엣지 집합으로 구획한다.
구체적으로, 연결된 엣지의 속성 정보의 유형 또는 속성 정보의 값에 따라 슈퍼 노드를 분해한다. 예를 들면, 속성 정보의 유형이 동일한 엣지를 하나의 엣지 집합에 구획하거나 또는 속성 정보의 값이 동일한 설정 범위 내에 있는 엣지를 하나의 엣지 집합에 구획한다. 예를 들면, 동일한 설정 범위가 8시로부터 12시, 12시로부터 15시를 포함하면 시간이 8시로부터 12시까지의 엣지를 하나의 엣지 집합에 구획하고, 시간이 12시로부터 15시까지의 엣지를 하나의 엣지 집합에 구획한다.
단계 S260: 엣지 집합의 수량에 근거하여 슈퍼 노드를 상응한 수량의 노드로 분해하고 각 엣지 집합에서의 엣지를 분해한 후의 각 노드에 연결한다.
도 2f는 본원발명의 실시예에 따라 제공하는 분해한 후의 노드의 모식도이다. 시공간 속성 정보의 값이 동일한 엣지를 하나의 엣지 집합에 구획, 즉 속성 정보의 값이 ST1, ST2 및 ST3인 엣지를 각각 3개의 엣지 집합에 구획한다. 나아가, 슈퍼 노드를 3개의 노드로 분해하고 엣지의 시공간 속성 정보의 값에 따라 분해한 후의 노드 표시를 결정하여 구획을 나타내도록 하며, 도 2f는 분해한 후의 3개의 노드 표시가 각각 ST1, ST2 및 ST3이라는 것을 도시한다. 이어서, 속성 정보의 값이 ST1인 엣지 집합을 S1T1 노드에 연결하고, 속성 정보의 값이 ST2인 엣지 집합을 S2T2 노드에 연결하며, 속성 정보의 값이 ST3인 엣지 집합을 S3T3 노드에 연결한다.
본 실시예는 슈퍼 노드를 분해하는 것을 통해 대량의 엣지를 각 노드에 할당함으로써, 액세스 시효성을 향상시키고 롱 테일 현상과 오버타임 현상을 방지한다.
본 실시예는 속성 정보의 값의 차이가 설정 범위 내에 있는 노드 및 두 개의 노드 사이의 속성 정보의 유형이 동일한 엣지를 병합시킴으로써, 지식 그래프가 동적 관계 마이닝 등 비즈니스 시나리오에 응용될 때 속성 정보의 값의 차이가 설정 범위 내에 있는 노드 및 두 포인트 사이의 속성 정보의 유형이 동일한 엣지를 일차적으로 획득할 수 있어 동작을 간략화하는데 유리하고, 이와 동시에 본 실시예에서 제공하는 병합방법은 실제 애플리케이션 시나리오에 더 부합되어 연관되지 않는 노드 또는 엣지를 병합하는 것을 방지한다.
본원발명의 실시예에서, 도 3a는 본원발명의 실시예에 따라 제공하는 세 번째 지식 그래프의 생성 방법의 과정 모식도이고 본 실시예는 상기 실시예의 기초상에 더 최적화한다.
선택적으로, "초기 지식 그래프를 획득한다"라는 동작을 "초기 지식 그래프를 생성하기 위한 여러 유형의 여러 장의 서브 그래프 및 여러 장의 서브 그래프에서의 노드의 정보와 엣지의 속성 정보를 획득하고, 엣지의 속성 정보에 근거하여 중간 지식 그래프에서 동일한 노드에 연결된, 설정된 관련 조건을 만족하는 엣지를 병합하여 초기 지식 그래프를 획득한다"로 최적화하여 초기 지식 그래프의 생성 방법을 제공한다.
도 3a에서 제공하는 지식 그래프의 생성 방법은 단계 S310 내지 단계 S350을 포함한다.
단계 S310: 초기 지식 그래프를 구축하기 위한 여러 유형의 여러 장의 서브 그래프 및 여러 장의 서브 그래프에서의 노드의 정보와 엣지의 속성 정보를 획득한다.
단계 S320: 노드의 정보에 근거하여 여러 장의 서브 그래프에서의 동일한 노드를 병합하여 중간 지식 그래프를 획득한다.
동일한 노드는 상이한 유형의 서브 그래프에 나타난다. 예를 들어, 어느 사용자에 의해 추상화된 노드가 사회적 관계의 서브 그래프와 계정 관계의 서브 그래프에 나타나면 당해 동일한 노드를 병합한다. 그러나, 상이한 유형의 서브 그래프에서 당해 동일한 노드를 연결하는 엣지는 보류해야 한다.
여러 장의 서브 그래프에서의 각 노드를 순회하고 임의의 두 장의 서브 그래프에서의 동일한 노드를 병합하여 하나의 지식 그래프를 얻고 이를 중간 지식 그래프라고 한다. 이해할 수 있는 것은, 중간 지식 그래프에는 동일한 노드가 존재하지 않고 여러 장의 서브 그래프에서의 상이한 노드를 융합시켜 모든 엣지를 보류한다.
단계 S330: 엣지의 속성 정보에 근거하여 중간 지식 그래프에서 동일한 노드에 연결된, 설정된 관련 조건을 만족하는 엣지를 병합하여 초기 지식 그래프를 획득한다.
동일한 노드에 연결한 각 엣지를 순회하고 상기 각 엣지의 속성 정보를 획득한다. 설정된 관련 조건을 만족하는 엣지를 병합한다. 상응하게, 병합된 두 개의 엣지와 대응되는 다른 두 개의 노드도 병합해야 한다. 실제 조작에서는, 다른 두 개의 노드를 하나의 노드로 나타낼 수 있으나, 원래의 두 노드의 정보와 속성 정보를 보류해야 한다.
선택적으로, 설정된 관련 조건은 시간 속성 정보 또는 공간 속성 정보의 근접, 이체 액수 속성 정보의 근접, 속성 정보 기밀성 여부를 포함하나 이에 한정되지 않는다.
속성 정보 기밀성 여부를 예로 들면, 기밀성을 모두 가지는 두 개의 엣지를 병합하여 지식 그래프를 얻는다. 중간 지식 그래프에서 노드 5와 노드 6이 연결되면 사용자 A가 사용자 B에게 이체하는 것을 나타내고, 대응되는 엣지의 속성 정보는 익명 이체이다. 노드 5와 노드 7이 연결되면 사용자 A가 사용자 C와 통화하는 것을 나타내고, 대응되는 엣지의 속성 정보는 전화번호 보이지 않음이다. 알 수 있는바, 노드 5에 연결되는 두 개의 속성 정보가 모두 기밀성을 가지면 당해 두개의 엣지를 병합한다. 상응하게, 노드 6과 노드 7도 병합하고 병합한 후의 노드는 사용자 B와 사용자 C의 정보를 동시에 나타낸다.
엣지의 타겟 속성 정보에 근거하여 중간 지식 그래프에서 동일한 노드에 연결된, 타겟 속성 정보의 값의 차이가 설정 범위 내에 있는 엣지를 병합하여 지식 그래프를 얻는다. 여기서, 타겟 속성 정보는 시간 속성 정보와 공간 속성 정보 중의 적어도 하나를 포함한다. 설정 범위는 실제 상황에 따라 원활하게 설치할 수 있는바, 시간 차이는 10분 또는 30분일 수 있고, 공간 차이는 10미터 또는 50미터일 수 있다. 노드 8과 노드 9가 연결된다고 가정하면, 이는 카메라 A가 얼굴 1을 촬영하고, 대응되는 엣지의 속성 정보는 10시, 중심 대로인 것을 나타낸다. 노드 8과 노드 10이 연결되면, 이는 카메라 A가 얼굴 2를 촬영하고, 대응되는 엣지의 속성 정보는 10시 5분, 중심 대로인 것을 나타낸다. 알 수 있는바, 노드 8에 연결되는 두 개의 시간 속성 정보가 근접하고 공간 속성 정보가 동일하면 당해 두 개의 엣지를 병합한다. 상응하게, 노드 9와 노드 10도 병합하고 병합한 후의 노드는 얼굴 1과 얼굴 2를 동시에 나타낸다.
나아가, 본 실시예에서, 각 서브 그래프는 한 가지 유형과 대응된다. 도 3b는 5장의 서브 그래프를 도시하는바, 각각 사회적 관계 서브 그래프, 계정 관계 서브 그래프, 행동 관계 서브 그래프, 소셜 관계 서브 그래프 및 신원 관계 서브 그래프이다. 각 서브 그래프에서, 노드는 엔티티가 추상화하여 얻은 것이고, 엣지는 엔티티 사이의 관계가 추상화하여 얻은 것이다. 예를 들어, 어느 노드가 사용자의 신원 또는 상기 사용자와 연관되는 인사 지물(人事地物) 등 정보를 나타낸다. 엣지는 상기 사용자와 기타 사용자 사이의 관계를 나타낸다.
여기서, 각 서브 그래프에서의 노드의 정보는 노드의 유일한 표지로서 노드의 이름으로 나타낼 수 있다. 엣지의 속성 정보는 시간 속성 정보, 공간 속성 정보, 예속 속성 정보, 등급 속성 정보 등을 포함하나 이에 한정되지 않는다. 구체적인 예에서, 휴대폰은 어느 한 기지국에 의해 대응되는 정보를 기록하게 되면 "노드 1: 휴대폰1; 노드 2: 기지국; 노드 1과 노드 2 사이의 엣지: 휴대폰이 기지국을 연결, 엣지의 속성 정보: 시간, 빈도수"와 같은 한 그룹의 포인트 엣지 관계로 기록된다. 다른 구체적인 예에서, 어느 한 계정이 다른 계정에 이체하게 되면 "노드 3: 계정 A; 노드 4: 계정 B; 노드 1과 노드 2 사이의 엣지: 이체, 엣지의 속성 정보: 이체 시간, 이체 금액, 이체 방향 등"과 같은 한 그룹의 포인트 엣지 관계로 기록된다.
실제 조작에서는, 도 3c에 도시된 바와 같이 여러 장의 서브 그래프를 시공간 좌표계 내에 투영한다. 물론, 이러한 관계는 시간 속성 정보 또는 공간 속성 정보를 구비하지 않을 수 있는데, 당해 관계 양단의 노드의 시간 속성 정보 또는 공간 속성 정보를 관계의 시간 속성 정보 또는 공간 속성 정보로 이용할 수 있으며, 이는 더 양호한 표징 관계를 위한 것으로, 나아가 근접한 속성의 관계를 병합함으로써 지식 그래프를 구축할 수 있다.
다음, 동일한 시공간 좌표계에 표징된 여러 장의 서브 그래프를 이용하여 동일한 노드를 병합하고, 도 3 d에 도시된 바와 같이 점선으로 일부 동일한 노드를 표기할 수 있다.
이어서, 모든 서브 그래프를 모두 동일한 레이어 평면에 투영한다. 상기 레이어 평면에는 시공간 속성이 피팅되어 있고, 자연적으로 동일한 노드가 연결하는 시간 속성 정보 또는 공간 속성 정보가 근접하는 엣지도 자동으로 병합되는바, 도 3e에 도시된 바와 같이, 이렇게 되면 하나의 상대적으로 완전한 지식 그래프를 구축할 수 있고 초기 지식 그래프라고 할 수 있다. 도 3e에서, IMSI는 국제 모바일 가입자 식별 번호(International Mobile Subscriber Identification Number)라고 하는데, 이는 모바일 사용자를 구별하기 위한 표지이다. IMEI(International Mobile Equipment Identity)는 국제 모바일 기기 식별 번호의 약자이다.
단계 S340: 초기 지식 그래프에서 설정된 속성 정보 요구를 만족하는 복수의 타겟 지도 요소를 결정한다.
단계 S350: 복수의 타겟 지도 요소를 병합하여 지식 그래프를 생성한다.
본원발명의 실시예는 여러 유형의 서브 그래프에서 동일한 노드를 병합함으로써 여러 유형의 서브 그래프의 병합을 실현하여 타입 크로스 정보를 초보적으로 융합하고, 더 나아가 동일한 노드에 연결된, 설정된 관련 조건을 만족하는 엣지를 병합하여 타입 크로스 정보의 충분한 융합을 실현함으로써 심층 정보를 효과적으로 마이닝하고, 정보 분실과 관건적인 증거사슬의 파괴를 방지하여 지식 그래프가 동적 관계 마이닝 등 비즈니스 시나리오에 적용될 때 효과적인 작용을 발휘하도록 할 수 있다.
선택적으로, 단계 S330 다음에, 만약 초기 지식 그래프에 고립된 서브 그래프가 존재하면 각 고립된 서브 그래프 사이에 연관 관계를 가지는 노드를 검색하고, 연관 관계를 가지는 노드 사이를 가상 노드를 통해 연결하는 단계를 더 포함한다. 고립된 서브 그래프 사이의 노드는 직접적인 연결이 존재하지 않는바, 어떠한 노드에 내부 연관 관계가 존재하고, 나아가 이러한 노드를 연결할 것인가를 마이닝 해야 한다. 고립된 서브 그래프를 관통하는 것을 통해 완전히 연통된 지식 그래프를 형성하여 노드 사이에 모두 도달 가능하도록 담보하고 진일보로 정보 융합을 실현한다.
여기서, 각 고립된 서브 그래프 사이에 연관 관계를 가지는 노드를 검색하는 단계는 아래와 같은 두 가지 선택적인 실시형태를 포함한다.
첫 번째 선택적인 실시형태에서, 각 고립된 서브 그래프에서의 각 노드의 타겟 속성 정보를 획득하되, 각 노드의 타겟 속성 정보에 근거하여 상이한 고립된 서브 그래프에서 타겟 속성 정보의 값의 차이가 설정 범위 내에 있는 노드를 연관 관계를 가지는 노드로 한다. 여기서, 타겟 속성 정보는 시간 속성 정보와 공간 속성 정보 중의 적어도 하나를 포함한다. 어떤 노드에 시간 속성 정보 또는 공간 속성 정보가 구비되지 않으면 이를 엣지의 시간 속성 정보 또는 공간 속성 정보에 연결하여 상기 노드의 시간 속성 정보 또는 공간 속성 정보로 사용할 수 있다. 상기 내용과 유사하게, 설정 범위는 실제 상황에 따라 원활하게 설치할 수 있다.
두 번째 선택적인 실시형태에서, 각 고립된 서브 그래프 사이에 공통 정보를 가지는 노드를 획득한다. 여기서, 공통 정보는 동일한 신원 정보를 포함한다. 예를 들면, 얼굴 프로브 서브 그래프는 서로 연결된 카메라 1 노드와 그가 촬영한 얼굴 노드를 포함하고, 차량 번호 프로브 서브 그래프는 서로 연결된 카메라 2 노드와 그가 촬영한 차량 번호 노드를 포함한다. 통신 서브 그래프는 서로 연결된 휴대폰 번호 1 노드와 휴대폰 번호 2 노드를 포함한다. 동일한 레이어 평면에 투영된 후 당해 3개의 서브 그래프는 모두 고립된 서브 그래프이다. 일부 경로를 통해 알 수 있는바, 얼굴, 차량 번호 및 휴대폰 번호 1가 모두 어느 신분증 번호와 연관되면 얼굴 노드, 차량 번호 노드 및 휴대폰 번호 1 노드가 가상 노드를 가리키도록 하고, 이렇게 되면 얼굴, 차량 번호 및 휴대폰 번호 사이의 관계는 통하게 되며 3개의 서브 그래프도 상응하게 연통된다. 선택적으로, 공통 정보는 동일한 예속 정보 또는 동일한 법인 정보를 더 포함할 수 있는데, 예를 들어 모두 어느 기구 또는 단체에 예속되고 모두 동일한 법인을 가지는 것이다. 본 실시예는 공통 정보를 구체적으로 한정하지 않는다.
설명할 필요가 있는 것은, 첫 번째 선택적인 실시형태와 두 번째 선택적인 실시형태는 하나를 선택하여 수행하거나 또는 모두 수행할 수 있다. 모두 수행할 경우, 두 가지 선택적인 실시형태의 수행 순서는 한정되지 않는다. 하나를 선택하여 수행할 경우 두 가지 선택적인 실시형태의 수행 가능성에 따라 적합한 단계를 선택할 수 있다. 예를 들어, 각 고립된 서브 그래프 사이에 공통 정보의 노드를 구비하지 않으면 첫 번째 선택적인 실시형태를 수행하도록 할 수 있다.
더 나아가, 연관 관계를 가지는 노드를 검색한 후, 연관 관계를 가지는 노드 사이를 가상 노드를 통해 연결한다.
도 3f에 도시된 바와 같이, 기지국 프로브 서브 그래프는 서로 연결된 기지국 노드와 그가 탐측한 휴대폰 물리적 주소 노드를 포함한다. 얼굴 프로브 서브 그래프는 서로 연결된 카메라 노드와 그가 촬영한 얼굴 노드를 포함한다. 동일한 레이어 평면에 투영된 후, 고립된 서브 그래프가 존재한다. 검색과 발견을 통해 기지국 노드와 카메라 노드의 시간 속성 정보가 근접하고 공간 속성 정보도 근접하면 기지국 노드와 카메라 노드는 연관 관계를 가지는 노드이다.
도 3f에 도시된 바와 같이, 기지국 노드와 카메라 노드를 연결한 후 대응되는 휴대폰 물리적 주소 노드와 얼굴 노드도 연결되어 휴대폰 물리적 주소와 얼굴 사이의 심층 관계를 마이닝한다.
도 3g에 도시된 바와 같이, 동일한 레이어 평면에 투영한 후, 고립된 서브 그래프 사이는 가상 노드를 통해 연통된다. 가상 노드는 삼각 부호로 표시한다.
본 실시예는 상이한 고립된 서브 그래프에서 시간 속성 정보와 공간 속성 정보 중 적어도 하나가 근접한 노드를 병합함으로써, 시공간이 근접한 노드를 이용하여 상이한 고립된 서브 그래프를 연통시켜 고립된 서브 그래프 사이의 시공간이 근접한 정보를 충분히 마이닝하고 새로운 연관 관계를 구축하며 더 깊은 데이터 마이닝을 실현하며, 상이한 고립된 서브 그래프에서 공통 정보를 가지는 노드를 연결시킴으로써 공통 정보를 이용한 상이한 고립된 서브 그래프를 연통시켜 공통 정보의 충분한 마이닝을 실현한다.
선택적으로, 지식 그래프를 구축하기 위한 여러 유형의 여러 장의 서브 그래프를 획득하는 단계는, 여러 유형의 엔티티 정보와 엔티티 사이의 직접적인 관계를 획득하는 단계; 각 유형의 엔티티 정보를 노드로 추상화하고 엔티티 사이의 직접적인 관계를 엣지로 추상화하여 대응되는 유형의 서브 그래프를 구축하는 단계; 및 대응되는 유형의 서브 그래프에서 연관 관계를 가지는 노드를 병합 또는 연결하여 서브 그래프 내부 노드와 관계의 융합과 관통을 실현하는 단계를 포함한다.
진실한 소셜 시나리오에서, 타겟 사이의 관계 설명 방식은 여러 가지일 수 있는바, 구조적 데이터, 비 구조적 데이터, 반 구조적 데이터를 포함하고, 텍스트, 동영상, 오디오, 이미지 등 여러 가지 멀티 모델 데이터를 더 포함할 수도 있으며, 관계는 단지 사람과 사람 사이에 한정되는 것이 아니라 사람과 물체, 물체와 물체 등 복수의 차원을 더 포함한다. 모든 관계를 추상화하여, 엔티티 정보, 엔티티 정보 사이의 직접적인 관계 및 속성 정보와 같은 3개의 차원을 추상화하는데, 당해 3개의 차원은 각각 노드, 엣지 및 노드와 엣지의 속성 정보에 대응된다. 동시에, 여러 가지 구조화를 위하여 비 구조적과 반 구조적인 멀티 소스 이기종의 다중 모델 데이터에서 대응되는 엔티티 정보, 관계 및 속성 정보를 추출하여 아래와 같은 방법을 제공한다.
도 3h는 본원발명의 실시예에 따라 제공하는 초기 지식 그래프의 구축 구조도이다. 도 3h와 결부하면, 우선, 멀티 소스 이기종이 액세스한 데이터에 대해 소스단 해석을 진행하는데 해석방법은 구조적 해석, 반 구조적 해석, 오디오 해석, 동영상 해석 및 그림 해석을 포함한다. 다음, 해석한 후의 데이터를 이용하여 소스단에 기반하여 모델링함으로써 4WH(Who, When, Where 및 What를 포함)와 How의 방식을 구축한다. 소스단 모델링 방법은, 룰 엔진, 엔티티-속성-행동-관계(Entity-Property-Action-Relation, EPAR) 모델링과 자연 언어 처리(NLP, Natural Language Processing) 플랫폼 모델링을 포함함으로써 대응되는 엔티티 정보와 속성 정보를 추출한다.
그 다음, 해석한 후의 데이터에서 처리, 룰 베이스에서의 룰 모듈, 의존 관계 분석, 관계 중합과 주어-술어-목적어(Subject-Predication-Object, SPO) 트리플 관계 추출 등 기술을 이용하여 대응되는 관계를 추출하고, 관계에 대해 SPO 융합과 중복 제거 등을 진행함으로써 관계를 추출한다. 도 3h에서, 추출된 관계는 고정 관계, 단일 관계와 지속 관계를 포함한다.
이어서, 4WH와 How에 대하여 데이터 클리닝, 이해 및 추출을 진행하고 지식 그래프를 액세스하여 지식 그래프에서의 노드와 노드의 속성 정보로 추상화한다. 추출한 관계는 노드 사이의 엣지와 엣지의 속성 정보로 추상화한다. 다음, 만약 지식 그래프에 고립된 서브 그래프가 존재하면 각 서브 그래프 사이에 연관 관계가 존재하는 노드(즉, 연관 노드)를 검색하고, 연관 노드 사이는 가상 노드를 통해 연결된다. 가상 노드와 구별하기 위하여, 추상화된 노드를 엔티티 노드라고 부른다. 더 나아가, 연관 노드와 엣지의 속성 정보를 결합하여 연관 노드와 연관 노드의 엣지의 속성 정보를 연관시켜 연관 노드의 속성 정보와 엣지의 속성 정보를 가지는 노드로 추상화한다.
설명할 필요가 있는 것은, 지식 그래프에서의 노드와 엣지로 추상화될 경우, 우선 각 유형의 서브 그래프로 추상화된다. 구체적으로 각 유형의 엔티티 정보를 노드로 추상화하고 엔티티 사이의 직접적인 관계를 엣지로 추상화하여 대응되는 유형의 서브 그래프를 구축하며, 대응되는 유형의 서브 그래프에서 연관 관계를 가지는 노드를 병합 또는 연결하여 서브 그래프 내부 노드와 관계의 융합 및 관통을 실현한다.
유의해야 할 것은, 엔티티 사이의 직접적인 관계란 추리와 분석이 없이 데이터 소스에서 직접 얻은 관계를 가리킨다. 예를 들어, 카메라가 차량 번호를 촬영하게 되면 카메라와 차량 번호는 직접적인 관계를 가지게 되고, 또 예를 들어 사용자가 물건을 구매하게 되면 사용자와 물건은 직접적인 관계를 가지게 된다.
하나의 예에서, 모든 휴대폰과 관련된 기록에 근거하여 하나의 서브 그래프를 구축하고, 생물적 특징과 관련된 엔티티에 근거하여 다른 서브 그래프를 구축하며, 차량과 관련된 엔티티에 근거하여 다른 서브 그래프를 구축하고, 계정과 관련된 엔티티에 근거하여 다른 서브 그래프를 구축하며, 신분증과 관련된 엔티티에 근거하여 또 다른 서브 그래프를 구축한다.
설명할 필요가 있는 것은, 여기서 연관 관계가 있는 노드는 직접적인 관계를 가지는 것이 아닌바, 즉 직접적으로 연결되지 않는다. 본 단계에서는 직접적으로 연결되지 않는 노드를 연결하거나 병합한다. 예를 들어, 노드 11과 노드 12가 친척 관계이고 노드 12와 노드 13이 친척 관계이면 노드 11과 노드 13도 친척 관계이고 노드 11과 노드 13은 연결되어 노드가 관통되도록 한다. 또 예를 들어, 어느 사람이 두 개의 휴대폰 번호를 가지고 각 휴대폰 번호의 노드가 모두 자신의 통화 행동을 가지면 두 개의 휴대폰 번호의 노드를 1개로 병합함으로써 노드의 융합을 실현할 수 있고, 상응하게, 두 개의 휴대폰 번호의 통화 행동도 연결, 즉 관계의 연결을 실현한다.
이렇게 진행한 장점은, 동일한 서브 그래프 내의 모든 관계를 충분히 융합하여 후속적인 과정에서, 어느 휴대폰 번호를 분실하거나 또는 노드 11과 노드 12의 관계를 분실하는 것과 같은 정보 분실로 인한 관건적인 증거 사슬이 파괴되어 이상 분석 결과를 획득할 수 없는 상황을 방지한다.
설명해야 할 것은, 만약 노드가 병합한 후의 노드이면 오리지널 노드의 정보와 속성 정보를 보류하고, 만약 엣지가 연관 관계를 가지는 노드가 연결되어 얻은 것이면 연관 관계를 가지는 상기 노드의 속성 정보를 엣지의 속성 정보로 한다.
다음, 노드의 정보에 근거하여 여러 장의 서브 그래프에서의 동일한 노드를 병합하여 중간 지식 그래프를 획득하고, 엣지의 속성 정보에 근거하여 중간 지식 그래프에서 동일한 노드에 연결된, 설정된 관련 조건을 만족하는 엣지를 병합하여 초기 지식 그래프를 얻는다. 마지막으로, 저장 지지 서비스인 그래프 데이터 베이스(Graph-DB) 또는 캐시 서비스를 이용하여 초기 지식 그래프를 저장한다.
본원발명의 실시예에서, 도 4는 본원발명의 실시예에 따라 제공하는 첫 번째 지식 그래프에 기반한 관계 마이닝 방법의 과정 모식도로서, 본 실시예는 상기 각 실시예에서 제공하는 지식 그래프에 대해 동적 관계 마이닝을 진행하는 상황에 적용된다. 상기 방법은 지식 그래프에 기반한 관계 마이닝 장치에 의해 수행될 수 있고, 상기 장치는 소프트웨어 및/또는 하드웨어의 방식으로 실현될 수 있으며 전자 기기에 집적될 수 있는바, 선택적으로, 상기 전자 기기는 단말기 또는 서버일 수 있다. 도 4에 도시된 바와 같이, 본 실시예에서 제공하는 지식 그래프에 기반한 관계 마이닝 방법은 단계 S410 내지 단계 S440을 포함할 수 있다.
단계 S410: 지식 그래프와 마이닝 대기 동적 관계를 획득한다.
본 실시예에서, 지식 그래프는 상기 임의의 한 실시예에서 제공하는 지식 그래프로서, 상기 지식 그래프에서는 설정된 속성 요구를 만족하는 노드와 엣지 중의 적어도 하나에 대해 각각 병합한다. 선택적으로, 상기 지식 그래프는 연통된 그래프로서 고립된 서브 그래프가 존재하지 않는다.
동적 관계는 시간, 공간, 엔티티 등 정보의 상이함에 따라 동적으로 변화하는 관계를 말하는바, 예를 들어 연관 검색, 라인 확장 분석, 포인트 속성 연구 및 판단, 엣지 속성 연구 및 판단, 연관 분석, 연관 추리, 그룹 마이닝, 즉석 분석, 동승 관계, 동행 관계 및 시공간 충돌 관계이다.
단계 S420: 동적 관계에 근거하여 마이닝 대기 노드와 마이닝 대기 속성 정보를 포함하는 마이닝 대기 정보를 결정한다.
선행기술에서는 일반적으로 모니터링 카메라와 WIFI 기기 등을 이용하여 동적 관계를 마이닝한다. 본 실시예는 지식 그래프의 기초상에 동적 관계의 마이닝 문제를 그래프 순회 문제로 전환한다. 이에 기반하여, 우선 동적 관계에서의 엔티티에 근거하여 노드의 정보를 결정하고, 동적 관계에서의 관계에 근거하여 속성 정보를 결정한다. 설명과 구별이 편리하도록 하기 위하여 동적 관계에 근거하여 결정한 노드와 속성 정보를 각각 마이닝 대기 노드와 마이닝 대기 속성 정보라고 한다. 마이닝 대기 속성 정보는 노드의 속성 정보 또는 엣지의 속성 정보로 사용될 수 있다.
예를 들어, 동적 관계가 동승 관계이면 마이닝 대기 노드는 캐릭터 노드와 차량 노드를 포함하고, 마이닝 대기 속성 정보는 시간 속성 정보와 공간 속성 정보를 포함한다고 결정한다.
단계 S430: 마이닝 대기 정보에 근거하여 지식 그래프에서의 시작 노드와 선별 조건을 결정한다.
단계 S440: 시작 노드로부터 지식 그래프를 순회하고 선별 조건에 따라 순회하여 얻은 노드를 선별함으로써 동적 관계를 가지는 노드를 획득한다.
시작 노드는 슈퍼 노드를 분해한 후의 노드, 병합한 후의 노드, 가상 노드 등과 같은 지식 그래프에서의 임의의 한 노드이다. 시작 노드는 마이닝 대기 노드 또는 마이닝 대기 속성 정보를 가지는 노드일 수 있다. 시작 노드로부터 시작하여 지식 그래프를 순회함으로써 순회된 노드를 획득한다. 본 실시예는 순회방법을 한정하지 않는바, 깊이 우선 순회 또는 너비 우선 순회일 수 있고, 본 실시예는 순회 단계를 한정하지 않는바, 1단계, 2단계 또는 3단계 등일 수 있다. 순회된 노드는 마지막 단계에서 순회한 노드일 수도 있고, 원 스텝으로 순회된 노드일 수도 있으며, 시작 노드와 원 스텝으로 순회된 노드일 수도 있다.
설명해야 할 것은, 지식 그래프의 순회는 트리에 대한 순회와 유사한 것으로, 순회란 적어도 그래프에서의 모든 노드의 정보를 액세스, 즉 각 노드를 순차적으로 한차례 액세스하고 또 단지 한차례만 액세스하는 것을 말한다.
선별 조건은 순회된 노드를 선별하는 조건으로서, 선별된 후의 노드가 마이닝 대기 정보와 일치하도록 하는 것, 예를 들어 선별된 후의 노드가 마이닝 대기 노드이고, 선별된 후의 노드가 마이닝 대기 속성 정보를 가지며, 선별된 후의 노드의 순회 경로가 마이닝 대기 속성 정보를 가지는 것이다. 상기 순회 경로는 선별된 후의 노드와 시작 노드 사이에 직접적으로 연결된 엣지 또는 간접적으로 연결된 복수의 엣지를 포함한다.
본 실시예에서, 동적 관계에 근거하여 마이닝 대기 정보를 결정함으로써 이미 노드와 엣지 중의 적어도 하나를 병합한 지식 그래프의 기초상에 동적 관계의 마이닝 문제를 그래프 순회 문제로 전환하고, 마이닝 대기 정보에 근거하여 지식 그래프에서의 시작 노드와 선별 조건을 결정하고 시작 노드로부터 지식 그래프를 순회함으로써 병합한 후의 지식 그래프에서 시작 노드를 정확히 검색하여 순회하고 선별 조건에 따라 순회된 노드를 선별한다. 지식 그래프에 대해 미리 병합하였으므로 노드와 엣지는 더 많은 속성 정보를 표달할 수 있고, 그래프 구조가 충분히 작으므로 시작 노드로부터 순회하여 순회된 노드를 선별함으로써 모든 노드를 처리할 필요가 없이 동적 관계를 가지는 노드를 검색할 수 있어 온라인 지식 그래프의 동적 관계 마이닝에 적용될 수 있고 분석 과정이 간단하며, 계산량이 적고 응답 시간 소모가 적다.
본원발명의 실시예에서, 도 5a는 본원발명의 실시예에 따라 제공하는 두 번째 지식 그래프에 기반한 관계 마이닝 방법의 과정 모식도이고, 본 실시예는 상기 실시예의 기초상에 진일보로 최적화한다.
선택적으로, "마이닝 대기 정보에 근거하여 지식 그래프에서의 시작 노드와 선별 조건을 결정한다"라는 동작을 진행하기 전에, "지식 그래프에서 추상화 가능 노드를 검색하되, 추상화 가능 노드는 제1 유형의 마이닝 대기 속성 정보를 구비하고, 연결된 엣지는 제2 유형의 마이닝 대기 속성 정보를 구비하며, 추상화 가능 노드와 추상화 가능 노드에 연결한 엣지를 마이닝 대기 속성 정보를 구비한 노드로 추상화한다"로 최적화하여 포인트와 변을 융합한다.
도 5a에서 제공하는 지식 그래프에 기반한 관계 마이닝 방법은 단계 S510 내지 단계 S560을 포함한다.
단계 S510: 지식 그래프와 마이닝 대기 동적 관계를 획득한다.
단계 S520: 동적 관계에 근거하여 마이닝 대기 노드와 마이닝 대기 속성 정보를 포함하는 마이닝 대기 정보를 결정한다.
단계 S530: 지식 그래프에서 추상화 가능 노드를 검색하되, 추상화 가능 노드는 제1 유형의 마이닝 대기 속성 정보를 구비하고, 연결된 엣지는 제2 유형의 마이닝 대기 속성 정보를 구비한다.
마이닝 대기 속성 정보는 제1 유형의 마이닝 대기 속성 정보와 제2 유형의 마이닝 대기 속성 정보를 포함한다. 예를 들면, 제1 유형의 마이닝 대기 속성 정보는 시간 속성 정보이고 제2 유형의 마이닝 대기 속성 정보는 공간 속성 정보이다. 설명의 편리를 위하여 제1 유형의 마이닝 대기 속성 정보를 구비하는 동시에 연결된 엣지가 제2 유형의 마이닝 대기 속성 정보를 구비하는 노드를 추상화 가능 노드라고 하고, 여기서 추상화 가능 노드에 연결한 엣지는 하나의 엣지일 수도 있고 두 개의 엣지일 수도 있다.
단계 S540: 추상화 가능 노드와 추상화 가능 노드에 연결한 엣지를 마이닝 대기 속성 정보를 구비한 노드로 추상화한다.
도 5b는 본원발명의 실시예에 따라 제공하는 추상화 가능 노드와 엣지를 추상화한 모식도이다. 도 5b에서 추상화 가능 노드는 가상 노드이고 삼각형으로 표시하며 공간 속성 정보를 가지고, 그와 노드(P1) 및 노드(P2)가 연결된 엣지는 각각 t1과 t2인 시간 속성 정보를 가지면, 도 5b에 도시된 바와 같이 가상 노드와 t1 속성 정보를 가지는 엣지를 노드(TS1)로 추상화하고 가상 노드와 t2 속성 정보를 가지는 엣지를 노드(TS2)로 추상화한다.
선택적으로, 추상화 가능 노드와 연결된 노드를 다시 추상화된 노드에 연결하는바, 예를 들면 도 5b에서는 가상 노드에 연결한 노드(P1)와 노드(P2)를 다시 노드(TS1)와 노드(TS2)에 연결시켜 연결 관계가 변하지 않도록 담보한다.
단계 S550: 마이닝 대기 정보에 근거하여 지식 그래프에서의 시작 노드와 선별 조건을 결정한다.
단계 S560: 시작 노드로부터 지식 그래프를 순회하고 선별 조건에 따라 순회하여 얻은 노드를 선별함으로써 동적 관계를 가지는 노드를 획득한다.
본 실시예에서, 만약 마이닝 대기 속성 정보가 각각 노드 및 노드에 연결된 엣지에 분포되면, 노드와 엣지를 추상화하여 추상화된 노드가 완전한 마이닝 대기 속성 정보를 가지도록 함으로써 동적 관계를 마이닝하는 과정에서 엣지를 유의할 필요가 없이 노드만 유의하면 되므로 동적 관계의 마이닝 효율을 향상시킨다.
본원발명의 실시예에서, 도 6은 본원발명의 실시예에 따라 제공하는 세 번째 지식 그래프에 기반한 관계 마이닝 방법의 과정 모식도이고, 본 실시예는 상기 실시예의 기초상에 진일보로 최적화한다.
선택적으로, "마이닝 대기 정보에 근거하여 지식 그래프에서의 시작 노드와 선별 조건을 결정한다"라는 동작을 "마이닝 대기 속성 정보를 구비하는 노드를 시작 노드로 결정하고 마이닝 대기 노드를 원 스텝 순회 선별 조건으로 결정하며 마이닝 대기 속성 정보를 투 스텝 순회 선별 조건으로 결정하거나, 또는 제1 유형의 마이닝 대기 속성 정보를 구비하는 노드를 시작 노드로 결정하고 제2 유형의 마이닝 대기 속성 정보와 마이닝 대기 노드를 원 스텝 순회 선별 조건으로 결정하며 마이닝 대기 속성 정보를 투 스텝 순회 선별 조건으로 결정하되, 여기서 마이닝 대기 속성 정보는 제1 유형의 마이닝 대기 속성 정보와 제2 유형의 마이닝 대기 속성 정보를 포함한다"로 세부화한다.
도 6에서 제공하는 지식 그래프에 기반한 관계 마이닝 방법은 단계 S610 내지 단계 S650를 포함한다.
단계 S610: 지식 그래프와 마이닝 대기 동적 관계를 획득한다.
단계 S620: 동적 관계에 근거하여 마이닝 대기 노드와 마이닝 대기 속성 정보를 포함하는 마이닝 대기 정보를 결정한다.
단계 S630: 지식 그래프에 마이닝 대기 속성 정보를 구비하는 노드가 존재하는지 여부를 판정하되, 만약 존재하면 단계 S641을 수행하고, 존재하지 않으면 단계 S642를 수행한다.
선택적으로, 마이닝 대기 속성 정보의 유형은 적어도 한 가지이다. 이에 기반하여, 만약 마이닝 대기 속성 정보의 유형이 한 가지이면 지식 그래프에 이러한 마이닝 대기 속성 정보가 존재하는지 여부를 판정한다. 만약 존재하면 단계 S641을 수행하고, 만약 존재하지 않으면 당해 동작을 완료한다.
만약 마이닝 대기 속성 정보의 유형이 두가지 이상이면 지식 그래프에 전체 유형의 마이닝 대기 속성 정보가 존재하는지 여부를 판정하는데, 만약 존재하면 단계 S641을 수행하고, 만약 존재하지 않으면 단계 S642를 수행한다.
단계 S641: 마이닝 대기 속성 정보를 구비하는 노드를 시작 노드로 결정하고 마이닝 대기 노드를 원 스텝 순회 선별 조건으로 결정하며 마이닝 대기 속성 정보를 투 스텝 순회 선별 조건으로 결정한다. 계속하여 단계 S650을 수행한다.
첫 번째 애플리케이션 시나리오에서, 동적 관계는 시공간 충돌 관계이고, 구체적으로 2개 이상의 시공간 포인트를 제공하며, 이러한 시공간 포인트에 동시에 나타나는 캐릭터를 마이닝한다. 마이닝 대기 노드는 캐릭터 신원을 표징하는 얼굴 노드, 휴대폰 노드, 차량 노드 등과 같은 노드를 포함하고, 마이닝 속성 정보는 각 시공간 포인트와 각각 대응되는 시간 속성 정보와 공간 속성 정보를 포함한다.
구체적으로, 하나의 시공간 포인트와 대응되는 시간 속성 정보와 공간 속성 정보의 노드를 시작 노드로 결정하고, 캐릭터 신원 정보를 표징하는 노드를 웬 스텝 순회 선별 조건으로 결정하며, 기타 시공간 포인트와 대응되는 시간 속성 정보와 공간 속성 정보를 투 스텝 순회 선별 조건으로 결정한다.
선택적으로, 시작 노드는 지식 그래프에서의 오리지널 노드일 수도 있고 상기 실시예에서 추상화된 노드일 수도 있다.
단계 S642: 제1 유형의 마이닝 대기 속성 정보를 구비하는 노드를 시작 노드로 결정하고, 제2 유형의 마이닝 대기 속성 정보와 마이닝 대기 노드를 원 스텝 순회 선별 조건으로 결정하며, 마이닝 대기 속성 정보를 투 스텝 순회 선별 조건으로 결정하는데, 여기서 마이닝 대기 속성 정보는 제1 유형의 마이닝 대기 속성 정보와 제2 유형의 마이닝 대기 속성 정보를 포함한다. 계속하여 단계 S650을 수행한다.
두 번째 애플리케이션 시나리오에서, 동적 관계는 시공간 충돌 관계이고 구체적으로 2개 이상의 시공간 포인트를 제공하며 이러한 시공간 포인트에 동시에 나타나는 캐릭터를 마이닝한다. 마이닝 대기 노드는 얼굴 노드, 휴대폰 노드, 차량 노드 등과 같은 캐릭터 신원을 표징하는 노드를 포함하고, 마이닝 대기 속성 정보는 각 시공간 포인트와 각각 대응되는 시간 속성 정보와 공간 속성 정보를 포함한다.
구체적으로, 하나의 시공간 포인트와 대응되는 공간 속성 정보를 구비하는 노드를 시작 노드로 결정하고, 상기 시공간 포인트와 대응되는 시간 속성 정보 및 캐릭터 신원 정보를 표징하는 노드를 원 스텝 순회 선별 조건으로 결정하며, 기타 시공간 포인트와 대응되는 시간 속성 정보와 공간 속성 정보를 투 스텝 순회 선별 조건으로 결정한다.
단계 S650: 시작 노드로부터 지식 그래프를 순회하고 원 스텝 순회 선별 조건과 투 스텝 순회 선별 조건에 따라 순회된 노드를 선별하여 동적 관계를 가지는 노드를 획득한다.
선택적으로, 시작 노드로부터 지식 그래프에 대해 투 스텝 순회를 진행한 후, 원 스텝 순회 선별 조건에 따라 원 스텝 순회된 노드를 선별하여 선별된 노드의 원 스텝 순회 후의 노드를 얻고, 다음 투 스텝 순회 선별 조건에 따라 선별된 노드의 원 스텝 순회된 후의 노드를 다시 선별하여 동적 관계를 가지는 노드를 획득한다.
선택적으로, 순회 노드 수량을 감소시키고 선별 효율을 향상시키기 위하여 각 원 스텝 순회가 완료된 후 순회된 후의 노드를 선별한다. 구체적으로, 시작 노드로부터 시작하여 지식 그래프에 대해 원 스텝 순회를 진행함으로써 원 스텝 순회된 노드를 획득하고, 원 스텝 순회 선별 조건에 따라 원 스텝 순회된 노드를 선별하여 후보 노드를 획득하며, 후보 노드로부터 시작하여 지식 그래프에 대해 원 스텝 순회를 진행함으로써 투 스텝 순회된 노드를 획득하고, 투 스텝 순회 선별 조건으로 투 스텝 순회된 노드를 선별하여 동적 관계를 가지는 노드를 획득한다.
상기 첫 번째 애플리케이션 시나리오에 대하여, 하나의 시공간 포인트와 대응되는 시간 속성 정보와 공간 속성 정보를 가지는 노드로부터 지식 그래프에 대해 원 스텝 순회를 진행함으로써 원 스텝 순회된 노드를 획득하고, 원 스텝 순회된 노드에서 캐릭터 신원 정보를 표징하는 노드를 선별하며, 캐릭터 신원 정보를 표징하는 노드(즉, 후보 노드)로부터 시작하여 지식 그래프에 대해 원 스텝 순회를 진행함으로써 투 스텝 순회된 노드를 획득하고, 투 스텝 순회된 노드에서 기타 시공간 포인트와 대응되는 시간 속성 정보와 공간 속성 정보를 구비한 노드를 선별하여 초기 노드와 최종적으로 선별된 후의 노드가 각각 연결된, 캐릭터 신원 정보를 표징하는 노드를 얻는다. 시공간-사람-시공간의 투 스텝 순회를 거치고 선별을 진행하여 이러한 시공간 포인트에 동시에 나타나는 캐릭터를 얻는다.
상기 두 번째 애플리케이션 시나리오에 대하여, 하나의 시공간 포인트와 대응되는 공간 속성 정보를 구비하는 노드로부터 지식 그래프에 대해 원 스텝 순회를 진행함으로써 원 스텝 순회된 노드를 획득하고, 원 스텝 순회된 노드에서 캐릭터 신원 정보를 표징하는 동시에 순회 경로에 상기 시공간 포인트와 대응되는 시간 속성 정보가 구비되는 노드를 선별하며, 상기 선별된 노드(즉, 후보 노드)로부터 시작하여 지식 그래프에 대해 원 스텝 순회를 진행함으로써 투 스텝 순회된 노드를 획득하고, 투 스텝 순회된 노드에서 기타 시공간 포인트와 대응되는 시간 속성 정보와 공간 속성 정보를 구비한 노드를 선별하거나, 또는 투 스텝 순회된 노드에서 기타 시공간 포인트와 대응되는 공간 속성 정보를 가지는 동시에 후보 노드와의 순회 경로에 기타 시공간 포인트와 대응되는 시간 속성 정보를 구비하는 노드를 선별하며, 초기 노드와 최종적으로 선별된 후의 노드가 각각 연결된, 캐릭터 신원 정보를 표징하는 노드를 얻는다. 이로써 시공간-사람-시공간의 투 스텝 순회를 거치고 선별을 진행하여 이러한 시공간 포인트에 동시에 나타나는 캐릭터를 얻는다.
본 실시예는 시작 노드와 선별 조건의 결정방법을 제공하는데 이는 마이닝 대기 속성 정보와 연관된 마이닝 대기 노드의 마이닝에 적용되며, 마이닝 대기 속성 정보가 시간 속성 정보와 공간 속성 정보를 포함하고 마이닝 대기 노드가 캐릭터 신원을 표징하는 노드일 경우, 시공간 충돌 관계의 마이닝에 적용될 수 있다. 지식 그래프에 대해 미리 병합하였으므로 노드와 엣지는 더 많은 속성 정보를 표달할 수 있고, 그래프 구조가 충분히 작아 투 스텝 순회만 거치면 되므로 계산량을 크게 감소시키고, 마이닝 대기 속성 정보가 변화하더라도 업데이트된 노드를 제때에 피드백 하여 실시간 분석을 지지할 수 있다.
본원발명의 실시예에서, 도 7은 본원발명의 실시예에 따라 제공하는 네 번째 지식 그래프에 기반한 관계 마이닝 방법의 과정 모식도이고, 본 실시예는 상기 실시예의 기초상에 진일보로 최적화한다.
선택적으로, "마이닝 대기 정보에 근거하여 지식 그래프에서의 시작 노드와 선별 조건을 결정한다"라는 동작은 "마이닝 대기 노드를 시작 노드로 결정하고 마이닝 대기 속성 정보를 원 스텝 순회 선별 조건으로 결정하며 마이닝 대기 노드를 투 스텝 순회 선별 조건으로 결정한다"로 세부화한다.
도 7에서 제공하는 지식 그래프에 기반한 관계 마이닝 방법은 단계 S710 내지 단계 S740을 포함한다.
단계 S710: 지식 그래프와 마이닝 대기 동적 관계를 획득한다.
단계 S720: 동적 관계에 근거하여 마이닝 대기 노드와 마이닝 대기 속성 정보를 포함하는 마이닝 대기 정보를 결정한다,
단계 S730: 마이닝 대기 노드를 시작 노드로 결정하고 마이닝 대기 속성 정보를 원 스텝 순회 선별 조건으로 결정하며 마이닝 대기 노드를 투 스텝 순회 선별 조건으로 결정한다.
한 가지 애플리케이션 시나리오에서, 동적 관계는 동행 관계이고 구체적으로 1개의 캐릭터를 제공하며 상기 캐릭터와 동행하는 기타 캐릭터를 마이닝한다. 마이닝 대기 노드는 얼굴 노드, 휴대폰 노드, 차량 노드 등과 같은 캐릭터 신원을 표징하는 노드를 포함하고, 마이닝 대기 속성 정보는 시간 속성 정보와 공간 속성 정보를 포함한다. 유의해야 할 것은, 본 실시예는 단지 시간 속성 정보와 공간 속성 정보의 유형을 한정할 뿐 값을 한정하지 않는다.
구체적으로, 상기 제공된 캐릭터의 신원을 표징하는 노드를 시작 노드로 결정하고, 시간 속성 정보와 공간 속성 정보를 원 스텝 순회 선별 조건으로 결정하며, 캐릭터 신원을 표징하는 노드를 투 스텝 순회 선별 조건으로 결정한다.
단계 S740: 시작 노드로부터 지식 그래프를 순회하고 원 스텝 순회 선별 조건과 투 스텝 순회 선별 조건에 따라 순회된 노드를 선별하여 동적 관계를 가지는 노드를 획득한다.
선택적으로, 시작 노드로부터 지식 그래프에 대해 투 스텝 순회를 진행한 후, 원 스텝 순회 선별 조건에 따라 원 스텝 순회된 노드를 선별하여 선별된 노드의 원 스텝 순회 후의 노드를 얻고, 다음 투 스텝 순회 선별 조건에 따라 선별된 노드의 원 스텝 순회된 후의 노드를 다시 선별하여 동적 관계를 가지는 노드를 획득한다.
선택적으로, 순회 노드 수량을 감소시키고 선별 효율을 향상시키기 위하여 각 원 스텝 순회가 완료된 후 순회된 후의 노드를 선별한다. 구체적으로, 시작 노드로부터 시작하여 지식 그래프에 대해 원 스텝 순회를 진행함으로써 원 스텝 순회된 노드를 획득하고, 원 스텝 순회 선별 조건에 따라 원 스텝 순회된 노드를 선별하여 후보 노드를 획득하며, 후보 노드로부터 시작하여 지식 그래프에 대해 원 스텝 순회를 진행함으로써 투 스텝 순회된 노드를 획득하고, 투 스텝 순회 선별 조건으로 투 스텝 순회된 노드를 선별하여 동적 관계를 가지는 노드를 획득한다.
상기 애플리케이션 시나리오에 대하여, 상기 제공된 캐릭터의 신원을 표징하는 노드로부터 지식 그래프에 대해 원 스텝 순회를 진행함으로써 원 스텝 순회된 노드를 획득하고, 원 스텝 순회된 노드에서 시간 속성과 공간 속성을 구비하는 노드를 선별하며, 상기 선별된 노드(즉, 후보 노드)로부터 시작하여 지식 그래프에 대해 원 스텝 순회를 진행함으로써 투 스텝 순회된 노드를 획득하고, 투 스텝 순회된 노드에서 캐릭터 신원을 표징하는 노드를 선별하여 시간 속성과 공간 속성을 구비하는 노드와 각각 연결된, 캐릭터 신원 정보를 표징하는 노드를 얻는다. 이로써 사람-시공간-사람의 투 스텝 순회를 거치고 선별을 진행하여 제공된 캐릭터와 동행하는 기타 캐릭터를 얻는다.
구체적으로, 투 스텝 순회된 노드를 선별한 후, 연결된 노드의 시간 속성과 공간 속성에 따라 선별된 후의 노드를 중합, 즉 제공된 캐릭터와 공동으로 나타나는 시공간 포인트에 따라 기타 캐릭터를 중합하여, 제공된 캐릭터와 2개 이상의 시공간 포인트에 공동으로 나타나는 기타 캐릭터를 동행으로 결정한다.
선택적으로, 시간 속성과 공간 속성을 가지는 노드는 지식 그래프의 오리지널 노드일 수도 있고 상기 실시예의 추상화된 노드일 수도 있다.
본 실시예는 시작 노드와 선별 조건의 결정방법을 제공하는데 이는 마이닝 대기 속성 정보와 연관된 두 개 이상의 마이닝 대기 노드의 마이닝에 적용되며, 마이닝 대기 속성 정보가 시간 속성 정보와 공간 속성 정보를 포함하고 마이닝 대기 노드가 캐릭터 신원을 표징하는 노드일 경우, 동행 관계의 마이닝에 적용될 수 있다. 지식 그래프에 대해 미리 병합하였으므로 노드와 엣지는 더 많은 속성 정보를 표달할 수 있고, 그래프 구조가 충분히 작아 투 스텝 순회만 거치면 되므로 계산량을 크게 감소시키고, 마이닝 대기 속성 정보가 변화하더라도 업데이트된 노드를 제때에 피드백하여 실시간 분석을 지지할 수 있다.
본원발명의 실시예에서, 도 8은 본원발명의 실시예에서 제공하는 지식 그래프의 생성 장치의 구조도로서, 본원발명의 실시예는 초기 지식 그래프를 다시 처리하는 상황에 적용되며, 상기 장치는 소프트웨어 및/또는 하드웨어를 이용하여 실현하고, 일정한 데이터 연산 능력을 가지는 전자 기기에 구체적으로 배치된다.
도 8에 도시된 바와 같은 지식 그래프의 생성 장치(800)는 획득 모듈(801), 결정 모듈(802) 및 생성 모듈(803)을 포함하는데, 여기서,
획득 모듈(801)은 복수의 연결 관계를 가지는 노드를 포함하는 초기 지식 그래프를 획득하고,
결정 모듈(802)은 초기 지식 그래프에서 설정된 속성 정보 요구를 만족하는 복수의 타겟 지도 요소를 결정하되, 타겟 지도 요소는 타겟 노드와 타겟 엣지 중의 적어도 하나를 포함하며,
생성 모듈(803)은 복수의 타겟 지도 요소를 병합하여 지식 그래프를 생성한다.
본 실시예에서, 초기 지식 그래프에서 설정된 속성 정보 요구를 만족하는 복수의 타겟 노드와 복수의 타겟 엣지 중의 적어도 하나를 병합하여 노드와 엣지가 더 많은 속성 정보를 표달하도록 하여 지식 그래프의 표달 능력을 향상시키고, 그래프 구조를 감소시키며 지식 그래프가 동적 관계 마이닝 등 비즈니스 시나리오에 응용될 때 분석 과정을 간략화하고 계산량을 절감하며 계산 효율을 향상시킬 수 있다.
선택적으로, 결정 모듈(802)은 구체적으로 만약 타겟 지도 요소가 타겟 노드를 포함하면 초기 지식 그래프에서 임의의 두 개의 노드의 속성 정보의 값의 차이가 설정 범위 내에 있는 복수의 타겟 노드를 결정하고, 만약 타겟 지도 요소가 타겟 엣지를 포함하면 초기 지식 그래프에서 두 개의 노드 사이의 속성 정보의 유형이 동일한 복수의 타겟 엣지를 결정한다.
선택적으로, 상기 장치는 분해 모듈을 더 포함하는데, 이는 지식 그래프에서 슈퍼 노드를 결정하되, 슈퍼 노드가 연결하는 엣지의 수량이 설정값을 초과하고, 슈퍼 노드에 연결한 엣지의 속성 정보에 근거하여 슈퍼 노드가 연결하는 엣지를 복수의 엣지 집합으로 구획하며, 엣지 집합의 수량에 근거하여 슈퍼 노드를 상응한 수량의 노드로 분해하고 각 엣지 집합에서의 엣지를 분해한 후의 각 노드에 연결한다.
선택적으로, 획득 모듈(801)은 획득 유닛, 제1 병합 유닛 및 제2 병합 유닛을 포함한다. 획득 유닛은 초기 지식 그래프를 구축하기 위한 여러 유형의 여러 장의 서브 그래프 및 여러 장의 서브 그래프에서의 노드의 정보와 엣지의 속성 정보를 획득하고, 제1 병합 유닛은 노드의 정보에 근거하여 여러 장의 서브 그래프에서의 동일한 노드를 병합함으로써 중간 지식 그래프를 획득하며, 제2 병합 유닛은 엣지의 속성 정보에 근거하여 중간 지식 그래프에서 동일한 노드에 연결된, 설정된 관련 조건을 만족하는 엣지를 병합하여 초기 지식 그래프를 획득한다.
선택적으로, 제2 병합 유닛은 구체적으로 엣지의 타겟 속성 정보에 근거하여 중간 지식 그래프에서 동일한 노드에 연결된, 타겟 속성 정보의 값의 차이가 설정 범위 내에 있는 엣지를 병합하여 초기 지식 그래프를 얻는데, 여기서 타겟 속성 정보는 시간 속성 정보와 공간 속성 정보를 포함한다.
선택적으로, 상기 장치는 연결 모듈을 더 포함하고, 연결 모듈은, 만약 초기 지식 그래프에 고립된 서브 그래프가 존재하면 각 고립된 서브 그래프 사이에 연관 관계를 가지는 노드를 검색하고 연관 관계를 가지는 노드 사이를 가상 노드를 통해 연결한다.
선택적으로, 연결 모듈은, 각 고립된 서브 그래프 사이에 연관 관계를 가지는 노드를 검색할 때, 구체적으로 각 고립된 서브 그래프에서의 각 노드의 타겟 속성 정보를 획득하되, 타겟 속성 정보는 시간 속성 정보와 공간 속성 정보 중의 적어도 하나를 포함하고, 각 노드의 타겟 속성 정보에 근거하여 상이한 고립된 서브 그래프에서 타겟 속성 정보의 값의 차이가 설정 범위 내에 있는 노드를 연관 관계를 가지는 노드로 하거나, 또는 각 고립된 서브 그래프 사이에 공통 정보를 가지는 노드를 획득하며, 여기서 공통 정보는 동일한 신원 정보를 포함한다.
본 실시예는 상기 임의의 한 실시예에서 제공하는 지식 그래프의 생성 방법을 수행할 수 있고, 대응하는 기술적 효과를 구비한다.
본원발명의 실시예에서, 도 9는 본원발명의 실시예에서 제공하는 지식 그래프에 기반한 관계 마이닝 장치의 구조도로서, 본원발명의 실시예는 상기 각 실시예에서 제공하는 지식 그래프가 동적 관계 마이닝을 진행하는 상황에 적용되며, 상기 장치는 소프트웨어 및/또는 하드웨어를 이용하여 실현하고, 일정한 데이터 연산 능력을 가지는 전자 기기에 구체적으로 배치된다.
도 9에 도시된 바와 같은 지식 그래프에 기반한 관계 마이닝 장치(900)는 획득 모듈(901), 제1 결정 모듈(902), 제2 결정 모듈(903) 및 순회와 선별 모듈(904)을 포함하되, 여기서,
획득 모듈(901)은 지식 그래프와 마이닝 대기 동적 관계를 획득하고,
제1 결정 모듈(902)은 동적 관계에 근거하여 마이닝 대기 노드와 마이닝 대기 속성 정보를 포함하는 마이닝 대기 정보를 결정하며,
제2 결정 모듈(903)은 마이닝 대기 정보에 근거하여 지식 그래프에서의 시작 노드와 선별 조건을 결정하고,
순회와 선별 모듈(904)은 시작 노드로부터 지식 그래프를 순회하고 선별 조건에 따라 순회하여 얻은 노드를 선별함으로써 동적 관계를 가지는 노드를 획득한다.
본 실시예에서, 동적 관계에 근거하여 마이닝 대기 정보를 결정함으로써 이미 노드와 엣지 중의 적어도 하나를 병합한 지식 그래프의 기초상에 동적 관계의 마이닝 문제를 그래프 순회 문제로 전환하고, 마이닝 대기 정보에 근거하여 지식 그래프에서의 시작 노드와 선별 조건을 결정하고 시작 노드로부터 지식 그래프를 순회함으로써 병합한 후의 지식 그래프에서 시작 노드를 정확히 검색하여 순회하고 선별 조건에 따라 순회된 노드를 선별한다. 지식 그래프에 대해 미리 병합하였으므로 노드와 엣지는 더 많은 속성 정보를 표달할 수 있고, 그래프 구조가 충분히 작으므로 시작 노드로부터 순회하여 순회된 노드를 선별함으로써 모든 노드를 처리할 필요가 없이 동적 관계를 가지는 노드를 검색할 수 있어 온라인 지식 그래프의 동적 관계 마이닝에 적용될 수 있고 분석 과정이 간단하며, 계산량이 적고 응답 시간 소모가 적다.
선택적으로, 마이닝 대기 속성 정보는 제1 유형의 마이닝 대기 속성 정보와 제2 유형의 마이닝 대기 속성 정보를 포함하고, 상기 장치는 추상화 모듈을 더 포함하는데, 이는 지식 그래프에서 추상화 가능 노드를 검색하기 위한 것으로, 추상화 가능 노드는 제1 유형의 마이닝 대기 속성 정보를 구비하고, 연결된 엣지는 제2 유형의 마이닝 대기 속성 정보를 구비하며, 추상화 가능 노드와 추상화 가능 노드에 연결한 엣지를 마이닝 대기 속성 정보를 구비한 노드로 추상화한다.
선택적으로, 선별 조건은 원 스텝 순회 선별 조건과 투 스텝 순회 선별 조건을 포함하며, 제2 결정 모듈(903)은 구체적으로 마이닝 대기 속성 정보를 구비하는 노드를 시작 노드로 결정하고 마이닝 대기 노드를 원 스텝 순회 선별 조건으로 결정하며 마이닝 대기 속성 정보를 투 스텝 순회 선별 조건으로 결정하거나, 또는 제1 유형의 마이닝 대기 속성 정보를 구비하는 노드를 시작 노드로 결정하고 제2 유형의 마이닝 대기 속성 정보와 마이닝 대기 노드를 원 스텝 순회 선별 조건으로 결정하며 마이닝 대기 속성 정보를 투 스텝 순회 선별 조건으로 결정하고, 여기서 마이닝 대기 속성 정보는 제1 유형의 마이닝 대기 속성 정보와 제2 유형의 마이닝 대기 속성 정보를 포함한다.
선택적으로, 선별 조건은 원 스텝 순회 선별 조건과 투 스텝 순회 선별 조건을 포함하며, 제2 결정 모듈(903)은 구체적으로 마이닝 대기 노드를 시작 노드로 결정하고 마이닝 대기 속성 정보를 원 스텝 순회 선별 조건으로 결정하며 마이닝 대기 노드를 투 스텝 순회 선별 조건으로 결정한다.
선택적으로, 순회와 선별 모듈(904)은 구체적으로 시작 노드로부터 시작하여 지식 그래프에 대해 원 스텝 순회를 진행함으로써 원 스텝 순회된 노드를 획득하고, 원 스텝 순회 선별 조건에 따라 원 스텝 순회된 노드를 선별하여 후보 노드를 획득하며, 후보 노드로부터 시작하여 지식 그래프에 대해 원 스텝 순회를 진행함으로써 투 스텝 순회된 노드를 획득하고, 투 스텝 순회 선별 조건으로 투 스텝 순회된 노드를 선별하여 동적 관계를 가지는 노드를 획득한다.
선택적으로, 마이닝 대기 노드는 캐릭터 신원을 표징하는 노드를 포함하고, 마이닝 대기 속성 정보는 시간 속성 정보와 공간 속성 정보를 포함한다.
본 실시예는 상기 임의의 한 실시예에서 제공하는 지식 그래프에 기반한 관계 마이닝 방법을 수행할 수 있고, 대응하는 기술적 효과를 구비한다.
본원발명의 실시예에 따르면, 본원발명은 전자 기기 및 판독 가능 저장 매체를 더 제공한다.
도 10에 도시된 바와 같이, 이는 본원발명의 실시예에 따른 지식 그래프의 생성 방법 또는 지식 그래프에 기반한 관계 마이닝 방법의 전자 기기의 블록도이다. 전자 기기는 랩톱 컴퓨터, 데스크톱 컴퓨터, 워크 벤치, 개인용 정보 단말기, 서버, 블레이드 서버, 메인 프레임 컴퓨터 및 다른 적합한 컴퓨터 등의 다양한 형태의 디지털 컴퓨터를 가리킨다. 전자 기기는 또한 개인용 정보 단말기, 셀룰러 폰, 스마트 폰, 웨어러블 장치 및 다른 유사한 컴퓨팅 장치와 같은 다양한 형태의 모바일 장치를 나타낼 수 있다. 본 명세서에 도시된 구성 요소, 그들의 연결 및 관계 및 그 기능은 단지 예시에 불과하며, 본 명세서에 기술되거나 청구된 구현을 한정하도록 의도되지 않는다.
도 10에 도시된 바와 같이, 당해 전자 기기는 하나 또는 복수의 프로세서(1001), 메모리(1002) 및 고속 인터페이스 및 저속 인터페이스를 포함하는 다양한 구성 요소를 연결하기 위한 인터페이스를 포함한다. 다양한 구성 요소는 서로 다른 버스를 사용하여 서로 연결되며 마더 보드에 설치되거나 필요에 따라 다른 방식으로 설치될 수 있다. 프로세서는 외부 입력/출력 장치(예를 들어, 인터페이스에 연결된 디스플레이 장치)에 GUI의 그래픽 정보를 표시하기 위해 메모리에 저장된 명령을 포함하여 전자 기기 내에서 실행되는 명령을 처리할 수 있다. 다른 실시 방식에서, 필요한 경우, 복수의 프로세서 및/또는 복수의 버스를 복수의 메모리와 함께 사용할 수 있다. 마찬가지로, 여러 전자 기기를 연결할 수 있고, 각 장치는 단지 몇 가지 필요한 기능(예를 들어, 서버 배열, 블레이드 서버 그룹 또는 다중 프로세서 시스템)을 제공할 수 있다. 도 10은 프로세서(1001)가 하나인 경우를 예를 들어 설명한다.
메모리(1002)는 본원발명에서 제공하는 비일시적 컴퓨터 판독 가능 저장 매체이다. 여기서, 적어도 하나의 프로세서에 의해 본원발명의 지식 그래프의 생성 방법 또는 지식 그래프에 기반한 관계 마이닝 방법을 수행하도록, 상기 메모리에는 적어도 하나의 프로세서에 의해 실행 가능한 명령이 저장된다. 본원발명의 비일시적 컴퓨터 판독 가능 저장 매체에는 컴퓨터가 본원발명의 지식 그래프의 생성 방법 또는 지식 그래프에 기반한 관계 마이닝 방법을 실행하게 하는 컴퓨터 명령어가 저장된다.
메모리(1002)는 비일시적 컴퓨터 판독 가능 저장 매체로서, 비일시적 소프트웨어 프로그램, 비일시적 컴퓨터 실행 가능 프로그램, 본원발명의 실시예의 지식 그래프의 생성 방법 또는 지식 그래프에 기반한 관계 마이닝 방법에 대응하는 프로그램 명령/모듈과 같은 모듈(예를 들면, 도 8에 도시된 획득 모듈(801), 결정 모듈(802) 및 생성 모듈(803); 도 9에 도시된 획득 모듈(901), 제1 결정 모듈(902), 제2 결정 모듈(903) 및 순회와 선별 모듈(904))을 저장하기 위해 사용될 수 있다. 프로세서(1001)는 메모리(1002)에 저장된 비일시적 소프트웨어 프로그램, 명령 및 모듈을 실행하여 서버의 다양한 기능적 애플리케이션 및 데이터 처리를 실행한다. 다시 말하면, 상기 방법 실시예의 모델 파라미터를 업데이트하는 방법을 구현한다.
메모리(1002)는 프로그램을 저장하기 위한 영역 및 데이터를 저장하기 위한 영역을 포함할 수 있고, 여기서 프로그램을 저장하기 위한 영역은 운영 체제 및 적어도 하나의 기능에 필요한 응용 프로그램이 저장될 수 있고, 데이터를 저장하기 위한 영역에는 모델의 파라미터를 업데이트하는 전자 기기를 사용하여 생성된 데이터가 저장될 수 있다. 또한, 메모리(1002)는 고속 랜덤 액세스 메모리를 포함할 수 있고, 또한 자기 디스크 저장 장치, 플래시 메모리 장치 또는 다른 비일시적 솔리드 스테이트 저장 장치와 같은 적어도 하나의 비일시적 메모리를 포함할 수 있다. 일부 실시예에서, 메모리(1002)는 프로세서(1001)에 대해 원격으로 설정된 메모리를 선택적으로 포함할 수 있고, 이러한 원격 메모리는 네트워크를 통해 모델의 파라미터가 업데이트된 전자 기기에 연결될 수 있다. 상기 네트워크의 사례는 인터넷, 인트라넷, 근거리 네트워크, 이동 통신 네트워크 및 이들의 조합을 포함하지만 이에 한정되지는 않는다.
지식 그래프의 생성 방법 또는 지식 그래프에 기반한 관계 마이닝 방법에 따른 전자 기기는 입력장치(1003)와 출력장치(1004)를 더 포함할 수 있다. 프로세서(1001), 메모리(1002), 입력장치(1003)와 출력장치(1004)는 버스 또는 기타 방식을 통해 연결될 수 있고 도 10에서는 버스를 통해 연결되는 것을 예로 한다.
입력 장치(1003)는 입력된 숫자 또는 문자 정보를 수신할 수 있고, 모델의 파라미터를 업데이트하는 전자 기기의 사용자 설정 및 기능 제어와 관련된 키 신호 입력을 생성할 수 있으며, 터치 스크린, 키패드, 마우스, 트랙 패드, 터치 패드, 포인팅 스틱, 하나 이상의 마우스 버튼, 트랙볼, 조이스틱 및 기타 입력 장치일 수 있다. 출력 장치(1004)는 디스플레이 장치, 보조 조명 장치(예를 들어, LED), 촉각 피드백 장치(예를 들어, 진동 모터) 등을 포함할 수 있다. 상기 디스플레이 장치는 액정 디스플레이(LCD), 발광 다이오드(LED) 디스플레이 및 플라즈마 디스플레이를 포함할 수 있지만, 이에 한정되지는 않는다. 일부 실시 방식에서, 디스플레이 장치는 터치 스크린일 수 있다.
본 출원의 실시예에 따르면, 컴퓨터 판독 가능 매체에 저장되어 있는 컴퓨터 프로그램을 더 제공한다. 당해 컴퓨터 프로그램의 명령이 실행될 경우, 본 출원 실시예의 지식 그래프의 생성 방법 또는 지식 그래프에 기반한 관계 마이닝 방법이 실행된다.
본 명세서에 설명된 시스템 및 기술의 다양한 실시 방식은 디지털 전자 회로, 집적 회로 시스템, 전용 ASIC(애플리케이션 특정 집적 회로), 컴퓨터 하드웨어, 펌웨어, 소프트웨어 및/또는 이들의 조합에 의해 구현될 수 있다. 이러한 다양한 실시 방식은 하나 이상의 컴퓨터 프로그램에 의해 실시될 수 있고, 상기 하나 이상의 컴퓨터 프로그램은 적어도 하나의 프로그램 가능 시스템에 의해 실행 및/또는 해석될 수 있으며, 상기 프로그램 가능 프로세서는 전용 또는 범용 프로그램 가능 프로세서일 수 있고, 저장 시스템, 적어도 하나의 입력 장치 및 적어도 하나의 출력 장치로부터 데이터 및 명령을 수신하며, 데이터 및 명령을 저장 시스템, 적어도 하나의 입력 장치 및 적어도 하나의 출력 장치에 전송할 수 있다.
이러한 컴퓨터 프로그램(프로그램, 소프트웨어, 소프트웨어 응용 프로그램 또는 코드라고도 함)에는 프로그램 가능 프로세서의 기계 명령어가 포함되고, 고급 프로세스 및/또는 객체 지향 프로그래밍 언어 및/또는 어셈블리 언어/기계어를 사용하여 이러한 컴퓨터 프로그램을 구현할 수 있다. 본 명세서에서 사용되는 "기계 판독 가능 매체" 및 "컴퓨터 판독 가능 매체"라는 용어는 프로그램 가능 프로세서에 기계 명령 및/또는 데이터를 제공하기 위해 사용되는 임의의 컴퓨터 프로그램 제품, 장비 및/또는 장치(예를 들어, 자기 디스크, 광 디스크, 메모리, 프로그램 가능 논리 장치(PLD))를 가리키며, 기계 판독 가능 신호로서 기계 명령을 수신하는 기계 판독 가능 매체를 포함한다. "기계 판독 가능 신호"라는 용어는 기계 명령 및/또는 데이터를 프로그램 가능 프로세서에 제공하기 위한 임의의 신호를 지칭한다.
사용자와의 상호 작용을 제공하기 위해, 컴퓨터에서 여기에 설명된 시스템 및 기술을 구현할 수 있다. 컴퓨터는 사용자에게 정보를 표시하기 위한 디스플레이 장치(예를 들어, CRT(음극선관) 또는 LCD(액정 디스플레이) 모니터)와 키보드 및 포인팅 장치(예를 들어, 마우스 또는 트랙볼)를 포함하고, 사용자는 상기 키보드 및 상기 포인팅 장치를 통해 정보를 입력하여 컴퓨터에 제공할 수 있다. 다른 종류의 장치를 사용하여 사용자와의 상호 작용을 제공할 수도 있다. 예를 들어, 사용자에게 제공되는 피드백은 임의의 형태의 감각 피드백(예를 들어, 시각적 피드백, 청각 피드백 또는 촉각 피드백)일 수 있고, 임의의 형태(음성 입력, 스피치 입력 또는 촉각 입력 포함)로 사용자에 의해 발송된 정보를 수신할 수 있다.
본 명세서에 설명된 시스템 및 기술은 백엔드 구성 요소(예를 들어, 데이터 서버)를 포함하는 컴퓨팅 시스템 또는 미들웨어 구성 요소(예를 들어, 애플리케이션 서버)를 포함하는 컴퓨팅 시스템 또는 프론트 엔드 구성 요소(예를 들어, 예를 들어, 그래픽 사용자 인터페이스 또는 웹 브라우저를 가진 사용자 컴퓨터일 수 있으며, 사용자는 그래픽 사용자 인터페이스 또는 웹 브라우저를 통해 여기에 설명된 시스템 및 기술의 구현과 상호 작용할 수 있음)를 포함하는 컴퓨팅 시스템 또는 이러한 백엔드 구성 요소, 미들웨어 구성 요소 또는 프론트 엔드 구성 요소의 임의의 조합을 포함하는 컴퓨팅 시스템에 의해 구현될 수 있다. 시스템의 구성 요소는 임의의 형태 또는 매체의 디지털 데이터 통신(예를 들어, 통신 네트워크)에 의해 상호 연결될 수 있다. 통신 네트워크의 예로는 근거리 통신망 (LAN), 광역 통신망 (WAN), 블록체인 네트워크 및 인터넷이 포함될 수 있다.
컴퓨터 시스템은 클라이언트 및 서버를 포함할 수 있다. 클라이언트와 서버는 일반적으로 서로 멀리 떨어져 있으며, 일반적으로 통신 네트워크를 통해 상호 작용한다. 클라이언트와 서버 간의 관계는 해당 컴퓨터에서 실행되고 서로 클라이언트-서버 관계가 있는 컴퓨터 프로그램에 의해 발생된다.
상기에 도시된 다양한 형태의 과정을 통해 단계를 재정렬, 추가 또는 삭제할 수 있다는 것을 이해해야 한다. 예를 들어, 본원발명에 설명된 각 단계들은 병렬, 순차적 또는 상이한 순서로 수행될 수 있으며, 본원발명에 개시된 기술적 해결책이 원하는 결과를 달성할 수만 있으면, 별도로 한정되지 않는다.
상기 구체적인 실시 방식은 본원발명의 보호 범위에 대한 제한을 구성하지 않는다. 당업자는 설계 요건 및 다른 요인에 따라 다양한 변형, 조합, 하위 조합 및 대체가 이루어질 수 있다는 것을 이해해야 한다. 본원발명의 원리와 원칙 내에서 이루어진 모든 수정, 동등한 대체 및 개선은 모두 본원발명의 보호 범위에 포함된다.
Claims (18)
- 복수의 연결 관계를 가지는 노드를 포함하는 초기 지식 그래프를 획득하는 단계;
상기 초기 지식 그래프에서 설정된 속성 정보 요구를 만족하는 복수의 타겟 지도 요소를 결정하는 단계 - 상기 타겟 지도 요소는 타겟 노드와 타겟 엣지 중의 적어도 하나를 포함함 - ; 및
상기 복수의 타겟 지도 요소를 병합하여 지식 그래프를 생성하는 단계
를 포함하는 것을 특징으로 하는 지식 그래프의 생성 방법. - 제1항에 있어서,
상기 초기 지식 그래프에서 설정된 속성 정보 요구를 만족하는 복수의 타겟 지도 요소를 결정하는 단계는,
만약 상기 타겟 지도 요소가 타겟 노드를 포함하면, 상기 초기 지식 그래프에서 임의의 두 개의 노드의 속성 정보의 값의 차이가 설정 범위 내에 있는 복수의 타겟 노드를 결정하는 단계; 및
만약 상기 타겟 지도 요소가 타겟 엣지를 포함하면, 상기 초기 지식 그래프에서 두 개의 노드 사이의 속성 정보의 유형이 동일한 복수의 타겟 엣지를 결정하는 단계
를 포함하는 것을 특징으로 하는 지식 그래프의 생성 방법. - 제1항에 있어서,
상기 복수의 타겟 지도 요소를 병합하여 지식 그래프를 생성하는 단계 후에,
상기 지식 그래프에서 슈퍼 노드를 결정하는 단계 - 상기 슈퍼 노드가 연결하는 엣지의 수량이 설정값을 초과함 - ;
상기 슈퍼 노드에 연결한 엣지의 속성 정보에 근거하여 상기 슈퍼 노드가 연결하는 엣지를 복수의 엣지 집합으로 구획하는 단계; 및
상기 엣지 집합의 수량에 근거하여 상기 슈퍼 노드를 상응한 수량의 노드로 분해하고 각 엣지 집합에서의 엣지를 분해한 후의 각 노드에 연결하는 단계
를 더 포함하는 것을 특징으로 하는 지식 그래프의 생성 방법. - 제1항에 있어서,
초기 지식 그래프를 획득하는 단계는,
초기 지식 그래프를 구축하기 위한 여러 유형의 여러 장의 서브 그래프 및 여러 장의 서브 그래프에서의 노드의 정보와 엣지의 속성 정보를 획득하는 단계;
상기 노드의 정보에 근거하여 여러 장의 서브 그래프에서의 동일한 노드를 병합하여 중간 지식 그래프를 획득하는 단계; 및
상기 엣지의 속성 정보에 근거하여 상기 중간 지식 그래프에서 동일한 노드에 연결된, 설정된 관련 조건을 만족하는 엣지를 병합하여 상기 초기 지식 그래프를 획득하는 단계
를 포함하는 것을 특징으로 하는 지식 그래프의 생성 방법. - 제4항에 있어서,
상기 엣지의 속성 정보에 근거하여 상기 중간 지식 그래프에서 동일한 노드에 연결된, 설정된 관련 조건을 만족하는 엣지를 병합하여 상기 초기 지식 그래프를 획득하는 단계는,
상기 엣지의 타겟 속성 정보에 근거하여 상기 중간 지식 그래프에서 동일한 노드에 연결된, 상기 타겟 속성 정보의 값의 차이가 설정 범위 내에 있는 엣지를 병합하여 상기 초기 지식 그래프를 획득하는 단계
를 포함하고,
상기 타겟 속성 정보는 시간 속성 정보와 공간 속성 정보 중의 적어도 하나를 포함하는 것을 특징으로 하는 지식 그래프의 생성 방법. - 제4항에 있어서,
상기 엣지의 속성 정보에 근거하여 상기 중간 지식 그래프에서 동일한 노드에 연결된, 설정된 관련 조건을 만족하는 엣지를 병합하여 상기 초기 지식 그래프를 획득하는 단계 후에,
만약 상기 초기 지식 그래프에 고립된 서브 그래프가 존재하면 각 상기 고립된 서브 그래프 사이에 연관 관계를 가지는 노드를 검색하고, 연관 관계를 가지는 노드 사이를 가상 노드를 통해 연결하는 단계
를 더 포함하는 것을 특징으로 하는 지식 그래프의 생성 방법. - 제6항에 있어서,
각 상기 고립된 서브 그래프 사이에 연관 관계를 가지는 노드를 검색하는 단계는,
각 상기 고립된 서브 그래프에서의 각 노드의 타겟 속성 정보를 획득하는 단계 - 상기 타겟 속성 정보는 시간 속성 정보와 공간 속성 정보 중의 적어도 하나를 포함함 - ; 및
상기 각 노드의 타겟 속성 정보에 근거하여, 상이한 고립된 서브 그래프에서 상기 타겟 속성 정보의 값의 차이가 설정 범위 내에 있는 노드를 연관 관계를 가지는 노드로 하는 단계
를 포함하거나, 또는
각 상기 고립된 서브 그래프 사이에 연관 관계를 가지는 노드를 검색하는 단계는,
각 상기 고립된 서브 그래프 사이에 공통 정보를 가지는 노드를 획득하는 단계
를 포함하며,
상기 공통 정보는 동일한 신원 정보를 포함하는 것을 특징으로 하는 지식 그래프의 생성 방법. - 지식 그래프에 기반한 관계 마이닝 방법에 있어서,
상기 지식 그래프는 제1항의 방법에 근거하여 생성되고, 지식 그래프에 기반한 관계 마이닝 방법은,
상기 지식 그래프와 마이닝 대기 동적 관계를 획득하는 단계;
상기 동적 관계에 근거하여 마이닝 대기 노드와 마이닝 대기 속성 정보를 포함하는 마이닝 대기 정보를 결정하는 단계;
상기 마이닝 대기 정보에 근거하여 상기 지식 그래프에서의 시작 노드와 선별 조건을 결정하는 단계; 및
상기 시작 노드로부터 상기 지식 그래프를 순회하고, 상기 선별 조건에 따라 순회하여 얻은 노드를 선별함으로써 상기 동적 관계를 가지는 노드를 획득하는 단계
를 포함하는 것을 특징으로 하는 지식 그래프에 기반한 관계 마이닝 방법. - 제8항에 있어서,
상기 마이닝 대기 속성 정보는 제1 유형의 마이닝 대기 속성 정보와 제2 유형의 마이닝 대기 속성 정보를 포함하고;
상기 마이닝 대기 정보에 근거하여 상기 지식 그래프에서의 시작 노드와 선별 조건을 결정하는 단계 전에,
상기 지식 그래프에서 추상화 가능 노드를 검색하는 단계 - 상기 추상화 가능 노드는 제1 유형의 마이닝 대기 속성 정보를 구비하고, 연결된 엣지는 상기 제2 유형의 마이닝 대기 속성 정보를 구비함 - ; 및
상기 추상화 가능 노드와 상기 추상화 가능 노드에 연결한 엣지를 상기 마이닝 대기 속성 정보를 구비한 노드로 추상화하는 단계
를 더 포함하는 것을 특징으로 하는 지식 그래프에 기반한 관계 마이닝 방법. - 제8항에 있어서,
상기 선별 조건은 원 스텝 순회 선별 조건과 투 스텝 순회 선별 조건을 포함하고,
상기 마이닝 대기 정보에 근거하여 상기 지식 그래프에서의 시작 노드와 선별 조건을 결정하는 단계는,
마이닝 대기 속성 정보를 구비하는 노드를 시작 노드로 결정하고 상기 마이닝 대기 노드를 상기 원 스텝 순회 선별 조건으로 결정하며 상기 마이닝 대기 속성 정보를 상기 투 스텝 순회 선별 조건으로 결정하는 단계; 또는
제1 유형의 마이닝 대기 속성 정보를 구비하는 노드를 시작 노드로 결정하고 제2 유형의 마이닝 대기 속성 정보와 상기 마이닝 대기 노드를 상기 원 스텝 순회 선별 조건으로 결정하며 상기 마이닝 대기 속성 정보를 상기 투 스텝 순회 선별 조건으로 결정하는 단계
를 포함하며,
상기 마이닝 대기 속성 정보는 상기 제1 유형의 마이닝 대기 속성 정보와 상기 제2 유형의 마이닝 대기 속성 정보를 포함하는 것을 특징으로 하는 지식 그래프에 기반한 관계 마이닝 방법. - 제8항에 있어서,
상기 선별 조건은 원 스텝 순회 선별 조건과 투 스텝 순회 선별 조건을 포함하고,
상기 마이닝 대기 정보에 근거하여 상기 지식 그래프에서의 시작 노드와 선별 조건을 결정하는 단계는,
상기 마이닝 대기 노드를 시작 노드로 결정하고, 상기 마이닝 대기 속성 정보를 상기 원 스텝 순회 선별 조건으로 결정하며, 상기 마이닝 대기 노드를 상기 투 스텝 순회 선별 조건으로 결정하는 단계
를 포함하는 것을 특징으로 하는 지식 그래프에 기반한 관계 마이닝 방법. - 제10항에 있어서,
상기 시작 노드로부터 상기 지식 그래프를 순회하고, 상기 선별 조건에 따라 순회하여 얻은 노드를 선별함으로써 상기 동적 관계를 가지는 노드를 획득하는 단계는,
상기 시작 노드로부터 시작하여 상기 지식 그래프에 대해 원 스텝 순회를 진행함으로써 원 스텝 순회된 노드를 획득하는 단계;
상기 원 스텝 순회 선별 조건에 따라 상기 원 스텝 순회된 노드를 선별하여 후보 노드를 획득하는 단계;
상기 후보 노드로부터 시작하여 상기 지식 그래프에 대해 원 스텝 순회를 진행함으로써 투 스텝 순회된 노드를 획득하는 단계; 및
상기 투 스텝 순회 선별 조건으로 상기 투 스텝 순회된 노드를 선별하여 상기 동적 관계를 가지는 노드를 획득하는 단계
를 포함하는 것을 특징으로 하는 지식 그래프에 기반한 관계 마이닝 방법. - 제8항에 있어서,
상기 마이닝 대기 노드는 캐릭터 신원을 표징하는 노드를 포함하고,
상기 마이닝 대기 속성 정보는 시간 속성 정보와 공간 속성 정보를 포함하는 것을 특징으로 하는 지식 그래프에 기반한 관계 마이닝 방법. - 복수의 연결 관계를 가지는 노드를 포함하는 초기 지식 그래프를 획득하기 위한 획득 모듈;
상기 초기 지식 그래프에서 설정된 속성 정보 요구를 만족하는 복수의 타겟 지도 요소를 결정하는 결정 모듈 - 상기 타겟 지도 요소는 타겟 노드와 타겟 엣지 중의 적어도 하나를 포함함 - ; 및
상기 복수의 타겟 지도 요소를 병합하여 지식 그래프를 생성하기 위한 생성 모듈
을 포함하는 것을 특징으로 하는 지식 그래프의 생성 장치. - 지식 그래프에 기반한 관계 마이닝 장치에 있어서
상기 지식 그래프와 마이닝 대기 동적 관계를 획득하기 위한 획득 모듈;
상기 동적 관계에 근거하여 마이닝 대기 노드와 마이닝 대기 속성 정보를 포함하는 마이닝 대기 정보를 결정하기 위한 제1 결정 모듈;
상기 마이닝 대기 정보에 근거하여 상기 지식 그래프에서의 시작 노드와 선별 조건을 결정하기 위한 제2 결정 모듈; 및
상기 시작 노드로부터 상기 지식 그래프를 순회하고, 상기 선별 조건에 따라 순회하여 얻은 노드를 선별함으로써 상기 동적 관계를 가지는 노드를 획득하기 위한 순회와 선별 모듈
을 포함하는 것을 특징으로 하는 지식 그래프에 기반한 관계 마이닝 장치. - 전자 기기에 있어서,
적어도 하나의 프로세서; 및
상기 적어도 하나의 프로세서와 통신 연결하는 메모리
를 포함하고,
상기 메모리에는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령이 저장되어 있고, 상기 명령이 상기 적어도 하나의 프로세서에 의해 실행될 경우, 상기 적어도 하나의 프로세서가 제1항 내지 제7항 중 어느 한 항에 따른 지식 그래프의 생성 방법 또는 제8항 내지 제13항 중 어느 한 항에 따른 지식 그래프에 기반한 관계 마이닝 방법을 수행하는 것을 특징으로 하는 전자 기기. - 컴퓨터 프로그램이 저장된 비일시적 컴퓨터 판독 가능 저장 매체에 있어서,
상기 컴퓨터 프로그램의 명령이 실행될 경우, 제1항 내지 제7항 중 어느 한 항에 따른 지식 그래프의 생성 방법 또는 제8항 내지 제13항 중 어는 한 항에 따른 지식 그래프에 기반한 관계 마이닝 방법이 수행되는 것을 특징으로 하는 컴퓨터 프로그램이 저장된 비일시적 컴퓨터 판독 가능 저장 매체. - 컴퓨터 판독 가능 매체에 저장되어 있는 컴퓨터 프로그램에 있어서,
상기 컴퓨터 프로그램의 명령이 실행될 경우, 제1항 내지 제7항 중 어느 한 항에 따른 지식 그래프의 생성 방법 또는 제8항 내지 제13항 중 어는 한 항에 따른 지식 그래프에 기반한 관계 마이닝 방법이 수행되는 것을 특징으로 하는 컴퓨터 판독 가능 매체에 저장되어 있는 컴퓨터 프로그램.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010238498.0 | 2020-03-30 | ||
CN202010238498.0A CN111324643B (zh) | 2020-03-30 | 2020-03-30 | 知识图谱的生成方法、关系挖掘方法、装置、设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210040003A true KR20210040003A (ko) | 2021-04-12 |
Family
ID=71171643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210037307A KR20210040003A (ko) | 2020-03-30 | 2021-03-23 | 지식 그래프의 생성 방법, 관계 마이닝 방법, 장치, 기기 및 매체 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210319329A1 (ko) |
EP (1) | EP3859564A3 (ko) |
JP (1) | JP7098775B2 (ko) |
KR (1) | KR20210040003A (ko) |
CN (1) | CN111324643B (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113704326A (zh) * | 2021-08-30 | 2021-11-26 | 中国银联股份有限公司 | 基于知识图谱的异常结构挖掘方法、装置及可读存储介质 |
CN117332091A (zh) * | 2023-08-29 | 2024-01-02 | 泰瑞数创科技(北京)股份有限公司 | 一种基于语义关系的地理实体时空知识图谱构建方法 |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11556636B2 (en) * | 2020-06-30 | 2023-01-17 | Microsoft Technology Licensing, Llc | Malicious enterprise behavior detection tool |
CN111767432B (zh) * | 2020-06-30 | 2024-04-02 | 北京百度网讯科技有限公司 | 共现对象的查找方法和装置 |
CN111881301B (zh) * | 2020-07-15 | 2024-06-04 | 北京百度网讯科技有限公司 | 一种数据处理方法、装置、电子设备和存储介质 |
CN111782822A (zh) * | 2020-07-21 | 2020-10-16 | 致诚阿福技术发展(北京)有限公司 | 一种关系图谱生成方法及装置 |
CN112215441B (zh) * | 2020-11-17 | 2024-09-13 | 北京明略软件系统有限公司 | 预测模型训练方法及系统 |
CN114564618A (zh) * | 2020-11-27 | 2022-05-31 | 亚信科技(中国)有限公司 | 面向海量图数据的超级节点查找方法、装置、介质及设备 |
CN112612846B (zh) * | 2020-12-23 | 2022-07-26 | 厦门市美亚柏科信息股份有限公司 | 一种关联关系可视化的方法和终端 |
CN112445919A (zh) * | 2021-02-01 | 2021-03-05 | 深圳追一科技有限公司 | 知识图谱构建方法和装置、服务器、计算机可读存储介质 |
CN112925921B (zh) * | 2021-04-21 | 2022-02-22 | 海南大学 | 基于dikw图谱的资源识别方法、相关装置及可读介质 |
CN113535810B (zh) * | 2021-06-25 | 2024-02-27 | 杨粤湘 | 一种交通违法对象的挖掘方法、装置、设备及介质 |
EP4375356A1 (en) | 2021-07-20 | 2024-05-29 | Toyo Seikan Group Holdings, Ltd. | Means for controlling intracellular reaction utilizing needle-shaped body |
CN114092868B (zh) * | 2021-09-24 | 2023-07-21 | 山东高速建设管理集团有限公司 | 一种人车溯源监控管理系统及方法 |
CN113918374B (zh) * | 2021-12-08 | 2022-03-08 | 云智慧(北京)科技有限公司 | 一种运维系统的根因分析方法、装置及设备 |
CN114240179A (zh) * | 2021-12-20 | 2022-03-25 | 国网汇通金财(北京)信息科技有限公司 | 一种基于事件图谱的财务流程挖掘方法和相关装置 |
CN114020934A (zh) * | 2022-01-05 | 2022-02-08 | 深圳市其域创新科技有限公司 | 基于知识图谱的空间语义信息的整合方法及系统 |
CN114282011B (zh) * | 2022-03-01 | 2022-08-23 | 支付宝(杭州)信息技术有限公司 | 知识图谱的构建方法和装置、图计算方法及装置 |
CN114416913B (zh) * | 2022-03-28 | 2022-07-05 | 支付宝(杭州)信息技术有限公司 | 一种对知识图谱进行数据分片的方法及装置 |
CN114723574A (zh) * | 2022-04-06 | 2022-07-08 | 平安科技(深圳)有限公司 | 基于人工智能的保险反欺诈识别方法、装置、设备及介质 |
CN114490833B (zh) * | 2022-04-06 | 2022-10-11 | 支付宝(杭州)信息技术有限公司 | 一种图计算结果可视化方法和系统 |
CN114579826B (zh) * | 2022-04-27 | 2022-08-12 | 支付宝(杭州)信息技术有限公司 | 基于知识图谱的任务处理方法及装置 |
CN114564525B (zh) * | 2022-04-28 | 2022-07-29 | 支付宝(杭州)信息技术有限公司 | 基于用户交易数据挖掘用户意图的方法和装置 |
CN114998074B (zh) * | 2022-05-18 | 2024-07-05 | 成都秦川物联网科技股份有限公司 | 一种基于物联网的智慧城市灾后联络方法和系统 |
CN115017328A (zh) * | 2022-05-26 | 2022-09-06 | 厦门市美亚柏科信息股份有限公司 | 一种连续事件关联关系分析方法、终端设备及存储介质 |
CN115983385B (zh) * | 2023-03-21 | 2023-08-11 | 航天宏图信息技术股份有限公司 | 空间环境实体构建方法及装置 |
CN116523039B (zh) * | 2023-04-26 | 2024-02-09 | 华院计算技术(上海)股份有限公司 | 连铸知识图谱的生成方法及装置、存储介质、终端 |
CN116186359B (zh) * | 2023-05-04 | 2023-09-01 | 安徽宝信信息科技有限公司 | 一种高校多源异构数据的集成管理方法、系统及存储介质 |
CN116340559B (zh) * | 2023-05-17 | 2023-10-20 | 阿里巴巴达摩院(杭州)科技有限公司 | 图数据处理方法 |
CN117319286A (zh) * | 2023-09-21 | 2023-12-29 | 鸿图百奥科技(广州)有限公司 | 一种通信数据的传输方法及系统 |
CN117235285B (zh) * | 2023-11-09 | 2024-02-02 | 支付宝(杭州)信息技术有限公司 | 融合知识图谱数据的方法及装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08249338A (ja) * | 1995-03-08 | 1996-09-27 | Nippon Telegr & Teleph Corp <Ntt> | データベース概念スキーマ統合支援装置 |
JP2003162533A (ja) | 2001-11-22 | 2003-06-06 | Nec Corp | スキーマ統合変換システム、スキーマ統合変換方法およびスキーマ統合変換用プログラム |
JP4935405B2 (ja) | 2007-02-16 | 2012-05-23 | 日本電気株式会社 | 因果関係分析装置、因果関係分析方法及びプログラム |
US20150370787A1 (en) * | 2014-06-18 | 2015-12-24 | Microsoft Corporation | Session Context Modeling For Conversational Understanding Systems |
US10313365B2 (en) * | 2016-08-15 | 2019-06-04 | International Business Machines Corporation | Cognitive offense analysis using enriched graphs |
US10878309B2 (en) * | 2017-01-03 | 2020-12-29 | International Business Machines Corporation | Determining context-aware distances using deep neural networks |
US11544295B2 (en) * | 2018-08-23 | 2023-01-03 | National Institute For Materials Science | Search system and search method for finding new relationships between material property parameters |
US20200074322A1 (en) | 2018-09-04 | 2020-03-05 | Rovi Guides, Inc. | Methods and systems for using machine-learning extracts and semantic graphs to create structured data to drive search, recommendation, and discovery |
CN109710776B (zh) * | 2018-12-29 | 2022-10-28 | 中国科学技术大学 | 相册的知识图谱的构建方法 |
CN110457403B (zh) * | 2019-08-12 | 2022-04-22 | 南京星火技术有限公司 | 图网络决策系统、方法及知识图谱的构建方法 |
CN110472068B (zh) * | 2019-08-20 | 2020-04-24 | 星环信息科技(上海)有限公司 | 基于异构分布式知识图谱的大数据处理方法、设备及介质 |
CN110727804A (zh) * | 2019-10-11 | 2020-01-24 | 北京明略软件系统有限公司 | 利用知识图谱处理维修案例的方法、装置及电子设备 |
CN110866190B (zh) * | 2019-11-18 | 2021-05-14 | 支付宝(杭州)信息技术有限公司 | 训练用于表征知识图谱的图神经网络模型的方法及装置 |
CN110929047B (zh) * | 2019-12-11 | 2023-04-28 | 中国人民解放军国防科技大学 | 关注邻居实体的知识图谱推理方法和装置 |
-
2020
- 2020-03-30 CN CN202010238498.0A patent/CN111324643B/zh active Active
-
2021
- 2021-03-22 US US17/208,921 patent/US20210319329A1/en active Pending
- 2021-03-23 JP JP2021049223A patent/JP7098775B2/ja active Active
- 2021-03-23 EP EP21164298.8A patent/EP3859564A3/en not_active Withdrawn
- 2021-03-23 KR KR1020210037307A patent/KR20210040003A/ko not_active Application Discontinuation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113704326A (zh) * | 2021-08-30 | 2021-11-26 | 中国银联股份有限公司 | 基于知识图谱的异常结构挖掘方法、装置及可读存储介质 |
CN117332091A (zh) * | 2023-08-29 | 2024-01-02 | 泰瑞数创科技(北京)股份有限公司 | 一种基于语义关系的地理实体时空知识图谱构建方法 |
CN117332091B (zh) * | 2023-08-29 | 2024-03-29 | 泰瑞数创科技(北京)股份有限公司 | 一种基于语义关系的地理实体时空知识图谱构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111324643B (zh) | 2023-08-29 |
CN111324643A (zh) | 2020-06-23 |
EP3859564A2 (en) | 2021-08-04 |
US20210319329A1 (en) | 2021-10-14 |
JP2021119463A (ja) | 2021-08-12 |
EP3859564A3 (en) | 2021-09-15 |
JP7098775B2 (ja) | 2022-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20210040003A (ko) | 지식 그래프의 생성 방법, 관계 마이닝 방법, 장치, 기기 및 매체 | |
CN110941664B (zh) | 知识图谱的构建方法、检测方法、装置、设备及存储介质 | |
US20190251143A1 (en) | Web page rendering method and related device | |
US9984408B1 (en) | Method, medium, and system for live video cooperative shopping | |
US20210201168A1 (en) | Method and Apparatus for Outputting Information, Device and Storage Medium | |
CN107133309B (zh) | 流程实例的存储、查询方法及装置、存储介质及电子设备 | |
CN112019820B (zh) | 界面生成方法和装置 | |
CN112015468B (zh) | 一种接口文档处理方法、装置、电子设备以及存储介质 | |
KR102553763B1 (ko) | 비디오 이벤트 인식 방법, 장치, 전자 기기 및 기록 매체 | |
US20210240983A1 (en) | Method and apparatus for building extraction, and storage medium | |
EP4102772A1 (en) | Method and apparatus of processing security information, device and storage medium | |
CN116611411A (zh) | 一种业务系统报表生成方法、装置、设备及存储介质 | |
CN114254014A (zh) | 一种业务数据的展示方法、装置、设备及存储介质 | |
CN112069137A (zh) | 生成信息的方法、装置、电子设备及计算机可读存储介质 | |
US11838294B2 (en) | Method for identifying user, storage medium, and electronic device | |
WO2019100234A1 (zh) | 实现信息互动的方法和装置 | |
CN113656731B (zh) | 广告页面的处理方法、装置、电子设备和存储介质 | |
CN113691403B (zh) | 拓扑节点配置方法、相关装置及计算机程序产品 | |
CN112035581B (zh) | 基于模型的任务处理方法、装置、设备和介质 | |
CN114756301A (zh) | 日志处理方法、装置和系统 | |
KR20210044747A (ko) | 태그 마이닝 방법, 장치, 전자 기기, 저장 매체 및 프로그램 | |
CN113821750B (zh) | 一种页面数据处理方法、系统、电子设备及可读存储介质 | |
CN115545822A (zh) | 产品属性推荐方法和装置、计算机存储介质、电子设备 | |
CN114461502A (zh) | 模型的监控方法和装置 | |
CN117785165A (zh) | 基于大模型的图表生成方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |