KR102528748B1 - 지식 그래프를 구축하는 방법, 장치, 기기 및 저장 매체 - Google Patents

지식 그래프를 구축하는 방법, 장치, 기기 및 저장 매체 Download PDF

Info

Publication number
KR102528748B1
KR102528748B1 KR1020200173813A KR20200173813A KR102528748B1 KR 102528748 B1 KR102528748 B1 KR 102528748B1 KR 1020200173813 A KR1020200173813 A KR 1020200173813A KR 20200173813 A KR20200173813 A KR 20200173813A KR 102528748 B1 KR102528748 B1 KR 102528748B1
Authority
KR
South Korea
Prior art keywords
scenario
tag
determining
knowledge graph
processor
Prior art date
Application number
KR1020200173813A
Other languages
English (en)
Other versions
KR20210132578A (ko
Inventor
치엔 리
야빙 쉬
예 쟝
춘광 차이
용 주
Original Assignee
베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. filed Critical 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Publication of KR20210132578A publication Critical patent/KR20210132578A/ko
Application granted granted Critical
Publication of KR102528748B1 publication Critical patent/KR102528748B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 출원은 데이터 처리 분야에 관한 것으로, 특히 인공 지능 기술에 관한 것이며, 지식 그래프를 구축하는 방법, 장치, 기기 및 저장 매체를 개시한다. 구체적인 구현 방안으로는, 시나리오 및 상기 시나리오의 시나리오 요소를 결정하고, 객체와 상기 시나리오 요소의 연관 관계 및 상기 객체와 속성 태그의 연관 관계에 따라 상기 속성 태그 중에서 대상 태그를 결정하고, 시나리오 노드와 대상 태그 노드 간의 엣지를 구축하여 시나리오 정보를 포함하는 지식 그래프를 획득하는 것이다. 본 출원의 실시예는 지식 그래프를 구축하는 방법, 장치, 기기 및 저장 매체를 제공하는 바, 지식 그래프 속의 지식을 풍부하게 하여 지식 그래프가 지능형 검색, 지능형 응답, 개인화 추천 등의 지능형 정보 서비스에서 더 큰 응용가치를 창출하도록 할 수 있다.

Description

지식 그래프를 구축하는 방법, 장치, 기기 및 저장 매체{METHOD, APPARATUS, DEVICE AND STORAGE MEDIUM FOR CONSTRUCTING KNOWLEDGE GRAPH}
본 출원의 실시예는 데이터 처리 분야에 관한 것으로, 특히 인공지능 기술에 관한 것이다. 구체적으로, 본 출원의 실시예는 지식 그래프를 구축하는 방법, 장치, 기기 및 저장 매체를 제공한다.
지식 그래프 기술은 인공지능 기술의 중요한 구성 요소로서, 객관세계 속의 개념, 객체 및 이들 간의 관계를 구조화하여 기술하는 것이다. 지식 그래프 기술은 대량의 인터넷 정보를 체계적으로 관리 및 이해하는 능력을 제공하며, 인간의 지각적 세계에 더 가까운 형태로 인터넷의 정보를 표현한다.
지식 그래프에서 지식의 수량과 종류는 지식 그래프를 평가하는 중요한 지표이고, 지식 용량이 풍부한 지식 그래프는 지능형 검색, 지능형 응답, 개인화 추천 등의 지능형 정보 서비스에서 응용 가치를 창출할 수 있다. 지식 그래프가 지능형 정보 서비스에서 더 큰 응용가치를 창출할 수 있도록 지식 그래프 속의 지식을 풍부히 하는 것은 현재 지식 그래프 기술이 직면하고 있는 과제이다.
본 출원의 실시예는 지식 그래프를 구축하는 방법, 장치, 기기 및 저장 매체를 제공한다.
일 측면에서, 본 출원의 실시예는 지식 그래프를 구축하는 방법을 제공하며, 당해 방법은,
시나리오 및 상기 시나리오의 시나리오 요소를 결정하는 단계;
객체와 상기 시나리오 요소의 연관 관계 및 상기 객체와 속성 태그의 연관 관계에 따라 상기 속성 태그 중에서 대상 태그를 결정하는 단계; 및
시나리오 노드와 대상 태그 노드 간의 엣지를 구축하여 시나리오 정보를 포함하는 지식 그래프를 획득하는 단계를 포함한다.
다른 일 측면에서, 본 출원의 실시예는 지식 그래프 구축 장치를 더 제공하며, 당해 장치는,
시나리오 및 상기 시나리오의 시나리오 요소를 결정하는 시나리오 결정 모듈;
객체와 상기 시나리오 요소의 연관 관계 및 상기 객체와 속성 태그의 연관 관계에 따라 상기 속성 태그 중에서 대상 태그를 결정하는 대상 태그 결정 모듈; 및
시나리오 노드와 대상 태그 노드 간의 엣지를 구축하여 시나리오 정보를 포함하는 지식 그래프를 획득하는 그래프 구축 모듈을 포함한다.
또 다른 일 측면에서, 본 출원의 실시예는 전자 기기를 더 제공하며, 이는
적어도 하나의 프로세서; 및
상기 적어도 하나의 프로세서에 통신적으로 연결되는 메모리를 포함하고, 여기서,
상기 메모리에는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령어가 저장되어 있고, 상기 명령어는 상기 적어도 하나의 프로세서에 의해 실행되어 상기 적어도 하나의 프로세서가 본 출원의 실시예 중 어느 하나에 따른 방법을 수행할 수 있도록 한다.
또 다른 일 측면에서, 본 출원의 실시예는 컴퓨터 명령어가 저장되어 있는 비일시적 컴퓨터 판독 가능한 저장 매체를 더 제공하며, 상기 컴퓨터 명령어는 상기 컴퓨터가 본 출원의 실시예 중 어느 하나에 따른 방법을 수행하도록 한다.
본 출원의 실시예의 기술방안에 의하면, 지식 그래프 속의 지식을 풍부하게 하여 지식 그래프가 지능형 검색, 지능형 응답, 개인화 추천 등의 지능형 정보 서비스에서 더 큰 응용가치를 창출하도록 할 수 있다.
상기 설명한 내용은 본 개시의 실시예의 핵심 또는 중요한 특징들을 나타내고자 하는 것이 아니며 본 개시의 범위를 제한하고자 하는 것도 아님을 이해하여야 한다. 본 개시의 다른 특징들은 아래의 명세서를 통해 이해하기 용이해질 것이다.
첨부도면은 본 방안을 더 잘 이해하기 위한 것으로, 본 출원을 제한하지 않는다.
도 1은 본 출원의 실시예에 의해 제공되는 일 지식 그래프를 구축하는 방법의 흐름도이다.
도 2는 본 출원의 실시예에 의해 제공되는 일 지식 그래프의 개략적인 구조도이다.
도 3은 본 출원의 실시예에 의해 제공되는 다른 일 지식 그래프를 구축하는 방법의 흐름도이다.
도 4는 본 출원의 실시예에 의해 제공되는 또 다른 일 지식 그래프를 구축하는 방법의 흐름도이다.
도 5는 본 출원의 실시예에 의해 제공되는 지식 그래프 구축 장치의 개략적인 구조도이다.
도 6은 본 출원의 실시예의 지식 그래프를 구축하는 방법을 구현하는 전자 기기의 블록도이다.
아래, 첨부한 도면을 참고하여 본 출원의 예시적인 실시예에 대해 설명하며, 상기 도면에는 본 출원의 실시예에 대한 이해를 위해 다양한 세부사항들이 포함되어 있으나, 이는 단지 예시적인 것으로만 이해하여야 한다. 따라서, 당업자라면 본 출원의 범위와 사상에 위배되지 않는 한, 여기서 설명하는 실시예에 대해 다양한 변경 및 수정이 가능하다는 것을 이해할 것이다. 또한, 명확하고 간단명료한 설명을 위해, 이하 설명에서는 공지된 기능과 구조에 대한 설명을 생략하기로 한다.
도 1은 본 출원의 실시예에 의해 제공되는 지식 그래프를 구축하는 방법의 흐름도이다. 본 실시예는 지능형 정보 서비스에서의 지식 그래프의 응용가치를 향상시키고자, 지식 그래프의 시나리오 정보를 풍부히 하는 경우에 적용가능하다. 도 1을 참조하면, 본 출원의 실시예에 의해 제공되는 지식 그래프를 구축하는 방법은 아래와 같은 단계들을 포함한다.
단계 S110, 시나리오 및 상기 시나리오의 시나리오 요소를 결정한다.
여기서, 시나리오는 일반적으로 상황을 가리키는 것으로, 예를 들면 차량 대기 시나리오, 데이트 시나리오, 큰 눈이 하늘을 뒤덮은 시나리오 등일 수 있다.
시나리오 요소는 시나리오를 구성하는 요소를 가리킨다. 구체적으로 시나리오 요소는 당해 시나리오 속의 사람들, 발생지점 및 발생시간 등일 수 있다. 시나리오에 연관되는 시나리오 요소의 수량은 하나, 둘 또는 복수일 수 있다.
예시적으로, 시나리오가 비교적 복잡한 경우, 당해 시나리오를 완전히 구성하기 위해서는, 복수의 시나리오 요소를 사용할 수 있고; 시나리오가 비교적 간단한 경우, 보다 적은 수량의 시나리오 요소에 의해 시나리오의 구축을 구현할 수 있다.
후속적인 연산을 고려하여 시나리오 요소의 데이터 량을 통일화하고자, 시나리오를 구축하는 요소를 규칙적으로 학습하고, 학습 규칙에 따라 시나리오 요소의 템플릿을 결정할 수 있다. 예시적으로, 시나리오 요소의 템플릿은 사람들, 시간, 지점, 수요 및 감정일 수 있다.
선택적으로, 상기 시나리오를 결정하는 단계는,
상기 시나리오 요소에 따라 상기 시나리오를 결정하는 단계; 또는
수요 정보에 따라 상기 시나리오를 결정하는 단계를 포함한다.
구체적으로, 상기 시나리오 요소에 따라 상기 시나리오를 결정하는 단계는
시나리오 요소와 시나리오의 매핑 관계에 기반하여 시나리오 요소에 따라 시나리오를 결정하는 단계; 또는
시나리오 요소에 대해 의미분석하고 분석결과에 따라 정리 및 요약하여 시나리오 요소에 연관되는 시나리오를 획득하는 단계를 포함한다.
구체적으로, 상기 시나리오의 시나리오 요소를 결정하는 단계는,
객체에 연관되는 타깃 데이터 소스를 결정하는 단계;
상기 타깃 데이터 소스의 데이터로부터 상기 시나리오 요소를 추출하는 단계를 포함한다.
예시적으로, 객체가 관심 지점(Point of Interest, POI)인 경우, 타깃 데이터 소스는 리뷰(댓글) 데이터일 수 있다.
객체가 인물인 경우, 목표 데이터는 인물 전기일 수 있다.
타깃 데이터 소스가 객체에 연관되므로 타깃 데이터 소스에 기반할 경우 시나리오 요소의 정확률 및 추출 효율을 향상시킬 수 있다.
선택적으로, 단어의 발생 빈도수에 따라 상기 타깃 데이터 소스의 데이터로부터 상기 시나리오 요소를 추출할 수도 있고, 단어와 시나리오가 공존하는 빈도수에 따라 상기 타깃 데이터 소스의 데이터로부터 상기 시나리오 요소를 추출할 수도 있다.
단계 S120, 객체와 상기 시나리오 요소의 연관 관계 및 상기 객체와 속성 태그의 연관 관계에 따라 상기 속성 태그 중에서 대상 태그를 결정한다.
여기서, 속성 태그는 객체의 속성을 설명하는 태그이다. 구체적으로, 속성 태그는 분류 태그일 수도 있고 다른 설명적 태그일 수도 있다. 본 실시예는 이에 대해 제한하지 않는다.
대상 태그는 시나리오에 연관되는 태그를 가리킨다.
구체적으로, 객체와 시나리오 요소의 연관 관계 및 상기 객체와 속성 태그의 연관 관계에 따라 상기 속성 태그 중에서 대상 태그를 결정하는 단계는,
상기 객체와 상기 시나리오 요소의 연관 관계 및 상기 객체와 상기 속성 태그의 연관 관계에 따라 상기 시나리오 요소와 상기 속성 태그 간의 연관 정보를 결정하는 단계; 및
상기 시나리오 요소와 상기 속성 태그 간의 연관 정보에 따라 상기 속성 태그 중에서 상기 대상 태그를 결정하는 단계를 포함한다.
여기서, 연관 정보는 시나리오 요소와 속성 태그 간의 상호 연관성 정보를 가리킨다. 구체적으로, 연관 정보는 시나리오 요소와 속성 태그 간에 연관 관계가 존재하는지 여부일수 있다.
구체적으로, 상기 시나리오 요소와 상기 속성 태그 간의 연관 정보에 따라 상기 속성 태그 중에서 상기 대상 태그를 결정하는 단계는,
상기 시나리오 요소와 상기 속성 태그 간의 연관 정보가 연관 관계가 존재하는 것인 경우, 당해 속성 태그를 대상 태그로 결정하는 단계를 포함한다.
단계 S130, 시나리오 노드와 대상 태그 노드 간의 엣지를 구축하여 시나리오 정보를 포함하는 지식 그래프를 획득한다.
여기서, 시나리오 노드는 시나리오가 지식 그래프에서 표시되는 노드를 가리킨다.
대상 태그 노드는 대상 태그가 지식 그래프에서 표시되는 노드를 가리킨다.
예시적으로, 객체가 POI인 경우를 예로 들면, 구축된 지식 그래프의 효과는 도 2를 참조할 수 있다.
본 출원의 실시예의 상술한 기술 방안은 시나리오 요소를 매체로 하여 태그와 시나리오 간의 숨겨진(hidden) 관계를 마이닝하고 당해 숨겨진 관계에 기반하여 지식 그래프를 구축함으로써 지식 그래프 속의 지식을 풍부하게 하여 지식 그래프가 지능형 검색, 지능형 응답, 개인화 추천 등의 지능형 정보 서비스에서 더 큰 응용가치를 창출할 수 있도록 한다.
도 3은 본 출원의 실시예에 의해 제공되는 다른 일 지식 그래프를 구축하는 방법의 흐름도이다. 도 3을 참조하여, 본 출원의 상술한 실시예에서 설명한 바와 같이, 대상 태그의 정확률을 향상시키기 위해, 상술한 단계 S120에 대해 설명하고자 한다.
구체적으로, 상술한 단계 S120는 하기의 단계들을 포함한다.
단계 S121, 상기 객체와 상기 시나리오 요소의 연관 관계 및 상기 객체와 상기 속성 태그의 연관 관계에 따라 상기 시나리오 요소와 상기 속성 태그 간의 연관 횟수를 결정한다.
단계 S122, 상기 시나리오 요소와 상기 속성 태그 간의 연관 횟수에 따라 상기 속성 태그 중에서 상기 대상 태그를 결정한다.
구체적으로, 연관 횟수가 많을수록 속성 태그를 대상 태그로 결정하는 확률이 더 크다.
구체적으로, 상기 시나리오 요소와 상기 속성 태그 간의 연관 횟수에 따라 상기 속성 태그 중에서 상기 대상 태그를 결정하는 단계는,
상기 연관 횟수에 따라 상기 속성 태그를 정렬(rank)하는 단계; 및
정렬 결과에 따라 상기 속성 태그 중에서 상기 대상 태그를 결정하는 단계를 포함한다.
예시적으로, 정렬 결과가 앞 설정 수량의 순번에 위치하는 속성 태그를 대상 태그로 결정할 수 있다.
상술한 단계에 대한 확장에 기초하여, 본 출원의 실시예는 시나리오와 속성 태그 간의 상관 관계를 양자화할 수 있다. 양자화 결과는 상관 관계에 대한 정확한 측정을 구현할 수 있으므로, 양자화된 시나리오와 속성 태그 간의 상관 관계에 의해 대상 태그의 정확률을 향상시킬 수 있다.
대상 태그의 정확률과 연산 효율을 향상시키기 위해, 상기 시나리오 요소와 상기 속성 태그 간의 연관 횟수에 따라 상기 속성 태그 중에서 상기 대상 태그를 결정하는 단계는,
상기 시나리오 요소와 상기 속성 태그 간의 연관 횟수가 설정 횟수 역치보다 큰 경우, 당해 속성 태그를 후보 태그로 하는 단계;
상기 시나리오 요소와 상기 후보 태그 간의 연관 횟수에 따라 상기 후보 태그와 상기 시나리오의 연관 정도를 결정하는 단계; 및
상기 연관 정도에 따라 상기 후보 태그 중에서 상기 대상 태그를 결정하는 단계를 포함한다.
여기서, 설정 횟수 역치는 시나리오와 속성 태그 간에 연관성이 존재할 경우의 시나리오 요소와 속성 태그 간의 연관 횟수의 최소치를 가리킨다.
후보 태그는 시나리오와 연관성을 가질 수 있는 속성 태그를 가리킨다.
당해 기술적 특징에 기초하면, 본 출원의 실시예는 설정 횟수 역치를 이용하여 속성 태그 중에서 시나리오에 연관될 수 없는 태그를 필터링해냄으로써 후속 연산 속도를 향상시키고, 나아가 대상 태그의 연산 효율을 향상시킨다.
또한, 설정 횟수 역치와 연관 정도의 이중 필터링을 이용함으로써 대상 태그의 정확률을 나아가 더 향상시킬 수 있다.
구체적으로, 상기 시나리오 요소와 상기 후보 태그 간의 연관 횟수에 따라 상기 후보 태그와 상기 시나리오의 연관 정도를 결정하는 단계는,
상기 시나리오 요소와 상기 후보 태그 간의 연관 횟수를 정렬(rank)하는 단계; 및
정렬 결과에 따라 상기 후보 태그와 상기 시나리오의 연관 정도를 결정하는 단계를 포함한다.
선택적으로, 상기 시나리오 요소와 상기 후보 태그 간의 연관 횟수에 따라 상기 후보 태그와 상기 시나리오의 연관 정도를 결정하는 단계는,
상기 시나리오 요소와 상기 후보 태그 간의 연관 횟수의 최대치를 결정하는 단계;
상기 시나리오 요소와 상기 후보 태그 간의 연관 횟수와 상기 최대치의 비례값을 산출하는 단계; 및
산출한 비례값에 따라 상기 후보 태그와 상기 시나리오의 연관 정도를 결정하는 단계를 포함한다.
예시적으로, 시나리오 요소가 A, B, C 및 D를 포함하고 시나리오가 X(여기서 X는 A와 B로 구축됨)이며, 속성 태그가 a, b, c 및 d를 포함한다고 가정한다. 이 때, 대상 태그를 결정하는 단계는 하기와 같이 설명될 수 있다.
상관항 마이닝: 연관 횟수에 따라 속성 태그 중에서 후보 태그 a와 b를 결정하여 2개의 상관쌍인 X-a 및 X-b를 구성한다.
연관 정도: X와 후보 태그의 연관 횟수의 최고치가 10이고 X-a의 연관 횟수가 10이며 X-b의 연관 횟수가 7이라고 가정할 경우, X-a의 연관 정도는 100%로, X-b의 연관 정도는 70%로 결정한다. 결정된 연관 정도에 따라 후보 태그 중에서 대상 태그를 결정하여 대상 태그의 정확률을 향상시킨다.
도 4는 본 출원의 실시예에 의해 제공되는 또 다른 일 지식 그래프를 구축하는 방법의 흐름도이다. 도 4를 참조하면, 본 출원의 상술한 실시예와 같이, 객체와 시나리오 요소의 연관 관계 및 객체와 후보 태그의 연관 관계의 마이닝 비용을 저감시키고 연관 관계의 마이닝 속도를 향상시키기 위해, 본 출원의 상술한 실시예는 하기와 같이 설명될 수도 있다.
단계 S210, 시나리오 및 상기 시나리오의 시나리오 요소를 결정한다.
단계 S220, 기존 지식 그래프 속의 객체 노드와 시나리오 요소 노드 간의 엣지에 따라 객체와 상기 시나리오 요소의 연관 관계를 결정한다.
단계 S230, 기존 지식 그래프 속의 상기 객체 노드와 속성 태그 노드의 엣지에 따라 상기 객체와 속성 태그의 연관 관계를 결정한다.
단계 S240, 상기 객체와 상기 시나리오 요소의 연관 관계 및 상기 객체와 상기 속성 태그의 연관 관계에 따라 상기 속성 태그 중에서 대상 태그를 결정한다.
단계 S250, 시나리오 노드와 대상 태그 노드 간의 엣지를 구축하여 시나리오 정보를 포함하는 지식 그래프를 획득한다.
본 출원의 실시예는 상술한 단계들의 수행 순서에 대해 제한하지 않는다. 선택적으로, 단계 S230이 단계 S220 전에 수행되거나 또는 단계 S230과 단계 S220이 단계 S210 전에 수행될 수 있다.
본 출원의 실시예는 기존 지식 그래프에서 객체와 시나리오 요소의 연관 관계 및 객체와 속성 태그의 연관 관계를 마이닝함으로써 신속하게 연관 관계를 획득하고 지식 그래프를 구축하는 효율을 향상시킨다.
도 5는 본 출원의 실시예에 의해 제공되는 지식 그래프 구축 장치의 개략적인 구조도이다. 도 5를 참조하면, 본 출원의 실시예에 의해 제공되는 지식 그래프 구축 장치(500)는 시나리오 결정 모듈(501), 대상 태그 결정 모듈(502) 및 그래프 구축 모듈(503)을 포함한다.
여기서, 시나리오 결정 모듈(501)은 시나리오 및 상기 시나리오의 시나리오 요소를 결정하고;
대상 태그 결정 모듈(502)은 객체와 상기 시나리오 요소의 연관 관계 및 상기 객체와 속성 태그의 연관 관계에 따라 상기 속성 태그 중에서 대상 태그를 결정하고;
그래프 구축 모듈(503)은 시나리오 노드와 대상 태그 노드 간의 엣지를 구축하여 시나리오 정보를 포함하는 지식 그래프를 획득한다.
본 출원의 실시예의 상술한 기술 방안은 시나리오 요소를 매체로 하여 태그와 시나리오 간의 숨겨진(hidden) 관계를 마이닝하고 당해 숨겨진 관계에 기반하여 지식 그래프를 구축함으로써 지식 그래프 속의 지식을 풍부하여 지식 그래프가 지능형 검색, 지능형 응답, 개인화 추천 등의 지능형 정보 서비스에서 더 큰 응용가치를 창출할 수 있도록 한다.
나아가, 상기 대상 태그 결정 모듈은,
상기 객체와 상기 시나리오 요소의 연관 관계 및 상기 객체와 상기 속성 태그의 연관 관계에 따라 상기 시나리오 요소와 상기 속성 태그 간의 연관 정보를 결정하는 정보 결정 유닛; 및
상기 시나리오 요소와 상기 속성 태그 간의 연관 정보에 따라 상기 속성 태그 중에서 상기 대상 태그를 결정하는 대상 태그 결정 유닛을 포함한다.
나아가, 상기 대상 태그 결정 유닛은,
상기 시나리오 요소와 상기 속성 태그 간의 연관 횟수에 따라 상기 속성 태그 중에서 상기 대상 태그를 결정하는 태그 결정 서브 유닛을 포함한다.
나아가, 상기 태그 결정 서브 유닛은,
상기 시나리오 요소와 상기 속성 태그 간의 연관 횟수가 설정 횟수 역치보다 큰 경우, 당해 속성 태그를 후보 태그로 하는 후보 태그 결정 부재;
상기 시나리오 요소와 상기 후보 태그 간의 연관 횟수에 따라 상기 후보 태그와 상기 시나리오의 연관 정도를 결정하는 연관 정도 결정 부재; 및
상기 연관 정도에 따라 상기 후보 태그 중에서 상기 대상 태그를 결정하는 대상 태그 결정 부재를 포함한다.
나아가, 상기 연관 정도 결정 부재는 구체적으로
상기 시나리오 요소와 상기 후보 태그 간의 연관 횟수의 최대치를 결정하고;
상기 시나리오 요소와 상기 후보 태그 간의 연관 횟수와 상기 최대치의 비례값을 산출하고;
산출한 비례값에 따라 상기 후보 태그와 상기 시나리오의 연관 정도를 결정한다.
나아가, 상기 장치는,
상기 객체와 시나리오 요소의 연관 관계 및 상기 객체와 후보 태그의 연관 관계에 따라 상기 후보 태그와 상기 시나리오의 연관 정도를 결정하기 전에, 기존 지식 그래프 속의 객체 노드와 시나리오 요소 노드 간의 엣지에 따라 상기 객체와 상기 시나리오 요소의 연관 관계를 결정하는 시나리오 관계 결정 모듈; 및
기존 지식 그래프 속의 상기 객체 노드와 속성 태그 노드의 엣지에 따라 상기 객체와 상기 속성 태그의 연관 관계를 결정하는 태그 관계 결정 모듈을 더 포함한다.
나아가, 상기 시나리오 결정 모듈은
상기 시나리오 요소에 따라 상기 시나리오를 결정하거나 또는,
수요 정보에 따라 상기 시나리오를 결정하는 시나리오 결정 유닛을 포함한다.
나아가, 상기 시나리오 결정 모듈은
상기 객체에 연관되는 타깃 데이터 소스를 결정하는 데이터 소스 결정 유닛; 및
상기 타깃 데이터 소스의 데이터로부터 상기 시나리오 요소를 추출하는 요소 추출 유닛을 포함한다.
나아가, 상기 시나리오 요소는 상기 시나리오를 구성하는 요소 중의 적어도 하나이고;
상기 시나리오의 요소는 상기 시나리오 속의 사람들, 상기 시나리오의 발생지점 및 상기 시나리오의 발생시간을 포함하나 이에 제한되지 않는다.
본 출원의 실시예에 따르면, 본 출원은 전자 기기 및 판독 가능한 저장 매체를 더 제공한다.
도 6에 도시한 바와 같이, 본 출원의 실시예의 지식 그래프를 구축하는 방법을 수행하는 전자 기기의 블록도이다. 전자 기기는 다양한 형태의 디지털 컴퓨터, 예컨대, 랩톱 컴퓨터, 데스크톱 컴퓨터, 스테이션, 개인 휴대 정보 단말기(PDA), 서버, 블레이드 서버, 대형 컴퓨터 및 기타의 적합한 컴퓨터를 나타내고자 하는 것이다. 전자 기기는 또한 다양한 형태의 이동 장치, 예컨대, 개인 휴대 정보 단말기, 셀룰러 폰, 스마트폰, 웨어러블 기기 및 기타의 유사한 컴퓨팅 장치를 나타낼 수 있다. 본 명세서에서 제시하는 부품, 이들의 연결 관계 및 이들의 기능은 단지 예시일 뿐, 본 명세서에서 설명 및/또는 요구하는 본 출원의 구현을 제한하고자 하는 것이 아니다.
도 6에 도시한 바와 같이, 당해 전자 기기는 하나 또는 복수의 프로세서(601), 메모리(602) 및 각 부품을 연결하는 인터페이스(고속 인터페이스 및 저속 인터페이스를 포함함)를 포함한다. 각 부품은 서로 다른 버스를 이용하여 서로 연결되고 공통 메인보드에 설치되거나 또는 필요에 따라 기타의 방식으로 설치될 수 있다. 프로세서는 전자 기기 내에서 실행되는 명령어를 처리할 수 있는 바, 메모리 내에 또는 메모리 상에 저장되어 외부 입력/출력 장치(예컨대, 인터페이스에 결합되는 디스플레이 기기)에 GUI의 그래픽 정보를 표시하는 명령어를 포함한다. 기타의 구현 방식에서, 필요에 따라 복수의 프로세서 및/또는 복수의 버스를 복수의 메모리와 함께 사용할 수 있다. 마찬가지로, 복수의 전자 기기를 연결할 수 있는 바, 각 전자 기기는 일부 필요한 동작을 제공한다(예컨대, 서버 어레이, 한 그룹의 블레이드 서버 또는 멀티프로세서 시스템으로서). 도 6은 하나의 프로세서(601)를 예로 든다.
메모리(602)는 본 출원에 의해 제공되는 비일시적 컴퓨터 판독 가능한 저장 매체이다. 여기서, 상기 메모리에는 적어도 하나의 프로세서에 의해 실행 가능한 명령어가 저장되어, 상기 적어도 하나의 프로세서에 의해 본 출원에 의해 제공되는 지식 그래프를 구축하는 방법이 수행되도록 한다. 본 출원의 비일시적 컴퓨터 판독 가능한 저장 매체는 컴퓨터 명령어를 저장하고, 당해 컴퓨터 명령어는 컴퓨터가 본 출원에 의해 제공되는 지식 그래프를 구축하는 방법을 수행하도록 한다.
메모리(602)는 비일시적 컴퓨터 판독 가능한 저장 매체로서, 비일시적 소프트웨어 프로그램, 비일시적 컴퓨터 실행 가능한 프로그램 및 모듈, 예를 들어 본 출원의 실시예의 지식 그래프를 구축하는 방법에 대응되는 프로그램 명령어/모듈(예컨대, 도 5에 도시한 시나리오 결정 모듈(501), 대상 태그 결정 모듈(502), 그래프 구축 모듈(503))을 저장할 수 있다. 프로세서(601)는 메모리(602)에 저장된 비일시적 소프트웨어 프로그램, 명령어 및 모듈을 실행함으로써 서버의 다양한 기능 응용 및 데이터 처리를 수행하는 바, 즉 상술한 방법 실시예의 지식 그래프를 구축하는 방법을 구현한다.
메모리(602)는 프로그램 저장 영역과 데이터 저장 영역을 포함할 수 있고, 여기서, 프로그램 저장 영역은 운영 체제, 적어도 하나의 기능에 있어서 필요한 응용 프로그램을 저장할 수 있고, 데이터 저장 영역은 지식 그래프를 구축하는 전자 기기의 사용에 따라 구축되는 데이터 등을 저장할 수 있다. 이 외에도, 메모리(602)는 고속 랜덤 액세스 메모리를 포함할 수도 있고, 비일시적 저장 장치, 예컨대 적어도 하나의 자기 디스크 저장 디바이스, 플래시 메모리 디바이스, 또는 기타의 비일시적 고체 상태 저장 디바이스를 더 포함할 수도 있다. 일부 실시예에서, 메모리(602)는 선택적으로 프로세서(601)에 대해 원격으로 설치되는 저장 장치를 포함할 수 있고, 이러한 원격 저장 장치는 네트워크를 통해 지식 그래프를 구축하는 전자 기기에 연결될 수 있다. 상술한 네트워크의 실시예는 인터넷, 인트라넷, 근거리 통신망, 이동 통신 네트워크 및 이들의 조합을 포함하나 이에 제한되지 않는다.
지식 그래프를 구축하는 방법을 수행하는 전자 기기는 입력 장치(603)와 출력 장치(604)를 더 포함할 수 있다. 프로세서(601), 메모리(602), 입력 장치(603) 및 출력 장치(604)는 버스 또는 기타의 방식으로 연결될 수 있는 바, 도 6에서는 버스를 통한 연결을 예로 든다.
입력 장치(603)는 입력되는 숫자 또는 문자(character) 정보를 수신하고 지식 그래프를 구축하는 전자 기기의 사용자 설정 및기능 제어에 관련되는 키 신호 입력을 발생시킬 수 있는 바, 예컨대 숫자 키패드, 마우스, 트랙패드, 터치패드, 포인팅 스틱, 하나 또는 복수의 마우스 버튼, 트랙볼, 조종 스틱 등 입력 장치가 있다. 출력 장치(604)는 디스플레이 기기, 보조 조명 장치(예컨대, LED) 및 촉각 피드백 장치 (예컨대, 진동 모터) 등을 포함할 수 있다. 당해 디스플레이 기기는 액정 디스플레이 (LCD), 발광 다이오드 (LED) 디스플레이 및 플라즈마 디스플레이를 포함할 수 있으나, 이에 제한되지 않는다. 일부 실시예에서 디스플레이 기기는 터치 스크린일 수 있다.
여기서 설명하는 시스템과 기술의 다양한 구현 방식은 디지털 전자 회로 시스템, 집적 회로 시스템, 주문형 ASIC (주문형 집적회로), 컴퓨터 하드웨어, 펌웨어, 소프트웨어 및/또는 이들의 조합으로 구현될 수 있다. 이러한 다양한 구현 방식은 하나 또는 복수의 컴퓨터 프로그램에서 구현되는 것을 포함할 수 있고, 당해 하나 또는 복수의 컴퓨터 프로그램은 적어도 하나의 프로그램 가능 프로세서를 포함하는 프로그램 가능 시스템에서 실행되거나 및/또는 분석될 수 있고, 당해 프로그램 가능 프로세서는 전용 또는 범용 프로그램 가능 프로세서일 수 있고, 당해 프로그램 가능 프로세서는 전용 또는 범용 프로그램 가능 프로세서일 수 있고, 저장 시스템, 적어도 하나의 입력 장치 및 적어도 하나의 출력 장치로부터 데이터와 명령어를 수신하고, 데이터와 명령어를 당해 저장 시스템, 당해 적어도 하나의 입력 장치 및 당해 적어도 하나의 출력 장치로 전송할 수 있다.
이러한 컴퓨팅 프로그램(프로그램, 소프트웨어, 소프트웨어 애플리케이션 또는 코드로 지칭되기도 함)은 프로그램 가능 프로세서의 기계 명령어를 포함하며, 고차원 프로세스 및/또는 객체 지향 프로그래밍 언어, 및/또는 어셈블리어/기계어를 이용하여, 이러한 컴퓨팅 프로그램을 구현할 수 있다. 본 명세서에서 사용한 바와 같이, 용어 '기계 판독 가능한 매체'와 '컴퓨터 판독 가능한 매체'는 기계 명령어 및/또는 데이터를 프로그램 가능 프로세서에 제공하기 위한 임의의 컴퓨터 프로그램 제품, 기기, 및/또는 장치(예컨대, 자기 디스크, 광 디스크, 메모리, 프로그램 가능 논리 장치(PLD))를 가리키는 바, 기계 판독 가능 신호로서의 기계 명령어를 수신하는 기계 판독 가능 매체를 포함한다. 용어 '기계 판독 가능 신호'는 기계 명령 및/또는 데이터를 프로그램 가능 프로세서에 제공하기 위한 임의의 신호를 가리킨다.
사용자와의 인터랙션을 제공하기 위해, 여기서 설명하는 시스템과 기술을 컴퓨터에서 실시할 수 있는 바, 당해 컴퓨터는 사용자한테 정보를 디스플레이하기 위한 디스플레이 장치(예컨대, CRT(음극선관) 또는 LCD(액정 디스플레이) 모니터) 및 키보드와 포인팅 장치(예컨대, 마우스 또는 트랙볼) 를 포함하고, 사용자는 당해 키보드와 당해 포인팅 장치를 통해 입력을 컴퓨터에 제공할 수 있다. 기타 종류의 장치도 사용자와의 인터랙션을 제공하는 데 사용될 수 있는 바; 예를 들어, 사용자한테 제공되는 피드백은 임의 형식의 감각 피드백(예를 들어 시각 피드백, 청각 피드백 또는 촉각 피드백)일 수 있고, 임의 형식(소리 입력, 음성 입력 또는 촉각 입력을 포함함)으로 사용자로부터의 입력이 수신될 수 있다.
여기서 설명하는 시스템과 기술을 백스테이지 부품을 포함하는 컴퓨팅 시스템(예컨대, 데이터 서버로서), 미들웨어를 포함하는 컴퓨팅 시스템(예컨대, 애플리케이션 서버), 프런트 엔드 부품을 포함하는 컴퓨팅 시스템(예컨대, 그래픽 사용자 인터페이스 또는 네트워크 브라우저를 구비하는 사용자 컴퓨터일 수 있는 바, 사용자는 당해 그래픽 사용자 인터페이스 또는 당해 네트워크 브라우저를 통하여, 여기서 설명하는 시스템 및 기술의 구현 방식과 인터랙션할 수 있음) 또는 이러한 백스테이지 부품, 미들웨어 또는 프런트 엔드 부품의 임의 조합을 포함하는 컴퓨팅 시스템에서 구현할 수 있다. 임의 형식 또는 매체의 디지털 데이터 통신(예컨대, 통신 네트워크)으로 시스템의 부품을 서로 연결시킬 수 있다. 통신 네트워크의 예시는 근거리 통신망(LAN), 광대역 통신망(WAN) 및 인터넷을 포함한다.
컴퓨터 시스템은 클라이언트와 서버를 포함할 수 있다. 클라이언트와 서버는 일반적으로 서로 멀리 떨어져 있고, 통상적으로 통신 네트워크를 통해 인터랙션한다. 상응한 컴퓨터에서 실행되고 서로 클라이언트 - 서버 관계를 이루는 컴퓨터 프로그램을 통해 클라이언트와 서버의 관계를 구성한다.
본 출원의 실시예에 따른 기술 방안은, 지식 그래프 속의 지식을 풍부하게 하여 지식 그래프가 지능형 검색, 지능형 응답, 개인화 추천 등의 지능형 정보 서비스에서 더 큰 응용가치를 창출하도록 할 수 있다.
위에서 제시한 다양한 형식의 흐름을 적용하여 단계를 재정렬, 증가 또는 삭제할 수 있음을 이해하여야 한다. 예컨대, 본 출원에 기재된 각 단계는 병행으로 실행될 수도 있고, 순차로 실행될 수도 있고, 서로 다른 순서로 실행될 수도 있는 바, 본 출원에서 개시하는 기술 방안에 대한 기대 효과를 구현할 수만 있다면 되는 것으로, 본 명세서는 이에 대해 제한하지 않는다.
상술한 구체적인 구현 방식은 본 출원의 보호 범위를 제한하지 않는다. 설계 요구와 기타 요소에 따른 다양한 수정, 조합, 서브 조합 및 치환이 가능하다는 점은 당업자에 있어서 자명할 것이다. 본 출원의 사상과 원칙 이내에 있는 임의의 수정, 등가 치환 및 개량 등은 모두 본 출원의 보호 범위에 포함되어야 한다.

Claims (20)

  1. 적어도 하나의 프로세서 및 상기 프로세서에 의해 실행 가능한 명령어를 저장하는 메모리를 구비한 컴퓨팅 장치에서 수행되는 지식 그래프를 구축하는 방법으로서,
    상기 프로세서가 시나리오 및 상기 시나리오의 시나리오 요소를 결정하는 단계;
    상기 프로세서가 지식 그래프 속의 객체 노드와 시나리오 요소 노드 간의 엣지에 따라 객체와 상기 시나리오 요소의 연관 관계를 결정하는 단계;
    상기 프로세서가 지식 그래프 속의 상기 객체 노드와 속성 태그 노드의 엣지에 따라 상기 객체와 속성 태그의 연관 관계를 결정하는 단계;
    상기 프로세서가 상기 객체와 상기 시나리오 요소의 연관 관계 및 상기 객체와 상기 속성 태그의 연관 관계에 따라 상기 속성 태그 중에서 대상 태그를 결정하는 단계; 및
    상기 프로세서가 시나리오 노드와 대상 태그 노드 간의 엣지를 구축하여 시나리오 정보를 포함하는 지식 그래프를 획득하는 단계
    를 포함하고,
    상기 시나리오의 시나리오 요소를 결정하는 단계는,
    상기 프로세서가 상기 객체에 연관되는 타깃 데이터 소스를 결정하는 단계; 및
    상기 프로세서가 상기 타깃 데이터 소스의 데이터로부터 상기 시나리오 요소를 추출하는 단계
    를 포함하며,
    상기 시나리오 노드는 상기 시나리오가 지식 그래프에서 표시되는 노드를 나타내고, 상기 대상 태그 노드는 상기 대상 태그가 지식 그래프에서 표시되는 노드를 나타내며, 상기 시나리오 요소는 상기 시나리오를 구성하는 요소 중의 적어도 하나이고, 상기 시나리오 요소는 시나리오 속의 사람들, 시나리오의 발생지점 및 시나리오의 발생시간을 포함하는 것을 특징으로 하는 지식 그래프를 구축하는 방법.
  2. 제1항에 있어서,
    상기 객체와 시나리오 요소의 연관 관계 및 상기 객체와 속성 태그의 연관 관계에 따라 상기 속성 태그 중에서 대상 태그를 결정하는 단계는,
    상기 프로세서가 상기 객체와 상기 시나리오 요소의 연관 관계 및 상기 객체와 상기 속성 태그의 연관 관계에 따라 상기 시나리오 요소와 상기 속성 태그 간의 연관 정보를 결정하는 단계; 및
    상기 프로세서가 상기 시나리오 요소와 상기 속성 태그 간의 연관 정보에 따라 상기 속성 태그 중에서 상기 대상 태그를 결정하는 단계
    를 포함하는 것을 특징으로 하는 지식 그래프를 구축하는 방법.
  3. 제2항에 있어서,
    상기 시나리오 요소와 상기 속성 태그 간의 연관 정보에 따라 상기 속성 태그 중에서 상기 대상 태그를 결정하는 단계는
    상기 프로세서가 상기 시나리오 요소와 상기 속성 태그 간의 연관 횟수에 따라 상기 속성 태그 중에서 상기 대상 태그를 결정하는 단계
    를 포함하는 것을 특징으로 하는 지식 그래프를 구축하는 방법.
  4. 제3항에 있어서,
    상기 시나리오 요소와 상기 속성 태그 간의 연관 횟수에 따라 상기 속성 태그 중에서 상기 대상 태그를 결정하는 단계는,
    상기 프로세서가 상기 시나리오 요소와 상기 속성 태그 간의 연관 횟수가 설정 횟수 역치보다 큰 경우, 당해 속성 태그를 후보 태그로 하는 단계;
    상기 프로세서가 상기 시나리오 요소와 상기 후보 태그 간의 연관 횟수에 따라 상기 후보 태그와 상기 시나리오의 연관 정도를 결정하는 단계; 및
    상기 프로세서가 상기 연관 정도에 따라 상기 후보 태그 중에서 상기 대상 태그를 결정하는 단계
    를 포함하는 것을 특징으로 하는 지식 그래프를 구축하는 방법.
  5. 제4항에 있어서,
    상기 시나리오 요소와 상기 후보 태그 간의 연관 횟수에 따라 상기 후보 태그와 상기 시나리오의 연관 정도를 결정하는 단계는,
    상기 프로세서가 상기 시나리오 요소와 상기 후보 태그 간의 연관 횟수의 최대치를 결정하는 단계;
    상기 프로세서가 상기 시나리오 요소와 상기 후보 태그 간의 연관 횟수와 상기 최대치의 비례값을 산출하는 단계; 및
    상기 프로세서가 산출한 비례값에 따라 상기 후보 태그와 상기 시나리오의 연관 정도를 결정하는 단계
    를 포함하는 것을 특징으로 하는 지식 그래프를 구축하는 방법.
  6. 삭제
  7. 제1항 내지 제5항 중 어느 한 항에 있어서,
    상기 시나리오를 결정하는 단계는,
    상기 프로세서가 상기 시나리오 요소에 따라 상기 시나리오를 결정하는 단계; 또는
    상기 프로세서가 수요 정보에 따라 상기 시나리오를 결정하는 단계
    를 포함하는 것을 특징으로 하는 지식 그래프를 구축하는 방법.
  8. 삭제
  9. 삭제
  10. 지식 그래프 구축 장치로서,
    시나리오 및 상기 시나리오의 시나리오 요소를 결정하는 시나리오 결정 모듈;
    지식 그래프 속의 객체 노드와 시나리오 요소 노드 간의 엣지에 따라 객체와 상기 시나리오 요소의 연관 관계를 결정하는 시나리오 관계 결정 모듈;
    지식 그래프 속의 상기 객체 노드와 속성 태그 노드의 엣지에 따라 상기 객체와 속성 태그의 연관 관계를 결정하는 태그 관계 결정 모듈;
    객체와 상기 시나리오 요소의 연관 관계 및 상기 객체와 속성 태그의 연관 관계에 따라 상기 속성 태그 중에서 대상 태그를 결정하는 대상 태그 결정 모듈; 및
    시나리오 노드와 대상 태그 노드 간의 엣지를 구축하여 시나리오 정보를 포함하는 지식 그래프를 획득하는 그래프 구축 모듈
    을 포함하고,
    상기 시나리오 결정 모듈은,
    상기 객체에 연관되는 타깃 데이터 소스를 결정하는 데이터 소스 결정 유닛; 및
    상기 타깃 데이터 소스의 데이터로부터 상기 시나리오 요소를 추출하는 요소 추출 유닛
    을 포함하며,
    상기 시나리오 노드는 상기 시나리오가 지식 그래프에서 표시되는 노드를 나타내고, 상기 대상 태그 노드는 상기 대상 태그가 지식 그래프에서 표시되는 노드를 나타내며, 상기 시나리오 요소는 상기 시나리오를 구성하는 요소 중의 적어도 하나이고, 상기 시나리오 요소는 시나리오 속의 사람들, 시나리오의 발생지점 및 시나리오의 발생시간을 포함하는 것을 특징으로 하는 지식 그래프 구축 장치.
  11. 제10항에 있어서,
    상기 대상 태그 결정 모듈은,
    상기 객체와 상기 시나리오 요소의 연관 관계 및 상기 객체와 상기 속성 태그의 연관 관계에 따라 상기 시나리오 요소와 상기 속성 태그 간의 연관 정보를 결정하는 정보 결정 유닛; 및
    상기 시나리오 요소와 상기 속성 태그 간의 연관 정보에 따라 상기 속성 태그 중에서 상기 대상 태그를 결정하는 대상 태그 결정 유닛
    을 포함하는 것을 특징으로 하는 지식 그래프 구축 장치.
  12. 제11항에 있어서,
    상기 대상 태그 결정 유닛은,
    상기 시나리오 요소와 상기 속성 태그 간의 연관 횟수에 따라 상기 속성 태그 중에서 상기 대상 태그를 결정하는 태그 결정 서브 유닛을 포함하는 것을 특징으로 하는 지식 그래프 구축 장치.
  13. 제12항에 있어서,
    상기 태그 결정 서브 유닛은,
    상기 시나리오 요소와 상기 속성 태그 간의 연관 횟수가 설정 횟수 역치보다 큰 경우, 당해 속성 태그를 후보 태그로 하는 후보 태그 결정 부재;
    상기 시나리오 요소와 상기 후보 태그 간의 연관 횟수에 따라 상기 후보 태그와 상기 시나리오의 연관 정도를 결정하는 연관 정도 결정 부재; 및
    상기 연관 정도에 따라 상기 후보 태그 중에서 상기 대상 태그를 결정하는 대상 태그 결정 부재
    를 포함하는 것을 특징으로 하는 지식 그래프 구축 장치.
  14. 제13항에 있어서,
    상기 연관 정도 결정 부재는 구체적으로
    상기 시나리오 요소와 상기 후보 태그 간의 연관 횟수의 최대치를 결정하고,
    상기 시나리오 요소와 상기 후보 태그 간의 연관 횟수와 상기 최대치의 비례값을 산출하고,
    산출한 비례값에 따라 상기 후보 태그와 상기 시나리오의 연관 정도를 결정하는
    것을 특징으로 하는 지식 그래프 구축 장치.
  15. 삭제
  16. 제10항 내지 제14항 중 어느 한 항에 있어서,
    상기 시나리오 결정 모듈은,
    상기 시나리오 요소에 따라 상기 시나리오를 결정하거나 또는 수요 정보에 따라 상기 시나리오를 결정하는 시나리오 결정 유닛을 포함하는 것을 특징으로 하는 지식 그래프 구축 장치.
  17. 삭제
  18. 삭제
  19. 전자 기기로서,
    적어도 하나의 프로세서; 및
    상기 적어도 하나의 프로세서에 통신적으로 연결되는 메모리를 포함하되,
    상기 메모리에는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령어가 저장되어 있고, 상기 명령어는 상기 적어도 하나의 프로세서에 의해 실행되어 상기 적어도 하나의 프로세서가 제1항에 따른 방법을 수행할 수 있도록 하는 것을 특징으로 하는 전자 기기.
  20. 컴퓨터 명령어가 저장되어 있는 비일시적 컴퓨터 판독 가능한 저장 매체로서,
    상기 컴퓨터 명령어는 상기 컴퓨터가 제1항에 따른 방법을 수행하도록 하는 것을 특징으로 하는 비일시적 컴퓨터 판독 가능한 저장 매체.
KR1020200173813A 2020-04-27 2020-12-11 지식 그래프를 구축하는 방법, 장치, 기기 및 저장 매체 KR102528748B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010345691.4 2020-04-27
CN202010345691.4A CN111522967B (zh) 2020-04-27 2020-04-27 知识图谱构建方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
KR20210132578A KR20210132578A (ko) 2021-11-04
KR102528748B1 true KR102528748B1 (ko) 2023-05-03

Family

ID=71905314

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200173813A KR102528748B1 (ko) 2020-04-27 2020-12-11 지식 그래프를 구축하는 방법, 장치, 기기 및 저장 매체

Country Status (5)

Country Link
US (1) US20210334669A1 (ko)
EP (1) EP3905146A1 (ko)
JP (1) JP7269913B2 (ko)
KR (1) KR102528748B1 (ko)
CN (1) CN111522967B (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112307085B (zh) * 2020-10-30 2024-04-09 北京百度网讯科技有限公司 数据处理方法、装置、电子设备及存储介质
CN112307337B (zh) * 2020-10-30 2024-04-12 中国平安人寿保险股份有限公司 基于标签知识图谱的关联推荐方法、装置及计算机设备
CN112528146B (zh) * 2020-12-09 2022-05-27 北京百度网讯科技有限公司 内容资源推荐方法、装置、电子设备及存储介质
CN113743974A (zh) * 2021-01-14 2021-12-03 北京沃东天骏信息技术有限公司 一种资源推荐方法及装置、设备、存储介质
CN113505235A (zh) * 2021-07-05 2021-10-15 北京优锘科技有限公司 一种基于配置数据生成交易路径图的方法、装置和设备
CN114543796B (zh) * 2022-02-14 2023-09-08 国网电力科学研究院有限公司 一种室外定位方法、系统及存储介质
CN114282011B (zh) * 2022-03-01 2022-08-23 支付宝(杭州)信息技术有限公司 知识图谱的构建方法和装置、图计算方法及装置
CN115203428B (zh) * 2022-05-30 2023-09-26 北京百度网讯科技有限公司 一种知识图谱构建方法、装置、电子设备及存储介质
CN117235289B (zh) * 2023-11-16 2024-02-27 国网浙江省电力有限公司 一种面向场景化决策需求的领域图谱模型的处理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070124291A1 (en) 2005-11-29 2007-05-31 Hassan Hany M Method and system for extracting and visualizing graph-structured relations from unstructured text
US20120072402A1 (en) 2008-12-19 2012-03-22 Thales Method and system for merging data or information
US20160292304A1 (en) 2015-04-01 2016-10-06 Tata Consultancy Services Limited Knowledge representation on action graph database
WO2020063092A1 (zh) * 2018-09-30 2020-04-02 北京国双科技有限公司 知识图谱的处理方法及装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5093869A (en) * 1990-12-26 1992-03-03 Hughes Aircraft Company Pattern recognition apparatus utilizing area linking and region growth techniques
KR940006841A (ko) * 1992-09-17 1994-04-25 전성원 자동차 전후이동 시이트 잠금장치
US20110096135A1 (en) * 2009-10-23 2011-04-28 Microsoft Corporation Automatic labeling of a video session
US8977611B2 (en) * 2011-10-18 2015-03-10 Facebook, Inc. Ranking objects by social relevance
CN103136228A (zh) * 2011-11-25 2013-06-05 阿里巴巴集团控股有限公司 一种图片搜索方法以及图片搜索装置
WO2014144931A2 (en) * 2013-03-15 2014-09-18 Robert Haddock Intelligent internet system with adaptive user interface providing one-step access to knowledge
US10474949B2 (en) * 2014-08-19 2019-11-12 Qualcomm Incorporated Knowledge-graph biased classification for data
US10534810B1 (en) * 2015-05-21 2020-01-14 Google Llc Computerized systems and methods for enriching a knowledge base for search queries
CN107688606A (zh) * 2017-07-26 2018-02-13 北京三快在线科技有限公司 一种推荐信息的获取方法及装置,电子设备
CN109948073B (zh) * 2017-09-25 2023-05-23 腾讯科技(深圳)有限公司 内容检索方法、终端、服务器、电子设备及存储介质
US20190102625A1 (en) * 2017-09-29 2019-04-04 Microsoft Technology Licensing, Llc Entity attribute identification
US20190179878A1 (en) * 2017-12-12 2019-06-13 Google Llc Generating organization-specific tags for communications from various sources of an organization using an expanded knowledge graph for organization-specific content
US10803135B2 (en) * 2018-09-11 2020-10-13 Apple Inc. Techniques for disambiguating clustered occurrence identifiers
KR20200042739A (ko) * 2018-10-16 2020-04-24 삼성전자주식회사 지식 그래프에 기초하여 콘텐트를 제공하는 시스템 및 방법
CN110008355A (zh) * 2019-04-11 2019-07-12 华北科技学院 基于知识图谱的灾害场景信息融合方法及装置
CN110377676B (zh) * 2019-06-25 2022-05-27 北京百度网讯科技有限公司 一种语音指令的处理方法、装置、设备和计算机存储介质
CN110611651B (zh) * 2019-07-19 2022-05-27 中国工商银行股份有限公司 网络监控方法、网络监控装置和电子设备
CN110580516B (zh) * 2019-08-21 2021-11-09 厦门无常师教育科技有限公司 一种基于智能机器人的交互方法及装置
CN110543574B (zh) * 2019-08-30 2022-05-17 北京百度网讯科技有限公司 一种知识图谱的构建方法、装置、设备及介质
CN110825882B (zh) * 2019-10-09 2022-03-01 西安交通大学 一种基于知识图谱的信息系统管理方法
CN110955764B (zh) * 2019-11-19 2021-04-06 百度在线网络技术(北京)有限公司 场景知识图谱的生成方法、人机对话方法以及相关设备
CN111026965B (zh) * 2019-12-05 2023-11-21 中国银行股份有限公司 基于知识图谱的热点话题追溯方法及装置
CN110688495B (zh) * 2019-12-09 2020-04-24 武汉中科通达高新技术股份有限公司 一种事件信息的知识图谱模型构建方法、装置、存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070124291A1 (en) 2005-11-29 2007-05-31 Hassan Hany M Method and system for extracting and visualizing graph-structured relations from unstructured text
US20120072402A1 (en) 2008-12-19 2012-03-22 Thales Method and system for merging data or information
US20160292304A1 (en) 2015-04-01 2016-10-06 Tata Consultancy Services Limited Knowledge representation on action graph database
WO2020063092A1 (zh) * 2018-09-30 2020-04-02 北京国双科技有限公司 知识图谱的处理方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
신동협, 김인철. 3차원 공간에서 에이전트의 탐색을 통한 장면 그래프 생성. 2018년 추계학술발표대회 논문집. 제25권. 제2호. 2018.11.*

Also Published As

Publication number Publication date
CN111522967B (zh) 2023-09-15
KR20210132578A (ko) 2021-11-04
EP3905146A1 (en) 2021-11-03
JP7269913B2 (ja) 2023-05-09
CN111522967A (zh) 2020-08-11
US20210334669A1 (en) 2021-10-28
JP2021174516A (ja) 2021-11-01

Similar Documents

Publication Publication Date Title
KR102528748B1 (ko) 지식 그래프를 구축하는 방법, 장치, 기기 및 저장 매체
CN111582453B (zh) 生成神经网络模型的方法和装置
US11928432B2 (en) Multi-modal pre-training model acquisition method, electronic device and storage medium
US11573992B2 (en) Method, electronic device, and storage medium for generating relationship of events
CN111709247A (zh) 数据集处理方法、装置、电子设备和存储介质
CN111582454B (zh) 生成神经网络模型的方法和装置
KR20210038467A (ko) 이벤트 테마 생성 방법, 장치, 기기 및 저장 매체
CN111680517B (zh) 用于训练模型的方法、装置、设备以及存储介质
CN111582477B (zh) 神经网络模型的训练方法和装置
CN113094550A (zh) 视频检索方法、装置、设备和介质
CN111078878B (zh) 文本处理方法、装置、设备及计算机可读存储介质
CN111860769A (zh) 预训练图神经网络的方法以及装置
CN111460384B (zh) 策略的评估方法、装置和设备
CN111563593B (zh) 神经网络模型的训练方法和装置
CN110704509A (zh) 数据分类方法、装置、设备及存储介质
CN111523007B (zh) 用户感兴趣信息确定方法、装置、设备以及存储介质
US20220027575A1 (en) Method of predicting emotional style of dialogue, electronic device, and storage medium
CN111680600A (zh) 人脸识别模型处理方法、装置、设备和存储介质
CN112115313B (zh) 正则表达式的生成、数据提取方法、装置、设备及介质
CN111767477B (zh) 一种检索方法、装置、电子设备和存储介质
KR20220014865A (ko) 비디오 이벤트 인식 방법, 장치, 전자 기기 및 기록 매체
CN111680597A (zh) 人脸识别模型处理方法、装置、设备和存储介质
CN112597288B (zh) 人机交互方法、装置、设备及存储介质
CN111680599B (zh) 人脸识别模型处理方法、装置、设备和存储介质
CN115186738B (zh) 模型训练方法、装置和存储介质

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant