KR20210040891A - 정보 추천 방법과 장치, 전자 장비, 컴퓨터 판독가능 저장 매체 및 컴퓨터 프로그램 - Google Patents

정보 추천 방법과 장치, 전자 장비, 컴퓨터 판독가능 저장 매체 및 컴퓨터 프로그램 Download PDF

Info

Publication number
KR20210040891A
KR20210040891A KR1020210039694A KR20210039694A KR20210040891A KR 20210040891 A KR20210040891 A KR 20210040891A KR 1020210039694 A KR1020210039694 A KR 1020210039694A KR 20210039694 A KR20210039694 A KR 20210039694A KR 20210040891 A KR20210040891 A KR 20210040891A
Authority
KR
South Korea
Prior art keywords
information
word
text
node
entity
Prior art date
Application number
KR1020210039694A
Other languages
English (en)
Inventor
하이웨이 왕
지에 왕
쥔 리우
용 주
하오 티엔
웨이 흐어
Original Assignee
베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드 filed Critical 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드
Publication of KR20210040891A publication Critical patent/KR20210040891A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0454
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 개시는 지식 맵 분야에 관한 것으로서, 정보 추천 방법을 제공한다. 상기 방법은, 청구 정보를 취득하는 것, 청구 정보로부터 실체를 나타내는 청구 실체 단어를 추출하는 것, 청구 실체 단어 및 사전에 구축된 지식 맵에 근거하여, 추천 정보를 확정하는 것, 및 추천 정보를 푸시하는 것을 포함하고, 지식 맵은 텍스트에 기초하여 구축된 것으로서, 텍스트의 출처를 나타내는 제1 단어를 지시한다. 또한, 본 개시는 정보 추천 장치, 전자 장비, 컴퓨터 판독가능 저장 매체 및 컴퓨터 프로그램을 제공한다.

Description

정보 추천 방법과 장치, 전자 장비, 컴퓨터 판독가능 저장 매체 및 컴퓨터 프로그램 {Method and Apparatus of Recommending Information, Electronic Device, Computer-Readable Recording Medium, and Computer Program}
본 개시는 지식 맵 분야에 관한 것으로서, 보다 구체적으로는, 정보 추천 방법과 장치, 전자 장비, 컴퓨터 판독가능 저장 매체 및 컴퓨터 프로그램에 관한 것이다.
인터넷 기술의 발전과 더불어, 업무 효율의 향상 및 기업 관리의 편의를 위해, 관리를 협조하는 각종 인공지능 플랫폼이 나타났다.
본 개시의 구상을 실현하는 과정에서, 발명자는 관련기술에 적어도 하기의 기술적 과제가 존재함을 의식하게 되었다. 즉, 관련기술의 인공지능 플랫폼은 정보 체계 구축, 정보 분류 및 정보 공유를 핵심으로 하는 경우가 대부분이다. 하지만, 검색 문구에 응답하여 정보를 추천할 때, 검색 문구에 근거하여 검색 문구의 키워드를 포함하는 정보만 사용자에게 추천하게 된다.
따라서, 관련기술의 인공지능 플랫폼은, 검색 문구에 근거하여 사용자의 의도에 대한 깊은 차원의 발굴 및 이해가 부족하므로, 사용자에게 보다 풍부한 정보를 제공할 수 없는 기술적 과제가 존재한다.
이를 감안하여, 본 개시는 깊은 차원에서 사용자의 수요를 발굴하고 이해하여 사용자에게 풍부한 정보를 추천하는 정보 추천 방법과 장치, 전자 장비, 컴퓨터 판독가능 저장 매체 및 컴퓨터 프로그램을 제공한다.
본 개시의 한 측면에 따르면, 청구 정보를 취득하는 것, 청구 정보로부터 실체를 나타내는 청구 실체 단어를 추출하는 것, 청구 실체 단어 및 사전에 구축된 지식 맵에 근거하여, 추천 정보를 확정하는 것, 및 추천 정보를 푸시하는 것을 포함하고, 지식 맵은 텍스트에 기초하여 구축된 것으로서, 텍스트의 출처를 나타내는 제1 단어를 지시하는 정보 추천 방법을 제공한다.
선택적으로, 상기 정보 추천 방법은, 텍스트에 기초하여 지식 맵을 구축하는 것을 더 포함하고, 텍스트에 기초하여 지식 맵을 구축하는 것은, 텍스트로부터 실체를 나타내는 복수의 실체 단어 및 복수의 실체 단어 사이의 연관관계를 추출하는 것, 및 추출된 복수의 실체 단어 및 복수의 실체 단어 사이의 연관관계에 근거하여, 지식 맵을 구축하는 것을 포함하고, 복수의 실체 단어는 제1 단어를 포함한다.
선택적으로, 상기 지식 맵을 구축하는 것은, 복수의 실체 단어 중 각 실체 단어에 대해, 각 실체 단어를 상대로 노드를 구축하는 것, 복수의 실체 단어 사이의 연관관계에 근거하여, 복수의 실체 단어 중 각 실체 단어와 연관관계를 가지는 연관 단어를 확정하는 것, 및 각 실체 단어를 상대로 하는 노드와 연관 단어를 상대로 하는 노드를 연결하여, 각 실체 단어를 상대로 하는 노드에 연관되는 에지를 형성하는 것을 포함한다.
선택적으로, 상기 지식 맵을 구축하는 것은, 각 실체 단어와 연관 단어 사이의 연관관계에 근거하여, 각 실체 단어와 연관 단어 사이의 연관 강도를 확정하는 것, 및 연관 강도에 근거하여, 각 실체 단어를 상대로 하는 노드와 연관 단어를 상대로 하는 노드를 연결하는 에지에 가중치를 부여하는 것을 더 포함하고, 연관 강도의 크기는 가중치의 크기에 비례한다.
선택적으로, 상기 추천 정보를 확정하는 것은, 지식 맵에서 청구 실체 단어를 상대로 하는 노드를 목표 노드로 확정하는 것, 목표 노드에 연관되는 에지에 근거하여, 목표 노드에 연결되는 적어도 하나의 노드를 확정하는 것, 및 적어도 하나의 노드가 상대로 하는 실체 단어에 근거하여, 추천 정보를 확정하는 것을 포함한다.
선택적으로, 상기 정보 추천 방법은, 새로운 텍스트를 취득한 것에 응답하여, 새로운 텍스트로부터 실체를 나타내는 복수의 새로운 실체 단어 및 복수의 새로운 실체 단어 사이의 연관관계를 추출하는 것, 및 지식 맵이 복수의 새로운 실체 단어 중 적어도 하나의 새로운 실체 단어를 지시하지 못할 경우, 복수의 새로운 실체 단어 및 복수의 새로운 실체 단어 사이의 연관관계에 근거하여, 지식 맵을 업데이트하는 것을 더 포함한다.
선택적으로, 상기 정보 추천 방법은, 청구 정보로부터 키 정보를 추출하는 것, 및 사전에 설정된 키 정보 구조 중 추출된 키 정보에 연관되는 정보 노드를 목표 정보 노드로 확정하는 것을 더 포함하고, 키 정보 구조에는 복수의 정보 노드가 포함되어 있고, 복수의 정보 노드 중의 각 정보 노드는 하나의 키 정보를 지시하고, 추천 정보를 확정하는 것은, 청구 실체 단어, 사전에 구축된 지식 맵 및 목표 정보 노드에 근거하여 추천 정보를 확정하는 것을 포함한다.
선택적으로, 복수의 실체 단어는 텍스트의 키 정보를 나타내는 제2 단어를 더 포함하고, 상기 정보 추천 방법은, 텍스트를 키 정보 구조에 포함되는 정보 노드에 분류시키는 것을 더 포함하고, 텍스트를 분류시키는 것은, 제2 단어에 근거하여, 텍스트와 키 정보 구조 중의 각 정보 노드 사이의 매칭 관계를 확정하는 것, 및 텍스트를 텍스트에 매칭되는 정보 노드에 분류시키는 것을 포함한다.
선택적으로, 제2 단어는 복수 개 이고, 텍스트와 키 정보 구조 중의 각 정보 노드 사이의 매칭 관계를 확정하는 것은, 제2 단어에 각 정보 노드가 지시하는 키 정보와 동일한 목표 단어가 포함되어 있는지 확정하는 것, 및 제2 단어에 목표 단어가 포함되어 있을 경우, 텍스트와 각 정보 노드 사이의 매칭 관계가 매칭된다고 확정하는 것을 포함한다.
선택적으로, 텍스트와 키 정보 구조 중의 각 정보 노드 사이의 매칭 관계를 확정하는 것은, 제2 단어에 목표 단어가 포함되어 있지 않을 경우, 지식 맵으로부터 제2 단어의 연관 단어를 취득하는 것, 및 제2 단어의 연관 단어에 목표 단어가 포함되어 있을 경우, 텍스트와 각 정보 노드 사이의 매칭 관계가 매칭된다고 확정하는 것을 더 포함한다.
선택적으로, 텍스트와 키 정보 구조 중의 각 정보 노드 사이의 매칭 관계를 확정하는 것은, 제2 단어와 각 정보 노드가 지시하는 키 정보 사이의 유사도를 확정하는 것, 및 유사도가 유사도 한계치보다 클 경우, 텍스트와 각 정보 노드 사이의 매칭 관계가 매칭된다고 확정하는 것을 포함한다.
선택적으로, 상기 정보 추천 방법은, 새로운 텍스트를 취득한 것에 응답하여, 새로운 텍스트로부터 새로운 텍스트의 새로운 키 정보를 추출하는 것, 및 키 정보 구조에 새로운 키 정보를 지시하는 정보 노드가 포함되어 있지 않을 경우, 새로운 키 정보에 근거하여, 키 정보 구조를 업데이트하는 것을 더 포함한다.
선택적으로, 추천 정보를 확정하는 것은, 목표 정보 노드에 분류된 텍스트를 취득하여, 추천 정보로 하는 것을 포함한다.
본 개시의 다른 한 측면에 따르면, 청구 정보를 취득하기 위한 취득 모듈, 청구 정보로부터 실체를 나타내는 청구 실체 단어를 추출하기 위한 정보 추출 모듈, 청구 실체 단어 및 사전에 구축된 지식 맵에 근거하여, 추천 정보를 확정하기 위한 정보 확정 모듈, 및 추천 정보를 푸시하기 위한 정보 푸시 모듈을 포함하고, 지식 맵은 텍스트에 기초하여 구축된 것으로서, 텍스트의 출처를 나타내는 제1 단어를 지시하는 정보 추천 장치를 제공한다.
본 개시의 다른 한 측면에 따르면, 하나 또는 복수의 프로세서, 및 하나 또는 복수의 프로그램을 저장하기 위한 저장 장치를 포함하는 전자 장비를 제공한다. 여기서, 하나 또는 복수의 프로그램이 하나 또는 복수의 프로세서에 의해 실행될 경우, 하나 또는 복수의 프로세서가 상기의 정보 추천 방법을 실행하도록 한다.
본 개시의 다른 한 측면에 따르면, 컴퓨터 프로그램이 저장되어 있는 비 일시적 컴퓨터 판독가능 저장 매체에 있어서, 상기 프로그램이 프로세서에 의해 실행될 경우, 상기와 같은 방법을 구현하는 비 일시적 컴퓨터 판독가능 저장 매체를 제공한다.
본 개시의 다른 한 측면에 따르면, 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램에 있어서, 상기 컴퓨터 프로그램의 명령이 프로세서에 의해 실행될 경우, 상기와 같은 방법을 구현하는 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램을 제공한다.
본 개시의 실시예에 따르면, 관련 정보 추천 방법에 존재하는 추천 정보가 단일하고, 기업의 팀 워크 및 프로젝트 관리에 깊게 관여할 수 없는 결함을 적어도 부분적으로 해소할 수 있다. 또한, 텍스트의 출처를 지시할 수 있는 지식 맵을 통해 정보를 추천하므로, 추천 결과가 기업의 팀 워크 및 프로젝트 관리에 깊게 관여할 수 있도록 한다. 이로써, 기업의 지식 활용 효율을 효과적으로 향상시킬 수 있고, 직원들의 업무 효율을 향상시켜, 지식에 대한 인공지능 플랫폼의 지능적 관리를 향상시킬 수 있다.
이하에서 첨부 도면을 참조하여 설명한 본 개시의 실시예를 통해, 본 개시의 상기 및 다른 목적, 특징 및 장점들은 보다 명확해질 것이다.
도 1은 본 개시의 실시예에 따른 정보 추천 방법과 장치, 전자 장비, 컴퓨터 판독가능 저장 매체 및 컴퓨터 프로그램의 응용장면을 예시적으로 도시하고 있다.
도 2는 본 개시의 실시예에 따른 정보 추천 방법의 흐름도를 예시적으로 도시하고 있다.
도 3a는 본 개시의 실시예에 따른 텍스트에 기초하여 지식 맵을 구축하는 흐름도를 예시적으로 도시하고 있다.
도 3b는 본 개시의 실시예에 따른 지식 맵을 구축하기 위한 텍스트의 취득 흐름을 예시적으로 도시하고 있다.
도 3c는 본 개시의 다른 실시예에 따른 텍스트에 기초하여 지식 맵을 구축하는 흐름도를 예시적으로 도시하고 있다.
도 4a는 본 개시의 실시예에 따른 추천 정보를 확정하는 흐름도를 예시적으로 도시하고 있다.
도 4b는 본 개시의 실시예에 따른 지식 맵에 근거하여 추천 정보를 확정하는 원리를 예시적으로 도시하고 있다.
도 5는 본 개시의 실시예에 따른 지식 맵을 업데이트하는 흐름도를 예시적으로 도시하고 있다.
도 6a는 본 개시의 다른 실시예에 따른 정보 추천 방법의 흐름도를 예시적으로 도시하고 있다.
도 6b는 본 개시의 실시예에 따른 사전에 설정된 키 정보 구조의 개략도를 예시적으로 도시하고 있다.
도 7은 본 개시의 실시예에 따른 텍스트를 키 정보 구조에 포함되어 있는 정보 노드에 분류시키는 흐름도를 예시적으로 도시하고 있다.
도 8은 본 개시의 실시예에 따른 텍스트와 키 정보 구조 중 각 정보 노드 사이의 매칭 관계를 확정하는 흐름도를 예시적으로 도시하고 있다.
도 9는 본 개시의 다른 실시예에 따른 텍스트와 키 정보 구조 중 각 정보 노드 사이의 매칭 관계를 확정하는 흐름도를 예시적으로 도시하고 있다.
도 10은 본 개시의 실시예에 따른 정보 추천 방법을 실현하기 위한 시스템 구성도를 예시적으로 도시하고 있다.
도 11은 본 개시의 실시예에 따른 정보 추천 장치의 블록 구성도를 예시적으로 도시하고 있다.
도 12는 본 개시의 실시예에 따른 정보 추천 방법을 실행하기에 적합한 전자 장비의 일 실예인 컴퓨터 시스템의 블록도를 예시적으로 도시하고 있다.
이하, 첨부 도면을 참조하여 본 개시의 실시예를 설명한다. 이러한 설명은 단지 예시적인 것일 뿐, 본 개시의 범위를 한정하기 위한 것이 아니다. 이하의 상세한 설명에 있어서, 해석의 편의를 위하여, 다수의 구체적인 세부요소들을 설명함으로써 본 개시의 실시예에 대해 전면적으로 이해할 수 있도록 한다. 하지만, 하나 또는 복수의 실시예는 이러한 세부요소 없이도 실시 가능함을 지적해 둔다. 또한, 이하의 설명에서는, 본 개시의 개념에 혼선을 주지 않기 위해 공지적인 구조나 기술에 대한 설명은 생략한다.
본 명세서에서 사용하는 용어는 단지 구체적인 실시예를 설명하기 위한 것으로서, 본 개시를 한정하기 위한 취지로 해석되어서는 아니된다. 본 명세서에서 사용하는 "포함", "구비" 등 용어는 언급된 특징, 단계, 동작 및/또는 부품의 존재를 의미하는데, 하나 또는 복수의 다른 특징, 단계, 동작 또는 부품의 존재 또는 추가를 배제하지는 않는다.
본 명세서에서 사용하는 모든 용어(기술적 및 과학적 용어 포함)는 별도로 정의되지 않는 한, 당업자가 통상적으로 이해하는 의미를 갖는다. 본 명세서에서 사용하는 용어는 본 명세서의 문맥과 일치하는 의미를 갖는 것으로 해석되어야 하며, 이상적이거나 과도하게 사전상의 의미로 해석되어서는 아니되는 점에 유의해야 한다.
"A, B 및 C중 적어도 하나"와 같은 표현을 사용할 경우, 당업자가 통상적으로 이해하는 해당 표현의 의미에 따라 해석되어야 한다(예를 들어, "A, B 및 C중 적어도 하나를 구비한 시스템"에는, A만 구비한 시스템, B만 구비한 시스템, C만 구비한 시스템, A 및 B를 구비한 시스템, A 및 C를 구비한 시스템, B 및 C를 구비한 시스템, 및/또는 A, B, C를 구비한 시스템이 포함되는데, 이에 한정되지는 않는다).
본 개시의 실시예에 따르면, 추천하는 정보의 풍부성 및 사용자 체험을 향상시키기 위한 정보 추천 방법 및 장치를 제공한다. 상기 정보 추천 방법은, 우선, 클라이언트가 접수한 청구 정보를 취득할 수 있다. 그 다음, 청구 정보를 취득한 것에 응답하여, 청구 정보로부터 실체를 나타내는 청구 실체 단어를 추출할 수 있다. 이어서, 청구 실체 단어 및 사전에 구축된 지식 맵에 근거하여, 추천 정보를 확정할 수 있다. 마지막으로, 추천 정보를 클라이언트로 푸시하여, 사용자에게 해당 추천 정보를 표시할 수 있다. 여기서, 지식 맵은 텍스트에 기초하여 구축된 것으로서, 텍스트의 출처를 나타내는 제1 단어를 지시한다. 본 방법에 의하면, 텍스트의 출처를 지시하는 지식 맵에 근거하여, 사용자에게 사용자가 필요로 하는 지식의 출처를 추천할 수 있으므로, 사용자가 관련지식을 연구하는 연구팀, 전문가 등 정보를 신속히 파악할 수 있어, 지식 개발 및 응용의 효율을 향상시킬 수 있다.
도 1은 본 개시의 실시예에 따른 정보 추천 방법과 장치, 전자 장비, 컴퓨터 판독가능 저장 매체 및 컴퓨터 프로그램의 응용장면을 예시적으로 도시하고 있다. 지적해두어야 할 것은, 도 1에 도시된 것 은 본 개시의 실시예를 응용할 수 있는 시스템 구조의 예시에 지나지 않으며, 당업자가 본 개시의 기술 내용을 보다 쉽게 이해하도록 돕기 위한 것으로, 본 개시의 실시예가 다른 장비, 시스템, 또는 응용장면에 응용할 수 없음을 의미하는 것은 아니다.
도 1에 도시된 바와 같이, 본 실시예의 응용장면(100)은 서버(101), 네트워크(102) 및 단말 장비(103, 104, 105)를 포함할 수 있다. 네트워크(102)는 서버(101)와 단말 장비(103, 104, 105) 사이에 통신 링크를 제공하기 위한 매체이다. 네트워크(102)에는 예를 들어, 유선 또는 무선 통신 링크 등 여러가지 연결형태가 포함될 수 있다.
단말 장비(103, 104, 105)는 예를 들어, 디스플레이 스크린을 구비하고 웹 페이지 브라우징을 지원하는 각종 전자 장비일 수 있다. 이러한 전자 장비는 스마트 폰, 태블릿 PC, 랩탑 PC 및 데스크 탑 PC 등을 포함할 수 있는데, 이에 한정되지는 않는다. 상기 단말 장비(103, 104, 105)는 사용자의 조작에 응답하여 청구 정보를 생성하고, 서버(101)와의 인터액션을 통해 해당 청구 정보에 응답하는 추천 정보를 취득하여 사용자에게 표시할 수 있다.
예시적으로, 단말 장비(103, 104, 105)에는 예를 들어 텍스트 편집용 앱, 음성 편집용 앱, 영상 편집용 앱, 실시간 통신용 앱, 스마트 오피스 플랫폼 등(단지 예시일 뿐)과 같은 각종 클라이언트 앱이 설치될 수 있다.
서버(101)는 예를 들어 취득한 정보에 근거하여 지식 관리 시스템을 유지 보수할 수 있다. 여기서, 취득한 정보는 예를 들어 단말 장비(103, 104, 105)에 설치된 복수의 클라이언트 앱으로부터 취득한 텍스트 정보, 영상 정보 및/또는 음성 정보 등을 포함할 수 있다. 상기 지식 관리 시스템은 예를 들어 취득한 정보에 근거하여 지식 맵을 구축하고 유지 보수함으로써, 복수의 정보 상호간의 연관관계를 가시적인 구조로 형성하여, 정보 발굴 및 추천을 용이하게 할 수 있다.
예시적으로, 상기 서버(101)는 단말 장비(103, 104, 105)가 생성한 청구 정보를 취득한 것 에 응답하여, 자신이 구축하고 유지 보수하고 있는 지식 맵에 근거하여 사용자에게 추천할 추천 정보를 확정하고, 해당 추천 정보를 단말 장비(103, 104, 105)에 푸시하여, 사용자가 열람할 수 있도록 할 수 있다.
예시적으로, 상기 서버(101)는 예를 들어 기업이 설치한 지식 관리 서버로서, 기업 내부 직원이 업로드한 정보 및 온라인으로 업무를 수행할 때 생성한 정보를 관리하고 유지 보수 할수 있다. 지식 맵은 취득한 정보에 근거하여 구축할 수 있을 뿐만아니라, 취득한 정보의 출처에 근거하여 구축할 수 도 있다. 여기서, 취득한 정보의 출처로는, 정보를 업로드한 사용자 정보, 정보를 생성한 작성자 및/또는 팀 등 정보가 포함될 수 있다. 지식 맵에 기초하여 추천 정보를 확정할 때, 기업 내부 직원 요소와 지식 사이의 연관관계를 발굴함으로써, 기업의 지식에 대한 생성 및 응용의 효율을 향상시킬 수 있다. 여기서, 서버가 관리하고 유지 보수하는 정보에는, 예를 들어, WiKi시스템으로부터 취득한 정보, 온라인 미팅 시 생성한 음성 및/또는 텍스트 정보, 온라인 오피스 플랫폼을 통해 전송한 파일, 온라인 오피스 플랫폼을 통해 생성된 채팅 정보 등을 포함하는 정보(106)를 포함할 수 있다.
지적해두어야 할 것은, 본 개시의 실시예에 의해 제공되는 정보 추천 방법은 일반적으로 서버(101)에 의해 실행될 수 있다. 이에 대응하여, 본 개시의 실시예에 의해 제공되는 정보 추천 장치는 일반적으로 서버(101)에 설치 될 수 있다.
지적해 두어야 할 것은, 도 1에 도시된 단말 장비, 네트워크 및 서버의 수와 유형은 단지 예시일 뿐이다. 실제 수요에 따라, 임의의 수 및 유형의 단말 장비, 네트워크 및 서버를 구비할 수 있다.
이하, 도 1의 응용장면에 기초하여, 도 2~도 9를 참조하면서 본 개시의 실시예의 정보 추천 방법을 상세히 설명한다.
도 2는 본 개시의 실시예에 따른 정보 추천 방법의 흐름도를 예시적으로 도시하고 있다.
도 2에 도시된 바와 같이, 본 실시예의 정보 추천 방법(200)은 동작(S210)~동작(S240)을 포함할 수 있다.
동작(S210)에서는, 청구 정보를 취득한다.
본 개시의 실시예에 따르면, 청구 정보는 예를 들어, 단말 장비가사용자의 조작에 응답하여 생성된 것일 수 있다. 단말 장비는 청구 정보를 생성한 후, 해당 청구 정보를 서버로 송신하여, 서버에 정보를 추천할 것을 청구한다.
예시적으로, 사용자의 조작은 예를 들어 사용자가 입력 장치를 통해 검색 문구를 입력하는 조작일 수 있다. 또는, 사용자의 조작은 사용자가 단말 장비에 음성 명령을 보내는 조작 등 일수 도 있다. 단말 장비가 생성한 청구 정보는 검색 문구 또는 음성 명령을 지시할 수 있고, 또한 서버가 식별가능한 정보이다. 예를 들어, 청구 정보는 예를 들어 query(검색) 문구일 수 있다.
동작(S220)에서는, 청구 정보로부터 실체를 나타내는 청구 실체 단어를 추출한다.
본 개시의 실시예에 따르면, 동작(S220)은 예를 들어 우선 청구 정보에 대해 단어 분류 처리를 진행하여, 청구 정보를 지시하는 단어 계열을 얻을 수 있다. 그 다음, 단어 계열중의 단어에 대해 실체 식별을 진행하여, 실체를 나타내는 단어를 추출하고, 청구 실체 단어를 취득한다. 예시적으로, 청구 실체 단어는 예를 들어 청구 정보중의 정보요소일 수 있는데, 예를 들어 성명, 조직/기관 명칭, 물체 명칭, 프로젝트 명칭 등과 같은 정보요소일 수 있다.
예시적으로, 상기 동작(S220)은 예를 들어 사전에 트레이닝된 머신 러닝 모델을 통해 청구 실체 단어를 추출할 수 있다. 머신 러닝 모델은 예를 들어 LSTM(Long Short-Term Memory) 등을 포함할 수 있다.
예시적으로, 상기 동작(S220)은 예를 들어 단어 계열중의 각 단어를 실체 단어 데이터 베이스중의 단어와 비교함으로써, 단어 계열에 포함되어 있는 복수의 단어로부터 실체 단어에 속하는 단어를 선별하여 얻을 수 있고, 이렇게 선별하여 얻은 단어가 바로 실체의 청구 실체 단어이다.
동작(S230)에서는, 청구 실체 단어 및 사전에 구축한 지식 맵에 근거하여 추천 정보를 확정한다.
본 개시의 실시예에 따르면, 지식 맵은 대량의 텍스트에 기초하여 구축된 것이다. 예를 들어, 지식 맵은 텍스트로부터 추출된 실체 단어와 실체 단어가 나타내는 실체 사이의 연관관계에 근거하여 구성된 것일 수 있다. 지식 맵에는 복수의 노드 및 노드를 연결하는 복수의 에지가 있다. 각 노드는 하나의 실체 단어를 상대로 한다. 즉, 각 노드는 하나의 실체를 나타낼 수 있다. 각 에지는 해당 에지에 의해 연결되는 2개의 노드가 각각 나타내는 2개의 실체 사이에 연관관계가 있음을 의미한다.
예시적으로, 취득 청구에 응답하여, 사용자에게 보다 풍부한 정보를 제공하기 위해, 지식 맵이 포함하는 복수의 노드는 예를 들어 텍스트의 출처를 나타내는 제1 단어를 포함할 수 있다. 제1 단어에는 예를 들어 텍스트의 작성자 성명, 텍스트를 생성한 팀 명칭, 조직명칭 등이 포함될 수 있다. 청구 실체 단어에 "Java"가 포함되어 있을 경우, 지식 맵에 근거하여 확정한 추천 정보는 예를 들어 기업내의 Java언어에 능숙한 전문가, 팀 등을 포함할 수 있다.
본 개시의 실시예에 따르면, 동작(S230)은 예를 들어 우선 지식 맵에서 청구 실체 단어를 나타내는 노드를 확정할 수 있다. 그 다음, 확정된 노드의 지식 맵에서의 위치에 근거하여, 청구 실체 단어가 나타내는 실체와 연관관계가 있는 실체를 확정할 수 있다. 마지막으로, 연관관계가 있는 해당 실체에 근거하여 추천 정보를 생성할 수 있다.
본 개시의 실시예에 따르면, 서버에는 예를 들어 텍스트 데이트베이스가 구축되어 있을 수도 있는데, 상기 텍스트 데이트 베이스에는 단말 장비가 업로드한 복수의 텍스트가 포함될 수 있다. 동작(S230)에서는, 예를 들어 우선 청구 실체 단어에 근거하여, 텍스트 데이트 베이스로부터 청구 실체 단어에 매칭되는 텍스트를 취득할 수도 있다. 그 다음, 지식 맵에서 청구 실체 단어와 연관관계가 있는 실체를 확정할 수 도 있다. 마지막으로, 텍스트 데이트 베이스로부터 취득한 텍스트 및 연관관계가 있는 실체 단어에 근거하여 추천 정보를 생성할 수 있다.
예시적으로, 지식 맵은 예를 들어 도 3a에 도시된 흐름을 통해 구축될 수 있고, 동작(S230)은 도 4a에 도시된 흐름을 통해 실현 될수 있는 바, 여기서는 상세히 설명하지 않는다.
동작(S240)에서는, 추천 정보를 푸시한다. 해당 동작은, 생성된 추천 정보를 단말 장비에 푸시함으로써, 단말 장비가 추천 정보를 사용자에게 표시하도록 할 수 있다.
상기 설명으로부터 알 수 있다 시피, 본 개시의 실시예는, 정보를 추천할 때, 텍스트의 출처를 지시하는 지식 맵에 기초하여 추천 정보를 확정함으로써, 사용자에게 청구 정보에 대한 출처 정보, 예를 들어, 해당 분야의 전문가 또는 팀 등을 추천할 수 있다. 따라서, 해당 정보 추천이 기업 팀워크 및 프로젝트 관리에 깊이 관여하도록 할 수 있으므로, 사용자를 위해 보다 전면적이고 보다 정확한 정보를 추천할 수 있다.
지식 맵에 근거하여 용이하게 정보를 추천하기 위해, 본 실시예의 정보 추천 방법은 동작(S210)전에 실행되는 텍스트에 기초하여 지식 맵을 구축하는 동작을 포함할 수도 있다.
도 3a는 본 개시의 실시예에 따른 텍스트에 기초하여 지식 맵을 구축하는 흐름도를 예시적으로 도시하고 있다. 도 3b는 본 개시의 실시예에 따른 지식 맵을 구축하기 위한 텍스트의 취득 흐름을 예시적으로 도시하고 있다.
도 3a에 도시된 바와 같이, 텍스트에 기초하여 지식 맵을 구축하는 동작(S350)은 예를 들어, 동작(S351)~동작(S352)을 포함할 수 있다.
동작(S351)에서는, 텍스트로부터 실체를 나타내는 복수의 실체 단어 및 복수의 실체 단어 사이의 연관관계를 추출한다.
본 개시의 실시예에 따르면, 구축한 지식 맵이 보다 많은 지식을 커버하도록 하기 위해, 실체 단어와 실체 단어 사이의 연관관계를 추출하기 위한 텍스트는 예를 들어 분산된 복수의 경로로부터 취득한 복수의 텍스트를 포함할 수 있다. 상기 동작(S351)은 복수의 텍스트 중의 각 텍스트에 대해 실체 단어와 연관관계를 추출한다. 복수의 텍스트 중의 각 텍스트로부터 실체 단어 및 연관관계를 추출한 후, 복수의 텍스트로부터 추출한 실체 단어 및 연관관계에 대해 통계를 진행하여, 지식 맵을 구축하기 위한 복수의 실체 단어 및 복수의 실체 단어 사이의 연관관계를 얻을 수 있다.
예시적으로, 도 3b에 도시된 바와 같이, 복수의 텍스트는 예를 들어 온라인 정보(301), 오프 라인 정보(302), 비가시적 정보(303), 결여(缺如) 정보(304)에 근거하여 생성된 온라인 텍스트(305)일 수 있다.
예시적으로, 지식 맵이 기업을 상대로 한 지식 맵일 경우, 온라인 정보(301)는 예를 들어 하기와 같은 방식을 통해 얻을 수 있다. 즉, 기업내의 지식 소스를 정리 및 조사하여 기업내의 온라인 정보를 수집하여 얻을 수 있다. 지식 소스는 예를 들어, 온라인 뉴스 공지, 온라인 문서, 온라인 회의기록, 온라인 VCR, 온라인 프로젝트 소개, 온라인 채팅 내용 등을 포함할 수 있다.
예시적으로, 오프 라인 정보(302)는 직원의 업무용 장비에 저장된 미처 업로드 되지 않은 정보를 포함할 수 있다. 상기 오프 라인 정보(302)는 업로드하도록 직원을 독촉함으로써 정보의 온라인화 처리를 실현하여(동작(S311)), 오프 라인 정보를 온라인 정보로 전환시킬 수 있다.
예시적으로, 비가시적 정보(303)는 예를 들어 직원들의 아직 문서화되지 않은 업무경험 등을 포함할 수 있다. 해당 비가시적 정보는 예를 들어 격려하는 방식을 통해 직원들이 이를 문서화하도록 격려할 수 있다(동작(S312)). 즉, 직원들이 업무 경험을 기록하고 기록한 업무경험을 전자파일화하도록 독려할 수 있다. 문서화된 비가시적 정보는 온라인화 처리(동작(S311))를 통해, 온라인 정보로 전환시킬 수 있다.
예시적으로, 결여 정보(304)는 예를 들어 기업 내부에 해당 정보가 없으므로 외부로부터 도입이 필요한 정보를 포함할 수 있다. 결여 정보(304)는 예를 들어 외부 캡쳐, 맞춤형 도입 등 방식을 통해 기업 외부로부터 기업내에 도입할 수 있다. 예를 들어, 공개적인 지식 플랫폼(포럼, 논문사이트, 특허 사이트 등)이 제공하는 인터페이스를 통해 결여된 정보를 기업 내부의 서버에 도입할 수 있다. 또는, 결여 정보는 운영생산(동작(S313))의 방식을 통해 직원의 창작을 고무 및 격려함으로써 얻을 수도 있다. 창작을 통해 얻은 정보는 우선 문서화처리를 거쳐야 하고(동작(S312)), 다시 온라인화 처리를 거쳐(동작(S311)), 온라인 정보로 전환된다.
오프 라인 정보(302), 비가시적 정보(303), 결여 정보(304)를 모두 온라인 정보로 전환시킨 후, 지식 소스에 대한 정리 및 조사를 통해 얻은 온라인 정보(301)와 전환을 통해 얻은 온라인 정보를 모두 텍스트화함으로써, 복수의 온라인 텍스트(305)를 얻을 수 있다.
본 개시의 실시예에 따르면, 구축된 지식 맵이 보다 많은 지식을 커버하도록 함과 동시에, 지식 맵의 구축 효율을 향상시키기 위해, 본 실시예는 복수의 온라인 텍스트(305)를 얻은 후 복수의 온라인 텍스트(305)를 선별함으로써 가치가 높은 온라인 텍스트를 얻을 수 있다.
예시적으로, 도 3b에 도시된 바와 같이, 온라인 텍스트(305)를 얻은 후, 복수의 온라인 텍스트에 대해 지식성 선별(동작(S314)) 및 내용 품질 선별(동작(S315))을 진행할 수 있다. 지식성 선별은 예를 들어 선별을 통해 지식성이 강한 텍스트를 얻을 수 있다. 내용 품질 선별은 예를 들어 선별을 통해 내용 품질이 높은 텍스트를 얻을 수 있다. 내용 품질 선별은 예를 들어 지식성 선별을 통해 얻은 텍스트에 대한 2차 선별일 수도 있다. 또는, 지식성 선별은 내용 품질 선별을 통해 얻은 텍스트에 대한 2차 선별일 수도 있다.
지식성 선별은 예를 들어 온라인 텍스트를 식별하고 이해함으로써 이루어질 수 있다. 예를 들어, 우선, 복수의 온라인 텍스트에 대해 텍스트 식별 및 텍스트 이해를 진행하여, 복수의 온라인 텍스트 중 각 온라인 텍스트가 표현하는 내용의 카테고리를 확정할 수 있다. 텍스트가 직원의 능력제고에 도움이 되는 텍스트 카테고리(예를 들어, 전문 지식 카테고리 등)일 경우, 텍스트의 지식성은 강하다. 텍스트가 직원의 능력제고에 도움이 되지 않는 텍스트 카테고리(예를 들어, 스캔들 카테고리 등)일 경우, 텍스트의 지식성은 약하다.
내용 품질 선별은 텍스트에 포함된 단어를 분류한 후 진행할 수 있다. 예를 들어, 텍스트에 포함된 민감어, 금지어 등 단어가 많을 경우, 텍스트의 내용 품질은 비교적 낮다. 텍스트에 민감어, 금지어가 포함되어 있지 않을 경우, 텍스트의 품질은 비교적 높다.
본 개시의 실시예에 따르면, 동작(S351)은 예를 들어 우선 동작(S220)과 유사한 방법을 사용하여 각 텍스트로부터 실체를 나타내는 실체 단어를 추출하여 얻을 수 있다. 그 다음, 텍스트로부터 2개의 실체 단어가 각각 나타내는 2개의 실체 사이의 문구 의미 관계를 추출하여, 해당 문구 의미 관계를 2개의 실체 단어 사이의 연관관계로 한다.
본 개시의 실시예에 따르면, 구축된 지식 맵이 텍스트의 출처를 나타내는 제1 단어를 지시할 경우, 텍스트로부터 추출한 실체 단어는 텍스트의 출처를 나타내는 제1 단어를 포함하여야 한다. 텍스트에 텍스트의 출처 정보가 포함되어 있지 않을 경우, 텍스트로부터 실체 단어를 추출하는 외에, 예를 들어, 텍스트의 속성 정보로부터 실체 단어를 추출할 수도 있다. 텍스트의 속성 정보에는 예를 들어, 작성자 정보, 작성일자 정보 등이 포함될 수 있다.
예시적으로, 동작(S351)은 딥 러닝의 방법을 통해 각 텍스트로부터 복수의 실체 단어 및 복수의 실체 단어 사이의 연관관계를 추출해낼 수 있다. 딥 러닝의 방법은 예를 들어, 콘볼루션 신경망 모델을 사용하여 구현할 수 있다.
예시적으로, 동작(S351)은 사전에 정의된 템플릿을 통해 텍스트 중의 실체 단어를 추출할 수 있다. 사전에 정의된 템플릿은 실체 단어를 추출하는 규칙 등을 규정하였다.
동작(S352)에서는, 추출된 상기 복수의 실체 단어 및 복수의 실체 단어 사이의 연관관계에 근거하여, 지식 맵을 구축한다.
본 개시의 실시예에 따르면, 상기 동작(S352)은, 예를 들어 우선동작(S351)에서 추출된 복수의 실체 단어 중의 각 실체 단어에 대해 노드를 구축할 수 있다. 그 다음, 복수의 실체 단어 사이의 연관관계에 근거하여, 복수의 실체 단어 중 각 실체 단어와 연관관계를 가지는 연관 단어를 확정할 수 있다. 마지막으로, 각 실체 단어를 상대로 하는 노드와 연관 단어를 상대로 하는 노드를 연결하여, 각 실체 단어를 상대로 하는 노드에 연관되는 에지를 형성한다.
예시적으로, 실체 단어 "Java"에 대해, 복수의 실체 단어 중 "Java"와 연관관계를 가지는 연관 단어에 "JavaWeb", "Android", "왕**"가 포함될 경우, 상기 동작(S352)은 "Java"의 실체 단어를 상대로 하는 노드와 "JavaWeb"의 실체 단어를 상대로 하는 노드를 연결하고, "Java"의 실체 단어를 상대로 하는 노드와 "Android"의 실체 단어를 상대로 하는 노드를 연결하고, "Java"의 실체 단어를 상대로 하는 노드와 "왕**"의 실체 단어를 상대로 하는 노드를 연결하여, 실체 단어 "Java"를 상대로 하는 노드에 연관되는 3개의 에지를 형성할 수 있다. 여기서, "왕**"는 Java언어에 능숙한 전문가의 성명 또는 Android개발에 능숙한 전문가의 성명 등일 수 있다.
본 개시의 실시예에 따르면, 정보 추천 시 정보 추천의 정확성을 향상시키기 위해, 본 실시예는, 지식 맵을 구축할 때, 2개의 노드를 연결하는 각 에지에 가중치를 부여할 수 있다.
도 3c는 본 개시의 다른 실시예에 따른 텍스트에 기초하여 지식 맵을 구축하는 흐름도를 예시적으로 도시하고 있다.
도 3c에 도시된 바와 같이, 본 실시예에서 텍스트에 기초하여 지식 맵을 구축하는 동작(S350)은, 동작(S351)~동작(S352)외에, 동작(S353)~동작(S354)을 더 포함할 수 있다. 동작(S353)~동작(S354)은 동작(S352)후에 실행된다.
동작(S353)에서는, 각 실체 단어와 연관 단어 사이의 연관관계에 근거하여, 각 실체 단어와 연관 단어 사이의 연관 강도를 확정한다.
동작(S354)에서는, 연관 강도에 따라, 각 실체 단어를 상대로 하는 노드와 연관 단어를 상대로 하는 노드를 연결하는 에지에 가중치를 부여한다.
본 개시의 실시예에 따르면, 동작(S353)은, 예를 들어 각 실체 단어가 나타내는 실체와 연관 단어가 나타내는 실체 사이의 복수의 차원에서의 연관관계에 근거하여, 각 단어와 키워드 사이의 연관 강도를 확정할 수 있다. 각 실체 단어가 나타내는 실체와 연관 단어가 나타내는 실체가 많은 차원에서 연관관계를 가질 경우, 실체 단어와 연관 단어 사이의 연관 강도는 크다. 각 실체 단어가 나타내는 실체와 연관 단어가 나타내는 실체가 적은 차원에서 연관관계를 가질 경우, 실체 단어와 연관 단어 사이의 연관 강도는 작다. 여기서, 복수의 차원은 예를 들어 지역 차원, 시간 차원, 종류 차원, 색상 차원, 사용자 체험 차원 등을 포함할 수 있다.
예시적으로, 실체 단어 "사과"에 대해, 복수의 실체 단어 중 "사과"와 연관관계를 가지는 연관 단어에 "배", "귤"이 포함되어 있다고 가정한다. 사과와 배는 모두 과일이고, 모두 북방에서 재배되므로, 사과와 배는 2개의 차원에서 연관관계를 가진다. 사과와 귤은 모두 과일이지만, 사과는 북방에서 재배되고, 귤은 남방에서 재배되므로, 사과와 귤은 1개의 차원에서 연관관계를 가진다. 따라서, 실체 단어 "사과"와 실체 단어 "배" 사이의 연관 강도는 실체 단어 "사과"와 실체 단어 "귤" 사이의 연관 강도보다 크다.
본 개시의 실시예에 따르면, 상기 동작(S354)은 연관 강도가 큰 2개의 실체 단어가 상대로 하는 2개의 노드 사이의 에지에 비교적 큰 가중치를 부여하고, 연관 강도가 작은 2개의 실체 단어가 상대로 하는 2개의 노드 사이의 에지에 비교적 작은 가중치를 부여할 수 있다. 예를 들어, 실체 단어 "사과"를 상대로 하는 노드와 실체 단어 "배"를 상대로 하는 노드 사이의 에지에 부여되는 가중치는 제1가중치일 수 있고, 실체 단어 "사과"를 상대로 하는 노드와 실체 단어 "귤"을 상대로 하는 노드 사이의 에지에 부여되는 가중치는 제2가중치일수 있는데, 여기서, 제1 가중치는 제2 가중치보다 크다.
예시적으로, 2개의 노드 사이의 에지에 부여되는 가중치의 크기는 해당 2개의 노드가 상대로 하는 2개의 실체 단어 사이의 연관 강도의 크기에 비례할 수 있다.
본 개시의 실시예에서는, 2개의 노드를 연결하는 에지에 가중치를 부여함으로써, 청구 실체 단어 및 사전에 구축된 지식 맵에 근거하여 추천 정보를 확정할 때, 일단이 청구 실체 단어를 상대로 하는 노드에 연결된 에지의 가중치에 따라, 우선적으로 가중치가 큰 에지의 타단에 연결되는 노드가 상대로 하는 연관 단어에 근거하여 추천 정보를 확정함으로써, 확정한 추천 정보와 청구 정보의 매칭도를 높일 수 있고, 이를 통해 사용자 체험을 향상시킬 수 있다.
도 4a는 본 개시의 실시예에 따른 추천 정보를 확정하는 흐름도를 예시적으로 도시하고 있다. 도 4b는 본 개시의 실시예에 따른 지식 맵에 근거하여 추천 정보를 확정하는 원리를 예시적으로 도시하고 있다.
본 개시의 실시예에 따르면, 도 4a에 도시된 바와 같이, 지식 맵을 구축한 후, 추천 정보를 확정하는 동작(S230)은 동작(S431)~동작(S433)을 포함할 수 있다.
동작(S431)에서는, 지식 맵에서 청구 실체 단어를 상대로 하는 노드를 목표 노드로 확정한다.
본 개시의 실시예에 따르면, 청구 실체 단어와 지식 맵 중의 각 노드가 상대로 하는 실체 단어를 비교함으로써, 상대로 하는 실체 단어가 청구 실체 단어와 일치하는 노드를 목표 노드로 확정할 수 있다.
본 개시의 실시예에 따르면, 복수의 실체 단어가 동일한 실체를 나타내는 경우를 감안하여, 우선 청구 실체 단어와 지식 맵 중의 각 노드가 상대로 하는 실체 단어 사이의 제1 유사도를 산출하고, 청구 실체 단어와의 제1 유사도가 제1 유사도 한계치보다 큰 실체 단어에 대응되는 노드를 목표 노드로 확정할 수 도 있다. 여기서, 제1 유사도는 예를 들어 코사인 유사도, 자카드(Jacard) 유사계수 등 임의의 형태의 파라미터를 통해 구현할 수 있다. 제1 유사도 한계치는 실제 수요에 따라 설정할 수 있는데, 예를 들어, 일 실시예에 있어서, 상기 제1 유사도 한계치는 0.8일 수 있다.
동작(S432)에서는, 목표 노드에 연관되는 에지에 근거하여, 목표 노드에 연결되는 적어도 하나의 노드를 확정한다.
예시적으로, 도 4b에 도시된 바와 같이, 동작(S431)을 통해 확정된 목표 노드는 예를 들어 노드(401) 및 노드(402)를 포함할 수 있다. 노드(401) 및 노드(402)에 연관된 에지에 근거하여, 목표 노드에 연결되는 적어도 하나의 노드(도 4b에서 우측 상단의 그림자 영역의 노드)를 확정할 수 있는데, 여기서는 노드(403), 노드(404), 노드(405) 및 노드(406)가 포함된다. 지적해 두어야 할 것은, 4b에 도시된 지식 맵의 에지는 지향성을 가지므로, 목표 노드에 연결되는 적어도 하나의 노드를 확정할 때, 구체적으로는, 목표 노드에 연결되는 에지가 지향하는 노드를 적어도 하나의 노드로 할 수 있다. 실제 응용장면에 따라, 본 개시의 실시예의 지식 맵 중의 에지는 지향성을 가지지 않을 수도 있다.
동작(S433)에서는, 적어도 하나의 노드가 상대로 하는 실체 단어에 근거하여, 추천 정보를 확정한다.
본 개시의 실시예에 따르면, 동작(S432)을 통해 확정된 적어도 하나의 노드가 상대로 하는 실체 단어에 근거하여 직접 추천 정보를 생성할 수도 있다. 예를 들어, 적어도 하나의 노드가 상대로 하는 실체 단어 및 실체 단어가 나타내는 실체의 카테고리에 근거하여 추천 정보를 생성할 수 있다. 예시적으로, 청구 실체 단어 "Java"에 대해, 동작(S432)을 통해 확정된 적어도 하나의 노드가 상대로 하는 실체 단어에 "Android" 및 "왕**"가 포함될 경우, "Android"는 OS 시스템 카테고리에 속하고, "왕**"는 인물 카테고리에 속하므로, 확정된 추천 정보는 예를 들어 "Android OS 시스템의 개발에 적용"이라는 추천문구 및 "이 분야의 전문가로는 왕**가 있다"라는 추천문구를 포함할 수 있다.
본 개시의 실시예에 따르면, 추천 정보가 보다 풍부하도록, 적어도 하나의 노드가 상대로 하는 실체 단어에 근거하여 추천 정보를 확정할 때, 우선 적어도 하나의 노드에 근거하여 실체 단어를 확충한 후, 확충하여 얻은 실체 단어 및 적어도 하나의 노드가 상대로 하는 실체 단어에 근거하여 추천 정보를 생성할 수도 있다.
예시적으로, 도 4b에 도시된 바와 같이, 적어도 하나의 노드에 노드(403), 노드(404), 노드(405) 및 노드(406)가 포함 될 경우, 우선 적어도 하나의 노드에 연관되는 에지에 근거하여, 적어도 하나의 노드에 연결되는 노드를 확정하여, 1차적으로 실체 단어를 확충할 수 있다. 예를 들어, 적어도 하나의 노드에 연결되는 노드(도 4b에서 우측 하단의 그림자 영역의 노드)에는 노드(407), 노드(408) 및 노드(409)가 포함된다. 그 다음, 적어도 하나의 노드에 연결되는 노드가 상대로 하는 실체 단어 및 적어도 하나의 노드가 상대로 하는 실체 단어에 근거하여 추천 정보를 생성한다.
예시적으로, 도 4b에 도시된 바와 같이, 본 개시의 실시예에서는, 적어도 하나의 노드에 근거하여 실체 단어를 2차적으로 확충하거나 보다 많은 차수의 확충을 진행한 후, 확충후의 실체 단어에 근거하여 추천 정보를 생성할 수도 있다. 예를 들어, 확충하여 얻은 실체 단어에는 노드(407)~노드(409) 및 노드(410)~노드(411)가 상대로 하는 실체 단어가 포함된다. 마지막으로, 확충하여 얻은 실체 단어 및 적어도 하나의 노드가 상대로 하는 실체 단어에 근거하여 추천 정보를 생성한다.
본 개시의 실시예에 따르면, 지식 맵이 보다 풍부한 정보를 지시할 수 있도록 하기 위해, 본 개시의 실시예는, 증가량 데이터(incremental data)에 근거하여 지식 맵 중의 노드 및 에지를 보충할 수도 있다.
도 5는 본 개시의 실시예에 따른 지식 맵을 업데이트하는 흐름도를 예시적으로 도시하고 있다.
도 5에 도시된 바와 같이, 본 실시예의 정보 추천 방법(500)은 앞에서 설명한 동작(S210)~동작(S240) 및 동작(S350) 외에, 동작(S560)~동작(S580)을 더 포함함으로써, 지식 맵에 대한 업데이트를 실현할 수 있다.
동작(S560)에서는, 새로운 텍스트를 취득한 것에 응답하여, 새로운 텍스트로부터 실체를 나타내는 복수의 새로운 실체 단어 및 복수의 새로운 실체 단어 사이의 연관관계를 추출한다.
본 개시의 실시예에 따르면, 새로운 텍스트는 예를 들어 사전에서버에 지식 맵을 구축한 후 단말 장비가 실시간으로 업로드한 텍스트일 수 있다. 동작(S560)의 실현방법은 앞에서 도 3a에서 도시한 동작(S351)의 실현방법과 동일하거나 비슷하므로, 여기서는, 설명을 생략한다.
동작(S570)에서는, 지식 맵이 복수의 새로운 실체 단어 중의 각 새로운 실체 단어를 지시할 수 있는지 판단한다.
본 개시의 실시예에 따르면, 새로운 텍스트로부터 추출한 복수의 새로운 실체 단어를 각각 지식 맵 중의 각 노드가 상대로 하는 실체 단어와 비교하여, 지식 맵 중의 복수의 노드가 상대로 하는 복수의 실체 단어에 복수의 새로운 실체 단어 중의 각 새로운 실체 단어가 포함되어 있는지 확정할 수 있다. 복수의 노드가 상대로 하는 복수의 실체 단어에 복수의 새로운 실체 단어 중의 어느 새로운 실체 단어가 포함되어 있지 않다고 확정하였을 경우, 지식 맵이 해당 새로운 실체 단어를 지시하지 못한다고 확정한다.
지식 맵이 복수의 새로운 실체 단어 중의 각 새로운 실체 단어를 지시하지 못할 경우, 즉, 지식 맵이 복수의 새로운 실체 단어 중의 적어도 하나의 새로운 실체 단어를 지시하지 못할 경우, 동작(S580)을 실행하여, 복수의 새로운 실체 단어 및 복수의 새로운 실체 단어 사이의 연관관계에 근거하여, 지식 맵을 업데이트한다. 지식 맵이 복수의 새로운 실체 단어 중의 각 새로운 실체 단어를 지시할 수 있을 경우, 지식 맵을 업데이트하지 않고 동작을 종료한다.
예시적으로, 우선 적어도 하나의 새로운 실체 단어를 상대로 하는 노드를 구축한 후, 복수의 실체 단어 중 적어도 하나의 새로운 실체 단어 중의 각 새로운 실체 단어와 연관관계를 갖는 새로운 연관 단어를 확정한다. 마지막으로, 각 새로운 실체 단어를 상대로 하는 노드와 새로운 연관 단어를 상대로 하는 노드를 연결하여, 각 새로운 실체 단어를 상대로 하는 노드에 연관되는 에지를 형성한다. 이로써, 지식 맵의 업데이트를 완료한다.
예시적으로, 지식 맵이 복수의 새로운 실체 단어 중의 각 실체 단어를 지시할 수 있을 경우, 본 개시의 실시예는, 지식 맵 중의 에지에 근거하여, 지식 맵이 복수의 새로운 실체 단어 사이의 연관관계중의 각 연관관계를 지시할 수 있는지 확정할 수 있다. 지식 맵이 복수의 새로운 실체 단어 사이의 연관관계중의 일부 연관관계를 지시하지 못할 경우, 해당 일부 연관관계에 근거하여 지식 맵에 새로운 실체 단어를 상대로 하는 노드에 연관되는 에지를 추가한다. 예를 들어, 지식 맵이 새로운 실체 단어 "Python"과 "각본" 사이의 연관관계를 지시하지 못하지만, 지식 맵이 상기 2개의 새로운 실체 단어를 지시할 수 있다면, 지식 맵에 새로운 실체 단어 "Python"을 상대로 하는 노드와 새로운 실체 단어 "각본"을 상대로 하는 노드 사이의 에지를 추가함으로써, 지식 맵의 업데이트를 실현할 수 있다.
사용자에게 추천하는 정보를 보다 풍부하게 하고, 기업내의 지식에 대한 지능적 관리를 실현하기 위하여, 본 개시의 실시예는, 지식 맵을 구축하기 위한 텍스트를 분류하여 관리할 수 있다. 예시적으로, 본 개시의 실시예는, 사전에 복수의 정보 노드를 포함하는 키 정보 구조를 구축해둘 수 있다. 단말 장비가 업로드한 텍스트를 수신 한 후, 텍스트에 포함된 키 정보에 근거하여 텍스트를 키 정보 구조 중의 대응되는 정보 노드에 분류시킨다. 이로써, 사용자가 정보를 청구할 경우, 청구 정보중의 키 정보에 근거하여 키 정보 구조의 정보 노드를 분류하여 얻은 텍스트를 추천 정보로서 단말 장비에 피드백할 수 있다.
도 6a는 본 개시의 다른 실시예에 따른 정보 추천 방법의 흐름도를 예시적으로 도시하고 있다. 도 6b는 본 개시의 실시예에 따른 사전에 설정된 키 정보 구조의 개략도를 예시적으로 도시하고 있다.
도 6a에 도시된 바와 같이, 본 실시예의 정보 추천 방법(600)은 동작(S210)~동작(S240) 및 동작(S350) 외에, 예를 들어, 동작(S660)~동작(S670)을 포함할 수 있다. 예시적으로, 동작(S660)~동작(S670)은 예를 들어 동작(S220)과 동기적으로 실행하거나, 동작(S220)전 또는 동작(S220)후에 실행될 수 있는데, 본 개시는 이에 대해 한정하지 않는다.
동작(S660)에서는, 청구 정보로부터 키 정보를 추출한다.
본 개시의 실시예에 따르면, 예를 들어, query문구에 대해 키워드를 추출하여 키 정보를 얻을 수 있다. 키워드를 추출함에 있어서, TF-IDF(Term Frequency-Inverse Document Frequency)알고리즘, TextRank알고리즘, LSA(Latent Semantic Analysis,)알고리즘, LSI(Latent Semantic Index)알고리즘 등을 사용할 수 있다.
예시적으로, 본 개시의 실시예는 TextRank알고리즘을 사용하여 키 정보를 추출할 수 있다. 우선, 예를 들어 동작(S220)과 유사한 방식을 통해, 먼저 청구 정보에 대해 단어 분류 처리를 진행하여, 청구 정보를 지시하는 단어 계열을 얻을 수 있다. 그 다음, 단어 계열중의 각 단어에 대해 품사 표기 처리를 진행하고, 사용 정지 단어를 걸러내고, 예를 들어 명사, 동사 및 형용사 등 지정된 품사의 단어만 남겨둔다. 남겨둔 단어를 후보 키 정보로 한다. 그 다음, 후보 키 정보 맵G=(V, E)을 구축하는데, 여기서, V는 노드 집합으로서, 후보 키 정보로 구성된다. 그 다음, 2개의 후보 키 정보 사이의 호응 관계(Co-Occurrence)를 이용하여 노드 집합 중의 임의의 2개의 노드 사이의 에지를 구축한다. 그 다음, TextRank의 공식에 따라, 수렴될 때 까지 반복적으로 노드 집합 중의 각 노드의 가중치를 도입한다. 그 다음, 노드 집합중의 노드에 대해 가중치에 따라 역순으로 배열하여, 가장 중요한 몇개의 단어를 얻어, 텍스트로부터 추출한 키 정보로 한다.
동작(S670)에서는, 사전에 설정된 키 정보 구조 중 추출된 키 정보에 연관되는 정보 노드를 목표 정보 노드로 확정한다. 키 정보 구조는 복수의 정보 노드를 포함하고, 복수의 정보 노드 중의 각 정보 노드는 하나의 키 정보를 지시한다.
본 개시의 실시예에 따르면, 도 6b에 도시된 바와 같이, 키 정보 구조는 예를 들어 다층 구조일 수 있고, 각 층구조에는 적어도 하나의 정보 노드가 포함되며, 서로 다른 층에 위치한 정보 노드가 지시하는 키 정보는 서로 다른 입도(粒度)의 정보에 속한다. 예를 들어, 각 층구조의 정보 노드가 지시하는 키 정보의 입도는 굵은 것으로부터 가는 것으로의 순서로 배열된다. 예시적으로, 키 정보 구조는 3층구조일 수 있고, 최상층 구조에는 키 정보 "인공지능"을 지시하기 위한 정보 노드(601)가 포함된다. 제2 층구조에는 정보 노드(602) 및 정보 노드(603)이 포함되고, 이들 2개의 정보 노드는 각각 키 정보 "신경망" 및 "딥 러닝"을 지시한다. 제3 층구조에는 정보 노드(604), 정보 노드(605), 정보 노드(606) 및 정보 노드(607)가 포함되고, 이들 4개의 정보 노드는 각각 키 정보 "CNN(콘볼루션 신경망)", "RNN(순환 신경망)", "BM(Boltzmann Machines)" 및 "RBF(Radial Basis Function)"를 지시한다. 여기서, 정보 노드(604) 및 정보 노드(605)는 정보 노드(602)의 가는 입도의 분기 노드에 속하고, 정보 노드(606) 및 정보 노드(607)는 정보 노드(603)의 가는 입도의 분기 노드에 속한다. 상기 키 정보 구조 중의 각 정보 노드는 예를 들어 각 정보 노드에 분류된 텍스트를 저장하기 위한 하나의 저장공간에 대응될 수 있다.
본 개시의 실시예에 따르면, 예를 들어, 우선 추출된 키 정보와 키 정보 구조 중의 각 정보 노드가 지시하는 키 정보의 유사도를 확정하여, 유사도가 높은 키 정보를 지시하는 정보 노드를 목표 정보 노드로 확정할 수 있다.
예시적으로, 동작(S670)은 예를 들어 후술하는 도 7 또는 도 8에 도시된 흐름을 통해 실현할 수 있는데, 여기서는 설명을 생략한다.
상기 목표 정보 노드를 확정한 것에 기초하여, 앞에서 설명한 추천 정보를 확정하는 동작(S240)은 예를 들어 도 6a에 도시된 동작(S640)을 통해 실현될 수 있다. 동작(S640)에서는, 청구 실체 단어, 사전에 구축된 지식 맵 및 목표 정보 노드에 근거하여, 추천 정보를 확정한다.
본 개시의 실시예에 따르면, 상기 동작(S640)은 예를 들어 청구 실체 단어 및 사전에 구축된 지식 맵에 근거하여 도 6a에 도시된 흐름에 따라 추천 정보를 확정할 수 있을 뿐만 아니라, 목표 정보 노드에 근거하여 추천 텍스트를 확정하고, 추천 텍스트를 추천 정보로 할 수도 있다.
예시적으로, 목표 정보 노드에 근거하여 추천 텍스트를 확정하는 것은, 목표 정보 노드에 분류된 텍스트를 취득하고, 취득한 텍스트를 추천 정보로 하는 것을 포함할 수 있다.
본 개시의 실시예에 따르면, 사용자에게 텍스트를 용이하게 추천하기 위해, 본 개시의 실시예에 따른 정보 추천 방법은 예를 들어, 텍스트에 기초하여 지식 맵을 구축할 때, 텍스트를 키 정보 구조에 포함되는 정보 노드에 분류시킬 수 있다. 이를 통해, 정보 노드에 근거하여 용이하게 사용자에게 텍스트를 추천할 수 있는 동시에, 텍스트를 분류하여 관리할 수 있다. 앞에서 설명한 동작(S351)을 통해 추출한 복수의 실체 단어 중에는 예를 들어 텍스트의 키 정보를 나타내기 위한 제2 단어가 포함될 수 있고, 제2 단어는 예를 들어 동작(S660)과 유사한 방법을 통해 텍스트로부터 추출하여 얻은 키워드일 수 있다.
도 7은 본 개시의 실시예에 따른 텍스트를 키 정보 구조에 포함되어 있는 정보 노드에 분류시키는 흐름도를 예시적으로 도시하고 있다.
도 7에 도시된 바와 같이, 텍스트를 키 정보 구조에 포함되어 있는 정보 노드에 분류시키는 동작(S780)은 예를 들어 동작(S781)~동작(S782)을 포함할 수 있다.
동작(S781)에서는, 제2 단어에 근거하여, 텍스트와 키 정보 구조 중 각 정보 노드 사이의 매칭 관계를 확정한다. 동작(S782)에서는, 텍스트를 텍스트에 매칭되는 정보 노드에 분류시킨다.
본 개시의 실시예에 따르면, 복수의 실체 단어 중의 제2 단어와 각 정보 노드가 지시하는 키 정보 사이의 유사관계에 근거하여, 텍스트와 각 정보 노드 사이의 매칭 관계를 확정할 수 있다. 매칭 관계에 근거하여 텍스트에 매칭되는 정보 노드를 확정하고, 텍스트를 매칭되는 정보 노드에 대응되는 저장공간에 저장한다.
예시적으로, 동작(S781)은 예를 들어 후술하는 도 8에 도시된 흐름 또는 도 9에 도시된 흐름을 통해 실현할 수 있는데, 여기서는 상세한 설명을 생략한다.
본 개시의 실시예에 따르면, 앞에서 설명한 지식 맵과 유사하게, 사전에 설정한 키 정보 구조는 예를 들어 증가량 데이터에 근거하여 보충할 수도 있다. 예를 들어, 본 실시예의 정보 추천 방법은, 새로운 텍스트를 취득한 것에 응답하여, 우선 새로운 텍스트로부터 새로운 텍스트의 키 정보를 추출하는 동작을 실행하고, 추출된 키워드를 새로운 키 정보로 할 수 있다. 이 동작의 실현방식은 앞에서 설명한 동작(S660)의 실현방식과 유사하므로, 여기서는 설명을 생략한다. 새로운 키 정보를 추출한 후, 키 정보 구조에 상기 새로운 키 정보를 지시하는 정보 노드가 포함되어 있는지 판단한다. 포함되어 있지 않을 경우, 새로운 키 정보에 근거하여 키 정보 구조를 업데이트한다.
예시적으로, 새로운 키 정보와 키 정보 구조 중의 복수의 정보 노드가 지시하는 키 정보의 연관관계에 근거하여, 새로운 키 정보를 상대로 하는 정보 노드를 추가할 수 있다. 예를 들어, 새로운 키 정보가 "LSTM"일 경우, 새로운 키 정보 "LSTM"와 도 6b에서 정보 노드(605)가 지시하는 키 정보 "RNN"의 종속관계에 근거하여, 정보 노드(605)의 하위층구조에 정보 노드(605)에 속하는 분기 노드를 추가하여, "LSTM"를 상대로 하는 정보 노드로 한다.
도 8은 본 개시의 실시예에 따른 텍스트와 키 정보 구조 중 각 정보 노드 사이의 매칭 관계를 확정하는 흐름도를 예시적으로 도시하고 있다.
도 8에 도시된 바와 같이, 일 실시예에 있어서, 텍스트와 키 정보 구조 중 각 정보 노드 사이의 매칭 관계를 확정하는 동작(S781)은 동작(S8811)로부터 시작하는 동작(S8811)~동작(S8812)을 포함할 수 있다.
동작(S8811)에서는, 제2 단어에 각 정보 노드가 지시하는 키 정보와 동일한 목표 단어가 포함되어 있는지 판단한다.
본 개시의 실시예에 따르면, 제2 단어와 키 정보 구조 중의 각 정보 노드가 지시하는 키 정보를 비교하여, 제2 단어가 키 정보와 일치하면, 제2 단어를 목표 단어로 확정할 수 있다.
예시적으로, 텍스트로부터 추출한 실체 단어는 예를 들어 복수의 제2 단어를 포함할 수 있고, 본 실시예에서는, 복수의 제2 단어 중의 각 제2 단어를 키 정보 구조 중의 각 정보 노드가 지시하는 키 정보와 비교함으로써, 제2 단어에 목표 단어가 포함되어 있는지 확정할 수 있다.
제2 단어에 목표 단어가 포함되어 있을 경우, 동작(S8812)을 실행하여, 텍스트와 각 정보 노드 사이의 매칭 관계가 매칭된다고 확정한다.
서로 다른 응용장면에서 동일한 단어의 표한방식이 다를 수 있음을 감안하여, 키 정보 구조에 포함된 정보 노드가 지시하는 단어의 표현방식이 제2 단어의 표현방식과 다름으로 인해 텍스트와 정보 노드의 매칭 관계를 정확하게 확정할 수 없는 것을 방지하기 위해, 본 실시예의 텍스트와 키 정보 구조 중 각 정보 노드 사이의 매칭 관계를 확정하는 동작은, 동작(S8811)~동작(S8812) 외에 동작(S8813)~동작(S8815)을 더 포함할 수 있다. 이에 대응하여, 지식 맵에는 예를 들어 동일한 단어를 상대로 하는 서로 다른 표현방식의 노드를 구비할 수 있다. 예시적으로, 지식 맵 중의 노드는 실체 "CNN"를 상대로 하는 노드를 포함할 뿐만 아니라, 실체 "콘볼루션 신경망"을 상대로 하는 노드도 포함한다.
제2 단어에 목표 단어가 포함되어 있지 않을 경우, 동작(S8813)을 실행하여, 지식 맵으로부터 제2 단어의 연관 단어를 취득한다. 예시적으로, 우선 지식 맵에서 제2 단어를 지시하기 위한 노드를 확정할 수 있다. 그 다음, 제2 단어를 지시하는 노드에 연관되는 에지에 근거하여 제2 단어의 연관 단어를 확정한다. 예를 들어, 연관되는 에지가 연결하는 노드가 지시하는 실체 단어를 연관 단어로 한다.
동작(S8814)에서는, 제2 단어의 연관 단어에 목표 단어가 포함되어 있는지 판단한다. 동작(S8814)의 실현방법은 동작(S8811)의 실현방법과 비슷하므로, 여기서는, 설명을 생략한다.
제2 단어의 연관 단어에 목표 단어가 포함되어 있을 경우, 동작(S8812)을 실핼하고, 텍스트와 각 정보 노드 사이의 매칭 관계가 매칭된다고 확정한다.
제2 단어의 연관 단어에 목표 단어가 포함되어 있지 않을 경우, 동작(S8815)을 실행하고, 텍스트와 각 정보 노드 사이의 매칭 관계가 매칭되지 않는다고 확정한다.
본 개시의 실시예에 따르면, 텍스트와 정보 노드의 매칭 관계를 확정할 때, 지식 맵에 기초하여 텍스트 중의 제2 단어의 연관 단어를 취득함으로써, 매칭 시 사용한 단어가 보다 전면적으로 텍스트의 내용을 반영할 수 있도록 하여, 텍스트와 정보 노드의 매칭 관계를 확정함에 있어서의 정확성을 높일 수 있다.
도 9는 본 개시의 다른 실시예에 따른 텍스트와 키 정보 구조 중 각 정보 노드 사이의 매칭 관계를 확정하는 흐름도를 예시적으로 도시하고 있다.
도 9에 도시된 바와 같이, 다른 실시예에 있어서, 텍스트와 키 정보 구조 중 각 정보 노드 사이의 매칭 관계를 확정하는 동작(S781)은 동작(S9811)~동작(S9814)을 포함할 수 있다.
동작(S9811)에서는, 제2 단어와 각 정보 노드가 지시하는 키 정보 사이의 유사도를 확정한다.
본 개시의 실시예에 따르면, 상기 동작은 예를 들어 제2 단어와 각 정보 노드가 지시하는 키 정보 사이의 코사인 유사도, 자카드(Jacard) 유사계수를 산출함으로써, 양자 간의 유사도를 얻을 수 있다. 예시적으로, 제2 단어가 복수 개 있을 경우, 상기 동작(S9811)에서는, 각 제2 단어와 각 정보 노드가 지시하는 키 정보 사이의 유사도를 확정하여, 복수 개의 유사도를 얻는다.
동작(S9812)에서는, 유사도가 유사도 한계치보다 큰지 판단한다. 여기서, 유사도 한계치는 예를 들어 실제 수요에 따라 설정할 수 있는 바, 본 개시는 이에 대해 한정하지 않는다. 예시적으로, 해당 유사도 한계치는 0.9일 수 있다.
유사도가 유사도 한계치보다 클 경우, 동작(S9813)을 실행하고, 텍스트와 각 정보 노드 사이의 매칭 관계가 매칭된다고 확정한다. 유사도가 유사도 한계치보다 크지 않을 경우, 동작(S9814)을 실행하고, 텍스트와 각 정보 노드 사이의 매칭 관계가 매칭되지 않는다고 확정한다.
예시적으로, 제2 단어가 복수 개일 경우, 상기 동작(S9812)에서는, 복수 개의 유사도에 유사도 한계치보다 큰 유사도가 포함되어 있는지 판단할 수 있다. 포함되어 있으면, 동작(S9813)을 실행하고, 포함되어 있지 않으면, 동작(S9814)을 실행한다.
앞에서 설명한 흐름을 통해, 본 개시의 실시예는, 우선 텍스트로부터 키워드를 추출한 후, 키워드에 근거하여 키 정보 구조 중의 매칭되는 정보 노드를 확정할 수 있다. 마지막으로, 텍스트를 매칭되는 정보 노드에 대응되는 저장공간에 저장할 수 있다. 텍스트로부터 복수의 키워드를 추출해냈을 경우, 키 정보 구조로부터 복수의 매칭되는 정보 노드를 얻을 수 있다. 이 경우, 텍스트를 여러 몫으로 카피(copy)하여, 복수의 매칭되는 정보 노드에 대응되는 저장공간에 저장할 수 있다.
예시적으로, 저장공간을 과도하게 차지하는 것을 방지하기 위해, 각 정보 노드를 위해 하나의 텍스트 리스트를 유지할 수 있다. 상기 텍스트 리스트에는 해당 정보 노드에 분류할 수 있는 텍스트의 타이틀 등이 포함될 수 있다. 추천 정보를 확정한 후 단말 장비로 텍스트를 푸시할 때, 정보 노드의 텍스트 리스트에 근거하여 텍스트를 취득할 수 있다.
본 개시의 실시예에 의해 제공되는 정보 추천 방법은 다양한 응용장면에 응용될 수 있음을 이해할 수 있을 것이다. 예를 들어, 상기 정보 추천 방법은, 지식을 검색하는 응용장면, 지식 문답을 진행하는 응용장면, 및 주동적으로 정보를 추천하는 응용장면 중 적어도 하나의 응용장면에 응용될 수 있다.
도 10은 본 개시의 실시예에 따른 정보 추천 방법을 실현하기 위한 시스템 구성도를 예시적으로 도시하고 있다.
도 10에 도시된 바와 같이, 본 실시예의 정보 추천 방법을 실현하기 위한 시스템 구조(1000)는, 예를 들어, 지식 전처리 모듈(1010), 지식 맵 구축 모듈(1020), 지식 서비스 모듈(1030) 및 지식 응용 모듈(1040)을 포함할 수 있다.
지식 전처리 모듈은, 예를 들어, 우선 앞에서 설명한 도 3b에 도시된 흐름을 통해 지식으로서의 정보를 수집함으로써, 각종 정보가 온라인 지식을 형성하도록 할 수 있다. 그 다음, 형성된 온라인 지식에 대해 지식 선별을 진행하여 지식성이 강하고, 내용 품질이 높은 온라인 지식만 남겨둔다.
지식 맵 구축 모듈(1020)은, 예를 들어, 도 3a에 도시된 흐름을 실행함으로써 지식 맵을 구축할 수 있다. 예를 들어, 우선 지식 전처리 모듈(1010)을 통해 얻은 지식을 발굴할 수 있다. 지식 발굴을 통해, 예를 들어, 온라인 지식의 각종 변형을 얻을 수 있다. 예시적으로, 온라인 지식이 중국어로 표현된 지식일 경우, 지식 발굴을 통해 예를 들어 영어로 표현된 지식을 얻을 수 있다. 지식 발굴을 진행한 후, 온라인 지식 및 발굴하여 얻은 지식에 대해 실체 발굴을 진행한다. 즉, 지식으로부터 복수의 실체 단어 및 복수의 실체 단어 사이의 연관관계를 추출한다. 마지막으로, 실체 발굴을 통해 얻은 정보를 도면화하여 지식 맵을 얻는다. 도면화 과정은 예를 들어 앞에서 설명한 동작(S352)을 통해 실현할 수 있다.
예시적으로, 지식 맵 구축 모듈(1020)은 예를 들어 지식 분류 체계를 구축함으로써, 지식의 분류를 실현할 수도 있다. 예를 들어, 지식 맵 구축 모듈(1020)은 도 7에 도시된 흐름을 통해 지식으로서의 텍스트를 분류하여, 지식 분류 체계의 구축을 완성할 수 있다.
지식 서비스 모듈(1030)은, 예를 들어 우선 지식 맵에 기초하여, 사용자에게 추천할 지식중의 지식요소를 생성할 수 있다. 생성된 지식요소에는 앞에서 설명한 도 4a에 도시된 흐름을 통해 얻은 실체 단어가 포함될 수 있다. 그 다음, 생성된 지식 요소를 집합시킬 수 있는데, 예를 들어, 앞에서 설명한 동작(S433)을 통해 지식을 집합시킬 수 있다. 이와 동시에, 지식 서비스 모듈(1030)은, 지식 분류 체계로부터 지식을 검색할 수도 있는데, 지식에 대한 검색은 예를 들어 도 6a에 도시된 흐름을 통해 완성될 수 있고, 검색을 통해 목표 정보 노드에 분류되는 텍스트를 얻을 수 있다. 지적해 두어야 할 것은, 지식 검색과정에 있어서, 지식 분류 체계로부터 텍스트를 얻을 수 없다면, 지식 추리를 진행한 후 다시 지식을 검색할 수도 있다. 지식 추리는 예를 들어 도 8에 도시된 동작(S8813)을 통해 완성될 수 있다.
지식 서비스 모듈(1030)의 기능에 기초하여, 지식 응용 모듈(1040)은 단말 장비를 통해 사용자에게 "지식 포털"기능 모듈, "지식 검색"기능 모듈, "지식 문답"기능 모듈 및 "장면화 추천"기능 모듈을 제공할 수 있다. 여기서, "지식 포털"기능 모듈을 통해, 사용자는 예를 들어 지식의 업로드 및 다운로드 등을 완성할 수 있다. "지식 검색"기능 모듈을 통해, 사용자는 예를 들어 검색 문구를 입력하여, 지식 맵 및 지식 분류 체계로부터 파악하고 싶은 지식을 검색할 수 있다. "지식 문답"기능 모듈을 통해, 사용자는 예를 들어 질문 문구를 입력하여 지식 맵 및 지식 분류 체계로부터 질문을 해답할 수 있는 지식을 얻을 수 있다. "장면화 추천"기능 모듈을 통해, 단말 장비는 예를 들어 사용자의 취향에 따라 사용자에게 적합한 지식을 사용자에게 추천할 수 있다.
상기로부터 알 수 있는 것과 같이, 본 개시의 실시예는 정보 추천 방법을 실행하기에 적합한 시스템 구조를 구축함으로써, 기업의 지식 지능화 관리 및 응용을 위해 완벽한 솔루션을 제공할 수 있고, 기업내의 분산되고 파편화된 문서에 대해 효과적인 선별 및 집중을 진행할 수 있어, 지식의 체계화 관리 및 기업 지식 맵의 구축을 실현함으로써, 기업의 지식 맵과 작업 장면을 보다 충분히 융합시켜, 작업 장면 지식의 지능화 응용을 실현하고, 기업의 지식생산 및 응용의 효율을 높일 수 있다.
도 11은 본 개시의 실시예에 따른 정보 추천 장치의 블록 구성도를 예시적으로 도시하고 있다.
도 11에 도시된 바와 같이, 본 실시예의 정보 추천 장치(1100)는, 예를 들어, 취득 모듈(1110), 정보 추출 모듈(1120), 정보 확정 모듈(1130) 및 정보 푸시 모듈(1140)을 포함할 수 있다.
취득 모듈(1110)은 청구 정보를 취득하기 위한 것이다. 일 실시예에 있어서, 취득 모듈(1110)은 도 2에 도시된 동작(S210)을 실행할 수 있는데, 여기서는, 설명을 생략한다.
정보 추출 모듈(1120)은 청구 정보로부터 실체를 나타내는 청구 실체 단어를 추출하기 위한 것이다. 일 실시예에 있어서, 정보 추출 모듈(1120)은 도 2에 도시된 동작(S220)을 실행할 수 있는데, 여기서는, 설명을 생략한다.
정보 확정 모듈(1130)은 청구 실체 단어 및 사전에 구축된 지식 맵에 근거하여, 추천 정보를 확정하기 위한 것이다. 여기서, 지식 맵은 텍스트에 기초하여 구축된 것으로서, 텍스트의 출처를 나타내는 제1 단어를 지시한다. 일 실시예에 있어서, 정보 확정 모듈(1130)은 도 2에 도시된 동작(S230)을 실행할 수 있는데, 여기서는, 설명을 생략한다.
정보 푸시 모듈(1140)은 추천 정보를 푸시하기 위한 것이다. 일 실시예에 있어서, 정보 푸시 모듈(1140)은 도 2에 도시된 동작(S240)을 실행할 수 있는데, 여기서는, 설명을 생략한다.
본 개시의 실시예에 따르면, 정보 추천 장치(1100)는 예를 들어 텍스트에 기초하여 지식 맵을 구축하기 위한 맵 구축 모듈을 더 포함할 수 있다. 예를 들어, 상기 맵 구축 모듈은 도 3a 및 도 3c에 도시된 흐름을 실행할 수 있는데, 여기서는, 설명을 생략한다.
본 개시의 실시예에 따르면, 상기 정보 확정 모듈(1130)은 예를 들어 도 4a에 도시된 흐름 및/또는 도 6a에 도시된 동작(S640)을 실행할 수 있는데, 여기서는, 설명을 생략한다.
본 개시의 실시예에 따르면, 상기 정보 추출 모듈(1120)은 도 5에 도시된 동작(S560)을 실행할 수 도 있다. 정보 추천 장치(1100)는 예를 들어 판단 모듈 및 업데이트 모듈을 더 포함할 수 있다. 판단 모듈은 예를 들어 도 5에 도시된 동작(S570)을 실행할 수 있고, 업데이트 모듈은 예를 들어 도 5에 도시된 동작(S580)을 실행할 수 있는데, 여기서는, 설명을 생략한다.
본 개시의 실시예에 따르면, 상기 정보 추출 모듈(1120)은 예를 들어 도 6a에 도시된 동작(S660)을 실행할 수도 있다. 정보 추천 장치(1100)는 예를 들어 도 6a에 도시된 동작(S670)을 실행하기 위한 노드 확정 모듈을 더 포함할 수 있는데, 여기서는, 설명을 생략한다.
본 개시의 실시예에 따르면, 정보 추천 장치(1100)는 예를 들어 텍스트를 키 정보 구조에 포함되는 정보 노드에 분류시키기 위한 텍스트 분류 모듈을 더 포함할 수 있다. 상기 텍스트 분류 모듈은 예를 들어 도 7에 도시된 동작(S781)~동작(S782)을 실행할 수 있는데, 여기서는, 설명을 생략한다.
본 개시의 실시예에 따르면, 텍스트 분류 모듈은 예를 들어 앞에서 설명한 도 8에 도시된 흐름 또는 도 9에 도시된 흐름을 통해 텍스트와 키 정보 구조 중의 각 정보 노드 사이의 매칭 관계를 확정할 수 있는데, 여기서는, 설명을 생략한다.
본 개시의 실시예에 따른 모듈, 서브 모듈, 유닛, 서브 유닛 중 임의의 하나 이상, 또는 이들 중 임의의 하나 이상의 적어도 일부 기능은 하나의 모듈에서 구현될 수 있다. 본 개시의 실시예에 따른 모듈, 서브 모듈, 유닛, 서브 유닛 중 임의의 하나 또는 하나 이상은 복수의 모듈로 분할되어 구현될 수 있다. 본 개시의 실시예에 따른 모듈, 서브 모듈, 유닛, 서브 유닛 중 임의의 하나 또는 하나 이상은 적어도 부분적으로 예를 들어 FPGA(Field Programmable Gate Array), PLA(Programmable Logic Array), SOC(System On Chip), SOS(System On Substrate), SOP(System On Package), ASIC(Application Specific Integrated Circuit)와 같은 하드웨어 회로를 통해 구현되거나, 또는 회로를 집적시키거나 패키징시키는 기타 합리적인 방식의 하드웨어 또는 펌웨어를 통해 구현되거나, 또는 소프트웨어, 하드웨어 및 펌웨어의 3가지 구현방식 중 임의의 하나 또는 하나 이상의 조합을 통해 구현될 수 있다. 또는, 본 개시의 실시예에 따른 모듈, 서브 모듈, 유닛, 서브 유닛 중 하나 또는 하나 이상은 적어도 부분적으로 컴퓨터 프로그램 모듈을 통해 구현될 수 있고, 해당 컴퓨터 프로그램 모듈은 실행될 경우, 대응되는 기능을 실행할 수 있다.
도 12는 본 개시의 실시예에 따른 정보 추천 방법을 실행하기에 적합한 전자 장비의 일 실예인 컴퓨터 시스템의 블록도를 예시적으로 도시하고 있다.
도 12에 도시된 바와 같이, 본 개시의 실시예에 따른 컴퓨터 시스템(1200)은 프로세서 (1201)를 포함하고, 프로세서 (1201)는 ROM(Read Only Memory)(1202)에 저장된 프로그램 또는 저장부(1208)로부터 RAM(Random Access Memory)(1203)에 로드된 프로그램에 따라 각종 적당한 동작 및 처리를 실행할 수 있다. 프로세서 (1201)는 예를 들어 범용 마이크로 프로세서 (예를 들어, CPU), 명령 집합 프로세서 및/또는 관련 칩셋 및/또는 전용 마이크로 프로세서 (예를 들어, ASIC(Application Specific Integrated Circuit)) 등을 포함할 수 있다. 프로세서 (1201)는 버퍼링 용도로 쓰이는 보드 탑재 메모리를 포함할 수도 있다. 프로세서 (1201)는 본 개시의 실시예에 따른 방법의 흐름의 서로 다른 동작을 실행하기 위한 단일 처리 유닛 또는 복수의 처리 유닛을 포함할 수 있다.
RAM(1203)에는, 시스템(1200) 조작에 필요한 각종 프로그램 및 데이터가 저장되어 있다. 프로세서 (1201), ROM(1202) 및RAM(1203)은 버스(1204)를 통해 서로 연결된다. 프로세서 (1201)는 ROM(1202) 및/또는 RAM(1203)에 저장된 프로그램을 실행함으로써, 본 개시의 실시예에 따른 방법의 흐름의 각 동작을 실행한다. 지적해 두어야 할 것은, 상기 프로그램은 ROM(1202) 및 RAM(1203)을 제외한 하나 또는 복수의 메모리에 저장될 수도 있다. 프로세서 (1201)는 상기 하나 또는 복수의 메모리에 저장되어 있는 프로그램을 실행함으로써, 본 개시의 실시예에 따른 방법의 흐름의 각 동작을 실행할 수도 있다.
본 개시의 실시예에 따르면, 시스템(1200)은 입력/출력(I/O) 인터페이스(1205)를 더 포함할 수 있고, 입력/출력(I/O) 인터페이스(1205)도 버스(1204)에 연결된다. 시스템(1200)은, I/O 인터페이스(1205)에 연결되는 키보드, 마우스 등을 포함하는 입력부(1206), 음극선관(CRT), 액정 디스플레이(LCD) 등 및 스피커 등을 포함하는 출력부(1207), 하드 디스크 등을 포함하는 저장부(1208), 및 LAN 카드, 모뎀 등과 같은 네트워크 인터페이스 카드를 포함하는 통신부(1209)중의 하나 또는 복수 개를 포함할 수 있다. 통신부(1209)는 인터넷과 같은 네트워크를 통해 통신 처리를 실행한다. 수요에 따라, 드라이버(1210)도 I/O 인터페이스(1205)에 연결된다. 수요에 따라, 디스크, 광 디스크, 자기 광 디스크, 반도체 메모리 등과 같은 탈착가능 매체(1211)를 드라이버(1210)에 장착함으로써, 이들로부터 판독된 컴퓨터 프로그램을 수요에 따라 저장부(1208)에 설치할 수 있도록 한다.
본 개시의 실시예에 따르면, 본 개시의 실시예에 따른 방법의 흐름은 컴퓨터 소프트웨어 프로그램으로 실현될 수 있다. 예를 들어, 본 개시의 실시예는 컴퓨터 프로그램 제품을 포함하고, 상기 제품은 컴퓨터 판독가능 저장 매체에 탑재된 컴퓨터 프로그램을 포함하고, 상기 컴퓨터 프로그램은 흐름도에 도시된 방법을 실행하기 위한 프로그램 코드를 포함할 수 있다. 이러한 실시예에 있어서, 상기 컴퓨터 프로그램은 통신부(1209)를 통해 네트워크로부터 다운로드하여 설치하거나, 또는 탈착가능 매체(1211)로부터 설치할 수 있다. 상기 컴퓨터 프로그램이 프로세서 (1201)에 의해 실행될 경우, 본 개시의 실시예의 시스템에서 한정된 상기 기능을 실행한다. 본 개시의 실시예에 따르면, 앞에서 설명한 시스템, 장비, 장치, 모듈, 유닛 등은 컴퓨터 프로그램 모듈을 통해 실현될 수 있다.
본 개시는 컴퓨터 판독가능 저장 매체도 제공한다. 상기 컴퓨터 판독가능 저장 매체는 상기 실시예에서 설명한 장비/장치/시스템에 포함될 수도 있고, 상기 장비/장치/시스템에 조립되지 않고 단독적으로 존재할 수도 있다. 상기 컴퓨터 판독가능 저장 매체에는 하나 또는 복수의 프로그램이 탑재되고, 상기 하나 또는 복수의 프로그램이 실행될 경우, 본 개시의 실시예에 따른 방법을 실현한다.
본 개시의 실시예에 따르면, 컴퓨터 판독가능 저장 매체는 컴퓨터 판독가능 비휘발성 저장 매체일 수 있다. 예를 들어, 휴대용 컴퓨터 디스크, 하드 디스크, RAM(Random Access Memory), ROM(Read Only Memory), EPROM(Erasable Programming ROM), 또는 플래시 메모리, 휴대용 CD-ROM(Compact Disc Read Only Memory), 광학적 저장 디바이스, 자기적 저장 디바이스, 또는 이들의 임의의 적합한 조합을 포함할 수 있는데, 이에 한정되지는 않는다. 본 개시에 있어서, 컴퓨터 판독가능 저장 매체는 프로그램을 포함 또는 저장하는 임의의 유형의 매체일 수 있는데, 상기 프로그램은 명령 실행 시스템, 장치 또는 디바이스에 의해 사용되거나 이들과 결합하여 사용할 수 있다. 예를 들어, 본 개시의 실시예에 따르면, 컴퓨터 판독가능 저장 매체는 앞에서 설명한 ROM(1202) 및/또는 RAM(1203) 및/또는 ROM(1202)과 RAM(1203)을 제외한 하나 또는 복수의 메모리를 포함할 수 있다.
첨부 도면의 흐름도 및 블록도는, 본 개시의 각종 실시예에 따른 시스템, 방법 및 컴퓨터 프로그램 제품의 실현가능한 체계구조, 기능 및 동작을 도시하고 있다. 이 점에서, 흐름도 또는 블록도의 각 블록은 하나의 모듈, 프로그램 세그먼트, 또는 코드의 일부를 의미할 수 있고, 상기 모듈, 프로그램 세그먼트 또는 코드의 일부는 하나 또는 복수의 소정의 논리적 기능을 실현하기 위한 실행가능 명령을 포함한다. 지적해 두어야 할 것은, 다른 일부 실시예에 있어서, 블록에 표기된 기능은 첨부 도면에 표기된 순서와 다른 순서로 실행될 수도 있다. 예를 들어, 순차적으로 표시된 2개의 블록은 병행적으로 실행될 수 도 있고, 반대되는 순서로 실행될 수도 있는데, 이는 관련되는 기능에 의해 결정된다. 또한, 지적해 두어야 할 것은, 블록도 또는 흐름도중의 각 블록 및 블록도 또는 흐름도중의 블록의 조합은, 소정의 기능 또는 동작을 실행하는 전용적인 하드웨어에 기반한 시스템을 통해 구현하거나, 또는 전용 하드웨어와 컴퓨터 명령의 조합을 통해 구현할 수 있다.
당업자라면, 본 개시에 명확히 개시되어 있지 않더라도, 본 개시의 각 실시예 및/또는 청구항에 기재된 특징을 다양하게 조합 및/또는 결합할 수 있음을 이해할 수 있을 것이다. 특히, 본 개시의 취지 및 시사를 벗어나지 않고 본 개시의 각 실시예 및/또는 청구항에 기재된 특징을 다양하게 조합 및/또는 결합할 수 있다. 이러한 전부의 조합 및/또는 결합은 모두 본 개시의 범위에 속한다.
이상에서는 본 개시의 실시예에 대해 설명하였다. 하지만, 이러한 실시예는 단지 설명을 위한 것일 뿐, 결코 본 개시의 범위를 제한하기 위한 것이 아니다. 비록 이상에서는 각 실시예를 별도로 설명하였으나, 이는 결코 각 실시예 중의 조치가 결합하여 사용할 수 없음을 의미하지 않는다. 본 개시의 범위는 첨부된 청구의 범위 및 그 등가물에 의해 한정된다. 당업자라면, 본 개시의 범위를 벗어나지 않고, 다양하게 치환 및 변경할 수 있는데, 이러한 치환 및 변경 또한 본 개시의 범위에 포함되어야 한다.
1110: 취득 모듈 1120: 정보 추출 모듈
1130: 정보 확정 모듈 1140: 정부 푸쉬 모듈

Claims (17)

  1. 청구 정보를 취득하는 것,
    상기 청구 정보로부터 실체를 나타내는 청구 실체 단어를 추출하는 것,
    상기 청구 실체 단어 및 사전에 구축된 지식 맵에 근거하여, 추천 정보를 확정하는 것, 및
    상기 추천 정보를 푸시하는 것을 포함하고,
    상기 지식 맵은 텍스트에 기초하여 구축된 것으로서, 상기 텍스트의 출처를 나타내는 제1 단어를 지시하는,
    정보 추천 방법.
  2. 제1항에 있어서,
    텍스트에 기초하여 지식 맵을 구축하는 것을 더 포함하고,
    상기 텍스트에 기초하여 지식 맵을 구축하는 것은,
    상기 텍스트로부터 실체를 나타내는 복수의 실체 단어 및 상기 복수의 실체 단어 사이의 연관관계를 추출하는 것, 및
    추출된 상기 복수의 실체 단어 및 상기 복수의 실체 단어 사이의 연관관계에 근거하여, 지식 맵을 구축하는 것을 포함하고,
    상기 복수의 실체 단어는 상기 제1 단어를 포함하는,
    정보 추천 방법.
  3. 제2항에 있어서,
    상기 지식 맵을 구축하는 것은,
    상기 복수의 실체 단어 중 각 실체 단어에 대해,
    상기 각 실체 단어를 상대로 노드를 구축하는 것,
    상기 복수의 실체 단어 사이의 연관관계에 근거하여, 상기 복수의 실체 단어 중 상기 각 실체 단어와 연관관계를 가지는 연관 단어를 확정하는 것, 및
    상기 각 실체 단어를 상대로 하는 노드와 상기 연관 단어를 상대로 하는 노드를 연결하여, 상기 각 실체 단어를 상대로 하는 노드에 연관되는 에지를 형성하는 것을 포함하는,
    정보 추천 방법.
  4. 제3항에 있어서,
    상기 지식 맵을 구축하는 것은,
    상기 각 실체 단어와 상기 연관 단어 사이의 연관관계에 근거하여, 상기 각 실체 단어와 상기 연관 단어 사이의 연관 강도를 확정하는 것, 및
    상기 연관 강도에 근거하여, 상기 각 실체 단어를 상대로 하는 노드와 상기 연관 단어를 상대로 하는 노드를 연결하는 에지에 가중치를 부여하는 것을 더 포함하고,
    상기 연관 강도의 크기는 상기 가중치의 크기에 비례되는,
    정보 추천 방법.
  5. 제3항에 있어서,
    상기 추천 정보를 확정하는 것은,
    상기 지식 맵에서 상기 청구 실체 단어를 상대로 하는 노드를 목표 노드로 확정하는 것,
    상기 목표 노드에 연관되는 에지에 근거하여, 상기 목표 노드에 연결되는 적어도 하나의 노드를 확정하는 것, 및
    상기 적어도 하나의 노드가 상대로 하는 실체 단어에 근거하여, 상기 추천 정보를 확정하는 것을 포함하는,
    정보 추천 방법.
  6. 제2항에 있어서,
    새로운 텍스트를 취득한 것에 응답하여, 상기 새로운 텍스트로부터 실체를 나타내는 복수의 새로운 실체 단어 및 상기 복수의 새로운 실체 단어 사이의 연관관계를 추출하는 것, 및
    상기 지식 맵이 상기 복수의 새로운 실체 단어 중 적어도 하나의 새로운 실체 단어를 지시하지 못할 경우, 상기 복수의 새로운 실체 단어 및 상기 복수의 새로운 실체 단어 사이의 연관관계에 근거하여, 상기 지식 맵을 업데이트하는 것을 더 포함하는,
    정보 추천 방법.
  7. 제2항에 있어서,
    상기 청구 정보로부터 키 정보를 추출하는 것, 및
    사전에 설정된 키 정보 구조 중 추출된 키 정보에 연관되는 정보 노드를 목표 정보 노드로 확정하는 것을 더 포함하고,
    상기 키 정보 구조에는 복수의 정보 노드가 포함되어 있고, 상기 복수의 정보 노드 중의 각 정보 노드는 하나의 키 정보를 지시하고,
    상기 추천 정보를 확정하는 것은,
    상기 청구 실체 단어, 사전에 구축된 지식 맵 및 상기 목표 정보 노드에 근거하여 추천 정보를 확정하는 것을 포함하는,
    정보 추천 방법.
  8. 제7항에 있어서,
    상기 복수의 실체 단어는 상기 텍스트의 키 정보를 나타내는 제2 단어를 더 포함하고,
    상기 방법은, 상기 텍스트를 상기 키 정보 구조에 포함되는 정보 노드에 분류시키는 것을 더 포함하고,
    상기 텍스트를 분류시키는 것은,
    상기 제2 단어에 근거하여, 상기 텍스트와 상기 키 정보 구조 중의 각 정보 노드 사이의 매칭 관계를 확정하는 것, 및
    상기 텍스트를 상기 텍스트에 매칭되는 정보 노드에 분류시키는 것을 포함하는,
    정보 추천 방법.
  9. 제8항에 있어서,
    상기 제2 단어는 복수 개 이고,
    상기 텍스트와 상기 키 정보 구조 중의 각 정보 노드 사이의 매칭 관계를 확정하는 것은,
    상기 제2 단어에 상기 각 정보 노드가 지시하는 키 정보와 동일한 목표 단어가 포함되어 있는지 확정하는 것, 및
    상기 제2 단어에 상기 목표 단어가 포함되어 있을 경우, 상기 텍스트와 상기 각 정보 노드 사이의 매칭 관계가 매칭된다고 확정하는 것을 포함하는,
    정보 추천 방법.
  10. 제9항에 있어서,
    상기 텍스트와 상기 키 정보 구조 중의 각 정보 노드 사이의 매칭 관계를 확정하는 것은,
    상기 제2 단어에 목표 단어가 포함되어 있지 않을 경우, 상기 지식 맵으로부터 상기 제2 단어의 연관 단어를 취득하는 것, 및
    상기 제2 단어의 연관 단어에 상기 목표 단어가 포함되어 있을 경우, 상기 텍스트와 상기 각 정보 노드 사이의 매칭 관계가 매칭된다고 확정하는 것을 더 포함하는,
    정보 추천 방법.
  11. 제8항에 있어서,
    상기 텍스트와 상기 키 정보 구조 중의 각 정보 노드 사이의 매칭 관계를 확정하는 것은,
    상기 제2 단어와 상기 각 정보 노드가 지시하는 키 정보 사이의 유사도를 확정하는 것, 및
    상기 유사도가 유사도 한계치보다 클 경우, 상기 텍스트와 상기 각 정보 노드 사이의 매칭 관계가 매칭된다고 확정하는 것을 포함하는,
    정보 추천 방법.
  12. 제8항에 있어서,
    새로운 텍스트를 취득한 것에 응답하여, 상기 새로운 텍스트로부터 상기 새로운 텍스트의 새로운 키 정보를 추출하는 것, 및
    상기 키 정보 구조에 상기 새로운 키 정보를 지시하는 정보 노드가 포함되어 있지 않을 경우, 상기 새로운 키 정보에 근거하여, 상기 키 정보 구조를 업데이트하는 것을 더 포함하는,
    정보 추천 방법.
  13. 제8항에 있어서,
    상기 추천 정보를 확정하는 것은,
    상기 목표 정보 노드에 분류된 텍스트를 취득하여, 상기 추천 정보로 하는 것을 포함하는,
    정보 추천 방법.
  14. 청구 정보를 취득하기 위한 취득 모듈,
    상기 청구 정보로부터 실체를 나타내는 청구 실체 단어를 추출하기 위한 정보 추출 모듈,
    상기 청구 실체 단어 및 사전에 구축된 지식 맵에 근거하여, 추천 정보를 확정하기 위한 정보 확정 모듈, 및
    상기 추천 정보를 푸시하기 위한 정보 푸시 모듈을 포함하고,
    상기 지식 맵은 텍스트에 기초하여 구축된 것으로서, 상기 텍스트의 출처를 나타내는 제1 단어를 지시하는,
    정보 추천 장치.
  15. 하나 또는 복수의 프로세서, 및
    하나 또는 복수의 프로그램을 저장하기 위한 저장 장치를 포함하고,
    상기 하나 또는 복수의 프로그램이 상기 하나 또는 복수의 프로세서에 의해 실행될 경우, 상기 하나 또는 복수의 프로세서가 제1항 내지 제13항중 어느 한 항의 방법을 실행하도록 하는,
    전자 장비.
  16. 컴퓨터 프로그램이 저장되어 있는 비 일시적 컴퓨터 판독가능 저장 매체에 있어서,
    상기 프로그램이 프로세서에 의해 실행될 경우, 제1항 내지 제13항 중 어느 한 항의 방법을 구현하는,
    비 일시적 컴퓨터 판독가능 저장 매체.
  17. 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램에 있어서,
    상기 컴퓨터 프로그램의 명령이 프로세서에 의해 실행될 경우, 제1항 내지 제13항 중 어느 한 항의 방법을 구현하는,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
KR1020210039694A 2020-06-22 2021-03-26 정보 추천 방법과 장치, 전자 장비, 컴퓨터 판독가능 저장 매체 및 컴퓨터 프로그램 KR20210040891A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010577208.5A CN111753198B (zh) 2020-06-22 2020-06-22 信息推荐方法和装置、以及电子设备和可读存储介质
CN202010577208.5 2020-06-22

Publications (1)

Publication Number Publication Date
KR20210040891A true KR20210040891A (ko) 2021-04-14

Family

ID=72674903

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210039694A KR20210040891A (ko) 2020-06-22 2021-03-26 정보 추천 방법과 장치, 전자 장비, 컴퓨터 판독가능 저장 매체 및 컴퓨터 프로그램

Country Status (5)

Country Link
US (1) US20210397980A1 (ko)
EP (1) EP3929769A1 (ko)
JP (1) JP2022002075A (ko)
KR (1) KR20210040891A (ko)
CN (1) CN111753198B (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113961811A (zh) * 2021-10-28 2022-01-21 平安科技(深圳)有限公司 基于事件图谱的话术推荐方法、装置、设备及介质
CN114417007A (zh) * 2021-12-21 2022-04-29 建信金融科技有限责任公司 金融产品的推荐方法和相关设备

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112732935A (zh) * 2021-01-11 2021-04-30 中国互联网络信息中心 域名推荐方法、系统、电子设备及存储介质
CN112884542A (zh) * 2021-01-21 2021-06-01 北京电解智科技有限公司 商品推荐方法和装置
CN112954025B (zh) * 2021-01-29 2023-07-18 北京百度网讯科技有限公司 基于分层知识图谱推送信息方法、装置、设备、介质
CN112749344B (zh) * 2021-02-04 2023-08-01 北京百度网讯科技有限公司 信息推荐方法、装置、电子设备、存储介质及程序产品
CN112836126A (zh) * 2021-02-08 2021-05-25 珠海格力电器股份有限公司 基于知识图谱的推荐方法、装置、电子设备及存储介质
CN112948590A (zh) * 2021-02-21 2021-06-11 深圳数研锦瀚智慧科技有限公司 一种基于预案的森林火灾响应方法及系统
CN113079417B (zh) * 2021-03-25 2023-01-17 北京百度网讯科技有限公司 生成弹幕的方法、装置、设备和存储介质
CN113515700B (zh) * 2021-07-01 2024-02-20 深圳追一科技有限公司 信息推送方法、装置、电子设备及存储介质
CN113722434B (zh) * 2021-08-30 2024-05-03 平安科技(深圳)有限公司 一种文本数据处理的方法、装置、计算机设备及存储介质
CN113779116B (zh) * 2021-09-10 2023-07-11 平安科技(深圳)有限公司 对象排序方法、相关设备及介质
CN114579875B (zh) * 2022-03-03 2022-09-27 中国科学院大学 基于知识图谱的设备故障诊断与维修知识推荐系统
CN114817737B (zh) * 2022-05-13 2024-01-02 北京世纪超星信息技术发展有限责任公司 一种基于知识图谱的文物热点推送方法及系统
CN115422369B (zh) * 2022-08-30 2023-11-03 中国人民解放军国防科技大学 基于改进TextRank的知识图谱补全方法和装置
CN116089624B (zh) * 2022-11-17 2024-02-27 昆仑数智科技有限责任公司 基于知识图谱的数据推荐方法、装置和系统
CN115878904B (zh) * 2023-02-22 2023-06-02 深圳昊通技术有限公司 基于深度学习的知识产权个性化推荐方法、系统及介质
CN117648449B (zh) * 2024-01-30 2024-05-14 青岛培诺教育科技股份有限公司 基于知识图谱的自适应推送方法、系统、设备和介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2959405A4 (en) * 2013-02-19 2016-10-12 Google Inc RESEARCH BASED ON TREATMENT OF NATURAL LANGUAGE
JP6343337B2 (ja) * 2013-03-15 2018-06-13 ニューラ ラブス コーポレイション 知識への1段階アクセスを提供する適応ユーザインターフェースを有する知的インターネットシステム
JP7088644B2 (ja) * 2017-09-15 2022-06-21 ヤフー株式会社 提供装置、提供方法及び提供プログラム
CN107609152B (zh) * 2017-09-22 2021-03-09 百度在线网络技术(北京)有限公司 用于扩展查询式的方法和装置
AU2018241092B2 (en) * 2017-10-04 2019-11-21 Accenture Global Solutions Limited Knowledge enabled data management system
JP6906419B2 (ja) * 2017-10-13 2021-07-21 ヤフー株式会社 情報提供装置、情報提供方法、およびプログラム
US10776337B2 (en) * 2018-07-06 2020-09-15 International Business Machines Corporation Multi-dimensional knowledge index and application thereof
JP7182923B2 (ja) * 2018-07-06 2022-12-05 株式会社東芝 情報検索システム
CN110188168B (zh) * 2019-05-24 2021-09-03 北京邮电大学 语义关系识别方法和装置
CN110457452B (zh) * 2019-07-08 2022-06-14 汉海信息技术(上海)有限公司 推荐理由生成方法、装置、电子设备及可读存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113961811A (zh) * 2021-10-28 2022-01-21 平安科技(深圳)有限公司 基于事件图谱的话术推荐方法、装置、设备及介质
CN113961811B (zh) * 2021-10-28 2024-04-05 平安科技(深圳)有限公司 基于事件图谱的话术推荐方法、装置、设备及介质
CN114417007A (zh) * 2021-12-21 2022-04-29 建信金融科技有限责任公司 金融产品的推荐方法和相关设备

Also Published As

Publication number Publication date
JP2022002075A (ja) 2022-01-06
US20210397980A1 (en) 2021-12-23
CN111753198B (zh) 2024-01-12
CN111753198A (zh) 2020-10-09
EP3929769A1 (en) 2021-12-29

Similar Documents

Publication Publication Date Title
KR20210040891A (ko) 정보 추천 방법과 장치, 전자 장비, 컴퓨터 판독가능 저장 매체 및 컴퓨터 프로그램
CN111753060B (zh) 信息检索方法、装置、设备及计算机可读存储介质
AU2019204976B2 (en) Intelligent data ingestion system and method for governance and security
US20190213407A1 (en) Automated Analysis System and Method for Analyzing at Least One of Scientific, Technological and Business Information
JP2021108183A (ja) 意図推薦方法、装置、機器及び記憶媒体
US11899681B2 (en) Knowledge graph building method, electronic apparatus and non-transitory computer readable storage medium
Liu et al. Finding media illustrating events
JP6930041B1 (ja) 検索/作成されたデジタルメディアファイルに基づく潜在的関連のあるトピックの予測
US9965726B1 (en) Adding to a knowledge base using an ontological analysis of unstructured text
Vysotska et al. Method of similar textual content selection based on thematic information retrieval
Das et al. A CV parser model using entity extraction process and big data tools
CN111723256A (zh) 一种基于信息资源库的政务用户画像构建方法及其系统
Kim et al. TwitterTrends: a spatio-temporal trend detection and related keywords recommendation scheme
Choi et al. Chrological big data curation: A study on the enhanced information retrieval system
Dao et al. Jointly exploiting visual and non-visual information for event-related social media retrieval
Al-Barhamtoshy et al. A data analytic framework for unstructured text
US20180150543A1 (en) Unified multiversioned processing of derived data
Shao Research on fuzzy ontology e-learning based on user profile
de Campos et al. An integrated system for managing the andalusian parliament's digital library
Li et al. Research on hot news discovery model based on user interest and topic discovery
Rogushina et al. Use of ontologies for metadata records analysis in big data
Acker et al. The Neil deGrasse Tyson Problem: Methods for Exploring Base Memes in Web Archives
ElGindy et al. Capturing place semantics on the geosocial web
US20170220644A1 (en) Media discovery across content respository
US20230409996A1 (en) Method and apparatus for retrieving relevant records from a database using prediction models

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application