KR101707369B1 - 이벤트 저장소의 구축 방법 및 장치 - Google Patents
이벤트 저장소의 구축 방법 및 장치 Download PDFInfo
- Publication number
- KR101707369B1 KR101707369B1 KR1020157036777A KR20157036777A KR101707369B1 KR 101707369 B1 KR101707369 B1 KR 101707369B1 KR 1020157036777 A KR1020157036777 A KR 1020157036777A KR 20157036777 A KR20157036777 A KR 20157036777A KR 101707369 B1 KR101707369 B1 KR 101707369B1
- Authority
- KR
- South Korea
- Prior art keywords
- event
- subject
- event knowledge
- fragment
- entity
- Prior art date
Links
Images
Classifications
-
- G06F17/30705—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G06F17/271—
-
- G06F17/274—
-
- G06F17/30312—
-
- G06F17/30604—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
이벤트 저장소의 구축 방법 및 장치가 제안되어 있다. 상기 구축 방법은, 텍스트를 인식하여 이벤트 발굴 후보 문장을 형성하는 단계; 인식된 이벤트 발굴 후보 문장을 분할하여 구문 단편을 취득하는 단계; 구문 단편 및 미리 정의된 이벤트 지식 구조에 따라 이벤트 지식 인스턴스들을 생성하는 단계 - 이벤트 지식 인스턴스들의 수는 구문 단편 내에 포함된 동사-목적어 단편들 및 주어-술어 단편들의 수와 동일함 -; 및 구문 단편들 내에 포함된 동사-목적어 단편들 및 주어-술어 단편들에 따라 대응하는 이벤트 발굴 타깃 문장을 취득하고, 취득된 이벤트 발굴 타깃 문장의 요소들을 분류하며, 분류된 요소를 이벤트 지식 인스턴스 내에 기록하여 저장소의 설정을 완성하는 단계를 포함한다. 본 발명에서는, 이벤트 저장소가 미리 정의된 이벤트 지식 구조를 통해 구축될 수 있고, 정확한 검색 결과가 이벤트 저장소에 기초하여 사용자에게 제공될 수 있으며, 사용자의 검색 경험이 향상될 수 있다.
Description
관련 출원에 대한 상호 참조
본 출원은, 발명의 명칭이 "이벤트 지식 기반을 구축하기 위한 방법 및 장치(method and device for constructing event knowledge base)"이고 바이두 온라인 네트웍 테크놀러지 (베이징) 컴파니 리미티드(BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) CO., LTD.)가 소유하는, 2014년 1월 9일자로 중국 국가 지식산권국(SIPO: State Intellectual Property Office)에 출원된 중국 특허출원 제201410010694.7호의 우선권 및 이익을 주장한다.
본 개시의 실시예들은 일반적으로 컴퓨터 기술 분야에 관한 것으로, 보다 구체적으로 이벤트 지식 기반을 구축하기 위한 방법 및 장치에 관한 것이다.
검색 엔진 기술은 지식 그래프를 중심으로 한 혁명(revolution)을 일으킨다. 혁명의 핵심은 미구조화 웹페이지 텍스트를 지향하는 전통적인 검색으로부터 구조화 지식을 지향하는 새로운 세대의 지식 기반 검색으로 전환하고, 이에 따라 사용자에게 보다 정확한 검색 결과를 제공하고 사용자의 검색 경험을 향상시키는 것이다. 현재, 지식 그래프 기술(좁은 의미에서 지식 그래프)의 핵심은 엔티티 지식(entity knowledge) 및 관련 응용 기술을 포함하는 엔티티 지식 기반(이후 엔티티 라이브러리(entity library)라고 칭함)을 포함하는 것이다.
엔티티 라이브러리에서, 엔티티 지식의 한 부분은 그의 고유한 시맨틱(semantic) 일련 번호, 즉 시맨틱 식별자(ID), 명확한 시맨틱 의미를 갖는 속성들 및 속성값들로 구성될 수 있다. 예를 들면, 엔티티 지식 "바이두 컴파니(BAIDU Co.)"에 대하여, 엔티티 라이브러리는 우선 그의 고유한 시맨틱 일련 번호로서 세계적으로 고유한 ID(company_XXX라고 가정)를 부여하고, 엔티티가 예를 들어 "설립: 2000년 1월(Founded: January 2000)", "사업: 네트워크 정보 서비스(Business: Network Information Service)", "회장: 리 얀홍(Chairman: Li Yanhong)", "자회사: 91 와이어리스(company_YYY), IQI(company_ZZZ)(subsidiaries: 91 Wireless (company_YYY), IQI (company_ZZZ))" 등에 속하는 카테고리에 기초하여 시맨틱 정보를 추가한다. 상기 지식은 사실적 지식에 대한 사용자의 질문, 예를 들면 "바이두 컴파니의 자회사는 무엇인가?(what are subsidiaries of BAIDU Co.)" 또는 "바이두 컴파니의 회장은 누구인가?(who is the Chairman of BAIDU Co.?)"를 해결할 수 있다. 이는, 단지 상기 질문을 "{카테고리=company; 엔티티=BAIDU Co. (company_XXX); 속성=subsidiaries; 속성값=?}" 및 "{카테고리=company; 엔티티=BAIDU Co. (company_XXX); 속성=Chairman; 속성값=?}"로 해결할 필요가 있어, 사용자의 요구가 기존의 지식 그래프에 의해 충족될 수 있다.
그러나, 엔티티 지식이 엔티티 또는 소정의 가상 엔티티에 초점을 맞추기 때문에, 엔티티들 간의 관계를 기재할 때, 가장 일반적인 방법 중 하나는 엔티티를 특정 속성, 예를 들면 "회장(Chairman)", "자회사(subsidiaries)", "사업(Business)" 등으로 요약하는 것이다. 이러한 요약이 지식의 표현을 더욱 정확하게 할 수 있지만, 세부사항은 상실될 수 있다.
구체적인 문의-답변 응용예를 예로 들면 - 사용자가, "2013년도에 바이두 컴파니가 어떤 자회사를 인수했는지(which subsidiaries are acquired by BAIDU Co. in 2013)" 또는 "바이두 컴파니가 총 얼마에 91 와이어리스 및 인터넷 TV 소프트웨어(PPS)를 인수하는지(how much does BAIDU Co. acquire 91 Wireless and internet TV software (PPS) totally)"를 문의한 경우 -, 상기 질문은 전통적인 엔티티 라이브러리의 지식에 기초하여 답변할 수 없다.
따라서, 구체적인 지식 검색이 전통적인 엔티티 라이브러리에 기초하여 수행되는 경우, 사용자에게 검색 결과를 제공할 수 없고, 이에 따라 사용자의 검색 경험을 감소시킨다.
본 개시는 상기 문제점 중 적어도 하나를 해결하고자 한다.
따라서, 본 개시의 제1 목적은 이벤트 지식 기반을 구축하기 위한 방법을 제공하는 것이다. 상기 방법은 미리 설정된 이벤트 지식 구조에 의해 이벤트 지식 기반을 구축할 수 있고, 이벤트 지식 기반에 기초하여 사용자에게 정확한 검색 결과를 제공할 수 있으며, 이에 따라 사용자의 검색 경험을 향상시킬 수 있다.
본 개시의 제2 목적은 이벤트 지식 기반을 구축하기 위한 장치를 제공하는 것이다.
상기 목적을 실현하기 위해서, 본 개시의 제1 측면의 실시예들은 이벤트 지식 기반을 구축하기 위한 방법을 제공하고, 상기 방법은, 텍스트를 식별하여 이벤트 발굴(mining) 후보 문장을 취득하는 단계; 상기 이벤트 발굴 후보 문장을 구문 단편(syntax fragment)들로 분할하는 단계; 상기 구문 단편들 및 미리 설정된 이벤트 지식 구조에 따라 이벤트 지식 인스턴스(instance)를 생성하는 단계 - 여기서 상기 이벤트 지식 인스턴스의 수는 구문 단편들 내의 동사-목적어(verb-object) 단편들 및 주어-술어(subject-predicate) 단편들의 수와 동일함 -; 및 상기 구문 단편들 내의 동사-목적어 단편들 및 주어-술어 단편들에 따라 이벤트 발굴 타깃 문장을 취득하고, 이벤트 발굴 타깃 문장을 분할하며, 분할된 요소들을 대응적으로 이벤트 지식 인스턴스 내에 기록하여, 이벤트 지식 기반의 구축을 달성하는 단계를 포함한다.
본 개시의 실시예들에 따른 이벤트 지식 기반을 구축하기 위한 방법은 미리 설정된 이벤트 지식 구조 및 구문 단편들에 따라 이벤트 지식 기반을 구축할 수 있고, 이벤트 지식 기반에 기초하여 웹페이지 지식을 구조화할 수 있으며, 또한 지식 간의 추론 및 계산을 지원할 수도 있다. 또한, 상기 방법은 관련 이벤트를 병합할 수 있고, 이에 따라 사용자가 구체적인 지식 검색을 원하는 경우에 사용자에게 정확한 검색 결과를 제공하고 또한 사용자의 검색 경험도 향상시킨다.
상기 목적을 실현하기 위해서, 본 개시의 제2 측면의 실시예들은 이벤트 지식 기반을 구축하기 위한 장치를 제공하며, 상기 장치는 식별 모듈, 분할 모듈, 생성 모듈 및 기록 모듈을 포함한다.
본 개시의 실시예들에 따른 이벤트 지식 기반을 구축하기 위한 장치는 미리 설정된 이벤트 지식 구조 및 구문 단편들에 따라 이벤트 지식 기반을 구축할 수 있고, 이벤트 지식 기반에 기초하여 웹페이지 지식을 구조화할 수 있으며, 또한 지식 간의 추론 및 계산을 지원할 수 있다. 또한, 상기 장치는 관련 이벤트들을 병합할 수 있고, 이에 따라 사용자가 구체적인 지식 검색을 원하는 경우에 사용자에게 정확한 검색 결과를 제공하고 또한 사용자의 검색 경험도 향상시킨다.
상기 목적을 실현하기 위해서, 본 개시의 제3 측면의 실시예들은 저장 매체를 제공하며, 상기 저장 매체는 본 개시의 제1 측면의 실시예들에 따른 이벤트 지식 기반을 구축하기 위한 방법을 실행하기 위한 응용 프로그램을 포함한다.
본 개시의 실시예들의 추가 측면들 및 이점들은 다음의 설명에서 부분적으로 주어지거나, 다음의 설명으로부터 부분적으로 분명하게 되거나, 또는 본 개시의 실시예들의 실행으로부터 학습될 것이다.
본 개시의 실시예들의 이들 및 다른 측면들 및 이점들은 첨부된 도면을 참조하여 이루어진 다음의 설명으로부터 분명해지고 더욱 용이하게 인정될 것이다.
도 1은 본 개시의 일 실시예에 따른 이벤트 지식 기반을 구축하기 위한 방법을 나타내는 순서도이고;
도 2는 본 개시의 다른 실시예에 따른 이벤트 지식 기반을 구축하기 위한 방법을 나타내는 순서도이고;
도 3은 본 개시의 일 실시예에 따른 이벤트 지식 기반을 구축하기 위한 장치를 나타내는 블록도이고;
도 4는 본 개시의 다른 실시예에 따른 이벤트 지식 기반을 구축하기 위한 장치를 나타내는 블록도이다.
도 1은 본 개시의 일 실시예에 따른 이벤트 지식 기반을 구축하기 위한 방법을 나타내는 순서도이고;
도 2는 본 개시의 다른 실시예에 따른 이벤트 지식 기반을 구축하기 위한 방법을 나타내는 순서도이고;
도 3은 본 개시의 일 실시예에 따른 이벤트 지식 기반을 구축하기 위한 장치를 나타내는 블록도이고;
도 4는 본 개시의 다른 실시예에 따른 이벤트 지식 기반을 구축하기 위한 장치를 나타내는 블록도이다.
본 개시의 실시예들에 대한 참조가 상세하게 이루어질 것이다. 본 개시의 실시예들이 도면에 도시될 것이며, 여기서 동일 또는 유사 구성요소들 및 동일 또는 유사 기능을 갖는 구성요소들이 명세서 전반에 걸쳐 동일한 참조 번호로 표시되어 있다. 도면에 따라 본 명세서에 기재되는 실시예들은 설명 및 예시적이고, 본 개시를 한정하려는 것으로 해석되지 않는다. 반대로, 본 개시는 첨부된 청구범위의 사상 및 범주 내에서 대체예, 변형예 및 등가물을 포함할 수 있다.
본 개시의 설명에서, 달리 특정되거나 한정되지 않는 한, "제1" 및 "제2"와 같은 용어가 설명의 목적을 위해 본 명세서에서 사용되며 상대적인 중요도 또는 중요성을 표시하거나 암시하려는 것이 아님을 이해해야 한다. 본 개시의 설명에서, 달리 특정되거나 한정되지 않는 한, 용어 "탑재된(mounted)", "연결된(connected), "결합된(coupled)" 및 이들의 변형이 광범위하게 사용되고, 예를 들어 기계적 또는 전기적 탑재, 연결 및 결합을 망라하며, 또한 2개의 구성성분의 내부 탑재, 연결 및 결합일 수 있고, 또한 본 개시의 상세한 실시예에 따라 당업자가 이해할 수 있는 직접 및 간접 탑재, 연결 및 결합일 수 있음을 유의해야 한다. 또한, 본 개시의 설명에서, "복수의"는 달리 특정되지 않는 한, 2개 이상을 의미한다.
순서도에 설명되거나 본 명세서에서 다른 방식으로 설명되는 임의의 공정 또는 방법은 공정 중에 특정한 논리 기능들 또는 단계들을 달성하기 위한 실행 가능한 명령어들의 코드들의 하나 이상의 모듈, 세그먼트 또는 부분을 포함하는 것으로 이해될 수 있고, 본 개시의 바람직한 실시예의 범주는 당업자에 의해 이해되어야 하는 다른 구현예를 포함한다.
본 개시의 실시예들에 대한 참조가 상세하게 이루어질 것이다. 본 개시의 실시예들이 도면에 도시될 것이며, 여기서 동일 또는 유사 구성요소들 및 동일 또는 유사 기능을 갖는 구성요소들이 명세서 전반에 걸쳐 동일한 참조 번호로 표시되어 있다. 도면에 따라 본 명세서에 기재되는 실시예들은 설명 및 예시적이고, 본 개시를 한정하려는 것으로 해석되지 않는다. 반대로, 본 개시는 첨부된 청구범위의 사상 및 범주 내에서 대체예, 변형예 및 등가물을 포함할 수 있다.
본 개시의 설명에서, 달리 특정되거나 한정되지 않는 한, "제1" 및 "제2"와 같은 용어가 설명의 목적을 위해 본 명세서에서 사용되며 상대적인 중요도 또는 중요성을 표시하거나 암시하려는 것이 아님을 이해해야 한다. 본 개시의 설명에서, 달리 특정되거나 한정되지 않는 한, 용어 "탑재된", "연결된, "결합된" 및 이들의 변형이 광범위하게 사용되고, 예를 들어 기계적 또는 전기적 탑재, 연결 및 결합을 망라하며, 또한 2개의 구성성분의 내부 탑재, 연결 및 결합일 수 있고, 또한 본 개시의 상세한 실시예에 따라 당업자가 이해할 수 있는 직접 및 간접 탑재, 연결 및 결합일 수 있음을 유의해야 한다. 또한, 본 개시의 설명에서, "복수의"는 달리 특정되지 않는 한, 2개 이상을 의미한다.
순서도에 설명되거나 본 명세서에서 다른 방식으로 설명되는 임의의 공정 또는 방법은 공정 중에 특정한 논리 기능들 또는 단계들을 달성하기 위한 실행 가능한 명령어들의 코드들의 하나 이상의 모듈, 세그먼트 또는 부분을 포함하는 것으로 이해될 수 있고, 본 개시의 바람직한 실시예의 범주는 당업자에 의해 이해되어야 하는 다른 구현예를 포함한다.
웹페이지 텍스트 지식을 구조화하고, 또한 지식 간의 추론 및 계산을 지원하기 위해서, 본 개시의 실시예들은 이벤트 지식 기반을 구축하기 위한 방법 및 장치를 제공한다. 이하에서는, 본 개시의 실시예들에 따른 이벤트 지식 기반을 구축하기 위한 방법 및 장치가 도면을 참조하여 설명될 것이다.
도 1은 본 개시의 일 실시예에 따른 이벤트 지식 기반을 구축하기 위한 방법을 나타내는 순서도이다.
도 1에 나타낸 바와 같이, 이벤트 지식 기반을 구축하기 위한 방법은 다음의 단계들을 포함한다.
S101에서, 텍스트가 식별되어 이벤트 발굴 후보 문장을 취득한다.
이벤트 지식을 발굴하는 타깃은 자연 언어 텍스트이다. 인터넷 자원에서, 모든 자연 언어 문장이 궁극적으로 이벤트 지식이 될 수는 없다. 따라서, 처음에, 자연 언어 텍스트, 예를 들면 웹페이지 텍스트가 식별되어 이벤트 발굴 후보 문장을 형성할 수 있다. 이 실시예에서, 이벤트 발굴 후보 문장은 적어도 하나의 주어 엔티티 뿐만 아니라 이러한 주어 엔티티의 핵심 행동을 포함할 필요가 있다.
이 실시예에서는 이벤트 발굴 후보 문장이, "네트워크 드래곤 컴파니의 자회사인 91 와이어리스 컴파니는 중국에서 선도적인 모바일 인터넷 회사이고, 웹사이트 Sj.91.com 및 apk.hiapk.com에서, 그것은 아이폰 운영 체제 및 안드로이드 운영 체제용의 2개의 스마트폰 거대 진영의 모바일 애플리케이션 배포 플랫폼을 개발하고 운영한다(91 Wireless Co., the subsidiary of Network Dragon Co., is the leading mobile Internet company in China, and in websites Sj.91.com and apk.hiapk.com, it develops and operates the mobile application distribution platform of two smartphone giants for iPhone operating system and Android operating system)" 인 것으로 가정한다.
S102에서, 이벤트 발굴 후보 문장이 구문 단편들로 분할된다.
구문 단편들은 주어-술어 단편, 동사-목적어 단편, 부사 단편, 주어 단편 및 명사적 술어(nounal predicate) 단편 등을 포함한다.
예를 들면, S101에서 취득된 이벤트 발굴 후보 문장은 다음의 단편들로 분할된다. 주어 단편: 91 와이어리스 컴파니(91 Wireless CO.); 명사적 술어 단편: 네트워크 드래곤 컴파니의 자회사(the subsidiary of Network Dragon Co.); 부사 단편: 웹사이트 Sj.91.com 및 apk.hiapk.com에서(in websites Sj.91.com and apk.hiapk.com); 동사-목적어 단편: 중국에서 선도적인 모바일 인터넷 회사이고(is the leading mobile internet company in China); 주어-술어 단편: 그것은 아이폰 운영 체제 및 안드로이드 운영 체제용의 2개의 스마트폰 거대 진영의 모바일 애플리케이션 배포 플랫폼을 개발하고 운영한다(it develops and operates the mobile application distribution platform of two smartphone giants for iPhone operating system and Android operating system).
S103에서, 이벤트 지식 인스턴스가 구문 단편들 및 미리 설정된 이벤트 지식 구조에 따라 생성되고, 여기서 이벤트 지식 인스턴스의 수는 구문 단편들 내의 동사-목적어 단편들 및 주어-술어 단편들의 수와 동일한다.
본 개시의 일 실시예에서, 미리 설정된 이벤트 지식 구조는 4개의 속성, 즉 이벤트 지식 인스턴스의 식별자, 주어 엔티티, 목적어 엔티티 및 행동을 가지며; 주어 엔티티는 행동 개시자(action initiator)에 대응하는 엔티티 정보 및 수식(embellishment) 정보를 포함하고; 목적어 엔티티는 행동 감수자(action bearer)에 대응하는 엔티티 정보 및 수식 정보를 포함하며; 행동은 핵심 행동 및 제약(constraint) 정보를 포함하고, 여기서
(a) 이벤트 지식 인스턴스의 식별자는 주로 이벤트 지식 기반에 의해 할당되고 이벤트 ID 속성 내에 저장되는, 이벤트 지식 인스턴스의 고유한 독립 식별자이다. 단일의 이벤트 지식 인스턴스는 유일한 ID를 갖는다.
(b) 주어 엔티티는 이벤트의 행동 개시자를 식별하고(수동태 문장 내의 주어도 행동 개시자임); 그의 "엔티티" 속성 도메인은 엔티티명 및 엔티티 시맨틱 ID를 저장하고 그의 수정(modification) 속성 도메인(하나의 엔티티가 다수의 수정 속성을 포함할 수 있음)은 엔티티의 수정자 및 한정자를 저장하며; 단일의 이벤트 지식에서는, 하나의 주어 엔티티 속성이 적어도 필요하고; 주어 엔티티는 복수일 수 있으며; 물론, 상기 수정 속성 도메인 내에 저장된 정보는 수정 정보이다.
(c) 목적어 엔티티는 이벤트의 행동 감수자를 식별하고; 그의 엔티티 속성 도메인은 엔티티명 및 엔티티 시맨틱 ID를 저장하며; 엔티티 단어들 이외에, 수량사(quantifier)(예를 들어, 10.39%의 주식), 시간(날짜, 시/분/초), 일정 기간(예를 들어, XX일 내지 YY일, AA시 내지 BB시), 리소스(예를 들어, url, uri 등), 전화/우편번호, 위치/방향(예를 들어, 식당, 남쪽), 공구/재료(예를 들어, 양모, 임금), 비교(예를 들어, 1 대 2), 수단(예를 들어, 수술, 낮은 피치), 열거 단어(예를 들어, 별자리, 혈액형), 보통 명사(예를 들어, 모바일 애플리케이션 배포 플랫폼) 등도 목적어 엔티티로서 기능할 수 있고; 그의 수정 속성 도메인은 목적어 엔티티의 수정자 및 한정자를 저장하며; 단일의 이벤트 지식에서, 주어 엔티티, 예를 들면 잡스의 죽음이 누락될 수 있고; 물론, 상기 수정 속성 도메인 내에 저장된 정보는 수식 정보이다.
(d) 행동은 이벤트 내의 주어 엔티티의 행위를 식별하고; "핵심 행동"은 주어 엔티티의 행위를 식별하며 단일의 이벤트 지식은 유일한 행동 속성을 가지며(병렬 행동, 예를 들면 "개발하고 운영한다(develop and operate)"가 존재할 수 있음); 제약 속성은 핵심 행동을 수식하도록 구성되고 2개 이상의 제약 속성일 수 있고; 제약 속성은 특정 속성 유형(예를 들어, 시간, 가격, 상태, 방향 등)으로 식별될 수 있고 그 유형(예를 들어, 수량사 유형, 엔티티 유형)이 제약 속성의 속성값에 대해 할당될 수 있다.
구체적으로, 이벤트 지식 인스턴스는 미리 설정된 이벤트 지식 구조의 측면에서 동사-목적어 단편들 및 주어-술어 단편들의 수, 즉 하나의 이벤트 지식 인스턴스에 대응하는 각각의 동사-목적에 단편들 및 주어-술어 단편들의 수에 따라 생성된다. 예를 들면, 동사-목적어 단편 및 주어-술어 단편 모두는 단계 S102에서 취득된 구문 단편들 내에 존재하고, 그래서 2개의 이벤트 지식 인스턴스, 즉 표 1에 나타낸 event_1 및 event_2를 준비할 필요가 있다. 동시에, 동사-목적어 단편 및 주어-술어 단편을 제외한 모든 구문 단편이 동사-목적어 단편 및 주어-술어 단편의 수식 및 제약 구성성분으로 분류된다.
속성 유형 | 속성 | 값 | |
ID | 이벤트 ID | event_1 | event_2 |
주어 엔티티 | 엔티티 | -- | -- |
수식 | -- | -- | |
목적어 엔티티 | 엔티티 | -- | -- |
수식 | -- | -- | |
행동 | 핵심 행동 | -- | -- |
제약 | -- | -- |
S104에서, 이벤트 발굴 타깃 문장이 구문 단편들 내의 동사-목적어 단편들 및 주어-술어 단편들에 따라 취득되고, 이벤트 발굴 타깃 문장이 분할되며, 분할된 요소들이 대응적으로 이벤트 지식 인스턴스 내에 기록되어, 이벤트 지식 기반의 구축을 달성한다.
구체적으로, 단계 S104는, 처음에 이벤트 발굴 타깃 문장 내의 주어-술어 단편이 분할되고, 모든 분할된 요소가 이벤트 지식 문장의 주어 엔티티, 목적어 엔티티 및 행동 내에 기록되며; 주어 단편이 이벤트 발굴 타깃 문장 내의 동사-목적어 단편 내에 존재하는 경우, 주어 단편이 이벤트 지식 문장의 주어 엔티티 내에 기록되고, 동사-목적어 단편이 분할되고 모든 분할된 요소가 이벤트 지식 문장의 목적어 엔티티 및 행동 내에 기록되며; 주어-술어 단편 및 동사-목적어 단편을 제외한 이벤트 발굴 타깃 문장 내의 구문 단편들이 분할되고, 모든 분할된 요소가 이벤트 지식 문장의 수식 정보 및 제약 정보 내에 기록되는 것을 포함할 수 있고, 여기서 상기 요소들은 주어, 술어, 목적어, 주어 관형어, 부사 및 목적어 관형어 중 하나 이상을 포함한다.
이 실시예에서, 구문 단편들 내의 동사-목적어 단편 및 주어-술어 단편에 따라 취득된 이벤트 발굴 타깃 문장들은 다음과 같을 수 있다.
이벤트 발굴 타깃 문장 event_1: 네트워크 드래곤 컴파니의 자회사인 91 와이어리스 컴파니는 중국에서 선도적인 모바일 인터넷 회사이다(91 Wireless CO., the subsidiary of Network Dragon Co., is the leading mobile internet company in China).
이벤트 발굴 타깃 문장 event_2: 웹사이트 Sj.91.com 및 apk.hiapk.com에서, 그것은 아이폰 운영 체제 및 안드로이드 운영 체제용의 2개의 스마트폰 거대 진영의 모바일 애플리케이션 배포 플랫폼을 개발하고 운영한다(in website Sj.91.com and apk.hiapk.com, it develops and operates the mobile application distribution platform of two smartphone giants for iPhone operating system and Android operating system).
대응하는 이벤트 발굴 타깃 문장들을 취득한 후, 발굴은 동사 주위에서 수행될 수 있다. 즉, 처음에 이벤트 발굴 타깃 문장들 내의 주어-술어 단편들 및 동사-목적어 단편들이 분할될 수 있고, 그런 다음 그 외의 단편들이 분할될 수 있다.
이 실시예에서, 처음에 이벤트 발굴 타깃 문장 event_2의 주어-술어 단편들이 분할되어 주어, 주어 관형어, 술어 핵심 동사, 부사, 목적어 및 목적어 관형어을 취득할 수 있고, 이들 요소는 이벤트 지식 인스턴스의 주어 엔티티, 목적어 엔티티 및 행동 내에 각각 기록된다.
예를 들면, "그것은 아이폰 운영 체제 및 안드로이드 운영 체제용의 2개의 스마트폰 거대 진영의 모바일 애플리케이션 배포 플랫폼을 개발하고 운영한다(it develops and operates the mobile application distribution platform of two smartphone giants for iPhone operating system and Android operating system)"는 다음과 같이 분할될 수 있다. 주어: 그것은(it); 부사: 아이폰 운영 체제 및 안드로이드 운영 체제(iPhone operating system and Android operating system); 동사: 개발하고 운영한다(develop and operate); 목적어: 2개의 스마트폰 거대 진영의 모바일 애플리케이션 배포 플랫폼을(the mobile application distribution platform of two smartphone giants). 그런 다음, 분할된 요소들이 표 1에 나타낸 이벤트 지식 기반의 이벤트 지식 인스턴스들 내에 기록될 수 있고, 결과적인 이벤트 지식 기반이 표 2에 표시될 수 있다.
속성 유형 | 속성 | 값 | |
ID | 이벤트 ID | event_1 | event_2 |
주어 엔티티 | 엔티티 | -- | 그것은(it) |
수식 | -- | -- | |
목적어 엔티티 |
엔티티 |
-- |
2개의 스마트폰 거대 진영의 모바일 애플리케이션 배포 플랫폼을(mobile application distribution platform of two smartphone giants) |
수식 | -- | -- | |
행동 |
핵심 행동 | -- | 개발하고 운영한다(develop and operate) |
제약 |
-- |
아이폰 운영 체제 및 안드로이드 운영 체제(iPhone operating system and Android operating system) |
그런 다음, 이벤트 발굴 타깃 문장 event_1의 동사-목적어 단편이 분할될 수 있다. 처음에, 주어 단편이 이러한 전체 문장 내에 존재하는지의 여부가 결정된다. 주어 단편이 존재하는 경우, 주어 단편이 이벤트 지식 인스턴스의 주어 엔티티 내에 기록될 것이다. 그런 다음, 종속성 구문 발굴이 동사-목적어 단편 내의 동사, 부사, 목적어, 목적어 관형어 및 그 외의 요소들을 찾아내기 위해서 채택될 수 있고, 이들 요소는 대응하는 이벤트 지식 인스턴스들의 목적어 엔티티 및 행동 내에 각각 기록된다. 주어 단편이 존재하지 않는 경우, 발굴하려는 이러한 단편은 폐기된다.
예를 들면, "중국에서 선도적인 모바일 인터넷 회사이다(is the leading mobile internet company in China)"는 다음과 같이 분할될 수 있다. 동사: 이다(is); 목적어: 모바일 인터넷 회사(mobile internet company); 목적어 관형어: 중국에서 선도적인(leading in China). 분할된 요소들은 표 2에 나타낸 이벤트 지식 기반의 이벤트 지식 인스턴스들 내에 기록될 수 있고, 결과적인 이벤트 지식 기반이 표 3에 표시될 수 있다.
속성 유형 | 속성 | 값 | |
ID | 이벤트 ID | event_1 | event_2 |
주어 엔티티 |
엔티티 | 91 와이어리스 (91 Wireless) | 그것은(it) |
수식 | -- | -- | |
목적어 엔티티 |
엔티티 |
모바일 인터넷 회사(mobile internet company) | 2개의 스마트폰 거대 진영의 모바일 애플리케이션 배포 플랫폼을(mobile application distribution platform for two smartphone giants) |
수식 | 중국에서 선도적인(leading in China) | -- | |
행동 |
핵심 행동 | 이다(is) | 개발하고 운영한다(develop and operate) |
제약 |
-- |
아이폰 운영 체제 및 안드로이드 운영 체제(iPhone operating system and Android operating system) |
마지막으로, 그외의 수식 성분들이 추가될 수 있다. 예를 들면, 우측에서 가장 가까운 핵심 행동의 제약으로서 이벤트 발굴 타깃 문장 event_2의 부사 단편이 이벤트 지식 인스턴스 내에 추가된다. 예를 들면, 표 4에 나타낸 바와 같이, 부사 단편 "웹사이트 Sj.91.com 및 apk.hiapk.com에서(in websites Sj.91.com and apk.hiapk.com)"가 이벤트 지식 인스턴스 내에 추가된다.
속성 유형 | 속성 | 값 | |
ID | 이벤트 ID | event_1 | event_2 |
주어 엔티티 |
엔티티 | 91 와이어리스(91 Wireless) | 그것은(it) |
수식 | -- | -- | |
목적어 엔티티 |
엔티티 |
모바일 인터넷 회사(mobile internet company) | 2개의 스마트폰 거대 진영의 모바일 애플리케이션 배포 플랫폼을(mobile application distribution platform for two smartphone giants) |
수식 | 중국에서 선도적인(leading in China) | -- | |
행동 |
핵심 행동 | 이다(is) | 개발하고 운영한다(develop and operate) |
제약 |
-- |
아이폰 운영 체제 및 안드로이드 운영 체제(iPhone operating system and Android operating system) | |
제약 | -- |
sj
.91.com
apk . hiapk .com |
그런 다음, 명사적 술어 단편이 이벤트 지식 기반의 이벤트 지식 인스턴스 내에 추가된다. 구체적으로, 처음에 주어 단편이 이러한 전체 문장 내에 존재하는지의 여부가 판정된다. 주어 단편이 존재하는 경우에는, 이벤트 지식 인스턴스의 주어 엔티티의 수식 내에 추가될 것이다. 주어 단편이 존재하지 않는 경우, 현재의 단편이 폐기된다. 예를 들면, 표 5에 나타낸 바와 같이, 명사적 술어 단편 "네트워크 드래곤 컴파니의 자회사(the subsidiary of Network Dragon Co.)"가 이벤트 지식 인스턴스 내에 추가된다.
속성 유형 | 속성 | 값 | |
ID | 이벤트 ID | event_1 | event_2 |
주어 엔티티 |
엔티티 | 91 와이어리스(91 Wireless) | 그것은(it) |
수식 |
네트워크 드래콘 컴파 니의 자회사(the subsidiary of Network Dragon Co.) | -- |
|
목적어 엔티티 |
엔티티 |
모바일 인터넷 회사(mobile internet company) | 2개의 스마트폰 거대 진영의 모바일 애플리케이션 배포 ㅍ플랫폼을(bile application distribution platform for two smartphone giants) |
수식 | 중국에서 선도적인(leading in China) | -- | |
행동 |
핵심 행동 | 이다(is) | 개발하고 운영한다(develop and operate) |
제약 |
-- |
아이폰 운영 체제 및 안드로이드 운영 체제(iPhone operating system and Android operating system) | |
제약 | -- | sj.91.com apk.hiapk.com |
굵은 폰트로 표시된 부분은 현재의 표에 새롭게 추가된 것이다. 이벤트 지식 기반의 동적 구축 절차는 표 1 내지 표 5로부터 알 수 있다.
본 개시의 실시예들은 웹페이지 텍스트 내의 문장들로부터 단편화에 의해 미리 설정된 구조로 이벤트 지식 기반을 수집하고 채워서, 이벤트 지식 인스턴스들을 수집하는 것을 알 수 있다. 그러나, 완전한 이벤트에 대하여, 단일 이벤트의 정보는 편파적일 수 있다. 일례로서 표 6에서의 3개의 이벤트 지식 인스턴스에 따르면, 이들 3개의 이벤트 지식 인스턴스는 상이한 어순으로 상이한 측면들로부터 "바이두 컴파니는 네트워크 드래곤 컴파니를 인수하다(BAIDU Co. acquires Network Dragon Co.)"라는 하나의 이벤트를 기술한다. 그러나, 단 하나의 지식 인스턴스에 의해 취득된 정보는 편파적이다.
속성 유형 | 속성 | 값 | ||
ID | 이벤트 ID | event_1 | event_2 | event_3 |
주어 엔티티 |
엔티티 |
바이두 컴파니 (company_XXX) (BAIDU Co. (company_XXX)) |
바이두 컴파니 (company_XXX) (BAIDU Co. (company_XXX)) |
91 와이어리스(91 Wireless) |
수식 |
중국의 검색 엔진 대기업(Chinese search engine giant) |
-- |
||
목적어 엔티티 |
엔티티 | 91 와이어리스 (company_YYY) (91 Wireless (company_YYY)) |
91 와이어리스 (company_YYY) (91 Wireless (company_YYY)) |
바이두 컴파니 (company_XXX) (BAIDU Co. (company_XXX)) |
수식 |
네트워크 드래곤 컴파니의 자회사(the subsidiary of Network Dragon Co.) | -- | ||
행동 |
핵심 행동 | 인수하다(acquire) | 합병하다(merger) | 인수되다(acquired) |
제약 | (시간) 2013년 7월 ((time) July 2013) |
(가격) 미화 19억 달러 ((price) 1.9 billion (USD)) |
(수단) 주식으로 ((means) by shares) |
가능한 한 많이 이벤트 지식 기반 내의 이벤트에 관한 정보를 수집할 수 있는 것을 보장하기 위해서, 단편화된 이벤트 지식 인스턴스들이 병합에 필요하고, 이에 따라 보다 상세한 정보를 갖는 보다 완전한 지식 인스턴스를 형성한다.
따라서, 도 2에 나타낸 바와 같이, 단계 S104 후, 상기 방법은 다음과 같은 단계들을 더 포함한다.
S105에서, 클러스터 분석이 이벤트 지식 기반 내의 이벤트 지식 인스턴스들에 대해 수행되어 등가 이벤트들의 세트를 취득한다.
단계 S105는, 구체적으로, 클러스터 분석이 이벤트 지식 기반 내의 일치하는 주어 엔티티, 일치하는 주어 엔티티 및 행동의 일치하는 제약 정보를 갖는 모든 이벤트 지식 인스턴스에 대해 수행되어, 제1 등가 이벤트들을 취득하고, 제1 등가 이벤트들의 핵심 행동이 추출되어 등가 행동 사전(dictionary)을 생성하며; 클러스터 분석이 주어 엔티티와 일치하는 주어 엔티티를 갖는 모든 이벤트 지식 인스턴스에 대해 수행되어 제2 등가 이벤트들을 취득하고, 일치하는 핵심 행동을 갖는 모든 이벤트 지식 인스턴스가 등가 행동 사전에 따라 제2 등가 이벤트들로부터 선택되어 등가 이벤트들의 세트를 생성한다.
S106에서, 등가 이벤트들의 세트 내의 모든 이벤트 지식 인스턴스의 정보가 이벤트 지식 기반 내에 기록되어, 새로운 이벤트 지식 인스턴스를 형성한다.
표 6에서의 3개의 이벤트 지식 인스턴스에 대한 병합 절차는 다음과 같다.
우선, 클러스터 분석이 개시자의 주어 엔티티 및 감수자의 주어 엔티티의 모든 이벤트 지식 인스턴스에 대하여 상충하는 제약 정보 없이 수행되고, 동일한 카테고리를 갖는 모든 이벤트 지식 인스턴스가 "등가 이벤트들"로서 간주되고, 등가 이벤트들의 핵심 행동들이 추출되어 이 실시예에서 "인수한, 합병한 및 인수된(acquiring, merging and being acquired)"이라 칭하는 등가 행동 사전을 형성할 수 있다. 그런 다음, 클러스터 분석이 감수자의 주어 엔티티와 일치하는 촉진자(promoter)의 주어 엔티티를 갖는 모든 이벤트 지식 인스턴스에 대해 재차 수행되고, 등가 핵심 행동을 갖는 모든 이벤트 지식 인스턴스가 등가 행동 사전에 따라 클러스터로부터 선택되어 등가 이벤트들의 세트를 형성할 수 있고, 여기서 등가 이벤트들의 세트 내의 이벤트 지식 인스턴스들은 event_1, event_2 및 event_3이다. 그런 다음, 임의의 이벤트 지식 인스턴스가 핵심 이벤트(EV)로서 등가 이벤트들의 세트로부터 선택되고, 그 외의 이벤트들 내의 모든 제약 및 주어 엔티티 수식 속성이 EV에 병합되어, 이벤트 지식 기반 내에 추가되고 이벤트 지식 기반에 의해 고유한 이벤트 ID를 할당받은 최종 병합된 이벤트 지식 인스턴스를 형성한다. 상기 병합 절차에 의해, 표 7에 나타낸 바와 같이, event_1, event_2 및 event_3이 새로운 이벤트 지식 인스턴스 event_4에 병합된다.
속성 유형 | 속성 | 값 |
ID | 이벤트 ID | event_4 |
주어 엔티티 |
엔티티 | 바이두 컴파니 (company_XXX) (BAIDU Co. (company_XXX)) |
수식 1 | 중국의 검색 엔진 대기업 (Chinese search engine giant) |
|
수식 2 | 검색 엔진 대기업 (search engine giant) |
|
목적어 엔티티 |
엔티티 | 91 와이어리스 (company_YYY) (91 Wireless (company_YYY)) |
수식 1 | 네트워크 드래곤 컴파니의 자회사 (the subsidiary of Network Dragon Co.) |
|
수식 2 | 무선 배포 플랫폼 (wireless distribution platform) |
|
행동 |
핵심 행동 | 인수하다, 합병하다 (Acquire, merger) |
제약 1 | (시간) 2013년 7월 ((time) July 2013) |
|
제약 2 | (가격) 미화 19억 달러 ((price) 1.9 billion (USD)) |
|
제약 3 | (수단) 주식으로 ((means) by shares) |
이벤트 지식 기반을 구축하기 위한 상기 방법은 미리 설정된 이벤트 지식 구조 및 구문 단편들에 따라 이벤트 지식 기반을 구축할 수 있고, 이벤트 지식 기반에 기초하여 웹페이지 지식을 구조화할 수 있으며, 또한 지식 간의 추론 및 계산을 지원할 수 있다. 또한, 상기 방법은 관련 이벤트들을 병합할 수 있고, 이에 따라 사용자가 구체적인 지식 검색을 실시할 경우에 사용자에게 정확한 검색 결과를 제공하고, 또한 사용자의 검색 경험을 향상시킨다.
도 3은 본 개시의 일 실시예에 따른 이벤트 지식 기반을 구축하기 위한 장치를 나타내는 블록도이다.
도 3에 나타낸 바와 같이, 상기 장치는 식별 모듈(310), 분할 모듈(320), 생성 모듈(330) 및 기록 모듈(340)을 포함한다.
식별 모듈(310)은 텍스트를 식별하여 이벤트 발굴 후보 문장을 취득하도록 구성되고; 분할 모듈(320)은 식별 모듈에 의해 식별된 이벤트 발굴 후보 문장을 구문 단편들로 분할하도록 구성되며; 생성 모듈(330)은 분할 모듈에 의해 취득된 구문 단편들 및 미리 설정된 이벤트 지식 구조에 따라 이벤트 지식 인스턴스를 생성하도록 구성되고, 여기서 이벤트 지식 인스턴스들의 수는 구문 단편들 내의 동사-목적어 단편들 및 주어-술어 단편들의 수와 동일하고; 기록 모듈(340)은 구문 단편들 내의 동사-목적어 단편들 및 주어-술어 단편들에 따라 이벤트 발굴 타깃 문장을 취득하여, 이벤트 발굴 타깃 문장을 분할하고, 분할된 요소들을 대응적으로 이벤트 지식 인스턴스 내에 기록하여, 이벤트 지식 기반의 구축을 달성하도록 구성된다.
본 개시의 일 실시예에서, 미리 설정된 지식 구조는 4개의 속성, 즉 이벤트 지식 인스턴스의 식별자, 주어 엔티티, 목적어 엔티티 및 행동을 가지며; 주어 엔티티는 행동 개시자에 대응하는 엔티티 정보 및 수식 정보를 포함하고; 목적어 엔티티는 행동 감수자에 대응하는 엔티티 정보 및 수식 정보를 포함하며; 행동은 핵심 행동 및 제약 정보를 포함하고, 여기서
(a) 이벤트 지식 인스턴스의 식별자는 주로 이벤트 지식 기반에 의해 할당되고 이벤트 ID 속성 내에 저장되는, 이벤트 지식 인스턴스의 고유한 독립 식별자이다. 단일의 이벤트 지식 인스턴스는 유일한 ID를 갖는다.
(b) 주어 엔티티는 이벤트의 행동 개시자를 식별하고(수동태 문장 내의 주어도 행동 개시자임); 그의 엔티티 속성 도메인은 엔티티명 및 엔티티 시맨틱 ID를 저장하고 그의 수정 속성 도메인(하나의 엔티티가 다수의 수정 속성을 포함할 수 있음)은 엔티티의 수정자 및 한정자를 저장하며; 단일의 이벤트 지식에서는, 하나의 주어 엔티티 속성이 적어도 필요하고; 주어 엔티티는 복수일 수 있으며; 물론, 상기 수정 속성 도메인 내에 저장된 정보는 수식 정보이다.
(c) 목적어 엔티티는 이벤트의 행동 감수자를 식별하고; 그의 엔티티 속성 도메인은 엔티티명 및 엔티티 시맨틱 ID를 저장하며; 엔티티 단어들 이외에, 수량사(예를 들어, 10.39%의 지식), 시간(날짜, 시/분/초), 일정 기간(예를 들어, XX일 내지 YY일, AA시 내지 BB시), 리소스(예를 들어, url, uri 등), 전화/우편번호, 위치/방향(예를 들어, 식당, 남쪽), 공구/재료(예를 들어, 양모, 임금), 비교(예를 들어, 1 대 2), 수단(예를 들어, 수술, 낮은 피치), 열거 단어(예를 들어, 별자리, 혈액형), 보통 명사(예를 들어, 모바일 애플리케이션 배포 플랫폼) 등도 목적어 엔티티로서 기능할 수 있고; 그의 수정 속성 도메인은 목적어 엔티티의 수정자 및 한정자를 저장하며; 단일의 이벤트 지식에서, 주어 엔티티, 예를 들면 잡스의 죽음이 누락될 수 있고; 물론, 상기 수정 속성 도메인 내에 저장된 정보는 수식 정보이다.
(d) 행동은 이벤트 내의 주어 엔티티의 행위를 식별하고; "핵심 행동"은 주어 엔티티의 행위를 식별하며 단일의 이벤트 지식은 유일한 행동 속성을 가지며(병렬 행동, 예를 들면 "개발하고 운영한다(develop and operate)"가 존재할 수 있음); 제약 속성은 핵심 행동을 수식하도록 구성되고 2개 이상의 제약 속성일 수 있고; 제약 속성은 특정 속성 유형(예를 들어, 시간, 가격, 상태, 방향 등)으로 식별될 수 있고 그 유형(예를 들어, 수량사 유형, 엔티티 유형)이 제약 속성의 속성값에 대해 할당될 수 있다.
기록 모듈(340)이 이벤트 발굴 타깃 문장들을 취득한 후, 발굴이 동사 주위에서 수행될 수 있다. 즉, 처음에 이벤트 발굴 타깃 문장들 내의 주어-술어 단편들 및 동사-목적어 단편들이 분할될 수 있고, 그런 다음 그 외의 단편들이 분할될 수 있다.
구체적으로, 기록 모듈(340)은, 이벤트 발굴 타깃 문장 내의 주어-술어 단편을 분할하고, 분할된 모든 요소를 이벤트 지식 문장의 주어 엔티티, 목적어 엔티티 및 행동 내에 기록하며; 주어 단편이 이벤트 발굴 타깃 문장 내의 동사-목적어 단편 내에 존재하는 경우, 주어 단편을 이벤트 지식 문장의 주어 엔티티 내에 기록하고, 동사-목적어 단편을 분할하며 분할된 모든 요소를 이벤트 지식 문장의 목적어 엔티티 및 행동 내에 기록하고; 주어-술어 단편 및 동사-목적어 단편을 제외한 이벤트 발굴 타깃 문장 내의 구문 단편들을 분할하고, 분할된 모든 요소를 이벤트 지식 문장의 수식 정보 및 제약 정보 내에 기록하도록 구성되며, 여기서 상기 요소들은 주어, 술어, 목적어, 주어 관형어, 부사 및 목적어 관형어 중 하나 이상을 포함한다.
또한, 상기 장치는 폐기 모듈(350)을 더 포함할 수 있다. 도 4에 나타낸 바와 같이, 주어 단편이 이벤트 발굴 타깃 문장 내의 동사-목적어 단편 내에 존재하지 않는 경우, 폐기 모듈(350)은 동사-목적어 단편을 폐기하도록 구성된다.
식별 모듈(310), 분할 모듈(320), 생성 모듈(330), 기록 모듈(340) 및 폐기 모듈(350)을 포함하는 상기 장치의 작업 절차는 도 1을 인용할 수 있어, 본 명세서에서는 상세히 설명하지 않을 것이다.
또한, 상기 장치는 병합 모듈(360)을 또한 포함한다. 병합 모듈(360)은, 이벤트 지식 기반 내의 이벤트 지식 인스턴스들에 대하여 클러스터 분석을 수행하여 기록 모듈(340)이 분할된 요소들을 대응하는 이벤트 지식 인스턴스 내에 기록한 후에 등가 이벤트들의 세트를 취득하도록 구성되고, 등가 이벤트들의 세트 내의 모든 이벤트 지식 인스턴스의 정보를 이벤트 지식 기반 내에 기록하여, 새로운 이벤트 지식 인스턴스를 형성하도록 구성된다.
구체적으로, 병합 모듈(360)은, 이벤트 지식 기반 내의 일치하는 주어 엔티티, 일치하는 주어 엔티티 및 행동의 일치하는 제약 정보를 갖는 모든 이벤트 지식 인스턴스에 대하여 클러스터 분석을 수행하여, 제1 등가 이벤트들을 취득하고, 제1 등가 이벤트들에서 핵심 행동들을 추출하여 등가 행동 사전을 생성하며; 주어 엔티티와 일치하는 주어 엔티티를 갖는 모든 이벤트 지식 인스턴스에 대하여 클러스터 분석을 수행하여, 제2 등가 이벤트들을 취득하고, 등가 행동 사전에 따라 제2 등가 이벤트들로부터 일치하는 핵심 행동을 갖는 모든 이벤트 지식 인스턴스를 선택하여 등가 이벤트들의 세트를 생성하도록 구성된다.
식별 모듈(310), 분할 모듈(320), 생성 모듈(330), 기록 모듈(340), 폐기 모듈(350) 및 병합 모듈(360)을 포함하는 상기 장치의 작업 절차는 도 2를 인용할 수 있어, 본 명세서에서는 상세히 설명하지 않을 것이다.
이벤트 지식 기반을 구축하기 위한 상기 장치는 미리 설정된 이벤트 지식 구조 및 구문 단편들에 따라 이벤트 지식 기반을 구축할 수 있고, 이벤트 지식 기반에 기초하여 웹페이지 지식을 구조화할 수 있으며, 또한 지식 간의 추론 및 계산을 지원할 수 있다. 또한, 상기 장치는 관련 이벤트들을 병합할 수 있어, 사용자가 구체적인 지식 검색을 실시할 경우에 사용자에게 정확한 검색 결과를 제공하고, 또한 사용자의 검색 경험을 향상시킨다.
상기 실시예들을 실현하기 위해서, 본 개시는 또한 실시예들 중 어느 하나에 따른 이벤트 지식 기반을 구축하기 위한 방법을 실행하기 위해서 사용되는 응용 프로그램을 저장하도록 구성된 저장 매체를 제공한다.
본 개시의 각 부분은 하드웨어, 소프트웨어, 펌웨어 또는 그들의 조합에 의해 실현될 수 있음을 이해해야 한다. 상기 실시예들에서, 복수의 단계 및 방법은 메모리 내에 저장되고 적절한 명령어 실행 시스템에 의해 실행되는 소프트웨어 또는 펌웨어에 의해 실현될 수 있다. 예를 들면, 하드웨어에 의해 실현되는 경우, 마찬가지로 다른 실시예에서, 상기 단계들 또는 방법들은 당 기술분야에 공지된 다음의 기술들, 즉 데이터 신호의 논리 기능을 실현하기 위한 논리 게이트 회로를 갖는 이산 논리 회로, 적절한 조합 논리 게이트 회로를 갖는 ASIC(application-specific integrated circuit), PGA(programmable gate array), FPGA(field programmable gate array) 등 중 하나 또는 조합에 의해 실현될 수 있다.
본 명세서 전반에 걸쳐서 "일 실시예", "일부 실시예", "하나의 실시예", "다른 실시예", "일례", "특정예", 또는 "일부 예"에 대한 참조는 실시예 또는 예와 관련하여 설명된 특정한 특성, 구성, 재료, 또는 특징이 본 개시의 적어도 하나의 실시예 또는 예에 포함되는 것을 의미한다. 따라서, 본 명세서 전반에 걸쳐서 다양한 곳에서 "일부 실시예에서", "하나의 실시예에서", "일 실시예에서", "다른 예에서", "일례에서", "특정예에서", 또는 "일부 예에서"와 같은 문구의 출현은 반드시 본 개시의 동일 실시예 또는 예를 지칭하는 것은 아니다. 또한, 특정한 특성들, 구성들, 재료들, 또는 특징들은 하나 이상의 실시예 또는 예에서 임의의 적절한 방식으로 조합될 수 있다.
예시적인 실시예들을 나타내고 설명했지만, 상기 실시예들은 본 개시를 한정하는 것으로 해석될 수 없고, 본 개시의 사상, 원리 및 범주를 이탈하지 않고서 실시예들에서 변경예, 대체예, 및 변형예가 이루어질 수 있음이 당업자에게 인정될 것이다.
Claims (15)
- 이벤트 지식 기반을 구축하기 위한 방법으로서,
텍스트를 식별하여 이벤트 발굴(mining) 후보 문장을 취득하는 단계;
상기 이벤트 발굴 후보 문장을 구문 단편(syntax fragment)들로 분할하는 단계;
상기 구문 단편들 및 미리 설정된 이벤트 지식 구조에 따라 이벤트 지식 인스턴스(instance)를 생성하는 단계를 포함하되, 상기 이벤트 지식 인스턴스들의 수는 상기 구문 단편들 내의 동사-목적어(verb-object) 단편들 및 주어-술어(subject-predicate) 단편들의 수와 동일하고, 상기 미리 설정된 이벤트 지식 구조는 4개의 속성, 즉 이벤트 지식 인스턴스의 식별자, 주어 엔티티(subject entity), 목적어 엔티티(object entity) 및 행동을 가지며; 상기 주어 엔티티는 행동 개시자(action initiator)에 대응하는 엔티티 정보 및 수식(embellishment) 정보를 포함하고; 상기 목적어 엔티티는 행동 감수자(action bearer)에 대응하는 엔티티 정보 및 수식 정보를 포함하며; 상기 행동은 핵심 행동 및 제약(constraint) 정보를 포함하고; 및
상기 구문 단편들 내의 상기 동사-목적어 단편들 및 상기 주어-술어 단편들에 따라 이벤트 발굴 타깃 문장을 취득하고, 상기 이벤트 발굴 타깃 문장을 분할하며, 분할된 요소들을 대응적으로 이벤트 지식 인스턴스 내에 기록하여, 상기 이벤트 지식 기반의 구축을 달성하는 단계를 포함하되,
상기 이벤트 발굴 타깃 문장을 분할하며, 분할된 요소들을 대응적으로 이벤트 지식 인스턴스 내에 기록하는 단계는,
상기 이벤트 발굴 타깃 문장 내의 상기 주어-술어 단편을 분할하고, 분할된 모든 요소를 상기 이벤트 지식 문장의 상기 주어 엔티티, 상기 목적어 엔티티 및 상기 행동 내에 기록하는 단계;
주어 단편이 상기 이벤트 발굴 타깃 문장 내의 상기 동사-목적어 단편 내에 존재하는 경우, 상기 주어 단편을 상기 이벤트 지식 문장의 상기 주어 엔티티 내에 기록하고, 상기 동사-목적어 단편을 분할하며, 상기 분할된 모든 요소를 상기 이벤트 지식 문장의 상기 주어 엔티티 및 상기 행동 내에 기록하는 단계; 및
상기 주어-술어 단편 및 상기 동사-목적어 단편을 제외한 상기 이벤트 발굴 타깃 문장 내의 구문 단편들을 분할하고, 분할된 모든 요소를 상기 이벤트 지식 문장의 상기 수식 정보 및 상기 제약 정보 내에 기록하는 단계를 포함하고,
상기 요소들은 주어, 술어, 목적어, 주어 관형어, 부사 및 목적어 관형어 중 하나 이상을 포함하는 이벤트 지식 기반을 구축하기 위한 방법. - 제1항에 있어서,
상기 구문 단편들은 동사-목적어 단편, 주어-술어 단편, 부사 단편, 주어 단편 및 명사적 술어(nounal predicate) 단편 중 하나 이상을 포함하는 이벤트 지식 기반을 구축하기 위한 방법. - 삭제
- 삭제
- 제1항에 있어서,
상기 주어 단편이 상기 이벤트 발굴 타깃 문장 내의 상기 동사-목적어 단편 내에 존재하지 않는 경우, 상기 동사-목적어 단편을 폐기하는 단계를 더 포함하는 이벤트 지식 기반을 구축하기 위한 방법. - 제5항에 있어서,
상기 분할된 요소들을 대응적으로 상기 이벤트 지식 인스턴스 내에 기록한 후,
상기 이벤트 지식 기반 내의 이벤트 지식 인스턴스들에 대하여 클러스터 분석을 수행하여 등가 이벤트들의 세트를 취득하는 단계; 및
상기 등가 이벤트들의 세트 내의 모든 이벤트 지식 인스턴스의 정보를 상기 이벤트 지식 기반 내에 기록하여, 새로운 이벤트 지식 인스턴스를 형성하는 단계
를 더 포함하는 이벤트 지식 기반을 구축하기 위한 방법. - 제6항에 있어서,
상기 이벤트 지식 기반 내의 이벤트 지식 인스턴스들에 대하여 클러스터 분석을 수행하여 등가 이벤트들의 세트를 취득하는 단계는,
상기 이벤트 지식 기반 내의 일치하는 주어 엔티티, 일치하는 주어 엔티티 및 상기 행동의 일치하는 제약 정보를 갖는 모든 이벤트 지식 인스턴스에 대하여 상기 클러스터 분석을 수행하여, 제1 등가 이벤트들을 취득하고, 상기 제1 등가 이벤트들의 상기 핵심 행동을 추출하여 등가 행동 사전을 생성하는 단계; 및
상기 주어 엔티티와 일치하는 상기 주어 엔티티를 갖는 모든 이벤트 지식 인스턴스에 대하여 상기 클러스터 분석을 수행하여 제2 등가 이벤트들을 취득하고, 상기 등가 행동 사전에 따라 상기 제2 등가 이벤트들로부터 일치하는 핵심 행동을 갖는 모든 이벤트 지식 인스턴스를 선택하여 등가 이벤트들의 세트를 생성하는 단계
를 포함하는 이벤트 지식 기반을 구축하기 위한 방법. - 이벤트 지식 기반을 구축하기 위한 장치로서,
텍스트를 식별하여 이벤트 발굴 후보 문장을 취득하도록 구성된 식별 모듈;
상기 식별 모듈에 의해 식별된 상기 이벤트 발굴 후보 문장을 구문 단편들로 분할하도록 구성된 분할 모듈;
상기 분할 모듈에 의해 취득된 상기 구문 단편들 및 미리 설정된 이벤트 지식 구조에 따라 이벤트 지식 인스턴스를 생성하도록 구성된 생성 모듈을 포함하되, 상기 이벤트 지식 인스턴스들의 수는 상기 구문 단편들 내의 동사-목적어 단편들 및 주어-술어 단편들의 수와 동일하고, 상기 미리 설정된 이벤트 지식 구조는 4개의 속성, 즉 이벤트 지식 인스턴스의 식별자, 주어 엔티티, 목적어 엔티티 및 행동을 가지며; 상기 주어 엔티티는 행동 개시자에 대응하는 엔티티 정보 및 수식 정보를 포함하고; 상기 목적어 엔티티는 행동 감수자에 대응하는 엔티티 정보 및 수식 정보를 포함하며; 상기 행동은 핵심 행동 및 제약 정보를 포함하고; 및
상기 구문 단편들 내의 상기 동사-목적어 단편들 및 상기 주어-술어 단편들에 따라 이벤트 발굴 타깃 문장을 취득하고, 상기 이벤트 발굴 타깃 문장을 분할하며, 분할된 요소들을 대응적으로 이벤트 지식 인스턴스 내에 기록하여, 상기 이벤트 지식 기반의 구축을 달성하도록 구성된 기록 모듈을 포함하되,
상기 기록 모듈은, 구체적으로
상기 이벤트 발굴 타깃 문장 내의 상기 주어-술어 단편을 분할하고, 분할된 모든 요소를 상기 이벤트 지식 문장의 상기 주어 엔티티, 상기 목적어 엔티티 및 상기 행동 내에 기록하며;
주어 단편이 상기 이벤트 발굴 타깃 문장 내의 상기 동사-목적어 단편 내에 존재하는 경우, 상기 주어 단편을 상기 이벤트 지식 문장의 상기 주어 엔티티 내에 기록하고, 상기 동사-목적어 단편을 분할하며, 상기 분할된 모든 요소를 상기 이벤트 지식 문장의 상기 주어 엔티티 및 상기 행동 내에 기록하고; 및
상기 주어-술어 단편 및 상기 동사-목적어 단편을 제외한 상기 이벤트 발굴 타깃 문장 내의 구문 단편들을 분할하고, 분할된 모든 요소를 상기 이벤트 지식 문장의 상기 수식 정보 및 상기 제약 정보 내에 기록하도록 구성되며,
상기 요소들은 주어, 술어, 목적어, 주어 관형어, 부사 및 목적어 관형어 중 하나 이상을 포함하는 이벤트 지식 기반을 구축하기 위한 장치. - 제8항에 있어서,
상기 구문 단편들은 동사-목적어 단편, 주어-술어 단편, 부사 단편, 주어 단편 및 명사적 술어 단편 중 하나 이상을 포함하는 이벤트 지식 기반을 구축하기 위한 장치. - 삭제
- 삭제
- 제8항에 있어서,
상기 주어 단편이 상기 이벤트 발굴 타깃 문장 내의 동사-목적어 단편 내에 존재하지 않는 경우, 상기 동사-목적어 단편을 폐기하도록 구성된 폐기 모듈을 더 포함하는 이벤트 지식 기반을 구축하기 위한 장치. - 제12항에 있어서,
상기 기록 모듈이 상기 분할된 요소들을 대응적으로 상기 이벤트 지식 인스턴스 내에 기록한 후에 상기 이벤트 지식 기반 내의 이벤트 지식 인스턴스들에 대하여 클러스터 분석을 수행하여 등가 이벤트들의 세트를 취득하고, 상기 등가 이벤트들의 세트 내의 모든 이벤트 지식 인스턴스의 정보를 상기 이벤트 지식 기반 내에 기록하여, 새로운 이벤트 지식 인스턴스를 형성하도록 구성된 병합 모듈을 더 포함하는 이벤트 지식 기반을 구축하기 위한 장치. - 제13항에 있어서,
상기 병합 모듈은, 구체적으로
상기 이벤트 지식 기반 내의 일치하는 주어 엔티티, 일치하는 주어 엔티티 및 상기 행동의 일치하는 제약 정보를 갖는 모든 이벤트 지식 인스턴스에 대하여 상기 클러스터 분석을 수행하여, 제1 등가 이벤트들을 취득하고, 상기 제1 등가 이벤트들 내의 상기 핵심 행동을 추출하여 등가 행동 사전을 생성하며;
상기 주어 엔티티와 일치하는 상기 주어 엔티티를 갖는 모든 이벤트 지식 인스턴스에 대하여 상기 클러스터 분석을 수행하여 제2 등가 이벤트들을 취득하고, 상기 등가 행동 사전에 따라 상기 제2 등가 이벤트들로부터 일치하는 핵심 행동을 갖는 모든 이벤트 지식 인스턴스들을 선택하여 상기 등가 이벤트들의 세트를 생성하도록 구성되는 이벤트 지식 기반을 구축하기 위한 장치. - 제1항, 제2항, 및 제5항 내지 제7항 중 어느 한 항에 따른 이벤트 지식 기반을 구축하기 위한 방법을 실행하기 위한 응용 프로그램을 포함하는 기록 매체.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410010694.7 | 2014-01-09 | ||
CN201410010694.7A CN103699689B (zh) | 2014-01-09 | 2014-01-09 | 事件知识库的构建方法及装置 |
PCT/CN2014/090073 WO2015103899A1 (zh) | 2014-01-09 | 2014-10-31 | 事件知识库的构建方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160018588A KR20160018588A (ko) | 2016-02-17 |
KR101707369B1 true KR101707369B1 (ko) | 2017-02-15 |
Family
ID=50361217
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157036777A KR101707369B1 (ko) | 2014-01-09 | 2014-10-31 | 이벤트 저장소의 구축 방법 및 장치 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10282664B2 (ko) |
JP (1) | JP6163607B2 (ko) |
KR (1) | KR101707369B1 (ko) |
CN (1) | CN103699689B (ko) |
WO (1) | WO2015103899A1 (ko) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103699689B (zh) * | 2014-01-09 | 2017-02-15 | 百度在线网络技术(北京)有限公司 | 事件知识库的构建方法及装置 |
CN105528349B (zh) | 2014-09-29 | 2019-02-01 | 华为技术有限公司 | 知识库中问句解析的方法及设备 |
CN104573006A (zh) * | 2015-01-08 | 2015-04-29 | 南通大学 | 一种公共卫生突发事件领域知识库的构建方法 |
CN104794163B (zh) * | 2015-03-25 | 2018-07-13 | 中国人民大学 | 实体集合扩展方法 |
CN108009184B (zh) * | 2016-10-27 | 2021-08-27 | 北大方正集团有限公司 | 知识库同名实例混淆检测的方法及装置 |
CN110569335B (zh) * | 2018-03-23 | 2022-05-27 | 百度在线网络技术(北京)有限公司 | 基于人工智能的三元组校验方法、装置及存储介质 |
CN108549667B (zh) * | 2018-03-23 | 2022-04-08 | 绍兴诺雷智信息科技有限公司 | 一种结构化工程设计知识的语义检索方法 |
JP7095377B2 (ja) * | 2018-04-17 | 2022-07-05 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及び情報処理プログラム |
CN110889274B (zh) * | 2018-08-17 | 2022-02-08 | 北大方正集团有限公司 | 信息质量评估方法、装置、设备及计算机可读存储介质 |
CN111443964B (zh) * | 2019-01-17 | 2023-10-20 | 伊姆西Ip控股有限责任公司 | 更新用户界面的方法、设备和计算机可读存储介质 |
CN110263177B (zh) * | 2019-05-23 | 2021-09-07 | 广州市香港科大霍英东研究院 | 用于事件预测的知识图构建方法与事件预测方法 |
CN110348018A (zh) * | 2019-07-16 | 2019-10-18 | 苏州大学 | 使用局部学习完成简易事件抽取的方法 |
CN110543574B (zh) * | 2019-08-30 | 2022-05-17 | 北京百度网讯科技有限公司 | 一种知识图谱的构建方法、装置、设备及介质 |
WO2021176572A1 (ja) | 2020-03-03 | 2021-09-10 | 富士通株式会社 | 機械学習プログラム、機械学習方法及び機械学習装置 |
CN111382256B (zh) * | 2020-03-20 | 2024-04-09 | 北京百度网讯科技有限公司 | 信息推荐方法及装置 |
WO2022102825A1 (ko) * | 2020-11-16 | 2022-05-19 | 주식회사 솔트룩스 | 표로부터 지식 데이터를 추출하기 위한 시스템 및 방법 |
EP4318268A4 (en) | 2021-03-31 | 2024-05-15 | Fujitsu Limited | INFORMATION PROCESSING PROGRAM, INFORMATION PROCESSING METHOD, INFORMATION PROCESSING DEVICE AND INFORMATION PROCESSING SYSTEM |
CN113312490B (zh) * | 2021-04-28 | 2023-04-18 | 乐山师范学院 | 一种针对突发事件的事件知识图谱构建方法 |
CN113157922B (zh) * | 2021-04-28 | 2022-01-21 | 江苏易安联网络技术有限公司 | 基于图的网络实体行为评估、可视化方法 |
CN113312500B (zh) * | 2021-06-24 | 2022-05-03 | 河海大学 | 一种面向大坝安全运行的事件图谱构建方法 |
CN113704490B (zh) * | 2021-08-19 | 2023-06-20 | 扬州大学 | 一种面向异构数据的新工科教育知识图谱构建方法 |
CN117743586B (zh) * | 2023-09-07 | 2024-07-05 | 四川大学 | 一种基于情绪事件知识图谱的心理健康辅助评价方法 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6907426B2 (en) | 2001-05-17 | 2005-06-14 | International Business Machines Corporation | Systems and methods for identifying and counting instances of temporal patterns |
KR100481580B1 (ko) | 2002-10-09 | 2005-04-08 | 한국전자통신연구원 | 문서에서 이벤트 문장을 추출하는 장치 및 그 방법 |
JP2005115882A (ja) | 2003-10-03 | 2005-04-28 | Akira Sagaraki | 知識発見方法および知識発見システム |
US8301435B2 (en) * | 2006-02-27 | 2012-10-30 | Nec Corporation | Removing ambiguity when analyzing a sentence with a word having multiple meanings |
JP4007413B2 (ja) | 2007-01-22 | 2007-11-14 | 富士ゼロックス株式会社 | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム |
JP4625535B1 (ja) | 2009-12-14 | 2011-02-02 | 株式会社野村総合研究所 | 情報抽出システム及び情報抽出プログラム |
CN102117283A (zh) * | 2009-12-30 | 2011-07-06 | 安世亚太科技(北京)有限公司 | 一种基于语义索引的数据检索方法 |
CN102207947B (zh) * | 2010-06-29 | 2013-05-15 | 天津海量信息技术有限公司 | 一种直接引语素材库的生成方法 |
CN102207948B (zh) * | 2010-07-13 | 2013-07-24 | 天津海量信息技术有限公司 | 一种事件陈述句素材库的生成方法 |
CN101937430B (zh) | 2010-09-03 | 2015-04-15 | 清华大学 | 一种汉语句子中事件句式的抽取方法 |
KR20130099327A (ko) | 2012-02-29 | 2013-09-06 | 한국전자통신연구원 | 오픈 도메인 정보 추출 장치 및 방법 |
US9208440B2 (en) * | 2012-05-29 | 2015-12-08 | Battelle Memorial Institute | Method of analyzing a scenario represented as elements of a tensor space, and scored using tensor operators |
CN103049532A (zh) | 2012-12-21 | 2013-04-17 | 东莞中国科学院云计算产业技术创新与育成中心 | 基于突发事件应急管理的知识库引擎构建及其查询方法 |
US9665875B2 (en) * | 2013-10-18 | 2017-05-30 | Sap Se | Automated software tools for improving sales |
CN103699689B (zh) | 2014-01-09 | 2017-02-15 | 百度在线网络技术(北京)有限公司 | 事件知识库的构建方法及装置 |
CN103902681A (zh) * | 2014-03-21 | 2014-07-02 | 百度在线网络技术(北京)有限公司 | 搜索推荐方法和装置 |
CN103914548B (zh) * | 2014-04-10 | 2018-01-09 | 北京百度网讯科技有限公司 | 信息搜索方法和装置 |
CN104035958B (zh) * | 2014-04-14 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 搜索方法和搜索引擎 |
CN103995870A (zh) * | 2014-05-21 | 2014-08-20 | 百度在线网络技术(北京)有限公司 | 交互式搜索方法和装置 |
CN104123351B (zh) * | 2014-07-09 | 2017-08-25 | 百度在线网络技术(北京)有限公司 | 交互式搜索方法和装置 |
CN104102713B (zh) * | 2014-07-16 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 推荐结果的展现方法和装置 |
CN104573028B (zh) * | 2015-01-14 | 2019-01-25 | 百度在线网络技术(北京)有限公司 | 实现智能问答的方法和系统 |
CN104965426A (zh) * | 2015-06-24 | 2015-10-07 | 百度在线网络技术(北京)有限公司 | 基于人工智能的智能机器人控制系统、方法和装置 |
CN107423274B (zh) * | 2017-06-07 | 2020-11-20 | 北京百度网讯科技有限公司 | 基于人工智能的比赛解说内容生成方法、装置及存储介质 |
-
2014
- 2014-01-09 CN CN201410010694.7A patent/CN103699689B/zh active Active
- 2014-10-31 JP JP2016526443A patent/JP6163607B2/ja active Active
- 2014-10-31 WO PCT/CN2014/090073 patent/WO2015103899A1/zh active Application Filing
- 2014-10-31 KR KR1020157036777A patent/KR101707369B1/ko active IP Right Grant
- 2014-10-31 US US14/899,510 patent/US10282664B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016532942A (ja) | 2016-10-20 |
US10282664B2 (en) | 2019-05-07 |
JP6163607B2 (ja) | 2017-07-12 |
WO2015103899A1 (zh) | 2015-07-16 |
US20160314394A1 (en) | 2016-10-27 |
CN103699689A (zh) | 2014-04-02 |
CN103699689B (zh) | 2017-02-15 |
KR20160018588A (ko) | 2016-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101707369B1 (ko) | 이벤트 저장소의 구축 방법 및 장치 | |
US10725836B2 (en) | Intent-based organisation of APIs | |
US10169337B2 (en) | Converting data into natural language form | |
US10169471B2 (en) | Generating and executing query language statements from natural language | |
RU2501078C2 (ru) | Ранжирование результатов поиска с использованием расстояния редактирования и информации о документе | |
US10191946B2 (en) | Answering natural language table queries through semantic table representation | |
JP6176017B2 (ja) | 検索装置、検索方法、およびプログラム | |
Kuc et al. | Elasticsearch server | |
WO2021006977A1 (en) | Delta graph traversing system | |
JP4237813B2 (ja) | 構造化文書管理システム | |
US8359592B2 (en) | Identifying groups and subgroups | |
EP3493076B1 (en) | Cognitive decision system for security and log analysis using associative memory mapping in graph database | |
CN110309214B (zh) | 一种指令执行方法及其设备、存储介质、服务器 | |
US20150178075A1 (en) | Enhancing understandability of code using code clones | |
JP2006106907A (ja) | 構造化文書管理システム、索引構築方法及びプログラム | |
JP2013125429A (ja) | 分析対象決定装置 | |
JP4304226B2 (ja) | 構造化文書管理システム、構造化文書管理方法及びプログラム | |
EP3944127A1 (en) | Dependency graph based natural language processing | |
JP4160627B2 (ja) | 構造化文書管理システム及びプログラム | |
CN115599858A (zh) | 数据库同步方法、装置、设备及介质 | |
Black et al. | Introducing Supplemental Context for Word Sense Disambiguation | |
CN116975198A (zh) | 信息查询方法、装置、设备和介质 | |
CN116955528A (zh) | 文本解析方法、装置、设备及存储介质 | |
JP2008250388A (ja) | 情報検索装置、情報検索方法及び情報検索プログラム | |
JP2008198236A (ja) | 構造化文書管理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20200129 Year of fee payment: 4 |