KR101696499B1 - 한국어 키워드 검색문 해석 장치 및 방법 - Google Patents

한국어 키워드 검색문 해석 장치 및 방법 Download PDF

Info

Publication number
KR101696499B1
KR101696499B1 KR1020120015109A KR20120015109A KR101696499B1 KR 101696499 B1 KR101696499 B1 KR 101696499B1 KR 1020120015109 A KR1020120015109 A KR 1020120015109A KR 20120015109 A KR20120015109 A KR 20120015109A KR 101696499 B1 KR101696499 B1 KR 101696499B1
Authority
KR
South Korea
Prior art keywords
keyword
instance
extracted
search
attribute
Prior art date
Application number
KR1020120015109A
Other languages
English (en)
Other versions
KR20130093889A (ko
Inventor
조준면
이무훈
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020120015109A priority Critical patent/KR101696499B1/ko
Priority to US13/768,044 priority patent/US20130211820A1/en
Publication of KR20130093889A publication Critical patent/KR20130093889A/ko
Application granted granted Critical
Publication of KR101696499B1 publication Critical patent/KR101696499B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • G06F16/24542Plan optimisation
    • G06F16/24545Selectivity estimation or determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24575Query processing with adaptation to user needs using context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Operations Research (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

한국어 키워드 검색문 해석 장치 및 방법이 개시된다. 한국어 키워드 검색문 해석 장치는 검색문을 입력 받고, 상기 검색문으로부터 키워드를 추출하는 인터페이스와, 상기 추출된 키워드를 한국어 문장 구조에 기초하여, 클래스, 인스턴스, 프라퍼티 또는 속성 중 적어도 하나로 분류하고, 상기 분류 결과에 기초하여, 데이터베이스로부터 상기 검색문과 연관된 의미해석 정보를 획득하는 프로세서를 포함한다.

Description

한국어 키워드 검색문 해석 장치 및 방법{APPARATUS AND METHOD FOR INTERPRETING KOREAN KEYWORD SEARCH PHRASE}
본 발명의 실시예는 입력된 검색문을 한국어 문장 구조에 기초하여, 해석 함으로써, 상기 검색문과 연관된 의미해석 정보를 보다 정확하게 제공할 수 있는 기술에 관한 것이다.
본 발명의 배경이 되는 기술은 다음의 문헌에 개시되어 있다.
1) 공개번호: 2011-0015534 (2011.02.16), "온라인 검색 및 광고를 위한 키워드 표현 언어"
2) 공개번호: 1997-0049752 (1997.07.29), "동사정보를 이용한 한국어 자연어 질의 정보검색 방법"
기존의 웹 검색 엔진 검색 방식은 단순히 사용자가 입력한 키워드와 일치하는 키워드를 포함하는 문서를 검색하여 제공하기 때문에, 키워드 간의 관계로 표현되는 검색문의 의미를 해석할 필요가 없었다. 즉, 기존의 웹 검색 엔진 검색 방법은 검색문에 포함된 키워드들을 개별적으로 문서 내용 또는 문서의 메타데이타와 비교하여 동일한 키워드가 포함된 것을 반환한다.
이러한 검색 방법은 검색문의 의미를 해석하지 않고, 입력한 키워드와 일치하는 키워드를 포함하는 문서를 검색하여 제공 함으로써, 방대한 양의 검색 결과를 제공할 수 있으나, 사용자가 의도한 검색 결과를 제공하는 것이 용이하지 않다.
이에, 최근 기존 키워드 일치 기반의 검색 방식의 한계를 뛰어 넘기 위해 활발히 연구되고 있는 의미 기반 검색 (semantic search) 방식에서는 키워드들이 나타내는 개체 간의 관계를 기반으로 검색문의 의미를 해석하고 이 해석과 일치하는 자료를 검색하는 방법이 연구되고 있다.
또한, 최근에는 사용자가 검색 응용을 실행하는 단말이 PC가 아닌 스마트폰, 태블릿 PC, 스마트 TV 등과 같이 문장 입력 인터페이스에 제약이 있는 단말들로 확대되고 있다. 이러한 단말은 전용 키보드가 없이, 작은 화면에 표시된 쿼티 자판을 통해 검색문을 입력하게 되는데, 이로 인해 완전한 자연어 문장을 입력하기 보다는 동사, 조사, 어미 등을 누락하고 핵심어만 입력함으로써, 자판 입력 횟수를 최대한으로 줄여 검색문을 입력하게 된다. 이렇게 핵심어만 입력한 검색문의 경우, 검색 장치는 문장 구조에 관한 정보가 없어 의미 해석이 어렵다.
본 발명의 실시예는 입력된 검색문으로부터 추출한 키워드를 한국어 문장 구조에 기초하여, 클래스, 인스턴스, 프라퍼티 또는 속성 중 적어도 하나로 분류하고, 상기 분류 결과에 기초하여, 데이터베이스로부터 상기 검색문과 연관된 의미해석 정보를 획득 함으로써, 사용자가 검색하고자 하는 정보를 보다 정확하게 획득하는 것을 목적으로 한다.
본 발명의 실시예에 따른 한국어 키워드 검색문 해석 장치는 검색문을 입력 받고, 상기 검색문으로부터 키워드를 추출하는 인터페이스와, 상기 추출된 키워드를 한국어 문장 구조에 기초하여, 클래스, 인스턴스, 프라퍼티 또는 속성 중 적어도 하나로 분류하고, 상기 분류 결과에 기초하여, 데이터베이스로부터 상기 검색문과 연관된 의미해석 정보를 획득하는 프로세서를 포함한다.
본 발명의 실시예에 따른 한국어 키워드 검색문 해석 방법은 검색문을 입력 받고, 상기 검색문으로부터 키워드를 추출하는 단계와, 상기 추출된 키워드를 한국어 문장 구조에 기초하여, 클래스, 인스턴스, 프라퍼티 또는 속성 중 적어도 하나로 분류하는 단계와, 상기 분류 결과에 기초하여, 데이터베이스로부터 상기 검색문과 연관된 의미해석 정보를 획득하는 단계를 포함한다.
본 발명의 실시예에 따르면, 입력된 검색문으로부터 추출한 키워드를 한국어 문장 구조에 기초하여, 클래스, 인스턴스, 프라퍼티 또는 속성 중 적어도 하나로 분류하고, 상기 분류 결과에 기초하여, 데이터베이스로부터 상기 검색문과 연관된 의미해석 정보를 획득 함으로써, 의미해석 경우의 수를 감소시킴에 따라, 사용자가 검색하고자 하는 정보를 보다 정확하게 획득하여 제공할 수 있다. 즉, 본 발명의 실시예는 검색문에 명시적으로 표현되지 않는 키워드 간에 누락된 관계 또는 속성 등을 데이터베이스에서 찾아 연결하여, 모든 키워드에 해당하는 모든 개체가 포함된 하나의 지식 그래프로 구성하는 과정에서, 모든 연결 가능한 경우의 개체 연결을 일일이 시도해 보는 것이 아니라, 한국어 문장 구조에 기반하여 연결 가능성이 높은 경우의 개체 연결을 시도하여, 한국어 키워드 검색문에 대한 의미 해석을 효율적으로 수행할 수 있다.
따라서, 스마트 폰의 제한된 쿼티 자판을 통해 검색어를 수신하는 경우에도, 상기 검색어의 의미를 재해석하여, 보다 정확한 검색 결과에 대한 정보를 제공할 수 있다.
도 1은 본 발명의 일실시예에 따른 한국어 키워드 검색문 해석 장치의 구성을 도시한 도면이다.
도 2는 본 발명의 일실시예에 따른 한국어 키워드 검색문 해석 방법을 나타내는 흐름도이다.
이하, 첨부된 도면들을 참조하여 본 발명의 실시예에 따른 한국어 키워드 검색문 해석 장치 및 방법에 대해 상세히 설명한다.
도 1은 본 발명의 일실시예에 따른 한국어 키워드 검색문 해석 장치의 구성을 도시한 도면이다.
도 1을 참조하면, 한국어 키워드 검색문 해석 장치(100)는 인터페이스(101), 프로세서(103) 및 데이터베이스(105)를 포함한다.
인터페이스(101)는 검색문을 입력 받고, 상기 검색문으로부터 키워드를 추출한다. 예컨대, 인터페이스(101)는 '하지원 출연 공포 영화'의 검색문을 입력 받는 경우, 검색문으로부터 '하지원', '출연', '공포', '영화' 키워드를 추출할 수 있다.
여기서, 인터페이스(101)는 클래스로 분류되는 적어도 하나의 키워드를 포함하는 검색문을 입력 받을 수 있다. 이때, 검색문은 마지막에 위치하는 키워드로서, 클래스로 분류되는 키워드를 포함할 수 있다.
프로세서(103)는 상기 추출된 키워드를 한국어 문장 구조에 기초하여, 클래스, 인스턴스, 프라퍼티 또는 인스턴스의 속성 중 적어도 하나로 분류하고, 상기 분류 결과에 기초하여, 데이터베이스(105)로부터 상기 검색문과 연관된 의미해석 정보(예컨대, 데이터베이스로부터 결과적으로 추출되는 인스턴스와 연관된 지식정보)를 획득하여, 디스플레이부(도시하지 않음)를 통해 제공할 수 있다. 예컨대, 프로세서(103)는 '하지원 출연 공포 영화'의 검색문으로부터 추출된 '하지원', '출연', '공포', '영화' 키워드에 대해, 한국어 문장 구조에 기초하여, '하지원'을 인스턴스로, '출연'을 프라퍼티로, '공포'를 속성으로, '영화'를 클래스로 분류할 수 있다. 여기서, 한국어 문장 구조는 예컨대, 주어와 목적어고 동사 앞에 위치하고, 수식어가 수식을 받는 피수식어 앞에 위치하는 구조일 수 있다.
구체적으로, 프로세서(103)는 데이터베이스(105)로부터 상기 클래스로 분류된 클래스 키워드에 대응하는 클래스에 포함되는 제1 인스턴스를 추출하고, 상기 추출된 제1 인스턴스 중에서, 상기 인스턴스로 분류된 인스턴스 키워드에 대응하는 인스턴스와 연결되는 제2 인스턴스를 추출하며, 상기 추출된 제2 인스턴스와 연관된 정보(또는, 제2 인스턴스를 일부로서 포함하는 문서정보)를 상기 의미해석 정보로서 획득할 수 있다. 예컨대, 프로세서(103)는 데이터베이스(105)로부터 '영화' 클래스에 포함되는 제1 인스턴스를 추출하고, 상기 추출된 제1 인스턴스 중에서, '하지원' 인스턴스와 연결되는 제2 인스턴스를 추출하며, 추출된 제2 인스턴스와 연관된 정보를 상기 의미해석 정보로서 획득할 수 있다.
이때, 프로세서(103)는 상기 프라퍼티로 분류된 프라퍼티 키워드가 존재하는 경우, 상기 추출된 제1 인스턴스 중에서, 상기 인스턴스 키워드에 대응하는 인스턴스와 상기 프라퍼티 키워드에 대응하는 프라퍼티로 연결되는, 상기 제2 인스턴스를 추출할 수 있다. 예컨대, 프로세서(103)는 '영화' 클래스에 포함되는 제1 인스턴스 중에서, '하지원' 인스턴스와 '출연'의 프라퍼티(관계)로 연결되는, 상기 제2 인스턴스를 추출할 수 있다.
또한, 프로세서(103)는 상기 속성으로 분류된 속성 키워드가 존재하는 경우, 상기 제2 인스턴스 중에서 상기 속성 키워드에 대응하는 속성 인스턴스를 추출하고, 추출된 속성 인스턴스와 연관된 정보를 상기 의미해석 정보로서 획득할 수 있다. 프로세서(103)는 '하지원' 인스턴스와 '출연'의 프라퍼티(관계)로 연결되는, 제2 인스턴스 중에서, '공포'의 속성에 해당하는 인스턴스를 추출하고, 추출된 인스턴스와 연관된 정보를 상기 의미해석 정보로서 획득할 수 있다.
따라서, 프로세서(103)는 인터페이스(101)에 의해, '하지원 출연 공포 영화'의 검색문을 입력 받는 경우에도, '하지원이 출연한 영화 중 공포 장르에 해당하는 영화'에 관한 정보를 획득하여 제공할 수 있다. 즉, 프로세서(103)는 예컨대, 스마트 폰의 제한된 쿼티 자판을 통해 검색어를 수신하는 경우에도, 상기 검색어의 의미를 재해석하여, 보다 정확한 검색 결과에 대한 정보를 제공할 수 있다.
한편, 프로세서(103)는 상기 키워드 중에서 클래스로 분류되는 키워드가 복수 개일 경우, 제1 키워드 이전에 입력된 키워드 및 상기 제1 키워드를 제1 단일 검색문으로 구분하고, 상기 제1 키워드와 제2 키워드 사이에 입력된 키워드 및 상기 제2 키워드를 제2 단일 검색문으로 구분할 수 있다. 예컨대, 프로세서(103)는 인터페이스(101)에 의해, '짝패 감독 주연 액션 영화'의 검색문을 입력 받은 경우, 상기 검색문으로부터 추출된 '감독', '영화' 키워드가 클래스로 분류됨에 따라, 클래스로 분류되는 키워드가 복수 개이므로, '감독' 이전에 입력된 키워드('짝패') 및 '감독' 즉, '짝패 감독'을 제1 단일 검색문으로 구분하고, '감독'과 '영화' 사이에 입력된 키워드('주연', '액션') 및 '영화' 즉, '주연 액션 영화'를 제2 단일 검색문으로 구분할 수 있다.
프로세서(103)는 데이터베이스(105)로부터 상기 제1 단일 검색문과 연관된 제1 인스턴스 및 제2 단일 검색문과 연관된 제2 인스턴스를 추출하고, 상기 제2 인스턴스 중에서 상기 제1 인스턴스와 연결되는 인스턴스를 추출하며, 상기 추출된 인스턴스와 연관된 정보를 상기 의미해석 정보로서 획득할 수 있다. 예컨대, 프로세서(103)는 데이터베이스(105)로부터 '짝패 감독'의 제1 단일 검색문과 연관된 제1 인스턴스로서, '감독' 클래스에 포함되는 인스턴스 중에서 '짝패' 인스턴스와 연결되는 인스턴스를 추출하고, '주연 액션 영화'의 제2 단일 검색문과 연관된 제2 인스턴스로서, '영화' 클래스에 포함되는 인스턴스를 추출할 수 있다. 프로세서(103)는 상기 제2 인스턴스 중에서, '주연'의 프라퍼티로 상기 제1 인스턴스와 연결되는 인스턴스를 추출하며, 추출된 인스턴스 중에서 '액션'의 속성에 해당하는 인스턴스를 추출하고, 추출된 인스턴스와 연관된 정보를 상기 의미해석 정보로서 획득할 수 있다.
데이터베이스(105)는 노드와 에지로 구성된 그래프 형태로 표현되는 정보(예컨대, 지식 그래프)를 저장한다. 여기서, 클래스 또는 인스턴스가 노드로 표현되고, 프라퍼티는 인스턴스와 클래스 간 또는 인스턴스와 인스턴스 간을 연결하는 에지로 표현된다. 또한, 속성은 인스턴스에 해당하는 노드에 부여된 값으로 표현된다. 이때, 인스턴스와 클래스 간의 에지로 표현되는 프라퍼티(즉, 멤버쉽 프라퍼티)는 하나일 수 있다.
데이터베이스(105)는 각 인스턴스와 연관된 지식정보를 더 포함할 수 있다.
도 2는 본 발명의 일실시예에 따른 한국어 키워드 검색문 해석 방법을 나타내는 흐름도이다.
도 2를 참조하면, 단계 201에서, 한국어 키워드 검색문 해석 장치는 검색문을 입력 받고, 상기 검색문으로부터 키워드를 추출한다.
단계 203에서, 한국어 키워드 검색문 해석 장치는 추출된 키워드를 한국어 문장 구조에 기초하여, 클래스, 인스턴스, 프라퍼티 또는 속성 중 적어도 하나로 분류한다.
단계 205에서, 한국어 키워드 검색문 해석 장치는 상기 분류 결과에 기초하여, 데이터베이스로부터 상기 검색문과 연관된 의미해석 정보를 획득하여, 제공할 수 있다.
구체적으로, 한국어 키워드 검색문 해석 장치는 데이터베이스로부터 상기 클래스로 분류된 클래스 키워드에 대응하는 클래스에 포함되는 제1 인스턴스를 추출하고, 상기 추출된 제1 인스턴스 중에서, 상기 인스턴스로 분류된 인스턴스 키워드에 대응하는 인스턴스와 연결되는 제2 인스턴스를 추출하며, 상기 추출된 제2 인스턴스와 연관된 정보를 상기 의미해석 정보로서 획득할 수 있다.
이때, 한국어 키워드 검색문 해석 장치는 상기 프라퍼티로 분류된 프라퍼티 키워드가 존재하는 경우, 상기 추출된 제1 인스턴스 중에서, 상기 인스턴스 키워드에 대응하는 인스턴스와 상기 프라퍼티 키워드에 대응하는 프라퍼티로 연결되는, 상기 제2 인스턴스를 추출할 수 있다.
또한, 한국어 키워드 검색문 해석 장치는 상기 속성으로 분류된 속성 키워드가 존재하는 경우, 상기 제2 인스턴스 중에서 상기 속성 키워드에 대응하는 속성 인스턴스를 추출하고, 추출된 속성 인스턴스와 연관된 정보를 상기 의미해석 정보로서 획득할 수 있다.
한편, 한국어 키워드 검색문 해석 장치는 상기 키워드 중에서 클래스로 분류되는 키워드가 복수 개일 경우, 제1 키워드 이전에 입력된 키워드 및 상기 제1 키워드를 제1 단일 검색문으로 구분하고, 상기 제1 키워드와 제2 키워드 사이에 입력된 키워드 및 상기 제2 키워드를 제2 단일 검색문으로 구분할 수 있다. 이후, 한국어 키워드 검색문 해석 장치는 데이터베이스로부터 상기 제1 단일 검색문과 연관된 제1 인스턴스 및 제2 단일 검색문과 연관된 제2 인스턴스를 추출하고, 상기 제2 인스턴스 중에서 상기 제1 인스턴스와 연결되는 인스턴스를 추출하며, 상기 추출된 인스턴스와 연관된 정보를 상기 의미해석 정보로서 획득할 수 있다.
본 발명의 실시예는 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
100: 한국어 키워드 검색문 해석 장치
101: 인터페이스 103: 프로세서
105: 데이터베이스

Claims (12)

  1. 검색문을 입력 받고, 상기 검색문으로부터 키워드를 추출하는 인터페이스; 및
    상기 추출된 키워드를 한국어 문장 구조에 기초하여, 클래스, 인스턴스, 프라퍼티 또는 속성 중 적어도 하나로 분류하고, 상기 분류 결과에 기초하여, 데이터베이스로부터 상기 검색문과 연관된 의미해석 정보를 획득하되, 상기 키워드 중에서 클래스로 분류되는 키워드가 복수 개일 경우, 제1 키워드 이전에 입력된 키워드 및 상기 제1 키워드를 제1 단일 검색문으로 구분하고, 상기 제1 키워드와 제2 키워드 사이에 입력된 키워드 및 상기 제2 키워드를 제2 단일 검색문으로 구분하는 프로세서
    를 포함하는 한국어 키워드 검색문 해석 장치.
  2. 제1항에 있어서,
    상기 프로세서는,
    상기 데이터베이스로부터 상기 클래스로 분류된 클래스 키워드에 대응하는 클래스에 포함되는 제1 인스턴스를 추출하고, 상기 추출된 제1 인스턴스 중에서, 상기 인스턴스로 분류된 인스턴스 키워드에 대응하는 인스턴스와 연결되는 제2 인스턴스를 추출하며, 상기 추출된 제2 인스턴스와 연관된 정보를 상기 의미해석 정보로서 획득하는, 한국어 키워드 검색문 해석 장치.
  3. 제2항에 있어서,
    상기 프라퍼티로 분류된 프라퍼티 키워드가 존재하는 경우,
    상기 프로세서는,
    상기 추출된 제1 인스턴스 중에서, 상기 인스턴스 키워드에 대응하는 인스턴스와 상기 프라퍼티 키워드에 대응하는 프라퍼티로 연결되는, 상기 제2 인스턴스를 추출하는, 한국어 키워드 검색문 해석 장치.
  4. 제2항에 있어서,
    상기 속성으로 분류된 속성 키워드가 존재하는 경우,
    상기 프로세서는,
    상기 제2 인스턴스 중에서 상기 속성 키워드에 대응하는 속성 인스턴스를 추출하고, 상기 추출된 속성 인스턴스와 연관된 정보를 상기 의미해석 정보로서 획득하는, 한국어 키워드 검색문 해석 장치.
  5. 삭제
  6. 제1항에 있어서,
    상기 프로세서는,
    상기 데이터베이스로부터 상기 제1 단일 검색문과 연관된 제1 인스턴스 및 제2 단일 검색문과 연관된 제2 인스턴스를 추출하고, 상기 제2 인스턴스 중에서 상기 제1 인스턴스와 연결되는 인스턴스를 추출하며, 상기 추출된 인스턴스와 연관된 정보를 상기 의미해석 정보로서 획득하는, 한국어 키워드 검색문 해석 장치.
  7. 한국어 키워드 검색문 해석 장치에 의해 구현되는 한국어 키워드 검색문 해석 방법에 있어서,
    상기 한국어 키워드 검색문 해석 장치에서, 검색문을 입력 받고, 상기 검색문으로부터 키워드를 추출하는 단계;
    상기 한국어 키워드 검색문 해석 장치에서, 상기 추출된 키워드를 한국어 문장 구조에 기초하여, 클래스, 인스턴스, 프라퍼티 또는 속성 중 적어도 하나로 분류하는 단계;
    상기 한국어 키워드 검색문 해석 장치에서, 상기 분류 결과에 기초하여, 데이터베이스로부터 상기 검색문과 연관된 의미해석 정보를 획득하는 단계; 및
    상기 키워드 중에서 클래스로 분류되는 키워드가 복수 개일 경우,
    상기 한국어 키워드 검색문 해석 장치에서, 제1 키워드 이전에 입력된 키워드 및 상기 제1 키워드를 제1 단일 검색문으로 구분하고, 상기 제1 키워드와 제2 키워드 사이에 입력된 키워드 및 상기 제2 키워드를 제2 단일 검색문으로 구분하는 단계
    를 포함하는 한국어 키워드 검색문 해석 방법.
  8. 제7항에 있어서,
    상기 의미해석 정보를 획득하는 단계는,
    상기 데이터베이스로부터 상기 클래스로 분류된 클래스 키워드에 대응하는 클래스에 포함되는 제1 인스턴스를 추출하고, 상기 추출된 제1 인스턴스 중에서, 상기 인스턴스로 분류된 인스턴스 키워드에 대응하는 인스턴스와 연결되는 제2 인스턴스를 추출하는 단계; 및
    상기 추출된 제2 인스턴스와 연관된 정보를 상기 의미해석 정보로서 획득하는 단계
    를 포함하는, 한국어 키워드 검색문 해석 방법.
  9. 제8항에 있어서,
    상기 제2 인스턴스를 추출하는 단계는,
    상기 프라퍼티로 분류된 프라퍼티 키워드가 존재하는 경우,
    상기 추출된 제1 인스턴스 중에서, 상기 인스턴스 키워드에 대응하는 인스턴스와 상기 프라퍼티 키워드에 대응하는 프라퍼티로 연결되는, 상기 제2 인스턴스를 추출하는 단계
    를 포함하는, 한국어 키워드 검색문 해석 방법.
  10. 제8항에 있어서,
    상기 추출된 제2 인스턴스와 연관된 정보를 상기 의미해석 정보로서 획득하는 단계는,
    상기 속성으로 분류된 속성 키워드가 존재하는 경우,
    상기 제2 인스턴스 중에서 상기 속성 키워드에 대응하는 속성 인스턴스를 추출하고, 상기 추출된 속성 인스턴스와 연관된 정보를 상기 의미해석 정보로서 획득하는 단계
    를 포함하는, 한국어 키워드 검색문 해석 방법.
  11. 삭제
  12. 제7항에 있어서,
    상기 한국어 키워드 검색문 해석 장치에서, 상기 데이터베이스로부터 상기 제1 단일 검색문과 연관된 제1 인스턴스 및 제2 단일 검색문과 연관된 제2 인스턴스를 추출하고, 상기 제2 인스턴스 중에서 상기 제1 인스턴스와 연결되는 인스턴스를 추출하며, 상기 추출된 인스턴스와 연관된 정보를 상기 의미해석 정보로서 획득하는 단계
    를 더 포함하는, 한국어 키워드 검색문 해석 방법.
KR1020120015109A 2012-02-15 2012-02-15 한국어 키워드 검색문 해석 장치 및 방법 KR101696499B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020120015109A KR101696499B1 (ko) 2012-02-15 2012-02-15 한국어 키워드 검색문 해석 장치 및 방법
US13/768,044 US20130211820A1 (en) 2012-02-15 2013-02-15 Apparatus and method for interpreting korean keyword search phrase

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120015109A KR101696499B1 (ko) 2012-02-15 2012-02-15 한국어 키워드 검색문 해석 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20130093889A KR20130093889A (ko) 2013-08-23
KR101696499B1 true KR101696499B1 (ko) 2017-01-13

Family

ID=48946368

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120015109A KR101696499B1 (ko) 2012-02-15 2012-02-15 한국어 키워드 검색문 해석 장치 및 방법

Country Status (2)

Country Link
US (1) US20130211820A1 (ko)
KR (1) KR101696499B1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9727617B1 (en) * 2014-03-10 2017-08-08 Google Inc. Systems and methods for searching quotes of entities using a database
KR101596390B1 (ko) * 2014-07-10 2016-02-22 이창엽 온톨로지 분석 기반의 사용자 맞춤형 정보 제공 시스템 및 방법
CN105335400B (zh) * 2014-07-22 2018-11-23 阿里巴巴集团控股有限公司 针对用户的提问意图获取答案信息的方法及装置
US10078651B2 (en) 2015-04-27 2018-09-18 Rovi Guides, Inc. Systems and methods for updating a knowledge graph through user input
KR101656245B1 (ko) * 2015-09-09 2016-09-09 주식회사 위버플 문장 추출 방법 및 시스템
CN110019697A (zh) * 2017-08-29 2019-07-16 北京国双科技有限公司 一种刑事文书的推送方法及装置
RU2699396C1 (ru) * 2018-11-19 2019-09-05 Общество С Ограниченной Ответственностью "Инвек" Нейронная сеть для интерпретирования предложений на естественном языке

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006031194A (ja) 2004-07-13 2006-02-02 Internatl Business Mach Corp <Ibm> 検索システム、検索方法、報告システム、報告方法、及びプログラム
US20070027856A1 (en) 2005-07-27 2007-02-01 Nhn Corporation Product searching system and method using search logic according to each category

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020032835A (ko) * 2000-10-27 2002-05-04 정우성 자연어 처리와 음성 인식 병합에 의거한 음성 언어 이해기술 및 그 비즈니스 모델

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006031194A (ja) 2004-07-13 2006-02-02 Internatl Business Mach Corp <Ibm> 検索システム、検索方法、報告システム、報告方法、及びプログラム
US20070027856A1 (en) 2005-07-27 2007-02-01 Nhn Corporation Product searching system and method using search logic according to each category

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YUANGUI LEI et al., SemSearch: A Search Engine for the Semantic Web, Proc. of the 15th Int. Conference, pp.238-145, 2006.*

Also Published As

Publication number Publication date
US20130211820A1 (en) 2013-08-15
KR20130093889A (ko) 2013-08-23

Similar Documents

Publication Publication Date Title
US10783202B2 (en) Analyzing concepts over time
CN108121829B (zh) 面向软件缺陷的领域知识图谱自动化构建方法
KR101696499B1 (ko) 한국어 키워드 검색문 해석 장치 및 방법
US10740678B2 (en) Concept hierarchies
US10127274B2 (en) System and method for querying questions and answers
US9626622B2 (en) Training a question/answer system using answer keys based on forum content
US9280535B2 (en) Natural language querying with cascaded conditional random fields
CN108280114B (zh) 一种基于深度学习的用户文献阅读兴趣分析方法
CN110543574A (zh) 一种知识图谱的构建方法、装置、设备及介质
US20150178273A1 (en) Unsupervised Relation Detection Model Training
KR101723862B1 (ko) 텍스트를 포함하는 문서 분류 및 분석 방법 및 이를 수행하는 문서 분류 및 분석 장치
CN104537341B (zh) 人脸图片信息获取方法和装置
Alami et al. Cybercrime profiling: Text mining techniques to detect and predict criminal activities in microblog posts
CN105718585B (zh) 文档与标签词语义关联方法及其装置
WO2015188719A1 (zh) 结构化数据与图片的关联方法与关联装置
KR101700820B1 (ko) 사용자 코멘트 기반 개인화 컨텐츠 검색 장치 및 방법
CN105243120A (zh) 一种检索方法及装置
KR102147582B1 (ko) 속성 지식 확장 시스템 및 속성 지식 확장 방법
CN113407678B (zh) 知识图谱构建方法、装置和设备
US11507593B2 (en) System and method for generating queryeable structured document from an unstructured document using machine learning
KR101274571B1 (ko) 콘텐츠를 검색하는 방법 및 장치
KR20190061668A (ko) 지식 네트워크 분석 방법
CN113886535B (zh) 基于知识图谱的问答方法、装置、存储介质及电子设备
KR20160109302A (ko) 지식기반 서비스 시스템, 지식기반 서비스 서버, 지식기반 서비스제공방법 및 컴퓨터 판독가능 기록매체
TWI517058B (zh) Method and Device for Constructing Knowledge Base

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant