KR102471063B1 - 답변 제공 장치 - Google Patents

답변 제공 장치 Download PDF

Info

Publication number
KR102471063B1
KR102471063B1 KR1020200155719A KR20200155719A KR102471063B1 KR 102471063 B1 KR102471063 B1 KR 102471063B1 KR 1020200155719 A KR1020200155719 A KR 1020200155719A KR 20200155719 A KR20200155719 A KR 20200155719A KR 102471063 B1 KR102471063 B1 KR 102471063B1
Authority
KR
South Korea
Prior art keywords
query
response
node
tree
nodes
Prior art date
Application number
KR1020200155719A
Other languages
English (en)
Other versions
KR20220068688A (ko
Inventor
황이규
류근재
이원문
Original Assignee
주식회사 마인즈랩
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 마인즈랩 filed Critical 주식회사 마인즈랩
Priority to KR1020200155719A priority Critical patent/KR102471063B1/ko
Publication of KR20220068688A publication Critical patent/KR20220068688A/ko
Application granted granted Critical
Publication of KR102471063B1 publication Critical patent/KR102471063B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3349Reuse of stored results of previous queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명의 일 실시예에 따른 리프 노드에 태깅 된 텍스트 콘텐츠에 대한 검색으로 질의에 대한 답변을 제공하는 답변 제공 장치는, 쿼리와의 관련성에 기초하여 원본 트리로부터 추출된 리프 노드인 후보 노드들을 포함하는 응답 트리를 생성하고, 상기 응답 트리에 기반한 질의 응답을 통해 상기 응답 트리에 포함된 후보 노드들 중 어느 하나를 상기 쿼리에 대응되는 응답 노드로 결정하고, 상기 응답 노드에 태깅 된 텍스트 콘텐츠에서 상기 쿼리에 대한 응답을 검색하되, 상기 쿼리 중 상기 응답 노드의 결정에 미사용 된 부분을 이용하여 상기 응답을 검색할 수 있다.

Description

답변 제공 장치{APPARATUS FOR PROVIDING ANSWER}
본 발명은 리프 노드에 태깅 된 텍스트 콘텐츠에 대한 검색으로 질의에 대한 답변을 제공하는 답변 제공 장치 관한 것이다.
정보통신 기술의 비약적인 발전으로 인해 이동통신 단말, 개인용 컴퓨터 등과 같은 다양한 종류의 단말들은 다양한 기능을 수행할 수 있도록 구현되고 있다.
이동통신 단말을 예로 들어 설명하면, 이동통신 단말은 기본적인 음성 통신 기능에서 더 나아가 최근에는 데이터 통신, 카메라를 이용한 사진이나 동영상 촬영, 음악 또는 동영상 파일 재생, 게임, 방송 시청 등 다양한 기능들을 이용할 수 있도록 구현되고 있다.
최근에는 이러한 단말을 통하여 질의를 시스템상에 업로드함으로써 답을 얻고자 하는 사용자의 수가 증가하였으며, 이에 따른 문제점이 대두되고 있다.
일 예로 다수의 서비스 제공 업체들이 상담사에 의한 답변을 제공하는 방식에서 사용자가 검색을 통해 원하는 답변을 검색하도록 하는 방식으로 전환하고 있는 가운데, 이러한 방식의 도입에 따라 사용자의 검색 과정이 복잡해지고 번거로워지는 문제점이 발생하였다.
특히 세분화된 답변을 제공하기 위해 많은 시스템들이 복수의 단계에 대한 선택 과정을 거쳐서 사용자가 원하는 답변을 얻을 수 있도록 하고 있는데, 일부 단계의 경우 사용자의 선택이 불필요함에도 불구하고 이를 생략할 수 있는 방법이 존재하지 않아 사용자의 검색 과정이 번거로워지는 문제점이 있었다.
본 발명은 상술한 문제점을 해결하기 위한 것으로 사용자가 자신의 질의에 대한 답변을 획득하는 과정에 있어서, 선택이 필요 없는 내용에 대한 선택 과정을 생략함으로써 응답 검색의 절차를 간소화하고자 한다.
또한 본 발명은 사용자의 최초 쿼리로부터 사용자의 질의 사항을 대략적으로 특정하고, 특정된 내용에 따라 대략적인 응답의 범위를 결정함으로써 질의응답 과정의 효율성을 향상시키고자 한다.
또한 본 발명은 상술한 간소화 및 효율화에도 불구하고 사용자의 질의에 대한 응답 정확도를 향상시키고자 한다.
본 발명의 일 실시예에 따른 리프 노드에 태깅 된 텍스트 콘텐츠에 대한 검색으로 질의에 대한 답변을 제공하는 답변 제공 장치는, 쿼리와의 관련성에 기초하여 원본 트리로부터 추출된 리프 노드인 후보 노드들을 포함하는 응답 트리를 생성하고, 상기 응답 트리에 기반한 질의 응답을 통해 상기 응답 트리에 포함된 후보 노드들 중 어느 하나를 상기 쿼리에 대응되는 응답 노드로 결정하고, 상기 응답 노드에 태깅 된 텍스트 콘텐츠에서 상기 쿼리에 대한 응답을 검색하되, 상기 쿼리 중 상기 응답 노드의 결정에 미사용 된 부분을 이용하여 상기 응답을 검색할 수 있다.
상기 쿼리는 제1 키워드에 기반하는 제1 쿼리 및 제2 키워드에 기반하는 제2 쿼리를 포함하고, 상기 장치는 상기 제1 쿼리와의 관련성에 기초하여 상기 응답 트리를 생성하고, 상기 응답 트리에 포함된 후보 노드들 중 어느 하나를 상기 제1 쿼리에 대응되는 응답 노드로 결정하고, 상기 응답 노드에 태깅 된 텍스트 콘텐츠에서 상기 제2 쿼리에 대한 응답을 검색할 수 있다.
상기 제1 키워드는 상기 제2 키워드의 상위 카테고리이고, 상기 제1 키워드는 하나 이상일 수 있다.
상기 장치는 상기 텍스트 콘텐츠의 적어도 일부분을 상기 쿼리에 대한 응답으로 결정할 수 있다.
상기 장치는 상기 원본 트리에서 상기 쿼리와 관련된 리프 노드들을 상기 후보 노드들로 추출하고, 상기 원본 트리의 루트 노드로부터 상기 후보 노드들 각각에 이르는 경로상에 있는 가지 노드들을 포함하는 상기 응답 트리를 생성하고, 상기 응답 트리의 루트 노드로부터 상기 쿼리에 대한 응답에 대응되는 리프 노드로 진행하는 과정 중 둘 이상의 노드가 존재하는 레벨을 만나는 경우, 상기 둘 이상의 노드 중 어느 하나의 노드를 선택하기 위한 질의를 생성하고, 상기 질의에 대한 답변에 따라 상기 둘 이상의 노드 중 어느 하나의 노드를 선택하고, 상기 선택된 노드가 상기 후보 노드들 중 어느 하나인 경우, 상기 선택된 노드를 상기 응답 노드로 결정할 수 있다.
상기 응답 트리는 하나의 노드만 포함하는 레벨인 질의 생략 레벨을 적어도 하나 이상 포함하고, 상기 장치는 상기 과정 중 상기 질의 생략 레벨을 만나는 경우, 상기 둘 이상의 노드 중 어느 하나의 노드를 선택하는 과정을 생략하고, 다음 레벨로 이동할 수 있다.
상기 원본 트리의 적어도 하나의 리프 노드들 각각에는 각각의 리프 노드와 관련된 질의, 각각의 리프 노드와 관련된 텍스트 콘텐츠가 태깅(Tagging)되어 있고, 상기 장치는 상기 쿼리와 상기 적어도 하나의 리프 노드들 각각에 태깅된 관련된 질의 및 텍스트 콘텐츠 중 적어도 하나를 이용하여 상기 후보 노드들을 추출할 수 있다.
상기 쿼리는 사용자가 답변을 얻고자 하는 내용에 대한 사용자 질의를 포함하고, 상기 장치는 소정의 우선순위에 따라 상기 사용자 질의와 상기 적어도 하나의 리프 노드들 각각에 태깅 된 항목들을 비교하여 상기 후보 노드들을 추출할 수 있다.
상기 장치는 상기 쿼리에 상기 응답 트리에 기반한 질의 응답을 통해 선택된 노드들에 대응되는 쿼리가 부가된 최종 쿼리를 생성하고, 상기 텍스트 콘텐츠에서 상기 생성 쿼리에 대응되는 응답을 검색할 수 있다.
본 발명의 일 실시예에 따른 리프 노드에 태깅 된 텍스트 콘텐츠에 대한 검색으로 질의에 대한 답변을 제공하는 답변 제공 방법은, 쿼리와의 관련성에 기초하여 원본 트리로부터 추출된 리프 노드인 후보 노드들을 포함하는 응답 트리를 생성하는 단계; 상기 응답 트리에 기반한 질의 응답을 통해 상기 응답 트리에 포함된 후보 노드들 중 어느 하나를 상기 쿼리에 대응되는 응답 노드로 결정하는 단계; 및 상기 응답 노드에 태깅 된 텍스트 콘텐츠에서 상기 쿼리에 대한 응답을 검색하되, 상기 쿼리 중 상기 응답 노드의 결정에 미사용 된 부분을 이용하여 상기 응답을 검색하는 단계;를 포함할 수 있다.
상기 쿼리는 제1 키워드에 기반하는 제1 쿼리 및 제2 키워드에 기반하는 제2 쿼리를 포함하고, 상기 응답 트리를 생성하는 단계는 상기 제1 쿼리와의 관련성에 기초하여 상기 응답 트리를 생성하고, 상기 응답 노드로 결정하는 단계는 상기 응답 트리에 포함된 후보 노드들 중 어느 하나를 상기 제1 쿼리에 대응되는 응답 노드로 결정하고, 상기 응답을 검색하는 단계는 상기 응답 노드에 태깅 된 텍스트 콘텐츠에서 상기 제2 쿼리에 대한 응답을 검색할 수 있다.
상기 제1 키워드는 상기 제2 키워드의 상위 카테고리이고, 상기 제1 키워드는 하나 이상일 수 있다.
상기 응답을 검색하는 단계는 상기 텍스트 콘텐츠의 적어도 일부분을 상기 쿼리에 대한 응답으로 결정할 수 있다.
상기 응답 트리를 생성하는 단계는 상기 원본 트리에서 상기 쿼리와 관련된 리프 노드들을 상기 후보 노드들로 추출하고, 상기 원본 트리의 루트 노드로부터 상기 후보 노드들 각각에 이르는 경로상에 있는 가지 노드들을 포함하는 상기 응답 트리를 생성하고, 상기 응답 노드로 결정하는 단계는 상기 응답 트리의 루트 노드로부터 상기 쿼리에 대한 응답에 대응되는 리프 노드로 진행하는 과정 중 둘 이상의 노드가 존재하는 레벨을 만나는 경우, 상기 둘 이상의 노드 중 어느 하나의 노드를 선택하기 위한 질의를 생성하고, 상기 질의에 대한 답변에 따라 상기 둘 이상의 노드 중 어느 하나의 노드를 선택하고, 상기 선택된 노드가 상기 후보 노드들 중 어느 하나인 경우, 상기 선택된 노드를 상기 응답 노드로 결정할 수 있다.
상기 응답 트리는 하나의 노드만 포함하는 레벨인 질의 생략 레벨을 적어도 하나 이상 포함하고, 상기 응답 노드로 결정하는 단계는 상기 과정 중 상기 질의 생략 레벨을 만나는 경우, 상기 둘 이상의 노드 중 어느 하나의 노드를 선택하는 과정을 생략하고, 다음 레벨로 이동할 수 있다.
상기 원본 트리의 적어도 하나의 리프 노드들 각각에는 각각의 리프 노드와 관련된 질의, 각각의 리프 노드와 관련된 텍스트 콘텐츠가 태깅(Tagging)되어 있고,
상기 응답 트리를 생성하는 단계는 상기 쿼리와 상기 적어도 하나의 리프 노드들 각각에 태깅된 관련된 질의 및 텍스트 콘텐츠 중 적어도 하나를 이용하여 상기 후보 노드들을 추출할 수 있다.
상기 쿼리는 사용자가 답변을 얻고자 하는 내용에 대한 사용자 질의를 포함하고, 상기 응답 트리를 생성하는 단계 소정의 우선순위에 따라 상기 사용자 질의와 상기 적어도 하나의 리프 노드들 각각에 태깅 된 항목들을 비교하여 상기 후보 노드들을 추출할 수 있다.
상기 응답 노드로 결정하는 단계는 상기 쿼리에 상기 응답 트리에 기반한 질의 응답을 통해 선택된 노드들에 대응되는 쿼리가 부가된 최종 쿼리를 생성하고, 상기 응답을 검색하는 단계는 상기 텍스트 콘텐츠에서 상기 생성 쿼리에 대응되는 응답을 검색할 수 있다.
본 발명에 따르면 사용자가 자신의 질의에 대한 답변을 획득하는 과정에 있어서, 선택이 필요 없는 내용에 대한 선택 과정이 생략되어 응답 검색의 절차가 간소화된다.
또한 사용자의 최초 쿼리로부터 사용자의 질의 사항을 대략적으로 특정하고, 특정된 내용에 따라 대략적인 응답의 범위를 결정함으로써 질의응답 과정의 효율성을 향상시킬 수 있다.
또한 원본 트리에 의해서 사용자의 의도에 정확하게 부합되는 답변이 제공되지 못하는 경우에도, 원본 트리에 부가된 텍스트 콘텐츠로부터 사용자의 의도에 부합하는 답변을 검색하여 제공함으로써 보다 정확한 답변이 가능하다.
도 1은 본 발명의 일 실시예에 따른 질의응답 시스템의 구성을 개략적으로 도시한 도면이다.
도 2는 본 발명의 일 실시예에 따른 서버에 구비되는 답변 제공 장치의 구성을 개략적으로 도시한 도면이다.
도 3은 답변 제공 장치가 생성한 예시적인 원본 트리를 도시한 도면이다.
도 4는 도 3의 원본 트리로부터 생성된 응답 트리를 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 답변 제공 장치가 응답 트리를 이용하여 응답 노드를 결정하는 과정을 설명하기 위한 도면이다.
도 6은 각 레벨에서의 질의, 응답과, 각 레벨에서 수정된 쿼리를 도시한 도면이다.
도 7은 답변 제공 장치가 텍스트 콘텐츠에서 쿼리에 대한 응답을 검색하는 과정을 설명하기 위한 도면이다.
도 8은 본 발명의 일 실시예에 따른 사용자 단말에 표시되는 화면의 예시이다.
도 9는 본 발명의 일 실시예에 따른 답변 제공 장치에 의해 수행되는 질의응답 제공 방법을 설명하기 위한 흐름도이다.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 본 발명의 효과 및 특징, 그리고 그것들을 달성하는 방법은 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 다양한 형태로 구현될 수 있다.
이하, 첨부된 도면을 참조하여 본 발명의 실시예들을 상세히 설명하기로 하며, 도면을 참조하여 설명할 때 동일하거나 대응하는 구성 요소는 동일한 도면부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.
이하의 실시예에서, 제1, 제2 등의 용어는 한정적인 의미가 아니라 하나의 구성 요소를 다른 구성 요소와 구별하는 목적으로 사용되었다. 이하의 실시예에서, 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 이하의 실시예에서, 포함하다 또는 가지다 등의 용어는 명세서상에 기재된 특징, 또는 구성요소가 존재함을 의미하는 것이고, 하나 이상의 다른 특징들 또는 구성요소가 부가될 가능성을 미리 배제하는 것은 아니다. 도면에서는 설명의 편의를 위하여 구성 요소들이 그 크기가 과장 또는 축소될 수 있다. 예컨대, 도면에서 나타난 각 구성의 크기 및 형태는 설명의 편의를 위해 임의로 나타내었으므로, 본 발명이 반드시 도시된 바에 한정되지 않는다.
도 1은 본 발명의 일 실시예에 따른 질의응답 시스템의 구성을 개략적으로 도시한 도면이다.
본 발명의 일 실시예에 다른 질의응답 시스템은 리프 노드에 태깅 된 텍스트 콘텐츠에 대한 검색으로 질의에 대한 답변을 제공할 수 있다.
이와 같은 본 발명의 일 실시예에 따른 질의응답 시스템은 서버(100), 사용자 단말(200) 및 통신망(300)을 포함할 수 있다.
본 발명에서 '트리(Tree)'는 계층적인 구조의 자료를 나타내기 위한 수단으로, 적어도 하나 이상의 노드(Node)로 구성되는 자료 구조를 의미할 수 있다. 본 발명에서 트리는 하나의 루트 노드(Root Node)를 가지며, 루트 노드는 0개 이상의 자식 노드(Child Node)를 가질 수 있다.
또한 0개 이상의 자식 노드 각각 또한 0개 이상의 자식 노드를 가질 수 있으며 이는 각각의 자식 노드에 대해서 반복적으로 정의될 수 있다. 트리에 포함된 노드들 간에는 간선(Edge)으로 연결될 수 있으나, 트리는 사이클(Cycle)(또는 폐회로)을 포함하지 않는다.
본 발명에서 '루트 노드'(Root Node)는 부모 노드(Parent Node, 또는 상위 노드)가 없는 최상위 노드를 의미할 수 있다. 이와 같은 루트 노드는 1개의 트리에서 1개만 존재할 수 있다.
본 발명에서 '리프 노드'(Leaf Node)는 자식 노드(Child Node, 또는 하위 노드)가 없는 노드를 의미할 수 있다. 이와 같은 리프 노드는 1개의 트리에서 복수개일 수 있다.
본 발명에서 리프 노드에는 해당 노드와 관련된 질의 및 해당 노드와 관련된 텍스트 콘텐츠가 태깅(Tagging)되어 있을 수 있으며, 이에 대한 상세한 설명은 후술한다.
본 발명에서 노드의 '레벨'(Level)은 트리에서 특정 깊이를 가지는 노드의 집합을 의미할 수 있다. 이때 '깊이'는 루트 노드에서 어떤 노드에 도달하기 위해 거쳐야 하는 간선(Edge)의 수를 의미할 수 있다.
본 발명에서 '원본 트리'는 질의응답 시스템에서 제공 가능한 모든 리프 노드들을 포함하는 트리를 의미할 수 있다. 가령 질의응답 시스템에서 제공 가능한 질의-텍스트 콘텐츠 셋이 100개 인 경우, 원본 트리는 100개의 리프 노드들을 포함하는 트리를 의미할 수 있다.
본 발명에서 '응답 트리'는 사용자의 쿼리와 관련된 응답을 포함하는 리프 노드들만 포함하는 트리를 의미할 수 있다. 가령 질의응답 시스템에서 제공 가능한 100개의 질의-텍스트 콘텐츠 셋 중에 사용자의 쿼리와 관련된 질의-텍스트 콘텐츠 셋이 10개 인경우, 응답 트리는 10개의 리프 노드들 만을 포함하는 트리를 의미할 수 있다. 이와 같은 응답 트리는 사용자의 쿼리에 기초하여 생성될 수 있으며, 이에 대한 상세한 설명은 후술한다.
본 발명에서 '사용자의 쿼리'(Query)는 서버(100)로 전송되는 사용자의 요청을 의미할 수 있다. 가령 사용자의 쿼리는 자신의 문의사항에 대한 답변을 구하는 요청일 수 있다.
본 발명에서 사용자의 쿼리는 하나 이상의 쿼리를 포괄하는 개념일 수 있다. 가령 사용자의 쿼리는 제1 키워드에 기반하는 제1 쿼리와 제2 키워드에 기반하는 제2 쿼리를 포괄하는 개념일 수 있다. 이 때 제1 키워드는 제 2키워드의 상위 카테고리(또는 상위 개념)일 수 있고, 각각의 키워드는 복수일 수 있다.
예를 들어 사용자의 쿼리가 '이순신 장군의 전투가 언제야?'인 경우, 쿼리는 '이순신', '장군' '전투'에 기반하여 관련 내용을 요청하는 제1 쿼리(또는 제1 서브 쿼리)와, '언제'에 기반하여 관련 내용을 요청하는 제2 쿼리(또는 제2 서브 쿼리)를 포괄하는 개념일 수 있다. 이때 하나의 서브 쿼리와 관련된 제1 키워드 및 제2 키워드 각각은 단수일 수도 있고 복수일 수도 있다. 다만 이는 예시적인것으로 본 발명의 사상이 이에 한정되는 것은 아니다.
본 발명의 다른 실시예에서, 사용자의 쿼리는 하나 이상의 서브 쿼리로 분할될 수 있다. 가령 사용자의 쿼리가 검색 문자열을 포함하는 경우, 사용자의 쿼리는 검색 문자열을 소정의 단위로 분할한 검색어(또는 키워드)를 포함하는 서브 쿼리로 분할될 수 있다. 다만 이는 예시적인것으로 본 발명의 사상이 이에 한정되는 것은 아니다.
본 발명의 일 실시예에 따른 사용자 단말(200)은 서버(100)에 의해 제공되는 질의응답 서비스를 이용할 수 있도록 사용자와 서버(100)를 매개하는 다양한 형태의 장치를 의미할 수 있다.
본 발명의 일 실시예에서, 사용자 단말(200)은 사용자의 질의 및 그에 대한 답변과 관련된 데이터를 서버(100)와 송수신 하는 다양한 장치를 의미할 수 있다. 이와 같은 사용자 단말(200)은 도 1에 도시된 바와 같이, 휴대용 단말(201, 202, 203)을 의미할 수도 있고, 컴퓨터(204)를 의미할 수도 있다.
한편 사용자 단말(200)은 상술한 기능을 수행하기 위해 콘텐츠 등을 표시하기 위한 표시수단, 이러한 콘텐츠에 대한 사용자의 입력을 획득하기 위한 입력수단을 구비할 수 있다. 이 때 입력수단 및 표시수단은 다양하게 구성될 수 있다. 가령 입력수단은 키보드, 마우스, 트랙볼, 마이크, 버튼, 터치패널 등을 포함할 수 있으나 이에 한정되지 않는다.
본 발명의 일 실시예에 따른 통신망(300)은 질의응답 시스템의 각 구성 간의 데이터 송수신을 매개하는 통신망을 의미할 수 있다. 가령 통신망(300)은 LANs(Local Area Networks), WANs(Wide Area Networks), MANs(Metropolitan Area Networks), ISDNs(Integrated Service Digital Networks) 등의 유선 네트워크나, 무선 LANs, CDMA, 블루투스, 위성 통신 등의 무선 네트워크를 망라할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.
본 발명의 일 실시예에 따른 서버(100)는 리프 노드에 태깅 된 텍스트 콘텐츠에 대한 검색으로 질의에 대한 답변을 제공할 수 있다. 특히 본 발명의 일 실시예에 따른 서버(100)는 트리에 포함된 노드에 의해 사용자의 질의에 대한 완전한 답변을 제공할 수 없는 경우에도, 리프 노드에 태깅 된 텍스트 콘텐츠에 대한 검색을 수행함으로써 사용자의 질의에 보다 부합하는 답변을 제공할 수 있다.
도 2는 본 발명의 일 실시예에 따른 서버(100)에 구비되는 답변 제공 장치(110)의 구성을 개략적으로 도시한 도면이다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 답변 제공 장치(110)는 통신부(111), 제어부(112) 및 메모리(113)를 포함할 수 있다. 또한 도면에는 도시되지 않았으나, 본 실시예에 따른 답변 제공 장치(110)는 입/출력부, 프로그램 저장부 등을 더 포함할 수 있다.
통신부(111)는 답변 제공 장치(110)가 사용자 단말(200) 및/또는 외부장치(미도시)와 같은 다른 네트워크 장치와 유무선 연결을 통해 제어 신호 또는 데이터 신호와 같은 신호를 송수신하기 위해 필요한 하드웨어 및 소프트웨어를 포함하는 장치일 수 있다.
제어부(112)는 프로세서(Processor)와 같이 데이터를 처리할 수 있는 모든 종류의 장치를 포함할 수 있다. 여기서, '프로세서(Processor)'는, 예를 들어 프로그램 내에 포함된 코드 또는 명령으로 표현된 기능을 수행하기 위해 물리적으로 구조화된 회로를 갖는, 하드웨어에 내장된 데이터 처리 장치를 의미할 수 있다. 이와 같이 하드웨어에 내장된 데이터 처리 장치의 일 예로써, 마이크로프로세서(Microprocessor), 중앙처리장치(Central Processing Unit: CPU), 프로세서 코어(Processor Core), 멀티프로세서(Multiprocessor), ASIC(Application-Specific Integrated Circuit), FPGA(Field Programmable Gate Array) 등의 처리 장치를 망라할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.
메모리(113)는 답변 제공 장치(110)가 처리하는 데이터를 일시적 또는 영구적으로 저장하는 기능을 수행한다. 메모리는 자기 저장 매체(Magnetic Storage Media) 또는 플래시 저장 매체(Flash Storage Media)를 포함할 수 있으나, 본 발명의 범위가 이에 한정되는 것은 아니다.
가령 메모리(113)는 원본 트리를 구성하는 데이터들(가령 데이터의 구조, 리프 노드들 각각에 태깅된 정보들 등) 및 응답 트리를 구성하는 데이터들을 일시적 및/또는 영구적으로 저장할 수 있다. 다만 이는 예시적인것으로 본 발명의 사상이 이에 한정되는 것은 아니다.
이하에서는 본 발명의 일 실시예에 따른 답변 제공 장치(110)가 서버(100)에 구비되고, 사용자가 사용자 단말(200)을 이용하여 서버(100)로 쿼리를 전송하는 것을 전제로 답변 제공 장치(110)의 동작을 설명한다. 다만 이와 같은 구성은 예시적인것으로, 답변 제공 장치(110)는 사용자 단말(200)에 구비될 수도 외부장치(미도시)에 구비될 수도 있다.
원본 트리로부터 응답 트리를 생성하는 과정
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 원본 트리를 생성할 수 있다. 가령 본 발명의 일 실시예에 따른 답변 제공 장치(110)는 복수의 외부장치(미도시)로부터 데이터를 수집하고, 수집된 데이터를 소정의 방식에 따라 검색, 분류 및/또는 가공 하여 원본 트리를 생성할 수 있다. 이때 답변 제공 장치(110)는 다양한 공지의 기법을 활용하여 원본 트리를 생성할 수 있다.
예를 들어 답변 제공 장치(110)는 이순신 장군에 대한 검색 결과를 복수의 웹 사이트로부터 크롤링(crawling)하여 데이터를 수집하고, 수집된 데이터를 소정의 방식에 따라 분류 및/또는 가공하여 원본 트리를 생성할 수 있다. 이때 답변 제공 장치(110)는 원본 트리의 레벨의 수, 각 레벨에 포함되는 노드의 수 및 리프 노드에 태깅되는 데이터 들을 적절히 결정할 수 있다. 다만 이는 예시적인것으로 본 발명의 사상이 이에 한정되는 것은 아니다.
선택적 실시예에서, 답변 제공 장치(110)는 사용자의 조작에 기초하여 원본 트리를 생성할 수도 있다.
도 3은 답변 제공 장치(110)가 생성한 예시적인 원본 트리(510)를 도시한 도면이다.
원본 트리(510)는 도 3에 도시된 바와 같이 3개의 레벨(Level 1, Level 2, Level 3)로 구성되고, 각각의 레벨은 하나 이상의 노드들을 포함할 수 있다. 가령 첫 번째 레벨(Level 1)의 경우 루트 노드(N11)를 포함할 수 있고, 두 번째 레벨(Level 2)의 경우 루트 노드(N11)에 대한 세 개의 자식 노드들(N21, N22, N23)을 포함할 수 있다. 물론 세 번째 레벨(Level 3)의 경우 두 번째 레벨(Level 2)의 노드들(N21, N22, N23)에 대한 자식 노드들(N31 내지 N35)을 포함할 수 있다.
한편 세 번째 레벨(Level 3)에 포함되는 노드들(N31 내지 N35)은 원본 트리(510)에 대한 리프 노드들에 해당할 수 있으며, 각각의 노드에는 각 노드와 관련된 질의 및 텍스트 콘텐츠(T1 내지 T3 및 T5 내지 T6)가 태깅되어 있을 수 있다. 물론 두 번째 레벨(Level 2)에 포함되는 노드(N22)도 리프 노드에 해당하며, 관련된 질의 및 텍스트 콘텐츠(T4)가 태깅되어 있을 수 있다.
가령 노드(N31)에 대한 관련된 질의 및 텍스트 콘텐츠(T1)는 이순신 장군의 한산도 대첩에 관한 질의들(Q1, Q2), 텍스트 콘텐츠(P1) 및 기타 태그들(Tag 1, Tag 2)을 포함할 수 있다. 이때 노드(N31)는 이순신 장군의 한산도 대첩에 대한 정보를 포함하는 노드일 수 있다.
도 3에 도시된 트리의 구조 및/또는 내용은 예시적인 것으로 본 발명의 사상이 이에 한정되는 것은 아니다. 따라서 트리는 도 3에 도시된 것 보다 더 많거나 더 적은 레벨로 구성될 수 있고, 리프 노드들이 서로 다른 레벨에 위치할 수도 있다.
이하에서는 설명의 편의를 위하여 원본 트리가 도 3에 도시된 바와 같음을 전제로 설명한다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 사용자의 쿼리를 수신할 수 있다. 본 발명에서 사용자의 쿼리는 답변 제공 장치(110)로 전송되는 사용자의 요청을 의미할 수 있다. 가령 사용자의 쿼리는 사용자의 문의사항에 대한 답변을 구하는 요청일 수 있다. 따라서 본 발명의 일 실시예에서 사용자의 쿼리는 사용자의 질의(또는 질의 내용)를 포함할 수 있다.
또한 전술한 바와 같이 본 발명에서 사용자의 쿼리는 하나 이상의 쿼리를 포괄하는 개념일 수 있다. 가령 사용자의 쿼리는 제1 키워드에 기반하는 제1 쿼리와 제2 키워드에 기반하는 제2 쿼리를 포괄하는 개념일 수 있다.
예를 들어 사용자의 쿼리(또는 메인 쿼리)가 '이순신 장군의 전투가 언제야?'인 경우, 쿼리는 '이순신', '장군' '전투'에 기반하여 관련 내용을 요청하는 제1 쿼리(또는 제1 서브 쿼리)와, '언제'에 기반하여 관련 내용을 요청하는 제2 쿼리(또는 제2 서브 쿼리)를 포괄하는 개념일 수 있다. 이때 하나의 서브 쿼리와 관련된 제1 키워드 및 제2 키워드 각각은 단수일 수도 있고 복수일 수도 있다. 다만 이는 예시적인것으로 본 발명의 사상이 이에 한정되는 것은 아니다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 원본 트리(510)에서 수신된 사용자의 쿼리와 관련된 리프 노드들을 후보 노드들로 추출할 수 있다. 이때 '후보 노드들'은 사용자의 쿼리에 대한 응답으로써 제공될 답변을 포함하는 것으로 예상되는 노드들을 의미할 수 있다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 사용자 쿼리의 내용과 원본 트리(510)의 적어도 하나의 리프 노드들(N22 및 N31 내지 N35) 각각에 태깅된 정보들을 이용하여 후보 노드들을 추출할 수 있다.
일 실시예에서 답변 제공 장치(110)는 사용자의 쿼리에 포함된 질의와 리프 노드들(N22 및 N31 내지 N35) 각각에 태깅된 항목들 간의 관련성에 기초하여 후보 노드들을 추출할 수 있다.
이때 답변 제공 장치(110)는 소정의 우선순위에 따라 쿼리에 포함된 질의와 리프 노드들(N22, N31 내지 N35) 각각에 태깅된 항목들 간의 관련성을 판단하여 후보 노드들을 추출할 수 있다.
가령 답변 제공 장치(110)는 리프 노드들(N22, N31 내지 N35)에 태깅된 질의(예를 들어 N31의 Q1, Q2), 텍스트 콘텐츠(P1), 기타 태그(예를 들어 N31의 Tag 1, Tag 2) 순으로 사용자의 쿼리에 포함된 질의와의 관련성을 판단하여 후보 노드들을 추출할 수 있다. 다만 이와 같은 순서는 예시적인것으로 본 발명의 사상이 이에 한정되는 것은 아니다.
예를 들어 사용자의 쿼리에 "이순신 장군의 전투가 전제야?"라는 질의가 포함되어 있는 경우, 답변 제공 장치(110)는 리프 노드들(N22, N31 내지 N35) 중 사용자의 질의에 대응되는 질의를 포함하는 리프 노드들(N31 내지 N33)을 후보 노드들로 추출할 수 있다.
선택적 실시예에서, 본 발명의 일 실시예에 따른 답변 제공 장치(110)는 사용자의 쿼리로부터 파악된 개체명(또는 소정의 키워드)과 리프 노드들에 태깅된 개체명(또는 소정의 키워드)을 비교하는 방식으로 후보 노드들을 추출할 수도 있다. 이를 위해서 리프 노드들(N22, N31 내지 N35)에는 기타 태그로써 개체명이 태깅 되어 있을 수 있다. 다만 이는 예시적인것으로 본 발명의 사상이 이에 한정되는 것은 아니다.
선택적 실시예에서, 답변 제공 장치(110)는 리프 노드들(N22, N31 내지 N35)에 태깅된 질의 및 텍스트 콘텐츠를 이용하여 추출된 후보 노드들의 수가 소정의 제1 임계 수량 미만인 경우에만 개체명(또는 기타 태그)을 이용하여 후보 노드들을 추출할 수 있다. 이때 제1 임계 수량은 시스템의 구성 및/또는 용도에 따라 적절하게 설정될 수 있다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 상술한 과정에 의해 추출횐 후보 노드들의 수량이 제2 임계 수량 미만인 경우, 미리 구축된 사전을 이용하여 수신된 쿼리에 포함되는 요청어와 관련이 있는 변형 요청어를 포함하는 변형 쿼리를 생성하고, 변형 쿼리를 이용하여 후보 노드들을 추출할 수도 있다. 이때 요청어 간에 '관련이 있는'것은 상호간에 동의어이거나 상호간에 소정의 관계에 있는 것으로, 미리 설정된 것을 의미할 수 있다. 또한 제2 임계 수량은 시스템의 구성 및/또는 용도에 따라 적절하게 설정될 수 있다.
본 발명에서 답변 제공 장치(110)는 다양한 방식으로 두 개의 항목의 관련성을 판단할 수 있다. 가령 답변 제공 장치(110)는 사용자의 쿼리에 포함된 질의와 리프 노드들(N22, N31 내지 N35)에 태깅된 질의들 각각의 특징 벡터(Feature Vector) 간의 거리를 산출하는 방식으로 관련성을 판단할 수 있다. 다만 이와 같은 방식은 예시적인것으로 본 발명의 사상이 이에 한정되는 것은 아니다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 상술한 과정에 따라 후보 노드들을 추출함에 있어서, 사용자의 쿼리의 적어도 일부만을 사용할 수 있다.
본 발명의 일 실시예에서, 따른 답변 제공 장치(110)는 사용자의 쿼리를 원본 트리에서 응답을 제공할 수 있는 부분인 제1 쿼리와 원본 트리에서 응답을 제공할 수 없는 부분인 제2 쿼리로 구분할 수 있다.
가령 사용자의 쿼리에 "이순신 장군의 전투가 언제야?"라는 질의가 포함되어 있는 경우, 답변 제공 장치(110)는 쿼리를 원본 트리(510)에서 응답을 제공할 수 있는 부분인 "이순신 장군 전투"와, 응답을 제공할 수 없는 부분인 "언제야"로 구분할 수 있다.
한편 이와 같은 쿼리의 구분(또는 분할)은 사후적으로 이루어 질 수도 있다. 바꾸어 말하면 답변 제공 장치(110)는 상술한 과정에 따라 후보 노드들을 추출한 뒤, 사용자의 쿼리를 후보 노드들의 추출에 사용된 부분과 그렇지 못한 부분으로 구분할 수도 있다.
본 발명의 일 실시예에서, 원본 트리에서 사용자의 쿼리에 대한 응답이 완전하게 제공된 경우, 제2 쿼리는 존재하지 않을 수 있다. 이러한 경우 사용자의 쿼리와 제1 쿼리가 동일할 수 있다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 원본 트리(510)의 루트 노드(N11)로부터 추출된 후보 노드들 각각에 이르는 경로상에 있는 가지 노드들을 포함하는 응답 트리를 생성할 수 있다.
도 4는 도 3의 원본 트리(510)로부터 생성된 응답 트리(610)를 도시한 도면이다.
설명의 편의를 위해 원본 트리(510)가 도 3에 도시된 바와 같으며, 사용자의 쿼리에 "이순신 장군의 전투가 언제야?"라는 질의(620)가 포함되어 있고, 이에 따라 답변 제공 장치(110)가 이순신 장군의 전투와 관련된 정보를 포함하는 리프 노드들(N31 내지 N33)을 후보 노드들로 추출하였음을 가정하여 설명한다.
상술한 가정 하에, 본 발명의 일 실시예에 따른 답변 제공 장치(110)는 원본 트리(510)의 루트 노드(N11)로부터 추출된 리프 노드들(N31 내지 N33)들(또는 후보 노드들) 각각에 이르는 경로상에 있는 가지 노드(N21)를 포함하는 응답 트리(610)를 생성할 수 있다. 이때 응답 트리(610)는 원본 트리(510) 상의 노드들로써 선택된 노드들(N11, N21, N31, N32, N33)을 포함하도록 구성될 수 있다.
이와 같이 본 발명은 사용자의 쿼리와 관련된 내용만을 포함하는 응답 트리를 생성할 수 있다. 생성된 응답 트리는 사용자에게 보다 빠르고 정확한 응답을 제공하기 위해 사용될 수 있으며, 이에 대한 상세한 내용은 후술한다.
응답 트리를 이용하여 응답 노드를 결정하는 과정
도 5는 본 발명의 일 실시예에 따른 답변 제공 장치(110)가 응답 트리(610)를 이용하여 응답 노드를 결정하는 과정을 설명하기 위한 도면이다. 도 6은 각 레벨에서의 질의, 응답과, 각 레벨에서 수정된 쿼리를 도시한 도면이다. 이하에서는 도 5 및 도 6을 함께 참조하여 설명한다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 응답 트리(610)에 기반한 질의 응답을 통해 응답 트리(610)에 포함된 후보 노드들 중 어느 하나를 쿼리에 대응되는 응답 노드로 결정할 수 있다.
가령 답변 제공 장치(110)는 응답 트리(610)의 Level 1의 루트 노드(N11)로부터 응답 트리(610)의 Level 3의 리프 노드들(N31 내지 N33)의 방향(D)으로 진행하면서, 최종적으로 리프 노드들(N31 내지 N33) 중 어느 하나를 응답 노드로 결정할 수 있다. 이때 방향(D)은 응답 트리(610)의 낮은 레벨에서 높은 레벨로 이동하는 방향 또는 루트 노드에서 리프 노드로 이동하는 방향을 의미할 수 있다.
보다 구체적으로 답변 제공 장치(110)는 상술한 방향(D)으로의 진행 과정 중 둘 이상의 노드가 존재하는 레벨을 만나는 경우, 둘 이상의 노드 중 어느 하나의 노드를 선택하기 위한 질의를 생성하여 사용자 단말(200)에 제공할 수 있다.
또한 답변 제공 장치(110)는 제공된 질의에 대한 사용자의 답변을 수신하여 둘 이상의 노드 중 어느 하나의 노드를 선택할 수 있다.
가령 답변 제공 장치(110)는 Level 3에서, 세 개의 리프 노드들(N31 내지 N33) 중 어느 하나를 선택하기 위해 "이순신 장군의 어떤 전투가 궁금하세요?"와 같은 질의을 생성하여 사용자 단말(200)에 제공하고, 그에 대한 사용자의 답변을 수신하여 세 개의 리프 노드들(N31 내지 N33) 중 어느 하나를 응답 노드로 선택할 수 있다. 이때 답변 제공 장치(110)는 생성된 질의 함께 후보 답변을 제공할 수도 있다. 가령 답변 제공 장치(110)는 상술한 질문과 함께 "한산도", "명량", "옥포"와 같은 후보 답변을 함께 제공할 수 있다. 다만 이는 예시적인것으로 본 발명의 사상이 이에 한정되는 것은 아니다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 하나의 노드만을 포함하는 레벨인 질의 생략 레벨을 만나는 경우, 둘 이상의 노드 중 어느 하나의 노드를 선택하는 과정을 생략하고 다음 레벨로 이동할 수 있다.
가령 답변 제공 장치(110)가 응답 트리(610)에서 노드(N21)만을 포함하는 질의 생략 레벨(Level 2)을 만나는 경우, 둘 이상의 노드 중 어느 하나의 노드를 선택하는 과정을 생략 다음 레벨(Level 3)로 이동할 수 있다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 응답 트리(610)의 리프 노드들(N31 내지 N33)에 대한 질의를 생성하여 그에 대한 답변을 수신할 때까지 상술한 동작을 반복하여 수행할 수 있다.
바꾸어말하면 답변 제공 장치(110)는 사용자의 답변에 따라 선택된 노드가 리프 노드들(N31 내지 N33) 중 어느 하나인 경우, 선택된 노드를 사용자의 쿼리에 대한 응답 노드로써 결정할 수 있다.
한편 본 발명의 일 실시예에 따른 답변 제공 장치(110)는 상술한 질의 응답 과정을 통해 선택된 노드들에 대응되는 쿼리를 부가한 최종 쿼리를 생성할 수 있다. 가령 답변 제공 장치(110)가 Level 3에서 세 개의 리프 노드들(N31 내지 N33) 중 어느 하나를 선택하기 위해 "이순신 장군의 어떤 전투가 궁금하세요?"와 같은 질의을 생성하여 사용자 단말(200)에 제공하였고, "한산도"라는 답변을 사용자 단말(200)로부터 수신하였음을 가정해 보자. 이러한 경우 답변 제공 장치(110)는 "이순신 장군의 전투가 언제야?"라는 쿼리에 "한산도"를 추가하여 "이순신 장군의 한산도 전투가 언제야?"를 최종 쿼리로 생성할 수 있다.
응답 노드를 이용하여 응답을 제공하는 과정
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 상술한 과정에 따라 결정된 응답 노드에 태깅 된 텍스트 콘텐츠에서, 쿼리에 대한 응답을 검색할 수 있다. 이때 답변 제공 장치(110)는 쿼리 중 원본 트리에서 응답을 제공하지 못한 부분을 이용하여 응답을 검색할 수 있다.
도 7은 답변 제공 장치(110)가 텍스트 콘텐츠(P1)에서 쿼리에 대한 응답을 검색하는 과정을 설명하기 위한 도면이다.
전술한 바와 같이 본 발명의 일 실시예에 따른 답변 제공 장치(110)는 사용자의 쿼리를 원본 트리에서 응답을 제공한 부분인 제1 쿼리와 원본 트리에서 응답을 제공하지 못한 부분인 제2 쿼리로 구분할 수 있다.
가령 사용자의 쿼리에 "이순신 장군의 전투가 언제야?"라는 질의가 포함되어 있는 경우, 답변 제공 장치(110)는 쿼리를 원본 트리(510)에서 응답을 제공한 부분인 "이순신 장군 전투"와, 응답을 제공하지 못한 부분인 "언제야"로 구분할 수 있다. 이때 원본 트리(510)에서 응답을 제공한 부분인 "이순신 장군 전투"는 상술한 과정에 따라 응답 트리(610)를 생성하는데 사용된 부분일 수 있다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 상술한 과정에 따라 결정된 응답 노드(N31)에 태깅 된 텍스트 콘텐츠(P1)에서 제2 쿼리에 대한 응답을 검색할 수 있다. 이때 답변 제공 장치는 상술한 과정에 따라 생성된 최종 쿼리를 고려하여 응답을 검색할 수 있다.
가령 본 발명의 일 실시예에 따른 답변 제공 장치(110)는 이순신 장군의 한산도 대첩에 대한 전반적 내용을 포함하는 텍스트 콘텐츠(P1)에서 제2 쿼리인 "언제야"에 대한 응답인 "1592년 선조(25) 8월 14일(음력 7월 8일)"을 검색할 수 있다.
본 발명의 일 실시예에서, 답변 제공 장치(110)는 텍스트 콘텐츠(P1)의 적어도 일 부분(T1_Ans)을 쿼리에 대한 응답으로 결정할 수 있다. 가령 답변 제공 장치(110)는 텍스트 콘텐츠(P1)내의 일부 구간을 응답으로 결정할 수 있다. 이때 답변 제공 장치(110)는 응답을 텍스트 콘텐츠(P1) 내의 구간을 설정하는 위치값의 형태로 결정할 수 있다.
종래기술의 경우, 원본 트리에 의해서 사용자의 의도에 정확하게 부합되는 답변이 제공되지 못하는 경우, 사용자가 제공된 답변에서 자신의 의도에 부합하는 정답을 다시 추론해야 하는 과정이 필요하였다. 예를 들어 종래기술에 따르면 "이순신 장군의 전투가 언제야?"라는 질의에 따라 이순신 장군의 한산도 대첩에 대한 일반적인 내용을 포함하는 답변(예를 들어 도 7의 P1)이 제공되었고, 사용자는 '언제야'에 부합되는 답을 제공된 답변 내에서 찾아야 했다.
그러나 본 발명에 따르면 원본 트리에 의해서 사용자의 의도에 정확하게 부합되는 답변이 제공되지 못하는 경우에도, 원본 트리에 부가된 텍스트 콘텐츠로부터 사용자의 의도에 부합하는 답변을 검색하여 제공함으로써 보다 정확한 답변이 가능하다.
이에 더하여 본 발명은 사용자의 쿼리에 따라 특정된 정보를 이용하여 모든 내용을 포함하는 원본 트리로부터 사용자의 쿼리에 관련된 내용만을 포함하는 응답 트리를 생성하고, 생성된 응답 트리를 이용하여 사용자의 쿼리에 대한 응답을 검색하되, 생략 가능한 레벨에 대한 질의는 생략하여 응답 검색의 절차를 간소화할 수 있다.
종래기술에 따를 경우 사용자는 도 3에 도시된 원본 트리(510)로부터 자신이 원하는 정보를 획득하기 위해, 총 2회의 선택 과정을 거쳐야 했다. 즉 사용자는 자신의 쿼리가 Level 2에 속하는 노드 중 어느 노드에 관한 것인지 선택하는 첫 번째 선택 과정과, Level 3에 속하는 노드 중 어느 노드에 관한 것인지 선택하는 두 번째 선택 과정을 거쳐야 최종적으로 자신의 요청사항에 대한 응답을 얻을 수 있었다.
그러나 본 발명은 사용자의 쿼리에 따라 도 5에 도시된 응답 트리(610)를 생성하고 이를 이용하여 응답을 제공하되, 사용자의 선택이 필요 없는 레벨(Level 2)에 대한 선택 과정을 생략함으로써 응답 검색의 절차를 간소화할 수 있다.
도 3 내지 도 5에 도시된 예시에서는 종래기술과 본 발명에 따른 선택 과정에 1회 밖에 차이가 나지 않지만, 이는 예시적인 트리 구조에 기인한 것으로 원본 트리가 보다 많은 레벨을 포함하는 경우 선택 과정의 수량 차이는 보다 증가될 수 있다. 가령 응답 트리가 N(N은 자연수)개의 레벨로 구성되고, M개(M은 N 미만의 자연수)의 질의응답 생략 레벨을 포함하는 경우, 답변 제공 장치(110)는 N-M 개의 레벨 각각에 대한 질의를 생성하고, 그에 대한 답변에 따라 각각의 레벨 상의 둘 이상의 노드 중 어느 하나의 노드를 선택할 수 있다. 이에 따라 M개의 선택 과정이 생략될 수 있다.
한편 본 발명의 일 실시예에 따른 답변 제공 장치(110)는 제2 쿼리가 존재하지 않는 경우, 상술한 검색 과정을 생략할 수 있다. 가령 사용자의 쿼리가 "이순신 장군의 한산도 대첩에 대해서 알려줘"이고, 이와 같은 쿼리가 모두 제1 쿼리에 속하는 경우 제2 쿼리를 이용한 검색 과정은 생략될 수 있다.
도 8은 본 발명의 일 실시예에 따른 사용자 단말(200)에 표시되는 화면(710)의 예시이다. 설명의 편의를 위하여, 도 3 내지 도 7에서 설명한 과정에 따라 응답 트리(610)가 생성되어 있음을 전제로 설명한다.
본 발명의 일 실시예에서, 답변 제공 장치(110)와 사용자 단말(200)은 도 8에 도시된 바와 같이 채팅 창의 형색으로 쿼리 및 그에 대한 응답을 송수신할 수 있다. 가령 사용자는 사용자 단말(200) 상에 "이순신 장군의 전투가 언제인가요?"와 같이 메시지의 형태로 쿼리를 발송할 수 있고, 답변 제공 장치(110)는 "안녕하세요. 홍길동님, 이순신 장군의 어떤 전투가 궁금하세요?"와 같이 메시지의 형태로 쿼리에 대한 질의를 발송할 수 있다. 이때 답변 제공 장치(110)는 질의에 대한 사용자의 입력을 획득하기 위한 인터페이스를 질의 메시지와 함께 제공할 수 있다.
답변 제공 장치(110)가 발송하는 질의는 도 5에서 설명한 과정에 따라 답변 제공 장치(110)가 응답 트리의 루트 노드로부터 쿼리에 대한 응답에 대응되는 리프 노드로 진행하는 과정 중 둘 이상의 노드가 존재하는 레벨을 만났을 때, 둘 이상의 노드 중 어느 하나의 노드를 선택하기 위해 생성된 것 일 수 있다.
또한 질의에 따른 사용자의 입력에 따라 답변 제공 장치(110)는 둘 이상의 노드가 존재하는 레벨 상의 어느 하나의 노드를 선택하고, 해당 노드의 자식 노드를 포함하는 다음 레벨로 이동하여 상술한 과정을 반복하여 수행할 수 있다.
물론 답변 제공 장치(110)는 선택된 노드가 후보 노드들(또는 리프 노드들)중 어느 하나인 경우, 해당 노드에 태그된 텍스트 콘텐츠에서 응답 트리의 생성에 사용되시 않은(또는 못한) 쿼리를 이용하여 사용자의 의도와 가장 부합되는 응답을 검색하여 사용자 단말(200)로 전송할 수 있다.
도 9는 본 발명의 일 실시예에 따른 답변 제공 장치(110)에 의해 수행되는 질의응답 제공 방법을 설명하기 위한 흐름도이다. 이하에서는 도 1 내지 도 8과 중복되는 내용의 설명은 생략하되, 도 1 내지 도 8을 함께 참조하여 설명한다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 원본 트리를 생성할 수 있다.(S910) 가령 본 발명의 일 실시예에 따른 답변 제공 장치(110)는 복수의 외부장치(미도시)로부터 데이터를 수집하고, 수집된 데이터를 소정의 방식에 따라 검색, 분류 및/또는 가공 하여 원본 트리를 생성할 수 있다. 이때 답변 제공 장치(110)는 다양한 공지의 기법을 활용하여 원본 트리를 생성할 수 있다.
예를 들어 답변 제공 장치(110)는 이순신 장군에 대한 검색 결과를 복수의 웹 사이트로부터 크롤링(crawling)하여 데이터를 수집하고, 수집된 데이터를 소정의 방식에 따라 분류 및/또는 가공하여 원본 트리를 생성할 수 있다. 이때 답변 제공 장치(110)는 원본 트리의 레벨의 수, 각 레벨에 포함되는 노드의 수 및 리프 노드에 태깅되는 데이터 들을 적절히 결정할 수 있다. 다만 이는 예시적인것으로 본 발명의 사상이 이에 한정되는 것은 아니다.
선택적 실시예에서, 답변 제공 장치(110)는 사용자의 조작에 기초하여 원본 트리를 생성할 수도 있다.
도 3은 답변 제공 장치(110)가 생성한 예시적인 원본 트리(510)를 도시한 도면이다.
원본 트리(510)는 도 3에 도시된 바와 같이 3개의 레벨(Level 1, Level 2, Level 3)로 구성되고, 각각의 레벨은 하나 이상의 노드들을 포함할 수 있다. 가령 첫 번째 레벨(Level 1)의 경우 루트 노드(N11)를 포함할 수 있고, 두 번째 레벨(Level 2)의 경우 루트 노드(N11)에 대한 세 개의 자식 노드들(N21, N22, N23)을 포함할 수 있다. 물론 세 번째 레벨(Level 3)의 경우 두 번째 레벨(Level 2)의 노드들(N21, N22, N23)에 대한 자식 노드들(N31 내지 N35)을 포함할 수 있다.
한편 세 번째 레벨(Level 3)에 포함되는 노드들(N31 내지 N35)은 원본 트리(510)에 대한 리프 노드들에 해당할 수 있으며, 각각의 노드에는 각 노드와 관련된 질의 및 텍스트 콘텐츠(T1 내지 T3 및 T5 내지 T6)가 태깅되어 있을 수 있다. 물론 두 번째 레벨(Level 2)에 포함되는 노드(N22)도 리프 노드에 해당하며, 관련된 질의 및 텍스트 콘텐츠(T4)가 태깅되어 있을 수 있다.
가령 노드(N31)에 대한 관련된 질의 및 텍스트 콘텐츠(T1)는 이순신 장군의 한산도 대첩에 관한 질의들(Q1, Q2), 텍스트 콘텐츠(P1) 및 기타 태그들(Tag 1, Tag 2)을 포함할 수 있다. 이때 노드(N31)는 이순신 장군의 한산도 대첩에 대한 정보를 포함하는 노드일 수 있다.
도 3에 도시된 트리의 구조 및/또는 내용은 예시적인 것으로 본 발명의 사상이 이에 한정되는 것은 아니다. 따라서 트리는 도 3에 도시된 것 보다 더 많거나 더 적은 레벨로 구성될 수 있고, 리프 노드들이 서로 다른 레벨에 위치할 수도 있다.
이하에서는 설명의 편의를 위하여 원본 트리가 도 3에 도시된 바와 같음을 전제로 설명한다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 원본 트리로부터 응답 트리를 생성할 수 있다.(S920)
이를 위해 본 발명의 일 실시예에 따른 답변 제공 장치(110)는 사용자의 쿼리를 수신할 수 있다. 본 발명에서 사용자의 쿼리는 답변 제공 장치(110)로 전송되는 사용자의 요청을 의미할 수 있다. 가령 사용자의 쿼리는 사용자의 문의사항에 대한 답변을 구하는 요청일 수 있다. 따라서 본 발명의 일 실시예에서 사용자의 쿼리는 사용자의 질의(또는 질의 내용)를 포함할 수 있다.
또한 전술한 바와 같이 본 발명에서 사용자의 쿼리는 하나 이상의 쿼리를 포괄하는 개념일 수 있다. 가령 사용자의 쿼리는 제1 키워드에 기반하는 제1 쿼리와 제2 키워드에 기반하는 제2 쿼리를 포괄하는 개념일 수 있다.
예를 들어 사용자의 쿼리(또는 메인 쿼리)가 '이순신 장군의 전투가 언제야?'인 경우, 쿼리는 '이순신', '장군' '전투'에 기반하여 관련 내용을 요청하는 제1 쿼리(또는 제1 서브 쿼리)와, '언제'에 기반하여 관련 내용을 요청하는 제2 쿼리(또는 제2 서브 쿼리)를 포괄하는 개념일 수 있다. 이때 하나의 서브 쿼리와 관련된 제1 키워드 및 제2 키워드 각각은 단수일 수도 있고 복수일 수도 있다. 다만 이는 예시적인것으로 본 발명의 사상이 이에 한정되는 것은 아니다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 원본 트리(510)에서 수신된 사용자의 쿼리와 관련된 리프 노드들을 후보 노드들로 추출할 수 있다. 이때 '후보 노드들'은 사용자의 쿼리에 대한 응답으로써 제공될 답변을 포함하는 것으로 예상되는 노드들을 의미할 수 있다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 사용자 쿼리의 내용과 원본 트리(510)의 적어도 하나의 리프 노드들(N22 및 N31 내지 N35) 각각에 태깅된 정보들을 이용하여 후보 노드들을 추출할 수 있다.
일 실시예에서 답변 제공 장치(110)는 사용자의 쿼리에 포함된 질의와 리프 노드들(N22 및 N31 내지 N35) 각각에 태깅된 항목들 간의 관련성에 기초하여 후보 노드들을 추출할 수 있다.
이때 답변 제공 장치(110)는 소정의 우선순위에 따라 쿼리에 포함된 질의와 리프 노드들(N22, N31 내지 N35) 각각에 태깅된 항목들 간의 관련성을 판단하여 후보 노드들을 추출할 수 있다.
가령 답변 제공 장치(110)는 리프 노드들(N22, N31 내지 N35)에 태깅된 질의(예를 들어 N31의 Q1, Q2), 텍스트 콘텐츠(P1), 기타 태그(예를 들어 N31의 Tag 1, Tag 2) 순으로 사용자의 쿼리에 포함된 질의와의 관련성을 판단하여 후보 노드들을 추출할 수 있다. 다만 이와 같은 순서는 예시적인것으로 본 발명의 사상이 이에 한정되는 것은 아니다.
예를 들어 사용자의 쿼리에 "이순신 장군의 전투가 전제야?"라는 질의가 포함되어 있는 경우, 답변 제공 장치(110)는 리프 노드들(N22, N31 내지 N35) 중 사용자의 질의에 대응되는 질의를 포함하는 리프 노드들(N31 내지 N33)을 후보 노드들로 추출할 수 있다.
선택적 실시예에서, 본 발명의 일 실시예에 따른 답변 제공 장치(110)는 사용자의 쿼리로부터 파악된 개체명(또는 소정의 키워드)과 리프 노드들에 태깅된 개체명(또는 소정의 키워드)을 비교하는 방식으로 후보 노드들을 추출할 수도 있다. 이를 위해서 리프 노드들(N22, N31 내지 N35)에는 기타 태그로써 개체명이 태깅 되어 있을 수 있다. 다만 이는 예시적인것으로 본 발명의 사상이 이에 한정되는 것은 아니다.
선택적 실시예에서, 답변 제공 장치(110)는 리프 노드들(N22, N31 내지 N35)에 태깅된 질의 및 텍스트 콘텐츠를 이용하여 추출된 후보 노드들의 수가 소정의 제1 임계 수량 미만인 경우에만 개체명(또는 기타 태그)을 이용하여 후보 노드들을 추출할 수 있다. 이때 제1 임계 수량은 시스템의 구성 및/또는 용도에 따라 적절하게 설정될 수 있다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 상술한 과정에 의해 추출횐 후보 노드들의 수량이 제2 임계 수량 미만인 경우, 미리 구축된 사전을 이용하여 수신된 쿼리에 포함되는 요청어와 관련이 있는 변형 요청어를 포함하는 변형 쿼리를 생성하고, 변형 쿼리를 이용하여 후보 노드들을 추출할 수도 있다. 이때 요청어 간에 '관련이 있는'것은 상호간에 동의어이거나 상호간에 소정의 관계에 있는 것으로, 미리 설정된 것을 의미할 수 있다. 또한 제2 임계 수량은 시스템의 구성 및/또는 용도에 따라 적절하게 설정될 수 있다.
본 발명에서 답변 제공 장치(110)는 다양한 방식으로 두 개의 항목의 관련성을 판단할 수 있다. 가령 답변 제공 장치(110)는 사용자의 쿼리에 포함된 질의와 리프 노드들(N22, N31 내지 N35)에 태깅된 질의들 각각의 특징 벡터(Feature Vector) 간의 거리를 산출하는 방식으로 관련성을 판단할 수 있다. 다만 이와 같은 방식은 예시적인것으로 본 발명의 사상이 이에 한정되는 것은 아니다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 상술한 과정에 따라 후보 노드들을 추출함에 있어서, 사용자의 쿼리의 적어도 일부만을 사용할 수 있다.
본 발명의 일 실시예에서, 따른 답변 제공 장치(110)는 사용자의 쿼리를 원본 트리에서 응답을 제공할 수 있는 부분인 제1 쿼리와 원본 트리에서 응답을 제공할 수 없는 부분인 제2 쿼리로 구분할 수 있다.
가령 사용자의 쿼리에 "이순신 장군의 전투가 언제야?"라는 질의가 포함되어 있는 경우, 답변 제공 장치(110)는 쿼리를 원본 트리(510)에서 응답을 제공할 수 있는 부분인 "이순신 장군 전투"와, 응답을 제공할 수 없는 부분인 "언제야"로 구분할 수 있다.
한편 이와 같은 쿼리의 구분(또는 분할)은 사후적으로 이루어 질 수도 있다. 바꾸어 말하면 답변 제공 장치(110)는 상술한 과정에 따라 후보 노드들을 추출한 뒤, 사용자의 쿼리를 후보 노드들의 추출에 사용된 부분과 그렇지 못한 부분으로 구분할 수도 있다.
본 발명의 일 실시예에서, 원본 트리에서 사용자의 쿼리에 대한 응답이 완전하게 제공된 경우, 제2 쿼리는 존재하지 않을 수 있다. 이러한 경우 사용자의 쿼리와 제1 쿼리가 동일할 수 있다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 원본 트리(510)의 루트 노드(N11)로부터 추출된 후보 노드들 각각에 이르는 경로상에 있는 가지 노드들을 포함하는 응답 트리를 생성할 수 있다.
도 4는 도 3의 원본 트리(510)로부터 생성된 응답 트리(610)를 도시한 도면이다.
설명의 편의를 위해 원본 트리(510)가 도 3에 도시된 바와 같으며, 사용자의 쿼리에 "이순신 장군의 전투가 언제야?"라는 질의(620)가 포함되어 있고, 이에 따라 답변 제공 장치(110)가 이순신 장군의 전투와 관련된 정보를 포함하는 리프 노드들(N31 내지 N33)을 후보 노드들로 추출하였음을 가정하여 설명한다.
상술한 가정 하에, 본 발명의 일 실시예에 따른 답변 제공 장치(110)는 원본 트리(510)의 루트 노드(N11)로부터 추출된 리프 노드들(N31 내지 N33)들(또는 후보 노드들) 각각에 이르는 경로상에 있는 가지 노드(N21)를 포함하는 응답 트리(610)를 생성할 수 있다. 이때 응답 트리(610)는 원본 트리(510) 상의 노드들로써 선택된 노드들(N11, N21, N31, N32, N33)을 포함하도록 구성될 수 있다.
이와 같이 본 발명은 사용자의 쿼리와 관련된 내용만을 포함하는 응답 트리를 생성할 수 있다. 생성된 응답 트리는 사용자에게 보다 빠르고 정확한 응답을 제공하기 위해 사용될 수 있으며, 이에 대한 상세한 내용은 후술한다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 응답 트리(610)에 기반한 질의 응답을 통해 응답 트리(610)에 포함된 후보 노드들 중 어느 하나를 쿼리에 대응되는 응답 노드로 결정할 수 있다.(S930)
도 5는 본 발명의 일 실시예에 따른 답변 제공 장치(110)가 응답 트리(610)를 이용하여 응답 노드를 결정하는 과정을 설명하기 위한 도면이다. 도 6은 각 레벨에서의 질의, 응답과, 각 레벨에서 수정된 쿼리를 도시한 도면이다. 이하에서는 도 5 및 도 6을 함께 참조하여 설명한다.
가령 답변 제공 장치(110)는 응답 트리(610)의 Level 1의 루트 노드(N11)로부터 응답 트리(610)의 Level 3의 리프 노드들(N31 내지 N33)(또는 후보 노드들)의 방향(D)으로 진행하면서, 최종적으로 리프 노드들(N31 내지 N33)(또는 후보 노드들) 중 어느 하나를 응답 노드로 결정할 수 있다. 이때 방향(D)은 응답 트리(610)의 낮은 레벨에서 높은 레벨로 이동하는 방향 또는 루트 노드에서 리프 노드로 이동하는 방향을 의미할 수 있다.
보다 구체적으로 답변 제공 장치(110)는 상술한 방향(D)으로의 진행 과정 중 둘 이상의 노드가 존재하는 레벨을 만나는 경우, 둘 이상의 노드 중 어느 하나의 노드를 선택하기 위한 질의를 생성하여 사용자 단말(200)에 제공할 수 있다.
또한 답변 제공 장치(110)는 제공된 질의에 대한 사용자의 답변을 수신하여 둘 이상의 노드 중 어느 하나의 노드를 선택할 수 있다.
가령 답변 제공 장치(110)는 Level 3에서, 세 개의 리프 노드들(N31 내지 N33) 중 어느 하나를 선택하기 위해 "이순신 장군의 어떤 전투가 궁금하세요?"와 같은 질의을 생성하여 사용자 단말(200)에 제공하고, 그에 대한 사용자의 답변을 수신하여 세 개의 리프 노드들(N31 내지 N33) 중 어느 하나를 응답 노드로 선택할 수 있다. 이때 답변 제공 장치(110)는 생성된 질의 함께 후보 답변을 제공할 수도 있다. 가령 답변 제공 장치(110)는 상술한 질문과 함께 "한산도", "명량", "옥포"와 같은 후보 답변을 함께 제공할 수 있다. 다만 이는 예시적인것으로 본 발명의 사상이 이에 한정되는 것은 아니다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 하나의 노드만을 포함하는 레벨인 질의 생략 레벨을 만나는 경우, 둘 이상의 노드 중 어느 하나의 노드를 선택하는 과정을 생략하고 다음 레벨로 이동할 수 있다.
가령 답변 제공 장치(110)가 응답 트리(610)에서 노드(N21)만을 포함하는 질의 생략 레벨(Level 2)을 만나는 경우, 둘 이상의 노드 중 어느 하나의 노드를 선택하는 과정을 생략 다음 레벨(Level 3)로 이동할 수 있다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 응답 트리(610)의 리프 노드들(N31 내지 N33)에 대한 질의를 생성하여 그에 대한 답변을 수신할 때까지 상술한 동작을 반복하여 수행할 수 있다.
바꾸어말하면 답변 제공 장치(110)는 사용자의 답변에 따라 선택된 노드가 리프 노드들(N31 내지 N33) 중 어느 하나인 경우, 선택된 노드를 사용자의 쿼리에 대한 응답 노드로써 결정할 수 있다.
한편 본 발명의 일 실시예에 따른 답변 제공 장치(110)는 상술한 질의 응답 과정을 통해 선택된 노드들에 대응되는 쿼리를 부가한 최종 쿼리를 생성할 수 있다. 가령 답변 제공 장치(110)가 Level 3에서 세 개의 리프 노드들(N31 내지 N33) 중 어느 하나를 선택하기 위해 "이순신 장군의 어떤 전투가 궁금하세요?"와 같은 질의을 생성하여 사용자 단말(200)에 제공하였고, "한산도"라는 답변을 사용자 단말(200)로부터 수신하였음을 가정해 보자. 이러한 경우 답변 제공 장치(110)는 "이순신 장군의 전투가 언제야?"라는 쿼리에 "한산도"를 추가하여 "이순신 장군의 한산도 전투가 언제야?"를 최종 쿼리로 생성할 수 있다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 상술한 과정에 따라 결정된 응답 노드에 태깅 된 텍스트 콘텐츠에서, 쿼리에 대한 응답을 검색할 수 있다.(S940) 이때 답변 제공 장치(110)는 쿼리 중 원본 트리에서 응답을 제공하지 못한 부분을 이용하여 응답을 검색할 수 있다.
도 7은 답변 제공 장치(110)가 텍스트 콘텐츠(P1)에서 쿼리에 대한 응답을 검색하는 과정을 설명하기 위한 도면이다.
전술한 바와 같이 본 발명의 일 실시예에 따른 답변 제공 장치(110)는 사용자의 쿼리를 원본 트리에서 응답을 제공한 부분인 제1 쿼리와 원본 트리에서 응답을 제공하지 못한 부분인 제2 쿼리로 구분할 수 있다.
가령 사용자의 쿼리에 "이순신 장군의 전투가 언제야?"라는 질의가 포함되어 있는 경우, 답변 제공 장치(110)는 쿼리를 원본 트리(510)에서 응답을 제공한 부분인 "이순신 장군 전투"와, 응답을 제공하지 못한 부분인 "언제야"로 구분할 수 있다. 이때 원본 트리(510)에서 응답을 제공한 부분인 "이순신 장군 전투"는 상술한 과정에 따라 응답 트리(610)를 생성하는데 사용된 부분일 수 있다.
본 발명의 일 실시예에 따른 답변 제공 장치(110)는 상술한 과정에 따라 결정된 응답 노드(N31)에 태깅 된 텍스트 콘텐츠(P1)에서 제2 쿼리에 대한 응답을 검색할 수 있다. 이때 답변 제공 장치는 상술한 과정에 따라 생성된 최종 쿼리를 고려하여 응답을 검색할 수 있다.
가령 본 발명의 일 실시예에 따른 답변 제공 장치(110)는 이순신 장군의 한산도 대첩에 대한 전반적 내용을 포함하는 텍스트 콘텐츠(P1)에서 제2 쿼리인 "언제야"에 대한 응답인 "1592년 선조(25) 8월 14일(음력 7월 8일)"을 검색할 수 있다.
본 발명의 일 실시예에서, 답변 제공 장치(110)는 텍스트 콘텐츠(P1)의 적어도 일 부분(T1_Ans)을 쿼리에 대한 응답으로 결정할 수 있다. 가령 답변 제공 장치(110)는 텍스트 콘텐츠(P1)내의 일부 구간을 응답으로 결정할 수 있다. 이때 답변 제공 장치(110)는 응답을 텍스트 콘텐츠(P1) 내의 구간을 설정하는 위치값의 형태로 결정할 수 있다.
종래기술의 경우, 원본 트리에 의해서 사용자의 의도에 정확하게 부합되는 답변이 제공되지 못하는 경우, 사용자가 제공된 답변에서 자신의 의도에 부합하는 정답을 다시 추론해야 하는 과정이 필요하였다. 예를 들어 종래기술에 따르면 "이순신 장군의 전투가 언제야?"라는 질의에 따라 이순신 장군의 한산도 대첩에 대한 일반적인 내용을 포함하는 답변(예를 들어 도 7의 P1)이 제공되었고, 사용자는 '언제야'에 부합되는 답을 제공된 답변 내에서 찾아야 했다.
그러나 본 발명에 따르면 원본 트리에 의해서 사용자의 의도에 정확하게 부합되는 답변이 제공되지 못하는 경우에도, 원본 트리에 부가된 텍스트 콘텐츠로부터 사용자의 의도에 부합하는 답변을 검색하여 제공함으로써 보다 정확한 답변이 가능하다.
이에 더하여 본 발명은 사용자의 쿼리에 따라 특정된 정보를 이용하여 모든 내용을 포함하는 원본 트리로부터 사용자의 쿼리에 관련된 내용만을 포함하는 응답 트리를 생성하고, 생성된 응답 트리를 이용하여 사용자의 쿼리에 대한 응답을 검색하되, 생략 가능한 레벨에 대한 질의는 생략하여 응답 검색의 절차를 간소화할 수 있다.
종래기술에 따를 경우 사용자는 도 3에 도시된 원본 트리(510)로부터 자신이 원하는 정보를 획득하기 위해, 총 2회의 선택 과정을 거쳐야 했다. 즉 사용자는 자신의 쿼리가 Level 2에 속하는 노드 중 어느 노드에 관한 것인지 선택하는 첫 번째 선택 과정과, Level 3에 속하는 노드 중 어느 노드에 관한 것인지 선택하는 두 번째 선택 과정을 거쳐야 최종적으로 자신의 요청사항에 대한 응답을 얻을 수 있었다.
그러나 본 발명은 사용자의 쿼리에 따라 도 5에 도시된 응답 트리(610)를 생성하고 이를 이용하여 응답을 제공하되, 사용자의 선택이 필요 없는 레벨(Level 2)에 대한 선택 과정을 생략함으로써 응답 검색의 절차를 간소화할 수 있다.
도 3 내지 도 5에 도시된 예시에서는 종래기술과 본 발명에 따른 선택 과정에 1회 밖에 차이가 나지 않지만, 이는 예시적인 트리 구조에 기인한 것으로 원본 트리가 보다 많은 레벨을 포함하는 경우 선택 과정의 수량 차이는 보다 증가될 수 있다. 가령 응답 트리가 N(N은 자연수)개의 레벨로 구성되고, M개(M은 N 미만의 자연수)의 질의응답 생략 레벨을 포함하는 경우, 답변 제공 장치(110)는 N-M 개의 레벨 각각에 대한 질의를 생성하고, 그에 대한 답변에 따라 각각의 레벨 상의 둘 이상의 노드 중 어느 하나의 노드를 선택할 수 있다. 이에 따라 M개의 선택 과정이 생략될 수 있다.
한편 본 발명의 일 실시예에 따른 답변 제공 장치(110)는 제2 쿼리가 존재하지 않는 경우, 상술한 검색 과정을 생략할 수 있다. 가령 사용자의 쿼리가 "이순신 장군의 한산도 대첩에 대해서 알려줘"이고, 이와 같은 쿼리가 모두 제1 쿼리에 속하는 경우 제2 쿼리를 이용한 검색 과정은 생략될 수 있다.
이상 설명된 본 발명에 따른 실시예는 컴퓨터 상에서 다양한 구성요소를 통하여 실행될 수 있는 컴퓨터 프로그램의 형태로 구현될 수 있으며, 이와 같은 컴퓨터 프로그램은 컴퓨터로 판독 가능한 매체에 기록될 수 있다. 이때, 매체는 컴퓨터로 실행 가능한 프로그램을 저장하는 것일 수 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다.
한편, 상기 컴퓨터 프로그램은 본 발명을 위하여 특별히 설계되고 구성된 것이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수 있다. 컴퓨터 프로그램의 예에는, 컴파일러에 의하여 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용하여 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함될 수 있다.
본 발명에서 설명하는 특정 실행들은 일 실시 예들로서, 어떠한 방법으로도 본 발명의 범위를 한정하는 것은 아니다. 명세서의 간결함을 위하여, 종래 전자적인 구성들, 제어 시스템들, 소프트웨어, 상기 시스템들의 다른 기능적인 측면들의 기재는 생략될 수 있다. 또한, 도면에 도시된 구성 요소들 간의 선들의 연결 또는 연결 부재들은 기능적인 연결 및/또는 물리적 또는 회로적 연결들을 예시적으로 나타낸 것으로서, 실제 장치에서는 대체 가능하거나 추가의 다양한 기능적인 연결, 물리적인 연결, 또는 회로 연결들로서 나타내어질 수 있다. 또한, "필수적인", "중요하게" 등과 같이 구체적인 언급이 없다면 본 발명의 적용을 위하여 반드시 필요한 구성 요소가 아닐 수 있다.
따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 또는 이로부터 등가적으로 변경된 모든 범위는 본 발명의 사상의 범주에 속한다고 할 것이다.
100: 서버
110: 답변 제공 장치
111: 통신부
112: 제어부
113: 메모리
200: 사용자 단말
300: 통신망

Claims (9)

  1. 리프 노드에 태깅 된 텍스트 콘텐츠에 대한 검색으로 질의에 대한 답변을 제공하는 답변 제공 장치에 있어서, 상기 장치는,
    쿼리와의 관련성에 기초하여 원본 트리로부터 추출된 리프 노드인 후보 노드들을 포함하는 응답 트리를 생성하고, 상기 원본 트리는 상기 답변 제공 장치에서 제공 가능한 모든 리프 노드들을 포함하는 트리이고, 상기 응답 트리는 상기 쿼리와 관련된 응답을 포함하는 리프 노드만을 포함하는 트리이고,
    상기 응답 트리에 기반한 질의 응답을 통해 상기 응답 트리에 포함된 후보 노드들 중 어느 하나를 상기 쿼리에 대응되는 응답 노드로 결정하고,
    상기 응답 노드에 태깅 된 텍스트 콘텐츠에서 상기 쿼리에 대한 응답을 검색하되, 상기 쿼리 중 상기 응답 노드의 결정에 미사용 된 부분을 이용하여 상기 응답을 검색하는, 답변 제공 장치.
  2. 청구항 1에 있어서
    상기 쿼리는
    제1 키워드에 기반하는 제1 쿼리 및 제2 키워드에 기반하는 제2 쿼리를 포함하고,
    상기 장치는
    상기 제1 쿼리와의 관련성에 기초하여 상기 응답 트리를 생성하고, 상기 응답 트리에 포함된 후보 노드들 중 어느 하나를 상기 제1 쿼리에 대응되는 응답 노드로 결정하고,
    상기 응답 노드에 태깅 된 텍스트 콘텐츠에서 상기 제2 쿼리에 대한 응답을 검색하는, 답변 제공 장치.
  3. 청구항 2에 있어서
    상기 제1 키워드는 상기 제2 키워드의 상위 카테고리이고,
    상기 제1 키워드는 하나 이상인, 답변 제공 장치.
  4. 청구항 1에 있어서
    상기 장치는
    상기 텍스트 콘텐츠의 적어도 일부분을 상기 쿼리에 대한 응답으로 결정하는, 답변 제공 장치.
  5. 청구항 1에 있어서
    상기 장치는
    상기 원본 트리에서 상기 쿼리와 관련된 리프 노드들을 상기 후보 노드들로 추출하고,
    상기 원본 트리의 루트 노드로부터 상기 후보 노드들 각각에 이르는 경로상에 있는 가지 노드들을 포함하는 상기 응답 트리를 생성하고,
    상기 응답 트리의 루트 노드로부터 상기 쿼리에 대한 응답에 대응되는 리프 노드로 진행하는 과정 중 둘 이상의 노드가 존재하는 레벨을 만나는 경우, 상기 둘 이상의 노드 중 어느 하나의 노드를 선택하기 위한 질의를 생성하고, 상기 질의에 대한 답변에 따라 상기 둘 이상의 노드 중 어느 하나의 노드를 선택하고,
    상기 선택된 노드가 상기 후보 노드들 중 어느 하나인 경우, 상기 선택된 노드를 상기 응답 노드로 결정하는, 답변 제공 장치.
  6. 청구항 5에 있어서
    상기 응답 트리는
    하나의 노드만 포함하는 레벨인 질의 생략 레벨을 적어도 하나 이상 포함하고,
    상기 장치는
    상기 과정 중 상기 질의 생략 레벨을 만나는 경우, 상기 둘 이상의 노드 중 어느 하나의 노드를 선택하는 과정을 생략하고, 다음 레벨로 이동하는, 답변 제공 장치.
  7. 청구항 1에 있어서
    상기 원본 트리의 적어도 하나의 리프 노드들 각각에는
    각각의 리프 노드와 관련된 질의, 각각의 리프 노드와 관련된 텍스트 콘텐츠가 태깅(Tagging)되어 있고,
    상기 장치는
    상기 쿼리와 상기 적어도 하나의 리프 노드들 각각에 태깅된 관련된 질의 및 텍스트 콘텐츠 중 적어도 하나를 이용하여 상기 후보 노드들을 추출하는, 답변 제공 장치.
  8. 청구항 7에 있어서
    상기 쿼리는 사용자가 답변을 얻고자 하는 내용에 대한 사용자 질의를 포함하고,
    상기 장치는
    소정의 우선순위에 따라 상기 사용자 질의와 상기 적어도 하나의 리프 노드들 각각에 태깅 된 항목들을 비교하여 상기 후보 노드들을 추출하는, 답변 제공 장치.
  9. 청구항 1에 있어서
    상기 장치는
    상기 쿼리에 상기 응답 트리에 기반한 질의 응답을 통해 선택된 노드들에 대응되는 쿼리가 부가된 최종 쿼리를 생성하고,
    상기 텍스트 콘텐츠에서 상기 생성된 최종 쿼리에 대응되는 응답을 검색하는, 답변 제공 장치.
KR1020200155719A 2020-11-19 2020-11-19 답변 제공 장치 KR102471063B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200155719A KR102471063B1 (ko) 2020-11-19 2020-11-19 답변 제공 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200155719A KR102471063B1 (ko) 2020-11-19 2020-11-19 답변 제공 장치

Publications (2)

Publication Number Publication Date
KR20220068688A KR20220068688A (ko) 2022-05-26
KR102471063B1 true KR102471063B1 (ko) 2022-11-25

Family

ID=81809949

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200155719A KR102471063B1 (ko) 2020-11-19 2020-11-19 답변 제공 장치

Country Status (1)

Country Link
KR (1) KR102471063B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160292300A1 (en) 2015-03-30 2016-10-06 Alcatel Lucent Usa Inc. System and method for fast network queries
US20190347297A1 (en) 2018-05-09 2019-11-14 Oracle International Corporation Constructing imaginary discourse trees to improve answering convergent questions

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101097660B1 (ko) * 2009-12-21 2011-12-22 고려대학교 산학협력단 무선 방송 스트림에서 xml 질의 처리 방법
KR101958729B1 (ko) * 2017-04-06 2019-03-18 네이버 주식회사 주제별 질의의 서브토픽 자동 추출 및 구조화

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160292300A1 (en) 2015-03-30 2016-10-06 Alcatel Lucent Usa Inc. System and method for fast network queries
US20190347297A1 (en) 2018-05-09 2019-11-14 Oracle International Corporation Constructing imaginary discourse trees to improve answering convergent questions

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
김자랑, 김경수, 최용석, TPE를 이용한 Triplet 추출 기반 질의응답 시스템, 정보과학회논문지 : 컴퓨팅의 실제 및 레터 19(12), 2013.12, 698-702페이지. 1부.*

Also Published As

Publication number Publication date
KR20220068688A (ko) 2022-05-26

Similar Documents

Publication Publication Date Title
US10642938B2 (en) Artificial intelligence based method and apparatus for constructing comment graph
CN107256267B (zh) 查询方法和装置
KR101721338B1 (ko) 검색 엔진 및 그의 구현 방법
JP5727512B2 (ja) 検索提案のクラスタ化及び提示
US9218414B2 (en) System, method, and user interface for a search engine based on multi-document summarization
US10157201B2 (en) Method and system for searching for and providing information about natural language query having simple or complex sentence structure
CN102770859B (zh) 跨语言搜索选项
WO2015172490A1 (zh) 一种提供扩展搜索项的方法与装置
JP2019507417A (ja) 多変数検索のためのユーザインターフェース
CN109165302A (zh) 多媒体文件推荐方法及装置
JP2004133947A (ja) 反復マッチングを利用した画像検索方法及び装置
US20130268554A1 (en) Structured document management apparatus and structured document search method
CN110717038B (zh) 对象分类方法及装置
KR20220006491A (ko) 댓글 자막을 생성하는 방법, 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램
CN108763244A (zh) 在图像内搜索和注释
WO2018227930A1 (zh) 智能提示答案的方法及装置
WO2017092493A1 (zh) 场景音乐搜索方法及场景音乐搜索装置
CN109952571A (zh) 基于上下文的图像搜索结果
JP2020129377A (ja) コンテンツ検索方法、装置、機器、および記憶媒体
CN110209780B (zh) 一种问题模板生成方法、装置、服务器及存储介质
US20170124090A1 (en) Method of discovering and exploring feature knowledge
KR102471063B1 (ko) 답변 제공 장치
US10838880B2 (en) Information processing apparatus, information processing method, and recording medium that provide information for promoting discussion
KR102310963B1 (ko) 답변 제공 장치
KR20070052027A (ko) 입력한 단어의 우선 순위 설정에 따른 키워드 검색 장치,방법 및 이를 구현할 수 있는 프로그램이 수록된 컴퓨터로읽을 수 있는 기록매체

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant