KR20210051519A - 다국어 질의 응답 시스템 - Google Patents

다국어 질의 응답 시스템 Download PDF

Info

Publication number
KR20210051519A
KR20210051519A KR1020190136902A KR20190136902A KR20210051519A KR 20210051519 A KR20210051519 A KR 20210051519A KR 1020190136902 A KR1020190136902 A KR 1020190136902A KR 20190136902 A KR20190136902 A KR 20190136902A KR 20210051519 A KR20210051519 A KR 20210051519A
Authority
KR
South Korea
Prior art keywords
query
server
language
response
answer
Prior art date
Application number
KR1020190136902A
Other languages
English (en)
Other versions
KR102256664B1 (ko
Inventor
홍동균
정용일
Original Assignee
주식회사 솔트룩스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 솔트룩스 filed Critical 주식회사 솔트룩스
Priority to KR1020190136902A priority Critical patent/KR102256664B1/ko
Publication of KR20210051519A publication Critical patent/KR20210051519A/ko
Application granted granted Critical
Publication of KR102256664B1 publication Critical patent/KR102256664B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

다국어 질의 응답 시스템을 제공한다. 본 발명에 따른 다국어 질의 응답 시스템은, 네트워크를 통하여 사용자로부터 질의를 수신하고 질의에 대한 응답을 사용자에게 송신하는 유저 인터페이스, 질의에 대한 언어를 판별하고 질의에 대한 언어 번역 여부 판단 및 질의 응답을 수행할 서버를 선택하는 질의 응답 브로커 서버, 및 질의 응답 브로커 서버와 연결되며 질의에 대한 응답을 생성하는 적어도 하나의 내부 질의 응답 서버를 포함하며, 질의 응답 브로커 서버는 네트워크를 통하여 내부 질의 응답 서버와 다른 언어에 대한 질의 응답을 수행하는 적어도 하나의 외부 질의 응답 서버와 접속한다.

Description

다국어 질의 응답 시스템{Multi-lingual support question-answering system}
본 발명은 질의 응답 시스템에 관한 것으로, 자세하게는 다국어를 지원하는 질의 응답 시스템에 관한 것이다.
본 발명은 과학기술정보통신부 정보통신.방송 기술개발사업의 일환으로 전자부품연구원에서 주관하고, (주)솔트룩스에서 수행된 연구로부터 도출된 것이다. [연구기간: 2018.01.01.~2018.12.31., 연구관리 전문기관: 정보통신기술진흥센터, 연구과제명: 자율지능 디지털 동반자 프레임워크 및 응용 연구개발, 과제 고유번호: 2017-0-00255]
질의 응답 시스템은 사용자의 질의에 대한 응답을 하기 위한 시스템으로, 사용자의 질의를 분석하여, 이에 대한 응답을 사용자에게 제공할 수 있다. 사용자의 질의에 대한 응답을 하기 위하여 질의 응답(Question-Answering, 이하 QA) 시스템이 개발되고 있으나, 개별 언어 별로 질의 응답을 수행하거나, 한정된 언어에 대하여 질의 응답을 하는데에 그치고 있다.
따라서 해당 질의 응답 시스템이 지원하지 않는 언어로 된 질의에 대하여 응답을 하지 못하거나, 올바른 응답을 하지 못하는 문제점이 있다.
본 발명의 기술적 과제는, 다국어의 사용자의 질의가 입력되어도, 해당 언어에 맞게 응답을 할 수 있는 다국어 질의 응답 시스템을 제공하는 것이다.
상기 기술적 과제를 달성하기 위한 본 발명의 기술적 사상의 일측면에 따른 다국어 질의 응답 시스템은, 네트워크를 통하여 사용자로부터 질의를 수신하고, 상기 질의에 대한 응답을 상기 사용자에게 송신하는 유저 인터페이스; 상기 질의에 대한 언어를 판별하고, 상기 질의에 대한 언어 번역 여부 판단 및 질의 응답을 수행할 서버를 선택하는 질의 응답 브로커 서버; 및 상기 질의 응답 브로커 서버와 연결되며 상기 질의에 대한 응답을 생성하는 적어도 하나의 내부 질의 응답 서버;를 포함하며, 상기 질의 응답 브로커 서버는, 상기 네트워크를 통하여 상기 내부 질의 응답 서버와 다른 언어에 대한 질의 응답을 수행하는 적어도 하나의 외부 질의 응답 서버와 접속한다.
상기 질의 응답 브로커 서버는, 상기 질의의 언어를 판별하는 언어 판별부; 상기 질의에 대한 언어 번역을 수행하고, 상기 답변을 상기 질의에 대한 언어로 번역하는 언어 번역부; 상기 언어 판별부에서 판별된 상기 질의의 언어를 참조하여, 상기 언어 번역부에서 상기 질의에 대한 언어 번역 여부를 판단 및 상기 적어도 하나의 내부 질의 응답 서버 및 상기 적어도 하나의 외부 질의 응답 서버 중 상기 질의에 대한 질의 응답을 수행할 질의 응답 서버를 선택하는 서버 관리부; 및 상기 적어도 하나의 내부 질의 응답 서버 및 상기 적어도 하나의 외부 질의 응답 서버 중 상기 서버 관리부에서 선택한 질의 응답 서버와 통신하여 질의 응답을 수행하도록 하는 서버 통신부;를 포함할 수 있다.
상기 언어 번역부는, 상기 네트워크를 통하여 외부 언어 번역 서버와 연결되어, 외부 언어 번역 서버를 통하여 상기 질의에 대한 언어 번역을 수행하도록 할 수 있다.
상기 적어도 하나의 내부 질의 응답 서버 및 상기 적어도 하나의 외부 질의 응답 서버 각각과 연결되는 지식 베이스에 대한 색인 정보를 가지는 데이터 서버;를 더 포함할 수 있다.
상기 서버 관리부는, 상기 적어도 하나의 내부 질의 응답 서버에, 상기 언어 판별부에서 판별한 상기 질의의 언어에 대응하는 상기 내부 질의 응답 서버가 있는 경우, 상기 질의의 언어에 대응하는 상기 내부 질의 응답 서버에서 상기 질의에 대한 질의 응답을 수행하도록 할 수 있다.
상기 서버 관리부는, 상기 적어도 하나의 내부 질의 응답 서버가 상기 언어 판별부에서 판별한 상기 질의의 언어에 대응하지 않는 경우, 상기 질의에 대한 언어 번역 여부를 판단할 수 있다.
상기 서버 관리부는 상기 적어도 하나의 내부 질의 응답 서버가 상기 언어 판별부에서 판별한 상기 질의의 언어에 대응하지 않는 경우, 상기 언어 번역부에서 상기 질의에 대한 번역을 수행하여, 번역된 상기 질의의 언어에 대응하는 상기 적어도 하나의 내부 질의 응답 서버 및 상기 적어도 하나의 외부 질의 응답 서버 중 어느를 통하여 상기 질의에 대한 질의 응답을 수행하도록 하거나, 상기 질의에 대한 번역을 수행하지 않고 상기 외부 질의 응답 서버를 통하여 상기 질의에 대한 질의 응답을 수행하도록 할 수 있다.
상기 서버 관리부는, 상기 언어 번역부를 통한 언어간 번역 정확도, 상기 지식 색인이 가지고 있는 지식 베이스별 지식 구축량, 및 상기 질의를 이루는 개체별 관계 트리플 개수를 종합하여, 상기 질의에 대한 언어 번역 여부 판단 및 질의 응답을 수행할 서버를 선택할 수 있다. ,
상기 데이터 서버는, 상기 적어도 하나의 내부 질의 응답 서버에서 질의 응답을 수행할 수 있는 언어에 대한 지식이 축적된 지식 베이스를 더 포함할 수 있다.
상기 지식 베이스는, 상기 적어도 하나의 내부 질의 응답 서버 및 상기 적어도 하나의 외부 질의 응답 서버 각각에서 질의 응답을 수행할 수 있는 언어에 대한 지식들이 축적된 다국어 지식베이스일 수 있다.
본 발명에 따른 다국어 질의 응답 시스템은, 질의 응답 브로커 서버(200)를 통하여, 내부 질의 응답 서버 또는 외부 질의 응답 서버을 선택하여 질의 응답을 수행하도록 하므로, 가변성과 유지보수성 그리고 확장성 관점에서 한계를 가지지 않는다.
또한, 본 발명에 따른 다국어 질의 응답 시스템은, 서버 관리부(230)에서 언어간 번역 정확도, 지식 베이스별 지식 구축량 및 개체별 관계 트리플 개수을 종합하여, 언어 번역 여부 판단, 및 내부 질의 응답 서버 또는 외부 질의 응답 서버를 선택하여 질의 응답을 수행하도록 하므로, 질의에 가장 적합한 질의 응답 서버를 선택하여, 고품질의 다국어 질의 응답을 수행하도록 할 수 있다.
도 1은 본 발명의 예시적 실시 예에 따른 다국어 질의 응답 시스템을 나타내는 블록도이다.
도 2는 본 발명의 예시적 실시 예에 따른 다국어 질의 응답 시스템을 나타내는 블록도이다.
도 3은 본 발명의 예시적 실시 예에 따른 다국어 질의 응답 시스템을 나타내는 블록도이다.
도 4는 본 발명의 예시적 실시 예에 따른 다국어 질의 응답 시스템의 자연어 이해부의 주요 구성을 나타내는 블록도이다.
도 5는 본 발명의 예시적 실시 예에 따른 다국어 질의 응답 시스템을 나타내는 블록도이다.
도 6은 본 발명의 예시적 실시 예에 따른 다국어 질의 응답 시스템의 동작을 설명하기 위한 흐름도이다.
도 7은 본 발명의 예시적 실시 예에 따른 다국어 질의 응답 시스템의 언어 판별부의 동작을 설명하기 위한 흐름도이다.
이하, 첨부한 도면을 참조하여 본 발명의 실시 예에 대해 상세히 설명한다. 본 발명의 실시 예는 당 업계에서 평균적인 지식을 가진 자에게 본 발명을 보다 완전하게 설명하기 위하여 제공되는 것이다. 본 발명은 다양한 변경을 가할 수 있고 여러 가지 형태를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 개시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용한다. 첨부된 도면에 있어서, 구조물들의 치수는 본 발명의 명확성을 기하기 위하여 실제보다 확대하거나 축소하여 도시한 것이다.
본 명세서에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수개의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하 도면 및 설명에서, 하나의 블록, 예를 들면, '~부' 또는 '~모듈'로 표시 또는 설명되는 구성요소는 하드웨어 블록 또는 소프트웨어 블록일 수 있다. 예를 들면, 구성요소들 각각은 서로 신호를 주고 받는 독립적인 하드웨어 블록일 수도 있고, 또는 하나의 프로세서에서 실행되는 소프트웨어 블록일 수도 있다.
본 발명의 구성 및 효과를 충분히 이해하기 위하여, 첨부한 도면을 참조하여 본 발명의 바람직한 실시 예들을 설명한다.
도 1은 본 발명의 예시적 실시 예에 따른 다국어 질의 응답 시스템을 나타내는 블록도이다.
도 1을 참조하면, 다국어 질의 응답 시스템(1, 이하 질의 응답 시스템)은 네트워크(20)를 통하여 사용자(10)로부터 질의를 수신하고, 응답을 송신하는 유저 인터페이스(UI, 100)를 포함한다. 네트워크(20)는 유선 인터넷 서비스, 근거리 통신망(LAN), 광대역 통신망(WAN), 인트라넷, 무선 인터넷 서비스, 이동 컴퓨팅 서비스, 무선 데이터 통신 서비스, 무선 인터넷 접속 서비스, 위성 통신 서비스, 무선 랜, 블루투스 등 유/무선을 통하여 데이터를 주고 받을 수 있는 것을 모두 포함할 수 있다. 네트워크(20)가 스마트폰 또는 태블릿 등과 연결되는 경우, 네트워크(20)는 3G, 4G, 5G 등의 무선 데이터 통신 서비스, 와이파이(Wi-Fi) 등의 무선 랜, 블루투스 등일 수 있다.
유저 인터페이스(100)는 사용자(10)가 사용하는 단말기 등을 통하여 질의 응답 시스템(1)에 엑세스하기 위한 인터페이스를 제공할 수 있다. 사용자(10)는 유저 인터페이스(100)를 통하여 질의 응답 시스템(1)에 질의를 전송할 수 있고, 유저 인터페이스(100)를 통하여 질의 응답 시스템(1)이 제공하는 질의에 대한 응답을 수신할 수 있다.
질의 응답 시스템(1)은 유저 인터페이스(100)와 연결되어 사용자(10)로부터 질의를 전달받아, 사용자(10)의 질의에 대한 응답을 제공할 질의 응답 서버를 선택하는 질의 응답 브로커 서버(200)를 포함할 수 있다. 질의 응답 브로커 서버(200)는 사용자(10)의 질의에 대한 언어를 판별할 수 있고, 필요에 따라서 사용자(10)의 질의에 대한 언어 번역을 수행할 수 있다. 질의 응답 브로커 서버(200)는 사용자(10)의 질의에 대한 언어 판별 및/또는 언어 번역을 수행한 후, 내부 질의 응답 서버(300) 또는 네트워크(20)를 통하여 외부 질의 응답 서버(30)를 선택하여, 질의 응답을 수행하도록 할 수 있다.
질의 응답 시스템(1)은 적어도 하나의 내부 질의 응답 서버(300)를 포함할 수 있고, 네트워크(20)를 통하여 적어도 하나의 외부 질의 응답 서버(30)에 접속할 수 있다. 질의 응답 브로커 서버(200)는 사용자(10)의 질의에 대한 언어를 판별하여, 내부 질의 응답 서버(300)를 선택하거나 또는 네트워크(20)를 통하여 외부 질의 응답 서버(30)에 접속하여 사용자(10)의 질의에 대한 질의 응답을 수행하여, 사용자(10)의 질의에 대한 응답을 구할 수 있다.
구체적으로, 질의 응답 시스템(1)은 질의 응답 브로커 서버(200)에서 입력된 사용자(10)의 질의의 언어를 판별하는 기능을 통해 해당 언어의 질의 응답 처리를 담당하는 서버, 예를 들면, 내부 질의 응답 서버(300) 또는 외부 질의 응답 서버(30) 중 어느 하나를 선택하여 질의 응답 처리를 요청하고 결과를 받을 수 있다. 또한 질의 응답 브로커 서버(200)는 사용자(10)의 질의가 현재 구현되지 않은 언어인 경우, 언어 번역 기능을 통해서 사용자(10)의 질의를 내부 질의 응답 서버(300) 또는 외부 질의 응답 서버(30)에서 구현된 언어로 번역하여 질의 응답 처리를 수행할 수 있다.
도 1에는 질의 응답 시스템(1)이 1개의 내부 질의 응답 서버(300)를 포함하는 것으로 도시되었으나, 질의 응답 시스템(1)는 각각 하나의 언어에 대한 자연어 이해와 질의 처리를 담당하며, 질의 응답 브로커 서버(200)와 통신할 수 있는 2개 이상의 내부 질의 응답 서버(300)를 포함할 수 있다. 또한, 도 1에는 질의 응답 시스템(1)이 네트워크(20)를 통하여 1개의 외부 질의 응답 서버(300)와 연결되는 것으로 도시되었으나, 질의 응답 시스템(1)는 각각 하나의 언어에 대한 자연어 이해와 질의 처리를 담당하며 질의 응답 브로커 서버(200)와 통신할 수 있는 2개 이상의 외부 질의 응답 서버(30)와 네트워크(20)를 통하여 연결될 수 있다.
따라서, 질의 응답 브로커 서버(200)와 주고 받는 통신 데이터의 규격이 맞는 복수개의 내부 질의 응답 서버(300)를 질의 응답 시스템(1) 내에 구축하거나, 질의 응답 브로커 서버(200)와 주고 받는 통신 데이터의 규격이 맞는 복수개의 외부 질의 응답 서버(30)를 질의 응답 시스템(1)과 연결하면, 어떠한 언어에 대한 질의 응답 서버든 질의 응답 시스템(1)과 통합되어, 다국어를 지원하는 질의 응답 시스템(1)을 구현할 수 있다.
본 발명에 따른 다국어 질의 응답 시스템(1)은 모든 언어를 각각 지원하는 질의 응답 모듈을 모두 포함하는 중앙 집중식의 단일 서버 방식으로 구성되지 않고, 각 언어를 지원하는 질의 응답 서버가 질의 응답 브로커 서버(200)를 통하여 통신되는 분산 구조의 시스템으로 구성될 수 있다. 따라서, 본 발명에 따른 다국어 질의 응답 시스템(1)은 단일 서버 방식과 달리, 가변성과 유지보수성 그리고 확장성 관점에서 한계를 가지지 않는다. 예를 들면, 주로 사용할 것으로 예상되는 언어에 대응되는 질의 응답 모듈은, 각 언어 별로 질의 응답 브로커 서버(200)과 통신되는 별도의 내부 질의 응답 서버(300)로 설계하고, 다른 언어에 대한 질의는 질의 응답 브로커 서버(200)가 네트워크(20)를 통하여 외부 질의 응답 서버(30)와 통신하도록 다국어 질의 응답 시스템(1)을 구성할 수 있다.
또한, 특정 언어에 대한 질의 응답 모듈이 없거나 성능이 낮아서, 내부 질의 응답 서버(300)으로 설계하거나 외부 질의 응답 서버(30)와 통신하도록 하는 것이 어렵거나, 질의 응답의 품질이 낮을 것으로 예상되는 경우, 질의 응답 브로커 서버(200)를 통하여 언어 번역을 수행하여, 상대적으로 높은 질의 응답의 폼질이 예상되는 내부 질의 응답 서버(300) 또는 외부 질의 응답 서버(30)에서 질의 응답을 수행하도록 하여, 다국어 질의 응답 시스템(1)의 성능을 향상시킬 수 있다.
질의 응답 시스템(1)은 데이터 서버(400)를 포함할 수 있다. 일부 실시 예에서, 데이터 서버(400) 중 적어도 일부분은 내부 질의 응답 서버(300) 내에 포함될 수 있다. 다른 일부 실시 예에서, 질의 응답 시스템(1)은 별도의 데이터 서버를 구비하지 않고, 네트워크(20)를 통해서 연결되는 외부 질의 응답 서버(30)가 외부 지식 베이스(40)와 같은 데이터 서버를 포함하거나, 외부 지식 베이스와 같은 데이터 서버와 네트워크(20)를 통해서 접속할 수 있다.
데이터 서버(400)는 지식 색인(410)과 지식 베이스(420)를 포함할 수 있다. 지식 색인(410)은 지식 베이스(420)에 대한 색인 정보를 가질 수 있다. 지식 베이스(420)는 내부 질의 응답 서버(300)와 연결되어, 내부 질의 응답 서버(300)에서 질의응답을 수행하는데 참조될 수 있다. 지식 베이스(420)는 지식, 또는 지식을 구현하기 위하여 필요한 개체들 및 이들 사이의 관계를 가지고 있는 데이터가 축적된 것을 의미한다 여기에서 지식이란, 불특정 다수의 정보를 선택하고 조합하여 주어진 문제의 시간과 공간에 적합한 해결책으로 활용이 가능한 것을 의미한다. 지식 베이스(420)는 도메인 별로 각각 별도로 구축되는 복수개일 수 있다. 도메인이란, 사전에 정의된 데이터의 주제에 관한 분류로 예를 들면, IT, 문화/예술, 경제, 건강/의학, 엔터테인먼트 등으로 나뉠 수 있으며, 일부 실시 예에서 각 도메인에서 하위 도메인으로 다시 나뉘는 계층적(hierarchy) 구조를 지닐 수 있다.
일부 실시 예에서, 지식 베이스(420)는 내부 질의 응답 서버(300)에서 질의 응답을 수행할 수 있는 언어에 대한 지식이 축적될 수 있다. 지식 베이스(420)는 저장할 수 있는 용량만 확보되는 경우, 다국어에 대한 지식들을 축적하기 위하여도 가변성과 유지보수성 그리고 확장성 관점에서 특별한 제약이 없을 수 있다. 따라서 다른 일부 실시 예에서, 지식 베이스(420)는 내부 질의 응답 서버(300) 및 외부 질의 응답 서버(30)에서 질의 응답을 수행할 수 있는 언어에 대한 지식들이 축적된 다국어 지식 베이스일 수 있다.
지식 색인(410)은 질의 응답 시스템(1)이 포함하는 지식 베이스(420)에 대한 색인 정보를 가질 수 있다. 일부 실시 예에서, 지식 색인(410)은 질의 응답 시스템(1)이 포함하는 지식 베이스(420)에 대한 색인 정보, 및 질의 응답 시스템(1)이 질의 응답 브로커 서버(200)를 통하여 통신할 수 있는 외부 질의 응답 서버(30)와 연결되는 외부 지식 베이스(40)에 대한 색인 정보를 모두 가질 수 있다. 지식 색인(410)은 상대적으로 적은 용량을 필요로 하므로, 다양한 언어에 대한 지식 베이스들의 색인 정보를 모두 포함하여도 가변성과 유지보수성 그리고 확장성 관점에서 특별한 제약이 없을 수 있다.
예를 들면, 데이터 서버(400)는 질의 응답 시스템(1)이 포함하는 지식 베이스(420)에 대한 색인 정보, 및 질의 응답 시스템(1)이 질의 응답 브로커 서버(200)를 통하여 통신할 수 있는 외부 질의 응답 서버(30)와 연결되는 외부 지식 베이스(40)에 대한 색인 정보를 모두 가지는 지식 색인(410) 및 내부 질의 응답 서버(300)에서 질의 응답을 수행할 수 있는 언어에 대한 지식이 축적된 지식 베이스(420)를 포함할 수 있다. 따라서 질의 응답 시스템(1)은, 지식 색인(410)을 통하여 질의 응답 브로커 서버(200)가 내부 질의 응답 서버(300)와 외부 질의 응답 서버(30) 중 사용자(10)의 질의에 대한 응답을 구하기에 적합한 언어를 지원하는 질의 응답 서버를 빠르고 정확하게 선택할 수 있고, 지식 베이스(420)가 필요한 하는 저장 용량을 최소화할 수 있어, 질의 응답 성능의 향상과 시스템의 용량의 최적화를 함께 구현할 수 있다.
도 2는 본 발명의 예시적 실시 예에 따른 다국어 질의 응답 시스템을 나타내는 블록도이다. 도 2에 대한 내용 중 도 1과 중복되는 설명은 생략될 수 있다.
도 2를 참조하면, 질의 응답 시스템(1a)은 유저 인터페이스(100), 질의 응답 브로커 서버(200), 적어도 하나의 내부 질의 응답 서버(300), 및 데이터 서버(400)를 포함하며, 네트워크(20)를 통하여 적어도 하나의 외부 질의 응답 서버(30)에 접속할 수 있다.
질의 응답 브로커 서버(200)는 언어 판별부(210), 언어 번역부(220), 서버 관리부(230) 및 서버 통신부(240)를 포함할 수 있다.
언어 판별부(210)는 사용자(10)의 질의에 대한 언어를 판별할 수 있다. 언어 판별부(210)는 사용자(10)의 질의에 대하여, 문장 전체로 언어를 판별할 수 있다. 질의 중 일부, 예를 들면 특정 단어에 다른 언어가 포함된 경우, 필요에 따라서 언어 번역부(220)에 의하여 해당 단어의 번역이 수행될 수 있다.
서버 관리부(230)는 언어 판별부(210)에서 판별된 사용자(10)의 질의에 대한 언어를 기초로, 질의 응답 서버를 선택할 수 있다. 예를 들면, 서버 관리부(230)는 사용자(10)의 질의에 대하여 판별된 언어에 대응되는 내부 질의 응답 서버(300)가 있는 경우, 해당 내부 질의 응답 서버(300)를 선택할 수 있다. 서버 관리부(230)는 사용자(10)의 질의에 대하여 판별된 언어에 대응되는 내부 질의 응답 서버(300)가 없는 경우, 판별된 언어에 대응되는 외부 질의 응답 서버(30)를 선택하거나, 언어 번역부(220)에 의하여 사용자(10)의 질의를 번역한 후, 내부 질의 응답 서버(300) 또는 외부 질의 응답 서버(30) 중 어느 하나를 선택할 수 있다. 서버 관리부(230)는 질의 응답 서버를 선택하기 위하여, 데이터 서버(400)를 참조할 수 있다.
언어 번역부(220)는 서버 관리부(230)의 요청에 따라, 사용자(10)의 질의에 대한 언어 번역을 수행할 수 있다. 또한, 언어 번역부(220)는 내부 질의 응답 서버(300) 또는 외부 질의 응답 서버(30)에서 수신된 응답이 사용자(10)의 질의에 대하여 판별된 언어와 다른 경우, 사용자(10)의 질의에 대하여 판별된 언어로 언어 번역을 수행할 수 있다.
서버 통신부(240)는 서버 관리부(230)의 선택 또는 요청에 따라, 내부 질의 응답 서버(300), 외부 질의 응답 서버(30), 또는 데이터 서버(400)를 선택하여, 정보, 예를 들면, 질의 및 그에 대한 응답, 또는 요청 및 그에 대한 회신을 송신 및 수신할 수 있다.
내부 질의 응답 서버(300)는 질의 응답 관리자(350), 자연어 이해부(360), 질의 처리 모듈(370), 및 자연어 생성부(380)를 포함한다.
질의 응답 관리자(350)는 서버 통신부(240)로부터 사용자(10)의 질의 또는 사용자(10)의 질의의 번역된 결과를 수신하고, 질의에 대한 응답을 서버 통신부(240)로 송신할 수 있다. 질의 응답 관리자(350)는 알림 수신부(310), 모듈 검출부(320) 및 답변 랭킹부(330)를 포함할 수 있다.
알림 수신부(310)는 서버 통신부(240)로부터 사용자(10)의 질의 또는 사용자(10)의 질의의 번역된 결과를 수신하면, 내부 질의 응답 서버(300)를 동작시킬 수 있다. 알림 수신부(310)는 수신한 사용자(10)의 질의 또는 사용자(10)의 질의의 번역된 결과을 자연어 이해부(360) 및 모듈 검출부(320)에 전달할 수 있다.
예를 들면, 자연어 이해부(360)는 자연어 형태의 사용자(10)의 질의 또는 번역 결과에 대하여, 시맨틱 롤 라벨링(Semantic Role Labeling), 형태소 분석, 구문 분석, 개체명 분석, 의도 분류, 및 도메인 분석 등의 복수의 단위 분석 과정을 수행할 수 있다. 상기 복수의 단위 분석 과정 중 일부는 병렬적으로 수행될 수 있다. 상기 복수의 단위 분석 과정 중 일부는 순차적으로 수행될 수 있다.
일부 실시 예에서, 자연어 이해부(360)는 사용자(10)의 질의 또는 번역 결과에 대한 자연어 분석 결과를 테이블(table) 구조 또는 트리(tree) 구조를 가지는 정형 데이터로 생성하여 모듈 검출부(320) 및 질의 처리 모듈(370)에 제공할 수 있다. 자연어 이해부(360)에서 제공하는 정형 데이터는 예를 들면, RDB(Relation DateBase), CSV(Comma-Seperated Variables), XML(eXtensible Markup Language), JSON(JavaScript Object Notation) 등일 수 있다.
알림 수신부(210)는, 자연어 이해부(360)에서 수행된 자연어 분석 결과를 모듈 검출부(320)로 전달할 수 있다. 모듈 검출부(320)는 알림 수신부(310)로부터 전달받은 자연어 이해부(360)에서 수행된 자연어 분석 결과를 토대로, 질의 처리 모듈(370)에 전달하여, 해당 단위 자연어 분석 결과 각각에 대응되는 적합한 적어도 하나의 모듈에서 질의에 대한 답변을 생성할 수 있다. 질의 처리 모듈(370)은 지식 베이스(420) 또는 지식 색인(410)을 참조하여, 질의에 대한 답변을 생성할 수 있다.
질의 처리 모듈(370)은 사용자(10)의 질의로부터 분석되어 분류된 질의 패턴에 대응되는 다양한 패턴별 질의 처리 모듈을 가질 수 있다. 예를 들면, 상기 패턴별 질의 처리 모듈은, 예를 들면, FBQA(Factoid Based Question Answering) 모듈, TBQA(Template Based Question Answering) 모듈, IRQA(Informationu Retrievalu Based Question Answering) 모듈, CPQA(ComParison of Question Answering, 비교형 질의 응답) 모듈, YNQA(Yes-No Question Answering, 판정형 질의 응답) 모듈 등 일 수 있으나, 이에 한정되지 않는다. 일부 실시 예에서, 상기 패턴별 질의 처리 모듈은, GBQA(Generated Based Question Answering) 모듈, KBQA(KnowledgeBase based Question and Answering, 지식 베이스 기반 질의 응답) 모듈일 수도 있다. 예를 들면, FBQA 모듈은 지식 베이스(420)를 참조하여 답변을 생성할 수 있고, IRQA 모듈은 지식 색인(410)을 참조하여 답변을 생성할 수 있다.
질의 처리 모듈(370)에서 얻어진 질의에 대한 처리 결과, 즉 답변은 자연어 생성부(380)에서 자연어로 생성되며, 답변 랭킹부(330)에서 응답이 결정될 수 있다. 예를 들면, 질의 처리 모듈(370)에서 얻어진 답변은 복수개일 수 있으며, 답변 랭킹부(330)에서는 복수개의 답변에 대한 랭킹을 정한 후, 랭킹이 높은 답변을 응답으로 선정하여 사용자(10)에게 제공할 수 있다.
답변 랭킹부(330)에서 선정된 사용자(10)의 질의에 대한 응답은, 서버 통신부(240)를 통하여 질의 응답 브로커 서버(200)로 전달되며, 유저 인터페이스(100)에서 네트워크(20)를 통하여 사용자(10)에게 제공할 수 있다.
외부 질의 응답 서버(30)는 내부 질의 응답 서버(300)와 유사한 구성을 가질 수 있으므로, 자세한 설명은 생략하도록 한다.
따라서, 질의 응답 브로커 서버(200)가 질의 응답을 처리하지 않고, 내부 질의 응답 서버(300) 또는 외부 질의 응답 서버(30)에서 질의 응답을 처리하나, 사용자(10)의 관점에서는, 마치 질의 응답 브로커 서버(200)가 질의 응답을 처리하는 브로커의 기능을 수행한다.
도 3은 본 발명의 예시적 실시 예에 따른 다국어 질의 응답 시스템을 나타내는 블록도이다. 도 3에 대한 내용 중 도 1 및 도 2와 중복되는 설명은 생략될 수 있다.
도 3을 참조하면, 질의 응답 시스템(1a)은 유저 인터페이스(100), 질의 응답 브로커 서버(200), 적어도 하나의 내부 질의 응답 서버(300), 및 데이터 서버(400)를 포함하며, 네트워크(20)를 통하여 적어도 하나의 외부 질의 응답 서버(30)에 접속할 수 있다.
언어 번역부(220)는 서버 관리부(230)의 요청에 따라, 사용자(10)의 질의에 대한 언어 번역을 수행할 수 있다. 또한, 언어 번역부(220)는 내부 질의 응답 서버(300) 또는 외부 질의 응답 서버(30)에서 수신된 응답이 사용자(10)의 질의에 대하여 판별된 언어와 다른 경우, 사용자(10)의 질의에 대하여 판별된 언어로 언어 번역을 수행할 수 있다. 언어 번역부(220)는 자체적으로 언어 번역을 수행할 수도 있으나, 일부 언어 간의 번역, 또는 모든 언어 간의 번역을 네트워크(20)를 통하여 연결되는 외부 언어 번역 서버(50)를 통하여 수행하도록 할 수 있다. 즉, 언어 번역부(220)는 외부 언어 번역 서버(50)와 네트워크(20)를 통하여 접속하여, 외부 언어 번역 서버(50)에 번역 요청를 송신하고, 번역 결과를 수신할 수 있는 통신 기능을 포함할 수 있다.
도 4는 본 발명의 예시적 실시 예에 따른 다국어 질의 응답 시스템의 자연어 이해부의 주요 구성을 나타내는 블록도이다.
도 4를 참조하면, 자연어 이해부(360)는 자연어 형태의 질의를 해석하는 자연어 분석부(368)를 포함할 수 있다. 자연어 분석부(368)는 형태소 분석부(361), 구문 분석부(362), 개체명 분석부(363), 필터링 분석부(364), 의도 분류부(365), 도메인 분석부(366) 및 시맨틱 롤 라벨링부(SRL, 367)를 포함할 수 있다.
형태소 분석부(361)는 질의를 최소의 의미 단위인 형태소 단위로 분리할 수 있다. 구문 분석부(362) 및 개체명 분석부(3)는 각각 형태소 단위로 분리된 질의에 대한 구문 분석 및 개체명 분석을 할 수 있다.
구문 분석부(362)에서는 형태소 분석 결과 중 가장 적합한 형태의 품사를 선택하는 과정으로서 문맥 좌우에 위치한 중의성 해소의 힌트가 되는 정보를 이용해서 적합한 분석 결과를 선택하는 품사 부착 과정, 명사구, 동사구, 부사구 등의 덩어리를 분석하는 구 단위 분석 과정, 중문, 복문 등의 문장을 단문 단위로 분해하는 절 단위 분석 과정, 및 문장을 이루고 있는 구성 성분 간 위계 관계를 분석하여 문장의 구조를 결정하는 구문 분석 과정이 수행될 수 있다.
필터링 분석부(364)는 질의 중 불필요한 피쳐를 제거하여 간결화된 문장을 생성할 수 있다.
의도 분류부(365) 및 도메인 분석부(366)는 필터링 분석부(364)에서 생성한 간결화된 문장을 기초로 의미 역할이 부여된 질의의 의도 분류 및 도메인 분석을 할 수 있다. 의도 분류부(365)는, 질의에 대한 자연어 처리 결과로부터 의도를 검출할 수 있다. 의도란 발언의 의도로 사용되며, 하나의 의도에는 다수의 의역된(paraphrasing) 문장들을 설정할 수 있다. 의도 검출(Intent Classification 또는 Intent Detect)이란 특정 문장에 대한 의미를 결정하기 위해 대화 과정에서 설정된 의도 중 유사도가 높은 문장을 찾는 과정을 말한다.
도메인 분석부(366)에서 수행되는 도메인 분석은, 지식 베이스(도 1의 420) 또는 외부 지식 베이스(도 1의 40)에서 질의에 대한 답변을 생성하는 과정에서, 질의에 맞는 도메인을 선택하도록 할 수 있다.
시맨틱 롤 라벨링부(SRL, 367)은 질의에 대한 의미 역할을 부여할 수 있다. 시맨틱 롤 라벨링이란, 질의의 형태소들에, E(Entity), P(Property), Q(Quantity), C(Class Information, 클래스 정보) 등과 같은 라벨(label)이 부여하는 것을 의미할 수 있다.
자연어 이해부(360)는 자연어 분석부(368)에서 수행된 자연어 처리 결과를 받아서, 질의에 대한 분류를 수행하는 질의 분류부(369)를 더 포함할 수 있다. 질의 분류부(369)는 질의에 대한 시맨틱 패턴 정보를 생성할 수 있다. 시맨틱 패턴은, 질의 전체에 대한 라벨의 구성, 예를 들면, EP(Entity, Property) 패턴, EPP(Entity, 2 Property) 패턴, EPQ(Entity, Property, Quntity) 패턴 등을 의미할 수 있다. 질의 분류부(369)에서 생성한 시맨틱 패턴 정보는 질의에 적합한 질의 처리 모듈(도 2의 370)을 선택하는 데에 사용될 수 있다.
도 5는 본 발명의 예시적 실시 예에 따른 다국어 질의 응답 시스템을 나타내는 블록도이다.
도 5를 참조하면, 질의 응답 시스템(2)은, 유저 인터페이스(100), 및 질의 응답 브로커 서버(200)을 포함하며, 네트워크(20)를 통하여 복수의 외부 질의 응답 서버(32, 34, 36)에 접속할 수 있다.
복수의 외부 질의 응답 서버(32, 34, 36)는 제1 외부 질의 응답 서버(32), 제2 외부 질의 응답 서버(34), 및 제3 외부 질의 응답 서버(36)를 포함할 수 있다. 제1 외부 질의 응답 서버(32), 제2 외부 질의 응답 서버(34), 및 제3 외부 질의 응답 서버(36) 각각은 다른 언어에 대한 질의 응답을 수행할 수 있다. 제1 외부 질의 응답 서버(32), 제2 외부 질의 응답 서버(34), 및 제3 외부 질의 응답 서버(36) 각각은 제1 외부 지식 베이스(42), 제2 외부 지식 베이스(44), 및 제3 외부 지식 베이스(46)와 연결될 수 있다. 제1 외부 지식 베이스(42), 제2 외부 지식 베이스(44), 및 제3 외부 지식 베이스(46) 각각은 다른 언어에 대한 지식이 구축될 수 있다.
즉, 질의 응답 시스템(2)는 내부 질의 응답 서버(도 1 내지 도 3의 300)을 포함하지 않고, 네트워크(20)를 통하여 질의 응답 브로커 서버(200)와 연결되어, 질의 응답 브로커 서버(200)에 의하여 질의 응답을 수행하는 복수의 외부 외부 질의 응답 서버(32, 34, 36)와 접속할 수 있다. 따라서, 질의 응답 시스템(2)은 가변성과 확장성 관점에서 한계를 가지지 않으며 다국어에 대한 질의 응답을 처리하면서도 컴팩트하게 구성될 수 있다.
질의 응답 시스템(2)은 데이터 서버(402)를 포함할 수 있다. 데이터 서버(402)는 지식 색인(412)을 포함할 수 있다. 지식 색인(412)은 복수의 외부 지식 베이스(42, 44, 46)에 대한 색인 정보, 즉 질의 응답 시스템(2)이 접속할 수 있는 복수의 외부 질의 응답 서버(32, 34, 36)와 연결되는 지식 베이스에 대한 색인 정보를 가질 수 있다.
따라서, 질의 응답 시스템(2)이 직접 복수의 질의 응답 서버(32, 34, 36)에 접속하여 정보를 요청하지 않아도, 질의 응답 브로커 서버(200)가 복수의 외부 질의 응답 서버(32, 34, 36) 중 사용자(10)의 질의에 적합한 언어를 지원하는 외부 질의 응답 서버를 빠르게 선택하여, 질의 응답을 수행하도록 할 수 있다.
도 6은 본 발명의 예시적 실시 예에 따른 다국어 질의 응답 시스템의 동작을 설명하기 위한 흐름도이다.
도 1, 도 2, 도 3, 도 5 및 도 6을 함께 참조하면, 사용자(10)의 질의가 유저 인터페이스(100)에 입력되면(S10), 질의 응답 브로커 서버(200)의 언어 판별부(210)에서 질의의 언어를 판별한다(S100).
판별된 질의의 언어에 대응하는 질의 응답 서버가 질의 응답 시스템(1, 1a, 1b)의 내부에 구축된 경우, 서버 관리부(230)는 내부 질의 응답 서버(300)를 선택하여, 서버 통신부(240)를 통하여, 내부 질의 응답 서버(300)에서 질의 응답을 수행하도록 한다(S200). 내부 질의 응답 서버(300)에서 수행되는 질의 응답을 내부 질의 응답이라 호칭할 수 있다. 내부 질의 응답 서버(300)에서 생성된 질의에 대한 응답은 서버 통신부(240)를 통하여 유저 인터페이스(100)에 전달되며, 네트워크(20)를 통하여 출력되어 사용자(10)에게 제공될 수 있다(S50).
판별된 질의의 언어에 대응하는 질의 응답 서버가 질의 응답 시스템(1, 1a, 1b, 2)의 내부에 구축되지 않은 경우, 서버 관리부(230)는 번역 여부 판별 및 서버 선택을 할 수 있다(S120), 판별된 질의의 언어에 대응하는 외부 질의 응답 서버(30)와 접속할 수 있는 경우에는 언어 번역을 하지 않고(N)에 외부 질의 응답 서버(30)를 선택하여, 서버 통신부(240)를 통하여, 외부 질의 응답 서버(30)에서 질의 응답을 수행하도록 할 수 있다(S220). 외부 질의 응답 서버(30)에서 수행되는 질의 응답을 외부 질의 응답이라 호칭할 수 있다. 외부 질의 응답 서버(30)에서 생성된 질의에 대한 응답은 서버 통신부(240)를 통하여 유저 인터페이스(100)에 전달되며, 네트워크(20)를 통하여 출력되어 사용자(10)에게 제공될 수 있다(S50).
판별된 질의의 언어에 대응하는 접속할 수 있는 외부 질의 응답 서버(30)가 없거나, 접속할 수 있는 외부 질의 응답 서버(30)를 통한 질의 응답이 적합하지 않다고 판단되는 경우(Y), 서버 관리부(230)는 언어 번역부(220)를 통하여 질의에 대한 언어 번역을 수행하도록 할 수 있다(S140).
이때, 서버 관리부(230)는 언어간 번역 정확도, 지식 베이스별 지식 구축량, 질의를 이루는 개체별 관계 트리플 개수를 종합하여, 번역할 언어 및 질의 응답을 수행할 내부 질의 응답 서버(300) 또는 외부 질의 응답 서버(30)를 선택하여, 질의에 대한 언어 번역 결과를 기초로 내부 질의 응답 서버(300)에서 질의 응답을 수행하도록 하거나(S200), 외부 질의 응답 서버(30)에서 질의 응답을 수행하도록 할 수 있다(S220).
질의에 대한 응답을 수신한 사용자(10)의 피드백은, 서버 관리부(230)로 전달되어, 번역 여부 판단 및 서버 선택에 대한 판단 자료로 사용될 수 있다.
도 7은 본 발명의 예시적 실시 예에 따른 다국어 질의 응답 시스템의 언어 판별부의 동작을 설명하기 위한 흐름도이다.
도 7을 참조하면, 서버 관리부(230)는 언어 번역부(220)를 통한 언어간 번역 정확도(F1), 지식 베이스(도 1의 420), 외부 지식 베이스(도 1의 40) 제1 내지 제3 외부 지식 베이스(도 5의 42, 44, 46) 등, 지식 베이스별 지식 구축량(F2), 및 질의를 이루는 개체별 관계 트리플 개수(F3)를 종합하여, 번역 여부 판단 및 서버 선택을 할 수 있다(S120).
언어간 번역 정확도(F1)는 언어 번역부(230)에서 수행된 언어 번역 결과, 및/또는 언어 번역부(230)가 가지고 있는 언어간 번역 정확도에 대한 정보로부터 구해질 수 있다. 지식 베이스별 지식 구축량(F2) 및 개체별 관계 트리플 개수(F3)는 지식 색인(410)에 저장될 수 있다.
예를 들어, 질의가 A 언어로 된 경우, A 언어와 B 언어 간의 번역 정확도가 상대적으로 높고, A 언어와 C 언어간의 번역 정확도가 상대적으로 낮은 경우, 1차적으로 A 언어를 B 언어로 번역하여, B 언어에 대응하는 질의 응답 서버를 선택할 수 있다. 그러나, B 언어에 대응하는 질의 응답 서버와 연결되는 지식 베이스의 지식 구축량이 C 언어에 대응하는 질의 응답 서버와 연결되는 지식 베이스의 지식 구축량에 비하여 큰 차이를 가지고 적은 경우, 서버 관리부(230)는 A 언어로 된 질의를 C 언어로 번역을 하여, C 언어에 대응하는 질의 응답 서버를 선택할 수 있다.
또는, 지식 베이스를 이루는 전체 지식 구축량은 차이가 적지만, 질의를 이루는 개체들이 가지는 관계 트리플이, B 언어에 대응하는 질의 응답 서버와 연결되는 지식 베이스 내에서, C 언어에 대응하는 질의 응답 서버와 연결되는 지식 베이스 내보다 큰 차이를 가지고 적은 경우에는, B 언어에 대응하는 질의 응답 서버는 질의의 도메인에 적합하지 않은 질의 응답 서버로 판단할 수 있으므로, 서버 관리부(230)는 A 언어로 된 질의를 C 언어로 번역을 하여, C 언어에 대응하는 질의 응답 서버를 선택할 수 있다.
즉, 서버 관리부(230)는 언어간 번역 정확도(F1), 지식 베이스별 지식 구축량(F2) 및 개체별 관계 트리플 개수(F3) 각각에 대하여 가중치를 부여하여 합산한 결과를 기초로, 질의를 번역할 언어 및 질의 응답을 수행할 질의 응답 서버를 선택할 수 있다.
도 1 내지 도 7을 함께 참조하면, 본 발명에 따른 다국어 질의 응답 시스템(1, 1a, 1b, 2)은 질의 응답 브로커 서버(200)를 통하여, 내부 질의 응답 서버(200), 또는 외부 질의 응답 서버(30, 32, 34, 36)을 선택하여 질의 응답을 수행하도록 하므로, 가변성과 유지보수성 그리고 확장성 관점에서 한계를 가지지 않는다. 또한, 본 발명에 따른 다국어 질의 응답 시스템(1, 1a, 1b, 2)은, 서버 관리부(230)에서 언어간 번역 정확도(F1), 지식 베이스별 지식 구축량(F2) 및 개체별 관계 트리플 개수(F3)을 종합하여, 언어 번역 여부 판단, 및 내부 질의 응답 서버(200) 또는 외부 질의 응답 서버(30, 32, 34, 36)를 선택하여 질의 응답을 수행하도록 하므로, 질의에 가장 적합한 질의 응답 서버를 선택하여, 고품질의 다국어 질의 응답을 수행하도록 할 수 있다.
이상, 본 발명을 바람직한 실시예를 들어 상세하게 설명하였으나, 본 발명은 상기 실시예에 한정되지 않고, 본 발명의 기술적 사상 및 범위 내에서 당 분야에서 통상의 지식을 가진 자에 의하여 여러가지 변형 및 변경이 가능하다.
1 : 다국어 질의 응답 시스템, 10 : 사용자, 20 : 네트워크, 30 : 외부 질의 응답 서버, 32, 34, 36 : 제1 내지 제3 질의 응답 서버, 40 : 외부 지식 베이스, 42, 44, 46 : 제1 내지 제3 외부 지식 베이스, 50 : 외부 언어 번역 서버, 100 : 유저 인터페이스, 200 : 질의 응답 브로커 서버, 210 : 언어 판별부, 220 : 언어 번역부, 230 : 서버 관리부, 240 : 서버 통신부, 300 : 내부 질의 응답 서버, 310 : 알림 수신부, 320 : 모듈 검출부, 330 : 답변 랭킹부, 350 : 질의 응답 관리자, 360 : 자연어 이해부, 370 : 질의 처리 모듈, 380 : 자연어 생성부, 400, 402 : 데이터 서버, 410, 412 : 지식 색인, 420 : 지식 베이스,

Claims (10)

  1. 네트워크를 통하여 사용자로부터 질의를 수신하고, 상기 질의에 대한 응답을 상기 사용자에게 송신하는 유저 인터페이스;
    상기 질의에 대한 언어를 판별하고, 상기 질의에 대한 언어 번역 여부 판단 및 질의 응답을 수행할 서버를 선택하는 질의 응답 브로커 서버; 및
    상기 질의 응답 브로커 서버와 연결되며 상기 질의에 대한 응답을 생성하는 적어도 하나의 내부 질의 응답 서버;를 포함하며,
    상기 질의 응답 브로커 서버는, 상기 네트워크를 통하여 상기 내부 질의 응답 서버와 다른 언어에 대한 질의 응답을 수행하는 적어도 하나의 외부 질의 응답 서버와 접속하는 다국어 질의 응답 시스템.
  2. 제1 항에 있어서,
    상기 질의 응답 브로커 서버는,
    상기 질의의 언어를 판별하는 언어 판별부;
    상기 질의에 대한 언어 번역을 수행하고, 상기 답변을 상기 질의에 대한 언어로 번역하는 언어 번역부;
    상기 언어 판별부에서 판별된 상기 질의의 언어를 참조하여, 상기 언어 번역부에서 상기 질의에 대한 언어 번역 여부를 판단 및 상기 적어도 하나의 내부 질의 응답 서버 및 상기 적어도 하나의 외부 질의 응답 서버 중 상기 질의에 대한 질의 응답을 수행할 질의 응답 서버를 선택하는 서버 관리부; 및
    상기 적어도 하나의 내부 질의 응답 서버 및 상기 적어도 하나의 외부 질의 응답 서버 중 상기 서버 관리부에서 선택한 질의 응답 서버와 통신하여 질의 응답을 수행하도록 하는 서버 통신부;를 포함하는 것을 특징으로 하는 다국어 질의 응답 시스템.
  3. 제2 항에 있어서,
    상기 언어 번역부는, 상기 네트워크를 통하여 외부 언어 번역 서버와 연결되어, 외부 언어 번역 서버를 통하여 상기 질의에 대한 언어 번역을 수행하도록 하는 것을 특징으로 하는 다국어 질의 응답 시스템.
  4. 제2 항에 있어서,
    상기 적어도 하나의 내부 질의 응답 서버 및 상기 적어도 하나의 외부 질의 응답 서버 각각과 연결되는 지식 베이스에 대한 색인 정보를 가지는 데이터 서버;를 더 포함하는 것을 특징으로 하는 다국어 질의 응답 시스템.
  5. 제4 항에 있어서,
    상기 서버 관리부는, 상기 적어도 하나의 내부 질의 응답 서버에, 상기 언어 판별부에서 판별한 상기 질의의 언어에 대응하는 상기 내부 질의 응답 서버가 있는 경우, 상기 질의의 언어에 대응하는 상기 내부 질의 응답 서버에서 상기 질의에 대한 질의 응답을 수행하도록 하는 것을 특징으로 하는 다국어 질의 응답 시스템.
  6. 제4 항에 있어서,
    상기 서버 관리부는, 상기 적어도 하나의 내부 질의 응답 서버가 상기 언어 판별부에서 판별한 상기 질의의 언어에 대응하지 않는 경우, 상기 질의에 대한 언어 번역 여부를 판단하는 것을 특징으로 하는 다국어 질의 응답 시스템.
  7. 제6 항에 있어서,
    상기 서버 관리부는 상기 적어도 하나의 내부 질의 응답 서버가 상기 언어 판별부에서 판별한 상기 질의의 언어에 대응하지 않는 경우, 상기 언어 번역부에서 상기 질의에 대한 번역을 수행하여, 번역된 상기 질의의 언어에 대응하는 상기 적어도 하나의 내부 질의 응답 서버 및 상기 적어도 하나의 외부 질의 응답 서버 중 어느를 통하여 상기 질의에 대한 질의 응답을 수행하도록 하거나, 상기 질의에 대한 번역을 수행하지 않고 상기 외부 질의 응답 서버를 통하여 상기 질의에 대한 질의 응답을 수행하도록 하는 것을 특징으로 하는 다국어 질의 시스템.
  8. 제7 항에 있어서,
    상기 서버 관리부는, 상기 언어 번역부를 통한 언어간 번역 정확도, 상기 지식 색인이 가지고 있는 지식 베이스별 구축량, 및 상기 질의를 이루는 개체별 관계 트리플 개수를 종합하여, 상기 질의에 대한 언어 번역 여부 판단 및 질의 응답을 수행할 서버를 선택하는 것을 특징으로 하는 다국어 질의 응답 시스템.
  9. 제4 항에 있어서,
    상기 데이터 서버는, 상기 적어도 하나의 내부 질의 응답 서버에서 질의 응답을 수행할 수 있는 언어에 대한 지식이 축적된 지식 베이스를 더 포함하는 것을 특징으로 하는 다국어 질의 응답 시스템.
  10. 제9 항에 있어서,
    상기 지식 베이스는, 상기 적어도 하나의 내부 질의 응답 서버 및 상기 적어도 하나의 외부 질의 응답 서버 각각에서 질의 응답을 수행할 수 있는 언어에 대한 지식들이 축적된 다국어 지식베이스인 것을 특징으로 하는 다국어 질의 응답 시스템.
KR1020190136902A 2019-10-30 2019-10-30 다국어 질의 응답 시스템 KR102256664B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190136902A KR102256664B1 (ko) 2019-10-30 2019-10-30 다국어 질의 응답 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190136902A KR102256664B1 (ko) 2019-10-30 2019-10-30 다국어 질의 응답 시스템

Publications (2)

Publication Number Publication Date
KR20210051519A true KR20210051519A (ko) 2021-05-10
KR102256664B1 KR102256664B1 (ko) 2021-05-27

Family

ID=75917545

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190136902A KR102256664B1 (ko) 2019-10-30 2019-10-30 다국어 질의 응답 시스템

Country Status (1)

Country Link
KR (1) KR102256664B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102604242B1 (ko) * 2023-05-15 2023-11-21 (주)페르소나에이아이 외부 모델과 연동하는 생성형 인공지능을 포함하는k-gpt 솔루션 기반의 전자 장치 및 시스템

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010097802A (ko) * 2000-04-26 2001-11-08 신재균 다국어 검색과 검색정보 자동번역/분류 시스템과 그를이용한 다국어 검색방법
JP2004118740A (ja) * 2002-09-27 2004-04-15 Toshiba Corp 質問応答システム、質問応答方法、質問応答プログラム
US7630961B2 (en) * 2002-04-12 2009-12-08 Targit A/S Method of processing multi-lingual queries
KR20190074828A (ko) * 2017-12-20 2019-06-28 주식회사 솔트룩스 복수의 질의 응답 모듈을 가지는 자동 질의 응답 시스템

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010097802A (ko) * 2000-04-26 2001-11-08 신재균 다국어 검색과 검색정보 자동번역/분류 시스템과 그를이용한 다국어 검색방법
US7630961B2 (en) * 2002-04-12 2009-12-08 Targit A/S Method of processing multi-lingual queries
JP2004118740A (ja) * 2002-09-27 2004-04-15 Toshiba Corp 質問応答システム、質問応答方法、質問応答プログラム
KR20190074828A (ko) * 2017-12-20 2019-06-28 주식회사 솔트룩스 복수의 질의 응답 모듈을 가지는 자동 질의 응답 시스템

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
정한민 외 4인, 관계형 데이터베이스 상에서의 다국어 질의 응답 시스템, 한국정보과학회 언어공학연구회 학술대회논문집, 2001. 530-537페이지. *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102604242B1 (ko) * 2023-05-15 2023-11-21 (주)페르소나에이아이 외부 모델과 연동하는 생성형 인공지능을 포함하는k-gpt 솔루션 기반의 전자 장치 및 시스템

Also Published As

Publication number Publication date
KR102256664B1 (ko) 2021-05-27

Similar Documents

Publication Publication Date Title
US11822890B2 (en) Method, system, and computer program for artificial intelligence answer
US11960513B2 (en) User-customized question-answering system based on knowledge graph
JP7420842B2 (ja) 自然言語理解(nlu)フレームワークにおける予測的類似性スコアリングサブシステム
CN110462730B (zh) 促进以多种语言与自动化助理的端到端沟通
Zhdanova et al. Community-driven ontology matching
Zhang et al. Towards building the federatedGPT: Federated instruction tuning
CN105378721A (zh) 知识捕获和发现系统
US20200285528A1 (en) Application program interface lists
JP2015201169A (ja) 多様な意味カテゴリに基づいた翻訳結果提供方法およびシステム
EP3610375B1 (en) Platform selection for performing requested actions in audio-based computing environments
US20230352017A1 (en) Platform selection for performing requested actions in audio-based computing environments
KR102256664B1 (ko) 다국어 질의 응답 시스템
US20220238103A1 (en) Domain-aware vector encoding (dave) system for a natural language understanding (nlu) framework
CN114064943A (zh) 会议管理方法、装置、存储介质及电子设备
WO2022047465A1 (en) Conversational syntax using constrained natural language processing for accessing datasets
US20220229990A1 (en) System and method for lookup source segmentation scoring in a natural language understanding (nlu) framework
Liu Research on Computer intelligent proofreading System based on improved phrase translation model
CN103577397A (zh) 计算机翻译数据处理方法及装置
Piller et al. SemSub: Semantic subscriptions for the MQTT protocol
KR102600752B1 (ko) 소스코드 분석을 이용한 텍스트 의미 분석 장치, 시스템 및 방법, 그리고, 이를 이용한 챗봇 질의응답 서비스 제공 방법
RU2818036C1 (ru) Способ и система управления диалоговым агентом в канале взаимодействия с пользователем
US20240176962A1 (en) CROSS-LINGUAL NATURAL LANGUAGE UNDERSTANDING MODEL FOR MULTI-LANGUAGE NATURAL LANGUAGE UNDERSTANDING (mNLU)
US20220245352A1 (en) Ensemble scoring system for a natural language understanding (nlu) framework
WO2021096382A2 (ru) Способ и система управления диалоговым агентом в канале взаимодействия с пользователем
WO2022254432A1 (en) A sign language translation method and system thereof

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right