KR20200032873A - Parsing system for chat bot service based on book information and control method thereof - Google Patents
Parsing system for chat bot service based on book information and control method thereof Download PDFInfo
- Publication number
- KR20200032873A KR20200032873A KR1020180112040A KR20180112040A KR20200032873A KR 20200032873 A KR20200032873 A KR 20200032873A KR 1020180112040 A KR1020180112040 A KR 1020180112040A KR 20180112040 A KR20180112040 A KR 20180112040A KR 20200032873 A KR20200032873 A KR 20200032873A
- Authority
- KR
- South Korea
- Prior art keywords
- information
- book
- sentence
- chatbot
- sentences
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 37
- 230000004044 response Effects 0.000 claims abstract description 59
- 238000012545 processing Methods 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 5
- 230000006870 function Effects 0.000 description 6
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/30—Transportation; Communications
-
- G06Q50/50—
Abstract
Description
본 발명은 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템 및 그 제어 방법에 관한 것으로, 보다 상세하게는 전자책의 정보를 가공하여 도서 전문 챗봇 서비스를 위한 답변 데이터베이스를 자동으로 생성할 수 있도록 하는, 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템 및 그 제어 방법에 관한 것이다.The present invention relates to a parsing system for a book information-based chatbot service and a control method thereof, more specifically, by processing information of an e-book so that an answer database for a book chatbot service can be automatically generated. The present invention relates to a parsing system for an information-based chatbot service and a control method thereof.
최근 인공지능과 메신저를 결합한'챗봇'기술이 주목받고 있다.Recently, 'chatbot' technology combining artificial intelligence and messenger has attracted attention.
상기 챗봇(Chat Bot)은, 사용자(user)를 대화상대로 텍스트나 음성기반의 대화를 수행하는 소프트웨어로서, 고객서비스나 정보수집 용도로 활용되고 있으며, 인공지능 비서(Artificial Assitance)와 혼용되어 사용되고 있다. The chat bot (Chat Bot) is software that performs a text or voice-based conversation with a user as a conversation partner, and is used for customer service or information collection purposes, and is used in combination with artificial intelligence assistant (Artificial Assitance). .
예컨대 상기 챗봇에는 구글 어시스턴트(Assistant), 애플 시리(Siri), 삼성 빅스비(Bixby) 등이 있다. 그러나 현재 개발된 챗봇들은 일상생활(예 : 날씨, 가전제품 제어, 쇼핑 등)에 관련된 기능을 수행하는 것이 대부분이며, 특정 전문분야에 대한 대화 기능을 수행하지는 못할 뿐만 아니라, 사용자가 질문하는 요지를 정확히 이해(파악)하지 못하는 등, 아직 오류가 많은 문제점이 있다.For example, the chatbot includes Google Assistant, Apple Siri, and Samsung Bixby. However, currently developed chatbots mostly perform functions related to daily life (eg, weather, home appliance control, shopping, etc.), and do not perform conversation functions for specific fields of expertise, as well as the points that users ask There are many problems with errors, such as not being able to understand (grasp) accurately.
따라서 이러한 문제점을 해결하기 위해서는, 즉, 상기 챗봇이 다양한 사용자들과 주고받는 대화의 요지나 의미를 정확히 인식하고, 사용자들과 적절한 대화를 이어가기 위해서는, 대화 내용으로 선택이 가능한 텍스트들을 미리 학습하고 준비하여, 상기 미리 학습하여 준비한 텍스트들 중 가장 적절한 내용의 텍스트를 답변으로서 제공하는 기능이 구현되어야 한다. Therefore, in order to solve such a problem, that is, the chatbot accurately recognizes the gist or meaning of a conversation exchanged with various users, and in order to continue an appropriate conversation with users, the texts that can be selected as conversation contents are learned in advance. In preparation, a function of providing text of the most appropriate content among the texts prepared by learning in advance as an answer should be implemented.
현재 대부분의 챗봇들은 대화 중 발생할 수 있는 무수히 많은 상황별 답변들을 개발자들이 미리 수동으로 작성해 데이터베이스를 생성하고 있다. 따라서 만약 특정 분야(또는 전문 분야)에 대해서 챗봇과 대화를 진행하기 위해서는 상기 데이터베이스를 생성할 개발자(또는 관리자)가 특정 분야(또는 전문 분야)에 대해서 충분한 지식을 가지고 있어야만 비로소 상기 특정 분야에 관련된 상황별 답변을 미리 준비할 수 있다.Currently, most chatbots create a database by manually writing in advance a myriad of context-sensitive responses that can occur during a conversation. Therefore, in order to communicate with a chatbot about a specific field (or special field), the developer (or manager) who will create the database must have sufficient knowledge about the specific field (or special field) before the situation related to the specific field Star responses can be prepared in advance.
하지만 상기와 같이 개발자가 수동으로 제작한 상황별 답변으로 데이터베이스를 생성하는 것은 많은 인력, 시간, 및 노력이 필요하며, 더구나 이를 위한 전문 인력이 필요하기 때문에 결과적으로 챗봇의 업데이트가 지연됨으로써, 사용자와의 대화 진행을 원활하게 수행할 수 없는 문제점이 발생한다.However, as mentioned above, creating a database with a contextual answer manually created by a developer requires a lot of manpower, time, and effort, and furthermore, it requires a specialized manpower for this. There is a problem that can not smoothly proceed with the conversation.
이러한 문제점을 도서(책) 분야에 적용해서 설명하면 다음과 같다.If this problem is applied to the book (book) field, it will be described as follows.
예컨대 현재 사용자가 원하는 내용의 도서를 검색하기 위해서는, 해당 홈페이지의 검색창(예 : 인터넷 서점, 전자 도서관, 포털사이트 등)에서 사용자가 검색할 도서의 카테고리(그룹)를 선택한 후, 제목의 일부, 및 저자 등을 키워드로서 사용자가 직접 입력하여 검색하는 것이 일반적이다. For example, in order to search for a book of the content desired by the current user, select a category (group) of the book to be searched by the user in the search box of the homepage (for example, an internet bookstore, electronic library, portal site, etc.), and then part of the title, And it is common to search by directly entering the user as the keyword as the author.
그런데 상기와 같이 사용자가 생각한 키워드를 검색창에 입력하는 키워드 검색이 아니라, 챗봇과의 대화를 통해 도서를 검색하기 위해서는, 상기 챗봇이 사용자가 입력하는 문장 형태의 질문을 이해하고, 도서(책)의 기본 정보(예 : 도서명, 출판사, 저자/역자, 주제어, 책소개, 가격, 카테고리) 뿐만 아니라, 도서(책)의 전체적인 내용(예 : 목차 정보, 상세 정보)도 데이터베이스에 포함하고 있어야 한다. However, in order to search for a book through a conversation with a chatbot, rather than a keyword search in which the user thinks the keyword entered in the search box as described above, the chatbot understands the question in the form of a sentence input by the user, and the book (book) In addition to the basic information (eg book name, publisher, author / translator, subject language, book introduction, price, category), the entire contents of the book (book) (eg table of contents information, detailed information) should be included in the database.
이때 상기 챗봇이 사용자가 입력하는 문장 형태의 질문을 이해하기 위해서는, 해당 도서의 분야에 대해서 충분한 지식을 가지고 있는 개발자(또는 해당 도서를 읽은 개발자)가 직접(즉, 수동으로) 상기 도서에 관해서 사용자가 질문할 내용(즉, 상황)과 이 상황(또는 질문)에 대한 답변을 작성하여 데이터베이스를 생성해야 한다.At this time, in order for the chatbot to understand the question in the form of a sentence input by the user, a developer (or a developer who has read the book) who has sufficient knowledge about the field of the book directly (ie, manually) uses the user for the book. You need to create a database by filling out the content to ask (ie situation) and answers to this situation (or question).
하지만 하루에도 적게는 수백 권에서 수천 권의 책이 출판되고 있는 상황에서 개발자(또는 해당 도서를 읽은 관리자)가 해당 도서에 관해서 발생할 수 있는 사용자와의 대화 상황별 복수의 답변을 직접(수동으로) 작성하는 것은 사실상 불가능하며, 결과적으로 특정 전문분야(예 : 도서 분야)에 대한 챗봇의 업데이트가 지연됨으로써, 사용자와의 도서에 대한 대화 진행을 원활하게 수행할 수 없는 문제점이 발생한다.However, in the situation where hundreds or thousands of books are being published every day, developers (or administrators who have read the books) can directly (manually) respond multiple times to conversations with users that may occur regarding the book. It is virtually impossible to write, and as a result, the update of the chatbot for a specific specialized field (for example, a book field) is delayed, which causes a problem that a conversation with a user cannot be smoothly performed.
본 발명의 배경기술은 대한민국 등록특허 10-1851785호(2018.04.18. 등록, 챗봇의 트레이닝 세트 생성 장치 및 방법)에 개시되어 있다. Background of the invention is disclosed in Republic of Korea Patent Registration No. 10-1851785 (2018.04.18. Registration, chatbot training set generation device and method).
본 발명의 일 측면에 따르면, 본 발명은 상기와 같은 문제점을 해결하기 위해 창작된 것으로서, 전자책의 정보를 가공하여 도서 전문 챗봇 서비스를 위한 답변 데이터베이스를 자동으로 생성할 수 있도록 하는, 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템 및 그 제어 방법을 제공하는 데 그 목적이 있다. According to an aspect of the present invention, the present invention was created to solve the above problems, and processes information of an e-book to automatically generate an answer database for a book chatbot service, based on book information. Its purpose is to provide a parsing system and control method for its chatbot service.
본 발명의 일 측면에 따른 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템은, 전자책들을 수집하거나 입력받아 각 전자책의 분석이나 검색에 필요한 적어도 하나의 파일을 추출하여 제어부에 전달하는 도서 정보 입력부; 상기 도서 정보 입력부에서 전달받은 파일을 파싱(parsing)하여, 각 전자책의 기본 정보, 목차 정보, 및 상세 정보를 바탕으로, 각 전자책에 포함된 단어, 문장, 단락, 및 장을 검색하여, 지정된 특정 분야의 도서에서 특정 주제에 대하여 챗봇을 통해 대화할 수 있는 복수의 답변 문장을 자동으로 생성하는 상기 제어부; 및 상기 제어부에서 생성한 복수의 답변 문장을 저장하는 데이터베이스부;를 포함하는 것을 특징으로 한다.A parsing system for a book information-based chatbot service according to an aspect of the present invention includes: a book information input unit that collects or receives e-books, extracts at least one file necessary for analysis or search of each e-book, and delivers it to a control unit; By parsing the file received from the book information input unit, search for words, sentences, paragraphs, and chapters included in each e-book based on the basic information, table of contents information, and detailed information of each e-book, The control unit that automatically generates a plurality of response sentences that can be communicated through a chatbot on a specific subject in a book in a specific field; And a database unit storing a plurality of response sentences generated by the control unit.
본 발명에 있어서, 상기 제어부는, 상기 도서 정보 입력부에서 전달받은 파일을 파싱(parsing)하여, 각 전자책의 기본 정보, 목차 정보, 및 상세 정보를 분석하는 도서 정보 파싱부; 및 상기 파싱된 각 전자책의 기본 정보, 목차 정보, 및 상세 정보를 바탕으로, 단어, 문장, 단락, 및 장(chapter)을 검색하여, 관리자가 미리 지정했거나 챗봇 대화 중 사용자가 지정하는 특정 분야의 특정 주제에 대하여 챗봇을 통해 대화할 수 있는 다양한 문장 형태를 갖는 복수의 답변 문장을 자동으로 생성하는 답변 생성부;를 포함하는 것을 특징으로 한다.In the present invention, the control unit, the book information parsing unit for parsing (parsing) the file received from the book information input unit, to analyze the basic information, table of contents information, and detailed information of each e-book; And search for words, sentences, paragraphs, and chapters based on the basic information, table of contents information, and detailed information of each parsed e-book, and a specific field designated by an administrator in advance or designated by a user during a chatbot conversation. Characterized in that it comprises; a response generating unit for automatically generating a plurality of response sentences having a variety of sentence types that can be communicated through a chatbot on a specific topic of.
본 발명에 있어서, 상기 제어부는, 상기 복수의 답변 문장을 생성하기 위한 키워드 정보를 지정하거나 생성하는 키워드 생성부;를 더 포함하고, 상기 키워드 정보는, 대화 분야, 대화 주제, 대화 목적, 및 대화 성향이 반영된 정보로서, 시스템 관리자나 챗봇 사용자로부터 복수의 단어 형태로 입력되거나 문장 형태로 입력되는 것을 특징으로 한다.In the present invention, the control unit further comprises a keyword generating unit for designating or generating keyword information for generating the plurality of response sentences, and the keyword information includes a conversation field, a conversation topic, a conversation purpose, and a conversation. As information reflecting the propensity, it is characterized in that it is input in the form of a plurality of words or sentences from a system administrator or a chatbot user.
본 발명에 있어서, 상기 제어부는, 상기 데이터베이스부에 저장된 복수의 답변 문장 중 챗봇 사용자가 가장 원하는 답변 문장의 우선순위를 답변 문장별로 조정하는 답변 문장 가공부;를 더 포함하고, 상기 챗봇 사용자가 가장 원하는 답변 문장은, 적중률이 높은 답변 문장이거나 챗봇 사용자가 채택하는 횟수가 높은 답변 문장인 것을 특징으로 한다.In the present invention, the control unit further includes a response sentence processing unit that adjusts the priority of a response sentence desired by a chatbot user among response sentences stored in the database unit for each response sentence. The desired response sentence is a response sentence having a high hit rate or a response sentence having a high number of times adopted by a chatbot user.
본 발명에 있어서, 상기 제어부는, 챗봇의 답변 문장 선택을 돕기 위하여, 데이터베이스부에 저장된 각 답변 문장들의 키워드에 대한 등급을 부가 정보로서 메타 데이터 형태로 추가하는 데이터베이스부 업데이트를 수행하며, 상기 키워드 등급은, 목적어, 주어, 동사, 및 보어의 순서로, 자주 언급된 단어를 우선으로 키워드의 등급이 상위로 지정되는 것을 특징으로 한다.In the present invention, the control unit performs a database unit update that adds a rating for a keyword of each answer sentence stored in the database unit in the form of metadata as additional information to help the chatbot select a response sentence, and the keyword rating It is characterized in that, in the order of the object, subject, verb, and bore, the keyword rating is designated as the higher priority with the frequently mentioned words first.
본 발명에 있어서, 상기 제어부는, 데이터베이스부에 저장된 답변 문장들의 우선순위 정보가 조정되면 데이터베이스부를 업데이트 하고, 또한 상기 우선순위 정보가 조정된 답변 문장들의 형태를 학습한 후, 이후의 답변 문장 생성 시 상기 학습한 결과를 반영한 답변 문장을 생성하는 것을 특징으로 한다.In the present invention, when the priority information of the answer sentences stored in the database unit is adjusted, the control unit updates the database unit, and also learns the types of the answer sentences in which the priority information is adjusted, and then generates the answer sentences. It is characterized by generating an answer sentence reflecting the learning result.
본 발명에 있어서, 상기 제어부는, 씨피유(CPU)가 포함된 컴퓨터나 서버의 형태로 구현되는 것을 특징으로 한다.In the present invention, the control unit is characterized in that implemented in the form of a computer or server containing a CPU (CPU).
본 발명의 다른 측면에 따른 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템의 제어 방법은, 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템의 제어부가 복수의 답변 문장을 생성하기 위한 키워드 정보를 지정하거나 생성하는 단계; 상기 제어부가 상기 키워드 정보를 기반으로 전자책들의 정보를 분석하여, 상기 답변 문장을 생성하기 위한 특정 전자책 및 해당 전자책의 특정 영역을 검색하여 지정하는 단계; 상기 제어부가 상기 특정 전자책 및 해당 전자책의 지정된 특정 영역의 텍스트 정보 중 상기 키워드 정보를 적어도 하나 이상 포함한 문장을 검색하는 단계; 및 상기 제어부가 상기 검색된 복수의 문장, 및 상기 문장들을 미리 지정된 방식으로 조합하여 복수의 답변 문장을 생성한 후 대화체로 보정하여 데이터베이스부에 저장하는 단계;를 포함하는 것을 특징으로 한다.In a method of controlling a parsing system for a book information-based chatbot service according to another aspect of the present invention, a control unit of a parsing system for a book information-based chatbot service designates or generates keyword information for generating a plurality of response sentences step; Analyzing, by the control unit, information on e-books based on the keyword information, searching and designating a specific e-book and a specific area of the e-book to generate the response sentence; Searching for a sentence including at least one of the keyword information among text information of the specific e-book and a specific specific area of the e-book; And generating, by the control unit, the plurality of sentences searched for, and the plurality of answer sentences by combining the sentences in a predetermined manner, and then correcting the dialogues and storing them in a database unit.
본 발명에 있어서, 상기 키워드 정보는, 대화 분야, 대화 주제, 대화 목적, 및 대화 성향이 반영된 정보로서, 상기 시스템과 관리자나 챗봇 사용자를 통해 복수의 단어 형태로 입력되거나 문장 형태로 입력되는 것을 특징으로 한다.In the present invention, the keyword information is information reflecting a conversation field, a conversation subject, a conversation purpose, and a conversation tendency, and is characterized in that it is input in a plurality of word forms or sentence form through the system and an administrator or a chatbot user. Is done.
본 발명에 있어서, 상기 전자책들의 정보는, 기본 정보, 목차 정보, 및 상세 정보를 포함하는 것을 특징으로 한다.In the present invention, the information of the e-books is characterized by including basic information, table of contents information, and detailed information.
본 발명에 있어서, 상기 키워드 정보를 적어도 하나 이상 포함한 문장은, 적어도 하나가 검색되거나 더 많은 문장이 검색될 수 있으며, 또한 상기 검색된 문장은 길이가 짧은 문장 형태이거나 길이가 더 긴 문장 형태를 포함하는 것을 특징으로 한다.In the present invention, a sentence including at least one or more keyword information may be searched for at least one or more sentences, and the searched sentence may include a short sentence form or a longer sentence form. It is characterized by.
본 발명에 있어서, 상기 제어부가 상기 데이터베이스부에 저장된 복수의 답변 문장에서 각기 핵심 키워드를 추출하는 단계; 상기 제어부가 상기 각 답변 문장별 키워드의 등급을 설정하고, 또한 키워드를 개체구와 의미구로 분류하는 단계; 및 상기 각 답변 문장별 키워드 등급 및 분류 정보를 메타 데이터 형태로 생성한 부가 정보를 상기 데이터베이스부에 추가하는 업데이트를 수행하는 단계;를 더 포함하는 것을 특징으로 한다.In the present invention, the control unit extracting a key keyword from each of a plurality of response sentences stored in the database unit; Setting, by the control unit, a keyword rating for each answer sentence, and also classifying the keywords into individual phrases and semantic phrases; And performing an update to add additional information generated by generating the keyword rating and classification information for each answer sentence in the form of metadata in the database unit.
본 발명에 있어서, 상기 부가 정보는, 챗봇이 상기 데이터베이스부에 저장된 복수의 답변 문장들 중 상황에 적합한 답변을 선택하는 데 반영할 수 있는 정보인 것을 특징으로 한다.In the present invention, the additional information is characterized in that the chatbot is information that can be reflected in selecting a response suitable for a situation among a plurality of response sentences stored in the database unit.
본 발명에 있어서, 상기 제어부가 챗봇이 선택한 답변 문장별 채택 정보를 누적하는 단계; 상기 제어부가 상기 누적된 채택 정보를 바탕으로 답변 채택 우선순위를 설정하는 단계; 및 상기 제어부가 상기 답변 채택 우선순위를 반영하여 데이터베이스부를 업데이트하고, 또한 상기 답변 채택 우선순위가 높은 답변 형태를 학습한 후, 이후의 답변 문장 생성 시 상기 학습한 결과를 반영한 형태로 답변 문장을 생성하는 단계;를 더 포함하는 것을 특징으로 한다.In the present invention, the control unit accumulating the adoption information for each sentence of the response selected by the chatbot; Setting, by the control unit, a priority of answer adoption based on the accumulated adoption information; And the control unit updates the database unit by reflecting the priority of adopting the answer, and after learning the answer type having the highest answer adoption priority, generates a response sentence in a form that reflects the learned result when generating a subsequent response sentence. It characterized in that it further comprises a step of.
본 발명에 있어서, 상기 채택 정보는, 챗봇이 사용자와 대화 중 사용자 또는 시스템 관리자가 만족이나 불만족을 선택한 정보인 것을 특징으로 한다.In the present invention, the adoption information is characterized in that the chatbot is information that the user or system administrator selects satisfaction or dissatisfaction during a conversation with the user.
본 발명의 일 측면에 따르면, 본 발명은 전자책의 정보를 가공하여 도서 전문 챗봇 서비스를 위한 답변 데이터베이스를 자동으로 생성할 수 있도록 한다.According to an aspect of the present invention, the present invention enables to automatically generate an answer database for a book chatbot service by processing information of an e-book.
또한 본 발명의 다른 측면에 따르면, 본 발명은 사용자의 질문에 대한 답변의 오류율을 낮출 수 있도록 한다.In addition, according to another aspect of the present invention, the present invention makes it possible to lower the error rate of answering a user's question.
또한 본 발명의 다른 측면에 따르면, 본 발명은 다양한 분야의 새로 출판된 도서에 대해서도 사용자들과 가능한 한 정확하게 대화를 진행 할 수 있도록 한다.In addition, according to another aspect of the present invention, the present invention enables users to communicate with users as accurately as possible about newly published books in various fields.
또한 본 발명의 다른 측면에 따르면, 본 발명은 사용자와의 대화 내용을 바탕으로 사용자가 읽고 싶어 할 만한 도서를 추천할 수 있도록 한다.In addition, according to another aspect of the present invention, the present invention allows the user to recommend a book that the user may want to read based on the content of the conversation with the user.
도 1은 본 발명의 일 실시예에 따른 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템의 개략적인 구성을 보인 예시도.
도 2는 발명의 제1 실시예에 따른 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템의 제어 방법을 설명하기 위한 흐름도.
도 3은 상기 도 2에 있어서, 제어부가 검색한 키워드 정보가 포함된 복수의 문장을 대화식 답변 문장으로 조합하여 테이블 형태로 보인 예시도.
도 4는 본 발명의 제2 실시예에 따른 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템의 제어 방법을 설명하기 위한 흐름도.
도 5는 발명의 제3 실시예에 따른 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템의 제어 방법을 설명하기 위한 흐름도.
도 6은 상기 도 4에 있어서, 데이터베이스부에 저장된 각 답변 문장에서 추출한 모든 키워드들에 대한 등급과 분류 정보, 및 문장별 답변 채택 우선순위를 추가로 부가하여 업데이트한 답변 문장들을 보인 예시도.1 is an exemplary view showing a schematic configuration of a parsing system for a book information-based chatbot service according to an embodiment of the present invention.
2 is a flowchart illustrating a control method of a parsing system for a book information-based chatbot service according to a first embodiment of the present invention.
FIG. 3 is an exemplary view of FIG. 2 in which a plurality of sentences including keyword information searched by the control unit are combined into interactive answer sentences and shown in a table form.
4 is a flowchart illustrating a control method of a parsing system for a book information-based chatbot service according to a second embodiment of the present invention.
5 is a flowchart illustrating a control method of a parsing system for a book information-based chatbot service according to a third embodiment of the present invention.
FIG. 6 is an exemplary view of FIG. 4 showing updated answer sentences by additionally adding rating and classification information for all keywords extracted from each answer sentence stored in the database unit, and a response priority of each sentence.
이하, 첨부된 도면을 참조하여 본 발명에 따른 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템 및 그 제어 방법의 일 실시예를 설명한다. Hereinafter, an embodiment of a parsing system for a book information-based chatbot service according to the present invention and a control method thereof will be described with reference to the accompanying drawings.
이 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있다. 그러므로 이러한 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.In this process, the thickness of the lines or the size of components shown in the drawings may be exaggerated for clarity and convenience. In addition, terms to be described later are terms defined in consideration of functions in the present invention, which may vary according to a user's or operator's intention or practice. Therefore, the definition of these terms should be made based on the contents throughout the present specification.
도 1은 본 발명의 일 실시예에 따른 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템의 개략적인 구성을 보인 예시도이다.1 is an exemplary view showing a schematic configuration of a parsing system for a book information-based chatbot service according to an embodiment of the present invention.
도 1에 도시된 바와 같이, 본 실시예에 따른 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템(100)은, 도서 정보 입력부(110), 키워드 생성부(120), 제어부(130), 답변 문장 가공부(140), 및 데이터베이스부(150)를 포함한다.As shown in FIG. 1, the
상기 도서 정보 입력부(110)는 복수의 출판사(11, 12)에서 출판되는 전자책들을 수집하거나 입력받는다.The book
여기서 상기 전자책은 문자나 화상과 같은 정보를 전자 매체에 기록하여 서적처럼 이용할 수 있는 디지털 도서를 의미하는 것으로, 유무선 통신망을 통해 전달받아 컴퓨터나 휴대단말기로 그 내용을 읽고 보고 들을 수 있도록 한 디지털 도서를 의미한다. Here, the e-book refers to a digital book that can be used as a book by recording information such as text or images on an electronic medium, and is digitally transmitted and received through a wired or wireless communication network to read, view, and listen to the content on a computer or mobile terminal. Books.
상기 전자책의 형식은 다양한 종류가 있지만, 대표적으로 이퍼브(EPUB) 파일 구조(예 : 전자책.epub)를 갖는 전자책이 많으며, 이러한 EPUB 형식의 전자책에는 이에 포함된 모든 파일의 목록을 담고 있으면서 내비게이션 역할을 하는 파일(예 : content.opf) 및 책의 목차 정보(이 목차는 링크를 통해 상세정보와 연결됨)를 담고 있으면서 책의 순서(예 : 장, 절, 편 등)를 정해 주는 파일(예 : toc.ncx)을 기본적으로 포함한다.There are various types of e-books, but there are many e-books having an epub (EPUB) file structure (e.g., e-book.epub), and e-books in the EPUB format include a list of all files included therein. While it contains, it serves as a navigation file (eg content.opf) and the table of contents information of the book (this table of contents is linked to the detailed information through a link), while determining the order of the book (eg chapter, section, section, etc.) The file (eg toc.ncx) is included by default.
따라서 상기 도서 정보 입력부(110)는 상기 수집하거나 입력받은 전자책들의 분석이나 검색에 필요한 파일(예 : toc.ncx, content.opf 등)을 추출하여 상기 제어부(130)에 전달한다.Therefore, the book
이에 따라 상기 제어부(130)는 상기 도서 정보 입력부(110)에서 전달받은 파일(예 : toc.ncx, content.opf 등)을 파싱(parsing)하여, 각 전자책의 기본 정보, 목차 정보, 및 상세 정보를 바탕으로, 상기 전자책에 포함된 단어, 문장, 단락, 및 장(chapter)을 검색하여, 특정 분야의 도서에서 특정 주제(예 : 관리자나 챗봇 사용자가 지정하는 분야의 주제)에 대하여 대화할 수 있는 다양한 답변(예 : 단답형 답변, 단문형 답변, 장문형 답변 등)을 자동으로 미리 준비(생성)하고 학습한다. 이때 상기 학습은 시스템이 동작하는 한 지속적으로 이루어진다.Accordingly, the
예컨대 상기 제어부(130)의 도서 정보 파싱부(131)는 상기 도서 정보 입력부(110)에서 전달받은 파일(예 : toc.ncx, content.opf 등)을 파싱(parsing)하여, 각 전자책의 기본 정보, 목차 정보, 및 상세 정보를 분석한다.For example, the book
그리고 답변 생성부(132)는 상기 파싱된 각 전자책의 기본 정보, 목차 정보, 및 상세 정보를 바탕으로, 단어, 문장, 단락, 및 장(chapter)을 검색하여, 관리자가 미리 지정했거나 챗봇 대화중 사용자가 대화중 지정하는 특정 분야의 특정 주제에 대하여 대화할 수 있는 다양한 복수의 답변(예 : 단답형 답변, 단문형 답변, 장문형 답변 등)을 자동으로 준비(생성)한다(도 3 참조). In addition, the
이때 상기 자동으로 준비(생성)하는 복수의 답변은 미리 준비(생성)될 수 있고, 챗봇 대화 중 실시간으로 준비(생성)될 수도 있다.At this time, the plurality of answers automatically prepared (generated) may be prepared (generated) in advance, or may be prepared (generated) in real time during a chatbot conversation.
한편 상기 키워드 생성부(120)는 상기 제어부(130)가 복수의 답변을 준비(생성)하기 위한 키워드 정보를 지정하거나 생성한다.Meanwhile, the
상기 키워드 정보는, 대화 분야, 대화 주제, 대화 목적, 및 대화 성향이 반영된 정보로서, 복수의 단어 형태로 입력될 수도 있고, 또는 문장 형태로 입력될 수도 있다(도 3의 키워드 참조).The keyword information is information reflecting a conversation field, a conversation topic, a conversation purpose, and a conversation tendency, and may be input in a plurality of word forms or in a sentence form (see keywords in FIG. 3).
이에 따라 상기 키워드 생성부(120)는 개발자(또는 시스템 관리자)(21)나 챗봇 대화중인 사용자(22)로부터 직접 키워드 정보를 입력받거나, 상기 개발자(또는 시스템 관리자)(21)나 챗봇 사용자(22)가 입력하는 문장에서 키워드 정보를 자동으로 추출할 수 있다. Accordingly, the
이때 상기 키워드 정보로 추출되는 정보(즉, 키워드)는 대화 분야, 대화 주제, 대화 목적, 및 대화 성향 중 적어도 어느 하나를 나타내는 정보이다.At this time, the information (ie, keyword) extracted as the keyword information is information indicating at least one of a conversation field, a conversation topic, a conversation purpose, and a conversation propensity.
따라서 상기 제어부(130)는 상기 키워드 생성부(120)에서 생성된(또는 지정되거나 추출된) 키워드 정보에 기초하여, 상기 키워드 정보에 관련된 도서들을 검색하고, 상기 검색된 도서들 중에서 단어, 문장, 단락, 및 장(chapter)을 검색하여, 상기 특정 분야의 특정 주제에 대하여 대화할 수 있는 다양한 복수의 답변(예 : 단답형 답변, 단문형 답변, 장문형 답변 등)을 자동으로 준비(생성)한다(도 3 참조). Therefore, the
한편 상기 키워드 생성부(120)에서 추출되거나 생성된 키워드 정보들은 상기 제어부(130)에서만 이용되는 것이 아니라, 상기 답변 문장 가공부(140)에서도 상기 키워드 정보들을 이용하여, 상기 제어부(130)에서 생성된 복수의 답변(또는 답변 문장)을 가공(또는 업데이트)한다.Meanwhile, keyword information extracted or generated by the
예컨대 상기 답변 문장 가공부(140)는 상기 데이터베이스부(150)에 저장되는 상기 복수의 답변(또는 답변 문장) 중 챗봇 사용자가 가장 원하는 답변(즉, 적중률이 높은 답변)이 챗봇에 의해 선택되어 대화의 답변으로서 출력될 수 있도록 가공(또는 업데이트)한다.For example, among the plurality of answers (or answer sentences) stored in the
다시 말해 상기 답변 문장 가공부(140)는 상기 제어부(130)에서 생성되어 상기 데이터베이스부(150)에 저장된 복수의 답변(또는 답변 문장)들 중 챗봇 사용자가 가장 원하는 답변(즉, 적중률이 높은 답변, 또는 사용자가 채택하는 횟수가 높은 답변)의 우선순위(또는 채택 등급)를 조정하는 기능을 수행한다. In other words, among the plurality of answers (or answer sentences) generated by the
또한 상기 답변 문장 가공부(140)는 상기 챗봇의 답변 선택을 돕기 위한 부가 정보(예 : 키워드 등급(즉, 우선순위)&분류(즉, 개체구, 의미구))를 상기 데이터베이스부(150)에 메타 데이터 형태로 추가하는 업데이트를 수행할 수 있다.In addition, the answer
참고로 상기 키워드 등급은, 목적어, 주어, 동사, 및 보어의 순서로, 자주 언급된 단어를 우선으로 키워드의 등급이 상위로 지정될 수 있다.For reference, in the order of the keyword, the object, the subject, the verb, and the bore, the ranking of the keyword may be designated as a higher priority with the frequently mentioned words first.
한편 상기와 같이 상기 답변 문장 가공부(140)에서 답변(또는 답변 문장)들이 가공(또는 데이터베이스부 업데이트)되면, 상기 조정된 문장 우선순위 정보를 상기 제어부(130)가 학습한다.On the other hand, when the answers (or answer sentences) are processed (or updated in the database) in the answer
이에 따라 상기 제어부(140)는 상기 학습 이후의 답변(또는 답변 문장) 생성 시 상기 학습한 결과를 반영한 답변을 생성할 수 있게 된다.Accordingly, the
이때 설명의 편의상 본 실시예에서는 상기 키워드 생성부(120) 및 상기 답변 문장 가공부(140)를 별도의 구성요소로서 설명하지만, 실질적으로는 상기 제어부(130)가 상기 키워드 생성부(120) 및 상기 답변 문장 가공부(140)의 기능을 포함하여 수행할 수도 있음에 유의한다. 또한 상기 제어부(130)는 씨피유(CPU)가 포함된 컴퓨터나 서버의 형태로 구현될 수 있다.At this time, for convenience of explanation, in the present embodiment, the
이하 도 2 내지 도 6을 참조하여, 상기 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템의 동작에 대해서 설명한다.Hereinafter, an operation of the parsing system for the book information-based chatbot service will be described with reference to FIGS. 2 to 6.
도 2는 발명의 제1 실시예에 따른 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템의 제어 방법을 설명하기 위한 흐름도이다.2 is a flowchart illustrating a control method of a parsing system for a book information-based chatbot service according to a first embodiment of the present invention.
도 2를 참조하면, 제어부(130)는 개발자(또는 시스템 관리자)(21)나 챗봇 대화중인 사용자(22)로부터 직접 키워드 정보를 입력받거나, 상기 개발자(또는 시스템 관리자)(21)나 챗봇 사용자(22)가 입력하는 문장에서 키워드 정보를 자동으로 추출하는 방식으로, 복수의 답변을 준비(생성)하기 위한 키워드 정보를 지정하거나 생성할 수 있다(S101).Referring to FIG. 2, the
여기서 상기 키워드 정보는, 대화 분야, 대화 주제, 대화 목적, 및 대화 성향이 반영된 정보로서, 복수의 단어 형태로 입력될 수도 있고, 또는 문장 형태로 입력될 수도 있다(도 3의 키워드 참조).Here, the keyword information is information reflecting a conversation field, a conversation topic, a conversation purpose, and a conversation tendency, and may be input in a plurality of word forms or in a sentence form (see keywords in FIG. 3).
상기와 같이 복수의 답변을 준비(생성)하기 위한 키워드 정보를 지정하거나 생성되면, 상기 제어부(130)는 상기 키워드 정보를 기반으로 전자책들의 정보(예 : 기본 정보, 목차 정보, 상세 정보)를 분석하여, 상기 답변을 준비(생성)하기 위한 특정 전자책 및 해당 전자책의 특정 영역을 검색하여 지정한다(S102).When keyword information for preparing (creating) a plurality of answers is designated or generated as described above, the
또한 상기 제어부(130)는 상기 특정 전자책 및 해당 전자책의 지정된 특정 영역(예 : 단어, 문장, 단락, 및 장(chapter) 등)의 텍스트 정보 중 상기 키워드 정보를 적어도 하나 이상 포함한 문장을 검색한다(S103).In addition, the
이때 상기 키워드 정보를 적어도 하나 이상 포함한 문장은 하나가 검색될 수도 있고, 더 많은 문장이 검색될 수도 있다. 또한 상기 검색된 문장은 길이가 짧은 문장 형태(예 : 단문 형태)일 수도 있고, 길이가 더 긴 문장 형태(예 : 장문 형태)일 수도 있다(도 3 참조).At this time, one sentence including at least one or more of the keyword information may be searched, or more sentences may be searched. In addition, the searched sentence may be a short sentence form (eg, a short sentence form) or a longer sentence form (eg, a long sentence form) (see FIG. 3).
이에 따라 상기 제어부(130)는 상기 검색된 복수의 문장, 및 상기 문장들을 미리 지정된 방식으로 조합하여 복수의 답변(또는 답변 문장)을 자동으로 생성한다(S104)(도 3 참조).Accordingly, the
이때 도면에는 구체적으로 도시되어 있지 않지만, 상기 생성된 답변(또는 답변 문장)들은 대화식 답변 문장(또는 대화체)로 보정될 수 있다.In this case, although not specifically shown in the drawings, the generated answers (or answer sentences) may be corrected to an interactive answer sentence (or dialog).
도 3은 상기 도 2에 있어서, 제어부가 검색한 키워드 정보가 포함된 복수의 문장을 대화식 답변 문장으로 조합하여 테이블 형태로 보인 예시도이다.FIG. 3 is an exemplary view of FIG. 2 in which a plurality of sentences including keyword information searched by the control unit are combined into interactive answer sentences and shown in a table form.
도 3에 도시된 바와 같이, 4개의 문장(예 : 1,2,3,4번 문장)이 검색되었다고 가정할 때, 1,2,3,4번 문장은 단문형 문장이고, 5,6번 문장은 상기 단문형 문장들을 조합하여 생성한 장문형 문장이다. 이때 상기 복수의 문장들을 조합하여 생성하는 장문형 문장은 예시된 것보다 더 많이 생성될 수 있다.As shown in FIG. 3, assuming that four sentences (eg, 1,2,3,4 sentences) are searched,
또한 상기 제어부(130)는 상기 생성된 복수의 답변(또는 답변 문장)을 데이터베이스부(150)에 저장한다(S105).In addition, the
이에 따라 챗봇(미도시)은 상기 데이터베이스부(150)에 저장된 복수의 답변(또는 답변 문장) 중 사용자와의 대화 상황에 따라 가장 적절한 답변을 선택하여 대화를 진행해야 한다. 하지만 현재 상태로는 상기 챗봇이 상기 데이터베이스부(150)에 저장된 복수의 답변(또는 답변 문장) 중 상황별(즉, 사용자의 질문의 의도에 따른) 가장 적절한 답변이 무엇인지 알 수 없기 때문에, 결과적으로 상기 챗봇(미도시)은 상기 데이터베이스부(150)에 저장된 답변(또는 답변 문장) 중 어느 하나를 랜덤 방식으로 선택하는 것과 마찬가지의 결과가 된다.Accordingly, the chatbot (not shown) should select the most appropriate answer according to the conversation situation with the user among a plurality of answers (or response sentences) stored in the
따라서 상기 제어부(130)는 상기 챗봇(미도시)이 상황별(즉, 사용자의 질문의 의도에 따른) 가장 적절한 답변을 선택할 수 있도록 하기 위하여, 상기 데이터베이스부(150)에 저장되는 답변(또는 답변 문장)을 가공할 필요가 있다.Therefore, the
도 4는 본 발명의 제2 실시예에 따른 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템의 제어 방법을 설명하기 위한 흐름도로서, 보다 상세하게는 상기 챗봇(미도시)이 상황별(즉, 사용자의 질문의 의도에 따른) 가장 적절한 답변을 선택할 수 있도록 하기 위하여, 상기 데이터베이스부(150)에 저장되는 답변(또는 답변 문장)들에 대한 부가 정보(즉, 챗봇이 답변을 선택하는 데 반영할 수 있는 부가 정보)를 추가하여 상기 데이터베이스부(150)를 업데이트하는 방법을 설명하기 위한 흐름도이다.4 is a flowchart for explaining a control method of a parsing system for a book information-based chatbot service according to a second embodiment of the present invention, and more specifically, the chatbot (not shown) is context-specific (that is, the user's In order to be able to select the most appropriate answer (depending on the intention of the question), additional information about the answers (or answer sentences) stored in the database unit 150 (that is, the chatbot can reflect in selecting the answer) It is a flow chart for explaining a method of updating the
도 4를 참조하면, 상기 제어부(130)는 상기 생성된 복수의 답변(또는 답변 문장)을 입력받고(S201), 상기 복수의 답변(또는 답변 문장)에서 각기 핵심 키워드를 추가로 추출한다(S202).Referring to FIG. 4, the
예컨대 상기 복수의 답변(또는 답변 문장)은 키워드 정보를 적어도 하나 이상 포함한 문장이 검색된 것이므로, 상기 검색된 문장에는 상기 키워드 정보 이외에도 더 많은 단어(즉, 키워드로 사용할 수 있는 단어)가 포함되어 문장을 이루고 있다. 따라서 상기 제어부(130)는 상기 답변(또는 답변 문장)에 포함된 적어도 하나 이상의 핵심 키워드를 추가로 추출한다. 이때 상기 적어도 하나 이상의 핵심 키워드에는 기존에 포함되어 있던 키워드 정보를 포함한다.For example, since the plurality of answers (or answer sentences) is a sentence containing at least one keyword information, the searched sentence includes more words (ie, words that can be used as keywords) in addition to the keyword information to form a sentence. have. Therefore, the
상기와 같이 제어부(130)가 생성한 복수의 답변(또는 답변 문장)에서 각기 핵심 키워드가 추가로 추출되면, 각 답변(또는 답변 문장)별 키워드의 등급(즉, 우선순위)을 설정하고, 또한 개체구와 의미구로 분류한다(S203)(도 6 참조). When a key keyword is additionally extracted from a plurality of answers (or answer sentences) generated by the
도 6은 상기 도 4에 있어서, 데이터베이스부에 저장된 각 답변 문장에서 추출한 모든 키워드들에 대한 등급과 분류 정보, 및 문장별 답변 채택 우선순위를 추가로 부가하여 업데이트한 답변 문장들을 보인 예시도이다.FIG. 6 is an exemplary diagram illustrating updated answer sentences by additionally adding rating and classification information for all keywords extracted from each answer sentence stored in the database unit, and a response priority of each sentence, in FIG. 4.
다만 상기 도 6에서는 상기 키워드의 등급(즉, 우선순위), 및 개체구와 의미구를 분류하는 표시는 구체적으로 도시하지는 않았으나, 이는 챗봇(미도시)에서 참조 가능한 메타 데이터 형태로 부가될 수 있기 때문이다. However, in FIG. 6, the class of the keyword (that is, priority) and the indications for classifying the individual phrase and the semantic phrase are not specifically illustrated, but this may be added in the form of metadata that can be referenced by a chatbot (not shown). to be.
상기와 같이 데이터베이스부(150)에 저장된 각 답변(또는 답변 문장)에서 추출한 키워드들(즉, 추가로 추출된 핵심 키워드를 포함한 키워드)에 등급(즉, 우선순위) 설정, 및 개체구와 의미구로 분류가 완료되면, 상기 각 답변 문장별 키워드 등급 및 분류를 적용하여(예 : 키워드의 등급 정보, 및 개체구와 의미구의 분류 정보를 메타 데이터 형태로 부가하여) 데이터베이스부(150)를 업데이트 한다(S204).Setting the rating (i.e., priority) to keywords extracted from each answer (or answer sentence) stored in the
그러나 상기와 같이 데이터베이스부(150)에 부가정보(즉, 챗봇이 답변을 선택하는 데 반영할 수 있는 부가 정보로서, 예컨대 키워드의 등급 정보, 및 개체구와 의미구의 분류 정보를 메타 데이터 형태로 부가하는 정보)를 추가하여 업데이트한다고 하더라도, 상기 부가정보를 참조하여 챗봇(미도시)이 선택한 답변에 대한 채택율(즉 사용자가 주로 원하는 문장 형태의 답변)이 높다고 보장할 수는 없다. 즉, 상기 답변의 채택율은 사용자의 대화 성향에 따라 달라질 수 있기 때문이다.However, as described above, additional information (that is, additional information that the chatbot can reflect in selecting an answer) is added to the
따라서 상기 채택율(즉 사용자가 주로 원하는 문장 형태의 답변)을 반영하기 위해서, 상기 데이터베이스부(150)에 저장되는 답변(또는 답변 문장)에 대하여 채택 우선순위를 반영하여 가공할 필요가 있다.Therefore, in order to reflect the adoption rate (ie, the answer in the form of a sentence mainly desired by the user), it is necessary to process the response (or answer sentence) stored in the
도 5는 발명의 제3 실시예에 따른 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템의 제어 방법을 설명하기 위한 흐름도로서, 보다 상세하게는 상기 챗봇(미도시)이 사용자가 원하는 문장형태(예 : 단문형, 중문형, 장문형 등)의 답변을 선택할 수 있도록 하기 위하여, 상기 데이터베이스부(150)에 저장되는 답변(또는 답변 문장)들에 대한 우선순위를 반영하여 상기 데이터베이스부(150)를 업데이트하는 방법을 설명하기 위한 흐름도이다.5 is a flowchart for explaining a control method of a parsing system for a book information-based chatbot service according to a third embodiment of the present invention, and more specifically, the chatbot (not shown) is a sentence form desired by a user (eg: In order to be able to select an answer of a short sentence type, a middle sentence type, a long sentence type, etc.), the
도 5를 참조하면, 상기 제어부(130)는 챗봇(미도시)이 선택한 답변(또는 답변 문장)별 채택 정보를 누적한다(S301).Referring to FIG. 5, the
예컨대 상기 채택 정보는, 챗봇(미도시)이 사용자와 대화 중 사용자(또는 개발자나 관리자)가 만족이나 불만족을 선택하는 정보를 의미한다.For example, the adoption information refers to information in which a chatbot (not shown) selects satisfaction or dissatisfaction by a user (or developer or administrator) during a conversation with the user.
상기와 같이 답변(또는 답변 문장)별 채택 정보가 누적되면, 상기 제어부(130)는 상기 누적된 채택 정보를 바탕으로 우선순위(즉, 답변 채택 우선순위)를 설정한다(S302).When the adoption information for each answer (or response sentence) is accumulated as described above, the
상기와 같이 답변(또는 답변 문장)별 우선순위(즉, 답변 채택 우선순위)가 설정되면, 상기 제어부(130)는 상기 우선순위(즉, 답변 채택 우선순위)를 반영하여 데이터베이스부(150)를 업데이트하고, 또한 상기 우선순위(즉, 답변 채택 우선순위)가 높은 답변 형태(예 : 단답형, 단문형, 장문형 등)를 학습하여 이후의 답변(또는 답변 문장) 생성 시 상기 학습한 결과를 반영한 형태로 답변을 생성할 수 있도록 한다(S303)(도 6 참조).When the priority (that is, the priority for adopting the answer) for each answer (or response sentence) is set as described above, the
예컨대 도 6을 참조하면, 상기 제어부(130)가 생성한 복수의 답변(또는 답변 문장) 중 답변 문장별 답변 채택 우선순위 정보가 메타 데이터 형태로 부가된다.For example, referring to FIG. 6, among the plurality of answers (or answer sentences) generated by the
이에 따라 챗봇(미도시)은 상기 답변 채택 우선순위 정보를 참조하여 답변을 선택하여 대화를 진행할 수 있게 됨으로써 사용자들과 좀 더 정확하고 완성도 있는 대화를 진행 할 수 있도록 한다.As a result, the chatbot (not shown) can select a response and proceed with a conversation by referring to the priority information for adopting the answer, thereby enabling a more accurate and complete conversation with the users.
상기와 같이 본 실시예는 전자책의 정보를 가공하여 도서 전문 챗봇 서비스를 위한 답변 데이터베이스를 자동으로 생성한 후, 사용자의 질문에 대한 답변의 오류율을 낮출 수 있도록 하기 위하여 부가정보를 부가하는 방식으로 상기 데이터베이스를 업데이트함으로써, 다양한 분야의 새로 출판된 도서에 대해서도 사용자들과 가능한 한 정확하게 대화를 진행 할 수 있도록 할 뿐만 아니라, 대화 내용을 바탕으로 사용자가 읽고 싶어 할 만한 도서를 쉽게 선택할 수 있도록 하는 효과가 있다.As described above, the present embodiment is a method of processing the information of the e-book and automatically generating an answer database for the book chatbot service, and then adding additional information in order to reduce the error rate of answering the user's question. By updating the above database, it is possible not only to communicate with users as accurately as possible about newly published books in various fields, but also to make it easy for users to select books that they want to read based on the contents of the conversation. There is.
이상으로 본 발명은 도면에 도시된 실시예를 참고로 하여 설명되었으나, 이는 예시적인 것에 불과하며, 당해 기술이 속하는 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 기술적 보호범위는 아래의 특허청구범위에 의해서 정하여져야 할 것이다.The present invention has been described above with reference to the embodiment shown in the drawings, but this is only exemplary, and those skilled in the art to which the art pertains may have various modifications and other equivalent embodiments. You will understand the point. Therefore, the technical protection scope of the present invention should be defined by the following claims.
11, 12 : 출판사 21 : 개발자
22 : 챗봇 사용자 110 : 도서 정보 입력부
120 : 키워드 생성부 130 : 제어부
131 : 도서 정보 파싱부 132 : 답변 생성부
140 : 답변 문장 가공부 150 : 데이터베이스부11, 12: Publisher 21: Developer
22: Chatbot user 110: Book information input unit
120: keyword generation unit 130: control unit
131: book information parsing unit 132: answer generating unit
140: answer sentence processing unit 150: database unit
Claims (15)
상기 도서 정보 입력부에서 전달받은 파일을 파싱(parsing)하여, 각 전자책의 기본 정보, 목차 정보, 및 상세 정보를 바탕으로, 각 전자책에 포함된 단어, 문장, 단락, 및 장을 검색하여, 지정된 특정 분야의 도서에서 특정 주제에 대하여 챗봇을 통해 대화할 수 있는 복수의 답변 문장을 자동으로 생성하는 상기 제어부; 및
상기 제어부에서 생성한 복수의 답변 문장을 저장하는 데이터베이스부;를 포함하는 것을 특징으로 하는 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템.
A book information input unit that collects or receives e-books, extracts at least one file necessary for analysis or search of each e-book, and transmits it to the control unit;
By parsing the file received from the book information input unit, searching for words, sentences, paragraphs, and chapters included in each e-book based on the basic information, table of contents information, and detailed information of each e-book, The control unit that automatically generates a plurality of response sentences that can be communicated through a chatbot on a specific subject in a book in a specific field; And
Parsing system for a book information-based chatbot service comprising a; database unit for storing a plurality of response sentences generated by the control unit.
상기 도서 정보 입력부에서 전달받은 파일을 파싱(parsing)하여, 각 전자책의 기본 정보, 목차 정보, 및 상세 정보를 분석하는 도서 정보 파싱부; 및
상기 파싱된 각 전자책의 기본 정보, 목차 정보, 및 상세 정보를 바탕으로, 단어, 문장, 단락, 및 장(chapter)을 검색하여, 관리자가 미리 지정했거나 챗봇 대화 중 사용자가 지정하는 특정 분야의 특정 주제에 대하여 챗봇을 통해 대화할 수 있는 다양한 문장 형태를 갖는 복수의 답변 문장을 자동으로 생성하는 답변 생성부;를 포함하는 것을 특징으로 하는 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템.
According to claim 1, The control unit,
A book information parsing unit parsing a file received from the book information input unit and analyzing basic information, table of contents information, and detailed information of each e-book; And
Based on the basic information, table of contents information, and detailed information of each parsed e-book, words, sentences, paragraphs, and chapters are searched for a specific field designated by an administrator in advance or designated by a user during a chatbot conversation. A parsing system for a book information-based chatbot service, comprising: an answer generation unit that automatically generates a plurality of response sentences with various sentence types that can communicate through a chatbot on a specific subject.
상기 복수의 답변 문장을 생성하기 위한 키워드 정보를 지정하거나 생성하는 키워드 생성부;를 더 포함하고,
상기 키워드 정보는,
대화 분야, 대화 주제, 대화 목적, 및 대화 성향이 반영된 정보로서,
시스템 관리자나 챗봇 사용자로부터 복수의 단어 형태로 입력되거나 문장 형태로 입력되는 것을 특징으로 하는 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템.
According to claim 1, The control unit,
It further includes a keyword generator for designating or generating keyword information for generating the plurality of response sentences,
The keyword information,
Information that reflects the field of conversation, the topic of conversation, the purpose of conversation, and the nature of conversation
A parsing system for a book information-based chatbot service, characterized in that it is input in the form of multiple words or sentences from a system administrator or a chatbot user.
상기 데이터베이스부에 저장된 복수의 답변 문장 중 챗봇 사용자가 가장 원하는 답변 문장의 우선순위를 답변 문장별로 조정하는 답변 문장 가공부;를 더 포함하고,
상기 챗봇 사용자가 가장 원하는 답변 문장은,
적중률이 높은 답변 문장이거나 챗봇 사용자가 채택하는 횟수가 높은 답변 문장인 것을 특징으로 하는 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템.
According to claim 1, The control unit,
The response sentence processing unit further adjusts the priority of the response sentence desired by the chatbot user among response sentences stored in the database unit for each response sentence.
The response sentence most desired by the chatbot user is,
A parsing system for book information-based chatbot services, characterized in that the response sentences with a high hit rate or the response sentences with a high number of times adopted by the chatbot user.
챗봇의 답변 문장 선택을 돕기 위하여,
데이터베이스부에 저장된 각 답변 문장들의 키워드에 대한 등급을 부가 정보로서 메타 데이터 형태로 추가하는 데이터베이스부 업데이트를 수행하며,
상기 키워드 등급은,
목적어, 주어, 동사, 및 보어의 순서로, 자주 언급된 단어를 우선으로 키워드의 등급이 상위로 지정되는 것을 특징으로 하는 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템.
The method of claim 4, wherein the control unit,
To help the chatbot choose the answer sentence,
Updates the database section that adds the ratings for keywords of each answer sentence stored in the database section as metadata as additional information,
The keyword rating,
A parsing system for a book information-based chatbot service, characterized in that a keyword is ranked as a higher priority in order of object, subject, verb, and bore, frequently mentioned words.
데이터베이스부에 저장된 답변 문장들의 우선순위 정보가 조정되면 데이터베이스부를 업데이트 하고, 또한
상기 우선순위 정보가 조정된 답변 문장들의 형태를 학습한 후,
이후의 답변 문장 생성 시 상기 학습한 결과를 반영한 답변 문장을 생성하는 것을 특징으로 하는 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템.
The method of claim 4, wherein the control unit,
When priority information of response sentences stored in the database unit is adjusted, the database unit is updated, and
After learning the types of response sentences in which the priority information is adjusted,
A parsing system for a book information-based chatbot service characterized by generating an answer sentence reflecting the learned result when generating a response sentence.
씨피유(CPU)가 포함된 컴퓨터나 서버의 형태로 구현되는 것을 특징으로 하는 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템.
According to claim 1, The control unit,
A parsing system for a book information-based chatbot service, characterized in that it is implemented in the form of a computer or server containing a CPU.
상기 제어부가 상기 키워드 정보를 기반으로 전자책들의 정보를 분석하여, 상기 답변 문장을 생성하기 위한 특정 전자책 및 해당 전자책의 특정 영역을 검색하여 지정하는 단계;
상기 제어부가 상기 특정 전자책 및 해당 전자책의 지정된 특정 영역의 텍스트 정보 중 상기 키워드 정보를 적어도 하나 이상 포함한 문장을 검색하는 단계; 및
상기 제어부가 상기 검색된 복수의 문장, 및 상기 문장들을 미리 지정된 방식으로 조합하여 복수의 답변 문장을 생성한 후 대화체로 보정하여 데이터베이스부에 저장하는 단계;를 포함하는 것을 특징으로 하는 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템의 제어 방법.
The controller of the parsing system for the book information-based chatbot service designates or generates keyword information for generating a plurality of response sentences;
Analyzing, by the control unit, information on e-books based on the keyword information, searching and designating a specific e-book and a specific area of the e-book to generate the response sentence;
Searching for a sentence including at least one of the keyword information among text information of the specific e-book and a specific specific area of the e-book; And
The control unit generates a plurality of response sentences by combining the retrieved plurality of sentences and the sentences in a predetermined manner, and then corrects the dialogues and stores them in a database unit. Control method of parsing system for service.
대화 분야, 대화 주제, 대화 목적, 및 대화 성향이 반영된 정보로서,
상기 시스템과 관리자나 챗봇 사용자를 통해 복수의 단어 형태로 입력되거나 문장 형태로 입력되는 것을 특징으로 하는 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템의 제어 방법.
The method of claim 8, wherein the keyword information,
Information that reflects the field of conversation, the topic of conversation, the purpose of conversation, and the nature of conversation
Control method of the parsing system for book information-based chatbot service, characterized in that it is input in a plurality of word forms or sentence form through the system and the administrator or chatbot user.
기본 정보, 목차 정보, 및 상세 정보를 포함하는 것을 특징으로 하는 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템의 제어 방법.
The method of claim 8, wherein the information of the e-books,
A method of controlling a parsing system for a book information-based chatbot service comprising basic information, table of contents information, and detailed information.
적어도 하나가 검색되거나 더 많은 문장이 검색될 수 있으며, 또한
상기 검색된 문장은 길이가 짧은 문장 형태이거나 길이가 더 긴 문장 형태를 포함하는 것을 특징으로 하는 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템의 제어 방법.
The method of claim 8, wherein the sentence including at least one or more of the keyword information,
At least one or more sentences can be searched, and
The searched sentence is a short sentence type or includes a longer sentence type. A method of controlling a parsing system for a book information-based chatbot service.
상기 제어부가 상기 데이터베이스부에 저장된 복수의 답변 문장에서 각기 핵심 키워드를 추출하는 단계;
상기 제어부가 상기 각 답변 문장별 키워드의 등급을 설정하고, 또한 키워드를 개체구와 의미구로 분류하는 단계; 및
상기 각 답변 문장별 키워드 등급 및 분류 정보를 메타 데이터 형태로 생성한 부가 정보를 상기 데이터베이스부에 추가하는 업데이트를 수행하는 단계;를 더 포함하는 것을 특징으로 하는 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템의 제어 방법.
The method of claim 8,
Extracting key keywords from the plurality of answer sentences stored in the database unit by the control unit;
Setting, by the control unit, a keyword rating for each answer sentence, and classifying the keyword into a subject phrase and a meaning phrase; And
Parsing system for a book information-based chatbot service further comprising the step of performing an update to add additional information generated in the form of metadata for each response sentence keyword rating and classification information in the form of a database. Control method.
챗봇이 상기 데이터베이스부에 저장된 복수의 답변 문장들 중 상황에 적합한 답변을 선택하는 데 반영할 수 있는 정보인 것을 특징으로 하는 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템의 제어 방법.
The method of claim 12, wherein the additional information,
A control method of a parsing system for a book information-based chatbot service, characterized in that the chatbot is information that can be reflected in selecting a response suitable for a situation among a plurality of response sentences stored in the database unit.
상기 제어부가 챗봇이 선택한 답변 문장별 채택 정보를 누적하는 단계;
상기 제어부가 상기 누적된 채택 정보를 바탕으로 답변 채택 우선순위를 설정하는 단계; 및
상기 제어부가 상기 답변 채택 우선순위를 반영하여 데이터베이스부를 업데이트하고, 또한 상기 답변 채택 우선순위가 높은 답변 형태를 학습한 후, 이후의 답변 문장 생성 시 상기 학습한 결과를 반영한 형태로 답변 문장을 생성하는 단계;를 더 포함하는 것을 특징으로 하는 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템의 제어 방법.
The method of claim 8,
Accumulating adoption information for each sentence of the response selected by the chatbot by the control unit;
Setting, by the control unit, a priority of answer adoption based on the accumulated adoption information; And
The control unit updates the database unit by reflecting the priority of adopting the answer, and after learning the answer form having the highest answer adoption priority, generates a response sentence in a form that reflects the learned result when generating a subsequent answer sentence. Step; Control method of the parsing system for a book information based chatbot service further comprising a.
챗봇이 사용자와 대화 중 사용자 또는 시스템 관리자가 만족이나 불만족을 선택한 정보인 것을 특징으로 하는 도서 정보 기반의 챗봇 서비스를 위한 파싱 시스템의 제어 방법.15. The method of claim 14, The adoption information,
A control method of a parsing system for a book information-based chatbot service characterized in that the chatbot is information that a user or a system administrator has selected satisfaction or dissatisfaction during a conversation with the user.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180112040A KR20200032873A (en) | 2018-09-19 | 2018-09-19 | Parsing system for chat bot service based on book information and control method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180112040A KR20200032873A (en) | 2018-09-19 | 2018-09-19 | Parsing system for chat bot service based on book information and control method thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20200032873A true KR20200032873A (en) | 2020-03-27 |
Family
ID=69959194
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180112040A KR20200032873A (en) | 2018-09-19 | 2018-09-19 | Parsing system for chat bot service based on book information and control method thereof |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20200032873A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210157770A (en) * | 2020-06-22 | 2021-12-29 | 송형석 | Optimized question and answer system and method thereof |
KR20220015129A (en) * | 2020-07-30 | 2022-02-08 | 예스이십사 주식회사 | Method and Apparatus for Providing Book Recommendation Service Based on Interactive Form |
KR20230132067A (en) | 2022-03-08 | 2023-09-15 | 주식회사 수동예림 | User-customized book curation system using book identification code and book curation method using the same |
-
2018
- 2018-09-19 KR KR1020180112040A patent/KR20200032873A/en active Search and Examination
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210157770A (en) * | 2020-06-22 | 2021-12-29 | 송형석 | Optimized question and answer system and method thereof |
KR20220015129A (en) * | 2020-07-30 | 2022-02-08 | 예스이십사 주식회사 | Method and Apparatus for Providing Book Recommendation Service Based on Interactive Form |
KR20230132067A (en) | 2022-03-08 | 2023-09-15 | 주식회사 수동예림 | User-customized book curation system using book identification code and book curation method using the same |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20200032893A (en) | Communication information processing system for chat bot service and control method thereof | |
US10162816B1 (en) | Computerized system and method for automatically transforming and providing domain specific chatbot responses | |
US9524291B2 (en) | Visual display of semantic information | |
CN109408622B (en) | Statement processing method, device, equipment and storage medium | |
US9703840B2 (en) | Handling information source ingestion in a question answering system | |
US8326829B2 (en) | System and method for displaying publication dates for search results | |
US7991724B2 (en) | Method and a computer program product for providing a response to a statement of a user | |
US20180157960A1 (en) | Scalable curation system | |
TW201921267A (en) | Method and system for generating a conversational agent by automatic paraphrase generation based on machine translation | |
US8930398B1 (en) | System and method for improving a resume according to a job description | |
CN106575292A (en) | Concept identification and capture of named entities for filling forms across applications | |
US20160196336A1 (en) | Cognitive Interactive Search Based on Personalized User Model and Context | |
US10326863B2 (en) | Speed and accuracy of computers when resolving client queries by using graph database model | |
US20160378853A1 (en) | Systems and methods for reducing search-ability of problem statement text | |
CN1936893A (en) | Method and system for generating input-method word frequency base based on internet information | |
US20210042300A1 (en) | Mapping data resources to requested teaching objectives | |
KR20200032873A (en) | Parsing system for chat bot service based on book information and control method thereof | |
EP3961426A2 (en) | Method and apparatus for recommending document, electronic device and medium | |
Lommatzsch et al. | An Information Retrieval-based Approach for Building Intuitive Chatbots for Large Knowledge Bases. | |
EP2673687A2 (en) | Visual display of semantic information | |
WO2022018676A1 (en) | Natural language enrichment using action explanations | |
US11379527B2 (en) | Sibling search queries | |
US20220391595A1 (en) | User discussion environment interaction and curation via system-generated responses | |
US10275487B2 (en) | Demographic-based learning in a question answering system | |
EP2261818A1 (en) | A method for inter-lingual electronic communication |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |