KR102578257B1 - Chatbot service construction and maintenance system - Google Patents

Chatbot service construction and maintenance system Download PDF

Info

Publication number
KR102578257B1
KR102578257B1 KR1020230069541A KR20230069541A KR102578257B1 KR 102578257 B1 KR102578257 B1 KR 102578257B1 KR 1020230069541 A KR1020230069541 A KR 1020230069541A KR 20230069541 A KR20230069541 A KR 20230069541A KR 102578257 B1 KR102578257 B1 KR 102578257B1
Authority
KR
South Korea
Prior art keywords
chatbot
external
data
response data
extracted
Prior art date
Application number
KR1020230069541A
Other languages
Korean (ko)
Inventor
김세원
Original Assignee
김세원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김세원 filed Critical 김세원
Priority to KR1020230069541A priority Critical patent/KR102578257B1/en
Application granted granted Critical
Publication of KR102578257B1 publication Critical patent/KR102578257B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/02User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/65Updates
    • G06Q50/30

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Computer Security & Cryptography (AREA)
  • Human Computer Interaction (AREA)
  • Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 인공지능 기반의 챗봇 모델을 구축하고, 빅데이터를 기반으로 챗봇 모델을 주기적으로 업데이트하는 챗봇 관리서버를 포함하는, 챗봇 서비스 구축 및 유지보수 시스템에 관한 것이다.The present invention relates to a chatbot service construction and maintenance system that includes a chatbot management server that builds an artificial intelligence-based chatbot model and periodically updates the chatbot model based on big data.

Description

챗봇 서비스 구축 및 유지보수 시스템{Chatbot service construction and maintenance system}Chatbot service construction and maintenance system {Chatbot service construction and maintenance system}

본 발명은 챗봇 서비스 구축 및 유지보수 시스템에 관한 것으로, 더욱 상세하게는 인공지능 기반의 챗봇 모델을 구축하고, 빅데이터를 기반으로 챗봇 모델을 주기적으로 업데이트하는 챗봇 서비스 구축 및 유지보수 시스템에 관한 것이다.The present invention relates to a chatbot service construction and maintenance system, and more specifically, to a chatbot service construction and maintenance system that builds an artificial intelligence-based chatbot model and periodically updates the chatbot model based on big data. .

오늘날 컴퓨터를 비롯한 정보통신 기술의 발달과 함께 인공지능(Artificial Intelligence; AI) 기술도 점차 발 달하여 현재는 다양한 분야에 응용되고 있다. 이와 같은 인공지능(AI)을 응용한 기술 중의 하나로 챗봇 (chatbot)이 있다. Today, with the development of computers and other information and communication technologies, artificial intelligence (AI) technology has also gradually developed and is currently being applied to various fields. One of the technologies that applies artificial intelligence (AI) is chatbot.

종래의 챗봇(chatbot)은 기업용 메신저에 채팅하듯 질문을 입력하면 인공지능(AI)이 빅데이터 분석 등을 바탕으로 일상 언어로 사람과 대화를 하며 해답을 주는 대화형 메신저를 말한다. 기업용 메신저 서비스를 제공하면서 업무용 스마트폰/PC의 사용 패턴을 분석하거나 업무상 주로 사용하는 언어 등 빅데이터를 수집해 자연어 처리 능력을 향상시킬 수 있기 때문에 IT 기업들의 경쟁이 치열해지고 있다. 이러한 챗봇 기능을 도입한 기업용 메신저는 별도의 앱을 실행하지 않고 채팅창에서 정보를 확인하고 처리할 수 있기 때문에 다양한 기능을 연결하는 플랫폼으로 활용할 수 있는 장점이 있다. A conventional chatbot is an interactive messenger that provides answers through artificial intelligence (AI), which talks to people in everyday language based on big data analysis, when you enter a question as if chatting on a corporate messenger. Competition among IT companies is intensifying because while providing corporate messenger services, natural language processing capabilities can be improved by analyzing usage patterns of business smartphones/PCs or collecting big data such as languages commonly used at work. Corporate messengers that adopt this chatbot function have the advantage of being able to use it as a platform to connect various functions because they can check and process information in the chat window without running a separate app.

한편, 전술한 배경 기술은 발명자가 본 발명의 도출을 위해 보유하고 있었거나, 본 발명의 도출 과정에서 습득한 기술 정보로서, 반드시 본 발명의 출원 전에 일반 공중에게 공개된 공지기술이라 할 수는 없다.Meanwhile, the above-mentioned background technology is technical information that the inventor possessed for deriving the present invention or acquired in the process of deriving the present invention, and cannot necessarily be said to be known technology disclosed to the general public before filing the application for the present invention. .

한국등록특허 제10-2445519호Korean Patent No. 10-2445519

본 발명의 일측면은 인공지능 기반의 챗봇 모델을 구축하고, 빅데이터를 기반으로 챗봇 모델을 주기적으로 업데이트하는 챗봇 서비스 구축 및 유지보수 시스템을 제공한다.One aspect of the present invention provides a chatbot service construction and maintenance system that builds an artificial intelligence-based chatbot model and periodically updates the chatbot model based on big data.

본 발명의 기술적 과제는 이상에서 언급한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.The technical problem of the present invention is not limited to the technical problem mentioned above, and other technical problems not mentioned will be clearly understood by those skilled in the art from the description below.

본 발명의 일 실시예에 따른 챗봇 서비스 구축 및 유지보수 시스템은 인공지능 기반의 챗봇 모델을 구축하고, 빅데이터를 기반으로 챗봇 모델을 주기적으로 업데이트하는 챗봇 관리서버를 포함한다.The chatbot service construction and maintenance system according to an embodiment of the present invention includes a chatbot management server that builds an artificial intelligence-based chatbot model and periodically updates the chatbot model based on big data.

상기 챗봇 관리서버는,The chatbot management server is,

사용자 단말로부터 수신되는 음성 또는 텍스트 형태의 질의어로부터 질문 데이터를 추출하고, 추출된 질문 데이터를 네트워크로 연결된 외부 검색엔진 및 외부 챗봇에 전송하여 외부 검색엔진 및 외부 챗봇로부터 수신된 응답 데이터를 구분하여 표시하는 챗봇 모델을 구축하는 챗봇 서비스 제공부; 및Question data is extracted from queries in the form of voice or text received from the user terminal, and the extracted question data is transmitted to a network-connected external search engine and external chatbot to display response data received from the external search engine and external chatbot separately. A chatbot service provider that builds a chatbot model that does the following; and

상기 챗봇 구축부에 의해 구축된 챗봇 모델을 주기적으로 업데이트하는 챗봇 업데이트부를 포함한다.It includes a chatbot update unit that periodically updates the chatbot model built by the chatbot construction unit.

상기 챗봇 서비스 제공부는,The chatbot service provider is,

하기 수학식을 이용하여 외부 검색엔진 및 외부 챗봇로부터 수신된 응답 데이터별 신뢰성 점수를 산출하고, 산출된 신뢰성 점수가 미리 설정된 기준값 이상인 응답 데이터만 표시하는 것을 특징으로 한다.The reliability score for each response data received from an external search engine and an external chatbot is calculated using the following equation, and only response data where the calculated reliability score is higher than a preset standard value is displayed.

[수학식][Equation]

여기서, TS는 신뢰성 점수, v_a는 질문 데이터로부터 추출된 키워드에 대한 임베딩 벡터, v_ri는 응답 데이터로부터 추출된 복수의 키워드 중 키워드i에 대한 임베딩 벡터, t는 응답 지연시간, u는 부적합 지수, w는 외부 검색엔진 및 외부 챗봇별로 상이하게 설정되는 가중치이다.Here, TS is the reliability score, v_a is the embedding vector for the keyword extracted from the question data, v_ri is the embedding vector for keyword i among the plurality of keywords extracted from the response data, t is the response delay time, u is the inappropriateness index, w is a weight that is set differently for each external search engine and external chatbot.

상술한 본 발명의 일측면에 따르면 사용자의 질의에 대한 신뢰성 있는 답변을 제공하는 챗봇 모델을 구축할 수 있으며, 이러한 챗봇 모델을 주기적으로 업데이트함으로써 유지보수에 소요되는 시간과 비용을 최소화할 수 있다.According to one aspect of the present invention described above, it is possible to build a chatbot model that provides reliable answers to user inquiries, and by periodically updating this chatbot model, the time and cost required for maintenance can be minimized.

도 1은 본 발명의 일 실시예에 따른 챗봇 서비스 구축 및 유지보수 시스템의 개략적인 구성이 도시된 도면이다.
도 2는 도 1에 도시된 챗봇 관리서버의 구체적인 구성이 도시된 도면이다.
Figure 1 is a diagram illustrating the schematic configuration of a chatbot service construction and maintenance system according to an embodiment of the present invention.
FIG. 2 is a diagram showing the specific configuration of the chatbot management server shown in FIG. 1.

후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예와 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.The detailed description of the present invention described below refers to the accompanying drawings, which show by way of example specific embodiments in which the present invention may be practiced. These embodiments are described in sufficient detail to enable those skilled in the art to practice the invention. It should be understood that the various embodiments of the present invention are different from one another but are not necessarily mutually exclusive. For example, specific shapes, structures and characteristics described herein may be implemented in one embodiment without departing from the spirit and scope of the invention. Additionally, it should be understood that the location or arrangement of individual components within each disclosed embodiment may be changed without departing from the spirit and scope of the invention. Accordingly, the detailed description that follows is not intended to be taken in a limiting sense, and the scope of the invention is limited only by the appended claims, together with all equivalents to what those claims assert, if properly described. Similar reference numbers in the drawings refer to identical or similar functions across various aspects.

이하, 도면들을 참조하여 본 발명의 바람직한 실시예들을 보다 상세하게 설명하기로 한다.Hereinafter, preferred embodiments of the present invention will be described in more detail with reference to the drawings.

도 1은 본 발명의 일 실시예에 따른 챗봇 서비스 구축 및 유지보수 시스템의 개략적인 구성이 도시된 도면이다.Figure 1 is a diagram illustrating the schematic configuration of a chatbot service construction and maintenance system according to an embodiment of the present invention.

본 발명에 따른 챗봇 서비스 구축 및 유지보수 시스템은 인공지능 기반의 챗봇 모델을 구축하여 사용자의 질의에 대한 신뢰성 있는 답변을 제공하는 챗봇 모델을 구축하고, 이러한 챗봇 모델을 주기적으로 업데이트함으로써 유지보수에 소요되는 시간과 비용을 최소화하는 것을 목적으로 한다.The chatbot service construction and maintenance system according to the present invention builds an artificial intelligence-based chatbot model to provide reliable answers to user inquiries, and periodically updates this chatbot model to reduce maintenance costs. The goal is to minimize time and cost.

구체적으로, 본 발명에 따른 챗봇 서비스 구축 및 유지보수 시스템은 사용자 단말(100) 및 챗봇 관리서버(200)를 포함한다.Specifically, the chatbot service construction and maintenance system according to the present invention includes a user terminal 100 and a chatbot management server 200.

사용자 단말(100)은 본 발명에 따른 챗봇 서비스 구축 및 유지보수 시스템을 이용하여 챗봇 서비스를 제공받기를 희망하는 사용자가 소지한 단말로, 외부 기기와 유무선 통신이 가능하며 정보의 입출력 및 처리가 가능한 스마트폰, PC, 노트북, 태블릿 PC, 웨어러블 디바이스 등과 같은 전자장치일 수 있다.The user terminal 100 is a terminal owned by a user who wishes to receive a chatbot service using the chatbot service construction and maintenance system according to the present invention, and is capable of wired and wireless communication with external devices and capable of inputting, outputting, and processing information. It may be an electronic device such as a smartphone, PC, laptop, tablet PC, wearable device, etc.

챗봇 관리서버(200)는 인공지능 기반의 챗봇 모델을 구축하고, 빅데이터를 기반으로 챗봇 모델을 주기적으로 업데이트한다.The chatbot management server 200 builds an artificial intelligence-based chatbot model and periodically updates the chatbot model based on big data.

도 2는 이러한 챗봇 관리서버(200)의 구체적인 구성이 도시된 도면이다.Figure 2 is a diagram showing the specific configuration of this chatbot management server 200.

도시된 바와 같이, 챗봇 관리서버(200)는 챗봇 서비스 제공부(210) 및 챗봇 업데이트부(220)를 포함한다.As shown, the chatbot management server 200 includes a chatbot service provision unit 210 and a chatbot update unit 220.

챗봇 서비스 제공부(210)는 Word2Vec 알고리즘이 구축된 인공 신경망을 이용하여 사용자 단말로부터 수신되는 음성 또는 텍스트 형태의 질의어로부터 질문 데이터를 추출한다.The chatbot service provider 210 extracts question data from a query in the form of voice or text received from the user terminal using an artificial neural network built with the Word2Vec algorithm.

Word2Vec 알고리즘은 신경망 언어 모델(NNLM : Neural Network Language Model)을 포함할 수 있다. 신경망 언어 모델은 기본적으로 Input Layer, Projection Layer, Hidden Layer, Output Layer로 이루어진 Neural Network이다. 신경망 언어 모델은 단어를 벡터화하는 방법에 사용되는 것이다. 신경망 언어 모델은 공지된 기술이므로 보다 자세한 설명은 생략하기로 한다.The Word2Vec algorithm may include a neural network language model (NNLM). A neural network language model is basically a neural network consisting of an input layer, projection layer, hidden layer, and output layer. Neural network language models are used to vectorize words. Since the neural network language model is a known technology, a more detailed description will be omitted.

Word2vec 알고리즘은, 텍스트마이닝을 위한 것으로, 각 단어 간의 앞, 뒤 관계를 보고 근접도를 정하는 알고리즘이다. Word2vec 알고리즘은 비지도 학습 알고리즘이다. Word2vec 알고리즘은 이름이 나타내는 바와 같이 단어의 의미를 벡터형태로 표현하는 계량기법일 수 있다. Word2vec 알고리즘은 각 단어를 200차원 정도의 공간에서 백터로 표현할 수 있다. Word2vec 알고리즘을 이용하면, 각 단어마다 단어에 해당하는 벡터를 구할 수 있다.The Word2vec algorithm is for text mining and is an algorithm that determines proximity by looking at the front and back relationships between each word. The Word2vec algorithm is an unsupervised learning algorithm. As the name indicates, the Word2vec algorithm can be a quantitative technique that expresses the meaning of words in vector form. The Word2vec algorithm can express each word as a vector in a space of about 200 dimensions. Using the Word2vec algorithm, you can obtain the vector corresponding to the word for each word.

Word2vec 알고리즘은 종래의 다른 알고리즘에 비해 자연어 처리 분야에서 비약적인 정밀도 향상을 가능하게 할 수 있다. Word2vec은 입력한 말뭉치의 문장에 있는 단어와 인접 단어의 관계를 이용해 단어의 의미를 학습할 수 있다. Word2vec 알고리즘은 인공 신경망에 근거한 것으로, 같은 맥락을 지닌 단어는 가까운 의미를 지니고 있다는 전제에서 출발한다. Word2vec 알고리즘은 텍스트 문서를 통해 학습을 진행하며, 한 단어에 대해 근처(전후 5 내지 10 단어 정도)에 출현하는 다른 단어들을 관련 단어로서 인공 신경망에 학습시킨다. 연관된 의미의 단어들은 문서상에서 가까운 곳에 출현할 가능성이 높기 때문에 학습을 반복해 나가는 과정에서 두 단어는 점차 가까운 벡터를 지닐 수 있다.The Word2vec algorithm can enable dramatic improvements in precision in the field of natural language processing compared to other conventional algorithms. Word2vec can learn the meaning of words using the relationships between words and adjacent words in sentences in the input corpus. The Word2vec algorithm is based on an artificial neural network and starts from the premise that words with the same context have close meanings. The Word2vec algorithm learns through text documents, and for one word, other words that appear nearby (about 5 to 10 words before or after it) are taught to the artificial neural network as related words. Because words with related meanings are likely to appear close together in a document, two words may have increasingly closer vectors during repeated learning.

Word2vec 알고리즘의 학습 방법은 CBOW(Continuous Bag Of Words) 방식과 skip-gram 방식이 있다. CBOW 방식은 주변 단어가 만드는 맥락을 이용해 타겟 단어를 예측하는 것이다. skip-gram 방식은 한 단어를 기준으로 주변에 올 수 있는 단어를 예측하는 것이다. 대규모 데이터셋에서는 skip-gram 방식이 더 정확한 것으로 알려져 있다.The learning methods of the Word2vec algorithm include the CBOW (Continuous Bag Of Words) method and the skip-gram method. The CBOW method predicts the target word using the context created by surrounding words. The skip-gram method predicts words that may come nearby based on one word. The skip-gram method is known to be more accurate in large datasets.

따라서, 본 발명의 실시 예에서는 skip-gram 방식을 이용한 Word2vec 알고리즘을 사용한다. 예컨대, Word2vec 알고리즘을 통해 학습이 잘 완료되면, 고차원 공간에서 비슷한 단어는 근처에 위치할 수 있다. 상술한 바와 같은 Word2vec 알고리즘에 따르면 학습 문서 내 주위 단어의 분포가 가까운 단어일수록 산출되는 벡터값은 유사해질 수 있으며, 산출된 벡터값이 비슷한 단어는 유사한 것으로 간주할 수 있다. Word2vec 알고리즘은 공지된 기술이므로 벡터값 계산과 관련한 보다 상세한 설명은 생략하기로 한다.Therefore, in the embodiment of the present invention, the Word2vec algorithm using the skip-gram method is used. For example, if learning is successfully completed through the Word2vec algorithm, similar words can be located nearby in a high-dimensional space. According to the Word2vec algorithm as described above, the closer the distribution of surrounding words in a learning document is, the more similar the calculated vector values can be, and words with similar calculated vector values can be considered similar. Since the Word2vec algorithm is a known technology, detailed descriptions related to vector value calculation will be omitted.

이와 같이, 챗봇 서비스 제공부(210)는 Word2Vec 알고리즘이 구축된 인공 신경망에 사용자 단말로부터 수신되는 음성 또는 텍스트 형태의 질의어를 입력하여 질문 데이터를 추출한다. 이러한 질문 데이터는 키워드와 같이 하나의 단어 형태일 수 있으나, 이에 한정되는 것은 아니며 연속된 두 단어 이상으로 이루어진 구(句)나 절(節) 형태 또는 하나의 문장 형태일 수도 있다.In this way, the chatbot service provider 210 extracts question data by inputting a query in the form of voice or text received from the user terminal into an artificial neural network in which the Word2Vec algorithm is built. Such question data may be in the form of a single word, such as a keyword, but is not limited to this and may be in the form of a phrase or clause consisting of two or more consecutive words, or a single sentence.

챗봇 서비스 제공부(210)는 추출된 질문 데이터를 네트워크로 연결된 외부 검색엔진 및 외부 챗봇에 전송하여 외부 검색엔진 및 외부 챗봇로부터 수신된 응답 데이터를 구분하여 표시하는 챗봇 모델을 구축한다.The chatbot service provider 210 transmits the extracted question data to an external search engine and an external chatbot connected to a network to build a chatbot model that distinguishes and displays response data received from the external search engine and external chatbot.

일 실시예에서, 상기 챗봇 서비스 제공부는 외부 검색엔진 및 외부 챗봇 각각으로부터 수신된 복수의 응답 데이터 중 신뢰성 있는 응답 데이터만 선별하기 위해, 하기 수학식 1을 이용하여 외부 검색엔진 및 외부 챗봇로부터 수신된 응답 데이터별 신뢰성 점수를 산출한다.In one embodiment, the chatbot service provider uses Equation 1 below to select only reliable response data among a plurality of response data received from each of the external search engine and external chatbot. Reliability scores are calculated for each response data.

[수학식 1][Equation 1]

여기서, TS는 신뢰성 점수, v_a는 질문 데이터로부터 추출된 키워드에 대한 임베딩 벡터, v_ri는 응답 데이터로부터 추출된 복수의 키워드 중 키워드i에 대한 임베딩 벡터, t는 응답 지연시간, u는 부적합 지수, w는 외부 검색엔진 및 외부 챗봇별로 상이하게 설정되는 가중치이다.Here, TS is the reliability score, v_a is the embedding vector for the keyword extracted from the question data, v_ri is the embedding vector for keyword i among the plurality of keywords extracted from the response data, t is the response delay time, u is the inappropriateness index, w is a weight that is set differently for each external search engine and external chatbot.

이와 같이, 챗봇 서비스 제공부(210)는 응답 데이터별로 신뢰성 점수를 산출하여, 산출된 신뢰성 점수가 미리 설정된 기준값 이상인 응답 데이터만 표시하는 것을 특징으로 한다. In this way, the chatbot service provider 210 calculates a reliability score for each response data and displays only response data where the calculated reliability score is greater than or equal to a preset reference value.

챗봇 서비스 제공부(210)는 신뢰성 점수가 기준값 이상인 응답 데이터가 복수개인 경우, 응답 데이터를 외부 검색엔진 및 외부 챗봇별로 구분하여 표시한다.When there is a plurality of response data with reliability scores greater than the standard value, the chatbot service provider 210 displays the response data separately by external search engine and external chatbot.

예를 들어, 챗봇 서비스 제공부(210)는 '내가 사는 지역의 맛집을 알려줘'라는 질의어에 대한 응답 데이터를 '구글 검색 결과로는 A 맛집을 추천하고, 네이버 검색 결과로는 B 맛집을 추천하고, 챗GPT 문의 결과로는 C 맛집을 추천합니다'등과 같은 형태로 응답할 수 있다.For example, the chatbot service provider 210 converts the response data to the query ‘Tell me about a restaurant in my area’ into ‘Recommend restaurant A as a Google search result, and recommend restaurant B as a Naver search result. , Chat GPT inquiry results can be answered in the form of ‘I recommend restaurant C’.

한편, 부적합 지수는 하기 수학식 2에 의해 산출되는 것을 특징으로 한다.Meanwhile, the nonconformity index is characterized by being calculated by Equation 2 below.

[수학식 2][Equation 2]

여기서, U는 부적합 지수, s_m은 부정 키워드 목록에 포함된 단어 개수, s_o는 긍정 키워드 목록에 포함된 단어 개수, s_t는 전체 단어 개수, bs는 응답 데이터로부터 추출된 복수의 키워드에 대한 임베딩 벡터간의 평균거리(라디안), n은 응답 데이터로부터 추출된 키워드의 개수, σ은 bs의 분산이다.Here, U is the misfit index, s_m is the number of words included in the negative keyword list, s_o is the number of words included in the positive keyword list, s_t is the total number of words, and bs is the distance between embedding vectors for multiple keywords extracted from response data. The average distance (radians), n is the number of keywords extracted from the response data, and σ is the variance of bs.

예를 들어, 응답 데이터를 구성하는 전체 단어의 개수가 20개, 단어들 중 부정 키워드에 해당되는 단어가 5개, 긍정 키워드에 해당되는 단어가 7개인 경우 n은 12가 되며, 여기에 bs가 3, σ가 0.2인 경우 u는 -2.07이며, 이러한 u의 값이 작을수록 해당 신뢰성 점수가 낮아질 수 있다.For example, if the total number of words that make up the response data is 20, and among the words, 5 words are negative keywords and 7 words are positive keywords, n is 12, and bs is 3, when σ is 0.2, u is -2.07, and the smaller the value of u, the lower the reliability score may be.

이와 같이, 챗봇 서비스 제공부(210)는 상술한 수학식 2를 이용하여 부적합 지수를 산출함으로써, 답변에 부적합한 응답 데이터의 신뢰성 점수를 감소시켜 결과적으로는 분석 결과의 신뢰성을 향상시킬 수 있다.In this way, the chatbot service provider 210 can calculate the unsuitability index using Equation 2 described above, thereby reducing the reliability score of response data that is inappropriate for the answer and ultimately improving the reliability of the analysis results.

챗봇 업데이트부(220)는 상기 챗봇 구축부에 의해 구축된 챗봇 모델을 주기적으로 업데이트한다.The chatbot update unit 220 periodically updates the chatbot model built by the chatbot construction unit.

이를 위해, 챗봇 업데이트부(220)는 인공 신경망을 학습시킬 수 있고, 학습이 완료된 인공 신경망을 이용할 수도 있다. 프로세서는 메모리에 저장된 인공 신경망을 학습시키거나 실행할 수 있고, 메모리는 학습 완료된 인공 신경망을 저장할 수 있다. 인공 신경망을 학습시키는 전자 장치와 이용하는 전자 장치는 동일할 수 있지만 별개일 수도 있다. 인공지능은 인간의 뇌의 기능을 일부 구현한 컴퓨터 시스템으로, 스스로 학습하고 추측하고 판단할 수 있다. 학습을 진행할수록 답을 추출할 확률이 높아질 수 있다. 인공지능은 학습과 그것을 이용한 요소 기술들로 구성될 수 있다. 인공지능의 학습은 입력 데이터를 바탕으로 특징을 분류와 학습을 하는 알고리즘 기술이고, 요소 기술들은 학습 알고리즘을 이용하여 인간의 뇌의 기능을 일부 구현하는 기술일 수 있다. To this end, the chatbot update unit 220 can train an artificial neural network or use a trained artificial neural network. The processor can train or execute an artificial neural network stored in memory, and the memory can store a trained artificial neural network. The electronic device that trains the artificial neural network and the electronic device that uses it may be the same, but may also be separate. Artificial intelligence is a computer system that implements some of the functions of the human brain and can learn, guess, and make decisions on its own. As learning progresses, the probability of extracting an answer may increase. Artificial intelligence can be composed of learning and elemental technologies using it. Artificial intelligence learning is an algorithmic technology that classifies and learns features based on input data, and elemental technologies may be technologies that implement some of the functions of the human brain using learning algorithms.

인공지능은 확률적으로 여러 답이 나올 수 있는 문제에 접근하기 쉬운 기술로써 어떠한 입력 데이터에 따르는 최적의 주기와 방법, 계획 등을 논리적이고 확률적으로 추론할 수 있다. 인공지능의 추론 기술은 입력 데이터를 판단하고 최적화 예측, 지식과 확률 기반 추론, 선호 기반 계획 등을 포함할 수 있다.Artificial intelligence is a technology that makes it easy to approach problems that can have multiple answers probabilistically, and can logically and probabilistically infer the optimal cycle, method, and plan according to any input data. Artificial intelligence's inference technology can include judging input data, optimization predictions, knowledge and probability-based reasoning, and preference-based planning.

인공신경망은 기계학습 분야의 학습 알고리즘 중 하나로 뇌의 뉴런과 시냅스의 연결을 프로그램으로 구현한 것이다. 인공신경망은 프로그램으로 신경망의 구조를 만든 다음 학습시켜 원하는 기능을 가지게 할 수 있다. 오차가 존재할 수 있지만 거대한 데이터를 바탕으로 학습하여 입력 데이터를 가지고 적절한 출력 데이터를 출력할 수 있다. 통계적으로 좋은 결과를 얻었던 출력 데이터를 획득할 수 있고 인간의 추론과 유사하다는 장점이 있다.Artificial neural network is one of the learning algorithms in the machine learning field and is a program that implements the connection between neurons and synapses in the brain. Artificial neural networks can be created through a program to create a neural network structure and then learn it to have the desired function. Although there may be errors, it is possible to learn based on huge data and output appropriate output data with input data. It has the advantage of being able to obtain output data with statistically good results and being similar to human reasoning.

챗봇 업데이트부(220)는 빅데이터를 기반으로 구축된 인공지능 알고리즘을 이용하여 학습에 요구되는 질의/응답 데이터셋을 구축할 수 있고, 이를 위해 미리 학습된 다수의 인공 신경망을 포함할 수 있다.The chatbot update unit 220 can build a question/answer dataset required for learning using an artificial intelligence algorithm built based on big data, and may include a number of artificial neural networks that have been trained in advance for this purpose.

본 실시예에서 중계서버는 기계 학습 알고리즘의 수행을 위하여 미리 학습된 다수의 인공 신경망을 포함할 수 있다. 기계 학습으로 입력 데이터를 바탕으로 출력 데이터를 출력하고 이것의 결과를 이용해 스스로 학습할 수도 있고 이로 인해 스스로 데이터 처리 능력이 향상될 수 있다. 인공 신경망은 입력 데이터를 바탕으로 특징을 추출하고 규칙성을 추측하여 결과데이터를 출력할 수 있고 이러한 과정이 쌓일수록 결과 데이터의 신뢰도가 높아지게 된다. In this embodiment, the relay server may include a number of pre-trained artificial neural networks to perform machine learning algorithms. With machine learning, you can output output data based on input data and use the results to learn on your own, which can improve your own data processing ability. Artificial neural networks can extract features based on input data, infer regularities, and output result data. As this process accumulates, the reliability of the result data increases.

본 실시예에서 인공 신경망은 질문의 종류, 질문의 길이, 키워드 개수, 질문의 중요도 중 적어도 하나 이상의 데이터로부터 응답 데이터를 출력하는 알고리즘일 수 있다. 인공 신경망은 빅데이터를 그대로 입력 데이터로 하거나 불필요한 데이터를 정리하는 처리 과정을 거친 후 입력 데이터로 하여 최상의 출력 데이터를 추론할 수 있다. In this embodiment, the artificial neural network may be an algorithm that outputs response data from at least one of the type of question, length of question, number of keywords, and importance of question. Artificial neural networks can infer the best output data using big data as input data or after going through a processing process to organize unnecessary data.

인공지능 기계 학습 모델은 학습 종류에 따라 Super Viser Learning(지도학습), UnSuper Viser Learning(비지도 학습), Semisupervised learning(반지도 학습), Reinforcement Learning(강화 학습) 등이 있다. 그리고 기계 학습 알고리즘으로 Decision Tree(의사 결정 트리), K-Nearest Neightbor, Artificial Neural Network(인공 신경망), Support Vector Machine, Ensemble Learning, Gradient Descent(기울기 하강법), Na

Figure 112023059713059-pat00004
ve Bayes Classifier, Hidden Markov Model, K-Means Clustering 등이 사용될 수 있다.Depending on the type of learning, artificial intelligence machine learning models include Super Viser Learning, UnSuper Viser Learning, Semisupervised Learning, and Reinforcement Learning. And machine learning algorithms include Decision Tree, K-Nearest Nearest Bor, Artificial Neural Network, Support Vector Machine, Ensemble Learning, Gradient Descent, Na
Figure 112023059713059-pat00004
ve Bayes Classifier, Hidden Markov Model, K-Means Clustering, etc. can be used.

인공 신경망은 입력 데이터에 포함될 수 있는 여러 입력 값들에 대해 미리 학습된 상태일 수 있다. 인공 신경망은 학습방식 중 하나인 reinforcement learning(강화 학습)에 따라 학습되는 인공 신경망일 수 있다. 강화 학습은 보수와 제한을 설정하여 점차 올바른 결과를 획득할 확률을 올려가는 방식이다. 인공 신경망은 Convelutional Neural Network(CNN, 합성곱 신경망)이나 Recurrent Neural Network(RNN, 순환 신경망)에 기반하여 모델링될 수도 있다.The artificial neural network may be pre-trained on various input values that may be included in the input data. An artificial neural network may be an artificial neural network that is learned according to reinforcement learning, one of the learning methods. Reinforcement learning is a method of gradually increasing the probability of obtaining the correct result by setting rewards and limits. Artificial neural networks can also be modeled based on Convelutional Neural Network (CNN) or Recurrent Neural Network (RNN).

이와 같이, 챗봇 업데이트부(220)는 빅데이터 및 인공 신경망을 이용하여 챗봇 모델을 주기적으로 업데이트할 수 있다.In this way, the chatbot update unit 220 can periodically update the chatbot model using big data and artificial neural networks.

이와 같은, 본 발명에 따른 기술은 애플리케이션으로 구현되거나 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.As such, the technology according to the present invention may be implemented as an application or in the form of program instructions that can be executed through various computer components and recorded on a computer-readable recording medium. The computer-readable recording medium may include program instructions, data files, data structures, etc., singly or in combination.

상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거니와 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다.The program instructions recorded on the computer-readable recording medium may be those specifically designed and configured for the present invention, or may be known and usable by those skilled in the computer software field.

컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD 와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tapes, optical recording media such as CD-ROMs and DVDs, and magneto-optical media such as floptical disks. media), and hardware devices specifically configured to store and perform program instructions, such as ROM, RAM, flash memory, etc.

프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Examples of program instructions include not only machine language code such as that created by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like. The hardware device may be configured to operate as one or more software modules to perform processing according to the invention and vice versa.

이상에서는 실시예들을 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구범위에 기재된 본 발명의 사상 및 공간으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.Although the above has been described with reference to embodiments, those skilled in the art will understand that various modifications and changes can be made to the present invention without departing from the spirit and space of the present invention as set forth in the following patent claims. You will be able to.

210: 챗봇 서비스 제공부
220: 챗봇 업데이트부
210: Chatbot service provision department
220: Chatbot update unit

Claims (3)

인공지능 기반의 챗봇 모델을 구축하고, 빅데이터를 기반으로 챗봇 모델을 주기적으로 업데이트하는 챗봇 관리서버를 포함하는, 챗봇 서비스 구축 및 유지보수 시스템에 있어서,
상기 챗봇 관리서버는,
사용자 단말로부터 수신되는 음성 또는 텍스트 형태의 질의어로부터 질문 데이터를 추출하고, 추출된 질문 데이터를 네트워크로 연결된 외부 검색엔진 및 외부 챗봇에 전송하여 외부 검색엔진 및 외부 챗봇로부터 수신된 응답 데이터를 구분하여 표시하는 챗봇 모델을 구축하는 챗봇 서비스 제공부; 및
상기 챗봇 서비스 제공부에 의해 구축된 챗봇 모델을 주기적으로 업데이트하는 챗봇 업데이트부를 포함하고,
상기 챗봇 서비스 제공부는,
하기 수학식 1을 이용하여 외부 검색엔진 및 외부 챗봇로부터 수신된 응답 데이터별 신뢰성 점수를 산출하고, 산출된 신뢰성 점수가 미리 설정된 기준값 이상인 응답 데이터만 표시하는 것을 특징으로 하는, 챗봇 서비스 구축 및 유지보수 시스템.

[수학식 1]

여기서, TS는 신뢰성 점수, v_a는 질문 데이터로부터 추출된 키워드에 대한 임베딩 벡터, v_ri는 응답 데이터로부터 추출된 복수의 키워드 중 키워드i에 대한 임베딩 벡터, t는 응답 지연시간, u는 하기 수학식 2에 의해 산출되는 부적합 지수, w는 외부 검색엔진 및 외부 챗봇별로 상이하게 설정되는 가중치이다.

[수학식 2]


여기서, u는 부적합 지수, s_m은 부정 키워드 목록에 포함된 단어 개수, s_o는 긍정 키워드 목록에 포함된 단어 개수, s_t는 전체 단어 개수, bs는 응답 데이터로부터 추출된 복수의 키워드에 대한 임베딩 벡터간의 평균거리(라디안), n은 응답 데이터로부터 추출된 키워드의 개수, σ은 bs의 분산이다.

In a chatbot service construction and maintenance system that includes a chatbot management server that builds an artificial intelligence-based chatbot model and periodically updates the chatbot model based on big data,
The chatbot management server is,
Question data is extracted from queries in the form of voice or text received from the user terminal, and the extracted question data is transmitted to a network-connected external search engine and external chatbot to display response data received from the external search engine and external chatbot separately. A chatbot service provider that builds a chatbot model that does the following; and
It includes a chatbot update unit that periodically updates the chatbot model built by the chatbot service provider,
The chatbot service provider is,
Building and maintaining a chatbot service, characterized by calculating a reliability score for each response data received from an external search engine and an external chatbot using Equation 1 below, and displaying only response data where the calculated reliability score is higher than a preset standard value. system.

[Equation 1]

Here, TS is the reliability score, v_a is the embedding vector for the keyword extracted from the question data, v_ri is the embedding vector for keyword i among the plurality of keywords extracted from the response data, t is the response delay time, and u is the following Equation 2 The nonconformity index calculated by , w, is a weight set differently for each external search engine and external chatbot.

[Equation 2]


Here, u is the misfit index, s_m is the number of words included in the negative keyword list, s_o is the number of words included in the positive keyword list, s_t is the total number of words, and bs is the distance between embedding vectors for multiple keywords extracted from response data. The average distance (radians), n is the number of keywords extracted from the response data, and σ is the variance of bs.

삭제delete 삭제delete
KR1020230069541A 2023-05-30 2023-05-30 Chatbot service construction and maintenance system KR102578257B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020230069541A KR102578257B1 (en) 2023-05-30 2023-05-30 Chatbot service construction and maintenance system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020230069541A KR102578257B1 (en) 2023-05-30 2023-05-30 Chatbot service construction and maintenance system

Publications (1)

Publication Number Publication Date
KR102578257B1 true KR102578257B1 (en) 2023-09-12

Family

ID=88019584

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230069541A KR102578257B1 (en) 2023-05-30 2023-05-30 Chatbot service construction and maintenance system

Country Status (1)

Country Link
KR (1) KR102578257B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102621683B1 (en) * 2023-09-15 2024-01-04 강나영 Customer response system using artificial intelligence

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180126357A (en) * 2017-05-17 2018-11-27 주식회사 에이아이리소프트 An appratus and a method for processing conversation of chatter robot
KR20190055425A (en) * 2017-11-15 2019-05-23 (주)페르소나시스템 Apparatus for adding data for chatbot based on machine learning
US20200382450A1 (en) * 2019-05-31 2020-12-03 International Business Machines Corporation Virtual agent chat model updates
KR20210142560A (en) * 2020-05-18 2021-11-25 권영훈 Communication system providing chatbot service
KR20220111570A (en) * 2021-02-02 2022-08-09 삼성전자주식회사 The electronic device for processing the user's inquiry and the method for operating the same
KR102445519B1 (en) 2020-06-25 2022-09-21 (주)아크릴 System and method for manufacturing conversational intelligence service providing chatbot

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180126357A (en) * 2017-05-17 2018-11-27 주식회사 에이아이리소프트 An appratus and a method for processing conversation of chatter robot
KR20190055425A (en) * 2017-11-15 2019-05-23 (주)페르소나시스템 Apparatus for adding data for chatbot based on machine learning
US20200382450A1 (en) * 2019-05-31 2020-12-03 International Business Machines Corporation Virtual agent chat model updates
KR20210142560A (en) * 2020-05-18 2021-11-25 권영훈 Communication system providing chatbot service
KR102445519B1 (en) 2020-06-25 2022-09-21 (주)아크릴 System and method for manufacturing conversational intelligence service providing chatbot
KR20220111570A (en) * 2021-02-02 2022-08-09 삼성전자주식회사 The electronic device for processing the user's inquiry and the method for operating the same

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102621683B1 (en) * 2023-09-15 2024-01-04 강나영 Customer response system using artificial intelligence

Similar Documents

Publication Publication Date Title
US20230016365A1 (en) Method and apparatus for training text classification model
CN109753566B (en) Model training method for cross-domain emotion analysis based on convolutional neural network
US20230100376A1 (en) Text sentence processing method and apparatus, computer device, and storage medium
CN111368996B (en) Retraining projection network capable of transmitting natural language representation
WO2020082560A1 (en) Method, apparatus and device for extracting text keyword, as well as computer readable storage medium
CN110866124B (en) Medical knowledge graph fusion method and device based on multiple data sources
CN111737552A (en) Method, device and equipment for extracting training information model and acquiring knowledge graph
KR102656620B1 (en) Electronic apparatus, controlling method of thereof and non-transitory computer readable recording medium
US11720759B2 (en) Electronic apparatus, controlling method of thereof and non-transitory computer readable recording medium
CN109800437A (en) A kind of name entity recognition method based on Fusion Features
CN111898374B (en) Text recognition method, device, storage medium and electronic equipment
CN111460157B (en) Cyclic convolution multitask learning method for multi-field text classification
CN109992784B (en) Heterogeneous network construction and distance measurement method fusing multi-mode information
Divyapushpalakshmi et al. An efficient sentimental analysis using hybrid deep learning and optimization technique for Twitter using parts of speech (POS) tagging
KR102578257B1 (en) Chatbot service construction and maintenance system
WO2021052137A1 (en) Emotion vector generation method and apparatus
CN112805715A (en) Identifying entity attribute relationships
CN112131345B (en) Text quality recognition method, device, equipment and storage medium
Dangi et al. An efficient model for sentiment analysis using artificial rabbits optimized vector functional link network
Shah et al. Simple App Review Classification with Only Lexical Features.
CN116757195B (en) Implicit emotion recognition method based on prompt learning
Pathuri et al. Feature based sentimental analysis for prediction of mobile reviews using hybrid bag-boost algorithm
Yang [Retracted] Application of English Vocabulary Presentation Based on Clustering in College English Teaching
US11442963B1 (en) Method of and system for ranking subgraphs as potential explanations for graph classification
Seth et al. Sentiment data analysis for detecting social sense after COVID-19 using hybrid optimization method

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant