WO2023095988A1 - 대화 상대방의 성격정보를 고려하여 신뢰도 증강을 위한 맞춤형 대화 생성 시스템 및 그 방법 - Google Patents

대화 상대방의 성격정보를 고려하여 신뢰도 증강을 위한 맞춤형 대화 생성 시스템 및 그 방법 Download PDF

Info

Publication number
WO2023095988A1
WO2023095988A1 PCT/KR2021/018136 KR2021018136W WO2023095988A1 WO 2023095988 A1 WO2023095988 A1 WO 2023095988A1 KR 2021018136 W KR2021018136 W KR 2021018136W WO 2023095988 A1 WO2023095988 A1 WO 2023095988A1
Authority
WO
WIPO (PCT)
Prior art keywords
personality
conversation
text
dialogue
customized
Prior art date
Application number
PCT/KR2021/018136
Other languages
English (en)
French (fr)
Inventor
박종철
송호윤
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Publication of WO2023095988A1 publication Critical patent/WO2023095988A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation

Definitions

  • the present invention relates to a customized dialogue generation system and method for enhancing reliability by considering personality information of a conversation partner, and more particularly, predicts personality information of a conversation partner from an input conversation text and records the utterance of a system user with the conversation partner. It relates to a style transfer technology for natural language text that changes to a type trusted by people with the same personality characteristics as
  • An object of the present invention is to apply a personality model or statistical distribution based on psychological theory to enhance the reliability of the other speaker (or conversation partner) in a conversation, analyze the personality of the other party from conversation based on an artificial neural network model, and Referring to this, we intend to provide a method of increasing the reliability of conversation by modifying the text using style transfer technology to match the personality of the other party and the type of personality that communicates well.
  • the purpose of the present invention is to identify the contextual information of each utterance in order to determine the personality of the other party in a conversation, to analyze the dependence between personality categories and reliability by analyzing personality categories that can appear in various ways using self-attention techniques, and to analyze the dependence between personality categories and reliability. Based on this, by providing a method for modifying the user's answer with high reliability, it is intended to help develop a chatbot system for conversations such as persuasion and solicitation that require high reliability.
  • a system for generating a customized dialogue for enhancing reliability includes a preprocessing unit that distinguishes a conversation subject from a text preprocessing unit in an input dialogue sentence, a personality information prediction unit that predicts personality information from the text of conversation contents between the conversation subjects, and the above. Based on personality information, a personality trait selection unit that selects the optimal personality trait of the type trusted by the group having the personality trait of the subject of the conversation, and a conversation that is modified and created based on the text to be modified in the input dialogue and the personality trait It includes a dialog generating unit that proposes text.
  • the pre-processing unit may classify the conversation subject into a conversation partner and a user in the input conversation text, and convert the text of conversation content between the conversation subjects into an embedding vector to be transmitted as an input value to the artificial neural network.
  • the pre-processing unit may combine the converted embedding vector with a delimiter notifying that it is a starting utterance and a delimiter indicating a conversation subject, and transmit the result to the personality information prediction unit.
  • the personality information prediction unit is composed of a dialogue embedding combining layer, a self-attention layer, a linear layer, and an active layer, uses a personality characteristic pre-learning corpus, and extracts personality information of the conversation partner from the text of the conversation content.
  • the personality trait selector may predict the personality trait of the conversation partner based on the personality information, and select the personality trait that is trustworthy and optimal for people in a group having the predicted personality trait of the conversation partner.
  • the personality trait selection unit is composed of a linear layer and an active layer and uses personality combination learning data for model training, and the personality combination learning data may be a mapping function based on psychological theories and rules.
  • the dialogue generation unit is composed of a decoder attention layer and a linear layer, and based on the text to be modified and the personality characteristics received from the personality characteristic selection unit, the personality characteristic is applied to the target text for modification using a style transfer method.
  • the dialogue text modified by application may be output as a final result.
  • a customized dialog creation method for enhancing reliability includes a pre-processing step of distinguishing a text pre-processing and a conversation subject from an input dialog, a step of predicting personality information from a text of a conversation between the conversation subjects, and the personality information Based on this, the step of selecting the optimal personality trait of the type trusted by the group having the personality trait of the conversation subject and the step of suggesting the text to be modified and the dialogue text to be modified and created based on the personality trait in the input dialogue.
  • the conversation subject may be divided into a conversation partner and a user in the input conversation text, and the text of conversation contents between the conversation subjects may be converted into an embedding vector to be transmitted as an input value of an artificial neural network.
  • the personality information may be transmitted to the step of predicting the personality information by combining the converted embedding vector with a delimiter indicating a start utterance and a delimiter indicating a conversation subject.
  • the step of predicting the personality information is composed of a dialog embedding combination layer, a self-attention layer, a linear layer, and an active layer, and uses a personality characteristic pre-learning corpus, and extracts the personality information of the conversation partner from the text of the conversation content. there is.
  • the personality characteristics of the conversation partner are predicted based on the personality information, and people in the group having the predicted personality characteristics of the conversation partner can select the personality characteristics that are reliable and optimal. .
  • a linear layer and an active layer are used to use personality combination learning data for model training, and the personality combination learning data may be a mapping function based on psychological theories and rules.
  • the step of suggesting the dialogue text is composed of a decoder attention layer and a linear layer, and the target text for modification and the personality characteristic received from the step of selecting the personality characteristic are used to use a style transition method.
  • the dialogue text corrected by applying the personality characteristics to the text may be output as a final result.
  • a reliable conversation is drawn from the conversation partner.
  • a personal chatbot system a user-customized conversation system can be built, and it can also help when building a conversational chatbot system for the purpose of persuasion or recommendation to the other party.
  • FIG. 1 is a block diagram showing a detailed configuration of a customized dialogue generating system for reliability enhancement according to an embodiment of the present invention.
  • FIG. 2 is a diagram to explain the process of an artificial neural network model for generating personality-customized conversations for input conversations according to an embodiment of the present invention.
  • FIG. 3 is a flowchart illustrating an operation of a method for generating a customized dialog for enhancing reliability according to an embodiment of the present invention.
  • Embodiments of the present invention have a gist of proposing a next utterance through natural language text generation and modification in order to obtain high trust from a conversation partner in a conversation situation. More specifically, the present invention automatically predicts the personality of a conversation partner through the analysis of language appearing in a conversation, and selects the most reliable type of personality trait of the conversation partner in consideration of the predicted personality information, thereby changing the conversation style. Reliability can be enhanced by outputting conversational text based on this.
  • FIG. 1 is a block diagram showing a detailed configuration of a customized dialogue generating system for reliability enhancement according to an embodiment of the present invention.
  • a system for creating a customized dialogue for enhancing reliability predicts personality information of a conversation partner from an input conversation, and converts a system user's utterance to people having the same personality characteristics as the conversation partner. Style transfer for natural language text that changes to a trusted type.
  • the customized dialogue generating system 100 for enhancing reliability includes a pre-processing unit 110, a personality information prediction unit 120, a personality characteristic selection unit 130, and a conversation generation unit 140. includes
  • the pre-processing unit 110 distinguishes between text pre-processing and a conversation subject in an input dialog.
  • the pre-processing unit 110 receives the input dialogue 10 through the customized dialogue generating system 100 for trust-enhancing dialogue.
  • the input dialogue 10 represents text including conversation contents in which two speakers participate.
  • the pre-processing unit 110 may classify the conversation subject into the conversation partner and the user in the input conversation text 10 and convert the text of the conversation content between the conversation subjects into an embedding vector to be transmitted as an input value of the artificial neural network.
  • the pre-processing unit 110 may classify the conversation subject into a conversation partner and a user, such as A and B or A and B, in the input dialogue 10 .
  • the input dialog 10 may include delimiters indicating the start of a sentence (eg, ⁇ CLS>, ⁇ SEP>) and delimiters indicating speakers (eg, ⁇ A>, ⁇ B>).
  • the pre-processing unit 110 divides the input dialogue 10 for each conversation subject and combines the transformed embedding vector with a separator indicating that it is a start utterance and a separator indicating a conversation subject, and delivers it to the personality information prediction unit 120 characterized by After being converted into an embedding vector, the resulting value includes an embedding vector for a language element (token) in the text.
  • the language element is a unit representing a sentence, and word division through spaces, subword units of Byte-Pair Encoding (BPE), or subwords divided by Unigram Language Model can be used.
  • the personality information prediction unit 120 predicts personality information from the text of conversation contents between conversation subjects.
  • the personality information prediction unit 120 uses an artificial neural network-based personality prediction model composed of a dialog embedding combining layer, a self-attention layer, a linear layer, and an active layer, and uses the personality characteristic pre-learning corpus 121 for model training. use.
  • the personality characteristic prediction unit 120 extracts the personality information of the conversation partner from the text of the conversation content in the input dialogue 10 and delivers it to the personality characteristic selection unit 130 for reliability enhancement.
  • models such as Big-Five and MBTI may be used as psychological models (personality prediction models) used to predict the personality of the speaker (the conversation partner and the user).
  • the process of predicting personality information and personality combinations from utterances may include multi-task learning and self-attention processes.
  • the self-attention layer can use a Transformer Encoder that effectively analyzes the dependency relationship between linguistic elements (tokens) in long texts such as dialogues.
  • a feed-forward layer and a softmax function may be used for the linear layer and the active layer, respectively.
  • the resulting value after being delivered to the self-attention layer, the resulting value includes an embedding vector converted into context information for each language element.
  • the resulting value can effectively detect the meaning of the current utterance by considering the linguistic elements of the surrounding utterance due to the characteristics of the self-attention layer.
  • the personality trait selector 130 selects an optimal personality trait of a type trusted by the group having the personality trait of the subject of conversation based on the personality information.
  • the personality trait selection unit 130 is composed of a linear layer and an active layer and uses the personality combination learning data 131 for model training.
  • the personality combination learning data 131 may be a mapping function based on psychological theories and rules.
  • the personality trait selector 130 predicts the personality traits of the conversation partner based on the personality information, and utilizes the correlation between the predicted personality trait and reliability to communicate well with the conversation partner, that is, a group with similar personality characteristics. I can choose the type of optimal personality traits my people can trust. For example, the personality trait selection unit 130 can predict that the conversation partner has personality trait A based on the personality information, and provides an example of the most reliable type of personality trait for people in group A who have personality trait A. For example, trustworthiness or trustworthiness can be selected as the optimal personality trait. At this time, the personality trait selection unit 130 may use various methodologies such as statistical values, compatibility between MBTI personality types, and psychological theories to select the optimal personality traits of the conversation partner.
  • the linear layer and the active layer constituting the personality characteristic selection unit 130 predict personality characteristics that are predicted to communicate best with the personality information received from the personality information prediction unit 120, and the personality characteristic style transfer conversation generation unit ( 140).
  • the dialog generator 140 proposes a dialog text to be corrected and created based on the text to be corrected and personality characteristics in the input dialog.
  • the dialogue generator 140 extracts only a part of the target text requiring modification from the input dialogue and classifies it as the text to be corrected, modifies the text to be corrected based on the personality characteristics through style transfer, or applies the personality characteristics to the text to be modified. You can suggest dialog text by generating text.
  • the dialogue generator 140 is composed of a decoder attention layer and a linear layer, and uses a style transfer method to modify the target text and the personality characteristic received from the personality characteristic selector 130.
  • the modified dialogue text can be output as a final result by applying personality characteristics to the text.
  • the decoder attention layer can use a transformer decoder that effectively analyzes the dependence between a language element (token) in the text and the output of the encoder. Feed-forward layer, Softmax function, Dense function, etc. may be used for the linear layer and the active layer.
  • FIG. 2 is a diagram to explain the process of an artificial neural network model for generating personality-customized conversations for input conversations according to an embodiment of the present invention.
  • one input dialogue 201 is arranged along with context information and transmitted as an input sequence.
  • the personality information prediction unit 120 of FIG. 1 includes a text embedding combination layer 210 and a self-attention layer 230, and the received input sequence is a dialogue embedding combination layer 210 and a self-attention layer 220. ) is passed on. Accordingly, the personality information predictor 120 predicts the personality information of the conversation subject by the independent linear layer 250 trained with other corpus such as the input embedding vector 220 and the context embedding vector 240, and The personality trait selection unit 130 composed of the layer and active layer 260 proceeds to predict the optimal personality trait of the type trusted by the group having the personality trait of the conversation subject.
  • the vector resulting from the independent linear layer 260 is passed as an input value to the personality trait selector 130, and the extracted personality trait finds the most reliable conversation style, and the decoder attention layer 280 and the linear layer 290
  • the personality characteristic style transition composed of is transmitted to the conversation generating unit 140 .
  • the linear layer 290 applies the personality style to the text to be modified 270 through a style transfer method, thereby generating the modified text, the dialogue text 202 .
  • FIG. 3 is a flowchart illustrating an operation of a method for generating a customized dialog for enhancing reliability according to an embodiment of the present invention.
  • step S310 a text preprocessing and a conversation subject are distinguished in an input dialogue.
  • step S310 an input dialogue text is received, and the input dialogue text represents text including conversation contents in which two speakers participate.
  • a conversation subject may be divided into a conversation partner and a user in the input conversation text, and the text of the conversation content between the conversation subjects may be converted into an embedding vector to be transmitted as an input value of the artificial neural network.
  • the conversation subject can be divided into a conversation partner and a user, such as A, B or A, B in the input dialogue, and the input dialogue is a delimiter indicating the start of a sentence (eg, ⁇ CLS>, ⁇ SEP> ), and a delimiter indicating the speaker (eg, ⁇ A>, ⁇ B>).
  • step S310 is characterized in that the input dialogue text is classified for each conversation subject and the converted embedding vector is combined with a delimiter notifying that it is a starting utterance and a delimiter indicating a conversation subject and transmitted to step S320.
  • step S320 personality information is predicted from the text of conversation contents between conversation subjects.
  • step S320 an artificial neural network-based personality prediction model composed of a dialog embedding combination layer, self-attention layer, linear layer, and active layer is used, and a pretrained personality trait corpus is used for model training.
  • Step S320 extracts the personality information of the conversation partner from the text of the conversation content in the input dialog and delivers it to step S330 for reliability enhancement.
  • models such as Big-Five and MBTI may be used as psychological models (personality prediction models) used to predict the personality of the speaker (the conversation partner and the user).
  • the process of predicting personality information and personality combinations from utterances may include multi-task learning and self-attention processes.
  • step S330 based on the personality information, the optimal personality trait of the type trusted by the group having the personality trait of the conversation subject is selected.
  • Step S330 consists of a linear layer and an active layer to use personality combination learning data for model training, and the personality combination learning data 131 may be a mapping function based on psychological theories and rules.
  • step S330 the personality characteristics of the conversation partner are predicted based on the personality information, and the relationship between the predicted personality characteristics and reliability is used to communicate well with the conversation partner, that is, people in a group with similar personality characteristics can be trusted.
  • various methodologies such as statistical values, compatibility between MBTI personality types, and psychological theories may be used to select the optimal personality characteristics of the conversation partner.
  • step S340 a dialogue text to be corrected and generated is suggested based on the text to be modified and personality characteristics in the input dialogue.
  • step S340 only a part of the target text requiring correction may be extracted from the input dialogue and classified as a target text for modification. Based on the personality characteristics, the target text may be modified through style transfer or a new text may be generated by applying the personality characteristics. You can suggest dialogue text. More specifically, step S340 is composed of a decoder attention layer and a linear layer, and based on the text to be corrected and the personality characteristics received from step S330, the modified text is modified by applying the personality characteristics to the text to be corrected using a style transfer method. The dialog text can be output as the final result.
  • the system or apparatus described above may be implemented as hardware components, software components, and/or a combination of hardware components and software components.
  • devices and components described in the embodiments may include, for example, a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable gate array (FPGA) , a programmable logic unit (PLU), microprocessor, or any other device capable of executing and responding to instructions.
  • the processing device may run an operating system (OS) and one or more software applications running on the operating system.
  • a processing device may also access, store, manipulate, process, and generate data in response to execution of software.
  • the processing device includes a plurality of processing elements and/or a plurality of types of processing elements. It can be seen that it can include.
  • a processing device may include a plurality of processors or a processor and a controller. Other processing configurations are also possible, such as parallel processors.
  • Software may include a computer program, code, instructions, or a combination of one or more of the foregoing, which configures a processing device to operate as desired or processes independently or collectively. You can command the device.
  • Software and/or data may be any tangible machine, component, physical device, virtual equipment, computer storage medium or device, intended to be interpreted by or provide instructions or data to a processing device. , or may be permanently or temporarily embodied in a transmitted signal wave.
  • Software may be distributed on networked computer systems and stored or executed in a distributed manner.
  • Software and data may be stored on one or more computer readable media.
  • the method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded on a computer readable medium.
  • the computer readable medium may include program instructions, data files, data structures, etc. alone or in combination.
  • Program commands recorded on the medium may be specially designed and configured for the embodiment or may be known and usable to those skilled in computer software.
  • Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floptical disks.
  • - includes hardware devices specially configured to store and execute program instructions, such as magneto-optical media, and ROM, RAM, flash memory, and the like.
  • program instructions include high-level language codes that can be executed by a computer using an interpreter, as well as machine language codes such as those produced by a compiler.
  • the hardware devices described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 입력된 대화문으로부터 대화 상대방의 성격정보를 예측하고, 시스템 사용자의 발화를 대화 상대방과 동일한 성격특성을 가진 사람들이 신뢰하는 유형으로 변경하는 자연어 텍스트에 대한 스타일 전이(style transfer) 맞춤형 대화 생성 시스템 및 그 방법에 관한 것으로서, 입력 대화문에서 텍스트 전처리와 대화 주체를 구분하는 전처리부, 상기 대화 주체 간의 대화 내용의 텍스트로부터 성격정보를 예측하는 성격정보 예측부, 상기 성격정보를 기반으로, 상기 대화 주체의 성격특성을 가진 그룹이 신뢰하는 유형의 최적 성격특성을 선택하는 성격특성 선택부 및 상기 입력 대화문에서 수정 대상 텍스트와 상기 성격특성을 기반으로 수정 및 생성되는 대화 텍스트를 제안하는 대화 생성부를 포함한다.

Description

대화 상대방의 성격정보를 고려하여 신뢰도 증강을 위한 맞춤형 대화 생성 시스템 및 그 방법
본 발명은 대화 상대방의 성격정보를 고려하여 신뢰도 증강을 위한 맞춤형 대화 생성 시스템 및 그 방법에 관한 것으로서, 보다 상세하게는 입력된 대화문으로부터 대화 상대방의 성격정보를 예측하고, 시스템 사용자의 발화를 대화 상대방과 동일한 성격특성을 가진 사람들이 신뢰하는 유형으로 변경하는 자연어 텍스트에 대한 스타일 전이(style transfer) 기술에 관한 것이다.
인공신경망 기반의 성격 범주 예측 분야에서는 빅파이브(Big-Five)나 성격 유형 검사(MBTI)와 같은 심리학 분야에서 사용하는 성격 모델을 적용하여 발화자의 성격을 예측하는 연구가 매우 활발히 진행되고 있다. 또한, 인공신경망 모델을 사용하여 특정 텍스트에 대한 신뢰 정도를 예측하고 증강하는 연구도 활발히 진행되고 있다. 또한, 이미지 처리 분야에서 원본 이미지를 만화화 혹은 스케치화로 변경하는 스타일 전이 기술을 최근 자연어 처리 분야에서 원본 텍스트에 다른 특성을 추가하는 방법으로 적용하려는 시도 또한 많아지고 있다.
Big-Five 모델에서 ‘성실성(conscientiousness)’의 성향이 강하게 나타나는 사람은 반대 성향인 ‘충동성(impulsive)’의 성향이 강한 사람과 의견이 일치하지 않은 경우가 많은데 이러한 성격특성을 참고하여, 스타일 전이 기술을 사용해 상대방과 대화가 잘 통하는 유형의 성격으로 보이게 텍스트를 수정함으로써 신뢰도를 증강하는 기술 도입 사례는 보고된 바 있다. 하지만, 신뢰도 증강을 위해 대화 상대방의 성격을 분석하고, 분석한 내용을 참고하여 대화 상대방이 신뢰할 만한 성격을 가진 사람들의 대화 스타일로 대화문을 생성하는 방법은 아직 진행된 연구가 부족하다.
본 발명의 목적은 대화문에서 상대 발화자(또는 대화 상대방)에 대한 신뢰도를 증강하기 위해 심리학 이론에 기반한 성격모델 또는 통계적 분포 등을 적용하여, 대화로부터 상대방이 나타내는 성격을 인공신경망 모델을 기반으로 분석하고 이를 참고하여 상대방의 성격과 대화가 잘 통하는 유형의 성격을 스타일 전이 기술을 사용해 텍스트를 수정함으로써, 대화의 신뢰도를 증가시키는 방법을 제공하고자 한다.
본 발명의 목적은 대화문 내 상대방의 성격을 판단하기 위해 각 발화의 문맥 정보를 파악하고, 다양하게 나타날 수 있는 성격 범주들을 자가 주의집중 기법을 사용해 분석하여 성격 범주와 신뢰도 간의 의존성을 분석하고, 이를 바탕으로 사용자의 대답을 신뢰도가 높게 수정하는 방법을 제공하여 높은 신뢰도가 필요한 설득, 권유 등의 대화문 챗봇 시스템 개발에 도움을 주고자 한다.
다만, 본 발명이 해결하고자 하는 기술적 과제들은 상기 과제로 한정되는 것은 아니며, 본 발명의 기술적 사상 및 영역으로부터 벗어나지 않은 범위에서 다양하게 확장될 수 있다.
본 발명의 실시예에 따른 신뢰도 증강을 위한 맞춤형 대화 생성 시스템은 입력 대화문에서 텍스트 전처리와 대화 주체를 구분하는 전처리부, 상기 대화 주체 간의 대화 내용의 텍스트로부터 성격정보를 예측하는 성격정보 예측부, 상기 성격정보를 기반으로, 상기 대화 주체의 성격특성을 가진 그룹이 신뢰하는 유형의 최적 성격특성을 선택하는 성격특성 선택부 및 상기 입력 대화문에서 수정 대상 텍스트와 상기 성격특성을 기반으로 수정 및 생성되는 대화 텍스트를 제안하는 대화 생성부를 포함한다.
상기 전처리부는 상기 입력 대화문에서 대화 상대방과 사용자로 상기 대화 주체를 구분하고, 인공신경망의 입력값으로 전달하기 위해 상기 대화 주체 간의 대화 내용의 텍스트를 임베딩 벡터로 변환할 수 있다.
상기 전처리부는 상기 변환된 임베딩 벡터와 시작 발화임을 알리는 구분자 및 대화 주체자를 나타내는 구분자를 결합하여 상기 성격정보 예측부로 전달할 수 있다.
상기 성격정보 예측부는 대화문 임베딩 결합 층, 자가 주의집중 층, 선형 층 및 활성 층으로 구성되어 성격특성 사전학습 말뭉치를 사용하며, 상기 대화 내용의 텍스트로부터 대화 상대방의 성격정보를 추출할 수 있다.
상기 성격특성 선택부는 상기 성격정보를 기반으로 상기 대화 상대방의 성격특성을 예측하며, 예측한 대화 상대방의 성격특성을 가진 그룹 내 사람들이 신뢰할 수 있는 유형 최적의 상기 성격특성을 선택할 수 있다.
상기 성격특성 선택부는 선형 층 및 활성 층으로 구성되어 모델 훈련을 위해 성격 조합 학습 데이터를 사용하며, 상기 성격 조합 학습 데이터는 심리학 이론 및 규칙에 기반한 사상 함수(mapping function)일 수 있다.
상기 대화 생성부는 디코더 주의집중 층 및 선형 층으로 구성되며, 상기 수정 대상 텍스트와 상기 성격특성 선택부로부터 수신된 상기 성격특성을 기반으로, 스타일 전이 방식을 사용하여 상기 수정 대상 텍스트에 상기 성격특성을 적용하여 수정된 상기 대화 텍스트를 최종 결과로 출력할 수 있다.
본 발명의 실시예에 따른 신뢰도 증강을 위한 맞춤형 대화 생성 방법은 입력 대화문에서 텍스트 전처리와 대화 주체를 구분하는 전처리 단계, 상기 대화 주체 간의 대화 내용의 텍스트로부터 성격정보를 예측하는 단계, 상기 성격정보를 기반으로, 상기 대화 주체의 성격특성을 가진 그룹이 신뢰하는 유형의 최적 성격특성을 선택하는 단계 및 상기 입력 대화문에서 수정 대상 텍스트와 상기 성격특성을 기반으로 수정 및 생성되는 대화 텍스트를 제안하는 단계를 포함한다.
상기 전처리 단계는 상기 입력 대화문에서 대화 상대방과 사용자로 상기 대화 주체를 구분하고, 인공신경망의 입력값으로 전달하기 위해 상기 대화 주체 간의 대화 내용의 텍스트를 임베딩 벡터로 변환할 수 있다.
상기 전처리 단계는 상기 변환된 임베딩 벡터와 시작 발화임을 알리는 구분자 및 대화 주체자를 나타내는 구분자를 결합하여 상기 성격정보를 예측하는 단계로 전달할 수 있다.
상기 성격정보를 예측하는 단계는 대화문 임베딩 결합 층, 자가 주의집중 층, 선형 층 및 활성 층으로 구성되어 성격특성 사전학습 말뭉치를 사용하며, 상기 대화 내용의 텍스트로부터 대화 상대방의 성격정보를 추출할 수 있다.
상기 성격특성을 선택하는 단계는 상기 성격정보를 기반으로 상기 대화 상대방의 성격특성을 예측하며, 예측한 대화 상대방의 성격특성을 가진 그룹 내 사람들이 신뢰할 수 있는 유형 최적의 상기 성격특성을 선택할 수 있다.
상기 성격특성을 선택하는 단계는 선형 층 및 활성 층으로 구성되어 모델 훈련을 위해 성격 조합 학습 데이터를 사용하며, 상기 성격 조합 학습 데이터는 심리학 이론 및 규칙에 기반한 사상 함수(mapping function)일 수 있다.
상기 대화 텍스트를 제안하는 단계는 디코더 주의집중 층 및 선형 층으로 구성되며, 상기 수정 대상 텍스트와 상기 성격특성을 선택하는 단계로부터 수신된 상기 성격특성을 기반으로, 스타일 전이 방식을 사용하여 상기 수정 대상 텍스트에 상기 성격특성을 적용하여 수정된 상기 대화 텍스트를 최종 결과로 출력할 수 있다.
본 발명의 실시예에 따르면, 대화문 내 대화 상대방의 성격정보를 예측하고, 그 성격특성을 가진 사람들이 가장 신뢰하는 유형의 대화 스타일을 사용자의 텍스트에 적용함으로써, 대화 상대방으로부터 신뢰할 수 있는 대화를 이끌어 내야하는 상황에 도움을 줄 수 있다. 이를 개인용 챗봇 시스템에 적용하면 사용자 맞춤형 대화 시스템을 구축할 수 있으며, 또한 상대방에 대한 설득 혹은 권유가 목적인 대화형 챗봇 시스템을 구축하는 경우에도 도움을 줄 수 있다.
다만, 본 발명의 효과는 상기 효과들로 한정되는 것은 아니며, 본 발명의 기술적 사상 및 영역으로부터 벗어나지 않는 범위에서 다양하게 확장될 수 있다.
도 1은 본 발명의 실시예에 따른 신뢰도 증강을 위한 맞춤형 대화 생성 시스템의 세부 구성을 블록도로 도시한 것이다.
도 2는 본 발명의 실시예에 따른 입력 대화문에 대한 성격 맞춤형 대화를 생성하는 인공신경망 모델의 과정을 설명하기 위해 도시한 것이다.
도 3은 본 발명의 실시예에 따른 신뢰도 증강을 위한 맞춤형 대화 생성 방법의 동작 흐름도를 도시한 것이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며, 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예들을 보다 상세하게 설명하고자 한다. 도면 상의 동일한 구성요소에 대해서는 동일한 참조 부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
본 발명의 실시예들은, 대화 상황에서 대화 상대방으로부터 높은 신뢰를 얻기 위해, 자연어 텍스트 생성 및 수정을 통해 다음 발화를 제안하는 것을 그 요지로 한다. 보다 상세하게, 본 발명은 대화문에서 나타나는 언어의 분석을 통해 대화 상대방의 성격을 자동으로 예측하고, 예측한 성격정보를 고려하여 대화 상대방이 가장 신뢰할 수 있는 유형의 성격특성을 선택함으로써, 대화 스타일을 기반으로 대화 텍스트를 출력하여 신뢰도를 증강할 수 있다.
이하에서는 도 1 내지 도 3을 참조하여 본 발명에 대해 상세히 설명한다.
도 1은 본 발명의 실시예에 따른 신뢰도 증강을 위한 맞춤형 대화 생성 시스템의 세부 구성을 블록도로 도시한 것이다.
도 1을 참조하면, 본 발명의 실시예에 따른 신뢰도 증강을 위한 맞춤형 대화 생성 시스템은 입력된 대화문으로부터 대화 상대방의 성격정보를 예측하고, 시스템 사용자의 발화를 대화 상대방과 동일한 성격특성을 가진 사람들이 신뢰하는 유형으로 변경하는 자연어 텍스트에 대한 스타일 전이(style transfer)한다.
이를 위해, 본 발명의 실시예에 따른 신뢰도 증강을 위한 맞춤형 대화 생성 시스템(100)은 전처리부(110), 성격정보 예측부(120), 성격특성 선택부(130) 및 대화 생성부(140)를 포함한다.
전처리부(110)는 입력 대화문에서 텍스트 전처리와 대화 주체를 구분한다.
전처리부(110)는 신뢰 향상 대화를 위한 맞춤형 대화 생성 시스템(100)을 통해 입력 대화문(10)을 입력 받는다. 이때, 입력 대화문(10)은 두 명의 발화자가 참여하는 대화 내용이 포함된 텍스트를 나타낸다.
전처리부(110)는 입력 대화문(10)에서 대화 상대방과 사용자로 대화 주체를 구분하고, 인공신경망의 입력값으로 전달하기 위해 대화 주체 간의 대화 내용의 텍스트를 임베딩 벡터로 변환할 수 있다. 예를 들면, 전처리부(110)는 입력 대화문(10)에서 A, B 또는 갑, 을과 같이 대화 상대방과 사용자로 대화 주체를 구분할 수 있다. 입력 대화문(10)은 문장 시작임을 알리는 구분자(예를 들면, <CLS>, <SEP>), 발화자를 나타내는 구분자(예를 들면, <A>, <B>)를 포함할 수 있다.
이에 따라서, 전처리부(110)는 입력 대화문(10)을 각 대화 주체별로 구분되어 변환된 임베딩 벡터와 시작 발화임을 알리는 구분자 및 대화 주체자를 나타내는 구분자를 결합하여 성격정보 예측부(120)로 전달하는 것을 특징으로 한다. 임베딩 벡터로 변환된 후 결과값은 텍스트 내 언어요소(token)에 대한 임베딩 벡터를 포함한다. 상기 언어요소는 문장을 나타내는 단위이며, 띄어쓰기를 통한 단어 구분 혹은, Byte-Pair Encoding(BPE)의 subword units, Unigram Language Model에 의해 나누어진 subwords가 사용될 수 있다.
성격정보 예측부(120)는 대화 주체 간의 대화 내용의 텍스트로부터 성격정보를 예측한다.
성격정보 예측부(120)는 대화문 임베딩 결합 층, 자가 주의집중 층, 선형 층 및 활성 층으로 구성되는 인공신경망 기반의 성격 예측 모델을 사용하며, 모델 훈련을 위해 성격특성 사전학습 말뭉치(121)를 사용한다. 성격특성 예측부(120)는 입력 대화문(10) 내 대화 내용의 텍스트로부터 대화 상대방의 성격정보를 추출하여 신뢰도 증강을 위한 성격특성 선택부(130)로 전달한다. 이때, 발화 주체(대화 상대방과 사용자)의 성격 예측에 사용되는 심리학 모델(성격 예측 모델)은 빅 파이브(Big-Five) 및 MBTI 등의 모델들이 사용될 수 있다. 또한, 발화로부터 성격정보와 성격 조합을 예측하는 과정은 다중 작업 학습, 자가 주의 집중 과정을 포함할 수 있다.
보다 상세하게, 자가 주의집중 층은 대화문과 같이 긴 길이를 가진 텍스트 내 언어요소(token) 간의 의존관계를 효과적으로 분석하는 Transformer Encoder가 사용될 수 있다. 또한, 선형 층 및 활성 층은 각각 Feed-forward layer와 Softmax function이 사용될 수 있다. 더욱이, 자가 주의집중 층에 전달된 후, 결과값은 각 언어요소에 대한 문맥 정보로 변환된 임베딩 벡터를 포함한다. 또한, 결과값은 자가 주의집중 층의 특성으로 인해 주변 발화의 언어요소를 고려하여 현재 발화의 의미를 효과적으로 탐지할 수 있다.
성격특성 선택부(130)는 성격정보를 기반으로, 대화 주체의 성격특성을 가진 그룹이 신뢰하는 유형의 최적 성격특성을 선택한다.
성격특성 선택부(130)는 선형 층 및 활성 층으로 구성되어 모델 훈련을 위해 성격 조합 학습 데이터(131)를 사용한다. 성격 조합 학습 데이터(131)는 심리학 이론 및 규칙에 기반한 사상 함수(mapping function)일 수 있다.
성격특성 선택부(130)는 성격정보를 기반으로 대화 상대방의 성격특성을 예측하며, 예측한 대화 상대방의 성격특성과 신뢰도 간의 연관성을 활용하여 대화 상대방과 대화가 잘 통하는 즉, 성격특성이 유사한 그룹 내 사람들이 신뢰할 수 있는 유형의 최적 성격특성을 선택할 수 있다. 예를 들면, 성격특성 선택부(130)는 성격정보를 기반으로 대화 상대방이 A 성격특성을 가진 것으로 예측할 수 있으며, A 성격특성을 가진 A 그룹 내 사람들이 가장 신뢰할 수 있는 유형의 성격특성 예를 들어, 신뢰성 또는 믿음성을 선택하여 최적 성격특성으로 선택할 수 있다. 이때, 성격특성 선택부(130)는 대화 상대방의 최적의 성격특성을 선택하기 위해, 통계적 수치, MBTI 성격 유형 간의 궁합, 심리학 이론 등 다양한 방법론들을 사용할 수 있다.
성격특성 선택부(130)를 구성하는 선형 층 및 활성 층은 성격정보 예측부(120)로부터 전달받은 성격정보와 가장 대화가 잘 통할 것으로 예측되는 성격특성을 예측하여 성격특성 스타일 전이 대화 생성부(140)로 전달한다.
대화 생성부(140)는 입력 대화문에서 수정 대상 텍스트와 성격특성을 기반으로 수정 및 생성되는 대화 텍스트를 제안한다. 대화 생성부(140)는 입력 대화문 중에서 수정이 필요한 대상 텍스트를 일부만 추출하여 수정 대상 텍스트로 분류할 수 있으며, 성격특성을 기반으로 수정 대상 텍스트에 스타일 전이를 통해 수정하거나, 성격특성을 적용하여 새로운 텍스트를 생성하여 대화 텍스트를 제안할 수 있다.
보다 상세하게, 대화 생성부(140)는 디코더 주의집중 층 및 선형 층으로 구성되며, 수정 대상 텍스트와 성격특성 선택부(130)로부터 수신된 성격특성을 기반으로, 스타일 전이 방식을 사용하여 수정 대상 텍스트에 성격특성을 적용하여 수정된 대화 텍스트를 최종 결과로 출력할 수 있다. 디코더 주의집중 층은 텍스트 내 언어요소(token)와 인코더의 출력 간의 의존관계를 효과적으로 분석하는 Transformer Decoder가 사용될 수 있다. 선형 층 및 활성 층은 Feed-forward layer와 Softmax function, Dense function 등이 사용될 수 있다.
도 2는 본 발명의 실시예에 따른 입력 대화문에 대한 성격 맞춤형 대화를 생성하는 인공신경망 모델의 과정을 설명하기 위해 도시한 것이다.
도 2를 참조하면, 본 발명은 하나의 입력 대화문(201)을 문맥 정보와 함께 나열하여 입력 시퀀스로 전달한다. 도 1의 성격정보 예측부(120)는 텍스트 임베딩 결합 층(210)과 자가 주의집중 층(230)을 포함하고 있으며, 전달받은 입력 시퀀스는 대화문 임베딩 결합 층(210) 및 자가 주의집중 층(220)에 전달된다. 이에, 성격정보 예측부(120)는 입력 임베딩 벡터(220) 및 문맥 임베딩 벡터(240)와 같은 다른 말뭉치로 훈련된 독립적인 선형 층(250)에 의해 대화 주체자에 대한 성격정보를 예측하고, 선형 층 및 활성 층(260)으로 구성된 성격특성 선택부(130)에 의해 대화 주체의 성격특성을 가진 그룹이 신뢰하는 유형의 최적 성격특성 예측을 진행한다.
독립적인 선형 층(260)의 결과 벡터는 성격특성 선택부(130)의 입력값으로 전달되어 추출된 성격특성이 가장 신뢰할 수 있는 대화 스타일을 찾아 디코더 주의집중 층(280) 및 선형 층(290)으로 구성된 성격특성 스타일 전이 대화 생성부(140)에 전달된다. 최종적으로 선형 층(290)에서 수정 대상 텍스트(270)에 스타일 전이 방법을 통해 성격 스타일을 적용함으로써, 수정된 텍스트인 대화 텍스트(202)를 생성한다.
도 3은 본 발명의 실시예에 따른 신뢰도 증강을 위한 맞춤형 대화 생성 방법의 동작 흐름도를 도시한 것이다.
도 3을 참조하면, 단계 S310에서, 입력 대화문에서 텍스트 전처리와 대화 주체를 구분한다.
단계 S310은 입력 대화문을 수신하며, 입력 대화문은 두 명의 발화자가 참여하는 대화 내용이 포함된 텍스트를 나타낸다.
단계 S310은 입력 대화문에서 대화 상대방과 사용자로 대화 주체를 구분하고, 인공신경망의 입력값으로 전달하기 위해 대화 주체 간의 대화 내용의 텍스트를 임베딩 벡터로 변환할 수 있다. 예를 들면, 단계 S310은 입력 대화문에서 A, B 또는 갑, 을과 같이 대화 상대방과 사용자로 대화 주체를 구분할 수 있으며, 입력 대화문은 문장 시작임을 알리는 구분자(예를 들면, <CLS>, <SEP>), 발화자를 나타내는 구분자(예를 들면, <A>, <B>)를 포함할 수 있다.
이에 따라서, 단계 S310은 입력 대화문을 각 대화 주체별로 구분되어 변환된 임베딩 벡터와 시작 발화임을 알리는 구분자 및 대화 주체자를 나타내는 구분자를 결합하여 단계 S320으로 전달하는 것을 특징으로 한다.
단계 S320에서, 대화 주체 간의 대화 내용의 텍스트로부터 성격정보를 예측한다.
단계 S320은 대화문 임베딩 결합 층, 자가 주의집중 층, 선형 층 및 활성 층으로 구성되는 인공신경망 기반의 성격 예측 모델을 사용하며, 모델 훈련을 위해 성격특성 사전학습 말뭉치를 사용한다. 단계 S320은 입력 대화문 내 대화 내용의 텍스트로부터 대화 상대방의 성격정보를 추출하여 신뢰도 증강을 위한 단계 S330으로 전달한다. 이때, 발화 주체(대화 상대방과 사용자)의 성격 예측에 사용되는 심리학 모델(성격 예측 모델)은 빅 파이브(Big-Five) 및 MBTI 등의 모델들이 사용될 수 있다. 또한, 발화로부터 성격정보와 성격 조합을 예측하는 과정은 다중 작업 학습, 자가 주의 집중 과정을 포함할 수 있다.
단계 S330에서, 성격정보를 기반으로, 대화 주체의 성격특성을 가진 그룹이 신뢰하는 유형의 최적 성격특성을 선택한다.
단계 S330은 선형 층 및 활성 층으로 구성되어 모델 훈련을 위해 성격 조합 학습 데이터를 사용하며, 성격 조합 학습 데이터(131)는 심리학 이론 및 규칙에 기반한 사상 함수(mapping function)일 수 있다.
단계 S330은 성격정보를 기반으로 대화 상대방의 성격특성을 예측하며, 예측한 대화 상대방의 성격특성과 신뢰도 간의 연관성을 활용하여 대화 상대방과 대화가 잘 통하는 즉, 성격특성이 유사한 그룹 내 사람들이 신뢰할 수 있는 유형의 최적 성격특성을 선택할 수 있다. 예를 들면, 단계 S330은 성격정보를 기반으로 대화 상대방이 A 성격특성을 가진 것으로 예측할 수 있으며, A 성격특성을 가진 A 그룹 내 사람들이 가장 신뢰할 수 있는 유형의 성격특성 예를 들어, 신뢰성 또는 믿음성을 선택하여 최적 성격특성으로 선택할 수 있다. 이때, 단계 S330은 대화 상대방의 최적의 성격특성을 선택하기 위해, 통계적 수치, MBTI 성격 유형 간의 궁합, 심리학 이론 등 다양한 방법론들을 사용할 수 있다.
단계 S340에서, 입력 대화문에서 수정 대상 텍스트와 성격특성을 기반으로 수정 및 생성되는 대화 텍스트를 제안한다. 단계 S340은 입력 대화문 중에서 수정이 필요한 대상 텍스트를 일부만 추출하여 수정 대상 텍스트로 분류할 수 있으며, 성격특성을 기반으로 수정 대상 텍스트에 스타일 전이를 통해 수정하거나, 성격특성을 적용하여 새로운 텍스트를 생성하여 대화 텍스트를 제안할 수 있다. 보다 상세하게, 단계 S340은 디코더 주의집중 층 및 선형 층으로 구성되며, 수정 대상 텍스트와 단계 S330로부터 수신된 성격특성을 기반으로, 스타일 전이 방식을 사용하여 수정 대상 텍스트에 성격특성을 적용하여 수정된 대화 텍스트를 최종 결과로 출력할 수 있다.
이상에서 설명된 시스템 또는 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(Field Programmable Gate Array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (14)

  1. 입력 대화문에서 텍스트 전처리와 대화 주체를 구분하는 전처리부;
    상기 대화 주체 간의 대화 내용의 텍스트로부터 성격정보를 예측하는 성격정보 예측부;
    상기 성격정보를 기반으로, 상기 대화 주체의 성격특성을 가진 그룹이 신뢰하는 유형의 최적 성격특성을 선택하는 성격특성 선택부; 및
    상기 입력 대화문에서 수정 대상 텍스트와 상기 성격특성을 기반으로 수정 및 생성되는 대화 텍스트를 제안하는 대화 생성부
    를 포함하는 신뢰도 증강을 위한 맞춤형 대화 생성 시스템.
  2. 제1항에 있어서,
    상기 전처리부는
    상기 입력 대화문에서 대화 상대방과 사용자로 상기 대화 주체를 구분하고, 인공신경망의 입력값으로 전달하기 위해 상기 대화 주체 간의 대화 내용의 텍스트를 임베딩 벡터로 변환하는, 신뢰도 증강을 위한 맞춤형 대화 생성 시스템.
  3. 제2항에 있어서,
    상기 전처리부는
    상기 변환된 임베딩 벡터와 시작 발화임을 알리는 구분자 및 대화 주체자를 나타내는 구분자를 결합하여 상기 성격정보 예측부로 전달하는, 신뢰도 증강을 위한 맞춤형 대화 생성 시스템.
  4. 제1항에 있어서,
    상기 성격정보 예측부는
    대화문 임베딩 결합 층, 자가 주의집중 층, 선형 층 및 활성 층으로 구성되어 성격특성 사전학습 말뭉치를 사용하며, 상기 대화 내용의 텍스트로부터 대화 상대방의 성격정보를 추출하는, 신뢰도 증강을 위한 맞춤형 대화 생성 시스템.
  5. 제4항에 있어서,
    상기 성격특성 선택부는
    상기 성격정보를 기반으로 상기 대화 상대방의 성격특성을 예측하며, 예측한 대화 상대방의 성격특성을 가진 그룹 내 사람들이 신뢰할 수 있는 유형 최적의 상기 성격특성을 선택하는, 신뢰도 증강을 위한 맞춤형 대화 생성 시스템.
  6. 제5항에 있어서,
    상기 성격특성 선택부는
    선형 층 및 활성 층으로 구성되어 모델 훈련을 위해 성격 조합 학습 데이터를 사용하며,
    상기 성격 조합 학습 데이터는
    심리학 이론 및 규칙에 기반한 사상 함수(mapping function)인 것을 특징으로 하는, 신뢰도 증강을 위한 맞춤형 대화 생성 시스템.
  7. 제5항에 있어서,
    상기 대화 생성부는
    디코더 주의집중 층 및 선형 층으로 구성되며, 상기 수정 대상 텍스트와 상기 성격특성 선택부로부터 수신된 상기 성격특성을 기반으로, 스타일 전이 방식을 사용하여 상기 수정 대상 텍스트에 상기 성격특성을 적용하여 수정된 상기 대화 텍스트를 최종 결과로 출력하는, 신뢰도 증강을 위한 맞춤형 대화 생성 시스템.
  8. 입력 대화문에서 텍스트 전처리와 대화 주체를 구분하는 전처리 단계;
    상기 대화 주체 간의 대화 내용의 텍스트로부터 성격정보를 예측하는 단계;
    상기 성격정보를 기반으로, 상기 대화 주체의 성격특성을 가진 그룹이 신뢰하는 유형의 최적 성격특성을 선택하는 단계; 및
    상기 입력 대화문에서 수정 대상 텍스트와 상기 성격특성을 기반으로 수정 및 생성되는 대화 텍스트를 제안하는 단계
    를 포함하는 신뢰도 증강을 위한 맞춤형 대화 생성 방법.
  9. 제8항에 있어서,
    상기 전처리 단계는
    상기 입력 대화문에서 대화 상대방과 사용자로 상기 대화 주체를 구분하고, 인공신경망의 입력값으로 전달하기 위해 상기 대화 주체 간의 대화 내용의 텍스트를 임베딩 벡터로 변환하는, 신뢰도 증강을 위한 맞춤형 대화 생성 방법.
  10. 제9항에 있어서,
    상기 전처리 단계는
    상기 변환된 임베딩 벡터와 시작 발화임을 알리는 구분자 및 대화 주체자를 나타내는 구분자를 결합하여 상기 성격정보를 예측하는 단계로 전달하는, 신뢰도 증강을 위한 맞춤형 대화 생성 방법.
  11. 제8항에 있어서,
    상기 성격정보를 예측하는 단계는
    대화문 임베딩 결합 층, 자가 주의집중 층, 선형 층 및 활성 층으로 구성되어 성격특성 사전학습 말뭉치를 사용하며, 상기 대화 내용의 텍스트로부터 대화 상대방의 성격정보를 추출하는, 신뢰도 증강을 위한 맞춤형 대화 생성 방법.
  12. 제11항에 있어서,
    상기 성격특성을 선택하는 단계는
    상기 성격정보를 기반으로 상기 대화 상대방의 성격특성을 예측하며, 예측한 대화 상대방의 성격특성을 가진 그룹 내 사람들이 신뢰할 수 있는 유형 최적의 상기 성격특성을 선택하는, 신뢰도 증강을 위한 맞춤형 대화 생성 방법.
  13. 제12항에 있어서,
    상기 성격특성을 선택하는 단계는
    선형 층 및 활성 층으로 구성되어 모델 훈련을 위해 성격 조합 학습 데이터를 사용하며,
    상기 성격 조합 학습 데이터는
    심리학 이론 및 규칙에 기반한 사상 함수(mapping function)인 것을 특징으로 하는, 신뢰도 증강을 위한 맞춤형 대화 생성 방법.
  14. 제12항에 있어서,
    상기 대화 텍스트를 제안하는 단계는
    디코더 주의집중 층 및 선형 층으로 구성되며, 상기 수정 대상 텍스트와 상기 성격특성을 선택하는 단계로부터 수신된 상기 성격특성을 기반으로, 스타일 전이 방식을 사용하여 상기 수정 대상 텍스트에 상기 성격특성을 적용하여 수정된 상기 대화 텍스트를 최종 결과로 출력하는, 신뢰도 증강을 위한 맞춤형 대화 생성 방법.
PCT/KR2021/018136 2021-11-29 2021-12-02 대화 상대방의 성격정보를 고려하여 신뢰도 증강을 위한 맞춤형 대화 생성 시스템 및 그 방법 WO2023095988A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020210166873A KR20230079767A (ko) 2021-11-29 2021-11-29 대화 상대방의 성격정보를 고려하여 신뢰도 증강을 위한 맞춤형 대화 생성 시스템 및 그 방법
KR10-2021-0166873 2021-11-29

Publications (1)

Publication Number Publication Date
WO2023095988A1 true WO2023095988A1 (ko) 2023-06-01

Family

ID=86539732

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2021/018136 WO2023095988A1 (ko) 2021-11-29 2021-12-02 대화 상대방의 성격정보를 고려하여 신뢰도 증강을 위한 맞춤형 대화 생성 시스템 및 그 방법

Country Status (2)

Country Link
KR (1) KR20230079767A (ko)
WO (1) WO2023095988A1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170125008A1 (en) * 2014-04-17 2017-05-04 Softbank Robotics Europe Methods and systems of handling a dialog with a robot
KR101892736B1 (ko) * 2015-03-13 2018-08-28 한국전자통신연구원 실시간 단어별 지속시간 모델링을 이용한 발화검증 장치 및 방법
KR20190125154A (ko) * 2018-04-27 2019-11-06 아토머스 주식회사 심리 상담 데이터를 기계 학습한 자동 대화 장치 및 그 방법
KR20200031245A (ko) * 2018-09-14 2020-03-24 한국과학기술연구원 사용자 성격을 고려한 강화학습 기반 적응형 로봇 대화시스템 및 이를 이용한 적응형 로봇 대화방법
KR20210097935A (ko) * 2020-01-31 2021-08-10 한국과학기술원 대화문 발화 성격 인식 방법 및 시스템

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170125008A1 (en) * 2014-04-17 2017-05-04 Softbank Robotics Europe Methods and systems of handling a dialog with a robot
KR101892736B1 (ko) * 2015-03-13 2018-08-28 한국전자통신연구원 실시간 단어별 지속시간 모델링을 이용한 발화검증 장치 및 방법
KR20190125154A (ko) * 2018-04-27 2019-11-06 아토머스 주식회사 심리 상담 데이터를 기계 학습한 자동 대화 장치 및 그 방법
KR20200031245A (ko) * 2018-09-14 2020-03-24 한국과학기술연구원 사용자 성격을 고려한 강화학습 기반 적응형 로봇 대화시스템 및 이를 이용한 적응형 로봇 대화방법
KR20210097935A (ko) * 2020-01-31 2021-08-10 한국과학기술원 대화문 발화 성격 인식 방법 및 시스템

Also Published As

Publication number Publication date
KR20230079767A (ko) 2023-06-07

Similar Documents

Publication Publication Date Title
WO2021132797A1 (ko) 반지도 학습 기반 단어 단위 감정 임베딩과 장단기 기억 모델을 이용한 대화 내에서 발화의 감정 분류 방법
KR102161579B1 (ko) 응답문 생성 장치, 방법 및 프로그램, 그리고 음성 대화 시스템
WO2011074771A2 (ko) 외국어 학습 장치 및 그 제공 방법.
CN107731228A (zh) 英文语音信息的文本转换方法和装置
CN110444198A (zh) 检索方法、装置、计算机设备和存储介质
KR20200044388A (ko) 음성을 인식하는 장치 및 방법, 음성 인식 모델을 트레이닝하는 장치 및 방법
WO2021162362A1 (ko) 음성 인식 모델을 학습시키는 방법 및 상기 방법을 이용하여 학습된 음성 인식 장치
KR20210146089A (ko) 대화 스타일링 서비스를 위한 다중 페르소나 모델 생성 방법 및 이를 이용한 대화 스타일링 방법
WO2018169276A1 (ko) 언어 정보를 처리하기 위한 방법 및 그 전자 장치
Abhishek et al. Aiding the visually impaired using artificial intelligence and speech recognition technology
JP6810580B2 (ja) 言語モデル学習装置およびそのプログラム
WO2019031621A1 (ko) 통화 중 감정을 인식하여 인식된 감정을 활용하는 방법 및 시스템
KR102139855B1 (ko) 사용자와 대화하며 내면 상태를 이해하고 긴밀한 관계를 맺을 수 있는 감성지능형 개인비서 시스템
CN108831212B (zh) 一种口语教学辅助装置及方法
WO2023095988A1 (ko) 대화 상대방의 성격정보를 고려하여 신뢰도 증강을 위한 맞춤형 대화 생성 시스템 및 그 방법
WO2024090712A1 (ko) 공감대 형성을 통한 심리 치료용 인공지능 대화 시스템
KR20210051523A (ko) 도메인 자동 분류 대화 시스템
WO2022097816A1 (ko) 대화 상대와 사용자의 성격 정보를 고려한 대화 상대에 대한 신뢰 정도 예측 시스템 및 그 방법
CN116978367A (zh) 语音识别方法、装置、电子设备和存储介质
CN114333790A (zh) 数据处理方法、装置、设备、存储介质及程序产品
WO2024112169A1 (ko) 개체 유형 및 관계 정보에 대한 프롬프트 및 빈칸 추론을 이용한 대화 관계 추출 방법 및 장치
JP2020173441A (ja) 音声認識方法及び装置
WO2019098539A1 (ko) 음성 대화 제어 방법 및 장치
WO2021153830A1 (ko) 대화문 발화 성격 인식 방법 및 시스템
KR20210097935A (ko) 대화문 발화 성격 인식 방법 및 시스템

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21965772

Country of ref document: EP

Kind code of ref document: A1