KR20230079767A - 대화 상대방의 성격정보를 고려하여 신뢰도 증강을 위한 맞춤형 대화 생성 시스템 및 그 방법 - Google Patents

대화 상대방의 성격정보를 고려하여 신뢰도 증강을 위한 맞춤형 대화 생성 시스템 및 그 방법 Download PDF

Info

Publication number
KR20230079767A
KR20230079767A KR1020210166873A KR20210166873A KR20230079767A KR 20230079767 A KR20230079767 A KR 20230079767A KR 1020210166873 A KR1020210166873 A KR 1020210166873A KR 20210166873 A KR20210166873 A KR 20210166873A KR 20230079767 A KR20230079767 A KR 20230079767A
Authority
KR
South Korea
Prior art keywords
personality
conversation
text
dialogue
customized
Prior art date
Application number
KR1020210166873A
Other languages
English (en)
Inventor
박종철
송호윤
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020210166873A priority Critical patent/KR20230079767A/ko
Priority to PCT/KR2021/018136 priority patent/WO2023095988A1/ko
Publication of KR20230079767A publication Critical patent/KR20230079767A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation

Abstract

본 발명은 입력된 대화문으로부터 대화 상대방의 성격정보를 예측하고, 시스템 사용자의 발화를 대화 상대방과 동일한 성격특성을 가진 사람들이 신뢰하는 유형으로 변경하는 자연어 텍스트에 대한 스타일 전이(style transfer) 맞춤형 대화 생성 시스템 및 그 방법에 관한 것으로서, 입력 대화문에서 텍스트 전처리와 대화 주체를 구분하는 전처리부, 상기 대화 주체 간의 대화 내용의 텍스트로부터 성격정보를 예측하는 성격정보 예측부, 상기 성격정보를 기반으로, 상기 대화 주체의 성격특성을 가진 그룹이 신뢰하는 유형의 최적 성격특성을 선택하는 성격특성 선택부 및 상기 입력 대화문에서 수정 대상 텍스트와 상기 성격특성을 기반으로 수정 및 생성되는 대화 텍스트를 제안하는 대화 생성부를 포함한다.

Description

대화 상대방의 성격정보를 고려하여 신뢰도 증강을 위한 맞춤형 대화 생성 시스템 및 그 방법{SYSTEM FOR GENERATING CUSTOMIZED CONVERSATION FOR ENHANCING CREDIBILITY BY TRANSFERRING COMPATIBLE PERSONALITY TRAITS OF CONVERSATION PARTNER AND THE METHOD THEREOF}
본 발명은 대화 상대방의 성격정보를 고려하여 신뢰도 증강을 위한 맞춤형 대화 생성 시스템 및 그 방법에 관한 것으로서, 보다 상세하게는 입력된 대화문으로부터 대화 상대방의 성격정보를 예측하고, 시스템 사용자의 발화를 대화 상대방과 동일한 성격특성을 가진 사람들이 신뢰하는 유형으로 변경하는 자연어 텍스트에 대한 스타일 전이(style transfer) 기술에 관한 것이다.
인공신경망 기반의 성격 범주 예측 분야에서는 빅파이브(Big-Five)나 성격 유형 검사(MBTI)와 같은 심리학 분야에서 사용하는 성격 모델을 적용하여 발화자의 성격을 예측하는 연구가 매우 활발히 진행되고 있다. 또한, 인공신경망 모델을 사용하여 특정 텍스트에 대한 신뢰 정도를 예측하고 증강하는 연구도 활발히 진행되고 있다. 또한, 이미지 처리 분야에서 원본 이미지를 만화화 혹은 스케치화로 변경하는 스타일 전이 기술을 최근 자연어 처리 분야에서 원본 텍스트에 다른 특성을 추가하는 방법으로 적용하려는 시도 또한 많아지고 있다.
Big-Five 모델에서 ‘성실성(conscientiousness)’의 성향이 강하게 나타나는 사람은 반대 성향인 ‘충동성(impulsive)’의 성향이 강한 사람과 의견이 일치하지 않은 경우가 많은데 이러한 성격특성을 참고하여, 스타일 전이 기술을 사용해 상대방과 대화가 잘 통하는 유형의 성격으로 보이게 텍스트를 수정함으로써 신뢰도를 증강하는 기술 도입 사례는 보고된 바 있다. 하지만, 신뢰도 증강을 위해 대화 상대방의 성격을 분석하고, 분석한 내용을 참고하여 대화 상대방이 신뢰할 만한 성격을 가진 사람들의 대화 스타일로 대화문을 생성하는 방법은 아직 진행된 연구가 부족하다.
본 발명의 목적은 대화문에서 상대 발화자(또는 대화 상대방)에 대한 신뢰도를 증강하기 위해 심리학 이론에 기반한 성격모델 또는 통계적 분포 등을 적용하여, 대화로부터 상대방이 나타내는 성격을 인공신경망 모델을 기반으로 분석하고 이를 참고하여 상대방의 성격과 대화가 잘 통하는 유형의 성격을 스타일 전이 기술을 사용해 텍스트를 수정함으로써, 대화의 신뢰도를 증가시키는 방법을 제공하고자 한다.
본 발명의 목적은 대화문 내 상대방의 성격을 판단하기 위해 각 발화의 문맥 정보를 파악하고, 다양하게 나타날 수 있는 성격 범주들을 자가 주의집중 기법을 사용해 분석하여 성격 범주와 신뢰도 간의 의존성을 분석하고, 이를 바탕으로 사용자의 대답을 신뢰도가 높게 수정하는 방법을 제공하여 높은 신뢰도가 필요한 설득, 권유 등의 대화문 챗봇 시스템 개발에 도움을 주고자 한다.
다만, 본 발명이 해결하고자 하는 기술적 과제들은 상기 과제로 한정되는 것은 아니며, 본 발명의 기술적 사상 및 영역으로부터 벗어나지 않은 범위에서 다양하게 확장될 수 있다.
본 발명의 실시예에 따른 신뢰도 증강을 위한 맞춤형 대화 생성 시스템은 입력 대화문에서 텍스트 전처리와 대화 주체를 구분하는 전처리부, 상기 대화 주체 간의 대화 내용의 텍스트로부터 성격정보를 예측하는 성격정보 예측부, 상기 성격정보를 기반으로, 상기 대화 주체의 성격특성을 가진 그룹이 신뢰하는 유형의 최적 성격특성을 선택하는 성격특성 선택부 및 상기 입력 대화문에서 수정 대상 텍스트와 상기 성격특성을 기반으로 수정 및 생성되는 대화 텍스트를 제안하는 대화 생성부를 포함한다.
상기 전처리부는 상기 입력 대화문에서 대화 상대방과 사용자로 상기 대화 주체를 구분하고, 인공신경망의 입력값으로 전달하기 위해 상기 대화 주체 간의 대화 내용의 텍스트를 임베딩 벡터로 변환할 수 있다.
상기 전처리부는 상기 변환된 임베딩 벡터와 시작 발화임을 알리는 구분자 및 대화 주체자를 나타내는 구분자를 결합하여 상기 성격정보 예측부로 전달할 수 있다.
상기 성격정보 예측부는 대화문 임베딩 결합 층, 자가 주의집중 층, 선형 층 및 활성 층으로 구성되어 성격특성 사전학습 말뭉치를 사용하며, 상기 대화 내용의 텍스트로부터 대화 상대방의 성격정보를 추출할 수 있다.
상기 성격특성 선택부는 상기 성격정보를 기반으로 상기 대화 상대방의 성격특성을 예측하며, 예측한 대화 상대방의 성격특성을 가진 그룹 내 사람들이 신뢰할 수 있는 유형 최적의 상기 성격특성을 선택할 수 있다.
상기 성격특성 선택부는 선형 층 및 활성 층으로 구성되어 모델 훈련을 위해 성격 조합 학습 데이터를 사용하며, 상기 성격 조합 학습 데이터는 심리학 이론 및 규칙에 기반한 사상 함수(mapping function)일 수 있다.
상기 대화 생성부는 디코더 주의집중 층 및 선형 층으로 구성되며, 상기 수정 대상 텍스트와 상기 성격특성 선택부로부터 수신된 상기 성격특성을 기반으로, 스타일 전이 방식을 사용하여 상기 수정 대상 텍스트에 상기 성격특성을 적용하여 수정된 상기 대화 텍스트를 최종 결과로 출력할 수 있다.
본 발명의 실시예에 따른 신뢰도 증강을 위한 맞춤형 대화 생성 방법은 입력 대화문에서 텍스트 전처리와 대화 주체를 구분하는 전처리 단계, 상기 대화 주체 간의 대화 내용의 텍스트로부터 성격정보를 예측하는 단계, 상기 성격정보를 기반으로, 상기 대화 주체의 성격특성을 가진 그룹이 신뢰하는 유형의 최적 성격특성을 선택하는 단계 및 상기 입력 대화문에서 수정 대상 텍스트와 상기 성격특성을 기반으로 수정 및 생성되는 대화 텍스트를 제안하는 단계를 포함한다.
상기 전처리 단계는 상기 입력 대화문에서 대화 상대방과 사용자로 상기 대화 주체를 구분하고, 인공신경망의 입력값으로 전달하기 위해 상기 대화 주체 간의 대화 내용의 텍스트를 임베딩 벡터로 변환할 수 있다.
상기 전처리 단계는 상기 변환된 임베딩 벡터와 시작 발화임을 알리는 구분자 및 대화 주체자를 나타내는 구분자를 결합하여 상기 성격정보를 예측하는 단계로 전달할 수 있다.
상기 성격정보를 예측하는 단계는 대화문 임베딩 결합 층, 자가 주의집중 층, 선형 층 및 활성 층으로 구성되어 성격특성 사전학습 말뭉치를 사용하며, 상기 대화 내용의 텍스트로부터 대화 상대방의 성격정보를 추출할 수 있다.
상기 성격특성을 선택하는 단계는 상기 성격정보를 기반으로 상기 대화 상대방의 성격특성을 예측하며, 예측한 대화 상대방의 성격특성을 가진 그룹 내 사람들이 신뢰할 수 있는 유형 최적의 상기 성격특성을 선택할 수 있다.
상기 성격특성을 선택하는 단계는 선형 층 및 활성 층으로 구성되어 모델 훈련을 위해 성격 조합 학습 데이터를 사용하며, 상기 성격 조합 학습 데이터는 심리학 이론 및 규칙에 기반한 사상 함수(mapping function)일 수 있다.
상기 대화 텍스트를 제안하는 단계는 디코더 주의집중 층 및 선형 층으로 구성되며, 상기 수정 대상 텍스트와 상기 성격특성을 선택하는 단계로부터 수신된 상기 성격특성을 기반으로, 스타일 전이 방식을 사용하여 상기 수정 대상 텍스트에 상기 성격특성을 적용하여 수정된 상기 대화 텍스트를 최종 결과로 출력할 수 있다.
본 발명의 실시예에 따르면, 대화문 내 대화 상대방의 성격정보를 예측하고, 그 성격특성을 가진 사람들이 가장 신뢰하는 유형의 대화 스타일을 사용자의 텍스트에 적용함으로써, 대화 상대방으로부터 신뢰할 수 있는 대화를 이끌어 내야하는 상황에 도움을 줄 수 있다. 이를 개인용 챗봇 시스템에 적용하면 사용자 맞춤형 대화 시스템을 구축할 수 있으며, 또한 상대방에 대한 설득 혹은 권유가 목적인 대화형 챗봇 시스템을 구축하는 경우에도 도움을 줄 수 있다.
다만, 본 발명의 효과는 상기 효과들로 한정되는 것은 아니며, 본 발명의 기술적 사상 및 영역으로부터 벗어나지 않는 범위에서 다양하게 확장될 수 있다.
도 1은 본 발명의 실시예에 따른 신뢰도 증강을 위한 맞춤형 대화 생성 시스템의 세부 구성을 블록도로 도시한 것이다.
도 2는 본 발명의 실시예에 따른 입력 대화문에 대한 성격 맞춤형 대화를 생성하는 인공신경망 모델의 과정을 설명하기 위해 도시한 것이다.
도 3은 본 발명의 실시예에 따른 신뢰도 증강을 위한 맞춤형 대화 생성 방법의 동작 흐름도를 도시한 것이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며, 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예들을 보다 상세하게 설명하고자 한다. 도면 상의 동일한 구성요소에 대해서는 동일한 참조 부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
본 발명의 실시예들은, 대화 상황에서 대화 상대방으로부터 높은 신뢰를 얻기 위해, 자연어 텍스트 생성 및 수정을 통해 다음 발화를 제안하는 것을 그 요지로 한다. 보다 상세하게, 본 발명은 대화문에서 나타나는 언어의 분석을 통해 대화 상대방의 성격을 자동으로 예측하고, 예측한 성격정보를 고려하여 대화 상대방이 가장 신뢰할 수 있는 유형의 성격특성을 선택함으로써, 대화 스타일을 기반으로 대화 텍스트를 출력하여 신뢰도를 증강할 수 있다.
이하에서는 도 1 내지 도 3을 참조하여 본 발명에 대해 상세히 설명한다.
도 1은 본 발명의 실시예에 따른 신뢰도 증강을 위한 맞춤형 대화 생성 시스템의 세부 구성을 블록도로 도시한 것이다.
도 1을 참조하면, 본 발명의 실시예에 따른 신뢰도 증강을 위한 맞춤형 대화 생성 시스템은 입력된 대화문으로부터 대화 상대방의 성격정보를 예측하고, 시스템 사용자의 발화를 대화 상대방과 동일한 성격특성을 가진 사람들이 신뢰하는 유형으로 변경하는 자연어 텍스트에 대한 스타일 전이(style transfer)한다.
이를 위해, 본 발명의 실시예에 따른 신뢰도 증강을 위한 맞춤형 대화 생성 시스템(100)은 전처리부(110), 성격정보 예측부(120), 성격특성 선택부(130) 및 대화 생성부(140)를 포함한다.
전처리부(110)는 입력 대화문에서 텍스트 전처리와 대화 주체를 구분한다.
전처리부(110)는 신뢰 향상 대화를 위한 맞춤형 대화 생성 시스템(100)을 통해 입력 대화문(10)을 입력 받는다. 이때, 입력 대화문(10)은 두 명의 발화자가 참여하는 대화 내용이 포함된 텍스트를 나타낸다.
전처리부(110)는 입력 대화문(10)에서 대화 상대방과 사용자로 대화 주체를 구분하고, 인공신경망의 입력값으로 전달하기 위해 대화 주체 간의 대화 내용의 텍스트를 임베딩 벡터로 변환할 수 있다. 예를 들면, 전처리부(110)는 입력 대화문(10)에서 A, B 또는 갑, 을과 같이 대화 상대방과 사용자로 대화 주체를 구분할 수 있다. 입력 대화문(10)은 문장 시작임을 알리는 구분자(예를 들면, <CLS>, <SEP>), 발화자를 나타내는 구분자(예를 들면, <A>, <B>)를 포함할 수 있다.
이에 따라서, 전처리부(110)는 입력 대화문(10)을 각 대화 주체별로 구분되어 변환된 임베딩 벡터와 시작 발화임을 알리는 구분자 및 대화 주체자를 나타내는 구분자를 결합하여 성격정보 예측부(120)로 전달하는 것을 특징으로 한다. 임베딩 벡터로 변환된 후 결과값은 텍스트 내 언어요소(token)에 대한 임베딩 벡터를 포함한다. 상기 언어요소는 문장을 나타내는 단위이며, 띄어쓰기를 통한 단어 구분 혹은, Byte-Pair Encoding(BPE)의 subword units, Unigram Language Model에 의해 나누어진 subwords가 사용될 수 있다.
성격정보 예측부(120)는 대화 주체 간의 대화 내용의 텍스트로부터 성격정보를 예측한다.
성격정보 예측부(120)는 대화문 임베딩 결합 층, 자가 주의집중 층, 선형 층 및 활성 층으로 구성되는 인공신경망 기반의 성격 예측 모델을 사용하며, 모델 훈련을 위해 성격특성 사전학습 말뭉치(121)를 사용한다. 성격특성 예측부(120)는 입력 대화문(10) 내 대화 내용의 텍스트로부터 대화 상대방의 성격정보를 추출하여 신뢰도 증강을 위한 성격특성 선택부(130)로 전달한다. 이때, 발화 주체(대화 상대방과 사용자)의 성격 예측에 사용되는 심리학 모델(성격 예측 모델)은 빅 파이브(Big-Five) 및 MBTI 등의 모델들이 사용될 수 있다. 또한, 발화로부터 성격정보와 성격 조합을 예측하는 과정은 다중 작업 학습, 자가 주의 집중 과정을 포함할 수 있다.
보다 상세하게, 자가 주의집중 층은 대화문과 같이 긴 길이를 가진 텍스트 내 언어요소(token) 간의 의존관계를 효과적으로 분석하는 Transformer Encoder가 사용될 수 있다. 또한, 선형 층 및 활성 층은 각각 Feed-forward layer와 Softmax function이 사용될 수 있다. 더욱이, 자가 주의집중 층에 전달된 후, 결과값은 각 언어요소에 대한 문맥 정보로 변환된 임베딩 벡터를 포함한다. 또한, 결과값은 자가 주의집중 층의 특성으로 인해 주변 발화의 언어요소를 고려하여 현재 발화의 의미를 효과적으로 탐지할 수 있다.
성격특성 선택부(130)는 성격정보를 기반으로, 대화 주체의 성격특성을 가진 그룹이 신뢰하는 유형의 최적 성격특성을 선택한다.
성격특성 선택부(130)는 선형 층 및 활성 층으로 구성되어 모델 훈련을 위해 성격 조합 학습 데이터(131)를 사용한다. 성격 조합 학습 데이터(131)는 심리학 이론 및 규칙에 기반한 사상 함수(mapping function)일 수 있다.
성격특성 선택부(130)는 성격정보를 기반으로 대화 상대방의 성격특성을 예측하며, 예측한 대화 상대방의 성격특성과 신뢰도 간의 연관성을 활용하여 대화 상대방과 대화가 잘 통하는 즉, 성격특성이 유사한 그룹 내 사람들이 신뢰할 수 있는 유형의 최적 성격특성을 선택할 수 있다. 예를 들면, 성격특성 선택부(130)는 성격정보를 기반으로 대화 상대방이 A 성격특성을 가진 것으로 예측할 수 있으며, A 성격특성을 가진 A 그룹 내 사람들이 가장 신뢰할 수 있는 유형의 성격특성 예를 들어, 신뢰성 또는 믿음성을 선택하여 최적 성격특성으로 선택할 수 있다. 이때, 성격특성 선택부(130)는 대화 상대방의 최적의 성격특성을 선택하기 위해, 통계적 수치, MBTI 성격 유형 간의 궁합, 심리학 이론 등 다양한 방법론들을 사용할 수 있다.
성격특성 선택부(130)를 구성하는 선형 층 및 활성 층은 성격정보 예측부(120)로부터 전달받은 성격정보와 가장 대화가 잘 통할 것으로 예측되는 성격특성을 예측하여 성격특성 스타일 전이 대화 생성부(140)로 전달한다.
대화 생성부(140)는 입력 대화문에서 수정 대상 텍스트와 성격특성을 기반으로 수정 및 생성되는 대화 텍스트를 제안한다. 대화 생성부(140)는 입력 대화문 중에서 수정이 필요한 대상 텍스트를 일부만 추출하여 수정 대상 텍스트로 분류할 수 있으며, 성격특성을 기반으로 수정 대상 텍스트에 스타일 전이를 통해 수정하거나, 성격특성을 적용하여 새로운 텍스트를 생성하여 대화 텍스트를 제안할 수 있다.
보다 상세하게, 대화 생성부(140)는 디코더 주의집중 층 및 선형 층으로 구성되며, 수정 대상 텍스트와 성격특성 선택부(130)로부터 수신된 성격특성을 기반으로, 스타일 전이 방식을 사용하여 수정 대상 텍스트에 성격특성을 적용하여 수정된 대화 텍스트를 최종 결과로 출력할 수 있다. 디코더 주의집중 층은 텍스트 내 언어요소(token)와 인코더의 출력 간의 의존관계를 효과적으로 분석하는 Transformer Decoder가 사용될 수 있다. 선형 층 및 활성 층은 Feed-forward layer와 Softmax function, Dense function 등이 사용될 수 있다.
도 2는 본 발명의 실시예에 따른 입력 대화문에 대한 성격 맞춤형 대화를 생성하는 인공신경망 모델의 과정을 설명하기 위해 도시한 것이다.
도 2를 참조하면, 본 발명은 하나의 입력 대화문(201)을 문맥 정보와 함께 나열하여 입력 시퀀스로 전달한다. 도 1의 성격정보 예측부(120)는 텍스트 임베딩 결합 층(210)과 자가 주의집중 층(230)을 포함하고 있으며, 전달받은 입력 시퀀스는 대화문 임베딩 결합 층(210) 및 자가 주의집중 층(220)에 전달된다. 이에, 성격정보 예측부(120)는 입력 임베딩 벡터(220) 및 문맥 임베딩 벡터(240)와 같은 다른 말뭉치로 훈련된 독립적인 선형 층(250)에 의해 대화 주체자에 대한 성격정보를 예측하고, 선형 층 및 활성 층(260)으로 구성된 성격특성 선택부(130)에 의해 대화 주체의 성격특성을 가진 그룹이 신뢰하는 유형의 최적 성격특성 예측을 진행한다.
독립적인 선형 층(260)의 결과 벡터는 성격특성 선택부(130)의 입력값으로 전달되어 추출된 성격특성이 가장 신뢰할 수 있는 대화 스타일을 찾아 디코더 주의집중 층(280) 및 선형 층(290)으로 구성된 성격특성 스타일 전이 대화 생성부(140)에 전달된다. 최종적으로 선형 층(290)에서 수정 대상 텍스트(270)에 스타일 전이 방법을 통해 성격 스타일을 적용함으로써, 수정된 텍스트인 대화 텍스트(202)를 생성한다.
도 3은 본 발명의 실시예에 따른 신뢰도 증강을 위한 맞춤형 대화 생성 방법의 동작 흐름도를 도시한 것이다.
도 3을 참조하면, 단계 S310에서, 입력 대화문에서 텍스트 전처리와 대화 주체를 구분한다.
단계 S310은 입력 대화문을 수신하며, 입력 대화문은 두 명의 발화자가 참여하는 대화 내용이 포함된 텍스트를 나타낸다.
단계 S310은 입력 대화문에서 대화 상대방과 사용자로 대화 주체를 구분하고, 인공신경망의 입력값으로 전달하기 위해 대화 주체 간의 대화 내용의 텍스트를 임베딩 벡터로 변환할 수 있다. 예를 들면, 단계 S310은 입력 대화문에서 A, B 또는 갑, 을과 같이 대화 상대방과 사용자로 대화 주체를 구분할 수 있으며, 입력 대화문은 문장 시작임을 알리는 구분자(예를 들면, <CLS>, <SEP>), 발화자를 나타내는 구분자(예를 들면, <A>, <B>)를 포함할 수 있다.
이에 따라서, 단계 S310은 입력 대화문을 각 대화 주체별로 구분되어 변환된 임베딩 벡터와 시작 발화임을 알리는 구분자 및 대화 주체자를 나타내는 구분자를 결합하여 단계 S320으로 전달하는 것을 특징으로 한다.
단계 S320에서, 대화 주체 간의 대화 내용의 텍스트로부터 성격정보를 예측한다.
단계 S320은 대화문 임베딩 결합 층, 자가 주의집중 층, 선형 층 및 활성 층으로 구성되는 인공신경망 기반의 성격 예측 모델을 사용하며, 모델 훈련을 위해 성격특성 사전학습 말뭉치를 사용한다. 단계 S320은 입력 대화문 내 대화 내용의 텍스트로부터 대화 상대방의 성격정보를 추출하여 신뢰도 증강을 위한 단계 S330으로 전달한다. 이때, 발화 주체(대화 상대방과 사용자)의 성격 예측에 사용되는 심리학 모델(성격 예측 모델)은 빅 파이브(Big-Five) 및 MBTI 등의 모델들이 사용될 수 있다. 또한, 발화로부터 성격정보와 성격 조합을 예측하는 과정은 다중 작업 학습, 자가 주의 집중 과정을 포함할 수 있다.
단계 S330에서, 성격정보를 기반으로, 대화 주체의 성격특성을 가진 그룹이 신뢰하는 유형의 최적 성격특성을 선택한다.
단계 S330은 선형 층 및 활성 층으로 구성되어 모델 훈련을 위해 성격 조합 학습 데이터를 사용하며, 성격 조합 학습 데이터(131)는 심리학 이론 및 규칙에 기반한 사상 함수(mapping function)일 수 있다.
단계 S330은 성격정보를 기반으로 대화 상대방의 성격특성을 예측하며, 예측한 대화 상대방의 성격특성과 신뢰도 간의 연관성을 활용하여 대화 상대방과 대화가 잘 통하는 즉, 성격특성이 유사한 그룹 내 사람들이 신뢰할 수 있는 유형의 최적 성격특성을 선택할 수 있다. 예를 들면, 단계 S330은 성격정보를 기반으로 대화 상대방이 A 성격특성을 가진 것으로 예측할 수 있으며, A 성격특성을 가진 A 그룹 내 사람들이 가장 신뢰할 수 있는 유형의 성격특성 예를 들어, 신뢰성 또는 믿음성을 선택하여 최적 성격특성으로 선택할 수 있다. 이때, 단계 S330은 대화 상대방의 최적의 성격특성을 선택하기 위해, 통계적 수치, MBTI 성격 유형 간의 궁합, 심리학 이론 등 다양한 방법론들을 사용할 수 있다.
단계 S340에서, 입력 대화문에서 수정 대상 텍스트와 성격특성을 기반으로 수정 및 생성되는 대화 텍스트를 제안한다. 단계 S340은 입력 대화문 중에서 수정이 필요한 대상 텍스트를 일부만 추출하여 수정 대상 텍스트로 분류할 수 있으며, 성격특성을 기반으로 수정 대상 텍스트에 스타일 전이를 통해 수정하거나, 성격특성을 적용하여 새로운 텍스트를 생성하여 대화 텍스트를 제안할 수 있다. 보다 상세하게, 단계 S340은 디코더 주의집중 층 및 선형 층으로 구성되며, 수정 대상 텍스트와 단계 S330로부터 수신된 성격특성을 기반으로, 스타일 전이 방식을 사용하여 수정 대상 텍스트에 성격특성을 적용하여 수정된 대화 텍스트를 최종 결과로 출력할 수 있다.
이상에서 설명된 시스템 또는 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(Field Programmable Gate Array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (14)

  1. 입력 대화문에서 텍스트 전처리와 대화 주체를 구분하는 전처리부;
    상기 대화 주체 간의 대화 내용의 텍스트로부터 성격정보를 예측하는 성격정보 예측부;
    상기 성격정보를 기반으로, 상기 대화 주체의 성격특성을 가진 그룹이 신뢰하는 유형의 최적 성격특성을 선택하는 성격특성 선택부; 및
    상기 입력 대화문에서 수정 대상 텍스트와 상기 성격특성을 기반으로 수정 및 생성되는 대화 텍스트를 제안하는 대화 생성부
    를 포함하는 신뢰도 증강을 위한 맞춤형 대화 생성 시스템.
  2. 제1항에 있어서,
    상기 전처리부는
    상기 입력 대화문에서 대화 상대방과 사용자로 상기 대화 주체를 구분하고, 인공신경망의 입력값으로 전달하기 위해 상기 대화 주체 간의 대화 내용의 텍스트를 임베딩 벡터로 변환하는, 신뢰도 증강을 위한 맞춤형 대화 생성 시스템.
  3. 제2항에 있어서,
    상기 전처리부는
    상기 변환된 임베딩 벡터와 시작 발화임을 알리는 구분자 및 대화 주체자를 나타내는 구분자를 결합하여 상기 성격정보 예측부로 전달하는, 신뢰도 증강을 위한 맞춤형 대화 생성 시스템.
  4. 제1항에 있어서,
    상기 성격정보 예측부는
    대화문 임베딩 결합 층, 자가 주의집중 층, 선형 층 및 활성 층으로 구성되어 성격특성 사전학습 말뭉치를 사용하며, 상기 대화 내용의 텍스트로부터 대화 상대방의 성격정보를 추출하는, 신뢰도 증강을 위한 맞춤형 대화 생성 시스템.
  5. 제4항에 있어서,
    상기 성격특성 선택부는
    상기 성격정보를 기반으로 상기 대화 상대방의 성격특성을 예측하며, 예측한 대화 상대방의 성격특성을 가진 그룹 내 사람들이 신뢰할 수 있는 유형 최적의 상기 성격특성을 선택하는, 신뢰도 증강을 위한 맞춤형 대화 생성 시스템.
  6. 제5항에 있어서,
    상기 성격특성 선택부는
    선형 층 및 활성 층으로 구성되어 모델 훈련을 위해 성격 조합 학습 데이터를 사용하며,
    상기 성격 조합 학습 데이터는
    심리학 이론 및 규칙에 기반한 사상 함수(mapping function)인 것을 특징으로 하는, 신뢰도 증강을 위한 맞춤형 대화 생성 시스템.
  7. 제5항에 있어서,
    상기 대화 생성부는
    디코더 주의집중 층 및 선형 층으로 구성되며, 상기 수정 대상 텍스트와 상기 성격특성 선택부로부터 수신된 상기 성격특성을 기반으로, 스타일 전이 방식을 사용하여 상기 수정 대상 텍스트에 상기 성격특성을 적용하여 수정된 상기 대화 텍스트를 최종 결과로 출력하는, 신뢰도 증강을 위한 맞춤형 대화 생성 시스템.
  8. 입력 대화문에서 텍스트 전처리와 대화 주체를 구분하는 전처리 단계;
    상기 대화 주체 간의 대화 내용의 텍스트로부터 성격정보를 예측하는 단계;
    상기 성격정보를 기반으로, 상기 대화 주체의 성격특성을 가진 그룹이 신뢰하는 유형의 최적 성격특성을 선택하는 단계; 및
    상기 입력 대화문에서 수정 대상 텍스트와 상기 성격특성을 기반으로 수정 및 생성되는 대화 텍스트를 제안하는 단계
    를 포함하는 신뢰도 증강을 위한 맞춤형 대화 생성 방법.
  9. 제8항에 있어서,
    상기 전처리 단계는
    상기 입력 대화문에서 대화 상대방과 사용자로 상기 대화 주체를 구분하고, 인공신경망의 입력값으로 전달하기 위해 상기 대화 주체 간의 대화 내용의 텍스트를 임베딩 벡터로 변환하는, 신뢰도 증강을 위한 맞춤형 대화 생성 방법.
  10. 제9항에 있어서,
    상기 전처리 단계는
    상기 변환된 임베딩 벡터와 시작 발화임을 알리는 구분자 및 대화 주체자를 나타내는 구분자를 결합하여 상기 성격정보를 예측하는 단계로 전달하는, 신뢰도 증강을 위한 맞춤형 대화 생성 방법.
  11. 제8항에 있어서,
    상기 성격정보를 예측하는 단계는
    대화문 임베딩 결합 층, 자가 주의집중 층, 선형 층 및 활성 층으로 구성되어 성격특성 사전학습 말뭉치를 사용하며, 상기 대화 내용의 텍스트로부터 대화 상대방의 성격정보를 추출하는, 신뢰도 증강을 위한 맞춤형 대화 생성 방법.
  12. 제11항에 있어서,
    상기 성격특성을 선택하는 단계는
    상기 성격정보를 기반으로 상기 대화 상대방의 성격특성을 예측하며, 예측한 대화 상대방의 성격특성을 가진 그룹 내 사람들이 신뢰할 수 있는 유형 최적의 상기 성격특성을 선택하는, 신뢰도 증강을 위한 맞춤형 대화 생성 방법.
  13. 제12항에 있어서,
    상기 성격특성을 선택하는 단계는
    선형 층 및 활성 층으로 구성되어 모델 훈련을 위해 성격 조합 학습 데이터를 사용하며,
    상기 성격 조합 학습 데이터는
    심리학 이론 및 규칙에 기반한 사상 함수(mapping function)인 것을 특징으로 하는, 신뢰도 증강을 위한 맞춤형 대화 생성 방법.
  14. 제12항에 있어서,
    상기 대화 텍스트를 제안하는 단계는
    디코더 주의집중 층 및 선형 층으로 구성되며, 상기 수정 대상 텍스트와 상기 성격특성을 선택하는 단계로부터 수신된 상기 성격특성을 기반으로, 스타일 전이 방식을 사용하여 상기 수정 대상 텍스트에 상기 성격특성을 적용하여 수정된 상기 대화 텍스트를 최종 결과로 출력하는, 신뢰도 증강을 위한 맞춤형 대화 생성 방법.
KR1020210166873A 2021-11-29 2021-11-29 대화 상대방의 성격정보를 고려하여 신뢰도 증강을 위한 맞춤형 대화 생성 시스템 및 그 방법 KR20230079767A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020210166873A KR20230079767A (ko) 2021-11-29 2021-11-29 대화 상대방의 성격정보를 고려하여 신뢰도 증강을 위한 맞춤형 대화 생성 시스템 및 그 방법
PCT/KR2021/018136 WO2023095988A1 (ko) 2021-11-29 2021-12-02 대화 상대방의 성격정보를 고려하여 신뢰도 증강을 위한 맞춤형 대화 생성 시스템 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210166873A KR20230079767A (ko) 2021-11-29 2021-11-29 대화 상대방의 성격정보를 고려하여 신뢰도 증강을 위한 맞춤형 대화 생성 시스템 및 그 방법

Publications (1)

Publication Number Publication Date
KR20230079767A true KR20230079767A (ko) 2023-06-07

Family

ID=86539732

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210166873A KR20230079767A (ko) 2021-11-29 2021-11-29 대화 상대방의 성격정보를 고려하여 신뢰도 증강을 위한 맞춤형 대화 생성 시스템 및 그 방법

Country Status (2)

Country Link
KR (1) KR20230079767A (ko)
WO (1) WO2023095988A1 (ko)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2933070A1 (en) * 2014-04-17 2015-10-21 Aldebaran Robotics Methods and systems of handling a dialog with a robot
KR101892736B1 (ko) * 2015-03-13 2018-08-28 한국전자통신연구원 실시간 단어별 지속시간 모델링을 이용한 발화검증 장치 및 방법
KR102199423B1 (ko) * 2018-04-27 2021-01-06 아토머스 주식회사 심리 상담 데이터를 기계 학습한 자동 대화 장치 및 그 방법
KR102140685B1 (ko) * 2018-09-14 2020-08-04 한국과학기술연구원 사용자 성격을 고려한 강화학습 기반 적응형 로봇 대화시스템 및 이를 이용한 적응형 로봇 대화방법
KR102319013B1 (ko) * 2020-01-31 2021-10-29 한국과학기술원 대화문 발화 성격 인식 방법 및 시스템

Also Published As

Publication number Publication date
WO2023095988A1 (ko) 2023-06-01

Similar Documents

Publication Publication Date Title
Adel et al. Combination of recurrent neural networks and factored language models for code-switching language modeling
KR102161579B1 (ko) 응답문 생성 장치, 방법 및 프로그램, 그리고 음성 대화 시스템
KR20190019748A (ko) 자연어 생성 방법 및 장치
KR102315830B1 (ko) 반지도 학습 기반 단어 단위 감정 임베딩과 lstm 모델을 이용한 대화 내에서 발화의 감정 분류 방법
JP2018146715A (ja) 音声対話装置、その処理方法及びプログラム
KR20200056001A (ko) 인공신경망에서의 디코딩 방법 및 그 장치
KR20200080681A (ko) 음성 합성 방법 및 장치
KR20200044388A (ko) 음성을 인식하는 장치 및 방법, 음성 인식 모델을 트레이닝하는 장치 및 방법
CN116745771A (zh) 语音识别转录本的标点和大写
CN113591462A (zh) 弹幕回复生成方法、装置及电子设备
JP6810580B2 (ja) 言語モデル学習装置およびそのプログラム
KR102183284B1 (ko) 교차언어 환경에서의 대화 상태 추적 방법 및 시스템
KR20210058701A (ko) 의존 구문 분석 시스템 및 이를 이용한 의존 구문 분석 방법
WO2017094913A1 (ja) 自然言語処理装置及び自然言語処理方法
KR20230079767A (ko) 대화 상대방의 성격정보를 고려하여 신뢰도 증강을 위한 맞춤형 대화 생성 시스템 및 그 방법
KR20210059995A (ko) 학습 기반의 외국어 말하기 평가 방법 및 그 시스템
KR102501869B1 (ko) 문장 중요도에 기반한 문서 수준의 감성 분류 방법 및 장치
KR102464190B1 (ko) 대화 상대와 사용자의 성격 정보를 고려한 대화 상대에 대한 신뢰 정도 예측 시스템 및 그 방법
Park et al. KNU CI System at SemEval-2018 Task4: Character Identification by Solving Sequence-Labeling Problem
JP7291099B2 (ja) 音声認識方法及び装置
KR20220133064A (ko) 대화 요약 모델 학습 장치 및 방법
KR102220106B1 (ko) 음성 인식된 문장의 보정 방법
KR20210065066A (ko) 상식 지식과 언어학적 패턴을 이용한 서술문 신뢰도 평가 시스템 및 그 방법
KR102659389B1 (ko) 신뢰도와 언어폭력 간 의존성을 이용한 언어폭력 수정 및 텍스트 신뢰도 증강 시스템 및 그 방법
KR20200117826A (ko) 음성 인식 방법 및 장치