KR20240051469A

KR20240051469A - 텍스트 기반의 대화 장치

Info

Publication number: KR20240051469A
Application number: KR1020220131167A
Authority: KR
Inventors: 홍진우; 백남주; 이희도
Original assignee: 홍진우; 백남주; 이희도
Priority date: 2022-10-13
Filing date: 2022-10-13
Publication date: 2024-04-22

Abstract

본 발명은 사용자 사이에 오고가는 대화 중 정보를 추추하고, 비속어, 욕설을 필터링하고, 질문 생성, 답변을 통해 대화를 유도하고, 정보를 제시하고, 검색 기능을 제공하고, 다자간의 구어체 대화를 그 흐름이 나누어지는 지점을 탐지하고, 채팅에서 이루어지는 대화에 포함된 문단, 문장, 키워드의 정보를 추출한다.

Description

텍스트 기반의 대화 장치{TEXT-BASED CONVERSATIONAL DEVICE}

본 발명은 텍스트 기반의 대화 장치에 관한 것으로, 보다 상세하게는 사용자가 채팅에서 대화를 원활하게 진행하고, 대화에 포함된 정보를 정확하게 추출하는 텍스트 기반의 대화 장치에 관한 것이다.

본 발명에 관련된 종래기술에는 키워드 정보 제공, 키워드 검색, 감성형 채팅, 맞춤형 키워드 추출이 있다. 특허문헌 1 키워드 정보 제공 방법은 키워드로부터 생성된 확장 의미 정보의 조합으로부터 부가 선택 정보를 검색하여 사용자에 제공한다. 또한, 특허문헌 2 인터랙션을 통해 키워드를 검색하는 단말, 서버 및 방법은 선택된 키워드에 대응하는 검색 결과를 디스플레이한다. 또한, 특허문헌 3 감성형 채팅 어플리케이션, 채팅 어플리케이션의 채팅 서비스 방법 및 채팅 서버는 채팅 서비스를 제공한다. 또한, 특허문헌 4 사용자 간의 관계와 사용자 성향을 고려한 채팅 서비스 내 대화 내용에서의 사용자 맞춤형 키워드 추출 시스템은 키워드 중에서 사용자가 관심 있어 하는 대화 키워드를 선택하면 클라이언트 단말기가 대화 키워드에 관련된 대화 내용을 사용자가 볼 수 있도록 출력한다.

그러나 종래기술은 사용자 사이에 오고가는 대화 중 정보를 추출하고, 비속어, 욕설을 필터링하고, 질문 생성, 답변을 통해 대화를 유도하고, 정보를 제시하고, 검색 기능을 제공하지 못하는 문제점이 있다.

공개특허공보 제10-2013-0062799호 키워드 정보 제공 방법 등록특허공보 제10-1665969호 인터랙션을 통해 키워드를 검색하는 단말, 서버 및 방법 공개특허공보 제10-2018-0002197호 감성형 채팅 어플리케이션, 채팅 어플리케이션의 채팅 서비스 방법 및 채팅 서버 공개특허공보 제10-2020-0012086호 사용자 간의 관계와 사용자 성향을 고려한 채팅 서비스 내 대화 내용에서의 사용자 맞춤형 키워드 추출 시스템

본 발명은 사용자 사이에 오고가는 대화 중 정보를 추출하고, 비속어, 욕설을 필터링하고, 질문 생성, 답변을 통해 대화를 유도하고, 정보를 제시하고, 검색 기능을 제공하는 텍스트 기반의 대화 장치를 제공하는 것을 목적으로 한다.

또한, 본 발명은 다자간의 구어체 대화를 그 흐름이 나누어지는 지점을 탐지하고, 채팅에서 이루어지는 대화에 포함된 문단, 문장, 키워드의 정보를 추출하는 텍스트 기반의 대화 장치를 제공하는 것을 또 다른 목적으로 한다.

본 발명의 바람직한 일 실시예에 따른 텍스트 기반의 대화 장치는, 상세 구성인 세그멘테이션(211), 키워드 추출(212)을 이용하여 채팅에서 이루어지는 대화에 포함된 문단, 문장, 키워드의 정보를 추출하는 정보 추출(21); 사용자 단말기 사이에 오고가는 대화 중 비속어, 욕설을 필터링하고, 경고음을 출력할 수 있고, 광고성 게시글, 욕설의 혐오 발언을 알고리즘을 이용하여 필터링하는 품질 관리(22); 대화 중 질문을 생성하고, 생성된 질문에 대응한 답변을 입력받아 저장하고, 대화 히스토리를 기록하고, 질문에 대한 답변 받기 푸시 알림 모드를 제공하고, 채팅 서비스에 재화, 토큰, 포인트를 도입하여 질문 횟수를 제한하고, 좋은 답변, 대화 참여에 대한 동기를 부여하는 대화 유도(23); 질의와 응답으로 태깅되는 텍스트 데이터를 확보하여, 라벨링된 데이터를 생성하고, 생성된 대화 쌍으로 챗봇을 만들고, 위키피디아 데이터 세트를 구축하는 질의응답(24); 및 사용자 사이에 이루어지는 대화 중 문장, 키워드 검색을 가능하게 하는 검색(25);을 포함하는 것을 특징으로 한다.

또한, 상기 정보 추출(21)은, 다자간의 구어체 대화를 그 흐름이 나누어지는 지점을 탐지하는 세그멘테이션(211); 및 구분 대화 세션 간에서 임베딩 벡터간의 코사인 유사도를 이용하여 채팅에서 이루어지는 대화에 포함된 문단, 문장, 키워드의 정보를 추출하는 키워드 추출(212);을 포함하는 것을 특징으로 한다.

또한, 상기 대화 유도(23)는, 대화 중 질문을 생성하는 질문 생성(231); 및 생성된 질문에 대응한 답변을 입력받아 저장하고, 대화 히스토리를 기록하고, 질문에 대한 답변 받기 푸시 알림 모드를 제공하고, 채팅 서비스에 재화, 토큰, 포인트를 도입하여 질문 횟수를 제한하고, 좋은 답변, 대화 참여에 대한 동기를 부여하는 질문과 답변(232);을 포함하는 것을 특징으로 한다.

또한, 상기 세그멘테이션(211)은, 커스터마이징한 데이터셋을 기반으로 다음 문장 예측 태스크를 이용하여 학습된 인공지능 모델, 슬라이딩 윈도우 알고리즘, 텍스트 데이터의 문장, 어절 단위 전처리 알고리즘을 통해 대화화 문단화하는 것을 특징으로 한다.

또한, 상기 키워드 추출(212)은, 서적, 뉴스 기사의 문어체 텍스트가 아닌 구어체 텍스트에서 상용화시킨 키워드 추출 알고리즘으로 추출된 키워드뿐만이 아닌, 대화 속에서 추출된 키워드에 대응한 대화의 메타 정보도 포함하여 해당 키워드 선택시 추출된 맥락의 시작 첫문자으로 이동하여 구체적인 대화 내용을 확인 가능한 것을 특징으로 한다.

본 발명은 사용자 사이에 오고가는 대화 중 정보를 추추하고, 비속어, 욕설을 필터링하고, 질문 생성, 답변을 통해 대화를 유도하고, 정보를 제시하고, 검색 기능을 제공함으로써 사용자가 채팅에서 대화를 원활하게 진행하는 효과를 가질 수 있다.

또한, 본 발명은 다자간의 구어체 대화를 그 흐름이 나누어지는 지점을 탐지하고, 채팅에서 이루어지는 대화에 포함된 문단, 문장, 키워드의 정보를 추출함으로써 텍스트 기반의 대화 장치는 대화에 포함된 정보를 정확하게 추출하는 효과를 가질 수 있다.

도 1은 본 발명 텍스트 기반 대화 장치의 구성을 보인 블록도이다.
도 2는 도 1 텍스트 기반 대화 장치의 상세 구성을 보인 블록도이다.
도 3은 본 발명 단말기의 대화 화면을 보인 예시도이다.
도 4는 도 1 텍스트 기반 대화 장치의 세그멘테이션 동작을 보인 예시도이다.
도 5는 도 1 텍스트 기반 대화 장치의 키워드 추출 동작을 보인 예시도이다.
도 6은 본 발명을 설명하기 위한 데이터 오류를 검증하는 구성을 설명하는 예시도이다.
도 7은 본 발명을 설명하기 위한 하드웨어 자원과 운영체제, 코어인 제어부의 동작, 제어부 동작을 실행할 권한을 부여하는 시스템 인증 구성을 설명하는 예시도이다.

이하, 도면을 참조하여 본 발명의 실시 예에 따른 텍스트 기반 대화 장치에 대하여 상세히 설명하기로 한다. 이하에서 종래 주지된 사항에 대한 설명은 본 발명의 요지를 명확히 하기 위해 생략하거나 간단히 한다. 본 발명의 설명에 포함된 구성은 개별 또는 복합 결합 구성되어 동작한다.

도 1은 본 발명 텍스트 기반 대화 장치의 구성을 보인 블록도로서, 도 1을 참조하면, 단말기(6)는 정보 추출(21), 품질 관리(22), 대화 유도(23), 질의응답(24), 검색(25)을 포함한다.

단말기(6)는 텍스트 기반 대화 장치로 동작한다.

정보 추출(21)은 상세 구성인 세그멘테이션(211), 키워드 추출(212)을 이용하여 채팅에서 이루어지는 대화에 포함된 문단, 문장, 키워드의 정보를 추출한다.

품질 관리(22)는 사용자 단말기 사이에 오고가는 대화 중 비속어, 욕설을 필터링하고, 경고음을 출력할 수 있고, 광고성 게시글, 욕설의 혐오 발언을 알고리즘을 이용하여 필터링한다.

대화 유도(23)는 대화 중 질문을 생성하고, 생성된 질문에 대응한 답변을 입력받아 저장하고, 대화 히스토리를 기록하고, 질문에 대한 답변 받기 푸시 알림 모드를 제공하고, 채팅 서비스에 재화, 토큰, 포인트를 도입하여 질문 횟수를 제한하고, 좋은 답변, 대화 참여에 대한 동기를 부여한다. 또한, 대화 유도(23)는 대화 중 익숙하지 않은 키워드의 경우 보조창을 통해 해당 키워드의 의미, 해석을 실시간을 제공한다.

질의응답(24)은 질의와 응답으로 태깅되는 텍스트 데이터를 확보하여, 라벨링된 데이터를 생성하고, 생성된 대화 쌍으로 챗봇을 만들고, 위키피디아 데이터 세트를 구축한다. 질의응답(24)은 챗봇 기능을 통해 사용자 혼자 대화를 진행할 수 있다.

검색(25)은 사용자 사이에 이루어지는 대화 중 문장, 키워드 검색을 가능하게 한다.

도 2는 도 1 텍스트 기반 대화 장치의 상세 구성을 보인 블록도로서, 도 2를 참조하면, 정보 추출(21)은 세스멘테이션(211), 키워드 추출(212)을 포함하고, 품질 관리(22)는 필터링(221)을 포함하고, 대화 유도(23)는 질문 생성(231), 질문과 답변(232)을 포함하고, 질의응답(24)은 정보 제시(241)를 포함한다.

정보 추출(21)은 다자간의 구어체 대화를 그 흐름이 나누어지는 지점을 탐지하는 세그멘테이션(211); 구분 대화 세션 간에서 임베딩 벡터간의 코사인 유사도를 이용하여 채팅에서 이루어지는 대화에 포함된 문단, 문장, 키워드의 정보를 추출하는 키워드 추출(212);을 포함한다.

품질 관리(22)는 사용자 단말기 사이에 오고가는 대화 중 비속어, 욕설을 필터링하고, 경고음을 출력할 수 있고, 광고성 게시글, 욕설의 혐오 발언을 알고리즘을 이용하여 필터링하는 필터링(221)을 포함한다.

대화 유도(23)는 대화 중 질문을 생성하는 질문 생성(231); 생성된 질문에 대응한 답변을 입력받아 저장하고, 대화 히스토리를 기록하고, 질문에 대한 답변 받기 푸시 알림 모드를 제공하고, 채팅 서비스에 재화, 토큰, 포인트를 도입하여 질문 횟수를 제한하고, 좋은 답변, 대화 참여에 대한 동기를 부여하는 질문과 답변(232);을 포함한다. 또한, 대화 유도(23)의 질문과 답변(232)은 대화 중 익숙하지 않은 키워드의 경우 보조창을 통해 해당 키워드의 의미, 해석을 실시간을 제공한다.

질의응답(24)은 질의와 응답으로 태깅되는 텍스트 데이터를 확보하여, 라벨링된 데이터를 생성하고, 생성된 대화 쌍으로 챗봇을 만들고, 위키피디아 데이터 세트를 구축하는 정보 제시(241)를 포함한다. 질의응답(24)의 정보 제시(241)는 챗봇 기능을 통해 사용자 혼자 대화를 진행할 수 있다.

도 3은 본 발명 단말기의 대화 화면을 보인 예시도로서, 도 3을 참조하면, 대화 화면은 초기 화면(31), 대화 화면(32), 질의 화면(33), 질문 화면(34)을 포함한다.

초기 화면(31)은 대화 개요를 표시하고, 대화 화면(32)은 사용자 사이에 오고가는 대화를 표시하고, 질의 화면(33)은 대화 중 질의 버튼을 선택하고, 질문 화면(34)은 질문 리스트를 표시한다.

도 4는 도 1 텍스트 기반 대화 장치의 세그멘테이션 동작을 보인 예시도로서, 도 4를 참조하면, 세그멘테이션(211)은 커스터마이징한 데이터셋을 기반으로 다음 문장 예측 태스크를 이용하여 학습된 인공지능 모델, 슬라이딩 윈도우 알고리즘, 텍스트 데이터의 문장, 어절 단위 전처리 알고리즘을 통해 대화화 문단화한다.

도 5는 도 1 텍스트 기반 대화 장치의 키워드 추출 동작을 보인 예시도로서, 도 5를 참조하면, 키워드 추출(212)은 서적, 뉴스 기사의 문어체 텍스트가 아닌 구어체 텍스트에서 상용화시킨 키워드 추출 알고리즘으로 추출된 키워드뿐만이 아닌, 대화 속에서 추출된 키워드에 대응한 대화의 메타 정보도 포함하여 해당 키워드 선택시 추출된 맥락의 시작 첫문자으로 이동하여 구체적인 대화 내용을 확인 가능하다.

도 6은 본 발명을 설명하기 위한 데이터 오류를 검증하는 구성을 설명하는 예시도이다.

도 6을 참조하면, 제어부(5)는 샘플링 데이터를 저장하고, 일정 시간 동안 샘플링 데이터의 크기 별로 발생 회수를 누적하여 확률 분포를 계산하고, 또 다른 일정 시간 동안의 확률 분포를 계산하고, 두 확률 분포의 차, 면적 차, 차 거리 누적을 계산해서(S101) 샘플링 회로 이상, 데이터 오류, 데이터 변화를 예측하고, 이에 대응할 수 있다(S102). 제어부(5)는 예측 결과를 사용자에게 알림으로써 사용자가 대응하거나 제어부(5)가 하드웨어 고장, 데이터 오류, 데이터 변화에 대응할 수 있다.

샘플링 데이터는 문단, 문장, 키워드, 정보 추출 데이터, 질문, 답변 데이터를 포함하고, 제어부(5)는 샘플링 데이터에 기반하여 하드웨어 고장, 데이터 오류, 데이터 변화에 대응한다.

제어부(5)는 일정 시간 동안 마다 각각의 확률 분포 추이를 보고, 확률 분포 중 특이 현상 이상을 예측하고, 이상 사고에 대응하고, 확률 분포에 대해 데이터 변화가 일정하면 정상 동작을 외부에 알린다. 또한, 제어부(5)는 일정 시간 간격을 조정하기 위해 데이터 변화율을 피드백한다. 예를 들어, 데이터 변화율이 크면 일정 시간 간격을 늘리고, 데이터 변화율이 작으면 일정 시간 간격을 줄인다.

도 7은 본 발명을 설명하기 위한 하드웨어 자원과 운영체제, 코어인 제어부의 동작, 제어부 동작을 실행할 권한을 부여하는 시스템 인증 구성을 설명하는 예시도로서, 도 7을 참조하면, 본 발명은 프로세서(1), 메모리(2), 입출력장치(3), 운영체제(4), 제어부(5)를 포함한다.

프로세서(1)는 CPU(Central Processing Units), GPU(Graphic Processing Unit), FPGA(Field Programmable Gate Array), NPU(Neural Processing Unit)로서, 메모리(2)에 탑재된 운영체제(4), 제어부(5)의 실행 코드를 수행한다.

메모리(2)는 RAM(random access memory), ROM(read only memory), 디스크 드라이브, SSD(solid state drive), 플래시 메모리(flash memory) 등과 같은 비소멸성 대용량 저장 장치(permanent mass storage device)를 포함할 수 있다.

입출력장치(3)는 입력 장치로, 오디오 센서 및/또는 이미지 센서를 포함한 카메라, 키보드, 마이크로폰, 마우스 등의 장치를, 그리고 출력 장치로, 디스플레이, 스피커, 햅틱 피드백 디바이스(haptic feedback device) 등과 같은 장치를 포함할 수 있다.

운영체제(4)는 윈도우, 리눅스, IOS, 가상 머신, 웹브라우저, 인터프리터를 포함할 수 있고, 태스크, 쓰레드, 타이머 실행, 스케줄링, 자원 관리, 그래픽, 폰트 처리, 통신 등을 지원한다.

제어부(5)는 운영체제(4)의 지원하에 입출력장치(3)의 센서, 키, 터치, 마우스 입력에 의한 상태를 결정하고, 결정된 상태에 따른 동작을 수행한다. 제어부(5)는 병렬 수행 루틴으로 타이머, 쓰레드에 의한 작업 스케줄링을 수행한다.

제어부(5)는 입출력장치(3)의 센서값을 이용하여 상태를 결정하고, 결정된 상태에 따른 알고리즘을 수행한다.

도 7을 참조하면, 시스템 인증 구성은 제어부(5)를 포함하는 단말기(6), 인증 서버(7)를 포함한다.

단말기(6)는 데이터 채널을 이중화하고, 단말기(6)의 키값, 생체 정보를 입력받아 인증 서버(7)에 제1데이터 채널을 통해 사용자 인증을 요청하고, 단말기(6)는 생성된 킷값을 디스플레이에 표시하고, 인증 서버(7)로 전송한다.

단말기(6)는 단말기(6)의 디스플레이에 표시된 킷값을 입력하고, 사용자 정보와 함께 제2데이터 채널을 통해 인증 서버(7)로 전송한다. 단말기(6)는 킷값과 사용자 정보를 이용하여 단말기(6)에 탑재된 시스템의 인증을 인증 서버(7)에 요청한다. 단말기(6)의 킷값은 컴퓨터 고유의 정보인 CPU 제조번호, 이더넷 칩의 맥주소로부터 생성될 수 있다. 단말기(6)는 카메라를 이용한 얼굴 인식, 마이크를 이용한 음성 인식, 디스플레이를 이용한 필기 인식을 통해 사용자 정보를 획득하고, 인증에 활용할 수 있다.

인증 서버(7)는 단말기(6)로부터 킷값을 수신하고, 단말기(6)로부터 이중화된 데이터 채널을 통해 킷값과 사용자 정보를 수신하여 단말기(6)의 킷값과 사용자 정보를 비교하고, 사용자 정보를 대응시켜 단말기(6)의 시스템 이용에 대한 인증을 처리한다. 인증 서버(7)는 인증 결과를 단말기(6)로 전송하여 시스템에 대한 사용자의 사용을 허가한다. 단말기(6)의 이중화된 데이터 채널로 인해 킷값 손실이 최소화되는 효과를 가질 수 있다.

인증 서버(7)는 사용자 정보의 히스토리 분석을 수행하고, 시간 흐름에 따라 사용자 정보의 일관성, 변화를 비교 판단한다. 히스토리 분석에서 사용자 정보가 일관성을 나타내면 사용자의 사용을 허가하고, 변화를 나타내면 사용자의 사용을 허가하지 않는다. 사용자 정보가 일관성을 나타낼 때 사용자의 시스템 사용을 허가함으로써 사용자 정보가 변조된 사용자가 시스템에 접근하지 못하도록 보안을 강화한다.

인증 서버(7)는 일관성, 변화, 빈도, 빈도 추이, 빈도가 높음에 가중치를 부여해서 가중치 조합으로 신뢰되지 않은 사용자의 접근을 차단한다. 예를 들어, 빈도의 임계치가 초과하면 초과 누적수에 비례하여 신뢰되지 않은 사용자의 접근을 차단하고, 장시간에 걸쳐 접근 시도하는 사용자를 인증 처리할 수 있다. 이때, 신뢰되지 않은 사용자에 대해 추가 인증을 요청한다.

시스템의 사용을 인증하는 수단인 단말기(6)는 시스템과 직접 연결하지 않고, 인증 서버(7)를 통한 우회 경로를 형성함으로써 인터넷망을 이루는 네트워크가 내부망과 외부망으로 구성되어 아이피 주소 설정 과정이 번거로울 때 단말기(6)를 이용한 인증 과정이 원활히 수행되는 장점이 있다. 이때, 단말기(6)에는 시스템이 탑재되고, 단말기(6)는 인증 단말 수단이 되고, 인증 서버(7)는 인증 서버 수단이 된다.

클라우드(12)는 프로세서(1), 메모리(2), 입출력장치(3), 통신부(6)를 관리하는 운영체제(4)의 지원 하에 컨테이너(7)의 모듈화로, 웹(8), DB(9), 프로토콜(10), 라이브러리(11)의 서비스를 제공하며, 제어부(5)는 컨테이너(7)의 서비스를 이용한 클라우드 애플리케이션을 실행한다. 컨테이너(7)라고 하는 표준 소프트웨어 패키지는 애플리케이션의 코드를 관련 구성 파일, 라이브러리(11) 및 앱 실행에 필요한 종속성과 함께 번들로 제공한다.

클라우드(12)는 다수의 단말기(6)를 통합 제어하고, 단말기(6)로부터 수신된 센서값을 저장하여 시간 흐름에 따라 모니터링하고, 단말기(6)의 동작 에러를 처리하고, 에러 메시지를 다른 단말기(6)로 알리고, 제어 대상인 단말기(6)를 스위칭 제어한다.

신경망 학습은 온도, 고도, 지문 등 각종 센서, 이미지, 적외선 등 카메라, 라이더와 같은 입력 장치로부터 수집된 시계열 데이터로부터 특징량 선택, 알고리즘 선택을 통해 모델을 선택하고, 학습, 성능 검증 과정에 의한 반복 시행 착오를 거쳐 모델 선택을 반복한다. 성능 검증이 마치면 인공지능 모델이 선택된다.

제어부(5)는 센서값 판단에 신경망을 이용한 딥러닝 알고리즘을 수행하고, 신경망 학습에 훈련 데이터를 이용하고, 시험 데이터로 신경망 성능을 검증한다.

본 발명은 상술한 특정의 바람직한 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 해당 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.

1: 프로세서
2: 메모리
3: 입출력장치
4: 운영체제
5: 제어부
6: 단말기
7: 인증 서버
8: 웹
9: DB
11: 라이브러리
12: 클라우드
14: 컨테이너
16: 통신부
21: 정보 추출
211: 세그멘테이션
212: 키워드 추출
22: 품질 관리
221: 필터링
23: 대화 유도
231: 질문 생성
232: 질문과 답변
24: 질의응답
241: 정보 제시
25: 검색

Claims

상세 구성인 세그멘테이션(211), 키워드 추출(212)을 이용하여 채팅에서 이루어지는 대화에 포함된 문단, 문장, 키워드의 정보를 추출하는 정보 추출(21);
사용자 단말기 사이에 오고가는 대화 중 비속어, 욕설을 필터링하고, 경고음을 출력할 수 있고, 광고성 게시글, 욕설의 혐오 발언을 알고리즘을 이용하여 필터링하는 품질 관리(22);
대화 중 질문을 생성하고, 생성된 질문에 대응한 답변을 입력받아 저장하고, 대화 히스토리를 기록하고, 질문에 대한 답변 받기 푸시 알림 모드를 제공하고, 채팅 서비스에 재화, 토큰, 포인트를 도입하여 질문 횟수를 제한하고, 좋은 답변, 대화 참여에 대한 동기를 부여하는 대화 유도(23);
질의와 응답으로 태깅되는 텍스트 데이터를 확보하여, 라벨링된 데이터를 생성하고, 생성된 대화 쌍으로 챗봇을 만들고, 위키피디아 데이터 세트를 구축하는 질의응답(24); 및
사용자 사이에 이루어지는 대화 중 문장, 키워드 검색을 가능하게 하는 검색(25);을 포함하는 것을 특징으로 하는, 텍스트 기반의 대화 장치.
제1항에 있어서,
상기 정보 추출(21)은,
다자간의 구어체 대화를 그 흐름이 나누어지는 지점을 탐지하는 세그멘테이션(211); 및
구분 대화 세션 간에서 임베딩 벡터간의 코사인 유사도를 이용하여 채팅에서 이루어지는 대화에 포함된 문단, 문장, 키워드의 정보를 추출하는 키워드 추출(212);을 포함하는 것을 특징으로 하는, 텍스트 기반의 대화 장치.
제1항에 있어서,
상기 대화 유도(23)는,
대화 중 질문을 생성하는 질문 생성(231); 및
생성된 질문에 대응한 답변을 입력받아 저장하고, 대화 히스토리를 기록하고, 질문에 대한 답변 받기 푸시 알림 모드를 제공하고, 채팅 서비스에 재화, 토큰, 포인트를 도입하여 질문 횟수를 제한하고, 좋은 답변, 대화 참여에 대한 동기를 부여하는 질문과 답변(232);을 포함하는 것을 특징으로 하는, 텍스트 기반의 대화 장치.
제2항에 있어서,
상기 세그멘테이션(211)은,
커스터마이징한 데이터셋을 기반으로 다음 문장 예측 태스크를 이용하여 학습된 인공지능 모델, 슬라이딩 윈도우 알고리즘, 텍스트 데이터의 문장, 어절 단위 전처리 알고리즘을 통해 대화화 문단화하는 것을 특징으로 하는, 텍스트 기반의 대화 장치.
제2항에 있어서,
상기 키워드 추출(212)은,
서적, 뉴스 기사의 문어체 텍스트가 아닌 구어체 텍스트에서 상용화시킨 키워드 추출 알고리즘으로 추출된 키워드뿐만이 아닌, 대화 속에서 추출된 키워드에 대응한 대화의 메타 정보도 포함하여 해당 키워드 선택시 추출된 맥락의 시작 첫문자으로 이동하여 구체적인 대화 내용을 확인 가능한 것을 특징으로 하는, 텍스트 기반의 대화 장치.