KR20240051469A - 텍스트 기반의 대화 장치 - Google Patents

텍스트 기반의 대화 장치 Download PDF

Info

Publication number
KR20240051469A
KR20240051469A KR1020220131167A KR20220131167A KR20240051469A KR 20240051469 A KR20240051469 A KR 20240051469A KR 1020220131167 A KR1020220131167 A KR 1020220131167A KR 20220131167 A KR20220131167 A KR 20220131167A KR 20240051469 A KR20240051469 A KR 20240051469A
Authority
KR
South Korea
Prior art keywords
conversation
questions
text
answers
information
Prior art date
Application number
KR1020220131167A
Other languages
English (en)
Inventor
홍진우
백남주
이희도
Original Assignee
홍진우
백남주
이희도
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 홍진우, 백남주, 이희도 filed Critical 홍진우
Priority to KR1020220131167A priority Critical patent/KR20240051469A/ko
Publication of KR20240051469A publication Critical patent/KR20240051469A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/02User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Human Computer Interaction (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 사용자 사이에 오고가는 대화 중 정보를 추추하고, 비속어, 욕설을 필터링하고, 질문 생성, 답변을 통해 대화를 유도하고, 정보를 제시하고, 검색 기능을 제공하고, 다자간의 구어체 대화를 그 흐름이 나누어지는 지점을 탐지하고, 채팅에서 이루어지는 대화에 포함된 문단, 문장, 키워드의 정보를 추출한다.

Description

텍스트 기반의 대화 장치{TEXT-BASED CONVERSATIONAL DEVICE}
본 발명은 텍스트 기반의 대화 장치에 관한 것으로, 보다 상세하게는 사용자가 채팅에서 대화를 원활하게 진행하고, 대화에 포함된 정보를 정확하게 추출하는 텍스트 기반의 대화 장치에 관한 것이다.
본 발명에 관련된 종래기술에는 키워드 정보 제공, 키워드 검색, 감성형 채팅, 맞춤형 키워드 추출이 있다. 특허문헌 1 키워드 정보 제공 방법은 키워드로부터 생성된 확장 의미 정보의 조합으로부터 부가 선택 정보를 검색하여 사용자에 제공한다. 또한, 특허문헌 2 인터랙션을 통해 키워드를 검색하는 단말, 서버 및 방법은 선택된 키워드에 대응하는 검색 결과를 디스플레이한다. 또한, 특허문헌 3 감성형 채팅 어플리케이션, 채팅 어플리케이션의 채팅 서비스 방법 및 채팅 서버는 채팅 서비스를 제공한다. 또한, 특허문헌 4 사용자 간의 관계와 사용자 성향을 고려한 채팅 서비스 내 대화 내용에서의 사용자 맞춤형 키워드 추출 시스템은 키워드 중에서 사용자가 관심 있어 하는 대화 키워드를 선택하면 클라이언트 단말기가 대화 키워드에 관련된 대화 내용을 사용자가 볼 수 있도록 출력한다.
그러나 종래기술은 사용자 사이에 오고가는 대화 중 정보를 추출하고, 비속어, 욕설을 필터링하고, 질문 생성, 답변을 통해 대화를 유도하고, 정보를 제시하고, 검색 기능을 제공하지 못하는 문제점이 있다.
공개특허공보 제10-2013-0062799호 키워드 정보 제공 방법 등록특허공보 제10-1665969호 인터랙션을 통해 키워드를 검색하는 단말, 서버 및 방법 공개특허공보 제10-2018-0002197호 감성형 채팅 어플리케이션, 채팅 어플리케이션의 채팅 서비스 방법 및 채팅 서버 공개특허공보 제10-2020-0012086호 사용자 간의 관계와 사용자 성향을 고려한 채팅 서비스 내 대화 내용에서의 사용자 맞춤형 키워드 추출 시스템
본 발명은 사용자 사이에 오고가는 대화 중 정보를 추출하고, 비속어, 욕설을 필터링하고, 질문 생성, 답변을 통해 대화를 유도하고, 정보를 제시하고, 검색 기능을 제공하는 텍스트 기반의 대화 장치를 제공하는 것을 목적으로 한다.
또한, 본 발명은 다자간의 구어체 대화를 그 흐름이 나누어지는 지점을 탐지하고, 채팅에서 이루어지는 대화에 포함된 문단, 문장, 키워드의 정보를 추출하는 텍스트 기반의 대화 장치를 제공하는 것을 또 다른 목적으로 한다.
본 발명의 바람직한 일 실시예에 따른 텍스트 기반의 대화 장치는, 상세 구성인 세그멘테이션(211), 키워드 추출(212)을 이용하여 채팅에서 이루어지는 대화에 포함된 문단, 문장, 키워드의 정보를 추출하는 정보 추출(21); 사용자 단말기 사이에 오고가는 대화 중 비속어, 욕설을 필터링하고, 경고음을 출력할 수 있고, 광고성 게시글, 욕설의 혐오 발언을 알고리즘을 이용하여 필터링하는 품질 관리(22); 대화 중 질문을 생성하고, 생성된 질문에 대응한 답변을 입력받아 저장하고, 대화 히스토리를 기록하고, 질문에 대한 답변 받기 푸시 알림 모드를 제공하고, 채팅 서비스에 재화, 토큰, 포인트를 도입하여 질문 횟수를 제한하고, 좋은 답변, 대화 참여에 대한 동기를 부여하는 대화 유도(23); 질의와 응답으로 태깅되는 텍스트 데이터를 확보하여, 라벨링된 데이터를 생성하고, 생성된 대화 쌍으로 챗봇을 만들고, 위키피디아 데이터 세트를 구축하는 질의응답(24); 및 사용자 사이에 이루어지는 대화 중 문장, 키워드 검색을 가능하게 하는 검색(25);을 포함하는 것을 특징으로 한다.
또한, 상기 정보 추출(21)은, 다자간의 구어체 대화를 그 흐름이 나누어지는 지점을 탐지하는 세그멘테이션(211); 및 구분 대화 세션 간에서 임베딩 벡터간의 코사인 유사도를 이용하여 채팅에서 이루어지는 대화에 포함된 문단, 문장, 키워드의 정보를 추출하는 키워드 추출(212);을 포함하는 것을 특징으로 한다.
또한, 상기 대화 유도(23)는, 대화 중 질문을 생성하는 질문 생성(231); 및 생성된 질문에 대응한 답변을 입력받아 저장하고, 대화 히스토리를 기록하고, 질문에 대한 답변 받기 푸시 알림 모드를 제공하고, 채팅 서비스에 재화, 토큰, 포인트를 도입하여 질문 횟수를 제한하고, 좋은 답변, 대화 참여에 대한 동기를 부여하는 질문과 답변(232);을 포함하는 것을 특징으로 한다.
또한, 상기 세그멘테이션(211)은, 커스터마이징한 데이터셋을 기반으로 다음 문장 예측 태스크를 이용하여 학습된 인공지능 모델, 슬라이딩 윈도우 알고리즘, 텍스트 데이터의 문장, 어절 단위 전처리 알고리즘을 통해 대화화 문단화하는 것을 특징으로 한다.
또한, 상기 키워드 추출(212)은, 서적, 뉴스 기사의 문어체 텍스트가 아닌 구어체 텍스트에서 상용화시킨 키워드 추출 알고리즘으로 추출된 키워드뿐만이 아닌, 대화 속에서 추출된 키워드에 대응한 대화의 메타 정보도 포함하여 해당 키워드 선택시 추출된 맥락의 시작 첫문자으로 이동하여 구체적인 대화 내용을 확인 가능한 것을 특징으로 한다.
본 발명은 사용자 사이에 오고가는 대화 중 정보를 추추하고, 비속어, 욕설을 필터링하고, 질문 생성, 답변을 통해 대화를 유도하고, 정보를 제시하고, 검색 기능을 제공함으로써 사용자가 채팅에서 대화를 원활하게 진행하는 효과를 가질 수 있다.
또한, 본 발명은 다자간의 구어체 대화를 그 흐름이 나누어지는 지점을 탐지하고, 채팅에서 이루어지는 대화에 포함된 문단, 문장, 키워드의 정보를 추출함으로써 텍스트 기반의 대화 장치는 대화에 포함된 정보를 정확하게 추출하는 효과를 가질 수 있다.
도 1은 본 발명 텍스트 기반 대화 장치의 구성을 보인 블록도이다.
도 2는 도 1 텍스트 기반 대화 장치의 상세 구성을 보인 블록도이다.
도 3은 본 발명 단말기의 대화 화면을 보인 예시도이다.
도 4는 도 1 텍스트 기반 대화 장치의 세그멘테이션 동작을 보인 예시도이다.
도 5는 도 1 텍스트 기반 대화 장치의 키워드 추출 동작을 보인 예시도이다.
도 6은 본 발명을 설명하기 위한 데이터 오류를 검증하는 구성을 설명하는 예시도이다.
도 7은 본 발명을 설명하기 위한 하드웨어 자원과 운영체제, 코어인 제어부의 동작, 제어부 동작을 실행할 권한을 부여하는 시스템 인증 구성을 설명하는 예시도이다.
이하, 도면을 참조하여 본 발명의 실시 예에 따른 텍스트 기반 대화 장치에 대하여 상세히 설명하기로 한다. 이하에서 종래 주지된 사항에 대한 설명은 본 발명의 요지를 명확히 하기 위해 생략하거나 간단히 한다. 본 발명의 설명에 포함된 구성은 개별 또는 복합 결합 구성되어 동작한다.
도 1은 본 발명 텍스트 기반 대화 장치의 구성을 보인 블록도로서, 도 1을 참조하면, 단말기(6)는 정보 추출(21), 품질 관리(22), 대화 유도(23), 질의응답(24), 검색(25)을 포함한다.
단말기(6)는 텍스트 기반 대화 장치로 동작한다.
정보 추출(21)은 상세 구성인 세그멘테이션(211), 키워드 추출(212)을 이용하여 채팅에서 이루어지는 대화에 포함된 문단, 문장, 키워드의 정보를 추출한다.
품질 관리(22)는 사용자 단말기 사이에 오고가는 대화 중 비속어, 욕설을 필터링하고, 경고음을 출력할 수 있고, 광고성 게시글, 욕설의 혐오 발언을 알고리즘을 이용하여 필터링한다.
대화 유도(23)는 대화 중 질문을 생성하고, 생성된 질문에 대응한 답변을 입력받아 저장하고, 대화 히스토리를 기록하고, 질문에 대한 답변 받기 푸시 알림 모드를 제공하고, 채팅 서비스에 재화, 토큰, 포인트를 도입하여 질문 횟수를 제한하고, 좋은 답변, 대화 참여에 대한 동기를 부여한다. 또한, 대화 유도(23)는 대화 중 익숙하지 않은 키워드의 경우 보조창을 통해 해당 키워드의 의미, 해석을 실시간을 제공한다.
질의응답(24)은 질의와 응답으로 태깅되는 텍스트 데이터를 확보하여, 라벨링된 데이터를 생성하고, 생성된 대화 쌍으로 챗봇을 만들고, 위키피디아 데이터 세트를 구축한다. 질의응답(24)은 챗봇 기능을 통해 사용자 혼자 대화를 진행할 수 있다.
검색(25)은 사용자 사이에 이루어지는 대화 중 문장, 키워드 검색을 가능하게 한다.
도 2는 도 1 텍스트 기반 대화 장치의 상세 구성을 보인 블록도로서, 도 2를 참조하면, 정보 추출(21)은 세스멘테이션(211), 키워드 추출(212)을 포함하고, 품질 관리(22)는 필터링(221)을 포함하고, 대화 유도(23)는 질문 생성(231), 질문과 답변(232)을 포함하고, 질의응답(24)은 정보 제시(241)를 포함한다.
정보 추출(21)은 다자간의 구어체 대화를 그 흐름이 나누어지는 지점을 탐지하는 세그멘테이션(211); 구분 대화 세션 간에서 임베딩 벡터간의 코사인 유사도를 이용하여 채팅에서 이루어지는 대화에 포함된 문단, 문장, 키워드의 정보를 추출하는 키워드 추출(212);을 포함한다.
품질 관리(22)는 사용자 단말기 사이에 오고가는 대화 중 비속어, 욕설을 필터링하고, 경고음을 출력할 수 있고, 광고성 게시글, 욕설의 혐오 발언을 알고리즘을 이용하여 필터링하는 필터링(221)을 포함한다.
대화 유도(23)는 대화 중 질문을 생성하는 질문 생성(231); 생성된 질문에 대응한 답변을 입력받아 저장하고, 대화 히스토리를 기록하고, 질문에 대한 답변 받기 푸시 알림 모드를 제공하고, 채팅 서비스에 재화, 토큰, 포인트를 도입하여 질문 횟수를 제한하고, 좋은 답변, 대화 참여에 대한 동기를 부여하는 질문과 답변(232);을 포함한다. 또한, 대화 유도(23)의 질문과 답변(232)은 대화 중 익숙하지 않은 키워드의 경우 보조창을 통해 해당 키워드의 의미, 해석을 실시간을 제공한다.
질의응답(24)은 질의와 응답으로 태깅되는 텍스트 데이터를 확보하여, 라벨링된 데이터를 생성하고, 생성된 대화 쌍으로 챗봇을 만들고, 위키피디아 데이터 세트를 구축하는 정보 제시(241)를 포함한다. 질의응답(24)의 정보 제시(241)는 챗봇 기능을 통해 사용자 혼자 대화를 진행할 수 있다.
도 3은 본 발명 단말기의 대화 화면을 보인 예시도로서, 도 3을 참조하면, 대화 화면은 초기 화면(31), 대화 화면(32), 질의 화면(33), 질문 화면(34)을 포함한다.
초기 화면(31)은 대화 개요를 표시하고, 대화 화면(32)은 사용자 사이에 오고가는 대화를 표시하고, 질의 화면(33)은 대화 중 질의 버튼을 선택하고, 질문 화면(34)은 질문 리스트를 표시한다.
도 4는 도 1 텍스트 기반 대화 장치의 세그멘테이션 동작을 보인 예시도로서, 도 4를 참조하면, 세그멘테이션(211)은 커스터마이징한 데이터셋을 기반으로 다음 문장 예측 태스크를 이용하여 학습된 인공지능 모델, 슬라이딩 윈도우 알고리즘, 텍스트 데이터의 문장, 어절 단위 전처리 알고리즘을 통해 대화화 문단화한다.
도 5는 도 1 텍스트 기반 대화 장치의 키워드 추출 동작을 보인 예시도로서, 도 5를 참조하면, 키워드 추출(212)은 서적, 뉴스 기사의 문어체 텍스트가 아닌 구어체 텍스트에서 상용화시킨 키워드 추출 알고리즘으로 추출된 키워드뿐만이 아닌, 대화 속에서 추출된 키워드에 대응한 대화의 메타 정보도 포함하여 해당 키워드 선택시 추출된 맥락의 시작 첫문자으로 이동하여 구체적인 대화 내용을 확인 가능하다.
도 6은 본 발명을 설명하기 위한 데이터 오류를 검증하는 구성을 설명하는 예시도이다.
도 6을 참조하면, 제어부(5)는 샘플링 데이터를 저장하고, 일정 시간 동안 샘플링 데이터의 크기 별로 발생 회수를 누적하여 확률 분포를 계산하고, 또 다른 일정 시간 동안의 확률 분포를 계산하고, 두 확률 분포의 차, 면적 차, 차 거리 누적을 계산해서(S101) 샘플링 회로 이상, 데이터 오류, 데이터 변화를 예측하고, 이에 대응할 수 있다(S102). 제어부(5)는 예측 결과를 사용자에게 알림으로써 사용자가 대응하거나 제어부(5)가 하드웨어 고장, 데이터 오류, 데이터 변화에 대응할 수 있다.
샘플링 데이터는 문단, 문장, 키워드, 정보 추출 데이터, 질문, 답변 데이터를 포함하고, 제어부(5)는 샘플링 데이터에 기반하여 하드웨어 고장, 데이터 오류, 데이터 변화에 대응한다.
제어부(5)는 일정 시간 동안 마다 각각의 확률 분포 추이를 보고, 확률 분포 중 특이 현상 이상을 예측하고, 이상 사고에 대응하고, 확률 분포에 대해 데이터 변화가 일정하면 정상 동작을 외부에 알린다. 또한, 제어부(5)는 일정 시간 간격을 조정하기 위해 데이터 변화율을 피드백한다. 예를 들어, 데이터 변화율이 크면 일정 시간 간격을 늘리고, 데이터 변화율이 작으면 일정 시간 간격을 줄인다.
도 7은 본 발명을 설명하기 위한 하드웨어 자원과 운영체제, 코어인 제어부의 동작, 제어부 동작을 실행할 권한을 부여하는 시스템 인증 구성을 설명하는 예시도로서, 도 7을 참조하면, 본 발명은 프로세서(1), 메모리(2), 입출력장치(3), 운영체제(4), 제어부(5)를 포함한다.
프로세서(1)는 CPU(Central Processing Units), GPU(Graphic Processing Unit), FPGA(Field Programmable Gate Array), NPU(Neural Processing Unit)로서, 메모리(2)에 탑재된 운영체제(4), 제어부(5)의 실행 코드를 수행한다.
메모리(2)는 RAM(random access memory), ROM(read only memory), 디스크 드라이브, SSD(solid state drive), 플래시 메모리(flash memory) 등과 같은 비소멸성 대용량 저장 장치(permanent mass storage device)를 포함할 수 있다.
입출력장치(3)는 입력 장치로, 오디오 센서 및/또는 이미지 센서를 포함한 카메라, 키보드, 마이크로폰, 마우스 등의 장치를, 그리고 출력 장치로, 디스플레이, 스피커, 햅틱 피드백 디바이스(haptic feedback device) 등과 같은 장치를 포함할 수 있다.
운영체제(4)는 윈도우, 리눅스, IOS, 가상 머신, 웹브라우저, 인터프리터를 포함할 수 있고, 태스크, 쓰레드, 타이머 실행, 스케줄링, 자원 관리, 그래픽, 폰트 처리, 통신 등을 지원한다.
제어부(5)는 운영체제(4)의 지원하에 입출력장치(3)의 센서, 키, 터치, 마우스 입력에 의한 상태를 결정하고, 결정된 상태에 따른 동작을 수행한다. 제어부(5)는 병렬 수행 루틴으로 타이머, 쓰레드에 의한 작업 스케줄링을 수행한다.
제어부(5)는 입출력장치(3)의 센서값을 이용하여 상태를 결정하고, 결정된 상태에 따른 알고리즘을 수행한다.
도 7을 참조하면, 시스템 인증 구성은 제어부(5)를 포함하는 단말기(6), 인증 서버(7)를 포함한다.
단말기(6)는 데이터 채널을 이중화하고, 단말기(6)의 키값, 생체 정보를 입력받아 인증 서버(7)에 제1데이터 채널을 통해 사용자 인증을 요청하고, 단말기(6)는 생성된 킷값을 디스플레이에 표시하고, 인증 서버(7)로 전송한다.
단말기(6)는 단말기(6)의 디스플레이에 표시된 킷값을 입력하고, 사용자 정보와 함께 제2데이터 채널을 통해 인증 서버(7)로 전송한다. 단말기(6)는 킷값과 사용자 정보를 이용하여 단말기(6)에 탑재된 시스템의 인증을 인증 서버(7)에 요청한다. 단말기(6)의 킷값은 컴퓨터 고유의 정보인 CPU 제조번호, 이더넷 칩의 맥주소로부터 생성될 수 있다. 단말기(6)는 카메라를 이용한 얼굴 인식, 마이크를 이용한 음성 인식, 디스플레이를 이용한 필기 인식을 통해 사용자 정보를 획득하고, 인증에 활용할 수 있다.
인증 서버(7)는 단말기(6)로부터 킷값을 수신하고, 단말기(6)로부터 이중화된 데이터 채널을 통해 킷값과 사용자 정보를 수신하여 단말기(6)의 킷값과 사용자 정보를 비교하고, 사용자 정보를 대응시켜 단말기(6)의 시스템 이용에 대한 인증을 처리한다. 인증 서버(7)는 인증 결과를 단말기(6)로 전송하여 시스템에 대한 사용자의 사용을 허가한다. 단말기(6)의 이중화된 데이터 채널로 인해 킷값 손실이 최소화되는 효과를 가질 수 있다.
인증 서버(7)는 사용자 정보의 히스토리 분석을 수행하고, 시간 흐름에 따라 사용자 정보의 일관성, 변화를 비교 판단한다. 히스토리 분석에서 사용자 정보가 일관성을 나타내면 사용자의 사용을 허가하고, 변화를 나타내면 사용자의 사용을 허가하지 않는다. 사용자 정보가 일관성을 나타낼 때 사용자의 시스템 사용을 허가함으로써 사용자 정보가 변조된 사용자가 시스템에 접근하지 못하도록 보안을 강화한다.
인증 서버(7)는 일관성, 변화, 빈도, 빈도 추이, 빈도가 높음에 가중치를 부여해서 가중치 조합으로 신뢰되지 않은 사용자의 접근을 차단한다. 예를 들어, 빈도의 임계치가 초과하면 초과 누적수에 비례하여 신뢰되지 않은 사용자의 접근을 차단하고, 장시간에 걸쳐 접근 시도하는 사용자를 인증 처리할 수 있다. 이때, 신뢰되지 않은 사용자에 대해 추가 인증을 요청한다.
시스템의 사용을 인증하는 수단인 단말기(6)는 시스템과 직접 연결하지 않고, 인증 서버(7)를 통한 우회 경로를 형성함으로써 인터넷망을 이루는 네트워크가 내부망과 외부망으로 구성되어 아이피 주소 설정 과정이 번거로울 때 단말기(6)를 이용한 인증 과정이 원활히 수행되는 장점이 있다. 이때, 단말기(6)에는 시스템이 탑재되고, 단말기(6)는 인증 단말 수단이 되고, 인증 서버(7)는 인증 서버 수단이 된다.
클라우드(12)는 프로세서(1), 메모리(2), 입출력장치(3), 통신부(6)를 관리하는 운영체제(4)의 지원 하에 컨테이너(7)의 모듈화로, 웹(8), DB(9), 프로토콜(10), 라이브러리(11)의 서비스를 제공하며, 제어부(5)는 컨테이너(7)의 서비스를 이용한 클라우드 애플리케이션을 실행한다. 컨테이너(7)라고 하는 표준 소프트웨어 패키지는 애플리케이션의 코드를 관련 구성 파일, 라이브러리(11) 및 앱 실행에 필요한 종속성과 함께 번들로 제공한다.
클라우드(12)는 다수의 단말기(6)를 통합 제어하고, 단말기(6)로부터 수신된 센서값을 저장하여 시간 흐름에 따라 모니터링하고, 단말기(6)의 동작 에러를 처리하고, 에러 메시지를 다른 단말기(6)로 알리고, 제어 대상인 단말기(6)를 스위칭 제어한다.
신경망 학습은 온도, 고도, 지문 등 각종 센서, 이미지, 적외선 등 카메라, 라이더와 같은 입력 장치로부터 수집된 시계열 데이터로부터 특징량 선택, 알고리즘 선택을 통해 모델을 선택하고, 학습, 성능 검증 과정에 의한 반복 시행 착오를 거쳐 모델 선택을 반복한다. 성능 검증이 마치면 인공지능 모델이 선택된다.
제어부(5)는 센서값 판단에 신경망을 이용한 딥러닝 알고리즘을 수행하고, 신경망 학습에 훈련 데이터를 이용하고, 시험 데이터로 신경망 성능을 검증한다.
본 발명은 상술한 특정의 바람직한 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 해당 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.
1: 프로세서
2: 메모리
3: 입출력장치
4: 운영체제
5: 제어부
6: 단말기
7: 인증 서버
8: 웹
9: DB
11: 라이브러리
12: 클라우드
14: 컨테이너
16: 통신부
21: 정보 추출
211: 세그멘테이션
212: 키워드 추출
22: 품질 관리
221: 필터링
23: 대화 유도
231: 질문 생성
232: 질문과 답변
24: 질의응답
241: 정보 제시
25: 검색

Claims (5)

  1. 상세 구성인 세그멘테이션(211), 키워드 추출(212)을 이용하여 채팅에서 이루어지는 대화에 포함된 문단, 문장, 키워드의 정보를 추출하는 정보 추출(21);
    사용자 단말기 사이에 오고가는 대화 중 비속어, 욕설을 필터링하고, 경고음을 출력할 수 있고, 광고성 게시글, 욕설의 혐오 발언을 알고리즘을 이용하여 필터링하는 품질 관리(22);
    대화 중 질문을 생성하고, 생성된 질문에 대응한 답변을 입력받아 저장하고, 대화 히스토리를 기록하고, 질문에 대한 답변 받기 푸시 알림 모드를 제공하고, 채팅 서비스에 재화, 토큰, 포인트를 도입하여 질문 횟수를 제한하고, 좋은 답변, 대화 참여에 대한 동기를 부여하는 대화 유도(23);
    질의와 응답으로 태깅되는 텍스트 데이터를 확보하여, 라벨링된 데이터를 생성하고, 생성된 대화 쌍으로 챗봇을 만들고, 위키피디아 데이터 세트를 구축하는 질의응답(24); 및
    사용자 사이에 이루어지는 대화 중 문장, 키워드 검색을 가능하게 하는 검색(25);을 포함하는 것을 특징으로 하는, 텍스트 기반의 대화 장치.
  2. 제1항에 있어서,
    상기 정보 추출(21)은,
    다자간의 구어체 대화를 그 흐름이 나누어지는 지점을 탐지하는 세그멘테이션(211); 및
    구분 대화 세션 간에서 임베딩 벡터간의 코사인 유사도를 이용하여 채팅에서 이루어지는 대화에 포함된 문단, 문장, 키워드의 정보를 추출하는 키워드 추출(212);을 포함하는 것을 특징으로 하는, 텍스트 기반의 대화 장치.
  3. 제1항에 있어서,
    상기 대화 유도(23)는,
    대화 중 질문을 생성하는 질문 생성(231); 및
    생성된 질문에 대응한 답변을 입력받아 저장하고, 대화 히스토리를 기록하고, 질문에 대한 답변 받기 푸시 알림 모드를 제공하고, 채팅 서비스에 재화, 토큰, 포인트를 도입하여 질문 횟수를 제한하고, 좋은 답변, 대화 참여에 대한 동기를 부여하는 질문과 답변(232);을 포함하는 것을 특징으로 하는, 텍스트 기반의 대화 장치.
  4. 제2항에 있어서,
    상기 세그멘테이션(211)은,
    커스터마이징한 데이터셋을 기반으로 다음 문장 예측 태스크를 이용하여 학습된 인공지능 모델, 슬라이딩 윈도우 알고리즘, 텍스트 데이터의 문장, 어절 단위 전처리 알고리즘을 통해 대화화 문단화하는 것을 특징으로 하는, 텍스트 기반의 대화 장치.
  5. 제2항에 있어서,
    상기 키워드 추출(212)은,
    서적, 뉴스 기사의 문어체 텍스트가 아닌 구어체 텍스트에서 상용화시킨 키워드 추출 알고리즘으로 추출된 키워드뿐만이 아닌, 대화 속에서 추출된 키워드에 대응한 대화의 메타 정보도 포함하여 해당 키워드 선택시 추출된 맥락의 시작 첫문자으로 이동하여 구체적인 대화 내용을 확인 가능한 것을 특징으로 하는, 텍스트 기반의 대화 장치.
KR1020220131167A 2022-10-13 2022-10-13 텍스트 기반의 대화 장치 KR20240051469A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220131167A KR20240051469A (ko) 2022-10-13 2022-10-13 텍스트 기반의 대화 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220131167A KR20240051469A (ko) 2022-10-13 2022-10-13 텍스트 기반의 대화 장치

Publications (1)

Publication Number Publication Date
KR20240051469A true KR20240051469A (ko) 2024-04-22

Family

ID=90881738

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220131167A KR20240051469A (ko) 2022-10-13 2022-10-13 텍스트 기반의 대화 장치

Country Status (1)

Country Link
KR (1) KR20240051469A (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130062799A (ko) 2011-12-05 2013-06-13 매디슨에비뉴 주식회사 키워드 정보 제공 방법
KR101665969B1 (ko) 2015-03-25 2016-10-13 주식회사 카카오 인터랙션을 통해 키워드를 검색하는 단말, 서버 및 방법
KR20180002197A (ko) 2016-06-29 2018-01-08 주식회사 엘지유플러스 감성형 채팅 어플리케이션, 채팅 어플리케이션의 채팅 서비스 방법 및 채팅 서버
KR20200012086A (ko) 2018-07-26 2020-02-05 한국과학기술원 사용자 간의 관계와 사용자 성향을 고려한 채팅 서비스 내 대화 내용에서의 사용자 맞춤형 키워드 추출 시스템

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130062799A (ko) 2011-12-05 2013-06-13 매디슨에비뉴 주식회사 키워드 정보 제공 방법
KR101665969B1 (ko) 2015-03-25 2016-10-13 주식회사 카카오 인터랙션을 통해 키워드를 검색하는 단말, 서버 및 방법
KR20180002197A (ko) 2016-06-29 2018-01-08 주식회사 엘지유플러스 감성형 채팅 어플리케이션, 채팅 어플리케이션의 채팅 서비스 방법 및 채팅 서버
KR20200012086A (ko) 2018-07-26 2020-02-05 한국과학기술원 사용자 간의 관계와 사용자 성향을 고려한 채팅 서비스 내 대화 내용에서의 사용자 맞춤형 키워드 추출 시스템

Similar Documents

Publication Publication Date Title
US10789552B2 (en) Question answering system-based generation of distractors using machine learning
CN110991391B (zh) 一种基于区块链网络的信息处理方法及装置
US11556698B2 (en) Augmenting textual explanations with complete discourse trees
US10162812B2 (en) Natural language processing system to analyze mobile application feedback
US11238132B2 (en) Method and system for using existing models in connection with new model development
CN107193974B (zh) 基于人工智能的地域性信息确定方法和装置
US11928985B2 (en) Content pre-personalization using biometric data
CN111552799A (zh) 信息处理方法、装置、电子设备及存储介质
CN111552797B (zh) 名称预测模型的训练方法、装置、电子设备及存储介质
CN111552798B (zh) 基于名称预测模型的名称信息处理方法、装置、电子设备
CN111552865A (zh) 用户兴趣画像方法及相关设备
CN116955573B (zh) 问题搜索方法、装置、设备及存储介质
CN114356747A (zh) 显示内容的测试方法、装置、设备、存储介质及程序产品
CN114186040A (zh) 一种智能机器人客服的运作方法
US11868678B2 (en) User interface sound emanation activity classification
CN113377972A (zh) 多媒体内容推荐方法、装置、计算设备和存储介质
KR20240051469A (ko) 텍스트 기반의 대화 장치
CN111552890A (zh) 基于名称预测模型的名称信息处理方法、装置、电子设备
US12001787B2 (en) Analyzing presentations to structure metadata for generating questions directed to the content of the presentations
US20220269746A1 (en) System and Methods for Standardizing Scoring of Individual Social Media Content
KR102377156B1 (ko) 공개 인터페이스를 통해 접수된 답변을 이용한 챗봇 서비스 제공 방법 및 그 장치
KR20240054524A (ko) 가족 맞춤형 메신저 장치 및 방법
KR20240041452A (ko) 언어 교환 파트너 매칭 시스템
CN116894093A (zh) 知识图驱动内容生成
CN117787254A (zh) 文本处理方法、装置、电子设备及介质