KR102427748B1 - 인공지능을 이용한 고객 응대 시스템 및 방법 - Google Patents

인공지능을 이용한 고객 응대 시스템 및 방법 Download PDF

Info

Publication number
KR102427748B1
KR102427748B1 KR1020210133539A KR20210133539A KR102427748B1 KR 102427748 B1 KR102427748 B1 KR 102427748B1 KR 1020210133539 A KR1020210133539 A KR 1020210133539A KR 20210133539 A KR20210133539 A KR 20210133539A KR 102427748 B1 KR102427748 B1 KR 102427748B1
Authority
KR
South Korea
Prior art keywords
customer
service
voice
customer terminal
response
Prior art date
Application number
KR1020210133539A
Other languages
English (en)
Inventor
차두선
조오영
Original Assignee
주식회사 브로드씨엔에스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 브로드씨엔에스 filed Critical 주식회사 브로드씨엔에스
Priority to KR1020210133539A priority Critical patent/KR102427748B1/ko
Application granted granted Critical
Publication of KR102427748B1 publication Critical patent/KR102427748B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0281Customer communication at a business location, e.g. providing product or service information, consulting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/02Reservations, e.g. for tickets, services or events
    • G06Q50/30
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • G10L21/043Time compression or expansion by changing speed
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Operations Research (AREA)
  • Accounting & Taxation (AREA)
  • Game Theory and Decision Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Resources & Organizations (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 고객 응대 시스템 및 방법을 공개한다. 본 발명은 고객 단말이 고객 응대 시스템으로 전화를 걸어서 민원을 신청하면, 고객 단말로부터 수신되는 음성 신호로부터, 고객의 성별 및 연령을 파악하여 고객 응대 시스템으로부터 고객 단말로 전송되는 음성 신호의 크기 및 속도를 조절하고, 고객 단말의 통화 품질을 자동으로 감지하여, 전화 응대 또는 채팅 응대를 적절하게 전환함으로써 최적의 고객 응대 서비스를 제공할 수 있다.

Description

인공지능을 이용한 고객 응대 시스템 및 방법{Customer response servie system and method using artificial intelligence}
본 발명은 고객 응대 시스템 및 방법에 관한 것으로서, 보다 구체적으로는 인공 지능을 이용하여 상담사 또는 음성봇에 의한 음성 응대 및 상담사 또는 채팅봇에 의한 채팅 응대를 자동으로 전환할 수 있는 고객 응대 시스템 및 방법에 관한 것이다.
일반적으로, 관공서나 기업체에서는 민원 처리를 위해서 콜센터 또는 컨택센터를 운영하고 있다. 그런데, 고객들이 전화로 문의하는 내용들은 상담사가 직접 응대하여야만 처리될 수 있는 민원도 있지만, 상당수는 정형화된 유형의 민원들이라서, 최근에는 전화 자동 응대 시스템(Automatic Response System; ARS), 음성으로 고객과의 상호작용을 수행하는 대화형 음성 응답(Interactive Voice Response; IVR) 시스템, CRM(Customer Relationship Management) 및 IPCC(Internet Protocol Contact Center) 등과 같이 자동으로 민원을 처리하는 응대 시스템들이 도입되고 있다.
그런데, 이러한 자동 응대 시스템은 대부분 음성을 통해서 고객의 민원 사항을 접수하게 되므로, 민원인이 발화에 어려움이 있거나 민원인이 소음이 심한 환경에 있는 경우 민원 전달에 어려움이 있다. 이러한 문제를 해결하기 위해서, 최근에는 인터넷 채팅으로 민원을 전달하는 챗봇 서비스들이 소개되고 있다.
그러나, 현재의 챗봇 서비스는 사용자가 작은 휴대폰에 표시되는 키패드를 통해서 민원 사항을 입력해야 하므로 잘못 입력되는 경우가 많고, 이에 따라서 원활한 민원 처리가 어려운 문제점이 존재한다.
본 발명이 해결하고자 하는 과제는 민원을 신청하는 고객이 처한 상황을 자동으로 감지하여, 전화 응대 또는 채팅 응대를 적절하게 전환함으로써 최적의 고객 응대를 제공하는 고객 응대 시스템 및 방법을 제공하는 것이다.
상술한 과제를 해결하기 위한 본 발명의 바람직한 실시예에 따른 인공지능을 이용한 고객 응대 시스템은, 고객 응대 장치로부터 입력된 음성 신호를 인식하여 텍스트 데이터로 출력하는 STT 서버; 상기 고객 응대 장치로부터 입력된 텍스트 형식의 응대 데이터를 음성 신호로 변환하여 상기 고객 응대 장치로 출력하는 TTS 서버; 상기 고객 응대 장치의 제어에 따라서 통신망을 통해서 연결된 고객 단말로 채팅 응대 서비스를 제공하는 채팅 서버; 및 통화 연결된 고객 단말로부터 수신되는 음성 신호를 상기 STT 서버로 출력하여 텍스트 데이터를 입력받고, 텍스트 데이터에 따라서 고객의 민원 요청에 대응하는 응대 데이터를 생성하여 상기 TTS 서버로 출력하여 음성 신호로 전환한 후 고객 단말로 전송함으로써 고객 응대 서비스를 제공하며, 고객 단말로부터 수신되는 음성 신호를 분석하여 통화 품질을 판단하고, 통화 품질에 따라서 음성 응대 서비스와 채팅 응대 서비스를 전환하는 상기 고객 응대 장치;를 포함한다.
또한, 상기 고객 응대 장치는, 고객 단말로부터 수신되는 음성 신호에 포함된 노이즈의 상태를 파악하고, 노이즈가 사전에 정의된 임계치 이상인 경우에는 고객 단말로 제공하는 음성 신호의 크기를 크게 조절하고, 속도를 느리게 조절할 수 있다.
또한, 상기 고객 응대 장치는, 고객 단말로부터 수신된 음성 신호에 포함된 주변 노이즈의 크기, 상기 STT 서버에서 수행된 음성 인식률, 고객 응대에 대해서 고객이 불만을 표시하거나 고객 단말로 재질문을 전송한 횟수 중 적어도 하나에 따라서 통화 품질을 판단하고, 통화 품질이 열악하여 음성 응대가 부적합하다고 판단하면, 고객 단말로 채팅 응대 서비스로 전환할지 여부를 문의하여, 고객이 채팅 응대 서비스로의 전환을 선택하면 상기 채팅 서버를 통해서 채팅 응대 서비스를 제공하고, 통화를 종료할 수 있다.
또한, 상기 고객 응대 장치는, 고객이 채팅 응대 서비스를 선택하면, 상기 채팅 서버로의 접속 정보를 상기 고객 단말로 전송하고, 고객 단말이 상기 채팅 서버로 접속하면 상기 채팅 서버를 통해서 채팅 응대 서비스를 제공할 수 있다.
또한, 상술한 기술적 과제를 해결하기 위한 본 발명의 바람직한 다른 실시예에 따른 인공지능을 이용한 고객 응대 시스템은, 인공지능을 이용한 고객 응대 시스템은, 고객의 개인 정보, 고객의 기존 예약 내역 및 서비스 이용 내역을 저장하는 고객 데이터베이스;를 더 포함하고, 상기 고객 응대 장치는 고객 단말의 전화번호를 상기 고객 데이터베이스에 조회하여 기존 고객인지 여부 및 기존 고객의 성별 및 연령을 확인하고, 기존 고객이 아닌 경우에, 상기 STT 서버는 고객의 음성 신호를 분석하여 고객의 성별 및 연령을 파악하여 상기 고객 응대 장치로 출력하며, 상기 고객 응대 장치는 고객의 연령이 노인층으로 판단되면 고객 단말로 제공하는 음성 신호의 크기를 크게 조절하고, 속도를 느리게 조절할 수 있다.
또한, 상기 고객 응대 장치는, 고객의 연령이 노인층에 해당하면, 채팅 응대 서비스를 제공할 때, 상기 채팅 서버로부터 고객 단말로 전송되는 텍스트의 크기를 기본 텍스트의 크기보다 크게 설정하고, 음성 응대 서비스로 전환할 수 있는 메뉴를 표시하며, 고객이 음성 응대 서비스를 선택하면, 고객 단말로 전화를 걸어 통화가 연결되면, 고객 단말과 채팅 서버간의 연결을 단절하고, 음성으로 고객 응대 서비스를 수행할 수 있다.
또한, 상기 STT 서버는, 고객 단말로부터 수신한 음성 신호를 일정한 시간 간격(프레임)으로 분할하여 음성 데이터를 생성하고, 음성 데이터에 대해서 주파수 변환을 수행하여 스펙트로그램(Spectrogram)을 생성하며, 스펙트로그램을 사전에 학습된 인공 지능 모델에 적용하여, 고객의 성별과 연령을 파악할 수 있다.
또한, 상기 고객 응대 장치는, 고객 단말로부터 수신한 음성 신호를 상기 STT 서버로 출력하고, 상기 STT 서버로부터 입력받은 텍스트 데이터를 AI 상담 모듈로 출력하며, 상기 AI 상담 모듈로부터 입력받은 텍스트 형식의 응대 데이터를 상기 TTS 서버로 출력하고, 상기 TTS 서버로부터 음성 신호를 입력받아 고객 단말로 전송하는 음성 게이트웨이; 고객 단말로부터 수신된 음성 신호에 포함된 주변 노이즈의 크기, 상기 STT 서버에서 수행된 음성 인식률, 고객 응대에 대해서 고객이 불만을 표시하거나 고객 단말로 재질문을 전송한 횟수 중 적어도 하나에 따라서 통화 품질을 판단하는 상황 인식 엔진; 및 상기 음성 게이트웨이로부터 입력된 상기 텍스트 데이터에 따라서 상기 응대 데이터를 생성하고, 상기 상황 인식 엔진에서 통화 품질이 열악하다고 판단하면, 고객 단말로 음성 응대 서비스를 채팅 응대 서비스로 전환할지를 문의하며, 고객이 채팅 응대 서비스를 선택하면, 상기 음성 게이트웨이를 통해서 고객 단말로 상기 채팅 서버의 접속 정보를 전송하는 AI 상담 모듈을 포함할 수 있다.
한편, 상술한 과제를 해결하기 위한 본 발명의 바람직한 실시예에 따른 인공지능을 이용한 고객 응대 방법은, 인공지능을 이용한 고객 응대 시스템에서 수행되는 인공지능을 이용한 고객 응대 방법으로서, (a) 고객 응대 시스템이 전화 통화가 연결된 고객이 기존 고객인지 여부를 확인하고, 기존 고객인 경우에는 고객의 연령을 판독하는 단계; (b) 기존 고객이 아닌 경우에는, 상기 고객 응대 시스템이 고객의 음성 신호로부터 고객의 연령을 판단하는 단계; (c) 고객의 연령이 노인층에 해당하는 경우에는, 상기 고객 응대 시스템이 상기 고객 단말로 전송되는 음성 신호의 크기를 크게 조절하고, 음성 신호의 속도를 느리게 조절하는 단계; (d) 상기 고객 응대 시스템이 전화 통화로 고객 응대를 수행하면서, 고객 단말로부터 수신되는 음성 신호를 분석하여 통화 품질을 판단하고, 통화 품질이 음성 응대를 수행하기에 부적합하다고 판단되면, 상기 고객 단말로 채팅 응대 여부를 문의하는 단계; 및 (e) 고객이 채팅 응대를 선택하면, 상기 고객 응대 시스템에 포함된 채팅 서버의 접속 정보를 상기 고객 단말로 전송하고, 상기 고객 단말이 상기 채팅 서버에 접속하면, 상기 고객 단말과의 통화를 종료하고, 상기 고객 단말로 채팅 응대 서비스를 제공하는 단계를 포함한다.
또한, 상기 (d) 단계에서, 상기 고객 응대 시스템은 상기 고객 단말로부터 수신되는 음성 신호에 포함된 노이즈의 상태를 파악하고, 노이즈가 사전에 정의된 임계치 이상인 경우에는 상기 고객 단말로 제공하는 음성 신호의 크기를 크게 조절하고, 속도를 느리게 조절할 수 있다.
또한, 상기 (d) 단계에서, 상기 고객 응대 시스템은 상기 고객 단말로부터 수신된 음성 신호에 포함된 주변 노이즈의 크기, 상기 고객 단말로부터 수신되는 음성 신호의 음성 인식률, 고객 응대에 대해서 고객이 불만을 표시하거나 상기 고객 단말로 재질문을 전송한 횟수 중 적어도 하나에 따라서 통화 품질을 판단할 수 있다.
또한, 상기 (b) 단계에서, 상기 고객 응대 시스템은 상기 고객 단말로부터 수신한 음성 신호를 일정한 시간 간격(프레임)으로 분할하여 음성 데이터를 생성하고, 음성 데이터에 대해서 주파수 변환을 수행하여 스펙트로그램(Spectrogram)을 생성하며, 스펙트로그램을 사전에 학습된 인공 지능 모델에 적용하여, 고객의 성별과 연령을 파악할 수 있다.
또한, 상기 (e) 단계에서, 고객의 연령이 노인층에 해당하면, 상기 고객 응대 시스템은 채팅 응대 서비스를 제공할 때, 상기 채팅 서버로부터 고객 단말로 전송되는 텍스트의 크기를 기본 텍스트의 크기보다 크게 설정하고, 음성 응대 서비스로 전환할 수 있는 메뉴를 표시하며, 고객이 음성 응대 서비스를 선택하면, 고객 단말로 전화를 걸어 통화가 연결되면, 고객 단말과 채팅 서버간의 연결을 단절하고, 상기 (d) 단계로 진행하여 음성으로 고객 응대 서비스를 수행할 수 있다.
본 발명은 고객 단말이 고객 응대 시스템으로 전화를 걸어서 민원을 신청하면, 고객 단말로부터 수신되는 음성 신호로부터, 고객의 성별 및 연령을 파악하여 고객 응대 시스템으로부터 고객 단말로 전송되는 음성 신호의 크기 및 속도를 조절하고, 고객 단말의 통화 품질을 자동으로 감지하여, 전화 응대 또는 채팅 응대를 적절하게 전환함으로써 최적의 고객 응대 서비스를 제공할 수 있다.
도 1은 본 발명의 바람직한 실시예에 따른 고객 응대 시스템의 전체 구조를 도시하는 도면이다.
도 2a 및 도 2b 는 본 발명의 바람직한 실시예에 따라서 고객 응대 시스템에서 수행되는 고객 응대 방법을 설명하는 흐름도이다.
도 3은 본 발명의 바람직한 실시예에 따라서 STT 서버에서 고객의 성별 및 연령을 파악하는 방법을 설명하는 흐름도이다.
도 4는 본 발명의 바람직한 실시예에 따른 STT 서버에서 음성 신호를 프레임 단위로 분할하는 방식을 설명하는 도면이다.
도 5는 본 발명의 바람직한 실시예에 따른 STT 서버에서 생성되는 스펙트로그램의 일 예를 도시하는 도면이다.
이하, 도면을 참고하여 본 발명의 바람직한 실시예를 설명한다.
여기서, 본 발명의 상술한 목적, 특징들 및 장점은 첨부된 도면과 관련된 다 음의 상세한 설명을 통해 보다 분명해질 것이다. 다만, 본 발명은 다양한 변경을 가할 수 있고 여러가지 실시예들을 가질 수 있는 바, 이하에서는 특정 실시예들을 도면에 예시하고 이를 상세히 설명하고자 한다.
도면들에 있어서, 층 및 영역들의 두께는 명확성을 기하기 위하여 과장되어진 것이며, 또한, 구성요소(element) 또는 층이 다른 구성요소 또는 층의 "위(on)" 또는 "상(on)"으로 지칭되는 것은 다른 구성요소 또는 층의 바로 위 뿐만 아니라 중간에 다른 층 또는 다른 구성요소를 개재한 경우를 모두 포함한다. 명세서 전체에 걸쳐서 동일한 참조번호들은 원칙적으로 동일한 구성요소들을 나타낸다. 또한, 각 실시예의 도면에 나타나는 동일한 사상의 범위 내의 기능이 동일한 구성요소는 동일한 참조부호를 사용하여 설명한다.
본 발명과 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 본 명세서의 설명 과정에서 이용되는 숫자(예를 들어, 제 1, 제 2 등)는 하나의 구성요소를 다른 구성요소와 구분하기 위한 식별기호에 불과하다.
도 1은 본 발명의 바람직한 실시예에 따른 인공지능을 이용한 고객 응대 시스템의 전체 구조를 도시하는 도면이다.
도 1을 참조하면, 본 발명의 바람직한 실시예에 따른 인공지능을 이용한 고객 응대 시스템(100)은 공중 전화망을 통해서 복수의 고객 단말(300)과 연결되거나, 인터넷망을 통해서 고객 단말(300)과 연결된다.
고객 응대 시스템(100)은 TTS 서버(130), STT 서버(120), 고객 데이터베이스(140), KMS(Knowledge Management System) 데이터 베이스(150), 채팅 서버(160), 및 고객 응대 장치(110)를 포함한다. 고객 응대 장치(110)는 컨택센터 교환기(200)를 통해서 고객 단말(300)과 음성 데이터를 송수신하는 음성 게이트웨이(111), 현재 고객 단말(300)의 통화 상태를 판단하여 음성 응대 모드와 채팅 응대 모드 간의 전환 여부를 판단하는 상황 인식 엔진(115) 및 고객 단말(300)과의 실질적인 상담 및 민원 응대를 진행하는 AI 상담 모듈(113)을 포함한다.
여기서, 음성 게이트웨이(111), AI 상담 모듈(113), 및 상황 인식 엔진(115)은 각각 독립적인 하드웨어적인 구성으로 구현될 수도 있고, 각각 범용 프로세서에서 실행되는 소프트웨어로 구현될 수도 있음을 주의해야 한다.
도 1을 참조하여, 각 구성요소들의 기능을 설명하면 다음과 같다.
TTS 서버(130)는 고객 응대 장치(110)의 음성 게이트웨이(111)로부터 입력되는 텍스트 형식의 응대 데이터를 음성 신호로 변환하여 음성 게이트웨이(111)로 출력하고, 음성 게이트웨이(111)는 음성 신호를 컨택센터 교환기(200)를 통해서 고객 단말(300)로 전송한다.
STT 서버(120)는 고객 단말(300)로부터 고객 응대 장치(110)의 음성 게이트웨이(111)로 수신되는 음성 신호를 인식하고 텍스트로 변환하여 음성 게이트웨이(111)로 출력한다. 또한, STT 서버(120)는 고객의 음성 신호로부터 고객의 성별과 연령을 파악하여 음성 게이트웨이(111)로 출력한다. STT 서버(120)가 고객의 성별과 연령을 파악하는 방법에 대해서는 도 3 내지 도 5 를 참조하여 후술한다.
고객 데이터베이스(140)는 고객의 정보를 저장한다. 보다 구체적으로는, 고객의 성명, 주소, 전화번호 등과 같은 개인적인 정보와, 기존 예약 내역 및 서비스 이용 내역 등의 정보를 저장한다. 만약, 본 발명의 고객 응대 시스템(100)이 병원의 컨택센터에 설치되는 경우에는, 고객의 개인 정보와 함께 고객의 진료 이력 정보 및 건강검진내역 정보 등을 저장할 수 있다.
KMS(Knowledge Management System) 데이터베이스는 고객 응대에 필요한 지식 정보들을 저장한다. 예를 들면, 본 발명의 고객 응대 시스템(100)이 병원의 컨택센터에 설치되는 경우에는, 고객으로부터 증상을 음성 또는 채팅으로 전달받고, 적합한 진료과를 알려달라는 민원을 수신할 수 있는데, 이를 위해서, KMS 데이터베이스(150)는 각 증상에 따라서 의심되는 질병 정보를 사전에 저장하고, 고객 응대 장치(110)가 이를 조회할 수 있도록 한다.
채팅 서버(160)는 고객 응대 장치(110)의 제어에 따라서 인터넷 통신망을 통해서 연결된 고객 단말(300)로 채팅 응대 서비스를 제공한다. 채팅 서버(160)는 고객 응대에 필요한 UI/UX 화면을 고객 단말(300)로 전송하여 표시하고, 고객 단말(300)로부터 수신된 각 메뉴 항목에 대한 선택 정보 및 텍스트 데이터를 고객 응대 장치(110)로 출력함으로써, 고객 단말(300)과의 채팅 응대를 수행한다.
고객 응대 장치(110)는 고객의 선택에 따라서 음성 응대 서비스 모드 또는 채팅 응대 서비스 모드에 따라서 고객 응대 서비스를 고객 단말(300)로 제공한다.
상술한 바와 같이, 고객 응대 장치(110)는 음성 게이트웨이(111), AI 상담 모듈(113), 및 상황 인식 엔진(115)을 포함한다.
음성 게이트웨이(111)는 컨택센터 교환기(200)를 통해서 수신되는 고객의 음성 신호를 STT 서버(120) 및 상황 인식 엔진(115)으로 출력하고, 고객 단말(300)의 전화번호를 AI 상담 모듈(113)로 출력한다.
음성 게이트웨이(111)는 STT 서버(120)로부터 고객의 음성 신호를 변환한 텍스트 데이터와 고객의 성별 및 연령 정보를 입력받아 AI 상담 모듈(113)로 출력한다. 또한, 음성 게이트웨이(111)는 AI 상담 모듈(113)로부터 고객 단말(300)로 음성 출력할 내용을 텍스트 데이터로 입력받으면, 해당 텍스트 데이터를 TTS 서버(130)로 출력하고, 변환된 음성 신호를 입력받아 고객 단말(300)로 전송한다.
또한, 음성 게이트웨이(111)는 AI 상담 모듈(113)로부터 입력되는 제어 메시지에 따라서, 채팅 응대 서비스 모드에서 음성 응대 서비스 모드로 전환하기 위해서 고객 단말(300)로 전화를 걸고, 음성 응대 서비스 모드에서 채팅 응대 서비스 모드로 전환하기 위해서 채팅 서버(160)의 접속 정보를 포함하는 문자 메시지 또는 PUSH 알림을 고객 단말(300)로 전송한다.
상황 인식 엔진(115)은 음성 게이트웨이(111)로부터, 고객 단말(300)이 전송한 음성 신호를 입력받고 음성 신호로부터 노이즈 등을 파악한다. 이 때, 상황 인식 엔진(115)은 음성 검출 기술(Voice Activity Detection:VAD)을 활용하여 발화 구간(노이즈 + 음성)과 비발화 구간(노이즈)을 분리한 후, 발화 구간에서 계산된 SNR이 10dB보다 작은 경우(노이즈가 사전에 정의된 임계치 이상인 경우)에는 노이즈가 심각한 상태(정상 통화가 어려움)로 판단한다.
또한, 상황 인식 엔진(115)은 AI 상담 모듈(113)로부터, 고객의 성별 및 연령 정보, STT 서버(120)에서 수행된 음성 인식률, AI 상담 모듈(113)에서 수행한 고객 응대에 대해서 고객이 불만을 표시하거나 AI 상담 모듈(113)이 정확한 응대 방법을 찾지 못하고 고객 단말(300)로 재질문을 전송한 횟수 등의 정보를 입력받는다.
그리고, 상황 인식 엔진(115)은 입력된 정보들을 종합적으로 고려하여, 음성 응대 서비스 모드와 채팅 응대 서비스 모드 간의 전환 여부를 판단하여 AI 상담 모듈(113)로 출력한다.
AI 상담 모듈(113)은 고객 데이터베이스(140) 및 KMS 데이터베이스(150)를 조회하여, 고객 단말(300)로부터 수신된 요청 사항에 대한 응답 데이터를 생성하여 고객 단말로 전송한다.
AI 상담 모듈(113)은 음성 게이트웨이(111)를 통해서 고객의 전화번호가 입력되면, 해당 전화번호를 고객 데이터베이스(140)에 조회하여 기존 고객인지 여부 및 기존 고객이라면 고객의 성별 및 연령을 파악한다. 만약, 전화를 걸어온 고객이 기존 고객이 아니라면, STT 서버(120)에서 판단한 고객의 성별 및 연령 정보를 입력받는다.
그리고, AI 상담 모듈(113)은 고객의 연령 및 성별에 따라서 고객 단말(300)로 전송할 음성 신호의 크기와 속도를 조절한다. 예컨대, 고객의 연령이 사전에 저장된 임계 연령을 초과하여 노인층에 해당하는 경우에는, 고객 단말(300)로 출력하는 음성 신호의 크기를 기본값보다 크게(예컨대, 약 125%) 설정하고, 음성 안내를 출력하는 속도를 기본 속도보다 느리게(예컨대, 기본속도의 80% 속도) 설정할 수 있다.
또한, AI 상담 모듈(113)은 상황 인식 엔진(115)으로부터 입력되는 주변 노이즈 크기가 사전에 정의된 제 1 임계치 이상인 경우에는, 상기한 바와 동일한 방식으로 고객 단말(300)로 전송할 음성 신호의 크기와 속도를 조절한다.
AI 상담 모듈(113)은 전화를 걸어온 고객이 기존 고객이고, 고객 데이터베이스(140) 조회 결과, 예약 내역이 확인되는 경우에는, 예약 확인/ 예약 변경/예약 취소할 수 있는 음성 안내 데이터를 음성 게이트웨이(111)로 출력하여 고객 단말(300)로 전송한다. 동일한 방식으로, 과거의 예약 내역이 확인되는 경우에도, 다시 간편하게 예약을 진행할 수 있는 음성 안내 데이터를 고객 단말(300)로 전송할 수 있다.
또한, 고객이 음성으로 자신이 원하는 요청 사항을 말하면, 해당 음성 신호는 STT 서버(120)에서 텍스트 데이터로 변환되어 음성 게이트웨이(111)를 통해서 AI 상담 모듈(113)로 입력되고, AI 상담 모듈(113)은 사전에 학습된 인공 지능 엔진(115)을 이용하여 고객의 요청에 대한 고객 응대 데이터를 생성하여 음성 게이트웨이(111)로 출력함으로써 고객 단말(300)로 전송한다.
음성 응대 서비스 모드로 응대를 진행하던 중, 상황 인식 엔진(115)으로부터 음성에서 채팅으로 응대 서비스 모드를 전환할 것을 나타내는 모드 전환 정보를 입력받으면, AI 상담 모듈(113)은 고객 단말(300)로 음성에서 채팅으로 응대 서비스 모드를 전환할지 여부를 문의하고, 고객이 채팅으로 응대 서비스 모드 전환을 선택하면, 음성 게이트웨이(111)를 통해서 고객 단말(300)로 채팅 서버(160)에 접속할 수 있는 접속 정보를 포함하는 문자 메시지를 전송하거나, push 메시지를 전송한다.
그 후, 고객 단말(300)이 채팅 서버(160)에 접속하면, AI 상담 모듈(113)은 고객 단말(300)과의 전화를 끊고, 채팅 서버(160)를 통해서 고객 단말(300)로 응대를 계속 진행한다.
도 2a 및 도 2b 는 본 발명의 바람직한 실시예에 따라서 인공지능을 이용한 고객 응대 시스템(100)에서 수행되는 인공지능을 이용한 고객 응대 방법을 설명하는 흐름도이다.
도 2a 및 도 2b를 더 참조하여, 본 발명의 바람직한 실시예에 따른 고객 응대 방법을 설명하면, 민원을 신청하고자 하는 고객 단말(300)은 먼저 전화를 걸어 본 발명의 고객 응대 시스템(100)으로 연결을 시도하고(S211), 전화가 연결되면 고객 응대 시스템(100)의 AI 상담 모듈(113)은 음성 게이트웨이(111)를 통해서 고객 단말(300)의 전화 번호를 입력받아 고객 DB(140)에 조회함으로써, 전화를 건 고객이 기존 고객인지 확인한다(S213).
이 때, 전화를 건 고객이 기존 고객이면, AI 상담 모듈(113)은 고객 DB로부터 고객의 성별 및 연령, 현재 예약 내역, 과거 민원 처리 내역, 과거 예약 내역, 과거 진료 내역 등의 정보를 함께 판독한다.
전화를 건 고객이 기존 고객임이 확인되면, AI 상담 모듈(113)은 채팅 응대로 전환할지 여부를 음성으로 문의하고(S231), 고객이 채팅 상담을 선택하면 제 S261 단계로 진행한다(S233).
만약, 고객이 채팅 응대를 선택하지 않으면, 음성을 통한 고객 응대가 그대로 진행된다(S233).
먼저, AI 상담 모듈(113)은 고객의 연령을 확인하여 고객의 연령이 사전에 저장된 임계 연령을 초과하여 노인층에 해당하는 경우에는(S241), 고객 단말(300)로 출력하는 음성 신호의 크기를 기본값보다 크게(예컨대, 약 125%) 설정하고, 음성 안내를 출력하는 속도를 기본 속도보다 느리게(예컨대, 기본속도의 80% 속도) 설정함으로써 고객의 편의를 도모한다(S243).
그 후, AI 상담 모듈(113)은 음성 인식 기술과 고객의 요구 사항을 사전에 학습한 인공 지능 엔진(115)을 이용하여 고객 응대를 진행한다(S245).
이 과정에서, AI 상담 모듈(113)은 사전에 정의된 응대 메뉴를 음성으로 고객 단말(300)로 출력하고, STT 서버(120)로부터 고객의 음성을 인식하여 텍스트로 변환한 텍스트 데이터를 입력받아, 고객이 요청한 예약, 예약 변경, 예약 취소, 문서 발급 등의 정형화된 기초 응대 사항들을 수행할 수 있을 뿐만 아니라, KMS DB를 조회하여 비정형화된 고객의 요청에 대해서 응답을 진행한다.
만약, 본 발명의 고객 응대 시스템(100)이 의료 기관의 콘택트 센터에 설치되는 경우에는, AI 상담 모듈(113)은 고객이 문의한 증상을 KMS DB에 조회하여, 증상에 따른 진료 센터, 진료과, 전문의명 등을 추천하고 진료 예약 설정 등의 응대를 진행할 수 있다.
이러한, 음성 상담 과정에서, 상황 인식 엔진(115)은 고객 단말(300)로부터 수신되는 음성 신호를 분석하여 음성 신호에 주변 노이즈가 많이 포함되어 있다고 판단되는 경우에는(S247), AI 상담 모듈(113)로 통화 상태가 불량하다는 것을 나타내는 통화 상태 정보를 출력하고, 이를 입력받은 AI 상담 모듈(113)은 상기한 제 S243 단계와 마찬가지로, 고객 단말(300)로 전달되는 음성 신호의 크기를 크게하고, 음성 안내 속도를 느리게 조절한다(S249).
그리고, 상황 인식 엔진(115)은 고객 단말(300)로부터 수신된 음성 신호에 포함된 주변 노이즈의 크기, STT 서버(120)에서 수행된 음성 인식률, AI 상담 모듈(113)에서 수행한 고객 응대에 대해서 고객이 불만을 표시하거나 AI 상담 모듈(113)이 정확한 응대 방법을 찾지 못하고 고객 단말(300)로 재질문을 전송한 횟수 등을 종합적으로 고려하여 통화 품질을 판단하고 통화 품질에 따라서 음성 응대를 계속할지 또는 채팅 응대로 전환할지 여부를 지속적으로 판단한다(S251).
상황 인식 엔진(115)이 통화 품질이 열악하여 음성 응대가 부적합하다고 판단하면(S253), 이를 AI 상담 모듈(113)로 출력하고, AI 상담 모듈(113)은 음성 게이트웨이(111)를 통해서 고객 단말(300)로 채팅 응대 서비스로 전환할 것인지를 문의한다(S255).
고객이 채팅 응대 서비스로의 전환을 선택하면 제 S261단계로 진행하여 채팅 응대 서비스를 진행하고, 고객이 채팅 응대 서비스로의 전환을 선택하지 않으면 음성 응대 서비스를 계속 진행한다(S257).
한편, 상기 제 S257 단계에서, 고객이 채팅 응대 서비스를 선택한 경우에, AI 상담 모듈(113)은 채팅 서버(160)에 접속할 수 있는 접속 정보를 포함하는 문자 메시지를 음성 게이웨이(111)를 통해서 고객 단말(300)로 전송하고(S261), 고객 단말(300)이 해당 접속 정보를 이용하여 채팅 서버(160)로 접속하면(S263), AI 상담 모듈(113)은 통화를 종료하고(S265), 채팅 서버(160)를 통해서 채팅 응대 서비스를 실행한다(S270).
제 S270 단계에서, AI 상담 모듈(113)은 먼저 확인된 고객의 연령이 사전에 정의된 임계 연령을 초과하면(즉, 노인층에 해당하면), 채팅 서버(160)로부터 고객 단말(300)로 전송되는 텍스트의 크기를 기본 텍스트의 크기보다 크게(예컨대, 기본 텍스트 크기의 125%)설정한다.
그 후, AI 상담 모듈(113)은 고객 DB에서 고객의 예약사항이 존재하는지 확인하고, 예약이 존재하면, 채팅 서버(160)를 통해서 예약 확인/예약 변경/예약 취소 등과 관련된 메뉴를 고객 단말(300)의 상단에 표시하여, 고객으로 하여금 빠르게 예약 관련 업무를 처리할 수 있도록 한다.
그리고, AI 상담 모듈(113)은 채팅 서버(160)를 통해서, 일반적인 고객 응대 메뉴들을 고객 단말(300)로 전송하여 표시하고, 고객 단말(300)로터 수신되는 요청을 처리한다. 고객 단말(300)로부터 수신되는 요청을 처리하는 방식은 음성 인식을 통해서 수신된 요청을 처리하는 방식과 동일하다.
만약, 본 발명의 고객 응대 시스템(100)이 병원의 컨택센터에 설치되어 병원 고객들을 응대하는 경우라면, AI 상담 모듈(113)은 고객의 현재 진료 예약과 관련된 진료 예약 확인/예약 변경/예약 취소 등과 관련된 메뉴를 고객 단말(300)의 상단에 표시하고, 만약, 현재 예약 사항이 없다면 이전 진료 내역과 관련된 신규 진료 예약/진료 내역서 출력/진단서 발급 신청 등의 민원 처리를 수행할 수 있는 메뉴를 고객 단말(300)의 상단에 표시한다.
그리고, AI 상담 모듈(113)은 고객 단말(300)로부터 수신되는 메뉴 선택 정보 및 텍스트 정보를 분석하여 고객의 요청에 대한 처리를 진행한다.
이렇게 채팅을 통해서 고객 응대 서비스를 수행하는 중에, AI 상담 모듈(113)은 고객 단말(300)에 표시되는 채팅 화면의 고정된 위치에, 음성 응대 서비스로 전환할 수 있는 메뉴를 표시하고, 고객이 음성 응대 서비스를 선택하는지 여부를 지속적으로 감시한다(S281).
고객이 음성 응대 서비스를 선택하면, AI 상담 모듈(113)은 음성 게이트웨이(111)를 통해서 고객 단말(300)로 전화를 걸고, 고객 단말(300)과 통화가 연결되면, 고객 단말(300)과 채팅 서버(160)간의 연결을 단절하고, 제 S245 단계로 진행하여 상술한 바와 같이 음성으로 고객 응대 서비스를 수행한다(S283).
한편, 상술한 제 S213 단계에서, 전화를 걸어온 고객이 기존 고객이 아닌 경우에, STT 서버(120)는 음성 게이트웨이(111)로부터 입력된 고객의 음성 신호를 분석하여 고객의 성별 및 연령을 파악하여 AI 상담 모듈(113)로 출력한다(S220).
그 후, AI 상담 모듈(113)은 상술한 S231 단계로 진행하여, 고객의 성별 및 연령에 따라서 음성 안내의 소리 크기 및 속도 등을 설정하고, 음성 응대 서비스를 수행한다. STT 서버(120)에서 고객의 성별 및 연령 등을 파악하는 과정은 상술하였으므로, 구체적인 설명은 생략한다.
이하, 도 3 내지 도 5를 참조하여, 본 발명의 바람직한 실시예에 따른 STT 서버(120)에서 고객의 성별 및 연령을 파악하는 과정을 설명한다.
도 3은 본 발명의 바람직한 실시예에 따라서 STT 서버(120)가 제 S220 단계에서 고객의 성별 및 연령을 파악하는 방법을 설명하는 흐름도이고, 도 4는 본 발명의 바람직한 실시예에 따른 STT 서버(120)에서 음성 신호를 프레임 단위로 분할하는 방식을 설명하는 도면이며, 도 5는 본 발명의 바람직한 실시예에 따른 STT 서버(120)에서 생성되는 스펙트로그램의 일 예를 도시하는 도면이다.
도 3 내지 도 5를 참조하면, STT 서버(120)는 음성 게이트웨이(111)를 통해서 입력되는 음성 신호를 일정한 시간 간격(프레임)으로 분할하여 음성 데이터를 생성한다(S221).
STT 서버(120)는 음성 신호에 포함된 특징들을 분석하고, 이를 사전에 학습된 인공 지능 모델에 적용하여 고객의 성별 및 연령을 파악하는데, 음성 신호에 포함된 특징들을 분석하기 위해서는 입력되는 음성 신호를 일정한 시간 구간들로 분할하고(도 4 참조), 각 분할된 구간(프레임)에 대해서 특징들을 분석한다.
일반적인 음성 처리에서는, 음성 신호를 샘플링하여 음성 데이터를 생성하고, 음성 데이터(pcm 형식)를 20ms ~ 40ms 사이(음성인식은 보통 25ms 정도)의 크기로 분할하는데, 전화망의 음성 데이터는 8kHz로 샘플링하여 생성되므로 샘플의 수가 일반적인 음성 데이터보다 적기 때문에 40ms 단위로 분할한다. 다만, 이러한 분할 시간 간격은 실제로 본 발명이 적용되는 상황에 따라서 변경될 수 있다. 이 때 이전 프레임과 약 50(ㅁ10)% 수준에서 중첩(overlap)되도록 20ms의 폭으로(stride)로 슬라이딩할 수 있다.
그 후, STT 서버(120)는 음성 데이터에 대해서 주파수 변환을 수행한다(S223).
제 S223 단계에서, 주파수 변환은 시간 도메인인 음성 데이터에 대해서 푸리에 변환(Fourier Transform)을 수행하여 실행되는데, 음성 데이터는 음성 신호를 샘플링한 불연속 데이터이므로 DFT(Discrete Fourier Transform)를 적용하며, 계산 속도가 빠른(계산량이 적은) FFT(Fast Fourier Transform)를 적용하였다.
참고로, 후술하는 인공 지능 모델에 적용하기 위한 전처리의 최종 결과물인 스펙트로그램은 프레임이라는 짧은 구간(시간) 단위로 푸리에 변환을 수행하는 것으로 이를 STFT(Short Time Fourier Transform)이라고 칭한다.
또한, 제 S223 단계에서, STT 서버(120)는 spectral leakage 현상을 방지하기 위해서, 프레임 단위로 분할된 음성 데이터들에 대해서 해밍 윈도우(Hamming Window) 필터링을 수행한 후, STFT를 수행할 수도 있다.
그 후, STT 서버(120)는 음성 데이터 전체에 대해서 프레임별로 STFT해서 얻은 주파수 변환 데이터를 이용하여 스펙트로그램(Spectrogram)을 생성한다(S225).
스펙트로그램은 주파수 변환 데이터의 주파수를 y축으로, 진폭을 색상으로 설정하고, x 축을 시간으로 설정하여 순차적으로 나열한 것으로서, 시간 변화에 따른 스펙트럼의 변화, 즉, 시간 변화에 따른 음성 데이터의 각 주파수별 진폭의 변화를 파악할 수 있게 한 것이다.
이렇게, 음성 데이터를 스펙트로그램 이미지로 표현하면, 이미지 인식 및 분류에 뛰어난 성능을 나타내는 CNN(Convolution Neural Network)과 같은 인공 지능 모델을 이용하여 음성 데이터의 특성을 파악하고 분류하기가 용이해진다.
그런데 여기서, 사람의 청각기관은 저주파 대역에서 더 민감하고, 성대에서 낼 수 있는 소리도 남성은 100~150Hz, 여성은 200~250Hz 정도이고, 최대 1200 Hz를 넘지 않는다고 알려져 있다. 또한, 저주파의 대역에서의 주파수 차이 식별과 고주파에서의 차이 식별이 선형적이지 않다고 알려져 있다. 즉, 동일한 주파수의 차이라고 하더라도, 주파수가 낮을수록 사람들이 더 식별하기 용이하다.
이러한 특성을 반영한 것을 Mel-scale(로그 스케일임)이라고 하며, Mel-scale에서 구간을 균등하게 N개로 나눠 구현한 triangular filter(=triangular window)를 Filter-bank라고 한다.
본 발명의 바람직한 실시예에서는, 음성 데이터에 대해서 STFT를 수행한 후, 주파수값에 대해서 Mel-scale을 적용하고, 진폭값에 대해서도 log 값을 취하여 스펙트로그램을 생성하였다. 즉, 본 발명의 바람직한 실시예에서, STT 서버(120)는 음성 데이터에 대해서 Log-Mel Spectrogram을 생성하여 고객의 음성을 분석하였으며, 도 5는 본 발명의 바람직한 실시예에서 적용되는 Log-Mel Spectrogram의 일 예를 도시한다.
그 후, STT 서버(120)는 스펙트로그램을 사전에 학습된 인공 지능 모델에 적용하여, 고객의 성별과 연령을 파악하고, 그 결과를 음성 게이트웨이(111)를 통하여 AI 상담 모듈(113)로 출력한다(S227).
이 때, 인공 지능 모델은 다양하게 적용이 가능하지만, 본 발명의 바람직한 실시예에서는 CNN과 같은 이미지 분석과 분류에 용이한 인공 지능 모델을 이용하여, 스펙트로그램 이미지를 입력받고 고객의 성별과 연령을 파악하였다. 본 발명의 바람직한 실시예에서는 인공 지능 모델이 고객의 음성 신호를 분석한 결과, 고객을 어린이, 젊은 남성, 젊은 여성, 중년 남성, 중년 여성, 노년 남성, 노년 여성으로 분류하여 그 결과를 출력하는데, 변형 실시예에서는 고객의 성별 및 연령 추정값을 각각 출력할 수도 있다.
지금까지 설명한 본 발명의 바람직한 실시예에 따른, 고객 응대 방법은, 컴퓨터에서 실행가능한 명령어로 구현되어 비일시적 저장매체에 저장된 컴퓨터 프로그램으로 구현될 수 있다.
저장매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 저장매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광데이터 저장장치 등이 있다. 또한 컴퓨터가 읽을 수 있는 저장매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
100 : 고객 응대 시스템
111 : 음성 게이트웨이
113 : AI 상담 모듈
115 : 상황 인식 엔진
110 : 고객 응대 장치
120 : STT 서버
130 : TTS 서버
140 : 고객 데이터 베이스
150 : KMS 데이터 베이스
160 : 채팅 서버
200 : 컨택센터 교환기
300 : 고객 단말

Claims (13)

  1. 고객 응대 장치로부터 입력된 음성 신호를 인식하여 텍스트 데이터로 출력하는 STT 서버;
    상기 고객 응대 장치로부터 입력된 텍스트 형식의 응대 데이터를 음성 신호로 변환하여 상기 고객 응대 장치로 출력하는 TTS 서버;
    상기 고객 응대 장치의 제어에 따라서 통신망을 통해서 연결된 고객 단말로 채팅 응대 서비스를 제공하는 채팅 서버;
    통화 연결된 고객 단말로부터 수신되는 음성 신호를 상기 STT 서버로 출력하여 텍스트 데이터를 입력받고, 텍스트 데이터에 따라서 고객의 민원 요청에 대응하는 응대 데이터를 생성하여 상기 TTS 서버로 출력하여 음성 신호로 전환한 후 고객 단말로 전송함으로써 고객 응대 서비스를 제공하며, 고객 단말로부터 수신되는 음성 신호를 분석하여 통화 품질을 판단하고, 통화 품질에 따라서 음성 응대 서비스와 채팅 응대 서비스를 전환하는 상기 고객 응대 장치; 및
    고객의 개인 정보, 고객의 기존 예약 내역 및 서비스 이용 내역을 저장하는 고객 데이터베이스;를 포함하고,
    상기 고객 응대 장치는 고객 단말의 전화번호를 상기 고객 데이터베이스에 조회하여 기존 고객인지 여부 및 기존 고객의 성별 및 연령을 확인하고,
    기존 고객이 아닌 경우에, 상기 STT 서버는 고객의 음성 신호를 분석하여 고객의 성별 및 연령을 파악하여 상기 고객 응대 장치로 출력하며,
    상기 고객 응대 장치는 고객의 연령이 노인층으로 판단되면 고객 단말로 제공하는 음성 신호의 크기를 크게 조절하고, 속도를 느리게 조절하고,
    상기 고객 응대 장치는
    고객의 연령이 노인층에 해당하면, 채팅 응대 서비스를 제공할 때, 상기 채팅 서버로부터 고객 단말로 전송되는 텍스트의 크기를 기본 텍스트의 크기보다 크게 설정하고, 음성 응대 서비스로 전환할 수 있는 메뉴를 표시하며, 고객이 음성 응대 서비스를 선택하면, 고객 단말로 전화를 걸어 통화가 연결되면, 고객 단말과 채팅 서버간의 연결을 단절하고, 음성으로 고객 응대 서비스를 수행하는 것을 특징으로 하는 인공지능을 이용한 고객 응대 시스템.
  2. 제 1 항에 있어서, 상기 고객 응대 장치는
    고객 단말로부터 수신되는 음성 신호에 포함된 노이즈의 상태를 파악하고, 노이즈가 사전에 정의된 임계치 이상인 경우에는 고객 단말로 제공하는 음성 신호의 크기를 크게 조절하고, 속도를 느리게 조절하는 것을 특징으로 하는 인공지능을 이용한 고객 응대 시스템.
  3. 제 1 항에 있어서, 상기 고객 응대 장치는
    고객 단말로부터 수신된 음성 신호에 포함된 주변 노이즈의 크기, 상기 STT 서버에서 수행된 음성 인식률, 고객 응대에 대해서 고객이 불만을 표시하거나 고객 단말로 재질문을 전송한 횟수 중 적어도 하나에 따라서 통화 품질을 판단하고,
    통화 품질이 열악하여 음성 응대가 부적합하다고 판단하면, 고객 단말로 채팅 응대 서비스로 전환할지 여부를 문의하여, 고객이 채팅 응대 서비스로의 전환을 선택하면 상기 채팅 서버를 통해서 채팅 응대 서비스를 제공하고, 통화를 종료하는 것을 특징으로 하는 인공지능을 이용한 고객 응대 시스템.
  4. 제 3 항에 있어서, 상기 고객 응대 장치는
    고객이 채팅 응대 서비스를 선택하면, 상기 채팅 서버로의 접속 정보를 상기 고객 단말로 전송하고, 고객 단말이 상기 채팅 서버로 접속하면 상기 채팅 서버를 통해서 채팅 응대 서비스를 제공하는 것을 특징으로 하는 인공지능을 이용한 고객 응대 시스템.
  5. 삭제
  6. 삭제
  7. 제 1 항에 있어서, 상기 STT 서버는
    고객 단말로부터 수신한 음성 신호를 일정한 시간 간격(프레임)으로 분할하여 음성 데이터를 생성하고, 음성 데이터에 대해서 주파수 변환을 수행하여 스펙트로그램(Spectrogram)을 생성하며, 스펙트로그램을 사전에 학습된 인공 지능 모델에 적용하여, 고객의 성별과 연령을 파악하는 것을 특징으로 하는 인공지능을 이용한 고객 응대 시스템.
  8. 제 1 항에 있어서, 상기 고객 응대 장치는
    고객 단말로부터 수신한 음성 신호를 상기 STT 서버로 출력하고, 상기 STT 서버로부터 입력받은 텍스트 데이터를 AI 상담 모듈로 출력하며, 상기 AI 상담 모듈로부터 입력받은 텍스트 형식의 응대 데이터를 상기 TTS 서버로 출력하고, 상기 TTS 서버로부터 음성 신호를 입력받아 고객 단말로 전송하는 음성 게이트웨이;
    고객 단말로부터 수신된 음성 신호에 포함된 주변 노이즈의 크기, 상기 STT 서버에서 수행된 음성 인식률, 고객 응대에 대해서 고객이 불만을 표시하거나 고객 단말로 재질문을 전송한 횟수 중 적어도 하나에 따라서 통화 품질을 판단하는 상황 인식 엔진; 및
    상기 음성 게이트웨이로부터 입력된 상기 텍스트 데이터에 따라서 상기 응대 데이터를 생성하고, 상기 상황 인식 엔진에서 통화 품질이 열악하다고 판단하면, 고객 단말로 음성 응대 서비스를 채팅 응대 서비스로 전환할지를 문의하며, 고객이 채팅 응대 서비스를 선택하면, 상기 음성 게이트웨이를 통해서 고객 단말로 상기 채팅 서버의 접속 정보를 전송하는 AI 상담 모듈을 포함하는 것을 특징으로 하는 인공지능을 이용한 고객 응대 시스템.
  9. 고객 응대 시스템에서 수행되는 고객 응대 방법으로서,
    (a) 고객 응대 시스템이 전화 통화가 연결된 고객이 기존 고객인지 여부를 확인하고, 기존 고객인 경우에는 고객의 연령을 판독하는 단계;
    (b) 기존 고객이 아닌 경우에는, 상기 고객 응대 시스템이 고객의 음성 신호로부터 고객의 연령을 판단하는 단계;
    (c) 고객의 연령이 노인층에 해당하는 경우에는, 상기 고객 응대 시스템이 고객 단말로 전송되는 음성 신호의 크기를 크게 조절하고, 음성 신호의 속도를 느리게 조절하는 단계;
    (d) 상기 고객 응대 시스템이 전화 통화로 고객 응대를 수행하면서, 고객 단말로부터 수신되는 음성 신호를 분석하여 통화 품질을 판단하고, 통화 품질이 음성 응대를 수행하기에 부적합하다고 판단되면, 상기 고객 단말로 채팅 응대 여부를 문의하는 단계; 및
    (e) 고객이 채팅 응대를 선택하면, 상기 고객 응대 시스템에 포함된 채팅 서버의 접속 정보를 상기 고객 단말로 전송하고, 상기 고객 단말이 상기 채팅 서버에 접속하면, 상기 고객 단말과의 통화를 종료하고, 상기 고객 단말로 채팅 응대 서비스를 제공하는 단계를 포함하고,
    상기 (e) 단계에서
    고객의 연령이 노인층에 해당하면, 상기 고객 응대 시스템은 채팅 응대 서비스를 제공할 때, 상기 채팅 서버로부터 고객 단말로 전송되는 텍스트의 크기를 기본 텍스트의 크기보다 크게 설정하고, 음성 응대 서비스로 전환할 수 있는 메뉴를 표시하며, 고객이 음성 응대 서비스를 선택하면, 고객 단말로 전화를 걸어 통화가 연결되면, 고객 단말과 채팅 서버간의 연결을 단절하고, 상기 (d) 단계로 진행하여 음성으로 고객 응대 서비스를 수행하는 것을 특징으로 하는 고객 응대 방법.
  10. 제 9 항에 있어서, 상기 (d) 단계에서
    상기 고객 응대 시스템은 상기 고객 단말로부터 수신되는 음성 신호에 포함된 노이즈의 상태를 파악하고, 노이즈가 사전에 정의된 임계치 이상인 경우에는 상기 고객 단말로 제공하는 음성 신호의 크기를 크게 조절하고, 속도를 느리게 조절하는 것을 특징으로 하는 고객 응대 방법.
  11. 제 9 항에 있어서, 상기 (d) 단계에서
    상기 고객 응대 시스템은 상기 고객 단말로부터 수신된 음성 신호에 포함된 주변 노이즈의 크기, 상기 고객 단말로부터 수신되는 음성 신호의 음성 인식률, 고객 응대에 대해서 고객이 불만을 표시하거나 상기 고객 단말로 재질문을 전송한 횟수 중 적어도 하나에 따라서 통화 품질을 판단하는 것을 특징으로 하는 고객 응대 방법.
  12. 제 9 항에 있어서, 상기 (b) 단계에서
    상기 고객 응대 시스템은 상기 고객 단말로부터 수신한 음성 신호를 일정한 시간 간격(프레임)으로 분할하여 음성 데이터를 생성하고, 음성 데이터에 대해서 주파수 변환을 수행하여 스펙트로그램(Spectrogram)을 생성하며, 스펙트로그램을 사전에 학습된 인공 지능 모델에 적용하여, 고객의 성별과 연령을 파악하는 것을 특징으로 하는 고객 응대 방법.
  13. 삭제
KR1020210133539A 2021-10-07 2021-10-07 인공지능을 이용한 고객 응대 시스템 및 방법 KR102427748B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210133539A KR102427748B1 (ko) 2021-10-07 2021-10-07 인공지능을 이용한 고객 응대 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210133539A KR102427748B1 (ko) 2021-10-07 2021-10-07 인공지능을 이용한 고객 응대 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR102427748B1 true KR102427748B1 (ko) 2022-08-01

Family

ID=82844281

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210133539A KR102427748B1 (ko) 2021-10-07 2021-10-07 인공지능을 이용한 고객 응대 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR102427748B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024071921A1 (ko) * 2022-09-30 2024-04-04 삼성전자 주식회사 인공지능과 음성 인식을 기반으로 동작하는 전자 장치 및 이의 제어 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010517101A (ja) * 2007-01-25 2010-05-20 エリザ・コーポレーション 発話音声プロンプトを作成するシステム及び技法
KR101501403B1 (ko) * 2014-01-21 2015-03-10 주식회사 엘지유플러스 All-IP 기반 음성/영상 호와 채팅 호 간의 실시간 전환을 위한 서버, 단말, 방법, 및 기록 매체
JP2015049337A (ja) * 2013-08-30 2015-03-16 株式会社東芝 音声応答装置、音声応答プログラム及び音声応答方法
KR20170143261A (ko) * 2016-06-21 2017-12-29 주식회사 엘지유플러스 지능망 환경에서의 전화 상담 및 채팅 상담 간의 전환을 위한 채팅 서버 및 지능망 서버의 동작 방법, 채팅 서버, 및 지능망 서버
KR20190006663A (ko) * 2017-07-11 2019-01-21 동서대학교 산학협력단 시각장애인용 음성서비스 제공 방법
KR20190117840A (ko) * 2018-03-27 2019-10-17 주식회사 머니브레인 대화 이해 ai 시스템에 의한 고객 상담의 제공 중에 사람 상담 직원으로 하여금 해당 고객을 위한 이후 상담을 진행하도록 전환하는 방법 및 컴퓨터 판독가능 기록 매체

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010517101A (ja) * 2007-01-25 2010-05-20 エリザ・コーポレーション 発話音声プロンプトを作成するシステム及び技法
JP2015049337A (ja) * 2013-08-30 2015-03-16 株式会社東芝 音声応答装置、音声応答プログラム及び音声応答方法
KR101501403B1 (ko) * 2014-01-21 2015-03-10 주식회사 엘지유플러스 All-IP 기반 음성/영상 호와 채팅 호 간의 실시간 전환을 위한 서버, 단말, 방법, 및 기록 매체
KR20170143261A (ko) * 2016-06-21 2017-12-29 주식회사 엘지유플러스 지능망 환경에서의 전화 상담 및 채팅 상담 간의 전환을 위한 채팅 서버 및 지능망 서버의 동작 방법, 채팅 서버, 및 지능망 서버
KR20190006663A (ko) * 2017-07-11 2019-01-21 동서대학교 산학협력단 시각장애인용 음성서비스 제공 방법
KR20190117840A (ko) * 2018-03-27 2019-10-17 주식회사 머니브레인 대화 이해 ai 시스템에 의한 고객 상담의 제공 중에 사람 상담 직원으로 하여금 해당 고객을 위한 이후 상담을 진행하도록 전환하는 방법 및 컴퓨터 판독가능 기록 매체

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024071921A1 (ko) * 2022-09-30 2024-04-04 삼성전자 주식회사 인공지능과 음성 인식을 기반으로 동작하는 전자 장치 및 이의 제어 방법

Similar Documents

Publication Publication Date Title
KR101827320B1 (ko) 인공지능 콜센터 서버
US10916245B2 (en) Intelligent hearing aid
US7047197B1 (en) Changing characteristics of a voice user interface
CN117221452A (zh) 使用话音和文本的同步通信
US8781826B2 (en) Method for operating a speech recognition system
JP7297797B2 (ja) 保留を管理するための方法および装置
US11721338B2 (en) Context-based dynamic tolerance of virtual assistant
US7212969B1 (en) Dynamic generation of voice interface structure and voice content based upon either or both user-specific contextual information and environmental information
KR102427748B1 (ko) 인공지능을 이용한 고객 응대 시스템 및 방법
JP6689953B2 (ja) 通訳サービスシステム、通訳サービス方法及び通訳サービスプログラム
CN112087726B (zh) 彩铃识别的方法及系统、电子设备及存储介质
WO2014069443A1 (ja) 不満通話判定装置及び不満通話判定方法
US10891813B2 (en) Cognitive vetting system for unsolicited residential visitors
US20240040039A1 (en) Selectable Controls for Interactive Voice Response Systems

Legal Events

Date Code Title Description
GRNT Written decision to grant