KR101600509B1 - 음성 감성 지수를 이용한 호 및 화자의 평가 장치 및 방법 - Google Patents

음성 감성 지수를 이용한 호 및 화자의 평가 장치 및 방법 Download PDF

Info

Publication number
KR101600509B1
KR101600509B1 KR1020140091735A KR20140091735A KR101600509B1 KR 101600509 B1 KR101600509 B1 KR 101600509B1 KR 1020140091735 A KR1020140091735 A KR 1020140091735A KR 20140091735 A KR20140091735 A KR 20140091735A KR 101600509 B1 KR101600509 B1 KR 101600509B1
Authority
KR
South Korea
Prior art keywords
call
evaluation
speaker
data
time
Prior art date
Application number
KR1020140091735A
Other languages
English (en)
Other versions
KR20160010951A (ko
Inventor
최성윤
Original Assignee
(주)복스유니버스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)복스유니버스 filed Critical (주)복스유니버스
Priority to KR1020140091735A priority Critical patent/KR101600509B1/ko
Publication of KR20160010951A publication Critical patent/KR20160010951A/ko
Application granted granted Critical
Publication of KR101600509B1 publication Critical patent/KR101600509B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Child & Adolescent Psychology (AREA)
  • General Health & Medical Sciences (AREA)
  • Hospice & Palliative Care (AREA)
  • Psychiatry (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 매일 다량으로 발생하는 착발신 호의 음성 신호를 분석하여 화자의 감정을 분류 및 평가하고, 이를 통해 호의 상태를 파악함으로써 콜 센터의 상담 품질, 고객 만족도를 극대화할 수 있는 음성 감성 지수를 이용한 호 및 화자 평가 시스템 및 방법을 제공한다.

Description

음성 감성 지수를 이용한 호 및 화자의 평가 장치 및 방법{SYSTEM AND METHOD FOR EVALUATING CALL OR SPEAKER USING VOICE EMOTION INDEX}
본 발명은 콜 센터(Call center)에서 발생하는 통화에서 착발신 호 및 화자(speaker)의 상태를 평가하여 콜 센터에 대한 상담 품질을 지수화할 수 있는 호 및 화자 평가 시스템 및 방법에 관한 것이다.
일반적으로 콜 센터에서는 상담 좌석별 소속과 업무를 배정하고, 이에 대한 구분코드를 할당하여 착발신 호를 처리할 수 있도록 자동화가 되어 있다. 특히, 고객 단말로부터 통신망을 통해 호가 착신되면 콜 센터가 가용한 상담원을 확인하고, 해당 가용 상담원에게 호를 연결하여 고객 상담을 처리한다.
또한, 콜 센터에서는 착신 호와 발신 호가 종료되는 시점에 해당 호를 1개의 상담으로 정의하여 녹음 파일로 저장하며, 저장된 녹음 파일은 고객 민원이 발생한 경우 증빙자료로 사용하거나, 상담원 평가를 위한 표본 선정 및 근거 자료로 사용할 수 있다.
그런데, 매일 발생하는 수만 건의 호에서 고객 불만 및 상담 미흡 사례를 녹음 파일로부터 일일이 찾기란 불가능하다. 이러한 이유로 콜 센터의 상담 품질에 대하여 객관적으로 지수화 하기가 어려운 문제점이 있다.
관련 선행기술로는 한국등록특허공보 제10-0642455호(발명의 명칭: 기업 전화응대에 대한 고객만족도 자동평가 서비스 방법, 공고일자: 2006년 11월 02일) 등이 있다.
본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로서, 매일 다량으로 발생하는 착발신 호의 음성 신호를 분석하여 화자의 감정을 분류 및 평가하고, 이를 통해 호의 상태를 파악함으로써 콜 센터의 상담 품질, 고객 만족도를 극대화할 수 있는 음성 감성 지수를 이용한 호 및 화자 평가 시스템 및 방법을 제공하는 데 그 목적이 있다.
이를 위하여, 본 발명의 실시 예에 따른 평가 장치는, 통화 호에서 발생한 음성 데이터로부터 특징 벡터를 추출하여 음성, 비음성 여부를 판별하고 상기 통화 호에 참여하는 화자의 감정을 분석하는 감정 분석 엔진; 상기 감정 분석 엔진을 통해 분석한 화자별 감정 지수를 일정 시간 단위로 누적하여 통계적 기초 데이터를 생성하는 기초 데이터 산출부; 상기 기초 데이터를 시간 관련 평가 지표, 감정 관련 평가 지표가 될 적어도 하나 이상의 파라미터로 변형 및 가공하여 평가 데이터로 산출하는 평가 데이터 산출부; 상기 평가 데이터 산출부를 통해 산출한 적어도 하나 이상의 평가 데이터에 대하여 평가 기준일 이전까지의 일별 누적 데이터를 근거로 시간 흐름에 따라 변화하는 각 화자의 상태와 통화 호의 상황을 평가 점수로 정규화하는 평가 점수 산출부; 및 상기 평가 점수를 기준으로 호 또는 화자의 상태를 평가하는 판별부를 포함한다.
한편, 본 발명의 실시 예에 따른 평가 방법은, 통화 호에서 발생한 음성 데이터로부터 특징 벡터를 추출하여 상기 특정 벡터로부터 상기 통화 호에 참여하는 화자의 감정을 분석하는 감정 분석 단계; 상기 감정 분석 단계를 통해 분석한 화자별 감정 지수를 일정 시간 단위로 누적하여 통계적 기초 데이터를 생성하는 기초 데이터 산출 단계; 상기 기초 데이터를 시간 관련 평가 지표, 감정 관련 평가 지표가 될 적어도 하나 이상의 파라미터로 변형 및 가공하여 평가 데이터로 산출하는 평가 데이터 산출 단계; 상기 평가 데이터 산출 단계를 통해 산출한 적어도 하나 이상의 평가 데이터에 대하여 평가 기준일 이전까지의 일별 누적 데이터를 근거로 시간 흐름에 따라 변화하는 각 화자의 상태와 통화 호의 상황을 평가 점수로 정규화하는 평가 점수 산출 단계; 및 상기 평가 점수를 기준으로 호 또는 화자의 상태를 평가하는 판별 단계를 포함할 수 있다.
이러한 본 발명에 따르면, 콜 센터에서 발생하는 착발신호의 음성 신호로부터 객관적이고 일률적인 지표 데이터를 추출하고 이를 근거로 화자의 감정 및 호의 상태를 분류 및 평가함으로써, 일일이 다루기 힘든 분류 및 평가 과정에 일괄적인 처리 능력을 부여하고 호에서 발생하는 정보를 누락 없이 반영할 수 있도록 한다.
또한, 콜 센터 내부 운영 관리자의 개인차로 인한 평가 결과의 부정확성을 개선하여 차등 없이 정형화된 데이터를 실시간으로 반영하며, 콜 센터의 상담품질 및 고객 만족도를 극대화할 수 있는 효과가 있다. 특히, 기업 입장에서 불만 고객에 대한 관리 및 신속 대처가 가능한 효과가 있다.
도 1은 본 발명의 실시 예에 따른 호 및 화자 평가 시스템을 개략적으로 나타낸 구성도.
도 2는 본 발명의 실시 예에 따른 평가장치의 구성을 나타낸 도면.
도 3은 본 발명의 실시 예에 따른 호 및 화자 평가 방법을 설명하기 위한 흐름도.
도 4는 도 3의 호 및 화자 평가 방법을 설명하기 위한 상세 흐름도.
본 명세서에서 사용되는 기술적 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아님을 유의해야 한다. 또한, 본 명세서에서 사용되는 기술적 용어는 본 명세서에서 특별히 다른 의미로 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 의미로 해석되어야 하며, 과도하게 포괄적인 의미로 해석되거나, 과도하게 축소된 의미로 해석되지 않아야 한다.
또한, 본 명세서에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "구성된다" 또는 "포함한다" 등의 용어는 명세서 상에 기재된 여러 구성 요소들, 또는 여러 단계들을 반드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을 수도 있고, 또는 추가적인 구성 요소 또는 단계들을 더 포함할 수 있는 것으로 해석되어야 한다.
또한, 본 명세서에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다.
이하, 첨부된 도면을 참조하여 본 실시 예를 상세하게 설명한다.
도 1은 본 발명의 실시 예에 따른 호 및 화자 평가 시스템(이하, 시스템)을 개략적으로 나타낸 구성도이다.
본 발명의 실시 예에 따른 시스템은 도 1에 도시한 바와 같이 단말기(10), 교환기(20), 녹취 장치(30), 평가 장치(40), 관리자 단말기(50)를 포함한다.
여기서, 시스템은 각 구성요소들이 하나의 독립적인 장치로 구현되는 예를 도시하였으나, 필요에 따라 구성요소의 추가 및 삭제, 상호 포함하여 적용할 수 있다.
단말기(10)는 유선 전화기 또는 무선 전화기를 포함할 뿐만 아니라 사용자의 키 조작에 따라 통신망을 경유하여 각종 데이터를 송수신할 수 있는 단말기를 말한다.
특히, 본 실시예에 따른 단말기(10)는 콜 센터의 호에 접속하여 착발신이 가능한 단말을 포함한다. 이를 테면, 발신 단말로서 콜 센터에 접속하여 발신 통화를 요청하는 고객 단말기(11), 착신 단말로서 콜 센터의 상담원이 고객으로부터의 통화 요청을 착신하는 단말(이하, 상담원 단말기)(12)을 포함할 수 있다.
이러한 단말기(10)는 유무선 전화기, 이외 태블릿 PC(Tablet PC), 랩톱(Laptop), 개인용 컴퓨터(Personal Computer: PC), 스마트폰(Smart Phone), 개인휴대용 정보단말기(Personal Digital Assistant: PDA) 및 이동통신 단말기(Mobile Communication Terminal) 등 다양하게 적용할 수 있을 것이다.
교환기(20)는 단말기(10)에서 음성 통신 서비스를 제공하기 위해 고객 단말기(11)로부터 호(call) 신호를 전달받아 호 전환을 위한 스위칭 동작을 수행한다. 따라서, 고객 단말기(11)가 콜 센터에 전화를 발신하면 교환기(20)를 통해 상담원 단말기(12)와 연결하여 통화 서비스를 제공한다.
또한, 교환기(20)는 위치등록 절차 및 핸드오프 절차 처리, 타 망과의 연동 기능 등을 수행할 수 있다. 여기서, 교환기(20)는 IP-PBX(Internet Protocol-Private Branch eXchange)일 수 있으나 반드시 이에 한정되는 것은 아니다.
일반적인 PBX 시스템의 연결 절차를 설명하면 다음과 같다. 즉, 고객 단말기(11)가 해당 기업의 대표번호로 전화를 발신하면, 해당 호는 PSTN(Public Switched Telephone Network)을 통하여 기업의 IP-PBX인 교환기에 연결하기 위하여 기업의 대표번호가 IP-PBX인 교환기에 등록된 연결번호로 매핑된다. 해당 호는 IP-PBX인 교환기에 연결 이후 ARS를 통하여 고객 단말기(11)가 음성 자동 응답을 수신한다. 이후, 고객 단말기(11)에서 자동응답에 대한 내선번호를 선택하고, 고객 단말기(11)가 선택한 내선번호에 따라 IP-PBX인 교환기가 해당 내선 번호에 해당하는 상담원 단말기(12)로 자동 연결 한다. 이때, 교환기는 연결 중인 내선 번호에 해당하는 상담원 단말기(12)와 연결된 후 고객 단말기(11)와 상담원 단말기(12)간의 음성 데이터를 녹취한다. 이러한, 방식은 콜센터 서비스에서 기업 내 IP-PBX 시스템을 구축하고 기업 내에서 사용되는 일정 수의 외부 전화회선을 모든 직원이 공유하고, 내선에 연결되어 있는 내부 사용자들 간에 전화를 자동으로 연결할 수 있는 네트워크로 구축될 수 있다.
녹취 장치(30)는 교환기(20)를 매개로 고객 단말기(11)와 상담원 단말기(12)간에 음성 통화가 연결되면 호에 실린 음성 데이터를 녹취하여 저장하는 장치를 말한다. 이때, 녹취 장치(30)는 착신 호와 발신 호가 종료되는 시점에 해당 호를 1개의 상담으로 정의하여 녹취할 수 있다.
또한, 녹취 장치(30)는 레코딩 서버(Recording Server), CTI 서버(Computer Telephony Integration Server), CRM(Customer Relationship Management), 호 센터 데이터(Call Center Data) 등을 포함할 수 있으나 반드시 이에 한정되는 것은 아니다.
평가 장치(40)는 호의 발생과 함께 결정되는 호 관련 정보와, 발생된 호에서 시간의 흐름에 따라 변화하는 녹취 정보를 이용하여, 호 관련 정보 및 해당 호에 참여하는 화자들의 정보를 평가 항목의 요건에 맞춰 정의한 기초데이터를 생성한다.
또한, 평가 장치(40)가 호 평가 및 화자를 평가하기 위한 평가 점수의 토대가 되는 평가 데이터를 생성할 수 있다. 그리고, 분석 대상인 호에서 추출한 기초 데이터와 분석 대상인 호의 발생일 전일까지의 누적 데이터를 반영하여 평가 점수를 산출할 수 있다. 여기에, 평가 장치(40)가 특수 상황에 따른 분류 기준을 적용하여 가산 및 감산 점수를 추가적으로 부여함으로써 사이트에서 요구하는 기준에 부합되는 최적화된 평가를 제공할 수도 있다.
이처럼, 평가 장치(40)에서 발생하는 각 기초 데이터, 평가 데이터, 평가 점수는 호의 발생 일자를 기준으로 생성되며, 데이터베이스(DB: 도 2의 60)에 저장된다. 데이터베이스(60)는 평가 장치(40) 내에 구비될 수 있고, 평가 장치(40)와 별개의 독립적인 저장 장치로 구비될 수 있다. 후자의 경우 클라우딩(clouding) 환경을 기반으로 구축되는 것도 가능할 것이다.
또한, 평가 점수를 산출하는 과정에서 반영되는 누적 데이터는 데이터베이스에 저장된 기준 일자 이전의 모든 데이터를 대상으로 한다. 따라서, 평가 장치(40)는 누적 데이터를 산출하는 반복 과정을 줄이고 시스템의 부하를 줄이기 위해 시스템 운영 일자 이전의 데이터를 대상으로 사전에 누적 데이터를 연산하여 저장하는 모듈을 포함할 수 있다.
한편, 평가 기준에 따라 하나 이상의 항목으로 산출되는 평가 점수는, 평가 점수가 포함하는 각 항목들과 가산 및 감산 점수를 합산하여 최종적으로 대상 호 및 화자를 평가한다. 여기서, 평가 장치(40)는 모든 호 및 화자에 대해 동일한 기준을 통해 일관된 평가를 수행할 수 있도록 평가 데이터를 점수화 하는 과정에서 표준 점수 및 각 항목별 반영 비중을 할당해 평가 기준을 정규화 하는 과정을 포함할 수 있으며, 해당 과정에 반영되는 기준 데이터를 입력 또는 수정할 수 있는 모듈을 포함할 수 있다.
또한, 평가 장치(40)는 적용 사이트의 소속 또는 업무에 따라 평가 데이터에 서로 다른 기준을 적용할 수 있으며, 평가 데이터에서 각 항목들의 패턴을 분석하여 특정 유형에 속하는 호들을 따로 관리할 수 있도록 유형에 따른 점수 산출 기능을 포함할 수 있다. 이때, 평가 장치(40)는 해당 호의 유형을 분류 및 판별하는 모듈을 포함할 수 있으며, 동일 평가 데이터에 대해 다른 기준을 통해 산출된 하나 이상의 평가 점수들을 따로 저장하고 관리할 수 있는 모듈을 포함할 수 있다. 또한, 평가 장치(40)가 각 상담원 및 고객별로 존재할 수 있는 개인의 고정적인 오차를 반영하기 위해 평가 데이터를 점수화하는 과정에 이를 보정하는 모듈을 포함할 수 있다.
관리자 단말기(50)는 네트워크 연결이 가능한 단말기라면 그 종류와 상관없이 어떠한 단말기라도 가능하다. 예컨대, 관리자 단말기(50)는 노트북 컴퓨터, 이동통신 단말기, PDA 등 통신 컴퓨팅 장치를 포함하는 넓은 개념의 단말을 포함할 수 있다.
본 발명의 실시 예에 따른 관리자 단말기(50)는 평가 장치(40)로부터 통계 데이터 또는 리포트 데이터를 제공받아 표시한다.
도 2는 본 발명의 실시 예에 따른 평가 장치의 구성을 구체적으로 나타낸 도면이다.
도 2에 도시한 바와 같이, 본 발명의 실시 예에 따른 평가 장치(40)는 감성 분석 엔진(41), 기초 데이터 산출부(42), 평가 데이터 산출부(43), 평가 점수 산출부(44), 유형 판별부(45), 가산/감산 점수 산출부(46), 문제호 판별부(47), 화자 판별부(48)를 포함할 수 있다.
감정분석 엔진(41)은 분석 대상 호에 참여하는 화자의 감정을 분류한다. 평가 장치에 소프트웨어적으로 탑재된 감정분석 엔진(41)은 '남성평상', '남성화남', '여성평상', '여성화남' 등으로 구분되는 다수의 학습데이터로부터 추출한 하나 이상의 음성 특징 벡터로 훈련된 화자 독립형 감정 분류기를 포함한다. 감정 분석 엔진(41)의 분류 기능은 실시간으로 유입되는 음성 신호 및 완료된 녹취 데이터에서 일괄적으로 유입되는 음성 신호에 대한 판정 기능을 모두 포함한다.
구체적으로, 감정 분석 엔진(41)이 화자의 감정을 분류하는 과정에 대하여 기술하도록 한다.
분석 대상 호의 각 화자별 음성 데이터가 평가 장치(40)로 유입되면, 평가 장치(40)가 시스템이 정의하는 추출 단위시간에 맞춰 음성 신호를 프레임으로 분해 및 전송한다. 그러면 감정분석 엔진(41)이 평가 장치(40)로부터 유입되는 프레임에서 '남성' 및 '여성', '평상' 또는 '화남'을 구분하기 위해 음성 특징 벡터를 추출하고, 추출한 음성 특징 벡터로부터 해당 프레임의 음성/비음성 여부를 판별한다. 음성으로 판별된 프레임의 특징은 시스템이 정의하는 분석 단위시간에 맞춰 누적하여, 누적량이 기준 값을 충족할 경우 분류기를 통해 감정을 분류한다.
예컨대, 콜 센터에서 통상적으로 사용하는 녹취 설정인 8kHz 샘플 레이트(sample rate)를 기준으로 20ms 단위의 추출시간과 1초 단위의 분석시간으로 설정된 감정 분석 엔진이 동작하는 경우, 분석 단위 시간인 1초 동안 최대 50개 음성 프레임의 추출된 특징을 누적하여 분석할 수 있다. 이때, 분석을 위한 누적된 특징의 최소 개수에 제한을 둘 수 있는데, 콜 센터에서 높은 빈도로 발생하는 1음절의 '네' 또는 '예' 와 같은 발성구간을 최소 인식 단위로 설정하여 60ms 이상의 연속된 음성이 들어올 경우, 즉 3개 미만의 특징 벡터의 경우는 비음성 구간으로 판정하여 감정분류를 생략하는 예외처리 모듈을 포함할 수 있다.
기초 데이터 산출부(42)는 통화 연결이 종료된 호를 대상으로 동작하며, 각 호마다 시스템에 정의된 분석 단위로 기록된 시간정보 및 감정 분석 엔진(41)의 지수 데이터를 종합하여 단일 값으로 수렴된, 호에 대한 특징 정보를 산출할 수 있다. 예를 들어, 한 통의 착발신 호가 완료되면 해당 통화의 관련 정보와 녹취 데이터는 데이터베이스(DB: 60)에 저장되고, 시스템의 평가 장치(40)는 데이터베이스(60)로부터 해당 정보를 감지하여 감정 분석 엔진(41)을 이용해 녹취 데이터의 분석을 수행한다. 분석이 시작되면 20ms 단위의 특징 벡터가 추출되고, 이는 다시 1초 단위의 데이터로 분류되어 각 단위 시간별 감정 지수를 산출한다. 초 단위로 판별된 감정 지수는 일련의 예외처리 과정과 통계적인 기법을 이용하여 하나의 값으로 수렴될 수 있으며, 이 수렴된 값들이 기초 데이터로 사용된다.
이렇게 산출된 기초 데이터는, 화자 화남지수(AI, Anger Index), 화남개수(Anger Count), 평상지수(Neutral Index), 평상개수(Neutral Count), 에너지(Energy), 데이터 개수(Count), 통화 시작시간(Start Time)을 포함하며, 해당 정보는 통화에 참여하는 화자인 상담원과 고객 각각에 대해 존재할 수 있다.
이처럼 기초데이터 산출부(42)를 통해 생성되는 기초 데이터는 일 예로 아래 표 1과 같다.
[표 1]
Figure 112014068099876-pat00001
평가 데이터 산출부(43)는 기초데이터 산출부(42)를 통해 통계적으로 추출된 감정 지수 데이터를 근거로 평가의 기반이 되는 하나 이상의 파라미터를 산출할 수 있으며, 이렇게 산출된 파라미터를 평가 데이터라고 부른다.
아래 표 2에서 나타낸 바와 같이, 호를 평가하는데 이용되는 평가 데이터(파라미터)는 통화시간(Duration), 대화시간(TT, Talk Time), 대기시간(HT, Holding Time), 고객 발화시간(CTT, Customer Talk Time), 고객 발화비율(CTTR, Customer Talk Time Ratio), 상담원 발화시간(ATT, Agent Talk Time), 상담원 발화비율(ATTR, Agent Talk Time Ratio), 음성겹침시간(LRO, Listen & Response Overlay), 음성격차시간(LRG, Listen & Response Gap) 등과 같이 시간 관련 지표와, 고객 불만 지수(CAI, Customer Anger Index), 상담원 불만 지수(AAI, Agent Anger Index) 등과 같은 감정 관련 지표를 포함할 수 있다.
[표 2]
Figure 112014068099876-pat00002
평가 점수 산출부(44)는 앞서 평가 데이터 산출부(43)에서 산출된 평가 데이터와, 시스템에서 기 설정된 평가 기준을 이용하여 각 파라미터를 점수화한 평가 점수를 산출한다.
산출 시 평가 기준은 일별 혹은 용도별로 사이트 혹은 관리자의 필요에 따라 각각 다르게 적용될 수 있다. 이때, 시스템은 평가 기준을 수정하거나 추가할 수 있는 모듈을 포함할 수 있다. 여기서, 동일 일자에 발생한 동일 유형의 호는 일관된 평가기준을 반영해야 하므로, 일반적인 상황에서 운용 중 실시간으로 반영되는 평가 기준은 수정 및 삭제가 제한될 수 있다.
평가 점수를 산출하는데 필요한 정보는 아래 표 3과 같다.
[표 3]
Figure 112014068099876-pat00003
평가 점수 산출부(44)는 금일 발생한 평가데이터의 파라미터 값과 전일까지 누적된 데이터의 평균 및 표준편차 정보, 각 파라미터가 호 평가 점수에서 반영될 비중 및 유형 정보에 근거하여 평가 점수를 산출할 수 있다.
산출 방법은 하기 수학식 1을 적용할 수 있다.
[수학식 1]
Figure 112014068099876-pat00004
여기서, x는 점수화 대상이 되는 각 파라미터 값을 의미하며, SP와 SD는 분석대상 일자의 전일까지 누적되어 계산된 각 파라미터의 평균과 표준편차 정보를 각각 의미한다. Weight 값은 각각의 파라미터를 합산하였을 때 총점에 기여하는 비중을 의미하며, Type은 해당 파라미터가 클수록 도움이 되는 지표인지 작을수록 도움이 되는 지표인지를 결정할 수 있는 파라미터의 유형을 의미한다. α는 조직별, 업무별 혹은 유형별로 일관된 기준을 적용함으로 인해 발생할 수 있는 문제를 보상하기 위한 값이다. 이 α값은 호 및 화자를 평가하는데 있어 데이터적으로 영향을 주지만, 상황적으로 반영될 필요가 없는 부분들을 보정하기 위한 값이다. 예컨대, 특정 자리의 녹취 환경이 일반 환경에 비해 이득(gain)이 높아 에너지가 평균적으로 높게 들어올 수 있으며, 특정 상담원의 목소리가 너무 크거나, 억양 및 강세 등의 이유로 다른 사람에 비해 고정적인 오차(fixed bias)를 보여주는 경우, 적절한 보정 값을 산정하여 모든 호와 화자를 가능한 동등한 레벨에서 측정하여 일률적인 평가 환경을 제공하게 한다.
상술한 바와 같이, 평가 점수 산출부(44)는 시스템의 날짜가 바뀌게 되면 전일까지의 누적된 데이터를 종합하여 각 파라미터에 대한 누적평균과 누적표준편차를 산출할 수 있다.
여기서, 수학식 1에 의하면 누적평균과 누적표준오차는 모든 호의 모든 파라미터에 필수적으로 반영되는 것을 알 수 있다. 해당 데이터를 산출하려면 과거의 모든 데이터에 대한 평균을 구하고 이를 기준으로 다시 모든 데이터에 대한 표준오차를 구해야 하는데, 이는 데이터베이스 혹은 시스템의 성능 저하를 야기할 수 있으며 분석 대상의 발생일 동안은 같은 동작을 반복하는 작업이기 때문에 중복을 생략할 수 있다. 이처럼, 평가 장치(40)는 누적평균과 누적표준편차를 구하기 위해 필요한 기준일의 각 파라미터 합과, 편차 합, 대상 호 수를 저장하여, 하기 수학식 2와 수학식 3을 통해 동일한 효과를 낼 수 있도록 한다.
[수학식 2]
Figure 112014068099876-pat00005
[수학식 3]
Figure 112014068099876-pat00006
가산/감산 점수 산출부(46)는 콜 센터의 소속, 업무 유형별로 존재하는 특정 상황에 대한 조건을 지정하여 평가 점수에 이를 반영할 수 있도록 한다. 앞서 언급되었던 보정값이 파라미터 각각에 대한 보상을 해주었다면, 가산/감산 점수는 특정 상황에 대한 점수를 보정하는 역할을 한다.
예컨대, 특정 파라미터의 조건 만족 여부 또는, 특정 기간내 반복적으로 연결된 호의 수와 같은 특정 상황을 감지하여 호 평가 점수에 추가적인 가산점 부여 등의 경우를 지정할 수 있다. 이 가산/감산 점수의 반영은 고객 유형(Customer Type) 및 고객 등급(Customer Grade)과 같이 특정 유형에 기준한 집중적인 평가를 가능하도록 한다. 특정 유형은 유형 판별부(45)를 통해 획득할 수 있다.
문제호 판별부(47)는 최종적으로 산출된 호 평가 점수와 가산/감산 점수를 모두 반영한 합산 점수를 근거로, 점수가 높을수록 심각한 문제 호(Problem Call)로 판정하여 우선청취를 위한 순위를 부여할 수 있다.
또한, 문제호 판별부(47)는 사이트 특성 또는 사용자의 의도에 따라 높은 점수를 기록하고 있지만, 문제 호의 분류에서 제외할 필요성이 있는 호의 경우, 각 평가 데이터 또는 호에 포함된 화자별 기초 데이터 사이의 관계를 이용하여 예외 처리를 할 수 있는 모듈을 포함할 수 있다.
화자 판별부(48)는 문제호 판별부(47)와 마찬가지로, 호 평가 점수와 가산/감산 점수를 모두 반영한 합산 점수를 근거로 한다. 상담원의 경우 점수가 낮을수록 우수 상담원으로 순위를 부여할 수 있다. 반면, 고객의 경우 합산 점수가 높을수록 집중관리 대상 혹은 블랙리스트 등의 유형에 분류 할 수 있다. 이는 점수화에 반영되는 표준점수(Weight)와 반영유형(Type)의 설정에 따라 그 의도를 반영하고, 보정 파라미터(α)의 가산/감산 점수를 통해 해당 의도를 더욱 선명하게 나타나도록 도와주는 부분들의 상호 작용을 통해 가능하다.
여기서, 평가 장치(40)는 점수 산출에 반영되는 설정 데이터를 제어할 수 있는 모듈을 포함할 수 있다.
이러한 구성에 기초하여 본 발명의 실시 예에 따른 호 및 화자 평가 방법에 대하여 도 3 및 도 4를 참조하여 설명하기로 한다. 참고로, 도 1 및 도 2에서의 구성요소를 참조한다.
먼저, 평가 장치(40)는 교환기(20) 또는 녹취 장치(30)로부터 연결된 호의 음성 데이터 및 관련 정보를 획득할 수 있으며, 평가 장치(40)에 탑재된 감성분석 엔진(41)을 통해 화자 음성 신호에 대한 감정지수 생성 및 저장 과정을 거치게 된다. 이때, 평가 장치(40)는 교환기(20) 및 녹취 장치(30) 중 적어도 하나의 장치와 연동하여 파라미터와 관련된 데이터인 통화 정보, 상담원 정보 및 고객 정보 중 적어도 하나 이상의 정보를 수신한다.
수신 이후 단계 S10에서, 평가 장치(40)가 감정분석 엔진(41)을 통해 호에서 발생된 음성 데이터로부터 특징 벡터를 추출하고 추출한 특징 벡터를 근거로 음성 데이터에 실린 화자의 감정을 분류한다. 이때, 화자는 고객 또는 상담원 이 둘을 모두 포함한다. 분류 시 화자의 감정이 불만으로 판정된 경우 평가 장치(40)가 시스템에서 지정한 추출 시간 또는 분석 시간 단위로 누적하여 데이터베이스에 저장하는 과정을 거친다.
감정 분석 엔진(41)은 상기의 과정을 호의 연결과 동시에 실시간(Real Time)으로 처리하거나, 호 연결의 종료 이후 일괄적(Batch)으로 처리할 수 있다. 또한, 감정 분석 엔진(41)은 호에서 발생된 음성 데이터로부터 음성 신호의 피치(Pitch), 에너지(Energy), MFCC를 나타내는 특징 벡터를 추출하고, 이를 근거로 '불만' 또는 '평상'의 감정 상태와 '남성' 또는 '여성'의 성별 여부를 판정한다. 본 실시 예에 포함된 특징 벡터는 이해의 편의상 '화남'과 '평상'의 두 감정을 분류하는 것으로 예시하고 있으나, 반드시 해당 분류에만 한정되는 것은 아니며 적용 사이트에 따라 평가에 반영될 수 있는 다른 요구가 발생하면 이를 위해 분류 항목을 추가하거나 수정할 수 있다.
다음 단계 S11에서, 호의 연결이 종료되면 이를 감지한 기초데이터 산출부(42)가 누적 판정 결과와 시간 정보를 각 항목별로 종합하여 호를 대표하는 기초 데이터를 산출한다. 
일정 시간 단위로 누적된 감정 판정 결과는 상담원과 고객 각각에 대해 존재할 수 있으며, 분리된 두 항목은 기초데이터를 생성하면서 하나의 데이터로 통합될 수 있다. 또한, 독립적으로 존재하던 두 항목은 데이터를 통합하는 과정에서 시간 정보를 기준으로 동일한 타임라인(Timeline)으로 동기화 될 수 있으며, 이 경우에도 동기화된 데이터의 비교 분석을 통해 발생하는 두 화자의 발화 시간 및 발화 구간 정보를 근거로 화자의 태도 및 유형을 구분하여 판정할 수 있다.
기초 데이터 산출 후, 단계 S12에서, 평가 장치(40)의 평가데이터 산출부(43)가 호 및 화자를 평가하는 기준이 되는 평가 데이터를 산출하기 위해 기초데이터를 변형 및 가공한다. 그리고, 평가 데이터 산출부(43)가 각 화자의 발화시간을 추출하고 이를 통해 상담원의 발화시간(ATT)과 고객 의 발화시간(CTT)을 각각 검출한다. 또한, 평가 데이터 산출부(43)가 한 명 이상의 화자가 동시에 발화한 구간을 분석하여 음성겹침(LRO) 시간을 추출하고, 두 화자의 각 발화구간 사이의 격차 정보를 통해 음성격차(LRG) 시간을 추출할 수 있다.
여기서, 음성 겹침(LRO) 정보와 음성격차(LRG) 정보는 수치적으로 단순히 두 화자 발화간의 교차와 간격을 나타내는 값이지만 어떤 화자를 기준으로 보느냐에 따라 그 값이 갖는 의미가 크게 달라질 수 있다. 예컨대, 콜 센터에서 일반적으로 상담원이 고객이 말하는 도중 끼어드는 행동은 문제 태도로서 평가에 매우 비중있게 반영될 수 있고, 반대로 상담원이 말하는 도중 고객이 끼어드는 경우는 상담에 대한 고객의 불만족도를 가늠할 수 있는 지표로서 활용될 수 있다. 따라서, 평가 데이터 산출부(43)는 음성겹침(LRO), 음성격차(LRG) 정보를 사이트에서 요구하는 평가 기준에 따라 화자별로 분리해서 저장 및 평가할 수 있다.
또한, 상기의 단계에서 평가 데이터 산출부(43)가 각 파라미터의 지수와 비중 데이터를 산출할 수 있는데, 지수와 비중이라는 정보는 어떤 값을 기준으로 산출하는가에 따라 그 의미가 달라지는 상대적인 데이터이므로 평가 대상 및 항목에 따라 올바른 기준의 선택이 매우 중요하다. 예컨대, 상담원 불만지수(AAI) 또는 고객 불만 지수(CAI) 같은 각 화자의 화남지수의 경우, 추출 기준을 각 화자의 발화 구간으로 한정해야 상담간 나타난 해당 화자의 감정을 올바르게 반영하여 표현할 수 있고, 상담원 발화비중(ATTR), 고객 발화 비중(CTTR), 음성 겹침 비중(LROR), 음성 격차 비중LRGR)과 같은 비중 정보(표 1 참조)는 상담간 차지하는 각 파라미터의 비율 및 상관관계를 표현할 수 있도록, 해당 값들의 범위를 모두 포함하는 대화시간(TT)을 기준으로 추출하는 것이 바람직하다. 여기서, 대화시간은 통화시간(DUR)에서 최초로 음성이 시작되는 시간까지의 대기시간(Holding Time)을 제외하여 추출할 수 있다. 본 실시 예를 통해 언급된 지수 및 비중의 기준값은 해당 범위에만 한정된 것은 아니며, 평가 항목 및 처리기준에 따라 달라질 수 있다.
다음으로 단계 S13에서, 평가 장치(40)의 평가 점수 산출부(44)가 수학식 1에 정의된 점수화 기준을 통해 각 파라미터를 평가 점수로 연산할 수 있다. 이때, 평가 점수 산출부(44)를 통해 발생된 결과는 평가 데이터의 항목과 일치한다. 수학식 1을 살펴보면, 평가점수의 산출을 위해서는 금일 이전까지 발생하여 누적됐던 모든 평가데이터의 평균과 표준편차 정보가 필요하다는 것을 알 수 있다.
본 시스템을 통해 추출하게 되는 각종 파라미터와 항목들은 녹취 데이터로부터 추출되는 음성신호와 시간정보 등에 근거한 것으로, 이는 모든 사이트에서 동일하게 적용될 수 있지만 해당 데이터를 어떤 기준으로 어떻게 판정할 것인가는 각 사이트와 관리자의 의도, 혹은 특정 이벤트에 의해 유연하게 달라질 수 있는 부분이다. 이에, 평가 장치(40)는 시스템으로 유입되는 정보와 이를 가공하여 산출하는 정보를 기반으로 판별 기준을 사이트 특성에 적응시키고 최적화된 고 신뢰도의 유연한 평가를 제공할 수 있는 방법을 제공한다.
한편, 상기의 단계를 통해 산출되는 모든 데이터는 일별 혹은 월별로 관리될 수 있으며, 데이터를 산출하기 위한 설정값은 일단위로 수정 및 적용이 가능하다. 평가 장치(40)는 매일 한 번 금일의 시작하기 이전, 전일 발생했던 데이터와 전일 이전까지 발생했던 데이터의 누적평균 및 누적표준편차를 통합하여 새롭게 발생하는 데이터에 적용하기 위한 데이터를 산출하는 과정을 거칠 수 있다. 누적평균 및 누적표준편차는 필요에 의해 실시간으로 계산 될 수 있지만, 시스템의 부담을 덜기 위해 일반적으로 한번의 산출과정으로 기준일의 모든 데이터에 동일하게 적용될 수 있도록 한다.
한편, 누적평균 및 누적표준편차를 산출하는 과정에 대하여 살펴보면 누적평균의 경우 누적 데이터의 합을 누적데이터의 수로 나누어서 구할 수 있다. 여기서, 누적 데이터의 합과 데이터 수는 하나 이상의 구간으로 분할해서 계산해도 같은 결과를 낼 수 있는 단순 합계에 의해 구해지는 값이므로, 분리된 기간의 각 합과 개수 정보들만 있어도 이를 다시 합하여 통합된 기간의 평균을 산출할 수 있게 된다. 누적표준편차의 경우도 누적평균과 마찬가지로 각 파라미터의 값과 누적평균과의 차의 제곱 값의 합과 개수 정보를 분리된 기간별로 저장하고 있다면 이들 정보를 합하여 통합된 기간의 표준편차를 산출할 수 있게 된다.
녹취 데이터로부터 평가점수를 산출하는 과정은, 시간의 흐름에 따라 데이터화되어 기록된 음성신호의 물리적인 특징을 이용하여, 대화에 참여한 각 화자의 상태와 연결된 호의 상황을 파악하기 위한 과정과 같다. 상태와 상황이라는 요소는 평가데이터와 같은 객관적 지표에 대해서도 이를 어떤 관점으로 보고, 어떤 기준으로 판단하는가에 따라서 그 결과가 달라질 수 있는 주관적인 지표이다. 이에, 평가 장치는 사이트 혹은 사용자의 요구에 맞춰 상태와 상황을 다양한 관점으로 분석할 수 있는 유형 분석 및 판별 모듈을 포함할 수 있다.
예컨대, 콜 센터는 일반적으로 소속과 업무라는 큰 유형으로 분류될 수 있으며 각 소속과 업무, 상담원의 특성에 따라 전반적인 고객의 유형과 통화 패턴이 달라질 수 있다. 이는 해당 유형의 호 및 화자를 평가함에 있어서 그 기준 역시 달라져야 함을 의미한다. 또한, 착발신 호에 대해서도 각 화자의 참여태도 및 성향, 대화의 내용과 시간 등의 전반적인 성향은 차이를 가질 수 있다.
이에, 평가장치에 포함된 유형 분석 및 판별 모듈은 평가 데이터를 기반으로 각 파라미터별 범위 혹은 임계치 등의 조건을 통해 해당 호를 하나 이상의 다양한 유형으로 분류하고, 각 유형별 점수화 기준을 적용하여 하나의 호, 혹은 한 명의 화자라 할지라도 다양한 관점에서의 데이터를 독립적으로 발생 및 저장할 수 있도록 한다. 또한, 앞서 언급된 일반적인 상황 외에도 누적된 각 파라미터의 패턴을 분석하여 새로운 유형을 탐지하거나 추가할 수 있는 모듈을 포함할 수 있다.
다음으로 단계 S14에서, 평가 장치(40)가 가산/감산 점수 산출부(46)를 통해 추가적인 점수를 산출하는 과정을 거친다. 평가 점수가 음성 신호로부터 추출되는 데이터와 시간 정보 등, 데이터에 기반한 평가지표를 제공한다면, 가산 및 감산 점수는 데이터 이외의 상황적인 요인에 근거하여 평가에 분별력을 더해줄 수 있다.
다음으로 단계 S15 및 S16에서, 평가 장치(40)가 판별부(47,48)를 통해 두 점수의 합산점수를 근거로 호 또는 화자에 대한 상태를 평가할 수 있다. 호와 화자를 평가하는 기준과 반영 파라미터의 수 및 비중은 사이트 혹은 사용자의 의도와 설정에 따라 다르거나 같을 수도 있으며, 유형의 종류와 수, 판별 기준은 일별로 생성되거나 수정하여 적용될 수 있다.
호의 상태를 평가하는 경우, 도 4의 S151단계에서, 평가 장치(40)가 평가 점수와 가산/감산 점수를 합산한 점수(합산 점수)가 높은지 여부를 판단한다. 높고 낮음의 판단은 평가 장치(40)에서 사전에 설정해 둔 기준값을 기준으로 비교 판단할 수 있다. 예를 들어 합산점수가 기준값 60을 기준으로 초과하면 높고, 이하이면 낮은 것으로 판단할 수 있다.
판단 결과 합산점수가 기준값보다 낮으면, 단계 S152에서, 평가 장치(40)가 합산 점수가 낮으면 낮을수록 정상적인 일반호로 분류한다.
반대로 합산 점수가 기준값보다 높으면, 단계 S153에서, 평가 장치(40)가 문제 호로 분류하고, 특히 합산 점수가 제1 임계 점수 이상인 경우 우선청취를 위한 문제 호로 판단할 수 있다. 여기서, 제1 임계 점수는 평가 점수가 너무 치명적이어서 더 이상의 모니터링 단계 없이 우선 청취의 관리 대상으로 분류하는 최대 임계값으로 정의할 수 있다.
다른 예로 화자의 상태를 평가하는 경우, S161단계에서, 평가 장치(40)가 평가 점수와 가산/감산 점수를 합산한 점수(합산 점수)가 높은지 여부를 판단할 수 있다.
판단 결과 합산 점수가 기준값보다 낮으면, 다음 단계 S162에서, 평가 장치(40)가 합산 점수가 낮으면 낮을수록 화자가 정상적인 상태(일반 상담원 또는 일반 고객)이며, 특히 상담원에 한하여 합산 점수가 제2 임계 점수보다 이하인 경우 우수 상담원으로 분류할 수 있다.
판단 결과 합산 점수가 기준값보다 높으면, 단계 S163에서, 평가 장치(40)가 합산 점수가 높으면 높을수록 교육대상 상담원 또는 집중관리 대상 고객으로 분류하고, 특히 합산 점수가 제3 임계 점수 이상인 경우 문제 화자로 판단할 수 있다.
상기의 단계에서, 호 평가 시 또는 화자 평가 시 합산 점수의 높고 낮음을 판단하는 기준값을 동일한 용어로 설명하였으나, 이는 평가 대상, 반영 파라미터의 수, 사용자의 의도 등에 따라 그 수치는 다르게 산정될 수 있다.
이하, 상기의 단계들에 의해 호를 평가하는 과정에 대하여 구체적으로 예로 들면 다음과 같다. 
먼저, 평가 장치(40)가 교환기(20) 또는 녹취 장치(30)로부터 통화 연결이 종료된 호에 실린 각 화자의 음성 데이터를 수신하면, 평가 장치(40)에 탑재된 감정 분석 엔진(41)이 기 정의된 시간 단위에 기초하여 음성 데이터의 특징 벡터를 추출하고, 추출한 특징 벡터로부터 음성과 비음성을 분리하는 동시에 단위 시간 마다의 감정 지수를 기록한다. 여기서, 감정 지수는 기 정의된 시간 단위 동안 존재하는 음성 프레임들의 감정 확률을 비율적으로 표현한 데이터를 의미한다.
그리고, 평가 장치(40)가 각 화자 별로 분리되어 있는 기초데이터를 시간 기준으로 동기화하여 하나의 데이터로 통합하는 과정을 거친다. 이때, 각 화자의 시간에 따른 상태 변화와 두 화자간 관계를 이용하여 호 평가의 근간이 되는 평가 데이터를 추출할 수 있다. 평가 데이터는 표 2에 나타난 바와 같이 하나 이상의 다양한 파라미터를 포함할 수 있으며, 통화시간(Duration), 음성겹침(LRO) 시간, 음성격차(LRG) 시간 등의 정보를 근간으로 통화 태도를 평가 할 수 있고, 통화시간, 대기시간(Holding Time), 대화시간(Talk Time), 각 화자의 음성 비중 등의 정보를 통해 고객 불만의 심각성과 상담원의 처리 숙련도 등을 평가할 수 있다.
여기서, 통화시간(Duration)은 녹취 데이터의 총 시간을 의미하며, 대기시간(Holding Time)은 녹취 데이터의 시작점으로부터 첫 화자의 발화 순간까지를 의미한다. 통화시간에서 제외시키면 두 화자의 대화시간(Talk Time)을 산출할 수 있다. 또한, 음성겹침(LRO) 구간은 시간을 중심으로 동기화 시킨 두 화자의 데이터를 교차 분석하여 두 화자가 동시에 발화한 구간으로 정의하며, 겹침 시간의 전화 후로 대화를 주도하는 사람을 식별하여 각 상황에 따른 점수를 부여할 수 있도록 처리한다. 음성격차(LRG) 구간은 두 화자가 동시에 말이 없는 구간으로 정의하며, 이 음성격차 구간은 보통 길수록 상담원의 미숙한 응대 태도를 반영하기 때문에 벌점으로 작용할 수 있는 파라미터의 하나가 된다.
평가 장치(40)는 기본적으로 모든 호에 대해 각 화자의 음성신호를 분석한 데이터와 두 화자의 음성신호를 통합하여 분석한 기초 데이터를 통해 상담원 불만지수(AAI), 상담원 발화시간(ATT), 상담원 발화비중(ATTR), 고객 불만지수(CAI), 음성 겹침(LRO), 음성 격차(LRG), 등의 평가 데이터(표 2 참조)를 산출하고 이를 근간으로 평가 데이터를 위한 하나 이상의 파라미터를 정의할 수 있다.
이후, 평가 장치(40)가 각 파라미터에 대하여 기준일 이전의 누적 데이터에 기초하여 평가 점수를 산출하고, 호의 유형별 평가를 위해 각 호에 대한 유형을 분류하여 유형에 따라 가산/감산 점수의 산출할 수 있다. 보통, 평가 장치(40)는 각 유형별 평가점수를 산출하기 때문에 하나의 호에 대해 하나 이상의 평가 점수가 발생할 수 있으며, 각 유형은 판별 조건을 포함하고 있기 때문에 각 호는 각 유형에 포함될 수도 혹은 포함되지 않을 수도 있다.
이후, 평가 장치(40)가 평가 점수와 가산/감산 점수의 산출을 완료하면 각 호의 합산 점수를 산출하여 점수가 높을수록 우선청취를 위한 문제 호(Problem Call)로 분류한다.
문제 호로 분류 시, 평가 장치(40)는 일별로 누적된 기준일의 평가 데이터를 상담원 중심으로 분석하여 상담원을 평가할 수 있다. 즉, 상담원 평가는 하루 한 번, 상담원이 포함된 호들의 감정 지수 및 처리 시간, 건수 등의 정보를 종합하여 누적된 상담원 정보와 전일 대비 변화량 정보를 통해 상담원의 성과 및 응대 태도 등을 분석 평가할 수 있다. 이때, 평가 장치(40)는 기준일의 대상 상담원을 포함하는 호들의 평가 데이터를 종합하여 아래 표 4에 있는 항목과 같이 각 파라미터에 대한 평균을 구하고, 설정된 평가 기준에 따라 상담원의 태도, 유형, 성과 등을 평가할 수 있다.
[표 4]
Figure 112014068099876-pat00007

이상의 설명은 본 발명을 예시적으로 설명한 것에 불과하며, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술적 사상에서 벗어나지 않는 범위에서 다양한 변형이 가능할 것이다. 따라서 본 발명의 명세서에 개시된 실시 예들은 본 발명을 한정하는 것이 아니다. 본 발명의 범위는 아래의 특허청구범위에 의해 해석되어야 하며, 그와 균등한 범위 내에 있는 모든 기술도 본 발명의 범위에 포함되는 것으로 해석해야 할 것이다.
10: 단말기 11: 고객 단말기
12: 상담원 단말기 20: 교환기
30: 녹취 장치 40: 평가 장치
50: 관리자 단말기 41: 감정 분석 엔진
42: 기초 데이터 산출부 43: 평가 데이터 산출부
44: 평가 점수 산출부 45: 유형 판별부
46: 가산/감산 점수 산출부 47: 문제 호 판별부
48: 화자 판별부

Claims (14)

  1. 통화 호에서 발생한 음성 데이터로부터 특징 벡터를 추출하여 음성, 비음성 여부를 판별하고 상기 통화 호에 참여하는 화자의 감정을 분석하는 감정 분석 엔진;
    상기 감정 분석 엔진을 통해 분석한 화자별 감정 지수를 일정 시간 단위로 누적하여 통계적 기초 데이터를 생성하는 기초 데이터 산출부;
    상기 기초 데이터를 시간 관련 평가 지표, 감정 관련 평가 지표가 될 적어도 하나 이상의 파라미터로 변형 및 가공하여 평가 데이터로 산출하는 평가 데이터 산출부;
    상기 평가 데이터 산출부를 통해 산출한 적어도 하나 이상의 평가 데이터에 대하여 평가 기준일 이전까지의 일별 누적 데이터를 근거로 시간 흐름에 따라 변화하는 각 화자의 상태와 통화 호의 상황을 평가 점수로 정규화하는 평가 점수 산출부; 및
    상기 평가 점수를 기준으로 호 또는 화자의 상태를 평가하는 판별부를 포함하고,
    상기 통화 호에 참여하는 화자 및 호의 상태, 소속, 업무 유형에 따라 존재하는 특정 상황에 대하여 통화 패턴을 정의한 가산 또는 감산 점수를 산출하여 상기 평가 점수에 보정하는 가산/감산 점수 산출부를 더 포함하며,
    상기 감정 분석 엔진은,
    상기 통화 호에서 발생하는 음성 데이터의 특징 벡터로부터 하나의 통화 호에 참여하는 화자를 상담원 및 고객으로 구분하고 각 화자별 감정 분석을 통해 화자의 성별, 불만 또는 평상의 화자 감정 상태를 분류하며,
    상기 평가 데이터는, 상기 시간 관련 지표로서 총 통화시간(Duration), 대화시간(TT, Talk Time), 대기시간(HT, Holding Time), 고객 발화시간(CTT, Customer Talk Time), 고객 발화비율(CTTR, Customer Talk Time Ratio), 상담원 발화시간(ATT, Agent Talk Time), 상담원 발화비율(ATTR, Agent Talk Time Ratio), 음성겹침시간(LRO, Listen & Response Overlay), 음성격차시간(LRG, Listen & Response Gap) 중 적어도 하나 이상을 포함하고, 상기 감정 관련 지표로서 고객 불만 지수(CAI, Customer Anger Index), 상담원 불만 지수(AAI, Agent Anger Index) 중 적어도 하나 이상을 포함하며,
    상기 평가 데이터에 대하여 상기 평가 데이터 산출부가 평가 대상 및 항목에 따라 어떤 화자를 기준으로 산출할 것인지를 선택하고 선택된 화자를 기준으로 두 화자간 음성겹침시간 또는 음성격차시간에 따른 시간 관련 지표를 추출하는 것을 특징으로 하는 평가 장치.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서,
    상기 감정 분석 엔진은
    상기 통화 호에서 발생한 음성 데이터를 호 연결과 동시에 교환기로부터 실시간 수신하거나, 통화 종료 이후 녹취 장치로부터 녹취된 데이터를 수신하여 일괄적으로 처리하는 것을 특징으로 하는 평가 장치.
  5. 제1항에 있어서,
    상기 기초 데이터는 호에 대한 화자의 화남 지수(AI), 통화시간 내에 존재하는 화남 데이터의 개수(Anger Count), 호에 대한 화자의 평상 정보(NI), 통화 시간 내에 존재하는 평상 데이터의 개수, 호에 분포되어 있는 음성 에너지의 합, 호에서 처음으로 음성이 시작된 시간(Start Time) 중 적어도 하나 이상의 정보를 포함하며,
    각 정보는 상기 통화 호에 참여하는 화자별로 생성되는 것을 특징으로 하는 평가 장치.
  6. 제5항에 있어서,
    상기 기초 데이터 산출부는
    상기 통화 호에 참여하는 화자별로 생성된 각 기초 데이터를 시간 정보에 기초하여 동일한 타임라인(Timeline)으로 동기화하여 하나의 데이터로 통합하여 생성하고, 화자별 발화 시간(Talk Time) 및 발화 구간 정보를 근거로 구분하는 것을 특징으로 하는 평가 장치.
  7. 삭제
  8. 삭제
  9. 제1항에 있어서,
    상기 판별부는
    상기 평가 점수를 기준으로 호의 상태를 평가하여 평가 결과에 따라 문제 호(problem call)로 판정하고 우선 청취를 위한 순위를 부여하는 문제 호 판별부,
    상기 평가 점수를 기준으로 화자의 불만 또는 만족 상태를 평가하여 평가 결과에 따라 상담원의 경우 우수 상담원으로 순위를 부여하고 고객의 경우 집중관리대상 고객으로 분류하는 화자 판별부
    를 포함하는 것을 특징으로 하는 평가 장치.
  10. 통화 호에서 발생한 음성 데이터로부터 특징 벡터를 추출하여 상기 특징 벡터로부터 상기 통화 호에 참여하는 화자의 감정을 분석하는 감정 분석 단계;
    상기 감정 분석 단계를 통해 분석된 화자별 감정 지수를 일정 시간 단위로 누적하여 통계적 기초 데이터를 생성하는 기초 데이터 산출 단계;
    상기 기초 데이터를 시간 관련 평가 지표, 감정 관련 평가 지표가 될 적어도 하나 이상의 파라미터로 변형 및 가공하여 평가 데이터로 산출하는 평가 데이터 산출 단계;
    상기 평가 데이터 산출 단계를 통해 산출한 적어도 하나 이상의 평가 데이터에 대하여 평가 기준일 이전까지의 일별 누적 데이터를 근거로 시간 흐름에 따라 변화하는 각 화자의 상태와 통화 호의 상황을 평가 점수로 정규화하는 평가 점수 산출 단계; 및
    상기 평가 점수를 기준으로 호 또는 화자의 상태를 평가하는 판별 단계를 포함하고,
    상기 평가 점수 산출 단계 이후에, 상기 통화 호에 참여하는 화자 및 호의 상태, 소속, 업무 유형에 따라 존재하는 특정 상황에 대하여 통화 패턴을 정의해 둔 가산 또는 감산 점수를 산출하여 상기 평가 점수에 반영하는 단계를 더 포함하며,
    상기 감정 분석 단계는,
    상기 통화 호에서 발생하는 음성 데이터의 특징 벡터로부터 하나의 통화 호에 참여하는 화자를 상담원 및 고객으로 구분하고 각 화자별 감정 분석을 통해 화자의 성별, 불만 또는 평상의 화자 감정 상태를 분류하며,
    상기 평가 데이터는 상기 시간 관련 지표로서 총 통화시간(Duration), 대화시간(TT, Talk Time), 대기시간(HT, Holding Time), 고객 발화시간(CTT, Customer Talk Time), 고객 발화비율(CTTR, Customer Talk Time Ratio), 상담원 발화시간(ATT, Agent Talk Time), 상담원 발화비율(ATTR, Agent Talk Time Ratio), 음성겹침시간(LRO, Listen & Response Overlay), 음성격차시간(LRG, Listen & Response Gap) 중 적어도 하나 이상을 포함하고, 상기 감정 관련 지표로서 고객 불만 지수(CAI, Customer Anger Index), 상담원 불만 지수(AAI, Agent Anger Index) 중 적어도 하나 이상을 포함하며,
    상기 평가 데이터 산출 단계에서는, 상기 평가 데이터에 대하여 평가 대상 및 항목에 따라 어떤 화자를 기준으로 산출할 것인지를 선택하고 선택된 화자를 기준으로 두 화자간 음성겹침시간 또는 음성격차시간에 따른 시간 관련 지표를 추출하는 것을 특징으로 하는 음성 감성 지수를 이용한 호 및 화자 평가 방법.
  11. 삭제
  12. 제10항에 있어서,
    상기 감정 분석 단계는
    상기 통화 호에서 발생한 음성 데이터를 호 연결과 동시에 교환기로부터 실시간 수신하거나, 통화 종료 이후 녹취 장치로부터 녹취된 데이터를 수신하여 일괄적으로 처리하는 것을 특징으로 하는 음성 감성 지수를 이용한 호 및 화자 평가 방법.
  13. 삭제
  14. 제10항에 있어서,
    상기 판별 단계는
    상기 평가 점수를 기준으로 호의 상태를 평가하여 평가 결과에 따라 문제 호(problem call)로 판정하고 우선 청취를 위한 순위를 부여하는 단계,
    상기 평가 점수를 기준으로 화자의 불만 또는 만족 상태를 평가하여 평가 결과에 따라 상담원의 경우 우수 상담원으로 순위를 부여하고 고객의 경우 집중관리대상 고객으로 분류하는 단계
    를 포함하는 것을 특징으로 하는 음성 감성 지수를 이용한 호 및 화자 평가 방법.
KR1020140091735A 2014-07-21 2014-07-21 음성 감성 지수를 이용한 호 및 화자의 평가 장치 및 방법 KR101600509B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140091735A KR101600509B1 (ko) 2014-07-21 2014-07-21 음성 감성 지수를 이용한 호 및 화자의 평가 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140091735A KR101600509B1 (ko) 2014-07-21 2014-07-21 음성 감성 지수를 이용한 호 및 화자의 평가 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20160010951A KR20160010951A (ko) 2016-01-29
KR101600509B1 true KR101600509B1 (ko) 2016-03-07

Family

ID=55310074

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140091735A KR101600509B1 (ko) 2014-07-21 2014-07-21 음성 감성 지수를 이용한 호 및 화자의 평가 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101600509B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102407055B1 (ko) 2021-12-30 2022-06-08 오정섭 음성인식 후 자연어 처리를 통한 대화 품질지수 측정장치 및 그 방법
US11954443B1 (en) 2021-06-03 2024-04-09 Wells Fargo Bank, N.A. Complaint prioritization using deep learning model
US12008579B1 (en) 2021-08-09 2024-06-11 Wells Fargo Bank, N.A. Fraud detection using emotion-based deep learning model

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102236424B1 (ko) * 2020-10-23 2021-04-07 주식회사 넥스프론 인공지능 기반의 콜 센터 상담사 지원 장치, 방법 및 프로그램

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007004001A (ja) * 2005-06-27 2007-01-11 Tokyo Electric Power Co Inc:The オペレータ応対能力診断装置、オペレータ応対能力診断プログラム、プログラム格納媒体
JP2014123813A (ja) * 2012-12-20 2014-07-03 Ntt Comware Corp オペレータ対顧客会話自動採点装置およびその動作方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050041485A (ko) * 2003-10-31 2005-05-04 주식회사 엠피씨 콜센터 시스템에서의 상담원 성과 평가 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007004001A (ja) * 2005-06-27 2007-01-11 Tokyo Electric Power Co Inc:The オペレータ応対能力診断装置、オペレータ応対能力診断プログラム、プログラム格納媒体
JP2014123813A (ja) * 2012-12-20 2014-07-03 Ntt Comware Corp オペレータ対顧客会話自動採点装置およびその動作方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11954443B1 (en) 2021-06-03 2024-04-09 Wells Fargo Bank, N.A. Complaint prioritization using deep learning model
US12008579B1 (en) 2021-08-09 2024-06-11 Wells Fargo Bank, N.A. Fraud detection using emotion-based deep learning model
KR102407055B1 (ko) 2021-12-30 2022-06-08 오정섭 음성인식 후 자연어 처리를 통한 대화 품질지수 측정장치 및 그 방법

Also Published As

Publication number Publication date
KR20160010951A (ko) 2016-01-29

Similar Documents

Publication Publication Date Title
US10276153B2 (en) Online chat communication analysis via mono-recording system and methods
US8219404B2 (en) Method and apparatus for recognizing a speaker in lawful interception systems
US10142461B2 (en) Multi-party conversation analyzer and logger
US9837078B2 (en) Methods and apparatus for identifying fraudulent callers
JP4662861B2 (ja) モニタリング装置、評価データ選別装置、応対者評価装置、応対者評価システムおよびプログラム
US20170366668A1 (en) System and method for analyzing and classifying calls without transcription
US20080189171A1 (en) Method and apparatus for call categorization
US20130246064A1 (en) System and method for real-time speaker segmentation of audio interactions
KR101795593B1 (ko) 전화상담원 보호 장치 및 그 방법
KR20200005753A (ko) 고객 응대용 감정 분석 장치
CN110705309B (zh) 服务质量评测方法及系统
US11463582B1 (en) Detecting scam callers using conversational agent and machine learning systems and methods
KR101543366B1 (ko) 고객 감정 지수를 이용한 호 또는 상담원 평가 방법 및 장치
KR101600509B1 (ko) 음성 감성 지수를 이용한 호 및 화자의 평가 장치 및 방법
US20120155663A1 (en) Fast speaker hunting in lawful interception systems
KR20190053982A (ko) 고객 응대용 감정 분석 장치
JP6365304B2 (ja) 会話分析装置及び会話分析方法
US10924611B2 (en) Voice recognition system and call evaluation setting method
KR20200143038A (ko) 감성 인덱스를 이용한 평가 장치 및 방법
JP2012195863A (ja) コールセンタシステム、コールセンタサーバ及びコールセンタプログラム、並びに、自動着信呼分配装置
WO2014069443A1 (ja) 不満通話判定装置及び不満通話判定方法
CN116980522B (zh) 一种基于智能质检客户画像的通知的系统和方法
WO2023162009A1 (ja) 感情情報活用装置、感情情報活用方法及びプログラム
WO2014069444A1 (ja) 不満会話判定装置及び不満会話判定方法
JP2021076845A (ja) 情報処理装置、情報処理方法及び情報処理プログラム

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
FPAY Annual fee payment

Payment date: 20200217

Year of fee payment: 5