KR20200027688A

KR20200027688A - 상담사와 상담하는 화자를 인증하는 서버 및 방법

Info

Publication number: KR20200027688A
Application number: KR1020180105801A
Authority: KR
Inventors: 서동철
Original assignee: 주식회사 케이티
Priority date: 2018-09-05
Filing date: 2018-09-05
Publication date: 2020-03-13
Also published as: KR102621881B1

Abstract

상담사와 상담하는 화자를 인증하는 화자 인증 서버는 화자의 실시간 상담 음성 정보로부터 화자의 실시간 실음성을 획득하는 실음성 획득부, 화자의 실시간 실음성을 스코어 산출 서버로 전송하는 실음성 전송부, 기설정된 인증 주기마다의 화자의 실시간 실음성 및 화자의 기등록된 음성 지문 간의 비교에 기초한 화자의 실시간 인증 결과에 대한 실시간 인증 스코어를 스코어 산출 서버로부터 수신하는 인증 결과 수신부 및 수신된 인증 스코어에 기초하여 화자에 대한 사칭 위험도를 판단하는 위험도 판단부를 포함하고, 인증 주기는 실시간 인증 스코어에 기초하여 가변될 수 있다.

Description

상담사와 상담하는 화자를 인증하는 서버 및 방법{SERVER AND METHOD FOR AUTHENTICATING SPEAKER DURING CALL TO COUNSELOR}

본 발명은 상담사와 상담하는 화자를 인증하는 서버 및 방법에 관한 것이다.

종래의 전화 상담 시스템에 따르면, 상담원은 고객으로부터 고객에 대한 정보(예컨대, 고객의 성명, 생년월일, 주소 정보, 납부 방법, 신용카드 번호 등)를 요청하여 고객을 식별 및 인증한다.

이러한 전화 상담 시스템은 고객이 제공하는 정보에 의해서만 고객을 식별 및 인증하기 때문에 고객에 대한 정보를 불법적으로 획득한 사칭자가 해당 고객에 대한 정보를 도용하여 서비스를 이용하는 문제점이 있었다.

상술한 문제점을 해결하기 위해 최근 고객의 음성을 이용하여 신분을 확인하는 화자 인증 시스템이 도입되었다.

이러한 고객의 음성을 이용하여 신분을 확인하는 화자 인증 시스템은 고객이 기설정된 특정 문장을 발화하면 해당 특정 문장에 대한 고객의 음성을 등록하고, 이후, 등록된 고객의 음성과 입력된 고객의 음성과 비교함으로써 고객을 인증한다.

그러나, 이러한 화자 인증 시스템은 상담 시작 시점에만 입력된 고객의 음성을 통해 고객을 인증하기 때문에 실시간 고객 인증이 어렵고, 고객 사칭을 원천적으로 차단하기 어려울 뿐만 아니라, 생활 소음 및 고객의 음성 변화가 있는 경우에는 고객의 음성을 통해 고객의 인증이 어렵다는 문제점이 있다.

한국공개특허공보 제2017-0105034호 (2017.09.18. 공개)

본 발명은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 기설정된 인증 주기마다 상담사와 상담하는 화자의 실시간 실음성 및 화자의 기등록된 음성 지문을 비교하여 화자의 실시간 인증 결과에 대한 실시간 인증 스코어를 산출하고자 한다.

또한, 본 발명은 인증 스코어에 기초하여 화자에 대한 사칭 위험도를 판단하고, 실시간 인증 스코어에 기초하여 화자의 실시간 실음성 및 화자의 기등록된 음성 지문을 비교하는 인증 주기를 변경하고자 한다. 다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 제 1 측면에 따른 상담사와 상담하는 화자를 인증하는 화자 인증 서버는 상기 화자의 실시간 상담 음성 정보로부터 상기 화자의 실시간 실음성을 획득하는 실음성 획득부; 상기 화자의 실시간 실음성을 스코어 산출 서버로 전송하는 실음성 전송부; 기설정된 인증 주기마다의 상기 화자의 실시간 실음성 및 상기 화자의 기등록된 음성 지문 간의 비교에 기초한 상기 화자의 실시간 인증 결과에 대한 실시간 인증 스코어를 상기 스코어 산출 서버로부터 수신하는 인증 결과 수신부; 및 상기 수신된 실시간 인증 스코어에 기초하여 상기 화자에 대한 사칭 위험도를 판단하는 위험도 판단부를 포함하고, 상기 인증 주기는 상기 실시간 인증 스코어에 기초하여 가변될 수 있다.

본 발명의 제 2 측면에 따른 상담사와 상담하는 화자를 인증하는 스코어 산출 서버는 화자 인증 서버로부터 상기 화자의 실시간 실음성을 수신하는 실음성 수신부; 상기 화자의 실시간 실음성 및 상기 화자의 기등록된 음성 지문을 비교하여 기설정된 인증 주기마다 상기 화자의 실시간 인증을 수행하는 실시간 인증 수행부; 상기 화자의 실시간 인증의 결과에 대한 실시간 인증 스코어를 산출하는 인증 스코어 산출부; 및 상기 실시간 인증 스코어를 상기 화자 인증 서버로 전송하는 인증 스코어 전송부를 포함하고, 상기 화자의 실시간 실음성은 상기 화자의 실시간 상담 음성 정보로부터 획득되고, 상기 인증 주기는 상기 실시간 인증 스코어에 기초하여 가변될 수 있다.

본 발명의 제 3 측면에 따른 화자 인증 서버에서 상담사와 상담하는 화자를 인증하는 방법은 상기 화자의 실시간 상담 음성 정보로부터 상기 화자의 실시간 실음성을 획득하는 단계; 상기 화자의 실시간 실음성을 스코어 산출 서버로 전송하는 단계; 기설정된 인증 주기마다의 상기 화자의 실시간 실음성 및 상기 화자의 기등록된 음성 지문 간의 비교에 기초한 상기 화자의 실시간 인증 결과에 대한 실시간 인증 스코어를 상기 스코어 산출 서버로부터 수신하는 단계; 및 상기 수신된 실시간 인증 스코어에 기초하여 상기 화자에 대한 사칭 위험도를 판단하는 단계를 포함하고, 상기 인증 주기는 상기 실시간 인증 스코어에 기초하여 가변될 수 있다.

상술한 과제 해결 수단은 단지 예시적인 것으로서, 본 발명을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 기재된 추가적인 실시예가 존재할 수 있다.

전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 본 발명은 기설정된 인증 주기마다 상담사와 상담하는 화자의 실시간 실음성 및 화자의 기등록된 음성 지문을 비교하여 화자의 실시간 인증 결과에 대한 실시간 인증 스코어를 산출할 수 있다.

또한, 본 발명은 인증 스코어에 기초하여 화자에 대한 사칭 위험도를 판단하고, 실시간 인증 스코어에 기초하여 화자의 실시간 실음성 및 화자의 기등록된 음성 지문을 비교하는 인증 주기를 변경할 수 있다.

이를 통해, 본 발명은 상담 시작 시점부터 상담 종료 시점까지 실시간 화자 인증이 가능하고, 이로 인해 상담 전체의 과정에서 화자의 본인확인을 보장하고 사칭을 원천적으로 차단할 수 있다. 즉, 본 발명은 상담 시작 시 화자의 본인확인이 성공하여도 상담 중 화자변경으로 발생할 수 있는 사칭을 원천적으로 차단할 수 있다.

또한, 본 발명은 상담사와 화자 간의 실시간 대화(즉, 실시간 상담 음성 정보)만으로 화자 인증이 수행되기 때문에 사칭자의 임의의 화자 사칭을 방지할 수 있다.

또한, 본 발명은 화자의 본인 확인을 위해 소요되는 상담사의 응대 시간을 줄일 수 있다. 또한, 본 발명은 기존에 상담사와의 상담 시에 화자의 개인정보를 제공함으로써 발생했던 거부감을 줄이고,　상담　업무의 효율성을 향상시킬 수 있다.

또한, 본 발명은 화자의 중요한 개인 정보가 유출되는 것을 방지할 수 있으며,　상담　통화 중 본인 여부 확인에 소요되는 시간을 단축시켜 고객 만족도를 향상시킬 수 있다.

도 1은 본 발명의 일 실시예에 따른, 화자 인증 시스템의 구성도이다.
도 2는 본 발명의 일 실시예에 따른, 도 1에 도시된 화자 인증 서버의 블록도이다.
도 3a 내지 3d는 본 발명의 일 실시예에 따른, 화자를 인증하는 방법을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른, 화자 인증 서버에서 화자를 인증하는 방법을 나타낸 흐름도이다.
도 5는 본 발명의 일 실시예에 따른, 도 1에 도시된 스코어 산출 서버의 블록도이다.
도 6은 본 발명의 일 실시예에 따른, 스코어 산출 서버에서 화자를 인증하는 방법을 나타낸 흐름도이다.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.

본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다.

본 명세서에 있어서 단말 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말 또는 디바이스에서 수행될 수도 있다.

이하, 첨부된 구성도 또는 처리 흐름도를 참고하여, 본 발명의 실시를 위한 구체적인 내용을 설명하도록 한다.

도 1은 본 발명의 일 실시예에 따른, 화자 인증 시스템의 구성도이다.

도 1을 참조하면, 화자 인증 시스템은 화자 인증 서버(100) 및 스코어 산출 서버(110)를 포함할 수 있다. 다만, 이러한 도 1의 화자 인증 시스템은 본 발명의 일 실시예에 불과하므로 도 1을 통해 본 발명이 한정 해석되는 것은 아니며, 본 발명의 다양한 실시예들에 따라 도 1과 다르게 구성될 수도 있다.

일반적으로, 도 1의 화자 인증 시스템의 각 구성요소들은 네트워크(미도시)를 통해 연결된다. 네트워크는 단말들 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 근거리 통신망(LAN: Local Area Network), 광역 통신망(WAN: Wide Area Network), 인터넷 (WWW: World Wide Web), 유무선 데이터 통신망, 전화망, 유무선 텔레비전 통신망 등을 포함한다. 무선 데이터 통신망의 일례에는 3G, 4G, 5G, 3GPP(3rd Generation Partnership Project), LTE(Long Term Evolution), WIMAX(World Interoperability for Microwave Access), 와이파이(Wi-Fi), 블루투스 통신, 적외선 통신, 초음파 통신, 가시광 통신(VLC: Visible Light Communication), 라이파이(LiFi) 등이 포함되나 이에 한정되지는 않는다.

화자 인증 서버(100)는 상담사와 상담하는 화자의 실시간 상담 음성 정보로부터 화자의 실시간 실음성을 획득하고, 획득된 화자의 실시간 실음성을 스코어 산출 서버(110)에게 전송할 수 있다. 여기서, 화자의 실시간 실음성은 화자의 실시간 상담 음성 정보에서 상담사의 실시간 실음성, 묵음 기간 및 생활 소음이 제거된 음성일 수 있다. 또한, 화자의 실시간 실음성은 화자의 실시간 상담 음성 정보에서 화자의 단순 대답 실음성이 더 제거된 음성일 수 있다.

스코어 산출 서버(110)는 화자 인증 서버(100)로부터 수신된 화자의 실시간 실음성 및 화자의 기등록된 음성 지문을 비교하여 기설정된 인증 주기마다 화자의 실시간 인증을 수행할 수 있다.

스코어 산출 서버(110)는 화자의 실시간 인증의 결과에 대한 실시간 인증 스코어를 산출하고, 산출된 실시간 인증 스코어를 화자 인증 서버(100)에게 전송할 수 있다.

화자 인증 서버(100)는 스코어 산출 서버(110)로부터 수신된 실시간 인증 스코어에 기초하여 화자에 대한 사칭 위험도를 판단할 수 있다.

이하에서는 도 1의 화자 인증 시스템의 각 구성요소의 동작에 대해 보다 구체적으로 설명한다.

도 2는 본 발명의 일 실시예에 따른, 도 1에 도시된 화자 인증 서버(100)의 블록도이다.

도 2를 참조하면, 화자 인증 서버(100)는 음성 지문 조회부(200), 음성 지문 등록부(210), 실음성 획득부(220), 저장부(230), 실음성 전송부(240), 인증 결과 수신부(250) 및 위험도 판단부(260)를 포함할 수 있다. 다만, 도 2에 도시된 화자 인증 서버(100)는 본 발명의 하나의 구현 예에 불과하며, 도 2에 도시된 구성요소들을 기초로 하여 여러 가지 변형이 가능하다.

음성 지문 조회부(200)는 화자의 정보(예컨대, 화자의 식별 정보로서, 화자의 아이디 등)에 기초하여 화자의 음성 지문을 스코어 산출 서버(110)를 통해 조회할 수 있다. 여기서, 스코어 산출 서버(110)는 화자의 정보에 기초하여 음성 지문 스토리지(미도시)에 화자의 음성 지문이 등록되어 있는지 여부를 확인할 수 있다.

음성 지문 등록부(210)는 상담사와 상담하는 화자의 음성 지문이 등록되어 있지 않은 경우, 음성 스토리지(미도시)에 기저장된 화자의 상담 음성 정보로부터 화자의 저장 실음성을 획득할 수 있다. 예를 들면, 음성 지문 등록부(210)는 음성 스토리지(미도시)로부터 기저장된 화자의 상담 음성 정보를 추출하고, 추출된 화자의 상담 음성 정보에서 상담사의 저장 실음성, 묵음 기간, 생활 소음 및 화자의 단순 대답 실음성을 제거함으로써 화자의 저장 실음성을 획득할 수 있다.

음성 지문 등록부(210)는 획득된 화자의 저장 실음성이 화자와 상담사와의 대화 분석을 통해 정상적인 상담으로 확인된 음성인 동시에 하나의 화자의 음성으로 확인되는 음성인지를 판단할 수 있다.

저장부(230)는 획득된 화자의 저장 실음성과 화자의 정보를 매핑하여 학습 스토리지(미도시)에 저장할 수 있다.

음성 지문 등록부(210)는 획득된 화자의 저장 실음성 및 화자의 정보(예컨대, 화자의 식별 정보로서, 화자의 아이디 등)를 포함하는 음성 지문 등록 요청을 스코어 산출 서버(110)에게 전송할 수 있다.

다른 실시예로, 음성 지문 등록부(210)는 상담사와 상담하는 화자의 음성 지문이 등록되어 있지 않고, 음성 스토리지(미도시)에도 화자의 상담 음성 정보가 저장되어 있지 않은 경우, 화자의 실시간 음성 정보로부터 획득된 화자의 실시간 실음성 및 화자의 정보를 포함하는 음성 지문 등록 요청을 스코어 산출 서버(110)에게 전송할 수 있다.

이 때, 음성 지문 등록 요청을 수신한 스코어 산출 서버(110)는 음성 지문 등록 요청에 포함된 화자의 저장 실음성 또는 실시간 실음성을 학습하고, 화자의 정보 및 학습된 화자의 저장 실음성 또는 실시간 실음성에 기초하여 화자의 음성 지문을 등록할 수 있다. 예를 들면, 스코어 산출 서버(110)는 화자의 저장 실음성 또는 실시간 실음성을 학습하여 화자의 음성특징벡터를 생성하고, 생성된 화자의 음성특징벡터를 화자의 음성 지문으로 등록할 수 있다.

실음성 획득부(220)는 상담 시, 화자의 실시간 상담 음성 정보로부터 화자의 실시간 실음성을 획득할 수 있다. 예를 들어, 실음성 획득부(220)는 화자의 실시간 상담 음성 정보에서 상담사의 실시간 실음성, 묵음 구간 및 생활 소음(예컨대, 음악, 자동차 엔진 소음, 백색 소음 등)을 제거함으로써 화자의 실시간 실음성을 획득할 수 있다. 또한, 실음성 획득부(220)는 화자의 실시간 상담 음성 정보에서 화자의 단순 대답 실음성(예컨대, '네, 아니요' 등)을 더 제거할 수 있다.

저장부(230)는 화자의 정보와 함께 화자의 실시간 실음성을 슬라이딩 윈도우 방식으로 학습 스토리지(미도시)에 저장할 수 있다. 여기서, 슬라이딩 윈도우 방식은 윈도우 사이즈(메모리 버퍼의 일정 영역)에 포함되는 데이터를 전송하고, 그 데이터의 수신이 확인되면, 윈도우 스텝을 옆으로 옮김(slide)으로써, 순차적으로 데이터를 전송하는 방식을 의미한다.

이때, 화자의 실시간 실음성은 화자의 상담의 시작 시점부터 종료 시점까지 학습 스토리지(미도시)에 저장될 수 있다. 예를 들면, 기설정된 윈도우 스텝(Window Step)(예컨대, n초 이내)만큼 쉬프트한 음성에서 화자 인증을 위한 최소의 실시간 실음성이 확보되면, 슬라이딩 윈도우 방식으로 학습 스토리지(미도시)에 저장될 수 있다.

실음성 전송부(240)는 획득된 화자의 실시간 실음성을 스코어 산출 서버(110)에게 전송할 수 있다. 예를 들면, 도3a를 참조하면, 실음성 전송부(240)는 상담 중에 실시간으로 획득된 화자의 실시간 실음성(30)을 실시간으로 스코어 산출 서버(110)에게 전송할 수 있다. 여기서, 스코어 산출 서버(110)는 예를 들면, 화자에 대한 인증이 1회 성공하기 전까지 기설정된 인증 주기(예컨대, 1초 주기)마다 화자의 실시간 실음성(30) 및 화자의 기등록된 음성 지문을 비교함으로써 화자를 인증할 수 있다.

인증 결과 수신부(250)는 기설정된 인증 주기마다의 화자의 실시간 실음성 및 화자의 기등록된 음성 지문 간의 비교에 기초한 화자의 실시간 인증 결과에 대한 실시간 인증 스코어를 스코어 산출 서버(110)로부터 수신할 수 있다.

여기서, 스코어 산출 서버(110)는 예를 들면, 화자에 대한 인증이 1회 성공한 이후에 화자의 실시간 실음성 및 화자의 기등록된 음성 지문을 비교를 통해 산출된 화자의 실시간 인증 결과에 대한 실시간 인증 스코어에 기초하여 인증 주기를 가변할 수 있다.

예를 들면, 도 3b를 참조하면, 실시간 인증 스코어가 기설정된 제 1 스코어(301)보다 큰 경우, 인증 주기는 제 1 인증 주기(303)(예컨대, 8초 주기)로 가변될 수 있다. 또한, 실시간 인증 스코어가 기설정된 제 1 스코어(305)보다 작은 경우, 인증 주기는 제 2 인증 주기(303)(예컨대, 4초 주기)로 가변될 수 있다. 여기서, 제 2 인증 주기(303)는 제 1 인증 주기(303)보다 짧은 주기일 수 있다.

위험도 판단부(260)는 스코어 산출 서버(110)로부터 수신된 실시간 인증 스코어에 기초하여 화자에 대한 사칭 위험도를 판단할 수 있다.

또한, 위험도 판단부(260)는 화자에 대한 사칭 위험도 판단 시 화자의 정보에 포함된 화자의 아이디를 이용하여 고객 센터 서버(미도시)에게 화자의 연령대 및 성별의 일치 여부에 대한 조회를 요청하고, 고객 센터 서버(미도시)로부터 수신된 화자의 연령대 및 성별의 일치 여부에 기초하여 화자에 대한 사칭 위험도를 판단할 수 있다.

또한, 위험도 판단부(260)는 화자의 음성 지문이 기저장된 위험군 음성지문에 해당하는지 여부, 화자의 연령대(또는 성별)가 화자와 일치하는지 여부 또는 상담 중 화자의 분리 가능성 여부(예컨대, 2명 이상의 화자가 교대로 상담하는 경우 등) 등에 기초하여 화자에 대한 사칭 위험도를 다르게 판단할 수 있다.

또한, 위험도 판단부(260)는 화자와의 상담 과정 중에 화자에 대한 인증 결과 및 사칭 위험도에 대한 정보를 상담사의 단말(미도시)에게 제공할 수 있다.

예를 들면, 도 3c를 참조하면, 위험도 판단부(260)는 실시간 인증 스코어가 제 1 사칭 위험도 범위에 속하는 경우, 기저장된 위험군 음성지문(범죄자의 음성 지문)과 화자의 음성 지문 간의 비교를 통해 화자에 대한 사칭 위험도를 판단할 수 있다. 만일, 화자의 음성 지문이 기저장된 위험군 음성 지문과 일치하는 경우, 위험도 판단부(260)는 화자에 대한 사칭 위험도를 제일 위험한 수준인 위험도 상(309)으로 판단하고, 판단된 사칭 위험도에 대한 정보 및 화자에 대한 대응 메뉴얼 정보를 상담사의 단말(미도시)에게 제공하는 동시에 사이버 경찰 서버(미도시)에게 사칭 알림을 전송할 수 있다. 이 때, 위험도 판단부(260)는 범죄자의 수사에 도움이 되도록 일정시간 가상 상담을 진행하여 범죄자의 위치 추적 및 음성을 확보할 수 있다.

다른 예로, 위험도 판단부(260)는 실시간 인증 스코어가 제 2 사칭 위험도 범위에 속하는 경우, 화자의 정보에 포함된 화자의 연령대가 화자와 일치하는지 여부 및 실시간 인증 스코어를 종합하여 화자에 대한 사칭 위험도를 판단할 수 있다.

위험도 판단부(260)는 화자의 연령대가 일치하지 않는 경우, 화자에 대한 사칭 위험도를 위험도 중(311)으로 판단하고, 판단된 사칭 위험도에 대한 정보와 함께 대응 매뉴얼 정보를 상담사의 단말(미도시)에게 제공할 수 있다.

또 다른 예로, 위험도 판단부(260)는 상담 중의 인증된 화자가 변경된 경우, 상담사의 단말(미도시)로 화자 변경 알림 메시지를 전송함과 동시에 변경된 다른 화자와 인증된 화자와의 관계 확인을 안내하는 대응 매뉴얼 정보를 상담사의 단말(미도시)에게 제공할 수 있다.

또 다른 예로, 위험도 판단부(260)는 화자의 인증 실패의 원인이 화자의 실시간 실음성에 대한 음성 품질에 의한 경우, 화자에 대한 사칭 위험도를 위험도 하(313)으로 판단하고, 판단된 화자에 대한 사칭 위험도에 대한 정보를 상담사의 단말(미도시)에게 제공할 수 있다.

또한, 위험도 판단부(260)는 실시간 인증 스코어에 기초하여 화자에 대한 인증의 성공 또는 실패 여부를 판단할 수 있다. 예를 들면, 기설정된 횟수(1 회 내지 2회) 이하로 화자의 인증이 실패(즉, 사칭)되면, 위험도 판단부(260)는 상담사로 하여금 화자 본인이 통화하도록 유도하는 대응 매뉴얼을 상담사의 단말(미도시)로 제공할 수 있다.

만일, 기설정된 횟수 이상으로 화자의 인증이 실패되면, 사칭 위험도를 높게 설정하고, 설정된 사칭 위험도에 대한 정보와 함께 상담 종료를 포함하는 대응 매뉴얼 정보를 상담사의 단말(미도시)로 제공할 수 있다. 이 때, 화자를 사칭한 화자의 실음성은 학습 스토리지(미도시)에 사칭 목소리로 구분되어 저장될 수 있다.

위험도 판단부(260)는 실시간 인증 스코어에 기초하여 판단된 화자에 대한 사칭 위험도에 대한 정보를 스코어 산출 서버(110)에게 전송할 수 있다. 이 때, 스코어 산출 서버(110)는 수신한 화자에 대한 사칭 위험도에 대한 정보에 기초하여 화자의 실시간 실음성 및 화자의 기등록된 음성 지문 간 비교를 위한 인증 주기를 변경할 수 있다.

예를 들어, 도 3d를 참조하면, 화자에 대한 사칭 위험도가 위험도 상(315)에 해당하는 경우, 인증 주기는 제 3 인증 주기(317)(예컨대, 1초 주기)로 변경할 수 있다. 화자에 대한 사칭 위험도가 위험도 중(319)에 해당하는 경우, 인증 주기는 제 4 인증 주기(312)(예컨대, 5초 주기)로 변경될 수 있다. 화자에 대한 사칭 위험도가 위험도 하(323)에 해당하는 경우, 인증 주기는 제 5 인증 주기(325)(예컨대, 10초 주기)로 변경될 수 있다.

한편, 당업자라면, 음성 지문 조회부(200), 음성 지문 등록부(210), 실음성 획득부(220), 저장부(230), 실음성 전송부(240), 인증 결과 수신부(250) 및 위험도 판단부(260) 각각이 분리되어 구현되거나, 이 중 하나 이상이 통합되어 구현될 수 있음을 충분히 이해할 것이다.

도 4는 본 발명의 일 실시예에 따른, 화자 인증 서버(100)에서 화자를 인증하는 방법을 나타낸 흐름도이다.

도 4에 도시된 실시예에 따른 화자 인증 방법은 도 1 내지 도 3d에 도시된 실시예에 따른 화자 인증 서버(100) 및 스코어 산출 서버(110)에서 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하 생략된 내용이라고 하더라도 도 1 내지 도 3d의 화자 인증 서버(100) 및 스코어 산출 서버(110)에 관하여 기술된 내용은 도 4에 도시된 실시예에 따른 화자 인증 방법에도 적용될 수 있다.

도 4를 참조하면, 단계 S401에서 화자 인증 서버(100)는 화자의 실시간 상담 음성 정보로부터 화자의 실시간 실음성을 획득할 수 있다.

단계 S403에서 화자 인증 서버(100)는 화자의 실시간 실음성을 스코어 산출 서버(110)에게 전송할 수 있다.

단계 S405에서 화자 인증 서버(100)는 기설정된 인증 주기마다의 화자의 실시간 실음성 및 화자의 기등록된 음성 지문 간의 비교에 기초한 화자의 실시간 인증 결과에 대한 실시간 인증 스코어를 스코어 산출 서버(110)로부터 수신할 수 있다. 여기서, 인증 주기는 실시간 인증 스코어에 기초하여 가변될 수 있다.

단계 S407에서 화자 인증 서버(100)는 수신된 인증 스코어에 기초하여 화자에 대한 사칭 위험도를 판단할 수 있다.

상술한 설명에서, 단계 S401 내지 S407은 본 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다.

도 5는 본 발명의 일 실시예에 따른, 도 1에 도시된 스코어 산출 서버(110)의 블록도이다.

도 5를 참조하면, 스코어 산출 서버(110)는 음성 지문 등록부(500), 실음성 수신부(510), 실시간 인증 수행부(520), 인증 스코어 산출부(530), 인증 스코어 전송부(540) 및 인증 주기 설정부(550)를 포함할 수 있다. 다만, 도 5에 도시된 스코어 산출 서버(110)는 본 발명의 하나의 구현 예에 불과하며, 도 5에 도시된 구성요소들을 기초로 하여 여러 가지 변형이 가능하다.

음성 지문 등록부(500)는 음성 스토리지(미도시)에 기저장된 화자의 상담 음성 정보로부터 획득된 화자의 저장 실음성 및 화자의 정보를 포함하는 음성 지문 등록 요청을 화자 인증 서버(100)로부터 수신할 수 있다. 여기서, 화자의 저장 실음성은 화자의 상담 음성 정보에서 상담사의 저장 실음성, 묵음 기간, 생활 소음 및 화자의 단순 대답 실음성이 제거된 음성일 수 있다.

음성 지문 등록부(500)는 수신된 음성 지문 등록 요청에 포함된 화자의 저장 실음성을 학습하고, 화자의 정보 및 학습된 화자의 저장 실음성에 기초하여 화자의 음성 지문을 등록할 수 있다. 예를 들면, 음성 지문 등록부(500)는 화자의 저장 실음성을 학습하여 화자의 음성특징벡터를 생성하고, 생성된 화자의 음성특징벡터를 화자의 음성 지문으로 등록할 수 있다.

실음성 수신부(510)는 화자 인증 서버(100)로부터 상담사와 상담 중인 화자의 실시간 실음성을 실시간으로 수신할 수 있다. 예를 들어, 실음성 수신부(510)는 상담사와 상담 중인 화자의 음성만이 포함된 화자의 실시간 실음성과 화자의 정보(예컨대, 화자의 식별 정보로서, 화자의 아이디 등)를 화자 인증 서버(100)로부터 수신할 수 있다. 여기서, 화자의 실시간 실음성은 화자의 실시간 상담 음성 정보로부터 획득될 수 있다. 예를 들어, 화자의 실시간 실음성은 화자의 실시간 상담 음성 정보에서 상담사의 실시간 실음성, 묵음 구간 및 생활 소음이 제거된 음성이고, 화자의 실시간 상담 음성 정보에서 화자의 단순 대답 실음성이 더 제거된 음성일 수 있다.

실시간 인증 수행부(520)는 음성 지문 스토리지(미도시)에 기등록된 복수의 음성 지문 중 화자의 정보에 매핑되는 음성 지문을 추출하고, 추출된 화자의 기등록된 음성 지문과 화자의 실시간 실음성을 비교하여 기설정된 인증 주기마다 화자의 실시간 인증을 수행할 수 있다. 예를 들면, 실시간 인증 수행부(520)는 화자에 대한 인증이 1회 성공하기 전까지 기설정된 인증 주기(예컨대, 1초 주기)마다 화자의 실시간 실음성 및 화자의 기등록된 음성 지문을 비교함으로써 화자를 실시간으로 인증할 수 있다.

인증 스코어 산출부(530)는 화자의 실시간 인증의 결과에 대한 실시간 인증 스코어를 산출할 수 있다. 예를 들면, 인증 스코어 산출부(530)는 기등록된 음성 지문과 화자의 실시간 실음성의 일치 여부에 대한 유사도에 기초하여 실시간 인증 스코어를 산출할 수 있다.

인증 스코어 전송부(540)는 산출된 실시간 인증 스코어를 화자 인증 서버(100)에게 전송할 수 있다.

인증 주기 설정부(550)는 실시간 인증 스코어에 기초하여 인증 주기를 설정할 수 있다. 예를 들면, 인증 주기 설정부(550)는 산출된 실시간 인증 스코어가 기설정된 제 1 스코어보다 큰 경우, 인증 주기를 제 1 인증 주기)(예컨대, 8초 주기)로 변경하고, 실시간 인증 스코어가 제 1 스코어보다 작은 경우, 인증 주기를 제 2 인증 주기)(예컨대, 4초 주기)로 변경할 수 있다. 여기서, 제 2 인증 주기는 제 1 인증 주기보다 짧은 주기일 수 있다.

예를 들면, 인증 주기 설정부(550)는 화자에 대한 인증이 1회 성공한 이후에 화자의 실시간 실음성 및 화자의 기등록된 음성 지문을 비교를 통해 산출된 화자의 실시간 인증 결과에 대한 실시간 인증 스코어에 기초하여 인증 주기를 변경할 수 있다.

인증 주기 설정부(550)는 실시간 인증 스코어에 기초하여 판단된 화자에 대한 사칭 위험도에 대한 정보를 화자 인증 서버(100)로부터 수신한 경우, 수신한 화자에 대한 사칭 위험도에 대한 정보에 기초하여 화자의 실시간 실음성 및 화자의 기등록된 음성 지문 간의 비교를 위한 인증 주기를 변경할 수 있다.

예를 들면, 화자에 대한 사칭 위험도가 위험도 상에 해당하는 경우, 인증 주기 설정부(550)는 인증 주기를 제 3 인증 주기(예컨대, 1초 주기)로 변경할 수 있다. 또는, 화자에 대한 사칭 위험도가 위험도 중에 해당하는 경우, 인증 주기 설정부(550)는 인증 주기를 제 4 인증 주기(예컨대, 5초 주기)로 변경될 수 있다. 또는, 화자에 대한 사칭 위험도가 위험도 하에 해당하는 경우, 인증 주기 설정부(550)는 인증 주기를 제 5 인증 주기(예컨대, 10초 주기)로 변경할 수 있다.

이후, 실시간 인증 수행부(520)는 변경된 인증 주기마다 화자의 기등록된 음성 지문과 화자의 실시간 실음성을 비교하여 화자의 실시간 인증을 수행할 수 있다.

이후, 음성 지문 등록부(500)는 상담사와 화자의 상담이 종료되면, 화자 인증에 성공한 실시간 실음성과 해당 화자의 기등록된 음성 지문에 기초하여 화자의 음성 지문을 업데이트할 수 있다. 예를 들면, 음성 지문 등록부(500)는 화자 인증에 성공한 실시간 실음성으로부터 화자의 음성특징벡터를 생성하고, 생성된 화자의 음성특징벡터를 화자의 음성 지문으로 재등록할 수 있다.

한편, 당업자라면, 음성 지문 등록부(500), 실음성 수신부(510), 실시간 인증 수행부(520), 인증 스코어 산출부(530), 인증 스코어 전송부(540) 및 인증 주기 설정부(550) 각각이 분리되어 구현되거나, 이 중 하나 이상이 통합되어 구현될 수 있음을 충분히 이해할 것이다.

도 6은 본 발명의 일 실시예에 따른, 스코어 산출 서버(110)에서 화자를 인증하는 방법을 나타낸 흐름도이다.

도 6에 도시된 실시예에 따른 화자 인증 방법은 도 1 내지 도 5에 도시된 실시예에 따른 화자 인증 서버(100) 및 스코어 산출 서버(110)에서 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하 생략된 내용이라고 하더라도 도 1 내지 도 5의 화자 인증 서버(100) 및 스코어 산출 서버(110)에 관하여 기술된 내용은 도 6에 도시된 실시예에 따른 화자 인증 방법에도 적용될 수 있다.

도 6을 참조하면, 단계 S601에서 스코어 산출 서버(110)는 화자 인증 서버(100)로부터 화자의 실시간 실음성을 수신할 수 있다. 여기서, 화자의 실시간 실음성은 화자의 실시간 상담 음성 정보로부터 획득될 수 있다.

단계 S603에서 스코어 산출 서버(110)는 화자의 실시간 실음성 및 화자의 기등록된 음성 지문을 비교하여 기설정된 인증 주기마다 화자의 실시간 인증을 수행할 수 있다. 여기서, 인증 주기는 실시간 인증 스코어에 기초하여 가변될 수 있다.

단계 S605에서 스코어 산출 서버(110)는 화자의 실시간 인증의 결과에 대한 실시간 인증 스코어를 산출할 수 있다.

단계 S607에서 스코어 산출 서버(110)는 실시간 인증 스코어를 화자 인증 서버(100)에게 전송할 수 있다.

상술한 설명에서, 단계 S601 내지 S607은 본 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다.

본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.

본 발명의 범위는 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

100: 화자 인증 서버
110: 스코어 산출 서버
200: 음성 지문 조회부
210: 음성 지문 등록부
220: 실음성 획득부
230: 저장부
240: 실음성 전송부
250: 인증 결과 수신부
260: 위험도 판단부
500: 음성 지문 등록부
510: 실음성 수신부
520: 실시간 인증 수행부
530: 인증 스코어 산출부
540: 인증 스코어 전송부
550: 인증 주기 설정부

Claims

상담사와 상담하는 화자를 인증하는 화자 인증 서버에 있어서,
상기 화자의 실시간 상담 음성 정보로부터 상기 화자의 실시간 실음성을 획득하는 실음성 획득부;
상기 화자의 실시간 실음성을 스코어 산출 서버로 전송하는 실음성 전송부;
기설정된 인증 주기마다의 상기 화자의 실시간 실음성 및 상기 화자의 기등록된 음성 지문 간의 비교에 기초한 상기 화자의 실시간 인증 결과에 대한 실시간 인증 스코어를 상기 스코어 산출 서버로부터 수신하는 인증 결과 수신부; 및
상기 수신된 실시간 인증 스코어에 기초하여 상기 화자에 대한 사칭 위험도를 판단하는 위험도 판단부를 포함하고,
상기 인증 주기는 상기 실시간 인증 스코어에 기초하여 가변되는 것인, 화자 인증 서버.
제 1 항에 있어서,
음성 스토리지에 기저장된 상기 화자의 상담 음성 정보로부터 상기 화자의 저장 실음성을 획득하고, 상기 획득된 화자의 저장 실음성 및 상기 화자의 정보를 포함하는 음성 지문 등록 요청을 상기 스코어 산출 서버로 전송하는 음성 지문 등록부를 더 포함하는 것인, 화자 인증 서버.
제 2 항에 있어서,
상기 화자의 정보에 기초하여 상기 화자의 음성 지문을 상기 스코어 산출 서버를 통해 조회하는 음성 지문 조회부를 더 포함하는 것인, 화자 인증 서버.
제 1 항에 있어서,
상기 획득된 화자의 실시간 실음성을 슬라이딩 윈도우 방식으로 학습 스토리지에 저장하는 저장부를 더 포함하는 것인, 화자 인증 서버.
제 1 항에 있어서,
상기 화자의 실시간 실음성은 상기 화자의 실시간 상담 음성 정보에서 상기 상담사의 실시간 실음성, 묵음 구간 및 생활 소음이 제거된 음성인 것인, 화자 인증 서버.
제 5 항에 있어서,
상기 화자의 실시간 실음성은 상기 화자의 실시간 상담 음성 정보에서 상기 화자의 단순 대답 실음성이 더 제거된 것인, 화자 인증 서버.
제 5 항에 있어서,
상기 스코어 산출 서버는 상기 수신된 화자의 저장 실음성을 학습하고, 상기 화자의 정보 및 상기 학습된 화자의 저장 실음성에 기초하여 상기 화자의 음성 지문을 등록하는 것인, 화자 인증 서버.
제 1 항에 있어서,
상기 실시간 인증 스코어가 기설정된 제 1 스코어보다 큰 경우, 상기 인증 주기는 제 1 인증 주기로 가변되고,
상기 실시간 인증 스코어가 상기 제 1 스코어보다 작은 경우, 상기 인증 주기는 제 2 인증 주기로 가변되고,
상기 제 2 인증 주기는 상기 제 1 인증 주기보다 짧은 것인, 화자 인증 서버.
제 1 항에 있어서,
상기 인증 주기는 상기 화자에 대한 사칭 위험도에 기초하여 가변되는 것인, 화자 인증 서버.
상담사와 상담하는 화자를 인증하는 스코어 산출 서버에 있어서,
화자 인증 서버로부터 상기 화자의 실시간 실음성을 수신하는 실음성 수신부;
상기 화자의 실시간 실음성 및 상기 화자의 기등록된 음성 지문을 비교하여 기설정된 인증 주기마다 상기 화자의 실시간 인증을 수행하는 실시간 인증 수행부;
상기 화자의 실시간 인증의 결과에 대한 실시간 인증 스코어를 산출하는 인증 스코어 산출부; 및
상기 실시간 인증 스코어를 상기 화자 인증 서버로 전송하는 인증 스코어 전송부
를 포함하고,
상기 화자의 실시간 실음성은 상기 화자의 실시간 상담 음성 정보로부터 획득되고,
상기 인증 주기는 상기 실시간 인증 스코어에 기초하여 가변되는 것인, 스코어 산출 서버.
제 10 항에 있어서,
음성 스토리지에 기저장된 상기 화자의 상담 음성 정보로부터 획득된 상기 화자의 저장 실음성 및 상기 화자의 정보를 포함하는 음성 지문 등록 요청을 상기 화자 인증 서버로부터 수신하는 음성 지문 등록부를 더 포함하는 것인, 스코어 산출 서버.
제 11 항에 있어서,
상기 음성 지문 등록부는 상기 화자의 저장 실음성을 학습하고, 상기 화자의 정보 및 상기 학습된 화자의 저장 실음성에 기초하여 상기 화자의 음성 지문을 등록하는 것인, 스코어 산출 서버.
제 11 항에 있어서,
상기 음성 지문 등록부는 상기 상담사와 상기 화자 간의 상담이 종료된 후, 상기 실시간 실음성 및 상기 화자의 기등록된 음성 지문에 기초하여 상기 화자의 음성 지문을 업데이트 하는 것인, 스코어 산출 서버.
제 11 항에 있어서,
상기 실시간 인증 스코어에 기초하여 상기 인증 주기를 설정하는 인증 주기 설정부를 더 포함하는 것인, 스코어 산출 서버.
제 14 항에 있어서,
상기 인증 주기 설정부는
상기 실시간 인증 스코어가 기설정된 제 1 스코어보다 큰 경우, 상기 인증 주기를 제 1 인증 주기로 변경하고,
상기 실시간 인증 스코어가 상기 제 1 스코어보다 작은 경우, 상기 인증 주기를 제 2 인증 주기로 변경하고,
상기 제 2 인증 주기는 상기 제 1 인증 주기보다 짧은 것인, 스코어 산출 서버.
화자 인증 서버에서 상담사와 상담하는 화자를 인증하는 방법에 있어서,
상기 화자의 실시간 상담 음성 정보로부터 상기 화자의 실시간 실음성을 획득하는 단계;
상기 화자의 실시간 실음성을 스코어 산출 서버로 전송하는 단계;
기설정된 인증 주기마다의 상기 화자의 실시간 실음성 및 상기 화자의 기등록된 음성 지문 간의 비교에 기초한 상기 화자의 실시간 인증 결과에 대한 실시간 인증 스코어를 상기 스코어 산출 서버로부터 수신하는 단계; 및
상기 수신된 실시간 인증 스코어에 기초하여 상기 화자에 대한 사칭 위험도를 판단하는 단계를 포함하고,
상기 인증 주기는 상기 실시간 인증 스코어에 기초하여 가변되는 것인, 화자 인증 방법.
제 16 항에 있어서,
음성 스토리지에 기저장된 상기 화자의 상담 음성 정보로부터 상기 화자의 저장 실음성을 획득하고, 상기 획득된 화자의 저장 실음성 및 상기 화자의 정보를 포함하는 음성 지문 등록 요청을 상기 스코어 산출 서버로 전송하는 단계를 더 포함하는 것인, 화자 인증 방법.
제 17 항에 있어서,
상기 화자의 정보에 기초하여 상기 화자의 음성 지문을 상기 스코어 산출 서버를 통해 조회하는 단계를 더 포함하는 것인, 화자 인증 방법.
제 16 항에 있어서,
상기 획득된 화자의 실시간 실음성을 슬라이딩 윈도우 방식으로 학습 스토리지에 저장하는 단계를 더 포함하는 것인, 화자 인증 방법.