KR20130059999A

KR20130059999A - 음성 기반 인증시스템 및 방법

Info

Publication number: KR20130059999A
Application number: KR1020110126266A
Authority: KR
Inventors: 박용선
Original assignee: 주식회사 지티티비
Priority date: 2011-11-29
Filing date: 2011-11-29
Publication date: 2013-06-07
Also published as: KR101424962B1

Abstract

이 발명은 인간(화자)의 음성 특징을 기반으로 정당 사용자의 본인 여부를 인증하는 시스템 및 방법에 관한 것이다.
이 발명에 따른 음성 기반 인증시스템은, 사용자 식별자 계정 정보와 이동통신단말기 정보와 사용자의 음성 패턴 정보를 연계하여 저장하는 저장부와, 상기 사용자 식별자 계정에 대한 음성 기반 인증을 요청한 컴퓨터장치 또는 상기 이동통신단말기에게 인증 문자열을 발급하는 인증문자열발급부와, 상기 이동통신단말기로부터 입력되는 화자의 음성신호로부터 음성 패턴을 추출하는 음성패턴추출부와, 상기 음성패턴추출부에서 추출된 상기 화자의 음성 패턴과 상기 사용자의 음성 패턴을 비교하는 음성패턴검증부와, 상기 화자의 음성신호를 음성인식하는 음성인식부와, 상기 음성인식부에서 인식된 문자열과 상기 인증문자열발급부에서 발급한 상기 인증 문자열을 비교하는 인증문자열검증부를 포함한다.

Description

음성 기반 인증시스템 및 방법 {AUTHENTICATION SYSTEM AND METHOD BASED BY VOICE}

이 발명은 인증시스템 및 방법에 관한 것으로서, 보다 상세하게는 인간(화자)의 음성 특징을 기반으로 정당 사용자의 본인 여부를 인증하는 시스템 및 방법에 관한 것이다.

오늘날 인터넷의 발달에 힘입어 다양한 종류의 온라인 서비스가 제공되고 있다. 대부분의 온라인 서비스 시스템들은 인터넷을 통해 해당 시스템에 접근하는 클라이언트 컴퓨터 장치가 해당 온라인 서비스를 이용할 자격을 가지는지 여부를 인증한다.

가장 보편적으로 사용되는 사용자 인증방법은 사용자 식별자(ID)와 비밀번호를 이용한 인증방법으로서, 사용자가 온라인 서비스 시스템에 회원으로 가입할 때 사용자 식별자와 비밀번호를 등록하고, 추후 해당 사용자가 해당 시스템에 접속하고자 할 때 기등록한 사용자 식별자와 비밀번호를 입력받아 그 사용자의 본인 여부를 검증한다.

그러나, 이러한 사용자 식별자와 비밀번호를 이용한 인증방법은 인증 정보(사용자 식별자와 비밀번호)가 도용되거나 해킹되기 쉬우며, 인증 정보가 노출될 경우 악의적인 접근 시도를 차단할 수 없는 문제점이 있다.

온라인 서비스 시스템에는 다양한 개인 정보들이 관리되고 있고, 최근 인터넷 뱅킹 서비스, 온라인 주식 거래 서비스 등을 통해 실질적인 금전 거래가 온라인에서 이루어지고 있으며, 온라인 서비스 시스템을 통한 무형의 자산(예컨대, 온라인 게임에서의 아이템, 사이버 머니 등)이 증가함에 따라, 온라인 서비스 시스템을 이용하는 사용자에 대해 보다 강력한 본인 인증방법들이 요구되고 있다.

이러한 요구에 따라 사용자의 이동통신단말기를 이용한 일회용 인증키 기반 인증방법이 사용되고 있다. 이 일회용 인증키 기반 인증방식은 통상 다음과 같은 절차로 진행된다. 먼저, 온라인 서비스 시스템은 사용자 식별자와 비밀번호를 확인하고, 인증서버에게 사용자 인증을 요청한다. 인증서버는 기등록된 사용자의 이동통신단말기에 일회용 인증키가 포함된 문자메시지(SMS)를 발송한다. 온라인 서비스 시스템은 사용자의 컴퓨터장치를 통해 그 일회용 인증키를 입력받아 인증서버에게 전달한다. 그러면 인증서버는 사용자의 이동통신단말기에 발송한 일회용 인증키와 온라인 서비스 시스템을 통해 입력받은 일회용 인증키가 동일한 지를 검증한다.

이러한 일회용 인증키 기반 인증방식은 본인 인증 보안 강도를 어느 정도 강화시킬 수는 있으나, 다양한 해킹에 의한 취약점이 여전히 존재하는 문제점이 있다. 또한, 하나의 사용자 식별자와 비밀번호를 여럿의 지인이 공유하여 다중 로그인을 함으로써, 온라인 서비스 시스템의 리소스가 부당하게 점유되는 문제점이 있다.

이 발명은 상술한 종래기술의 문제점을 해결하기 위하여 안출된 것으로서, 인간의 음성 특징을 기반으로 사용자의 본인 여부를 인증하는 시스템 및 방법에 관한 것이다.

상술한 목적을 달성하기 위한 이 발명에 따른 음성 기반 인증시스템은, 사용자 식별자 계정 정보와 이동통신단말기 정보와 사용자의 음성 패턴 정보를 연계하여 저장하는 저장부와, 상기 사용자 식별자 계정에 대한 음성 기반 인증을 요청한 컴퓨터장치 또는 상기 이동통신단말기에게 인증 문자열을 발급하는 인증문자열발급부와, 상기 이동통신단말기로부터 입력되는 화자의 음성신호로부터 음성 패턴을 추출하는 음성패턴추출부와, 상기 음성패턴추출부에서 추출된 상기 화자의 음성 패턴과 상기 사용자의 음성 패턴을 비교하는 음성패턴검증부와, 상기 화자의 음성신호를 음성인식하는 음성인식부와, 상기 음성인식부에서 인식된 문자열과 상기 인증문자열발급부에서 발급한 상기 인증 문자열을 비교하는 인증문자열검증부를 포함한 것을 특징으로 한다.

또한, 이 발명에 따른 음성 기반 인증방법은, 인증서버가 사용자 식별자 대응 사용자의 음성 패턴을 등록하는 제1단계와, 상기 사용자 식별자에 대해 음성 기반 인증 요청이 접수되면, 상기 인증서버가 인증문자열을 생성하여 발급하는 제2단계와, 상기 사용자 식별자 대응 이동통신단말기를 통해 화자의 음성신호가 입력되면, 상기 인증서버가 상기 화자의 음성신호로부터 화자의 음성 패턴을 추출하는 제3단계와, 상기 인증서버가 상기 화자의 음성 패턴과 상기 사용자의 음성 패턴을 비교하여 상기 화자의 음성 패턴을 검증하는 제4단계와, 상기 화자의 음성신호를 음성 인식하여 화자가 발성한 문자열을 추출하는 제5단계와, 상기 화자가 발성한 문자열과 제2단계에서 발급된 인증문자열을 비교하여 상기 화자가 발성한 문자열을 검증하는 제6단계를 포함한 것을 특징으로 한다.

이상과 같이 이 발명에 따르면 기등록된 사용자의 이동통신단말기를 통해 기등록된 음성 특징의 음성신호가 입력되는지를 검증함으로써, 정당 사용자의 본인 여부를 보다 강력하게 인증할 수 있는 효과가 있다. 아울러, 랜덤한 인증 문자열을 발급하고, 현재 화자로부터 입력된 음성신호를 음성 인식한 결과의 문자열과 상기 발급된 인증 문자열을 비교함으로써, 상기 화자가 정당 사용자임을 보다 강력하게 인증할 수 있는 효과가 있다.

도 1은 이 발명에 따른 음성 기반 인증 시스템을 도시한 구성 블록도이다.
도 2는 이 발명에 따른 음성패턴추출부(153)의 구성 블록도이다.
도 3은 이 발명에 따른 음성 기반 인증방법을 도시한 동작 흐름도이다.
도 4는 이 발명에 따른 사용자 식별자 대응 사용자의 음성패턴을 등록하는 과정(S301)을 도시한 동작 흐름도이다.
도 5는 이 발명에 따른 화자의 음성패턴을 추출하는 과정(S305)을 도시한 동작 흐름도이다.

이하, 첨부된 도면을 참조하여 이 발명의 한 실시예에 따른 음성 기반 인증시스템 및 방법을 보다 상세하게 설명하면 다음과 같다.

이 발명의 명세서에서 '사용자'라 함은 임의의 사용자 식별자의 '정당 사용자'임을 의미하고, '화자'라 함은 임의의 사용자 식별자의 정당 사용자 여부가 인증되지 않은 자임을 의미한다. 이 발명의 명세서에서는 이 발명에 따른 음성 기반 인증을 위한 음성 패턴 등록시에는 정당 사용자인 '사용자'가 정상적으로 등록하는 것으로 가정한다. 반면, 음성 패턴 등록 후, 음성 기반 인증시 사용자 식별자로 로그인을 하더라도 음성 패턴 검증전에는 '화자'로 명명한다. '화자'는 음성 패턴 검증을 통해 '사용자'로 인증될 수 있다.

도 1은 이 발명에 따른 음성 기반 인증 시스템을 도시한 구성 블록도이다.

사용자는 이동통신단말기(110) 또는 컴퓨터장치(120)를 이용하여 통신망(130)에 접속하고, 온라인 서비스 시스템(140)에서 온라인 서비스를 제공받기 위해 이 발명에 따른 인증 절차를 수행한다. 컴퓨터장치(120)는 데스크탑, 노트북과 같은 다양한 컴퓨터 환경을 포함하며, 이동통신단말기(110)는 일반 피처폰(feature phone) 또는 운영체제(OS)를 탑재하고 다양한 어플리케이션(응용프로그램)의 설치 및 구동이 가능한 스마트폰을 포함한다.

온라인 서비스 시스템(140)은 통신망(130)을 통해 다수의 사용자들에게 온라인 서비스를 제공하는 웹 상의 시스템으로서, 사용자가 사용하는 이동통신단말기(110) 또는 컴퓨터장치(120)를 통해 사용자 식별자 및 비밀번호를 입력받는 로그인 절차를 수행한다.

이 발명에 따른 인증 서버(150)는 사용자의 등록 요청시 이동통신단말기(110)를 통해 등록용 문자열에 상응하는 사용자의 음성 신호를 입력받고 그 음성 신호로부터 음성 패턴을 추출하여 등록한다. 다음, 사용자의 인증 요청시 인증용 문자열을 발급하고 이동통신단말기를 통해 음성 신호를 입력받아 음성 패턴을 추출하여 등록된 음성 패턴과 동일한지를 검증하고, 아울러 입력된 음성 신호를 음성 인식하여 추출한 문자열과 상기 발급한 인증용 문자열을 비교하여 동일한지를 검증한다.

즉, 이 발명에 따른 인증 서버(150)는 현재 인증 요청하는 화자에 대해 2가지를 인증하는데, 하나는 현재 화자의 음성 패턴이 기등록된 사용자의 음성 패턴과 동일한지를 인증하고 것이고, 다른 하나는 현재 화자의 음성 신호에 상응하는 문자열이 해당 사용자에게 발급한 인증용 문자열과 동일한지를 인증하는 것이다. 전자의 인증을 통해 현재 화자의 음성이 사용자 본인의 음성인지를 검증하여 타인에 의한 악의적인 도용을 방지할 수 있는 잇점이 있다. 그렇다고 매번 동일한 문자열에 대한 사용자의 음성 패턴을 검증한다면(입력되는 음성 신호에 대한 문자열에 대한 검증을 하지 않는다면), 사용자의 해당 문자열에 대응하는 음성 신호를 미리 녹음하였다가 그 녹음된 음성 신호를 인증 서버로 입력하여 인증받을 우려가 있다. 후자는 랜덤한 인증용 문자열을 발급하여 화자가 그 인증용 문자열을 발성하는지에 대한 검증을 하기 때문에 사용자 식별자 계정에 대한 악의적인 도용을 방지함과 아울러 하나의 사용자 식별자 계정의 공유도 방지할 수 있는 잇점이 있다.

인증 서버의 구성 및 동작을 보다 상세하게 설명한다.

인증 서버(150)는 사용자 식별자 계정 정보와 이동통신단말기 정보와 사용자의 음성 패턴 정보를 연계하여 저장하는 저장부(151)와, 상기 사용자 식별자 계정에 대한 음성 기반 인증을 요청한 화자의 컴퓨터장치 또는 상기 이동통신단말기에게 인증 문자열을 발급하고 저장부(151)에 저장하는 인증문자열발급부(152)와, 상기 이동통신단말기(110)로부터 입력되는 화자의 음성신호로부터 화자의 음성 패턴을 추출하는 음성패턴추출부(153)와, 상기 음성패턴추출부(153)에서 추출된 화자의 음성 패턴과 상기 저장부(151)에 저장된 사용자의 음성 패턴을 비교하는 음성패턴검증부(154)와, 상기 화자의 음성신호를 음성인식하는 음성인식부(155)와, 상기 음성인식부(155)에서 인식된 문자열과 상기 인증문자열발급부(152)에서 발급한 인증 문자열을 비교하는 인증문자열검증부(156)를 포함한다.

음성패턴추출부(153)는 임의의 사용자 식별자 계정에 대응하는 음성 패턴 등록시, 사용자의 음성신호로부터 추출된 음성 패턴을 학습하여 저장부(151)에 저장한다. 또한, 임의의 사용자 식별자 계정에 대응하는 음성 패턴 검증시, 화자의 음성신호로부터 추출된 음성 패턴과 저장부(151)에 저장된 사용자의 음성 패턴을 비교하여 매칭율이 임계값 이상일 경우 사용자의 음성 패턴을 학습하고 저장부(151)에 학습된 음성 패턴으로 업데이트한다. 음성패턴검증부(154)는 음성패턴추출부(153)에서 추출된 화자의 음성 패턴과 저장부(151)에 저장된 사용자의 음성 패턴을 비교하여 화자의 사용자 여부를 인증한다.

음성인식부(144)는 통상적인 음성인식기술을 적용하여 사용자의 음성신호로부터 사용자가 발성한 문자열을 추출한다. 인증문자열검증부(156)는 음성인식부(144)에서 추출한 문자열과 저장부(151)에 저장된 인증 문자열을 비교하여 사용자가 발성한 문자열을 검증한다.

음성패턴검증부(154)의 화자 인식과 인증문자열검증부(156)의 인증문자열 검증이 정상적으로 완료되면, 상기 사용자 식별자 계정에 대한 음성 기반 인증을 요청한 화자의 컴퓨터장치 또는 상기 이동통신단말기가 온라인 서비스를 이용할 수 있도록 한다. 음성패턴검증부(154)의 화자 인식과 인증문자열검증부(156)의 인증문자열 검증은 순차적으로 이루어질 수도 있고, 동시에 이루어질 수도 있다.

인증문자열발급부(152)는 컴퓨터장치(120) 또는 이동통신단말기(110)에게 인증문자열을 발급하지만, 이동통신단말기(110)를 통해 해당 인증문자열에 대응하는 음성신호를 전송받는다. 이동통신단말기(110)에 인증문자열을 발송하거나 혹은 이동통신단말기(110)로부터 인증문자열 대응 음성신호를 전송받으려면 이동통신단말기(110)가 활성화 상태가 되어야 하는데, 이동통신단말기(110)가 일반 피쳐폰이거나 푸시서비스를 위한 장치토큰이 등록되지 않은 스마트폰인 경우 인증문자열발급부(152)는 인증서버(150)와의 접속을 위한 에스엠에스(SMS)를 발송하여 인증서버(150)와 이동통신단말기(110) 사이의 통신이 이루어지도록 한다.

한편, 이동통신단말기(110)가 푸시서비스를 위한 장치토큰이 등록된 스마트폰인 경우, 인증문자열발급부(152)는 푸시서버(160)를 이용하여 해당 이동통신단말기(110)를 활성화시키고 이동통신단말기(110)로부터 화자의 음성신호를 전송받는다.

푸시(PUSH)서버는 이동통신단말기(110)의 제조업체에서 제공하는 서비스로서, 이동통신단말기(110)는 임의의 어플리케이션에 대해 푸시서비스를 제공받고자 할 경우, 먼저 푸시서버(160)로부터 해당 어플리케이션에 대응하는 장치토큰을 발급받는다. 그러면, 푸시서버(160)는 이동통신단말기(110)에 푸시메시지를 전송하여 이동통신단말기를 깨우고(wakeup), 해당 토큰장치에 대응되는 어플리케이션(예컨대, 이동통신단말기의 보안인증모듈)을 활성화시키는 역할을 수행한다.

즉, 인증서버(150)가 이동통신단말기(110)로부터 인증문자열 대응 음성신호를 전송받고자 할 때, 인증문자열발급부(152)는 이동통신단말기(110)의 장치토큰을 푸시(PUSH)서버(160)에게 전달하고, 그러면 푸시(PUSH)서버(160)는 이동통신단말기(110)에게 푸시메시지를 출력하여 이동통신단말기(110)가 깨어나서 인증서버(150)와 통신하도록 한다. 푸시서버의 예로서, iOS계열은 애플에서 제공하는 APNs(Apple Push Notification Service)를 푸시서버로 사용하고, 안드로이드 계열은 구글에서 제공하는 C2DM(Cloud To Device Messaging)를 푸시서버로 사용한다.

도 2는 이 발명에 따른 음성패턴추출부(153)의 구성 블록도이다.

음성패턴추출부(153)는 입력되는 음성신호를 샘플링하는 샘플링부(21)와, 상기 샘플링된 음성신호로부터 화자 음성의 특징 파라미터를 추출하는 MFCC(Mel Frequency Cepstral Coefficients)(22)와, 상기 음성의 특징 파라미터를 코드북(23)의 코드 벡터 공간으로 사상하여 음성의 특징 벡터를 추출하는 벡터양자화부(24)와, 상기 특징 벡터의 패턴을 시간축 상에서의 비선형 신축을 고려하여 보정하여 화자의 음성 패턴을 추출하고 상기 추출된 화자의 음성 패턴을 상기 저장부(151)에 저장하는 DTW(Dynamic Time Warping) 프로세서(25)를 포함한다.

음성패턴추출부(153)는 상기 화자의 음성 패턴과 상기 저장부(151)에 기저장된 사용자의 음성 패턴의 매칭율과 임계값을 비교하는 매칭프로세서(26)와, 상기 매칭율이 임계값 이상이면 화자의 음성 패턴을 반영하여 상기 사용자의 음성 패턴을 훈련하는 음성패턴훈련부(27)와, 상기 훈련된 사용자의 음성 패턴을 최적화하여 상기 저장부(151)에 저장하는 최적화부(28)를 포함한다.

사용자의 음성 패턴 등록시, 사용자에게는 적어도 둘 이상(바람직하게는 5개)의 샘플 문자열에 발성이 요구되는데, 사용자는 기등록된 이동통신단말기를 이용하여 이 샘플 문자열을 발성하고, 이 발명에 따른 음성패턴추출부(153)에 사용자의 음성신호가 입력된다. 첫 번째 샘플 문자열에 대응하는 음성신호는 상기 샘플링부(21)와 MFCC(22)와 벡터양자화부(24)와 DTW 프로세서(25)를 통해 음성 패턴이 추출되어 저장부(151)에 저장된다. 두 번째 샘플 문자열에 대응하는 음성신호로부터 추출된 음성 패턴은 매칭 프로세서(26)에서 저장부(151)에 저장된 음성 패턴과 비교되는데, 그 매칭율이 기설정된 기준치보다 낮으면 상기 두 번째 샘플 문자열에 대응하는 음성신호로부터 음성 패턴을 다시 추출하던지 아니면 사용자에게 재발송할 것을 요청한다. 하지만, 그 매칭율이 기설정된 기준치보다 낮지 않으면 음성 패턴을 훈련하여 업데이트한다.

도 3은 이 발명에 따른 음성 기반 인증방법을 도시한 동작 흐름도이다.

인증서버는 사용자 식별자 대응 사용자의 음성 패턴을 등록한다(S301). 사용자의 음성 패턴을 등록하는 상세한 과정은 후술하기로 한다.

이 후, 사용자 식별자에 대해 음성 기반 인증 요청이 접수되면(S302), 인증 서버는 인증문자열을 생성하여 컴퓨터장치 또는 이동통신단말기에게 발급하면서 해당 인증문자열에 대한 발성을 요청한다(S303). 이때, 인증서버는 푸시서버를 통해 이동통신단말기에게 푸시메시지를 전송할 수도 있다.

이동통신단말기를 통해 화자의 음성신호가 입력되면(S304), 인증서버는 화자의 음성신호로부터 화자의 음성 패턴을 추출한다(S305). 통상적으로 단계 S301의 사용자의 음성 패턴과 단계 S305의 화자의 음성 패턴은 동일한 방법으로 추출되는 것이 바람직하다.

다음, 화자의 음성 패턴과 사용자의 음성 패턴을 비교하여(S306), 그 매칭율이 임계값보다 크면(S307) 사용자의 음성 패턴을 학습하여 업데이트하고(S308), 화자의 음성신호를 음성 인식하여 화자가 발성한 문자열을 추출한다(S309). 발성된 문자열과 단계 S303에서 발급한 인증문자열을 비교하여(S310), 두 문자열이 일치하면(S311) 인증을 완료하며 컴퓨터장치 또는 이동통신단말기에 대한 온라인 서비스 이용이 허용되도록 한다(S312). 그러나, 두 문자열이 일치하지 않으면(S311), 상기 컴퓨터장치와 이동통신단말기에 대한 온라인 서비스 이용이 차단되도록 한다(S313). 또한, 단계 S307에서 화자의 음성 패턴과 기저장된 사용자의 음성 패턴의 매칭율이 임계값보다 크지 않으면, 상기 컴퓨터장치와 이동통신단말기에 대한 온라인 서비스 이용이 차단되도록 한다.

도 4는 이 발명에 따른 사용자 식별자 대응 사용자의 음성패턴을 등록하는 과정(S301)을 도시한 동작 흐름도이다.

인증 서버는 컴퓨터장치 또는 이동통신단말기에게 샘플 문자열을 출력하고 사용자로 하여금 샘플 문자열에 대한 발성을 요청한다(S401).

사용자의 음성신호가 입력되면(S402), 입력되는 사용자의 음성신호를 샘플링하고(S403), 샘플링된 음성신호로부터 사용자 음성의 특징 파라미터를 추출하며(S404), 음성의 특징 파라미터를 코드북의 코드 벡터 공간으로 사상하여 음성의 특징 벡터를 추출한다(S405). 다음, 추출된 특징 벡터의 패턴을 시간축 상에서의 비선형 신축을 고려하여 보정하여 사용자의 음성 패턴을 생성한다(S406).

기추출된 사용자의 음성패턴이 존재하지 않으면(S407), 즉 첫 번째 샘플 문자열을 기반으로 추출된 사용자의 음성패턴이면, 추출된 사용자의 음성 패턴을 저장하고(S408), 단계 S409로 진행한다. 단계 S409에서 음성 패턴 추출 대상 샘플 문자열이 남아 있으면 단계 S402로 진행하여 사용자의 음성 신호 입력을 대기한다.

사용자의 음성신호가 입력되면 단계 S403 내지 단계 S406을 수행하여 음성 패턴을 추출한다.

단계 S407에서 기추출된 사용자의 음성패턴이 존재하면, 새롭게 추출된 음성 패턴과 기추출된 음성 패턴을 비교하여(S410), 그 매칭율이 기설정된 기준치보다 크면(S411), 사용자의 음성 패턴을 훈련하고 훈련된 사용자의 음성 패턴을 최적화하여 업데이트한다(S412). 한편, 매칭율이 기설정된 기준치보다 크지 않으면(S411), 단계 S403부터 다시 수행하여 사용자의 음성 패턴을 다시 추출한다. 도면에 도시되어 있지는 않으나 다시 추출한 횟수가 기설정된 횟수 이상이면 음성 패턴 추출 오류로 인식하여 사용자에게 해당 샘플 문자열에 대한 발성을 다시 요청할 수도 있다.

단계 S409에서 음성 패턴을 추출할 샘플 문자열이 남아 있으면 단계 S402로 진행하여 다음 샘플 문자열에 대한 음성 패턴을 추출하고, 단계 S409에서 모든 샘플문자열에 대한 음성 패턴 추출이 완료되면 사용자의 음성 패턴 등록 절차를 완료한다(S413).

도 5는 이 발명에 따른 화자의 음성패턴을 추출하는 과정(S305)을 도시한 동작 흐름도이다.

인증 서버는 입력되는 화자의 음성신호를 샘플링하고(S51), 샘플링된 음성신호로부터 화자 음성의 특징 파라미터를 추출하며(S52), 음성의 특징 파라미터를 코드북의 코드 벡터 공간으로 사상하여 화자 음성의 특징 벡터를 추출한다(S53). 다음, 추출된 특징 벡터의 패턴을 시간축 상에서의 비선형 신축을 고려하여 보정함으로써(S54), 사용자의 음성 패턴을 생성한다.

110 : 이동통신단말기 120 : 컴퓨터장치
130 : 통신망 140 : 온라인 서비스 시스템
150 : 인증서버 151 : 저장부
152 : 인증문자열발급부 153 : 음성패턴추출부
154 : 음성패턴검증부 155 : 음성인식부
156 : 인증문자열검증부

Claims

사용자 식별자 계정 정보와 이동통신단말기 정보와 사용자의 음성 패턴 정보를 연계하여 저장하는 저장부와,
상기 사용자 식별자 계정에 대한 음성 기반 인증을 요청한 컴퓨터장치 또는 상기 이동통신단말기에게 인증 문자열을 발급하는 인증문자열발급부와,
상기 이동통신단말기로부터 입력되는 화자의 음성신호로부터 음성 패턴을 추출하는 음성패턴추출부와,
상기 음성패턴추출부에서 추출된 상기 화자의 음성 패턴과 상기 사용자의 음성 패턴을 비교하는 음성패턴검증부와,
상기 화자의 음성신호를 음성인식하는 음성인식부와,
상기 음성인식부에서 인식된 문자열과 상기 인증문자열발급부에서 발급한 상기 인증 문자열을 비교하는 인증문자열검증부를 포함한 것을 특징으로 하는 음성 기반 인증시스템.
제 1 항에 있어서, 상기 인증문자열발급부는 푸시서버를 이용하여 상기 이동통신단말기를 활성화시키는 것을 특징으로 하는 음성 기반 인증시스템.
제 1 항에 있어서, 상기 음성패턴추출부는 상기 화자의 음성신호를 샘플링하는 샘플링부와,
상기 샘플링된 음성신호로부터 화자 음성의 특징 파라미터를 추출하는 MFCC(Mel Frequency Cepstral Coefficients)와,
상기 음성의 특징 파라미터를 코드북의 코드 벡터 공간으로 사상하여 음성의 특징 벡터를 추출하는 벡터양자화부와,
상기 특징 벡터의 패턴을 시간축 상에서의 비선형 신축을 고려하여 보정하여 화자의 음성 패턴을 추출하는 DTW(Dynamic Time Warping) 프로세서를 포함한 것을 특징으로 하는 음성 기반 인증시스템.
제 3 항에 있어서, 상기 음성패턴추출부는 상기 화자의 음성 패턴과 상기 사용자의 음성 패턴의 매칭율과 임계값을 비교하는 매칭프로세서와, 상기 매칭율이 임계값 이상이면 상기 화자의 음성 패턴을 반영하여 상기 사용자의 음성 패턴을 훈련하는 음성패턴훈련부를 포함한 것을 특징으로 하는 음성 기반 인증시스템.
인증서버가 사용자 식별자 대응 사용자의 음성 패턴을 등록하는 제1단계와,
상기 사용자 식별자에 대해 음성 기반 인증 요청이 접수되면, 상기 인증서버가 인증문자열을 생성하여 발급하는 제2단계와,
상기 사용자 식별자 대응 이동통신단말기를 통해 화자의 음성신호가 입력되면, 상기 인증서버가 상기 화자의 음성신호로부터 화자의 음성 패턴을 추출하는 제3단계와,
상기 인증서버가 상기 화자의 음성 패턴과 상기 사용자의 음성 패턴을 비교하여 상기 화자의 음성 패턴을 검증하는 제4단계와,
상기 화자의 음성신호를 음성 인식하여 화자가 발성한 문자열을 추출하는 제5단계와,
상기 화자가 발성한 문자열과 제2단계에서 발급된 인증문자열을 비교하여 상기 화자가 발성한 문자열을 검증하는 제6단계를 포함한 것을 특징으로 하는 음성 기반 인증방법.
제 5 항에 있어서, 상기 제2단계는 상기 인증서버가 푸시서버를 통해 상기 이동통신단말기에게 푸시메시지를 전송하는 것을 특징으로 하는 음성 기반 인증방법.
제 5 항에 있어서, 상기 제1단계는,
상기 인증서버가 샘플 문자열을 출력하는 제11소단계와,
사용자의 음성신호가 입력되면, 상기 인증서버가 상기 사용자의 음성신호를 샘플링하는 제12소단계와,
상기 샘플링된 음성신호로부터 사용자 음성의 특징 파라미터를 추출하는 제13소단계와,
상기 사용자 음성의 특징 파라미터를 코드북의 코드 벡터 공간으로 사상하여 음성의 특징 벡터를 추출하는 제14소단계와,
상기 추출된 특징 벡터의 패턴을 시간축 상에서의 비선형 신축을 고려하여 보정하여 사용자의 음성 패턴을 생성하는 제15소단계를 포함한 것을 특징으로 하는 음성 기반 인증방법.
제 7 항에 있어서, 적어도 둘 이상의 샘플 문자열에 대해 상기 제11소단계 내지 상기 제15소단계를 수행하여 적어도 둘 이상의 사용자의 음성 패턴을 생성하고 학습하는 것을 특징으로 하는 음성 기반 인증방법.
제 5 항에 있어서, 상기 제3단계는,
상기 인증서버가 상기 화자의 음성신호를 샘플링하는 제31소단계와,
상기 샘플링된 음성신호로부터 화자 음성의 특징 파라미터를 추출하는 제32소단계와,
상기 화자 음성의 특징 파라미터를 코드북의 코드 벡터 공간으로 사상하여 음성의 특징 벡터를 추출하는 제33소단계와,
상기 추출된 특징 벡터의 패턴을 시간축 상에서의 비선형 신축을 고려하여 보정하여 화자의 음성 패턴을 생성하는 제34소단계를 포함한 것을 특징으로 하는 음성 기반 인증방법.
제 5 항에 있어서, 상기 제4단계에서 상기 화자의 음성 패턴과 상기 사용자의 음성 패턴의 매칭율이 기설정된 임계값보다 크면 상기 화자의 음성 패턴을 반영하여 상기 사용자의 음성 패턴을 훈련하는 제7단계를 더 포함한 것을 특징으로 하는 음성 기반 인증방법.