KR20050050466A - Svm을 이용한 화자 등록 및 인증 시스템과 그 방법 - Google Patents

Svm을 이용한 화자 등록 및 인증 시스템과 그 방법 Download PDF

Info

Publication number
KR20050050466A
KR20050050466A KR1020030084213A KR20030084213A KR20050050466A KR 20050050466 A KR20050050466 A KR 20050050466A KR 1020030084213 A KR1020030084213 A KR 1020030084213A KR 20030084213 A KR20030084213 A KR 20030084213A KR 20050050466 A KR20050050466 A KR 20050050466A
Authority
KR
South Korea
Prior art keywords
voice
authentication
speaker
feature
svm
Prior art date
Application number
KR1020030084213A
Other languages
English (en)
Other versions
KR100560425B1 (ko
Inventor
최우용
이경희
반성범
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020030084213A priority Critical patent/KR100560425B1/ko
Publication of KR20050050466A publication Critical patent/KR20050050466A/ko
Application granted granted Critical
Publication of KR100560425B1 publication Critical patent/KR100560425B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/39Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using genetic algorithms

Abstract

본 발명에 의한 SVM(Support Vector Machine)을 이용한 화자 등록 및 인증 시스템과 그 방법은 등록될 사용자의 음성을 입력받는 음성입력부; 상기 입력된 음성에 대하여 소정의 전처리과정을 수행한 후 소정의 음성특징을 적어도 하나 이상 추출하는 전처리부; 및 상기 추출된 각 음성특징을 염색체로 매핑하여 특징집합을 구성하고 상기 특징집합에 대하여 유전자 알고리즘을 적용하여 최적의 염색체로 이루어지는 최적특징집합을 구한 후 상기 최적특징집합을 입력벡터로 하여 SVM을 생성함으로써 화자모델을 구성하는 제어부;를 포함하는 것을 특징으로 하며, 화자 등록 과정에서는 개인별로 식별력이 우수한 특징집합을 선택하고, 화자 인증 과정에서는 상기 화자 등록시 학습과정에서 선택된 특징 집합만을 사용함으로써, 불필요한 정보에 따른 메모리 사용을 줄이고, 화자 인증을 위한 데이터 계산량도 줄일 수 있어 USB 토큰 또는 스마트카드와 같은 제한된 자원 환경 하에서도 화자 인증을 통한 신원인증을 가능하게 하는 이점이 있다

Description

SVM을 이용한 화자 등록 및 인증 시스템과 그 방법{Apparatus for registrating and identifying voice and method thereof}
본 발명은 생체정보를 이용한 사용자 등록 및 인증 시스템 및 그 방법에 관한 것으로, 특히 제한된 환경에서 음성정보를 이용한 화자 등록 과정에서는 화자별로 식별력이 우수한 특징 집합을 선택하고, 인증과정에서는 학습과정에서 선택된 특징 집합만을 사용하여 화자인증이 가능하도록 하는 시스템 및 그 방법에 관한 것이다.
통상적으로 신원인증 시스템이라 함은 보안이 요구되는 특정 지역이나 건물 등에 미리 등록된 사람들만의 출입을 허용하기 위하여 도입된 시스템으로, 사용자의 각종 신상정보와 특정 건물로의 접근을 위한 비밀번호 등을 스마트카드에 기록하여 상기 신상정보와 비밀번호가 일치하는 등록된 사용자에게만 접근을 허용하는 방식의 스마트카드 시스템이 일반적인 신원인증 시스템으로서 널리 사용되고 있으나 상기 스마트카드 시스템은 타인에 의한 도용, 위조 및 변조가 비교적 용이한 문제점이 있었다.
따라서 최근 들어서는 사람의 망막, 홍채, 지문, 서명, 얼굴, 음성 등과 같은 사용자 고유의 생체정보를 신원 인증에 이용하는 생체인식 기술 분야가 그 뛰어난 보안성을 이유로 새로운 신원인증 시스템으로서 크게 주목받고 있으며, 사회 전반에 걸쳐 보안문제가 화두로 대두됨에 따라 보다 신뢰성이 높은 보안시스템을 구축하고자 하는 사용자들을 통해 높은 설치비용에도 불구하고 그 이용이 급속히 증가하고 있는 추세이다.
한편, 종래 상기 지문, 망막, 홍채 등을 이용하는 생체정보 인증 시스템은 사용자로 하여금 자신의 생체정보가 외부로 유출된다는 느낌을 주게 되므로 사용자의 거부감이 크다는 문제점이 있으나, 음성을 이용하는 경우에는 사용자의 거부감을 크게 줄일 수 있다는 장점이 있다.
이하 상기 종래 화자인증에 관한 연구들을 살펴보면, 종래 화자인증에 관한 연구들중 대표적인 것으로 HMM(Hidden Markov Model)과 DTW(Dynamic Time Warping)를 들 수 있다. 상기 HMM은 음성의 각 프레임의 주파수 특성을 통계적 모델로 표현하는 방법으로 모든 프레임에 대해서 확률값을 계산하기 때문에 인식성능은 뛰어나지만 계산량이 많아서 데이터의 처리속도가 느리다는 단점이 있었다.
그리고 상기 DTW는 템플릿 매칭 방법으로 시간축에 대해서 부분선형 변환을 수행함으로써 발성 속도의 차이에서 오는 프레임간의 불일치를 보상해 주는 방법이다. 그러나 상기 DTW 방법은 별도의 훈련과정 없이 등록음성 특징벡터를 저장하기 때문에 등록 시간이 짧다는 장점은 있으나 인증 시간이 길고, 메모리 사용량이 많다는 단점이 있었다. 따라서 상기 방법들은 메모리 및 계산량에 제한이 있는 환경 하에서는 사용이 어려운 문제점이 있었다.
본 발명이 이루고자 하는 기술적 과제는 유전자 알고리즘과 SVM을 이용하여 식별력이 우수한 특징집합을 선택하여 사용자를 등록하는 시스템 및 그 방법을 제공하는데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는 화자등록시에 선택된 특징집합과 SVM을 이용하여 인증을 수행하는 시스템 및 그 방법을 제공하는데 있다.
상기의 기술적 과제를 이루기 위하여 본 발명에 의한 SVM을 이용한 화자 등록 시스템은 등록될 사용자의 음성을 입력받는 음성입력부; 상기 입력된 음성에 대하여 소정의 전처리과정을 수행한 후 소정의 음성특징을 적어도 하나 이상 추출하는 전처리부; 및 상기 추출된 각 음성특징을 염색체로 매핑하여 특징집합을 구성하고 상기 특징집합에 대하여 유전자 알고리즘을 적용하여 최적의 염색체로 이루어지는 최적특징집합을 구한 후 상기 최적특징집합을 입력벡터로 하여 SVM(Support Vector Machine)을 생성함으로써 화자모델을 구성하는 제어부;를 포함하는 것을 특징으로 한다.
상기의 기술적 과제를 이루기 위하여 본 발명에 의한 SVM을 이용한 화자 등록 방법은 등록될 사용자의 음성을 입력받는 단계; 상기 입력된 음성에 대하여 소정의 전처리과정을 수행한 후 소정의 음성특징을 적어도 하나 이상 추출하는 단계; 상기 추출된 각 음성특징을 염색체로 매핑하여 특징집합을 구성하는 단계; 및 상기 특징집합에 대하여 유전자 알고리즘을 적용하여 최적의 염색체로 이루어지는 최적특징집합을 구하고 상기 최적특징집합을 입력벡터로 하여 SVM(Support Vector Machine)을 생성함으로써 상기 사용자를 대표하는 화자모델을 구성하는 단계;를 포함하는 것을 특징으로 한다.
상기의 다른 기술적 과제를 이루기 위하여 본 발명에 의한 SVM을 이용한 화자 인증 시스템은 등록된 사용자별로 SV(Support Vector), 가중치정보, 최적특징값으로 구성된 화자모델을 구비하고, 인증을 요하는 사용자의 음성을 입력받는 음성입력부; 상기 입력된 음성에 대하여 소정의 전처리과정을 수행한 후 소정의 음성특징을 적어도 하나 이상 추출하는 전처리부; 상기 인증을 요구하는 사용자의 개인정보를 입력받는 개인정보입력부; 및 상기 개인정보에 기초하여 대응되는 상기 화자모델내의 상기 SV, 가중치정보, 최적특징값을 기초로 화자인증을 수행하는 제어부;를 포함하는 것을 특징으로 한다.
상기의 다른 기술적 과제를 이루기 위하여 본 발명에 의한 SVM을 이용한 화자 인증 방법은 등록된 사용자별로 SV(Support Vector), 가중치정보, 최적특징값으로 구성된 화자모델을 기초로 하여,인증을 요구하는 사용자의 음성을 입력받아 소정의 전처리과정을 거쳐 소정의 음성특징을 추출하는 단계; 상기 인증을 요구하는 사용자의 개인정보를 입력받는 단계; 상기 개인정보를 기초로 상기 화자모델내의 SV, 가중치정보, 최적특징값을 읽어오는 단계; 및 상기 SV, 가중치정보로 인증SVM을 생성한 후, 상기 최적특징값에 대응되는 상기 추출된 음성특징을 상기 인증SVM의 입력벡터로 하여 화자인증을 수행하는 단계;를 포함하는 것을 특징으로 한다.
이하 첨부된 도면을 참조하여 본 발명의 바람직한 일 실시예를 상세히 설명하도록 한다. 도 1은 본 발명에 의한 SVM(Support Vector Machine)을 이용한 화자 등록 및 인증 시스템의 구성을 보여주는 블럭도이다. 먼저 상기 도 1을 참조하여 본 발명에 의한 SVM을 이용한 화자 등록 및 인증 시스템의 동작을 개괄적으로 살펴본 후 도 2내지 도4를 참조하면서 상세하게 설명하도록 한다. 우선 화자 등록 블럭에 대하여 살펴본다. 화자 등록부(100)는 상기 화자 등록 및 인증 시스템에서 사용자의 등록 요구에 대해 사용자 고유의 음성을 등록하는 기능블록으로 등록음성 입력부(101), 제1전처리부(102), 제1제어부(103), SVM 분류기(104) 및 화자 모델(105)로 구성된다.
상기 화자 등록부(100)의 동작을 살펴보면, 등록음성 입력부(101)에서 입력받은 사용자의 등록 음성을 제1전처리부(102)에서 끝점 검출 및 전처리 과정을 수행하여 제1제어부(103)로 인가시킨다. 제1제어부(103)는 상기 전처리부를 거친 음성으로부터 음성특징을 추출하고 추출된 음성특징을 염색체로 대응시켜 염색체로 표현되는 특징 집합을 구성한 후, SVM분류기(104)를 통해 각 염색체에 대한 적합도를 측정한다.
이때 제1제어부(103)는 유전자 알고리즘(Genetic Algorithm)를 이용하여 교차(Crossover)와 돌연변이 등으로 상기 염색체 값을 진화시키면서 각 사람의 음성특징을 가장 잘 나타내는 최고의 염색체를 찾아내어 이를 입력벡터로 하여 SVM(Support Vector Machine)을 생성함으로써 각 사용자에 대한 화자 모델(105)을 생성하여 저장한다. 여기서 유전자 알고리즘은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 이해하는 것이므로 설명을 생략한다.
이제 화자 인증 블럭에 대하여 살펴본다. 화자 인증부(110)는 상기 화자 등록 및 인증 시스템에서 사용자의 인증 요구에 대해 사용자의 인증 여부를 결정하는 블록으로 인증음성 입력부(111), 개인정보 입력부(114), 제2전처리부(112), 제2제어부(113),SVM분류기(104) 및 화자 모델(105)로 구성된다.
상기 화자 인증부(180)의 동작을 살펴보면, 인증음성 입력부(100)와 개인정보입력부(114)로부터 각각 사용자의 인증 음성과 개인정보를 받아들인다. 제2전처리부(112)에서는 인증음성입력부(111)에서 획득한 인증을 요하는 사용자의 음성으로부터 끝점을 검출하고, 전처리 과정을 수행하여 제2제어부(113)로 인가시킨다. 제2제어부(113)는 개인정보 입력부(114)를 통해 상기 신원인증을 요구한 사용자가 입력하는 개인 식별 정보를 이용하여 상기 인증 시스템에 등록된 사용자 중 상기 개인 식별 정보에 해당하는 사용자의 화자인증을 위해 화자 모델(140)에 저장된 SV값과 가중치 정보, 그리고 개인별 식별력이 우수한 특징 선택값을 읽어 들인다.
그리고 제2제어부(113)는 상기 SV값과 가중치 정보를 이용하여 인증용SVM을 생성하고, 상기 특징 선택값을 이용하여 상기 화자 등록 시스템에 저장된 식별력이 우수한 특징 집합에 해당하는 특징값을 추출하여 그 추출된 값을 입력벡터로 하여 SVM 분류기(104)를 통해 상기 인증용SVM에 의하여 화자 인증을 수행한다.
이때 상기 개인정보 입력부(114)는 다수의 숫자키를 구비하여 화자인증 요청 사용자가 자신의 개인 식별 정보를 숫자로 입력할 수 있도록 한 사용자 정보 입력 인터페이스일 수도 있으며, 사용자별로 키가 할당되는 USB 보안 토큰(Token) 입력 인터페이스로 구현될 수도 있다. 또한 상기 개인정보 입력부(114)는 근래에 들어 신원인증을 위해 널리 사용되고 있는 신분(Identification: ID) 카드를 인식할 수 있는 신분카드 인식부 등이 될 수도 있는데, 상기 신분카드로 사용되는 스마트카드 등과 같은 IC 카드의 경우와 같이 자원이 한정적인 경우에도 화자인증을 위한 SVM 분류기(104) 생성에 필요한 상기 사용자별 SV값, 가중치 정보 및 개인별 식별력이 우수한 특징 선택값을 미리 저장시켜 IC 카드 자체에서 화자 인증이 가능하게 함으로써, 보안성을 한층 더 높일 수 있다.
이하에서는 위에서 언급한 SVM을 이용한 화자 등록 및 인증 시스템에 대하여 보다 상세한 설명을 하기로 한다.
도 2는 본 발명의 일실시예에 따른 SVM분류기를 구비한 화자 등록 시스템에서 등록된 사람의 선택된 특징값을 입력벡터로 하여 SVM을 생성한 후, 생성된 SVM을 표현하는 SV값과 가중치를 저장하고, 또한 선택된 특징 정보를 저장하는 동작 의 흐름을 도시한 것이다. 이하 상기 도 1 및 도 2를 참조하여 본 발명의 실시 예를 상세히 설명한다.
먼저 제1제어부(103)는 상기 화자 등록 시스템에 등록하여야 하는 사용자들의 사용자별 특징값을 생성하기 위해 상기 음성 입력부(101)를 제어하여 상기 시스템에 등록될 사용자의 음성을 입력받도록 한다(S200단계). 이어 제1전처리부(102)는 상기 등록음성입력부(101)가 출력하는 사용자의 입력 음성으로부터 시작점과 끝점을 검출하여 묵음구간을 제외한 음성을 추출한다(S201단계). 그리고 제1전처리부(102)는 상기 추출된 음성을 Preemphasis 과정을 통하여 음성 신호의 고주파 영역을 강조하는 필터링을 하여 음성특징을 추출하기 위한 전처리 과정을 수행한다(S202단계).
이어 제1제어부(101)는 (S203)단계 내지 (S208)단계를 수행하면서 각 개인의 음성 특징 정보 중에서 유전자 알고리즘을 이용한 진화 과정을 통해 개인별로 식별 능력이 우수한 특징들만을 선택하여 개인별로 고유한 차원의 SVM 특징 벡터를 계산해 내는데 이하 그 과정을 설명한다. 이를 위해 먼저 제1제어부(101)는 상기 등록될 사용자의 음성과 시스템에 등록된 타인의 음성들을 학습 데이터와 튜닝 데이터로 나누어 두고, 식별능력이 우수한 특징을 선택하기 위한 학습과정에 사용될 학습 데이터와 튜닝 데이터 각각에 대하여 전체 특징 리스트에 해당되는 값들을 미리 계산해 둔다. 즉, 제1제어부(101)는 상기 음성특징으로부터 상기 학습 데이터와 튜닝 데이터로 사용되는 사용자 음성과 타인의 음성에 대해 각 염색체 표현에 사용될 전체 특징값들을 미리 계산하여 저장하여 두는데, 이는 다음에 설명할 유전자 알고리즘에 의한 특징 집합 선택 과정에서 특징값들이 반복하여 계산되는 것을 막기 위한 것이다.
이어 제1제어부(101)는 유전자 알고리즘을 이용하여 음성특징을 가장 잘 표현할 최적의 특징집합을 선택하기 위하여 상기 미리 계산된 개인별 음성의 특징값들에서 각 염색체에 대한 특징값을 추출하여 SVM의 입력 벡터를 구성(S204단계)한 후, 각각의 선택된 특징 집합을 표현하는 염색체의 적합도를 측정하여 적합도 또는 세대수가 일정 수에 이를 때까지 염색체 교차와 돌연변이를 이용한 염색체의 진화 과정을 수행한다(S205단계). 여기서 적합도를 구하는 (S205단계)의 상세한 과정은 도 3을 참조하면서 보다 자세하게 설명한다.
도 3은 상기 제1제어부(101)에서 염색체에 대한 적합도를 측정하는 서브루틴 처리 흐름을 도시한 것으로, 상기 도 3을 참조하면, 제1제어부(101)는 상기 학습 데이터의 특징값들 중에서, 염색체로 표현된 선택된 특징들에 해당되는 값들을 추출하여 이를 입력벡터로 만들어 SVM을 생성하고(S300단계), 이렇게 생성된 SVM에 대하여 튜닝 데이터의 특징값들 중에서, 염색체로 표현된 선택된 특징들에 해당되는 값들을 추출하여 이를 상기 생성된 SVM에 입력하여 인증 성공 횟수에 따른 SVM의 분리 능력을 평가하고, 이를 적합도로 사용한다(S301단계).
이때 만일 상기 서브루틴의 처리 흐름을 통해 측정되는 상기 염색체의 적합도가 미리 설정된 기준치를 초과하거나 상기 염색체의 진화과정이 미리 설정된 세대수에 이르는지를 판단하여, 유전자 알고리즘의 종료여부를 결정한다(S206단계). 만약 기준치를 초과하였거나 세대수에 도달하였으면 적합도가 최고로 측정된 염색체의 선택된 특징값을 입력벡터로 하여 다시 SVM을 생성(S207단계)하고, 생성된 SVM을 저장하기 위하여 SV값과 가중치를 저장하고, (S208)단계에서 상기 최고의 염색체로 표현된 특징 집합을 저장함으로써 인가된 사용자의 화자 등록 과정을 종료하게 된다(S206단계).
도 4는 본 발명의 실시 예에 따른 SVM분류기를 구비한 화자 인증 시스템에서 화자인증을 위한 과정의 흐름을 도시한 것이다. 이하 상기 도 1 및 도 4를 참조하여 화자 인증 방법의 일 실시예를 상세히 설명한다.
먼저 제2제어부(113)는 임의의 사용자로부터 화자 인증 요구가 있는 경우 인증음성입력부(111)를 통해 상기 사용자의 음성을 입력받도록 한다. 제2전처리부(112)는 상기 인증하고자 하는 사용자가 입력한 음성에서 시작점과 끝점을 검출하여 묵음 구간을 제외한 음성을 추출한다(S401단계). 이어 상기 추출된 음성을 Preemphasis 과정을 통하여 음성 신호의 고주파 영역을 증폭하여 제2제어부(113)으로 출력하게 된다(S402단계). 또한 개인정보입력부(170)은 위에서 설명한 것처럼 인증을 요구하는 사용자로부터 개인 식별 정보를 입력받는다. 제2제어부(113)는 상기 개인정보 입력부(170)를 통해 입력되는 개인 식별 정보를 통해 상기 인증 시스템 내에 회원으로 등록된 사용자 중 상기 개인 식별 정보에 해당하는 사용자의 화자인증을 위해 이미 저장되어 있는 SV값과 가중치 정보 및 특징 정보값의 개인별 식별력이 우수한 특징 선택값을 화자모델(105)로부터 읽어 들인 후, 상기 제2전처리부(112)가 출력한 입력 음성에 대하여 화자모델(105)로부터 읽어 들인 식별력이 우수한 특징 선택값에 대응되는 특징값을 추출하고(S403단계), 화자모델(105)에서 읽어 들인 SV값과 가중치 정보를 이용하여 인증SVM을 생성한다(S404단계). 제2제어부(113)는 상기 추출된 특징값을 입력벡터로 하여 상기 생성된 인증SVM에 적용함으로써 화자 인증을 수행하고(S405단계), 상기 인증 결과를 화면에 출력시킨다(S406단계).
따라서 상기와 같이 본 발명에 의한 SVM을 이용한 화자 등록 및 인증 방법에서는 개인별로 식별 능력이 우수한 특징 집합을 선택함으로써, 인증 과정을 수행함에 있어 자원 사용을 효율적으로 하여 한정된 자원 하에서도 높은 성능의 인증 시스템을 구현할 수 있게 된다.
한편 지금까지는 화자 등록 방법과 화자 인증 방법을 분리해서 설명하였으나 두 가지 방법이 결합하여 화자 등록 및 인증 방법으로 구현될 수 있음은 명백하므로 그 설명은 생략하기로 한다.
본 발명에 의한 SVM을 이용한 화자 등록 혹은 화자 인증 방법은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 하드 디스크, 플로피 디스크, 플래쉬 메모리, 광 데이타 저장장치등이 있으며, 또한 캐리어 웨이브(예를들면 인터넷을 통한 전송)의 형태로 구현되는 것도 포함된다. 또한 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 읽을 수 있는 코드로서 저장되고 실행될 수 있다. 또한 본 발명에 의한 폰트 롬 데이터구조도 컴퓨터로 읽을 수 있는 ROM, RAM, CD-ROM, 자기 테이프, 하드 디스크, 플로피 디스크, 플래쉬 메모리, 광 데이타 저장장치등과 같은 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다.
이상과 같이 본 발명은 양호한 실시예에 근거하여 설명하였지만, 이러한 실시예는 이 발명을 제한하려는 것이 아니라 예시하려는 것으로, 본 발명이 속하는 기술분야의 숙련자라면 이 발명의 기술사상을 벗어남이 없이 위 실시예에 대한 다양한 변화나 변경 또는 조절이 가능함이 자명할 것이다. 그러므로, 이 발명의 보호범위는 첨부된 청구범위에 의해서만 한정될 것이며, 위와 같은 변화예나 변경예 또는 조절예를 모두 포함하는 것으로 해석되어야 할 것이다.
이상에서 설명한 바와 같이, 본 발명에 의한 SVM을 이용한 화자 등록 및 인증 시스템 과 그 방법에 있어서, 화자 등록 과정에서는 개인별로 식별력이 우수한 특징집합을 선택하고, 화자 인증 과정에서는 상기 화자 등록시 학습과정에서 선택된 특징 집합만을 사용함으로써, 불필요한 정보에 따른 메모리 사용을 줄이고, 화자 인증을 위한 데이터 계산량도 줄일 수 있어 USB 토큰 또는 스마트카드와 같은 제한된 자원 환경 하에서도 화자 인증을 통한 신원인증을 가능하게 하는 이점이 있다. 또한 식별력이 우수한 특징 정보의 사용에 따라 인증 성능도 향상시킬 수 있으며, 인증과정에서는 학습을 통해서 만들어진 최적의 특징 집합에 의한 SVM에 의해 화자 인증이 수행됨에 따라 화자 인증 수행시간도 단축시킬 수 있는 이점이 있다.
도 1은 본 발명에 의한 SVM을 이용한 화자 등록 및 인증 시스템의 구성을 보여주는 블럭도이다.
도 2는 본 발명에 의한 화자 등록 방법의 과정을 보여주는 흐름도이다.
도 3은 본 발명에 의한 화자 등록 방법에 있어서 각 염색체에 대한 적합도 측정을 위한 과정의 상세 흐름도이다.
도 4는 본 발명에 의한 화자 인증 방법의 과정을 보여주는 흐름도이다.

Claims (13)

  1. 등록될 사용자의 음성을 입력받는 음성입력부;
    상기 입력된 음성에 대하여 소정의 전처리과정을 수행한 후 소정의 음성특징을 적어도 하나 이상 추출하는 전처리부; 및
    상기 추출된 각 음성특징을 염색체로 매핑하여 특징집합을 구성하고 상기 특징집합에 대하여 유전자 알고리즘을 적용하여 최적의 염색체로 이루어지는 최적특징집합을 구한 후 상기 최적특징집합을 입력벡터로 하여 SVM(Support Vector Machine)을 생성함으로써 화자모델을 구성하는 제어부;를 포함하는 것을 특징으로 하는 SVM을 이용한 화자 등록 시스템.
  2. 제1항에 있어서, 상기 전처리부는
    상기 입력된 음성에서 묵음구간을 제외한 음성을 추출한 후 상기 묵음이 제외된 음성의 고주파 영역을 강조한 후 상기 음성특징을 추출하는 것을 특징으로 하는 SVM을 이용한 화자 등록 시스템.
  3. 제1항에 있어서, 상기 제어부는
    상기 특징집합에 대하여 염색체 교차와 돌연변이를 기초로하는 염색체 진화 알고리즘을 적용하여 상기 최적특징집합을 구하는 것을 특징으로 하는 SVM을 이용한 화자 등록 시스템.
  4. 제3항에 있어서, 상기 제어부는
    상기 전처리부의 출력신호를 학습용 음성과 튜닝용 음성으로 나눈 후 상기 학습용 음성과 튜닝용 음성에 대하여 상기 특징집합을 각각 생성하여, 학습용 음성특징집합을 기초로 SVM을 생성한 후 튜닝용 음성특징집합의 값들을 상기 SVM에 입력하여 적합도를 구하는 것을 특징으로 하는 SVM을 이용한 화자 등록 시스템.
  5. 등록된 사용자별로 SV(Support Vector), 가중치정보, 최적특징값으로 구성된 화자모델을 구비하여 화자를 인증하는 시스템에 있어서,
    인증을 요하는 사용자의 음성을 입력받는 음성입력부;
    상기 입력된 음성에 대하여 소정의 전처리과정을 수행한 후 소정의 음성특징을 적어도 하나 이상 추출하는 전처리부;
    상기 인증을 요구하는 사용자의 개인정보를 입력받는 개인정보입력부; 및
    상기 개인정보에 기초하여 대응되는 상기 화자모델내의 상기 SV, 가중치정보, 최적특징값을 기초로 화자인증을 수행하는 제어부;를 포함하는 것을 특징으로 하는 SVM을 이용한 화자 인증 시스템.
  6. 제5항에 있어서, 상기 전처리부는
    상기 입력된 음성에서 묵음구간을 제외한 음성을 추출한 후 상기 묵음이 제외된 음성의 고주파 영역을 증폭하여 출력하는 것을 특징으로 하는 SVM을 이용한 화자 인증 시스템.
  7. 제5항에 있어서, 상기 제어부는
    상기 SV, 가중치정보를 기초로 인증용SVM을 생성한 후, 상기 인증을 요하는 사용자의 입력 음성에서 상기 최적특징값에 대응되는 특징값을 추출하여 상기 인증용SVM의 입력벡터로 하여 인증을 수행하는 것을 특징으로 하는 SVM을 이용한 화자 인증 시스템.
  8. (a) 등록될 사용자의 음성을 입력받는 단계;
    (b) 상기 입력된 음성에 대하여 소정의 전처리과정을 수행한 후 소정의 음성특징을 적어도 하나 이상 추출하는 단계;
    (c) 상기 추출된 각 음성특징을 염색체로 매핑하여 특징집합을 구성하는 단계; 및
    (d) 상기 특징집합에 대하여 유전자 알고리즘을 적용하여 최적의 염색체로 이루어지는 최적특징집합을 구하고 상기 최적특징집합을 입력벡터로 하여 SVM(Support Vector Machine)을 생성함으로써 상기 사용자를 대표하는 화자모델을 구성하는 단계;를 포함하는 것을 특징으로 하는 SVM을 이용한 화자 등록 방법.
  9. 제8항에 있어서, 상기 (b)단계는
    (b1) 상기 입력된 음성에서 묵음 구간을 제외한 음성을 추출하는 단계; 및
    (b2) 상기 묵음 구간이 제외된 음성의 고주파 영역을 증폭하는 단계;를 포함하는 것을 특징으로 하는 SVM을 이용한 화자 등록 방법.
  10. 제8항에 있어서, 상기 (d)단계는
    (d1) 상기 특징집합을 소정의 학습용 특징집합과 튜닝용 특징집합으로 구분하여 생성하는 단계;
    (d2) 상기 학습용 특징집합과 튜닝용 특징집합에 대하여 유전자 알고리즘을 적용하여 상기 사용자의 음성특징을 대표하는 최적특징을 생성한 후 상기 최적특징집합을 입력벡터로 하여 등록음성SVM을 생성하는 단계; 및
    (d3) 상기 튜닝용 특징집합을 입력벡터로 하여 상기 등록음성SVM에 입력하여 적합도를 구하는 단계;를 포함하는 것을 특징으로 하는 SVM을 이용한 화자 등록 방법.
  11. 등록된 사용자별로 SV(Support Vector), 가중치정보, 최적특징값으로 구성된 화자모델을 기초로 화자를 인증하는 방법에 있어서,
    (a) 인증을 요구하는 사용자의 음성을 입력받아 소정의 전처리과정을 거쳐 소정의 음성특징을 추출하는 단계;
    (b) 상기 인증을 요구하는 사용자의 개인정보를 입력받는 단계;
    (c) 상기 개인정보를 기초로 상기 화자모델내의 SV, 가중치정보, 최적특징값을 읽어오는 단계; 및
    (d) 상기 SV, 가중치정보로 인증SVM을 생성한 후, 상기 최적특징값에 대응되는 상기 추출된 음성특징을 상기 인증SVM의 입력벡터로 하여 화자인증을 수행하는 단계;를 포함하는 것을 특징으로 하는 SVM을 이용한 화자 인증 방법.
  12. 제11항에 있어서, 상기 (a)단계는
    (a1) 상기 입력된 음성에서 묵음 구간을 제외한 음성을 추출하는 단계; 및
    (a2) 상기 묵음 구간이 제외된 음성의 고주파 영역을 증폭하는 단계;를 포함하는 것을 특징으로 하는 SVM을 이용한 화자 인증 방법.
  13. 제11항에 있어서, 상기 (d)단계는
    상기 화자 인증 결과를 화상처리장치로 출력하여 상기 인증을 요구하는 사용자에게 인증결과를 보고하는 단계;를 더 포함하는 것을 특징으로 하는 SVM을 이용한 화자 인증 방법.
KR1020030084213A 2003-11-25 2003-11-25 Svm을 이용한 화자 등록 및 인증 시스템과 그 방법 KR100560425B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020030084213A KR100560425B1 (ko) 2003-11-25 2003-11-25 Svm을 이용한 화자 등록 및 인증 시스템과 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030084213A KR100560425B1 (ko) 2003-11-25 2003-11-25 Svm을 이용한 화자 등록 및 인증 시스템과 그 방법

Publications (2)

Publication Number Publication Date
KR20050050466A true KR20050050466A (ko) 2005-05-31
KR100560425B1 KR100560425B1 (ko) 2006-03-13

Family

ID=38665947

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030084213A KR100560425B1 (ko) 2003-11-25 2003-11-25 Svm을 이용한 화자 등록 및 인증 시스템과 그 방법

Country Status (1)

Country Link
KR (1) KR100560425B1 (ko)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100809662B1 (ko) * 2006-07-11 2008-03-05 하나 마이크론(주) 화자 인증을 이용한 온라인 컨텐츠의 사용자 인증 시스템및 방법
KR100826875B1 (ko) * 2006-09-08 2008-05-06 한국전자통신연구원 온라인 방식에 의한 화자 인식 방법 및 이를 위한 장치
KR100869386B1 (ko) * 2007-02-21 2008-11-19 인하대학교 산학협력단 피치 특징 벡터와 서포트 벡터머신을 이용한 음성신호에기초한 성별 인식 방법
KR100869387B1 (ko) * 2007-02-21 2008-11-19 인하대학교 산학협력단 서포트 벡터머신을 이용한 음성신호에 기초한 성별 인식방법
US7873189B2 (en) 2005-11-26 2011-01-18 Electronics And Telecommunications Research Institute Face recognition by dividing an image and evaluating a similarity vector with a support vector machine
KR20200049642A (ko) * 2018-10-30 2020-05-08 건국대학교 글로컬산학협력단 가축의 행동 분석과 방목을 위한 방법 및 시스템
KR20210014174A (ko) * 2019-01-11 2021-02-08 주식회사 액션파워 대화록 서비스를 제공하는 컴퓨팅 장치

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101871940B1 (ko) 2014-05-12 2018-06-27 한화에어로스페이스 주식회사 설비 이상 예측 모델의 구축방법 및 시스템

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7873189B2 (en) 2005-11-26 2011-01-18 Electronics And Telecommunications Research Institute Face recognition by dividing an image and evaluating a similarity vector with a support vector machine
KR100809662B1 (ko) * 2006-07-11 2008-03-05 하나 마이크론(주) 화자 인증을 이용한 온라인 컨텐츠의 사용자 인증 시스템및 방법
KR100826875B1 (ko) * 2006-09-08 2008-05-06 한국전자통신연구원 온라인 방식에 의한 화자 인식 방법 및 이를 위한 장치
KR100869386B1 (ko) * 2007-02-21 2008-11-19 인하대학교 산학협력단 피치 특징 벡터와 서포트 벡터머신을 이용한 음성신호에기초한 성별 인식 방법
KR100869387B1 (ko) * 2007-02-21 2008-11-19 인하대학교 산학협력단 서포트 벡터머신을 이용한 음성신호에 기초한 성별 인식방법
KR20200049642A (ko) * 2018-10-30 2020-05-08 건국대학교 글로컬산학협력단 가축의 행동 분석과 방목을 위한 방법 및 시스템
KR20210014174A (ko) * 2019-01-11 2021-02-08 주식회사 액션파워 대화록 서비스를 제공하는 컴퓨팅 장치

Also Published As

Publication number Publication date
KR100560425B1 (ko) 2006-03-13

Similar Documents

Publication Publication Date Title
Liu et al. An MFCC‐based text‐independent speaker identification system for access control
US7447632B2 (en) Voice authentication system
US9311546B2 (en) Biometric identity verification for access control using a trained statistical classifier
WO2019153404A1 (zh) 智能教室语音控制系统
US20070038460A1 (en) Method and system to improve speaker verification accuracy by detecting repeat imposters
US6496800B1 (en) Speaker verification system and method using spoken continuous, random length digit string
US8032380B2 (en) Method of accessing a dial-up service
KR100560425B1 (ko) Svm을 이용한 화자 등록 및 인증 시스템과 그 방법
KR101805437B1 (ko) 배경 화자 데이터를 이용한 화자 인증 방법 및 화자 인증 시스템
US20140163986A1 (en) Voice-based captcha method and apparatus
Revathi et al. Person authentication using speech as a biometric against play back attacks
Saleema et al. Voice biometrics: the promising future of authentication in the internet of things
US11929077B2 (en) Multi-stage speaker enrollment in voice authentication and identification
JP4245948B2 (ja) 音声認証装置、音声認証方法及び音声認証プログラム
Nhan Nguyen et al. Fuzzy logic weight estimation in biometric-enabled co-authentication systems
KR20110070516A (ko) 동작 기반 개인 식별 시스템 및 방법
Anarkat et al. Detection of Mimicry Attacks on Speaker Verification System for Cartoon Characters’ Dataset
JP2020154061A (ja) 話者識別装置、話者識別方法およびプログラム
TW202032536A (zh) 語者驗證系統
US20230289420A1 (en) Method for multifactor authentication using bone conduction and audio signals
van Rensburg et al. Exploring Emotion Detection as a Possible Aid in Speaker Authentication
Muttathu Sivasankara Pillai et al. Spoofing Detection for Personal Voice Assistants
Issadykova et al. Multimodal Authentication Systems: A Consideration of System Integrity, Availability and Resilience Against Spoofing Attacks
JPS63106798A (ja) 個人認証装置
JPH11344992A (ja) 音声辞書作成方法、個人認証装置および記録媒体

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20090303

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee