KR100488121B1 - 화자간 변별력 향상을 위하여 개인별 켑스트럼 가중치를 적용한 화자 인증 장치 및 그 방법 - Google Patents
화자간 변별력 향상을 위하여 개인별 켑스트럼 가중치를 적용한 화자 인증 장치 및 그 방법 Download PDFInfo
- Publication number
- KR100488121B1 KR100488121B1 KR10-2002-0014490A KR20020014490A KR100488121B1 KR 100488121 B1 KR100488121 B1 KR 100488121B1 KR 20020014490 A KR20020014490 A KR 20020014490A KR 100488121 B1 KR100488121 B1 KR 100488121B1
- Authority
- KR
- South Korea
- Prior art keywords
- speaker
- lpc
- individual
- extracting
- equation
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0016—Codebook for LPC parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Mathematics (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Operations Research (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (13)
- 화자들의 일반적 특징을 담고 있는 공통 화자의 특징 파라미터에 대한 특정 화자의 변별력있는 특징 파라미터를 추출함으로써, 화자간 변별력 향상을 시키는 화자 인증 장치에 있어서,입력되는 음성 신호를 샘플링하여 끝점을 추출하는 끝점 추출부;상기 끝점 추출부에 의하여 결정된 음성 구간에서 음성 신호의 음성 특징점을 추출할 때, 고대역을 증가시키기 위한 고대역 강조 필터;상기 고대역 강조 필터로부터 고대역이 증가된 샘플링된 음성 신호를 입력받아 주기적인 윈도우를 취하여 주기적 신호로 생성하는 윈도윙부;상기 윈도윙부로부터 주기적 신호로 변환된 음성 신호를 입력받아 LPC(Linear Predictive Coefficient)를 추출하기 위한 자기 상관값을 구하는 자기 상관 분석부;상기 자기 상관 분석부로부터 자기 상관값을 이용하여 PARCOR(PARtial CORrelation) 계수를 구한 후, 이를 이용하여 LPC를 구하는 LPC 분석부;상기 LPC 분석부로부터 구한 LPC를 이용하여 LPC 켑스트럼(Cepstrum)을 구한 후, 공통 코드북의 차수별 분산, 개인 화자의 발성 구간 내에서 전체 프레임에 대한 차수별 특징 벡터의 분산의 비값을 가중치로 하여 상기 LPC 켑스트럼에 적용하는 LPC 파라미터 변환부;를 포함하는 것을 특징으로 하는 개인별 켑스트럼 가중치를 적용한 화자 인증 장치.
- 삭제
- 제 1 항에 있어서,상기 고대역 강조 필터로부터 고대역이 강조된 음성 신호를 입력받아 프레임 간의 음성 정보의 손실을 고려하여 임의의 개수의 음성 샘플로 블로킹(Blocking)하고, 임의의 개수의 샘플만큼 천이하여 재차 블로킹한 후, 상기 윈도윙부로 전송하는 프레임 블로킹부;를 더 포함하는 것을 특징으로 하는 개인별 켑스트럼 가중치를 적용한 화자 인증 장치.
- 제 1 항에 있어서,상기 윈도윙부는,윈도우 함수로서, 해밍 윈도우(Hamming Window) 함수를 이용하는 것을 특징으로 하는 개인별 켑스트럼 가중치를 적용한 화자 인증 장치.
- 제 1 항에 있어서,상기 LPC 분석부는,아래의 [식 1]에 의하여 LPC를 구하는 것을 특징으로 하는 개인별 켑스트럼 가중치를 적용한 화자 인증 장치.[식 1]여기서, (LPC 계수)는 이고, m은 을 만족하며, 은 PARCOR 계수이고, r(i)는 자기 상관값(Auto Correlation)이며, i는 LPC 차수이다.
- 제 1 항에 있어서,상기 LPC 파라미터 변환부는,상기 공통 코드북의 가중치를 아래의 [식 2]에 의하여 결정하는 것을 특징으로 하는 개인별 켑스트럼 가중치를 적용한 화자 인증 장치.[식 2]여기서, w(i)는 가중치를 의미하며, 는 공통 코드북의 차수별 분산을 의미하고, 는 개인 화자의 발성 구간(T 개의 프레임) 내에서 전체 프레임에 대한 차수별 특징 벡터의 분산을 의미한다.
- 화자들의 일반적 특징을 담고 있는 공통 화자의 특징 파리미터에 대한 특정 화자의 변별력있는 특징 파라미터를 추출함으로써, 화자간 변별력 향상을 시키는 화자 인증 방법에 있어서,입력되는 음성 신호를 샘플링하여 끝점을 추출하여 음성 구간을 결정한 후, 상기 음성 구간에서의 음성 특징점을 추출할 때, 고대역을 증가시키는 제 1 단계;상기 제 1 단계에서 고대역이 증가된 샘플링된 음성 신호를 입력받아 주기적인 윈도우를 취하여 주기적 신호로 생성하는 제 2 단계;상기 제 2 단계에서 주기적 신호로 변환된 음성 신호를 입력받아 LPC(Linear Predictive Coefficient)를 추출하기 위한 자기 상관값을 구하는 제 3 단계;상기 제 3 단계에서 구한 자기 상관값을 이용하여 PARCOR(PARtial CORrelation) 계수를 구한 후, 이를 이용하여 LPC를 구하는 제 4 단계;상기 제 4 단계에서 구한 LPC를 이용하여 LPC 켑스트럼(Cepstrum)을 구한 후, 공통 코드북의 차수별 분산, 개인 화자의 발성 구간 내에서 전체 프레임에 대한 차수별 특징 벡터의 분산의 비값을 가중치로 하여 상기 LPC 켑스트럼에 적용하는 제 5 단계;를 포함하는 것을 특징으로 하는 개인별 켑스트럼 가중치를 적용한 화자 인증 방법.
- 삭제
- 제 7 항에 있어서,상기 제 2 단계는,상기 제 1 단계에서 고대역이 강조된 음성 신호를 입력받아 프레임 간의 음성 정보의 손실을 고려하여 임의의 개수의 음성 샘플로 블로킹(Blocking)하고, 임의의 개수의 샘플만큼 천이하여 재차 블로킹하는 서브 단계를 포함하는 것을 특징으로 하는 개인별 켑스트럼 가중치를 적용한 화자 인증 방법.
- 제 7 항에 있어서,상기 제 2 단계는,윈도우 함수로서, 해밍 윈도우(Hamming Window) 함수를 이용하는 것을 특징으로 하는 개인별 켑스트럼 가중치를 적용한 화자 인증 방법.
- 제 7 항에 있어서,상기 제 4 단계는,아래의 [식 3]에 의하여 LPC를 구하는 것을 특징으로 하는 개인별 켑스트럼 가중치를 적용한 화자 인증 방법.[식 1]여기서, (LPC 계수)는 이고, m은 을 만족하며, 은 PARCOR 계수이고, r(i)는 자기 상관값(Auto Correlation)이며, i는 LPC 차수이다.
- 제 7 항에 있어서,상기 제 5 단계는,상기 공통 코드북의 가중치를 아래의 [식 4]에 의하여 결정하는 것을 특징으로 하는 개인별 켑스트럼 가중치를 적용한 화자 인증 방법.[식 4]여기서, w(i)는 가중치를 의미하며, 는 공통 코드북의 차수별 분산을 의미하고, 는 개인 화자의 발성 구간(T 개의 프레임) 내에서 전체 프레임에 대한 차수별 특징 벡터의 분산을 의미한다.
- 화자들의 일반적인 특징을 담고 있는 공통 화자의 특징 파라미터에 대한 특정 화자의 변별력있는 특징 파라미터를 추출함으로써, 화자간 변별력 향상을 시키는 화자 인증 프로그램을 실행시킬 수 있는 컴퓨터로 읽을 수 있는 기록 매체에 있어서,입력되는 샘플링된 음성 신호의 음성 특징점을 추출할 때, 고대역을 증가시키는 제 1 단계;상기 제 1 단계에서 고대역이 증가된 샘플링된 음성 신호를 입력받아 주기적인 윈도우를 취하여 주기적 신호로 생성하는 제 2 단계;상기 제 2 단계에서 주기적 신호로 변환된 음성 신호를 입력받아 LPC(Linear Predictive Coefficient)를 추출하기 위한 자기 상관값을 구하는 제 3 단계;상기 제 3 단계에서 구한 자기 상관값을 이용하여 PARCOR(PARtial CORrelation) 계수를 구한 후, 이를 이용하여 LPC를 구하는 제 4 단계;상기 제 4 단계에서 구한 LPC를 이용하여 LPC 켑스트럼(Cepstrum)을 구한 후, 공통 코드북의 차수별 분산, 개인 화자의 발성 구간 내에서 전체 프레임에 대한 차수별 특징 벡터의 분산의 비값을 가중치로 하여 상기 LPC 켑스트럼에 적용하는 제 5 단계;를 포함하고,상기 제 5 단계는,상기 공통 코드북의 가중치를 아래의 [식 5]에 의하여 결정하는 것을 특징으로 하는 개인별 켑스트럼 가중치를 적용한 화자 인증 프로그램을 실행시킬 수 있는 컴퓨터로 읽을 수 있는 기록 매체.[식 5]여기서, w(i)는 가중치를 의미하며, 는 공통 코드북의 차수별 분산을 의미하고, 는 개인 화자의 발성 구간(T 개의 프레임) 내에서 전체 프레임에 대한 차수별 특징 벡터의 분산을 의미한다.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0014490A KR100488121B1 (ko) | 2002-03-18 | 2002-03-18 | 화자간 변별력 향상을 위하여 개인별 켑스트럼 가중치를 적용한 화자 인증 장치 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0014490A KR100488121B1 (ko) | 2002-03-18 | 2002-03-18 | 화자간 변별력 향상을 위하여 개인별 켑스트럼 가중치를 적용한 화자 인증 장치 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20030075328A KR20030075328A (ko) | 2003-09-26 |
KR100488121B1 true KR100488121B1 (ko) | 2005-05-06 |
Family
ID=32225169
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2002-0014490A KR100488121B1 (ko) | 2002-03-18 | 2002-03-18 | 화자간 변별력 향상을 위하여 개인별 켑스트럼 가중치를 적용한 화자 인증 장치 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100488121B1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102604319B1 (ko) * | 2016-11-01 | 2023-11-24 | 한국전자통신연구원 | 화자 인증 시스템 및 그 방법 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0736477A (ja) * | 1993-07-16 | 1995-02-07 | Ricoh Co Ltd | パターンマッチング方式 |
US5522012A (en) * | 1994-02-28 | 1996-05-28 | Rutgers University | Speaker identification and verification system |
JPH09218697A (ja) * | 1995-12-22 | 1997-08-19 | Ncr Internatl Inc | 話者検証システム |
US5732188A (en) * | 1995-03-10 | 1998-03-24 | Nippon Telegraph And Telephone Corp. | Method for the modification of LPC coefficients of acoustic signals |
KR19990004697A (ko) * | 1997-06-30 | 1999-01-25 | 배순훈 | 가중 선형 예측 켑스트럼 계수를 이용한 음성인식 장치 및 그 제어방법 |
-
2002
- 2002-03-18 KR KR10-2002-0014490A patent/KR100488121B1/ko active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0736477A (ja) * | 1993-07-16 | 1995-02-07 | Ricoh Co Ltd | パターンマッチング方式 |
US5522012A (en) * | 1994-02-28 | 1996-05-28 | Rutgers University | Speaker identification and verification system |
US5732188A (en) * | 1995-03-10 | 1998-03-24 | Nippon Telegraph And Telephone Corp. | Method for the modification of LPC coefficients of acoustic signals |
JPH09218697A (ja) * | 1995-12-22 | 1997-08-19 | Ncr Internatl Inc | 話者検証システム |
KR19990004697A (ko) * | 1997-06-30 | 1999-01-25 | 배순훈 | 가중 선형 예측 켑스트럼 계수를 이용한 음성인식 장치 및 그 제어방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20030075328A (ko) | 2003-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Saksamudre et al. | A review on different approaches for speech recognition system | |
JP6777768B2 (ja) | 単語ベクトル化モデル学習装置、単語ベクトル化装置、音声合成装置、それらの方法、及びプログラム | |
Vergin et al. | Generalized mel frequency cepstral coefficients for large-vocabulary speaker-independent continuous-speech recognition | |
JP4802135B2 (ja) | 話者認証登録及び確認方法並びに装置 | |
Kumar et al. | Design of an automatic speaker recognition system using MFCC, vector quantization and LBG algorithm | |
WO2007046267A1 (ja) | 音声判別システム、音声判別方法及び音声判別用プログラム | |
Almaadeed et al. | Text-independent speaker identification using vowel formants | |
Shanthi et al. | Review of feature extraction techniques in automatic speech recognition | |
JP2006171750A (ja) | 音声認識のための特徴ベクトル抽出方法 | |
Pawar et al. | Review of various stages in speaker recognition system, performance measures and recognition toolkits | |
Razak et al. | Quranic verse recitation recognition module for support in j-QAF learning: A review | |
Karpov | Real-time speaker identification | |
Shanthi Therese et al. | Review of feature extraction techniques in automatic speech recognition | |
JP2001166789A (ja) | 初頭/末尾の音素類似度ベクトルによる中国語の音声認識方法及びその装置 | |
WO2015025788A1 (ja) | 定量的f0パターン生成装置及び方法、並びにf0パターン生成のためのモデル学習装置及び方法 | |
KR101560833B1 (ko) | 음성 신호를 이용한 감정 인식 장치 및 방법 | |
JP4461557B2 (ja) | 音声認識方法および音声認識装置 | |
Praveen et al. | Text dependent speaker recognition using MFCC features and BPANN | |
Sharma et al. | Soft-Computational Techniques and Spectro-Temporal Features for Telephonic Speech Recognition: an overview and review of current state of the art | |
KR100488121B1 (ko) | 화자간 변별력 향상을 위하여 개인별 켑스트럼 가중치를 적용한 화자 인증 장치 및 그 방법 | |
JP2011180308A (ja) | 音声認識装置及び記録媒体 | |
Dustor et al. | Influence of feature dimensionality and model complexity on speaker verification performance | |
Shafie et al. | Sequential classification for articulation and Co-articulation classes of Al-Quran syllables pronunciations based on GMM-MLLR | |
Khalifa et al. | Statistical modeling for speech recognition | |
Correia et al. | Anti-spoofing: Speaker verification vs. voice conversion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130425 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20140428 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20150227 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20160304 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20170920 Year of fee payment: 13 |
|
FPAY | Annual fee payment |
Payment date: 20190328 Year of fee payment: 15 |