KR100435440B1 - 화자간 변별력 향상을 위한 가변 길이 코드북 생성 장치및 그 방법, 그를 이용한 코드북 조합 방식의 화자 인식장치 및 그 방법 - Google Patents
화자간 변별력 향상을 위한 가변 길이 코드북 생성 장치및 그 방법, 그를 이용한 코드북 조합 방식의 화자 인식장치 및 그 방법 Download PDFInfo
- Publication number
- KR100435440B1 KR100435440B1 KR10-2002-0014491A KR20020014491A KR100435440B1 KR 100435440 B1 KR100435440 B1 KR 100435440B1 KR 20020014491 A KR20020014491 A KR 20020014491A KR 100435440 B1 KR100435440 B1 KR 100435440B1
- Authority
- KR
- South Korea
- Prior art keywords
- codebook
- personal
- speaker
- cluster
- model
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 197
- 238000012795 verification Methods 0.000 title description 4
- 239000013598 vector Substances 0.000 claims abstract description 117
- 238000001514 detection method Methods 0.000 claims abstract description 4
- 238000013139 quantization Methods 0.000 claims description 50
- 238000004364 calculation method Methods 0.000 claims description 6
- 239000006185 dispersion Substances 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 description 38
- 238000010586 diagram Methods 0.000 description 7
- 238000012790 confirmation Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 4
- 238000003909 pattern recognition Methods 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/16—Hidden Markov models [HMM]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/081—Search algorithms, e.g. Baum-Welch or Viterbi
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Optimization (AREA)
- Multimedia (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Theoretical Computer Science (AREA)
- Algebra (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Collating Specific Patterns (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (30)
- 화자 인식 시스템에 적용되는 개인 코드북 생성 장치에 있어서,입력되는 모든 샘플링된 음성 벡터에 대하여 하나의 중심값을 설정하는 중심값 설정 수단;모든 클러스터 중 최대 분산을 가지는 클러스터를 검출하는 검출 수단;상기 최대 분산을 가지는 클러스터의 중심값을 상기 분산을 고려하여 이동시켜 둘로 분할하는 분할 수단;상기 모든 입력 벡터에 대하여 분할된 각각의 클러스터와의 유클리드 거리를 측정하여 가장 작은 거리를 가지는 클러스터의 멤버 벡터로 집단화하는 집단화 수단; 및상기 각 클러스터의 멤버 벡터를 통하여 클러스터의 중심점을 갱신함으로써, 개인 코드북을 생성하는 중심점 갱신 수단;을 포함하는 것을 특징으로 하는 화자 인식 시스템에 적용되는 개인 코드북 생성 장치.
- 제 1 항에 있어서,상기 중심값 설정 수단은,아래의 [식 1]에 의하여 중심값을 결정하는 것을 특징으로 하는 화자 인식 시스템에 적용되는 개인 코드북 생성 장치.[식 1]여기서,는 입력 벡터이고,는 모든 입력 벡터의 개수이다.
- 제 1 항에 있어서,상기 검출 수단은,최대 분산을 가지는 클러스터를 아래의 [식 2]에 의하여 결정하는 것을 특징으로 하는 화자 인식 시스템에 적용되는 개인 코드북 생성 장치.[식 2]여기서,는 k 번째 클러스터의 분산이고, k는 1부터 K 까지의 정수이다.
- 제 1 항에 있어서,상기 분할 수단은,분할 방향이 아래의 [식 3]와 같이 분산을 고려하여 분할하고자 하는 클러스터의 멤버를 양분하는 것을 특징으로 하는 화자 인식 시스템에 적용되는 개인 코드북 생성 장치.[식 3]여기서,은 상수이다.
- 제 1 항에 있어서,상기 집단화 수단은,아래의 [식 4]에 의하여 집단화를 수행하는 것을 특징으로 하는 화자 인식 시스템에 적용되는 개인 코드북 생성 장치.[식 4]
- 제 1 항에 있어서,상기 중심점 갱신 수단은,아래의 [식 5]에 의하여 중심점을 결정하는 것을 특징으로 하는 화자 인식 시스템에 적용되는 개인 코드북 생성 장치.[식 5]여기서,는에 소속된 멤버의 개수이다.
- 제 1 항에 있어서,오차의 갱신값이 임계값 이하이고, 각 클러스터들의 분산이 공통 코드북의 평균 분산 이하이면, 작업을 종료하는 종료 수단;을 더 포함하는 것을 특징으로 하는 화자 인식 시스템에 적용되는 개인 코드북 생성 장치.
- 화자 인식 시스템에 적용되는 개인 코드북 생성 방법에 있어서,입력되는 모든 샘플링된 음성 벡터에 대하여 하나의 중심값을 설정하는 제 1 단계;모든 클러스터 중 최대 분산을 가지는 클러스터를 검출하는 제 2 단계;상기 최대 분산을 가지는 클러스터의 중심값을 상기 분산을 고려하여 이동시켜 둘로 분할하는 제 3 단계;상기 모든 입력 벡터에 대하여 분할된 각각의 클러스터와의 유클리드 거리를 측정하여 가장 작은 거리를 가지는 클러스터의 멤버 벡터로 집단화하는 제 4 단계; 및상기 각 클러스터의 멤버 벡터를 통하여 클러스터의 중심점을 갱신함으로써, 개인 코드북을 생성하는 제 5 단계;를 포함하는 것을 특징으로 하는 화자 인식 시스템에 적용되는 개인 코드북 생성 방법.
- 제 8 항에 있어서,상기 제 1 단계는,아래의 [식 6]에 의하여 중심값을 결정하는 것을 특징으로 하는 화자 인식 시스템에 적용되는 개인 코드북 생성 방법.[식 6]여기서,는 입력 벡터이고,는 모든 입력 벡터의 개수이다.
- 제 8 항에 있어서,상기 제 2 단계는,최대 분산을 가지는 클러스터를 아래의 [식 7]에 의하여 결정하는 것을 특징으로 하는 화자 인식 시스템에 적용되는 개인 코드북 생성 방법.[식 7]여기서,는 k 번째 클러스터의 분산이고, k는 1부터 K 까지의 정수이다.
- 제 8 항에 있어서,상기 제 3 단계는,분할 방향이 아래의 [식 8]과 같이 분산을 고려하여 분할하고자 하는 클러스터의 멤버를 양분하는 것을 특징으로 하는 화자 인식 시스템에 적용되는 개인 코드북 생성 방법.[식 8]여기서,은 상수이다.
- 제 8 항에 있어서,상기 제 4 단계는,아래의 [식 9]에 의하여 집단화를 수행하는 것을 특징으로 하는 화자 인식 시스템에 적용되는 개인 코드북 생성 방법.[식 9]
- 제 8 항에 있어서,상기 제 5 단계는,아래의 [식 10]에 의하여 중심점을 결정하는 것을 특징으로 하는 화자 인식 시스템에 적용되는 개인 코드북 생성 방법.[식 10]여기서,는에 소속된 멤버의 개수이다.
- 제 8 항에 있어서,오차의 갱신값이 임계값 이하이고, 각 클러스터들의 분산이 공통 코드북의 평균 분산 이하이면, 작업을 종료하는 제 6 단계;를 더 포함하는 것을 특징으로 하는 화자 인식 시스템에 적용되는 개인 코드북 생성 방법.
- 공통 VQ(Vector Quantization) 코드북을 입력받아 음성 특징 파라미터를 상기 공통 코드북에 벡터 양자화 과정을 수행하여 생성한 관측열로써 HMM(Hidden Markov Model) 확률 모델에 따른 월드 모델을 생성하는 월드 모델 생성 수단;공통 코드북의 분산값과 비교하여 최적의 임의의 개수의 개인 코드북을 생성하는 개인 코드북 생성 수단;개인 화자의 음성 특징 파라미터를 상기 개인 코드북에 벡터 양자화 과정을 수행하여 생성한 관측열(시퀀스열)로써 HMM 확률 모델에 따른 화자 모델을 생성하는 화자 모델 생성 수단; 및상기 공통 코드북에 벡터 양자화 과정을 수행하여 생성한 관측열로써 월드 모델과의 비터비 연산을 통하여 확률값을 구하고, 상기 개인 코드북에 벡터 양자화 과정을 수행하여 생성한 관측열로써 개인 화자 모델과의 비터비 연산을 통하여 확률값을 구한 후, 이들의 비값을 개인 사전 문턱치로 설정하는 개인 사전 문턱치 설정 수단;을 포함하는 것을 특징으로 하는 코드북 조합 방식의 VQ/HMM 기법을 이용한 화자 인식 장치.
- 제 15 항에 있어서,입력되는 샘플링된 화자의 음성 데이터의 화자 특징 파라미터를 상기 공통 코드북과 개인 코드북에 벡터 양자화 과정을 수행하여 생성한 관측열로서 개인 화자 모델과의 비터비 연산을 통하여 확률값을 구하는 개인 화자 모델 확률 계산 수단;상기 화자 특징 파라미터를 상기 공통 코드북과 임의의 차수의 개인 코드북에 벡터 양자화 과정을 수행하여 생성한 관측열로써 월드 모델과의 비터비 연산을 통하여 확률값을 구하는 월드 모델 확률 계산 수단; 및상기 개인 화자 모델과 월드 모델 확률값의 비율과 상기 개인 사전 문턱치 설정 수단에 의하여 설정된 개인 문턱치를 비교하여 화자의 승인/거부를 결정하는 승인/거부 결정 수단;을 더 포함하는 것을 특징으로 하는 코드북 조합 방식의 VQ/HMM 기법을 이용한 화자 인식 장치.
- 제 15 항에 있어서,승인된 특징 파라미터를 상기 개인 코드북 중 가장 가까운 거리를 가지는 인덱스를 구한 후, 상기 인덱스의 코드북과 특징 파라미터의 거리가 상기 인덱스의 코드북의 분산값보다 임계값만큼 크면, 새로운 클러스터를 생성하여 편입시키고,임계값보다 작으면 상기 개인 코드북의 평균값을 상기 특징 파라미터를 이용하여 갱신하는 것을 특징으로 하는 개인 코드북 갱신 수단;을 더 포함하는 것을 특징으로 하는 코드북 조합 방식의 VQ/HMM 기법을 이용한 화자 인식 장치.
- 제 17 항에 있어서,상기 개인 코드북의 평균값의 갱신은 아래의 [식 1]에 의하여 결정되는 것을 특징으로 하는 코드북 조합 방식의 VQ/HMM 기법을 이용한 화자 인식 장치.[식 1]여기서,는 인덱스 k의 코드북 센터값이고,는 i 번째 특징 파라미터 값이며, w는 가중치이다.
- 제 15 항에 있어서,상기 개인 코드북에 대한 입력 특징 파라미터의 벡터 양자화로 생성된 관측열(시퀀스)로 화자 모델을 갱신한 후, 상기 갱신된 새로운 코드북에 대한 입력 특징 파라미터의 벡터 양자화를 수행하여 생성된 관측열로 새로운 화자 모델을 생성하고, 이를 이용하여 화자 모델을 갱신하는 화자 모델 갱신 수단;을 더 포함하는것을 특징으로 하는 코드북 조합 방식의 VQ/HMM 기법을 이용한 화자 인식 장치.
- 제 19 항에 있어서,상기 화자 모델의 갱신은 아래의 [식 2]에 의하여 결정하는 것을 특징으로 하는 코드북 조합 방식의 VQ/HMM 기법을 이용한 화자 인식 장치.[식 2]여기서, a, b, c는 기설정된 가중치이고,은 기존의 화자 모델이다.
- 제 15 항에 있어서,상기 개인 코드북 생성 수단은,입력되는 모든 샘플링된 음성 벡터에 대하여 하나의 중심값을 설정하는 중심값 설정부;모든 클러스터 중 최대 분산을 가지는 클러스터를 검출하는 검출부;상기 최대 분산을 가지는 클러스터의 중심값을 상기 분산을 고려하여 이동시켜 둘로 분할하는 분할부;상기 모든 입력 벡터에 대하여 분할된 각각의 클러스터와의 유클리드 거리를측정하여 가장 작은 거리를 가지는 클러스터의 멤버 벡터로 집단화하는 집단화부; 및상기 각 클러스터의 멤버 벡터를 통하여 클러스터의 중심점을 갱신함으로써, 개인 코드북을 생성하는 중심점 갱신부;를 포함하는 것을 특징으로 하는 코드북 조합 방식의 VQ/HMM 기법을 이용한 화자 인식 장치.
- 공통 VQ(Vector Quantization) 코드북을 입력받아 음성 특징 파라미터를 상기 공통 코드북에 벡터 양자화 과정을 수행하여 생성한 관측열로써 HMM(Hidden Markov Model) 확률 모델에 따른 월드 모델을 생성하는 제 1 단계;공통 코드북의 분산값과 비교하여 최적의 임의의 개수의 개인 코드북을 생성하는 제 2 단계;개인 화자의 음성 특징 파라미터를 상기 개인 코드북에 벡터 양자화 과정을 수행하여 생성한 관측열(시퀀스열)로써 HMM 확률 모델에 따른 화자 모델을 생성하는 제 3 단계; 및상기 공통 코드북에 벡터 양자화 과정을 수행하여 생성한 관측열로써 월드 모델과의 비터비 연산을 통하여 확률값을 구하고, 상기 개인 코드북에 벡터 양자화 과정을 수행하여 생성한 관측열로써 개인 화자 모델과의 비터비 연산을 통하여 확률값을 구한 후, 이들의 비값을 개인 사전 문턱치로 설정하는 제 4 단계;를 포함하는 것을 특징으로 하는 코드북 조합 방식의 VQ/HMM 기법을 이용한 화자 인식 방법.
- 제 22 항에 있어서,입력되는 샘플링된 화자의 음성 데이터의 화자 특징 파라미터를 상기 공통 코드북과 개인 코드북에 벡터 양자화 과정을 수행하여 생성한 관측열로서 개인 화자 모델과의 비터비 연산을 통하여 확률값을 구하는 제 5 단계;상기 화자 특징 파라미터를 상기 공통 코드북과 임의의 차수의 개인 코드북에 벡터 양자화 과정을 수행하여 생성한 관측열로써 월드 모델과의 비터비 연산을 통하여 확률값을 구하는 제 6 단계; 및상기 개인 화자 모델과 월드 모델 확률값의 비율과 상기 개인 사전 문턱치 설정 수단에 의하여 설정된 개인 문턱치를 비교하여 화자의 승인/거부를 결정하는 제 7 단계;를 더 포함하는 것을 특징으로 하는 코드북 조합 방식의 VQ/HMM 기법을 이용한 화자 인식 방법.
- 제 22 항에 있어서,승인된 특징 파라미터를 상기 개인 코드북 중 가장 가까운 거리를 가지는 인덱스를 구한 후, 상기 인덱스의 코드북과 특징 파라미터의 거리가 상기 인덱스의 코드북의 분산값보다 크면, 새로운 클러스터를 생성하여 편입시키고, 임계값보다 작으면 상기 개인 코드북의 평균값을 상기 특징 파리미터를 이용하여 갱신하는 것을 특징으로 하는 제 8 단계;를 더 포함하는 것을 특징으로 하는 코드북 조합 방식의 VQ/HMM 기법을 이용한 화자 인식 방법.
- 제 24 항에 있어서,상기 개인 코드북의 평균값의 갱신은 아래의 [식 3]에 의하여 결정되는 것을 특징으로 하는 코드북 조합 방식의 VQ/HMM 기법을 이용한 화자 인식 방법.[식 3]여기서,는 인덱스 k의 코드북 센터값이고,는 i 번째 특징 파라미터 값이며, w는 가중치이다.
- 제 22 항에 있어서,상기 개인 코드북에 대한 입력 특징 파라미터의 벡터 양자화로 생성된 관측열(시퀀스)로 화자 모델을 갱신한 후, 상기 갱신된 새로운 코드북에 대한 입력 특징 파라미터의 벡터 양자화를 수행하여 생성된 관측열로 새로운 화자 모델을 생성하고, 이를 이용하여 화자 모델을 갱신하는 제 9 단계;를 더 포함하는 것을 특징으로 하는 코드북 조합 방식의 VQ/HMM 기법을 이용한 화자 인식 방법.
- 제 26 항에 있어서,상기 화자 모델의 갱신은 아래의 [식 4]에 의하여 결정하는 것을 특징으로 하는 코드북 조합 방식의 VQ/HMM 기법을 이용한 화자 인식 방법.[식 4]여기서, a, b, c는 기설정된 가중치이고,은 기존의 화자 모델이다.
- 제 22 항에 있어서,상기 제 2 단계는,입력되는 모든 샘플링된 음성 벡터에 대하여 하나의 중심값을 설정하는 제 1 서브 단계;모든 클러스터 중 최대 분산을 가지는 클러스터를 검출하는 제 2 서브 단계;상기 최대 분산을 가지는 클러스터의 중심값을 상기 분산을 고려하여 이동시켜 둘로 분할하는 제 3 서브 단계;상기 모든 입력 벡터에 대하여 분할된 각각의 클러스터와의 유클리드 거리를 측정하여 가장 작은 거리를 가지는 클러스터의 멤버 벡터로 집단화하는 제 4 서브단계; 및상기 각 클러스터의 멤버 벡터를 통하여 클러스터의 중심점을 갱신함으로써, 개인 코드북을 생성하는 제 5 서브 단계;를 포함하는 것을 특징으로 하는 코드북 조합 방식의 VQ/HMM 기법을 이용한 화자 인식 방법.
- 화자 인식 시스템에 적용되는 개인 코드북 생성 프로그램을 실행시킬 수 있는 컴퓨터로 읽을 수 있는 기록 매체에 있어서,입력되는 모든 샘플링된 음성 벡터에 대하여 하나의 중심값을 설정하는 제 1 단계;모든 클러스터 중 최대 분산을 가지는 클러스터를 검출하는 제 2 단계;상기 최대 분산을 가지는 클러스터의 중심값을 상기 분산을 고려하여 이동시켜 둘로 분할하는 제 3 단계;상기 모든 입력 벡터에 대하여 분할된 각각의 클러스터와의 유클리드 거리를 측정하여 가장 작은 거리를 가지는 클러스터의 멤버 벡터로 집단화하는 제 4 단계; 및상기 각 클러스터의 멤버 벡터를 통하여 클러스터의 중심점을 갱신함으로써, 개인 코드북을 생성하는 제 5 단계;를 포함하는 화자 인식 시스템에 적용되는 개인 코드북 생성 프로그램을 실행시킬 수 있는 컴퓨터로 읽을 수 있는 기록 매체.
- 공통 VQ(Vector Quantization) 코드북을 입력받아 음성 특징 파라미터를 상기 공통 코드북에 벡터 양자화 과정을 수행하여 생성한 관측열로써 HMM(Hidden Markov Model) 확률 모델에 따른 월드 모델을 생성하는 제 1 단계;공통 코드북의 분산값과 비교하여 최적의 임의의 개수의 개인 코드북을 생성하는 제 2 단계;개인 화자의 음성 특징 파라미터를 상기 개인 코드북에 벡터 양자화 과정을 수행하여 생성한 관측열(시퀀스열)로써 HMM 확률 모델에 따른 화자 모델을 생성하는 제 3 단계; 및상기 공통 코드북에 벡터 양자화 과정을 수행하여 생성한 관측열로써 월드 모델과의 비터비 연산을 통하여 확률값을 구하고, 상기 개인 코드북에 벡터 양자화 과정을 수행하여 생성한 관측열로써 개인 화자 모델과의 비터비 연산을 통하여 확률값을 구한 후, 이들의 비값을 개인 사전 문턱치로 설정하는 제 4 단계;를 포함하는 코드북 조합 방식의 VQ/HMM 기법을 이용한 화자 인식 프로그램을 실행시킬 수 있는 컴퓨터로 읽을 수 있는 기록 매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0014491A KR100435440B1 (ko) | 2002-03-18 | 2002-03-18 | 화자간 변별력 향상을 위한 가변 길이 코드북 생성 장치및 그 방법, 그를 이용한 코드북 조합 방식의 화자 인식장치 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0014491A KR100435440B1 (ko) | 2002-03-18 | 2002-03-18 | 화자간 변별력 향상을 위한 가변 길이 코드북 생성 장치및 그 방법, 그를 이용한 코드북 조합 방식의 화자 인식장치 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20030075329A KR20030075329A (ko) | 2003-09-26 |
KR100435440B1 true KR100435440B1 (ko) | 2004-06-10 |
Family
ID=32291626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2002-0014491A KR100435440B1 (ko) | 2002-03-18 | 2002-03-18 | 화자간 변별력 향상을 위한 가변 길이 코드북 생성 장치및 그 방법, 그를 이용한 코드북 조합 방식의 화자 인식장치 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100435440B1 (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100933705B1 (ko) * | 2007-08-17 | 2009-12-24 | 삼성중공업 주식회사 | 계측 시스템의 데이터 필터링 방법 |
KR101616886B1 (ko) * | 2014-09-05 | 2016-04-29 | (주)에스티씨 | 단일 센서의 다중 이벤트 식별 방법 및 장치 |
KR102607373B1 (ko) * | 2016-11-23 | 2023-12-05 | 한국전자통신연구원 | 음성감성 인식 장치 및 방법 |
KR102621897B1 (ko) * | 2018-10-10 | 2024-01-08 | 주식회사 케이티 | 화자 인식 장치 및 그 동작방법 |
KR102546327B1 (ko) * | 2020-12-31 | 2023-06-20 | 주식회사 포스코디엑스 | 클러스터링 기법을 이용하여 얼굴이미지를 비교하는 에지 디바이스 및 이를 포함한 얼굴인증 시스템 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0720889A (ja) * | 1993-06-30 | 1995-01-24 | Omron Corp | 不特定話者の音声認識装置および方法 |
US5598507A (en) * | 1994-04-12 | 1997-01-28 | Xerox Corporation | Method of speaker clustering for unknown speakers in conversational audio data |
JPH0981178A (ja) * | 1995-09-19 | 1997-03-28 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 不特定話者モデル作成装置及び音声認識装置 |
JPH09258769A (ja) * | 1996-03-18 | 1997-10-03 | Seiko Epson Corp | 話者適応化方法および話者適応化装置 |
JPH11175090A (ja) * | 1997-12-10 | 1999-07-02 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 話者クラスタリング処理装置及び音声認識装置 |
KR20010089769A (ko) * | 1999-01-04 | 2001-10-08 | 러셀 비. 밀러 | 음성 신호를 구분 및 인식하기 위한 시스템 및 방법 |
-
2002
- 2002-03-18 KR KR10-2002-0014491A patent/KR100435440B1/ko active IP Right Grant
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0720889A (ja) * | 1993-06-30 | 1995-01-24 | Omron Corp | 不特定話者の音声認識装置および方法 |
US5598507A (en) * | 1994-04-12 | 1997-01-28 | Xerox Corporation | Method of speaker clustering for unknown speakers in conversational audio data |
JPH0981178A (ja) * | 1995-09-19 | 1997-03-28 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 不特定話者モデル作成装置及び音声認識装置 |
JPH09258769A (ja) * | 1996-03-18 | 1997-10-03 | Seiko Epson Corp | 話者適応化方法および話者適応化装置 |
JPH11175090A (ja) * | 1997-12-10 | 1999-07-02 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 話者クラスタリング処理装置及び音声認識装置 |
KR20010089769A (ko) * | 1999-01-04 | 2001-10-08 | 러셀 비. 밀러 | 음성 신호를 구분 및 인식하기 위한 시스템 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20030075329A (ko) | 2003-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6350148B2 (ja) | 話者インデキシング装置、話者インデキシング方法及び話者インデキシング用コンピュータプログラム | |
KR100612840B1 (ko) | 모델 변이 기반의 화자 클러스터링 방법, 화자 적응 방법및 이들을 이용한 음성 인식 장치 | |
CN102509547B (zh) | 基于矢量量化的声纹识别方法及系统 | |
US5893058A (en) | Speech recognition method and apparatus for recognizing phonemes using a plurality of speech analyzing and recognizing methods for each kind of phoneme | |
US6490555B1 (en) | Discriminatively trained mixture models in continuous speech recognition | |
CA2060591C (en) | Speaker-independent label coding apparatus | |
EP0617827B1 (en) | Composite expert | |
US5794190A (en) | Speech pattern recognition using pattern recognizers and classifiers | |
Bansal et al. | Speaker recognition using MFCC, shifted MFCC with vector quantization and fuzzy | |
WO2003015078A1 (en) | Voice registration method and system, and voice recognition method and system based on voice registration method and system | |
US5825977A (en) | Word hypothesizer based on reliably detected phoneme similarity regions | |
Kumar et al. | Comparative analysis of different feature extraction and classifier techniques for speaker identification systems: A review | |
KR20080026951A (ko) | 강인한 원거리 음성 인식 시스템을 위한 음성 인식 방법 | |
KR100435440B1 (ko) | 화자간 변별력 향상을 위한 가변 길이 코드북 생성 장치및 그 방법, 그를 이용한 코드북 조합 방식의 화자 인식장치 및 그 방법 | |
KR20200114705A (ko) | 음성 신호 기반의 사용자 적응형 스트레스 인식 방법 | |
WO2022056898A1 (en) | A deep neural network training method and apparatus for speaker verification | |
Dustor et al. | Influence of feature dimensionality and model complexity on speaker verification performance | |
Dustor et al. | Speaker recognition system with good generalization properties | |
Dustor et al. | Influence of corpus size on speaker verification | |
Zhou et al. | Speaker identification based on adaptive discriminative vector quantisation | |
Sharma et al. | Text-independent speaker identification using backpropagation mlp network classifier for a closed set of speakers | |
Grósz et al. | A Comparative Evaluation of GMM-Free State Tying Methods for ASR. | |
Bennani | Adaptive weighting of pattern features during learning | |
Hadi et al. | A proposed speaker recognition method based on long term voice features and fuzzy logic | |
JP2000122693A (ja) | 話者認識方法および話者認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20020318 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20040517 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20040601 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20040602 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20070604 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20080528 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20090519 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20100527 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20110601 Start annual number: 8 End annual number: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20120529 Start annual number: 9 End annual number: 9 |
|
FPAY | Annual fee payment |
Payment date: 20130531 Year of fee payment: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20130531 Start annual number: 10 End annual number: 10 |
|
FPAY | Annual fee payment |
Payment date: 20140530 Year of fee payment: 11 |
|
PR1001 | Payment of annual fee |
Payment date: 20140530 Start annual number: 11 End annual number: 11 |
|
FPAY | Annual fee payment |
Payment date: 20150430 Year of fee payment: 12 |
|
PR1001 | Payment of annual fee |
Payment date: 20150430 Start annual number: 12 End annual number: 12 |
|
FPAY | Annual fee payment |
Payment date: 20160524 Year of fee payment: 13 |
|
PR1001 | Payment of annual fee |
Payment date: 20160524 Start annual number: 13 End annual number: 13 |
|
FPAY | Annual fee payment |
Payment date: 20170920 Year of fee payment: 14 |
|
PR1001 | Payment of annual fee |
Payment date: 20170920 Start annual number: 14 End annual number: 14 |
|
FPAY | Annual fee payment |
Payment date: 20180731 Year of fee payment: 15 |
|
PR1001 | Payment of annual fee |
Payment date: 20180731 Start annual number: 15 End annual number: 15 |
|
FPAY | Annual fee payment |
Payment date: 20190603 Year of fee payment: 16 |
|
PR1001 | Payment of annual fee |
Payment date: 20190603 Start annual number: 16 End annual number: 16 |
|
PR1001 | Payment of annual fee |
Payment date: 20200803 Start annual number: 17 End annual number: 17 |
|
PR1001 | Payment of annual fee |
Payment date: 20210520 Start annual number: 18 End annual number: 18 |
|
PC1801 | Expiration of term |
Termination date: 20220918 Termination category: Expiration of duration |