KR20070047795A - 벡터 코드북 생성 방법, 데이터 압축 방법 및 장치, 및분산 음성 인식 시스템 - Google Patents
벡터 코드북 생성 방법, 데이터 압축 방법 및 장치, 및분산 음성 인식 시스템 Download PDFInfo
- Publication number
- KR20070047795A KR20070047795A KR1020077004401A KR20077004401A KR20070047795A KR 20070047795 A KR20070047795 A KR 20070047795A KR 1020077004401 A KR1020077004401 A KR 1020077004401A KR 20077004401 A KR20077004401 A KR 20077004401A KR 20070047795 A KR20070047795 A KR 20070047795A
- Authority
- KR
- South Korea
- Prior art keywords
- subsets
- vector
- subset
- additional
- feature
- Prior art date
Links
- 239000013598 vector Substances 0.000 title claims abstract description 303
- 238000000034 method Methods 0.000 title claims abstract description 186
- 238000013144 data compression Methods 0.000 claims abstract description 24
- 238000012545 processing Methods 0.000 claims description 33
- 238000000605 extraction Methods 0.000 claims description 13
- GNFTZDOKVXKIBK-UHFFFAOYSA-N 3-(2-methoxyethoxy)benzohydrazide Chemical compound COCCOC1=CC=CC(C(=O)NN)=C1 GNFTZDOKVXKIBK-UHFFFAOYSA-N 0.000 claims description 12
- 230000001174 ascending effect Effects 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 238000000638 solvent extraction Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 56
- 238000007906 compression Methods 0.000 description 33
- 230000006835 compression Effects 0.000 description 33
- 238000004364 calculation method Methods 0.000 description 22
- 238000005457 optimization Methods 0.000 description 15
- 238000004422 calculation algorithm Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 9
- 239000005441 aurora Substances 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001125 extrusion Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000010845 search algorithm Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000003801 milling Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (34)
- N과 Q가 1보다 큰 양의 정수인, Q개의 특징들을 포함하는 N개의 참조 벡터들의 세트를 포함하는 벡터 코드북에서 시작하여 적은 데이터 압축 계산 노력을 제공하는 벡터 코드북을 생성하는 방법에 있어서,a) 상기 N개의 참조 벡터들의 세트를 상기 N개의 참조 벡터들의 세트의 소정 특징값에 대하여 오름차순 또는 내림차순으로 정렬시키는 단계;b) 상기 정렬된 참조 벡터들의 세트를 서브세트들로 하위분할 하는 단계;c) 상기 소정 특징의 개별적인 임계값을 상기 서브세트 각각에 연관시키는 단계를 포함하는 벡터 코드북 생성 방법.
- 제1항에 있어서,상기 N개의 참조 벡터들의 세트를 추가 분할시키는 단계를 더 포함하며, 상기 추가 분할하는 단계는:d) 상기 N개의 참조 벡터들의 세트의 추가된 소정 특징값에 대하여, 오름차순 또는 내림차순으로 상기 각 서브세트들의 참조 벡터들을 정렬시키는 단계;e) 상기 정렬된 참조 벡터들의 각 서브세트들을 추가 서브세트들로 하위분할하는 단계; 및f) 상기 추가된 소정 특징들에 대하여 개별적인 추가 임계값을 상기 각 추가 서브세트들과 연관시키는 단계를 포함하는 것을 특징으로 하는 벡터 코드북 생성 방법.
- 제2항에 있어서,상기 추가 분할하는 단계는 추가 분할의 이전 실행에서 획득된 추가 서브세트 및, 단계 d) 및 f)를 수행되는 동안, 상기 N개의 참조 벡터의 다른 추가된 소정 특징들을 언제나 서브세트들로 고려하여, 소정 횟수 동안 반복되는 것을 특징으로 하는 벡터 코드북 생성 방법.
- 제1항에 있어서,g) 단계 b)에서 획득된 서브세트들 중 적어도 하나를 인접한 서브세트의 적어도 하나의 참조 벡터로 확장하는 단계를 더 포함하는 벡터 코드북 생성 방법.
- 제4항에 있어서,상기 단계 g)는 상기 단계 a)에서 정렬된 세트의 꼭대기에 있는 상기 단계 b)에 의해 획득된 서브세트를, 상기 단계 b)에서 획득된 서브세트의 바닥에 상기 단계 a)에서 정렬된 세트에서 상기 꼭대기 서브세트의 바로 아래 있는 참조 벡터에 해당하는 적어도 하나의 참조 벡터를 추가하는 것에 의하여 확장함으로써 수행되는 것을 특징으로 하는 벡터 코드북 생성 방법.
- 제4항에 있어서,상기 단계 g)는 상기 단계 a)에서 정렬된 세트의 바닥에 있는 상기 단계 b)에 의해 획득된 서브세트를, 상기 단계 b)에서 획득된 서브세트의 꼭대기에 상기 단계 a)에서 정렬된 세트에서 상기 바닥 서브세트의 바로 위 있는 참조 벡터에 해당하는 적어도 하나의 참조 벡터를 추가하는 것에 의하여, 확장함으로써 수행되는 것을 특징으로 하는 벡터 코드북 생성 방법.
- 제4항에 있어서,상기 단계 g)는 상기 단계 b)에서 획득된 임의의 다른 중간 서브세트들을, 상기 중간 서브세트들의 꼭대기와 바닥에 상기 a)에서 정렬된 세트에서 상기 중간 서브세트들의 바로 위 및 아래에 있는 참조 벡터들에 해당하는 적어도 하나의 참조 벡터들을 추가하는 것에 의하여 수행되는 것을 특징으로 하는 벡터 코드북 생성 방법.
- 제2항에 있어서,상기 단계 b)에서 획득된 서브세트들 중 적어도 하나를, 인접하는 서브세트의 적어도 하나의 참조 벡터로 확장하는 단계 g)를 더 포함하며,상기 단계 d) 및 e)는 상기 단계 g)에 따라 확장된 서브세트들에 대하여 수행되는 것을 특징으로 하는 벡터 코드북 생성 방법.
- 제8항에 있어서,상기 추가 분할 단계는, 단계 e) 후에 상기 e)에서 획득된 추가 서브세트들 중 적어도 하나를 인접하는 추가 서브세트의 적어도 하나의 참조 벡터로 확장하는 단계 h)를 더 포함하는 것을 특징으로 하는 벡터 코드북 생성 방법.
- 제9항에 있어서,상기 단계 h)는 단계 d)에서 정렬되는 해당 확장된 서브세트의 꼭대기에 있는 단계 e)에 의해 획득된 각 추가 서브세트들을, 상기 해당 정렬된 확장된 서브세트에서, 상기 꼭대기 추가 서브세트 바로 아래 있는 참조 벡터에 해당하는 적어도 하나의 참조 벡터들을 그것의 바닥에 추가하는 것에 의하여 확장함으로써 수행되는 것을 특징으로 하는 벡터 코드북 생성 방법.
- 제9항에 있어서,상기 단계 h)는 단계 d)에서 정렬되는 해당 확장된 서브세트의 바닥에 있는 단계 e)에 의해 획득된 각 추가 서브세트들을, 상기 해당 정렬되는 확장된 서브세트에서, 상기 바닥 추가 서브세트 바로 위에 있는 참조 벡터에 해당하는 적어도 하나의 참조 벡터들을 그것의 꼭대기에 추가하는 것에 의하여 확장함으로써 수행되는 것을 특징으로 하는 벡터 코드북 생성 방법.
- 제9항에 있어서,상기 단계 h)는 상기 단계 e)에서 획득된 임의의 다른 중간 추가 서브세트들 을, 상기 단계 d)에서 정렬되는 해당 확장된 서브세트들에서 상기 중간 추가 서브세트들 바로 위 및 아래에 있는 참조 벡터들에 해당하는 적어도 하나의 참조 벡터들을 그것의 꼭대기 및 바닥에 추가하는 것에 의하여 확장함으로써 수행되는 것을 특징으로 하는 벡터 코드북 생성 방법.
- 제3항에 있어서,상기 추가 분할은 상기 단계 e) 후에, 상기 단계 e)에서 획득된 추가 서브세트들 중 적어도 하나를 인접하는 추가 서브세트들의 적어도 하나의 참조 벡터로 확장하는 단계 h)를 더 포함하며,상기 추가 분할 단계는 상기 단계 h)의 이전 수행에 따라 확장된 추가 서브세트들을 언제나 서브세트들로 고려하여 반복되는 것을 특징으로 하는 벡터 코드북 생성 방법.
- 프로그램이 전자 처리 시스템상에서 수행될 때 제1항 내지 제13항 중 어느 한 항에 따른 방법의 단계들을 수행하도록 설계된 프로그램 명령어들을 포함하는 컴퓨터 프로그램.
- 1보다 큰 정수인 Q개의 특징을 갖는 입력 벡터에 의해 표현된 데이터를 압축하는 방법에 있어서,1) 제1항 내지 제13항 중 어느 한 항에 따른 방법에 의해 생성된, 인덱스된 Q-특징 참조 벡터들 및 소정 특징에 대하여 상기 서브세트들과 연관된 임계값들의 서브세트를 포함하는 벡터 코드북을 정의하는 단계;2) 상기 소정 특징에 해당하는 입력 벡터의 특징값을 상기 서브세트들과 연관된 임계값과 점진적으로 비교하는 것에 의하여 상기 서브세트들 사이에서 참조 벡터들의 서브세트를 식별하는 단계; 및3) 상기 단계 2)에서 식별된 서브세트에서, 상기 입력 벡터에 대하여 가장 낮은 왜곡을 제공하는 참조 벡터를 식별하는 단계를 포함하는 데이터 압축 방법.
- 제15항에 있어서,상기 단계 3)은 상기 입력 벡터로부터 최소 거리를 갖는 참조 벡터를 식별하는 것에 의하여 수행되는 것을 특징으로 하는 데이터 압축 방법.
- 제15항에 있어서,상기 단계 3)에서 식별된 참조 벡터의 인덱스를 상기 입력 벡터와 연관시키는 단계를 더 포함하는 것을 특징으로 하는 데이터 압축 방법.
- 제15항에 있어서,상기 단계 1)에서 인덱스된 Q-특징 참조 벡터들의 추가 서브세트들 및 상기 추가된 소정 특징들에 대하여 상기 추가 서브세트들과 연관된 추가 임계값들은 제2항 내지 제13항 중 어느 한 항에 따른 방법에 의하여 생성된 참조 벡터들의 각 서 브세트에 대하여 또한 제공되는 것을 특징으로 하는 데이터 압축 방법.
- 제18항에 있어서,상기 단계 2)에서 식별된 서브세트에 해당하는 추가 서브세트들 사이에서, 상기 추가된 소정 특징에 해당하는 입력 벡터의 추가 특징값을 상기 추가 서브세트들과 연관된 추가 임계값들과 점진적으로 비교하는 것에 의하여 추가 서브세트들을 식별하는 단계 4)를 더 포함하며,상기 단계 3)은 상기 단계 4)에서 식별된 추가 서브세트 내에서 수행되는 것을 특징으로 하는 데이터 압축 방법.
- 제15항에 있어서,상기 단계 1)에서 제4항 내지 제13항 중 어느 한 항에 따른 방법의 단계 g)에 의해 생성된 확장된 서브세트들이 제공되고, 상기 단계 2) 및 3)은 상기 확장된 서브세트들에 대하여 수행되는 것을 특징으로 하는 데이터 압축 방법.
- 제19항에 있어서,상기 단계 1에서 제9항 내지 제13항 중 어느 한 항에 따른 방법의 단계 h)에 의해 생성된 확장된 추가 서브세트들이 제공되고, 상기 단계 4) 및 3)은 상기 확장된 추가 서브세트들에 대하여 수행되는 것을 특징으로 하는 데이터 압축 방법.
- 프로그램이 전자 처리 시스템상에서 수행될 때 제15항 내지 제21항 중 어느 한 항에 따른 방법의 단계들을 수행하도록 설계된 프로그램 명령어들을 포함하는 컴퓨터 프로그램.
- 1보다 큰 정수인 Q-특징 벡터들을 제공하도록 디지털 입력 데이터를 처리하기 위한 특징 추출 유닛(802);정렬되고 인덱스된 Q-특징 참조 벡터들의 소정 서브세트들 및 상기 소정 서브세트들과 관련된 소정 임계값들을 포함하는 적어도 하나의 벡터 코드북을 저장하기 위한 메모리 유닛(806);상기 특징 추출 유닛(802)에 의해 제공된 각 입력 Q-특징 벡터들에 대하여, 상기 입력 벡터의 소정 특징을 상기 소정 임계값들과 비교하는 것에 의하여 상기 소정 서브세트들 중 하나를 식별하고; 상기 식별된 서브세트 내에서, 상기 입력 특징 벡터에 대하여 가장 낮은 왜곡을 제공하는 참조 벡터를 식별하는 데이터 압축 유닛(804)을 포함하는 데이터 압축 장치.
- 제23항에 있어서,상기 데이터 압축 유닛(804)은 상기 가장 낮은 왜곡을 제공하는 참조 벡터의 인덱스를 상기 입력 Q-특징 벡터와 연관시키도록 설계된 것을 특징으로 하는 데이터 압축 장치.
- 제23항에 있어서,상기 데이터 압축 유닛(804)은 제15항 내지 제21항 중 어느 한 항에 따른 방법의 단계들을 수행하도록 설계된 것을 특징으로 하는 데이터 압축 장치.
- 제23항에 있어서,상기 메모리 유닛(806)은 제1항 내지 제13항 중 어느 한 항에 따른 방법에 의해 생성된 상기 정렬되고 인덱스된 Q-특징 참조 벡터들의 서브세트, 상기 임계값 및 임의의 추가 임계값을 저장하도록 설계되는 것을 특징으로 하는 데이터 압축 장치.
- 제23항에 있어서,상기 메모리 유닛(806)은 제1항 내지 제13항 중 어느 한 항에 따른 방법에 의해 생성된 상기 정렬되고 인덱스된 Q-특징 참조 벡터들의 추가 서브세트들, 임계값들 및 모든 추가 임계값들을 저장하도록 설계된 것을 특징으로 하는 데이터 압축 장치.
- 제23항에 있어서,제1항 내지 제13항 중 어느 한 항에 따른 방법의 단계들을 수행하고 상기 방법에 의해 생성된 추가 서브세트들, 임계값들 및 임의의 추가 임계값들을 상기 메모리 유닛(806)에 저장하도록 설계된 코드북 처리 유닛을 더 포함하는 데이터 압축 장치.
- 제23항에 있어서,제1항 내지 제13항 중 어느 한 항에 따른 방법의 단계들을 수행하고 상기 방법에 의해 생성된 추가 서브세트들, 임계값들 및 모든 추가 임계값들을 상기 메모리 유닛(806)에 저장하도록 설계된 코드북 처리 유닛을 더 포함하는 데이터 압축 장치.
- 제23항에 있어서,입력 음성 신호를 디지털 음성 데이터로 변환하고 상기 변환된 디지털 음성 데이터를 상기 특징 추출 유닛(802)으로 제공하기 위한 변환 유닛(801)을 더 포함하는 데이터 압축 장치.
- 제23항 내지 제30항 중 임의의 한 항에 따른 사용자 장치(810);디지털 입력 데이터를 복원하기 위한 인식 장치(820); 및상기 사용자 장치(810) 및 인식 장치(820) 사이의 데이터 전송을 위한 전송 채널(805)을 포함하는 분산 음성 인식 시스템.
- 제31항에 있어서,상기 사용자 장치(810)는 상기 인식 장치(820)로 입력 Q-특징 벡터들에게 가 장 낮은 왜곡을 제공하는 참조 벡터들의 인덱스를 전송하도록 설계된 것을 특징으로 하는 분산 음성 인식 시스템.
- 제31항에 있어서,제1항 내지 제13항 중 어느 한 항에 따른 방법의 단계들을 수행하고 상기 방법에 의해 생성된 서브세트들, 임계값들 및 임의의 추가 임계값들을 상기 메모리 유닛(806)에 저장하도록 설계된 코드북 처리 유닛을 더 포함하는 분산 음성 인식 시스템.
- 제31항에 있어서,제1항 내지 제13항 중 어느 한 항에 따른 방법의 단계들을 수행하고 상기 방법에 의해 생성된 추가 서브세트들, 임계값들 및 모든 추가 임계값들을 상기 메모리 유닛(806)에 저장하도록 설계된 코드북 처리 유닛을 더 포함하는 분산 음성 인식 시스템.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2004/008372 WO2006007871A1 (en) | 2004-07-23 | 2004-07-23 | Method for generating a vector codebook, method and device for compressing data, and distributed speech recognition system |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070047795A true KR20070047795A (ko) | 2007-05-07 |
KR101010585B1 KR101010585B1 (ko) | 2011-01-24 |
Family
ID=34958455
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077004401A KR101010585B1 (ko) | 2004-07-23 | 2004-07-23 | 벡터 코드북 생성 방법, 데이터 압축 방법 및 장치, 및분산 음성 인식 시스템 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8214204B2 (ko) |
EP (1) | EP1771841B1 (ko) |
JP (1) | JP4703648B2 (ko) |
KR (1) | KR101010585B1 (ko) |
CN (1) | CN101019171B (ko) |
AT (1) | ATE464635T1 (ko) |
DE (1) | DE602004026645D1 (ko) |
WO (1) | WO2006007871A1 (ko) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7587314B2 (en) * | 2005-08-29 | 2009-09-08 | Nokia Corporation | Single-codebook vector quantization for multiple-rate applications |
US20070299667A1 (en) * | 2006-06-22 | 2007-12-27 | Texas Instruments, Incorporated | System and method for reducing storage requirements for a model containing mixed weighted distributions and automatic speech recognition model incorporating the same |
CN101335004B (zh) * | 2007-11-02 | 2010-04-21 | 华为技术有限公司 | 一种多级量化的方法及装置 |
GB0901262D0 (en) * | 2009-01-26 | 2009-03-11 | Mitsubishi Elec R&D Ct Europe | Video identification |
KR101711158B1 (ko) * | 2010-12-22 | 2017-03-14 | 한국전자통신연구원 | 셀룰러 시스템에서 인접 셀간 간섭 제어 방법 |
US9779731B1 (en) * | 2012-08-20 | 2017-10-03 | Amazon Technologies, Inc. | Echo cancellation based on shared reference signals |
US10147441B1 (en) | 2013-12-19 | 2018-12-04 | Amazon Technologies, Inc. | Voice controlled system |
CN103837890B (zh) * | 2014-02-26 | 2016-07-06 | 中国石油集团川庆钻探工程有限公司地球物理勘探公司 | 获取地震数据的方法及设备 |
US9930186B2 (en) * | 2015-10-14 | 2018-03-27 | Pindrop Security, Inc. | Call detail record analysis to identify fraudulent activity |
CN107564535B (zh) * | 2017-08-29 | 2020-09-01 | 中国人民解放军理工大学 | 一种分布式低速语音通话方法 |
US11470194B2 (en) | 2019-08-19 | 2022-10-11 | Pindrop Security, Inc. | Caller verification via carrier metadata |
CN112445943A (zh) * | 2019-09-05 | 2021-03-05 | 阿里巴巴集团控股有限公司 | 数据处理的方法、装置和系统 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4958225A (en) | 1989-06-09 | 1990-09-18 | Utah State University Foundation | Full-search-equivalent method for matching data and a vector quantizer utilizing such method |
US5061924B1 (en) | 1991-01-25 | 1996-04-30 | American Telephone & Telegraph | Efficient vector codebook |
US5651026A (en) * | 1992-06-01 | 1997-07-22 | Hughes Electronics | Robust vector quantization of line spectral frequencies |
JP3093879B2 (ja) * | 1992-07-27 | 2000-10-03 | オリンパス光学工業株式会社 | ベクトル量子化コードブック作成及び探索装置 |
US5774839A (en) * | 1995-09-29 | 1998-06-30 | Rockwell International Corporation | Delayed decision switched prediction multi-stage LSF vector quantization |
GB9622055D0 (en) * | 1996-10-23 | 1996-12-18 | Univ Strathclyde | Vector quantisation |
US6009387A (en) * | 1997-03-20 | 1999-12-28 | International Business Machines Corporation | System and method of compression/decompressing a speech signal by using split vector quantization and scalar quantization |
US6161086A (en) * | 1997-07-29 | 2000-12-12 | Texas Instruments Incorporated | Low-complexity speech coding with backward and inverse filtered target matching and a tree structured mutitap adaptive codebook search |
US5946653A (en) | 1997-10-01 | 1999-08-31 | Motorola, Inc. | Speaker independent speech recognition system and method |
US6067515A (en) * | 1997-10-27 | 2000-05-23 | Advanced Micro Devices, Inc. | Split matrix quantization with split vector quantization error compensation and selective enhanced processing for robust speech recognition |
US5966688A (en) * | 1997-10-28 | 1999-10-12 | Hughes Electronics Corporation | Speech mode based multi-stage vector quantizer |
US6148283A (en) * | 1998-09-23 | 2000-11-14 | Qualcomm Inc. | Method and apparatus using multi-path multi-stage vector quantizer |
US6389389B1 (en) | 1998-10-13 | 2002-05-14 | Motorola, Inc. | Speech recognition using unequally-weighted subvector error measures for determining a codebook vector index to represent plural speech parameters |
US7389227B2 (en) * | 2000-01-14 | 2008-06-17 | C & S Technology Co., Ltd. | High-speed search method for LSP quantizer using split VQ and fixed codebook of G.729 speech encoder |
JP3483513B2 (ja) * | 2000-03-02 | 2004-01-06 | 沖電気工業株式会社 | 音声録音再生装置 |
JP3367931B2 (ja) | 2000-03-06 | 2003-01-20 | 日本電信電話株式会社 | 共役構造ベクトル量子化方法 |
US6633839B2 (en) * | 2001-02-02 | 2003-10-14 | Motorola, Inc. | Method and apparatus for speech reconstruction in a distributed speech recognition system |
US7003454B2 (en) * | 2001-05-16 | 2006-02-21 | Nokia Corporation | Method and system for line spectral frequency vector quantization in speech codec |
CN1190772C (zh) * | 2002-09-30 | 2005-02-23 | 中国科学院声学研究所 | 语音识别系统及用于语音识别系统的特征矢量集的压缩方法 |
US20040176950A1 (en) * | 2003-03-04 | 2004-09-09 | Docomo Communications Laboratories Usa, Inc. | Methods and apparatuses for variable dimension vector quantization |
-
2004
- 2004-07-23 KR KR1020077004401A patent/KR101010585B1/ko active IP Right Grant
- 2004-07-23 JP JP2007521800A patent/JP4703648B2/ja not_active Expired - Fee Related
- 2004-07-23 EP EP04763512A patent/EP1771841B1/en not_active Not-in-force
- 2004-07-23 US US11/658,090 patent/US8214204B2/en active Active
- 2004-07-23 DE DE602004026645T patent/DE602004026645D1/de active Active
- 2004-07-23 CN CN2004800439812A patent/CN101019171B/zh not_active Expired - Fee Related
- 2004-07-23 WO PCT/EP2004/008372 patent/WO2006007871A1/en active Application Filing
- 2004-07-23 AT AT04763512T patent/ATE464635T1/de not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
WO2006007871A8 (en) | 2006-03-16 |
ATE464635T1 (de) | 2010-04-15 |
JP4703648B2 (ja) | 2011-06-15 |
EP1771841A1 (en) | 2007-04-11 |
JP2008507718A (ja) | 2008-03-13 |
CN101019171A (zh) | 2007-08-15 |
WO2006007871A1 (en) | 2006-01-26 |
KR101010585B1 (ko) | 2011-01-24 |
DE602004026645D1 (de) | 2010-05-27 |
US8214204B2 (en) | 2012-07-03 |
EP1771841B1 (en) | 2010-04-14 |
CN101019171B (zh) | 2011-08-10 |
US20090037172A1 (en) | 2009-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4837831A (en) | Method for creating and using multiple-word sound models in speech recognition | |
EP0085543B1 (en) | Speech recognition apparatus | |
KR0143076B1 (ko) | 다중-요소 신호 코딩 방법 및 장치 | |
US4718093A (en) | Speech recognition method including biased principal components | |
JP3412496B2 (ja) | 話者適応化装置と音声認識装置 | |
KR101010585B1 (ko) | 벡터 코드북 생성 방법, 데이터 압축 방법 및 장치, 및분산 음성 인식 시스템 | |
KR20060129417A (ko) | 차원 벡터 및 가변 분해능 양자화 | |
EP1141939A1 (en) | System and method for segmentation and recognition of speech signals | |
CN110931045A (zh) | 基于卷积神经网络的音频特征生成方法 | |
KR102204975B1 (ko) | 심층 신경망 기반 음성인식 방법 및 그 장치 | |
CN114512112A (zh) | 语音合成模型的训练方法、装置、电子设备和存储介质 | |
CN112885367B (zh) | 基频获取方法、装置、计算机设备和存储介质 | |
CN114171043A (zh) | 回声的确定方法、装置、设备以及存储介质 | |
JP2973805B2 (ja) | 標準パターン作成装置 | |
JP3029803B2 (ja) | 音声認識のための単語モデル生成装置及び音声認識装置 | |
JP3091648B2 (ja) | 隠れマルコフモデルの学習方法 | |
JP2734828B2 (ja) | 確率演算装置及び確率演算方法 | |
Srikotr et al. | Sub-band Vector Quantized Variational AutoEncoder for Spectral Envelope Quantization | |
JP2023079258A (ja) | 音抽出システム及び音抽出方法 | |
EP0139642A1 (en) | SPEECH RECOGNITION METHODS AND DEVICES. | |
Curatelli et al. | Competitive learning methods for efficient vector quantizations in a speech recognition environment | |
JP2000181486A (ja) | 学習装置および学習方法、認識装置および認識方法、並びに記録媒体 | |
CN115188362A (zh) | 语音合成模型生成方法及其装置、设备、介质、产品 | |
Guo et al. | A Chinese Speech Recognition System Based on Binary Neural Network and Pre-processing | |
JP5188913B2 (ja) | 量子化装置、量子化方法、逆量子化装置、逆量子化方法、音声音響符号化装置および音声音響復号装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20140107 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20150106 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20160108 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20170111 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20180105 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20190108 Year of fee payment: 9 |