KR20080055026A - 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를이용한 오디오 신호의 부호화/복호화 방법 및 장치 - Google Patents
오디오 신호의 부호화 모드 결정 방법 및 장치와 이를이용한 오디오 신호의 부호화/복호화 방법 및 장치 Download PDFInfo
- Publication number
- KR20080055026A KR20080055026A KR1020060127844A KR20060127844A KR20080055026A KR 20080055026 A KR20080055026 A KR 20080055026A KR 1020060127844 A KR1020060127844 A KR 1020060127844A KR 20060127844 A KR20060127844 A KR 20060127844A KR 20080055026 A KR20080055026 A KR 20080055026A
- Authority
- KR
- South Korea
- Prior art keywords
- frame
- mode
- encoding mode
- term
- long
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 118
- 238000000034 method Methods 0.000 title claims abstract description 64
- 230000007774 longterm Effects 0.000 claims abstract description 106
- 230000003595 spectral effect Effects 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000010586 diagram Methods 0.000 description 33
- 239000006185 dispersion Substances 0.000 description 25
- 230000006835 compression Effects 0.000 description 13
- 238000007906 compression Methods 0.000 description 13
- 230000001186 cumulative effect Effects 0.000 description 11
- 238000010606 normalization Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 230000036039 immunity Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (20)
- 오디오 신호의 부호화 모드 결정 방법에 있어서,(a) 상기 오디오 신호를 프레임 단위로 분석하여 상기 분석된 프레임에 대한 단구간 특성과 장구간 특성을 생성하는 단계;(b) 상기 생성된 장구간 특성에 따라 부호화 모드를 결정하고자 하는 프레임에 대한 모드 결정 기준값을 적응적으로 조절하는 단계; 및(c) 상기 장구간 특성과 적응적으로 조절된 모드 결정 기준값을 이용하여 상기 부호화 모드를 결정하고자 하는 프레임의 부호화 모드를 결정하는 단계를 포함하는 오디오 신호의 부호화 모드 결정 방법.
- 제1항에 있어서,상기 부호화 모드를 결정하고자 하는 프레임의 장구간 특성과 소정의 임계값을 비교하는 단계를 더 포함하고, 상기 (b) 단계는 상기 비교 결과에 따라 모드 결정 기준 값을 적응적으로 조절하는 것을 특징으로 하는 오디오 신호의 부호화 모드 결정 방법.
- 제1항에 있어서,상기 장구간 특성을 생성하는 것은 상기 부호화 모드를 결정하고자 하는 프레임에 선행하는 소정 개수의 프레임에 따른 단구간 특성의 평균과 상기 부호화 모 드를 결정하고자 하는 프레임에 따른 단구간 특성간의 차분값을 이용하여 생성하는 것을 특징으로 하는 오디오 신호의 부호화 모드 결정 방법.
- 제1항에 있어서,상기 부호화 모드를 결정하고자 하는 프레임의 장구간 특성과 소정의 임계값을 비교하는 단계를 더 포함하고, 상기 (b) 단계는 상기 비교 결과와 상기 부호화 모드를 결정하고자 하는 프레임에 선행하는 프레임이 갖는 부호화 모드에 따라 모드 결정 기준 값을 적응적으로 조절하는 것을 특징으로 하는 오디오 신호의 부호화 모드 결정 방법.
- 제4항에 있어서,상기 (b) 단계는 상기 장구간 특성과 소정의 임계값의 비교 결과 상기 장구간 특성 만으로는 프레임의 부호화 모드를 결정하기 어려운 경우, 상기 부호화 모드를 결정하고자 하는 프레임의 부호화 모드가 상기 프레임에 선행하는 프레임의 부호화 모드와 동일한 모드로 결정되는 가능성이 높아지도록 상기 모드 결정 파라미터를 조절하는 것임을 특징으로 하는 오디오 신호의 부호화 모드 결정 방법.
- 제1항에 있어서,상기 (c) 단계는 모드를 결정하고자 하는 프레임의 단구간 특성과 상기 조절된 모드 결정 기준값의 대소 비교를 통해 상기 프레임의 모드를 결정하는 것을 특 징으로 하는 오디오 신호의 부호화 모드 결정 방법.
- 제2항에 있어서,상기 장구간 특성을 생성하는 것은 상기 차분값이 소정의 기준값 보다 클 경우에는 부호화 모드를 결정하고자 하는 프레임에 대한 차분값과 상기 프레임에 선행하는 프레임에 대한 차분값에 각각 양(+)의 가중치를 부여하고, 가중치가 부여된 차분값 들을 합산하는 계산을 수행하여 생성하거나,상기 차분값이 소정의 기준값 보다 작을 경우에는 상기 부호화 모드를 결정하고자 하는 프레임에 대한 차이값에는 음(-)의 가중치를 부여하고, 선행하는 프레임에 대한 차이값에 양(+)의 가중치를 부여하여 상기 가중치가 부여된 차이값을 합산하는 계산을 수행하거나 또는 선행하는 프레임에 따른 장구간 특성을 감소시키는 계산을 수행하여 생성하는 것을 특징으로 하는 오디오 신호의 부호화 모드 결정 방법.
- 제1항에 있어서,상기 (c) 단계의 부호화 모드는 주파수 영역 부호화 모드와 시간 영역 부호화 모드 중 어느 하나의 모드이거나, 음악 부호화 모드와 음성 부호화 모드 중 어느 하나의 모드인 것을 특징으로 하는 오디오 신호의 부호화 모드 결정 방법.
- 제1항에 있어서,상기 단구간 특성은 단기/장기 예측 이득, 스펙트럼 틸트 및 영점 교차율로 이루어진 군으로부터 선택되는 1종 이상인 것을 특징으로 하는 오디오 신호의 부호화 모드 결정 방법.
- 제1항 내지 제9항 중 어느 한 항의 오디오 신호의 부호화 모드 결정 방법을 컴퓨터 또는 네트워크 상에서 수행하기 위한 프로그램이 기록된 컴퓨터에서 판독 가능한 기록 매체.
- 제1항 내지 제9항 중 어느 한 항의 오디오 신호의 부호화 모드 결정 방법에 의해 결정된 오디오 신호의 부호화 모드에 따라 오디오 신호를 프레임 별로 음성 부호화 또는 오디오 부호화함으로써 부호화된 신호를 생성하는 단계; 및상기 부호화된 신호에 대한 비트스트림 처리를 통해 비트스트림을 생성하는 단계를 포함하는 오디오 신호의 부호화 방법.
- 제11항에 있어서, 상기 생성된 비트스트림은 각각의 프레임의 부호화 모드에 대한 모드 정보를 더 포함하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
- 제1항 내지 제9항 중 어느 한 항의 오디오 신호의 부호화 모드 결정 방법에 따라 결정된 오디오 신호의 부호화 모드에 따라, 오디오 신호를 시간 영역에서 부호화하거나 또는 주파수 영역에서 부호화하여 부호화된 신호를 생성하는 단계 ; 및상기 부호화된 신호에 대한 비트스트림 처리를 통해 비트스트림을 생성하는 단계를 포함하는 오디오 신호의 부호화 방법.
- 오디오 신호를 프레임 단위로 분석하여 단구간 특성을 생성하는 단구간 특성 생성부;상기 단구간 특성을 이용하여 장구간 특성을 생성하는 장구간 특성 생성부;상기 장구간 특성을 이용하여 부호화 모드를 판단하고자 하는 프레임의 모드 결정 기준 값을 적응적으로 조절하는 모드 결정 기준값 조절부; 및상기 적응적으로 조절된 모드 결정 기준값을 이용하여 상기 부호화 모드를 판단하고자 하는 프레임의 부호화 모드를 결정하는 부호화 모드 결정부를 포함하는 오디오 신호의 부호화 모드 결정 장치.
- 제14항에 있어서,상기 부호화 모드를 결정하고자 하는 프레임의 장구간 특성과 소정의 임계값을 비교하는 장구간 특성 비교부를 더 포함하고,상기 모드 결정 기준값 조절부는 상기 모드를 결정하고자 하는 프레임에 선행하는 프레임의 장구간 특성과 상기 장구간 특성 비교부의 비교 결과를 이용하여 부호화 모드를 결정하는 것을 특징으로 하는 오디오 신호의 부호화 모드 결정 장치.
- 제14항에 있어서,상기 장구간 특성 생성부는 부호화 모드를 결정하고자 하는 프레임에 선행하는 소정 개수의 프레임에 따른 단구간 특성을 이용하여 제1 장구간 특성을 생성하는 제1 장구간 특성 생성부; 및상기 제1 장구간 특성 생성부로부터 생성된 제1 장구간 특성과 부호화 모드를 결정하고자 하는 프레임과 상기 프레임에 선행하는 각각의 프레임에 대한 장구간 특성 들을 이용하여 제2 장구간 특성을 생성하는 제2 장구간 특성 생성부를 더 포함하고,상기 모드 결정 기준값 조절부는 상기 제2 장구간 특성 생성부로부터 생성된 제2 장구간 특성을 이용하여 부호화 모드를 결정하고자 하는 프레임의 모드 결정 기준값을 적응적으로 조절하는 것을 특징으로 하는 오디오 신호의 부호화 모드 결정 장치.
- 제14항에 있어서,상기 단구간 특성 생성부는 LP-LTP 이득 생성부, 스펙트럼 틸트 생성부 및 영점 교차율 생성부로 이루어진 군으로부터 하나 이상을 포함하는 것을 특징으로 하는 오디오 신호의 부호화 모드 결정 장치.
- 오디오 신호를 프레임 단위로 분석하여 단구간 특성을 생성하는 단구간 특성 생성부;상기 단구간 특성을 이용하여 장구간 특성을 생성하는 장구간 특성 생성부;상기 장구간 특성을 이용하여 부호화 모드를 판단하고자 하는 프레임의 모드 결정 기준 값을 적응적으로 조절하는 모드 결정 기준값 조절부;상기 적응적으로 조절된 모드 결정 기준값을 이용하여 상기 부호화 모드를 판단하고자 하는 프레임의 부호화 모드를 결정하는 부호화 모드 결정부;상기 결정된 부호화 모드에 따라 오디오 신호를 프레임 별로 음성 부호화하는 주파수 영역에서 부호화하거나 시간 영역에서 부호화하는 부호화부; 및상기 부호화된 신호에 대한 비트스트림 처리를 통해 비트스트림을 생성하는 비트스트림 생성부를 포함하는 오디오 신호의 부호화 장치.
- 오디오 신호에 대한 장구간 특성을 이용하여 부호화 모드가 적응적으로 결정된 프레임별 부호화 모드 정보를 포함하는 비트스트림을 수신하는 단계;상기 수신된 비트스트림에 포함된 부호화 모드 정보에 따라 수신된 디지털 정보의 복호화 모드를 결정하는 단계; 및상기 결정된 복호화 모드에 따라 상기 수신된 디지털 정보를 복호화하는 단계를 포함하는 오디오 신호의 복호화 방법.
- 오디오 신호에 대한 장구간 특성을 이용하여 부호화 모드가 적응적으로 결정된 프레임별 부호화 모드 정보를 포함하는 비트 스트림을 수신하는 수신부;상기 수신된 비트스트림에 따라 수신된 디지털 정보의 복호화 모드를 결정하 는 복호화 모드 결정부; 및상기 결정된 복호화 모드에 따라 상기 수신된 디지털 정보를 복호화부를 포함하는 오디오 신호의 복호화 장치.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060127844A KR100964402B1 (ko) | 2006-12-14 | 2006-12-14 | 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치 |
US11/939,074 US20080147414A1 (en) | 2006-12-14 | 2007-11-13 | Method and apparatus to determine encoding mode of audio signal and method and apparatus to encode and/or decode audio signal using the encoding mode determination method and apparatus |
EP20070851482 EP2102859A4 (en) | 2006-12-14 | 2007-12-13 | METHOD AND APPARATUS FOR DETERMINING THE AUDIO SIGNAL ENCODING MODE AND METHOD AND APPARATUS FOR ENCODING AND / OR DECODING AN AUDIO SIGNAL USING THE ENCODING MODE DETERMINING METHOD AND APPARATUS |
PCT/KR2007/006511 WO2008072913A1 (en) | 2006-12-14 | 2007-12-13 | Method and apparatus to determine encoding mode of audio signal and method and apparatus to encode and/or decode audio signal using the encoding mode determination method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060127844A KR100964402B1 (ko) | 2006-12-14 | 2006-12-14 | 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080055026A true KR20080055026A (ko) | 2008-06-19 |
KR100964402B1 KR100964402B1 (ko) | 2010-06-17 |
Family
ID=39511882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060127844A KR100964402B1 (ko) | 2006-12-14 | 2006-12-14 | 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20080147414A1 (ko) |
EP (1) | EP2102859A4 (ko) |
KR (1) | KR100964402B1 (ko) |
WO (1) | WO2008072913A1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150055035A (ko) * | 2012-09-18 | 2015-05-20 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 낮은 또는 중간 비트 레이트에 대한 인지 품질에 기반한 오디오 분류 |
KR20150087226A (ko) * | 2012-11-13 | 2015-07-29 | 삼성전자주식회사 | 부호화 모드 결정방법 및 장치, 오디오 부호화방법 및 장치와, 오디오 복호화방법 및 장치 |
US9355646B2 (en) | 2008-07-14 | 2016-05-31 | Samsung Electronics Co., Ltd. | Method and apparatus to encode and decode an audio/speech signal |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2007331763B2 (en) | 2006-12-12 | 2011-06-30 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream |
KR100883656B1 (ko) * | 2006-12-28 | 2009-02-18 | 삼성전자주식회사 | 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치 |
WO2009051404A2 (en) * | 2007-10-15 | 2009-04-23 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
US20090150144A1 (en) * | 2007-12-10 | 2009-06-11 | Qnx Software Systems (Wavemakers), Inc. | Robust voice detector for receive-side automatic gain control |
EP2269188B1 (en) * | 2008-03-14 | 2014-06-11 | Dolby Laboratories Licensing Corporation | Multimode coding of speech-like and non-speech-like signals |
KR20100006492A (ko) * | 2008-07-09 | 2010-01-19 | 삼성전자주식회사 | 부호화 방식 결정 방법 및 장치 |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
PL2301011T3 (pl) * | 2008-07-11 | 2019-03-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób i dyskryminator do klasyfikacji różnych segmentów sygnału audio zawierającego segmenty mowy i muzyki |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
KR101381513B1 (ko) | 2008-07-14 | 2014-04-07 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
KR101261677B1 (ko) | 2008-07-14 | 2013-05-06 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
US9037474B2 (en) | 2008-09-06 | 2015-05-19 | Huawei Technologies Co., Ltd. | Method for classifying audio signal into fast signal or slow signal |
EP2490214A4 (en) * | 2009-10-15 | 2012-10-24 | Huawei Tech Co Ltd | METHOD, DEVICE AND SYSTEM FOR SIGNAL PROCESSING |
CN102237085B (zh) * | 2010-04-26 | 2013-08-14 | 华为技术有限公司 | 音频信号的分类方法及装置 |
IL205394A (en) * | 2010-04-28 | 2016-09-29 | Verint Systems Ltd | A system and method for automatically identifying a speech encoding scheme |
CA2958360C (en) | 2010-07-02 | 2017-11-14 | Dolby International Ab | Audio decoder |
US9111531B2 (en) * | 2012-01-13 | 2015-08-18 | Qualcomm Incorporated | Multiple coding mode signal classification |
TWI615834B (zh) * | 2013-05-31 | 2018-02-21 | Sony Corp | 編碼裝置及方法、解碼裝置及方法、以及程式 |
PT3011561T (pt) | 2013-06-21 | 2017-07-25 | Fraunhofer Ges Forschung | Aparelho e método para desvanecimento de sinal aperfeiçoado em diferentes domínios durante ocultação de erros |
CN104282315B (zh) * | 2013-07-02 | 2017-11-24 | 华为技术有限公司 | 音频信号分类处理方法、装置及设备 |
CN105096958B (zh) | 2014-04-29 | 2017-04-12 | 华为技术有限公司 | 音频编码方法及相关装置 |
FR3020732A1 (fr) * | 2014-04-30 | 2015-11-06 | Orange | Correction de perte de trame perfectionnee avec information de voisement |
CN107424621B (zh) | 2014-06-24 | 2021-10-26 | 华为技术有限公司 | 音频编码方法和装置 |
US9886963B2 (en) * | 2015-04-05 | 2018-02-06 | Qualcomm Incorporated | Encoder selection |
US11166101B2 (en) * | 2015-09-03 | 2021-11-02 | Dolby Laboratories Licensing Corporation | Audio stick for controlling wireless speakers |
KR101728047B1 (ko) | 2016-04-27 | 2017-04-18 | 삼성전자주식회사 | 부호화 방식 결정 방법 및 장치 |
US10504539B2 (en) * | 2017-12-05 | 2019-12-10 | Synaptics Incorporated | Voice activity detection systems and methods |
JP7407580B2 (ja) | 2018-12-06 | 2024-01-04 | シナプティクス インコーポレイテッド | システム、及び、方法 |
US11257512B2 (en) | 2019-01-07 | 2022-02-22 | Synaptics Incorporated | Adaptive spatial VAD and time-frequency mask estimation for highly non-stationary noise sources |
US11064294B1 (en) | 2020-01-10 | 2021-07-13 | Synaptics Incorporated | Multiple-source tracking and voice activity detections for planar microphone arrays |
US11823707B2 (en) | 2022-01-10 | 2023-11-21 | Synaptics Incorporated | Sensitivity mode for an audio spotting system |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06332492A (ja) * | 1993-05-19 | 1994-12-02 | Matsushita Electric Ind Co Ltd | 音声検出方法および検出装置 |
TW271524B (ko) * | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
US5778335A (en) * | 1996-02-26 | 1998-07-07 | The Regents Of The University Of California | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding |
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
DE69926821T2 (de) * | 1998-01-22 | 2007-12-06 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen |
JP3273599B2 (ja) * | 1998-06-19 | 2002-04-08 | 沖電気工業株式会社 | 音声符号化レート選択器と音声符号化装置 |
US6604070B1 (en) * | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
US6785645B2 (en) | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
US7613606B2 (en) | 2003-10-02 | 2009-11-03 | Nokia Corporation | Speech codecs |
GB0408856D0 (en) * | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
US7739120B2 (en) | 2004-05-17 | 2010-06-15 | Nokia Corporation | Selection of coding models for encoding an audio signal |
-
2006
- 2006-12-14 KR KR1020060127844A patent/KR100964402B1/ko not_active IP Right Cessation
-
2007
- 2007-11-13 US US11/939,074 patent/US20080147414A1/en active Granted
- 2007-12-13 EP EP20070851482 patent/EP2102859A4/en not_active Ceased
- 2007-12-13 WO PCT/KR2007/006511 patent/WO2008072913A1/en active Application Filing
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9355646B2 (en) | 2008-07-14 | 2016-05-31 | Samsung Electronics Co., Ltd. | Method and apparatus to encode and decode an audio/speech signal |
US9728196B2 (en) | 2008-07-14 | 2017-08-08 | Samsung Electronics Co., Ltd. | Method and apparatus to encode and decode an audio/speech signal |
KR20150055035A (ko) * | 2012-09-18 | 2015-05-20 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 낮은 또는 중간 비트 레이트에 대한 인지 품질에 기반한 오디오 분류 |
US9589570B2 (en) | 2012-09-18 | 2017-03-07 | Huawei Technologies Co., Ltd. | Audio classification based on perceptual quality for low or medium bit rates |
US10283133B2 (en) | 2012-09-18 | 2019-05-07 | Huawei Technologies Co., Ltd. | Audio classification based on perceptual quality for low or medium bit rates |
US11393484B2 (en) | 2012-09-18 | 2022-07-19 | Huawei Technologies Co., Ltd. | Audio classification based on perceptual quality for low or medium bit rates |
KR20150087226A (ko) * | 2012-11-13 | 2015-07-29 | 삼성전자주식회사 | 부호화 모드 결정방법 및 장치, 오디오 부호화방법 및 장치와, 오디오 복호화방법 및 장치 |
KR20220132662A (ko) * | 2012-11-13 | 2022-09-30 | 삼성전자주식회사 | 부호화 모드 결정방법 및 장치, 오디오 부호화방법 및 장치와, 오디오 복호화방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
WO2008072913A1 (en) | 2008-06-19 |
US20080147414A1 (en) | 2008-06-19 |
KR100964402B1 (ko) | 2010-06-17 |
EP2102859A1 (en) | 2009-09-23 |
EP2102859A4 (en) | 2011-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100964402B1 (ko) | 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치 | |
KR100883656B1 (ko) | 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치 | |
TWI441166B (zh) | 用以將信號之不同區段分類之方法與鑑別器 | |
US7472059B2 (en) | Method and apparatus for robust speech classification | |
CA2833874C (en) | Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium | |
KR100711280B1 (ko) | 소스 제어되는 가변 비트율 광대역 음성 부호화 방법 및장치 | |
EP1982329B1 (en) | Adaptive time and/or frequency-based encoding mode determination apparatus and method of determining encoding mode of the apparatus | |
KR101116363B1 (ko) | 음성신호 분류방법 및 장치, 및 이를 이용한 음성신호부호화방법 및 장치 | |
JP4270866B2 (ja) | 非音声のスピーチの高性能の低ビット速度コード化方法および装置 | |
JP4907826B2 (ja) | 閉ループのマルチモードの混合領域の線形予測音声コーダ | |
US20050177364A1 (en) | Methods and devices for source controlled variable bit-rate wideband speech coding | |
KR20080101873A (ko) | 부호화/복호화 장치 및 방법 | |
KR20080083719A (ko) | 오디오 신호를 부호화하기 위한 부호화 모델들의 선택 | |
KR20020052191A (ko) | 음성 분류를 이용한 음성의 가변 비트 속도 켈프 코딩 방법 | |
MXPA04011751A (es) | Metodo y dispositivo para ocultamiento de borrado adecuado eficiente en codecs de habla de base predictiva lineal. | |
WO2008148321A1 (fr) | Appareil de codage et de décodage et procédé de traitement du bruit de fond et dispositif de communication utilisant cet appareil | |
JP2010540990A (ja) | 埋め込み話声およびオーディオコーデックにおける変換情報の効率的量子化のための方法および装置 | |
EP2450881A2 (en) | Apparatus for encoding and decoding an audio signal using a weighted linear predictive transform, and method for same | |
Ojala | Toll quality variable-rate speech codec | |
KR100854534B1 (ko) | 오디오 코더 모드들 간의 스위칭 지원 | |
Ritz et al. | Transcoding of Narrowband to Wideband Speech |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application | ||
J201 | Request for trial against refusal decision | ||
AMND | Amendment | ||
E801 | Decision on dismissal of amendment | ||
B601 | Maintenance of original decision after re-examination before a trial | ||
J301 | Trial decision |
Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20080827 Effective date: 20100212 |
|
S901 | Examination by remand of revocation | ||
E902 | Notification of reason for refusal | ||
GRNO | Decision to grant (after opposition) | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130530 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20140529 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20150528 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20160530 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20170529 Year of fee payment: 8 |
|
LAPS | Lapse due to unpaid annual fee |