KR101019681B1 - 스피치 및 이외 다른 유형들의 오디오 자료를 포함하는 오디오 신호들에서 스피치의 세기 조절 - Google Patents
스피치 및 이외 다른 유형들의 오디오 자료를 포함하는 오디오 신호들에서 스피치의 세기 조절 Download PDFInfo
- Publication number
- KR101019681B1 KR101019681B1 KR1020057003479A KR20057003479A KR101019681B1 KR 101019681 B1 KR101019681 B1 KR 101019681B1 KR 1020057003479 A KR1020057003479 A KR 1020057003479A KR 20057003479 A KR20057003479 A KR 20057003479A KR 101019681 B1 KR101019681 B1 KR 101019681B1
- Authority
- KR
- South Korea
- Prior art keywords
- speech
- intensity
- segments
- audio
- audio signal
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G5/00—Tone control or bandwidth control in amplifiers
- H03G5/16—Automatic control
- H03G5/165—Equalizers; Volume or gain control in limited frequency bands
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Stereophonic System (AREA)
- Diaphragms For Electromechanical Transducers (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
Description
특징 | 블록크기 (샘플들) |
블록길이 (msec) |
프레임 당 블록 |
가중 스펙트럼 플럭스의 평균 제곱한 l2-norm | 1024 | 64 | 32 |
추정된 스펙트럼 파워 밀도에 의한 최적으로 부합되는 리그레시브 라인 | 512 | 32 | 64 |
휴기구간 카운트 | 256 | 16 | 128 |
제로 크로싱 레이트의 스큐 계수 | 256 | 16 | 128 |
제로 크로싱 레이트의 평균 대 중앙값 | 256 | 16 | 128 |
짧은 리듬 측정 | 256 | 16 | 128 |
긴 리듬 측정 | 256 | 16 | 128 |
Claims (36)
- 신호처리 방법에 있어서,입력신호를 수신하고, 오디오 신호 구간을 나타내는 오디오 정보를 상기 입력신호로부터 얻는 단계;상기 오디오 정보를 조사하여, 상기 오디오 정보의 세그먼트들을, 스피치로서 분류되는 오디오 신호 부분들을 나타내는 스피치 세그먼트들로서 혹은 스피치로서 분류되지 않는 오디오 신호 부분들을 나타내는 스피치가 아닌 세그먼트들로서 분류하는 단계, 세그먼트로 나타내어진 오디오 신호의 각 부분은 각각의 세기를 가지며, 상기 스피치 세그먼트들의 세기는 하나 혹은 그 이상의 스피치가 아닌 세그먼트들의 세기보다 작으며;상기 오디오 정보를 조사하여, 상기 스피치 세그먼트들의 추정된 세기를 구하는 단계; 및상기 스피치가 아닌 세그먼트들인 것으로 나타내어진 오디오 신호 부분들의 세기보다는 상기 스피치 세그먼트들의 상기 추정된 세기에 더 응답하는 제어정보를 생성함으로써 상기 오디오 신호 구간의 세기의 표시값을 제공하는 단계를 포함하는, 신호처리방법.
- 제1항에 있어서, 상기 스피치 세그먼트들의 세기의 변화를 감소시키기 위해서 상기 제어정보에 응하여 상기 오디오 신호 구간의 세기를 조절하는 단계를 포함 하며, 상기 하나 혹은 그 이상의 스피치가 아닌 세그먼트들로 나타내어진 오디오 신호 부분들의 세기는 스피치 세그먼트들로 나타내어진 오디오 신호 부분들의 세기가 증가될 때 증가되는 것인, 신호처리방법.
- 제1항에 있어서, 상기 오디오 정보의 표현과 상기 제어정보를 출력신호로 어셈블하여 상기 출력신호를 전송하는 단계를 포함하는, 신호처리방법.
- 제1항 또는 제2항에 있어서, 상기 스피치 세그먼트들로 나타내어진 상기 오디오 신호를 주파수 가중한 것의 평균 파워를 계산함으로써 상기 스피치 세그먼트들의 추정된 세기를 구하는, 신호처리방법.
- 제1항 또는 제2항에 있어서, 세기의 사이코어쿠스틱 모델을 상기 오디오 정보에 적용함으로써 상기 스피치 세그먼트들의 추정된 세기를 구하는, 신호처리방법.
- 제1항 또는 제2항에 있어서, 상기 오디오 신호의 복수의 특성들을 상기 오디오 정보로부터 도출하고, 각각의 중요도 측정에 의해 각 특성에 가중치를 부여하고, 상기 가중된 특성들의 조합에 따라 상기 세그먼트들을 분류함으로써, 세그먼트들을 분류하는 것인, 신호처리방법.
- 제1항 또는 제2항에 있어서, 임계값 미만의 오디오 에너지 측정을 갖는 오디오 신호 구간들 동안에 대해서만 세기를 조종함으로써 상기 오디오 신호 구간의 세기를 조절하는, 신호처리방법.
- 제1항 또는 제2항에 있어서, 상기 오디오 신호 구간의 세기의 표시값은 상기 스피치 세그먼트들의 추정된 세기에만 응답하는, 신호처리방법..
- 제1항 또는 제2항에 있어서, 하나 혹은 그 이상의 스피치가 아닌 세그먼트들의 세기를 추정하는 것을 포함하며, 상기 오디오 신호 구간의 세기의 표시값은 상기 하나 혹은 그 이상의 스피치가 아닌 세그먼트들의 추정된 세기보다는 상기 스피치 세그먼트들의 추정된 세기에 더 응답하는, 신호처리방법.
- 제1항 또는 제2항에 있어서, 각각의 세그먼트로 나타내어진 상기 오디오 신호가 스피치의 특성을 갖는 정보를 나타내는 스피치 측정을 제공하는 단계; 및 상기 각각의 세그먼트들의 상기 스피치 측정들에 따라 각각의 세그먼트들의 추정된 세기에 응답하게, 상기 세기의 표시값을 제공하는 단계를 포함하는, 신호처리방법.
- 제1항 또는 제2항에 있어서, 세그먼트들의 시간순서에 따라 각각의 세그먼트들의 추정된 세기에 응답하게 세기의 표시값을 제공하는 것을 포함하는, 신호처리방법.
- 제1 또는 제2항에 있어서, 상기 오디오 정보의 특성들에 응하여 오디오 정보의 세그먼트들의 길이들을 맞추는 단계를 포함하는, 신호처리방법.
- 입력신호를 수신하고, 오디오 신호 구간을 나타내는 오디오 정보를 상기 입력신호로부터 얻는 단계;상기 오디오 정보를 조사하여, 상기 오디오 정보의 세그먼트들을, 스피치로서 분류되는 오디오 신호 부분들을 나타내는 스피치 세그먼트들로서 혹은 스피치로서 분류되지 않는 오디오 신호 부분들을 나타내는 스피치가 아닌 세그먼트들로서 분류하는 단계, 세그먼트로 나타내어진 오디오 신호의 각 부분은 각각의 세기를 가지며, 상기 스피치 세그먼트들의 세기는 하나 혹은 그 이상의 스피치가 아닌 세그먼트들의 세기보다 작으며;상기 오디오 정보를 조사하여, 상기 스피치 세그먼트들의 추정된 세기를 구하는 단계; 및상기 스피치가 아닌 세그먼트들인 것으로 나타내어진 오디오 신호 부분들의 세기보다는 상기 스피치 세그먼트들의 상기 추정된 세기에 더 응답하는 제어정보를 생성함으로써 상기 오디오 신호 구간의 세기의 표시값을 제공하는 단계를 포함하는 신호처리 방법을 수행하게 디바이스에 의해 실행될 수 있는 명령들의 프로그램을 전달하는 것이며, 상기 디바이스에 의해 독출가능한 것인, 매체.
- 제13항에 있어서, 상기 방법은, 상기 스피치 세그먼트들의 세기의 변화를 감소시키기 위해서 상기 제어정보에 응하여 상기 오디오 신호 구간의 세기를 조절하는 단계를 포함하며, 상기 하나 혹은 그 이상의 스피치가 아닌 세그먼트들로 나타내어진 오디오 신호 부분들의 세기는 스피치 세그먼트들로 나타내어진 오디오 신호 부분들의 세기가 증가될 때 증가되는 것인, 매체.
- 제13항에 있어서, 상기 방법은 상기 오디오 정보의 표현과 상기 제어 정보를 출력신호로 어셈블하여 상기 출력신호를 전송하는 단계를 포함하는, 매체.
- 제13항 또는 제14항에 있어서, 상기 방법은 상기 스피치 세그먼트들로 나타내어진 상기 오디오 신호를 주파수 가중한 것의 평균 파워를 계산함으로써 상기 스피치 세그먼트들의 추정된 세기를 구하는, 매체.
- 제13항 또는 제14항에 있어서, 상기 방법은, 세기의 사이코어쿠스틱 모델을 상기 오디오 정보에 적용함으로써 상기 스피치 세그먼트들의 추정된 세기를 구하는, 매체.
- 제13항 또는 제14항에 있어서, 상기 방법은, 상기 오디오 신호의 복수의 특성들을 상기 오디오 정보로부터 도출하고, 각각의 중요도 측정에 의해 각 특성에 가중치를 부여하고, 상기 가중된 특성들의 조합에 따라 상기 세그먼트들을 분류함 으로써, 세그먼트들을 분류하는 것인, 매체.
- 제13항 또는 제14항에 있어서, 상기 방법은, 임계값 미만의 오디오 에너지 측정을 갖는 오디오 신호 구간들 동안에 대해서만 세기를 조종함으로써 상기 오디오 신호 구간의 세기를 조절하는, 매체.
- 제13항 또는 제14항에 있어서, 상기 오디오 신호 구간의 세기의 표시값은 상기 스피치 세그먼트들의 추정된 세기에만 응답하는, 매체.
- 제13항 또는 제14항에 있어서, 상기 방법은, 하나 혹은 그 이상의 스피치가 아닌 세그먼트들의 세기를 추정하는 것을 포함하며, 상기 오디오 신호 구간의 세기의 표시값은 상기 하나 혹은 그 이상의 스피치가 아닌 세그먼트들의 추정된 세기보다는 상기 스피치 세그먼트들의 추정된 세기에 더 응답하는, 매체.
- 제13항 또는 제14항에 있어서, 상기 방법은, 각각의 세그먼트로 나타내어진 상기 오디오 신호가 스피치의 특성을 갖는 정도를 나타내는 스피치 측정을 제공하는 단계; 및 상기 각각의 세그먼트들의 상기 스피치 측정들에 따라 각각의 세그먼트들의 추정된 세기에 응답하게, 상기 세기의 표시값을 제공하는 단계를 포함하는, 매체.
- 제13항 또는 제14항에 있어서, 상기 방법은, 세그먼트들의 시간순서에 따라 각각의 세그먼트들의 추정된 세기에 응답하게 세기의 표시값을 제공하는 것을 포함하는, 매체.
- 제13항 또는 제14항에 있어서, 상기 방법은, 상기 오디오 정보의 특성들에 응하여 오디오 정보의 세그먼트들의 길이들을 맞추는 단계를 포함하는, 매체.
- 신호 처리 장치에 있어서,입력신호를 수신하는 입력단말;메모리; 및 상기 입력단말 및 상기 메모리에 결합된 처리회로를 포함하고, 상기 처리회로는,입력신호를 수신하고, 오디오 신호 구간을 나타내는 오디오 정보를 상기 입력신호로부터 얻고;상기 오디오 정보를 조사하여, 상기 오디오 정보의 세그먼트들을, 스피치로서 분류되는 오디오 신호 부분들을 나타내는 스피치 세그먼트들로서 혹은 스피치로서 분류되지 않는 오디오 신호 부분들을 나타내는 스피치가 아닌 세그먼트들로서 분류하는 것으로, 세그먼트로 나타내어진 오디오 신호의 각 부분은 각각의 세기를 가지며, 상기 스피치 세그먼트들의 세기는 하나 혹은 그 이상의 스피치가 아닌 세그먼트들의 세기보다 작으며;상기 오디오 정보를 조사하여, 상기 스피치 세그먼트들의 추정된 세기를 구하고;상기 스피치가 아닌 세그먼트들인 것으로 나타내어진 오디오 신호 부분들의 세기보다는 상기 스피치 세그먼트들의 상기 추정된 세기에 더 응답하는 제어정보를 생성함으로써 상기 오디오 신호 구간의 세기의 표시값을 제공하도록 된 것인, 신호처리장치.
- 제25항에 있어서, 상기 처리회로는 상기 스피치 세그먼트들의 세기의 변화를 감소시키기 위해서 상기 제어정보에 응하여 상기 오디오 신호 구간의 세기를 조절하게 한 것으로, 상기 하나 혹은 그 이상의 스피치가 아닌 세그먼트들로 나타내어진 오디오 신호 부분들의 세기는 스피치 세그먼트들로 나타내어진 오디오 신호 부분들의 세기가 증가될 때 증가되는 것인, 신호처리장치.
- 제25항에 있어서, 상기 처리회로는 상기 오디오 정보의 표현과 상기 제어 정보를 출력신호로 어셈블하여 상기 출력신호를 전송하도록 된 것인, 신호처리장치.
- 제25항 또는 제26항에 있어서, 상기 처리회로는 상기 스피치 세그먼트들로 나타내어진 상기 오디오 신호를 주파수 가중한 것의 평균 파워를 계산함으로써 상기 스피치 세그먼트들의 추정된 세기를 구하도록 된 것인, 신호처리장치.
- 제25항 또는 제26항에 있어서, 상기 처리회로는 세기의 사이코어쿠스틱 모델 을 상기 오디오 정보에 적용함으로써 상기 스피치 세그먼트들의 추정된 세기를 구하도록 된, 신호처리장치.
- 제25항 또는 제26항에 있어서, 상기 처리회로는 상기 오디오 신호의 복수의 특성들을 상기 오디오 정보로부터 도출하고, 각각의 중요도 측정에 의해 각 특성에 가중치를 부여하고, 상기 가중된 특성들의 조합에 따라 상기 세그먼트들을 분류함으로써, 세그먼트들을 분류하는 것인, 신호처리장치.
- 제25항 또는 제26항에 있어서, 상기 처리회로는 임계값 미만의 오디오 에너지 측정을 갖는 오디오 신호 구간들 동안에 대해서만 세기를 조종함으로써 상기 오디오 신호 구간의 세기를 조절하는, 신호처리장치.
- 제25항 또는 제26항에 있어서, 상기 오디오 신호 구간의 세기의 표시값은 상기 스피치 세그먼트들의 추정된 세기에만 응답하는, 신호처리장치.
- 제25항 또는 제26항에 있어서, 상기 처리회로는 하나 혹은 그 이상의 스피치가 아닌 세그먼트들의 세기를 추정하는 것을 포함하며, 상기 오디오 신호 구간의 세기의 표시값은 상기 하나 혹은 그 이상의 스피치가 아닌 세그먼트들의 추정된 세기보다는 상기 스피치 세그먼트들의 추정된 세기에 더 응답하는, 신호처리장치.
- 제25항 또는 제26항에 있어서, 상기 처리회로는 각각의 세그먼트로 나타내어진 상기 오디오 신호가 스피치의 특성을 갖는 정보를 나타내는 스피치 측정을 제공하며; 상기 각각의 세그먼트들의 상기 스피치 측정들에 따라 각각의 세그먼트들의 추정된 세기에 응답하기 위해, 상기 세기의 세기값을 제공하도록 된 것인, 신호처리장치.
- 제25항 또는 제26항에 있어서, 상기 처리회로는 세그먼트들의 시간순서에 따라 각각의 세그먼트들의 추정된 세기에 응답하게 세기의 표시값을 제공하도록 된 신호처리장치.
- 제25항 또는 제26항에 있어서, 상기 처리회로는 상기 오디오 정보의 특성들을 검출하고 검출된 특성들에 응하여 오디오 정보의 세그먼트들의 길이들을 맞추도록 된 것인, 신호처리장치.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/233,073 US7454331B2 (en) | 2002-08-30 | 2002-08-30 | Controlling loudness of speech in signals that contain speech and other types of audio material |
US10/233,073 | 2002-08-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050057045A KR20050057045A (ko) | 2005-06-16 |
KR101019681B1 true KR101019681B1 (ko) | 2011-03-07 |
Family
ID=31977143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020057003479A KR101019681B1 (ko) | 2002-08-30 | 2003-08-15 | 스피치 및 이외 다른 유형들의 오디오 자료를 포함하는 오디오 신호들에서 스피치의 세기 조절 |
Country Status (15)
Country | Link |
---|---|
US (2) | US7454331B2 (ko) |
EP (1) | EP1532621B1 (ko) |
JP (1) | JP4585855B2 (ko) |
KR (1) | KR101019681B1 (ko) |
CN (1) | CN100371986C (ko) |
AT (1) | ATE328341T1 (ko) |
AU (1) | AU2003263845B2 (ko) |
CA (1) | CA2491570C (ko) |
DE (1) | DE60305712T8 (ko) |
HK (1) | HK1073917A1 (ko) |
IL (1) | IL165938A (ko) |
MX (1) | MXPA05002290A (ko) |
MY (1) | MY133623A (ko) |
TW (1) | TWI306238B (ko) |
WO (1) | WO2004021332A1 (ko) |
Families Citing this family (100)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7711123B2 (en) * | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
US7461002B2 (en) * | 2001-04-13 | 2008-12-02 | Dolby Laboratories Licensing Corporation | Method for time aligning audio signals using characterizations based on auditory events |
US7610205B2 (en) * | 2002-02-12 | 2009-10-27 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
US20040045022A1 (en) * | 2002-09-03 | 2004-03-04 | Steven Riedl | Digital message insertion technique for analog video services |
WO2004111994A2 (en) * | 2003-05-28 | 2004-12-23 | Dolby Laboratories Licensing Corporation | Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal |
US8086448B1 (en) * | 2003-06-24 | 2011-12-27 | Creative Technology Ltd | Dynamic modification of a high-order perceptual attribute of an audio signal |
US7353169B1 (en) * | 2003-06-24 | 2008-04-01 | Creative Technology Ltd. | Transient detection and modification in audio signals |
US7398207B2 (en) | 2003-08-25 | 2008-07-08 | Time Warner Interactive Video Group, Inc. | Methods and systems for determining audio loudness levels in programming |
DE60320414T2 (de) * | 2003-11-12 | 2009-05-20 | Sony Deutschland Gmbh | Vorrichtung und Verfahren zur automatischen Extraktion von wichtigen Ereignissen in Audiosignalen |
US7970144B1 (en) | 2003-12-17 | 2011-06-28 | Creative Technology Ltd | Extracting and modifying a panned source for enhancement and upmix of audio signals |
JP4867914B2 (ja) | 2004-03-01 | 2012-02-01 | ドルビー ラボラトリーズ ライセンシング コーポレイション | マルチチャンネルオーディオコーディング |
US7376890B2 (en) * | 2004-05-27 | 2008-05-20 | International Business Machines Corporation | Method and system for checking rotate, shift and sign extension functions using a modulo function |
US7617109B2 (en) * | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
US7508947B2 (en) | 2004-08-03 | 2009-03-24 | Dolby Laboratories Licensing Corporation | Method for combining audio signals using auditory scene analysis |
WO2006047600A1 (en) | 2004-10-26 | 2006-05-04 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
US8199933B2 (en) | 2004-10-26 | 2012-06-12 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
US7962327B2 (en) * | 2004-12-17 | 2011-06-14 | Industrial Technology Research Institute | Pronunciation assessment method and system based on distinctive feature analysis |
CN102276769B (zh) * | 2005-04-18 | 2013-12-04 | 巴斯夫欧洲公司 | 一种呈由至少三种不同的单烯属不饱和单体构成的聚合物形式的共聚物 |
WO2006132857A2 (en) * | 2005-06-03 | 2006-12-14 | Dolby Laboratories Licensing Corporation | Apparatus and method for encoding audio signals with decoding instructions |
TWI396188B (zh) * | 2005-08-02 | 2013-05-11 | Dolby Lab Licensing Corp | 依聆聽事件之函數控制空間音訊編碼參數的技術 |
WO2007045797A1 (fr) * | 2005-10-20 | 2007-04-26 | France Telecom | Procede, programme et dispositif de description d'un fichier musical, procede et programme de comparaison de deux fichiers musicaux entre eux, et serveur et terminal pour la mise en oeuvre de ces procedes |
US8068627B2 (en) | 2006-03-14 | 2011-11-29 | Starkey Laboratories, Inc. | System for automatic reception enhancement of hearing assistance devices |
US8494193B2 (en) * | 2006-03-14 | 2013-07-23 | Starkey Laboratories, Inc. | Environment detection and adaptation in hearing assistance devices |
US7986790B2 (en) * | 2006-03-14 | 2011-07-26 | Starkey Laboratories, Inc. | System for evaluating hearing assistance device settings using detected sound environment |
TWI517562B (zh) * | 2006-04-04 | 2016-01-11 | 杜比實驗室特許公司 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
JP5185254B2 (ja) * | 2006-04-04 | 2013-04-17 | ドルビー ラボラトリーズ ライセンシング コーポレイション | Mdct領域におけるオーディオ信号音量測定と改良 |
US8682654B2 (en) * | 2006-04-25 | 2014-03-25 | Cyberlink Corp. | Systems and methods for classifying sports video |
NO345590B1 (no) | 2006-04-27 | 2021-05-03 | Dolby Laboratories Licensing Corp | Audioforsterkningsregulering ved bruk av spesifikk lydstyrkebasert hørehendelsesdeteksjon |
CN101529721B (zh) | 2006-10-20 | 2012-05-23 | 杜比实验室特许公司 | 使用复位的音频动态处理 |
US8521314B2 (en) * | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
US20100046765A1 (en) | 2006-12-21 | 2010-02-25 | Koninklijke Philips Electronics N.V. | System for processing audio data |
EP2122828B1 (en) * | 2007-01-03 | 2018-08-22 | Dolby Laboratories Licensing Corporation | Hybrid digital/analog loudness-compensating volume control |
CN101647059B (zh) * | 2007-02-26 | 2012-09-05 | 杜比实验室特许公司 | 增强娱乐音频中的语音的方法和设备 |
US8204359B2 (en) * | 2007-03-20 | 2012-06-19 | At&T Intellectual Property I, L.P. | Systems and methods of providing modified media content |
US8213624B2 (en) * | 2007-06-19 | 2012-07-03 | Dolby Laboratories Licensing Corporation | Loudness measurement with spectral modifications |
US8054948B1 (en) * | 2007-06-28 | 2011-11-08 | Sprint Communications Company L.P. | Audio experience for a communications device user |
JP2009020291A (ja) * | 2007-07-11 | 2009-01-29 | Yamaha Corp | 音声処理装置および通信端末装置 |
CN101790758B (zh) * | 2007-07-13 | 2013-01-09 | 杜比实验室特许公司 | 用于控制音频信号的信号处理的设备和方法 |
CA2705549C (en) | 2007-11-12 | 2015-12-01 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
PL2232700T3 (pl) * | 2007-12-21 | 2015-01-30 | Dts Llc | System regulacji odczuwanej głośności sygnałów audio |
US8457951B2 (en) | 2008-01-29 | 2013-06-04 | The Nielsen Company (Us), Llc | Methods and apparatus for performing variable black length watermarking of media |
US20090226152A1 (en) * | 2008-03-10 | 2009-09-10 | Hanes Brett E | Method for media playback optimization |
ATE546812T1 (de) * | 2008-03-24 | 2012-03-15 | Victor Company Of Japan | Vorrichtung zur audiosignalverarbeitung und verfahren zur audiosignalverarbeitung |
WO2009152124A1 (en) * | 2008-06-10 | 2009-12-17 | Dolby Laboratories Licensing Corporation | Concealing audio artifacts |
CN102160115A (zh) | 2008-09-19 | 2011-08-17 | 杜比实验室特许公司 | 对于资源受限客户机设备的上游质量增强信号处理 |
ATE552690T1 (de) * | 2008-09-19 | 2012-04-15 | Dolby Lab Licensing Corp | Upstream-signalverarbeitung für client- einrichtungen in einem drahtlosen kleinzellen- netz |
US7755526B2 (en) * | 2008-10-31 | 2010-07-13 | At&T Intellectual Property I, L.P. | System and method to modify a metadata parameter |
JP4826625B2 (ja) * | 2008-12-04 | 2011-11-30 | ソニー株式会社 | 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器 |
CN104378075B (zh) | 2008-12-24 | 2017-05-31 | 杜比实验室特许公司 | 频域中的音频信号响度确定和修改 |
CN101483416B (zh) * | 2009-01-20 | 2011-09-14 | 杭州火莲科技有限公司 | 一种语音的响度均衡处理方法 |
US8428758B2 (en) * | 2009-02-16 | 2013-04-23 | Apple Inc. | Dynamic audio ducking |
EP2237269B1 (en) * | 2009-04-01 | 2013-02-20 | Motorola Mobility LLC | Apparatus and method for processing an encoded audio data signal |
KR101616054B1 (ko) * | 2009-04-17 | 2016-04-28 | 삼성전자주식회사 | 음성 검출 장치 및 방법 |
WO2010126709A1 (en) * | 2009-04-30 | 2010-11-04 | Dolby Laboratories Licensing Corporation | Low complexity auditory event boundary detection |
WO2010127024A1 (en) * | 2009-04-30 | 2010-11-04 | Dolby Laboratories Licensing Corporation | Controlling the loudness of an audio signal in response to spectral localization |
TWI503816B (zh) * | 2009-05-06 | 2015-10-11 | Dolby Lab Licensing Corp | 調整音訊信號響度並使其具有感知頻譜平衡保持效果之技術 |
US8302047B2 (en) | 2009-05-06 | 2012-10-30 | Texas Instruments Incorporated | Statistical static timing analysis in non-linear regions |
US8996538B1 (en) | 2009-05-06 | 2015-03-31 | Gracenote, Inc. | Systems, methods, and apparatus for generating an audio-visual presentation using characteristics of audio, visual and symbolic media objects |
US9215538B2 (en) * | 2009-08-04 | 2015-12-15 | Nokia Technologies Oy | Method and apparatus for audio signal classification |
US8538042B2 (en) * | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
GB0919672D0 (en) * | 2009-11-10 | 2009-12-23 | Skype Ltd | Noise suppression |
TWI447709B (zh) | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
TWI525987B (zh) | 2010-03-10 | 2016-03-11 | 杜比實驗室特許公司 | 在單一播放模式中組合響度量測的系統 |
WO2011141772A1 (en) * | 2010-05-12 | 2011-11-17 | Nokia Corporation | Method and apparatus for processing an audio signal based on an estimated loudness |
US8731216B1 (en) * | 2010-10-15 | 2014-05-20 | AARIS Enterprises, Inc. | Audio normalization for digital video broadcasts |
KR101726738B1 (ko) * | 2010-12-01 | 2017-04-13 | 삼성전자주식회사 | 음성처리장치 및 그 방법 |
TWI800092B (zh) * | 2010-12-03 | 2023-04-21 | 美商杜比實驗室特許公司 | 音頻解碼裝置、音頻解碼方法及音頻編碼方法 |
US9620131B2 (en) | 2011-04-08 | 2017-04-11 | Evertz Microsystems Ltd. | Systems and methods for adjusting audio levels in a plurality of audio signals |
EP2702589B1 (en) * | 2011-04-28 | 2017-04-05 | Dolby International AB | Efficient content classification and loudness estimation |
JP2013041197A (ja) * | 2011-08-19 | 2013-02-28 | Funai Electric Co Ltd | デジタル放送受信装置 |
WO2013078056A1 (en) | 2011-11-22 | 2013-05-30 | Dolby Laboratories Licensing Corporation | Method and system for generating an audio metadata quality score |
US8923437B2 (en) * | 2011-12-29 | 2014-12-30 | Raytheon Bbn Technologies Corp. | Non-contiguous spectral-band modulator and method for non-contiguous spectral-band modulation |
JP5827442B2 (ja) | 2012-04-12 | 2015-12-02 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ信号におけるラウドネス変化をレベリングするシステム及び方法 |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
US9053710B1 (en) * | 2012-09-10 | 2015-06-09 | Amazon Technologies, Inc. | Audio content presentation using a presentation profile in a content header |
CN102946520B (zh) * | 2012-10-30 | 2016-12-21 | 深圳创维数字技术有限公司 | 一种自动控制频道音量的方法及数字电视终端 |
CN103841241B (zh) * | 2012-11-21 | 2017-02-08 | 联想(北京)有限公司 | 音量调整方法及装置 |
US8958586B2 (en) | 2012-12-21 | 2015-02-17 | Starkey Laboratories, Inc. | Sound environment classification by coordinated sensing using hearing assistance devices |
US9171552B1 (en) * | 2013-01-17 | 2015-10-27 | Amazon Technologies, Inc. | Multiple range dynamic level control |
BR112015017064B1 (pt) | 2013-01-21 | 2022-03-22 | Dolby Laboratories Licensing Corporation | Método, meio legível em computador e aparelho para otimizar o nível de intensidade do som e a faixa dinâmica através de dispositivos de reprodução diferentes |
CN107257234B (zh) * | 2013-01-21 | 2020-09-15 | 杜比实验室特许公司 | 解码具有保留数据空间中的元数据容器的编码音频比特流 |
EP2901449B1 (en) * | 2013-01-21 | 2018-01-03 | Dolby Laboratories Licensing Corporation | Audio encoder and decoder with program loudness and boundary metadata |
JP6179122B2 (ja) * | 2013-02-20 | 2017-08-16 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム |
US20140278911A1 (en) * | 2013-03-15 | 2014-09-18 | Telemetry Limited | Method and apparatus for determining digital media audibility |
WO2014148845A1 (ko) * | 2013-03-21 | 2014-09-25 | 인텔렉추얼디스커버리 주식회사 | 오디오 신호 크기 제어 방법 및 장치 |
CN104080024B (zh) | 2013-03-26 | 2019-02-19 | 杜比实验室特许公司 | 音量校平器控制器和控制方法以及音频分类器 |
CN104078050A (zh) | 2013-03-26 | 2014-10-01 | 杜比实验室特许公司 | 用于音频分类和音频处理的设备和方法 |
TWI502582B (zh) * | 2013-04-03 | 2015-10-01 | Chung Han Interlingua Knowledge Co Ltd | 服務點之語音客服系統 |
TWM487509U (zh) * | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
US9344825B2 (en) | 2014-01-29 | 2016-05-17 | Tls Corp. | At least one of intelligibility or loudness of an audio program |
US9578436B2 (en) | 2014-02-20 | 2017-02-21 | Bose Corporation | Content-aware audio modes |
US9473094B2 (en) * | 2014-05-23 | 2016-10-18 | General Motors Llc | Automatically controlling the loudness of voice prompts |
US9842608B2 (en) | 2014-10-03 | 2017-12-12 | Google Inc. | Automatic selective gain control of audio data for speech recognition |
EP4060661B1 (en) * | 2014-10-10 | 2024-04-24 | Dolby Laboratories Licensing Corporation | Transmission-agnostic presentation-based program loudness |
JP6395558B2 (ja) * | 2014-10-21 | 2018-09-26 | オリンパス株式会社 | 第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム |
US20160283566A1 (en) * | 2015-03-27 | 2016-09-29 | Ca, Inc. | Analyzing sorted mobile application operational state sequences based on sequence metrics |
CN108432130B (zh) | 2015-10-28 | 2022-04-01 | Dts(英属维尔京群岛)有限公司 | 基于对象的音频信号平衡 |
RU2768224C1 (ru) * | 2018-12-13 | 2022-03-23 | Долби Лабораторис Лайсэнзин Корпорейшн | Двусторонняя медийная аналитика |
CN110231087B (zh) * | 2019-06-06 | 2021-07-23 | 江苏省广播电视集团有限公司 | 一种高清电视音频响度分析报警及归一化制作方法和设备 |
US11138477B2 (en) * | 2019-08-15 | 2021-10-05 | Collibra Nv | Classification of data using aggregated information from multiple classification modules |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0517233A1 (en) * | 1991-06-06 | 1992-12-09 | Matsushita Electric Industrial Co., Ltd. | Music/voice discriminating apparatus |
WO2000078093A1 (en) * | 1999-06-15 | 2000-12-21 | Hearing Enhancement Co., Llc. | Voice-to-remaining audio (vra) interactive hearing aid & auxiliary equipment |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4281218A (en) * | 1979-10-26 | 1981-07-28 | Bell Telephone Laboratories, Incorporated | Speech-nonspeech detector-classifier |
DE3314570A1 (de) * | 1983-04-22 | 1984-10-25 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Verfahren und anordnung zur einstellung der verstaerkung |
US5097510A (en) * | 1989-11-07 | 1992-03-17 | Gs Systems, Inc. | Artificial intelligence pattern-recognition-based noise reduction system for speech processing |
JP2737491B2 (ja) * | 1991-12-04 | 1998-04-08 | 松下電器産業株式会社 | 音楽音声処理装置 |
JP2961952B2 (ja) * | 1991-06-06 | 1999-10-12 | 松下電器産業株式会社 | 音楽音声判別装置 |
US5548638A (en) * | 1992-12-21 | 1996-08-20 | Iwatsu Electric Co., Ltd. | Audio teleconferencing apparatus |
US5457769A (en) * | 1993-03-30 | 1995-10-10 | Earmark, Inc. | Method and apparatus for detecting the presence of human voice signals in audio signals |
BE1007355A3 (nl) * | 1993-07-26 | 1995-05-23 | Philips Electronics Nv | Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling. |
IN184794B (ko) * | 1993-09-14 | 2000-09-30 | British Telecomm | |
JP2986345B2 (ja) * | 1993-10-18 | 1999-12-06 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 音声記録指標化装置及び方法 |
GB9419388D0 (en) * | 1994-09-26 | 1994-11-09 | Canon Kk | Speech analysis |
CA2167748A1 (en) * | 1995-02-09 | 1996-08-10 | Yoav Freund | Apparatus and methods for machine learning hypotheses |
DE19509149A1 (de) | 1995-03-14 | 1996-09-19 | Donald Dipl Ing Schulz | Codierverfahren |
JPH08328599A (ja) | 1995-06-01 | 1996-12-13 | Mitsubishi Electric Corp | Mpegオーディオ復号器 |
US5712954A (en) * | 1995-08-23 | 1998-01-27 | Rockwell International Corp. | System and method for monitoring audio power level of agent speech in a telephonic switch |
DE59713033D1 (de) * | 1996-07-19 | 2010-06-02 | Bernafon Ag | Lautheitsgesteuerte Verarbeitung akustischer Signale |
JP2953397B2 (ja) * | 1996-09-13 | 1999-09-27 | 日本電気株式会社 | ディジタル補聴器の聴覚補償処理方法及びディジタル補聴器 |
US6570991B1 (en) | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
US6125343A (en) * | 1997-05-29 | 2000-09-26 | 3Com Corporation | System and method for selecting a loudest speaker by comparing average frame gains |
US6272360B1 (en) * | 1997-07-03 | 2001-08-07 | Pan Communications, Inc. | Remotely installed transmitter and a hands-free two-way voice terminal device using same |
US6233554B1 (en) * | 1997-12-12 | 2001-05-15 | Qualcomm Incorporated | Audio CODEC with AGC controlled by a VOCODER |
US6298139B1 (en) * | 1997-12-31 | 2001-10-02 | Transcrypt International, Inc. | Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control |
US6182033B1 (en) * | 1998-01-09 | 2001-01-30 | At&T Corp. | Modular approach to speech enhancement with an application to speech coding |
US6353671B1 (en) * | 1998-02-05 | 2002-03-05 | Bioinstco Corp. | Signal processing circuit and method for increasing speech intelligibility |
US6311155B1 (en) * | 2000-02-04 | 2001-10-30 | Hearing Enhancement Company Llc | Use of voice-to-remaining audio (VRA) in consumer applications |
US6351731B1 (en) * | 1998-08-21 | 2002-02-26 | Polycom, Inc. | Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor |
US6823303B1 (en) * | 1998-08-24 | 2004-11-23 | Conexant Systems, Inc. | Speech encoder using voice activity detection in coding noise |
US6411927B1 (en) * | 1998-09-04 | 2002-06-25 | Matsushita Electric Corporation Of America | Robust preprocessing signal equalization system and method for normalizing to a target environment |
DE19848491A1 (de) | 1998-10-21 | 2000-04-27 | Bosch Gmbh Robert | Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger |
US6314396B1 (en) * | 1998-11-06 | 2001-11-06 | International Business Machines Corporation | Automatic gain control in a speech recognition system |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
EP1089242B1 (en) * | 1999-04-09 | 2006-11-08 | Texas Instruments Incorporated | Supply of digital audio and video products |
JP3473517B2 (ja) * | 1999-09-24 | 2003-12-08 | ヤマハ株式会社 | 指向性拡声装置 |
US6351733B1 (en) * | 2000-03-02 | 2002-02-26 | Hearing Enhancement Company, Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
US6889186B1 (en) * | 2000-06-01 | 2005-05-03 | Avaya Technology Corp. | Method and apparatus for improving the intelligibility of digitally compressed speech |
US6625433B1 (en) * | 2000-09-29 | 2003-09-23 | Agere Systems Inc. | Constant compression automatic gain control circuit |
US6807525B1 (en) * | 2000-10-31 | 2004-10-19 | Telogy Networks, Inc. | SID frame detection with human auditory perception compensation |
DE10058786A1 (de) * | 2000-11-27 | 2002-06-13 | Philips Corp Intellectual Pty | Verfahren zum Steuerung eines eine akustische Ausgabeeinrichtung aufweisenden Geräts |
US7068723B2 (en) * | 2002-02-28 | 2006-06-27 | Fuji Xerox Co., Ltd. | Method for automatically producing optimal summaries of linear media |
US7155385B2 (en) * | 2002-05-16 | 2006-12-26 | Comerica Bank, As Administrative Agent | Automatic gain control for adjusting gain during non-speech portions |
-
2002
- 2002-08-30 US US10/233,073 patent/US7454331B2/en not_active Ceased
-
2003
- 2003-07-30 TW TW092120799A patent/TWI306238B/zh not_active IP Right Cessation
- 2003-08-15 AU AU2003263845A patent/AU2003263845B2/en not_active Expired
- 2003-08-15 CN CNB038199181A patent/CN100371986C/zh not_active Expired - Lifetime
- 2003-08-15 AT AT03791682T patent/ATE328341T1/de not_active IP Right Cessation
- 2003-08-15 CA CA2491570A patent/CA2491570C/en not_active Expired - Lifetime
- 2003-08-15 WO PCT/US2003/025627 patent/WO2004021332A1/en active IP Right Grant
- 2003-08-15 EP EP03791682A patent/EP1532621B1/en not_active Expired - Lifetime
- 2003-08-15 MX MXPA05002290A patent/MXPA05002290A/es active IP Right Grant
- 2003-08-15 JP JP2004532903A patent/JP4585855B2/ja not_active Expired - Lifetime
- 2003-08-15 DE DE60305712T patent/DE60305712T8/de active Active
- 2003-08-15 KR KR1020057003479A patent/KR101019681B1/ko active IP Right Grant
- 2003-08-28 MY MYPI20033257A patent/MY133623A/en unknown
-
2004
- 2004-12-22 IL IL165938A patent/IL165938A/en active IP Right Grant
-
2005
- 2005-08-01 HK HK05106543A patent/HK1073917A1/xx not_active IP Right Cessation
-
2010
- 2010-11-17 US US12/948,730 patent/USRE43985E1/en not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0517233A1 (en) * | 1991-06-06 | 1992-12-09 | Matsushita Electric Industrial Co., Ltd. | Music/voice discriminating apparatus |
WO2000078093A1 (en) * | 1999-06-15 | 2000-12-21 | Hearing Enhancement Co., Llc. | Voice-to-remaining audio (vra) interactive hearing aid & auxiliary equipment |
Also Published As
Publication number | Publication date |
---|---|
TW200404272A (en) | 2004-03-16 |
CA2491570A1 (en) | 2004-03-11 |
WO2004021332A1 (en) | 2004-03-11 |
DE60305712D1 (de) | 2006-07-06 |
JP4585855B2 (ja) | 2010-11-24 |
EP1532621A1 (en) | 2005-05-25 |
USRE43985E1 (en) | 2013-02-05 |
CN100371986C (zh) | 2008-02-27 |
MY133623A (en) | 2007-11-30 |
US7454331B2 (en) | 2008-11-18 |
TWI306238B (en) | 2009-02-11 |
AU2003263845B2 (en) | 2008-08-28 |
ATE328341T1 (de) | 2006-06-15 |
US20040044525A1 (en) | 2004-03-04 |
CN1679082A (zh) | 2005-10-05 |
DE60305712T2 (de) | 2007-03-08 |
JP2005537510A (ja) | 2005-12-08 |
KR20050057045A (ko) | 2005-06-16 |
AU2003263845A1 (en) | 2004-03-19 |
IL165938A (en) | 2010-04-15 |
DE60305712T8 (de) | 2007-07-12 |
IL165938A0 (en) | 2006-01-15 |
EP1532621B1 (en) | 2006-05-31 |
CA2491570C (en) | 2011-10-18 |
MXPA05002290A (es) | 2005-06-08 |
HK1073917A1 (en) | 2005-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101019681B1 (ko) | 스피치 및 이외 다른 유형들의 오디오 자료를 포함하는 오디오 신호들에서 스피치의 세기 조절 | |
US10586557B2 (en) | Voice activity detector for audio signals | |
KR101726208B1 (ko) | 볼륨 레벨러 제어기 및 제어 방법 | |
CN109616142B (zh) | 用于音频分类和处理的装置和方法 | |
US8825188B2 (en) | Methods and systems for identifying content types | |
EP2979359B1 (en) | Equalizer controller and controlling method | |
KR102072026B1 (ko) | 잡음 검출 및 라우드니스 하락 검출을 포함하는 라우드니스 제어 | |
KR101101384B1 (ko) | 파라미터화된 시간 특징 분석 | |
US5867815A (en) | Method and device for controlling the levels of voiced speech, unvoiced speech, and noise for transmission and reproduction | |
JPH06332492A (ja) | 音声検出方法および検出装置 | |
CN1981433A (zh) | 自动调整音频信号的音量的方法和系统 | |
JP2002237785A (ja) | 人間の聴覚補償によりsidフレームを検出する方法 | |
JPH0748695B2 (ja) | 音声符号化方式 | |
CN116745844A (zh) | 双耳录音中语音的检测和增强 | |
KR20180088807A (ko) | 비디오 정보를 이용한 오디오 인코딩 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20140211 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20150206 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20160211 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20170221 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20180208 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20190212 Year of fee payment: 9 |