KR20100065372A - 음성 신호 처리를 이용한 멀티-채널 신호 발생 장치 및 방법 - Google Patents
음성 신호 처리를 이용한 멀티-채널 신호 발생 장치 및 방법 Download PDFInfo
- Publication number
- KR20100065372A KR20100065372A KR1020107007771A KR20107007771A KR20100065372A KR 20100065372 A KR20100065372 A KR 20100065372A KR 1020107007771 A KR1020107007771 A KR 1020107007771A KR 20107007771 A KR20107007771 A KR 20107007771A KR 20100065372 A KR20100065372 A KR 20100065372A
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- channel
- sound field
- input signal
- implemented
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 77
- 238000012545 processing Methods 0.000 title description 7
- 230000002238 attenuated effect Effects 0.000 claims description 20
- 230000003595 spectral effect Effects 0.000 claims description 17
- 238000004458 analytical method Methods 0.000 claims description 15
- 230000008859 change Effects 0.000 claims description 15
- 238000005259 measurement Methods 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000002123 temporal effect Effects 0.000 claims description 2
- 238000007619 statistical method Methods 0.000 claims 1
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 14
- 239000003607 modifier Substances 0.000 abstract description 2
- 230000005236 sound signal Effects 0.000 description 25
- 230000001629 suppression Effects 0.000 description 18
- 230000008569 process Effects 0.000 description 13
- 230000003321 amplification Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000003199 nucleic acid amplification method Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 7
- 230000009467 reduction Effects 0.000 description 7
- 238000001914 filtration Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000003909 pattern recognition Methods 0.000 description 3
- 235000009508 confectionery Nutrition 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000004091 panning Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000010129 solution processing Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 108010066082 tartrate-sensitive acid phosphatase Proteins 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
- H04S5/005—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation of the pseudo five- or more-channel type, e.g. virtual surround
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Stereo-Broadcasting Methods (AREA)
- Dot-Matrix Printers And Others (AREA)
- Color Television Systems (AREA)
- Time-Division Multiplex Systems (AREA)
Abstract
Description
도 1은 본 발명의 일 실시예의 블록도를 도시한다.
도 2는 "대응 섹션들(corresponding sections)"을 논의하기 위해 분석 신호 및 음장감(ambience) 채널 또는 입력 신호의 시간/주파수 섹션들의 관련성을 나타낸다.
도 3은 본 발명의 바람직한 실시예에 따른 음장감 신호 변경(modification)을 나타낸다.
도 4는 본 발명의 다른 실시예에 따른 음성 검출기 및 음장감 신호 변경기 사이의 협업을 나타낸다.
도 5a는 다이렉트 소스들(드럼 악기) 및 확산 컴포넌트들을 포함하는 스테레오 재생 시나리오를 나타낸다.
도 5b는 모든 다이렉트 사운드 소스들은 정면 채널들에 의해 재생되고, 확산 컴포넌트들은 이 모든 채널에 의해 재생되는, 멀티-채널 재생 시나리오를 나타내는데, 이 시나리오는 다이렉트 음장감 개념으로 또한 언급된다.
도 5c는 별개의 사운드 소스들이 적어도 부분적으로 후위 채널들에 의해 재생되고, 음장감 채널들이 후위 라우드스피커들에 의해 재생되지 않거나 도 5b에서 보다 작은 정도로 재생되는, 멀티-채널 재생 시나리오를 도시한다.
도 6a는 음장감 채널에서의 음성 검출 및 음장감 채널의 변경을 포함하는 다른 실시예를 도시한다.
도 6b는 입력 신호에서의 음성 검출 및 음장감 채널의 변경을 포함하는 실시예를 도시한다.
도 6c는 입력 신호에서의 음성 검출 및 및 입력 신호의 변경을 포함하는 실시예를 도시한다.
도 6d는 입력 신호에서의 음성 검출 및 음장감 신호에서의 변경을 포함하는 다른 실시예를 도시하는데, 변경은 음성에 대해 특히 동조된다.
도 7은 대역통과 신호/서브-대역 신호에 기초하여, 대역 마다 증폭 인자 계산을 포함하는 실시예를 도시한다.
도 8은 도 7의 증폭 계산 블록의 상세를 도시한다.
Claims (23)
- 입력 신호(12)의 입력 채널들의 개수보다 큰 개수의 출력 채널들을 포함하는데, 입력 채널들의 개수는 1 또는 그 이상인, 멀티-채널 신호(10)를 발생시키는 장치에 있어서,
적어도 다이렉트 신호 채널 및 적어도 음장감 채널 또는 변경된 음장감 채널을 제공하기 위해 상기 입력 신호를 업믹스하는 업믹서(14);
상기 입력 신호, 상기 다이렉트 신호 채널 또는 상기 음장감 신호 채널의 음성 부분이 발생하는 섹션을 검출하는 음성 검출기(18);
상기 음성 부분이 감쇠되거나 제거되는 변경된 음장감 신호 채널 또는 변경된 입력 신호를 획득하기 위해 상기 음성 검출기(18)에 의해 검출된 상기 섹션에 대응하는 상기 음장감 채널 또는 입력 신호의 섹션을 변경하는데, 상기 다이렉트 채널 신호의 상기 섹션은 더 작은 정도로 감쇠되거나 전혀 감쇠되지 않는, 신호 변경기(20); 및
상기 다이렉트 채널 및 상기 변경된 음장감 채널을 이용하여 재생 방식으로 라우드스피커 신호들을 출력하는 라우드스피커 신호 출력 수단(22)을 포함하는 멀티-채널 발생 장치. - 청구항 1에 있어서,
상기 라우드스피커 신호 출력 수단(22)은 각 다이렉트 채널이 그 자신의 라우드스피커로 맵핑될 수 있고, 모든 음장감 채널이 그 자신의 라우드스피커에 맵핑될 수 있는 다이렉트/음장감 방식에 따라 동작하도록 구현되며, 상기 라우드스피커 신호 출력 수단(22)은 상기 다이렉트 채널이 아닌, 상기 음장감 채널만을 상기 재생 방식으로 청취자 후위의 라우드스피커들을 위한 라우드스피커 신호들로 맵핑하도록 구현되는 멀티-채널 발생 장치. - 청구항 1에 있어서,
상기 라우드스피커 신호 출력 수단(22)은, 각 다이렉트 신호 채널이, 그 위치에 따라, 하나 또는 몇 개의 라우드스피커들로 맵핑될 수 있는 인-밴드 방식에 따라 동작하도록 구현되고, 상기 라우드스피커 신호 출력 수단(22)은 상기 라우드스피커를 위한 라우드스피커 출력 신호를 획득하기 위해, 상기 음장감 채널과 상기 다이렉트 채널을 결합하거나 상기 음장감 채널 또는 상기 다이렉트 채널의, 라우드스피커에 대해 결정된 부분을 결합하도록 구현되는 멀티-채널 발생 장치. - 전술한 청구항들 중 어느 한 항에 있어서,
상기 라우드스피커 신호 출력 수단은 상기 재생 방식으로 청취자의 정면에 위치될 수 있는 적어도 3개의 채널들을 위한 라우드스피커 신호들을 제공하고, 상기 재생 방식으로 상기 청취자의 후위에 위치될 수 있는 적어도 2개의 채널들을 발생시키도록 구현되는 멀티-채널 발생 장치. - 전술한 청구항들 중 어느 한 항에 있어서,
상기 음성 검출기(18)는 시간 상에서 블록 단위로(block-by-block manner) 동작하고, 시간 블록에 대한 주파수 대역을 검출하기 위해 각 시간 블록을 대역 단위로(band by band)로 주파수 선택적인 방식으로 분석하도록 구현되며,
상기 신호 변경기(20)는 상기 음성 검출기(18)에 의해 검출된 상기 대역에 대응하는 입력 신호 또는 상기 음장감 신호 채널의 이러한 시간 블록에서 주파수 대역을 변경하도록 구현되는 멀티-채널 발생 장치. - 전술한 청구항들 중 어느 한 항에 있어서,
상기 시간 변경기는 상기 음장감 채널 신호나 상기 입력 신호 또는 상기 음장감 채널 신호나 입력 신호의 부분들을 상기 음성 검출기(18)에 의해 검출된 시간 간격에서 감쇠하도록 구현되며,
상기 업믹서(14) 및 상기 라우드스피커 신호 출력 수단(22)은 상기 동일한 시간 구간이 더 작은 정도로 감쇠되거나 전혀 감쇠되지 않도록 적어도 하나의 다이렉트 채널을 발생시키도록 구현되어, 상기 다이렉트 채널은, 재생될 때 상기 변경된 음장감 채널 신호 또는 상기 변경된 입력 신호에서의 음성 컴포넌트보다 더 강하게 인지될 수 있는 음성 컴포넌트를 포함하는, 멀티-채널 발생 장치. - 전술한 청구항들 중 어느 한 항에 있어서,
상기 신호 변경기(20)는 음성 검출기(18)가 음성 부분이 존재하는 시간 구간을 검출하면 상기 적어도 하나의 음장감 채널 또는 입력 신호를 고역-통과 필터링시키도록 구현되며, 상기 고역 통과 필터의 컷오프 주파수는 400 Hz와 3,500 Hz 사이에 있는, 멀티-채널 발생 장치. - 전술한 청구항들 중 어느 한 항에 있어서,
상기 음성 검출기(18)는 음성 신호 컴포넌트의 시간적 발생을 검출하도록 구현되고,
상기 신호 변경기(20)는 상기 음성 신호 컴포넌트의 기본 주파수를 찾고, 변경된 음장감 채널 신호 또는 변경된 입력 신호를 획득하기 위해 상기 기본 주파수 및 그 고조파에서 상기 음장감 채널 또는 상기 입력 신호에서의 톤들을 선택적으로 감쇠하도록(43) 구현되는 멀티-채널 발생 장치. - 전술한 청구항들 중 어느 한 항에 있어서,
상기 음성 검출기(18)는 주파수 대역 당 음성 컨텐츠의 측정치를 구하도록 구현되며,
상기 신호 변경기(20)는 상기 측정치에 따라 상기 음장감 채널의 대응하는 대역을 감쇠 인자만큼 감쇠(72a, 72b)하도록 구현되며, 측정치가 높을수록 감쇠 인자가 커지고, 측정치가 낮을수록 감쇠 인자가 낮아지는 멀티-채널 발생 장치. - 청구항 9에 있어서,
상기 신호 변경기(20)는, 상기 음장감 신호 또는 입력 신호를 스펙트럼 표현으로 변환하는 시간-주파수 영역 변환기(70);
상기 스펙트럼 표현을 주파수-선택적으로 가변적으로 감쇠하는 감쇠기(72a, 72b); 및
상기 변경된 음장감 채널 신호 또는 변경된 입력 신호를 획득하기 위해 시간 영역 상에서 상기 가변적으로 감쇠된 스펙트럼 표현을 변환하는 주파수-시간 영역 변환기(73)를 포함하는 멀티-채널 발생 장치. - 청구항 9 또는 청구항 10에 있어서,
상기 음성 검출기(18)는, 분석 신호의 스펙트럼 표현을 제공하는 시간-주파수 영역 변환기(42);
상기 분석 신호의 대역마다 하나 또는 몇 개의 특징들(71a, 71b)을 계산하는 수단; 및
상기 대역마다의 하나 또는 몇 개의 특징들의 조합에 기초하여 음성 컨텐츠의 측정치를 계산하는 수단(80)을 포함하는 멀티-채널 발생 장치. - 청구항 11에 있어서,
상기 신호 변경기(20)는 특징으로서, 스펙트럼 평편도 측정치(SFM) 또는 4-Hz 변조 에너지(4HzME)를 계산하도록 구현되는 멀티-채널 발생 장치. - 전술한 청구항 들 중 어느 한 항에 있어서,
상기 음성 검출기(18)는 상기 음장감 채널 신호(18c)를 분석하도록 구현되며, 상기 신호 변경기(20)는 상기 음장감 채널 신호(16)을 변경하도록 구현되는 멀티-채널 발생 장치. - 청구항 1 내지 청구항 12 중 어느 한 항에 있어서,
상기 음성 검출기(18)는 상기 입력 신호(18a)를 분석하도록 구현되며, 상기 신호 변경기(20)는 상기 음성 검출기(18)로부터의 제어 정보(18d)에 기초하여 상기 음장감 채널 신호(16)를 변경하도록 구현되는 멀티-채널 발생 장치. - 청구항 1 내지 청구항 12 중 어느 한 항에 있어서,
상기 음성 검출기(18)는 상기 입력 신호(18a)를 분석하도록 구현되며, 상기 신호 변경기(20)는 상기 음성 검출기(18)로부터의 제어 정보(18d)에 기초하여 상기 입력 신호를 변경하도록 구현되며, 상기 업믹서(14)는 상기 변경된 입력 신호에 기초하여 상기 변경된 음장감 채널 신호(16')를 구하도록 구현된 음장감 채널 추출기를 포함하고, 상기 업믹서(14)는 상기 신호 변경기(20)의 입력에서 입력 신호(12)에 기초하여 상기 다이렉트 채널 신호(15)를 구하도록 추가로 구현되는 멀티-채널 발생 장치. - 청구항 1 내지 청구항 12 중 어느 한 항에 있어서,
상기 음성 검출기(18)는 상기 입력 신호(18a)를 분석하도록 구현되며, 추가적으로 상기 입력 신호에 대해 음성 분석이 행해지도록 하는 음성 분석기(30)가 제공되며,
상기 신호 변경기(20)는 상기 음성 검출기(18)로부터의 제어 정보(18d)에 기초하여 그리고 상기 음성 분석기(30)로부터의 음성 분석 정보(18e)에 기초하여 상기 음장감 채널 신호(16)를 변경하도록 구현되는 멀티-채널 발생 장치. - 전술한 청구항들 중 어느 한 항에 있어서,
상기 업믹서(14)는 매트릭스 디코더로서 구현되는 멀티-채널 발생 장치. - 전술한 청구항들 중 어느 한 항에 있어서,
상기 업믹서(14)는 추가적으로 전송된 업믹스 정보 없이, 상기 입력 신호(12)에만 기초하여 상기 다이렉트 채널 신호(15), 상기 음장감 채널 신호(16) 또는 상기 변경된 음장감 채널 신호(16')를 발생시키는 블라인드 업믹서로서 구현되는 멀티-채널 발생 장치. - 전술한 청구항들 중 어느 한 항에 있어서,
상기 업믹서(14)는 상기 다이렉트 채널 신호(15), 상기 음장감 채널 신호(16) 또는 상기 변경된 음장감 채널 신호(16')를 발생시키기 위해 상기 입력 신호(12)의 통계적 분석을 수행하도록 구현되는 멀티-채널 발생 장치. - 전술한 청구항들 중 어느 한 항에 있어서,
상기 입력 신호는 하나의 채널을 포함하는 모노-신호이고, 상기 출력 신호는 2 이상의 채널 신호들을 포함하는 멀티-채널 신호인 멀티-채널 발생 장치. - 청구항 1 내지 청구항 19 중 어느 한 항에 있어서,
상기 업믹서(14)는 입력 신호로서, 2개의 스테레오 채널 신호들을 포함하는 스테레오 신호를 획득하도록 구현되며, 상기 업믹서(14)는 상기 스테레오 채널 신호들의 상호 상관 계산에 기초하여 음장감 채널 신호(16) 또는 상기 변경된 음장감 채널 신호(16')를 실현하도록 추가적으로 구현되는 멀티-채널 발생 장치. - 입력 신호(12)의 입력 채널들의 개수보다 큰 개수의 출력 채널들을 포함하는 멀티-채널 신호(10)를 발생시키는 방법으로서, 상기 입력 채널들의 개수는 1 또는 그 이상인, 멀티-채널 발생 방법에 있어서,
적어도 다이렉트 신호 채널 및 적어도 음장감 채널 또는 변경된 음장감 채널을 제공하도록 상기 입력 신호를 업믹싱(14)하는 단계;
상기 입력 신호, 상기 다이렉트 신호 채널 또는 상기 음장감 신호 채널의 음성 부분이 발생하는 섹션을 검출(18)하는 단계; 및
상기 음성 부분이 감쇠되거나 제거된 변경된 음장감 신호 채널 또는 변경된 입력 신호를 획득하기 위해 상기 검출 단계(18)에서 검출된 상기 섹션에 대응하는, 음장감 채널 또는 상기 입력 신호의 섹션을 변경(20)하는 단계로서, 상기 다이렉트 채널 신호의 상기 섹션은 더 작은 정도로 감쇠되거나 전혀 감쇠되지 않는 단계; 및
상기 다이렉트 채널 및 상기 변경된 음장감 채널을 이용한 재생 방식으로 라우드스피커 신호들을 출력(22)하는 단계를 포함하는 멀티-채널 발생 방법. - 컴퓨터 상에서 동작할 때, 청구항 22에 따른 방법을 실행하는 프로그램을 포함하는 컴퓨터 프로그램.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102007048973.2 | 2007-10-12 | ||
DE102007048973A DE102007048973B4 (de) | 2007-10-12 | 2007-10-12 | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung |
PCT/EP2008/008324 WO2009049773A1 (de) | 2007-10-12 | 2008-10-01 | Vorrichtung und verfahren zum erzeugen eines multikanalsignals mit einer sprachsignalverarbeitung |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100065372A true KR20100065372A (ko) | 2010-06-16 |
KR101100610B1 KR101100610B1 (ko) | 2011-12-29 |
Family
ID=40032822
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020107007771A KR101100610B1 (ko) | 2007-10-12 | 2008-10-01 | 음성 신호 처리를 이용한 멀티-채널 신호 발생 장치 및 방법 |
Country Status (16)
Country | Link |
---|---|
US (1) | US8731209B2 (ko) |
EP (1) | EP2206113B1 (ko) |
JP (1) | JP5149968B2 (ko) |
KR (1) | KR101100610B1 (ko) |
CN (1) | CN101842834B (ko) |
AT (1) | ATE507555T1 (ko) |
AU (1) | AU2008314183B2 (ko) |
BR (1) | BRPI0816638B1 (ko) |
CA (1) | CA2700911C (ko) |
DE (2) | DE102007048973B4 (ko) |
ES (1) | ES2364888T3 (ko) |
HK (1) | HK1146424A1 (ko) |
MX (1) | MX2010003854A (ko) |
PL (1) | PL2206113T3 (ko) |
RU (1) | RU2461144C2 (ko) |
WO (1) | WO2009049773A1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9161148B2 (en) | 2011-09-09 | 2015-10-13 | Samsung Electronics Co., Ltd. | Signal processing apparatus and method for providing 3D sound effect |
KR20180108766A (ko) * | 2016-02-02 | 2018-10-04 | 디티에스, 인코포레이티드 | 증강 현실 헤드폰 환경 렌더링 |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5577787B2 (ja) * | 2009-05-14 | 2014-08-27 | ヤマハ株式会社 | 信号処理装置 |
US20110078224A1 (en) * | 2009-09-30 | 2011-03-31 | Wilson Kevin W | Nonlinear Dimensionality Reduction of Spectrograms |
TWI459828B (zh) | 2010-03-08 | 2014-11-01 | Dolby Lab Licensing Corp | 在多頻道音訊中決定語音相關頻道的音量降低比例的方法及系統 |
JP5299327B2 (ja) * | 2010-03-17 | 2013-09-25 | ソニー株式会社 | 音声処理装置、音声処理方法、およびプログラム |
EP2555188B1 (en) * | 2010-03-31 | 2014-05-14 | Fujitsu Limited | Bandwidth extension apparatuses and methods |
WO2011155144A1 (ja) | 2010-06-11 | 2011-12-15 | パナソニック株式会社 | 復号装置、符号化装置及びこれらの方法 |
EP2661746B1 (en) * | 2011-01-05 | 2018-08-01 | Nokia Technologies Oy | Multi-channel encoding and/or decoding |
EP2523473A1 (en) * | 2011-05-11 | 2012-11-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an output signal employing a decomposer |
JP5057535B1 (ja) | 2011-08-31 | 2012-10-24 | 国立大学法人電気通信大学 | ミキシング装置、ミキシング信号処理装置、ミキシングプログラム及びミキシング方法 |
US9280984B2 (en) | 2012-05-14 | 2016-03-08 | Htc Corporation | Noise cancellation method |
PL2896221T3 (pl) * | 2012-09-12 | 2017-04-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie do i sposób zapewniania rozszerzonych możliwości kierowanego downmixu dla 3D audio |
JP6054142B2 (ja) * | 2012-10-31 | 2016-12-27 | 株式会社東芝 | 信号処理装置、方法およびプログラム |
WO2014112792A1 (ko) * | 2013-01-15 | 2014-07-24 | 한국전자통신연구원 | 사운드 바를 위한 오디오 신호 처리 장치 및 방법 |
EP2965540B1 (en) * | 2013-03-05 | 2019-05-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for multichannel direct-ambient decomposition for audio signal processing |
EP2830065A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
RU2639952C2 (ru) | 2013-08-28 | 2017-12-25 | Долби Лабораторис Лайсэнзин Корпорейшн | Гибридное усиление речи с кодированием формы сигнала и параметрическим кодированием |
EP2866227A1 (en) * | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
US10176818B2 (en) * | 2013-11-15 | 2019-01-08 | Adobe Inc. | Sound processing using a product-of-filters model |
KR101808810B1 (ko) * | 2013-11-27 | 2017-12-14 | 한국전자통신연구원 | 음성/무음성 구간 검출 방법 및 장치 |
CN104683933A (zh) | 2013-11-29 | 2015-06-03 | 杜比实验室特许公司 | 音频对象提取 |
CN106104684A (zh) | 2014-01-13 | 2016-11-09 | 诺基亚技术有限公司 | 多通道音频信号分类器 |
JP6274872B2 (ja) * | 2014-01-21 | 2018-02-07 | キヤノン株式会社 | 音処理装置、音処理方法 |
US10362422B2 (en) | 2014-08-01 | 2019-07-23 | Steven Jay Borne | Audio device |
US20160071524A1 (en) * | 2014-09-09 | 2016-03-10 | Nokia Corporation | Audio Modification for Multimedia Reversal |
CN104409080B (zh) * | 2014-12-15 | 2018-09-18 | 北京国双科技有限公司 | 语音端点检测方法和装置 |
PL3257270T3 (pl) * | 2015-03-27 | 2019-07-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie i sposób przetwarzania sygnałów stereo do odtwarzania w samochodach dla uzyskania indywidualnego dźwięku trójwymiarowego przez przednie głośniki |
CN106205628B (zh) * | 2015-05-06 | 2018-11-02 | 小米科技有限责任公司 | 声音信号优化方法及装置 |
US11463833B2 (en) * | 2016-05-26 | 2022-10-04 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for voice or sound activity detection for spatial audio |
EP3469590B1 (en) * | 2016-06-30 | 2020-06-24 | Huawei Technologies Duesseldorf GmbH | Apparatuses and methods for encoding and decoding a multichannel audio signal |
CN106412792B (zh) * | 2016-09-05 | 2018-10-30 | 上海艺瓣文化传播有限公司 | 对原立体声文件重新进行空间化处理并合成的系统及方法 |
WO2018053518A1 (en) * | 2016-09-19 | 2018-03-22 | Pindrop Security, Inc. | Channel-compensated low-level features for speaker recognition |
EP3382704A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal |
US9820073B1 (en) | 2017-05-10 | 2017-11-14 | Tls Corp. | Extracting a common signal from multiple audio signals |
KR20230151049A (ko) | 2017-12-18 | 2023-10-31 | 돌비 인터네셔널 에이비 | 가상 현실 환경에서 청취 위치 사이의 로컬 전환을 처리하기 위한 방법 및 시스템 |
US11019201B2 (en) | 2019-02-06 | 2021-05-25 | Pindrop Security, Inc. | Systems and methods of gateway detection in a telephone network |
US12015637B2 (en) | 2019-04-08 | 2024-06-18 | Pindrop Security, Inc. | Systems and methods for end-to-end architectures for voice spoofing detection |
KR102164306B1 (ko) * | 2019-12-31 | 2020-10-12 | 브레인소프트주식회사 | 디제이변환에 기초한 기본주파수 추출 방법 |
CN111654745B (zh) * | 2020-06-08 | 2022-10-14 | 海信视像科技股份有限公司 | 多声道的信号处理方法及显示设备 |
CN114630057B (zh) * | 2022-03-11 | 2024-01-30 | 北京字跳网络技术有限公司 | 确定特效视频的方法、装置、电子设备及存储介质 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03236691A (ja) | 1990-02-14 | 1991-10-22 | Hitachi Ltd | テレビジョン受信機用音声回路 |
JPH07110696A (ja) * | 1993-10-12 | 1995-04-25 | Mitsubishi Electric Corp | 音声再生装置 |
JP3412209B2 (ja) * | 1993-10-22 | 2003-06-03 | 日本ビクター株式会社 | 音響信号処理装置 |
JP2003524906A (ja) * | 1998-04-14 | 2003-08-19 | ヒアリング エンハンスメント カンパニー,リミティド ライアビリティー カンパニー | 聴覚障害および非聴覚障害リスナーの好みに合わせてユーザ調整能力を提供する方法および装置 |
US6928169B1 (en) * | 1998-12-24 | 2005-08-09 | Bose Corporation | Audio signal processing |
JP2001069597A (ja) * | 1999-06-22 | 2001-03-16 | Yamaha Corp | 音声処理方法及び装置 |
FR2797343B1 (fr) * | 1999-08-04 | 2001-10-05 | Matra Nortel Communications | Procede et dispositif de detection d'activite vocale |
JP4463905B2 (ja) * | 1999-09-28 | 2010-05-19 | 隆行 荒井 | 音声処理方法、装置及び拡声システム |
US6351733B1 (en) | 2000-03-02 | 2002-02-26 | Hearing Enhancement Company, Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
US7177808B2 (en) | 2000-11-29 | 2007-02-13 | The United States Of America As Represented By The Secretary Of The Air Force | Method for improving speaker identification by determining usable speech |
US20040086130A1 (en) * | 2002-05-03 | 2004-05-06 | Eid Bradley F. | Multi-channel sound processing systems |
US7567845B1 (en) * | 2002-06-04 | 2009-07-28 | Creative Technology Ltd | Ambience generation for stereo signals |
US7257231B1 (en) * | 2002-06-04 | 2007-08-14 | Creative Technology Ltd. | Stream segregation for stereo signals |
ATE359687T1 (de) | 2003-04-17 | 2007-05-15 | Koninkl Philips Electronics Nv | Audiosignalgenerierung |
US8311809B2 (en) | 2003-04-17 | 2012-11-13 | Koninklijke Philips Electronics N.V. | Converting decoded sub-band signal into a stereo signal |
SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
SE0400997D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Efficient coding of multi-channel audio |
SE0402652D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
JP2007028065A (ja) * | 2005-07-14 | 2007-02-01 | Victor Co Of Japan Ltd | サラウンド再生装置 |
JP4896029B2 (ja) | 2005-09-22 | 2012-03-14 | パイオニア株式会社 | 信号処理装置、信号処理方法、信号処理プログラムおよびコンピュータに読み取り可能な記録媒体 |
JP4940671B2 (ja) | 2006-01-26 | 2012-05-30 | ソニー株式会社 | オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム |
WO2007096792A1 (en) * | 2006-02-22 | 2007-08-30 | Koninklijke Philips Electronics N.V. | Device for and a method of processing audio data |
KR100773560B1 (ko) | 2006-03-06 | 2007-11-05 | 삼성전자주식회사 | 스테레오 신호 생성 방법 및 장치 |
DE102006017280A1 (de) | 2006-04-12 | 2007-10-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals |
-
2007
- 2007-10-12 DE DE102007048973A patent/DE102007048973B4/de active Active
-
2008
- 2008-10-01 BR BRPI0816638-2A patent/BRPI0816638B1/pt active IP Right Grant
- 2008-10-01 DE DE502008003378T patent/DE502008003378D1/de active Active
- 2008-10-01 CA CA2700911A patent/CA2700911C/en active Active
- 2008-10-01 PL PL08802737T patent/PL2206113T3/pl unknown
- 2008-10-01 ES ES08802737T patent/ES2364888T3/es active Active
- 2008-10-01 US US12/681,809 patent/US8731209B2/en active Active
- 2008-10-01 KR KR1020107007771A patent/KR101100610B1/ko active IP Right Grant
- 2008-10-01 JP JP2010528297A patent/JP5149968B2/ja active Active
- 2008-10-01 AU AU2008314183A patent/AU2008314183B2/en active Active
- 2008-10-01 WO PCT/EP2008/008324 patent/WO2009049773A1/de active Application Filing
- 2008-10-01 RU RU2010112890/08A patent/RU2461144C2/ru active
- 2008-10-01 CN CN2008801112350A patent/CN101842834B/zh active Active
- 2008-10-01 EP EP08802737A patent/EP2206113B1/de active Active
- 2008-10-01 AT AT08802737T patent/ATE507555T1/de active
- 2008-10-01 MX MX2010003854A patent/MX2010003854A/es active IP Right Grant
-
2011
- 2011-01-12 HK HK11100278.0A patent/HK1146424A1/xx unknown
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9161148B2 (en) | 2011-09-09 | 2015-10-13 | Samsung Electronics Co., Ltd. | Signal processing apparatus and method for providing 3D sound effect |
KR20180108766A (ko) * | 2016-02-02 | 2018-10-04 | 디티에스, 인코포레이티드 | 증강 현실 헤드폰 환경 렌더링 |
Also Published As
Publication number | Publication date |
---|---|
EP2206113B1 (de) | 2011-04-27 |
ATE507555T1 (de) | 2011-05-15 |
BRPI0816638B1 (pt) | 2020-03-10 |
CN101842834A (zh) | 2010-09-22 |
HK1146424A1 (en) | 2011-06-03 |
CA2700911A1 (en) | 2009-04-23 |
EP2206113A1 (de) | 2010-07-14 |
WO2009049773A1 (de) | 2009-04-23 |
ES2364888T3 (es) | 2011-09-16 |
US20100232619A1 (en) | 2010-09-16 |
MX2010003854A (es) | 2010-04-27 |
DE102007048973B4 (de) | 2010-11-18 |
PL2206113T3 (pl) | 2011-09-30 |
CA2700911C (en) | 2014-08-26 |
BRPI0816638A2 (pt) | 2015-03-10 |
US8731209B2 (en) | 2014-05-20 |
KR101100610B1 (ko) | 2011-12-29 |
AU2008314183B2 (en) | 2011-03-31 |
JP5149968B2 (ja) | 2013-02-20 |
JP2011501486A (ja) | 2011-01-06 |
AU2008314183A1 (en) | 2009-04-23 |
RU2010112890A (ru) | 2011-11-20 |
CN101842834B (zh) | 2012-08-08 |
RU2461144C2 (ru) | 2012-09-10 |
DE102007048973A1 (de) | 2009-04-16 |
DE502008003378D1 (de) | 2011-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101100610B1 (ko) | 음성 신호 처리를 이용한 멀티-채널 신호 발생 장치 및 방법 | |
US10685638B2 (en) | Audio scene apparatus | |
JP4664431B2 (ja) | アンビエンス信号を生成するための装置および方法 | |
Baumgarte et al. | Binaural cue coding-Part I: Psychoacoustic fundamentals and design principles | |
US8588427B2 (en) | Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program | |
EP2064699B1 (en) | Method and apparatus for extracting and changing the reverberant content of an input signal | |
US7412380B1 (en) | Ambience extraction and modification for enhancement and upmix of audio signals | |
KR101989062B1 (ko) | 오디오 신호를 향상시키기 위한 장치 및 방법 및 음향 향상 시스템 | |
US9743215B2 (en) | Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio | |
KR101710544B1 (ko) | 스펙트럼 무게 발생기를 사용하는 주파수-영역 처리를 이용하는 스테레오 레코딩 분해를 위한 방법 및 장치 | |
Czyżewski et al. | Adaptive personal tuning of sound in mobile computers | |
Uhle et al. | A supervised learning approach to ambience extraction from mono recordings for blind upmixing | |
Negru et al. | Automatic Audio Upmixing Based on Source Separation and Ambient Extraction Algorithms | |
Paulus et al. | Geometrically-Motivated Primary-Ambient Decomposition With Center-Channel Extraction | |
JP2023012347A (ja) | 音響装置および音響制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20141201 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20151215 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20161219 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20171214 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20181217 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20191217 Year of fee payment: 9 |