KR20110018727A - 사운드에서 오브젝트 분리 방법 및 장치 - Google Patents
사운드에서 오브젝트 분리 방법 및 장치 Download PDFInfo
- Publication number
- KR20110018727A KR20110018727A KR1020090076337A KR20090076337A KR20110018727A KR 20110018727 A KR20110018727 A KR 20110018727A KR 1020090076337 A KR1020090076337 A KR 1020090076337A KR 20090076337 A KR20090076337 A KR 20090076337A KR 20110018727 A KR20110018727 A KR 20110018727A
- Authority
- KR
- South Korea
- Prior art keywords
- objects
- subbands
- audio signal
- subband
- sound
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000005236 sound signal Effects 0.000 claims abstract description 39
- 238000000926 separation method Methods 0.000 claims abstract description 19
- 230000006870 function Effects 0.000 claims description 22
- 238000013507 mapping Methods 0.000 claims description 13
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 238000012886 linear function Methods 0.000 claims 1
- 239000000284 extract Substances 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 2
- 208000023514 Barrett esophagus Diseases 0.000 description 1
- 241001342895 Chorus Species 0.000 description 1
- ZYXYTGQFPZEUFX-UHFFFAOYSA-N benzpyrimoxan Chemical compound O1C(OCCC1)C=1C(=NC=NC=1)OCC1=CC=C(C=C1)C(F)(F)F ZYXYTGQFPZEUFX-UHFFFAOYSA-N 0.000 description 1
- HAORKNGNJCEJBX-UHFFFAOYSA-N cyprodinil Chemical compound N=1C(C)=CC(C2CC2)=NC=1NC1=CC=CC=C1 HAORKNGNJCEJBX-UHFFFAOYSA-N 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Abstract
Description
Claims (18)
- 사운드에서의 오브젝트 분리 방법에 있어서,비트 스트림으로 부터 가상 음상 위치 정보와 오디오 신호를 추출하는 과정;상기 가상 음상 위치에 근거하여 오디오 신호에 포함된 오브젝트를 분리하는 과정;상기 가상 음상 위치에 존재하는 이전 프레임의 오브젝트들과 현재 프레임의 오브젝트들을 매핑하는 과정;연속된 프레임들간에 상기 매핑된 오브젝트들을 추출하는 과정을 포함하는 사운드에서의 오브젝트 분리 방법.
- 제1항에 있어서, 상기 가상 음상 위치 정보는 비트스트림의 부가 정보로부터 추출하거나 복수 채널의 오디오 신호의 크기에 기반하여 추출되는 것임을 특징으로 하는 사운드에서의 오브젝트 분리 방법.
- 제1항에 있어서, 상기 오브젝트 분리 과정은프레임을 기준으로 상기 가상 음상 위치에 존재하는 서브밴드들을 임시 오브젝트로 결정하는 과정,상기 임시 오브젝트의 서브밴드들의 움직임을 체크하고, 그 임시 오브젝트의 서브밴드들이 일정 방향으로 움직이면 상기 임시 오브젝트를 유효 오브젝트로 결정 하는 과정을 구비하는 것을 특징으로 하는 사운드에서의 오브젝트 분리 방법.
- 제3항에 있어서, 상기 임시 오브젝트 결정 과정은한 프레임내에서 각 서브밴드별 가상 음상 위치 및 각 서브밴드별 에너지를 추출하는 과정;상기 서브밴드들중에서 가장 큰 에너지를 갖는 서브밴드를 선택하는 과정;상기 선택된 서브밴드를 중심으로 미리 정의한 함수를 이용하여 상기 가상 음상 위치들에 존재하는 복수개의 서브밴드들을 추출하는 과정;상기 추출된 복수개 서브밴드들을 임시 오브젝트로 결정하는 과정을 구비하는 것을 특징으로 하는 사운드에서의 오브젝트 분리 방법.
- 제4항에 있어서, 상기 미리 정의한 함수는 서브 밴드별 가상 음상 위치와 서브 밴드별 에너지를 이용한 스프레딩 함수임을 특징으로 하는 사운드에서의 오브젝트 분리 방법.
- 제4항에 있어서, 상기 스프레딩 함수는 소정개수의 일차 함수로 표현하고,그 함수의 절편은 중심 서브밴드의 에너지와 가상 음상 위치에 따라 결정되는 것임을 특징으로 하는 사운드에서의 오브젝트 분리 방법.
- 제3항에 있어서, 상기 유효 오브젝트의 결정 과정은이전 프레임의 임시 오브젝트의 서브밴드들이 존재하는 가상 음상 위치와 현재 프레임의 임시 오브젝트의 서브밴드들이 존재하는 가상 음상 위치 사이의 차이값을 구하고,그 차이값에 근거하여 서브 밴드들의 움직임 분산값을 획득하고,상기 서브 밴드들의 움직임 분산값이 임계치 보다 적으면 임시 오브젝트 결정 과정에서 결정된 임시 오브젝트를 유효 오브젝트로 결정하는 것임을 특징으로 하는 사운드에서의 오브젝트 분리 방법.
- 제1항에 있어서, 상기 오브젝트들의 매핑 과정은이전 프레임의 오브젝트와 현재 프레임의 오브젝트간의 체크 파라메터를 정의하고,상기 오브젝트들간의 체크 파라메터를 조합하여 여러 가지 조건을 만들고, 이 조건에 따라 오브젝트간의 동질성을 판별하는 것을 특징으로 하는 사운드에서의 오브젝트 분리 방법.
- 제1항에 있어서, 상기 오브젝트들의 매핑 과정은프레임별 오브젝트들간의 주파수 성분 차이 및 상대적인 위치 차이 및 에너지와 미리 정해진 임계치를 비교하여 프레임별 오브젝트들의 동질성을 판별하는 것임을 특징으로 하는 사운드에서의 오브젝트 분리 방법.
- 제9항에 있어서, 상기 오브젝트들간의 상대적인 위치 차이는 각 오브젝트의 중심 서브밴드들의 가상 음상 위치 정보를 기반으로 획득하는 것임을 특징으로 하는 사운드에서의 오브젝트 분리 방법.
- 제9항에 있어서, 상기 프레임별 오브젝트들의 동질성 판별 과정은두 오브젝트간에 주파수 성분 차이가 임계치보다 적은 제1조건,두 오브젝트간의 발생 위치 차이와 에너지 차이가 임계치보다 적은 제2조건,두 오브젝트간에 주파수 성분 차이가 임계치보다 적거나 두 오브젝트간의 발생 위치 차이가 임계보다 큰 제3조건들중에서 어느 하나를 만족할 경우 두 오브젝트들은 서로 동일한 오브젝트임을 결정하는 것임을 특징으로 하는 사운드에서의 오브젝트 분리 방법.
- 제9항에 있어서, 상기 오브젝트들간의 성분 차이는 각 오브젝트가 갖는 서브 밴드들의 인덱스들을 기반으로 획득하는 것임을 특징으로 하는 사운드에서의 오브젝트 분리 방법.
- 제1항에 있어서, 상기 오디오 신호로부터 분리된 오브젝트들중에서 특정 오브젝트들을 합성하는 과정을 더 포함하는 것을 특징으로 하는 사운드에서의 오브젝트 분리 방법.
- 제1항에 있어서, 상기 오디오 신호로부터 분리된 오브젝트들중에서 특정 오브젝트를 묵음으로 설정하는 과정을 더 포함하는 것을 특징으로 하는 사운드에서의 오브젝트 분리 방법.
- 사운드에서의 오브젝트 분리 장치에 있어서,비트스트림으로부터 오디오 신호와 가상 음상 위치 정보를 디코딩하는 오디오 디코딩부;상기 오디오 디코딩부에서 추출된 가상 음상 위치 정보와 서브밴드 에너지에 근거하여 오디오 신호에서 오브젝트를 분리하는 오브젝트 분리부;복수개의 체크 파라메터를 근거로 가상 음상 위치에 존재하는 이전 프레임의 오브젝트들과 현재 프레임의 오브젝트들을 매핑하는 오브젝트 맵핑부를 포함하는 사운드에서의 오브젝트 분리 장치.
- 제15항에 있어서, 상기 오브젝트 분리부에서 분리된 오브젝트들의 움직임에 근거하여 해당 오브젝트의 유효성을 검증하는 오브젝트 움직임 추정부를 더 구비하는 것을 특징으로 하는 사운드에서의 오브젝트 분리 장치.
- 제15항에 있어서, 상기 복수개 체크 파라메터는 오브젝트간의 주파수 성분 차이, 가상 음상 위치 차이, 에너지 차이임을 특징으로 하는 사운드에서의 오브젝 트 분리 장치.
- 제1항의 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090076337A KR101600354B1 (ko) | 2009-08-18 | 2009-08-18 | 사운드에서 오브젝트 분리 방법 및 장치 |
US12/697,647 US20110046759A1 (en) | 2009-08-18 | 2010-02-01 | Method and apparatus for separating audio object |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090076337A KR101600354B1 (ko) | 2009-08-18 | 2009-08-18 | 사운드에서 오브젝트 분리 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110018727A true KR20110018727A (ko) | 2011-02-24 |
KR101600354B1 KR101600354B1 (ko) | 2016-03-07 |
Family
ID=43605979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090076337A KR101600354B1 (ko) | 2009-08-18 | 2009-08-18 | 사운드에서 오브젝트 분리 방법 및 장치 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20110046759A1 (ko) |
KR (1) | KR101600354B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101406398B1 (ko) * | 2012-06-29 | 2014-06-13 | 인텔렉추얼디스커버리 주식회사 | 사용자 음원 평가 장치, 방법 및 기록 매체 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8762158B2 (en) * | 2010-08-06 | 2014-06-24 | Samsung Electronics Co., Ltd. | Decoding method and decoding apparatus therefor |
US9336791B2 (en) * | 2013-01-24 | 2016-05-10 | Google Inc. | Rearrangement and rate allocation for compressing multichannel audio |
GB2515089A (en) * | 2013-06-14 | 2014-12-17 | Nokia Corp | Audio Processing |
WO2015003312A1 (en) | 2013-07-09 | 2015-01-15 | Hua Zhong University Of Science Technology | Data communication on a virtual machine |
CN104683933A (zh) * | 2013-11-29 | 2015-06-03 | 杜比实验室特许公司 | 音频对象提取 |
CN105336335B (zh) | 2014-07-25 | 2020-12-08 | 杜比实验室特许公司 | 利用子带对象概率估计的音频对象提取 |
US10349196B2 (en) | 2016-10-03 | 2019-07-09 | Nokia Technologies Oy | Method of editing audio signals using separated objects and associated apparatus |
US11386913B2 (en) | 2017-08-01 | 2022-07-12 | Dolby Laboratories Licensing Corporation | Audio object classification based on location metadata |
US11532317B2 (en) * | 2019-12-18 | 2022-12-20 | Munster Technological University | Audio interactive decomposition editor method and system |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020133333A1 (en) * | 2001-01-24 | 2002-09-19 | Masashi Ito | Apparatus and program for separating a desired sound from a mixed input sound |
US20030097269A1 (en) * | 2001-10-25 | 2003-05-22 | Canon Kabushiki Kaisha | Audio segmentation with the bayesian information criterion |
US20060215854A1 (en) * | 2005-03-23 | 2006-09-28 | Kaoru Suzuki | Apparatus, method and program for processing acoustic signal, and recording medium in which acoustic signal, processing program is recorded |
KR20090067550A (ko) * | 2007-12-21 | 2009-06-25 | 삼성전자주식회사 | 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7970144B1 (en) * | 2003-12-17 | 2011-06-28 | Creative Technology Ltd | Extracting and modifying a panned source for enhancement and upmix of audio signals |
US8027478B2 (en) * | 2004-04-16 | 2011-09-27 | Dublin Institute Of Technology | Method and system for sound source separation |
JP3906230B2 (ja) * | 2005-03-11 | 2007-04-18 | 株式会社東芝 | 音響信号処理装置、音響信号処理方法、音響信号処理プログラム、及び音響信号処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP4637725B2 (ja) * | 2005-11-11 | 2011-02-23 | ソニー株式会社 | 音声信号処理装置、音声信号処理方法、プログラム |
US9426596B2 (en) * | 2006-02-03 | 2016-08-23 | Electronics And Telecommunications Research Institute | Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue |
JP4403429B2 (ja) * | 2007-03-08 | 2010-01-27 | ソニー株式会社 | 信号処理装置、信号処理方法、プログラム |
-
2009
- 2009-08-18 KR KR1020090076337A patent/KR101600354B1/ko not_active IP Right Cessation
-
2010
- 2010-02-01 US US12/697,647 patent/US20110046759A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020133333A1 (en) * | 2001-01-24 | 2002-09-19 | Masashi Ito | Apparatus and program for separating a desired sound from a mixed input sound |
US20030097269A1 (en) * | 2001-10-25 | 2003-05-22 | Canon Kabushiki Kaisha | Audio segmentation with the bayesian information criterion |
US20060215854A1 (en) * | 2005-03-23 | 2006-09-28 | Kaoru Suzuki | Apparatus, method and program for processing acoustic signal, and recording medium in which acoustic signal, processing program is recorded |
KR20090067550A (ko) * | 2007-12-21 | 2009-06-25 | 삼성전자주식회사 | 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101406398B1 (ko) * | 2012-06-29 | 2014-06-13 | 인텔렉추얼디스커버리 주식회사 | 사용자 음원 평가 장치, 방법 및 기록 매체 |
Also Published As
Publication number | Publication date |
---|---|
KR101600354B1 (ko) | 2016-03-07 |
US20110046759A1 (en) | 2011-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101600354B1 (ko) | 사운드에서 오브젝트 분리 방법 및 장치 | |
JP5149968B2 (ja) | スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法 | |
US9761229B2 (en) | Systems, methods, apparatus, and computer-readable media for audio object clustering | |
US7983922B2 (en) | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing | |
CN105637582B (zh) | 音频编码装置及音频解码装置 | |
RU2643644C2 (ru) | Кодирование и декодирование аудиосигналов | |
JP5291096B2 (ja) | オーディオ信号処理方法及び装置 | |
JP4664431B2 (ja) | アンビエンス信号を生成するための装置および方法 | |
CN110890101B (zh) | 用于基于语音增强元数据进行解码的方法和设备 | |
EP3172731B1 (en) | Audio object extraction with sub-band object probability estimation | |
CN111316354A (zh) | 目标空间音频参数和相关联的空间音频播放的确定 | |
CN113302692B (zh) | 基于方向响度图的音频处理 | |
KR100763919B1 (ko) | 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2 채널의 바이노럴 신호로 복호화하는 방법 및 장치 | |
WO2022014326A1 (ja) | 信号処理装置および方法、並びにプログラム | |
US8447618B2 (en) | Method and apparatus for encoding and decoding residual signal | |
CN112823534B (zh) | 信号处理设备和方法以及程序 | |
CN114631142A (zh) | 电子设备、方法和计算机程序 | |
KR20080013628A (ko) | 멀티채널 오디오 신호의 부호화/복호화 방법 및 장치,멀티채널이 다운믹스된 신호를 2 채널로 출력하는 복호화방법 및 장치 | |
US7860721B2 (en) | Audio encoding device, decoding device, and method capable of flexibly adjusting the optimal trade-off between a code rate and sound quality | |
Yang et al. | A 3D audio coding technique based on extracting the distance parameter | |
Yang et al. | Multi-channel object-based spatial parameter compression approach for 3d audio | |
CN117501361A (zh) | 用于重合立体声捕获的声道间时差(itd)估计器的提高的稳定性 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20090818 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20140818 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20090818 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20150508 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20151129 |
|
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20160229 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20160302 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |