KR101641645B1 - 오디오 소스 분리 방법 및 이를 적용한 오디오 시스템 - Google Patents
오디오 소스 분리 방법 및 이를 적용한 오디오 시스템 Download PDFInfo
- Publication number
- KR101641645B1 KR101641645B1 KR1020140070876A KR20140070876A KR101641645B1 KR 101641645 B1 KR101641645 B1 KR 101641645B1 KR 1020140070876 A KR1020140070876 A KR 1020140070876A KR 20140070876 A KR20140070876 A KR 20140070876A KR 101641645 B1 KR101641645 B1 KR 101641645B1
- Authority
- KR
- South Korea
- Prior art keywords
- audio
- signal
- separating
- sources
- audio signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 20
- 230000005236 sound signal Effects 0.000 claims abstract description 62
- 238000000926 separation method Methods 0.000 claims abstract description 34
- 230000005284 excitation Effects 0.000 claims description 46
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Stereophonic System (AREA)
- Mathematical Physics (AREA)
Abstract
Description
도 2는 실제 오디오 신호와 오디오 소스들 간의 관계를 나타낸 도면,
도 3은 본 발명의 일 실시예에 따른 오디오 시스템의 블럭도, 그리고,
도 4 내지 도 7에는 오디오 분리 성능 평가 결과를 나타낸 그래프들이다.
120 : 파라미터 업데이트부
130 : 여기 신호 분리부
140 : 오디오 소스 합성부
Claims (7)
- 믹싱된 오디오 신호를 입력받는 단계; 및
입력된 믹싱된 오디오 신호를 다수의 오디오 소스들과 제1 여기 신호로 분리하는 제1 분리단계;를 포함하고,
상기 제1 여기 신호는,
상기 다수의 오디오 소스들 중 적어도 2개에 공통되는 오디오 신호인 것을 특징으로 하는 오디오 분리 방법.
- 삭제
- 제 1항에 있어서,
상기 제1 분리단계에서 분리된 상기 여기 신호를, 상기 오디오 소스들 각각에 해당하는 여기 신호들과 제2 여기 신호로 분리하는 제2 분리단계; 및
상기 여기 신호들을 상기 오디오 소스들에 각각 부가하는 단계;를 더 포함하는 것을 특징으로 하는 오디오 분리 방법.
- 제 3항에 있어서,
상기 제1 분리 단계 및 상기 제2 분리단계는, NMF-EM(Nonnegative Matrix Factorization - Expectation Maximization) 기법을 이용하여, 분리 작업을 수행하고,
상기 제2 분리단계는,
상기 제1 분리단계에서 사용한 초기 파라미터들 및 상기 제1 분리단계에 의해 업데이트된 파라미터들을 기초로 결정한 파라미터들을 이용하는 것을 특징으로 하는 오디오 분리 방법.
- 제 4항에 있어서,
상기 제2 분리단계는,
상기 결정한 파라미터들에 가중치를 부가한 파라미터들을 이용하는 것을 특징으로 하는 오디오 분리 방법.
- 제 5항에 있어서,
상기 가중치는,
상기 믹싱된 오디오 신호의 절대 파워 평균과 상기 제1 여기 신호의 절대 파워 평균을 기초로 결정되는 것을 특징으로 하는 오디오 분리 방법.
- 믹싱된 오디오 신호를 입력받는 입력부; 및
입력된 믹싱된 오디오 신호를 다수의 오디오 소스들과 제1 여기 신호로 분리하는 분리부;를 포함하고,
상기 제1 여기 신호는,
상기 다수의 오디오 소스들 중 적어도 2개에 공통되는 오디오 신호인 것을 특징으로 하는 오디오 시스템.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140070876A KR101641645B1 (ko) | 2014-06-11 | 2014-06-11 | 오디오 소스 분리 방법 및 이를 적용한 오디오 시스템 |
US14/553,188 US9466312B2 (en) | 2014-06-11 | 2014-11-25 | Method for separating audio sources and audio system using the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140070876A KR101641645B1 (ko) | 2014-06-11 | 2014-06-11 | 오디오 소스 분리 방법 및 이를 적용한 오디오 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150142777A KR20150142777A (ko) | 2015-12-23 |
KR101641645B1 true KR101641645B1 (ko) | 2016-07-22 |
Family
ID=54837294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020140070876A KR101641645B1 (ko) | 2014-06-11 | 2014-06-11 | 오디오 소스 분리 방법 및 이를 적용한 오디오 시스템 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9466312B2 (ko) |
KR (1) | KR101641645B1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105989851B (zh) * | 2015-02-15 | 2021-05-07 | 杜比实验室特许公司 | 音频源分离 |
KR101864925B1 (ko) * | 2016-02-05 | 2018-06-05 | 전자부품연구원 | 글로벌 모델 기반 오디오 객체 분리 방법 및 시스템 |
US10667069B2 (en) * | 2016-08-31 | 2020-05-26 | Dolby Laboratories Licensing Corporation | Source separation for reverberant environment |
CN111696572B (zh) * | 2019-03-13 | 2023-07-18 | 富士通株式会社 | 语音分离装置、方法及介质 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AUPP272598A0 (en) * | 1998-03-31 | 1998-04-23 | Lake Dsp Pty Limited | Wavelet conversion of 3-d audio signals |
KR100923156B1 (ko) * | 2006-05-02 | 2009-10-23 | 한국전자통신연구원 | 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법 |
AU2007300810B2 (en) * | 2006-09-29 | 2010-06-17 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
EP2201566B1 (en) * | 2007-09-19 | 2015-11-11 | Telefonaktiebolaget LM Ericsson (publ) | Joint multi-channel audio encoding/decoding |
KR20110018107A (ko) * | 2009-08-17 | 2011-02-23 | 삼성전자주식회사 | 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치 |
KR101613975B1 (ko) * | 2009-08-18 | 2016-05-02 | 삼성전자주식회사 | 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치 |
KR101710113B1 (ko) * | 2009-10-23 | 2017-02-27 | 삼성전자주식회사 | 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 |
US20110194709A1 (en) * | 2010-02-05 | 2011-08-11 | Audionamix | Automatic source separation via joint use of segmental information and spatial diversity |
KR101375432B1 (ko) * | 2010-06-21 | 2014-03-17 | 한국전자통신연구원 | 통합 음원 분리 방법 및 장치 |
KR101341188B1 (ko) * | 2012-01-25 | 2013-12-12 | 세종대학교산학협력단 | Nmf 알고리즘을 이용한 음성 신호 코딩 장치 및 그 방법 |
EP2845191B1 (en) * | 2012-05-04 | 2019-03-13 | Xmos Inc. | Systems and methods for source signal separation |
US10595144B2 (en) * | 2014-03-31 | 2020-03-17 | Sony Corporation | Method and apparatus for generating audio content |
-
2014
- 2014-06-11 KR KR1020140070876A patent/KR101641645B1/ko not_active Application Discontinuation
- 2014-11-25 US US14/553,188 patent/US9466312B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20150365766A1 (en) | 2015-12-17 |
KR20150142777A (ko) | 2015-12-23 |
US9466312B2 (en) | 2016-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101641645B1 (ko) | 오디오 소스 분리 방법 및 이를 적용한 오디오 시스템 | |
JP7208126B2 (ja) | マルチチャンネル信号を符号化又は復号化するための装置と方法 | |
JP4918490B2 (ja) | エネルギー整形装置及びエネルギー整形方法 | |
EP1921605B1 (en) | Multi-channel acoustic signal processing device | |
RU2016141784A (ru) | Устройство и способ рендеринга звука с использованием определения геометрического расстояния | |
KR101697550B1 (ko) | 멀티채널 오디오 대역폭 확장 장치 및 방법 | |
KR20160011580A (ko) | 화상 수신 장치, 화상 전송 시스템 및 화상 수신 방법 | |
JP2008129541A (ja) | 復号化装置および復号化方法 | |
RU2017105507A (ru) | Устройство и способ формирования расширенного сигнала с использованием заполнения независимым шумом | |
TW201537562A (zh) | 將高階保真立體音響信號壓縮之方法,將已壓縮高階保真立體音響信號解壓縮之方法,將高階保真立體音響信號壓縮之裝置,以及將已壓縮高階保真立體音響信號解壓縮之裝置 | |
JP2017526004A5 (ko) | ||
KR101129877B1 (ko) | 음향 신호 복호 장치 | |
HRP20191107T1 (hr) | Parametarsko miješanje audio signala | |
JP2009217583A (ja) | パターン認識装置及びその方法 | |
CN107945813B (zh) | 解码方法、解码装置、和计算机可读取的记录介质 | |
US20110112842A1 (en) | Method and apparatus for editing audio object in spatial information-based multi-object audio coding apparatus | |
RU2017110842A (ru) | Способ декодирования и декодер для усиления диалога | |
EP3050054B1 (en) | Audio signal processing for generating a downmix signal | |
Tchernev et al. | Modules over categories and Betti posets of monomial ideals | |
JP2003316394A (ja) | 音声復号システム、及び、音声復号方法、並びに、音声復号プログラム | |
KR20180084663A (ko) | 영상 신호 부호화/복호화 방법 및 장치 | |
KR101511553B1 (ko) | 다중 단계 오디오 분리 방법 및 이를 적용한 오디오 시스템 | |
JP5268964B2 (ja) | 信号分離装置 | |
KR101864925B1 (ko) | 글로벌 모델 기반 오디오 객체 분리 방법 및 시스템 | |
US8345884B2 (en) | Signal separation reproduction device and signal separation reproduction method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20140611 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20150612 Patent event code: PE09021S01D |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20151221 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20160615 |
|
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20160715 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20160715 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |