KR101312451B1 - 복수의 음원이 출력되는 환경하에서 음성 인식에 이용될 음성 신호의 추출 방법 및 음성 신호의 추출 장치 - Google Patents
복수의 음원이 출력되는 환경하에서 음성 인식에 이용될 음성 신호의 추출 방법 및 음성 신호의 추출 장치 Download PDFInfo
- Publication number
- KR101312451B1 KR101312451B1 KR1020130037214A KR20130037214A KR101312451B1 KR 101312451 B1 KR101312451 B1 KR 101312451B1 KR 1020130037214 A KR1020130037214 A KR 1020130037214A KR 20130037214 A KR20130037214 A KR 20130037214A KR 101312451 B1 KR101312451 B1 KR 101312451B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- noise
- audio
- speech
- frequency
- Prior art date
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 58
- 230000005236 sound signal Effects 0.000 claims abstract description 103
- 238000000034 method Methods 0.000 claims abstract description 29
- 230000002194 synthesizing effect Effects 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 28
- 230000006870 function Effects 0.000 description 15
- 239000013598 vector Substances 0.000 description 12
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 11
- 229910052709 silver Inorganic materials 0.000 description 11
- 239000004332 silver Substances 0.000 description 11
- 239000000284 extract Substances 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 2
- 241001025261 Neoraja caerulea Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
본 발명을 이용함으로써, 경제적으로 높은 음성 인식률을 제공할 수 있도록 한다.
Description
도 2는, 음성 신호 추출 장치의 제 1의 예시적인 하드웨어 블록도를 도시한 도면이다.
도 3은, 음성 신호 추출 장치의 제 2의 예시적인 하드웨어 블록도를 도시한 도면이다.
도 4는, 음성 신호 추출 장치의 제 3의 예시적인 하드웨어 블록도를 도시한 도면이다.
도 5는, 음성 신호 추출 장치의 예시적인 기능 블록도를 도시한 도면이다.
도 6은, 음성 신호 추출 장치에서 이루어지는 음성 인식에 이용될 음성 신호를 추출하기 위한 제어 흐름을 도시한 도면이다.
105 : 메모리 107 : 대용량 저장 매체
109 : 오디오 ADC 111 : 오디오 DAC
113 : 프로세서 115 : 노래용 마이크 단자
117 : 잡음용 마이크 단자 119 : 음성 인식용 마이크 단자
121 : 좌측 스피커 출력 단자 123 : 우측 스피커 출력 단자
125 : 시스템 버스/제어 버스 127 : 무선 인터페이스
201 : 아날로그 합성부 203 : 아날로그-디지털 변환부
205 : 시간-주파수 변환부 207 : 잡음 신호 추정부
209 : 목적 신호 생성부 211 : 음성 신호 생성부
213 : 구간 추정부 215 : 계수 갱신부
217 : 게인 결정부 219 : 음성 인식부
221 : 기능 제어부
Claims (10)
- 복수의 음원이 출력되는 환경하에서 음성 인식에 이용될 음성 신호의 추출 방법으로서, 노래 반주 장치에서 수행되는 상기 음성 신호의 추출 방법은,
(a) 하나의 마이크를 통해 수신되는 제 1 오디오 신호와 상기 하나의 마이크와 상이한 복수의 마이크를 통해 수신되는 제 2 오디오 신호에 기초하여 잡음 구간인지 상기 음성 신호가 수신되는 목적 구간인지를 추정하는 단계;
(b) 상기 단계 (a)에서의 추정이 잡음 구간인 경우에, 상기 제 2 오디오 신호로부터 추정될 잡음 신호에 적용되는 필터 계수를 갱신하는 단계; 및
(c) 음성 인식에 이용될 음성 신호의 추출을 위해, 갱신된 필터 계수를 이용하여 제 2 오디오 신호로부터 잡음 신호를 추정하는 단계;를 포함하며,
상기 필터 계수는, 잡음 구간인 동안에 갱신되며,
상기 제 2 오디오 신호는, 상기 복수의 마이크로부터 각각 수신된 아날로그 오디오 신호를 믹싱한 후에 생성되는 시간 도메인 상의 디지털의 오디오 프레임을 주파수 도메인으로 변환한 주파수 신호이거나, 상기 복수의 마이크로부터 수신된 오디오 신호와 상기 노래 반주 장치에서 생성되어 출력되는 재생 음원의 오디오 신호를 합성한 후에 주파수 도메인으로 변환된 신호인,
음성 신호의 추출 방법. - 제1항에 있어서,
(d) 제 1 오디오 신호에서 상기 추정된 잡음 신호를 차감하여 목적 신호를 생성하는 단계;를 더 포함하며,
상기 단계 (a)는, 생성된 목적 신호와 추정된 잡음 신호 사이에 계산되는 상관 계수가, 지정된 임계치 이하인 경우에 목적 구간으로 추정하고, 지정된 임계치를 초과하는 경우에 잡음 구간으로 추정하는,
음성 신호의 추출 방법. - 제1항에 있어서,
상기 단계 (a)는, 제 1 오디오 신호와 제 2 오디오 신호의 연속적으로 수신된 복수의 오디오 프레임에 대하여 변환된 주파수 신호 사이의 파워 비(ratio of power)에 따라 목적 구간인지 잡음 구간인지를 추정하는,
음성 신호의 추출 방법. - 제2항에 있어서,
목적 신호의 주파수 신호와 상기 잡음 신호의 주파수 신호에 대한 파워(power)의 비에 기초하여, 목적 신호에 적용할 게인(gain)을 결정하는 단계; 및
결정된 게인을 이용하여 목적 신호로부터 음성 인식에 이용될 음성 신호를 생성하는 단계;를 더 포함하며,
상기 잡음 신호의 주파수 신호에 대한 파워는, 상기 잡음 구간인 동안에 결정되는,
음성 신호의 추출 방법. - 삭제
- 복수의 음원이 출력되는 환경하에서 음성 인식에 이용될 음성 신호의 추출 장치로서,
하나의 마이크를 통해 수신되는 제 1 오디오 신호와 상기 하나의 마이크와 상이한 하나 이상의 마이크를 통해 수신되는 제 2 오디오 신호에 기초하여 잡음 구간인지 상기 음성 신호가 수신되는 목적 구간인지를 추정하는, 구간 추정부;
상기 구간 추정부에서의 추정이 잡음 구간인 경우에, 상기 제 2 오디오 신호로부터 추정될 잡음 신호에 적용되는 필터 계수를 갱신하는, 계수 갱신부;
음성 인식에 이용될 음성 신호의 추출을 위해, 갱신된 필터 계수를 이용하여 제 2 오디오 신호로부터 잡음 신호를 추정하는, 잡음 신호 추정부;
제 1 오디오 신호에서 상기 추정된 잡음 신호를 차감하여 목적 신호를 생성하는 목적 신호 생성부;
목적 신호의 주파수 신호와 상기 잡음 신호의 주파수 신호에 대한 파워의 비(ratio of power)에 기초하여, 목적 신호에 적용할 게인(gain)을 결정하는, 게인 결정부; 및
결정된 게인을 이용하여 목적 신호로부터 음성 인식에 이용될 음성 신호를 생성하는, 음성 신호 생성부;를 포함하며,
상기 필터 계수는, 잡음 구간인 동안에 갱신되며, 상기 잡음 신호의 주파수 신호에 대한 파워는, 상기 잡음 구간인 동안에 결정되는,
음성 신호의 추출 장치. - 제6항에 있어서
상기 구간 추정부는, 생성된 목적 신호와 추정된 잡음 신호 사이에 계산되는 상관 계수가, 지정된 임계치 이하인 경우에 목적 구간으로 추정하고, 지정된 임계치를 초과하는 경우에 잡음 구간으로 추정하며,
상기 필터 계수는, 목적 신호의 주파수 신호가 최소가 되도록, 제 1 오디오 신호의 주파수 신호와 목적 신호의 주파수 신호와 제 2 오디오 신호의 주파수 신호의 관계에 따라 결정되는,
음성 신호의 추출 장치. - 삭제
- 제6항에 있어서,
상기 하나의 마이크와 상이한 복수의 마이크로부터 각각 수신된 아날로그 오디오 신호를 합성하는 아날로그 합성부;
합성된 아날로그 오디오 신호로부터 디지털의 오디오 신호로 변환하기 위한 아날로그-디지털 변환부; 및
변환된 디지털의 오디오 신호를 주파수 도메인의 주파수 신호로 변환하여 상기 제 2 오디오 신호를 생성하기 위한 시간-주파수 변환부;를 더 포함하며,
상기 음성 신호의 추출 장치는, 노래 반주 장치인,
음성 신호의 추출 장치. - 제6항에 있어서,
상기 구간 추정부는, 제 1 오디오 신호와 제 2 오디오 신호의 연속적으로 수신된 복수의 오디오 프레임에 대하여 변환된 주파수 신호 사이의 파워 비(ratio of power)에 따라 목적 구간인지 잡음 구간인지를 추정하는,
음성 신호의 추출 장치.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130037214A KR101312451B1 (ko) | 2013-04-05 | 2013-04-05 | 복수의 음원이 출력되는 환경하에서 음성 인식에 이용될 음성 신호의 추출 방법 및 음성 신호의 추출 장치 |
PCT/KR2013/004042 WO2014163231A1 (ko) | 2013-04-05 | 2013-05-08 | 복수의 음원이 출력되는 환경하에서 음성 인식에 이용될 음성 신호의 추출 방법 및 음성 신호의 추출 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020130037214A KR101312451B1 (ko) | 2013-04-05 | 2013-04-05 | 복수의 음원이 출력되는 환경하에서 음성 인식에 이용될 음성 신호의 추출 방법 및 음성 신호의 추출 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101312451B1 true KR101312451B1 (ko) | 2013-09-27 |
Family
ID=49456888
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020130037214A KR101312451B1 (ko) | 2013-04-05 | 2013-04-05 | 복수의 음원이 출력되는 환경하에서 음성 인식에 이용될 음성 신호의 추출 방법 및 음성 신호의 추출 장치 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR101312451B1 (ko) |
WO (1) | WO2014163231A1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11398241B1 (en) * | 2021-03-31 | 2022-07-26 | Amazon Technologies, Inc. | Microphone noise suppression with beamforming |
US11418877B2 (en) | 2019-11-21 | 2022-08-16 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
US11741934B1 (en) | 2021-11-29 | 2023-08-29 | Amazon Technologies, Inc. | Reference free acoustic echo cancellation |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107105095B (zh) * | 2017-04-25 | 2020-03-31 | 努比亚技术有限公司 | 一种声音处理方法及移动终端 |
CN113808605B (zh) * | 2021-09-29 | 2023-09-12 | 睿云联(厦门)网络通讯技术有限公司 | 一种基于楼宇对讲系统的语音增强方法和装置以及设备 |
CN114979734B (zh) * | 2022-05-17 | 2024-04-02 | 歌尔科技有限公司 | 一种语音控制遥控器及其降噪方法和电视机 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010054728A (ja) * | 2008-08-27 | 2010-03-11 | Hitachi Ltd | 音源抽出装置 |
KR20100040664A (ko) * | 2008-10-10 | 2010-04-20 | 삼성전자주식회사 | 잡음 추정 장치 및 방법과, 이를 이용한 잡음 감소 장치 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100940629B1 (ko) * | 2008-01-29 | 2010-02-05 | 한국과학기술원 | 잡음 제거 장치 및 방법 |
KR101811716B1 (ko) * | 2011-02-28 | 2017-12-28 | 삼성전자주식회사 | 음성 인식 방법 및 그에 따른 음성 인식 장치 |
-
2013
- 2013-04-05 KR KR1020130037214A patent/KR101312451B1/ko active IP Right Grant
- 2013-05-08 WO PCT/KR2013/004042 patent/WO2014163231A1/ko active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010054728A (ja) * | 2008-08-27 | 2010-03-11 | Hitachi Ltd | 音源抽出装置 |
KR20100040664A (ko) * | 2008-10-10 | 2010-04-20 | 삼성전자주식회사 | 잡음 추정 장치 및 방법과, 이를 이용한 잡음 감소 장치 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11418877B2 (en) | 2019-11-21 | 2022-08-16 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
US11398241B1 (en) * | 2021-03-31 | 2022-07-26 | Amazon Technologies, Inc. | Microphone noise suppression with beamforming |
US11741934B1 (en) | 2021-11-29 | 2023-08-29 | Amazon Technologies, Inc. | Reference free acoustic echo cancellation |
Also Published As
Publication number | Publication date |
---|---|
WO2014163231A1 (ko) | 2014-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12159086B2 (en) | Device arbitration by multiple speech processing systems | |
KR101312451B1 (ko) | 복수의 음원이 출력되는 환경하에서 음성 인식에 이용될 음성 신호의 추출 방법 및 음성 신호의 추출 장치 | |
US12125483B1 (en) | Determining device groups | |
CN108074557B (zh) | 音调调整方法、装置及存储介质 | |
US9837068B2 (en) | Sound sample verification for generating sound detection model | |
CN107533848B (zh) | 用于话音恢复的系统和方法 | |
TW201503107A (zh) | 語音控制系統、電子裝置及語音控制方法 | |
JP2004347761A (ja) | 音声認識装置、音声認識方法、該音声認識方法をコンピュータに対して実行させるためのコンピュータ実行可能なプログラムおよび記憶媒体 | |
CN113841196A (zh) | 利用语音唤醒执行语音识别的方法和装置 | |
US20190180758A1 (en) | Voice processing apparatus, voice processing method, and non-transitory computer-readable storage medium for storing program | |
CN113270082A (zh) | 一种车载ktv控制方法及装置、以及车载智能网联终端 | |
US20150262589A1 (en) | Sound processor, sound processing method, program, electronic device, server, client device, and sound processing system | |
WO2010061505A1 (ja) | 発話音声検出装置 | |
JP2016042152A (ja) | 音声認識装置及びプログラム | |
US10592204B2 (en) | User interface device and method, and sound-enabled operation system | |
US12136428B1 (en) | Audio watermarking | |
KR101863098B1 (ko) | 음성 인식 장치 및 방법 | |
JP2019015950A (ja) | 音声認識方法、プログラム、音声認識装置、及びロボット | |
KR101400258B1 (ko) | 음성 인식을 이용한 이미지 표시 방법 | |
KR101429138B1 (ko) | 복수의 사용자를 위한 장치에서의 음성 인식 방법 | |
US20070269056A1 (en) | Method and Apparatus for Audio Signal Expansion and Compression | |
JP7200597B2 (ja) | 情報処理方法および情報処理システム | |
CN112133320A (zh) | 语音处理装置及语音处理方法 | |
JP6559051B2 (ja) | 発声機能を備えたロボット装置、発声制御方法およびプログラム | |
JP6998289B2 (ja) | 抽出装置、学習装置、抽出方法、抽出プログラム、学習方法および学習プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20130405 |
|
PA0201 | Request for examination | ||
A302 | Request for accelerated examination | ||
PA0302 | Request for accelerated examination |
Patent event date: 20130528 Patent event code: PA03022R01D Comment text: Request for Accelerated Examination Patent event date: 20130405 Patent event code: PA03021R01I Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20130625 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20130830 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20130923 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20130924 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20161222 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20161222 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20180312 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20180312 Start annual number: 5 End annual number: 5 |
|
FPAY | Annual fee payment |
Payment date: 20180903 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20180903 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20190827 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20190827 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20200831 Start annual number: 8 End annual number: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20210831 Start annual number: 9 End annual number: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20220831 Start annual number: 10 End annual number: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20240829 Start annual number: 12 End annual number: 12 |