KR100565428B1 - 인간 청각 모델을 이용한 부가잡음 제거장치 - Google Patents
인간 청각 모델을 이용한 부가잡음 제거장치 Download PDFInfo
- Publication number
- KR100565428B1 KR100565428B1 KR1020030057646A KR20030057646A KR100565428B1 KR 100565428 B1 KR100565428 B1 KR 100565428B1 KR 1020030057646 A KR1020030057646 A KR 1020030057646A KR 20030057646 A KR20030057646 A KR 20030057646A KR 100565428 B1 KR100565428 B1 KR 100565428B1
- Authority
- KR
- South Korea
- Prior art keywords
- additional noise
- human auditory
- signal
- auditory model
- unit
- Prior art date
Links
- 241000282414 Homo sapiens Species 0.000 title claims abstract description 64
- 238000001228 spectrum Methods 0.000 claims abstract description 37
- 238000000034 method Methods 0.000 claims abstract description 21
- 230000004044 response Effects 0.000 claims abstract description 18
- 238000009432 framing Methods 0.000 claims abstract description 14
- 210000000959 ear middle Anatomy 0.000 claims abstract description 12
- 230000003139 buffering effect Effects 0.000 claims abstract description 11
- 210000000883 ear external Anatomy 0.000 claims abstract description 11
- 239000013598 vector Substances 0.000 claims description 15
- 210000000056 organ Anatomy 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 239000000872 buffer Substances 0.000 claims description 6
- 230000001149 cognitive effect Effects 0.000 claims description 3
- 230000003595 spectral effect Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 abstract description 10
- 230000008569 process Effects 0.000 abstract description 9
- 230000009467 reduction Effects 0.000 abstract description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 239000000654 additive Substances 0.000 description 4
- 230000000996 additive effect Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Signal Processing (AREA)
- Pure & Applied Mathematics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Noise Elimination (AREA)
Abstract
Description
Claims (8)
- 음성 신호를 입력받아 버퍼링하고, 일정 시간 간격마다 상기 음성 신호를 프레임 단위로 구분하는 프레이밍 작용을 수행하는 입력신호 버퍼링 및 프레이밍부;상기 입력된 음성 신호의 진폭에 대해 인간의 청각 특성과 유사하도록 자동 이득 제어를 수행하는 자동 이득 제어부, 상기 입력된 음성 신호에 대해 인간의 외이 및 중이의 주파수 응답 특성과 동일한 주파수 응답 특성을 갖는 필터를 이용하여 신호 처리를 수행하는 외이 및 중이의 주파수 응답 적용부 및 인간의 청각 기관 내부의 잡음을 모델링하여 상기 입력된 음성 신호를 처리하는 내부 잡음 처리부를 포함하여 구성되어 인간 청각 모델을 상기 음성 신호에 적용시키는 인간 청각 모델 적용부;입력된 음성 신호를 주파수 영역으로 변환하여 진폭 성분과 위상 성분으로 이루어진 주파수 스펙트럼을 생성하는 주파수 스펙트럼 추정부;상기 주파수 스펙트럼 추정부에서 생성된 주파수 스펙트럼을 이용하여 음성 신호에 부가된 잡음의 스펙트럼 정보를 추정하는 역할을 수행하는 부가잡음 추정부; 및상기 주파수 스펙트럼 추정부에서 생성된 주파수 스펙트럼으로부터 상기 부가잡음 추정부에 의해 추정된 부가잡음을 제거하는 작용을 수행하는 부가잡음 제거부를 포함하는인간 청각 모델을 이용한 부가잡음 제거장치.
- 삭제
- 제1항에 있어서,상기 인간 청각 모델 적용부에서 처리된 음성 신호가 묵음 구간인지 또는 음성 구간인지를 판단하기 위한 음성 검출부를 더 포함하는인간 청각 모델을 이용한 부가잡음 제거장치.
- 제1항 또는 제6항에 있어서,상기 부가잡음 제거부에서 얻어진 부가잡음이 제거된 스펙트럼을 시간 영역으로 변환하는 작용을 수행하는 신호 재생부를 더 포함하는인간 청각 모델을 이용한 부가잡음 제거장치.
- 제1항 또는 제6항에 있어서,상기 부가잡음 제거부에서 얻어진 부가잡음이 제거된 스펙트럼으로부터 음성 인식에 필요한 특징 벡터들을 추출하는 작용을 수행하는 특징벡터 추출부를 더 포함하는인간 청각 모델을 이용한 부가잡음 제거장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030057646A KR100565428B1 (ko) | 2003-08-20 | 2003-08-20 | 인간 청각 모델을 이용한 부가잡음 제거장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030057646A KR100565428B1 (ko) | 2003-08-20 | 2003-08-20 | 인간 청각 모델을 이용한 부가잡음 제거장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050019686A KR20050019686A (ko) | 2005-03-03 |
KR100565428B1 true KR100565428B1 (ko) | 2006-03-30 |
Family
ID=37228901
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020030057646A KR100565428B1 (ko) | 2003-08-20 | 2003-08-20 | 인간 청각 모델을 이용한 부가잡음 제거장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100565428B1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102059341B1 (ko) | 2013-04-02 | 2019-12-27 | 삼성전자주식회사 | 난청인의 청각 모델을 이용한 파라미터 결정 장치 및 방법 |
-
2003
- 2003-08-20 KR KR1020030057646A patent/KR100565428B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
KR20050019686A (ko) | 2005-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2643834B1 (en) | Device and method for producing an audio signal | |
US5757937A (en) | Acoustic noise suppressor | |
EP2643981B1 (en) | A device comprising a plurality of audio sensors and a method of operating the same | |
JP6553111B2 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
EP1208563B1 (en) | Noisy acoustic signal enhancement | |
KR100750440B1 (ko) | 잔향 추정 및 억제 시스템 | |
EP2306457B1 (en) | Automatic sound recognition based on binary time frequency units | |
US20060224382A1 (en) | Noise reduction and audio-visual speech activity detection | |
AU2011200494A1 (en) | A speech intelligibility predictor and applications thereof | |
CN101593522A (zh) | 一种全频域数字助听方法和设备 | |
JP4816711B2 (ja) | 通話音声処理装置および通話音声処理方法 | |
KR101260938B1 (ko) | 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체 | |
JP2011033717A (ja) | 雑音抑圧装置 | |
Itoh et al. | Environmental noise reduction based on speech/non-speech identification for hearing aids | |
CN112053702A (zh) | 一种语音处理的方法、装置及电子设备 | |
Sun et al. | Investigations into the relationship between measurable speech quality and speech recognition rate for telephony speech | |
JPH04245300A (ja) | 雑音除去装置 | |
KR100565428B1 (ko) | 인간 청각 모델을 이용한 부가잡음 제거장치 | |
KR101610708B1 (ko) | 음성 인식 장치 및 방법 | |
WO2021059497A1 (ja) | 音信号処理装置、音信号処理方法および記憶媒体 | |
JP2002064617A (ja) | 反響抑圧方法・反響抑圧装置 | |
KR100574883B1 (ko) | 비음성 제거에 의한 음성 추출 방법 | |
EP1104925A1 (en) | Method for processing speech signals by substracting a noise function | |
JPH03269498A (ja) | 雑音除去方式 | |
JP2003316380A (ja) | 会話を含む音の信号処理を行う前の段階の処理におけるノイズリダクションシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130304 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20140303 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20150226 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20160226 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20170224 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20180226 Year of fee payment: 13 |
|
FPAY | Annual fee payment |
Payment date: 20190311 Year of fee payment: 14 |
|
FPAY | Annual fee payment |
Payment date: 20200310 Year of fee payment: 15 |