KR20080068397A - 음성명료도 향상장치 및 방법 - Google Patents
음성명료도 향상장치 및 방법 Download PDFInfo
- Publication number
- KR20080068397A KR20080068397A KR1020070006143A KR20070006143A KR20080068397A KR 20080068397 A KR20080068397 A KR 20080068397A KR 1020070006143 A KR1020070006143 A KR 1020070006143A KR 20070006143 A KR20070006143 A KR 20070006143A KR 20080068397 A KR20080068397 A KR 20080068397A
- Authority
- KR
- South Korea
- Prior art keywords
- amplitude level
- cutoff frequency
- output
- input
- difference value
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000005236 sound signal Effects 0.000 claims abstract description 25
- 238000001914 filtration Methods 0.000 claims abstract description 17
- 230000008569 process Effects 0.000 claims abstract description 5
- 238000001514 detection method Methods 0.000 claims description 8
- 230000007423 decrease Effects 0.000 claims 1
- 238000004364 calculation method Methods 0.000 abstract description 6
- 238000012545 processing Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000010295 mobile communication Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
본 발명은 음성명료도 향상장치 및 방법에 관한 것이다. 본 음성명료도 향상장치는 입력 음성신호 포락선의 진폭 레벨을 검출하는 입력레벨 검출부, 출력 음성신호 포락선의 진폭 레벨을 검출하는 출력레벨 검출부, 입력 음성신호 포락선의 진폭 레벨과 출력 음성신호 포락선의 진폭 레벨의 차이값을 산출하는 신호 결합부,산출된 차이값에 기초하여 차단주파수를 산출하는 차단주파수 산출부, 및 차단주파수에 따라 필터링되는 영역이 조정되면서, 입력 음성신호를 필터링하여 출력하는 튜너블 쉘빙 필터부를 포함한다. 이에 의해, 비교적 간단한 구성과 적은 연산량으로 입력되는 음성신호의 음성명료도를 향상시킬 수 있다.
음성명료도, 쉘빙필터, 차단주파수
Description
도 1은 본 발명의 일실시예에 따른 음성명료도 향상장치의 블럭도,
도 2는 도 1의 튜너블 쉘빙 필터부를 보다 상세하게 나타낸 도면,
도 3은 본 발명의 일실시예에 따른 음성명료도 향상장치의 동작방법의 설명에 제공되는 흐름도,
도 4 및 도 5는 본 발명에 따른 음성명료도 향상장치가 적용된 예를 나타낸 도면, 그리고
도 6 및 도 7은 본 발명에 따른 음성명료도 향상방법의 효과를 설명하기 위한 도면이다.
* 도면의 주요 부분에 대한 부호의 설명 *
110 : 튜너블 쉘빙 필터부 120 : 입력레벨 검출부
130 : 출력레벨 검출부 140 : 신호결합부
150 : 차단주파수 산출부 160 : 저대역 쉘빙 필터부
본 발명은 음성명료도 향상장치 및 방법에 관한 것으로, 더욱 상세하게는 저연산량과 저전력이 요구되어 이동통신 단말기 등과 같은 휴대용 기기에 적용이 용이한 음성명료도 향상 장치 및 방법에 관한 것이다.
음성의 명료도를 향상시키기 위한 장치 및 방법에 대해서는 기존에도 여러가지 방식이 제안되고 있다. 예를 들어, 미국특허 4,454,609호에서는, Spectral Components의 대비(Contrast)를 강화시키는 음성강화장치가 개시되어 있다. 미국특허 5,479,560호에서는 음성신호의 대비강화(Contrast-enhanced) 전력 스펙트럼으로부터 포먼트 주파수들을 검출하여 음성신호의 명료도를 강화하기 위한 방법이 개시되어 있다. 미국특허 4,468,804호에서는, 균일하지 않은 주기성을 가진 유성음은 더 낮은 명료도를 가지고 있다고 가정하고, 유성언어의 분절음은 음조주기와 각 음조주기에서 음성의 피크 크기가 전체 유성분절음의 주기상에서 지속되는 것처럼 처리하고 있다. 미국특허 5,479,560호에 개시된 장치에서는, 입력음성신호는 음성포멘트를 알기 위해서 스펙트럼 분석기를 사용해서 분석 후 가중포멘트는 강화된 명료한 음성신호를 만들기 위해서 입력신호에 합쳐지게 된다. 미국특허 5,479,560호에서는, 명료도 증가를 위해서 입력 음성신호의 상승부분을 강화시키는 음성명료도 강화장치가 개시되어 있다. 미국특허 6,993,480호에서는, 음성스펙트럼은 사람의 청각시스템 전달함수의 역함수를 근사화한 전달함수에 곱해진다. 이렇게 함으로써, 그 장치는 주파수영역에서 음성명료도에 덜 영향을 주는 음성신호와 관련된 전력을 감소시킨다. 그리고, 음성신호의 전력은 주파수영역에서 좀 더 많이 명료로를 주기 위해서 증가 된다.
그런데, 이와 같은 대부분의 종래 음성명료도 향상장치와 방법들은, 복잡한 연산 과정을 거치게 되어, 실시간 처리에 어려움이 존재하므로, 이동통신 단말기, 모바일 방송재생장치, 블루투스 기기, PAN(Personal Area Network) 시스템 등에 바로 적용이 어렵다.
따라서, 종래의 음성명료도 향상장치 및 방법에 비하여 솔루션 대비 저전력과 저연산량이 요구되면서도, 청취자가 잡음이 심한 지역에 있는 경우라도 음성의 명료도가 감소되는 것을 최소화하는 음성명료도 향상장치 및 방법이 필요하다.
따라서, 본 발명의 목적은, 저연산량과 저전력이 요구되어 이동통신 단말기 등과 같은 휴대용 기기에 적용이 용이한 음성명료도 향상장치 및 방법을 제공함에 있다.
상기 목적을 달성하기 위한 본 발명에 따른 음성명료도 향상장치는, 입력 음성신호 포락선의 진폭 레벨을 검출하는 입력레벨 검출부, 출력 음성신호 포락선의 진폭 레벨을 검출하는 출력레벨 검출부, 상기 입력 음성신호 포락선의 진폭 레벨과 상기 출력 음성신호 포락선의 진폭 레벨의 차이값을 산출하는 신호 결합부, 상기 차이값에 기초하여 차단주파수를 산출하는 차단주파수 산출부, 및 상기 차단주파수에 따라 필터링되는 영역이 조정되면서, 입력 음성신호를 필터링하여 출력하는 튜너블 쉘빙 필터부를 포함한다.
한편, 본 발명에 따른 음성명료도 향상방법은, 입력 음성신호 포락선의 진폭 레벨과 출력 음성신호 포락선의 진폭 레벨을 각각 검출하는 단계, 산출된 입력 음성신호 포락선의 진폭 레벨과 산출된 출력 음성신호 포락선의 진폭 레벨의 차이값을 산출하는 단계, 상기 차이값에 기초하여 차단주파수를 산출하는 단계, 및 상기 차단주파수에 따라 필터링 영역을 조정하면서, 입력 음성신호를 필터링하여 출력하는 단계를 포함한다.
이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.
도 1은 본 발명의 일실시예에 따른 음성명료도 향상장치의 블럭도이다. 도 1을 참조하면, 본 음성명료도 향상장치는 튜너블 쉘빙 필터(Tunable Shelving Filter)부(110), 입력레벨 검출부(120), 출력레벨 검출부(130), 신호 결합부(140), 차단주파수 산출부(150), 및 저주파 쉘빙 필터부(160)를 포함한다.
입력레벨 검출부(120)는 입력 음성신호 포락선의 진폭레벨을 검출한다. 출력레벨 검출부(130)는 튜너블 쉘빙 필터부(110)에서 출력되는 출력 음성신호 포락선의 진폭레벨을 검출한다. 신호결합부(140)는 입력레벨 검출부(120) 및 출력레벨 검출부(130)로부터 출력되는 신호를 입력받아, 입력 음성신호 포락선의 진폭레벨과 출력 음성신호 포락선의 진폭레벨의 차를 산출한다. 차단주파수 산출부(150)는 신호결합부(140)에서 출력되는 신호에 따라 튜너블 쉘빙 필터부(100)의 차단주파수(cut-off frequency)를 산출한다.
튜너블 쉘빙 필터부(110)는 차단주파수 산출부(140)에서 산출된 차단주파수에 따라 입력 음성신호를 필터링하여 출력 음성신호를 출력한다. 이때, 입력 음성신호는 출력 음성신호 포락선의 진폭레벨이 대략 입력 음성신호 포락선의 진폭레벨 과 비슷해지는 경우에 차단주파수가 조정된 튜너블 쉘빙 필터부(110)에 의해 처리되어 진다. 즉, 입력 음성신호 포락선의 진폭레벨이 출력 음성신호 포락선의 진폭레벨보다 큰 경우, 튜너블 쉘빙 필터부(110)의 차단주파수가 동일성을 유지하기 위해 더 낮은 값을 갖게 된다. 또한, 입력 음성신호 포락선의 진폭레벨이 출력 음성신호 포락선의 진폭레벨 보다 작은 경우, 튜너블 쉘빙 필터부(110)의 차단주파수는 더 높은 값을 갖게 된다.
그리고, 저대역 쉘빙 필터부(160)는 튜너블 쉘빙 필터부(110)에서 자체 생성된 노이즈를 제거하여 최종적으로 음성명료도가 향상된 음성신호를 출력한다.
이와 같은 구성에서, 입력레벨 검출부(120)의 어택 타임(attack time)은 출력레벨 검출부(130)의 어택 타임과 동일해지고, 반면에 입력레벨 검출부(120)의 릴리즈 타임(release time)은 오히려 출력레벨 검출부(130)의 릴리즈 타임보다 훨씬 더 크다. 예를 들어, 모음은 자음과 비교했을 때, 모음은 저주파성분이 우세하므로, 모음이 처리될 때 차단 주파수는 출력신호레벨이 입력신호레벨과 같게 하기 위해서 저주파수치로 유지되어진다. 언급된 단어에서 자음이 모음 다음에 나타나는 경우, 자음은 보통 고주파성분이 우세하기 때문에, 출력레벨신호는 입력레벨신호보다 더 크고 입력레벨신호와 출력입력레벨신호가 동일성을 유지하도록 하기 위해서 차단 주파수를 더 큰수치로 이동시킨다.
자음의 발음상의 전력은 분명히 바로 앞의 모음보다 작기 때문에, 입력레벨 검출부(120) 뿐만 아니라 출력레벨 검출부(130)는 높은 수치부터 낮은 수치까지 과거의 측정된 수치로 이동하기 시작한다. 입력레벨 검출부(120)와 출력레벨 검출 부(130)의 릴리즈 타임은 입력레벨 검출부(120)와 출력레벨 검출부(130)의 어택타임보다 더 빠르다. 출력레벨 검출부(130)의 릴리즈 타임은 입력레벨 검출부(120)의 릴리즈 시간보다 짧다. 결과적으로 자음의 초기주기에서 차단주파수는 더 높은 주파수범위로 순간적으로 이동하지 않는다. 이것은 모음 다음에 오는 자음의 발음상 파워의 초기증가를 초래한다.
튜너블 쉘빙 필터부(110)의 차단 주파수는 더 높은 주파수범위에서 차단주파수보다 더 높은 범위에 있는 것과 같은 방법으로 변화한다. 이런 상위 제한이 있기에 튜너블 쉘빙 필터부(110)의 차단주파수는 비록 출력 음성레벨이 입력 음성레벨보다 클지라도 증가하지 않는다.
따라서, 대부분의 자음의 경우에서 입력음성 레벨과 출력음성 레벨사이의 동일성은 얻어지지 못하고 자음은 그것의 발음상의 파워로 상승된다. 자음에서 모음으로 변하는 동안에, 튜너블 쉘빙 필터부(110)의 차단 주파수는 초기에 높은 주파수 범위에 있다. 모음이 나타날 때 출력 음성신호 포락선의 진폭레벨은 모음이 주로 저주파 성분들을 가지고 있기 때문에 입력 음성신호 포락선의 진폭레벨보다 작다. 이러한 이유로 본 음성명료도 향상장치는 입력음성 레벨과 출력음성레벨의 동일성을 유지하기 위해서 튜너블 쉘빙 필터부(110)의 차단 주파수를 저주파영역으로 이동시킨다.
모음의 발음상의 파워는 분명히 자음보다 크다. 입력레벨 검출부(120)와 출력레벨 검출부(130)는 낮은 진폭 레벨에서 높은 진폭 레벨로 상승하기 시작한다. 입력레벨 검출부(120)와 출력레벨 검출부(130)의 어택 타임이 각각의 릴리즈 타임 과 비교하여 더 작기 때문에, 본 음성명료도 향상장치는 즉시 쉘빙 필터의 차단주파수를 저주파영역으로 이동시키고 입력과 출력음성레벨을 같게 유지한다. 그 결과 모음의 발음상의 파워는 증가하지 않는다.
도 2는 도 1의 튜너블 쉘빙 필터부의 구성을 보다 상세하게 나타낸 블럭도이다. 도 2를 참조하면, 튜너블 쉘빙 필터부는 전역 필터(111), 제1 신호 합산부(112), 제2 신호 합상부(113), 제3 신호 합산부(116), 제1 이득조정부(114), 및 제2 이득조정부(115)를 포함한다.
입력 음성신호 sin[n]은 출력향상된 음성을 산출하기 위해서 조정가능한 전역 필터(112)를 사용해서 필터링되어 진다. 전역 필터(111)는 다음과 같은 식에 의해 출력신호 Sapf _out[n]을 산출한다.
제1 합산부(112)는 전역 필터(111)에서 출력되는 신호 Sapf _out[n]에 입력 음성신호 sin[n]를 더하여 출력한다. 제1 합산부(120)를 통해 출력된 신호에 대하여 제1 이득조정부(114)에서 쉘빙 필터의 게인 lπ/2 을 곱하여 출력한다. 제2 합산부(113)는 전역 필터(111)에서 출력되는 신호 Sapf _out[n]에서 입력 음성신호 sin[n]을 감하여 출력한다. 제2 이득조정부는(115)는 제2 합산부(113)에서 출력되는 신호에 쉘빙 필터의 게인 lo/2 을 곱하여 출력한다.
제1 합산부(114)와 제2 합산부(115)의 출력은 제3 합산부(116)에서 합해져서 sout[n]이 출력된다. 저대역 쉘빙 필터부(130)는 음성신호의 명료도가 향상되는 동안 자체적으로 생성된 노이즈를 제거하여 출력한다.
도 3은 본 발명의 일실시예에 따른 음성명료도 향상장치의 동작방법의 설명에 제공되는 흐름도이다, 도 3을 참조하면, 먼저 입력 음성신호 포락선의 진폭레벨과 출력 음성신호 포락선의 진폭레벨의 차를 산출한다(S200).
이를 위해, 입력레벨 검출부(120)는 다음과 같은 식에 의해 입력 음성신호 포락선의 진폭레벨을 검출한다.
여기서, lin[n]은 시간 n에서 입력음성신호 포락선의 대략적인 진폭 레벨, sin[n]은 시간 n에서 순간적인 입력음성신호,은 어택 타임 상수, 은 입력레벨 검출부의 릴리즈 타임 상수가 된다.
[수학식 2]를 사용하여 lin[n+1]이 계산되어 지며, 입력 음성신호 포락선의 진폭레벨을 검출하기 위해서, 실효치(root mean square) 검출, 포락선 검출(envelop detection), 저주파통과 필터링에 의한 정류기(rectifier) 등을 사용할 수 있다.
출력레벨 검출부(130)는 다음과 같은 식에 의해 출력 음성신호 포락선의 진폭레벨을 검출한다.
여기서, lout[n]은 시간상수 n에서 출력음성 포락선의 계산된 출력레벨, Sout[n]은 시간 n에서 순간적인 음성 출력, 1/αaout 은 attack 시간상수, 1/αrout은 출력음성 포락선 레벨 디텍터의 release 시간상수이다.
[수학식 3]을 이용하여 lout[n+1]이 산출되면, 출력음성신호 포락선의 진폭레벨을 계산하기 위해서, 실효치(root mean square), 포락선 검출(envelop detection), 저주파통과 필터링에 의한 정류기(rectifier) 등을 사용할 수 있다.
입력레벨 검출부(120)와 출력레벨 검출부(130)의 시간상수들의 선택은 효과적인 음성명료도 강화를 위해 중요하다. 다음의 [수학식 4]에서 보여지는 것과 같이 관계가 유지되어 진다.
입력레벨 검출부(120)와 출력레벨 검출부(13)의 어택 타임 상수는 입력레벨 검출부(120)의 릴리즈 타임 상수보다 훨씬 작다. 오히려 입,출력 어택 타임상수는 릴리즈 타임 상수보다 더 작은값을 유지한다.
신호 결합부(140)는 입력음성신호 포락선의 진폭레벨과 출력음성신호 포락선의 진폭레벨의 차인, (lin[n+1] - lout[n+1])을 산출한다.
다음으로 차단주파수를 산출한다(S210). 즉, 입력음성 포락선 진폭레벨과 출력음성 포락선 진폭레벨의 차인, (lin[n+1] - lout[n+1])는 차단주파수 산출부(150)에서 튜너블 쉘빙 필터부(110)의 주된 차단주파수를 결정하기 위해서 사용되어 진다. 만일 그 레벨 차이가 양수이면, 즉 입력 신호레벨이 출력 레벨보다 크다면, 필터의 차단주파수는 저주파 영역으로 그 차에 비례적으로 감소된다. 또한, 레벨차이가 음수이면, 즉 출력레벨이 입력레벨보다 큰 경우에는, 필터의 차단주파수는 저주파 영역으로 차에 비례적으로 감소되어 진다. 차단주파수 산출부(150)의 차단주파수는 입력음성 레벨과 출력음성 레벨사이에서 차의 또 다른 함수를 사용해서 계산되어질 수 있다.
다음으로 산출된 차단주파수에 따라 입력 입성신호가 필터링된다(S220). 즉, 입력음성신호 sin[n]은 출력강화된 음성을 만들어 내기 위해서 튜너블 쉘빙 필터부(110)를 사용해서 필터링되어 진다. 튜너블 쉘빙 필터부(110)는 low-sensitivity realization robust를 coefficient quantization에 이르게 하는 전역통과필터를 사용해서 구조적으로 passive 형태로 파악될 수 있다.
쉘빙 필터를 구조적으로 passive form 으로 바꾸는 과정은 “P. Regalia and S. Mitra, “Tunable digital frequency response equalization,” filters, IEEE Transactions on Acoustics, Speech, and Signal Processing, vol. 35, issue 1, pp. 118-120, Jan 1987”등에서 설명 되어진다. 튜너블 쉘빙 필터부(110)은 구조적으로 passive form 을 이끈다.
Zero 주파수에서 게인 l0 를 가지고 고주파에서는 게인 lπ를 가지는 고주파통과필터 h(s)는 다음의 [수학식 4]를 사용해서 지속적인 시간영역에서 표시될 수 있다.
여기서,
튜너블 쉘빙 필터부(110)는, 도 2에 도시한 바와 같이, 전역 필터(111)의 파리미터 a를 변화시켜가면서 조정되어 진다. Shelving 필터의 차단주파수인 ωcut-off 의 다른 값들에 대해서, a값은 [수학식 8], [수학식 9], [수학식 10]을 사용해서 계산되어 진다. 이 수치들은 lookup 테이블에 저장되어 진다. 계산된 타겟(target) 차단주파수의 수치에 따라서 전역통과필터계수 a는 전역필터(111)를 조절하기 위해서 LUT(Look Up Table)로부터 얻어진다. 쉘빙 필터부에서 출력된 신호는 저대역 쉘빙 필터부에서 자체적으로 생성된 노이즈가 제거되어 출력된다(S230).
상기한 바와 같은 과정에 의해, 저연산량으로 입력되는 음성신호의 음성 명 료도를 강하시켜 출력할 수 있다.
도 4 및 도 5는 본 발명에 따른 음성명료도 향상장치가 이동통신 단말기와 방송 시스템에 적용된 예를 나타낸 도면이다. 본 발명에 따른 음성명료도 향상장치는, 도 4에 도시한 것처럼, 이동단말기와 같은 양방향 통신시스템에 적용된다.
도 4에서, 음성이나 오디오신호는 마이크에 의해 전기적인 신호로 바뀐다. 아날로그나 디지털형태의 음성/오디오신호는 송신되기 전에 음성명료도를 강조하기 위해서 본 발명에 따른 음성명료도 향상장치 및 방법을 사용해서 처리된다.
수신된 음성/오디오신호는 본 발명에 따른 음성명료도 향상장치 및 방법을 사용해서 강화된다. 그리고 강화된 음성/오디오신호는 하나 혹은 다수의 스피커를 사용해서 재생된다. 송신방향에서 제안된 방법과 장치는 또한 송신된 음성/오디오신호의 명료도를 증가시키기 위해 사용될 수 있다.
또한, 본 발명에 따른 음성명료도 향상장치는, 도 5에 도시한 바와 같이, 음성/오디오 방송 시스템에 적용가능하다. 즉, 수신된 음원은 본 발명에 따른 음성명료도 향상장치 및 방법을 사용하여 강화되고, 부가적 신호처리 과정을 거친 후, 스피커를 통해 출력된다.
도 6 및 도 7은 본 발명에 따른 음성명료도 향상방법의 효과를 설명하기 위한 도면이다. 도 6은 65dB의 음성레벨과 60dB의 잡음레벨에 대한 short term SIIs를 나타낸다. 여기서, NOISEX-92로부터 얻어진 공장잡음녹음이 사용되어 진다. 도 6에 도시한 바와 같이, 본 발명에 따른 제안된 방법과 장치는 분명히 SII를 향상시킨다.
도 7은 다른 SNR에 대해서 음성 세그먼트(segment) 주기 동안 평균 내어진 SII의 향상을 보여준다. 음성레벨은 잡음레벨이 변하는 동안 65dB로 유지되어 진다. NOISEX-92 에서 공장잡음녹음이 사용되었다.
이와 같이, 본 발명에 따른 음성명료도 향상장치 및 방법은 음성명료도 cues를 분명히 증가시킨다. 또한, 본 발명에서 음성향상을 위해 사용되는 필터는 차단주파수가 low-complexity 응용에 적합하기 위해서 파라미터의 작은 집합에 의해 조절될 수 있는 방법으로 구성되어야 한다. 또한, 차단주파수와 시스템의 튜닝을 쉽게 할 수 있도록 각각에 대해서 독립적으로 필터 게인을 변경할 수 있어야 한다다. 필터의 주파수 선택적인 부분은 low-sensitivity realization robust를 coefficient quantization으로 유도하는 구조적으로 passive 형태가 될 수 있다.
또한, 본 발명에 따른 음성향상 장치 및 방법은, 전화기 송수신기, 확성장치, 오디오처리시스템, 텔레비전, 스테레오, VCR, DVD 재생과 녹음장치, 디지털 비디오테이프 재생과 녹음장치, compact disc 재생과 녹음장치, 영화소리재생과 녹음장치, 케이블 텔레비전수신기, 오디오신호처리를 위한 컴퓨터 S/W와 H/W, 컴퓨터인터페이스(interface) 카드, 오디오처리를 위한 직접회로, magnetic 테이프, 플로피디스크, 하드디스크, CD-ROM, DVD, 광디스크, 컴퓨터 solid-state 메모리 같은 저장매체, 기타 이와 유사한 것에 사용될 수 있다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
이상 설명한 바와 같이, 본 발명에 따르면, 저연산량으로 음성명료도 cues 를 증가시키며, 음성명료도가 증가되는 동안 출력음성에서 처리된 결과들의 최소한의 양을 산출하므로, 음성명료도를 잘 유지할 수 있다. 또한, 조정가능한 쉘빙 필터를 사용하여 저연산량으로 차단주파수를 용이하게 변경할 수 있으므로, 복잡하지 않은 구조와 낮은 개발 비용으로, 여러가지 장치에 적용되어 음성명료도를 강화시킬 수 있다.
Claims (12)
- 입력 음성신호 포락선의 진폭 레벨을 검출하는 입력레벨 검출부;출력 음성신호 포락선의 진폭 레벨을 검출하는 출력레벨 검출부;상기 입력 음성신호 포락선의 진폭 레벨과 상기 출력 음성신호 포락선의 진폭 레벨의 차이값을 산출하는 신호 결합부;상기 차이값에 기초하여 차단주파수를 산출하는 차단주파수 산출부; 및상기 차단주파수에 따라 필터링되는 영역이 조정되면서, 입력 음성신호를 필터링하여 출력하는 튜너블 쉘빙 필터부;를 포함하는 것을 특징으로 하는 음성명료도 향상장치.
- 제1항에 있어서,상기 필터링 과정에서 자체적으로 생성된 노이즈를 제거하여 출력하는 저대역 쉘빙 필터부;를 더 포함하는 것을 특징으로 하는 음성명료도 향상장치.
- 제1항에 있어서,상기 차단주파수 산출부는, 상기 차이값이 양수이면, 저주파 영역으로 상기 차이값에 비례하여 감소되도록 상기 차단주파수를 산출하는 것을 특징으로 하는 음성명료도 향상장치.
- 제1항에 있어서,상기 차단주파수 산출부는, 상기 차이값이 음수이면, 고주파 영역으로 상기 차이값에 비례하여 증가되도록 상기 차단주파수를 산출하는 것을 특징으로 하는 음성명료도 향상장치.
- 제1항에 있어서,상기 입력레벨 검출부는, 실효치 검출기, 포락선 검출기, 및 저주파통과 필터링에 의한 정류기 중 어느 하나를 사용하여 상기 입력 음성신호 포락선의 진폭레벨을 검출하는 것을 특징으로 하는 음성명료도 향상장치.
- 제1항에 있어서,상기 출력레벨 검출부는, 실효치 검출기, 포락선 검출기, 및 저주파통과 필터링에 의한 정류기 중 어느 하나를 사용하여 상기 출력 음성신호 포락선의 진폭레벨을 검출하는 것을 특징으로 하는 음성명료도 향상장치.
- 입력 음성신호 포락선의 진폭 레벨과 출력 음성신호 포락선의 진폭 레벨을 각각 검출하는 단계;산출된 입력 음성신호 포락선의 진폭 레벨과 산출된 출력 음성신호 포락선의 진폭 레벨의 차이값을 산출하는 단계;상기 차이값에 기초하여 차단주파수를 산출하는 단계; 및상기 차단주파수에 따라 필터링 영역을 조정하면서, 입력 음성신호를 필터링하여 출력하는 단계;를 포함하는 것을 특징으로 하는 음성명료도 향상방법.
- 제7항에 있어서,상기 필터링 과정에서 자체적으로 생성된 노이즈를 제거하여 출력하는 단계;를 더 포함하는 것을 특징으로 하는 음성명료도 향상방법.
- 제7항에 있어서,상기 차단주파수는, 상기 차이값이 양수이면, 저주파 영역으로 상기 차이값에 비례하여 감소되도록 산출하는 것을 특징으로 하는 음성명료도 향상방법.
- 제7항에 있어서,상기 차단주파수는, 상기 차이값이 음수이면, 고주파 영역으로 상기 차이값에 비례하여 증가되도록 산출하는 것을 특징으로 하는 음성명료도 향상방법.
- 제7항에 있어서,상기 입력 음성신호 포락선의 진폭레벨은, 실효치 검출, 포락선 검출, 및 저주파통과 필터링에 의한 정류 방법 중 어느 하나에 의해 검출되는 것을 특징으로 하는 음성명료도 향상방법.
- 제7항에 있어서,상기 출력 음성신호 포락선의 진폭레벨은, 실효치 검출, 포락선 검출, 및 저주파통과 필터링에 의한 정류 중 어느 하나의 방법에 의해 검출하는 것을 특징으로 하는 음성명료도 향상방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070006143A KR100883896B1 (ko) | 2007-01-19 | 2007-01-19 | 음성명료도 향상장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070006143A KR100883896B1 (ko) | 2007-01-19 | 2007-01-19 | 음성명료도 향상장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080068397A true KR20080068397A (ko) | 2008-07-23 |
KR100883896B1 KR100883896B1 (ko) | 2009-02-17 |
Family
ID=39822225
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070006143A KR100883896B1 (ko) | 2007-01-19 | 2007-01-19 | 음성명료도 향상장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100883896B1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105208187A (zh) * | 2014-06-25 | 2015-12-30 | Vine公司 | 宽带及窄带语音清晰度提高装置 |
KR101581748B1 (ko) * | 2015-03-20 | 2015-12-31 | (주)진명아이앤씨 | 디에스피(dsp)를 이용한 스마트 다이나믹 제어 장치 |
JP2021013088A (ja) * | 2019-07-05 | 2021-02-04 | 清水建設株式会社 | 局所的音場支援装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101077437B1 (ko) | 2009-09-10 | 2011-10-26 | 엘지이노텍 주식회사 | Stfd용 헤드셋에서의 음질 개선 시스템 및 그 방법 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1997010586A1 (en) * | 1995-09-14 | 1997-03-20 | Ericsson Inc. | System for adaptively filtering audio signals to enhance speech intelligibility in noisy environmental conditions |
KR100213236B1 (ko) * | 1997-03-14 | 1999-08-02 | 윤종용 | 필터의 차단 주파수 자동제어장치 |
US6441983B1 (en) | 1998-10-02 | 2002-08-27 | International Business Machines Corporation | System and method for adjusting a cutoff frequency of a tunable filter employed in a read channel of a data storage system |
-
2007
- 2007-01-19 KR KR1020070006143A patent/KR100883896B1/ko not_active IP Right Cessation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105208187A (zh) * | 2014-06-25 | 2015-12-30 | Vine公司 | 宽带及窄带语音清晰度提高装置 |
KR101581748B1 (ko) * | 2015-03-20 | 2015-12-31 | (주)진명아이앤씨 | 디에스피(dsp)를 이용한 스마트 다이나믹 제어 장치 |
JP2021013088A (ja) * | 2019-07-05 | 2021-02-04 | 清水建設株式会社 | 局所的音場支援装置 |
Also Published As
Publication number | Publication date |
---|---|
KR100883896B1 (ko) | 2009-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9881635B2 (en) | Method and system for scaling ducking of speech-relevant channels in multi-channel audio | |
JP4640461B2 (ja) | 音量調整装置およびプログラム | |
JP5917518B2 (ja) | 知覚スペクトルアンバランス改善のための音声信号動的補正 | |
TWI463817B (zh) | 可適性智慧雜訊抑制系統及方法 | |
JP6328627B2 (ja) | 雑音検出及びラウドネス低下検出によるラウドネスコントロール | |
RU2467406C2 (ru) | Способ и устройство для поддержки воспринимаемости речи в многоканальном звуковом сопровождении с минимальным влиянием на систему объемного звучания | |
US8170879B2 (en) | Periodic signal enhancement system | |
WO2010131470A1 (ja) | ゲイン制御装置及びゲイン制御方法、音声出力装置 | |
JP6290429B2 (ja) | 音声処理システム | |
US20080082327A1 (en) | Sound Processing Apparatus | |
KR101855969B1 (ko) | 오디오 신호를 압축하는 디지털 압축기 | |
TWI451770B (zh) | 增加聽障者聽到聲音正確性之方法及助聽器 | |
KR100667852B1 (ko) | 휴대용 레코더 기기의 잡음 제거 장치 및 그 방법 | |
JP7467422B2 (ja) | メディア補償パススルーデバイスにおける動的環境オーバレイ不安定性の検出と抑制 | |
KR20160113224A (ko) | 오디오 신호를 압축하는 오디오 압축 시스템 | |
JP2009175420A (ja) | 音補正装置 | |
JP2010021627A (ja) | 音量調整装置、音量調整方法および音量調整プログラム | |
US20060239472A1 (en) | Sound quality adjusting apparatus and sound quality adjusting method | |
KR100883896B1 (ko) | 음성명료도 향상장치 및 방법 | |
JPH0968997A (ja) | 音声処理方法及び装置 | |
JPH06208395A (ja) | ホルマント検出装置及び音声加工装置 | |
JP5058844B2 (ja) | 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体 | |
JP2001188599A (ja) | オーディオ信号復号装置 | |
JPH06289898A (ja) | 音声信号処理装置 | |
JP2008102551A (ja) | 音声信号の処理装置およびその処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130128 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20140124 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20150128 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20160122 Year of fee payment: 8 |
|
LAPS | Lapse due to unpaid annual fee |