KR20160000680A - 광대역 보코더용 휴대폰 명료도 향상장치와 이를 이용한 음성출력장치 - Google Patents

광대역 보코더용 휴대폰 명료도 향상장치와 이를 이용한 음성출력장치 Download PDF

Info

Publication number
KR20160000680A
KR20160000680A KR1020140078140A KR20140078140A KR20160000680A KR 20160000680 A KR20160000680 A KR 20160000680A KR 1020140078140 A KR1020140078140 A KR 1020140078140A KR 20140078140 A KR20140078140 A KR 20140078140A KR 20160000680 A KR20160000680 A KR 20160000680A
Authority
KR
South Korea
Prior art keywords
level
cutoff frequency
signal
input signal
voice
Prior art date
Application number
KR1020140078140A
Other languages
English (en)
Inventor
박성진
Original Assignee
주식회사 더바인코퍼레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 더바인코퍼레이션 filed Critical 주식회사 더바인코퍼레이션
Priority to KR1020140078140A priority Critical patent/KR20160000680A/ko
Priority to CN201410400265.0A priority patent/CN105208187A/zh
Publication of KR20160000680A publication Critical patent/KR20160000680A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/15Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)

Abstract

본 발명은 명료도 향상장치와 이를 이용한 음성출력장치에 관한 것으로, 입력신호의 샘플링 주파수에 따라 자동으로 필터의 컷오프주파수가 설정되고, 입력포락선 검출부를 통해 입력 신호에 대해 음성 프레임의 레벨을 검출하여 컷오프주파수 예측부에 제공하고, 출력포락선 검출부를 통해 출력 신호에 대해 음성 프레임의 레벨을 검출하는 컷오프주파수 예측부에 제공하며, 컷오프주파수 예측부에서 입력포락선 검출부로부터 수신된 N번째 음성 프레임의 레벨과 출력포락선 검출부로부터 수신된 (N-1)번째 음성 프레임의 레벨 간의 차이값을 파악하고, 상기 차이값으로 상기 입력 신호의 자음 성분을 증폭시키기 위한 컷오프주파수를 산출하며, 쉘빙 필터부가 컷오프주파수 예측부에 의해 산출된 컷오프 주파수에 따라 상기 입력 신호를 필터링하되, 상기 입력 신호의 자음 성분으로 추측되는 부분을 선택적으로 증폭되게 한다. 이에 따라 쉘빙 필터부는 입력 신호에 자음성분이 많고 적음에 따라 컷오프 주파수가 동적으로 변동되어, 입력 신호의 자음 신호에 해당하는 고주파 성분이 증폭되는 반면에 저주파 성분을 감쇄시킴으로써, 자음 성분이 선택적으로 강조되게 하여 음성 명료도가 향상되게 한다.

Description

광대역 보코더용 휴대폰 명료도 향상장치와 이를 이용한 음성출력장치{APPARATUS FOR ENHANCING INTELLIGIBILITY OF SPEECH, VOICE OUTPUT APPARATUS WITH THE APPARATUS}
본 발명은 이동통신 분야에서 광대역 (wideband) 및 협대역 (narrowband) 음성 신호의 음질을 향상시키는 방법 및 장치에 관한 것으로, 보다 상세하게는 수신되는 광대역 (wideband) 및 협대역 (narrowband) 음성 신호의 명료도를 향상시키는 장치 및 이 장치를 이용하는 음성출력장치에 관한 것이다.
휴대폰 음성통화에 쓰이는 8 KHz 샘플링주파수 보코더는 음악에서 쓰이는 인코딩, 디코딩 방식과는 달리 가장 유사한 신호를 재 구성하는 방식으로 디지털 음악과 비교하면 확연한 음질의 차이를 누구나 알 수 있다. 최근에는 샘플링 주파수를 16 KHz까지 높인 광대역 보코더가 상용화 되었으나 44.1 KHz에 익숙한 휴대폰 사용자들은 더 좋은 통화음질을 희망한다.
이에, 협대역 (8 KHz 샘플링주파수) 및 광대역 (16 KHz)에서 음성 신호의 명료도를 향상시키는 기술이 요구된다.
본 발명이 이루고자 하는 과제는 수신되는 음성 신호에 대한 전체적인 출력이 아닌 음성 명료도만 높여 수신음질을 향상시키는 장치를 제공하는 것이다.
또한 본 발명이 이루고자 하는 다른 과제는 협대역 및 광대역 음성신호에 대해 명료도를 향상 시키는 음성출력장치를 제공하는 것이다.
상기 기술적 과제를 달성하기 본 발명은 입력 신호에 따른 협대역과 광대역의 컷오프주파수 초기값; 음성 프레임의 레벨을 검출하는 입력포락선 검출부; 출력 신호에 대해 음성 프레임의 레벨을 검출하는 출력포락선 검출부; 상기 입력포락선 검출부로부터 수신된 N번째 음성 프레임의 레벨과 상기 출력포락선 검출부로부터 수신된 N-1)번째 음성 프레임의 레벨 간의 차이값을 파악하고, 상기 차이값으로 상기 입력 신호의 자음 성분을 증폭시키기 위한 컷오프주파수를 산출하는 컷오프주파수 예측부; 상기 컷오프주파수 예측부에 의해 산출된 상기 컷오프 주파수에 따라 상기 입력 신호를 필터링하되, 상기 입력 신호의 자음 성분으로 추측되는 부분을 선택적으로 증폭되게 필터링하는 쉘빙 필터부; 및 상기 입력 신호를 분석하여 음성 신호인지 비음성 신호를 파악하며, 상기 비음성 신호인 경우에 상기 입력 신호를 상기 출력 신호로 바이패스시키고, 상기 음성 신호인 경우에 상기 입력포락선 검출부와 상기 쉘빙 필터부의 입력으로 제공하는 음성 검출기를 포함하는 것을 특징으로 하는 명료도 향상장치를 제공한다.
상기에서, 컷오프주파수 예측부는 상기 N번째 음성 프레임의 레벨이 상기 (N-1)번째 음성 프레임의 레벨보다 크면 상기 쉘빙 필터부에 설정된 컷오프 주파수를 설정치만큼 낮추거나, 상기 N번째 음성 프레임의 레벨이 상기 (N-1)번째 음성 프레임의 레벨보다 작으면 상기 쉘빙 필터부에 설정된 컷오프 주파수를 설정치만큼 높이는 것을 특징으로 한다.
본 발명의 실시 예에 따르면, 음성출력장치가 자동으로 사용자의 통화 환경을 파악하여 통화 환경에 맞는 수신 음량 조절 및 음성 명료도를 향상시켜 수신음질이 향상된 상태에서 통화를 할 수 있게 하는 효과가 있다.
또한 본 발명의 실시 예에 따르면, 사용자가 통화 중에 음질 향상 요구를 하더라도 사용자의 음질향상 요구에 맞게 명료도 향상 동작을 하여 사용자의 요구에 부응하는 수신 음질이 향상된 소리를 들을 수 있게 하는 효과가 있다.
또한 본 발명의 실시 예에 따르면, 수신 음질이 향상되어 출력되는 상태를 음성출력장치의 화면상에 표시하여 사용자가 현재 출력되는 소리가 수신 음질이 향상된 소리임을 알 수 있게 하는 효과가 있다.
도 1은 본 발명의 실시 예에 따른 명료도 향상장치의 블록 구성도이다.
도 2는 일반적인 쉘빙 필터의 주파수 특성 그래프이다.
도 3은 본 발명의 실시 예를 휴대폰 단말기에 탑재 하여 신호처리 한 결과의 일 예를 보인 도면이다.
도 4는 본 발명의 실시 예에 따른 명료도 향상장치에 의해 선택적으로 자음을 필터링한 결과의 다른 예를 보인 도면이다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시 예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
이제, 도면을 참조하여 본 발명의 실시 예에 따른 명료도 향상장치와 이를 이용한 음성출력장치, 명료도 향상방법 및 이를 이용한 수신음 처리방법에 대하여 상세히 설명하기로 한다. 그러나 본 발명은 이하의 실시 예들에 의해 제한되거나 한정되는 것은 아니다.
이하에서는 도 1을 참조로 하여 본 발명의 실시 예에 따른 명료도 향상장치를 설명한다.
설명에 앞서, 음성신호에서 자음 부분은 모음에 비해 상대적으로 아주 작은 신호성분을 가지고 있다. 그러나, 이동통신 기기의 네트워크 장비 및 단말기의 오디오 신호처리 과정에서 이 작은 신호성분은 종종 사라지거나 작아지는 경향이 많다. 그 결과 휴대전화로 통화 시 상당히 둔탄한 소리를 느끼거나 상대방이 누구인지 목소리를 듣고서 알기 어려울 때가 많다.
본 발명의 실시 예에 따른 명료도 향상장치는 오디오 신호처리 과정에서 자음 부분의 신호 성분이 사라지거나 작아지지 않게 한다. 즉, 본 발명의 실시 예에 따른 명료도 향상장치는 자음 부분의 신호 성분을 선택적으로 강조하여 음성 명료도를 향상시킨다.
도 1은 본 발명의 실시 예에 따른 명료도 향상장치(100)의 블록 구성도이다. 도 1에 도시된 바와 같이, 본 발명의 실시 예에 따른 명료도 향상장치(100)는 쉘빙 필터부(101), 입력포락선(input envelop) 검출부(102), 출력포락선(output envelop) 검출부(103), 음성 검출기(104)와 컷오프주파수(cutoff frequency) 예측부(105), 컷오프주파수 초기값(106)을 포함한다.
실험적으로 구해진 협대역과 광대역 샘플링주파수에 따른 컷오프주파수 초기값(106)은 입력신호의 샘플링주파수에 따라 컷오프주파수의 예측부로 전달된다.
입력포락선 검출부(102)는 현재 입력되는 음성신호에 대해 음성 프레임 단위로 포락선(envelop)의 진폭 레벨(이하 “현재 입력음성신호 레벨”이라 함)을 검출하고, 검출한 진폭 레벨을 컷오프주파수 예측부(105)에 제공한다.
출력포락선 검출부(103)는 출력되는 음성신호에 대해 음성 프레임 단위로 포락선(envelop)의 진폭 레벨을 계산하되, 현재 출력되는 음성 프레임의 바로 이전의 음성 프레임에 대한 포락선 진폭 레벨(이하 “이전 출력음성신호 레벨”이라 함)을 컷오프주파수 예측부(105)에 제공한다.
음성 검출기(104)는 수신되는 입력 신호의 주파수 대역을 분석하여 입력 신호가 사람에 의해 발생된 음성신호인지를 판단한다. 일반적으로 Voice Activity Detector (VAD) 라고 불리우며, 입력신호가 음성신호가 아닌 경우에 쉘빙 필터부(101)를 거치지 않고 바로 출력 음성으로 “by-pass” 출력되게 한다. 그리고 음성 검출기(104)는 입력신호가 음성신호인 경우에는 정해진 쉘빙 필터부(101)를 통과하여 특정부분의 음성신호가 강조 된다.
컷오프주파수 예측부(105)는 입력포락선 검출부(102)로부터 현재 입력음성신호 레벨을 수신하고, 출력포락선 검출부(103)로부터 이전 출력음성신호 레벨을 수신한다. 그리고 컷오프주파수 예측부(105)는 현재 입력음성신호 레벨과 이전 출력음성신호 레벨을 비교하여 두 진폭 레벨 간 차이의 크기를 비교하며, 쉘빙 필터부(101)의 특성을 동적으로 변경 가능하도록 하는 컷오프 주파수를 계산한다.
컷오프주파수 예측부(105)는 두 진폭 레벨 간 차이의 크기에 따라 계산한 컷오프 주파수가 쉘빙 필터부(101)의 컷오프 주파수가 되도록 한다. 즉, 컷오프주파수 예측부(105)는 두 진폭 레벨 간 차이의 크기에 따라 계산한 컷오프 주파수가 되도록 하기 수학식 4의 ωcut - off 를 변경한다.
컷오프주파수 예측부(105)는 두 진폭 레벨 간 차이의 크기가 양수(즉, 현재 입력음성신호 레벨이 이전 출력음성신호 레벨보다 큼)인 경우에 컷오프 주파수를 설정치 (
Figure pat00001
)만큼 낮춘다. 반면에 컷오프주파수 예측부(105)는 상기 두 레벨간의 차이가 음수이면 쉘빙 필터부(101)에 현재 설정되어 있는 컷오프 주파수를 설정치(
Figure pat00002
)만큼 높여 준다. 이때 변경되는 값 즉, 설정치(
Figure pat00003
)는 미리 실험적으로 정해 둔 값에 의한다.
쉘빙 필터부(101)는 컷오프주파수 예측부(105)에서 산출한 컷오프 주파수를 수신하고, 수신한 컷오프 주파수에 따라 입력 음성신호를 고주파 통과 필터링하여 출력 음성신호를 출력한다.
이러한 쉘빙 필터부(101)는 오디오 설계에 많이 사용되는 쉘빙 필터(shelving filter)를 근간으로 하며, 일반적인 쉘빙 필터의 전달함수(H(s))는 다음의 수학식 1과 같이 나타내어지고, 주파수 특성은 도 2에 도시된 바와 같다.
Figure pat00004
여기서
Figure pat00005
는 전이주파수(transition frequency)를 조정하는 계수이고,
Figure pat00006
Figure pat00007
는 각각 제로와 고주파수의 게인 값으로 각 프레임의 포락선을 계산 후 얻어지는 상수이다. 여기서
Figure pat00008
Figure pat00009
에 대해 다시 전개하면 수학식 1은 다음의 수학식 2와 같이 나타낼 수 있다.
Figure pat00010
그리고 수학식 2를 수학식 1에 대입하면 다음의 수학식 3과 같이 아날로그 전달함수를 얻을 수 있다.
Figure pat00011
수학식 3을 쌍 일차 변환(Bi-linear transform)으로 디지털 도메인의 응답특성으로 변환하면 다음의 수학식 4와 같다. 여기서, 쌍 일차 변환은
Figure pat00012
Figure pat00013
와 같이 정의되어 있다.
Figure pat00014
수학식 4에서
Figure pat00015
값은 고주파 통과 필터의 특성을 결정하는 값이다.
이러한 전달함수에 의해 쉘빙 필터부(101)는 도 2에 도시된 그래프와 같이, 일반적인 쉘빙 필터의 주파수 특성을 가진다. 일반적인 쉘빙 필터의 주파수 특성 그래프는 여러 문헌에서 접할 수 있으므로 부연 설명은 생략한다.
이상과 같이 구성된 본 발명의 실시 예에 따른 명료도 향상 장치는 입력 음성신호의 자음 성분으로 추측되는 부분을 선택적으로 강조하여 음성 명료도를 향상시킨다. 아래는 이러한 본 발명의 실시 예에 따른 명료도 향상 장치의 동작을 설명한다.
입력 신호가 수신되면, 음성 검출기(104)는 입력 신호가 음성 신호인지 비음성 신호인지를 판단한다. 이러한 판단으로 입력 신호가 음성 신호인 경우에, 음성 검출기(104)는 입력 신호를 쉘빙 필터부(101)에 제공한다. 이때 쉘빙 필터부(101)에 입력되는 입력 신호는 입력포락선 검출부(102)에도 입력되며, 입력포락선 검출부(102)는 입력 신호에 대한 포락선 레벨을 검출하여 컷오프주파수 예측부(105)에 제공한다.
한편, 쉘빙 필터부(101)에 입력된 입력신호는 쉘빙 필터부(101)에 설정된 필터 전달함수에 따라 신호 처리된 후 출력 신호로서 출력된다. 이때 쉘빙 필터부(101)에서 출력된 출력 신호는 외부로 출력되고, 동시에 출력포락선 검출부(103)에 입력된다. 그러면, 출력포락선 검출부(103)는 입력된 출력 신호에 대하여 포락선 레벨을 검출하여 컷오프주파수 예측부(105)에 제공한다.
여기서, 컷오프주파수 예측부(105)는 입력신호에 대한 포락선 레벨과 출력신호에 대한 포락선 레벨을 입력하지만, 동일한 음성 프레임에 대한 입력신호와 출력신호를 이용하지 않고, 현재 음성프레임의 입력신호와 이전 음성프레임의 출력신호를 이용한다.
즉, 컷오프주파수 예측부(105)는 이전 프레임의 출력신호에 대한 포락선 레벨(즉, 이전 출력음성신호 레벨)(E2)과 현재 프레임의 입력신호에 대한 포락선 레벨(즉, 현재 입력음성신호 레벨)(E1) 간에 포락선 레벨 차이(E1-E2)를 계산한다.
컷오프주파수 예측부(105)는 현재 입력음성신호 레벨과 이전 출력음성신호 레벨간 차이(E1E2)의 크기가 양수이면 현재 입력음성신호 레벨이 이전 출력음성신호 레벨보다 크다고 판단하고, 음수이면 현재 입력음성신호 레벨이 이전 출력음성신호 레벨보다 작다고 판단한다.
컷오프주파수 예측부(105)는 상기 두 레벨간의 차이가 양수이면 쉘빙(shelving) 필터부(101)에 현재 설정되어 있는 컷오프 주파수를 설정치(
Figure pat00016
)만큼 낮추어 준다. 반면에 컷오프주파수 예측부(105)는 상기 두 레벨간의 차이가 음수이면 쉘빙 필터부(101)에 현재 설정되어 있는 컷오프 주파수를 설정치(
Figure pat00017
)만큼 높여 준다.
컷오프주파수 예측부(105)는 포락선의 값이 작아지면 음성신호에 자음성분이 많은 것으로 간주하여 특정 고주파 성분을 강조해 준다. 여기서 고주파 성분의 범위는 약 1.5KHz에서 2.5KHz 사이에 속한다.
이 때, 결정되는 컷오프 주파수의 낮음 정도는 현재 음성입력신호 레벨과 이전 출력음성신호 레벨의 차이에 따라 실험적으로 미리 정해진 값, 즉, 설정치(
Figure pat00018
)만큼 컷오프 주파수가 변화한다.
이와 같이 컷오프 주파수를 동적으로 변경함으로써, 쉘빙 필터부(101)에서 출력하는 출력 음성신호의 자음성분 고주파 성분이 증폭되는 반면에, 저주파 성분은 감쇄된다. 그러므로 평균적인 RMS(Root-Mean-Square) 에너지 정도는 필터링 후에도 변화하지 않고 유지된다.
이때 자음이 모음에 비해 주된 고주파 성분을 포함하고 있기 때문에, 출력 음성신호가 자음인 경우에 발음상의 파워가 증가되고, 이의 결과로 수신 음성신호에 대한 음성 명료도가 향상된다.
본 발명의 실시 예에 따른 명료도 향상장치에 의한 음성 명료도가 향상을 보인 다른 예가 도 3에 도시되어 있다. 도 3은 본 발명의 실시 예를 휴대폰 단말기에 탑재 하여 신호처리 한 결과의 일 예를 보인 도면이다.
도 3의 (a)는 본 발명에 따른 명료도 향상장치에 입력 및 출력되는 음성신호를 보여주는 주파수 파형도로서, 붉은색 파형은 수신되는 음성신호의 파형이고, 파란색 파형은 필터링에 의해 증폭된 출력되는 음성신호의 파형이다.
그리고 (b)는 입력 음성신호의 스펙트로그램이며, (c)는 출력 음성신호의 스펙트로그램이다.
(a)에서 붉은색과 파란색으로 표기된 입력 음성신호와 출력 음성신호를 통해 알 수 있듯이“beach exposed to trash”라는 음성신호가 수신되면 명료도 향상장치(100)는 고주파 통과 필터인 쉘빙 필터부(101)의 컷오프 주파수가 변화하면서 자음인 “b”, “ch”, “k”, “p”, “zd”, “t”, “sh”의 신호 성분을 모음에 비해 상대적으로 강조(즉, 증폭)을 하여 출력함을 보여준다.
그리고 (b)와 (c)에 도시된 스펙트로그램에서 알 수 있듯이, 원으로 마킹한 자음 부분은 입력 음성신호에 비해 출력 음성신호에서 고주파 성분에서의 분포가 높음을 알 수 있다.
본 발명의 실시 예에 따른 명료도 향상장치에 의해 음성 명료도가 향상됨을 보여주는 일 예가 도 4에 도시되어 있다. 도 4는 본 발명의 실시 예에 따른 명료도 향상장치에 의해 선택적으로 자음을 필터링한 결과의 다른 예를 보인 도면이다.
본 발명의 실시 예를 휴대폰 단말기에 탑재하여 신호처리 한 결과의 일 예를 보인 도면으로, “five”, “six” 그리고 “two”라는 음성 신호를 수신한 경우에 대한 것이다.
도 4에서 (a)는 본 발명에 따른 신호 처리를 하지 않은 상태로 출력되는 출력 음성신호의 주파수 파형도이고, (b)는 본 발명에 따른 신호 처리를 한 상태로 출력되는 출력 음성신호의 주파수 파형도이다.
(a)에 도시된 바와 같이,“five”, “six”와 “two”라는 음성신호가 수신되면 종래에는 원으로 마킹(marking)된 “F”, “S’, “W”에 해당하는 자음 신호 성분에 대한 증폭이 이루어지지 않고 있다.
이에 반해, (b)에 도시된 바와 같이 본 발명의 실시 예에 따른 명료도 향상장치(100)는 five”, “six”와 “two”라는 음성신호가 수신되면 원으로 마킹(marking)된 “F”, “S’, “W”에 해당하는 자음 신호 성분에 대해 선택적인 증폭하여 출력한다. 물론, 본 발명의 실시 예에 따른 명료도 향상장치(100)는“V”, “X”, “T”에 해당하는 자음 신호 성분 또한 선택적인 증폭하여 출력하고 있음을 알 수 있다.
본 발명의 실시 예에 따른 음성출력장치는 음성신호를 수신하고 출력하는 장치로서, 휴대폰, 일반전화기, PMP, DMB, MP3, 차량용 핸즈 프리킷(hands-free kit), 블루투스 이어셋(bluetooth ear-set) 등일 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
100 : 명료도 향상장치 101 : 쉘빙 필터부
102 : 제1 레벨 검출부 103 : 제2 레벨 검출부
104 : 비교부 105 : 컷오프주파수 예측부

Claims (3)

  1. 입력신호의 샘플링 주파수에 따른 컷오프주파수 초기값 설정 부;
    입력 신호에 대해 음성 프레임의 레벨을 검출하는 입력포락선 검출부;
    출력 신호에 대해 음성 프레임의 레벨을 검출하는 출력포락선 검출부;
    상기 입력포락선 검출부로부터 수신된 N번째 음성 프레임의 레벨과 상기 출력포락선 검출부로부터 수신된 (N-1)번째 음성 프레임의 레벨 간의 차이값을 파악하고, 상기 차이값으로 상기 입력 신호의 자음 성분을 증폭시키기 위한 컷오프주파수를 산출하는 컷오프주파수 예측부;
    상기 컷오프주파수 예측부에 의해 산출된 상기 컷오프 주파수에 따라 상기 입력 신호를 필터링하되, 상기 입력 신호의 자음 성분으로 추측되는 부분을 선택적으로 증폭되게 필터링하는 쉘빙 필터부; 및
    상기 입력 신호를 분석하여 음성 신호인지 비음성 신호를 파악하며, 상기 비음성 신호인 경우에 상기 입력 신호를 상기 출력 신호로 바이패스시키고, 상기 음성 신호인 경우에 상기 입력포락선 검출부와 상기 쉘빙 필터부의 입력으로 제공하는 음성 검출기를 포함하는 것을 특징으로 하는 명료도 향상장치.
  2. 제1항에 있어서,
    상기 컷오프주파수 예측부는,
    상기 N번째 음성 프레임의 레벨이 상기 (N-1)번째 음성 프레임의 레벨보다 크면 상기 쉘빙 필터부에 설정된 컷오프 주파수를 설정치만큼 낮추는 것을 특징으로 하는 명료도 향상장치.
  3. 제2항에 있어서,
    상기 N번째 음성 프레임의 레벨이 상기 (N-1)번째 음성 프레임의 레벨보다 작으면 상기 쉘빙 필터부에 설정된 컷오프 주파수를 설정치만큼 높이는 것을 특징으로 하는 명료도 향상장치.
KR1020140078140A 2014-06-25 2014-06-25 광대역 보코더용 휴대폰 명료도 향상장치와 이를 이용한 음성출력장치 KR20160000680A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020140078140A KR20160000680A (ko) 2014-06-25 2014-06-25 광대역 보코더용 휴대폰 명료도 향상장치와 이를 이용한 음성출력장치
CN201410400265.0A CN105208187A (zh) 2014-06-25 2014-08-14 宽带及窄带语音清晰度提高装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140078140A KR20160000680A (ko) 2014-06-25 2014-06-25 광대역 보코더용 휴대폰 명료도 향상장치와 이를 이용한 음성출력장치

Publications (1)

Publication Number Publication Date
KR20160000680A true KR20160000680A (ko) 2016-01-05

Family

ID=54955605

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140078140A KR20160000680A (ko) 2014-06-25 2014-06-25 광대역 보코더용 휴대폰 명료도 향상장치와 이를 이용한 음성출력장치

Country Status (2)

Country Link
KR (1) KR20160000680A (ko)
CN (1) CN105208187A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101893684B1 (ko) 2017-02-24 2018-08-30 국방과학연구소 딥 러닝 기반 보코더 통과 음성 명료도 평가 방법 및 장치

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112019490B (zh) * 2019-05-31 2023-04-18 海能达通信股份有限公司 一种不同网络间的通信方法、网关和具有存储功能的装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6441983B1 (en) * 1998-10-02 2002-08-27 International Business Machines Corporation System and method for adjusting a cutoff frequency of a tunable filter employed in a read channel of a data storage system
CA2454296A1 (en) * 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
US8214202B2 (en) * 2006-09-13 2012-07-03 Telefonaktiebolaget L M Ericsson (Publ) Methods and arrangements for a speech/audio sender and receiver
DE112006004192A5 (de) * 2006-11-17 2009-10-22 Siemens Aktiengesellschaft Verfahren und Anordnung zur Steuerung von adaptiven Filtern
KR100883896B1 (ko) * 2007-01-19 2009-02-17 엘지전자 주식회사 음성명료도 향상장치 및 방법
GB2461315B (en) * 2008-06-27 2011-09-14 Wolfson Microelectronics Plc Noise cancellation system
KR101068227B1 (ko) * 2009-06-23 2011-09-28 주식회사 더바인코퍼레이션 명료도 향상장치와 이를 이용한 음성출력장치
CN103440871B (zh) * 2013-08-21 2016-04-13 大连理工大学 一种语音中瞬态噪声抑制的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101893684B1 (ko) 2017-02-24 2018-08-30 국방과학연구소 딥 러닝 기반 보코더 통과 음성 명료도 평가 방법 및 장치

Also Published As

Publication number Publication date
CN105208187A (zh) 2015-12-30

Similar Documents

Publication Publication Date Title
JP6147744B2 (ja) 適応音声了解度処理システムおよび方法
Reddy et al. An individualized super-Gaussian single microphone speech enhancement for hearing aid users with smartphone as an assistive device
KR101068227B1 (ko) 명료도 향상장치와 이를 이용한 음성출력장치
JP5453740B2 (ja) 音声強調装置
EP2546831B1 (en) Noise suppression device
JP4836720B2 (ja) ノイズサプレス装置
CN106463106B (zh) 用于音频接收的风噪声降低
KR100876794B1 (ko) 이동 단말에서 음성의 명료도 향상 장치 및 방법
JP2004507141A (ja) 音声強調システム
US9082411B2 (en) Method to reduce artifacts in algorithms with fast-varying gain
RU2411595C2 (ru) Улучшение разборчивости речи в мобильном коммуникационном устройстве путем управления работой вибратора в зависимости от фонового шума
US9478235B2 (en) Voice signal processing device and voice signal processing method
WO2013078677A1 (zh) 一种自适应调节音效的方法和设备
KR102591447B1 (ko) 음성 신호 레벨링
US20160365099A1 (en) Method and system for consonant-vowel ratio modification for improving speech perception
US8254590B2 (en) System and method for intelligibility enhancement of audio information
JP2008309955A (ja) ノイズサプレス装置
JP4542790B2 (ja) ノイズサプレッサ及びノイズサプレッサを備えた音声通信装置
KR20160000680A (ko) 광대역 보코더용 휴대폰 명료도 향상장치와 이를 이용한 음성출력장치
CN111477246B (zh) 语音处理方法、装置及智能终端
JP6197367B2 (ja) 通話装置及びマスキング音生成プログラム
CN113316075B (zh) 一种啸叫检测方法、装置及电子设备
Park et al. Improving perceptual quality of speech in a noisy environment by enhancing temporal envelope and pitch
JP6435133B2 (ja) 音素分割装置、音声処理システム、音素分割方法、および音素分割プログラム
Premananda et al. Speech enhancement to overcome the effect of near-end noise in mobile phones using psychoacoustics

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid