KR950013557B1 - 음성 명료도를 향상시키기 위한 방법 및 장치 - Google Patents

음성 명료도를 향상시키기 위한 방법 및 장치 Download PDF

Info

Publication number
KR950013557B1
KR950013557B1 KR1019910025540A KR910025540A KR950013557B1 KR 950013557 B1 KR950013557 B1 KR 950013557B1 KR 1019910025540 A KR1019910025540 A KR 1019910025540A KR 910025540 A KR910025540 A KR 910025540A KR 950013557 B1 KR950013557 B1 KR 950013557B1
Authority
KR
South Korea
Prior art keywords
signal
formants
formant
frequency
speech
Prior art date
Application number
KR1019910025540A
Other languages
English (en)
Other versions
KR920018650A (ko
Inventor
아이. 클레이만 아널드
Original Assignee
휴우즈 에어크라프트 캄파니
완다 케이.덴슨-로우
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 휴우즈 에어크라프트 캄파니, 완다 케이.덴슨-로우 filed Critical 휴우즈 에어크라프트 캄파니
Publication of KR920018650A publication Critical patent/KR920018650A/ko
Application granted granted Critical
Publication of KR950013557B1 publication Critical patent/KR950013557B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)

Abstract

내용 없음.

Description

음성 명료도를 향상시키기 위한 방법 및 장치
제1도는 전형적인 확성기 또는 녹음 장치내의 음성 처리기의 접속 상태를 도시한 블럭도.
제2도는 사람의 전형적인 음성 포르만트를 도시한 그래프도.
제3도는 음성의 명료도를 향상시키기 위한 하나의 처리장치의 블럭도.
제4도는 음성의 명료도를 향상시키기 위한 처리 장치의 변형 구조를 도시한 블럭도.
제5도는 제4도의 처리 장치에 유용한 스펙트럼 분석기의 블럭도.
제6도는 제4도의 처리 장치용의 전형적인 전압 제어 증폭기를 도시한 도면.
* 도면 주요부분에 대한 부호의 설명
10 : 음성소오스 12 : 증폭장치
16 : 스피커 18 : 음성처리기
26,28,30 : 음성포르만트 42,124 : 스펙트럼분석기
44 : 채널 50,58,74,80,140,142,144,146 : 전압제어증폭기
52 : 신호 입력 라인 54 : 이득 제어 입력 라인
56,57,78,80 : 가변 저항기 60 및 62 : 출력라인
64,84,102,150 : 조합 회로망
본 발명은 육성 통신에 관한 것으로, 특히 높은주변 잡음중에 사람의 음성의 명료도를 향상시키는 확성장치 및 그 향상 방법에 관한 것이다.
확성 장치는 큰 지역에서 안내 방송을 하거나, 그렇지 않으면 동일한 장소에 있는 많은 사람들과 육성으로 통신하는데 이용된다. 청취자가 위치한 지역의 주변 잡음이 매우 높으면 종종, 확성 장치로부터 원하는 구두 통신의 명료도의 레벨이 크게 열화된다. 통신이 손실되거나 최소한 부분적으로 손실되는 여러 가지 형태의 환경이 있는데, 그 이유는 청취자의 입장에서 들을 때 높은 주변 잡음 레벨로 인해 연사의 음성이 차단되거나 왜곡되기 때문이다. 이러한 환경으로는 공항, 지하철역, 버스 정거장 및 철도역, 항공기 및 열차, 항공기의 운반기, 조차장(操車場), 헬리콥터, 격납고 및 그 밖의 잡음이 밸생되는 장소를 포함한다. 비행기나 욜차의 도착 또는 출발에 관련된 안내 방송을 이해하고자 하는 사람은 이러한 주변 잡음이 존재하는 동안에는 유용한 정보를 입수하기 공란함을 인식하게 된다.
높은 배경 잡음에서 명료도의 손실을 최소화 시키기 위한 시도로서 동화기 및 클립핑 회로가 사용되거나, 간단하게는 확성 장치의 음량을 증가시킨다. 동화기 및 클립핑 회로 자체는 배경 잡음을 증가시킬 수 있으므로, 상기한 문제점들을 해결하지는 못한다. 음성의 레벨이나 확성 장치의 음량을 증가시키면 명료도가 거의 개선되지 않아서 피드백과 같은 다른 문제점 및 청취자의 불쾌감을 종종 초래하게 된다.
이러한 문제점에 대한 확산과 여러해 동안이 인식에도 불구하고 해결방법은 전혀 없었다. 실제로, 높은 주변 잡음 상태에 의해 불명해지는, 안내 방송과 같은 공중 통신의 명료도를 충분히 개선하기 위한 공지된 방법은 아직까지는 없었다.
따라서, 본 발명의 목적은 배경잡음에 열화되지 않은 음성통신의 향상된 명료도를 제공하는 장치와 그 향상 방법을 제공하기 위한 것이다.
본 발명의 양호한 실시예에 의해 본 발명의 원리를 실현하는 데 있어서는, 음성포르만트(vacal formant)가 개선된 명료도의 음성신호를 제공하도록 선택적으로 증폭 및 조합된다. 조합된 출력 신호를 발생시키기 위해 향상된 포르만트를 선택적으로 향상시키면 배경 잡음이 매우 높을지라도 음성 신호의 명료도는 크게 증가한다.
이하, 첨부 도면을 참조하여 본 발명에 대해 상세하게 기술하고자 한다.
제1도는 음성명료도 처리 기능을 갖는 확성 장치의 주요부품을 상당히 간이화한 형태로 도시한 것이다.
녹음된 음성 방송에 관련된 카세트, 디스크 등과 같은 방송용 마이크로폰 또는 레코드 플레이어일 수 있는 음성소오스(10)은 전자음성신호를 증폭장치에 공급하는 데, 이 증폭 장치(12)는 스피커 (16)에 직접 여러위치에 배치된 다수의 스피커를 포함한다. 상술한 바와 같이, 이러한 영역은 확성 방송의 명료도를 크게 열화시키는 높은 배경 잡음을 통상적으로 갖고 있다. 공항 터미널, 열차역 또는 이와 유사한 배경 잡음이 높은 환경에서 확성 방송의 모든 말들을 이해해야 하는 청취자는 상당한 주의력을 요한다. 이때 청취자는 방송 내용의 모두를 완전히 인식하는 것은 거의 불가능하고, 어떤경우에는 방송 내용을 거의 알아들을 수 없었다.
본 발명에 따르면, 매우 높은 배경 잡음이 존재하고 스피커(16)내에서 발생된 음성의 레벨을 거의 증가시키지 않고서도 명료도가 크게 향상된 음성을 스피커(16)을 통해 발생시키는 음성 처리기(18)이 증폭기(12)와 스피커(16)사이에 삽입된다.
녹음 장치의 유일한 대체품으로 스피커(16)를 갖는 제1도의 장치는 잡음환경에서 재생하거나 잡음 환경에서 초기에 발성된 음성을 녹음하기 위한 녹음 장치의 명료도를 향상시키는데 사용될 수 있다. 이러한 장치에 대해서는 지금부터 보다 상세하게 설명하고자 한다.
음성 처리기(18)는 발성된 육성이 개인의 귀와 뇌에 의해 들리게 하고 처리되게 하는 장점을 취하는 능동자기 적응 장치(active self-adaiptve system)이다. 간단하게 말하면, 처리기(18)은 모음, 자음, 마찰음 및 파열음의 음성 포르만트를 인식하여 이들을 선택적으로 증폭시켜 배가시키고, 이들을 조합하여 명료도가 크게 증가된 음성 신호를 제공한다.
말의 발생과 의미의 역학 관계에 대해서 간단히 설명하는 것은 본 발명의 동작을 이해하는 데 도움을 줄 수 있다. 음을 상이한 주파수에서 공진시키는 음성트랙에서 음을 발생시킴으로서 육성이 발생된다. 모음은 일반적으로 성대(聲帶)로 알려진 사람의 음성 폴드(vacal folds)의 바이브레이션을 야기시키도록 허파로부터 방출된 기류에 의해 발생된다. 성대의 바이브레이션에 의해 발생된 음성은 연속적인 고주파수에서, 기본 주파수 또는 기저대, 및 다수의 고조파 부분들 또는 배음(倍音)으로 이루어진다. 고조파의 진폭이 감소하면, 주파수가 약 12dB/옥타브의 속도로 증가한다. 기저대 또는 기본 주파수 및 이의 고조파는 음성 트랙을 통과하게 되는데, 이 음성 트랙은 다수의 개별 공진을 제공하는 목, 머리 및 입 내에 여러개의 공동을 포함한다. 음성 트랙은 다수의 특이할 만한 공진 모드를 갖고 있고 기저대 또는 기본 주파수 및 이의 고조파로 작동하는 다수의 공진 기관으로서도 조금은 작용한다. 음성 트랙의 선택적인 공진 작용으로 인해, 성대의 기본 주파수 중 몇몇 부분의 진폭은 주파수가 증가함에 따라 완만한 곡선을 이루며 감소하지는 않지만, 음성트랙의 특정한 공진에 대응하는 주파수에서 예리한 피크치를 나타낸다. 이러한 피크치 또는 공진을 "포르만트"라고 한다.
제2도에는 다수의 고조파에 대한 진폭대 주파수를 도시한 유성음(예를 들어, 모음) 의 그래프가 도시되어 있다. 그래프의 좌측의 하부 주파수는 성대의 바이브레이션에 의해 발생된 기본 주파수 또는 기저대이다. 이러한 기저대 주파수는 전형적인 성인 남성의 음성의 60Hz와 250Hz사이이다. 기본 주파수의 여러 가지 고조파는 성분(22a,22b,22c)들 각각에 의해 나타난다. 전체 음성 신호는 기저대 및 전체 주파수 대역에 걸친 다수의 개별 고조파로 이루어져 있다는 것을 알 수 있다. 음성 신호의 해당주파수 대역은 60Hz와 약 7,500Hz 사이가 일반적이다.
제2도는 주파수가 증가함에 따라 진폭이 자연스럽게 감소하는 개별 고조파가 완만한 곡선으로 진폭이 감소하는 것이 아니라, 소정의 피크치(26, 28 및 30)에서 다소 나타난다는 사실을 도시한 것이다. 이러한 피크치들은 음성트랙의 개별 공진을 나타내고, 정상적인 사람의 음성 트랙은 4개 이상이지만 설명을 용이하게 하고자 3개로 한다. 피크치 또는 음성 트랙 공진은 발성된 음성의 포르만트이다. 성인 남자에 있어서, 제1의 4개 포르만트(저 주파수)는 약 500, 1500, 2500 및 3500Hz에 각각 가깝다. 턱, 혀 및 혀의 끝을 포함하는 여러 가지 발성 기관을 움직이면 다수의 포르만트 주파수가 광범위하게 변한다. 상이한 포르만트 주파수들은 개별 발성구조의 형태 또는 위치에 대해 상이한 감도를 갖고 있다. 사람들 각자의 발성기는 유성음을 선택된 모음으로 제공하는 데 이용하는 발성 기관들을 움직임으로써 포르만트 주파수가 선택된다. 반대로 말하면, 발성된 말들을 듣고 있는 경우, 각각의 모음은 독특한 포르만트 셋트에 의해 인식될 수 있다.
제2도의 유성음 및 포르만트에 관련된 상기 설명은 음성 트랙의 공진 공동(cavity)에 의해서도 포르만트가 발생되는 무성음에도 동일하게 적용할 수 있다. 유성음은 호흡 기관에 의해 발생된 입김이 성대의 바이브레이션에 의해 발생되고 발성된 말의 모음을 포함한다. 무성음은 성대의 바이브레이션이 일어나지 않을 때 음성 트랙에 의해 발생되는 것이다. 무성음은 자음, 파열음 및 마찰음을 포함한다. 이러한 음은 호흡 기관으로부터의 공기의 방출을 조절하지만 성대의 바이브레이션은 조절하지 못하는 혀, 이(爾) 및 입의 움직임에 의해 발생되는 것이다. 이들은 여러 가지 자음을 포함한다. 무성음은 문자(M, N, L, Z, G, DG 등)을 포함하지 않는 발성된 말의 음을 포함한다. 성대의 바이브레이션 음을 포함하지 않는 이러한 파열음, 미찰음 및 자음은 2,000Hz 내지 3,000Hz 범위의 성대 바이브레이션의 기본 주파수보다 높은 주파수특성을 갖고 있다. 그러나 음성 트랙에서 발생된 음이 성대 바이브레이션에 의해 발생되는 유성음인지 또는 성대의 바이브레이션이 일어나지 않고서도 발생된 자음, 파열음 및 마찰음인지의 여부에 무관하게, 음성 트랙의 공진은 발생된 기본 주파수의 고조파들 중 상이한 고조파들의 피크치로서 포르만트를 발생시키도록 작용한다.
스피치의 포르만트는 스피치의 명료도가 청취자에게 주요하게 기여하게 된다는 것으로 알려져 있다. 즉, 청취자는 특정한 모음 또는 자음 파열음 또는 마찰음을 청취자의 포르만트의 특정한 패턴에 의해 인식할 수 있다. 이것은 몇몇 포르만트의 상대 주파수의 패턴이다. 포르만트 패턴은 여성 또는 어린 아이들의 음성의 높은 피치, 또는 남성의 음성의 낮은 피치와 같은, 높은 피치 또는 낮은 피치의 기본 주파수에 기인한다. 그럼에도 불구하고, 포르만트의 패턴 및 공진 피크치의 상대 주파수로 발성된 고유음을 청취자가 인식한다. 육성의 음향학에 대한 성명은 더블류. 에이취. 프리맨 앤드 캄파니(W.H.Freeman and Compny)(1948)가 간행한 씨. 헛친스(C. Huchins)의 입문서인 Readings from Scientific American, The Physics of Music에 실린 제이. 선버그(J. Sunburg)저 "The Acoustics of the Singing Voice"라는 논문에 기재되어 있다.
사람의 귀로 들을 수 있는 음성의 명료도는 하워드 더블류. 샘스 앤드 캄파니(Howard W. Sams and Company)(1987)가 간행하고, 글렌 밸로우(Glen Ballou)저 "Handbook Ror Sound Engineers-The New Audio Cyclopedia"에 부분적으로 기재되어 있다. 이 핸드북의 162페이지에는 상이하게 발성된 음성에 포함된 상이한 주파수가 발성된 말의 명료도에 기여한다는 발견에 대해 기재되어 있다. 그러므로, 약 1.5KHz내지 3.5KHz인 중간 주파수는 명료도에 크게 기여한다. 예를 들어, 약 250Hz 내지 5KHz 이상의 주파수범위에서 옥타브가 분류되는데, 250Hz가 중간 주파수인 옥타브는 청취자가 들을 수 있는 발성된 음성의 명료도가 7.2%가 향상되게 하고, 500Hz가 중간주파수인 옥타브는 14.4%가 향상되게 하며, 1KHz가 중간 주파수인 옥타브는 22.2%가 향상되게 한다. 2KHz가 중간 주파수인 옥타브는 최대로 32.8%가 향상되게 하고, 4KHz가 중간 주파수인 옥타브는 23.4%가 향상된다.
본 발명은 배경 잡음이 높을지라도 명료도가 크게 향상된 전체 스프치 신호를 제공하기 위해, 스피치를 발생시키는 방식, 및 여러 가지 유성음 및 무성음이 형성되는 방식은 채택하고, 그리고 선택적으로 증폭된 스피치 포르만트를 독특하게 가중시키기도 한다. 기본적으로, 본 발명의 실시예에 따르면, 음성의 명료도는 스피치 포르만트를 선택적으로 증폭하여 향상된 포르만트를 조합함으로로써 향상된다.
제3도에는 본 발명의 한 실시예의 블록도가 도시되어 있다. 마이크로폰 또는 녹음 매체 또는 이와 유사한 음성 소오스로부터 유도될 수 있는 라인(40)상의 입력 전기 신호는 별도의 출력 라인 또는 주파수 채널라인(44 및 46 )상에 나타나는 상이한 주파수 성분의 수가 30개로서 인입 신호를 분리하는 스펙트럼 분석기(42)에 제공된다. 라인(44 및 46)은 협대역 주파수에서 스펙트럼 분석기의 출력으로부터의 30개의 상이한 출력 라인들을 각각 나타낸다. 개별 주파수 채널 각각에서 신호를 처리하는 것은 이러한 장치의 다른 주파수 채널 각각에서 신호를 처리하는것과 동일하므로, 스펙트럼 분석기 출력의 채널(44)에서 신호를 처리하는 것에 대한 설명은 다른 채널 각각에서 신호를 처리하는 것에 대한 설명으로도 충분하다는 것을 이해할 수 있을 것이다. 채널(44)에서의 신호는 라인(52)상의 신호입력, 및 라인(54)상의 이득 제어 입력을 갖고 있는 전압 제어증폭기(VCA : 50)의 신호 입력에 제공된다. 라인(54)상의 이득 제어 입력은 가변 저항기(56)을 통해 입력 라인(52)로부터 유도된다. 30개의 채널(44 내지 46)들의 그룹 및 이들의 전압 제어증폭기(50 내지 58)은 조합 회로망(64)에서 조합되는(각각 30개인) 출력 라인(60 및 62) 상에 출력들을 갖고 있다. 채널(44 내지 46)은 음성 신호 또는 모음을 처리한다.
이와 마찬가지로 30개의 채널로 이루어진 스펙트럼 분석기의 출력 신호는 자음 및 마찰음 채널(70 내지 72)에 제공되는데, 이 채널들은 1/3옥타브의 중분만큼 격리된 30개 이상의 채널일 수 있으며 주파수가 상이하다는 것을 제외하고는 다른 것들은 동일하다. 그러나, 자음 및 마찰음 채널이 경우에, 소수, 즉 5개 또는 10개의 채널이 적당하다. 자음 및 마찰음 채널(70 내지 72)는 모음(유성음) 채널(44 내지 46)과 유사하고, 채널(70)용 증폭기(74)와 같은 전압 제어 증폭기를 각각 포함하는데, 채널(70)의 입력 신호 및 전압 제어 입력(76)의 신호는 입력라인으로부터 가변 저항기(78)을 통해 제공된다. 이와 같이 채널 (72)는 제어 입력 신호가 입력 신호 라인으로부터 가변 저항기(82)를 통해 제공되는 전압 제어 증폭기(89)를 포함한다. 음성 채널에 있어서, 자음 및 마찰음 채널의 출력은 조합 회로(84)에서 조합된다.
또한, 입력 신호(40)은 음성 신호가 존재하는지의 여부를 나타내는 출력 라인(92 및 94)의 선택 신호를 제공하는 유성음/무성음 스위치(90)에 제공된다. 유성음/무성음 신호 셀렉터는 300Hz이하의 주파수를 통과시키는 저역 통과 필터로 간단히 구성할 수 있다. 다시 말하면, 이러한 스위치(셀렉터)는 모음의 기본 주파수를 선택적으로 통과시킨다. 발성된 모음(유성음)의 기본 주파수는 약 600Hz와 250Hz 사이가 일반적이므로, 저역 통과 대역의 신호가 존재하며, 음성 신호가 존재한다는 것을 알 수 있는데 반해, 저역 통과 필터로부터의 출력이 전혀 없다면, 입력 신호는 무성음만을 포함하고 있다는 것을 알 수 있다. 유성음 신호의 존재시에, 라인(92)는 유성음 채널의 전압 제어 증폭기(50 및 58)을 턴 온시키는 반면 , 유성음 신호의 존재시에 라인(94)상의 신호는 무성음 채널이 전압 제어 증폭기(74 및 80)을 턴 오프시키는 제어 신호를 제공한다.
선택적으로, 모음이 아닌 유성음 성분의 부재시에, 라인(92)의 신호는 유성음 채널 증폭기(50 내지 58)을 턴 오프시키고, 라인(94)의 신호는 무성음 채널 증폭기(74 내지 80)을 턴온시킨다.
초기의 처리되지 않은 유성음, 특히 기저대 또는 기본 주파수의 유성음을 처리한 후에 유성음과 무성음을 조합하는 것이 요구된다. 그러나, 스펙트럼 분석기 및 이의 몇몇 필터가 소정의 위상 전이량을 출력 신호에 가하기 때문에, 처리된 유성음 신호와 무성음 신호를 조합한 처리되지 않는 유성음 신호는 스펙트럼 분석기의 출력으로부터 유도되므로, 조합된 신호가 동일하게 위상 전이된다. 이러한 목적을 달성하기 위해, 채널(44 내지 46)을 포함하여 모든 스펙트럼 분석기의 출력 라인으로부터의 신호들이 라인(100 및 102)를 통해 합 또는 조합 회로망(104)에 제공되는 데, 이 회로망은 출력 라인(106)상에 스펙트럼 분석기에 의해 부과된 모든 위상 전이 신호를 갖는 재조합된 유성음 신호를 제공하므로, 레벨 조정 전위차계(110, 112 및 114)를 통해 조합기(64)로부터의 조합된 유성음 신호, 및 조합기(84)로부터의 조합된 무성음 신호를 믹서(108)에서 적절하게 조합시킬 수 있다. 라인(116)상에 믹서(108)의 출력은 명료도가 향상된 음성 신호를 제공한다.
명료도에 대한 각각의 기여도에 따라서 몇몇 채널(44 내지 46, 및 70 내지 72)의 몇몇 신호 성분을 적절하게 가중시키기 위해, 전압 제어 증폭기의 제어 입력의 가변 저항기(56, 57, 58 및 82)는 스펙트럼 분석기의 몇몇 출력 성부느이 증폭을 가중시키는데 이용된다.
아래의 표 1은 1/3 옥타브 주파수 대역 또는 전(full) 옥타브 주파수 대역으로 분리되는 육성 신호의 상이한 주파수 성분의 명료도에 대한 %기여도를 나타낸다. 전압 제어 조정 저항기(56, 57, 78, 82)은 아래 표에 따라서 조정된다. 표 1에 따라 명료도에 더욱 기여하는 주파수 대역의 포르만트들은 비례관계로 증폭된다. 예를 들어, 스펙트럼 분석기의 1 옥타브 대역에 있어서, 2KHz가 중심 주파수인 채널은 32.8의 상대치의 이득 제어 신호를 제공하도록 조정된 이득 제어 저항기를 갖고 있는 반면, 500Hz가 중심 주파수인 채널은 14.4의 상대치의 이득 제어 신호를 제공하도록 조정된 이득 제어 저항기를 갖고 있다.
효과적으로, 제3도에 도시된 개별 음성 포르만트를 진폭에 의해 각각 자동적으로 선택한다. 제2도에 도시된 바와 같이, 포르만트는 음성 트랙의 공진 피크치로 인해 증가된 진폭을 갖고 있으므로, 각 채널로 제어되는 몇몇 전압 제어 증폭기는 개별 주파수 대역의 최고 진폭의 주파수 성분을 선택하고 도시된 제곱(sqware law) 증폭만큼 진폭이 증가한다(증폭기 입력은 이득을 제어하는 데 사용된다). 입력- 개별 전압 제어 증폭기의 진폭이 소정 레벨 이하인 경우, 신호 레벨은 증폭된다기보다는 증폭기에 의해 감소된다. 그러므로, 상대적으로 톺은 진폭의 포르만트를 포함하는 시펙트럼 분석기의 출력에서의 주파수 대역에 있어서, 이러한 포르만트는 개별 전압 제어 증폭기에 의해 증폭되는데, 이 증폭기의 이득은 가중 전위차계(56 또는 57)에 의해 조정된 바와 같이 입력 신호 자체에 의해 제어된다. 이와 동일한 동작이 채널(70 내지 72)의 자음 및 마찰음에 관련하여 발생한다. 기본적으로 이 장치는 스피치의 포르만트를 선택적으로 인식하고 제곱형 증폭의 포르만트를 증폭시키며, 포르만트의 증폭(예를 들어, 이득)의 선택적인 가중후에, 명료도가 향상된 출력을 제공하기 위해 초기 신호와 포르만트를 조합한다.
제4도에는 제3도의 처리기의 간단한 변형 구조가 도시되어 있다. 제3도의 것과 유사한 이 처리기는 표준 확성 장치 또는 녹음 장치에 사용하는 경우 제1도의 처리기를 한정할 수 있다.
제 4도의 장치에 있어서, 신호는 유성음 성분과 무성음 성분으로 분리되지 않을 뿐만 아니라, 자체 입력에 의해 제어된 각각의 전압 제어증폭기로 분리되지는 않는다. 그러므로, 이러한 장치는 상당히 간단해지고 동일하거나 개선된 성능도 제공한다. 더욱이, 제4도의 장치에 있어서, 개별 포르만트 증폭의 소정 또는 예산(pre-computed) 및 일반화된 가증이 전혀 이용되지 않는다. 오히려, 간단한 검증 절차가 따르므로, 각각의 포르만트 레벨은 기저대 신호의 레벨까지 효과적으로 가져갈 수 있다.
제4도의 라인(120)상의 입력 음성 신호는 버퍼 증폭기(122)를 통해 요구된 소정수의 채널을 갖는 스펙트럼 분석기(124)에 제공된다. 스펙트럼 분석기는 1 옥타브 또는 1/3 옥타브 또는 이와 유사한 배분이 이루어 진다. 전형적인 장치에 대해 보다 상세하게 후술한 바와 같이, 스펙트럼 분석기는 근접 대역에 각각 조정된 연속적인 고주파의 30개의 상이한 출력 주파수 대역을 제공하기 위해 30개의 개별 채널을 갖추고 있다. 스펙트럼 분석기의 최저 출력 대역은 라인(130)상에 제공되고, 약 300Hz 이하의 저주파수 대역의 모든 신호 성분을 포함한다. 이것은 성대의 기저대 또는 기본 주파수 범위에 있다. 다수의 추가 대역은 참조 번호(132,134,136 및 138)로 나타난다.(실제 대역수는 29개이다). 이들 각각은 자체 개별 전압 제어 증폭기(140,142,144 및 146)에 신호를 제공한다. 스펙트럼 분석기의 모든 출력에서의 모든 신호는 합 저항기(156)을 경유하여 연산 증폭기(158)이 반전 입력에 제공되는 라인(154)상의 조합 신호를 나타내는 출력으로부터 혼합 또는 조합 회로망(150)에 입력신호로서 제공되는데, 연산 증폭기(158)은 접지된 비반전 입력을 갖고 있고, 합 증폭기로서 사용된다.
또한, 조합 회로망의 출력은 증폭기(160)에 제공되어 조정 전위차계(162)를 경유하여 버퍼 증폭기(164)에 제공된다. 버퍼 증폭기(164)의 출력은 라인(166)상의 공통 이득 제어 입력을 처리기의 몇몇 채널의 전압 제어 증폭기(140) 내지 146)에 제공한다. 버퍼 증폭기(144)에서 라인(166)상의 제어 신호는 상기 가중을 제공하기 위해 각각의 전압 제어증폭기의 신호의 크기로서 각각 조정된다. 각각의 전압 제어증폭기(140 내지 146)은 개별채널의 적절한 가중을 제공하도록 설정되는 조정가능 전위차계(제4도에는 도시하지 않음)를 포함한다. 이 가중은 조정될 기저대 및 한 채널만을 제외하고는 스펙트럼 분석기의 모든 채널을 초기에 단로시킴으로써 실험적인 기초가 달성된다. 기저대 신호의 진폭과 전압 제어 증폭기(VCA : 140)의 출력에서의 진폭이 비교된다. 이 VCA에 제공된 제어 신호량을 변화시키는 전위차계는 개별 VCA의 출력 진폭이, 기저대 채널의 신호 진폭 레벨까지 조정되도록 증폭기의 이득을 조정하기 위해 조정된다. 한 채널이 조정되면, 이 채널은 턴 오프되고 다음 채널이 유일하게 턴 온된다. 이때, 전압 제어 증폭기로부터의 출력은 기저대의 진폭과 비교되어 이와 동일하게 조정된다. 이러한 절차는 분석기의 모든 채널이 개별적으론 조정될 때까지 스펙트럼 분석기의 채널로 각각의 수순에 따르므로, VCA의 각각의 출력 진폭은 기저대 채널의 신호 진폭까지 개별적으로 이른다. 그러므로, 소정의 적절한 음성 형태인 입력(120)에서의 검증 또는 가상 음성신호로 조정이 수행된다. 검사 신호는 모든 고조파를 포함하는 기저대 신호를 나타내지만, 포르만트를 포함하는 공진 피크치와는 상관없는 신호를 포함한다.
증폭기(160)는 전위차계(162)의 조정에 의해 효과적으로 감쇠되는 약 +5의 이득을 갖고 있다. 버퍼 증폭기(164)는 단위 이득을 갖고 있다. 모든 채널의 입력들이 합 저항기(170,172,174,176,178 및 156)을 포함하는 연산 증폭기(158)의 반전 입력에서 합산되는 합 회로망은 증폭기의 입력에서의 모든 입력 신호를 동일하게 합하도록 한다. 그러므로, 연산 증폭기(158)의 피드백 저항기(180)은 모두가 서로 동일한 합 저항기(170 내지 178, 및 156)의 각각과 동일하다.
제4도의 실시예에 있어서, 유성음 또는 무성음으로부터 유도되는지의 여부를 나타내는 모든 포르만트는 동일 방식으로 처리되고, 이와 유사한 실험적으로 결정된 가중에 의해서도 처리된다. 각각의 포르만트는 개별적으로 선택되어 향상되는데, 그 이유는 개별 전압 제어 증폭기가 스펙트럼 분석기의 출력에서 개별 주파수 대역 내의 최고 진폭 성분시에만 동작하고 신호 출력이 선정된 임계치 이상일 경우에만 동작한다. 몇몇 VCA들은 이러한 임계치 이상의 신호들을 효과적으로 부시하고 최고 진폭을 선택적으로 증폭한다. 효과적으로, 몇몇 전압 제어 증폭기는 기저대 신호 자체에 의해 제어된다. 기저대 신호는 기저대의 고조파인 고주파수를 다른 주파수와 조합한 신호지만, 문자의 진폭은 고조파의 진폭보다 상당히 크고 자음, 마찰음 및 파열음의 진폭보다 높으므로, 개별 전압 제어 증폭기의 모든 제어 입력에 제공되는 라인(166)상에 최대 제어 신호 성분을 제공한다, 그러므로, 제4도의 장치에 있어서, 몇몇 포르만트는 기저대 신호의 제어중에 효과적으로 증폭되는 반면, 제3도의 장치에 있어서, 각각의 개별 포르만트는 자체의 제어중에 효과적으로 증폭된다.
제5도에는 다수의 National Semiconductor counter for divider chips Model 120 TPQ의 상호접속에 기초한 예시적인 스펙트럼 분석기가 도시되어 있다. 그러므로 10개의 상이한 칩(200,202,204,206,208,210,212,214,216 및 218)들 각각은 제5도에 도시된 바와 같이 상호접속되는데, 칩(200)의 출력 라인(220)은 그 다음 칩(202)의 라인(222)상의 입력에 순차적으로 접속된다. 모든 칩들은 칩(200)이 캐패시터(226 및 227)을 통해 접지에 접속된 기준 주파수를 발생시키는 1MHz크리스탈(224)에 먼저 접속되는 것을 제외하고는 동일 한 방식으로 접속된다. 각 칩의 출력은 칩(200)의 출력으로부터의 클럭 입력 라인(232)을 갖고 있는 용량 전환용 필터 칩(230)이 높은 신호 주파수를 다음 칩에 직렬로 제공한다. 필터(230)의 클럭 출력 라인(233)의 신호는 라인(236)을 경유하여 칩(210 및 212)의 입력 및 제 2용량 전환 필터(234)의 입력에 제공된다. 필터(234)는 칩(214,216 및 218)로의 입력들은 제어하기 위해 접속된 출력을 갖고 있다. 필터 칩(230)은 칩(210 및 212)과 칩(206 및 208)로의 입력들을 제어한다. 제4도의 라인(120)으로부터의 입력은 칩(200,202 및 204)과 용량 전환 필터 칩(230)에 직접 제공된다. 이러한 스펙트럼 분석기의 30개의 상이한 주파수 출력은 30개의 라인(C1 내지 C30)상에 나타나는데, C30은 최고 주파수 채널이고, C2는 최저 주파수 채널이다. 예를 들어, 출력(C1, C2 및 C3)은 약 20, 32 및 42KHz의 출력 주파수를 갖고 있다. 이 장치는 60Hz와 8,000Hz사이의 1/3 옥타브 주파수만을 사용한다. 칩(200)은 주파수가 크리스탈(224) 및 캐패시터(226)에 의해 제어되는 발진기내에 설치된다. 주파수는 상술한 30개의 상이한 주파수를 얻기 위해 몇몇 칩에 의해 분주된다. 전환필터(230 및 234)는 National Semiconductor chip"LMF, 60-100"일 수 있다.
제 6 도는 제 4 도의 처리기의 모든 채널과 동일하나 전압 제어 증폭기(VCA)들 중 예시적인 한 증폭기가 도시되어 있다. 각각의 전압 제어 증폭기 칩(300)은 이중채널 고성능 이득 제어 회로인 Signetics NE/SA 572 "Programmed Analog Compandor"인데, 변형된 입력 및 출력 회로는 제 6 도에 도시되어 있다. VCA칩(300)은 스펙트럼 분석기(124)(제 4 도)의 (132,134,135,138에 대응하는) 라인(306)으로부터 캐패시터(304)를 통해 라인(302)상의 입력을 갖고 있다. 버퍼(164)의 출력 라인(166)에 제공되는 증폭기용의 전압 제어 입력은 전위차계(제 3 도의 56,57,78 및 82에 대응하는) 검증 및 가중 전위차계(308)을 통해 제공되므로, 전위차계 가동자 암으로부터 캐패시터(170) 및 입력 저항기(172)를 경유하여 이득 제어 VCA칩(300)의 제어입력에 제공된다. 합 회로망(172,174,178 및 156 : 제 4 도)로의 전압 제어 증폭기 출력은 고정 전압원으로부터 전압 조정 전위차계 및 고정 저항기(322)를 경유하여 바이어스되는 출력 단자(320)으로부터 제공된다. 전압 제어 증폭기의 출력은 라인(328)상의 출력 신호를 제 4 도의 합 회로망(170 내지 178)에 제공하도록 비반전 입력이 접지된 연산 증폭기(326)의 반전 입력에 제공된다. 개별 전압 제어 증폭기의 개별 가중을 제어하는 것은 전위차계(308)이다. 이것은 각 채널의 진폭을 기저대 신호의 진폭까지 가져가는데 채널 단위로 조정되는 저항기이다. 물론, 전위차계(308)의 적절한 저항의 크기를 결정할 때, 전위차계의 저항은 소량만큼 조절될 수 있는 고정 저항기로서 제공될 수 있다.
상술한 바와 같이, 제 1 도는 음성 통신 장치에 실제로 적용된 본 발명의 음성 처리 방법 및 장치가 도시되어 있다. 동일한 음성 처리 장치가 종래의 확성 정치에 입력된 소리를 후에 반복해서 이용해서 적절한 녹음을 행하는데 적용될 수 있다는 것을 쉽게 알 수 있다. 이러한 녹음을 행할 때,, 본 발명의 음성 처리 및 명료도 향상 기술을 사용하면, 본래 최종 녹음은 처리 회로에 의해 명료도가 향상된다. 그러므로, 명료도 향상 처리는 이러한 녹음이 종래의 확성 장치나 다른 스피커를 통해 행해지는 것을 전혀 필요로 하지 않는다.
이러한 녹음을 행하기 위해서는 제 1 도에 도시된 것과 거의 동일한 장치가 사용된다. 단지 차이점이라면 테이프레코더 등과 같은 녹음 장치를 스피커(16)으로 대체했다는 것으로, 테이프 또는 다른 녹음 매체 상에 녹음된 소리는 방금 기술한 회로(18)에 의해 처리되어 향상 및 조합된 포르만트를 포함한다.
명료도가 향상된 녹음이 이러한 녹음 장치에 의해 행해지도록, 제1 도의 장치중 스피커(16)으로 표시된 소자가 실제로 스피커 대용의 녹음 장치인데, 음성 소오스(10)으로부터의 입력 신호는 녹음실에서 발성된 신호 또는 배경 잡음이 없는 다른 환경에서 발성된 신호와 같이 깨끗한 음성 신호일 수 있다. 그러나, 상술한 처리는 입력된 음이 배경 잡음이 있는 환경에서 일어난 음성을 포함하는 경우에 명료도가 향상된 녹음을 제공한다. 이러한 조건은 여러 가지 상황하에 있을 수 있는데, 예를 들면 항공기의 조타실에서 사건 및 승무원의 대화 내용을 녹음하기 위해 종래의 항공기 조타실에서 이용되는 녹음 장치인 조종실용 음성 레코더(CVR)의 경우와 같은 상황하에 있을 수 있다. 조타실은 상당히 잡음이 심하므로, 과거에는, 조타실용 음성레코더로 녹음한 녹음 내용은 명료도의 열화로 인해 알아듣기 어려웠었다. 본 발명은 종래의 재생 장비로 재생할 경우 녹음된 소리의 명료도를 향상시키기 위해 조타실 음성 레코더와 같은 것에 적용할 수 있다. 본 발명의 명료도가 향상된 조타실용 음성 레코더는 제 1 도에 도시한 장치와 거의 동일한데, 음성소오스(10)은 제 1 도에 스피커(16)으로 대체된 공지된 음성 레코더에 녹음하기 위해 음을 모으는데 이용된 마이크로폰을 포함한다. 마이크로폰(10)의 출력(음성 소오스)는 증폭기(12)와 같은 적절한 증폭기에 제공된다. 증폭기의 출력은 상술한 명료도가 향상된 음성 처리 회로(14)에 제공된다. 회로(14)는 상대적으로 높은 레벨의 배경 잡음이 존재할지라도 음성 신호의 포르만트를 선택적으로 인식하여 증폭한다. 그러므로, 상술한 바와 같은 포르만트 처리는 녹음중에 잡음이 포함되어 있을지라도 명료도가 향상된 녹음을 할 수 있다.

Claims (20)

  1. 포르만트(formant) 갖고 있는 발성된 말을 나타내는 전기 음성 신호로부터 유도된 입력 신호를 수신하는 스피커로부터 주변 잡음 구역 내로 투입된 발성된 말의 명료도(intelligibility)를 향상시키기 위한 방법에 있어서, 포르만트를 갖고 있는 발성된 말(spoken words)을 나타내는 전기 음성 신호를 생성하는 단계 ; 상기 발성된 상기 포르만트들 중 개별 포르만트들을 제어된 양만큼 증폭하는 단계 ; 상기 포르만트들 중 서로 다른 포르만트들의 증폭량을 상호 다른 가중값들로 가중시키는 단계 ; 상기 발성된 말을 나타내는 향상된 음성 신호를 생성하기 위해 상기 발성된 말의 상기 증폭 가중된 포르만트들을 조합하는 단계 ; 및 주변 잡음 영역 내에 음(sound)으로서 투입되도록 상기 향상된 음성 신호를 스피커에 제공하는 단계를 포함하는 것을 음성 명료도 향상 방법.
  2. 포르만트를 갖고 있는 전기 음성 신호로부터 유도된 입력 신호를 수신하는 스피커로부터 주변 잡음 구역 내로 투입될 음성의 명료도를 향상시키기 위한 방법에 있어서, 상기 포르만트들 중 개별 포르만트들을 제어된 양만큼 증폭하는 단계 ; 상기 포르만트들의 증폭량을 서로 다른 가중값으로 가중시키는 단계 ; 향상된 음성 신호를 생성하기 위해 상기 증폭 가중된 포르만트들을 조합하는 단계 ; 및 주변 잡음 구역 내에 음으로서 투입되도록 상기 향상된 음성 신호를 스피커에 제공하는 단계를 포함하고, 상기 포르만트는 기저대신호를 포함하며, 상기 조합 단계 이전에 상기 포르만트 및 기저대 신호를 위상 전이시키는 단계를 더 포함하고, 상기 음성 신호는 모음, 자음, 및 마찰음을 포함하며, 상기 증폭 단계는 상기 모음, 자음 및 마찰음의 포르만트들을 향상시키는 단계 및 상기 향상된 포르만트들을 상기 기저대 신호와 조합하는 단계를 포함하는 것을 특징으로 하는 음성 명료도 향상 방법.
  3. 제 1 항에 있어서, 상기 음성 신호는 진폭을 갖는 기저대 신호를 포함하고 ; 상기 포르만트들 중 개별 포르만트들을 증폭하는 상기 단계는 상기 포르만트의 진폭을 상기 기저대 성분의 진폭까지 상승시키는 단계를 포함하는 것을 특징으로 하는 음성 명료도 향상 방법.
  4. 제 1 항에 있어서, 상기 포르만트 가중 단계는 상기 포르만트에 대해 약 1KHz와 4KHz 사이의 주파수에서는 가중을 더 크게 하고 약 1KHz 이하와 약 4KHz 이상의 주파수에서는 가중을 더 작게 하는 단계를 포함하는 것을 특징으로 하는 음성 명료도 향상 방법.
  5. 제 4 항에 있어서, 상기 가중 단계는 약 2KHz 내지 3KHz 범위의 주파수에서 상기 포르만트에 대해 가중을 더 크게 하는 단계를 포함하는 것을 특징으로 하는 음성 명료도 향상 방법.
  6. 제 1 항에 있어서, 상기 가중 단계는 일군의 상기 포르만트들 각각의 진폭을 선정된 레벨까지 증가시키는 단계를 더 포함하는 것을 특징으로 하는 음성 명료도 향상 방법.
  7. 제 1 항에 있어서, 포르만트들을 증폭하는 상기 단계는 포르만트 자신의 진폭에 따라서 각각의 포르만트 레벨을 제어하는 단계를 포함하는 것을 특징으로 하는 음성 명료도 향상 방법.
  8. 제 1 항에 있어서, 상기 포르만트들 중 개별 포르만트들을 증폭하는 상기 단계는 상기 음성 신호의 레벨을 나타내는 제 어 신호를 생성하는 단계, 및 상기 제어 신호의 세기에 따라서 상기 선택된 포르만트들을 개별적으로 증폭하는 단계를 포함하는 것을 특징으로 하는 음성 명료도 향상 방법.
  9. 제 8 항에 있어서, 증폭 제어 신호를 생성하기 위해 선정된 주파수 대역들의 상기 포르만트들을 조합하는 단계를 포함하고, 상기 가중 단계는 상기 제어 신호의 개별적으로 가중된 크기에 따라 상기 포르만트들 중 개별 포르만트들을 증폭하는 단계를 포함하는 것을 특징으로 하는 음성 명료도 향상 방법.
  10. 포르만트를 갖고 있는 전기 음성 신호로부터 유도된 입력 신호를 수신하는 스피커로부터 주변 잡음 구역 내로 투입될 음성의 명료도를 향상시키기 위한 방법에 있어서, 상기 포르만트들 중 개별 포르만트들을 제어된 양만큼 증폭하는 단계 ; 상기 포르만트들의 증폭량을 서로 다른 가중값으로 가중시키는 단계; 증폭제어 신호를 생성하기 위해 선정된 주파수 대역들의 포르만트들을 조합하는 단계 ; 상기 가중 단계는 상기 증폭 제어 신호의 개별적으로 가중된 크기에 따라 상기 포르만트들 중 개별 포르만트들을 증폭하는 단계를 포함하고 ; 향상된 출력 신호를 제고하기 위해 상기 증폭된 포르만트들과 상기 증폭 제어 신호를 조합하는 단계 ; 및 주변 잡음 구역 내에 음으로서 투입되도록 상기 향상된 출력 신호를 스피커에 제공하는 단계를 포함하는 것을 특징으로 하는 음성 명료도 향상 방법.
  11. 음을 주변 잡음 구역 내에 투입하는 스피커의 출력으로서 투입된 발성된 말의 명료도를 향상시키기 위한 방법에 있어서, 발성된 말의 시퀀스의 기저대 성분 및 다수의 포르만트 성분을 포함하는 발성된 말의 상기 시퀀스를 나타내는 전기 음성 신호를 입력하는 단계 ; 기저대 주파수를 포함하는 상이한 주파수들 및 다수의 고주파들의 다수의 개별 주파수 성분들로 상기 전기 음성 신호를 분리하는 단계 ; 다수의 상기 개별 주파수 성분들을 증폭하는 단계 ; 상기 개별 주파수 성분들 중 최소한 한 성분으로부터 증폭 제어 신호를 발생시키는 단계 ; 가중된 신호를 생성하도록 서로 다른 가중값들로 개별 주파수 성분들의 상기 증폭량을 개별적으로 가중시키기 위해 상기 증폭 제어 신호를 사용하는 단계 ; 발성된 말의 상기 시퀀스를 나타내는 향상된 음성 신호를 생성하기 위해 사이 가중된 신호들을 조합하는 단계 ; 및 주변 잡음 구역 내에 음으로 투입되도록 상기 향상된 음성 신호를 스피커에 제공하는 단계를 포함하는 것을 특징으로 하는 음성 명료도 향상 방법.
  12. 주변 잡음 구역 내에 음을 투입하며, 기저대 성분 및 다수의 포르만트 성분을 포함하는 음성을 나타내는 전기 음성 신호로부터 유도된 입력 신호가 공급되는 스피커의 출력으로서 투입된 음성의 명료도를 향상시키기 위한 방법에 있어서, 기저대 주파수를 포함하는 상이한 주파수들 및 다수의 고주파들의 다수의 개별 주파수 성분들로 상기 전기 음성 신호를 분리하는 단계 ; 다수의 상기 개별 주파수 성분들을 증폭하는 단계 ; 상기 개별 주파수 성분들 중 최소한 하나의 성분으로부터 증폭 제어신호를 발생시키는 단계 ; 가중된 신호를 발생하도록 서로 다른 가중값들로 개별 주파수 성분들의 상기 증폭량을 개별적으로 가중시키기 위해 상기 증폭 제어신호를 사용하는 단계 ; 향상된 음성신호를 생성하기 위해 상기 가중된 신호들을 조합하는 단계 ; 및 주변 잡음 구역 내에 음으로서 투입되도록 상기 향상된 음성신호를 스피커에 제공하는 단계를 포함하고, 주파수 성분을 증폭시키고 상기 증폭 제어 신호를 사용하는 상기 단계들은 상기 개별 주파수 성분들 중 최소한 하나의 성분을 자신의 크기에 따른 양만큼 증폭 시키는 단계를 포함하는 것을 특징으로 하는 음성 명료도 향상 방법.
  13. 전기 음성 신호의 명료도를 향상시키기 위한 음성 명료도 향상 장치에 있어서, 선택된 주파수 범위를 커버하는 다수의 상이한 주파수 채널의 주파수 대역 신호들을 상기 전기 음성신호에 응답하여 발생시키는 수단, 상기 주파수 대역 신호들 중 하나는 기저대 신호를 포함하고 ; 다수의 증폭된 주파수 대역 신호들을 발생시키기 위해서 일군의 상기 주파수 채널들 각각의 주파수 대역 신호를 증폭하기 위한 상기 일군의 주파수 채널들 각각의 증폭기 수단, 상기 증폭기 수단 각각은 증폭 제어 입력을 포함하고 ; 증폭 제어 신호를 발생하기 위해 상기 주파수 대역 신호들 중 최소한 하나에 응답하는 수단 ; 다수의 상기 증폭 제어 입력들에 상기 증폭 제어 신호를 인가하는 수단 ; 향상된 신호 출력을 발생시키기 위해서 상기 증폭된 주파수 대역 신호들과 상기 기저대 신호를 조합하는 수단 ; 상기 기저대 신호는 기저대 신호 진폭을 갖고 있고, 상기 채널들 중 일군의 서로 다른 채널들 각각의 상기 신호들 각각은 상기 전기 음성 신호의 포르만트를 나타내는 진폭을 갖는 포르만트 신호를 포함하며, 상기 포르만트 진폭들은 주파수 증가에 따라 감소하고, 상기 증폭기 수단은 상기 포르만트 신호를 각각의 진폭을 상기 기저대 신호의 진폭과 거의 같은 진폭으로 증가시켜, 각각의 포르만트 신호의 진폭이 상기 기저대 신호의 진폭에 이르며 ; 상기 향상된 신호 출력을 주변 잡음 구역 내에 투입하기 위해 상기 향상된 신호 출력에 응답하는 스피커 수단을 포함하는 것을 특징으로 하는 음성 명료도 향상 장치.
  14. 포르만트를 갖고 있는 완전 발성된 말의 시퀀스를 나타내는 전기 음성 신호를 수신 및 입력하는 입력 수단 ; 상기 전기 음성 신호를 수신하도록 접속되어, 서로 상이한 주파수 대역들의 다수의 개별 주파수 대역 출력 채널들 내에 개별 주파수 대역 신호들을 갖고 있는 스펙트럼 분석기 ; 상기 채널들 중 개별 채널에 각각 할당되고, 각각은 상기 채널들 중 하나의 채널로부터의 입력을 갖고 있으며 이득 제어 입력을 갖고 있는 다수의 전압 제어 증폭기들 ; 다수의 상기 증폭기들의 이득 제어 입력에 이득 제어 신호를 제공하기 위해 상기 채널들 중 최소한 한 채널의 신호들에 응답하는 제어 신호 발생수단 ; 상기 증폭기 및 상기 제어 신호 발생 수단은 상기 이득 제어 신호를 서로 다른 가중값들로 가중하기 위한 가중 수단을 포함하고 ; 다수의 상기 주파수 대역 채널들 각각으로부터의 입력, 및 조합된 출력을 갖고 있는 조합 회로 ; 완전 발성된 말의 상기 시퀸스를 나타내는 향상된 음성 신호 출력을 발생하며, 상기 증폭기들의 출력들과 상기 조합된 출력을 조합하는 수단을 포함하는 출력수단 ; 및 상기 향상된 음성 신호 출력을 주변 잡음 구역 내에 투입하기 위해 상기 향상된 신호 출력에 응답하는 스피커 수단을 포함하는 것을 특징으로 하는 음성 명료도 향상 장치.
  15. 제14항에 있어서, 상기 제어신호발생수단은 이득제어신호를 상기 증폭기의 이득 제어 입력에 상기 한 채널로 제공하기 위해 상기 채널들중 한 채널 내의 신호에 응답하는 수단을 포함하는 것을 특징으로 하는 음성 명료도 향상 장치.
  16. 제14항에 있어서, 상기 제어신호발생수단은 이득제어신호를 다수의 상기 증폭기들의 이득제어입력들에 제공하기 위해 상기 조합된 출력에 응답하는 수단을 포함하는 것을 특징으로 하는 음성 명료도 향상 장치.
  17. 제14항에 있어서, 상기 조합된 출력과 상기 증폭기들의 상기 출력들을 조합하기 위한 상기 수단은 상기 향상된 출력을 생성하기 위해 상기 채널들중 최저 주파수 채널로 상기 스펙트럼 분석기로부터 제공된 신호를 상기 증폭기들의 상기 출력들 및 상기 조합된 신호와 조합하기 위한 수단을 포함하는 것을 특징으로 하는 음성 명료도 향상 장치.
  18. 제17항에 있어서, 상기 가중 수단은 개별 증폭기의 출력 레벨을 상기 최저 주파수 채널 내의 신호 레벨과 동일하게 변화시키기 위해 상기 전압 제어 증폭기들 각각의 증폭량을 조정하기 위한 제어 레벨 조정 수단을 더 포함하는 것을 특징으로 하는 음성 명료도 향상 장치.
  19. 제14항에 있어서, 상기 주파수 대역 채널들 중 한 채널이 사람의 성대의 고유 주파수와는 동일하나 크지는 않은 저주파수 대역을 통과시키기 위한 기저대 채널인 것을 특징으로 하는 음성 명료도 향상 장치.
  20. 제14항에 있어서, 상기 채널들중 한 채널이 약 300Hz 미만의 주파수 대역을 통과시키는 것을 특징으로 하는 음성 명료도 향상 장치.
KR1019910025540A 1991-03-27 1991-12-30 음성 명료도를 향상시키기 위한 방법 및 장치 KR950013557B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US676,037 1976-04-12
US67603791A 1991-03-27 1991-03-27

Publications (2)

Publication Number Publication Date
KR920018650A KR920018650A (ko) 1992-10-22
KR950013557B1 true KR950013557B1 (ko) 1995-11-08

Family

ID=24712968

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019910025540A KR950013557B1 (ko) 1991-03-27 1991-12-30 음성 명료도를 향상시키기 위한 방법 및 장치

Country Status (11)

Country Link
US (1) US5459813A (ko)
EP (1) EP0505645B1 (ko)
JP (1) JP3151459B2 (ko)
KR (1) KR950013557B1 (ko)
CN (1) CN1041266C (ko)
CA (1) CA2056110C (ko)
DE (1) DE69131095T2 (ko)
ES (1) ES2133281T3 (ko)
HK (1) HK1003305A1 (ko)
IL (1) IL100174A (ko)
MX (1) MX9102610A (ko)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5710862A (en) * 1993-06-30 1998-01-20 Motorola, Inc. Method and apparatus for reducing an undesirable characteristic of a spectral estimate of a noise signal between occurrences of voice signals
JPH07104788A (ja) * 1993-10-06 1995-04-21 Technol Res Assoc Of Medical & Welfare Apparatus 音声強調処理装置
US5467393A (en) * 1993-11-24 1995-11-14 Ericsson Inc. Method and apparatus for volume and intelligibility control for a loudspeaker
JP3321971B2 (ja) * 1994-03-10 2002-09-09 ソニー株式会社 音声信号処理方法
EP0756386B1 (en) * 1995-07-27 2003-09-17 Victor Company Of Japan, Limited Method and apparatus for coding a digital, acoustic signal
GB2306088A (en) * 1995-10-09 1997-04-23 London Regional Transport Public address system speech training
US5966438A (en) * 1996-03-05 1999-10-12 Ericsson Inc. Method and apparatus for adaptive volume control for a radiotelephone
US5790671A (en) * 1996-04-04 1998-08-04 Ericsson Inc. Method for automatically adjusting audio response for improved intelligibility
GB9714001D0 (en) * 1997-07-02 1997-09-10 Simoco Europ Limited Method and apparatus for speech enhancement in a speech communication system
US6353671B1 (en) * 1998-02-05 2002-03-05 Bioinstco Corp. Signal processing circuit and method for increasing speech intelligibility
US6285767B1 (en) 1998-09-04 2001-09-04 Srs Labs, Inc. Low-frequency audio enhancement system
US6590983B1 (en) 1998-10-13 2003-07-08 Srs Labs, Inc. Apparatus and method for synthesizing pseudo-stereophonic outputs from a monophonic input
US6993480B1 (en) 1998-11-03 2006-01-31 Srs Labs, Inc. Voice intelligibility enhancement system
US7031474B1 (en) 1999-10-04 2006-04-18 Srs Labs, Inc. Acoustic correction apparatus
US7277767B2 (en) 1999-12-10 2007-10-02 Srs Labs, Inc. System and method for enhanced streaming audio
DE10124699C1 (de) * 2001-05-18 2002-12-19 Micronas Gmbh Schaltungsanordnung zur Verbesserung der Verständlichkeit von Sprache enthaltenden Audiosignalen
US20030220801A1 (en) * 2002-05-22 2003-11-27 Spurrier Thomas E. Audio compression method and apparatus
KR20050049103A (ko) * 2003-11-21 2005-05-25 삼성전자주식회사 포만트 대역을 이용한 다이얼로그 인핸싱 방법 및 장치
US7522733B2 (en) * 2003-12-12 2009-04-21 Srs Labs, Inc. Systems and methods of spatial image enhancement of a sound source
DE102004013952A1 (de) * 2004-03-22 2005-10-20 Infineon Technologies Ag Schaltkreis-Anordnung und Signalverarbeitungs-Vorrichtung
US8543390B2 (en) 2004-10-26 2013-09-24 Qnx Software Systems Limited Multi-channel periodic signal enhancement system
US8170879B2 (en) * 2004-10-26 2012-05-01 Qnx Software Systems Limited Periodic signal enhancement system
US8306821B2 (en) * 2004-10-26 2012-11-06 Qnx Software Systems Limited Sub-band periodic signal enhancement system
US7949520B2 (en) * 2004-10-26 2011-05-24 QNX Software Sytems Co. Adaptive filter pitch extraction
US7676362B2 (en) * 2004-12-31 2010-03-09 Motorola, Inc. Method and apparatus for enhancing loudness of a speech signal
TW200627999A (en) 2005-01-05 2006-08-01 Srs Labs Inc Phase compensation techniques to adjust for speaker deficiencies
KR100657948B1 (ko) 2005-02-03 2006-12-14 삼성전자주식회사 음성향상장치 및 방법
US8280730B2 (en) 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
US8050434B1 (en) 2006-12-21 2011-11-01 Srs Labs, Inc. Multi-channel audio enhancement system
WO2009004718A1 (ja) * 2007-07-03 2009-01-08 Pioneer Corporation 楽音強調装置、楽音強調方法、楽音強調プログラムおよび記録媒体
TWI376925B (en) 2007-08-28 2012-11-11 Micro Star Int Co Ltd Adjusting device and method of notification sound according to the environment
US8850154B2 (en) 2007-09-11 2014-09-30 2236008 Ontario Inc. Processing system having memory partitioning
US8904400B2 (en) 2007-09-11 2014-12-02 2236008 Ontario Inc. Processing system having a partitioning component for resource partitioning
US8209514B2 (en) 2008-02-04 2012-06-26 Qnx Software Systems Limited Media processing system having resource partitioning
JP4968147B2 (ja) 2008-03-31 2012-07-04 富士通株式会社 通信端末、通信端末の音声出力調整方法
JP5551254B2 (ja) 2009-09-14 2014-07-16 ディーティーエス・エルエルシー 適応音声了解度処理のためのシステム
US9324337B2 (en) * 2009-11-17 2016-04-26 Dolby Laboratories Licensing Corporation Method and system for dialog enhancement
KR101690252B1 (ko) 2009-12-23 2016-12-27 삼성전자주식회사 신호 처리 방법 및 장치
US8660271B2 (en) 2010-10-20 2014-02-25 Dts Llc Stereo image widening system
US9659571B2 (en) * 2011-05-11 2017-05-23 Robert Bosch Gmbh System and method for emitting and especially controlling an audio signal in an environment using an objective intelligibility measure
KR102060208B1 (ko) 2011-07-29 2019-12-27 디티에스 엘엘씨 적응적 음성 명료도 처리기
US9164724B2 (en) 2011-08-26 2015-10-20 Dts Llc Audio adjustment system
PL2798737T3 (pl) 2011-12-27 2019-05-31 Dts Inc System wzbogacania niskich tonów
JP5590021B2 (ja) * 2011-12-28 2014-09-17 ヤマハ株式会社 音声明瞭化装置
US9026439B2 (en) * 2012-03-28 2015-05-05 Tyco Fire & Security Gmbh Verbal intelligibility analyzer for audio announcement systems
US9299333B2 (en) 2012-09-02 2016-03-29 Qosound, Inc System for adaptive audio signal shaping for improved playback in a noisy environment
US9805738B2 (en) * 2012-09-04 2017-10-31 Nuance Communications, Inc. Formant dependent speech signal enhancement
CN104078050A (zh) 2013-03-26 2014-10-01 杜比实验室特许公司 用于音频分类和音频处理的设备和方法
WO2014190140A1 (en) 2013-05-23 2014-11-27 Alan Kraemer Headphone audio enhancement system
CN104575515A (zh) * 2013-10-23 2015-04-29 中兴通讯股份有限公司 一种提高语音质量的方法及装置
US9531333B2 (en) * 2014-03-10 2016-12-27 Lenovo (Singapore) Pte. Ltd. Formant amplifier
EP3107097B1 (en) * 2015-06-17 2017-11-15 Nxp B.V. Improved speech intelligilibility
US9847093B2 (en) * 2015-06-19 2017-12-19 Samsung Electronics Co., Ltd. Method and apparatus for processing speech signal
WO2017025107A2 (en) * 2015-11-22 2017-02-16 Al-Shalash Taha Kais Taha Talker language, gender and age specific hearing device
CN110024418B (zh) * 2016-12-08 2020-12-29 三菱电机株式会社 声音增强装置、声音增强方法和计算机可读取的记录介质
TWI662545B (zh) * 2018-06-22 2019-06-11 塞席爾商元鼎音訊股份有限公司 調整語音頻率之方法及其聲音播放裝置
CN109658952B (zh) * 2018-12-13 2020-10-09 歌尔科技有限公司 一种音频信号处理方法、设备及存储介质
CN109671422B (zh) * 2019-01-09 2022-06-17 浙江工业大学 一种获取纯净语音的录音方法

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3180936A (en) * 1960-12-01 1965-04-27 Bell Telephone Labor Inc Apparatus for suppressing noise and distortion in communication signals
US3368039A (en) * 1965-01-22 1968-02-06 Ibm Speech analyzer for speech recognition system
DE2555263B1 (de) * 1975-12-09 1977-02-10 Westfaelische Metall Industrie Kg, Hueck & Co, 4780 Lippstadt Verkehrsdurchsagesystem
DE2618973B2 (de) * 1976-04-29 1981-05-07 CMB Colonia Management- und Beratungsgesellschaft mbH & Co KG, 5000 Köln Verfahren zum Auffrischen älterer Tonaufzeichnungen
US4166926A (en) * 1978-06-07 1979-09-04 Seiler George J Portable lectern and voice amplifier
DE3070698D1 (en) * 1979-05-28 1985-07-04 Univ Melbourne Speech processor
US4287391A (en) * 1979-06-21 1981-09-01 Rhr Industries, Ltd. Microphone assembly for speech recording using noise-adaptive output level control
US4506379A (en) * 1980-04-21 1985-03-19 Bodysonic Kabushiki Kaisha Method and system for discriminating human voice signal
FI66268C (fi) * 1980-12-16 1984-09-10 Euroka Oy Moenster och filterkoppling foer aotergivning av akustisk ljudvaeg anvaendningar av moenstret och moenstret tillaempandetalsyntetisator
JPS5842096A (ja) * 1981-09-04 1983-03-11 富士通テン株式会社 音声信号の雑音抑圧方式
US4661981A (en) * 1983-01-03 1987-04-28 Henrickson Larry K Method and means for processing speech
US4641343A (en) * 1983-02-22 1987-02-03 Iowa State University Research Foundation, Inc. Real time speech formant analyzer and display
US4707858A (en) * 1983-05-02 1987-11-17 Motorola, Inc. Utilizing word-to-digital conversion
US4703505A (en) * 1983-08-24 1987-10-27 Harris Corporation Speech data encoding scheme
US4696040A (en) * 1983-10-13 1987-09-22 Texas Instruments Incorporated Speech analysis/synthesis system with energy normalization and silence suppression
US4686693A (en) * 1985-05-17 1987-08-11 Sound Mist, Inc. Remotely controlled sound mask
US4689821A (en) * 1985-09-23 1987-08-25 Lockheed Corporation Active noise control system
NL8600405A (nl) * 1986-02-18 1987-09-16 Philips Nv Versterker met automatische regeling van de versterking.
JPS62235996A (ja) * 1986-04-07 1987-10-16 東洋通信機株式会社 合成音質変化方法
US4882758A (en) * 1986-10-23 1989-11-21 Matsushita Electric Industrial Co., Ltd. Method for extracting formant frequencies
US4802228A (en) * 1986-10-24 1989-01-31 Bernard Silverstein Amplifier filter system for speech therapy
US5175793A (en) * 1989-02-01 1992-12-29 Sharp Kabushiki Kaisha Recognition apparatus using articulation positions for recognizing a voice
US4979216A (en) * 1989-02-17 1990-12-18 Malsheen Bathsheba J Text to speech synthesis system and method using context dependent vowel allophones
JP2705201B2 (ja) * 1989-03-29 1998-01-28 富士通株式会社 適応後置フイルタ制御方法
JP2573352B2 (ja) * 1989-04-10 1997-01-22 富士通株式会社 音声検出装置
US5280543A (en) * 1989-12-26 1994-01-18 Yamaha Corporation Acoustic apparatus and driving apparatus constituting the same
EP0438662A2 (en) * 1990-01-23 1991-07-31 International Business Machines Corporation Apparatus and method of grouping utterances of a phoneme into context-de-pendent categories based on sound-similarity for automatic speech recognition
EP0477591B1 (de) * 1990-09-27 1995-06-28 STUDER Professional Audio AG Verstärkereinheit
JPH04250710A (ja) * 1991-01-09 1992-09-07 Sony Corp オーディオ回路

Also Published As

Publication number Publication date
US5459813A (en) 1995-10-17
JP3151459B2 (ja) 2001-04-03
CN1041266C (zh) 1998-12-16
DE69131095D1 (de) 1999-05-12
CA2056110C (en) 1997-02-04
JPH04328798A (ja) 1992-11-17
EP0505645A1 (en) 1992-09-30
CA2056110A1 (en) 1992-09-28
CN1065370A (zh) 1992-10-14
IL100174A0 (en) 1992-08-18
IL100174A (en) 1997-09-30
KR920018650A (ko) 1992-10-22
DE69131095T2 (de) 1999-09-23
HK1003305A1 (en) 1998-10-23
MX9102610A (es) 1994-06-30
EP0505645B1 (en) 1999-04-07
ES2133281T3 (es) 1999-09-16

Similar Documents

Publication Publication Date Title
KR950013557B1 (ko) 음성 명료도를 향상시키기 위한 방법 및 장치
US6993480B1 (en) Voice intelligibility enhancement system
KR100377291B1 (ko) 음향신호재생방법및장치
JP2880645B2 (ja) ステレオ増強がなされた録音媒体
Siegel et al. Auditory feedback in the regulation of voice
EP0312569B1 (en) Method and apparatus for improving voice intelligibility in high noise environments
Warren Anomalous loudness function for speech
KR20060054367A (ko) 오디오 조절 장치, 방법 및 컴퓨터 프로그램 제품
US20140086426A1 (en) Masking sound generation device, masking sound output device, and masking sound generation program
Pollack et al. Masking of speech by noise at high sound levels
JPH05508760A (ja) ダイナミックレンジ圧縮
Glave et al. Is the effort dependence of speech loudness explicable on the basis of acoustical cues?
US3101390A (en) Apparatus for audio-vocal conditioning
Drake et al. Wavelet analysis in recruitment of loudness compensation
JP5345638B2 (ja) 瞬時ピークレベル管理とスピーチの清澄の改良方法
EP0795860B1 (en) Apparatus for reproducing audio signals
JPH05175772A (ja) 音響再生装置
US6064329A (en) System for creating and amplifying three dimensional sound employing phase distribution and duty cycle modulation of a high frequency digital signal
JP3958009B2 (ja) 音声認識装置
EP0421531B1 (en) Device for sound synthesis
US4266094A (en) Electronic speech processing system
Summers et al. SIMULATED LOSS OF FREQUENCY SELECTIVITY AND ITS EFFECT
JP2988358B2 (ja) 音声合成回路
JPH06250695A (ja) ピッチ制御方法及び装置
Hermes Loudness Perception

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20111021

Year of fee payment: 17

EXPY Expiration of term