KR20190120570A - 음성 지문을 이용한 음성 증폭 장치 - Google Patents

음성 지문을 이용한 음성 증폭 장치 Download PDF

Info

Publication number
KR20190120570A
KR20190120570A KR1020180043923A KR20180043923A KR20190120570A KR 20190120570 A KR20190120570 A KR 20190120570A KR 1020180043923 A KR1020180043923 A KR 1020180043923A KR 20180043923 A KR20180043923 A KR 20180043923A KR 20190120570 A KR20190120570 A KR 20190120570A
Authority
KR
South Korea
Prior art keywords
power
voice
signal
frequency
unit
Prior art date
Application number
KR1020180043923A
Other languages
English (en)
Other versions
KR102132734B1 (ko
Inventor
홍충식
Original Assignee
주식회사 이엠텍
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 이엠텍 filed Critical 주식회사 이엠텍
Priority to KR1020180043923A priority Critical patent/KR102132734B1/ko
Publication of KR20190120570A publication Critical patent/KR20190120570A/ko
Application granted granted Critical
Publication of KR102132734B1 publication Critical patent/KR102132734B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03FAMPLIFIERS
    • H03F3/00Amplifiers with only discharge tubes or only semiconductor devices as amplifying elements
    • H03F3/20Power amplifiers, e.g. Class B amplifiers, Class C amplifiers
    • H03F3/21Power amplifiers, e.g. Class B amplifiers, Class C amplifiers with semiconductor devices only
    • H03F3/217Class D power amplifiers; Switching amplifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Power Engineering (AREA)
  • Amplifiers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

본 발명은 획득된 음향에 포함된 음성 지문을 검색하여 음성 지문의 베이스 주파수와, 베이스 주파수의 하모닉 주파수의 전력을 증폭하여 음성을 강화시키는 음성 지문을 이용한 음성 증폭 장치에 관한 것이다.
본 발명인 음성 지문을 이용한 음성 증폭 장치는 마이크와, 스피커와, 기준 잡음 전력을 포함하는 전력 데이터와, 증폭 지수를 저장하는 저장부와, 외부 음향 신호를 디지털 신호로 변환하는 아날로그-디지털 변환부와, 디지털 신호를 푸리에 변환시키는 푸리에 변환부와, 푸리에 변환부로부터의 변환값들을 이용하여 주파수별로 전력을 산정하는 전력 산정부와, 주파수별 전력 중에서 가장 전력이 큰 주파수(베이스 주파수)를 결정하고, 결정된 베이스 주파수의 하모닉 주파수들을 산정하고, 베이스 주파수와 산정된 하모닉 주파수들의 변환값들 각각을 증폭 지수만큼 증폭 처리를 수행하는 신호 처리부와, 증폭 처리된 변환값들을 역푸리에 변환시켜 디지털 신호를 생성하는 역푸리에 변환부와, 역푸리에 변환부로부터의 디지털 신호를 아날로그 신호로 변환하여 스피커에 출력하는 디지털-아날로그 변환부를 포함하는 프로세서로 구성된다.

Description

음성 지문을 이용한 음성 증폭 장치{VOICE AMPLIFYING APPARATUS USING VOICE PRINT}
본 발명은 음성 증폭 장치에 관한 것으로서, 특히 획득된 음향에 포함된 음성 지문을 검색하여 음성 지문의 베이스 주파수와, 베이스 주파수의 하모닉 주파수의 전력을 증폭하여 음성을 강화시키는 음성 지문을 이용한 음성 증폭 장치에 관한 것이다.
인체 각 감각기관의 기능을 보완 또는 보강하는 의료기기는 지속적인 시장 성장이 전망되는데, 특히 노인인구가 증가하고, 소득수준이 향상됨에 따라 매년 10~20% 이상의 성장세가 예상되고 있다.
특히 고령화 사회에 접어듦에 따라, 노인인구가 증가되면서 눈(시력), 귀(청력), 치아(치악력)을 보완 및 대체 할 수 있는 의료기기의 발전이 두드러지는데, 상기의 세 요소는 특히 삶에 있어서 필수적인 요소임에도 불구하고 나이를 먹어감에 따라 필연적으로 기능이 저하되기 때문에, 이를 보완 또는 대체할 수 있도록 하는 의료기기 의 수요 자체가 타 의료기기에 비해 크고, 인체 외부에 드러난 기관을 보완하는 기기들로서 거부감이 없고 쉽게 사용 가능하다는 이점이 있어, 시장 자체가 타 의료기기에 비해 크고 보편적으로 형성되어 있다.
상기의 세 요소에 관한 대표적인 의료기기로서, 시력의 경우 간접적인 렌즈 및 안경을 제외하더라도, 시력검안기 시장 자체의 시장규모가 약 300억 정도로 추산되며, 치아를 직접적으로 대체할 수 있는 임플란트의 시장 규모 는 약 2,200억 정도로 추산된다.
반면에 청력 보완 의료기기인 보청기 시장은 아직 시장 초기 단계로서 나머지 두 의료기기의 선례를 보았을 때 시장의 성장가능성이 매우 높을 것으로 평가된다.
상기와 같은 보청기 시장의 경우, 아직 시장이 성장하지 않는 큰 이유로서 100만원 이상의 고가 외산 보청기가 시장의 주류를 형성하고 있기 때문에, 국내 난청 장애인의 7%만이 보청기를 사용하고 있는 것으로 예상된다. 따라서 성능 면에서 외산 보청기에 비해 뒤처지지 않으면서도 가격 면에서 경쟁력이 있는 국산 보청기가 개발 및 보급되면, 국내 보청기 시장이 크게 확대됨은 물론 국내 난청 장애인에 대한 보청기 접근성을 높일 수 있을 것 으로 기대된다.
상기 보청기는 동작 방식, 착용 방법, 크기 등에 따라 다양한 종류가 개발되어 있는데, 상기 동작 방식 중에서도 디지털 보청기는 마이크로폰, 증폭기, 이어폰 등으로 구성되어 개개인의 난청 정도에 맞춰서 맞춤형으로 제 조하기에 용이하고 전자장비나 통신 가능한 단말기와 무선 연결을 통한 연계도 가능하여 최근 각광받고 있는 형 태다.
이러한 디지털 보청기는 한국등록특허 10-1354902호, 한국등록특허 10-1425554호, 한국등록특허 10-1007138호 등을 통하여 다양한 형태로 기재되어 있으나 본 발명과는 그 구성 및 동작 방식에서 완전히 차이가 있는 발명들이다.
본 발명은 획득된 음향에 포함된 음성 지문을 검색하여 음성 지문의 베이스 주파수와, 베이스 주파수의 하모닉 주파수의 전력을 증폭하여 음성을 강화시키는 음성 지문을 이용한 음성 증폭 장치를 제공하는 것을 목적으로 한다.
본 발명인 음성 지문을 이용한 음성 증폭 장치는 마이크와, 스피커와, 기준 잡음 전력을 포함하는 전력 데이터와, 증폭 지수를 저장하는 저장부와, 외부 음향 신호를 디지털 신호로 변환하는 아날로그-디지털 변환부와, 디지털 신호를 푸리에 변환시키는 푸리에 변환부와, 푸리에 변환부로부터의 변환값들을 이용하여 주파수별로 전력을 산정하는 전력 산정부와, 주파수별 전력 중에서 가장 전력이 큰 주파수(베이스 주파수)를 결정하고, 결정된 베이스 주파수의 하모닉 주파수들을 산정하고, 베이스 주파수와 산정된 하모닉 주파수들의 변환값들 각각을 증폭 지수만큼 증폭 처리를 수행하는 신호 처리부와, 증폭 처리된 변환값들을 역푸리에 변환시켜 디지털 신호를 생성하는 역푸리에 변환부와, 역푸리에 변환부로부터의 디지털 신호를 아날로그 신호로 변환하여 스피커에 출력하는 디지털-아날로그 변환부를 포함하는 프로세서로 구성된다.
또한, 신호 처리부는 산정된 하모닉 주파수들과, 산정된 하모닉 주파수에 대응하는 기준 잡음 전력을 각각 비교하여, 각각의 비교 결과에 따라 증폭 처리를 수행하는 것이 바람직하다.
또한, 신호 처리부는 하모닉 주파수들의 전력들 중의 어느 하나라도 각 하모닉 주파수에 대응하는 기준 잡음 전력보다 큰 경우에, 또는 기준 개수 이상의 하모닉 주파수들의 전력이 각 하모닉 주파수에 대응하는 기준 잡음 전력보다 큰 경우, 증폭 처리를 수행하는 것이 바람직하다.
또한, 신호 처리부는 베이스 주파수 대역에 포함된 주파수 중에서 베이스 주파수를 결정하는 것이 바람직하다.
또한, 프로세서는 아날로그-디지털 변환부로부터의 디지털 신호를 프레임 단위로 분할하여 푸리에 변환부로 인가하는 윈도우 분할부와, 역푸리에 변환부로부터의 디지털 신호를 프레임 단위로 병합하여 디지털-아날로그 변환부로 인가하는 윈도우 병합부를 포함하는 것이 바람직하다.
본 발명은 획득된 음향에 포함된 음성 지문을 검색하여 음성 지문의 베이스 주파수와, 베이스 주파수의 하모닉 주파수의 전력을 증폭하여 음성을 강화시키는 효과가 있다.
도 1은 본 발명인 음성 지문을 이용한 음성 증폭 장치의 구성도이다.
도 2는 도 1의 음성 증폭 장치의 프로세서(10)의 세부 처리 구성도이다.
도 3a는 전력 산정부에 의해 산정된 음향(기준 잡음)의 전력 그래프이다.
도 3b는 전력 산정부에 의해 산정된 음향의 전력 그래프이다.
이하, 본 발명의 다양한 실시 예가 첨부된 도면을 참조하여 기재된다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 실시 예의 다양한 변경(modification), 균등물(equivalent), 및/또는 대체물(alternative)을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다.
본 문서에서, "가진다", "가질 수 있다", "포함한다", 또는 "포함할 수 있다" 등의 표현은 해당 특징(예: 수치, 기능, 동작, 또는 부품 등의 구성요소)의 존재를 가리키며, 추가적인 특징의 존재를 배제하지 않는다.
본 문서에서, "A 또는 B", "A 또는/및 B 중 적어도 하나", 또는 "A 또는/및 B 중 하나 또는 그 이상" 등의 표현은 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. 예를 들면, "A 또는 B", "A 및 B 중 적어도
하나", 또는 "A 또는 B 중 적어도 하나"는, (1) 적어도 하나의 A를 포함, (2) 적어도 하나의 B를 포함, 또는 (3) 적어도 하나의 A 및 적어도 하나의 B 모두를 포함하는 경우를 모두 지칭할 수 있다.
본 문서에서 사용된 "제1", "제2", "첫째", 또는 "둘째" 등의 표현들은 다양한 구성요소들을, 순서 및/또는 중요도에 상관없이 수식할 수 있고, 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 뿐 해당 구성요소들을 한정하지 않는다. 예를 들면, 제1 사용자 기기와 제2 사용자 기기는, 순서 또는 중요도와 무관하게, 서로 다른 사용자 기기를 나타낼 수 있다. 예를 들면, 본 문서에 기재된 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 바꾸어 명명될 수 있다.
어떤 구성요소(예: 제1 구성요소)가 다른 구성요소(예: 제2 구성요소)에 "(기능적으로 또는 통신적으로) 연결되어((operatively or communicatively) coupled with/to)" 있다거나 "접속되어(connected to)" 있다고 언급된 때에는, 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로 연결되거나, 다른 구성요소(예: 제3 구성요소)를 통하여 연결될 수 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소(예: 제1 구성요소)가 다른 구성요소(예: 제2 구성요소)에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소와 상기 다른 구성요소 사이에 다른 구성요소(예: 제3 구성요소)가 존재하지 않는 것으로 이해될 수 있다.
본 문서에서 사용된 표현 "~하도록 구성된(또는 설정된)(configured to)"은 상황에 따라, 예를 들면, "~에 적합한(suitable for)", "~하는 능력을 가지는(having the capacity to)", "~하도록 설계된(designed to)", "~하도
록 변경된(adapted to)", "~하도록 만들어진(made to)", 또는 "~를 할 수 있는(capable of)"과 바꾸어 사용될 수 있다. 용어 "~하도록 구성(또는 설정)된"은 하드웨어적으로 "특별히 설계된(specifically designed to)"것만을 반드시 의미하지 않을 수 있다. 대신, 어떤 상황에서는, "~하도록 구성된 장치"라는 표현은, 그 장치가 다른 장치 또는 부품들과 함께 "~할 수 있는" 것을 의미할 수 있다. 예를 들면, 문구 "A, B, 및 C를 수행하도록 구성(또는 설정)된 프로세서"는 해당 동작을 수행하기 위한 전용 프로세서(예: 임베디드 프로세서), 또는 메모리 장치에 저장된 하나 이상의 소프트웨어 프로그램들을 실행함으로써, 해당 동작들을 수행할 수 있는 범용 프로세서(generic-purpose processor)(예: CPU 또는 application processor)를 의미할 수 있다.
본 문서에서 사용된 용어들은 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 다른 실시 예의 범위를 한정하려는 의도가 아닐 수 있다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함할 수 있다. 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 용어들은 본 문서에 기재된 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가질 수 있다. 본 문서에 사용된 용어들 중 일반적인 사전에 정의된 용어들은 관련 기술의 문맥 상 가지는 의미와 동일 또는 유사한 의미로 해석될 수 있으며, 본 문서에서 명백하게 정의되지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다. 경우에 따라서, 본 문서에서 정의된 용어일지라도 본 문서의 실시 예들을 배제하도록 해석될 수 없다.
도 1은 본 발명인 음성 지문을 이용한 음성 증폭 장치의 구성도이다. 본 발명인 음성 증폭 장치는 음성을 증폭하는 장치로 예를 들면, 보청기, 청음 보조 장치 등에 적용될 수 있다.
본 발명인 음성 증폭 장치는 외부 음향을 획득하여 아날로그 신호인 외부 음향 신호를 인가하는 마이크(1)와, 사용자로부터의 명령을 입력 받는 입력부(3)와, 아날로그 신호를 인가 받아 음향으로 출력하는 스피커(5)와, 이득 처리 데이터와 전력 데이터 등을 저장하는 저장부(7)와, 외부 음향에 포함된 음성 신호 및/또는 잡음 신호에 대하여 음성 신호에 대해서는 증폭 동작을 수행하고 잡음 신호에 대해서는 감쇄 동작을 수행하는 프로세서(10)를 포함한다. 다만, 전원부(미도시), 마이크(1), 스피커(5)는 본 발명이 속하는 기술분야에 통상의 지식을 가진 자에게 당연히 인식되는 정도에 불과한 기술에 해당되어, 상세한 설명이 생략된다.
입력부(3)는 사용자로부터의 명령(예를 들면, 전원 온/오프, 스피커의 볼륨 조절 등)을 획득하여 프로세서(10)에 인가한다.
저장부(7)는 프로세서(10)에 의해 산정된 외부 음향 신호의 전력 정보를 포함하는 전력 데이터와, 외부 음향 신호를 보상 처리(증폭/감쇄)하기 위한 이득 처리 데이터와 기설정된 증폭 지수를 저장한다.
전력 데이터는 외부 음향 신호의 전력을 포함하되, 포함된 전력은 기설정된 크기 단위인 프레임 별 전력을 포함한다. 또한, 각 프레임 별 전력은 기설정된 주파수 밴드별 전력(전력들)을 포함한다. 기설정된 주파수 밴드는 프로세서(10)에서 처리 가능한 주파수 범위(예를 들면, 20kHz 이내의 주파수)가 기준 주파수 간격 단위로 구획된 복수의 주파수 대역에 해당된다.
전력 데이터는 주파수 밴드별 기준 잡음 전력을 포함한다. 기준 잡음 전력은 외부 음향 중에서 포함된 음성 및 잡음을 구별하기 위한 전력에 해당되며, 프로세서(10)가 적어도 하나 이상의 프레임 전력에서 각 주파수 밴드별로 또는 주파수 밴드들에서 특정 전력으로 일정하거나 특정 전력의 일정한 범위(예를 들면, ±5%의 오차 범위) 내에서 가변하는 전력을 기준 잡음 전력으로 설정한다. 이 기준 잡음 전력은 복수의 프레임을 처리하는 프로세서(10)에 의해 가변 설정될 수 있다.
이득 처리 데이터는 각 주파수 밴드별로 기준 잡음 전력과, 현재 처리되는 프레임의 전력 간의 전력차 또는 전력비율에 따른 보상값을 포함한다. 보상값은 전력차(현재 전력 - 기준 잡음 전력) 또는 전력비율(현재 전력/기준 잡음 전력)에 정비례하는 것으로, 동일한 주파수 밴드에서 현재 전력이 기준 잡음 전력보다 더 커질 수록 증폭 보상을 위해 보상값도 더 커지도록 설정되며, 예를 들면, 1.1, 1.2 등과 같다. 또한, 전력차가 0이거나 음수에 해당될 경우, 상쇄 보상을 위해 보상값은 1보다 작게 설정되며, 예를 들면, 0.9, 0.5 등과 같다.
증폭 지수는 음향에 포함된 음성만을 증폭하기 위한 지수에 해당된다.
프로세서(10)는 마이크(1)로부터 인가되는 아날로그 신호인 외부 음향 신호에 대한 프레임별 전력 산정 과정과, 산정된 전력으로부터 기준 잡음 전력의 결정과 외부 음향 신호에 포함된 음성 신호에 대한 증폭 보상 및 외부 음향 신호에 포함된 잡음 신호에 대한 감쇄 보상을 수행하는 신호 처리 과정, 신호 처리된 신호를 스피커(5)에 인가하여 출력하는 과정 등을 포함하는 제 1 보상 과정을 수행하며, 이러한 제 1 보상 과정에 대해서는 하기에서 상세하게 기재된다.
또한, 프로세서(10)는 상술된 음성 신호에 대한 증폭 보상 및 잡음 신호에 대한 감쇄 보상(제 1 보상 과정)과 함께 또는 독자적으로 음향에 포함된 음성(유성 음성)의 고유한 특성인 베이스 주파수와, 베이스 주파수의 하모닉 주파수로 구성된 음성 지문의 특성을 이용하여 음성 지문이 나타나는 주파수만을 증폭을 더 시켜 음성 강화를 수행할 수도 있다. 즉, 프로세서(10)는 베이스 주파수와, 베이스 주파수의 하모닉 주파수에서 기준 잡음 전력보다 높은 전력을 지닌 경우에 음성이 포함된 것으로 판단하여 베이스 주파수와, 베이스 주파수의 하모닉 주파수의 전력을 증폭시킨다. 프로세서(10)는 각 프레임별로 베이스 주파수 대역(100~400Hz)에서 가장 전력이 높은 주파수(베이스 주파수)를 결정하는 과정과, 베이스 주파수와 베이스 주파수의 하모닉 주파수의 전력을 기준으로 하여 음성이 포함되어 있는지 판단하는 과정과, 음성이 포함된 경우 베이스 주파수와 베이스 주파수의 하모닉 주파수에서의 전력을 증폭하는 과정 등을 포함하는 제 2 보상 과정을 수행하며, 이러한 제 2 보상 과정에 대해서는 하기에서 상세하게 기재된다.
도 2는 도 1의 음성 증폭 장치의 프로세서(10)의 세부 처리 구성도이다. 프로세서(10)에 구비되는 모듈 형태의 구성요소들과 그 기능이 설명된다.
먼저, 아날로그/디지털 변환부(A/D 변환부)(10a)는 마이크(1)로부터 아날로그 신호인 외부 음향 신호(A1)를 인가 받아 디지털 신호(D1)로 변환 생성하여 윈도우 분할부(10b)에 인가한다.
윈도우 분할부(10b)는 인가된 디지털 신호(D1)을 프레임 단위로 분할하여, 분할된 디지털 신호(W) 각각을 푸리에 변환부(10c)에 인가한다.
푸리에 변환부(10c)는 인가된 분할된 디지털 신호(W)에 대하여 푸리에 변환을 수행하여 각 주파수에 따른 변환값(푸리에 스펙트럼)(FW)을 생성하여 전력 산정부(10d)에 인가한다. 푸리에 변환부(10c)는 예를 들면, 고속 푸리에 변환(fast Fourier transform) 방식을 이용하거나 이산 푸리에 변환(Discrete Fourier transform) 방식을 이용할 수 있다.
전력 산정부(10d)는 인가된 변환값(FW)을 이용하여 주파수 밴드별 전력(P)을 각각 산정하여 신호 처리부(10e)에 인가한다. 전력 산정부(10d)는 주파수 밴드별로 각 주파수 밴드에 포함된 주파수들의 변환값(FW)을 제곱하여 합산하여 주파수 밴드별 전력(P)을 산정하거나, 변환값(FW)을 제곱하여 합산한 후 기준 주파수 간격 단위의 대역폭으로 나눔으로써 주파수 밴드별 전력(P)을 산정할 수 있다. 또한, 전력 산정부(10d)는 산정된 주파수 밴드별 전력(P) 및 인가된 변환값(FW)을 저장부(7)에 저장한다. 즉, 저장부(7)는 적어도 하나 이상의 프레임 별로 복수의 주파수 밴드별 전력(P) 및 변환값(FW)을 저장한다.
신호 처리부(10e)는 인가된 복수의 주파수 밴드별 전력(P)(전력들) 간의 크기 분포 확인 및/또는 프레임별로 주파수 밴드별 전력(P)들 간의 크기 비교를 수행하여 주파수 밴드별 기준 잡음 전력을 결정한다. 상술된 바와 같이, 신호 처리부(10e)는 각 주파수 밴드별로 전력이 특정 전력(전력값)으로 일정하거나 특정 전력(전력값)의 일정한 범위 이내인지를 확인함으로써 크기 분포 확인을 수행할 수 있다. 또한, 신호 처리부(10e)는 예를 들면, 제 1 프레임과 제 2 프레임에서의 주파수 밴드별 전력(P)들을 상호 비교하여 특정 전력(전력값)으로 일정하거나 특정 전력(전력값)의 일정한 범위 이내인지를 확인함으로써 크기 비교를 수행할 수도 있다. 신호 처리부(10e)는 크기 분포 확인 과정과 크기 비교 과정을 동시에 또는 순차적으로 수행할 수 있다. 신호 처리부(10e)는 결정된 주파수 밴드별 기준 잡음 전력을 저장부(7)에 저장한다.
또한, 신호 처리부(10e)는 주파수 밴드별로 인가된 복수의 주파수 밴드별 전력(P)과 주파수 밴드별 기준 잡음 전력을 비교하여 이득 처리 데이터에 따른 보상값을 결정하고, 저장부(7)로부터 변화값(FW)을 판독하여 결정된 보상값으로 판독된 변화값(FW)에 대한 증폭 보상 및 감쇄 보상을 수행한다. 신호 처리부(10e)는 상술된 바와 같이 저장부(7)로부터 이득 처리 데이터를 판독하여 주파수 밴드별로 기준 잡음 전력보다 큰 전력(P)을 지닌 변화값(FW)에 대해서 전력(P)와 기초 잡음 전력의 전력차에 대응하는 주파수 밴드별 보상값(증폭 보상값)을 결정하여 증폭 보상을 수행한다. 또한, 신호 처리부(10e)는 기준 잡음 전력보다 작은 전력(P)을 지닌 변화값(FW)에 대해서 전력(P)와 기초 잡음 전력의 전력차에 대응하는 주파수 밴드별 보상값(상쇄 보상값)을 결정하여 상쇄 보상을 수행한다. 또한, 신호 처리부(10e)는 기준 잡음 전력과 동일한 전력(P)을 지닌 변환값(FW)에 대해서 그대로 유지하거나 상쇄 보상을 수행한다. 이러한 보상 과정은 음성이 포함된 외부 음향 신호에는 기초 잡음 전력에 대응하는 잡음 이외에 음성이 포함되어 있으므로, 음성이 포함된 외부 음향 신호의 주파수 밴드별 전력(P)은 주파수 밴드별 기초 잡음 전력보다 크게 되는 점을 이용하여 수행된다.
또한, 신호 처리부(10e)는 보상 과정 이전에 또는 보상 과정의 수행 시에, 외부 음향 신호에 음성이 포함되어 있는지를 판단하는 과정을 수행할 수도 있다. 만약 주파수 밴드별 전력(P)이 주파수 밴드별 기준 잡음 전력보다 크면, 신호 처리부(10e)는 해당 주파수 밴드에 음성이 포함되어 있다고 판단하고 증폭 보상을 수행한다. 만약 주파수 밴드별 전력(P)이 주파수 밴드별 기준 잡음 전력보다 작거나 같으면, 해당 주파수 밴드에 음성이 포함되어 있지 않다고 판단하고 상쇄 보상을 수행한다.
신호 처리부(10e)는 상술된 바와 같이, 주파수 밴드별 전력(P)과 주파수 밴드별 기준 잡음 전력을 비교하여 이득 처리 데이터에 따라 변화값(FW)에 대한 증폭 보상 및 감쇄 보상을 수행하여, 보상 처리된 변화값(GP)를 계산하여 역푸리에 변환부(10f)로 인가한다. 또는, 증폭 보상과 상쇄 보상의 수행 시에, 신호 처리부(10e)는 전력(P)에 대하여 직접적으로 보상(증폭/상쇄)을 수행한 후, 보상된 전력(P)의 양의 제곱근을 보상 처리된 변화값(GP)으로 이용할 수도 있다.
역푸리에 변환부(10f)는 인가된 보상 처리된 변화값(GP)에 대하여 역푸리에 변환을 수행하여 프레임 단위의 디지털 신호(GW)를 생성하여 윈도우 병합부(10g)에 인가한다. 역푸리에 변환부(10f)는 푸리에 변환부(10c)의 변환 방식에 대응하여 예를 들면, 역 고속 푸리에 변환(inverse fast Fourier transform) 방식을 이용하거나 역 이산 푸리에 변환(inverse Discrete Fourier tansform) 방식을 이용할 수 있다.
윈도우 병합부(10g)는 프레임 단위의 복수의 디지털 신호(GW)를 병합하여 디지털 신호(D2)를 생성하여 디지털/아날로그 변환부(D/A 변환부)(10h)로 인가한다.
디지털/아날로그 변환부(D/A 변환부)(10h)는 인가된 디지털 신호(D2)를 아날로그 신호(A2)로 변환하여 스피커(5)에 인가한다.
상술된 바와 같이, 프로세서(10)는 음성 신호에 대한 증폭 보상 및 잡음 신호에 대한 감쇄 보상을 수행한다.
다음으로, 프로세서(10)는 음성 지문의 특성을 이용하여 음성 지문이 나타나는 주파수만을 증폭시켜 음성 강화를 수행할 수도 있다. 이러한 과정을 위해, 전력 산정부(10d)는 인가된 변환값(FW)을 이용하여 주파수별 전력(FP)을 각각 산정하여 신호 처리부(10e)에 인가한다.
신호 처리부(10e)는 인가된 주파수별 전력(FP)(전력들) 중에서, 베이스 주파수 대역에서의 가장 큰 전력을 지닌 주파수를 베이스 주파수로 결정한다. 또한, 신호 처리부(10e)는 결정된 베이스 주파수의 정수배에 해당하는 복수의 하모닉 주파수(예를 들면, 50개의 하모닉 주파수들)를 산정하고, 산정된 하모닉 주파수들의 전력들과, 산정된 하모닉 주파수들 각각이 속한 주파수 밴드의 기준 잡음 전력을 각각 비교한다. 신호 처리부(10e)는 각각의 비교 결과에 따라, 예를 들면 하모닉 주파수들의 전력들 중의 어느 하나라도 각 하모닉 주파수에 대응하는 주파수 밴드의 기준 잡음 전력보다 큰 경우에, 또는 기준 개수(예를 들면, 10개) 이상의 하모닉 주파수들의 전력이 각 하모닉 주파수에 대응하는 주파수 밴드의 기준 잡음 전력보다 큰 경우에 해당 프레임에 음성이 포함된 것으로 판단한다.
만약 해당 프레임에 음성이 포함된 것으로 판단되면, 신호 처리부(10e)는 베이스 주파수와, 베이스 주파수의 하모닉 주파수들의 변화값(FW)을 기설정된 증폭 지수(예를 들면, 1.4, 1.5 등)를 곱하여 증폭된 변화값(GP)을 계산하여 역푸리에 변환부(10f)로 인가한다. 또는, 신호 처리부(10e)는 베이스 주파수와, 베이스 주파수의 하모닉 주파수들의 전력(P) 각각에 대하여 직접적으로 기설정된 증폭 지수를 곱하여 증폭시킨 후, 증폭된 전력(P)의 양의 제곱근을 증폭된 변화값(GP)으로 이용할 수도 있다. 만약 해당 프레임에 음성이 포함되지 않은 것으로 판단되면, 신호 처리부(10e)는 상술된 증폭 과정을 수행하지 않고, 저장부(7)에 저장된 변화값(FW)을 그대로 역푸리에 변환부(10f)로 인가한다.
프로세서(10)는 제 1 보상 과정 및 제 2 보상 과정 중의 하나의 과정만을 수행할 수도 있으며, 제 1 보상 과정의 수행 중에 제 2 보상 과정을 추가적으로 수행할 수도 있다. 또한, 프로세서(10)는 제 2 보상 과정만을 수행할 경우에도, 주파수 밴드별 기준 잡음 전력을 산정하는 과정을 수행하여 제 2 보상 과정에서 이용한다.
상술된 바와 같이, 프로세서(10)는 아날로그/디지털 변환부(A/D 변환부)(10a), 윈도우 분할부(10b), 푸리에 변환부(10c), 전력 산정부(10d), 신호 처리부(10e), 역푸리에 변환부(10f), 윈도우 병합부(10g), 디지털/아날로그 변환부(D/A 변환부)(10h)를 포함하여 구성된다. 본 문서에서 사용된 용어 "프로세서(10)"는, 예를 들면, 하드웨어, 소프트웨어 또는 펌웨어(firmware) 중 하나 또는 둘 이상의 조합을 포함하는 단위(unit)를 의미할 수 있다. "프로세서"는, 예를 들면, 유닛(unit), 로직(logic), 논리 블록(logical block), 부품(component), 또는 회로(circuit) 등의 용어와 바꾸어 사용(interchangeably use)될 수 있다. "프로세서"는, 일체로 구성된 부품의 최소 단위 또는 그 일부가 될 수 있다. "프로세서"는 하나 또는 그 이상의 기능을 수행하는 최소 단위 또는 그 일부가 될 수도 있다. "프로세서"는 기계적으로 또는 전자적으로 구현될 수 있다. 예를 들면, "프로세서"는, 알려졌거나 앞으로 개발될, 어떤 동작들을 수행하는 ASIC(application-specific integrated circuit) 칩, FPGAs(field-programmable gate arrays) 또는 프로그램 가능 논리 장치(programmable-logic device) 중 적어도 하나를 포함할 수 있다.
도 3a는 전력 산정부에 의해 산정된 음향(기준 잡음)의 전력 그래프이다. 프로세서(10)는 전력(P)를 도 3a와 같은 그래프가 아닌 수치로된 데이터로 저장부(7)에 저장되나, 이해를 위해 전력 그래프로 설명된다. 도 3a에 전력 산정부(10d)에 의해 산정된 예시적인 제 1 내지 제 3 주파수 밴드(B1 내지 B8)의 전력(P)이 도시된다. 신호 처리부(10e)는 제 1 내지 제 8 주파수 밴드(B1 내지 B8)의 전력들 간의 크기 분포로부터 서로 간에 전력 상의 차이가 크기 않은 점을 확인하여, 현재의 프레임의 주파수 밴드별 전력을 기준 잡음 전력으로 설정하여 저장부(7)에 저장한다.
도 3b는 전력 산정부에 의해 산정된 음향의 전력 그래프이다. 신호 처리부(10e)는 저장부(7)에 저장된 기준 잡음 전력과, 전력 산정부(10d)로부터 인가된 현재 프레임의 전력을 주파수 밴드별로 비교한다. 주파수 밴드(B1), (B6)에서 현재 프레임의 전력과 기준 잡음 전력이 동일하고, 주파수 밴드(B2), (B4), (B5), (B7)에서 현재 프레임의 전력이 기준 잡음 전력보다 크고, 주파수 밴드(B3), (B8)에서 현재 프레임의 전력이 기준 잡음 전력보다 작은 경우이다.
신호 처리부(10e)는 현재 프레임의 전력이 기준 잡음 전력과 동일한 주파수 밴드(B1), (B6)의 전력이나 그 전력에 대응하는 변화값(FW)을 그대로 유지시키거나 감쇄 보상을 수행하여, 원래의 외부 음향 신호에 포함된 잡음을 그대로 유지시키거나 감쇄시켜 스피커(5)에서 출력되도록 한다.
또한, 신호 처리부(10e)는 현재 프레임의 전력이 기준 잡음 전력보다 큰 주파수 밴드(B2), (B4), (B5), (B7)의 전력이나 그 전력에 대응하는 변화값(FW)에 대해서 증폭 보상을 수행함으로써, 원래의 외부 음향 신호에 포함된 음성을 증폭시켜 스피커(5)에서 출력되도록 한다. 특히, 신호 처리부(10e)는 이득 처리 데이터를 기준으로 하여 주파수 밴드(B2), (B5)의 전력이나 그 전력에 대응하는 변화값(FW)에 대한 보상값의 크기는 주파수 밴드(B4), (B7)의 전력이나 그 전력에 대응하는 변화값(FW)에 대한 보상값의 크기보다 크게 하여 증폭 보상을 수행한다.
또한, 신호 처리부(10e)는 현재 프레임의 전력이 기준 잡음 전력보다 작은 주파수 밴드(B3), (B8)의 전력이나 그 전력에 대응하는 변화값(FW)에 대해서 감쇄 보상을 수행함으로써, 원래의 외부 음향 신호에 포함된 잡음을 감쇄시켜 스피커(5)에서 출력되도록 한다.
다양한 실시 예에 따른 장치(예: 프로세서 또는 그 기능들) 또는 방법(예: 동작들)의 적어도 일부는, 예컨대, 프로그램 모듈의 형태로 컴퓨터로 읽을 수 있는 저장매체(computer-readable storage media)에 저장된 명령어로 구현될 수 있다. 상기 명령어가 프로세서에 의해 실행될 경우, 상기 하나 이상의 프로세서가 상기 명령어에 해당하는 기능을 수행할 수 있다. 컴퓨터로 읽을 수 있는 저장매체는, 예를 들면, 메모리가 될 수 있다.
컴퓨터로 판독 가능한 기록 매체는, 하드디스크, 플로피디스크, 마그네틱 매체(magnetic media)(예:자기테이프), 광기록 매체(optical media)(예: CD-ROM, DVD(Digital Versatile Disc), 자기-광 매체(magnetoopticalmedia)(예: 플롭티컬 디스크(floptical disk)), 하드웨어 장치(예: ROM, RAM, 또는 플래시 메모리 등)등을 포함할 수 있다. 또한, 프로그램 명령에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함할 수 있다. 상술한 하드웨어 장치는 다양한 실시 예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지다.
다양한 실시 예에 따른 프로세서 또는 프로세서에 의한 기능들은 전술한 구성요소들 중 적어도 하나 이상을 포함하거나, 일부가 생략되거나, 또는 추가적인 다른 구성요소를 더 포함할 수 있다. 다양한 실시 예에 따른 모듈, 프로그램 모듈 또는 다른 구성요소에 의해 수행되는 동작들은 순차적, 병렬적, 반복적 또는 휴리스틱(heuristic)한 방법으로 실행될 수 있다. 또한, 일부 동작은 다른 순서로 실행되거나, 생략되거나, 또는 다른 동작이 추가될 수 있다.
이상 설명한 바와 같이, 본 발명은 상술한 특정의 바람직한 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형의 실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.
1: 마이크 3: 입력부
5: 스피커 7: 저장부
10: 프로세서

Claims (7)

  1. 마이크와;
    스피커와;
    기준 잡음 전력을 포함하는 전력 데이터와, 증폭 지수를 저장하는 저장부와;
    외부 음향 신호를 디지털 신호로 변환하는 아날로그-디지털 변환부와, 디지털 신호를 푸리에 변환시키는 푸리에 변환부와, 푸리에 변환부로부터의 변환값들을 이용하여 주파수별로 전력을 산정하는 전력 산정부와, 주파수별 전력 중에서 가장 전력이 큰 주파수(베이스 주파수)를 결정하고, 결정된 베이스 주파수의 하모닉 주파수들을 산정하고, 베이스 주파수와 산정된 하모닉 주파수들의 변환값들 각각을 증폭 지수만큼 증폭 처리를 수행하는 신호 처리부와, 증폭 처리된 변환값들을 역푸리에 변환시켜 디지털 신호를 생성하는 역푸리에 변환부와, 역푸리에 변환부로부터의 디지털 신호를 아날로그 신호로 변환하여 스피커에 출력하는 디지털-아날로그 변환부를 포함하는 프로세서로 구성된 것을 특징으로 하는 음성 지문을 이용한 음성 증폭 장치.
  2. 제 1 항에 있어서,
    결정된 베이스 주파수의 하모닉 주파수들은 결정된 베이스 주파수의 정수배인 것을 특징으로 하는 음성 지문을 이용한 음성 증폭 장치.
  3. 제 1 항에 있어서,
    신호 처리부는 산정된 하모닉 주파수들과, 산정된 하모닉 주파수에 대응하는 기준 잡음 전력을 각각 비교하여, 각각의 비교 결과에 따라 증폭 처리를 수행하는 것을 특징으로 하는 음성 지문을 이용한 음성 증폭 장치.
  4. 제 3 항에 있어서,
    신호 처리부는 하모닉 주파수들의 전력들 중의 어느 하나라도 각 하모닉 주파수에 대응하는 기준 잡음 전력보다 큰 경우에, 또는 기준 개수 이상의 하모닉 주파수들의 전력이 각 하모닉 주파수에 대응하는 기준 잡음 전력보다 큰 경우, 증폭 처리를 수행하는 것을 특징으로 하는 음성 지문을 이용한 음성 증폭 장치.
  5. 제 1 항에 있어서,
    신호 처리부는 베이스 주파수 대역에 포함된 주파수 중에서 베이스 주파수를 결정하는 것을 특징으로 하는 음성 지문을 이용한 음성 증폭 장치.
  6. 제 5 항에 있어서,
    베이스 주파수 대역은 100~400Hz인 것을 특징으로 하는 음성 지문을 이용한 음성 증폭 장치.
  7. 제 1 항에 있어서,
    프로세서는 아날로그-디지털 변환부로부터의 디지털 신호를 프레임 단위로 분할하여 푸리에 변환부로 인가하는 윈도우 분할부와, 역푸리에 변환부로부터의 디지털 신호를 프레임 단위로 병합하여 디지털-아날로그 변환부로 인가하는 윈도우 병합부를 포함하는 것을 특징으로 하는 음성 지문을 이용한 음성 증폭 장치.
KR1020180043923A 2018-04-16 2018-04-16 음성 지문을 이용한 음성 증폭 장치 KR102132734B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180043923A KR102132734B1 (ko) 2018-04-16 2018-04-16 음성 지문을 이용한 음성 증폭 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180043923A KR102132734B1 (ko) 2018-04-16 2018-04-16 음성 지문을 이용한 음성 증폭 장치

Publications (2)

Publication Number Publication Date
KR20190120570A true KR20190120570A (ko) 2019-10-24
KR102132734B1 KR102132734B1 (ko) 2020-07-13

Family

ID=68423441

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180043923A KR102132734B1 (ko) 2018-04-16 2018-04-16 음성 지문을 이용한 음성 증폭 장치

Country Status (1)

Country Link
KR (1) KR102132734B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030040399A (ko) * 2000-08-14 2003-05-22 클리어 오디오 리미티드 음성 강화 시스템
KR20070015811A (ko) * 2005-08-01 2007-02-06 삼성전자주식회사 음성 신호의 하모닉 성분을 이용한 유/무성음 분리 정보를추출하는 방법 및 그 장치
KR101619255B1 (ko) * 2014-11-14 2016-05-10 현대자동차 주식회사 차량 음향 제어 시스템 및 그 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030040399A (ko) * 2000-08-14 2003-05-22 클리어 오디오 리미티드 음성 강화 시스템
KR100860805B1 (ko) * 2000-08-14 2008-09-30 클리어 오디오 리미티드 음성 강화 시스템
KR20070015811A (ko) * 2005-08-01 2007-02-06 삼성전자주식회사 음성 신호의 하모닉 성분을 이용한 유/무성음 분리 정보를추출하는 방법 및 그 장치
KR101619255B1 (ko) * 2014-11-14 2016-05-10 현대자동차 주식회사 차량 음향 제어 시스템 및 그 방법

Also Published As

Publication number Publication date
KR102132734B1 (ko) 2020-07-13

Similar Documents

Publication Publication Date Title
US10748553B2 (en) Distortion sensing, prevention, and distortion-aware bass enhancement
AU2009200179B2 (en) A hearing aid adapted to a specific type of voice in an acoustical environment, a method and use
RU2520420C2 (ru) Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала
JP4649546B2 (ja) 補聴器
KR20130008609A (ko) 입력 오디오 신호를 수정하는 장치 및 방법
CN114424581A (zh) 用于音频信号生成的系统和方法
US9478235B2 (en) Voice signal processing device and voice signal processing method
US9997171B2 (en) Multi-band signal processor for digital audio signals
Liebich et al. Active occlusion cancellation with hear-through equalization for headphones
US20120114142A1 (en) Acoustic signal processing apparatus, processing method therefor, and program
Kates Modeling the effects of single-microphone noise-suppression
KR101156648B1 (ko) 디지털 보청기의 신호처리 방법
CN117321681A (zh) 嘈杂环境中的语音优化
KR101996380B1 (ko) 음성 주파수 대역 특성을 이용한 음성 증폭 장치
KR102132734B1 (ko) 음성 지문을 이용한 음성 증폭 장치
US11871183B2 (en) Single microphone hearing aid noise reduction method based on bluetooth headset chip and bluetooth headset
JP2008072600A (ja) 音響信号処理装置、音響信号処理プログラム、音響信号処理方法
Lezzoum et al. Noise reduction of speech signals using time-varying and multi-band adaptive gain control for smart digital hearing protectors
KR101996381B1 (ko) 돌발성 잡음을 제거하는 음성 증폭 장치
KR102080099B1 (ko) 음향 처리 장치
US11765524B1 (en) Hearing aid with variable number of channels and method of switching number of channels of hearing aid
JP2021022883A (ja) 音声増幅装置及びプログラム
US11967334B2 (en) Method for operating a hearing device based on a speech signal, and hearing device
KR20230144729A (ko) 음향 증폭 장치
KR102167469B1 (ko) 피드백 처리 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant