KR20210086217A - 쉰목소리 잡음 제거시스템 - Google Patents

쉰목소리 잡음 제거시스템 Download PDF

Info

Publication number
KR20210086217A
KR20210086217A KR1020190180006A KR20190180006A KR20210086217A KR 20210086217 A KR20210086217 A KR 20210086217A KR 1020190180006 A KR1020190180006 A KR 1020190180006A KR 20190180006 A KR20190180006 A KR 20190180006A KR 20210086217 A KR20210086217 A KR 20210086217A
Authority
KR
South Korea
Prior art keywords
voice
hoarse
hoarse voice
section
unit
Prior art date
Application number
KR1020190180006A
Other languages
English (en)
Other versions
KR102319101B1 (ko
Inventor
송윤경
김덕술
Original Assignee
동명대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 동명대학교산학협력단 filed Critical 동명대학교산학협력단
Priority to KR1020190180006A priority Critical patent/KR102319101B1/ko
Publication of KR20210086217A publication Critical patent/KR20210086217A/ko
Application granted granted Critical
Publication of KR102319101B1 publication Critical patent/KR102319101B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Telephonic Communication Services (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

본 발명은 쉰 목소리 잡음 제거시스템에 관한 것이다. 본 발명은 쉰목소리를 대체하여 듣기 좋은 소리를 내도록 하는 잡음 제거시스템으로서, 음성신호를 수집하여 상기 음성신호의 성분 중에서 쉰목소리가 있는 특정 구간을 검출하는 구간검출부와 상기 구간검출부에서 검출되는 특정구간을 주파수 대역으로 변환하여 증폭시키는 특정구간생성부와 상기 특정구간에 있는 음성의 파형을 분석하여 쉰목소리의 정보를 추출하는 쉰 목소리 정보추출부와 상기 쉰목소리 정보추출부에서 추출된 쉰목소리를 학습에 의하여 축적된 쉰목소리와 비교하여 기준치 이상 여부를 판단해서 쉰목소리 상태를 결정하는 쉰목소리 결정부와 상기 쉰목소리 결정부에 의하여 쉰목소리 상태로 결정되면 노이즈를 제거 또는 감쇄하고 정상적인 음성을 증폭시키는 음성신호조절부와 상기 음성신호조절부에 의하여 수행된 상기 정상적인 음성을 전달하는 음성제공부와 데이터의 흐름을 처리하여 제어하는 제어부와 상기 제어부를 통해 처리되는 데이터를 저장하는 정보저장부를 포함하는 것을 특징으로 한다.

Description

쉰목소리 잡음 제거시스템 {Hoarse voice noise filtering system}
본 발명은 쉰목소리 잡음 제거시스템에 관한 것으로 더욱 자세하게는, 마이크 등과 같은 전달수단을 통해서 흘러나오는 강사의 음성을 정상적인 목소리의 형태로 변환하여 청중들에게 전달할 수 있는 쉰목소리 잡음 제거시스템에 관한 것이다.
목소리는 호감도 및 신뢰도를 결정하는 중요한 요소 중의 하나이며, 음성으로 의사표현을 할때에 정보의 전달력에도 많은 영향을 미치게 된다.
일반적으로 목소리 등의 음색을 통해 성별은 물론, 사람의 연령과 성격도 어느 정도 파악할 수 있어 외모와 전혀 어울리지 않게 음색을 입히면 어색하거나 듣기 불편함을 느낀다.
더우기 성대결절, 성대폴립 등 성대질환을 앓고 있는 환자의 경우, 본래의 목소리가 제대로 나오지 않고 대부분 탁해지고 거칠어, 환자 본인이 느끼는 통증이나 발성의 어려움과 함께 들려지는 목소리에 대한 스트레스가 매우 크다고 한다.
이렇게 음성문제는 일반인들에게도 나타나지만 음성을 직업으로 사용하는 전문음성 사용 직업인에게서 흔히 발생한다.
강사나 가수 등과 같은 전문 음성 사용의 직업인은 음성문제가 지속되면, 수행하는 일의 성취도에 부정적인 영향을 많이 받으므로 정상적인 음성의 유지가 매우 중요하다.
이러한 직업에는 교육자, 성악가 등과 같은 경우가 있다. 특히, 교수, 교사 등과 같이 말로 장시간 설명을 하는 직업은 담당과목의 특성이나 수업하는 교실의 소음특성, 그리고 말하는 습관 등에 의하여 영향을 받기 쉬우며 다른 직업인에 비교하여 높은 음성문제 발생율을 보인다.
이를 나타낸 도 1을 보면 대학생들에게 쉰 음성으로 강의를 받는 경우와 정상적인 음성으로 강의를 받는 경우를 비교하여 이를 일정한 체크리스트 및 설문문항에 체크하도록 하여 비교한 것을 그래프로 나타낸 것으로, 쉰 음성과 정상음성을 청취한 후에 그 음성으로 강의를 듣는다면 어떠하겠는가를 묻는 각 문항에 반응한 결과를 그래프의 수치로 나타내었다.
사진에 나타나 바와 같이, 쉰 음성점수의 크기를 나타낸 그래프보다 정상 음성의 크기를 나타낸 그래프가 월등히 높은 수치로 나타나 있다.
따라서, 정상적인 음성으로의 학습이 학업성취도에도 상당한 영향을 미칠 것이라는 사실은 무척이나 명백한 것으로, 이에 대한 시스템이나 장치의 개발이 시급한 실정이었다.
대한민국 특허출원 제2013-0106393호 대한민국 특허공개 제2014-0093134호 대한민국 특허공개 제2017-0045798호
따라서, 본 발명은 교실 등에서 강의를 하는 강사들의 목소리를 마이크 등과 같은 수단을 통해 수강생에게 발성할 경우에 나올수 있는 쉰 목소리 등과 같은 듣기에 거북한 목소리를 변화시켜, 맑고 정상적인 목소리가 마이크 등과 같은 수단을 통하여 전달되도록 하게 함으로서 강의를 듣는 수강생들에게 거부감을 해소하고, 수강생들에게 있어서는 안정감이 있는 청강과 강의의 몰입도를 더욱 높여줄 수 있는 쉰목소리 잡음 제거시스템을 제공하고자 하는데 있는 것이다.
이러한 문제를 해결하기 위하여 본 발명은 쉰목소리 잡음 제거시스템에 있어서, 음성신호를 수집하여 수집한 상기 음성신호의 성분에서 쉰목소리가 있는 구간을 검출하는 구간검출부와 상기 구간검출부에서 검출되는 쉰목소리의 구간을 주파수 대역으로 변환하여 증폭시키는 구간생성부와 상기 쉰목소리의 구간에 있는 음성의 파형을 분석하여 쉰목소리의 정보를 추출하는 쉰목소리 정보추출부와 상기 쉰목소리 정보추출부에서 추출된 쉰목소리를 학습에 의하여 축적된 쉰목소리와 비교하여 기준치 이상 여부를 판단해서 쉰목소리 상태를 결정하는 쉰목소리 결정부와 상기 쉰목소리 결정부에 의하여 쉰목소리 상태인지 여부를 판단하여, 쉰목소리가 전송되면 정상적인 음성으로 변환시키는 음성 신호조절부와 상기 음성 신호조절부에 의하여 수행된 상기 정상적인 음성을 외부에 전달하는 음성제공부와 상기 음성제공부로부터 음성정보와 데이터를 송수신하며, 상기 데이터의 흐름을 처리하는 제어부와 상기 제어부를 통해 처리되는 데이터를 저장하는 정보저장부를 포함하는 것을 특징으로 한다.
또한, 상기 쉰목소리 결정부는 음성내용을 캡쳐, 저장하여 성대와 진동수에 기반한 주파수를 미세하게 분석하여 나타난 차이점을 통해 쉰목소리를 결정하는 것을 특징으로 한다.
또한, 상기 음성제공부는 음성에 노이즈가 있다고 판단되면 필터링 또는 감쇄시키는 동시에 정상적인 음성을 증폭시켜 전달하는 것을 특징으로 하는 것이다.
그리고, 상기 차이점의 판단은 파라미터를 이용하여 수치가 높다고 판단되면 쉰목소리로 간주하는 것을 특징으로 한다.
따라서, 본 발명은 강의 등을 듣는 학생에게 강사의 쉰 목소리 등과 같은 귀에 거슬리는 음성이 나오는 것을 방지하기 위하여 본 발명에 의한 쉰목소리 제거 시스템을 이용하여 정상적인 음성이 수강생에게 들리도록 함으로서, 학생들의 학업 성취도의 향상에도 효과가 있는 것이다.
또한, 평소 쉰목소리가 나오는 교사나 교수, 강사 등이 강의를 할 때에 자신이 전달하고자 하는 강의 내용을 학생등과 같은 청강생들에게 맑은 소리로 정확하게 전달할 수 있어 강의할 때마다 발생되는 쉰목소리에 대한 스트레스를 받지 않을 수 있는 효과도 있는 것이다.
도 1은 대학생들에게 쉰 음성으로 강의를 받는 경우와 정상적인 음성으로 강의를 받는 경우를 비교하여 이를 일정한 체크리스트 및 설문문항에 체크하도록 하여 비교한 것을 나타낸 그래프.
도 2는 본 발명에 의한 쉰목소리 잡음 제거시스템의 구성도.
도 3은 본 발명에 의한 쉰목소리 잡음 제거시스템을 이용한 강의방법의 흐름 도.
도 4는 쉰목소리의 정보를 설명하기 위해 쉰목소리를 내는 음성 구간의 음성파형을 나타낸 도면.
이하에서는 본 발명의 양호한 실시예를 첨부된 도면을 참조하여 상세히 설명한다. 우선 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시가 되더라도 가능한 한 동일 부호를 가지도록 하고 있음에 유의하여야 한다.
또한, 하기에서 본 발명을 설명함에 있어 관련된 공지기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다.
또한, 본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위하여 사용된 것에 불과하므로, 본 발명을 한정하려는 의도가 아니며 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현도 의미하는 것임을 미리 밝혀두고자 한다.
본 발명에 의한 쉰목소리 잡음 제거시스템의 전체적인 구성은 음성신호를 수집하여 수집한 상기 음성신호의 성분에서 쉰목소리가 있는 구간을 검출하는 구간검출부와 상기 구간검출부에서 검출되는 쉰목소리의 구간을 주파수 대역으로 변환하여 증폭시키는 구간생성부와 상기 쉰목소리의 구간에 있는 음성의 파형을 분석하여 쉰목소리의 정보를 추출하는 쉰목소리 정보추출부와 상기 쉰목소리 정보추출부에서 추출된 쉰목소리를 학습에 의하여 축적된 쉰목소리와 비교하여 기준치 이상 여부를 판단해서 쉰목소리 상태를 결정하는 쉰목소리 결정부와 상기 쉰목소리 결정부에 의하여 쉰목소리 상태인지 여부를 판단하여, 쉰목소리가 전송되면 정상적인 음성으로 변환시키는 음성신호조절부와 상기 음성신호조절부에 의하여 수행된 상기 정상적인 음성을 외부에 전달하는 음성제공부와 상기 음성제공부로부터 음성정보와 데이터를 송수신하며, 상기 데이터의 흐름을 처리하는 제어부와 상기 제어부를 통해 처리되는 데이터를 저장하는 정보저장부를 포함하는 것이다.
도 2는 본 발명에 의한 쉰 목소리 잡음 제거시스템의 구성도이고, 도 3은 본 발명에 의한 쉰목소리 잡음 제거시스템을 이용한 강의 방법의 흐름도이고, 도 4는 쉰목소리 정보를 설명하기 위해 쉰목소리를 내는 음성 구간의 음성 파형을 예시적으로 나타낸 도면이다.
설명하기에 앞서, 본 발명의 제목임과 동시에 본 명세서 상에 등장하는 용어인 쉰목소리 잡음 제거 시스템(100)은 음파(音波)에 의해 생긴 에너지를 녹음·전송·증폭이 가능한 전기신호로 변환시키는 장치인 마이크(MIC: 도시(圖示)는 생략) 등과 같은 시스템의 내부에 구현되는 것임을 미리 밝혀두고자 한다.
이하, 도 2를 참조하여 본 발명에 의한 쉰목소리 잡음 제거시스템(100)을 설명하기로 한다.
도 2에 도시된 대로, 구간검출부(10)는 강사 등이 마이크 등과 같은 수단을 통하여 음성을 전달하면, 상기 음성의 신호를 수집해서 수집한 상기 음성신호의 성분에서 쉰목소리가 있는 구간을 검출해내는 역할을 한다.
상기 구간검출부(10)에서 검출되는 쉰목소리의 구간을 주파수 대역으로 변환하여 증폭시키는 구간생성부(20)가 형성된다.
쉰목소리 정보추출부(30)는 상기 쉰목소리가 발성되는 구간의 음성의 파형을 분석하여 쉰목소리의 정보를 추출하는 것이다.
그러면, 쉰목소리 결정부(40)는 상기 쉰목소리 정보추출부(30)에서 추출되는 쉰목소리를 학습에 의하여 축적된 쉰목소리와 비교하여 기준치 이상인지의 여부를 판단해서 쉰목소리 여부를 확인하는 것을 결정하게 된다.
즉, 상기 정보추출부(30)는 학습에 의하여 쉰목소리를 빅데이터 형태로 미리 저장시켜 놓아 이에 대한 특성을 파악하여 마이크를 통하여 전달되는 쉰목소리를 비교하게 되는 것이다.
그리고, 쉰목소리 결정의 또 다른 방식으로 상기 쉰목소리 결정부(40)에서 쉰목소리를 판단하는 것은 마이크 등을 통하여 전달되는 강사의 음성내용을 캡쳐, 저장하여 성대와 진동수에 기반한 주파수를 미세하게 분석하여 나타난 차이점을 통해 쉰목소리를 결정하는 것이다. 따라서, 상기 쉰목소리 결정부(40)에는 소정의 저장부(미도시)가 형성되는 것이 바람직할 것이다.
상기 주파수 분석을 하여 차이점을 판단하는 방법은 강사 등이 마이크 등과 같은 도구를 이용하여 전달하는 음성을 주파수에 기반하여 아주 잘게 절단하여 서로 비교해서 파라미터를 구하게 된다.
이러한 미세한 차이점이 있는 부분을 찾아서, 지터(jitter) 파라미터나 쉬머(shimmer) 파라미터를 이용하여 수치가 높아지게 되면 쉰목소리로 판단을 내리고 결정내는 것이다. 음성분석평가 파라메타인 상기 지터(jitter) 또는 상기 쉼머(shimmer) 지수의 수치는 음성 파형의 규칙성을 알 수 있는 요소이다.
특히, 상기 쉼머(shimmer) 파라미터는 습도가 80%일 때 가장 낮게 측정하는 것으로 알려져 있으며, 일반적으로 지터(jitter) 파라미터와 쉼머(shimmer) 파라미터는 수치가 작을수록 안정되고 또렷한 목소리로 본다.
상기 음향학적 파라미터들인 지터(jitter) 파라미터나 쉬머(shimmer) 파라미터를 이용하여 수치의 고저를 찾아내는 방법에 대한 설명은 널리 공지된 기술이므로 자세한 설명은 생략하기로 한다.
음성 신호조절부(50)는 상기 쉰목소리 결정부(40)에 의하여 쉰목소리 상태인지 여부를 판단하여, 쉰목소리라고 판단이 되어 쉰목소리라는 신호를 전송받게 되면 정상적인 음성으로 변환시키도록 신호를 변환시키는 역할을 한다.
그러면, 음성제공부(60)는 상기 음성 신호조절부(50)에 의하여 실행되는 쉰목소리가 아닌 정상적인 음성으로 변환시켜 외부 청중 등에게 전달하는 것으로, 쉽게 말해서 스피커(speaker)에 해당되는 것이다.
상기 음성제공부(60)는 본 발명의 시스템(100)이 내장되어 있는 마이크를 통해 강사가 발성하는 음성에 노이즈(noise)가 있다고 판단되면 쉰목소리로 간주하여 필터링 또는 감쇄(attenuation)시키는 것이며, 정상적인 음성을 증폭(AMPLIPYING)시켜 마이크를 통하여 정상적인 음성을 청중들에게 전달하는 것이다.
제어부(70)는 상기 음성제공부(60)로부터 전달하는 음성정보와 필요한 데이터를 송수신하며, 상기 데이터의 흐름을 처리하는 역할을 한다.
또한, 상기 제어부(70)는 인터넷, 인트라넷, 유무선통신망, 이동통신망을 포함하는 네트워크와 연결되어 있으며, 강사의 음성정보 등과 같은 각종 신호와 데이터를 송수신할 수도 있는 것이다.
상기 제어부(70)를 통해 처리되는 데이터를 저장하는 정보저장부(80)는 내부에 상기 데이터를 저장하는 데이터베이스(미도시)를 구비하여 음성의 분석 등을 하여 정상적인 음성의 데이터를 저장할 수 있는 것이다. 또한, 음성 데이터의 주파수, 속도, 크기, 패턴 등을 분석해서 실행하는 저장도 가능하다.
이하에서는 도 3과 도 4를 참조하여 본 발명에 의한 쉰목소리 잡음 제거시스템(100)을 이용한 쉰목소리 제거방법에 대하여 설명하기로 한다.
우선, 먼저 도 3을 참조하면, 본 발명의 일 실시예에 따른 쉰목소리 제거 방법은 강사의 마이크등과 같은 전달수단을 통한 음성의 전달하는 제1단계, 상기 음성 신호의 특정 구간 검출하는 제2단계, 상기 제2단계에서 검출한 특정 구간을 생성하는 제3단계, 쉰목소리 정보를 추출하는 제4단계, 쉰목소리의 상태를 결정하는 제5단계와 쉰목소리라고 판단되면 쉰목소리 음성을 정상 음성으로 청중들에게 전달하는 제6단계를 포함하여 이루어진다.
먼저, 제1단계로서 일정한 공간에서 청중들을 상대로 강의를 하는 강사 등이 본 발명의 시스템(100) 기능이 구현되는 마이크 등과 같은 장치 또는 시스템을 통하여 음성을 청중들에게 전달하게 된다.
그러면, 제2단계에서는 강사 등에 의해 마이크를 통하여 발산된 음성 신호를 수집하여 음성 신호의 성분 중 규칙 변화가 심한 특정한 구간을 검출하는 역할을 한다.
상기 특정 구간 내에는 특정 단어나 문장 길이 수준에 준하는 음성을 담고 있으며, 그 음성이 규칙 변화가 심한 관계로 쉰목소리(음정의 변화)가 포함된 상태일 가능성이 매우 높다. 따라서, 특정 구간의 검출은 규칙변화 정도를 확인함으로써 쉽게 예측되어 얻어진 결과이다.
다음 제3단계로, 본 발명의 제3단계에서는 상기 제2단계에서 검출되어진 특정 구간을 주파수 대역으로 변환시킨 후, 증폭하여 특정한 구간을 생성하는 역할을 한다.
이러한 주파수 대역의 변환은 필터(filter)를 통하여 행해지며, 주파수 대역으로 변환된 음성 신호의 특정 구간을 증폭함으로써, 확대된 음성 신호의 특정한 구간을 생성하게 되는 것이다. 상기 필터는 대역제한 필터인 것이 바람직하다.
이러한 음성 신호의 특정한 구간의 생성은 이하에서와 같이 쉰목소리의 정보를 파악하는데 유용하게 사용된다.
다음 제4단계로, 상기 특정한 구간에 있는 음성 파형을 분석하여 쉰목소리의 정보를 추출하는 역할을 수행한다.
상기 음성 파형을 분석하는 과정은 제2 특정 구간에 있는 음성 파형의 진폭 크기, 길이, 각도, 최대 값, 에너지량 및 특징점 개수 등의 상태를 파악함으로써, 정보를 추출할 수 있게된다.
그러면, 이하에서는 상기 쉰목소리 정보의 추출에 대한 자세한 설명을 도 4를을 참조하여 이하에서 설명한다.
상기 도 4는 본 발명의 일 실시예에 따른 쉰목소리 정보를 설명하기 위한 특정 구간의 음성 파형을 예시적으로 나타낸 도면으로서, 도시된 바와 같이 음성 파형에 대해 쉰목소리 정보의 추출요소를 참조 부호로서 나타내고 있음을 보여준다.
즉, 상기 도 4에서와 같이, 본 발명의 쉰목소리 잡음 제거시스템(100)의 쉰목소리 정보추출부(30)에서 추출하는 쉰목소리 정보의 추출은 음성 신호의 특정한 구간(쉰목소리를 내는 구간)에 있는 음성파형(W)에서 진폭의 크기(1), 길이(2), 각도(3), 최대 값(4), 에너지량(5) 및 최대 값(4)과 같은 특징점의 개수 등을 파악함으로써 가능하게 된다.
다음으로, 본 발명의 쉰목소리 잡음 제거시스템(100)을 이용한 쉰목소리 제거방법 제5단계에서는 학습에 의해 축적된 쉰목소리의 기준 정보와 상기 제4단계에서 추출된 쉰목소리 정보를 비교 후, 기준치 이상 여부를 판단하여 쉰목소리의 상태를 결정하는 역할을 수행한다.
여기서, 쉰목소리 기준정보라 함은 다수의 샘플 음성 신호의 음소적 요소와 음율적 요소를 파악하여 축적된 쉰목소리 데이터를 지칭하며, 이때의 음소적 요소는 상대방이 말한 음성 신호에서 측정 가능한 피치, 에너지 및 발음 속도 등의 파라미터 정보를 의미하며, 운율적 요소라 함은 강사 등이 말한 음성 신호의 구간 피치, 에너지의 평균, 표준 편차 및 최대 값 등의 파라미터 정보를 의미한다. 앞서서도 언급한 대로, 상기 파라미터의 종류로는 지터 파라미터, 쉼머 파라미터인 것이다.
이로써, 본 발명의 쉰목소리 기준 정보는 음소적 요소의 파라미터로부터 피치 횟수와 크기, 에너지의 크기 및 발음 속도의 크기와 운율적 요소의 파라미터로부터 구간 피치의 횟수와 크기, 에너지의 평균 값, 표준 편차값 및 최대 값 등을 분석하여 획득되어진 결과이다.
결국, 쉰목소리 기준이 되는 정보는 음성 파형의 진폭 크기, 길이, 각도 및 최대 값 및 진동 반복 횟수와 관련하여 보다 세밀하게 분석된 축적 데이터인 것이다.
이에 따라, 본 발명의 제5단계에서는 위와 같이 학습에 의해 축적된 쉰목소리 기준 정보의 정해진 각 요소에 가장 근접한 쉰목소리 정보를 찾아내어 비교함으로써, 기준치 이상 여부를 판단하여 쉰목소리 상태를 결정할 수 있게 되는 것이다.
또 다른 방법으로는 음소적 요소 및 운율적 요소의 쉰목소리 기준 정보를 이용하여, 음성신호의 특정한 구간에 내포된 쉰목소리 정보에 대한 각각의 가우시안(Gaussian) 혼합 분포를 찾아내어 비교함으로써, 그 중 가장 큰 확률 값이 기준치 이상인지를 판단하여 쉰목소리 상태를 결정할 수도 있다.
마지막으로, 본 발명의 제6단계에서는 쉰목소리 상태로 결정된 음성 신호 중에서 쉰목소리 정보를 담고 있는 특정한 구간을 쉰목소리 상태의 기준인 기준치의 이하로 낮추는 기능을 수행하는 것이다. 앞에서도 언급했지만, 노이즈에 해당하는 쉰목소리를 없애거나 감쇄시키고, Harmonic에 해당하는 좋은 소리를 증폭시켜서 양질의 음성을 청중들에게 전달시키는 것이다. 본 발명의 시스템(100)의 설명에서도 언급했지만, 파라미터를 이용하여 수치가 높다고 판단되면 쉰목소리로 판단하는 것이다.
이처럼 쉰목소리 상태를 줄이거나 없앤 음성신호를 마이크 등과 같은 수단에 의하여 내장되어 구성되는 본 발명에 의한 쉰목소리 잡음 제거시스템(100)을 통하여 좋은 소리를 전송할 수 있게 된다. 이때, 기준치의 값은 상기 제5단계에서 설정된 값이다.
아울러, 본 발명의 제6단계에서는 특정 구간의 음성 신호에 대해 손실 압축 방법을 적용하여 쉰목소리 정보에 담긴 에너지량을 축소하는 기능을 더 수행하게 된다.
상기 손실 압축방법은 상기 제6단계에서 결정된 쉰목소리가 발성된 상태를 가지고 CELP, G711, G726, HILN, AMR 및 Speex 군 중 선택된 어느 하나의 방법을 적용하여 쉰목소리가 가지고 있는 에너지량을 축소하여 축소된 주파수 영역을 제외한 나머지 영역을 손실 압축하게 된다.
이 결과에 더하여, 본 발명의 제6단계에서는 쉰목소리 상태의 기준인 기준치의 이하로 낮추는 기능을 더 수행함으로써, 쉰목소리 정보가 담긴 음성 신호를 최대한 억제하여 정상적인 수준 정도의 음성을 상대방에게 전송하게 되는 것이다.
이와 같이, 본 실시예에서는 쉰목소리 상태가 담긴 특정 구간의 음성 신호를 정상적인 형태로 변환시켜 쉰목소리가 담긴 음성을 최대한 억제하고 정상적인 음성을 전달할 수 있는 장점을 제공하게 된다.
따라서, 본 발명의 쉰목소리 잡음 제거시스템(100)은 강사가 수업 도중에 쉰목소리를 내는 경우가 많은 강사 등이 본 발명에 의한 쉰목소리 잡음 제거시스템(100)과 방법이 구현된 마이크 등과 같은 육성(肉聲) 전달수단의 도구를 사용하는 경우, 강사의 강의를 청강하는 수강생들에게 정상적인 목소리에 근접한 음질을 전달할수 있어 효율적인 수업과 지도를 받을수 있다는 장점이 있는 것이다.
이상에서와 같은 내용의 본 발명이 속하는 기술분야의 당업자는 본 발명의 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로, 상기 기술한 실시 예는 예시된 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다.
본 발명의 범위는 상기 상세한 설명보다는 첨부된 특허청구범위에 의하여 나타내어지며, 특허청구 범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
10 : 구간 검출부
20 : 구간 생성부
30 : 쉰목소리 정보추출부
40 : 쉰목소리 결정부
50 : 음성 신호조절부
60 : 음성제공부
70 : 제어부
80 : 정보저장부
100 : 쉰목소리 잡음 제거 시스템

Claims (4)

  1. 쉰목소리 잡음 제거시스템에 있어서,
    음성신호를 수집하여 수집한 상기 음성신호의 성분에서 쉰목소리가 있는 구간을 검출하는 구간검출부;
    상기 구간검출부에서 검출되는 쉰목소리의 구간을 주파수 대역으로 변환하여 증폭시키는 구간생성부;
    상기 쉰목소리의 구간에 있는 음성의 파형을 분석하여 쉰목소리의 정보를 추출하는 쉰목소리 정보추출부;
    상기 쉰목소리 정보추출부에서 추출된 쉰목소리를 학습에 의하여 축적된 쉰목소리와 비교하여 기준치 이상 여부를 판단해서 쉰목소리 상태를 결정하는 쉰목소리 결정부;
    상기 쉰목소리 결정부에 의하여 쉰목소리 상태인지 여부를 판단하여, 쉰목소리가 전송되면 정상적인 음성으로 변환시키는 음성신호조절부;
    상기 음성신호조절부에 의하여 수행된 상기 정상적인 음성을 외부에 전달하는 음성제공부;
    상기 음성제공부로부터 음성정보와 데이터를 송수신하며, 상기 데이터의 흐름을 처리하는 제어부;
    상기 제어부를 통해 처리되는 데이터를 저장하는 정보저장부를 포함하는 것을 특징으로 하는 쉰목소리 잡음 제거시스템.
  2. 제1항에 있어서,
    상기 쉰목소리 결정부는 강사의 음성내용을 캡쳐, 저장하여 성대와 진동수에 기반한 주파수를 미세하게 분석하여 나타난 차이점을 통해 쉰목소리를 결정하는 것을 특징으로 하는 쉰목소리 잡음 제거시스템.
  3. 제1항에 있어서,
    상기 음성제공부는 음성에 노이즈가 있다고 판단되면 필터링 또는 감쇄시키고, 정상적인 음성을 증폭시켜 전달하는 것을 특징으로 하는 쉰목소리 잡음 제거시스템.
  4. 제2항에 있어서,
    상기 차이점의 판단은 파라미터를 이용하여 수치가 높다고 판단되면 쉰목소리로 판단하는 것을 특징으로 하는 쉰목소리 잡음 제거시스템.

KR1020190180006A 2019-12-31 2019-12-31 쉰목소리 잡음 제거시스템 KR102319101B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190180006A KR102319101B1 (ko) 2019-12-31 2019-12-31 쉰목소리 잡음 제거시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190180006A KR102319101B1 (ko) 2019-12-31 2019-12-31 쉰목소리 잡음 제거시스템

Publications (2)

Publication Number Publication Date
KR20210086217A true KR20210086217A (ko) 2021-07-08
KR102319101B1 KR102319101B1 (ko) 2021-10-28

Family

ID=76894150

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190180006A KR102319101B1 (ko) 2019-12-31 2019-12-31 쉰목소리 잡음 제거시스템

Country Status (1)

Country Link
KR (1) KR102319101B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230091439A (ko) 2021-12-16 2023-06-23 주식회사 케이티 단발성 잡음을 제거하는 장치, 방법 및 컴퓨터 프로그램

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130106393A (ko) 2010-09-10 2013-09-27 데이진 가부시키가이샤 스테레오컴플렉스 폴리락트산계 필름 및 수지 조성물
KR20140047525A (ko) * 2012-10-12 2014-04-22 삼성전자주식회사 음성 변환 장치 및 이의 음성 변환 방법
KR20140093134A (ko) 2013-01-17 2014-07-25 이너비트 주식회사 사람의 목소리로부터 음계 및 음장을 추출하는 방법
KR20160128871A (ko) * 2015-04-29 2016-11-08 서울대학교산학협력단 파라미터 변경에 의해 음색을 변환하는 사용자 맞춤형 음성 보정 방법 및 이를 구현하는 음성 보정 장치
KR20170045798A (ko) 2015-10-20 2017-04-28 김인태 스마트폰을 이용한 목소리 질환 조기진단 시스템 및 방법
KR101820595B1 (ko) * 2016-05-02 2018-01-19 동의대학교 산학협력단 쉰 목소리를 정상 목소리로 개선하는 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130106393A (ko) 2010-09-10 2013-09-27 데이진 가부시키가이샤 스테레오컴플렉스 폴리락트산계 필름 및 수지 조성물
KR20140047525A (ko) * 2012-10-12 2014-04-22 삼성전자주식회사 음성 변환 장치 및 이의 음성 변환 방법
KR20140093134A (ko) 2013-01-17 2014-07-25 이너비트 주식회사 사람의 목소리로부터 음계 및 음장을 추출하는 방법
KR20160128871A (ko) * 2015-04-29 2016-11-08 서울대학교산학협력단 파라미터 변경에 의해 음색을 변환하는 사용자 맞춤형 음성 보정 방법 및 이를 구현하는 음성 보정 장치
KR20170045798A (ko) 2015-10-20 2017-04-28 김인태 스마트폰을 이용한 목소리 질환 조기진단 시스템 및 방법
KR101820595B1 (ko) * 2016-05-02 2018-01-19 동의대학교 산학협력단 쉰 목소리를 정상 목소리로 개선하는 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230091439A (ko) 2021-12-16 2023-06-23 주식회사 케이티 단발성 잡음을 제거하는 장치, 방법 및 컴퓨터 프로그램

Also Published As

Publication number Publication date
KR102319101B1 (ko) 2021-10-28

Similar Documents

Publication Publication Date Title
US10475467B2 (en) Systems, methods and devices for intelligent speech recognition and processing
CN109147765B (zh) 音频质量综合评测方法及系统
US7363227B2 (en) Disruption of speech understanding by adding a privacy sound thereto
Allen Harvey Fletcher's role in the creation of communication acoustics
Ternström et al. Loud speech over noise: Some spectral attributes, with gender differences
US20110178799A1 (en) Methods and systems for identifying speech sounds using multi-dimensional analysis
Monson et al. Detection of high-frequency energy level changes in speech and singing
Keidser et al. Cognitive spare capacity: evaluation data and its association with comprehension of dynamic conversations
KR102319101B1 (ko) 쉰목소리 잡음 제거시스템
de la Prida et al. Methodology for the subjective evaluation of airborne sound insulation through 2-AC and Thurstonian models
Alapetite Impact of noise and other factors on speech recognition in anaesthesia
Bruns et al. Automated speech audiometry for integrated Voice over Internet Protocol communication services
Pulakka et al. Conversational quality evaluation of artificial bandwidth extension of telephone speech
Leembruggen et al. Further investigations into improving STI’s recognition of the effects of poor frequency response on subjective intelligibility
Drullman The significance of temporal modulation frequencies for speech intelligibility
Kobayashi et al. Performance Evaluation of an Ambient Noise Clustering Method for Objective Speech Intelligibility Estimation
Dekens et al. A Multi-sensor Speech Database with Applications towards Robust Speech Processing in hostile Environments.
US11380345B2 (en) Real-time voice timbre style transform
Ghimire Speech intelligibility measurement on the basis of ITU-T Recommendation P. 863
Nyberg An investigation of qualitative research methodology for perceptual audio evaluation
Freyman et al. Priming of lowpass-filtered speech affects response bias, not sensitivity, in a bandwidth discrimination task
Pike Timbral constancy and compensation for spectral distortion caused by loudspeaker and room acoustics
Brachmanski Automation of subjective measurements of logatom intelligibility in classrooms
Yeung Improving the intelligibility of synthetic speech over the telephone and in noise
Zjalic " a Proposed Framework for Forensic Audio Enhancement

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant