KR0160206B1 - 음성신호 추출장치 - Google Patents
음성신호 추출장치 Download PDFInfo
- Publication number
- KR0160206B1 KR0160206B1 KR1019950020793A KR19950020793A KR0160206B1 KR 0160206 B1 KR0160206 B1 KR 0160206B1 KR 1019950020793 A KR1019950020793 A KR 1019950020793A KR 19950020793 A KR19950020793 A KR 19950020793A KR 0160206 B1 KR0160206 B1 KR 0160206B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- voice
- voice signal
- input
- output
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/44—Receiver circuitry for the reception of television signals according to analogue transmission standards
- H04N5/60—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
- H04N5/607—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals for more than one sound signal, e.g. stereo, multilanguages
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03K—PULSE TECHNIQUE
- H03K19/00—Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits
- H03K19/02—Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits using specified components
- H03K19/173—Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits using specified components using elementary logic circuits as components
- H03K19/1733—Controllable logic circuits
- H03K19/1737—Controllable logic circuits using multiplexers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Television Signal Processing For Recording (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
Abstract
본 발명은 음성, 음악, 효과음 등의 다양한 소리로 녹음된 신호중에서 음성부만을 추출하여 출력토록하는 음성신호 추출장치에 관한 것이다.
종래기술은 입력신호에 음성신호의 유무를 판별하여 잡음 신호 입력 구간에서는 뮤팅회로를 동작시켜 잡음을 제거하고 음성신호 입력구간에서는 뮤팅동작을 해제시켜 음성신호를 추출하는 회로구성인 것이어서, 예를들면 음성과 음악이 입력신호에 혼입되어 들어올 경우에는 음성신호만을 추출할 수가 없는 문제점이 있고, 또한 FFT 및 셉트럼 분석을 행해야만 하므로 이로 인해 회로구성이 복잡해지며 실시간 구현이 용이하지 못한 문제점이 있었다.
이를 개선코자 하여 본 발명은 모노(Mono) 상태로 녹음된 영화 또는 TV드라마에서 대사부분만을 추출할 수 있도록 하여 대사부분과 배경음악 혹은 효과음 부분의 음장효과를 다르게 함으로써 보다 탁월한 오디오/비디오(A/V) 음장 재생을 행할 수 있도록 한 것이다.
Description
제1도는 종래의 음성신호 추출장치의 블록 구성도.
제2도는 본 발명에 의한 음성신호 추출장치의 블록 구성도.
제3도는 본 발명에 의한 추출기의 블록 구성도.
제4도는 본 발명에서 대역 통과 필터를 통한 주파수 특성 예시도.
* 도면의 주요부분에 대한 부호의 설명
101, 102,....10n : 대역통과필터(BPF) 111, 112,....11n : 추출기
201 : 가산기 111a : 적분기
111b : 비교기 111c : 멀티플렉서
본 발명은 음성신호 추출장치에 관한 것으로 특히 음성, 음악, 효과음 등의 다양한 소리로 녹음된 신호중에서 음성부반을 추출하여 출력토록 하는 음성신호 추출장치에 관한 것이다.
종래의 음성신호 추출장치는 제1도에 도시한 바와 같이 입력되는 음서, 잡음 혼입신호를 고속푸리에 변환(Fast Fourier Transform; FFT)하여 다수개의 스펙트럼 신호를 셉트럼 분석기(2)로 출력하는 출력하는 대역분배기(1)와, 상기 대역분배기(1)의 출력신호를 셉트럼 분석하여 후단의 음성힌호 검출기(3)에 출력하는 셉트럼 분석기(2)와, 상기 셉트럼 분석기(2)로부터 입력되는 신호가 음성신호인가 여부를 판별하는 음성신호 검출기(3)와, 상기 음성신호 검출기(3)의 출력신호가 음성신호가 아닌 경우 잡음신호로 판별하는 잡음구간판별기(4)와, 상기 잡음구간 판별기(4)의 출력신호가 잡음구간일 때 뮤팅회로(6)를 구동시키는 뮤팅회로구동부(5)와, 상기 뮤팅회로구동부(5)의 제어에 따라 입력되는 음성,잡음 혼입신호를 뮤트시키는 뮤팅회로(6)로 구성되어져 있다.
또한 상기한 음성신호 검출기(3)는 상기 셉트럼 분석기(2) 출력신호에서 기본주파수를 추출하는 피크치 검출기(3a)와, 셉트럼분석기(2) 출력신호에서 평균값을 산출하는 평균치 산출기(3b)와, 상기 피크치 검출기(3a)와 평균치 산출기(3b)로부터 입력되는 신호가 모음 또는 자음인가를 판별하는 모음/자음 판별기(3c)와, 상기 모음/자음판별기(3c)의 출력신호가 음성신호인가를 판별하여 잡음구간 판별기(4)로 출력하는 음성신호 판별회로(3d)로 구성되어져 있다.
이와 같이 구성된 종래의 음성신호 추출장치의 동작을 설명하면 다음과 같다.
음성 및 잡음신호가 혼입된 신호에서 음성신호와 잡음신호가 랜덤(Random)하게 입력되면 그 신호는 뮤팅회로(6)와 FFT를 행하는 대역 분배기(1)를 거쳐 셉트럼 분석기(2)에서 셉트럼 분석을 행하게 된다.
이와 같이 셉트럼 분석을 하게 되면 고주파 성분과 저주파 성분으로 나누어 출력하게 되는데, 이때 고주파 성분은 피크치 검출기(3a) 및 평균치산출기(3b)에 입력되어 각각 입력신호의 기본주파수와 평균치 데이터를 모음/자음 판별기(3c)에 입력시킨다.
이와 같은 상태에서 모음/자음 판별기(3c)는 입력신호의 기본주파수와 평균치 데이터를 분석하여 입력되는 신호가 음성신호 또는 잡음신호인가를 판별한다.
이어서 음성신호 판별회로(3d)는 상기 모음/자음 판별기(3c)의 분석결과를 이용하여 입력신호가 음성신호 또는 잡음신호인가를 판별하여 잡음구간판별기94)에 해당 판별신호를 출력시킨다.
상기 잡음구간 판별기(4)는 뮤팅회로구동부(5)에 잡음구간 정보를 출력하므로 뮤팅회로구동부(5)에서는 입력신호가 잡음구간일때에는 뮤팅회로(6)를 뮤트동작시키고, 음성신호일때에는 뮤팅회로(6)를 구동시키지 않으므로 음성신호를 추출하게 된다.
그러나 이러한 종래기술은 입력신호에 음성신호의 유무를 판별하여 잡음신호 입력구간에서는 뮤팅회로를 동작시켜 잡음을 제거하고 음성신호 입력구간에서는 뮤팅동작을 해제시켜 음성신호를 추출하는 회로구성인 것이어서, 예를들면 음성과 음악기 입력신호에 혼입되어 들어올 경우에는 음성신호만을 추출할 수가 없는 문제점이 있고, 또한 FFT 및 셉트럼 분석을 행해야만 하므로 이로 인해 회로구성이 복잡해지며 실시간 구현이 용이하지 못한 문제점이 있었다.
따라서 본 발명은 상기한 종래기술의 문제점을 해결코자하여 제안된 것으로서, 모노(Mono) 상태로 녹음된 영화 또는 TV드라마에서 대사부분만을 추출할 수 있도록 하여 대사부분과 배경음악 혹은 효과음 부분의 음장효과를 다르게 함으로써 보다 탁월한 오디오/비디오(A/V) 음장 재생을 행할 수 있도록함을 그 목적으로 하는 것이다.
상기한 목적을 달성하기 위한 본 발명을 첨부된 도면에 의하여 상세히 설명하면 다음과 같다.
제2도는 본 발명에 의한 음성신호추출장치의 블록구성도를 나타낸 것으로서, 입력되는 신호중 특정 주파수 대역신호(100Hz~4KHz)만을 통과시키는 다수개의 대역통과필터(101,102,....10n)와, 상기 다수개의 대역통과필터(101,102,....10n)를 통과한 신호가 음성신호인가 여부를 판별하여 음성신호인 경우에는 입력신호를 그대로 출력시키고 음성신호가 아닌 경우에는 ψ를 출력하는 다수개의 추출기(111,112,....11n)와, 상기 다수개의 추출기(111,112,....11n)의 출력신호를 가산하여 음성신호만을 추출하는 가산기(201)로 구성되어져 있다.
또한 상기한 단일의 추출기(111)는 제3도에 도시한 바와 같이 상기 대역통과필터(101)를 통과한 신호의 절대값을 적분하는 적분기(111a)와, 상기 적분기(111a)의 출력신호와 기준신호(Rf)를 비교하여 적분기(111a)의 출력신호가 기준신호(Rf)보다 크면 음성신호로 판별하여 상기 대역통과필터(101)를 통과한 신호를 그대로 멀티플렉서(111c)에 출력하고, 기준신호(Rf)보다 작으면 ψ신호를 멀티플렉서(111c)에 출력하는 비교기(111b)와, 상기 비교기(111b)의 출력제어신호에 따라 입력신호와 ψ신호를 선택적으로 출력하는 멀티플렉서(111c)로 구성되어져 있다.
이와 같이 구성된 본 발명의 동작 및 작용효과를 제4도를 참조하여 설명하면 다음과 같다.
예로서 모노(Mono)로 녹음된 영화나 TV드라마의 오디오신호에는 대사, 배경음악 그리고 효과음이 개별적 혹은 한꺼번에 송출될 수가 있다.
대사, 배경음악, 효과음이 개별적으로 송출될 때에는 종래의 경우에도 대사부분의 추출이 가능하지만 세가지 신호가 한꺼번에 송출될때에는 대사부분을 추출할 수가 없었다.
따라서 본 발명은 상기 신호들이 개별적 또는 동시에 출력되던지 상관없이 대사(음성신호)부분만을 추출할 수 있도록 한 것이다.
일반적으로 사람의 음성신호 주파수 대역은 제4도에 도시한 바와 같이 100Hz~4KHz로서, 영화나 TV드라마에서 상기 세가지 신호가 동시에 출력될 때 대사부분은 배경음악이나 효과음보다 에너지가 높다.
그러나 배경음악이나 효과음의 주파수 대역은 구성음의 특성에 따라 음성대역에 겹치는 부분이 존재하게 된다.
이러한 배경하에 본 발명에서는 음성대역내에서 배경음악이나 효과음을 제거하기 위해 다수개의 대역통과필터를 사용하여 입력신호를 다수개의 대역신호로 분리하고, 이와 같이 분리된 각 신호가 음성신호인지 여부를 판별하여 음성신호에 해당하는 대역의 신호만을 가산하여 음성신호를 추출하는 것이다.
상기한 음성신호 판별은 일정구간 대역통과필터의 출력신호의 절대값을 적분한 값이 기준값보다 크면 대역통과필터의 출력신호는 가산기로 입력되고, 만일 기준값보다 작으면 음성신호가 아닌 것으로 판별하여 그 대역의 신호는 음성신호 부분에서 삭제된다.
본 발명의 동작을 보다 구체적으로 설명하면 다음과 같다.
제2도에서와 같이 입력신호가 다수개의 대역통과필터(101,102,....10n)에 입력되면 각 대역통과필터의 통과대역은 사람의 음성대역을 필터의 설치 개수만큼 분할함으로써 각각의 필터는 해당대역의 신호를 추출하게 된다.
상기 추출된 신호들은 절대값으로 변환된 후 제3도에 도시된 적분기(111a)를 통해 적분된다.
이와 같이 적분을 하게 되면 이 신호의 일정구간 에너지를 구할 수가 있다.
상기 적분기(111a)의 출력은 비교기(111b)에 입력되어 기준값(Rf)과 비교하게 된다.
이때 상기 적분기(111a)를 통해 출력되는 적분값이 기준값(Rf)보다 클때에는 비교기(111b)에서 음성신호로 인식하여 멀티플렉서(111c)에서는 대역통과필터(101)의 출력신호를 가산기(201)에 입력시키게 된다.
한편 상기 적분값이 기준값(Rf)보다 작을때에는 비교기(111b)에서 음성신호가 아닌 것으로 인식하여 멀티플렉서(111c)에서는 ψ신호를 가산기(201)에 입력시키게 된다.
이와 같은 일련의 동작은 대역의 신호가 효과음 또는 배경음악인 것으로 간주하여 제거하기 위한 것이다.
즉 본 발명에서는 다수개의 필터(101~10n)의 각 출력이 음성신호인지 여부를 적분기(111a)와 비교기(111b)에 의해 판별한 후, 음성신호라고 판별된 대역의 신호들만 멀티플렉서(111c)를 통과하여 가산기(201)에 의해 합성된 후 음성신호만을 추출하게 되는 것이다.
이상에서와 같이 본 발명은 모노상태로 녹음된 영화나 TV드라마에서 대사부분만을 추출이 가능토록 하여 대사부분과 배경음악 혹은 효과음 부분의 음장효과를 다르게 할 수가 있는 것이어서 종래기술에 비하여 보다 탁월한 오디오/비디오(A/V)음장 재생특성을 제공할 수가 있다.
Claims (2)
- 입력되는 신호중 특정주파수 대역신호(100Hz~100Hz)만을 통과시키는 다수개의 대역통과필터(101,102,....10n)와, 상기 다수개의 대역통과필터(101,102,....10n)를 통과한 신호가 음성신호인가 여부를 판별하여 음성신호인경우에는 입력신호를 그대로 출력시키고 음성신호가 아닌 경우에는 ψ를 출력하는 다수개의 추출기(111,112,....11n)와, 상기 다수개의 추출기(111,112,....11n)의 출력신호를 가산하여 음성신호만을 추출하는 가산기(201)로 구성됨을 특징으로 하는 음성신호 추출장치.
- 제1항에 있어서, 상기 단일의 추출기(111)는 대역통과필터(101)를 통과한 신호의 절대값을 적분하는 적분기(111a)와, 상기 적분기(111a)의 출력신호와 기준신호(Rf)를 비교하여 적분기(111a)의 출력신호가 기준신호(Rf)보다 크면 음성신호로 판별하여 상기 대역통과필터(101)를 통과한 신호를 그대로 멀티플렉서(111c)에 출력하고, 기준신호(Rf)보다 작으면 ψ신호를 멀티플렉서(111c)에 출력하는 비교기(111b)와, 상기 비교기(111b)의 출력제어신호에 따라 입력신호와 ψ신호를 선택적으로 출력하는 멀티플렉서(111c)로 구성된 음성신호 추출장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950020793A KR0160206B1 (ko) | 1995-07-14 | 1995-07-14 | 음성신호 추출장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950020793A KR0160206B1 (ko) | 1995-07-14 | 1995-07-14 | 음성신호 추출장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR970009308A KR970009308A (ko) | 1997-02-24 |
KR0160206B1 true KR0160206B1 (ko) | 1999-01-15 |
Family
ID=19420654
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019950020793A KR0160206B1 (ko) | 1995-07-14 | 1995-07-14 | 음성신호 추출장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR0160206B1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100499032B1 (ko) * | 2002-10-23 | 2005-07-01 | 엘지전자 주식회사 | 텔레비젼 수신기를 기반으로 하는 오디오 및 비디오 합성편집장치 |
-
1995
- 1995-07-14 KR KR1019950020793A patent/KR0160206B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR970009308A (ko) | 1997-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101100610B1 (ko) | 음성 신호 처리를 이용한 멀티-채널 신호 발생 장치 및 방법 | |
Sukittanon et al. | Modulation-scale analysis for content identification | |
KR101101384B1 (ko) | 파라미터화된 시간 특징 분석 | |
JP4906230B2 (ja) | オーディトリーイベントに基づく特徴付けを使ったオーディオ信号の時間調整方法 | |
US5719344A (en) | Method and system for karaoke scoring | |
US20070076902A1 (en) | Method and Apparatus for Removing or Isolating Voice or Instruments on Stereo Recordings | |
JP3033061B2 (ja) | 音声雑音分離装置 | |
WO2002097792A1 (en) | Segmenting audio signals into auditory events | |
AU2002252143A1 (en) | Segmenting audio signals into auditory events | |
Fitzgerald | Upmixing from mono-a source separation approach | |
US20050267740A1 (en) | Signal processing apparatus and method, recording medium, and program | |
US20080091422A1 (en) | Speech recognition method and apparatus therefor | |
DE102012103553A1 (de) | Audiosystem und verfahren zur verwendung von adaptiver intelligenz, um den informationsgehalt von audiosignalen in verbraucheraudio zu unterscheiden und eine signalverarbeitungsfunktion zu steuern | |
CN102214464A (zh) | 音频信号的瞬态检测方法以及基于该方法的时长调整方法 | |
US5483617A (en) | Elimination of feature distortions caused by analysis of waveforms | |
KR910020643A (ko) | 음성신호처리장치 | |
JP2001147697A (ja) | 音響データ分析方法及びその装置 | |
KR0160206B1 (ko) | 음성신호 추출장치 | |
Gillet et al. | Extraction and remixing of drum tracks from polyphonic music signals | |
Tessier et al. | A CASA front-end using the localisation cue for segregation and then cocktail-party speech recognition | |
JPH04230800A (ja) | 音声信号処理装置 | |
JPH03122699A (ja) | 雑音除去装置及び該装置を用いた音声認識装置 | |
KR102611105B1 (ko) | 콘텐츠 내 음악 식별 장치 및 방법 | |
Sofianos et al. | Singing voice separation based on non-vocal independent component subtraction and amplitude discrimination | |
KR100539176B1 (ko) | 음악적 특징 추출 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |