KR0129829B1

KR0129829B1 - 음향 변속 재생장치

Info

Publication number: KR0129829B1
Application number: KR1019940024514A
Authority: KR
Inventors: 오영환; 김연준
Original assignee: 오영환
Priority date: 1994-09-28
Filing date: 1994-09-28
Publication date: 1998-04-17
Also published as: GB2293741B; GB2293741A; CN1127916A; CN1143293C; US5781696A; JPH08190400A; GB9519586D0

Abstract

명령어가 저장되어 있는 명령어 기억회로(29)와; 음향신호 데이터가 저장되어 있는 기억장치(30)와; 명령어를 순차적으로 읽어들여 이를 해독함으로써 각 부분을 제어하기 위한 제어신호를 출력하는 주제어기(28)와; 애널로그 입력신호를 디지틀 신호로 변환, 출력하는 애널로그/디지틀 컨버터(21)와; 애널로그/디지틀 컨버터의 디지틀 출력신호가 일시 저장되는 입력버퍼(22)와; 입력신호로부터 음원이 되는 부분과 음향신호 특성에 해당하는 부분으로 분리하여 출력하는 피치검출 회로(23)와; 분리된 음향신호로부터 추출된 음원성분을 재생하고자 하는 속도에 따라 삭제 또는 첨가하여 음향신호의 길이를 조절하고, 음원의 위치를 기준으로 일정한 길이의 창함수를 씌워서 신호를 변조, 출력하는 피치 변조부(24)와; 변조된 음원 성분과 음향신호 특성을 이용하여 변속된 음성신호를 산출하여 출력하는 음성합성 회로(25)와; 변속된 음성신호를 일시 저장하는 출력버퍼(26)와; 디지틀 변속신호를 애널로그 신호로 변환, 출력하는 디지틀/애널로그 컨버터(27)로 구성되어 있으며; 음향 재생장치로부터 저장된 음성 또는 음향을 재생할 경우에 음향의 재생속도를 변경하게 됨으로써 발생하게 되는 음색의 변질 및 손실을 방지하고, 상기한 음성을 사람이 빨리 또는 천천히 이야기하는 것처럼 들리도록 음향의 재생속도를 조절하여 재생시킬 수 있는 음향 변속 재생장치에 관한 것.

Description

음향 변속 재생장치

제1도는 종래의 음성변속 재생방식으로 나타낸 도면이고,

제2도는 음성생성모델을 전자 회로화하여 나타낸 도면이고,

제3도는 이 발명의 실시예에 따른 음향 변속 재생장치의 주요부분의 신호처리과정을 나타낸 도면이고,

제4도는 이 발명의 실시예에 따른 음향 변속 재생장치의 회로 구성도이고,

제5도는 이 발명의 실시예에 따른 음향 변속 재생장치의 분석부 과정에서 분리된 음원 및 음향특성의 형태를 나타낸 도면이고,

제6도는 이 발명의 실시예에 따른 음향 변속 재생장치의 음원 변조과정을 나타낸 도면이다.

* 도면의 주요부분에 대한 부호의 설명

21 : 애널로그/디지틀 컨버터 22 : 입력버퍼

23 : 피치검출 회로 24 : 피치 변조부

25 : 음성합성 회로 26 : 출력버퍼

27 : 디지틀/애널로그 컨버터 28 : 주제어기

29 : 명령어 기억회로 30 : 기억장치

이 발명은 음향 변속 재생장치에 관한 것으로서, 더욱 상세하게 말하자면 음향 재생장치(테이프 플레이어, VTR, 멀티미디어 장비, 컴퓨터 등)로부터 저장된 음성 또는 음향을 재생할 경우에 음향의 재생속도를 변경하게 됨으로써 발생하게 되는 음색의 변질 및 손실을 방지하고, 상기한 음성을 사람이 빨리 또는 천천히 이야기하는 것처럼 들리도록 음향의 재생속도를 조절하여 재생시킬 수 있는 음향 변속 재생장치에 관한 것이다.

테이프 또는 비디오 플레이어의 재생(play back) 속도를 변경하는 경우에, 속도를 빠르게 재생시키면 원래의 음의 높이로부터 벗어나서 '삐리삐리'하는 소리처럼 들리게 된다. 그리고, 속도를 느리게 재생시키면 우리가 흔히 말하는 '테이프 늘어지는 소리'가 나게 된다.

상기한 바와 같은 현상을 방지하기 위하여, 종래에는 음성 또는 음향신호를 버퍼에 읽어 들여서 일부분만을 재생하는 방법을 사용한다. 즉, 종래에는 음성 또는 음향신호를 메모리 버퍼에 읽어들여서, 재생속도를 2배로 하는 경우에는 2개의 시간단편(time-slice) 중에서 하나만을 재생시키는 방법을 사용한다.

따라서 종래의 방법으로 '나는 영희와 함께 학교에 가다'를 2배속으로 재생시키면 제1도에 도시된 바와 같이 원음중에서 무늬진 부분의 음성은 탈락되어 '나는 함께 간다'만을 재생하게 된다.

이와 같이, 기존의 방법은, 재생속도를 빠르게 하는 경우에 음성의 음색을 유지하기 위하여 음성의 일부분만을 재생하게 되므로 원래의 음성의 의미를 보존하지 못하고 상실하게 된다. 따라서, 재생장치를 이용하여 음성의 의미를 이해하는데 많은 어려움을 겪게 되며, 듣는이로 하여금 거부감을 느끼게 하는 문제점이 있다.

이 발명의 목적은 상기한 종래의 문제점을 해결하기 위한 것으로서, 음향 재생장치(테이프 플레이어, VTR, 멀티미디어 장비, 컴퓨터 등)로부터 저장된 음성 또는 음향을 재생할 경우에 음향의 재생속도를 변경하게 됨으로써 발생하게 되는 음색의 변질 및 손실을 방지하고, 상기한 음성을 사람이 빨리 또는 천천히 이야기하는 것처럼 들리도록 음향의 재생속도를 조절하여 재생시킬 수 있는 음향 변속 재생장치를 제공하는데 있다.

상기한 목적을 달성하기 위한 수단으로서 이 발명의 구성은, 명령어가 저장되어 있는 명령어 기억회로와, 프로그램, 데이터 버스에 연결되어 있으며, 음향신호 데이터가 저장되어 있는 기억장치와, 상기한 명령어 기억회로에 저장되어 있는 명령어를 순차적으로 읽어들여 이를 해독함으로써 각 부분을 제어하기 위한 제어신호를 프로그램 버스를 통해서 출력하는 주제어기와, 상기한 주제어기의 제어신호에 따라, 애널로그 입력신호를 디지틀 신호로 변환하여 출력하는 애널로그/디지틀 컨버터와, 상기한 애널로그/디지틀 컨버터의 디지틀 출력신호가 일시 저장되는 입력버퍼와, 상기한 주제어기의 제어신호에 따라, 상기한 입력버퍼를 통해서 입력되는 신호로부터 음원이 되는 부분과 음향신호 특성에 해당하는 부분으로 분리하여 출력하는 피치검출 회로, 상기한 주제어기의 제어신호에 따라, 상기한 피치검출 회로에서 분리된 음향신호로부터 추출된 음원성분을 재생하고자 하는 속도에 따라 삭제 또는 첨가하여 음향신호의 길이를 조절하고, 음원의 위치를 기준으로 일정한 길이의 창함수를 씌워서 신호를 변조하여 출력하는 피치 변조부와, 상기한 주제어기의 제어신호에 따라, 상기한 피치 변조부에 의하여 변조된 음원 성분과 음향신호 특성을 이용하여 변속된 음성신호를 산출하여 출력하는 음성합성 회로와, 상기한 음성합성 회로로부터 입력되는 변속된 음성신호를 일시 저장하는 출력버퍼와, 상기한 주제어기의 제어신호에 따라, 디지틀 변속신호를 애널로그 신호로 변환하여 출력하는 디지틀/애널로그 컨버터로 이루어진다.

이하, 이 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 이 발명을 용이하게 실시할 수 있을 정도로 상세히 설명하기 위하여, 이 발명의 가장 바람직한 실시예를 첨부된 도면을 참조로 하여 설명하기로 한다.

제4도는 이 발명의 실시예에 따른 음향 변속 재생장치의 회로 구성도이다.

제4도에 도시되어 있듯이 이 발명의 실시예에 따른 음향 변속 재생장치의 구성은, 입력 신호선(Audio In)과 프로그램 버스에 연결되어 있는 애널로그/디지틀 컨버터(21)와, 애널로그/디지틀 컨버터(21) 및 프로그램, 데이터 버스에 연결되어 있는 입력버퍼(22)와, 입력버퍼(22) 및 프로그램 버스에 연결되어 있는 피치검출 회로(23)와, 피치검출 회로(23)에 연결되어 있는 피치 변조부(24)와, 피치 변조부(24)와 프로그램, 데이터 버스에 연결되어 있는 음성합성 회로(25)와, 음성합성 회로(25)와 프로그램 버스에 연결되어 있는 출력버퍼(26)와, 출력버퍼(26)와, 프로그램 버스에 연결되어 있는 디지틀/애널로그 컨버터(27)와, 프로그램 버스에 연결되어 있는 주제어기(28)와, 주제어기(28)에 연결되어 있는 명령어 기억회로(29)와, 프로그램, 데이터 버스에 연결되어 있는 기억장치(30)로 이루어진다.

음향 변속 재생장치 전체를 제어하는 역할은 주제어기(28)가 수행하며, 주제어기(28)에서 각 부분을 제어하기 위해 필요한 명령어들은 명령어 기억회로(29)에 저장되어 있다. 그리고, 음향신호 데이터는 기억장치(30)에 저장된다.

각 블럭간의 제어신호와 데이터의 전달은 프로그램 버스와 데이터 버스에 의해서 각각 이루어지는데, 프로그램 버스는 주제어기(28)로부터 내려지는 명령을 제어하고자하는 부분으로 전달해주는 역할을 담당하고, 데이터 버스는 입력버퍼로부터 음향 데이터를 받아서 기억장치(30)에 저장했다가 음성합성시에 이를 음성합성 회로(25)에 전달함으로써 음성합성 회로(25)에서 변조된 음원신호와 함께 재합성되도록 한다.

상기한 구성에 의한, 이 발명의 실시예에 따른 음향 변속 재생장치의 작용은 다음과 같다.

이 발명에서 사용되는 방식은 음성생성모델(speech production model)에 근거한다. 음성생성모델은 사람의 발성기관을 모의한 것으로, 음성을 음성발생의 근원인 음원과 조음기관(혀, 이, 입술 등)에 의한 음향전달특성을 나타낸다.

음성생성모델에 의하면, 음성은 사람의 허파에서 시작된 공기의 흐름이 성대(voice cord), 또는 구강내의 혀, 이, 입술 등에 의해 만들어진 좁은공간, 즉 조음점(point of articulation)의 부위에 각각 주기적 또는 잡음성의 공기진동을 일으킨다. 이들이 음원(speech source)이 되어, 성대보다 위의 부위에 있는 기관, 즉 성도(vocal tract)의 조음(articulation) 동작에 의해 결정되는 음향 전달특성의 영향을 받아 음원의 주파수 성분이 선택적으로 공명함으로써 음성이 생성된다.

상기한 음성생성모델을 전자 회로화하여 도식적으로 나타낸 것이 제2도에 도시되어 있다.

본 방식은 위에서 설명한 음성생성모델에 근거한 것으로서, 제3도에 도시되어 있는 바와 같이, 입력신호로부터 음원과 음향특성을 분리해내는 분석부와, 분리된 신호를 원하는 재생속도에 따라 처리하는 변조부와, 변조된 신호를 이용하여 신호를 재합성해내는 합성부의 주요 3부분으로 나눌 수가 있다.

상기한 변조부는, 위에서 설명한 음성생성모델에 근거하여 분리된 음원신호를 처리하는 음원 변조부와, 음색 즉 음향특성을 유지하면서 재합성에 필요한 창함수에 의한 평활화(smoothing) 처리를 수행하는 음향특성 제어부로 나뉘어진다.

본 방식의 전체적인 흐름은 음향신호의 음색 또는 주파수를 그대로 유지하면서 재생속도를 변화시키기 위하여 입력된 음향신호를 분석하여 음원신호와 음향특성을 분리한 후, 분리된 데이터 각각을 변속 처리하고, 처리된 데이터를 이용하여 재합성하는 과정으로 이루어진다. 이러한 과정이 제3도에 잘 나타나 있다. 제3도는 이 발명의 실시예에 따른 음향 변속 재생장치의 주요부분의 신호 처리과정을 나타낸 도면이다.

본 발명의 가장 핵심부분인 분석부, 변조부, 합성부는, 제4도에서 각각 피치검출 회로(24), 피치 변조부(24), 음성합성 회로(25)에 해당한다.

이하, 제4도를 참조로 하여 이 발명의 실시예에 따른 음향 변속 재생장치의 동작을 설명하면 다음과 같다.

먼저, 음향신호(Audio In)가 입력되면, 애널로그 디지틀 컨버터(21)에 의하여 상기한 음향신호(Audio In)가 디지틀 신호로 변환된 뒤에 입력버퍼(22)를 거쳐서 피치검출 회로(23)로 출력된다.

분석부 과정에서, 주제어기(28)의 제어신호에 따라 피치검출 회로(23)는 음성생성모델에 의거하여 음향신호로부터 음원이 되는 부분과 음향신호 특성에 해당하는 부분으로 분리한다. 이때, 음향신호로부터 음원의 위치를 구하기 위하여 상호 유사도(cross-amplitude difference) c(m,δ)(m-1번째 음원과 m번째 음원을 기준으로 신호의 차이를 측정한 값으로서 이때의 허용범위는 δ이다)를 아래의 식(1)과 같이 정의한다.

상기한 상호 유사도란 인접한 음원의 위치를 기준점으로 신호의 차이를 측정함으로써 신호의 유사도를 나타내는 척도로서 정의된다. 따라서, m번째 음원의 위치는 상호 유사도가 최소가 되는 위치 tm으로 결정되며, 이러한 과정을 입력된 신호에 대하여 반복적으로 수행함으로써 음원성분을 추출하게 된다.

여기에서, x(n)은 입력된 원래의 신호(시간축 n에서의 음량)이고, tm은 m번째 음원의 위치이고, δ은 음원위치의 허용범위(tolerance region around tm)이다.

제5도는 위의 분석부 과정으로부터 분리된 음원 및 음향특성의 형태를 그림으로 나타낸 것이다.

제5도에 도시되어 있듯이, 일반적인 음향신호는 준안정(quasi-stationary) 즉, 이웃하는 짧은 시간구간에서는 거의 유사한 특징을 지니는 것으로 나타난다. 이때, 유사한 신호특성을 지니는 가장 큰 신호 주기를 우리는 흔히 한 피치(pitch)라고 하는데, 본 발명의 분석부 과정에서는 입력된 음향신호로부터 이러한 피치주기, 즉 음원신호를 추출하여 음향재생의 속도를 조절하는데 이용한다.

변조부 과정에서는 상기한 분석부 과정에서 분리된 음원신호와 음향특성신호를 변조하는 과정을 수행한다. 따라서 피치 변조부(24)는, 음원신호를 처리하는 음원 변조부와, 음색 즉, 음향특성을 유지하면서 재합성에 필요한 창함수에 의한 평활화 처리를 수행하는 음향특성 제어부로 구성된다.

피치 변조부(24)의 음원 변조부에서는 음향신호로부터 추출된 음원성분을 재생하고자 하는 속도에 따라 삭제 또는 첨가하여 음향신호의 길이를 조절한다. 보다 상세한 설명은 제6도를 참조한다. 제6도는 이 발명의 실시예에 따른 음향 변속 재생장치의 음원 변조과정을 나타낸 도면이다.

제6도에 도시되어 있는 바와 같이, 음향의 재생속도를 느리게 하기 위해서는 이웃하는 음원간의 간격을 그대로 유지하면서 또다른 음원을 첨가하여 신호를 늘이고, 음원의 재생속도를 빠르게 하기 위해서는 이웃하는 음원의 간격을 유지하도록 하면서 하나씩 걸러서 음원을 선택하여 음향특성을 이용하여 재합성함으로써 가능하게 된다.

피치 변조부(24)의 음향특성 제어부에서는 음향신호 특성에 해당하는 부분을 식(2)에서와 같이 음원의 위치를 기준으로 일정한 길이의 창함수(window)를 씌워서 신호를 변조시킨다. 이는 나중에 음성합성시에 음원의 삭제 및 첨가에 의하여 신호가 변조된 경우에도 매끄러운 음향신호를 생성하기 위한 처리과정이다.

여기에서, x_m(n)은 변조된 음향신호이고, h_m(n)은 창함수이고, t_m은 음원의 위치이고, x(n)은 입력된 음향신호(시간축 n에서의 음량)이다.

마지막으로, 합성부 과정이 이루어지는 음원합성 회로(25)에서는 위의 변조부 과정에 의하여 변조된 음원 성분과 음향신호 특성을 이용하여 변속된 음성신호 x(n)을 구한다. 이를 식으로 나타내면 아래의 식(3)과 같이 나타낼 수 있다.

여기에서, αq는 합성음량 조절변수이고, xq(n)=x_m(n-δq)은 변조된 음향특성이고, hq(n)은 창함수이고, tq는 변조된 음원의 위치이고, δq는 재생속도 결정변수이다.

변속된 음성신호 x(n)은, 출력버퍼(26)를 거쳐서 디지틀 애널로그 컨버터(27)에 의하여 애널로그 신호(Audio Out)로 변환된 뒤에 출력된다.

본 방식에 의하여 음향을 재생할 경우에는 재생속도는 변화시키더라도 재생시키고자 하는 음성의 음색을 그대로 유지하면서 사람이 빨리 또는 천천히 발생하는 것처럼 들을 수가 있다.

따라서, VTR 플레이어와 같이 영상화면을 빠르게 재생하여 검색 또는 모니터링하는 경우, 기존의 VTR 플레이어처럼 음색이 변하여 듣기가 거북하거나 또는 음향신호의 손실로 시청자가 답답함이 느껴지지 않고 원래의 음색으로 빠르게 말하는 것과 같은 재생음을 얻을 수가 있다.

그외에도 멀티미디어 장비의 고속 스캐닝과 같은 응용에 적합할 것으로 예상된다. 앞으로 멀티미디어 시장의 성장과 함께 본 기술의 활용이 다양해질 것으로 생각된다.

이상에서와 같이 이 발명의 실시예에서, 음향 재생장치(테이프 플레이어, VTR, 멀티미디어 장비, 컴퓨터 등)로부터 저장된 음성 또는 음향을 재생할 경우에 음향의 재생속도를 변경하게 됨으로써 발생하게 되는 음색의 변질 및 손실을 방지하고, 상기한 음성을 사람이 빨리 또는 천천히 이야기하는 것처럼 들리도록 음향의 재생속도를 조절하여 재생시킬 수 있는 효과를 가진 음향 변속 재생장치를 제공할 수가 있다.

이 발명의 이러한 효과는 각종 음향 재생장치의 설계, 제조, 판매 등의 분야에서 이용될 수가 있다.

Claims

명령어가 저장되어 있는 명령어 기억회로와, 프로그램, 데이터 버스에 연결되어 있으며, 음향신호 데이터가 저장되어 있는 기억장치와, 상기한 명령어 기억회로에 저장되어 있는 명령어를 순차적으로 읽어들여 이를 해독함으로써 각 부분을 제어하기 위한 제어신호를 프로그램 버스를 통해서 출력하는 주제어기와, 상기한 주제어기의 제어신호에 따라, 애널로그 입력신호를 디지틀 신호로 변환하여 출력하는 애널로그/디지틀 컨버터와, 상기한 애널로그/디지틀 컨버터의 디지틀 출력신호가 일시 저장되는 입력버퍼와, 상기한 주제어기의 제어신호에 따라, 상기한 입력버퍼를 통해서 입력되는 신호로부터 음원이 되는 부분과 음향신호 특성에 해당하는 부분으로 분리하여 출력하는 피치검출 회로와, 상기한 주제어기의 제어신호에 따라, 상기한 피치검출 회로에서 분리된 음향신호로부터 추출된 음원성분을 재생하고자 하는 속도에 따라 삭제 또는 첨가하여 음향신호의 길이를 조절하고, 음원의 위치를 기준으로 일정한 길이의 창함수를 씌워서 신호를 변조하여 출력하는 피치 변조부와, 상기한 주제어기의 제어신호에 따라, 상기한 피치 변조부에 의하여 변조된 음원 성분과 음향신호 특성을 이용하여 변속된 음성신호를 산출하여 출력하는 음성합성 회로와, 상기한 음성합성 회로로부터 입력되는 변속된 음성신호를 일시 저장하는 출력버퍼와, 상기한 주제어기의 제어신호에 따라, 디지틀 변속신호를 애널로그 신호로 변환하여 출력하는 디지틀/애널로그 컨버터로 이루어지는 것을 특징으로 하는 음향 변속 재생장치.
제1항에 있어서, 상기한 피치 검출회로부는 다음의 수식에 의하여 음원성분을 추출하는 것을 특징으로 하는 음향 변속 재생장치.

여기에서, x(n)은 입력된 원래의 신호(시간축 n에서의 음량)이고, tm은 m번째 음원의 위치이고, δ은 음원위치의 허용범위(tolerance region around tm)이다.
제1항에 있어서, 상기한 피치 변조부는 음향신호 특성에 해당하는 부분을 다음의 수식에서와 같이 음원의 위치를 기준으로 일정한 길이의 창함수를 씌워서 신호를 변조시키는 것을 특징으로 하는 음향 변속 재생장치.

x_m(n)=h_m(t_m-n)x(n)

여기에서, x_m(n)은 변조된 음향신호이고, h_m(n)은 창함수이고, t_m은 음원의 위치이고, x(n)은 입력된 음향신호(시간축 n에서의 음량)이다.
제1항에 있어서, 상기한 음원합성 회로는 다음의 수식과 같이 변조된 음원 성분과 음향신호 특성을 이용하여 변속된 음성신호 x(n)을 구하는 것을 특징으로 하는 음향 변속 재생장치.

여기에서, αq는 합성음량 조절변수이고, xq(n)-x_m(n-δq)은 변조된 음향특성이고, hq(n)은 창함수이고, tq는 변조된 음원의 위치이고, δq는 재생속도 결정변수이다.