KR0129829B1 - 음향 변속 재생장치 - Google Patents
음향 변속 재생장치 Download PDFInfo
- Publication number
- KR0129829B1 KR0129829B1 KR1019940024514A KR19940024514A KR0129829B1 KR 0129829 B1 KR0129829 B1 KR 0129829B1 KR 1019940024514 A KR1019940024514 A KR 1019940024514A KR 19940024514 A KR19940024514 A KR 19940024514A KR 0129829 B1 KR0129829 B1 KR 0129829B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- sound
- sound source
- voice
- main controller
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 34
- 230000015572 biosynthetic process Effects 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 11
- 238000003786 synthesis reaction Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 10
- 230000015654 memory Effects 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims 1
- 230000002194 synthesizing effect Effects 0.000 abstract 1
- 238000000034 method Methods 0.000 description 17
- 238000004458 analytical method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 210000000056 organ Anatomy 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000004148 unit process Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 210000000214 mouth Anatomy 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/01—Correction of time axis
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/005—Reproducing at a different information rate from the information rate of recording
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/90—Tape-like record carriers
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
Abstract
명령어가 저장되어 있는 명령어 기억회로(29)와; 음향신호 데이터가 저장되어 있는 기억장치(30)와; 명령어를 순차적으로 읽어들여 이를 해독함으로써 각 부분을 제어하기 위한 제어신호를 출력하는 주제어기(28)와; 애널로그 입력신호를 디지틀 신호로 변환, 출력하는 애널로그/디지틀 컨버터(21)와; 애널로그/디지틀 컨버터의 디지틀 출력신호가 일시 저장되는 입력버퍼(22)와; 입력신호로부터 음원이 되는 부분과 음향신호 특성에 해당하는 부분으로 분리하여 출력하는 피치검출 회로(23)와; 분리된 음향신호로부터 추출된 음원성분을 재생하고자 하는 속도에 따라 삭제 또는 첨가하여 음향신호의 길이를 조절하고, 음원의 위치를 기준으로 일정한 길이의 창함수를 씌워서 신호를 변조, 출력하는 피치 변조부(24)와; 변조된 음원 성분과 음향신호 특성을 이용하여 변속된 음성신호를 산출하여 출력하는 음성합성 회로(25)와; 변속된 음성신호를 일시 저장하는 출력버퍼(26)와; 디지틀 변속신호를 애널로그 신호로 변환, 출력하는 디지틀/애널로그 컨버터(27)로 구성되어 있으며; 음향 재생장치로부터 저장된 음성 또는 음향을 재생할 경우에 음향의 재생속도를 변경하게 됨으로써 발생하게 되는 음색의 변질 및 손실을 방지하고, 상기한 음성을 사람이 빨리 또는 천천히 이야기하는 것처럼 들리도록 음향의 재생속도를 조절하여 재생시킬 수 있는 음향 변속 재생장치에 관한 것.
Description
제1도는 종래의 음성변속 재생방식으로 나타낸 도면이고,
제2도는 음성생성모델을 전자 회로화하여 나타낸 도면이고,
제3도는 이 발명의 실시예에 따른 음향 변속 재생장치의 주요부분의 신호처리과정을 나타낸 도면이고,
제4도는 이 발명의 실시예에 따른 음향 변속 재생장치의 회로 구성도이고,
제5도는 이 발명의 실시예에 따른 음향 변속 재생장치의 분석부 과정에서 분리된 음원 및 음향특성의 형태를 나타낸 도면이고,
제6도는 이 발명의 실시예에 따른 음향 변속 재생장치의 음원 변조과정을 나타낸 도면이다.
* 도면의 주요부분에 대한 부호의 설명
21 : 애널로그/디지틀 컨버터 22 : 입력버퍼
23 : 피치검출 회로 24 : 피치 변조부
25 : 음성합성 회로 26 : 출력버퍼
27 : 디지틀/애널로그 컨버터 28 : 주제어기
29 : 명령어 기억회로 30 : 기억장치
이 발명은 음향 변속 재생장치에 관한 것으로서, 더욱 상세하게 말하자면 음향 재생장치(테이프 플레이어, VTR, 멀티미디어 장비, 컴퓨터 등)로부터 저장된 음성 또는 음향을 재생할 경우에 음향의 재생속도를 변경하게 됨으로써 발생하게 되는 음색의 변질 및 손실을 방지하고, 상기한 음성을 사람이 빨리 또는 천천히 이야기하는 것처럼 들리도록 음향의 재생속도를 조절하여 재생시킬 수 있는 음향 변속 재생장치에 관한 것이다.
테이프 또는 비디오 플레이어의 재생(play back) 속도를 변경하는 경우에, 속도를 빠르게 재생시키면 원래의 음의 높이로부터 벗어나서 '삐리삐리'하는 소리처럼 들리게 된다. 그리고, 속도를 느리게 재생시키면 우리가 흔히 말하는 '테이프 늘어지는 소리'가 나게 된다.
상기한 바와 같은 현상을 방지하기 위하여, 종래에는 음성 또는 음향신호를 버퍼에 읽어 들여서 일부분만을 재생하는 방법을 사용한다. 즉, 종래에는 음성 또는 음향신호를 메모리 버퍼에 읽어들여서, 재생속도를 2배로 하는 경우에는 2개의 시간단편(time-slice) 중에서 하나만을 재생시키는 방법을 사용한다.
따라서 종래의 방법으로 '나는 영희와 함께 학교에 가다'를 2배속으로 재생시키면 제1도에 도시된 바와 같이 원음중에서 무늬진 부분의 음성은 탈락되어 '나는 함께 간다'만을 재생하게 된다.
이와 같이, 기존의 방법은, 재생속도를 빠르게 하는 경우에 음성의 음색을 유지하기 위하여 음성의 일부분만을 재생하게 되므로 원래의 음성의 의미를 보존하지 못하고 상실하게 된다. 따라서, 재생장치를 이용하여 음성의 의미를 이해하는데 많은 어려움을 겪게 되며, 듣는이로 하여금 거부감을 느끼게 하는 문제점이 있다.
이 발명의 목적은 상기한 종래의 문제점을 해결하기 위한 것으로서, 음향 재생장치(테이프 플레이어, VTR, 멀티미디어 장비, 컴퓨터 등)로부터 저장된 음성 또는 음향을 재생할 경우에 음향의 재생속도를 변경하게 됨으로써 발생하게 되는 음색의 변질 및 손실을 방지하고, 상기한 음성을 사람이 빨리 또는 천천히 이야기하는 것처럼 들리도록 음향의 재생속도를 조절하여 재생시킬 수 있는 음향 변속 재생장치를 제공하는데 있다.
상기한 목적을 달성하기 위한 수단으로서 이 발명의 구성은, 명령어가 저장되어 있는 명령어 기억회로와, 프로그램, 데이터 버스에 연결되어 있으며, 음향신호 데이터가 저장되어 있는 기억장치와, 상기한 명령어 기억회로에 저장되어 있는 명령어를 순차적으로 읽어들여 이를 해독함으로써 각 부분을 제어하기 위한 제어신호를 프로그램 버스를 통해서 출력하는 주제어기와, 상기한 주제어기의 제어신호에 따라, 애널로그 입력신호를 디지틀 신호로 변환하여 출력하는 애널로그/디지틀 컨버터와, 상기한 애널로그/디지틀 컨버터의 디지틀 출력신호가 일시 저장되는 입력버퍼와, 상기한 주제어기의 제어신호에 따라, 상기한 입력버퍼를 통해서 입력되는 신호로부터 음원이 되는 부분과 음향신호 특성에 해당하는 부분으로 분리하여 출력하는 피치검출 회로, 상기한 주제어기의 제어신호에 따라, 상기한 피치검출 회로에서 분리된 음향신호로부터 추출된 음원성분을 재생하고자 하는 속도에 따라 삭제 또는 첨가하여 음향신호의 길이를 조절하고, 음원의 위치를 기준으로 일정한 길이의 창함수를 씌워서 신호를 변조하여 출력하는 피치 변조부와, 상기한 주제어기의 제어신호에 따라, 상기한 피치 변조부에 의하여 변조된 음원 성분과 음향신호 특성을 이용하여 변속된 음성신호를 산출하여 출력하는 음성합성 회로와, 상기한 음성합성 회로로부터 입력되는 변속된 음성신호를 일시 저장하는 출력버퍼와, 상기한 주제어기의 제어신호에 따라, 디지틀 변속신호를 애널로그 신호로 변환하여 출력하는 디지틀/애널로그 컨버터로 이루어진다.
이하, 이 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 이 발명을 용이하게 실시할 수 있을 정도로 상세히 설명하기 위하여, 이 발명의 가장 바람직한 실시예를 첨부된 도면을 참조로 하여 설명하기로 한다.
제4도는 이 발명의 실시예에 따른 음향 변속 재생장치의 회로 구성도이다.
제4도에 도시되어 있듯이 이 발명의 실시예에 따른 음향 변속 재생장치의 구성은, 입력 신호선(Audio In)과 프로그램 버스에 연결되어 있는 애널로그/디지틀 컨버터(21)와, 애널로그/디지틀 컨버터(21) 및 프로그램, 데이터 버스에 연결되어 있는 입력버퍼(22)와, 입력버퍼(22) 및 프로그램 버스에 연결되어 있는 피치검출 회로(23)와, 피치검출 회로(23)에 연결되어 있는 피치 변조부(24)와, 피치 변조부(24)와 프로그램, 데이터 버스에 연결되어 있는 음성합성 회로(25)와, 음성합성 회로(25)와 프로그램 버스에 연결되어 있는 출력버퍼(26)와, 출력버퍼(26)와, 프로그램 버스에 연결되어 있는 디지틀/애널로그 컨버터(27)와, 프로그램 버스에 연결되어 있는 주제어기(28)와, 주제어기(28)에 연결되어 있는 명령어 기억회로(29)와, 프로그램, 데이터 버스에 연결되어 있는 기억장치(30)로 이루어진다.
음향 변속 재생장치 전체를 제어하는 역할은 주제어기(28)가 수행하며, 주제어기(28)에서 각 부분을 제어하기 위해 필요한 명령어들은 명령어 기억회로(29)에 저장되어 있다. 그리고, 음향신호 데이터는 기억장치(30)에 저장된다.
각 블럭간의 제어신호와 데이터의 전달은 프로그램 버스와 데이터 버스에 의해서 각각 이루어지는데, 프로그램 버스는 주제어기(28)로부터 내려지는 명령을 제어하고자하는 부분으로 전달해주는 역할을 담당하고, 데이터 버스는 입력버퍼로부터 음향 데이터를 받아서 기억장치(30)에 저장했다가 음성합성시에 이를 음성합성 회로(25)에 전달함으로써 음성합성 회로(25)에서 변조된 음원신호와 함께 재합성되도록 한다.
상기한 구성에 의한, 이 발명의 실시예에 따른 음향 변속 재생장치의 작용은 다음과 같다.
이 발명에서 사용되는 방식은 음성생성모델(speech production model)에 근거한다. 음성생성모델은 사람의 발성기관을 모의한 것으로, 음성을 음성발생의 근원인 음원과 조음기관(혀, 이, 입술 등)에 의한 음향전달특성을 나타낸다.
음성생성모델에 의하면, 음성은 사람의 허파에서 시작된 공기의 흐름이 성대(voice cord), 또는 구강내의 혀, 이, 입술 등에 의해 만들어진 좁은공간, 즉 조음점(point of articulation)의 부위에 각각 주기적 또는 잡음성의 공기진동을 일으킨다. 이들이 음원(speech source)이 되어, 성대보다 위의 부위에 있는 기관, 즉 성도(vocal tract)의 조음(articulation) 동작에 의해 결정되는 음향 전달특성의 영향을 받아 음원의 주파수 성분이 선택적으로 공명함으로써 음성이 생성된다.
상기한 음성생성모델을 전자 회로화하여 도식적으로 나타낸 것이 제2도에 도시되어 있다.
본 방식은 위에서 설명한 음성생성모델에 근거한 것으로서, 제3도에 도시되어 있는 바와 같이, 입력신호로부터 음원과 음향특성을 분리해내는 분석부와, 분리된 신호를 원하는 재생속도에 따라 처리하는 변조부와, 변조된 신호를 이용하여 신호를 재합성해내는 합성부의 주요 3부분으로 나눌 수가 있다.
상기한 변조부는, 위에서 설명한 음성생성모델에 근거하여 분리된 음원신호를 처리하는 음원 변조부와, 음색 즉 음향특성을 유지하면서 재합성에 필요한 창함수에 의한 평활화(smoothing) 처리를 수행하는 음향특성 제어부로 나뉘어진다.
본 방식의 전체적인 흐름은 음향신호의 음색 또는 주파수를 그대로 유지하면서 재생속도를 변화시키기 위하여 입력된 음향신호를 분석하여 음원신호와 음향특성을 분리한 후, 분리된 데이터 각각을 변속 처리하고, 처리된 데이터를 이용하여 재합성하는 과정으로 이루어진다. 이러한 과정이 제3도에 잘 나타나 있다. 제3도는 이 발명의 실시예에 따른 음향 변속 재생장치의 주요부분의 신호 처리과정을 나타낸 도면이다.
본 발명의 가장 핵심부분인 분석부, 변조부, 합성부는, 제4도에서 각각 피치검출 회로(24), 피치 변조부(24), 음성합성 회로(25)에 해당한다.
이하, 제4도를 참조로 하여 이 발명의 실시예에 따른 음향 변속 재생장치의 동작을 설명하면 다음과 같다.
먼저, 음향신호(Audio In)가 입력되면, 애널로그 디지틀 컨버터(21)에 의하여 상기한 음향신호(Audio In)가 디지틀 신호로 변환된 뒤에 입력버퍼(22)를 거쳐서 피치검출 회로(23)로 출력된다.
분석부 과정에서, 주제어기(28)의 제어신호에 따라 피치검출 회로(23)는 음성생성모델에 의거하여 음향신호로부터 음원이 되는 부분과 음향신호 특성에 해당하는 부분으로 분리한다. 이때, 음향신호로부터 음원의 위치를 구하기 위하여 상호 유사도(cross-amplitude difference) c(m,δ)(m-1번째 음원과 m번째 음원을 기준으로 신호의 차이를 측정한 값으로서 이때의 허용범위는 δ이다)를 아래의 식(1)과 같이 정의한다.
상기한 상호 유사도란 인접한 음원의 위치를 기준점으로 신호의 차이를 측정함으로써 신호의 유사도를 나타내는 척도로서 정의된다. 따라서, m번째 음원의 위치는 상호 유사도가 최소가 되는 위치 tm으로 결정되며, 이러한 과정을 입력된 신호에 대하여 반복적으로 수행함으로써 음원성분을 추출하게 된다.
여기에서, x(n)은 입력된 원래의 신호(시간축 n에서의 음량)이고, tm은 m번째 음원의 위치이고, δ은 음원위치의 허용범위(tolerance region around tm)이다.
제5도는 위의 분석부 과정으로부터 분리된 음원 및 음향특성의 형태를 그림으로 나타낸 것이다.
제5도에 도시되어 있듯이, 일반적인 음향신호는 준안정(quasi-stationary) 즉, 이웃하는 짧은 시간구간에서는 거의 유사한 특징을 지니는 것으로 나타난다. 이때, 유사한 신호특성을 지니는 가장 큰 신호 주기를 우리는 흔히 한 피치(pitch)라고 하는데, 본 발명의 분석부 과정에서는 입력된 음향신호로부터 이러한 피치주기, 즉 음원신호를 추출하여 음향재생의 속도를 조절하는데 이용한다.
변조부 과정에서는 상기한 분석부 과정에서 분리된 음원신호와 음향특성신호를 변조하는 과정을 수행한다. 따라서 피치 변조부(24)는, 음원신호를 처리하는 음원 변조부와, 음색 즉, 음향특성을 유지하면서 재합성에 필요한 창함수에 의한 평활화 처리를 수행하는 음향특성 제어부로 구성된다.
피치 변조부(24)의 음원 변조부에서는 음향신호로부터 추출된 음원성분을 재생하고자 하는 속도에 따라 삭제 또는 첨가하여 음향신호의 길이를 조절한다. 보다 상세한 설명은 제6도를 참조한다. 제6도는 이 발명의 실시예에 따른 음향 변속 재생장치의 음원 변조과정을 나타낸 도면이다.
제6도에 도시되어 있는 바와 같이, 음향의 재생속도를 느리게 하기 위해서는 이웃하는 음원간의 간격을 그대로 유지하면서 또다른 음원을 첨가하여 신호를 늘이고, 음원의 재생속도를 빠르게 하기 위해서는 이웃하는 음원의 간격을 유지하도록 하면서 하나씩 걸러서 음원을 선택하여 음향특성을 이용하여 재합성함으로써 가능하게 된다.
피치 변조부(24)의 음향특성 제어부에서는 음향신호 특성에 해당하는 부분을 식(2)에서와 같이 음원의 위치를 기준으로 일정한 길이의 창함수(window)를 씌워서 신호를 변조시킨다. 이는 나중에 음성합성시에 음원의 삭제 및 첨가에 의하여 신호가 변조된 경우에도 매끄러운 음향신호를 생성하기 위한 처리과정이다.
여기에서, xm(n)은 변조된 음향신호이고, hm(n)은 창함수이고, tm은 음원의 위치이고, x(n)은 입력된 음향신호(시간축 n에서의 음량)이다.
마지막으로, 합성부 과정이 이루어지는 음원합성 회로(25)에서는 위의 변조부 과정에 의하여 변조된 음원 성분과 음향신호 특성을 이용하여 변속된 음성신호 x(n)을 구한다. 이를 식으로 나타내면 아래의 식(3)과 같이 나타낼 수 있다.
여기에서, αq는 합성음량 조절변수이고, xq(n)=xm(n-δq)은 변조된 음향특성이고, hq(n)은 창함수이고, tq는 변조된 음원의 위치이고, δq는 재생속도 결정변수이다.
변속된 음성신호 x(n)은, 출력버퍼(26)를 거쳐서 디지틀 애널로그 컨버터(27)에 의하여 애널로그 신호(Audio Out)로 변환된 뒤에 출력된다.
본 방식에 의하여 음향을 재생할 경우에는 재생속도는 변화시키더라도 재생시키고자 하는 음성의 음색을 그대로 유지하면서 사람이 빨리 또는 천천히 발생하는 것처럼 들을 수가 있다.
따라서, VTR 플레이어와 같이 영상화면을 빠르게 재생하여 검색 또는 모니터링하는 경우, 기존의 VTR 플레이어처럼 음색이 변하여 듣기가 거북하거나 또는 음향신호의 손실로 시청자가 답답함이 느껴지지 않고 원래의 음색으로 빠르게 말하는 것과 같은 재생음을 얻을 수가 있다.
그외에도 멀티미디어 장비의 고속 스캐닝과 같은 응용에 적합할 것으로 예상된다. 앞으로 멀티미디어 시장의 성장과 함께 본 기술의 활용이 다양해질 것으로 생각된다.
이상에서와 같이 이 발명의 실시예에서, 음향 재생장치(테이프 플레이어, VTR, 멀티미디어 장비, 컴퓨터 등)로부터 저장된 음성 또는 음향을 재생할 경우에 음향의 재생속도를 변경하게 됨으로써 발생하게 되는 음색의 변질 및 손실을 방지하고, 상기한 음성을 사람이 빨리 또는 천천히 이야기하는 것처럼 들리도록 음향의 재생속도를 조절하여 재생시킬 수 있는 효과를 가진 음향 변속 재생장치를 제공할 수가 있다.
이 발명의 이러한 효과는 각종 음향 재생장치의 설계, 제조, 판매 등의 분야에서 이용될 수가 있다.
Claims (4)
- 명령어가 저장되어 있는 명령어 기억회로와, 프로그램, 데이터 버스에 연결되어 있으며, 음향신호 데이터가 저장되어 있는 기억장치와, 상기한 명령어 기억회로에 저장되어 있는 명령어를 순차적으로 읽어들여 이를 해독함으로써 각 부분을 제어하기 위한 제어신호를 프로그램 버스를 통해서 출력하는 주제어기와, 상기한 주제어기의 제어신호에 따라, 애널로그 입력신호를 디지틀 신호로 변환하여 출력하는 애널로그/디지틀 컨버터와, 상기한 애널로그/디지틀 컨버터의 디지틀 출력신호가 일시 저장되는 입력버퍼와, 상기한 주제어기의 제어신호에 따라, 상기한 입력버퍼를 통해서 입력되는 신호로부터 음원이 되는 부분과 음향신호 특성에 해당하는 부분으로 분리하여 출력하는 피치검출 회로와, 상기한 주제어기의 제어신호에 따라, 상기한 피치검출 회로에서 분리된 음향신호로부터 추출된 음원성분을 재생하고자 하는 속도에 따라 삭제 또는 첨가하여 음향신호의 길이를 조절하고, 음원의 위치를 기준으로 일정한 길이의 창함수를 씌워서 신호를 변조하여 출력하는 피치 변조부와, 상기한 주제어기의 제어신호에 따라, 상기한 피치 변조부에 의하여 변조된 음원 성분과 음향신호 특성을 이용하여 변속된 음성신호를 산출하여 출력하는 음성합성 회로와, 상기한 음성합성 회로로부터 입력되는 변속된 음성신호를 일시 저장하는 출력버퍼와, 상기한 주제어기의 제어신호에 따라, 디지틀 변속신호를 애널로그 신호로 변환하여 출력하는 디지틀/애널로그 컨버터로 이루어지는 것을 특징으로 하는 음향 변속 재생장치.
- 제1항에 있어서, 상기한 피치 검출회로부는 다음의 수식에 의하여 음원성분을 추출하는 것을 특징으로 하는 음향 변속 재생장치.여기에서, x(n)은 입력된 원래의 신호(시간축 n에서의 음량)이고, tm은 m번째 음원의 위치이고, δ은 음원위치의 허용범위(tolerance region around tm)이다.
- 제1항에 있어서, 상기한 피치 변조부는 음향신호 특성에 해당하는 부분을 다음의 수식에서와 같이 음원의 위치를 기준으로 일정한 길이의 창함수를 씌워서 신호를 변조시키는 것을 특징으로 하는 음향 변속 재생장치.xm(n)=hm(tm-n)x(n)여기에서, xm(n)은 변조된 음향신호이고, hm(n)은 창함수이고, tm은 음원의 위치이고, x(n)은 입력된 음향신호(시간축 n에서의 음량)이다.
- 제1항에 있어서, 상기한 음원합성 회로는 다음의 수식과 같이 변조된 음원 성분과 음향신호 특성을 이용하여 변속된 음성신호 x(n)을 구하는 것을 특징으로 하는 음향 변속 재생장치.여기에서, αq는 합성음량 조절변수이고, xq(n)-xm(n-δq)은 변조된 음향특성이고, hq(n)은 창함수이고, tq는 변조된 음원의 위치이고, δq는 재생속도 결정변수이다.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019940024514A KR0129829B1 (ko) | 1994-09-28 | 1994-09-28 | 음향 변속 재생장치 |
GB9519586A GB2293741B (en) | 1994-09-28 | 1995-09-26 | Speed-variable audio play-back apparatus |
JP7249848A JPH08190400A (ja) | 1994-09-28 | 1995-09-27 | 音響変速再生装置 |
US08/535,517 US5781696A (en) | 1994-09-28 | 1995-09-28 | Speed-variable audio play-back apparatus |
CNB95118654XA CN1143293C (zh) | 1994-09-28 | 1995-09-28 | 声音变速播放装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019940024514A KR0129829B1 (ko) | 1994-09-28 | 1994-09-28 | 음향 변속 재생장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR0129829B1 true KR0129829B1 (ko) | 1998-04-17 |
Family
ID=19393736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019940024514A KR0129829B1 (ko) | 1994-09-28 | 1994-09-28 | 음향 변속 재생장치 |
Country Status (5)
Country | Link |
---|---|
US (1) | US5781696A (ko) |
JP (1) | JPH08190400A (ko) |
KR (1) | KR0129829B1 (ko) |
CN (1) | CN1143293C (ko) |
GB (1) | GB2293741B (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100337996B1 (ko) * | 1999-02-27 | 2002-05-24 | 허진호 | 음성신호재생속도제어장치및제어방법 |
KR100677950B1 (ko) * | 2005-06-09 | 2007-02-05 | 주식회사 아이웨어 | 음성신호를 보존하는 재생속도 가변 장치 및 방법 |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2305830B (en) * | 1995-09-30 | 1999-09-22 | Ibm | Voice processing system and method |
JP3910702B2 (ja) * | 1997-01-20 | 2007-04-25 | ローランド株式会社 | 波形発生装置 |
JP4170458B2 (ja) | 1998-08-27 | 2008-10-22 | ローランド株式会社 | 波形信号の時間軸圧縮伸長装置 |
US6323797B1 (en) | 1998-10-06 | 2001-11-27 | Roland Corporation | Waveform reproduction apparatus |
JP2001075565A (ja) | 1999-09-07 | 2001-03-23 | Roland Corp | 電子楽器 |
JP2001084000A (ja) | 1999-09-08 | 2001-03-30 | Roland Corp | 波形再生装置 |
JP4293712B2 (ja) * | 1999-10-18 | 2009-07-08 | ローランド株式会社 | オーディオ波形再生装置 |
JP2001125568A (ja) | 1999-10-28 | 2001-05-11 | Roland Corp | 電子楽器 |
US7010491B1 (en) | 1999-12-09 | 2006-03-07 | Roland Corporation | Method and system for waveform compression and expansion with time axis |
US7136571B1 (en) | 2000-10-11 | 2006-11-14 | Koninklijke Philips Electronics N.V. | System and method for fast playback of video with selected audio |
US20050209847A1 (en) * | 2004-03-18 | 2005-09-22 | Singhal Manoj K | System and method for time domain audio speed up, while maintaining pitch |
US8032360B2 (en) * | 2004-05-13 | 2011-10-04 | Broadcom Corporation | System and method for high-quality variable speed playback of audio-visual media |
JP4096915B2 (ja) * | 2004-06-01 | 2008-06-04 | 株式会社日立製作所 | デジタル情報再生装置及び方法 |
US7750229B2 (en) * | 2005-12-16 | 2010-07-06 | Eric Lindemann | Sound synthesis by combining a slowly varying underlying spectrum, pitch and loudness with quicker varying spectral, pitch and loudness fluctuations |
WO2008035829A1 (en) * | 2006-09-22 | 2008-03-27 | I-Ware Inc., Ltd. | Apparatus and method for playback speed altering with preservation of tone signal |
JP4952469B2 (ja) * | 2007-09-19 | 2012-06-13 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
US20160071524A1 (en) * | 2014-09-09 | 2016-03-10 | Nokia Corporation | Audio Modification for Multimedia Reversal |
JP6646001B2 (ja) * | 2017-03-22 | 2020-02-14 | 株式会社東芝 | 音声処理装置、音声処理方法およびプログラム |
JP2018159759A (ja) | 2017-03-22 | 2018-10-11 | 株式会社東芝 | 音声処理装置、音声処理方法およびプログラム |
US10708633B1 (en) | 2019-03-19 | 2020-07-07 | Rovi Guides, Inc. | Systems and methods for selective audio segment compression for accelerated playback of media assets |
US11102523B2 (en) | 2019-03-19 | 2021-08-24 | Rovi Guides, Inc. | Systems and methods for selective audio segment compression for accelerated playback of media assets by service providers |
US11039177B2 (en) * | 2019-03-19 | 2021-06-15 | Rovi Guides, Inc. | Systems and methods for varied audio segment compression for accelerated playback of media assets |
CN112750456A (zh) * | 2020-09-11 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 即时通信应用中的语音数据处理方法、装置及电子设备 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4164626A (en) * | 1978-05-05 | 1979-08-14 | Motorola, Inc. | Pitch detector and method thereof |
US4624012A (en) * | 1982-05-06 | 1986-11-18 | Texas Instruments Incorporated | Method and apparatus for converting voice characteristics of synthesized speech |
AU574104B2 (en) * | 1983-09-09 | 1988-06-30 | Sony Corporation | Apparatus for reproducing audio signal |
US4783807A (en) * | 1984-08-27 | 1988-11-08 | John Marley | System and method for sound recognition with feature selection synchronized to voice pitch |
US5365592A (en) * | 1990-07-19 | 1994-11-15 | Hughes Aircraft Company | Digital voice detection apparatus and method using transform domain processing |
JPH04168499A (ja) * | 1990-10-31 | 1992-06-16 | Sanyo Electric Co Ltd | 時間軸圧縮伸長装置 |
KR940001861B1 (ko) * | 1991-04-12 | 1994-03-09 | 삼성전자 주식회사 | 오디오 대역신호의 음성/음악 판별장치 |
DE69214882T2 (de) * | 1991-06-06 | 1997-03-20 | Matsushita Electric Ind Co Ltd | Gerät zur Unterscheidung von Musik und Sprache |
US5457769A (en) * | 1993-03-30 | 1995-10-10 | Earmark, Inc. | Method and apparatus for detecting the presence of human voice signals in audio signals |
-
1994
- 1994-09-28 KR KR1019940024514A patent/KR0129829B1/ko not_active IP Right Cessation
-
1995
- 1995-09-26 GB GB9519586A patent/GB2293741B/en not_active Expired - Fee Related
- 1995-09-27 JP JP7249848A patent/JPH08190400A/ja active Pending
- 1995-09-28 US US08/535,517 patent/US5781696A/en not_active Expired - Fee Related
- 1995-09-28 CN CNB95118654XA patent/CN1143293C/zh not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100337996B1 (ko) * | 1999-02-27 | 2002-05-24 | 허진호 | 음성신호재생속도제어장치및제어방법 |
KR100677950B1 (ko) * | 2005-06-09 | 2007-02-05 | 주식회사 아이웨어 | 음성신호를 보존하는 재생속도 가변 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
GB2293741B (en) | 1999-05-19 |
GB2293741A (en) | 1996-04-03 |
CN1127916A (zh) | 1996-07-31 |
CN1143293C (zh) | 2004-03-24 |
US5781696A (en) | 1998-07-14 |
JPH08190400A (ja) | 1996-07-23 |
GB9519586D0 (en) | 1995-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR0129829B1 (ko) | 음향 변속 재생장치 | |
US5862232A (en) | Sound pitch converting apparatus | |
US20160071429A1 (en) | Method of Presenting a Piece of Music to a User of an Electronic Device | |
KR100375329B1 (ko) | 음원제어장치및음원제어방법 | |
US8314321B2 (en) | Apparatus and method for transforming an input sound signal | |
KR100251497B1 (ko) | 음성신호 변속재생방법 및 그 장치 | |
Dutilleux et al. | Time‐segment Processing | |
JP3620787B2 (ja) | 音声データの符号化方法 | |
Canfer | Music Technology in Live Performance: Tools, Techniques, and Interaction | |
JP3552675B2 (ja) | 波形生成方法及び装置 | |
KR100359988B1 (ko) | 실시간 화속 변환 장치 | |
JP3613191B2 (ja) | 波形生成方法及び装置 | |
JPH07287576A (ja) | 音楽再生方法 | |
KR0162422B1 (ko) | 자동 반주기의 음성합성 장치 | |
von Doehren | Time is Ticking, Expressing Grief Through Time: Exploring the Production and Creative Techniques for a Composition for Flute and Electronics | |
Dofat | Introduction to Digital Audio | |
Exarchos et al. | Audio processing | |
JP3000567U (ja) | 電子音楽再生装置 | |
JPH11133996A (ja) | 音程変換装置 | |
JPH0644686A (ja) | 光ディスク及び音場再生装置 | |
Grew | A guide to electro-acoustic performance for the acoustic oboist | |
JP2962777B2 (ja) | 音声信号の時間軸伸長圧縮装置 | |
JP3876896B2 (ja) | 波形生成方法及び装置 | |
Rothstein | Twelve Tone Systems Cakewalk Sequencer Software | |
JPH07152386A (ja) | カラオケ装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20101028 Year of fee payment: 14 |
|
LAPS | Lapse due to unpaid annual fee |