KR100768457B1 - 오디오 속도 변환을 가능하게 하는 시스템 및 방법 - Google Patents

오디오 속도 변환을 가능하게 하는 시스템 및 방법 Download PDF

Info

Publication number
KR100768457B1
KR100768457B1 KR1020037001764A KR20037001764A KR100768457B1 KR 100768457 B1 KR100768457 B1 KR 100768457B1 KR 1020037001764 A KR1020037001764 A KR 1020037001764A KR 20037001764 A KR20037001764 A KR 20037001764A KR 100768457 B1 KR100768457 B1 KR 100768457B1
Authority
KR
South Korea
Prior art keywords
signal
audio signal
rate
speed
processing
Prior art date
Application number
KR1020037001764A
Other languages
English (en)
Other versions
KR20030018071A (ko
Inventor
메가이드매그디
Original Assignee
톰슨 라이센싱
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 톰슨 라이센싱 filed Critical 톰슨 라이센싱
Publication of KR20030018071A publication Critical patent/KR20030018071A/ko
Application granted granted Critical
Publication of KR100768457B1 publication Critical patent/KR100768457B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • G10L21/043Time compression or expansion by changing speed

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Television Receiver Circuits (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Systems (AREA)

Abstract

본 발명의 오디오 속도 변환기는 관련 정보의 손실없이 오디오 속도 변화를 제공하며, 출력 오디오와 비디오 신호 간에 우수한 동기를 제공하여 비디오 시스템에 사용되기에 적합하다. 전형적인 실시예에 따르면, 오디오 신호를 처리하는 시스템은 오디오 신호를 제1 속도율에서 수신하여 그 수신된 오디오 신호를 복수의 제어 신호에 따라 처리하는 제1 프로세서를 포함한다. 각각의 제어 신호는 다른 기준 파라미터의 레벨을 표시한다. 제1 프로세서는 수신된 오디오 신호의 출력을 처리에 따라 제2 속도율에서 제공한다. 속도율 비교기는 제2 속도와 요구되는 속도율을 비교하여 그 비교에 따라 비교 신호를 생성한다. 제2 프로세서는 그 비교 신호에 따라 제어 신호를 생성한다.

Description

오디오 속도 변환을 가능하게 하는 시스템 및 방법{SYSTEM AND METHOD FOR ENABLING AUDIO SPEED CONVERSION}
본 발명은 일반적으로 오디오 속도 변환에 관한 것으로서, 보다 구체적으로는 음성 속도 변환과 같은 오디오 속도 변환을 가능하게 하는 시스템 및 방법에 관한 것이다.
속도 변환 시스템은 컬러 텔레비전(CTV) 시스템, 비디오 테이프 레코더(VTR), DVD(Digital Video/versatile Disk) 시스템, 컴팩트 디스크(CD) 플레이어, 보청기, 전화 응답기 등의, 비디오 및/또는 오디오 재생 시스템에서 다중 속도 조절(예컨대, 고속, 저속 등)을 가능하게 하는데 이용될 수 있다. 종래의 오디오 속도 변환기는 일반적으로 오디오 신호의 무음 구간과 유음 구간을 구별한다. 그 무음 구간을 삭제하고 유음 구간을 압축하면 오디오 속도가 상승하는 반면에, 무음 구간과 유음 구간을 신장하면 오디오 속도가 느려진다.
일부 경우에서는, 출력 오디오 신호는 일정한 속도율로 생성되는 출력 비디오 신호와 동기되어야만 한다. 그러한 경우에, 출력 오디오 신호의 속도를 제어하는 것이 필요하며, 이러한 속도 제어는 종종 입력 오디오 신호의 용장도(redundancy amount)를 알 수 없기 때문에 어려움이 있다. 종래의 오디오 속도 변환기는 입력 오디오 신호를 고정 길이의 프레임으로 분할하여 각 프레임을 소정의 지속 시간으로 압축함으로써 이러한 문제를 해결한다. 예를 들어, 오디오 출력 속도가 정상 속도의 2배(2x)로 설정되면, 변환기는 각각의 프레임을 원래의 지속 시간의 1/2로 압축한다. 그 각각의 프레임이 상이한 오디오 내용을 나타내기 때문에, 그 프레임의 일부는 적합하게 신호를 압축하는데 필요한 충분한 무음 및 용장 구간을 가질 수 없다. 그러한 경우에, 변환기는 원하는 오디오 속도에 도달하기 위하여 하나 이상의 프레임의 일부를 삭제한다. 그 결과, 출력 오디오 속도는 거의 일정하게 유지되고 각 프레임의 끝에서 조절될 수 있다. 이러한 종래의 속도 제어 형태는 도 1에 그래프로 도시된다.
도 1의 그래프(60)는 시간에 따른 비디오 속도(점선으로 표시)와 오디오 속도(실선으로 표시) 사이의 전형적인 관계를 나타내고 있다. 도 1에 도시되는 바와 같이, 비디오 속도와 오디오 속도 사이의 동기는 하나 이상의 오디오 프레임의 일부를 삭제함으로써 이루어진다. 따라서, 실제의 동기는 각 프레임의 끝에서만 행해지지만, 프레임 기간의 나머지 동안에는 반드시 그렇지는 않다. 이러한 종래의 속도 제어 형태는, 출력 오디오 신호의 부분들을 청취자가 이해하지 못할 수 있기 때문에 종종 만족스러운 결과를 제공하지 못한다. 따라서, 이러한 형태의 종래의 오디오 속도 변환기는 비디오 테이프 레코더(VTR)의 빨리 감기 동작과 같은 제한된 수의 용도에서만 이용되어야 한다.
전술한 종래 기술의 문제점에서 볼 때, 개선된 오디오 속도 변환기가 필요하다고 인식된다. 특히, 바람직하게는 관련 정보의 손실없이 오디오 속도 변화를 수용하는 오디오 속도 변환기를 제공하는 것이 좋다. 또한, 바람직하게는 출력 오디오와 비디오 신호 사이에 우수한 동기를 제공하기 위해서 비디오 시스템에 사용하기에 적합한 오디오 속도 변환기가 좋다. 본 발명은 이러한 문제 및 기타 문제를 해결할 수 있도록 고려된 것이다.
본 발명의 특징에 따르면, 오디오 신호를 처리하는 시스템은 제1 속도율(rate of speed)에서 오디오 신호를 수신하여 그 수신된 오디오 신호를 복수의 제어 신호에 따라 처리하는 제1 처리 수단을 포함한다. 각각의 제어 신호는 다른 기준 파라미터의 레벨을 표시한다. 제1 처리 수단은 그 수신된 오디오 신호의 출력을 그 처리에 따라 제2 속도율에서 제공한다. 비교 수단은 제2 속도율과 요구되는 속도율을 비교하여, 그 비교에 따라 비교 신호를 발생한다. 제2 처리 수단은 그 비교 신호에 따라 제어 신호를 발생한다.
본 발명의 또 다른 특징에 따르면, 오디오 신호를 처리하는 방법은 제1 속도율에서 오디오 신호를 수신하는 단계를 포함한다. 그 수신된 오디오 신호는 다른 기준 파라미터의 레벨을 각각 표시하는 복수의 제어 신호에 따라 처리된다. 그 수신된 오디오 신호는 그 처리에 따라 제2 속도율에서 출력된다. 제2 속도율은 요구되는 속도율과 비교되고, 그 비교에 따라 비교 신호가 발생된다. 제어 신호는 그 비교 신호에 따라 발생된다.
도 1은 종래의 속도 제어 기술에 따른 비디오 속도와 오디오 속도 사이의 전형적인 관계를 나타내는 그래프이다.
도 2는 본 발명의 원리에 따라 구성된 오디오 속도 변환기를 나타내는 도면이다.
도 3은 본 발명의 원리에 따라 구성된 오디오 속도 변환기를 포함하는 전형적인 시스템이다.
도 4는 전형적인 입력 오디오 신호의 기준 파라미터 레벨을 나타내는 그래프이다.
도 5는 출력 오디오 음질과 기준 파라미터(PREF)의 레벨 사이의 전형적인 관계를 나타내는 그래프이다.
도 6은 개방 루프 시스템과 폐루프 시스템 사이의 전형적인 비교를 나타내는 그래프이다.
본 명세서에서 설명하는 예증은 본 발명의 양호한 실시예를 나타내며, 상기 예증은 어떠한 방식으로도 본 발명의 범위를 제한하는 것으로서 해석되어서는 안된다.
본 출원은 관련 정보의 손실없이 오디오 속도 변화를 제공하며, 출력 오디오와 비디오 신호 간에 우수한 동기를 제공하여 비디오 시스템에 사용되기에 적합한, 오디오 신호를 처리하는 시스템 및 방법을 개시한다. 전형적인 실시예에 따르면, 이 시스템은 제1 속도율에서 오디오 신호를 수신하여 그 수신된 오디오 신호를 복수의 제어 신호에 따라 처리하는 제1 처리 수단을 포함한다. 각각의 제어 신호는 다른 기준 파라미터의 레벨을 나타낸다. 제1 처리 수단은 수신된 오디오 신호의 출력을 그 처리에 따라 제2 속도율로 제공한다. 전형적인 실시예에 따르면, 제1 처리 수단은 수신된 오디오 신호를 압축하거나 신장함으로써 수신된 오디오 신호를 처리한다. 비교기 수단은 제2 속도율과 요구되는 속도율을 비교하여, 그 비교에 따라 비교 신호를 발생한다. 제2 처리 수단은 그 비교 신호에 따라 제어 신호를 발생한다. 전형적인 실시예에 따르면, 제어 신호에 의해 표시되는 기준 파라미터 중 하나는 평균 전력(average power)이다. 시스템은 원하는 속도를 사용자가 입력할 수 있도록 하는 입력 수단, 및/또는 비디오 신호를 상기 제2 속도율에 동기함으로써 비디오 신호를 처리하는 수단을 포함할 수도 있다. 전술한 시스템에 의해 수행되는 방법도 본 명세서에서 설명된다.
이제 도면을 참조하면, 특히 도 2에서는 본 발명의 원리에 따라 구성된 오디오 속도 변환기(10)가 도시되어 있다. 도 2에서, 오디오 속도 변환기(10)는 파라미터 종속 프로세서(parameter-dependent processor)(11)와 같은 제1 처리 수단을 포함한다. 파라미터 종속 프로세서(11)는 음성 신호와 같은 입력 오디오 신호를 제1 속도율(SIN)로 수신한다. 파라미터 종속 프로세서(11)는 그 수신된 오디오 신호를 복수의 제어 신호에 따라 압축하거나 신장함으로써 그 수신된 오디오 신호를 처리하여, 제2 속도율(SOUT)로 출력 오디오 신호를 발생한다. 양호한 실시예에 따르면, 각각의 제어 신호는 다른 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN)의 레벨을 나타낸다.
속도율 비교기(12)와 같은 비교 수단은 파라미터 종속 프로세서(11)로부터 출력 오디오 신호를 수신하여 그 속도를 검출한다. 사용자 인터페이스(13)와 같은 입력 수단은 지정되거나 요구되는 속도율(m)을 사용자가 입력하게 함으로써 속도 제어와 같은 다양한 기능을 가능하게 한다. 속도율 비교기(12)는 출력 오디오 신호의 검출된 속도(SOUT)와 요구되는 속도율(m)을 비교하여, 그 비교 결과에 기초하여 비교 신호를 발생한다.
파라미터 프로세서(14)와 같은 제2 처리 수단은 속도율 비교기(12)로부터 비교 신호를 수신한다. 파라미터 프로세서(14)는 그 수신된 비교 신호에 따라 제어 신호를 발생한다. 각각의 제어 신호는 다른 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN)의 레벨을 표시한다. 제어 신호는 파라미터 종속 프로세서(11)에 동시에 입력되어 파라미터 종속 프로세서(11)의 신호 압축 및 신장 동작을 제어한다. 후술하겠지만, 오디오 속도 변환기(10)의 폐루프 설계는 입력 오디오 신호의 내용에 기초해서 오디오 속도를 적응적으로 제어하기에 유용하다. 오디오 속도 변환기(10)는 또한 도 3에 도시되는 바와 같이, 오디오 및 비디오 재생 기능을 모두 갖춘 시스템에 내장될 수도 있다.
도 3을 참조하게 되면, 본 발명의 원리에 따라 구성된 오디오 속도 변환기(10)를 포함하는 전형적인 시스템(100)이 도시된다. 도 3에서, 그 시스템(100)은 도 2에 도시되는 오디오 속도 변환기(10)와, 비디오 속도 변환기(20)를 포함하는 오디오/비디오 시스템이다. 도 3의 시스템(100)에서, 출력 비디오 신호는 출력 오디오 신호와 같은 속도를 나타내는 것이 바람직하다. 그러므로, 최적의 비디오 동기를 위해, 비디오 속도 변환기(20)는 출력 오디오 신호의 순간 속도에 관한 정보를 이용해서 출력 비디오 신호의 속도를 제어한다. 일 실시예에 따르면, 이 정보는 도 3에 도시되는 바와 같이, 파라미터 종속 프로세서(11)의 출력을 통해 디지털 데이터로서 비디오 속도 변환기(20)에 제공된다. 일 실시예에 따르면, 오디오 속도 변환기(10)는 "마스터"로서 동작하고 비디오 속도 변환기(20)는 "슬레이브"로서 동작한다.
본 발명의 원리에 따라 구성된 오디오 속도 변환기(10)의 동작에 대한 추가 세부 사항은 도 2 내지 도 6을 참조하여 이제 설명할 것이다.
전술한 바와 같이, 도 2와 도 3에서 오디오 속도 변환기(10)의 파라미터 종속 프로세서(11)는 제1 속도율(SIN)에서 입력 오디오 신호를 수신한다. 이 파라미터 종속 프로세서(11)는 그 수신된 오디오 신호를 복수의 제어 신호에 따라 압축 또는 신장함으로써 그 수신된 오디오 신호를 처리한다. 각각의 제어 신호는 다른 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN)의 레벨을 표시한다. 파라미터 종속 프로세서(11)에 의해 수행되는 처리에 의해 제2 속도율(SOUT)에서 출력 오디오 신호가 생성된다. 구체적으로, 수신 오디오 신호를 압축하게 되면 출력 오디오 신호의 속도를 증가시키는 기능을 하게 되는 반면, 수신 오디오 신호를 신장하게 되면 출력 오디오 신호의 속도를 저하시키는 기능을 하게 된다.
속도율 비교기(12)는 출력 오디오 신호를 수신하여 그 속도를 검출한다. 즉, 속도율 비교기(12)는 제2 속도율(SOUT)을 검출한다. 속도율 비교기(12)는 또한 요구되는 속도율(m)을 표시하는 입력 신호를 사용자 인터페이스(13)로부터 수신한다. 사용자 인터페이스(13)는 지정되거나 요구되는 속도율(m)을 사용자가 입력할 수 있는 키패드, 원격 제어기 등과 같은 임의 형태의 입력 수단으로서 포함될 수 있다. 속도율 비교기(12)는 출력 오디오 신호의 검출된 속도(SOUT)와 요구되는 속도율(m)을 비교하여 그 결과에 기초하여 비교 신호를 생성한다. 전형적인 실시예에 따르면, 속도율 비교기(12)는 요구된 속도율(m)에 아직 도달하지 못했음을 알리기 위해 비교 신호를 2진 로우 신호로서 생성한다. 반대로, 속도율 비교기(12)는 요구된 속도율(m)이 초과했음을 알리기 위해 비교 신호를 2진 하이 신호로서 생성한다.
파라미터 프로세서(14)는 속도율 비교기(12)로부터 비교 신호를 수신하고, 그 수신된 비교 신호에 따라 제어 신호를 발생한다. 각각의 제어 신호는 다른 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN)의 레벨을 표시한다. 제어 신호는 파라미터 종속 프로세서(11)에 동시에 입력되어, 파라미터 종속 프로세서(11)의 신호 압축 및 신장 동작을 제어하는데 이용된다. 전형적인 실시예에 따르면, 각각의 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN)는 오디오 신호의 다른 독립 파라미터를 표시한다. 예를 들어, 제1 기준 파라미터(PREF1)는 그 수신된 오디오 신호의 평균 전력을 표시할 수 있다. 제2 기준 파라미터(PREF2)는, 예컨대 수신된 오디오 신호의 2개의 연속 피치 기간(pitch period) 간의 유사성을 표시할 수 있다. 제3 기준 파라미터(PREF3)는 수신된 오디오 신호의 2개의 연속 피치 기간에 포함된 사이클 수의 차이를 나타낸다. 물론 본 발명의 원리에 따라 다른 파라미터도 사용될 수 있다.
평균 전력은 유효한 입력 오디오 신호와 잡음 신호를 구별하는데 특히 유용한 파라미터이다. 유효한 입력 오디오 신호와 잡음 신호를 구별하는 임계값은 기준 파라미터(PREF)의 레벨에 의해 일반적으로 정해질 수 있다. 전형적인 기준 파라미터(PREF)에 관한 추가 세부 사항은 도 4를 참조하여 이제 설명할 것이다.
도 4를 참조하면, 전형적인 입력 오디오 신호의 파라미터 레벨을 나타내는 그래프(30)가 도시된다. 예시적으로, 도 4에 도시된 파라미터는 전형적인 입력 오디오 신호의 평균 전력 레벨에 대응할 수 있다. 도 4에서, 평균 전력 파라미터 레벨(PAVERAGE)은 시간에 따라 기준 파라미터(PREF)의 레벨의 상하로 변동한다. 평균 파라미터 레벨(PAVERAGE)과 기준 파라미터(PREF)는 디지털값으로 표현될 수 있다. 평균 파라미터 레벨(PAVERAGE)이 기준 파라미터(PREF)의 레벨보다 높다면, 그 대응하는 신호를 유효한 오디오 신호라고 간주할 수 있다. 그렇지만, 그 신호가 잡음 신호라고 간주되면, 그에 따라 제거될 수 있다.
도 4에 도시하는 바와 같이, 특정 기준 파라미터(PREF)의 레벨이 너무 높게 설정되어 있다면(점선으로 표시), 입력 오디오 신호의 상승 부분이 잡음 신호로 간주될 수 있어, 결국 제거된다. 다른 방법으로서, 기준 파라미터(PREF)의 레벨이 너무 낮게 설정되어 있다면(파선으로 표시), 효과적인 잡음 검출이 매우 어려워진다. 실제로, 소정의 기준 파라미터(PREF)의 레벨은 임의적이지만, 결국 출력 오디오 신호의 음질에 영향을 미치기 때문에 설계상의 선택에 따라 주의해서 선택되어야 한다. 소정의 기준 파라미터(PREF)의 적합한 레벨은 출력 오디오 신호의 음질을 열화시키는 일없이 좁은 허용 범위 내에 존재할 수 있다고 알려져 있다. 소정의 기준 파라미터(PREF)에 대한 이러한 허용 범위의 예는 도 4에서 음영 부분으로 표시된다.
도 5를 참조하게 되면, 출력 오디오 음질(청취자가 이해할 수 있는 특성)과 기준 파라미터(PREF)의 레벨 사이의 전형적인 관계가 도시된다. 도 5에 나타낸 바와 같이, 기준 파라미터(PREF)에 대한 허용 범위가 초과하면 유효한 오디오 신호가 손실되기 때문에 출력 오디오 신호의 음질이 극적으로 열화할 수 있다. 각 기준 파라미터(PREF)의 레벨은 또한 압축율에 영향을 끼쳐, 결국 오디오 출력 속도에 영향을 줄 수 있다는 점에 주목하는 것이 중요하다. 예를 들어, 소정의 시간 간격 동안에, 높은 임계 기준 파라미터(PREF)를 이용하는 오디오 속도 변환기는 더 낮은 임계 기준 파라미터(PREF)를 이용하는 오디오 속도 변환기보다 더 많은 잡음을 제거한다. 전술한 바와 같이, 본 발명은 복수의 다른 독립 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN)를 이용하여 오디오(즉, 사운드)의 용장도를 검출한다.
도 2와 도 3을 다시 참조하면, 파라미터 프로세서(14)는 속도 변환기(12)에 의해 발생된 비교 신호에 응답하여 제어 신호를 생성하는데, 각각의 제어 신호는 복수의 다른 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN) 중 하나의 레벨을 표시한다. 전형적인 실시예에 따르면, 파라미터 프로세서(14)는 "N"개의 다른 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN)를 사용하고, 그 각각의 파라미터는 개별 디지털값으로 표현된다. 기준 파라미터의 개수("N")는 설계상의 선택의 문제로서 선택될 수 있다. 사실상, 다른 각각의 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN)의 분해능(resolution)은 반드시 같을 필요가 없다. 예를 들어, 제1 기준 파라미터(PREF1)의 레벨은 8비트 디지털값으로 표현될 수 있지만, 제2 기준 파라미터(PREF2)의 레벨은 14비트 디지털값으로 표현될 수 있다.
파라미터 프로세서(14)는 속도율 비교기(12)에 의해 발생된 비교 신호에 따라 각각의 개별 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN)의 레벨을 변경하기 위해 제어 신호를 생성한다. 즉, 파라미터 프로세서(14)는 비교 신호에 따라 각각의 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN)의 레벨을 변경하여 요구되는 속도율(m)을 달성한다. 예를 들어, 요구 속도율(m)을 달성하기 위해서, 파라미터 프로세서(14)는, 제1 기준 파라미터(PREF1)가 (PREF1 +/- ΔPREF1)가 되고, 제2 기준 파라미터(PREF2)가 (PREF2 +/- ΔPREF2)가 되고, 제3 기준 파라미터(PREF3)가 (PREF3 +/- ΔPREF3)되며, 제N 기준 파라미터(PREFN)가 (PREFN +/- ΔPREFN)가 되도록 제어 신호를 생성한다. 상기 식에서, 오디오 속도의 상승은 기준 파라미터 레벨의 상승을, 그리고 이와 반대로 되는 것을 요구하지 않기 때문에 "+/-"이 필요하다. 또한, 도 2와 도 3은 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN) 각각에 대한 개별 출력 라인을 갖는 것으로서 파라미터 프로세서(14)를 도시하고 있지만, 제어 신호를 연속으로 전송함으로써 사실상 상기 출력 라인의 수를 줄이는 것이 가능하다는 점에 주목해야 한다.
예를 들어, 도 2와 도 3에서 오디오 속도 변환기(10)는 어떠한 속도 조절(즉, m=1) 없이도 정상적으로 동작하고 있다고 가정한다. 이 상황에서, 사용자 인터페이스(13)를 통해 사용자가 요구 속도율(m)을 2(즉, 정상 속도의 2배)로 입력하면, 오디오 속도 변환기(10)는 출력 오디오 신호의 속도(SOUT)를 요구 속도율(m)까지 상승시키도록 동작한다.
원하는 속도 변화를 달성하기 위하여, 속도율 비교기(12)는 사용자 인터페이스(13)를 통해 사용자 입력을 수신하고, 처음에, 출력 오디오 신호의 속도(SOUT)가 아직 요구 속도율(m), 즉 2에 미치지 못했다고 검출한다. 따라서, 속도율 비교기(12)는 2진 로우 신호로서 비교 신호를 생성하여 요구 속도율(m)에 아직 미치지 못했다고 알린다. 파라미터 비교기(14)는 2진 로우 상태의 비교 신호를 수신하고, 요구 속도율(m)에 아직 미치지 못했다고 알리기 위해 제어 신호를 생성하여 응답한다. 즉, 파라미터 프로세서(14)는 제어 신호를 생성하여 요구 속도율(m)에 부합하게 기준 파라미터의 레벨을 변경한다. 제어 신호에 의해 이어서 파라미터 종속 프로세서(11)는 신호 압축율을 상승시킴으로써 출력 오디오 신호의 속도(SOUT)를 상승시킨다.
속도율 비교기(12)는 출력 오디오 신호의 상승된 속도(SOUT)를 검출하고, 출력 오디오 신호의 검출 속도(SOUT)가 요구 속도율(m)보다 낮다면 비교 신호를 2진 로우 신호로서 계속 생성한다. 같은 방식으로, 파라미터 프로세서(14)는 요구 속도율(m)에 부합하게 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN)의 레벨을 변경하기 위해 계속해서 제어 신호를 생성한다. 그리고 이것에 의해 파라미터 종속 프로세서(11)는 신호 압축율을 상승시킴으로써 출력 오디오 신호의 속도(SOUT)를 추가로 상승시킨다. 이 프로세스는 속도율 비교기(12)가 요구 속도율(m)이 초과되었음을 검출하여 2진 하이 상태의 비교 신호를 생성할 때까지 계속된다.
일단 요구 속도율(m)이 초과되면, 파라미터 프로세서(14)는 제어 신호를 생성하여 요구 속도율(m)에 부합하게 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN)의 레벨을 다시 변경한다. 이것에 의해 이어서 파라미터 종속 프로세서(11)는 신호 압축율을 낮춤으로써 출력 오디오 신호의 속도(SOUT)를 느리게 한다. 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN)의 레벨을 반복해서 변경하는 이러한 루프 기반의 프로세스는 출력 오디오 신호의 속도(SOUT)를 요구 속도율(m)에 고정하기 위해 계속된다. 오디오 속도 변환기(10)는 유사한 방식으로 동작하지만, 요구 속도율(m)이 1 미만이라면 역방식으로 동작한다.
전술한 방식에 있어서, 파라미터 종속 프로세서(11), 속도율 비교기(12) 및 파라미터 프로세서(14)는 폐루프 시스템으로서 동작하여 입력 오디오 신호의 내용에 따라 오디오 속도를 적응적으로 제어한다. 게다가, 이러한 속도 제어 방법은 도 3에 도시하는 바와 같이, 오디오 및 비디오 재생 기능을 모두 갖는 시스템에 내장될 수 있다. 본 발명의 원리에 따라 구성된 폐쇄 루프 속도 제어 시스템의 이점을 도 6에서 알 수 있다.
도 6을 참조하면, 개방 루프 시스템과 폐루프 시스템 사이의 전형적인 비교를 나타내는 그래프(50)가 도시된다. 도 6에 나타낸 바와 같이, 개방 루프 시스템(실선으로 표시)은 시간과 함께 속도 변동하는 출력 오디오 신호를 생성한다. 이러한 형태의 속도 변화는 청취자에게 짜증스럽게 느껴지는 경향이 있다. 반대로, 본 발명의 원리에 따라 구성된 폐쇄 루프 시스템(파선으로 표시)은 비교적 일정한 속도로 출력 오디오 신호를 바람직하게 생성한다. 본 발명의 원리에 따라 구성된 시스템은 오디오 및 비디오 제품에 향상된 기능을 제공한다. 예를 들어, 본 발명에 의해 오디오 및 비디오 세그먼트간의 양호한 동기가 보장되면서 사용자는 오디오 및 비디오 속도를 상승시켜 원 상영 시간의 단지 70%에서 영화를 볼 수 있기 때문에 시간을 절약할 수 있다. 또한, 사용자는 전화 응답기의 메시지를 원래 녹음 구간의 단지 60%만 재생함으로써 시간을 절약할 수 있다. 따라서, 녹음 전에 오디오 신호를 압축하면 효율적인 기억이 실현될 수 있기 때문에 생산 비용이 저감된다.
본 발명은 양호하게 설계된 것으로서 설명되었지만, 본 명세서의 기술 사상 및 범위 내에서 본 발명을 추가로 수정할 수 있다. 따라서, 본 출원은 본 발명의 일반적인 원리를 이용하여 발명을 적용한 어떠한 변형이나 이용으로부터 보호하는 것이다. 또한, 본 출원은 본 발명이 속하고 첨부 청구범위의 한계 내에 있는 기술 의 통상적인 실시와 같이 현재 개시한 것에서 벗어나는 것을 보호하는 것이다.

Claims (15)

  1. 오디오 신호를 처리하는 시스템으로서,
    상기 오디오 신호를 제1 속도율(SIN)에서 수신하고, 수신된 오디오 신호를 다른 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN)의 레벨을 각각 나타내는 복수의 제어 신호에 따라 처리하여, 상기 처리에 따라 상기 수신된 오디오 신호의 출력을 제2 속도율(SOUT)에서 제공하는 제1 처리 수단(11)과,
    상기 제2 속도율(SOUT)과 요구되는 속도율(m)을 비교하여 상기 비교에 따라 비교 신호를 생성하는 비교 수단(12)과,
    상기 비교 신호에 따라 상기 제어 신호를 생성하는 제2 처리 수단(14)을 포함하는 오디오 신호 처리 시스템.
  2. 제1항에 있어서, 상기 제어 신호에 의해 표시되는 상기 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN)의 하나는 평균 전력인 것인 오디오 신호 처리 시스템.
  3. 제1항에 있어서, 상기 요구되는 속도율(m)을 사용자가 입력할 수 있도록 하는 입력 수단(13)을 더 포함하는 오디오 신호 처리 시스템.
  4. 제1항에 있어서, 비디오 신호를 상기 제2 속도율(SOUT)에 동기함으로써 상기 비디오 신호를 처리하는 수단(20)을 더 포함하는 오디오 신호 처리 시스템.
  5. 제1항에 있어서, 상기 제1 처리 수단(11)은 상기 수신된 오디오 신호를 압축하거나 신장함으로써 상기 수신된 오디오 신호를 처리하는 것인 오디오 신호 처리 시스템.
  6. 오디오 신호를 처리하는 시스템으로서,
    상기 오디오 신호를 제1 속도율(SIN)에서 수신하고, 수신된 오디오 신호를 다른 파라미터(PREF1, PREF2, PREF3, …, PREFN)의 레벨을 각각 나타내는 복수의 제어 신호에 따라 처리하여 상기 수신된 오디오 신호의 출력을 상기 처리에 따라 제2 속도율(SOUT)에서 제공하는 제1 프로세서(11)와,
    상기 제2 속도율(SOUT)과 요구되는 속도율(m)을 비교하여 상기 비교에 따라 비교 신호를 생성하는 속도율 비교기(12)와,
    상기 비교 신호에 따라 상기 제어 신호를 생성하는 제2 프로세서(14)를 포함하는 오디오 신호 처리 시스템.
  7. 제6항에 있어서, 상기 제어 신호에 의해 표시되는 상기 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN)의 하나는 평균 전력인 것인 오디오 신호 처리 시스템.
  8. 제6항에 있어서, 상기 요구되는 속도율(m)을 사용자가 입력할 수 있도록 하는 사용자 인터페이스(13)를 더 포함하는 오디오 신호 처리 시스템.
  9. 제6항에 있어서, 비디오 신호를 상기 제2 신호(SOUT)에 동기함으로써 상기 비디오 신호를 처리하는 비디오 신호 프로세서(20)를 더 포함하는 오디오 신호 처리 시스템.
  10. 제6항에 있어서, 상기 제1 프로세서(11)는 상기 수신된 오디오 신호를 압축하거나 신장함으로써 상기 수신된 오디오 신호를 처리하는 것인 오디오 신호 처리 시스템.
  11. 오디오 신호를 처리하는 방법으로서,
    상기 오디오 신호를 제1 속도율(SIN)에서 수신하는 단계와,
    다른 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN)의 레벨을 각각 나타내는 복수의 제어 신호에 따라 상기 수신된 오디오 신호를 처리하는 단계와,
    상기 수신된 오디오 신호의 출력을 상기 처리에 따라 제2 속도율(SOUT)에서 제공하는 단계와,
    상기 제2 속도율(SOUT)과 요구되는 속도율(m)을 비교하는 단계와,
    상기 비교에 따라 비교 신호를 생성하는 단계와,
    상기 비교 신호에 따라 상기 제어 신호를 생성하는 단계를 포함하는 오디오 신호 처리 방법.
  12. 제11항에 있어서, 상기 제어 신호에 의해 표시되는 상기 기준 파라미터(PREF1, PREF2, PREF3, …, PREFN) 중 하나는 평균 전력인 것인 오디오 신호 처리 방법.
  13. 제11항에 있어서, 상기 요구되는 속도율(m)을 사용자가 입력할 수 있도록 하는 단계를 더 포함하는 오디오 신호 처리 방법.
  14. 제11항에 있어서, 비디오 신호를 상기 제2 속도율(m)에 동기함으로써 상기 비디오 신호를 처리하는 단계를 더 포함하는 오디오 신호 처리 방법.
  15. 제11항에 있어서, 상기 수신된 오디오 신호를 처리하는 단계는 상기 수신된 오디오 신호를 압축하거나 신장함으로써 수행되는 것인 오디오 신호 처리 방법.
KR1020037001764A 2000-08-10 2001-07-19 오디오 속도 변환을 가능하게 하는 시스템 및 방법 KR100768457B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US22445400P 2000-08-10 2000-08-10
US60/224,454 2000-08-10
PCT/IB2001/001302 WO2002013540A2 (en) 2000-08-10 2001-07-19 System and method for enabling audio speed conversion

Publications (2)

Publication Number Publication Date
KR20030018071A KR20030018071A (ko) 2003-03-04
KR100768457B1 true KR100768457B1 (ko) 2007-10-19

Family

ID=22840761

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020037001764A KR100768457B1 (ko) 2000-08-10 2001-07-19 오디오 속도 변환을 가능하게 하는 시스템 및 방법

Country Status (9)

Country Link
US (1) US20040090555A1 (ko)
EP (1) EP1308050B1 (ko)
JP (1) JP4785328B2 (ko)
KR (1) KR100768457B1 (ko)
CN (1) CN1185628C (ko)
AU (1) AU2002229158A1 (ko)
DE (1) DE60107438T2 (ko)
MX (1) MXPA03001200A (ko)
WO (1) WO2002013540A2 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7030930B2 (en) * 2001-03-06 2006-04-18 Ati Technologies, Inc. System for digitized audio stream synchronization and method thereof
US20060209210A1 (en) * 2005-03-18 2006-09-21 Ati Technologies Inc. Automatic audio and video synchronization
EP1977549B1 (en) * 2006-01-26 2009-11-04 Infra-Com Ltd. Low jitter clock recovery from a digital baseband data signal transmitted over a wireless medium
KR101224165B1 (ko) * 2008-01-02 2013-01-18 삼성전자주식회사 데이터 처리 모듈 제어 방법 및 장치
US10178281B2 (en) * 2014-07-28 2019-01-08 Starkey Laboratories, Inc. System and method for synchronizing audio and video signals for a listening system
US11443646B2 (en) 2017-12-22 2022-09-13 Fathom Technologies, LLC E-Reader interface system with audio and highlighting synchronization for digital books
US10671251B2 (en) 2017-12-22 2020-06-02 Arbordale Publishing, LLC Interactive eReader interface generation based on synchronization of textual and audial descriptors
CN112562719B (zh) * 2020-11-30 2024-03-19 清华珠三角研究院 合成语音与原始视频匹配方法、系统、装置及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0681398A2 (en) * 1994-04-28 1995-11-08 International Business Machines Corporation Synchronised, variable speed playback of digitally recorded audio and video
US5969716A (en) 1996-08-06 1999-10-19 Interval Research Corporation Time-based media processing system

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3786195A (en) * 1971-08-13 1974-01-15 Dc Dt Liquidating Partnership Variable delay line signal processor for sound reproduction
FR2485839B1 (fr) * 1980-06-27 1985-09-06 Cit Alcatel Procede de detection de parole dans un signal de circuit telephonique et detecteur de parole le mettant en oeuvre
US4631746A (en) * 1983-02-14 1986-12-23 Wang Laboratories, Inc. Compression and expansion of digitized voice signals
US4803730A (en) * 1986-10-31 1989-02-07 American Telephone And Telegraph Company, At&T Bell Laboratories Fast significant sample detection for a pitch detector
US5717818A (en) * 1992-08-18 1998-02-10 Hitachi, Ltd. Audio signal storing apparatus having a function for converting speech speed
JPH0854895A (ja) * 1994-08-11 1996-02-27 Matsushita Electric Ind Co Ltd 再生装置
US5920842A (en) * 1994-10-12 1999-07-06 Pixel Instruments Signal synchronization
US5647834A (en) * 1995-06-30 1997-07-15 Ron; Samuel Speech-based biofeedback method and system
JPH09198089A (ja) * 1996-01-19 1997-07-31 Matsushita Electric Ind Co Ltd 再生速度変換装置
US5749064A (en) * 1996-03-01 1998-05-05 Texas Instruments Incorporated Method and system for time scale modification utilizing feature vectors about zero crossing points
JP2955247B2 (ja) * 1997-03-14 1999-10-04 日本放送協会 話速変換方法およびその装置
EP0944036A4 (en) * 1997-04-30 2000-02-23 Japan Broadcasting Corp METHOD AND DEVICE FOR DETECTING LANGUAGE AREAS, AND METHOD AND DEVICE FOR LANGUAGE SPEED CONVERSION
US6009386A (en) * 1997-11-28 1999-12-28 Nortel Networks Corporation Speech playback speed change using wavelet coding, preferably sub-band coding
JP4098420B2 (ja) * 1998-11-04 2008-06-11 富士通株式会社 音響データ・動画データの同期再構築方法及び装置
US7010491B1 (en) * 1999-12-09 2006-03-07 Roland Corporation Method and system for waveform compression and expansion with time axis

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0681398A2 (en) * 1994-04-28 1995-11-08 International Business Machines Corporation Synchronised, variable speed playback of digitally recorded audio and video
US5969716A (en) 1996-08-06 1999-10-19 Interval Research Corporation Time-based media processing system

Also Published As

Publication number Publication date
WO2002013540A3 (en) 2002-04-11
JP4785328B2 (ja) 2011-10-05
KR20030018071A (ko) 2003-03-04
CN1446350A (zh) 2003-10-01
EP1308050A2 (en) 2003-05-07
JP2004506241A (ja) 2004-02-26
WO2002013540A2 (en) 2002-02-14
US20040090555A1 (en) 2004-05-13
DE60107438D1 (de) 2004-12-30
DE60107438T2 (de) 2005-05-25
CN1185628C (zh) 2005-01-19
AU2002229158A1 (en) 2002-02-18
MXPA03001200A (es) 2003-06-30
EP1308050B1 (en) 2004-11-24

Similar Documents

Publication Publication Date Title
KR101145941B1 (ko) 음성 신호 처리 장치, 음성 신호 처리 방법
JP3793245B2 (ja) 音声信号弁別装置及びオーディオ装置
JP3334419B2 (ja) ノイズ低減方法及びノイズ低減装置
US20080262856A1 (en) Method and system for enabling audio speed conversion
KR100768457B1 (ko) 오디오 속도 변환을 가능하게 하는 시스템 및 방법
EP1481544B1 (en) Gated silence removal during video trick modes
EP1483908B1 (en) Audio frequency scaling during video trick modes utilizing digital signal processing
US5633633A (en) Codec apparatus
KR100733192B1 (ko) 디지털 녹화 장치
US20050096764A1 (en) Sound-activated recording, transmission, and playback
JP3550110B2 (ja) 信号処理回路および信号処理方法
JP2001204018A (ja) 可変ビットレート符号化装置及び符号化方法
US5600755A (en) Voice codec apparatus
JPH0854895A (ja) 再生装置
US20040148043A1 (en) Method and apparatus for controlling recording levels
KR200147770Y1 (ko) 오디오신호 처리장치
JP2006179071A (ja) Dvdレコーダおよび映像音声再生装置
JP4913273B2 (ja) 映像信号処理装置および映像信号処理方法
KR950005249B1 (ko) 디지탈 아날로그 겸용 기록 재생시스템
JPH07123192A (ja) ファクシミリ装置
JP2000011311A (ja) 再生装置及び記録装置
JPS5912192B2 (ja) 音声再生装置
JPH01243726A (ja) Adm処理回路
KR20040067352A (ko) 앰펙 비디오 데이터 기록장치 및 방법
JPH05274791A (ja) ディスク記録再生装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120919

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20130924

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140923

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150918

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160921

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20170919

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20180918

Year of fee payment: 12