KR100656968B1 - 음속변환장치와 음속변환방법 및 컴퓨터 독출가능기록매체 - Google Patents

음속변환장치와 음속변환방법 및 컴퓨터 독출가능기록매체 Download PDF

Info

Publication number
KR100656968B1
KR100656968B1 KR1020040037494A KR20040037494A KR100656968B1 KR 100656968 B1 KR100656968 B1 KR 100656968B1 KR 1020040037494 A KR1020040037494 A KR 1020040037494A KR 20040037494 A KR20040037494 A KR 20040037494A KR 100656968 B1 KR100656968 B1 KR 100656968B1
Authority
KR
South Korea
Prior art keywords
waveform
inverted
speech
pitch period
decompression processing
Prior art date
Application number
KR1020040037494A
Other languages
English (en)
Other versions
KR20040102336A (ko
Inventor
나가야스가츠요시
야마모토고이치
Original Assignee
가부시끼가이샤 도시바
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시끼가이샤 도시바 filed Critical 가부시끼가이샤 도시바
Publication of KR20040102336A publication Critical patent/KR20040102336A/ko
Application granted granted Critical
Publication of KR100656968B1 publication Critical patent/KR100656968B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47GHOUSEHOLD OR TABLE EQUIPMENT
    • A47G19/00Table service
    • A47G19/22Drinking vessels or saucers used for table service
    • A47G19/2205Drinking glasses or vessels
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B82NANOTECHNOLOGY
    • B82YSPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
    • B82Y30/00Nanotechnology for materials or surface science, e.g. nanocomposites
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47GHOUSEHOLD OR TABLE EQUIPMENT
    • A47G2400/00Details not otherwise provided for in A47G19/00-A47G23/16
    • A47G2400/02Hygiene
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Nanotechnology (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Materials Engineering (AREA)
  • Composite Materials (AREA)
  • General Physics & Mathematics (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명에 따른 음속변환장치는, 입력되는 음성신호로부터 피치주기를 산출하는 피치주기 산출부와, 음성신호의 음성파형을 피치주기만큼 잘라내고 그 음성파형을 시간축 반전시킨 반전파형을 음성신호에 삽입함으로써 신장처리를 실행하는 신장처리부를 구비하고 있다.

Description

음속변환장치와 음속변환방법 및 컴퓨터 독출가능 기록매체 {SPEECH RATE CONVERSION APPARATUS, METHOD AND COMPUTER-READABLE RECORD MEDIUM THEREOF}
도 1은 본 발명의 1실시예에서의 음속변환장치의 구성을 나타낸 블럭도,
도 2는 음성신호의 파형을 피치주기만큼 잘라낸 상태를 설명하는 설명도,
도 3은 잘라낸 음성신호의 시간축 반전을 행한 상태를 설명하는 설명도,
도 4는 음성파형에 가중계수를 승산한 상태를 설명하는 설명도,
도 5는 가중 파형을 가산한 상태를 설명하는 설명도,
도 6은 삽입한 음성파형의 합성을 설명하는 설명도,
도 7은 합성한 음성파형을 삽입함으로써 신장처리를 설명하는 설명도,
도 8은 본 발명의 실시예의 신장처리의 흐름을 나타낸 플로우차트이다.
<도면부호의 설명>
1 --- 음성파형 프레임 추출부, 2 --- 피치주기 산출부,
3 --- 시간축 신장부, 100 --- 음속변환장치.
본 발명은 음성신호의 음속을 변화시키기 위한 음속변환장치에 관한 것이다.
입력되는 음성의 속도변환을 행하기 위한 일반적인 수법으로서, PICOLA(Pointer Interval Control OverLap and Add)에 의해 음성의 시간축을 압축 및 확장하는 파형처리방법이 알려져 있다(예컨대, "Compression and Expansion on Time Axis of Speech Using Pointer Interval Control OverLap and Add (PICOLA) Method and its Evaluation" 참조).
이 음속변환에서는, 입력되는 음성 데이터를 특정의 프레임길이로 잘라내고, 자동상관함수(autocorrelation function) 등을 이용해서 프레임에서의 피치주기를 얻어 압축 및 신장처리를 실행하도록 되어 있다.
그러나, 이 방법에서는, 신장처리를 할 때에 음성 이외의 배경음향으로서 군중의 왁자지껄한 소리나 파도소리와 같은 근무작위음(near-random sound: 近無作爲音)이 있을 때, 파형 삽입의 주기에 대응하는 소름끼치는 기생진동음(parasitic sound: 寄生振動音)(대개는 음악소리의 일종)이 과도하게 발생하게 된다.
한편, 상술한 소름끼치는 기생진동음이 나지 않게 하는 방법으로서, 위상(phase)을 무작위화해서 중첩(superimpose)시키는 방법이 알려져 있다(예컨대, 일본 특개평5-108095호의 단락 [0015], 도 1 참조).
그렇지만, 이와 같은 방법에서도 파형을 시프트시키는 동안 위상을 무작위화하여 생성한 무작위화 음성 세그먼트 파형을 부가하거나 중첩시키는 복잡한 처리가 필요하게 되어 스루풋(throughput: 처리량)의 부하가 커지기 때문에, 이 방법을 실시간 처리가 필요한 처리 시스템에 짜 넣는 것이 어렵게 된다.
상술한 바와 같이, 종래 기술의 음속변환에서는, 배경 음향으로서 근무작위음이 있을 때 파형 삽입의 주기에 대응하는 소름끼치는 소리가 과도하게 발생한다는 문제점이 있었다.
또한, 이 문제점에 대한 해결책으로서, 파형을 시프트시키는 동안 위상을 무작위화하여 생성한 무작위화 음성 세그먼트 파형을 부가하거나 중첩시키는 방법이 알려져 있지만, 복잡한 처리가 필요하게 되어 스루풋의 부하가 커지기 때문에, 이 방법을 실시간 처리가 필요한 처리 시스템에 짜 넣는 것이 어렵다는 문제점이 있었다.
따라서, 본 발명은 상술한 바와 같은 문제점을 감안하여 이루어진 것으로, 그 목적은 배경 음향으로서 근무작위음이 있는 경우의 음속변환에 있어서도 소름끼치는 기생진동음이 발생하지 않는 동안에 극히 간단한 처리에 의해 양호한 음질을 갖는 음속변환장치를 실현하는데 있다.
상기 목적을 달성하기 위해 본 발명은, 입력되는 음성신호로부터 피치주기를 산출하는 피치주기 산출부와, 음성신호의 음성파형을 피치주기만큼 잘라내고 그 음성파형을 시간축 반전시킨 반전파형을 음성신호에 삽입함으로써 신장처리를 실행하는 신장처리부를 구비하여 구성된 것을 특징으로 한다.
그 결과로서, 소름끼치는 기생진동음을 발생시키지 않고도 상당히 간단하게 양호한 음질을 갖는 음속변환을 실현할 수 있게 된다.
(실시예)
이하, 도면을 참조하면서 본 발명의 1실시예를 상세히 설명한다. 도 1은 본 발명의 1실시예에서의 음속변환장치의 구성을 나타낸 블럭도이다.
음속변환장치(100)는, 음성파형 프레임 추출부(1)와 피치주기 산출부(2) 및 시간축 신장부(3)를 갖추고 있다. 상기 음성파형 프레임 추출부(1)는 피치주기를 얻기 위해 입력음성신호의 소정의 프레임길이를 가진 음성파형을 잘라내는 역할을 한다. 또, 상기 피치주기 산출부(2)는 음성파형 프레임 추출부(1)에서 잘라내어진 음성신호로부터 피치주기(Tp)를 산출하여 이 피치주기(Tp)를 시간축 신장부(3)로 입력하는 역할을 한다.
다음에는, 상기 피치주기를 산출하는 방법으로서, 자동상관함수(autocorrelation function)를 이용하여 피치주기를 산출하는 방법에 대해 설명한다. 자동상관함수를 이용해서 피치주기를 산출하는 방법에 있어서, 자동상관(自動相關)은, 입력음성신호가 유한한 시간길이를 갖고, 프레임길이(Tc)의 간격(상술한 프레임길이에 대응함) 내에서만 존재하며, 그 신호가 프레임길이(Tc)의 간격 이외에서는 항상 제로(0)라는 가정 하에서 얻어지게 된다. 즉, 이러한 단시간 자동상관값 Rn(k)는 수학식 1에 나타낸 것과 같이 얻어진다.
Figure 112004022236867-pat00001
여기서, m = 0, 1, 2, …, Tc-1-k
Tc는 입력음성신호가 존재한다고 가정한 경우의 시간간격이고, k는 단시간 자동상관값 Rn(k)을 산출할 때에 음성파형을 지연시키는 경우의 지연시간이며, 이들 사이에는 Tc≫k의 관계가 있다. 단시간 자동상관값 Rn(k)이 최대로 되도록 k의 값이 수학식 1에서 얻어질 때 그 값이 피치주기로 된다. 이렇게 해서 얻어진 피치주기(Tp)는 시간축 신장부(3)로 보내지고, 이 시간축 신장부(3)에서는 다음에 설명하는 바와 같은 신장처리가 수행된다.
신장처리에서는, 도 2에 도시된 바와 같이 피치주기 산출부(2)에 의해 산출된 피치주기가 Tp이고, 신장계수가 R(예컨대, 1<R≤2)이며, 프레임길이 추출부의 잘라낸 음성파형이 Tc=Tp/(R-1)이라고 가정했을 때, 먼저 복수의 음성파형이 피치주기만큼 잘라내어진다. 여기서는, 파형 A와 파형 B의 연속한 2개의 음성파형이 있는 그대로 간단히 잘라내어진다. 그 후, 도 3에 도시된 바와 같이 파형 A의 음성파형이 시간축 반전에 의해 파형 A'로 변환되게 된다.
도 4에 도시된 바와 같이, 파형 B와의 접촉점[파형 A의 종단(終端)]으로부터 Lp 부분까지의 파형 A는 0∼1의 가중계수와 승산되어 파형 D1의 음성파형을 작성한다. 여기서, Lp는 소정의 시간길이로서 피치주기(Tp)보다 짧고, 대략 Lp = 1/5 ∼ 1/6Tp이다. 마찬가지로, 파형 A와의 접촉점[파형 B의 초단(初端: 시단)]으로부터 Lp 부분까지의 파형 B, 초단으로부터 Lp 부분까지의 파형 A' 및 종단으로부터 Lp 부분까지의 파형 A'는 1∼0의 사이, 0∼1의 사이 및 1∼0의 사이에서 직선적으로 각각 변화하는 가중계수와 승산되어 파형 C1, 파형 C2 및 파형 D2의 음성파형을 작성한다.
파형 C1 및 파형 C2의 작성된 음성파형과 파형 D1 및 파형 D2의 음성파형은 각각 가산되어 파형 C 및 파형 D의 음성파형을 작성한다(도 5). 더욱이, 도 6에 도시된 바와 같이, Lp 부분은 파형 A'의 음성파형의 초단 및 종단의 잘라낸 부분으로서, 이 Lp 부분에 파형 C 및 파형 D의 음성파형이 각각 삽입되어 파형 A"의 음성파형으로 합성되게 된다.
마지막으로, 이 파형 A"를 파형 A와 파형 B의 음성파형 사이에 삽입시켜 Tc=Tp/(R-1)의 파형으로부터 신장계수 R을 만족하는 Tc+Tp=Tp/(R-1)의 파형을 작성한다(도 7).
상술한 구성에 의해, 삽입되는 음성파형이 시간축 반전에 의해 변환된 파형이기 때문에, 과도하게 발생하여 입력 음성신호를 잘라내는 모든 프레임의 주기에 대응하던 소름끼치는 기생진동음이 발생하지 않게 된다. 또한, 삽입되는 음성파형의 초단부 및 종단부의 파형으로서 0∼1의 사이 또는 1∼0의 사이에서 직선적으로 변화하는 가중계수를 승산한 파형을 이용함으로써, 신장처리를 실행하는 경우에도 작은 왜곡을 갖는 음성파형이 얻어지도록 삽입되는 파형 A"와 파형 A 및 파형 B 사이에 평탄한 접점을 갖는 파형과 같이 접촉이 이루어질 수 있게 된다. 더욱이, 삽입되는 음성파형은 시간축 반전과 같은 극히 간단한 처리에 의해 실현될 수 있게 된다.
한편, 여기서는 신장처리가 파형 A의 음성파형을 변환하여 얻은 파형 A"를 삽입함으로써 수행되는 실시예에 대해 설명했지만, 마찬가지로 파형 B의 음성파형을 변환하는 경우에도 적용할 수가 있다.
다음에는, 본 발명의 1실시예의 신장처리의 흐름에 대해 도 8의 플로우차트를 참조로 해서 설명한다. 먼저, 입력되는 음성신호에서 소정의 프레임길이(Tc)의 음성파형을 잘라내고(단계 S1), 자동상관함수 등을 이용해서 이 잘라낸 프레임길이(Tc)의 음성파형으로부터 피치주기(Tp)를 얻는다(단계 S2). 이렇게 해서 얻어진 피치주기(Tp)로부터, 처리목표의 2개의 음성파형(파형 A, B)을 입력된 음성신호로부터 피치주기(Tp)만큼 잘라내고(단계 S3), 그 후 파형 A의 음성파형을 시간축 반전에 의해 파형 A'로 변환시킨다(단계 S4).
파형 B의 단부로부터 Lp 부분까지의 파형 A에 0∼1의 사이에서 직선적으로 변화하는 가중계수를 승산하여 파형 D1을 작성한다. 마찬가지로, 파형 A의 단부로부터 Lp 부분까지의 파형 B에 1∼0의 사이에서 직선적으로 변화하는 가중계수를 승산하여 파형 C1을 작성한다. 더욱이, 파형 A'의 초단 및 종단으로부터 Lp 부분까지의 부분에 각각 0∼1의 사이 및 1∼0의 사이에서 직선적으로 변화하는 가중계수를 승산하여 파형 C2와 파형 D2의 음성파형을 작성한다(단계 S5).
파형 C1과 파형 C2의 음성파형을 가산하여 파형 C의 음성파형을 작성한다(단계 S6A). 마찬가지로, 파형 D1과 파형 D2의 음성파형을 가산하여 파형 D의 음성파형을 작성한다(단계 S6B).
그 후, 파형 A'의 시작점 및 끝점으로부터 Lp 부분까지의 음성파형을 잘라내고, 그 잘라낸 부분에 파형 C와 파형 D의 음성파형을 각각 삽입함으로써, 파형 A"를 합성한다(단계 S7). 더욱이, 이 파형 A"의 음성파형을 파형 A와 파형 B 사이에 삽입해서(단계 S8) 음성파형을 신장시킨다. 다음의 프레임에 대하여 단계 S1∼S8을 반복해서 실행하고, 신장시켜야 할 입력음성신호가 입력되지 않을 때 이 신장처리를 종료한다(단계 S9).
여기서는 도 1에 구성된 음속변환장치 내에서 실시되는 신장처리에 대해 설명했지만, 상술한 단계 S1∼S8을 갖춘 신장처리는 도 1에 도시된 바와 같은 신장처리부(3) 이외에 CPU와 같은 프로세서가 구비된 컴퓨터에 의해 실행되는 소프트웨어로 실시할 수도 있다. 여기서, 잘라낸 파형에 승산되는 가중계수는 직선적으로 변화하는 형태에 한정되는 것은 아니다.
한편, 텔레비전 세트, DVD 플레이어 등에 조립되는 음성출력부와 같은 다수의 변형례 및 기타의 실시예도 본 발명에 관련된 기술분야에서 통상의 지식을 가진 자라면 본 발명의 기술을 이용해서 실시할 수 있는 것인 바, 그 실시되는 변형례는 모두 본 발명의 범위 내의 기술이라 할 것이다.
상술한 바와 같이 본 발명에 의하면, 소름끼치는 기생진동음을 발생시키지 않고도 양호한 음질을 갖는 음속변환을 극히 간단한 처리에 의해 실현할 수 있게 된다.

Claims (16)

  1. 입력되는 음성신호로부터 피치주기를 산출하는 피치주기 산출부와,
    상기 음성신호의 음성파형을 피치주기만큼 잘라내고 그 음성파형을 시간축 반전시킨 반전파형을 상기 음성신호에 삽입함으로써 신장처리를 실행하는 신장처리부를 구비하여 구성된 것을 특징으로 하는 음속변환장치.
  2. 입력되는 음성신호로부터 소정의 프레임길이의 음성프레임을 추출하는 음성프레임 추출부와,
    상기 음성프레임으로부터 피치주기를 산출하는 피치주기 산출부 및,
    상기 음성프레임의 음성파형을 피치주기만큼 잘라내고 그 음성파형을 시간축 반전시킨 반전파형을 상기 음성프레임에 삽입함으로써 신장처리를 실행하는 신장처리부를 구비하여 구성된 것을 특징으로 하는 음속변환장치.
  3. 제1항에 있어서, 상기 신장처리부가, 복수의 음성파형을 피치주기만큼 연속해서 잘라내고 적어도 하나 이상의 반전파형을 삽입함으로써 신장처리를 실행하도록 된 것을 특징으로 하는 음속변환장치.
  4. 제2항에 있어서, 상기 신장처리부가, 복수의 음성파형을 피치주기만큼 연속해서 잘라내고 적어도 하나 이상의 반전파형을 삽입함으로써 신장처리를 실행하도 록 된 것을 특징으로 하는 음속변환장치.
  5. 제1항에 있어서, 상기 신장처리부가, 상기 반전파형을 반전 전에 잘라낸 음성파형과 잘라낸 다음의 음성파형 사이에 삽입함으로써 신장처리를 실행하도록 된 것을 특징으로 하는 음속변환장치.
  6. 제2항에 있어서, 상기 신장처리부가, 상기 반전파형을 반전 전에 잘라낸 음성파형과 잘라낸 다음의 음성파형 사이에 삽입함으로써 신장처리를 실행하도록 된 것을 특징으로 하는 음속변환장치.
  7. 제5항에 있어서, 상기 반전파형이, 잘라내어 시간축 반전시킨 파형의 초단부에 가중을 부여하고, 그 부분을 반전 전에 잘라낸 음성파형의 종단부와 가산하고 합성함으로써 얻어지도록 된 것을 특징으로 하는 음속변환장치.
  8. 제6항에 있어서, 상기 반전파형이, 잘라내어 시간축 반전시킨 파형의 초단부에 가중을 부여하고, 그 부분을 반전 전에 잘라낸 음성파형의 종단부와 가산하고 합성함으로써 얻어지도록 된 것을 특징으로 하는 음속변환장치.
  9. 제5항에 있어서, 상기 반전파형이, 잘라내어 시간축 반전시킨 파형의 종단부에 가중을 부여하고, 그 부분을 잘라낸 다음의 음성파형의 초단부와 가산하고 합성 함으로써 얻어지도록 된 것을 특징으로 하는 음속변환장치.
  10. 제6항에 있어서, 상기 반전파형이, 잘라내어 시간축 반전시킨 파형의 종단부에 가중을 부여하고, 그 부분을 잘라낸 다음의 음성파형의 초단부와 가산하고 합성함으로써 얻어지도록 된 것을 특징으로 하는 음속변환장치.
  11. 입력되는 음성신호로부터 피치주기를 산출하는 단계와,
    상기 음성신호의 음성파형을 피치주기만큼 잘라내고 그 음성파형을 시간축 반전시킨 반전파형을 상기 음성신호에 삽입함으로써 신장처리를 실행하는 단계를 구비하여 이루어진 것을 특징으로 하는 음속변환방법.
  12. 제11항에 있어서, 상기 신장처리가, 복수의 음성파형을 피치주기만큼 연속해서 잘라내고 적어도 하나 이상의 반전파형을 삽입함으로써 실행되는 것을 특징으로 하는 음속변환방법.
  13. 제11항에 있어서, 상기 신장처리가, 상기 반전파형을 반전 전에 잘라낸 음성파형과 잘라낸 다음의 음성파형 사이에 삽입함으로써 실행되는 것을 특징으로 하는 음속변환방법.
  14. 제13항에 있어서, 상기 반전파형이, 잘라내어 시간축 반전시킨 파형의 초단 부에 가중을 부여하고, 그 부분을 반전 전에 잘라낸 음성파형의 종단부와 가산하고 합성함으로써 얻어지는 것을 특징으로 하는 음속변환방법.
  15. 제13항에 있어서, 상기 반전파형이, 잘라내어 시간축 반전시킨 파형의 종단부에 가중을 부여하고, 그 부분을 잘라낸 다음의 음성파형의 초단부와 가산하고 합성함으로써 얻어지는 것을 특징으로 하는 음속변환방법.
  16. 컴퓨터에 의해, 입력되는 음성신호로부터 피치주기를 산출하는 단계와, 상기 음성신호의 음성파형을 피치주기만큼 잘라내고 그 음성파형을 시간축 반전시킨 반전파형을 상기 음성신호에 삽입함으로써 신장처리를 실행하는 단계를 수행하도록 하기 위한 음속변환 프로그램이 기록된 것을 특징으로 하는 컴퓨터 독출가능 기록매체.
KR1020040037494A 2003-05-27 2004-05-25 음속변환장치와 음속변환방법 및 컴퓨터 독출가능기록매체 KR100656968B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2003-00149034 2003-05-27
JP2003149034A JP3871657B2 (ja) 2003-05-27 2003-05-27 話速変換装置、方法、及びそのプログラム

Publications (2)

Publication Number Publication Date
KR20040102336A KR20040102336A (ko) 2004-12-04
KR100656968B1 true KR100656968B1 (ko) 2006-12-13

Family

ID=33128213

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040037494A KR100656968B1 (ko) 2003-05-27 2004-05-25 음속변환장치와 음속변환방법 및 컴퓨터 독출가능기록매체

Country Status (5)

Country Link
US (1) US20050010398A1 (ko)
EP (1) EP1482483A3 (ko)
JP (1) JP3871657B2 (ko)
KR (1) KR100656968B1 (ko)
CN (1) CN1266675C (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4550652B2 (ja) * 2005-04-14 2010-09-22 株式会社東芝 音響信号処理装置、音響信号処理プログラム及び音響信号処理方法
EP1895511B1 (en) * 2005-06-23 2011-09-07 Panasonic Corporation Audio encoding apparatus, audio decoding apparatus and audio encoding information transmitting apparatus
JP5011803B2 (ja) 2006-04-24 2012-08-29 ソニー株式会社 オーディオ信号伸張圧縮装置及びプログラム
JP4985152B2 (ja) * 2007-07-02 2012-07-25 ソニー株式会社 情報処理装置、信号処理方法およびプログラム
JP2009048676A (ja) * 2007-08-14 2009-03-05 Toshiba Corp 再生装置および方法
JP5346230B2 (ja) * 2009-03-10 2013-11-20 パナソニック株式会社 話速変換装置
JP2010249940A (ja) * 2009-04-13 2010-11-04 Sony Corp ノイズ低減装置、ノイズ低減方法
CN101719371B (zh) * 2009-11-20 2012-04-04 安凯(广州)微电子技术有限公司 一种语音变速的方法
JP2012194417A (ja) * 2011-03-17 2012-10-11 Sony Corp 音声処理装置および方法、並びにプログラム
CN105788601B (zh) * 2014-12-25 2019-08-30 联芯科技有限公司 VoLTE的抖动隐藏方法和装置
CN106469559B (zh) * 2015-08-19 2020-10-16 中兴通讯股份有限公司 语音数据的调整方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960007843B1 (ko) * 1990-05-28 1996-06-12 마쯔시다덴기산교 가부시기가이샤 음성신호처리장치
JP2000003199A (ja) 1998-06-15 2000-01-07 Yamaha Corp 音声変換装置及び音声変換方法
JP2000099097A (ja) 1998-09-24 2000-04-07 Sony Corp 信号再生装置及び方法、音声信号再生装置、並びに、音声信号の速度変換方法
JP2000259200A (ja) 1999-03-11 2000-09-22 Nippon Telegr & Teleph Corp <Ntt> 話速変換方法および装置および話速変換プログラムを格納した記録媒体
KR100327969B1 (ko) 1996-11-11 2002-04-17 모리시타 요이찌 음성재생속도변환장치및음성재생속도변환방법
KR20030015579A (ko) * 2001-08-16 2003-02-25 주식회사 코스모탄 지정된 변속율에 정확하게 비례하는 재생시간을 갖도록오디오신호의 시간스케일을 수정하는 방법과 이를 위한장치

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69228211T2 (de) * 1991-08-09 1999-07-08 Koninklijke Philips Electronics N.V., Eindhoven Verfahren und Apparat zur Handhabung von Höhe und Dauer eines physikalischen Audiosignals
US5717823A (en) * 1994-04-14 1998-02-10 Lucent Technologies Inc. Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders
JPH0896514A (ja) * 1994-07-28 1996-04-12 Sony Corp オーディオ信号処理装置
US5828995A (en) * 1995-02-28 1998-10-27 Motorola, Inc. Method and apparatus for intelligible fast forward and reverse playback of time-scale compressed voice messages
US5842172A (en) * 1995-04-21 1998-11-24 Tensortech Corporation Method and apparatus for modifying the play time of digital audio tracks
JP2001513225A (ja) * 1997-12-19 2001-08-28 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 伸長オーディオ信号からの周期性の除去
KR100341197B1 (ko) * 1998-09-29 2002-06-20 포만 제프리 엘 오디오 데이터로 부가 정보를 매립하는 방법 및 시스템
JP3546755B2 (ja) * 1999-05-06 2004-07-28 ヤマハ株式会社 リズム音源信号の時間軸圧伸方法及び装置
US6842735B1 (en) * 1999-12-17 2005-01-11 Interval Research Corporation Time-scale modification of data-compressed audio information
EP1143417B1 (en) * 2000-04-06 2005-12-28 Telefonaktiebolaget LM Ericsson (publ) A method of converting the speech rate of a speech signal, use of the method, and a device adapted therefor
US6718309B1 (en) * 2000-07-26 2004-04-06 Ssi Corporation Continuously variable time scale modification of digital audio signals
JP4067762B2 (ja) * 2000-12-28 2008-03-26 ヤマハ株式会社 歌唱合成装置
US7094965B2 (en) * 2001-01-17 2006-08-22 Yamaha Corporation Waveform data analysis method and apparatus suitable for waveform expansion/compression control
US7233832B2 (en) * 2003-04-04 2007-06-19 Apple Inc. Method and apparatus for expanding audio data

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960007843B1 (ko) * 1990-05-28 1996-06-12 마쯔시다덴기산교 가부시기가이샤 음성신호처리장치
KR100327969B1 (ko) 1996-11-11 2002-04-17 모리시타 요이찌 음성재생속도변환장치및음성재생속도변환방법
JP2000003199A (ja) 1998-06-15 2000-01-07 Yamaha Corp 音声変換装置及び音声変換方法
JP2000099097A (ja) 1998-09-24 2000-04-07 Sony Corp 信号再生装置及び方法、音声信号再生装置、並びに、音声信号の速度変換方法
JP2000259200A (ja) 1999-03-11 2000-09-22 Nippon Telegr & Teleph Corp <Ntt> 話速変換方法および装置および話速変換プログラムを格納した記録媒体
KR20030015579A (ko) * 2001-08-16 2003-02-25 주식회사 코스모탄 지정된 변속율에 정확하게 비례하는 재생시간을 갖도록오디오신호의 시간스케일을 수정하는 방법과 이를 위한장치

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
1003279690000
1020030015579
12099097

Also Published As

Publication number Publication date
CN1573931A (zh) 2005-02-02
US20050010398A1 (en) 2005-01-13
CN1266675C (zh) 2006-07-26
KR20040102336A (ko) 2004-12-04
JP2004354462A (ja) 2004-12-16
JP3871657B2 (ja) 2007-01-24
EP1482483A3 (en) 2006-11-02
EP1482483A2 (en) 2004-12-01

Similar Documents

Publication Publication Date Title
US5630013A (en) Method of and apparatus for performing time-scale modification of speech signals
JP2782147B2 (ja) 波形編集型音声合成装置
KR100656968B1 (ko) 음속변환장치와 음속변환방법 및 컴퓨터 독출가능기록매체
US8331583B2 (en) Noise reducing apparatus and noise reducing method
EP1840871B1 (en) Audio waveform processing device, method, and program
JP4550652B2 (ja) 音響信号処理装置、音響信号処理プログラム及び音響信号処理方法
JPH07160299A (ja) 音声信号帯域圧縮伸張装置並びに音声信号の帯域圧縮伝送方式及び再生方式
US6519567B1 (en) Time-scale modification method and apparatus for digital audio signals
EP1074968B1 (en) Synthesized sound generating apparatus and method
CA2242610C (en) Sound reproducing speed converter
JPH09127995A (ja) 信号復号化方法及び信号復号化装置
KR100677612B1 (ko) 오디오 재생 속도 제어 장치 및 그 방법
JP2001255882A (ja) 音声信号処理装置及びその信号処理方法
JP2957861B2 (ja) 音声時間軸圧縮伸長装置
JP2022045086A (ja) 残響を求めるためのシステム
JPH1078791A (ja) ピッチ変換器
JPH06222794A (ja) 音声速度変換方法
JP2951181B2 (ja) 音声時間軸圧縮装置及び音声時間軸伸長装置、並びに音声時間軸圧縮伸長装置
JP3639461B2 (ja) 音声信号のピッチ周期抽出方法、及び音声信号のピッチ周期抽出装置、音声信号の時間軸圧縮装置、音声信号の時間軸伸長装置、音声信号の時間軸圧縮伸長装置
JP3112462B2 (ja) 音声符号化装置
JPH07302097A (ja) 音声の時間軸圧縮方法、及び伸長方法、並びに音声の時間軸圧縮伸長方法
JP2006139158A (ja) 音響信号の合成装置および合成再生装置
JPS61148499A (ja) 音声信号帯域圧縮方式
JP2000232367A (ja) トリプレット情報処理装置及びその方法
JPH0519791A (ja) 雑音抑圧装置と雑音抑圧方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee