KR100656968B1 - 음속변환장치와 음속변환방법 및 컴퓨터 독출가능기록매체 - Google Patents
음속변환장치와 음속변환방법 및 컴퓨터 독출가능기록매체 Download PDFInfo
- Publication number
- KR100656968B1 KR100656968B1 KR1020040037494A KR20040037494A KR100656968B1 KR 100656968 B1 KR100656968 B1 KR 100656968B1 KR 1020040037494 A KR1020040037494 A KR 1020040037494A KR 20040037494 A KR20040037494 A KR 20040037494A KR 100656968 B1 KR100656968 B1 KR 100656968B1
- Authority
- KR
- South Korea
- Prior art keywords
- waveform
- inverted
- speech
- pitch period
- decompression processing
- Prior art date
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 title claims description 28
- 238000012545 processing Methods 0.000 claims abstract description 31
- 230000006837 decompression Effects 0.000 claims abstract description 29
- 230000005236 sound signal Effects 0.000 claims description 8
- 230000002194 synthesizing effect Effects 0.000 claims 4
- 238000010586 diagram Methods 0.000 description 8
- 230000003071 parasitic effect Effects 0.000 description 6
- 238000005311 autocorrelation function Methods 0.000 description 4
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- A—HUMAN NECESSITIES
- A47—FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
- A47G—HOUSEHOLD OR TABLE EQUIPMENT
- A47G19/00—Table service
- A47G19/22—Drinking vessels or saucers used for table service
- A47G19/2205—Drinking glasses or vessels
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B82—NANOTECHNOLOGY
- B82Y—SPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
- B82Y30/00—Nanotechnology for materials or surface science, e.g. nanocomposites
-
- A—HUMAN NECESSITIES
- A47—FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
- A47G—HOUSEHOLD OR TABLE EQUIPMENT
- A47G2400/00—Details not otherwise provided for in A47G19/00-A47G23/16
- A47G2400/02—Hygiene
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Nanotechnology (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Condensed Matter Physics & Semiconductors (AREA)
- Crystallography & Structural Chemistry (AREA)
- Materials Engineering (AREA)
- Composite Materials (AREA)
- General Physics & Mathematics (AREA)
- Electrophonic Musical Instruments (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
본 발명에 따른 음속변환장치는, 입력되는 음성신호로부터 피치주기를 산출하는 피치주기 산출부와, 음성신호의 음성파형을 피치주기만큼 잘라내고 그 음성파형을 시간축 반전시킨 반전파형을 음성신호에 삽입함으로써 신장처리를 실행하는 신장처리부를 구비하고 있다.
Description
도 1은 본 발명의 1실시예에서의 음속변환장치의 구성을 나타낸 블럭도,
도 2는 음성신호의 파형을 피치주기만큼 잘라낸 상태를 설명하는 설명도,
도 3은 잘라낸 음성신호의 시간축 반전을 행한 상태를 설명하는 설명도,
도 4는 음성파형에 가중계수를 승산한 상태를 설명하는 설명도,
도 5는 가중 파형을 가산한 상태를 설명하는 설명도,
도 6은 삽입한 음성파형의 합성을 설명하는 설명도,
도 7은 합성한 음성파형을 삽입함으로써 신장처리를 설명하는 설명도,
도 8은 본 발명의 실시예의 신장처리의 흐름을 나타낸 플로우차트이다.
<도면부호의 설명>
1 --- 음성파형 프레임 추출부, 2 --- 피치주기 산출부,
3 --- 시간축 신장부, 100 --- 음속변환장치.
본 발명은 음성신호의 음속을 변화시키기 위한 음속변환장치에 관한 것이다.
입력되는 음성의 속도변환을 행하기 위한 일반적인 수법으로서, PICOLA(Pointer Interval Control OverLap and Add)에 의해 음성의 시간축을 압축 및 확장하는 파형처리방법이 알려져 있다(예컨대, "Compression and Expansion on Time Axis of Speech Using Pointer Interval Control OverLap and Add (PICOLA) Method and its Evaluation" 참조).
이 음속변환에서는, 입력되는 음성 데이터를 특정의 프레임길이로 잘라내고, 자동상관함수(autocorrelation function) 등을 이용해서 프레임에서의 피치주기를 얻어 압축 및 신장처리를 실행하도록 되어 있다.
그러나, 이 방법에서는, 신장처리를 할 때에 음성 이외의 배경음향으로서 군중의 왁자지껄한 소리나 파도소리와 같은 근무작위음(near-random sound: 近無作爲音)이 있을 때, 파형 삽입의 주기에 대응하는 소름끼치는 기생진동음(parasitic sound: 寄生振動音)(대개는 음악소리의 일종)이 과도하게 발생하게 된다.
한편, 상술한 소름끼치는 기생진동음이 나지 않게 하는 방법으로서, 위상(phase)을 무작위화해서 중첩(superimpose)시키는 방법이 알려져 있다(예컨대, 일본 특개평5-108095호의 단락 [0015], 도 1 참조).
그렇지만, 이와 같은 방법에서도 파형을 시프트시키는 동안 위상을 무작위화하여 생성한 무작위화 음성 세그먼트 파형을 부가하거나 중첩시키는 복잡한 처리가 필요하게 되어 스루풋(throughput: 처리량)의 부하가 커지기 때문에, 이 방법을 실시간 처리가 필요한 처리 시스템에 짜 넣는 것이 어렵게 된다.
상술한 바와 같이, 종래 기술의 음속변환에서는, 배경 음향으로서 근무작위음이 있을 때 파형 삽입의 주기에 대응하는 소름끼치는 소리가 과도하게 발생한다는 문제점이 있었다.
또한, 이 문제점에 대한 해결책으로서, 파형을 시프트시키는 동안 위상을 무작위화하여 생성한 무작위화 음성 세그먼트 파형을 부가하거나 중첩시키는 방법이 알려져 있지만, 복잡한 처리가 필요하게 되어 스루풋의 부하가 커지기 때문에, 이 방법을 실시간 처리가 필요한 처리 시스템에 짜 넣는 것이 어렵다는 문제점이 있었다.
따라서, 본 발명은 상술한 바와 같은 문제점을 감안하여 이루어진 것으로, 그 목적은 배경 음향으로서 근무작위음이 있는 경우의 음속변환에 있어서도 소름끼치는 기생진동음이 발생하지 않는 동안에 극히 간단한 처리에 의해 양호한 음질을 갖는 음속변환장치를 실현하는데 있다.
상기 목적을 달성하기 위해 본 발명은, 입력되는 음성신호로부터 피치주기를 산출하는 피치주기 산출부와, 음성신호의 음성파형을 피치주기만큼 잘라내고 그 음성파형을 시간축 반전시킨 반전파형을 음성신호에 삽입함으로써 신장처리를 실행하는 신장처리부를 구비하여 구성된 것을 특징으로 한다.
그 결과로서, 소름끼치는 기생진동음을 발생시키지 않고도 상당히 간단하게 양호한 음질을 갖는 음속변환을 실현할 수 있게 된다.
(실시예)
이하, 도면을 참조하면서 본 발명의 1실시예를 상세히 설명한다. 도 1은 본 발명의 1실시예에서의 음속변환장치의 구성을 나타낸 블럭도이다.
음속변환장치(100)는, 음성파형 프레임 추출부(1)와 피치주기 산출부(2) 및 시간축 신장부(3)를 갖추고 있다. 상기 음성파형 프레임 추출부(1)는 피치주기를 얻기 위해 입력음성신호의 소정의 프레임길이를 가진 음성파형을 잘라내는 역할을 한다. 또, 상기 피치주기 산출부(2)는 음성파형 프레임 추출부(1)에서 잘라내어진 음성신호로부터 피치주기(Tp)를 산출하여 이 피치주기(Tp)를 시간축 신장부(3)로 입력하는 역할을 한다.
다음에는, 상기 피치주기를 산출하는 방법으로서, 자동상관함수(autocorrelation function)를 이용하여 피치주기를 산출하는 방법에 대해 설명한다. 자동상관함수를 이용해서 피치주기를 산출하는 방법에 있어서, 자동상관(自動相關)은, 입력음성신호가 유한한 시간길이를 갖고, 프레임길이(Tc)의 간격(상술한 프레임길이에 대응함) 내에서만 존재하며, 그 신호가 프레임길이(Tc)의 간격 이외에서는 항상 제로(0)라는 가정 하에서 얻어지게 된다. 즉, 이러한 단시간 자동상관값 Rn(k)는 수학식 1에 나타낸 것과 같이 얻어진다.
여기서, m = 0, 1, 2, …, Tc-1-k
Tc는 입력음성신호가 존재한다고 가정한 경우의 시간간격이고, k는 단시간 자동상관값 Rn(k)을 산출할 때에 음성파형을 지연시키는 경우의 지연시간이며, 이들 사이에는 Tc≫k의 관계가 있다. 단시간 자동상관값 Rn(k)이 최대로 되도록 k의 값이 수학식 1에서 얻어질 때 그 값이 피치주기로 된다. 이렇게 해서 얻어진 피치주기(Tp)는 시간축 신장부(3)로 보내지고, 이 시간축 신장부(3)에서는 다음에 설명하는 바와 같은 신장처리가 수행된다.
신장처리에서는, 도 2에 도시된 바와 같이 피치주기 산출부(2)에 의해 산출된 피치주기가 Tp이고, 신장계수가 R(예컨대, 1<R≤2)이며, 프레임길이 추출부의 잘라낸 음성파형이 Tc=Tp/(R-1)이라고 가정했을 때, 먼저 복수의 음성파형이 피치주기만큼 잘라내어진다. 여기서는, 파형 A와 파형 B의 연속한 2개의 음성파형이 있는 그대로 간단히 잘라내어진다. 그 후, 도 3에 도시된 바와 같이 파형 A의 음성파형이 시간축 반전에 의해 파형 A'로 변환되게 된다.
도 4에 도시된 바와 같이, 파형 B와의 접촉점[파형 A의 종단(終端)]으로부터 Lp 부분까지의 파형 A는 0∼1의 가중계수와 승산되어 파형 D1의 음성파형을 작성한다. 여기서, Lp는 소정의 시간길이로서 피치주기(Tp)보다 짧고, 대략 Lp = 1/5 ∼ 1/6Tp이다. 마찬가지로, 파형 A와의 접촉점[파형 B의 초단(初端: 시단)]으로부터 Lp 부분까지의 파형 B, 초단으로부터 Lp 부분까지의 파형 A' 및 종단으로부터 Lp 부분까지의 파형 A'는 1∼0의 사이, 0∼1의 사이 및 1∼0의 사이에서 직선적으로 각각 변화하는 가중계수와 승산되어 파형 C1, 파형 C2 및 파형 D2의 음성파형을 작성한다.
파형 C1 및 파형 C2의 작성된 음성파형과 파형 D1 및 파형 D2의 음성파형은 각각 가산되어 파형 C 및 파형 D의 음성파형을 작성한다(도 5). 더욱이, 도 6에 도시된 바와 같이, Lp 부분은 파형 A'의 음성파형의 초단 및 종단의 잘라낸 부분으로서, 이 Lp 부분에 파형 C 및 파형 D의 음성파형이 각각 삽입되어 파형 A"의 음성파형으로 합성되게 된다.
마지막으로, 이 파형 A"를 파형 A와 파형 B의 음성파형 사이에 삽입시켜 Tc=Tp/(R-1)의 파형으로부터 신장계수 R을 만족하는 Tc+Tp=Tp/(R-1)의 파형을 작성한다(도 7).
상술한 구성에 의해, 삽입되는 음성파형이 시간축 반전에 의해 변환된 파형이기 때문에, 과도하게 발생하여 입력 음성신호를 잘라내는 모든 프레임의 주기에 대응하던 소름끼치는 기생진동음이 발생하지 않게 된다. 또한, 삽입되는 음성파형의 초단부 및 종단부의 파형으로서 0∼1의 사이 또는 1∼0의 사이에서 직선적으로 변화하는 가중계수를 승산한 파형을 이용함으로써, 신장처리를 실행하는 경우에도 작은 왜곡을 갖는 음성파형이 얻어지도록 삽입되는 파형 A"와 파형 A 및 파형 B 사이에 평탄한 접점을 갖는 파형과 같이 접촉이 이루어질 수 있게 된다. 더욱이, 삽입되는 음성파형은 시간축 반전과 같은 극히 간단한 처리에 의해 실현될 수 있게 된다.
한편, 여기서는 신장처리가 파형 A의 음성파형을 변환하여 얻은 파형 A"를 삽입함으로써 수행되는 실시예에 대해 설명했지만, 마찬가지로 파형 B의 음성파형을 변환하는 경우에도 적용할 수가 있다.
다음에는, 본 발명의 1실시예의 신장처리의 흐름에 대해 도 8의 플로우차트를 참조로 해서 설명한다. 먼저, 입력되는 음성신호에서 소정의 프레임길이(Tc)의 음성파형을 잘라내고(단계 S1), 자동상관함수 등을 이용해서 이 잘라낸 프레임길이(Tc)의 음성파형으로부터 피치주기(Tp)를 얻는다(단계 S2). 이렇게 해서 얻어진 피치주기(Tp)로부터, 처리목표의 2개의 음성파형(파형 A, B)을 입력된 음성신호로부터 피치주기(Tp)만큼 잘라내고(단계 S3), 그 후 파형 A의 음성파형을 시간축 반전에 의해 파형 A'로 변환시킨다(단계 S4).
파형 B의 단부로부터 Lp 부분까지의 파형 A에 0∼1의 사이에서 직선적으로 변화하는 가중계수를 승산하여 파형 D1을 작성한다. 마찬가지로, 파형 A의 단부로부터 Lp 부분까지의 파형 B에 1∼0의 사이에서 직선적으로 변화하는 가중계수를 승산하여 파형 C1을 작성한다. 더욱이, 파형 A'의 초단 및 종단으로부터 Lp 부분까지의 부분에 각각 0∼1의 사이 및 1∼0의 사이에서 직선적으로 변화하는 가중계수를 승산하여 파형 C2와 파형 D2의 음성파형을 작성한다(단계 S5).
파형 C1과 파형 C2의 음성파형을 가산하여 파형 C의 음성파형을 작성한다(단계 S6A). 마찬가지로, 파형 D1과 파형 D2의 음성파형을 가산하여 파형 D의 음성파형을 작성한다(단계 S6B).
그 후, 파형 A'의 시작점 및 끝점으로부터 Lp 부분까지의 음성파형을 잘라내고, 그 잘라낸 부분에 파형 C와 파형 D의 음성파형을 각각 삽입함으로써, 파형 A"를 합성한다(단계 S7). 더욱이, 이 파형 A"의 음성파형을 파형 A와 파형 B 사이에 삽입해서(단계 S8) 음성파형을 신장시킨다. 다음의 프레임에 대하여 단계 S1∼S8을 반복해서 실행하고, 신장시켜야 할 입력음성신호가 입력되지 않을 때 이 신장처리를 종료한다(단계 S9).
여기서는 도 1에 구성된 음속변환장치 내에서 실시되는 신장처리에 대해 설명했지만, 상술한 단계 S1∼S8을 갖춘 신장처리는 도 1에 도시된 바와 같은 신장처리부(3) 이외에 CPU와 같은 프로세서가 구비된 컴퓨터에 의해 실행되는 소프트웨어로 실시할 수도 있다. 여기서, 잘라낸 파형에 승산되는 가중계수는 직선적으로 변화하는 형태에 한정되는 것은 아니다.
한편, 텔레비전 세트, DVD 플레이어 등에 조립되는 음성출력부와 같은 다수의 변형례 및 기타의 실시예도 본 발명에 관련된 기술분야에서 통상의 지식을 가진 자라면 본 발명의 기술을 이용해서 실시할 수 있는 것인 바, 그 실시되는 변형례는 모두 본 발명의 범위 내의 기술이라 할 것이다.
상술한 바와 같이 본 발명에 의하면, 소름끼치는 기생진동음을 발생시키지 않고도 양호한 음질을 갖는 음속변환을 극히 간단한 처리에 의해 실현할 수 있게 된다.
Claims (16)
- 입력되는 음성신호로부터 피치주기를 산출하는 피치주기 산출부와,상기 음성신호의 음성파형을 피치주기만큼 잘라내고 그 음성파형을 시간축 반전시킨 반전파형을 상기 음성신호에 삽입함으로써 신장처리를 실행하는 신장처리부를 구비하여 구성된 것을 특징으로 하는 음속변환장치.
- 입력되는 음성신호로부터 소정의 프레임길이의 음성프레임을 추출하는 음성프레임 추출부와,상기 음성프레임으로부터 피치주기를 산출하는 피치주기 산출부 및,상기 음성프레임의 음성파형을 피치주기만큼 잘라내고 그 음성파형을 시간축 반전시킨 반전파형을 상기 음성프레임에 삽입함으로써 신장처리를 실행하는 신장처리부를 구비하여 구성된 것을 특징으로 하는 음속변환장치.
- 제1항에 있어서, 상기 신장처리부가, 복수의 음성파형을 피치주기만큼 연속해서 잘라내고 적어도 하나 이상의 반전파형을 삽입함으로써 신장처리를 실행하도록 된 것을 특징으로 하는 음속변환장치.
- 제2항에 있어서, 상기 신장처리부가, 복수의 음성파형을 피치주기만큼 연속해서 잘라내고 적어도 하나 이상의 반전파형을 삽입함으로써 신장처리를 실행하도 록 된 것을 특징으로 하는 음속변환장치.
- 제1항에 있어서, 상기 신장처리부가, 상기 반전파형을 반전 전에 잘라낸 음성파형과 잘라낸 다음의 음성파형 사이에 삽입함으로써 신장처리를 실행하도록 된 것을 특징으로 하는 음속변환장치.
- 제2항에 있어서, 상기 신장처리부가, 상기 반전파형을 반전 전에 잘라낸 음성파형과 잘라낸 다음의 음성파형 사이에 삽입함으로써 신장처리를 실행하도록 된 것을 특징으로 하는 음속변환장치.
- 제5항에 있어서, 상기 반전파형이, 잘라내어 시간축 반전시킨 파형의 초단부에 가중을 부여하고, 그 부분을 반전 전에 잘라낸 음성파형의 종단부와 가산하고 합성함으로써 얻어지도록 된 것을 특징으로 하는 음속변환장치.
- 제6항에 있어서, 상기 반전파형이, 잘라내어 시간축 반전시킨 파형의 초단부에 가중을 부여하고, 그 부분을 반전 전에 잘라낸 음성파형의 종단부와 가산하고 합성함으로써 얻어지도록 된 것을 특징으로 하는 음속변환장치.
- 제5항에 있어서, 상기 반전파형이, 잘라내어 시간축 반전시킨 파형의 종단부에 가중을 부여하고, 그 부분을 잘라낸 다음의 음성파형의 초단부와 가산하고 합성 함으로써 얻어지도록 된 것을 특징으로 하는 음속변환장치.
- 제6항에 있어서, 상기 반전파형이, 잘라내어 시간축 반전시킨 파형의 종단부에 가중을 부여하고, 그 부분을 잘라낸 다음의 음성파형의 초단부와 가산하고 합성함으로써 얻어지도록 된 것을 특징으로 하는 음속변환장치.
- 입력되는 음성신호로부터 피치주기를 산출하는 단계와,상기 음성신호의 음성파형을 피치주기만큼 잘라내고 그 음성파형을 시간축 반전시킨 반전파형을 상기 음성신호에 삽입함으로써 신장처리를 실행하는 단계를 구비하여 이루어진 것을 특징으로 하는 음속변환방법.
- 제11항에 있어서, 상기 신장처리가, 복수의 음성파형을 피치주기만큼 연속해서 잘라내고 적어도 하나 이상의 반전파형을 삽입함으로써 실행되는 것을 특징으로 하는 음속변환방법.
- 제11항에 있어서, 상기 신장처리가, 상기 반전파형을 반전 전에 잘라낸 음성파형과 잘라낸 다음의 음성파형 사이에 삽입함으로써 실행되는 것을 특징으로 하는 음속변환방법.
- 제13항에 있어서, 상기 반전파형이, 잘라내어 시간축 반전시킨 파형의 초단 부에 가중을 부여하고, 그 부분을 반전 전에 잘라낸 음성파형의 종단부와 가산하고 합성함으로써 얻어지는 것을 특징으로 하는 음속변환방법.
- 제13항에 있어서, 상기 반전파형이, 잘라내어 시간축 반전시킨 파형의 종단부에 가중을 부여하고, 그 부분을 잘라낸 다음의 음성파형의 초단부와 가산하고 합성함으로써 얻어지는 것을 특징으로 하는 음속변환방법.
- 컴퓨터에 의해, 입력되는 음성신호로부터 피치주기를 산출하는 단계와, 상기 음성신호의 음성파형을 피치주기만큼 잘라내고 그 음성파형을 시간축 반전시킨 반전파형을 상기 음성신호에 삽입함으로써 신장처리를 실행하는 단계를 수행하도록 하기 위한 음속변환 프로그램이 기록된 것을 특징으로 하는 컴퓨터 독출가능 기록매체.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JPJP-P-2003-00149034 | 2003-05-27 | ||
JP2003149034A JP3871657B2 (ja) | 2003-05-27 | 2003-05-27 | 話速変換装置、方法、及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20040102336A KR20040102336A (ko) | 2004-12-04 |
KR100656968B1 true KR100656968B1 (ko) | 2006-12-13 |
Family
ID=33128213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020040037494A KR100656968B1 (ko) | 2003-05-27 | 2004-05-25 | 음속변환장치와 음속변환방법 및 컴퓨터 독출가능기록매체 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20050010398A1 (ko) |
EP (1) | EP1482483A3 (ko) |
JP (1) | JP3871657B2 (ko) |
KR (1) | KR100656968B1 (ko) |
CN (1) | CN1266675C (ko) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4550652B2 (ja) * | 2005-04-14 | 2010-09-22 | 株式会社東芝 | 音響信号処理装置、音響信号処理プログラム及び音響信号処理方法 |
EP1895511B1 (en) * | 2005-06-23 | 2011-09-07 | Panasonic Corporation | Audio encoding apparatus, audio decoding apparatus and audio encoding information transmitting apparatus |
JP5011803B2 (ja) | 2006-04-24 | 2012-08-29 | ソニー株式会社 | オーディオ信号伸張圧縮装置及びプログラム |
JP4985152B2 (ja) * | 2007-07-02 | 2012-07-25 | ソニー株式会社 | 情報処理装置、信号処理方法およびプログラム |
JP2009048676A (ja) * | 2007-08-14 | 2009-03-05 | Toshiba Corp | 再生装置および方法 |
JP5346230B2 (ja) * | 2009-03-10 | 2013-11-20 | パナソニック株式会社 | 話速変換装置 |
JP2010249940A (ja) * | 2009-04-13 | 2010-11-04 | Sony Corp | ノイズ低減装置、ノイズ低減方法 |
CN101719371B (zh) * | 2009-11-20 | 2012-04-04 | 安凯(广州)微电子技术有限公司 | 一种语音变速的方法 |
JP2012194417A (ja) * | 2011-03-17 | 2012-10-11 | Sony Corp | 音声処理装置および方法、並びにプログラム |
CN105788601B (zh) * | 2014-12-25 | 2019-08-30 | 联芯科技有限公司 | VoLTE的抖动隐藏方法和装置 |
CN106469559B (zh) * | 2015-08-19 | 2020-10-16 | 中兴通讯股份有限公司 | 语音数据的调整方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR960007843B1 (ko) * | 1990-05-28 | 1996-06-12 | 마쯔시다덴기산교 가부시기가이샤 | 음성신호처리장치 |
JP2000003199A (ja) | 1998-06-15 | 2000-01-07 | Yamaha Corp | 音声変換装置及び音声変換方法 |
JP2000099097A (ja) | 1998-09-24 | 2000-04-07 | Sony Corp | 信号再生装置及び方法、音声信号再生装置、並びに、音声信号の速度変換方法 |
JP2000259200A (ja) | 1999-03-11 | 2000-09-22 | Nippon Telegr & Teleph Corp <Ntt> | 話速変換方法および装置および話速変換プログラムを格納した記録媒体 |
KR100327969B1 (ko) | 1996-11-11 | 2002-04-17 | 모리시타 요이찌 | 음성재생속도변환장치및음성재생속도변환방법 |
KR20030015579A (ko) * | 2001-08-16 | 2003-02-25 | 주식회사 코스모탄 | 지정된 변속율에 정확하게 비례하는 재생시간을 갖도록오디오신호의 시간스케일을 수정하는 방법과 이를 위한장치 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69228211T2 (de) * | 1991-08-09 | 1999-07-08 | Koninklijke Philips Electronics N.V., Eindhoven | Verfahren und Apparat zur Handhabung von Höhe und Dauer eines physikalischen Audiosignals |
US5717823A (en) * | 1994-04-14 | 1998-02-10 | Lucent Technologies Inc. | Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders |
JPH0896514A (ja) * | 1994-07-28 | 1996-04-12 | Sony Corp | オーディオ信号処理装置 |
US5828995A (en) * | 1995-02-28 | 1998-10-27 | Motorola, Inc. | Method and apparatus for intelligible fast forward and reverse playback of time-scale compressed voice messages |
US5842172A (en) * | 1995-04-21 | 1998-11-24 | Tensortech Corporation | Method and apparatus for modifying the play time of digital audio tracks |
JP2001513225A (ja) * | 1997-12-19 | 2001-08-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 伸長オーディオ信号からの周期性の除去 |
KR100341197B1 (ko) * | 1998-09-29 | 2002-06-20 | 포만 제프리 엘 | 오디오 데이터로 부가 정보를 매립하는 방법 및 시스템 |
JP3546755B2 (ja) * | 1999-05-06 | 2004-07-28 | ヤマハ株式会社 | リズム音源信号の時間軸圧伸方法及び装置 |
US6842735B1 (en) * | 1999-12-17 | 2005-01-11 | Interval Research Corporation | Time-scale modification of data-compressed audio information |
EP1143417B1 (en) * | 2000-04-06 | 2005-12-28 | Telefonaktiebolaget LM Ericsson (publ) | A method of converting the speech rate of a speech signal, use of the method, and a device adapted therefor |
US6718309B1 (en) * | 2000-07-26 | 2004-04-06 | Ssi Corporation | Continuously variable time scale modification of digital audio signals |
JP4067762B2 (ja) * | 2000-12-28 | 2008-03-26 | ヤマハ株式会社 | 歌唱合成装置 |
US7094965B2 (en) * | 2001-01-17 | 2006-08-22 | Yamaha Corporation | Waveform data analysis method and apparatus suitable for waveform expansion/compression control |
US7233832B2 (en) * | 2003-04-04 | 2007-06-19 | Apple Inc. | Method and apparatus for expanding audio data |
-
2003
- 2003-05-27 JP JP2003149034A patent/JP3871657B2/ja not_active Expired - Fee Related
-
2004
- 2004-05-25 KR KR1020040037494A patent/KR100656968B1/ko not_active IP Right Cessation
- 2004-05-26 US US10/853,261 patent/US20050010398A1/en not_active Abandoned
- 2004-05-26 EP EP04253085A patent/EP1482483A3/en not_active Withdrawn
- 2004-05-27 CN CNB2004100475810A patent/CN1266675C/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR960007843B1 (ko) * | 1990-05-28 | 1996-06-12 | 마쯔시다덴기산교 가부시기가이샤 | 음성신호처리장치 |
KR100327969B1 (ko) | 1996-11-11 | 2002-04-17 | 모리시타 요이찌 | 음성재생속도변환장치및음성재생속도변환방법 |
JP2000003199A (ja) | 1998-06-15 | 2000-01-07 | Yamaha Corp | 音声変換装置及び音声変換方法 |
JP2000099097A (ja) | 1998-09-24 | 2000-04-07 | Sony Corp | 信号再生装置及び方法、音声信号再生装置、並びに、音声信号の速度変換方法 |
JP2000259200A (ja) | 1999-03-11 | 2000-09-22 | Nippon Telegr & Teleph Corp <Ntt> | 話速変換方法および装置および話速変換プログラムを格納した記録媒体 |
KR20030015579A (ko) * | 2001-08-16 | 2003-02-25 | 주식회사 코스모탄 | 지정된 변속율에 정확하게 비례하는 재생시간을 갖도록오디오신호의 시간스케일을 수정하는 방법과 이를 위한장치 |
Non-Patent Citations (3)
Title |
---|
1003279690000 |
1020030015579 |
12099097 |
Also Published As
Publication number | Publication date |
---|---|
CN1573931A (zh) | 2005-02-02 |
US20050010398A1 (en) | 2005-01-13 |
CN1266675C (zh) | 2006-07-26 |
KR20040102336A (ko) | 2004-12-04 |
JP2004354462A (ja) | 2004-12-16 |
JP3871657B2 (ja) | 2007-01-24 |
EP1482483A3 (en) | 2006-11-02 |
EP1482483A2 (en) | 2004-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5630013A (en) | Method of and apparatus for performing time-scale modification of speech signals | |
JP2782147B2 (ja) | 波形編集型音声合成装置 | |
KR100656968B1 (ko) | 음속변환장치와 음속변환방법 및 컴퓨터 독출가능기록매체 | |
US8331583B2 (en) | Noise reducing apparatus and noise reducing method | |
EP1840871B1 (en) | Audio waveform processing device, method, and program | |
JP4550652B2 (ja) | 音響信号処理装置、音響信号処理プログラム及び音響信号処理方法 | |
JPH07160299A (ja) | 音声信号帯域圧縮伸張装置並びに音声信号の帯域圧縮伝送方式及び再生方式 | |
US6519567B1 (en) | Time-scale modification method and apparatus for digital audio signals | |
EP1074968B1 (en) | Synthesized sound generating apparatus and method | |
CA2242610C (en) | Sound reproducing speed converter | |
JPH09127995A (ja) | 信号復号化方法及び信号復号化装置 | |
KR100677612B1 (ko) | 오디오 재생 속도 제어 장치 및 그 방법 | |
JP2001255882A (ja) | 音声信号処理装置及びその信号処理方法 | |
JP2957861B2 (ja) | 音声時間軸圧縮伸長装置 | |
JP2022045086A (ja) | 残響を求めるためのシステム | |
JPH1078791A (ja) | ピッチ変換器 | |
JPH06222794A (ja) | 音声速度変換方法 | |
JP2951181B2 (ja) | 音声時間軸圧縮装置及び音声時間軸伸長装置、並びに音声時間軸圧縮伸長装置 | |
JP3639461B2 (ja) | 音声信号のピッチ周期抽出方法、及び音声信号のピッチ周期抽出装置、音声信号の時間軸圧縮装置、音声信号の時間軸伸長装置、音声信号の時間軸圧縮伸長装置 | |
JP3112462B2 (ja) | 音声符号化装置 | |
JPH07302097A (ja) | 音声の時間軸圧縮方法、及び伸長方法、並びに音声の時間軸圧縮伸長方法 | |
JP2006139158A (ja) | 音響信号の合成装置および合成再生装置 | |
JPS61148499A (ja) | 音声信号帯域圧縮方式 | |
JP2000232367A (ja) | トリプレット情報処理装置及びその方法 | |
JPH0519791A (ja) | 雑音抑圧装置と雑音抑圧方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |