KR20010085664A - 화속 변환 장치 - Google Patents

화속 변환 장치 Download PDF

Info

Publication number
KR20010085664A
KR20010085664A KR1020010010011A KR20010010011A KR20010085664A KR 20010085664 A KR20010085664 A KR 20010085664A KR 1020010010011 A KR1020010010011 A KR 1020010010011A KR 20010010011 A KR20010010011 A KR 20010010011A KR 20010085664 A KR20010085664 A KR 20010085664A
Authority
KR
South Korea
Prior art keywords
rate
speech
data
audio data
memory
Prior art date
Application number
KR1020010010011A
Other languages
English (en)
Inventor
이노우에다께오
Original Assignee
다카노 야스아키
산요 덴키 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 다카노 야스아키, 산요 덴키 가부시키가이샤 filed Critical 다카노 야스아키
Publication of KR20010085664A publication Critical patent/KR20010085664A/ko

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

음성 재생 장치로부터 입력되는 입력 음성 신호를 화속 변환 처리하는 화속 변환 처리 수단, 화속 변환 처리 수단의 출력이 기입되는 음성 데이터 축적용 메모리, 및 음성 데이터 축적용 메모리로부터 음성 데이터를 판독하는 수단을 구비한 화속 변환 장치에 있어서, 음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적율을 산출하는 산출 수단, 및 음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적율에 따라서, 음성 재생 장치의 재생 속도를 제어하는 제어 수단을 구비하고 있다.

Description

화속 변환 장치{SPEECH SPEED CONVERTING DEVICE}
본 발명은 화속 변환 장치(話速變換裝置)에 관한 것이다.
VTR의 고속 재생시에 있어서, 비디오 테이프로부터 판독된 음성 신호 중, 무음 구간의 음성 신호를 삭제하고, 음성 구간의 음성 신호를 시간축 압축신장부에 의해 시간축 상에 있어서 압축하여, 음성 구간의 음성을 사용자에 의해서 설정된 VTR의 재생 속도(설정 재생 속도)보다 느린 속도로 출력하는 화속 변환 장치가 공지되어 있다(특개평7-192392호 참조).
이와 같은 화속 변환 장치 에서는 입력 음성의 화속을 느리게 하여 출력할 때에 입력 음성과 출력 음성 사이에 생기는 시간적인 지연량을 흡수하기 위한 링 메모리(음성 데이터 축적용 메모리)가 설치되어 있다. 링 메모리 내의 미판독의 음성 데이터의 축적량이 링 메모리의 용량을 넘으면, 출력되는 음성 구간의 음성에 끊김이 생긴다.
그래서, 링 메모리 내의 미판독의 음성 데이터의 축적량이 링 메모리의 용량을 넘지 않도록 하기 위해서, 링 메모리 내의 미판독의 음성 데이터의 축적량이 소정량을 넘었을 때에, 시간축 압축신장부의 압축율을 변화시키고 있다. 그러나, 이와 같이 하면, 출력 음성 속도가 빠르게 된다고 하는 문제가 있다.
또한, 고령자 등에의 청각 보조 또는 어학 학습를 위해, 테이프 레코더 등의 음성 재생 장치로부터 출력되는 음성의 화속을 느리게 하는 화속 변환 장치가 실용화되어 있지만, 이 경우에도 마찬가지의 문제가 있다.
본 발명의 목적은 음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적량이 증가한 경우라도, 출력 음성의 화속을 그다지 빠르게 하지 않고, 음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적량이 음성 데이터 축적용 메모리의 용량을 넘지 않도록 할 수 있는 화속 변환 장치를 제공하는 것이다.
본 발명에 의한 제1의 화속 변환 장치는 음성 재생 장치로부터 입력되는 입력 음성 신호를 화속 변환 처리하는 화속 변환 처리 수단, 화속 변환 처리 수단의 출력이 기입되는 음성 데이터 축적용 메모리 및 음성 데이터 축적용 메모리로부터 음성 데이터를 판독하는 수단을 구비한 화속 변환 장치에 있어서, 음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적율을 산출하는 산출 수단 및 음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적율에 따라서, 음성 재생 장치의 재생 속도를 제어하는 제어 수단을 구비하는 것을 특징으로 한다.
화속 변환 처리 수단으로서는 예를 들면, 입력 음성 신호가 음성 구간인지 무음 구간인지를 판정하는 구간 판정 수단, 무음 구간이라고 판정된 입력 음성 신호를 삭제 처리하는 삭제 처리 수단, 및 유음 구간이라고 판정된 입력 음성 신호를, 메모리 내의 미판독의 음성 데이터의 축적율에 따른 압축율로 시간축 압축신장 처리하는 시간축 압축신장 처리 수단을 구비하고 있는 것이 이용된다.
음성 재생 장치로서는 예를 들면, VTR, 하드디스크 레코더가 이용된다.
본 발명에 의한 제2의 화속 변환 장치는 음성 재생 장치로부터 입력되는 아날로그 음성 신호를 설정된 재생 속도 배율에 따른 샘플링 주파수로 샘플링하는 A/D변환 수단, A/D 변환 수단으로부터 출력되는 음성 데이터가 입력되는 프레임 메모리, 프레임 메모리에 소요수의 음성 데이터가 입력될 때마다 이들 음성 데이터에 대한 화속 변환 처리를 행하는 화속 변환 처리 수단, 화속 변환 처리 수단의 출력이 기입되는 음성 데이터 축적용 메모리, 및 음성 데이터 축적용 메모리로부터 음성 데이터를 판독하는 수단을 구비한 화속 변환 장치에 있어서, 음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적율을 산출하는 산출 수단, 및 음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적율에 따라서, 음성 재생 장치의 재생 속도를 제어하는 제어 수단을 구비하는 것을 특징으로 한다.
본 발명에 의한 제3의 화속 변환 장치는 음성 재생 장치로부터 입력되는 디지털 음성 신호가 설정된 재생 속도 배율에 따른 속도로 기입되는 프레임 메모리, 프레임 메모리에 소요수의 음성 데이터가 입력될 때마다, 이들 음성 데이터에 대한 화속 변환 처리를 행하는 화속 변환 처리 수단, 화속 변환 처리 수단의 출력이 기입되는 음성 데이터 축적용 메모리, 및 음성 데이터 축적용 메모리로부터 음성 데이터를 판독하는 수단을 구비한 화속 변환 장치에 있어서, 음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적율을 산출하는 산출 수단, 및 음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적율에 따라서, 음성 재생 장치의 재생 속도를 제어하는 제어 수단을 구비하고 있는 것을 특징으로 한다.
상기 제 2 또는 제3의 화속 변환 장치에 있어서의 화속 변환 처리 수단으로서는 예를 들면, 프레임 메모리에 입력된 소요수의 음성 데이터에 대응하는 입력음성이 음성 구간인지 무음 구간인지를 판정하는 구간 판정 수단, 무음 구간이라고 판정된 음성 데이터를 삭제 처리하는 삭제 처리 수단, 및 유음 구간이라고 판정된 음성 데이터를, 음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적율에 따른 압축율로 시간축 압축신장 처리하는 시간축 압축신장 처리 수단을 구비하고 있는 것이 이용된다.
도 1은 제1의 실시 형태인 화속 변환 장치의 구성을 나타내는 블록도.
도 2는 제1의 실시 형태의 변형예를 나타내는 블록도.
도 3은 제2의 실시 형태인 화속 변환 장치의 구성을 나타내는 블록도.
도 4는 제3의 실시 형태인 화속 변환 장치의 구성을 나타내는 블록도.
<도면의 주요 부분에 대한 부호의 설명>
1 : A/D 변환부
2 : 프레임 메모리
3 : 구간 판정 회로
4 : 무음 구간 삭제부
5 : 시간축 압축신장부
6 : 링 메모리
7 : 축적율 산출부
8 : 적응 화속 제어부
9 : D/A 변환부
11 : 음성 부호화부
20 : VTR
이하, 도면을 참조하여, 본 발명의 실시 형태에 관해서 설명한다.
〔1〕 제1의 실시 형태의 설명
도 1은 VTR의 고속 재생시에 있어서, 사용자에 의해서 설정된 VTR(20)의 재생 속도(설정 재생 속도)보다 느린 속도로 음성을 출력하는 화속 변환 장치의 구성을 보이고 있다. 도 1에는 도시하지 않지만, VTR에서 출력된 영상 신호는 도시하지 않은 모니터에 표시된다.
VTR(20)로부터 출력된 음성 신호는, A/D 변환부(1)에 보내여지고, 예를 들면 12 비트의 디지털 신호로 변환된다.
A/D 변환부(1)의 출력은 프레임 메모리(2)에 일단 저장된다. 구간 판정부(3), 무음 구간 삭제부(4) 및 시간축 압축신장부(5)는 프레임 메모리(2)에 저장된 1 프레임 단위의 음성 데이터에 대하여 처리를 행한다.
구간 판정부(3)는 1 프레임분의 음성 데이터의 파워의 평균치, 파워의 누적치, 진폭 평균치, 진폭 누적치 등에 기초하여, 입력 음성이 음성 구간인지 무음 구간인지를 판정한다. 무음 구간 삭제부(4)는 구간 판정부(3)에 의해서 무음 구간이라고 판정된 음성 데이터를 삭제한다. 무음 구간 삭제부(4)에 의해서 무음 구간의 음성 데이터가 삭제된 후의 음성 데이터(음성 구간의 음성 데이터)는 시간축 압축신장부(5)에 보내여지고, 시간축 압축신장 처리가 행해진다.
시간축 압축신장부(5)에 의해서 시간축 압축신장 처리가 행해진 음성 데이터는 링 메모리(음성 데이터 축적용 메모리)(6)에 일단 축적된다. 링 메모리(6)에 축적된 음성 데이터는 판독되어 D/A 변환부(9)에 보내여지고, 아날로그 신호로 변환되어 일정속도로 출력된다.
링 메모리(6) 내의 미판독의 음성 데이터의 축적율이 축적율 산출부(7)에 의해서 산출된다. 여기서, 링 메모리(6) 내의 미판독의 음성 데이터의 축적율이란, 링 메모리(6)에 기억할 수 있는 음성 데이터 총량에 대한 미판독의 음성 데이터의 축적량의 비율〔%〕을 말한다. 축적율 산출부(7)에 의해서 산출된 축적율은 적응 화속 제어부(8)에 보내짐과 동시에 VTR(20)의 재생 속도를 제어하는 재생 속도 제어부(21)에 보내진다.
이하의 설명에 있어서, 압축율이란, 시간축 압축신장부(5)에의 입력 신호의 시간 길이(데이터수)를 P, 상기 입력 신호에 대한 시간축 압축신장부(5)로부터 출력되는 출력 신호의 시간 길이(데이터수)를 Q로 하면, P/Q로 정의된다. 또한, 링 메모리(6) 내의 미판독의 음성 데이터의 축적율을, 단순히 축적율이라고 하는 것으로 한다.
적응 화속 제어부(8)는 축적율에 기초하여 시간축 압축신장부(5)에서 이용되는 압축율을 제어한다. 또한, 재생 속도 제어부(21)는 사용자에 의해서 설정된VTR(20)의 재생 속도 배율(이하, 설정 재생 속도 배율이라 함)과 축적율에 기초하여, VTR(20)의 실제의 재생 속도(실제의 재생 속도 배율)을 제어한다.
A/D 변환부(1)의 표준 샘플링 주파수 및 D/A 변환부(9)의 표준 샘플링 주파수는 이 예에서 8 kHz이다. VTR(20)의 재생 속도 배율이 M의 경우에는 M 배속 재생시에 A/D 변환부(1)에 의해서 얻어지는 샘플링 데이터와 표준 재생 속도에서의 재생시에 A/D 변환부(1)에 의해서 얻어지는 샘플링 데이터를 일치시키기 위해서, A/D 변환부(1)의 샘플링 주파수 fAD는 D/A 변환부9의 샘플링 주파수 fDA의 M배로 설정된다. 따라서, M=2의 경우(2 배속 재생시)에는 fAD=16 kHz가 되고, fDA=8 kHz가 된다. D/A 변환부(9)의 샘플링 주파수 fDA는 재생 속도 배율에 관계없이, 항상 표준 샘플링 주파수(8 kHz)로 유지된다.
2 배속 재생시에 있어서, 음성을 설정 재생 속도보다 느린 속도로 출력하는 경우의 적응 화속 제어부(8) 및 재생 속도 제어부(21)의 동작에 관해서 설명한다.
표1은 설정 재생 속도 배율이 2인 경우의 축적율과 압축율의 관계 및 축적율과 재생 속도 배율의 관계를 나타내고 있다. 표1에 있어서, 메모리 잔량율이란, 100에서 축적율〔%〕을 감산한 값을 말한다.
압축율(메모리 축적율) 압축율 재생 속도 배율
0∼20% (80∼100) 1 2
20∼40% (60∼80) 1. 2 2
40∼60% (40∼60) 1. 4 2
60∼80% (20∼40) 1. 4 1. 8
80∼95% (5∼20) 1. 4 1. 6
95∼100% (0∼5) 1. 4 1. 4
적응 화속 제어부(8)는 표1의 축적율과 압축율의 관계를 기억한 축적율/압축율 테이블을 구비하고 있다. 또한, 재생 속도 제어부(21)는 표1의 축적율과 재생 속도 배율의 관계를 기억한 축적율/재생 속도배율 테이블을 구비하고 있다.
적응 화속 제어부(8)는 축적율 산출부7로부터 축적율이 보내져오면, 축적율/압축율 테이블에 기초하여, 축적율 산출부7로부터 보내여져 온 축적율에 대응하는 압축율을 판독하여, 시간축 압축신장부(5)에 설정한다. 재생 속도 제어부(21)는 축적율 산출부(7)로부터 축적율이 보내져오면, 축적율/재생 속도배율 테이블에 기초하여, 축적율 산출부(7)로부터 보내여져 온 축적율에 대응하는 재생 속도 배율을 판독하여, VTR(20)의 재생 속도를 판독한 재생 속도 배율에 따른 속도가 되도록 제어한다.
(1) 축적율이 0∼20%(0 이상이고 또한 20% 미만)인 경우
축적율이 0∼20%인 경우에는 압축율은 1로 설정되어, 재생 속도 배율은 설정 재생 속도 배율인 2로 설정된다. 이 경우에는 설정 재생 속도 배율2에 따른 재생 속도로 VTR(20)로부터 출력된 음성 신호는 A/D 변환부(1)에 의해서 D/A 변환부(9)의 표준 샘플링 주파수의 2배의 주파수(16 kHz)로 샘플링되어 프레임 메모리(2)에 저장된다.
프레임 메모리(2)에 저장된 음성 데이터는 무음 구간 삭제부(4)에 의해서 무음 구간의 데이터가 삭제된 후, 시간축 압축신장부(5)에서 시간축 압축신장 처리는 행해지지 않고, 링 메모리(6)에 축적된다. 링 메모리(6)에 축적된 음성 데이터는 D/A 변환부(9)에 의해서 표준 샘플링 주파수(8 kHz)로 샘플링되어 출력된다. 따라서, 출력 음성의 화속은 표준 재생 속도(1 배속 재생 시의 재생 속도)로 재생되었을 때의 출력 음성의 화속과 같게 된다.
링 메모리(6)에의 데이터 기입 속도는 링 메모리(6)로부터의 데이터 판독 속도보다 빠르기 때문에, 링 메모리(6) 내의 미판독의 음성 데이터의 축적량이 증가하여 간다. 미판독의 음성 데이터의 축적량이 증가하여 가는 속도는 입력 음성 데이터에 무음 구간의 데이터가 적은 만큼, 빠르게 된다.
(2) 축적율이 20∼40%인 경우
축적율이 20∼40%인 경우에는 압축율이 1.2로 설정된다. 단, 재생 속도 배율은 그대로 2이다. 이 경우에는 시간축 압축신장부(5)는 입력 신호의 시간 길이 P와 출력 신호의 시간 길이 Q의 비가 1.2:1이 되도록, 입력 데이터에 대하여 시간축 압축 처리를 행한다. 이 결과, 출력 음성의 화속은 표준 재생 속도(1 배속 재생 시의 재생 속도)로 재생되었을 때의 출력 음성의 화속보다 약간 빠르게 된다. 한편, 링 메모리(6)에 입력되는 음성 구간의 음성 데이터량이 저감되기 때문에, 상기 (1)의 경우와 비교하여, 링 메모리(6)로부터 판독되는 데이터량에 대한 링 메모리(6)에 기입되는 데이터량의 비를 작게 할 수가 있다.
(3) 축적율이 40∼60%인 경우
축적율이 40∼60%인 경우에는 압축율이 1.4로 설정된다. 단, 재생 속도 배율은 그대로 2이다. 이 경우에 시간축 압축신장부(5)는 입력 신호의 시간 길이 P와 출력 신호의 시간 길이 Q의 비가 1.4:1이 되도록, 입력 데이터에 대하여 시간축 압축 처리를 행한다. 이 결과, 출력 음성의 화속은 상기 (2)의 경우와 비교하여더욱 빠르게 된다. 한편, 링 메모리(6)에 입력되는 음성구간의 음성 데이터량이 상기 (2)의 경우와 비교하여 더욱 저감되기 때문에, 상기 (2)의 경우와 비교하여, 링 메모리(6)로부터 판독되는 데이터량에 대한 링 메모리(6)에 기입되는 데이터량의 비를 작게 할 수가 있다.
(4) 축적율이 60∼80%인 경우
축적율이 60∼80%인 경우에는, 압축율이 1.4로 설정되고, 재생 속도 배율이 1.8배로 설정된다. 이 경우에는 A/D 변환부(1)의 샘플링 주파수 fAD는 D/A 변환부(9)의 표준 샘플링 주파수 fDA의 1.8배로 설정된다. 또한, 시간축 압축신장부(5)는 입력 신호의 시간 길이 P와 출력 신호의 시간 길이 Q의 비가 1.4:1이 되도록, 입력 데이터에 대하여 시간축 압축 처리를 행한다. 또한, 재생 속도 제어부(21)는 VTR(20)의 재생 속도를 재생 속도 배율 1.8에 따른 속도가 되도록 제어한다.
재생 속도 배율이 1.8로 설정되기 때문에, 상기 (3)의 경우와 비교하여, 링 메모리(6)에의 데이터의 기입 속도가 저하하므로, 상기 (3)의 경우와 비교하여, 링 메모리(6)로부터 판독되는 데이터량에 대한 링 메모리(6)에 기입되는 데이터량의 비를 작게 할 수가 있다.
(5) 축적율이 80∼95%인 경우
축적율이 80∼95%인 경우에는 압축율이 1.4로 설정되고, 재생 속도 배율이 1.6배로 설정된다. 이 경우에는 A/D 변환부(1)의 샘플링 주파수 fAD는 D/A변환부(9)의 표준 샘플링 주파수 fDA의 1.6배로 설정된다. 또한, 시간축 압축신장부(5)는 입력 신호의 시간 길이 P와 출력 신호의 시간 길이 Q의 비가 1.6:1이 되도록, 입력 데이터에 대하여 시간축 압축 처리를 행한다. 또한, 재생 속도 제어부(21)는 VTR(20)의 재생 속도를 재생 속도배율 1.6에 따른 속도가 되도록 제어한다.
재생 속도배율이 1.6으로 설정되기 때문에, 상기 (4)의 경우와 비교하여, 링 메모리(6)에의 데이터의 기입 속도가 저하하기 때문에, 상기 (4)의 경우와 비교하여, 링 메모리(6)로부터 판독되는 데이터량에 대한 링 메모리(6)에 기입되는 데이터량의 비를 작게 할 수가 있다.
(6) 축적율이 95∼100%인 경우
축적율이 95∼100%인 경우에는 압축율이 1.4로 설정되고, 재생 속도 배율이 1.4배로 설정된다. 이 경우에는 A/D 변환부(1)의 샘플링 주파수 fAD는 D/A 변환부(9)의 표준 샘플링 주파수 fDA의 1.4배로 설정된다. 또한, 시간축 압축신장부(5)는 입력 신호의 시간 길이 P와 출력 신호의 시간 길이 Q의 비가 1.4:1이 되도록, 입력 데이터에 대하여 시간축 압축 처리를 행한다. 또한, 재생 속도 제어부(21)는 VTR(20)의 재생 속도를 재생 속도 배율 1.4에 따른 속도가 되도록 제어한다.
재생 속도 배율이 1.4로 설정되기 때문에, 상기 (5)의 경우와 비교하여, 링 메모리(6)에의 데이터의 기입 속도가 저하하기 때문에, 상기 (5)의 경우와 비교하여, 링 메모리(6)로부터 판독되는 데이터량에 대한, 링 메모리(6)에 기입되는 데이터량의 비를 작게 할 수가 있다.
또한, 미판독의 음성 데이터의 축적율이 작은 경우, 예를 들면, 미판독의 음성 데이터의 축적율이 20% 미만일 때에, 무음 구간 삭제부(4)에 의한 삭제 동작을 정지시키는 바와 같이 하더라도 좋다.
또한, 링 메모리(6)로서, 보다 용량이 작은 것을 이용하고 싶은 경우에는 도 2에 도시한 바와 같이, 링 메모리(6)의 전단에, 시간축 압축신장부(5)로부터 출력되는 음성 데이터를 부호화하는 음성 부호화부(11)를 설치함과 동시에 링 메모리(6)의 후단에, 링 메모리(6)로부터 판독된 부호화 데이터를 복호하는 음성 복호화부(12)를 설치하면 좋다.
〔2〕 제2의 실시 형태의 설명
도 3은 테이프 레코더 등의 음성 재생 장치에 있어서, 음성을 표준 재생 속도보다 느린 속도로 출력하는 화속 변환 장치의 구성을 보이고 있다. 도 3에 있어서, 도 1과 같은 것에는 동일 부호를 붙이고 그 설명을 생략한다.
도 3에 있어서, (30)은 음성 재생 장치이고, (31)은 음성 재생 장치(30)의 재생 속도 제어부이다.
음성 재생 장치(30)의 재생 속도 배율이 M의 경우에는 M 배속 재생시에 A/D 변환부(1)에 의해서 얻어지는 샘플링 데이터와 표준 재생 속도에서의 재생시에 A/D 변환부(1)에 의해서 얻어지는 샘플링 데이터를 일치시키기 위해서, A/D 변환부(1)의 샘플링 주파수 fAD는 D/A 변환부9의 샘플링 주파수 fDA의 M 배로 설정된다.D/A 변환부(9)의 샘플링 주파수 fDA는 재생 속도배율에 관계없이, 항상 표준 샘플링 주파수로 유지된다.
표준 재생 속도(1 배속 재생 시의 재생 속도)로 재생하는 경우에 있어서, 음성을 표준 재생 속도보다 느린 속도로 출력시키는 경우의 적응 화속 제어부(8) 및 재생 속도 제어부(31)의 동작에 관해서 설명한다.
표2는 설정 재생 속도배율이 1인 경우의 축적율과 압축율의 관계 및 축적율과 재생 속도 배율의 관계를 나타내고 있다.
압축율(메모리 축적율) 압축율 재생 속도 배율
0∼20% (80∼100) 0. 7 1
25∼50% (50∼75) 0. 8 1
50∼75% (25∼50) 0. 9 0. 9
75∼100% (0∼25) 1 0. 8
적응 화속 제어부(8)는 표2의 축적율과 압축율의 관계를 기억한 축적율/압축율 테이블을 구비하고 있다. 또한, 재생 속도 제어부(31)는 표2의 축적율과 재생 속도 배율의 관계를 기억한 축적율/재생 속도 배율 테이블을 구비하고 있다.
적응 화속 제어부(8)는 축적량 산출부(7)로부터 미판독의 음성 데이터의 축적율이 보내져오면, 축적율/압축율 테이블에 기초하여, 축적량 산출부(7)로부터 보내져 온 축적율에 대응하는 압축율을 판독하여, 시간축 압축신장부(5)에 설정한다. 재생 속도 제어부(31)는 축적량 산출부(7)로부터 미판독의 음성 데이터의 축적율이 보내져오면, 축적율/재생 속도 배율 테이블에 기초하여, 축적량 산출부(7)로부터 보내져 온 축적율에 대응하는 재생 속도 배율을 판독하여, 음성 재생 장치(30)의 재생 속도를 판독한 재생 속도 배율에 따른 속도가 되도록 제어한다.
(1) 축적율이 0∼25%인 경우
축적율이 0∼25%인 경우에, 압축율은 0.7로 설정되고, 재생 속도 배율은 설정 재생 속도 배율인 1로 설정된다. 이 경우에는 음성 재생 장치(30)로부터 재생 속도 배율이 1의 속도로 출력된 음성 신호는 A/D 변환부(1)에 의해서 D/A 변환부(9)의 표준 샘플링 주파수와 동일 샘플링 주파수로 샘플링되어 프레임 메모리(2)에 저장된다.
프레임 메모리(2)에 저장된 음성 데이터는 무음 구간 삭제부(4)에 의해서 무음 구간의 데이터가 삭제된 후, 시간축 압축신장부(5)에 보내여진다. 시간축 압축신장부(5)에서는 입력 신호의 시간 길이 P와 출력 신호의 시간 길이 Q의 비가 0.7:1이 되도록, 입력 데이터(음성 구간의 음성 데이터)에 대하여 시간축 신장 처리가 행해진다.
시간축 압축신장부(5)에 의해서 시간축 신장 처리가 행해진 뒤의 음성 데이터는 링 메모리(6)에 축적된다. 링 메모리(6)에 축적된 음성 데이터는 D/A 변환부(9)에 의해서 표준 샘플링 주파수로 샘플링되어 출력된다.
음성 구간의 음성 데이터는 시간축 상에서 신장된 후에 링 메모리(6)에 기입되고 있기 때문에, 출력 음성의 화속은 표준 재생 속도로 재생되었을 때의 출력 음성의 화속보다 늦어진다. 단, 무음 구간의 음성 데이터가 적은 만큼, 링 메모리(6) 내의 미판독의 음성 데이터의 축적량이 증가하여 간다.
(2) 축적율이 25∼50%인 경우
축적율이 25∼50%인 경우에는 압축율이 0.8로 설정된다. 단, 재생 속도 배율은 그대로 1이다. 이 경우에는 시간축 압축신장부(5)가 입력 신호의 시간 길이 P와 출력 신호의 시간 길이 Q의 비가 0.8:1이 되도록, 입력 데이터에 대하여 시간축 신장 처리를 행한다. 이 결과, 출력 음성의 화속은 표준 재생 속도로 재생되었을 때의 출력 음성의 화속보다 느리지만 상기 (1)의 경우와 비교하여 약간 빠르게 된다. 단, 링 메모리(6)에 입력되는 음성 구간의 음성 데이터량이 상기 (1)의 경우와 비교하여 저감하기 때문에, 상기 (1)의 경우와 비교하여, 링 메모리(6)로부터 판독되는 데이터량에 대한, 링 메모리(6)에 기입되는 데이터량의 비를 작게 할 수가 있다.
(3) 축적율이 50∼75%인 경우
축적율이 50∼75%인 경우에는 압축율이 0.9로 설정되고, 재생 속도 배율이 0. 9로 설정된다. 이 경우에는 A/D 변환부(1)의 샘플링 주파수 fAD는 D/A 변환부(9)의 표준 샘플링 주파수 fDA의 0.9배로 설정된다.
또한, 시간축 압축신장부(5)는 단위 시간당의 데이터 입력 갯수 P와 단위 시간당의 데이터 출력 갯수 Q의 비가 0.9:1이 되도록, 입력 데이터에 대하여 시간축 신장 처리를 행한다. 또한, 재생 속도 제어부(31)는 음성 재생 장치(30)의 재생 속도를 재생 속도 배율 0.9에 따른 속도가 되도록 제어한다.
상기 (2)의 경우와 비교하여, 시간축 상의 압축율이 크게 되어 있음과 동시에, 재생 속도 배율이 상기 (2)와 비교하여 작게 되어 있기 때문에, 상기 (2)의 경우와 비교하여, 링 메모리(6)로부터 판독되는 데이터량에 대한, 링 메모리(6)에 기입되는 데이터량의 비를 작게 할 수가 있다. 단, 재생 속도 배율이 상기 (2)와 비교하여 작게 되어 있기 때문에, 압축율만을 크게 하는 경우와 비교하여, 출력 음성의 화속은 빠르게 되지 않는다.
(4) 축적율이 75∼100%인 경우
축적율이 75∼100%인 경우에는 압축율이 1.0으로 설정되고, 재생 속도 배율이 0.8배로 설정된다. 이 경우에는 A/D 변환부(1)의 샘플링 주파수 fAD는 D/A 변환부(9)의 표준 샘플링 주파수 fDA의 0. 8배로 설정된다.
또한, 시간축 압축신장부(5)는 시간축 신장 처리를 행하지 않는다. 재생 속도 제어부(31)는 음성 재생 장치(30)의 재생 속도를 재생 속도 배율 0.8에 따른 속도가 되도록 제어한다.
상기 (3)의 경우와 비교하여, 시간축 상의 압축율이 크게 되어 있음과 동시에, 재생 속도 배율이 상기 (3)과 비교하여 작게 되어 있기 때문에, 상기 (3)의 경우와 비교하여, 링 메모리(6)로부터 판독되는 데이터량에 대한, 링 메모리(6)에 기입되는 데이터량의 비를 작게 할 수가 있다. 단, 재생 속도 배율이 상기 (3)과 비교하여 작게 되어 있기 때문에, 압축율만을 크게 하는 경우와 비교하여, 출력 음성의 화속은 빠르게 되지 않는다.
또한, 미판독의 음성 데이터의 축적율이 작은 경우, 예를 들면, 미판독의 음성 데이터의 축적율이 20% 미만일 때에, 무음 구간 삭제부(4)에 의한 삭제 동작을 정지시키는 바와 같이 하더라도 좋다.
또한, 링 메모리(6)로서, 보다 용량이 작은 것을 이용하고 싶은 경우에는 도 3과 마찬가지로, 링 메모리(6)의 전단에, 시간축 압축신장부(5)로부터 출력되는 음성 데이터를 부호화하는 음성 부호화부를 설치함과 동시에 링 메모리(6)의 후단에, 링 메모리(6)로부터 판독된 부호화 데이터를 복호하는 음성 복호화부를 설치하면 좋다.
상기 제1의 실시 형태 및 제2의 실시 형태에서는 VTR(20) 또는 음성 재생 장치(30)로부터 아날로그의 음성 신호가 보내져오는 경우에 관해서 설명했지만, VTR(20) 또는 음성 재생 장치(30)로부터 디지털의 음성 데이터가 보내져오는 경우에도 본 발명을 적용할 수가 있다. 이 경우에는 VTR(20) 또는 음성 재생 장치(30)로부터 보내져 온 디지털의 음성 데이터를 재생 속도 배율에 따른 기입 속도로 프레임 메모리(2)에 기입하여, 1 배속 재생 시의 프레임 메모리(2)에의 음성 데이터의 기입 속도와 동일 속도로 링 메모리로부터 데이터를 판독하면 좋다.
〔3〕 제3의 실시 형태의 설명
도4는 하드디스크 레코더의 재생 회로에 화속 변환 장치를 응용한 예를 도시하고 있다. 도 4에 있어서, 도 1과 같은 것에는 동일 부호를 붙이고 그 설명을 생략한다.
도 4에 있어서, (40)은 하드디스크 레코더에 설치되고 또한 음성 데이터가 저장되는 하드디스크(HD)이다. (41)은 재생시에 있어서, 하드디스크(40)로부터 판독된 음성 데이터를 일시적으로 저장하는 버퍼이다. (42)는 버퍼(41)로부터 음성 데이터를 출력하는 속도를 제어하는 재생 속도 제어부이다.
도 4에 있어서는 하드디스크(40)에 음성 데이터를 저장하기 위한 음성 기록 회로는 생략하고 있다. 이 하드디스크 레코더에서는 재생 모드로서, 출력 음성이 말을 빠름하는 것으로 되거나, 음성 정보의 누락을 방지하면서, 단시간에 재생을 행하기 위한 빨리 듣기 모드와 화속을 느리게 하여 재생하는 늦게 듣기 모드가 있다. 이하, 이들 각 재생 모드 시의 동작에 관해서 설명한다.
〔3-1〕빨리 듣기 모드 시의 동작의 설명
표3은 빨리 듣기 모드 시의 축적율과 압축율의 관계 및 축적율과 버퍼로부터 음성 데이터를 출력하는 속도의 배율(재생 속도배율)과의 관계를 나타내고 있다.
압축율(메모리 축적율) 압축율 버퍼로부터의 출력 속도 배율
0∼20% (80∼100) 1 2
20∼40% (60∼80) 1. 2 2
40∼60% (40∼60) 1. 4 2
60∼80% (20∼40) 1. 4 1. 8
80∼95% (5∼20) 1. 4 1. 6
95∼100% (0∼5) 1. 4 1. 4
적응 화속 제어부(8)는 표3의 축적율과 압축율의 관계를 기억한 빨리 듣기 모드용의 축적율/ 압축율 테이블을 구비하고 있다. 또한, 재생 속도 제어부(42)는 표3의 축적율과 버퍼로부터 음성 데이터를 출력하는 속도의 배율과의 관계를 기억한 빨리 듣기 모드용의 축적율/재생 속도 배율 테이블을 구비하고 있다.
적응 화속 제어부(8)는 축적율 산출부(7)로부터 축적율이 보내져오면, 빨리 듣기 모드용의 축적율/압축율 테이블에 기초하여, 축적율 산출부(7)로부터 보내여져 온 축적율에 대응하는 압축율을 판독하여, 시간축 압축신장부(5)에 설정한다.
재생 속도 제어부(42)는 축적율 산출부(7)로부터 축적율이 보내져오면, 빨리듣기 모드용의 축적율/재생 속도 배율 테이블에 기초하여, 축적율 산출부(7)로부터 보내여져 온 축적율에 대응하는 재생 속도 배율을 판독하여, 버퍼(41)로부터 음성 데이터의 출력 속도를, 재생 속도 배율에 따른 속도가 되도록 제어한다. 또한, 하드디스크(40)로부터 음성 데이터를 판독하는 속도는 버퍼(41)로부터 음성 데이터를 출력하는 속도와 비교하여 매우 빠르고, 버퍼(41)가 비게 되는 일은 없다.
(1) 축적율이 0∼20%(0 이상이고 또한 20% 미만)인 경우
축적율이 0∼20%인 경우에는 압축율은 1로 설정되고, 재생 속도 배율은 2배로 설정된다. 이 경우에는 재생 속도 제어부(42)는 표준 재생 속도(1 배속 재생 시의 재생 속도)의 2배에 따른 속도로, 버퍼(41)로부터 음성 데이터를 출력시킨다.
버퍼(41)로부터 출력된 음성 데이터는 무음 구간 삭제부(4)에 의해서 무음 구간의 데이터가 삭제된 후, 시간축 압축신장부(5)에서 시간축 압축신장 처리는 행해지지 않고, 링 메모리(6)에 축적된다. 링 메모리(6)에 축적된 음성 데이터는 표준 재생 속도에 따른 속도로 판독되어 출력된다. 따라서, 출력 음성의 화속은 표준 재생 속도(1 배속 재생 시의 재생 속도)로 재생되었을 때의 출력 음성의 화속과 같게 된다.
링 메모리(6)에의 데이터 기입 속도는 링 메모리(6)로부터의 데이터 판독 속도보다 빠르기 때문에, 링 메모리(6) 내의 미판독의 음성 데이터의 축적량이 증가하여 간다. 미판독의 음성 데이터의 축적량이 증가하여 가는 속도는 입력 음성 데이터에 무음 구간의 데이터가 적은 만큼, 빠르게 된다.
(2) 축적율이 20∼40%인 경우
축적율이 20∼40%인 경우에는 압축율이 1.2로 설정된다. 단, 재생 속도 배율은 그대로 2이다. 이 경우에는 시간축 압축신장부(5)는 입력 신호의 시간 길이 P와 출력 신호의 시간 길이 Q의 비가 1.2:1이 되도록, 입력 데이터에 대하여 시간축 압축 처리를 행한다. 이 결과, 출력 음성의 화속은 표준 재생 속도(1 배속 재생 시의 재생 속도)로 재생되었을 때의 출력 음성의 화속보다 약간 빠르게 된다. 한편, 링 메모리(6)에 입력되는 음성 구간의 음성 데이터량이 저감되기 때문에, 상기 (1)의 경우와 비교하여, 링 메모리(6)로부터 판독되는 데이터량에 대한, 링 메모리(6)에 기입되는 데이터량의 비를 작게 할 수가 있다.
(3) 축적율이 40∼60%인 경우
축적율이 40∼60%인 경우에는 압축율이 1.4로 설정된다. 단, 재생 속도 배율은 그대로 2이다. 이 경우에는 시간축 압축신장부(5)는 입력 신호의 시간 길이 P와 출력 신호의 시간 길이 Q의 비가 1.4:1이 되도록, 입력 데이터에 대하여 시간축 압축 처리를 행한다. 이 결과, 출력 음성의 화속은 상기(2)의 경우와 비교하여 더욱 빠르게 된다. 한편, 링 메모리(6)에 입력되는 음성 구간의 음성 데이터량이 상기 (2)의 경우와 비교하여 더욱 저감되기 때문에, 상기 (2)의 경우와 비교하여, 링 메모리(6)로부터 판독되는 데이터량에 대한, 링 메모리(6)에 기입되는 데이터량의 비를 작게 할 수가 있다.
(4) 축적율이 60∼80%인 경우
축적율이 60∼80%인 경우에는 압축율이 1.4로 설정되고, 재생 속도 배율이 1.8배로 설정된다. 이 경우에는 재생 속도 제어부(42)는 표준 재생 속도의 1.8배에 따른 속도로, 버퍼(41)로부터 음성 데이터를 출력시킨다. 또한, 시간축 압축신장부(5)는 입력 신호의 시간 길이 P와 출력 신호의 시간 길이 Q의 비가 1.4:1이 되도록, 입력 데이터에 대하여 시간축 압축 처리를 행한다.
재생 속도 배율이 1.8로 설정되기 때문에, 상기 (3)의 경우와 비교하여, 링 메모리(6)에의 데이터의 기입 속도가 저하하기 때문에, 상기 (3)의 경우와 비교하여, 링 메모리(6)로부터 판독되는 데이터량에 대한, 링 메모리(6)에 기입되는 데이터량의 비를 작게 할 수가 있다. 또한, 재생 속도 배율이 상기 (3)과 비교하여 작게 되어 있기 때문에, 압축율 만을 크게 하는 경우와 비교하여, 출력 음성의 화속이 지나치게 빨리 말하기로 되는 일이 없다. 즉, 알아 듣기가 용이한 범위에서의 빨리 말하기로 할 수 있다.
(5) 축적율이 80∼95%인 경우
축적율이 80∼95%인 경우에는 압축율이 1.4로 설정되고, 재생 속도 배율이 1.6배로 설정된다. 이 경우에는 재생 속도 제어부(42)는 표준 재생 속도의 1.6배에 따른 속도로, 버퍼(41)로부터 음성 데이터를 출력시킨다. 또한, 시간축 압축신장부(5)는 입력 신호의 시간 길이 P와 출력 신호의 시간 길이 Q의 비가 1.6:1이 되도록, 입력 데이터에 대하여 시간축 압축 처리를 행한다.
재생 속도 배율이 1.6으로 설정되기 때문에, 상기 (4)의 경우와 비교하여, 링 메모리(6)에의 데이터의 기입 속도가 저하하기 때문에, 상기 (4)의 경우와 비교하여, 링 메모리(6)로부터 판독되는 데이터량에 대한, 링 메모리(6)에 기입되는 데이터량의 비를 작게 할 수가 있다. 또한, 재생 속도 배율이 상기 (4)와 비교하여작게 되어 있기 때문에, 압축율만을 크게 하는 경우와 비교하여, 출력 음성의 화속이 지나치게 빨리 말하기로 되는 일이 없다. 즉, 알아 듣기가 용이한 범위에서의 빨리 말하기로 할 수 있다.
(6) 축적율이 95∼100%인 경우
축적율이 95∼100%인 경우에는 압축율이 1.4로 설정되고, 재생 속도 배율이 1.4배로 설정된다. 이 경우에는 재생 속도 제어부(42)는 표준 재생 속도의 1.4배에 따른 속도로, 버퍼(41)로부터 음성 데이터를 출력시킨다. 또한, 시간축 압축신장부(5)는 입력 신호의 시간 길이 P와 출력 신호의 시간 길이 Q의 비가 1.4:1이 되도록, 입력 데이터에 대하여 시간축 압축 처리를 행한다.
재생 속도 배율이 1.4로 설정되기 때문에, 상기 (5)의 경우와 비교하여, 링 메모리(6)에의 데이터의 기입 속도가 저하하기 때문에, 상기 (5)의 경우와 비교하여, 링 메모리(6)에서 판독되는 데이터량에 대한, 링 메모리(6)에 기입되는 데이터량의 비를 작게 할 수가 있다. 또한, 재생 속도 배율이 상기 (5)와 비교하여 작게 되어 있기 때문에, 압축율 만을 크게 하는 경우와 비교하여, 출력 음성의 화속이 지나치게 빨리 말하기로 되는 일이 없다. 즉, 알아 듣기가 용이한 범위에서의 빨리 말하기로 할 수 있다.
〔3-2〕늦게 듣기 모드 시의 동작의 설명
표4는 늦게 듣기 모드 시의 축적율과 압축율의 관계 및 축적율과 버퍼로부터 음성 데이터를 출력하는 속도의 배율의 관계를 나타내고 있다.
압축율(메모리 축적율) 압축율 버퍼로부터의 출력 속도 배율
0∼20% (80∼100) 0.7 1
25∼50% (50∼75) 0.8 1
50∼75% (25∼50) 0.9 0.9
75∼100% (0∼25) 1 0.8
적응 화속 제어부(8)는 표4의 축적율과 압축율의 관계를 기억한 늦게 듣기 모드용의 축적율/압축율 테이블을 구비하고 있다. 또한, 재생 속도 제어부(42)는 표4의 축적율과 버퍼로부터 음성 데이터를 출력하는 속도의 배율과의 관계를 기억한 늦게 듣기 모드용의 축적율/재생 속도 배율 테이블을 구비하고 있다.
적응 화속 제어부(8)는 축적율 산출부(7)로부터 축적율이 보내져오면, 늦게 듣기 모드용의 축적율/압축율 테이블에 기초하여, 축적율 산출부(7)로부터 보내져 온 축적율에 대응하는 압축율을 판독하여, 시간축 압축신장부(5)에 설정한다.
재생 속도 제어부(42)는 축적율 산출부(7)로부터 축적율이 보내져오면, 늦게 듣기 모드용의 축적율/재생 속도 배율 테이블에 기초하여, 축적율 산출부(7)로부터 보내여져 온 축적율에 대응하는 재생 속도 배율을 판독하여, 버퍼(41)로부터 음성 데이터의 출력 속도를, 재생 속도배율에 따른 속도가 되도록 제어한다.
(1) 축적율이 0∼25%인 경우
축적율이 0∼25%인 경우에는 압축율은 0.7로 설정되고, 재생 속도 배율은 1로 설정된다. 이 경우에는 재생 속도 제어부(42)는 표준 재생 속도에 따른 속도로, 버퍼(41)로부터 음성 데이터를 출력시킨다.
버퍼(41)로부터 출력된 음성 데이터는 무음 구간 삭제부(4)에 의해서 무음 구간의 데이터가 삭제된 후, 시간축 압축신장부(5)에 보내여진다. 시간축 압축신장부(5)에서는 입력 신호의 시간 길이 P와 출력 신호의 시간 길이 Q의 비가 0.7:1이 되도록, 입력 데이터(음성 구간의 음성 데이터)에 대하여 시간축 신장 처리가 행해진다.
시간축 압축신장부(5)에 의해서 시간축 신장 처리가 행해진 뒤의 음성 데이터는 링 메모리(6)에 축적된다. 링 메모리(6)에 축적된 음성 데이터는 표준 재생 속도에 따른 속도로 판독되어 출력된다.
음성 구간의 음성 데이터는 시간축 상에서 신장된 후에 링 메모리(6)에 기입되고 있기 때문에, 출력 음성의 화속은 표준 재생 속도로 재생되었을 때의 출력 음성의 화속보다 늦어진다. 단, 무음 구간의 음성 데이터가 적은 만큼, 링 메모리(6) 내의 미판독의 음성 데이터의 축적량이 증가하여 간다.
(2) 축적율이 25∼50%인 경우
축적율이 25∼50%인 경우에는 압축율이 0.8로 설정된다. 단, 재생 속도 배율은 그대로 1이다. 이 경우에는 시간축 압축신장부(5)는 입력 신호의 시간 길이 P와 출력 신호의 시간 길이 Q의 비가 0.8:1이 되도록, 입력 데이터에 대하여 시간축 신장 처리를 행한다. 이 결과, 출력 음성의 화속은 표준 재생 속도로 재생되었을 때의 출력 음성의 화속보다 느리지만 상기 (1)의 경우와 비교하여 약간 빠르게 된다. 단, 링 메모리(6)에 입력되는 음성 구간의 음성 데이터량이 상기 (1)의 경우와 비교하여 저감하기 때문에, 상기 (1)의 경우와 비교하여, 링 메모리(6)에서 판독되는 데이터량에 대한, 링 메모리(6)에 기입되는 데이터량의 비를 작게 할 수가 있다.
(3) 축적율이 50∼75%인 경우
축적율이 50∼75%인 경우에는 압축율이 0.9로 설정되고, 재생 속도 배율이 0.9로 설정된다. 이 경우에는 재생 속도 제어부(42)는 표준 재생 속도의 0.9배에 따른 속도로, 버퍼(41)로부터 음성 데이터를 출력시킨다. 또한, 시간축 압축신장부(5)는 단위 시간당의 데이터 입력 갯수 P와 단위 시간당의 데이터 출력 갯수 Q의 비가 0.9:1이 되도록, 입력 데이터에 대하여 시간축신장 처리를 행한다.
상기 (2)의 경우와 비교하여, 시간축 상의 압축율이 크게 되어 있음과 동시에, 재생 속도 배율이 상기 (2)와 비교하여 작게 되어 있기 때문에, 상기 (2)의 경우와 비교하여, 링 메모리(6)로부터 판독되는 데이터량에 대한, 링 메모리(6)에 기입되는 데이터량의 비를 작게 할 수가 있다. 단, 재생 속도 배율이 상기 (2)와 비교하여 작게 되어 있기 때문에, 압축율 만을 크게 하는 경우와 비교하여, 출력 음성의 화속은 빠르게 되지 않는다.
(4) 축적율이 75∼100%인 경우
축적율이 75∼100%인 경우에는 압축율이 1.0으로 설정되고, 재생 속도 배율이 0.8배로 설정된다. 재생 속도 제어부(42)는 표준 재생 속도의 0.8배에 따른 속도로, 버퍼(41)로부터 음성 데이터를 출력시킨다. 또한, 시간축 압축신장부(5)는 시간축 신장 처리를 행하지 않는다.
상기 (3)의 경우와 비교하여, 시간축 상의 압축율이 크게 되어 있음과 동시에, 재생 속도 배율이 상기 (3)과 비교하여 작게 되어 있기 때문에, 상기 (3)의 경우와 비교하여, 링 메모리(6)로부터 판독되는 데이터량에 대한, 링 메모리(6)에 기입되는 데이터량의 비를 작게 할 수가 있다. 단, 재생 속도 배율이 상기 (3)과 비교하여 작게 되어 있기 때문에, 압축율 만을 크게 하는 경우와 비교하여, 출력 음성의 화속은 빠르게 되지 않는다.
본 발명에 따라, 음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적량이 증가한 경우라도, 출력 음성의 화속을 그다지 빠르게 하지 않고, 음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적량이 음성 데이터 축적용 메모리의 용량을 넘지 않도록 할 수 있는 화속 변환 장치를 얻을 수 있다.

Claims (10)

  1. 음성 재생 장치에서 입력되는 입력 음성 신호를 화속 변환 처리하는 화속 변환 처리 수단, 화속 변환 처리 수단의 출력이 기입되는 음성 데이터 축적용 메모리, 및 음성 데이터 축적용 메모리에서 음성 데이터를 판독하는 수단을 구비한 화속 변환 장치에 있어서,
    음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적율을 산출하는 산출 수단, 및
    음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적율에 따라서, 음성 재생 장치의 재생 속도를 제어하는 제어 수단
    을 구비하는 것을 특징으로 하는 화속 변환 장치.
  2. 제1항에 있어서, 상기 화속 변환 처리 수단은
    입력 음성 신호가 음성 구간인지 무음 구간인지를 판정하는 구간 판정 수단,
    무음 구간이라고 판정된 입력 음성 신호를 삭제 처리하는 삭제 처리 수단, 및
    유음 구간이라고 판정된 입력 음성 신호를, 음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적율에 따른 압축율로 시간축 압축신장 처리하는 시간축 압축신장 처리 수단
    을 구비하는 것을 특징으로 하는 화속 변환 장치.
  3. 제1항에 있어서, 상기 음성 재생 장치가 VTR인 것을 특징으로 하는 화속 변환 장치.
  4. 제2항에 있어서, 상기 음성 재생 장치가 VTR인 것을 특징으로 하는 화속 변환 장치.
  5. 제1항에 있어서, 상기 음성 재생 장치가 하드디스크 레코더인 것을 특징으로 하는 화속 변환 장치.
  6. 제2항에 있어서, 상기 음성 재생 장치가 하드디스크 레코더인 것을 특징으로 하는 화속 변환 장치.
  7. 음성 재생 장치에서 입력되는 아날로그 음성 신호를 설정된 재생 속도 배율에 따른 샘플링 주파수로 샘플링하는 A/D변환 수단, A/D 변환 수단에서 출력되는 음성 데이터가 입력되는 프레임 메모리, 프레임 메모리에 소요수의 음성 데이터가 입력될 때마다, 이들 음성 데이터에 대한 화속 변환 처리를 행하는 화속 변환 처리 수단, 화속 변환 처리 수단의 출력이 기입되는 음성 데이터 축적용 메모리, 및 음성 데이터 축적용 메모리로부터 음성 데이터를 판독하는 수단을 구비한 화속 변환 장치에 있어서,
    음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적율을 산출하는 산출 수단, 및
    음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적율에 따라서, 음성 재생 장치의 재생 속도를 제어하는 제어 수단
    을 구비하는 것을 특징으로 하는 화속 변환 장치.
  8. 제7항에 있어서, 상기 화속 변환 처리 수단은
    프레임 메모리에 입력된 소요수의 음성 데이터에 대응하는 입력 음성이 음성 구간인지 무음 구간인지를 판정하는 구간 판정 수단,
    무음 구간이라고 판정된 음성 데이터를 삭제 처리하는 삭제 처리 수단, 및
    유음 구간이라고 판정된 음성 데이터를, 음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적율에 따른 압축율로 시간축 압축신장 처리하는 시간축 압축신장 처리 수단
    을 구비하는 것을 특징으로 하는 화속 변환 장치.
  9. 음성 재생 장치로부터 입력되는 디지털 음성 신호가 설정된 재생 속도 배율에 따른 속도로 기입되는 프레임 메모리, 프레임 메모리에 소요수의 음성 데이터가 입력될 때마다, 이들 음성 데이터에 대한 화속 변환 처리를 행하는 화속 변환 처리 수단, 화속 변환 처리 수단의 출력이 기입되는 음성 데이터 축적용 메모리, 및 음성 데이터 축적용 메모리로부터 음성 데이터를 판독하는 수단을 구비한 화속 변환장치에 있어서,
    음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적율을 산출하는 산출 수단, 및
    음성 데이터 축적용 메모리 내의 미판독의 음성 데이터의 축적율에 따라서, 음성 재생 장치의 재생 속도를 제어하는 제어 수단
    을 더 구비하는 것을 특징으로 하는 화속 변환 장치.
  10. 제9항에 있어서, 상기 화속 변환 처리 수단은
    프레임 메모리에 입력된 소요수의 음성 데이터에 대응하는 입력 음성이 음성 구간인지 무음 구간인지를 판정하는 구간 판정 수단,
    무음 구간이라고 판정된 음성 데이터를 삭제 처리하는 삭제 처리 수단, 및
    유음 구간이라고 판정된 음성 데이터를, 음성 데이터 축적용 메모리 내의 미 판독의 음성 데이터의 축적율에 따른 압축율로 시간축 압축신장 처리하는 시간축 압축신장 처리 수단
    을 구비하는 것을 특징으로 하는 화속 변환 장치.
KR1020010010011A 2000-02-28 2001-02-27 화속 변환 장치 KR20010085664A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2000051305 2000-02-28
JP2000-051305 2000-02-28

Publications (1)

Publication Number Publication Date
KR20010085664A true KR20010085664A (ko) 2001-09-07

Family

ID=18572969

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020010010011A KR20010085664A (ko) 2000-02-28 2001-02-27 화속 변환 장치

Country Status (2)

Country Link
US (1) US20020004722A1 (ko)
KR (1) KR20010085664A (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006008810A1 (ja) * 2004-07-21 2006-01-26 Fujitsu Limited 速度変換装置、速度変換方法及びプログラム
CN100588237C (zh) * 2008-07-10 2010-02-03 旭丽电子(广州)有限公司 数字讯号转换系统与方法
KR102329888B1 (ko) * 2017-01-09 2021-11-23 현대자동차주식회사 음성 인식 장치, 이를 포함하는 차량, 및 음성 인식 장치의 제어방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5611018A (en) * 1993-09-18 1997-03-11 Sanyo Electric Co., Ltd. System for controlling voice speed of an input signal
KR960005647B1 (ko) * 1993-12-22 1996-04-30 엘지전자주식회사 브이씨알(vcr)의 다이제스트 오디오 스킵장치 및 그의 방법
US5809454A (en) * 1995-06-30 1998-09-15 Sanyo Electric Co., Ltd. Audio reproducing apparatus having voice speed converting function

Also Published As

Publication number Publication date
US20020004722A1 (en) 2002-01-10

Similar Documents

Publication Publication Date Title
JP4630876B2 (ja) 話速変換方法及び話速変換装置
JP4319548B2 (ja) ビデオ・トリック・モード再生中における音声番組の再生方法および装置
EP1481392B1 (en) Trick mode audio playback
KR20010085664A (ko) 화속 변환 장치
JP3416403B2 (ja) Mpegオーディオデコーダ
US6101474A (en) Voice recording/reproducing apparatus
JP2001318700A (ja) 話速変換装置
JPH08211894A (ja) 音声通信機および音声通信システム
JP3189587B2 (ja) 音声時間軸変換装置
JP4529859B2 (ja) 音声再生装置
JPH0573089A (ja) 音声再生方法
KR0166885B1 (ko) 자동 응답기의 메모리 감소를 위한 제어장치
JP3189597B2 (ja) 音声時間軸変換装置
JPH05303400A (ja) 音声再生装置と音声再生方法
JPH09154093A (ja) 映像・音声再生装置
KR930002585B1 (ko) 음성우편장치의 음성정보 처리방법
JPH0944199A (ja) 音声信号再生装置
JPH05100698A (ja) 音声記録再生装置
JPH0744199A (ja) 音声録音再生装置
JP2000115352A (ja) 留守番機能付電話装置およびメッセージデータ録音方法
JPH07121985A (ja) 音声再生装置
JPH0589407A (ja) テープレコーダの再生方式および録音方式
JPH07121193A (ja) 音声信号記録装置
JPH07253798A (ja) 音声蓄積装置
JP2003216195A (ja) Mpegオーディオデコーダ

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid