JPH08328586A - 音声時間軸変換装置 - Google Patents

音声時間軸変換装置

Info

Publication number
JPH08328586A
JPH08328586A JP7130072A JP13007295A JPH08328586A JP H08328586 A JPH08328586 A JP H08328586A JP 7130072 A JP7130072 A JP 7130072A JP 13007295 A JP13007295 A JP 13007295A JP H08328586 A JPH08328586 A JP H08328586A
Authority
JP
Japan
Prior art keywords
expansion ratio
data
silent
sound
remaining amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7130072A
Other languages
English (en)
Inventor
Masayuki Misaki
正之 三崎
Takeshi Norimatsu
武志 則松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP7130072A priority Critical patent/JPH08328586A/ja
Publication of JPH08328586A publication Critical patent/JPH08328586A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 音響信号を記録時の速度以下で再生する際、
記録時の音程を保ちつつ再生速度以上で記録時以下の話
速に変換する音声時間軸変換装置を提供する。 【構成】 記録再生部101からM倍速再生(0<M<
1)された音声は、A/D変換器102で周期T/Mで
デジタル信号に変換されたのちに入力バッファ103に
書き込まれる。この信号は有音無音判定部104で有音
無音判定される。時間軸制御部105では入力バッファ
103から読み出したデータに対して、有音無音部分の
判定結果に応じて伸長比を変更して時間軸伸長を行い、
出力バッファ108に書き込まれる。データ残量監視部
109は、出力バッファからD/A変換器に読み出され
ずに蓄積されているデータの残量を計測し、伸長比制御
部110に与える。伸長比制御部は、データ残量と無音
含有率に対応した変換規則で有音部分と無音部分の伸長
比を独立に決定して時間軸制御部に与える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ビデオテープレコーダ
ー(VTR)等で音声の低速再生を行なう際に必要とな
る、音声の時間軸の長さを任意に伸長を行なうことを可
能にする音声時間軸変換装置に関するものである。
【0002】
【従来の技術】所定の速度で記録された音声信号を、記
録時の速度と異なる速度で再生する音声時間軸変換装置
が実用化されている。例えば、テープレコーダーではテ
ープの走行スピードを調節して再生速度を早めたり遅め
たりすることができる。しかし、再生スピードが変化す
るのに伴って同時に音程も変化してしまうので、内容が
聞きづらくなってしまう。そこで、音程を変化させずに
再生速度のみを変化させることが可能な音声時間軸変換
装置が提案されている。
【0003】以下、このような従来の音声時間軸変換装
置について図面を参照しながら説明する。
【0004】図5は従来の音声時間軸変換装置の構成を
表すブロック図である。図6は従来の時間軸伸長処理を
表す模式図である。図5において、1は音響信号の記録
および再生を行なう記録再生部、2は再生されたアナロ
グ信号をデジタル信号に変換するA/D変換器、3はデ
ジタルデータを蓄積するためのバッファメモリ、4はバ
ッファメモリ3から読み出されたディジタル信号をアナ
ログ信号に変換するD/A変換器、5はバッファメモリ
3へのデータの書き込みを制御する書き込み制御部、6
はバッファメモリ3のデータの読み出しを制御する読み
出し制御部である。
【0005】以上のように構成された音声時間軸変換装
置について、以下にその動作を説明する。ここでは、記
録媒体への記録速度以下で音声信号を再生する場合に、
音程を記録時の状態に戻して再生する音声時間軸変換装
置について説明する。
【0006】まず、記録再生部1において記録時のM倍
(0<M<1)の速度で音響信号が再生される。ここで
記録再生部とは、例えばVTR,テープレコーダー等の
磁気テープに記録する装置の記録再生部を意図してい
る。次に、記録再生部1から再生された音響信号は、再
生速度に反比例したサンプリング周期T/MでA/D変
換器2によりデジタル信号に変換される。ここで、Tは
記録時の音響信号について標本化定理を満足するサンプ
リング周期であり、M倍速再生された音響信号の場合に
は、その1/Mの周期にする必要がある。
【0007】A/D変換されたこれらのデジタル信号
は、書き込み制御部5によって周期T/Mでバッファメ
モリ3に順次蓄積されていく。ここで、バッファメモリ
3に蓄積された各デジタル信号を周期Tで読み出し再生
すれば記録時の音程に復元できるが、出力信号を連続し
て出し続けるには入力信号データが不足し、時間的に空
白となる部分ができる。そのため、読み出し制御部6で
はバッファメモリ3に蓄えられたデジタル信号を数10
msecのフレーム単位で2度繰り返して読み出しを行う部
分を設けるようにして、不足するデータを補うようにす
る。そして、読み出し制御部6により読み出されたデジ
タル信号を、D/A変換器4によりサンプリング周期T
でアナログ信号に変換する。これら一連の処理により、
音程を変化させずに音声時間軸変換が実現できる。ここ
で説明した、音程一定で速度のみを変換する技術につい
ては、例えば「会話の時間軸を圧縮/伸長するテープ・
レコーダ」;小坂,横堀,藤田;日経エレクトロニクス
(1976.7.26発行)に詳しく解説されている。
【0008】図6は上述した音声時間軸変換装置の1/
2倍速の場合の処理例を示している。(a)は記録時の
データを示しており、(b)はバッファメモリに蓄えら
れていくデータの時間的位置を示している。(b)の各
ブロックを2回づつ繰り返しながらサンプリング周期T
で再生したものが(c)のデータ列となり、これは
(a)のデータ列と音程が同じであり時間軸が2倍のス
ケールになっている。
【0009】
【発明が解決しようとする課題】上述した従来例では、
記録時の音程を保ち、音声速度は記録媒体の再生速度と
同一であり、記録時より遅く変換されている。ここでV
TR等で画像情報を詳細にゆっくりと見たい場合などに
おいて、記録媒体の再生速度を遅くしていくと、従来の
時間軸変換装置を用いた場合には音声速度も画像と同様
に遅くなっていく。ここで、人間の会話速度を違和感無
く可変できる幅については、0.75〜1.5倍程度と言われ
ている。したがって、主として画像情報を詳細にゆっく
りと見たい場合に記録媒体の再生速度をあまり遅くする
と、再生される音声速度が必要以上に遅くなりすぎて違
和感が起こり、かえって聴き取りにくくなる。また、こ
れを回避するために、現在の記録媒体の再生速度よりも
早い速度で音声を聴取しようとすると、再生すべき音声
信号データが時間的に不足してしまう。この場合、不足
する音声データ部分が定期的に発生し、この部分に無音
データを挿入するなどの手段を用いたとしても、不連続
な音声信号となり極めて不自然な再生音となってしま
う。
【0010】本発明は上記課題を解決するもので、記録
媒体から記録速度以下の再生速度で読み出した場合に、
音声の速度は必要以上に遅くせず、不連続点を生じるこ
ともなく、聴き取りやすい音声を聴取することが可能な
音声時間軸変換装置を提供することを目的とする。
【0011】
【課題を解決するための手段】上記課題を解決するため
に、請求項1記載の音声時間軸変換装置は、記録媒体に
記憶された音響信号を記録時のM倍(ただし、0<M<
1)の速度で読み出す再生部と、前記再生部で読み出さ
れたアナログ信号をデジタル信号へ変換するA/D変換
器と、前記A/D変換器の出力データを記憶する入力バ
ッファと、前記入力バッファに入力される信号の有音部
分と無音部分の判定を行う有音無音判定部と、前記有音
無音判定部の判定結果に基づき所定の時間長における無
音部分の含有率を演算する無音含有率演算部と、前記入
力バッファに記憶されている音声データに時間軸伸長を
行う時間軸制御部と、前記時間軸制御部の出力データを
蓄積するための出力バッファと、前記出力バッファ内に
蓄積されているデータのデータ残量を計測するデータ残
量監視部と、前記データ残量監視部から得られたデータ
残量と前記無音含有率演算部から得られた無音含有率に
応じて、予め定めた規則にしたがって時間軸変換の伸長
比を決定する伸長比制御部と、前記出力バッファに蓄積
されている音声データをアナログ信号に変換するD/A
変換器とを備えたものである。
【0012】請求項2記載の音声時間軸変換装置は、請
求項1記載の構成において、無音部分に対する伸長比と
有音部分に対する伸長比とをデータ残量による短期的な
適応制御と、無音含有率による長期的な適応制御の双方
を考慮して各々独立に設定する伸長比設定部を備えたも
のである。
【0013】請求項3記載の音声時間軸変換装置は、請
求項2記載の発明において、無音部分伸長比を1/M以
上に設定し、有音部分伸長比を1.0以上かつ1/M以
下に設定し、データ残量に対応した変換規則に基づき各
々の伸長比を決定する伸長比制御部を備えたものであ
る。
【0014】請求項4記載の音声時間軸変換装置は、請
求項2記載の発明において、有音部分伸長比をデータ残
量が所定の値以下の場合には1/Mに設定し、それ以外
には指定した固定値に設定し、無音部分伸長比を1/M
以上の範囲でデータ残量に対応した変換規則に基づき伸
長比を決定する伸長比制御部を備えたものである。
【0015】請求項5記載の音声時間軸変換装置は、請
求項3記載の発明において、伸長比制御部は、長期的な
時間間隔で求めた無音含有率に応じて、有音または無音
部分の伸長比の可変範囲の上限値または下限値を変更し
たデータ残量と無音含有率に対応した変換規則に調整し
て各々の伸長比を決定する伸長比制御部を備えたもので
ある。
【0016】
【作用】上記の構成によれば、有音無音の判定結果をも
とに、無音部分の伸長比を有音部分より大きくした時間
軸圧縮を行った後に出力バッファに書き込みを行う。こ
の際に、出力バッファ内に蓄積されているデータのデー
タ残量を計測し、データ残量が少なくなるほど伸長比を
大きくし、あるいは、無音部分の割合が所定値より少な
い場合にも自動的に伸長比を加減してバッファメモリに
絶えず十分なデータが確保される構成にしたことによ
り、時間的に短期的な伸長比の適応制御を行う。一方、
無音含有率を比較的長い周期で更新することにより、入
力される音声信号の性質が考慮され、時間的に長期的な
伸長比の適応制御を行うことができる。これらの双方の
伸長比の適応制御を行うことにより、有音部分の再生速
度をできるだけ記録時に近い値に保って再生することが
できるとともに、入力信号の性質に合わせた滑らかな伸
長比の変化を行うことができ、その結果、聴き取りやす
いスロー再生音を得ることができる。
【0017】また、請求項4記載の構成によれば、バッ
ファメモリに残っているデータの数であるデータ残量が
極めて少ない場合には有音部分でも1/Mの伸長比で時
間軸伸長して音切れを防ぎ、それ以外の場合には無音部
分の伸長比をデータ残量をもとに調整する。これによっ
て、話速は所定の固定値で再生しつつ、バッファメモリ
が空になることによって出力信号がとぎれることもない
違和感の無い自然な再生音を得ることができる。
【0018】
【実施例】以下、本発明の第1の実施例について図面を
参照しながら説明する。
【0019】図1は本発明の第1の実施例における音声
時間軸変換装置の構成を示すブロック図である。図1に
おいて、101は音響信号の記録および再生を行なう記
録再生部、102は記録再生部1で再生されたアナログ
信号をデジタル信号に変換するA/D変換器、103は
A/D変換された音響信号を一旦記録するための入力バ
ッファ、104は入力バッファ103へ書き込まれるデ
ジタル信号列が有音部分であるか無音部分であるかを判
定する有音無音判定部、105は、入力バッファ103
から読み出された信号に対して所定の伸長比で時間軸伸
長処理を行う時間軸制御部、106は入力バッファ10
3からのデータの読み出しおよびそのアドレスを制御す
る読み出し制御部、107は出力バッファ108へのデ
ータの書き込みおよびそのアドレスを制御する書き込み
制御部、108は時間軸制御部105で処理されたデー
タを一時的に蓄える出力バッファ、109は出力バッフ
ァ108に一時的に保存しているデータ量を監視するデ
ータ残量監視部、110は時間軸制御部105の伸長比
をデータ残量監視部109の出力および無音含有率演算
部112の出力に応じて決定する伸長比制御部、111
は出力バッファ108に蓄積されたデジタルデータをア
ナログ信号に変換するD/A変換器、112は入力信号
の無音含有率を演算する無音含有率演算部である。
【0020】以上のように構成された音声時間軸変換装
置について、以下その動作を図1を参照しながら詳細に
説明する。
【0021】まず、記録再生部101から記録時のM
(0<M<1)倍の速度で音響信号が読み出される。以
後、速度とは記録速度に対する相対速度を表すこととす
る。ここで、記録再生部101よりM倍速で再生された
音響信号は、逐次A/D変換器102によりサンプリン
グ周期T/Mでデジタル信号系列に変換されて、入力バ
ッファ103に書き込まれる。一方、D/A変換器11
1はサンプリング周期Tでアナログ信号への変換が行わ
れるので、単位時間あたり入力信号に比べて1/M倍以
上の数のデータが出力バッファに適宜準備されていなけ
ればならない。その際に、入力信号全体に同じ割合の時
間軸伸長を施すのではなく、有音無音判定部104によ
る有音無音判定結果に基づき、無音部分には有音部分よ
り大きい伸長比で時間軸伸縮することで有音部分の伸長
比を1.0に近づける(有音部分のみ通常の速度に近い速
度で再生する)ように動作させるのが本実施例の基本的
な考え方である。
【0022】入力バッファ103へ書き込まれる信号系
列に対して、有音無音判定部104によりそのサンプル
値列が有音部分であるか有音部分であるかの判定が行わ
れる。この有音無音判定は、例えばサンプル値の音圧レ
ベルが予め設定した基準音圧レベル以上であるか否かを
判別することなどで実現できる。この判定結果は、入力
バッファ103に書き込まれているデータのどの部分が
有音/無音なのかを伸長比制御部110に伝えられると
共に、無音含有率演算部112で、ある特定時間内にお
ける無音部分の含まれる割合を比較的長い時間周期で求
めるために利用される。
【0023】時間軸制御部105は、後述する伸長比制
御部によって与えられた伸長比で、入力バッファ103
から読み出したデータに対して時間軸伸長処理を施して
出力バッファ108へ出力する。その際には、無音部分
には無音部分用の伸長比で時間軸伸長し、有音部分には
有音部分用の伸長比で時間軸伸長が行われる。データ残
量監視部109では、出力バッファ108に書き込まれ
ているがD/A変換器111にはまだ出力されていない
データの残量をモニタしてその結果を伸長比制御部11
0に与えている。伸長比制御部110は、“無音含有
率”と“データ残量”を入力とし、時間軸制御部105
へ無音および有音の各々の部分に対する伸長比を与え
る。伸長比を与える基本的な考え方は以下の点である。 (1)無音部分への伸長比を有音部分への伸長比より大
きくまたは等しくする。 (2)出力バッファへ溜まったデータ残量に応じて伸長
比を調整する。その際、データ残量が少ないほど、伸長
比を大きくする。 (3)入力バッファへ書き込まれるデータの無音含有率
に応じて伸長比を調整する。その際無音含有率が小さい
ほど、有音伸長比が小さめの値を取り易く、無音伸長比
が大きめの値を取り易くする。
【0024】図2(a)には、データ残量と伸長比の関
係、および無音含有率Rmによる曲線の変化させる傾向
を示している。上記(1)は、一般的に人の音声は無音
部分の継続時間長を調整して発話速度を変化させている
ことに基づいている。このことは、例えば、「『連続音
声中の音韻区分の持続時間の性質』;比企,金森,大
泉;電気通信学会誌,第50巻,5号」に詳しく述べられ
ている。また、(2)のように伸長比を変えることによ
って、出力バッファに残っているデータ残量が空に近く
なるほど伸長比を大きくして出力データが不足しないよ
うにし、データ残量が大きくなるほど伸長比を小さめに
してデータが溜まりにくくすることができる。この動作
は、文節程度の時間長すなわち比較的短期的な適応の時
定数にする。(3)は、例えば有音用伸長比は下に凸に
なる度合を大きくし、無音用伸長比は上に凸なる度合を
大きくすることで実現される。
【0025】また、入力信号中に含まれる無音の量に応
じて、有音部分と無音部分への伸長比を調整して、有音
部分の伸長比をできるだけ1.0に近づけるようにする
目的で利用する。すなわち、無音の多く含まれるソース
ほど、有音部分への伸長比を1.0に近づけ易くして、相
対的に有音部分を聴き取り易くする。この動作は、文章
程度の時間長、すなわち比較的長期的な適応の時定数に
する。そして、(2)および(3)を組み合わせること
で、様々な音声信号に対して柔軟に適応することが可能
となる。
【0026】データ残量と伸長比の関係は例えば図2
(a)のように関数形で与えられるものでも、あるいは
階段状に変化するテーブル参照型のものでもかまわな
い。図2(b)の例は、有音部分はデータ残量が0にな
らない限り伸長率0、すなわち記録時と同一の話速で再
生されることになる。この場合、有音部分の伸長率が固
定の“1”の状態では、有音部分が連続すると出力バッ
ファ内のデータ残量が急激に減少することになるので、
無音部分の伸長率はおおむね大きめにして出力バッファ
にデータが溜まりやすくしている。時間軸伸長すること
により、出力バッファが空にならないようにデータ数を
増加させることはできるが、むやみに大きい値の伸長比
を与えていると出力バッファの容量を越えてしまうこと
になり、出力信号の連続性を保てなくなる。このため、
データ残量が多くなるに連れて、無音部分の伸長比は小
さく抑えてある。
【0027】以下は、記録媒体の再生速度を記録時の2
/3倍(M=2/3)にした場合の動作について説明を
行う。
【0028】まず、図2の伸長比設定テーブルは、デー
タ残量が0のとき、有音部分の伸長率を1.5にして、
入力信号に有音が与えられても出力バッファが空になる
ことを防いでいる。また、データ残量がほぼ出力バッフ
ァ容量と等しくなり、バッファ容量をオーバーフローす
る可能性がある場合には、無音部分の伸長比は1.5以
下に抑える必要がある。
【0029】図4は、無音部分と有音部分とを別々の時
間軸伸長比で時間軸伸長を行う場合の処理の様子を、時
間軸に関して模式的に示したものである。図4(a)の
記録時の入力信号に対して図4(b)は2/3倍の再生
速度で記録媒体から音声を再生した場合である。ここ
で、入力信号の無音部分の割合に依存して無音部分,有
音部分の伸長比を決める必要がある。(c)と(d)に
は無音部分の割合の異なる2つの例を示す。入力信号1
から6の部分において、(c)の例では1,2,3が無
音部分で、4,5,6が有音部分とした場合の処理を行
っている。(d)の例では1,2が無音部分で、3,
4,5,6が有音部分とした場合の処理を行っている。
この例では有音部分の伸長比はともに1.0にしている
ため、無音部分の伸長比は、(c)の例では2.0、
(d)の例では2.5となる。
【0030】これらの例のように、無音部分の割合があ
らかじめ推定できれば、出力バッファ108から不足な
く出力データをD/A変換器111に供給し続けられる
ので、伸長比を一定に固定しておいても出力データが不
足することが無い。再生するソースの種類によって無音
の含まれる割合は様々であるので、本実施例では、無音
含有率を演算して、時間的に比較的長期な無音の含まれ
る割合を求めている。
【0031】しかしながら、時間的に比較的短期の間隔
で考えると、出力バッファのデータ容量に制限がある場
合や、遅延時間を考慮する必要がある場合などにおいて
は、局所的にデータが不足する場合が生じる。このよう
な場合には、直接的に、出力バッファのデータ残量から
短期的なデータ残量の増加率、すなわち伸長比を操作す
る必要がある。なぜなら、出力バッファから出ていくデ
ータ量は一定値であるが、入力されるデータ量は有音部
/無音部の伸長比によって増減率が変化するからであ
る。したがって、記憶容量に制限のある出力バッファに
蓄えられたデータの量をモニタしその値によって伸長比
を決定し、出力バッファで出力データの時間的な過不足
を吸収することによって、無音の割合が予想できない音
声であっても、無音部分と有音部分の伸長比を独立に設
定してもデータが不足することがないようにすることが
できる。なお、本発明は時間軸処理の細かい部分に特徴
があるわけでないため時間軸処理の詳細については言及
しない。なお、時間軸変換処理の詳細については、例え
ば「『高品質音声速度変換方式のDSPによる実現』,
鈴木,三崎;電子情報通信学会 音声研究会資料 SP90-3
4,(1990.8.23)」などに詳しく記述されている。
【0032】なお、図2の例では、有音部伸長比を1.
0〜1.5、無音部伸長比を1.5〜3.0で変化させ
るとしたが、本発明においてこれらの伸長比の上限値・
下限値はこれらの数値に限られるものではない。例え
ば、画像との時間的ずれを少なくするためには、伸長比
の可変幅を小さくして、有音部伸長比を1.2〜1.
5、無音部伸長比を1.5〜2.0などで変化させても
良い。
【0033】また、図3に示したように、無音含有率が
小さくなるに連れて、図3(a)から(b),(c)へ
と順に変化させることも考えられる。これらの図は、可
変する伸長比の上限値・下限値を無音含有率によって変
更する例である。例えば、ニュースなどの比較的無音部
分の多く含まれるソースの場合は、有音部分の伸長比の
下限値を小さめの値に設定し、無音部分の伸長比の上限
値も小さめの値に設定しても、データ残量が空になるこ
とはない。一方、サッカーなどの無音部分がほとんど含
まれないソースでは、有音部分の伸長比の下限値を大き
めにし、無音部分の伸長比の上限値を大きめにしても、
データ残量が安定し易く、有音部分の安定した話速の再
生音を得ることができる。このような場合においても、
先に示した例と同様の効果が得られる。いずれの場合に
おいても、平均的な有音部分の話速が安定し易くなる。
【0034】このような伸長比の制御を行なうことによ
り、無音部分の割合により時間軸伸長する伸長比が少々
変化するが、記録時の話速以下で、かつ、記録媒体の再
生速度より早い話速で、音声信号を聴取できることにな
る。
【0035】以上のように本実施例によれば、データ残
量と無音含有率に基づいて有音部分・無音部分各々独立
に時間軸伸長比を設定し、データ残量が予め定めた一定
量より少ない時には有音部分の伸長比を1/Mに設定し
て出力信号が途切れることを防ぎつつ、有音部分をでき
るだけ記録時の話速に近くする伸長比の制御を行うこと
により、記録媒体の再生速度が遅くなっても違和感なく
聞き取りやすい再生音を得ることができる。
【0036】
【発明の効果】以上のように本発明は、記録速度のM倍
(0<M<1)で再生された音響信号を有音無音判定部
で有音部分と無音部分の判定をし、時間軸制御部では有
音部分と無音部分に対して独立に設定した伸長比で時間
軸伸長して出力バッファに蓄え、入力バッファに書き込
まれる音声信号の無音含有率および出力バッファに蓄積
されているデータ残量に応じて、無音部分および有音部
分を時間軸伸長する伸長比を予め定めた規則により決定
する伸長比制御部を備えているので、有音部分の再生速
度をできるだけ記録時に近い値に保って再生することが
できるとともに、入力信号の性質に合わせた滑らかな伸
長比の変化を行うことができ、その結果、聴き取りやす
いスロー再生音を得ることができる。
【0037】そして、無音部分伸長比を1/M以上か
つ、有音部分伸長比を1.0以上かつ1/M以下に設定
して各々の伸長比を独立に変化させることにより、有音
部分の話速をVTR再生速度より早くすることができ
る。
【0038】あるいは、有音部分伸長比はデータ残量が
所定の値以下の場合には1/Mに設定しそれ以外の場合
には指定した固定値に設定し、かつ無音部分伸長比を1
/M以上の範囲でデータ残量に対応した変換規則に基づ
いて決定することにより、話速は再生速度より早い一定
値で再生することができる。したがって、一般的に有音
部分の話速をより記録時に近い値にして出力できる。そ
して、無音含有率に応じて無音伸長比と有音伸長比の
値、あるいは無音伸長比の値のみを調整できるように伸
長比制御部で制御でき、入力信号の性質に合わせた伸長
比に自動的に調整可能となる。また、出力バッファに溜
まっているデータ残量を監視するデータ残量監視部を設
けており、どのような入力信号が与えられても出力信号
が途切れることなく再生できる。
【0039】また、長期的な時間間隔で求めた無音含有
率に応じて、有音または無音部分の伸長比の可変範囲の
上限値または下限値を変更したデータ残量と無音含有率
に対応した変換規則に調整して各々の伸長比を決定する
ことにより、入力信号の性質に適合した伸長比を設定す
ることができる。
【0040】このように、画像信号をゆっくりと見るた
めに記録媒体の再生速度を遅くした時に、どのような入
力ソースであっても、音声信号を必要以上に遅い話速で
聞く必要はなくなり、違和感の無い聞き取りやすいスロ
ー再生を可能にする音声時間軸変換装置を提供すること
ができる。
【図面の簡単な説明】
【図1】本発明の一実施例における音声時間軸変換装置
の構成を示すブロック図
【図2】本実施例に係る伸長比設定テーブルの説明図
【図3】本実施例に係る他の伸長比設定テーブルの説明
【図4】本実施例に係る時間軸伸長処理の模式図
【図5】従来の音声時間軸変換装置のブロック図
【図6】従来の時間軸伸長処理の模式図
【符号の説明】
101 記録再生部 102 A/D変換器 103 入力バッファ 104 有音無音判定部 105 時間軸制御部 106 読み出し制御部 107 書き込み制御部 108 出力バッファ 109 データ残量監視部 110 伸長比制御部 111 D/A変換器 112 無音含有率演算部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】記録媒体に記憶された音響信号を記録時の
    M倍(ただし、0<M<1)の速度で読み出す再生部
    と、 前記再生部で読み出されたアナログ信号をデジタル信号
    へ変換するA/D変換器と、 前記A/D変換器の出力データを記憶する入力バッファ
    と、 前記入力バッファに入力される信号の有音部分と無音部
    分の判定を行う有音無音判定部と、 前記有音無音判定部の判定結果に基づき所定の時間長に
    おける無音部分の含有率を演算する無音含有率演算部
    と、 前記入力バッファに記憶されている音声データに時間軸
    伸長を行う時間軸制御部と、 前記時間軸制御部の出力データを蓄積するための出力バ
    ッファと、 前記出力バッファ内に蓄積されているデータのデータ残
    量を計測するデータ残量監視部と、 前記データ残量監視部から得られたデータ残量と前記無
    音含有率演算部から得られた無音含有率に応じて、予め
    定めた規則にしたがって時間軸変換の伸長比を決定する
    伸長比制御部と、 前記出力バッファに蓄積されている音声データをアナロ
    グ信号に変換するD/A変換器とを備えたことを特徴と
    する音声時間軸変換装置。
  2. 【請求項2】伸長比制御部は、データ残量監視部から得
    られたデータ残量による短期的な適応制御と、無音含有
    率演算部から得られた無音含有率による長期的な適応制
    御、の双方を考慮した圧伸比の制御を行い、無音部分に
    対する伸長比と有音部分に対する伸長比とを各々独立に
    設定することを特徴とする請求項1記載の音声時間軸変
    換装置。
  3. 【請求項3】伸長比制御部は、無音部分伸長比を1/M
    以上に設定し、有音部分伸長比を1.0以上かつ1/M
    以下に設定し、データ残量と無音含有率に対応した変換
    規則に基づき各々の伸長比を決定することを特徴とする
    請求項2記載の音声時間軸変換装置。
  4. 【請求項4】伸長比制御部は、有音部分伸長比を、デー
    タ残量が所定値以下の場合には1/Mに設定しそれ以外
    の場合には指定した固定値に設定し、無音部分伸長比を
    1/M以上の範囲でデータ残量と無音含有率に対応した
    変換規則に基づき伸長比を決定することを特徴とする請
    求項2記載の音声時間軸変換装置。
  5. 【請求項5】伸長比制御部は、長期的な時間間隔で求め
    た無音含有率に応じて、有音または無音部分の伸長比の
    可変範囲の上限値または下限値を変更したデータ残量と
    無音含有率に対応した変換規則に調整して各々の伸長比
    を決定することを特徴とする請求項3記載の音声時間軸
    変換装置。
JP7130072A 1995-05-29 1995-05-29 音声時間軸変換装置 Pending JPH08328586A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7130072A JPH08328586A (ja) 1995-05-29 1995-05-29 音声時間軸変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7130072A JPH08328586A (ja) 1995-05-29 1995-05-29 音声時間軸変換装置

Publications (1)

Publication Number Publication Date
JPH08328586A true JPH08328586A (ja) 1996-12-13

Family

ID=15025331

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7130072A Pending JPH08328586A (ja) 1995-05-29 1995-05-29 音声時間軸変換装置

Country Status (1)

Country Link
JP (1) JPH08328586A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001067438A1 (fr) * 2000-03-10 2001-09-13 Matsushita Electric Industrial Co., Ltd. Procede de reproduction par ralentissement de la voix
JP2006133698A (ja) * 2004-11-09 2006-05-25 Toshiba Corp 復号装置
JP2008058956A (ja) * 2006-07-31 2008-03-13 Matsushita Electric Ind Co Ltd 音声再生装置
US7418393B2 (en) 2000-05-26 2008-08-26 Fujitsu Limited Data reproduction device, method thereof and storage medium
JP2012205066A (ja) * 2011-03-25 2012-10-22 Mitsubishi Electric Corp 音声データ処理装置
JP2013156552A (ja) * 2012-01-31 2013-08-15 Sharp Corp 話速変換装置、話速変換方法及びプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001067438A1 (fr) * 2000-03-10 2001-09-13 Matsushita Electric Industrial Co., Ltd. Procede de reproduction par ralentissement de la voix
US7418393B2 (en) 2000-05-26 2008-08-26 Fujitsu Limited Data reproduction device, method thereof and storage medium
JP2006133698A (ja) * 2004-11-09 2006-05-25 Toshiba Corp 復号装置
JP2008058956A (ja) * 2006-07-31 2008-03-13 Matsushita Electric Ind Co Ltd 音声再生装置
JP2012205066A (ja) * 2011-03-25 2012-10-22 Mitsubishi Electric Corp 音声データ処理装置
JP2013156552A (ja) * 2012-01-31 2013-08-15 Sharp Corp 話速変換装置、話速変換方法及びプログラム

Similar Documents

Publication Publication Date Title
KR100333795B1 (ko) 화속변환장치
JP2955247B2 (ja) 話速変換方法およびその装置
KR100739355B1 (ko) 음성 재생 방법 및 음성 재생 장치
JP2000511651A (ja) 記録されたオーディオ信号の非均一的時間スケール変更
JP2004126595A (ja) 信号エネルギーに基づく非一様時間領域音声信号処理方法
JP3619946B2 (ja) 話速変換装置、話速変換方法及び記録媒体
JPH08328586A (ja) 音声時間軸変換装置
US6085157A (en) Reproducing velocity converting apparatus with different speech velocity between voiced sound and unvoiced sound
JPS5982608A (ja) 音声の再生速度制御方式
JP3378672B2 (ja) 話速変換装置
JP3373933B2 (ja) 話速変換装置
JP3189597B2 (ja) 音声時間軸変換装置
JP3162945B2 (ja) ビデオテープレコーダ
JP3081469B2 (ja) 話速変換装置
JP3357742B2 (ja) 話速変換装置
JP3189587B2 (ja) 音声時間軸変換装置
JPH09138698A (ja) 音声記録再生装置
JPH04367898A (ja) 音声再生装置
EP0702354A1 (en) Apparatus for modifying the time scale modification of speech
JP2001222300A (ja) 音声再生装置および記録媒体
JPH0573089A (ja) 音声再生方法
JP2874607B2 (ja) 音声時間軸変換装置
WO1997009713A1 (fr) Procede de traitement de signal audio en vue d'une reproduction fidele et a vitesse variable
JPH0854895A (ja) 再生装置
JPH0772896A (ja) 音声の圧縮伸長装置