JPH08328586A

JPH08328586A - 音声時間軸変換装置

Info

Publication number: JPH08328586A
Application number: JP7130072A
Authority: JP
Inventors: Masayuki Misaki; 正之三崎; Takeshi Norimatsu; 武志則松
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1995-05-29
Filing date: 1995-05-29
Publication date: 1996-12-13

Abstract

(57)【要約】【目的】音響信号を記録時の速度以下で再生する際、
記録時の音程を保ちつつ再生速度以上で記録時以下の話
速に変換する音声時間軸変換装置を提供する。【構成】記録再生部１０１からＭ倍速再生（０＜Ｍ＜
１）された音声は、Ａ／Ｄ変換器１０２で周期Ｔ／Ｍで
デジタル信号に変換されたのちに入力バッファ１０３に
書き込まれる。この信号は有音無音判定部１０４で有音
無音判定される。時間軸制御部１０５では入力バッファ
１０３から読み出したデータに対して、有音無音部分の
判定結果に応じて伸長比を変更して時間軸伸長を行い、
出力バッファ１０８に書き込まれる。データ残量監視部
１０９は、出力バッファからＤ／Ａ変換器に読み出され
ずに蓄積されているデータの残量を計測し、伸長比制御
部１１０に与える。伸長比制御部は、データ残量と無音
含有率に対応した変換規則で有音部分と無音部分の伸長
比を独立に決定して時間軸制御部に与える。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、ビデオテープレコーダ
ー（ＶＴＲ）等で音声の低速再生を行なう際に必要とな
る、音声の時間軸の長さを任意に伸長を行なうことを可
能にする音声時間軸変換装置に関するものである。

【０００２】

【従来の技術】所定の速度で記録された音声信号を、記
録時の速度と異なる速度で再生する音声時間軸変換装置
が実用化されている。例えば、テープレコーダーではテ
ープの走行スピードを調節して再生速度を早めたり遅め
たりすることができる。しかし、再生スピードが変化す
るのに伴って同時に音程も変化してしまうので、内容が
聞きづらくなってしまう。そこで、音程を変化させずに
再生速度のみを変化させることが可能な音声時間軸変換
装置が提案されている。

【０００３】以下、このような従来の音声時間軸変換装
置について図面を参照しながら説明する。

【０００４】図５は従来の音声時間軸変換装置の構成を
表すブロック図である。図６は従来の時間軸伸長処理を
表す模式図である。図５において、１は音響信号の記録
および再生を行なう記録再生部、２は再生されたアナロ
グ信号をデジタル信号に変換するＡ／Ｄ変換器、３はデ
ジタルデータを蓄積するためのバッファメモリ、４はバ
ッファメモリ３から読み出されたディジタル信号をアナ
ログ信号に変換するＤ／Ａ変換器、５はバッファメモリ
３へのデータの書き込みを制御する書き込み制御部、６
はバッファメモリ３のデータの読み出しを制御する読み
出し制御部である。

【０００５】以上のように構成された音声時間軸変換装
置について、以下にその動作を説明する。ここでは、記
録媒体への記録速度以下で音声信号を再生する場合に、
音程を記録時の状態に戻して再生する音声時間軸変換装
置について説明する。

【０００６】まず、記録再生部１において記録時のＭ倍
（０＜Ｍ＜１）の速度で音響信号が再生される。ここで
記録再生部とは、例えばＶＴＲ，テープレコーダー等の
磁気テープに記録する装置の記録再生部を意図してい
る。次に、記録再生部１から再生された音響信号は、再
生速度に反比例したサンプリング周期Ｔ／ＭでＡ／Ｄ変
換器２によりデジタル信号に変換される。ここで、Ｔは
記録時の音響信号について標本化定理を満足するサンプ
リング周期であり、Ｍ倍速再生された音響信号の場合に
は、その１／Ｍの周期にする必要がある。

【０００７】Ａ／Ｄ変換されたこれらのデジタル信号
は、書き込み制御部５によって周期Ｔ／Ｍでバッファメ
モリ３に順次蓄積されていく。ここで、バッファメモリ
３に蓄積された各デジタル信号を周期Ｔで読み出し再生
すれば記録時の音程に復元できるが、出力信号を連続し
て出し続けるには入力信号データが不足し、時間的に空
白となる部分ができる。そのため、読み出し制御部６で
はバッファメモリ３に蓄えられたデジタル信号を数１０
msecのフレーム単位で２度繰り返して読み出しを行う部
分を設けるようにして、不足するデータを補うようにす
る。そして、読み出し制御部６により読み出されたデジ
タル信号を、Ｄ／Ａ変換器４によりサンプリング周期Ｔ
でアナログ信号に変換する。これら一連の処理により、
音程を変化させずに音声時間軸変換が実現できる。ここ
で説明した、音程一定で速度のみを変換する技術につい
ては、例えば「会話の時間軸を圧縮／伸長するテープ・
レコーダ」；小坂，横堀，藤田；日経エレクトロニクス
（１９７６．７．２６発行）に詳しく解説されている。

【０００８】図６は上述した音声時間軸変換装置の１／
２倍速の場合の処理例を示している。（ａ）は記録時の
データを示しており、（ｂ）はバッファメモリに蓄えら
れていくデータの時間的位置を示している。（ｂ）の各
ブロックを２回づつ繰り返しながらサンプリング周期Ｔ
で再生したものが（ｃ）のデータ列となり、これは
（ａ）のデータ列と音程が同じであり時間軸が２倍のス
ケールになっている。

【０００９】

【発明が解決しようとする課題】上述した従来例では、
記録時の音程を保ち、音声速度は記録媒体の再生速度と
同一であり、記録時より遅く変換されている。ここでＶ
ＴＲ等で画像情報を詳細にゆっくりと見たい場合などに
おいて、記録媒体の再生速度を遅くしていくと、従来の
時間軸変換装置を用いた場合には音声速度も画像と同様
に遅くなっていく。ここで、人間の会話速度を違和感無
く可変できる幅については、0.75〜1.5倍程度と言われ
ている。したがって、主として画像情報を詳細にゆっく
りと見たい場合に記録媒体の再生速度をあまり遅くする
と、再生される音声速度が必要以上に遅くなりすぎて違
和感が起こり、かえって聴き取りにくくなる。また、こ
れを回避するために、現在の記録媒体の再生速度よりも
早い速度で音声を聴取しようとすると、再生すべき音声
信号データが時間的に不足してしまう。この場合、不足
する音声データ部分が定期的に発生し、この部分に無音
データを挿入するなどの手段を用いたとしても、不連続
な音声信号となり極めて不自然な再生音となってしま
う。

【００１０】本発明は上記課題を解決するもので、記録
媒体から記録速度以下の再生速度で読み出した場合に、
音声の速度は必要以上に遅くせず、不連続点を生じるこ
ともなく、聴き取りやすい音声を聴取することが可能な
音声時間軸変換装置を提供することを目的とする。

【００１１】

【課題を解決するための手段】上記課題を解決するため
に、請求項１記載の音声時間軸変換装置は、記録媒体に
記憶された音響信号を記録時のＭ倍（ただし、０＜Ｍ＜
１）の速度で読み出す再生部と、前記再生部で読み出さ
れたアナログ信号をデジタル信号へ変換するＡ／Ｄ変換
器と、前記Ａ／Ｄ変換器の出力データを記憶する入力バ
ッファと、前記入力バッファに入力される信号の有音部
分と無音部分の判定を行う有音無音判定部と、前記有音
無音判定部の判定結果に基づき所定の時間長における無
音部分の含有率を演算する無音含有率演算部と、前記入
力バッファに記憶されている音声データに時間軸伸長を
行う時間軸制御部と、前記時間軸制御部の出力データを
蓄積するための出力バッファと、前記出力バッファ内に
蓄積されているデータのデータ残量を計測するデータ残
量監視部と、前記データ残量監視部から得られたデータ
残量と前記無音含有率演算部から得られた無音含有率に
応じて、予め定めた規則にしたがって時間軸変換の伸長
比を決定する伸長比制御部と、前記出力バッファに蓄積
されている音声データをアナログ信号に変換するＤ／Ａ
変換器とを備えたものである。

【００１２】請求項２記載の音声時間軸変換装置は、請
求項１記載の構成において、無音部分に対する伸長比と
有音部分に対する伸長比とをデータ残量による短期的な
適応制御と、無音含有率による長期的な適応制御の双方
を考慮して各々独立に設定する伸長比設定部を備えたも
のである。

【００１３】請求項３記載の音声時間軸変換装置は、請
求項２記載の発明において、無音部分伸長比を１／Ｍ以
上に設定し、有音部分伸長比を１．０以上かつ１／Ｍ以
下に設定し、データ残量に対応した変換規則に基づき各
々の伸長比を決定する伸長比制御部を備えたものであ
る。

【００１４】請求項４記載の音声時間軸変換装置は、請
求項２記載の発明において、有音部分伸長比をデータ残
量が所定の値以下の場合には１／Ｍに設定し、それ以外
には指定した固定値に設定し、無音部分伸長比を１／Ｍ
以上の範囲でデータ残量に対応した変換規則に基づき伸
長比を決定する伸長比制御部を備えたものである。

【００１５】請求項５記載の音声時間軸変換装置は、請
求項３記載の発明において、伸長比制御部は、長期的な
時間間隔で求めた無音含有率に応じて、有音または無音
部分の伸長比の可変範囲の上限値または下限値を変更し
たデータ残量と無音含有率に対応した変換規則に調整し
て各々の伸長比を決定する伸長比制御部を備えたもので
ある。

【００１６】

【作用】上記の構成によれば、有音無音の判定結果をも
とに、無音部分の伸長比を有音部分より大きくした時間
軸圧縮を行った後に出力バッファに書き込みを行う。こ
の際に、出力バッファ内に蓄積されているデータのデー
タ残量を計測し、データ残量が少なくなるほど伸長比を
大きくし、あるいは、無音部分の割合が所定値より少な
い場合にも自動的に伸長比を加減してバッファメモリに
絶えず十分なデータが確保される構成にしたことによ
り、時間的に短期的な伸長比の適応制御を行う。一方、
無音含有率を比較的長い周期で更新することにより、入
力される音声信号の性質が考慮され、時間的に長期的な
伸長比の適応制御を行うことができる。これらの双方の
伸長比の適応制御を行うことにより、有音部分の再生速
度をできるだけ記録時に近い値に保って再生することが
できるとともに、入力信号の性質に合わせた滑らかな伸
長比の変化を行うことができ、その結果、聴き取りやす
いスロー再生音を得ることができる。

【００１７】また、請求項４記載の構成によれば、バッ
ファメモリに残っているデータの数であるデータ残量が
極めて少ない場合には有音部分でも１／Ｍの伸長比で時
間軸伸長して音切れを防ぎ、それ以外の場合には無音部
分の伸長比をデータ残量をもとに調整する。これによっ
て、話速は所定の固定値で再生しつつ、バッファメモリ
が空になることによって出力信号がとぎれることもない
違和感の無い自然な再生音を得ることができる。

【００１８】

【実施例】以下、本発明の第１の実施例について図面を
参照しながら説明する。

【００１９】図１は本発明の第１の実施例における音声
時間軸変換装置の構成を示すブロック図である。図１に
おいて、１０１は音響信号の記録および再生を行なう記
録再生部、１０２は記録再生部１で再生されたアナログ
信号をデジタル信号に変換するＡ／Ｄ変換器、１０３は
Ａ／Ｄ変換された音響信号を一旦記録するための入力バ
ッファ、１０４は入力バッファ１０３へ書き込まれるデ
ジタル信号列が有音部分であるか無音部分であるかを判
定する有音無音判定部、１０５は、入力バッファ１０３
から読み出された信号に対して所定の伸長比で時間軸伸
長処理を行う時間軸制御部、１０６は入力バッファ１０
３からのデータの読み出しおよびそのアドレスを制御す
る読み出し制御部、１０７は出力バッファ１０８へのデ
ータの書き込みおよびそのアドレスを制御する書き込み
制御部、１０８は時間軸制御部１０５で処理されたデー
タを一時的に蓄える出力バッファ、１０９は出力バッフ
ァ１０８に一時的に保存しているデータ量を監視するデ
ータ残量監視部、１１０は時間軸制御部１０５の伸長比
をデータ残量監視部１０９の出力および無音含有率演算
部１１２の出力に応じて決定する伸長比制御部、１１１
は出力バッファ１０８に蓄積されたデジタルデータをア
ナログ信号に変換するＤ／Ａ変換器、１１２は入力信号
の無音含有率を演算する無音含有率演算部である。

【００２０】以上のように構成された音声時間軸変換装
置について、以下その動作を図１を参照しながら詳細に
説明する。

【００２１】まず、記録再生部１０１から記録時のＭ
（０＜Ｍ＜１）倍の速度で音響信号が読み出される。以
後、速度とは記録速度に対する相対速度を表すこととす
る。ここで、記録再生部１０１よりＭ倍速で再生された
音響信号は、逐次Ａ／Ｄ変換器１０２によりサンプリン
グ周期Ｔ／Ｍでデジタル信号系列に変換されて、入力バ
ッファ１０３に書き込まれる。一方、Ｄ／Ａ変換器１１
１はサンプリング周期Ｔでアナログ信号への変換が行わ
れるので、単位時間あたり入力信号に比べて１／Ｍ倍以
上の数のデータが出力バッファに適宜準備されていなけ
ればならない。その際に、入力信号全体に同じ割合の時
間軸伸長を施すのではなく、有音無音判定部１０４によ
る有音無音判定結果に基づき、無音部分には有音部分よ
り大きい伸長比で時間軸伸縮することで有音部分の伸長
比を1.0に近づける（有音部分のみ通常の速度に近い速
度で再生する）ように動作させるのが本実施例の基本的
な考え方である。

【００２２】入力バッファ１０３へ書き込まれる信号系
列に対して、有音無音判定部１０４によりそのサンプル
値列が有音部分であるか有音部分であるかの判定が行わ
れる。この有音無音判定は、例えばサンプル値の音圧レ
ベルが予め設定した基準音圧レベル以上であるか否かを
判別することなどで実現できる。この判定結果は、入力
バッファ１０３に書き込まれているデータのどの部分が
有音／無音なのかを伸長比制御部１１０に伝えられると
共に、無音含有率演算部１１２で、ある特定時間内にお
ける無音部分の含まれる割合を比較的長い時間周期で求
めるために利用される。

【００２３】時間軸制御部１０５は、後述する伸長比制
御部によって与えられた伸長比で、入力バッファ１０３
から読み出したデータに対して時間軸伸長処理を施して
出力バッファ１０８へ出力する。その際には、無音部分
には無音部分用の伸長比で時間軸伸長し、有音部分には
有音部分用の伸長比で時間軸伸長が行われる。データ残
量監視部１０９では、出力バッファ１０８に書き込まれ
ているがＤ／Ａ変換器１１１にはまだ出力されていない
データの残量をモニタしてその結果を伸長比制御部１１
０に与えている。伸長比制御部１１０は、“無音含有
率”と“データ残量”を入力とし、時間軸制御部１０５
へ無音および有音の各々の部分に対する伸長比を与え
る。伸長比を与える基本的な考え方は以下の点である。（１）無音部分への伸長比を有音部分への伸長比より大
きくまたは等しくする。（２）出力バッファへ溜まったデータ残量に応じて伸長
比を調整する。その際、データ残量が少ないほど、伸長
比を大きくする。（３）入力バッファへ書き込まれるデータの無音含有率
に応じて伸長比を調整する。その際無音含有率が小さい
ほど、有音伸長比が小さめの値を取り易く、無音伸長比
が大きめの値を取り易くする。

【００２４】図２（ａ）には、データ残量と伸長比の関
係、および無音含有率Ｒｍによる曲線の変化させる傾向
を示している。上記（１）は、一般的に人の音声は無音
部分の継続時間長を調整して発話速度を変化させている
ことに基づいている。このことは、例えば、「『連続音
声中の音韻区分の持続時間の性質』；比企，金森，大
泉；電気通信学会誌，第50巻，５号」に詳しく述べられ
ている。また、（２）のように伸長比を変えることによ
って、出力バッファに残っているデータ残量が空に近く
なるほど伸長比を大きくして出力データが不足しないよ
うにし、データ残量が大きくなるほど伸長比を小さめに
してデータが溜まりにくくすることができる。この動作
は、文節程度の時間長すなわち比較的短期的な適応の時
定数にする。（３）は、例えば有音用伸長比は下に凸に
なる度合を大きくし、無音用伸長比は上に凸なる度合を
大きくすることで実現される。

【００２５】また、入力信号中に含まれる無音の量に応
じて、有音部分と無音部分への伸長比を調整して、有音
部分の伸長比をできるだけ１．０に近づけるようにする
目的で利用する。すなわち、無音の多く含まれるソース
ほど、有音部分への伸長比を1.0に近づけ易くして、相
対的に有音部分を聴き取り易くする。この動作は、文章
程度の時間長、すなわち比較的長期的な適応の時定数に
する。そして、（２）および（３）を組み合わせること
で、様々な音声信号に対して柔軟に適応することが可能
となる。

【００２６】データ残量と伸長比の関係は例えば図２
（ａ）のように関数形で与えられるものでも、あるいは
階段状に変化するテーブル参照型のものでもかまわな
い。図２（ｂ）の例は、有音部分はデータ残量が０にな
らない限り伸長率０、すなわち記録時と同一の話速で再
生されることになる。この場合、有音部分の伸長率が固
定の“１”の状態では、有音部分が連続すると出力バッ
ファ内のデータ残量が急激に減少することになるので、
無音部分の伸長率はおおむね大きめにして出力バッファ
にデータが溜まりやすくしている。時間軸伸長すること
により、出力バッファが空にならないようにデータ数を
増加させることはできるが、むやみに大きい値の伸長比
を与えていると出力バッファの容量を越えてしまうこと
になり、出力信号の連続性を保てなくなる。このため、
データ残量が多くなるに連れて、無音部分の伸長比は小
さく抑えてある。

【００２７】以下は、記録媒体の再生速度を記録時の２
／３倍（Ｍ＝２／３）にした場合の動作について説明を
行う。

【００２８】まず、図２の伸長比設定テーブルは、デー
タ残量が０のとき、有音部分の伸長率を１．５にして、
入力信号に有音が与えられても出力バッファが空になる
ことを防いでいる。また、データ残量がほぼ出力バッフ
ァ容量と等しくなり、バッファ容量をオーバーフローす
る可能性がある場合には、無音部分の伸長比は１．５以
下に抑える必要がある。

【００２９】図４は、無音部分と有音部分とを別々の時
間軸伸長比で時間軸伸長を行う場合の処理の様子を、時
間軸に関して模式的に示したものである。図４（ａ）の
記録時の入力信号に対して図４（ｂ）は２／３倍の再生
速度で記録媒体から音声を再生した場合である。ここ
で、入力信号の無音部分の割合に依存して無音部分，有
音部分の伸長比を決める必要がある。（ｃ）と（ｄ）に
は無音部分の割合の異なる２つの例を示す。入力信号１
から６の部分において、（ｃ）の例では１，２，３が無
音部分で、４，５，６が有音部分とした場合の処理を行
っている。（ｄ）の例では１，２が無音部分で、３，
４，５，６が有音部分とした場合の処理を行っている。
この例では有音部分の伸長比はともに１．０にしている
ため、無音部分の伸長比は、（ｃ）の例では２．０、
（ｄ）の例では２．５となる。

【００３０】これらの例のように、無音部分の割合があ
らかじめ推定できれば、出力バッファ１０８から不足な
く出力データをＤ／Ａ変換器１１１に供給し続けられる
ので、伸長比を一定に固定しておいても出力データが不
足することが無い。再生するソースの種類によって無音
の含まれる割合は様々であるので、本実施例では、無音
含有率を演算して、時間的に比較的長期な無音の含まれ
る割合を求めている。

【００３１】しかしながら、時間的に比較的短期の間隔
で考えると、出力バッファのデータ容量に制限がある場
合や、遅延時間を考慮する必要がある場合などにおいて
は、局所的にデータが不足する場合が生じる。このよう
な場合には、直接的に、出力バッファのデータ残量から
短期的なデータ残量の増加率、すなわち伸長比を操作す
る必要がある。なぜなら、出力バッファから出ていくデ
ータ量は一定値であるが、入力されるデータ量は有音部
／無音部の伸長比によって増減率が変化するからであ
る。したがって、記憶容量に制限のある出力バッファに
蓄えられたデータの量をモニタしその値によって伸長比
を決定し、出力バッファで出力データの時間的な過不足
を吸収することによって、無音の割合が予想できない音
声であっても、無音部分と有音部分の伸長比を独立に設
定してもデータが不足することがないようにすることが
できる。なお、本発明は時間軸処理の細かい部分に特徴
があるわけでないため時間軸処理の詳細については言及
しない。なお、時間軸変換処理の詳細については、例え
ば「『高品質音声速度変換方式のＤＳＰによる実現』，
鈴木，三崎；電子情報通信学会音声研究会資料 SP90-3
4，（1990.8.23）」などに詳しく記述されている。

【００３２】なお、図２の例では、有音部伸長比を１．
０〜１．５、無音部伸長比を１．５〜３．０で変化させ
るとしたが、本発明においてこれらの伸長比の上限値・
下限値はこれらの数値に限られるものではない。例え
ば、画像との時間的ずれを少なくするためには、伸長比
の可変幅を小さくして、有音部伸長比を１．２〜１．
５、無音部伸長比を１．５〜２．０などで変化させても
良い。

【００３３】また、図３に示したように、無音含有率が
小さくなるに連れて、図３（ａ）から（ｂ），（ｃ）へ
と順に変化させることも考えられる。これらの図は、可
変する伸長比の上限値・下限値を無音含有率によって変
更する例である。例えば、ニュースなどの比較的無音部
分の多く含まれるソースの場合は、有音部分の伸長比の
下限値を小さめの値に設定し、無音部分の伸長比の上限
値も小さめの値に設定しても、データ残量が空になるこ
とはない。一方、サッカーなどの無音部分がほとんど含
まれないソースでは、有音部分の伸長比の下限値を大き
めにし、無音部分の伸長比の上限値を大きめにしても、
データ残量が安定し易く、有音部分の安定した話速の再
生音を得ることができる。このような場合においても、
先に示した例と同様の効果が得られる。いずれの場合に
おいても、平均的な有音部分の話速が安定し易くなる。

【００３４】このような伸長比の制御を行なうことによ
り、無音部分の割合により時間軸伸長する伸長比が少々
変化するが、記録時の話速以下で、かつ、記録媒体の再
生速度より早い話速で、音声信号を聴取できることにな
る。

【００３５】以上のように本実施例によれば、データ残
量と無音含有率に基づいて有音部分・無音部分各々独立
に時間軸伸長比を設定し、データ残量が予め定めた一定
量より少ない時には有音部分の伸長比を１／Ｍに設定し
て出力信号が途切れることを防ぎつつ、有音部分をでき
るだけ記録時の話速に近くする伸長比の制御を行うこと
により、記録媒体の再生速度が遅くなっても違和感なく
聞き取りやすい再生音を得ることができる。

【００３６】

【発明の効果】以上のように本発明は、記録速度のＭ倍
（０＜Ｍ＜１）で再生された音響信号を有音無音判定部
で有音部分と無音部分の判定をし、時間軸制御部では有
音部分と無音部分に対して独立に設定した伸長比で時間
軸伸長して出力バッファに蓄え、入力バッファに書き込
まれる音声信号の無音含有率および出力バッファに蓄積
されているデータ残量に応じて、無音部分および有音部
分を時間軸伸長する伸長比を予め定めた規則により決定
する伸長比制御部を備えているので、有音部分の再生速
度をできるだけ記録時に近い値に保って再生することが
できるとともに、入力信号の性質に合わせた滑らかな伸
長比の変化を行うことができ、その結果、聴き取りやす
いスロー再生音を得ることができる。

【００３７】そして、無音部分伸長比を１／Ｍ以上か
つ、有音部分伸長比を１．０以上かつ１／Ｍ以下に設定
して各々の伸長比を独立に変化させることにより、有音
部分の話速をＶＴＲ再生速度より早くすることができ
る。

【００３８】あるいは、有音部分伸長比はデータ残量が
所定の値以下の場合には１／Ｍに設定しそれ以外の場合
には指定した固定値に設定し、かつ無音部分伸長比を１
／Ｍ以上の範囲でデータ残量に対応した変換規則に基づ
いて決定することにより、話速は再生速度より早い一定
値で再生することができる。したがって、一般的に有音
部分の話速をより記録時に近い値にして出力できる。そ
して、無音含有率に応じて無音伸長比と有音伸長比の
値、あるいは無音伸長比の値のみを調整できるように伸
長比制御部で制御でき、入力信号の性質に合わせた伸長
比に自動的に調整可能となる。また、出力バッファに溜
まっているデータ残量を監視するデータ残量監視部を設
けており、どのような入力信号が与えられても出力信号
が途切れることなく再生できる。

【００３９】また、長期的な時間間隔で求めた無音含有
率に応じて、有音または無音部分の伸長比の可変範囲の
上限値または下限値を変更したデータ残量と無音含有率
に対応した変換規則に調整して各々の伸長比を決定する
ことにより、入力信号の性質に適合した伸長比を設定す
ることができる。

【００４０】このように、画像信号をゆっくりと見るた
めに記録媒体の再生速度を遅くした時に、どのような入
力ソースであっても、音声信号を必要以上に遅い話速で
聞く必要はなくなり、違和感の無い聞き取りやすいスロ
ー再生を可能にする音声時間軸変換装置を提供すること
ができる。

【図面の簡単な説明】

【図１】本発明の一実施例における音声時間軸変換装置
の構成を示すブロック図

【図２】本実施例に係る伸長比設定テーブルの説明図

【図３】本実施例に係る他の伸長比設定テーブルの説明
図

【図４】本実施例に係る時間軸伸長処理の模式図

【図５】従来の音声時間軸変換装置のブロック図

【図６】従来の時間軸伸長処理の模式図

【符号の説明】

１０１記録再生部１０２Ａ／Ｄ変換器１０３入力バッファ１０４有音無音判定部１０５時間軸制御部１０６読み出し制御部１０７書き込み制御部１０８出力バッファ１０９データ残量監視部１１０伸長比制御部１１１Ｄ／Ａ変換器１１２無音含有率演算部

Claims

【特許請求の範囲】

【請求項１】記録媒体に記憶された音響信号を記録時の
Ｍ倍（ただし、０＜Ｍ＜１）の速度で読み出す再生部
と、前記再生部で読み出されたアナログ信号をデジタル信号
へ変換するＡ／Ｄ変換器と、前記Ａ／Ｄ変換器の出力データを記憶する入力バッファ
と、前記入力バッファに入力される信号の有音部分と無音部
分の判定を行う有音無音判定部と、前記有音無音判定部の判定結果に基づき所定の時間長に
おける無音部分の含有率を演算する無音含有率演算部
と、前記入力バッファに記憶されている音声データに時間軸
伸長を行う時間軸制御部と、前記時間軸制御部の出力データを蓄積するための出力バ
ッファと、前記出力バッファ内に蓄積されているデータのデータ残
量を計測するデータ残量監視部と、前記データ残量監視部から得られたデータ残量と前記無
音含有率演算部から得られた無音含有率に応じて、予め
定めた規則にしたがって時間軸変換の伸長比を決定する
伸長比制御部と、前記出力バッファに蓄積されている音声データをアナロ
グ信号に変換するＤ／Ａ変換器とを備えたことを特徴と
する音声時間軸変換装置。
【請求項２】伸長比制御部は、データ残量監視部から得
られたデータ残量による短期的な適応制御と、無音含有
率演算部から得られた無音含有率による長期的な適応制
御、の双方を考慮した圧伸比の制御を行い、無音部分に
対する伸長比と有音部分に対する伸長比とを各々独立に
設定することを特徴とする請求項１記載の音声時間軸変
換装置。
【請求項３】伸長比制御部は、無音部分伸長比を１／Ｍ
以上に設定し、有音部分伸長比を１．０以上かつ１／Ｍ
以下に設定し、データ残量と無音含有率に対応した変換
規則に基づき各々の伸長比を決定することを特徴とする
請求項２記載の音声時間軸変換装置。
【請求項４】伸長比制御部は、有音部分伸長比を、デー
タ残量が所定値以下の場合には１／Ｍに設定しそれ以外
の場合には指定した固定値に設定し、無音部分伸長比を
１／Ｍ以上の範囲でデータ残量と無音含有率に対応した
変換規則に基づき伸長比を決定することを特徴とする請
求項２記載の音声時間軸変換装置。
【請求項５】伸長比制御部は、長期的な時間間隔で求め
た無音含有率に応じて、有音または無音部分の伸長比の
可変範囲の上限値または下限値を変更したデータ残量と
無音含有率に対応した変換規則に調整して各々の伸長比
を決定することを特徴とする請求項３記載の音声時間軸
変換装置。