JPH0883096A - 音声時間軸変換装置 - Google Patents

音声時間軸変換装置

Info

Publication number
JPH0883096A
JPH0883096A JP6220131A JP22013194A JPH0883096A JP H0883096 A JPH0883096 A JP H0883096A JP 6220131 A JP6220131 A JP 6220131A JP 22013194 A JP22013194 A JP 22013194A JP H0883096 A JPH0883096 A JP H0883096A
Authority
JP
Japan
Prior art keywords
speed
data
memory
control unit
recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6220131A
Other languages
English (en)
Other versions
JP3189587B2 (ja
Inventor
Takeshi Norimatsu
武志 則松
Masayuki Misaki
正之 三崎
Kimiharu Watanabe
公治 渡辺
Norikazu Ueno
憲和 上野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP22013194A priority Critical patent/JP3189587B2/ja
Priority to EP95306302A priority patent/EP0702354A1/en
Priority to CN 95117716 priority patent/CN1131794A/zh
Publication of JPH0883096A publication Critical patent/JPH0883096A/ja
Application granted granted Critical
Publication of JP3189587B2 publication Critical patent/JP3189587B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

(57)【要約】 【目的】 音響信号を記録時のM(≧1)倍で再生する
際に、記録時の音程を保ちながらデータの廃棄を極力抑
え自動的に聴き易い速度に変換することのできる音声時
間軸変換装置を提供することを目的とする。 【構成】 記録再生部101からM倍速再生された音声
は、A/D変換器102で周期T/Mでディジタル信号
に変換される。この信号は有音無音判定部103で有音
無音判定され、書き込み制御部104により有音部分の
みがバッファメモリー105に蓄積される。読み出し制
御部106は周期Tでバッファメモリー105からデー
タを読み出し、時間軸制御部109ではその時間軸変換
処理を行う。メモリー残量監視部107では逐次バッフ
ァメモリー内の現在の書き込み、読み出し位置からメモ
リー残量を計測し、この結果を基に適応速度制御部10
8でメモリー残量に応じて予め定めた規則に基づいて時
間軸変換の速度を決定する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ビデオテープレコーダ
ー(VTR)等で音声の高速、低速再生を行う際に必要
となる音声の時間軸の長さを任意に圧縮、伸長すること
のできる音声時間軸変換装置に関するものである。
【0002】
【従来の技術】従来から、記録媒体から記録時とは異な
った速度で音声信号を再生することのできる音声時間軸
変換装置がある。例えばカセットテープレコーダーの早
送り再生機能であるが、この場合読みだし速度を高速に
することにより音程までもが変化してしまうため、大変
聴きづらいものとなる。そこで、音程は記録時のままで
再生速度を可変することのできる音声時間軸変換装置が
提案されている。
【0003】以下、従来の音声時間軸変換装置について
図面を参照しながら説明する。図7は従来の音声時間軸
変換装置の構成を示すブロック図である。図7におい
て、1は音響信号の記録及び再生を行う記録再生部、2
は再生されたアナログ信号をディジタル信号に変換する
A/D変換器、3はディジタルデータを蓄積するための
バッファメモリー、4はD/A変換器、5はバッファメ
モリーへのデータの書き込みを制御する書き込み制御
部、6はメモリのデータの読み出しを制御する読みだし
制御部である。
【0004】以上のように構成された音声時間軸変換装
置について、以下その動作を説明する。ここでは、記録
媒体への記録速度以上で音声信号を再生する場合に、音
程を記録時のものに戻して再生する音声時間軸変換装置
について説明する。
【0005】まず、記録再生部1は記録速度のM倍で音
響信号を再生する。ここで記録再生部とは例えば、VT
R、カセットテープレコーダー等である。次に、記録再
生部1から再生された音響信号は再生速度に反比例した
サンプリング周期T/MでA/D変換器2によりディジ
タル信号に変換される。Tは記録時の音響信号について
標本化定理を満足するサンプリング周期であり、M倍速
再生された音響信号をディジタル信号に変換するために
は、少なくともサンプリング周期Tの1/M倍、すなわ
ちT/Mで標本化する必要がある。A/D変換されたこ
れらのディジタル信号は書き込み制御部5により周期T
/Mで順次バッファメモリー3に蓄積される。これらの
信号を今度は周期Tで読み出し再生すれば記録時の音程
に戻るわけであるが、全てのデータを出力するには時間
的に不可能である。そこで読み出し制御部6ではバッフ
ァメモリー3に蓄積されたディジタル信号を周期Tで順
次読みだし、一定量のサンプル値毎に|1−M|/Mの
割合でデータを廃棄しながら、残りのデータをD/A変
換器4によりサンプリング周期Tでアナログ信号に変換
する。ここで||は絶対値を表す。通常この廃棄と再生
の間隔は数ミリ秒以下の短い単位である。これら一連の
処理により、記録時の音程を保持したままで高速再生が
実現できる。
【0006】図8は2倍速(M=2)の場合の処理例を
示している。(a)は記録時のデータを示しており、2
倍速で読み出すことにより(b)のように時間軸は1/
2になる。この(b)のデータの1/2を廃棄しながら
サンプリング周期Tで再生すると(c)のデータ列とな
り、音程は(a)のデータ列と同じで、時間軸は(b)
のデータ列と同じにすることができる。
【0007】
【発明が解決しようとする課題】しかしながら上記した
従来例では、音程は記録時の高さに戻るが、均一の再生
速度の制御しか行えないため、音声の速度は再生速度に
比例して早口になり人間にとって大変聴きづらいものと
なっていた。また、高速再生時に再生速度との時間軸を
そろえるためには、再生速度に比例した量のデータを廃
棄しなければならない。例えば2倍速再生時には半分の
データを棄却することになる。そのため高速になるほど
再生音声は劣化してしまう。また、情報の廃棄の間隔を
数秒程度と長くすれば、音声の再生されている区間は、
劣化もなく記録時と同じ速度で聴き易くなるが、反面大
きなブロックで情報が欠落することになり言葉全体とし
ての意味を理解しづらくなるという欠点があった。
【0008】本発明は上記課題を解決するもので、記録
媒体から記録速度以上の再生速度で読みだした場合に、
情報の欠落をできるだけ抑えながら聴き易い変換速度に
自動的に変更することが可能な音声時間軸変換装置を提
供することを目的とする。
【0009】
【課題を解決するための手段】上記課題を解決するため
に、請求項1記載の音声時間軸変換装置は、記録媒体か
ら記録速度以上の再生速度で音響信号を読み出す記録再
生部と、再生されたアナログ信号をディジタル信号に変
換するA/D変換器と、入力信号中の無音部と有音部の
判定を行う有音無音判定部と、入力信号を蓄積するため
のバッファメモリーと、バッファメモリーへのデータの
書き込み、及びそのアドレスを制御する書き込み制御部
と、バッファメモリーからのデータの読み出し、及びそ
のアドレスを制御する読み出し制御部と、書き込み制御
部及び読み出し制御部で現在の書き込みアドレス及び読
み出しアドレスの位置関係からバッファメモリー中のメ
モリー残量を計測するメモリー残量監視部と、メモリー
残量に応じて予め定めた規則に基づき時間軸変換の速度
を決定する適応速度制御部と、適応速度制御部で決定さ
れた変換速度に従って音声時間軸の圧縮を行う時間軸制
御部と、時間軸変換後のデータをアナログ信号に変換す
るD/A変換器とを備えたものである。
【0010】請求項2記載の音声時間軸変換装置は、メ
モリー残量に比例して時間軸変換速度を決定する適応速
度制御部を備えたものである。
【0011】請求項3記載の音声時間軸変換装置は、メ
モリー残量に非線形に対応した変換規則に基づき時間軸
変換速度を決定する適応速度制御部を備えたものであ
る。
【0012】請求項4記載の音声時間軸変換装置は、隣
合う一定個数のサンプル値列に、それぞれ、単調減少す
る重み係数を掛け合わせた値と、単調増加する重み係数
を掛け合わせた値とを加算するクロスフェード区間と、
サンプル値を直接出力する無処理区間の長さとを調整す
ることにより、所望の時間軸変換速度に変換する時間軸
制御部を備えたものである。
【0013】請求項5および請求項6記載の音声時間軸
変換装置は、メモリー残量が一定値以上の時は有音区間
のみをバッファメモリーに蓄積し、一定値以下の時は全
てのデータをバッファメモリーに蓄積する書き込み制御
部を備えたものである。
【0014】
【作用】上記請求項1記載の構成によれば、有音無音の
判定の結果、有音と判定された区間のみをバッファメモ
リーに蓄積し、書き込みと読み出しのアドレス位置から
メモリー残量を計測し、その残量に応じて残量の多いと
きはできるだけ低速に残量が少なくなるにつれて徐々に
高速になるといったように無音の量に応じて自動的に速
度を調整できるように構成したことにより、特に無音の
多い入力信号に対しては聴き易い速度で音声を再生する
ことが可能となる。また無音の少ない入力信号の場合
は、メモリー残量に応じて再生速度が変化するので情報
が欠落を防止することができる。また多少の情報の欠落
を許して、適応的に変える音声の速度の最大値を再生速
度より小さい値に設定すると、わずかな情報欠落はある
ものの言葉としては理解できる範囲で聞き取り易い速度
で音声を再生することが可能となる。また記録速度と同
速度(1倍速)で再生する場合に、無音の量に応じて時
間軸変換の速度を記録速度より低速になるように制御す
れば、もともと早口の音声の聞き取り、外国語の聞き取
りを容易にすることも可能となる。。
【0015】請求項2記載の構成によれば、メモリー残
量と変換速度が比例して変化するので、音声の速度が急
激に変化することが抑えられ、音声が聞き取り易くな
る。
【0016】請求項3記載の構成によれば、低速の変換
速度に長くとどまるような非線形の変換規則を設定すれ
ば、変換速度を低く抑えようとする効果により、低速側
で安定して音声を再生することが可能であり、非常に聞
き取り易い音声時間軸変換装置が実現できる。
【0017】請求項4記載の構成によれば、バッファメ
モリーに蓄積されたデータを直接出力する無処理区間の
長さを調節するだけで、任意の時間軸変換速度を得るこ
とができ、非常に簡単な構成で任意の速度に変換可能な
音声時間軸変換装置が実現できる。
【0018】請求項5および請求項6記載の構成によれ
ば、メモリー残量が少なくなった時点で入力信号の有音
無音判定結果にかかわらず全てのデータをバッファメモ
リーに蓄積することにより、読み出すべきデータがなく
なり途中で再生音が無音状態となる(ミュート状態とな
る)ことがなく、違和感のない自然な再生音を得ること
ができる。
【0019】
【実施例】以下、本発明の第1の実施例について図面を
参照しながら説明する。図1は本発明の第1の実施例に
おける音声時間軸変換装置の構成を示すブロック図であ
る。図1において、101は音響信号の記録及び再生を
行う記録再生部、102は記録再生部1で再生されたア
ナログ信号をディジタル信号に変換するA/D変換器、
103は変換されたディジタル信号列が有音部であるか
無音部であるかを判定する有音無音判定部、104は有
音部と判定された信号列を書き込むバッファメモリー1
05上への書き込み及びそのアドレスを制御する書き込
み制御部、106はバッファメモリー105に蓄積され
たデータの読み出し及びそのアドレスを制御する読み出
し制御部、107は現在のバッファメモリー105上の
書き込みアドレスと読み出しアドレスの位置関係からメ
モリー残量を計測するメモリー残量監視部、108はメ
モリー残量監視部で得られたメモリー残量から時間軸変
換のための速度を決定する適応速度制御部、109は適
応速度制御部で決定された変換速度に従って時間軸の変
換処理を行う時間軸制御部、110は時間軸変換された
ディジタルデータをアナログ信号に変換するD/A変換
器である。
【0020】以上のように構成された音声時間軸変換装
置について、以下その動作を図1を参照しながら詳細に
説明する。
【0021】まず記録再生部101から記録時のM(≧
1)倍の速度で音響信号が読み出される。以降では、速
度とは記録速度(=1)に対する相対速度を表すことと
する。ここで、記録再生部101での記録時のサンプリ
ング周期をTとすると、記録再生部101よりM倍速で
再生された音響信号は逐次A/D変換器102によりサ
ンプリング周期T/Mでディジタル信号系列に変換され
る。このディジタル信号系列から有音無音判定部103
によりそのサンプル列が有音部であるか無音部であるか
を判定する。有音無音の判定は例えば次のように行う。
ディジタル信号のサンプル値列をsiとすると、N個のサ
ンプル値系列に対して、(数1)を満たす場合にそのサ
ンプル値列は有音、満たさない場合は無音であると判定
する。ここでPthは予め定めた有音無音判定のためのし
きい値である。
【0022】
【数1】
【0023】ここで、バッファメモリー105上の次に
データを格納すべきアドレスを指し示すポインター(以
下、書き込みポインターと呼ぶ)をPwとすると、上記
(数1)で有音と判定された場合には、書き込み制御部
104によりそのサンプル値系列が書き込みポインター
Pwの示すバッファメモリー105のアドレス位置に順次
格納され、その都度Pwはインクリメントされる。逆に無
音と判定された場合には、書き込み制御部104はバッ
ファメモリー105へのデータの書き込み動作を停止す
る。これにより、バッファメモリー105には有音部の
データのみが蓄積される。
【0024】なお、ここでは(数1)を満たす場合に有
音、満たさない場合に無音と判定したが、(数1)を満
たす区間に対してその前方、あるいは後方に続く無音と
判定された短いサンプル列分を有音区間に含めてもよ
い。
【0025】読み出し制御部106では、バッファメモ
リー105のデータを周期Tで順次読み出し、時間軸制
御部109へ送る。ここで、次に読み出すべきバッファ
メモリー105上のデータのアドレスを示すポインター
(以下、読み出しポインターと呼ぶ)をPrとする。メモ
リー残量監視部107では、前記書き込みポインターPw
と読み出しポインターPrとの位置関係から、バッファメ
モリー105上のまだ読み出されていないデータの残量
を逐次計測する。図2はメモリー残量の計測方法を示す
説明図であり、2つのポインターの位置関係により同図
(a)(b)の2つの場合がある。図2においてバッフ
ァメモリーの開始アドレスをa0、終了アドレスをa
nー1(但し、anー1>a0)とすると、まだ読み出されてい
ないメモリー残量Zは、図2の斜線の部分で示され次式
のように計算できる。
【0026】
【数2】
【0027】これは、バッファメモリー105をいわゆ
る巡回メモリーとして扱っていることと等価である。こ
こで、通常メモリーからデータを読みだし出力するため
には、巡回メモリー上で書き込みポインターPwが読み出
しポインターPrより先行していなければならないため、
PwとPrが重なっている場合は(Pw=Pr)、読み出し制御
部106が読み出し動作を停止し、読み出しポインター
Prはそのときのアドレス値を維持する。ここで、PwとPr
が重なった状態には、図2(a)でPrがPwに追いついた
場合と、図2(b)でPwがPrに追いついた場合の2通り
が考えられる。後者の場合は、実際にはメモリー残量が
バッファメモリー105の容量、即ちnの時に相当する
が、この場合もメモリー残量Zを0にリセットする。
【0028】メモリー残量監視部107で得られたメモ
リー残量Zの値をもとに、適応速度制御部108では、
メモリー残量が少ないときはできるだけ記録速度に近い
ゆっくりした速度に、残量が多いときには書き込みポイ
ンターPwに読み出しポインターPrが追いつかれないよう
に、適宜速い速度に時間軸変換の速度を設定する。以下
適応速度制御部108の動作を、記録再生部101から
記録速度の2倍(M=2)の速度で再生した場合につい
て説明する。ここでは、変換速度の最大値を再生速度と
同じ2、最小値を記録速度と同じ1とする。図3はメモ
リー残量とそれに対する変換速度の関係を示しており、
これが変換速度を設定するための規則となる。図3
(a)はメモリー残量と変換速度を線形に対応づける規
則を示している。この場合、変換速度Vは次式により算
出できる。
【0029】
【数3】
【0030】図3(b)はメモリー残量と変換速度を非
線形に対応づける規則の例を示したものである。ここ
で、2次曲線により対応づけるとすると、変換速度Vは
次式により算出できる。
【0031】
【数4】
【0032】図3(a)の場合は、メモリー残量の増減
に応じてなめらかに変換速度を変更することができ、一
方図3(b)の場合はバッファメモリー105にデータ
がある程度蓄積されるまでは、できるだけ記録速度1に
近いところで安定させることができるという特徴があ
る。
【0033】図3(c)は非線形の対応付けを階段上に
規定した場合の例であり、変換速度Vは次式により算出
できる。
【0034】
【数5】
【0035】図3(c)に示した規則は、(b)の規則
とほぼ同等の制御を少ない演算量、回路規模で実現する
ことが可能である。
【0036】このように、図3の対応規則に基づき変換
速度を決定することにより、2倍速で再生された信号で
も、無音がある量以上存在する入力信号に対しては記録
速度1に近い聞き易い速度を設定することが可能であ
り、また無音の含まれない信号が継続する場合は最大の
変換速度2が設定されるので、データの欠落を生じな
い。なお、ここでは変換速度の最大値を2、最小値を1
としたが、最大値を2より小さな値(例えば1.8)、
また最小値を1より大きな値(例えば1.5)に設定し
ても同様の規則が設定できる。ただし、最大値を2より
小さい値に設定する場合は、無音の含まれない信号が継
続した時に、記録速度の2倍で再生された信号に対して
最大でも2倍未満の速度にしか設定されないため、デー
タの読み出しができずにデータの一部を棄却する必要が
生じる場合がある。これは例えば図2(b)においてPw
がPrに追いついた場合が相当するが、この場合上記で述
べたようにメモリー残量を0にリセットすることによ
り、今までに蓄積されたバッファメモリーの容量分のデ
ータを廃棄していることになる。例えば、バッファメモ
リーの容量を256kビットとし、10kHzサンプリ
ングで1サンプル8ビットデータを扱う場合は、32k
ポイント(約3.2秒分)の有音データを廃棄すること
になる。このような設定を行うことにより、無音の量に
よりデータの一部が欠落するが、変換速度の最大値を低
く抑えることにより、データ全体をよりゆっくりした聞
きやすい速度で再生することが可能となる。
【0037】適応速度制御部108により決定された変
換速度Vの値は時間軸制御部109に送出され、変換速
度Vに応じた時間軸の変換処理が施される。図4は時間
軸制御部109の詳細構成を示すブロック図である。図
4において、401は全体の制御を行う制御回路、40
2は制御回路の指令により重み付け加算を行うクロスフ
ェード処理区間か、無処理区間かを切り替える切換回
路、403は一時的にデータを保持するラッチ回路、4
04は重みづけ加算処理を行うクロスフェード回路であ
り、他のブロックは図1の同名のブロックと同一のもの
であるので同番号を付してある。以下、図4に沿って、
時間軸制御部109の動作を説明する。
【0038】制御回路401は、まず変換速度Vを実現
するために、クロスフェード区間長Kと無処理区間長S
を決定する。ここではクロスフェード区間長を固定値K
とするが、変換速度Vに応じてKの値を可変にすること
ももちろん可能である。図5は時間軸変換処理を説明す
るための模式図であり、図5(a)は処理前のデータ、
図5(b)は処理後のデータを表している。また、図5
(b)のデータの長さKに対応する部分はデータAとB
をクロスフェード処理したことを表している。ここで、
変換速度Vを実現するためには、処理前のデータA,
B,Cの合計の長さ(2K+S)の1/Vが時間軸処理
後のデータ長(K+S)になるように長さSを決定すれ
ばよい。そこで、無処理区間長Sは次式により決定され
る。
【0039】
【数6】
【0040】今、読み出しポインターPrが図5(a)の
データ列Aの先頭を指しているとして、まずクロスフェ
ード処理について説明する。制御回路401は切換回路
402をクロスフェード処理側に切り換えるとともに、
読み出し制御部106にポインターPrの示すデータを読
み出すよう指令する。このデータはラッチ回路403に
入力され保持される。制御回路401は次にkサンプル
先のPr+Kのアドレスの示すデータを読み出すよう読み
出し制御部106に指令し、このデータは直接クロスフ
ェード回路404に入力される。クロスフェード回路4
04はこの2つのデータを用いて重み付け加算を実行す
る。
【0041】ここで、図5(a)のデータ列Aをd0
d1、・・・、dk-1、データ列Bをdk、dk+1、・・・、d
2k-1とする。また単調増加する重み関数をw1(t)(但
し、0≦w1(t)≦1、t=0、1、・・・k-1)、単調減少
する重み関数をw2(t)=1−w1(t)とすると、重み付け加
算後の値ctは次式により得られる。
【0042】
【数7】
【0043】この後、読み出しポインターPrはインクリ
メントされ、以降制御回路は上記と同様の処理をK回続
け、図5(a)のデータ列AとBとのクロスフェード処
理が全て終了後、読み出しポインターにはその時点のPr
+Kの値が設定される。クロスフェード処理が終了する
と、制御回路401は切換回路402を無処理側に切り
換え、バッファメモリー105から読み出されたデータ
は(数6)で決定された長さS分のデータが直接D/A
変換器110に入力される。以降、長さKのクロスフェ
ード処理と、長さSの無処理データの出力を交互に繰り
返すことにより、変換速度Vを与える時間軸変換が実現
できる。ある時点で適応速度制御部108で設定された
変換速度が変更された場合は、(数6)により無処理区
間長を変更し、以降上記と同様の処理を続けることによ
り、随時変換速度を変更する。
【0044】このようにして時間軸変換処理されたデー
タ列は、最終的に周期TでD/A変換器110によりア
ナログ信号に変換されることにより、記録時と音程が同
一で再生速度M以下で速度が適応的に切り替わる音声信
号を得ることができる。
【0045】以上のように、上記した第1の実施例によ
ると、有音無音判定部103と、書き込みポインターと
読み出しポインターの位置関係からメモリー残量を計測
するメモリー残量監視部107と、メモリー残量に応じ
て時間軸変換の速度を決定する適応速度制御部108と
を設け、メモリー残量が少ない時は変換速度を徐々に遅
く、メモリー残量が多い時には徐々に速く制御すること
により、高速に再生された音声信号をその中に含まれる
無音の量に応じて再生速度以下のゆっくりした速度で、
しかも情報の欠落がほとんどなく、高速に聴取すること
が可能となる。また、クロスフェード区間長と無処理区
間長を調整することにより、所望の変換速度で時間軸を
変換する時間軸制御部109を設けたことにより、高品
質の時間軸変換が実現できるとともに、特にクロスフェ
ード区間長を予め設定した値に固定すると、無処理区間
の長さのみを変更するだけで任意の時間軸変換の速度が
達成され、非常に簡単な構成で音声時間軸変換装置を実
現することができる。特にVTRなどのように画像を伴
った記録再生部では、例えば画像は2倍速再生で、音声
のみを2倍速以下のゆっくりした速度で再生することが
でき、効果が大きい。
【0046】次に、本発明の音声時間軸変換装置の第2
の実施例について説明する。本実施例の音声時間軸変換
装置の基本構成は図1に示したブロック図と同一であ
り、書き込み制御部104の動作のみが異なる。図6は
本実施例の書き込み制御部の動作を示すフローチャート
である。以下では、図6を参照しながら書き込み制御部
の動作についてのみ説明する。
【0047】書き込み動作部104は、メモリー残量監
視部107より計測されたメモリー残量Zの値を逐次取
り込み(S1)、予め設定したしきい値Zthと比較する
(S2)。ここで、ZがZthよりも大きければ、即ち十
分にメモリー残量がある場合は、有音無音判定部103
の結果から現在の入力データが有音であるか無音である
かを判断し(S3)、有音である場合のみそのデータを
バッファメモリー105に書き込み(S4)、書き込み
ポインターPwをインクリメントする(S5)。S3の
判定条件を満足しない場合、即ちメモリー残量が十分に
存在しない場合は、有音無音の判定結果にかかわらず、
データをバッファメモリー105に書き込み、書き込み
ポインターPwをインクリメントする。上記した一連の
処理は具体的には、無音が多く含まれる信号の場合に、
図2(a)において読み出しポインターPrが書き込み
ポインターPwに追いつかないよう、即ちメモリー残量
が0にならないように制御していることになる。
【0048】以上のように、上記した第2の実施例によ
ると、メモリー残量が予め定めた一定量より少ないとき
には全データをバッファメモリーに蓄積する書き込み制
御部を設けたことにより、メモリー残量が0にならずに
再生音が途切れる(ミュート状態になる)ことが防止さ
れ、違和感のない自然な再生が可能な音声時間軸変換装
置を実現することができる。
【0049】
【発明の効果】以上のように、本発明の音声時間軸変換
装置は、記録速度のM(≧1)倍で再生された音響信号
から有音無音判定により有音部分のみをバッファメモリ
ーに蓄積し、書き込みと読み出しのアドレス位置からメ
モリー残量を計測し、その残量に応じて残量の少ないと
きはできるだけ低速に、残量が多くなるにつれて徐々に
高速になるように無音の量に応じて自動的に変換速度を
調整できるように構成したことにより、高速再生時に、
音程は記録時と同一で、しかも再生速度よりも遅い聞き
やすい速度で音声を再生することが可能な音声時間軸変
換装置を提供することができる。
【0050】また、クロスフェード区間長と無処理区間
長を調整することにより、所望の変換速度に時間軸を変
換する時間軸制御部を設けたことにより、特にクロスフ
ェード区間長を一定にすれば、無処理区間の長さを調節
するだけで任意の変換速度が達成でき、高品質の時間軸
変換された再生音を簡単な回路構成で実現できる。
【0051】また、メモリー残量が少ない時には、有音
無音の判定にかかわらず全てのデータをバッファメモリ
ーに記憶するように構成することにより、出力するデー
タがなくなり再生途中でミュート状態になることがな
く、違和感のない自然な再生音声を出力することのでき
る音声時間軸変換装置を提供することができる。
【図面の簡単な説明】
【図1】本発明の一実施例における音声時間軸変換装置
の構成を示すブロック図
【図2】本実施例に係るメモリー残量の計測方法の説明
【図3】本実施例に係る適応速度制御部の速度設定方法
の説明図
【図4】本実施例に係る時間軸制御部の回路図
【図5】本実施例に係る時間軸制御部の動作を示す原理
【図6】本発明の第2の実施例に係る書き込み制御部を
動作を示すフローチャート
【図7】従来例の音声時間軸変換装置のブロック構成図
【図8】従来例の音声時間軸変換装置のデータ処理方法
を示す原理図
【符号の説明】
101 記録再生部 102 A/D変換器 103 有音無音判定部 104 書き込み制御部 105 バッファメモリー 106 読みだし制御部 107 メモリー残量監視部 108 適応速度制御部 109 時間軸制御部 110 D/A変換器
───────────────────────────────────────────────────── フロントページの続き (72)発明者 上野 憲和 大阪府門真市大字門真1006番地 松下電器 産業株式会社内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】記録媒体に記憶された音響信号を記録時の
    M(≧1)倍の速度で読み出す記録再生部と、前記記録
    再生部で読み出されたアナログ音響信号をディジタル信
    号に変換するA/D変換器と、入力信号の無音部分と有
    音部分を判定する有音無音判定部と、ディジタル変換さ
    れたデータを蓄積するためのバッファメモリーと、前記
    有音無音判定部で有音と判定された区間のデータのみを
    前記バッファメモリーに書き込むように書き込みアドレ
    スを制御する書き込み制御部と、前記バッファメモリー
    のデータを読み出す読み出し制御部と、前記書き込み制
    御部で最後に前記バッファメモリーに書き込まれたアド
    レスと前記読み出し制御部で最後に読み出された前記バ
    ッファメモリー上のアドレスとの位置関係を監視するこ
    とにより前記バッファメモリー内のメモリー残量を計測
    するメモリー残量監視部と、前記メモリー残量監視部か
    ら得られたメモリー残量に応じて予め定めた規則に従っ
    てデータの時間軸変換の速度を決定する適応速度制御部
    と、前記適応速度制御部で決定された変換速度に従っ
    て、音声の時間軸の圧縮を行う時間軸制御部と、前記時
    間軸制御部により得られた処理データをアナログ信号に
    変換するD/A変換器とを備えたことを特徴とする音声
    時間軸変換装置。
  2. 【請求項2】適応速度制御部は、設定する変換速度の最
    大値を前記記録媒体からの再生速度Mと同じあるいはそ
    れ以下、最小値を記録媒体の記録速度と同じあるいはそ
    れ以上とし、メモリー残量に比例して変換速度を決定す
    ることを特徴とする請求項1記載の音声時間軸変換装
    置。
  3. 【請求項3】適応速度制御部は、設定する変換速度の最
    大値を前記記録媒体からの再生速度Mと同じあるいはそ
    れ以下、最小値を記録媒体の記録速度と同じあるいはそ
    れ以上とし、メモリー残量と非線形に対応付けした変換
    規則に基づき変換速度を決定することを特徴とする請求
    項1記載の音声時間軸変換装置。
  4. 【請求項4】時間軸制御部は、隣合う一定個数毎のサン
    プル値列に、それぞれ、単調減少する重み係数を掛け合
    わせた値と単調増加する重み係数を掛け合わせた値とを
    加算するクロスフェード処理区間の長さと、データを直
    接出力する無処理区間の長さを調整し、それぞれの区間
    を交互に出力することにより、前記適応速度制御部から
    出力される時間軸変換速度に合わせて時間軸を調整する
    ことを特徴とする請求項1、請求項2、請求項3のいず
    れかに記載の音声時間軸変換装置。
  5. 【請求項5】書き込み制御部は、メモリー残量監視部で
    メモリー残量が一定量以上の時は有音無音判定部で有音
    と判定されたデータのみをバッファメモリーに蓄積し、
    前記メモリー残量監視部でメモリー残量が一定量以下で
    あると判定された場合には、前記有音無音判定部の結果
    に関わらず、すべてのデータを前記バッファメモリーに
    蓄積するように書き込みアドレスを制御することを特徴
    とする請求項1記載の音声時間軸変換装置。
  6. 【請求項6】書き込み制御部は、メモリー残量監視部で
    メモリー残量が一定量以上の時は有音無音判定部で有音
    と判定されたデータのみをバッファメモリーに蓄積し、
    前記メモリー残量監視部でメモリー残量が一定量以下で
    あると判定された場合には、前記有音無音判定部の結果
    に関わらず、すべてのデータを前記バッファメモリーに
    蓄積するように書き込みアドレスを制御することを特徴
    とする請求項4記載の音声時間軸変換装置。
JP22013194A 1994-09-14 1994-09-14 音声時間軸変換装置 Expired - Fee Related JP3189587B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP22013194A JP3189587B2 (ja) 1994-09-14 1994-09-14 音声時間軸変換装置
EP95306302A EP0702354A1 (en) 1994-09-14 1995-09-08 Apparatus for modifying the time scale modification of speech
CN 95117716 CN1131794A (zh) 1994-09-14 1995-09-14 用来改变语音的时标修改的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22013194A JP3189587B2 (ja) 1994-09-14 1994-09-14 音声時間軸変換装置

Publications (2)

Publication Number Publication Date
JPH0883096A true JPH0883096A (ja) 1996-03-26
JP3189587B2 JP3189587B2 (ja) 2001-07-16

Family

ID=16746396

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22013194A Expired - Fee Related JP3189587B2 (ja) 1994-09-14 1994-09-14 音声時間軸変換装置

Country Status (1)

Country Link
JP (1) JP3189587B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001134300A (ja) * 1999-08-24 2001-05-18 Sony Corp 音声再生方法および音声再生装置
KR20030000400A (ko) * 2001-06-25 2003-01-06 주식회사 보이스텍 음성 재생속도 실시간 변환 방법 및 장치
US7711444B2 (en) 2005-02-15 2010-05-04 Sony Corporation Audio input/output control apparatus and audio input/output control method
JP2010191415A (ja) * 1999-08-24 2010-09-02 Sony Corp 音声再生方法および音声再生装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001134300A (ja) * 1999-08-24 2001-05-18 Sony Corp 音声再生方法および音声再生装置
JP2010191415A (ja) * 1999-08-24 2010-09-02 Sony Corp 音声再生方法および音声再生装置
KR20030000400A (ko) * 2001-06-25 2003-01-06 주식회사 보이스텍 음성 재생속도 실시간 변환 방법 및 장치
US7711444B2 (en) 2005-02-15 2010-05-04 Sony Corporation Audio input/output control apparatus and audio input/output control method

Also Published As

Publication number Publication date
JP3189587B2 (ja) 2001-07-16

Similar Documents

Publication Publication Date Title
JP2955247B2 (ja) 話速変換方法およびその装置
KR100739355B1 (ko) 음성 재생 방법 및 음성 재생 장치
US6085157A (en) Reproducing velocity converting apparatus with different speech velocity between voiced sound and unvoiced sound
JPH10260694A (ja) 話速変換装置、話速変換方法及び記録媒体
JP3189587B2 (ja) 音声時間軸変換装置
JP2006317768A (ja) 話速変換装置、及びこの話速変換装置を制御する話速変換プログラム
JP2874607B2 (ja) 音声時間軸変換装置
JP3378672B2 (ja) 話速変換装置
JP3162945B2 (ja) ビデオテープレコーダ
JP4542805B2 (ja) 変速再生方法及び装置、並びにプログラム
JP3373933B2 (ja) 話速変換装置
EP0702354A1 (en) Apparatus for modifying the time scale modification of speech
JP3357742B2 (ja) 話速変換装置
JPH08328586A (ja) 音声時間軸変換装置
JP3081469B2 (ja) 話速変換装置
JP3189597B2 (ja) 音声時間軸変換装置
JPH0573089A (ja) 音声再生方法
JP3966814B2 (ja) 簡易再生方法とこの方法に利用可能な簡易再生装置、復号方法、復号装置
JPH04367898A (ja) 音声再生装置
JPH05303400A (ja) 音声再生装置と音声再生方法
JP2962777B2 (ja) 音声信号の時間軸伸長圧縮装置
JP2001318700A (ja) 話速変換装置
JP2861005B2 (ja) 音声蓄積再生装置
JPH08293137A (ja) 再生装置
JPH09154107A (ja) 映像・音声再生装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees