JP2001344905A - データ再生装置、その方法及び記録媒体 - Google Patents

データ再生装置、その方法及び記録媒体

Info

Publication number
JP2001344905A
JP2001344905A JP2000157042A JP2000157042A JP2001344905A JP 2001344905 A JP2001344905 A JP 2001344905A JP 2000157042 A JP2000157042 A JP 2000157042A JP 2000157042 A JP2000157042 A JP 2000157042A JP 2001344905 A JP2001344905 A JP 2001344905A
Authority
JP
Japan
Prior art keywords
frame
data
audio data
audio
reproducing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000157042A
Other languages
English (en)
Inventor
Yukihiro Abiko
幸弘 安孫子
Hideo Kato
秀雄 加藤
Tetsuo Hizuka
哲雄 肥塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2000157042A priority Critical patent/JP2001344905A/ja
Priority to US09/788,514 priority patent/US7418393B2/en
Publication of JP2001344905A publication Critical patent/JP2001344905A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

(57)【要約】 【課題】MPEGデータを簡単な構成で話速変換可能な
再生装置及び方法を提供する。 【解決手段】MPEGオーディオデータをデコードしな
いまま、そのデータ単位であるフレームを抽出する。そ
して、フレームに含まれるスケールファクタを抽出し、
スケールファクタに基づいて評価関数を算出する。そし
て、評価関数の値が所定の閾値より大きければ、そのフ
レームを速度変換処理する。評価関数の値が所定の閾値
より小さければ、無音区間のフレームであるとして無視
する。速度変換処理は、フレームを所定の法則に基づい
て間引いたり、同じフレームを所定回数繰り返すことに
より行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データ再生装置及
び再生方法に関する。
【0002】
【従来の技術】近年のデジタル音声録音技術の発展によ
り、従来のテープレコーダに代わり、MDレコーダを使
用して、MDに音声を録音することが一般的となってい
る。また、更に、現在では、DVDなどを従来のビデオ
テープの代わりに使用し、映画などを一般に配布するこ
とが行われ始めている。このようなデジタル音声録音技
術、及び画像録画技術には、様々な技術が使用される
が、そのような技術の中でもMPEGは最も一般的な技
術の一つである。
【0003】図15及び図16は、MPEGオーディオ
データのフォーマットを示す図である。MPEGオーデ
ィオデータは図15に示されるように、AAU(Audio
Access UnitあるいはAudio Frame)と呼ばれる連続
したフレームで構成される。フレームは、更にヘッダ、
エラーチェック、オーディオデータ、アンシラリデータ
(付加情報)で構成される階層構造を持つ。ここで、オ
ーディオデータは、圧縮処理されたデータである。
【0004】ヘッダは、syncword、レイヤ、ビットレー
トに関する情報、サンプリング周波数に関する情報、パ
ディングビットなどのデータで構成される。この構造は
圧縮性能の異なるレイヤI、レイヤII、レイヤIII
で共通している。
【0005】フレーム中のオーディオデータは図16の
ように構成されている。 図16に示されるように、オ
ーディオデータは、レイヤI、II、IIIに関わら
ず、必ずスケールファクタを含んでいる。このスケール
ファクタは波形の再生時の倍率を表したデータである。
すなわち、レイヤI、IIのサンプリングデータあるい
は、レイヤIIIのハフマンコードビットが表す音声デ
ータは、スケールファクタで正規化されており、実際の
音声データは、サンプリングデータや、ハフマンコード
ビットを伸長したデータにスケールファクタを乗算して
得られる。スケールファクタは時間軸に沿って更に32
区間(サブバンド)に分かれて圧縮されており、スケー
ルファクタもモノラルで最大32個割り当てられる。
【0006】なお、MPEGオーディオの詳細について
は、国際規格であるISO/IEC11172−2を参
照されたい。図17は、従来のMPEGオーディオ再生
装置の基本的構成を示す図である。
【0007】MPEGオーディオデータがMPEGオー
ディオ入力部10に入力されると、上記国際規格に記載
されている処理を実現するMPEGオーディオ復号化部
11において復号され、スピーカなどからなるオーディ
オ出力部12から音声として出力される。
【0008】
【発明が解決しようとする課題】デジタルで録音された
音声を再生する場合、再生速度を変更することは頻繁に
行われ、特に、話速変換は内容理解や内容圧縮に有効で
ある。ところが、MPEGオーディオデータから直接話
速変換する場合、従来においては、一旦デコードしてか
ら話速変換を行っていた。
【0009】MPEGオーディオにおける圧縮は、デー
タを数十分の1まで低減させることができる。したがっ
て、MPEGオーディオデータをデコードしてから話速
変換処理を行おうとすると、圧縮データを伸長した後の
膨大なデータを扱わなければならい。従って、話速変換
に必要な回路の数や規模が大きくなってしまう。
【0010】MPEGオーディオデータを一旦デコード
してから話速変換するものである公知例として特開平9
−73299号公報がある。本発明の課題は、マルチメ
ディアデータを簡単な構成で話速変換可能な再生装置及
び方法を提供することである。
【0011】
【課題を解決するための手段】本発明の第1のデータ再
生装置は、オーディオデータを含む圧縮されたマルチメ
ディアデータを再生する装置であって、該オーディオデ
ータの単位データであるフレームを抽出する抽出手段
と、該オーディオデータの該フレームの間引き処理ある
いは該フレームの繰り返し出力処理を行う変換手段と、
該変換手段から受け取った該オーディオデータの該フレ
ームをデコードし、音声を再生する再生手段とを備えた
ことを特徴とする。
【0012】本発明の第2のデータ再生装置は、オーデ
ィオデータを含むマルチメディアデータを再生する装置
であって、該オーディオデータの単位データであるフレ
ームを抽出する抽出手段と、該オーディオデータの再生
速度を設定する設定手段と、該設定手段によって設定さ
れた該再生速度に基づいて、該オーディオデータの該フ
レームの間引き処理あるいは該フレームの繰り返し出力
処理を行う速度変換手段と、該速度変換手段から受け取
った該オーディオデータの該フレームをデコードし、音
声を再生する再生手段とを備え、圧縮されたオーディオ
データをデコードすることなしに再生速度変換処理を行
うことを特徴とする。
【0013】本発明のデータ再生方法は、オーディオデ
ータを含むマルチメディアデータを再生する方法であっ
て、(a)該オーディオデータの単位データであるフレ
ームを抽出するステップと、(b)該オーディオデータ
の再生速度を設定するステップと、(c)該ステップ
(b)において設定された該再生速度に基づいて、該オ
ーディオデータの該フレームの間引き処理あるいは該フ
レームの繰り返し出力処理を行うステップと、(d)該
ステップ(c)の処理後受け取った該オーディオデータ
の該フレームをデコードし、音声を再生するステップと
を備え、圧縮されたオーディオデータをデコードするこ
となしに再生速度変換処理を行うことを特徴とする。
【0014】本発明によれば、圧縮されたオーディオデ
ータを、デコードすることなく、圧縮されたままで、話
速変換処理を行うことが可能となるので、データ再生装
置に必要とされる回路規模が縮小され、簡単な構成で話
速変換を伴う再生処理を行うことが出来る。
【0015】
【発明の実施の形態】本発明の実施形態は、MPEGオ
ーディオからオーディオフレームと呼ばれるフレームを
抽出し、フレームを所定の法則に従って間引くことによ
って変換速度を速める、あるいはフレームを所定の法則
に従って内挿することによって変換速度を遅くする。ま
た、抽出したフレームから得られるスケールファクタを
用いて評価関数を算出し、所定の法則に従って当該フレ
ームを間引くことによって無音区間を圧縮する。更に、
接続される前後のフレームでスケールファクタを変更す
ることで、接続部での聴覚上の違和感(ノイズなど)を
低減する。また再生装置においては、データ入力部とM
PEGデータ判別部と上記方法によって話速変換変換を
行う話速変換部とMPEGオーディオ部とオーディオ出
力部を備える。
【0016】本発明の実施形態で行うフレーム抽出につ
いて、図16、17のMPEGオーディオデータの構成
を参照して説明する。フレームの抽出は、フレームの先
頭にあるsyncwordを検出することによって行う。つま
り、フレームnのsyncwordの先頭からフレームn+1の
syncwordの直前までのビット列を読み込む。
【0017】あるいは、別なフレームの抽出方法とし
て、syncwordを含む32ビットのビット列からなるオー
ディオフレームヘッダから、ビットレート、サンプリン
グ周波数、パディングビットを抽出し、次式から1フレ
ームのデータ長を求め、syncwordからデータ長までのビ
ット列を読み込んでも良い。 {フレームサイズ×ビットレート[bit/sec]÷8÷サ
ンプリング周波数[Hz]}+パディングビット[byt
e] 話速変換では、再生速度を変化させたときに聞き手に違
和感を感じさせないことが重要であるため、次にステッ
プで処理を行う。 ・基本周期の抽出 ・基本周期の間引き、繰り返し ・無音部分の圧縮 音声の周期性を持つ波形の周期を基本周期と呼び、日本
人男性で100〜150Hz、女性で250〜300H
zである。話速を速くする場合には周期性のある波形を
抽出し間引く処理、一方、遅くする場合には逆に繰り返
す処理を行う。
【0018】MPEGオーディオに対して従来の話速変
換方法を適用する場合には、次の問題がある。 ・PCM形式への復元が必要 ・リアルタイム処理には専用のハードウェアが必要 音声処理においては、その処理単位として約10〜30
ミリ秒程度が一般的である。MPEGオーディオでは1
オーディオフレームは約20ミリ秒(レイヤII、4
4.1KHz、1152サンプルの場)である。
【0019】この基本周期をオーディオフレームで代用
することで復元なしに話速変換の効果を得る。一方、従
来無音区間を検出するためには、音圧の強弱を評価する
必要があった。厳密にはデコードなしに無音区間を正確
に検出することはできない。しかし、オーディオデータ
に含まれるスケールファクタは波形の再生の倍率を表し
たデータであるので、音圧と近い性質を持ち、本実施形
態ではスケールファクタを利用する。
【0020】図1は、同じ音声データをMPEGオーデ
ィオレイヤIIで圧縮したデータのスケールファクタと
圧縮しないデータの音圧について比較した図である。グ
ラフの縦軸は1フレーム(MPEGオーディオレイヤI
I相当:1152サンプル)についてのスケールファク
タの平均、あるいは音圧の区間平均を表し、横軸は時間
を表す。スケールファクタと音圧が非常に近い形状を示
しており、この図においては相関係数は約80%程度で
あり高い相関を示している。エンコーダの性能にも依存
するが、スケールファクタは、音圧と近い性質を持って
いることが示されている。
【0021】従って、本実施形態においては、スケール
ファクタから評価関数を演算することによって無音区間
の検出をする。評価関数の一例としては1フレーム内の
スケールファクタの平均値とすることが考えられる。あ
るいは、数フレームにわたって評価関数を設定してもよ
いし、サブバンド毎のスケールファクタから評価関数を
設定してもよく、更にこれらを組み合わせたものでもよ
い。
【0022】ところで、単にフレーム単位に間引きを行
い接続する場合、フレームとフレームの接続点で聴感上
違和感を感じる場合がある。これは、間引きを行ったこ
とにより、音圧の変換が不連続に大きくなったり、小さ
くなることによって生じる。そこで、本実施形態では、
フレームとフレームの接続点前後のフレームの一部のス
ケールファクタを変更することで、この違和感を低減す
る。
【0023】例えば、接続点直前のスケールファクタが
0に近く、かつ接続点直後のスケールファクタが最大値
に近い場合、接続部では本来含まれない高周波成分が加
わってしまい。これがノイズとして聴感上の違和感とな
って現れることになる。この場合については、接続点前
後のスケールファクタを中間値に変更することで低減さ
れる。
【0024】本発明の実施形態においては、MPEGオ
ーディオ規格で定義されているオーディオフレームと呼
ばれるフレームを単位としてMPEGデータをデコード
せずに話速変換するので、MPEGデータをデコードす
る必要が無く、回路規模を縮小し、簡単な構成で話速変
換を実現することが出来る。また、スケールファクタを
用いることで、デコードによって音圧を得ることなしに
無音区間を判定して、無音区間を削除し、有音区間を割
り当てることにより話速変換を行う。更に、スケールフ
ァクタを適切に可変することで、フレームの接続点前後
の聴感上の違和感を低減することができる。
【0025】図2は、本発明の話速変換処理の概略フロ
ーチャートである。まず、ステップS10において、フ
レームの抽出を行う。フレームの抽出は、フレームの先
頭にあるsyncwordを検出することで行う。つまり、フレ
ームnのsyncwordの先頭からフレームn+1のsyncword
の直前までのビット列を読み込む用にする。あるいは、
syncwordを含む32ビットのビット列からなるオーディ
オフレームヘッダから、ビットレート、サンプリング周
波数、パディングビットを抽出し、前述の式から1フレ
ームのデータ長を求め、syncwordからデータ長までのビ
ット列を読み込んでも良い。また、フレームの抽出は、
MPEGオーディオの復号化では必須の処理であるの
で、MPEGオーディオ復号化で用いられるフレームの
抽出機能をそのまま利用することで実現しても良い。そ
して、フレーム抽出が成功すると、次に、スケールファ
クタの抽出を行う。図17に示されるように、スケール
ファクタは、MPEGオーディオのオーディオデータの
先頭から、各レイヤにおいて、決められたビット位置に
存在するので、syncwordからのビット数を係数する事に
よって、スケールファクタを抽出することができる。あ
るいは、スケールファクタの抽出も、フレームの抽出と
同様にMPEGオーディオの復号化では必須の処理であ
るので、既存のMPEGオーディオ復号化処理によって
抽出されたスケールファクタを使用しても良い。
【0026】次に、ステップS12において、スケール
ファクタから評価関数算出処理を行う。評価関数はスケ
ールファクタから算出する。評価関数の簡単な一例とし
ては1フレーム内のスケールファクタの平均値とするこ
とが考えられる。あるいは、数フレームにわたって評価
関数を設定しても良いし、サブバンド毎のスケールファ
クタから評価関数を設定してもよく、さらにこれらを組
み合わせたものでも良い。
【0027】次に、評価関数の演算値と予め決定された
閾値との比較を行う。閾値より評価関数の方が大きい場
合には、有音区間のフレームであるとしてステップS1
4に進む。また、評価関数の値が閾値以下の場合には、
無音区間のフレームであるとしてフレームを無視し、ス
テップS10に戻る。ここで、閾値は固定でも、可変で
もよい。
【0028】ステップS14においては、速度変換処理
を行う。速度変換処理は、オリジナルのMPEGデータ
の再生速度を1としたとき、所望の再生速度が1より大
きい場合、ある間隔でフレームを間引き、データを短縮
して出力する。例えば、フレームを先頭から0、1、
2、・・・とした場合、2倍速である場合には、0、
2、4、・・・等のように、フレームを間引いて復号化
し、再生する。また、所望の再生速度が1未満の場合、
ある間隔でフレームを繰り返して出力する。例えば、上
記例を採用すると、1/2倍速の時は、フレームを0、
0、1、1、2、2、・・・というようにフレームを配
列し、復号化して再生する。聴者は、このようにして出
力されたMPEGデータがデコードされると所望の速度
で再生されたように聞こえる。
【0029】そして、ステップS14において、速度変
換処理があるフレームについて終了すると、ステップS
15に進んで、まだ処理すべきデータが存在するか否か
を判断し、データが存在する場合には、ステップS10
に戻って、次のフレームを処理し、データがない場合に
は、処理を終了する。
【0030】図3は、本発明の別の話速変換処理の概略
フローチャートである。まず、図2の場合と同様に、ス
テップS20において、フレーム抽出処理を行い、ステ
ップS21において、スケールファクタ抽出処理を行
う。そして、ステップS22において、評価関数を演算
し、ステップS23において、評価関数の値と閾値との
比較を行う。ステップS23において、評価関数の方が
閾値よりも大きいと判断された場合には、有音区間のフ
レームであるとして、ステップS24に進む。ステップ
S23において、評価関数の値が閾値以下であると判断
される場合には、無音区間のフレームであるとして、ス
テップS20に戻って、次のフレームの処理をする。
【0031】ステップS24においては、図2で説明し
たような速度変換処理を行い、更に、ステップS25に
おいて、フレームの接続部におけるノイズの発生を抑え
るため、スケールファクタの修正処理を行う。そして、
ステップS26において、後続のデータがあるか否かを
判断し、データがある場合には、ステップS20に進
み、データがない場合には処理を終了する。なお、スケ
ールファクタ修正処理では、直前のフレームを保持して
おり、フレームの接続点前後のスケールファクタを調整
し出力する。
【0032】図4は、再生速度変換処理の流れを示す詳
細なフローチャートである。なお、同図においては、n
inを入力フレーム数とし、noutを出力フレーム数と
し、Kを再生速度とする。
【0033】まず、ステップS30において、初期化す
る。すなわち、ninを−1に、nou tを0に設定する。
次に、ステップS31において、オーディオフレームの
抽出処理を行う。この処理は、前述したように、既存の
技術を使用して実現することができるので、詳細には説
明しない。次に、ステップS32において、オーディオ
フレームの抽出処理が正常に行われたか否かを判断す
る。ステップS32において、オーディオフレームの抽
出が正常に行われなかったと判断された場合には、処理
を終了する。ステップS32において、オーディオフレ
ームの抽出が正常に行われたと判断された場合には、ス
テップS33に進む。
【0034】ステップS33においては、入力フレーム
数であるninを1だけ増加する。そして、ステップS3
4において、再生速度Kが1以上であるか否かが判断さ
れる。この再生速度は、一般には、再生装置を使用する
ユーザによって設定されるものである。ステップS34
において、再生速度Kが1以上であると判断された場合
には、出力フレーム数noutの再生速度K倍が入力フレ
ーム数nin以上になったか否かを判断する(ステップS
35)。すなわち、入力フレームを間引いて出力される
出力フレームの数の再生速度K倍が入力フレーム数nin
以下か否かを判断する。ステップS35の判断がNOと
なった場合には、ステップS31に戻り、ステップS3
5の判断がYESとなった場合には、ステップS36に
進む。
【0035】ステップS36においては、オーディオフ
レームを出力する。そして、ステップS37において、
出力フレーム数noutを1だけ増加し、ステップS31
に戻る。
【0036】図4のKが1以上である場合の、オーディ
オフレームの出力は処理を繰り返すことによって間引き
処理を行うようになっている。間引き方としては、前述
の2倍速の他に、3倍速の場合においては、0、3、
6、・・・などのように行う。1.5倍速などの場合に
は、整数N、Mに対して、1.5×N=Mを計算し、M
番のフレームをN+1番目に配置し、このようにして配
置されたフレームの間に適当なフレームを埋め込むこと
によって行う。すなわち、1.5倍の場合、0、1、
3、4、6、・・・とするか、0、2、3、5、6、・
・・などのように行う。
【0037】ステップS34において、再生速度Kが1
より小さい場合には、ステップS38において、オーデ
ィオフレーム出力処理を行う。この場合は、フローに従
ってオーディオフレームを出力することによって、例え
ば、1/2倍速の場合には、0、0、1、1、2、2、
・・・のように、1/3倍速の場合には、0、0、0、
1、1、1、2、2、2、・・・のようにフレームを繰
り返して出力し、1より小さい再生速度を実現する。
【0038】そして、ステップS39において、出力フ
レーム数noutを1だけ増加し、ステップS40におい
て、入力フレーム数ninが出力フレーム数noutの再生
速度K倍以下であるか以下を判断する。ステップS40
の判断がYESの場合には、ステップS41に戻る。ス
テップS40の判断がNOの場合には、ステップS38
に戻って、同じフレームを繰り返し出力する。
【0039】以上のような処理を繰り返して、再生速度
変換処理を行う。図5は、再生速度変換処理及び無音部
分除去処理を含む処理の流れを示す詳細フローチャート
である。
【0040】まず、ステップS45において、ninを−
1に、noutを0に初期化する。次に、ステップS46
において、オーディオフレームの抽出処理を行う。ステ
ップS47において、オーディオフレームの抽出処理が
正常か否かを判断する。オーディオフレームの抽出処理
が異常であった場合には、処理を終了する。オーディオ
フレームの抽出処理が正常であった場合には、ステップ
S48に進んで、スケールファクタの抽出を行う。スケ
ールファクタの抽出方法は、前述したように、既存の技
術で行うことができるので、詳細な説明は省略する。そ
して、ステップS49に進んで、抽出したスケールファ
クタから評価関数F(前述したように、例えば、1フレ
ーム分のスケールファクタの和)を算出する。そして、
ステップS50において、入力フレーム数ninを1増加
してステップS51に進む。ステップS51において
は、nin≧K・noutかつF>Th(ここで、Thは閾
値)であるか否かを判断する。ステップS51におい
て、判断がNOの場合には、ステップS46に戻る。ス
テップS51における判断がYESの場合には、ステッ
プS52に進んで、オーディオフレームを出力し、ステ
ップS53において、出力フレーム数noutを1だけ増
加して、ステップS46に進む。
【0041】ここで、ステップS51のnin≧K・n
outの判断式の意味は、図4で説明したものと同様であ
る。また、F>Thも前述の概略フローによって説明し
たとおりである。
【0042】図6は、ノイズ低減処理の流れを示すフロ
ーチャートである。まず、ステップS60において、n
inを−1、noutを0に設定して、初期化を行う。次
に、ステップS61において、オーディオフレーム抽出
処理を行い、ステップS62において、オーディオフレ
ーム抽出処理が成功であったか否かを判断する。オーデ
ィオフレーム抽出処理が失敗であった場合には、処理を
終了する。オーディオフレーム抽出処理が成功であった
場合には、ステップS63に進む。
【0043】次に、ステップS63において、スケール
ファクタを抽出し、ステップS64において、評価関数
Fを算出する。そして、ステップS66において、入力
フレーム数ninを1だけ増加し、ステップS67におい
て、nin≧K・noutかつF>Thであるか否かを判断
する。ステップS67の判断がNOの場合には、ステッ
プS61に進み、ステップS67の判断がYESの場合
には、ステップS68において、スケールファクタ修正
処理を行う。
【0044】そして、ステップS69に進み、オーディ
オフレーム出力処理を行い、ステップS70において、
outを1だけ増加してステップS61に戻る。図7、
及び、図8は、図6のスケールファクタ修正処理を説明
する図である。
【0045】図7に示されるように、オーディオフレー
ムを間引いたりして送出する場合、オーディオフレーム
の接続点において、音圧の不連続な変化が生じる。この
ような不連続は、音声を聞いているユーザにとっては、
ノイズとして聞こえてしまい、早送りなどをしている場
合に、非常に不快な音に気が取られてしまう。
【0046】そこで、図8に示すように、オーディオフ
レームの境界付近で係数値が小さくなるような修正係数
をスケールファクタに乗算して、音声を再生するように
する。このようにすることによって、図8の太線で示さ
れているように、オーディオフレームの接続点付近での
音圧の不連続な飛びが緩和される。従って、再生音を聞
いているユーザにとっても、ノイズが小さくなり、早送
りなどの場合、不快な音が気にならなくなる。
【0047】図9は、本発明の話速変換を適用したMP
EGオーディオデータ再生装置の一構成を示すブロック
構成図である。これは図18に示す従来のMPEGオー
ディオ再生装置にフレーム抽出部21、評価関数演算部
24、速度変換処理部23、スケールファクタ修正部2
5を加えたものである。フレーム抽出部21は、図18
には、明示されていないが、MPEGオーディオ復号化
部11に含まれているものを同図では、明示的に示した
ものである。
【0048】フレーム抽出部21では、MPEGオーデ
ィオデータのオーディオフレームとも呼ばれるフレーム
を抽出する機能を持ち、フレームデータをスケールファ
クタ抽出部22と速度変換処理部23に出力する。スケ
ールファクタ抽出部22では、フレームからスケールフ
ァクタを抽出し、評価関数演算部24に出力する。速度
変換処理部24では、フレームの間引きや繰り返しを行
うと共に、評価関数によって無音区間のデータ量を削除
し、スケールファクタ修正部25に出力する。スケール
ファクタ修正部25では速度変換部23で接続されたフ
レームの前後のスケールファクタを修正し、MPEGオ
ーディオ復号化部26に出力する。
【0049】本構成例においては、図18に示す一般的
なMPEGオーディオ再生装置に話速変換系回路22、
23、24、25を追加するのみであり、話速変換機能
を容易に備えることができる利点がある。
【0050】図10は、本発明の話速変換を適用したM
PEGデータ再生装置の別の構成例を示す図である。図
10の構成においては、図18にしめる一般的なMPE
Gオーディオ再生装置に評価関数演算部33、話速変換
処理部34、スケールファクタ修正部35を加えたもの
である。MPEGオーディオ復号化部31では、既にフ
レーム抽出機能とスケールファクタ抽出機能を持つの
で、本発明の実施形態の話速変換方法で必要な処理の一
部を含んでいる。よって、MPEGオーディオ復号化部
31のフレーム抽出機能とスケールファクタ抽出機能の
利用することで回路規模を小さくできる利点がある。
【0051】MPEGオーディオ復号化部11で抽出さ
れたフレームとスケールファクタは、評価関数演算部3
3に送られ、評価関数の算出が評価関数演算部33にお
いてなされる。評価関数値とフレームは、話速変換処理
部34に送られ、フレームの間引きや繰り返しに使用さ
れる。そして、話速変換されたフレームとスケールファ
クタは、MPEGオーディオ復号化部11に送られる。
また、MPEGオーディオ復号化部12からは、スケー
ルファクタがスケールファクタ修正部35にも送られ、
スケールファクタ修正部35において、スケールファク
タの修正が行われる。修正されたスケールファクタは、
MPEGオーディオ復号化部11に入力される。MPE
Gオーディオ復号化部11は、話速変換されたフレーム
と修正されたスケールファクタからオーディオフレーム
からなるMPEGオーディオデータをデコードし、オー
ディオ出力部12にデコードされたデータを送る。この
ようにして、話速変換された音声がオーディオ出力部1
2から出力される。
【0052】図11は、本発明の別の実施形態を説明す
る図である。なお、図11においては、図9と同じ構成
要素には同じ参照番号を付して説明を省略する。
【0053】同図は、話速変換を適用したMPEGデー
タ再生装置を示している。これは、従来のMPEGデー
タ再生装置(構成要素40、41、42、43、44、
45)のMPEGオーディオ復号化部を本発明の実施形
態に示したMPEGオーディオデータ再生装置のMPE
Gオーディオ入力部とオーディオ出力部を除いた回路と
置き換えたものである。従って、上記実施形態と同様の
利点を得ることができる。
【0054】図11の構成は、MPEGデータとして、
音声データのみではなく、画像データも含まれる場合の
装置構成を示している。まず、MPEGデータ入力部4
0から入力されたMPEGデータは、MPEGデータ分
離部41によって分離され、MPEGビデオデータとM
PEGオーディオデータとに分離される。MPEGビデ
オデータは、MPEGビデオ復号化部42に入力され、
MPEGオーディオデータは、フレーム抽出部21に入
力される。MPEGビデオでは、MPEGビデオ復号化
部42においてデコードされ、ビデオ出力部44から出
力さえる。
【0055】MPEGオーディオデータは、図9で説明
したような処理を受け、最終的にMPEGオーディオ復
号化部43において復号され、オーディオ出力部45か
ら出力される。
【0056】図12は、本発明の更に別の実施形態であ
る話速変換を適用したMPEGデータ再生装置の一構成
例を示す図である。なお、同図において、図10、11
と同じ構成要素には同じ参照符号を付し、説明を省略す
る。
【0057】図12の構成は、従来のMPEGデータ再
生装置のMPEGオーディオ復号化部を図10に示した
MPEGオーディオデータ再生装置のMPEGオーディ
オ入力部とオーディオ出力部を除いた回路と置き換えた
ものである。従って、図10の構成例と同様の利点を得
ることができる。
【0058】すなわち、MPEGデータ分離部41で分
離されたMPEGオーディオデータには、MPEGオー
ディオ復号化部43において、フレーム抽出、スケール
ファクタ抽出処理が施され、これらの処理結果は、評価
関数演算部33とスケールファクタ修正部35に入力さ
れて、上記したような処理により、話速変換が行われ
る。
【0059】図13は、本発明の更に別の実施形態であ
り、MPEGデータ再生装置を示す図である。なお、同
図においては、図12と同じ構成要素には同じ参照符号
を付してある。
【0060】図13においては、従来のMPEGデータ
再生装置に評価関数演算部33、データ蓄積部50、入
力データ選択部51、出力データ選択部52を加えたも
のである。特に、上記構成例では、MPEGオーディオ
データの処理のみを独立に考えていたが、図13におい
ては、画像データと音声データの両方を速度変換する構
成を示している。
【0061】ここで、評価関数演算はMPEGオーディ
オ復号化部43あるいはMPEGビデオ復号化部42か
ら種々のパラメータを得て評価関数を演算するものであ
り、データ蓄積部50はMPEGデータを蓄積するもの
であり、入力データ選択部51は評価関数と、所定の法
則に従って、MPEGデータ蓄積部50から入力するM
PEGデータを選択するものであり、出力データ選択部
52は評価関数と所定の法則に従って出力するデータを
選択するものである。
【0062】また、ユーザからの再生速度指定は、評価
関数演算部33に入力され、その再生速度情報が入力デ
ータ選択部51に通知される。ここで、評価関数のパラ
メータとしては、例えば、再生速度、スケールファク
タ、オーディオフレームカウントなど話速変換用パラメ
ータ、また、音圧、セリフなどの音声から得られる情
報、ビデオフレームカウント、フレームレート、色情
報、離散コサイン変換直流成分、動きベクトル、シーン
チェンジ、字幕などの映像から得られる情報が有効であ
る。回路規模の比較的大きいフレームメモリや画像演算
回路はコスト上昇につながるため、使用を避ける場合に
は、これらの内、ビデオフレームカウント、フレームレ
ート、離散コサイン変換直流成分、動きベクトルなどデ
コードなしに得られる情報を評価関数のパラメータに用
いても良い。また、MPEGビデオ復号化部42にシー
ンチェンジ検出機能があれば、本発明の実施形態におけ
る話速変換機能と組み合わせることで、つまり、シーン
チェンジフレームとスケールファクタと再生速度から評
価関数を演算することで、無音区間のシーンの欠落無し
に話速変換されたダイジェスト映像を出力することが可
能となる。
【0063】通常の再生時では、MPEGデータ蓄積部
50からは連続的にMPEGデータが読みだされるが、
例えば、再生速度が上限を超えるデータ転送レートを求
めるような場合は再生が滞ってしまう。そこで、入力デ
ータ選択部51は、このような場合に評価関数を元にし
て、あらかじめ読み出し不要なMPEGデータをスキッ
プする。つまり不連続的に読み出しアドレスを決定す
る。具体的には評価関数によって再生されるべきビデオ
フレーム、オーディオフレームを決定し、再生されるべ
きMPEGデータのアドレスを算出する。MPEGデー
タにおいてオーディオを含むパケットあるいはビデオを
含むパケットはパケットヘッダより判定する。MPEG
オーディオについてはフレーム単位でアクセスが可能で
あり、フレームのデータ長はレイヤI、IIでは一定で
あるので、容易にアドレスを決定することができる。M
PEGビデオについては、複数のフレームをひとまとま
りとしたGOP単位でアクセスする。
【0064】ここで、MPEGデータは規格上MPEG
オーディオデータはフレーム単位のアクセスが可能であ
るが、MPEGビデオデータはフレーム単位ではなく、
複数のフレームをひとまとまりとしたGOP単位にアク
セス可能である。しかしながら、評価関数によっては出
力不要なフレームがある。そこで、出力データ選択部5
2は、このような場合に、評価関数を元に出力フレーム
を決定する。また、出力するビデオフレームとオーディ
オフレームの同期を調整する。
【0065】再生速度が高い場合、人間が映像と音声の
同期を敏感に知覚しにくくなるので、厳密な同期が不要
であると考えられる。従って、映像と音声が大局的に同
期が合うように、映像をGOP単位、音声はオーディオ
フレーム(オーディオフレーム)単位で出力データを選
択する。
【0066】図14は、本発明の実施形態をプログラム
で実現する場合に必要とされる装置のハードウェア構成
例を示す図である。CPU61は、バス60を介して、
ROM62、RAM63、通信インターフェース64、
記録装置67、記録媒体読み取り装置68、入出力装置
70に接続される。
【0067】ROM63には、BIOSなどが格納さ
れ、CPU61がこれを実行することによって、CPU
61へのユーザの指示が入出力装置70から入力可能と
したり、CPU61の演算結果をユーザに提示可能とす
る。ここで、入出力装置は、ディスプレイ、マウス、キ
ーボードなどからなる。
【0068】また、本発明の実施形態にかかる話速変換
処理を伴うMPEGデータ再生処理を実現するプログラ
ムは、ROM62、RAM63、記録装置67、可搬記
録媒体69に格納することが可能である。ROM62、
RAM63に格納された当該プログラムは、CPU61
が直接実行する。記録装置67や可搬記録媒体69に記
録された当該プログラムは、記録装置67からは、バス
60を介して直接RAM63に展開され、可搬記録媒体
69からは、記録媒体読み取り装置68で可搬記録媒体
69上のプログラムを読みとって、バス60を介してR
AM63に展開することによって、CPU61が実行可
能な状態とする。
【0069】ここで、記録装置67は、ハードディスク
などであり、可搬記録媒体69は、CD−ROMやフロ
ッピー(登録商標)ディスク、DVDなどである。ま
た、装置は、通信インターフェース64を備えてもよ
く、この場合、ネットワーク65を介して情報提供者6
6のデータベースにアクセスし、当該プログラムをダウ
ンロードして使用することの可能である。あるいは、ネ
ットワーク65がLANのように構築されている場合に
は、ネットワーク環境下で当該プログラムを実行するこ
とも可能である。 <付記> 1.オーディオデータを含む圧縮されたマルチメディア
データを再生する装置であって、該オーディオデータの
単位データであるフレームを抽出する抽出手段と、該オ
ーディオデータの該フレームの間引き処理あるいは該フ
レームの繰り返し出力処理を行う変換手段と、該変換手
段から受け取った該オーディオデータの該フレームをデ
コードし、音声を再生する再生手段とを備えた、ことを
特徴とするデータ再生装置。 2.オーディオデータを含むマルチメディアデータを再
生する装置であって、該オーディオデータの単位データ
であるフレームを抽出する抽出手段と、該オーディオデ
ータの再生速度を設定する設定手段と、該設定手段によ
って設定された該再生速度に基づいて、該オーディオデ
ータの該フレームの間引き処理あるいは該フレームの繰
り返し出力処理を行う速度変換手段と、該速度変換手段
から受け取った該オーディオデータの該フレームをデコ
ードし、音声を再生する再生手段とを備え、圧縮された
オーディオデータをデコードすることなしに再生速度変
換処理を行うことを特徴とするデータ再生装置。 3.前記オーディオデータは、MPEGオーディオデー
タであることを特徴とする付記2に記載のデータ再生装
置。 4.前記フレームに含まれるスケールファクタを抽出す
るスケールファクタ抽出手段と、該スケールファクタに
対して演算を行う演算手段と、該演算手段の演算結果と
所定の閾値とを比較し、該演算結果が該閾値よりも小さ
い場合には、対応する該フレームを前記再生手段に送ら
ないように制御する制御手段と、を更に備えることを特
徴とする付記3に記載のデータ再生装置。 5.前記演算手段は、前記フレームに含まれる複数のス
ケールファクタの和を演算することを特徴とする付記4
に記載のデータ再生装置。 6.前記フレームに含まれる複数のスケールファクタの
内、前記再生手段によって再生されるときに、フレーム
間の接続部分に生じる音圧の不連続な変化をうち消すた
めのスケールファクタ修正係数を生成し、該スケールフ
ァクタと該スケールファクタ修正係数を演算して、該再
生手段にデコードすべきデータとして入力するスケール
ファクタ修正手段を更に備えることを特徴とする付記4
に記載のデータ再生装置。 7.前記データ再生装置は、画像データとオーディオデ
ータを含むマルチメディアデータを受信し、更に、画像
データとオーディオデータを分離する分離手段と、該画
像データを復号する復号手段と、該画像データを再生す
る画像再生手段とを備えることを特徴とする付記2に記
載のデータ再生装置。 8.前記画像データとオーディオデータは、MPEGデ
ータとして構成されていることを特徴とする付記7に記
載のデータ再生装置。 9.オーディオデータを含むマルチメディアデータを再
生する方法であって、 (a)該オーディオデータの単位データであるフレーム
を抽出するステップと、 (b)該オーディオデータの再生速度を設定するステッ
プと、 (c)該ステップ(b)において設定された該再生速度
に基づいて、該オーディオデータの該フレームの間引き
処理あるいは該フレームの繰り返し出力処理を行うステ
ップと、 (d)該ステップ(c)の処理後受け取った該オーディ
オデータの該フレームをデコードし、音声を再生するス
テップとを備え、圧縮されたオーディオデータをデコー
ドすることなしに再生速度変換処理を行うことを特徴と
するデータ再生方法。 10.前記オーディオデータは、MPEGオーディオデ
ータであることを特徴とする付記9に記載のデータ再生
方法。 11.(e)前記フレームに含まれるスケールファクタ
を抽出するステップと、 (f)該スケールファクタに対して演算を行うステップ
と、 (g)該ステップ(f)の演算結果と所定の閾値とを比
較し、該演算結果が該閾値よりも小さい場合には、対応
する該フレームに前記ステップ(d)の処理を行わない
ように制御するステップと、を更に備えることを特徴と
する付記10に記載のデータ再生方法。 12.前記ステップ(f)は、前記フレームに含まれる
複数のスケールファクタの和を演算することを特徴とす
る付記11に記載のデータ再生方法。 13.(h)前記フレームに含まれる複数のスケールフ
ァクタの内、前記ステップ(d)において再生されると
きに、フレーム間の接続部分に生じる音圧の不連続な変
化をうち消すためのスケールファクタ修正係数を生成
し、該スケールファクタと該スケールファクタ修正係数
を演算した値に基づいて、該ステップ(d)の処理を行
うステップを更に備えることを特徴とする付記11に記
載のデータ再生方法。 14.前記データ再生方法は、画像データとオーディオ
データを含むマルチメディアデータを処理し、 更に、 (i)画像データとオーディオデータを分離するステッ
プと、 (j)該画像データを復号するステップと、 (k)該画像データを再生するステップとを備えること
を特徴とする付記9に記載のデータ再生方法。 15.前記画像データとオーディオデータは、MPEG
データとして構成されていることを特徴とする付記14
に記載のデータ再生方法。 16.情報装置に、オーディオデータを含むマルチメデ
ィアデータを再生する方法を実行させるプログラムを記
録した記録媒体であって、 (a)該オーディオデータの単位データであるフレーム
を抽出するステップと、 (b)該オーディオデータの再生速度を設定するステッ
プと、 (c)該ステップ(b)において設定された該再生速度
に基づいて、該オーディオデータの該フレームの間引き
処理あるいは該フレームの繰り返し出力処理を行うステ
ップと、 (d)該ステップ(c)の処理後受け取った該オーディ
オデータの該フレームをデコードし、音声を再生するス
テップとを備え、圧縮されたオーディオデータをデコー
ドすることなしに再生速度変換処理を行うことを特徴と
する方法を実現するプログラムを記録した、情報装置読
み取り可能な記録媒体。 17.前記オーディオデータは、MPEGオーディオデ
ータであることを特徴とする付記16に記載の記録媒
体。 18.(e)前記フレームに含まれるスケールファクタ
を抽出するステップと、 (f)該スケールファクタに対して演算を行うステップ
と、 (g)該ステップ(f)の演算結果と所定の閾値とを比
較し、該演算結果が該閾値よりも小さい場合には、対応
する該フレームに前記ステップ(d)の処理を行わない
ように制御するステップと、を更に備えることを特徴と
する付記17に記載の記録媒体。 19.前記ステップ(f)は、前記フレームに含まれる
複数のスケールファクタの和を演算することを特徴とす
る付記18に記載の記録媒体。 20.(h)前記フレームに含まれる複数のスケールフ
ァクタの内、前記ステップ(d)において再生されると
きに、フレーム間の接続部分に生じる音圧の不連続な変
化をうち消すためのスケールファクタ修正係数を生成
し、該スケールファクタと該スケールファクタ修正係数
を演算した値に基づいて、該ステップ(d)の処理を行
うステップを更に備えることを特徴とする付記18に記
載の記録媒体。 21.前記データ再生方法は、画像データとオーディオ
データを含むマルチメディアデータを処理し、 更に、 (i)画像データとオーディオデータを分離するステッ
プと、 (j)該画像データを復号するステップと、 (k)該画像データを再生するステップとを備えること
を特徴とする付記16に記載の記録媒体。 22.前記画像データとオーディオデータは、MPEG
データとして構成されていることを特徴とする付記21
に記載の記録媒体。
【0070】
【発明の効果】以上説明したように、本発明によれば、
MPEGオーディオ規格で定義されるフレーム単位に処
理することでMPEGデータをデコードせずに話速を変
化させる話速変換する効果を奏し、スケールファクタを
用いることでMPEGデータをデコードせずに無音区間
を圧縮して話速変換する効果を有する。
【0071】また、フレーム間の接続部の前後のスケー
ルファクタを変化させることで、フレームの接続部での
聴感上の違和感を低減する効果を奏し、MPEGデータ
再生方法及びMPEGデータ再生装置の性能向上に寄与
するところが大きい。
【図面の簡単な説明】
【図1】同じ音声データをMPEGオーディオレイヤI
Iで圧縮したデータのスケールファクタと圧縮しないデ
ータの音圧について比較した図である。
【図2】本発明の話速変換処理の概略フローチャートで
ある。
【図3】本発明の別の話速変換処理の概略フローチャー
トである。
【図4】再生速度変換処理の流れを示す詳細なフローチ
ャートである。
【図5】再生速度変換処理及び無音部分除去処理を含む
処理の流れを示す詳細フローチャートである。
【図6】ノイズ低減処理の流れを示すフローチャートで
ある。
【図7】図6のスケールファクタ修正処理を説明する図
(その1)である。
【図8】図6のスケールファクタ修正処理を説明する図
(その2)である。
【図9】本発明の話速変換を適用したMPEGオーディ
オデータ再生装置の一構成を示すブロック構成図であ
る。
【図10】本発明の話速変換を適用したMPEGデータ
再生装置の別の構成例を示す図である。
【図11】本発明の別の実施形態を説明する図である。
【図12】本発明の更に別の実施形態である話速変換を
適用したMPEGデータ再生装置の一構成例を示す図で
ある。
【図13】本発明の更に別の実施形態であり、MPEG
データ再生装置を示す図である。
【図14】本発明の実施形態をプログラムで実現する場
合に必要とされる装置のハードウェア構成例を示す図で
ある。
【図15】MPEGオーディオデータのフォーマットを
示す図(その1)である。
【図16】MPEGオーディオデータのフォーマットを
示す図(その2)である。
【図17】従来のMPEGオーディオ再生装置の基本的
構成を示す図である。
【符号の説明】
10、20 MPEGオーディオ入力部 11、26、43 MPEGオーディオ復号化部 12、27、45 オーディオ出力部 21 フレーム抽出部 22 スケールファクタ抽出部 23、34 速度変換部(話速変換処理部) 24、33 評価関数演算部 25、35 スケールファクタ修正部 40 MPEGデータ入力部 41 MPEGデータ分離部 42 MPEGビデオ復号化部 44 ビデオ出力部 50 MPEGデータ蓄積部 51 入力データ選択部 52 出力データ選択部
フロントページの続き (72)発明者 肥塚 哲雄 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 Fターム(参考) 5D044 AB05 DE03 DE14 FG23 GK02 GK08 5D045 DA00

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】オーディオデータを含む圧縮されたマルチ
    メディアデータを再生する装置であって、 該オーディオデータの単位データであるフレームを抽出
    する抽出手段と、 該オーディオデータの該フレームの間引き処理あるいは
    該フレームの繰り返し出力処理を行う変換手段と、 該変換手段から受け取った該オーディオデータの該フレ
    ームをデコードし、音声を再生する再生手段とを備え
    た、ことを特徴とするデータ再生装置。
  2. 【請求項2】オーディオデータを含むマルチメディアデ
    ータを再生する装置であって、 該オーディオデータの単位データであるフレームを抽出
    する抽出手段と、 該オーディオデータの再生速度を設定する設定手段と、 該設定手段によって設定された該再生速度に基づいて、
    該オーディオデータの該フレームの間引き処理あるいは
    該フレームの繰り返し出力処理を行う速度変換手段と、 該速度変換手段から受け取った該オーディオデータの該
    フレームをデコードし、音声を再生する再生手段とを備
    え、 圧縮されたオーディオデータをデコードすることなしに
    再生速度変換処理を行うことを特徴とするデータ再生装
    置。
  3. 【請求項3】前記フレームに含まれるスケールファクタ
    を抽出するスケールファクタ抽出手段と、 該スケールファクタに対して演算を行う演算手段と、 該演算手段の演算結果と所定の閾値とを比較し、該演算
    結果が該閾値よりも小さい場合には、対応する該フレー
    ムを前記再生手段に送らないように制御する制御手段
    と、を更に備えることを特徴とする請求項2に記載のデ
    ータ再生装置。
  4. 【請求項4】オーディオデータを含むマルチメディアデ
    ータを再生する方法であって、 (a)該オーディオデータの単位データであるフレーム
    を抽出するステップと、 (b)該オーディオデータの再生速度を設定するステッ
    プと、 (c)該ステップ(b)において設定された該再生速度
    に基づいて、該オーディオデータの該フレームの間引き
    処理あるいは該フレームの繰り返し出力処理を行うステ
    ップと、 (d)該ステップ(c)の処理後受け取った該オーディ
    オデータの該フレームをデコードし、音声を再生するス
    テップとを備え、 圧縮されたオーディオデータをデコードすることなしに
    再生速度変換処理を行うことを特徴とするデータ再生方
    法。
  5. 【請求項5】情報装置に、オーディオデータを含むマル
    チメディアデータを再生する方法を実行させるプログラ
    ムを記録した記録媒体であって、 (a)該オーディオデータの単位データであるフレーム
    を抽出するステップと、 (b)該オーディオデータの再生速度を設定するステッ
    プと、 (c)該ステップ(b)において設定された該再生速度
    に基づいて、該オーディオデータの該フレームの間引き
    処理あるいは該フレームの繰り返し出力処理を行うステ
    ップと、 (d)該ステップ(c)の処理後受け取った該オーディ
    オデータの該フレームをデコードし、音声を再生するス
    テップとを備え、 圧縮されたオーディオデータをデコードすることなしに
    再生速度変換処理を行うことを特徴とする方法を実現す
    るプログラムを記録した、情報装置読み取り可能な記録
    媒体。
JP2000157042A 2000-05-26 2000-05-26 データ再生装置、その方法及び記録媒体 Pending JP2001344905A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000157042A JP2001344905A (ja) 2000-05-26 2000-05-26 データ再生装置、その方法及び記録媒体
US09/788,514 US7418393B2 (en) 2000-05-26 2001-02-21 Data reproduction device, method thereof and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000157042A JP2001344905A (ja) 2000-05-26 2000-05-26 データ再生装置、その方法及び記録媒体

Publications (1)

Publication Number Publication Date
JP2001344905A true JP2001344905A (ja) 2001-12-14

Family

ID=18661741

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000157042A Pending JP2001344905A (ja) 2000-05-26 2000-05-26 データ再生装置、その方法及び記録媒体

Country Status (2)

Country Link
US (1) US7418393B2 (ja)
JP (1) JP2001344905A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007094234A (ja) * 2005-09-30 2007-04-12 Sony Corp データ記録再生装置、データ記録再生方法及びそのプログラム
WO2017169890A1 (ja) * 2016-03-31 2017-10-05 ソニー株式会社 情報処理装置および方法

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100287366B1 (ko) 1997-11-24 2001-04-16 윤순조 엠피이지 방식을 이용한 휴대용 음향 재생장치 및 방법
GB0007861D0 (en) * 2000-03-31 2000-05-17 Koninkl Philips Electronics Nv Video signal analysis and storage
GB0103242D0 (en) * 2001-02-09 2001-03-28 Radioscape Ltd Method of analysing a compressed signal for the presence or absence of information content
JP2002268692A (ja) * 2001-03-14 2002-09-20 Sanyo Electric Co Ltd データ再生装置
CN100380441C (zh) * 2001-05-11 2008-04-09 皇家菲利浦电子有限公司 检测给定类型节目的方法和设备、无声检测器和接收器
WO2003034725A1 (fr) * 2001-10-18 2003-04-24 Matsushita Electric Industrial Co., Ltd. Appareil et procede de reproduction video/audio, programme et support correspondants
US7376159B1 (en) * 2002-01-03 2008-05-20 The Directv Group, Inc. Exploitation of null packets in packetized digital television systems
US7286473B1 (en) 2002-07-10 2007-10-23 The Directv Group, Inc. Null packet replacement with bi-level scheduling
JP3821086B2 (ja) * 2002-11-01 2006-09-13 ソニー株式会社 ストリーミングシステム及びストリーミング方法、クライアント端末及びデータ復号方法、並びにプログラム
JP4354455B2 (ja) * 2003-02-28 2009-10-28 パナソニック株式会社 再生装置および再生方法
US7647221B2 (en) * 2003-04-30 2010-01-12 The Directv Group, Inc. Audio level control for compressed audio
US7912226B1 (en) 2003-09-12 2011-03-22 The Directv Group, Inc. Automatic measurement of audio presence and level by direct processing of an MPEG data stream
WO2009154033A1 (ja) * 2008-06-18 2009-12-23 三菱電機株式会社 三次元映像変換記録装置、三次元映像変換記録方法、記録媒体、三次元映像変換装置、及び三次元映像伝送装置
JP2010226557A (ja) * 2009-03-25 2010-10-07 Sony Corp 画像処理装置、画像処理方法、およびプログラム
US9729120B1 (en) 2011-07-13 2017-08-08 The Directv Group, Inc. System and method to monitor audio loudness and provide audio automatic gain control
US8666748B2 (en) * 2011-12-20 2014-03-04 Honeywell International Inc. Methods and systems for communicating audio captured onboard an aircraft
JP6695069B2 (ja) * 2016-05-31 2020-05-20 パナソニックIpマネジメント株式会社 電話装置
CN107424620B (zh) * 2017-07-27 2020-12-01 苏州科达科技股份有限公司 一种音频解码方法和装置
US11398216B2 (en) 2020-03-11 2022-07-26 Nuance Communication, Inc. Ambient cooperative intelligence system and method

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58216300A (ja) 1982-06-11 1983-12-15 日本コロムビア株式会社 周波数スペクトル圧縮伸長装置
JPS6391873A (ja) 1986-10-06 1988-04-22 Matsushita Electric Ind Co Ltd 音声録音再生装置
JP2612868B2 (ja) 1987-10-06 1997-05-21 日本放送協会 音声の発声速度変換方法
US5611018A (en) 1993-09-18 1997-03-11 Sanyo Electric Co., Ltd. System for controlling voice speed of an input signal
JP3357742B2 (ja) 1993-09-18 2002-12-16 三洋電機株式会社 話速変換装置
JP3187242B2 (ja) 1994-04-05 2001-07-11 日本放送協会 話速変換装置
JP3187241B2 (ja) 1994-04-05 2001-07-11 日本放送協会 話速変換装置
EP0737959A4 (en) 1994-10-28 1999-05-06 Nippon Steel Corp DEVICE FOR DECODING ENCODED DATA, AND USING DEVICE FOR DECODING MULTIPLEXED AUDIO / VIDEO DATA
JPH08237135A (ja) 1994-10-28 1996-09-13 Nippon Steel Corp 符号化データ復号装置およびそれを用いた画像オーディオ多重化データ復号装置
JPH08315512A (ja) 1995-05-19 1996-11-29 Nippon Columbia Co Ltd 再生装置
JP3332667B2 (ja) 1995-06-15 2002-10-07 三洋電機株式会社 ビデオテープレコーダ
JPH08328586A (ja) 1995-05-29 1996-12-13 Matsushita Electric Ind Co Ltd 音声時間軸変換装置
JP3316340B2 (ja) 1995-06-20 2002-08-19 三洋電機株式会社 ビデオテープレコーダ
JP3594409B2 (ja) 1995-06-30 2004-12-02 三洋電機株式会社 Mpegオーディオ再生装置およびmpeg再生装置
US5809454A (en) * 1995-06-30 1998-09-15 Sanyo Electric Co., Ltd. Audio reproducing apparatus having voice speed converting function
KR100188701B1 (ko) * 1996-01-08 1999-06-01 윤종용 가변속 고속 재생기능을 갖는 가변 비트율 동화상복호화장치
JPH10143193A (ja) 1996-11-08 1998-05-29 Matsushita Electric Ind Co Ltd 音声信号処理装置
JP3395560B2 (ja) 1997-01-31 2003-04-14 ヤマハ株式会社 波形再生装置および波形データのクロスフェード方法
JP3220043B2 (ja) 1997-04-30 2001-10-22 日本放送協会 話速変換方法およびその装置
JP3017715B2 (ja) 1997-10-31 2000-03-13 松下電器産業株式会社 音声再生装置
JPH11355145A (ja) 1998-06-10 1999-12-24 Mitsubishi Electric Corp 音響符号器および音響復号器
JP2000099097A (ja) 1998-09-24 2000-04-07 Sony Corp 信号再生装置及び方法、音声信号再生装置、並びに、音声信号の速度変換方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007094234A (ja) * 2005-09-30 2007-04-12 Sony Corp データ記録再生装置、データ記録再生方法及びそのプログラム
US8275473B2 (en) 2005-09-30 2012-09-25 Sony Corporation Data recording and reproducing apparatus, method of recording and reproducing data, and program therefor
WO2017169890A1 (ja) * 2016-03-31 2017-10-05 ソニー株式会社 情報処理装置および方法

Also Published As

Publication number Publication date
US20010047267A1 (en) 2001-11-29
US7418393B2 (en) 2008-08-26

Similar Documents

Publication Publication Date Title
JP2001344905A (ja) データ再生装置、その方法及び記録媒体
JP4098420B2 (ja) 音響データ・動画データの同期再構築方法及び装置
US6339760B1 (en) Method and system for synchronization of decoded audio and video by adding dummy data to compressed audio data
US10244271B2 (en) Audio recording device, audio recording system, and audio recording method
JP3594409B2 (ja) Mpegオーディオ再生装置およびmpeg再生装置
JP4359499B2 (ja) オーディオ信号の編集
WO2004047441A1 (ja) 伝送装置と伝送方法と再生装置と再生方法およびプログラムと記録媒体
JPH10313251A (ja) オーディオ信号変換装置及び方法、予測係数生成装置及び方法、予測係数格納媒体
US20010032072A1 (en) Apparatus and method for converting reproducing speed
JP2000078531A (ja) オ―ディオデ―タ編集方法、編集システム
JPWO2002058053A1 (ja) ディジタル音声データの符号化方法及び復号化方法
JP2005512134A (ja) リアルタイム時間伸縮用パラメータ付きデジタルオーディオ
JP3416403B2 (ja) Mpegオーディオデコーダ
JPH08293157A (ja) 可変フレーム長高能率符号化データの記録再生方法
JP2822940B2 (ja) 動画像音声データ編集装置
JP4212253B2 (ja) 話速変換装置
JP2002258900A (ja) 音声再生装置及び音声再生方法
JP2002073093A (ja) オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体
JPH10174065A (ja) 画像音声多重化データ編集方法およびその装置
JP4155990B2 (ja) 音響データ・動画データの同期再構築方法及び装置
US20060069565A1 (en) Compressed data processing apparatus and method and compressed data processing program
JP2002229593A (ja) 音声信号復号化処理方法
JPH08237135A (ja) 符号化データ復号装置およびそれを用いた画像オーディオ多重化データ復号装置
JP4539180B2 (ja) 音響復号装置及び音響復号方法
JP2005204003A (ja) 連続メディアデータ高速再生方法、複合メディアデータ高速再生方法、多チャンネル連続メディアデータ高速再生方法、映像データ高速再生方法、連続メディアデータ高速再生装置、複合メディアデータ高速再生装置、多チャンネル連続メディアデータ高速再生装置、映像データ高速再生装置、プログラム、および、記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060627

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080215

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080215

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080318

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080515

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080610

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080710

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080825

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20080912

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110128