JP2001344905A

JP2001344905A - データ再生装置、その方法及び記録媒体

Info

Publication number: JP2001344905A
Application number: JP2000157042A
Authority: JP
Inventors: Yukihiro Abiko; 幸弘安孫子; Hideo Kato; 秀雄加藤; Tetsuo Hizuka; 哲雄肥塚
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2000-05-26
Filing date: 2000-05-26
Publication date: 2001-12-14
Also published as: US20010047267A1; US7418393B2

Abstract

(57)【要約】【課題】ＭＰＥＧデータを簡単な構成で話速変換可能な
再生装置及び方法を提供する。【解決手段】ＭＰＥＧオーディオデータをデコードしな
いまま、そのデータ単位であるフレームを抽出する。そ
して、フレームに含まれるスケールファクタを抽出し、
スケールファクタに基づいて評価関数を算出する。そし
て、評価関数の値が所定の閾値より大きければ、そのフ
レームを速度変換処理する。評価関数の値が所定の閾値
より小さければ、無音区間のフレームであるとして無視
する。速度変換処理は、フレームを所定の法則に基づい
て間引いたり、同じフレームを所定回数繰り返すことに
より行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、データ再生装置及
び再生方法に関する。

【０００２】

【従来の技術】近年のデジタル音声録音技術の発展によ
り、従来のテープレコーダに代わり、ＭＤレコーダを使
用して、ＭＤに音声を録音することが一般的となってい
る。また、更に、現在では、ＤＶＤなどを従来のビデオ
テープの代わりに使用し、映画などを一般に配布するこ
とが行われ始めている。このようなデジタル音声録音技
術、及び画像録画技術には、様々な技術が使用される
が、そのような技術の中でもＭＰＥＧは最も一般的な技
術の一つである。

【０００３】図１５及び図１６は、ＭＰＥＧオーディオ
データのフォーマットを示す図である。ＭＰＥＧオーデ
ィオデータは図１５に示されるように、ＡＡＵ（Audio
Access UnitあるいはAudio Frame）と呼ばれる連続
したフレームで構成される。フレームは、更にヘッダ、
エラーチェック、オーディオデータ、アンシラリデータ
（付加情報）で構成される階層構造を持つ。ここで、オ
ーディオデータは、圧縮処理されたデータである。

【０００４】ヘッダは、syncword、レイヤ、ビットレー
トに関する情報、サンプリング周波数に関する情報、パ
ディングビットなどのデータで構成される。この構造は
圧縮性能の異なるレイヤＩ、レイヤＩＩ、レイヤＩＩＩ
で共通している。

【０００５】フレーム中のオーディオデータは図１６の
ように構成されている。図１６に示されるように、オ
ーディオデータは、レイヤＩ、ＩＩ、ＩＩＩに関わら
ず、必ずスケールファクタを含んでいる。このスケール
ファクタは波形の再生時の倍率を表したデータである。
すなわち、レイヤＩ、ＩＩのサンプリングデータあるい
は、レイヤＩＩＩのハフマンコードビットが表す音声デ
ータは、スケールファクタで正規化されており、実際の
音声データは、サンプリングデータや、ハフマンコード
ビットを伸長したデータにスケールファクタを乗算して
得られる。スケールファクタは時間軸に沿って更に３２
区間（サブバンド）に分かれて圧縮されており、スケー
ルファクタもモノラルで最大３２個割り当てられる。

【０００６】なお、ＭＰＥＧオーディオの詳細について
は、国際規格であるＩＳＯ／ＩＥＣ１１１７２−２を参
照されたい。図１７は、従来のＭＰＥＧオーディオ再生
装置の基本的構成を示す図である。

【０００７】ＭＰＥＧオーディオデータがＭＰＥＧオー
ディオ入力部１０に入力されると、上記国際規格に記載
されている処理を実現するＭＰＥＧオーディオ復号化部
１１において復号され、スピーカなどからなるオーディ
オ出力部１２から音声として出力される。

【０００８】

【発明が解決しようとする課題】デジタルで録音された
音声を再生する場合、再生速度を変更することは頻繁に
行われ、特に、話速変換は内容理解や内容圧縮に有効で
ある。ところが、ＭＰＥＧオーディオデータから直接話
速変換する場合、従来においては、一旦デコードしてか
ら話速変換を行っていた。

【０００９】ＭＰＥＧオーディオにおける圧縮は、デー
タを数十分の１まで低減させることができる。したがっ
て、ＭＰＥＧオーディオデータをデコードしてから話速
変換処理を行おうとすると、圧縮データを伸長した後の
膨大なデータを扱わなければならい。従って、話速変換
に必要な回路の数や規模が大きくなってしまう。

【００１０】ＭＰＥＧオーディオデータを一旦デコード
してから話速変換するものである公知例として特開平９
−７３２９９号公報がある。本発明の課題は、マルチメ
ディアデータを簡単な構成で話速変換可能な再生装置及
び方法を提供することである。

【００１１】

【課題を解決するための手段】本発明の第１のデータ再
生装置は、オーディオデータを含む圧縮されたマルチメ
ディアデータを再生する装置であって、該オーディオデ
ータの単位データであるフレームを抽出する抽出手段
と、該オーディオデータの該フレームの間引き処理ある
いは該フレームの繰り返し出力処理を行う変換手段と、
該変換手段から受け取った該オーディオデータの該フレ
ームをデコードし、音声を再生する再生手段とを備えた
ことを特徴とする。

【００１２】本発明の第２のデータ再生装置は、オーデ
ィオデータを含むマルチメディアデータを再生する装置
であって、該オーディオデータの単位データであるフレ
ームを抽出する抽出手段と、該オーディオデータの再生
速度を設定する設定手段と、該設定手段によって設定さ
れた該再生速度に基づいて、該オーディオデータの該フ
レームの間引き処理あるいは該フレームの繰り返し出力
処理を行う速度変換手段と、該速度変換手段から受け取
った該オーディオデータの該フレームをデコードし、音
声を再生する再生手段とを備え、圧縮されたオーディオ
データをデコードすることなしに再生速度変換処理を行
うことを特徴とする。

【００１３】本発明のデータ再生方法は、オーディオデ
ータを含むマルチメディアデータを再生する方法であっ
て、（ａ）該オーディオデータの単位データであるフレ
ームを抽出するステップと、（ｂ）該オーディオデータ
の再生速度を設定するステップと、（ｃ）該ステップ
（ｂ）において設定された該再生速度に基づいて、該オ
ーディオデータの該フレームの間引き処理あるいは該フ
レームの繰り返し出力処理を行うステップと、（ｄ）該
ステップ（ｃ）の処理後受け取った該オーディオデータ
の該フレームをデコードし、音声を再生するステップと
を備え、圧縮されたオーディオデータをデコードするこ
となしに再生速度変換処理を行うことを特徴とする。

【００１４】本発明によれば、圧縮されたオーディオデ
ータを、デコードすることなく、圧縮されたままで、話
速変換処理を行うことが可能となるので、データ再生装
置に必要とされる回路規模が縮小され、簡単な構成で話
速変換を伴う再生処理を行うことが出来る。

【００１５】

【発明の実施の形態】本発明の実施形態は、ＭＰＥＧオ
ーディオからオーディオフレームと呼ばれるフレームを
抽出し、フレームを所定の法則に従って間引くことによ
って変換速度を速める、あるいはフレームを所定の法則
に従って内挿することによって変換速度を遅くする。ま
た、抽出したフレームから得られるスケールファクタを
用いて評価関数を算出し、所定の法則に従って当該フレ
ームを間引くことによって無音区間を圧縮する。更に、
接続される前後のフレームでスケールファクタを変更す
ることで、接続部での聴覚上の違和感（ノイズなど）を
低減する。また再生装置においては、データ入力部とＭ
ＰＥＧデータ判別部と上記方法によって話速変換変換を
行う話速変換部とＭＰＥＧオーディオ部とオーディオ出
力部を備える。

【００１６】本発明の実施形態で行うフレーム抽出につ
いて、図１６、１７のＭＰＥＧオーディオデータの構成
を参照して説明する。フレームの抽出は、フレームの先
頭にあるsyncwordを検出することによって行う。つま
り、フレームｎのsyncwordの先頭からフレームｎ＋１の
syncwordの直前までのビット列を読み込む。

【００１７】あるいは、別なフレームの抽出方法とし
て、syncwordを含む３２ビットのビット列からなるオー
ディオフレームヘッダから、ビットレート、サンプリン
グ周波数、パディングビットを抽出し、次式から１フレ
ームのデータ長を求め、syncwordからデータ長までのビ
ット列を読み込んでも良い。｛フレームサイズ×ビットレート［bit/sec］÷８÷サ
ンプリング周波数［Ｈｚ］｝＋パディングビット［byt
e］話速変換では、再生速度を変化させたときに聞き手に違
和感を感じさせないことが重要であるため、次にステッ
プで処理を行う。・基本周期の抽出・基本周期の間引き、繰り返し・無音部分の圧縮音声の周期性を持つ波形の周期を基本周期と呼び、日本
人男性で１００〜１５０Ｈｚ、女性で２５０〜３００Ｈ
ｚである。話速を速くする場合には周期性のある波形を
抽出し間引く処理、一方、遅くする場合には逆に繰り返
す処理を行う。

【００１８】ＭＰＥＧオーディオに対して従来の話速変
換方法を適用する場合には、次の問題がある。・ＰＣＭ形式への復元が必要・リアルタイム処理には専用のハードウェアが必要音声処理においては、その処理単位として約１０〜３０
ミリ秒程度が一般的である。ＭＰＥＧオーディオでは１
オーディオフレームは約２０ミリ秒（レイヤＩＩ、４
４．１ＫＨｚ、１１５２サンプルの場）である。

【００１９】この基本周期をオーディオフレームで代用
することで復元なしに話速変換の効果を得る。一方、従
来無音区間を検出するためには、音圧の強弱を評価する
必要があった。厳密にはデコードなしに無音区間を正確
に検出することはできない。しかし、オーディオデータ
に含まれるスケールファクタは波形の再生の倍率を表し
たデータであるので、音圧と近い性質を持ち、本実施形
態ではスケールファクタを利用する。

【００２０】図１は、同じ音声データをＭＰＥＧオーデ
ィオレイヤＩＩで圧縮したデータのスケールファクタと
圧縮しないデータの音圧について比較した図である。グ
ラフの縦軸は１フレーム（ＭＰＥＧオーディオレイヤＩ
Ｉ相当：１１５２サンプル）についてのスケールファク
タの平均、あるいは音圧の区間平均を表し、横軸は時間
を表す。スケールファクタと音圧が非常に近い形状を示
しており、この図においては相関係数は約８０％程度で
あり高い相関を示している。エンコーダの性能にも依存
するが、スケールファクタは、音圧と近い性質を持って
いることが示されている。

【００２１】従って、本実施形態においては、スケール
ファクタから評価関数を演算することによって無音区間
の検出をする。評価関数の一例としては１フレーム内の
スケールファクタの平均値とすることが考えられる。あ
るいは、数フレームにわたって評価関数を設定してもよ
いし、サブバンド毎のスケールファクタから評価関数を
設定してもよく、更にこれらを組み合わせたものでもよ
い。

【００２２】ところで、単にフレーム単位に間引きを行
い接続する場合、フレームとフレームの接続点で聴感上
違和感を感じる場合がある。これは、間引きを行ったこ
とにより、音圧の変換が不連続に大きくなったり、小さ
くなることによって生じる。そこで、本実施形態では、
フレームとフレームの接続点前後のフレームの一部のス
ケールファクタを変更することで、この違和感を低減す
る。

【００２３】例えば、接続点直前のスケールファクタが
０に近く、かつ接続点直後のスケールファクタが最大値
に近い場合、接続部では本来含まれない高周波成分が加
わってしまい。これがノイズとして聴感上の違和感とな
って現れることになる。この場合については、接続点前
後のスケールファクタを中間値に変更することで低減さ
れる。

【００２４】本発明の実施形態においては、ＭＰＥＧオ
ーディオ規格で定義されているオーディオフレームと呼
ばれるフレームを単位としてＭＰＥＧデータをデコード
せずに話速変換するので、ＭＰＥＧデータをデコードす
る必要が無く、回路規模を縮小し、簡単な構成で話速変
換を実現することが出来る。また、スケールファクタを
用いることで、デコードによって音圧を得ることなしに
無音区間を判定して、無音区間を削除し、有音区間を割
り当てることにより話速変換を行う。更に、スケールフ
ァクタを適切に可変することで、フレームの接続点前後
の聴感上の違和感を低減することができる。

【００２５】図２は、本発明の話速変換処理の概略フロ
ーチャートである。まず、ステップＳ１０において、フ
レームの抽出を行う。フレームの抽出は、フレームの先
頭にあるsyncwordを検出することで行う。つまり、フレ
ームｎのsyncwordの先頭からフレームｎ＋１のsyncword
の直前までのビット列を読み込む用にする。あるいは、
syncwordを含む３２ビットのビット列からなるオーディ
オフレームヘッダから、ビットレート、サンプリング周
波数、パディングビットを抽出し、前述の式から１フレ
ームのデータ長を求め、syncwordからデータ長までのビ
ット列を読み込んでも良い。また、フレームの抽出は、
ＭＰＥＧオーディオの復号化では必須の処理であるの
で、ＭＰＥＧオーディオ復号化で用いられるフレームの
抽出機能をそのまま利用することで実現しても良い。そ
して、フレーム抽出が成功すると、次に、スケールファ
クタの抽出を行う。図１７に示されるように、スケール
ファクタは、ＭＰＥＧオーディオのオーディオデータの
先頭から、各レイヤにおいて、決められたビット位置に
存在するので、syncwordからのビット数を係数する事に
よって、スケールファクタを抽出することができる。あ
るいは、スケールファクタの抽出も、フレームの抽出と
同様にＭＰＥＧオーディオの復号化では必須の処理であ
るので、既存のＭＰＥＧオーディオ復号化処理によって
抽出されたスケールファクタを使用しても良い。

【００２６】次に、ステップＳ１２において、スケール
ファクタから評価関数算出処理を行う。評価関数はスケ
ールファクタから算出する。評価関数の簡単な一例とし
ては１フレーム内のスケールファクタの平均値とするこ
とが考えられる。あるいは、数フレームにわたって評価
関数を設定しても良いし、サブバンド毎のスケールファ
クタから評価関数を設定してもよく、さらにこれらを組
み合わせたものでも良い。

【００２７】次に、評価関数の演算値と予め決定された
閾値との比較を行う。閾値より評価関数の方が大きい場
合には、有音区間のフレームであるとしてステップＳ１
４に進む。また、評価関数の値が閾値以下の場合には、
無音区間のフレームであるとしてフレームを無視し、ス
テップＳ１０に戻る。ここで、閾値は固定でも、可変で
もよい。

【００２８】ステップＳ１４においては、速度変換処理
を行う。速度変換処理は、オリジナルのＭＰＥＧデータ
の再生速度を１としたとき、所望の再生速度が１より大
きい場合、ある間隔でフレームを間引き、データを短縮
して出力する。例えば、フレームを先頭から０、１、
２、・・・とした場合、２倍速である場合には、０、
２、４、・・・等のように、フレームを間引いて復号化
し、再生する。また、所望の再生速度が１未満の場合、
ある間隔でフレームを繰り返して出力する。例えば、上
記例を採用すると、１／２倍速の時は、フレームを０、
０、１、１、２、２、・・・というようにフレームを配
列し、復号化して再生する。聴者は、このようにして出
力されたＭＰＥＧデータがデコードされると所望の速度
で再生されたように聞こえる。

【００２９】そして、ステップＳ１４において、速度変
換処理があるフレームについて終了すると、ステップＳ
１５に進んで、まだ処理すべきデータが存在するか否か
を判断し、データが存在する場合には、ステップＳ１０
に戻って、次のフレームを処理し、データがない場合に
は、処理を終了する。

【００３０】図３は、本発明の別の話速変換処理の概略
フローチャートである。まず、図２の場合と同様に、ス
テップＳ２０において、フレーム抽出処理を行い、ステ
ップＳ２１において、スケールファクタ抽出処理を行
う。そして、ステップＳ２２において、評価関数を演算
し、ステップＳ２３において、評価関数の値と閾値との
比較を行う。ステップＳ２３において、評価関数の方が
閾値よりも大きいと判断された場合には、有音区間のフ
レームであるとして、ステップＳ２４に進む。ステップ
Ｓ２３において、評価関数の値が閾値以下であると判断
される場合には、無音区間のフレームであるとして、ス
テップＳ２０に戻って、次のフレームの処理をする。

【００３１】ステップＳ２４においては、図２で説明し
たような速度変換処理を行い、更に、ステップＳ２５に
おいて、フレームの接続部におけるノイズの発生を抑え
るため、スケールファクタの修正処理を行う。そして、
ステップＳ２６において、後続のデータがあるか否かを
判断し、データがある場合には、ステップＳ２０に進
み、データがない場合には処理を終了する。なお、スケ
ールファクタ修正処理では、直前のフレームを保持して
おり、フレームの接続点前後のスケールファクタを調整
し出力する。

【００３２】図４は、再生速度変換処理の流れを示す詳
細なフローチャートである。なお、同図においては、ｎ
_inを入力フレーム数とし、ｎ_outを出力フレーム数と
し、Ｋを再生速度とする。

【００３３】まず、ステップＳ３０において、初期化す
る。すなわち、ｎ_inを−１に、ｎ_ou _tを０に設定する。
次に、ステップＳ３１において、オーディオフレームの
抽出処理を行う。この処理は、前述したように、既存の
技術を使用して実現することができるので、詳細には説
明しない。次に、ステップＳ３２において、オーディオ
フレームの抽出処理が正常に行われたか否かを判断す
る。ステップＳ３２において、オーディオフレームの抽
出が正常に行われなかったと判断された場合には、処理
を終了する。ステップＳ３２において、オーディオフレ
ームの抽出が正常に行われたと判断された場合には、ス
テップＳ３３に進む。

【００３４】ステップＳ３３においては、入力フレーム
数であるｎ_inを１だけ増加する。そして、ステップＳ３
４において、再生速度Ｋが１以上であるか否かが判断さ
れる。この再生速度は、一般には、再生装置を使用する
ユーザによって設定されるものである。ステップＳ３４
において、再生速度Ｋが１以上であると判断された場合
には、出力フレーム数ｎ_outの再生速度Ｋ倍が入力フレ
ーム数ｎ_in以上になったか否かを判断する（ステップＳ
３５）。すなわち、入力フレームを間引いて出力される
出力フレームの数の再生速度Ｋ倍が入力フレーム数ｎ_in
以下か否かを判断する。ステップＳ３５の判断がＮＯと
なった場合には、ステップＳ３１に戻り、ステップＳ３
５の判断がＹＥＳとなった場合には、ステップＳ３６に
進む。

【００３５】ステップＳ３６においては、オーディオフ
レームを出力する。そして、ステップＳ３７において、
出力フレーム数ｎ_outを１だけ増加し、ステップＳ３１
に戻る。

【００３６】図４のＫが１以上である場合の、オーディ
オフレームの出力は処理を繰り返すことによって間引き
処理を行うようになっている。間引き方としては、前述
の２倍速の他に、３倍速の場合においては、０、３、
６、・・・などのように行う。１．５倍速などの場合に
は、整数Ｎ、Ｍに対して、１．５×Ｎ＝Ｍを計算し、Ｍ
番のフレームをＮ＋１番目に配置し、このようにして配
置されたフレームの間に適当なフレームを埋め込むこと
によって行う。すなわち、１．５倍の場合、０、１、
３、４、６、・・・とするか、０、２、３、５、６、・
・・などのように行う。

【００３７】ステップＳ３４において、再生速度Ｋが１
より小さい場合には、ステップＳ３８において、オーデ
ィオフレーム出力処理を行う。この場合は、フローに従
ってオーディオフレームを出力することによって、例え
ば、１／２倍速の場合には、０、０、１、１、２、２、
・・・のように、１／３倍速の場合には、０、０、０、
１、１、１、２、２、２、・・・のようにフレームを繰
り返して出力し、１より小さい再生速度を実現する。

【００３８】そして、ステップＳ３９において、出力フ
レーム数ｎ_outを１だけ増加し、ステップＳ４０におい
て、入力フレーム数ｎ_inが出力フレーム数ｎ_outの再生
速度Ｋ倍以下であるか以下を判断する。ステップＳ４０
の判断がＹＥＳの場合には、ステップＳ４１に戻る。ス
テップＳ４０の判断がＮＯの場合には、ステップＳ３８
に戻って、同じフレームを繰り返し出力する。

【００３９】以上のような処理を繰り返して、再生速度
変換処理を行う。図５は、再生速度変換処理及び無音部
分除去処理を含む処理の流れを示す詳細フローチャート
である。

【００４０】まず、ステップＳ４５において、ｎ_inを−
１に、ｎ_outを０に初期化する。次に、ステップＳ４６
において、オーディオフレームの抽出処理を行う。ステ
ップＳ４７において、オーディオフレームの抽出処理が
正常か否かを判断する。オーディオフレームの抽出処理
が異常であった場合には、処理を終了する。オーディオ
フレームの抽出処理が正常であった場合には、ステップ
Ｓ４８に進んで、スケールファクタの抽出を行う。スケ
ールファクタの抽出方法は、前述したように、既存の技
術で行うことができるので、詳細な説明は省略する。そ
して、ステップＳ４９に進んで、抽出したスケールファ
クタから評価関数Ｆ（前述したように、例えば、１フレ
ーム分のスケールファクタの和）を算出する。そして、
ステップＳ５０において、入力フレーム数ｎ_inを１増加
してステップＳ５１に進む。ステップＳ５１において
は、ｎ_in≧Ｋ・ｎ_outかつＦ＞Ｔｈ（ここで、Ｔｈは閾
値）であるか否かを判断する。ステップＳ５１におい
て、判断がＮＯの場合には、ステップＳ４６に戻る。ス
テップＳ５１における判断がＹＥＳの場合には、ステッ
プＳ５２に進んで、オーディオフレームを出力し、ステ
ップＳ５３において、出力フレーム数ｎ_outを１だけ増
加して、ステップＳ４６に進む。

【００４１】ここで、ステップＳ５１のｎ_in≧Ｋ・ｎ
_outの判断式の意味は、図４で説明したものと同様であ
る。また、Ｆ＞Ｔｈも前述の概略フローによって説明し
たとおりである。

【００４２】図６は、ノイズ低減処理の流れを示すフロ
ーチャートである。まず、ステップＳ６０において、ｎ
_inを−１、ｎ_outを０に設定して、初期化を行う。次
に、ステップＳ６１において、オーディオフレーム抽出
処理を行い、ステップＳ６２において、オーディオフレ
ーム抽出処理が成功であったか否かを判断する。オーデ
ィオフレーム抽出処理が失敗であった場合には、処理を
終了する。オーディオフレーム抽出処理が成功であった
場合には、ステップＳ６３に進む。

【００４３】次に、ステップＳ６３において、スケール
ファクタを抽出し、ステップＳ６４において、評価関数
Ｆを算出する。そして、ステップＳ６６において、入力
フレーム数ｎ_inを１だけ増加し、ステップＳ６７におい
て、ｎ_in≧Ｋ・ｎ_outかつＦ＞Ｔｈであるか否かを判断
する。ステップＳ６７の判断がＮＯの場合には、ステッ
プＳ６１に進み、ステップＳ６７の判断がＹＥＳの場合
には、ステップＳ６８において、スケールファクタ修正
処理を行う。

【００４４】そして、ステップＳ６９に進み、オーディ
オフレーム出力処理を行い、ステップＳ７０において、
ｎ_outを１だけ増加してステップＳ６１に戻る。図７、
及び、図８は、図６のスケールファクタ修正処理を説明
する図である。

【００４５】図７に示されるように、オーディオフレー
ムを間引いたりして送出する場合、オーディオフレーム
の接続点において、音圧の不連続な変化が生じる。この
ような不連続は、音声を聞いているユーザにとっては、
ノイズとして聞こえてしまい、早送りなどをしている場
合に、非常に不快な音に気が取られてしまう。

【００４６】そこで、図８に示すように、オーディオフ
レームの境界付近で係数値が小さくなるような修正係数
をスケールファクタに乗算して、音声を再生するように
する。このようにすることによって、図８の太線で示さ
れているように、オーディオフレームの接続点付近での
音圧の不連続な飛びが緩和される。従って、再生音を聞
いているユーザにとっても、ノイズが小さくなり、早送
りなどの場合、不快な音が気にならなくなる。

【００４７】図９は、本発明の話速変換を適用したＭＰ
ＥＧオーディオデータ再生装置の一構成を示すブロック
構成図である。これは図１８に示す従来のＭＰＥＧオー
ディオ再生装置にフレーム抽出部２１、評価関数演算部
２４、速度変換処理部２３、スケールファクタ修正部２
５を加えたものである。フレーム抽出部２１は、図１８
には、明示されていないが、ＭＰＥＧオーディオ復号化
部１１に含まれているものを同図では、明示的に示した
ものである。

【００４８】フレーム抽出部２１では、ＭＰＥＧオーデ
ィオデータのオーディオフレームとも呼ばれるフレーム
を抽出する機能を持ち、フレームデータをスケールファ
クタ抽出部２２と速度変換処理部２３に出力する。スケ
ールファクタ抽出部２２では、フレームからスケールフ
ァクタを抽出し、評価関数演算部２４に出力する。速度
変換処理部２４では、フレームの間引きや繰り返しを行
うと共に、評価関数によって無音区間のデータ量を削除
し、スケールファクタ修正部２５に出力する。スケール
ファクタ修正部２５では速度変換部２３で接続されたフ
レームの前後のスケールファクタを修正し、ＭＰＥＧオ
ーディオ復号化部２６に出力する。

【００４９】本構成例においては、図１８に示す一般的
なＭＰＥＧオーディオ再生装置に話速変換系回路２２、
２３、２４、２５を追加するのみであり、話速変換機能
を容易に備えることができる利点がある。

【００５０】図１０は、本発明の話速変換を適用したＭ
ＰＥＧデータ再生装置の別の構成例を示す図である。図
１０の構成においては、図１８にしめる一般的なＭＰＥ
Ｇオーディオ再生装置に評価関数演算部３３、話速変換
処理部３４、スケールファクタ修正部３５を加えたもの
である。ＭＰＥＧオーディオ復号化部３１では、既にフ
レーム抽出機能とスケールファクタ抽出機能を持つの
で、本発明の実施形態の話速変換方法で必要な処理の一
部を含んでいる。よって、ＭＰＥＧオーディオ復号化部
３１のフレーム抽出機能とスケールファクタ抽出機能の
利用することで回路規模を小さくできる利点がある。

【００５１】ＭＰＥＧオーディオ復号化部１１で抽出さ
れたフレームとスケールファクタは、評価関数演算部３
３に送られ、評価関数の算出が評価関数演算部３３にお
いてなされる。評価関数値とフレームは、話速変換処理
部３４に送られ、フレームの間引きや繰り返しに使用さ
れる。そして、話速変換されたフレームとスケールファ
クタは、ＭＰＥＧオーディオ復号化部１１に送られる。
また、ＭＰＥＧオーディオ復号化部１２からは、スケー
ルファクタがスケールファクタ修正部３５にも送られ、
スケールファクタ修正部３５において、スケールファク
タの修正が行われる。修正されたスケールファクタは、
ＭＰＥＧオーディオ復号化部１１に入力される。ＭＰＥ
Ｇオーディオ復号化部１１は、話速変換されたフレーム
と修正されたスケールファクタからオーディオフレーム
からなるＭＰＥＧオーディオデータをデコードし、オー
ディオ出力部１２にデコードされたデータを送る。この
ようにして、話速変換された音声がオーディオ出力部１
２から出力される。

【００５２】図１１は、本発明の別の実施形態を説明す
る図である。なお、図１１においては、図９と同じ構成
要素には同じ参照番号を付して説明を省略する。

【００５３】同図は、話速変換を適用したＭＰＥＧデー
タ再生装置を示している。これは、従来のＭＰＥＧデー
タ再生装置（構成要素４０、４１、４２、４３、４４、
４５）のＭＰＥＧオーディオ復号化部を本発明の実施形
態に示したＭＰＥＧオーディオデータ再生装置のＭＰＥ
Ｇオーディオ入力部とオーディオ出力部を除いた回路と
置き換えたものである。従って、上記実施形態と同様の
利点を得ることができる。

【００５４】図１１の構成は、ＭＰＥＧデータとして、
音声データのみではなく、画像データも含まれる場合の
装置構成を示している。まず、ＭＰＥＧデータ入力部４
０から入力されたＭＰＥＧデータは、ＭＰＥＧデータ分
離部４１によって分離され、ＭＰＥＧビデオデータとＭ
ＰＥＧオーディオデータとに分離される。ＭＰＥＧビデ
オデータは、ＭＰＥＧビデオ復号化部４２に入力され、
ＭＰＥＧオーディオデータは、フレーム抽出部２１に入
力される。ＭＰＥＧビデオでは、ＭＰＥＧビデオ復号化
部４２においてデコードされ、ビデオ出力部４４から出
力さえる。

【００５５】ＭＰＥＧオーディオデータは、図９で説明
したような処理を受け、最終的にＭＰＥＧオーディオ復
号化部４３において復号され、オーディオ出力部４５か
ら出力される。

【００５６】図１２は、本発明の更に別の実施形態であ
る話速変換を適用したＭＰＥＧデータ再生装置の一構成
例を示す図である。なお、同図において、図１０、１１
と同じ構成要素には同じ参照符号を付し、説明を省略す
る。

【００５７】図１２の構成は、従来のＭＰＥＧデータ再
生装置のＭＰＥＧオーディオ復号化部を図１０に示した
ＭＰＥＧオーディオデータ再生装置のＭＰＥＧオーディ
オ入力部とオーディオ出力部を除いた回路と置き換えた
ものである。従って、図１０の構成例と同様の利点を得
ることができる。

【００５８】すなわち、ＭＰＥＧデータ分離部４１で分
離されたＭＰＥＧオーディオデータには、ＭＰＥＧオー
ディオ復号化部４３において、フレーム抽出、スケール
ファクタ抽出処理が施され、これらの処理結果は、評価
関数演算部３３とスケールファクタ修正部３５に入力さ
れて、上記したような処理により、話速変換が行われ
る。

【００５９】図１３は、本発明の更に別の実施形態であ
り、ＭＰＥＧデータ再生装置を示す図である。なお、同
図においては、図１２と同じ構成要素には同じ参照符号
を付してある。

【００６０】図１３においては、従来のＭＰＥＧデータ
再生装置に評価関数演算部３３、データ蓄積部５０、入
力データ選択部５１、出力データ選択部５２を加えたも
のである。特に、上記構成例では、ＭＰＥＧオーディオ
データの処理のみを独立に考えていたが、図１３におい
ては、画像データと音声データの両方を速度変換する構
成を示している。

【００６１】ここで、評価関数演算はＭＰＥＧオーディ
オ復号化部４３あるいはＭＰＥＧビデオ復号化部４２か
ら種々のパラメータを得て評価関数を演算するものであ
り、データ蓄積部５０はＭＰＥＧデータを蓄積するもの
であり、入力データ選択部５１は評価関数と、所定の法
則に従って、ＭＰＥＧデータ蓄積部５０から入力するＭ
ＰＥＧデータを選択するものであり、出力データ選択部
５２は評価関数と所定の法則に従って出力するデータを
選択するものである。

【００６２】また、ユーザからの再生速度指定は、評価
関数演算部３３に入力され、その再生速度情報が入力デ
ータ選択部５１に通知される。ここで、評価関数のパラ
メータとしては、例えば、再生速度、スケールファク
タ、オーディオフレームカウントなど話速変換用パラメ
ータ、また、音圧、セリフなどの音声から得られる情
報、ビデオフレームカウント、フレームレート、色情
報、離散コサイン変換直流成分、動きベクトル、シーン
チェンジ、字幕などの映像から得られる情報が有効であ
る。回路規模の比較的大きいフレームメモリや画像演算
回路はコスト上昇につながるため、使用を避ける場合に
は、これらの内、ビデオフレームカウント、フレームレ
ート、離散コサイン変換直流成分、動きベクトルなどデ
コードなしに得られる情報を評価関数のパラメータに用
いても良い。また、ＭＰＥＧビデオ復号化部４２にシー
ンチェンジ検出機能があれば、本発明の実施形態におけ
る話速変換機能と組み合わせることで、つまり、シーン
チェンジフレームとスケールファクタと再生速度から評
価関数を演算することで、無音区間のシーンの欠落無し
に話速変換されたダイジェスト映像を出力することが可
能となる。

【００６３】通常の再生時では、ＭＰＥＧデータ蓄積部
５０からは連続的にＭＰＥＧデータが読みだされるが、
例えば、再生速度が上限を超えるデータ転送レートを求
めるような場合は再生が滞ってしまう。そこで、入力デ
ータ選択部５１は、このような場合に評価関数を元にし
て、あらかじめ読み出し不要なＭＰＥＧデータをスキッ
プする。つまり不連続的に読み出しアドレスを決定す
る。具体的には評価関数によって再生されるべきビデオ
フレーム、オーディオフレームを決定し、再生されるべ
きＭＰＥＧデータのアドレスを算出する。ＭＰＥＧデー
タにおいてオーディオを含むパケットあるいはビデオを
含むパケットはパケットヘッダより判定する。ＭＰＥＧ
オーディオについてはフレーム単位でアクセスが可能で
あり、フレームのデータ長はレイヤＩ、ＩＩでは一定で
あるので、容易にアドレスを決定することができる。Ｍ
ＰＥＧビデオについては、複数のフレームをひとまとま
りとしたＧＯＰ単位でアクセスする。

【００６４】ここで、ＭＰＥＧデータは規格上ＭＰＥＧ
オーディオデータはフレーム単位のアクセスが可能であ
るが、ＭＰＥＧビデオデータはフレーム単位ではなく、
複数のフレームをひとまとまりとしたＧＯＰ単位にアク
セス可能である。しかしながら、評価関数によっては出
力不要なフレームがある。そこで、出力データ選択部５
２は、このような場合に、評価関数を元に出力フレーム
を決定する。また、出力するビデオフレームとオーディ
オフレームの同期を調整する。

【００６５】再生速度が高い場合、人間が映像と音声の
同期を敏感に知覚しにくくなるので、厳密な同期が不要
であると考えられる。従って、映像と音声が大局的に同
期が合うように、映像をＧＯＰ単位、音声はオーディオ
フレーム（オーディオフレーム）単位で出力データを選
択する。

【００６６】図１４は、本発明の実施形態をプログラム
で実現する場合に必要とされる装置のハードウェア構成
例を示す図である。ＣＰＵ６１は、バス６０を介して、
ＲＯＭ６２、ＲＡＭ６３、通信インターフェース６４、
記録装置６７、記録媒体読み取り装置６８、入出力装置
７０に接続される。

【００６７】ＲＯＭ６３には、ＢＩＯＳなどが格納さ
れ、ＣＰＵ６１がこれを実行することによって、ＣＰＵ
６１へのユーザの指示が入出力装置７０から入力可能と
したり、ＣＰＵ６１の演算結果をユーザに提示可能とす
る。ここで、入出力装置は、ディスプレイ、マウス、キ
ーボードなどからなる。

【００６８】また、本発明の実施形態にかかる話速変換
処理を伴うＭＰＥＧデータ再生処理を実現するプログラ
ムは、ＲＯＭ６２、ＲＡＭ６３、記録装置６７、可搬記
録媒体６９に格納することが可能である。ＲＯＭ６２、
ＲＡＭ６３に格納された当該プログラムは、ＣＰＵ６１
が直接実行する。記録装置６７や可搬記録媒体６９に記
録された当該プログラムは、記録装置６７からは、バス
６０を介して直接ＲＡＭ６３に展開され、可搬記録媒体
６９からは、記録媒体読み取り装置６８で可搬記録媒体
６９上のプログラムを読みとって、バス６０を介してＲ
ＡＭ６３に展開することによって、ＣＰＵ６１が実行可
能な状態とする。

【００６９】ここで、記録装置６７は、ハードディスク
などであり、可搬記録媒体６９は、ＣＤ−ＲＯＭやフロ
ッピー（登録商標）ディスク、ＤＶＤなどである。ま
た、装置は、通信インターフェース６４を備えてもよ
く、この場合、ネットワーク６５を介して情報提供者６
６のデータベースにアクセスし、当該プログラムをダウ
ンロードして使用することの可能である。あるいは、ネ
ットワーク６５がＬＡＮのように構築されている場合に
は、ネットワーク環境下で当該プログラムを実行するこ
とも可能である。＜付記＞１．オーディオデータを含む圧縮されたマルチメディア
データを再生する装置であって、該オーディオデータの
単位データであるフレームを抽出する抽出手段と、該オ
ーディオデータの該フレームの間引き処理あるいは該フ
レームの繰り返し出力処理を行う変換手段と、該変換手
段から受け取った該オーディオデータの該フレームをデ
コードし、音声を再生する再生手段とを備えた、ことを
特徴とするデータ再生装置。２．オーディオデータを含むマルチメディアデータを再
生する装置であって、該オーディオデータの単位データ
であるフレームを抽出する抽出手段と、該オーディオデ
ータの再生速度を設定する設定手段と、該設定手段によ
って設定された該再生速度に基づいて、該オーディオデ
ータの該フレームの間引き処理あるいは該フレームの繰
り返し出力処理を行う速度変換手段と、該速度変換手段
から受け取った該オーディオデータの該フレームをデコ
ードし、音声を再生する再生手段とを備え、圧縮された
オーディオデータをデコードすることなしに再生速度変
換処理を行うことを特徴とするデータ再生装置。３．前記オーディオデータは、ＭＰＥＧオーディオデー
タであることを特徴とする付記２に記載のデータ再生装
置。４．前記フレームに含まれるスケールファクタを抽出す
るスケールファクタ抽出手段と、該スケールファクタに
対して演算を行う演算手段と、該演算手段の演算結果と
所定の閾値とを比較し、該演算結果が該閾値よりも小さ
い場合には、対応する該フレームを前記再生手段に送ら
ないように制御する制御手段と、を更に備えることを特
徴とする付記３に記載のデータ再生装置。５．前記演算手段は、前記フレームに含まれる複数のス
ケールファクタの和を演算することを特徴とする付記４
に記載のデータ再生装置。６．前記フレームに含まれる複数のスケールファクタの
内、前記再生手段によって再生されるときに、フレーム
間の接続部分に生じる音圧の不連続な変化をうち消すた
めのスケールファクタ修正係数を生成し、該スケールフ
ァクタと該スケールファクタ修正係数を演算して、該再
生手段にデコードすべきデータとして入力するスケール
ファクタ修正手段を更に備えることを特徴とする付記４
に記載のデータ再生装置。７．前記データ再生装置は、画像データとオーディオデ
ータを含むマルチメディアデータを受信し、更に、画像
データとオーディオデータを分離する分離手段と、該画
像データを復号する復号手段と、該画像データを再生す
る画像再生手段とを備えることを特徴とする付記２に記
載のデータ再生装置。８．前記画像データとオーディオデータは、ＭＰＥＧデ
ータとして構成されていることを特徴とする付記７に記
載のデータ再生装置。９．オーディオデータを含むマルチメディアデータを再
生する方法であって、（ａ）該オーディオデータの単位データであるフレーム
を抽出するステップと、（ｂ）該オーディオデータの再生速度を設定するステッ
プと、（ｃ）該ステップ（ｂ）において設定された該再生速度
に基づいて、該オーディオデータの該フレームの間引き
処理あるいは該フレームの繰り返し出力処理を行うステ
ップと、（ｄ）該ステップ（ｃ）の処理後受け取った該オーディ
オデータの該フレームをデコードし、音声を再生するス
テップとを備え、圧縮されたオーディオデータをデコー
ドすることなしに再生速度変換処理を行うことを特徴と
するデータ再生方法。１０．前記オーディオデータは、ＭＰＥＧオーディオデ
ータであることを特徴とする付記９に記載のデータ再生
方法。１１．（ｅ）前記フレームに含まれるスケールファクタ
を抽出するステップと、（ｆ）該スケールファクタに対して演算を行うステップ
と、（ｇ）該ステップ（ｆ）の演算結果と所定の閾値とを比
較し、該演算結果が該閾値よりも小さい場合には、対応
する該フレームに前記ステップ（ｄ）の処理を行わない
ように制御するステップと、を更に備えることを特徴と
する付記１０に記載のデータ再生方法。１２．前記ステップ（ｆ）は、前記フレームに含まれる
複数のスケールファクタの和を演算することを特徴とす
る付記１１に記載のデータ再生方法。１３．（ｈ）前記フレームに含まれる複数のスケールフ
ァクタの内、前記ステップ（ｄ）において再生されると
きに、フレーム間の接続部分に生じる音圧の不連続な変
化をうち消すためのスケールファクタ修正係数を生成
し、該スケールファクタと該スケールファクタ修正係数
を演算した値に基づいて、該ステップ（ｄ）の処理を行
うステップを更に備えることを特徴とする付記１１に記
載のデータ再生方法。１４．前記データ再生方法は、画像データとオーディオ
データを含むマルチメディアデータを処理し、更に、（ｉ）画像データとオーディオデータを分離するステッ
プと、（ｊ）該画像データを復号するステップと、（ｋ）該画像データを再生するステップとを備えること
を特徴とする付記９に記載のデータ再生方法。１５．前記画像データとオーディオデータは、ＭＰＥＧ
データとして構成されていることを特徴とする付記１４
に記載のデータ再生方法。１６．情報装置に、オーディオデータを含むマルチメデ
ィアデータを再生する方法を実行させるプログラムを記
録した記録媒体であって、（ａ）該オーディオデータの単位データであるフレーム
を抽出するステップと、（ｂ）該オーディオデータの再生速度を設定するステッ
プと、（ｃ）該ステップ（ｂ）において設定された該再生速度
に基づいて、該オーディオデータの該フレームの間引き
処理あるいは該フレームの繰り返し出力処理を行うステ
ップと、（ｄ）該ステップ（ｃ）の処理後受け取った該オーディ
オデータの該フレームをデコードし、音声を再生するス
テップとを備え、圧縮されたオーディオデータをデコー
ドすることなしに再生速度変換処理を行うことを特徴と
する方法を実現するプログラムを記録した、情報装置読
み取り可能な記録媒体。１７．前記オーディオデータは、ＭＰＥＧオーディオデ
ータであることを特徴とする付記１６に記載の記録媒
体。１８．（ｅ）前記フレームに含まれるスケールファクタ
を抽出するステップと、（ｆ）該スケールファクタに対して演算を行うステップ
と、（ｇ）該ステップ（ｆ）の演算結果と所定の閾値とを比
較し、該演算結果が該閾値よりも小さい場合には、対応
する該フレームに前記ステップ（ｄ）の処理を行わない
ように制御するステップと、を更に備えることを特徴と
する付記１７に記載の記録媒体。１９．前記ステップ（ｆ）は、前記フレームに含まれる
複数のスケールファクタの和を演算することを特徴とす
る付記１８に記載の記録媒体。２０．（ｈ）前記フレームに含まれる複数のスケールフ
ァクタの内、前記ステップ（ｄ）において再生されると
きに、フレーム間の接続部分に生じる音圧の不連続な変
化をうち消すためのスケールファクタ修正係数を生成
し、該スケールファクタと該スケールファクタ修正係数
を演算した値に基づいて、該ステップ（ｄ）の処理を行
うステップを更に備えることを特徴とする付記１８に記
載の記録媒体。２１．前記データ再生方法は、画像データとオーディオ
データを含むマルチメディアデータを処理し、更に、（ｉ）画像データとオーディオデータを分離するステッ
プと、（ｊ）該画像データを復号するステップと、（ｋ）該画像データを再生するステップとを備えること
を特徴とする付記１６に記載の記録媒体。２２．前記画像データとオーディオデータは、ＭＰＥＧ
データとして構成されていることを特徴とする付記２１
に記載の記録媒体。

【００７０】

【発明の効果】以上説明したように、本発明によれば、
ＭＰＥＧオーディオ規格で定義されるフレーム単位に処
理することでＭＰＥＧデータをデコードせずに話速を変
化させる話速変換する効果を奏し、スケールファクタを
用いることでＭＰＥＧデータをデコードせずに無音区間
を圧縮して話速変換する効果を有する。

【００７１】また、フレーム間の接続部の前後のスケー
ルファクタを変化させることで、フレームの接続部での
聴感上の違和感を低減する効果を奏し、ＭＰＥＧデータ
再生方法及びＭＰＥＧデータ再生装置の性能向上に寄与
するところが大きい。

【図面の簡単な説明】

【図１】同じ音声データをＭＰＥＧオーディオレイヤＩ
Ｉで圧縮したデータのスケールファクタと圧縮しないデ
ータの音圧について比較した図である。

【図２】本発明の話速変換処理の概略フローチャートで
ある。

【図３】本発明の別の話速変換処理の概略フローチャー
トである。

【図４】再生速度変換処理の流れを示す詳細なフローチ
ャートである。

【図５】再生速度変換処理及び無音部分除去処理を含む
処理の流れを示す詳細フローチャートである。

【図６】ノイズ低減処理の流れを示すフローチャートで
ある。

【図７】図６のスケールファクタ修正処理を説明する図
（その１）である。

【図８】図６のスケールファクタ修正処理を説明する図
（その２）である。

【図９】本発明の話速変換を適用したＭＰＥＧオーディ
オデータ再生装置の一構成を示すブロック構成図であ
る。

【図１０】本発明の話速変換を適用したＭＰＥＧデータ
再生装置の別の構成例を示す図である。

【図１１】本発明の別の実施形態を説明する図である。

【図１２】本発明の更に別の実施形態である話速変換を
適用したＭＰＥＧデータ再生装置の一構成例を示す図で
ある。

【図１３】本発明の更に別の実施形態であり、ＭＰＥＧ
データ再生装置を示す図である。

【図１４】本発明の実施形態をプログラムで実現する場
合に必要とされる装置のハードウェア構成例を示す図で
ある。

【図１５】ＭＰＥＧオーディオデータのフォーマットを
示す図（その１）である。

【図１６】ＭＰＥＧオーディオデータのフォーマットを
示す図（その２）である。

【図１７】従来のＭＰＥＧオーディオ再生装置の基本的
構成を示す図である。

【符号の説明】

１０、２０ＭＰＥＧオーディオ入力部１１、２６、４３ＭＰＥＧオーディオ復号化部１２、２７、４５オーディオ出力部２１フレーム抽出部２２スケールファクタ抽出部２３、３４速度変換部（話速変換処理部）２４、３３評価関数演算部２５、３５スケールファクタ修正部４０ＭＰＥＧデータ入力部４１ＭＰＥＧデータ分離部４２ＭＰＥＧビデオ復号化部４４ビデオ出力部５０ＭＰＥＧデータ蓄積部５１入力データ選択部５２出力データ選択部

フロントページの続き (72)発明者肥塚哲雄神奈川県川崎市中原区上小田中４丁目１番１号富士通株式会社内Ｆターム(参考） 5D044 AB05 DE03 DE14 FG23 GK02 GK08 5D045 DA00

Claims

【特許請求の範囲】

【請求項１】オーディオデータを含む圧縮されたマルチ
メディアデータを再生する装置であって、該オーディオデータの単位データであるフレームを抽出
する抽出手段と、該オーディオデータの該フレームの間引き処理あるいは
該フレームの繰り返し出力処理を行う変換手段と、該変換手段から受け取った該オーディオデータの該フレ
ームをデコードし、音声を再生する再生手段とを備え
た、ことを特徴とするデータ再生装置。
【請求項２】オーディオデータを含むマルチメディアデ
ータを再生する装置であって、該オーディオデータの単位データであるフレームを抽出
する抽出手段と、該オーディオデータの再生速度を設定する設定手段と、該設定手段によって設定された該再生速度に基づいて、
該オーディオデータの該フレームの間引き処理あるいは
該フレームの繰り返し出力処理を行う速度変換手段と、該速度変換手段から受け取った該オーディオデータの該
フレームをデコードし、音声を再生する再生手段とを備
え、圧縮されたオーディオデータをデコードすることなしに
再生速度変換処理を行うことを特徴とするデータ再生装
置。
【請求項３】前記フレームに含まれるスケールファクタ
を抽出するスケールファクタ抽出手段と、該スケールファクタに対して演算を行う演算手段と、該演算手段の演算結果と所定の閾値とを比較し、該演算
結果が該閾値よりも小さい場合には、対応する該フレー
ムを前記再生手段に送らないように制御する制御手段
と、を更に備えることを特徴とする請求項２に記載のデ
ータ再生装置。
【請求項４】オーディオデータを含むマルチメディアデ
ータを再生する方法であって、（ａ）該オーディオデータの単位データであるフレーム
を抽出するステップと、（ｂ）該オーディオデータの再生速度を設定するステッ
プと、（ｃ）該ステップ（ｂ）において設定された該再生速度
に基づいて、該オーディオデータの該フレームの間引き
処理あるいは該フレームの繰り返し出力処理を行うステ
ップと、（ｄ）該ステップ（ｃ）の処理後受け取った該オーディ
オデータの該フレームをデコードし、音声を再生するス
テップとを備え、圧縮されたオーディオデータをデコードすることなしに
再生速度変換処理を行うことを特徴とするデータ再生方
法。
【請求項５】情報装置に、オーディオデータを含むマル
チメディアデータを再生する方法を実行させるプログラ
ムを記録した記録媒体であって、（ａ）該オーディオデータの単位データであるフレーム
を抽出するステップと、（ｂ）該オーディオデータの再生速度を設定するステッ
プと、（ｃ）該ステップ（ｂ）において設定された該再生速度
に基づいて、該オーディオデータの該フレームの間引き
処理あるいは該フレームの繰り返し出力処理を行うステ
ップと、（ｄ）該ステップ（ｃ）の処理後受け取った該オーディ
オデータの該フレームをデコードし、音声を再生するス
テップとを備え、圧縮されたオーディオデータをデコードすることなしに
再生速度変換処理を行うことを特徴とする方法を実現す
るプログラムを記録した、情報装置読み取り可能な記録
媒体。