JP5093648B2 - 再生装置 - Google Patents
再生装置 Download PDFInfo
- Publication number
- JP5093648B2 JP5093648B2 JP2007122542A JP2007122542A JP5093648B2 JP 5093648 B2 JP5093648 B2 JP 5093648B2 JP 2007122542 A JP2007122542 A JP 2007122542A JP 2007122542 A JP2007122542 A JP 2007122542A JP 5093648 B2 JP5093648 B2 JP 5093648B2
- Authority
- JP
- Japan
- Prior art keywords
- reproduction
- plan
- playback
- speed
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/78—Television signal recording using magnetic recording
- H04N5/782—Television signal recording using magnetic recording on tape
- H04N5/783—Adaptations for reproducing at a rate different from the recording rate
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/806—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
- H04N9/8063—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Television Signal Processing For Recording (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
Description
また、例えば、3倍速再生などの高速度再生の時間を、10秒以上持続させると、ほとんどの場合聞き取れなくなってしまうが、0.5秒程度の短時間にすれば、多くの場合聞き落としはないということも分かっている。
また、時間軸変換技術を前提として、文頭ではゆっくり再生し、文末では速めに再生することで、文頭と文末とで再生速度が同一の場合と比較して、同じ再生時間であっても、より聞き取りやすく再生する再生プランを決定する方法が提案されている(例えば、特許文献5参照)。
また、特許文献5では、早送り再生を含んだ状況での再生プランの決定については述べられていないため、ユーザにより早送り再生が指示された際に、再生データの再生速度の変化を人間の特性に基づいて最適に調整するための再生プランを決定することはできない。
再生データの再生時に、当該再生データの記録時の速度とは異なる速度で再生を行う再生装置において、
前記再生データを記憶する記憶手段と、
ユーザによる前記再生装置の操作によって指示された前記再生データの記録時の速度とは異なる再生速度V1に応じた、現時点t0における第1次再生プランP1による再生位置P1(t0)(=P1(t0−1)+(FS/FP)V1)及び未来における第1次再生プランP1による再生位置P1(t0+j)(j=1,2,…,LJ−1)を作成する第1次再生プラン作成手段(FSは再生データを構成する音声データのサンプリング周波数、FPは時間軸を離散化するサンプリング周波数、LJは再生位置のサンプル数)と、
前記第1次再生プラン作成手段により作成された第1次再生プランを基に、最適化問題を解くことによって、修正量dj(j=0,1,…,LJ−1)を求め、現時点から未来に亘る第1次再生プランP1による再生位置P1(t0+j)(j=0,1,…,LS−1)と、前記修正量dj(j=0,1,…,LS−1)と、に基づいて、当該第1次再生プランを修正した現時点から未来に亘る第2次再生プランP2による再生位置P2(t0+j)(j=0,1,…,LS−1)を作成する第2次再生プラン作成手段(LSは修正量のサンプル数)と、
を備え、ユーザにとって視聴しやすい状態で再生データの可変速再生を行うことを特徴とする。
請求項1に記載の再生装置において、
前記記憶手段に記憶された再生データの再生速度V1を指示するための指示手段と、
前記第2次再生プラン作成手段により作成された第2次再生プランに従って、前記記憶手段から再生データを取得する取得手段と、
前記取得手段により取得された再生データを所定の出力装置に出力させる出力制御手段と、を備え、
前記第1次再生プラン作成手段は、前記指示手段により指示された再生速度V1に応じた、現時点から未来に亘る第1次再生プランを作成し、
前記最適化問題は、目的関数として、所定の値を最小又は最大にするために、制約条件として、前記第2次再生プランによる再生位置、再生速度及び再生加速度のうちの少なくとも1つの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まるように、線形計画問題として線形計画法を用いて解くものであり、
前記所定の値は、前記第1次再生プランと前記第2次再生プランとの差を含むことを特徴とする。
再生データの再生時に、当該再生データの記録時の速度とは異なる速度で再生を行う再生装置において、
前記再生データを記憶する記憶手段と、
前記記憶手段に記憶された再生データの再生速度V1を指示するための指示手段と、
前記指示手段により指示された再生速度V1に応じた、現時点t0における第1次再生プランP1による再生位置P1(t0)(=P1(t0−1)+(FS/FP)V1)及び未来における第1次再生プランP1による再生位置P1(t0+j)(j=1,2,…,LJ−1)を作成する第1次再生プラン作成手段(FSは再生データを構成する音声データのサンプリング周波数、FPは時間軸を離散化するサンプリング周波数、LJは再生位置のサンプル数)と、
前記第1次再生プラン作成手段により作成された第1次再生プランを基に、最適化問題を解くことによって、修正量dj(j=0,1,…,LJ−1)を求め、現時点から未来に亘る第1次再生プランP1による再生位置P1(t0+j)(j=0,1,…,LS−1)と、前記修正量dj(j=0,1,…,LS−1)と、に基づいて、当該第1次再生プランを修正した現時点から未来に亘る第2次再生プランP2による再生位置P2(t0+j)(j=0,1,…,LS−1)を作成する第2次再生プラン作成手段(LSは修正量のサンプル数)と、
前記第2次再生プラン作成手段により作成された第2次再生プランに従って、前記記憶手段から再生データを取得する取得手段と、
前記取得手段により取得された再生データを所定の出力装置に出力させる出力制御手段と、を備え、
前記最適化問題は、目的関数として、所定の値を最小又は最大にするために、制約条件として、前記第2次再生プランによる再生位置、再生速度及び再生加速度のうちの少なくとも1つを元にした線形関数又は非線形関数を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まるように、非線形計画問題として非線形計画法を用いて解くものであり、
前記所定の値は、前記第1次再生プランと前記第2次再生プランとの差を線形関数又は非線形関数で含むことを特徴とする。
再生データの再生時に、当該再生データの記録時の速度とは異なる速度で再生を行う再生装置において、
前記再生データを記憶する記憶手段と、
前記記憶手段に記憶された再生データの再生速度V1を指示するための指示手段と、
前記指示手段により指示された再生速度V1に応じた、現時点t0における第1次再生プランP1による再生位置P1(t0)(=P1(t0−1)+(FS/FP)V1)及び未来における第1次再生プランP1による再生位置P1(t0+j)(j=1,2,…,LJ−1)を作成する第1次再生プラン作成手段(FSは再生データを構成する音声データのサンプリング周波数、FPは時間軸を離散化するサンプリング周波数、LJは再生位置のサンプル数)と、
前記第1次再生プラン作成手段により作成された第1次再生プランを基に、修正量dj(j=0,1,…,LJ−1)を求め、現時点から未来に亘る第1次再生プランP1による再生位置P1(t0+j)(j=0,1,…,LS−1)と、前記修正量dj(j=0,1,…,LS−1)と、に基づいて、当該第1次再生プランを修正した現時点から未来に亘る第2次再生プランP2による再生位置P2(t0+j)(j=0,1,…,LS−1)を作成する第2次再生プラン作成手段(LSは修正量のサンプル数)と、
前記第2次再生プラン作成手段により作成された第2次再生プランに従って、前記記憶手段から再生データを取得する取得手段と、
前記取得手段により取得された再生データを所定の出力装置に出力させる出力制御手段と、を備え、
前記第2次再生プラン作成手段は、前記第2次再生プランによる再生位置、再生速度及び再生加速度のうちの少なくとも1つの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まるという制約条件を満たすとともに、所定の値を最小又は最大にし、且つ、再生加速度が所定の範囲内にあるとともに、再生加速度が予め設定された時区間では一定である第2次再生プランを作成し、
前記所定の値は、前記第1次再生プランと前記第2次再生プランとの差を含むことを特徴とする。
請求項2〜4の何れか一項に記載の再生装置において、
前記記憶手段に記憶された再生データは、少なくとも音声データにより構成されており、
前記第1次再生プラン作成手段により作成された第1次再生プランと、前記第2次再生プラン作成手段により作成された第2次再生プランと、の差が予め設定された規定範囲内にあるか否かを判断する判断手段と、
前記判断手段によって前記第1次再生プラン作成手段により作成された第1次再生プランと前記第2次再生プラン作成手段により作成された第2次再生プランとの差が予め設定された規定範囲内にないと判断された場合、又は、前記第2次再生プラン作成手段により前記制約条件を満たす第2次再生プランが作成されなかった場合に、前記出力装置から出力される再生データに基づく音声の音量を予め設定された音量まで小さくなるように調整する音量調整手段と、
を備えることを特徴とする。
請求項2〜5の何れか一項に記載の再生装置において、
前記所定の値は、前記第2次再生プランによる再生加速度の大きさを含むことを特徴とする。
請求項2〜6の何れか一項に記載の再生装置において、
前記記憶手段に記憶された再生データは、少なくとも音声データにより構成されており、
前記取得手段により取得された再生データが、無音区間内の再生データであるか否かを判定する無音区間判定手段を備え、
前記第2次再生プラン作成手段は、前記無音区間判定手段によって前記取得手段により取得された再生データが無音区間内の再生データであると判定された場合は、前記第1次再生プラン作成手段により作成された第1次再生プランを基に、前記制約条件よりも制約が緩和された条件内で第2次再生プランを作成することを特徴とする。
請求項2〜7の何れか一項に記載の再生装置において、
前記記憶手段に記憶された再生データは、少なくとも音声データにより構成されており、
前記取得手段により取得された再生データが、音声区間内の再生データであるか否かを判定する音声区間判定手段を備え、
前記第2次再生プラン作成手段は、前記音声区間判定手段によって前記取得手段により取得された再生データが音声区間内の再生データでないと判定された場合は、前記第1次再生プラン作成手段により作成された第1次再生プランを基に、前記制約条件よりも制約が緩和された条件内で第2次再生プランを作成することを特徴とする。
請求項2〜8の何れか一項に記載の再生装置において、
前記記憶手段に記憶された再生データは、少なくとも音声データにより構成されており、
前記取得手段により取得された再生データに基づく音声の話速を推定する話速推定手段を備え、
前記第2次再生プラン作成手段は、前記話速推定手段により推定された話速に応じて前記制約条件を変化させることを特徴とする。
請求項2〜9の何れか一項に記載の再生装置において、
前記記憶手段に記憶された再生データは、音声データ及び映像データにより構成されており、
前記所定の値は、前記第2次再生プランによる音声データの再生位置と、当該第2次再生プランによる映像データの再生位置と、の差を含むことを特徴とする。
音声データにより構成される再生データの再生時に、当該再生データの記録時の速度とは異なる速度で再生を行う再生装置において、
前記再生データを記憶する記憶手段と、
前記記憶手段に記憶された再生データの再生速度V1を指示するための指示手段と、
前記指示手段により指示された再生速度V1に応じた、現時点t0における第1次再生プランP1による再生位置P1(t0)(=P1(t0−1)+(FS/FP)V1)及び未来における第1次再生プランP1による再生位置P1(t0+j)(j=1,2,…,LJ−1)を作成する第1次再生プラン作成手段(FSは再生データを構成する音声データのサンプリング周波数、FPは時間軸を離散化するサンプリング周波数、LJは再生位置のサンプル数)と、
前記第1次再生プラン作成手段により作成された第1次再生プランを基に、最適化問題を解くことによって、修正量dj(j=0,1,…,LJ−1)を求め、現時点から未来に亘る第1次再生プランP1による再生位置P1(t0+j)(j=0,1,…,LS−1)と、前記修正量dj(j=0,1,…,LS−1)と、に基づいて、当該第1次再生プランを修正した現時点から未来に亘る第2次再生プランP2による再生位置P2(t0+j)(j=0,1,…,LS−1)を作成する第2次再生プラン作成手段(LSは修正量のサンプル数)と、
前記第2次再生プラン作成手段により作成された第2次再生プランに従って、前記記憶手段から再生データを取得する取得手段と、
前記取得手段により取得された再生データの波形の一致度を考慮して、当該再生データの時間軸を変換する時間軸変換手段と、
前記時間軸変換手段により時間軸が変換された再生データを所定の出力装置に出力させる出力制御手段と、を備え、
前記最適化問題は、目的関数として、前記第1次再生プランと前記第2次再生プランとの差と、前記第2次再生プランによる再生加速度の大きさと、の和を最小にするために、制約条件として、前記第2次再生プランによる再生位置の線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面内にある判別可能条件を示す予め設定された領域の内部に収まるように、線形計画問題として線形計画法を用いて解くものであることを特徴とする。
したがって、再生データの再生速度の変化を、ユーザが指示する再生速度との差を最小にし、且つ、判別可能条件の内部に収まるという制約条件を満たすように調整できるため、ユーザにとって視聴しやすい状態で再生データの可変速再生を行うことができる。
本発明にかかる再生装置1の構成など(実施例)を説明する前に、まず、人間の特性を知るために行った基礎的実験の概要について説明する。
そこで、人間の特性を知るために、被験者に対して任意の速度変化で話速を変化させた音声を提示できる実験装置1000を作成し、以下の実験を行った。
例えば、図1に示すように、操作者は、モニタ3000の画面を見ながら、スライド型可変抵抗器2000を操作するようになっており、被験者は、ヘッドホン5000から出力される音声を聞きながら、スイッチ6000を操作するようになっている。
また、実験装置1000は、例えば、図1に示すように、実験結果解析用計算機9000と接続されており、実験装置1000により得られた実験結果は、実験結果解析用計算機9000において解析されるようになっている。
具体的には、操作者は、例えば、音声データの再生プランの軌跡がマクロ速度−加速度平面(後述)をまんべんなくうめつくすように、モニタ3000に表示されるマクロ速度−加速度平面図を見ながら、スライド型可変抵抗器2000を操作する。
具体的には、デジタル信号処理装置4000は、例えば、図1に示すように、記憶媒体4100と、読取部4200と、デコーダ4300と、時間軸変換部4400と、制御部4500と、実験結果記録用メモリ4600と、などを備えて構成される。
記憶部4530は、例えば、図1に示すように、再生速度決定プログラム4531と、読取位置決定プログラム4532と、マクロ速度/加速度算出プログラム4533と、マクロ速度/加速度グラフ化プログラム4534と、音声強度算出プログラム4535と、などを記憶している。
次いで、CPU4510は、例えば、読取位置決定プログラム4532を実行して、当該決定された再生速度V(t)に基づいて、記憶媒体4100に記憶された音声データの読取位置を決定する。
次いで、読取部4200は、制御部4500から入力される制御信号に従って、例えば、記憶媒体4100に記憶された音声データのうちの当該決定された読取位置にある音声データを取得して、デコーダ4300に出力する。
次いで、デコーダ4300は、制御部4500から入力される制御信号に従って、例えば、読取部4200から入力された音声データにデコード等の所定の処理を施して、時間軸変換部4400及び制御部4500に出力する。
次いで、時間軸変換部4400は、制御部4500から入力される制御信号に従って、例えば、異音を発生させることなく、ピッチを変えずに話速のみを変化させる既存の時間軸変換技術(例えば、TSMなど)を用いて、デコーダ4300から入力された音声データの時間軸を変換して、図示しないアンプを介して、ヘッドホン5000に出力する。
これにより、ヘッドホン5000から音声データに基づく音声が出力されることになる。
次いで、CPU4510は、例えば、マクロ速度/加速度グラフ化プログラム4534を実行して、当該算出されたマクロ速度及びマクロ加速度をグラフ化することによって、操作者から指示された再生プラン(再生速度変化)の軌跡が描かれたマクロ速度−加速度平面図を作成し、そのマクロ速度−加速度平面図をモニタ3000に表示させる。
また、CPU4510は、例えば、音声強度算出プログラム4535を実行して、デコーダ4300から入力された音声データに基づいて音声強度P(t)を算出する。
具体的には、被験者は、例えば、ヘッドホン5000から出力される音声を聞き取り、語句が聞き取れない時区間の間はスイッチ6000を「ON」にし、語句が聞き取れる時区間の間はスイッチ6000を「OFF」にする。
具体的には、再生速度V(t)の表現の仕方としては、例えば、時刻tにおいて、標準速の場合をV(t)=1.0、2倍速の場合をV(t)=2.0、などとすることにする。
また、スイッチ6000の状態Z(t)の表現の仕方としては、例えば、時刻tにおいて、スイッチ6000が「ON」である場合をZ(t)=1、スイッチ6000が「OFF」である場合をZ(t)=0、とすることにする。
例えば、「再生速度が2.2倍速よりも小さいと聞き取れる」という単純な条件であれば、所望の条件は、V(t)<2.2となる。
しかしながら、例えば、V(t)=1.0からゆっくり時間をかけて速度を上昇させてV(t)=2.2にする場合は、語句を十分に聞き取れることが多いのに対し、V(t)=1.0から一瞬にして速度を上昇させてV(t)=2.2にする場合は、人間の脳が速度変化に対応し切れずに、変化直後の数秒間は語句の聞き落としが生じてしまうことが多い。
さらに、例えば、0.02秒間はV(t)=10にして、直ぐにV(t)=1.0に戻す場合は、高速度再生の期間がほんの一瞬であるため、語句の聞き取りに何の問題も生じないことが多い。
そこで、人間が語句を聞き取るための条件は、本質的に2つの指標に関する条件から成り立っていると考えることにする。
第1の指標を、瞬間的な再生速度とせずに、マクロ速度VM(t)としたのは、音韻を識別していく場合、ある決まった長さの音声波形が必要であるし、また、音声を語句として識別していく場合、脳の処理速度に限界があるため、単位時間あたりの処理可能な語句の数に制限がありそうだからである。
第2の指標として、マクロ加速度AM(t)を挙げたのは、上述のように、同じ話速であっても、ゆっくりと速度を変化させたときと、一瞬にして速度を変化させたときとでは、語句の聞き取りに差が出るため、加速度的な指標が必要であると考えたからである。
再生する音声データ(音声波形データ)が、例えば、図2(a)に示すものであるとすると、マクロ加速度AM(t)は、例えば、図2(c)に示すように、加速度を評価する2つの時区間(例えば、現時点から過去LB秒に亘る時区間と、過去LB秒から過去LB+LC秒に亘る時区間)を決めて、現時点から過去LB秒に亘る時区間における平均再生速度と、過去LB秒から過去LB+LC秒に亘る時区間における平均再生速度との差を、両時区間の中心間の時間差(すなわち、現時点から過去LB秒に亘る時区間の中央から過去LB秒から過去LB+LC秒に亘る時区間の中央までの時間)で除算したものとして、すなわち、以下の式(4)のように定義する。
そこで、マクロ速度VM(t)を横軸にとり、マクロ加速度AM(t)を縦軸にとった2次元平面としてマクロ速度−加速度平面を考え、人間が語句を聞き取り可能な条件(判別可能条件)は、このマクロ速度−加速度平面内にある特定領域の内部であると考えることにする。
そこで、マクロ速度−加速度平面における判別可能条件を満たす領域と判別可能条件を満たさない領域とを、より高い分離度で分離できるパラメータLA、LB、LCの組を探索するために、実験を行った。
図3(a)及び図4(a)は、再生時間8分40秒分の再生プランの全軌跡を示し、図3(b)及び図4(b)は、再生時間8分40秒分の再生プランの全軌跡のうちの、被験者が語句を聞き取ることができなかった時区間の軌跡(Z(t)=1に対応する軌跡)のみを抜き出したものを示す。
具体的には、図5は、適切なパラメータLA、LB、LCの組(具体的には、LA=0.5秒、LB=0.25秒、LC=1.08秒)を選択した場合の、マクロ速度−加速度平面における聞き取れる割合(Z(t)=1とZ(t)=0の割合)を図式化したものである。灰色の濃さが濃いほど聞き取れる割合が高いことを示し、灰色の濃さが薄いほど聞き取れる割合が低いことを示し、白色は誰も聞き取ることができなかったことを示す。なお、背景の斜線領域は、再生プランの軌跡が通過しなかった領域である。
具体的には、例えば、図6に示した折れ線は、折れ線を構成する4本の直線の組み合わせのうち、領域を最適に分割するものを探索するプログラムを作成して求めたものである。このときの最適性の基準は、以下の式(11)で示される分割の評価関数EDを最小化することとした。
そこで、パラメータLA、LB、LCの組の組み合わせを変えて、分割の評価関数EDの変化を調べる実験を行った。
また、被験者がスイッチ6000をON/OFFする反応時間についても、所定の方法で補正してある。
しかしながら、ある一定幅の時区間での再生速度を式(3)や式(6)のように加重平均して(線形和をとって)、2つ以上のマクロ指標(例えば、マクロ速度VM(t)とマクロ加速度AM(t))を生成し、このマクロ指標に対する不等式(例えば、図6のマクロ速度−加速度平面に示した折れ線の内側)によって聞き取りの可否を判定する点、すなわち、一定時区間での再生速度の線形結合を2つ以上生成し、これらの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面(例えば、マクロ速度−加速度平面)内にある判別可能条件を示す予め設定された領域S0の内部に収まるか否かによって聞き取りの可否を判定する点、は普遍であり、これが本発明での本質である。
次に、基礎的実験の概要において定義したマクロ速度及びマクロ加速度を定式化する手法について説明する。
これに対し、第1次再生プランP1を人間の特性に応じて修正した時間進行を第2次再生プランP2とし、時刻tにおける第2次再生プランP2による再生位置をP2(t)とする。
なお、サンプリング周波数FPの値は任意であるが(好ましくは、数Hz〜100Hz程度)、再生データが音声データ及び映像データにより構成される場合は、サンプリング周波数FPを映像のフレーム周波数(例えば、30Hzや60Hzなど)と一致させておくと実装が容易になる。
次に、定式化したマクロ速度VM(t)及びマクロ加速度AM(t)を、線形計画法に帰着させる手法について説明する。
判別可能条件を満たす領域S0は、折れ線で囲まれた凸領域であり、その折れ線は、K本の直線で構成されているとする。このとき、マクロ速度VM(t)とマクロ加速度AM(t)を持つ再生プランの時刻tの瞬間が、S0に含まれる条件は、VM(t)とAM(t)に関する線形条件として、以下の式(24)のようにK個の不等式で書き表すことができる。ここで、式(24)のCVk、CAk、CCkは、折れ線を構成する各直線の位置や傾きによって決まるパラメータである。
このような障害が起こらないようにするために、現時点の時刻t0での第2次再生プランP2の決定において、未来の数秒間(例えば、LJサンプル分の時区間)で式(24)が成立するように、時刻t0の時点で制約してやる必要がある。
そのためには、まず、未来の第1次再生プランP1を予測しなければならない。
操作者から指示される再生速度の予測の仕方については、任意であるが、例えば、操作者による現操作が継続される(例えば、「早送りボタン」が押されているなら押し続けられる)と仮定して決めてもよいし、スライド型可変抵抗器2000のように自由に再生速度を設定できる操作器が操作されている場合は、その速度変化が一定である(例えば、加速が続いているならば同じ加速度で加速する)と仮定して決めてもよい。また、操作者が断続的に「早送りボタン」を押しているならば、今回の「早送りボタン」の押下時間も、前回の「早送りボタン」の押下時間とほぼ同一であると仮定して決めてもよい。また、「早送りボタン」の他に、例えば、10倍速での5秒飛ばしを指示するための「5秒飛ばしボタン」や、10倍速での15秒飛ばしを指示するための「15秒飛ばしボタン」が設けられた操作器が操作されている場合は、「5秒飛ばしボタン」が押されたならば、直後の0.5秒間は10倍速になり、「15秒飛ばしボタン」が押されたならば、直後の1.5秒間は10倍速になって、その後は標準速に戻ると予測できる。
このように取り決めると、式(26)及び式(27)は、それぞれ以下の式(28)及び式(29)のように書き直すことができる。
なお、制約条件を再生位置(P1(t)若しくはP2(t))で書き表したが、第2次再生プランP2による再生速度V2(t)は、V2(t)=(FP/FS)(P2(t)−P2(t−1))で再生位置と関係付けられており、第2次再生プランP2による再生加速度A2(t)は、A2(t)=FP(V2(t)−V2(t−1))で再生速度と関係付けられているので、制約条件を、再生位置で書き表す代わりに、再生速度や再生加速度で書き表しても本質的には同じことである。したがって、制約条件は、第2次再生プランP2による再生位置P2(t0+j)、再生速度V2(t0+j)及び再生加速度A2(t0+j)のうちの少なくとも1つの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まる条件であれば任意である。
ちなみに、式(34)で定義した目的関数は、第1次再生プランP1に対する第2次再生プランP2の遅れ時間の単なる総和として定義しているが、場合によっては、これを重み付け総和としてもよい。
次に、線形計画問題LP1(t0,LJ)を改良する手法について説明する。
そこで、第2次再生プランP2による再生加速度の大きさ、すなわち、速度の加速/減速の度合いを目的関数に加味することにする。
具体的には、例えば、加速と減速を別々の正の変数として記述しておき、加減速の変動をそれらの和として書き表すことにする。
なお、制約条件を再生位置(P1(t)若しくはP2(t))で書き表したが、第2次再生プランP2による再生速度V2(t)は、V2(t)=(FP/FS)(P2(t)−P2(t−1))で再生位置と関係付けられており、第2次再生プランP2による再生加速度A2(t)は、A2(t)=FP(V2(t)−V2(t−1))で再生速度と関係付けられているので、制約条件を、再生位置で書き表す代わりに、再生速度や再生加速度で書き表しても本質的には同じことである。したがって、制約条件は、第2次再生プランP2による再生位置P2(t0+j)、再生速度V2(t0+j)及び再生加速度A2(t0+j)のうちの少なくとも1つの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まる条件であれば任意である。
なお、線形計画問題LP1(t0,LJ)又は改良型の線形計画問題LP2(t0,LJ)は、現時点から未来に亘る時区間(時刻t0から始まるLJサンプル分の時区間)における第2次再生プランP2を求める方法にすぎない。再生データ全体を再生するためには、この方法を繰り返し適用していく必要がある。
[再生装置の構成]
本発明の再生装置1は、例えば、音声データにより構成される再生データの再生時に、当該再生データの記録時の速度とは異なる速度で再生を行う、CD(Compact Disc)プレーヤや、DVD(Digital Versatile Disc)プレーヤ、ハードディスクプレーヤ、パーソナルコンピュータなどである。
そして、再生装置1は、当該作成した第1次再生プランP1と予め決定しておいた人間の特性に関するパラメータを基に、最適化問題を線形計画問題(線形計画問題LP1(t0,LJ)又は改良型の線形計画問題LP2(t0,LJ))として線形計画法を用いて解くことによって、現時点から未来に亘る第2次再生プランP2を作成する。
そして、再生装置1は、当該作成した第2次再生プランP2に従って、記憶媒体11に記憶されている再生データを順次取得して、その再生データの断片を時間軸変換技術により滑らかにつないで、音声出力装置3から出力するようになっている。
また、再生装置1は、例えば、図9に示すように、時間軸変換部14を介して、所定の出力装置としての音声出力装置3を接続している。
なお、記憶媒体11は、例えば、CDや、DVD、HDD(Hard Disk Drive)、半導体メモリ、メモリカードなどの、データの読み取りが可能な記憶媒体であれば任意である。
CPU161は、かかる第1次再生プラン作成プログラム163b1を実行することによって、第1次再生プラン作成手段として機能する。
CPU161は、かかる第2次再生プラン作成プログラム163b2を実行することによって、第2次再生プラン作成手段及び判断手段として機能する。
具体的には、CPU161は、例えば、読取部12に制御信号を入力して、第2次再生プラン作成プログラム163b2を実行したCPU161により作成された第2次再生プランP2に従って、記憶媒体11から再生データを取得させ、そして、デコーダ13や時間軸変換部14に制御信号を入力して、読取部12により取得された再生データを音声出力装置3に出力させる。
CPU161は、かかる再生制御プログラム163b3を実行することによって、出力制御手段として機能する。
次に、再生装置1による記憶媒体11に記憶された再生データの再生に関する処理について、図10のフローチャートを参照して説明する。
具体的には、CPU171は、読取部11に、記憶媒体11に記憶された再生データのうちの時間座標P2(t0)の部分を取得させ、当該取得された再生データを、デコーダ13や時間軸変換部14を介して、音声出力装置3に出力させる。これにより、音声出力装置3から再生データに基づく音声が出力される。
そして、CPU161は、ステップS3〜ステップS14の処理を、例えば、ユーザによる操作部15の操作によって再生データの再生を終了するよう指示されるまで、或いは、記憶媒体11に記憶された再生データを再生し尽すまで、繰り返して行う。
そして、再生装置1は、第1次再生プラン蓄積ファイル163a2に蓄積されている第1次再生プランP1による再生位置P1(t)のうちの、過去におけるLMサンプル分の再生位置と、未来におけるLJサンプル分の再生位置と、を使って、線形計画問題LP1(t0,LJ)又は改良型の線形計画問題LP2(t0,LJ)を、線形計画法を用いてt0から始まるLJサンプル分について解くことによって、LJ個の修正量dj(j=0,1,…,LJ−1)を得る。
そして、再生装置1は、得られた修正量dj(j=0,1,…,LJ−1)のうちの最初のLS個を使って、第2次再生プランP2による再生位置P2(t0+j)(j=0,1,…,LS−1)を作成し、第2次再生プラン蓄積ファイル163a3に記憶させる。すなわち、線形計画問題は、サンプリング周波数FPにおける、LSサンプル分の時区間毎に解かれるようになっている。
そして、時刻t=t0+LSになると、新たな線形計画問題が生成されて、それが解かれることになる。
ここで、LJサンプル分の時区間は、例えば、1秒〜2秒程度の時区間であり、LSサンプル分の時区間は、LJサンプル分の時区間よりも短く、例えば、0.5秒〜1秒程度の時区間である。
また、第1次再生プランP1による再生位置P1(t0)と第2次再生プランP2による再生位置P2(t0)との差(P1(t0)−P2(t0))が、予め設定された規定範囲内に収まらない場合は、ユーザに対する「語句の聞き取り」を確保したままでは、ユーザにより指示された再生速度に応じた再生位置と、実際の再生位置と、の差が大きすぎるため、P2(t0)をP1(t0)で置き換えて、この差を一気に取り戻すようにしたが(具体的には、例えば、図10のステップS10参照)、これに限ることはなく、例えば、所定の速度(例えば、8倍速など)で高速度再生することによって、この差を縮めるようにしてもよい。
図12と図13は、異なる2種類の判別可能条件を満たす領域S0について、改良型の線形計画問題LP2(t0,LJ)で再生装置1の再生処理(図10)を行った結果である。パラメータは、LJ=90(1.5秒相当)、LS=30(0.5秒相当)、α=β=0.011に設定した。
図12(a)には、1倍速〜4倍速の変速を含む3分間の第1次再生プランP1の軌跡を示し、図12(b)には、図12(a)の第1次再生プランP1を基に、判別可能条件を満たす領域S0内に収まるように、改良型の線形計画問題LP2(t0,LJ)を順次適用していくことで作成した第2次再生プランP2の軌跡を示す。
図12(a)によれば、判別可能条件を満たす領域S0から逸脱している軌跡が多く含まれるため、聞き落としが多く発生すると推測される。
これに対し、図12(b)によれば、判別可能条件を満たす領域S0内に全ての軌跡が収まっているため、ほぼ聞き落としがないと期待できる。
図13(a)は、図12(a)と同一の軌跡であり、図13(b)には、図13(a)の第1次再生プランP1を基に、判別可能条件を満たす領域S0内に収まるように、改良型の線形計画問題LP2(t0,LJ)を順次適用していくことで作成した第2次再生プランP2の軌跡を示す。
図13(a)によれば、図12(a)と同様、判別可能条件を満たす領域S0から逸脱している軌跡が多く含まれるため、聞き落としが多く発生すると推測される。
これに対し、図13(b)によれば、図12(b)と同様、判別可能条件を満たす領域S0内に全ての軌跡が収まっているため、ほぼ聞き落としがないと期待できる。
また、折れ線で定義される判別可能条件を満たす領域S0の形状が変わっても、第2次再生プランP2の軌跡は、判別可能条件を満たす領域S0内に完全に収まっていることが分かる。
図14(a)によれば、高速度再生の開始時には、再生速度が急激に変化していることがわかる。
これに対し、図14(b)によれば、図14(a)と比較して、高速度再生の開始時(特に、14秒付近)における再生速度の急激な変化が抑えられており、第2次再生プランP2は、第1次再生プランP1と比較して、再生速度の変化が緩やかであることが分かる。
また、図14(c)によれば、図14(b)よりもマクロ加速度AM(t)の条件が厳しいため、図14(b)と比較して、高速度再生の開始時における再生速度の急激な変化がさらに抑えられており、図14(c)の第2次再生プランP2は、図14(b)の第2次再生プランP2と比較して、より一層、再生速度の変化が緩やかであることが分かる。
すなわち、図14(b)及び図14(c)によれば、折れ線の形状をコントロールすることにより、作成される第2次再生プランP2の性質が変わることが分かる。
したがって、再生データの再生速度の変化を、ユーザが指示する再生速度V1との差を最小にし、且つ、判別可能条件の内部に収まるという制約条件を満たすように調整できるため、第2次再生プランP2が、人間の特性に合ったものになり、ユーザにとって視聴しやすい状態で再生データの可変速再生を行うことができる。
実施例のように、現時点から未来に亘る時区間における第2次再生プランP2の決定に関する問題を、線形計画法の枠組みに入れることで、開発は容易になるが、本発明の基本的な考えは、線形計画法に限定されるものではなく、線形計画法から逸脱して拡張してもよい。
具体的には、例えば、図15に示す再生装置1Aのように、最適化問題を非線形計画問題として非線形計画法を用いて解いてもよい。
ここで、線形計画問題が、目的関数及び制約条件が線形の最適化問題であったのに対し、非線形計画問題は、目的関数及び/又は制約条件が非線形の最適化問題である。
CPU161は、かかる第2次再生プラン作成プログラム163b2Aを実行することによって、第2次再生プラン作成手段及び判断手段として機能する。
したがって、第2次再生プランP2が、より一層、人間の特性に合ったものになり、より一層、ユーザにとって視聴しやすい状態で再生データの可変速再生を行うことができる。
実施例の線形計画問題は、FPを大きくしてLJを長く取ると、巨大な問題となり、再生装置1に内蔵されているCPU161にとって計算負荷が大きくなってしまう。
一方、マクロ速度−加速度平面における判別可能条件を満たす領域S0は、多人数について平均的に求められたものであるため、それほど厳密に実現する必要がない場合も多い。
このようなとき、線形計画問題は、線形計画法ルーチンを使って解くのではなく、近似的に解いてもよい。
具体的には、例えば、図16に示す再生装置1Bのように、線形計画問題を、近似的方法を使って解いてもよい。以下では、この近似的方法をQLP(t0,LJ)と書くことにする。
具体的には、CPU161は、例えば、第2次再生プランP2による再生位置P2(t0+j)、再生速度V2(t0+j)及び再生加速度A2(t0+j)のうちの少なくとも1つの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まるという制約条件を満たすとともに、第1次再生プランP1による再生位置P1(t0+j)と第2次再生プランP2による再生位置P2(t0+j)との差dj(或いは、第1次再生プランP1による再生位置P1(t0+j)と第2次再生プランP2による再生位置P2(t0+j)との差djと、第2次再生プランP2による再生加速度の大きさaj+bjと、の和)を最小にし、且つ、再生加速度A2(t0+j)が所定の範囲内(aMINからのaMAX範囲内)にあるとともに、再生加速度A2(t0+j)が予め設定された時区間(LJ)では一定(再生加速度a)である第2次再生プランP2を作成する。
CPU161は、かかる第2次再生プラン作成プログラム163b2Bを実行することによって、第2次再生プラン作成手段及び判断手段として機能する。
次に、再生装置1Bによる記憶媒体11に記憶された再生データの再生に関する処理について、図17及び図18のフローチャートを参照して説明する。
具体的には、CPU171は、読取部11に、記憶媒体11に記憶された再生データのうちの時間座標P2(t0)の部分を取得させ、当該取得された再生データを、デコーダ13や時間軸変換部14を介して、音声出力装置3に出力させる。これにより、音声出力装置3から再生データに基づく音声が出力される。
そして、CPU161は、ステップS33〜ステップS43の処理を、例えば、ユーザによる操作部15の操作によって再生データの再生を終了するよう指示されるまで、或いは、記憶媒体11に記憶された再生データを再生し尽すまで、繰り返して行う。
図19(a)は、図12(a)と同一の軌跡であり、図19(b)には、図19(a)の第1次再生プランP1を基に、判別可能条件を満たす領域S0内に収まるように、近似的方法QLP(t0,LJ)を順次適用していくことで作成した第2次再生プランP2の軌跡を示す。
図19(b)によれば、図12(b)と比較して、折れ線(判別可能条件を満たす領域S0と判別可能条件を満たさない領域S1の境界線)から離れている軌跡を多く含むが、判別可能条件を満たす領域S0内に全ての軌跡が収まっているため、ほぼ聞き落としがないと期待できる。
第1は、処理能力の高いプロセッサを使用する場合は、線形計画問題LP1(t0,LJ)又は改良型の線形計画問題LP2(t0,LJ)をそのまま実現して最適な再生ができるという点にある。
第2は、理論的に最適な解があるということを示すためのものであるという点にある。
第3は、近似的方法QLP(t0,LJ)のような近似的手法を開発する際に、それがどこまでよい近似であるかを調べるためのツールとして役立つという点にある。
すなわち、再生装置1Bは、実施例1の線形計画問題(線形計画問題LP1(t0,LJ)又は改良型の線形計画問題LP2(t0,LJ))を近似的に解いて、第2次再生プランP2を作成するため、ユーザにとって視聴しやすい状態で再生データの可変速再生を行うことができるとともに、CPU161の計算負荷を抑えることができる。
実施例で示した手法は、人間の特性に沿って音声を聞き取らせつつ、再生データを再生する際の再生速度をできるだけユーザが指示する再生速度に近づける手法であった。しかしながら、再生データを構成する音声データには、無音部の時区間もあれば、音声が存在しない時区間もある。このような時区間に対して制約条件を課しても無意味であり、再生データを再生する際の再生速度が、ユーザが指示する再生速度からずれていくだけである。
このようなとき、無音部の時区間や音声が存在しない時区間などの、制約が必要ないと判断される時区間については、制約条件(例えば、式(31)など)を緩和するとよい。
具体的には、例えば、図20に示す再生装置1Cのように、無音部や音声の有無を判定して、制約が必要ないと判断される時区間については、制約条件を緩和するとよい。
具体的には、CPU161は、例えば、再生データ(音声データ)の2乗和を積分して、所定の閾値と比較することによって、無音区間の判定を行う。
CPU161は、かかる無音区間判定プログラム163b4Cを実行することによって、無音区間判定手段として機能する。
具体的には、CPU161は、例えば、再生データ(音声データ)のスペクトル形、エネルギー変動の度合い(例えば、短時間分散と長時間分散との比など)、などを用いて、音声区間の判定を行う。なお、CPU161は、音声区間であるか否かの判定が曖昧な時区間については、その軸間を音声区間であると判定するようになっている。
CPU161は、かかる音声区間判定プログラム163b5Cを実行することによって、音声区間判定手段として機能する。
また、CPU161は、例えば、無音区間判定プログラム163b4Cを実行したCPU161によって読取部12により取得された再生データが無音区間内の再生データでないと判定された場合であっても、音声区間判定プログラム163b5Cを実行したCPU161によって読取部12により取得された再生データが音声区間内の再生データでないと判定された場合は、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランP1を基に、線形計画問題LP1(t0,LJ)又は改良型の線形計画問題LP2(t0,LJ)の制約条件よりも制約が緩和された条件内で第2次再生プランP2を作成するようになっている。
すなわち、読取部12により取得された再生データが、無音区間内の再生データであると判定された場合、或いは、音声区間内の再生データでないと判定された場合には、CPU161は、制約条件(例えば、式(31)など)を無視して、線形計画問題LP1(t0,LJ)又は改良型の線形計画問題LP2(t0,LJ)を解くことによって、第2次再生プランP2を作成する。
CPU161は、かかる第2次再生プラン作成プログラム163b2Cを実行することによって、第2次再生プラン作成手段及び判断手段として機能する。
したがって、再生装置1Cは、無音区間である時区間や音声区間でない時区間などの、制約が必要ないと判断される時区間では、線形計画問題LP1(t0,LJ)又は改良型の線形計画問題LP2(t0,LJ)を解いて作成した第2次再生プランP2よりも第1次再生プランP1に近い第2次再生プランP2を作成するため、再生データを再生する際の再生速度が、ユーザが指示する再生速度からずれていくのを抑えることができ、効率よく再生データを再生することができる。
実施例においては、話速にかかわらず制約条件を一定にしていたが、制約条件は、人間の特性として定量化したパラメータMV(τ)、MA(τ)、CVk、CAk、CCkを使用して生成されるものであり、パラメータMV(τ)、MA(τ)、CVk、CAk、CCkは、話速に依存する。したがって、さらにユーザにとって視聴しやすい状態で再生データの再生を行うためには、話速に応じて制約条件を変化させるとよい。
具体的には、例えば、図21に示す再生装置1Dのように、話速を判定して、その話速に応じて制約条件を変化させるとよい。
具体的には、CPU161は、例えば、再生データ(音声データ)のエネルギーの変動の大きさを用いることによって、話速を推定する。すなわち、CPU161は、例えば、再生データの信号エネルギーを、長い時定数で平滑化したものをPL(t)とし、短い時定数で平滑化したものをPS(t)としたときに、1秒間あたりにPL(t)とPS(t)とが交差する回数を求めることによって、話速を推定する。
CPU161は、かかる話速推定プログラム163b6Dを実行することによって、話速推定手段として機能する。
具体的には、例えば、話速推定プログラム163b6Dを実行したCPU161により推定される話速は、「早い」、「普通」、「遅い」の3段階に分けられるようになっており、パラメータ記憶ファイル163a1Dは、話速が早い場合と、話速が普通の場合と、話速が遅い場合と、のそれぞれについて、作成される第2次再生プランP2による再生速度V2(t)の最高値が適度なものとなるような、パラメータMV(τ)、MA(τ)、CVk、CAk、CCkなどを記憶している。
なお、話速を「早い」、「普通」、「遅い」の3段階に分けるようにしたが、これに限ることはなく、段階の数は複数であれば任意である。
CPU161は、かかる第2次再生プラン作成プログラム163b2Dを実行することによって、第2次再生プラン作成手段及び判断手段として機能する。
すなわち、話速に応じたパラメータMV(τ)、MA(τ)、CVk、CAk、CCkの組を使用して制約条件を生成することによって、制約条件を変化させるため、例えば、話速が早い時区間では遅くなるように、話速が遅い時区間では早くなるように、再生速度が調整された第2次再生プランP2を作成できることとなって、ユーザにとって聞きやすい状態で効率よく再生データの可変速再生を行うことができる。
実施例では、ユーザが指示する再生速度V1が高速であって、それが長時間維持された場合には、音声の全てを聞き取らせるのは不可能である。例えば、再生装置1が再生処理(図10)を行なっている場合であれば、ユーザにより指示された再生速度V1に応じた再生位置(第1次再生プランP1による再生位置P1(t0))と、実際の再生位置(第2次再生プランP2による再生位置P2(t0))と、の剥離による強制的な再生位置の修正(ステップS10のP2(t0)をP1(t0)で置き換える処理)が頻繁に起こって、聞くに耐えない音声になる場合がある。そのようなことが生じたときは、語句を聞き取らせるのを諦めて、音量を下げたり、音量を切ってしまう(音声を切る、音を切る、又は、音量を0にする)のがよい。
具体的には、例えば、図22に示す再生装置1Eのように、RAM162内の「聞き取り可否U(t0+j)」記憶領域のうちのj=0の領域、すなわち、RAM162内の「聞き取り可否U(t0)」記憶領域に“1”が設定されている場合は、音量を下げたり、音声を切ってもよい。
一方、U(t)=1は、第2次再生プランP2が時刻tで聞き取り可能でないと推定されたこと、すなわち、第2次再生プランP2の軌跡が時刻tで判別可能条件を満たす領域S0内に収まらないことを示す。
ここで、再生データに基づく音声の音量を予め設定された音量まで小さくなるように調整するとは、例えば、音量を下げたり、音量を切ってしまう(音声を切る、音を切る、又は、音量を0にする)ことである。
具体的には、CPU161は、例えば、U(t0)=0で通常音量、U(t0)=1で小音量(又は無音量)となるように、音声出力装置3を制御する。
CPU161は、かかる音量制御プログラム163b7Eを実行することによって、音量調整手段として機能する。
したがって、ユーザにより指示された再生速度V1に応じた再生位置(第1次再生プランP1による再生位置P1(t0))と、実際の再生位置(第2次再生プランP2による再生位置P2(t0))と、の剥離による強制的な再生位置の修正(P2(t0)をP1(t0)で置き換える処理)が頻繁に起こって、聞くに耐えない音声が出力される場合は、音量が小さくなるため、より一層、ユーザにとって聞きやすい状態で再生データの可変速再生を行うことができる。
実施例では、記憶媒体11に記憶された再生データは音声データにより構成されていたが、再生データは、音声データ及び映像データにより構成されていてもよい。
この場合、例えば、図23に示す再生装置1Fのように、第2次再生プランP2に従って、音声データを再生するとともに、第1次再生プランP1に従って、映像データを再生することになる。
なお、記憶媒体11Fには、音声データと、映像データと、が予め分離されて記憶されている。
具体的には、最適化問題は、目的関数として、第1次再生プランP1による再生位置P1(t0+j)と第2次再生プランP2による再生位置P2(t0+j)との差dj(或いは、第1次再生プランP1による再生位置P1(t0+j)と第2次再生プランP2による再生位置P2(t0+j)との差djと、第2次再生プランP2による再生加速度の大きさaj+bjと、の和)と、第2次再生プランP2による音声データの再生位置と第2次再生プランP2による映像データの再生位置との差と、の和を最小にするために、制約条件として、第2次再生プランP2による再生位置P2(t0+j)、再生速度V2(t0+j)及び再生加速度A2(t0+j)のうちの少なくとも1つの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まるように、線形計画問題として線形計画法を用いて解くものである。
CPU161は、かかる第2次再生プラン作成プログラム163b2Fを実行することによって、第2次再生プラン作成手段及び判断手段として機能する。
CPU161は、かかる再生制御プログラム163b3Fを実行することによって、出力制御手段として機能する。
この場合、音声データと映像データが各々に適した第2次再生プランに従って再生されるため、可変速再生をした場合であっても、音声と映像をより自然に視聴させることができる。
また、デコーダ13Fから制御部16Fに再生データ(映像データ)が入力されるよう構成し、デコーダ13Fから入力される再生データ(映像データ)を解析して、読取部11により読み取られた再生データが、変化の多い動画区間内の再生データであるか否かを判定して、変化の多い動画区間内の再生データであると判定された場合は、映像データをゆっくりと再生するようにしてもよい。
3 音声出力装置(出力装置)
5F 表示装置(出力装置)
11,11F 記憶媒体(記憶手段)
12 読取部(取得手段)
14 時間軸変換部(時間軸変換手段)
15 操作部(指示手段)
161 CPU(第1次再生プラン作成手段、第2次再生プラン作成手段、判断手段、出力制御手段、無音区間判定手段、音声区間判定手段、話速推定手段、音量調整手段)
163b1 第1次再生プラン作成プログラム(第1次再生プラン作成手段)
163b2,163b2A,163b2B,163b2C,163b2D,163b2F 第2次再生プラン作成プログラム(第2次再生プラン作成手段、判断手段)
163b3,163b3F 再生制御プログラム(出力制御手段)
163b4C 無音区間判定プログラム(無音区間判定手段)
163b5C 音声区間判定プログラム(音声区間判定手段)
163b6D 話速推定プログラム(話速推定手段)
163b7E 音量制御プログラム(音量調整手段)
Claims (11)
- 再生データの再生時に、当該再生データの記録時の速度とは異なる速度で再生を行う再生装置において、
前記再生データを記憶する記憶手段と、
ユーザによる前記再生装置の操作によって指示された前記再生データの記録時の速度とは異なる再生速度V1に応じた、現時点t0における第1次再生プランP1による再生位置P1(t0)(=P1(t0−1)+(FS/FP)V1)及び未来における第1次再生プランP1による再生位置P1(t0+j)(j=1,2,…,LJ−1)を作成する第1次再生プラン作成手段(FSは再生データを構成する音声データのサンプリング周波数、FPは時間軸を離散化するサンプリング周波数、LJは再生位置のサンプル数)と、
前記第1次再生プラン作成手段により作成された第1次再生プランを基に、最適化問題を解くことによって、修正量dj(j=0,1,…,LJ−1)を求め、現時点から未来に亘る第1次再生プランP1による再生位置P1(t0+j)(j=0,1,…,LS−1)と、前記修正量dj(j=0,1,…,LS−1)と、に基づいて、当該第1次再生プランを修正した現時点から未来に亘る第2次再生プランP2による再生位置P2(t0+j)(j=0,1,…,LS−1)を作成する第2次再生プラン作成手段(LSは修正量のサンプル数)と、
を備え、
ユーザにとって視聴しやすい状態で再生データの可変速再生を行うことを特徴とする再生装置。 - 請求項1に記載の再生装置において、
前記記憶手段に記憶された再生データの再生速度V1を指示するための指示手段と、
前記第2次再生プラン作成手段により作成された第2次再生プランに従って、前記記憶手段から再生データを取得する取得手段と、
前記取得手段により取得された再生データを所定の出力装置に出力させる出力制御手段と、を備え、
前記第1次再生プラン作成手段は、前記指示手段により指示された再生速度V1に応じた、現時点から未来に亘る第1次再生プランを作成し、
前記最適化問題は、目的関数として、所定の値を最小又は最大にするために、制約条件として、前記第2次再生プランによる再生位置、再生速度及び再生加速度のうちの少なくとも1つの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まるように、線形計画問題として線形計画法を用いて解くものであり、
前記所定の値は、前記第1次再生プランと前記第2次再生プランとの差を含むことを特徴とする再生装置。 - 再生データの再生時に、当該再生データの記録時の速度とは異なる速度で再生を行う再生装置において、
前記再生データを記憶する記憶手段と、
前記記憶手段に記憶された再生データの再生速度V1を指示するための指示手段と、
前記指示手段により指示された再生速度V1に応じた、現時点t0における第1次再生プランP1による再生位置P1(t0)(=P1(t0−1)+(FS/FP)V1)及び未来における第1次再生プランP1による再生位置P1(t0+j)(j=1,2,…,LJ−1)を作成する第1次再生プラン作成手段(FSは再生データを構成する音声データのサンプリング周波数、FPは時間軸を離散化するサンプリング周波数、LJは再生位置のサンプル数)と、
前記第1次再生プラン作成手段により作成された第1次再生プランを基に、最適化問題を解くことによって、修正量dj(j=0,1,…,LJ−1)を求め、現時点から未来に亘る第1次再生プランP1による再生位置P1(t0+j)(j=0,1,…,LS−1)と、前記修正量dj(j=0,1,…,LS−1)と、に基づいて、当該第1次再生プランを修正した現時点から未来に亘る第2次再生プランP2による再生位置P2(t0+j)(j=0,1,…,LS−1)を作成する第2次再生プラン作成手段(LSは修正量のサンプル数)と、
前記第2次再生プラン作成手段により作成された第2次再生プランに従って、前記記憶手段から再生データを取得する取得手段と、
前記取得手段により取得された再生データを所定の出力装置に出力させる出力制御手段と、を備え、
前記最適化問題は、目的関数として、所定の値を最小又は最大にするために、制約条件として、前記第2次再生プランによる再生位置、再生速度及び再生加速度のうちの少なくとも1つを元にした線形関数又は非線形関数を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まるように、非線形計画問題として非線形計画法を用いて解くものであり、
前記所定の値は、前記第1次再生プランと前記第2次再生プランとの差を線形関数又は非線形関数で含むことを特徴とする再生装置。 - 再生データの再生時に、当該再生データの記録時の速度とは異なる速度で再生を行う再生装置において、
前記再生データを記憶する記憶手段と、
前記記憶手段に記憶された再生データの再生速度V1を指示するための指示手段と、
前記指示手段により指示された再生速度V1に応じた、現時点t0における第1次再生プランP1による再生位置P1(t0)(=P1(t0−1)+(FS/FP)V1)及び未来における第1次再生プランP1による再生位置P1(t0+j)(j=1,2,…,LJ−1)を作成する第1次再生プラン作成手段(FSは再生データを構成する音声データのサンプリング周波数、FPは時間軸を離散化するサンプリング周波数、LJは再生位置のサンプル数)と、
前記第1次再生プラン作成手段により作成された第1次再生プランを基に、修正量dj(j=0,1,…,LJ−1)を求め、現時点から未来に亘る第1次再生プランP1による再生位置P1(t0+j)(j=0,1,…,LS−1)と、前記修正量dj(j=0,1,…,LS−1)と、に基づいて、当該第1次再生プランを修正した現時点から未来に亘る第2次再生プランP2による再生位置P2(t0+j)(j=0,1,…,LS−1)を作成する第2次再生プラン作成手段(LSは修正量のサンプル数)と、
前記第2次再生プラン作成手段により作成された第2次再生プランに従って、前記記憶手段から再生データを取得する取得手段と、
前記取得手段により取得された再生データを所定の出力装置に出力させる出力制御手段と、を備え、
前記第2次再生プラン作成手段は、前記第2次再生プランによる再生位置、再生速度及び再生加速度のうちの少なくとも1つの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まるという制約条件を満たすとともに、所定の値を最小又は最大にし、且つ、再生加速度が所定の範囲内にあるとともに、再生加速度が予め設定された時区間では一定である第2次再生プランを作成し、
前記所定の値は、前記第1次再生プランと前記第2次再生プランとの差を含むことを特徴とする再生装置。 - 請求項2〜4の何れか一項に記載の再生装置において、
前記記憶手段に記憶された再生データは、少なくとも音声データにより構成されており、
前記第1次再生プラン作成手段により作成された第1次再生プランと、前記第2次再生プラン作成手段により作成された第2次再生プランと、の差が予め設定された規定範囲内にあるか否かを判断する判断手段と、
前記判断手段によって前記第1次再生プラン作成手段により作成された第1次再生プランと前記第2次再生プラン作成手段により作成された第2次再生プランとの差が予め設定された規定範囲内にないと判断された場合、又は、前記第2次再生プラン作成手段により前記制約条件を満たす第2次再生プランが作成されなかった場合に、前記出力装置から出力される再生データに基づく音声の音量を予め設定された音量まで小さくなるように調整する音量調整手段と、
を備えることを特徴とする再生装置。 - 請求項2〜5の何れか一項に記載の再生装置において、
前記所定の値は、前記第2次再生プランによる再生加速度の大きさを含むことを特徴とする再生装置。 - 請求項2〜6の何れか一項に記載の再生装置において、
前記記憶手段に記憶された再生データは、少なくとも音声データにより構成されており、
前記取得手段により取得された再生データが、無音区間内の再生データであるか否かを判定する無音区間判定手段を備え、
前記第2次再生プラン作成手段は、前記無音区間判定手段によって前記取得手段により取得された再生データが無音区間内の再生データであると判定された場合は、前記第1次再生プラン作成手段により作成された第1次再生プランを基に、前記制約条件よりも制約が緩和された条件内で第2次再生プランを作成することを特徴とする再生装置。 - 請求項2〜7の何れか一項に記載の再生装置において、
前記記憶手段に記憶された再生データは、少なくとも音声データにより構成されており、
前記取得手段により取得された再生データが、音声区間内の再生データであるか否かを判定する音声区間判定手段を備え、
前記第2次再生プラン作成手段は、前記音声区間判定手段によって前記取得手段により取得された再生データが音声区間内の再生データでないと判定された場合は、前記第1次再生プラン作成手段により作成された第1次再生プランを基に、前記制約条件よりも制約が緩和された条件内で第2次再生プランを作成することを特徴とする再生装置。 - 請求項2〜8の何れか一項に記載の再生装置において、
前記記憶手段に記憶された再生データは、少なくとも音声データにより構成されており、
前記取得手段により取得された再生データに基づく音声の話速を推定する話速推定手段を備え、
前記第2次再生プラン作成手段は、前記話速推定手段により推定された話速に応じて前記制約条件を変化させることを特徴とする再生装置。 - 請求項2〜9の何れか一項に記載の再生装置において、
前記記憶手段に記憶された再生データは、音声データ及び映像データにより構成されており、
前記所定の値は、前記第2次再生プランによる音声データの再生位置と、当該第2次再生プランによる映像データの再生位置と、の差を含むことを特徴とする再生装置。 - 音声データにより構成される再生データの再生時に、当該再生データの記録時の速度とは異なる速度で再生を行う再生装置において、
前記再生データを記憶する記憶手段と、
前記記憶手段に記憶された再生データの再生速度V1を指示するための指示手段と、
前記指示手段により指示された再生速度V1に応じた、現時点t0における第1次再生プランP1による再生位置P1(t0)(=P1(t0−1)+(FS/FP)V1)及び未来における第1次再生プランP1による再生位置P1(t0+j)(j=1,2,…,LJ−1)を作成する第1次再生プラン作成手段(FSは再生データを構成する音声データのサンプリング周波数、FPは時間軸を離散化するサンプリング周波数、LJは再生位置のサンプル数)と、
前記第1次再生プラン作成手段により作成された第1次再生プランを基に、最適化問題を解くことによって、修正量dj(j=0,1,…,LJ−1)を求め、現時点から未来に亘る第1次再生プランP1による再生位置P1(t0+j)(j=0,1,…,LS−1)と、前記修正量dj(j=0,1,…,LS−1)と、に基づいて、当該第1次再生プランを修正した現時点から未来に亘る第2次再生プランP2による再生位置P2(t0+j)(j=0,1,…,LS−1)を作成する第2次再生プラン作成手段(LSは修正量のサンプル数)と、
前記第2次再生プラン作成手段により作成された第2次再生プランに従って、前記記憶手段から再生データを取得する取得手段と、
前記取得手段により取得された再生データの波形の一致度を考慮して、当該再生データの時間軸を変換する時間軸変換手段と、
前記時間軸変換手段により時間軸が変換された再生データを所定の出力装置に出力させる出力制御手段と、を備え、
前記最適化問題は、目的関数として、前記第1次再生プランと前記第2次再生プランとの差と、前記第2次再生プランによる再生加速度の大きさと、の和を最小にするために、制約条件として、前記第2次再生プランによる再生位置の線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面内にある判別可能条件を示す予め設定された領域の内部に収まるように、線形計画問題として線形計画法を用いて解くものであることを特徴とする再生装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007122542A JP5093648B2 (ja) | 2007-05-07 | 2007-05-07 | 再生装置 |
US11/935,745 US8165459B2 (en) | 2007-05-07 | 2007-11-06 | Reproducing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007122542A JP5093648B2 (ja) | 2007-05-07 | 2007-05-07 | 再生装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008276122A JP2008276122A (ja) | 2008-11-13 |
JP5093648B2 true JP5093648B2 (ja) | 2012-12-12 |
Family
ID=39969620
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007122542A Expired - Fee Related JP5093648B2 (ja) | 2007-05-07 | 2007-05-07 | 再生装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8165459B2 (ja) |
JP (1) | JP5093648B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010266150A (ja) * | 2009-05-15 | 2010-11-25 | Zojirushi Corp | 調理器 |
JP2012220547A (ja) * | 2011-04-05 | 2012-11-12 | Sony Corp | 音量制御装置、音量制御方法およびコンテンツ再生システム |
JP6454495B2 (ja) * | 2014-08-19 | 2019-01-16 | ルネサスエレクトロニクス株式会社 | 半導体装置及びその故障検出方法 |
US10878835B1 (en) * | 2018-11-16 | 2020-12-29 | Amazon Technologies, Inc | System for shortening audio playback times |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0854895A (ja) * | 1994-08-11 | 1996-02-27 | Matsushita Electric Ind Co Ltd | 再生装置 |
JP2955247B2 (ja) | 1997-03-14 | 1999-10-04 | 日本放送協会 | 話速変換方法およびその装置 |
JP3730764B2 (ja) * | 1997-09-12 | 2006-01-05 | 日本放送協会 | 話速/画速同時変換装置 |
JP4016158B2 (ja) * | 1998-07-15 | 2007-12-05 | ソニー株式会社 | 信号再生方法および信号再生装置 |
JP2001094948A (ja) | 1999-09-27 | 2001-04-06 | Sanyo Electric Co Ltd | デジタル放送記録再生装置 |
JP4235780B2 (ja) | 1999-09-29 | 2009-03-11 | ソニー株式会社 | 信号再生方法および信号再生装置 |
JP2001222300A (ja) | 2000-02-08 | 2001-08-17 | Nippon Hoso Kyokai <Nhk> | 音声再生装置および記録媒体 |
EP1309965B1 (en) * | 2000-08-09 | 2010-12-15 | Thomson Licensing | Method and system for enabling audio speed conversion |
US6625387B1 (en) * | 2002-03-01 | 2003-09-23 | Thomson Licensing S.A. | Gated silence removal during video trick modes |
JP2006127647A (ja) | 2004-10-29 | 2006-05-18 | Sharp Corp | 音声高速再生装置及び方法 |
-
2007
- 2007-05-07 JP JP2007122542A patent/JP5093648B2/ja not_active Expired - Fee Related
- 2007-11-06 US US11/935,745 patent/US8165459B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20080279528A1 (en) | 2008-11-13 |
US8165459B2 (en) | 2012-04-24 |
JP2008276122A (ja) | 2008-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4736586B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
US8386257B2 (en) | Emotion detecting method, emotion detecting apparatus, emotion detecting program that implements the same method, and storage medium that stores the same program | |
US8744244B2 (en) | Reproducing apparatus, reproducing method, and storage medium | |
JP5093648B2 (ja) | 再生装置 | |
US20090047003A1 (en) | Playback apparatus and method | |
US8804976B2 (en) | Content reproduction device and method, and program | |
EP1973115A1 (en) | Contents reproducer and reproduction method | |
JP2019068300A (ja) | ダイジェストデータ生成装置、ダイジェストデータ再生装置、ダイジェストデータ生成システム、ダイジェストデータ生成方法及びプログラム | |
US7203558B2 (en) | Method for computing sense data and device for computing sense data | |
WO2021176842A1 (ja) | 復号装置、復号方法、プログラム、符号化装置、符号化方法 | |
JP4433027B2 (ja) | 信号処理装置、信号処理方法、およびプログラム | |
JP4322691B2 (ja) | 選曲装置 | |
US20100138009A1 (en) | Music Device Equipped with Image Display | |
IL178316A (en) | Cerebrum evaluation device | |
JPH10260694A (ja) | 話速変換装置、話速変換方法及び記録媒体 | |
RU2510954C2 (ru) | Способ переозвучивания аудиоматериалов и устройство для его осуществления | |
JP4390289B2 (ja) | 再生装置 | |
JP2009075280A (ja) | コンテンツ再生装置 | |
US20230145547A1 (en) | Decoding device, decoding method, program, encoding device, and encoding method | |
JP2012004722A (ja) | コンテンツ再生装置、コンテンツ再生方法、およびコンテンツ再生プログラム | |
JP2009260824A (ja) | 映像音声出力装置 | |
JP2001013003A (ja) | 音質評価方法及び装置並びに音質評価尺度特定方法及び音質評価尺度特定用プログラムを記憶した記憶媒体 | |
JP2006154531A (ja) | 音声速度変換装置、音声速度変換方法、および音声速度変換プログラム | |
JP2837640B2 (ja) | 補聴器 | |
WO2023238650A1 (ja) | 変換装置および変換方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091218 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110812 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111004 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120807 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120906 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150928 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |