JP5093648B2 - 再生装置 - Google Patents

再生装置 Download PDF

Info

Publication number
JP5093648B2
JP5093648B2 JP2007122542A JP2007122542A JP5093648B2 JP 5093648 B2 JP5093648 B2 JP 5093648B2 JP 2007122542 A JP2007122542 A JP 2007122542A JP 2007122542 A JP2007122542 A JP 2007122542A JP 5093648 B2 JP5093648 B2 JP 5093648B2
Authority
JP
Japan
Prior art keywords
reproduction
plan
playback
speed
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007122542A
Other languages
English (en)
Other versions
JP2008276122A (ja
Inventor
弘太 ▲高▼橋
康生 政木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
THE UNIVERSITY OF ELECTRO-COMUNICATINS
Funai Electric Co Ltd
Original Assignee
THE UNIVERSITY OF ELECTRO-COMUNICATINS
Funai Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by THE UNIVERSITY OF ELECTRO-COMUNICATINS, Funai Electric Co Ltd filed Critical THE UNIVERSITY OF ELECTRO-COMUNICATINS
Priority to JP2007122542A priority Critical patent/JP5093648B2/ja
Priority to US11/935,745 priority patent/US8165459B2/en
Publication of JP2008276122A publication Critical patent/JP2008276122A/ja
Application granted granted Critical
Publication of JP5093648B2 publication Critical patent/JP5093648B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • H04N5/783Adaptations for reproducing at a rate different from the recording rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/806Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
    • H04N9/8063Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Description

本発明は、可変速再生を行う再生装置に関する。
VCR(Video Cassette Recorder)やDVDレコーダ、ハードディスクレコーダなどの再生装置においては、ユーザはリモートコントローラ(以下「リモコン」という)に設けられた「早送りボタン」や「巻戻しボタン」などを駆使することで、音声データ及び/又は映像データにより構成される再生データの再生中に、聞きたくない部分や見たくない部分を飛ばしたり、必要な部分を繰り返し聞いたり見たりすることができるようになっている。
しかしながら、例えば、ユーザの指示に従って、再生速度を標準速(1倍速)から2倍速に推移させてそのまま固定すると、再生速度が一瞬にして標準速から2倍速に変化するため、人間の聞き取り処理がその変化に対応できず、聞き落としが生じるという問題がある。
また、例えば、3倍速再生などの高速度再生の時間を、10秒以上持続させると、ほとんどの場合聞き取れなくなってしまうが、0.5秒程度の短時間にすれば、多くの場合聞き落としはないということも分かっている。
従来、再生データの再生速度の制御については、VCRの機械的特性などに依存して緩やかに変化させるものや、段階的に速度を上昇/下降させるものはあった。
また、音声データを不連続な位置にジャンプさせた際、映像データを違和感なく再生するために、適度に増加させた速度や、段階的に増加させた速度、スプライン関数で制御された速度などで映像データを再生し、映像を音声に滑らかに一致させていく方法が提案されている(例えば、特許文献1参照)。
また、再生速度の変化を人間にとって快適にするために、再生速度を人工的に可変する技術として、追い付き再生(現在放送されているシーンまでの早送り再生)において、追い付く直前に再生速度を減速していき、現在の放送に滑らかにつなげる方法(例えば、特許文献2参照)や、音声データの高速度再生において、フレームを前半ブロックと後半ブロックに分割し、前半ブロックには次第に減衰率が大きくなるフェードアウト処理を施すとともに、後半ブロックには次第に減衰率が小さくなるフェードイン処理を施し、フェードアウト処理をした前半ブロックとフェードイン処理をした後半ブロックとを重ね合わせることによって、前後のフレームを滑らかにつなげる方法(例えば、特許文献3参照)が提案されている。
ところで、音声データに基づく音声の話速をユーザにとって聞きやすく修正する技術として、音声の時間軸変換(TSM:Time Scale Modification)と呼ばれる技術が、既に公知になっている(例えば、特許文献4参照)。この時間軸変換技術を用いると、声の高さ(ピッチ)を変えずに、音声の長さを変えることができる。
また、時間軸変換技術を前提として、文頭ではゆっくり再生し、文末では速めに再生することで、文頭と文末とで再生速度が同一の場合と比較して、同じ再生時間であっても、より聞き取りやすく再生する再生プランを決定する方法が提案されている(例えば、特許文献5参照)。
特開2001−103401号公報 特開2001−94948号公報 特開2006−127647号公報 特開平10−257596号公報 特開2001−222300号公報
しかしながら、上述の、再生データの再生速度の制御について、VCRの機械的特性などに依存して緩やかに変化させるものや、段階的に速度を上昇/下降させるものは、あくまでも再生データの再生速度の急激な変化に伴う不具合の程度を緩和するだけのものであり、再生データの再生速度の変化を、人間の特性に基づいて最適に調整できるものではない。さらに、高速度再生の持続時間に許容範囲があることまでを考慮して、再生データの再生速度の変化を最適に調整できるものでもない。
また、特許文献1は、最適な速度変化を決定する方法を示したものではなく、あくまでも再生データの再生速度の急激な変化に伴う不具合の程度を緩和するだけのものであり、再生データの再生速度の変化を、人間の特性に基づいて最適に調整できるものではない。
また、特許文献2及び3は、再生速度を人工的に可変するため、人間にとって不自然感をもたらすという問題がある。さらに、特許文献2及び3の再生速度の変化は便宜的なものであって、最適性の基準を持たないため、やはり再生データの再生速度の急激な変化に伴う不具合の程度を緩和するだけのものであり、再生データの再生速度の変化を、人間の特性に基づいて最適に調整できるものではない。
また、特許文献4は、決定された再生プランに基づいて、明瞭な音で再生するための手法(すなわち、ノイズを発生させないで音を再生する手法)を示したものであり、再生データの再生速度の変化を人間の特性に基づいて最適に調整するための再生プランを決定する手法を示したものではない。
また、特許文献5では、早送り再生を含んだ状況での再生プランの決定については述べられていないため、ユーザにより早送り再生が指示された際に、再生データの再生速度の変化を人間の特性に基づいて最適に調整するための再生プランを決定することはできない。
本発明の課題は、ユーザにとって視聴しやすい状態で再生データの可変速再生を行うことができる再生装置を提供することにある。
上記課題を解決するために、請求項1に記載の発明は、
再生データの再生時に、当該再生データの記録時の速度とは異なる速度で再生を行う再生装置において、
前記再生データを記憶する記憶手段と、
ユーザによる前記再生装置の操作によって指示された前記再生データの記録時の速度とは異なる再生速度V1に応じた、現時点t0における第1次再生プランP1による再生位置P1(t0)(=P1(t0−1)+(FS/FP)V1)及び未来における第1次再生プランP1による再生位置P1(t0+j)(j=1,2,…,LJ−1)を作成する第1次再生プラン作成手段(FSは再生データを構成する音声データのサンプリング周波数、FPは時間軸を離散化するサンプリング周波数、LJは再生位置のサンプル数)と、
前記第1次再生プラン作成手段により作成された第1次再生プランを基に、最適化問題を解くことによって、修正量dj(j=0,1,…,LJ−1)を求め、現時点から未来に亘る第1次再生プランP1による再生位置P1(t0+j)(j=0,1,…,LS−1)と、前記修正量dj(j=0,1,…,LS−1)と、に基づいて、当該第1次再生プランを修正した現時点から未来に亘る第2次再生プランP2による再生位置P2(t0+j)(j=0,1,…,LS−1)を作成する第2次再生プラン作成手段(LSは修正量のサンプル数)と、
を備え、ユーザにとって視聴しやすい状態で再生データの可変速再生を行うことを特徴とする。
請求項2に記載の発明は、
請求項1に記載の再生装置において、
前記記憶手段に記憶された再生データの再生速度V1を指示するための指示手段と、
前記第2次再生プラン作成手段により作成された第2次再生プランに従って、前記記憶手段から再生データを取得する取得手段と、
前記取得手段により取得された再生データを所定の出力装置に出力させる出力制御手段と、を備え、
前記第1次再生プラン作成手段は、前記指示手段により指示された再生速度V1に応じた、現時点から未来に亘る第1次再生プランを作成し、
前記最適化問題は、目的関数として、所定の値を最小又は最大にするために、制約条件として、前記第2次再生プランによる再生位置、再生速度及び再生加速度のうちの少なくとも1つの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まるように、線形計画問題として線形計画法を用いて解くものであり、
前記所定の値は、前記第1次再生プランと前記第2次再生プランとの差を含むことを特徴とする。
請求項3に記載の発明は、
再生データの再生時に、当該再生データの記録時の速度とは異なる速度で再生を行う再生装置において、
前記再生データを記憶する記憶手段と、
前記記憶手段に記憶された再生データの再生速度V1を指示するための指示手段と、
前記指示手段により指示された再生速度V1に応じた、現時点t0における第1次再生プランP1による再生位置P1(t0)(=P1(t0−1)+(FS/FP)V1)及び未来における第1次再生プランP1による再生位置P1(t0+j)(j=1,2,…,LJ−1)を作成する第1次再生プラン作成手段(FSは再生データを構成する音声データのサンプリング周波数、FPは時間軸を離散化するサンプリング周波数、LJは再生位置のサンプル数)と、
前記第1次再生プラン作成手段により作成された第1次再生プランを基に、最適化問題を解くことによって、修正量dj(j=0,1,…,LJ−1)を求め、現時点から未来に亘る第1次再生プランP1による再生位置P1(t0+j)(j=0,1,…,LS−1)と、前記修正量dj(j=0,1,…,LS−1)と、に基づいて、当該第1次再生プランを修正した現時点から未来に亘る第2次再生プランP2による再生位置P2(t0+j)(j=0,1,…,LS−1)を作成する第2次再生プラン作成手段(LSは修正量のサンプル数)と、
前記第2次再生プラン作成手段により作成された第2次再生プランに従って、前記記憶手段から再生データを取得する取得手段と、
前記取得手段により取得された再生データを所定の出力装置に出力させる出力制御手段と、を備え、
前記最適化問題は、目的関数として、所定の値を最小又は最大にするために、制約条件として、前記第2次再生プランによる再生位置、再生速度及び再生加速度のうちの少なくとも1つを元にした線形関数又は非線形関数を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まるように、非線形計画問題として非線形計画法を用いて解くものであり、
前記所定の値は、前記第1次再生プランと前記第2次再生プランとの差を線形関数又は非線形関数で含むことを特徴とする。
請求項4に記載の発明は、
再生データの再生時に、当該再生データの記録時の速度とは異なる速度で再生を行う再生装置において、
前記再生データを記憶する記憶手段と、
前記記憶手段に記憶された再生データの再生速度V1を指示するための指示手段と、
前記指示手段により指示された再生速度V1に応じた、現時点t0における第1次再生プランP1による再生位置P1(t0)(=P1(t0−1)+(FS/FP)V1)及び未来における第1次再生プランP1による再生位置P1(t0+j)(j=1,2,…,LJ−1)を作成する第1次再生プラン作成手段(FSは再生データを構成する音声データのサンプリング周波数、FPは時間軸を離散化するサンプリング周波数、LJは再生位置のサンプル数)と、
前記第1次再生プラン作成手段により作成された第1次再生プランを基に、修正量dj(j=0,1,…,LJ−1)を求め、現時点から未来に亘る第1次再生プランP1による再生位置P1(t0+j)(j=0,1,…,LS−1)と、前記修正量dj(j=0,1,…,LS−1)と、に基づいて、当該第1次再生プランを修正した現時点から未来に亘る第2次再生プランP2による再生位置P2(t0+j)(j=0,1,…,LS−1)を作成する第2次再生プラン作成手段(LSは修正量のサンプル数)と、
前記第2次再生プラン作成手段により作成された第2次再生プランに従って、前記記憶手段から再生データを取得する取得手段と、
前記取得手段により取得された再生データを所定の出力装置に出力させる出力制御手段と、を備え、
前記第2次再生プラン作成手段は、前記第2次再生プランによる再生位置、再生速度及び再生加速度のうちの少なくとも1つの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まるという制約条件を満たすとともに、所定の値を最小又は最大にし、且つ、再生加速度が所定の範囲内にあるとともに、再生加速度が予め設定された時区間では一定である第2次再生プランを作成し、
前記所定の値は、前記第1次再生プランと前記第2次再生プランとの差を含むことを特徴とする。
請求項5に記載の発明は、
請求項2〜4の何れか一項に記載の再生装置において、
前記記憶手段に記憶された再生データは、少なくとも音声データにより構成されており、
前記第1次再生プラン作成手段により作成された第1次再生プランと、前記第2次再生プラン作成手段により作成された第2次再生プランと、の差が予め設定された規定範囲内にあるか否かを判断する判断手段と、
前記判断手段によって前記第1次再生プラン作成手段により作成された第1次再生プランと前記第2次再生プラン作成手段により作成された第2次再生プランとの差が予め設定された規定範囲内にないと判断された場合、又は、前記第2次再生プラン作成手段により前記制約条件を満たす第2次再生プランが作成されなかった場合に、前記出力装置から出力される再生データに基づく音声の音量を予め設定された音量まで小さくなるように調整する音量調整手段と、
を備えることを特徴とする。
請求項6に記載の発明は、
請求項2〜5の何れか一項に記載の再生装置において、
前記所定の値は、前記第2次再生プランによる再生加速度の大きさを含むことを特徴とする。
請求項7に記載の発明は、
請求項2〜6の何れか一項に記載の再生装置において、
前記記憶手段に記憶された再生データは、少なくとも音声データにより構成されており、
前記取得手段により取得された再生データが、無音区間内の再生データであるか否かを判定する無音区間判定手段を備え、
前記第2次再生プラン作成手段は、前記無音区間判定手段によって前記取得手段により取得された再生データが無音区間内の再生データであると判定された場合は、前記第1次再生プラン作成手段により作成された第1次再生プランを基に、前記制約条件よりも制約が緩和された条件内で第2次再生プランを作成することを特徴とする。
請求項8に記載の発明は、
請求項2〜7の何れか一項に記載の再生装置において、
前記記憶手段に記憶された再生データは、少なくとも音声データにより構成されており、
前記取得手段により取得された再生データが、音声区間内の再生データであるか否かを判定する音声区間判定手段を備え、
前記第2次再生プラン作成手段は、前記音声区間判定手段によって前記取得手段により取得された再生データが音声区間内の再生データでないと判定された場合は、前記第1次再生プラン作成手段により作成された第1次再生プランを基に、前記制約条件よりも制約が緩和された条件内で第2次再生プランを作成することを特徴とする。
請求項9に記載の発明は、
請求項2〜8の何れか一項に記載の再生装置において、
前記記憶手段に記憶された再生データは、少なくとも音声データにより構成されており、
前記取得手段により取得された再生データに基づく音声の話速を推定する話速推定手段を備え、
前記第2次再生プラン作成手段は、前記話速推定手段により推定された話速に応じて前記制約条件を変化させることを特徴とする。
請求項10に記載の発明は、
請求項2〜9の何れか一項に記載の再生装置において、
前記記憶手段に記憶された再生データは、音声データ及び映像データにより構成されており、
前記所定の値は、前記第2次再生プランによる音声データの再生位置と、当該第2次再生プランによる映像データの再生位置と、の差を含むことを特徴とする。
請求項11に記載の発明は、
音声データにより構成される再生データの再生時に、当該再生データの記録時の速度とは異なる速度で再生を行う再生装置において、
前記再生データを記憶する記憶手段と、
前記記憶手段に記憶された再生データの再生速度V1を指示するための指示手段と、
前記指示手段により指示された再生速度V1に応じた、現時点t0における第1次再生プランP1による再生位置P1(t0)(=P1(t0−1)+(FS/FP)V1)及び未来における第1次再生プランP1による再生位置P1(t0+j)(j=1,2,…,LJ−1)を作成する第1次再生プラン作成手段(FSは再生データを構成する音声データのサンプリング周波数、FPは時間軸を離散化するサンプリング周波数、LJは再生位置のサンプル数)と、
前記第1次再生プラン作成手段により作成された第1次再生プランを基に、最適化問題を解くことによって、修正量dj(j=0,1,…,LJ−1)を求め、現時点から未来に亘る第1次再生プランP1による再生位置P1(t0+j)(j=0,1,…,LS−1)と、前記修正量dj(j=0,1,…,LS−1)と、に基づいて、当該第1次再生プランを修正した現時点から未来に亘る第2次再生プランP2による再生位置P2(t0+j)(j=0,1,…,LS−1)を作成する第2次再生プラン作成手段(LSは修正量のサンプル数)と、
前記第2次再生プラン作成手段により作成された第2次再生プランに従って、前記記憶手段から再生データを取得する取得手段と、
前記取得手段により取得された再生データの波形の一致度を考慮して、当該再生データの時間軸を変換する時間軸変換手段と、
前記時間軸変換手段により時間軸が変換された再生データを所定の出力装置に出力させる出力制御手段と、を備え、
前記最適化問題は、目的関数として、前記第1次再生プランと前記第2次再生プランとの差と、前記第2次再生プランによる再生加速度の大きさと、の和を最小にするために、制約条件として、前記第2次再生プランによる再生位置の線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面内にある判別可能条件を示す予め設定された領域の内部に収まるように、線形計画問題として線形計画法を用いて解くものであることを特徴とする。
本発明によれば、再生データの再生時に、当該再生データの記録時の速度とは異なる速度で再生を行う再生装置において、再生データを記憶する記憶手段と、再生データの記録時の速度とは異なる再生速度に応じた、現時点から未来に亘る第1次再生プランを作成する第1次再生プラン作成手段と、第1次再生プラン作成手段により作成された第1次再生プランを基に、最適化問題を解くことによって、当該第1次再生プランを修正した現時点から未来に亘る第2次再生プランを作成する第2次再生プラン作成手段と、記憶手段に記憶された再生データの再生速度を指示するための指示手段と、第2次再生プラン作成手段により作成された第2次再生プランに従って、記憶手段から再生データを取得する取得手段と、取得手段により取得された再生データを所定の出力装置に出力させる出力制御手段と、を備え、第1次再生プラン作成手段は、指示手段により指示された再生速度に応じた、現時点から未来に亘る第1次再生プランを作成し、最適化問題は、目的関数として、所定の値を最小又は最大にするために、制約条件として、第2次再生プランによる再生位置、再生速度及び再生加速度のうちの少なくとも1つの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まるように、線形計画問題として線形計画法を用いて解くものであり、所定の値は、第1次再生プランと第2次再生プランとの差を含んでいる。
したがって、再生データの再生速度の変化を、ユーザが指示する再生速度との差を最小にし、且つ、判別可能条件の内部に収まるという制約条件を満たすように調整できるため、ユーザにとって視聴しやすい状態で再生データの可変速再生を行うことができる。
以下、図を参照して、本発明にかかる再生装置の最良の形態を詳細に説明する。なお、発明の範囲は、図示例に限定されない。
<基礎的実験の概要>
本発明にかかる再生装置1の構成など(実施例)を説明する前に、まず、人間の特性を知るために行った基礎的実験の概要について説明する。
「人間が聞き取ることのできる再生速度変化の限界」が定量化できれば、再生装置1は、その限界に基づいて再生データを再生できるので、視聴者に最も時間的効率のよい視聴をさせることが可能となる。また、「人間がストレスを感じない再生速度変化の限界」が定量化できれば、再生装置1は、その限界に基づいて再生データを再生できるので、視聴者に不快感を生じさせないままで効率のよい視聴をさせることが可能となる。
そこで、人間の特性を知るために、被験者に対して任意の速度変化で話速を変化させた音声を提示できる実験装置1000を作成し、以下の実験を行った。
実験装置1000は、例えば、図1に示すように、スライド型可変抵抗器2000と、モニタ3000と、デジタル信号処理装置4000と、ヘッドホン5000と、スイッチ6000と、などを備えて構成される。
例えば、図1に示すように、操作者は、モニタ3000の画面を見ながら、スライド型可変抵抗器2000を操作するようになっており、被験者は、ヘッドホン5000から出力される音声を聞きながら、スイッチ6000を操作するようになっている。
また、実験装置1000は、例えば、図1に示すように、実験結果解析用計算機9000と接続されており、実験装置1000により得られた実験結果は、実験結果解析用計算機9000において解析されるようになっている。
操作者は、例えば、スライド型可変抵抗器2000を操作して、記憶媒体4100に記憶された音声データの再生速度を随時変化させる。
具体的には、操作者は、例えば、音声データの再生プランの軌跡がマクロ速度−加速度平面(後述)をまんべんなくうめつくすように、モニタ3000に表示されるマクロ速度−加速度平面図を見ながら、スライド型可変抵抗器2000を操作する。
デジタル信号処理装置4000は、例えば、SD(Secure Digital)メモリカードなどの記憶媒体4100に記憶された音声データをスライド型可変抵抗器2000の位置に応じた再生速度で再生して、実験結果を記録する。
具体的には、デジタル信号処理装置4000は、例えば、図1に示すように、記憶媒体4100と、読取部4200と、デコーダ4300と、時間軸変換部4400と、制御部4500と、実験結果記録用メモリ4600と、などを備えて構成される。
制御部4500は、例えば、図1に示すように、CPU(Central Processing Unit)4510と、RAM(Random Access Memory)4520と、記憶部4530と、などを備えて構成されている。
記憶部4530は、例えば、図1に示すように、再生速度決定プログラム4531と、読取位置決定プログラム4532と、マクロ速度/加速度算出プログラム4533と、マクロ速度/加速度グラフ化プログラム4534と、音声強度算出プログラム4535と、などを記憶している。
CPU4510は、例えば、再生速度決定プログラム4531を実行して、スライド型可変抵抗器2000の位置に応じた再生速度V(t)を決定する。
次いで、CPU4510は、例えば、読取位置決定プログラム4532を実行して、当該決定された再生速度V(t)に基づいて、記憶媒体4100に記憶された音声データの読取位置を決定する。
次いで、読取部4200は、制御部4500から入力される制御信号に従って、例えば、記憶媒体4100に記憶された音声データのうちの当該決定された読取位置にある音声データを取得して、デコーダ4300に出力する。
次いで、デコーダ4300は、制御部4500から入力される制御信号に従って、例えば、読取部4200から入力された音声データにデコード等の所定の処理を施して、時間軸変換部4400及び制御部4500に出力する。
次いで、時間軸変換部4400は、制御部4500から入力される制御信号に従って、例えば、異音を発生させることなく、ピッチを変えずに話速のみを変化させる既存の時間軸変換技術(例えば、TSMなど)を用いて、デコーダ4300から入力された音声データの時間軸を変換して、図示しないアンプを介して、ヘッドホン5000に出力する。
これにより、ヘッドホン5000から音声データに基づく音声が出力されることになる。
また、CPU4510は、例えば、マクロ速度/加速度算出プログラム4533を実行して、当該決定された再生速度V(t)に基づいて、マクロ速度(後述)及びマクロ加速度(後述)を算出する。
次いで、CPU4510は、例えば、マクロ速度/加速度グラフ化プログラム4534を実行して、当該算出されたマクロ速度及びマクロ加速度をグラフ化することによって、操作者から指示された再生プラン(再生速度変化)の軌跡が描かれたマクロ速度−加速度平面図を作成し、そのマクロ速度−加速度平面図をモニタ3000に表示させる。
また、CPU4510は、例えば、音声強度算出プログラム4535を実行して、デコーダ4300から入力された音声データに基づいて音声強度P(t)を算出する。
被験者は、例えば、操作者によるスライド型可変抵抗器2000の操作によって再生速度が調整された音声を聞き取り、語句が聞き取れるか否かを判定する。
具体的には、被験者は、例えば、ヘッドホン5000から出力される音声を聞き取り、語句が聞き取れない時区間の間はスイッチ6000を「ON」にし、語句が聞き取れる時区間の間はスイッチ6000を「OFF」にする。
そして、CPU4510は、例えば、再生速度決定プログラム4531を実行したCPU4510により決定された再生速度V(t)と、スイッチ6000の状態Z(t)と、を時系列として実験結果記録用メモリ4600に記録するとともに、例えば、再生された音声が無音区間の音声であるか否かを記録しておくために、音声強度算出プログラム4535を実行したCPU4510により算出された音声強度P(t)も同時に実験結果記録用メモリ4600に記録する。
具体的には、再生速度V(t)の表現の仕方としては、例えば、時刻tにおいて、標準速の場合をV(t)=1.0、2倍速の場合をV(t)=2.0、などとすることにする。
また、スイッチ6000の状態Z(t)の表現の仕方としては、例えば、時刻tにおいて、スイッチ6000が「ON」である場合をZ(t)=1、スイッチ6000が「OFF」である場合をZ(t)=0、とすることにする。
そして、実験結果記録用メモリ4600に記録されたV(t)、Z(t)、P(t)を、実験結果解析用計算機9000に転送して、実験結果解析用計算機9000により解析し、人間が語句を聞き取るためには、再生速度V(t)はどのような条件を満たせばよいか解析した。
人間が語句を聞き取るための条件が単純なものでないことは明らかである。
例えば、「再生速度が2.2倍速よりも小さいと聞き取れる」という単純な条件であれば、所望の条件は、V(t)<2.2となる。
しかしながら、例えば、V(t)=1.0からゆっくり時間をかけて速度を上昇させてV(t)=2.2にする場合は、語句を十分に聞き取れることが多いのに対し、V(t)=1.0から一瞬にして速度を上昇させてV(t)=2.2にする場合は、人間の脳が速度変化に対応し切れずに、変化直後の数秒間は語句の聞き落としが生じてしまうことが多い。
さらに、例えば、0.02秒間はV(t)=10にして、直ぐにV(t)=1.0に戻す場合は、高速度再生の期間がほんの一瞬であるため、語句の聞き取りに何の問題も生じないことが多い。
以上のようなことを考えると、人間が語句を聞き取るための条件は、“V(t)<定数”のように書き表せるような単純なものでないことは明らかである。
そこで、人間が語句を聞き取るための条件は、本質的に2つの指標に関する条件から成り立っていると考えることにする。
第1の指標は、一定幅の時区間での平均再生速度(以下「マクロ速度V(t)」という)である。
第1の指標を、瞬間的な再生速度とせずに、マクロ速度V(t)としたのは、音韻を識別していく場合、ある決まった長さの音声波形が必要であるし、また、音声を語句として識別していく場合、脳の処理速度に限界があるため、単位時間あたりの処理可能な語句の数に制限がありそうだからである。
再生する音声データ(音声波形データ)が、例えば、図2(a)に示すものであるとすると、マクロ速度V(t)は、例えば、図2(b)に示すように、現時点から過去L秒に亘る時区間Lにおける平均再生速度として、すなわち、以下の式(1)のように定義する。
なお、マクロ速度V(t)は、さらに一般的な形として、以下の式(2)の条件を満たす重み関数Wで重みをつけることによって、以下の式(3)のように定義することもできる。図2(d)には、図2(b)を実現するための重み関数Wの例を示す。このとき、W(τ)=1/Lである。
第2の指標は、一定幅の時区間での再生加速度(以下「マクロ加速度A(t)」という)である。
第2の指標として、マクロ加速度A(t)を挙げたのは、上述のように、同じ話速であっても、ゆっくりと速度を変化させたときと、一瞬にして速度を変化させたときとでは、語句の聞き取りに差が出るため、加速度的な指標が必要であると考えたからである。
再生する音声データ(音声波形データ)が、例えば、図2(a)に示すものであるとすると、マクロ加速度A(t)は、例えば、図2(c)に示すように、加速度を評価する2つの時区間(例えば、現時点から過去L秒に亘る時区間と、過去L秒から過去L+L秒に亘る時区間)を決めて、現時点から過去L秒に亘る時区間における平均再生速度と、過去L秒から過去L+L秒に亘る時区間における平均再生速度との差を、両時区間の中心間の時間差(すなわち、現時点から過去L秒に亘る時区間の中央から過去L秒から過去L+L秒に亘る時区間の中央までの時間)で除算したものとして、すなわち、以下の式(4)のように定義する。
なお、マクロ加速度A(t)は、さらに一般的な形として、以下の式(5)の条件を満たす重み関数Wで重みをつけて、時間長Lにわたって速度を加重平均することによって、以下の式(6)のように定義することもできる。
ちなみに、一般的なマクロ加速度の定義である式(6)で式(4)のマクロ加速度を表現するためには、重み関数Wを、以下の式(7)〜(9)とし、時間長Lを、以下の式(10)とすればよい。具体例を示すと、例えば、図2(c)のマクロ加速度は、図2(e)で示される重み関数Wで表現できる。
さて、マクロ速度VM(t)とマクロ加速度AM(t)は、語句の聞き取りに関する人間の負担を定量化したものであり、本来は別個のものである。しかしながら、語句を聞き取ろうとする人間の総合的な負担は、両者の組み合わせによって決まると考えられる。
そこで、マクロ速度VM(t)を横軸にとり、マクロ加速度AM(t)を縦軸にとった2次元平面としてマクロ速度−加速度平面を考え、人間が語句を聞き取り可能な条件(判別可能条件)は、このマクロ速度−加速度平面内にある特定領域の内部であると考えることにする。







操作者が、モニタ3000に表示されたマクロ速度−加速度平面上に描かれていくマクロ速度V(t)とマクロ加速度A(t)とを要素とするベクトルの軌跡(再生プランの軌跡)を見ながら、スライド型可変抵抗器2000を操作することで、再生プランの軌跡でマクロ速度−加速度平面をうめつくしていくことができる。このとき、マクロ速度−加速度平面内の、判別可能条件を満たす領域(Z(t)=0に対応する軌跡が入る領域)と、判別可能条件を満たさない領域(Z(t)=1に対応する軌跡が入る領域)と、をより高い分離度で分離できるパラメータL、L、Lを選択することができれば、判別可能条件を、速度だけの単純な条件よりも、人間の特性により近いものとして記述できることになる。
そこで、マクロ速度−加速度平面における判別可能条件を満たす領域と判別可能条件を満たさない領域とを、より高い分離度で分離できるパラメータL、L、Lの組を探索するために、実験を行った。
図3及び図4は、ある被験者に対してある音声データに基づく音声を聞かせた場合の実験結果の例である。図3は、あまり適切でないパラメータL、L、Lの組(具体的には、L=2.0秒、L=0.5秒、L=0.5秒)を選択した場合の例であり、図4は、適切なパラメータL、L、Lの組(具体的には、L=0.5秒、L=0.25秒、L=1.08秒)を選択した場合の例である。
図3(a)及び図4(a)は、再生時間8分40秒分の再生プランの全軌跡を示し、図3(b)及び図4(b)は、再生時間8分40秒分の再生プランの全軌跡のうちの、被験者が語句を聞き取ることができなかった時区間の軌跡(Z(t)=1に対応する軌跡)のみを抜き出したものを示す。
図3及び図4によれば、図3に示す場合よりも、図4に示す場合の方が判別可能条件を満たす領域と判別可能条件を満たさない領域とを高い分離度で分離できることが分かる。すなわち、図3及び図4によれば、パラメータL、L、Lの組が異なれば、判別可能条件を満たす領域と、判別可能条件を満たさない領域と、の分離に差が出ることが分かる。
このパラメータL、L、Lの組を探索するための実験を、延べ7名の被験者に対して行って総計した結果を図5に示す。
具体的には、図5は、適切なパラメータL、L、Lの組(具体的には、L=0.5秒、L=0.25秒、L=1.08秒)を選択した場合の、マクロ速度−加速度平面における聞き取れる割合(Z(t)=1とZ(t)=0の割合)を図式化したものである。灰色の濃さが濃いほど聞き取れる割合が高いことを示し、灰色の濃さが薄いほど聞き取れる割合が低いことを示し、白色は誰も聞き取ることができなかったことを示す。なお、背景の斜線領域は、再生プランの軌跡が通過しなかった領域である。
図5によれば、適切なパラメータL、L、Lの組を選択すれば、マクロ速度−加速度平面における判別可能条件を満たす領域と判別可能条件を満たさない領域とを、より高い分離度で分離できること(すなわち、語句を聞き取れるか否かの判定をより高い精度で行うこと)ができそうであることが分かる。また、判別可能条件を満たす領域と判別可能条件を満たさない領域との分割の際には、マクロ速度V(t)とマクロ加速度A(t)の何れか一方を用いるよりも、両方を用いるほうがよりよい分割ができそうであることも分かる。
図5に示すマクロ速度−加速度平面を、判別可能条件を満たす領域(S)と、判別可能条件を満たさない領域(S)と、に分割するためには、図6に示すように、数本の直線を用いて折れ線を作り、その折れ線によって領域を分離するのが簡単である。
具体的には、例えば、図6に示した折れ線は、折れ線を構成する4本の直線の組み合わせのうち、領域を最適に分割するものを探索するプログラムを作成して求めたものである。このときの最適性の基準は、以下の式(11)で示される分割の評価関数Eを最小化することとした。
式(11)に示すように、分割の評価関数Eは、「全再生時間の長さに対する、判別可能条件を満たす領域S内にありながら聞き取れなかった時間の長さの割合」と、「全再生時間の長さに対する、判別可能条件を満たさない領域S内にありながら聞き取れた時間の長さの割合」と、の加重和である。加重Wは、前者の方に大きなペナルティを課すための係数であり、例えば、W=6.0程度にすると、良好な結果が得られる。
なお、折れ線を構成する直線の本数は任意であり、例えば、マクロ速度−加速度平面の縦軸に平行な直線及び横軸に平行な直線の2本の直線により構成してもよい。このように構成するためには、マクロ速度V(t)とマクロ加速度A(t)を線形変換して、新たなマクロ速度とマクロ加速度を定義すればよく、新たなマクロ速度とマクロ加速度に与えられた別個の上限のみで判別可能条件を満たす領域Sが定義できるとともに、マクロ速度−加速度平面の縦軸及び横軸に対して平行にならない直線を考える必要がないため、この後の処理の簡易化に役立つ。
いずれにしても、あるパラメータL、L、Lの組に対する分割の評価関数EをE(L,L,L)とすると、分割の評価関数Eを最小にする折れ線を決定するプログラム(すなわち、折れ線を構成する直線の組み合わせの中から領域を最適に分割するものを探索するプログラム)を使えば、E(L,L,L)に最小値を与える特定のパラメータL、L、Lの組を求めることができる。
そこで、パラメータL、L、Lの組の組み合わせを変えて、分割の評価関数Eの変化を調べる実験を行った。
図7は、L=0.5秒に固定して、LとLを変化させたときの分割の評価関数Eの変化を3次元プロットしたものである。図7の水平平面はL−L平面を示し、垂直座標は分割の評価関数Eを示す。すなわち、高さ方向が分割の評価関数Eの大きさであるため、3次元プロットの高さが低い点ほど評価がよいことになる。この結果から、L=0.5秒の場合には、L=0.25秒、L=1.08秒が最適であることが分かった。
図8は、L=0.25秒、L=1.08秒に固定して、Lを変化させたときの分割の評価関数Eの変化を2次元プロットしたものである。図8の横軸はLを示し、縦軸は分割の評価関数Eを示す。この結果から、L=0.25秒、L=1.08秒の場合には、L=0.5秒付近に最適値があることが分かった。
すなわち、図7及び図8によれば、現時点での暫定的な結論であるが、L=0.5秒、L=0.25秒、L=1.08秒の組が、最適なパラメータL、L、Lの組であることが分かった。
なお、音声のエネルギーが小さい時区間は無音区間であると考えられるので、本基礎的実験の結果の解析からは除外してある。具体的には、例えば、実験結果記録用メモリ4600に記録された音声強度P(t)を用いて、その音声強度P(t)を前後合計1秒間で平均した平均音声強度を算出し、平均音声強度が閾値よりも低ければ、無音区間であると推定して解析から取り除いた。当該閾値は、全時区間に対する無音区間の割合が10%程度となるよう調整してあるものを用いた。
また、被験者がスイッチ6000をON/OFFする反応時間についても、所定の方法で補正してある。
本基礎的実験の実験結果をまとめると、適切なマクロ速度V(t)とマクロ加速度A(t)を定義すれば、人間が語句を聞き取ることができるか否かは、そのマクロ速度V(t)とマクロ加速度A(t)とを要素とするベクトルの軌跡(再生プランの軌跡)が、マクロ速度−加速度平面を折れ線で分割した領域のうちの判別可能条件を満たす領域S内に入っているか否かから推定することができる。したがって、ユーザに語句を聞き取らせるためには、常に判別可能条件を満たす領域S内に入るような再生プランを設計すればよいわけである。
なお、L=0.5秒、L=0.25秒、L=1.08秒という値や、図6で示した折れ線の傾きや本数などは、現時点での暫定的な結論にすぎないため、これに限られることはない。
しかしながら、ある一定幅の時区間での再生速度を式(3)や式(6)のように加重平均して(線形和をとって)、2つ以上のマクロ指標(例えば、マクロ速度V(t)とマクロ加速度A(t))を生成し、このマクロ指標に対する不等式(例えば、図6のマクロ速度−加速度平面に示した折れ線の内側)によって聞き取りの可否を判定する点、すなわち、一定時区間での再生速度の線形結合を2つ以上生成し、これらの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面(例えば、マクロ速度−加速度平面)内にある判別可能条件を示す予め設定された領域Sの内部に収まるか否かによって聞き取りの可否を判定する点、は普遍であり、これが本発明での本質である。
<マクロ速度及びマクロ加速度を定式化する>
次に、基礎的実験の概要において定義したマクロ速度及びマクロ加速度を定式化する手法について説明する。
ユーザが指定する再生速度による時間進行を第1次再生プランPとし、時刻tにおける第1次再生プランPによる再生位置をP(t)とする。これは、ユーザの世界での時刻tにおいて、再生データの時間座標P(t)の部分が再生されることを意味する。
これに対し、第1次再生プランPを人間の特性に応じて修正した時間進行を第2次再生プランPとし、時刻tにおける第2次再生プランPによる再生位置をP(t)とする。
ここで、本来、時刻tは、単位が“秒”の連続量であるが、デジタル信号処理を行う場合、離散化しておいたほうが都合がよい。そこで、時間軸は、サンプリング周波数Fで離散化されており、時刻tは離散時間でのサンプリング番号を表すこととする。すなわち、t=0は、ユーザ時間での0秒を指し、t=1は、ユーザ時間での1/F秒を指すものとする。また、以下では、時区間を示すパラメータL、L、Lについてもサンプリング周波数Fでのサンプル数で表すことにする。
なお、サンプリング周波数Fの値は任意であるが(好ましくは、数Hz〜100Hz程度)、再生データが音声データ及び映像データにより構成される場合は、サンプリング周波数Fを映像のフレーム周波数(例えば、30Hzや60Hzなど)と一致させておくと実装が容易になる。
また、再生データの時間座標も、本来は単位が“秒”であるが、再生データを構成する音声データのサンプリング周波数Fでのサンプル数で表現しておくと都合がよい。例えば、サンプリング周波数Fが44.1kHzである場合、P(t)=0は、再生データの開始地点を指し、P(t)=1は、再生データの開始地点から1/44100秒経過した位置を指すものとする。
以上のように取り決めると、式(1)で定義されるマクロ速度V(t)は、第2次再生プランPによる再生位置P(t)に対しては、以下の式(12)のように書き表すことができる。
式(3)で定義される、より一般的なマクロ速度V(t)については、式(12)と同様、異なる時点におけるP(t)の線形結合になる。すなわち、より一般的なマクロ速度V(t)は、P(t)との関係が以下の式(13)で表される第2次再生プランPによる再生速度V(t)を用いると、以下の式(14)のように書き表すことができ、そして、式(13)の関係を使えば、式(14)は、以下の式(15)、さらには以下の式(16)のように書き直すことができる。
式(4)で定義されるマクロ加速度A(t)は、第2次再生プランPによる再生位置P(t)に対しては、以下の式(17)、さらには以下の式(18)のように書き表すことができ、マクロ加速度A(t)も、マクロ速度V(t)と同様、異なる時点におけるP(t)の線形結合になっている。
式(6)で定義される、より一般的なマクロ加速度A(t)については、式(6)が式(3)と類似の形をしていることを利用して、式(16)の結果をそのまま使って、以下の式(19)のように書き表すことができる。
式(12)、式(16)、式(18)、式(19)を総合すると、マクロ速度V(t)も、マクロ加速度A(t)も、異なる時点におけるP(t)の線形結合で書き表すことができることが分かる。そこで、時間τだけ過去のP(t)に対する線形加重を新たにM(τ)若しくはM(τ)と記述することにすると、式(12)、式(16)は、以下の式(20)のように書き直すことができ、式(18)、式(19)は、以下の式(21)のように書き直すことができる。
ここで、式(20)及び式(21)のLは、式(12)と式(18)の定義においては、LとL+Lのうちの何れか大きな方であり、式(16)と式(19)の定義においては、LとL(=L+L)のうちの何れか大きな方である。
式(20)及び式(21)は、第1次再生プランPによる再生位置P(t)と第2次再生プランPによる再生位置をP(t)との差d(t)(=P(t)−P(t))を使うと、それぞれ以下の式(22)及び式(23)のように書き表すことができる。なお、式(22)及び式(23)において、負のτに対するd(t−τ)は、“0”であるものとしておく。
なお、マクロ速度V(t)とマクロ加速度A(t)を再生位置(P(t)若しくはP(t))で書き表したが、すなわち、マクロ速度V(t)とマクロ加速度A(t)を再生位置の関数として議論したが、第2次再生プランPによる再生速度V(t)は、V(t)=(F/F)(P(t)−P(t−1))で再生位置と関係付けられており、第2次再生プランPによる再生加速度A(t)は、A(t)=F(V(t)−V(t−1))で再生速度と関係付けられているので、マクロ速度V(t)とマクロ加速度A(t)を、再生位置の関数とする代わりに、再生速度の関数や再生加速度の関数としても本質的には同じことである。
<線形計画法に帰着させる>
次に、定式化したマクロ速度V(t)及びマクロ加速度A(t)を、線形計画法に帰着させる手法について説明する。
まず、図6に示した折れ線を定式化する。
判別可能条件を満たす領域Sは、折れ線で囲まれた凸領域であり、その折れ線は、K本の直線で構成されているとする。このとき、マクロ速度V(t)とマクロ加速度A(t)を持つ再生プランの時刻tの瞬間が、Sに含まれる条件は、V(t)とA(t)に関する線形条件として、以下の式(24)のようにK個の不等式で書き表すことができる。ここで、式(24)のCVk、CAk、CCkは、折れ線を構成する各直線の位置や傾きによって決まるパラメータである。
現時点が時刻tであるとする。単純に考えると、式(24)をt=tにおいて満たすという制約のもとで、第1次再生プランPによる再生位置P(t)と第2次再生プランPによる再生位置P(t)との差|d(t)|=|P(t)−P(t)|を最小にするという問題を解いて、P(t)を決定すればよさそうである。しかしながら、式(24)を構成するマクロ速度V(t)やマクロ加速度A(t)が、過去の時点におけるP(t)によって定義されているため、t=tにおいて式(24)が満たせても、t>tにおいては式(24)が満たせなくなってしまう可能性がある。
このような障害が起こらないようにするために、現時点の時刻tでの第2次再生プランPの決定において、未来の数秒間(例えば、Lサンプル分の時区間)で式(24)が成立するように、時刻tの時点で制約してやる必要がある。
そのためには、まず、未来の第1次再生プランPを予測しなければならない。
具体的には、操作者から指示される再生速度を予測して、t<t<t+LにおいてP(t)を決める。
操作者から指示される再生速度の予測の仕方については、任意であるが、例えば、操作者による現操作が継続される(例えば、「早送りボタン」が押されているなら押し続けられる)と仮定して決めてもよいし、スライド型可変抵抗器2000のように自由に再生速度を設定できる操作器が操作されている場合は、その速度変化が一定である(例えば、加速が続いているならば同じ加速度で加速する)と仮定して決めてもよい。また、操作者が断続的に「早送りボタン」を押しているならば、今回の「早送りボタン」の押下時間も、前回の「早送りボタン」の押下時間とほぼ同一であると仮定して決めてもよい。また、「早送りボタン」の他に、例えば、10倍速での5秒飛ばしを指示するための「5秒飛ばしボタン」や、10倍速での15秒飛ばしを指示するための「15秒飛ばしボタン」が設けられた操作器が操作されている場合は、「5秒飛ばしボタン」が押されたならば、直後の0.5秒間は10倍速になり、「15秒飛ばしボタン」が押されたならば、直後の1.5秒間は10倍速になって、その後は標準速に戻ると予測できる。
さて、現時点が時刻tであるとすると、P(t)は、t<tに対しては既に確定しており、t≧tに対して再生位置P(t)と再生位置P(t)との差d(t)で調整する必要があるので、以下の式(25)のように書き表すことができる。
マクロ速度V(t)及びマクロ加速度A(t)を、それぞれ式(20)及び式(21)で定義するものと仮定して、式(25)を、式(20)及び式(21)に代入すると、それぞれ以下の式(26)及び式(27)のようになる。
ここで、現時点では、式(26)及び式(27)における時刻tとして、t=tからt=t+LJ−1のL個が使われることを考えると、j(j=0,1,…,L−1)を使って、時刻tを、t=t+jと表現しておくと都合がよい。また、第1次再生プランPによる再生位置P(t+j)と第2次再生プランPによる再生位置P(t+j)との差d(t+j)を、d(t+j)=dと記述することにする。
このように取り決めると、式(26)及び式(27)は、それぞれ以下の式(28)及び式(29)のように書き直すことができる。
一方、折れ線による制約式は、折れ線を構成する直線の本数をK本とすると、KL個の不等式として、以下の式(30)のように書き表すことができる。
そして、式(30)に、式(28)と式(29)を代入すると、以下の式(31)のようになる。ここで、式(31)のQ(τ)は、以下の式(32)であり、式(31)のPjkは、以下の式(33)である。
次に、目的関数を決定する。目的関数とは、線形計画法において最小にすべき値である。ここでは、目的関数は、例えば、第1次再生プランPによる再生位置P(t+j)と第2次再生プランPによる再生位置P(t+j)との差dの累積として、以下の式(34)のように定義する。
以上をまとめると、以下の線形計画問題LP1(t,L)が導かれる。
線形計画問題LP1(t,L)は、目的関数として、第1次再生プランPによる再生位置P(t+j)と第2次再生プランPによる再生位置P(t+j)との差dを最小にするために、制約条件として、第2次再生プランPによる再生位置P(t+j)の線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面(マクロ速度−加速度平面)内にある判別可能条件を示す予め設定された領域(判別可能条件を満たす領域S)の内部に収まるように、線形計画法を用いて解くものとなっている。
なお、制約条件を再生位置(P(t)若しくはP(t))で書き表したが、第2次再生プランPによる再生速度V(t)は、V(t)=(F/F)(P(t)−P(t−1))で再生位置と関係付けられており、第2次再生プランPによる再生加速度A(t)は、A(t)=F(V(t)−V(t−1))で再生速度と関係付けられているので、制約条件を、再生位置で書き表す代わりに、再生速度や再生加速度で書き表しても本質的には同じことである。したがって、制約条件は、第2次再生プランPによる再生位置P(t+j)、再生速度V(t+j)及び再生加速度A(t+j)のうちの少なくとも1つの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まる条件であれば任意である。
ここで、線形計画問題LP1(t,L)において、d(j=0,1,…,L−1)を非負に限定することについて説明する。通常、第2次再生プランPは、第1次再生プランPの再生速度を緩和したものになり、d(t)<0の必要がないので、d(t)≧0の条件があっても邪魔にならない。さらに、条件設定によっては起こるかもしれないオーバーシュートの問題を回避するには都合がよい。また、こうすることで、目的関数の定義に絶対値の演算が不要となるため、既存の線形計画法の枠組みに入れ易くなる。
ちなみに、式(34)で定義した目的関数は、第1次再生プランPに対する第2次再生プランPの遅れ時間の単なる総和として定義しているが、場合によっては、これを重み付け総和としてもよい。
<線形計画法を改良する>
次に、線形計画問題LP1(t,L)を改良する手法について説明する。
線形計画問題LP1(t,L)では、制約条件の範囲内で、第1次再生プランPによる再生位置P(t+j)と第2次再生プランPによる再生位置P(t+j)との差dの累積を最小にする解は見つかるが、最適性を極限まで追求してしまうため、結果として得られた第2次再生プランPは速度変動の激しいものになってしまうことが起こりうる。
そこで、第2次再生プランPによる再生加速度の大きさ、すなわち、速度の加速/減速の度合いを目的関数に加味することにする。
速度の加速/減速の度合いを目的関数に加味するために、加速と減速を表す変数を導入することにする。加速と減速は、第1次再生プランPによる再生位置P(t+j)と第2次再生プランPによる再生位置P(t+j)との差d(以下「修正量d」という)で書き表すことができるので、新たな変数を導入する必要がないように思われるが、線形計画法の枠組みではそのままでは絶対値の演算が扱えないため、新たな変数を導入するのが有効である。
具体的には、例えば、加速と減速を別々の正の変数として記述しておき、加減速の変動をそれらの和として書き表すことにする。
以上の方針に沿って、非負の変数a,b(j=0,1,…,L−1)を導入する。そして、時刻t+jでの(離散時間での)加速度がa−bであるものとする。線形計画法の枠組みに入れるためには、加速度a−bと、修正量dと、の関係を等式で表現しておく必要がある。これには、時刻tでの(離散時間での)再生速度をV(t)として記述することにすると、サンプリング周波数Fでのサンプル数を単位とした加速度の差として、以下の式(35)、さらには以下の式(36)のように計算できる。
式(36)を、式(25)を使って変形すると、j=0、j=1及びj≧2の3つのケースについて、それぞれ以下の式(37)、式(38)及び式(39)のようになる。
さらに、式(37)、式(38)及び式(39)の変数(最適化問題において調整すべき量)を左辺に集めると、それぞれ以下の式(40)、式(41)及び式(42)のようになる。
そして、式(40)〜式(42)の右辺をまとめてRと記述することにすると、加速度a−bと、修正量dと、の間の等式関係は、以下の式(43)のようにまとめられる。
ここで、式(43)でj=0、j=1とした場合に形式上あらわれてくる変数d−2、d−1は、既に過ぎてしまった過去に対する修正量dとなってしまうので、“0”と定義しておく。
次に目的関数を修正する。加速/減速が過度に起こらないようにするためには、目的関数を、以下の式(44)のように定義すればよい。ここで、αは加速することのペナルティの重さであり、βは減速することのペナルティの重さである。ペナルティの重さは、ズレとの間の相対的な関係として記述することにする。すなわち、具体的には、例えば、加速度が1s/s(=標準速から2倍速へ1秒で推移する加速度)であることと対等とみなせるズレの時間が、加速のときはαであり、減速のときはβである。
以上をまとめると、以下の改良型の線形計画問題LP2(t,L)が導かれる。
改良型の線形計画問題LP2(t,L)は、目的関数として、第1次再生プランPによる再生位置P(t+j)と第2次再生プランPによる再生位置P(t+j)との差dと、第2次再生プランPによる再生加速度の大きさa+bと、の和を最小にするために、制約条件として、第2次再生プランPによる再生位置P(t+j)の線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面(マクロ速度−加速度平面)内にある判別可能条件を示す予め設定された領域(判別可能条件を満たす領域S)の内部に収まるように、線形計画法を用いて解くものとなっている。
なお、制約条件を再生位置(P(t)若しくはP(t))で書き表したが、第2次再生プランPによる再生速度V(t)は、V(t)=(F/F)(P(t)−P(t−1))で再生位置と関係付けられており、第2次再生プランPによる再生加速度A(t)は、A(t)=F(V(t)−V(t−1))で再生速度と関係付けられているので、制約条件を、再生位置で書き表す代わりに、再生速度や再生加速度で書き表しても本質的には同じことである。したがって、制約条件は、第2次再生プランPによる再生位置P(t+j)、再生速度V(t+j)及び再生加速度A(t+j)のうちの少なくとも1つの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まる条件であれば任意である。
以上、説明したように、現時点から未来に亘る時区間における第2次再生プランPの決定に関する問題を、線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L)に帰着させることができた。線形計画法は広い分野で使用されているアルゴリズムであるため、既存のサブルーチンなどを利用してソフトウエアを実装することが可能になる。
なお、線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L)は、現時点から未来に亘る時区間(時刻tから始まるLサンプル分の時区間)における第2次再生プランPを求める方法にすぎない。再生データ全体を再生するためには、この方法を繰り返し適用していく必要がある。
<実施例>
[再生装置の構成]
本発明の再生装置1は、例えば、音声データにより構成される再生データの再生時に、当該再生データの記録時の速度とは異なる速度で再生を行う、CD(Compact Disc)プレーヤや、DVD(Digital Versatile Disc)プレーヤ、ハードディスクプレーヤ、パーソナルコンピュータなどである。
具体的には、再生装置1は、例えば、ユーザによる操作部15の操作によって指示された再生速度Vに基づいて、未来の再生速度を予測して、現時点から未来に亘る第1次再生プランPを作成する。
そして、再生装置1は、当該作成した第1次再生プランPと予め決定しておいた人間の特性に関するパラメータを基に、最適化問題を線形計画問題(線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L))として線形計画法を用いて解くことによって、現時点から未来に亘る第2次再生プランPを作成する。
そして、再生装置1は、当該作成した第2次再生プランPに従って、記憶媒体11に記憶されている再生データを順次取得して、その再生データの断片を時間軸変換技術により滑らかにつないで、音声出力装置3から出力するようになっている。
より具体的には、再生装置1は、例えば、図9に示すように、記憶媒体11と、読取部12と、デコーダ13と、時間軸変換部14と、操作部15と、制御部16と、などを備えて構成される。
また、再生装置1は、例えば、図9に示すように、時間軸変換部14を介して、所定の出力装置としての音声出力装置3を接続している。
記憶媒体11は、例えば、記憶手段として、音声データにより構成される再生データを予め記憶している。
なお、記憶媒体11は、例えば、CDや、DVD、HDD(Hard Disk Drive)、半導体メモリ、メモリカードなどの、データの読み取りが可能な記憶媒体であれば任意である。
読取部12は、制御部16から入力される制御信号に従って、例えば、取得手段として、第2次再生プラン作成プログラム163b2を実行したCPU161により作成された第2次再生プランPに従って、記憶媒体11から再生データを取得して、デコーダ13に出力する。
デコーダ13は、制御部16から入力される制御信号に従って、例えば、読取部12から入力された再生データにデコード等の所定の処理を施して、時間軸変換部14に出力する。
時間軸変換部14は、制御部16から入力される制御信号に従って、例えば、時間軸変換手段として、デコーダ13から入力された再生データの波形の一致度を考慮して、既存の時間軸変換技術(例えば、TSMなど)などを用いて、当該再生データの時間軸を変換し、図示しないアンプを介して、音声出力装置3に出力する。
音声出力装置3は、例えば、スピーカ機器等であり、例えば、時間軸変換部14から入力された再生データ(音声データ)に基づく音声を出力する。
操作部15は、例えば、再生装置1の外面に設けられた「早送りボタン」や「巻戻しボタン」などの操作ボタン(図示省略)や、「早送りボタン」や「巻戻しボタン」などの操作ボタンを有する再生装置1用のリモコン(図示省略)及びリモコンと通信可能なリモコン受信部(図示省略)などにより構成され、例えば、ユーザにより操作されると、当該操作に伴う各種信号を制御部16に出力する。
具体的には、操作部15は、例えば、指示手段として、ユーザが、記憶媒体11に記憶された再生データの再生速度Vを指示する際に操作される。
制御部16は、例えば、図9に示すように、CPU161と、RAM162と、記憶部163と、などを備えて構成される。
CPU161は、例えば、記憶部163に記憶された再生装置1用の各種処理プログラムに従って各種の制御動作を行う。
RAM162は、例えば、CPU161によって実行される処理プログラムなどを展開するためのプログラム格納領域や、入力データや上記処理プログラムが実行される際に生じる処理結果などを格納するデータ格納領域などを備える。
記憶部163は、例えば、再生装置1で実行可能なシステムプログラム、当該システムプログラムで実行可能な各種処理プログラム、これら各種処理プログラムを実行する際に使用されるデータ、CPU161によって演算処理された処理結果のデータなどを記憶する。なお、プログラムは、コンピュータが読み取り可能なプログラムコードの形で記憶部163に記憶されている。
具体的には、記憶部163は、例えば、図9に示すように、パラメータ記憶ファイル163a1と、第1次再生プラン蓄積ファイル163a2と、第2次再生プラン蓄積ファイル163a3と、第1次再生プラン作成プログラム163b1と、第2次再生プラン作成プログラム163b2と、再生制御プログラム163b3と、などを記憶している。
パラメータ記憶ファイル163a1は、例えば、予め決定しておいた人間の特性に関するパラメータとして、M(τ)、M(τ)、CVk、CAk、CCkなどを記憶している。
第1次再生プラン蓄積ファイル163a2は、例えば、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPによる再生位置P(t)を蓄積する。
第2次再生プラン蓄積ファイル163a3は、例えば、第2次再生プラン作成プログラム163b2を実行したCPU161により作成された第2次再生プランPによる再生位置P(t)を蓄積する。
第1次再生プラン作成プログラム163b1は、例えば、ユーザによる操作部15の操作により指示された再生速度Vに応じた、現時点から未来に亘る第1次再生プランPを作成する機能を、CPU161に実現させる。
CPU161は、かかる第1次再生プラン作成プログラム163b1を実行することによって、第1次再生プラン作成手段として機能する。
第2次再生プラン作成プログラム163b2は、例えば、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPと、パラメータ記憶ファイル163a1に記憶されたM(τ)、M(τ)、CVk、CAk、CCkなどと、を基に、最適化問題を、線形計画問題(線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L))として線形計画法を用いて解くことによって、当該第1次再生プランPを修正した現時点から未来に亘る第2次再生プランPを作成する機能を、CPU161に実現させる。
また、第2次再生プラン作成プログラム163b2は、例えば、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPと、当該作成された第2次再生プランPと、の差が予め設定された規定範囲内にあるか否かを判断し、規定範囲内にないと判断した場合は、「語句の聞き取り」を確保したままでは、ユーザにより指示された再生速度Vに応じた再生位置(第1次再生プランPによる再生位置P(t))と、実際の再生位置(第2次再生プランPによる再生位置P(t))と、の差が大きすぎるため、当該作成された第2次再生プランPを、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPで置き換える機能を、CPU161に実現させる。
CPU161は、かかる第2次再生プラン作成プログラム163b2を実行することによって、第2次再生プラン作成手段及び判断手段として機能する。
再生制御プログラム163b3は、例えば、第2次再生プラン作成プログラム163b2を実行したCPU161により作成された現時点から未来に亘る第2次再生プランPに従って、記憶媒体11に記憶された再生データを再生する機能を、CPU161に実現させる。
具体的には、CPU161は、例えば、読取部12に制御信号を入力して、第2次再生プラン作成プログラム163b2を実行したCPU161により作成された第2次再生プランPに従って、記憶媒体11から再生データを取得させ、そして、デコーダ13や時間軸変換部14に制御信号を入力して、読取部12により取得された再生データを音声出力装置3に出力させる。
CPU161は、かかる再生制御プログラム163b3を実行することによって、出力制御手段として機能する。
[再生処理]
次に、再生装置1による記憶媒体11に記憶された再生データの再生に関する処理について、図10のフローチャートを参照して説明する。
ユーザによる操作部15の操作によって、記憶媒体11に記憶された再生データを再生するよう指示されると(ステップS1)、CPU161は、RAM162内の「現時点の時刻t」記憶領域に“0”を設定する(ステップS2)。
次いで、CPU161は、ユーザによる操作部15の操作によって指示された、記憶媒体11に記憶された再生データを再生する際の再生速度Vを読み込む(ステップS3)。
次いで、CPU161は、第1次再生プラン蓄積ファイル163a2にP(t)が蓄積されているか否か、すなわち、前もって予測していた、時刻tにおける第1次再生プランPによる再生位置P(t)が存在するか否かを判断する(ステップS4)。
ステップS4で、前もって予測していたP(t)が存在しないと判断すると(ステップS4;No)、CPU161は、第1次再生プラン作成プログラム163b1を実行して、現時点から未来に亘る第1次再生プランPを作成する(ステップS5)。
具体的には、CPU161は、例えば、ステップS3で読み込んだ再生速度Vと、第1次再生プラン蓄積ファイル163a2に蓄積されているP(t−1)と、に基づいて、現時点における第1次再生プランPによる再生位置P(t)(=P(t−1)+(F/F)V)を作成して(ステップS5a)、第1次再生プラン蓄積ファイル163a2に記憶させる。
次いで、CPU161は、未来の第1次再生プランPを予測することによって、未来における第1次再生プランPによる再生位置P(t+j)(j=1,2,…,L−1)を作成して(ステップS5b)、第1次再生プラン蓄積ファイル163a2に記憶させる。
次いで、CPU161は、第2次再生プラン作成プログラム163b2を実行して、現時点から未来に亘る第2次再生プランPを作成して(ステップS6)、ステップS9の処理に移行する。
具体的には、CPU161は、例えば、線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L)を解いて、修正量d(j=0,1,…,L−1)を求める(ステップS6a)。
次いで、CPU161は、第1次再生プラン蓄積ファイル163a2に蓄積されている現時点から未来に亘る第1次再生プランPによる再生位置P(t+j)(j=0,1,…,L−1)と、ステップS6aで求めた修正量d(j=0,1,…,L−1)と、に基づいて、現時点から未来に亘る第2次再生プランPによる再生位置P(t+j)(j=0,1,…,L−1)を作成して(ステップS6b)、第2次再生プラン蓄積ファイル163a3に記憶させて、ステップS9の処理に移行する。
また、ステップS4で、前もって予測していたP(t)が存在すると判断すると(ステップS4;Yes)、CPU161は、ステップS3で読み込んだ再生速度Vと、第1次再生プラン蓄積ファイル163a2に蓄積されているP(t−1)と、に基づいて作成した現時点における第1次再生プランPによる再生位置P(t−1)+(F/F)Vが、前もって予測していたP(t)にほぼ等しいか否かを判断する(ステップS7)。
ステップS7で、P(t−1)+(F/F)Vが、前もって予測していたP(t)にほぼ等しくないと判断すると(ステップS7;No)、CPU161は、ステップS5の処理に移行する。
一方、ステップS7で、P(t−1)+(F/F)Vが、前もって予測していたP(t)にほぼ等しいと判断すると(ステップS7;Yes)、CPU161は、第2次再生プラン蓄積ファイル163a3にP(t)が蓄積されているか否か、すなわち、時刻tにおける第2次再生プランPによる再生位置P(t)が作成されているか否かを判定する(ステップS8)。
ステップS8で、P(t)が作成されていないと判断すると(ステップS8;No)、CPU161は、ステップS5の処理に移行する。
一方、ステップS8で、P(t)が作成されていると判断すると(ステップS8;Yes)、CPU161は、P(t)−P(t)が、予め設定された規定範囲内にあるか否かを判断する(ステップS9)。
ステップS9で、P(t)−P(t)が規定範囲内にないと判断すると(ステップS9;No)、CPU161は、P(t)をP(t)で置き換える(ステップS10)。
次いで、CPU161は、RAM162内の「聞き取り可否U(t+j)」記憶領域のうちのj=0の領域、すなわち、「聞き取り可否U(t)」記憶領域に“1”を設定することによって(ステップS11)、時刻t+j(j=0)においては判別可能条件を満たす領域Sに収まらない旨を記録して、ステップS13の処理に移行する。
一方、ステップS9で、P(t)−P(t)が規定範囲内にあると判断すると(ステップS9;Yes)、CPU171は、RAM162内の「聞き取り可否U(t+j)」記憶領域のうちのj=0の領域、すなわち、「聞き取り可否U(t)」記憶領域に“0”を設定することによって(ステップS12)、時刻t+j(j=0)においては判別可能条件を満たす領域Sに収まる旨を記録する。
次いで、CPU161は、再生制御プログラム163b3を実行して、P(t)で記憶媒体11に記憶された再生データの再生を行う(ステップS13)。
具体的には、CPU171は、読取部11に、記憶媒体11に記憶された再生データのうちの時間座標P(t)の部分を取得させ、当該取得された再生データを、デコーダ13や時間軸変換部14を介して、音声出力装置3に出力させる。これにより、音声出力装置3から再生データに基づく音声が出力される。
次いで、CPU161は、RAM162内の「現時点の時刻t」記憶領域に“t+1”を設定して(ステップS14)、ステップS3以降の処理を繰り返して行う。
そして、CPU161は、ステップS3〜ステップS14の処理を、例えば、ユーザによる操作部15の操作によって再生データの再生を終了するよう指示されるまで、或いは、記憶媒体11に記憶された再生データを再生し尽すまで、繰り返して行う。
次に、再生装置1の再生処理(図10)によって各変数が更新されていく様子を、例えば、図11に示す。図11の横軸は時間軸である。
時刻t=tにおいて、再生装置1は、線形計画問題を解く前に、tから始まるLサンプル分について、第1次再生プランPによる再生位置P(t+j)(j=0,1,…,L−1)を予測して作成し、第1次再生プラン蓄積ファイル163a2に記憶させる。
そして、再生装置1は、第1次再生プラン蓄積ファイル163a2に蓄積されている第1次再生プランPによる再生位置P(t)のうちの、過去におけるLサンプル分の再生位置と、未来におけるLサンプル分の再生位置と、を使って、線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L)を、線形計画法を用いてtから始まるLサンプル分について解くことによって、L個の修正量d(j=0,1,…,L−1)を得る。
そして、再生装置1は、得られた修正量d(j=0,1,…,L−1)のうちの最初のL個を使って、第2次再生プランPによる再生位置P(t+j)(j=0,1,…,L−1)を作成し、第2次再生プラン蓄積ファイル163a3に記憶させる。すなわち、線形計画問題は、サンプリング周波数Fにおける、Lサンプル分の時区間毎に解かれるようになっている。
その後、ユーザによる操作部15の操作によって再生速度の変更指示がなければ、すなわち、再生装置1の再生処理(図10)のステップS7がYesならば、Lサンプル分の時区間は、第2次再生プラン蓄積ファイル163a3に蓄積された第2次再生プランPに従って再生データの再生が行われる。
そして、時刻t=t+Lになると、新たな線形計画問題が生成されて、それが解かれることになる。
ここで、Lサンプル分の時区間は、例えば、1秒〜2秒程度の時区間であり、Lサンプル分の時区間は、Lサンプル分の時区間よりも短く、例えば、0.5秒〜1秒程度の時区間である。
なお、ユーザによる操作部15の操作によって再生速度の変更指示があった場合は、線形計画問題を解きなおす必要がある。
また、第1次再生プランPによる再生位置P(t)と第2次再生プランPによる再生位置P(t)との差(P(t)−P(t))が、予め設定された規定範囲内に収まらない場合は、ユーザに対する「語句の聞き取り」を確保したままでは、ユーザにより指示された再生速度に応じた再生位置と、実際の再生位置と、の差が大きすぎるため、P(t)をP(t)で置き換えて、この差を一気に取り戻すようにしたが(具体的には、例えば、図10のステップS10参照)、これに限ることはなく、例えば、所定の速度(例えば、8倍速など)で高速度再生することによって、この差を縮めるようにしてもよい。
次に、第1次再生プランPと、再生装置1の再生処理(図10)を実行して改良型の線形計画問題LP2(t,L)を順次解くことによって作成した第2次再生プランPと、について、例えば、図12及び図13に示すマクロ速度−加速度平面を用いて比較する。
図12と図13は、異なる2種類の判別可能条件を満たす領域Sについて、改良型の線形計画問題LP2(t,L)で再生装置1の再生処理(図10)を行った結果である。パラメータは、L=90(1.5秒相当)、L=30(0.5秒相当)、α=β=0.011に設定した。
図12は、図6で得られた折れ線を使用した場合である。
図12(a)には、1倍速〜4倍速の変速を含む3分間の第1次再生プランPの軌跡を示し、図12(b)には、図12(a)の第1次再生プランPを基に、判別可能条件を満たす領域S内に収まるように、改良型の線形計画問題LP2(t,L)を順次適用していくことで作成した第2次再生プランPの軌跡を示す。
図12(a)によれば、判別可能条件を満たす領域Sから逸脱している軌跡が多く含まれるため、聞き落としが多く発生すると推測される。
これに対し、図12(b)によれば、判別可能条件を満たす領域S内に全ての軌跡が収まっているため、ほぼ聞き落としがないと期待できる。
図13は、図6で得られた折れ線よりも、マクロ加速度A(t)の条件を厳しくした折れ線を使用した場合である。
図13(a)は、図12(a)と同一の軌跡であり、図13(b)には、図13(a)の第1次再生プランPを基に、判別可能条件を満たす領域S内に収まるように、改良型の線形計画問題LP2(t,L)を順次適用していくことで作成した第2次再生プランPの軌跡を示す。
図13(a)によれば、図12(a)と同様、判別可能条件を満たす領域Sから逸脱している軌跡が多く含まれるため、聞き落としが多く発生すると推測される。
これに対し、図13(b)によれば、図12(b)と同様、判別可能条件を満たす領域S内に全ての軌跡が収まっているため、ほぼ聞き落としがないと期待できる。
図12及び図13によれば、マクロ速度−加速度平面において、第1次再生プランPの軌跡は、判別可能条件を満たす領域Sから逸脱する軌跡を多く含むが、第2次再生プランPの軌跡は、判別可能条件を満たす領域S内に完全に収まっていることが分かる。
また、折れ線で定義される判別可能条件を満たす領域Sの形状が変わっても、第2次再生プランPの軌跡は、判別可能条件を満たす領域S内に完全に収まっていることが分かる。
次に、第1次再生プランPと、再生装置1の再生処理(図10)を実行して改良型の線形計画問題LP2(t,L)を順次解くことによって作成した第2次再生プランPと、について、例えば、図14に示す再生速度の変化を示す図を用いて比較する。図14の横軸は時間であり、縦軸は再生速度である。
図14(a)には、図12(a)(図13(a))に示す第1次再生プランPの最初の20秒間における再生速度の変化を示し、図14(b)には、図12(b)に示す第2次再生プランPの最初の20秒間における再生速度の変化を示し、図14(c)は、図13(b)に示す第2次再生プランPの最初の20秒間における再生速度の変化を示す。
図14によれば、再生速度の変化の仕方から、2.5秒付近、9秒付近及び14秒付近で、高速度再生が開始されたことが分かる。
図14(a)によれば、高速度再生の開始時には、再生速度が急激に変化していることがわかる。
これに対し、図14(b)によれば、図14(a)と比較して、高速度再生の開始時(特に、14秒付近)における再生速度の急激な変化が抑えられており、第2次再生プランPは、第1次再生プランPと比較して、再生速度の変化が緩やかであることが分かる。
また、図14(c)によれば、図14(b)よりもマクロ加速度A(t)の条件が厳しいため、図14(b)と比較して、高速度再生の開始時における再生速度の急激な変化がさらに抑えられており、図14(c)の第2次再生プランPは、図14(b)の第2次再生プランPと比較して、より一層、再生速度の変化が緩やかであることが分かる。
すなわち、図14(b)及び図14(c)によれば、折れ線の形状をコントロールすることにより、作成される第2次再生プランPの性質が変わることが分かる。
以上説明した本発明の再生装置1によれば、操作部15によって、ユーザが、記憶媒体11に記憶された再生データの再生速度を指示することができ、第1次再生プラン作成プログラム163b1を実行したCPU161によって、操作部15により指示された再生速度Vに応じた、現時点から未来に亘る第1次再生プランPを作成することができ、第2次再生プラン作成プログラム163b2を実行したCPU161によって、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPを基に、最適化問題を、線形計画問題(線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L))として、線形計画法を用いて解くことによって、第1次再生プランPを修正した現時点から未来に亘る第2次再生プランPを作成することができ、読取部12によって、第2次再生プラン作成プログラム163b2を実行したCPU161により作成された第2次再生プランPに従って、記憶媒体11から再生データを取得することができ、再生制御プログラム163b3を実行したCPU161によって、読取部12により取得された再生データを所定の音声出力装置2に出力させることができる。
したがって、再生データの再生速度の変化を、ユーザが指示する再生速度Vとの差を最小にし、且つ、判別可能条件の内部に収まるという制約条件を満たすように調整できるため、第2次再生プランPが、人間の特性に合ったものになり、ユーザにとって視聴しやすい状態で再生データの可変速再生を行うことができる。
なお、本発明は、上記した実施の形態のものに限るものではなく、その要旨を逸脱しない範囲で適宜変更可能である。
<変形例1>
実施例のように、現時点から未来に亘る時区間における第2次再生プランPの決定に関する問題を、線形計画法の枠組みに入れることで、開発は容易になるが、本発明の基本的な考えは、線形計画法に限定されるものではなく、線形計画法から逸脱して拡張してもよい。
具体的には、例えば、図15に示す再生装置1Aのように、最適化問題を非線形計画問題として非線形計画法を用いて解いてもよい。
ここで、線形計画問題が、目的関数及び制約条件が線形の最適化問題であったのに対し、非線形計画問題は、目的関数及び/又は制約条件が非線形の最適化問題である。
目的関数の非線形化としては、例えば、目的関数をO=Σd(t)などと定義すること等が考えられる。また、例えば、再生データが音声データ及び映像データにより構成される場合は、映像と音声のズレがストレスを及ぼす時間差に対して目的関数Oを極端に大きくして、剥離を防ぐこと等も考えられる。これらは全て、非線形の目的関数を生じさせる。
制約条件の非線形化としては、例えば、マクロ速度V(t)とマクロ加速度A(t)を、第2次再生プランPの再生位置P(t)の線形結合として定義するのではなく、人間の特性に応じて非線形関数として定義すること等が考えられる。また、判別可能条件を満たす領域Sを、折れ線で定義するのではなく、曲線で定義すること等も考えられる。これらは全て、非線形の制約条件を生じさせる。
なお、再生装置1Aは、例えば、実施例の再生装置1(図9)における制御部16の構成の一部のみが異なる。したがって、異なる箇所のみについて説明し、その他の共通する部分は同一符号を付して説明する。
具体的には、再生装置1Aの制御部16Aは、例えば、図15に示すように、CPU161と、RAM162と、記憶部163Aと、などを備えて構成される。
記憶部163Aは、例えば、図15に示すように、パラメータ記憶ファイル163a1と、第1次再生プラン蓄積ファイル163a2と、第2次再生プラン蓄積ファイル163a3と、第1次再生プラン作成プログラム163b1と、第2次再生プラン作成プログラム163b2Aと、再生制御プログラム163b3と、などを記憶している。
第2次再生プラン作成プログラム163b2Aは、例えば、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPと、パラメータ記憶ファイル163a1に記憶された人間の特性に関するパラメータ(例えば、M(τ)、M(τ)、CVk、CAk、CCkなど)と、を基に、最適化問題を、非線形計画問題として非線形計画法を用いて解くことによって、当該第1次再生プランPを修正した現時点から未来に亘る第2次再生プランPを作成する機能を、CPU161に実現させる。
具体的には、最適化問題は、目的関数として、第1次再生プランPによる再生位置P(t+j)と第2次再生プランPによる再生位置P(t+j)との差dを元にした線形関数又は非線形関数(或いは、第1次再生プランPによる再生位置P(t+j)と第2次再生プランPによる再生位置P(t+j)との差dを元にした線形関数又は非線形関数と、第2次再生プランPによる再生加速度の大きさa+bと、の和)を最小にするために、制約条件として、第2次再生プランPによる再生位置P(t+j)、再生速度V(t+j)及び再生加速度A(t+j)のうちの少なくとも1つを元にした線形関数又は非線形関数を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まるように、非線形計画問題として非線形計画法を用いて解くものである。
また、第2次再生プラン作成プログラム163b2Aは、例えば、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPと、当該作成された第2次再生プランPと、の差が予め設定された規定範囲内にあるか否かを判断し、規定範囲内にないと判断した場合は、「語句の聞き取り」を確保したままでは、ユーザにより指示された再生速度Vに応じた再生位置(第1次再生プランPによる再生位置P(t))と、実際の再生位置(第2次再生プランPによる再生位置P(t))と、の差が大きすぎるため、当該作成された第2次再生プランPを、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPで置き換える機能を、CPU161に実現させる。
CPU161は、かかる第2次再生プラン作成プログラム163b2Aを実行することによって、第2次再生プラン作成手段及び判断手段として機能する。
変形例1の再生装置1Aによれば、第2次再生プラン作成プログラム163b2Aを実行してCPU161によって、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPを基に、最適化問題を、非線形計画問題として、非線形計画法を用いて解くことによって、当該第1次再生プランPを修正した現時点から未来に亘る第2次再生プランPを作成することができる。
したがって、第2次再生プランPが、より一層、人間の特性に合ったものになり、より一層、ユーザにとって視聴しやすい状態で再生データの可変速再生を行うことができる。
<変形例2>
実施例の線形計画問題は、Fを大きくしてLを長く取ると、巨大な問題となり、再生装置1に内蔵されているCPU161にとって計算負荷が大きくなってしまう。
一方、マクロ速度−加速度平面における判別可能条件を満たす領域Sは、多人数について平均的に求められたものであるため、それほど厳密に実現する必要がない場合も多い。
このようなとき、線形計画問題は、線形計画法ルーチンを使って解くのではなく、近似的に解いてもよい。
具体的には、例えば、図16に示す再生装置1Bのように、線形計画問題を、近似的方法を使って解いてもよい。以下では、この近似的方法をQLP(t,L)と書くことにする。
なお、再生装置1Bは、例えば、実施例の再生装置1(図9)における制御部16の構成の一部のみが異なる。したがって、異なる箇所のみについて説明し、その他の共通する部分は同一符号を付して説明する。
具体的には、再生装置1Bの制御部16Bは、図16に示すように、CPU161と、RAM162と、記憶部163Bと、などを備えて構成される。
記憶部163Bは、例えば、図16に示すように、パラメータ記憶ファイル163a1と、第1次再生プラン蓄積ファイル163a2と、第2次再生プラン蓄積ファイル163a3と、第1次再生プラン作成プログラム163b1と、第2次再生プラン作成プログラム163b2Bと、再生制御プログラム163b3と、などを記憶している。
第2次再生プラン作成プログラム163b2Bは、例えば、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPを基に、近似的方法QLP(t,L)を用いて、第1次再生プランPを修正した現時点から未来に亘る第2次再生プランPを作成する機能を、CPU161に実現させる。
具体的には、CPU161は、例えば、第2次再生プランPによる再生位置P(t+j)、再生速度V(t+j)及び再生加速度A(t+j)のうちの少なくとも1つの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まるという制約条件を満たすとともに、第1次再生プランPによる再生位置P(t+j)と第2次再生プランPによる再生位置P(t+j)との差d(或いは、第1次再生プランPによる再生位置P(t+j)と第2次再生プランPによる再生位置P(t+j)との差dと、第2次再生プランPによる再生加速度の大きさa+bと、の和)を最小にし、且つ、再生加速度A(t+j)が所定の範囲内(aMINからのaMAX範囲内)にあるとともに、再生加速度A(t+j)が予め設定された時区間(L)では一定(再生加速度a)である第2次再生プランPを作成する。
また、第2次再生プラン作成プログラム163b2Bは、例えば、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPと、当該作成された第2次再生プランPと、の差が予め設定された規定範囲内にあるか否かを判断し、規定範囲内にないと判断した場合は、「語句の聞き取り」を確保したままでは、ユーザにより指示された再生速度Vに応じた再生位置(第1次再生プランPによる再生位置P(t))と、実際の再生位置(第2次再生プランPによる再生位置P(t))と、の差が大きすぎるため、当該作成された第2次再生プランPを、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPで置き換える機能を、CPU161に実現させる。
CPU161は、かかる第2次再生プラン作成プログラム163b2Bを実行することによって、第2次再生プラン作成手段及び判断手段として機能する。
[再生処理]
次に、再生装置1Bによる記憶媒体11に記憶された再生データの再生に関する処理について、図17及び図18のフローチャートを参照して説明する。
ユーザによる操作部15の操作によって、記憶媒体11に記憶された再生データを再生するよう指示されると(ステップS31)、CPU161は、RAM162内の「現時点の時刻t」記憶領域に“0”を設定する(ステップS32)。
次いで、CPU161は、ユーザによる操作部15の操作によって指示された、記憶媒体11に記憶された再生データを再生する際の再生速度Vを読み込む(ステップS33)。
次いで、CPU161は、第1次再生プラン蓄積ファイル163a2にP(t)が蓄積されているか否か、すなわち、前もって予測していた、時刻tにおける第1次再生プランPによる再生位置P(t)が存在するか否かを判断する(ステップS34)。
ステップS34で、前もって予測していたP(t)が存在しないと判断すると(ステップS34;No)、CPU161は、第1次再生プラン作成プログラム163b1を実行して、現時点から未来に亘る第1次再生プランPを作成する(ステップS35)。
具体的には、CPU161は、例えば、ステップS33で読み込んだ再生速度Vと、第1次再生プラン蓄積ファイル163a2に蓄積されているP(t−1)と、に基づいて、現時点における第1次再生プランPによる再生位置P(t)(=P(t−1)+(F/F)V)を作成して(ステップS35a)、第1次再生プラン蓄積ファイル163a2に記憶させる。
次いで、CPU161は、未来の第1次再生プランPを予測することによって、未来における第1次再生プランPによる再生位置P(t+j)(j=1,2,…,L−1)を作成して(ステップS35b)、第1次再生プラン蓄積ファイル163a2に記憶させる。
次いで、CPU161は、第2次再生プラン作成プログラム163b2Bを実行して、近似的方法QLP(t,L)を用いて、現時点から未来に亘る第2次再生プランPを作成して(ステップS36)、ステップS39の処理に移行する。
具体的には、CPU161は、RAM162内の「OF MIN」記憶領域に“正の最大値”を設定するとともに、RAM162内の「再生加速度a」記憶領域に、所定の“aMIN”を設定する(ステップS36a)。
次いで、CPU161は、初期速度VをV=(F/F)(P(t−1)−P(t−2))として、現時点から未来に亘る第2次再生プランPによる再生位置P(t+j)(j=0,1,…,L−1)が同等の再生加速度aとなるように、修正量d(j=0,1,…,L−1)を仮決定する(ステップS36b)。
次いで、CPU161は、ステップS36bで仮決定した修正量d(j=0,1,…,L−1)に対して、制約条件が満たされているか否か、すなわち、式(31)が全て満たされているか否かを判断する(ステップS36c)。
ステップS36cで、ステップS36bで仮決定した修正量d(j=0,1,…,L−1)に対して、式(31)が全て満たされていないと判断すると(ステップS36c;No)、CPU161は、ステップS36gの処理に移行する。
一方、ステップS36cで、ステップS36bで仮決定した修正量d(j=0,1,…,L−1)に対して、式(31)が全て満たされていると判断すると(ステップS36c;Yes)、CPU161は、式(34)を計算して、RAM162内の「O」記憶領域に、当該計算の結果である“式(34)の計算結果”を設定する(ステップS36d)。
次いで、CPU161は、RAM162内の「O」記憶領域に設定されている値が、RAM162内の「OF MIN」記憶領域に設定されている値よりも小さいか否かを判断する(ステップS36e)。
ステップS36eで、RAM162内の「O」記憶領域に設定されている値が、RAM162内の「OF MIN」記憶領域に設定されている値よりも小さくないと判断すると(ステップS36e;No)、CPU161は、ステップS36gの処理に移行する。
一方、ステップS36eで、RAM162内の「O」記憶領域に設定されている値が、RAM162内の「OF MIN」記憶領域に設定されている値よりも小さいと判断すると(ステップS36e;Yes)、CPU161は、RAM162内の「OF MIN」記憶領域に、RAM162内の「O」記憶領域に設定されている値“O”を設定するとともに、RAM162内の「最良のd」記憶領域に、ステップS36bで仮決定した修正量d(j=0,1,…,L−1)を設定する(ステップS36f)。
次いで、CPU161は、RAM162内の「再生加速度a」記憶領域に、“a+Δa”を設定する(ステップS36g)。
次いで、CPU161は、RAM162内の「再生加速度a」記憶領域に設定されている値が、所定のaMAXよりも小さいか否かを判断する(ステップS36h)。
ステップS36hで、RAM162内の「再生加速度a」記憶領域に設定されている値が、所定のaMAXよりも小さいと判断すると(ステップS36h;Yes)、CPU161は、ステップS36b以降の処理を繰り返して行う。
一方、ステップS36hで、RAM162内の「再生加速度a」記憶領域に設定されている値が、所定のaMAXよりも小さくないと判断すると(ステップS36h;No)、CPU161は、RAM162内の「OF MIN」記憶領域に設定されている値が正の最大値であるか否かを判断する(ステップS36i)。
ステップS36iで、RAM162内の「OF MIN」記憶領域に設定されている値が正の最大値でないと判断すると(ステップS36i;No)、CPU161は、求めていた修正量dが見つかったと判断して、RAM162内の「最良のd」記憶領域に設定されている修正量d(j=0,1,…,L−1)を、求めていた修正量d(j=0,1,…,L−1)とする(ステップS36j)。
次いで、CPU161は、当該求めていた修正量d(j=0,1,…,L−1)のうちの修正量d(j=0,1,…,L−1)と、第1次再生プラン蓄積ファイル163a2に蓄積されている現時点から未来に亘る第1次再生プランPによる再生位置P(t+j)(j=0,1,…,L−1)と、に基づいて、現時点から未来に亘る第2次再生プランPによるP(t+j)(j=0,1,…,L−1)を作成して(ステップS36k)、第2次再生プラン蓄積ファイル163a3に記憶させる。
次いで、CPU161は、RAM162内の「聞き取り可否U(t+j)」記憶領域に“0”を設定することによって(ステップS36l)、時刻t+j(j=0,1,…,L−1)においては判別可能条件を満たす領域Sに収まる旨を記録し、ステップS39の処理に移行する。
また、ステップS36iで、RAM162内の「OF MIN」記憶領域に設定されている値が正の最大値であると判断すると(ステップS36i;Yes)、CPU161は、求めていた修正量dが見つからなかったと判断して、第1次再生プラン蓄積ファイル163a2に蓄積されている現時点から未来に亘る第1次再生プランPによる再生位置P(t+j)(j=0,1,…,L−1)を、現時点から未来に亘る第2次再生プランPによるP(t+j)(j=0,1,…,L−1)とすることによって、現時点から未来に亘る第2次再生プランPによるP(t+j)(j=0,1,…,L−1)を作成して(ステップS36m)、第2次再生プラン蓄積ファイル163a3に記憶させる。
次いで、CPU161は、RAM162内の「聞き取り可否U(t+j)」記憶領域に“1”を設定することによって(ステップS36n)、時刻t+j(j=0,1,…,L−1)においては判別可能条件を満たす領域Sに収まらない旨を記録し、ステップS39の処理に移行する。
また、ステップS34で、前もって予測していたP(t)が存在すると判断すると(ステップS34;Yes)、CPU161は、ステップS33で読み込んだ再生速度Vと、第1次再生プラン蓄積ファイル163a2に蓄積されているP(t−1)と、に基づいて作成した現時点における第1次再生プランPによる再生位置P(t−1)+(F/F)Vが、前もって予測していたP(t)にほぼ等しいか否かを判断する(ステップS37)。
ステップS37で、P(t−1)+(F/F)Vが、前もって予測していたP(t)にほぼ等しくないと判断すると(ステップS37;No)、CPU161は、ステップS35の処理に移行する。
一方、ステップS37で、P(t−1)+(F/F)Vが、前もって予測していたP(t)にほぼ等しいと判断すると(ステップS37;Yes)、CPU161は、第2次再生プラン蓄積ファイル163a3にP(t)が蓄積されているか否か、すなわち、時刻tにおける第2次再生プランPによる再生位置P(t)が作成されているか否かを判定する(ステップS38)。
ステップS38で、P(t)が作成されていないと判断すると(ステップS38;No)、CPU161は、ステップS35の処理に移行する。
一方、ステップS38で、P(t)が作成されていると判断すると(ステップS38;Yes)、CPU161は、P(t)−P(t)が、予め設定された規定範囲内にあるか否かを判断する(ステップS39)。
ステップS39で、P(t)−P(t)が規定範囲内にないと判断すると(ステップS39;No)、CPU161は、P(t)をP(t)で置き換える(ステップS40)。
次いで、CPU161は、RAM162内の「聞き取り可否U(t+j)」記憶領域のうちのj=0の領域、すなわち、「聞き取り可否U(t)」記憶領域に“1”を設定することによって(ステップS41)、時刻t+j(j=0)においては判別可能条件を満たす領域Sに収まらない旨を記録して、ステップS42の処理に移行する。
一方、ステップS39で、P(t)−P(t)が規定範囲内にあると判断すると(ステップS39;Yes)、CPU171は、再生制御プログラム163b3を実行して、P(t)で記憶媒体11に記憶された再生データの再生を行う(ステップS42)。
具体的には、CPU171は、読取部11に、記憶媒体11に記憶された再生データのうちの時間座標P(t)の部分を取得させ、当該取得された再生データを、デコーダ13や時間軸変換部14を介して、音声出力装置3に出力させる。これにより、音声出力装置3から再生データに基づく音声が出力される。
次いで、CPU161は、RAM162内の「現時点の時刻t」記憶領域に“t+1”を設定して(ステップS43)、ステップS33以降の処理を繰り返して行う。
そして、CPU161は、ステップS33〜ステップS43の処理を、例えば、ユーザによる操作部15の操作によって再生データの再生を終了するよう指示されるまで、或いは、記憶媒体11に記憶された再生データを再生し尽すまで、繰り返して行う。
すなわち、近似的方法QLP(t,L)は、Lサンプル分の第2次再生プランPによる再生位置P(t+j)(j=0,1,…,L−1)を、Lサンプルの時区間は、一定の再生加速度aを持つものと限定するところに特徴がある。そして、再生加速度aを、aMINからaMAXの範囲で所定のΔa毎に変化させながら、最良の修正量dを探して、第2次再生プランPを作成する。すなわち、近似的方法QLP(t,L)は、式(31)の制約条件を満たしつつ、式(34)(或いは式(44)であってもよい)で定義される修正量dを最小にする再生加速度aをもって、準最適な第2次再生プランPとする方法である。
次に、第1次再生プランPと、再生装置1Bの再生処理(図17及び図18)を実行して近似的方法QLP(t,L)を用いて作成した第2次再生プランPと、について、例えば、図19に示すマクロ速度−加速度平面を用いて比較する。パラメータは、L=90(1.5秒相当)、L=30(0.5秒相当)、α=β=0.011に設定した。
図19は、図6で得られた折れ線を使用した場合である。
図19(a)は、図12(a)と同一の軌跡であり、図19(b)には、図19(a)の第1次再生プランPを基に、判別可能条件を満たす領域S内に収まるように、近似的方法QLP(t,L)を順次適用していくことで作成した第2次再生プランPの軌跡を示す。
図19(b)によれば、図12(b)と比較して、折れ線(判別可能条件を満たす領域Sと判別可能条件を満たさない領域Sの境界線)から離れている軌跡を多く含むが、判別可能条件を満たす領域S内に全ての軌跡が収まっているため、ほぼ聞き落としがないと期待できる。
近似的方法QLP(t,L)でも判別可能条件を満たす領域S内に全ての軌跡が収まったことをふまえて、線形計画問題LP1(t,L)及び改良型の線形計画問題LP2(t,L)による解法の意味は次の3つである。
第1は、処理能力の高いプロセッサを使用する場合は、線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L)をそのまま実現して最適な再生ができるという点にある。
第2は、理論的に最適な解があるということを示すためのものであるという点にある。
第3は、近似的方法QLP(t,L)のような近似的手法を開発する際に、それがどこまでよい近似であるかを調べるためのツールとして役立つという点にある。
変形例2の再生装置1Bによれば、第2次再生プラン作成プログラム163b2Bを実行したCPU161によって、第2次再生プランPによる再生位置P(t+j)、再生速度V(t+j)及び再生加速度A(t+j)のうちの少なくとも1つの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まるという制約条件を満たすとともに第1次再生プランPによる再生位置P(t+j)と第2次再生プランPによる再生位置P(t+j)との差d(或いは、第1次再生プランPによる再生位置P(t+j)と第2次再生プランPによる再生位置P(t+j)との差dと、第2次再生プランPによる再生加速度の大きさa+bと、の和)を最小にし、且つ、再生加速度A(t+j)が所定の範囲内(aMINからのaMAX範囲内)にあるとともに、再生加速度A(t+j)が予め設定された時区間(L)では一定(再生加速度a)である第2次再生プランPを作成することができる。
すなわち、再生装置1Bは、実施例1の線形計画問題(線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L))を近似的に解いて、第2次再生プランPを作成するため、ユーザにとって視聴しやすい状態で再生データの可変速再生を行うことができるとともに、CPU161の計算負荷を抑えることができる。
なお、再生装置1Bは、実施例の線形計画問題を近似的に解いて第2次再生プランPを作成する限りではなく、変形例1の非線形計画問題を近似的に解いて第2次再生プランPを作成してもよい。
<変形例3>
実施例で示した手法は、人間の特性に沿って音声を聞き取らせつつ、再生データを再生する際の再生速度をできるだけユーザが指示する再生速度に近づける手法であった。しかしながら、再生データを構成する音声データには、無音部の時区間もあれば、音声が存在しない時区間もある。このような時区間に対して制約条件を課しても無意味であり、再生データを再生する際の再生速度が、ユーザが指示する再生速度からずれていくだけである。
このようなとき、無音部の時区間や音声が存在しない時区間などの、制約が必要ないと判断される時区間については、制約条件(例えば、式(31)など)を緩和するとよい。
具体的には、例えば、図20に示す再生装置1Cのように、無音部や音声の有無を判定して、制約が必要ないと判断される時区間については、制約条件を緩和するとよい。
なお、再生装置1Cは、例えば、実施例の再生装置1(図9)における、デコーダ13の構成の一部と、制御部16の構成の一部と、のみが異なる。したがって、異なる箇所のみについて説明し、その他の共通する部分は同一符号を付して説明する。
具体的には、再生装置1Cのデコーダ13Cは、制御部16Cから入力される制御信号に従って、例えば、読取部12から入力された再生データにデコード等の所定の処理を施して、時間軸変換部14に出力するとともに、制御部16Cに出力する。
また、再生装置1Cの制御部16Cは、例えば、図20に示すように、CPU161と、RAM162と、記憶部163Cと、などを備えて構成される。
記憶部163Cは、例えば、図20に示すように、パラメータ記憶ファイル163a1と、第1次再生プラン蓄積ファイル163a2と、第2次再生プラン蓄積ファイル163a3と、第1次再生プラン作成プログラム163b1と、第2次再生プラン作成プログラム163b2Cと、再生制御プログラム163b3と、無音区間判定プログラム163b4Cと、音声区間判定プログラム163b5Cと、などを記憶している。
無音区間判定プログラム163b4Cは、例えば、デコーダ13Cから入力された再生データ(音声データ)を解析して、読取部12により取得された再生データが、無音区間内の再生データであるか否かを判定する機能を、CPU161に実現させる。
具体的には、CPU161は、例えば、再生データ(音声データ)の2乗和を積分して、所定の閾値と比較することによって、無音区間の判定を行う。
CPU161は、かかる無音区間判定プログラム163b4Cを実行することによって、無音区間判定手段として機能する。
音声区間判定プログラム163b5Cは、例えば、デコーダ13Cから入力された再生データ(音声データ)を解析して、読取部12により取得された再生データが、音声区間内の再生データであるか否かを判定する機能を、CPU161に実現させる。
具体的には、CPU161は、例えば、再生データ(音声データ)のスペクトル形、エネルギー変動の度合い(例えば、短時間分散と長時間分散との比など)、などを用いて、音声区間の判定を行う。なお、CPU161は、音声区間であるか否かの判定が曖昧な時区間については、その軸間を音声区間であると判定するようになっている。
CPU161は、かかる音声区間判定プログラム163b5Cを実行することによって、音声区間判定手段として機能する。
第2次再生プラン作成プログラム163b2Cは、例えば、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPと、パラメータ記憶ファイル163a1に記憶されたM(τ)、M(τ)、CVk、CAk、CCkなどと、を基に、最適化問題を、線形計画問題(線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L))として線形計画法を用いて解くことによって、当該第1次再生プランPを修正した現時点から未来に亘る第2次再生プランPを作成する機能を、CPU161に実現させる。
このとき、CPU161は、例えば、無音区間判定プログラム163b4Cを実行したCPU161によって読取部12により取得された再生データが無音区間内の再生データであると判定された場合は、第1次再生プラン作成プログラム163b1を実行したCPU161段により作成された第1次再生プランPを基に、線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L)の制約条件よりも制約が緩和された条件内で第2次再生プランPを作成するようになっている。
また、CPU161は、例えば、無音区間判定プログラム163b4Cを実行したCPU161によって読取部12により取得された再生データが無音区間内の再生データでないと判定された場合であっても、音声区間判定プログラム163b5Cを実行したCPU161によって読取部12により取得された再生データが音声区間内の再生データでないと判定された場合は、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPを基に、線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L)の制約条件よりも制約が緩和された条件内で第2次再生プランPを作成するようになっている。
具体的には、線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L)の制約条件よりも制約が緩和された条件とは、例えば、線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L)の制約条件を除去した条件である。
すなわち、読取部12により取得された再生データが、無音区間内の再生データであると判定された場合、或いは、音声区間内の再生データでないと判定された場合には、CPU161は、制約条件(例えば、式(31)など)を無視して、線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L)を解くことによって、第2次再生プランPを作成する。
また、第2次再生プラン作成プログラム163b2Cは、例えば、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPと、当該作成された第2次再生プランPと、の差が予め設定された規定範囲内にあるか否かを判断し、規定範囲内にないと判断した場合は、「語句の聞き取り」を確保したままでは、ユーザにより指示された再生速度Vに応じた再生位置(第1次再生プランPによる再生位置P(t))と、実際の再生位置(第2次再生プランPによる再生位置P(t))と、の差が大きすぎるため、当該作成された第2次再生プランPを、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPで置き換える機能を、CPU161に実現させる。
CPU161は、かかる第2次再生プラン作成プログラム163b2Cを実行することによって、第2次再生プラン作成手段及び判断手段として機能する。
変形例3の再生装置1Cによれば、無音区間判定プログラム163b4Cを実行したCPU161によって、読取部12により取得された再生データが、無音区間内の再生データであるか否かを判定することができ、音声区間判定プログラム163b5Cを実行したCPU161によって、読取部12により取得された再生データが、音声区間内の再生データであるか否かを判定することができ、そして、第2次再生プラン作成プログラム163b2Cを実行したCPU161は、無音区間判定プログラム163b4Cを実行したCPU161によって読取部12により取得された再生データが無音区間内の再生データであると判定された場合、或いは、音声区間判定プログラム163b5Cを実行したCPU161によって読取部12により取得された再生データが音声区間内の再生データでないと判定された場合は、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPを基に、線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L)の制約条件よりも制約が緩和された条件内で第2次再生プランPを作成することができる。
ここで、読取部12により取得された再生データが、無音区間内の再生データであると判定された場合、或いは、音声区間内の再生データでないと判定された場合に作成される第2次再生プランPは、線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L)の制約条件よりも制約が緩和された条件内で作成されたものであるため、線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L)を解いて作成した第2次再生プランPよりも第1次再生プランPに近いプランになる。
したがって、再生装置1Cは、無音区間である時区間や音声区間でない時区間などの、制約が必要ないと判断される時区間では、線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L)を解いて作成した第2次再生プランPよりも第1次再生プランPに近い第2次再生プランPを作成するため、再生データを再生する際の再生速度が、ユーザが指示する再生速度からずれていくのを抑えることができ、効率よく再生データを再生することができる。
なお、再生装置1Cは、読取部12により読み取られた再生データが、無音区間内の再生データであるか否かと、音声区間内の再生データであるか否かと、の2項目について判定するようにしたが、何れか一方のみを判定するようにしてもよい。
また、線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L)の制約条件よりも制約が緩和された条件は、線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L)の制約条件を除去した条件に限ることはなく、線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L)の制約条件よりも制約が緩和されていれば任意であり、例えば、線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L)の制約条件のパラメータを変化させた制約条件であってもよい。
また、再生装置1Cは、実施例のように、線形計画問題を解いて第2次再生プランPを作成する限りではなく、変形例1のように、非線形計画問題を解いて第2次再生プランPを作成してもよいし、変形例2のように、近似的方法を用いて第2次再生プランPを作成してもよい。
<変形例4>
実施例においては、話速にかかわらず制約条件を一定にしていたが、制約条件は、人間の特性として定量化したパラメータM(τ)、M(τ)、CVk、CAk、CCkを使用して生成されるものであり、パラメータM(τ)、M(τ)、CVk、CAk、CCkは、話速に依存する。したがって、さらにユーザにとって視聴しやすい状態で再生データの再生を行うためには、話速に応じて制約条件を変化させるとよい。
具体的には、例えば、図21に示す再生装置1Dのように、話速を判定して、その話速に応じて制約条件を変化させるとよい。
なお、再生装置1Dは、例えば、実施例の再生装置1(図9)における、デコーダ13の構成の一部と、制御部16の構成の一部と、のみが異なる。したがって、異なる箇所のみについて説明し、その他の共通する部分は同一符号を付して説明する。
具体的には、再生装置1Dのデコーダ13Dは、制御部16Dから入力される制御信号に従って、例えば、読取部12から入力された再生データにデコード等の所定の処理を施して、時間軸変換部14に出力するとともに、制御部16Dに出力する。
また、再生装置1Dの制御部16Dは、例えば、図21に示すように、CPU161と、RAM162と、記憶部163Dと、などを備えて構成される。
記憶部163Dは、例えば、図21に示すように、パラメータ記憶ファイル163a1Dと、第1次再生プラン蓄積ファイル163a2と、第2次再生プラン蓄積ファイル163a3と、第1次再生プラン作成プログラム163b1と、第2次再生プラン作成プログラム163b2Dと、再生制御プログラム163b3と、話速推定プログラム163b6Dと、などを記憶している。
話速推定プログラム163b6Dは、例えば、デコーダ13Dから入力される再生データ(音声データ)を解析して、読取部12により取得された再生データに基づく音声の話速を推定する機能を、CPU161に実現させる。
具体的には、CPU161は、例えば、再生データ(音声データ)のエネルギーの変動の大きさを用いることによって、話速を推定する。すなわち、CPU161は、例えば、再生データの信号エネルギーを、長い時定数で平滑化したものをP(t)とし、短い時定数で平滑化したものをP(t)としたときに、1秒間あたりにP(t)とP(t)とが交差する回数を求めることによって、話速を推定する。
CPU161は、かかる話速推定プログラム163b6Dを実行することによって、話速推定手段として機能する。
パラメータ記憶ファイル163a1Dは、例えば、予め決定しておいた、各話速に対応するパラメータM(τ)、M(τ)、CVk、CAk、CCkなどを記憶している。
具体的には、例えば、話速推定プログラム163b6Dを実行したCPU161により推定される話速は、「早い」、「普通」、「遅い」の3段階に分けられるようになっており、パラメータ記憶ファイル163a1Dは、話速が早い場合と、話速が普通の場合と、話速が遅い場合と、のそれぞれについて、作成される第2次再生プランPによる再生速度V(t)の最高値が適度なものとなるような、パラメータM(τ)、M(τ)、CVk、CAk、CCkなどを記憶している。
なお、話速を「早い」、「普通」、「遅い」の3段階に分けるようにしたが、これに限ることはなく、段階の数は複数であれば任意である。
第2次再生プラン作成プログラム163b2Dは、例えば、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPと、パラメータ記憶ファイル163a1Dに記憶されたM(τ)、M(τ)、CVk、CAk、CCkのうちの話速推定プログラム163b6Dを実行したCPU161により推定された話速に対応するパラメータM(τ)、M(τ)、CVk、CAk、CCkなどと、を基に、最適化問題を、線形計画問題(線形計画問題LP1(t,L)又は改良型の線形計画問題LP2(t,L))として線形計画法を用いて解くことによって、当該第1次再生プランPを修正した現時点から未来に亘る第2次再生プランPを作成する機能を、CPU161に実現させる。
このとき、CPU161は、話速推定プログラム163b6Dを実行したCPU161により推定された話速に対応するパラメータM(τ)、M(τ)、CVk、CAk、CCkをパラメータ記憶データファイル163a1Dから取得して制約条件を生成することによって、話速推定プログラム163b6Dを実行したCPU161により推定された話速に応じて制約条件を変化させるようになっている。
また、第2次再生プラン作成プログラム163b2Dは、例えば、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPと、当該作成された第2次再生プランPと、の差が予め設定された規定範囲内にあるか否かを判断し、規定範囲内にないと判断した場合は、「語句の聞き取り」を確保したままでは、ユーザにより指示された再生速度Vに応じた再生位置(第1次再生プランPによる再生位置P(t))と、実際の再生位置(第2次再生プランPによる再生位置P(t))と、の差が大きすぎるため、当該作成された第2次再生プランPを、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPで置き換えることによって、現時点から未来に亘る第2次再生プランPを作成する機能を、CPU161に実現させる。
CPU161は、かかる第2次再生プラン作成プログラム163b2Dを実行することによって、第2次再生プラン作成手段及び判断手段として機能する。
変形例4の再生装置1Dによれば、話速推定プログラム163b6Dによって、読取部12により取得された再生データに基づく音声の話速を推定することができ、そして、第2次再生プラン作成プログラム163b2Dを実行したCPU161は、話速推定プログラム163b6Dを実行したCPU161により推定された話速に応じて制約条件を変化させることができる。
すなわち、話速に応じたパラメータM(τ)、M(τ)、CVk、CAk、CCkの組を使用して制約条件を生成することによって、制約条件を変化させるため、例えば、話速が早い時区間では遅くなるように、話速が遅い時区間では早くなるように、再生速度が調整された第2次再生プランPを作成できることとなって、ユーザにとって聞きやすい状態で効率よく再生データの可変速再生を行うことができる。
なお、話速に応じて制約条件を変化させる他に、話速に応じて再生データの再生速度を調整する手法としては、例えば、再生データの時間座標に話速で重みを付ける手法などがある。具体的には、例えば、P(t)−P(t)が再生データの時間座標上での距離であるが、この距離に、話速に比例する量を乗算することで、話速に応じて再生データの再生速度を調整するようにしてもよい。
また、再生装置1Dは、実施例のように、線形計画問題を解いて第2次再生プランPを作成する限りではなく、変形例1のように、非線形計画問題を解いて第2次再生プランPを作成してもよいし、変形例2のように、近似的方法を用いて第2次再生プランPを作成してもよいし、変形例3のように、制約が必要ないと判断される時区間では、実施例や変形例1、変形例2などの制約条件よりも制約が緩和された条件内で第2次再生プランPを作成してもよい。
<変形例5>
実施例では、ユーザが指示する再生速度Vが高速であって、それが長時間維持された場合には、音声の全てを聞き取らせるのは不可能である。例えば、再生装置1が再生処理(図10)を行なっている場合であれば、ユーザにより指示された再生速度Vに応じた再生位置(第1次再生プランPによる再生位置P(t))と、実際の再生位置(第2次再生プランPによる再生位置P(t))と、の剥離による強制的な再生位置の修正(ステップS10のP(t)をP(t)で置き換える処理)が頻繁に起こって、聞くに耐えない音声になる場合がある。そのようなことが生じたときは、語句を聞き取らせるのを諦めて、音量を下げたり、音量を切ってしまう(音声を切る、音を切る、又は、音量を0にする)のがよい。
具体的には、例えば、図22に示す再生装置1Eのように、RAM162内の「聞き取り可否U(t+j)」記憶領域のうちのj=0の領域、すなわち、RAM162内の「聞き取り可否U(t)」記憶領域に“1”が設定されている場合は、音量を下げたり、音声を切ってもよい。
ここで、U(t)=0は、第2次再生プランPが時刻tで聞き取り可能であると推定されたこと、すなわち、第2次再生プランPの軌跡が時刻tで判別可能条件を満たす領域S内に収まることを示す。
一方、U(t)=1は、第2次再生プランPが時刻tで聞き取り可能でないと推定されたこと、すなわち、第2次再生プランPの軌跡が時刻tで判別可能条件を満たす領域S内に収まらないことを示す。
実施例の再生装置1による再生処理(図10)では、制約条件を確保しようとして第1次再生プランPと第2次再生プラントPの差が規定範囲を超えた場合、線形計画法での解を捨てて、第2次再生プランPを第1次再生プランPで置き換えることによって(ステップS10)、第2次再生プランPとして、第1次再生プランPをそのまま利用するようになっている。このとき、制約条件は満たされないので、U(t)=1と設定される。また、瞬間的であっても最低の再生速度や最高の再生速度に制約をつけることも可能であるが、その場合も線形計画法の解がなくなるので、U(t)=1と設定される。
また、変形例2の再生装置1Bによる再生処理(図17及び図18)では、第1次再生プランPと第2次再生プラントPの差が規定範囲を超えた場合に、第2次再生プランPを第1次再生プランPで置き換える(ステップS40)他に、予め定められた加速度の範囲(aMINからaMAXの範囲)で制約条件を満たせず、求めていた修正量dが見つからなかった場合は、第1次再生プラン蓄積ファイル163a2に蓄積されている現時点から未来に亘る第1次再生プランPによる再生位置P(t+j)(j=0,1,…,L−1)を、現時点から未来に亘る第2次再生プランPによるP(t+j)(j=0,1,…,L−1)とする(ステップS36m)ようになっている。このときも、制約条件は満たされないので、U(t)=1と設定される。
なお、再生装置1Eは、例えば、実施例の再生装置1(図9)における、時間軸変換部14の構成の一部と、音量調整部17Eが追加された点と、制御部16の構成の一部と、のみが異なる。したがって、異なる箇所のみについて説明し、その他の共通する部分は同一符号を付して説明する。
具体的には、再生装置1Eの時間軸変換部14Eは、制御部16Eから入力される制御信号に従って、例えば、時間軸変換手段として、デコーダ13から入力された再生データの波形の一致度を考慮して、既存の時間軸変換技術(例えば、TSMなど)などを用いて、当該再生データの時間軸を変換し、音量調整部17Eや図示しないアンプを介して、音声出力装置3に出力する。
また、再生装置1Eの音量調整部17Eは、制御部16Eから入力される制御信号に従って、音量出力装置3から出力される再生データ(音声データ)に基づく音声の音量を調整する。
また、再生装置1Eの制御部16Eは、例えば、図22に示すように、CPU161と、RAM162と、記憶部163Eと、などを備えて構成される。
具体的には、記憶部163Eは、例えば、図22に示すように、パラメータ記憶ファイル163a1と、第1次再生プラン蓄積ファイル163a2と、第2次再生プラン蓄積ファイル163a3と、第1次再生プラン作成プログラム163b1と、第2次再生プラン作成プログラム163b2と、再生制御プログラム163b3と、音量制御プログラム163b7Eと、などを記憶している。
音量制御プログラム163b7Eは、例えば、RAM162内の「聞き取り可否U(t)」記憶領域に“1”を設定されている場合、すなわち、第2次再生プラン作成プログラム163b2を実行したCPU161によって第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPと第2次再生プラン作成プログラム163b2を実行したCPU161により作成された第2次再生プランPとの差が予め設定された規定範囲内にないと判断された場合に、音量調整部17Eに制御信号を入力して、音声出力装置3から出力される再生データに基づく音声の音量を予め設定された音量まで小さくなるように調整する機能を、CPU161に実現させる。
ここで、再生データに基づく音声の音量を予め設定された音量まで小さくなるように調整するとは、例えば、音量を下げたり、音量を切ってしまう(音声を切る、音を切る、又は、音量を0にする)ことである。
具体的には、CPU161は、例えば、U(t)=0で通常音量、U(t)=1で小音量(又は無音量)となるように、音声出力装置3を制御する。
CPU161は、かかる音量制御プログラム163b7Eを実行することによって、音量調整手段として機能する。
変形例5の再生装置1Eによれば、音量制御プログラム163b7Eを実行したCPU161によって、第2次再生プラン作成プログラム163b2を実行したCPU171によって第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPと第2次再生プラン作成プログラム163b2を実行したCPU161により作成された第2次再生プランPとの差が予め設定された規定範囲内にないと判断された場合に、音声出力装置3から出力される再生データに基づく音声の音量が小さくなるように調整することができる。
したがって、ユーザにより指示された再生速度Vに応じた再生位置(第1次再生プランPによる再生位置P(t))と、実際の再生位置(第2次再生プランPによる再生位置P(t))と、の剥離による強制的な再生位置の修正(P(t)をP(t)で置き換える処理)が頻繁に起こって、聞くに耐えない音声が出力される場合は、音量が小さくなるため、より一層、ユーザにとって聞きやすい状態で再生データの可変速再生を行うことができる。
なお、再生装置1Eは、変形例2のように、近似的方法を用いて第2次再生プランPを作成してもよい。この場合、RAM162内の「聞き取り可否U(t)」記憶領域に“1”を設定されるのが、第2次再生プラン作成プログラム163b2Bを実行したCPU161によって第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPと第2次再生プラン作成プログラム163b2Bを実行したCPU161により作成された第2次再生プランPとの差が予め設定された規定範囲内にないと判断された場合と、第2次再生プラン作成プログラム163b2Bを実行したCPU161により制約条件を満たす第2次再生プランPが作成されなかった場合と、であるため、第2次再生プラン作成プログラム163b2Bを実行したCPU161により制約条件を満たす第2次再生プランPが作成されなかった場合も、音声出力装置3から出力される再生データに基づく音声の音量が小さくなるように調整する必要がある。
また、音量の制御の仕方は、U(t)=0で通常音量、U(t)=1で小音量(又は無音量)となるように制御する限りではなく、U(t)=1で音声出力装置3から出力される再生データに基づく音声の音量が小さくなるように制御できれば任意であり、例えば、U(t)=1が設定されると、予め設定された音量レベルに達するまで徐々に音量を下げ、その後、連続して所定回数U(t)=0が設定されると、通常音量になるまで徐々に音量を上げるようにしてもよい。この場合、頻繁に音量が制御されることがなく、また、滑らかに音量が変化するため、ユーザにとって快適である。
また、第2次再生プランPを作成せずに、第1次再生プランPに従って記憶媒体11に記憶された再生データを再生する場合は、式(30)においてj=0としたK個の不等式が、現時点での第1次再生プランPについて成り立つか否かを判定し、1個でも成り立たないと判定された場合にU(t)=1として、音量を小さくなるように調整するようにしてもよい。
また、再生装置1Eは、実施例のように、線形計画問題を解いて第2次再生プランPを作成する限りではなく、変形例1のように、非線形計画問題を解いて第2次再生プランPを作成してもよいし、変形例3のように、制約が必要ないと判断される時区間では、実施例や変形例1、変形例2などの制約条件よりも制約が緩和された条件内で第2次再生プランPを作成してもよいし、変形例4のように、話速に応じて制約条件を変化させて第2次再生プランPを作成してもよい。
<変形例6>
実施例では、記憶媒体11に記憶された再生データは音声データにより構成されていたが、再生データは、音声データ及び映像データにより構成されていてもよい。
この場合、例えば、図23に示す再生装置1Fのように、第2次再生プランPに従って、音声データを再生するとともに、第1次再生プランPに従って、映像データを再生することになる。
なお、再生装置1Fは、例えば、実施例の再生装置1(図9)における、記憶媒体11の構成の一部と、デコーダ13の構成の一部と、制御部16の構成の一部と、のみが異なる。したがって、異なる箇所のみについて説明し、その他の共通する部分は同一符号を付して説明する。
具体的には、再生装置1Fの記憶媒体11Fは、例えば、記憶手段として、音声データ及び映像データにより構成される再生データを予め記憶している。
なお、記憶媒体11Fには、音声データと、映像データと、が予め分離されて記憶されている。
また、再生装置1Fのデコーダ13Fは、制御部16Fから入力される制御信号に従って、例えば、読取部12から入力された再生データのうちの音声データにデコード等の所定の処理を施して、時間軸変換部14を介して音声出力装置3に出力するとともに、読取部12から入力された再生データのうちの映像データにデコード等の所定の処理を施して、表示装置5Fに出力する。
また、デコーダ13Fを介して表示装置1Fに接続された表示装置5Fは、例えば、液晶表示機器等であり、例えば、所定の出力装置として、デコーダ13Fから入力された再生データ(映像データ)に基づく映像を表示する。
また、再生装置1Fの制御部16Fは、例えば、図23に示すように、CPU161と、RAM162と、記憶部163Fと、などを備えて構成される。
記憶部163Fは、例えば、図22に示すように、パラメータ記憶ファイル163a1と、第1次再生プラン蓄積ファイル163a2と、第2次再生プラン蓄積ファイル163a3と、第1次再生プラン作成プログラム163b1と、第2次再生プラン作成プログラム163b2Fと、再生制御プログラム163b3Fと、などを記憶している。
第2次再生プラン作成プログラム163b2Fは、例えば、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPと、パラメータ記憶ファイル163a1に記憶されたM(τ)、M(τ)、CVk、CAk、CCkなどと、を基に、最適化問題を、線形計画問題として線形計画法を用いて解くことによって、当該第1次再生プランPを修正した現時点から未来に亘る第2次再生プランPを作成する機能を、CPU161に実現させる。
具体的には、最適化問題は、目的関数として、第1次再生プランPによる再生位置P(t+j)と第2次再生プランPによる再生位置P(t+j)との差d(或いは、第1次再生プランPによる再生位置P(t+j)と第2次再生プランPによる再生位置P(t+j)との差dと、第2次再生プランPによる再生加速度の大きさa+bと、の和)と、第2次再生プランPによる音声データの再生位置と第2次再生プランPによる映像データの再生位置との差と、の和を最小にするために、制約条件として、第2次再生プランPによる再生位置P(t+j)、再生速度V(t+j)及び再生加速度A(t+j)のうちの少なくとも1つの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まるように、線形計画問題として線形計画法を用いて解くものである。
また、第2次再生プラン作成プログラム163b2Fは、例えば、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPと、当該作成された第2次再生プランPと、の差が予め設定された規定範囲内にあるか否かを判断し、規定範囲内にないと判断した場合は、「語句の聞き取り」を確保したままでは、ユーザにより指示された再生速度Vに応じた再生位置(第1次再生プランPによる再生位置P(t))と、実際の再生位置(第2次再生プランPによる再生位置P(t))と、の差が大きすぎるため、当該作成された第2次再生プランPを、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPで置き換える機能を、CPU161に実現させる。
CPU161は、かかる第2次再生プラン作成プログラム163b2Fを実行することによって、第2次再生プラン作成手段及び判断手段として機能する。
再生制御プログラム163b3Fは、例えば、第2次再生プラン作成プログラム163b2Fを実行したCPU161により作成された現時点から未来に亘る第2次再生プランPに従って、記憶媒体11に記憶された再生データのうちの音声データを再生するとともに、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された現時点から未来に亘る第1次再生プランPに従って、記憶媒体11に記憶された再生データのうちの映像データを再生する機能を、CPU161に実現させる。
具体的には、CPU161は、例えば、読取部12に制御信号を入力して、第2次再生プラン作成プログラム163b2Fを実行したCPU161により作成された第2次再生プランPに従って、記憶媒体11から音声データを取得させ、そして、デコーダ13や時間軸変換部14に制御信号を入力して、読取部12により取得された音声データを音声出力装置3に出力させるとともに、読取部12に制御信号を入力して、第1次再生プラン作成プログラム163b1を実行したCPU161により作成された第1次再生プランPに従って、記憶媒体11から映像データを取得させ、そして、デコーダ13に制御信号を入力して、読取部12により取得された映像データを表示装置5Fに出力させる。
CPU161は、かかる再生制御プログラム163b3Fを実行することによって、出力制御手段として機能する。
変形例6の再生装置1Fによれば、目的関数として、第1次再生プランPによる再生位置P(t+j)と第2次再生プランPによる再生位置P(t+j)との差d(或いは、第1次再生プランPによる再生位置P(t+j)と第2次再生プランPによる再生位置P(t+j)との差dと、第2次再生プランPによる再生加速度の大きさa+bと、の和)と、第2次再生プランPによる音声データの再生位置と第2次再生プランPによる映像データの再生位置との差と、の和を最小にするために、線形計画問題として線形計画法を用いて解くようになっているため、再生される音声と映像のズレを抑えることができる。
なお、映像データを第1次再生プランPに従って再生するようにしたが、第1次再生プランPを基に、映像データ用の第2次再生プランを作成し、この映像データ用の第2次再生プランに従って、映像データを再生するようにしてもよい。このとき、この映像データ用の第2次再生プランを基に、第2次再生プランP(音声データ用の第2次再生プラン)を作成してもよい。或いは、逆に第1次再生プランPを基に、第2次再生プランP(音声データ用の第2次再生プラン)を作成して、第2次再生プランP(音声データ用の第2次再生プラン)を基に、映像データ用の第2次再生プランを作成し、この映像データ用の第2次再生プランに従って映像データを再生するようにしてもよい。この場合、目的関数から音声データの再生位置と映像データの再生位置との差を除去して、最適化問題を、例えば、目的関数として、第1次再生プランPによる再生位置P(t+j)と第2次再生プランPによる再生位置P(t+j)との差d(或いは、第1次再生プランPによる再生位置P(t+j)と第2次再生プランPによる再生位置P(t+j)との差dと、第2次再生プランPによる再生加速度の大きさa+bと、の和)を最小にするために、線形計画問題として線形計画法を用いて解くことになる。
この場合、音声データと映像データが各々に適した第2次再生プランに従って再生されるため、可変速再生をした場合であっても、音声と映像をより自然に視聴させることができる。
また、デコーダ13Fから制御部16Fに再生データ(映像データ)が入力されるよう構成し、デコーダ13Fから入力される再生データ(映像データ)を解析して、読取部11により読み取られた再生データが、静止画区間内の再生データであるか否かを判定し、静止画区間内の再生データであると判定された場合は、映像データを早送り再生をするようにしてもよい。
また、デコーダ13Fから制御部16Fに再生データ(映像データ)が入力されるよう構成し、デコーダ13Fから入力される再生データ(映像データ)を解析して、読取部11により読み取られた再生データが、変化の多い動画区間内の再生データであるか否かを判定して、変化の多い動画区間内の再生データであると判定された場合は、映像データをゆっくりと再生するようにしてもよい。
また、再生装置1Fは、実施例のように、線形計画問題を解いて第2次再生プランPを作成する限りではなく、変形例1のように、非線形計画問題を解いて第2次再生プランPを作成してもよいし、変形例2のように、近似的方法を用いて第2次再生プランPを作成してもよいし、変形例3のように、制約が必要ないと判断される時区間では、実施例や変形例1、変形例2などの制約条件よりも制約が緩和された条件内で第2次再生プランPを作成してもよいし、変形例4のように、話速に応じて制約条件を変化させて第2次再生プランPを作成してもよいし、変形例5のように、音量を調整してもよい。
なお、実施例及び変形例1〜6においては、再生装置1,1A〜1Fと、音声出力装置3や表示装置5Fと、が別体である必要はなく、一体であってもよい。
基礎的実験を行うための実験装置の機能的構成を示す図である。 マクロ速度及びマクロ加速度について説明するための図である。 L=2.0秒、L=0.5秒、L=0.5秒である場合のマクロ速度−加速度平面における第1次再生プランの軌跡を示す図である。 L=0.5秒、L=0.25秒、L=1.08秒である場合のマクロ速度−加速度平面における第1次再生プランの軌跡を示す図である。 延べ7名の被験者の結果を総計して得た、L=0.5秒、L=0.25秒、L=1.08秒である場合のマクロ速度−加速度平面における、聞き取れる割合を示す図である。 図5のマクロ速度−加速度平面上を、判別可能条件を満たす領域と聞き取り不可能な領域とに分割した図である。 L=0.5秒に固定して、LとLを変化させたときの分割の評価関数Eの変化を3次元プロットしたものを示す図である。 L=0.25秒、L=1.08秒に固定して、Lを変化させたときの分割の評価関数Eの変化を2次元プロットしたものを示す図である。 本発明の再生装置の機能的構成を示す図である。 本発明の再生装置による記憶媒体に記憶された再生データの再生に関する処理を説明するためのフローチャートである。 本発明の再生装置の再生処理によって各変数が更新されていく様子を示す図である。 マクロ速度−加速度平面における第1次再生プランの軌跡(a)と第2次再生プランの軌跡(b)を示す図である。 図12よりもマクロ加速度の条件を厳しくした折れ線を使用した場合の、マクロ速度−加速度平面における第1次再生プランの軌跡(a)と第2次再生プランの軌跡(b)を示す図である。 図12(a)(図13(a))に示す第1次再生プランの再生速度の変化(a)と図12(b)に示す第2次再生プランの再生速度の変化(b)と図13(b)に示す第2次再生プランの再生速度の変化(c)を示す図である。 変形例1の再生装置の機能的構成を示す図である。 変形例2の再生装置の機能的構成を示す図である。 変形例2の再生装置による記憶媒体に記憶された再生データの再生に関する処理を説明するための第1のフローチャートである。 変形例2の再生装置による記憶媒体に記憶された再生データの再生に関する処理を説明するための第2のフローチャートである。 マクロ速度−加速度平面における第1次再生プランの軌跡(a)と近似的方法QLP(t,L)によって作成した第2次再生プランの軌跡(b)を示す図である。 変形例3の再生装置の機能的構成を示す図である。 変形例4の再生装置の機能的構成を示す図である。 変形例5の再生装置の機能的構成を示す図である。 変形例6の再生装置の機能的構成を示す図である。
符号の説明
1,1A,1B,1C,1D,1E,1F 再生装置
3 音声出力装置(出力装置)
5F 表示装置(出力装置)
11,11F 記憶媒体(記憶手段)
12 読取部(取得手段)
14 時間軸変換部(時間軸変換手段)
15 操作部(指示手段)
161 CPU(第1次再生プラン作成手段、第2次再生プラン作成手段、判断手段、出力制御手段、無音区間判定手段、音声区間判定手段、話速推定手段、音量調整手段)
163b1 第1次再生プラン作成プログラム(第1次再生プラン作成手段)
163b2,163b2A,163b2B,163b2C,163b2D,163b2F 第2次再生プラン作成プログラム(第2次再生プラン作成手段、判断手段)
163b3,163b3F 再生制御プログラム(出力制御手段)
163b4C 無音区間判定プログラム(無音区間判定手段)
163b5C 音声区間判定プログラム(音声区間判定手段)
163b6D 話速推定プログラム(話速推定手段)
163b7E 音量制御プログラム(音量調整手段)

Claims (11)

  1. 再生データの再生時に、当該再生データの記録時の速度とは異なる速度で再生を行う再生装置において、
    前記再生データを記憶する記憶手段と、
    ユーザによる前記再生装置の操作によって指示された前記再生データの記録時の速度とは異なる再生速度V1に応じた、現時点t0における第1次再生プランP1による再生位置P1(t0)(=P1(t0−1)+(FS/FP)V1)及び未来における第1次再生プランP1による再生位置P1(t0+j)(j=1,2,…,LJ−1)を作成する第1次再生プラン作成手段(FSは再生データを構成する音声データのサンプリング周波数、FPは時間軸を離散化するサンプリング周波数、LJは再生位置のサンプル数)と、
    前記第1次再生プラン作成手段により作成された第1次再生プランを基に、最適化問題を解くことによって、修正量dj(j=0,1,…,LJ−1)を求め、現時点から未来に亘る第1次再生プランP1による再生位置P1(t0+j)(j=0,1,…,LS−1)と、前記修正量dj(j=0,1,…,LS−1)と、に基づいて、当該第1次再生プランを修正した現時点から未来に亘る第2次再生プランP2による再生位置P2(t0+j)(j=0,1,…,LS−1)を作成する第2次再生プラン作成手段(LSは修正量のサンプル数)と、
    を備え
    ユーザにとって視聴しやすい状態で再生データの可変速再生を行うことを特徴とする再生装置。
  2. 請求項1に記載の再生装置において、
    前記記憶手段に記憶された再生データの再生速度V1を指示するための指示手段と、
    前記第2次再生プラン作成手段により作成された第2次再生プランに従って、前記記憶手段から再生データを取得する取得手段と、
    前記取得手段により取得された再生データを所定の出力装置に出力させる出力制御手段と、を備え、
    前記第1次再生プラン作成手段は、前記指示手段により指示された再生速度V1に応じた、現時点から未来に亘る第1次再生プランを作成し、
    前記最適化問題は、目的関数として、所定の値を最小又は最大にするために、制約条件として、前記第2次再生プランによる再生位置、再生速度及び再生加速度のうちの少なくとも1つの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まるように、線形計画問題として線形計画法を用いて解くものであり、
    前記所定の値は、前記第1次再生プランと前記第2次再生プランとの差を含むことを特徴とする再生装置。
  3. 再生データの再生時に、当該再生データの記録時の速度とは異なる速度で再生を行う再生装置において、
    前記再生データを記憶する記憶手段と、
    前記記憶手段に記憶された再生データの再生速度V1を指示するための指示手段と、
    前記指示手段により指示された再生速度V1に応じた、現時点t0における第1次再生プランP1による再生位置P1(t0)(=P1(t0−1)+(FS/FP)V1)及び未来における第1次再生プランP1による再生位置P1(t0+j)(j=1,2,…,LJ−1)を作成する第1次再生プラン作成手段(FSは再生データを構成する音声データのサンプリング周波数、FPは時間軸を離散化するサンプリング周波数、LJは再生位置のサンプル数)と、
    前記第1次再生プラン作成手段により作成された第1次再生プランを基に、最適化問題を解くことによって、修正量dj(j=0,1,…,LJ−1)を求め、現時点から未来に亘る第1次再生プランP1による再生位置P1(t0+j)(j=0,1,…,LS−1)と、前記修正量dj(j=0,1,…,LS−1)と、に基づいて、当該第1次再生プランを修正した現時点から未来に亘る第2次再生プランP2による再生位置P2(t0+j)(j=0,1,…,LS−1)を作成する第2次再生プラン作成手段(LSは修正量のサンプル数)と、
    前記第2次再生プラン作成手段により作成された第2次再生プランに従って、前記記憶手段から再生データを取得する取得手段と、
    前記取得手段により取得された再生データを所定の出力装置に出力させる出力制御手段と、を備え、
    前記最適化問題は、目的関数として、所定の値を最小又は最大にするために、制約条件として、前記第2次再生プランによる再生位置、再生速度及び再生加速度のうちの少なくとも1つを元にした線形関数又は非線形関数を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まるように、非線形計画問題として非線形計画法を用いて解くものであり、
    前記所定の値は、前記第1次再生プランと前記第2次再生プランとの差を線形関数又は非線形関数で含むことを特徴とする再生装置。
  4. 再生データの再生時に、当該再生データの記録時の速度とは異なる速度で再生を行う再生装置において、
    前記再生データを記憶する記憶手段と、
    前記記憶手段に記憶された再生データの再生速度V1を指示するための指示手段と、
    前記指示手段により指示された再生速度V1に応じた、現時点t0における第1次再生プランP1による再生位置P1(t0)(=P1(t0−1)+(FS/FP)V1)及び未来における第1次再生プランP1による再生位置P1(t0+j)(j=1,2,…,LJ−1)を作成する第1次再生プラン作成手段(FSは再生データを構成する音声データのサンプリング周波数、FPは時間軸を離散化するサンプリング周波数、LJは再生位置のサンプル数)と、
    前記第1次再生プラン作成手段により作成された第1次再生プランを基に、修正量dj(j=0,1,…,LJ−1)を求め、現時点から未来に亘る第1次再生プランP1による再生位置P1(t0+j)(j=0,1,…,LS−1)と、前記修正量dj(j=0,1,…,LS−1)と、に基づいて、当該第1次再生プランを修正した現時点から未来に亘る第2次再生プランP2による再生位置P2(t0+j)(j=0,1,…,LS−1)を作成する第2次再生プラン作成手段(LSは修正量のサンプル数)と、
    前記第2次再生プラン作成手段により作成された第2次再生プランに従って、前記記憶手段から再生データを取得する取得手段と、
    前記取得手段により取得された再生データを所定の出力装置に出力させる出力制御手段と、を備え、
    前記第2次再生プラン作成手段は、前記第2次再生プランによる再生位置、再生速度及び再生加速度のうちの少なくとも1つの線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面又は空間内にある判別可能条件を示す予め設定された領域の内部に収まるという制約条件を満たすとともに、所定の値を最小又は最大にし、且つ、再生加速度が所定の範囲内にあるとともに、再生加速度が予め設定された時区間では一定である第2次再生プランを作成し、
    前記所定の値は、前記第1次再生プランと前記第2次再生プランとの差を含むことを特徴とする再生装置。
  5. 請求項2〜4の何れか一項に記載の再生装置において、
    前記記憶手段に記憶された再生データは、少なくとも音声データにより構成されており、
    前記第1次再生プラン作成手段により作成された第1次再生プランと、前記第2次再生プラン作成手段により作成された第2次再生プランと、の差が予め設定された規定範囲内にあるか否かを判断する判断手段と、
    前記判断手段によって前記第1次再生プラン作成手段により作成された第1次再生プランと前記第2次再生プラン作成手段により作成された第2次再生プランとの差が予め設定された規定範囲内にないと判断された場合、又は、前記第2次再生プラン作成手段により前記制約条件を満たす第2次再生プランが作成されなかった場合に、前記出力装置から出力される再生データに基づく音声の音量を予め設定された音量まで小さくなるように調整する音量調整手段と、
    を備えることを特徴とする再生装置。
  6. 請求項2〜5の何れか一項に記載の再生装置において、
    前記所定の値は、前記第2次再生プランによる再生加速度の大きさを含むことを特徴とする再生装置。
  7. 請求項2〜6の何れか一項に記載の再生装置において、
    前記記憶手段に記憶された再生データは、少なくとも音声データにより構成されており、
    前記取得手段により取得された再生データが、無音区間内の再生データであるか否かを判定する無音区間判定手段を備え、
    前記第2次再生プラン作成手段は、前記無音区間判定手段によって前記取得手段により取得された再生データが無音区間内の再生データであると判定された場合は、前記第1次再生プラン作成手段により作成された第1次再生プランを基に、前記制約条件よりも制約が緩和された条件内で第2次再生プランを作成することを特徴とする再生装置。
  8. 請求項2〜7の何れか一項に記載の再生装置において、
    前記記憶手段に記憶された再生データは、少なくとも音声データにより構成されており、
    前記取得手段により取得された再生データが、音声区間内の再生データであるか否かを判定する音声区間判定手段を備え、
    前記第2次再生プラン作成手段は、前記音声区間判定手段によって前記取得手段により取得された再生データが音声区間内の再生データでないと判定された場合は、前記第1次再生プラン作成手段により作成された第1次再生プランを基に、前記制約条件よりも制約が緩和された条件内で第2次再生プランを作成することを特徴とする再生装置。
  9. 請求項2〜8の何れか一項に記載の再生装置において、
    前記記憶手段に記憶された再生データは、少なくとも音声データにより構成されており、
    前記取得手段により取得された再生データに基づく音声の話速を推定する話速推定手段を備え、
    前記第2次再生プラン作成手段は、前記話速推定手段により推定された話速に応じて前記制約条件を変化させることを特徴とする再生装置。
  10. 請求項2〜9の何れか一項に記載の再生装置において、
    前記記憶手段に記憶された再生データは、音声データ及び映像データにより構成されており、
    前記所定の値は、前記第2次再生プランによる音声データの再生位置と、当該第2次再生プランによる映像データの再生位置と、の差を含むことを特徴とする再生装置。
  11. 音声データにより構成される再生データの再生時に、当該再生データの記録時の速度とは異なる速度で再生を行う再生装置において、
    前記再生データを記憶する記憶手段と、
    前記記憶手段に記憶された再生データの再生速度V1を指示するための指示手段と、
    前記指示手段により指示された再生速度V1に応じた、現時点t0における第1次再生プランP1による再生位置P1(t0)(=P1(t0−1)+(FS/FP)V1)及び未来における第1次再生プランP1による再生位置P1(t0+j)(j=1,2,…,LJ−1)を作成する第1次再生プラン作成手段(FSは再生データを構成する音声データのサンプリング周波数、FPは時間軸を離散化するサンプリング周波数、LJは再生位置のサンプル数)と、
    前記第1次再生プラン作成手段により作成された第1次再生プランを基に、最適化問題を解くことによって、修正量dj(j=0,1,…,LJ−1)を求め、現時点から未来に亘る第1次再生プランP1による再生位置P1(t0+j)(j=0,1,…,LS−1)と、前記修正量dj(j=0,1,…,LS−1)と、に基づいて、当該第1次再生プランを修正した現時点から未来に亘る第2次再生プランP2による再生位置P2(t0+j)(j=0,1,…,LS−1)を作成する第2次再生プラン作成手段(LSは修正量のサンプル数)と、
    前記第2次再生プラン作成手段により作成された第2次再生プランに従って、前記記憶手段から再生データを取得する取得手段と、
    前記取得手段により取得された再生データの波形の一致度を考慮して、当該再生データの時間軸を変換する時間軸変換手段と、
    前記時間軸変換手段により時間軸が変換された再生データを所定の出力装置に出力させる出力制御手段と、を備え、
    前記最適化問題は、目的関数として、前記第1次再生プランと前記第2次再生プランとの差と、前記第2次再生プランによる再生加速度の大きさと、の和を最小にするために、制約条件として、前記第2次再生プランによる再生位置の線形結合を要素とするベクトルが、そのベクトルを幾何学的に含む平面内にある判別可能条件を示す予め設定された領域の内部に収まるように、線形計画問題として線形計画法を用いて解くものであることを特徴とする再生装置。
JP2007122542A 2007-05-07 2007-05-07 再生装置 Expired - Fee Related JP5093648B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007122542A JP5093648B2 (ja) 2007-05-07 2007-05-07 再生装置
US11/935,745 US8165459B2 (en) 2007-05-07 2007-11-06 Reproducing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007122542A JP5093648B2 (ja) 2007-05-07 2007-05-07 再生装置

Publications (2)

Publication Number Publication Date
JP2008276122A JP2008276122A (ja) 2008-11-13
JP5093648B2 true JP5093648B2 (ja) 2012-12-12

Family

ID=39969620

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007122542A Expired - Fee Related JP5093648B2 (ja) 2007-05-07 2007-05-07 再生装置

Country Status (2)

Country Link
US (1) US8165459B2 (ja)
JP (1) JP5093648B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010266150A (ja) * 2009-05-15 2010-11-25 Zojirushi Corp 調理器
JP2012220547A (ja) * 2011-04-05 2012-11-12 Sony Corp 音量制御装置、音量制御方法およびコンテンツ再生システム
JP6454495B2 (ja) * 2014-08-19 2019-01-16 ルネサスエレクトロニクス株式会社 半導体装置及びその故障検出方法
US10878835B1 (en) * 2018-11-16 2020-12-29 Amazon Technologies, Inc System for shortening audio playback times

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0854895A (ja) * 1994-08-11 1996-02-27 Matsushita Electric Ind Co Ltd 再生装置
JP2955247B2 (ja) 1997-03-14 1999-10-04 日本放送協会 話速変換方法およびその装置
JP3730764B2 (ja) * 1997-09-12 2006-01-05 日本放送協会 話速/画速同時変換装置
JP4016158B2 (ja) * 1998-07-15 2007-12-05 ソニー株式会社 信号再生方法および信号再生装置
JP2001094948A (ja) 1999-09-27 2001-04-06 Sanyo Electric Co Ltd デジタル放送記録再生装置
JP4235780B2 (ja) 1999-09-29 2009-03-11 ソニー株式会社 信号再生方法および信号再生装置
JP2001222300A (ja) 2000-02-08 2001-08-17 Nippon Hoso Kyokai <Nhk> 音声再生装置および記録媒体
EP1309965B1 (en) * 2000-08-09 2010-12-15 Thomson Licensing Method and system for enabling audio speed conversion
US6625387B1 (en) * 2002-03-01 2003-09-23 Thomson Licensing S.A. Gated silence removal during video trick modes
JP2006127647A (ja) 2004-10-29 2006-05-18 Sharp Corp 音声高速再生装置及び方法

Also Published As

Publication number Publication date
US20080279528A1 (en) 2008-11-13
US8165459B2 (en) 2012-04-24
JP2008276122A (ja) 2008-11-13

Similar Documents

Publication Publication Date Title
JP4736586B2 (ja) 情報処理装置、情報処理方法、及びプログラム
US8386257B2 (en) Emotion detecting method, emotion detecting apparatus, emotion detecting program that implements the same method, and storage medium that stores the same program
US8744244B2 (en) Reproducing apparatus, reproducing method, and storage medium
JP5093648B2 (ja) 再生装置
US20090047003A1 (en) Playback apparatus and method
US8804976B2 (en) Content reproduction device and method, and program
EP1973115A1 (en) Contents reproducer and reproduction method
JP2019068300A (ja) ダイジェストデータ生成装置、ダイジェストデータ再生装置、ダイジェストデータ生成システム、ダイジェストデータ生成方法及びプログラム
US7203558B2 (en) Method for computing sense data and device for computing sense data
WO2021176842A1 (ja) 復号装置、復号方法、プログラム、符号化装置、符号化方法
JP4433027B2 (ja) 信号処理装置、信号処理方法、およびプログラム
JP4322691B2 (ja) 選曲装置
US20100138009A1 (en) Music Device Equipped with Image Display
IL178316A (en) Cerebrum evaluation device
JPH10260694A (ja) 話速変換装置、話速変換方法及び記録媒体
RU2510954C2 (ru) Способ переозвучивания аудиоматериалов и устройство для его осуществления
JP4390289B2 (ja) 再生装置
JP2009075280A (ja) コンテンツ再生装置
US20230145547A1 (en) Decoding device, decoding method, program, encoding device, and encoding method
JP2012004722A (ja) コンテンツ再生装置、コンテンツ再生方法、およびコンテンツ再生プログラム
JP2009260824A (ja) 映像音声出力装置
JP2001013003A (ja) 音質評価方法及び装置並びに音質評価尺度特定方法及び音質評価尺度特定用プログラムを記憶した記憶媒体
JP2006154531A (ja) 音声速度変換装置、音声速度変換方法、および音声速度変換プログラム
JP2837640B2 (ja) 補聴器
WO2023238650A1 (ja) 変換装置および変換方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120807

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120906

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150928

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees