JP2003309814A5 - - Google Patents

Download PDF

Info

Publication number
JP2003309814A5
JP2003309814A5 JP2002113624A JP2002113624A JP2003309814A5 JP 2003309814 A5 JP2003309814 A5 JP 2003309814A5 JP 2002113624 A JP2002113624 A JP 2002113624A JP 2002113624 A JP2002113624 A JP 2002113624A JP 2003309814 A5 JP2003309814 A5 JP 2003309814A5
Authority
JP
Japan
Prior art keywords
reproduction
voice
moving image
speed
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002113624A
Other languages
English (en)
Other versions
JP4086532B2 (ja
JP2003309814A (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2002113624A priority Critical patent/JP4086532B2/ja
Priority claimed from JP2002113624A external-priority patent/JP4086532B2/ja
Priority to US10/413,390 priority patent/US7286749B2/en
Publication of JP2003309814A publication Critical patent/JP2003309814A/ja
Publication of JP2003309814A5 publication Critical patent/JP2003309814A5/ja
Priority to US11/756,777 priority patent/US7450821B2/en
Application granted granted Critical
Publication of JP4086532B2 publication Critical patent/JP4086532B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

即ち、音声信号を含む動画情報を高速度で再生可能な動画再生装置であって、
前記動画情報に含まれる音声信号に基づいて、人の発声期間を表わす第1音声区間と、それ以外の第2音声区間とを判定する音声区間判定手段と、
前記動画情報に基づいて、前記第1音声区間は、ユーザが内容を把握可能な所定速度で、再生音声を伴う高速動画再生を行なう一方で、前記第2音声区間は、前記所定速度より高速度で、高速動画再生を行なう早見再生手段と、
を備えることを特徴とする。
好適な実施形態において、前記早見再生手段は、前記第2音声区間において、前記第1音声区間における音量より小音量の再生音声を伴う動画再生を行なうと良い。
或いは、好適な他の実施形態において、前記早見再生手段は、前記第2音声区間において、無音声にて動画再生を行なうと良い。
また、例えば前記早見再生手段は、前記第1音声区間の長さおよびその区間の再生速度と、前記第2音声区間の長さおよびその区間の再生速度とに基づいて、前記高速動画再生に要する所要時間を算出すると共に、算出した所要時間をユーザに提示することを特徴とし、
この場合、前記早見再生手段は、前記所要時間を提示するのに応じて、前記第1及び第2音声区間の再生速度の変更操作がユーザによって行われた場合に、その変更後の再生速度に基づいて、前記所要時間を調整する調整手段を含むと良い。
<動画早見インデックス作成部100>
図2は、動画早見インデックス作成部100において行われる人の発声期間を表わす音声区間(区間A)検出のためのアルゴリズムを表わすブロック図であり、AGC(オートゲインコントロール)21、ローパスフィルタ22、零交差検出部23a,23b、音声セグメント化部24、音声ピッチ検出部25、音声ラベリング部26、音声エネルギ計算部27、並びに音声区間判定部28から成る。
図3は、図2に示すアルゴリズムに基づく処理の概略を示すフローチャートであり、このフローチャートを参照して区間A検出の手順を説明すると、まずステップS301にて音声信号を複数の小セグメントに分割し、ステップS302では、それらの小セグメントの音響的な特徴を表す音声ラベリングを行なう。その際、ステップS303では、音声ピッチを検出することによってロバストな母音候補の検出を行い、最後に、ステップS304において、音声ピッチ検出結果に基づいて人の音声区間(区間A)の判定を行う。
そして、ステップS902では、図7に例示する場合において、零交差点X1を始点とし、零交差点X2を終点とする部分波形をf(x)、零交差点X2を始点とし、零交差点X3を終点とする部分波形をg(x)を、初期基準として決定する。
Figure 2003309814

Claims (30)

  1. 音声信号を含む動画情報を高速度で再生可能な動画再生装置であって、
    前記動画情報に含まれる音声信号に基づいて、人の発声期間を表わす第1音声区間と、それ以外の第2音声区間とを判定する音声区間判定手段と、
    前記動画情報に基づいて、前記第1音声区間は、ユーザが内容を把握可能な所定速度で、再生音声を伴う高速動画再生を行なう一方で、前記第2音声区間は、前記所定速度より高速度で、高速動画再生を行なう早見再生手段と、
    を備えることを特徴とする動画再生装置。
  2. 前記早見再生手段は、前記第2音声区間において、前記第1音声区間における音量より小音量の再生音声を伴う動画再生を行なうことを特徴とする請求項1記載の動画再生装置。
  3. 前記早見再生手段は、前記第2音声区間において、無音声にて動画再生を行なうことを特徴とする請求項1記載の動画再生装置。
  4. 前記音声区間判定手段は、前記音声信号に基づいて、声帯振動に対応する音声ピッチを抽出し、抽出した音声ピッチに基づいて、前記第1音声区間を判定することを特徴とする請求項1乃至請求項3の何れかに記載の動画再生装置。
  5. 前記早見再生手段において、前記第2音声区間における音声再生時の音量は、予め決定されるまたはユーザが指定可能であることを特徴とする請求項1乃至請求項3の何れかに記載の動画再生装置。
  6. 前記音声区間判定手段は、
    前記音声信号に含まれる人の発した音声帯域にフィルタリングを施すことによって得られる信号から、存在し得る声帯振動数範囲のピッチを抽出することによって人の声の支配的な母音部を検出すると共に、検出した母音部を統合することにより、前記第1音声区間を決定することを特徴とする請求項1乃至請求項3の何れかに記載の動画再生装置。
  7. 前記音声区間判定手段は、前記音声信号に基づいて、前記第1音声区間を判定するに際して、時間軸上で近接する複数の前記第1音声区間を、統合補正する補正手段を含むことを特徴とする請求項1乃至請求項3の何れかに記載の動画再生装置。
  8. 前記補正手段は、前記動画情報に含まれるシーンチェンジ点を検出すると共に、検出した個々のシーンチェンジ点のうち、着目する前記第1音声区間の始点よりも時間的に早く且つ最も近傍に位置する近傍シーンチェンジ点と、その始点との時間間隔が所定のしきい値以下である場合に、該着目する前記第1音声区間の始点を、該近傍シーンチェンジ点に対応する情報に置き換えることによって補正することを特徴とする請求項7記載の動画再生装置。
  9. 前記早見再生手段は、前記第1音声区間の長さおよびその区間の再生速度と、前記第2音声区間の長さおよびその区間の再生速度とに基づいて、前記高速動画再生に要する所要時間を算出すると共に、算出した所要時間をユーザに提示することを特徴とする請求項1乃至請求項3の何れかに記載の動画再生装置。
  10. 前記早見再生手段は、前記所要時間を提示するのに応じて、前記第1及び第2音声区間の再生速度の変更操作がユーザによって行われた場合に、その変更後の再生速度に基づいて、前記所要時間を調整する調整手段を含むことを特徴とする請求項9記載の動画再生装置。
  11. 更に、前記動画再生装置を利用可能なユーザを対象として、個々のユーザに関する属性情報が登録されたユーザ・プロファイルを備え、
    前記早見再生手段は、前記ユーザ・プロファイルに登録されているところの、特定ユーザに関する属性情報に従って、前記第1及び第2音声区間の再生速度を自動的に決定することを特徴とする請求項1乃至請求項3の何れかに記載の動画再生装置。
  12. 前記ユーザ・プロファイルには、前記個々のユーザに関する属性情報として、年齢、使用言語、動体視力、並びに早い音声の聴力のうち少なくとも何れかが含まれることを特徴とする請求項11記載の動画再生装置。
  13. 前記早見再生手段は、
    前記特定ユーザに関する属性情報に従って自動的に決定したところの、前記第1音声区間の長さおよびその区間の再生速度と、前記第2音声区間の長さおよびその区間の再生速度とに基づいて、前記高速動画再生に要する所要時間を算出すると共に、算出した所要時間を該ユーザに提示すると共に、その所要時間を提示するのに応じて、前記第1及び第2音声区間の再生速度の変更操作がユーザによって行われた場合に、その変更後の再生速度に基づいて、前記所要時間を調整する調整手段を含む
    ことを特徴とする請求項11または請求項12記載の動画再生装置。
  14. 前記調整手段は、前記変更後の第1及び第2音声区間の再生速度を、前記特定ユーザに関する属性情報と関連付けして、前記ユーザ・プロファイルに記憶し、
    前記早見再生手段は、前記高速動画再生に際して、前記ユーザ・プロファイルに記憶された変更後の第1及び第2音声区間の再生速度を反映する
    ことを特徴とする請求項13記載の動画再生装置。
  15. 前記早見再生手段は、
    前記第2音声区間の再生態様に関する情報がユーザによって指定された場合に、前記ユーザ・プロファイルに記憶された該ユーザに関する属性情報に対して、該再生態様に関する情報を関連付けして、前記ユーザ・プロファイルに記憶すると共に、前記高速動画再生に際して、前記ユーザ・プロファイルに記憶された前記第2音声区間の再生態様に関する情報を反映することを特徴とする請求項11記載の動画再生装置。
  16. 前記第1音声区間の高速動画再生時の前記所定速度は、等速再生の1.5倍乃至2倍の速度であることを特徴とする請求項1記載の動画再生装置。
  17. 前記早見再生手段は、前記ユーザ・プロファイルに登録された前記ユーザに関する属性情報に、高齢者、視覚障害者、或いは聴覚障害者であることを示す識別情報が含まれる場合に、その識別情報に対応するユーザを対象として前記高速動画再生を行なうに際して、前記第1音声区間の再生速度は前記等倍速度より遅くし、前記第2音声区間の再生速度は前記等倍速度より速く行なうことを特徴とする請求項11記載の動画再生装置。
  18. 前記早見再生手段は、前記ユーザ・プロファイルに登録された前記ユーザに関する属性情報に、そのユーザの使用言語を示す識別情報が含まれ、その識別情報と、前記動画情報に含まれる言語種別情報とが一致しない場合には、その識別情報に対応するユーザを対象として前記高速動画再生を行なうに際して、前記第1音声区間の再生速度は前記等倍速度より遅くし、前記第2音声区間の再生速度は5倍速乃至10倍速で行なうことを特徴とする請求項11記載の動画再生装置。
  19. 前記ユーザ・プロファイルには、前記動画再生装置を利用可能な複数のユーザを対象として、個々のユーザに関する属性情報が登録されており、
    前記早見再生手段は、特定ユーザの選択操作に応じて、または個人認証技術に基づいて、その特定ユーザに関する属性情報を、前記ユーザ・プロファイルから取得することを特徴とする請求項11記載の動画再生装置。
  20. 更に、前記ユーザ・プロファイルに登録された特定ユーザに関する属性情報を、その特定ユーザ自身が変更可能な属性情報変更手段を備えることを特徴とする請求項11記載の動画再生装置。
  21. 音声信号を含む動画情報を高速度で再生する動画再生方法であって、
    前記動画情報に含まれる音声信号に基づいて、人の発声期間を表わす第1音声区間と、それ以外の第2音声区間とを判定する音声区間判定工程と、
    前記動画情報に基づいて、前記第1音声区間は、ユーザが内容を把握可能な所定速度で、再生音声を伴う高速動画再生を行なう一方で、前記第2音声区間は、前記所定速度より高速度で、高速動画再生を行なう早見再生工程と、
    を有することを特徴とする動画再生方法。
  22. 前記早見再生工程では、前記第2音声区間において、前記第1音声区間における音量より小音量の再生音声を伴う動画再生を行なうことを特徴とする請求項21記載の動画再生方法。
  23. 前記早見再生工程では、前記第2音声区間において、無音声にて動画再生を行なうことを特徴とする請求項21記載の動画再生方法。
  24. 前記音声区間判定工程では、前記音声信号に基づいて、声帯振動に対応する音声ピッチを抽出し、抽出した音声ピッチに基づいて、前記第1音声区間を判定することを特徴とする請求項21乃至請求項23の何れかに記載の動画再生方法。
  25. 前記音声区間判定工程では、前記音声信号に含まれる人の発した音声帯域にフィルタリングを施すことによって得られる信号から、存在し得る声帯振動数範囲のピッチを抽出することによって人の声の支配的な母音部を検出すると共に、検出した母音部を統合することにより、前記第1音声区間を決定することを特徴とする請求項21乃至請求項23の何れかに記載の動画再生方法。
  26. 前記音声区間判定工程では、前記音声信号に基づいて、前記第1音声区間を判定するに際して、時間軸上で近接する複数の前記第1音声区間を、統合補正することを特徴とする請求項21乃至請求項23の何れかに記載の動画再生方法。
  27. 前記音声区間判定工程では、前記補正に際して、前記動画情報に含まれるシーンチェンジ点を検出すると共に、検出した個々のシーンチェンジ点のうち、着目する前記第1音声区間の始点よりも時間的に早く且つ最も近傍に位置する近傍シーンチェンジ点と、その始点との時間間隔が所定のしきい値以下である場合に、該着目する前記第1音声区間の始点を、該近傍シーンチェンジ点に対応する情報に置き換えることによって補正することを特徴とする請求項26記載の動画再生方法。
  28. 更に、前記動画再生装置を利用可能なユーザを対象として、個々のユーザに関する属性情報を、ユーザ・プロファイルとして登録する登録工程を有し、
    前記早見再生工程では、前記ユーザ・プロファイルに登録されているところの、特定ユーザに関する属性情報に従って、前記第1及び第2音声区間の再生速度を自動的に決定することを特徴とする請求項21乃至請求項23の何れかに記載の動画再生方法。
  29. 請求項1乃至請求項20の何れかに記載の動画再生装置を、コンピュータによって実現可能な動作指示をなすことを特徴とするコンピュータ・プログラム。
  30. 請求項21乃至請求項28の何れかに記載の動画再生方法として、コンピュータを動作させる指示をなすことを特徴とするコンピュータ・プログラム。
JP2002113624A 2002-04-16 2002-04-16 動画再生装置、動画再生方法及びそのコンピュータ・プログラム Expired - Fee Related JP4086532B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2002113624A JP4086532B2 (ja) 2002-04-16 2002-04-16 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
US10/413,390 US7286749B2 (en) 2002-04-16 2003-04-15 Moving image playback apparatus, moving image playback method, and computer program thereof with determining of first voice period which represents a human utterance period and second voice period other than the first voice period
US11/756,777 US7450821B2 (en) 2002-04-16 2007-06-01 Moving image playback apparatus, moving image playback method, and computer program thereof with determining of first voice period which represents a human utterance period and second voice period other than the first voice period

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002113624A JP4086532B2 (ja) 2002-04-16 2002-04-16 動画再生装置、動画再生方法及びそのコンピュータ・プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007317591A Division JP4455644B2 (ja) 2007-12-07 2007-12-07 動画再生装置、動画再生方法及びそのコンピュータ・プログラム

Publications (3)

Publication Number Publication Date
JP2003309814A JP2003309814A (ja) 2003-10-31
JP2003309814A5 true JP2003309814A5 (ja) 2005-05-19
JP4086532B2 JP4086532B2 (ja) 2008-05-14

Family

ID=29395757

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002113624A Expired - Fee Related JP4086532B2 (ja) 2002-04-16 2002-04-16 動画再生装置、動画再生方法及びそのコンピュータ・プログラム

Country Status (1)

Country Link
JP (1) JP4086532B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4515176B2 (ja) * 2004-07-13 2010-07-28 アルパイン株式会社 テレビ放送受信システム
JP4551734B2 (ja) * 2004-10-25 2010-09-29 パイオニア株式会社 変速再生装置及び変速再生方法
JP4882327B2 (ja) * 2005-09-29 2012-02-22 ヤマハ株式会社 コンテンツ再生装置、コンテンツ再生方法、及びコンテンツ再生プログラム
JP4321518B2 (ja) 2005-12-27 2009-08-26 三菱電機株式会社 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置
JP4442585B2 (ja) 2006-05-11 2010-03-31 三菱電機株式会社 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置
JP4563418B2 (ja) * 2007-03-27 2010-10-13 株式会社コナミデジタルエンタテインメント 音声処理装置、音声処理方法、ならびに、プログラム
JP5050634B2 (ja) 2007-05-08 2012-10-17 ソニー株式会社 画像処理システム、画像処理方法、およびプログラム
JP2009048676A (ja) * 2007-08-14 2009-03-05 Toshiba Corp 再生装置および方法
JP4679647B2 (ja) * 2009-02-27 2011-04-27 株式会社東芝 映像音声再生装置および映像音声再生方法
JP5358270B2 (ja) * 2009-04-28 2013-12-04 パナソニック株式会社 デジタル信号再生装置及びデジタル信号圧縮装置
JP5701017B2 (ja) * 2010-11-09 2015-04-15 キヤノン株式会社 動画再生装置、動画再生方法、コンピュータプログラム、記憶媒体

Similar Documents

Publication Publication Date Title
US7450821B2 (en) Moving image playback apparatus, moving image playback method, and computer program thereof with determining of first voice period which represents a human utterance period and second voice period other than the first voice period
JP4599244B2 (ja) 動画データから字幕を作成する装置及び方法、プログラム、並びに記憶媒体
JP5010292B2 (ja) 映像属性情報出力装置、映像要約装置、プログラムおよび映像属性情報出力方法
US20100298959A1 (en) Speech reproducing method, speech reproducing device, and computer program
WO2005069171A1 (ja) 文書対応付け装置、および文書対応付け方法
JP2003309814A5 (ja)
JP2011239141A (ja) 情報処理方法、情報処理装置、情景メタデータ抽出装置、欠損補完情報生成装置及びプログラム
JP2007101945A (ja) 音声付き映像データ処理装置、音声付き映像データ処理方法及び音声付き映像データ処理用プログラム
JP2010283605A (ja) 映像処理装置及び方法
JP3877371B2 (ja) 映像再生装置
JPH08286693A (ja) 情報処理装置
JP4086532B2 (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
WO2021085242A1 (ja) 情報処理装置、及びコマンド処理方法
JP4455644B2 (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
JP5310682B2 (ja) カラオケ装置
JP4272611B2 (ja) 映像処理方法、映像処理装置、映像処理用プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003309786A5 (ja)
JP4086886B2 (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
JP4509188B2 (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
JP3970080B2 (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
JP4353084B2 (ja) 映像再生方法及び装置及びプログラム
JP2009130849A (ja) シーン認識装置及び映像処理装置
JP2006154531A (ja) 音声速度変換装置、音声速度変換方法、および音声速度変換プログラム
JP4361347B2 (ja) データ同期装置、データ同期方法、およびその方法をコンピュータに実行させるプログラム
JP2003230094A (ja) チャプター作成装置及びデータ再生装置及びその方法並びにプログラム