JP2003309786A - 動画再生装置、動画再生方法及びそのコンピュータ・プログラム - Google Patents

動画再生装置、動画再生方法及びそのコンピュータ・プログラム

Info

Publication number
JP2003309786A
JP2003309786A JP2002113625A JP2002113625A JP2003309786A JP 2003309786 A JP2003309786 A JP 2003309786A JP 2002113625 A JP2002113625 A JP 2002113625A JP 2002113625 A JP2002113625 A JP 2002113625A JP 2003309786 A JP2003309786 A JP 2003309786A
Authority
JP
Japan
Prior art keywords
section
reproduction
voice
speed
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002113625A
Other languages
English (en)
Other versions
JP2003309786A5 (ja
JP3970080B2 (ja
Inventor
Hirotaka Shiiyama
弘隆 椎山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2002113625A priority Critical patent/JP3970080B2/ja
Priority to US10/413,390 priority patent/US7286749B2/en
Publication of JP2003309786A publication Critical patent/JP2003309786A/ja
Publication of JP2003309786A5 publication Critical patent/JP2003309786A5/ja
Priority to US11/756,777 priority patent/US7450821B2/en
Application granted granted Critical
Publication of JP3970080B2 publication Critical patent/JP3970080B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4305Synchronising client clock from received content stream, e.g. locking decoder clock with encoder clock, extraction of the PCR packets

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

(57)【要約】 【課題】 人の発した音声区間を正確に検出すると共
に、検出した音声区間に従って映像と音声との同期関係
を忠実に維持しながら、ユーザの閲覧所要時間を大幅に
短縮する。 【解決手段】 動画再生装置において、動画データに含
まれる副情報に基づいて、人の発声期間を表わす区間A
と、それ以外の区間Bとを判定すると共に、当該動画デ
ータに基づいて、区間Aは、等速再生乃至ユーザが内容
を把握可能な所定速度(例えば等速再生の1.5乃至2
倍速)で、再生音声を伴う高速動画再生を行なう一方
で、区間Bは、当該所定速度より高速度(例えば等速再
生の5乃至10倍速)で、少なくとも小音量の再生音声
を伴う高速動画再生、または無音で高速動画再生を行な
う。その際、動画再生の速度は、ユーザ・プロファイル
14に登録されたユーザの属性情報に応じて調整可能で
ある。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声の再生を伴う
動画再生技術の分野に関する。
【0002】
【従来の技術】従来より、例えば、ビデオテープレコー
ダ等のように、音声の再生を伴う動画再生装置において
は、再生実行時にユーザが動画全体を短時間で見ること
を可能とすべく、倍速再生機能や、高速早送り機能等が
備えられている。
【0003】また、代表的な動画再生装置であるビデオ
テープレコーダにおいては、近年、記録媒体の倍速再生
実行時に、音のエネルギが所定のしきい値以上の第1音
声区間と、当該所定のしきい値未満の第2音声区間とを
検出すると共に、その第1音声区間における音声信号の
ピッチ変換を行ないながら継続再生することにより、当
該第2音声区間を侵食しながらも、再生された音声はユ
ーザにとって多少早口ではあるもの、内容の理解が可能
な再生音を伴いながら、2倍速で記憶媒体を再生可能な
技術も提案されている。
【0004】
【発明が解決しようとする課題】しかしながら、上記の
如く音声信号の部分的なピッチ変換処理を行うと、動画
再生時に必ずしも音声と映像との同期関係が保てないこ
とにより、例えば、再生された映像中の人物の喋ってい
る映像と、再生された音声との同期が取れないことか
ら、人間の感覚にとって不自然な再生となり、ユーザは
違和感を感じることがある。
【0005】また、例えば特開平10−32776号公
報、特開平9−243351号公報等においては、音声
エネルギに基づいて無音状態を検出し、検出した無音状
態以外の音を人の発した音声区間とみなすことにより、
動画の要約(サマリー)を行う技術も提案されている。
しかしながら、例えばニュース番組等のように、その番
組全体を通して人の発した音声が支配的な動画において
は、音声エネルギに基づく人の発した音声区間の検出は
ある程度は可能であるものの、バックグラウンドノイズ
やバックグラウンド音楽が存在する環境下ではこの方法
は現実的ではない。
【0006】更に、上記特許公報以前の従来技術におい
ても、音声検出を行なうと共に、検出した音声を考慮し
た動画再生を行なう技術が数多く提案されており、その
殆どが音のエネルギをしきい値処理することによって音
声を検出している。この背景には、日本語の曖昧さに起
因する問題があり、「人の声」も「音声」と言い、人の
声を含む音一般も「音声」と呼ぶことに起因しており、
このような従来技術における音のエネルギのしきい値処
理を、真の「音声検出」とひとまとめに総称するのは不
適当である。
【0007】また、特開平9−247617号公報に
は、音声信号のFFT(高速フーリエ変換)スペクトラ
ムを算出することによって特異点を求めることによって
「音声情報等の特徴点」を検出し、その音量を分析する
技術が提案されている。しかしながら、FFTスペクト
ラムを利用する方法においては、再生すべき音声信号の
中に、広帯域のスペクトル分布となる所謂バックグラウ
ンド音楽等が含まれる場合には、その中から人の発した
声を検出することは困難である。
【0008】このように、音声を伴う従来の動画再生に
おいては、上述したように音声区間の検出が便宜的で不
正確であるという問題があり、更に、その検出結果を用
いた動画のサマリーの作成や倍速再生を行う場合には、
再生に際して、映像と音声との同期関係が維持できない
という問題がある。
【0009】また、近年においては、発声内容の情報
を、所謂、字幕やクロ−ズキャプション等によって、動
画データ及び音声信号と多重化、或いは別の領域帯域に
挿入されたメディアが登場しているが、このようなメデ
ィアの再生時においても、音声区間の検出結果を用いた
動画のサマリーの作成や倍速再生を行う場合には、再生
に際して、映像と音声との同期関係が維持できないとい
う問題がある。
【0010】また、一般に、老人や子供等のユーザにと
って各種装置を使いこなすことは容易なことでななく、
且つ速い速度で発せられる音声は、その内容の理解が追
いつき難いことが知られている。従って、このようなユ
ーザにとって、上述したテープレコーダのような動画再
生装置において倍速再生等の内容の早見(短縮再生)を
行なうに際しては、再生に最適な条件が一般のユーザと
は異なる。
【0011】更に、動体視力の弱いユーザ、早い音声に
対する聴力が弱いユーザ、或いは再生される音声を母国
語としない外国のユーザ等にとっても、上記のような動
画再生装置によって倍速再生等の内容の早見(短縮再
生)を行なうに際しては、再生に最適な条件が一般のユ
ーザとは異なる。
【0012】そこで本発明は、人の発した音声区間を正
確に検出すると共に、検出した音声区間に従って映像と
音声との同期関係を忠実に維持しながら、ユーザの閲覧
所要時間を大幅に短縮する動画再生装置、動画再生方法
及びそのコンピュータ・プログラムの提供を目的とす
る。
【0013】
【課題を解決するための手段】上記の目的を達成するた
め、本発明に係る動画再生装置は、以下の構成を特徴と
する。
【0014】即ち、音声信号と副情報とを含む動画情報
を、高速度で再生可能な動画再生装置であって、前記動
画情報に含まれる副情報に基づいて、人の発声期間を表
わす第1音声区間と、それ以外の第2音声区間とを判定
する音声区間判定手段と、前記動画情報に基づいて、前
記第1音声区間は、ユーザが内容を把握可能な所定速度
で、再生音声を伴う高速動画再生を行なう一方で、前記
第2音声区間は、前記所定速度より高速度で、少なくと
も高速動画再生を行なう早見再生手段とを備えることを
特徴とする。
【0015】好適な実施形態において、前記早見再生手
段は、前記第2音声区間において、前記所定速度より高
速度で、少なくとも小音量の再生音声を伴う動画再生を
行なうと良い。
【0016】好適な他の実施形態において、前記早見再
生手段は、前記第2音声区間において、前記所定速度よ
り高速度で、無音声にて動画再生を行なうと良い。
【0017】ここで、前記副情報には、人の発した音声
区間の開始タイミングと終了タイミング、開始タイミン
グとその区間長、或いは終了タイミングとその区間長の
うち何れかが含まれる。
【0018】また、例えば前記早見再生手段による高速
動画再生の実行を指示された際に、前記音声区間判定手
段は、再生映像が出力されるのに先立って前記動画情報
に基づいて前記第1及び第2音声区間を判定することに
より、前記音声区間判定手段による音声区間の判定と、
前記早見再生手段による高速動画再生とが、擬似的リア
ルタイムに行われると良い。
【0019】また、例えば前記音声区間判定手段は、前
記音声信号に基づいて、前記第1音声区間を判定するに
際して、時間軸上で近接する複数の前記第1音声区間
を、統合補正する補正手段を含むことを特徴とし、この
場合、前記補正手段は、前記動画情報に含まれるシーン
チェンジ点を検出すると共に、検出した個々のシーンチ
ェンジ点のうち、着目する前記第1音声区間の始点より
も時間的に早く且つ最も近傍に位置する近傍シーンチェ
ンジ点と、その始点との時間間隔が所定のしきい値以下
である場合に、該着目する前記第1音声区間の始点を、
該近傍シーンチェンジ点に対応する情報に置き換えるこ
とによって補正すると良い。
【0020】ここで、前記補正手段は、前記動画情報に
含まれるシーンチェンジ点を、前記副情報から抽出する
ことによって取得しても良い。
【0021】尚、同目的は、上記の各構成を備える動画
再生装置に対応する動画再生方法によっても達成され
る。
【0022】また、同目的は、上記の各構成を備える動
画再生装置及び方法を、コンピュータによって実現する
プログラムコード、及びそのプログラムコードが格納さ
れている、コンピュータ読み取り可能な記憶媒体によっ
ても達成される。
【0023】
【発明の実施の形態】以下、本発明に係る動画再生装置
の一実施形態を、図面を参照して詳細に説明する。
【0024】はじめに、本実施形態における動画再生装
置の動作の概要について、図1を参照して説明する。
【0025】図1は、本実施形態に係る動画再生装置に
おける動画早見アルゴリズムの概念図を表す図である。
【0026】本実施形態に係る動画再生装置は、図1に
示すように、大別して、動画早見インデックス作成部1
00と、動画早見再生部200とからなる。
【0027】<動画早見インデックス作成部100>動
画早見インデックス作成部100では、動画データ記憶
部10から読み出した動画データが映像/音声/副情報
分離処理(ステップS101)において映像データ(映像
信号)、音声データ(音声信号)、並びに副情報に分離
される。
【0028】そして、音声信号に対しては、音声区間読
み込み処理(ステップS102)及び音声区間補正処理
(ステップS103)が施され、映像信号に対しては、当
該副情報にシーンチェンジ点情報が含まれない場合に、
映像変化度演算処理(ステップS106)及びシーンチェ
ンジ点検出処理(ステップS107)が施され、副情報に
対しては、当該副情報にシーンチェンジ点情報が含まれ
る場合に、シーンチェンジ点読み出し処理(ステップS
105)が施される。早見再生区間補正処理(ステップS1
04)では、早見再生区間情報が生成され、生成されたこ
の情報は、動画早見インデックス記憶部11に記憶され
る。
【0029】即ち、音声区間読み込み処理(ステップS
102)では、動画データが映像/音声/副情報分離処理
(ステップS101)にて分離された情報に基づいて、
「人の発生内容に関する情報」と、「表示タイミング情
報」とが、音声区間読み込み結果として、当該動画デー
タから読み出される。ここで、表示タイミング情報に
は、表示開始タイミング、表示終了タイミング、並びに
区間長が含まれる。
【0030】音声区間補正処理(ステップS103)で
は、上記の音声区間読み込み結果に基づいて、音声再生
時に人(ユーザ)が不快にならないように、近接する複
数の音声区間を統合することによって新たに再生すると
ころの、人の発声期間を表わす音声区間(以下、「人の
音声区間」または区間Aと称する)の補正が行われるこ
とにより、補正済みの音声区間情報を取得する。
【0031】例えば、高速動画再生に際する悪い態様と
して、近接する2つの区間Aの間隔が狭い場合に、動画
再生に際して、それらの音声区間を、人が聞いて内容把
握ができる程度の速度で、音声を伴う倍速再生(例えば
2倍速再生)を行なうと共に、人の音声区間ではない区
間(以下、区間Bと称する)に対しては、動画再生に際
して、再生映像を人が見ることによって内容把握ができ
る程度の高倍率の倍速で再生を行うと、変化が激しく、
一般のユーザにとって聞き苦しいものとなる。
【0032】従って、本実施形態では、音声区間補正処
理(ステップS103)において、人の音声区間の間隔を
考慮し、その間隔がある所定の条件を満たす場合には複
数の人の音声区間群を統合することにより、前記の聞き
苦しさを解消する。ここで、所定の条件としては、例え
ば、人の音声区間の間隔が所定のしきい値以下であるこ
とを設定するのが最も容易である。
【0033】また、映像変化度演算処理(ステップS10
6)では、映像/音声/副情報分離処理(ステップS10
1)にて得られた映像データに対して、特開2000−
235639号公報に記載されたフレーム間の類似比較
処理を行うことによってフレーム間類似度を演算するこ
とにより、映像変化情報が生成される。
【0034】一般に、音声信号を含む動画データに映像
の変わり目が存在し、その直ぐ後に音声区間が始まる場
合には、動画再生に際して、ほんの一瞬高速でシーンの
先頭部分の映像が再生された後で、音声を伴う倍速再生
による再生映像が、人が聞いて把握できる速度で行われ
るため、ユーザにとって映像がちらついたような違和感
が生じる。
【0035】そこで、本実施形態では、上記の副情報に
シーンチェンジ点情報が含まれている場合には、シーン
チェンジ点読み出し処理(ステップS105)において、
その副情報からシーンチェンジ点群(シーンチェンジ点
情報)を読み出し、シーンチェンジ点情報が含まれてい
ない場合には、シーンチェンジ点検出処理(ステップS
107)において、例えば、本願出願人による先行する特
開2000−235639号公報に開示されたシーンチ
ェンジ点の検出技術を採用することにより、映像変化度
演算処理(ステップS106)にて得られた映像変化情報
に基づいて、シーンチェンジ点群(シーンチェンジ点情
報)を検出する。
【0036】そして、早見再生区間補正処理(ステップ
S104)では、ステップS103における音声区間補正処理
後の音声区間の先頭よりも時間的に早く、且つ最も近傍
で、その距離が所定のしきい値以下である場合に、音声
区間の先頭を、ステップS105またはステップS107にて
取得したシーンチェンジ点に対応する情報に置き換える
ことにより、ユーザの違和感を取り除くことができる。
【0037】上記各ステップの処理は、極めて高速に処
理が可能であるから、本実施形態では、動画早見再生部
200による動画再生を行なうに際して、動画データ記
憶部10から読み出した音声・副情報付き動画データを
メモリバッファ(不図示)に一時記憶しておき、動画再
生が実際に行われるのに先んじて、上記の「人の発生内
容に関する情報」を取得することにより、再生対象の動
画データの内容を予め解析すること無く、動画早見イン
デックス作成部100による早見再生区間情報の生成プ
ロセスと、生成された早見再生区間情報及び動画データ
を利用した動画早見再生部200による動画再生プロセ
スとを、動画全体(即ち、再生対象のコンテンツ全編)
を、擬似的リアルタイムに実行(即ち、擬似並行処理に
よって実行)することにより、ユーザは、所望する動画
コンテンツの全体(全編)を、短時間で効率良く早見す
ることが可能である。
【0038】<動画早見再生部200>次に、動画早見
再生部200では、動画早見再生処理(ステップS10
7)において、再生映像はディスプレイ12、再生音声
はスピーカ13を利用して再生される。この動画早見再
生処理による動画再生に際しては、動画早見インデック
ス記憶部11から読み出された早見再生区間情報に基づ
いて、ステップS108にて再生に要する時間が表示され
ると共に、その表示に応じてステップS109にて設定さ
れたユーザ所望の再生条件のフィードバックおよびユー
ザ・プロファイル14に基づく再生条件を統合判断する
ことにより、早見再生条件の最終的な設定が行われ、設
定された早見再生条件に基づいて、動画データ記憶部1
0から読み出した動画データの動画再生が行われる。
【0039】その際、本実施形態では、 ・区間Aに対しては、再生される音声をユーザが聞いた
際に内容を把握できる速度で音声を伴う倍速再生が行わ
れ、 ・区間Bに対しては、再生される映像を見ることによっ
てユーザが内容を把握できる範囲内で高倍率の倍速再生
が行われる。
【0040】ここで、上記の区間Aにおける倍速再生、
即ち、人が聞いて内容を把握できる速度の再生とは、実
験では2倍速まで、望ましくは1.5倍速程度にすると良い
ことが本願出願人による実験の結果から判っている。他
方、区間Bに対しては、再生映像を人が見て内容が把握
できる範囲で高い倍率の倍速で再生を行うが、本願出願
人による実験の結果によれば、経験的には10倍速まで、
望ましくは5倍速以上に設定すると良いことが判ってい
る。
【0041】区間Bを高倍率で倍速再生すると、一般
に、「キュルキュル」という音が出ることが知られてい
るので、ステップS107では、区間Bを高速で再生する
に際して、ユーザがそのような音を聞きたくない場合に
は、音声再生はミュートすることによって無音状態にす
る、或いは、再生時の音量を小さくすることが考えられ
る。
【0042】区間Aの再生速度、区間Bの再生速度及び
その再生時の音量に関して、最も簡単な実施方法は、動
画早見再生処理(ステップS107)において、予め音声
をどう処理するかを決めておく他、その再生速度を、ユ
ーザが可変で設定可能とする方法が存在する。
【0043】しかし、一般に、例えば老人や子供等のユ
ーザにとっては各種装置を使いこなすことは容易なこと
でななく、速い速度の音声再生が行われた場合にはその
内容理解が難いことが知られており、面倒な速度調整を
行わず且つ簡易に、やや低い倍率の倍速再生することが
好ましい。これと同様に、年齢に関わらず視力の弱いユ
ーザ(視覚障害者)、特に動体視力や聴力、特に早い音
声の聴力の弱いユーザの弱いユーザ(聴覚障害者)、或
いは再生される音声を母国語としない外国のユーザ等に
とっても、速い速度の音声再生が行われた場合にはその
内容理解が難いことが知られており、これらのユーザに
とって最適な再生速度もある。
【0044】そこで、本実施形態では、ユーザの年齢や
言語や理解できる言語や視力や聴力等の情報、更には個
々のユーザが好む基準の再生条件等のユーザに関する属
性情報を、ユーザ・プロファイル14に予め記憶してお
き、動画早見再生処理(ステップS107)において、そ
のプロファイル14を参照することにより、対象となる
ユーザに応じて、人間の発声期間を表わす音声区間(区
間A)および人間の発声区間を除く区間(区間B)の再
生速度をそれぞれ決定し、個人に応じた内容理解が容易
な動画早見再生を行うことが可能となる。
【0045】また、上述したように、区間Bの高倍率な
倍速再生時に、音声のミュート或いは音量を小さくする
場合にも、係る設定をプロファイル14に予め記述して
おくことにより、個々のユーザに応じた快適な動画早見
再生を行うことが可能となる。
【0046】更に、高齢者および動体視力にハンディキ
ャップのあるユーザに関しては、本来の早見再生という
観点からは外れるかもしれないが、区間Aの再生速度を
等倍速度より遅く設定すると共に、区間Bの再生速度は
等倍速度以上に設定することにより、係るユーザが区間
Aの音声内容を把握可能な低速再生を行いながらも、全
体としては全ての区間を低速再生する場合と比較して短
い所要時間で、動画(即ち、動画データ記憶部10に格
納されている動画データ)を閲覧することが可能とな
る。
【0047】また、早い音声の内容理解にハンディキャ
ップのあるユーザおよび音声内容の言語に堪能でないユ
ーザに関しては、本来の早見再生という観点からは外れ
るかもしれないが、区間Aの再生速度を等倍速度より遅
く設定すると共に、区間Bの再生速度は10倍速まで、望
ましくは5倍速以上とし、係るユーザが区間Aの音声内
容を把握可能な低速再生を行いながらも、全体としては
全ての区間を低速再生する場合と比較して短い所要時間
で、動画(即ち、動画データ記憶部10に格納されてい
る動画データ)を閲覧することが可能となる。ここで、
音声内容の言語に堪能か否かの判断は、上述したプロフ
ァイル14に予め記憶した識別情報(後述する表4では
得意言語)と、再生対象の動画に含まれる音声の言語種
類情報とを比較することによって行なえば良い。
【0048】ユーザ・プロファイル14を選択する手順
としては、例えば、ディスプレイ12に表示されたプロ
ファイル選択画面にユーザ・プロファイルリストを表示
し、その中から、ユーザによるリモコン端末(不図示)
の操作に応じて選択することが考えられ、更に指紋や声
紋や顔認識等の個人認識技術を用いた自動的なプロファ
イル選択方法を採用しても良い。
【0049】ところで、上記の如く個々のユーザにとっ
て最適な早見再生を行う場合に、果たして元々どの長さ
の動画がどの位の時間で早見できるかは、空き時間を活
用して早見を行おうとしているユーザにとって重要な情
報である。
【0050】そこで、本実施形態では、ステップS108
において、区間Aのトータル長を再生速度で割ることに
よって区間Aの再生時間を計算すると共に、区間Bにつ
いては、当該トータル長を再生速度で割ることによって
区間Bの再生速度を計算し、早見に要する時間として、
算出したこれら2つの値の和を求め、元の動画を等倍再
生する場合の所要時間と共にユーザに提示する。更に、
これらの再生時間をユーザが見た上で、所望の再生時間
内に収まるように、区間Aの再生速度や区間Bの再生速
度を指定することにより、ユーザ所望の再生時間に近く
なるように調節することが可能である。
【0051】ところで、予め設定されたユーザのプロフ
ァイル14と、ユーザが指示した所望の再生速度との関
連であるが、上記の如くステップS108においてプロフ
ァイル14を用いて自動的に算出された動画早見再生に
要する時間を見たユーザが、所定のマンマシン・インタ
フェースを介して、ステップS109において、更に、区
間Aおよび区間Bの再生速度を指定することにより、所
望の動画早見再生に要する時間(再生速度情報)を設定
した場合には、設定された所要時間内に納めるべく、自
動的、或いはユーザに確認を行った上で、係る設定され
た再生速度情報を新たにプロファイルに記憶することに
より、前回の操作情報を反映しつつ個々のユーザの好み
に応じた理解の容易な動画早見再生を行うことが可能と
なる。
【0052】また、上述したユーザ・プロファイルに、
更に、区間Bの再生時の音量をどう処理するかを予め指
定しておく、或いは所定のマンマシン・インタフェース
を介してユーザが指定した場合には、その指定された音
量情報を反映しつつ個々のユーザの好みに応じた理解の
容易な動画早見再生を行うことが可能となる。
【0053】<動画再生装置の動作の詳細>以下、上記
の如く概説した本実施形態に係る動画再生装置の動作の
詳細について説明する。以下の説明では、動画データ記
憶部10に記憶された録画済の動画データ(音声信号及
び副情報を含む動画データ)に対して早見再生を行うた
めのインデックスとして早見再生区間情報を作成し、作
成したその情報を利用して、当該動画データの早見再生
を行う場合を例に説明する。
【0054】本実施形態では、上述したように、ステッ
プS101の映像/音声分離処理を経た後処理として、大
別して、動画早見インデックス作成部100による動画
早見インデックス作成処理と、動画早見再生部200に
よる動画早見再生処理とがある。
【0055】本実施形態における音声・副情報付き動画
データは、映像情報、音声情報、並びに副情報が多重化
されたコンテンツであり、このような情報形態のメディ
アとしては、例えば、DVDやデジタルテレビ放送等が
挙げられる。
【0056】本実施形態において、副情報とは、動画の
セグメント情報、シーンチェンジ情報、字幕に関する情
報、時間情報等のように、映像や音声そのものとは異な
る各種の情報である。
【0057】本実施形態において、以下の説明では、係
る副情報として、「人の発生内容に関する情報」を利用
するが、この他にも、例えば、字幕、クロ−ズキャプシ
ョン等があり、更に、人が発した音声の認識結果から得
られる音素列表記等を採用することができる。
【0058】ここで、字幕やクロ−ズキャプションは、
聴覚障害者や自分が聴いている言語が理解できない者で
もコンテンツの内容を楽しめるように、映像信号と同期
して、人の発した音声内容に対応してオーバーレー表示
するためのものであり、このような副情報を含むコンテ
ンツは、その提供に先立って、人手により、或いは自動
または半自動的に、人の発声期間を表わす音声区間(区
間A)が決定されると共に、決定された個々の音声区間
における人の発声内容は、人手によって及び/または音
声認識処理を施すことによって、当該コンテンツに付加
的な情報(本実施形態では「副情報」)として記述され
るのが一般的である。
【0059】また、このようなコンテンツにおいて、そ
のコンテンツオリジナルな人の発した音声内容とは異な
る言語種類の字幕またはクロ−ズキャプションは、上記
の如く当該コンテンツに記述された副情報を、更に、人
手及び/または自動翻訳によって目的とする言語に翻訳
した後、追加的に記述されるのが一般的である。
【0060】そして、このような字幕やクロ−ズキャプ
ション等の副情報は、一般に、動画再生時の表示期間を
表すための区間情報を伴っており、この区間情報は、人
の音声区間(区間A)を表わすと捉えることができる。
【0061】そこで、本実施形態では、上記のような形
態の副情報を含む音声・副情報付き動画データを対象と
して、その動画データに含まれる人の音声区間(区間
A)を検出する。
【0062】本実施形態では、上述したように、ステッ
プS101の映像/音声分離処理を経た後処理として、大
別して、動画早見インデックス作成部100による動画
早見インデックス作成処理と、動画早見再生部200に
よる動画早見再生処理とがある。
【0063】<動画早見インデックス作成部100> (人の音声区間の検出)図2は、本実施形態において、
動画早見インデックス作成部100にて行われる人の音
声区間の検出処理の概略を示すフローチャートであり、
上述した音声区間読み込み処理(ステップS102)の詳
細な手順を表わす。
【0064】同図において、ステップS201では、上述
したステップS101における映像/音声/副情報分離処
理が施された動画ストリームで未だ読み込んでいないも
のがあるかを判断し、全て読み込み済みの場合には本処
理を終了する。
【0065】ステップS202では、ステップS201にて未
だ読み込んでいない動画ストリームが存在すると判断さ
れたので、その動画ストリームをバッファ(不図示)に
読み込み、ステップS203では、読み込んだ動画ストリ
ームに含まれる副情報から、「人の発生内容に関する情
報」として、字幕、クロ−ズキャプション、音声認識の
結果得られる音素列表記、或いは音声検出結果情報をシ
ークし、その結果得られる情報を、人の音声区間(音声
区間情報)として設定する。
【0066】ここで、読み込まれた情報の中からステッ
プS203において音声区間情報として何れのものを選択
するかは、存在するこれらの情報の中でその内容の確度
が高いものから選べば良く、例えば字幕>クロ−ズキャ
プション>音素列表記>音声検出結果情報の順位で選択
すれば良い。
【0067】表1は、音声区間情報として読み込んだ副
情報を例示する表であり、この例では、区間Aとして、
発音区間0乃至2に関して、個々の区間の開始時刻(始
点)と終了時刻(終点)とが対の情報として読み込まれ
ている。
【0068】
【表1】
【0069】(人の音声区間の補正)上述した音声区間
補正処理(ステップS103)の詳細について説明する。
ステップS103では、動画早見再生時に再生音声を聴い
たユーザが不快感を抱かないように、時間軸上で近傍に
位置する複数の音声区間を1つの音声区間として統合す
ることによる補正が行われる。
【0070】ここで、上述した音声区間の検出処理(図
2)によって取得した音声区間情報の補正を行なう理由
は、例えば、時間軸上で近傍に位置する2つの区間Aの
間隔が狭い場合に、区間Aを聞いて人が内容を把握でき
る速度で音声を伴う倍速再生を行なう一方で、区間Bに
対しては、再生映像を見て人が内容を把握できる範囲で
高倍率な倍速で再生を行うと、再生態様の変化が激し
く、ユーザにとって聞き苦しいものとなるからである。
【0071】また、動画デコーダおよび再生処理の面か
らも、短い区間での速度の変化は、処理のオーバーヘッ
ドが大きく、再生動作が一時的に停止状態になり、ギク
シャクした再生になることが、一例として、マイクロソ
フト社のDirectShowを用いた本願出願人による実験にお
いて観察されている他、他の多くの動画再生手段で同様
の現象が見られる。
【0072】そこで、本実施形態では、時間軸上で最も
近傍に位置する2つの音声区間(区間A)の間隔がある
しきい値(図3ではTh3)以下である場合には、これ
らの音声区間を統合することによる補正を行う。このし
きい値を決めるに当たっては、例えば、会話を行うシー
ンを想定し、会話が成り立つ程度の間を実験的に求め、
それをしきい値に用いる。この場合の処理の手順を、図
3を参照して説明する。
【0073】図3は、本実施形態において間隔の短い音
声区間に対して行われる統合補正処理を示すフローチャ
ートである。
【0074】同図において、ステップS301では、先に
検出された複数の区間Aのうち、時間軸上で最初に位置
する区間Aを、着目する音声区間として読み込むが、着
目すべき音声区間が無ければ本処理は終了する。
【0075】ステップS302では、次に着目する音声区
間(区間A)が存在するかを判断し、着目すべき音声区
間が無ければ本処理を終了し、一方、まだ存在する場合
には、以下に説明するステップS303乃至ステップS307
の処理を繰り返す。
【0076】ステップS303では、ステップS302にて次
に着目する音声区間が存在すると判断されたので、その
音声区間(区間A)を表わす音声区間情報を読み込む。
ここで、音声区間情報とは、音声区間の開始点と終点と
が対となった情報である。
【0077】ステップS304では、2つの区間Aの間
隔、即ち、時間軸上で先の音声区間(現在着目している
音声区間)の終点と、次の音声区間の開始点との間の距
離(時間間隔)を求め、この距離が所定のしきい値Th
3以下であるかを判断する。
【0078】ステップS305では、ステップS302にて2
つの区間Aの間隔が所定のしきい値Th3以下であると
判断されたので、これら2つの音声区間を、1つの音声
区間に統合する。より具体的に、統合された音声区間の
音声区間情報には、本ステップにおける処理によって、
先の音声区間の開始点が設定されると共に、次の音声区
間の終点が設定される。
【0079】ステップS306では、統合された音声区間
を、現在着目する音声区間(区間A)として設定し、ス
テップS302に戻る。
【0080】ステップS307では、ステップS302にて2
つの区間Aの間隔が所定のしきい値Th3より大きいと
判断されたので、現在着目する音声区間を、そのまま1
つの補正した音声区間情報として記憶すると共に、ステ
ップS308では、次の音声区間を、処理対象として着目
すべき音声区間として設定し、ステップS302に戻る。
【0081】このような統合処理が、扱うべき音声区間
(区間A)がなくなるまで繰り返される。
【0082】(シーンチェンジ点情報を利用した人の音
声区間の補正)一般に、音声信号を含む動画データに映
像の変わり目が存在し、その直後に区間Aが始まる場合
には、動画再生に際して、ほんの一瞬高速でシーンの先
頭部分の映像が再生された後で、音声を伴う倍速再生に
よる再生映像が、人が聞いて把握できる速度で行われる
ため、ユーザにとって映像がちらついたような違和感が
生じる。
【0083】そこで、本実施形態では、例えば、本願出
願人による先行する特開2000−235639号公報
に開示されたシーンチェンジ点の検出技術を採用するこ
とにより、ステップS107にて検出したシーンチェンジ
点群、或いは、ステップS105にて副情報から読み出さ
れたシーンチェンジ点群のうち、音声区間補正処理後の
音声区間の先頭よりも時間的に早く、最も近傍で、且つ
その距離があるしきい値以下であるシーンチェンジ点が
存在する場合には、その音声区間の先頭を、該シーンチ
ェンジ点に対応する情報に置き換える補正を行なうこと
により、早見再生時のユーザの違和感を取り除く。その
際、近傍判定のためのしきい値は、高速再生の状態から
人が聞いて内容が把握できる程度の速度で音声を伴う倍
速再生へ移行する際のオーバーヘッドに応じた値であ
る。
【0084】図4は、本実施形態においてシーンチェン
ジ点を用いて行われる音声区間統合補正処理を示すフロ
ーチャートであり、早見再生区間補正処理(ステップS
104)の詳細を表わす。
【0085】同図において、まずステップS401では、
シーンチェンジ点検出処理(ステップS107)にて検出
されたシーンチェンジ点群(シーンチェンジ点情報また
はシーンチェンジ位置情報)から、時間軸上で先頭とな
るシーンチェンジ点(A)を読み込む。
【0086】シーンチェンジ点情報は、通常はフレーム
単位で記述されるが、本ステップでは、フレームレート
に基づいて時間情報に変換した後、音声区間情報と比較
することになる。即ち、本実施形態のアルゴリズムで
は、音声区間の開始点から最も近傍のシーンチェンジ点
を求めるために、連続する2つのシーンチェンジ点情報
を用いることにし、ここでは、説明の便宜上、先のシー
ンチェンジ点をA、次のシーンチェンジ点をBとして、
ステップS401では、Aの方へシーンチェンジ点の時間
を記憶する。
【0087】ステップS402では、読み込んでない音声
区間情報があるかどうかを判断し、無い場合には処理を
終了し、読み込んでない音声区間情報がある場合にはス
テップS403において音声区間情報を1つ読み込む。
【0088】ステップS404では、未だ読み込んでない
シーンチェンジ点情報があるかどうかを判断し、無い場
合には、ステップS403にて既に読み込んである音声区
間情報を、ステップS405において、そのまま補正済の
音声区間情報として更新記憶する。
【0089】ステップS406では、ステップS404にて読
み込んでないシーンチェンジ点情報があると判断された
ので、そのシーンチェンジ点情報を、シーンチェンジ点
情報Bとして読み込む。
【0090】ステップS407では、シーンチェンジ点A
が、時間軸上において、ステップS403にて読み込んだ
現在着目する音声区間の始点より前に位置するかどうか
判断し、前に位置する場合には、ステップS405におい
て、補正の必要は無いとして音声区間情報をそのまま補
正済音声区間情報として更新記憶する。
【0091】ステップS408では、ステップS407にてシ
ーンチェンジ点Aが現在着目する音声区間の始点より前
に位置すると判断されたので、そのシーンチェンジ点A
が当該音声区間の始点としきい値Th4以内の距離に存
在するかどうかを判断し、当該しきい値Th4以内では
ない場合には、ステップS409において、シーンチェン
ジ点Bの情報を、シーンチェンジ点Aへコピーすること
により、次のシーンチェンジ点を判断対象とする準備を
行う。
【0092】ステップS410では、ステップS408にてシ
ーンチェンジ点Aが現在着目する音声区間の始点と当該
しきい値Th4以内の距離に存在すると判断されたの
で、シーンチェンジ点Bが当該音声区間の始点よりも後
ろに位置するかを判断し、後ろに位置しない場合にはス
テップS409に進む。
【0093】一方、ステップS410にてシーンチェンジ
点Bが当該音声区間の始点よりも後ろに位置すると判断
された場合には、ステップS411において、シーンチェ
ンジ点Aが開始点であり、当該音声区間の終点が終点で
ある部分区間を、補正済の音声区間情報として更新記憶
し、ステップS412では、シーンチェンジ点Bの情報
を、シーンチェンジ点Aにコピーすることにより、次の
シーンチェンジ点を判断対象とする準備を行う。
【0094】即ち、上述したステップS407、ステップ
S408、並びにステップS410の判断によって、シーンチ
ェンジ点Aが現在着目する音声区間の始点の前に位置す
ると共に、当該しきい値Th4以下の近傍であり且つ、
最も音声区間の始点に近い点であることが確かめられて
初めて、上記のステップS411及びステップS412の処理
が行われる。
【0095】また、ステップS410にてシーンチェンジ
点Bが当該音声区間の始点よりも後ろではないと判断さ
れた場合、当該シーンチェンジ点Bは、現在設定されて
いるシーンチェンジ点Aよりも補正済音声区間の始点候
補として更にふさわしいと判断できるので、ステップS
409において、当該シーンチェンジ点Bの情報を、新た
なシーンチェンジ点Aとしてコピーすることにより、次
のシーンチェンジ点を判断対象とする準備を行ない、そ
の後でステップS404の処理に戻る。但し、この場合の
シーンチェンジ点Aは、既にステップS407およびステ
ップS408の要件を満たしているので、ステップS407と
ステップS408とをパスしてステップS410の判断をいき
なり行っても構わない。
【0096】上述した音声区間統合補正処理(図4)の
手順によって取得した補正済の音声区間情報は、早見再
生区間情報として、表2に例示するようなスキーマで、
動画早見インデックス記憶部11に記憶される。
【0097】表2は、本実施形態におけるシーンチェン
ジ検出結果を例示する表であり、一例として、シーンチ
ェンジ点の検出を行ったフレームを、フレームレート
(30枚/Sec)を元に秒換算した結果が格納されている。
【0098】
【表2】
【0099】そして、表3は、本実施形態における補正
済の音声区間検出結果を例示する表であり、表2に示す
結果と表1に示す結果とに基づいて、シーンチェンジ点
を用いた音声区間の統合補正処理(図4)を、しきい値
Th4= 2000 mSecで施した場合の処理結果を示す。
【0100】
【表3】
【0101】表1及び表2を参照すると、音声区間0お
よび音声区間2に対しては、それぞれの音声区間の開始
点60000 mSec、400000 mSecの前で且つしきい値Th4
である2000 mSec以内の期間にはシーンチェンジは存在
しない。また、音声区間1に対しては、開始点102000 m
Secの1500 mSecの前で且つ2000 mSec以内には、シーン
チェンジ点として、シーンチェンジID=2(開始時間
100000 mSec)と、シーンチェンジID=3(開始時間1
01000mSec)の2点が存在するが、図4で示したアルゴ
リズムに従って最も近傍のものを選ぶことから、結果と
して、シーンチェンジID=3の101000mSecが選ばれ、
これが表3に反映されている。
【0102】<動画早見再生部200>動画早見再生部
200にて行われる動画早見再生処理(ステップS10
7)は、人の音声区間(区間A)に対しては人が聞いて
内容を把握できる速度で音声を伴う倍速再生を行なう一
方で、人の音声区間ではない区間(区間B)に対して
は、再生映像を人が見て内容が把握できる範囲で高い倍
率の倍速で再生を行う。
【0103】近年、動画再生環境が整い、例えばマイク
ロソフト社の DirectShowモジュールを用いると、任意
区間の速度を指定して連続再生することが可能である。
このような機能を持つモジュールを用いることで、比較
的簡易に任意区間の再生速度の変化を実現することが可
能であり、その際、重要なのは、何の観点で速度を変化
させるかである。
【0104】図5は、本実施形態における動画早見再生
処理を示すフローチャートである。
【0105】同図において、ステップS601では、先に
上述したユーザ・プロファイル14の中からユーザが所
望のものを選択するが、その具体的な手順としては、例
えば、ディスプレイ12に図8に例示するようなユーザ
・プロファイルリストを含む表示画面を表示し、その中
からユーザがリモコン端末等を利用して、所望のプロフ
ァイルを選択すれば良い。
【0106】即ち、図7に示すユーザ・プロファイルリ
ストにおけるユーザ所望のプロファイルの指定は、例え
ばリモコン端末にプロファイル選択用の操作ボタンを設
けておき、これをユーザが押下するのに応じて、図9に
例示するようなメニュー表示画面が表示され、その画面
を見ながら、リモコン端末のプロファイル選択用の操作
ボタンを利用して、ユーザが所望のプロファイルを指定
する。もちろんユーザ・プロファイルの選択には、指紋
や声紋や顔認識等の個人認識技術を用いた自動的なプロ
ファイル選択方法も考えられ、こちらの方が常に正しい
プロファイルの指定が可能なため、プロファイルの指定
の誤りを起こしたり、他人のプロファイルを変更したり
内容を覗く等のトラブルを防げる。
【0107】また、ユーザ・プロファイルを新規に登録
する場合には、図7の表示画面において「新規登録」ボ
タンをポインタデバイスで指定すると、プロファイル名
およびその他の属性を入力するための、図8に例示する
表示画面が現れる。
【0108】即ち、図8は、ユーザ・プロファイル登録
用の表示画面を例示する図であり、初期状態では、識別
名と年齢以外の内容が基準値で埋められており、ユーザ
による入力操作によってユニークな識別名と年齢の入力
変更の必要がある個所のみが変更され、所定の入力値範
囲の適正チェックをパスした後、ユーザが「OK]ボタ
ンを押下するのに応じて、そのプロファイルがユーザ・
プロファイル14に新たに追加登録される。
【0109】また、ユーザが所望のプロファイルの内容
変更を希望する場合、図7に示す表示画面において「変
更」ボタンを押下し、図9に示す表示画面において所望
のプロファイルを選択するのに応じて表示される図8の
表示画面において、変更を希望する項目の情報内容を変
更した後、「OK]ボタンを押下すれば良い。
【0110】更に、ユーザが所望のプロファイルの削除
を希望する場合、図7に示す表示画面において「削除」
ボタンを押下し、図9に示す表示画面において所望のプ
ロファイルを選択し、その後、「OK]ボタンを押下す
れば良い。
【0111】尚、上述した図7及び図8に示す表示画面
において、「キャンセル」ボタンが押下された場合に
は、それまでの選択操作や入力操作に対応する処理(プ
ロファイルの登録、変更、削除)はなされることなく処
理が終了する。
【0112】次に、ステップS602では、ステップS601
にて選択されたプロファイルが、ユーザ・プロファイル
14に存在するかを判断し、存在する場合には、ステッ
プS603において対象となるプロファイルをユーザ・プ
ロファイル14から読み込み、存在しない場合には、基
準値として予め設定されているところの、区間Aおよび
区間Bの再生速度、並びに区間Bの再生時の音量を、ス
テップS606において読み込む。ここで、ユーザ・プロ
ファイルのデータスキーマ一の一例を、表4に示す。
【0113】
【表4】
【0114】表4は、本実施形態におけるユーザ・プロ
ファイルを例示する表である。基準値は、プロファイル
ID=0に示すように記憶しておけば良く、この場合、
区間Aの再生速度は1.5倍速、区間Bの再生速度は10.0
倍速、そして、区間B再生時の音量の基準値は0(即ち
音声ミュート)である。上述したユーザ・プロファイル
の新規登録時に用いられる基準値には、この値を用い
る。
【0115】また、表4のユーザ・プロファイルのデー
タスキーマ一において、None とは値が設定されていな
いことを表し、逆に値が設定されている場合は、その値
を最優先して再生を行う。更に、表4において、視力や
聴力の欄の Good と Poorは、その人の年齢に無関係
な、動体視力や早い音声の聴力の能力を表わす。
【0116】一般に、高齢になるほど耳が聞こえにくく
なる他、言葉を理解する速度の低下が見られることが多
く、また子供は言語能力が未発達のために速い速度で音
声再生を行なうと理解できなくなることが多い。
【0117】これらの事情を踏まえて、健常者の年齢に
適した区間Aの再生速度、並びに区間Bの再生速度のテ
ンプレートを予め用意しておき、ユーザ・プロファイル
14に記憶された年齢に基づき、これらの速度を決定す
る。
【0118】しかし、青年にも関わらず動体視力や早い
音声の聴力の弱い人や、外国人のため母国語とは異なる
言語(例えば日本語)速い速度で音声再生を行なうと理
解が追いつかない等、年齢に無関係な原因がある場合も
ある。このため、本実施形態では、表4に例示するユー
ザ・プロファイルのように、視力および聴力の特性を記
述しておき、これらの設定があればこちらを優先して、
区間Aの再生速度、並びに区間Bの再生速度を低めに決
定する。
【0119】このような場合、高齢者および動体視力の
弱いユーザに関しては、本来の早見再生という観点から
は外れるかもしれないが、人の音声区間(区間A)の再
生速度を等倍速度より遅い速度に決定し、人の音声区間
ではない区間(区間B)の再生速度を等倍速度以上とす
ることにより、係るユーザが区間Aの音声内容を把握可
能な低速再生を行いながらも、全体としては全ての区間
を低速再生するよりも速い時間で動画を閲覧することが
可能となる。
【0120】また、早口の音声に対する聴力の弱いユー
ザおよび外国人のため早口の日本語等では理解が追いつ
かないユーザに関しては、区間Aの再生速度を等倍速度
より遅い速度に決定し、区間Bの再生速度に関しては、
その年齢の健常者と同じ再生速度とすることにより、区
間Aの音声内容を把握可能な低速再生を行いながらも、
全体としては全ての区間を低速再生するよりも速い時間
で動画を閲覧することが可能となる。
【0121】このように、本実施形態では、ユーザ・プ
ロファイルに対する速度決定処理は、予め健常者におけ
る年齢に適した区間Aの再生速度および区間Bの再生速
度のテンプレート、動体視力や早い音声の聴力の弱い症
状、外国人のため早口の日本語では理解が追いつかない
状況を加味して総合的な判断を行う。
【0122】また、本実施形態において、音声内容の言
語に堪能か否かの判断は、ユーザ・プロファイル14に
記憶されている堪能であるか否か、或いは母国語を特定
する言語種別情報と、再生対象の動画に含まれる音声内
容の言語種別情報とを比較することにより行う。近年、
DVD等のデジタルコンテンツや、デジタルBS等のデ
ジタルメディアには、音声内容の言語を特定する言語種
別情報が記憶されており、また近年EPG(電子番組
表)等から番組内容が電子的に入手可能であるため、こ
れらの情報を用いることは現実的である。また、これら
の情報が入手できない場合であっても、地上波TV番組
でも標準設定では母国語、2カ国音声では通常メイン音
声が母国語であり且つサブ音声は外国語であるため、こ
れらの経験則に基づいて推定すれば良い。
【0123】ステップS604では、ステップS603にて読
み込んだユーザ所望のプロファイルに基づいて、区間A
の再生速度と、区間Bの再生速度とを決定する。ここ
で、本ステップにおける処理の詳細を、図6を参照して
説明する。
【0124】図6は、本実施形態における動画早見再生
処理を示すフローチャートのうち、ステップS604(図
5)の処理の詳細を示すフローチャートである。
【0125】同図において、まずステップS601では、
ユーザ・プロファイル14から先にユーザによって選択
されたプロファイルを読み込み、ステップS602では、
読み込んだプロファイルから取得したユーザの年齢に従
って、健常者の年齢に応じた最適な区間Aの再生速度
と、区間Bの再生速度とが設定されているテンプレート
を参照することにより、そのユーザに対する区間Aの再
生速度と、区間Bの再生速度とを仮決定する。
【0126】ステップS603では、ステップS601にて読
み込んだプロファイルに、動体視力が弱いと記述されて
いるかを判断し、その旨が記述されている場合には、ス
テップS604において、区間Aの再生速度と、区間Bの
再生速度とを両方とも基準値より低い値に更新する。従
って、この値も、予めプロファイルに記憶しておくのが
望ましい。
【0127】ステップS605では、ステップS603にて当
該プロファイルに動体視力が弱いとは記述されていない
と判断されたので、当該プロファイルに、速い音声の聴
力が弱いと記述されているかを判断し、その旨が記述さ
れている場合には、ステップS606において、区間Aの
再生速度のみ低い値に更新する。従って、この値も、予
めプロファイルに記憶しておくのが望ましい。
【0128】ステップS607では、ステップS605にて当
該プロファイルに速い音声の聴力が弱いとは記述されて
いないと判断されたので、再生すべき動画データに含ま
れる音声内容の言語種別情報が入手可能であるかを判断
し、入手可能である場合にはステップS608に進み、入
手不可能な場合には処理を終了する。
【0129】ステップS608では、再生すべき動画デー
タに含まれる音声内容の言語種別情報を入手すると共
に、入手した言語種別情報と、現在選択されている当該
プロファイルに記述された得意言語情報とを比較し、こ
れら2種類の情報が一致する場合には処理を終了し、一
致しない場合には、ステップS609において、区間Aの
再生速度のみ低い値に更新する。従って、この値も、予
めプロファイルに記憶しておくのが望ましい。
【0130】即ち、図6に示す一連の処理では、ステッ
プS603、ステップS605、並びにステップS608のどれ
にも当たらない場合には、ステップS602において仮決
定された区間Aの再生速度、並びに区間Bの再生速度が
そのまま採用されることになる。
【0131】もし、高齢や若年にもかかわらず動体視力
や早い音声の聴力が優れている場合や、逆に劣っている
場合には、区間Aの再生速度および区間Bの再生速度の
変更メニューを用いて、これらの値を変更できるように
構成すると良い。この場合、ユーザは、再生映像を見な
がら、区間Aの再生速度および区間Bの再生速度を適宜
変更し、自動的、或いはユーザに確認を求めた上で、設
定された再生速度情報を、当該ユーザに対応するプロフ
ァイルに記憶することにより、前回の操作情報を反映し
つつ個々のユーザに応じた理解しやすい動画早見再生を
行うことが可能となる。
【0132】尚、上述したプロファイルを用いずに簡易
に行うのであれば、例えば、ステップS601乃至ステッ
プS604、並びにステップS606の各ステップにおける処
理の代わりに、区間Aの再生速度を0.5倍速から2倍速ま
で、区間Bの再生速度を2倍速から10倍速までの間で、
ユーザが動作メニューを利用して可変設定可能に構成す
る実施形態が想定される。
【0133】ところで、区間Bを高倍率で倍速再生する
と、「キュルキュル」という音が出るが、その音を聞き
たくない場合には、区間Bの再生時には、音声再生はミ
ュート状態とすることによって音を出なくする、或い
は、小さな音量に変更する実施形態が想定される。この
ような設定に関しても、ステップS603で読み込んだプ
ロファイルに予め記述しておき、動画早見再生時には、
係るプロファイルを最優先とし、ステップS602でプロ
ファイルが存在しないと判定された場合には、ステップ
S606では予め設定されている基準の音量を採用する。
もちろん更に簡易に行うのであれば、例えば、動画早見
再生処理が予め区間Bの音声再生レベルをどう処理する
か予め決めておく実施形態が想定される。
【0134】上記のような構成により、本実施形態で
は、区間Aの再生速度および区間Bの再生速度、或いは
それら両方、並びに区間Bの音声レベルの指定を、ユー
ザ・プロファイルを用いることにより、個々のユーザに
最適な再生を簡便に実現することが可能となる。
【0135】次に、ステップS605では、動画早見イン
デックス記憶部11から、補正済み音声区間情報を読み
込み、ステップS607では、区間Aのトータル長を再生
速度で割ることによって区間Aの再生時間を計算し、区
間Bについても同様にして再生速度を計算すると共に、
これら2つの値を足すことによってユーザが早見に要す
る時間を算出する。そして、算出された早見に要する時
間は、ディスプレイ23等を利用してユーザに提示す
る。
【0136】ステップS608では、ステップS607にて早
見再生時間を認識したユーザがその時間に満足している
か否かを、リモコン端末への入力操作等を利用して判断
し、この判断でユーザが満足している場合には、ステッ
プS610において、上述した処理によって設定された区
間Aおよび区間Bの再生速度、並びに区間Bの音声再生
レベルに従って、動画データ記憶部10に記憶されてい
る再生対象の動画を再生する。
【0137】ステップS609では、ステップS608にてユ
ーザが満足していないと判断されたので、ユーザ所望の
再生時間に収まるように、区間Aおよび区間Bの再生速
度、並びに区間Bの音声再生レベルを変更可能なマンマ
シン・インタフェースを提供することにより、プロファ
イルや標準設定に満足できないユーザ自身が望む再生時
間に近くなるように調節し、ステップS607に戻る。
【0138】また、ステップS609に対応する他の実施
形態として、現在設定されている区間Aおよび区間Bの
再生速度に基づく動画再生を見ながら、それぞれの区間
に対して、ユーザ所望の再生速度を変更可能に構成し、
それに応じた早見に要する時間の算出及びその提示を行
なうことにより、プロファイルや標準設定に満足できな
いユーザ自身が望む再生時間に近くなるように調節する
構成も想定される。
【0139】ところでユーザ・プロファイルと、ユーザ
所望の速度指示との関連であるが、ステップS607にて
動画早見再生に要する時間を見たユーザが、所望の動画
早見再生に要する時間に収めるべく、区間Aおよび区間
Bの再生速度を変更可能なマンマシン・インタフェース
を用いて、これらの設定を調整・変更した場合には、そ
の調整・変更後の値を、基準値として採用したいことも
ある。そこで、このような場合には、自動的、或いは図
10に例示する確認画面により、ユーザによる確認を促
した後、「はい」が選択された場合には、ユーザによっ
て調整・変更された再生速度情報を、当該ユーザに対応
するプロファイルに記憶することにより、以降の動画再
生に際しては、前回の操作情報を反映しつつ当該ユーザ
に応じた理解しやすい動画早見再生を行うことが可能と
なる。
【0140】尚、上述した実施形態において、算出され
た早見再生に要する時間をユーザが確認した上で、ユー
ザ所望の再生時間に収まるように、区間Aの再生速度お
よび区間Bの再生速度を変更することにより、プロファ
イルや標準設定に満足できないユーザが、自身が望む再
生時間に近くなるように調節する構成例を挙げたが、こ
の構成に限られるものではなく、例えば、ユーザが再生
映像を見ながら、区間Aの再生速度および区間Bの再生
速度をそれぞれの変更可能に構成しておき、その設定に
応じた早見に要する時間を再計算し、これをユーザに提
示することにより、ユーザ自身が望む再生時間に近くな
るように調節する実施形態も存在する。
【0141】また、本実施形態においては、音声区間情
報を、始点と終点との対であるとして説明したが、始点
とその区間長、或いは終点と区間長からなる情報であっ
ても良い。
【0142】このように、上述した本実施形態によれ
ば、映像と音声との同期関係は崩すことなく、動画早見
再生時には、人の発した音声は全て内容を把握できる速
度で再生する一方で、人の発した音声の含まれない区間
(区間B)は、より高速に再生する。これにより、動画
早見再生時のトータルの閲覧時間を、等倍再生を行なっ
た場合と比較して合理的に減らすことが可能となる。
【0143】また、本実施形態によれば、区間Aの再生
速度および区間Bの再生速度を、ユーザ・プロファイル
14を用いることにより、個々のユーザに適した再生速
度に簡便に設定可能であると共に、区間Bの再生時にお
ける音量も、ユーザに適したものに設定できる。
【0144】更に、本実施形態によれば、早見再生に要
する時間を予め、或いは動画の再生中に表示することに
より、これに満足できないユーザは、区間Aの再生速度
および区間Bの再生速度を指定することにより、当該ユ
ーザに最適な早見再生に要する時間に調整することがで
き、調整によって設定された情報は、当該ユーザに対応
するプロファイルに更新記憶することが可能であるの
で、次回の早見再生に際して適切な動画再生を行なうこ
とができる。
【0145】
【他の実施形態】上述した各実施形態を例に説明した本
発明は、複数の機器から構成されるシステムに適用して
も良いし、また、一つの機器からなる装置に適用しても
良い。
【0146】尚、本発明は、前述した各実施形態におい
て説明したフローチャートの機能を実現するソフトウェ
ア・プログラムを、上述した動画再生装置として動作す
るシステム或いは装置に直接或いは遠隔から供給し、そ
のシステム或いは装置のコンピュータが該供給されたプ
ログラムコードを読み出して実行することによっても達
成される場合を含む。その場合、プログラムの機能を有
していれば、形態は、プログラムである必要はない。
【0147】従って、本発明の機能処理をコンピュータ
で実現するために、該コンピュータにインストールされ
るプログラムコード自体も本発明を実現するものであ
る。つまり、本発明のクレームでは、本発明の機能処理
を実現するためのコンピュータプログラム自体も含まれ
る。
【0148】その場合、プログラムの機能を有していれ
ば、オブジェクトコード、インタプリタにより実行され
るプログラム、OSに供給するスクリプトデータ等、プ
ログラムの形態を問わない。
【0149】プログラムを供給するための記録媒体とし
ては、例えば、フロッピー(登録商標)ディスク、ハー
ドディスク、光ディスク、光磁気ディスク、MO、CD
−ROM、CD−R、CD−RW、磁気テープ、不揮発
性のメモリカード、ROM、DVD(DVD−ROM,
DVD−R)などがある。
【0150】その他、プログラムの供給方法としては、
クライアントコンピュータのブラウザを用いてインター
ネットのホームページに接続し、該ホームページから本
発明のコンピュータプログラムそのもの、もしくは圧縮
され自動インストール機能を含むファイルをハードディ
スク等の記録媒体にダウンロードすることによっても供
給できる。また、本発明のプログラムを構成するプログ
ラムコードを複数のファイルに分割し、それぞれのファ
イルを異なるホームページからダウンロードすることに
よっても実現可能である。つまり、本発明の機能処理を
コンピュータで実現するためのプログラムファイルを複
数のユーザに対してダウンロードさせるWWW(World W
ide Web)サーバも、本発明のクレームに含まれるもので
ある。
【0151】また、本発明のプログラムを暗号化してC
D−ROM等の記憶媒体に格納してユーザに配布し、所
定の条件をクリアしたユーザに対し、インターネットを
介してホームページから暗号化を解く鍵情報をダウンロ
ードさせ、その鍵情報を使用することにより暗号化され
たプログラムを実行してコンピュータにインストールさ
せて実現することも可能である。
【0152】また、コンピュータが、読み出したプログ
ラムを実行することによって、前述した実施形態の機能
が実現される他、そのプログラムの指示に基づき、コン
ピュータ上で稼動しているOSなどが、実際の処理の一
部または全部を行ない、その処理によっても前述した実
施形態の機能が実現され得る。
【0153】さらに、記録媒体から読み出されたプログ
ラムが、コンピュータに挿入された機能拡張ボードやコ
ンピュータに接続された機能拡張ユニットに備わるメモ
リに書き込まれた後、そのプログラムの指示に基づき、
その機能拡張ボードや機能拡張ユニットに備わるCPU
などが実際の処理の一部または全部を行ない、その処理
によっても前述した実施形態の機能が実現される。
【0154】
【発明の効果】以上説明した本発明によれば、人の発し
た音声区間を正確に検出すると共に、検出した音声区間
に従って映像と音声との同期関係を忠実に維持しなが
ら、ユーザの閲覧所要時間を大幅に短縮する動画再生装
置、動画再生方法及びそのコンピュータ・プログラムの
提供が実現する。
【図面の簡単な説明】
【図1】本実施形態に係る動画再生装置における動画早
見アルゴリズムの概念図を表す図である。
【図2】本実施形態において、動画早見インデックス作
成部100にて行われる人の音声区間の検出処理の概略
を示すフローチャートである。
【図3】本実施形態において間隔の短い音声区間に対し
て行われる統合補正処理を示すフローチャートである。
【図4】本実施形態においてシーンチェンジ点を用いて
行われる音声区間統合補正処理を示すフローチャートで
ある。
【図5】本実施形態における動画早見再生処理を示すフ
ローチャートである。
【図6】本実施形態における動画早見再生処理を示すフ
ローチャートのうち、ステップS604(図5)の処理の
詳細を示すフローチャートである。
【図7】ユーザ・プロファイル選択用の表示画面を例示
する図である。
【図8】ユーザ・プロファイル登録用の表示画面を例示
する図である。
【図9】本実施形態におけるユーザ・プロファイルの例
を示す図である。
【図10】提示された動画早見再生に要する時間に満足
しないユーザが設定変更をした場合に、調整・変更され
た値を次回以降の動画再生時に基準値として用いるか確
認を促す表示画面を例示する図である。

Claims (30)

    【特許請求の範囲】
  1. 【請求項1】 音声信号と副情報とを含む動画情報を高
    速度で再生可能な動画再生装置であって、 前記動画情報に含まれる副情報に基づいて、人の発声期
    間を表わす第1音声区間と、それ以外の第2音声区間と
    を判定する音声区間判定手段と、 前記動画情報に基づいて、前記第1音声区間は、ユーザ
    が内容を把握可能な所定速度で、再生音声を伴う高速動
    画再生を行なう一方で、前記第2音声区間は、前記所定
    速度より高速度で、少なくとも高速動画再生を行なう早
    見再生手段と、を備えることを特徴とする動画再生装
    置。
  2. 【請求項2】 前記早見再生手段は、前記第2音声区間
    において、前記所定速度より高速度で、少なくとも小音
    量の再生音声を伴う動画再生を行なうことを特徴とする
    請求項1記載の動画再生装置。
  3. 【請求項3】 前記早見再生手段は、前記第2音声区間
    において、前記所定速度より高速度で、無音声にて動画
    再生を行なうことを特徴とする請求項1記載の動画再生
    装置。
  4. 【請求項4】 前記副情報には、人の発した音声区間の
    開始タイミングと終了タイミング、開始タイミングとそ
    の区間長、或いは終了タイミングとその区間長のうち何
    れかが含まれることを特徴とする請求項1乃至請求項3
    の何れかに記載の動画再生装置。
  5. 【請求項5】 前記早見再生手段による高速動画再生の
    実行を指示された際に、前記音声区間判定手段は、再生
    映像が出力されるのに先立って前記動画情報に基づいて
    前記第1及び第2音声区間を判定することにより、前記
    音声区間判定手段による音声区間の判定と、前記早見再
    生手段による高速動画再生とが、擬似的リアルタイムに
    行われることを特徴とする請求項1乃至請求項3の何れ
    かに記載の動画再生装置。
  6. 【請求項6】 前記早見再生手段において、前記第2音
    声区間における音声再生時の音量は、予め決定されるま
    たはユーザが指定可能であることを特徴とする請求項1
    乃至請求項3の何れかに記載の動画再生装置。
  7. 【請求項7】 前記音声区間判定手段は、前記音声信号
    に基づいて、前記第1音声区間を判定するに際して、時
    間軸上で近接する複数の前記第1音声区間を、統合補正
    する補正手段を含むことを特徴とする請求項1乃至請求
    項3の何れかに記載の動画再生装置。
  8. 【請求項8】 前記補正手段は、前記動画情報に含まれ
    るシーンチェンジ点を検出すると共に、検出した個々の
    シーンチェンジ点のうち、着目する前記第1音声区間の
    始点よりも時間的に早く且つ最も近傍に位置する近傍シ
    ーンチェンジ点と、その始点との時間間隔が所定のしき
    い値以下である場合に、該着目する前記第1音声区間の
    始点を、該近傍シーンチェンジ点に対応する情報に置き
    換えることによって補正することを特徴とする請求項7
    記載の動画再生装置。
  9. 【請求項9】 前記補正手段は、前記動画情報に含まれ
    るシーンチェンジ点を、前記副情報から抽出することに
    よって取得することを特徴とする請求項8記載の動画再
    生装置。
  10. 【請求項10】 前記早見再生手段は、前記第1音声区
    間の長さとその区間の再生速度、並びに前記第2音声区
    間の長さに基づいて、前記高速動画再生に要する所要時
    間を算出すると共に、算出した所要時間をユーザに提示
    することを特徴とする請求項1乃至請求項3の何れかに
    記載の動画再生装置。
  11. 【請求項11】 前記早見再生手段は、前記所要時間を
    提示するのに応じて、前記第1及び第2音声区間の再生
    速度の変更操作がユーザによって行われた場合に、その
    変更後の再生速度に基づいて、前記所要時間を調整する
    調整手段を含むことを特徴とする請求項10記載の動画
    再生装置。
  12. 【請求項12】 更に、前記動画再生装置を利用可能な
    ユーザを対象として、個々のユーザに関する属性情報が
    登録されたユーザ・プロファイルを備え、 前記早見再生手段は、前記ユーザ・プロファイルに登録
    されているところの、特定ユーザに関する属性情報に従
    って、前記第1及び第2音声区間の再生速度を自動的に
    決定することを特徴とする請求項1乃至請求項3の何れ
    かに記載の動画再生装置。
  13. 【請求項13】 前記ユーザ・プロファイルには、前記
    個々のユーザに関する属性情報として、年齢、使用言
    語、動体視力、並びに早い音声の聴力のうち少なくとも
    何れかが含まれることを特徴とする請求項12記載の動
    画再生装置。
  14. 【請求項14】 前記早見再生手段は、 前記特定ユーザに関する属性情報に従って自動的に決定
    したところの、前記第1音声区間の長さとその区間の再
    生速度、並びに前記第2音声区間の長さに基づいて、前
    記高速動画再生に要する所要時間を算出すると共に、算
    出した所要時間を該ユーザに提示すると共に、その所要
    時間を提示するのに応じて、前記第1及び第2音声区間
    の再生速度の変更操作がユーザによって行われた場合
    に、その変更後の再生速度に基づいて、前記所要時間を
    調整する調整手段を含むことを特徴とする請求項12ま
    たは請求項13記載の動画再生装置。
  15. 【請求項15】 前記調整手段は、前記変更後の第1及
    び第2音声区間の再生速度を、前記特定ユーザに関する
    属性情報と関連付けして、前記ユーザ・プロファイルに
    記憶し、 前記早見再生手段は、前記高速動画再生に際して、前記
    ユーザ・プロファイルに記憶された変更後の第1及び第
    2音声区間の再生速度を反映することを特徴とする請求
    項14記載の動画再生装置。
  16. 【請求項16】 前記早見再生手段は、 前記第2音声区間の再生態様に関する情報がユーザによ
    って指定された場合に、前記ユーザ・プロファイルに記
    憶された該ユーザに関する属性情報に対して、該再生態
    様に関する情報を関連付けして、前記ユーザ・プロファ
    イルに記憶すると共に、前記高速動画再生に際して、前
    記ユーザ・プロファイルに記憶された前記第2音声区間
    の再生態様に関する情報を反映することを特徴とする請
    求項12記載の動画再生装置。
  17. 【請求項17】 前記第1音声区間の高速動画再生時の
    前記所定速度は、等速再生の1.5倍乃至2倍の速度で
    あることを特徴とする請求項1記載の動画再生装置。
  18. 【請求項18】 前記早見再生手段は、前記ユーザ・プ
    ロファイルに登録された前記ユーザに関する属性情報
    に、高齢者、視覚障害者、或いは聴覚障害者であること
    を示す識別情報が含まれる場合に、その識別情報に対応
    するユーザを対象として前記高速動画再生を行なうに際
    して、前記第1音声区間の再生速度は前記等倍速度より
    遅くし、前記第2音声区間の再生速度は前記等倍速度よ
    り速く行なうことを特徴とする請求項12記載の動画再
    生装置。
  19. 【請求項19】 前記早見再生手段は、前記ユーザ・プ
    ロファイルに登録された前記ユーザに関する属性情報
    に、そのユーザの使用言語を示す識別情報が含まれ、そ
    の識別情報と、前記動画情報に含まれる言語種別情報と
    が一致しない場合には、その識別情報に対応するユーザ
    を対象として前記高速動画再生を行なうに際して、前記
    第1音声区間の再生速度は前記等倍速度より遅くし、前
    記第2音声区間の再生速度は5倍速乃至10倍速で行な
    うことを特徴とする請求項12記載の動画再生装置。
  20. 【請求項20】 前記ユーザ・プロファイルには、前記
    動画再生装置を利用可能な複数のユーザを対象として、
    個々のユーザに関する属性情報が登録されており、 前記早見再生手段は、特定ユーザの選択操作に応じて、
    または個人認証技術に基づいて、その特定ユーザに関す
    る属性情報を、前記ユーザ・プロファイルから取得する
    ことを特徴とする請求項12記載の動画再生装置。
  21. 【請求項21】 更に、前記ユーザ・プロファイルに登
    録された特定ユーザに関する属性情報を、その特定ユー
    ザ自身が変更可能な属性情報変更手段を備えることを特
    徴とする請求項12記載の動画再生装置。
  22. 【請求項22】 音声信号と副情報とを含む動画情報を
    高速度で再生可能な動画再生方法であって、 前記動画情報に含まれる副情報に基づいて、人の発声期
    間を表わす第1音声区間と、それ以外の第2音声区間と
    を判定する音声区間判定工程と、 前記動画情報に基づいて、前記第1音声区間は、ユーザ
    が内容を把握可能な所定速度で、再生音声を伴う高速動
    画再生を行なう一方で、前記第2音声区間は、前記所定
    速度より高速度で、少なくとも高速動画再生を行なう早
    見再生工程と、を有することを特徴とする動画再生方
    法。
  23. 【請求項23】 前記早見再生工程では、前記第2音声
    区間において、前記所定速度より高速度で、少なくとも
    小音量の再生音声を伴う動画再生を行なうことを特徴と
    する請求項22記載の動画再生方法。
  24. 【請求項24】 前記早見再生工程では、前記第2音声
    区間において、前記所定速度より高速度で、無音声にて
    動画再生を行なうことを特徴とする請求項22記載の動
    画再生方法。
  25. 【請求項25】 前記副情報には、人の発した音声区間
    の開始タイミングと終了タイミング、開始タイミングと
    その区間長、或いは終了タイミングとその区間長のうち
    何れかが含まれることを特徴とする請求項22乃至請求
    項24の何れかに記載の動画再生方法。
  26. 【請求項26】 前記早見再生工程にて高速動画再生を
    実行するに際して、再生映像が出力されるのに先立って
    前記音声区間判定工程における前記動画情報に基づく前
    記第1及び第2音声区間の判定を実行することにより、
    前記音声区間判定工程における音声区間の判定と、前記
    早見再生工程における高速動画再生とが、擬似的リアル
    タイムに行われることを特徴とする請求項22乃至請求
    項24の何れかに記載の動画再生方法。
  27. 【請求項27】 前記音声区間判定工程では、前記音声
    信号に基づいて、前記第1音声区間を判定するに際し
    て、時間軸上で近接する複数の前記第1音声区間を、統
    合補正することを特徴とする請求項22乃至請求項24
    の何れかに記載の動画再生方法。
  28. 【請求項28】 前記音声区間判定工程では、前記動画
    情報に含まれるシーンチェンジ点を検出すると共に、検
    出した個々のシーンチェンジ点のうち、着目する前記第
    1音声区間の始点よりも時間的に早く且つ最も近傍に位
    置する近傍シーンチェンジ点と、その始点との時間間隔
    が所定のしきい値以下である場合に、該着目する前記第
    1音声区間の始点を、該近傍シーンチェンジ点に対応す
    る情報に置き換えることによって補正することを特徴と
    する請求項27記載の動画再生方法。
  29. 【請求項29】 請求項1乃至請求項21の何れかに記
    載の動画再生装置を、コンピュータによって実現可能な
    動作指示をなすことを特徴とするコンピュータ・プログ
    ラム。
  30. 【請求項30】 請求項22乃至請求項28の何れかに
    記載の動画再生方法として、コンピュータを動作させる
    指示をなすことを特徴とするコンピュータ・プログラ
    ム。
JP2002113625A 2002-04-16 2002-04-16 動画再生装置、動画再生方法及びそのコンピュータ・プログラム Expired - Fee Related JP3970080B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2002113625A JP3970080B2 (ja) 2002-04-16 2002-04-16 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
US10/413,390 US7286749B2 (en) 2002-04-16 2003-04-15 Moving image playback apparatus, moving image playback method, and computer program thereof with determining of first voice period which represents a human utterance period and second voice period other than the first voice period
US11/756,777 US7450821B2 (en) 2002-04-16 2007-06-01 Moving image playback apparatus, moving image playback method, and computer program thereof with determining of first voice period which represents a human utterance period and second voice period other than the first voice period

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002113625A JP3970080B2 (ja) 2002-04-16 2002-04-16 動画再生装置、動画再生方法及びそのコンピュータ・プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007117564A Division JP4086886B2 (ja) 2007-04-26 2007-04-26 動画再生装置、動画再生方法及びそのコンピュータ・プログラム

Publications (3)

Publication Number Publication Date
JP2003309786A true JP2003309786A (ja) 2003-10-31
JP2003309786A5 JP2003309786A5 (ja) 2005-05-19
JP3970080B2 JP3970080B2 (ja) 2007-09-05

Family

ID=29395758

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002113625A Expired - Fee Related JP3970080B2 (ja) 2002-04-16 2002-04-16 動画再生装置、動画再生方法及びそのコンピュータ・プログラム

Country Status (1)

Country Link
JP (1) JP3970080B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007334301A (ja) * 2006-06-16 2007-12-27 Storz Endoskop Produktions Gmbh ユーザプロファイル管理コンポーネントを備えた音声認識システム
JP2008199456A (ja) * 2007-02-15 2008-08-28 Funai Electric Co Ltd 番組記録再生装置
JP2016161830A (ja) * 2015-03-03 2016-09-05 カシオ計算機株式会社 コンテンツ出力装置、コンテンツ出力方法及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007334301A (ja) * 2006-06-16 2007-12-27 Storz Endoskop Produktions Gmbh ユーザプロファイル管理コンポーネントを備えた音声認識システム
JP4699411B2 (ja) * 2006-06-16 2011-06-08 シュトルツ・エンドスコープ・プロドゥクツィオンス・ゲーエムベーハー ユーザプロファイル管理コンポーネントを備えた音声認識システム
JP2008199456A (ja) * 2007-02-15 2008-08-28 Funai Electric Co Ltd 番組記録再生装置
JP2016161830A (ja) * 2015-03-03 2016-09-05 カシオ計算機株式会社 コンテンツ出力装置、コンテンツ出力方法及びプログラム

Also Published As

Publication number Publication date
JP3970080B2 (ja) 2007-09-05

Similar Documents

Publication Publication Date Title
US7450821B2 (en) Moving image playback apparatus, moving image playback method, and computer program thereof with determining of first voice period which represents a human utterance period and second voice period other than the first voice period
US7467088B2 (en) Closed caption control apparatus and method therefor
JP4170808B2 (ja) 情報表示装置、情報表示方法及びプログラム
JP4127668B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP4331217B2 (ja) 映像再生装置および方法
US20060010366A1 (en) Multimedia content generator
JP4086532B2 (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
JP2010283605A (ja) 映像処理装置及び方法
JP2008178090A (ja) 映像処理装置
KR0176961B1 (ko) 캡션지향 화면 검색기능의 비디오cd재생장치 및 캡션지향 화면 검색방법
JP4509188B2 (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
JP4086886B2 (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
JP4455644B2 (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
JP2003309814A5 (ja)
JP2010109852A (ja) 映像インデクシング方法、映像録画再生装置、及び映像再生装置
JP3970080B2 (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
JP2006339817A (ja) 情報処理装置およびその表示方法
US20050069282A1 (en) Information reproducing method, recording medium on which information reproducing program is computer-readably recorded, and information reproducing apparatus
WO1998044483A1 (en) Time scale modification of audiovisual playback and teaching listening comprehension
WO2021157192A1 (ja) 制御装置及び制御方法、コンピュータプログラム、並びにコンテンツ再生システム
KR101832464B1 (ko) 동영상 제공 장치, 동영상 제공 방법, 및 컴퓨터 프로그램
JP4353084B2 (ja) 映像再生方法及び装置及びプログラム
JP2002084505A (ja) 映像閲覧時間短縮装置及び方法
JP2005352330A (ja) 音声分割記録装置
WO2023238650A1 (ja) 変換装置および変換方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040706

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040706

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070525

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070605

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110615

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120615

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120615

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130615

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees