JP2010283605A - 映像処理装置及び方法 - Google Patents

映像処理装置及び方法 Download PDF

Info

Publication number
JP2010283605A
JP2010283605A JP2009135313A JP2009135313A JP2010283605A JP 2010283605 A JP2010283605 A JP 2010283605A JP 2009135313 A JP2009135313 A JP 2009135313A JP 2009135313 A JP2009135313 A JP 2009135313A JP 2010283605 A JP2010283605 A JP 2010283605A
Authority
JP
Japan
Prior art keywords
video
playback
speed
audio
video content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009135313A
Other languages
English (en)
Inventor
Takuya Iwata
拓也 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009135313A priority Critical patent/JP2010283605A/ja
Priority to US12/791,684 priority patent/US8391669B2/en
Priority to CN201010194764.0A priority patent/CN101909191B/zh
Publication of JP2010283605A publication Critical patent/JP2010283605A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • H04N5/783Adaptations for reproducing at a rate different from the recording rate
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/005Reproducing at a different information rate from the information rate of recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/781Television signal recording using magnetic recording on disks or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/907Television signal recording using static stores, e.g. storage tubes or semiconductor memories
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/806Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
    • H04N9/8063Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal

Abstract

【課題】 音声が聞き取り易い範囲となるように、映像コンテンツの再生速度を制御した映像処理装置を提供する。
【解決手段】 映像コンテンツの音声データを分析することにより得られる音声特性情報と所定の音声パラメータとに基いて映像コンテンツの適正再生速度範囲を算出する。ユーザにより選択された再生モードに基いて適正再生速度範囲内にある特定再生速度を算出し、適正再生速度で映像コンテンツを再生する。これにより各々の再生モードにおいて、音声の聞き取り易い状態での映像コンテンツの再生が可能となる。
【選択図】 図1

Description

本発明は、映像の再生速度を、音声の聞き取り易さに基づいて制御した映像処理装置及び方法に関する。
近年、30fps(frame per second)程度の低いフレームレートから1000fpsを超える高いフレームレートまでの複数のフレームレートで映像撮影が可能な撮影装置が知られている。この撮影装置では、撮影中に撮影フレームレートを動的に切り替えることも可能である。一方で、映像再生装置で映像を再生するフレームレートとしては、60fpsや120fpsが一般的である。撮影装置の撮影フレームレートと、映像再生装置の再生フレームレートとの違いを利用することにより、特殊な映像効果をもった映像表示が可能となる。例えば、撮影フレームレートが再生フレームレートよりも高い場合、表示される映像は滑らかな動きのスロー再生映像となる。撮影フレームレートが再生フレームレートよりも低い場合、表示される映像はすばやい動きのファースト再生映像となる。
一方、音声データを含む映像をスロー再生する場合、音声の再生速度も遅くなるため、再生される音声の音域が実際よりも低くなり、音声の聞き取りが困難になってしまう場合がある。逆に、映像をファースト再生する場合、再生される音声の音域が実際よりも高くなり、聞き取りにくくなる場合がある。
下記特許文献1では、映像の音声区間と非音声区間を検出し、ユーザが指定した再生速度に応じて、非音声区間の音声データを一部削除して出力用音声データを作成する話速変換システムが開示されている。
特開2002−314945号公報
しかしながら、従来は、ユーザが設定した再生速度に応じて一律に音声データを補正するので、必ずしもユーザが聞き取り易い音声が出力される訳ではなかった。さらに、1つの映像コンテンツの中で、複数の異なる撮影(記録)フレームレート部分を有する多フレームレート映像コンテンツに対しては、適正に音声データを補正することが困難であった。
本発明は上記の点を鑑みてなされたものであり、ユーザにとって聞き取り易い音声で、映像コンテンツが再生されるように再生速度を制御することを目的とする。
上記課題を解決するために、本発明は、映像の音声データから音声に関する所定の情報を抽出する音声情報抽出手段と、前記音声情報抽出手段によって抽出された所定の音声情報に基づき、映像の音声が聞き取り易くなる映像の再生フレームレートの範囲を計算する再生フレームレート計算手段と、ユーザによる再生方法の指示に従って、前記再生フレームレート計算手段により計算された再生フレームレートの範囲に関する情報に基づき、映像の再生フレームレートを決定する再生フレームレート決定手段を備えることを特徴とする。
本発明によれば、音声分析に基づいて映像コンテンツの再生速度を制御するため、音声の聞き取り易い範囲内でスロー再生やファースト再生を行うことができる。また、多フレームレート映像コンテンツについても、撮影者が撮影時に意図した映像効果を保持しながら、聞き取り易い音声での再生が可能となる。
本発明に係る映像再生装置のブロック図である。 本発明に係るユーザ選択画面の模式図である。 本発明に係る適正再生速度範囲を説明するための説明図である。 本発明に係る再生処理を説明するフローチャートである。 本発明に係る他の再生処理を説明するフローチャートである。 本発明に係る再生速度決定部のブロック図である。
(実施例1)
図1は本発明の映像処理装置の一形態である映像再生装置のブロック図である。記憶部101は、HDD(Hard Disk Drive)又はフラッシュメモリであり、映像コンテンツを記憶する。映像コンテンツは、撮影フレームレートの異なる複数の映像部分から構成された多フレームレート映像コンテンツであり、MPEG形式によって符号化された映像データ及び音声データを含む。また、映像コンテンツのメタデータとして、プレビュー画像データ、撮影(記録)フレームレート情報及び適正再生速度情報が記憶される。再生速度とは、撮影時における撮影対象物の動きの速さに対する、再生時におけるその撮影映像の動きの速さの比である。音声情報生成部102は、記憶部101に記録されている音声データを解析して音声特性情報を生成し、再生速度決定部103に出力する。音声特性は、音声の周波数特性であり、音声データの離散フーリエ変換又は高速フーリエ変換により得られる。音声特性は、映像データの1つのシーンに対応する複数のフレーム毎に算出される。音声特性情報は、映像データの所定数のフレーム毎に算出された音声特性のセットである。再生速度決定部103は、音声特性情報を用いて適正再生速度の範囲を算出する。適正再生速度範囲とは、ユーザにとって音声が聞き取り可能な、映像の適正再生速度の範囲である。再生速度決定部103は、適正再生速度範囲の情報とユーザによって選択された再生モードの情報とに基いて、再生速度を決定する。再生モードは、通常再生モード、オリジナル再生モード、スロー再生モード、ファースト再生モードとからなる。また、スロー再生モード及びファースト再生モードは、ユーザによる音優先の指示によりそれぞれ音優先スロー再生モード及び音優先ファースト再生とすることができる。モード再生速度決定部103によって決定された再生速度情報は、制御部104に送られる。映像コンテンツ読み出し部105は、ユーザから指定された映像コンテンツを、制御部104の指示により記憶部101から読み出す。映像・音声処理部106は、制御部104からの制御信号に従い、記憶部101から読み出された映像データを復号し、復号された映像データに対して再生速度に応じて間引き/補間処理を実行する。さらに記憶部101から読み出された音声データに対して圧縮/伸張処理を実行する。映像・音声出力部107は、映像・音声処理部106から出力される映像データ及び音声データを変換して、表示装置及びスピーカにそれぞれ出力する。
再生速度決定部103は、以下のように適正再生速度を算出する。記憶部101には、心理実験により求められた、映像に同期した音声の聞き取りが可能かどうか(可聴周波数範囲か否か)を判断するための音声パラメータが予め記録されている。具体的には、一般的なユーザ(人間)が聞き取り可能な音の周波数の最小値fminを20Hz、最大値fmaxを20kHzとした音声パラメータのセットが記録されている。また、100Hz程度以下の音が通常騒音の対象として扱われていることに基いて、最小値を100Hzとしてもよい。入力された音声データの音声特性情報、すなわち、所定数のフレーム毎に算出された各周波数帯域毎のデータから、最小の周波数Fminと最大の周波数Fmaxとを抽出する。そのとき、データの大きさが所定の閾値以下である周波数帯域は無視するリミット処理を施す。次に、入力された音声データが、聞き取りが可能な最大周波数fmax及び最小周波数fminに対してどの程度の余裕を有しているかを表す余裕度(latitude)Lmax、Lminを以下の数式により算出する。
Lmax=fmax/Fmax
Lmin=Fmin/fmin
最大周波数及び最小周波数に対する余裕度に基いて、以下のように適正再生速度を計算する。再生フレームレートは一定(60fps)である。入力された音声データに対して求められた余裕度がそれぞれ(Lmax=2、Lmin=3)であったとする。この場合、等倍速での再生(撮影時間と一致するような再生)は適正再生速度の範囲内である。しかし、最大周波数に対する余裕度Lmaxが2であるので、2倍速(撮影時間の1/2倍の時間)でも音声の聞き取りが可能である。逆に、最小周波数に対する余裕度が3であるので、1/3倍速(撮影時間の3倍の時間)でも音声の聞き取りが可能である。従って、適正再生速度範囲は、1/3倍速〜2倍速と決められる。図3は、上で述べた再生速度と音声周波数の関係を模式的に表している。
適正再生速度範囲は、映像コンテンツのシーン毎に決定され、制御部104が映像コンテンツ毎に付与したコンテンツID及びシーン毎に付与したシーンIDとに関連付けされて、記憶部101に記憶される。また、適正再生速度範囲の算出は、映像コンテンツを記憶部101に記憶させた時に、制御部104の指示により自動的に実行される。
図2は、再生する映像コンテンツ選択画面の例である。映像表示領域201は、ユーザに対して再生可能なコンテンツの一覧を表示するための領域であり、記憶部101から読み出されたコンテンツのプレビュー画像203が表示される。映像のプレビュー画像203に代えて、映像から抽出された静止画像や、コンテンツのタイトルを表示してもよい。再生モード表示領域202は、ユーザに対してコンテンツの再生モードの選択肢を表示するための領域である。以下に説明する4通りの再生モードを示すアイコン205が表示されている。また、スロー再生又はファースト再生のアイコンを選択した後、音優先アイコン206を選択すると、それぞれ音優先スロー再生又は音優先ファースト再生となる。ユーザは、リモコンを操作してカーソル204を所望のプレビュー画像及び再生モードアイコン上に合わせることにより、再生コンテンツ及び再生モードを選択することができる。
「通常再生」は、撮影フレームレートによらず、一定の再生速度で再生するモードである。30fpsで撮影(記録)された映像も1200fpsで撮影(記録)された映像も、1倍速(撮影時間と同じ時間)で再生される。このモードでは、撮影時と同じ速度で再生されるため、音声も自然なトーンで再生される。「オリジナル再生」は、撮影フレームレートに応じて、高フレームレートの映像はスロー再生、低フレームレートの映像はファースト再生されるモードである。再生フレームレートは一定(60fps)であるので、 30fpsの映像は2倍速(撮影時間の1/2倍の時間)で再生が行われ、1200fpsの映像の場合は1/20倍速(撮影時間の20倍の時間)で再生が行われる。このモードでは、撮影フレームレートに対応して再生されるため、映像効果を最大限に発揮することができる。しかし一方で、再生速度が速すぎる、又は遅すぎるために、ユーザにとって音声が聞き取れない場合がある。「スロー再生」及び「ファースト再生」は、それぞれ一定の再生速度1/3倍速及び3倍速で再生するモードである。「音優先スロー再生」は、適正再生速度範囲にある特定の再生速度として適正最小再生速度を選択し、適正最小再生速度で再生するモードである。例えば、コンテンツのあるシーンAでは1/2倍速から2倍速再生、別のシーンBでは1/3倍速から3倍速再生までであれば音声の聞き取りが可能であったとする。この場合、シーンAが再生されるときは1/2倍速、シーンBが再生されるときは1/3倍速と、動的に再生速度が切り替わって再生される。このモードでは、音声が聞き取れる範囲内で、なるべく遅いスロー再生で映像の動きの詳細を視聴したいというユーザの要求を満たすことが可能となる。なお、コンテンツのシーン毎に再生速度を切り替えるのではなく、1つのコンテンツ内では一定の再生速度としてもよい。「音優先ファースト再生」は、適正最大再生速度で再生するモードである。例えば、コンテンツのあるシーンCでは1/2倍速から2倍速再生、別のシーンDでは1/3倍速から3倍速再生までであれば音声の聞き取りが可能であったとする。このとき自動的に、シーンAが再生されるときは2倍速、シーンBが再生されるときは3倍速に切り替わって再生される。このモードでは、音声が聞き取れる範囲内で、なるべくスピード感のある映像を視聴したいというユーザの要求を満たすことが可能となる。あるいは、音声が聞き取れる範囲内で視聴時間を短縮したいという要求も満たすことが可能となる。
ここで、映像・音声処理部106で実行される間引き・補間処理と再生速度との関係について説明する。撮影フレームレートをC(fps)、再生フレームレートをP(fps)とする(但し、P,Cは正数)。入力した映像データに対して間引き・補間処理を実行しない場合は、再生速度は、P/C倍速となる。映像データを1/N(但し、Nは正数)に間引いた場合、再生速度は、PN/C倍速となる。逆に、映像データをN倍に補間した場合、再生速度は、P/CN倍速となる。また、2/5倍速の再生速度とするときは、5倍の補間処理と1/2倍の間引き処理を実行する。
図4は、制御部104の処理を示すフローチャートである。「通常再生」が選択された場合(S400)、選択された映像コンテンツは等倍速(1倍速)で再生される。制御部104は、再生時間と撮影時間とが等しくなるように(S401)、選択された映像コンテンツの撮影フレームレート情報と、再生フレームレート情報とに基いて、映像・音声処理部106に、間引き・補間処理を実行させる(S408)。「オリジナル再生」が選択された場合(S3402)、選択された映像コンテンツは、撮影フレームレートに応じた再生速度となるようにスロー再生又はファースト再生される(S403)。制御部104は、間引き・補間処理を実行しないように映像・音声処理部を制御する。「音優先スロー再生」が選択された場合(S404)、選択された映像コンテンツは、適正最小再生速度で再生される。制御部104は、適正最小再生速度で再生されるように(S405)、選択された映像コンテンツの撮影フレームレート情報と、再生フレームレート情報とに基いて、映像・音声処理部106に、間引き・補間処理を実行させる(S408)。「音優先ファースト再生」が選択された場合(S406)、選択された映像コンテンツは、適正最大再生速度で再生される。制御部104は、適正最大再生速度で再生されるように(S407)、選択された映像コンテンツの撮影フレームレート情報と、再生フレームレート情報とに基いて、映像・音声処理部106に、間引き・補間処理を実行させる(S408)。
本実施例では、多フレームレート映像コンテンツの再生について説明したが、単一の撮影フレームレートの映像コンテンツであっても適用可能である。
(実施例2)
実施例1の「オリジナル再生」は、多フレームレート映像コンテンツの再生に際して、撮影フレームレートに応じて、高フレームレートの部分はスロー再生、低フレームレートの部分はファースト再生されるモードである。本実施例は、再生モードとして、高フレームレート部分及び低フレームレート部分の再生速度をそれぞれ適正再生速度で再生する「適正再生」モードを新たに追加するものである。「適正再生」モードは、図2の再生モード表示領域202に追加された「適正再生」アイコン(不図示)にカーソルを合わせることにより選択される。
本実施例における映像再生装置のブロック図は、図1と同様である。再生速度決定部103は、記憶部101に記録されている選択された映像コンテンツの適性再生速度範囲の情報と、撮影フレームレート情報及びユーザによって選択された再生モード情報とに基づいて、再生速度を決定する。
「適正再生」モードでは、多フレームレート映像コンテンツの中で、高フレームレートで撮影されたシーンは、適正最大再生速度で、低フレームレートで撮影されたシーンは、再生最小速度で再生する。再生フレームレートである60fpsを映像コンテンツの撮影フレームレートの基準フレームレートとし、60fpsよりも高いフレームレートを高フレームレート、60fps低いフレームレートを低フレームレートとする。撮影フレームレートが基準フレームレートと等しいシーンでは、1倍速での再生を行う。「適正再生」モードでは、音声の聞き取りが可能で、且つ、高フレームレートで撮影されたシーンはなるべく遅い再生速度で、低フレームレートで撮影されたシーンはなるべく速い再生速度で再生が行われる。従って、音声の聞き取りが可能な範囲で、撮影者が意図した動的に変化する映像効果を保持することができる。
図5は、「適正再生」が選択された際の、制御部104の処理を示すフローチャートである。尚、ステップ400からステップ408は実施例1と同様であるので、説明を省略する。選択された映像コンテンツでは、撮影フレームレートが、60fps(シーンA)、30fps(シーンB)、1200fps(シーンC)と、動的に切り替わる。「適正再生」が選択された場合(S509)、まず撮影フレームレートと基準フレームレートとを比較し、撮影フレームレートが基準フレームレートに等しい場合は(S510)、等倍速(1倍速)再生とする(S511)。高フレームレートシーンでは(S512)、適正最大再生速度を選択する(S513)し、低フレームレートシーンでは(S512)、適正最小再生速度を選択する(S514)。
適正再生速度は、実施例1と同様に、映像コンテンツの音声データの音声特性情報と撮影フレームレート情報とに基いて、再生速度決定部103において求められる。その結果、適正再生速度範囲がそれぞれ、シーンAでは1/2倍速から2倍速、シーンBでは1/3倍速から3倍速、シーンCでは1/4倍速から4倍速であったとする。このときシーンAでは、撮影フレームレートが基準フレームレートと等しいため、1倍速で再生される。シーンBでは、撮影フレームレートが基準フレームレートより低いため、適正最小再生速度である1/3倍速で再生される。シーンCでは、撮影フレームレートが基準フレームレートより高いため、適正最大再生速度である4倍速で再生される。
(実施例3)
実施例1では、音声の聞き取りが可能かどうかを心理実験結果に基いて判断したが、本実施例では音声認識技術に基いて判断する。
図6は再生速度決定部103のブロック図である。再生速度決定部103には、音声情報生成部102より、映像コンテンツの音声データの周波数特性と振幅情報が入力される。このとき、周波数特性は特徴ベクトル抽出部602に、振幅情報は有音/無音判定部604にそれぞれ入力される。音響モデル記憶部601には、予め、音素や音節などの音響的な特徴を表す音響モデルが記憶されている。特徴ベクトル抽出部602は、入力される周波数情報についてMFCC(Mel Frequency Cepstrum Coefficient)による音響分析を行い、音響分析結果を、特徴ベクトルとしてマッチング部603に出力する。マッチング部603は、音響モデル格納部601に記憶されている音響モデルを参照しながら、特徴ベクトル抽出部により抽出された特徴ベクトルを用いて、HMM(Hidden Markov Model)法に基づいて音声認識を行う。認識された結果は、文字発声時間判定部605に出力される。有音/無音判定部604は、入力された音声の振幅情報から、音声が含まれている区間と、音声が含まれていない区間とを判定する。これは、音声の振幅の値がある閾値を越える区間を有音区間、越えない区間を無音区間として判断する。文字発声時間判定部605は、マッチング部603によって音声認識された結果と、有音/無音判定部604によって判定された有音区間と無音区間の割合を元に、認識された文字が発声されている時間に存在するフレーム数を測定する。例えば、音声情報生成部102が、1000フレーム単位毎に映像データの音声に関する周波数特性を抽出し、抽出した周波数情報を再生速度計算部103に出力しているとする。また、マッチング部603によって、上記1000フレームの中に「あいうえお」という5文字が存在することが認識されたとする。さらに、有音/無音判定部604より、上記1000フレーム中、有音の区間は50フレームであると判定されたとする。この場合、文字発声時間判定部505は、「あいうえお」という5文字が合計50フレームに渡って発声されていると判定する。再生速度計算実行部606は、文字発声時間判定部605の判定結果を元に、ユーザが話の内容の聞き取りが容易な再生速度を計算する。通常のニュース番組では、1秒間に6〜8文字程度の速度で文字が読まれている。従って、1秒間に6〜8文字が内容の聞き取りが容易な再生速度であるとすれば、1文字を再生する時間を1/8秒〜1/6秒の範囲とすることで、内容を聞き取ることが容易な再生速度であると考えることができる。従って、上記の例においては、「あいうえお」という5文字が50フレームに渡って発声されており、1文字あたりの平均フレーム数は10フレームである。従って再生速度計算実行部506は、10フレームを1/6秒で再生するフレームレート(60fps、1倍速)から、10フレームを1/8秒で再生するフレームレート(80fps、4/3倍速)を、内容を聞き取ることが容易な再生速度として決定する。
100 映像再生装置
101 記憶部
102 音声情報生成部
103、500 再生速度決定部
104 制御部
105 映像コンテンツ読み出し部
106 映像・音声処理部
107 映像・音声出力部
200 再生モード選択画面
201 映像表示領域
202 再生モード表示領域

Claims (5)

  1. 記録された映像コンテンツを複数の再生モードで再生可能な映像処理装置であって、
    前記映像コンテンツの音声データの周波数特性を解析して音声特性情報を生成する音声情報生成手段と、
    前記音声特性情報と所定の音声パラメータとに基いて、適正再生速度範囲を決定する再生速度決定手段と、
    選択された再生モードに応じて、前記適正再生速度範囲にある特定の再生速度を決定する制御部と、
    前記特定の再生速度に基いて、前記映像コンテンツの映像データに対してフレームの間引き及び/又は補間処理を施す映像処理手段と、
    前記間引き及び/又は補間処理された映像データを表示装置に出力する映像出力手段とを有することを特徴とする映像処理装置。
  2. 前記音声特性情報は、前記映像データの所定数のフレーム毎に算出された前記映像データに同期した音声データの周波数帯域の情報である請求項1記載の映像処理装置。
  3. 前記所定の音声パラメータは、人間の可聴周波数範囲に基いたパラメータである請求項2記載の映像処理装置。
  4. 前記映像コンテンツは、異なる撮影フレームレートを有する複数の映像部分により構成されている請求項1記載の映像処理装置。
  5. 記録された映像コンテンツを複数の再生モードで再生する映像処理方法であって、
    前記映像コンテンツの音声データの周波数特性を解析して音声特性情報を生成するステップと、
    前記音声特性情報と所定の音声パラメータとに基いて、適正再生速度範囲を決定するステップと、
    選択された再生モードに応じて、前記適正再生速度範囲にある特定の再生速度を決定するステップと、
    前記特定の再生速度に基いて、前記映像コンテンツの映像データに対してフレームの間引き及び/又は補間処理を施すステップと、
    前記間引き及び/又は補間処理された映像データを表示装置に出力するステップとを有することを特徴とする映像処理方法。
JP2009135313A 2009-06-04 2009-06-04 映像処理装置及び方法 Pending JP2010283605A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009135313A JP2010283605A (ja) 2009-06-04 2009-06-04 映像処理装置及び方法
US12/791,684 US8391669B2 (en) 2009-06-04 2010-06-01 Video processing apparatus and video processing method
CN201010194764.0A CN101909191B (zh) 2009-06-04 2010-06-04 视频处理设备和视频处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009135313A JP2010283605A (ja) 2009-06-04 2009-06-04 映像処理装置及び方法

Publications (1)

Publication Number Publication Date
JP2010283605A true JP2010283605A (ja) 2010-12-16

Family

ID=43264487

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009135313A Pending JP2010283605A (ja) 2009-06-04 2009-06-04 映像処理装置及び方法

Country Status (3)

Country Link
US (1) US8391669B2 (ja)
JP (1) JP2010283605A (ja)
CN (1) CN101909191B (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5902928B2 (ja) * 2011-11-25 2016-04-13 キヤノン株式会社 再生装置、その制御方法、及びプログラム
JP2014082731A (ja) * 2012-09-26 2014-05-08 Jvc Kenwood Corp 動画像データ処理装置及び動画像データ処理方法
CN104681047B (zh) * 2013-11-26 2018-03-23 中国移动通信集团公司 一种自适应视频播放方法、装置及终端
CN105578258B (zh) * 2015-12-11 2019-05-24 浙江大华技术股份有限公司 一种视频预处理和视频回放的方法及装置
CN107645630B (zh) * 2016-07-20 2021-02-23 中兴通讯股份有限公司 摄像处理方法及装置
CN113395545B (zh) * 2021-06-10 2023-02-28 北京字节跳动网络技术有限公司 视频处理、视频播放方法、装置、计算机设备及存储介质
CN116847164B (zh) * 2023-07-04 2024-02-13 广东景行教育科技有限公司 一种基于大数据的课程内容反馈系统及方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3063838B2 (ja) * 1997-10-02 2000-07-12 日本電気株式会社 オーディオ・ビデオ同期再生装置および方法
JP2000099097A (ja) 1998-09-24 2000-04-07 Sony Corp 信号再生装置及び方法、音声信号再生装置、並びに、音声信号の速度変換方法
JP2000215024A (ja) 1999-01-27 2000-08-04 Victor Co Of Japan Ltd 音声応答システム
JP4895418B2 (ja) 1999-08-24 2012-03-14 ソニー株式会社 音声再生方法および音声再生装置
KR100657241B1 (ko) * 1999-09-03 2006-12-18 삼성전자주식회사 동영상 기록/재생 장치와 방법 및 기록 매체
JP3620787B2 (ja) 2000-02-28 2005-02-16 カナース・データー株式会社 音声データの符号化方法
JP2002314945A (ja) 2001-04-18 2002-10-25 Nippon Hoso Kyokai <Nhk> 話速変換プログラムおよび話速変換システム
US7809241B2 (en) * 2002-03-01 2010-10-05 Thomson Licensing Audio frequency scaling during video trick modes utilizing digital signal processing
US7693330B2 (en) * 2004-03-15 2010-04-06 Vincent So Anti-piracy image display methods and systems with sub-frame intensity compensation
WO2006082787A1 (ja) 2005-02-03 2006-08-10 Matsushita Electric Industrial Co., Ltd. 記録再生装置および記録再生方法および記録再生プログラムを格納した記録媒体および記録再生装置において用いられる集積回路
BRPI0607288A2 (pt) * 2005-02-07 2009-08-25 Thomson Licensing método e aparelho para reprodução de um sinal de vìdeo e um ou mais sinais de áudio relacionados com dados de áudio/vìdeo que são baseados em um sinal de vìdeo de frequência de quadro de 24 hz
CA2604866C (en) 2005-04-11 2013-06-25 Gingl, Manfred Bicycle frame construction
US20070250311A1 (en) * 2006-04-25 2007-10-25 Glen Shires Method and apparatus for automatic adjustment of play speed of audio data
JP5163005B2 (ja) 2007-08-10 2013-03-13 三菱電機株式会社 映像信号再生装置、映像信号処理装置および映像信号処理方法
JP2009075280A (ja) 2007-09-20 2009-04-09 Nippon Hoso Kyokai <Nhk> コンテンツ再生装置

Also Published As

Publication number Publication date
US20100310229A1 (en) 2010-12-09
CN101909191B (zh) 2013-04-10
US8391669B2 (en) 2013-03-05
CN101909191A (zh) 2010-12-08

Similar Documents

Publication Publication Date Title
JP2010283605A (ja) 映像処理装置及び方法
KR101334366B1 (ko) 오디오 배속 재생 방법 및 장치
JP5643821B2 (ja) 音声制御装置及び音声制御方法
JP5910379B2 (ja) 情報処理装置、情報処理方法、表示制御装置および表示制御方法
JP4965371B2 (ja) 音声再生装置
MXPA04008427A (es) Escalamiento de frecuencia de audio durante modos de truco de video que utilizan procesamiento de senal digital.
JP2009075280A (ja) コンテンツ再生装置
WO1998044483A1 (en) Time scale modification of audiovisual playback and teaching listening comprehension
JP2007149163A (ja) コンテンツ再生装置
JP2007183410A (ja) 情報再生装置および方法
JP6409163B2 (ja) 音声処理装置、音声処理プログラムおよび音声処理方法
JP2006317768A (ja) 話速変換装置、及びこの話速変換装置を制御する話速変換プログラム
JP2007163801A (ja) コンテンツ再生装置
JP4580297B2 (ja) 音声再生装置、音声録音再生装置、およびそれらの方法、記録媒体、集積回路
JP6486582B2 (ja) 電子機器、音声制御方法、およびプログラム
JP4353084B2 (ja) 映像再生方法及び装置及びプログラム
JP4543298B2 (ja) 再生装置および方法、記録媒体、並びにプログラム
JPH0854895A (ja) 再生装置
JP2001222300A (ja) 音声再生装置および記録媒体
JP2005266571A (ja) 変速再生方法及び装置、並びにプログラム
JP2006154531A (ja) 音声速度変換装置、音声速度変換方法、および音声速度変換プログラム
JP2007174074A (ja) 再生装置
JP2007256815A (ja) 音声再生装置、音声再生方法、音声再生プログラム
JP4529859B2 (ja) 音声再生装置
JP5375869B2 (ja) 楽曲再生装置、楽曲再生方法及びプログラム