JP2008079073A - 動画再生装置及びそのプログラム - Google Patents

動画再生装置及びそのプログラム Download PDF

Info

Publication number
JP2008079073A
JP2008079073A JP2006256923A JP2006256923A JP2008079073A JP 2008079073 A JP2008079073 A JP 2008079073A JP 2006256923 A JP2006256923 A JP 2006256923A JP 2006256923 A JP2006256923 A JP 2006256923A JP 2008079073 A JP2008079073 A JP 2008079073A
Authority
JP
Japan
Prior art keywords
moving image
data
speed
sound
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006256923A
Other languages
English (en)
Other versions
JP4687908B2 (ja
Inventor
Shigeki Mineo
茂樹 峯尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2006256923A priority Critical patent/JP4687908B2/ja
Publication of JP2008079073A publication Critical patent/JP2008079073A/ja
Application granted granted Critical
Publication of JP4687908B2 publication Critical patent/JP4687908B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/005Reproducing at a different information rate from the information rate of recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • H04N5/783Adaptations for reproducing at a rate different from the recording rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

【課題】 簡音声付動画データのスロー再生時においても聞き取りやすい音声を再生することができる動画再生装置及びそのプログラムを実現する。
【解決手段】 設定されている動画の再生速度が所定速度より遅いと判断すると(S2でY)、音声付動画データの音声データの音声を認識し(S3)、該認識に基づいて該音声データを複数に区切る(S4)。そして、該音声付動画データの動画データを該設定されている再生速度での再生を開始させるとともに(S5)、該複数に区切られた音声データを、該再生させている動画データに同期させながら通常の速度で再生させる(S6〜S10)。一方、設定されている再生速度が所定速度より速い場合は(S2でN)、音声付動画データの動画データと音声データとを該設定されている再生速度で再生させる動作を開始させる(S11)。
【選択図】 図2

Description

本発明は、動画再生装置及びそのプログラムに係り、詳しくは、音声付動画像データをスロー再生することができる動画再生装置及びそのプログラムに関する。
動画再生装置においては、音声付動画データの動画データをスロー再生させるとともに、該動画データと関連付けられている音声データも一緒にスロー再生させる技術がある(特許文献1)。
公開特許公報 特開2003−58195号
しかしながら、従来の技術によれば、動画データと一緒に音声データをスロー再生させてしまうと、そのスロー再生される音声が聞き取りづらいという問題がある。
例えば、人の声をスローで再生してしまうと、何を話しているのかわからなくなり、たとえ、聞き取れたとしても動画を見る人が苛々してしまっていた。
そこで本発明は、かかる従来の問題点に鑑みてなされたものであり、音声付動画データのスロー再生時においても聞き取りやすい音声を再生することができる動画再生装置及びそのプログラムを提供することを目的とする。
上記目的達成のため、請求項1記載の発明による動画再生装置は、音声付動画データを取得する取得手段と、
前記取得手段により取得された音声付動画データの動画データをスロー再生させて表示手段に表示させるスロー再生制御手段と、
前記取得手段により取得された音声付動画データの音声データを複数に区切る区切手段と、
前記区切手段により複数に区切られた音声データを前記スロー再生制御手段によりスロー再生させる動画データの再生速度よりも早い速度で、該スロー再生制御手段によりスロー再生される動画データと同期させて放音手段から放音させることにより、該区切られた複数の音声データを再生させていく音声再生制御手段と、
を備えたことを特徴とする。
また、例えば、請求項2に記載されているように、前記区切手段は、
前記取得手段により取得された音声付動画データの音声データを、所定の単位時間毎に区切るようにしてもよい。
また、例えば、請求項3に記載されているように、前記取得手段により取得された音声付動画データの音声データの音声を認識する音声認識手段を備え、
前記区切手段は、
前記音声認識手段により認識された音声に基づいて、該音声データの音声の区切のよい部分で区切るようにしてもよい。
また、例えば、請求項4に記載されているように、前記音声再生制御手段は、
前記区切手段により複数に区切られた音声データを、通常の再生速度又は前記スロー再生制御手段によりスロー再生される動画データの再生速度よりも速い再生速度で再生させていくようにしてもよい。
また、例えば、請求項5に記載されているように、前記スロー再生制御手段によりスロー再生される動画データの再生速度よりも速い任意の再生速度を、音声の再生速度として設定する音声再生速度設定手段を備え、
前記音声再生制御手段は、
前記区切手段により複数に区切られた音声データを前記音声再生速度設定手段により設定された音声の再生速度で、前記スロー再生制御手段によりスロー再生される動画データと同期させて放音手段から放音させることにより、該区切られた複数の音声データを再生させていくようにしてもよい。
また、例えば、請求項6に記載されているように、前記音声再生制御手段は、
前記区切手段により複数に区切られた音声データを、無音状態を挟みながら再生させていくようにしてもよい。
また、例えば、請求項7に記載されているように、前記音声再生制御手段は、
前記区切手段により複数に区切られた各音声データを、スロー再生される動画データと同期される期間内でリピート再生させるようにしてもよい。
また、例えば、請求項8に記載されているように、前記音声再生制御手段は、
前記区切手段により複数に区切られた各音声データをリピート再生させる場合、2回目以降に再生される音声を1回目に再生される音声より小さくするようにしてもよい。
また、例えば、請求項9に記載されているように、前記音声再生制御手段は、
前記区切手段により複数に区切られた各音声データを、スロー再生される動画データと同期された期間内の任意のタイミングで再生させていくようにしてもよい。
また、例えば、請求項10に記載されているように、前記音声再生制御手段は、
前記区切手段により複数に区切られた各音声データを再生する場合、各音声データの音声の始めと終わりとでフェードイン、フェードアウトさせて再生させるようにしてもよい。
また、例えば、請求項11に記載されているように、前記スロー再生制御手段により再生される再生速度を設定するスロー再生速度設定手段と、
前記スロー再生速度設定手段により設定された再生速度が所定速度より遅いか否かを判断する速度判断手段と、を備え、
前記音声再生制御手段は、
前記速度判断手段により前記スロー再生速度設定手段によって設定された再生速度が所定速度より遅いと判断された場合は、前記区切手段により複数に区切られた音声データを、前記スロー再生制御手段によりスロー再生させる動画データの再生速度よりも早い速度で、該スロー再生制御手段によりスロー再生される動画データと同期させて放音手段から放音させることにより、該区切られた複数の音声データを再生させていき、前記速度判断手段により前記スロー再生速度設定手段によって設定された再生速度が所定速度より遅くないと判断された場合には、前記取得手段により取得された音声付動画データの音声データを、前記スロー再生制御手段によりスロー再生させる動画データの再生速度と同じ速度で再生させるようにしてもよい。
また、例えば、請求項12に記載されているように、音声の再生速度を、動画の再生速度と同じにするかそれとも動画の再生速度より速い速度にするかを選択する選択手段を備え、
前記音声再生制御手段は、
前記選択手段により音声の再生速度を動画の再生速度より速い速度にすると選択された場合は、前記区切手段により複数に区切られた音声データを前記スロー再生制御手段によりスロー再生させる動画データの再生速度よりも早い速度で、該スロー再生制御手段によりスロー再生される動画データと同期させて放音手段から放音させることにより、該区切られた複数の音声データを再生させていき、前記選択手段により音声の再生速度を動画の再生速度と同じにすると選択された場合には、前記取得手段により取得された音声付動画データの音声データを、前記スロー再生制御手段によりスロー再生させる動画データの再生速度と同じ速度で再生させるようにしてもよい。
また、例えば、請求項13に記載されているように、前記取得手段により取得された音声付動画データの音声データの音声が人の音声かそれとも人の音声以外の音声か否かを判断する判断手段を備え、
前記音声再生制御手段は、
前記判断手段により人の音声と判断された場合は、前記区切手段により複数に区切られた音声データを前記スロー再生制御手段によりスロー再生される動画データの再生速度よりも速い速度で、該スロー再生制御手段によりスロー再生される動画データと同期させて放音手段から放音させることにより、該区切られた複数の音声データを再生していき、前記判断手段により人の音声以外の音声と判断された場合には、前記取得手段により取得された音声付動画データの音声データを、前記スロー再生制御手段によりスロー再生される動画データの再生速度と同じ速度で再生させるようにしてもよい。
上記目的達成のため、請求項14記載の発明によるプログラムは、音声付動画データを取得する取得処理と、
前記取得処理により取得された音声付動画データの動画データをスロー再生させて表示部に表示させるスロー再生制御処理と、
前記取得処理により取得された音声付動画データの音声データを複数に区切る区切処理と、
前記区切処理により複数に区切られた音声データを前記スロー再生制御処理によりスロー再生させる動画データの再生速度よりも早い速度で、該スロー再生制御処理によりスロー再生される動画データと同期させて放音部から放音させることにより、該区切られた複数の音声データを再生させていく音声再生制御処理と、
を含み、上記各処理をコンピュータで実行させることを特徴とする。
本願発明によれば、音声付動画データの動画データをスロー再生させるとともに、音声データを複数に区切り、該区切られた各音声データを、該各音声データに対応する動画データに同期させて、スロー再生される動画データの再生速度よりも速い速度で再生させるようにしたので、聞き取りやすい音声を放音手段から放音させることができる。
以下、本実施の形態について、本発明の動画再生装置をデジタルカメラに適用した一例として図面を参照して詳細に説明する。
[実施の形態]
A.デジタルカメラの構成
図1は、本発明の動画再生装置を実現するデジタルカメラ1の電気的な概略構成を示すブロック図である。
デジタルカメラ1は、撮影レンズ2、レンズ駆動ブロック3、CCD4、ドライバ5、TG(timing
generator)6、ユニット回路7、画像生成部8、CPU9、キー入力部10、メモリ11、DRAM12、フラッシュメモリ13、画像表示部14、音声処理部15、バス16を備えている。
撮影レンズ2は、複数のレンズ群から構成されるフォーカスレンズ2a、ズームレンズ2b等を含む。そして、撮影レンズ2にはレンズ駆動ブロック3が接続されている。レンズ駆動ブロック3は、フォーカスレンズ2a、ズームレンズ2bをそれぞれ光軸方向に沿って駆動させるフォーカスモータ、ズームモータと、CPU9から送られてくる制御信号にしたがって、フォーカスモータ、ズームモータを駆動させるフォーカスモータドライバ、ズームモータドライバから構成されている(図示略)。
CCD4は、ドライバ5によって駆動され、一定周期毎に被写体像のRGB値の各色の光の強さを光電変換して撮像信号としてユニット回路7に出力する。このドライバ5、ユニット回路7の動作タイミングはTG6を介してCPU9により制御される。
ユニット回路7には、TG6が接続されており、CCD4から出力される撮像信号を相関二重サンプリングして保持するCDS(Correlated Double Sampling)回路、そのサンプリング後の撮像信号の自動利得調整を行なうAGC(Automatic Gain Control)回路、その自動利得調整後のアナログの撮像信号をデジタル信号に変換するA/D変換器から構成されており、CCD4から出力された撮像信号はユニット回路7を経てデジタル信号として画像生成部8に送られる。
画像生成部8は、ユニット回路7から送られてきた画像データに対してγ補正処理、ホワイトバランス処理などの処理を施すとともに、輝度色差信号(YUVデータ)を生成し、該生成された輝度色差信号の画像データはCPU9に送られる。つまり、画像生成部8は、CCD4から出力された画像データに対して画像処理を施す。
CPU9は、画像生成部8から送られてきた画像データの圧縮・伸張(例えば、JPEG形式、MPEG形式の圧縮・伸張)処理、リピート再生処理、動画データ及び音声の削除処理を行う機能を有するとともに、デジタルカメラ1の各部を制御するワンチップマイコンである。
特に、CPU9は、フラッシュメモリ13に記録されている音声付動画データを取得する機能(取得手段)、該取得した音声付動画データの動画データをスロー再生させる機能(スロー再生制御手段)、音声付動画データの音声データの音声を認識する機能(音声認識手段)、音声認識手段により認識された音声に基づいて、該取得した音声付動画データの音声データを複数に区切る機能(区切手段)、該区切られた各音声データを、通常の速度(1倍速)で、スロー再生される動画データと同期させてスピーカから放音させる機能(音声再生制御手段)を備える。
また、スロー再生される動画データの再生速度を設定する機能(スロー再生設定手段)、該設定された再生速度が所定速度より遅いか否かを判断する機能(速度判断手段)も備える。
キー入力部10は、シャッタボタン、電源オンオフキー、モード切替キー、十字キー、SETキー等の複数の操作キーを含み、ユーザのキー操作に応じた操作信号をCPU9に出力する。
メモリ11には、CPU9が各部を制御するのに必要な制御プログラム、及び必要なデータが記録されており、CPU9は、該プログラムに従い動作する。
DRAM12は、CCD4によって撮像された後、CPU9に送られてきた画像データを一時記憶するバッファメモリとして使用されるとともに、CPU9のワーキングメモリとして使用される。
フラッシュメモリ13は、圧縮された画像データを保存する記録媒体である。
画像表示部14は、カラーLCDとその駆動回路を含み、撮影待機状態にあるときには、CCD4によって撮像された被写体をスルー画像として表示し、記録画像の再生時には、フラッシュメモリ13から読み出され、伸張された記録画像を表示させる。
音声処理部15は、内蔵マイク、アンプ、A/D変換器、D/A変換器、アンプ、内蔵スピーカ等を含み、音声付動画撮影時には、内蔵マイクに入力された音声をデジタル信号に変換してCPU9に送る。CPU9は、送られてきた音声データを、バッファメモリ(DRAM12)に順次記憶し、該記憶した音声データを撮影された動画データと関連付けてフラッシュメモリ13に記録する。つまり、音声付動画データを記録する。
また、音声処理部15は、音声付動画再生時には、画像表示部14に再生表示される動画データに合わせて、該動画データに関連付けられて記録されている音データに基づく音声等を内蔵スピーカから放音する。
B.デジタルカメラ1の動作
実施の形態におけるデジタルカメラ1の動作を図2のフローチャートに従って説明する。なお、本実施の形態においては、動画データをスローで再生させるということを前提に説明する。
ユーザのキー入力部10の操作により音声付動画データの再生の指示が行われると、ステップS1で、CPU9は、フラッシュメモリ13に記録されている音声付動画データのうち、ユーザのキー入力部10の操作により再生指示された該音声付動画データ(動画データ、及び該動画データに関連付けれられている音声データ)を、フラッシュメモリ13から読み出すことにより取得する(取得手段)。この読み出された音声付動画データはバッファメモリ(DRAM12)に記憶される。
次いで、ステップS2で、現在設定されている動画再生速度が所定速度より遅いか否かを判断する(速度判断手段)。
ユーザはキー入力部10を操作することにより、設定モードやメニューモードにおいて、予め動画の再生速度を任意に選択することができ、CPU9は、該選択された再生速度を動画の再生速度として設定する(スロー再生速度設定手段)。つまり、CPU9は、ユーザによって選択された再生速度をメモリ11の再生速度記録領域に記録させる。ユーザは、1倍速(通常の速度)、1/2倍速、1/3倍速、1/4倍速等の1倍速未満の再生速度を設定することができる。ここでは、ユーザにより設定された再生速度を1/3倍速とし、所定速度を1/2倍速とする。
ステップS2で、設定されている再生速度(再生速度記録領域に記録されている再生速度)がメモリ11に予め記録されている所定速度より遅いと判断すると、ステップS3に進み、CPU9は、該取得したバッファメモリに記憶されている音声付動画データの音声データの音声を音声認識処理により認識する(音声認識手段)。
ここで話しは変わるが、該取得した音声付動画データは、図3(a)に示すように音声付動画データの記録時間は8秒とし、録音された音声は「イチニツイテー、ヨーイ、□□スタート、ワー、ワー」であるとする。
この「イチニツイテー、ヨーイ、□□スタート、ワー、ワー」のうち「イチニ」とう音声は0秒から1秒の間に録音され、「ツイテ」という音声は1秒から2秒の間に録音され、「ー」という音声は2秒から3秒の間に録音され、「ヨーイ」という音声は3秒から4秒の間に録音され、4秒から5秒の間は音声が録音されておらず(□□の部分)、「スタート」という音声は5秒から6秒の間に録音され、1回目の「ワー」という音声は6秒から7秒の間に録音され、2回目の「ワー」という音声は7秒から8秒の間に録音されている。
音声認識処理の話しに戻り、ここでの音声認識処理は、音声に基づいて言葉を認識することにより、言葉の文章で区切りのよい部分(例えば、文節など)を認識する。この音声認識処理は、既に周知技術なので説明を省略する。これにより、文章を区切りの悪いところで区切ることがなく、放音される音声の文章を聞き取り易くすることができる。
次いで、ステップS4で、CPU9は、該音声認識処理に基づいて該音声データを複数に区切る(区切手段)。例えば、音声認識により区切のよい部分として認識された音声が「イチニツイテー」、「ヨーイ」、「□□」、「スタート」、「ワー」、「ワー」である場合には、録音された全音声データを、「イチニツイテー」の音声データ(0秒〜3秒までの音声データ)と、「ヨーイ」という音声データ(3秒〜4秒までの音声データ)と、「□□」の音声データ(4秒〜5秒までの音声データ)、つまり、音声が無い部分の音声データと、「スタート」の音声データ(5秒〜6秒までの音声データ)と、1回目の「ワー」の音声データ(6秒〜7秒までの音声データ)と、2回目の「ワー」の音声データ(7秒〜8秒までの音声データ)とに区切ることになる。
次いで、ステップS5で、CPU9は、該取得した(バッファメモリに記憶した)音声付動画データの動画データの再生を該設定されている再生速度(再生速度記録領域に記録されている再生速度)で開始する(スロー再生制御手段)。
つまり、動画データのフレームデータを該設定された再生速度で最初から順次画像表示部14に表示させる。この設定された再生速度での再生とは、例えば、該音声付動画データの動画データが1/30秒のフレームレートで撮像されていった場合に、設定された再生速度が1/3倍速の場合は、1/10秒のフレームレート間隔で、つまり、1秒間に10枚のフレームデータを表示させる間隔で表示させていくことになる。
動画データの再生を開始させると、CPU9は、該複数に区分けされた音声データを、該再生させている動画データに同期させながら通常の速度で再生させる動作を開始する(音声再生制御手段)。これにより、音声データの音声を聞き取り易くすることができる。
具体的には、動画データの再生を開始させると、CPU9は、まず、複数に区分けされた音声データのうち、最初の区分けされた音声データの再生を通常の再生速度(1倍速)で開始させる(ステップS6)。
ここでは、複数に区切られた音声データのうち、最初の区分けされた音声データは、「イチニツイテー」の音声データであるので、該音声データを通常の再生速度で再生させる動作を開始する。この通常の再生速度は、録音したときの音声の速度と同じ速度(実速度)ということである。
なお、再生された音声は音声処理部15の内蔵スピーカから放音される。
次いで、CPU9は、該音声データの再生が終了したか否かを判断する(ステップS7)。例えば、「イチニツイテー」の音声データを再生している場合には最後まで再生したか否かを判断する。
ステップS7で、音声データの再生が終了していないと判断すると終了するまでステップS7に留まり、音声データの再生が終了したと判断すると、CPU9は、該区分けされた音声データに対応する動画データの再生が終了したか否かを判断する(ステップS8)。この該区分けされた音声データに対応する動画データとは、例えば、該区分けされた音声データが「イチニツイテー」である場合には、該音声データは0秒〜3秒までの音声データなので、0秒〜3秒までに対応する動画データということになり、1/30秒のフレームレートで撮影された動画データである場合は、1枚目〜90枚目までのフレームの動画データの再生が終了したか否かということになる。また、再生されている区分けされた音声データが「ヨーイ」の場合には、該音声データは3秒〜4秒までの音声データなので、3秒〜4秒までに対応する動画データということになり、1/30秒のフレームレートで撮影された動画データである場合は、91枚目〜120枚目までのフレームの動画データの再生が終了したか否かということになる。
ステップS8で、再生されている区分けされた音声データに対応する動画データの再生が終了していないと判断すると終了したと判断するまでステップS8に留まる。このときは、区分けされた音声データの再生は終了しているので音声処理部15のスピーカからは音声が放音されない、つまり無音状態となる。
一方、ステップS8で、再生されている区分けされた音声データに対応する動画データの再生が終了したと判断すると、CPU9は、動画再生が終了したか否かを判断する(ステップS9)。つまり、動画データのフレームを最後まで再生したか否かにより判断する。
ステップS9で、動画データの再生が終了していないと判断すると、CPU9は、該複数に区分けされた音声データのうち、再生させていた区分けされた音声データの次の区分けされた音声データの再生を通常の再生速度で開始させて(ステップS10)、ステップS7に戻る。例えば、「イチニツイテー」の音声データを再生させていた場合は、「ヨーイ」の音声データの再生を開始させることになる。つまり、複数に区切られた音声データを、区分けされた各音声データに対応する動画データに同期させて、通常の再生速度で再生させていくことになる。
なお、再生された音声は音声処理部15の内蔵スピーカから放音される。
図3(b)は、実施の形態において再生された動画と音声の様子を示すものである。
記録された動画データの時間は、8秒であり、設定された再生速度は1/3倍速なので、3秒経過したときに1秒分の動画データの再生が終了し、6秒経過すると2秒分の動画データの再生が終了するというように、動画データの再生時間は、実際の記録時間の3倍の時間がかかるということが分かる。
また、複数に区切られた音声データのうち、最初の動画データの音声は、「イチニツイテー」であり、この部分の音声は0〜3秒の間に録音されたものであり、音声は通常の再生速度で再生しているので、該区切られた音声データに対応する動画データ(0秒〜3秒の間に録画された動画データ)のうち、0〜1秒の間に対応する動画データの再生が終了した時点で、該区切られた音声データの再生は終了してしまう。従って、該区切られた音声データに対応する動画データの再生が終了するまで待ち動作を行ない、つまり、無音状態となり、該区切られた音声データに対応する動画データの再生が終了すると、次の区切られた音声データ(ここでは、3秒から4秒の間に録音された音声データ)、つまり、「ヨーイ」の音声データの再生を開始させる。つまり、該区切れた音声データを、該音声データに対応する動画データに同期させて通常の再生速度で再生させる。そして、該「ヨーイ」の音声データの再生が終了すると、該区切られた音声データに対応する動画データ(3秒〜4秒の間に録画された動画データ)の再生が終了するまで待ち処理を行い、該動画データの再生が終了すると、次の区切られた音声データの再生を開始させる。
一方、ステップS2で、設定されている動画の再生速度が所定速度より遅くないと判断すると、CPU9は、該取得した音声付動画データの動画データと音声データとの再生を該設定されている再生速度(再生速度記録領域に記録されている再生速度)で開始する(ステップS11)。
例えば、設定されている再生速度が1/1.5倍速、つまり2/3倍速の場合は、該音声付動画データの動画データの再生を2/3倍速で開始させるとともに、音声付動画データの音声データの再生も2/3倍速で開始させる。つまり、従来の音声付動画データの再生を開始させることになる。
なお、再生された音声は音声処理部15の内蔵スピーカから放音される。
設定された再生速度が所定速度より遅くない場合は、該再生速度で音声データを再生させても聞き取りづらくない音声が放音されるからである。
次いで、CPU9は、動画再生処理が終了したか否かを判断し(ステップS12)、終了するまでステップS12に留まる。
C.以上のように、実施の形態においては、設定されている再生速度が所定速度より遅い場合は、音声付動画データの音声データを複数に区切るとともに、該音声付動画データの動画データを該設定されている再生速度でスロー再生させ、該区切られた各音声データを、該各音声データに対応する動画データに同期させて通常の再生速度で再生させるようにしたので、聞き取りやすい音声を内蔵スピーカから放音させることができる。
また、音声データの音声を音声認識処理により文章の区切りのよい部分を認識し、該認識に基づいて該音声データを区切るようにしたので、放音される文章を聞き取りやすくすることができる。
[変形例]
D.上記実施の形態は以下のような態様でもよい。
(1)上記実施の形態においては、区切られた各音声データと、各音声データに対応する動画データとを同期させる位置を、区切られた音声データの再生開始と、該区切られた音声データに対応する動画データの再生開始とが同時になるような位置にしたが、図3(c)に示すように、区切られた音声データが、該区切られた音声データに対応する動画データの中間で再生されるような位置にするように、つまり、該区切られた音声データの中間と、該区切られた音声データに対応する動画データの中間とが同時に再生されるような位置にするようにしてもよいし、区切られた音声データの再生の終了と、該区切られた音声データに対応する動画データの再生の終了とが同じになるような位置にしてもよい。
また、区切られた音声データが、該区切られた音声データに対応する動画データの再生中に再生されるのであれば(再生が開始され、且つ、終了するのであれば)、どの任意のタイミングで再生させるようにしてもよい。つまり、同期された期間内であれば任意のタイミングで再生させるようにしてもよい。
(2)上記実施の形態においては、音声認識処理に基づいて音声データを、複数に区切るようにしたが、単に所定の単位時間毎に音声データを区切るようにしてもよい。
図4(a)は、そのときに再生された動画と音声の様子を示す図である。
図を見ると、所定の単位時間(ここでは1秒)毎に、音声データが区切られ、該区切られた各音声データは、該音声データに対応する動画データと同期されて(ここでは、区切られた音声データの再生開始と、該区切られた音声データに対応する動画データの再生開始とが同時になるように)、再生されているのが分かる。
また、上記変形例(1)で説明したように、同期位置を、区切られた音声データの中間と動画データの中間とが同時に再生されるような位置にしてもよいし、区切られた音声データの再生の終了と、該区切られた音声データに対応する動画データの再生の終了とが同じになるような位置にしてもよい(図4(b)参照)。
また、区切られた音声データが、該区切られた音声データの動画データの再生中に再生されるのであれば(再生が開始され、且つ、終了するのであれば)、どの任意のタイミングで再生させるようにしてもよい。
(3)また、上記実施の形態においては、ステップS7で、区切られた音声データの再生が終了したと判断されると、ステップS8で、該区切られた音声データに対応する動画データの再生が終了するまで待ち処理を行うようにしたが、該区切られた音声データに対応する動画データの再生が終了するまでは、該区切られた音声データのリピート再生を行なうようにしてもよい。
このときのデジタルカメラ1の動作を図5のフローチャートにしたがって説明する。なお、図2のフローチャートと同様の動作を行なうステップについては、同じステップ番号を付している。
図2のステップS6で、複数に区分けされた音声データのうち、最初の音声データの再生を通常の再生速度で開始させると、図5のステップS7に進み、該区切られた音声データの再生が終了したか否かを判断し、終了したと判断するまでステップS7に留まる。
ステップS7で、該区切られた音声データの再生が終了したと判断すると、CPU9は、該再生した区分けされた音声データに対応する動画データの再生が終了する前に、もう一度該再生した区分けされた音声データを再生することができるか否かを判断する(ステップS21)。
例えば、「イチニツイテー」の音声データの再生が終了すると、該「イチニツイテー」の音声データに対応する動画データ(0秒〜3秒までの動画データ)の再生が終了する前に、もう一度「イチニツイテー」の音声データを再生することができるか否かを判断することになる。
ステップS21で、該再生した区分けされた音声データに対応する動画データの再生が終了する前に、もう一度該再生した区分けされた音声データを再生することができると判断すると、CPU9は、該再生した区分けされた音声データを前回より小さい音量で、且つ、通常の再生速度で再び再生させる動作を開始してステップS7に戻る。これにより、リピートされる回数が増えれば増えるほど、リピート再生される音声の音量は段々小さくなっていく。
一方、ステップS21で、該再生した区分けされた音声データに対応する動画データの再生が終了する前に、もう一度該再生した区分けされた音声データを再生することができないと判断すると、図2のステップS8へ進む。
図6は、このときに再生された動画と音声の様子を示すものである。
図を見ると、区切られた音声データに対応する動画データの再生が終了するまで、該区切られた音声データがリピート再生されているのがわかる。
なお、リピート再生の回数に応じて、リピート再生される音量を小さくさせていくようにしたが、逆に音量を大きくさせていくようにしてもよい。
また、リピート再生される音量(2回目以降に再生される音量)を、同じ音量にするようにしてもよい。この場合は、リピート再生される音量を1回目に再生される音量と同じにしてもよいし、小さくするようにしてもよいし、大きくするようにしてもよい。
(4)また、上記実施の形態においては、音声付動画データの音声データの音声が人の音声(話し声)か、それ以外の音声や音などの自然音(動物の鳴き声や、車の音、海の波の音、風によって木がなびく音)であるか否かを音声認識により判断して、人の音声であると判断した場合に本発明を行なうようにしてもよい。人の音声をスロー再生すると聞き取りづらいが、自然音の場合はスロー再生しても聞き取りづらい(何を言っているのか分からない)ということは無いからである。
このデジタルカメラ1の動作を図7のフローチャートにしたがって説明する。
図2のステップS1で、音声付動画データを取得すると、図7のステップS51に進み、CPU9は、該取得した音声付動画データの音声データの音声を音声認識処理により認識する。ここでの、音声認識処理は、人の音声であるか否かを認識できる程度の処理でよい。
次いで、ステップS52で、CPU9は、該音声認識処理に基づいて、該音声データの音声は人の音声か否かを判断する(判断手段)。
ステップS52で人の音声であると判断すると、図2のステップS2、又は、ステップS3に進み、人の音声でないと判断するとステップS11に進む。
(5)また、上記実施の形態において、区分けした各音声データを再生させる場合に、区分けされた各音声データの再生の初めをフェードインさせていき、再生の終わりをフェードアウトさせるようにしてもよい。
(6)また、上記実施の形態においては、設定されている再生速度(再生速度記録領域に記録されている再生速度)が所定速度より遅いと判断された場合は、音声データを通常の再生速度で再生させるようにしたが、音声データの再生速度が動画データの再生速度(設定されている再生速度)よりも速い速度であれば通常の再生速度よりも遅い速度で再生するようにしてもよい。つまり、設定されている再生速度よりも速い速度であればよい。音声データの再生速度が設定されている再生速度よりも速い速度であれば、然程音声が聞き取りづらいということはないからである。
この場合は、ユーザが音声データの再生速度を任意に選択することができるようにしてもよい。このときは、CPU9は、該選択に従って音声データの再生速度を設定する(音声再生速度設定手段)。
(7)また、上記実施の形態においては、ユーザの意思に関わらず、所定の条件を満たすと、音声データを通常の再生速度で再生させるようにしたが、ユーザが、該設定された再生速度(再生速度記録領域に記録されている再生速度)で音声データを再生させるか否かを選択することができようにしてもよい(選択手段)。この場合、該設定された再生速度(再生速度記録領域に記録されている再生速度)で音声データを再生させると選択された場合は図2のステップS11に進み、該設定された再生速度で音声データを再生させないと選択された場合は図2のステップS2又はステップS3へ進むようにする。
(8)また、上記実施の形態においては、予め設定モードやメニューモードにおいて、動画の再生速度を設定するようにしたが、動画再生中においても動画の再生速度の設定変更を行なうことができるようにしてもよい。この設定変更された再生速度は、メモリ11の再生速度記録領域に上書きして記録される。
このときは、設定変更が行なわれると、再び、該設定された再生速度が所定速度より遅いか否かを判断し、遅い場合は通常の再生速度(1倍速)でこれからの音声データを再生させるとともに、設定された再生速度でこれからの動画データを再生し、設定された再生速度が所定速度より速い場合にはこれからの動画データと音声データとを該設定された再生速度で再生するようにしてもよい。
(9)また、上記実施の形態においては、上記変形例(1)乃至(8)を任意に組み合わせるような態様であってもよい。
(10)また、上記実施の形態においては、本発明の動画再生装置をデジタルカメラ1に適用した場合について説明したが、カメラ付き携帯電話、カメラ付きPDA、カメラ付きパソコン、カメラ付きICレコーダ、又はデジタルビデオカメラ等に適用してもよく、音声付動画データを再生することができる機器であればよい。
本発明の実施の形態のデジタルカメラのブロック図である。 実施の形態のデジタルカメラ1の動作を示すフローチャートである。 記録された音声付動画データの様子、及び、実施の形態及び変形例において再生された動画と音声の様子を示すものである。 変形例において再生された動画と音声の様子を示すものである。 変形例におけるデジタルカメラ1の動作を示すフローチャートである。 変形例において再生された動画と音声の様子を示すものである。 変形例におけるデジタルカメラ1の動作を示すフローチャートである。
符号の説明
1 デジタルカメラ
2 撮影レンズ
3 レンズ駆動ブロック
4 CCD
5 ドライバ
6 TG
7 ユニット回路
8 画像生成部
9 CPU
10 キー入力部
11 メモリ
12 DRAM
13 フラッシュメモリ
14 画像表示部
15 音声処理部
16 バス

Claims (14)

  1. 音声付動画データを取得する取得手段と、
    前記取得手段により取得された音声付動画データの動画データをスロー再生させて表示手段に表示させるスロー再生制御手段と、
    前記取得手段により取得された音声付動画データの音声データを複数に区切る区切手段と、
    前記区切手段により複数に区切られた音声データを前記スロー再生制御手段によりスロー再生させる動画データの再生速度よりも早い速度で、該スロー再生制御手段によりスロー再生される動画データと同期させて放音手段から放音させることにより、該区切られた複数の音声データを再生させていく音声再生制御手段と、
    を備えたことを特徴とする動画再生装置。
  2. 前記区切手段は、
    前記取得手段により取得された音声付動画データの音声データを、所定の単位時間毎に区切ることを特徴とする請求項1記載の動画再生装置。
  3. 前記取得手段により取得された音声付動画データの音声データの音声を認識する音声認識手段を備え、
    前記区切手段は、
    前記音声認識手段により認識された音声に基づいて、該音声データの音声の区切のよい部分で区切ることを特徴とする請求項1記載の動画再生装置。
  4. 前記音声再生制御手段は、
    前記区切手段により複数に区切られた音声データを、通常の再生速度又は前記スロー再生制御手段によりスロー再生される動画データの再生速度よりも速い再生速度で再生させていくことを特徴とする請求項1乃至3の何れかに記載の動画再生装置。
  5. 前記スロー再生制御手段によりスロー再生される動画データの再生速度よりも速い任意の再生速度を、音声の再生速度として設定する音声再生速度設定手段を備え、
    前記音声再生制御手段は、
    前記区切手段により複数に区切られた音声データを前記音声再生速度設定手段により設定された音声の再生速度で、前記スロー再生制御手段によりスロー再生される動画データと同期させて放音手段から放音させることにより、該区切られた複数の音声データを再生させていくことを特徴とする請求項1乃至3の何れかに記載の動画再生装置。
  6. 前記音声再生制御手段は、
    前記区切手段により複数に区切られた音声データを、無音状態を挟みながら再生させていくことを特徴とする請求項1乃至5の何れかに記載の動画再生装置。
  7. 前記音声再生制御手段は、
    前記区切手段により複数に区切られた各音声データを、スロー再生される動画データと同期される期間内でリピート再生させることを特徴とする請求項1乃至6の何れかに記載の動画再生装置。
  8. 前記音声再生制御手段は、
    前記区切手段により複数に区切られた各音声データをリピート再生させる場合、2回目以降に再生される音声を1回目に再生される音声より小さくすることを特徴とする請求項7記載の動画再生装置。
  9. 前記音声再生制御手段は、
    前記区切手段により複数に区切られた各音声データを、スロー再生される動画データと同期された期間内の任意のタイミングで再生させていくことを特徴とする請求項1乃至6の何れかに記載の動画再生装置。
  10. 前記音声再生制御手段は、
    前記区切手段により複数に区切られた各音声データを再生する場合、各音声データの音声の始めと終わりとでフェードイン、フェードアウトさせて再生させることを特徴とする請求項1乃至9の何れかに記載の動画再生装置。
  11. 前記スロー再生制御手段により再生される再生速度を設定するスロー再生速度設定手段と、
    前記スロー再生速度設定手段により設定された再生速度が所定速度より遅いか否かを判断する速度判断手段と、を備え、
    前記音声再生制御手段は、
    前記速度判断手段により前記スロー再生速度設定手段によって設定された再生速度が所定速度より遅いと判断された場合は、前記区切手段により複数に区切られた音声データを、前記スロー再生制御手段によりスロー再生させる動画データの再生速度よりも早い速度で、該スロー再生制御手段によりスロー再生される動画データと同期させて放音手段から放音させることにより、該区切られた複数の音声データを再生させていき、前記速度判断手段により前記スロー再生速度設定手段によって設定された再生速度が所定速度より遅くないと判断された場合には、前記取得手段により取得された音声付動画データの音声データを、前記スロー再生制御手段によりスロー再生させる動画データの再生速度と同じ速度で再生させることを特徴とする請求項1乃至10の何れかに記載の動画再生装置。
  12. 音声の再生速度を、動画の再生速度と同じにするかそれとも動画の再生速度より速い速度にするかを選択する選択手段を備え、
    前記音声再生制御手段は、
    前記選択手段により音声の再生速度を動画の再生速度より速い速度にすると選択された場合は、前記区切手段により複数に区切られた音声データを前記スロー再生制御手段によりスロー再生させる動画データの再生速度よりも早い速度で、該スロー再生制御手段によりスロー再生される動画データと同期させて放音手段から放音させることにより、該区切られた複数の音声データを再生させていき、前記選択手段により音声の再生速度を動画の再生速度と同じにすると選択された場合には、前記取得手段により取得された音声付動画データの音声データを、前記スロー再生制御手段によりスロー再生させる動画データの再生速度と同じ速度で再生させることを特徴とする請求項1乃至10の何れかに記載の動画再生装置。
  13. 前記取得手段により取得された音声付動画データの音声データの音声が人の音声かそれとも人の音声以外の音声か否かを判断する判断手段を備え、
    前記音声再生制御手段は、
    前記判断手段により人の音声と判断された場合は、前記区切手段により複数に区切られた音声データを前記スロー再生制御手段によりスロー再生される動画データの再生速度よりも速い速度で、該スロー再生制御手段によりスロー再生される動画データと同期させて放音手段から放音させることにより、該区切られた複数の音声データを再生していき、前記判断手段により人の音声以外の音声と判断された場合には、前記取得手段により取得された音声付動画データの音声データを、前記スロー再生制御手段によりスロー再生される動画データの再生速度と同じ速度で再生させることを特徴とする請求項1乃至10の何れかに記載の動画再生装置。
  14. 音声付動画データを取得する取得処理と、
    前記取得処理により取得された音声付動画データの動画データをスロー再生させて表示部に表示させるスロー再生制御処理と、
    前記取得処理により取得された音声付動画データの音声データを複数に区切る区切処理と、
    前記区切処理により複数に区切られた音声データを前記スロー再生制御処理によりスロー再生させる動画データの再生速度よりも早い速度で、該スロー再生制御処理によりスロー再生される動画データと同期させて放音部から放音させることにより、該区切られた複数の音声データを再生させていく音声再生制御処理と、
    を含み、上記各処理をコンピュータで実行させることを特徴とするプログラム。
JP2006256923A 2006-09-22 2006-09-22 動画再生装置及びそのプログラム Expired - Fee Related JP4687908B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006256923A JP4687908B2 (ja) 2006-09-22 2006-09-22 動画再生装置及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006256923A JP4687908B2 (ja) 2006-09-22 2006-09-22 動画再生装置及びそのプログラム

Publications (2)

Publication Number Publication Date
JP2008079073A true JP2008079073A (ja) 2008-04-03
JP4687908B2 JP4687908B2 (ja) 2011-05-25

Family

ID=39350649

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006256923A Expired - Fee Related JP4687908B2 (ja) 2006-09-22 2006-09-22 動画再生装置及びそのプログラム

Country Status (1)

Country Link
JP (1) JP4687908B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024059428A1 (en) * 2022-09-15 2024-03-21 Qualcomm Incorporated Coordination of slow motion video with audio

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0973299A (ja) * 1995-06-30 1997-03-18 Sanyo Electric Co Ltd Mpegオーディオ再生装置およびmpeg再生装置
JP2000048487A (ja) * 1998-07-24 2000-02-18 Yamaha Corp ディジタルオーディオデータの再生方法及び装置
JP2005346781A (ja) * 2004-06-01 2005-12-15 Hitachi Ltd デジタル情報再生装置及び方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0973299A (ja) * 1995-06-30 1997-03-18 Sanyo Electric Co Ltd Mpegオーディオ再生装置およびmpeg再生装置
JP2000048487A (ja) * 1998-07-24 2000-02-18 Yamaha Corp ディジタルオーディオデータの再生方法及び装置
JP2005346781A (ja) * 2004-06-01 2005-12-15 Hitachi Ltd デジタル情報再生装置及び方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024059428A1 (en) * 2022-09-15 2024-03-21 Qualcomm Incorporated Coordination of slow motion video with audio

Also Published As

Publication number Publication date
JP4687908B2 (ja) 2011-05-25

Similar Documents

Publication Publication Date Title
US8482624B2 (en) Image pickup device with still picture pickup function during moving picture pickup operation
JP4777180B2 (ja) 撮像装置及びその制御方法
US20120057843A1 (en) Moving image processing apparatus, moving image playback apparatus, moving image processing method, moving image playback method, and storage medium
US8018497B2 (en) Image pick-up apparatus having still image advancing/retreating manipulation function, and method and non-transitory computer readable medium therefor
JP2012100216A (ja) カメラおよび動画撮影プログラム
JP5155092B2 (ja) カメラ、再生装置、および再生方法
US8391669B2 (en) Video processing apparatus and video processing method
JP2007089186A (ja) 動画撮影機能付き移動通信端末機及びその動作方法
JP4654947B2 (ja) 動画処理装置及びそのプログラム
JP4687908B2 (ja) 動画再生装置及びそのプログラム
KR100775187B1 (ko) 썸네일 재생 방법 및 이를 이용한 단말기
JP2007174278A (ja) 画像表示装置、画像表示方法
KR101285382B1 (ko) 동영상 편집 기능을 구비한 동영상 촬영 장치 및 방법
JP4562837B2 (ja) 画像再生装置、画像再生方法、画像記録再生方法及びデジタルカメラ
JP4915978B2 (ja) 動画再生装置及びそのプログラム
JP5268608B2 (ja) 撮像再生装置
JP2005072729A (ja) 電子カメラ及び画像撮影方法
JP4013433B2 (ja) 画像再生装置及びデジタルカメラ
JP2007266661A (ja) 撮像装置、情報処理装置、撮像表示システム
JP2007104405A (ja) 音声付き映像データ処理装置、音声付き映像データ処理方法及び音声付き映像データ処理用プログラム
JP2008097727A (ja) 動画再生装置
JP4438332B2 (ja) 電子機器、この電子機器に用いられるモニタ表示方法及びプログラム
JP2008278315A (ja) 撮像装置及びそのプログラム
JP2006217111A (ja) 動画撮影装置、及び動画撮影方法
JP2009095047A (ja) 録画再生装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090403

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101029

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110119

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110201

R150 Certificate of patent or registration of utility model

Ref document number: 4687908

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140225

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees