JP2006319483A - 記録再生装置及び記録再生方法 - Google Patents

記録再生装置及び記録再生方法 Download PDF

Info

Publication number
JP2006319483A
JP2006319483A JP2005137894A JP2005137894A JP2006319483A JP 2006319483 A JP2006319483 A JP 2006319483A JP 2005137894 A JP2005137894 A JP 2005137894A JP 2005137894 A JP2005137894 A JP 2005137894A JP 2006319483 A JP2006319483 A JP 2006319483A
Authority
JP
Japan
Prior art keywords
sound
signal
recording
data
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005137894A
Other languages
English (en)
Other versions
JP2006319483A5 (ja
JP4533234B2 (ja
Inventor
Hiroshi Owaki
浩 大脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005137894A priority Critical patent/JP4533234B2/ja
Priority to US11/408,281 priority patent/US8538244B2/en
Publication of JP2006319483A publication Critical patent/JP2006319483A/ja
Publication of JP2006319483A5 publication Critical patent/JP2006319483A5/ja
Application granted granted Critical
Publication of JP4533234B2 publication Critical patent/JP4533234B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • G11B2020/10555Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Quality & Reliability (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

【課題】短時間の適切なサムネイル音声を生成できる技術の提供。
【解決手段】音データが付随した画像データの記録再生装置であって、音データから所定の音又は音声信号を抽出する抽出手段と、前記所定の音又は音声信号を画像データに関連付けて記録する記録手段と、前記画像データの縮小画像の選択時に前記所定の音又は音声信号を再生する再生手段とを備える。
【選択図】 図1

Description

本発明は、音データが付随した画像データを記録再生する技術に関する。
従来より、静止画、動画、及び音声に関する各データ毎に代表静止画であるサムネイル画像を生成し、静止画、動画、及び音声と関連付けて管理する技術が提案されている。
例えば、特許文献1には、静止画に関するデータと音声に関するデータとを関連付ける装置が提案されている。
また、特許文献2には、より良い代表静止画であるサムネイル画像を生成する装置として、無意味なフレームが代表静止画として生成されることがなく、有用な代表静止画を生成できる動画検索装置が提案されている。
また、特許文献3には、サムネイル画像用の音声データを、音声データの編集・加工なしで抽出する装置がに提案されている。
また、音声信号の基本的な処理方法について、非特許文献1に記述されている。
また、音声信号の話速変換方法の例について、非特許文献2に記述されている。
特開2003−348530公報 特開2003−111011公報 特開2001−298711公報 古井貞熙 著「ディジタル音声処理」 春日正男、船田哲男、林伸二、武田一哉 共著「音声情報処理」
上記技術によって、静止画、動画、及び音声について関連のあるデータ同士をグループ化して管理したり、関連のあるデータ同士をデータグループとして読み出したりできるようになっている。
また、関連のあるデータ同士について、より適切な代表静止画であるサムネイル画像を生成し、ユーザはサムネイル画像を見ることでそのデータグループがどのような関連があるのかを短時間で把握できるようになっている。
しかし、より適切なサムネイル画像を生成できたとしても、より適切な代表音声であるサムネイル音声を生成する装置は未だ提案されていない。
本発明は、上記課題を解決するためになされ、その目的は、短時間の適切なサムネイル音声を生成できる技術を提供することである。
また、他の目的は、サムネイル画像と関連付けすることによりサムネイル画像の選択時にサムネイル音声を再生できる技術を提供することである。
なお、本発明では、上記サムネイル音声を、便宜的に「音声サムネイル」と呼ぶことにする。
上記課題を解決し、目的を達成するために、本発明の記録再生装置は、音データが付随した画像データの記録再生装置であって、音データから所定の音又は音声信号を抽出する抽出手段と、前記所定の音又は音声信号を画像データに関連付けて記録する記録手段とを具備する。
また、本発明の記録再生方法は、音データが付随した画像データの記録再生方法であって、音データから所定の音又は音声信号を抽出する抽出工程と、前記所定の音又は音声信号を画像データに関連付けて記録する記録工程とを備える。
以上説明したように、本発明によれば、短時間の適切なサムネイル音声を生成できる。また、サムネイル画像と関連付けしてサムネイル画像の選択時にサムネイル音声を再生できる。
以下に、添付図面を参照して本発明の好適な実施形態について詳細に説明する。
尚、以下に説明する実施の形態は、本発明の実現手段としての一例であり、本発明が適用される装置の構成や各種条件によって適宜修正又は変更されるべきものであり、本発明は以下の実施の形態に限定されるものではない。
[記録再生装置の構成]
本実施形態では、音データが付随した画像データの記録再生装置は図1のように構成される。
即ち、レンズ1は撮影したい被写体の光学像を取り込む。撮像部2は、光学像を光電変換して得られるアナログ映像信号をデジタル映像信号に変換する。ディスプレイ3は、デジタル映像信号を表示再生する。マイク4は、音信号をアナログ音信号として取り込む。オーディオ入力部5は、アナログ音信号をデジタル音信号に変換する。スピーカ7は、アナログ音信号を音又は音声として出力する。
信号処理部8は、音や音声、画像の信号処理を行い、音及び音声信号区間を抽出する区間抽出部8a、音及び音声信号の性質を分析する性質分析部8b、音及び音声信号の話速変換や信号を削除する加工・編集部8c、音及び音声信号の圧縮(符号化)や展開(復号化)を行う圧縮・展開部8d、画像信号を輝度色差信号に変換すると共に、圧縮(符号化)及び展開(復号化)等の画像処理を行う画像処理部8eを備える。
CPU9は、本実施形態の記録再生装置全体の制御やデータの関連付けを行う。RAM10は、画像信号、圧縮画像信号、音信号、圧縮音信号、CPU9の実行プログラム及びデータの書き込み/読み出しを行う。ROM11は、CPU9の実行プログラム及びデータを記録保管する。インターフェース12は、メディア13にデータを書き込み/読み出しするための信号変換を行う。メディア13は、画像信号、圧縮画像信号、音声信号、圧縮音声信号を書き込み/読み出しする。
シャッターキー14は、シャッターレリーズ動作を指示する。上下左右キー15は、ディスプレイ3に表示された項目を上下左右に移動して指示する。決定キー16は、ディスプレイ3に表示された項目を選択する指示を出す。メニューキー17は、ディスプレイ3に、メニュー項目の表示の開始と終了の指示を出す。モードキー18は、装置の状態を音声付きの動画モード、静止画モード、再生モードのいずれかに切り替える。音声付き動画モードでは、音声付き動画を記録する。静止画モードでは、静止画を記録する。再生モードでは、各モードで記録した、音声付き動画、静止画、静止画サムネイル、音声メモ、音声サムネイルを再生する。静止画サムネイルは、音声付き動画や静止画からよりサイズ・情報量を縮小した静止画を生成して簡易に表示させるものである。音声メモは、音声付き動画や静止画に対して、覚え書きを音声として記録したものである。音声サムネイルは、音データ中から音又は音声信号区間を抽出し、それを加工・編集したデータを生成して画像データに関連付けして再生可能に記録したものである。音声メモキー19は、音声付き動画や静止画に対して、覚え書き音声の記録開始・停止を指示する。20は、本発明を実現する記録再生装置全体を表している。
[音声信号を用いた音声サムネイルの作成方法]
図2は、母音、子音、無声区間の分布した音声信号を各区間毎に時間的に並べた模式図であり、Pa1〜Pa7は、音声信号の各区間を示すポインタである。母1〜母7は母音区間、子1〜子3は子音区間、無1〜無4は無声区間を表している。音声信号抽出開始ポイントの時間をST、音声信号抽出時間長をSTLとする。図3は、音声信号に対する、無声区間探索、発声開始探索、短時間音声信号区間内の発声区間割合検査の各処理を示すフローチャート、図4は、短時間音声信号の時間短縮のための加工・編集処理1を示すフローチャート、図5は、短時間音声信号の時間短縮のための加工・編集処理2を示すフローチャートである。
ここで、本実施形態による音声信号を用いた音声サムネイルの作成方法について説明する。
先ず、上記区間抽出部8aによって音データ中に存在する音声信号を抽出する処理について、図1〜図5を参照して説明する。
なお、音声信号の基本分析項目について下記のように記号を定める。
[音声信号の基本分析項目]
・パワー値=P
・パワー値Pの所定しきい値=PT
・パワー値Pが所定しきい値PTを超えた継続時間長=PGT
・PGTの所定しきい値=PGTT
・周期性値=R
・周期性値Rの所定しきい値=RT
・周期性値RがRTを超えた継続時間長=RGT
・RGTの所定しきい値=RGTT
・ゼロクロス値=Z
・ゼロクロス値Zの所定しきい値=ZT
・低域と高域のパワー比(低域パワー/高域パワー)=A
(低域は100〜900Hz、高域は3700〜5000Hz)
・パワー比Aの所定しきい値=AT
・STを起点として、パワー値Pが所定しきい値PTを超えた、のべ時間=PGTSUM・STを起点として、パワー値Pが所定しきい値PT未満だった、のべ時間=PLTSUM
・(PGTSUM/PLTSUM)値の所定しきい値=PGLR
・STを起点として、周期性値Rが所定しきい値RTを超えた、のべ時間=RGTSUM
・STを起点として、周期性値Rが所定しきい値RT未満だった、のべ時間=RLTSUM
・(RGTSUM/RLTSUM値)値の所定しきい値=RGLR
・STを起点として、パワー比Aが所定しきい値ATを超えた、のべ時間=AGTSUM
・STを起点として、パワー比Aが所定しきい値AT未満だった、のべ時間=ALTSUM
・(AGTSUM/ALTSUM)値の所定しきい値=AGLR
・一般的な子音の継続時間長=CT
更に、本実施形態における短時間で抽出する音声信号は、時間STを始点として、時間長STLの音声信号として、
・音声信号抽出開始ポイントの時間=ST
・音声信号抽出時間長=STL
と定める。
次に、信号処理部8による処理について概説する。
先ず、音データ中の音声信号が圧縮されていたら展開して音声信号の波形デジタル値に変換する。また、音データ中の音声信号が圧縮されていなかったら展開せずに音声信号の波形デジタル値を取り出す。そして、音声信号の波形デジタル値の先頭に音声信号の分析ポイントを定め、その分析ポイントから発声信号区間を抽出する。
具体的には、最初に無声区間を探索してから、その先の発声開始ポイントを探索して、当該ポイントを音声信号抽出開始ポイントの時間STに設定する。次に、STから音声信号抽出時間長STLの長さの音声信号中において、発声区間割合が所定割合以上であれば、そのSTL長の音声信号を発声信号区間として抽出する。
その後、この発声信号区間について、音声の性質によって信号区間を分けて時間的に圧縮する話速変換処理及び信号削除処理を実行することにより信号時間圧縮及び単位時間あたりの音声情報量を増加させる。この音声情報量を増加させた音声信号を、圧縮又は非圧縮の特定ファイル形式に変換し、画像データに関連付けしてメディア13に保存することで音声サムネイルとして利用される。
以上の処理を図1〜図3を用いて説明する。
最初に、音データ中の音声信号が圧縮されていたら、音及び音声信号の圧縮・展開部8dで展開して、音声信号の波形デジタル値に変換する。また、音データ中の音声信号が圧縮されていなかったら展開せずにこれらの波形デジタル値を取り出す。
その後、音声信号の波形デジタル値の先頭であるPa1ポイントに音声信号の分析ポイントを定め、区間抽出部8aによって無声区間探索PR1を開始する。PR1では、Sa3にて分析フレームを前方へ進めながら、Sa1でパワー値Pが所定しきい値PT未満であること、Sa2で周期性値Rが所定しきい値RT未満であることを判定する。
Sa1,Sa2の両方が成立すると、無声区間が探索できたとして区間抽出部8aによる発声開始探索PR2を開始する。PR2では、Sa4でパワー値が所定しきい値を超えた継続時間長PGTと、周期性値が所定しきい値を超えた継続時間長RGTをゼロに初期化する。そして、Sa7にて分析フレームを前方へ進めながら、Sa5でPGTが所定しきい値PGTTを超えたこと、Sa6でRGTが所定しきい値RGTTを超えたことを判定する。
Sa5,Sa6の両方が成立すると、発声開始が探索できたことになり、その発生開始ポイントを音声信号抽出開始ポイントの時間STとして、分析ポイントがPa3に移行する。ここで、発声先頭の子音が、音声信号抽出時間長STLの先頭から脱落することを防ぐために、Sa8では、音声信号抽出開始ポイントの時間ST(=Pa3)を、CTだけ前方にずらして、ST=ST−CT(=Pa2)とする。ここで、音声信号の分析ポイントはPa2に移行する。
Sa9では、音声信号抽出開始ポイントの時間ST(=Pa2)から音声信号抽出時間長STL時間長の音声信号を分析区間に設定する。次に、区間抽出部8aにより短時間音声信号区間STL内の発声区間割合検査PR3を開始する。PR3では、Sa10で、音声信号抽出開始ポイントの時間STを起点として、音信号パワーが所定しきい値を超えた信号時間割合が、所定割合以上、即ち(PGTSUM/PLTSUM)値が所定しきい値PGLRを超えたかどうかを判定する。
Sa11では、一番最初の判断であるときには、Sa12でSTを起点としてSTL時間長の信号を保存し、後に全ての分析信号区間に音声が存在しなかった場合には、STを起点としてSTL時間長の音声信号を用いて音声サムネイルを作成する。
Sa13では、音声信号抽出開始ポイントの時間STを起点として、音信号周期性値が所定しきい値を超えた信号時間割合が、所定割合以上、すなわち(RGTSUM/RLTSUM)が所定のしきい値RGLRを超えたか判定する。
Sa14は、実行の有無を問わないが、音声信号の低域と高域のパワー比が所定しきい値を超えた信号時間割合が、所定割合以上、即ち(AGTSUM/ALTSUM)値が、所定のしきい値AGLRを超えたかどうかを判定する。
Sa10及びSa13でYes、かつSa14を実行してYesならば、Sa16で、ST(=Pa2)を起点としてSTL時間長の音声信号を、発声信号区間として使用する短時間音声信号に決定する。
Sa10、Sa13、及びSa14のいずれかでNoならば、Sa15で、分析ポイントを時間後方Pa3へずらして、PR1、PR2、PR3を再度行い、音声信号抽出開始ポイントの時間ST=Pa5で、音声信号抽出時間長STLの音声信号を、発声信号区間として使用する短時間音声信号として決定できる。
また、Sa15の分析ポイントを時間的に後方へずらすことを繰り返して、音声信号の終端を超えてしまった場合には音声信号が存在しなかったとする。そして、区間抽出部8aで抽出された音データ中に音声信号が存在しなければ、図6及び図7で後述する発音信号区間を検索して抽出処理を開始する。これは、音データ中の音信号の先頭である図6のPb1ポイントに音信号の分析ポイントを定めて、図7の無音区間探索PR1を開始することを意味する。
Sa16まで処理が進み、発声信号区間として使用する短時間音声信号が決定できた場合には、図4のSb1に進み、STを起点としてSTL時間長の音声信号の編集を開始する。
PR4では、性質分析部8bと加工・編集部8cによって、STを起点としてSTL時間長の音声信号の時間短縮のための加工・編集を行う。そして、Sb13で終端フレームに達したかどうかを判定して、Sb14で加工・編集フレームを1つずつ進めながら、音声信号を編集・加工する。
Sb2では、パワー値Pが所定しきい値PTを超えているか判定する。
Sb3とSb8では、周期性値Rが所定しきい値RTを超えているか判定する。また、Sb3とSb8では、低域と高域のパワー比値Aが所定しきい値ATを越えているか判定して、周期性値Rと低域と高域のパワー比値Aの両者が同時にそれぞれの所定しきい値を超えているか判定してもよい。
Sb5とSb10では、ゼロクロス値Zが所定しきい値ZTを超えているか判定する。
Sb4では、母音区間と判断して圧縮率普通の話速変換で信号時間短縮を行う。
Sb6では、子音区間と判断して無変換とする。
Sb7では、大音圧の無声区間と判断して圧縮率普通の話速変換で信号時間短縮を行う。
Sb9では、小音圧の母音区間と判断して圧縮率普通の話速変換で信号時間短縮を行う。
Sb11では、小音圧の子音区間と判断して無変換とする。
Sb12では、小音圧無声区間と判断して削除又は圧縮率極大の話速変換で信号時間短縮を行う。
そして、Sb13で終端フレームに達したらPR4を終了し、Sb15でST(=図2ではPa2又はPa5)を起点としてSTL時間長の音声信号の編集を終了して、編集後の短時間音声信号を得る。この編集後の短時間音声信号を、Sb16で、圧縮・展開部8dによって圧縮又は非圧縮の特定ファイル形式に変換し、画像データに関連付けて保存することで音声サムネイルとして利用する。
また、音声信号の時間短縮のための加工・編集を行うPR4の内容を、図5のPR4mのように変更して、全てのフレームの音声信号に対して圧縮率普通の話速変換を行ってもよい。この場合、Sb13mで終端フレームに達したか判定しながら、Sb14mで編集・加工フレームを1つずつ進めて、Sb4mで圧縮率普通の話速変換で信号時間短縮を行う。そして、Sb13mで終端フレームに達したらPR4mを終了し、Sb15でST(=図2ではPa2又はPa5)を起点としてSTL時間長の音声信号編集終了して、編集後の短時間音声信号を得る。この編集後の短時間音声信号を、Sb16で、圧縮・展開部8dによって圧縮又は非圧縮の特定ファイル形式に変換し、画像データに関連付けて保存して音声サムネイルとして利用する。
その後、区間抽出部8aにおいて、図1〜図5で述べた処理を行った結果、図3の分析開始ポイントを時間後方へずらすSa15を繰り返して、音声サムネイルを抽出するために用いる音データの終端を超えてしまった場合には、音データ中に音声が存在しないと判断して音声以外の音を抽出する。
[音信号を用いた音声サムネイルの作成方法]
次に、上記音声以外の音を用いて音声サムネイルを作成する方法について、図1、図6〜9を用いて説明する。
図6は、有音、無音区間の分布した音信号を各区間毎に時間的に並べた模式図であり、Pb1〜Pb7は、音信号のある区間を示すポインタである。有1〜有10は有音区間、無5〜無8は無音区間を表している。音信号抽出開始ポイントの時間をST、音信号抽出時間長をSTLとする。図7は、音信号に対する、無音区間探索、発音開始探索、短時間音信号区間内の発音区間割合検査の各処理を示すフローチャート、図8は、短時間音信号の時間短縮のための加工・編集処理1を示すフローチャート、図9は、短時間音信号の時間短縮のための加工・編集処理2を示すフローチャートである。
先ず、信号処理部8による処理について概説する。
最初に、前述した図3のSa12で、音信号抽出時間長STL分の音信号が保存されていたら、その音信号を用いて、下記の処理Aを行う。また、図3のSa12で、音信号抽出時間長STL分の音信号が保存されていなかった場合には、最初に、音データ中の音信号が圧縮されていたら展開して音信号の波形デジタル値に変換し、圧縮されていなかったら、展開を行わずに音信号の波形デジタル値を取り出す。
次に、音信号の波形デジタル値の先頭に音信号の分析ポイントを定めて、分析ポイントを進めながら、発音信号区間を抽出する。これは、最初に無音区間を探索し、その先の発音開始ポイントを探索し、そのポイントを音信号抽出開始ポイントの時間STとし、STから音信号抽出時間長STLの長さの音信号中に、発音区間割合が所定割合以上であれば、そのSTL長の音信号を発音信号区間として抽出する。
次に、上記処理Aとして、この発音信号区間について、音の性質によって信号区間を分けて時間的に圧縮する話速変換処理及び信号削除処理を実行することにより信号時間圧縮及び単位時間あたりの音情報量を増加させる。この音情報量を増加させた音信号を、圧縮又は非圧縮の特定ファイル形式に変換し、画像データに関連付けしてメディア13に保存することで音声サムネイルとして利用される。
以上の処理を図1、図6、図7を用いて説明する。
最初に、前述した図3のSa12で、音信号抽出時間長STL分の音信号が保存されていたら、その音信号を用いて、図8のPR8で、短時間音信号の時間短縮のための加工・編集以降の処理を行う。また、図3のSa12で、音信号抽出時間長STL分の音信号が保存されていなかった場合には、最初に音データ中の音信号が圧縮されていたら、圧縮・展開部8dで展開して音信号の波形デジタル値に変換し、圧縮されていなかったら、展開を行わずに音信号の波形デジタル値を取り出す。そして、その音信号の波形デジタル値の先頭に音信号の分析ポイントを定めて、分析ポイントを進めながら発音信号区間を抽出する。
ここでは、Pb1に音信号の分析ポイントを定めて、区間抽出部8aによる無音区間探索PR5を開始する。PR5では、Sc2にて、分析フレームを前方へ進めながら、Sc1でパワー値Pが所定しきい値PT未満であることを判定する。Sc1でYesの判定であれば、無音区間が探索できたとして、区間抽出部8aによる発音開始探索PR6を開始する。
PR6では、Sc3でパワー値が所定しきい値を超えた継続時間長PGTをゼロに初期化する。Sc5にて分析フレームを前方へ進めながら、Sc4でパワー値が所定しきい値を超えた継続時間長PGTが所定しきい値PGTTを超えかを判定する。Sc4でYesの判定であれば、発音開始区間が探索できたことになる。
Sc6では、音信号抽出開始ポイントの時間ST(=Pb2)から音信号抽出時間長STL時間長の音信号を分析区間に設定する。次に、区間抽出部8aによる短時間音信号区間STL内の発音区間割合検査PR7を開始する。PR7では、Sc7で(PGTSUM/PLTSUM)値が所定しきい値PGLRを超えたかどうかを判定する。
Sc7でYesの判定ならば、Sc9で、ST(=Pb2)を起点としてSTL時間長の音信号を、発音信号区間として使用する短時間音声信号に決定する。また、Sc7でNoの判定ならば、Sc8で分析ポイントを時間後方Pb3へずらして、PR5,PR6,PR7を再度行ない、音信号抽出開始ポイントの時間ST(=Pb5)で、音信号抽出時間長STLの音信号が、発音信号区間として使用する短時間音信号に決定できる。
そして、図8のSd1で、STを起点としてSTL時間長の音信号の編集を開始する。PR8では、性質分析部8bと加工・編集部8cによって、短時間音信号の時間短縮のための加工・編集を行う。
Sd5では終端フレームに達したか判定し、Sd6で加工・編集フレームを1つずつ進めながら、音信号を編集・加工する。Sd2では、パワー値Pが所定しきい値PTを超えているか判定する。Sd3では、大音圧音及び普通音圧音区間と判断して、圧縮率普通の話速変換で信号時間短縮を行う。Sd4では、小音圧音及び無音区間と判断して、削除又は圧縮率極大の話速変換で信号時間短縮を行う。そして、Sd5で終端フレームに達したら、PR8を終了し、Sd7でST(=図6ではPb2又はPb5)を起点としてSTL時間長の音信号の編集を終了し、編集後の短時間音信号を得る。この編集後の短時間音信号を、Sd8で、圧縮・展開部8dにて、圧縮又は非圧縮の特定ファイル形式に変換し、画像データに関連付けて保存して音声サムネイルとして利用する。
また、上記PR8での処理を図9のPR8mのように変更して、全てのフレームの音信号に対して、圧縮率普通の話速変換を行ってもよい。この場合、Sd5mで終端フレームに達したか判定しながら、Sd6mで編集・加工フレームを1つずつ進めて、Sd3mで圧縮率普通の話速変換で信号時間短縮を行う。そして、Sd5mで終端フレームに達したら、PR8mを終了して、Sd7でST(=図6ではPb2又はPb5)を起点としてSTL時間長の音信号の編集を終了して、編集後の短時間音信号を得る。この編集後の短時間音信号を、Sd8で、圧縮・展開部8dにて、圧縮又は非圧縮の特定ファイル形式に変換し、画像データに関連付けて保存して音声サムネイルとして利用する。
次に、本実施形態の音声サムネイルの記録動作について、音声付き動画の撮影中に音声付き動画の音声部分から音声サムネイルを抽出して行う場合を例にして説明する。
図1において、最初に、モードキー18で音声付き動画モードを選択して、音声付き動画の撮影中に、音声付き動画と、それに付随する静止画サムネイルと、音声付き動画の音声部分の音信号から音声サムネイルを作成して、特定ファイル形式に変換して、メディア13に記録する。このとき、音声付き動画と、それに付随する静止画サムネイルと、作成される音声サムネイルを圧縮する場合は、画像処理部8eや圧縮・展開部8dにて圧縮し、インターフェース(I/F)12を介してメディア13に記録する。この記録された音声サムネイルを、画像データに関連付けて音声サムネイルとする。
上記音声サムネイルの記録動作において、音声付き動画の撮影後に記録された音声付き動画の音声部分から音声サムネイルを抽出してもよい。
また、上記音声サムネイルの記録動作において、音声メモ録音中に音声メモ信号から音声サムネイルを抽出してもよい。
また、上記音声サムネイルの記録動作において、音声メモ録音後に記録された音声メモから音声サムネイルを抽出してもよい。
[音声サムネイルの記録再生動作]
次に、本実施形態の音声サムネイルの記録再生動作について図10と図11を用いて説明する。
なお、図10のメディア13aは図1のメディア13、図10のディスプレイ3aは図1のディスプレイ3、図10の上下左右キーと決定キー21は図1の上下左右キー15と決定キー16、図10の15b、15d、15c、15aは図1の上下左右キー15の上キー、下キー、左キー、右キーにそれぞれ対応している。
また、図10の16aは図1の決定キー16、ディスプレイ3a上の画像サムネイル表示項目G1、G2、G3、G4、G5は、それぞれメディア13a内のデータD1、D2、D3、D4、D5に関連付けられている。D1の中には、音声付き動画ファイル又は静止画ファイルF1、静止画サムネイルファイルF2、音声メモファイルF3、音声サムネイルファイルF4が含まれる。音声メモファイルF3は、ユーザーが記録しなければ無い場合もある。音声サムネイルファイルF4の内容は、音声付き動画ファイルF1の音声部分から抽出しても、音声メモファイルF3から抽出しても良い。ファイルF1、F2、F3、F4は、全てを1つのファイルにまとめても、いくつかのファイルに分割しても良い。データD2、D3、D4、D5の中にも同様に、音声付き動画ファイル又は静止画ファイル、静止画サムネイルファイル、音声メモファイル、音声サムネイルファイルが含まれる。
さて、図11において、Se1で動作をスタートすると、Se2において、例えば、ユーザーがモードキー18を再生モードに設定することで、CPU9は、記録再生装置20を再生モードで動作させる。Se3では、メディア13aに記録されたデータD1、D2、D3、D4、D5のそれぞれに関連付けられた静止画サムネイルG1、G2、G3、G4、G5がディスプレイ3aに表示される。
Se4では、データD1とそれを代表する静止画サムネイルG1が選択され、G1に選択表示枠が表示される。
Se5では、メディア13a内の選択されたデータD1の中の、音声サムネイルファイルF4の音信号が、インターフェース(I/F)12と信号処理部8を介してオーディオ出力部6でアナログ音信号に変換されて、スピーカ7から音又は音声として出力される。このとき、音信号が圧縮されていれば、信号処理部8の圧縮・展開部8dによって展開される。
Se6で上下左右キー15b、15d、15c、15a以外が操作された場合には、Se9にて音声サムネイル出力を終了する。ここで、上下左右キーの代わりに、決定キー16aが操作された場合は、音声サムネイルを出力せず、音データが付随した画像データの、音データと画像データをそのまま再生する。
また、Se6で上下左右キー15b、15d、15c、15aが操作された場合には、ステップSe6にて、静止画サムネイルの選択が他の静止画サムネイルへ移動する。
Se8では、移動直後に選択されたデータの中の音声サムネイルファイルの音信号が、インターフェース(I/F)12と信号処理部8を介してオーディオ出力部6でアナログ音信号に変換されて、スピーカ7から音又は音声として出力される。このとき、音信号が圧縮されていれば、信号処理部8の圧縮・展開部8dによって展開される。その後、Se6にリターンして処理を行う。
[他の実施形態]
以上、本発明に係る実施形態について具体例を用いて詳述したが、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体(記録媒体)等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図示の各フローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体(記憶媒体)としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現される。
[効果の説明]
上記実施形態によれば、音データ中の音又は音声信号から、音又は音声信号区間を抽出して音声サムネイルを生成し画像データに関連付けて保存するため、音声サムネイルを画像データと同時に利用できるようになる。
また、画像データは画像サムネイルを含み、画像データに関連付けられた音声サムネイルを画像データ選択時に再生するので、画像サムネイルの選択時に音声サムネイルをすぐに聞けるようになる。その結果、ユーザは、画像サムネイルによって画像データ全体を瞬時に把握できることに加えて、音声サムネイルを聞くことによる補助が受けられるようになり、データの中身を把握しやすくなる。
また、区間抽出部では、音データ中に音声信号が存在すれば音声信号を抽出し、音声信号が存在しなければ音信号を抽出することにより、音データ中に音声信号が存在しないときにも音声サムネイルを作成して利用できるようにできる。
また、区間抽出部は、発声信号区間を探索して音声信号を抽出するので、より音声情報量の多い信号区間を用いて音声サムネイルを作成できるようになり、音声サムネイル再生時の音声による認識効果を向上できる。
また、区間抽出部で発声信号区間の探索し、更に発声信号区間を性質によって分析して時間圧縮する話速変換処理及び信号削除処理を実行するので、発声信号区間を、信号を聞き分ける了解度を低下させずに、信号時間圧縮及び単位時間あたりの音声情報量を増加させることができるようになる。この結果、発声信号区間の情報量を保存したまま、信号を短く、また、データ量を減少させることができる。そして、このような発声信号区間を利用して音声サムネイルを作成することで、より短時間にユーザに同じ音声を伝達できる。更に、より少ない情報量でユーザに同じ音声を伝達できる。また、上記時間圧縮に話速変換処理を利用することにより、信号時間圧縮のために音声の速さだけが変わり、音声の音の高さは変わらないため、話速変換処理を用いて時間圧縮した音声は違和感が少ない。
また、発声信号区間の分析は、音又は音声信号の、パワー、周期性、波形のゼロクロス、低域高域のパワー比のいずれか1つ又は2つ以上を利用することにより、処理量の少ない手法で音声の性質を分析できる。
また、区間抽出部は、発音信号区間を探索音信号を抽出するので、より音情報量の多い信号区間を用いて音声サムネイルを作成できるようになり、音声サムネイル再生時の音による認識効果を向上できる。
また、区間抽出部で発音信号区間を探索し、更に発音信号区間を性質によって分析して、時間圧縮する話速変換処理及び信号削除処理を実行するので、発音信号区間を、信号を聞き分ける了解度を低下させずに、信号時間圧縮及び単位時間あたりの音情報量を増加させることができるようになる。この結果、発音信号区間の情報量を保存したまま、信号を短く、また、データ量を減少させることができる。そして、このような発音信号区間を利用して音声サムネイルを作成することで、より短時間にユーザに同じ音を伝達できる。更に、より少ない情報量で、ユーザに同じ音を伝達できる。また、上記時間圧縮に話速変換処理を利用することにより、信号時間圧縮のために音の速さだけが変わり、音の高さは変わらないため、話速変換処理を用いて時間圧縮した音は違和感が少ない。
また、発音信号区間の分析は、音信号のパワーを利用することにより、処理量の少ない手法で音の性質を分析できる。
また、音データが付随した画像データを、音声メモデータの付随した静止画データにすると、記録再生装置の代表例であるデジタルカメラにおける、圧縮又は非圧縮の音声メモデータと、JPEG等の静止画データに利用することもできる。
また、音データが付随した画像データを、音声付き動画データにすると、上記デジタルカメラやデジタルビデオにおける、MPEGやH.264等の音声付き動画データに利用することもできる。
更に、音データが付随した画像データを、音声メモデータの付随した音声付き動画データにすると、上記デジタルカメラやデジタルビデオにおける、圧縮又は非圧縮の音声メモデータと、MPEGやH.264等の音声付き動画データに利用することもできる。
本発明に係る実施形態の記録再生装置のブロック図である。 母音、子音、無声区間の分布した音声信号を各区間毎に時間的に並べた模式図である。 音声信号に対する、無声区間探索、発声開始探索、短時間音声信号区間内の発声区間割合検査の各処理を示すフローチャートである。 短時間音声信号の時間短縮のための加工・編集処理1を示すフローチャートである。 短時間音声信号の時間短縮のための加工・編集処理2を示すフローチャートである。 有音、無音区間の分布した音信号を各区間毎に時間的に並べた模式図である。 音信号に対する、無音区間探索、発音開始探索、短時間音信号区間内の発音区間割合検査の各処理を示すフローチャートである。 短時間音信号の時間短縮のための加工・編集処理1を示すフローチャートである。 短時間音信号の時間短縮のための加工・編集処理2を示すフローチャートである。 音声付き動画ファイル及び静止画ファイルに音声サムネイルを関連付けして記録する動作を説明するブロック図である。 音声サムネイルの再生動作を示すフローチャートである。
符号の説明
1 レンズ
2 撮像部
3,3a ディスプレイ
4 マイク
5 オーディオ入力部
6 オーディオ出力部
7 スピーカ
8 信号処理部
9 CPU
10 RAM
11 ROM
12 インターフェース
13,13a メディア
14 シャッターキー
15 上下左右キー
15a 右キー
15b 上キー
15c 左キー
15d 下キー
16,16a 決定キー
17 メニューキー
18 モードキー
19 音声メモキー
20 記録再生装置
21 上下左右キー及び決定キー

Claims (23)

  1. 音データが付随した画像データの記録再生装置であって、
    音データから所定の音又は音声信号を抽出する抽出手段と、
    前記所定の音又は音声信号を画像データに関連付けて記録する記録手段とを具備することを特徴とする記録再生装置。
  2. 前記画像データは縮小画像を含み、当該縮小画像の選択時に前記所定の音又は音声信号を再生する再生手段を更に備えることを特徴とする請求項1に記載の記録再生装置。
  3. 前記抽出手段は、音データ中に音声が存在する場合には音声信号を抽出し、音声が存在しなければ音声以外の音信号を抽出することを特徴とする請求項1又は2に記載の記録再生装置。
  4. 前記抽出手段は、前記音データから発声信号区間を探索して音声信号を抽出することを特徴とする請求項3に記載の記録再生装置。
  5. 前記発声信号区間の音声信号を分析する手段と、
    前記分析手段による分析結果に基づいて、音声信号を時間圧縮するための話速変換処理及び信号削除処理を行う手段とを更に備えることを特徴とする請求項4に記載の記録再生装置。
  6. 前記分析手段は、音声信号の、パワー、周期性、波形のゼロクロス、低域高域のパワー比の少なくとも1つを分析することを特徴とする請求項5に記載の記録再生装置。
  7. 前記抽出手段は、前記音データから発音信号区間を探索して音信号を抽出することを特徴とする請求項3に記載の記録再生装置。
  8. 前記発音信号区間の音信号を分析する手段と、
    前記分析手段による分析結果に基づいて、音信号を時間圧縮するための話速変換処理及び信号削除処理を行う手段とを更に備えることを特徴とする請求項7に記載の記録再生装置。
  9. 前記分析手段は、音信号のパワーを分析することを特徴とする請求項8に記載の記録再生装置。
  10. 前記音データが付随した画像データは、音声メモデータの付随した静止画データであることを特徴とする請求項1乃至9のいずれか1項に記載の記録再生装置。
  11. 前記音データが付随した画像データは、音声付き動画データであることを特徴とする請求項1乃至9のいずれか1項に記載の記録再生装置。
  12. 前記音データが付随した画像データは、音声メモデータの付随した音声付き動画データであることを特徴とする請求項1乃至9のいずれか1項に記載の記録再生装置。
  13. 音データが付随した画像データの記録再生方法であって、
    音データから所定の音又は音声信号を抽出する抽出工程と、
    前記所定の音又は音声信号を画像データに関連付けて記録する記録工程とを備えることを特徴とする方法。
  14. 前記画像データは縮小画像を含み、当該縮小画像の選択時に前記所定の音又は音声信号を再生する再生工程を更に備えることを特徴とする請求項13に記載の方法。
  15. 前記抽出工程では、音データ中に音声が存在する場合には音声信号を抽出し、音声が存在しなければ音声以外の音信号を抽出することを特徴とする請求項13又は14に記載の方法。
  16. 前記抽出工程では、前記音データから発声信号区間を探索して音声信号を抽出することを特徴とする請求項15に記載の方法。
  17. 前記発声信号区間の音声信号を分析する工程と、
    前記分析工程による分析結果に基づいて、音声信号を時間圧縮するための話速変換処理及び信号削除処理を行う工程とを更に備えることを特徴とする請求項16に記載の方法。
  18. 前記分析工程では、音声信号の、パワー、周期性、波形のゼロクロス、低域高域のパワー比の少なくとも1つを分析することを特徴とする請求項17に記載の方法。
  19. 前記抽出工程では、前記音データから発音信号区間を探索して音信号を抽出することを特徴とする請求項15に記載の方法。
  20. 前記発音信号区間の音信号を分析する工程と、
    前記分析工程による分析結果に基づいて、音信号を時間圧縮するための話速変換処理及び信号削除処理を行う工程とを更に備えることを特徴とする請求項19に記載の方法。
  21. 前記分析工程では、音信号のパワーを分析することを特徴とする請求項20に記載の方法。
  22. 請求項13乃至21のいずれか1項に記載の記録再生方法をコンピュータに実行させるためのプログラム。
  23. 請求項22に記載のプログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2005137894A 2005-05-10 2005-05-10 記録再生装置及び記録再生方法 Expired - Fee Related JP4533234B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005137894A JP4533234B2 (ja) 2005-05-10 2005-05-10 記録再生装置及び記録再生方法
US11/408,281 US8538244B2 (en) 2005-05-10 2006-04-20 Recording/reproduction apparatus and recording/reproduction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005137894A JP4533234B2 (ja) 2005-05-10 2005-05-10 記録再生装置及び記録再生方法

Publications (3)

Publication Number Publication Date
JP2006319483A true JP2006319483A (ja) 2006-11-24
JP2006319483A5 JP2006319483A5 (ja) 2008-06-19
JP4533234B2 JP4533234B2 (ja) 2010-09-01

Family

ID=37539781

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005137894A Expired - Fee Related JP4533234B2 (ja) 2005-05-10 2005-05-10 記録再生装置及び記録再生方法

Country Status (2)

Country Link
US (1) US8538244B2 (ja)
JP (1) JP4533234B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008158788A (ja) * 2006-12-22 2008-07-10 Fujifilm Corp 情報処理装置および情報処理方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100026816A1 (en) * 2008-07-30 2010-02-04 Jonathan Bergstrom Wireless data capture and sharing system, such as image capture and sharing of digital camera images via a wireless cellular network
US8392957B2 (en) * 2009-05-01 2013-03-05 T-Mobile Usa, Inc. Automatic content tagging, such as tagging digital images via a wireless cellular network using metadata and facial recognition
KR102081347B1 (ko) * 2013-03-21 2020-02-26 삼성전자주식회사 라이브 픽쳐 파일 생성 및 재생 장치, 방법 및 컴퓨터 판독 가능한 기록 매체
CN106375681A (zh) * 2016-09-29 2017-02-01 维沃移动通信有限公司 一种动静结合影像的生成方法和移动终端

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08307827A (ja) * 1995-05-09 1996-11-22 Sanyo Electric Co Ltd ビデオテープレコーダ
JP2004356982A (ja) * 2003-05-29 2004-12-16 Fuji Photo Film Co Ltd カメラ
JP2004363924A (ja) * 2003-06-04 2004-12-24 Hitachi Ltd 記録再生装置及びその制御方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3162945B2 (ja) 1995-04-20 2001-05-08 三洋電機株式会社 ビデオテープレコーダ
JP3434195B2 (ja) 1998-03-18 2003-08-04 日本電信電話株式会社 音楽映像管理方法、装置および音楽映像管理プログラムを記録した記録媒体
US7212972B2 (en) * 1999-12-08 2007-05-01 Ddi Corporation Audio features description method and audio video features description collection construction method
JP2001298711A (ja) 2000-04-17 2001-10-26 Sony Corp 画像記録再生装置および方法、並びに記録媒体
JP2003288096A (ja) 2002-03-27 2003-10-10 Nippon Telegr & Teleph Corp <Ntt> コンテンツ情報配信方法、コンテンツ情報配信装置、コンテンツ情報配信プログラム
JP2003111011A (ja) 2001-09-28 2003-04-11 Matsushita Electric Ind Co Ltd 動画検索装置
JP2003348530A (ja) 2002-05-23 2003-12-05 Nikon Corp 画像取扱い装置、電子カメラおよび画像取扱い処理用プログラム
JP2005101859A (ja) 2003-09-24 2005-04-14 Sony Corp テレビジョン受像機、番組表提示プログラムおよび番組表提示方法
JP2005117077A (ja) 2003-10-02 2005-04-28 Konica Minolta Photo Imaging Inc 携帯電子機器およびデータ再生方法
US7509255B2 (en) * 2003-10-03 2009-03-24 Victor Company Of Japan, Limited Apparatuses for adaptively controlling processing of speech signal and adaptively communicating speech in accordance with conditions of transmitting apparatus side and radio wave and methods thereof

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08307827A (ja) * 1995-05-09 1996-11-22 Sanyo Electric Co Ltd ビデオテープレコーダ
JP2004356982A (ja) * 2003-05-29 2004-12-16 Fuji Photo Film Co Ltd カメラ
JP2004363924A (ja) * 2003-06-04 2004-12-24 Hitachi Ltd 記録再生装置及びその制御方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008158788A (ja) * 2006-12-22 2008-07-10 Fujifilm Corp 情報処理装置および情報処理方法

Also Published As

Publication number Publication date
US20070061133A1 (en) 2007-03-15
US8538244B2 (en) 2013-09-17
JP4533234B2 (ja) 2010-09-01

Similar Documents

Publication Publication Date Title
JP4250301B2 (ja) 映像シーケンスを編集する方法及びシステム
JP4098420B2 (ja) 音響データ・動画データの同期再構築方法及び装置
EP1341155A3 (en) Information processing apparatus and method with speech synthesis function
JP5144424B2 (ja) 撮像装置及び情報処理方法
JP4533234B2 (ja) 記録再生装置及び記録再生方法
JP2009157272A (ja) 音声再生装置
US9666211B2 (en) Information processing apparatus, information processing method, display control apparatus, and display control method
JP2008153795A (ja) 動画撮影装置、動画再生制御方法、及び動画再生制御プログラム
JP2006221714A (ja) 符号化ディジタルオーディオ再生装置
JP6589838B2 (ja) 動画像編集装置及び動画像編集方法
JP2006166407A (ja) 撮像装置及びその制御方法
JP2005326811A (ja) 音声合成装置および音声合成方法
JP2005033714A (ja) 情報信号再生装置および情報信号再生方法並びに情報信号処理装置及び情報信号処理方法
KR20070042000A (ko) 동영상 스트림의 챕터 별 제목 설정 방법 및 장치
JP2006261957A (ja) 撮影装置
JP5045597B2 (ja) 編集装置および編集方法、並びにプログラム
JP2009118117A (ja) スライドショー作成システム及びスライドショー作成方法並びにスライドショー作成プログラム
KR100383194B1 (ko) 미디어 파일 재생 방법
JP2007279241A (ja) 復号処理装置
JP2007078985A (ja) データ検索装置及びその制御方法
JP4563418B2 (ja) 音声処理装置、音声処理方法、ならびに、プログラム
JP4665550B2 (ja) 再生装置および再生方法
JP5471138B2 (ja) 音素符号変換装置および音声合成装置
JP2007036945A (ja) 情報再生装置、情報記録媒体、及び情報再生プログラム
JP2005204003A (ja) 連続メディアデータ高速再生方法、複合メディアデータ高速再生方法、多チャンネル連続メディアデータ高速再生方法、映像データ高速再生方法、連続メディアデータ高速再生装置、複合メディアデータ高速再生装置、多チャンネル連続メディアデータ高速再生装置、映像データ高速再生装置、プログラム、および、記録媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080507

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080507

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100607

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100611

R150 Certificate of patent or registration of utility model

Ref document number: 4533234

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130618

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees