JP2007266661A - 撮像装置、情報処理装置、撮像表示システム - Google Patents

撮像装置、情報処理装置、撮像表示システム Download PDF

Info

Publication number
JP2007266661A
JP2007266661A JP2006084956A JP2006084956A JP2007266661A JP 2007266661 A JP2007266661 A JP 2007266661A JP 2006084956 A JP2006084956 A JP 2006084956A JP 2006084956 A JP2006084956 A JP 2006084956A JP 2007266661 A JP2007266661 A JP 2007266661A
Authority
JP
Japan
Prior art keywords
thumbnail
image
sound
imaging
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006084956A
Other languages
English (en)
Inventor
Hiroaki Yoshida
博明 吉田
Yukio Mori
幸夫 森
Yasuhachi Hamamoto
安八 浜本
Seiji Okada
誠司 岡田
Satoru Takeuchi
悟 竹内
Masahiro Yokohata
正大 横畠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2006084956A priority Critical patent/JP2007266661A/ja
Publication of JP2007266661A publication Critical patent/JP2007266661A/ja
Pending legal-status Critical Current

Links

Abstract

【課題】所望の動画ファイルの選定の容易化が図られた撮像装置を提供することを目的とする。
【解決手段】動画撮影時に撮影者が発声したサムネイル用音声から、テキスト変換を介して、サムネイル文字列を生成し、それをサムネイル画像に関連付けて記録する。そして、サムネイル画像を表示する際、サムネイル画像と併せてサムネイル文字列を表示する。また、サムネイル用音声の信号成分を、撮影時の周辺音を表す音声信号から除去し、除去後の音声信号を最終的な音声信号として映像信号と共にメモリカードに記録する。
【選択図】図7

Description

本発明は、デジタルスチルカメラやデジタルビデオカメラ等の撮像装置に関し、特に動画用のサムネイルの作成技術に関する。また、本発明は、撮像装置を利用した情報処理装置及び撮像表示システムに関する。
デジタルビデオカメラ等の撮像装置には、サムネイル画像を表示するモードが設けられていることが多い。動画用のサムネイル画像は、通常、動画の録画開始時または録画終了時など、適当なタイミングで生成される(例えば、下記特許文献1参照)。この種の撮像装置は、例えば下記特許文献1に開示されている。ユーザは、このサムネイル画像を頼りに、録画した複数の動画の内から再生しようとする動画を選び出す。
尚、下記特許文献2(例えば段落62)には、マイクに向かって発声したシーン番号等を表す音声より、動画ファイルのファイル名を生成する手法が開示されている。
特開平10−28250号公報 特開2003−37770号公報
上記のように、従来の動画用のサムネイル画像は、撮影した動画の内容と関係なく、適当なタイミングにおける画像を基に生成される。このため、従来の撮像装置において、サムネイル画像は撮影した動画の特徴を表していないことが多く、所望の動画ファイルを効率的に選択して再生することが困難である、という問題があった。
尚、上記特許文献2に記載の技術は、動画ファイルのファイル名の生成手法に関する技術であり、サムネイル画像に関与する上記のような問題を解決する技術ではない。
そこで本発明は、所望の動画ファイルの選定の容易化が図られた撮像装置並びに該撮像装置を利用した情報処理装置及び撮像表示システムを提供することを目的とする。
上記の目的を達成するために本発明に係る撮像装置は、被写体に応じた撮像信号を出力する撮像手段と、動画を撮影した際、前記撮像信号に基づいて該動画に対応するサムネイル画像を生成するサムネイル画像生成手段と、前記サムネイル画像を表示可能な表示手段と、を備えた撮像装置において、外部からサムネイル用音声の入力を受ける音入力手段と、前記動画の撮影に対応して入力された前記サムネイル用音声からサムネイル文字列を生成するサムネイル文字列生成手段と、を備え、前記表示手段は、前記サムネイル画像を表示する際、表示した前記サムネイル画像に対応する前記サムネイル文字列も表示することを特徴とする。
サムネイル画像を表示する際、入力されたサムネイル用音声に応じたサムネイル文字列も表示することにより、所望の動画ファイルの選定の容易化が図られる。
尚、サムネイル画像がカーソル等によって選択されている場合にのみ対応するサムネイル文字列を表示するか、或いは、サムネイル画像がカーソル等によって選択されているか否かに拘らず対応するサムネイル文字列を表示するか、は任意である。
例えば、前記表示手段は、前記サムネイル画像を表示する際、外部からの操作に応じて、表示した前記サムネイル画像に対応する前記サムネイル文字列も表示する。
また例えば、前記サムネイル用音声は、外部から所定の操作を受けたときに前記音入力手段を介して入力された音声である。
また例えば、上記撮像装置は、前記音入力手段を介して入力された音声の話者と、予め登録された登録話者と、の一致または不一致を判断する話者認識手段を備え、前記サムネイル用音声は、前記登録話者に一致すると判断された話者が前記音入力手段を介して入力した音声である。
また例えば、上記撮像装置は、当該撮像装置の周辺音に応じた音声信号を前記動画を表す映像信号と共に記録する記録手段と、前記サムネイル用音声の信号成分を、前記記録手段に記録されるべき前記音声信号から除去する音声除去手段と、を更に備えている。
これにより、サムネイル文字列を形成するために発したサムネイル用音声が記録されるべき周辺音に混入してしまうことを嫌うユーザに対して、便宜が図られる。
また例えば、前記サムネイル画像生成手段は、前記サムネイル文字列の生成の基となる前記サムネイル用音声が入力されたタイミングを基準とした所定タイミングにおける前記撮像信号を用いて、前記サムネイル画像を生成する。
動画の特徴を表現しようとしてユーザはサムネイル用音声を発する。従って、この発声タイミングにおける撮影画像及びそれに対応するサムネイル画像は、動画の特徴を良く表した画像またはユーザにとって印象の深い画像となることが多い。このため、上記のように構成することにより、サムネイル画像を頼りとした、所望の動画ファイルの選定の容易化がより一層図られる。
また上記の目的を達成するために本発明に係る情報処理装置は、被写体に応じた撮像信号を出力する撮像手段と、動画を撮影した際、前記撮像信号に基づいて該動画に対応するサムネイル画像を生成するサムネイル画像生成手段と、外部からサムネイル用音声の入力を受ける音入力手段と、前記動画の撮影に対応して入力された前記サムネイル用音声からサムネイル文字列を生成するサムネイル文字列生成手段と、を備えた撮像装置にて生成された、前記サムネイル画像を表す情報及び前記サムネイル文字列を表す情報の供給を受ける入力手段と、前記入力手段を介して与えられた前記情報に基づいた表示を行う表示手段と、を備えた情報処理装置であって、前記表示手段は、前記サムネイル画像を表示する際、表示した前記サムネイル画像に対応する前記サムネイル文字列も表示することを特徴とする。
サムネイル画像を表示する際、入力されたサムネイル用音声に応じたサムネイル文字列も表示することにより、所望の動画ファイルの選定の容易化が図られる。
尚、サムネイル画像がカーソル等によって選択されている場合にのみ対応するサムネイル文字列を表示するか、或いは、サムネイル画像がカーソル等によって選択されているか否かに拘らず対応するサムネイル文字列を表示するか、は任意である。
例えば、上記情報処理装置において、前記表示手段は、前記サムネイル画像を表示する際、外部からの操作に応じて、表示した前記サムネイル画像に対応する前記サムネイル文字列も表示する。
また上記の目的を達成するために本発明に係る撮像表示システムは、上記撮像装置と上記情報処理装置とを備えている。
上述した通り、本発明によれば、所望の動画ファイルの選定の容易化が図られる。
以下、本発明の実施の形態につき、図面を参照して具体的に説明する。参照される各図において、同一の部分には同一の符号を付す。
後に、第1、第2及び第3実施例を説明するが、まず、それらの全てに共通する内容を、図1〜図3を参照して説明する。
図1は、本発明の実施の形態に係る撮像装置1の全体ブロック図である。撮像装置1は、例えば、デジタルスチルカメラやデジタルビデオカメラである。撮像装置1は、動画及び静止画を撮影可能となっていると共に、動画撮影中に静止画を同時に撮影することも可能となっている。
撮像装置1は、撮像部11と、AFE(Analog Front End)12と、映像信号処理部13と、主マイク14aと、副マイク14bと、音声信号処理部15と、圧縮処理部16と、内部メモリの一例としてのSDRAM(Synchronous Dynamic Random Access Memory)17と、メモリカード18と、伸張処理部19と、映像出力回路(ビデオ出力回路)20と、音声出力回路21と、TG(タイミングジェネレータ)22と、CPU(Central Processing Unit)23と、バス24と、バス25と、操作部26と、表示部27と、スピーカ28と、を備えている。操作部26は、録画ボタン26a、シャッタボタン26b及び操作キー26c等を有している。
バス24には、撮像部11、AFE12、映像信号処理部13、音声信号処理部15、圧縮処理部16、伸張処理部19、映像出力回路20、音声出力回路21及びCPU23が接続されている。バス24に接続された各部位は、バス24を介して、各種の信号(データ)のやり取りを行う。
バス25には、映像信号処理部13、音声信号処理部15、圧縮処理部16、伸張処理部19及びSDRAM17に接続されている。バス25に接続された各部位は、バス25を介して、各種の信号(データ)のやり取りを行う。
TG22は、撮像装置1全体における各動作のタイミングを制御するためのタイミング制御信号を生成し、生成したタイミング制御信号を撮像装置1内の各部に与える。具体的には、タイミング制御信号は、撮像部11、映像信号処理部13、音声信号処理部15、圧縮処理部16、伸張処理部19及びCPU23に与えられる。タイミング制御信号は、垂直同期信号Vsyncと水平同期信号Hsyncを含む。
CPU23は、撮像装置1内の各部の動作を統括的に制御する。操作部26は、ユーザによる操作を受け付ける。操作部26に与えられた操作内容は、CPU23に伝達される。SDRAM17は、フレームメモリとして機能する。撮像装置1内の各部は、必要に応じて、信号処理時に一時的に各種のデータ(デジタル信号)をSDRAM17に記録する。
メモリカード18は、外部記録媒体であり、例えば、SD(Secure Digital)メモリカードである。メモリカード18は、撮像装置1に対して着脱自在となっている。メモリカード18の記録内容は、メモリカード18の端子を介して又は撮像装置1に設けられた通信用コネクタ部(不図示)を介して、外部のパーソナルコンピュータ等によって自在に読み出し可能である。尚、本実施形態では外部記録媒体としてメモリカード18を例示しているが、外部記録媒体を、1または複数のランダムアクセス可能な記録媒体(半導体メモリ、メモリカード、光ディスク、磁気ディスク等)で構成することができる。
図2は、図1の撮像部11の内部構成図である。撮像部11は、ズームレンズ30及びフォーカスレンズ31を含む複数枚のレンズを備えて構成される光学系35と、絞り32と、撮像素子33と、ドライバ34を有している。ドライバ34は、ズームレンズ30及びフォーカスレンズ31の移動並びに絞り12の開口量の調節を実現するためのモータ等から構成される。
被写体(撮像対象)からの入射光は、光学系35を構成するズームレンズ30及びフォーカスレンズ31、並びに、絞り32を介して撮像素子33に入射する。TG22は、上記タイミング制御信号に同期した、撮像素子33を駆動するための駆動パルスを生成し、該駆動パルスを撮像素子33に与える。
撮像素子33は、例えばCCD(Charge Coupled Devices)やCMOS(Complementary Metal Oxide Semiconductor)イメージセンサ等からなる。撮像素子33は、光学系35及び絞り32を介して入射した光学像を光電変換し、該光電変換によって得られた電気信号をAFE12に出力する。より具体的には、撮像素子33は、マトリクス状に二次元配列された複数の画素(受光画素;不図示)を備え、各撮影において、各画素は露光時間に応じた電荷量の信号電荷を蓄える。蓄えた信号電荷の電荷量に比例した大きさを有する各画素からの電気信号は、TG22からの駆動パルスに従って、後段のAFE12に順次出力される。
撮像素子33は、カラー撮影の可能な、単板式の撮像素子となっている。撮像素子33を構成する各画素には、例えば、赤(R)、緑(G)及び青(B)の何れかのカラーフィルタ(不図示)が設けられている。尚、撮像素子33として、3板式の撮像素子を採用することも可能である。
AFE12は、撮像部11の出力信号(即ち、撮像素子33の出力信号)であるアナログの上記電気信号を増幅する増幅回路(不図示)、増幅された電気信号をデジタル信号に変換するA/D(アナログ−デジタル)変換回路(不図示)と、を備える。AFE12によってデジタル信号に変換された撮像部11の出力信号は、順次、映像信号処理部13に送られる。また、CPU23は、撮像部11の出力信号の信号レベルに基づいて上記増幅回路の増幅度を調整する。
以下、撮像部11またはAFE12から出力される、被写体に応じた信号を、撮像信号と呼ぶ。
映像信号処理部13は、AFE12からの撮像信号に基づいて、撮像部11の撮影によって得られる映像(撮影画像)を表す映像信号を生成し、生成した映像信号を圧縮処理部16に送る。映像信号は、撮影画像の輝度を表す輝度信号Yと、撮影画像の色を表す色差信号U及びVと、から構成される。映像信号処理部13は、動画の映像信号の生成と静止画の映像信号の生成の双方を行う。
図3は、撮像装置1の概略外観図である。主マイク14aは、撮像装置1の周辺の音を広く集めることができるよう、撮像装置1の筐体の適切な場所に固定される。副マイク14bは、撮像装置1を用いて被写体を撮影するユーザ(即ち撮影者)が発した音声を選択的に集音できるように、撮像装置1の筐体の適切な場所に固定される。具体的には、副マイク14bは、指向性マイクとされ、表示部27の表示内容を視認できる方向(例えば、表示部27の表示面に鉛直な方向であって且つ表示部27の表示内容を視認できる方向)、または、撮像装置1のファインダ29を覗くことができる方向からの音声を選択的に集音する。
主マイク14aは、撮像装置1の周辺の音を受け、その音をアナログの電気信号に変換して出力する。音声信号処理部15は、主マイク14aから出力される電気信号(音声アナログ信号)をデジタル信号に変換する。この変換によって得られたデジタル信号は、主マイク14aに対して入力された音声を表す音声信号として圧縮処理部16に送られる。主マイク14aに対応する該音声信号を、以下、主音声信号(主音声データとも呼べる)という。
副マイク14bは、外部から与えられた音声をアナログの電気信号に変換して出力するが、その音声の発生元は、主として撮影者である。音声信号処理部15は、副マイク14bより出力される電気信号から人の音声の周波数成分を抽出した上で、その電気信号をデジタル信号に変換する。この変換によって得られたデジタル信号は、副マイク14bに対して入力された音声を表す音声信号であり、この音声信号を、以下、副音声信号(副音声データとも呼べる)という。
圧縮処理部16は、映像信号処理部13からの映像信号を、所定の圧縮方式を用いて圧縮する。動画に対しては、例えば、MPEG(Moving Picture Experts Group)等の圧縮方式を用いて映像信号の圧縮を行い、静止画に対しては、例えば、JPEG(Joint Photographic Experts Group)等の圧縮方式を用いて映像信号の圧縮を行う。動画または静止画撮影時において、圧縮された映像信号はメモリカード18に送られる。
尚、例えば、動画を構成する各撮影画像(各フレーム画像)の画像サイズは、映像信号処理部13等において、必要に応じ、間引き処理等を介して縮小されている。静止画に対しては、例えば、そのような縮小処理は施されない(施してもよい)。
また、圧縮処理部16は、音声信号処理部15からの主音声信号を、AAC(Advanced Audio Coding)等の所定の圧縮方式を用いて圧縮する。動画撮影時において、映像信号処理部13からの映像信号と音声信号処理部15からの主音声信号は、圧縮処理部16にて、時間的に互いに関連付けられつつ圧縮され、圧縮後のそれらはメモリカード18に送られる。副音声信号の取り扱いについては、後に詳説する。
録画ボタン26aは、ユーザが動画(動画像)の撮影の開始及び終了を指示するための押しボタンスイッチであり、シャッタボタン26bは、ユーザが静止画(静止画像)の撮影を指示するための押しボタンスイッチである。録画ボタン26aに対する操作に従って動画撮影の開始及び終了が実施され、シャッタボタン26bに対する操作に従って静止画撮影が実施される。1つのフレームにて1つのフレーム画像が得られる。各フレームの長さは、例えば1/60秒である。この場合、1/60秒の周期にて順次取得されるフレーム画像の集まり(ストリーム画像)が、動画を構成する。
撮像装置1の動作モードには、動画及び静止画の撮影が可能な撮影モードと、メモリカード18に格納された動画または静止画を表示部27に再生表示する再生モードと、が含まれる。再生モードには、メモリカード18に格納された動画または静止画に関連付けられたサムネイル画像を表示部27に再生表示するサムネイル画像表示モードが、含まれる。操作キー26cに対する操作に応じて、各モード間の遷移は実施される。
撮影モードにおいて、ユーザが録画ボタン26aを押下すると、CPU23の制御の下、その押下後の各フレームの映像信号及びそれに対応する主音声信号が、順次、圧縮処理部16を介してメモリカード18に記録される。つまり、主音声信号と共に、各フレームの撮影画像(即ちフレーム画像)が順次メモリカード18に格納される。動画撮影の開始後、再度ユーザが録画ボタン26aを押下すると、動画撮影は終了する。つまり、映像信号及び主音声信号のメモリカード18への記録は終了し、1つの動画の撮影は完了する。
また、撮影モードにおいて、ユーザがシャッタボタン26bを押下すると、静止画の撮影が行われる。具体的には、CPU23の制御の下、その押下直後の1つのフレームの映像信号が、静止画を表す映像信号として、圧縮処理部16を介してメモリカード18に記録される。動画の撮影中に静止画を同時撮影することも可能であり、この場合、同一のフレームの撮像信号に基づいて、動画に関する信号処理と静止画に関する信号処理が並行して行われる。尚、共通の回路を時分割で利用して、動画に関する信号処理と静止画に関する信号処理を別個のタイミングで行うようにしてもよい。例えば、静止画に関する信号処理を動画撮影終了後に行う。この場合、例えば、事後的に行うその信号処理に必要な撮像信号(撮影画像)をSDRAM17に一時記憶させておけばよい。
再生モードにおいて、ユーザが操作キー26cに所定の操作を施すと、メモリカード18に記録された動画または静止画を表す圧縮された映像信号は、伸張処理部19に送られる。伸張処理部19は、受け取った映像信号を伸張して映像出力回路20に送る。また、撮影モードにおいては、通常、動画または静止画を撮影しているか否かに拘らず、映像信号処理13による映像信号の生成が逐次行われており、その映像信号は映像出力回路20に送られる。
映像出力回路20は、与えられたデジタルの映像信号を表示部27で表示可能な形式の映像信号(例えば、アナログの映像信号)に変換して出力する。表示部27は、液晶ディスプレイなどの表示装置であり、映像出力回路20から出力された映像信号に応じた画像を表示する。即ち、表示部27は、撮像部11から現在出力されている撮像信号に基づく画像(現在の被写体を表す画像)、または、メモリカード18に記録されている動画(動画像)若しくは静止画(静止画像)を、表示する。
また、再生モードにおいて動画を再生する際、メモリカード18に記録された動画に対応する圧縮された主音声信号も、伸張処理部19に送られる。伸張処理部19は、受け取った主音声信号を伸張して音声出力回路21に送る。音声出力回路21は、与えられたデジタルの主音声信号をスピーカ28にて出力可能な形式の主音声信号(例えば、アナログの主音声信号)に変換してスピーカ28に出力する。スピーカ28は、音声出力回路21からの主音声信号を音声(音)として外部に出力する。
また、映像信号処理部13は、撮影画像中のフォーカス検出領域内のコントラスト量に応じたAF評価値を検出するAF評価値検出回路、撮影画像の明るさに応じたAE評価値を検出するAE評価値検出回路、画像の動きを検出する動き検出回路などを含む。CPU23は、AF評価値に応じ、図2のドライバ34を介してフォーカスレンズ31の位置を調節することにより、被写体の光学像を撮像素子33の撮像面(受光面)に結像させる。また、CPU23は、AE評価値に応じ、図2のドライバ34を介して絞り32の開口量(及び必要に応じてAFE12の増幅回路の増幅度)を調節することにより、受光量(画像の明るさ)を制御する。
撮像装置1は、撮影された動画の夫々にサムネイル画像とサムネイル文字列とを関連付け、サムネイル画像と共にサムネイル文字列を表示する機能を備えている。該サムネイル文字列は、副マイク14bに与えられた音声に基づいて作成される。
サムネイル画像には、動画用のサムネイル画像と静止画用のサムネイル画像があるが、以下の説明において、単にサムネイル画像といった場合、それは、動画用のサムネイル画像を意味するものとする。
サムネイル文字列の作成動作を含む、動画撮影時の撮像装置1の動作を例示する実施例として、以下に、第1、第2及び第3実施例を例示する。以下、特に記述しない限り、或る1つの動画に着目して説明を行う。
<<第1実施例>>
まず、第1実施例について説明する。図4は、第1実施例に係る、撮像装置1の動作手順を示すフローチャートである。
まず、ステップS1において、CPU23は、撮影モードにおいて録画ボタン26aが押下されたかどうかを判断する。押下されていない場合はステップS1の処理が繰り返され、押下された場合はステップS2に移行する(ステップS1のYes)。
ステップS2に移行すると、映像信号(映像データ)及び主音声信号(主音声データ)から成る撮影データの記録が開始される(録画が開始される)。具体的には、ステップS2に移行してから録画ボタン26aが再度押下されたことに起因してステップS10に移行するまでの間、CPU23の制御の下、各フレームの撮影画像を表す映像信号(即ち動画)及びそれに対応する主音声信号が、順次、圧縮処理部16を介してメモリカード18に記録されていく。
ステップS2の処理の後、ステップS3に移行する。ステップS3において、CPU23は、録画ボタン26aが再度押下されたか、即ち録画停止が指示されたかを判断する。録画ボタン26aが再度押下された場合は(ステップS3のYes)ステップS10に移行し、録画ボタン26aが再度押下されていない場合は(ステップS3のNo)ステップS4に移行する。
ステップS4において、CPU23は、サムネイル文字列を生成するための所定の録音開始操作が操作キー26cに対して施されたかを判断する。録音開始操作がなされた場合は(ステップS4のYes)ステップS5に進む一方、なされていない場合は(ステップS4のNo)ステップS3に戻る。
ステップS5において、CPU23は、副マイク14bへの音声入力に応じた副音声信号(副音声データ)を、SDRAM17に記録させる。この記録動作は、映像信号及び主音声信号から成る撮影データの記録動作と平行して実施される。
ステップS5に続くステップS6において、CPU23は、所定の録音終了操作が操作キー26cに対して施されたかを判断する。録音終了操作がなされた場合は(ステップS6のYes)はステップS3に戻り、なされていない場合は(ステップS6のNo)ステップS5に戻る。
このように、ステップS5とS6のループ処理により、録音開始操作がなされてから録音終了操作がなされるまでの期間の副音声信号(副音声データ)がSDRAM17に記録される。この期間を、サムネイル用音声入力期間と呼ぶ。SDRAM17に記録された、該サムネイル用音声入力期間における副音声信号(副音声データ)をサムネイル用音声信号と呼ぶ。サムネイル用音声信号によって表される、サムネイル用音声入力期間における副マイク14bへの入力音声をサムネイル用音声と呼ぶ。
録画停止が指示された場合にステップS3から移行するステップS10では、撮影データの記録が終了する(録画が終了する)。つまり、ステップS2から行われていた、各フレームの撮影画像を表す映像信号及びそれに対応する主音声信号をメモリカード18に記録する処理を停止する。
ステップS10に続くステップS11において、CPU23は、SDRAM17に記録されているサムネイル用音声信号を、音声認識処理を用いて、テキスト情報に変換する(テキスト変換する)。音声認識処理を実現する手法として、公知または周知の任意の手法を採用可能である。
例えば、CPU23は、音素または単語などを単位とする標準パターンと、サムネイル用音声信号から求められた、未知音声の音声パターンとの比較を行う。そして、最も類似している標準パターンと同じカテゴリの音素または単語が未知音声として発声されたと判断する。この際、適宜、周知のDP(Dynamic Programming)マッチング法などが用いられる。尚、標準パターンは、撮像装置1内の音声認識用メモリ(不図示)に予め格納されている。
これにより、副マイク14bへのサムネイル用音声が「秋の運動会、徒競走に出場、天候は晴れ」であった場合、ステップS11にて、そのサムネイル用音声はテキスト変換され、「秋の運動会、徒競走に出場、天候は晴れ」のテキスト情報が得られる。
ステップS11を終えるとステップS12に移行する。ステップS12では、ステップS11で作成されたテキスト情報からサムネイル文字列を生成する。例えば、テキスト情報の最初のp個の、文節、単語または音素をサムネイル文字列として抽出する(pは、1以上の整数)。例えば、副マイク14bへのサムネイル用音声が「秋の運動会、徒競走に出場、天候は晴れ」であった場合において、テキスト情報の最初の2個の文節をサムネイル文字列として抽出する場合、サムネイル文字列は「秋の運動会」となる。尚、テキスト情報の全てをサムネイル文字列とするようにしてもよい。この場合、サムネイル文字列は、「秋の運動会、徒競走に出場、天候は晴れ」となる。
ステップS12を終えるとステップS13に移行する。ステップS13では、撮影した動画を構成するフレーム画像からサムネイル画像を作成する。作成されたサムネイル画像は、撮影した動画に関連付けられつつ、メモリカード18に記録される。例えば、撮影した動画の先頭のフレーム画像、末尾のフレーム画像など、予め設定されたタイミングのフレーム画像(換言すれば、そのフレーム画像を表す撮像信号)からサムネイル画像を作成する。また、動画の撮影直前または撮影直後のフレーム画像から、その動画に関連付けられるべきサムネイル画像を作成するようにしてもよい。
また、サムネイル用音声入力期間における何れかのフレーム画像から、サムネイル画像を作成するようにしてもよい。換言すれば、サムネイル用音声入力期間における何れかのフレームの撮像信号に基づいて、サムネイル画像を作成するようにしてもよい。何れのフレームの撮像信号に基づいてサムネイル画像を作成するかは、例えば、サムネイル用音声入力期間の開始タイミングを基準として予め設定されている。例えば、サムネイル用音声入力期間の先頭フレームまたは末尾フレームの撮像信号からサムネイル画像が作成される。勿論、該期間の中間のフレームの撮像信号からサムネイル画像を作成してもよい。
サムネイル用音声入力期間におけるフレーム画像から作成されたサムネイル画像は、動画の特徴を表すサムネイル文字列の入力タイミングに対応した画像であるため、動画の特徴を良く表した画像または撮影者にとって印象の深い画像となることが多い。
サムネイル画像の画像サイズは、間引き処理等を介して、作成元のフレーム画像の画像サイズよりも縮小化される。但し、この縮小化は必須ではない。尚、ステップS13の処理は、映像信号処理部13によって実施される。また、サムネイル画像の生成は、録画中に行っても良い(ステップS2とS3の間など)。
ステップS13を終えるとステップS14に移行する。ステップS14では、ステップS12にて作成されたサムネイル文字列が、ステップS13で作成されたサムネイル画像に関連付けられつつメモリカード18に記録される。具体的には例えば、サムネイル画像のファイル名を、サムネイル文字列にて置換する。当初、サムネイル画像のファイル名は、撮影順番に応じた番号などとなっている。
図5に、サムネイル画像表示モードにおける表示部27の表示画面の表示例を示す。サムネイル画像表示モードにおいて、メモリカード18に格納されたサムネイル画像は、伸張処理部19による伸張処理及び映像出力回路20による変換処理を介して、表示部27に表示される。表示部27の表示画面に表示されるサムネイル画像には、図4のステップS13にて作成される動画用のサムネイル画像と、撮影された静止画に対応する静止画用のサムネイル画像と、がある。静止画用のサムネイル画像は、静止画撮影時に撮影及び記録される。
図5では、表示部27の表示エリアは4分割され、表示エリアの左上、右上、左下及び右下に、それぞれ、サムネイル画像TN1、TN2、TN3及びTN4が表示されている。メモリカード18に、他のサムネイル画像が格納されている場合は、操作キー26cに所定の操作を施すことにより、上記他のサムネイル画像が表示される。サムネイル画像TN2及びTN3に付されたマーク71は、そのサムネイル画像が動画用のサムネイル画像であることを示している。従って、サムネイル画像TN2及びTN3は動画用のサムネイル画像であり、サムネイル画像TN1及びTN4は静止画用のサムネイル画像である。今、サムネイル画像TN3として表示されているサムネイル画像に、「秋の運動会」というサムネイル文字列が関連付けられているとする。
図5において、72は表示画面上のカーソルである。カーソル72は、操作キー26cに対する操作により表示画面上を移動する。図5は、サムネイル画像TN3がカーソル72によって選択されている状態を示している。各サムネイル画像の右下に表示されている番号または文言は、各サムネイル画像のファイル名を示している。図5は、サムネイル画像TN3のファイル名が、図4のステップS12で作成されたサムネイル文字列(「秋の運動会」)となっている場合を表している。
カーソル72によって或るサムネイル画像を選択している状態において、所定のキー操作を行うと、そのサムネイル画像に関連付けられた動画または静止画がメモリカード18から読み出される。そして、読み出された動画または静止画が表示部27の表示画面全体を使って表示される。例えば、サムネイル画像TN3に対応する動画が再生されるようにキー操作を施した場合、表示部27の表示画面は図5に示す状態から図6に示す状態に遷移し、サムネイル画像TN3に対応する動画が表示部27の表示画面全体を使って再生表示される。この状態で、再生を停止するためのキー操作を施すと、表示画面は図5に示す状態に戻る。
また例えば、或るサムネイル画像をカーソル72によって選択した際に、そのサムネイル画像に対応するサムネイル文字列を表示するためのウィンドウをポップアップ表示するようにしてもよい。つまり例えば、図7に示す如く、サムネイル画像TN3がカーソル72によって選択されたとき、表示部27の表示画面上にサムネイル画像TN3に関連付けたウィンドウを開き、該ウィンドウにサムネイル画像TN3に関連付けられたサムネイル文字列(「秋の運動会」)を表示するようにしてもよい。
これ以外にも、サムネイル画像とサムネイル文字列との関連が分かるような表示形式であれば、どのような表示形式を採用してもよい。例えば、表示画面上にサムネイル文字列を表示する専用の領域を設け、該領域にサムネイル文字列をサムネイル画像との対応が分かるように表示するようにしてもよい。例えば、該領域にはサムネイル画像TN3に対応するサムネイル文字列が、カーソル72によってサムネイル画像TN3が選択されている場合に、或いは、カーソル72によってサムネイル画像TN3が選択されているか否かに拘らず、表示される。
このように、サムネイル画像を表示する際において、サムネイル画像だけでなくサムネイル文字列も併せて表示することにより(より詳しくは、同一の画像に対応するサムネイル画像とサムネイル文字列とを関連付けて表示することにより)、撮影した動画の特徴を、画像とテキストで提示することができる。この結果、サムネイル画像を利用した所望の動画ファイル選定が容易となり、ユーザの利便性が向上する。
尚、動画撮影中に、録音開始操作及び録音終了操作が複数回実行された場合、サムネイル用音声入力期間が複数存在することになるが、その場合、CPU23は、例えば、最後のサムネイル用音声入力期間に対応するサムネイル用音声信号からサムネイル文字列を作成する。
<<第2実施例>>
次に、第2実施例について説明する。第1実施例に記載した事項は、矛盾なき限り第2実施例についても当てはまる。第1実施例との相違点に特に着目して第2実施例の説明を行う。
第2実施例では、任意の言葉にて話者認識を行う発声内容独立型の話者認識処理が利用される。話者認識処理を実現する手法として、公知または周知の任意の手法を採用可能である。図8に、周知の話者認識処理を行うための話者認識部のブロック図を示す。図8に示す各部は、例えばCPU23によって実現される。但し、図8の話者モデル記録部53は、CPU23の外部に設けられるメモリ(不図示)によって実現される。
まず、話者認識を行う前に話者の登録を行う。本実施例では、登録される話者が撮像装置1を用いて撮影を行う1人のユーザである場合を想定する。つまり、登録話者が1人である場合を想定する。但し、登録話者を複数人とすることも可能である。また、話者登録及び話者認識の対象となる話者の音声は、副マイク14bから入力される。
話者登録時において、副マイク14bに入力された音声は、特徴量抽出部51に供給される。話者が発生した文章などの音声に含まれる、ケプストラムやピッチ等の特徴量が特徴量抽出部51にて抽出される。話者登録時において、該特徴量は話者モデル作成部52に与えられる。
話者モデル作成部52は、抽出された特徴量に基づき、話者の音声のモデル(以下、登録話者モデルという)、例えば隠れマルコフモデル(Hidden Markov Model)を作成する。登録話者モデルは、話者モデル記録部53に記録される。
話者認識時において、副マイク14bに入力された、認識対象話者(現在の話者)の音声は、特徴量抽出部51に供給される。認識対象話者が発生した文章などの音声に含まれる、ケプストラムやピッチ等の特徴量が特徴量抽出部51にて抽出される。話者認識時において、該特徴量は尤度算出部54に与えられる。尤度算出部54は、話者モデル記録部53に記録されている登録話者モデルと認識対象話者に対応する特徴量とを比較し、それらの尤度(類似度)を算出する。そして、尤度が所定の閾値より大きければ認識対象話者が登録話者と一致すると判断し、そうでなければ、認識対象話者は登録話者と相違すると判断する。
上記のような話者認識処理を利用した、撮像装置1の動作の手順を示すフローチャートを図9に示す。図9のフローチャートに示す処理の実行の前に、事前に話者登録が行われているものとする。第2実施例に係る動作手順は、ステップS1〜S3と、S21と、S5と、S10〜S14と、から成る。ステップS1〜S3と、S5と、S10〜S14の処理は、第1実施例に係る動作手順におけるそれらと同じであるので、それらに関する重複する説明を(原則として)省略する。
第2実施例では、ステップS3において録画ボタン26aの再度の押下が確認されない場合(ステップS3のNo)、ステップS21に移行する。
ステップS21において、動画撮影中に副マイク14bに対して入力された音声の話者(上記の認識対象話者に対応)の話者認識を行い、その話者が登録話者と一致するかが判断される。一致する場合は(ステップS21のYes)ステップS5に移行し、一致しない場合は(ステップS21のNo)ステップS3に戻る。
ステップS5において、CPU23は、副マイク14bへの音声入力に応じた副音声信号(副音声データ)を、SDRAM17に記録させる。この記録動作は、映像信号(映像データ)及び主音声信号(主音声データ)とから成る撮影データの記録動作と平行して実施される。
本実施例では、動画撮影中に登録話者が副マイク14bに対して発した音声はサムネイル用音声となり、該音声を表す副音声信号はサムネイル用音声信号となる。ステップS3、S21及びS5の処理により、サムネイル用音声信号はSDRAM17に記録される。そして、該サムネイル用音声信号はステップS11にてテキスト情報に変換され、ステップS12にてサムネイル文字列が生成される。このサムネイル文字列は、第1実施例と同様、ステップS13にて作成されたサムネイル画像と関連付けられつつメモリカード18に記録される。そして、サムネイル画像表示モードにおいて、第1実施例と同様、サムネイル文字列はサムネイル画像に関連付けられつつ表示される。
尚、ステップS13では、第1実施例と同様、予め設定されたタイミングのフレーム画像からサムネイル画像が作成される。この際、サムネイル用音声が入力されていた期間における何れかのフレーム画像から、サムネイル画像を作成するようにしてもよい。換言すれば、その期間における何れかのフレームの撮像信号に基づいて、サムネイル画像を作成するようにしてもよい。該期間中の何れのフレームの撮像信号に基づいてサムネイル画像を作成するかは、例えば、該期間の開始タイミングを基準として予め設定されている。例えば、該期間の先頭フレームまたは末尾フレームの撮像信号からサムネイル画像が作成される。勿論、該期間の中間のフレームの撮像信号からサムネイル画像を作成してもよい。
該期間におけるフレーム画像から作成されたサムネイル画像は、動画の特徴を表すサムネイル文字列の入力タイミングに対応した画像であるため、動画の特徴を良く表した画像または撮影者にとって印象の深い画像となることが多い。
また、1つの動画撮影中において、副マイク14bに対してサムネイル用音声が2回以上入力された場合は、例えば、各サムネイル用音声の音の強さまたは大きさに基づいて、テキスト情報とサムネイル文字列の生成の基となるサムネイル用音声を択一的に選択する。以下、各サムネイル用音声の音の強さに基づいて、上記の選択を行う場合の例を説明する。各サムネイル用音声の音の大きさに基づいて、上記の選択を行う場合は、音に関する下記「強さ」の文言は、「大きさ」に読み替えられる。
例えば、図10に示す如く、録画開始後、或るタイミングにおいて、登録話者による第1回目のサムネイル用音声の入力があり、その第1回目のサムネイル用音声の入力が終了してから所定の閾値時間以上の時間が経過した後、登録話者による第2回目のサムネイル用音声の入力があった場合を考える。登録話者による副マイク14bへの音声入力が閾値時間(例えば1〜2秒)以上途絶えると、1つのサムネイル用音声の入力は終了したものと判断される。尚、副マイク14bに入力された音の強さが所定の閾値以下である場合に、サムネイル用音声の入力はない、と判断される。
第1回目のサムネイル用音声に対応する第1のサムネイル用音声信号、第2回目のサムネイル用音声に対応する第2のサムネイル用音声信号は、ステップS5の処理によって、共にSDRAM17に記録される。
そして、ステップS11においてCPU23は、テキスト情報の生成の基となるサムネイル用音声信号を、第1及び第2のサムネイル用音声信号の中から択一的に選択する。この際、第1回目のサムネイル用音声の音の強さに応じた音強度値と、第2回目のサムネイル用音声の音の強さに応じた音強度値とを比較し、大きい方の音強度値に対応するサムネイル用音声信号を、テキスト情報の生成の基となるサムネイル用音声信号として選択する。尚、サムネイル用音声が3回以上入力された場合は、最大の音強度値に対応するサムネイル用音声信号を、テキスト情報の生成の基となるサムネイル用音声信号として選択する。
第1回目及び第2回目のサムネイル用音声が副マイク14bに入力されていた期間を、それぞれ、第1及び第2の発声期間と呼ぶ。第1のサムネイル用音声信号に対応する音強度値は、例えば、第1回目のサムネイル用音声の音の強さの、第1の発声期間における平均値またはピーク値(最大値)である。第2のサムネイル用音声信号に対応する音強度値は、例えば、第2回目のサムネイル用音声の音の強さの、第2の発声期間における平均値またはピーク値(最大値)である。各音強度値は、音の強さが増大するにつれて大きくなる。また、音の強さとは、実際に発声した音の強さではなく、副マイク14bに与えられた音の強さを意味する。
登録話者としての撮影者は、サムネイル用音声として意図していない音声を、小さな声で発する場合もある。このような音声に基づきサムネイル文字列を作成するのは好ましくないが、上記のように処理することにより、サムネイル用音声を意図して発した比較的大きな声に基づいてサムネイル文字列は作成されるようになる。また、サムネイル用音声として発した第1回目のサムネイル用音声を、他のサムネイル用音声に置換したい場合、ユーザは、より大きな声で第2回目のサムネイル用音声を発すればよい。
<<第3実施例>>
動画撮影中に副マイク14bに対して発したサムネイル用音声は、主マイク14aにもひろわれ、主マイク14aに対応する主音声信号に、サムネイル用音声に対応する信号成分が混入する(以下、この混入した信号成分を「混入信号成分」とよぶ)。サムネイル用音声は、撮影者がサムネイル文字列を形成するために発した音声であり、主音声信号への混入は望まれないことが多い。
これを考慮し、第1及び第2実施例において、主マイク14aに対応する主音声信号からサムネイル用音声に対応する混入信号成分を除去し、その除去後の主音声信号を最終的にメモリカード18に記録するようにしてもよい。このような除去に関する変形を施した、第1及び第2実施例に対する変形例を、第3実施例として説明する。
主音声信号から混入信号成分を除去するタイミングは、動画撮影中であっても動画撮影終了後であっても構わない。
図11に、動画撮影中に混入信号成分を除去する場合における音声除去部の概略ブロック図を示す。図11の音声除去部は、図1の音声信号処理部15内に設けられる。図11の音声除去部は、副マイク14bに対してサムネイル用音声が入力された時にのみ機能する。
主マイク14aに入力された音に応じた、主マイク14aからの電気信号は、A/D変換回路61にてデジタル値に変換され、差分回路63に送られる。副マイク14bに入力された音に応じた、副マイク14bからの電気信号は、A/D変換回路62にてデジタル値に変換され、乗算器64に送られる。
主マイク14aと14bのマイクとしての特性の相違やそれらの配置位置の相違に起因して、撮影者が副マイク14bに対して発した音声が同じであっても、その音声に対応するA/D変換回路61の出力値(A/D変換回路61から出力されるデジタル値)とA/D変換回路62の出力値(A/D変換回路62から出力されるデジタル値)は異なる。撮影者が副マイク14bに対して発した音声が同じ場合に、それらの出力値が同じとなるように、乗算器64は、予め設定された係数kをA/D変換回路62の出力値に乗算し、その乗算によって得られた値を差分回路63に送る。
差分回路63は、A/D変換回路61の出力値から乗算器64の出力値を減算する。この減算によって得られた信号は、主マイク14aに対して入力された音声を表す主音声信号(より詳しくは、混入信号成分が除去された主音声信号)として圧縮処理部16に送られ、圧縮後、メモリカード18に記録される。
尚、第2実施例では、話者認識を行う必要があり、話者認識の実施には或る程度の時間が必要である。従って、第2実施例に対して図11の音声除去部を適用する場合においては、A/D変換回路61及び62の出力値を一定量保存しておくバッファを差分回路63などに設けるようにし、話者認識の結果が得られた後に、そのバッファに保存された値を用いて上述と同様の動作を行うようにすればよい。勿論、第1実施例に対して図11の音声除去部を適用する場合においても、同様にバッファを設けてもよい。
また、図11の音声除去部は、デジタル変換後に差分処理(差分回路63における差分処理)を行うようにしているが、アナログの信号形式の状態で同様の差分処理を行うようにしても構わない。
また、動画撮影終了後に、主音声信号から混入信号成分を除去する場合は、副マイク14bに対してサムネイル用音声が入力されていた期間に対応する主音声信号をメモリカード18から読み出すともに、SDRAM17に記録されているサムネイル用音声信号(図4及び図9におけるステップS5参照)をSDRAM17から読み出す。そして、例えばCPU23が、その主音声信号からサムネイル用音声信号の成分が除去されるように主音声信号を補正し、補正後の主音声信号にてメモリカード18内の該期間に対応する主音声信号を置き換える。
また、撮像装置1に主マイク14aと副マイク14bの2つのマイクを設ける例を上述してきたが、マイクを1つにすることも可能である。例えば、副マイク14bを省略することが可能である。この場合、主マイク14aが、上述してきた副マイク14bの機能を兼務する。
マイクを1つにした場合は、第2実施例に対してのみ混入信号成分の除去機能を適用可能である。例えば、動画撮影中に主マイク14aに対して入力された音声の話者が登録話者であるかを判断する。そして、その話者が登録話者である場合、登録話者の音声、即ちサムネイル用音声からサムネイル文字列を生成する。一方で、差分演算等を介して、そのサムネイル用音声に対応するサムネイル用音声信号の成分を、最終的にメモリカード18に記録されるべき主音声信号から除去する。
<<変形等>>
上述の各実施例に記載した内容は、矛盾なき限り、他の実施例にも適用可能である。
また、上述したように、メモリカード18の記録内容は、外部のパーソナルコンピュータ等によって自在に読み出し可能となっている。メモリカード18の記録内容を表示部27及びスピーカ28にて再生(映像表示及び音声出力)することができると上述したが、メモリカード18の記録内容の再生は、図12に示す、パーソナルコンピュータ等の情報処理装置80によっても同様に実現可能である。情報処理装置80は、表示部27と同様の表示を行うことが可能な表示部81と、スピーカ28と同様の音声出力を行うことが可能なスピーカ82と、を備えている。尚、表示部27及びスピーカ28そのものが表示部81及びスピーカ82として、情報処理装置80内に設けられていると考えても良い。
情報処理装置80は、メモリカード18に記録された記録内容を読み出すための入力部83を備える。この入力部83は、例えば、メモリカード18を装着してメモリカード18の記録内容を読み出すためのメモリカードスロット、または、通信線を介してメモリカード18の記録内容を読み出すための通信用コネクタである。メモリカード18の記録内容には、サムネイル画像を表す情報、サムネイル文字列を表す情報、撮影された動画を表す情報などが含まれている他、それらの対応関係(関連付けがどのようになされているか)を特定する情報も含まれている。
そして、情報処理装置80の表示部81は、入力部83を介して与えられた各情報に基づき、サムネイル画像を表示する際、同一の動画に対応するサムネイル画像とサムネイル文字列とを、図5及び図7に示したものと同様に、関連付けて表示する。
また、この情報処理装置80と、撮像装置1とで、撮像表示システムが構成されると考えても良い。情報処理装置80を用いることを前提とすれば、撮像装置1から表示部27及びスピーカ28を削除する形態も有用である。
尚、動画撮影の開始及び終了を指示するための手段として押しボタンスイッチの録画ボタン26aを例示し、静止画撮影の実施を指示するための手段として押しボタンスイッチのシャッタボタン26bを例示したが、それらの手段を実施するための手法として、あらゆる手法を採用可能である。例えば、押しボタンスイッチ以外のスイッチ手段(例えば、ダイヤル式やレバー式のスイッチ)やタッチパネル等を用いて、動画撮影の開始及び終了や静止画撮影の実施を指示するようにしてもよいし、ユーザ(特に例えば、上述の登録話者)が発した音声によって動画撮影の開始及び終了や静止画撮影を実施するようにしてもよい。
また、サムネイル画像を表示する際、サムネイル用音声をスピーカ28を介して同時に出力するようにしてもよい。また、動画に対応するサムネイル画像は動画(以下、サムネイル動画という)であっても構わない。
本発明の実施の形態に係る撮像装置の全体ブロック図である。 図1の撮像部の内部ブロック図である。 図1の撮像装置の概略外観図である。 本発明の第1実施例に係る、図1の撮像装置の動作を説明するための図である。 サムネイル画像表示モードにおける、図1の表示部の表示画面の表示例を示す図である。 図5の表示画面から遷移しうる、動画の再生表示画面を示す図である。 サムネイル画像表示モードにおける、図1の表示部の表示画面の表示例を示す図である。 本発明の第2実施例に係る話者認識部のブロック図である。 本発明の第2実施例に係る、図1の撮像装置の動作を説明するための図である。 本発明の第2実施例を説明するための図である。 本発明の第3実施例を説明するための図である。 図1の撮像装置と併せて使用可能な情報処理装置の概略外観図である。
符号の説明
1 撮像装置
11 撮像部
12 AFE
13 映像信号処理部
14a 主マイク
14b 副マイク
15 音声信号処理部
26 操作部
26a 録画ボタン
26b シャッタボタン
26c 操作キー
27 表示部
28 スピーカ

Claims (9)

  1. 被写体に応じた撮像信号を出力する撮像手段と、
    動画を撮影した際、前記撮像信号に基づいて該動画に対応するサムネイル画像を生成するサムネイル画像生成手段と、
    前記サムネイル画像を表示可能な表示手段と、を備えた撮像装置において、
    外部からサムネイル用音声の入力を受ける音入力手段と、
    前記動画の撮影に対応して入力された前記サムネイル用音声からサムネイル文字列を生成するサムネイル文字列生成手段と、を備え、
    前記表示手段は、前記サムネイル画像を表示する際、表示した前記サムネイル画像に対応する前記サムネイル文字列も表示する
    ことを特徴とする撮像装置。
  2. 前記表示手段は、前記サムネイル画像を表示する際、外部からの操作に応じて、表示した前記サムネイル画像に対応する前記サムネイル文字列も表示する
    ことを特徴とする請求項1に記載の撮像装置。
  3. 前記サムネイル用音声は、外部から所定の操作を受けたときに前記音入力手段を介して入力された音声である
    ことを特徴とする請求項1または請求項2に記載の撮像装置。
  4. 前記音入力手段を介して入力された音声の話者と、予め登録された登録話者と、の一致または不一致を判断する話者認識手段を備え、
    前記サムネイル用音声は、前記登録話者に一致すると判断された話者が前記音入力手段を介して入力した音声である
    ことを特徴とする請求項1または請求項2に記載の撮像装置。
  5. 当該撮像装置の周辺音に応じた音声信号を前記動画を表す映像信号と共に記録する記録手段と、
    前記サムネイル用音声の信号成分を、前記記録手段に記録されるべき前記音声信号から除去する音声除去手段と、を更に備えている
    ことを特徴とする請求項1〜請求項4の何れかに記載の撮像装置。
  6. 前記サムネイル画像生成手段は、前記サムネイル文字列の生成の基となる前記サムネイル用音声が入力されたタイミングを基準とした所定タイミングにおける前記撮像信号を用いて、前記サムネイル画像を生成する
    ことを特徴とする請求項1〜請求項5の何れかに記載の撮像装置。
  7. 被写体に応じた撮像信号を出力する撮像手段と、動画を撮影した際、前記撮像信号に基づいて該動画に対応するサムネイル画像を生成するサムネイル画像生成手段と、外部からサムネイル用音声の入力を受ける音入力手段と、前記動画の撮影に対応して入力された前記サムネイル用音声からサムネイル文字列を生成するサムネイル文字列生成手段と、を備えた撮像装置にて生成された、前記サムネイル画像を表す情報及び前記サムネイル文字列を表す情報の供給を受ける入力手段と、
    前記入力手段を介して与えられた前記情報に基づいた表示を行う表示手段と、を備えた情報処理装置であって、
    前記表示手段は、前記サムネイル画像を表示する際、表示した前記サムネイル画像に対応する前記サムネイル文字列も表示する
    ことを特徴とする情報処理装置。
  8. 前記表示手段は、前記サムネイル画像を表示する際、外部からの操作に応じて、表示した前記サムネイル画像に対応する前記サムネイル文字列も表示する
    ことを特徴とする請求項7に記載の情報処理装置。
  9. 請求項7または請求項8に記載の撮像装置及び情報処理装置を備えた
    ことを特徴とする撮像表示システム。
JP2006084956A 2006-03-27 2006-03-27 撮像装置、情報処理装置、撮像表示システム Pending JP2007266661A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006084956A JP2007266661A (ja) 2006-03-27 2006-03-27 撮像装置、情報処理装置、撮像表示システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006084956A JP2007266661A (ja) 2006-03-27 2006-03-27 撮像装置、情報処理装置、撮像表示システム

Publications (1)

Publication Number Publication Date
JP2007266661A true JP2007266661A (ja) 2007-10-11

Family

ID=38639277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006084956A Pending JP2007266661A (ja) 2006-03-27 2006-03-27 撮像装置、情報処理装置、撮像表示システム

Country Status (1)

Country Link
JP (1) JP2007266661A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010276728A (ja) * 2009-05-26 2010-12-09 Nec Casio Mobile Communications Ltd 音声処理装置、音声処理方法、及び、プログラム
JP2011101184A (ja) * 2009-11-05 2011-05-19 Sony Corp 撮影装置、撮影制御方法及び撮影制御プログラム
JP2013142987A (ja) * 2012-01-10 2013-07-22 Nk Works Kk 画像処理プログラムおよび画像処理装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010276728A (ja) * 2009-05-26 2010-12-09 Nec Casio Mobile Communications Ltd 音声処理装置、音声処理方法、及び、プログラム
JP2011101184A (ja) * 2009-11-05 2011-05-19 Sony Corp 撮影装置、撮影制御方法及び撮影制御プログラム
JP2013142987A (ja) * 2012-01-10 2013-07-22 Nk Works Kk 画像処理プログラムおよび画像処理装置

Similar Documents

Publication Publication Date Title
KR101189980B1 (ko) 기록 장치 및 방법, 재생 장치 및 방법, 및 기록매체
EP2741293A1 (en) Video processing apparatus and method
JP2010219692A (ja) 撮像装置及びカメラ
JP2008141484A (ja) 画像再生システム及び映像信号供給装置
KR100770637B1 (ko) 디지털 카메라
JP2008139683A (ja) 撮像装置及びオートフォーカス制御方法
JP2012100216A (ja) カメラおよび動画撮影プログラム
JP2007101945A (ja) 音声付き映像データ処理装置、音声付き映像データ処理方法及び音声付き映像データ処理用プログラム
JP2009147744A (ja) 記録装置、再生装置、記録方法、再生方法及びプログラム
JP2007228453A (ja) 撮像装置、再生装置、プログラム、および記憶媒体
JP2007266661A (ja) 撮像装置、情報処理装置、撮像表示システム
JP2007194829A (ja) カメラ、画像処理装置、静止画生成方法、プログラム、および記憶媒体
JP2012257112A (ja) 撮像装置およびプログラム
JP2001069453A (ja) 静止画カメラ
JP2011139306A (ja) 撮像装置及び再生装置
JP2008205953A (ja) 撮像装置、及び画像再生装置
JP4742912B2 (ja) 画像音声記録装置、画像音声記録方法および画像音声記録制御プログラム
JP4179456B2 (ja) デジタルカメラ、及びそれに用いられるプログラム
JP2007104405A (ja) 音声付き映像データ処理装置、音声付き映像データ処理方法及び音声付き映像データ処理用プログラム
JP4911287B2 (ja) 画像再生装置及びそのプログラム
JP2007266662A (ja) サムネイル生成装置及び撮像装置
JP4013433B2 (ja) 画像再生装置及びデジタルカメラ
JP2008091978A (ja) 撮像装置及び画像記憶方法
JP2004120279A (ja) 動画・テキスト編集装置、編集方法及び編集プログラム
CN102006410A (zh) 根据场景识别设置图像宽高比的方法及其数字拍摄设备