JP2006211720A

JP2006211720A - 情報処理装置

Info

Publication number: JP2006211720A
Application number: JP2006112990A
Authority: JP
Inventors: Satoshi Ejima; 聡江島
Original assignee: Nikon Corp
Current assignee: Nikon Corp
Priority date: 2006-04-17
Filing date: 2006-04-17
Publication date: 2006-08-10

Abstract

【課題】録音された音声データの一部を、図形を指定することにより再生する。
【解決手段】マイクロホン８より入力された音声信号は、音声ＩＣ３８により、所定の処理が施された後、メモリカード２４に記録される。このようにして記録された音声データを再生する場合は、記録された音声データの再生時間に対応する長さの線分をＬＣＤ６に表示させる。ペン４６により、表示された線分の２点の座標が指定されると、ＣＰＵ３６は、線分上で指定された領域に対応する部分の音声データをメモリカード２４から読み出し、音声ＩＣ３８に供給する。その結果、指定された部分の音声が再生されることになる。
【選択図】図４

Description

本発明は、情報処理装置に関し、特に、音声を記録または再生する情報処理装置に関する。

例えば、従来の電子カメラ等において、録音された音声を再生する場合は、録音単位（１回の操作で録音された音声）毎に再生が行われるようになされていた。

したがって、従来の電子カメラ等では、録音単位の特定の部分だけを選択的に再生することができないという課題があった。

本発明は、以上のような状況に鑑みてなされたものであり、録音された音声の必要な部分だけを再生することを可能とするものである。

請求項１に記載の情報処理装置は、入力された音声を記録する記録手段と、記録手段に記録された音声の記録時間に対応する、長さ、または、角度を有する図形を作成する図形作成手段と、図形作成手段により作成された図形を表示装置に出力する出力手段と、表示装置の画面上の所定の位置を指定する位置指定手段と、表示装置に表示された図形の少なくとも２点の座標が位置指定手段により指定された場合に、それらの座標を取得する座標取得手段と、座標取得手段により取得された座標に応じて記録手段に記録されている音声の所定の部分を再生する再生手段とを備えることを特徴とする。

請求項１に記載の情報処理装置によれば、入力された音声を記録手段により記録し、記録手段に記録された音声の記録時間に対応する、長さ、または、角度を有する図形を図形作成手段が作成し、図形作成手段により作成された図形を表示装置に出力手段が出力し、表示装置の画面上の所定の位置を位置指定手段により指定し、表示装置に表示された図形の少なくとも２点の座標が位置指定手段により指定された場合に、それらの座標を座標取得手段が取得し、座標取得手段により取得された座標に応じて記録手段に記録されている音声の所定の部分を再生手段が再生するようにしたので、表示手段に表示されている図形の少なくとも２点の座標を位置指定手段により指定することにより、記録手段に記録された音声の所望の部分だけを再生することが可能となる。

以下、本発明の実施例を図面を参照して説明する。

図１及び図２は、本発明を適用した電子カメラの一実施例の構成を示す斜視図である。本実施例の電子カメラにおいては、被写体を撮影する場合において、被写体に向けられる面が面Ｘ１とされ、ユーザ側に向けられる面が面Ｘ２とされている。面Ｘ１の上端部には、被写体の撮影範囲の確認に用いられるファインダ２、被写体の光画像を取り込む撮影レンズ３、及び、被写体を照明する場合に発光される発光部（フラッシュランプ）４が設けられている。

一方、面Ｘ１に対向する面Ｘ２の上端部（面Ｘ１の、ファインダ２、撮影レンズ３、発光部４が形成されている部分に対向する部分）には、上記ファインダ２、及びこの電子カメラ１に記録されている音声を出力するスピーカ５が設けられている。また、面Ｘ２に形成されているＬＣＤ６および操作キー７（メニューキー７Ａ、実行キー７Ｂ、クリアキー７Ｃ、キャンセルキー７Ｄ、およびスクロールキー７Ｅ）は、ファインダ２、撮影レンズ３、発光部４、及びスピーカ５よりも、鉛直下側に形成されている。ＬＣＤ６の表面上には、後述するペン型指示装置の接触操作により、指示された位置に対応する位置データを出力する、いわゆるタッチタブレット６Ａ（座標取得手段）が形成されている。

このタッチタブレット６Ａは、ガラス、樹脂等の透明な材料によって構成されており、ユーザは、タッチタブレット６Ａの内側に形成されているＬＣＤ６に表示される画像を、タッチタブレット６Ａを介して観察することができる。

操作キー７は、ＬＣＤ６に記録データを再生表示する場合などに操作されるキーであり、以下に示すキーによって構成されている。すなわち、メニューキー７Ａは、ＬＣＤ６上にメニュー画面を表示する場合に操作されるキーである。実行キー７Ｂは、ユーザによって選択された記録情報を再生する場合に操作されるキーである。

クリアキー７Ｃは、記録した情報を削除する場合に操作されるキーである。キャンセルキー７Ｄは、記録情報の再生処理を中断する場合に操作されるキーである。スクロールキー７Ｅは、ＬＣＤ６に記録情報の一覧が表示されている場合において、画面を上下方向にスクロールさせるときに操作されるキーである。

電子カメラ１の上面である面Ｚには、音声を集音するマイクロホン８、及び図示せぬイヤホンが接続されるイヤホンジャック９が設けられている。

左側面（面Ｙ１）には、被写体を撮像するときに操作されるレリーズスイッチ１０、電源スイッチ１１、および、ＡＣアダプタを接続するためのＡＣアダプタジャック１５が設けられている。

一方、面Ｙ１に対向する面Ｙ２（右側面）には、音声を録音するときに操作される録音スイッチ１２と、撮影時の連写モードを切り換えるときに操作される連写モード切り換えスイッチ１３が設けられている。なお、録音スイッチ１２は、面Ｙ１のレリーズスイッチ１０とほぼ同じ高さに形成されており、左右どちらの手で持っても、違和感のないように構成されている。

なお、録音スイッチ１２とレリーズスイッチ１０の高さを、あえて異ならせることにより、一方のスイッチを押す場合に、この押圧力によるモーメントを打ち消すために反対側の側面を指で保持したとき、誤ってこの反対側の側面に設けられたスイッチが押されてしまわないようにしてもよい。

上記連写モード切り換えスイッチ１３は、ユーザがレリーズスイッチ１０を押して被写体を撮影するとき、被写体を１コマだけ撮影するのか、または、所定の複数コマ撮影するのかを設定する場合に用いられる。例えば、連写モード切り換えスイッチ１３の指針が「Ｓ」と印刷された位置に切り換えられている（すなわち、Ｓモードに切り換えられている）場合において、レリーズスイッチ１０が押されると、１コマだけ撮影が行われるようになされている。

また、連写モード切り換えスイッチ１３の指針が「Ｌ」と印刷された位置に切り換えられている（すなわち、Ｌモードに切り換えられている）場合において、レリーズスイッチ１０が押されると、レリーズスイッチ１０の押されている期間中、１秒間に８コマの撮影が行われるようになされている（すなわち、低速連写モードになる）。

さらに、連写モード切り換えスイッチ１３の指針が「Ｈ」と印刷された位置に切り換えられている（すなわち、Ｈモードに切り換えられている）場合において、レリーズスイッチ１０が押されると、レリーズスイッチ１０の押されている期間中、１秒間に３０コマの撮影が行われるようになされている（すなわち、高速連写モードになる）。

次に、電子カメラ１の内部の構成について説明する。図３は、図１及び図２に示す電子カメラの内部の構成例を示す斜視図である。ＣＣＤ２０は、撮影レンズ３の後段（面Ｘ２側）に設けられており、撮影レンズ３を介して結像する被写体の光画像を電気信号に光電変換するようになされている。

ＬＣＤ６の鉛直下側には、円柱形状の４本のバッテリ（単３型乾電池）２１が縦に並べられており、このバッテリ２１が発生する電力が装置の各部に供給される。また、発光部４を発光させるための電荷を蓄積しているコンデンサ２２は、バッテリ２１と並べて配置されている。

回路基板２３には、この電子カメラ１の各部を制御する種々の制御回路が形成されている。また、回路基板２３と、ＬＣＤ６及びバッテリ２１の間には、挿抜可能なメモリカード２４（記録手段）が設けられており、この電子カメラ１に入力される各種の情報が、メモリカード２４の予め設定されている領域に記録される。

なお、本実施例においては、メモリカード２４は挿抜可能とされているが、回路基板２３上にメモリを設け、そのメモリに各種情報を記録するようにしてもよい。また、メモリ（メモリカード２４）に記録されている各種情報を、図示せぬインタフェースを介して外部のパーソナルコンピュータに出力することができるようにしてもよい。

次に、本実施例の電子カメラ１の内部の電気的構成を、図４のブロック図を参照して説明する。レンズ駆動回路３０は、ＣＰＵ３６（図形作成手段）に制御され、撮影レンズ３を光軸方向に移動させ、オートフォーカスを実行する。複数の画素を備えているＣＣＤ２０は、各画素に結像した光画像を画像信号（電気信号）に光電変換するようになされている。また、ＣＣＤ駆動回路３９は、ディジタルシグナルプロセッサ（以下、ＤＳＰという）３３に制御され、ＣＣＤ２０を駆動するようになされている。

画像処理部３１は、ＣＣＤ２０が光電変換した画像信号を所定のタイミングで相関二重サンプリングすると共に、オートゲインコントロールにより、サンプリングされた画像信号の信号値が最適となるよう制御する。アナログ／ディジタル変換回路（以下、Ａ／Ｄ変換回路という）３２は、画像処理部３１でサンプリングした画像信号をディジタル化してＤＳＰ３３に供給するようになされている。

ＤＳＰ３３は、ディジタル化された画像信号に後述する所定の処理を施し、圧縮伸長回路およびメモリコントローラ（以下、圧縮伸長回路と略記する）３４に供給する。圧縮伸長回路３４は、ＤＳＰ３３から供給された画像信号（以下、単に撮影画像データという）を圧縮し、ＣＰＵ３６の制御に応じて、メモリカード２４の所定の領域（撮影画像記録領域）に格納するようになされている。

タイマ４５は、撮影した日時（年、月、日、時間）の情報を画像データのヘッダ情報として、メモリカード２４の撮影画像記録領域に記録するようになされている（すなわち、メモリカード２４の撮影画像記録領域に記録される撮影画像データには、撮影日時のデータが付随している）。

マイクロホン８は、音声を入力し（音声を集音し）、対応する電気信号に変換して音声ＩＣ（Integrated Ciruit）３８（再生手段）に供給する。音声ＩＣ３８は、入力された音声信号をＡ／Ｄ変換するとともに、ＡＤＰＣＭ（Adaptive Differential Pulse Code Modulation）による圧縮処理を施し、ＣＰＵ制御バスを介してＣＰＵ３６に供給する。

ＣＰＵ３６は、ディジタル化されて圧縮された音声データをＣＰＵ制御バスを介してメモリカード２４の所定の領域（音声記録領域）に記録するようになされている。また、このとき、メモリカード２４の音声記録領域には、録音日時のデータと音声の録音時間（再生時間）が音声データのヘッダ情報として記録されるようになされている。

ユーザの操作するペン型指示装置（以下、ペンという）４６（位置指定手段）によってタッチタブレット６Ａの所定の位置が押圧されると、ＣＰＵ３６は、タッチタブレット６Ａの押圧された位置のＸ−Ｙ座標を読み取り、その座標データ（後述する線画情報）をバッファメモリ３５に格納するようになされている。また、ＣＰＵ３６は、バッファメモリ３５に格納された線画情報を、線画情報入力日時のヘッダ情報とともに、メモリカード２４の線画情報記録領域に記録するようになされている。

フレームメモリ４７（出力手段）は、ＣＰＵ制御バスを介して送られてきた画像データを記憶し、ＬＣＤ６に表示するようになされている。但し、圧縮処理が施された撮影画像データは、一旦、圧縮伸長回路３４に入力され、そこで、伸長されてからフレームメモリ４７に供給されるようになされている。

更に、メモリカード２４から出力された音声データは、音声ＩＣ３８によりディジタル／アナログ変換（以下、Ｄ／Ａ変換という）が施され、アナログ信号に変換された後、スピーカ５に供給され、音声として出力されるようになされている。

フラッシュランプ駆動回路４１は、ＣＰＵ３６によって制御され、発光部４に内蔵されているフラッシュランプ４２を駆動するようになされている。また、赤目軽減ランプ駆動回路４３は、同様に、ＣＰＵ３６によって制御され、発光部４に内蔵されている赤目軽減ランプ４４を駆動するようになされている。なお、この赤目軽減ランプ４４は、フラッシュランプ４２が点灯される直前に発光されるようになされており、これにより被写体となる人物の瞳孔が閉じられるので、撮影された画像中の人物の目が赤くなる、いわゆる赤目を軽減することができる。

検出回路４０は、バッテリ２１の電圧を対応するディジタル信号に変換し、ＣＰＵ３６に供給する。ＣＰＵ３６は、検出回路４０から供給されるディジタル信号により、バッテリ２１の残量を検知することができる。

次に、本実施例の電子カメラ１の各種動作について説明する。

まず、本装置の音声情報の入出力処理（但し、音声情報のみの入出力処理）について説明する。

電源スイッチ１１が操作されることにより電子カメラ１に電源が投入された後、面Ｙ２に設けられている録音スイッチ１２が押されると、音声の録音処理（音声情報の入力処理）が開始される。音声情報はマイクロホン８を介して入力され、音声ＩＣ３８によりＡ／Ｄ変換と圧縮処理が施された後、ＣＰＵ３６に供給される。

ＣＰＵ３６に供給された音声データは、メモリカード２４に供給され、音声記録領域に記録される。このとき、メモリカード２４の音声記録領域には、録音日時のデータと録音時間（再生時間）が、ヘッダ情報として記録される。このような動作が、録音スイッチ１２を押圧している期間中、連続して行われる。

なお、この場合における音声は、ＡＤＰＣＭ方式で圧縮されるようにしたが、他の圧縮方式を用いるようにしてもよい。

次に、本実施例による被写体の撮影時の動作について説明する。

第１に、面Ｙ２に設けられている連写モード切り換えスイッチ１３が、Ｓモード（１コマだけ撮影を行うモード）に切り換えられている場合について説明する。最初に、面Ｙ１に設けられている電源スイッチ１１をユーザが操作することにより、電子カメラ１に電源を投入する。ファインダ２で被写体を確認し、面Ｙ１に設けられているレリーズスイッチ１０を押すと、被写体の撮影処理が開始される。

ファインダ２で観察される被写体の光画像が撮影レンズ３によって集光され、複数の画素を備えるＣＣＤ２０上に結像する。ＣＣＤ２０に結像した被写体の光画像は、各画素で画像信号に光電変換され、画像処理部３１によってサンプリングされる。画像処理部３１によってサンプリングされた画像信号は、Ａ／Ｄ変換回路３２に供給され、そこでディジタル化されてＤＳＰ３３に出力される。

ＤＳＰ３３は、ＲＧＢ（Red Green Blue）信号から色差信号を生成する処理を行うとともに、非線形処理であるγ処理を施す。圧縮伸長回路３４は、ＤＳＰ３３から供給された画像データを、離散的コサイン変換、量子化及びハフマン符号化を組み合わせたＪＰＥＧ（Joint Photografic Experts Group）方式に従って圧縮し、メモリカード２４の撮影画像記録領域に記録させる。このとき、メモリカード２４の撮影画像記録領域には、撮影日時のデータが、撮影画像データのヘッダ情報として記録される。

なお、連写モード切り換えスイッチ１３がＳモードに切り換えられている場合においては、１コマの撮影だけが行われ、レリーズスイッチ１０が継続して押され続けても、それ以降の撮影は行われず、ＬＣＤ６上に撮影された画像が表示される。

第２に、連写モード切り換えスイッチ１３がＬモード（１秒間に８コマの連写を行うモード）に切り換えられている場合について説明する。電源スイッチ１１を操作することにより、電子カメラ１に電源を投入し、面Ｙ１に設けられているレリーズスイッチ１０を押すと、被写体の撮影処理が開始される。

ファインダ２で観察される被写体の光画像が撮影レンズ３によって集光され、複数の画素を備えるＣＣＤ２０に結像する。ＣＣＤ２０に結像した被写体の光画像は画像信号に光電変換され、画像処理部３１によって１秒間に８回の割合でサンプリングされる。また、このとき、画像処理部３１は、ＣＣＤ２０の全画素のうち４分の１の画素をサンプリングする。

すなわち、画像処理部３１は、マトリクス状に配列されているＣＣＤ２０の画素を、図５に示すように、２×２画素（４つの画素）の領域に分割し、各領域の所定の位置に配置されている１画素の画像信号をサンプリングし、残りの３画素を間引く。

例えば、第１回目のサンプリング時（１コマ目）においては、各基本単位の左上の画素ａがサンプリングされ、その他の画素ｂ，ｃ，ｄが間引かれる。第２回目のサンプリング時（２コマ目）においては、各基本単位の右上の画素ｂがサンプリングされ、その他の画素ａ，ｃ，ｄが間引かれる。以下、第３回目、第４回目のサンプリング時においては、左下の画素ｃ、右下の画素ｄが、それぞれ、サンプリングされ、その他の画素が間引かれる。つまり、各画素は４回に１回だけサンプリングされる。

画像処理部３１によってサンプリングされた画像信号（ＣＣＤ２０の全画素中の４分の１の画素の画像信号）は、Ａ／Ｄ変換回路３２に供給され、そこでディジタル化されてＤＳＰ３３に出力される。

ＤＳＰ３３は、ディジタル化された画像信号に対して前述した処理を施し、圧縮伸長回路３４に出力する。圧縮伸長回路３４は、画像信号に対してＪＰＥＧ方式に基づく圧縮処理を施し、ＣＰＵ制御バスを介して、メモリカード２４の撮影画像記録領域に記録する。このとき、メモリカード２４の撮影画像記録領域には、撮影日時のデータが、撮影画像データのヘッダ情報として記録される。

第３に、連写モード切り換えスイッチ１３がＨモード（１秒間に３０コマの連写を行うモード）に切り換えられている場合について説明する。電源スイッチ１１を操作することにより、電子カメラ１の電源をＯＮの状態にし、面Ｙ１に設けられているレリーズスイッチ１０を押すと、被写体の撮影処理が開始される。

ファインダ２で観察される被写体の光画像が撮影レンズ３によって集光され、ＣＣＤ２０に結像する。複数の画素を備えるＣＣＤ２０に結像した被写体の光画像は、各画素で画像信号に光電変換され、画像処理部３１によって１秒間に３０回の割合でサンプリングされる。また、このとき、画像処理部３１は、ＣＣＤ２０の全画素のうち９分の１の画素をサンプリングする。

すなわち、画像処理部３１は、マトリクス状に配列されているＣＣＤ２０の画素を、図６に示すように、３×３画素を１つとする領域に分割し、その１つの領域から、所定の位置に配置されている１画素の画像電気信号を、１秒間に３０回の割合でサンプリングし、残りの８画素を間引く。

例えば、第１回目のサンプリング時（１コマ目）においては、各領域の左上の画素ａがサンプリングされ、その他の画素ｂ乃至ｉが間引かれる。第２回目のサンプリング時（２コマ目）においては、画素ａの右側に配置されている画素ｂがサンプリングされ、その他の画素ａ，ｃ乃至ｉが間引かれる。以下、第３回目以降のサンプリング時においては、画素ｃ、画素ｄ・・・が、それぞれ、サンプリングされ、その他の画素が間引かれる。つまり、９コマ毎に各画素がサンプリングされる。

画像処理部３１によってサンプリングされた画像信号（ＣＣＤ２０の全画素中の９分の１の画素の画像信号）は、Ａ／Ｄ変換回路３２に供給され、そこでディジタル化されてＤＳＰ３３に出力される。

ＤＳＰ３３は、ディジタル化された画像信号に前述の処理を施し、圧縮伸長回路３４に供給する。圧縮伸長回路３４は、ＪＰＥＧ方式に従って画像信号に圧縮処理を施した後、タイマ４５から供給される撮影日時をヘッダ情報として付加し、メモリカード２４の撮影画像記録領域に記録する。

次に、タッチタブレット６Ａから２次元の線画情報（ペン入力情報）を入力する場合の動作について説明する。タッチタブレット６Ａがペン４６のペン先で押圧されると、接触した箇所のＸ−Ｙ座標がＣＰＵ３６に供給される。このＸ−Ｙ座標は、バッファメモリ３５に格納されるとともに、フレームメモリ４７の内部の上記Ｘ−Ｙ座標の各点に対応した箇所にデータが書き込まれ、ＬＣＤ６上に表示される。

上述したように、ＬＣＤ６の表面上に形成されているタッチタブレット６Ａは、透明部材によって構成されているので、ユーザは、ＬＣＤ６上に表示される点（ペン４６のペン先で押圧された位置の点）を観察することができ、あたかもＬＣＤ６上に直接ペン入力をしたかのように感じることができる。また、ペン４６をタッチタブレット６Ａ上で移動させると、ＬＣＤ６上には、ペン４６の移動に伴う線が描画される。さらに、ペン４６をタッチタブレット６Ａ上で断続的に移動させると、ＬＣＤ６上には、ペン４６の移動に伴う破線が表示される。以上のようにして、ユーザは、タッチタブレット６Ａ（ＬＣＤ６）から所望の文字、図形等の線画情報を入力することができる。

また、ＬＣＤ６上に撮影画像が表示されている場合において、ペン４６によって線画情報が入力されると、この線画情報が、撮影画像情報とともに、フレームメモリ４７で合成され、ＬＣＤ６上に表示される。

なお、ユーザは、図示せぬ色選択スイッチを操作することによって、ＬＣＤ６上に表示される線画の色を、黒、白、赤、青等の色から選択することができる。

ペン４６によるタッチタブレット６Ａへの線画情報の入力後、操作キー７の実行キー７Ｂが押されると、バッファメモリ３５に格納されている線画情報が、入力日時のヘッダ情報とともにＣＰＵ制御バスを介してメモリカード２４に供給され、線画情報記録領域に記録される。

なお、メモリカード２４に記録される線画情報は、圧縮処理の施された情報である。タッチタブレット６Ａに入力された線画情報は空間周波数成分の高い情報を多く含んでいるので、撮影画像の圧縮に用いられる上記ＪＰＥＧ方式によって圧縮処理を行うと、圧縮効率が悪く、情報量を削減できないので、圧縮及び伸長に必要な時間が長くなってしまう。さらに、ＪＰＥＧ方式による圧縮は、非可逆圧縮であるので、情報量の少ない線画情報の圧縮には適していない（伸長してＬＣＤ６上に表示した場合、情報の欠落に伴うギャザ、にじみが際だってしまうため）。

そこで、本実施例においては、ファックス等において用いられるランレングス法によって、線画情報を圧縮するようにしている。ランレングス法とは、線画画面を水平方向に走査し、黒、白、赤、青等の各色の情報（点）の継続する長さ、及び無情報（ペン入力のない部分）の継続する長さを符号化することにより、線画情報を圧縮する方法である。

このランレングス法を用いることにより、線画情報を有効に圧縮することができ、また、圧縮された線画情報を伸長した場合においても、情報の欠落を抑制することが可能になる。なお、線画情報は、その情報量が比較的少ない場合には、圧縮しないようにすることもできる。

また、上述したように、ＬＣＤ６上に撮影画像が表示されている場合において、ペン入力を行うと、撮影画像データとペン入力の線画情報がフレームメモリ４７で合成され、撮影画像と線画の合成画像がＬＣＤ６上に表示される。その一方で、メモリカード２４においては、撮影画像データは、撮影画像記録領域に記録され、線画情報は、線画情報記録領域に記録される。このように、２つの情報が、各々異なる領域に記録されるので、ユーザは、撮影画像と線画の合成画像から、いずれか一方の画像（例えば線画）を削除することができ、さらに、各々の画像情報を個別の圧縮方法で圧縮することもできる。

メモリカード２４の音声記録領域、撮影画像記録領域、または線画情報記録領域にデータを記録した場合、図７に示すように、ＬＣＤ６に所定の表示が行われる。図７に示す表示例においては、情報を記録した時点の年月日（記録年月日）（この場合、１９９６年６月３０日）が画面の上端部に表示され、その記録年月日に記録された情報の記録時刻が画面の最も左側に表示されている。

記録時刻の右隣には、サムネイル（Thumb Nail）画像が表示されている。このサムネイル画像は、メモリカード２４に記録された撮影画像データの各画像データのビットマップデータを間引いて（縮小して）作成されたものである。この表示のある情報は、撮影画像情報を含む情報である。つまり、「１０時１６分」と「１０時２１分」に記録（入力）された情報には、撮影画像情報が含まれており、「１０時０５分」、「１０時２８分」、「１０時５４分」に記録された情報には、画像情報が含まれていない。

また、メモ記号「＊」は、線画情報として所定のメモが記録されていることを表している。

サムネイル画像の表示領域の右側には、音声サムネイルが表示され、録音時間に対応する長さの線分が表示される（音声情報が入力されていない場合は、表示されない）。この音声サムネイルの表示処理については後述する。

なお、この実施例において、サムネイル画像や音声サムネイルなどの表示の順序は、メモリカード２４に記録されている順序（時系列順）とされている。即ち、１画面で表示することができない多数の情報が記録されている場合に、この画面の表示処理を行うと、最も古い記録情報が最初の行に表示され、以下、記録日時（撮影日時、入力日時、または録音日時）が古い順に表示されることになる。

ユーザは、図７に示すＬＣＤ６の所望の音声サムネイルを、ペン４６のペン先でダブルクリックして（同一の場所を２回連続して押圧して）、再生する情報を選択指定し、実行キー（ＥＸＥＣキー）７Ｂをペン４６のペン先で押圧することにより、所望の情報を再生させることができる。

例えば、図７に示す「１０時０５分」の右側に表示されている音声サムネイルがペン４６によってダブルクリックされると、ＣＰＵ３６は、選択された録音日時（１０時０５分）に対応する音声データをメモリカード２４から読み出し、音声ＩＣ３８に供給する。音声ＩＣ３８は、音声データ（圧縮されている音声データ）に伸長処理を施し、更にＤ／Ａ変換を施してアナログ信号に変換してスピーカ５に供給する。スピーカ５は、供給されたアナログ信号を音声に変換し、出力する。なお、イヤホンジャック９に図示せぬイヤホンが接続されている場合においては、スピーカ５からは音声が再生されず、図示せぬイヤホンにより音声が再生される。なお、この音声サムネイルの再生処理についても後述する。

メモリカード２４に記録した撮影画像データを再生する場合、ユーザは、所望のサムネイル画像をペン４６のペン先で押圧することにより、その情報を選択し、続いて、実行キー７Ｂを押すことにより、選択した情報を再生させる。

ＣＰＵ３６は、選択された撮影日時に対応する撮影画像データをメモリカード２４から読み出し、圧縮伸長回路３４に供給する。圧縮伸長回路３４に供給された撮影画像データ（圧縮されている撮影画像データ）はそこで伸長され、ＣＰＵ３６に再び出力される。ＣＰＵ３６は、この撮影画像データをビットマップデータとしてフレームメモリ４７に一旦格納させた後、ＬＣＤ６に表示させる。

Ｓモードで撮影された画像は、ＬＣＤ６上に、静止画像として表示される。この静止画像は、ＣＣＤ２０の全ての画素の画像信号を再生したものであることはいうまでもない。

Ｌモードで撮影された画像は、ＬＣＤ６上において、１秒間に８コマの割合で連続して表示される。このとき、各コマに表示される画素数は、ＣＣＤ２０の全画素数の４分の１である。

人間の視覚は、静止画像の解像度の劣化に対しては敏感であるため、静止画像の画素を間引くと、ユーザはこれを容易に感知してしまう。しかしながら、１秒間に８コマの画像が再生されるＬモードでは、各コマの画素数はＣＣＤ２０の画素数の４分の１になるが、前述のように１秒間に８コマの画像が再生されるので、単位時間当たりの情報量は、静止画像の場合に比べて２倍になる。

すなわち、Ｓモードで撮影された画像の１コマの画素数を１とすると、Ｌモードで撮影された画像の１コマの画素数は１／４となる。Ｓモードで撮影された画像（静止画像）がＬＣＤ６に表示された場合、１秒間に人間の目に入る情報量は１（＝（画素数１）×（コマ数１））となる。一方、Ｌモードで撮影された画像がＬＣＤ６に表示された場合、１秒間に人間の目に入る情報量は２（＝（画素数１／４）×（コマ数８））となる（すなわち、人間の目には、静止画像の２倍の情報が入る）。従って、１コマ中の画素の数を４分の１にした場合でも、再生時において、ユーザは、画質の劣化をさほど気にしない。

さらに、本実施例においては、各コマ毎に異なる画素をサンプリングし、そのサンプリングした画素をＬＣＤ６に表示するようにしているので、人間の目に残像効果が起こり、１コマ当たり４分の３画素を間引いたとしても、ユーザは、画質の劣化をさほど気にすることなく、ＬＣＤ６に表示されるＬモードで撮影された画像を観察することができる。

また、Ｈモードで撮影された画像は、ＬＣＤ６上において、１秒間に３０コマの割合で連続して表示される。このとき、各コマに表示される画素数は、ＣＣＤ２０の全画素数の９分の１であるが、Ｌモードの場合と同様の理由で、ユーザは、画質の劣化をさほど気にすることなくＬＣＤ６に表示されるＨモードで撮影された画像を観察することができる。

本実施例においては、Ｌモード及びＨモードで被写体を撮像する場合、画像処理部３１が、再生時における画質の劣化が気にならない程度にＣＣＤ２０の画素を間引くようにしているので、ＤＳＰ３３と圧縮伸長回路３４の負荷を低減することができ、これらを、低速度、低電力で作動させることができる。また、このことにより、装置の低コスト化及び低消費電力化が可能になる。

図８は、図７に示す音声サムネイルを表示する処理の一例を説明するフローチャートである。この処理は、例えば、電子カメラ１が再生モードにされた場合に実行される。

ステップＳ１において、ＣＰＵ３６は、メモリカード２４の音声記録領域から、ヘッダ情報として記録されている音声データの再生時間を読み出し、読み出された音声データの再生時間を３０秒で除算し、得られた解の整数部分を変数ｎに代入する（ｎ←ｄｉｖ（音声データの再生時間，３０ｓｅｃ））。なお、ｄｉｖ（ｘ，ｙ）は、ｘをｙで除算した結果の整数値を求める関数である。

ステップＳ２では、ＣＰＵ３６は、ステップＳ１において読み出された音声データの再生時間を３０秒で除算した余りを変数ｍに代入する（ｍ←ｍｏｄ（音声データの再生時間，３０ｓｅｃ））。なお、ｍｏｄ（ｘ，ｙ）は、ｘをｙで除算した余りを求める関数である。

次のステップＳ３では、ＣＰＵ３６は、ステップＳ１において求めた変数ｎに格納されている値に対応する本数の線分をＬＣＤ６に表示する。なお、この線分は、１本あたり３０秒の音声データに対応しているので、例えば、音声データの再生時間が１分３０である場合には、ｎ＝３となり、３本の線分が表示されることになる。

ステップＳ４では、ステップＳ２において求めたｍの値に対応する長さの線分を表示する。即ち、変数ｍの値は、０≦ｍ＜３０であるので、ステップＳ３で表示される線分の長さの、ｍ／３０に対応する長さの線分が表示されることになる。例えば、音声データの再生時間が４５秒である場合は、ｎ＝１，ｍ＝１５となり、ステップＳ３の処理において、３０秒に対応する線分が１本表示され、その長さの１／２（＝１５／３０）の長さの線分がステップＳ４の処理において表示されることになる。

図９は、本発明を適用した音声データの再生処理の一例を説明するフローチャートである。この処理は、図８の処理が終了した後に実行される。

この処理が実行されると、ステップＳ２０において、ＣＰＵ３６は、タッチタブレット６Ａが押圧されたか否かを判定する。その結果、タッチタブレット６Ａが押圧された（ＹＥＳ）と判定した場合は、ステップＳ２１の処理に進み、また、タッチタブレット６Ａが押圧されていないと判定した場合は、ステップＳ２０に戻り同様の処理を繰り返す。

続く、ステップＳ２１において、ＣＰＵ２０は、ペン４６の座標（ｘ₁，ｙ₁）を取得する。そして、ステップＳ２２に進み、ＣＰＵ２０は、タッチタブレット６Ａが再度押圧されたか否かを判定する。その結果、タッチタブレット６Ａが押圧された（ＹＥＳ）と判定した場合は、ステップＳ２３の処理に進み、また、タッチタブレット６Ａが押圧されていない（ＮＯ）と判定した場合は、ステップＳ２２に戻り同様の処理を繰り返す。

ステップＳ２３では、ＣＰＵ３６は、ペン４６の座標（ｘ₂，ｙ₂）を取得する。そして、ステップＳ２４に進み、ＣＰＵ３６は、２つの座標（ｘ₁，ｙ₁）と（ｘ₂，ｙ₂）を始点または終点として囲まれる部分の音声サムネイルの表示色を変更する。

次のステップＳ２５において、ＣＰＵ３６は、実行（ＥＸＥＣ）キー７Ｂが押圧されたか否かを判定する。その結果、実行キー７Ｂが押圧された（ＹＥＳ）と判定した場合は、ステップＳ２６の処理に進み、また、実行キー７Ｂが押圧されていない（ＮＯ）と判定した場合は、ステップＳ２５に戻り同様の処理を繰り返す。

ステップＳ２６では、ＣＰＵ３６は、２つの座標（ｘ₁，ｙ₁）と（ｘ₂，ｙ₂）を始点または終点として指定される音声サムネイルの領域に対応する部分の音声データをメモリカード２４から読み出し、音声ＩＣ３８に供給することにより、指定された部分の音声を再生する。

いま、図１０に示す表示例において、音声サムネイルの所定の位置がペン４６により押圧された場合、ＣＰＵ３６は、ステップＳ２０において、タッチタブレット６Ａが押圧された（ＹＥＳ）と判定し、ステップＳ２１に進む。ステップＳ２１では、ペン４６の座標（ｘ₁，ｙ₁）が取得される。

次に、図１１の表示例に示すように、音声サムネイルの他の部分がペン４６によって再度押圧された場合、ＣＰＵ３６は、ステップＳ２２において、タッチタブレット６Ａが再度押圧された（ＹＥＳ）と判定し、ステップＳ２３の処理に進む。ステップＳ２３では、ペン４６の座標（ｘ₂，ｙ₂）が取得される。

ステップＳ２４では、ＣＰＵ３６は、取得された２つの座標（ｘ₁，ｙ₁）と（ｘ₂，ｙ₂）を始点または終点として囲まれる部分の音声サムネイルの表示色を変更する。その結果、これら２つの座標を始点または終点として囲まれる部分の音声サムネイルは、図１２に示すように表示色が変更されることになる（この図においては、線の太さにより表示色の相違を表している）。

以上のように音声サムネイルの所定の部分が指定された後、ペン４６により実行キー７Ｂが押圧されると、ＣＰＵ３６は、ステップＳ２５において、実行キー７Ｂが押圧された（ＹＥＳ）と判定し、ステップＳ２６に進む。そして、ＣＰＵ３６は、表示色が変更されている部分に対応する部分の音声データをメモリカード２４から読み出し、音声ＩＣ３８に供給し、再生させる。

以上のような処理によれば、画面上に表示されている音声サムネイル上の２点をペン４６により指定することにより、音声データを部分的に再生することが可能となる。

なお、以上の実施例では、最初に指定された座標（ｘ₁，ｙ₁）を始点とし、次に指定された座標（ｘ₂，ｙ₂）を終点とするようにしたが、例えば、最初に座標（ｘ₂，ｙ₂）が指定され、次に座標（ｘ₁，ｙ₁）が指定された場合には、最初に指定された座標を終点とし、次に指定された座標を始点とする処理を行うようにしてもよい。

また、以上の実施例では、１本の音声サムネイル（線分）上において、始点と終点を指定したが、異なる音声サムネイル（線分）上において、始点と終点を指定することも可能であることは言うまでもない。

更に、ペン４６により音声サムネイルをダブルクリックした場合には、音声データを全て（最初から最後まで）再生するようにすることも可能である。

図１３は、本発明を適用した再生処理の他の一例を説明するフローチャートである。この処理も、図９に示す処理と同様に、図８に示す処理が終了した後に実行される。

この処理が実行されると、ステップＳ４０において、ＣＰＵ３６はタッチタブレット６Ａがペン４６により押圧されたか否かを判定する。その結果、タッチタブレット６Ａが押圧された（ＹＥＳ）と判定した場合は、ステップＳ４１に進み、また、タッチタブレット６Ａが押圧されていない（ＮＯ）と判定した場合は、ステップＳ４０に戻り同様の処理を繰り返す。

ステップＳ４１では、ＣＰＵ３６はペン４６の座標（ｘ₁，ｙ₁）を取得する。そして、ステップＳ４２に進み、ペン４６がタッチタブレット６Ａから離されたか否かを判定する。その結果、ペン４６がタッチタブレット６Ａから離された（ＹＥＳ）と判定した場合は、ステップＳ４３に進み、また、ペン４６がタッチタブレット６Ａから離されていない（ＮＯ）と判定した場合は、ステップＳ４２に戻り同様の処理を繰り返す。

続くステップＳ４３において、ＣＰＵ３６は、ペン４６がタッチタブレット６Ａから離された座標（ｘ₂，ｙ₂）を取得する。そして、ステップＳ４４に進み、ｙ₁，ｙ₂に最も近い音声サムネイルの座標Ｙ₁，Ｙ₂をそれぞれ取得する。即ち、音声サムネイルの真上がペン４６により押圧されるとは限らないので、音声サムネイルから多少離れた場所が押圧された場合においても、再生処理が可能となるように座標の変換を行う。なお、この座標変換は、現在表示されている全ての音声サムネイルのＹ座標を記憶しておき、ペン４６により押圧されたｙ座標に最も近い座標値を検索することにより実行可能である。

ステップＳ４５では、ＣＰＵ３６は、座標（ｘ₁，Ｙ₁）と（ｘ₂，Ｙ₂）を始点または終点として指定される部分の音声サムネイルの表示色を変更する。そして、ステップＳ４６に進み、座標（ｘ₁，Ｙ₁）と（ｘ₂，Ｙ₂）を始点または終点として指定される音声サムネイルの領域に対応する部分の音声データをメモリカード２４から読み出し、音声ＩＣ３８に供給し、再生させる。

いま、図１４に示す表示画面において、画面上の一点がペン４６により指定された場合、ステップＳ４０において、タッチタブレット６Ａが押圧された（ＹＥＳ）と判定され、ステップＳ４１に進む。ステップＳ４１では、ペン４６の座標（ｘ₁，ｙ₁）が取得され、ステップＳ４２に進む。

図１５に示すように、ペン４６がドラッグされ（ペン４６がタッチタブレット６Ａに押圧されたままで移動され）た後、タッチタブレット６Ａより離された場合、ステップＳ４２において（ＹＥＳ）と判定され、ステップＳ４３に進む。ステップＳ４３では、ペン４６がタッチタブレット６Ａから離された座標（ｘ₂，ｙ₂）が取得され、ステップＳ４４に進む。

ステップＳ４４では、ｙ₁，ｙ₂に最も近い音声サムネイルの座標Ｙ₁，Ｙ₂がそれぞれ取得される。即ち、図１５の例では、座標ｙ₁に対しては、第１番目の音声サムネイルのＹ座標であるＹ₁が取得され、また、座標ｙ₂に対しては、第３番目の音声サムネイルのＹ座標であるＹ₂が取得される。

ステップＳ４５においては、２つの座標（ｘ₁，Ｙ₁）と（ｘ₂，Ｙ₂）を始点または終点として指定される部分の音声サムネイルの表示色が図１６に示すように変更される（この図においては、線の太さにより表示色の相違を表している）。そして、ステップＳ４６において、表示色が変更された領域に対応する部分の音声データがメモリカード２４より読み出され、音声ＩＣ３８に供給される。その結果、指定された部分の音声データが再生されることになる。

以上のような実施例によれば、タッチタブレット６Ａ上でペン４６を軽く移動させるだけで、音声データの所望の部分を再生することができる。

なお、図１６に示すように、音声データを再生している際には、音声の再生が現在行われている部分を矢印（↓）等によって明示するようにしてもよい。また、以上の実施例では、音声サムネイルの表示色を変更した直後に、音声の再生処理を実行するようにしたが、前述の実施例と同様に、実行キー７Ｂが押圧された場合に再生処理を実行するようにしてもよい。

図１７は、本発明を適用した音声サムネイルの表示処理の一例を説明するフローチャートである。この処理は、例えば、電子カメラ１が再生モードにされた場合に実行される。

この処理が実行されると、ステップＳ６０において、ＣＰＵ３６は、メモリカード２４から音声サムネイルとして表示しようとする音声データを読み出し、音声ＩＣ３８に供給して伸長処理を施した後、１次元配列Ｄａｔａ［ｉ］（ｉ＝１，２，・・・，Ｎ）（Ｎは音声データのデータ数）に格納する。そして、ステップＳ６１に進み、Ｄａｔａ［ｉ］に格納されている各音声データの絶対値を求め、１次元配列Ａｂｓ［ｉ］（ｉ＝１，２，・・・，Ｎ）に格納する。

続くステップＳ６２において、ＣＰＵ３６は、１次元配列Ｌｅｖｅｌ［ｉ］（ｉ＝１，２，・・・，Ｎ）に、以下の式により得られる値（１または０）を格納する。

δ｛（Ａｂｓ［ｉ−ｎ／２］＋Ａｂｓ［ｉ−ｎ／２＋１］＋・・・＋Ａｂｓ［ｉ］＋・・・＋Ａｂｓ［ｉ＋ｎ／２］）／ｎ，Ｒｅｆ｝・・・（１）

なお、δ｛ｘ，Ｒｅｆ｝は、ｘの値が基準値Ｒｅｆよりも大きいか、これらが等しい（ｘ≧Ｒｅｆ）場合は、δ｛ｘ，Ｒｅｆ｝＝１となり、逆に、ｘの値が基準値Ｒｅｆよりも小さい（ｘ＜Ｒｅｆ）場合は、δ｛ｘ，Ｒｅｆ｝＝０となる関数である。また、ｎは、１回の処理において対象となる音声データのデータ数であり、例えば、ｎ＝１０とされる。更に、Ａｂｓ［ｘ］において、ｘ＜１となる場合は、データが存在しないため（ｘ＝１，２，・・・，Ｎであるため）、Ａｂｓ［ｘ］＝０とされるとともに、分母のｎの値が１だけ減算される。このような処理により、音声データの絶対値の平均値が基準値Ｒｅｆを超過する部分（音声の瞬時値の平均値が基準値Ｒｅｆを超過する部分）に対しては、配列Ｌｅｖｅｌに値１が格納される。

次のステップＳ６３において、ＣＰＵ３６は、対象となる音声データの再生時間を３０秒で除算した結果の整数部（＝ｄｉｖ（音声データの再生時間，３０ｓｅｃ））を変数ｇに代入する。また、ステップＳ６４では、音声データの再生時間を３０秒で除算した余り（＝ｍｏｄ（音声データの再生時間，３０ｓｅｃ））を変数ｈに代入する。

ステップＳ６５では、変数ｇの値に対応する本数の長方形がＬＣＤ６上に音声サムネイルとして表示され、また、ステップＳ６６では、変数ｈの値に対応する長さの長方形が表示される。なお、ステップＳ６３乃至Ｓ６６の処理は、図８におけるステップＳ１乃至Ｓ４の処理と同様である。

ステップＳ６７では、変数ｉが１に初期設定され、ステップＳ６８に進む。ステップＳ６８では、Ｌｅｖｅｌ［ｉ］に格納されている値が“１”であるか否かが判定される。その結果、Ｌｅｖｅｌ［ｉ］に格納されている値が“１”である（ＹＥＳ）と判定された場合は、ステップＳ６９に進み、また、Ｌｅｖｅｌ［ｉ］に格納されている値が“１”ではない（ＮＯ）と判定された場合は、ステップＳ６９の処理をスキップし、ステップＳ７０に進む。

ステップＳ６９では、音声サムネイルの変数ｉの値に対応する部分の表示色が変更される。即ち、前述のように、配列Ｌｅｖｅｌに格納されている値が“１”である場合には、その部分の音声データの瞬時値が所定のレベル（Ｒｅｆ）を超過していることを示しており、音声サムネイルの表示色を変更することにより、その部分を明示する。そして、ステップＳ７０において、変数ｉの値が１だけインクリメントされる。

続くステップＳ７１では、変数ｉの値が音声データのデータ数Ｎよりも大きいか否かが判定される。その結果、変数ｉの値がデータ数Ｎよりも小さいか、または、これらが等しい（ＮＯ）と判定された場合は、ステップＳ６８に戻り同様の処理が繰り返される。また、変数ｉの値がデータ数Ｎよりも大きい（ＹＥＳ）と判定された場合は処理を終了する（エンド）。

以上のような処理により表示される音声サムネイルの表示例を図１８に示す。この図に示すように、所定のレベル（Ｒｅｆ）を超過する部分の音声データに対応する領域の音声サムネイルは、表示色が変更されている。この例では、領域ａ乃至領域ｄの４カ所の表示色が変更されており、これらの領域の音声データが、所定のレベルを超過していることが示されている。

なお、以上の実施例では、音声データの絶対値の平均値を、基準値Ｒｅｆと比較することにより、所定のレベルを超過した音声データを検出するようにしたが、本発明は、このような方法のみに限定されるものではないことは勿論である。例えば、音声データの２乗の平均値を基準値と比較するようにしてもよい。

また、基準値Ｒｅｆを適当に設定することにより、例えば、複数の発話が同時進行的になされている場合に、特定の発話（マイクロホン８に最も近い場所でなされている発話）に対応する部分のみの表示色を変更するようにすることも可能である。

図１９は、図１８の表示例において、音声データの再生を指定した場合に実行される処理の一例を説明するフローチャートである。この処理では、変数ｓｔａｒｔとｓｔｏｐに格納されている値を、それぞれ始点と終点とし、対応する音声データを再生するようになされている。これら２つの値は、例えば、ペン４６により音声サムネイル上の２点が指定された場合に取得される。

この処理が実行されると、ステップＳ９０において、ＣＰＵ３６は、ステップＳ９０において、変数ｓｔａｒｔに格納されている値を変数ｉに代入する。ステップＳ９１では、図１７の処理により得られた配列Ｌｅｖｅｌの第ｉ番目の値が“１”であるか否かが判定される（即ち、Ｌｅｖｅｌ［ｉ］＝１であるか否かが判定される）。その結果、Ｌｅｖｅｌ［ｉ］＝１である（ＹＥＳ）と判定された場合は、ステップＳ９２に進み、値ｉに対応する音声データをメモリカード２４から読み出し、音声ＩＣ３８に供給して再生させる。また、Ｌｅｖｅｌ［ｉ］≠１である（ＮＯ）と判定された場合は、ステップＳ９２の処理をスキップし、ステップＳ９３に進む。

ステップＳ９３においては、変数ｉの値が１だけインクリメントされ、ステップＳ９４に進む。ステップＳ９４では、変数ｉの値がｓｔｏｐの値よりも大きいか否かが判定される。その結果、変数ｉの値がｓｔｏｐの値よりも大きい（ＹＥＳ）と判定された場合は処理を終了し、また、変数ｉの値がｓｔｏｐの値よりも小さいか、または、これらが等しい（ＮＯ）と判定された場合はステップＳ９１に戻り、同様の処理を繰り返すことになる。

いま、図１８に示す表示画面上において、音声サムネイルの最初の部分（音声データの先頭）と最後の部分（音声データの末尾）をそれぞれ、始点と終点として図１９に示す処理を実行した場合、領域ａ乃至領域ｄが順に再生され、その他の部分（図１８において、ハッチングが施されていない部分）は再生が実行されない。従って、不要な部分（音声のレベルが低い部分（例えば、会話が行われていない部分））の再生が省略されるので、その分だけ再生時間が短縮されることになる。

以上の実施例では、始点と終点を指定し、再生を実行するようにしたが、例えば、再生しようとする部分（領域ａ乃至領域ｄ）をペン４６により指定し、指定された部分の音声データのみを再生するようにしてもよい。例えば、ペン４６により、領域ａ，ｄの一部が押圧された後、実行キー７Ｂが押圧された場合は、領域ａ，ｄに対応する部分の音声データがカードメモリ２４より読み出され、再生されるようにしてもよい。

図２０は、図１８の表示画面において、画面の下部に表示されている「Ｓｌｏｗ」または「Ｆａｓｔ」ボタンが押圧された場合に実行される処理の一例を説明するフローチャートである。

ステップＳ１１０において、ＣＰＵ３６はＳｌｏｗボタンが押圧されたか否かを判定する。その結果、Ｓｌｏｗボタンが押圧された（ＹＥＳ）と判定した場合は、ステップＳ１１１に進み、音声ＩＣ３８に出力クロックの周期を長くするための制御信号を出力する。即ち、音声をＤ／Ａ変換する周期を通常よりも長くすることにより、音声の再生スピードを遅くする。また、Ｓｌｏｗボタンが押圧されていない（ＮＯ）と判定した場合は、ステップＳ１１１の処理をスキップし、ステップＳ１１２に進む。

ステップＳ１１２では、ＣＰＵ３６は、Ｆａｓｔボタンが押圧されたか否かを判定する。その結果、Ｆａｓｔボタンが押圧された（ＹＥＳ）と判定した場合は、ステップＳ１１３に進み、音声ＩＣ３８に出力クロックの周期を短くするための制御信号を出力する。即ち、音声をＤ／Ａ変換する周期を通常よりも短くすることにより、音声の再生スピードを速くする。また、Ｆａｓｔボタンが押圧されていない（ＮＯ）と判定した場合は、ステップＳ１１３の処理をスキップし、処理を終了する（エンド）。

このような処理によれば、音声データの再生スピードを変更することができるので、例えば、不明瞭な発話等が記録されている場合には、その部分をペン４６により指定し、Ｓｌｏｗボタンを押圧してから再生させることにより、不明瞭な部分をゆっくり再生させることができる。また、比較的時間の長い会話等が録音されている場合は、Ｆａｓｔボタンを押圧してから再生することにより、短時間で会話の内容を把握することが可能となる。

なお、図１８の最下部に表示されている「Ｒｅｐｅａｔ」ボタンが押圧された場合には、直前に再生された音声データを再度再生するようにしてもよい。これにより、例えば、外国語等の発話において、特定の単語が聞き取れない場合に、その部分を繰り返し聞くことが可能となる。

また、以上の実施例では、音声ＩＣ３８の出力クロックの周期を変更することにより、再生スピードを変化させるようにした。しかしながら、例えば、ＣＰＵ３６が所定の時間毎にソフトウエア割り込みにより１処理単位の音声データを音声ＩＣ３８に供給するように構成し、このソフトウエア割り込みが生ずる時間（周期）を変更することにより音声の再生スピードを変更するようにしてもよい。

図２１は、本発明を適用した他の音声サムネイルの表示の一例を示している。

この表示例では、音声データの再生時間に対応した角度を有する扇形が表示されている。即ち、最長の再生時間（例えば、３分）を３６０度とした場合に、表示しようとする音声データの再生時間に対応する角度を求め、求められた角度を有する扇形を音声サムネイルとして表示する。

図２２は、このような表示画面において、扇形の音声サムネイル上または、その近傍の２点がペン４６により押圧された場合に、それら２点を始点または終点として音声を再生する処理の一例を説明するフローチャートである。なお、この処理は、図２１の画面が表示された後に実行される。

ステップＳ１３０において、ＣＰＵ３６は、タッチタブレット６Ａが押圧されたか否かを判定する。その結果、タッチタブレット６Ａが押圧された（ＹＥＳ）と判定した場合は、ステップＳ１３１に進み、また、押圧されていない（ＮＯ）と判定した場合はステップＳ１３０に戻り同様の処理を繰り返す。

ステップＳ１３１において、ＣＰＵ３６は、ペン４６の座標（ｘ₁，ｙ₁）を取得する。そして、ステップＳ１３２に進み、扇形の始点Ｐ、中心点Ｏ、および、座標（ｘ₁，ｙ₁）の間の角度θ₁を求める（図２３参照）。

ステップＳ１３３では、ＣＰＵ３６は、タッチタブレット６Ａが再度押圧されたか否かを判定する。その結果、タッチタブレット６Ａが押圧された（ＹＥＳ）と判定した場合は、ステップＳ１３４に進み、また、押圧されていない（ＮＯ）と判定した場合は、ステップＳ１３３に戻り同様の処理を繰り返す。

ステップＳ１３４においては、ＣＰＵ３６は、ペン４６の座標（ｘ₂，ｙ₂）を取得する。そして、ステップＳ１３５において、扇形の始点Ｐ、中心点Ｏ、および座標（ｘ₂，ｙ₂）の間の角度θ₂を求める（図２３参照）。

続くステップＳ１３６では、ＣＰＵ３６は、実行キー７Ｂが押圧されたか否かを判定する。その結果、実行キー７Ｂが押圧された（ＹＥＳ）と判定すると、ステップＳ１３７に進み、また、実行キー７Ｂが押圧されていない（ＮＯ）と判定すると、ステップＳ１３６に戻り同様の処理を繰り返す。

ステップＳ１３７では、ＣＰＵ３６は、θ₁とθ₂をそれぞれ始点または終点として、音声データの対応する部分をメモリカード２４から読み出し、音声ＩＣ３８に供給する。その結果、ペン４６により指示された２点を始点または終点として、指定される部分の音声データが再生されることになる。

いま、例えば、図２３に示すような扇形が表示されている場合に、ペン４６により、座標（ｘ₁，ｙ₁）が押圧されたとする。すると、ＣＰＵ３６は、ステップＳ１３０において、タッチタブレット６Ａが押圧された（ＹＥＳ）と判定し、ステップＳ１３１に進み、ペン４６の座標（ｘ₁，ｙ₁）を取得する。そして、ステップＳ１３２では、扇形の始点Ｐ、中心点Ｏ、および座標（ｘ₁，ｙ₁）の間の角度θ₁が求められる。

そして、座標（ｘ₂，ｙ₂）がペン４６により指示された場合、ＣＰＵ３６はステップＳ１３３においてタッチタブレット６Ａが押圧された（ＹＥＳ）と判定し、ステップＳ１３４に進む。ステップＳ１３４では、ペン４６の座標（ｘ₂，ｙ₂）が求められ、更に、ステップＳ１３５において、扇形の始点Ｐ、中心点Ｏ、および座標（ｘ₂，ｙ₂）の間の角度θ₂が求められる。

続いて、実行キー７Ｂが押圧されると、ＣＰＵ３６は、ステップＳ１３６において、実行キー７Ｂが押圧された（ＹＥＳ）と判定し、ステップＳ１３７に進む。ステップＳ１３７では、θ₁とθ₂をそれぞれ、始点または終点として指定される部分の音声データをメモリカード２４から読み出し、音声ＩＣ３８に供給することにより、指定された部分の音声を再生させる。

以上のような実施例によれば、例えば、図２３に示すように、座標（ｘ₁，ｙ₁）と座標（ｘ₂，ｙ₂）を指定することにより、音声データを部分的に再生することが可能となる。このように、扇形の内部の座標を指定する場合は、ペン４６を移動させる距離を短くすることができる。即ち、この例では、最短の場合、２つの座標を結ぶ直線の長さ（＝（（ｘ₂−ｘ₁）²＋（ｙ₂−ｙ₁）²）^1/2）だけペン４６を移動させればよい。

また、扇形の外部の座標を指定するようにしてもよい。例えば、図２３に示すように、座標（ｘ₃，ｙ₃）と座標（ｘ₄，ｙ₄）を指定し、これらの座標により指定される部分の音声データを再生するようにしてもよい。このように、扇形の外部の座標を指定する場合では、ペン４６を移動させる距離は、扇形の内部を指示する場合に比べて長くなるものの、その分、位置を正確に指定することができる。

更に、以上の例では、音声データの再生時間に応じた角度を有する扇形を表示するようにしたが、図２４に示すように、再生時間によらず一定の大きさの円を表示し、円の内部または外部に再生時間を表示するようにしてもよい。そして、再生時間が視覚的に把握しやすくなるように、例えば、円の外周部に一定の時間毎にタイムスケールを付加してもよい。この例では、１５秒間隔でタイムスケールが付加されており、８つのタイムスケールが存在することから、再生時間は２：００（＝２分＝８×１５秒）であることが理解できる。

このような音声サムネイルを用いるとともに、ペン４６がドラッグされた範囲に対応する部分の音声データを再生するようにすることにより、再生処理を繰り返し行うことができる。例えば、図２４に示すように、座標（ｘ₁，ｙ₁）からドラッグを開始し、２周円を描いた後、座標（ｘ₂，ｙ₂）でペン４６を離した場合、同一の部分を２度繰り返して再生することができる。

また、図２３と図２４に示す実施例において、音声データの再生が開始された場合は、再生が現在行われている部分を、例えば、矢印等で指示するようにしてもよい。

更に、前述の実施例と同様に、音声データが所定のレベルを超過した部分の表示色を変更し、その部分を明示するようにしてもよいことは勿論である。

本発明の情報処理装置を適用した電子カメラの構成の一例を示す斜視図である。図１に示す電子カメラの面Ｘ１に対向する側から見た場合の斜視図である。図１または図２に示す電子カメラの内部の構成を示す斜視図である。図１または図２に示す電子カメラの電気的な構成を示すブロック図である。Ｌモードにおける画素の間引き処理を説明する図である。Ｓモードにおける画素の間引き処理を説明する図である。記録された情報を再生する場合の表示画面の表示例である。図７に示す音声サムネイルの表示処理の一例を説明するフローチャートである。図７に示す画面上において、音声サムネイル上の２点が指示された場合の再生処理の一例を説明するフローチャートである。音声サムネイルの再生の始点を指定する様子を示す図である。音声サムネイルの再生の終点を指定する様子を示す図である。図９の処理の結果、始点と終点によって指定される部分の表示色が変更された場合の表示の一例を示す図である。音声サムネイルから離れた場所が指定された場合の再生処理の一例を説明するフローチャートである。音声サムネイルから離れた場所で再生の始点が指定された場合の様子を示す図である。音声サムネイルから離れた場所で再生の終点が指定された場合の様子を示す図である。図１３の処理の結果、始点と終点によって囲まれた部分の表示色が変更された場合の表示の一例を示す図である。音声データが所定のレベルを超過する部分の音声サムネイルの表示色を変更する処理の一例を説明するフローチャートである。図１７の処理の結果、表示色が変更された音声サムネイルの表示例を示す図である。図１８の表示画面において、音声サムネイルの所定の部分を指定した場合の再生処理の一例を説明するフローチャートである。図１８の表示画面において、ＳｌｏｗボタンまたはＦａｓｔボタンが押圧された場合の処理の一例を説明するフローチャートである。本発明を適用した他の音声サムネイルの表示例を示す図である。図２１に示す表示例において、音声サムネイルの２点が指定された場合の再生処理の一例を説明するフローチャートである。音声サムネイル上または音声サムネイルの外部において、２点の座標を指定した場合の様子を示す図である。本発明を適用した更に他の音声サムネイルの表示例を示す図である。

符号の説明

６Ａタッチタブレット（座標取得手段）
２４メモリカード（記録手段）
３６ＣＰＵ（図形作成手段）
３８音声ＩＣ（再生手段）
４６ペン（位置指定手段）
４７フレームメモリ（出力手段）

Claims

音声を入力し、記録または再生する情報処理装置において、
入力された音声を記録する記録手段と、
前記記録手段に記録された前記音声の記録時間に対応する、長さ、または、角度を有する図形を作成する図形作成手段と、
前記図形作成手段により作成された前記図形を表示装置に出力する出力手段と、
前記表示装置の画面上の所定の位置を指定する位置指定手段と、
前記表示装置に表示された前記図形の少なくとも２点の座標が前記位置指定手段により指定された場合に、それらの座標を取得する座標取得手段と、
前記座標取得手段により取得された前記座標に応じて前記記録手段に記録されている前記音声の所定の部分を再生する再生手段と
を備えることを特徴とする情報処理装置。
前記図形は、少なくとも１本以上の線分であり、前記位置指定手段により前記線分の２点が指定された場合に、前記再生手段は、それら２点を始点または終点として、前記記録手段に記録されている前記音声の対応する部分を読み出して再生する
ことを特徴とする請求項１に記載の情報処理装置。
前記図形は、扇形であり、前記位置指定手段により前記扇型の２点が指定された場合に、前記再生手段は、それら２点を始点または終点として、前記記録手段に記録されている前記音声の対応する部分を読み出して再生する
ことを特徴とする請求項１に記載の情報処理装置。
前記図形作成手段は、前記記録手段に記録されている音声の瞬時値が所定のレベルを超過する場合は、前記図形の対応する部分の表示形式を変更する
ことを特徴とする請求項１乃至３の何れかに記載の情報処理装置。
前記表示形式は、図形の表示色である
ことを特徴とする請求項４に記載の情報処理装置。
前記再生手段は、前記記録手段に記録されている音声の瞬時値が所定のレベルを超過する部分のみを再生する
ことを特徴とする請求項１乃至５の何れかに記載の情報処理装置。
前記再生手段は、前記記録手段に記録されている前記音声の再生速度を変更可能である
ことを特徴とする請求項１乃至６の何れかに記載の情報処理装置。