JP2004289560A - 画像記録再生方法および画像記録再生装置 - Google Patents
画像記録再生方法および画像記録再生装置 Download PDFInfo
- Publication number
- JP2004289560A JP2004289560A JP2003079881A JP2003079881A JP2004289560A JP 2004289560 A JP2004289560 A JP 2004289560A JP 2003079881 A JP2003079881 A JP 2003079881A JP 2003079881 A JP2003079881 A JP 2003079881A JP 2004289560 A JP2004289560 A JP 2004289560A
- Authority
- JP
- Japan
- Prior art keywords
- image
- file
- recording
- data
- reproducing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- Studio Devices (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
Abstract
【解決手段】ユーザーは、画像内容として「家族」「チワワ」「モモちゃん」などの文字を入力し、撮影場所として「自宅」などの文字を入力する。システム制御部は、その文字列データ、および取得した撮影日時のデータを、画像ファイルの定められた領域に記録する。再生時、システム制御部は、これらデータを読み出し、構文構成によって語を選択補充してメッセージ文を生成し、テキスト音声合成によって音声ナレーションを出力する。
【選択図】 図18
Description
【発明の属する技術分野】
この発明は、DSC(デジタルスチルカメラ)やカメラ付きPDA(Personal Digital Assistant)などの、画像を撮影記録し、再生する装置、および、この画像記録再生装置での画像記録再生方法に関する。
【0002】
【従来の技術】
DSCでは、撮影された画像が、定められたファイルフォーマットの画像ファイルとして、メモリカードなどのリムーバブル(着脱可能な)記録メディアに記録される。画像ファイルには、原画像(主画像)のデータのほかに、サムネイル画像(見出し用の縮小画像)のデータが付加され、原画像のデータとリンクされる。
【0003】
再生時には、サムネイル画像のデータによって、ディスプレイ上にサムネイル画像が配列表示され、そのうちのユーザーによって選択された画像が、原画像のデータによってディスプレイ上に表示される。
【0004】
ユーザーは、その表示された画像を見て、画像をプリントアウトし、パーソナルコンピュータに取り込み、または不要なものは廃棄する、などの処理を行う。
【0005】
しかし、DSCの表示画面は、もともと小さく、DSCの小型化の要請によって、さらに小さくなる傾向にある。そのため、表示された画像を見ただけでは、どのような内容の画像であるかを確実に判断することが難しく、フォーカス状態や露出状態(画像の明るさ)などのカメラ制御状態を確実に判断することも難しい。勿論、サムネイル画像の配列表示状態では、その判断がいっそう難しい。
【0006】
表示画面上に、画像内容などを示す文字を表示することも考えられているが、画面自体が小さいので、文字も大きくできないとともに、同時に多数の文字を表示できないため、画像内容などを十分に説明することは困難である。
【0007】
特許文献1(特許第3081304号公報)には、通信衛星を利用した放送のビジネスニュース番組など、特定の視聴者にのみ配信する映像番組を制作するに際して、データベースに用意されている多数の画像データから番組制作用の素材として利用する画像を迅速に検索することができるように、各画像の内容を説明する文の音声データをデータベースに蓄積しておき、この音声データによる音声ナレーションを聞いて画像の内容を判断することが示されている。
【0008】
【特許文献1】
特許第3081304号公報。
【0009】
【発明が解決しようとする課題】
しかしながら、上記の特許文献1に示されたような方法を、DSCによって撮影された画像に利用しようとすると、ユーザーは、撮影の都度、撮影された画像の内容を説明する文章を考え、DSCに文字を入力して、記録メディアに画像ファイルに対応づけてテキストファイルを記録し、または、文章を読み上げて、記録メディアに画像ファイルに対応づけて音声ファイルを記録しなければならず、ユーザーの負担が大きくなるだけでなく、記録メディアに記録されるファイルが多くなるとともに、フォーカス状態や露出状態などのカメラ制御状態については、ユーザーが的確に判断すること自体が難しいため、文章で的確に表現することも難しい。
【0010】
そこで、この発明は、ユーザーとしては簡単な操作や入力によって、または特に操作や入力を必要とすることなく、しかも、画像ファイルとは別にテキストファイルや音声ファイルを記録することなく、撮影された画像の内容や撮影時のカメラ制御状態などの画像に関連する事項を、装置のユーザーインターフェースとしてユーザーに的確に提示することができるようにしたものである。
【0011】
【課題を解決するための手段】
この発明の画像記録再生方法は、
画像を撮影し、定められたファイルフォーマットの画像ファイルとして記録メディアに記録する撮影記録工程と、
画像に関連する情報を、文字列データとして、前記画像ファイルの前記ファイルフォーマットで指定された領域に記録する情報記録工程と、
前記画像ファイルとして記録された画像の、原画像またはサムネイル画像を再生する画像再生工程と、
前記画像ファイルから前記画像関連情報の文字列データを読み出し、辞書解析および構文解析によって、画像についてのメッセージ文を生成する構文構成工程と、
その生成したメッセージ文から、テキスト音声合成によって、音声ナレーションのデータを生成するテキスト音声合成工程と、
を備えることを特徴とする。
【0012】
文字列データとして画像ファイルに記録される画像関連情報は、ユーザーによって入力される画像内容や撮影場所などを示す情報、画像記録再生装置で取得される撮影日時などの撮影属性情報、画像記録再生装置で検出される撮影時のフォーカス状態や露出状態などのカメラ制御状態、などである。
【0013】
したがって、この発明の画像記録再生方法では、ユーザーは、撮影時や撮影後において、画像内容や撮影場所などとして簡単かつ断片的な文字を入力するだけで、または、撮影属性情報やカメラ制御状態については、特別の操作や入力を行うことなく、画像再生時における画像記録再生装置の、構文構成によるメッセージ文の生成、およびテキスト音声合成による音声ナレーションのデータの生成によって、画像内容、撮影場所、撮影日、ピントが合っているか否かなどのカメラ制御状態などを、音声ナレーションで聴くことができ、自然語の音声によって画像を的確に判断することができる。
【0014】
しかも、これらの画像関連情報は、文字列データとして画像ファイルのファイルフォーマットで指定された領域に記録されるので、音声ナレーション用に画像ファイルとは別にテキストファイルや音声ファイルを記録する必要がない。
【0015】
【発明の実施の形態】
〔画像記録再生装置のシステム構成:図1〕
図1は、この発明の画像記録再生装置の一実施形態のシステム構成を示し、DSCシステムとして構成した場合である。
【0016】
このDSCシステムでは、被写体画像からの光が、撮像光学系11を介して、CCD撮像素子やCMOS撮像素子などの撮像素子12に投射されて、撮像素子12からアナログ画像信号が得られ、そのアナログ画像信号が、信号処理部13で、サンプルホールドされ、自動利得制御された後、デジタル画像データに変換される。
【0017】
記録再生処理部14では、画像記録時には、この信号処理部13からの撮影された画像のデータが圧縮される。その圧縮画像データは、システム制御部17によって、後述のようなファイルフォーマットの画像ファイルとして、リムーバブル記録メディア25に記録され、リムーバブル記録メディア25から読み出される。記録再生処理部14では、画像再生時には、この読み出された画像ファイルの圧縮画像データが伸長される。
【0018】
その伸長後の画像データは、表示処理部15で表示用に処理されて、液晶ディスプレイなどのディスプレイ16に供給され、ディスプレイ16上に再生画像が表示される。
【0019】
さらに、後述のように、リムーバブル記録メディア25に記録される、または記録された画像ファイルの、ファイルフォーマットで指定された領域(欄、フィールド、タグなどと称される領域)に、画像関連情報として、ユーザーによって入力された画像内容や撮影場所を示す文字列データ、またはシステム制御部17によって取得または検出された撮影属性情報やカメラ制御状態を示す文字列データが書き込まれ、画像再生時、それらの文字列データから、構文構成部18で、辞書解析および構文解析によって、画像についてのメッセージ文が生成され、さらに、そのテキストから、テキスト音声合成部19で、テキスト音声合成によって、音声ナレーションのデータが生成され、音声ナレーションが出力される。
【0020】
システム制御部17は、CPU、このCPUが実行すべき処理プログラムや後述のファイルフォーマット(ファイルシステム)が記述されたプログラムメモリ、およびCPUのワークエリアなどとして機能するRAMなどを備えるものである。
【0021】
システム制御部17には、カメラ操作部21が、インターフェース22を介して接続され、文字入力用のキー操作入力部23が、インターフェース24を介して接続されるとともに、メディア用スロットに装着されたリムーバブル記録メディア25が、メディアドライブ26を介して接続される。
【0022】
リムーバブル記録メディア25としては、メモリカード、カード型HDD(ハードディスクドライブ)、リムーバブル光ディスクなどの、書き込み可能な、または書き込み消去可能な、好ましくは大容量化された書き換え可能な、不揮発性メディアを用いる。具体的に、以下の実施形態では、メモリカードを用いる。
【0023】
テキスト音声合成部19で生成された音声データは、D/Aコンバータ27でアナログ音声信号に変換され、その音声信号が音声増幅回路28で増幅されてスピーカ29に供給され、スピーカ29から音声ナレーションが出力される。
【0024】
さらに、この実施形態のDSCシステムでは、ユーザーが音声を入力し、音声ファイルとしてリムーバブル記録メディア25に記録することができるように、マイクロホン31が設けられる。
【0025】
このマイクロホン31からのアナログ音声信号は、音声増幅回路32で増幅されて、A/Dコンバータ33でデジタル音声データに変換され、その音声データが、システム制御部17に取り込まれ、記録再生処理部14で圧縮されて、音声ファイルとしてリムーバブル記録メディア25に記録され、再生時には、記録再生処理部14で伸長されて、システム制御部17からD/Aコンバータ27に送出される。
【0026】
〔ファイルフォーマットおよび画像関連情報:図2〜図7〕
(ファイルフォーマットの概要)
携帯型の撮影画像記録メディアのフォーマットとしては、Exif(Exchangeable image file format:以下ではExifファイルフォーマットと称する)が広く使用されており、そのなかでも、DSC用としては、DCF(Design rule for Camera Filesystem:以下ではDCFファイルシステムと称する)というファイルシステム(実体はDSC用フラッシュメモリのメディアファイルフォーマット)が広く採用されている。
【0027】
DCFファイルシステムおよびその基本であるExifファイルフォーマットは、DSCの撮影画像に限らず、音声ファイルのメモリカード用フォーマットとして広く使用されている。
【0028】
また、このExifファイルフォーマットおよびDCFファイルシステムでは、JPEG(Joint Photographic Experts Group)やTIFF(Tagged Image File Format)などの既存のフォーマットによる画像データとともに、ファイル作成日時などのファイル付属情報やサムネイル画像データを一つのファイルに記録することができる。
【0029】
なお、「サムネイル」は、Exif規格およびDCF規格でも定義されているように、見出し用の縮小画像であるが、場合によって「サムネイル画像」と称する。また、この発明で、サムネイル画像の配列表示とは、複数のサムネイル画像を、一行または一列に配置して表示し、または行列方向に2次元に配置して表示することである。
【0030】
以下の実施形態では、リムーバブル記録メディア25としては、上記のようにメモリカードを用い、そのファイルフォーマットとして、ExifファイルフォーマットおよびDCFファイルシステムを用いる。
【0031】
画像データの圧縮方式としては、JPEG圧縮方式を用いるが、将来のJPEG2000を初めとする進歩した圧縮方式や他の圧縮方式を用いることもできる。
【0032】
メモリカードのファイルシステムとしては、FAT(File Allocation Table)やFAT32が広く使用されているが、以下の実施形態では、メディア容量が2GByteを超える場合にもアクセス可能なFAT32ファイルシステムを用いる。
【0033】
ただし、Windows(登録商標)システムがサポートするFATやNTFS(NT File System)を用いることもでき、リムーバブル記録メディア25として光ディスクを用いる場合には、UDF(Universal Disc Format)およびその静止画対応ファイルフォーマットを用いることができる。
【0034】
Exifファイルフォーマットでは、(a)フォルダ名は英数字番号のみであり、その開始番号は100である、(b)フォルダ名およびファイル名に2バイトコードを使用することはできない、などの制限がある。
【0035】
(画像ファイルフォーマット:図2〜図4)
<DCF基本ファイル:図2および図3>
図2に、DCFファイルシステムに準拠する画像ファイルフォーマットの一例を示し、圧縮タグ“6”で圧縮サムネイルを有し、DCF基本ファイルとしてDCF基本主画像データとDCF基本サムネイルデータを同一ファイル内に有する場合である。この場合、ファイル拡張子は“JPG”である。
【0036】
図3に、DCF基本ファイル(拡張子“JPG”)がDCF基本主画像とDCF基本サムネイルとからなることを概略的に示す。
【0037】
図2に示すように、DCF基本ファイル(Exif圧縮ファイル)は、SOI(Start Of Image)で開始し、これに続いて、最大64kByteサイズのExif付属情報用のAPP(アプリケーション・マーカーセグメント)1、拡張データ用に必要に応じて追加されるAPP2(図では省略)、JPEGテーブル、およびJPEG圧縮の基本主画像データが記録され、EOI(End Of Image)で終了する。
【0038】
APP1は、APP1マーカーで開始し、これに続いて、APP1データ長、Exif識別コード、JPEGテーブル、およびExifIFDが記録される。ExifIFDは、後述のような構造とされる。
【0039】
さらに、ExifIFDに続く第1IFDで、JPEG圧縮データのアドレスおよびデータ長が指定され、その指定されたアドレスに、JPEG圧縮の基本サムネイルデータが記録される。
【0040】
このJPEG圧縮の基本サムネイルデータ(圧縮サムネイル)は、SOIで開始し、これに続いて、JPEGテーブル、およびJPEG圧縮の基本サムネイルの生ストリームデータが記録され、EOIで終了する。
【0041】
ExifIFDには、付属情報として、Exifバージョンに関するタグ、画像データの特性に関するタグ、画像構造に関するタグ、ユーザーコメントタグ、関連ファイル情報に関するタグ、日時に関するタグ、撮影条件に関するタグ、およびIFDポインタ互換性が記録される。
【0042】
関連ファイル情報タグでは、当該の画像ファイルと関連する音声ファイルなどのファイルとの相互リンクが規定される。
【0043】
ユーザーコメントタグでは、ExifIFD内のユーザーコメント欄が指定される。そのユーザーコメント欄の先頭には、ユーザーコメントの文字コードタイプが、ASCII文字8字によって指定される。日本語の場合、文字コードは、ASCII,UnicodeまたはJISであり、最も望ましいのは、Unicodeである。
【0044】
日本でのパーソナルコンピュータの事情によってShiftJISを用いる場合には、未定義コードに指定されて使用されるので、それに対応することを考えて、コード変換部や対応する翻訳部があることが望ましい。インターネット上からダウンロードしたファイルを蓄えたDCFファイルシステムのメモリカードを用いる場合にも、海外からのダウンロードへの対応を考えて、コード変換部や対応する翻訳部があることが望ましい。
【0045】
日時タグでは、ExifIFD内の日時フィールドが指定され、その日時フィールドには、システム制御部17によって決定されたファイル作成日時(撮影日時)が、撮影属性情報として記録される。
【0046】
<DCF拡張画像ファイルおよびDCFサムネイルファイル:図4>
DCFファイルシステムに準拠する画像ファイルフォーマットとしては、図4に概略的に示すように、同一フォルダ内でDCF拡張画像ファイルとDCFサムネイルファイルを別ファイルのペアとして対応づけることもできる。この場合のDCFサムネイルファイルの拡張子は、“THM”である。
【0047】
この場合には、DCFサムネイルファイル内に、ExifIFDを有するAPP1が記録され、そのExifIFD内に、ユーザーコメント欄および日時フィールドが指定される。
【0048】
<ファイルの種類および拡張子>
DCFファイルシステムでは、撮影専用のファイルヘッダが設けられ、ここで圧縮データの種別によって画像ファイルであることが示され、さらには、図2および図3のようにDCF基本主画像とDCF基本サムネイルを同一ファイル内に有するJPEG圧縮DCF基本ファイルであることを示す拡張子“JPG”、または図4のようにDCF拡張画像ファイルとDCFサムネイルファイルが別ファイルでペアとなる場合のDCFサムネイルファイルであることを示す拡張子“THM”が記録される。
【0049】
<画像関連情報>
画像ファイルのファイルフォーマットとして、以上のようなファイルフォーマットを用いる場合には、ユーザーの入力による画像内容や撮影場所を示す文字列データ、およびシステム制御部17の検出によるカメラ制御状態を示す文字列データが、ユーザーコメントデータとして、ExifIFD内のユーザーコメント欄に書き込まれ、構文構成およびテキスト音声合成による音声ナレーションの生成に供されるように、DSCシステムを構成する。
【0050】
また、撮影日時(ファイル作成日時)を示す文字列データが、システム制御部17によって撮影属性情報として、ExifIFD内の日時フィールドに書き込まれ、構文構成およびテキスト音声合成による音声ナレーションの生成に供されるように、DSCシステムを構成する。
【0051】
<フォルダ名およびファイル名>
フォルダ名は、Exifファイルフォーマットでは、上記(a)(b)の制限のもとに、「数字3桁+アルファベット5文字」が認められ、DCFファイルシステムでは、1バイトコードの集合として、「英字2文字のIM+英字5文字」が推奨されている。
【0052】
そこで、この実施形態では、図3または図4に示すように、画像ファイル(DCF基本ファイル、またはDCF拡張画像ファイルとDCFサムネイルファイルのペア)とは別に、フォルダ名対照テーブルファイル9を設けて、後述のようにユーザーによって画像整理用に命名されるフォルダ名、例えば「家族」「花」「犬」などという文字列の2バイトコードと、DCFファイルシステムに準拠してシステム制御部17によって登録される上記の「数字3桁+アルファベット5文字」のフォルダ名、例えば「101AAAAA」「102AAAAA」「103AAAAA」などというコードとをリンクさせる。
【0053】
そして、後述のようにユーザーがユーザー命名のフォルダ名を選択したときには、システム制御部17は、このフォルダ名対照テーブルファイル9から、その選択されたユーザー命名のフォルダ名に対応する自動登録のフォルダ名を読み出し、そのフォルダ名が付されたフォルダを呼び出すように、DSCシステムを構成する。
【0054】
ファイル名は、DCF基本ファイルおよびDCF拡張画像ファイルでは、「(先頭4文字の英字)+(ファイル番号4文字)」からなるDCFファイル名として、順番に並べて管理するものとされ、以下の実施形態でも、これに従う。
【0055】
(音声ファイルフォーマット:図5)
図5に、Exif規格に準拠する音声ファイルフォーマットの一例を示し、「RIFF/WAVE MP3Audio」の圧縮オーディオファイルの場合である。この場合、ファイル拡張子は“WAV”または“MP3”である。
【0056】
このRIFFファイルは、「チャンク」と呼ばれるデータブロックから構成され、最上位のRIFFチャンクでは、“RIFF”というチャンクID(ckID)に続いて、RIFFチャンクのチャンクサイズ(ckSize)、および“WAVE”タイプが指定され、さらに、フォーマットチャンクで、音声符号化方式や音声チャネル数などが指定される。
【0057】
さらに、ファクトチャンクで、音声データのサンプル長が指定され、それに続いて、付属情報サブチャンクとして、INFOリストチャンクおよびExifリストチャンクが記録され、最後に、データチャンクとして、MP3圧縮形式のWAVEオーディオストリームデータが記録される。データチャンクは、チャンクID(ckID)として、ASCII文字列“data”(64617461)を開始マーカーとする。
【0058】
INFOリストチャンクでは、“LIST”というチャンクID、INFOリストチャンクのチャンクサイズ、および“INFO”というリストタイプの記録に続いて、音声ファイルのタイトル、ジャンル、ファイル作成年月日、コメント、アーティスト、および著作権情報が、それぞれASCII文字列で記載される。
【0059】
Exifリストチャンクでは、“LIST”というチャンクID、Exifリストチャンクのチャンクサイズ、および“exif”というExif専用のリストタイプの記録に続いて、規格バージョン、関連画像ファイル名、音声ファイル作成日時、作成メーカー名、作成モデル名、メーカー用ノート、およびユーザーコメントeucmというデータフィールドが記録される。
【0060】
関連画像ファイル名は、当該の音声ファイルに関連する画像ファイルがある場合に、その画像ファイルを「ファイル名.拡張子」の形式で直接指定する(ポインタは許可されない)ものであり、音声ファイル作成日時は、当該の音声ファイルの作成日時を「年:月:日:時:分:秒.サブ秒」の形式でサブ秒まで記載するものである。
【0061】
ユーザーコメントeucmは、“eucm”というチャンクID、およびユーザーコメントeucmのチャンクサイズに続いて、チャンクデータ(ckData)であるユーザーコメントが記載される。
【0062】
このユーザーコメントでは、先頭8バイトで、ASCII大文字によって文字コードタイプが指定され、それに続いて、ユーザーコメント欄が設けられる。
【0063】
文字コードは、Unicodeが望ましい。日本でのパーソナルコンピュータの事情によってShiftJISを用いる場合には、Undefinedが指定される。
【0064】
ユーザーコメント欄には、2バイトコード文字によるユーザーコメントデータとして、アーティスト名や曲名、ファイル作成日時、曲のさび部分の歌詞などが登録される。
【0065】
(画像関連情報の書き込み読み出し制御:図6および図7)
図6に、図2および図3に示したDCF基本ファイル(拡張子“JPG”)を用いる場合の、画像関連情報の書き込み読み出し制御の様子を示す。
【0066】
この例は、ユーザーによって、画像内容として「家族」「チワワ」「モモちゃん」の各単語が入力され、撮影場所として「自宅」の単語が入力されるとともに、システム制御部17によって、撮影日(撮影年月日)として「2002年11月21日」が取得される場合である。
【0067】
システム制御部17は、入力された「家族」「チワワ」「モモちゃん」「自宅」の各単語に、FAT32ファイルシステムのクラスタ単位で文字列コードを指定して、ユーザーコメントデータの文字列データを生成し、DCF基本ファイル内のAPP1内のExifIFD内のユーザーコメント欄に、アドレスで区切って記録し、撮影日時(ファイル作成日時)を、「年:月:日:時:分:秒.サブ秒」の形式でサブ秒まで取得して、同じExifIFD内の日時フィールドに、16進数データの撮影属性情報として記録する。
【0068】
これらユーザーコメントデータ(この例では画像内容情報および撮影場所情報)および撮影属性情報(撮影日時)に、DCF基本ファイルへのポインタが付加されて、ソフトウェア処理上の登録キー情報クラス構造体が構成される。
【0069】
DCF基本ファイルへのポインタは、そのファイルフォーマットの論理ブロックアドレス(LBA)または論理セクタ番号(LSN)でベースアドレスを指定して、FAT32ファイルシステムのクラスタ単位でExifIFD内のユーザーコメント欄および日時フィールドに対して、データオブジェクト集合インスタンスの書き込み読み出しを制御するものである。
【0070】
日時フィールドの撮影属性情報(撮影日時)は、システム制御部17が取得し、ユーザーが記入することはできないので、ユーザーに対しては読み出し専用のパーミッション属性を持つデータである。
【0071】
これに対して、画像内容情報および撮影場所情報は、ユーザーの入力によって記録されるので、書き込み読み出しの双方が可能なパーミッション属性を持つデータである。
【0072】
上述したユーザー命名の2バイトコード文字列のフォルダ名も、同様に、ユーザーが変更可能なパーミッション属性を持つデータとする。
【0073】
また、この場合のファイル拡張子“JPG”は、DCFファイルシステムに準拠する一意のファイル拡張子であるので、ファイルを作成または削除する場合以外では、ソフトウェアによる変更が禁止される。
【0074】
図7に、図4に示したようにDCF拡張画像ファイルとDCFサムネイルファイルをペアで用いる場合の、画像関連情報の書き込み読み出し制御の様子を示す。
【0075】
これは、ユーザーコメントデータ(この例では画像内容情報および撮影場所情報)および撮影属性情報(撮影日時)が、DCFサムネイルファイル(拡張子“THM”)内のAPP1内のExifIFD内のユーザーコメント欄および日時フィールドに記録され、ファイルへのポインタが、DCFサムネイルファイルへのポインタとなる点を除いて、図6に示したDCF基本ファイルを用いる場合と同じである。
【0076】
〔ユーザーコメントデータの入力および記録:図8〜図10〕
(キー操作入力部23の例:図8)
画像内容や撮影場所などを示す文字列は、図1に示したキー操作入力部23によって入力する。
【0077】
図8に、キー操作入力部23の一例を示す。この例は、携帯電話端末などのキー操作入力部と同様に、メニュー画面の開閉やメニュー項目の選択・決定などを行う操作キー231と、文字入力キー232とを備え、操作キー231の操作によって、文字入力キー232の入力モードを、同図(A)のような数字入力モード、同図(B)のような仮名入力モード、または同図(C)のようなアルファベット入力モードに切り換えることができる場合である。
【0078】
(画像内容および撮影場所の入力および記録:図9および図10)
ユーザーは、以下のように、撮影時または撮影後、キー操作入力部23での操作によって、フォルダ名を命名し、画像内容および撮影場所を入力して、画像ファイル内に記録することができる。
【0079】
撮影時、撮影された画像は、図9(A)に示すように、原画像1としてディスプレイ16上に表示され、ユーザーは撮影状態を確認することができる。
【0080】
この状態で、ユーザーがキー操作入力部23でフォルダ名のメニューを呼び出す操作をすると、図9(B)に示すように、ディスプレイ16上に、原画像1にオーバーレイされてフォルダ名メニュー画面2が表示され、ユーザーが命名できるフォルダ名が、「家族」「花」「犬」などというように幾つか提示される。
【0081】
ユーザーは、原画像1の内容に応じて、そのうちの一つ、例えば「犬」を選択する。これによって、システム制御部17は、そのユーザー指定のフォルダ名に対応づけるDCFファイルシステムに準拠するフォルダ名を決定し、上述したフォルダ名対照テーブルファイル9に記述する。
【0082】
フォルダ名を指定したら、ユーザーは、ユーザーコメントデータ用の文字入力画面を呼び出す。これによって、フォルダ名メニュー画面2に代えて、図9(C)に示すような文字入力画面3が表示される。この文字入力画面3は、画像内容記入欄3aと撮影場所記入欄3bに区分されたものとされ、その撮影場所記入欄3bには、「場所:」のプロンプトが表示される。
【0083】
ユーザーは、画像内容記入欄3aに、画像内容として、例えば「家族」「チワワ」「モモちゃん」の文字列を、各単語の間に半角スペースまたはカンマを挿入して入力し、その後、キー操作入力部23の#キー232aを押して、入力フォーカスを撮影場所記入欄3bに移動させ、「場所:」のプロンプトが表示されている箇所に、撮影場所として、例えば「自宅」の文字列を入力する。
【0084】
これによって、システム制御部17は、上述したフォルダ名対照テーブルファイル9を参照して、例えば「犬」というユーザー指定のフォルダ名に対応する「103AAAAA」というDCFファイルシステムに準拠するフォルダ名のフォルダをファイル保存先として、ユーザー入力の画像内容および撮影場所を示す文字列データを上述したようにDCF基本ファイル内またはDCFサムネイルファイル内のユーザーコメント欄に書き込んだ上で、撮影された画像のファイル(DCF基本ファイル、またはDCF拡張画像ファイルとDCFサムネイルファイルのペア)をメモリカードに記録する。
【0085】
このとき、図9(C)に示すように、文字入力画面3とともに撮影日提示画面4が表示されて、既にシステム制御部17が取得している撮影日(撮影日時)が変更不可状態で提示されることが望ましい。
【0086】
以上は、撮影された画像を記録する場合であるが、既に画像ファイルとして記録されている画像についても、ユーザーの操作によって、その画像がディスプレイ16上に呼び出され、文字入力画面3が表示されて、画像内容または撮影場所が入力されることによって、未記録の画像内容情報または撮影場所情報が記録され、あるいは記録済みの画像内容情報または撮影場所情報が書き換えられる。
【0087】
図10に、この画像記録後の画像内容または撮影場所の記録または書き換えの例を示す。
【0088】
この例では、ユーザーは、まず、フォルダ名のメニューを呼び出す操作をする。これによって、図10左上に示すように、ディスプレイ16上にフォルダ名メニュー画面2が表示される。
【0089】
ユーザーは、そのうちから、呼び出すフォルダのフォルダ名、例えば「犬」を指示する。これによって、システム制御部17は、上述したフォルダ名対照テーブルファイル9を参照して、例えば「犬」というユーザー指定のフォルダ名に対応する「103AAAAA」というDCFファイルシステムに準拠するフォルダ名のフォルダをファイル呼び出し先として、そのフォルダ内に記録されている各画像ファイル(DCF基本ファイル、またはDCF拡張画像ファイルとDCFサムネイルファイルのペア)を、DCFファイルシステムに準拠するファイル名中のファイル番号順に読み出し、それぞれのDCF基本サムネイルまたはDCFサムネイルファイルのデータによって、図10右上に示すように、ディスプレイ16上にサムネイル画像A,B,C‥‥を配列表示する。
【0090】
この状態で、ユーザーは、アイコン形状のサムネイル画像の一つを選択する。これによって、システム制御部17は、その選択された画像のファイル(DCF基本ファイル、またはDCF拡張画像ファイルとDCFサムネイルファイルのペア)中のDCF基本主画像またはDCF拡張画像ファイルのデータによって、図10左下に示すように、ディスプレイ16上に、選択された画像の原画像1を表示する。
【0091】
次に、ユーザーは、ユーザーコメントデータ用の文字入力画面を呼び出す。これによって、図10右下に示すように、ディスプレイ16上に、原画像1にオーバーレイされて文字入力画面3および撮影日提示画面4が表示される。文字入力画面3は、画像内容記入欄3aと撮影場所記入欄3bに区分されたものとされ、撮影日提示画面4には、記録済みの撮影日(撮影日時)が変更不可状態で表示される。
【0092】
この状態で、ユーザーは、画像内容記入欄3aに画像内容を示す文字列を入力し、または画像内容記入欄3aに記入表示されている文字列を修正し、入力フォーカスを撮影場所記入欄3bに移動させて、撮影場所記入欄3bに撮影場所を示す文字列を入力し、または撮影場所記入欄3bに記入表示されている文字列を修正する。
【0093】
これによって、システム制御部17は、画像記録時と同様に、画像内容情報または撮影場所情報を記録し、あるいは画像内容情報または撮影場所情報を書き換える。
【0094】
〔撮影時のカメラ制御状態:図11〜図16〕
上述した例は、ユーザー入力の画像内容および撮影場所を示す文字列データを画像ファイルに記録する場合であるが、撮影時のカメラ制御状態を画像ファイルに記録することもできる。カメラ制御状態は、システム制御部17によって検出取得されるもので、ユーザーによって直接入力されるものではないが、ユーザーコメントデータとして画像ファイルに記録する。
【0095】
さらに、カメラ制御状態については、画像をディスプレイ16上でモニターするE−Eモードや、撮影された画像を画像ファイルとして記録する記録モードでも、音声ナレーションを出力することができる。
【0096】
(カメラ撮像部の例:図11)
図11に、図1に示した撮像光学系11、撮像素子12、信号処理部13、カメラ操作部21およびシステム制御部17、および図1では省略したフォーカス調整部35およびフォーカスモーター37を備えるカメラ撮像部の例を示す。ただし、図1に示したインターフェース22は省略した。
【0097】
この例では、撮像素子12から得られるRGBアナログ画像信号が、信号処理部13のサンプルホールド回路131でサンプルホールドされ、AGC回路132で自動利得制御された後、A/Dコンバータ133でRGBデジタル画像データに変換される。
【0098】
変換後のRGB画像データは、クランプ回路134でオプティカル黒レベルがクランプされ、レンズ歪補正回路135でレンズ歪が補正され、欠陥ピクセル補正回路136で欠陥ピクセルのデータが補正され、ホワイトバランス回路137でホワイトバランスが設定され、ガンマ補正回路138でガンマ補正され、色補間回路139で色補間され、色空間変換回路141でYCrCb画像データに変換される。
【0099】
変換後のYCrCb画像データは、エッジ検出回路142および疑似カラー抑圧回路143に供給され、エッジ検出回路142で画像エッジ部が検出されるとともに、疑似カラー抑圧回路143で疑似カラー成分が抑圧される。
【0100】
そして、疑似カラー抑圧回路143の出力の画像データが、記録再生処理部14に供給されるとともに、この画像データと、エッジ検出回路142の出力のエッジ検出信号が、フォーカス調整部35に供給される。
【0101】
さらに、システム制御部17からフォーカス調整部35に、カメラ操作部21でのモード設定に基づくフォーカスモード設定信号が供給されて、フォーカス調整部35において、モニター中の画像の指定された領域におけるフォーカス状態が検出される。その検出結果のフォーカス状態を示す信号が、システム制御部17によってフォーカス調整信号に変換され、そのフォーカス調整信号が、モーター駆動信号としてフォーカスモーター37に供給されて、モニター中の画像の指定された領域が合焦状態となるように、撮像光学系11が駆動される。
【0102】
また、システム制御部17からAGC回路132に、カメラ操作部21での露出設定に応じたゲイン制御信号が供給されて、サンプルホールド回路131でサンプルホールドされた画像信号のゲインが制御され、モニター中の画像の露出状態が制御される。
【0103】
(カメラ制御状態の音声ナレーション:図12〜図16)
上記のカメラ撮像部では、カメラ制御状態としては、図12左上の表に示すように、撮影モードとして「オート」または「マニュアル」が検出され、フォーカス状態として「合焦」または「非合焦」が検出され、露出状態として「明るい」「普通」または「暗い」が検出される。表中の0,1,2は、モードまたは状態を示すデータ値である。
【0104】
ただし、露出状態は、オートモードでは、ゲイン小を「明るい」とし、ゲイン大を「暗い」とするものであり、マニュアルモードでは、動作中のゲイン制御信号と比較して、ゲイン小に設定するときを「明るい」とし、ゲイン大に設定するときを「暗い」とするものである。
【0105】
このカメラ制御状態については、上記のE−Eモードや記録モードでも、図1に示した構文構成部18での構文構成およびテキスト音声合成部19でのテキスト音声合成によって、音声ナレーションを出力することができる。
【0106】
図12に、このようにE−Eモードまたは記録モードでカメラ制御状態の音声ナレーションを出力する場合の例を示す。
【0107】
この場合、E−Eモードでは、モニター中の画像が、画像5として示すようにディスプレイ16上に表示されるとともに、そのときのカメラ制御状態を示すデータが、後述のような文字列データに置き換えられ、その文字列データから、構文構成によってメッセージ文が生成され、さらに、そのメッセージ文から、テキスト音声合成によって音声ナレーションが出力される。
【0108】
記録モードでは、撮影された画像が、画像5として示すようにディスプレイ16上に表示され、E−Eモードと同様に、そのときのカメラ制御状態を示す文字列データに基づいて、音声ナレーションが出力されるとともに、その文字列データが、撮影された画像のファイルに書き込まれて、画像ファイルがメモリカードに記録される。
【0109】
図13に、画像ファイルフォーマットとしてDCF基本ファイル(拡張子“JPG”)を用いる場合の、カメラ制御状態の書き込み読み出し制御の様子を示す。
【0110】
これは、図6に示した、ユーザー入力の画像内容および撮影場所を示す文字列データが、DCF基本ファイルに書き込まれ、DCF基本ファイルから読み出される場合と同じで、すなわち、カメラ制御状態を示す文字列データは、ユーザーコメントデータとして、DCF基本ファイル内のAPP1内のExifIFD内のユーザーコメント欄に書き込まれ、ユーザーコメント欄から読み出される。
【0111】
以下に、E−Eモードまたは記録モードで、音声ナレーションによってカメラ制御状態をメッセージする場合の、構文構成部18での構文構成の様子を示す。ただし、構文構成部18での構文構成およびテキスト音声合成部19でのテキスト音声合成の具体的方法は、後記の〔構文構成(テキスト生成):図25および図26〕および〔テキスト音声合成:図27および図28〕で詳細に示す。
【0112】
図14に、E−Eモードで露出状態をメッセージする場合の構文構成の様子を示す。
【0113】
露出を明るくする場合には、図12左上の表中に示した露出状態を示すデータによって、「露出」「明るく」という単語が選択されるとともに、構文パターンに付加する語として「を」「します」という語が選択されて、「露出を明るくします」というメッセージ文が生成され、音声ナレーションが出力される。
【0114】
露出を暗くする場合には、露出状態を示すデータによって、「露出」「暗く」という単語が選択されるとともに、構文パターンに付加する語として「を」「します」という語が選択されて、「露出を暗くします」というメッセージ文が生成され、音声ナレーションが出力される。
【0115】
図15上段に、E−Eモードでフォーカス状態および撮影モードをメッセージする場合の構文構成の様子を示す。
【0116】
合焦した場合には、図12左上の表中に示したフォーカス状態を示すデータによって、「ピント」「合いました」という単語が選択されるとともに、構文パターンに付加する語として「が」という語が選択されて、「ピントが合いました」というメッセージ文が生成され、音声ナレーションが出力される。
【0117】
マニュアル撮影である場合には、撮影モードの情報から、「マニュアル撮影」という単語が選択されるとともに、構文パターンに付加する語として「です」という語が選択されて、「マニュアル撮影です」というメッセージ文が生成され、音声ナレーションが出力される。
【0118】
合焦していない場合には、図示していないが、フォーカス状態を示すデータによって、「ピント」「合っていません」という単語が選択されるとともに、構文パターンに付加する語として「が」という語が選択されて、「ピントが合っていません」というメッセージ文が生成され、音声ナレーションが出力される。
【0119】
オート撮影である場合には、図示していないが、撮影モードの情報から、「オート撮影」という単語が選択されるとともに、構文パターンに付加する語として「です」という語が選択されて、「オート撮影です」というメッセージ文が生成され、音声ナレーションが出力される。
【0120】
なお、ユーザーは、カメラ操作部21またはキー操作入力部23での選択によって、露出状態、フォーカス状態、および撮影モードのうちの、いずれか一つまたは複数をメッセージさせることができるとともに、ユーザーが複数を選択した場合には、複数のメッセージ(音声ナレーション)が順次出力されるように、DSCシステムを構成する。
【0121】
さらに、記録モードでは、撮影日を音声ナレーションとしてメッセージすることもできる。撮影日(撮影日時)は、上述したように画像内容情報および撮影場所情報をユーザーコメントデータとして記録する場合と同様に、システム制御部17によって取得され、撮影属性情報として、画像ファイルフォーマットとしてDCF基本ファイル(拡張子“JPG”)を用いる場合には、図13に示したように、DCF基本ファイル内のAPP1内のExifIFD内の日時フィールドに記録されるものである。
【0122】
図15下段に、記録モードで撮影日をメッセージする場合の構文構成の様子を示す。
【0123】
この例では、上述したファイル種類情報またはファイル拡張子によって、記録されるファイルの種類(この場合は画像ファイル)が判別されて、「画像」という単語が選択されるとともに、撮影日時のデータによって、「2002年」「11月21日」という、年と月日に分けられた単語が選択され、構文パターンに付加する語として「この」「は」「の」「に」「撮影」「されました」という語が選択されて、「この画像は2002年の11月21日に撮影されました」というメッセージ文が生成され、音声ナレーションが出力される。
【0124】
メッセージ中の動詞は、ファイルの種類に応じて選択されるもので、この場合には、画像データが画像ファイルとして記録されるので、動詞として「撮影」が選択される。
【0125】
これに対して、音声データが音声ファイルとして記録される場合には、撮影日時(撮影属性情報)の代わりに録音日時(録音属性情報)が記録され、動詞として「録音」が選択されて、「この音声は2002年の11月21日に録音されました」というメッセージ文が生成され、画像データでもなく音声データでもないデータがファイルとして記録される場合には、撮影日時(撮影属性情報)や録音日時(録音属性情報)の代わりに記録日時(記録属性情報)が記録され、動詞として「記録」が選択されて、「このデータは2002年の11月21日に記録されました」というメッセージ文が生成される。
【0126】
図16に、E−Eモードから記録モードに移行する場合の、一連のユーザー操作およびシステム動作の例を時系列的に示す。
【0127】
ユーザーは、DSCシステムを起動させ、E−Eモードとして、ディスプレイ16上に画像6を表示させる。DSCシステムでは、上述したようにフォーカス調整が実行され、画像7で示すように合焦状態になると、図15上段に示したように「ピントが合いました」という音声ナレーションが出力される。
【0128】
ユーザーが、これを聞いて撮影操作をすると、システム制御部17は、内部のメモリに記録されている内蔵音の音声データによって、「カシッ」というような擬音を発生させた後、記録処理を開始する。
【0129】
そして、画像ファイルの記録が終了すると、図15下段に示したように「この画像は2002年の11月21日に撮影されました」という音声ナレーションが出力される。ユーザーは、これを聞いて、画像が記録されたことを確認することができる。
【0130】
〔再生時の音声ナレーション:図17〜図24〕
この実施形態のDSCシステムでは、画像記録後、ユーザーは、以下のような再生モードにおいて、画像を再生し、再生画像をディスプレイ16上に表示させることができるとともに、構文構成部18での構文構成およびテキスト音声合成部19でのテキスト音声合成によって、再生画像についての音声ナレーションを出力させることができる。
【0131】
なお、この場合の構文構成およびテキスト音声合成の具体的方法も、後記の〔構文構成(テキスト生成):図25および図26〕および〔テキスト音声合成:図27および図28〕で詳細に示す。
【0132】
(閲覧モード:図17および図18)
図17に、図6または図7および図9に示したように、画像ファイル(DCF基本ファイル、またはDCF拡張画像ファイルとDCFサムネイルファイルのペア)に、ユーザーコメントデータとして画像内容情報および撮影場所情報が記録され、撮影属性情報として撮影日時が記録されている場合に、閲覧モードにおいて、画像内容、および撮影日と撮影場所を、音声ナレーションとしてメッセージする場合の例を示す。
【0133】
上述したように、画像内容情報および撮影場所情報は、文字列データとして、DCF基本ファイル内またはDCFサムネイルファイル内のAPP1内のExifIFD内のユーザーコメント欄に記録され、撮影日時は、「年:月:日:時:分:秒.サブ秒」という形式の16進数データとして、同じExifIFD内の日時フィールドに記録されている。
【0134】
ユーザーは、図10に示した方法と同様の方法によって、フォルダ名のメニューを呼び出す操作をし、呼び出すフォルダのフォルダ名、例えば「犬」を指示する。これによって、システム制御部17は、上述したフォルダ名対照テーブルファイル9を参照して、例えば「犬」というユーザー指定のフォルダ名に対応する「103AAAAA」というDCFファイルシステムに準拠するフォルダ名のフォルダをファイル呼び出し先として、そのフォルダ内に記録されている各画像ファイル(DCF基本ファイル、またはDCF拡張画像ファイルとDCFサムネイルファイルのペア)を、DCFファイルシステムに準拠するファイル名中のファイル番号順に読み出し、それぞれのDCF基本サムネイルまたはDCFサムネイルファイルのデータによって、図17左上に示すように、ディスプレイ16上にサムネイル画像A,B,C‥‥を配列表示する。
【0135】
この状態で、ユーザーは、アイコン形状のサムネイル画像の一つを選択する。これによって、システム制御部17は、その選択された画像のファイル(DCF基本ファイル、またはDCF拡張画像ファイルとDCFサムネイルファイルのペア)中のDCF基本主画像またはDCF拡張画像ファイルのデータによって、ディスプレイ16上に、選択された画像の原画像1を表示する。
【0136】
同時に、このとき、システム制御部17によって、その画像ファイルから、画像内容および撮影場所を示す文字列データ、および撮影日時のデータが読み出され、そのデータから、構文構成部18での構文構成によって、メッセージ文が生成され、さらに、そのメッセージ文から、テキスト音声合成部19でのテキスト音声合成によって、音声ナレーションが出力される。
【0137】
図18上段に、閲覧モードで画像内容をメッセージする場合の構文構成の様子を示す。
【0138】
この例では、ユーザー指定のユーザー命名フォルダ名によって、「犬」という単語が選択され、画像内容を示す文字列データによって、「家族」「チワワ」「モモちゃん」という単語が選択されるとともに、構文パターンに付加する語として「この」「は」「の」「の」「です」という語が選択されて、「この犬は家族のチワワのモモちゃんです」というメッセージ文が生成され、音声ナレーションが出力される。
【0139】
図18下段に、閲覧モードで撮影日と撮影場所をメッセージする場合の構文構成の様子を示す。
【0140】
この例では、上述したファイル種類情報またはファイル拡張子によって、記録されているファイルの種類(この場合は画像ファイル)が判別されて、「画像」という単語が選択されるとともに、撮影日時のデータによって、「2002年」「11月21日」という、年と月日に分けられた単語が選択され、撮影場所を示す文字列データによって、「自宅」という単語が選択され、構文パターンに付加する語として「この」「は」「の」「に」「で」「撮影」「しました」という語が選択されて、「この画像は2002年の11月21日に自宅で撮影しました」というメッセージ文が生成され、音声ナレーションが出力される。
【0141】
なお、ユーザーは、カメラ操作部21またはキー操作入力部23での選択によって、画像内容のメッセージ、および撮影日と撮影場所のメッセージのうちの、いずれか一方または双方を、音声ナレーションとして出力させることができるとともに、ユーザーが双方を選択した場合には、双方のメッセージ(音声ナレーション)が順次出力されるように、DSCシステムを構成する。
【0142】
(早見モード:図19)
この実施形態のDSCシステムでは、ユーザーは、ディスプレイ16上にサムネイル画像を順次表示させ、表示されたサムネイル画像を順次選択することによって、サムネイル画像の表示状態のまま、それぞれの画像についての音声ナレーションを出力させることができる。
【0143】
図19に、この早見モードで画像内容の音声ナレーションおよび撮影日と撮影場所の音声ナレーションを出力する場合の例を示す。
【0144】
この場合、ユーザーは、早見モードを選択した上で、フォルダ名のメニューを呼び出す操作をする。これによって、図19左上に示すように、ディスプレイ16上にフォルダ名メニュー画面2が表示される。
【0145】
ユーザーは、そのうちから、呼び出すフォルダのフォルダ名、例えば「犬」を指示する。これによって、システム制御部17は、上述したフォルダ名対照テーブルファイル9を参照して、例えば「犬」というユーザー指定のフォルダ名に対応する「103AAAAA」というDCFファイルシステムに準拠するフォルダ名のフォルダをファイル呼び出し先として、そのフォルダ内に記録されている各画像ファイル(DCF基本ファイル、またはDCF拡張画像ファイルとDCFサムネイルファイルのペア)を、DCFファイルシステムに準拠するファイル名中のファイル番号順に読み出し、それぞれのDCF基本サムネイルまたはDCFサムネイルファイルのデータによって、ディスプレイ16上にサムネイル画像を順次表示する。
【0146】
ユーザーは、その順次表示されるサムネイル画像を順次選択する。これによって、システム制御部17は、サムネイル画像データ(DCF基本サムネイルまたはDCFサムネイルファイルのデータ)によってサムネイル画像を表示した状態で、その選択された画像のファイル(DCF基本ファイル、またはDCF拡張画像ファイルとDCFサムネイルファイルのペア)から、画像内容および撮影場所を示す文字列データ、および撮影日時のデータを読み出し、構文構成部18での構文構成およびテキスト音声合成部19でのテキスト音声合成によって、図18に示した「この犬は家族のチワワのモモちゃんです」および「この画像は2002年の11月21日に自宅で撮影しました」というようなメッセージ文を生成し、音声ナレーションを出力する。
【0147】
さらに、システム制御部17は、このように構文構成部18によって、選択された画像についてのメッセージ文を生成しつつ、次にサムネイル画像を表示すべき、すなわち次にユーザーによって選択されるべき画像のファイル(DCF基本ファイル、またはDCF拡張画像ファイルとDCFサムネイルファイルのペア)から、サムネイル画像データ(DCF基本サムネイルまたはDCFサムネイルファイルのデータ)を読み出す。
【0148】
これによって、選択された画像についての音声ナレーションの終了後、直ちに、次のサムネイル画像がディスプレイ16上に表示され、ユーザーは迅速かつ円滑に同一フォルダ内の各画像の内容などを知ることができる。
【0149】
(高速連写画像スライドショー再生モード:図20および図21)
この実施形態のDSCシステムは、高速連写モードとして、複数枚の画像をコンマ数秒(1秒間に数回)というような短い時間間隔で連続して撮影し、画像ファイルとして記録する機能を備える構成とする。
【0150】
この高速連写モードでは、システム制御部17によって、各画像の撮影日時が、「年:月:日:時:分:秒.サブ秒」の形式でサブ秒まで取得され、図6に示したDCF基本ファイル(拡張子“JPG”)内または図7に示したDCFサムネイルファイル(拡張子“THM”)内の、APP1内のExifIFD内の日時フィールドに記録される。
【0151】
また、この高速連写モードでも、ユーザーは、図9に示したように、フォルダ名を命名し、画像内容または撮影場所を示す文字列を入力することができ、それによって、システム制御部17は、上述したフォルダ名対照テーブルファイル9を生成し、上記のExifIFD内のユーザーコメント欄に、画像内容または撮影場所を示す文字列データを記録するように、DSCシステムを構成する。
【0152】
そして、画像再生時、ユーザーは、高速連写画像スライドショー再生モードを選択することによって、以下に示すように、高速連写された各画像の原画像を、一定時間間隔で順次再生させ、ディスプレイ16上に表示させることができるとともに、各画像の間の時間的な変化の様子を示す音声ナレーションを出力させることができる。
【0153】
具体的に、ユーザーが高速連写画像スライドショー再生モードを選択すると、図20の左上に示すように、ディスプレイ16上に、高速連写された各画像のサムネイル画像A1,A2,A3‥‥が配列表示される。
【0154】
この状態で、ユーザーは、スライドショー再生のスタート画像およびエンド画像を順番に指示して、スライドショー再生の方向および範囲を指定する。
【0155】
図20の例は、高速連写の最初の画像(サムネイル画像は画像A1、原画像は画像a1)がスライドショー再生のスタート画像とされ、高速連写の5番目の画像(サムネイル画像は画像A5、原画像は画像a5)がスライドショー再生のエンド画像とされ、順方向のスライドショー再生が指示された場合である。
【0156】
これによって、システム制御部17は、定められた時間間隔で、例えば、1画像の表示時間を5秒とし、スライド送り時間を1秒として、スタート画像(画像a1)からエンド画像(画像a5)までの各画像を、順次再生し、ディスプレイ16上に表示する。
【0157】
同時に、システム制御部17は、次の画像を表示するまでの間に、次の画像の撮影日時とスタート画像(画像a1)の撮影日時との差分時間(t2−t1,t3−t1,t4−t1,t5−t1)を算出し、構文構成部18によって、次の画像についてのメッセージ文として、その算出した差分時間を示す単語(秒数)を含むメッセージ文を生成し、テキスト音声合成部19によって、次の画像の表示時に音声ナレーションとして出力する。
【0158】
具体的に、この例は、高速連写の時間間隔が0.2秒とされるとともに、高速連写モードにおいて、ユーザー入力の「家族」「チワワ」「モモちゃん」という文字列データが画像ファイルに記録された場合である。
【0159】
この場合、構文構成部18での構文構成では、順方向のスライドショー再生として、(1)スタート画像(画像a1)については、「最初の」および「画像」という単語が選択され、(2)途中の画像(画像a2,a3,a4)については、それぞれの画像につき個別に、システム制御部17によって算出された差分時間を示す「0.2」「0.4」または「0.6」という単語(秒数)が選択されるとともに、それぞれの画像につき共通に、順方向のスライドショー再生であることから、「秒後の」という単語が選択され、ユーザー入力の「家族」「チワワ」「モモちゃん」という文字列から、最下位の概念と認識される「モモちゃん」という単語が選択され、(3)エンド画像(画像a5)については、「最後の」および「画像」という単語が選択され、(4)スライドショー再生の対象となる全ての画像(画像a1〜a5)につき共通に、構文パターンに付加する語として「です」という語が選択される。
【0160】
これによって、スタート画像(画像a1)の表示時には、「最初の画像です」というメッセージ文が生成され、音声ナレーションが出力される。次の画像(画像a2)の表示時には、「0.2秒後のモモちゃんです」というメッセージ文が生成され、音声ナレーションが出力される。さらに次の画像(画像a3)の表示時には、「0.4秒後のモモちゃんです」というメッセージ文が生成され、音声ナレーションが出力される。さらに次の画像(画像a4)の表示時には、「0.6秒後のモモちゃんです」というメッセージ文が生成され、音声ナレーションが出力される。エンド画像(画像a5)の表示時には、「最後の画像です」というメッセージ文が生成され、音声ナレーションが出力される。
【0161】
したがって、ユーザーは、各画像の内容、および各画像の間の時間的な変化の様子を、容易に把握することができる。
【0162】
図20の例は、順方向のスライドショー再生を行う場合であるが、図21の左上に示すように、ディスプレイ16上に、高速連写された各画像のサムネイル画像A1,A2,A3‥‥が配列表示された状態で、ユーザーが、図20の例とは逆に、例えば、高速連写の5番目の画像(サムネイル画像は画像A5、原画像は画像a5)をスライドショー再生のスタート画像として指定し、高速連写の最初の画像(サムネイル画像は画像A1、原画像は画像a1)をスライドショー再生のエンド画像として指定した場合には、以下のような逆方向のスライドショー再生が実行される。
【0163】
具体的に、この場合、システム制御部17は、上記のような定められた時間間隔で、スタート画像(画像a5)からエンド画像(画像a1)までの各画像を、順次再生し、ディスプレイ16上に表示すると同時に、図20の例と同様に、次の画像の撮影日時とスタート画像(画像a5)の撮影日時との差分時間(t5−t4,t5−t3,t5−t2,t5−t1)を算出する。
【0164】
同時に、構文構成部18での構文構成では、逆方向のスライドショー再生として、(1)スタート画像(画像a5)については、「最後の」および「画像」という単語が選択され、(2)途中の画像(画像a4,a3,a2)については、それぞれの画像につき個別に、システム制御部17によって算出された差分時間を示す「0.2」「0.4」または「0.6」という単語(秒数)が選択されるとともに、それぞれの画像につき共通に、逆方向のスライドショー再生であることから、「秒前の」という単語が選択され、ユーザー入力の「家族」「チワワ」「モモちゃん」という文字列から、最下位の概念と認識される「モモちゃん」という単語が選択され、(3)エンド画像(画像a1)については、「最初の」および「画像」という単語が選択され、(4)スライドショー再生の対象となる全ての画像(画像a5〜a1)につき共通に、構文パターンに付加する語として「です」という語が選択される。
【0165】
これによって、スタート画像(画像a5)の表示時には、「最後の画像です」というメッセージ文が生成され、音声ナレーションが出力される。次の画像(画像a4)の表示時には、「0.2秒前のモモちゃんです」というメッセージ文が生成され、音声ナレーションが出力される。さらに次の画像(画像a3)の表示時には、「0.4秒前のモモちゃんです」というメッセージ文が生成され、音声ナレーションが出力される。さらに次の画像(画像a2)の表示時には、「0.6秒前のモモちゃんです」というメッセージ文が生成され、音声ナレーションが出力される。エンド画像(画像a1)の表示時には、「最初の画像です」というメッセージ文が生成され、音声ナレーションが出力される。
【0166】
したがって、ユーザーは、逆方向のスライドショー再生を行わせる場合にも、各画像の内容、および各画像の間の時間的な変化の様子を、容易に把握することができる。
【0167】
なお、エンド画像(図20の順方向スライドショー再生の例では画像a5、図21の逆方向スライドショー再生の例では画像a1)につき選択される単語、したがってエンド画像についてのメッセージ内容は、上記の例と変えることができ、例えば、図20の順方向スライドショー再生の例では、「0.8秒後のモモちゃんです」というメッセージ文が生成され、音声ナレーションが出力されるようにし、図21の逆方向スライドショー再生の例では、「0.8秒前のモモちゃんです」というメッセージ文が生成され、音声ナレーションが出力されるようにしてもよい。
【0168】
また、スタート画像についても、例えば、図20の順方向スライドショー再生の例では、「最初のモモちゃんです」というメッセージ文が生成され、音声ナレーションが出力されるようにし、図21の逆方向スライドショー再生の例では、「最後のモモちゃんです」というメッセージ文が生成され、音声ナレーションが出力されるようにしてもよい。
【0169】
(再生画像のカメラ制御状態の音声ナレーション:図22〜図24)
上述したように、画像記録時、カメラ制御状態をユーザーコメントデータとして画像ファイルに記録する場合には、画像再生時、再生画像のカメラ制御状態を音声ナレーションとしてメッセージすることができる。また、併せて、画像ファイルの日時フィールドに撮影属性情報として記録されている撮影日を音声ナレーションとしてメッセージすることができる。
【0170】
図22上段に、再生モードでフォーカス状態および撮影モードをメッセージする場合の構文構成の様子を示す。
【0171】
再生画像が合焦している場合には、再生される画像ファイルのユーザーコメント欄に記録されているフォーカス状態を示すデータによって、「ピント」「合っています」という単語が選択されるとともに、構文パターンに付加する語として「は」という語が選択されて、「ピントは合っています」というメッセージ文が生成され、音声ナレーションが出力される。
【0172】
また、マニュアル撮影である場合には、再生される画像ファイルのユーザーコメント欄に記録されている撮影モードの情報から、「マニュアル撮影」という単語が選択されるとともに、構文パターンに付加する語として「です」という語が選択されて、「マニュアル撮影です」というメッセージ文が生成され、音声ナレーションが出力される。
【0173】
図22下段に、再生モードで撮影日をメッセージする場合の構文構成の様子を示す。
【0174】
この例では、上述したファイル種類情報またはファイル拡張子によって、再生されるファイルの種類(この場合は画像ファイル)が判別されて、「画像」という単語が選択されるとともに、その再生される画像ファイルの日時フィールドに記録されている撮影日時のデータによって、「2002年」「11月21日」という、年と月日に分けられた単語が選択され、構文パターンに付加する語として「この」「は」「の」「に」「撮影」「されました」という語が選択されて、「この画像は2002年の11月21日に撮影されました」というメッセージ文が生成され、音声ナレーションが出力される。
【0175】
なお、この場合も、再生されるファイルが画像ファイルであることから、動詞として「撮影」が選択される。
【0176】
図23に、再生モードで撮影日およびフォーカス状態をメッセージする場合の、一連のユーザー操作およびシステム動作の例を時系列的に示す。
【0177】
ユーザーは、図10に示した方法と同様の方法によって、フォルダ名のメニューを呼び出す操作をし、呼び出すフォルダのフォルダ名、例えば「犬」を指示する。これによって、システム制御部17は、上述したフォルダ名対照テーブルファイル9を参照して、例えば「犬」というユーザー指定のフォルダ名に対応する「103AAAAA」というDCFファイルシステムに準拠するフォルダ名のフォルダをファイル呼び出し先として、そのフォルダ内に記録されている各画像ファイル(DCF基本ファイル、またはDCF拡張画像ファイルとDCFサムネイルファイルのペア)を、DCFファイルシステムに準拠するファイル名中のファイル番号順に読み出し、それぞれのDCF基本サムネイルまたはDCFサムネイルファイルのデータによって、ディスプレイ16上にサムネイル画像A,B,C‥‥を配列表示する。
【0178】
この状態で、ユーザーは、アイコン形状のサムネイル画像の一つを選択する。これによって、システム制御部17は、その選択された画像のファイル(DCF基本ファイル、またはDCF拡張画像ファイルとDCFサムネイルファイルのペア)から、撮影日時のデータを読み出し、構文構成部18での構文構成によって、図22下段に示したように「この画像は2002年の11月21日に撮影されました」というメッセージ文を生成し、テキスト音声合成部19でのテキスト音声合成によって音声ナレーションとして出力する。
【0179】
さらに、システム制御部17は、その選択された画像のファイルから、フォーカス状態を示すデータを読み出し、構文構成部18での構文構成によって、図22上段に示したように「ピントは合っています」というメッセージ文を生成し、テキスト音声合成部19でのテキスト音声合成によって音声ナレーションとして出力する。
【0180】
同時に、システム制御部17は、その選択された画像のファイル中の、DCF基本主画像またはDCF拡張画像ファイルのデータによって、ディスプレイ16上に、選択された画像の原画像1を表示する。
【0181】
ユーザーが、これを見て決定操作をすると、システム制御部17は、内部のメモリに記録されている内蔵音の音声データによって、「ヒュッ」というような擬音を発生させるとともに、ユーザーの別の操作があるまで、原画像1の再生表示を継続する。
【0182】
図24に、再生モードで露出状態をメッセージする場合の構文構成の様子を示す。
【0183】
再生画像の露出が明るい場合には、再生される画像ファイルのユーザーコメント欄に記録されている露出状態を示すデータによって、「露出」「明るい」という単語が選択されるとともに、構文パターンに付加する語として「は」「です」という語が選択されて、「露出は明るいです」というメッセージ文が生成され、音声ナレーションが出力される。
【0184】
再生画像の露出が暗い場合には、再生される画像ファイルのユーザーコメント欄に記録されている露出状態を示すデータによって、「露出」「暗い」という単語が選択されるとともに、構文パターンに付加する語として「は」「です」という語が選択されて、「露出は暗いです」というメッセージ文が生成され、音声ナレーションが出力される。
【0185】
〔構文構成(テキスト生成):図25および図26〕
上述したように、図1の構文構成部18では、画像記録時には画像ファイルに記録されるユーザーコメントデータまたは撮影属性情報をもとに、画像再生時には画像ファイルから読み出されたユーザーコメントデータまたは撮影属性情報をもとに、辞書解析および構文解析を実行して、記録される画像および再生される画像についてのメッセージ文が生成される。
【0186】
図25に、この構文構成部18の一例を示す。ただし、図1に示したインターフェース22および24は省略した。
【0187】
システム制御部17から構文構成部18には、画像関連情報、カメラ状態情報およびユーザー指示情報が送出される。
【0188】
画像関連情報は、ユーザーコメントデータ(ユーザー入力の画像内容または撮影場所を示す文字列データや、カメラ制御状態を示すデータ)、撮影属性情報(撮影日時のデータ)、ユーザー命名のフォルダ名、ファイル種類情報、ファイル拡張子などである。
【0189】
カメラ状態情報は、E−Eモード、記録モード、高速連写モード、再生モード(閲覧モード、早見モード、高速連写画像スライドショー再生モードなど)などのカメラモードを示す情報、使用されているアプリケーションが何語で起動されているかを示す情報、その時点の時間帯や季節を示す情報などである。
【0190】
ユーザー指示情報は、ユーザーによってカメラ操作部21またはキー操作入力部23で指示された、出力音声ナレーションの言語、速度(話速)、高さ(周波数)、音色、音量などを示す情報である。
【0191】
構文構成部18は、制御部41、情報抽出部46およびテキスト生成部50によって構成され、その制御部41は、出力言語決定モジュール42、出力内容決定モジュール43および文体決定モジュール44によって構成され、情報抽出部46には、形態素境界判定部47および翻訳装置部48が設けられる。
【0192】
出力言語決定モジュール42は、(a)アプリケーションの起動言語、(b)ユーザー命名フォルダ名やユーザーコメントデータの文字列の言語、および(c)ユーザー指定の言語から、テキスト生成部50で生成するテキスト(メッセージ文)の言語を決定するものである。
【0193】
ただし、あらかじめ(a)(b)(c)の間に優先順位を設定しておいて、優先順位の高いものに従って出力言語を決定し、または、(a)(b)(c)を同一順位として、それらの間での多数決によって出力言語を決定するように構成する。
【0194】
(b)の文字列の言語を判定する方法としては、文字列の文字コードの種別によって判定する方法、文字列の並びの特徴から判定する方法、文字列を辞書で引くことによって判定する方法などを採ることができる。
【0195】
出力内容決定モジュール43は、テキスト生成部50で生成するテキスト(メッセージ文)の内容を決定するものである。ユーザーは、ユーザー指示情報として、詳細な文を生成すべきか簡潔な文を生成すべきか、文の語数、メッセージに要する時間、および複数のメッセージを生成できる場合に生成すべき文の数や種類(画像内容メッセージ、撮影日撮影場所メッセージ、フォーカスメッセージ、露出状態メッセージ、撮影日メッセージなど)などを指示することができるように、DSCシステムを構成する。
【0196】
文体決定モジュール44は、テキスト生成部50で生成するテキスト(メッセージ文)の文体を決定するものである。ユーザーは、ユーザー指示情報として、丁寧な文体の文を生成すべきこと、くだけた文体の文を生成すべきこと、または特定の方言の文を生成すべきことなどを指示することができるように、DSCシステムを構成する。
【0197】
情報抽出部46は、入力された画像関連情報、カメラ状態情報およびユーザー指示情報から、制御部41によって指定された情報を抽出するもので、例えば、制御部41がユーザーコメントデータをもとにテキストを生成することを指示したときには、ユーザーコメントデータの文字列データを抽出する。
【0198】
具体的に、そのユーザーコメントデータの文字列が2つ以上の意味をなす単位(形態素:単語や語句)から構成されている場合、情報抽出部46は、形態素境界判定部47によって、その文字列の形態素境界を判定して、単語や語句を抽出する。
【0199】
形態素境界判定部47での形態素境界の判定は、最長一致法または分割数最小法のような経験則による方法、文法的な接続の可能性をチェックする方法、統計的な言語モデルを使用する方法などによって実行する。
【0200】
また、ユーザーコメントデータの文字列が、形態素境界に空白などのデリミタを含む文字列である場合には、情報抽出部46は、そのデリミタを手掛かりに、それぞれの単語や語句を抽出ことができる。
【0201】
また、ユーザーコメントデータの文字列の言語が、ユーザー指定の言語と異なる場合には、情報抽出部46は、翻訳装置部48の対訳辞書などによって、文字列から抽出した単語や語句をユーザー指定の言語に翻訳するように、または、単語や語句を抽出する前の文字列をユーザー指定の言語に翻訳し、翻訳後の文字列から単語や語句を抽出するように、構文構成部18を構成することができる。
【0202】
テキスト生成部50は、制御部41からの、出力言語、出力内容および文体を指示する情報と、情報抽出部46で抽出された単語や語句の情報とに基づいて、テキスト(メッセージ文)を生成するもので、図26に示すように、文字列解析モジュール51、テンプレート選択モジュール54およびテンプレート適用モジュール57によって構成される。
【0203】
文字列解析モジュール51は、情報抽出部46で得られた単語や語句を、ルールデータベース52および辞書データベース53と照らし合わせることによって、それぞれの単語や語句に、品詞情報などの言語的な情報を付与する。
【0204】
テキスト生成部50でのテキスト生成は、単語や語句をテンプレートに当てはめることによって実現される。テンプレートとしては、「これは<名詞/名詞句>です」などが挙げられる。
【0205】
テンプレート選択モジュール54は、制御部41からの情報に基づいて、ルールデータベース55および辞書データベース56を用いて、適切なテンプレートを選択する。
【0206】
例えば、ユーザーコメントデータの画像内容を示す文字列をもとに画像内容メッセージを生成する場合には、それ用のテンプレートが選択され、撮影日および撮影場所を示す文字列をもとに撮影日撮影場所メッセージを生成する場合には、それ用のテンプレートが選択され、ユーザーコメントデータとしてのフォーカス状態や露出状態を示す文字列をもとにフォーカスメッセージや露出状態メッセージを生成する場合には、それ用のテンプレートが選択される。
【0207】
また、ユーザー指示情報に応じて、選択するテンプレートを変え、例えば、丁寧な文体の文を生成すべきことが指示された場合には、上記のように「これは<名詞>です」というテンプレートを選択し、くだけた文体の文を生成すべきことが指示された場合には、「これは<名詞>だよ」というテンプレートを選択する。
【0208】
テンプレート適用モジュール57は、ルールデータベース58および辞書データベース59を用いて、入力された単語や語句を、テンプレート選択モジュール54で選択されたテンプレートに当てはめて、テキスト(メッセージ文)を生成する。
【0209】
例えば、テンプレート選択モジュール54で「これは<名詞/名詞句>です」というテンプレートが選択され、文字列解析モジュール51によって単語や語句が名詞または名詞句であるとされた場合には、その単語や語句を、「これは<名詞/名詞句>です」というテンプレートの<名詞/名詞句>の部分に当てはめて、テキストを生成する。
【0210】
また、入力された単語や語句をそのまま当てはめないで、概念(thesaurus)辞書の、単語間の概念的な関係を示すデータを用いて、入力された単語や語句を、同じ概念の語、または上位概念を有する語などで置き換えて、テンプレートに当てはめるように、テキスト生成部50を構成することもできる。
【0211】
例えば、ユーザーコメントデータの画像内容を示す文字列が「赤」「薔薇」であり、文字列解析モジュール51で、それらが共に名詞であると解析され、テンプレート選択モジュール54で、「これは<“色”>の<“花”>です」というテンプレート(“色”および“花”は概念)が選択された場合、概念辞書によって、赤の上位概念が色であり、「薔薇」の上位概念が花であることが分かるので、「赤」「薔薇」という単語は、選択されたテンプレートに当てはめることができると判定されて、「これは赤の薔薇です」という文が生成される。
【0212】
解析の結果、当該の単語や語句を、そのままテンプレートに当てはめることができないことが判明することもある。例えば、情報抽出部46で「駅前で見かけた」という語句が抽出されたとする。この語句を解析すると、「名詞+格助詞+動詞+助動詞」という品詞列が得られるが、これは、上記のテンプレートに当てはまらない。しかし、この語句に「もの」という形式名詞を追加することによって、語句全体が「駅前で見かけたもの」という名詞句になり、テンプレートに当てはめることができるようになる。このように、テンプレート適用モジュール57では、入力された単語や語句を、選択されたテンプレートに当てはめることができるように変形する。
【0213】
なお、上述したカメラ状態情報によって、例えば、DSCシステムの使用時間帯に応じて、ユーザーに対する挨拶文のテキストを生成し、上記のメッセージ文に付加することもできる。
【0214】
〔テキスト音声合成:図27および図28〕
図1のテキスト音声合成部19では、上記のように構文構成部18で生成されたテキスト(メッセージ文)から、テキスト音声合成によって、音声ナレーション用の音声波形データを生成する。
【0215】
図27に、テキスト音声合成部19の一例を示す。上述したカメラ状態情報およびユーザー指示情報は、テキスト音声合成部19にも送出される。
【0216】
この例のテキスト音声合成部19は、言語処理部61、韻律制御部71および波形生成部81によって構成される。
【0217】
言語処理部61は、ルールデータベース62および辞書データベース63を用いて、構文構成部18からのテキストを解析し、テキスト音声合成に必要な情報を抽出するもので、図28に示すように、テキスト解析モジュール64および韻律情報生成モジュール67によって構成される。
【0218】
テキスト解析モジュール64は、ルールデータベース65および辞書データベース66を用いて、入力テキストを解析して、形態素(単語や語句)に分割し、それぞれの形態素につき、品詞や読みなどの情報を得るものである。
【0219】
テキスト解析モジュール64でのテキスト解析は、最長一致法または分割数最小法のような経験則による方法、文法的な接続の可能性をチェックする方法、統計的な言語モデルを使用する方法、正規文法や文脈文法などの文法を用いる方法などによって実行する。
【0220】
以上のテキスト解析によって、構文構成部18から出力されたテキスト(メッセージ文)のそれぞれの単語や語句につき、品詞や読み、アクセント型などの情報が求められる。
【0221】
韻律情報生成モジュール67は、テキスト解析モジュール64の解析結果をもとに、ルールデータベース68内の、ルール、統計的な言語モデル、決定木を用いて、アクセント核位置やポーズ位置の決定、フレージング処理など、入力テキストを音声で読み上げるために必要な情報を求めるものである。
【0222】
テキスト解析モジュール64および韻律情報生成モジュール67からなる言語処理部61で得られた解析結果および情報は、音声記号列という中間的な表現形態で出力される。
【0223】
音声記号列は、IPA(国際音声字母)やSAMPAなどの一般的な発音記号を用いて記述してもよく、あるいは独自の発音記号を定めて記述してもよい。
【0224】
図27の韻律制御部71は、言語処理部61から音声記号列を受け取り、ルールデータベース72およびデータベース73を用いて、それぞれの音(音素)の継続時間長および基本周波数を求めるもので、図28に示すように、継続時間長決定モジュール74および基本周波数決定モジュール77によって構成される。
【0225】
継続時間長決定モジュール74は、ルールデータベース75およびデータベース76中の、あらかじめ大量のデータから学習して得られた、音韻環境と音の継続時間長との関係を示すルールおよびデータを用いて、音声記号列を解析し、それぞれの音(音素)の長さを決定するものである。
【0226】
音韻環境とは、それぞれの音素の文における位置、アクセントやストレスの有無、ポーズの長さ、フレーズやアクセントの強さなどである。
【0227】
基本周波数決定モジュール77は、ルールデータベース78およびデータベース79中の、あらかじめ大量のデータから学習して得られた、音韻環境と音の基本周波数との関係を示すルールおよびデータを用いて、音声記号列を解析し、それぞれの音(音素)のピッチを決定するものである。
【0228】
継続時間長決定モジュール74および基本周波数決定モジュール77からなる韻律制御部71で求められたデータは、韻律データという中間的な表現形態で出力される。
【0229】
図27および図28の波形生成部81は、韻律制御部71から出力された韻律データに従って、音素の並び、継続時間長および基本周波数などを考慮して、素片データベース82から適切な音声素片を選択し、必要に応じて変形を施した上で接続して、音声ナレーションの音声波形を示す音声データを生成するものである。
【0230】
さらに、この例では、ユーザーは、上述したユーザー指示情報によって、テキスト音声合成部19で生成される音声ナレーションの音声波形につき、話速、声の高さ、音色、音声レベルなどを指定することができる。
【0231】
語の発音やアクセントは、年代によって変化するが、テキスト音声合成部19の各部および各モジュールが、年代ごとにルール、辞書、データ、音声素片を保持し、ユーザーによって指定された年代のルール、辞書、データ、音声素片によって、解析、生成、決定などの処理を実行することによって、テキスト音声合成部19から出力される音声ナレーションとして、ユーザーによって指定された年代の発話の特徴を反映したものが得られる。
【0232】
また、上述したカメラ状態情報によって、例えば、DSCシステムの使用時間帯に応じて、テキスト音声合成部19で生成される音声ナレーションの音声波形につき、話速、声の高さ、音色、音声レベルなどを変化させ、例えば、朝には声を高くし、深夜には音声レベルを下げるなどの制御を行うことができる。また、季節や特定日に合わせて、テキスト音声合成による音声にBGMを付加することもできる。
【0233】
図1で上述したように、テキスト音声合成部19で生成された音声データは、D/Aコンバータ27でアナログ音声信号に変換され、その音声信号が音声増幅回路28で増幅されてスピーカ29に供給され、スピーカ29から音声ナレーションが出力される。
【0234】
〔他の実施形態〕
上述した実施形態は、ユーザー入力の撮影場所を示す文字列データを、ユーザーコメントデータとして画像ファイルのユーザーコメント欄に書き込み、画像再生時、「この画像は2002年の11月21日に自宅で撮影しました」というようなメッセージ文を生成し、音声ナレーションを出力する場合であるが、DSCシステムにGPS(Global Positioning System)受信機を設け、または接続できるようにし、このGPS受信機で測定された撮影位置を、ユーザーコメントデータとして画像ファイルのユーザーコメント欄に書き込み、画像再生時、「この画像は2002年の11月21日に北緯35度25分、東経138度54分の場所で撮影しました」というようなメッセージ文を生成し、音声ナレーションを出力するように、システムを構成することもできる。
【0235】
さらに、DSCシステムまたはCPU受信機が地図メモリを備え、撮影時、その地図メモリを参照して、GPS受信機で測定された「北緯35度25分、東経138度54分」というような撮影位置を、「山中湖近傍」というような撮影場所に変換して、ユーザーコメントデータとして画像ファイルのユーザーコメント欄に書き込み、画像再生時、「この画像は2002年の11月21日に山中湖近傍で撮影しました」というようなメッセージ文を生成し、音声ナレーションを出力するように、システムを構成することもできる。
【0236】
なお、上述した実施形態は、画像ファイルフォーマットとしてExifファイルフォーマットのDCFファイルシステムを用いる場合であるが、将来的に考えられるファイルフォーマットまたはファイルシステムを用いることもできる。
【0237】
また、上述した実施形態は、この発明をDSCに適用した場合であるが、この発明は、DSCに限らず、カメラ付きPDAやカメラ付き携帯電話端末などにも適用することができる。
【0238】
【発明の効果】
上述したように、この発明によれば、ユーザーとしては簡単な操作や入力によって、または特に操作や入力を必要とすることなく、しかも、画像ファイルとは別にテキストファイルや音声ファイルを記録することなく、撮影された画像の内容や撮影時のカメラ制御状態などの画像に関連する事項を、装置のユーザーインターフェースとしてユーザーに的確に提示することができる。
【0239】
しかも、DSCやカメラ付き携帯端末などの画像記録再生装置のディスプレイ画面が小さい場合でも、さらには、その小さい画面上にサムネイル画像が配列表示された状態でも、画像の一部または大部分を文字などによって覆うことなく、音声ナレーションによって画像内容などをユーザーに十分かつ明瞭に提示することができる。
【0240】
さらに、音声ナレーションの出力のために画像ファイルとは別の音声ファイルなどにアクセスする必要がないので、記録メディアが光ディスクのようなメディア上のシークに時間がかかるものである場合でも、画像の再生および音声ナレーションの出力のためのファイルへのアクセス時間が増加することがない。
【0241】
また、画像ファイルとは別に音声ファイルなどを記録する必要がないので、ファイル書き込み回数が増加することがなく、記録メディアとして、書き込み回数に制限のあるメモリや、一括して書き込み消去を行う必要のある、例えばフラッシュメモリを用いたメモリカードを用いる場合、記録メディアを長く使用することができる。
【図面の簡単な説明】
【図1】この発明の画像記録再生装置の一実施形態のDSCシステムを示す図である。
【図2】画像ファイルフォーマットの一例を示す図である。
【図3】フォルダ名対照テーブルファイルと画像ファイルの一例を示す図である。
【図4】フォルダ名対照テーブルファイルと画像ファイルの他の例を示す図である。
【図5】音声ファイルフォーマットの一例を示す図である。
【図6】画像関連情報の書き込み読み出し制御の一例を示す図である。
【図7】画像関連情報の書き込み読み出し制御の他の例を示す図である。
【図8】キー操作入力部の一例を示す図である。
【図9】画像内容および撮影場所を示す文字の入力方法の一例を示す図である。
【図10】画像内容および撮影場所を示す文字の入力方法の他の例を示す図である。
【図11】カメラ撮像部の一例を示す図である。
【図12】E−Eモードおよび記録モードでのカメラ制御状態の音声ナレーションの説明に供する図である。
【図13】カメラ制御状態を示すデータの書き込み読み出し制御の一例を示す図である。
【図14】E−Eモードでの露出状態の音声ナレーションの説明に供する図である。
【図15】E−Eモードでのフォーカス状態の音声ナレーションおよび記録モードでの撮影日の音声ナレーションの説明に供する図である。
【図16】E−Eモードから記録モードに移行する場合のユーザー操作およびシステム動作の一例を示す図である。
【図17】閲覧モードでの音声ナレーションの説明に供する図である。
【図18】閲覧モードでの構文構成の説明に供する図である。
【図19】早見モードでの音声ナレーションの説明に供する図である。
【図20】高速連写画像の順方向スライドショー再生の説明に供する図である。
【図21】高速連写画像の逆方向スライドショー再生の説明に供する図である。
【図22】再生モードでのフォーカス状態および撮影日のメッセージ文の説明に供する図である。
【図23】再生モードでの一連のユーザー操作およびシステム動作の一例を示す図である。
【図24】再生モードでの露出状態のメッセージ文の構文構成の説明に供する図である。
【図25】構文構成部の一例を示す図である。
【図26】構文構成部中のテキスト生成部の一例を示す図である。
【図27】テキスト音声合成部の一例を示す図である。
【図28】テキスト音声合成部の各部の具体例を示す図である。
【符号の説明】
主要部については図中に全て記述したので、ここでは省略する。
Claims (18)
- 画像を撮影し、定められたファイルフォーマットの画像ファイルとして記録メディアに記録する撮影記録工程と、
画像に関連する情報を、文字列データとして、前記画像ファイルの前記ファイルフォーマットで指定された領域に記録する情報記録工程と、
前記画像ファイルとして記録された画像の、原画像またはサムネイル画像を再生する画像再生工程と、
前記画像ファイルから前記画像関連情報の文字列データを読み出し、辞書解析および構文解析によって、画像についてのメッセージ文を生成する構文構成工程と、
その生成したメッセージ文から、テキスト音声合成によって、音声ナレーションのデータを生成するテキスト音声合成工程と、
を備える画像記録再生方法。 - 請求項1の画像記録再生方法において、
前記画像関連情報は、ユーザーによって入力される情報である画像記録再生方法。 - 請求項1の画像記録再生方法において、
前記画像関連情報は、撮影属性情報である画像記録再生方法。 - 請求項1の画像記録再生方法において、
前記画像関連情報は、画像撮影時のカメラ制御状態を示す情報である画像記録再生方法。 - 請求項1の画像記録再生方法において、
前記構文構成工程では、指定されたフォルダ名を含むメッセージ文を生成する画像記録再生方法。 - 請求項1の画像記録再生方法において、
前記構文構成工程では、前記画像ファイルのファイル種類情報またはファイル拡張子に応じて動詞を選択して、メッセージ文を生成する画像記録再生方法。 - 請求項1の画像記録再生方法において、
前記構文構成工程および前記画像再生工程では、ディスプレイ上で選択されたサムネイル画像のデータを含む画像ファイルから前記画像関連情報の文字列データを読み出してメッセージ文を生成しつつ、次にディスプレイ上で選択されるべきサムネイル画像のデータを含む画像ファイルからサムネイル画像データを読み出す画像記録再生方法。 - 請求項1の画像記録再生方法において、
前記撮影記録工程では、撮影モードの一つとして、複数の画像を1秒未満の定められた時間間隔で連続して撮影記録し、
前記情報記録工程では、前記複数の画像の撮影日時を、サブ秒の単位まで記録し、
前記画像再生工程では、前記複数の画像中の、指定された範囲内の原画像を、定められた時間間隔で連続して再生し、
前記構文構成工程では、指定された範囲内の当該画像の撮影日時と再生開始画像の撮影日時との差分時間T(秒)を算出して、当該画像の再生時、「T秒後」または「T秒前」という語句を含むメッセージ文を生成する画像記録再生方法。 - 画像を撮影する撮像手段と、
その撮影された画像を、定められたファイルフォーマットの画像ファイルとして記録メディアに記録する画像記録手段と、
画像に関連する情報を、文字列データとして、前記画像ファイルの前記ファイルフォーマットで指定された領域に記録する情報記録手段と、
前記画像ファイルとして記録された画像の、原画像またはサムネイル画像を再生する画像再生手段と、
前記画像ファイルから前記画像関連情報の文字列データを読み出し、辞書解析および構文解析によって、画像についてのメッセージ文を生成する構文構成手段と、
その生成されたメッセージ文から、テキスト音声合成によって、音声ナレーションのデータを生成するテキスト音声合成手段と、
を備える画像記録再生装置。 - 請求項9の画像記録再生装置において、
前記画像関連情報として文字を入力できる手段を備える画像記録再生装置。 - 請求項9の画像記録再生装置において、
前記画像関連情報として撮影属性情報を取得する手段を備える画像記録再生装置。 - 請求項9の画像記録再生装置において、
前記画像関連情報として画像撮影時のカメラ制御状態を検出する手段を備える画像記録再生装置。 - 請求項9の画像記録再生装置において、
前記構文構成手段は、指定されたフォルダ名を含むメッセージ文を生成する画像記録再生装置。 - 請求項9の画像記録再生装置において、
前記構文構成手段は、前記画像ファイルのファイル種類情報またはファイル拡張子に応じて動詞を選択して、メッセージ文を生成する画像記録再生装置。 - 請求項9の画像記録再生装置において、
前記構文構成手段および前記画像再生手段は、ディスプレイ上で選択されたサムネイル画像のデータを含む画像ファイルから前記画像関連情報の文字列データを読み出してメッセージ文を生成しつつ、次にディスプレイ上で選択されるべきサムネイル画像のデータを含む画像ファイルからサムネイル画像データを読み出す画像記録再生装置。 - 請求項9の画像記録再生装置において、
前記撮像手段は、撮影モードの一つとして、複数の画像を1秒未満の定められた時間間隔で連続して撮影し、
前記情報記録手段は、前記複数の画像の撮影日時をサブ秒の単位まで記録し、
前記画像再生手段は、前記複数の画像中の、指定された範囲内の原画像を、定められた時間間隔で連続して再生し、
前記構文構成手段は、指定された範囲内の当該画像の撮影日時と再生開始画像の撮影日時との差分時間T(秒)を算出して、当該画像の再生時、「T秒後」または「T秒前」という語句を含むメッセージ文を生成する画像記録再生装置。 - 撮影対象の画像のフォーカス状態または露出状態を検出する工程と、
その検出結果の文字列データから、辞書解析および構文解析によって、画像についてのメッセージ文を生成する工程と、
その生成したメッセージ文から、テキスト音声合成によって、音声ナレーションのデータを生成し、音声ナレーションを出力する工程と、
画像を撮影し、定められたファイルフォーマットの画像ファイルとして記録メディアに記録する工程と、
その画像ファイルとして記録された画像を再生する工程と、
を備える画像記録再生方法。 - 撮影対象の画像のフォーカス状態または露出状態を検出する手段と、
その検出結果の文字列データから、辞書解析および構文解析によって、画像についてのメッセージ文を生成する手段と、
その生成されたメッセージ文から、テキスト音声合成によって、音声ナレーションのデータを生成し、音声ナレーションを出力する手段と、
画像を撮影し、定められたファイルフォーマットの画像ファイルとして記録メディアに記録する手段と、
その画像ファイルとして記録された画像を再生する手段と、
を備える画像記録再生装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003079881A JP2004289560A (ja) | 2003-03-24 | 2003-03-24 | 画像記録再生方法および画像記録再生装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003079881A JP2004289560A (ja) | 2003-03-24 | 2003-03-24 | 画像記録再生方法および画像記録再生装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004289560A true JP2004289560A (ja) | 2004-10-14 |
Family
ID=33293888
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003079881A Pending JP2004289560A (ja) | 2003-03-24 | 2003-03-24 | 画像記録再生方法および画像記録再生装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004289560A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007036450A (ja) * | 2005-07-25 | 2007-02-08 | Canon Inc | 画像再生装置、撮像装置、及び制御方法 |
JP2007178839A (ja) * | 2005-12-28 | 2007-07-12 | Sony Corp | 表示制御装置および表示制御方法、並びにプログラム |
JP2009058226A (ja) * | 2007-08-29 | 2009-03-19 | Pioneer Electronic Corp | 情報生成装置及び情報生成方法、情報表示装置及び情報表示方法、データ構造並びに情報生成用プログラム及び情報表示用プログラム |
JP2010267270A (ja) * | 2010-05-24 | 2010-11-25 | Ricoh Co Ltd | 画像形成装置、画像印刷システム、プログラムおよび画像合成出力方法 |
JP5042037B2 (ja) * | 2005-12-27 | 2012-10-03 | オリンパスメディカルシステムズ株式会社 | カプセル型医療装置誘導システム |
WO2013001990A1 (ja) * | 2011-06-29 | 2013-01-03 | 三洋電機株式会社 | 撮影メモ作成装置 |
JP2016163233A (ja) * | 2015-03-03 | 2016-09-05 | 株式会社国際電気通信基礎技術研究所 | 再生管理装置、再生管理プログラム、再生管理方法および再生管理システム |
-
2003
- 2003-03-24 JP JP2003079881A patent/JP2004289560A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007036450A (ja) * | 2005-07-25 | 2007-02-08 | Canon Inc | 画像再生装置、撮像装置、及び制御方法 |
JP4646723B2 (ja) * | 2005-07-25 | 2011-03-09 | キヤノン株式会社 | 画像再生装置、撮像装置、及び制御方法 |
JP5042037B2 (ja) * | 2005-12-27 | 2012-10-03 | オリンパスメディカルシステムズ株式会社 | カプセル型医療装置誘導システム |
JP2007178839A (ja) * | 2005-12-28 | 2007-07-12 | Sony Corp | 表示制御装置および表示制御方法、並びにプログラム |
US8897625B2 (en) | 2005-12-28 | 2014-11-25 | Sony Corporation | Slideshow display control for a display control apparatus |
JP2009058226A (ja) * | 2007-08-29 | 2009-03-19 | Pioneer Electronic Corp | 情報生成装置及び情報生成方法、情報表示装置及び情報表示方法、データ構造並びに情報生成用プログラム及び情報表示用プログラム |
JP2010267270A (ja) * | 2010-05-24 | 2010-11-25 | Ricoh Co Ltd | 画像形成装置、画像印刷システム、プログラムおよび画像合成出力方法 |
WO2013001990A1 (ja) * | 2011-06-29 | 2013-01-03 | 三洋電機株式会社 | 撮影メモ作成装置 |
JP2016163233A (ja) * | 2015-03-03 | 2016-09-05 | 株式会社国際電気通信基礎技術研究所 | 再生管理装置、再生管理プログラム、再生管理方法および再生管理システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8396714B2 (en) | Systems and methods for concatenation of words in text to speech synthesis | |
EP2207165B1 (en) | Information processing apparatus and text-to-speech method | |
KR101513888B1 (ko) | 멀티미디어 이메일 합성 장치 및 방법 | |
US20060129927A1 (en) | HTML e-mail creation system, communication apparatus, HTML e-mail creation method, and recording medium | |
JP4127668B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US20100082344A1 (en) | Systems and methods for selective rate of speech and speech preferences for text to speech synthesis | |
US20100082348A1 (en) | Systems and methods for text normalization for text to speech synthesis | |
US20100082349A1 (en) | Systems and methods for selective text to speech synthesis | |
JPH02204827A (ja) | 報告作成装置および方法 | |
JPH10274997A (ja) | 文書読み上げ装置 | |
JP2007507746A (ja) | 選択自由な後処理を備えた携帯可能な装置のための音声タギング,音声アノテーション,および音声認識 | |
JP2003330777A (ja) | データファイル再生装置、記録メディア、データファイル記録装置及びデータファイル記録プログラム | |
KR101567449B1 (ko) | 음성인식에 기반한 애니메이션 재생이 가능한 전자책 단말기 및 그 방법 | |
US20140019132A1 (en) | Information processing apparatus, information processing method, display control apparatus, and display control method | |
US8706484B2 (en) | Voice recognition dictionary generation apparatus and voice recognition dictionary generation method | |
JP2004289560A (ja) | 画像記録再生方法および画像記録再生装置 | |
JP4189653B2 (ja) | 画像記録再生方法および画像記録再生装置 | |
JP4697432B2 (ja) | 音楽再生装置、音楽再生方法及び音楽再生用プログラム | |
US20030122943A1 (en) | Method of storing data, a method of storing and reproducing data and an image-pickup apparatus | |
CN113709521A (zh) | 一种根据视频内容自动匹配背景的系统 | |
JP2005326811A (ja) | 音声合成装置および音声合成方法 | |
JP4765274B2 (ja) | 音声合成装置及び音声合成方法 | |
JP2007049245A (ja) | 音声入力機能付撮影装置 | |
JP2004294577A (ja) | 文字情報音声変換方法 | |
JP2004301894A (ja) | 音声記録方法および装置、デジタルカメラ、並びに画像再生方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051021 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080123 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080319 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080416 |