本発明は、画像データを分類するための分類用データを生成する分類用データ生成プログラム及びデジタルカメラ並びに記録装置に関する。
近年、写真画像に関する様々なサービスが提供されている。例えば、デジタルカメラで写真を撮影した場合、デジタルカメラやデジタルカメラ用メディアをミニラボ等の写真店に持ち込めば、店舗内に設けられた無人端末(キオスク)や店頭端末などを用いて、デジタルカメラやメディアに記録された画像データをCD−R、DVD−Rなどの記録媒体に書き込むこともできる(上記無人端末に関しては、例えば、下記特許文献1参照)。
また、デジタルカメラ、メディアから読み取った画像データを単に記録媒体に記録するのではなく、これらの画像データからスライドショーとして表示される動画データを生成(エンコード)し、該動画データに基づいてDVDプレーヤやDVDレコーダ、HDDレコーダ、ゲーム機などの家電機器で再生可能なデータ(以下、家電機器用データと呼ぶ。)を生成(オーサリング)し、生成したデータを画像データと共にCD−RやDVD−Rなどの記録媒体に書き込むサービスも行われている。
また、読み取った画像データから家電機器用データを生成したり、画像データや家電機器用データを記録媒体に書き込むためのアプリケーションを提供するサービスもあり、該アプリケーションを自宅のパーソナルコンピュータなどのコンピュータ機器にインストールすることにより、写真店などに出向かなくても自宅でデジタルカメラやメディアから読み取った画像データや生成した家電機器用データを記録媒体に書き込んだり、コンピュータ機器のハードディスクにバックアップすることもできる。
上記サービスを利用することにより、デジタルカメラ、メディアから読み取った画像データを電子アルバムとして利用することができ、コンピュータ機器や家電機器を用いて記録媒体内の画像データをファイル名や撮影日時などに基づいて配列した順番で一覧表示したり、スライドショーとして再生することができる。
しかしながら、画像データをファイル名順や撮影日時順で再生する方法は必ずしも便利ではなく、例えば、撮影者や被写体、撮影場所、イベントの種類などの特定の項目で分類した方が画像データを整理して表示することができ、また、スライドショーの見栄えをよくすることができるが、従来は、ファイル名や撮影日時以外で画像データを分類することはできず、上記特定の項目で画像データを分類するためには各々の画像データの画像を確認してユーザ自らが分類しなければならないという問題があった。
本発明は、上記問題点に鑑みてなされたものであって、その主たる目的は、画像データを分類するための分類用データを生成する分類用データ生成プログラム及びデジタルカメラ並びに記録装置を提供することにある。
上記目的を達成するため、本発明の分類用データ生成プログラムは、コンピュータを、画像データに対応して入力された音声データをテキスト情報に変換する手段、画像データを分類するためのキーワードが列記された辞書テーブルを参照して、前記テキスト情報を構成する言語の中から前記キーワードに合致する言語を抽出する手段、少なくとも、抽出された前記言語と前記画像データとを対応付ける情報を記述した分類用データを生成する手段、として機能させるものである。
本発明においては、前記辞書テーブルは、撮影者、被写体、撮影場所、イベントの種類、撮影条件及び写真の種類の中から選択される1以上の項目に対する前記キーワードを含むことが好ましい。
また、本発明のデジタルカメラは、写真を撮像して画像データを取得する手段と、取得した前記画像データに対応する音声データを入力させる手段と、画像データを分類するためのキーワードが列記された辞書テーブルを記憶する手段と、前記音声データをテキスト情報に変換する手段と、前記辞書テーブルを参照して、前記テキスト情報を構成する言語の中から前記キーワードに合致する言語を抽出する手段と、少なくとも、抽出された前記言語と前記画像データとを対応付ける情報を記述した分類用データを生成する手段と、を含む分類用データ生成手段と、少なくとも、前記画像データと前記分類用データとを関連付けて記憶手段又はメディアに記録させる記録制御手段とを少なくとも備えるものである。
また、本発明の記録装置は、画像データと該画像データに対応する音声データとを読み取る手段と、画像データを分類するためのキーワードが列記された辞書テーブルを記憶する手段と、前記音声データをテキスト情報に変換する手段と、前記辞書テーブルを参照して、前記テキスト情報を構成する言語の中から前記キーワードに合致する言語を抽出する手段と、少なくとも、抽出された前記言語と前記画像データとを対応付ける情報を記述した分類用データを生成する手段と、を含む分類用データ生成手段と、少なくとも、前記画像データと前記分類用データとを関連付けて記録媒体に記録させる記録制御手段とを少なくとも備えるものである。
また、本発明の記録装置は、画像データを読み取る手段と、読み取った前記画像データに対する音声データを入力させる手段と、画像データを分類するためのキーワードが列記された辞書テーブルを記憶する手段と、前記音声データをテキスト情報に変換する手段と、前記辞書テーブルを参照して、前記テキスト情報を構成する言語の中から前記キーワードに合致する言語を抽出する手段と、少なくとも、抽出された前記言語と前記画像データとを対応付ける情報を記述した分類用データを生成する手段と、を含む分類用データ生成手段と、少なくとも、前記画像データと前記分類用データとを関連付けて記録媒体に記録させる記録制御手段とを少なくとも備えるものである。
本発明においては、前記分類用データの記述に基づいて分類された前記画像データをスライドショーとして再生させるためのVideo−CD形式又はDVD−Video形式の家電機器用データを生成する手段を備え、前記記録制御手段では、更に、前記家電機器用データを前記記録媒体に記録させる構成とすることができる。
このように、本発明の構成によれば、画像データに対応して入力された音声データに基づいて、画像データを撮影者や被写体、撮影場所、イベントの種類、撮影条件、写真の種類などの特定の項目で分類するための分類用データが生成されるため、この分類用データを利用することにより、画像データを効果的に分類することができる。
本発明の分類用データ生成プログラム及びデジタルカメラ並びに記録装置によれば、画像データを効果的に分類することができ、ユーザの利便性を向上させることができる。
その理由は、分類用データ生成手段により、画像データに対応して入力された音声データがテキスト情報に変換され、画像データを分類するためのキーワードが列記された辞書テーブルを参照して、テキスト情報を構成する言語の中からキーワードに合致する言語が抽出され、少なくとも抽出された言語と画像データとを対応付ける情報を記述した分類用データが生成されるため、この分類用データを利用することにより、被写体、撮影場所、イベントの種類、撮影条件、写真の種類などの特定の項目で画像データを分類することができるからである。
本発明の分類用データ生成プログラムは、その好ましい一実施の形態において、コンピュータを、画像データに対応して入力された音声データをテキスト情報に変換する手段、画像データを分類するためのキーワードが列記された辞書テーブルを参照して、テキスト情報を構成する言語の中からキーワードに合致する言語を抽出する手段、少なくとも抽出された言語と画像データとを対応付ける情報を記述した分類用データを生成する手段として機能させるものであり、この分類用データを利用することにより、被写体、撮影場所、イベントの種類、撮影条件、写真の種類などの特定の項目で画像データを効果的に分類することができ、ユーザの利便性を向上させることができる。
上記した本発明の実施の形態についてさらに詳細に説明すべく、本発明の第1の実施例に係る分類用データ生成プログラム及びデジタルカメラについて、図1乃至図6を参照して説明する。図1は、本実施例のデジタルカメラの構成を模式的に示す図であり、図2は、デジタルカメラの主要な手段を示すブロック図である。また、図3は、本実施例のデジタルカメラを用いた分類用データの生成手順を示すフローチャート図であり、図4は、本実施例のデジタルカメラに記憶された辞書テーブルの構成例を示す図である。また、図5は、本実施例の分類用データの構成例を示す図であり、図6は、本実施例のデジタルカメラに記憶されるデータの記録構造を示す図である。
図1及び図2に示すように、本実施例のデジタルカメラ1(デジタルスチルカメラ、デジタルムービーカメラ、カメラ付き携帯電話機など、写真を撮影する機能を有する機器を総称してデジタルカメラ1とする。)は、CCD等の撮像素子、レンズ等の光学部材を備え、CCDの受光面に結像される被写体の光学像を画像信号に変換する撮像手段5、画像信号に色分離処理、ゲイン調整、A/D変換、コントラスト調整、ホワイトバランス調整、ガンマ補正等の処理を行って画像データに変換する信号処理手段6、画像データを記録する内蔵メモリなどの内部記録手段8や本体に着脱可能に取り付けられたスマートメディア、コンパクトフラッシュ(登録商標)、メモリースティック(登録商標)、SDメモリーカード、マルチメディアカードなどの記録媒体(以下、メディア11と呼ぶ。)、液晶モニタなどの表示手段2、シャッターボタンやジョグダイアルなどの操作手段3等に加えて、画像データに関する情報を音声データとして入力させるためのマイクなどの音声入力手段9、入力された音声データに基づいて画像データを特定の項目で分類するための分類用データを生成する分類用データ生成手段10、画像データと分類用データと必要に応じて音声データとを関連付けて内部記録手段8やメディア11に記録する記録制御手段7などを備え、上記各手段が制御手段4によって制御されている。
なお、上記各手段はデジタルカメラ1にハードウェアとして構成されていてもよいが、コンピュータを、少なくとも、分類用データ生成手段10として機能させる分類用データ生成プログラムとして構成し、該分類用データ生成プログラムを内部記憶手段8に記憶し、デジタルカメラ1で実行させる構成としてもよい。
上記構成のデジタルカメラ1を用いて分類用データを生成する手順について、図3のフローチャート図を参照して説明する。なお、ここでは、デジタルカメラ1に撮影済みの画像データが予め記憶されており、撮影後に各々の画像データに対して音声データを入力する構成とするが、写真撮影と音声データの入力とを続けて行う構成としてもよい。
まず、ステップS101で、ユーザはデジタルカメラ1の電源を投入し、ステップS102で、操作手段3を操作して表示手段2に撮影済みの画像データを表示させ、その中から音声データの入力対象となる画像データを選択する。なお、ここでは1つ1つの画像データに対して音声データを入力する構成としているが、同種の複数の画像データ(例えば、同じ者が同じ場所で撮影した複数の画像データなど)に対して一括して音声データを入力する構成としてもよい。
次に、必要に応じて、ステップS103で、選択された画像データに付帯する注文情報ファイルに記述された情報(例えば、DPOF:Digital Print Order Format情報)や画像データのヘッダに記述された情報(例えば、EXIF:Exchangeable Image File Format情報)を参照して、該画像データに対応付けられた撮影日時や記録日時などの日時情報を読み取る。
次に、ステップS104で、上記DPOF情報やEXIF情報を参照して、該画像データが音声付き画像データであるか(すなわち、該画像データに音声データが含まれているか、また、該画像データに音声データが関連付けされているか)を判断する。そして、選択された画像データが音声付き画像データの場合はステップS106にスキップし、選択された画像データが音声付き画像データでない場合は、ステップS105で、ユーザは音声入力手段9を用いて該画像データに対して音声データを入力する。
なお、入力する音声データは画像データを分類するために利用可能な情報(例えば、撮影者の名前や被写体の名前、写真撮影の場所、イベントの名称、写真の向きや色情報などの撮影条件、通常の写真かパノラマ写真か連写写真か等の写真の種類などの特定の項目の中から選択される1以上の項目に対する情報を含んでいればよい。また、上記情報の発声の順序や発声の方法(単語して発声するか、文章として発声するかなど)などは特に限定されないが、後述する音声データの認識を迅速かつ確実に行うために、予め定められたルール(例えば、撮影者、被写体、撮影場所、イベントの種類の順序で単語で発声するなど)に従って発声することが好ましい。また、ここでは、画像データに音声データが含まれているか、又は、画像データに音声データが関連付けされている場合には音声データの入力を行わない構成としたが、これらの音声データ中に上記特定の項目に対する情報が含まれていない場合もあるため、選択された全ての画像データに対して音声データの入力を行うようにしてもよい。
そして、分類用データ生成手段10は、入力された音声データ、又は、画像データに付帯又は関連付けされた音声データに基づいて、画像データを特定の項目で分類するための分類用データを生成する。
具体的には、まず、ステップS106で、公知の音声認識手法を用いて、入力された音声データを音響分析して音響パラメータを抽出し、音声の統計的な情報をモデル化した音響モデルを用いて音響パラメータの尤度(確からしさ)を求め、音声データに最も近い言語を検索してテキスト情報として出力する。なお、上記音声認識手法は例示であり、音声データをテキスト情報に変換(テキスト化)できる手法であればよい。
次に、ステップS107で、分類用データ生成手段10は、内部記憶手段8に予め記憶された、特定の項目に対するキーワードが列記された辞書テーブルを参照して、テキスト情報を構成する単語や文節などの所定の単位の言語の中から上記キーワードに合致する言語を抽出する。この辞書テーブルは、例えば、図4に示すように構成され、特定の項目(例えば”Person”、”Place”、”Event”など)の各々に対して、対象となる情報(例えば、”Person”として”Taro”や”Hanako”など)が網羅されており、”タロー”という音声を入力した場合は、”Taro”が辞書テーブルに列記されていることから、分類用データ生成手段10は、”Taro”を分類用データに利用する言語として抽出する。
次に、ステップS108で、分類用データ生成手段10は、ステップS107で抽出した言語と、必要に応じてステップS103で読み取った日時情報と、ステップS102で選択された画像データを特定する情報(ファイル名など)とを対応付ける情報を記述した分類用データを生成する。なお、この分類用データは、特定した言語と画像データとを対応付ける情報が記述されていればよく、記述の順番やデータの構成などは特に限定されない。また、分類用データの形式も特に限定されず、テキスト形式としてもよいし、写真業界で推奨されている専用のファイル(pvm形式のファイル)としてもよいし、メタデータとしてもよい。
次に、ステップS109で、記録制御手段7は、画像データと上記手順で生成した分類用データと必要に応じて音声データとを関連付けて内部記憶手段8又はメディア11に記録する。この関連付けの方法は、画像データと分類用データと必要に応じて音声データの関連を画像データが利用される機器側で認識できる方法であればよく、例えば、画像データと分類用データと必要に応じて音声データとを同じファイル名(拡張子のみが異なるファイル名)や同じ要素を含むファイル名としたり、画像データと分類用データと必要に応じて音声データとを関連付ける情報を情報ファイルに記述するなどの方法がある。
そして、ステップS110で、他の画像データに対して音声データを入力する場合は、ステップS102に戻って同様の処理を行う。
上記手順で生成された分類用データは例えば、図5(a)に示すようになり、各々の画像データ(例えば、DSC00001.jpg)に対する分類用データ(例えば、DSC00001.txt)には、画像データの格納場所及びファイル名と、特定された言語(例えば、”Hanako”、”Tokyo”、”Hatsumoude"など)と、日時情報(例えば、”05.01.01”など)などが記述される。なお、図5(a)の構成は、1つの画像データに対して1つの分類用データを生成する場合の例であるが、複数の画像データに対して1つの分類用データを生成してもよい。その場合の分類用データは例えば、図5(b)に示すようになり、格納場所やファイル名、特定された言語、日時情報などが画像データ毎に列記される。
また、内部記録手段8又はメディア11におけるデータの記録構造は、例えば、図6(a)に示すようになり、画像データの格納場所を示すフォルダ(100KONICなど)に、撮影して得られた画像データ(DSC00001.jpgなど)と、必要に応じて、該画像データに対して入力された音声データ(DSC00001.wavなど)と、画像データ毎に作成された分類用データ(DSC00001.txtなど)がセットになって記録される。また、複数の画像データに対して1つの分類用データが生成される場合は、図6(b)に示すようになり、画像データの格納場所を示すフォルダ(100KONICなど)に、撮影して得られた画像データ(DSC00001.jpgなど)と、必要に応じて、該画像データに対して入力された音声データ(DSC00001.wavなど)と、1つの分類用データ(classify.txtなど)が記録される。
このように、本実施例のデジタルカメラ1では、撮影した画像データに対して音声データを入力すると、分類用データ生成手段10では、音声データをテキスト情報に変換し、予め記憶された辞書テーブルを参照して、テキスト情報を構成する言語の中から辞書テーブルに記述されたキーワードと合致する言語を抽出し、少なくとも抽出した言語と画像データとを対応付ける情報を記述した分類用データを生成するため、画像データを再生する機器(デジタルカメラ1であってもよいし、コンピュータ機器などであってもよい。)でこの分類用データを利用し、分類用データの記述に基づいて多数の画像データを分類することにより、画像データを整理して一覧表示したり、見栄えよくスライド表示することができ、ユーザの利便性を向上させることができる。
次に、本発明の第2の実施例に係る分類用データ生成プログラム及び記録装置について、図7乃至図16を参照して説明する。図7は、本実施例の記録装置の構成を模式的に示す図であり、図8乃至図12は、そのバリエーションを示す図である。また、図13は、記録装置の主要な手段を示すブロック図であり、図14は、記録媒体の作成手順を示すフローチャート図である。また、図15は、記録媒体におけるデータの記録構造を示す図であり、図16は、CD−Rの構造を模式的に示す図である。なお、第1の実施例では、デジタルカメラで分類用データを生成したが、本実施例では、デジタルカメラで音声データの入力までを行い、記録装置で分類用データを生成する場合について記述する。
図7に示すように、本実施例の記録装置12は、メディア11を装填するメディア装填部16、デジタルカメラ1やカメラ付き携帯電話機1a等の撮影機器を有線又は無線、赤外線等によって接続するための機器接続部15などのデータを入力する手段と、記録媒体18を装填する記録媒体装填部17と、ボタン、キーボード、マウス等の操作手段14及びLCD、CRT等の表示手段13とを備えている。
また、記録装置12に備える主な手段をブロック図で示すと図13のようになり、メディア装填部16や機器接続部15などを用いて、デジタルカメラ1やメディア11などに記録された画像データや音声データを読み取るデータ入力手段19と、読み取った音声データに基づいて画像データを特定の項目で分類するための分類用データを生成する分類用データ生成手段10と、必要に応じて、分類された画像データをDVDプレーヤやDVDレコーダ、HDDレコーダ、ゲーム機などの家電機器でスライドショーとして表示させるための家電機器用データを生成するデータ生成手段20と、記録媒体装填部17に装填された記録媒体18に、画像データや分類用データ、音声データ、家電機器用データなど記録する制御を行う記録制御手段21と、第1の実施例と同様の辞書テーブルなどを記憶するハードディスクなどの記憶手段22と、画像データの表示などを行う表示手段13と、スライドショーの設定などを行う操作手段14とを備えている。
なお、上記各手段は記録装置12にハードウェアとして構成されていてもよいが、コンピュータを、少なくとも、分類用データ生成手段10として機能させる分類用データ生成プログラムとして構成し、該分類用データ生成プログラムを記録装置12にインストールして実行させる構成としてもよい。また、図7では記録装置12としてパーソナルコンピュータなどのコンピュータ機器を示しているが、記録装置12の形態は任意であり、例えば、図8に示すように写真店やコンビニエンスストアなどの店舗に設置される無人端末(キオスク)としたり、図9に示すように専用のセットトップボックスとしたり、図10に示すようにポータブルライターとしたり、図11に示すように演算処理機能を備えたDVDレコーダ、HDDレコーダなどとしたり、図12に示すように、ハードディスクを備えた端末と画像データの読み取りや書き込みを行う本体とが分離可能な携帯機器としたり、演算処理機能を備えたカーナビゲーション機器などとすることもできる。
上記構成の記録装置12を用いて分類用データを生成する手順について、図13のフローチャート図を参照して説明する。なお、デジタルカメラ1には予め画像データと該画像データに対応する音声データとが関連付けて記録されているものとする。また、本発明は画像データを分類するための分類用データを生成することを特徴とするが、本実施例では分類用データの生成に加えて、分類用データにより分類された画像データをスライドショーとして再生するための家電機器用データを生成し、更に各種データを記録媒体18に記録するものとする。
まず、ステップS201で、記録装置12のメディア装填部16にメディア11を装填、又は、機器接続部15にデジタルカメラ1やカメラ付き携帯電話機1aを接続する。次に、ステップS202で、データ入力手段19を用いて、デジタルカメラ1やメディア11から画像データと該画像データに対応する音声データとを読み取る。続いて、必要に応じて、読み取った画像データの中から処理の対象となる画像データを選択し、ステップS203で、DPOF情報やEXIF情報などを参照して、読み取った又は選択した画像データに対応付けられた撮影日時や記録日時などの日時情報を読み取る。
次に、ステップS204で、分類用データ生成手段10は、第1の実施例と同様に、公知の音声認識手法を用いて、各々の音声データを音響分析して音響パラメータを抽出し、音声の統計的な情報をモデル化した音響モデルを用いて音響パラメータの尤度(確からしさ)を求め、音声データに最も近い言語を検索してテキスト情報として出力する。
次に、ステップS205で、分類用データ生成手段10は、記憶手段22に予め記憶された、特定の項目に対するキーワードが列記された辞書テーブルを参照して、テキスト情報を構成する所定の単位の言語の中から上記キーワードに合致する言語を抽出する。
次に、ステップS206で、分類用データ生成手段10は、ステップS205で抽出した言語と、必要に応じてステップS203で読み取った日時情報と、画像データを特定する情報(ファイル名など)とを対応付ける情報を記述した分類用データを生成する。なお、第1の実施例と同様に、各々の音声データに対して分類用データを生成してもよいし、複数の画像データに対して1つの分類用データを生成してもよい。また、分類用データの形式も特に限定されず、テキスト形式としてもよいし、pvm形式のファイルとしてもよいし、メタデータとしてもよい。
次に、ステップS207で、データ生成手段20は、必要に応じて、読み取った画像データをスライドショーとして表示させるための設定(画像データの表示順や音楽データの選択など)を行う。その際、従来の記録装置12では、読み取った画像データはファイル名順又は撮影日時順などで表示されるだけであり、撮影者や被写体、撮影場所、イベントの種類などの特定の項目で分類して表示することができなかったためユーザの嗜好に応じたスライドショーを作成することができなかったが、本実施例の記録装置1では、画像データを特定の項目で分類するための分類用データが生成されているため、この分類用データの記述に基づいて画像データを分類し、スライドの表示順を設定することができ、例えば、被写体が”Hanako”の画像データをまとめて表示するなど、見栄えのよいスライドショーを作成することができる。
次に、ステップS208で、データ生成手段20は、必要に応じて、上記スライドショーをDVDレコーダやDVDプレーヤ、HDDレコーダ、ゲーム機などで再生させるために、画像データに基づいて動画データを生成(エンコード)し、生成された動画データに基づいて、家電機器で再生可能な形式の家電機器用データ(例えば、動画データがMPEG1形式の場合はVideo−CD形式のデータ、動画データがMPEG1又はMPEG2の場合はDVD−Video形式のデータ)を生成(オーサリング)する。また、必要に応じて、読み取った画像データのデータサイズを縮小したサムネイル画像データやスクリーンネイル画像データなどの縮小画像データを作成する。
次に、ステップS209で、記録媒体装填部17に記録媒体18を装填する。この記録媒体18として、市販されている任意の記録媒体18を用いることができるが、特定の記録媒体18のみ利用できるようにしてもよく、その場合は、ステップS210で、記録媒体18の所定の領域に記録媒体18を識別するための識別情報が記録されているか否かに基づいて記録媒体18を特定することができる。この識別情報の内容は限定されず、記録媒体18の製造者に対応するコード(製造者コード、通称Mコード)や記録媒体18の規格に対応するコード(タイプコード、通称Tコード)などとすることができる。また、上記識別情報は適正な記録媒体に対してデータの書き込みを許可するために設けるものであり、識別情報の中身が容易に知られてしまうと識別情報自体もコピーされてしまうため、識別情報の少なくとも一部はコンピュータのOSでは記録内容を制御できない情報、具体的にはプログラムメモリ領域の情報や、CD−R成型時に付与される案内溝変調(ATIP:Absolute Time In Pre-groove)による情報などとすることが好ましい。
ここで、一般的な記録媒体18の構造について、図16を参照して説明すると、CD-Rは、ポリカーボネート基板100上に、シアニン、フタロシアニン、アゾなどの有機色素層101と銀などの反射層102と保護層103とが積層されて形成され、有機色素層101に所定のパワーのレーザ光を当てて色素を分解して基板を変形させることでピットを形成し、情報の記録を行っているが、レーザパワーは、レーザ光を照射するレーザヘッドの方式や使用する有機色素層101の種類に応じて最適な値が異なるため、情報の書き込みを確実に行うためにはCD-Rのタイプやレーザ記録パワーの推奨値をドライブ側が認識する必要がある。そこで、ディスクの応用コードやレーザ記録パワーの推奨値などの情報を記録媒体の製造段階で案内溝変調(ATIP)による情報として書き込み、その情報をドライブのファームウェアが読み取り、ファームウェアが独自にレーザヘッドを制御してレーザパワーの調整を行っている。このような案内溝変調(ATIP)は製造時にしか作成できないため、ユーザレベルでのコピーを防止することができる。また、上記以外の案内溝変調(ATIP)であるリードイン開始時間、最大リードアウト開始可能時間等も適宜設定することで識別情報として利用することができる。
その後、各種データを記録媒体18に記録するが、家電機器ではデータを読み込むことができる記録領域が限定されるため、まず、ステップS211で、記録制御手段21は、必要に応じて生成した家電機器用データを記録媒体18の論理アドレス領域の内周側の領域に記録した後、必要に応じてセッションをクローズする。なお、上記論理アドレス領域とは、ユーザのデータ(プログラム)が記録される領域であり、ユーザデータの配置情報が記録されるプログラムメモリ領域、リードイン・TOC領域やリードアウト領域などの情報領域、ディスクの応用コードやレーザ記録パワーの推奨値、その他の情報が記録される案内溝変調(ATIP)情報の領域は含まない領域である。
次に、ステップS212で、読み取った画像データとステップS206で生成した分類用データと必要に応じて読み取った音声データとを関連付けてその外側の領域に記録して一連の処理を終了する。
上記手順で作成された記録媒体18のディレクトリ構造は、例えば図15(a)に示すようになり、画像データの格納場所を示すフォルダ(PS_Rollフォルダ)内に、画像データと分類用データと必要に応じて音声データとが格納され、APPLフォルダ内に、画像データをスライドショーとして表示させるためのアプリケーションや設定ファイルなどが格納されてコンピュータ機器用データが構成される。なお、このディレクトリ構造やファイル名は任意であるが、画像データの管理を容易にするために、画像データの格納場所を示すフォルダ(PS_Roll)の下位の階層にメディア11毎、機器毎、フィルム毎のデータの格納場所を示すフォルダ(ROYYMMDDyyy_XXXXXXAABxxx、YYMMDD:書き込み年月日を特定する数字、yyy:日毎のシーケンシャル番号、XXXXXX:ランダムなID番号、AA:メーカーコード(00〜ZZ)、B:ソフトウェア、機器の商品カテゴリー(0〜Z)、xxx:シーケンシャル番号)などを作成したり、各々のデータをCCYYMMDDxxxxxx(CC:データの種別、YYMMDD:書き込み年月日を特定する数字、xxxxxx:シーケンシャル番号)などにリネームしてもよい。
また、家電機器用データとしてVideo−CD形式のデータを生成した場合の記録媒体18のディレクトリ構造は図15(a)に示すようになり、上記コンピュータ機器用データに加えて、”VCD”フォルダ内の画像データをVideo−CD形式用データとして関連付けるファイル、”SEGMENT”フォルダ内のTV画面に表示する画像データ、”MPEGAV”フォルダ内の動画データ、”DAT”フォルダ内のTV画面に静止画像データを表示するためのアプリケーションなどが記録され、DVD−Video形式のデータを生成した場合は、図15(b)に示すように、”VIDEO_TS”フォルダ内の、チャプター位置情報が記述されたVIDEO_TS.IFOとそのバックアップファイルであるVIDEO_TS.BUPとタイトル選択メニューのためのVIDEO_TS.VOBとで構成されるビデオマネージャ(VMG)と、チャプター位置情報が記述されたVTS_**_0.IFOとそのバックアップファイルであるVTS_**_0.BUPとVTSの各タイトルの動画データであるVTS_**_*.VOBなどとで構成されるビデオタイトルセット(VTS)などが記録される。
このように、本実施例の記録装置12では、デジタルカメラ1やメディア11から画像データと音声データとを読み取ると、分類用データ生成手段10では、音声データをテキスト情報に変換し、予め記憶された辞書テーブルを参照してテキスト情報を構成する言語の中から辞書テーブルに記述されたキーワードに合致する言語を抽出し、少なくとも抽出した言語と画像データとを対応付ける情報を記述した分類用データを生成するため、この分類用データの記述に基づいて多数の画像データを分類して一覧表示したり、スライド表示したり、家電機器用データを生成したり、これらのデータが記録された記録媒体18を作成することができ、これによりユーザの利便性を向上させることができる。
次に、本発明の第3の実施例に係る分類用データ生成プログラム及び記録装置について、図17及び図18を参照して説明する。図17は、記録装置の主要な手段を示すブロック図であり、図18は、記録媒体の作成手順を示すフローチャート図である。なお、第2の実施例では、デジタルカメラで音声データを入力したが、本実施例では、記録装置で音声データの入力と分類用データの生成とを行う場合について記述する。
図17に示すように、本実施例の記録装置12は、デジタルカメラ1やメディア11などに記録された画像データを読み取るデータ入力手段19と、画像データに関する情報を音声データとして入力させるためのマイクなどの音声入力手段23と、入力された音声データに基づいて画像データを特定の項目で分類するための分類用データを生成する分類用データ生成手段10と、必要に応じて、分類された画像データをDVDプレーヤやDVDレコーダ、HDDレコーダ、ゲーム機などの家電機器でスライドショーとして表示させるための家電機器用データを生成するデータ生成手段20と、記録媒体装填部17に装填された記録媒体18に、画像データや分類用データ、音声データ、家電機器用データなど記録する制御を行う記録制御手段21と、第1の実施例と同様の辞書テーブルなどを記憶するハードディスクなどの記憶手段22と、画像データの表示などを行う表示手段13と、スライドショーの設定などを行う操作手段14とを備えている。
なお、本実施例においても上記各手段は記録装置12にハードウェアとして構成されていてもよいが、コンピュータを、少なくとも、分類用データ生成手段10として機能させる分類用データ生成プログラムとして構成し、該分類用データ生成プログラムを記録装置12にインストールして実行させる構成としてもよい。
上記構成の記録装置12を用いて分類用データを生成する手順について、図18のフローチャート図を参照して説明する。なお、本発明は画像データを分類するための分類用データを生成することを特徴とするが、本実施例では、第2の実施例と同様に分類用データの生成に加えて、分類用データにより分類された画像データをスライドショーとして再生するための家電機器用データを生成し、更に各種データを記録媒体18に記録するものとする。
まず、ステップS301で、記録装置12のメディア装填部16にメディア11を装填、又は、機器接続部15にデジタルカメラ1やカメラ付き携帯電話機1aを接続し、ステップS302で、データ入力手段19を用いて、デジタルカメラ1やメディア11から画像データを読み取る。続いて、読み取った画像データの中から処理の対象となる画像データを選択し、必要に応じて、ステップS303で、DPOF情報やEXIF情報などを参照して、読み取った又は選択した画像データに対応付けられた撮影日時や記録日時などの日時情報を読み取る。
次に、ステップS304で、上記DPOF情報やEXIF情報を参照して、該画像データが音声付き画像データであるかを判断し、音声付き画像データの場合はステップS306にスキップし、音声付き画像データでない場合は、ステップS305で、ユーザは音声入力手段23を用いて該画像データに対して音声データを入力する。
次に、分類用データ生成手段10は、ステップS306で、第1及び第2の実施例と同様に、公知の音声認識手法を用いて、各々の音声データを音響分析して音響パラメータを抽出し、音声の統計的な情報をモデル化した音響モデルを用いて音響パラメータの尤度(確からしさ)を求め、音声データに最も近い言語を検索してテキスト情報として出力する。続いて、ステップS307で、記憶手段22に予め記憶された、特定の項目に対するキーワードが列記された辞書テーブルを参照して、テキスト情報を構成する所定の単位の言語の中から上記キーワードに合致する言語を抽出し、ステップS308で、ステップS307で抽出した言語と、必要に応じてステップS303で読み取った日時情報と、画像データとを対応付ける情報を記述した分類用データを生成する。
次に、ステップS309で、データ生成手段20は、必要に応じて、読み取った画像データをスライドショーとして表示させるための設定を行い、ステップS310で、必要に応じて、上記スライドショーをDVDレコーダやDVDプレーヤ、HDDレコーダ、ゲーム機などで再生させるために、画像データに基づいて動画データを生成(エンコード)し、生成された動画データに基づいて、家電機器で再生可能な形式の家電機器用データを生成(オーサリング)する。
次に、ステップS311で、記録媒体装填部17に記録媒体18を装填し、必要に応じて、ステップS312で、記録媒体18の所定の領域に記録媒体18を識別するための識別情報が記録されているか否かに基づいて記録媒体18を特定する。
次に、ステップS313で、記録制御手段21は、必要に応じて生成した家電機器用データを記録媒体18の論理アドレス領域の内周側の領域に記録した後、必要に応じてセッションをクローズし、ステップS314で、読み取った画像データとステップS308で生成した分類用データと必要に応じて入力した音声データとを関連付けてその外側の領域に記録して一連の処理を終了する。
このように、本実施例の記録装置12では、デジタルカメラ1やメディア11から画像データを読み取り、音声入力手段23を用いて画像データに関する音声データを入力すると、分類用データ生成手段10では、音声データをテキスト情報に変換し、予め記憶された辞書テーブルを参照して、テキスト情報を構成する言語の中から辞書テーブルに記述されたキーワードと合致する言語を抽出し、少なくとも抽出された言語と画像データとを対応付ける情報を記述した分類用データを生成するため、この分類用データの記述に基づいて多数の画像データを分類して一覧表示したり、スライド表示したり、家電機器用データを生成したり、これらのデータが記録された記録媒体18を作成することができ、これによりユーザの利便性を向上させることができる。
なお、上記各実施例では、デジタルカメラで取得した画像データに対して分類用データを生成する場合を示したが、本発明は上記実施例に限定されるものではなく、写真フィルムをスキャンして得た画像データや通信ネットワークを介して取得した画像データなどに対して分類用データを生成する場合についても同様に適用することができる。
本発明の第1の実施例に係るデジタルカメラの構成を模式的に示す図である。
本発明の第1の実施例に係るデジタルカメラの主要な手段を示すブロック図である。
本発明の第1の実施例に係るデジタルカメラを用いた分類用データの生成手順を示すフローチャート図である。
本発明の第1の実施例に係るデジタルカメラに記憶される辞書テーブルの構成例を示す図である。
本発明の第1の実施例に係る分類用データの構成例を示す図である。
本発明の第1の実施例に係るデジタルカメラ又はメディアに記憶される画像データのフォルダ構造を示す図である。
本発明の第2の実施例に係る記録装置の構成を模式的に示す図である。
本発明の第2の実施例に係る記録装置のバリエーションを示す図である。
本発明の第2の実施例に係る記録装置のバリエーションを示す図である。
本発明の第2の実施例に係る記録装置のバリエーションを示す図である。
本発明の第2の実施例に係る記録装置のバリエーションを示す図である。
本発明の第2の実施例に係る記録装置のバリエーションを示す図である。
本発明の第2の実施例に係る記録装置の主要な手段を示すブロック図である。
本発明の第2の実施例に係る記録装置を用いた記録媒体の作成手順を示すフローチャート図である。
本発明の第2の実施例に係る記録媒体に記憶される画像データのフォルダ構造を示す図である。
記録媒体(CD−R)の構造を模式的に示す図である。
本発明の第3の実施例に係る記録装置の主要な手段を示すブロック図である。
本発明の第3の実施例に係る記録装置を用いた記録媒体の作成手順を示すフローチャート図である。
符号の説明
1 デジタルカメラ
1a カメラ付き携帯電話機
2 表示手段
3 操作手段
4 制御手段
5 撮像手段
6 信号処理手段
7 記録手段
8 内部記録手段
9 音声入力手段
10 分類用データ生成手段
11 メディア
12 記録装置
13 表示手段
14 操作手段
15 機器接続部
16 メディア装填部
17 記録媒体装填部
18 記録媒体
19 データ入力手段
20 データ生成手段
21 記録制御手段
22 記憶手段
23 音声入力手段
100 ポリカーボネート基板
101 有機色素層
102 反射層
103 保護層