JP2000358205A - 音声認識による画像分類装置、方法及び記憶媒体 - Google Patents

音声認識による画像分類装置、方法及び記憶媒体

Info

Publication number
JP2000358205A
JP2000358205A JP11171189A JP17118999A JP2000358205A JP 2000358205 A JP2000358205 A JP 2000358205A JP 11171189 A JP11171189 A JP 11171189A JP 17118999 A JP17118999 A JP 17118999A JP 2000358205 A JP2000358205 A JP 2000358205A
Authority
JP
Japan
Prior art keywords
data
image
voice
classification
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11171189A
Other languages
English (en)
Inventor
Toshiaki Fujimaki
敏明 藤巻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Holdings Corp
Original Assignee
Fuji Photo Film Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Photo Film Co Ltd filed Critical Fuji Photo Film Co Ltd
Priority to JP11171189A priority Critical patent/JP2000358205A/ja
Publication of JP2000358205A publication Critical patent/JP2000358205A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Studio Devices (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

(57)【要約】 【課題】撮影時に、撮影画像の分類に関するキーワード
を音声にて収録し、該音声データを音声認識して前記撮
影画像データを自動的に分類する画像分類装置を提供す
る。 【解決手段】画像分類装置20に、画像データに付随す
る音声データを音声認識する音声認識手段30と、前記
音声認識した音声データが示す内容に基づいて前記画像
データを分類するCPU28とを備えたので、画像分類
装置20に画像データと音声データとが記憶されている
記憶媒体18をセットするだけで自動的に撮影画像デー
タの分類が行えるとともに、分類した撮影画像のファイ
ルを文字や音声によって容易に検索することが可能とな
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声認識による画像
分類装置、方法及びその記憶媒体に係り、特に撮影と同
時に分類項目を音声で記録しておき、該記録された音声
の内容に応じて撮影画像を分類する音声認識による画像
分類装置、方法及びその記憶媒体に関する。
【0002】
【従来の技術】従来、デジタルカメラで撮影して記憶媒
体に格納されている画像の分類及び整理は、編集、分類
する人が記憶媒体に格納されている画像データを呼び出
して展開表示し、内容を確認した上で所定のファイルや
ディレクトリに分類・整理していた。
【0003】音声によるメッセージを記憶しておき、該
メッセージの音声認識を行う装置としては特開平8−8
2856号の公報に示されているように、音声によるメ
ッセージを記憶しておき、該記憶されたメッセージの音
声認識を行い、認識結果をプリンタに出力することが可
能な装置が知られている。
【0004】
【発明が解決しようとする課題】しかしながら、特開平
8−82856号の公報に示されている装置では、撮影
ごとに一時的に記憶されたメッセージは音声認識された
後にプリンタにて紙面上にプリントされるだけであるた
め、分類あるいは画像データの検索には役に立たず、整
理に手間がかかるとともに、分類を間違えるという不具
合が多発していた。
【0005】また、デジタルカメラで撮影して記憶媒体
に格納されている画像の分類及び整理では、文字による
画像の検索ができないという不具合に加えて、画像デー
タを呼び出して展開表示するのにたいへんな時間と手間
を必要とし、所定のファイルやディレクトリに分類・整
理する際においても撮影から時間が経過していると撮影
場所や条件等を間違えるという不具合が発生していた。
【0006】本発明はこのような事情に鑑みてなされた
もので、画像分類装置に画像データと音声データとが記
憶されている記憶媒体をセットするだけで自動的に撮影
画像の分類が行えるとともに、分類した撮影画像ファイ
ルを文字や音声によって容易に検索することが可能な画
像分類装置を提供することを目的とする。
【0007】
【課題を解決する為の手段】本発明は前記目的を達成す
るために、画像データに付随する音声データを音声認識
する音声認識手段と、前記音声認識した音声データが示
す内容に基づいて前記画像データを分類する分類手段と
を備えたことを特徴としている。
【0008】本発明によれば、画像データに付随する音
声データを音声認識する音声認識手段と、前記音声認識
した音声データが示す内容に基づいて前記画像データを
分類する分類手段とを備えたので、画像分類装置に画像
データと音声データとが記憶されている記憶媒体をセッ
トするだけで自動的に撮影画像の分類が行えるととも
に、分類した撮影画像ファイルを文字や音声によって容
易に検索することが可能となる。
【0009】
【発明の実施の形態】以下添付図面に従って本発明に係
る音声認識による画像分類装置、方法及びその記憶媒体
の好ましい実施の形態について詳説する。
【0010】図1は、撮影時における画像の分類項目の
音声入力方法と音声データ記憶部の構成とを示す図であ
る。
【0011】同図によれば、撮影者10がカメラ12を
用いて被写体14を撮影する際に、マイクロフォン15
が撮影者10の発した分類項目に関するキーワードを含
む音声を受信する。カメラ12は、受信した音声データ
をデジタル変換器16によってデジタル変換した後、記
憶媒体制御回路17にて記憶媒体18に伝送可能な形態
に変換して、記憶媒体18に記憶する。この際、撮影し
た画像に対して記憶した音声の相関を記憶しておく。記
憶媒体18は、カメラ12の内部に設けられていてもよ
いし、カメラ12に対して着脱可能な構造であってもよ
い。また、通信手段19を用いて取得した画像データと
音声データを他の機器に対して出力してもよい。
【0012】分類項目に関する音声データ(キーワー
ド)は、撮影場所や撮影条件、簡単な内容説明等、編集
に必要な情報にしておく。
【0013】図2に、撮影後に記憶媒体18に記憶され
ている撮影された画像データのファイルと音声データの
ファイルのファイルリストを示す。
【0014】同図に示すとおり、画像データのファイル
名は撮影順に付番される番号であるので、撮影画像の内
容と相関が無い。したがって、ファイル名を見ただけで
は、どのような画像が記憶されているのか皆目見当がつ
かない。
【0015】図3は、本発明に係る音声認識による画像
分類装置の実施の形態を示す外観図とブロック図であ
る。
【0016】同図によれば、画像分類装置20は、入力
手段22と表示手段24とを備え、内部にはハードディ
スク等の記憶手段26と情報処理手段であるCPU28
と、音声認識手段30と、記憶媒体18とデータの通信
を行う記憶媒体制御回路32と、カメラ等の外部機器と
データの受け渡しを行う通信手段34とを備えている。
カメラ12で撮影及び取得した撮影画像データと音声デ
ータは、挿抜可能な記憶媒体18又は通信ライン36、
光あるいは電波等の通信手段34を介してカメラ12か
ら画像分類装置20に伝達される。なお、音声認識手段
30を用いる代わりにCPU28が音声認識処理を行う
ことも可能である。
【0017】入力手段22から、画像データの分類開始
を指令すると、撮影画像データと音声データを画像分類
装置20内部の情報処理手段が読み取るとともに、CP
U28は図4に示すフローチャートに従って画像分類の
処理を開始する。なお、画像分類処理のプログラムは、
ハードディスクやROM等の記憶手段26に格納されて
いてもよいし記憶媒体18に代表される挿抜可能な記憶
手段に記憶されていてもよい。
【0018】ステップS100「分類スタート」(以下
S100と略す)にて画像分類処理が開始されると、次
のS102「画像ファイルを探す」に進み、入力手段2
2によって指定された記憶媒体18又は他の記憶媒体の
フォルダ内に記憶されているファイルを探す処理を行
う。
【0019】S104「画像ファイルあり」では、S1
02で画像ファイルを探した結果、分類未処理の画像フ
ァイルの有無を判断している。S104で分類未処理の
画像ファイルが無いと判断された場合にはS106「終
了」へ分岐して、分類の処理ルーチンを終了する。S1
04で分類未処理の画像ファイルが存在すると判断した
場合には、次のS108「対になった音声ファイルの検
索」に進み、画像データと相関のある音声データが記憶
されている音声データファイルを探す。
【0020】S110「音声ファイルあり」では、対に
なった音声ファイルが存在するか否かの判断を行う。も
し音声ファイルが存在しない場合には、音声による分類
を行うことは不可能であるので分類は行わず、S112
「他のフォルダに移動」に分岐して、他のフォルダまた
はディレクトリを設定した後に再びS102の処理に戻
る。S110で音声ファイルが存在すると判断した場合
には次のS114「音声データの読み込み」に進み、C
PU28は音声データを記憶媒体18又は記憶手段26
から読み込んで次のS116「音声認識」で音声データ
を音声認識手段30に伝送し、音声データを解析してキ
ーワードとして使用可能な文字データ又はコードに変換
する。変換した文字データ(キーワード)又はコードは
再びCPU28に伝送されて、CPU28(分類手段)
はS118「テキスト・ファイルの作成」にて撮影条件
等のデータとともにキーワードに従って分類し、図5に
示す表の形態のテキストデータに整列する。
【0021】次のS120「キーワードに従ったフォル
ダへの画像移動」では、図5に示す分類表の形態をもと
にCPU28(格納手段)が、画像ファイルを格納する
ディレクトリ又はフォルダを作成して所定のディレクト
リ又はフォルダに画像ファイルを移動して分類、整理す
る。分類・整理の処理が終了したら、S102に戻る。
【0022】たとえば、音声データから変換した文字デ
ータが「東京、東京タワー」である場合には、この画像
ファイルはルートディレクトリ〔A:¥〕の下の階層の
ディレクトリ〔東京〕の下の〔東京タワー〕の内部に格
納される。なお、同一ディレクトリ内部の画像データ
は、例えば日付順に一連の番号を取って新たなファイル
名としてもよい。また、画像ファイルに付随する音声デ
ータから変換した文字データが「東京、東京タワー、飛
行船」である場合には、〔東京タワー〕より更に下の階
層の〔飛行船〕のディレクトリを生成して、該ディレク
トリの内部に画像ファイルを格納する。
【0023】図6に、各ディレクトリに格納された各画
像ファイルのツリー構造を示す。
【0024】同図に示すように画像ファイルを分類して
記憶手段26に記憶、格納することにより、ファイルを
直接操作して表示、編集、複写、移動、削除する場合の
作業が容易となる。
【0025】同図の〔A:¥〕のルートディレクトリに
存在する〔テキストファイル〕は、図5に示す〔A:
¥〕のディレクトリにおける画像データの分類表の形態
が、テキスト形式のデータで記憶されている。画像デー
タ自体を直接検索することは難しいが、文字データやコ
ードであれば容易に検索することが可能である。従っ
て、この分類表をテキスト形式のデータとしておくこと
によって、一般のワードプロセッサーや表計算のソフト
ウエアで容易に読み込んで編集、加工、印刷を行うこと
ができるので、画像データの管理に好都合である。
【0026】なお、図5に示す表を表示手段24に表示
して、カーソル等で各画像データのファイルを選択可能
にしておき、画像データの表示や印刷、画像データファ
イルの削除や、他のディレクトリやフォルダに複写、移
動や、サムネイル画像の生成、表示等が可能なアイコン
やコマンドを設けておくと、撮影した画像の閲覧や編集
が更に容易になる。
【0027】なお、上述の説明では本発明に係る音声認
識による画像分類装置20を独立した装置として説明し
たが、本発明はこれに限定されるものではなく、カメラ
自体が画像分類装置の機能を備えていてもよいし、プリ
ンター等の画像出力手段が画像分類装置の機能を備えて
いても本発明の目的は達成される。
【0028】画像データの分類を行うために、撮影時に
音声によるキーワードを入力する他の実施の形態として
以下に示す手段を用いるとよい。
【0029】カメラ12にて「新規フォルダ作成」とい
うモードを選択可能にしておき、該モードを選択してマ
イクロフォン15に向かってフォルダ名称を伝えると、
入力した音声データと次回からの撮影番号に関するデー
タを記憶媒体18に記憶する。
【0030】入力されたフォルダ名称に関する音声デー
タは、本発明に係る音声認識による画像分類装置20で
処理されて、該フォルダ名称が新規の名称である場合に
は新しくフォルダ又はディレクトリを作成して、以降撮
影された画像データは新しく生成したフォルダ又はディ
レクトリの内部に複写又は移動して分類する。また前記
フォルダ名称が以前に登録されている名称である場合に
は、従来作成したフォルダ又はディレクトリに以降撮影
した画像データを移動又は複写して分類する。そして、
以後新たにフォルダを生成するか又は別のフォルダに移
る処理を指定しないかぎり外フォルダから移動しないよ
うにする。通常の撮影する場合には関連している被写体
を連続して撮影する場合が多いので、上記のようにフォ
ルダの管理を行うことによって撮影毎にフォルダ名を音
声入力しなくともよいので好都合である。
【0031】
【発明の効果】以上説明したように本発明に係る音声認
識による画像分類装置によれば、画像データに付随する
音声データを音声認識する音声認識手段と、前記音声認
識した音声データが示す内容に基づいて前記画像データ
を分類する分類手段とを備えたので、画像分類装置に画
像データと音声データとが記憶されている記憶媒体をセ
ットするだけで自動的に撮影画像の分類が行えるととも
に、分類した撮影画像のファイルを文字や音声によって
容易に検索することが可能となる。
【図面の簡単な説明】
【図1】撮影時における画像の分類項目の音声入力方法
と音声データ記憶部の構成とを示す図
【図2】記憶媒体18に記憶されている、撮影された画
像データのファイルと音声データのファイルのファイル
リストを示す図
【図3】本発明に係る画像分類装置の実施の形態を示す
外観図とブロック図
【図4】本発明に係る画像分類装置の処理方法を示すフ
ローチャート
【図5】本発明に係る画像分類装置を用いて画像データ
をキーワードに従って分類した表の形態を示す図
【図6】本発明に係る画像分類装置を用いて画像データ
を各ディレクトリに分類、格納したツリー構造を示す図
【符号の説明】
10…撮影者、12…カメラ、14…被写体、16…デ
ジタル変換器、17…記憶媒体制御回路、18…記憶媒
体、19…通信手段、20…画像分類装置、22…入力
手段、24…表示手段、26…記憶手段、28…CP
U、30…音声認識手段、34…通信手段
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 5/91 J

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 画像データに付随する音声データを音声
    認識する音声認識手段と、 前記音声認識した音声データが示す内容に基づいて前記
    画像データを分類する分類手段と、 を備えたことを特徴とする音声認識による画像分類装
    置。
  2. 【請求項2】 前記分類手段は、前記音声データを文字
    データ又はコードに変換することを特徴とする請求項1
    の音声認識による画像分類装置。
  3. 【請求項3】 前記分類手段は、前記文字データ又はコ
    ードに基づいて階層構造を作成することを特徴とする請
    求項2の音声認識による画像分類装置。
  4. 【請求項4】 前記分類手段は、音声データに対応する
    画像データを前記階層に複写又は移動して格納する格納
    手段を備えたことを特徴とする請求項3の音声認識によ
    る画像分類装置。
  5. 【請求項5】 前記変換した文字データ又はコードは、
    テキスト形式のデータであるとともに、対応する画像デ
    ータ情報を加味して記憶する記憶手段又は出力する通信
    手段を備えたことを特徴とする請求項2乃至4のいずれ
    かに記載の音声認識による画像分類装置。
  6. 【請求項6】 前記変換した文字データ又はコードと、
    対応する画像データ情報とを加味して表示する表示手段
    を備えたことを特徴とする請求項2乃至5のいずれかに
    記載の音声認識による画像分類装置。
  7. 【請求項7】 画像データに付随する音声データを音声
    認識し、 前記音声認識した音声データが示す内容に基づいて前記
    画像データを分類するようにしたことを特徴とする音声
    認識による画像分類方法。
  8. 【請求項8】 前記分類は、前記音声データを文字デー
    タ又はコードに変換することを特徴とする請求項7の音
    声認識による画像分類方法。
  9. 【請求項9】 前記分類は、前記文字データ又はコード
    に基づいて階層構造を作成することを特徴とする請求項
    8の音声認識による画像分類方法。
  10. 【請求項10】 前記分類は、音声データに対応する画
    像データを前記階層に複写又は移動して格納することを
    特徴とする請求項9の音声認識による画像分類方法。
  11. 【請求項11】 前記変換した文字データ又はコード
    は、テキスト形式のデータであるとともに、対応する画
    像データ情報を加味して記憶する記憶手段又は出力する
    通信手段を備えたことを特徴とする請求項8乃至10の
    いずれかに記載の音声認識による画像分類方法。
  12. 【請求項12】 前記変換した文字データ又はコード
    と、対応する画像データ情報とを加味して表示すること
    を特徴とする請求項8乃至11のいずれかに記載の音声
    認識による画像分類方法。
  13. 【請求項13】 音声認識が可能なコンピュータにプロ
    グラムを提供する記録媒体であって、 前記コンピュータに、画像データと該画像データに付随
    する音声データとが記憶された記憶手段から前記画像デ
    ータと音声データとを読み取らせ、 前記音声データを音声認識させ、 前記音声認識した音声データが示す内容に基づいて前記
    読み取った画像データを分類して格納させるプログラム
    が記録された記録媒体。
JP11171189A 1999-06-17 1999-06-17 音声認識による画像分類装置、方法及び記憶媒体 Pending JP2000358205A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11171189A JP2000358205A (ja) 1999-06-17 1999-06-17 音声認識による画像分類装置、方法及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11171189A JP2000358205A (ja) 1999-06-17 1999-06-17 音声認識による画像分類装置、方法及び記憶媒体

Publications (1)

Publication Number Publication Date
JP2000358205A true JP2000358205A (ja) 2000-12-26

Family

ID=15918667

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11171189A Pending JP2000358205A (ja) 1999-06-17 1999-06-17 音声認識による画像分類装置、方法及び記憶媒体

Country Status (1)

Country Link
JP (1) JP2000358205A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006229293A (ja) * 2005-02-15 2006-08-31 Konica Minolta Photo Imaging Inc 分類用データ生成プログラム及びデジタルカメラ並びに記録装置
JP2007094518A (ja) * 2005-09-27 2007-04-12 Nec Personal Products Co Ltd 携帯情報端末装置、情報処理装置、及び、画像整理方法
JP2011223240A (ja) * 2010-04-08 2011-11-04 Nec Corp 携帯情報端末、画像登録方法および画像分類整理方法
KR101227671B1 (ko) * 2006-01-19 2013-01-30 삼성전자주식회사 소리 정보를 이용한 이미지 관리 장치 및 방법
US8438034B2 (en) 2007-12-21 2013-05-07 Koninklijke Philips Electronics N.V. Method and apparatus for playing pictures
JP2013239988A (ja) * 2012-05-17 2013-11-28 Software Factory:Kk 携帯端末、記録装置及びこれらを備えたライフレコーダ

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006229293A (ja) * 2005-02-15 2006-08-31 Konica Minolta Photo Imaging Inc 分類用データ生成プログラム及びデジタルカメラ並びに記録装置
JP2007094518A (ja) * 2005-09-27 2007-04-12 Nec Personal Products Co Ltd 携帯情報端末装置、情報処理装置、及び、画像整理方法
KR101227671B1 (ko) * 2006-01-19 2013-01-30 삼성전자주식회사 소리 정보를 이용한 이미지 관리 장치 및 방법
US8438034B2 (en) 2007-12-21 2013-05-07 Koninklijke Philips Electronics N.V. Method and apparatus for playing pictures
JP2011223240A (ja) * 2010-04-08 2011-11-04 Nec Corp 携帯情報端末、画像登録方法および画像分類整理方法
JP2013239988A (ja) * 2012-05-17 2013-11-28 Software Factory:Kk 携帯端末、記録装置及びこれらを備えたライフレコーダ

Similar Documents

Publication Publication Date Title
US6335742B1 (en) Apparatus for file management and manipulation using graphical displays and textual descriptions
US6549913B1 (en) Method for compiling an image database, an image database system, and an image data storage medium
JP4791288B2 (ja) デジタル写真を電子ドキュメントにリンクするための方法およびシステム
US6903767B2 (en) Method and apparatus for initiating data capture in a digital camera by text recognition
JP2006120125A (ja) ドキュメント画像情報管理装置及びドキュメント画像情報管理プログラム
JP2003316524A (ja) 記録媒体及びプログラム
US7085767B2 (en) Data storage method and device and storage medium therefor
JP2004215231A (ja) ファイル管理プログラム
US7836024B2 (en) File generating method and file retrieving method
JPH1196194A (ja) 表示処理装置、表示方法、表示処理装置としてコンピュータを機能させるためのプログラムを記録した記録媒体、およびコンピュータ・プログラム・プロダクト
US20050110879A1 (en) Image taking apparatus, image processing apparatus, and image processing program
JP2002169809A (ja) 画像管理装置、画像管理方法及び記録媒体
JP2000358205A (ja) 音声認識による画像分類装置、方法及び記憶媒体
US10909169B2 (en) Information processing apparatus, information processing method, and program
US20050001851A1 (en) Apparatus and method for processing annotated images
JPH07306933A (ja) 通信機能を持つ画像データのファイリングシステム
JP2001357045A (ja) 画像管理装置,画像管理方法および画像管理プログラムの記録媒体
JP2003317447A (ja) 画像表示用プログラム及び該プログラムが記録された情報記録媒体
US20040130636A1 (en) Electronic image intent attribute
JP2006215811A (ja) ファイリング装置、検索管理方法、及びプログラム
JP2002116946A (ja) マルチメディアデータ蓄積方法及び装置及び記憶媒体
JP2005269219A (ja) フイルムデジタイズ装置及び画像管理プログラム
JP4220458B2 (ja) 画像表示装置
JP6701268B2 (ja) 情報処理装置、制御方法およびプログラム
JP2003196638A (ja) ファイリングデータのサムネイルキャプチャリングシステム及びプログラム