JP5209510B2

JP5209510B2 - 音声表示装置及びカメラ

Info

Publication number: JP5209510B2
Application number: JP2009001993A
Authority: JP
Inventors: 正浩荻本; 寿一林; 修野中
Original assignee: Olympus Imaging Corp
Current assignee: Olympus Imaging Corp
Priority date: 2009-01-07
Filing date: 2009-01-07
Publication date: 2013-06-12
Anticipated expiration: 2029-01-07
Also published as: JP2010161592A

Description

本発明は音声表示装置に関し、より詳細には、犬などのペットの写真を楽しむためのカメラの技術に関するものである。

カメラ技術のデジタル化が進展し、画像がデジタルデータとして取り扱いやすくなったことから、撮影した画像を、電子メールに添付したり、ブログやＳＮＳに貼付けたりして楽しむ用途が増えている。また、ペットなど、身近なものが撮影の対象になることが多いが、これは家族などには愛着があって、見るだけで楽しい写真になるが、家族以外には、それほど楽しさを感じるものではなかった。

特に、犬やネコの場合、人間とは異なり、毛皮で服装の変化があるわけでもなく、背景が自宅近辺に限られたりしていて、変化が乏しい写真になりがちであった。また、ペットの表情などは、かぶっている毛皮のせいで、画像からだけではわかりにくく、これも変化が少なく、そのときの感情を明確に可視化するような工夫が必要であった。

更に、例えば、下記特許文献１には、ペット側に、ペットの発する音声を音声データに変換し、前記音声データに基づいて前記ペットの感情を判別、翻訳し、翻訳データを電子メールデータとして作成する手段を設けた技術が開示されている。

特開２００５−３１号公報

しかしながら、上述した特許文献１には、飼い主との関係が不明瞭であり、飼い主がどのようにペットと接したかの記録にはならないものであった。

したがって、本発明は上記実情に鑑みてなされたものであり、その目的は、単調なペット写真に変化を持たせ、誰でも楽しめるペットの写真を簡単に撮影可能とした音声表示装置及びカメラを提供することである。

すなわち本発明は、操作者が対象物であるペットに対して発する第１の音声と、上記対象物である上記ペットが発する第２の音声とを取得する音声取得部と、上記音声取得部で得られた上記第１の音声を分析することで第１の音声に含まれるキーワードを取得し、上記キーワード及び上記音声取得部で得られた上記第２の音声に基づいて、上記操作者と上記対象物との関係を示す言語を表現する文字である表示内容を決定する表示決定部と、上記表示決定部で決定された上記表示内容を表示する表示部と、を具備することを特徴とする。

また本発明は、対象物を撮影して取得した画像を表示部に表示するカメラに於いて、操作者が上記対象物であるペットに対して発する第１の音声と、上記対象物である上記ペットが発する第２の音声とを取得する音声取得部と、上記音声取得部で得られた上記第１の音声を分析することで第１の音声に含まれるキーワードを取得し、上記キーワード及び上記音声取得部で得られた上記第２の音声に基づいて、上記操作者と上記対象物との関係を示す言語を表現する文字である表示内容を決定する表示決定部と、を具備し、上記表示部は、上記表示決定部で決定された上記表示内容を表示することを特徴とする。

本発明によれば、単調なペット写真に変化を持たせ、誰でも楽しめるペットの写真を簡単に撮影可能とした音声表示装置及びカメラを提供することができる。

また、カメラや携帯電話の内蔵カメラで撮影したペットの画像に、ペットの鳴き声などを反映させて変化を持たせ、家族以外にも、ペットと撮影者（操作者）の関係を分かりやすく示し、ペットと飼い主の愛情を画像化するカメラを提供することができる。

本発明の音声表示装置の一実施形態に係るカメラの概略構成を示したブロック図である。図１のように構成されたカメラ１０の使用例とその効果によるイメージを示したものである。本発明の一実施形態に於けるカメラ１０の制御動作を説明するためのフローチャートである。図３のフローチャートのステップＳ１０に於けるサブルーチン「音声によってテキスト切換え」の詳細な動作を説明するためのフローチャートである。図３のフローチャートのステップＳ１１に於けるサブルーチン「キーワード・テキスト化」の詳細な動作を説明するためのフローチャートである。図３のフローチャートのステップＳ１３に於けるサブルーチン「音声によって表現切換え」の詳細な動作を説明するためのフローチャートである。最終的なテキストを決定するための変換表である。

以下、図面を参照して、本発明の実施形態について説明する。

図１は本発明の音声表示装置の一実施形態に係るカメラの概略構成を示したブロック図である。

図１に於いて、本発明の一実施形態に係るカメラ１０は、信号処理及び制御部１１と、撮像部１２と、大きさ判定部１３と、距離判定部１４と、前方音声収録部１５と、後方音声収録部１６と、音声処理部１８と、記録部２０と、操作判定部２２と、表示部２３と、時計部２４と、通信部２５と、を有して構成される。

上記信号処理及び制御部１１は、上記撮像部１２から出力される撮影画像を画像処理すると共に、このカメラ１０全体のシーケンスを制御する。更に、信号処理及び制御部１１は、後述するテキスト化機能部１８ｂより構成されたテキストを撮影画像に合成して表示するためのテキスト合成部１１ａを有している。

上記撮像部１２は、図示されない撮影用のレンズや撮像素子、並びにその駆動、読み出し回路等から構成されるもので、図示されない対象物である被写体を撮影して撮影画像を得るための撮影手段である。大きさ判定部１３は、カメラの画面内に於ける被写体の割合、距離や撮影時の画角等から、被写体の大きさを判定する。距離判定部１４は、対象物までの距離を、図示されないピント合わせ部の情報から取得する。

すなわち、信号処理及び制御部１１では、撮像部１２からの撮影画像のみならず、距離判定部１４による対象物までの距離情報や、大きさ判定部１３によって上記画面内に被写体が占める割合を検出することができるようになっている。

前方音声収録部１５は、上記撮像部１２で得られた画像に対応する方向である前方からの音声を収音するもので、マイク等により構成される。また、後方音声収録部１６は、撮影者の声を収音するもので、マイク等により構成される。上記前方音声収録部１５及び後方音声収録部１６は、同一のマイクで構成し、声によって声の主を判別するようにしてもよい。

音声処理部１８は、これらのマイクから得られた音声を処理してテキスト化し、撮影画像と一緒に表示できるようにするためのものである。そのため、音声処理部１８は、後述する記録部２０内に記録された音声パターンと比較する機能を有した比較部１８ａと、後述する辞書記録部２０ｂのデータやフォント情報を基にテキスト化を行うテキスト化機能部１８ｂと、音の大きさや高低、その変化等を判定するための音量・音程判定部１８ｃを有して構成される。

記録部２０は、撮影画像等を記録するための記録手段である。この記録部２０は、撮影画像を記録する機能の他、音声パターンの情報を記録する音声パターン記録部２０ａと、音声からキーワードを判定するための辞書記録部２０ｂと、辞書で得られたテキストを表示する際のフォント情報を記録するフォント記録部２０ｃと、撮影画像を記録するための画像記録部２０ｄ等を有している。

操作判定部２２は、ユーザが撮影操作を行う際に操作するレリーズスイッチ等の操作の有無を判定するためのものである。この操作判定部２２でカメラ１０の操作が検出されると、信号処理及び制御部１１によってこれらが制御されて、これらのブロックから取得された画像やテキスト等が、記録部２０内に記録される。

表示部２３は、液晶等から構成される表示パネルを有するもので、上述した撮影画像を表示したり、撮影した結果が見られるようにしている。尚、この表示部２３には、撮影前にも、撮像部１２で得られた画像が表示されて、構図や撮影タイミングの確認等ができるようになっている。

更に、時計部２４は、撮影画像に撮影時刻が関連付けられるようにするためのものである。通信部２５は、撮影画像に撮影位置が関連付けられて記憶されるようにするために設けられている。こうした画像並びに付随した情報は、通信部２５によって外部に出力することができる。これは、無線では赤外通信や無線ＬＡＮ等、有線でもＵＳＢ等を想定している。

このような構成のカメラ１０を使用することにより、従来のように代わり映えしないペットの写真に、テキストを入れて変化をつけて楽しむことができる。しかも、撮影時に於ける撮影者とペットの交流が文字として記録される。

図２は、このようなカメラ１０の使用例とその効果によるイメージを示したものである。

図２に示されるように、操作者であるユーザ３０が、対象物であるペット３１の写真を撮る場合、当該ペット３１に声をかけながら撮影することが多い。しかしながら、それほど多くの語彙の言葉が費やされるわけではなく、通常、「こっちを見て」とか、名前を呼ぶだけである。したがって、カメラ１０は、そうした言葉に含まれるキーワードだけを検出することができればよい。

この時、ペットは多くの場合黙っているが、そのときの感情に応じて、反応して声を出すこともある。この反応による声を利用して、テキストを画像に合成して表示、記録すれば、そのときのペットとの交流を画像に写し込むことができる。尚、この時のテキストは、単にペットの声のみならず、飼い主の声に応じて最適化するようにする。これによって、言葉を話さないペットの言葉を、人間の言葉に訳して（推測して）表示することが可能となる。

次に、図３乃至図６のフローチャートを参照して、このようなペットと飼い主のコミュニケーションを写し込むことが可能なカメラ１０の動作について説明する。

尚、以下に説明するカメラ１０の動作は、主に信号処理及び制御部１１によって行われる。

図３は、本発明の一実施形態に於けるカメラ１０の制御動作を説明するためのフローチャートである。

本シーケンスが開始されると、先ず、ステップＳ１に於いて、撮影モードか否かが判定される。ここで、撮影モードである場合はステップＳ２へ移行し、再生モードである場合は後述するステップＳ１８へ移行する。

ステップＳ２では、撮像部１２からの画像の取込みが行われる。ここで得られた画像が、続くステップＳ３にて、適正なコントラスト、露出になるように画像処理等が行われる。ここでは、取り込み画像内の動きのある部分や同じ色の部分などをペット部分として判定するような処理も行われる。

更に、ステップＳ４にて、表示に適切な処理が表示部２３に表示される。そして、ステップＳ５にて、カメラ１０の前方、後方の音声（ペット３１、ユーザ３０の音声）が取り込まれることによって、テキスト化される音声の判定が開始される。ステップＳ６では、上記ステップＳ５で取り込まれるべく前方、後方の音声が、所定時間無いか否かが判定される。その結果、所定時間音声が無い場合は、ステップＳ７に移行し、表示テキストがある場合はこれが消去される。一方、上記ステップＳ６にて音声があった場合は、ステップＳ７がスキップされる。

そして、ステップＳ８に於いて、上記ステップＳ５で取り込まれた後方音声に、辞書記録部２０ｂに記録されているのと同様のキーワードが入っているか否かが判定される。また、「○○ちゃん、○○ちゃん」のような繰り返しパターンかどうかなども判定される。このような判定がなされた場合はステップＳ１１に移行し、そうでない場合はステップＳ９に移行する。

上記ステップＳ８に於いて、撮影者が無言の場合もあり、キーワードにない言葉を発する場合もある。こうした場合にステップＳ９に移行して、前方音声の取り込み、すなわちペット３１の音声の取り込みが行われる。尚、このサブルーチン「音声によってテキスト切換え」の詳細な動作については後述する。

そして、続くステップＳ１０にて、サブルーチン「音声によってテキスト切換え」が実行される。こうしたテキストが画面上に表示されることにより、画面に変化がつけられる。

一方、上記ステップＳ８に於いて、後方音声にキーワードがあった場合は、ステップＳ１１に移行して、サブルーチン「キーワード・テキスト化」が実行される。このサブルーチン「キーワード・テキスト化」の詳細な動作については後述する。

そして、ステップＳ１２では、前方からの音声（ペットの声）が取り込まれる。すると、続くステップＳ１３に於いて、サブルーチン「音声によって表現切換え」が実行される。すなわち、上記ステップＳ５の音声で取り込まれたキーワードが利用されたテキストに対し、表現が切換えられたものが作成される。こうして作成されたテキストが画面上に表示されて、画面に変化がつけられる。尚、このサブルーチン「音声によって表現切換え」の詳細な動作については後述する。

次に、ステップＳ１４にて、上記ステップＳ１０またはステップＳ１３にて切換えられたテキストが表示される。そして、ステップＳ１５に於いて、撮影操作が行われるか否かが操作判定部２２によって判定される。その結果、撮影する場合はステップＳ１６に移行して撮影処理が行われる。更に、ステップＳ１７にて、先に得られたテキストと共に画像記録部２０ｄへの記録が行われる。こうして、本シーケンスが終了する。

尚、ステップＳ１７にて記録する前に、確認用表示のステップを入れてもよい。

また、ステップＳ１４では、撮影しなくてもテキストを表示するようにしてもよい。

一方、上記ステップＳ１５に於いて、撮影が行われない場合は、上記ステップＳ１に移行する。

上記ステップＳ１に於いて撮影モードでない場合は、ステップＳ１８に移行して再生モードであるか否かが判定される。ここで、カメラ操作で再生モードが設定されると、ステップＳ１９に移行して画像の再生が行われる。ここでは、画像をサムネイル表示したり、スライドショー切換えしたり、日付情報や、本発明の特徴たるテキスト情報によって、検索して見たい画像を鑑賞したりすることもできる。表示部２３に表示される画像とテキストは、テキスト合成部１１ａにて合成される。

外部機器にこの再生の結果を送信したい場合は、ステップＳ２０にてその旨が判定される。ここで、送信する場合はステップＳ２１に移行してその操作が行われ、表示画像の送信がなされる。こうして、本シーケンスが終了する。

上記ステップＳ２０にて送信されない場合は、上記ステップＳ１８に移行する。

また、上記ステップＳ１８にて、再生モードでない場合は、上記ステップＳ１に移行する。

図４は、図３のフローチャートのステップＳ１０に於けるサブルーチン「音声によってテキスト切換え」の詳細な動作を説明するためのフローチャートである。このフローチャートは、ユーザの音声が無く、ペットの声のみでテキストを決定するためのものである。

本サブルーチンに入ると、先ず、ステップＳ３１にて音量・音程判定部１８ｃで音量が判定され、次いでステップＳ３２にて距離判定部１４によって被写体の距離が判定される。これらによって、距離による音の減衰にかかわらず、ペット３１が出した音声の大きさを判定することができる。

ここで、声の大きさや周波数から動物の種類を、音声パターン記録部２０ａに記録された音声パターンと比較することによって判定してもよい。ペットは、多くの場合、犬か猫であるので、ここでは犬の場合を想定して説明する。

ペットが出した声の大きさによって、ペットの興奮具合が分かり、ステップＳ３３の音域判定によって、感情などが分かる。また、大きな犬では高い声で甘えても、小さな犬の低い声と同等の音の高さになる可能性がある。そのため、ステップＳ３４では、画角や距離、画面内にペットが占める割合などから、対象となるペットが大型犬であるか小型犬であるかが判定される。尚、この結果で発音量を補正してもよい。

つまり、大型犬は小さい声でも、小型犬の大きな声に相当する音量である場合がある。したがって、ステップＳ３５に於いて、発音量が大きい場合はステップＳ３６に移行して、音の高低が調べられる。すなわち、ステップＳ３６にて低音であると判定された場合は、ステップＳ３７に移行して、大型犬が「ワンワン」吠えていると判定される。

また、低音でない場合はステップＳ４３に移行し、小型犬であるか否かが判定される。その結果、小型犬であれば続くステップＳ４４にて高音であるか否かが判定される。小型犬で更に高音で鳴く場合は、ステップＳ４５に移行して、「キャンキャン」鳴いているとして、テキスト化機能部１８ｂにてテキストが決定される。一方、小型犬でも低音でない場合は、ステップＳ４３からステップＳ４５へ移行して「キャンキャン」鳴いていると判定される。更に、低音でなくとも小型犬であれば、ステップＳ３７で同様のテキストが対応される。

また、ステップＳ３５にて発音量が大きくないと判定された場合は、ステップＳ３８に移行する。そして、このステップＳ３８にて低音であるか否かが判定され、低音であればステップＳ４０へ移行し、そうでない場合はステップＳ３９にて小型犬であるか否かが判定される。

ステップＳ４０では、ペットが鳴いている音声がだんだん大きくなっているか否かが判定される。低音がだんだん大きくなる場合は威嚇していると考えられるので、ステップＳ４１に移行して、「ウー」というテキストが対応されて決定される。一方、ステップＳ３９からステップＳ４０に移行して、小型犬で低音でなくてもだんだん大きくなる場合は、ステップＳ４１に移行して、同様に「ウー」というテキストが対応される。

また、低音でも小型犬でもない場合は、ステップＳ４２に移行して、甘えた「きゅーん」というテキストが対応されて決定される。尚、小型犬でも、だんだん大きくならない声ならば、同様に甘えているものと判定される。

このような声の種類で、犬の写真と一緒に表示するテキストを切換えるので、単に撮影した結果を楽しむのみならず、そのときの犬の声を反映させた楽しみ方ができる画像が得られる。

このようにして、対応するテキストが選択されたならば、本サブルーチンを抜けて、図３のフローチャートのステップＳ１４に移行する。

図５は、図３のフローチャートのステップＳ１１に於けるサブルーチン「キーワード・テキスト化」の詳細な動作を説明するためのフローチャートである。

上述したように、ペットの写真を撮影するとき、且つ、ペットが写真に収まるような距離など、状況下では、ユーザはペットに声をかけながら撮影を行うことが多い。そのような状況下に於ける、ユーザとペットの交流を記録に残そうというのが、本発明の目的である。こうした状況下に於けるペットへの呼びかけの言葉というのは、限られたものであり、通常の辞書のような大がかりなデータベースを有したり、詳細な音声認識の機能を有したりする必要はない。

したがって、ここでは、ユーザがペットに呼びかける代表的な言葉として、「こっち」、「おいで」の呼びかけや、「かわいいね」、「お利口ね」のような形容詞や、名詞に「ね」が付いたほめ言葉、更には「どうしたの」、といった疑問の言葉などで、かなりの範囲をカバーすることができる。

図５のサブルーチンに入ると、先ず、ステップＳ５１に於いて、キーワードが「こっち」、「おいで」等の単語の繰り返しであるか否かが判定される。ここで、キーワードがこれらの単語の繰り返しである場合はステップＳ５４へ移行し、そうでない場合はステップＳ５２に移行する。

そして、ステップＳ５２に於いては、キーワードが、上述した形容詞、名詞に「ね」、「よ」が付いた言葉であるか否かが判定される。ここで、該当する言葉であった場合はステップＳ５５へ移行し、そうでない場合はステップＳ５３へ移行する。更に、ステップＳ５３では、キーワードが疑問である「どうした」という言葉であるか否かが判定される。その結果、キーワードが該当する言葉の場合はステップＳ５６に移行し、そうでない場合は本サブルーチンを抜けて図３のフローチャートのステップＳ１２へ移行する。

キーワードが、上述したような呼びかけの言葉であった場合は、ステップＳ５４、Ｓ５５、Ｓ５６に於いて、それぞれの言葉が選択されてテキスト化される。つまり、これらの場合、ユーザは、それぞれ「はい」、形容詞＋「よ」、「えーと」というような返事を期待していると考えられるので、こうした言葉がテキスト化されるようになっている。

このテキスト化された言葉は、例えば、図７の変換表に示されるように、カテゴリＡとして「はい」、カテゴリＢとして「形容詞、名詞＋「よ」、そしてカテゴリＣとして「えーと」が該当する。これらの言葉に対して、図６で決定されるペット側のアクションが加味されて、最終的なテキストとして決定される。

図６は、図３のフローチャートのステップＳ１３に於けるサブルーチン「音声によって表現切換え」の詳細な動作を説明するためのフローチャートである。

ここでは、基本的に図４のフローチャートに於ける、「ワンワン」を不快表現とし、「キャンキャン」を興奮表現とし、「ウー」を怒り表現とし、「きゅーん」を満足表現に置き換えている。更に、無言の場合（犬は尻尾を振るだけ、猫はすり寄って来るだけという感情表現が多い）は、通常表現としている。

また、本実施形態では、基本的に飼い主とペットが遊んでいる状態の関係を画像化（テキスト化）するものであるから、ここでは、寂しいという感情は排除して単純化している。

尚、図６のフローチャートに於けるステップＳ６１〜Ｓ６６の処理動作は、上述した図４のフローチャートのステップＳ３１〜Ｓ３６の処理動作と同様であるので、対応するステップ番号を参照するものとしてここでの説明は省略する。

ステップＳ６６にて低音であると判定された場合は、ステップＳ６７に移行して、不快表現であるとされる。大型犬が「ワンワン」吠えていると判定される。

また、ステップＳ６６にて低音でないとされた場合は、ステップＳ７５に移行して小型犬であるか否かが判定される。その結果、小型犬であれば続くステップＳ７６にて高音であるか否かが判定される。小型犬で更に高音で鳴く場合は、ステップＳ７７に移行して、興奮状態である旨のテキストが決定される。一方、小型犬でも低音でない場合は、ステップＳ７３からステップＳ７７へ移行して興奮状態であるとされる。更に、低音でなくとも小型犬であれば、ステップＳ６７で同様のテキストが対応される。

また、ステップＳ６５にて発音量が大きくないと判定された場合は、ステップＳ３８に移行して、無言であるか否かが判定される。ここで、無言である場合は、ステップＳ６９に移行して、上述したように、通常表現であるとされる。一方、無言ではないと判定された場合は、ステップＳ７０に移行する。

ステップＳ７０では、音声が低音であるか否かが判定される。ここで、低音であればステップＳ７２へ移行し、そうでない場合はステップＳ７１に移行して小型犬であるか否かが判定される。

ステップＳ７２では、ペットが鳴いている音声がだんだん大きくなっているか否かが判定される。低音がだんだん大きくなる場合は威嚇していると考えられるので、ステップＳ７３に移行して、怒り表現である旨のテキストが対応される。一方、ステップＳ７１からステップＳ７２に移行して、小型犬で低音でなくてもだんだん大きくなる場合は、ステップＳ７３に移行して、同様に、怒り表現のテキストが対応される。

また、低音でも小型犬でもない場合は、ステップＳ７４に移行して、満足表現である旨のテキストが対応される。尚、小型犬でも、だんだん大きくならない声ならば、同様に満足表現であると判定される。

このように、ステップＳ６７、Ｓ６８、Ｓ６９、Ｓ７３、Ｓ７４でそれぞれの表現が決定されると、本サブルーチンを抜けて、図３のフローチャートのステップＳ１４に移行する。

そして、上述した図５のフローチャートのステップＳ５４、Ｓ５５、Ｓ５６の言葉と、図６のフローチャートのステップＳ６７、Ｓ６８、Ｓ６９、Ｓ７３、Ｓ７４の表現とを組み合わせて、図７の変換表に表示されるような最終的なテキストが決定される。

例えば、キーワードの言葉が「はい」で、満足表現である場合は、「はーい」がテキスト化される。キーワードの言葉が、形容詞・名詞＋「よ」で、怒り表現である場合は、「何？」がテキスト化される。また、キーワードの言葉が「えーと」で、通常表現である場合は、「えーと」がテキスト化される。

このような変換表は、上述したステップで声によって決定されたペットの感情状態に基づいて加工される。

例えば、図２に示されるように、ユーザ３０がペット３１に対して、形容詞、名詞＋「ね」、「よ」の例にあるような言葉として、「お利口ね」と呼びかけたとする。この場合、ペット３１が発音した「わんわん」は、大型犬、小型犬の何れであっても、発音量が大きくなく、しかもだんだん大きくはならないので、満足表現であるということになる。したがって、ペットの満足表現である、形容詞、名詞＋「でしょ」が適用された「お利口でしょ」がテキスト化される。このテキスト化された文字が、画像と共にカメラ１０の表示部２３に表示されるようになっている。

尚、このように、テキストを変更すると共に、テキストのフォントや色、大きさなどを決定してもよく、絵文字などを追加できるようにしてもよい。

更に、本実施形態では、犬がペットの例として説明したが、その他の生物等に於いても、同様にしてテキスト化して表示するようにすればよい。

以上説明したように、本実施形態によれば、飼い主とペットの交流がテキスト表示される写真撮影が楽しめるカメラを提供することが可能となる。

また、上述した実施形態では、音声表示装置をカメラに適用した例について説明したが、これに限られるものではない。例えば、携帯電話機等、カメラ以外に適用してもよく、或いは、撮影部を持たない機器に利用して、単なる翻訳機器やコミュニケーションツールのように利用してもよい。

更に、本発明は静止画だけに限られず動画に於いても適用可能である。

以上、本発明の実施形態について説明したが、本発明は上述した実施形態以外にも、本発明の要旨を逸脱しない範囲で種々の変形実施が可能である。

更に、上述した実施形態には種々の段階の発明が含まれており、開示される複数の構成要件の適当な組合せにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件から幾つかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除された構成も発明として抽出され得る。

本発明によれば、単調なペット写真に変化を持たせ、誰でも楽しめるペットの写真を簡単に撮影可能とすることができる。

１０…カメラ、１１…信号処理及び制御部、１１ａ…テキスト合成部、１２…撮像部、１３…大きさ判定部、１４…距離判定部、１５…前方音声収録部、１６…後方音声収録部、１８…音声処理部、１８ａ…被殻部、１８ｂ…テキスト化機能部、１８ｃ…音量・音程判定部、２０…記録部、２０ａ…音声パターン記録部、２０ｂ…辞書記録部、２０ｃ…フォント部、２０ｄ…画像記録部、２２…操作判定部、２３…表示部、２４…時計部、２５…通信部、３０…ユーザ、３１…ペット。

Claims

操作者が対象物であるペットに対して発する第１の音声と、上記対象物である上記ペットが発する第２の音声とを取得する音声取得部と、
上記音声取得部で得られた上記第１の音声を分析することで第１の音声に含まれるキーワードを取得し、上記キーワード及び上記音声取得部で得られた上記第２の音声に基づいて、上記操作者と上記対象物との関係を示す言語を表現する文字である表示内容を決定する表示決定部と、
上記表示決定部で決定された上記表示内容を表示する表示部と、
を具備することを特徴とする音声表示装置。
上記対象物までの距離を判定する距離判定部と、
上記距離に従って上記対象物の声の大きさを判定する音量判定部と、
を更に具備し、
上記表示決定部は、上記音量判定部の判定結果に従って表示内容を決定することを特徴とする請求項１に記載の音声表示装置。
上記対象物の大きさを判定する大きさ判定部を更に具備し、
上記表示決定部は、上記大きさ判定部で判定された大きさに従って表示内容を決定することを特徴とする請求項１に記載の音声表示装置。
上記第２の音声より上記対象物の興奮状態を判定する状態判定部を更に具備し、
上記表示決定部は、上記興奮状態と上記キーワードに基づいて上記表示内容を決定することを特徴とする請求項１に記載の音声表示装置。
上記音量判定部は、上記第２の音声の高低、大きさに基づいて上記興奮状態を判定することを特徴とする請求項４に記載の音声表示装置。
上記表示決定部は、上記対象物の画像と共に該対象物の状態に応じた文字を表示させることを特徴とする請求項１乃至５の何れか１項に記載の音声表示装置。
上記音声取得部は、上記操作者の発する上記第１の音声を取得する後方音声取得部と、上記対象物の発する上記第２の音声を取得する前方音声取得部と、を有することを特徴とする請求項６に記載の音声表示装置。
対象物を撮影して取得した画像を表示部に表示するカメラに於いて、
操作者が上記対象物であるペットに対して発する第１の音声と、上記対象物である上記ペットが発する第２の音声とを取得する音声取得部と、
上記音声取得部で得られた上記第１の音声を分析することで第１の音声に含まれるキーワードを取得し、上記キーワード及び上記音声取得部で得られた上記第２の音声に基づいて、上記操作者と上記対象物との関係を示す言語を表現する文字である表示内容を決定する表示決定部と、
を具備し、
上記表示部は、上記表示決定部で決定された上記表示内容を表示することを特徴とするカメラ。
上記対象物までの距離を判定する距離判定部と、
上記距離に従って上記対象物の声の大きさを判定する音量判定部と、
を更に具備し、
上記表示決定部は、上記音量判定部の判定結果に従って表示内容を決定することを特徴とする請求項８に記載のカメラ。
上記対象物の大きさを判定する大きさ判定部を更に具備し、
上記表示決定部は、上記大きさ判定部で判定された大きさに従って表示内容を決定することを特徴とする請求項８に記載のカメラ。
上記第２の音声より上記対象物の興奮状態を判定する状態判定部を更に具備し、
上記表示決定部は、上記興奮状態と上記キーワードに基づいて上記表示内容を決定することを特徴とする請求項８に記載のカメラ。
上記音量判定部は、上記第２の音声の高低、大きさに基づいて上記興奮状態を判定することを特徴とする請求項１１に記載のカメラ。
上記表示決定部は、上記対象物の画像と共に該対象物の状態に応じた文字を表示させることを特徴とする請求項８乃至１２何れか１項に記載のカメラ。
上記音声取得部は、上記操作者の発する上記第１の音声を取得する後方音声取得部と、上記対象物の発する上記第２の音声を取得する前方音声取得部と、を有することを特徴とする請求項１３に記載のカメラ。