JP5209510B2 - 音声表示装置及びカメラ - Google Patents

音声表示装置及びカメラ Download PDF

Info

Publication number
JP5209510B2
JP5209510B2 JP2009001993A JP2009001993A JP5209510B2 JP 5209510 B2 JP5209510 B2 JP 5209510B2 JP 2009001993 A JP2009001993 A JP 2009001993A JP 2009001993 A JP2009001993 A JP 2009001993A JP 5209510 B2 JP5209510 B2 JP 5209510B2
Authority
JP
Japan
Prior art keywords
voice
display
determination unit
unit
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009001993A
Other languages
English (en)
Other versions
JP2010161592A (ja
Inventor
正浩 荻本
寿一 林
修 野中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Imaging Corp
Original Assignee
Olympus Imaging Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Imaging Corp filed Critical Olympus Imaging Corp
Priority to JP2009001993A priority Critical patent/JP5209510B2/ja
Publication of JP2010161592A publication Critical patent/JP2010161592A/ja
Application granted granted Critical
Publication of JP5209510B2 publication Critical patent/JP5209510B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)

Description

本発明は音声表示装置に関し、より詳細には、犬などのペットの写真を楽しむためのカメラの技術に関するものである。
カメラ技術のデジタル化が進展し、画像がデジタルデータとして取り扱いやすくなったことから、撮影した画像を、電子メールに添付したり、ブログやSNSに貼付けたりして楽しむ用途が増えている。また、ペットなど、身近なものが撮影の対象になることが多いが、これは家族などには愛着があって、見るだけで楽しい写真になるが、家族以外には、それほど楽しさを感じるものではなかった。
特に、犬やネコの場合、人間とは異なり、毛皮で服装の変化があるわけでもなく、背景が自宅近辺に限られたりしていて、変化が乏しい写真になりがちであった。また、ペットの表情などは、かぶっている毛皮のせいで、画像からだけではわかりにくく、これも変化が少なく、そのときの感情を明確に可視化するような工夫が必要であった。
更に、例えば、下記特許文献1には、ペット側に、ペットの発する音声を音声データに変換し、前記音声データに基づいて前記ペットの感情を判別、翻訳し、翻訳データを電子メールデータとして作成する手段を設けた技術が開示されている。
特開2005−31号公報
しかしながら、上述した特許文献1には、飼い主との関係が不明瞭であり、飼い主がどのようにペットと接したかの記録にはならないものであった。
したがって、本発明は上記実情に鑑みてなされたものであり、その目的は、単調なペット写真に変化を持たせ、誰でも楽しめるペットの写真を簡単に撮影可能とした音声表示装置及びカメラを提供することである。
すなわち本発明は、操作者が対象物であるペットに対して発する第1の音声と、上記対象物である上記ペットが発する第2の音声とを取得する音声取得部と、上記音声取得部で得られた上記第1の音声を分析することで第1の音声に含まれるキーワードを取得し、上記キーワード及び上記音声取得部で得られた上記第2の音声に基づいて、上記操作者と上記対象物との関係を示す言語を表現する文字である表示内容を決定する表示決定部と、上記表示決定部で決定された上記表示内容を表示する表示部と、を具備することを特徴とする。
また本発明は、対象物を撮影して取得した画像を表示部に表示するカメラに於いて、操作者が上記対象物であるペットに対して発する第1の音声と、上記対象物である上記ペットが発する第2の音声とを取得する音声取得部と、上記音声取得部で得られた上記第1の音声を分析することで第1の音声に含まれるキーワードを取得し、上記キーワード及び上記音声取得部で得られた上記第2の音声に基づいて、上記操作者と上記対象物との関係を示す言語を表現する文字である表示内容を決定する表示決定部と、を具備し、上記表示部は、上記表示決定部で決定された上記表示内容を表示することを特徴とする。
本発明によれば、単調なペット写真に変化を持たせ、誰でも楽しめるペットの写真を簡単に撮影可能とした音声表示装置及びカメラを提供することができる。
また、カメラや携帯電話の内蔵カメラで撮影したペットの画像に、ペットの鳴き声などを反映させて変化を持たせ、家族以外にも、ペットと撮影者(操作者)の関係を分かりやすく示し、ペットと飼い主の愛情を画像化するカメラを提供することができる。
本発明の音声表示装置の一実施形態に係るカメラの概略構成を示したブロック図である。 図1のように構成されたカメラ10の使用例とその効果によるイメージを示したものである。 本発明の一実施形態に於けるカメラ10の制御動作を説明するためのフローチャートである。 図3のフローチャートのステップS10に於けるサブルーチン「音声によってテキスト切換え」の詳細な動作を説明するためのフローチャートである。 図3のフローチャートのステップS11に於けるサブルーチン「キーワード・テキスト化」の詳細な動作を説明するためのフローチャートである。 図3のフローチャートのステップS13に於けるサブルーチン「音声によって表現切換え」の詳細な動作を説明するためのフローチャートである。 最終的なテキストを決定するための変換表である。
以下、図面を参照して、本発明の実施形態について説明する。
図1は本発明の音声表示装置の一実施形態に係るカメラの概略構成を示したブロック図である。
図1に於いて、本発明の一実施形態に係るカメラ10は、信号処理及び制御部11と、撮像部12と、大きさ判定部13と、距離判定部14と、前方音声収録部15と、後方音声収録部16と、音声処理部18と、記録部20と、操作判定部22と、表示部23と、時計部24と、通信部25と、を有して構成される。
上記信号処理及び制御部11は、上記撮像部12から出力される撮影画像を画像処理すると共に、このカメラ10全体のシーケンスを制御する。更に、信号処理及び制御部11は、後述するテキスト化機能部18bより構成されたテキストを撮影画像に合成して表示するためのテキスト合成部11aを有している。
上記撮像部12は、図示されない撮影用のレンズや撮像素子、並びにその駆動、読み出し回路等から構成されるもので、図示されない対象物である被写体を撮影して撮影画像を得るための撮影手段である。大きさ判定部13は、カメラの画面内に於ける被写体の割合、距離や撮影時の画角等から、被写体の大きさを判定する。距離判定部14は、対象物までの距離を、図示されないピント合わせ部の情報から取得する。
すなわち、信号処理及び制御部11では、撮像部12からの撮影画像のみならず、距離判定部14による対象物までの距離情報や、大きさ判定部13によって上記画面内に被写体が占める割合を検出することができるようになっている。
前方音声収録部15は、上記撮像部12で得られた画像に対応する方向である前方からの音声を収音するもので、マイク等により構成される。また、後方音声収録部16は、撮影者の声を収音するもので、マイク等により構成される。上記前方音声収録部15及び後方音声収録部16は、同一のマイクで構成し、声によって声の主を判別するようにしてもよい。
音声処理部18は、これらのマイクから得られた音声を処理してテキスト化し、撮影画像と一緒に表示できるようにするためのものである。そのため、音声処理部18は、後述する記録部20内に記録された音声パターンと比較する機能を有した比較部18aと、後述する辞書記録部20bのデータやフォント情報を基にテキスト化を行うテキスト化機能部18bと、音の大きさや高低、その変化等を判定するための音量・音程判定部18cを有して構成される。
記録部20は、撮影画像等を記録するための記録手段である。この記録部20は、撮影画像を記録する機能の他、音声パターンの情報を記録する音声パターン記録部20aと、音声からキーワードを判定するための辞書記録部20bと、辞書で得られたテキストを表示する際のフォント情報を記録するフォント記録部20cと、撮影画像を記録するための画像記録部20d等を有している。
操作判定部22は、ユーザが撮影操作を行う際に操作するレリーズスイッチ等の操作の有無を判定するためのものである。この操作判定部22でカメラ10の操作が検出されると、信号処理及び制御部11によってこれらが制御されて、これらのブロックから取得された画像やテキスト等が、記録部20内に記録される。
表示部23は、液晶等から構成される表示パネルを有するもので、上述した撮影画像を表示したり、撮影した結果が見られるようにしている。尚、この表示部23には、撮影前にも、撮像部12で得られた画像が表示されて、構図や撮影タイミングの確認等ができるようになっている。
更に、時計部24は、撮影画像に撮影時刻が関連付けられるようにするためのものである。通信部25は、撮影画像に撮影位置が関連付けられて記憶されるようにするために設けられている。こうした画像並びに付随した情報は、通信部25によって外部に出力することができる。これは、無線では赤外通信や無線LAN等、有線でもUSB等を想定している。
このような構成のカメラ10を使用することにより、従来のように代わり映えしないペットの写真に、テキストを入れて変化をつけて楽しむことができる。しかも、撮影時に於ける撮影者とペットの交流が文字として記録される。
図2は、このようなカメラ10の使用例とその効果によるイメージを示したものである。
図2に示されるように、操作者であるユーザ30が、対象物であるペット31の写真を撮る場合、当該ペット31に声をかけながら撮影することが多い。しかしながら、それほど多くの語彙の言葉が費やされるわけではなく、通常、「こっちを見て」とか、名前を呼ぶだけである。したがって、カメラ10は、そうした言葉に含まれるキーワードだけを検出することができればよい。
この時、ペットは多くの場合黙っているが、そのときの感情に応じて、反応して声を出すこともある。この反応による声を利用して、テキストを画像に合成して表示、記録すれば、そのときのペットとの交流を画像に写し込むことができる。尚、この時のテキストは、単にペットの声のみならず、飼い主の声に応じて最適化するようにする。これによって、言葉を話さないペットの言葉を、人間の言葉に訳して(推測して)表示することが可能となる。
次に、図3乃至図6のフローチャートを参照して、このようなペットと飼い主のコミュニケーションを写し込むことが可能なカメラ10の動作について説明する。
尚、以下に説明するカメラ10の動作は、主に信号処理及び制御部11によって行われる。
図3は、本発明の一実施形態に於けるカメラ10の制御動作を説明するためのフローチャートである。
本シーケンスが開始されると、先ず、ステップS1に於いて、撮影モードか否かが判定される。ここで、撮影モードである場合はステップS2へ移行し、再生モードである場合は後述するステップS18へ移行する。
ステップS2では、撮像部12からの画像の取込みが行われる。ここで得られた画像が、続くステップS3にて、適正なコントラスト、露出になるように画像処理等が行われる。ここでは、取り込み画像内の動きのある部分や同じ色の部分などをペット部分として判定するような処理も行われる。
更に、ステップS4にて、表示に適切な処理が表示部23に表示される。そして、ステップS5にて、カメラ10の前方、後方の音声(ペット31、ユーザ30の音声)が取り込まれることによって、テキスト化される音声の判定が開始される。ステップS6では、上記ステップS5で取り込まれるべく前方、後方の音声が、所定時間無いか否かが判定される。その結果、所定時間音声が無い場合は、ステップS7に移行し、表示テキストがある場合はこれが消去される。一方、上記ステップS6にて音声があった場合は、ステップS7がスキップされる。
そして、ステップS8に於いて、上記ステップS5で取り込まれた後方音声に、辞書記録部20bに記録されているのと同様のキーワードが入っているか否かが判定される。また、「○○ちゃん、○○ちゃん」のような繰り返しパターンかどうかなども判定される。このような判定がなされた場合はステップS11に移行し、そうでない場合はステップS9に移行する。
上記ステップS8に於いて、撮影者が無言の場合もあり、キーワードにない言葉を発する場合もある。こうした場合にステップS9に移行して、前方音声の取り込み、すなわちペット31の音声の取り込みが行われる。尚、このサブルーチン「音声によってテキスト切換え」の詳細な動作については後述する。
そして、続くステップS10にて、サブルーチン「音声によってテキスト切換え」が実行される。こうしたテキストが画面上に表示されることにより、画面に変化がつけられる。
一方、上記ステップS8に於いて、後方音声にキーワードがあった場合は、ステップS11に移行して、サブルーチン「キーワード・テキスト化」が実行される。このサブルーチン「キーワード・テキスト化」の詳細な動作については後述する。
そして、ステップS12では、前方からの音声(ペットの声)が取り込まれる。すると、続くステップS13に於いて、サブルーチン「音声によって表現切換え」が実行される。すなわち、上記ステップS5の音声で取り込まれたキーワードが利用されたテキストに対し、表現が切換えられたものが作成される。こうして作成されたテキストが画面上に表示されて、画面に変化がつけられる。尚、このサブルーチン「音声によって表現切換え」の詳細な動作については後述する。
次に、ステップS14にて、上記ステップS10またはステップS13にて切換えられたテキストが表示される。そして、ステップS15に於いて、撮影操作が行われるか否かが操作判定部22によって判定される。その結果、撮影する場合はステップS16に移行して撮影処理が行われる。更に、ステップS17にて、先に得られたテキストと共に画像記録部20dへの記録が行われる。こうして、本シーケンスが終了する。
尚、ステップS17にて記録する前に、確認用表示のステップを入れてもよい。
また、ステップS14では、撮影しなくてもテキストを表示するようにしてもよい。
一方、上記ステップS15に於いて、撮影が行われない場合は、上記ステップS1に移行する。
上記ステップS1に於いて撮影モードでない場合は、ステップS18に移行して再生モードであるか否かが判定される。ここで、カメラ操作で再生モードが設定されると、ステップS19に移行して画像の再生が行われる。ここでは、画像をサムネイル表示したり、スライドショー切換えしたり、日付情報や、本発明の特徴たるテキスト情報によって、検索して見たい画像を鑑賞したりすることもできる。表示部23に表示される画像とテキストは、テキスト合成部11aにて合成される。
外部機器にこの再生の結果を送信したい場合は、ステップS20にてその旨が判定される。ここで、送信する場合はステップS21に移行してその操作が行われ、表示画像の送信がなされる。こうして、本シーケンスが終了する。
上記ステップS20にて送信されない場合は、上記ステップS18に移行する。
また、上記ステップS18にて、再生モードでない場合は、上記ステップS1に移行する。
図4は、図3のフローチャートのステップS10に於けるサブルーチン「音声によってテキスト切換え」の詳細な動作を説明するためのフローチャートである。このフローチャートは、ユーザの音声が無く、ペットの声のみでテキストを決定するためのものである。
本サブルーチンに入ると、先ず、ステップS31にて音量・音程判定部18cで音量が判定され、次いでステップS32にて距離判定部14によって被写体の距離が判定される。これらによって、距離による音の減衰にかかわらず、ペット31が出した音声の大きさを判定することができる。
ここで、声の大きさや周波数から動物の種類を、音声パターン記録部20aに記録された音声パターンと比較することによって判定してもよい。ペットは、多くの場合、犬か猫であるので、ここでは犬の場合を想定して説明する。
ペットが出した声の大きさによって、ペットの興奮具合が分かり、ステップS33の音域判定によって、感情などが分かる。また、大きな犬では高い声で甘えても、小さな犬の低い声と同等の音の高さになる可能性がある。そのため、ステップS34では、画角や距離、画面内にペットが占める割合などから、対象となるペットが大型犬であるか小型犬であるかが判定される。尚、この結果で発音量を補正してもよい。
つまり、大型犬は小さい声でも、小型犬の大きな声に相当する音量である場合がある。したがって、ステップS35に於いて、発音量が大きい場合はステップS36に移行して、音の高低が調べられる。すなわち、ステップS36にて低音であると判定された場合は、ステップS37に移行して、大型犬が「ワンワン」吠えていると判定される。
また、低音でない場合はステップS43に移行し、小型犬であるか否かが判定される。その結果、小型犬であれば続くステップS44にて高音であるか否かが判定される。小型犬で更に高音で鳴く場合は、ステップS45に移行して、「キャンキャン」鳴いているとして、テキスト化機能部18bにてテキストが決定される。一方、小型犬でも低音でない場合は、ステップS43からステップS45へ移行して「キャンキャン」鳴いていると判定される。更に、低音でなくとも小型犬であれば、ステップS37で同様のテキストが対応される。
また、ステップS35にて発音量が大きくないと判定された場合は、ステップS38に移行する。そして、このステップS38にて低音であるか否かが判定され、低音であればステップS40へ移行し、そうでない場合はステップS39にて小型犬であるか否かが判定される。
ステップS40では、ペットが鳴いている音声がだんだん大きくなっているか否かが判定される。低音がだんだん大きくなる場合は威嚇していると考えられるので、ステップS41に移行して、「ウー」というテキストが対応されて決定される。一方、ステップS39からステップS40に移行して、小型犬で低音でなくてもだんだん大きくなる場合は、ステップS41に移行して、同様に「ウー」というテキストが対応される。
また、低音でも小型犬でもない場合は、ステップS42に移行して、甘えた「きゅーん」というテキストが対応されて決定される。尚、小型犬でも、だんだん大きくならない声ならば、同様に甘えているものと判定される。
このような声の種類で、犬の写真と一緒に表示するテキストを切換えるので、単に撮影した結果を楽しむのみならず、そのときの犬の声を反映させた楽しみ方ができる画像が得られる。
このようにして、対応するテキストが選択されたならば、本サブルーチンを抜けて、図3のフローチャートのステップS14に移行する。
図5は、図3のフローチャートのステップS11に於けるサブルーチン「キーワード・テキスト化」の詳細な動作を説明するためのフローチャートである。
上述したように、ペットの写真を撮影するとき、且つ、ペットが写真に収まるような距離など、状況下では、ユーザはペットに声をかけながら撮影を行うことが多い。そのような状況下に於ける、ユーザとペットの交流を記録に残そうというのが、本発明の目的である。こうした状況下に於けるペットへの呼びかけの言葉というのは、限られたものであり、通常の辞書のような大がかりなデータベースを有したり、詳細な音声認識の機能を有したりする必要はない。
したがって、ここでは、ユーザがペットに呼びかける代表的な言葉として、「こっち」、「おいで」の呼びかけや、「かわいいね」、「お利口ね」のような形容詞や、名詞に「ね」が付いたほめ言葉、更には「どうしたの」、といった疑問の言葉などで、かなりの範囲をカバーすることができる。
図5のサブルーチンに入ると、先ず、ステップS51に於いて、キーワードが「こっち」、「おいで」等の単語の繰り返しであるか否かが判定される。ここで、キーワードがこれらの単語の繰り返しである場合はステップS54へ移行し、そうでない場合はステップS52に移行する。
そして、ステップS52に於いては、キーワードが、上述した形容詞、名詞に「ね」、「よ」が付いた言葉であるか否かが判定される。ここで、該当する言葉であった場合はステップS55へ移行し、そうでない場合はステップS53へ移行する。更に、ステップS53では、キーワードが疑問である「どうした」という言葉であるか否かが判定される。その結果、キーワードが該当する言葉の場合はステップS56に移行し、そうでない場合は本サブルーチンを抜けて図3のフローチャートのステップS12へ移行する。
キーワードが、上述したような呼びかけの言葉であった場合は、ステップS54、S55、S56に於いて、それぞれの言葉が選択されてテキスト化される。つまり、これらの場合、ユーザは、それぞれ「はい」、形容詞+「よ」、「えーと」というような返事を期待していると考えられるので、こうした言葉がテキスト化されるようになっている。
このテキスト化された言葉は、例えば、図7の変換表に示されるように、カテゴリAとして「はい」、カテゴリBとして「形容詞、名詞+「よ」、そしてカテゴリCとして「えーと」が該当する。これらの言葉に対して、図6で決定されるペット側のアクションが加味されて、最終的なテキストとして決定される。
図6は、図3のフローチャートのステップS13に於けるサブルーチン「音声によって表現切換え」の詳細な動作を説明するためのフローチャートである。
ここでは、基本的に図4のフローチャートに於ける、「ワンワン」を不快表現とし、「キャンキャン」を興奮表現とし、「ウー」を怒り表現とし、「きゅーん」を満足表現に置き換えている。更に、無言の場合(犬は尻尾を振るだけ、猫はすり寄って来るだけという感情表現が多い)は、通常表現としている。
また、本実施形態では、基本的に飼い主とペットが遊んでいる状態の関係を画像化(テキスト化)するものであるから、ここでは、寂しいという感情は排除して単純化している。
尚、図6のフローチャートに於けるステップS61〜S66の処理動作は、上述した図4のフローチャートのステップS31〜S36の処理動作と同様であるので、対応するステップ番号を参照するものとしてここでの説明は省略する。
ステップS66にて低音であると判定された場合は、ステップS67に移行して、不快表現であるとされる。大型犬が「ワンワン」吠えていると判定される。
また、ステップS66にて低音でないとされた場合は、ステップS75に移行して小型犬であるか否かが判定される。その結果、小型犬であれば続くステップS76にて高音であるか否かが判定される。小型犬で更に高音で鳴く場合は、ステップS77に移行して、興奮状態である旨のテキストが決定される。一方、小型犬でも低音でない場合は、ステップS73からステップS77へ移行して興奮状態であるとされる。更に、低音でなくとも小型犬であれば、ステップS67で同様のテキストが対応される。
また、ステップS65にて発音量が大きくないと判定された場合は、ステップS38に移行して、無言であるか否かが判定される。ここで、無言である場合は、ステップS69に移行して、上述したように、通常表現であるとされる。一方、無言ではないと判定された場合は、ステップS70に移行する。
ステップS70では、音声が低音であるか否かが判定される。ここで、低音であればステップS72へ移行し、そうでない場合はステップS71に移行して小型犬であるか否かが判定される。
ステップS72では、ペットが鳴いている音声がだんだん大きくなっているか否かが判定される。低音がだんだん大きくなる場合は威嚇していると考えられるので、ステップS73に移行して、怒り表現である旨のテキストが対応される。一方、ステップS71からステップS72に移行して、小型犬で低音でなくてもだんだん大きくなる場合は、ステップS73に移行して、同様に、怒り表現のテキストが対応される。
また、低音でも小型犬でもない場合は、ステップS74に移行して、満足表現である旨のテキストが対応される。尚、小型犬でも、だんだん大きくならない声ならば、同様に満足表現であると判定される。
このように、ステップS67、S68、S69、S73、S74でそれぞれの表現が決定されると、本サブルーチンを抜けて、図3のフローチャートのステップS14に移行する。
そして、上述した図5のフローチャートのステップS54、S55、S56の言葉と、図6のフローチャートのステップS67、S68、S69、S73、S74の表現とを組み合わせて、図7の変換表に表示されるような最終的なテキストが決定される。
例えば、キーワードの言葉が「はい」で、満足表現である場合は、「はーい」がテキスト化される。キーワードの言葉が、形容詞・名詞+「よ」で、怒り表現である場合は、「何?」がテキスト化される。また、キーワードの言葉が「えーと」で、通常表現である場合は、「えーと」がテキスト化される。
このような変換表は、上述したステップで声によって決定されたペットの感情状態に基づいて加工される。
例えば、図2に示されるように、ユーザ30がペット31に対して、形容詞、名詞+「ね」、「よ」の例にあるような言葉として、「お利口ね」と呼びかけたとする。この場合、ペット31が発音した「わんわん」は、大型犬、小型犬の何れであっても、発音量が大きくなく、しかもだんだん大きくはならないので、満足表現であるということになる。したがって、ペットの満足表現である、形容詞、名詞+「でしょ」が適用された「お利口でしょ」がテキスト化される。このテキスト化された文字が、画像と共にカメラ10の表示部23に表示されるようになっている。
尚、このように、テキストを変更すると共に、テキストのフォントや色、大きさなどを決定してもよく、絵文字などを追加できるようにしてもよい。
更に、本実施形態では、犬がペットの例として説明したが、その他の生物等に於いても、同様にしてテキスト化して表示するようにすればよい。
以上説明したように、本実施形態によれば、飼い主とペットの交流がテキスト表示される写真撮影が楽しめるカメラを提供することが可能となる。
また、上述した実施形態では、音声表示装置をカメラに適用した例について説明したが、これに限られるものではない。例えば、携帯電話機等、カメラ以外に適用してもよく、或いは、撮影部を持たない機器に利用して、単なる翻訳機器やコミュニケーションツールのように利用してもよい。
更に、本発明は静止画だけに限られず動画に於いても適用可能である。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態以外にも、本発明の要旨を逸脱しない範囲で種々の変形実施が可能である。
更に、上述した実施形態には種々の段階の発明が含まれており、開示される複数の構成要件の適当な組合せにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件から幾つかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除された構成も発明として抽出され得る。
本発明によれば、単調なペット写真に変化を持たせ、誰でも楽しめるペットの写真を簡単に撮影可能とすることができる。
10…カメラ、11…信号処理及び制御部、11a…テキスト合成部、12…撮像部、13…大きさ判定部、14…距離判定部、15…前方音声収録部、16…後方音声収録部、18…音声処理部、18a…被殻部、18b…テキスト化機能部、18c…音量・音程判定部、20…記録部、20a…音声パターン記録部、20b…辞書記録部、20c…フォント部、20d…画像記録部、22…操作判定部、23…表示部、24…時計部、25…通信部、30…ユーザ、31…ペット。

Claims (14)

  1. 操作者が対象物であるペットに対して発する第1の音声と、上記対象物である上記ペットが発する第2の音声とを取得する音声取得部と、
    上記音声取得部で得られた上記第1の音声を分析することで第1の音声に含まれるキーワードを取得し、上記キーワード及び上記音声取得部で得られた上記第2の音声に基づいて、上記操作者と上記対象物との関係を示す言語を表現する文字である表示内容を決定する表示決定部と、
    上記表示決定部で決定された上記表示内容を表示する表示部と、
    を具備することを特徴とする音声表示装置。
  2. 上記対象物までの距離を判定する距離判定部と、
    上記距離に従って上記対象物の声の大きさを判定する音量判定部と、
    を更に具備し、
    上記表示決定部は、上記音量判定部の判定結果に従って表示内容を決定することを特徴とする請求項1に記載の音声表示装置。
  3. 上記対象物の大きさを判定する大きさ判定部を更に具備し、
    上記表示決定部は、上記大きさ判定部で判定された大きさに従って表示内容を決定することを特徴とする請求項1に記載の音声表示装置。
  4. 上記第2の音声より上記対象物の興奮状態を判定する状態判定部を更に具備し、
    上記表示決定部は、上記興奮状態と上記キーワードに基づいて上記表示内容を決定することを特徴とする請求項に記載の音声表示装置。
  5. 上記音量判定部は、上記第2の音声の高低、大きさに基づいて上記興奮状態を判定することを特徴とする請求項に記載の音声表示装置。
  6. 上記表示決定部は、上記対象物の画像と共に該対象物の状態に応じた文字を表示させることを特徴とする請求項1乃至の何れか1項に記載の音声表示装置。
  7. 上記音声取得部は、上記操作者の発する上記第1の音声を取得する後方音声取得部と、上記対象物の発する上記第2の音声を取得する前方音声取得部と、を有することを特徴とする請求項に記載の音声表示装置。
  8. 対象物を撮影して取得した画像を表示部に表示するカメラに於いて、
    操作者が上記対象物であるペットに対して発する第1の音声と、上記対象物である上記ペットが発する第2の音声とを取得する音声取得部と、
    上記音声取得部で得られた上記第1の音声を分析することで第1の音声に含まれるキーワードを取得し、上記キーワード及び上記音声取得部で得られた上記第2の音声に基づいて、上記操作者と上記対象物との関係を示す言語を表現する文字である表示内容を決定する表示決定部と、
    を具備し、
    上記表示部は、上記表示決定部で決定された上記表示内容を表示することを特徴とするカメラ。
  9. 上記対象物までの距離を判定する距離判定部と、
    上記距離に従って上記対象物の声の大きさを判定する音量判定部と、
    を更に具備し、
    上記表示決定部は、上記音量判定部の判定結果に従って表示内容を決定することを特徴とする請求項に記載のカメラ。
  10. 上記対象物の大きさを判定する大きさ判定部を更に具備し、
    上記表示決定部は、上記大きさ判定部で判定された大きさに従って表示内容を決定することを特徴とする請求項に記載のカメラ。
  11. 上記第2の音声より上記対象物の興奮状態を判定する状態判定部を更に具備し、
    上記表示決定部は、上記興奮状態と上記キーワードに基づいて上記表示内容を決定することを特徴とする請求項に記載のカメラ。
  12. 上記音量判定部は、上記第2の音声の高低、大きさに基づいて上記興奮状態を判定することを特徴とする請求項11に記載のカメラ。
  13. 上記表示決定部は、上記対象物の画像と共に該対象物の状態に応じた文字を表示させることを特徴とする請求項8乃至12何れか1項に記載のカメラ。
  14. 上記音声取得部は、上記操作者の発する上記第1の音声を取得する後方音声取得部と、上記対象物の発する上記第2の音声を取得する前方音声取得部と、を有することを特徴とする請求項13に記載のカメラ。
JP2009001993A 2009-01-07 2009-01-07 音声表示装置及びカメラ Expired - Fee Related JP5209510B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009001993A JP5209510B2 (ja) 2009-01-07 2009-01-07 音声表示装置及びカメラ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009001993A JP5209510B2 (ja) 2009-01-07 2009-01-07 音声表示装置及びカメラ

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2013030525A Division JP2013102544A (ja) 2013-02-20 2013-02-20 音声表示装置及びカメラ

Publications (2)

Publication Number Publication Date
JP2010161592A JP2010161592A (ja) 2010-07-22
JP5209510B2 true JP5209510B2 (ja) 2013-06-12

Family

ID=42578427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009001993A Expired - Fee Related JP5209510B2 (ja) 2009-01-07 2009-01-07 音声表示装置及びカメラ

Country Status (1)

Country Link
JP (1) JP5209510B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100238323A1 (en) * 2009-03-23 2010-09-23 Sony Ericsson Mobile Communications Ab Voice-controlled image editing

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3757565B2 (ja) * 1997-08-04 2006-03-22 カシオ計算機株式会社 音声認識画像処理装置
JP2002244688A (ja) * 2001-02-15 2002-08-30 Sony Computer Entertainment Inc 情報処理方法及び装置、情報伝送システム、情報処理プログラムを情報処理装置に実行させる媒体、情報処理プログラム
JP4226237B2 (ja) * 2001-09-11 2009-02-18 日本放送協会 漫画生成装置及び漫画生成プログラム
EP1429314A1 (en) * 2002-12-13 2004-06-16 Sony International (Europe) GmbH Correction of energy as input feature for speech processing

Also Published As

Publication number Publication date
JP2010161592A (ja) 2010-07-22

Similar Documents

Publication Publication Date Title
JP2010219692A (ja) 撮像装置及びカメラ
CN111583944A (zh) 变声方法及装置
JP2018078402A (ja) コンテンツ制作装置、及び音声付コンテンツ制作システム
JP2009171176A (ja) 再生装置およびその制御方法並びにプログラム
JP5152583B2 (ja) 撮影装置、撮影案内方法、及びプログラム
CN115273831A (zh) 语音转换模型训练方法、语音转换方法和装置
JP2003037826A (ja) 代理画像表示装置およびテレビ電話装置
JP5120716B2 (ja) 撮像装置、撮像制御方法及びプログラム
JP4803147B2 (ja) 撮像装置、画像生成方法、およびプログラム
JP5209510B2 (ja) 音声表示装置及びカメラ
US20090010628A1 (en) Camera Apparatus and a Method and Software For Using Such
JP2005197867A (ja) 議事進行支援システム及び議事進行支援方法、及び発言入力装置
US20080159584A1 (en) Information processing apparatus and information processing method
CN103491304B (zh) 一种拍照方法及移动终端
JP2013102544A (ja) 音声表示装置及びカメラ
JP4722010B2 (ja) 情報処理装置、情報処理方法、情報処理プログラム、および情報処理プログラムを記録したコンピュータ読取り可能な記録媒体
JP2005107595A (ja) 自動翻訳装置
JP2005249880A (ja) 携帯式通信端末によるディジタル絵本システム
JP6166070B2 (ja) 再生装置および再生方法
JP4047834B2 (ja) 携帯情報端末
JP2004289560A (ja) 画像記録再生方法および画像記録再生装置
JP2004184788A (ja) 音声対話システムおよびプログラム
JP5182507B2 (ja) 撮影装置、撮影案内方法、及びプログラム
JP4295540B2 (ja) 音声記録方法および装置、デジタルカメラ、並びに画像再生方法および装置
JP2006267934A (ja) 議事録作成装置および議事録作成処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111026

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121101

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130221

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160301

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 5209510

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160301

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees