JP6634755B2

JP6634755B2 - 電子機器、システム、保存制御方法及びプログラム

Info

Publication number: JP6634755B2
Application number: JP2015185867A
Authority: JP
Inventors: 岡田　健; 岡田　　健
Original assignee: Casio Computer Co Ltd
Current assignee: Casio Computer Co Ltd
Priority date: 2015-09-18
Filing date: 2015-09-18
Publication date: 2020-01-22
Anticipated expiration: 2035-09-18
Also published as: CN107065400B; US10230884B2; CN107065400A; JP2017060127A; US20170085772A1; KR20170034315A; KR102653751B1

Description

本発明は、電子機器、システム、保存制御方法及びプログラムに関する。

従来より、例えば、撮影制御を手操作ではなく、音声で行うカメラの技術がある（特許文献１・２参照）。また、撮影した写真をＷｅｂ上の所定サーバにアップロードする技術がある。それを利用したＳＮＳなどのサービスもある（特許文献３参照）。

特開２０１２−１００２１４号公報特開２００９−１０９８７号公報特開２００２−１８９７２３号公報

ＳＮＳなどのＷｅｂ上のサーバに写真をアップロードする際には、写真撮影が完了したのち、撮影装置または写真が保存されているメモリを有する装置で専用アプリケーションを起動させて、保存された写真の中から目的の写真を選択して、アップロード先を選択して、写真をウェブ上にアップロードするといった煩雑な作業が必要となる。

本発明は、このような状況に鑑みてなされたものであり、煩雑な作業なしで、写真を撮影して、その撮影された写真を簡単に適切な場所へアップロードすることができることを目的とする。

上記目的を達成するため、本発明の一態様の電子機器は、
画像を取得する画像取得手段と、
ユーザから発せられる所定の音声を取得する音声取得手段と、
前記所定の音声と同じ音声を文字情報に変換する制御を行う音声変換制御手段と、
前記変換された前記文字情報の内容に対応付けられて予め設定された記憶先に、前記画像と共に前記文字情報を保存させる制御を行う保存制御手段と、
を備えることを特徴とする。

本発明によれば、煩雑な作業なしで、撮影された写真を簡単に適切な場所へアップロードすることができる。

本発明の一実施形態に係る投稿システムのシステム構成を示すシステム構成図である。本実施形態の投稿システムで実行される音声投稿を説明するための模式図である。本実施形態の音声投稿の利用シーンを示す模式図である。本実施形態の投稿システムのリスト端末のハードウェアの構成を示すブロック図である。本実施形態の投稿システムの撮影端末のハードウェアの構成を示すブロック図である。本実施形態の投稿システムの携帯端末のハードウェアの構成を示すブロック図である。図４のリスト端末の機能的構成のうち、音声投稿処理を実行するための機能的構成を示す機能ブロック図である。図５の撮影端末の機能的構成のうち、音声投稿処理を実行するための機能的構成を示す機能ブロック図である。図６の携帯端末の機能的構成のうち、音声投稿処理を実行するための機能的構成を示す機能ブロック図である。図７乃至９の機能的構成を有する図４のリスト端末１、図５の撮影端末及び図６の携帯端末が実行する音声投稿処理の流れを説明するフローチャートである。第２の実施形態に係る投稿システムのシステム構成を示すシステム図である。本実施形態の投稿システムで実行される音声投稿を説明するための模式図である。図７及び図８の機能的構成を有する図４のリスト端末１及び図５の撮影端末が実行する音声投稿処理の流れを説明するフローチャートである。本実施形態の撮影端末のハードウェアの構成を示すブロック図である。図１４の撮影端末の機能的構成のうち、音声投稿処理を実行するための機能的構成を示す機能ブロック図である。図１５の機能的構成を有する図１４の撮影端末が実行する音声投稿処理の流れを説明するフローチャートである。

以下、本発明の実施形態について、図面を用いて説明する。

＜第１の実施形態＞
図１は、本発明の一実施形態に係る投稿システムのシステム構成を示すシステム構成図である。
本実施形態の投稿システムＳは、図１に示すように、リスト端末１と、撮影端末２と、携帯端末３と、を含む。
本実施形態の投稿システムＳでは、１の音声入力により、投稿指示と投稿内容の入力と撮影指示を行って、作成した投稿内容のテキストと、撮影した画像を、ＳＮＳ（ＳｏｃｉａｌＮｅｔｗｏｒｋｉｎｇＳｅｒｖｉｃｅ）サーバに送信して投稿を行う。

投稿システムＳを構成するリスト端末１は、ユーザの腕に装着して使用され、音声入力機能と、画面表示機能と、通信機能を有する。
リスト端末１は、音声入力を行って、撮影と入力された音声の音声認識の指示と、音声認識結果に応じた投稿先への投稿指示を携帯端末３に行う。なお、投稿内容は、音声認識結果の文字列と、撮影指示によって取得した画像である。

また、投稿システムＳを構成する撮影端末２は、ユーザのバッグ、衣服、帽子等に装着して使用され、通信機能と、撮影機能を有する。
撮影端末２は、リスト端末１からの撮影指示に基づいて撮影を行って、画像をリスト端末１に送信する。

また、投稿システムＳを構成する携帯端末３は、ユーザが携行しており、通信機能を有する。
携帯端末３では、リスト端末１から音声認識指示に基づいて、外部の音声認識サーバから入力された音声の音声認識結果を取得してリスト端末１に送信する。また、携帯端末３では、リスト端末１からの投稿指示に基づいて、指定された投稿先となるＳＮＳサーバに投稿内容を送信して、投稿を行う。

投稿内容の画像と文字列を作成するための撮影指示及び音声認識指示と、投稿先を決定するための音声内容とは、任意の内容の後に続く音声内容全体の末尾の内容である。即ち、音声内容全体は、「任意の音声内容」＋「末尾：特定の音声内容」から構成されており、投稿先を決定する音声内容は「末尾：特定の音声内容」である。入力される音声内容全体から判断せずに、末尾部分の音声内容で判断することになる。本実施形態においては、音声内容を文字列として扱い、入力された音声に対応する文字列の末尾の文字列が特定の文字列である場合（入力された音声＝「任意の文字列＋末尾が特定の文字列」）に、本機能が動作することになる。
末尾の特定の文字列は、ユーザが任意に設定することが可能であるが、本実施形態においては、記憶先となる投稿先を直接的に又は間接的に想起させるような投稿先に関連したキーワードが設定される。さらには、投稿先で慣用的、又は公式的に使用されているワードを用いるように構成する。

具体的には、Ｔｗｉｔｔｅｒ（登録商標）の場合には、投稿したい内容と、Ｔｗｉｔｔｅｒ（登録商標）において慣用されている現在何をしているのかを表す「なう」の文言を最後に発して音声入力すると、投稿内容のテキストと、音声入力した際に撮影した画像とがＴｗｉｔｔｅｒ（登録商標）の自分のアカウントに投稿される。
即ち、入力した音声が「○○○なう」の場合に自分のアカウント（特定の投稿先）に、音声入力時に撮影した画像と共に「○○○なう」のテキストが自分のＴｗｉｔｔｅｒ（登録商標）のアカウントに投稿されることとなる。

また、Ｆａｃｅｂｏｏｋ（登録商標）の場合には、投稿したい内容と、Ｆａｃｅｂｏｏｋ（登録商標）が公式的に設けている相手を賞賛する際に押すボタンの文言である「いいね」の文言を最後に発して音声入力すると、投稿内容のテキストと、音声入力した際に撮影した画像とがＦａｃｅｂｏｏｋ（登録商標）の自分のアカウントに投稿される。
即ち、入力した音声が「○○○いいね」の場合に自分のアカウント（特定の投稿先）に、音声入力時に撮影した画像と共に「○○○いいね」のテキストが自分のＦａｃｅｂｏｏｋ（登録商標）のアカウントに投稿されることとなる。

このように音声の末尾に投稿先を想起させるキーワードを投稿・投稿先の指定等を判断するワードとすることで、音声入力をするユーザは、気持ちや感想等の文言を発した最後に特定のワードを発すればよく、投稿・投稿先の指定等を意識して気持ちや感想等の思考を妨げることなく直感的に音声を入力することができる。
また、投稿先を指定して、投稿を指示するワードを発してから、投稿内容を発するような場合、投稿内容を発するまでに興ざめしてしまう可能性があるが、この場合に比べて、投稿内容をまず発することで、身構えた感じにならずに直感的に発しやすくなりリアルタイム感も損なわない。また、投稿先と関連しており、さらに慣用的又は公式的に使用されているワードを用いることで、特定の文言を覚える必要がなくなる。
また、直感的に投稿内容のみ発して、後に、投稿内容に応じて投稿先を選択するワードを発して、投稿先を調整することも可能となる。

図２は、本実施形態の投稿システムＳで実行される音声投稿を説明するための模式図である。
本実施形態の投稿システムＳでは、図２の例に示すように、例えば、「頂上なう」という音声をリスト端末１に入力する（つぶやく）ことで、当該音声をトリガにして、撮影端末２でセルフタイマ撮影が行われ、携帯端末３において入力した音声の音声認識がされる。その後、音声（“つぶやき”）はテキスト化されて撮影した画像と共にリスト端末１の画面に表示される。なお、セルフタイマ時にリスト端末１を操作（タッチ操作）することで、撮影を一時停止させたり、投稿を中止させたりすることが可能に構成される。また、セルフタイマの時間設定も任意に変更可能に構成される。
最終的に、リスト端末１の画面に表示されたつぶやきと画像がＳＮＳサーバにアップロードされて投稿され、自分のツイートとして公開される。

図３は、本実施形態の音声投稿の利用シーンを示す模式図である。
本実施形態の音声投稿の利用シーンは、図３に示すように、多岐に亘っており、「山」、「キャンプ」、「サイクリング」、「スキー・スノーボード」等の端末等を入力操作できないようなシーンや別動作を伴うようなシーンでより効果的に機能する。
例えば、登山しているような場合には、入力・撮影等の端末操作は、行いづらい。頂上に着いた際に、頂上に着いた旨を告知する「頂上着いたなう」との音声入力を行うことで、頂上付近の画像と、「頂上着いたなう」のテキストがＴｗｉｔｔｅｒ（登録商標）に投稿されることになる。
また、キャンプで食事しているような場合には、入力・撮影等の端末操作を行っていると食事の感想のリアルタイム感が失われてしまう。食べてすぐに食事の感想を告知する「飯うまなう」との音声入力を行うことで、食事風景の画像と、「飯うまなう」のテキストがＴｗｉｔｔｅｒ（登録商標）に投稿されることになる。
また、サイクリングしているような場合には、入力・撮影等の端末操作は、行いづらい。特定の場所に辿り着いた際に、現在地点の名称を告知する「しまなみ来たぜイイネ！」との音声入力を行うことで、周りの風景の画像と、「しまなみ来たぜイイネ！」のテキストがＦａｃｅｂｏｏｋ（登録商標）に投稿されることになる。
また、スキーやスノーボードをしている場合には、入力・撮影等の端末操作は、行いづらい。転んでいる等の特定のシーンが訪れた際に、感想を告知する「転びすぎイイネ！」との音声入力を行うことで、特定のシーンを撮影した画像と、「転びすぎイイネ！」のテキストがＦａｃｅｂｏｏｋ（登録商標）に投稿されることになる。

図４は、本実施形態の投稿システムＳのリスト端末１のハードウェアの構成を示すブロック図である。
リスト端末１は、例えば、スマートウォッチとして構成される。

リスト端末１は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１１−１と、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）１２−１と、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１３−１と、バス１４−１と、入出力インターフェース１５−１と、入力部１６−１と、出力部１７−１と、記憶部１８−１と、通信部１９−１と、ドライブ２０−１と、を備えている。

ＣＰＵ１１−１は、ＲＯＭ１２−１に記録されているプログラム、又は、記憶部１８−１からＲＡＭ１３−１にロードされたプログラムに従って各種の処理を実行する。

ＲＡＭ１３−１には、ＣＰＵ１１−１が各種の処理を実行する上において必要なデータ等も適宜記憶される。

ＣＰＵ１１−１、ＲＯＭ１２−１及びＲＡＭ１３−１は、バス１４−１を介して相互に接続されている。このバス１４−１にはまた、入出力インターフェース１５−１も接続されている。入出力インターフェース１５−１には、入力部１６−１、出力部１７−１、記憶部１８−１、通信部１９−１及びドライブ２０−１が接続されている。

入力部１６−１は、タッチパネルで構成され、ユーザの指示操作に応じて各種情報を入力する。
また、入力部１６−１は、マイクで構成され、ユーザの発する音声を入力する。

出力部１７−１は、ディスプレイやスピーカ等で構成され、画像や音声を出力する。

記憶部１８−１は、ハードディスク或いはＤＲＡＭ（ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）等で構成され、各種画像のデータを記憶する。

通信部１９−１は、インターネットを含むネットワークを介して他の装置（図示せず）との間で行う通信を制御する。また、通信部１９−１は、他の端末と、Ｂｌｕｅｔｏｏｔｈ通信（ＢｌｕｅｔｏｏｔｈＬｅｇａｃｙ通信）、Ｗｉ−Ｆｉ通信可能に構成される。また、通信部１９−１は、携帯電話の通信規格であるＬＴＥ（ＬｏｎｇＴｅｒｍＥｖｏｌｕｔｉｏｎ）、３Ｇ（第３世代移動通信システム）の方式で、インターネットを介して各種サーバと通信可能に構成される。

ドライブ２０−１には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等よりなる、リムーバブルメディア３１−１が適宜装着される。ドライブ２０−１によってリムーバブルメディア３１−１から読み出されたプログラムは、必要に応じて記憶部１８−１にインストールされる。また、リムーバブルメディア３１−１は、記憶部１８−１に記憶されている画像のデータ等の各種データも、記憶部１８−１と同様に記憶することができる。

図５は、本実施形態の投稿システムＳの撮影端末２のハードウェアの構成を示すブロック図である。
撮影端末２は、例えば、デジタルカメラとして構成される。

撮影端末２は、図５に示すように、ＣＰＵ１１−２乃至撮像部２１−２を備えている。撮影端末２は、リスト端末１の出力部１７−１に相当するハードウェア構成を備えずに、撮像部２１−２のハードウェア構成を備えていることが異なる。リスト端末１と同様のハードウェア構成であるＣＰＵ１１−２乃至ドライブ２０−２の説明は省略する。

撮像部２１−２は、図示はしないが、光学レンズ部と、イメージセンサと、を備えている。

光学レンズ部は、被写体を撮影するために、光を集光するレンズ、例えばフォーカスレンズやズームレンズ等で構成される。
フォーカスレンズは、イメージセンサの受光面に被写体像を結像させるレンズである。ズームレンズは、焦点距離を一定の範囲で自在に変化させるレンズである。
光学レンズ部にはまた、必要に応じて、焦点、露出、ホワイトバランス等の設定パラメータを調整する周辺回路が設けられる。

イメージセンサは、光電変換素子や、ＡＦＥ（ＡｎａｌｏｇＦｒｏｎｔＥｎｄ）等から構成される。
光電変換素子は、例えばＣＭＯＳ（ＣｏｍｐｌｅｍｅｎｔａｒｙＭｅｔａｌＯｘｉｄｅＳｅｍｉｃｏｎｄｕｃｔｏｒ）型の光電変換素子等から構成される。光電変換素子には、光学レンズ部から被写体像が入射される。そこで、光電変換素子は、被写体像を光電変換（撮像）して画像信号を一定時間蓄積し、蓄積した画像信号をアナログ信号としてＡＦＥに順次供給する。
ＡＦＥは、このアナログの画像信号に対して、Ａ／Ｄ（Ａｎａｌｏｇ／Ｄｉｇｉｔａｌ）変換処理等の各種信号処理を実行する。各種信号処理によって、ディジタル信号が生成され、撮像部２１−２の出力信号として出力される。
このような撮像部２１−２の出力信号を、以下、「撮像画像のデータ」と呼ぶ。撮像画像のデータは、ＣＰＵ１１−２や図示しない画像処理部等に適宜供給される。

図６は、本実施形態の投稿システムＳの携帯端末３のハードウェアの構成を示すブロック図である。
携帯端末３は、例えば、スマートフォンとして構成される。
携帯端末３のハードウェア構成（ＣＰＵ１１−３乃至撮像部２１−３）は、上述したリスト端末１及び撮影端末２の個々のハードウェア構成が同じであるため、説明を省略する。

図７は、図４のリスト端末１の機能的構成のうち、音声投稿処理を実行するための機能的構成を示す機能ブロック図である。
音声投稿処理とは、１度の音声入力によって、文字情報と音声入力時点の画像を、特定のＳＮＳに投稿させる一連の処理をいう。
なお、本実施形態の構成は、リスト端末１にＳＩＭ（ＳｕｂｓｃｒｉｂｅｒＩｄｅｎｔｉｔｙＭｏｄｕｌｅ）カードがないような場合により有効的に機能する。

リスト端末１側の音声投稿処理を実行する場合には、図７に示すように、ＣＰＵ１１−１において、投稿先設定部５１と、入力検出部５２と、通信制御部５３と、文字列解析部５４と、投稿先決定部５５と、表示制御部５６と、が機能する。
また、記憶部１８−１の一領域には、投稿先記憶部７１と、投稿内容情報記憶部７２と、が設定される。
投稿先記憶部７１には、投稿先ワードと投稿先とが対応付けられて記憶されており、投稿先への投稿に必要な投稿情報（個人アカウント又は投稿用メールアドレス等）が記憶される。具体的には、本実施形態においては、投稿先記憶部７１には、投稿先ワード「なう」の場合には、投稿先をＴｗｉｔｔｅｒ（登録商標）とし、投稿先ワード「いいね」の場合には、投稿先をＦａｃｅｂｏｏｋ（登録商標）として記憶されている。なお、投稿先ワードは、ユーザが任意に設定可能に構成される。

投稿内容情報記憶部７２には、投稿内容の文字列及び画像データが記憶される。

投稿先設定部５１は、ユーザの入力部１６−１等による設定操作によって、投稿先ワードと、投稿先を対応付けて、投稿先記憶部７１に記憶させて、投稿先を設定する。

入力検出部５２は、入力部１６−１に対するユーザが発する音声の入力を検出する。
具体的には、入力検出部５２は、ユーザから入力部１６−１を介して、音声の入力が検出されたか否かを判定する。

通信制御部５３は、撮影端末２及び携帯端末３と通信を行うように通信部１９−１を制御する。
具体的には、通信制御部５３は、撮影指示を撮影端末２に送信し、音声認識指示及び音声入力によって入力された音声データを携帯端末３に送信するように通信部１９−１を制御する。また、通信制御部５３は、撮影端末２から撮影指示により撮影された画像を受信し、携帯端末３から音声認識結果（本実施形態においては、文字列データ）を受信するように通信部１９−１を制御する。また、通信制御部５３は、携帯端末３に対して、投稿先ワードに対応する投稿先及び投稿内容（出力部１７−１に表示した画像と文字列）を含む投稿指示と、画像データ及び文字列データと、を送信するように通信部１９−１を制御する。

文字列解析部５４は、音声認識結果である文字列を解析する。
具体的には、文字列解析部５４は、音声認識結果の文字列を解析して、投稿ワードとなる文字列の末尾に投稿先ワードが含まれるか否かを判定する。

投稿先決定部５５は、投稿先記憶部７１を参照し、音声認識結果の文字列の末尾に含まれる投稿先ワードに対応する投稿先を決定する。

表示制御部５６は、投稿ワードとなる文字列や投稿画像となる撮影画像を表示するように出力部１７−１を制御する。出力部１７−１には、投稿ワードや投稿画像が表示され、ユーザが投稿内容を把握することができる。

図８は、図５の撮影端末２の機能的構成のうち、音声投稿処理を実行するための機能的構成を示す機能ブロック図である。

撮影端末２側の音声投稿処理を実行する場合には、図８に示すように、ＣＰＵ１１−２において、通信制御部９１と、撮影制御部９２と、が機能する。

通信制御部９１は、リスト端末１と通信を行うように通信部１９−２を制御する。
具体的には、通信制御部９１は、リスト端末１から撮影指示を受信するように通信部１９−２を制御する。また、撮影処理の結果、撮影された画像をリスト端末１に送信するように通信部１９−２を制御する。

撮影制御部９２は、撮像処理を行うように撮像部２１−２を制御する。その結果、撮影制御部９２は、撮像部２１−２で撮影された画像を取得する。

図９は、図６の携帯端末３の機能的構成のうち、音声投稿処理を実行するための機能的構成を示す機能ブロック図である。

携帯端末３側の音声投稿処理を実行する場合には、図９に示すように、ＣＰＵ１１−３において、通信制御部１１１が機能する。

通信制御部１１１は、リスト端末１、音声認識サーバ及びＳＮＳサーバと通信を行うように通信部１９−３を制御する。
具体的には、通信制御部１１１は、音声認識指示及び音声認識用の音声データを受信するように通信部１９−３を制御する。また、通信制御部１１１は、外部の音声認識サーバに対して、音声認識指示及び音声認識用の音声データを送信するように通信部１９−３を制御する。また、通信制御部１１１は、外部の音声認識サーバから、音声認識結果を受信するように通信部１９−３を制御する。また、通信制御部１１１は、リスト端末１に対して、音声認識結果を送信するように通信部１９−３を制御する。また、通信制御部１１１は、リスト端末１から、投稿指示と、画像データ及び文字列データを、を受信にするように通信部１９−３を制御する。また、通信制御部１１１は、投稿先のＳＮＳサーバに、投稿内容である画像データ及び文字列データを送信するように通信部１９−３を制御する。

図１０は、図７乃至９の機能的構成を有する図４のリスト端末１、図５の撮影端末２及び図６の携帯端末３が実行する音声投稿処理の流れを説明するフローチャートである。音声投稿処理の開始にあたり、投稿先設定部５１により、投稿先ワードがユーザによって事前に登録されている状態、即ち、投稿先記憶部７１に個人アカウント設定を含む投稿先の情報と投稿先ワードとが登録されている状態となっている。また、各端末（リスト端末１、撮影端末２、携帯端末３）の間では、互いに通信可能に接続が完了している状態となっている。また、音声投稿用のアプリケーションをユーザの操作等で起動して、音声入力が可能な状態となることで、音声投稿処理が開始される。
なお、音声投稿用のアプリケーションを起動して、音声入力が可能な状態とすることで、音声投稿処理を開始するように構成したが、これに限られず、全ての動作を音声入力で行うように構成してもよい。例えば、音声入力に応じて、音声投稿用のアプリケーションを自動起動させて、音声入力が可能な状態にしてから、音声投稿処理を開始するように構成してもよい。

［リスト端末１側の音声投稿処理］
ステップＳ１１−１において、入力検出部５２は、ユーザから入力部１６−１を介して、音声の入力が検出されたか否かを判定する。
音声の入力が検出されていない場合には、ステップＳ１１−１においてＮＯと判定されて、待機状態となる。
音声の入力が検出された場合には、ステップＳ１１−１においてＹＥＳと判定されて、処理はステップＳ１２−１に進む。

ステップＳ１２−１において、通信制御部５３は、撮影指示を撮影端末２に送信し、音声認識指示及び音声入力によって入力された音声データを携帯端末３に送信するように通信部１９−１を制御する。
その後、撮影端末２では、撮影指示を受けて、撮影処理が実行される。また、携帯端末３では、音声認識指示を受けて、インターネット等を介して、外部の音声認識サーバに音声データを送信して、音声認識を実行させる。

ステップＳ１３−１において、通信制御部５３は、撮影端末２から撮影指示により撮影された画像を受信し、携帯端末３から音声認識結果（本実施形態においては、文字列データ）を受信するように通信部１９−１を制御する。

ステップＳ１４−１において、文字列解析部５４は、携帯端末３から受信した文字列データを解析して、投稿先記憶部７１を参照し、投稿先ワードを文字列の末尾に含んでいるか否かを判定する。具体的には、例えば、投稿ワードの末尾に「なう」や「いいね」の投稿先ワードが含まれるか否かを判定する。文字列が「頂上なう」だった場合には、投稿先ワードを末尾に含み、「頂上」又は「なう頂上」の場合には、末尾に投稿先ワードを含まないと判定される。
投稿先ワードを文字列の末尾に含んでいない場合には、ステップＳ１４−１においてＮＯと判定されて、リスト端末１側の音声投稿処理は終了する。
投稿先ワードを文字列の末尾に含んでいる場合には、ステップＳ１４−１においてＹＥＳと判定されて、処理はステップＳ１５−１に進む。

ステップＳ１５−１において、投稿先決定部５５は、投稿先記憶部７１を参照し、末尾に含まれる投稿先ワードに対応する投稿先を決定する。
具体的には、投稿先ワードが「なう」であった場合には、投稿先記憶部７１を参照した結果、設定されているＴｗｉｔｔｅｒ（登録商標）を投稿先として決定し、「いいね」であった場合には、Ｆａｃｅｂｏｏｋ（登録商標）を投稿先として決定する。

ステップＳ１６−１において、表示制御部５６は、撮影端末２から受信した画像と、携帯端末３から受信した文字列を表示出力するように出力部１７−１を制御する。

ステップＳ１７−１において、通信制御部５３は、携帯端末３に対して、投稿先ワードに対応する投稿先及び投稿内容（出力部１７−１に表示した画像と文字列）を含む投稿指示と、画像データ及び文字列データと、を送信するように通信部１９−１を制御する。携帯端末３では、投稿指示を受けて、投稿先ワードに対応する投稿先となるＳＮＳサーバに対して、受信した画像データと文字列データを送信して、投稿処理を行う。また、送信に際して、投稿内容である文字列及び画像データが投稿内容情報記憶部７２に記憶される。
その後、リスト端末１側の音声投稿処理は終了する。

［撮影端末２側の音声投稿処理］
ステップＳ１１−２において、通信制御部９１は、リスト端末１から撮影指示を受信するように通信部１９−２を制御する。

ステップＳ１２−２において、撮影制御部９２は、撮影処理を実行する。本実施形態の撮影処理では、セルフタイマ機能により所定時間経過後に撮影が行われる。なお、セルフタイマの間、ライブビュー画像をリスト端末１に送信するように構成してもよい。

ステップＳ１３−２において、通信制御部９１は、撮影処理の結果、撮影された画像をリスト端末１に送信するように通信部１９−２を制御する。その後、撮影端末２側の音声投稿処理は終了する。

［携帯端末３側の音声投稿処理］
ステップＳ１１−３において、通信制御部１１１は、音声認識指示及び音声認識用の音声データを受信するように通信部１９−３を制御する。

ステップＳ１２−３において、通信制御部１１１は、外部の音声認識サーバに対して、音声認識指示及び音声認識用の音声データを送信するように通信部１９−３を制御する。

ステップＳ１３−３において、通信制御部１１１は、外部の音声認識サーバから、音声認識結果を受信するように通信部１９−３を制御する。

ステップＳ１４−３において、通信制御部１１１は、リスト端末１に対して、音声認識結果を送信するように通信部１９−３を制御する。

ステップＳ１５−３において、通信制御部１１１は、リスト端末１から、投稿指示と、画像データ及び文字列データを、を受信にするように通信部１９−３を制御する。

ステップＳ１６−３において、通信制御部１１１は、投稿先のＳＮＳサーバに、投稿内容である画像データ及び文字列データを送信するように通信部１９−３を制御する。
その後、携帯端末３側の音声投稿処理は終了する。

＜第２の実施形態＞
図１１は、第２の実施形態に係る投稿システムＳのシステム構成を示すシステム図である。
本実施形態の投稿システムＳは、第１の実施形態とは異なり、図１１に示すように、音声入力機能と投稿機能を有するリスト端末１と、撮影機能を有する撮影端末２と、で構成される。なお、機能ブロックについては、第１の実施形態の図７に示すリスト端末１及び図８に示す撮影端末２と同じであるため説明及び図示を省略する。
なお、本実施形態の構成は、リスト端末１にＳＩＭカードがあるような場合により有効的に機能する。

図１２は、第２の実施形態の投稿システムＳで実行される音声投稿を説明するための模式図である。
本実施形態の投稿システムＳでは、図１２の例に示すように、例えば、「頂上なう」という音声をリスト端末１に入力する（つぶやく）ことで、当該音声をトリガにして、撮影端末２でセルフタイマ撮影が行われ、携帯端末３において入力した音声の音声認識がされる。
その後、音声認識された文字列が撮影された画像と共にリスト端末１の画面に表示される。なお、ライブビュー画像をリスト端末１の画面に表示させて、所定時間経過後にタイマ表示を行って撮影するように構成してもよい。また、セルフタイマ時にリスト端末１を操作（タッチ操作）することで、撮影を一時停止させることが可能に構成される。また、セルフタイマの時間設定も任意に変更可能に構成される。
最終的に、リスト端末１の画面に表示されたつぶやきと画像がＳＮＳにアップロードされて投稿され、自分のツイートとして公開される。なお、投稿データの送信中に、リスト端末１を操作（タッチ操作）して投稿を中止させたりするように構成してもよい。

図１３は、図７及び図８の機能的構成を有する図４のリスト端末１及び図５の撮影端末２が実行する音声投稿処理の流れを説明するフローチャートである。音声投稿処理の開始にあたり、投稿先設定部５１により投稿先ワードがユーザによって事前に登録されている状態、即ち、投稿先記憶部７１に個人アカウント設定を含む投稿先の情報と投稿先ワードとが登録されている状態となっている。また、リスト端末１及び撮影端末２の間では、互いに通信可能に接続が完了している状態となっている。また、音声投稿用のアプリケーションをユーザの操作等で起動して、音声入力が可能な状態となることで、音声投稿処理が開始される。
なお、音声投稿用のアプリケーションを起動して、音声入力が可能な状態とすることで、音声投稿処理を開始するように構成したが、これに限られず、全ての動作を音声入力で行うように構成してもよい。例えば、音声入力に応じて、音声投稿用のアプリケーションを自動起動させて、音声入力が可能な状態にしてから、音声投稿処理を開始するように構成してもよい。

［リスト端末１側の音声投稿処理］
ステップＳ３１−１において、入力検出部５２は、ユーザから入力部１６−１を介して、音声の入力が検出されたか否かを判定する。
音声の入力が検出されていない場合には、ステップＳ３１−１においてＮＯと判定されて、待機状態となる。
音声の入力が検出された場合には、ステップＳ３１−１においてＹＥＳと判定されて、処理はステップＳ３２−１に進む。

ステップＳ３２−１において、通信制御部５３は、撮影指示を撮影端末２に送信し、音声入力によって入力された音声データを外部の音声認識サーバに送信するように通信部１９−１を制御する。
その後、撮影端末２では、撮影指示を受けて、撮影処理が実行される。また、外部の音声認識サーバでは、音声認識が実行される。

ステップＳ３３−１において、通信制御部５３は、撮影端末２から撮影指示により撮影された画像を受信し、外部の音声認識サーバから音声認識結果（本実施形態においては、文字列データ）を受信するように通信部１９−１を制御する。

ステップＳ３４−１において、文字列解析部５４は、外部の音声認識サーバから受信した文字列データを解析して、投稿先ワードを文字列の末尾に含んでいるか否かを判定する。
投稿先ワードを文字列の末尾に含んでいない場合には、ステップＳ３４−１においてＮＯと判定されて、リスト端末１側の音声投稿処理は終了する。
投稿先ワードを文字列の末尾に含んでいる場合には、ステップＳ３４−１においてＹＥＳと判定されて、処理はステップＳ３５−１に進む。

ステップＳ３５−１において、投稿先決定部５５は、投稿先記憶部７１を参照し、末尾に含まれる投稿先ワードに対応する投稿先を決定する。

ステップＳ３６−１において、表示制御部５６は、撮影端末２から受信した画像と、外部の音声認識サーバから受信した文字列を表示出力するように出力部１７−１を制御する。

ステップＳ３７−１において、通信制御部５３は、投稿先ワードに対応する投稿先となるＳＮＳサーバに対して、画像データと文字列データを送信するように通信部１９−１を制御して、投稿処理を行う。また、送信に際して、投稿内容である文字列及び画像データが投稿内容情報記憶部７２に記憶される。
その後、リスト端末１側の音声投稿処理は終了する。

［撮影端末２側の音声投稿処理］
ステップＳ３１−２において、通信制御部９１は、リスト端末１から撮影指示を受信するように通信部１９−２を制御する。

ステップＳ３２−２において、撮影制御部９２は、撮影処理を実行する。本実施形態の撮影処理では、セルフタイマ機能により所定時間経過後に撮影が行われる。なお、セルフタイマの間、ライブビュー画像をリスト端末１に送信するように構成してもよい。

ステップＳ３３−２において、通信制御部９１は、撮影処理の結果、撮影された画像をリスト端末１に送信するように通信部１９−２を制御する。その後、撮影端末２側の音声投稿処理は終了する。

＜第３の実施形態＞
上述した実施形態では、複数の端末によって、音声投稿処理を実行するように構成したが、本実施形態では、撮影機能と、音声入力機能と、投稿機能とを備えた単体の端末によって音声投稿処理を実行するように構成する。本実施形態においては、デジタルカメラとして構成した撮影端末２に、撮影機能に加えて、音声入力機能及び投稿機能を備えてスタンドアロン機として構成して、音声投稿処理を実行する。
図１４は、本実施形態の撮影端末２のハードウェアの構成を示すブロック図である。なお、本実施形態において追加されたハードウェア構成については、上述したリスト端末１及び携帯端末３と同じであるため、説明を省略する。

図１５は、図１４の撮影端末２の機能的構成のうち、音声投稿処理を実行するための機能的構成を示す機能ブロック図である。なお、本実施形態において再構成された機能ブロック（投稿先設定部１３１乃至表示制御部１３７、投稿先記憶部１５１、投稿内容情報記憶部１５２）は、上述したリスト端末１の投稿先設定部５１、入力検出部５２、通信制御部５３、文字列解析部５４、投稿先決定部５５、表示制御部５６、投稿先記憶部７１、投稿内容情報記憶部７２及び携帯端末３の通信制御部９１、撮影制御部９２と同じであるため説明を省略する。

図１６は、図１５の機能的構成を有する図１４の撮影端末２が実行する音声投稿処理の流れを説明するフローチャートである。音声投稿処理の開始にあたり、投稿先設定部１３１により、投稿先ワードがユーザによって事前に登録されている状態、即ち、投稿先記憶部７１に個人アカウント設定を含む投稿先の情報と投稿先ワードとが登録されている状態となっている。また、音声投稿用のアプリケーションをユーザの操作等で起動して、音声入力が可能な状態となることで、音声投稿処理が開始される。
なお、音声投稿用のアプリケーションを起動して、音声入力が可能な状態とすることで、音声投稿処理を開始するように構成したが、これに限られず、全ての動作を音声入力で行うように構成してもよい。例えば、音声入力に応じて、音声投稿用のアプリケーションを自動起動させて、音声入力が可能な状態にしてから、音声投稿処理を開始するように構成してもよい。

ステップＳ５１において、入力検出部１３２は、ユーザから入力部１６−２を介して、音声の入力が検出されたか否かを判定する。
音声の入力が検出されていない場合には、ステップＳ５１においてＮＯと判定されて、待機状態となる。
音声の入力が検出された場合には、ステップＳ５１においてＹＥＳと判定されて、処理はステップＳ５２に進む。

ステップＳ５２において、撮影制御部１３３は、撮影処理を実行する。本実施形態の撮影処理では、セルフタイマ機能により所定時間経過後に撮影が行われる。なお、セルフタイマの間、表示制御部１３７は、ライブビュー画像を表示させるように出力部１７−２を制御してもよい。

ステップＳ５３において、通信制御部１３４は、音声入力によって入力された音声データを外部の音声認識サーバに送信するように通信部１９−２を制御する。
その後、外部の音声認識サーバでは、音声認識が実行される。

ステップＳ５４において、通信制御部１３４は、外部の音声認識サーバから音声認識結果（本実施形態においては、文字列データ）を受信するように通信部１９−２を制御する。

ステップＳ５５において、文字列解析部１３５は、外部の音声認識サーバから受信した文字列データを解析して、投稿先ワードを文字列の末尾に含んでいるか否かを判定する。
投稿先ワードを文字列の末尾に含んでいない場合には、ステップＳ５５においてＮＯと判定されて、音声投稿処理は終了する。
投稿先ワードを文字列の末尾に含んでいる場合には、ステップＳ５５においてＹＥＳと判定されて、処理はステップＳ５６に進む。

ステップＳ５６において、投稿先決定部１３６は、投稿先記憶部７１を参照し、末尾に含まれる投稿先ワードに対応する投稿先を決定する。

ステップＳ５７において、表示制御部１３７は、撮影した画像と、外部の音声認識サーバから受信した文字列を表示出力するように出力部１７−２を制御する。

ステップＳ５８において、通信制御部１３４は、投稿先ワードに対応する投稿先となるＳＮＳサーバに対して、画像データと文字列データを送信して、投稿処理を行う。また、送信に際して、投稿内容である文字列及び画像データが投稿内容情報記憶部１５２に記憶される。
その後、音声投稿処理は終了する。

従来では、アウトドアでは、ＳＮＳへの投稿が頻繁に行われるが、手順としては、例えば、（１）端末を取り出して、（２）ＳＮＳアプリケーションを起動して、（３）文字入力して、（４）カメラアプリケーションを起動して、（５）撮影して、（６）投稿ボタンを押して、などの操作で行われており、多くの操作等を要するものであった。
本機能においては、リスト端末１へ音声入力するだけで、素早く、撮影、文字入力、投稿が一体化して行われるような本機能を実装することで、「より簡単に、より素早く」投稿でき、新しいユーザ体験につなげることができる。

以上のように構成される撮影端末２は、撮影制御部１３３と、入力検出部１３２と、撮影制御部１３３と、通信制御部１３４と、を備える。
撮影制御部１３３は、画像を取得する。
入力検出部１３２は、ユーザから発せられる所定の音声を取得する。
撮影制御部１３３は、入力検出部１３２により取得された所定の音声と同じ音声に基づいて、画像を取得するように制御する。
通信制御部１３４は、入力検出部１３２により取得された所定の音声と同じ音声の内容に応じて予め設定された記憶先に、画像を保存させる制御を行う。
これにより、撮影端末２においては、音声の入力によって画像を取得して、入力された所定の音声と同じ音声の内容に応じた記憶先に、当該画像を保存する制御を行うために、煩雑な作業なしで、撮影された写真を簡単に適切な場所へアップロードすることができる。

通信制御部１３４は、所定の音声と同じ音声を文字情報に変換する制御を行う指示を送信するように通信部１９−３を制御する。
通信制御部１３４は、画像と共に文字情報を保存する制御を行う。
これにより、撮影端末２においては、１の音声入力で画像と文字情報を保存することができ、煩雑な作業なしで、簡単に適切な場所へアップロードすることができる。

また、撮影端末２は、投稿先設定部１３１をさらに備える。
投稿先設定部１３１は、入力検出部１３２によって取得される所定の音声と同じ音声の内容と、記憶先とを対応させて設定する。
通信制御部１３４は、入力検出部１３２により取得された所定の音声と同じ音声の内容に対応した投稿先設定部１３１により設定された記憶先に保存させる指示を送信するように通信部１９−３を制御する。
これにより、撮影端末２においては、ユーザによって予め所定の音声と同じ音声の内容に対応した記憶先を任意に設定することができる。

記憶先に対応付けられる所定の音声と同じ音声の内容は、記憶先に関連するキーワードである。
これにより、撮影端末２においては、所定の音声と同じ音声の内容が記憶先に関連するキーワードであるために、記憶先を想起しやすく、簡単に意図した記憶先を指定することができる。

記憶先に対応付けられる所定の音声と同じ音声の内容は、所定の音声と同じ音声の末尾の内容である。
これにより、撮影端末２においては、所定の音声と同じ音声の内容が音声の末尾の内容であるために、音声を入力するユーザは、記憶先を指定する思考でイメージや感想を妨げにくくなり、より直感的に音声を発しやすくなる。

また、撮影端末２は、撮像部２１−２をさらに備える。
撮影制御部１３３は、入力検出部１３２により取得された特定の音声の内容で撮影を行うように撮像部２１−２を制御し、撮像部２１−２により撮影された画像を取得する。
これにより、撮影端末２においては、煩雑な作業なしで、撮影された写真を簡単に適切な場所へアップロードすることができる。

撮影制御部１３３は、セルフタイマ撮影を行うように撮像部２１−２を制御する。
これにより、撮影端末２においては、セルフタイマ撮影により、音声入力から所定時間後に撮影が行われることが保証されるために、ユーザが撮影のタイミングを認識しやすくなる。

また、撮影端末２は、ユーザの音声を入力する入力部１６−２をさらに備える。
入力検出部１３２は、入力部１６−２によって入力された音声を取得する。
これにより、撮影端末２においては、自己のマイク等の入力部１６−２に音声を入力させることができ、より簡単に操作を行うことができる。

記憶先は、当該電子機器の外部に設けられる。
これにより、撮影端末２においては、外部の記憶先に簡単に画像等を記憶させることができる。

記憶先は、ウェブ上のストレージサーバ又はＳＮＳが提供するサーバである。
これにより、撮影端末２においては、ウェブ上のストレージサーバ又はＳＮＳが提供するサーバに簡単にアップロードすることができる。

以上のように構成される投稿システムＳは、リスト端末１と撮影端末２とからなる。
リスト端末１は、入力検出部５２と、通信部１９−１と、通信制御部５３と、を備える。
入力検出部５２は、ユーザから発せられる音声を取得する。
通信部１９−１は、入力検出部５２によって取得された音声に基づいて被写体を撮影する撮影指示を撮影端末２に送信する。
通信部１９−１は、撮影指示に基づいて撮影端末２で撮影された画像データを撮影端末２から受信する。
通信制御部５３は、入力検出部５２により取得された音声の内容に応じて予め設定された記憶先に、画像を保存させる制御を行う。
撮影端末２は、撮像部２１−２と、通信部１９−２と、を備える。
通信部１９−２は、リスト端末１の通信部１９−１から送信される撮影指示を受信する。
撮影制御部１３３は、通信部１９−２で受信された撮影指示に基づいて、被写体を撮影するように撮像部２１−２を制御する。
通信部１９−２は、画像データをリスト端末１に送信する。
これにより、撮影端末２においては、音声の入力によって画像を取得して、入力された音声の内容に応じた記憶先に、当該画像を保存する制御を行うために、煩雑な作業なしで、撮影された写真を簡単に適切な場所へアップロードすることができる。

なお、本発明は、上述の実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものである。

上述の実施形態では、音声認識を外部の音声認識サーバで行っていたが、音声認識機能を搭載して、自機で音声認識に係る処理を行うように構成してもよい。また、音声認識結果に特定の文字列が含まれていた場合に、撮影を行うように構成してもよい。これにより、音声が入力されたことを契機に撮影する場合に比べて、即時性は低下するが、特定の文字列が含まれていない場合には撮影は行われないために、無駄な撮影を行わなくてよくなる。

また、上述の実施形態では、異なる外部の記憶先に記憶させるように構成したいが、さらに細かく、内部／外部に関わらず異なる記憶場所（フォルダ等）とする制御を行うように構成してもよい。

また、上述の実施形態では、特定の文字列である末尾の音声内容も投稿内容に含めたが、末尾の音声内容を除いた部分を投稿内容としてもよい。また、特定の文字列を末尾としたが、これに限られず、先頭、意味のある音声内容（例えば、単語）間、任意の特定の場所、単に音声内容に一部に含まれているように構成してもよい。

また、上述の実施形態では、末尾の特定の文字列は記憶先となる投稿先を直接的に又は間接的に想起させるような投稿先に関連したキーワード、即ち「なう」や「いいね」が設定されているが、ユーザがこれらの文字列を自由に設定できるようにしても良い。

また、上述した実施形態では、音声内容が任意の文字列＋末尾に特定の文字列という構成で画像とテキストの投稿が行われるように構成したが、例えば、「なう」や「いいね」の特定の文字列のみであった場合には、画像のみで投稿を行う（対応する記憶先に記憶させる）ように構成してもよい。この場合において、特定の文字列も画像と共に投稿させる（対応する記憶先に記憶させる）ように構成してもよい。

また、上述した実施形態では、入力された音声の全てを用いて判断するように構成したが、入力された音声の一部を用いるように構成してもよい。例えば、特定の文字列が末尾にある場合には、末尾の直前の文字列のみを用いるように構成してもよい。

また、上述した実施形態では、音声認識を行ってテキストレベルで音声内容を比較判断するように構成したが、例えば、入力された音声と、予め記憶されている音声データを比較して判断するように構成してもよい。この場合、単純に音声内容の一致不一致を判断してもよいし、セキュリティの向上を目的として、音声内容と声紋レベルでの一致不一致を判断してもよい。また、投稿内容をテキストに代えて、音声ファイルで行うように構成してもよい。

また、上述の実施形態では、本発明が適用されるリスト端末１、撮影端末２及び携帯端末３は、スマートウォッチ、デジタルカメラ、スマートフォンを例として説明したが、特にこれに限定されない。
例えば、本発明は、音声投稿処理機能を有する電子機器一般に適用することができる。具体的には、例えば、本発明は、ノート型のパーソナルコンピュータ、プリンタ、テレビジョン受像機、ビデオカメラ、携帯型ナビゲーション装置、携帯電話機、ポータブルゲーム機等に適用可能である。

上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。
換言すると、図７、８、９及び１５の機能的構成は例示に過ぎず、特に限定されない。即ち、上述した一連の処理を全体として実行できる機能がリスト端末１、撮影端末２及び携帯端末３に備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは特に図７、８、９及び１５の例に限定されない。
また、１つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェア単体で構成してもよいし、それらの組み合わせで構成してもよい。

一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされる。
コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えば汎用のパーソナルコンピュータであってもよい。

このようなプログラムを含む記録媒体は、ユーザにプログラムを提供するために装置本体とは別に配布される図４、５、６及び１４のリムーバブルメディア３１−１，３１−２，３１−３により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される記録媒体等で構成される。リムーバブルメディア３１−１，３１−２，３１−３は、例えば、磁気ディスク（フロッピディスクを含む）、光ディスク、又は光磁気ディスク等により構成される。光ディスクは、例えば、ＣＤ−ＲＯＭ（ＣｏｍｐａｃｔＤｉｓｋ−ＲｅａｄＯｎｌｙＭｅｍｏｒｙ），ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋ），Ｂｌｕ−ｒａｙ（登録商標）Ｄｉｓｃ（ブルーレイディスク）等により構成される。光磁気ディスクは、ＭＤ（Ｍｉｎｉ−Ｄｉｓｋ）等により構成される。また、装置本体に予め組み込まれた状態でユーザに提供される記録媒体は、例えば、プログラムが記録されている図４、５、６及び１４のＲＯＭ１２−１，１２−２，１２−３や、図４、５、６及び１４の記憶部１８−１，１８−２，１８−３に含まれるハードディスク等で構成される。

なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的或いは個別に実行される処理をも含むものである。
また、本明細書において、システムの用語は、複数の装置や複数の手段などより構成される全体的な装置を意味するものとする。

以上、本発明のいくつかの実施形態について説明したが、これらの実施形態は、例示に過ぎず、本発明の技術的範囲を限定するものではない。本発明はその他の様々な実施形態を取ることが可能であり、さらに、本発明の要旨を逸脱しない範囲で、省略や置換等種々の変更を行うことができる。これら実施形態やその変形は、本明細書等に記載された発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。

以下に、本願の出願当初の特許請求の範囲に記載された発明を付記する。
［付記１］
画像を取得する画像取得手段と、
ユーザから発せられる所定の音声を取得する音声取得手段と、
前記音声取得手段により取得された前記所定の音声と同じ音声に基づいて、前記画像を取得するように前記画像取得手段を制御する画像取得制御手段と、
前記音声取得手段により取得された前記所定の音声と同じ音声の内容に応じて予め設定された記憶先に、前記画像を保存させる制御を行う保存制御手段と、
を備えることを特徴とする電子機器。
［付記２］
前記所定の音声と同じ音声を文字情報に変換する制御を行う音声変換制御手段をさらに備え、
前記保存制御手段は、前記画像と共に前記文字情報を保存する制御を行う、
ことを特徴とする付記１に記載の電子機器。
［付記３］
前記音声取得手段によって取得される前記所定の音声と同じ音声の内容と、前記記憶先とを対応させて設定する記憶先設定手段をさらに備え、
前記保存制御手段は、前記音声取得手段により取得された前記所定の音声と同じ音声の内容に対応した前記記憶先設定手段により設定された前記記憶先に保存させる、
ことを特徴とする付記１又は２に記載の電子機器。
［付記４］
前記記憶先に対応付けられる前記所定の音声と同じ音声の内容は、前記記憶先に関連するキーワードである、
ことを特徴とする付記１乃至３の何れか１つに記載の電子機器。
［付記５］
前記記憶先に対応付けられる前記所定の音声と同じ音声の内容は、前記所定の音声と同じ音声の末尾の内容である、
ことを特徴とする付記１乃至４の何れか１つに記載の電子機器。
［付記６］
撮影手段と、
前記撮影手段を制御する撮影制御手段と、をさらに備え、
前記撮影制御手段は、前記音声取得手段により取得された所定の音声と同じ音声に基づいて撮影を行うように前記撮影手段を制御し、
前記画像取得手段は、前記撮影手段により撮影された画像を取得する、
ことを特徴とする付記１乃至５の何れか１つに記載の電子機器。
［付記７］
前記撮影制御手段は、セルフタイマ撮影を行うように前記撮影手段を制御する、
ことを特徴とする付記６に記載の電子機器。
［付記８］
ユーザの所定の音声を入力する音声入力手段をさらに備え、
前記音声取得手段は、前記音声入力手段によって入力された所定の音声を取得する、
ことを特徴とする付記１乃至７の何れか１つに記載の電子機器。
［付記９］
前記記憶先は、当該電子機器の外部に設けられる、
ことを特徴とする付記１乃至８の何れか１つに記載の電子機器。
［付記１０］
前記記憶先は、ウェブ上のストレージサーバ又はＳＮＳ（ＳｏｃｉａｌＮｅｔｗｏｒｋｉｎｇｓｅｒｖｉｃｅ）が提供するサーバである、
ことを特徴とする付記１乃至９の何れか１つに記載の電子機器。
［付記１１］
第一の装置と第二の装置とからなるシステムであって、
前記第一の装置は、
ユーザから発せられる所定の音声を取得する音声取得手段と、
前記音声取得手段によって取得された前記所定の音声と同じ音声に基づいて被写体を撮影する撮影指示を前記第二の装置に送信する第一の送信手段と、
前記撮影指示に基づいて前記第二の装置で撮影された画像データを前記第二の装置から受信する第一の受信手段と、
前記音声取得手段により取得された前記所定の音声と同じ音声の内容に応じて予め設定された記憶先に、前記画像を保存させる制御を行う保存制御手段と、
を備え、
前記第二の装置は、
撮影手段と、
前記第一の装置の前記第一の送信手段から送信される前記撮影指示を受信する第二の受信手段と、
前記第二の受信手段で受信された前記撮影指示に基づいて、被写体を撮影するように前記撮影手段を制御する撮影制御手段と、
前記画像データを前記第一の装置に送信する第二の送信手段と、
を備える、
ことを特徴とするシステム。
［付記１２］
画像を取得する画像取得ステップと、
ユーザから発せられる所定の音声を取得する音声取得ステップと、
前記音声取得ステップにより取得された前記所定の音声と同じ音声に基づいて、前記画像を取得するように前記画像取得ステップを制御する画像取得制御ステップと、
前記音声取得ステップにより取得された前記所定の音声と同じ音声の内容に応じて予め設定された記憶先に、前記画像を保存させる制御を行う保存制御ステップと、
を含むことを特徴とする保存制御方法。
［付記１３］
コンピュータを、
画像を取得する画像取得手段、
ユーザから発せられる音声を取得する音声取得手段、
前記音声取得手段により取得された前記所定の音声と同じ音声に基づいて、前記画像を取得するように前記画像取得手段を制御する画像取得制御手段、
前記音声取得手段により取得された前記所定の音声と同じ音声の内容に応じて予め設定された記憶先に、前記画像を保存させる制御を行う保存制御手段、
として機能させることを特徴とするプログラム。

１・・・リスト端末，２・・・撮影端末，３・・・携帯端末，１１・・・ＣＰＵ，１２・・・ＲＯＭ，１３・・・ＲＡＭ，１４・・・バス，１５・・・入出力インターフェース，１６・・・入力部，１７・・・出力部，１８・・・記憶部，１９・・・通信部，２０・・・ドライブ，２１・・・撮像部，３１・・・リムーバブルメディア，５１・・・投稿先設定部，５２・・・入力検出部，５３・・・通信制御部，５４・・・文字列解析部，５５・・・投稿先決定部，５６・・・表示制御部，７１・・・投稿先記憶部，７２・・・投稿内容記憶部，９１・・・通信制御部，９２・・・撮影制御部，１１１・・・通信制御部，１３１・・・投稿先設定部，１３２・・・入力検出部，１３３・・・撮影制御部，１３４・・・通信制御部，１３５・・・文字列解析部，１３６・・・投稿先決定部，１３７・・・表示制御部，１５１・・・投稿先記憶部，１５１・・・投稿内容記憶部，Ｓ・・・投稿システム

Claims

画像を取得する画像取得手段と、
ユーザから発せられる所定の音声を取得する音声取得手段と、
前記所定の音声と同じ音声を文字情報に変換する制御を行う音声変換制御手段と、
前記変換された前記文字情報の内容に対応付けられて予め設定された記憶先に、前記画像と共に前記文字情報を保存させる制御を行う保存制御手段と、
を備えることを特徴とする電子機器。
前記音声取得手段により取得された前記所定の音声と同じ音声に基づいて、前記画像を取得するように前記画像取得手段を制御する画像取得制御手段と、を備え、
前記保存制御手段は、前記画像取得制御手段により取得された画像と共に前記文字情報を保存させる制御を行い、
前記所定の音声と同じ音声は、１ワードであることを特徴とする請求項１に記載の電子機器。
前記１ワードは、前記記憶先を特定し、且つ前記画像と共に保存する前記文字情報である同じ１ワードであることを特徴とする請求項２に記載の電子機器。
前記音声取得手段によって取得される前記所定の音声と同じ音声の内容と、前記記憶先とを対応させて設定する記憶先設定手段をさらに備え、
前記保存制御手段は、前記音声取得手段により取得された前記所定の音声と同じ音声の内容に対応した前記記憶先設定手段により設定された前記記憶先に保存させる、
ことを特徴とする請求項１乃至３の何れか１項に記載の電子機器。
前記記憶先に対応付けられる前記所定の音声と同じ音声の内容は、前記記憶先に関連するキーワードである、
ことを特徴とする請求項１乃至４の何れか１項に記載の電子機器。
前記記憶先に対応付けられる前記所定の音声と同じ音声の内容は、前記所定の音声と同じ音声の末尾の内容である、
ことを特徴とする請求項１乃至５の何れか１項に記載の電子機器。
撮影手段と、
前記撮影手段を制御する撮影制御手段と、をさらに備え、
前記撮影制御手段は、前記音声取得手段により取得された所定の音声と同じ音声に基づいて撮影を行うように前記撮影手段を制御し、
前記画像取得手段は、前記撮影手段により撮影された画像を取得する、
ことを特徴とする請求項１乃至６の何れか１項に記載の電子機器。
前記撮影制御手段は、セルフタイマ撮影を行うように前記撮影手段を制御する、
ことを特徴とする請求項７に記載の電子機器。
ユーザの所定の音声を入力する音声入力手段をさらに備え、
前記音声取得手段は、前記音声入力手段によって入力された所定の音声を取得する、
ことを特徴とする請求項１乃至８の何れか１項に記載の電子機器。
前記記憶先は、当該電子機器の外部に設けられる、
ことを特徴とする請求項１乃至９の何れか１項に記載の電子機器。
前記記憶先は、ウェブ上のストレージサーバ又はＳＮＳ（ＳｏｃｉａｌＮｅｔｗｏｒｋｉｎｇｓｅｒｖｉｃｅ）が提供するサーバである、
ことを特徴とする請求項１乃至１０の何れか１項に記載の電子機器。
第一の装置と第二の装置とからなるシステムであって、
前記第一の装置は、
ユーザから発せられる所定の音声を取得する音声取得手段と、
前記音声取得手段によって取得された前記所定の音声と同じ音声に基づいて被写体を撮影する撮影指示を前記第二の装置に送信する第一の送信手段と、
前記所定の音声と同じ音声を文字情報に変換する制御を行う音声変換制御手段と、
前記撮影指示に基づいて前記第二の装置で撮影された画像データを前記第二の装置から受信する第一の受信手段と、
前記変換された前記文字情報の内容に対応付けられて予め設定された記憶先に、前記画像データと共に前記文字情報を保存させる制御を行う保存制御手段と、
を備え、
前記第二の装置は、
撮影手段と、
前記第一の装置の前記第一の送信手段から送信される前記撮影指示を受信する第二の受信手段と、
前記第二の受信手段で受信された前記撮影指示に基づいて、被写体を撮影するように前記撮影手段を制御する撮影制御手段と、
前記画像データを前記第一の装置に送信する第二の送信手段と、
を備える、
ことを特徴とするシステム。
画像を取得する画像取得ステップと、
ユーザから発せられる所定の音声を取得する音声取得ステップと、
前記所定の音声と同じ音声を文字情報に変換する制御を行う音声変換制御ステップと、
前記変換された前記文字情報の内容に対応付けられて予め設定された記憶先に、前記画像と共に前記文字情報を保存させる制御を行う保存制御ステップと、
を含むことを特徴とする保存制御方法。
コンピュータを、
画像を取得する画像取得手段、
ユーザから発せられる所定の音声を取得する音声取得手段、
前記所定の音声と同じ音声を文字情報に変換する制御を行う音声変換制御手段、
前記変換された前記文字情報の内容に対応付けられて予め設定された記憶先に、前記画像と共に前記文字情報を保存させる制御を行う保存制御手段、
として機能させることを特徴とするプログラム。