JP6634755B2 - 電子機器、システム、保存制御方法及びプログラム - Google Patents
電子機器、システム、保存制御方法及びプログラム Download PDFInfo
- Publication number
- JP6634755B2 JP6634755B2 JP2015185867A JP2015185867A JP6634755B2 JP 6634755 B2 JP6634755 B2 JP 6634755B2 JP 2015185867 A JP2015185867 A JP 2015185867A JP 2015185867 A JP2015185867 A JP 2015185867A JP 6634755 B2 JP6634755 B2 JP 6634755B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- unit
- image
- posting
- photographing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G03—PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
- G03B—APPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
- G03B17/00—Details of cameras or camera bodies; Accessories therefor
- G03B17/56—Accessories
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/27—Server based end-user applications
- H04N21/274—Storing end-user multimedia data in response to end-user request, e.g. network recorder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/62—Control of parameters via user interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/66—Remote control of cameras or camera parts, e.g. by remote control devices
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/66—Remote control of cameras or camera parts, e.g. by remote control devices
- H04N23/661—Transmitting camera control signals through networks, e.g. control via the Internet
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/765—Interface circuits between an apparatus for recording and another apparatus
- H04N5/77—Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
- H04N5/92—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N5/9201—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal
- H04N5/9202—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal the additional signal being a sound signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
- H04N7/188—Capturing isolated or intermittent images triggered by the occurrence of a predetermined event, e.g. an object reaching a predetermined position
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
Description
画像を取得する画像取得手段と、
ユーザから発せられる所定の音声を取得する音声取得手段と、
前記所定の音声と同じ音声を文字情報に変換する制御を行う音声変換制御手段と、
前記変換された前記文字情報の内容に対応付けられて予め設定された記憶先に、前記画像と共に前記文字情報を保存させる制御を行う保存制御手段と、
を備えることを特徴とする。
図1は、本発明の一実施形態に係る投稿システムのシステム構成を示すシステム構成図である。
本実施形態の投稿システムSは、図1に示すように、リスト端末1と、撮影端末2と、携帯端末3と、を含む。
本実施形態の投稿システムSでは、1の音声入力により、投稿指示と投稿内容の入力と撮影指示を行って、作成した投稿内容のテキストと、撮影した画像を、SNS(Social Networking Service)サーバに送信して投稿を行う。
リスト端末1は、音声入力を行って、撮影と入力された音声の音声認識の指示と、音声認識結果に応じた投稿先への投稿指示を携帯端末3に行う。なお、投稿内容は、音声認識結果の文字列と、撮影指示によって取得した画像である。
撮影端末2は、リスト端末1からの撮影指示に基づいて撮影を行って、画像をリスト端末1に送信する。
携帯端末3では、リスト端末1から音声認識指示に基づいて、外部の音声認識サーバから入力された音声の音声認識結果を取得してリスト端末1に送信する。また、携帯端末3では、リスト端末1からの投稿指示に基づいて、指定された投稿先となるSNSサーバに投稿内容を送信して、投稿を行う。
末尾の特定の文字列は、ユーザが任意に設定することが可能であるが、本実施形態においては、記憶先となる投稿先を直接的に又は間接的に想起させるような投稿先に関連したキーワードが設定される。さらには、投稿先で慣用的、又は公式的に使用されているワードを用いるように構成する。
即ち、入力した音声が「○○○なう」の場合に自分のアカウント(特定の投稿先)に、音声入力時に撮影した画像と共に「○○○なう」のテキストが自分のTwitter(登録商標)のアカウントに投稿されることとなる。
即ち、入力した音声が「○○○いいね」の場合に自分のアカウント(特定の投稿先)に、音声入力時に撮影した画像と共に「○○○いいね」のテキストが自分のFacebook(登録商標)のアカウントに投稿されることとなる。
また、投稿先を指定して、投稿を指示するワードを発してから、投稿内容を発するような場合、投稿内容を発するまでに興ざめしてしまう可能性があるが、この場合に比べて、投稿内容をまず発することで、身構えた感じにならずに直感的に発しやすくなりリアルタイム感も損なわない。また、投稿先と関連しており、さらに慣用的又は公式的に使用されているワードを用いることで、特定の文言を覚える必要がなくなる。
また、直感的に投稿内容のみ発して、後に、投稿内容に応じて投稿先を選択するワードを発して、投稿先を調整することも可能となる。
本実施形態の投稿システムSでは、図2の例に示すように、例えば、「頂上なう」という音声をリスト端末1に入力する(つぶやく)ことで、当該音声をトリガにして、撮影端末2でセルフタイマ撮影が行われ、携帯端末3において入力した音声の音声認識がされる。その後、音声(“つぶやき”)はテキスト化されて撮影した画像と共にリスト端末1の画面に表示される。なお、セルフタイマ時にリスト端末1を操作(タッチ操作)することで、撮影を一時停止させたり、投稿を中止させたりすることが可能に構成される。また、セルフタイマの時間設定も任意に変更可能に構成される。
最終的に、リスト端末1の画面に表示されたつぶやきと画像がSNSサーバにアップロードされて投稿され、自分のツイートとして公開される。
本実施形態の音声投稿の利用シーンは、図3に示すように、多岐に亘っており、「山」、「キャンプ」、「サイクリング」、「スキー・スノーボード」等の端末等を入力操作できないようなシーンや別動作を伴うようなシーンでより効果的に機能する。
例えば、登山しているような場合には、入力・撮影等の端末操作は、行いづらい。頂上に着いた際に、頂上に着いた旨を告知する「頂上着いたなう」との音声入力を行うことで、頂上付近の画像と、「頂上着いたなう」のテキストがTwitter(登録商標)に投稿されることになる。
また、キャンプで食事しているような場合には、入力・撮影等の端末操作を行っていると食事の感想のリアルタイム感が失われてしまう。食べてすぐに食事の感想を告知する「飯うまなう」との音声入力を行うことで、食事風景の画像と、「飯うまなう」のテキストがTwitter(登録商標)に投稿されることになる。
また、サイクリングしているような場合には、入力・撮影等の端末操作は、行いづらい。特定の場所に辿り着いた際に、現在地点の名称を告知する「しまなみ来たぜ イイネ!」との音声入力を行うことで、周りの風景の画像と、「しまなみ来たぜ イイネ!」のテキストがFacebook(登録商標)に投稿されることになる。
また、スキーやスノーボードをしている場合には、入力・撮影等の端末操作は、行いづらい。転んでいる等の特定のシーンが訪れた際に、感想を告知する「転びすぎ イイネ!」との音声入力を行うことで、特定のシーンを撮影した画像と、「転びすぎ イイネ!」のテキストがFacebook(登録商標)に投稿されることになる。
リスト端末1は、例えば、スマートウォッチとして構成される。
また、入力部16−1は、マイクで構成され、ユーザの発する音声を入力する。
撮影端末2は、例えば、デジタルカメラとして構成される。
フォーカスレンズは、イメージセンサの受光面に被写体像を結像させるレンズである。ズームレンズは、焦点距離を一定の範囲で自在に変化させるレンズである。
光学レンズ部にはまた、必要に応じて、焦点、露出、ホワイトバランス等の設定パラメータを調整する周辺回路が設けられる。
光電変換素子は、例えばCMOS(Complementary Metal Oxide Semiconductor)型の光電変換素子等から構成される。光電変換素子には、光学レンズ部から被写体像が入射される。そこで、光電変換素子は、被写体像を光電変換(撮像)して画像信号を一定時間蓄積し、蓄積した画像信号をアナログ信号としてAFEに順次供給する。
AFEは、このアナログの画像信号に対して、A/D(Analog/Digital)変換処理等の各種信号処理を実行する。各種信号処理によって、ディジタル信号が生成され、撮像部21−2の出力信号として出力される。
このような撮像部21−2の出力信号を、以下、「撮像画像のデータ」と呼ぶ。撮像画像のデータは、CPU11−2や図示しない画像処理部等に適宜供給される。
携帯端末3は、例えば、スマートフォンとして構成される。
携帯端末3のハードウェア構成(CPU11−3乃至撮像部21−3)は、上述したリスト端末1及び撮影端末2の個々のハードウェア構成が同じであるため、説明を省略する。
音声投稿処理とは、1度の音声入力によって、文字情報と音声入力時点の画像を、特定のSNSに投稿させる一連の処理をいう。
なお、本実施形態の構成は、リスト端末1にSIM(Subscriber Identity Module)カードがないような場合により有効的に機能する。
また、記憶部18−1の一領域には、投稿先記憶部71と、投稿内容情報記憶部72と、が設定される。
投稿先記憶部71には、投稿先ワードと投稿先とが対応付けられて記憶されており、投稿先への投稿に必要な投稿情報(個人アカウント又は投稿用メールアドレス等)が記憶される。具体的には、本実施形態においては、投稿先記憶部71には、投稿先ワード「なう」の場合には、投稿先をTwitter(登録商標)とし、投稿先ワード「いいね」の場合には、投稿先をFacebook(登録商標)として記憶されている。なお、投稿先ワードは、ユーザが任意に設定可能に構成される。
具体的には、入力検出部52は、ユーザから入力部16−1を介して、音声の入力が検出されたか否かを判定する。
具体的には、通信制御部53は、撮影指示を撮影端末2に送信し、音声認識指示及び音声入力によって入力された音声データを携帯端末3に送信するように通信部19−1を制御する。また、通信制御部53は、撮影端末2から撮影指示により撮影された画像を受信し、携帯端末3から音声認識結果(本実施形態においては、文字列データ)を受信するように通信部19−1を制御する。また、通信制御部53は、携帯端末3に対して、投稿先ワードに対応する投稿先及び投稿内容(出力部17−1に表示した画像と文字列)を含む投稿指示と、画像データ及び文字列データと、を送信するように通信部19−1を制御する。
具体的には、文字列解析部54は、音声認識結果の文字列を解析して、投稿ワードとなる文字列の末尾に投稿先ワードが含まれるか否かを判定する。
具体的には、通信制御部91は、リスト端末1から撮影指示を受信するように通信部19−2を制御する。また、撮影処理の結果、撮影された画像をリスト端末1に送信するように通信部19−2を制御する。
具体的には、通信制御部111は、音声認識指示及び音声認識用の音声データを受信するように通信部19−3を制御する。また、通信制御部111は、外部の音声認識サーバに対して、音声認識指示及び音声認識用の音声データを送信するように通信部19−3を制御する。また、通信制御部111は、外部の音声認識サーバから、音声認識結果を受信するように通信部19−3を制御する。また、通信制御部111は、リスト端末1に対して、音声認識結果を送信するように通信部19−3を制御する。また、通信制御部111は、リスト端末1から、投稿指示と、画像データ及び文字列データを、を受信にするように通信部19−3を制御する。また、通信制御部111は、投稿先のSNSサーバに、投稿内容である画像データ及び文字列データを送信するように通信部19−3を制御する。
なお、音声投稿用のアプリケーションを起動して、音声入力が可能な状態とすることで、音声投稿処理を開始するように構成したが、これに限られず、全ての動作を音声入力で行うように構成してもよい。例えば、音声入力に応じて、音声投稿用のアプリケーションを自動起動させて、音声入力が可能な状態にしてから、音声投稿処理を開始するように構成してもよい。
ステップS11−1において、入力検出部52は、ユーザから入力部16−1を介して、音声の入力が検出されたか否かを判定する。
音声の入力が検出されていない場合には、ステップS11−1においてNOと判定されて、待機状態となる。
音声の入力が検出された場合には、ステップS11−1においてYESと判定されて、処理はステップS12−1に進む。
その後、撮影端末2では、撮影指示を受けて、撮影処理が実行される。また、携帯端末3では、音声認識指示を受けて、インターネット等を介して、外部の音声認識サーバに音声データを送信して、音声認識を実行させる。
投稿先ワードを文字列の末尾に含んでいない場合には、ステップS14−1においてNOと判定されて、リスト端末1側の音声投稿処理は終了する。
投稿先ワードを文字列の末尾に含んでいる場合には、ステップS14−1においてYESと判定されて、処理はステップS15−1に進む。
具体的には、投稿先ワードが「なう」であった場合には、投稿先記憶部71を参照した結果、設定されているTwitter(登録商標)を投稿先として決定し、「いいね」であった場合には、Facebook(登録商標)を投稿先として決定する。
その後、リスト端末1側の音声投稿処理は終了する。
ステップS11−2において、通信制御部91は、リスト端末1から撮影指示を受信するように通信部19−2を制御する。
ステップS11−3において、通信制御部111は、音声認識指示及び音声認識用の音声データを受信するように通信部19−3を制御する。
その後、携帯端末3側の音声投稿処理は終了する。
図11は、第2の実施形態に係る投稿システムSのシステム構成を示すシステム図である。
本実施形態の投稿システムSは、第1の実施形態とは異なり、図11に示すように、音声入力機能と投稿機能を有するリスト端末1と、撮影機能を有する撮影端末2と、で構成される。なお、機能ブロックについては、第1の実施形態の図7に示すリスト端末1及び図8に示す撮影端末2と同じであるため説明及び図示を省略する。
なお、本実施形態の構成は、リスト端末1にSIMカードがあるような場合により有効的に機能する。
本実施形態の投稿システムSでは、図12の例に示すように、例えば、「頂上なう」という音声をリスト端末1に入力する(つぶやく)ことで、当該音声をトリガにして、撮影端末2でセルフタイマ撮影が行われ、携帯端末3において入力した音声の音声認識がされる。
その後、音声認識された文字列が撮影された画像と共にリスト端末1の画面に表示される。なお、ライブビュー画像をリスト端末1の画面に表示させて、所定時間経過後にタイマ表示を行って撮影するように構成してもよい。また、セルフタイマ時にリスト端末1を操作(タッチ操作)することで、撮影を一時停止させることが可能に構成される。また、セルフタイマの時間設定も任意に変更可能に構成される。
最終的に、リスト端末1の画面に表示されたつぶやきと画像がSNSにアップロードされて投稿され、自分のツイートとして公開される。なお、投稿データの送信中に、リスト端末1を操作(タッチ操作)して投稿を中止させたりするように構成してもよい。
なお、音声投稿用のアプリケーションを起動して、音声入力が可能な状態とすることで、音声投稿処理を開始するように構成したが、これに限られず、全ての動作を音声入力で行うように構成してもよい。例えば、音声入力に応じて、音声投稿用のアプリケーションを自動起動させて、音声入力が可能な状態にしてから、音声投稿処理を開始するように構成してもよい。
ステップS31−1において、入力検出部52は、ユーザから入力部16−1を介して、音声の入力が検出されたか否かを判定する。
音声の入力が検出されていない場合には、ステップS31−1においてNOと判定されて、待機状態となる。
音声の入力が検出された場合には、ステップS31−1においてYESと判定されて、処理はステップS32−1に進む。
その後、撮影端末2では、撮影指示を受けて、撮影処理が実行される。また、外部の音声認識サーバでは、音声認識が実行される。
投稿先ワードを文字列の末尾に含んでいない場合には、ステップS34−1においてNOと判定されて、リスト端末1側の音声投稿処理は終了する。
投稿先ワードを文字列の末尾に含んでいる場合には、ステップS34−1においてYESと判定されて、処理はステップS35−1に進む。
その後、リスト端末1側の音声投稿処理は終了する。
ステップS31−2において、通信制御部91は、リスト端末1から撮影指示を受信するように通信部19−2を制御する。
上述した実施形態では、複数の端末によって、音声投稿処理を実行するように構成したが、本実施形態では、撮影機能と、音声入力機能と、投稿機能とを備えた単体の端末によって音声投稿処理を実行するように構成する。本実施形態においては、デジタルカメラとして構成した撮影端末2に、撮影機能に加えて、音声入力機能及び投稿機能を備えてスタンドアロン機として構成して、音声投稿処理を実行する。
図14は、本実施形態の撮影端末2のハードウェアの構成を示すブロック図である。なお、本実施形態において追加されたハードウェア構成については、上述したリスト端末1及び携帯端末3と同じであるため、説明を省略する。
なお、音声投稿用のアプリケーションを起動して、音声入力が可能な状態とすることで、音声投稿処理を開始するように構成したが、これに限られず、全ての動作を音声入力で行うように構成してもよい。例えば、音声入力に応じて、音声投稿用のアプリケーションを自動起動させて、音声入力が可能な状態にしてから、音声投稿処理を開始するように構成してもよい。
音声の入力が検出されていない場合には、ステップS51においてNOと判定されて、待機状態となる。
音声の入力が検出された場合には、ステップS51においてYESと判定されて、処理はステップS52に進む。
その後、外部の音声認識サーバでは、音声認識が実行される。
投稿先ワードを文字列の末尾に含んでいない場合には、ステップS55においてNOと判定されて、音声投稿処理は終了する。
投稿先ワードを文字列の末尾に含んでいる場合には、ステップS55においてYESと判定されて、処理はステップS56に進む。
その後、音声投稿処理は終了する。
本機能においては、リスト端末1へ音声入力するだけで、素早く、撮影、文字入力、投稿が一体化して行われるような本機能を実装することで、「より簡単に、より素早く」投稿でき、新しいユーザ体験につなげることができる。
撮影制御部133は、画像を取得する。
入力検出部132は、ユーザから発せられる所定の音声を取得する。
撮影制御部133は、入力検出部132により取得された所定の音声と同じ音声に基づいて、画像を取得するように制御する。
通信制御部134は、入力検出部132により取得された所定の音声と同じ音声の内容に応じて予め設定された記憶先に、画像を保存させる制御を行う。
これにより、撮影端末2においては、音声の入力によって画像を取得して、入力された所定の音声と同じ音声の内容に応じた記憶先に、当該画像を保存する制御を行うために、煩雑な作業なしで、撮影された写真を簡単に適切な場所へアップロードすることができる。
通信制御部134は、画像と共に文字情報を保存する制御を行う。
これにより、撮影端末2においては、1の音声入力で画像と文字情報を保存することができ、煩雑な作業なしで、簡単に適切な場所へアップロードすることができる。
投稿先設定部131は、入力検出部132によって取得される所定の音声と同じ音声の内容と、記憶先とを対応させて設定する。
通信制御部134は、入力検出部132により取得された所定の音声と同じ音声の内容に対応した投稿先設定部131により設定された記憶先に保存させる指示を送信するように通信部19−3を制御する。
これにより、撮影端末2においては、ユーザによって予め所定の音声と同じ音声の内容に対応した記憶先を任意に設定することができる。
これにより、撮影端末2においては、所定の音声と同じ音声の内容が記憶先に関連するキーワードであるために、記憶先を想起しやすく、簡単に意図した記憶先を指定することができる。
これにより、撮影端末2においては、所定の音声と同じ音声の内容が音声の末尾の内容であるために、音声を入力するユーザは、記憶先を指定する思考でイメージや感想を妨げにくくなり、より直感的に音声を発しやすくなる。
撮影制御部133は、入力検出部132により取得された特定の音声の内容で撮影を行うように撮像部21−2を制御し、撮像部21−2により撮影された画像を取得する。
これにより、撮影端末2においては、煩雑な作業なしで、撮影された写真を簡単に適切な場所へアップロードすることができる。
これにより、撮影端末2においては、セルフタイマ撮影により、音声入力から所定時間後に撮影が行われることが保証されるために、ユーザが撮影のタイミングを認識しやすくなる。
入力検出部132は、入力部16−2によって入力された音声を取得する。
これにより、撮影端末2においては、自己のマイク等の入力部16−2に音声を入力させることができ、より簡単に操作を行うことができる。
これにより、撮影端末2においては、外部の記憶先に簡単に画像等を記憶させることができる。
これにより、撮影端末2においては、ウェブ上のストレージサーバ又はSNSが提供するサーバに簡単にアップロードすることができる。
リスト端末1は、入力検出部52と、通信部19−1と、通信制御部53と、を備える。
入力検出部52は、ユーザから発せられる音声を取得する。
通信部19−1は、入力検出部52によって取得された音声に基づいて被写体を撮影する撮影指示を撮影端末2に送信する。
通信部19−1は、撮影指示に基づいて撮影端末2で撮影された画像データを撮影端末2から受信する。
通信制御部53は、入力検出部52により取得された音声の内容に応じて予め設定された記憶先に、画像を保存させる制御を行う。
撮影端末2は、撮像部21−2と、通信部19−2と、を備える。
通信部19−2は、リスト端末1の通信部19−1から送信される撮影指示を受信する。
撮影制御部133は、通信部19−2で受信された撮影指示に基づいて、被写体を撮影するように撮像部21−2を制御する。
通信部19−2は、画像データをリスト端末1に送信する。
これにより、撮影端末2においては、音声の入力によって画像を取得して、入力された音声の内容に応じた記憶先に、当該画像を保存する制御を行うために、煩雑な作業なしで、撮影された写真を簡単に適切な場所へアップロードすることができる。
例えば、本発明は、音声投稿処理機能を有する電子機器一般に適用することができる。具体的には、例えば、本発明は、ノート型のパーソナルコンピュータ、プリンタ、テレビジョン受像機、ビデオカメラ、携帯型ナビゲーション装置、携帯電話機、ポータブルゲーム機等に適用可能である。
換言すると、図7、8、9及び15の機能的構成は例示に過ぎず、特に限定されない。即ち、上述した一連の処理を全体として実行できる機能がリスト端末1、撮影端末2及び携帯端末3に備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは特に図7、8、9及び15の例に限定されない。
また、1つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェア単体で構成してもよいし、それらの組み合わせで構成してもよい。
コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えば汎用のパーソナルコンピュータであってもよい。
また、本明細書において、システムの用語は、複数の装置や複数の手段などより構成される全体的な装置を意味するものとする。
[付記1]
画像を取得する画像取得手段と、
ユーザから発せられる所定の音声を取得する音声取得手段と、
前記音声取得手段により取得された前記所定の音声と同じ音声に基づいて、前記画像を取得するように前記画像取得手段を制御する画像取得制御手段と、
前記音声取得手段により取得された前記所定の音声と同じ音声の内容に応じて予め設定された記憶先に、前記画像を保存させる制御を行う保存制御手段と、
を備えることを特徴とする電子機器。
[付記2]
前記所定の音声と同じ音声を文字情報に変換する制御を行う音声変換制御手段をさらに備え、
前記保存制御手段は、前記画像と共に前記文字情報を保存する制御を行う、
ことを特徴とする付記1に記載の電子機器。
[付記3]
前記音声取得手段によって取得される前記所定の音声と同じ音声の内容と、前記記憶先とを対応させて設定する記憶先設定手段をさらに備え、
前記保存制御手段は、前記音声取得手段により取得された前記所定の音声と同じ音声の内容に対応した前記記憶先設定手段により設定された前記記憶先に保存させる、
ことを特徴とする付記1又は2に記載の電子機器。
[付記4]
前記記憶先に対応付けられる前記所定の音声と同じ音声の内容は、前記記憶先に関連するキーワードである、
ことを特徴とする付記1乃至3の何れか1つに記載の電子機器。
[付記5]
前記記憶先に対応付けられる前記所定の音声と同じ音声の内容は、前記所定の音声と同じ音声の末尾の内容である、
ことを特徴とする付記1乃至4の何れか1つに記載の電子機器。
[付記6]
撮影手段と、
前記撮影手段を制御する撮影制御手段と、をさらに備え、
前記撮影制御手段は、前記音声取得手段により取得された所定の音声と同じ音声に基づいて撮影を行うように前記撮影手段を制御し、
前記画像取得手段は、前記撮影手段により撮影された画像を取得する、
ことを特徴とする付記1乃至5の何れか1つに記載の電子機器。
[付記7]
前記撮影制御手段は、セルフタイマ撮影を行うように前記撮影手段を制御する、
ことを特徴とする付記6に記載の電子機器。
[付記8]
ユーザの所定の音声を入力する音声入力手段をさらに備え、
前記音声取得手段は、前記音声入力手段によって入力された所定の音声を取得する、
ことを特徴とする付記1乃至7の何れか1つに記載の電子機器。
[付記9]
前記記憶先は、当該電子機器の外部に設けられる、
ことを特徴とする付記1乃至8の何れか1つに記載の電子機器。
[付記10]
前記記憶先は、ウェブ上のストレージサーバ又はSNS(Social Networking service)が提供するサーバである、
ことを特徴とする付記1乃至9の何れか1つに記載の電子機器。
[付記11]
第一の装置と第二の装置とからなるシステムであって、
前記第一の装置は、
ユーザから発せられる所定の音声を取得する音声取得手段と、
前記音声取得手段によって取得された前記所定の音声と同じ音声に基づいて被写体を撮影する撮影指示を前記第二の装置に送信する第一の送信手段と、
前記撮影指示に基づいて前記第二の装置で撮影された画像データを前記第二の装置から受信する第一の受信手段と、
前記音声取得手段により取得された前記所定の音声と同じ音声の内容に応じて予め設定された記憶先に、前記画像を保存させる制御を行う保存制御手段と、
を備え、
前記第二の装置は、
撮影手段と、
前記第一の装置の前記第一の送信手段から送信される前記撮影指示を受信する第二の受信手段と、
前記第二の受信手段で受信された前記撮影指示に基づいて、被写体を撮影するように前記撮影手段を制御する撮影制御手段と、
前記画像データを前記第一の装置に送信する第二の送信手段と、
を備える、
ことを特徴とするシステム。
[付記12]
画像を取得する画像取得ステップと、
ユーザから発せられる所定の音声を取得する音声取得ステップと、
前記音声取得ステップにより取得された前記所定の音声と同じ音声に基づいて、前記画像を取得するように前記画像取得ステップを制御する画像取得制御ステップと、
前記音声取得ステップにより取得された前記所定の音声と同じ音声の内容に応じて予め設定された記憶先に、前記画像を保存させる制御を行う保存制御ステップと、
を含むことを特徴とする保存制御方法。
[付記13]
コンピュータを、
画像を取得する画像取得手段、
ユーザから発せられる音声を取得する音声取得手段、
前記音声取得手段により取得された前記所定の音声と同じ音声に基づいて、前記画像を取得するように前記画像取得手段を制御する画像取得制御手段、
前記音声取得手段により取得された前記所定の音声と同じ音声の内容に応じて予め設定された記憶先に、前記画像を保存させる制御を行う保存制御手段、
として機能させることを特徴とするプログラム。
Claims (14)
- 画像を取得する画像取得手段と、
ユーザから発せられる所定の音声を取得する音声取得手段と、
前記所定の音声と同じ音声を文字情報に変換する制御を行う音声変換制御手段と、
前記変換された前記文字情報の内容に対応付けられて予め設定された記憶先に、前記画像と共に前記文字情報を保存させる制御を行う保存制御手段と、
を備えることを特徴とする電子機器。 - 前記音声取得手段により取得された前記所定の音声と同じ音声に基づいて、前記画像を取得するように前記画像取得手段を制御する画像取得制御手段と、を備え、
前記保存制御手段は、前記画像取得制御手段により取得された画像と共に前記文字情報を保存させる制御を行い、
前記所定の音声と同じ音声は、1ワードであることを特徴とする請求項1に記載の電子機器。 - 前記1ワードは、前記記憶先を特定し、且つ前記画像と共に保存する前記文字情報である同じ1ワードであることを特徴とする請求項2に記載の電子機器。
- 前記音声取得手段によって取得される前記所定の音声と同じ音声の内容と、前記記憶先とを対応させて設定する記憶先設定手段をさらに備え、
前記保存制御手段は、前記音声取得手段により取得された前記所定の音声と同じ音声の内容に対応した前記記憶先設定手段により設定された前記記憶先に保存させる、
ことを特徴とする請求項1乃至3の何れか1項に記載の電子機器。 - 前記記憶先に対応付けられる前記所定の音声と同じ音声の内容は、前記記憶先に関連するキーワードである、
ことを特徴とする請求項1乃至4の何れか1項に記載の電子機器。 - 前記記憶先に対応付けられる前記所定の音声と同じ音声の内容は、前記所定の音声と同じ音声の末尾の内容である、
ことを特徴とする請求項1乃至5の何れか1項に記載の電子機器。 - 撮影手段と、
前記撮影手段を制御する撮影制御手段と、をさらに備え、
前記撮影制御手段は、前記音声取得手段により取得された所定の音声と同じ音声に基づいて撮影を行うように前記撮影手段を制御し、
前記画像取得手段は、前記撮影手段により撮影された画像を取得する、
ことを特徴とする請求項1乃至6の何れか1項に記載の電子機器。 - 前記撮影制御手段は、セルフタイマ撮影を行うように前記撮影手段を制御する、
ことを特徴とする請求項7に記載の電子機器。 - ユーザの所定の音声を入力する音声入力手段をさらに備え、
前記音声取得手段は、前記音声入力手段によって入力された所定の音声を取得する、
ことを特徴とする請求項1乃至8の何れか1項に記載の電子機器。 - 前記記憶先は、当該電子機器の外部に設けられる、
ことを特徴とする請求項1乃至9の何れか1項に記載の電子機器。 - 前記記憶先は、ウェブ上のストレージサーバ又はSNS(Social Networking service)が提供するサーバである、
ことを特徴とする請求項1乃至10の何れか1項に記載の電子機器。 - 第一の装置と第二の装置とからなるシステムであって、
前記第一の装置は、
ユーザから発せられる所定の音声を取得する音声取得手段と、
前記音声取得手段によって取得された前記所定の音声と同じ音声に基づいて被写体を撮影する撮影指示を前記第二の装置に送信する第一の送信手段と、
前記所定の音声と同じ音声を文字情報に変換する制御を行う音声変換制御手段と、
前記撮影指示に基づいて前記第二の装置で撮影された画像データを前記第二の装置から受信する第一の受信手段と、
前記変換された前記文字情報の内容に対応付けられて予め設定された記憶先に、前記画像データと共に前記文字情報を保存させる制御を行う保存制御手段と、
を備え、
前記第二の装置は、
撮影手段と、
前記第一の装置の前記第一の送信手段から送信される前記撮影指示を受信する第二の受信手段と、
前記第二の受信手段で受信された前記撮影指示に基づいて、被写体を撮影するように前記撮影手段を制御する撮影制御手段と、
前記画像データを前記第一の装置に送信する第二の送信手段と、
を備える、
ことを特徴とするシステム。 - 画像を取得する画像取得ステップと、
ユーザから発せられる所定の音声を取得する音声取得ステップと、
前記所定の音声と同じ音声を文字情報に変換する制御を行う音声変換制御ステップと、
前記変換された前記文字情報の内容に対応付けられて予め設定された記憶先に、前記画像と共に前記文字情報を保存させる制御を行う保存制御ステップと、
を含むことを特徴とする保存制御方法。 - コンピュータを、
画像を取得する画像取得手段、
ユーザから発せられる所定の音声を取得する音声取得手段、
前記所定の音声と同じ音声を文字情報に変換する制御を行う音声変換制御手段、
前記変換された前記文字情報の内容に対応付けられて予め設定された記憶先に、前記画像と共に前記文字情報を保存させる制御を行う保存制御手段、
として機能させることを特徴とするプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015185867A JP6634755B2 (ja) | 2015-09-18 | 2015-09-18 | 電子機器、システム、保存制御方法及びプログラム |
KR1020160112639A KR102653751B1 (ko) | 2015-09-18 | 2016-09-01 | 전자 기기, 시스템, 보존 제어 방법 및 프로그램 |
CN201610821964.1A CN107065400B (zh) | 2015-09-18 | 2016-09-13 | 电子设备、系统以及保存控制方法 |
US15/266,858 US10230884B2 (en) | 2015-09-18 | 2016-09-15 | Electronic apparatus, system, storage control method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015185867A JP6634755B2 (ja) | 2015-09-18 | 2015-09-18 | 電子機器、システム、保存制御方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017060127A JP2017060127A (ja) | 2017-03-23 |
JP6634755B2 true JP6634755B2 (ja) | 2020-01-22 |
Family
ID=58283583
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015185867A Active JP6634755B2 (ja) | 2015-09-18 | 2015-09-18 | 電子機器、システム、保存制御方法及びプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US10230884B2 (ja) |
JP (1) | JP6634755B2 (ja) |
KR (1) | KR102653751B1 (ja) |
CN (1) | CN107065400B (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6822941B2 (ja) * | 2017-12-19 | 2021-01-27 | Kddi株式会社 | 通信端末、端末制御プログラム、端末制御方法及び通信システム |
US11902656B2 (en) * | 2022-06-29 | 2024-02-13 | Western Digital Technologies, Inc. | Audio sensors for controlling surveillance video data capture |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002189723A (ja) | 2000-12-20 | 2002-07-05 | Plaza Create Co Ltd | デジタルフォトサービスシステム |
US7343289B2 (en) * | 2003-06-25 | 2008-03-11 | Microsoft Corp. | System and method for audio/video speaker detection |
GB2405948B (en) * | 2003-09-12 | 2006-06-28 | Canon Res Ct Europ Ltd | Voice activated device |
GB2405949A (en) * | 2003-09-12 | 2005-03-16 | Canon Kk | Voice activated device with periodicity determination |
US20090247245A1 (en) * | 2004-12-14 | 2009-10-01 | Andrew Strawn | Improvements in or Relating to Electronic Headset Devices and Associated Electronic Devices |
US7697827B2 (en) * | 2005-10-17 | 2010-04-13 | Konicek Jeffrey C | User-friendlier interfaces for a camera |
JP2009027626A (ja) * | 2007-07-23 | 2009-02-05 | Canon Inc | マイクロフォン装置、撮影装置、及びリモート撮影システム |
US8958848B2 (en) * | 2008-04-08 | 2015-02-17 | Lg Electronics Inc. | Mobile terminal and menu control method thereof |
US20090262205A1 (en) * | 2008-04-21 | 2009-10-22 | Dana Stephen Smith | Voice activated headset imaging system |
JP5053950B2 (ja) * | 2008-07-29 | 2012-10-24 | キヤノン株式会社 | 情報処理方法、情報処理装置、プログラムおよび記憶媒体 |
JP4449082B2 (ja) | 2008-08-22 | 2010-04-14 | 富士フイルム株式会社 | 電子カメラ |
US8635066B2 (en) * | 2010-04-14 | 2014-01-21 | T-Mobile Usa, Inc. | Camera-assisted noise cancellation and speech recognition |
US8700392B1 (en) * | 2010-09-10 | 2014-04-15 | Amazon Technologies, Inc. | Speech-inclusive device interfaces |
JP2012100214A (ja) | 2010-11-05 | 2012-05-24 | Nikon Corp | 撮像装置、補正プログラム及び記録媒体 |
US9031847B2 (en) * | 2011-11-15 | 2015-05-12 | Microsoft Technology Licensing, Llc | Voice-controlled camera operations |
JP2014026642A (ja) * | 2012-06-19 | 2014-02-06 | Seiko Epson Corp | 駐車場システム |
CN104429049B (zh) * | 2012-07-18 | 2016-11-16 | 华为技术有限公司 | 具有用于立体声录音的麦克风的便携式电子装置 |
KR101992676B1 (ko) * | 2012-07-26 | 2019-06-25 | 삼성전자주식회사 | 영상 인식을 이용하여 음성 인식을 하는 방법 및 장치 |
WO2014025012A1 (ja) * | 2012-08-10 | 2014-02-13 | 株式会社ホンダアクセス | 音声認識方法及び音声認識装置 |
KR20140075997A (ko) * | 2012-12-12 | 2014-06-20 | 엘지전자 주식회사 | 이동 단말기 및 이동 단말기의 제어 방법 |
US20140267742A1 (en) * | 2013-03-15 | 2014-09-18 | William F. Tapia | Camera with remote watch |
US9747900B2 (en) * | 2013-05-24 | 2017-08-29 | Google Technology Holdings LLC | Method and apparatus for using image data to aid voice recognition |
JP2015115911A (ja) * | 2013-12-16 | 2015-06-22 | 株式会社日立システムズ | 行動記録装置、入出力装置、行動記録プログラムおよび行動記録方法 |
EP2899609B1 (en) * | 2014-01-24 | 2019-04-17 | Sony Corporation | System and method for name recollection |
KR20160034065A (ko) * | 2014-09-19 | 2016-03-29 | 엘지전자 주식회사 | 이동 단말기 및 그 제어 방법 |
CN104853101A (zh) * | 2015-05-18 | 2015-08-19 | 牟肇健 | 基于语音的智能化即时命名拍照技术 |
-
2015
- 2015-09-18 JP JP2015185867A patent/JP6634755B2/ja active Active
-
2016
- 2016-09-01 KR KR1020160112639A patent/KR102653751B1/ko active IP Right Grant
- 2016-09-13 CN CN201610821964.1A patent/CN107065400B/zh active Active
- 2016-09-15 US US15/266,858 patent/US10230884B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN107065400B (zh) | 2019-12-03 |
US10230884B2 (en) | 2019-03-12 |
CN107065400A (zh) | 2017-08-18 |
JP2017060127A (ja) | 2017-03-23 |
US20170085772A1 (en) | 2017-03-23 |
KR20170034315A (ko) | 2017-03-28 |
KR102653751B1 (ko) | 2024-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI464513B (zh) | 無線通訊系統、可攜式電子裝置以及遠端閃光源控制方法 | |
US10321091B2 (en) | Information processing device and method of information processing | |
JPWO2017047012A1 (ja) | 撮像装置および撮像装置とサーバとを含むシステム | |
BRPI0903881B1 (pt) | Dispositivo de processamento de informação, método de processamento de informação, e, meio de armazenagem armazenando um programa de computador | |
US9601158B2 (en) | Moving image selection apparatus for selecting moving image to be combined, moving image selection method, and storage medium | |
JP6634755B2 (ja) | 電子機器、システム、保存制御方法及びプログラム | |
US9674437B2 (en) | Imaging apparatus, imaging method and computer readable recording medium having program for performing interval shooting | |
US20160088219A1 (en) | Image capture apparatus which controls frame rate based on motion of object, information transmission apparatus, image capture control method, information transmission method, and recording medium | |
US9313472B2 (en) | Image capture apparatus that photographs a specific subject, a communication method, a storage medium and a communication system | |
JP2014187551A (ja) | 画像取得装置、画像取得方法及びプログラム | |
JP2014122978A (ja) | 撮像装置、音声認識方法、及びプログラム | |
JP6679409B2 (ja) | 撮像装置、遠隔制御装置、制御方法及びプログラム並びに記憶媒体 | |
JP2019068203A (ja) | サーバ装置、配信システム、配信方法及びプログラム | |
JP7365793B2 (ja) | 撮像装置およびその制御方法、プログラム | |
JP6357922B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP6617396B2 (ja) | 撮像装置、及び撮像方法 | |
JP2018056776A (ja) | 撮像装置、撮影システム、電源管理方法及びプログラム | |
JP6446842B2 (ja) | 撮像装置、撮影制御システム、撮影制御方法及びプログラム | |
JP2016010085A (ja) | 撮像装置 | |
JP5746105B2 (ja) | 情報機器及び情報表示方法 | |
JP2020036347A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2024005948A (ja) | 撮像装置、その制御方法及びプログラム | |
JP2013093726A (ja) | 電子カメラ | |
JP2016066994A (ja) | 撮像装置、情報送信装置、撮像制御方法、情報送信方法及びプログラム | |
JP2016015658A (ja) | 撮像装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180912 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190610 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190702 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190828 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191119 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191202 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6634755 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |