JP6634755B2 - 電子機器、システム、保存制御方法及びプログラム - Google Patents

電子機器、システム、保存制御方法及びプログラム Download PDF

Info

Publication number
JP6634755B2
JP6634755B2 JP2015185867A JP2015185867A JP6634755B2 JP 6634755 B2 JP6634755 B2 JP 6634755B2 JP 2015185867 A JP2015185867 A JP 2015185867A JP 2015185867 A JP2015185867 A JP 2015185867A JP 6634755 B2 JP6634755 B2 JP 6634755B2
Authority
JP
Japan
Prior art keywords
voice
unit
image
posting
photographing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015185867A
Other languages
English (en)
Other versions
JP2017060127A (ja
Inventor
岡田 健
岡田  健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2015185867A priority Critical patent/JP6634755B2/ja
Priority to KR1020160112639A priority patent/KR102653751B1/ko
Priority to CN201610821964.1A priority patent/CN107065400B/zh
Priority to US15/266,858 priority patent/US10230884B2/en
Publication of JP2017060127A publication Critical patent/JP2017060127A/ja
Application granted granted Critical
Publication of JP6634755B2 publication Critical patent/JP6634755B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B17/00Details of cameras or camera bodies; Accessories therefor
    • G03B17/56Accessories
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/27Server based end-user applications
    • H04N21/274Storing end-user multimedia data in response to end-user request, e.g. network recorder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/62Control of parameters via user interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • H04N23/661Transmitting camera control signals through networks, e.g. control via the Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N5/9201Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal
    • H04N5/9202Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal the additional signal being a sound signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/188Capturing isolated or intermittent images triggered by the occurrence of a predetermined event, e.g. an object reaching a predetermined position
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols

Description

本発明は、電子機器、システム、保存制御方法及びプログラムに関する。
従来より、例えば、撮影制御を手操作ではなく、音声で行うカメラの技術がある(特許文献1・2参照)。また、撮影した写真をWeb上の所定サーバにアップロードする技術がある。それを利用したSNSなどのサービスもある(特許文献3参照)。
特開2012−100214号公報 特開2009−10987号公報 特開2002−189723号公報
SNSなどのWeb上のサーバに写真をアップロードする際には、写真撮影が完了したのち、撮影装置または写真が保存されているメモリを有する装置で専用アプリケーションを起動させて、保存された写真の中から目的の写真を選択して、アップロード先を選択して、写真をウェブ上にアップロードするといった煩雑な作業が必要となる。
本発明は、このような状況に鑑みてなされたものであり、煩雑な作業なしで、写真を撮影して、その撮影された写真を簡単に適切な場所へアップロードすることができることを目的とする。
上記目的を達成するため、本発明の一態様の電子機器は、
画像を取得する画像取得手段と、
ユーザから発せられる所定の音声を取得する音声取得手段と、
記所定の音声と同じ音声を文字情報に変換する制御を行う音声変換制御手段と、
前記変換された前記文字情報の内容に対応付けられて予め設定された記憶先に、前記画像と共に前記文字情報を保存させる制御を行う保存制御手段と、
を備えることを特徴とする。
本発明によれば、煩雑な作業なしで、撮影された写真を簡単に適切な場所へアップロードすることができる。
本発明の一実施形態に係る投稿システムのシステム構成を示すシステム構成図である。 本実施形態の投稿システムで実行される音声投稿を説明するための模式図である。 本実施形態の音声投稿の利用シーンを示す模式図である。 本実施形態の投稿システムのリスト端末のハードウェアの構成を示すブロック図である。 本実施形態の投稿システムの撮影端末のハードウェアの構成を示すブロック図である。 本実施形態の投稿システムの携帯端末のハードウェアの構成を示すブロック図である。 図4のリスト端末の機能的構成のうち、音声投稿処理を実行するための機能的構成を示す機能ブロック図である。 図5の撮影端末の機能的構成のうち、音声投稿処理を実行するための機能的構成を示す機能ブロック図である。 図6の携帯端末の機能的構成のうち、音声投稿処理を実行するための機能的構成を示す機能ブロック図である。 図7乃至9の機能的構成を有する図4のリスト端末1、図5の撮影端末及び図6の携帯端末が実行する音声投稿処理の流れを説明するフローチャートである。 第2の実施形態に係る投稿システムのシステム構成を示すシステム図である。 本実施形態の投稿システムで実行される音声投稿を説明するための模式図である。 図7及び図8の機能的構成を有する図4のリスト端末1及び図5の撮影端末が実行する音声投稿処理の流れを説明するフローチャートである。 本実施形態の撮影端末のハードウェアの構成を示すブロック図である。 図14の撮影端末の機能的構成のうち、音声投稿処理を実行するための機能的構成を示す機能ブロック図である。 図15の機能的構成を有する図14の撮影端末が実行する音声投稿処理の流れを説明するフローチャートである。
以下、本発明の実施形態について、図面を用いて説明する。
<第1の実施形態>
図1は、本発明の一実施形態に係る投稿システムのシステム構成を示すシステム構成図である。
本実施形態の投稿システムSは、図1に示すように、リスト端末1と、撮影端末2と、携帯端末3と、を含む。
本実施形態の投稿システムSでは、1の音声入力により、投稿指示と投稿内容の入力と撮影指示を行って、作成した投稿内容のテキストと、撮影した画像を、SNS(Social Networking Service)サーバに送信して投稿を行う。
投稿システムSを構成するリスト端末1は、ユーザの腕に装着して使用され、音声入力機能と、画面表示機能と、通信機能を有する。
リスト端末1は、音声入力を行って、撮影と入力された音声の音声認識の指示と、音声認識結果に応じた投稿先への投稿指示を携帯端末3に行う。なお、投稿内容は、音声認識結果の文字列と、撮影指示によって取得した画像である。
また、投稿システムSを構成する撮影端末2は、ユーザのバッグ、衣服、帽子等に装着して使用され、通信機能と、撮影機能を有する。
撮影端末2は、リスト端末1からの撮影指示に基づいて撮影を行って、画像をリスト端末1に送信する。
また、投稿システムSを構成する携帯端末3は、ユーザが携行しており、通信機能を有する。
携帯端末3では、リスト端末1から音声認識指示に基づいて、外部の音声認識サーバから入力された音声の音声認識結果を取得してリスト端末1に送信する。また、携帯端末3では、リスト端末1からの投稿指示に基づいて、指定された投稿先となるSNSサーバに投稿内容を送信して、投稿を行う。
投稿内容の画像と文字列を作成するための撮影指示及び音声認識指示と、投稿先を決定するための音声内容とは、任意の内容の後に続く音声内容全体の末尾の内容である。即ち、音声内容全体は、「任意の音声内容」+「末尾:特定の音声内容」から構成されており、投稿先を決定する音声内容は「末尾:特定の音声内容」である。入力される音声内容全体から判断せずに、末尾部分の音声内容で判断することになる。本実施形態においては、音声内容を文字列として扱い、入力された音声に対応する文字列の末尾の文字列が特定の文字列である場合(入力された音声=「任意の文字列+末尾が特定の文字列」)に、本機能が動作することになる。
末尾の特定の文字列は、ユーザが任意に設定することが可能であるが、本実施形態においては、記憶先となる投稿先を直接的に又は間接的に想起させるような投稿先に関連したキーワードが設定される。さらには、投稿先で慣用的、又は公式的に使用されているワードを用いるように構成する。
具体的には、Twitter(登録商標)の場合には、投稿したい内容と、Twitter(登録商標)において慣用されている現在何をしているのかを表す「なう」の文言を最後に発して音声入力すると、投稿内容のテキストと、音声入力した際に撮影した画像とがTwitter(登録商標)の自分のアカウントに投稿される。
即ち、入力した音声が「○○○なう」の場合に自分のアカウント(特定の投稿先)に、音声入力時に撮影した画像と共に「○○○なう」のテキストが自分のTwitter(登録商標)のアカウントに投稿されることとなる。
また、Facebook(登録商標)の場合には、投稿したい内容と、Facebook(登録商標)が公式的に設けている相手を賞賛する際に押すボタンの文言である「いいね」の文言を最後に発して音声入力すると、投稿内容のテキストと、音声入力した際に撮影した画像とがFacebook(登録商標)の自分のアカウントに投稿される。
即ち、入力した音声が「○○○いいね」の場合に自分のアカウント(特定の投稿先)に、音声入力時に撮影した画像と共に「○○○いいね」のテキストが自分のFacebook(登録商標)のアカウントに投稿されることとなる。
このように音声の末尾に投稿先を想起させるキーワードを投稿・投稿先の指定等を判断するワードとすることで、音声入力をするユーザは、気持ちや感想等の文言を発した最後に特定のワードを発すればよく、投稿・投稿先の指定等を意識して気持ちや感想等の思考を妨げることなく直感的に音声を入力することができる。
また、投稿先を指定して、投稿を指示するワードを発してから、投稿内容を発するような場合、投稿内容を発するまでに興ざめしてしまう可能性があるが、この場合に比べて、投稿内容をまず発することで、身構えた感じにならずに直感的に発しやすくなりリアルタイム感も損なわない。また、投稿先と関連しており、さらに慣用的又は公式的に使用されているワードを用いることで、特定の文言を覚える必要がなくなる。
また、直感的に投稿内容のみ発して、後に、投稿内容に応じて投稿先を選択するワードを発して、投稿先を調整することも可能となる。
図2は、本実施形態の投稿システムSで実行される音声投稿を説明するための模式図である。
本実施形態の投稿システムSでは、図2の例に示すように、例えば、「頂上なう」という音声をリスト端末1に入力する(つぶやく)ことで、当該音声をトリガにして、撮影端末2でセルフタイマ撮影が行われ、携帯端末3において入力した音声の音声認識がされる。その後、音声(“つぶやき”)はテキスト化されて撮影した画像と共にリスト端末1の画面に表示される。なお、セルフタイマ時にリスト端末1を操作(タッチ操作)することで、撮影を一時停止させたり、投稿を中止させたりすることが可能に構成される。また、セルフタイマの時間設定も任意に変更可能に構成される。
最終的に、リスト端末1の画面に表示されたつぶやきと画像がSNSサーバにアップロードされて投稿され、自分のツイートとして公開される。
図3は、本実施形態の音声投稿の利用シーンを示す模式図である。
本実施形態の音声投稿の利用シーンは、図3に示すように、多岐に亘っており、「山」、「キャンプ」、「サイクリング」、「スキー・スノーボード」等の端末等を入力操作できないようなシーンや別動作を伴うようなシーンでより効果的に機能する。
例えば、登山しているような場合には、入力・撮影等の端末操作は、行いづらい。頂上に着いた際に、頂上に着いた旨を告知する「頂上着いたなう」との音声入力を行うことで、頂上付近の画像と、「頂上着いたなう」のテキストがTwitter(登録商標)に投稿されることになる。
また、キャンプで食事しているような場合には、入力・撮影等の端末操作を行っていると食事の感想のリアルタイム感が失われてしまう。食べてすぐに食事の感想を告知する「飯うまなう」との音声入力を行うことで、食事風景の画像と、「飯うまなう」のテキストがTwitter(登録商標)に投稿されることになる。
また、サイクリングしているような場合には、入力・撮影等の端末操作は、行いづらい。特定の場所に辿り着いた際に、現在地点の名称を告知する「しまなみ来たぜ イイネ!」との音声入力を行うことで、周りの風景の画像と、「しまなみ来たぜ イイネ!」のテキストがFacebook(登録商標)に投稿されることになる。
また、スキーやスノーボードをしている場合には、入力・撮影等の端末操作は、行いづらい。転んでいる等の特定のシーンが訪れた際に、感想を告知する「転びすぎ イイネ!」との音声入力を行うことで、特定のシーンを撮影した画像と、「転びすぎ イイネ!」のテキストがFacebook(登録商標)に投稿されることになる。
図4は、本実施形態の投稿システムSのリスト端末1のハードウェアの構成を示すブロック図である。
リスト端末1は、例えば、スマートウォッチとして構成される。
リスト端末1は、CPU(Central Processing Unit)11−1と、ROM(Read Only Memory)12−1と、RAM(Random Access Memory)13−1と、バス14−1と、入出力インターフェース15−1と、入力部16−1と、出力部17−1と、記憶部18−1と、通信部19−1と、ドライブ20−1と、を備えている。
CPU11−1は、ROM12−1に記録されているプログラム、又は、記憶部18−1からRAM13−1にロードされたプログラムに従って各種の処理を実行する。
RAM13−1には、CPU11−1が各種の処理を実行する上において必要なデータ等も適宜記憶される。
CPU11−1、ROM12−1及びRAM13−1は、バス14−1を介して相互に接続されている。このバス14−1にはまた、入出力インターフェース15−1も接続されている。入出力インターフェース15−1には、入力部16−1、出力部17−1、記憶部18−1、通信部19−1及びドライブ20−1が接続されている。
入力部16−1は、タッチパネルで構成され、ユーザの指示操作に応じて各種情報を入力する。
また、入力部16−1は、マイクで構成され、ユーザの発する音声を入力する。
出力部17−1は、ディスプレイやスピーカ等で構成され、画像や音声を出力する。
記憶部18−1は、ハードディスク或いはDRAM(Dynamic Random Access Memory)等で構成され、各種画像のデータを記憶する。
通信部19−1は、インターネットを含むネットワークを介して他の装置(図示せず)との間で行う通信を制御する。また、通信部19−1は、他の端末と、Bluetooth通信(Bluetooth Legacy通信)、Wi−Fi通信可能に構成される。また、通信部19−1は、携帯電話の通信規格であるLTE(Long Term Evolution)、3G(第3世代移動通信システム)の方式で、インターネットを介して各種サーバと通信可能に構成される。
ドライブ20−1には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等よりなる、リムーバブルメディア31−1が適宜装着される。ドライブ20−1によってリムーバブルメディア31−1から読み出されたプログラムは、必要に応じて記憶部18−1にインストールされる。また、リムーバブルメディア31−1は、記憶部18−1に記憶されている画像のデータ等の各種データも、記憶部18−1と同様に記憶することができる。
図5は、本実施形態の投稿システムSの撮影端末2のハードウェアの構成を示すブロック図である。
撮影端末2は、例えば、デジタルカメラとして構成される。
撮影端末2は、図5に示すように、CPU11−2乃至撮像部21−2を備えている。撮影端末2は、リスト端末1の出力部17−1に相当するハードウェア構成を備えずに、撮像部21−2のハードウェア構成を備えていることが異なる。リスト端末1と同様のハードウェア構成であるCPU11−2乃至ドライブ20−2の説明は省略する。
撮像部21−2は、図示はしないが、光学レンズ部と、イメージセンサと、を備えている。
光学レンズ部は、被写体を撮影するために、光を集光するレンズ、例えばフォーカスレンズやズームレンズ等で構成される。
フォーカスレンズは、イメージセンサの受光面に被写体像を結像させるレンズである。ズームレンズは、焦点距離を一定の範囲で自在に変化させるレンズである。
光学レンズ部にはまた、必要に応じて、焦点、露出、ホワイトバランス等の設定パラメータを調整する周辺回路が設けられる。
イメージセンサは、光電変換素子や、AFE(Analog Front End)等から構成される。
光電変換素子は、例えばCMOS(Complementary Metal Oxide Semiconductor)型の光電変換素子等から構成される。光電変換素子には、光学レンズ部から被写体像が入射される。そこで、光電変換素子は、被写体像を光電変換(撮像)して画像信号を一定時間蓄積し、蓄積した画像信号をアナログ信号としてAFEに順次供給する。
AFEは、このアナログの画像信号に対して、A/D(Analog/Digital)変換処理等の各種信号処理を実行する。各種信号処理によって、ディジタル信号が生成され、撮像部21−2の出力信号として出力される。
このような撮像部21−2の出力信号を、以下、「撮像画像のデータ」と呼ぶ。撮像画像のデータは、CPU11−2や図示しない画像処理部等に適宜供給される。
図6は、本実施形態の投稿システムSの携帯端末3のハードウェアの構成を示すブロック図である。
携帯端末3は、例えば、スマートフォンとして構成される。
携帯端末3のハードウェア構成(CPU11−3乃至撮像部21−3)は、上述したリスト端末1及び撮影端末2の個々のハードウェア構成が同じであるため、説明を省略する。
図7は、図4のリスト端末1の機能的構成のうち、音声投稿処理を実行するための機能的構成を示す機能ブロック図である。
音声投稿処理とは、1度の音声入力によって、文字情報と音声入力時点の画像を、特定のSNSに投稿させる一連の処理をいう。
なお、本実施形態の構成は、リスト端末1にSIM(Subscriber Identity Module)カードがないような場合により有効的に機能する。
リスト端末1側の音声投稿処理を実行する場合には、図7に示すように、CPU11−1において、投稿先設定部51と、入力検出部52と、通信制御部53と、文字列解析部54と、投稿先決定部55と、表示制御部56と、が機能する。
また、記憶部18−1の一領域には、投稿先記憶部71と、投稿内容情報記憶部72と、が設定される。
投稿先記憶部71には、投稿先ワードと投稿先とが対応付けられて記憶されており、投稿先への投稿に必要な投稿情報(個人アカウント又は投稿用メールアドレス等)が記憶される。具体的には、本実施形態においては、投稿先記憶部71には、投稿先ワード「なう」の場合には、投稿先をTwitter(登録商標)とし、投稿先ワード「いいね」の場合には、投稿先をFacebook(登録商標)として記憶されている。なお、投稿先ワードは、ユーザが任意に設定可能に構成される。
投稿内容情報記憶部72には、投稿内容の文字列及び画像データが記憶される。
投稿先設定部51は、ユーザの入力部16−1等による設定操作によって、投稿先ワードと、投稿先を対応付けて、投稿先記憶部71に記憶させて、投稿先を設定する。
入力検出部52は、入力部16−1に対するユーザが発する音声の入力を検出する。
具体的には、入力検出部52は、ユーザから入力部16−1を介して、音声の入力が検出されたか否かを判定する。
通信制御部53は、撮影端末2及び携帯端末3と通信を行うように通信部19−1を制御する。
具体的には、通信制御部53は、撮影指示を撮影端末2に送信し、音声認識指示及び音声入力によって入力された音声データを携帯端末3に送信するように通信部19−1を制御する。また、通信制御部53は、撮影端末2から撮影指示により撮影された画像を受信し、携帯端末3から音声認識結果(本実施形態においては、文字列データ)を受信するように通信部19−1を制御する。また、通信制御部53は、携帯端末3に対して、投稿先ワードに対応する投稿先及び投稿内容(出力部17−1に表示した画像と文字列)を含む投稿指示と、画像データ及び文字列データと、を送信するように通信部19−1を制御する。
文字列解析部54は、音声認識結果である文字列を解析する。
具体的には、文字列解析部54は、音声認識結果の文字列を解析して、投稿ワードとなる文字列の末尾に投稿先ワードが含まれるか否かを判定する。
投稿先決定部55は、投稿先記憶部71を参照し、音声認識結果の文字列の末尾に含まれる投稿先ワードに対応する投稿先を決定する。
表示制御部56は、投稿ワードとなる文字列や投稿画像となる撮影画像を表示するように出力部17−1を制御する。出力部17−1には、投稿ワードや投稿画像が表示され、ユーザが投稿内容を把握することができる。
図8は、図5の撮影端末2の機能的構成のうち、音声投稿処理を実行するための機能的構成を示す機能ブロック図である。
撮影端末2側の音声投稿処理を実行する場合には、図8に示すように、CPU11−2において、通信制御部91と、撮影制御部92と、が機能する。
通信制御部91は、リスト端末1と通信を行うように通信部19−2を制御する。
具体的には、通信制御部91は、リスト端末1から撮影指示を受信するように通信部19−2を制御する。また、撮影処理の結果、撮影された画像をリスト端末1に送信するように通信部19−2を制御する。
撮影制御部92は、撮像処理を行うように撮像部21−2を制御する。その結果、撮影制御部92は、撮像部21−2で撮影された画像を取得する。
図9は、図6の携帯端末3の機能的構成のうち、音声投稿処理を実行するための機能的構成を示す機能ブロック図である。
携帯端末3側の音声投稿処理を実行する場合には、図9に示すように、CPU11−3において、通信制御部111が機能する。
通信制御部111は、リスト端末1、音声認識サーバ及びSNSサーバと通信を行うように通信部19−3を制御する。
具体的には、通信制御部111は、音声認識指示及び音声認識用の音声データを受信するように通信部19−3を制御する。また、通信制御部111は、外部の音声認識サーバに対して、音声認識指示及び音声認識用の音声データを送信するように通信部19−3を制御する。また、通信制御部111は、外部の音声認識サーバから、音声認識結果を受信するように通信部19−3を制御する。また、通信制御部111は、リスト端末1に対して、音声認識結果を送信するように通信部19−3を制御する。また、通信制御部111は、リスト端末1から、投稿指示と、画像データ及び文字列データを、を受信にするように通信部19−3を制御する。また、通信制御部111は、投稿先のSNSサーバに、投稿内容である画像データ及び文字列データを送信するように通信部19−3を制御する。
図10は、図7乃至9の機能的構成を有する図4のリスト端末1、図5の撮影端末2及び図6の携帯端末3が実行する音声投稿処理の流れを説明するフローチャートである。音声投稿処理の開始にあたり、投稿先設定部51により、投稿先ワードがユーザによって事前に登録されている状態、即ち、投稿先記憶部71に個人アカウント設定を含む投稿先の情報と投稿先ワードとが登録されている状態となっている。また、各端末(リスト端末1、撮影端末2、携帯端末3)の間では、互いに通信可能に接続が完了している状態となっている。また、音声投稿用のアプリケーションをユーザの操作等で起動して、音声入力が可能な状態となることで、音声投稿処理が開始される。
なお、音声投稿用のアプリケーションを起動して、音声入力が可能な状態とすることで、音声投稿処理を開始するように構成したが、これに限られず、全ての動作を音声入力で行うように構成してもよい。例えば、音声入力に応じて、音声投稿用のアプリケーションを自動起動させて、音声入力が可能な状態にしてから、音声投稿処理を開始するように構成してもよい。
[リスト端末1側の音声投稿処理]
ステップS11−1において、入力検出部52は、ユーザから入力部16−1を介して、音声の入力が検出されたか否かを判定する。
音声の入力が検出されていない場合には、ステップS11−1においてNOと判定されて、待機状態となる。
音声の入力が検出された場合には、ステップS11−1においてYESと判定されて、処理はステップS12−1に進む。
ステップS12−1において、通信制御部53は、撮影指示を撮影端末2に送信し、音声認識指示及び音声入力によって入力された音声データを携帯端末3に送信するように通信部19−1を制御する。
その後、撮影端末2では、撮影指示を受けて、撮影処理が実行される。また、携帯端末3では、音声認識指示を受けて、インターネット等を介して、外部の音声認識サーバに音声データを送信して、音声認識を実行させる。
ステップS13−1において、通信制御部53は、撮影端末2から撮影指示により撮影された画像を受信し、携帯端末3から音声認識結果(本実施形態においては、文字列データ)を受信するように通信部19−1を制御する。
ステップS14−1において、文字列解析部54は、携帯端末3から受信した文字列データを解析して、投稿先記憶部71を参照し、投稿先ワードを文字列の末尾に含んでいるか否かを判定する。具体的には、例えば、投稿ワードの末尾に「なう」や「いいね」の投稿先ワードが含まれるか否かを判定する。文字列が「頂上なう」だった場合には、投稿先ワードを末尾に含み、「頂上」又は「なう頂上」の場合には、末尾に投稿先ワードを含まないと判定される。
投稿先ワードを文字列の末尾に含んでいない場合には、ステップS14−1においてNOと判定されて、リスト端末1側の音声投稿処理は終了する。
投稿先ワードを文字列の末尾に含んでいる場合には、ステップS14−1においてYESと判定されて、処理はステップS15−1に進む。
ステップS15−1において、投稿先決定部55は、投稿先記憶部71を参照し、末尾に含まれる投稿先ワードに対応する投稿先を決定する。
具体的には、投稿先ワードが「なう」であった場合には、投稿先記憶部71を参照した結果、設定されているTwitter(登録商標)を投稿先として決定し、「いいね」であった場合には、Facebook(登録商標)を投稿先として決定する。
ステップS16−1において、表示制御部56は、撮影端末2から受信した画像と、携帯端末3から受信した文字列を表示出力するように出力部17−1を制御する。
ステップS17−1において、通信制御部53は、携帯端末3に対して、投稿先ワードに対応する投稿先及び投稿内容(出力部17−1に表示した画像と文字列)を含む投稿指示と、画像データ及び文字列データと、を送信するように通信部19−1を制御する。携帯端末3では、投稿指示を受けて、投稿先ワードに対応する投稿先となるSNSサーバに対して、受信した画像データと文字列データを送信して、投稿処理を行う。また、送信に際して、投稿内容である文字列及び画像データが投稿内容情報記憶部72に記憶される。
その後、リスト端末1側の音声投稿処理は終了する。
[撮影端末2側の音声投稿処理]
ステップS11−2において、通信制御部91は、リスト端末1から撮影指示を受信するように通信部19−2を制御する。
ステップS12−2において、撮影制御部92は、撮影処理を実行する。本実施形態の撮影処理では、セルフタイマ機能により所定時間経過後に撮影が行われる。なお、セルフタイマの間、ライブビュー画像をリスト端末1に送信するように構成してもよい。
ステップS13−2において、通信制御部91は、撮影処理の結果、撮影された画像をリスト端末1に送信するように通信部19−2を制御する。その後、撮影端末2側の音声投稿処理は終了する。
[携帯端末3側の音声投稿処理]
ステップS11−3において、通信制御部111は、音声認識指示及び音声認識用の音声データを受信するように通信部19−3を制御する。
ステップS12−3において、通信制御部111は、外部の音声認識サーバに対して、音声認識指示及び音声認識用の音声データを送信するように通信部19−3を制御する。
ステップS13−3において、通信制御部111は、外部の音声認識サーバから、音声認識結果を受信するように通信部19−3を制御する。
ステップS14−3において、通信制御部111は、リスト端末1に対して、音声認識結果を送信するように通信部19−3を制御する。
ステップS15−3において、通信制御部111は、リスト端末1から、投稿指示と、画像データ及び文字列データを、を受信にするように通信部19−3を制御する。
ステップS16−3において、通信制御部111は、投稿先のSNSサーバに、投稿内容である画像データ及び文字列データを送信するように通信部19−3を制御する。
その後、携帯端末3側の音声投稿処理は終了する。
<第2の実施形態>
図11は、第2の実施形態に係る投稿システムSのシステム構成を示すシステム図である。
本実施形態の投稿システムSは、第1の実施形態とは異なり、図11に示すように、音声入力機能と投稿機能を有するリスト端末1と、撮影機能を有する撮影端末2と、で構成される。なお、機能ブロックについては、第1の実施形態の図7に示すリスト端末1及び図8に示す撮影端末2と同じであるため説明及び図示を省略する。
なお、本実施形態の構成は、リスト端末1にSIMカードがあるような場合により有効的に機能する。
図12は、第2の実施形態の投稿システムSで実行される音声投稿を説明するための模式図である。
本実施形態の投稿システムSでは、図12の例に示すように、例えば、「頂上なう」という音声をリスト端末1に入力する(つぶやく)ことで、当該音声をトリガにして、撮影端末2でセルフタイマ撮影が行われ、携帯端末3において入力した音声の音声認識がされる。
その後、音声認識された文字列が撮影された画像と共にリスト端末1の画面に表示される。なお、ライブビュー画像をリスト端末1の画面に表示させて、所定時間経過後にタイマ表示を行って撮影するように構成してもよい。また、セルフタイマ時にリスト端末1を操作(タッチ操作)することで、撮影を一時停止させることが可能に構成される。また、セルフタイマの時間設定も任意に変更可能に構成される。
最終的に、リスト端末1の画面に表示されたつぶやきと画像がSNSにアップロードされて投稿され、自分のツイートとして公開される。なお、投稿データの送信中に、リスト端末1を操作(タッチ操作)して投稿を中止させたりするように構成してもよい。
図13は、図7及び図8の機能的構成を有する図4のリスト端末1及び図5の撮影端末2が実行する音声投稿処理の流れを説明するフローチャートである。音声投稿処理の開始にあたり、投稿先設定部51により投稿先ワードがユーザによって事前に登録されている状態、即ち、投稿先記憶部71に個人アカウント設定を含む投稿先の情報と投稿先ワードとが登録されている状態となっている。また、リスト端末1及び撮影端末2の間では、互いに通信可能に接続が完了している状態となっている。また、音声投稿用のアプリケーションをユーザの操作等で起動して、音声入力が可能な状態となることで、音声投稿処理が開始される。
なお、音声投稿用のアプリケーションを起動して、音声入力が可能な状態とすることで、音声投稿処理を開始するように構成したが、これに限られず、全ての動作を音声入力で行うように構成してもよい。例えば、音声入力に応じて、音声投稿用のアプリケーションを自動起動させて、音声入力が可能な状態にしてから、音声投稿処理を開始するように構成してもよい。
[リスト端末1側の音声投稿処理]
ステップS31−1において、入力検出部52は、ユーザから入力部16−1を介して、音声の入力が検出されたか否かを判定する。
音声の入力が検出されていない場合には、ステップS31−1においてNOと判定されて、待機状態となる。
音声の入力が検出された場合には、ステップS31−1においてYESと判定されて、処理はステップS32−1に進む。
ステップS32−1において、通信制御部53は、撮影指示を撮影端末2に送信し、音声入力によって入力された音声データを外部の音声認識サーバに送信するように通信部19−1を制御する。
その後、撮影端末2では、撮影指示を受けて、撮影処理が実行される。また、外部の音声認識サーバでは、音声認識が実行される。
ステップS33−1において、通信制御部53は、撮影端末2から撮影指示により撮影された画像を受信し、外部の音声認識サーバから音声認識結果(本実施形態においては、文字列データ)を受信するように通信部19−1を制御する。
ステップS34−1において、文字列解析部54は、外部の音声認識サーバから受信した文字列データを解析して、投稿先ワードを文字列の末尾に含んでいるか否かを判定する。
投稿先ワードを文字列の末尾に含んでいない場合には、ステップS34−1においてNOと判定されて、リスト端末1側の音声投稿処理は終了する。
投稿先ワードを文字列の末尾に含んでいる場合には、ステップS34−1においてYESと判定されて、処理はステップS35−1に進む。
ステップS35−1において、投稿先決定部55は、投稿先記憶部71を参照し、末尾に含まれる投稿先ワードに対応する投稿先を決定する。
ステップS36−1において、表示制御部56は、撮影端末2から受信した画像と、外部の音声認識サーバから受信した文字列を表示出力するように出力部17−1を制御する。
ステップS37−1において、通信制御部53は、投稿先ワードに対応する投稿先となるSNSサーバに対して、画像データと文字列データを送信するように通信部19−1を制御して、投稿処理を行う。また、送信に際して、投稿内容である文字列及び画像データが投稿内容情報記憶部72に記憶される。
その後、リスト端末1側の音声投稿処理は終了する。
[撮影端末2側の音声投稿処理]
ステップS31−2において、通信制御部91は、リスト端末1から撮影指示を受信するように通信部19−2を制御する。
ステップS32−2において、撮影制御部92は、撮影処理を実行する。本実施形態の撮影処理では、セルフタイマ機能により所定時間経過後に撮影が行われる。なお、セルフタイマの間、ライブビュー画像をリスト端末1に送信するように構成してもよい。
ステップS33−2において、通信制御部91は、撮影処理の結果、撮影された画像をリスト端末1に送信するように通信部19−2を制御する。その後、撮影端末2側の音声投稿処理は終了する。
<第3の実施形態>
上述した実施形態では、複数の端末によって、音声投稿処理を実行するように構成したが、本実施形態では、撮影機能と、音声入力機能と、投稿機能とを備えた単体の端末によって音声投稿処理を実行するように構成する。本実施形態においては、デジタルカメラとして構成した撮影端末2に、撮影機能に加えて、音声入力機能及び投稿機能を備えてスタンドアロン機として構成して、音声投稿処理を実行する。
図14は、本実施形態の撮影端末2のハードウェアの構成を示すブロック図である。なお、本実施形態において追加されたハードウェア構成については、上述したリスト端末1及び携帯端末3と同じであるため、説明を省略する。
図15は、図14の撮影端末2の機能的構成のうち、音声投稿処理を実行するための機能的構成を示す機能ブロック図である。なお、本実施形態において再構成された機能ブロック(投稿先設定部131乃至表示制御部137、投稿先記憶部151、投稿内容情報記憶部152)は、上述したリスト端末1の投稿先設定部51、入力検出部52、通信制御部53、文字列解析部54、投稿先決定部55、表示制御部56、投稿先記憶部71、投稿内容情報記憶部72及び携帯端末3の通信制御部91、撮影制御部92と同じであるため説明を省略する。
図16は、図15の機能的構成を有する図14の撮影端末2が実行する音声投稿処理の流れを説明するフローチャートである。音声投稿処理の開始にあたり、投稿先設定部131により、投稿先ワードがユーザによって事前に登録されている状態、即ち、投稿先記憶部71に個人アカウント設定を含む投稿先の情報と投稿先ワードとが登録されている状態となっている。また、音声投稿用のアプリケーションをユーザの操作等で起動して、音声入力が可能な状態となることで、音声投稿処理が開始される。
なお、音声投稿用のアプリケーションを起動して、音声入力が可能な状態とすることで、音声投稿処理を開始するように構成したが、これに限られず、全ての動作を音声入力で行うように構成してもよい。例えば、音声入力に応じて、音声投稿用のアプリケーションを自動起動させて、音声入力が可能な状態にしてから、音声投稿処理を開始するように構成してもよい。
ステップS51において、入力検出部132は、ユーザから入力部16−2を介して、音声の入力が検出されたか否かを判定する。
音声の入力が検出されていない場合には、ステップS51においてNOと判定されて、待機状態となる。
音声の入力が検出された場合には、ステップS51においてYESと判定されて、処理はステップS52に進む。
ステップS52において、撮影制御部133は、撮影処理を実行する。本実施形態の撮影処理では、セルフタイマ機能により所定時間経過後に撮影が行われる。なお、セルフタイマの間、表示制御部137は、ライブビュー画像を表示させるように出力部17−2を制御してもよい。
ステップS53において、通信制御部134は、音声入力によって入力された音声データを外部の音声認識サーバに送信するように通信部19−2を制御する。
その後、外部の音声認識サーバでは、音声認識が実行される。
ステップS54において、通信制御部134は、外部の音声認識サーバから音声認識結果(本実施形態においては、文字列データ)を受信するように通信部19−2を制御する。
ステップS55において、文字列解析部135は、外部の音声認識サーバから受信した文字列データを解析して、投稿先ワードを文字列の末尾に含んでいるか否かを判定する。
投稿先ワードを文字列の末尾に含んでいない場合には、ステップS55においてNOと判定されて、音声投稿処理は終了する。
投稿先ワードを文字列の末尾に含んでいる場合には、ステップS55においてYESと判定されて、処理はステップS56に進む。
ステップS56において、投稿先決定部136は、投稿先記憶部71を参照し、末尾に含まれる投稿先ワードに対応する投稿先を決定する。
ステップS57において、表示制御部137は、撮影した画像と、外部の音声認識サーバから受信した文字列を表示出力するように出力部17−2を制御する。
ステップS58において、通信制御部134は、投稿先ワードに対応する投稿先となるSNSサーバに対して、画像データと文字列データを送信して、投稿処理を行う。また、送信に際して、投稿内容である文字列及び画像データが投稿内容情報記憶部152に記憶される。
その後、音声投稿処理は終了する。
従来では、アウトドアでは、SNSへの投稿が頻繁に行われるが、手順としては、例えば、(1)端末を取り出して、(2)SNSアプリケーションを起動して、(3)文字入力して、(4)カメラアプリケーションを起動して、(5)撮影して、(6)投稿ボタンを押して、などの操作で行われており、多くの操作等を要するものであった。
本機能においては、リスト端末1へ音声入力するだけで、素早く、撮影、文字入力、投稿が一体化して行われるような本機能を実装することで、「より簡単に、より素早く」投稿でき、新しいユーザ体験につなげることができる。
以上のように構成される撮影端末2は、撮影制御部133と、入力検出部132と、撮影制御部133と、通信制御部134と、を備える。
撮影制御部133は、画像を取得する。
入力検出部132は、ユーザから発せられる所定の音声を取得する。
撮影制御部133は、入力検出部132により取得された所定の音声と同じ音声に基づいて、画像を取得するように制御する。
通信制御部134は、入力検出部132により取得された所定の音声と同じ音声の内容に応じて予め設定された記憶先に、画像を保存させる制御を行う。
これにより、撮影端末2においては、音声の入力によって画像を取得して、入力された所定の音声と同じ音声の内容に応じた記憶先に、当該画像を保存する制御を行うために、煩雑な作業なしで、撮影された写真を簡単に適切な場所へアップロードすることができる。
通信制御部134は、所定の音声と同じ音声を文字情報に変換する制御を行う指示を送信するように通信部19−3を制御する。
通信制御部134は、画像と共に文字情報を保存する制御を行う。
これにより、撮影端末2においては、1の音声入力で画像と文字情報を保存することができ、煩雑な作業なしで、簡単に適切な場所へアップロードすることができる。
また、撮影端末2は、投稿先設定部131をさらに備える。
投稿先設定部131は、入力検出部132によって取得される所定の音声と同じ音声の内容と、記憶先とを対応させて設定する。
通信制御部134は、入力検出部132により取得された所定の音声と同じ音声の内容に対応した投稿先設定部131により設定された記憶先に保存させる指示を送信するように通信部19−3を制御する。
これにより、撮影端末2においては、ユーザによって予め所定の音声と同じ音声の内容に対応した記憶先を任意に設定することができる。
記憶先に対応付けられる所定の音声と同じ音声の内容は、記憶先に関連するキーワードである。
これにより、撮影端末2においては、所定の音声と同じ音声の内容が記憶先に関連するキーワードであるために、記憶先を想起しやすく、簡単に意図した記憶先を指定することができる。
記憶先に対応付けられる所定の音声と同じ音声の内容は、所定の音声と同じ音声の末尾の内容である。
これにより、撮影端末2においては、所定の音声と同じ音声の内容が音声の末尾の内容であるために、音声を入力するユーザは、記憶先を指定する思考でイメージや感想を妨げにくくなり、より直感的に音声を発しやすくなる。
また、撮影端末2は、撮像部21−2をさらに備える。
撮影制御部133は、入力検出部132により取得された特定の音声の内容で撮影を行うように撮像部21−2を制御し、撮像部21−2により撮影された画像を取得する。
これにより、撮影端末2においては、煩雑な作業なしで、撮影された写真を簡単に適切な場所へアップロードすることができる。
撮影制御部133は、セルフタイマ撮影を行うように撮像部21−2を制御する。
これにより、撮影端末2においては、セルフタイマ撮影により、音声入力から所定時間後に撮影が行われることが保証されるために、ユーザが撮影のタイミングを認識しやすくなる。
また、撮影端末2は、ユーザの音声を入力する入力部16−2をさらに備える。
入力検出部132は、入力部16−2によって入力された音声を取得する。
これにより、撮影端末2においては、自己のマイク等の入力部16−2に音声を入力させることができ、より簡単に操作を行うことができる。
記憶先は、当該電子機器の外部に設けられる。
これにより、撮影端末2においては、外部の記憶先に簡単に画像等を記憶させることができる。
記憶先は、ウェブ上のストレージサーバ又はSNSが提供するサーバである。
これにより、撮影端末2においては、ウェブ上のストレージサーバ又はSNSが提供するサーバに簡単にアップロードすることができる。
以上のように構成される投稿システムSは、リスト端末1と撮影端末2とからなる。
リスト端末1は、入力検出部52と、通信部19−1と、通信制御部53と、を備える。
入力検出部52は、ユーザから発せられる音声を取得する。
通信部19−1は、入力検出部52によって取得された音声に基づいて被写体を撮影する撮影指示を撮影端末2に送信する。
通信部19−1は、撮影指示に基づいて撮影端末2で撮影された画像データを撮影端末2から受信する。
通信制御部53は、入力検出部52により取得された音声の内容に応じて予め設定された記憶先に、画像を保存させる制御を行う。
撮影端末2は、撮像部21−2と、通信部19−2と、を備える。
通信部19−2は、リスト端末1の通信部19−1から送信される撮影指示を受信する。
撮影制御部133は、通信部19−2で受信された撮影指示に基づいて、被写体を撮影するように撮像部21−2を制御する。
通信部19−2は、画像データをリスト端末1に送信する。
これにより、撮影端末2においては、音声の入力によって画像を取得して、入力された音声の内容に応じた記憶先に、当該画像を保存する制御を行うために、煩雑な作業なしで、撮影された写真を簡単に適切な場所へアップロードすることができる。
なお、本発明は、上述の実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものである。
上述の実施形態では、音声認識を外部の音声認識サーバで行っていたが、音声認識機能を搭載して、自機で音声認識に係る処理を行うように構成してもよい。また、音声認識結果に特定の文字列が含まれていた場合に、撮影を行うように構成してもよい。これにより、音声が入力されたことを契機に撮影する場合に比べて、即時性は低下するが、特定の文字列が含まれていない場合には撮影は行われないために、無駄な撮影を行わなくてよくなる。
また、上述の実施形態では、異なる外部の記憶先に記憶させるように構成したいが、さらに細かく、内部/外部に関わらず異なる記憶場所(フォルダ等)とする制御を行うように構成してもよい。
また、上述の実施形態では、特定の文字列である末尾の音声内容も投稿内容に含めたが、末尾の音声内容を除いた部分を投稿内容としてもよい。また、特定の文字列を末尾としたが、これに限られず、先頭、意味のある音声内容(例えば、単語)間、任意の特定の場所、単に音声内容に一部に含まれているように構成してもよい。
また、上述の実施形態では、末尾の特定の文字列は記憶先となる投稿先を直接的に又は間接的に想起させるような投稿先に関連したキーワード、即ち「なう」や「いいね」が設定されているが、ユーザがこれらの文字列を自由に設定できるようにしても良い。
また、上述した実施形態では、音声内容が任意の文字列+末尾に特定の文字列という構成で画像とテキストの投稿が行われるように構成したが、例えば、「なう」や「いいね」の特定の文字列のみであった場合には、画像のみで投稿を行う(対応する記憶先に記憶させる)ように構成してもよい。この場合において、特定の文字列も画像と共に投稿させる(対応する記憶先に記憶させる)ように構成してもよい。
また、上述した実施形態では、入力された音声の全てを用いて判断するように構成したが、入力された音声の一部を用いるように構成してもよい。例えば、特定の文字列が末尾にある場合には、末尾の直前の文字列のみを用いるように構成してもよい。
また、上述した実施形態では、音声認識を行ってテキストレベルで音声内容を比較判断するように構成したが、例えば、入力された音声と、予め記憶されている音声データを比較して判断するように構成してもよい。この場合、単純に音声内容の一致不一致を判断してもよいし、セキュリティの向上を目的として、音声内容と声紋レベルでの一致不一致を判断してもよい。また、投稿内容をテキストに代えて、音声ファイルで行うように構成してもよい。
また、上述の実施形態では、本発明が適用されるリスト端末1、撮影端末2及び携帯端末3は、スマートウォッチ、デジタルカメラ、スマートフォンを例として説明したが、特にこれに限定されない。
例えば、本発明は、音声投稿処理機能を有する電子機器一般に適用することができる。具体的には、例えば、本発明は、ノート型のパーソナルコンピュータ、プリンタ、テレビジョン受像機、ビデオカメラ、携帯型ナビゲーション装置、携帯電話機、ポータブルゲーム機等に適用可能である。
上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。
換言すると、図7、8、9及び15の機能的構成は例示に過ぎず、特に限定されない。即ち、上述した一連の処理を全体として実行できる機能がリスト端末1、撮影端末2及び携帯端末3に備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは特に図7、8、9及び15の例に限定されない。
また、1つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェア単体で構成してもよいし、それらの組み合わせで構成してもよい。
一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされる。
コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えば汎用のパーソナルコンピュータであってもよい。
このようなプログラムを含む記録媒体は、ユーザにプログラムを提供するために装置本体とは別に配布される図4、5、6及び14のリムーバブルメディア31−1,31−2,31−3により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される記録媒体等で構成される。リムーバブルメディア31−1,31−2,31−3は、例えば、磁気ディスク(フロッピディスクを含む)、光ディスク、又は光磁気ディスク等により構成される。光ディスクは、例えば、CD−ROM(Compact Disk−Read Only Memory),DVD(Digital Versatile Disk),Blu−ray(登録商標) Disc(ブルーレイディスク)等により構成される。光磁気ディスクは、MD(Mini−Disk)等により構成される。また、装置本体に予め組み込まれた状態でユーザに提供される記録媒体は、例えば、プログラムが記録されている図4、5、6及び14のROM12−1,12−2,12−3や、図4、5、6及び14の記憶部18−1,18−2,18−3に含まれるハードディスク等で構成される。
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的或いは個別に実行される処理をも含むものである。
また、本明細書において、システムの用語は、複数の装置や複数の手段などより構成される全体的な装置を意味するものとする。
以上、本発明のいくつかの実施形態について説明したが、これらの実施形態は、例示に過ぎず、本発明の技術的範囲を限定するものではない。本発明はその他の様々な実施形態を取ることが可能であり、さらに、本発明の要旨を逸脱しない範囲で、省略や置換等種々の変更を行うことができる。これら実施形態やその変形は、本明細書等に記載された発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
以下に、本願の出願当初の特許請求の範囲に記載された発明を付記する。
[付記1]
画像を取得する画像取得手段と、
ユーザから発せられる所定の音声を取得する音声取得手段と、
前記音声取得手段により取得された前記所定の音声と同じ音声に基づいて、前記画像を取得するように前記画像取得手段を制御する画像取得制御手段と、
前記音声取得手段により取得された前記所定の音声と同じ音声の内容に応じて予め設定された記憶先に、前記画像を保存させる制御を行う保存制御手段と、
を備えることを特徴とする電子機器。
[付記2]
前記所定の音声と同じ音声を文字情報に変換する制御を行う音声変換制御手段をさらに備え、
前記保存制御手段は、前記画像と共に前記文字情報を保存する制御を行う、
ことを特徴とする付記1に記載の電子機器。
[付記3]
前記音声取得手段によって取得される前記所定の音声と同じ音声の内容と、前記記憶先とを対応させて設定する記憶先設定手段をさらに備え、
前記保存制御手段は、前記音声取得手段により取得された前記所定の音声と同じ音声の内容に対応した前記記憶先設定手段により設定された前記記憶先に保存させる、
ことを特徴とする付記1又は2に記載の電子機器。
[付記4]
前記記憶先に対応付けられる前記所定の音声と同じ音声の内容は、前記記憶先に関連するキーワードである、
ことを特徴とする付記1乃至3の何れか1つに記載の電子機器。
[付記5]
前記記憶先に対応付けられる前記所定の音声と同じ音声の内容は、前記所定の音声と同じ音声の末尾の内容である、
ことを特徴とする付記1乃至4の何れか1つに記載の電子機器。
[付記6]
撮影手段と、
前記撮影手段を制御する撮影制御手段と、をさらに備え、
前記撮影制御手段は、前記音声取得手段により取得された所定の音声と同じ音声に基づいて撮影を行うように前記撮影手段を制御し、
前記画像取得手段は、前記撮影手段により撮影された画像を取得する、
ことを特徴とする付記1乃至5の何れか1つに記載の電子機器。
[付記7]
前記撮影制御手段は、セルフタイマ撮影を行うように前記撮影手段を制御する、
ことを特徴とする付記6に記載の電子機器。
[付記8]
ユーザの所定の音声を入力する音声入力手段をさらに備え、
前記音声取得手段は、前記音声入力手段によって入力された所定の音声を取得する、
ことを特徴とする付記1乃至7の何れか1つに記載の電子機器。
[付記9]
前記記憶先は、当該電子機器の外部に設けられる、
ことを特徴とする付記1乃至8の何れか1つに記載の電子機器。
[付記10]
前記記憶先は、ウェブ上のストレージサーバ又はSNS(Social Networking service)が提供するサーバである、
ことを特徴とする付記1乃至9の何れか1つに記載の電子機器。
[付記11]
第一の装置と第二の装置とからなるシステムであって、
前記第一の装置は、
ユーザから発せられる所定の音声を取得する音声取得手段と、
前記音声取得手段によって取得された前記所定の音声と同じ音声に基づいて被写体を撮影する撮影指示を前記第二の装置に送信する第一の送信手段と、
前記撮影指示に基づいて前記第二の装置で撮影された画像データを前記第二の装置から受信する第一の受信手段と、
前記音声取得手段により取得された前記所定の音声と同じ音声の内容に応じて予め設定された記憶先に、前記画像を保存させる制御を行う保存制御手段と、
を備え、
前記第二の装置は、
撮影手段と、
前記第一の装置の前記第一の送信手段から送信される前記撮影指示を受信する第二の受信手段と、
前記第二の受信手段で受信された前記撮影指示に基づいて、被写体を撮影するように前記撮影手段を制御する撮影制御手段と、
前記画像データを前記第一の装置に送信する第二の送信手段と、
を備える、
ことを特徴とするシステム。
[付記12]
画像を取得する画像取得ステップと、
ユーザから発せられる所定の音声を取得する音声取得ステップと、
前記音声取得ステップにより取得された前記所定の音声と同じ音声に基づいて、前記画像を取得するように前記画像取得ステップを制御する画像取得制御ステップと、
前記音声取得ステップにより取得された前記所定の音声と同じ音声の内容に応じて予め設定された記憶先に、前記画像を保存させる制御を行う保存制御ステップと、
を含むことを特徴とする保存制御方法。
[付記13]
コンピュータを、
画像を取得する画像取得手段、
ユーザから発せられる音声を取得する音声取得手段、
前記音声取得手段により取得された前記所定の音声と同じ音声に基づいて、前記画像を取得するように前記画像取得手段を制御する画像取得制御手段、
前記音声取得手段により取得された前記所定の音声と同じ音声の内容に応じて予め設定された記憶先に、前記画像を保存させる制御を行う保存制御手段、
として機能させることを特徴とするプログラム。
1・・・リスト端末,2・・・撮影端末,3・・・携帯端末,11・・・CPU,12・・・ROM,13・・・RAM,14・・・バス,15・・・入出力インターフェース,16・・・入力部,17・・・出力部,18・・・記憶部,19・・・通信部,20・・・ドライブ,21・・・撮像部,31・・・リムーバブルメディア,51・・・投稿先設定部,52・・・入力検出部,53・・・通信制御部,54・・・文字列解析部,55・・・投稿先決定部,56・・・表示制御部,71・・・投稿先記憶部,72・・・投稿内容記憶部,91・・・通信制御部,92・・・撮影制御部,111・・・通信制御部,131・・・投稿先設定部,132・・・入力検出部,133・・・撮影制御部,134・・・通信制御部,135・・・文字列解析部,136・・・投稿先決定部,137・・・表示制御部,151・・・投稿先記憶部,151・・・投稿内容記憶部,S・・・投稿システム

Claims (14)

  1. 画像を取得する画像取得手段と、
    ユーザから発せられる所定の音声を取得する音声取得手段と、
    記所定の音声と同じ音声を文字情報に変換する制御を行う音声変換制御手段と、
    前記変換された前記文字情報の内容に対応付けられて予め設定された記憶先に、前記画像と共に前記文字情報を保存させる制御を行う保存制御手段と、
    を備えることを特徴とする電子機器。
  2. 前記音声取得手段により取得された前記所定の音声と同じ音声に基づいて、前記画像を取得するように前記画像取得手段を制御する画像取得制御手段と、を備え、
    前記保存制御手段は、前記画像取得制御手段により取得された画像と共に前記文字情報を保存させる制御を行い、
    前記所定の音声と同じ音声は、1ワードであることを特徴とする請求項1に記載の電子機器。
  3. 前記1ワードは、前記記憶先を特定し、且つ前記画像と共に保存する前記文字情報である同じ1ワードであることを特徴とする請求項2に記載の電子機器。
  4. 前記音声取得手段によって取得される前記所定の音声と同じ音声の内容と、前記記憶先とを対応させて設定する記憶先設定手段をさらに備え、
    前記保存制御手段は、前記音声取得手段により取得された前記所定の音声と同じ音声の内容に対応した前記記憶先設定手段により設定された前記記憶先に保存させる、
    ことを特徴とする請求項1乃至3の何れか1項に記載の電子機器。
  5. 前記記憶先に対応付けられる前記所定の音声と同じ音声の内容は、前記記憶先に関連するキーワードである、
    ことを特徴とする請求項1乃至の何れか1項に記載の電子機器。
  6. 前記記憶先に対応付けられる前記所定の音声と同じ音声の内容は、前記所定の音声と同じ音声の末尾の内容である、
    ことを特徴とする請求項1乃至の何れか1項に記載の電子機器。
  7. 撮影手段と、
    前記撮影手段を制御する撮影制御手段と、をさらに備え、
    前記撮影制御手段は、前記音声取得手段により取得された所定の音声と同じ音声に基づいて撮影を行うように前記撮影手段を制御し、
    前記画像取得手段は、前記撮影手段により撮影された画像を取得する、
    ことを特徴とする請求項1乃至の何れか1項に記載の電子機器。
  8. 前記撮影制御手段は、セルフタイマ撮影を行うように前記撮影手段を制御する、
    ことを特徴とする請求項に記載の電子機器。
  9. ユーザの所定の音声を入力する音声入力手段をさらに備え、
    前記音声取得手段は、前記音声入力手段によって入力された所定の音声を取得する、
    ことを特徴とする請求項1乃至の何れか1項に記載の電子機器。
  10. 前記記憶先は、当該電子機器の外部に設けられる、
    ことを特徴とする請求項1乃至の何れか1項に記載の電子機器。
  11. 前記記憶先は、ウェブ上のストレージサーバ又はSNS(Social Networking service)が提供するサーバである、
    ことを特徴とする請求項1乃至10の何れか1項に記載の電子機器。
  12. 第一の装置と第二の装置とからなるシステムであって、
    前記第一の装置は、
    ユーザから発せられる所定の音声を取得する音声取得手段と、
    前記音声取得手段によって取得された前記所定の音声と同じ音声に基づいて被写体を撮影する撮影指示を前記第二の装置に送信する第一の送信手段と、
    前記所定の音声と同じ音声を文字情報に変換する制御を行う音声変換制御手段と、
    前記撮影指示に基づいて前記第二の装置で撮影された画像データを前記第二の装置から受信する第一の受信手段と、
    前記変換された前記文字情報の内容に対応付けられて予め設定された記憶先に、前記画像データと共に前記文字情報を保存させる制御を行う保存制御手段と、
    を備え、
    前記第二の装置は、
    撮影手段と、
    前記第一の装置の前記第一の送信手段から送信される前記撮影指示を受信する第二の受信手段と、
    前記第二の受信手段で受信された前記撮影指示に基づいて、被写体を撮影するように前記撮影手段を制御する撮影制御手段と、
    前記画像データを前記第一の装置に送信する第二の送信手段と、
    を備える、
    ことを特徴とするシステム。
  13. 画像を取得する画像取得ステップと、
    ユーザから発せられる所定の音声を取得する音声取得ステップと、
    記所定の音声と同じ音声を文字情報に変換する制御を行う音声変換制御ステップと、
    前記変換された前記文字情報の内容に対応付けられて予め設定された記憶先に、前記画像と共に前記文字情報を保存させる制御を行う保存制御ステップと、
    を含むことを特徴とする保存制御方法。
  14. コンピュータを、
    画像を取得する画像取得手段、
    ユーザから発せられる所定の音声を取得する音声取得手段、
    記所定の音声と同じ音声を文字情報に変換する制御を行う音声変換制御手段、
    前記変換された前記文字情報の内容に対応付けられて予め設定された記憶先に、前記画像と共に前記文字情報を保存させる制御を行う保存制御手段、
    として機能させることを特徴とするプログラム。
JP2015185867A 2015-09-18 2015-09-18 電子機器、システム、保存制御方法及びプログラム Active JP6634755B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2015185867A JP6634755B2 (ja) 2015-09-18 2015-09-18 電子機器、システム、保存制御方法及びプログラム
KR1020160112639A KR102653751B1 (ko) 2015-09-18 2016-09-01 전자 기기, 시스템, 보존 제어 방법 및 프로그램
CN201610821964.1A CN107065400B (zh) 2015-09-18 2016-09-13 电子设备、系统以及保存控制方法
US15/266,858 US10230884B2 (en) 2015-09-18 2016-09-15 Electronic apparatus, system, storage control method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015185867A JP6634755B2 (ja) 2015-09-18 2015-09-18 電子機器、システム、保存制御方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2017060127A JP2017060127A (ja) 2017-03-23
JP6634755B2 true JP6634755B2 (ja) 2020-01-22

Family

ID=58283583

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015185867A Active JP6634755B2 (ja) 2015-09-18 2015-09-18 電子機器、システム、保存制御方法及びプログラム

Country Status (4)

Country Link
US (1) US10230884B2 (ja)
JP (1) JP6634755B2 (ja)
KR (1) KR102653751B1 (ja)
CN (1) CN107065400B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6822941B2 (ja) * 2017-12-19 2021-01-27 Kddi株式会社 通信端末、端末制御プログラム、端末制御方法及び通信システム
US11902656B2 (en) * 2022-06-29 2024-02-13 Western Digital Technologies, Inc. Audio sensors for controlling surveillance video data capture

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002189723A (ja) 2000-12-20 2002-07-05 Plaza Create Co Ltd デジタルフォトサービスシステム
US7343289B2 (en) * 2003-06-25 2008-03-11 Microsoft Corp. System and method for audio/video speaker detection
GB2405948B (en) * 2003-09-12 2006-06-28 Canon Res Ct Europ Ltd Voice activated device
GB2405949A (en) * 2003-09-12 2005-03-16 Canon Kk Voice activated device with periodicity determination
US20090247245A1 (en) * 2004-12-14 2009-10-01 Andrew Strawn Improvements in or Relating to Electronic Headset Devices and Associated Electronic Devices
US7697827B2 (en) * 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
JP2009027626A (ja) * 2007-07-23 2009-02-05 Canon Inc マイクロフォン装置、撮影装置、及びリモート撮影システム
US8958848B2 (en) * 2008-04-08 2015-02-17 Lg Electronics Inc. Mobile terminal and menu control method thereof
US20090262205A1 (en) * 2008-04-21 2009-10-22 Dana Stephen Smith Voice activated headset imaging system
JP5053950B2 (ja) * 2008-07-29 2012-10-24 キヤノン株式会社 情報処理方法、情報処理装置、プログラムおよび記憶媒体
JP4449082B2 (ja) 2008-08-22 2010-04-14 富士フイルム株式会社 電子カメラ
US8635066B2 (en) * 2010-04-14 2014-01-21 T-Mobile Usa, Inc. Camera-assisted noise cancellation and speech recognition
US8700392B1 (en) * 2010-09-10 2014-04-15 Amazon Technologies, Inc. Speech-inclusive device interfaces
JP2012100214A (ja) 2010-11-05 2012-05-24 Nikon Corp 撮像装置、補正プログラム及び記録媒体
US9031847B2 (en) * 2011-11-15 2015-05-12 Microsoft Technology Licensing, Llc Voice-controlled camera operations
JP2014026642A (ja) * 2012-06-19 2014-02-06 Seiko Epson Corp 駐車場システム
CN104429049B (zh) * 2012-07-18 2016-11-16 华为技术有限公司 具有用于立体声录音的麦克风的便携式电子装置
KR101992676B1 (ko) * 2012-07-26 2019-06-25 삼성전자주식회사 영상 인식을 이용하여 음성 인식을 하는 방법 및 장치
WO2014025012A1 (ja) * 2012-08-10 2014-02-13 株式会社ホンダアクセス 音声認識方法及び音声認識装置
KR20140075997A (ko) * 2012-12-12 2014-06-20 엘지전자 주식회사 이동 단말기 및 이동 단말기의 제어 방법
US20140267742A1 (en) * 2013-03-15 2014-09-18 William F. Tapia Camera with remote watch
US9747900B2 (en) * 2013-05-24 2017-08-29 Google Technology Holdings LLC Method and apparatus for using image data to aid voice recognition
JP2015115911A (ja) * 2013-12-16 2015-06-22 株式会社日立システムズ 行動記録装置、入出力装置、行動記録プログラムおよび行動記録方法
EP2899609B1 (en) * 2014-01-24 2019-04-17 Sony Corporation System and method for name recollection
KR20160034065A (ko) * 2014-09-19 2016-03-29 엘지전자 주식회사 이동 단말기 및 그 제어 방법
CN104853101A (zh) * 2015-05-18 2015-08-19 牟肇健 基于语音的智能化即时命名拍照技术

Also Published As

Publication number Publication date
CN107065400B (zh) 2019-12-03
US10230884B2 (en) 2019-03-12
CN107065400A (zh) 2017-08-18
JP2017060127A (ja) 2017-03-23
US20170085772A1 (en) 2017-03-23
KR20170034315A (ko) 2017-03-28
KR102653751B1 (ko) 2024-04-01

Similar Documents

Publication Publication Date Title
TWI464513B (zh) 無線通訊系統、可攜式電子裝置以及遠端閃光源控制方法
US10321091B2 (en) Information processing device and method of information processing
JPWO2017047012A1 (ja) 撮像装置および撮像装置とサーバとを含むシステム
BRPI0903881B1 (pt) Dispositivo de processamento de informação, método de processamento de informação, e, meio de armazenagem armazenando um programa de computador
US9601158B2 (en) Moving image selection apparatus for selecting moving image to be combined, moving image selection method, and storage medium
JP6634755B2 (ja) 電子機器、システム、保存制御方法及びプログラム
US9674437B2 (en) Imaging apparatus, imaging method and computer readable recording medium having program for performing interval shooting
US20160088219A1 (en) Image capture apparatus which controls frame rate based on motion of object, information transmission apparatus, image capture control method, information transmission method, and recording medium
US9313472B2 (en) Image capture apparatus that photographs a specific subject, a communication method, a storage medium and a communication system
JP2014187551A (ja) 画像取得装置、画像取得方法及びプログラム
JP2014122978A (ja) 撮像装置、音声認識方法、及びプログラム
JP6679409B2 (ja) 撮像装置、遠隔制御装置、制御方法及びプログラム並びに記憶媒体
JP2019068203A (ja) サーバ装置、配信システム、配信方法及びプログラム
JP7365793B2 (ja) 撮像装置およびその制御方法、プログラム
JP6357922B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP6617396B2 (ja) 撮像装置、及び撮像方法
JP2018056776A (ja) 撮像装置、撮影システム、電源管理方法及びプログラム
JP6446842B2 (ja) 撮像装置、撮影制御システム、撮影制御方法及びプログラム
JP2016010085A (ja) 撮像装置
JP5746105B2 (ja) 情報機器及び情報表示方法
JP2020036347A (ja) 画像処理装置、画像処理方法及びプログラム
JP2024005948A (ja) 撮像装置、その制御方法及びプログラム
JP2013093726A (ja) 電子カメラ
JP2016066994A (ja) 撮像装置、情報送信装置、撮像制御方法、情報送信方法及びプログラム
JP2016015658A (ja) 撮像装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180912

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190702

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190828

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191202

R150 Certificate of patent or registration of utility model

Ref document number: 6634755

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150