JP2020047227A - フォトブック作製システム及びサーバ装置 - Google Patents
フォトブック作製システム及びサーバ装置 Download PDFInfo
- Publication number
- JP2020047227A JP2020047227A JP2018177699A JP2018177699A JP2020047227A JP 2020047227 A JP2020047227 A JP 2020047227A JP 2018177699 A JP2018177699 A JP 2018177699A JP 2018177699 A JP2018177699 A JP 2018177699A JP 2020047227 A JP2020047227 A JP 2020047227A
- Authority
- JP
- Japan
- Prior art keywords
- user
- voice
- album
- image
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
【課題】所定のユーザのみがスマートスピーカに話しかけることでフォトブックの編集や注文を行えるようにする。【解決手段】本実施形態に係るフォトブック作製システムは、サーバ装置と、音声の出力及びユーザの発話の集音を行うスマートスピーカと、を備える。前記サーバ装置は、前記ユーザの音声データを格納する記憶部と、前記ユーザの音声指示に基づいて前記記憶部内にアルバムを作成するアルバム作成部と、ユーザ端末から受信したデータを前記アルバムに格納する画像受信部と、前記ユーザの音声がフォトブックの作製指示及びアルバムの指定である場合に、前記記憶部に格納された前記音声データを用いて、ユーザの音声認証を行う音声認証部と、前記アルバムに格納された画像の中から複数の画像を選択する画像選択部と、選択された画像を用いてフォトブックデータを生成する編集処理部と、を有する。【選択図】図1
Description
本発明は、フォトブック作製システム及びサーバ装置に関する。
デジタルカメラやスマートフォン等で撮影した画像を、ネットワーク上にアップロードして保存することが行われている。また、アップロードした画像をプリントして、フォトブックやポスター等の印画物を作製するサービスが知られている(例えば特許文献1参照)。
従来、アップロードした画像を用いてフォトブックを注文する場合、パーソナルコンピュータやスマートフォンを操作して画像の選択、配置、コメントの入力等を行っていた。
近年、対話型の音声操作に対応したAIアシスタントを利用可能なスマートスピーカが普及している。ユーザがスマートスピーカに話しかけることで、検索エンジンを用いた調べ物、ニュースの読み上げ、音楽や動画の再生、家電の操作など、様々なアクションを実行できる。
本発明は、所定のユーザのみがスマートスピーカに話しかけることでフォトブックの編集や注文を行うことができるフォトブック作製システム及びサーバ装置を提供することを課題とする。
本発明によるフォトブック作製システムは、ユーザ端末から受信した画像データを保存するサーバ装置と、前記サーバ装置と通信可能に接続され、音声の出力及びユーザの発話の集音を行うスマートスピーカと、を備え、前記サーバ装置は、前記スマートスピーカを介して入力されたユーザの音声を理解し、ユーザに対する応答文を生成し、前記スマートスピーカを介して前記応答文を前記ユーザへ出力する対話処理部と、前記ユーザの音声データを格納する記憶部と、前記ユーザの音声が、画像データを保存する領域となるアルバムの作成指示である場合に、前記記憶部内にアルバムを作成するアルバム作成部と、前記ユーザ端末から受信したデータを前記アルバムに格納する画像受信部と、前記ユーザの音声がフォトブックの作製指示、及びフォトブックに使用する画像が格納されたアルバムの指定である場合に、前記記憶部に格納された前記音声データを用いて、ユーザの音声認証を行う音声認証部と、前記アルバムに格納された画像の中から複数の画像を選択する画像選択部と、選択された画像を用いてフォトブックデータを生成する編集処理部と、を有するものである。
本発明の一態様では、前記サーバ装置は、指定されたアルバムが複数ユーザのユーザ端末から受信した画像を格納するものである場合、フォトブックの作製指示を受け付けると、他ユーザのユーザ端末にフォトブックが作製されることを通知する共有ユーザ問合せ部をさらに備える。
本発明の一態様では、前記共有ユーザ問合せ部は、フォトブック作製の可否を問い合わせ、前記画像選択部は、フォトブックの作製を許可しなかった他ユーザのユーザ端末から受信した画像を選択しない。
本発明の一態様では、前記サーバ装置は、前記フォトブックデータのプレビュー画面を前記ユーザ端末へ送信する。
本発明によるサーバ装置は、音声の出力及びユーザの発話の集音を行うスマートスピーカと通信可能に接続されたサーバ装置であって、前記スマートスピーカを介して入力されたユーザの音声を理解し、ユーザに対する応答文を生成し、前記スマートスピーカを介して前記応答文を前記ユーザへ出力する対話処理部と、前記ユーザの音声データを格納する記憶部と、前記ユーザの音声が、画像データを保存する領域となるアルバムの作成指示である場合に、前記記憶部内にアルバムを作成するアルバム作成部と、ユーザ端末から受信したデータを前記アルバムに格納する画像受信部と、ユーザ端末から受信した画像データを保存する記憶部と、前記ユーザの音声がフォトブックの作製指示、及びフォトブックに使用する画像が格納されたアルバムの指定である場合に、前記記憶部に格納された前記音声データを用いて、ユーザの音声認証を行う音声認証部と、前記指定されたアルバムに格納された画像の中から複数の画像を選択する画像選択部と、前記画像選択部により選択された画像を用いてフォトブックデータを生成する編集処理部と、を備えるものである。
本発明によれば、音声認証により登録音声と一致したユーザのみが、スマートスピーカに話しかけることで、フォトブックの編集や注文を行うことができる。
以下、本発明の実施の形態を図面に基づいて説明する。
図1に示すように、本発明の実施形態に係るフォトブック作製システムは、サーバ装置1及びスマートスピーカ2を備える。サーバ装置1は、インターネット等の通信ネットワークを介して、スマートスピーカ2及びユーザ端末3,7と通信可能となっている。
ユーザ端末3,7は、スマートフォン、タブレット端末等である。ユーザ端末3はユーザAが所有する端末であり、ユーザ端末7はユーザBが所有する端末である。サーバ装置1には、ユーザA,Bからアップロードされた画像データが保存されている。スマートスピーカ2は、通信機能と対話型音声操作のアシスタント機能とを有するスピーカであり、ユーザAの自宅等に設置されている。
スマートスピーカ2及びユーザ端末3には、サーバ装置1から、ユーザAを識別する同一の識別情報(ユーザID)が付与されている。従って、サーバ装置1は、スマートスピーカ2及びユーザ端末3が、同一のユーザAが使用するものであることを認識している。上述した画像のアップロードは、ユーザ端末3から行われてもよいし、同じユーザIDでログインした他の端末から行われてもよい。
サーバ装置1は、画像解析機能を有し、ユーザからアップロードされた画像の解析を行う。画像解析は、例えば、画像内の物体やテキストの検出、公序良俗に反するおそれのある画像の検出、著作権を侵害する可能性のある画像の検出である。例えば、サーバ装置1はウェブ上で類似している画像を検索して、著作権侵害の有無を判定する。サーバ装置1は、公序良俗に反する画像や著作権を侵害する可能性のある画像については、フォトブックに使用すべきでない不適切画像と判定し、その他の画像についてはフォトブックに使用可能な画像と判定する。
本実施形態において、ユーザAは、スマートスピーカ2に話しかけることで、アップロードした画像を格納するためのアルバム(フォルダ)を作成する。また、ユーザAは、スマートスピーカ2に話しかけることで、フォトブックに使用する画像が格納されているアルバムを指定し、フォトブックの編集を行い、ユーザ端末3に表示されるプレビュー画面を確認する。
ユーザAの自宅に設置されたスマートスピーカ2は、ユーザAの家族など、ユーザA以外も使用することができ、他ユーザが、ユーザA作成のアルバムを利用してフォトブックを注文できてしまうことが好ましくない場合がある。そのため、音声認証を行い、ユーザA作成のアルバムを利用してフォトブックを作製することを指示する者がユーザAであるか否かを確認する。
音声認証を行うために、事前に(例えばアルバム作成時に)、ユーザAの音声を登録する。例えば、図2に示すように、ユーザAは「OK、スピーカ」のような所定のウェイクワード(コマンドワード)でスマートスピーカ2に呼びかけ、アシスタント機能を起動させる。続いて、ユーザAはアルバムを作成するようにスマートスピーカ2に話かける。例えば「12月の旅行のアルバムを作って」と話しかける。
スマートスピーカ2は、ウェイクワード以降のユーザの発話の音声データをサーバ装置1へ送信する。サーバ装置1は、ユーザの発話文を解釈し、アルバムを作成する。サーバ装置1は、アルバムを作成すると、音声登録を要求する応答文(音声データ)を生成してスマートスピーカ2へ送信する。スマートスピーカ2は、音声登録を行うように、音声を出力する。例えば、スマートスピーカ2は「あなたの音声を登録するので、キーワードを3回喋ってください」という音声を出力する。
ユーザAがキーワードを喋ると、スマートスピーカ2は、音声データをサーバ装置1へ送信する。サーバ装置1は、ユーザAの音声を登録する。
ユーザAは、ユーザ端末3等を用いて、作成したアルバムに画像を登録する。登録する画像は、ユーザ端末3の内蔵カメラで撮影したものでもよいし、別のデジタルカメラで撮影したものでもよい。
ユーザは、スマートスピーカ2に話しかけることでフォトブックの編集を行い、ユーザ端末3に表示されるプレビュー画面を確認できる。
例えば、図3に示すように、ユーザは「OK、スピーカ」のような所定のウェイクワード(コマンドワード)でスマートスピーカ2に呼びかけ、アシスタント機能を起動させる。続いて、ユーザはフォトブックを作製するようにスマートスピーカ2に話かける。例えば「フォトブック作って」と話しかける。
サーバ装置1は、ユーザの発話文を解釈し、フォトブックの作製処理を開始する。サーバ装置1は、どのアルバムを使用してフォトブックを作製するかユーザAに問い合わせる質問文を生成して、スマートスピーカ2へ送信する。例えば、スマートスピーカ2は「どのアルバムを使いますか」という音声を出力する。
ユーザAが「12月の旅行のアルバムを使って」とスマートスピーカ2に返答すると、スマートスピーカ2はユーザAの音声データをサーバ装置1へ送信する。サーバ装置1は、指定されたアルバムに音声が登録されているため、音声認証を行うためにキーワードを話すことを要求する応答文を生成してスマートスピーカ2へ送信する。例えば、スマートスピーカ2は「音声認証を行うので、キーワードを1回喋ってください」という音声を出力する。
ユーザAがスマートスピーカ2にキーワードを話しかけると、スマートスピーカ2はユーザAの音声データをサーバ装置1へ送信する。サーバ装置1は、受信した音声データと、登録されている音声データとの特徴を比較する。例えば、サウンドスペクトログラムや、これと等価な音声特徴を用いて、音声認証を行う。音声特徴が一致し、ユーザAの認証が行われると、サーバ装置1は、フォトブックの作製処理を開始する。音声特徴が一致しない場合、サーバ装置1は、音声が不一致である応答文を生成して、スマートスピーカ2から出力させる。
音声認証は、上述したようなキーワード方式でもよいし、通常の会話(自由発話)から照合するフリーワード方式でもよい。
フォトブック作製処理では、サーバ装置1は、指定されたアルバムに保存されている画像から、フォトブックに好適な画像を選択し、フォトブックのテンプレートに配置する。
サーバ装置1は、選択した画像をレイアウトしてフォトブックデータを作成すると、応答文(音声データ)を生成してスマートスピーカ2へ送信する。スマートスピーカ2は、フォトブックデータをユーザ端末3から確認するように音声を出力する。例えば、スマートスピーカ2は「スマートフォンの通知を確認してください」という音声を出力する。
ユーザ端末3には、サーバ装置1からフォトブックデータが生成されたことを通知するメッセージが届いている。ユーザがメッセージにタッチすると、ユーザ端末3はサーバ装置1からフォトブックのプレビュー画面を取得する。例えば、図4に示すように、ユーザ端末3のタッチパネル3Aにフォトブックのプレビュー画面が表示される。
例えば、プレビュー画面の下部には、複数ページの画像がサムネイル表示され、画面上部には、選択したページの画像が大きく表示される。ページ切替ボタンB1、B2を押して、サムネイル表示するページを切り替えることができる。
発話により選択ページを切り替えることもできる。例えば、ユーザが「5ページ見せて」とスマートスピーカ2に話かける。サーバ装置1は、スマートスピーカ2を介してユーザの発話文を取得して解釈し、プレビュー画面の選択ページを5ページに切り替える。
発話によりページ順の入れ替えを行うことができる。例えば、図5に示すように、ユーザが「2ページと3ページを入れ替えて」とスマートスピーカ2に話しかける。サーバ装置1は、スマートスピーカ2を介してユーザの発話文を取得して解釈し、2ページの画像と3ページの画像とを入れ替え、プレビュー画面を更新する。ページ入れ替えの音声指示には、少なくとも「入れ替え」というワードと、入れ替え対象の2つのページ番号が含まれている必要がある。
サーバ装置1は、ページ入れ替え後、応答文を生成してスマートスピーカ2へ送信する。スマートスピーカ2は「ページを入れ替えました」のように、ページを入れ替えたことを知らせる音声を出力する。
ユーザが単に「ページを入れ替えて」とスマートスピーカ2に話しかけた場合、サーバ装置1は、所定の行動選択規則に基づいて、入れ替えるページを質問する応答文を生成してスマートスピーカ2へ送信する。あるいはまた、「“3ページと4ページを入れ替える”のように指示してください」と、所定の言葉の順番で指示を出すように知らせる音声をスマートスピーカ2から出力してもよい。
プレビュー画面のページ入れ替えボタンB3を押し、入れ替えるページをドラッグアンドドロップすることでも、ページ順の入れ替えを行うことができる。
フォトブックに使用する画像を変更する場合は、発話により画像の変更を指示する。例えば、図6に示すように、ユーザが「6ページの写真を変更」とスマートスピーカ2に話しかける。サーバ装置1は、スマートスピーカ2を介してユーザの発話文を取得して解釈し、画像の一覧画面をユーザ端末3へ送信する。サーバ装置1は、画像一覧画面の送信後、応答文を生成してスマートスピーカ2へ送信する。スマートスピーカ2は「端末の画面から写真を選んでください」等の音声を出力する。
ユーザが単に「写真を変更」とスマートスピーカ2に話しかけた場合、サーバ装置1は、所定の行動選択規則に基づいて、どのページの画像を変更するか質問する応答文を生成してスマートスピーカ2へ送信する。
ユーザが、ユーザ端末3を操作して画像一覧画面から画像を選択すると、サーバ装置1は画像を変更し、フォトブックデータ及びプレビュー画面を更新する。
画像の一覧画面には、ユーザが指定したアルバムにアップロードされた全ての画像が含まれる。すなわち、サーバ装置1の画像解析により、フォトブックに使用すべきでないと判定された不適切画像も含まれる。ユーザが一覧画面から不適切画像を選択した場合、サーバ装置1は、画像の出所を質問する応答文を生成してスマートスピーカ2へ送信する。例えば、スマートスピーカ2は「6ページの写真にキャラクターコンテンツが含まれますが、ご自身で撮影された写真ですか」のような音声を出力する。
ユーザが「はい、そうです」のような肯定的な返答をした場合、サーバ装置1は、選択した画像の使用を承認する応答文を生成し、スマートスピーカ2へ送信する。一方、ユーザが「いいえ」のような否定的な応答をした場合、サーバ装置1はこの画像の使用には問題があることを説明する応答文を生成してスマートスピーカ2から音声を出力し、ユーザ端末3の表示を画像一覧画面に戻す。
プレビュー画面の画像変更ボタンB4(図4参照)を押して画像一覧画面を表示させ、画像一覧画面から画像を選択することでも、画像の変更を行うことができる。
サーバ装置1は、画像を選択してフォトブックデータを作成する際に、選択した画像に対し、コメント(又はタイトル)を生成して付与できる。サーバ装置1は、画像解析により検出された画像内の物体やテキスト、フォトブックの目的等に基づいて、コメントを生成する。例えば、サーバ装置1は、特徴的な物体が検出された画像に対してコメントを生成して付与する。
図7に示すように、コメントを付与したページを表示する場合、サーバ装置1は、コメントを生成・付与したこと及びコメント内容を知らせる応答文を生成してスマートスピーカ2へ送信する。スマートスピーカ2は、コメントを音声で読み上げる。ユーザは、スマートスピーカ2から出力される音声を聞いて、コメントを確認する。
コメントを変更する場合は、発話によりコメントの変更を指示する。例えば、図7に示すように、ユーザが「コメント変更」とスマートスピーカ2に話しかけ、続いて変更後のコメントを発話する。サーバ装置1は、スマートスピーカ2を介してユーザの発話文を取得して解釈し、現在表示している画像のコメントを変更し、フォトブックデータ及びプレビュー画面を更新する。
サーバ装置1は、コメント変更後、応答文を生成してスマートスピーカ2へ送信する。スマートスピーカ2は「コメントを変更しました」のように、コメントを変更したことを知らせる音声を出力する。
プレビュー画面のコメント変更ボタンを押し、ユーザ端末3のタッチキーを操作してコメントを入力することでも、コメントの変更を行うことができる。
ユーザがフォトブックのプレビュー画面を一通り確認して「注文します」等の所定のワードを発するか、又はプレビュー画面の確定ボタンB5(図4参照)を押すと、サーバ装置1は最終確認画面を生成してユーザ端末3へ送信し、応答文を生成してスマートスピーカ2へ送信する。スマートスピーカ2は「端末画面で、写真とコメントの最終確認をお願いします」等の音声を出力する。
ユーザ端末3には、図8に示すような最終確認画面FCが表示される。例えば、画面の下部には、各ページの画像選択者、コメント作成者、コメント内容を含む編集一覧が表示され、画面の上部には選択したページが表示される。編集一覧の画像選択者及びコメント作成者における“AI自動選択”、“AI自動作成”は、サーバ装置1に相当する。
上述したように、サーバ装置1は、画像の選択、配置、コメントの作成等を自動で行う。そのため、図8に示すように、編集一覧では、サーバ装置1が画像を選択し、かつコメントもサーバ装置1が作成したか又はコメントの無いページについては、ページ番号を強調表示する。これらのページは、ユーザが見落としている可能性があるためである。
ユーザが画像を選択(変更、入れ替え)したり、コメントを作成したりしたページは、既にユーザが目を通しているページであるため、強調表示する必要はない。
ユーザが、強調表示されているページを確認した後、「注文します」等の所定のワードを発するか、又は最終確認画面の確定ボタンB7を押すと、サーバ装置1は決済画面を生成してユーザ端末3へ送信し、応答文を生成してスマートスピーカ2へ送信する。スマートスピーカ2は「決済処理に進みます。ここからは端末より入力をお願いします」等の音声を出力する。決済画面では、フォトブックの配送先やクレジットカード番号の入力が必要となり、スマートスピーカ2を用いた音声入力より、ユーザ端末3の操作による手入力の方が好ましい。
サーバ装置1は、ユーザ(ユーザ端末3)から決済情報が入力され、フォトブックの注文を受け付けると、フォトブックデータ及び注文内容を工場5へ送信する。
工場5に設置されたプリンタ(図示略)は、受信したフォトブックデータに基づいて印画処理を行い、フォトブック6を作製する。工場5で作製されたフォトブック6は、ユーザへ配送される。
工場5へ送信されるフォトブックデータを考査端末4へ送信し、考査端末4で人手による考査を行ってもよい。これにより、サーバ装置1の画像解析で見落とした不適切画像を検出できる。
このように、本実施形態によれば、ユーザの音声認証を行うことで、事前に登録されたユーザのみが、スマートスピーカ2を介して、音声によりフォトブックの作製を指示できる。また、自動レイアウトされた画像のページ順の入れ替えや、自動作成されたコメントの変更も、スマートスピーカ2を介して音声指示により行うことができる。
サーバ装置1は、ユーザからアップロードされた画像の解析を行い、公序良俗に反するおそれがある画像や著作権を侵害するおそれがある画像等の不適席画像を予め特定している。サーバ装置1は、フォトブックの作製にあたり、不適切画像以外の、フォトブックでの使用に問題無い画像から画像を選択できる。
画像変更処理において、ユーザにより、画像一覧画面から不適切画像が選択された場合、スマートスピーカ2を介してユーザに画像の出所等を質問し、問題無いことが確認されると、フォトブックに使用する。
ユーザAがサーバ装置1に作成したアルバムを、他ユーザと共有できるようにしてもよい。例えば、ユーザAがアルバムにアクセスするためのURL等を含むメッセージ(Eメール等)をユーザBのユーザ端末7に通知し、招待する。ユーザBは、ユーザ端末7を用いて、このアルバムに画像をアップロードできるようになる。
ユーザAがフォトブック作製にあたり指定したアルバムが、ユーザBとの共有アルバムである場合、サーバ装置1は、ユーザAの音声認証後、図3に示すように、ユーザ端末7に対し、ユーザAが共有アルバムの画像を用いてフォトブックを作製しようとしていることを通知するメッセージを送信してもよい。また、ユーザBが、メッセージに含まれる許可ボタンT1を押すと、フォトブック作製処理を開始するようにしてもよい。ユーザBが不許可ボタンT2を押した場合、サーバ装置1は、許可されなかったことをスマートスピーカ2から音声で出力する。ユーザBが不許可ボタンT2を押した場合、サーバ装置1は、ユーザAがアップロードした画像のみを使用してフォトブックデータを生成してもよいし、フォトブック作製処理を中止してもよい。
図9は、フォトブック作製システムのブロック構成図である。図9に示すように、スマートスピーカ2は、制御部20、集音部(マイク)21、音声出力部(スピーカ)22及び通信部23を有する。
制御部20は、音声認識の機能を有し、集音部21を介して所定のウェイクワードが入力されると、ウェイクワード以降の音声を、通信部23を用いてサーバ装置1へ送信する。
音声出力部22は、通信部23を介してサーバ装置1から受信した応答文の音声データを出力する。
サーバ装置1は、対話処理部10及びフォトブック編集部100を備える。
対話処理部10は、ユーザからの音声指示を理解し、ユーザに対する適切な応答文を生成するものであり、入力理解部11、対話管理部12及び出力生成部13を有する。入力理解部11は、スマートスピーカ2から受け取ったユーザの発話文からユーザの意図(タスク)を推定する意図推定と、人名や地名等の固有名詞、日付、時間等の表現を発話文から抽出する固有表現抽出の機能を有する。
対話管理部12は、入力理解部11から受け取った結果情報をデータベースに相当する内部状態に書き込んで更新する内部状態更新と、内部状態及び対話戦略(行動選択規則)に基づいて次の行動を選択する行動選択の機能を有する。
出力生成部13は、対話管理部12の行動選択が出した指示に合う応答文を生成し、スマートスピーカ2へ送信する。
対話処理部10は、フォトブック編集部100と連携し、フォトブック編集部100の処理結果を応答文に反映させることができる。
フォトブック編集部100は、画像DB、ユーザ情報DB、音声DB、解析結果DB、フォトブックデータDB、及び注文内容DBを有する記憶部110を備える。各DB(データベース)は、異なる記憶装置に設けられていてもよい。
CPU(中央処理装置)が記憶部110に記憶されているプログラムを実行することで、アルバム作成部101、画像受信部102、画像解析部103、音声認証部104、共有ユーザ問合せ部105、画像選択部106、編集処理部107、コメント生成部108及び注文処理部109の機能が実現される。
アルバム作成部101は、対話処理部10がユーザの発話からアルバムの作成というタスクを抽出すると、画像DB内にアルバムを作成する。また、アルバム作成部101は、各アルバムに対し、画像をアップロード可能なユーザの情報をユーザ情報DBに格納する。例えば、アルバムを作成したユーザAや、ユーザAが招待したユーザBが画像をアップロードできるユーザとなる。
また、アルバム作成部101は、アルバム作成を指示したユーザに対し、音声の登録を要求し、ユーザが発したキーワードの音声を音声DBに格納する。
画像受信部102は、ユーザ端末3(又はユーザ端末7)からアップロードされた画像データを受信し、画像DBのアルバムに格納する。
画像解析部103は、ユーザ端末3からアップロードされた画像の解析を行う。画像解析は、例えば、画像内の物体やテキストの検出、公序良俗に反するおそれのある画像の検出、著名人や有名キャラクター等が写った著作権を侵害する可能性のある画像の検出である。画像解析部103は、公序良俗に反する画像や著作権を侵害する可能性のある画像については、フォトブックに使用すべきでない不適切画像と判定し、判定結果を画像DB内の画像データに紐付ける。画像解析部103は、画像毎に、画像から検出した物体やテキスト、画像データに含まれる撮影日情報、撮影場所情報等をタグとして解析結果DBに格納する。
音声認証部104は、対話処理部10がユーザの発話からフォトブックの作製というタスクを抽出し、フォトブック作製に使用するアルバムが指定されると、音声認証を行う。音声認証部104は、指定されたアルバムを作成したユーザの音声を音声DBから取り出し、フォトブック作製を指示するユーザの音声と特徴を比較して、認証を行う。
共有ユーザ問合せ部105は、フォトブック作製にあたり指定されたアルバムが他ユーザと共有しているものである場合、フォトブック作製の可否を他ユーザに問い合わせる。
画像選択部106は、指定されたアルバムからフォトブックに好適な画像を選択する。
編集処理部107は、画像選択部106により選択された画像を所定のテンプレートに配置し、フォトブックデータを生成し、プレビュー画面をユーザ端末3へ送信する。生成したフォトブックデータは、フォトブックデータDBに格納される。
編集処理部107は、対話処理部10がユーザの発話からページの入れ替えというタスクを抽出すると、ページを入れ替えて、フォトブックデータ及びプレビュー画面を更新する。
編集処理部107は、対話処理部10がユーザの発話から画像の変更というタスクを抽出すると、指定アルバム内の画像を用いて画像一覧画面を作成し、ユーザ端末3へ送信する。画像一覧画面を介して画像が選択されると、編集処理部107は、画像を変更してフォトブックデータ及びプレビュー画面を更新する。
画像一覧画面から不適切画像が選択された場合、不適切画像が選択されたことを対話処理部10に通知する。対話処理部10は、不適切画像の出所等を問う質問文を生成し、スマートスピーカ2から出力させる。
編集処理部107は、対話処理部10がユーザの発話からコメントの変更というタスクを抽出すると、ユーザから音声入力されたコメントに変更し、フォトブックデータ及びプレビュー画面を更新する。
また、編集処理部107は、図8に示すような最終確認画面FCを作成する。
コメント生成部108は、フォトブックに使用している画像に対して、コメントを自動生成し、付与する。各画像には、画像解析により画像から検出された物体やテキスト、画像データに含まれる撮影日情報、撮影場所情報等がタグとして付与されている。コメント生成部108はこれらのタグを用いて、コメントを生成する。
注文処理部109は、ユーザ端末3から、フォトブックのプリント冊数等の注文を受け付ける。注文処理部109が決済情報の入力を受け付けて決済処理を行うと、プリント注文が完了する。注文処理部109はフォトブックのプリント冊数や配送先住所等を含む注文内容を注文内容DBに格納する。
プリント注文されたフォトブックデータと、注文内容とが工場5へ送信され、フォトブック6が製造される。
このように、本実施形態によれば、ユーザの音声認証を行うことで、事前に登録されたユーザのみがスマートスピーカ2に話しかけることで、フォトブックの編集や注文を行うことができる。
ユーザ端末3はスマートフォンやタブレット端末に限定されず、図10に示すような大画面のテレビ(ディスプレイ)3A及びコントローラ3Bであってもよい。これにより、複数人で大型ディスプレイに表示されたプレビュー画面を確認しながら、事前登録されたユーザがスマートスピーカ2に話しかけてフォトブックの編集を行うことができる。
上記実施形態において、アルバムを共有するユーザBからフォトブック作製の許可が得られなかった場合、サーバ装置1は、ユーザAがアップロードした画像のみを使用してフォトブックデータを生成してもよいし、フォトブック作製処理を中止してもよい。
ユーザBが許可をした後、最終的に使用されたユーザBのアップロード画像をユーザ端末7に通知してもよい。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
1 サーバ装置
2 スマートスピーカ
3,7 ユーザ端末
4 考査端末
5 工場
6 フォトブック
2 スマートスピーカ
3,7 ユーザ端末
4 考査端末
5 工場
6 フォトブック
Claims (5)
- ユーザ端末から受信した画像データを保存するサーバ装置と、
前記サーバ装置と通信可能に接続され、音声の出力及びユーザの発話の集音を行うスマートスピーカと、
を備え、
前記サーバ装置は、
前記スマートスピーカを介して入力されたユーザの音声を理解し、ユーザに対する応答文を生成し、前記スマートスピーカを介して前記応答文を前記ユーザへ出力する対話処理部と、
前記ユーザの音声データを格納する記憶部と、
前記ユーザの音声が、画像データを保存する領域となるアルバムの作成指示である場合に、前記記憶部内にアルバムを作成するアルバム作成部と、
前記ユーザ端末から受信したデータを前記アルバムに格納する画像受信部と、
前記ユーザの音声がフォトブックの作製指示、及びフォトブックに使用する画像が格納されたアルバムの指定である場合に、前記記憶部に格納された前記音声データを用いて、ユーザの音声認証を行う音声認証部と、
前記アルバムに格納された画像の中から複数の画像を選択する画像選択部と、
選択された画像を用いてフォトブックデータを生成する編集処理部と、
を有することを特徴とするフォトブック作製システム。 - 前記サーバ装置は、指定されたアルバムが複数ユーザのユーザ端末から受信した画像を格納するものである場合、フォトブックの作製指示を受け付けると、他ユーザのユーザ端末にフォトブックが作製されることを通知する共有ユーザ問合せ部をさらに備えることを特徴とする請求項1に記載のフォトブック作製システム。
- 前記共有ユーザ問合せ部は、フォトブック作製の可否を問い合わせ、
前記画像選択部は、フォトブックの作製を許可しなかった他ユーザのユーザ端末から受信した画像を選択しないことを特徴とする請求項2に記載のフォトブック作製システム。 - 前記サーバ装置は、前記フォトブックデータのプレビュー画面を前記ユーザ端末へ送信することを特徴とする請求項1乃至3のいずれか1項に記載のフォトブック作製システム。
- 音声の出力及びユーザの発話の集音を行うスマートスピーカと通信可能に接続されたサーバ装置であって、
前記スマートスピーカを介して入力されたユーザの音声を理解し、ユーザに対する応答文を生成し、前記スマートスピーカを介して前記応答文を前記ユーザへ出力する対話処理部と、
前記ユーザの音声データを格納する記憶部と、
前記ユーザの音声が、画像データを保存する領域となるアルバムの作成指示である場合に、前記記憶部内にアルバムを作成するアルバム作成部と、
ユーザ端末から受信したデータを前記アルバムに格納する画像受信部と、
ユーザ端末から受信した画像データを保存する記憶部と、
前記ユーザの音声がフォトブックの作製指示、及びフォトブックに使用する画像が格納されたアルバムの指定である場合に、前記記憶部に格納された前記音声データを用いて、ユーザの音声認証を行う音声認証部と、
前記指定されたアルバムに格納された画像の中から複数の画像を選択する画像選択部と、
前記画像選択部により選択された画像を用いてフォトブックデータを生成する編集処理部と、
を備えるサーバ装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018177699A JP2020047227A (ja) | 2018-09-21 | 2018-09-21 | フォトブック作製システム及びサーバ装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018177699A JP2020047227A (ja) | 2018-09-21 | 2018-09-21 | フォトブック作製システム及びサーバ装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020047227A true JP2020047227A (ja) | 2020-03-26 |
Family
ID=69899802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018177699A Pending JP2020047227A (ja) | 2018-09-21 | 2018-09-21 | フォトブック作製システム及びサーバ装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020047227A (ja) |
-
2018
- 2018-09-21 JP JP2018177699A patent/JP2020047227A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10917369B2 (en) | Information processing apparatus, information processing system, and information processing method | |
US11955125B2 (en) | Smart speaker and operation method thereof | |
KR101198744B1 (ko) | 전자 기기에 보유된 연락처 리스트들 내 이미지들을 이용하는 장치, 방법 및 컴퓨터 프로그램 제품 | |
US8027998B2 (en) | Minutes production device, conference information management system and method, computer readable medium, and computer data signal | |
JP7130929B2 (ja) | 情報処理装置、プログラム及び制御方法 | |
JP7106827B2 (ja) | 情報処理装置、プログラム及び制御方法 | |
JP2011043716A (ja) | 情報処理装置、会議システム、情報処理方法及びコンピュータプログラム | |
JP2023073412A (ja) | 情報提供方法、情報提供システム、情報提供装置及びコンピュータプログラム | |
JP7147295B2 (ja) | フォトブック作製システム及びサーバ装置 | |
JP6988608B2 (ja) | フォトブック作製システム及びサーバ装置 | |
JP6447689B1 (ja) | 情報処理装置及びプログラム | |
CN110781417A (zh) | 一种基于二维码的朗读作品传播方法及系统 | |
JP2020064493A (ja) | オンラインコミュニケーションのレビューシステム、方法、及びコンピュータプログラム | |
JP7263869B2 (ja) | 情報処理装置及びプログラム | |
JP4543761B2 (ja) | コンテンツ共有システム及びコンテンツコンテナ作成方法 | |
JP7091890B2 (ja) | フォトブック作製システム及びサーバ装置 | |
JP2020047227A (ja) | フォトブック作製システム及びサーバ装置 | |
JP2019149083A (ja) | 議事録生成装置、議事録生成方法、及びプログラム | |
JP2019160186A (ja) | フォトブック作製システム及びサーバ装置 | |
JP6988606B2 (ja) | フォトブック作製システム及びサーバ装置 | |
JP6642630B2 (ja) | 情報処理装置及びプログラム | |
TW201738830A (zh) | 資訊處理系統、受理伺服器、資訊處理方法及程式 | |
KR101355050B1 (ko) | 영상 카드 제작방법 | |
JP2020064362A (ja) | フォトブック作製システム及びサーバ装置 | |
JP7284204B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム |