JP7447633B2 - 情報処理装置及び情報処理方法 - Google Patents

情報処理装置及び情報処理方法 Download PDF

Info

Publication number
JP7447633B2
JP7447633B2 JP2020063717A JP2020063717A JP7447633B2 JP 7447633 B2 JP7447633 B2 JP 7447633B2 JP 2020063717 A JP2020063717 A JP 2020063717A JP 2020063717 A JP2020063717 A JP 2020063717A JP 7447633 B2 JP7447633 B2 JP 7447633B2
Authority
JP
Japan
Prior art keywords
image data
information processing
template
processing device
print
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020063717A
Other languages
English (en)
Other versions
JP2021163164A (ja
Inventor
聡輝 長尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2020063717A priority Critical patent/JP7447633B2/ja
Priority to US17/210,437 priority patent/US11474782B2/en
Publication of JP2021163164A publication Critical patent/JP2021163164A/ja
Application granted granted Critical
Publication of JP7447633B2 publication Critical patent/JP7447633B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Facsimiles In General (AREA)
  • Accessory Devices And Overall Control Thereof (AREA)

Description

本願は、画像形成装置を音声により制御する技術に関するものである。
特許文献1には、所定のフレーズを発音すると、ゲームコンテンツを指定し、そのゲームコンテンツに基づいた印刷を印刷装置に行わせる印刷システムが記載されている。
特開2019-185618号公報
しかし、特許文献1に記載の印刷システムでは、発音と画像データを検索する機能とをつなぐことは言及していないので、発音によりユーザの意図に沿った画像データを検索して画像形成に用いることはできない。
本願は、発音によりユーザの意図に沿った画像データを検索して画像形成に用いることが可能となる技術を提供することを目的とする。
上記目的を達成するため、本願の情報処理装置は、通信インタフェースと、制御装置と、を備え、制御装置は、通信インタフェースを介して接続された、音声を入力及び出力するスマートスピーカから、画像形成装置のユーザが発話することにより入力された音声の内容を認識し、認識された音声の内容が、テンプレートを指定し、そのテンプレートに挿入する画像データの属性を指定して画像形成を指示する内容である場合、認識された音声の内容から、指定された画像データの属性を抽出し、抽出された属性を有する画像データを取得し、指定されたテンプレートに取得した画像データを挿入して画像形成を行うべくコマンドを画像形成装置に送信する。
本願によれば、発音によりユーザの意図に沿った画像データを検索して画像形成に用いることが可能となる。
本願の一実施形態に係る画像形成システムの構成を示すブロック図である。 図1の画像形成システムによって実行される印刷制御処理のシーケンス図である。 図2の印刷制御処理とは異なる他の印刷制御処理のシーケンス図である。 テンプレートの一例((a))と、テンプレートに基づいて印刷した印刷画像の一例((b))と、検索された複数の写真画像の一例((c))を示す図である。 複数の写真画像データが抽出された場合に、図1の画像形成システムによって実行される印刷制御処理の一部のシーケンス図である。
以下、本願の実施の形態を図面に基づいて詳細に説明する。
図1は、本願の一実施形態に係る画像形成システム1000の構成を示している。画像形成システム1000は、プリンタ200と、スマートスピーカ300と、アプリケーションサーバ400とにより主として構成されている。なお、本実施形態の画像形成システム1000では、プリンタ200とスマートスピーカ300は、同じユーザによって利用される。
画像形成システム1000で用いられるアクセスポイント50は、例えば、IEEE802.11a/b/g/nの規格に従った通信方式を用いて無線LANのアクセスポイントとしての機能を実現する。アクセスポイント50は、LAN70に接続されている。LAN70は、例えば、イーサネット(登録商標)規格に準拠して構築された有線ネットワークである。LAN70は、インターネット80に接続されている。アプリケーションサーバ400は、インターネット80に接続されている。
プリンタ200は、例えば、CPUとメモリを含む制御部210と、制御部210の制御に従って印刷を行う印刷機構250と、ブルートゥースIF260と、を備えている。制御部210に含まれるメモリには、複数個のテンプレートを含むテンプレート群210aが記憶されている。印刷機構250は、シートに画像を印刷する機構であり、電子写真方式、インクジェット方式、サーマル方式等の印刷機構である。ブルートゥースIF260は、アンテナを含み、ブルートゥース方式に準拠した近距離無線通信を行うためのインタフェースであり、スマートスピーカ300との通信のために用いられる。
スマートスピーカ300は、ユーザが発話した音声に応じて特定の処理を実行する装置である。特定の処理は、例えば、音声データを生成して、アプリケーションサーバ400に送信する処理を含む。スマートスピーカ300は、CPUとメモリとを含む制御部310と、表示部340と、音声入出力部350と、ブルートゥースIF360と、無線LANIF380と、を備えている。
表示部340は、液晶ディスプレイや有機ELディスプレイなどの表示装置、表示装置を駆動する駆動回路などにより構成されている。
音声入出力部350は、スピーカとマイクとを含み、音声の入力と音声の出力に関する処理を実行する。例えば、音声入出力部350は、制御部310の制御に従って、ユーザが発話した音声を検出し、その音声を示す音声データを生成する。また、音声入出力部350は、受信した音声データに応じた音声をスピーカから発生する。
無線LANIF380は、アンテナを含み、例えば、IEEE802.11a/b/g/nの規格に従った通信方式を用いて無線通信を行う。これにより、スマートスピーカ300は、アクセスポイント50を介してLAN70及びインターネット80に接続され、アプリケーションサーバ400と通信可能に接続される。
ブルートゥースIF360は、アンテナを含み、ブルートゥース方式に準拠した近距離無線通信を行うためのインタフェースであり、プリンタ200との通信のために用いられる。これにより、プリンタ200は、ブルートゥースIF260、スマートスピーカ300のブルートゥースIF360、スマートスピーカ300の無線LANIF380、アクセスポイント50、LAN70及びインターネット80を介して、アプリケーションサーバ400と通信可能に接続される。
アプリケーションサーバ400は、例えば、いわゆるクラウドサービスを提供する事業者が運営するサーバである。アプリケーションサーバ400は、アプリケーションサーバ400全体を制御するCPU410と、ROM、RAM、HDD、SSD及び光ディスクドライブなどを含む記憶部420と、を備えている。アプリケーションサーバ400は、さらに、インターネット80と接続するためのネットワークIF480を備えている。なお、図1では、アプリケーションサーバ400は、概念的に1個のサーバとして図示されているが、互いに通信可能に接続された複数個のサーバを含む、いわゆるクラウドサーバであってもよい。
記憶部420は、データ記憶領域422及びプログラム記憶領域424を含んでいる。データ記憶領域422は、CPU410が処理を行う際に必要なデータなどを記憶する記憶領域として、また、CPU410が処理を行う際に生成される種々の中間データを一時的に格納するバッファ領域として機能する。データ記憶領域422には、複数個のテンプレートを含むテンプレート群422aと、各種画像データを含む画像データ群422bも記憶されている。プログラム記憶領域424は、OS、情報処理プログラム、その他各種のアプリやファームウェアなどを記憶する領域である。情報処理プログラムには、音声解析プログラム424a及び印刷関連プログラム424bが含まれる。音声解析プログラム424aは、例えば、アプリケーションサーバ400の運営者によって、アプリケーションサーバ400にアップロードされることによって提供される。印刷関連プログラム424bは、例えば、アプリケーションサーバ400のリソースを利用して印刷サービスを提供する事業者、例えば、プリンタ200を製造する事業者によって、アプリケーションサーバ400にアップロードされることによって提供される。なお、音声解析プログラム424aの全部または一部が、プリンタ200を製造する事業者によって提供されてもよい。あるいは、印刷関連プログラム424bの全部または一部がアプリケーションサーバ400を運営する事業者によって提供されてもよい。
アプリケーションサーバ400、特にCPU410は、音声解析プログラム424aを実行することによって、音声解析処理部424a′(図2参照)として機能する。音声解析処理部424a′は、音声認識処理や形態素解析処理を実行する。音声認識処理は、音声データを解析して、音声データによって示される発話の内容を示すテキストデータを生成する処理である。形態素解析処理は、そのテキストデータを解析して、発話の内容に含まれる単語などの構成単位(形態素と呼ばれる)の抽出や、抽出された形態素の種別(例えば、品詞の種別)の特定を行う処理である。
また、アプリケーションサーバ400、特にCPU410は、印刷関連プログラム424bを実行することによって、印刷関連処理部424b′(図2参照)として機能する。印刷関連処理部424b′は、音声データを解析して得られるテキストデータを用いて、プリンタ200に動作指示を行うコマンドを生成する処理などを実行する。
図2は、画像形成システム1000によって実行される印刷制御処理のシーケンスを示している。印刷制御処理は、スマートスピーカ300とアプリケーションサーバ400とが協働して、プリンタ200に印刷を実行させる処理である。
図2において、まずS2で、ユーザが発話する。ユーザは、アプリケーションサーバ400あるいはプリンタ200に既に登録されているテンプレートを用いて印刷したいと思ったので、スマートスピーカ300に対して、例えば「テンプレートAに○○で撮った写真を印刷して」と指示する。印刷制御処理は、スマートスピーカ300がその発話された音声を検出した場合に、開始する。
S4では、スマートスピーカ300は、ユーザによって発話された音声を示す音声データを生成する。つまり、「テンプレートAに○○で撮った写真を印刷して」との音声がスマートスピーカ300に入力されると、スマートスピーカ300は、その音声を示す音声データを生成する。
次に、S6では、スマートスピーカ300は、その音声データと登録済みのユーザIDとをアプリケーションサーバ400の音声解析処理部424a′に送信する。音声データの送信には、公知のプロトコル、例えば、HTTPが用いられる。なお、スマートスピーカ300には、ユーザの声紋が登録できるようになっており、スマートスピーカ300は、入力された音声に基づいて声紋認識を行い、認識した声紋と登録されている声紋とが一致した場合に、ユーザIDを送信する。したがって、スマートスピーカ300からユーザIDが送信されたときには、その前段階で既に、声紋認識はなされている。
アプリケーションサーバ400がその音声データとユーザIDとを受信すると、S8にて、アプリケーションサーバ400の音声解析処理部424a′は、受信された音声データを解析する。具体的には、音声解析処理部424a′は、音声データに対して音声認識処理を実行し、音声データによって示される音声を示すテキストデータを生成する。例えば、「テンプレートAに○○で撮った写真を印刷して」との音声を示す音声データを受信した場合には、音声解析処理部424a′は、その音声の内容を示すテキストデータを生成する。音声解析処理部424a′は、さらに、そのテキストデータに対して形態素解析処理を実行する。これにより、生成されたテキストデータから、例えば、「テンプレートA」、「○○で撮った写真」、「印刷して」などの単語が抽出されるとともに、これらの単語の品詞種別(例えば、名詞、動詞)が特定される。音声解析処理部424a′は、形態素解析結果として、抽出された単語に品詞種別を対応付けたリストを生成する。
次に、S10では、音声解析処理部424a′は、生成されたテキストデータと、形態素解析結果と、スマートスピーカ300から受信されたユーザIDと、を、印刷関連処理部424b′に渡す。具体的には、音声解析処理部424a′は、例えば、データ記憶領域422内の所定領域にテキストデータと形態素解析結果とユーザIDとを格納して、印刷関連プログラム424bをコールする。
音声解析処理部424a′からテキストデータと形態素解析結果とユーザIDとを受け取ると、S12にて、印刷関連処理部424b′は、テキストデータと形態素解析結果とを用いて、テンプレート特定処理を実行する。具体的には、印刷関連処理部424b′は、テンプレートAがアプリケーションサーバ400に記憶されているものであるか、あるいはプリンタ200に記憶されているものであるかを特定する。テンプレートAが、例えば、プリンタ200に記憶されている上記テンプレート群210aに含まれていたとすると、印刷関連処理部424b′は、テンプレートAはプリンタ200内のテンプレートであると特定する。図4(a)は、“テンプレートA”T1の一例を示している。“テンプレートA”T1は、画像データ入力ボックスT11と、バックグラウンド画像T12とによって構成されている。なお、画像データ入力ボックスT11は、図示例では矩形状となっているが、これに限らず、円形状やハート形状など、種々の形状を採るようにしてもよい。
次に、S14では、印刷関連処理部424b′は、テキストデータと形態素解析結果とを用いて、上記画像データ群422bから写真画像データを条件検索する。具体的には、印刷関連処理部424b′は、「○○で撮った写真」に該当する写真画像データを画像データ群422bから抽出する。
例えば、「○○」が「京都」であるとすると、印刷関連処理部424b′は、撮影場所が京都であることを検索条件として、画像データ群422bから写真画像データを抽出する。具体的には、画像データ群422bに含まれる写真画像データが、例えば、Exif( Exchange image file format の略語である)に従う写真画像データである場合、印刷関連処理部424b′は、写真画像データ内のメタデータに含まれる位置情報(ジオタグ)が示す位置が京都府内に含まれる写真画像データを抽出する。また、写真画像データ内のメタデータに含まれるコメント領域に撮影場所が記載されていれば、これに基づいて検索条件に合致する写真画像データを抽出するようにしてもよい。
一方、「○○」が「公園」などのように、撮影場所が1つの地点に決まらない場合には、印刷関連処理部424b′は、コメント領域の記載内容に基づいて検索したり、写真画像を画像認識し、公園が写っている写真画像データを抽出したりするようにすればよい。
また、ユーザが「○○で撮った写真」ではなく、「自分の写った写真」をテンプレート印刷したい場合には、例えば、アプリケーションサーバ400の記憶部420のデータ記憶領域422内に、ユーザIDに対応付けてユーザの顔の画像データが登録されているとすると、印刷関連処理部424b′は、上記撮影場所が1つの地点に決まらない場合と同様にして、コメント領域の記載内容に基づいて検索したり、写真画像を画像認識し、ユーザが写っている写真画像データを抽出したりするようにすればよい。なお、本実施形態では上述のように、ユーザの声紋認識は、スマートスピーカ300側で行われ、スマートスピーカ300がユーザIDを送信するときには、既にユーザの声紋認識は終了しているとした。しかし、これに限らず、ユーザの声紋認識は、アプリケーションサーバ400で行われるとしてもよい。その場合には、上記データ記憶領域422内に、ユーザの声紋とユーザの顔の画像データとを対応付けて登録されている必要がある。
さらに、ユーザは「特定サイズの写真」、「特定の色合いの写真」、「特定のデータフォーマットの写真」など、テンプレートAに挿入する写真を検索する条件として種々の条件を指定する場合があるが、検索対象の写真画像データ内に、指定された条件に対応する情報が含まれていれば、印刷関連処理部424b′は、同様にして検索条件に合致する写真画像データを抽出することができる。
なお、印刷関連処理部424b′が自ら、検索条件に合致する写真画像データを検索するのではなく、写真画像データを保存し、保存した写真画像データを用いて各種サービスを提供しているサービス事業者に検索条件を渡し、そのサービス事業者から検索条件に合致した写真画像データを受け取ることで、写真画像データを取得するようにしてもよい。例えば、印刷関連処理部424b′は、サービス事業者が運営するサーバが提供するAPI(Application Programming Interface の略語である)に検索条件を渡し、その応答である写真画像データを取得する。
次に、S16では、印刷関連処理部424b′は、テンプレート印刷コマンドを作成する。テンプレート印刷コマンドは、印刷に用いるテンプレートを特定するテンプレート特定情報を含み、テンプレート印刷コマンドと一緒に送信される画像データを、テンプレート特定情報によって特定されるテンプレートの画像データ入力ボックスに入れて印刷することを指示するコマンドである。なお、テンプレート印刷コマンドと一緒に送信される画像データ、つまり写真画像データに撮影日時が含まれており、かつ印刷に用いるテンプレート、つまりテンプレートAに日付オブジクトが含まれている場合には、撮影日時の情報を日付オブジクトの設定値として、テンプレート印刷コマンドに追加するようにしてもよい。
次に、S18では、印刷関連処理部424b′は、作成したテンプレート印刷コマンド及び抽出した写真画像データをスマートスピーカ300に送信する。
そして、スマートスピーカ300は、S20にて、受信したテンプレート印刷コマンドと写真画像データをそのまま、プリンタ200に送信する。プリンタ200は、テンプレート印刷コマンドと写真画像データを受信し、S22にて、テンプレート印刷を実行する。具体的には、プリンタ200は、受信したテンプレート印刷コマンドに含まれるテンプレート特定情報が示すテンプレート、つまりテンプレートAを上記テンプレート群210aから読み出す。そして、プリンタ200は、テンプレートAの画像データ入力ボックスT11(図4(a))に受信した写真画像データを入力して印刷する。
図4(b)は、“テンプレートA”T1の画像データ入力ボックスT11に受信した写真画像データを入力して印刷した印刷画像P1の一例を示している。印刷画像P1は、バックグラウンド画像P12内の画像データ入力ボックスT11の領域内に写真画像データの列画像P11が挿入されたものとなっている。このように、ユーザは、「テンプレートAに○○で撮った写真を印刷して」と発音するだけで、プリンタ200に「○○で撮った写真」の入った印刷画像P1を印刷させることができる。
なお、ユーザが発話した検索条件に、印刷関連処理部424b′が独自に選定した検索条件を加えることにより、写真画像データの検索を行うようにしてもよい。独自に選定した検索条件とは、具体的には、画像データ入力ボックスT11のサイズである。この場合、印刷関連処理部424b′は、「○○で撮った」+「サイズ」に合致する写真画像データを画像データ群422bから抽出する。
また、画像データ入力ボックスT11に入力する画像データは、写真画像データに限らない。例えば、ロゴマークや模様、絵など、種々の画像データを入力してもよい。
図3は、テンプレートAがアプリケーションサーバ400の記憶部420内の上記テンプレート群422aに含まれている場合に、画像形成システム1000によって実行される印刷制御処理のシーケンスを示している。図3の印刷制御処理のシーケンスは、図2の印刷制御処理のシーケンスの一部を変更して構成されている。このため、図3中、図2と同様の処理には、同一符号を付して、その説明を省略する。
図3において、S32では、印刷関連処理部424b′は、テキストデータと形態素解析結果とを用いて、テンプレート読出処理を実行する。具体的には、印刷関連処理部424b′は、テンプレートAをテンプレート群422aから検索して読み出す。そして、印刷関連処理部424b′は、S14にて、上述のようにして写真画像データを条件検索して取得する。
次に、S36では、印刷関連処理部424b′は、読み出した“テンプレートA”T1の画像データ入力ボックスT11に取得した写真画像データを入力し、写真画像データが入力された“テンプレートA”T1を印刷用画像データに変換し、S38にて、スマートスピーカ300に送信する。
S40では、スマートスピーカ300は、プリンタ200に、受信した印刷用画像データと、その印刷指示を行う印刷指示コマンドを送信する。プリンタ200は、印刷用画像データと印刷指示コマンドを受信し、S42にて、印刷用画像データに基づいて印刷を実行する。
このように、テンプレートAがアプリケーションサーバ400の記憶部420内のテンプレート群422aに含まれている場合でも、ユーザは、「テンプレートAに○○で撮った写真を印刷して」と発音するだけで、プリンタ200に「○○で撮った写真」の入った印刷画像P1を印刷させることができる。
上記S14では、印刷関連処理部424b′は、条件検索により1つの写真画像データを抽出する場合を説明したが、複数の写真画像データが抽出される場合もある。図4(c)は、条件検索により写真画像A~Dの4枚の写真画像データが抽出された例を示している。“テンプレートA”T1には、画像データ入力ボックスT11が1つだけ含まれるため、印刷関連処理部424b′は、写真画像A~Dの中からいずれか1枚の写真画像に絞り込む必要がある。絞り込む方法は、各種考えられる。
まず、ユーザに絞り込み条件を発話するように促す方法を挙げることができる。図5は、この場合に画像形成システム1000によって実行される印刷制御処理のシーケンスの一例を示している。なお、図5のシーケンスは、図2のシーケンスのS14以降の処理を示している。
図5において、S50では、印刷関連処理部424b′は、例えば「4枚の写真が抽出されました。1枚の写真にするために絞り込み条件を言ってください」のテキストデータを生成し、音声解析処理部424a′に渡す。これに応じて、音声解析処理部424a′は、S52にて、そのテキストデータに基づいて音声データを作成し、S54にて、スマートスピーカ300に送信する。
スマートスピーカ300は、S56にて、受信した音声データを音声として発生させる。この音声を聞いたユーザは、S58にて、例えば「清水寺」と発話する。これに応じて、スマートスピーカ300及び音声解析処理部424a′は、上記S4~S10の処理と同様の処理を実行し、テキストデータを生成して、印刷関連処理部424b′に渡す。印刷関連処理部424b′は、S62にて、現在の検索条件「京都」に絞り込み条件「清水寺」を追加して、「京都」+「清水寺」の検索条件で写真画像データを絞り込み検索する。以上の処理を、写真画像データが1つになるまで繰り返す。そして、写真画像データが1つになると、印刷関連処理部424b′、スマートスピーカ300及びプリンタ200は、上記S16~S22の処理を実行して、テンプレート印刷を実行する。
なお、絞り込み条件は、場所に関するものではなく、撮影日時(例えば、ある範囲を持った期間)や色(例えば、「明るい」「暗い」など)、被写体(例えば、「花」「船」など)など、各種考えられる。
次に、写真画像A~Dをスマートスピーカ300の表示部340に表示させて、ユーザにいずれか1枚を選択させる方法を挙げることができる。この場合、印刷関連処理部424b′は、抽出した写真画像A~Dの画像データをスマートスピーカ300に送信する。このとき、印刷関連処理部424b′は、「4枚の写真が抽出されました。どれか1枚の写真を選択してください」のテキストデータを生成し、上記処理と同様にして、スマートスピーカ300から、そのテキストデータに応じた音声を発生させる。この音声を聞いたユーザは、例えば「写真A」と発話する。これに応じて、スマートスピーカ300及び音声解析処理部424a′は、上記S4~S10の処理と同様の処理を実行し、テキストデータを生成して、印刷関連処理部424b′に渡す。印刷関連処理部424b′は、S14にて、写真画像Aの写真画像データを取得する。なお、写真画像A~Dを表示部340に表示する場合、優先度が高いものほど、上位に表示する方が好ましい。例えば、撮影日付(時刻も含む)がより新しいものほど優先度を高くすることが考えられる。
次に、ユーザの意向を聞かず、印刷関連処理部424b′が自動的に写真画像A~Dの中からいずれか1枚の写真画像を選択する方法を挙げることができる。この場合、印刷関連処理部424b′は、上記優先度が最も高い写真画像データを選択すればよい。また、優先度の他に、写真画像A~Dの各サイズにばらつきがある場合には、画像データ入力ボックスT11に最も適合する写真画像データを選択することが考えられる。さらに、写真画像A~Dのいずれも、画像データ入力ボックスT11のサイズより大きく、縮小しなければ収まらない場合には、縮小したときに最も見易い写真画像データを選択することが考えられる。
以上説明したように、本実施形態のアプリケーションサーバ400は、ネットワークIF480と、CPU410と、を備えている。CPU410は、ネットワークIF480を介して接続された、音声を入力及び出力するスマートスピーカ300から、プリンタ200のユーザが発話することにより入力された音声の内容を認識し(S8)、認識された音声の内容が、テンプレートAを指定し、そのテンプレートAに挿入する写真画像データの属性を指定して画像形成を指示する内容である場合、認識された音声の内容から、指定された写真画像データの属性を抽出し、抽出された属性を有する写真画像データを取得し(S14)、指定されたテンプレートに取得した写真画像データを挿入して印刷を行うべくコマンドをプリンタ200に送信する(S16,S18)。
このように、本実施形態のアプリケーションサーバ400では、発音によりユーザの意図に沿った写真画像データを検索して画像形成に用いることが可能となる。
ちなみに、本実施形態において、アプリケーションサーバ400は、「情報処理装置」の一例である。ネットワークIF480は、「通信インタフェース」の一例である。記憶部420は、「記憶装置」の一例である。CPU410は、「制御装置」の一例である。プリンタ200は、「画像形成装置」の一例である。テンプレートAは、「テンプレート」の一例である。写真画像データは、「画像データ」の一例である。印刷は、「画像形成」の一例である。
また、CPU410は、取得する写真画像データとしてさらに、指定されたテンプレートに挿入する写真画像データの条件を満たした写真画像データを取得する。これにより、ユーザの意図にさらに沿った写真画像データを取得して、テンプレート印刷することができる。
また、アプリケーションサーバ400はさらに、人の顔の画像データと、人が発した声の声紋とを対応付けて記憶する記憶部420を備え、CPU410は、入力された音声に基づいて声紋認識を行い、認識された声紋を有する人の顔の画像データを記憶部420から読み出し、取得する写真画像データとしてさらに、読み出された人の顔の画像データを含む写真画像データを取得する。これにより、ユーザの意図にさらに沿った写真画像データを取得して、テンプレート印刷することができる。ちなみに、記憶部420は、「第1記憶装置」の一例である。
また、CPU410は、送信された写真画像データに撮影日時が含まれている場合、撮影日時を挿入して印刷を行う指示をコマンドに追加する。これにより、撮影日時が自動的に挿入された印刷結果が得られるので、便利である。ちなみに、撮影日時は、「日付情報」の一例である。
また、CPU410は、コマンドの送信に代えて、指定されたテンプレートAを取得し(S32)、取得されたテンプレートAに取得された写真画像データを挿入し、写真画像データが挿入されたテンプレートAを印刷用画像データに変換し(S36)、変換された印刷用画像データをプリンタ200に送信する(S38)。これにより、プリンタ200にテンプレートAが記憶されていなくても、アプリケーションサーバ400に記憶されていれば、テンプレートAに基づいたテンプレート印刷することができるので、便利である。
また、CPU410は、抽出された属性を示す情報を、ネットワークIF480を介して接続された他の情報処理装置に送信し、これに応じて他の情報処理装置が検索し、アプリケーションサーバ400に送信した、抽出された属性を有する写真画像データを取得する。これにより、アプリケーションサーバ400自ら抽出された属性を有する写真画像データを取得しなくてもよいので、アプリケーションサーバ400に対する負荷を低減させることが可能となる。
また、アプリケーションサーバ400はさらに、複数の画像データを記憶する記憶部420を備え、CPU410は、抽出された属性を有する写真画像データを、記憶部420及びネットワークIF480を介して接続された他の情報処理装置から検索して取得する。これにより、ユーザの意図する写真画像データをより広い範囲で検索して取得することができるので、ユーザの意図にさらに沿った写真画像データを取得して、テンプレート印刷することができる。ちなみに、記憶部420は、「第2記憶装置」の一例である。
また、CPU410は、取得された写真画像データが、指定されたテンプレートに挿入可能な数を超えた場合、写真画像データを絞り込むための絞り込み条件の発音をユーザに促すことを発音する音声データを、ネットワークIF480を介してスマートスピーカ300に送信し(S50~S54)、これに応じてユーザが絞り込み条件を発音すると(S58)、取得された写真画像データを発音に係る絞り込み条件に基づいて絞り込む(S62)。これにより、ユーザの意図にさらに沿った写真画像データを取得して、テンプレート印刷することができる。
また、CPU410は、ネットワークIF480を介して接続されたスマートスピーカ300の表示部340に、取得された写真画像データをプレビュー表示し、ユーザがプレビュー表示された写真画像データの中から採用する写真画像データを指定する発音を行った場合、指定された写真画像データをテンプレートAに挿入する写真画像データに決定する。これにより、ユーザの意図にさらに沿った写真画像データを取得して、テンプレート印刷することができる。ちなみに、スマートスピーカ300の表示部340は、「ディスプレイ」の一例である。
また、CPU410は、プレビュー表示する写真画像データが複数ある場合、複数の写真画像データを優先度順にプレビュー表示する。これにより、ユーザは優先度を考慮しながら写真画像データを選択することができるので、便利である。
なお、本発明は上記実施形態に限定されるものでなく、その趣旨を逸脱しない範囲で様々な変更が可能である。
(1)上記実施形態では、音声データを解析する処理は、アプリケーションサーバ400の音声解析処理部424a′が実行している。これに代えて、音声データを解析する処理の一部または全部は、スマートスピーカ300が実行してもよい。また、音声データを解析する処理の一部または全部は、印刷関連処理部424b′が実行してもよい。例えば、音声解析処理部424a′は、音声認識処理を行ってテキストデータを生成する処理だけを行い、単語を抽出する形態素解析処理は、印刷関連処理部424b′が実行してもよい。また、印刷関連処理部が行う一部または全部は、スマートスピーカ300が実行してもよい、或いはプリンタ200、或いは他の情報端末で実行してもよい。
(2)上記実施形態では、画像形成装置として、プリンタ200を採用したが、これに限らず、印刷機能にスキャン機能やファックス機能を加えた複合機を採用してもよい。この場合には、例えば、スマートスピーカ300に入力される音声に応じて、その複合機に印刷を行わせることができる。
(3)アプリケーションサーバ400は、クラウドサーバであるが、LAN70に接続され、インターネット80に接続されないローカルサーバであってもよい。この場合には、スマートスピーカ300からアプリケーションサーバ400にユーザIDなどの識別情報を送信せず、音声データだけを送信してもよい。
(4)スマートスピーカ300とプリンタ200とを接続するインタフェースは、ブルートゥースIF160に限らず、例えば、無線LAN、有線LAN、USBなどのインタフェースであってもよい。
(5)上記実施形態において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されていた構成の一部をハードウェアに置き換えるようにしてもよい。
50…アクセスポイント、70…LAN、80…インターネット、200…プリンタ、210…制御部、250…印刷機構、260,360…ブルートゥースIF、300…スマートスピーカ、310…制御部、340…表示部、350…音声入出力部、380…無線LANIF、400…アプリケーションサーバ、410…CPU、420…記憶部、424a…音声解析プログラム、424b…印刷関連プログラム、424b′…印刷関連処理部、424a′…音声解析処理部、480…ネットワークIF、1000…画像形成システム。

Claims (13)

  1. 通信インタフェースと、
    制御装置と、
    を備え、
    前記制御装置は、
    前記通信インタフェースを介して接続された、音声を入力及び出力するスマートスピーカから、画像形成装置のユーザが発話することにより入力された音声の内容を認識し、
    前記認識された音声の内容が、テンプレートを指定し、そのテンプレートに挿入する画像データの属性を指定して画像形成を指示する内容である場合、
    前記認識された音声の内容から、前記指定された画像データの属性を抽出し、
    前記抽出された属性を有する画像データを取得し、
    前記指定されたテンプレートに前記取得した画像データを挿入して画像形成を行うべくコマンドを前記画像形成装置に送信する、
    情報処理装置。
  2. 前記制御装置は、前記取得する画像データとしてさらに、前記指定されたテンプレートに挿入する画像データの条件を満たした画像データを取得する、
    請求項1に記載の情報処理装置。
  3. 前記画像データの条件は、画像データのサイズ、色及びデータフォーマットを含む、
    請求項2に記載の情報処理装置。
  4. 前記情報処理装置はさらに、
    人の顔の画像データと、前記人が発した声の声紋とを対応付けて記憶する第1記憶装置
    を備え、
    前記制御装置は、
    前記入力された音声に基づいて声紋認識を行い、
    前記認識された声紋を有する人の顔の画像データを前記第1記憶装置から読み出し、
    前記取得する画像データとしてさらに、前記読み出された人の顔の画像データを含む画像データを取得する、
    請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 前記制御装置は、前記送信された画像データに日付情報が含まれている場合、前記日付情報を挿入して前記画像形成を行う指示を前記コマンドに追加する、
    請求項1乃至4のいずれか1項に記載の情報処理装置。
  6. 前記制御装置は、
    前記コマンドの送信に代えて、
    前記指定されたテンプレートを取得し、
    前記取得されたテンプレートに前記取得された画像データを挿入し、
    前記画像データが挿入されたテンプレートを印刷用画像データに変換し、
    前記変換された印刷用画像データを前記画像形成装置に送信する、
    請求項1に記載の情報処理装置。
  7. 前記制御装置は、
    前記抽出された属性を示す情報を、前記通信インタフェースを介して接続された他の情報処理装置に送信し、
    これに応じて前記他の情報処理装置が検索し、前記情報処理装置に送信した、前記抽出された属性を有する画像データを取得する、
    請求項1乃至6のいずれか1項に記載の情報処理装置。
  8. 前記情報処理装置はさらに、
    複数の画像データを記憶する第2記憶装置
    を備え、
    前記制御装置は、
    前記抽出された属性を有する画像データを、前記第2記憶装置及び前記通信インタフェースを介して接続された他の情報処理装置から検索して取得する、
    請求項1乃至7のいずれか1項に記載の情報処理装置。
  9. 前記制御装置は、
    前記取得された画像データが、前記指定されたテンプレートに挿入可能な数を超えた場合、
    画像データを絞り込むための絞り込み条件の発音を前記ユーザに促すことを発音する音声データを、前記通信インタフェースを介して前記スマートスピーカに送信し、
    これに応じて前記ユーザが前記絞り込み条件を発音すると、前記取得された画像データを前記発音に係る前記絞り込み条件に基づいて絞り込む、
    請求項1乃至8のいずれか1項に記載の情報処理装置。
  10. 前記制御装置は、
    前記通信インタフェースを介して接続されたディスプレイに、前記取得された画像データをプレビュー表示し、
    前記ユーザが前記プレビュー表示された画像データの中から採用する画像データを指定する発音を行った場合、
    前記指定された画像データを前記テンプレートに挿入する画像データに決定する、
    請求項1乃至9のいずれか1項に記載の情報処理装置。
  11. 前記制御装置は、前記プレビュー表示する画像データが複数ある場合、前記複数の画像データを優先度順にプレビュー表示する、
    請求項10に記載の情報処理装置。
  12. 前記画像データの属性は、前記画像データを撮像した場所、前記画像データを撮像した日付及び前記画像データに含まれる被写体を含む、
    請求項1乃至11のいずれか1項に記載の情報処理装置。
  13. 通信インタフェースを備えた情報処理装置を用いた情報処理方法であって、
    前記通信インタフェースを介して接続された、音声を入力及び出力するスマートスピーカから、画像形成装置のユーザが発話することにより入力された音声の内容を認識する認識処理と、
    前記認識処理によって認識された音声の内容が、テンプレートを指定し、そのテンプレートに挿入する画像データの属性を指定して画像形成を指示する内容である場合、
    前記認識された音声の内容から、前記指定された画像データの属性を抽出する抽出処理と、
    前記抽出処理によって抽出された属性を有する画像データを取得する取得処理と、
    前記指定されたテンプレートに前記取得処理によって取得された画像データを挿入して画像形成を行うべくコマンドを前記画像形成装置に送信する第2送信処理と、
    を含む情報処理方法。
JP2020063717A 2020-03-31 2020-03-31 情報処理装置及び情報処理方法 Active JP7447633B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020063717A JP7447633B2 (ja) 2020-03-31 2020-03-31 情報処理装置及び情報処理方法
US17/210,437 US11474782B2 (en) 2020-03-31 2021-03-23 Information processing apparatus, information processing method and non-transitory computer-readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020063717A JP7447633B2 (ja) 2020-03-31 2020-03-31 情報処理装置及び情報処理方法

Publications (2)

Publication Number Publication Date
JP2021163164A JP2021163164A (ja) 2021-10-11
JP7447633B2 true JP7447633B2 (ja) 2024-03-12

Family

ID=78003426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020063717A Active JP7447633B2 (ja) 2020-03-31 2020-03-31 情報処理装置及び情報処理方法

Country Status (1)

Country Link
JP (1) JP7447633B2 (ja)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001136368A (ja) 1999-09-28 2001-05-18 Hewlett Packard Co <Hp> 画像併合方法
WO2004014074A1 (ja) 2002-08-01 2004-02-12 Seiko Epson Corporation 画像再生装置、画像保持装置、及び、画像再生システム
JP2008305311A (ja) 2007-06-11 2008-12-18 Sony Corp 表示装置および方法、プログラム、並びに記録媒体。
JP2015011621A (ja) 2013-07-01 2015-01-19 シャープ株式会社 会話処理装置、制御方法、制御プログラム、および記録媒体
JP2015179223A (ja) 2014-03-20 2015-10-08 フリュー株式会社 サーバ、写真撮影編集装置、情報処理端末、制御プログラム、および記録媒体
JP2016063400A (ja) 2014-09-18 2016-04-25 株式会社沖データ 画像処理装置および画像処理方法
JP2018018403A (ja) 2016-07-29 2018-02-01 富士フイルム株式会社 サーバ、端末装置、画像処理システム、画像処理方法、プログラムおよび記録媒体
JP2019046103A (ja) 2017-08-31 2019-03-22 キヤノン株式会社 システム、音声制御デバイス、及び印刷装置
JP2019074872A (ja) 2017-10-13 2019-05-16 セイコーエプソン株式会社 表示装置、表示方法および表示プログラム
JP2019117441A (ja) 2017-12-26 2019-07-18 大日本印刷株式会社 操作表示装置及びプログラム
JP2020009011A (ja) 2018-07-04 2020-01-16 大日本印刷株式会社 フォトブック作製システム及びサーバ装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001136368A (ja) 1999-09-28 2001-05-18 Hewlett Packard Co <Hp> 画像併合方法
WO2004014074A1 (ja) 2002-08-01 2004-02-12 Seiko Epson Corporation 画像再生装置、画像保持装置、及び、画像再生システム
JP2008305311A (ja) 2007-06-11 2008-12-18 Sony Corp 表示装置および方法、プログラム、並びに記録媒体。
JP2015011621A (ja) 2013-07-01 2015-01-19 シャープ株式会社 会話処理装置、制御方法、制御プログラム、および記録媒体
JP2015179223A (ja) 2014-03-20 2015-10-08 フリュー株式会社 サーバ、写真撮影編集装置、情報処理端末、制御プログラム、および記録媒体
JP2016063400A (ja) 2014-09-18 2016-04-25 株式会社沖データ 画像処理装置および画像処理方法
JP2018018403A (ja) 2016-07-29 2018-02-01 富士フイルム株式会社 サーバ、端末装置、画像処理システム、画像処理方法、プログラムおよび記録媒体
JP2019046103A (ja) 2017-08-31 2019-03-22 キヤノン株式会社 システム、音声制御デバイス、及び印刷装置
JP2019074872A (ja) 2017-10-13 2019-05-16 セイコーエプソン株式会社 表示装置、表示方法および表示プログラム
JP2019117441A (ja) 2017-12-26 2019-07-18 大日本印刷株式会社 操作表示装置及びプログラム
JP2020009011A (ja) 2018-07-04 2020-01-16 大日本印刷株式会社 フォトブック作製システム及びサーバ装置

Also Published As

Publication number Publication date
JP2021163164A (ja) 2021-10-11

Similar Documents

Publication Publication Date Title
JP7224863B2 (ja) 中継サーバおよび制御方法
JP5146429B2 (ja) 画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム
JP2010252047A (ja) 電子装置及び電子装置の設定方法
US20090287491A1 (en) Data processing apparatus, speech conversion method, and speech conversion program embodied on computer readable medium
CN110875993A (zh) 带交互代理功能的图像形成系统及其控制方法和存储介质
US12015746B2 (en) Image processing system, setting control method, image processing apparatus, and storage medium
US8773696B2 (en) Method and system for generating document using speech data and image forming apparatus including the system
JP2015103919A (ja) 情報処理装置、システム、方法およびプログラム
US20200341728A1 (en) Information processing system and non-transitory recording medium
JP2023025021A (ja) 画像処理システム、及びその制御方法
US11474782B2 (en) Information processing apparatus, information processing method and non-transitory computer-readable medium
JP7447633B2 (ja) 情報処理装置及び情報処理方法
JPH11175092A (ja) オーディオから派生したテキストのイメージとの関連付け
EP3716040A1 (en) Image forming apparatus and job execution method
US20100241653A1 (en) Information providing apparatus, information providing method, and information providing program embodied on computer readable medium
JP2019135609A (ja) 文字入力支援システム、文字入力支援制御装置、文字入力支援プログラム
US11568854B2 (en) Communication system, server system, and control method
JP7388272B2 (ja) 情報処理装置、情報処理方法及びプログラム
CN115811576A (zh) 带交互代理功能的图像形成系统及其控制方法和存储介质
JP2020035203A (ja) デジタル履歴書作成システム
US11837226B2 (en) Information processing apparatus, information processing method, electronic device and information processing system
US12051411B2 (en) Speech setting system, speech setting assistance device and non-transitory computer-readable recording medium encoded with speech setting assistance program
CN112684990B (zh) 印刷系统、印刷方法以及信息处理装置
CN112684989B (zh) 印刷系统、印刷方法以及信息处理装置
JP7349533B2 (ja) 情報処理システム、及び情報処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230328

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231019

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240212

R150 Certificate of patent or registration of utility model

Ref document number: 7447633

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150