JP2021163069A - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP2021163069A
JP2021163069A JP2020062762A JP2020062762A JP2021163069A JP 2021163069 A JP2021163069 A JP 2021163069A JP 2020062762 A JP2020062762 A JP 2020062762A JP 2020062762 A JP2020062762 A JP 2020062762A JP 2021163069 A JP2021163069 A JP 2021163069A
Authority
JP
Japan
Prior art keywords
voice
value
image forming
forming apparatus
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020062762A
Other languages
English (en)
Other versions
JP7400593B2 (ja
Inventor
直毅 楠本
Naoki Kusumoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2020062762A priority Critical patent/JP7400593B2/ja
Priority to US17/210,444 priority patent/US11563864B2/en
Publication of JP2021163069A publication Critical patent/JP2021163069A/ja
Application granted granted Critical
Publication of JP7400593B2 publication Critical patent/JP7400593B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

【課題】ユーザの意図通りの画像形成を行うことが可能となる、音声による設定パラメータの変更技術を提供する。【解決手段】CPU410は、ネットワークIF480を介して接続された、音声を入力及び出力するスマートスピーカ300から、プリンタ200のユーザが発音することにより入力された音声の内容を認識し(S8)、認識された音声の内容が、プリンタ200が形成した画像に対するユーザの不満あるいは要求を示す内容である場合、認識された音声の内容に基づいて、プリンタ200が変更すべき設定パラメータの項目及び値を決定するための処理を実行し(S12)、決定された設定パラメータの項目及び値を含むコマンドを生成し(S36)、生成されたコマンドをプリンタ200に送信する(S38)。【選択図】 図3

Description

本願は、画像形成装置を音声により制御する技術に関するものである。
特許文献1には、パネル部でのタッチ操作による指示と、音声による指示とに基づいた操作処理を行う電子機器が記載されている。
特開2019−139674号公報
しかし、特許文献1に記載の電子機器では、音声による画像形成装置の設定パラメータの値の変更指示は、その設定パラメータの値そのものを指定して指示しているので、ユーザがその設定パラメータの値と画像形成結果の関係をよく理解していないような場合、指示後の設定パラメータの値で画像形成装置に画像形成を行わせた場合であっても、ユーザの意図通りの画像形成がなされない虞が生ずる。
本願は、ユーザの意図通りの画像形成を行うことが可能となる、音声による設定パラメータの変更技術を提供することを目的とする。
上記目的を達成するため、本願の情報処理装置は、通信インタフェースと、制御装置と、を備え、制御装置は、通信インタフェースを介して接続された、音声を入力及び出力するスマートスピーカから、画像形成装置のユーザが発音することにより入力された音声の内容を認識し、認識された音声の内容が、画像形成装置が形成した画像に対するユーザの不満あるいは要求を示す内容である場合、認識された音声の内容に基づいて、画像形成装置が変更すべき設定パラメータの項目及び値を決定するための処理を実行し、決定された設定パラメータの項目及び値を含むコマンドを生成し、生成されたコマンドを画像形成装置に送信する。
なお、本明細書に開示される技術は、種々の形態で実現することが可能であり、例えば、情報処理方法、画像形成装置の制御方法、装置の機能または上記方法を実現するためのコンピュータプログラム、そのコンピュータプログラムを記録した記録媒体、等の形態で実現することができる。
本願によれば、ユーザの意図通りの画像形成を行うことが可能となる。
本願の一実施形態に係る画像形成システムの構成を示すブロック図である。 図1の画像形成システムによって実行される印刷制御処理のシーケンス図である。 図2のシーケンス図の続きのシーケンス図である。 ログ情報として記憶されるデータの一例を示す図である。
以下、本願の実施の形態を図面に基づいて詳細に説明する。
図1は、本願の一実施形態に係る画像形成システム1000の構成を示している。画像形成システム1000は、中継器100と、プリンタ200と、スマートスピーカ300と、アプリケーションサーバ400とにより主として構成されている。なお、本実施形態の画像形成システム1000では、中継器100とプリンタ200とスマートスピーカ300は、同じユーザによって利用される。
画像形成システム1000で用いられるアクセスポイント50は、例えば、IEEE802.11a/b/g/nの規格に従った通信方式を用いて無線LANのアクセスポイントとしての機能を実現する。アクセスポイント50は、LAN70に接続されている。LAN70は、例えば、イーサネット(登録商標)規格に準拠して構築された有線ネットワークである。LAN70は、インターネット80に接続されている。アプリケーションサーバ400は、インターネット80に接続されている。
中継器100は、アプリケーションサーバ400とプリンタ200との間で送受信されるデータを中継する装置である。中継器100は、中継器100全体を制御するためのCPU110と、ROMやRAM、NVMなどのメモリ120と、プリンタ200とP2P通信するためのブルートゥース(登録商標)IF160と、アプリケーションサーバ400と通信するための無線LANIF180と、を主に備えている。中継器100は、例えば、スマートフォン等のモバイル端末によって構成されている。なお、NVMは、non-volatile memoryの略語であり、P2Pは、Peer to Peerの略語であり、IFは、Interfaceの略語である。
メモリ120は、データ記憶領域122及び制御プログラム領域124を含んでいる。データ記憶領域122は、CPU110が制御プログラムなどを実行する際に必要なデータなどを記憶する領域である。また、制御プログラム領域124は、OSや制御プログラム、ファームウェアなどを記憶する領域である。
ブルートゥースIF160は、アンテナを含み、ブルートゥース方式に準拠した近距離無線通信を行うためのインタフェースである。ブルートゥースIF160を介して、中継器100は、プリンタ200と通信可能に接続される。無線LANIF180は、アンテナを含み、例えば、IEEE802.11a/b/g/nの規格に従った通信方式を用いて無線通信を行う。これにより、中継器100は、アクセスポイント50を介してLAN70及びインターネット80に接続され、アプリケーションサーバ400と通信可能に接続される。なお、プリンタ200が無線LANIFを備える場合には、中継器100は無線LANIF180を介して、プリンタ200と通信可能に接続するように構成してもよい。
プリンタ200は、例えば、CPUとメモリを含む制御部210と、制御部210の制御に従って印刷を行う印刷機構250と、ブルートゥースIF260と、を備えている。印刷機構250は、シートに画像を印刷する機構であり、電子写真方式、インクジェット方式、サーマル方式等の印刷機構である。ブルートゥースIF260は、アンテナを含み、ブルートゥース方式に準拠した近距離無線通信を行うためのインタフェースであり、上述のように中継器100との通信のために用いられる。なお、プリンタ200は、ブルートゥースIF260に代えて無線LANIFを備え、中継器100と通信可能に接続するよう構成してもよい。
プリンタ200は、無線LANIFを備えていない場合、中継器100とは通信可能に接続されるが、アプリケーションサーバ400とは直接、通信することができない。
スマートスピーカ300は、ユーザが発話した音声に応じて特定の処理を実行する装置である。特定の処理は、例えば、音声データを生成して、アプリケーションサーバ400に送信する処理を含む。スマートスピーカ300は、CPUとメモリとを含む制御部310と、音声入出力部350と、ブルートゥースIF360と、無線LANIF380と、を備えている。
音声入出力部350は、スピーカとマイクとを含み、音声の入力と音声の出力に関する処理を実行する。例えば、音声入出力部350は、制御部310の制御に従って、ユーザが発話した音声を検出し、その音声を示す音声データを生成する。また、音声入出力部350は、受信した音声データに応じた音声をスピーカから発生する。
無線LANIF380は、アンテナを含み、例えば、IEEE802.11a/b/g/nの規格に従った通信方式を用いて無線通信を行う。これにより、スマートスピーカ300は、アクセスポイント50を介してLAN70及びインターネット80に接続され、アプリケーションサーバ400と通信可能に接続される。
アプリケーションサーバ400は、例えば、いわゆるクラウドサービスを提供する事業者が運営するサーバである。アプリケーションサーバ400は、アプリケーションサーバ400全体を制御するCPU410と、ROM、RAM、HDD、SSD及び光ディスクドライブなどを含む記憶部420と、を備えている。アプリケーションサーバ400は、さらに、インターネット80と接続するためのネットワークIF480を備えている。なお、図1では、アプリケーションサーバ400は、概念的に1個のサーバとして図示されているが、実際は、互いに通信可能に接続された複数個のサーバを含む、いわゆるクラウドサーバである。
記憶部420は、データ記憶領域422及びプログラム記憶領域424を含んでいる。データ記憶領域422は、CPU410が処理を行う際に必要なデータなどを記憶する記憶領域として、また、CPU410が処理を行う際に生成される種々の中間データを一時的に格納するバッファ領域として機能する。プログラム記憶領域424は、OS、情報処理プログラム、その他各種のアプリやファームウェアなどを記憶する領域である。情報処理プログラムには、音声解析プログラム424a及び印刷関連プログラム424bが含まれる。音声解析プログラム424aは、例えば、アプリケーションサーバ400の運営者によって、アプリケーションサーバ400にアップロードされることによって提供される。印刷関連プログラム424bは、例えば、アプリケーションサーバ400のリソースを利用して印刷サービスを提供する事業者、例えば、プリンタ200を製造する事業者によって、アプリケーションサーバ400にアップロードされることによって提供される。なお、音声解析プログラム424aの全部または一部が、プリンタ200を製造する事業者によって提供されてもよい。あるいは、印刷関連プログラム424bの全部または一部がアプリケーションサーバ400を運営する事業者によって提供されてもよい。
アプリケーションサーバ400、特にCPU410は、音声解析プログラム424aを実行することによって、音声解析処理部424a′(図2参照)として機能する。音声解析処理部424a′は、音声認識処理や形態素解析処理を実行する。音声認識処理は、音声データを解析して、音声データによって示される発話の内容を示すテキストデータを生成する処理である。形態素解析処理は、そのテキストデータを解析して、発話の内容に含まれる単語などの構成単位(形態素と呼ばれる)の抽出や、抽出された形態素の種別(例えば、品詞の種別)の特定を行う処理である。
また、アプリケーションサーバ400、特にCPU410は、印刷関連プログラム424bを実行することによって、印刷関連処理部424b′(図2参照)として機能する。印刷関連処理部424b′は、音声データを解析して得られるテキストデータを用いて、プリンタ200に動作指示を行うコマンドを生成する処理などを実行する。
図2及び図3は、画像形成システム1000によって実行される印刷制御処理のシーケンスを示している。印刷制御処理は、スマートスピーカ300とアプリケーションサーバ400とが協働して、プリンタ200に印刷を実行させる処理である。
図2及び図3の印刷制御処理は、所定の事前処理が実行された以降の処理を示している。その事前処理とは、まず、ユーザが、画像形成システム1000に含まれない端末装置、例えばスマートフォンやPC等を用いてスマートスピーカ300にアクセスし、上記制御部310に含まれるメモリにユーザIDと声紋を登録する。次に、ユーザは、アプリケーションサーバ400とプリンタ200との間でデータが正しく送受信されるように、中継器100、プリンタ200及びスマートスピーカ300を設定する。さらに、ユーザは、上記端末装置にインストールされた印刷アプリを用いてプリンタ200に印刷を指示する。このような事前処理の実行により、ユーザは、プリンタ200から印刷結果を受け取り、その印刷結果に不満あるいは要求を抱いている状態となっている。
図2において、まずS2で、ユーザが発話する。ユーザは、印刷結果が自身の意図した濃度より少し薄く感じたので、スマートスピーカ300に対して、例えば「もう少し濃くなる?」と問いかけている。印刷制御処理は、スマートスピーカ300がその発話された音声を検出した場合に、開始する。
S4では、スマートスピーカ300は、ユーザによって発話された音声を示す音声データを生成する。つまり、「もう少し濃くなる?」との音声がスマートスピーカ300に入力されると、スマートスピーカ300は、その音声を示す音声データを生成する。
次に、S6では、スマートスピーカ300は、その音声データと登録済みのユーザIDとをアプリケーションサーバ400の音声解析処理部424a′に送信する。音声データの送信には、公知のプロトコル、例えば、HTTPが用いられる。
アプリケーションサーバ400がその音声データとユーザIDとを受信すると、S8にて、アプリケーションサーバ400の音声解析処理部424a′は、受信された音声データを解析する。具体的には、音声解析処理部424a′は、音声データに対して音声認識処理を実行し、音声データによって示される音声を示すテキストデータを生成する。例えば、「もう少し濃くなる?」との音声を示す音声データを受信した場合には、音声解析処理部424a′は、その音声の内容を示すテキストデータを生成する。音声解析処理部424a′は、さらに、そのテキストデータに対して形態素解析処理を実行する。これにより、生成されたテキストデータから、例えば、「もう少し」、「濃く」、「なる?」などの単語が抽出されるとともに、これらの単語の品詞種別(例えば、名詞、動詞)が特定される。音声解析処理部424a′は、形態素解析結果として、抽出された単語に品詞種別を対応付けたリストを生成する。
次に、S10では、音声解析処理部424a′は、生成されたテキストデータと、形態素解析結果と、スマートスピーカ300から受信されたユーザIDと、を、印刷関連処理部424b′に渡す。具体的には、音声解析処理部424a′は、例えば、データ記憶領域422内の所定領域にテキストデータと形態素解析結果とユーザIDとを格納して、印刷関連プログラム424bをコールする。
音声解析処理部424a′からテキストデータと形態素解析結果とユーザIDとを受け取ると、S12にて、印刷関連処理部424b′は、テキストデータと形態素解析結果とを用いて、次に行うべき内容を決定する処理を実行する。具体的には、印刷関連処理部424b′は、「もう少し」から何かの変更が小程度であり、「濃く」から何かは設定パラメータの項目が濃度パラメータであって、さらに変更する方向が増加方向であり、「なる?」から可能かどうかを問い合わせていることであると認識する。そして、この認識結果から、印刷関連処理部424b′は、ユーザの発話内容が「濃度パラメータの値を現在の値より少し濃い方向に増加させること」と認識し、そのためにまず、プリンタ200に対して、濃度パラメータの現在の設定値を問い合わせることであると決定する。そして、印刷関連処理部424b′は、濃度パラメータの現在の設定値を問い合わせるためのコマンド(以下「現設定要求コマンド」という)を生成する。
次に、S14では、印刷関連処理部424b′は、現設定要求コマンドを中継器100に送信する。中継器100は、S16にて、受信した現設定要求コマンドをそのまま、プリンタ200に送信する。
プリンタ200は、現設定要求コマンドを受信すると、S18にて、濃度パラメータの現在の設定値及びプリンタ200のモデル名を含む応答(以下「現設定応答」という)を中継器100に送信する。
中継器100は、S20にて、受信した現設定応答をそのまま、アプリケーションサーバ400に送信する。アプリケーションサーバ400の印刷関連処理部424b′は、S22にて、受信した現設定応答に基づいた処理を実行する。具体的には、例えば、現設定応答に、濃度パラメータの現在の設定値として“5”が含まれているとする。アプリケーションサーバ400は、例えば、データ記憶領域422内にプリンタ200を含む各種画像形成装置それぞれについて全設定パラメータの情報を記憶している。印刷関連処理部424b′は、現設定応答に含まれるモデル名と一致する画像形成装置、つまりプリンタ200の全設定パラメータの情報から、濃度パラメータとして設定可能な最大値を取得する。その最大値が、例えば“10”であるとすると、印刷関連処理部424b′は、濃度パラメータの値を現在値“5”からさらに“5”段階増加できることを知る。そこで、印刷関連処理部424b′は、そのことを知らせるための音声データの基になるテキストデータを生成する。例えば、印刷関連処理部424b′は、「5」、「濃くできる」と、小程度に対して「2」を選び、「あと5段階濃くできます。2段階濃くして再印刷しましょうか」のテキストデータを生成する。そして、印刷関連処理部424b′は、S24にて、生成したテキストデータを音声解析処理部424a′に渡す。
次に、S26では、音声解析処理部424a′は、そのテキストデータに基づいて音声データを作成する。そして、音声解析処理部424a′は、図3のS28にて、作成した音声データをスマートスピーカ300に送信する。
次に、S30では、スマートスピーカ300は、受信した音声データを音声として発生させる。この音声を聞いたユーザは、S32にて、例えば「OK」と発話する。また、例えば「1段階だけ濃くして」と発話してもよい。これに応じて、スマートスピーカ300及び音声解析処理部424a′は、S32にて、上記S4〜S10の処理と同様の処理を実行し、テキストデータを生成して、印刷関連処理部424b′に渡す。
S36では、印刷関連処理部424b′は、そのテキストデータに基づいてコマンドを作成する。具体的には、印刷関連処理部424b′は、2段階であれば、濃度パラメータの値を現在の設定値+2、すなわち7にして、再印刷することを指示するコマンドを生成する。そして、アプリケーションサーバ400は、S38にて、生成したコマンドを中継器100に送信する。中継器100は、S40にて、受信した再印刷のコマンドをそのまま、プリンタ200に送信する。S42では、プリンタ200は、受信した再印刷のコマンドに従って、濃度パラメータの設定値にて印刷機構250を制御し、制御部210に記憶している前回印刷に用いた印刷データに基づく再印刷を実行する。
印刷関連処理部424b′は、上記S38で、印刷コマンドを中継器100に送信するときに、プリンタ200に再印刷を指示したことを知らせるための音声データの基になるテキストデータを生成し、音声解析処理部424a′に渡すようにしてもよい。これにより、スマートスピーカ300から、プリンタ200に再印刷を指示したことを知らせる音声が発生するので、ユーザは、プリンタ200から再印刷結果が出力されることを事前に知ることができる。
また、再印刷結果に不満な場合には、ユーザは再度、不満な内容をスマートスピーカ300に発話する。これに応じて、上記S4〜S42の処理が繰り返され、プリンタ200から再々印刷結果が出力される。
なお、プリンタ200は、濃度パラメータの設定値を変更できるように構成されているが、他のプリンタでは、濃度パラメータの設定値を変更できないモデルもある。その場合には、印刷関連処理部424b′は、設定変更できないことを知らせるための音声データの基になるテキストデータを生成し、音声解析処理部424a′に渡すようにすればよい。
また、本実施形態では、上記S2で、ユーザが「もう少し濃くなる?」と問いかけているので、上記S30で、「あと5段階濃くできます。2段階濃くして再印刷しましょうか」とユーザに返答している。これに代えて、上記S22〜S34の処理を省略して、ユーザに返答せずに、処理をS20からS36に進ませ、「濃く」から決定した濃度パラメータの現在値に、「もう少し」から少し増加方向に決定した値だけ加算して、再印刷することを指示するコマンドを生成するようにしてもよい。
なお、本実施形態において、ユーザが発話した内容やスマートスピーカ300から発生された音声の内容は、一例に過ぎない。また、決定した設定パラメータの項目も、濃度パラメータに限らず、ユーザの発話内容に応じて様々な設定パラメータの項目が決定される。さらに、パラメータ値も、増加方向の変更に限らず、減少方向の変更もあり得る。また、変更しないこともあり得る。
このように、本実施形態の画像形成システム1000では、プリンタ200からの印刷結果に不満あるいは要求を抱いたユーザは、抱いた不満あるいは要求の内容をスマートスピーカ300に発話するだけで、その不満を解消する印刷結果、あるいはその要求に沿った印刷結果になるように、自動的に設定パラメータの項目とその値が決定されて、プリンタ200に対する印刷制御がなされるので、ユーザの意図通りの画像形成を行うことが可能となる。特に、変更すべき設定パラメータの値と印刷結果の関係をよく理解していないようなユーザにとって、ユーザが直接、設定パラメータの項目とパラメータ値を指示しなくてもよいので、有用である。
また、ユーザは印刷結果に対する直感的な印象を発話するだけで、印刷設定が変更されて意図通りの印刷結果が得られるので、ユーザは直感的に印刷設定の変更ができるようになる。この結果、ユーザは、印刷アプリからユーザの意図通りの印刷結果が得られるような印刷設定を探す必要がなくなる。また、印刷アプリに予め登録されている印刷設定にはない、新規な印刷設定に変更できることもあり得る。
本実施形態の画像形成システム1000では、アプリケーションサーバ400が、ユーザの発話内容の解析からプリンタ200へ送信するコマンドの生成まで行うので、スマートスピーカ300として種々のものを採用してもよい。つまり、機種依存性がない。また、中継器100も、アプリケーションサーバ400とプリンタ200との間で送受信されるデータをそのまま中継するだけであるので、データの中継ができるものであればよく、機種依存性がない。
図4は、アプリケーションサーバ400の印刷関連処理部424b′が記憶部420に記憶するログ情報のフォーマットの一例を示している。印刷関連処理部424b′は、ユーザがスマートスピーカ300に発話すると、発話の度にログ情報を取得し、記憶部420に記憶するようにしている。ログ情報は、図4に示すように、1.発話データと2.プリンタ情報とを対応付けて記憶する。
1.発話データとしては、1−1:日時、1−2:地域、1−3:生データ及び1−4:抽出データを取得する。「日時」は、ユーザが発話した日時である。「地域」は、ユーザが発話したときに居る地域である。地域は、国家単位、県単位、市町村単位、さらに細かい単位など、いずれの単位でもよい。例えば、スマートスピーカ300にGPSを搭載し、GPSから得られた位置情報に基づいて、「地域」を決定すればよい。「生データ」は、スマートスピーカ300から入力された音声データそのものである。「抽出データ」とは、「生データ」から、上述のようにして生成されたテキストデータと、このテキストデータに形態素解析処理を施して生成された形態素解析結果のことである。
2.プリンタ情報としては、2−1:印刷アプリ情報、2−2:印刷設定及び2−3:モデル情報を取得する。「印刷アプリ情報」は、上記図2及び図3の印刷制御処理の事前処理で用いた印刷アプリの情報のことである。印刷アプリの情報は、その印刷アプリがインストールされている端末装置に問い合わせるか、あるいは、プリンタ200が印刷に使用された印刷アプリの情報を記憶している場合には、上記S14で、現設定要求コマンドを送信するときに、印刷アプリの情報も問い合わせるようにすればよい。「印刷設定」は、プリンタ200の発話時に設定中の印刷設定である。S14では、上記S2で発話された発話内容に関連する設定パラメータの情報のみ要求するようにしたが、全ての設定パラメータの設定情報を要求するようにすればよい。「モデル情報」は、プリンタ200のモデル名のことである。上記S18では、プリンタ200は、モデル名も含んだ現設定応答を生成するので、このモデル名を用いればよい。なお、「印刷設定」は、プリンタ200に設定中の印刷設定の全てであっても、そのうちの一部であってもよい。一部とは、1つであってもよい。この場合、発話内容に関係の深い1つの印刷設定を選択するようにしてもよい。
さらにログ情報を、発話データ内にプリンタ200の設定に関する用語が含まれているログ情報と、プリンタ200の設定に関する用語が含まれていないログ情報とに分類し、各類型毎に記憶しておく。このように記憶しておけば、類型毎にログ情報を使用でき、便利である。なお、プリンタ200の設定に関する用語が含まれているか否かは、1−4:抽出データに基づいて直ちに判断できる。
このようにして取得したログ情報は、プリンタ200に対するユーザの幅広い好みや要望を知り、今後の製品開発に生かすために利用する。従来から、印刷アプリのUI画面に対するユーザ操作は操作ログとして記憶されていたが、ユーザがしたいこと(Want)を把握できる範囲は限られていた。例えば、濃度パラメータの設定値が最大に設定されている場合、ユーザはその設定値でよいのか、もっと濃くしたいのか、操作ログからでは判断が困難である。一方、ユーザの発話が「もっと濃くしたい」や「まだ薄いな」であり、これがログ情報として収集されていた場合、ユーザのWantは、装置の設定可能な範囲を超えたWantであることが分かる。このように、本実施形態のログ情報からは、ユーザの幅広い好みや要望を知ることができる。
なお、ログ情報として、音声データをテキスト化しただけの情報を記憶することも考えられるが、それでは、何を基準にユーザがその発話に及んだか、後から分かり難い。そこで、本実施形態では、プリンタの設定等の情報と発話の情報とを対応付けて、ログ情報として記憶するようにしている。これにより、ユーザのWantの把握の正確性が大きく向上し、ログ情報としての有用性も大きく向上する。
また、ユーザの好みや要望を知る方法として、例えば、プリンタのサポートサイトなどにユーザの要望欄を設け、自由に書き込んでもらう方法がある。この方法で得られたユーザの好みや要望には、偏りがある場合がある。つまり、積極的に書き込む意思のあるユーザからの好みや要望しか得られないからである。これに対して、本実施形態のようにして得られるログ情報からは、偏りのない広い範囲のユーザからの好みや要望を得ることができる。このため、幅広いユーザのWantに対応したサービスの提供等の事業拡大や、次の製品開発等に生かすことができる。
以上説明したように、本実施形態のアプリケーションサーバ400は、ネットワークIF480と、CPU410と、を備えている。そして、CPU410は、ネットワークIF480を介して接続された、音声を入力及び出力するスマートスピーカ300から、プリンタ200のユーザが発音することにより入力された音声の内容を認識し(S8)、認識された音声の内容が、プリンタ200が形成した画像に対するユーザの不満あるいは要求を示す内容である場合、認識された音声の内容に基づいて、プリンタ200が変更すべき設定パラメータの項目及び値を決定し(S12)、決定された設定パラメータの項目及び値を含むコマンドを生成し(S36)、生成されたコマンドをプリンタ200に送信する(S38)。
このように、本実施形態のアプリケーションサーバ400では、ユーザは直接、設定パラメータの項目とパラメータ値を指示しなくても、ユーザの意図通りの画像形成を行うことが可能となる。
ちなみに、本実施形態において、アプリケーションサーバ400は、「情報処理装置」の一例である。ネットワークIF480は、「通信インタフェース」の一例である。CPU410は、「制御装置」の一例である。プリンタ200は、「画像形成装置」の一例である。
また、CPU410は、決定された設定パラメータ項目のプリンタ200における現在の設定値をプリンタ200から取得し(S20)、取得された現在の設定値及び認識された音声の内容に基づいて、決定された設定パラメータ項目の値を決定する(S22)。
これにより、設定パラメータの値は自動的に決定されるので、便利である。
また、CPU410は、決定された設定パラメータ項目の値を決定する前に、決定された設定パラメータ項目において設定可能な最大値又は最小値と、取得された現在の設定値とを比較し、現在の設定値に加算又は減算できる値の範囲を発音する音声データを、ネットワークIF480を介してスマートスピーカ300に送信し(S28)、これに応じて、ユーザが現在の設定値に加算又は減算する値を発音した場合、現在の設定値に加算又は減算する値を認識し、決定された設定パラメータ項目の値を、認識された値分現在の設定値を加算又は減算した値に決定する(S36)。
これにより、ユーザは、現在の設定値に加算又は減算する値を発音するだけで、設定パラメータの値を指示できるので、便利である。
また、CPU410は、プリンタ200から現在の設定値を取得できなかった場合、取得できなかったことを発音する音声データを、ネットワークIF480を介してスマートスピーカ300に送信する。
これにより、ユーザは、プリンタ200が設定値を変更できるかどうか音声により知ることができるので、便利である。
また、CPU410は、認識された音声の内容が、プリンタ200に対して再度の画像形成を指示する内容である場合、画像形成の実行リクエストを含むコマンドを生成し(S36)、生成されたコマンドをプリンタ200に送信する(S38)。
これにより、ユーザは、声で指示するだけで、プリンタ200に再度の画像形成を指示できるので、便利である。
また、CPU410は、コマンドを送信した後、プリンタ200に対して再度の画像形成を指示したことを発音する音声データを、ネットワークIF480を介してスマートスピーカ300に送信する。
これにより、ユーザは、指示した内容をプリンタ200に指示されたことを音声で知ることができるので、便利である。
また、CPU410は、ネットワークIF480を介して接続された、プリンタ200とP2P通信を行う中継器100を介して、プリンタ200とコマンドを含むデータの送受信を行う。
これにより、プリンタ200がネットワークIFを備えていなくても、プリンタ200は、中継器100を介してアプリケーションサーバ400とデータの送受信を行うことができる。
なお、本発明は上記実施形態に限定されるものでなく、その趣旨を逸脱しない範囲で様々な変更が可能である。
(1)上記実施形態では、音声データを解析する処理は、アプリケーションサーバ400の音声解析処理部424a′が実行している。これに代えて、音声データを解析する処理の一部または全部は、スマートスピーカ300が実行してもよい。また、音声データを解析する処理の一部または全部は、印刷関連処理部424b′が実行してもよい。例えば、音声解析処理部424a′は、音声認識処理を行ってテキストデータを生成する処理だけを行い、単語を抽出する形態素解析処理は、印刷関連処理部424b′が実行してもよい。
(2)上記実施形態では、画像形成装置として、プリンタ200を採用したが、これに限らず、印刷機能にスキャン機能やファックス機能を加えた複合機を採用してもよい。この場合には、例えば、スマートスピーカ300に入力される音声に応じて、その複合機に印刷を行わせることができる。
(3)アプリケーションサーバ400は、クラウドサーバであるが、LAN70に接続され、インターネット80に接続されないローカルサーバであってもよい。この場合には、スマートスピーカ300からアプリケーションサーバ400にユーザIDなどの識別情報を送信せず、音声データだけを送信してもよい。
(4)中継器100とプリンタ200とを接続するインタフェースは、ブルートゥースIF160に限らず、例えば、USBなどの有線インタフェースであってもよいし、NFC(Near field communicationの略)などの他の無線インタフェースであってもよい。
(5)上記実施形態では、中継器100が、アプリケーションサーバ400とプリンタ200との間で送受信されるデータを中継する構成としたが、さらにアプリケーションサーバ400との間にスマートスピーカ300を介して中継してもよい。この場合、スマートスピーカ300のブルートゥースIF160あるいは無線LANIF180を用いた通信が中継器100との間で行われる。また、プリンタ200が無線LANIFを備えているような場合、アプリケーションサーバ400が中継器100を介さずに直接プリンタ200と通信するようにしてもよいし、あるいはアプリケーションサーバ400がスマートスピーカ300を介してプリンタ200と通信するようにしてもよい。
(6)上記実施形態において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されていた構成の一部をハードウェアに置き換えるようにしてもよい。
50…アクセスポイント、70…LAN、80…インターネット、100…中継器、110…CPU、120…メモリ、160,260,360…ブルートゥースIF、180,380…無線LANIF、200…プリンタ、210…制御部、250…印刷機構、300…スマートスピーカ、310…制御部、350…音声入出力部、400…アプリケーションサーバ、410…CPU、420…記憶部、424a…音声解析プログラム、424b…印刷関連プログラム、424b′…印刷関連処理部、424a′…音声解析処理部、480…ネットワークIF、1000…画像形成システム。

Claims (9)

  1. 通信インタフェースと、
    制御装置と、
    を備え、
    前記制御装置は、
    前記通信インタフェースを介して接続された、音声を入力及び出力するスマートスピーカから、画像形成装置のユーザが発音することにより入力された音声の内容を認識し、
    前記認識された音声の内容が、前記画像形成装置が形成した画像に対するユーザの不満あるいは要求を示す内容である場合、
    前記認識された音声の内容に基づいて、前記画像形成装置が変更すべき設定パラメータの項目及び値を決定するための処理を実行し、
    前記決定された設定パラメータの項目及び値を含むコマンドを生成し、
    前記生成されたコマンドを前記画像形成装置に送信する、
    情報処理装置。
  2. 前記制御装置は、
    前記決定された設定パラメータ項目の前記画像形成装置における現在の設定値を前記画像形成装置から取得し、
    前記取得された現在の設定値及び前記認識された音声の内容に基づいて、前記決定された設定パラメータ項目の値を決定する、
    請求項1に記載の情報処理装置。
  3. 前記制御装置は、
    前記決定された設定パラメータ項目の値を決定する前に、前記決定された設定パラメータ項目において設定可能な最大値又は最小値と、前記取得された現在の設定値とを比較し、前記現在の設定値に加算又は減算できる値の範囲を発音する音声データを、前記通信インタフェースを介して前記スマートスピーカに送信し、
    これに応じて、前記ユーザが前記現在の設定値に加算又は減算する値を発音した場合、
    前記現在の設定値に加算又は減算する値を認識し、
    前記決定された設定パラメータ項目の値を、前記認識された値分前記現在の設定値を加算又は減算した値に決定する、
    請求項2に記載の情報処理装置。
  4. 前記制御装置は、
    前記画像形成装置から前記現在の設定値を取得できなかった場合、取得できなかったことを発音する音声データを、前記通信インタフェースを介して前記スマートスピーカに送信する、
    請求項2又は3に記載の情報処理装置。
  5. 前記制御装置は、
    前記認識された音声の内容が、前記画像形成装置に対して再度の画像形成を指示する内容である場合、
    前記画像形成の実行リクエストを含むコマンドを生成し、
    前記生成されたコマンドを前記画像形成装置に送信する、
    請求項1乃至4のいずれか1項に記載の情報処理装置。
  6. 前記制御装置は、
    前記コマンドを送信した後、前記画像形成装置に対して再度の画像形成を指示したことを発音する音声データを、前記通信インタフェースを介して前記スマートスピーカに送信する、
    請求項5に記載の情報処理装置。
  7. 前記制御装置は、
    前記通信インタフェースを介して接続された、前記画像形成装置とP2P通信を行う中継器を介して、前記画像形成装置と前記コマンドを含むデータの送受信を行う、
    請求項1乃至6のいずれか1項に記載の情報処理装置。
  8. 前記入力された音声のテキストデータが、「もう少し濃くして」である場合、
    前記制御装置は、
    前記テキストデータから「もう少し」、「濃く」及び「して」を抽出し、
    前記抽出された「もう少し」から程度を認識し、
    前記抽出された「濃く」から濃度を認識し、
    前記抽出された「して」から濃度を濃くすることを認識し、
    前記認識された音声の内容に基づいて、前記設定パラメータの前記項目として、画像の濃度項目を決定し、前記設定パラメータの前記値として、前記画像の濃度をより濃くする値に決定する、
    請求項1乃至7のいずれか1項に記載の情報処理装置。
  9. 通信インタフェースを備えた情報処理装置のコンピュータが実行可能なプログラムであって、
    前記コンピュータに、
    前記通信インタフェースを介して接続された、音声を入力及び出力するスマートスピーカから、画像形成装置のユーザが発音することにより入力された音声の内容を認識する認識処理と、
    前記認識処理によって認識された音声の内容が、前記画像形成装置が形成した画像に対するユーザの不満あるいは要求を示す内容である場合、
    前記認識された音声の内容に基づいて、前記画像形成装置が変更すべき設定パラメータの項目及び値を決定するための処理と、
    前記決定された設定パラメータの項目及び値を含むコマンドを生成する生成処理と、
    前記生成処理によって生成されたコマンドを前記画像形成装置に送信する送信処理と、
    を実行させるプログラム。
JP2020062762A 2020-03-31 2020-03-31 情報処理装置及びプログラム Active JP7400593B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020062762A JP7400593B2 (ja) 2020-03-31 2020-03-31 情報処理装置及びプログラム
US17/210,444 US11563864B2 (en) 2020-03-31 2021-03-23 Information processing apparatus and non-transitory computer-readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020062762A JP7400593B2 (ja) 2020-03-31 2020-03-31 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2021163069A true JP2021163069A (ja) 2021-10-11
JP7400593B2 JP7400593B2 (ja) 2023-12-19

Family

ID=78003467

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020062762A Active JP7400593B2 (ja) 2020-03-31 2020-03-31 情報処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP7400593B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000209378A (ja) * 1999-01-20 2000-07-28 Ricoh Co Ltd 画像形成装置
US20130253834A1 (en) * 2012-03-26 2013-09-26 Mark Slusar Reverse Natural Guidance
WO2019013316A1 (ja) * 2017-07-14 2019-01-17 ダイキン工業株式会社 機器制御システム
JP2019096295A (ja) * 2017-11-17 2019-06-20 キヤノン株式会社 音声制御システム、制御方法及びプログラム
JP2019185734A (ja) * 2018-03-30 2019-10-24 株式会社リコー 情報処理システム、情報処理装置、情報処理方法及び情報処理プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000209378A (ja) * 1999-01-20 2000-07-28 Ricoh Co Ltd 画像形成装置
US20130253834A1 (en) * 2012-03-26 2013-09-26 Mark Slusar Reverse Natural Guidance
WO2019013316A1 (ja) * 2017-07-14 2019-01-17 ダイキン工業株式会社 機器制御システム
JP2019096295A (ja) * 2017-11-17 2019-06-20 キヤノン株式会社 音声制御システム、制御方法及びプログラム
JP2019185734A (ja) * 2018-03-30 2019-10-24 株式会社リコー 情報処理システム、情報処理装置、情報処理方法及び情報処理プログラム

Also Published As

Publication number Publication date
JP7400593B2 (ja) 2023-12-19

Similar Documents

Publication Publication Date Title
JP2019095520A (ja) 音声制御システム、制御方法およびプログラム
JP7224863B2 (ja) 中継サーバおよび制御方法
KR102533074B1 (ko) 인쇄 시스템, 제어 방법, 및 서버
US11475892B2 (en) Speech control system, speech control method, image processing apparatus, speech control apparatus, and storage medium
US20230254421A1 (en) Image processing system, setting control method, image processing apparatus, and storage medium
US11327697B2 (en) Information processing apparatus and startup method for input-output device
KR20120051517A (ko) 음성데이터를 이용한 문서생성 방법 및 시스템과, 이를 구비한 화상형성장치
US11683422B2 (en) Image processing system, image processing apparatus, and image processing method
US20200366800A1 (en) Apparatus
JP2022001997A (ja) 情報処理装置、情報処理システム、制御方法、並びにプログラム
JP7400593B2 (ja) 情報処理装置及びプログラム
JP7404974B2 (ja) 情報処理装置及びプログラム
JP7361509B2 (ja) 周辺装置管理システム、印刷装置制御システム、制御方法、印刷制御装置及びプログラム
US11563864B2 (en) Information processing apparatus and non-transitory computer-readable storage medium
JP7314499B2 (ja) 情報処理システム、情報処理装置、ジョブ制御方法およびジョブ制御プログラム
KR102537797B1 (ko) 대화형 에이전트 기능이 설치된 화상 형성 시스템, 그 제어 방법 및 저장 매체
JP2020134903A (ja) システム、画像形成装置、方法およびプログラム
US11700338B2 (en) Information processing system that receives audio operations on multifunction peripheral, as well as image processing apparatus and control method therefor
JP7388272B2 (ja) 情報処理装置、情報処理方法及びプログラム
US11647130B2 (en) Information processing system capable of connecting a plurality of voice control devices, method of controlling information processing system, and storage medium
JP2021105849A (ja) 印刷制御システムおよびその制御方法、並びにプログラム
US11368593B2 (en) Image forming system allowing voice operation, control method therefor, and storage medium storing control program therefor
JP2022096305A (ja) 情報処理システム、画像処理装置、情報処理システムの制御方法、及びプログラム
JP2021163164A (ja) 情報処理装置及び情報処理方法
JP2021162696A (ja) 情報処理装置、情報処理方法、電子機器及び情報処理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230815

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230822

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231013

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231120

R150 Certificate of patent or registration of utility model

Ref document number: 7400593

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150