JP2021163074A - Information processing apparatus and program - Google Patents

Information processing apparatus and program Download PDF

Info

Publication number
JP2021163074A
JP2021163074A JP2020062809A JP2020062809A JP2021163074A JP 2021163074 A JP2021163074 A JP 2021163074A JP 2020062809 A JP2020062809 A JP 2020062809A JP 2020062809 A JP2020062809 A JP 2020062809A JP 2021163074 A JP2021163074 A JP 2021163074A
Authority
JP
Japan
Prior art keywords
image forming
setting
forming apparatus
voice
printer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020062809A
Other languages
Japanese (ja)
Other versions
JP7404974B2 (en
Inventor
直毅 楠本
Naoki Kusumoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2020062809A priority Critical patent/JP7404974B2/en
Priority to US17/210,444 priority patent/US11563864B2/en
Publication of JP2021163074A publication Critical patent/JP2021163074A/en
Application granted granted Critical
Publication of JP7404974B2 publication Critical patent/JP7404974B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Accessory Devices And Overall Control Thereof (AREA)
  • Facsimiles In General (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

To provide a technique that can collect a user's wide variety of preferences and demands as logs.SOLUTION: A CPU 410 executes voice detail recognition processing of recognizing the details of a voice input by a user of a printer 200 uttering a voice, from a smart speaker 300 that is connected through a network IF 480 and inputs and outputs a voice, acquisition processing of, when a term related to the setting of the printer 200 is included in the recognized details of the voice, acquiring the print setting of the printer 200 from the printer 200, and log information storage processing of associating the recognized details of the voice with the acquired print setting of the printer 200 and storing them in a storage unit 420 as log information related to the setting of the printer 200.SELECTED DRAWING: Figure 4

Description

本願は、画像形成装置を音声により制御する技術に関するものである。 The present application relates to a technique for controlling an image forming apparatus by voice.

特許文献1には、操作画面に対するユーザの操作履歴を記録しておき、その操作履歴を利用して操作画面を変更する構成が記載されている。 Patent Document 1 describes a configuration in which an operation history of a user with respect to an operation screen is recorded, and the operation screen is changed by using the operation history.

特開2020−21354号公報Japanese Unexamined Patent Publication No. 2020-21354

しかし、特許文献1に記載の構成では、操作画面に対するユーザの操作情報しかログとして収集していないので、操作画面を超えたユーザの好みや要望をログとして収集することができない。 However, in the configuration described in Patent Document 1, since only the user's operation information for the operation screen is collected as a log, the user's preference and request beyond the operation screen cannot be collected as a log.

本願は、ユーザの幅広い好みや要望をログとして収集することが可能となる技術を提供することを目的とする。 An object of the present application is to provide a technique capable of collecting a wide range of user preferences and requests as a log.

上記目的を達成するため、本願の情報処理装置は、通信インタフェースと、記憶装置と、制御装置と、を備え、制御装置は、通信インタフェースを介して接続された、音声を入力及び出力するスマートスピーカから、画像形成装置のユーザが発話することにより入力された音声の内容を認識する音声内容認識処理と、認識された音声の内容の中に、画像形成装置の設定に関する用語が含まれている場合、画像形成装置の設定情報を画像形成装置から取得する取得処理と、認識された音声の内容と、取得された画像形成装置の設定情報とを対応付け、画像形成装置の設定に関するログ情報として記憶装置に記憶するログ情報記憶処理と、を実行する。 In order to achieve the above object, the information processing device of the present application includes a communication interface, a storage device, and a control device, and the control device is a smart speaker that inputs and outputs voice connected via the communication interface. Therefore, when the voice content recognition process for recognizing the content of the voice input by the user of the image forming apparatus and the recognized voice content include terms related to the setting of the image forming apparatus. , The acquisition process of acquiring the setting information of the image forming apparatus from the image forming apparatus, the content of the recognized sound, and the acquired setting information of the image forming apparatus are associated with each other, and stored as log information regarding the setting of the image forming apparatus. Executes log information storage processing stored in the device.

なお、本明細書に開示される技術は、種々の形態で実現することが可能であり、例えば、情報処理方法、画像形成装置の制御方法、装置の機能または上記方法を実現するためのコンピュータプログラム、そのコンピュータプログラムを記録した記録媒体、等の形態で実現することができる。 The techniques disclosed in the present specification can be realized in various forms, for example, an information processing method, a control method of an image forming apparatus, a function of the apparatus, or a computer program for realizing the above method. , A recording medium on which the computer program is recorded, and the like.

本願によれば、ユーザの幅広い好みや要望をログとして収集することが可能となる。 According to the present application, it is possible to collect a wide range of user preferences and requests as a log.

本願の一実施形態に係る画像形成システムの構成を示すブロック図である。It is a block diagram which shows the structure of the image formation system which concerns on one Embodiment of this application. 図1の画像形成システムによって実行される印刷制御処理のシーケンス図である。It is a sequence diagram of the print control process executed by the image formation system of FIG. 図2のシーケンス図の続きのシーケンス図である。It is a continuation sequence diagram of the sequence diagram of FIG. ログ情報として記憶されるデータの一例を示す図である。It is a figure which shows an example of the data which is stored as log information.

以下、本願の実施の形態を図面に基づいて詳細に説明する。 Hereinafter, embodiments of the present application will be described in detail with reference to the drawings.

図1は、本願の一実施形態に係る画像形成システム1000の構成を示している。画像形成システム1000は、中継器100と、プリンタ200と、スマートスピーカ300と、アプリケーションサーバ400とにより主として構成されている。なお、本実施形態の画像形成システム1000では、中継器100とプリンタ200とスマートスピーカ300は、同じユーザによって利用される。 FIG. 1 shows the configuration of the image forming system 1000 according to the embodiment of the present application. The image forming system 1000 is mainly composed of a repeater 100, a printer 200, a smart speaker 300, and an application server 400. In the image forming system 1000 of the present embodiment, the repeater 100, the printer 200, and the smart speaker 300 are used by the same user.

画像形成システム1000で用いられるアクセスポイント50は、例えば、IEEE802.11a/b/g/nの規格に従った通信方式を用いて無線LANのアクセスポイントとしての機能を実現する。アクセスポイント50は、LAN70に接続されている。LAN70は、例えば、イーサネット(登録商標)規格に準拠して構築された有線ネットワークである。LAN70は、インターネット80に接続されている。アプリケーションサーバ400は、インターネット80に接続されている。 The access point 50 used in the image forming system 1000 realizes a function as a wireless LAN access point by using, for example, a communication method according to the standard of IEEE802.11a / b / g / n. The access point 50 is connected to the LAN 70. The LAN 70 is, for example, a wired network constructed in accordance with the Ethernet (registered trademark) standard. The LAN 70 is connected to the Internet 80. The application server 400 is connected to the Internet 80.

中継器100は、アプリケーションサーバ400とプリンタ200との間で送受信されるデータを中継する装置である。中継器100は、中継器100全体を制御するためのCPU110と、ROMやRAM、NVMなどのメモリ120と、プリンタ200とP2P通信するためのブルートゥース(登録商標)IF160と、アプリケーションサーバ400と通信するための無線LANIF180と、を主に備えている。中継器100は、例えば、スマートフォン等のモバイル端末によって構成されている。なお、NVMは、non-volatile memoryの略語であり、P2Pは、Peer to Peerの略語であり、IFは、Interfaceの略語である。 The repeater 100 is a device that relays data transmitted and received between the application server 400 and the printer 200. The repeater 100 communicates with the CPU 110 for controlling the entire repeater 100, the memory 120 such as ROM, RAM, and NVM, the Bluetooth (registered trademark) IF160 for P2P communication with the printer 200, and the application server 400. It mainly has a wireless LAN IF180 for the purpose. The repeater 100 is composed of, for example, a mobile terminal such as a smartphone. NVM is an abbreviation for non-volatile memory, P2P is an abbreviation for Peer to Peer, and IF is an abbreviation for Interface.

メモリ120は、データ記憶領域122及び制御プログラム領域124を含んでいる。データ記憶領域122は、CPU110が制御プログラムなどを実行する際に必要なデータなどを記憶する領域である。また、制御プログラム領域124は、OSや制御プログラム、ファームウェアなどを記憶する領域である。 The memory 120 includes a data storage area 122 and a control program area 124. The data storage area 122 is an area for storing data or the like required when the CPU 110 executes a control program or the like. The control program area 124 is an area for storing the OS, control program, firmware, and the like.

ブルートゥースIF160は、アンテナを含み、ブルートゥース方式に準拠した近距離無線通信を行うためのインタフェースである。ブルートゥースIF160を介して、中継器100は、プリンタ200と通信可能に接続される。無線LANIF180は、アンテナを含み、例えば、IEEE802.11a/b/g/nの規格に従った通信方式を用いて無線通信を行う。これにより、中継器100は、アクセスポイント50を介してLAN70及びインターネット80に接続され、アプリケーションサーバ400と通信可能に接続される。なお、プリンタ200が無線LANIFを備える場合には、中継器100は無線LANIF180を介して、プリンタ200と通信可能に接続するように構成してもよい。 The Bluetooth IF160 includes an antenna and is an interface for performing short-range wireless communication conforming to the Bluetooth method. The repeater 100 is communicably connected to the printer 200 via Bluetooth IF160. The wireless LAN IF180 includes an antenna and performs wireless communication using, for example, a communication method according to the standard of IEEE802.11a / b / g / n. As a result, the repeater 100 is connected to the LAN 70 and the Internet 80 via the access point 50, and is communicably connected to the application server 400. When the printer 200 is provided with a wireless LAN IF, the repeater 100 may be configured to be communicably connected to the printer 200 via the wireless LAN IF 180.

プリンタ200は、例えば、CPUとメモリを含む制御部210と、制御部210の制御に従って印刷を行う印刷機構250と、ブルートゥースIF260と、を備えている。印刷機構250は、シートに画像を印刷する機構であり、電子写真方式、インクジェット方式、サーマル方式等の印刷機構である。ブルートゥースIF260は、アンテナを含み、ブルートゥース方式に準拠した近距離無線通信を行うためのインタフェースであり、上述のように中継器100との通信のために用いられる。なお、プリンタ200は、ブルートゥースIF260に代えて無線LANIFを備え、中継器100と通信可能に接続するよう構成してもよい。 The printer 200 includes, for example, a control unit 210 including a CPU and a memory, a printing mechanism 250 that prints under the control of the control unit 210, and a Bluetooth IF 260. The printing mechanism 250 is a mechanism for printing an image on a sheet, and is a printing mechanism such as an electrophotographic method, an inkjet method, or a thermal method. The Bluetooth IF260 includes an antenna and is an interface for performing short-range wireless communication conforming to the Bluetooth method, and is used for communication with the repeater 100 as described above. The printer 200 may be provided with a wireless LAN IF instead of the Bluetooth IF 260 and may be configured to be communicably connected to the repeater 100.

プリンタ200は、無線LANIFを備えていない場合、中継器100とは通信可能に接続されるが、アプリケーションサーバ400とは直接、通信することができない。 When the printer 200 is not provided with the wireless LAN IF, the printer 200 is communicably connected to the repeater 100, but cannot directly communicate with the application server 400.

スマートスピーカ300は、ユーザが発話した音声に応じて特定の処理を実行する装置である。特定の処理は、例えば、音声データを生成して、アプリケーションサーバ400に送信する処理を含む。スマートスピーカ300は、CPUとメモリとを含む制御部310と、音声入出力部350と、ブルートゥースIF360と、無線LANIF380と、を備えている。 The smart speaker 300 is a device that executes a specific process according to the voice spoken by the user. The specific process includes, for example, a process of generating voice data and transmitting it to the application server 400. The smart speaker 300 includes a control unit 310 including a CPU and a memory, an audio input / output unit 350, a Bluetooth IF 360, and a wireless LAN IF 380.

音声入出力部350は、スピーカとマイクとを含み、音声の入力と音声の出力に関する処理を実行する。例えば、音声入出力部350は、制御部310の制御に従って、ユーザが発話した音声を検出し、その音声を示す音声データを生成する。また、音声入出力部350は、受信した音声データに応じた音声をスピーカから発生する。 The audio input / output unit 350 includes a speaker and a microphone, and executes processing related to audio input and audio output. For example, the voice input / output unit 350 detects the voice spoken by the user according to the control of the control unit 310, and generates voice data indicating the voice. Further, the voice input / output unit 350 generates a voice corresponding to the received voice data from the speaker.

無線LANIF380は、アンテナを含み、例えば、IEEE802.11a/b/g/nの規格に従った通信方式を用いて無線通信を行う。これにより、スマートスピーカ300は、アクセスポイント50を介してLAN70及びインターネット80に接続され、アプリケーションサーバ400と通信可能に接続される。 The wireless LAN IF380 includes an antenna and performs wireless communication using, for example, a communication method according to the standard of IEEE802.11a / b / g / n. As a result, the smart speaker 300 is connected to the LAN 70 and the Internet 80 via the access point 50, and is communicably connected to the application server 400.

アプリケーションサーバ400は、例えば、いわゆるクラウドサービスを提供する事業者が運営するサーバである。アプリケーションサーバ400は、アプリケーションサーバ400全体を制御するCPU410と、ROM、RAM、HDD、SSD及び光ディスクドライブなどを含む記憶部420と、を備えている。アプリケーションサーバ400は、さらに、インターネット80と接続するためのネットワークIF480を備えている。なお、図1では、アプリケーションサーバ400は、概念的に1個のサーバとして図示されているが、実際は、互いに通信可能に接続された複数個のサーバを含む、いわゆるクラウドサーバである。 The application server 400 is, for example, a server operated by a business operator that provides a so-called cloud service. The application server 400 includes a CPU 410 that controls the entire application server 400, and a storage unit 420 that includes a ROM, a RAM, an HDD, an SSD, an optical disk drive, and the like. The application server 400 further includes a network IF480 for connecting to the Internet 80. Although the application server 400 is conceptually shown as one server in FIG. 1, it is actually a so-called cloud server including a plurality of servers connected to each other so as to be able to communicate with each other.

記憶部420は、データ記憶領域422及びプログラム記憶領域424を含んでいる。データ記憶領域422は、CPU410が処理を行う際に必要なデータなどを記憶する記憶領域として、また、CPU410が処理を行う際に生成される種々の中間データを一時的に格納するバッファ領域として機能する。プログラム記憶領域424は、OS、情報処理プログラム、その他各種のアプリやファームウェアなどを記憶する領域である。情報処理プログラムには、音声解析プログラム424a及び印刷関連プログラム424bが含まれる。音声解析プログラム424aは、例えば、アプリケーションサーバ400の運営者によって、アプリケーションサーバ400にアップロードされることによって提供される。印刷関連プログラム424bは、例えば、アプリケーションサーバ400のリソースを利用して印刷サービスを提供する事業者、例えば、プリンタ200を製造する事業者によって、アプリケーションサーバ400にアップロードされることによって提供される。なお、音声解析プログラム424aの全部または一部が、プリンタ200を製造する事業者によって提供されてもよい。あるいは、印刷関連プログラム424bの全部または一部がアプリケーションサーバ400を運営する事業者によって提供されてもよい。 The storage unit 420 includes a data storage area 422 and a program storage area 424. The data storage area 422 functions as a storage area for storing data and the like required when the CPU 410 performs processing, and as a buffer area for temporarily storing various intermediate data generated when the CPU 410 performs processing. do. The program storage area 424 is an area for storing an OS, an information processing program, various other applications, firmware, and the like. The information processing program includes a voice analysis program 424a and a print-related program 424b. The voice analysis program 424a is provided, for example, by being uploaded to the application server 400 by the operator of the application server 400. The print-related program 424b is provided by being uploaded to the application server 400 by, for example, a business operator that provides a print service using the resources of the application server 400, for example, a business operator that manufactures the printer 200. Note that all or part of the voice analysis program 424a may be provided by a business operator that manufactures the printer 200. Alternatively, all or part of the print-related program 424b may be provided by the operator operating the application server 400.

アプリケーションサーバ400、特にCPU410は、音声解析プログラム424aを実行することによって、音声解析処理部424a′(図2参照)として機能する。音声解析処理部424a′は、音声認識処理や形態素解析処理を実行する。音声認識処理は、音声データを解析して、音声データによって示される発話の内容を示すテキストデータを生成する処理である。形態素解析処理は、そのテキストデータを解析して、発話の内容に含まれる単語などの構成単位(形態素と呼ばれる)の抽出や、抽出された形態素の種別(例えば、品詞の種別)の特定を行う処理である。 The application server 400, particularly the CPU 410, functions as a voice analysis processing unit 424a'(see FIG. 2) by executing the voice analysis program 424a. The voice analysis processing unit 424a'executes voice recognition processing and morphological analysis processing. The voice recognition process is a process of analyzing voice data and generating text data indicating the content of an utterance indicated by the voice data. The morphological analysis process analyzes the text data, extracts constituent units (called morphemes) such as words included in the content of the utterance, and specifies the type of the extracted morpheme (for example, the type of part of speech). It is a process.

また、アプリケーションサーバ400、特にCPU410は、印刷関連プログラム424bを実行することによって、印刷関連処理部424b′(図2参照)として機能する。印刷関連処理部424b′は、音声データを解析して得られるテキストデータを用いて、プリンタ200に動作指示を行うコマンドを生成する処理などを実行する。 Further, the application server 400, particularly the CPU 410, functions as a print-related processing unit 424b'(see FIG. 2) by executing the print-related program 424b. The print-related processing unit 424b'executes a process of generating a command for instructing the printer 200 to operate using the text data obtained by analyzing the voice data.

図2及び図3は、画像形成システム1000によって実行される印刷制御処理のシーケンスを示している。印刷制御処理は、スマートスピーカ300とアプリケーションサーバ400とが協働して、プリンタ200に印刷を実行させる処理である。 2 and 3 show a sequence of print control processes performed by the image forming system 1000. The print control process is a process in which the smart speaker 300 and the application server 400 cooperate with each other to cause the printer 200 to perform printing.

図2及び図3の印刷制御処理は、所定の事前処理が実行された以降の処理を示している。その事前処理とは、まず、ユーザが、画像形成システム1000に含まれない端末装置、例えばスマートフォンやPC等を用いてスマートスピーカ300にアクセスし、上記制御部310に含まれるメモリにユーザIDと声紋を登録する。次に、ユーザは、アプリケーションサーバ400とプリンタ200との間でデータが正しく送受信されるように、中継器100、プリンタ200及びスマートスピーカ300を設定する。さらに、ユーザは、上記端末装置にインストールされた印刷アプリを用いてプリンタ200に印刷を指示する。このような事前処理の実行により、ユーザは、プリンタ200から印刷結果を受け取り、その印刷結果に不満あるいは要求を抱いている状態となっている。 The print control process of FIGS. 2 and 3 shows the process after the predetermined preprocess is executed. The preprocessing is that the user first accesses the smart speaker 300 using a terminal device not included in the image forming system 1000, for example, a smartphone or a PC, and a user ID and a voiceprint are stored in the memory included in the control unit 310. To register. Next, the user sets the repeater 100, the printer 200, and the smart speaker 300 so that data can be correctly transmitted and received between the application server 400 and the printer 200. Further, the user instructs the printer 200 to print using the printing application installed in the terminal device. By executing such preprocessing, the user receives the print result from the printer 200 and is in a state of being dissatisfied or having a request for the print result.

図2において、まずS2で、ユーザが発話する。ユーザは、印刷結果が自身の意図した濃度より少し薄く感じたので、スマートスピーカ300に対して、例えば「もう少し濃くなる?」と問いかけている。印刷制御処理は、スマートスピーカ300がその発話された音声を検出した場合に、開始する。 In FIG. 2, the user first speaks in S2. Since the user felt that the print result was a little lighter than his intended density, he asked the smart speaker 300, for example, "Is it a little darker?" The print control process starts when the smart speaker 300 detects the spoken voice.

S4では、スマートスピーカ300は、ユーザによって発話された音声を示す音声データを生成する。つまり、「もう少し濃くなる?」との音声がスマートスピーカ300に入力されると、スマートスピーカ300は、その音声を示す音声データを生成する。 In S4, the smart speaker 300 generates voice data indicating the voice spoken by the user. That is, when the voice "Is it a little darker?" Is input to the smart speaker 300, the smart speaker 300 generates voice data indicating the voice.

次に、S6では、スマートスピーカ300は、その音声データと登録済みのユーザIDとをアプリケーションサーバ400の音声解析処理部424a′に送信する。音声データの送信には、公知のプロトコル、例えば、HTTPが用いられる。 Next, in S6, the smart speaker 300 transmits the voice data and the registered user ID to the voice analysis processing unit 424a'of the application server 400. A known protocol, such as HTTP, is used to transmit the voice data.

アプリケーションサーバ400がその音声データとユーザIDとを受信すると、S8にて、アプリケーションサーバ400の音声解析処理部424a′は、受信された音声データを解析する。具体的には、音声解析処理部424a′は、音声データに対して音声認識処理を実行し、音声データによって示される音声を示すテキストデータを生成する。例えば、「もう少し濃くなる?」との音声を示す音声データを受信した場合には、音声解析処理部424a′は、その音声の内容を示すテキストデータを生成する。音声解析処理部424a′は、さらに、そのテキストデータに対して形態素解析処理を実行する。これにより、生成されたテキストデータから、例えば、「もう少し」、「濃く」、「なる?」などの単語が抽出されるとともに、これらの単語の品詞種別(例えば、名詞、動詞)が特定される。音声解析処理部424a′は、形態素解析結果として、抽出された単語に品詞種別を対応付けたリストを生成する。 When the application server 400 receives the voice data and the user ID, in S8, the voice analysis processing unit 424a'of the application server 400 analyzes the received voice data. Specifically, the voice analysis processing unit 424a'executes voice recognition processing on the voice data and generates text data indicating the voice indicated by the voice data. For example, when the voice data indicating the voice "is it a little darker?" Is received, the voice analysis processing unit 424a'generates text data indicating the content of the voice. The speech analysis processing unit 424a' further executes morphological analysis processing on the text data. As a result, words such as "a little more", "darker", and "become?" Are extracted from the generated text data, and the part of speech types (for example, nouns and verbs) of these words are specified. .. The voice analysis processing unit 424a'generates a list in which the extracted words are associated with the part of speech type as the morphological analysis result.

次に、S10では、音声解析処理部424a′は、生成されたテキストデータと、形態素解析結果と、スマートスピーカ300から受信されたユーザIDと、を、印刷関連処理部424b′に渡す。具体的には、音声解析処理部424a′は、例えば、データ記憶領域422内の所定領域にテキストデータと形態素解析結果とユーザIDとを格納して、印刷関連プログラム424bをコールする。 Next, in S10, the voice analysis processing unit 424a'passes the generated text data, the morphological analysis result, and the user ID received from the smart speaker 300 to the print-related processing unit 424b'. Specifically, the voice analysis processing unit 424a'stores the text data, the morphological analysis result, and the user ID in a predetermined area in the data storage area 422, and calls the print-related program 424b.

音声解析処理部424a′からテキストデータと形態素解析結果とユーザIDとを受け取ると、S12にて、印刷関連処理部424b′は、テキストデータと形態素解析結果とを用いて、次に行うべき内容を決定する処理を実行する。具体的には、印刷関連処理部424b′は、「もう少し」から何かの変更が小程度であり、「濃く」から何かは設定パラメータの項目が濃度パラメータであって、さらに変更する方向が増加方向であり、「なる?」から可能かどうかを問い合わせていることであると認識する。そして、この認識結果から、印刷関連処理部424b′は、ユーザの発話内容が「濃度パラメータの値を現在の値より少し濃い方向に増加させること」と認識し、そのためにまず、プリンタ200に対して、濃度パラメータの現在の設定値を問い合わせることであると決定する。そして、印刷関連処理部424b′は、濃度パラメータの現在の設定値を問い合わせるためのコマンド(以下「現設定要求コマンド」という)を生成する。 Upon receiving the text data, the morphological analysis result, and the user ID from the voice analysis processing unit 424a', the print-related processing unit 424b' uses the text data and the morphological analysis result in S12 to perform the next content. Execute the process to determine. Specifically, in the print-related processing unit 424b', the change from "a little more" is small, and from "dark", the setting parameter item is the density parameter, and the direction of further change is Recognize that it is an increasing direction and that it is inquiring whether it is possible from "become?". Then, from this recognition result, the print-related processing unit 424b'recognizes that the content of the user's utterance is "to increase the value of the density parameter in a direction slightly darker than the current value", and for that purpose, first, the printer 200 is asked. It is determined that the current setting value of the concentration parameter is to be queried. Then, the print-related processing unit 424b'generates a command (hereinafter referred to as "current setting request command") for inquiring the current setting value of the density parameter.

次に、S14では、印刷関連処理部424b′は、現設定要求コマンドを中継器100に送信する。中継器100は、S16にて、受信した現設定要求コマンドをそのまま、プリンタ200に送信する。 Next, in S14, the print-related processing unit 424b'transmits the current setting request command to the repeater 100. The repeater 100 transmits the received current setting request command as it is to the printer 200 in S16.

プリンタ200は、現設定要求コマンドを受信すると、S18にて、濃度パラメータの現在の設定値及びプリンタ200のモデル名を含む応答(以下「現設定応答」という)を中継器100に送信する。 When the printer 200 receives the current setting request command, in S18, the printer 200 transmits a response including the current setting value of the density parameter and the model name of the printer 200 (hereinafter referred to as “current setting response”) to the repeater 100.

中継器100は、S20にて、受信した現設定応答をそのまま、アプリケーションサーバ400に送信する。アプリケーションサーバ400の印刷関連処理部424b′は、S22にて、受信した現設定応答に基づいた処理を実行する。具体的には、例えば、現設定応答に、濃度パラメータの現在の設定値として“5”が含まれているとする。アプリケーションサーバ400は、例えば、データ記憶領域422内にプリンタ200を含む各種画像形成装置それぞれについて全設定パラメータの情報を記憶している。印刷関連処理部424b′は、現設定応答に含まれるモデル名と一致する画像形成装置、つまりプリンタ200の全設定パラメータの情報から、濃度パラメータとして設定可能な最大値を取得する。その最大値が、例えば“10”であるとすると、印刷関連処理部424b′は、濃度パラメータの値を現在値“5”からさらに“5”段階増加できることを知る。そこで、印刷関連処理部424b′は、そのことを知らせるための音声データの基になるテキストデータを生成する。例えば、印刷関連処理部424b′は、「5」、「濃くできる」と、小程度に対して「2」を選び、「あと5段階濃くできます。2段階濃くして再印刷しましょうか」のテキストデータを生成する。そして、印刷関連処理部424b′は、S24にて、生成したテキストデータを音声解析処理部424a′に渡す。 The repeater 100 transmits the received current setting response as it is to the application server 400 in S20. The print-related processing unit 424b'of the application server 400 executes processing based on the received current setting response in S22. Specifically, for example, it is assumed that the current setting response includes "5" as the current setting value of the concentration parameter. The application server 400 stores, for example, information on all setting parameters for each of the various image forming devices including the printer 200 in the data storage area 422. The print-related processing unit 424b'acquires the maximum value that can be set as the density parameter from the information of all the setting parameters of the image forming apparatus that matches the model name included in the current setting response, that is, the printer 200. Assuming that the maximum value is, for example, "10", the print-related processing unit 424b'knows that the value of the density parameter can be further increased by "5" steps from the current value "5". Therefore, the print-related processing unit 424b'generates text data that is the basis of the voice data for notifying the fact. For example, the print-related processing unit 424b'selects "5" and "can be darkened" and "2" for a small degree, and "can be darkened by 5 more steps. Should I make it darker by 2 steps and reprint?" Generate text data for. Then, the print-related processing unit 424b'passes the generated text data to the voice analysis processing unit 424a' in S24.

次に、S26では、音声解析処理部424a′は、そのテキストデータに基づいて音声データを作成する。そして、音声解析処理部424a′は、図3のS28にて、作成した音声データをスマートスピーカ300に送信する。 Next, in S26, the voice analysis processing unit 424a'creates voice data based on the text data. Then, the voice analysis processing unit 424a'transmits the created voice data to the smart speaker 300 in S28 of FIG.

次に、S30では、スマートスピーカ300は、受信した音声データを音声として発生させる。この音声を聞いたユーザは、S32にて、例えば「OK」と発話する。また、例えば「1段階だけ濃くして」と発話してもよい。これに応じて、スマートスピーカ300及び音声解析処理部424a′は、S32にて、上記S4〜S10の処理と同様の処理を実行し、テキストデータを生成して、印刷関連処理部424b′に渡す。 Next, in S30, the smart speaker 300 generates the received voice data as voice. The user who hears this voice utters, for example, "OK" in S32. Alternatively, for example, the utterance may be "make it darker by one step". In response to this, the smart speaker 300 and the voice analysis processing unit 424a'execute the same processing as the processing of the above S4 to S10 in S32, generate text data, and pass it to the printing-related processing unit 424b'. ..

S36では、印刷関連処理部424b′は、そのテキストデータに基づいてコマンドを作成する。具体的には、印刷関連処理部424b′は、2段階であれば、濃度パラメータの値を現在の設定値+2、すなわち7にして、再印刷することを指示するコマンドを生成する。そして、アプリケーションサーバ400は、S38にて、生成したコマンドを中継器100に送信する。中継器100は、S40にて、受信した再印刷のコマンドをそのまま、プリンタ200に送信する。S42では、プリンタ200は、受信した再印刷のコマンドに従って、濃度パラメータの設定値にて印刷機構250を制御し、制御部210に記憶している前回印刷に用いた印刷データに基づく再印刷を実行する。 In S36, the print-related processing unit 424b'creates a command based on the text data. Specifically, the print-related processing unit 424b'sets the density parameter value to the current set value +2, that is, 7 in the case of two steps, and generates a command instructing reprinting. Then, the application server 400 transmits the generated command to the repeater 100 in S38. The repeater 100 transmits the received reprint command as it is to the printer 200 in S40. In S42, the printer 200 controls the printing mechanism 250 with the set value of the density parameter according to the received reprint command, and executes reprinting based on the print data stored in the control unit 210 for the previous printing. do.

印刷関連処理部424b′は、上記S38で、印刷コマンドを中継器100に送信するときに、プリンタ200に再印刷を指示したことを知らせるための音声データの基になるテキストデータを生成し、音声解析処理部424a′に渡すようにしてもよい。これにより、スマートスピーカ300から、プリンタ200に再印刷を指示したことを知らせる音声が発生するので、ユーザは、プリンタ200から再印刷結果が出力されることを事前に知ることができる。 In S38 above, the print-related processing unit 424b'generates text data that is the basis of voice data for notifying the printer 200 that the printer 200 has been instructed to reprint when transmitting a print command to the repeater 100, and the voice is generated. It may be passed to the analysis processing unit 424a'. As a result, the smart speaker 300 generates a voice informing the printer 200 that the printer 200 has been instructed to reprint, so that the user can know in advance that the reprint result will be output from the printer 200.

また、再印刷結果に不満な場合には、ユーザは再度、不満な内容をスマートスピーカ300に発話する。これに応じて、上記S4〜S42の処理が繰り返され、プリンタ200から再々印刷結果が出力される。 If the user is dissatisfied with the reprint result, the user again speaks the dissatisfied content to the smart speaker 300. In response to this, the processes S4 to S42 are repeated, and the print result is output again from the printer 200.

なお、プリンタ200は、濃度パラメータの設定値を変更できるように構成されているが、他のプリンタでは、濃度パラメータの設定値を変更できないモデルもある。その場合には、印刷関連処理部424b′は、設定変更できないことを知らせるための音声データの基になるテキストデータを生成し、音声解析処理部424a′に渡すようにすればよい。 The printer 200 is configured so that the set value of the density parameter can be changed, but there is a model in which the set value of the density parameter cannot be changed in other printers. In that case, the print-related processing unit 424b'may generate text data that is the basis of the voice data for notifying that the setting cannot be changed, and pass it to the voice analysis processing unit 424a'.

また、本実施形態では、上記S2で、ユーザが「もう少し濃くなる?」と問いかけているので、上記S30で、「あと5段階濃くできます。2段階濃くして再印刷しましょうか」とユーザに返答している。これに代えて、上記S22〜S34の処理を省略して、ユーザに返答せずに、処理をS20からS36に進ませ、「濃く」から決定した濃度パラメータの現在値に、「もう少し」から少し増加方向に決定した値だけ加算して、再印刷することを指示するコマンドを生成するようにしてもよい。 Further, in the present embodiment, the user asks "Is it a little darker?" In S2 above, so in S30 above, the user asks "You can make it darker by 5 steps. Let's make it darker by 2 steps and reprint." Is replying to. Instead of this, the processing of S22 to S34 is omitted, the processing is advanced from S20 to S36 without replying to the user, and the current value of the concentration parameter determined from "dark" is slightly changed from "a little more". A command may be generated instructing reprinting by adding only the values determined in the increasing direction.

なお、本実施形態において、ユーザが発話した内容やスマートスピーカ300から発生された音声の内容は、一例に過ぎない。また、決定した設定パラメータの項目も、濃度パラメータに限らず、ユーザの発話内容に応じて様々な設定パラメータの項目が決定される。さらに、パラメータ値も、増加方向の変更に限らず、減少方向の変更もあり得る。また、変更しないこともあり得る。 In this embodiment, the content spoken by the user and the content of the voice generated from the smart speaker 300 are only examples. Further, the determined setting parameter items are not limited to the concentration parameter, and various setting parameter items are determined according to the content of the user's utterance. Further, the parameter value is not limited to the change in the increasing direction, but may be changed in the decreasing direction. It is also possible that it will not be changed.

このように、本実施形態の画像形成システム1000では、プリンタ200からの印刷結果に不満あるいは要求を抱いたユーザは、抱いた不満あるいは要求の内容をスマートスピーカ300に発話するだけで、その不満を解消する印刷結果、あるいはその要求に沿った印刷結果になるように、自動的に設定パラメータの項目とその値が決定されて、プリンタ200に対する印刷制御がなされるので、ユーザの意図通りの画像形成を行うことが可能となる。特に、変更すべき設定パラメータの値と印刷結果の関係をよく理解していないようなユーザにとって、ユーザが直接、設定パラメータの項目とパラメータ値を指示しなくてもよいので、有用である。 As described above, in the image forming system 1000 of the present embodiment, the user who is dissatisfied or has a request for the print result from the printer 200 simply speaks the dissatisfaction or the content of the request to the smart speaker 300, and the dissatisfaction is expressed. The items of the setting parameters and their values are automatically determined so that the print result to be resolved or the print result meets the request, and the print control for the printer 200 is performed, so that the image is formed as intended by the user. Can be done. In particular, it is useful for a user who does not fully understand the relationship between the value of the setting parameter to be changed and the print result, because the user does not have to directly instruct the item and the parameter value of the setting parameter.

また、ユーザは印刷結果に対する直感的な印象を発話するだけで、印刷設定が変更されて意図通りの印刷結果が得られるので、ユーザは直感的に印刷設定の変更ができるようになる。この結果、ユーザは、印刷アプリからユーザの意図通りの印刷結果が得られるような印刷設定を探す必要がなくなる。また、印刷アプリに予め登録されている印刷設定にはない、新規な印刷設定に変更できることもあり得る。 Further, the user can intuitively change the print setting because the print setting is changed and the print result as intended can be obtained only by speaking an intuitive impression on the print result. As a result, the user does not have to search the print application for print settings that can obtain the print result as intended by the user. In addition, it may be possible to change to a new print setting that is not in the print setting registered in advance in the print application.

本実施形態の画像形成システム1000では、アプリケーションサーバ400が、ユーザの発話内容の解析からプリンタ200へ送信するコマンドの生成まで行うので、スマートスピーカ300として種々のものを採用してもよい。つまり、機種依存性がない。また、中継器100も、アプリケーションサーバ400とプリンタ200との間で送受信されるデータをそのまま中継するだけであるので、データの中継ができるものであればよく、機種依存性がない。 In the image forming system 1000 of the present embodiment, since the application server 400 performs from the analysis of the utterance content of the user to the generation of the command to be transmitted to the printer 200, various smart speakers 300 may be adopted. That is, there is no model dependence. Further, since the repeater 100 only relays the data transmitted and received between the application server 400 and the printer 200 as it is, it is sufficient as long as the data can be relayed, and there is no model dependence.

図4は、アプリケーションサーバ400の印刷関連処理部424b′が記憶部420に記憶するログ情報のフォーマットの一例を示している。印刷関連処理部424b′は、ユーザがスマートスピーカ300に発話すると、発話の度にログ情報を取得し、記憶部420に記憶するようにしている。ログ情報は、図4に示すように、1.発話データと2.プリンタ情報とを対応付けて記憶する。 FIG. 4 shows an example of the format of the log information stored in the storage unit 420 by the print-related processing unit 424b'of the application server 400. When the user speaks to the smart speaker 300, the print-related processing unit 424b'acquires log information each time the user speaks and stores the log information in the storage unit 420. As shown in FIG. 4, the log information is 1. Utterance data and 2. Stores in association with printer information.

1.発話データとしては、1−1:日時、1−2:地域、1−3:生データ及び1−4:抽出データを取得する。「日時」は、ユーザが発話した日時である。「地域」は、ユーザが発話したときに居る地域である。地域は、国家単位、県単位、市町村単位、さらに細かい単位など、いずれの単位でもよい。例えば、スマートスピーカ300にGPSを搭載し、GPSから得られた位置情報に基づいて、「地域」を決定すればよい。「生データ」は、スマートスピーカ300から入力された音声データそのものである。「抽出データ」とは、「生データ」から、上述のようにして生成されたテキストデータと、このテキストデータに形態素解析処理を施して生成された形態素解析結果のことである。 1. 1. As the utterance data, 1-1: date and time, 1-2: region, 1-3: raw data and 1-4: extracted data are acquired. The "date and time" is the date and time when the user utters. The "region" is the region in which the user is speaking. The area may be any unit such as a national unit, a prefecture unit, a municipal unit, or a finer unit. For example, the smart speaker 300 may be equipped with GPS, and the "region" may be determined based on the position information obtained from the GPS. The "raw data" is the voice data itself input from the smart speaker 300. The "extracted data" is the text data generated as described above from the "raw data" and the morphological analysis result generated by subjecting the text data to morphological analysis processing.

2.プリンタ情報としては、2−1:印刷アプリ情報、2−2:印刷設定及び2−3:モデル情報を取得する。「印刷アプリ情報」は、上記図2及び図3の印刷制御処理の事前処理で用いた印刷アプリの情報のことである。印刷アプリの情報は、その印刷アプリがインストールされている端末装置に問い合わせるか、あるいは、プリンタ200が印刷に使用された印刷アプリの情報を記憶している場合には、上記S14で、現設定要求コマンドを送信するときに、印刷アプリの情報も問い合わせるようにすればよい。「印刷設定」は、プリンタ200の発話時に設定中の印刷設定である。S14では、上記S2で発話された発話内容に関連する設定パラメータの情報のみ要求するようにしたが、全ての設定パラメータの設定情報を要求するようにすればよい。「モデル情報」は、プリンタ200のモデル名のことである。上記S18では、プリンタ200は、モデル名も含んだ現設定応答を生成するので、このモデル名を用いればよい。なお、「印刷設定」は、プリンタ200に設定中の印刷設定の全てであっても、そのうちの一部であってもよい。一部とは、1つであってもよい。この場合、発話内容に関係の深い1つの印刷設定を選択するようにしてもよい。 2. As the printer information, 2-1: print application information, 2-2: print setting, and 2-3: model information are acquired. The "print application information" is the information of the print application used in the pre-processing of the print control processing of FIGS. 2 and 3 above. For the information of the print application, inquire the terminal device in which the print application is installed, or when the printer 200 stores the information of the print application used for printing, the current setting request is made in S14 above. When you send the command, you should also ask for the information of the print application. The "print setting" is a print setting that is being set when the printer 200 speaks. In S14, only the information of the setting parameters related to the utterance content uttered in S2 is requested, but the setting information of all the setting parameters may be requested. "Model information" is a model name of the printer 200. In S18, the printer 200 generates the current setting response including the model name, so this model name may be used. The "print settings" may be all of the print settings set in the printer 200, or may be a part of them. The part may be one. In this case, one print setting that is closely related to the utterance content may be selected.

さらにログ情報を、発話データ内にプリンタ200の設定に関する用語が含まれているログ情報と、プリンタ200の設定に関する用語が含まれていないログ情報とに分類し、各類型毎に記憶しておく。このように記憶しておけば、類型毎にログ情報を使用でき、便利である。なお、プリンタ200の設定に関する用語が含まれているか否かは、1−4:抽出データに基づいて直ちに判断できる。 Further, the log information is classified into log information in which terms related to printer 200 settings are included in the utterance data and log information in which terms related to printer 200 settings are not included, and is stored for each type. .. If you store it in this way, you can use the log information for each type, which is convenient. Whether or not the term related to the setting of the printer 200 is included can be immediately determined based on 1-4: extracted data.

このようにして取得したログ情報は、プリンタ200に対するユーザの幅広い好みや要望を知り、今後の製品開発に生かすために利用する。従来から、印刷アプリのUI画面に対するユーザ操作は操作ログとして記憶されていたが、ユーザがしたいこと(Want)を把握できる範囲は限られていた。例えば、濃度パラメータの設定値が最大に設定されている場合、ユーザはその設定値でよいのか、もっと濃くしたいのか、操作ログからでは判断が困難である。一方、ユーザの発話が「もっと濃くしたい」や「まだ薄いな」であり、これがログ情報として収集されていた場合、ユーザのWantは、装置の設定可能な範囲を超えたWantであることが分かる。このように、本実施形態のログ情報からは、ユーザの幅広い好みや要望を知ることができる。 The log information acquired in this way is used to know a wide range of user preferences and requests for the printer 200 and to utilize it in future product development. Conventionally, user operations on the UI screen of a print application have been stored as an operation log, but the range in which the user can grasp what he / she wants to do (Want) has been limited. For example, when the set value of the density parameter is set to the maximum, it is difficult for the user to judge from the operation log whether the set value should be used or whether the set value should be made darker. On the other hand, if the user's utterance is "want to be darker" or "still thin" and this is collected as log information, it can be seen that the user's Want is a Want that exceeds the settable range of the device. .. As described above, from the log information of the present embodiment, a wide range of user preferences and requests can be known.

なお、ログ情報として、音声データをテキスト化しただけの情報を記憶することも考えられるが、それでは、何を基準にユーザがその発話に及んだか、後から分かり難い。そこで、本実施形態では、プリンタの設定等の情報と発話の情報とを対応付けて、ログ情報として記憶するようにしている。これにより、ユーザのWantの把握の正確性が大きく向上し、ログ情報としての有用性も大きく向上する。 It is conceivable to store information that is just a text version of voice data as log information, but then it is difficult to understand later what the user used to speak. Therefore, in the present embodiment, information such as printer settings and utterance information are associated with each other and stored as log information. As a result, the accuracy of grasping the Want of the user is greatly improved, and the usefulness as log information is also greatly improved.

また、ユーザの好みや要望を知る方法として、例えば、プリンタのサポートサイトなどにユーザの要望欄を設け、自由に書き込んでもらう方法がある。この方法で得られたユーザの好みや要望には、偏りがある場合がある。つまり、積極的に書き込む意思のあるユーザからの好みや要望しか得られないからである。これに対して、本実施形態のようにして得られるログ情報からは、偏りのない広い範囲のユーザからの好みや要望を得ることができる。このため、幅広いユーザのWantに対応したサービスの提供等の事業拡大や、次の製品開発等に生かすことができる。 Further, as a method of knowing the user's preference and request, for example, there is a method of providing a user's request column on a printer support site or the like and having the user write freely. The user preferences and desires obtained by this method may be biased. In other words, only the tastes and requests from users who are willing to write positively can be obtained. On the other hand, from the log information obtained as in the present embodiment, it is possible to obtain preferences and requests from a wide range of users without bias. Therefore, it can be utilized for business expansion such as provision of services corresponding to Want of a wide range of users and development of the next product.

以上説明したように、本実施形態のアプリケーションサーバ400は、ネットワークIF480と、記憶部420と、CPU410と、を備えている。そして、CPU410は、ネットワークIF480を介して接続された、音声を入力及び出力するスマートスピーカ300から、プリンタ200のユーザが発話することにより入力された音声の内容を認識する音声内容認識処理と、認識された音声の内容の中に、プリンタ200の設定に関する用語が含まれている場合、プリンタ200の印刷設定をプリンタ200から取得する取得処理と、認識された音声の内容と、取得されたプリンタ200の印刷設定とを対応付け、プリンタ200の設定に関するログ情報として記憶部420に記憶するログ情報記憶処理と、を実行する。 As described above, the application server 400 of the present embodiment includes a network IF 480, a storage unit 420, and a CPU 410. Then, the CPU 410 recognizes the content of the voice input by the user of the printer 200 from the smart speaker 300 that inputs and outputs the voice connected via the network IF480. When the term "setting of the printer 200" is included in the content of the sound, the acquisition process of acquiring the print setting of the printer 200 from the printer 200, the content of the recognized sound, and the acquired printer 200 The log information storage process of storing the log information in the storage unit 420 as the log information related to the setting of the printer 200 is executed in association with the print setting of.

このように、本実施形態のアプリケーションサーバ400では、ユーザの幅広い好みや要望をログとして収集することが可能となる。 As described above, the application server 400 of the present embodiment can collect a wide range of user preferences and requests as a log.

ちなみに、本実施形態において、アプリケーションサーバ400は、「情報処理装置」の一例である。ネットワークIF480は、「通信インタフェース」の一例である。記憶部420は、「記憶装置」の一例である。CPU410は、「制御装置」の一例である。プリンタ200は、「画像形成装置」の一例である。印刷設定は、「設定情報」の一例である。 Incidentally, in the present embodiment, the application server 400 is an example of an "information processing device". The network IF480 is an example of a "communication interface". The storage unit 420 is an example of a “storage device”. The CPU 410 is an example of a "control device". The printer 200 is an example of an "image forming apparatus". The print setting is an example of "setting information".

また、ログ情報記憶処理では、プリンタ200の印刷設定に加えて、プリンタ200に印刷を指示した印刷アプリ情報もプリンタ200の設定に関するログ情報として記憶する。これにより、印刷アプリについてのユーザの幅広い好みや要望をログとして収集することができる。ちなみに、印刷は、「画像形成」の一例である。印刷アプリ情報は、「アプリケーションの情報」の一例である。 Further, in the log information storage process, in addition to the print settings of the printer 200, the print application information instructing the printer 200 to print is also stored as log information related to the settings of the printer 200. This makes it possible to collect a wide range of user preferences and requests regarding the print application as a log. By the way, printing is an example of "image formation". The print application information is an example of "application information".

また、ログ情報記憶処理では、プリンタ200の印刷設定に加えて、プリンタ200のモデル情報もプリンタ200の設定に関するログ情報として記憶する。これにより、プリンタ200のモデル毎にユーザの幅広い好みや要望をログとして収集することができる。ちなみに、モデル情報は、「機器情報」の一例である。 Further, in the log information storage process, in addition to the print settings of the printer 200, the model information of the printer 200 is also stored as log information related to the settings of the printer 200. As a result, a wide range of user preferences and requests can be collected as a log for each model of the printer 200. By the way, the model information is an example of "device information".

また、ログ情報記憶処理では、認識された音声の内容の中に、プリンタ200の設定に関する用語が含まれていない場合、認識された音声の内容と、取得されたプリンタ200の設定情報とを対応付け、プリンタ200の設定に関しないログ情報として記憶部420に記憶する。これにより、プリンタ200の設定に関しない音声内容を含むユーザの幅広い好みや要望をログとして収集することができる。 Further, in the log information storage process, when the recognized voice content does not include a term related to the setting of the printer 200, the recognized voice content corresponds to the acquired setting information of the printer 200. Attached, it is stored in the storage unit 420 as log information not related to the setting of the printer 200. As a result, a wide range of user preferences and requests including audio content not related to the settings of the printer 200 can be collected as a log.

また、プリンタ200の印刷設定は、複数の設定項目の設定を含み、ログ情報記憶処理では、認識された音声の内容と、複数の設定項目の設定から認識された音声の内容と関連する1つを対応付け、プリンタ200の設定に関するログ情報として記憶部420に記憶する。これにより、設定項目を絞りつつ、ユーザの幅広い好みや要望をログとして収集することができる。 Further, the print setting of the printer 200 includes the setting of a plurality of setting items, and in the log information storage process, one related to the recognized voice content and the sound content recognized from the setting of the plurality of setting items. Are associated with each other and stored in the storage unit 420 as log information related to the setting of the printer 200. This makes it possible to collect a wide range of user preferences and requests as a log while narrowing down the setting items.

また、ログ情報記憶処理では、認識された音声の内容が程度を示す用語を含む場合、程度を示す用語も併せてプリンタ200の設定に関するログ情報として記憶部420に記憶する。これにより、程度を含むユーザの幅広い好みや要望もログとして収集することができる。ちなみに、「もっと濃くしたい」や「まだ薄いな」は、「程度」の一例である。 Further, in the log information storage process, when the content of the recognized voice includes a term indicating the degree, the term indicating the degree is also stored in the storage unit 420 as log information regarding the setting of the printer 200. This makes it possible to collect a wide range of user preferences and requests, including degree, as a log. By the way, "I want to make it darker" and "I'm still thin" are examples of "degree".

なお、本発明は上記実施形態に限定されるものでなく、その趣旨を逸脱しない範囲で様々な変更が可能である。 The present invention is not limited to the above embodiment, and various modifications can be made without departing from the spirit of the present invention.

(1)上記実施形態では、音声データを解析する処理は、アプリケーションサーバ400の音声解析処理部424a′が実行している。これに代えて、音声データを解析する処理の一部または全部は、スマートスピーカ300が実行してもよい。また、音声データを解析する処理の一部または全部は、印刷関連処理部424b′が実行してもよい。例えば、音声解析処理部424a′は、音声認識処理を行ってテキストデータを生成する処理だけを行い、単語を抽出する形態素解析処理は、印刷関連処理部424b′が実行してもよい。 (1) In the above embodiment, the process of analyzing the voice data is executed by the voice analysis processing unit 424a'of the application server 400. Instead, the smart speaker 300 may perform part or all of the process of analyzing the voice data. In addition, the print-related processing unit 424b'may execute a part or all of the processing for analyzing the voice data. For example, the voice analysis processing unit 424a'may perform only the processing of performing the voice recognition processing to generate text data, and the morphological analysis processing of extracting words may be executed by the printing-related processing unit 424b'.

(2)上記実施形態では、画像形成装置として、プリンタ200を採用したが、これに限らず、印刷機能にスキャン機能やファックス機能を加えた複合機を採用してもよい。この場合には、例えば、スマートスピーカ300に入力される音声に応じて、その複合機に印刷を行わせることができる。 (2) In the above embodiment, the printer 200 is adopted as the image forming apparatus, but the present invention is not limited to this, and a multifunction device in which a scanning function and a fax function are added to the printing function may be adopted. In this case, for example, the multifunction device can be made to print according to the voice input to the smart speaker 300.

(3)アプリケーションサーバ400は、クラウドサーバであるが、LAN70に接続され、インターネット80に接続されないローカルサーバであってもよい。この場合には、スマートスピーカ300からアプリケーションサーバ400にユーザIDなどの識別情報を送信せず、音声データだけを送信してもよい。 (3) Although the application server 400 is a cloud server, it may be a local server connected to the LAN 70 and not connected to the Internet 80. In this case, the smart speaker 300 may not transmit the identification information such as the user ID to the application server 400, but may transmit only the voice data.

(4)中継器100とプリンタ200とを接続するインタフェースは、ブルートゥースIF160に限らず、例えば、USBなどの有線インタフェースであってもよいし、NFC(Near field communicationの略)などの他の無線インタフェースであってもよい。 (4) The interface for connecting the repeater 100 and the printer 200 is not limited to the Bluetooth IF160, and may be, for example, a wired interface such as USB, or another wireless interface such as NFC (abbreviation of Near field communication). It may be.

(5)上記実施形態では、中継器100が、アプリケーションサーバ400とプリンタ200との間で送受信されるデータを中継する構成としたが、さらにアプリケーションサーバ400との間にスマートスピーカ300を介して中継してもよい。この場合、スマートスピーカ300のブルートゥースIF160あるいは無線LANIF180を用いた通信が中継器100との間で行われる。また、プリンタ200が無線LANIFを備えているような場合、アプリケーションサーバ400が中継器100を介さずに直接プリンタ200と通信するようにしてもよいし、あるいはアプリケーションサーバ400がスマートスピーカ300を介してプリンタ200と通信するようにしてもよい。 (5) In the above embodiment, the repeater 100 relays the data transmitted and received between the application server 400 and the printer 200, but further relays the data to and from the application server 400 via the smart speaker 300. You may. In this case, communication using the Bluetooth IF160 of the smart speaker 300 or the wireless LAN IF180 is performed with the repeater 100. Further, when the printer 200 is provided with a wireless LAN IF, the application server 400 may directly communicate with the printer 200 without going through the repeater 100, or the application server 400 may communicate directly with the printer 200 via the smart speaker 300. It may communicate with the printer 200.

(6)上記実施形態において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されていた構成の一部をハードウェアに置き換えるようにしてもよい。 (6) In the above embodiment, a part of the configuration realized by the hardware may be replaced with software, and conversely, a part of the configuration realized by the software may be replaced with the hardware. May be good.

50…アクセスポイント、70…LAN、80…インターネット、100…中継器、110…CPU、120…メモリ、160,260,360…ブルートゥースIF、180,380…無線LANIF、200…プリンタ、210…制御部、250…印刷機構、300…スマートスピーカ、310…制御部、350…音声入出力部、400…アプリケーションサーバ、410…CPU、420…記憶部、424a…音声解析プログラム、424b…印刷関連プログラム、424b′…印刷関連処理部、424a′…音声解析処理部、480…ネットワークIF、1000…画像形成システム。 50 ... Access point, 70 ... LAN, 80 ... Internet, 100 ... Repeater, 110 ... CPU, 120 ... Memory, 160, 260, 360 ... Bluetooth IF, 180, 380 ... Wireless LAN IF, 200 ... Printer, 210 ... Control unit , 250 ... printing mechanism, 300 ... smart speaker, 310 ... control unit, 350 ... audio input / output unit, 400 ... application server, 410 ... CPU, 420 ... storage unit, 424a ... voice analysis program, 424b ... printing related program, 424b ′… Printing-related processing unit 424a ′… Voice analysis processing unit 480… Network IF, 1000… Image forming system.

Claims (7)

通信インタフェースと、
記憶装置と、
制御装置と、
を備え、
前記制御装置は、
前記通信インタフェースを介して接続された、音声を入力及び出力するスマートスピーカから、画像形成装置のユーザが発話することにより入力された音声の内容を認識する音声内容認識処理と、
前記認識された音声の内容の中に、前記画像形成装置の設定に関する用語が含まれている場合、
前記画像形成装置の設定情報を前記画像形成装置から取得する取得処理と、
前記認識された音声の内容と、前記取得された前記画像形成装置の設定情報とを対応付け、前記画像形成装置の設定に関するログ情報として前記記憶装置に記憶するログ情報記憶処理と、
を実行する、
情報処理装置。
Communication interface and
Storage device and
Control device and
With
The control device is
A voice content recognition process that recognizes the content of the input voice by the user of the image forming apparatus speaking from a smart speaker that inputs and outputs voice connected via the communication interface.
When the recognized audio content includes terms related to the setting of the image forming apparatus,
The acquisition process of acquiring the setting information of the image forming apparatus from the image forming apparatus, and
A log information storage process in which the recognized voice content is associated with the acquired setting information of the image forming apparatus and stored in the storage device as log information relating to the setting of the image forming apparatus.
To execute,
Information processing device.
前記ログ情報記憶処理では、前記画像形成装置の設定情報に加えて、前記画像形成装置に画像形成を指示したアプリケーションの情報も前記画像形成装置の設定に関する前記ログ情報として記憶する、
請求項1に記載の情報処理装置。
In the log information storage process, in addition to the setting information of the image forming apparatus, the information of the application instructing the image forming apparatus to form an image is also stored as the log information regarding the setting of the image forming apparatus.
The information processing device according to claim 1.
前記ログ情報記憶処理では、前記画像形成装置の設定情報に加えて、前記画像形成装置の機器情報も前記画像形成装置の設定に関する前記ログ情報として記憶する、
請求項1又は2に記載の情報処理装置。
In the log information storage process, in addition to the setting information of the image forming apparatus, the device information of the image forming apparatus is also stored as the log information regarding the setting of the image forming apparatus.
The information processing device according to claim 1 or 2.
前記ログ情報記憶処理では、
前記認識された音声の内容の中に、前記画像形成装置の設定に関する用語が含まれていない場合、
前記認識された音声の内容と、前記取得された前記画像形成装置の設定情報とを対応付け、前記画像形成装置の設定に関しないログ情報として前記記憶装置に記憶する、
請求項1乃至3のいずれか1項に記載の情報処理装置。
In the log information storage process,
When the recognized audio content does not include terms related to the setting of the image forming apparatus.
The recognized content of the sound is associated with the acquired setting information of the image forming apparatus, and stored in the storage device as log information not related to the setting of the image forming apparatus.
The information processing device according to any one of claims 1 to 3.
前記画像形成装置の設定情報は、複数の設定項目の設定を含み、
前記ログ情報記憶処理では、前記認識された音声の内容と、前記複数の設定項目の設定から前記認識された音声の内容と関連する1つを対応付け、前記画像形成装置の設定に関するログ情報として前記記憶装置に記憶する、
請求項1乃至4のいずれか1項に記載の情報処理装置。
The setting information of the image forming apparatus includes the setting of a plurality of setting items.
In the log information storage process, the recognized voice content is associated with one related to the recognized voice content from the settings of the plurality of setting items, and the log information related to the setting of the image forming apparatus is used. Store in the storage device,
The information processing device according to any one of claims 1 to 4.
前記ログ情報記憶処理では、前記認識された音声の内容が程度を示す用語を含む場合、前記程度を示す用語も併せて前記画像形成装置の設定に関するログ情報として前記記憶装置に記憶する、
請求項1乃至5のいずれか1項に記載の情報処理装置。
In the log information storage process, when the content of the recognized voice includes a term indicating a degree, the term indicating the degree is also stored in the storage device as log information regarding the setting of the image forming apparatus.
The information processing device according to any one of claims 1 to 5.
通信インタフェースと、記憶装置と、を備えた情報処理装置のコンピュータが実行可能なプログラムであって、
前記コンピュータに、
前記通信インタフェースを介して接続された、音声を入力及び出力するスマートスピーカから、画像形成装置のユーザが発話することにより入力された音声の内容を認識する音声内容認識処理と、
前記音声内容認識処理によって認識された音声の内容の中に、前記画像形成装置の設定に関する用語が含まれている場合、
前記画像形成装置の設定情報を前記画像形成装置から取得する取得処理と、
前記認識された音声の内容と、前記取得された前記画像形成装置の設定情報とを対応付け、前記画像形成装置の設定に関するログ情報として前記記憶装置に記憶するログ情報記憶処理と、
を実行させるプログラム。
A program that can be executed by a computer of an information processing device equipped with a communication interface and a storage device.
On the computer
A voice content recognition process that recognizes the content of the input voice by the user of the image forming apparatus speaking from a smart speaker that inputs and outputs voice connected via the communication interface.
When the content of the voice recognized by the voice content recognition process includes terms related to the setting of the image forming apparatus.
The acquisition process of acquiring the setting information of the image forming apparatus from the image forming apparatus, and
A log information storage process in which the recognized voice content is associated with the acquired setting information of the image forming apparatus and stored in the storage device as log information relating to the setting of the image forming apparatus.
A program that executes.
JP2020062809A 2020-03-31 2020-03-31 Information processing device and program Active JP7404974B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020062809A JP7404974B2 (en) 2020-03-31 2020-03-31 Information processing device and program
US17/210,444 US11563864B2 (en) 2020-03-31 2021-03-23 Information processing apparatus and non-transitory computer-readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020062809A JP7404974B2 (en) 2020-03-31 2020-03-31 Information processing device and program

Publications (2)

Publication Number Publication Date
JP2021163074A true JP2021163074A (en) 2021-10-11
JP7404974B2 JP7404974B2 (en) 2023-12-26

Family

ID=78003465

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020062809A Active JP7404974B2 (en) 2020-03-31 2020-03-31 Information processing device and program

Country Status (1)

Country Link
JP (1) JP7404974B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019013316A1 (en) * 2017-07-14 2019-01-17 ダイキン工業株式会社 Equipment control system
US20190237085A1 (en) * 2018-01-29 2019-08-01 Samsung Electronics Co., Ltd. Display apparatus and method for displaying screen of display apparatus
WO2019207900A1 (en) * 2018-04-24 2019-10-31 ソニー株式会社 Information processing device and information processing method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019013316A1 (en) * 2017-07-14 2019-01-17 ダイキン工業株式会社 Equipment control system
US20190237085A1 (en) * 2018-01-29 2019-08-01 Samsung Electronics Co., Ltd. Display apparatus and method for displaying screen of display apparatus
WO2019207900A1 (en) * 2018-04-24 2019-10-31 ソニー株式会社 Information processing device and information processing method

Also Published As

Publication number Publication date
JP7404974B2 (en) 2023-12-26

Similar Documents

Publication Publication Date Title
JP2019095520A (en) Voice control system, control method, and program
JP7224863B2 (en) Relay server and control method
KR102533074B1 (en) Printing system, control method, and server
US20230254421A1 (en) Image processing system, setting control method, image processing apparatus, and storage medium
JP2011065108A (en) Image processing device, speech recognition processing device, control method of speech recognition processing device, and computer program
US11327697B2 (en) Information processing apparatus and startup method for input-output device
US11240390B2 (en) Server apparatus, voice operation system, voice operation method, and recording medium
JP2019215485A (en) Image forming apparatus, image forming system, control method, and control program
US11683422B2 (en) Image processing system, image processing apparatus, and image processing method
JP2022001997A (en) Information processing device, information processing system, control method, and program
JP7434519B2 (en) Printing control system and control method
JP7404974B2 (en) Information processing device and program
JP7400593B2 (en) Information processing device and program
JP7361509B2 (en) Peripheral device management system, printing device control system, control method, printing control device and program
CN111756944A (en) Image forming apparatus and job execution method
US11563864B2 (en) Information processing apparatus and non-transitory computer-readable storage medium
JP7314499B2 (en) Information processing system, information processing device, job control method and job control program
JP7205308B2 (en) Job generation device, image processing device, job generation method and job generation program
KR102537797B1 (en) Image forming system equipped with interactive agent function, method of controlling same, and storage medium
JP2020134903A (en) System, image formation device, method, and program
JP2021105849A (en) Print control system and its control method and program
JP7388272B2 (en) Information processing device, information processing method and program
US11700338B2 (en) Information processing system that receives audio operations on multifunction peripheral, as well as image processing apparatus and control method therefor
US11647130B2 (en) Information processing system capable of connecting a plurality of voice control devices, method of controlling information processing system, and storage medium
US11837226B2 (en) Information processing apparatus, information processing method, electronic device and information processing system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230815

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230829

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231025

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231114

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231127

R150 Certificate of patent or registration of utility model

Ref document number: 7404974

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150