JP2020020943A - Voice control system, information processing apparatus, control method, and program - Google Patents

Voice control system, information processing apparatus, control method, and program Download PDF

Info

Publication number
JP2020020943A
JP2020020943A JP2018144026A JP2018144026A JP2020020943A JP 2020020943 A JP2020020943 A JP 2020020943A JP 2018144026 A JP2018144026 A JP 2018144026A JP 2018144026 A JP2018144026 A JP 2018144026A JP 2020020943 A JP2020020943 A JP 2020020943A
Authority
JP
Japan
Prior art keywords
voice
terminal
registration
information
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018144026A
Other languages
Japanese (ja)
Inventor
洋介 須賀井
Yosuke Sugai
洋介 須賀井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2018144026A priority Critical patent/JP2020020943A/en
Publication of JP2020020943A publication Critical patent/JP2020020943A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

To efficiently associate a voice terminal with an apparatus to be operated.SOLUTION: When receiving, with a device, a registration instruction for registering the device and a voice terminal in association with each other, a voice control system issues a registration code for starting registration, and controls a portable terminal to output the issued registration code by voice. The voice control system acquires identification information on the device receiving the registration instruction and identification information on the voice terminal to which the registration code output by voice from the portable terminal is input by voice, and registers the acquired identification information on the device and identification information on the voice terminal in association with each other by using the registration code input by voice to the voice terminal.SELECTED DRAWING: Figure 10

Description

本発明は、音声コマンドによりデバイスを制御可能な音声制御システム、情報処理装置、制御方法およびプログラムに関する。   The present invention relates to a voice control system capable of controlling a device by a voice command, an information processing apparatus, a control method, and a program.

従来、独立した一つの音声端末が、様々な機器を代表して音声入力を受け付け、受け付けた内容に応じて、あらかじめ登録されたそれぞれの機器に対して命令を届ける(呼び出す)情報管理装置が特許文献1に記載されている。   Conventionally, an independent voice terminal receives voice input on behalf of various devices, and sends (calls) an instruction to each device registered in advance in accordance with the content of the received information. It is described in Reference 1.

特開2016−14967号公報JP 2016-14967 A

特許文献1のように音声端末が音声入力に対応する命令を登録されている電子機器に届けるためには、音声端末と、操作の対象となる機器の対応づけが必要である。音声端末が普及するに従い、この登録のための操作の効率化が求められている。   In order for the voice terminal to deliver a command corresponding to voice input to a registered electronic device as in Patent Literature 1, it is necessary to associate the voice terminal with the device to be operated. As voice terminals become more widespread, there is a demand for more efficient operation for this registration.

本発明は、音声端末と操作の対象となる機器との対応付けを効率的に行うことを目的とする。   An object of the present invention is to efficiently associate a voice terminal with a device to be operated.

上記課題を解決するため、本発明に係る音声制御システムは、音声端末と、前記音声端末で音声入力されたコマンドにより動作可能なデバイスと、サーバと、音声出力可能な携帯端末とを含む音声制御システムであって、前記デバイスと前記音声端末とを対応づけて登録する登録指示を前記デバイスで受け付けると、前記登録を開始するための登録コードを発行する発行手段と、前記発行手段により発行された前記登録コードを音声出力するよう前記携帯端末を制御する制御手段と、前記登録指示が受け付けられた前記デバイスの識別情報と、前記携帯端末から音声出力された前記登録コードが音声入力された前記音声端末の識別情報と、を取得する取得手段と、前記音声端末に音声入力された前記登録コードを用いて、前記取得手段により取得された前記デバイスの識別情報と前記音声端末の識別情報とを対応づけて登録する登録手段とを備えることを特徴とする。   In order to solve the above-mentioned problem, a voice control system according to the present invention provides a voice control including a voice terminal, a device operable by a command input by voice at the voice terminal, a server, and a mobile terminal capable of voice output. A registration unit for issuing a registration code for starting the registration when the device receives a registration instruction for registering the device and the voice terminal in association with each other; Control means for controlling the mobile terminal to output the registration code by voice; identification information of the device for which the registration instruction has been received; and the voice to which the registration code output by voice from the mobile terminal is input by voice By using the registration code that is input to the audio terminal by voice, Identification information obtained by said device and the identification information of the audio terminal in association, characterized in that it comprises a registration unit for registering.

本発明によれば、音声端末と操作の対象となる機器との対応付けを効率的に行うことが可能となる。   According to the present invention, it is possible to efficiently associate a voice terminal with a device to be operated.

音声制御システムを示す概略構成図である。It is a schematic structure figure showing a voice control system. サーバ管理DBに登録される情報を示す図である。FIG. 6 is a diagram illustrating information registered in a server management DB. 連携管理DBに登録される情報を示す図である。It is a figure showing information registered into cooperation management DB. 印刷装置管理DBに登録される情報を示す図である。FIG. 4 is a diagram illustrating information registered in a printing device management DB. ワンタイムトークンDBに登録される情報を示す図である。It is a figure showing information registered into one time token DB. 音声端末を用いた一般的な音声による命令を説明するための図である。It is a figure for explaining a command by a general voice using a voice terminal. 音声端末が命令を処理する場合の処理を示す図である。It is a figure showing processing when a voice terminal processes a command. 印刷装置の外観図である。FIG. 2 is an external view of a printing apparatus. 印刷装置が音声端末に紐づけて登録されるまでを説明するための図である。FIG. 4 is a diagram for describing a process until a printing device is registered in association with an audio terminal. 印刷装置の登録の手順を示すシーケンス図である。FIG. 4 is a sequence diagram illustrating a procedure for registering a printing apparatus. 印刷装置が音声端末に紐づけて登録されるまでを説明するための図である。FIG. 4 is a diagram for describing a process until a printing device is registered in association with an audio terminal. 印刷装置の登録の手順を示すシーケンス図である。FIG. 4 is a sequence diagram illustrating a procedure for registering a printing apparatus. 音声端末のブロック構成を示す図である。FIG. 3 is a diagram illustrating a block configuration of a voice terminal. 各サーバのブロック構成を示す図である。FIG. 3 is a diagram illustrating a block configuration of each server. 印刷装置のブロック構成を示す図である。FIG. 2 is a diagram illustrating a block configuration of a printing apparatus. 携帯端末のブロック構成を示す図である。It is a figure showing the block composition of a personal digital assistant. サーバにおける処理を示すフローチャートである。5 is a flowchart illustrating processing in the server.

以下、添付図面を参照して本発明の実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る本発明を限定するものでなく、また本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。なお、同一の構成要素には同一の参照番号を付して、説明を省略する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. The following embodiments do not limit the present invention according to the claims, and all combinations of features described in the present embodiments are not necessarily essential to the solution of the present invention. . The same components are denoted by the same reference numerals, and description thereof will be omitted.

[第一実施形態]
図1は、本実施形態における音声制御システムを示す概略構成図であり、基本的なサーバおよび情報端末構成を示している。音声制御システム1は、主としてユーザからの音声による命令(指示コマンド)を受け付ける音声端末106、その命令に基づいて処理を実行する印刷装置104、それらの機器とネットワーク100を介して接続される情報処理装置を含む。本実施形態の場合、情報処理装置は、印刷装置管理サーバ101、音声端末連携サーバ102、音声端末管理サーバ103、登録音声付HTML生成サーバ115を含む。また、音声制御システム1は、印刷装置104を音声端末106に紐づけて登録する際に用いられる携帯端末105を含む。ネットワーク100は、例えばインターネットである。ネットワーク100は、有線媒体や無線媒体を含み、アクセスポイントも含み得る。
[First embodiment]
FIG. 1 is a schematic configuration diagram illustrating a voice control system according to the present embodiment, and illustrates a basic configuration of a server and an information terminal. The voice control system 1 mainly includes a voice terminal 106 that receives a command (instruction command) by voice from a user, a printing device 104 that executes processing based on the command, and information processing that is connected to those devices via the network 100. Including equipment. In the case of the present embodiment, the information processing apparatus includes a printing apparatus management server 101, a voice terminal cooperation server 102, a voice terminal management server 103, and an HTML generation server with registered voice 115. The voice control system 1 also includes a portable terminal 105 used when registering the printing device 104 in association with the voice terminal 106. The network 100 is, for example, the Internet. The network 100 includes a wired medium and a wireless medium, and may include an access point.

印刷装置104は、自身を識別する印刷装置識別ID111を記憶領域に保持しており、ネットワーク100を通じて印刷装置管理サーバ101と通信可能である。   The printing device 104 holds a printing device identification ID 111 for identifying itself in a storage area, and can communicate with the printing device management server 101 via the network 100.

印刷装置管理サーバ101は、印刷装置管理DB107と、ワンタイムトークンDB108とを有する。印刷装置管理DB107は、印刷装置104の識別情報とIPアドレスとを対応付けて登録し、管理するデータベースである。ワンタイムトークンDB108は、後述する処理において登録コードとして用いるワンタイムトークンと印刷装置104とを対応付けて登録し、管理するデータベースである。印刷装置管理サーバ101は、印刷装置104と音声端末106とを紐づけて登録する依頼を受信すると、ワンタイムトークンを発行する。また、印刷装置管理サーバ101は、印刷装置識別ID111および発行されたワンタイムトークンをワンタイムトークンDB108に保存する。また、印刷装置管理サーバ101は、ユーザが音声端末106に対して発した指示コマンドに対応する処理を、音声端末106に対応付けられたデバイス、例えば印刷装置104に対して実行させるデバイス制御を行う。   The printing device management server 101 has a printing device management DB 107 and a one-time token DB 108. The printing device management DB 107 is a database that registers and manages the identification information of the printing device 104 and the IP address in association with each other. The one-time token DB 108 is a database for registering and managing the one-time token used as a registration code in the processing described later and the printing apparatus 104 in association with each other. When receiving the request to link and register the printing device 104 and the audio terminal 106, the printing device management server 101 issues a one-time token. The printing device management server 101 stores the printing device identification ID 111 and the issued one-time token in the one-time token DB 108. Further, the printing apparatus management server 101 performs device control for causing a device associated with the audio terminal 106 to execute processing corresponding to an instruction command issued by the user to the audio terminal 106, for example, the printing apparatus 104. .

音声端末106は、ユーザの音声による命令を受け付ける。音声端末106は、自身を識別する音声端末識別ID114を記憶領域に保持しており、ネットワーク100を通じて音声端末管理サーバ103と通信する。また、後述の処理を行うことにより、音声端末106で音声入力されたコマンドにより動作可能なデバイスに対して命令が送信される。本実施形態の場合、ユーザは、音声端末106に対して音声入力を行うことで印刷装置104に対して種種の命令を出すことができる。   The voice terminal 106 receives a command by a user's voice. The voice terminal 106 holds a voice terminal identification ID 114 for identifying itself in a storage area, and communicates with the voice terminal management server 103 via the network 100. In addition, by performing the processing described below, a command is transmitted to a device operable by a command input by voice from the voice terminal 106. In the case of the present embodiment, the user can issue various commands to the printing device 104 by performing voice input to the voice terminal 106.

音声端末管理サーバ103は、音声端末106と他の様々な情報機器や装置とが連携して様々なサービスを行うためのシステムを構築している。音声端末106は、ユーザの音声による命令を受け付けると、その発話内容を音声端末管理サーバ103に送信する。音声端末管理サーバ103は、音声端末連携サーバ管理DB110(以下、サーバ管理DB110とも呼ぶ)を有しており、サーバ管理DB110には、印刷装置104およびその他のデバイス等の呼び出し名(後述)と、その呼び出し名の装置に対応した音声端末連携サーバのURLとが対応付けられて保存されている。音声端末管理サーバ103は、音声端末管理サーバ103から送信された発話内容に含まれる呼び出し名、および、サーバ管理DB110に保存された情報から、発話内容に含まれる命令を送信する音声端末連携サーバ102を特定する。音声端末管理サーバ103は、音声端末106から送信された発話内容に基づく命令を対象の音声端末連携サーバ102に転送し、音声端末連携サーバ102にサービスを提供させる。また、音声端末管理サーバ103は、音声端末連携サーバ102からユーザの命令に対する応答を受け取ると、その応答を音声端末106に転送し、音声端末106に応答を音声出力させる。このように、音声端末管理サーバ103は、音声端末連携サーバ102と音声端末106との間の仲介機能を有している。   The voice terminal management server 103 constructs a system for performing various services in cooperation with the voice terminal 106 and various other information devices and devices. Upon receiving the user's voice command, the voice terminal 106 transmits the uttered content to the voice terminal management server 103. The voice terminal management server 103 has a voice terminal cooperation server management DB 110 (hereinafter, also referred to as a server management DB 110). The server management DB 110 includes a call name (to be described later) of the printing apparatus 104 and other devices, and the like. The URL of the voice terminal cooperation server corresponding to the device of the call name is stored in association with the URL. The voice terminal management server 103 transmits a command included in the utterance content from the call name included in the utterance content transmitted from the voice terminal management server 103 and the information stored in the server management DB 110. To identify. The voice terminal management server 103 transfers the command based on the utterance content transmitted from the voice terminal 106 to the target voice terminal cooperation server 102, and causes the voice terminal cooperation server 102 to provide a service. Further, upon receiving a response to the user's command from the voice terminal cooperation server 102, the voice terminal management server 103 transfers the response to the voice terminal 106, and causes the voice terminal 106 to output the response by voice. Thus, the voice terminal management server 103 has an intermediary function between the voice terminal cooperation server 102 and the voice terminal 106.

音声端末連携サーバ102は、音声端末管理サーバ103から命令が転送されると、その命令の内容に応じてサービスを提供する機能を有する。また、音声端末連携サーバ102は、どの音声端末識別IDとどの印刷装置識別IDとが連携をしているのかを登録している連携管理DB109を有する。   When a command is transferred from the voice terminal management server 103, the voice terminal cooperation server 102 has a function of providing a service according to the content of the command. Further, the voice terminal cooperation server 102 has a cooperation management DB 109 that registers which voice terminal ID and which printing device ID are linked with each other.

携帯端末105は、一般的な携帯端末であり、携帯端末105として、例えばスマートフォンやタブレット端末等を用いられる。携帯端末105は、Webブラウザ機能113と、QRコード(登録商標)を読取可能なQRコード読み取り機能112とを有する。Webブラウザ機能113は、URLを指定されると様々なWebサーバにアクセス可能であり、例えば、ネットワーク100を通じて登録音声付HTML生成サーバに接続可能である。従って、QRコードに登録音声付HTML生成サーバ115のURLの情報が埋め込まれていれば、携帯端末105は、QRコード読み取り機能112によってそのQRコードを読み取ることで、登録音声付HTML生成サーバ115にアクセスすることができる。例えば、携帯端末105は、登録音声付HTMLサーバ115にアクセスして、音声データを取得することができる。なお、本実施形態では、携帯端末105が読み取る対象をQRコードとして説明するが、他の二次元コードであってもよい。   The mobile terminal 105 is a general mobile terminal, and for example, a smartphone, a tablet terminal, or the like is used as the mobile terminal 105. The mobile terminal 105 has a Web browser function 113 and a QR code reading function 112 capable of reading a QR code (registered trademark). The Web browser function 113 can access various Web servers when the URL is specified, and can connect to the HTML generation server with registered voice via the network 100, for example. Therefore, if the URL information of the registered voice-attached HTML generation server 115 is embedded in the QR code, the portable terminal 105 reads the QR code by the QR code reading function 112, Can be accessed. For example, the mobile terminal 105 can access the registered voice-attached HTML server 115 and acquire voice data. In the present embodiment, the target read by the mobile terminal 105 is described as a QR code, but may be another two-dimensional code.

図2は、音声端末管理サーバ103のサーバ管理DB110に登録される情報の一例を示す図である。サーバ管理DB110には、呼び出し名と、呼び出し名に対応する音声端末連携サーバのURLとが組み合わされて登録されている。音声端末管理サーバ103は、音声端末106から発話内容が送信された場合、発話内容に含まれる呼び出し名に基づいて、発話内容に含まれる命令の転送先となる音声端末連携サーバ102のURLが特定される。   FIG. 2 is a diagram illustrating an example of information registered in the server management DB 110 of the voice terminal management server 103. In the server management DB 110, the combination of the call name and the URL of the voice terminal cooperation server corresponding to the call name is registered. When the speech content is transmitted from the speech terminal 106, the speech terminal management server 103 specifies the URL of the speech terminal cooperation server 102 to which the command contained in the speech content is transferred based on the call name contained in the speech content. Is done.

図3は、音声端末連携サーバ102の連携管理DB109に登録される情報の一例を示す図である。連携管理DB109には、印刷装置識別IDと音声端末識別IDとが紐づけて登録されており、どちらか一方が指定されると、連携先のIDが特定される。   FIG. 3 is a diagram illustrating an example of information registered in the cooperation management DB 109 of the voice terminal cooperation server 102. In the cooperation management DB 109, the printing apparatus identification ID and the voice terminal identification ID are registered in association with each other, and when one of them is specified, the ID of the cooperation destination is specified.

図4は、印刷装置管理サーバ101の印刷装置管理DB107に登録される情報の一例を示す図である。印刷装置識別IDとIPアドレスとが組み合わされて登録されており、アクセスしたい印刷装置識別IDから、その装置のIPアドレスが特定される。   FIG. 4 is a diagram illustrating an example of information registered in the printing device management DB 107 of the printing device management server 101. The printing device identification ID and the IP address are registered in combination, and the IP address of the device is specified from the printing device identification ID to be accessed.

図5は、印刷装置管理サーバ101のワンタイムトークンDB108に登録される情報の一例を示す図である。ワンタイムトークンIDと印刷装置識別IDが組み合わされて登録されており、ワンタイムトークンIDから、印刷装置識別IDが特定される。   FIG. 5 is a diagram illustrating an example of information registered in the one-time token DB 108 of the printing device management server 101. The one-time token ID and the printing device identification ID are registered in combination, and the printing device identification ID is specified from the one-time token ID.

図6は、音声端末を用いた一般的な音声による命令を説明するための図である。ユーザ600は、音声端末106に対して、命令としての発声602を発声すると、音声端末106は、発声602を受信して処理を行った後、命令を受け取った旨の返信603を音声出力する。また、発声602は、その内容により、開始部分604、呼び出し部分605及び命令部分606に分けられる。   FIG. 6 is a diagram for explaining a general voice command using a voice terminal. When the user 600 utters the utterance 602 as an instruction to the audio terminal 106, the audio terminal 106 receives the utterance 602 and performs a process, and then outputs a reply 603 indicating that the instruction has been received. The utterance 602 is divided into a start portion 604, a calling portion 605, and a command portion 606 according to the content.

ここで、開始部分604は、音声端末106に対して音声入力している事を認識させるための部分であり、音声端末106は、開始部分604を受け付けることで、後続する発声を自装置への命令として認識可能である。また、呼び出し部分605は、連携したい音声端末連携サーバ102を示す部分であり、本実施形態では、呼び出し部分605の発声内容を「呼び出し名」と呼称し、呼び出し名に対応付けられた音声端末連携サーバ102と音声端末106とが音声端末管理サーバ103を介して連携可能となる。さらに、命令部分606は、音声端末連携サーバ102により音声端末106と連携しているデバイス、例えば印刷装置104に対して具体的に実行させたい処理内容を指示する部分である。   Here, the start part 604 is a part for causing the voice terminal 106 to recognize that the voice is being input, and the voice terminal 106 accepts the start part 604 to transmit the subsequent utterance to its own device. It can be recognized as an instruction. Further, the calling part 605 is a part indicating the voice terminal cooperation server 102 to be cooperated. In this embodiment, the utterance content of the calling part 605 is referred to as “call name”, and the voice terminal cooperation The server 102 and the audio terminal 106 can cooperate via the audio terminal management server 103. Further, the command part 606 is a part for instructing a device cooperating with the audio terminal 106 by the audio terminal cooperating server 102, for example, a printing device 104, with a process content to be specifically executed.

図13は、音声端末106のハードウェアブロック構成を示す図である。音声端末106は、スピーカ1301、CPU1302、ROM1303、マイクロフォン1304、RAM1305、外部記憶装置1306、通信部1307、近距離無線通信部1308を有する。なお、図13に示す各ブロックは、例えば内部バス1310を用いて相互に接続される。また、CPUはCentral Processing Unitを表し、ROMはRead Only Memoryを表し、RAMはRandom Access Memoryを表す。本実施形態における音声端末106の動作は、例えば、CPU1302がROM1303に記憶されたプログラムをRAM1305にロードして実行することにより実現される。   FIG. 13 is a diagram illustrating a hardware block configuration of the audio terminal 106. The audio terminal 106 includes a speaker 1301, a CPU 1302, a ROM 1303, a microphone 1304, a RAM 1305, an external storage device 1306, a communication unit 1307, and a short-range wireless communication unit 1308. The blocks shown in FIG. 13 are connected to each other using, for example, an internal bus 1310. Further, the CPU represents the Central Processing Unit, the ROM represents the Read Only Memory, and the RAM represents the Random Access Memory. The operation of the audio terminal 106 in the present embodiment is realized, for example, by the CPU 1302 loading a program stored in the ROM 1303 into the RAM 1305 and executing the program.

スピーカ1301は、音声データに基づいて音声出力する。CPU1302は、例えばシステム制御基板上に構成され、音声端末106を統括的に制御する。ROM1303は、CPU1302が実行する制御プログラムやデータテーブル、組み込みOS(Operating System)プログラム等の固定データを記憶する。本実施形態では、ROM1303に記憶されている各制御プログラムは、ROM1303に記憶されている組み込みOSのソフトウェア実行制御の対象となる。ソフトウェア実行制御とは、例えば、スケジューリングやタスクスイッチ、割り込み処理である。マイクロフォン1304は、音声端末106の周囲の音声、例えば、ユーザが発した音声を受信する。   The speaker 1301 outputs audio based on audio data. The CPU 1302 is configured, for example, on a system control board, and controls the voice terminal 106 comprehensively. The ROM 1303 stores fixed data such as a control program executed by the CPU 1302, a data table, and an embedded OS (Operating System) program. In the present embodiment, each control program stored in the ROM 1303 is a target of software execution control of the embedded OS stored in the ROM 1303. The software execution control is, for example, scheduling, task switching, and interrupt processing. The microphone 1304 receives audio around the audio terminal 106, for example, audio emitted by the user.

RAM1305は、例えば、バックアップ電源を必要とするSRAM(StaticRAM)等で構成される。なお、RAM1305は、不図示のデータバックアップ用の一次電池によってデータが保持されるので、プログラム制御変数等のデータを揮発させずに保持することができる。また、音声端末106の設定情報や管理データ等を記憶するメモリエリアもRAM1305に設けられている。また、RAM1305は、CPU1302の主メモリ及びワークメモリとしても用いられる。外部記憶装置1306は、アプリケーションソフトウェアを記憶する。   The RAM 1305 includes, for example, an SRAM (Static RAM) that requires a backup power supply. Since data is held in the RAM 1305 by a data backup primary battery (not shown), data such as program control variables can be held without volatilization. Further, a memory area for storing setting information and management data of the audio terminal 106 is also provided in the RAM 1305. The RAM 1305 is also used as a main memory and a work memory of the CPU 1302. The external storage device 1306 stores application software.

通信部1307は、所定の無線通信方式に従って通信を行うための回路やアンテナを含んで構成される。例えば、通信部1307は、外部のアクセスポイントに無線接続することができる。また、通信部1307は、一時的に自身がアクセスポイントとして動作することも可能である。つまり通信部1307がアクセスポイント機能を備えてもよい。本実施形態で使用される無線通信は、IEEE802.11規格シリーズに準拠した無線LANの無線通信方式に従って動作する能力を有しても良いし、他の無線通信方式に従って動作する能力を有しても良い。近距離無線通信部1308は、音声端末106と一定の近距離範囲内に存在する他の装置と近距離無線通信を行う。なお、近距離無線通信部1308は、通信部1307と異なる無線通信方式によって通信を行う。本実施形態では、近距離無線通信部1308は、Bluetooth(登録商標)規格に従って動作するものとする。   The communication unit 1307 includes a circuit and an antenna for performing communication according to a predetermined wireless communication scheme. For example, the communication unit 1307 can wirelessly connect to an external access point. The communication unit 1307 can also temporarily operate as an access point. That is, the communication unit 1307 may have an access point function. The wireless communication used in the present embodiment may have the ability to operate in accordance with the wireless LAN wireless communication system conforming to the IEEE 802.11 standard series, or the ability to operate in accordance with another wireless communication system. Is also good. The short-range wireless communication unit 1308 performs short-range wireless communication with the audio terminal 106 and another device existing within a certain short-range. Note that the short-range wireless communication unit 1308 performs communication using a wireless communication method different from that of the communication unit 1307. In the present embodiment, the short-range wireless communication unit 1308 operates according to the Bluetooth (registered trademark) standard.

音声認識・音声出力部1309は、マイクロフォン1304を介して入力された音声を音声認識して音声データを生成し、また、外部から受信した音声データ若しくは予め保持しているメッセージデータを音声信号に変換してスピーカ1301から音声出力する。   A voice recognition / voice output unit 1309 recognizes voice input via the microphone 1304 to generate voice data, and converts voice data received from the outside or message data stored in advance into voice signals. Then, sound is output from the speaker 1301.

図14は、音声端末管理サーバ103、音声端末連携サーバ102、登録音声付HTML生成サーバ115のブロック構成を示す図である。図14は、上記の3つの装置に共通の構成を示しているので、以下では、音声端末管理サーバ103として説明する。なお、本実施形態では、音声端末管理サーバ103、音声端末連携サーバ102、登録音声付HTML生成サーバ115がそれぞれ1台のサーバ(情報処理装置)で構成されているが、複数台のサーバが連携して動作することで、音声端末管理サーバ103、音声端末連携サーバ102、登録音声付HTML生成サーバ115に対応するサーバシステムが構築される形態であっても構わない。   FIG. 14 is a diagram illustrating a block configuration of the voice terminal management server 103, the voice terminal cooperation server 102, and the HTML generation server with registration voice 115. FIG. 14 shows a configuration common to the three devices described above. In the present embodiment, the voice terminal management server 103, the voice terminal cooperation server 102, and the registered voice-attached HTML generation server 115 are each configured by one server (information processing device). By operating as such, a server system corresponding to the voice terminal management server 103, the voice terminal cooperation server 102, and the registered voice-attached HTML generation server 115 may be constructed.

CPU1401は、音声端末管理サーバ103を統括的に制御するための中央演算装置である。ディスク装置1402は、アプリケーションプログラム1412やデータベース1413やOSの他、各種ファイルやデータを記憶する。外部記憶媒体読取装置1403は、SDカードなどの外部記憶媒体に記憶されたファイルなどの情報を読み出すための装置である。メモリ1404は、RAMなどで構成され、CPU1401が必要に応じてデータの一時的格納やバッファリング等を行う。   The CPU 1401 is a central processing unit for controlling the voice terminal management server 103 overall. The disk device 1402 stores various files and data in addition to the application program 1412, the database 1413, and the OS. The external storage medium reading device 1403 is a device for reading information such as a file stored in an external storage medium such as an SD card. The memory 1404 is configured by a RAM or the like, and the CPU 1401 performs temporary storage and buffering of data as necessary.

表示部1405は、例えばLCDで構成され、各種の情報を表示する。また、操作部1406は、ユーザが各種の入力操作を行うためのキーボードやマウスなどを含み、ユーザからの指示や操作を受付可能である。ネットワーク通信部1407は、ネットワーク接続部1408を介してインターネット等のネットワークと接続され、各種の通信を行う。ネットワーク接続部1408は、有線LANや無線LANなどのネットワーク媒体に対応し、有線LAN対応の場合は、例えば、有線LANのケーブルを接続するためのコネクタであり、無線LAN対応の場合は、例えばアンテナである。なお、ネットワーク接続部1408が、有線LANおよび無線LANの両者に対応していても良い。USB通信部1410は、各種周辺装置とUSB接続部1411を介して接続され、各種通信を行う。   The display unit 1405 includes, for example, an LCD, and displays various types of information. The operation unit 1406 includes a keyboard and a mouse for the user to perform various input operations, and can receive instructions and operations from the user. The network communication unit 1407 is connected to a network such as the Internet via the network connection unit 1408, and performs various types of communication. The network connection unit 1408 corresponds to a network medium such as a wired LAN or a wireless LAN. In the case of a wired LAN, for example, a connector for connecting a cable of a wired LAN. It is. Note that the network connection unit 1408 may support both a wired LAN and a wireless LAN. The USB communication unit 1410 is connected to various peripheral devices via a USB connection unit 1411 and performs various communication.

図14の各ブロックは、バス1409を介して相互に接続される。また、本実施形態における音声端末管理サーバ106(若しくは、音声端末連携サーバ102、登録音声付HTML生成サーバ115)の動作は、例えば、CPU1401が処理に必要なプログラムをディスク装置1402からメモリ1404にロードして実行することで実現される。また、図13の音声認識・音声出力部1309の音声認識機能が、図14の構成に含まれていても良い。その場合は、図14の構成を含む装置は、例えば、音声端末106から送信される音声信号を音声認識して、所定のワードを認識して抽出することができる。本実施形態では、音声端末管理サーバ103、音声端末連携サーバ102、登録音声付HTML生成サーバ115を別々のサーバ(情報処理装置)として説明するが、それぞれのサーバ機能が一体化されたサーバとして構成されても良い。   Each block in FIG. 14 is mutually connected via a bus 1409. In the operation of the voice terminal management server 106 (or the voice terminal cooperation server 102 and the registered voice-attached HTML generation server 115) in the present embodiment, for example, the CPU 1401 loads a program required for processing from the disk device 1402 to the memory 1404. And execute it. Further, the voice recognition function of the voice recognition / voice output unit 1309 of FIG. 13 may be included in the configuration of FIG. In that case, the device including the configuration in FIG. 14 can recognize, for example, a speech signal transmitted from the speech terminal 106 and recognize and extract a predetermined word. In the present embodiment, the voice terminal management server 103, the voice terminal cooperation server 102, and the registered voice-attached HTML generation server 115 will be described as separate servers (information processing devices). However, each server function is configured as an integrated server. May be.

印刷装置管理サーバ101の場合、ディスク装置1402に印刷装置管理DB107およびワンタイムトークンDB108が構築されている。また、音声端末管理サーバ103のディスク装置1402にはサーバ管理DB110が構築され、音声端末連携サーバ102のディスク装置1402には連携管理DB109が構築されている。   In the case of the printing device management server 101, the printing device management DB 107 and the one-time token DB 108 are built in the disk device 1402. A server management DB 110 is built in the disk device 1402 of the voice terminal management server 103, and a cooperation management DB 109 is built in the disk device 1402 of the voice terminal cooperation server 102.

図15は、印刷装置104のブロック構成を示す図である。なお、本実施形態では、印刷装置104は、複合機の形態として説明するが、特に複合機でなく、印刷機能を有する装置であれば他の形態の装置が用いられても良い。例えば、画像処理装置、複写機、ファクシミリ、単機能の印刷装置等が用いられても良い。印刷装置104において、印刷機能はプリンタ部1501で実現され、スキャナ機能はスキャナ部1502で実現され、ストレージ機能はメモリカード装着部1503及びメモリカード1504で実現される。上述した各部は、バス1514で相互に接続される。   FIG. 15 is a diagram illustrating a block configuration of the printing apparatus 104. In the present embodiment, the printing apparatus 104 is described as a multifunction peripheral. However, other than the multifunction peripheral, any other apparatus having a printing function may be used. For example, an image processing device, a copying machine, a facsimile, a single-function printing device, or the like may be used. In the printing apparatus 104, the printing function is realized by the printer unit 1501, the scanner function is realized by the scanner unit 1502, and the storage function is realized by the memory card mounting unit 1503 and the memory card 1504. The components described above are interconnected by a bus 1514.

プリンタ部1501は、外部から受信した画像データやメモリカード1504に記憶されている画像データなどを、インクジェット記録方式や電子写真方式などの記録方式によって印刷用紙等の記録媒体に記録する。また、プリンタ部1501は、消耗部材に関する情報、例えば、インク残量を含むインク情報や積載用紙の枚数等の用紙情報を管理している。   The printer unit 1501 records image data received from the outside, image data stored in the memory card 1504, and the like on a recording medium such as printing paper by a recording method such as an inkjet recording method or an electrophotographic method. The printer unit 1501 manages information on consumable members, for example, ink information including the remaining amount of ink and sheet information such as the number of stacked sheets.

スキャナ部1502は、原稿台(不図示)にセットされた原稿を光学的に読み取って電子データに変換し、更に指定されたファイル形式に変換した画像データを、ネットワーク経由で外部装置に送信、或いはHDD1516等の記憶領域に格納する。コピーサービスでは、スキャナ部1502が原稿台に置かれた原稿をスキャナ部1502で読み取って生成した画像データをプリンタ部1501へ転送し、プリンタ部1501が印刷用紙等の記録媒体にその画像データに基づいて印刷を行うことで実現される。   The scanner unit 1502 optically reads a document set on a document table (not shown), converts the document into electronic data, and transmits image data converted into a specified file format to an external device via a network, or It is stored in a storage area such as the HDD 1516. In the copy service, the scanner unit 1502 reads an original placed on a platen and transfers the image data generated by the scanner unit 1502 to the printer unit 1501, and the printer unit 1501 stores the image data in a recording medium such as printing paper based on the image data. It is realized by performing printing.

メモリカード装着部1503に装着されたメモリカード1504には、各種ファイルデータが記憶される。このファイルデータは、ネットワークを介して外部装置から読み出されて編集される場合もある。また、外部装置からメモリカード1504にファイルデータが格納される場合もある。   Various file data are stored in the memory card 1504 mounted on the memory card mounting unit 1503. This file data may be read from an external device via a network and edited. In some cases, file data is stored in the memory card 1504 from an external device.

更に、印刷装置104は、CPU1505、プログラムメモリ1506、ワークメモリ1507、表示部1508、操作部1509、ネットワーク通信部1510、ネットワーク接続部1511、フラッシュメモリ1512を有する。CPU1505は、印刷装置104内の各部を統括的に制御するための中央演算装置である。プログラムメモリ1506は、ROMなどで構成され、各種のプログラムコードや、外部のサーバと通信するためなどのアプリケーション1515が記憶されている。また、アプリケーション1515は、プリンタ部1501にアクセスしてインクや用紙などの消耗品情報を取得することも可能である。ワークメモリ1507は、RAMなどで構成され、各サービス実行時に画像データなどを一時格納したり、バッファリングしたりする。表示部1508は、例えばLCDで構成され、ユーザインタフェース画面等、各種の情報を表示する。また、操作部1509は、キーボードやマウス、スイッチ等を含み、ユーザからの指示や操作を受付可能である。ネットワーク通信部1510は、ネットワーク接続部1511を介して印刷装置104をネットワークに接続して各種通信を行う。   Further, the printing apparatus 104 includes a CPU 1505, a program memory 1506, a work memory 1507, a display unit 1508, an operation unit 1509, a network communication unit 1510, a network connection unit 1511, and a flash memory 1512. The CPU 1505 is a central processing unit for totally controlling each unit in the printing apparatus 104. The program memory 1506 is constituted by a ROM or the like, and stores various program codes and an application 1515 for communicating with an external server. The application 1515 can also access the printer unit 1501 to acquire information about consumables such as ink and paper. The work memory 1507 includes a RAM or the like, and temporarily stores and buffers image data and the like when each service is executed. The display unit 1508 includes, for example, an LCD, and displays various information such as a user interface screen. The operation unit 1509 includes a keyboard, a mouse, a switch, and the like, and can receive instructions and operations from a user. The network communication unit 1510 connects the printing apparatus 104 to a network via the network connection unit 1511 and performs various types of communication.

ネットワーク通信部1510が有線LAN対応の場合のネットワーク接続部1511は有線LANのケーブルを接続するためのコネクタであり、ネットワーク通信部1510が無線LAN対応の場合のネットワーク接続部1511はアンテナとなる。なお、ネットワーク接続部1511が、有線LANおよび無線LANの両者に対応していても良い。本実施形態では、ネットワーク通信部1510、ネットワーク接続部1511は、無線LANに対応しており、IEEE802.11規格シリーズに準拠した無線LANの無線通信方式に従ってアクセスポイントと接続することができる。なお、ネットワーク接続部1511は、一時的に自身がアクセスポイント(ネットワークを構築する親局)として動作することも可能である。つまりネットワーク接続部1511がアクセスポイントに対応する機能を備えてもよい。また、印刷装置104は、音声端末106と同様に近距離無線通信部(不図示)を備えていてもよい。   When the network communication unit 1510 is compatible with a wired LAN, the network connection unit 1511 is a connector for connecting a wired LAN cable. When the network communication unit 1510 is compatible with a wireless LAN, the network connection unit 1511 is an antenna. Note that the network connection unit 1511 may support both a wired LAN and a wireless LAN. In the present embodiment, the network communication unit 1510 and the network connection unit 1511 are compatible with a wireless LAN, and can connect to an access point according to a wireless communication method of a wireless LAN conforming to the IEEE 802.11 standard series. Note that the network connection unit 1511 itself can temporarily operate as an access point (master station that constructs a network). That is, the network connection unit 1511 may have a function corresponding to the access point. Further, the printing device 104 may include a short-range wireless communication unit (not shown), like the audio terminal 106.

フラッシュメモリ1512は、ネットワーク通信部1510が受信した画像データなどを格納するための不揮発性のメモリである。そして、上述した各部は、バス1513で相互に接続される。また、バス1514とバス1513との間でデータ変換を行うブロックがあっても良い。本実施形態における印刷装置104の動作は、例えば、CPU1505が処理に必要なプログラムをプログラムメモリ1506からワークメモリ1507に読み出して実行することで実現される。   The flash memory 1512 is a non-volatile memory for storing image data and the like received by the network communication unit 1510. The components described above are interconnected by a bus 1513. Further, there may be a block for performing data conversion between the bus 1514 and the bus 1513. The operation of the printing apparatus 104 according to the present embodiment is realized, for example, by the CPU 1505 reading a program necessary for processing from the program memory 1506 to the work memory 1507 and executing the program.

図16は、携帯端末105のハードウェア構成図の概略を示すブロック図である。携帯端末105は、一例として、撮像部1601、入力インタフェース1610、CPU1620、ROM1630、表示部1640、RAM1650、外部記憶装置1660、通信部1670、近距離無線通信部1680、音声出力部1690を有する。なお、これらのブロックは、例えば内部バスを用いて相互に接続される。   FIG. 16 is a block diagram schematically illustrating a hardware configuration diagram of the portable terminal 105. The mobile terminal 105 includes, for example, an imaging unit 1601, an input interface 1610, a CPU 1620, a ROM 1630, a display unit 1640, a RAM 1650, an external storage device 1660, a communication unit 1670, a short-range wireless communication unit 1680, and an audio output unit 1690. These blocks are connected to each other using, for example, an internal bus.

CPU1620は、システム制御部であり、装置の全体を制御する。RAM1650は、例えばRAM1305と同様に、バックアップ電源を必要とするDRAM(Dynamic RAM)等で構成される。RAM1650は、CPU1620の主メモリとワークメモリとしても用いられる。ROM1630は、CPU1620が実行する制御プログラムやデータテーブル、OSプログラム等の固定データを格納する。なお、本実施形態では、携帯端末105は、音声端末106用のアプリケーションプログラム(以下、音声制御アプリケーション)をインストールして、ROM1630に格納しているものとする。   The CPU 1620 is a system control unit and controls the entire device. The RAM 1650 includes, for example, a DRAM (Dynamic RAM) requiring a backup power supply, like the RAM 1305. The RAM 1650 is also used as a main memory and a work memory of the CPU 1620. The ROM 1630 stores fixed data such as a control program executed by the CPU 1620, a data table, and an OS program. In the present embodiment, it is assumed that the portable terminal 105 installs an application program for the audio terminal 106 (hereinafter, an audio control application) and stores the application program in the ROM 1630.

表示部1640は、LED(発光ダイオード)やLCD(液晶ディスプレイ)などから構成され、各種データに基づく画面を表示する。なお、表示部1640は、タッチディスプレイ等で構成されることにより、ユーザから各種入力を受け付ける機能を有していても良い。すなわち、表示部1640は、ユーザからのデータ入力や動作指示を受け付けるためのインタフェースであり、物理的なキーボードやボタン、タッチパネル等で構成される操作パネルであっても良い。通信部1670は、上述の通信部1307と同様の機能を有し、アクセスポイントを介して他の装置と無線接続することができる。近距離無線通信部1680は、近距離無線通信部1308と同じ無線通信方式を用いて、近距離無線通信部1308との間で近距離無線通信を行うことができる装置である。   The display unit 1640 includes an LED (light emitting diode), an LCD (liquid crystal display), and the like, and displays a screen based on various data. Note that the display unit 1640 may have a function of receiving various inputs from a user by being configured with a touch display or the like. That is, display unit 1640 is an interface for receiving data input and operation instructions from the user, and may be an operation panel including a physical keyboard, buttons, touch panel, and the like. The communication unit 1670 has a function similar to that of the above-described communication unit 1307, and can be wirelessly connected to another device via an access point. The short-range wireless communication unit 1680 is a device that can perform short-range wireless communication with the short-range wireless communication unit 1308 using the same wireless communication scheme as the short-range wireless communication unit 1308.

音声出力部1690は、ユーザに対し音声により情報や命令等を伝達可能であり、例えばスピーカである。撮像部1601は、ユーザの撮像指示に応じて撮像する。例えば、撮像部1601はカメラ装置である。撮像部1601で撮影された撮像データは、ROM1630等の記憶領域に格納される。また、携帯端末105は、QRコード読み取りアプリを搭載しており、撮像部1601によりQRコードを撮像することで、QRコードに保存されている情報を読み取る事が可能である。即ち、撮像部1601およびQRコード読み取りアプリにより、QRコード読み取り機能112を構成する。   The audio output unit 1690 can transmit information, commands, and the like to the user by audio, and is, for example, a speaker. The imaging unit 1601 captures an image according to a user's imaging instruction. For example, the imaging unit 1601 is a camera device. Imaging data captured by the imaging unit 1601 is stored in a storage area such as the ROM 1630. In addition, the mobile terminal 105 is equipped with a QR code reading application, and is capable of reading information stored in the QR code by imaging the QR code with the imaging unit 1601. That is, the imaging unit 1601 and the QR code reading application constitute the QR code reading function 112.

図7は、音声端末106が音声で印刷命令を受けた場合に、印刷装置104と連携し印刷を行う場合を例にして示したシーケンス図である。なお、図中の左右方向の矢印は各構成要素間の通信を示し、上下方向の直線は時間の経過を示す。   FIG. 7 is a sequence diagram illustrating a case where the voice terminal 106 performs printing in cooperation with the printing device 104 when receiving a print command by voice. It should be noted that leftward and rightward arrows in the figure indicate communication between components, and vertical lines indicate passage of time.

ユーザが指示コマンド(命令)を発話(701)すると、音声端末106は、その音声を受け、自身の音声端末識別ID114とともに発話内容の情報を音声端末管理サーバ103に送信する(702)。音声端末管理サーバ103は、受信した発話内容の情報から呼び出し名605、および命令部分606を抽出する(703)。音声端末管理サーバ103は、呼び出し名605から連携先の音声端末連携サーバ102を決定し(704)、その音声端末連携サーバ102に音声端末識別ID114と、命令部分606の情報を送信する(705)。音声端末管理サーバ103は、情報を送信する際は、呼び出し名605に対応する音声端末連携サーバ102のURLをサーバ管理DB110から取得する。本実施形態の場合、音声端末管理サーバ103は、呼び出し名「○○社印刷」に対応する音声端末連携サーバ102に対して、音声端末識別ID114及び命令「今日のニュースの印刷をお願い」の情報を送信する。   When the user utters the instruction command (command) (701), the voice terminal 106 receives the voice and transmits the information of the utterance content together with its own voice terminal identification ID 114 to the voice terminal management server 103 (702). The voice terminal management server 103 extracts the call name 605 and the command part 606 from the received utterance content information (703). The voice terminal management server 103 determines the voice terminal cooperation server 102 of the cooperation destination from the call name 605 (704), and transmits the voice terminal identification ID 114 and the information of the command part 606 to the voice terminal cooperation server 102 (705). . When transmitting the information, the voice terminal management server 103 acquires the URL of the voice terminal cooperation server 102 corresponding to the call name 605 from the server management DB 110. In the case of this embodiment, the voice terminal management server 103 sends the voice terminal identification ID 114 and the information of the command “Please print today's news” to the voice terminal cooperation server 102 corresponding to the call name “XX company print”. Send

音声端末連携サーバ102は、音声端末管理サーバ103からの命令を受けて、その命令の内容に応じて、印刷内容を生成する(706)。次に、音声端末連携サーバ102は、音声端末識別ID114に基づいて、印刷を行う印刷装置識別ID111を決定し(707)、印刷装置管理サーバ101に対して、印刷を行わせたい印刷装置識別ID111と印刷内容とを印刷命令として送信する(708)。このとき、音声端末連携サーバ102は、連携管理DB109に登録された情報の中から音声端末管理サーバ103からの命令とともに受信した音声端末識別ID114を検索し、その音声端末識別ID114に対応付けられた印刷装置識別ID111を取得する。   The voice terminal cooperation server 102 receives the command from the voice terminal management server 103, and generates print content according to the content of the command (706). Next, the voice terminal cooperation server 102 determines the printing device identification ID 111 to perform printing based on the voice terminal identification ID 114 (707), and instructs the printing device management server 101 to perform printing. Is transmitted as a print command (708). At this time, the voice terminal cooperation server 102 searches the information registered in the cooperation management DB 109 for the voice terminal identification ID 114 received together with the instruction from the voice terminal management server 103, and associates the voice terminal identification ID 114 with the voice terminal identification ID 114. The printing device identification ID 111 is obtained.

その後、音声端末連携サーバ102は、音声端末管理サーバ103に対して、ユーザに対する返信用の音声内容の情報と、返信先の音声端末識別ID114とを返信する(709)。音声端末管理サーバ103は、返信用の音声内容の情報と音声端末識別ID114とを受信すると、音声端末識別ID114で指定された音声端末106に返信用音声内容の情報を送信し(710)、音声端末106は、その返信用音声内容の情報に基づいて音声出力する(711)。   After that, the voice terminal cooperation server 102 returns to the voice terminal management server 103 the voice content information for reply to the user and the voice terminal identification ID 114 of the reply destination (709). Upon receiving the reply voice content information and the voice terminal identification ID 114, the voice terminal management server 103 transmits the reply voice content information to the voice terminal 106 specified by the voice terminal identification ID 114 (710), and The terminal 106 outputs voice based on the information of the voice content for reply (711).

また、印刷装置管理サーバ101は、音声端末連携サーバ102から受け取った印刷命令に基づいて、印刷装置識別ID111から、対象の印刷装置104のIPアドレスを特定する。その後、印刷装置管理サーバ101は、IPアドレスが特定された印刷装置104に対して印刷内容を印刷するように命令する(712)。このとき、印刷装置管理サーバ101は、印刷装置管理DB107に登録された情報から印刷装置識別ID111に対応するIPアドレスを特定する。印刷装置104は、印刷装置管理サーバ101から受け取った命令に従って、印刷を行う(713)。   Further, the printing device management server 101 specifies the IP address of the target printing device 104 from the printing device identification ID 111 based on the print command received from the voice terminal cooperation server 102. Thereafter, the printing device management server 101 instructs the printing device 104 whose IP address is specified to print the print contents (712). At this time, the printing device management server 101 specifies an IP address corresponding to the printing device identification ID 111 from information registered in the printing device management DB 107. The printing device 104 performs printing according to the command received from the printing device management server 101 (713).

上述のように音声端末106を用いて印刷装置104を操作するためには、予め印刷装置104を音声端末106に紐づけて登録しておく必要がある。登録方法としては、携帯端末を介して印刷装置のワンタイムトークンを音声端末106に送信して登録を行う方法や、ユーザが声で音声端末に対して印刷装置104のワンタイムトークンを伝えて登録を行う方法が考えられる。しかし、本実施形態では、QRコード等の二次元コードを使用して音声端末106を印刷装置104に紐づけて登録する。以下、その処理について詳細に説明する。   In order to operate the printing device 104 using the audio terminal 106 as described above, it is necessary to associate the printing device 104 with the audio terminal 106 and register it in advance. As a registration method, a method of transmitting the one-time token of the printing apparatus to the voice terminal 106 via the mobile terminal to perform registration, or a method in which the user transmits the one-time token of the printing apparatus 104 to the voice terminal by voice and performs registration. There is a way to do this. However, in the present embodiment, the audio terminal 106 is registered in association with the printing device 104 using a two-dimensional code such as a QR code. Hereinafter, the processing will be described in detail.

図8は、第一実施形態における印刷装置104の外観図である。印刷装置104は、操作を行うためのパネル801(表示部1508に対応)を備えており、装置情報や設定画面、ジョブ情報等、各種のユーザインタフェース画面を表示する。パネル801には、後述する音声端末106への登録を開始するためのボタン802が存在し、ボタン802を押すと、排出口803から音声端末登録用のQRコードが印刷される。ボタン802は、例えば、印刷装置104のメイン画面から遷移して表示される音声制御機能の設定画面上で表示される登録開始ボタンである。   FIG. 8 is an external view of the printing apparatus 104 according to the first embodiment. The printing apparatus 104 includes a panel 801 (corresponding to the display unit 1508) for performing operations, and displays various user interface screens such as apparatus information, a setting screen, and job information. The panel 801 has a button 802 for starting registration with the voice terminal 106 described later. When the button 802 is pressed, a QR code for voice terminal registration is printed from the outlet 803. The button 802 is, for example, a registration start button displayed on the setting screen of the voice control function displayed by transiting from the main screen of the printing apparatus 104.

図9は、第一実施形態における、印刷装置104によりQRコードが印刷されてから、印刷装置104が音声端末106に紐づけて登録されるまでを説明するための図である。シート900は、印刷装置104のボタン802が押下された際に印刷される用紙を示し、QRコード901と、説明文とが印刷されている。QRコード901には、URL情報902が保存されており、引数としてワンタイムトークンが付加されている。携帯端末105は、QRコード読み取りアプリを搭載しており、撮像部1601によりQRコードを撮像することで、QRコードに保存されている情報を読み取る事が可能である。   FIG. 9 is a diagram for explaining from the printing of the QR code by the printing device 104 to the registration of the printing device 104 in association with the voice terminal 106 in the first embodiment. A sheet 900 indicates a sheet to be printed when the button 802 of the printing apparatus 104 is pressed, and has a QR code 901 and a description printed thereon. URL information 902 is stored in the QR code 901, and a one-time token is added as an argument. The mobile terminal 105 is equipped with a QR code reading application, and is capable of reading information stored in the QR code by imaging the QR code with the imaging unit 1601.

画面903は、QRコードを読み取った後の携帯端末105の表示部1640に表示される画面であり、Webブラウザが起動され、登録音声付Webページが表示されている。音声904は、登録音声付Webページが表示されている状態で音声出力部1690で再生される音声である。携帯端末105は音声出力可能なスピーカを有しており、音声端末106は、音声904を受けてサーバ通信を行い、登録が完了すると、返信905を音声出力し、ユーザに登録が完了した事を通知する。   A screen 903 is a screen displayed on the display unit 1640 of the mobile terminal 105 after reading the QR code, in which a Web browser is activated and a Web page with registered voice is displayed. The sound 904 is sound reproduced by the sound output unit 1690 in a state where the Web page with the registered sound is displayed. The mobile terminal 105 has a speaker capable of outputting voice. The voice terminal 106 receives the voice 904 and performs server communication. When the registration is completed, a voice Reply 905 is output, and the user is notified that the registration is completed. Notice.

図10は、第一実施形態における、印刷装置104の登録の手順を示すシーケンス図である。なお、図7と同様に図中の左右方向の矢印は各構成要素間の通信を示し、上下方向の直線は時間の経過を示す。   FIG. 10 is a sequence diagram illustrating a registration procedure of the printing apparatus 104 according to the first embodiment. Note that, similarly to FIG. 7, arrows in the left and right directions in the figure indicate communication between the components, and straight lines in the up and down directions indicate the passage of time.

ユーザが印刷装置104の音声端末106への登録開始ボタン802を押すと、印刷装置104は、印刷装置管理サーバ101へ、自身の印刷装置識別ID111と登録開始依頼を送信する(1001)。   When the user presses a registration start button 802 of the printing device 104 to the voice terminal 106, the printing device 104 transmits its own printing device identification ID 111 and a registration start request to the printing device management server 101 (1001).

印刷装置管理サーバ101は、印刷装置104からの依頼(登録指示)を受信すると、了解した旨を返信し(1002)、ワンタイムトークンを発番し、受信した印刷装置識別ID111と対応付けてワンタイムトークンDB108へ保存する(1003)。さらに、印刷装置管理サーバ101は、印刷装置104に対してこれらの情報についての出力制御を行う。本実施形態の場合、印刷装置管理サーバ101は、ワンタイムトークン付URLをQRコードとして埋め込んだ画像データを生成し(1004)、印刷装置104に対して、その画像の印刷命令を出力する(1005)。印刷命令を受信した印刷装置104は、その画像データに基づいて印刷物を出力する(1006)。ユーザが印刷物に記載された指示に従い、携帯端末105の撮像部1601で印刷物上のQRコードを読み取ると(1007)、携帯端末105は、QRコード内のURLを取得し、そのURLへアクセスする(1008)。本実施形態では、携帯端末105は、登録音声付HTML生成サーバ115にアクセスする。   Upon receiving the request (registration instruction) from the printing apparatus 104, the printing apparatus management server 101 returns a notice to the effect (1002), issues a one-time token, associates the one-time token with the received printing apparatus identification ID 111, and returns the one-time token. It is stored in the time token DB 108 (1003). Further, the printing apparatus management server 101 controls output of the information to the printing apparatus 104. In the case of the present embodiment, the printing apparatus management server 101 generates image data in which a URL with a one-time token is embedded as a QR code (1004), and outputs a print command of the image to the printing apparatus 104 (1005). ). The printing device 104 that has received the print command outputs a printed matter based on the image data (1006). When the user reads the QR code on the printed material with the imaging unit 1601 of the mobile terminal 105 according to the instruction described in the printed material (1007), the mobile terminal 105 acquires the URL in the QR code and accesses the URL ( 1008). In the present embodiment, the portable terminal 105 accesses the HTML generation server with registration voice 115.

QRコードに埋め込まれたURLが示す登録音声付HTML生成サーバ115は、アクセスされたURLに付属されたワンタイムトークンに基づいて、登録用音声データの生成を行う(1009)。さらに、登録音声付HTML生成サーバ115は、生成されたその登録用音声データを再生するためのHTMLを携帯端末105に返却する(1010)。携帯端末105は、内蔵されたWebブラウザにて、その返却されたHTMLに基づいてWebページ904を表示すると、HTMLに埋め込まれた音声が再生される(1011)。ここで、再生される音声は、図9の音声904である。   The registered voice-added HTML generation server 115 indicated by the URL embedded in the QR code generates registration voice data based on the one-time token attached to the accessed URL (1009). Further, the HTML server with registration voice generation server 115 returns the generated HTML for reproducing the registration voice data to the portable terminal 105 (1010). When the mobile terminal 105 displays the Web page 904 based on the returned HTML by the built-in Web browser, the sound embedded in the HTML is reproduced (1011). Here, the reproduced sound is the sound 904 in FIG.

音声端末106は、その音声904をキャッチし(1012)、音声端末管理サーバ103へ、自身の音声端末識別ID114とともにその音声情報を送信する(1013)。音声端末管理サーバ103は、音声情報から命令部分を抽出して(1014)登録用命令であることを認識すると、音声端末連携サーバ102へ、音声端末識別ID114とともに登録用命令の情報を送信する(1015)。   The voice terminal 106 catches the voice 904 (1012), and transmits the voice information to the voice terminal management server 103 together with its own voice terminal identification ID 114 (1013). When the voice terminal management server 103 extracts the command portion from the voice information (1014) and recognizes that the command is a registration command, the voice terminal management server 103 transmits the registration command information together with the voice terminal identification ID 114 to the voice terminal cooperation server 102 ( 1015).

音声端末連携サーバ102は、登録用命令の中からワンタイムトークンを取りだして、そのワンタイムトークンの確認処理を印刷装置管理サーバ101に対して依頼する(1016)。   The voice terminal cooperation server 102 extracts the one-time token from the registration command, and requests the printing device management server 101 to perform processing for confirming the one-time token (1016).

印刷装置管理サーバ101は、図5のDBを参照し、ワンタイムトークンが存在して有効なものであると判定した場合、対象のワンタイムトークンに対応付けられた印刷装置識別ID111を音声端末連携サーバ102へ返却する(1017)。音声端末連携サーバ102は、返却された印刷装置識別ID111と音声端末識別ID114とを対応付けて連携管理DB109に保存し(1018)、音声端末管理サーバ103に対して登録が完了した事を示すユーザへの返信用音声情報及び音声端末識別ID114を返信する(1019)。音声端末管理サーバ103は、返信用音声情報及び音声端末識別ID114を受信すると、対応する音声端末識別ID114を有する音声端末106へ返信用音声情報を送信し(1020)、返信用音声情報を受信した音声端末106は、返信用音声を音声出力する(1021)。ここで、音声出力される内容が図9の返信905である。   When the printing device management server 101 determines that the one-time token exists and is valid with reference to the DB of FIG. 5, the printing device identification ID 111 associated with the target one-time token is linked to the voice terminal. It is returned to the server 102 (1017). The voice terminal cooperation server 102 associates the returned printing device identification ID 111 with the voice terminal identification ID 114 and stores them in the cooperation management DB 109 (1018), and the user indicating that registration to the voice terminal management server 103 is completed. The voice information for reply and the voice terminal identification ID 114 are returned (1019). Upon receiving the reply voice information and the voice terminal identification ID 114, the voice terminal management server 103 transmits the reply voice information to the voice terminal 106 having the corresponding voice terminal identification ID 114 (1020), and receives the reply voice information. The voice terminal 106 outputs the voice for reply as voice (1021). Here, the content output as voice is the reply 905 in FIG.

図17は、印刷装置104を音声端末106に紐づけて登録するときの印刷装置管理サーバ101の処理を示すフローチャートである。本フローチャートは、ユーザが印刷装置104の音声端末106への登録を開始するためのボタン802を押下し、印刷装置管理サーバ101が印刷装置104から登録依頼及び印刷装置識別IDを受信することにより開始する。   FIG. 17 is a flowchart illustrating a process of the printing device management server 101 when the printing device 104 is registered in association with the audio terminal 106. This flowchart starts when the user presses a button 802 for starting registration of the printing apparatus 104 with the voice terminal 106, and the printing apparatus management server 101 receives a registration request and the printing apparatus identification ID from the printing apparatus 104. I do.

S1701において、CPU1401は、印刷装置104から、登録依頼及び印刷装置管理IDを受信する(図10の1001)。そして、S1702において、CPU1401は、印刷装置104に対して、依頼を了解した旨を通知する(図10の1002)。   In step S1701, the CPU 1401 receives a registration request and a printing device management ID from the printing device 104 (1001 in FIG. 10). In step S1702, the CPU 1401 notifies the printing device 104 that the request has been accepted (1002 in FIG. 10).

S1703において、CPU1401は、ワンタイムトークンを発番し、S1704において、印刷装置104から受信した印刷装置識別ID111と対応付けてワンタイムトークンDB108へ保存する(図10の1003)。   In S1703, the CPU 1401 issues a one-time token, and in S1704, stores the one-time token in the one-time token DB 108 in association with the printing device identification ID 111 received from the printing device 104 (1003 in FIG. 10).

S1705において、CPU1401は、ワンタイムトークン付URLをQRコードとして埋め込んだ画像を生成し(図10の1004)、S1706において、印刷装置104に対して、生成した画像の印刷命令を送信する(図10の1005)。   In S1705, the CPU 1401 generates an image in which the URL with the one-time token is embedded as a QR code (1004 in FIG. 10), and in S1706, transmits a print command of the generated image to the printing apparatus 104 (FIG. 10). 1005).

S1707において、CPU1401は、音声端末連携サーバ102からワンタイムトークン確認処理を受信すると、送信されてきたワンタイムトークンが有効であるか否かを判定する(図10の1016)。ワンタイムトークンが有効であると判定した場合、S1708に進み、CPU1401は、音声端末連携サーバ102に対して印刷装置104の印刷装置識別ID111を送信し(図10の1017)、図17の処理を終了する。一方、ワンタイムトークンが有効でないと判定した場合、S1709に進み、ワンタイムトークンが有効でない旨のエラーメッセージを音声端末連携サーバ102に送信し、図17の処理を終了する。音声端末連携サーバ102は、エラーメッセージを受信すると、音声端末管理サーバ103に対して、エラーメッセージの音声情報と音声端末識別ID114を送信する。そして、音声端末管理サーバ103は、エラーメッセージの音声情報を音声端末106に送信する。その結果、音声端末106から、例えば、「音声端末と印刷装置の登録に失敗しました。再度、やり直してください」等のエラーメッセージが音声出力される。   In step S1707, upon receiving the one-time token confirmation process from the voice terminal cooperation server 102, the CPU 1401 determines whether or not the transmitted one-time token is valid (1016 in FIG. 10). If it is determined that the one-time token is valid, the process advances to step S1708, and the CPU 1401 transmits the printing device identification ID 111 of the printing device 104 to the voice terminal cooperation server 102 (1017 in FIG. 10), and executes the process in FIG. finish. On the other hand, if it is determined that the one-time token is not valid, the process advances to step S1709 to transmit an error message indicating that the one-time token is not valid to the voice terminal cooperation server 102, and the processing in FIG. 17 ends. Upon receiving the error message, the voice terminal cooperation server 102 transmits the voice information of the error message and the voice terminal identification ID 114 to the voice terminal management server 103. Then, the voice terminal management server 103 transmits the voice information of the error message to the voice terminal 106. As a result, for example, an error message such as “Registration of voice terminal and printing device failed. Please try again” is output from voice terminal 106 by voice.

以上により、ユーザは印刷装置104の登録開始ボタン802を押下、および携帯端末10にてQRコードを読みこむという簡単な操作のみで印刷装置104の登録を行うことができる。従って、本来であれば煩雑な、音声端末106への印刷装置104の登録用の会話等を自分で行う事無く、印刷装置104の登録を簡便に行う事ができる。   As described above, the user can register the printing device 104 only by pressing the registration start button 802 of the printing device 104 and reading the QR code with the portable terminal 10. Therefore, the registration of the printing device 104 can be easily performed without having to perform a conversation for registration of the printing device 104 with the audio terminal 106, which would otherwise be complicated.

なお、本実施形態の場合、印刷装置管理サーバ101は、ワンタイムトークン付きURLをQRコードとして埋め込んだ画像を生成している。しかしながら、例えば、携帯端末105に音声出力させたい内容の音声データやテキストデータ等を電子透かしデータとして埋め込んだ画像を生成してもよい。この場合、携帯端末105は、印刷装置104が印刷した画像を読み取って自ら音声データを生成し、その生成した音声データを再生したり、読み取ったテキストデータを読み上げたりしてもよい。このような構成により、携帯端末105が登録音声付HTML生成サーバ115にアクセスすることなく、印刷装置104の登録を行うことができる。また、印刷装置管理サーバ101は、例えば、携帯端末105に音声出力させたい内容の文字が印刷された画像を生成してもよい。この場合、携帯端末105は、印刷装置104が印刷した画像の文字を光学文字認識(OCR)処理により読み取り、その内容を読み上げてもよい。このような構成でも、携帯端末105が登録音声付HTML生成サーバ115にアクセスすることなく、印刷装置104の登録を行うことができる。   In the case of the present embodiment, the printing apparatus management server 101 generates an image in which a URL with a one-time token is embedded as a QR code. However, for example, an image may be generated in which audio data or text data of the content that the portable terminal 105 wants to output as audio is embedded as digital watermark data. In this case, the mobile terminal 105 may read the image printed by the printing device 104 to generate audio data by itself, reproduce the generated audio data, or read out the read text data. With such a configuration, the printing device 104 can be registered without the portable terminal 105 accessing the HTML generation server with registration voice 115. Further, the printing apparatus management server 101 may generate, for example, an image in which characters having contents to be output to the portable terminal 105 by voice are printed. In this case, the mobile terminal 105 may read the characters of the image printed by the printing device 104 by an optical character recognition (OCR) process, and may read out the contents. Even with such a configuration, the printing device 104 can be registered without the portable terminal 105 accessing the HTML generation server with registration voice 115.

また、例えば、印刷装置104は、スピーカを内蔵してもよい。そして、音声端末106が印刷装置104の近傍にあるのであれば、印刷装置管理サーバ101は、印刷装置104に対して画像の印刷命令1011ではなく、ワンタイムトークン等を含む発話内容自体を送信するようにしてもよい。このような構成により、携帯端末105を使用することなく印刷装置104の登録を簡易に行うことができる。   Further, for example, the printing device 104 may include a speaker. If the voice terminal 106 is located near the printing device 104, the printing device management server 101 transmits the utterance content itself including the one-time token or the like to the printing device 104 instead of the image print command 1011. You may do so. With such a configuration, the registration of the printing device 104 can be easily performed without using the portable terminal 105.

[第二実施形態]
図11は、第二実施形態における、印刷装置104が音声端末106に紐づけて登録されるまでの概略図を示している。第一実施形態では、印刷装置管理サーバ101は、ワンタイムトークンや印刷装置識別ID111等の情報を印刷装置104に対して印刷出力しているが、第二実施形態では表示出力する。第二実施形態では、音声端末106への登録用のQRコードが印刷装置104の液晶パネルに表示され、ユーザが携帯端末105でそのQRコードを読み取ることにより印刷装置104が音声端末106に登録される。また、第二実施形態は、ユーザが所有する音声端末106が複数ある点、音声端末106の言語設定に基づいて登録がなされる点において第一実施形態と異なる。
[Second embodiment]
FIG. 11 is a schematic diagram showing a process until the printing device 104 is registered in association with the voice terminal 106 in the second embodiment. In the first embodiment, the printing device management server 101 prints out information such as the one-time token and the printing device identification ID 111 to the printing device 104, but in the second embodiment, displays and outputs the information. In the second embodiment, a QR code for registration with the audio terminal 106 is displayed on the liquid crystal panel of the printing device 104, and the printing device 104 is registered with the audio terminal 106 by reading the QR code with the mobile terminal 105. You. The second embodiment differs from the first embodiment in that the user has a plurality of voice terminals 106 and that registration is performed based on the language setting of the voice terminals 106.

フロー1100は、印刷装置104に搭載された液晶パネル1101(表示部1508)上に表示されるGUIの遷移を示している。ボタン1102は、液晶パネル1101に表示された音声端末106への登録作業開始ボタンであり、ユーザがタッチする事で、次の画面1120に遷移する。   A flow 1100 shows transition of a GUI displayed on the liquid crystal panel 1101 (display unit 1508) mounted on the printing apparatus 104. A button 1102 is a button for starting a registration operation for the audio terminal 106 displayed on the liquid crystal panel 1101, and when the user touches the button, the screen transits to the next screen 1120.

画面1120には、登録の対象となる音声端末106を選ぶコンボボックス1103が表示される。ユーザは選択可能な音声端末106の中から登録を行う音声端末106(図11では音声端末1113)を選ぶことが可能であり、ユーザが選択を行うと次の画面1121へ遷移する。画面1121には、音声端末106の言語設定を選ぶコンボボックス1104が表示され、ユーザが言語を選ぶと次の画面1122へ遷移する。   The screen 1120 displays a combo box 1103 for selecting the audio terminal 106 to be registered. The user can select the audio terminal 106 (the audio terminal 1113 in FIG. 11) to be registered from the selectable audio terminals 106. When the user makes a selection, the screen transitions to the next screen 1121. A screen 1121 displays a combo box 1104 for selecting a language setting of the audio terminal 106. When the user selects a language, the screen transitions to the next screen 1122.

画面1122では、QRコード1105を表示する。QRコード1105に埋め込まれたデータを図示したのが埋め込みデータ1106であり、ユーザが選択した情報や、ワンタイムトークンが埋め込みデータとして埋め込まれている。   On a screen 1122, a QR code 1105 is displayed. The data embedded in the QR code 1105 is shown as embedded data 1106, in which information selected by the user and a one-time token are embedded as embedded data.

携帯端末105は、撮像部1601によって画面1122に表示されたQRコード1122を読み取る事が可能である。また、携帯端末105は、撮像部1601によって読み取ったQRコードに埋め込まれたデータに基づいて印刷装置104を登録するためのプリンタ登録用アプリを実装している。プリンタ登録用アプリは、携帯端末105が読み取ったQRコードの中からデータを取り出し、その情報に従い、音声1111を音声出力する。音声1111には、音声端末1113に対応する呼び出し名、及び、印刷装置104の登録命令が含まれている。   The mobile terminal 105 can read the QR code 1122 displayed on the screen 1122 by the imaging unit 1601. In addition, the portable terminal 105 has a printer registration application for registering the printing apparatus 104 based on the data embedded in the QR code read by the imaging unit 1601. The printer registration application extracts data from the QR code read by the mobile terminal 105, and outputs audio 1111 according to the information. The voice 1111 includes a call name corresponding to the voice terminal 1113 and a registration command of the printing device 104.

音声端末1113は、ユーザが複数所持する音声端末1112、1113のうちの1つであるが、音声1111が、自分に対する呼びかけである事を理解し、登録作業を行う。登録が完了すると、返信1114を音声出力し、ユーザに登録が完了した事を通知する。ここで、音声端末1113は、音声1111が自分に対する呼びかけであることを、音声1111の呼び出し名が音声端末1113に対応するものであることで理解する。一方、音声端末1112は、ユーザが複数所持する音声端末1112、1113のうちの1つであるが、音声1111が自分に対する呼びかけで無い事を理解し、反応しない。   The voice terminal 1113 is one of a plurality of voice terminals 1112 and 1113 owned by the user. The voice terminal 1113 understands that the voice 1111 is a call to the user, and performs a registration operation. When the registration is completed, a reply 1114 is output by voice to notify the user that the registration is completed. Here, the voice terminal 1113 understands that the voice 1111 is a call to itself, based on the fact that the call name of the voice 1111 corresponds to the voice terminal 1113. On the other hand, the audio terminal 1112 is one of the audio terminals 1112 and 1113 owned by the user, but understands that the audio 1111 is not a call to the user and does not respond.

図12は、第二実施形態における、印刷装置104の登録処理を示すシーケンス図である。なお、図7および図10と同様に図中の左右方向の矢印は各構成要素間のやり取りを示し、上下方向の直線は時間の経過を示す。   FIG. 12 is a sequence diagram illustrating a registration process of the printing apparatus 104 according to the second embodiment. As in FIGS. 7 and 10, arrows in the left and right directions in the drawings indicate exchanges between the components, and straight lines in the up and down directions indicate the passage of time.

ユーザが印刷装置104の音声端末106への登録開始ボタン802を押すと、印刷装置104は、印刷装置管理サーバ101へ自身の印刷装置識別ID111と登録開始依頼を送信する(1201)。   When the user presses the registration start button 802 of the printing device 104 to the audio terminal 106, the printing device 104 transmits its own printing device identification ID 111 and a registration start request to the printing device management server 101 (1201).

印刷装置管理サーバ101は、印刷装置104へ対象音声端末選択画面を返却する(1202)。印刷装置104は、印刷装置管理サーバ101から受け取った対象音声端末選択画面を液晶パネル1508に表示し、ユーザにより登録を行う音声端末106が選択されると、対象音声端末の選択結果を印刷装置管理サーバ101へ返却する(1203)。次に、印刷装置管理サーバ101は、印刷装置104へ言語選択画面を返却する(1204)。印刷装置104は、印刷装置管理サーバ101から受け取った言語選択画面を液晶パネル1508に表示し、ユーザにより言語が選択されると、選択言語を印刷装置管理サーバ101へ返却する(1205)。   The printing device management server 101 returns the target voice terminal selection screen to the printing device 104 (1202). The printing device 104 displays the target voice terminal selection screen received from the printing device management server 101 on the liquid crystal panel 1508, and when the voice terminal 106 to be registered is selected by the user, the selection result of the target voice terminal is displayed in the printing device management. It is returned to the server 101 (1203). Next, the printing device management server 101 returns a language selection screen to the printing device 104 (1204). The printing device 104 displays the language selection screen received from the printing device management server 101 on the liquid crystal panel 1508, and when the user selects a language, returns the selected language to the printing device management server 101 (1205).

その後、印刷装置管理サーバ101は、ワンタイムトークンを発番し、ワンタイムトークンDB108へ保存する(1206)。印刷装置管理サーバ101は、受信した情報とワンタイムトークンを埋め込んだQRコードを生成し(1207)、印刷装置104へQRコード画面を返却する(1208)。印刷装置104は、印刷装置管理サーバ101から受け取ったQRコード画面を液晶パネル1508に表示する。   Thereafter, the printing apparatus management server 101 issues a one-time token and stores it in the one-time token DB 108 (1206). The printing device management server 101 generates a QR code in which the received information and the one-time token are embedded (1207), and returns a QR code screen to the printing device 104 (1208). The printing apparatus 104 displays the QR code screen received from the printing apparatus management server 101 on the liquid crystal panel 1508.

ユーザは、携帯端末105のプリンタ登録用アプリを起動し、印刷装置104の液晶パネル1508に表示されたQRコードを撮像部1601で撮影する(1209)。携帯端末105のプリンタ登録用アプリは、読み取ったQRコードからデータを抽出して音声データを生成し(1210)、音声データに基づいて音声出力部1690から音声出力させる(1211)。   The user activates the printer registration application of the mobile terminal 105 and captures the QR code displayed on the liquid crystal panel 1508 of the printing device 104 with the imaging unit 1601 (1209). The printer registration application of the portable terminal 105 extracts data from the read QR code to generate audio data (1210), and causes the audio output unit 1690 to output audio based on the audio data (1211).

音声端末106は、その音声をキャッチし(1212)、音声端末管理サーバ103へ、その音声情報及び自身の音声端末識別ID114を送信する(1213)。音声端末管理サーバ103は、受信した音声情報から対象の音声端末連携サーバ102を特定し、命令部分を抽出し(1214)、命令部分の情報と音声端末識別ID114を音声端末連携サーバ102へ送信する(1215)。音声端末連携サーバ102は、命令部分の情報から、それが登録用命令である事を認識し、その命令の中からワンタイムトークンを取り出して、そのワンタイムトークンの確認処理を印刷装置管理サーバ101に対して行う(1216)。   The voice terminal 106 catches the voice (1212), and transmits the voice information and its own voice terminal identification ID 114 to the voice terminal management server 103 (1213). The voice terminal management server 103 specifies the target voice terminal cooperation server 102 from the received voice information, extracts a command part (1214), and transmits the information of the command part and the voice terminal identification ID 114 to the voice terminal cooperation server 102. (1215). The voice terminal cooperation server 102 recognizes that it is a registration command from the information of the command part, extracts the one-time token from the command, and performs the one-time token confirmation processing on the printing device management server 101. (1216).

印刷装置管理サーバ101は、音声端末連携サーバ102から受信したワンタイムトークンが有効なものであると判定した場合、それに対応付けられた印刷装置識別ID111を音声端末連携サーバ10へ返却する(1217)。   If the printing device management server 101 determines that the one-time token received from the voice terminal cooperation server 102 is valid, it returns the printing device identification ID 111 associated therewith to the voice terminal cooperation server 10 (1217). .

音声端末連携サーバ102は、返却された印刷装置識別ID111と音声端末識別ID114とを対応付けて連携管理DB109に保存し(1218)、音声端末管理サーバ103に登録が完了した事を示すユーザへの返信用音声情報と、音声端末識別ID114とを返信する(1219)。音声端末管理サーバ103は、音声端末106へ返信用音声情報を送信し(1220)、音声端末106は、音声端末管理サーバ103から受信した返信用音声情報に基づいて音声出力する(1221)。   The voice terminal cooperation server 102 associates the returned printing device identification ID 111 with the voice terminal identification ID 114 and stores them in the cooperation management DB 109 (1218), and notifies the user that the registration to the voice terminal management server 103 is completed. The reply voice information and the voice terminal identification ID 114 are returned (1219). The voice terminal management server 103 transmits reply voice information to the voice terminal 106 (1220), and the voice terminal 106 outputs voice based on the reply voice information received from the voice terminal management server 103 (1221).

以上のように、実施形態によれば、QRコードを印刷せずとも、音声端末106への登録を行う事ができる。従って、例えば、テレビや冷蔵庫、電子レンジ等、印刷機能を持たない情報端末でも、QRコードを表示する表示部を有していれば登録を行うことができる。また、複数種類の音声端末がある場合や、言語設定が音声端末とプリンタとで異なる場合でも、それらの情報付でQRコードを生成する事で、柔軟に音声出力する登録用音声を切り替える事が可能となる。   As described above, according to the embodiment, registration to the audio terminal 106 can be performed without printing a QR code. Therefore, for example, even an information terminal that does not have a printing function, such as a television, a refrigerator, and a microwave oven, can be registered if it has a display unit that displays a QR code. In addition, even when there are a plurality of types of voice terminals or when the language setting is different between the voice terminal and the printer, by generating a QR code with such information, it is possible to flexibly switch the registration voice for voice output. It becomes possible.

なお、本実施形態の場合、印刷装置管理サーバ101は、ワンタイムトークン付きURLをQRコードとして埋め込んだ画像を生成している。しかし、例えば、携帯端末105に音声出力させたい内容の音声データやテキストデータ等を電子透かしデータとして埋め込んだ画像を生成してもよい。この場合、印刷装置104の液晶パネル1101に表示した画像を携帯端末105が撮像部1601で読み取り、携帯端末105が、読み取った音声データの再生又はテキストデータの読み上げを行ってもよい。このような構成により、プリンタ登録用アプリを使用することなく印刷装置104の登録を行うことができる。また、印刷装置管理サーバ101は、例えば、携帯端末105に音声出力させたい内容の文字が印刷された画像を生成してもよい。この場合、携帯端末105は、印刷装置104が液晶パネル1101に表示した画像の文字を光学文字認識(OCR)処理により読み取り、その内容を読み上げてもよい。このような構成でも、プリンタ登録用アプリを使用することなく印刷装置104の登録を行うことができる。   In the case of the present embodiment, the printing apparatus management server 101 generates an image in which a URL with a one-time token is embedded as a QR code. However, for example, an image may be generated in which audio data or text data of the content that the mobile terminal 105 wants to output as audio is embedded as digital watermark data. In this case, the image displayed on the liquid crystal panel 1101 of the printing apparatus 104 may be read by the mobile terminal 105 by the imaging unit 1601, and the mobile terminal 105 may reproduce the read voice data or read out the text data. With such a configuration, it is possible to register the printing device 104 without using the printer registration application. Further, the printing apparatus management server 101 may generate, for example, an image in which characters having contents to be output to the portable terminal 105 by voice are printed. In this case, the portable terminal 105 may read the characters of the image displayed on the liquid crystal panel 1101 by the printing device 104 by an optical character recognition (OCR) process and read out the contents. Even with such a configuration, it is possible to register the printing device 104 without using the printer registration application.

(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
(Other Examples)
The present invention supplies a program for realizing one or more functions of the above-described embodiments to a system or an apparatus via a network or a storage medium, and one or more processors in a computer of the system or the apparatus read and execute the program. This processing can be realized. Further, it can also be realized by a circuit (for example, an ASIC) that realizes one or more functions.

プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROM、DVDなどを用いることができる。   As a storage medium for supplying the program code, for example, a flexible disk, hard disk, optical disk, magneto-optical disk, CD-ROM, CD-R, magnetic tape, nonvolatile memory card, ROM, DVD, or the like can be used. it can.

また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施例の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOperating System(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。   When the computer executes the readout program code, not only the functions of the above-described embodiments are realized, but also an Operating System (OS) running on the computer based on the instruction of the program code. It goes without saying that a case where some or all of the actual processing is performed and the functions of the above-described embodiments are realized by the processing is also included.

さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書きこまれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。   Further, after the program code read from the storage medium is written into the memory provided on the function expansion board inserted into the computer or the function expansion unit connected to the computer, the function is executed based on the instruction of the program code. It goes without saying that the CPU included in the expansion board or the function expansion unit performs part or all of the actual processing, and the processing realizes the functions of the above-described embodiments.

101 印刷装置管理サーバ: 102 音声端末連携サーバ: 103 音声端末管理サーバ: 104 印刷装置: 105 携帯端末: 106 音声端末: 115 登録音声付HTML生成サーバ: 1302、1401、1505、1620 CPU   101 printing device management server: 102 voice terminal cooperation server: 103 voice terminal management server: 104 printing device: 105 portable terminal: 106 voice terminal: 115 HTML generation server with registered voice: 1302, 1401, 1505, 1620 CPU

Claims (17)

音声端末と、前記音声端末で音声入力されたコマンドにより動作可能なデバイスと、サーバと、音声出力可能な携帯端末とを含む音声制御システムであって、
前記デバイスと前記音声端末とを対応づけて登録する登録指示を前記デバイスで受け付けると、前記登録を開始するための登録コードを発行する発行手段と、
前記発行手段により発行された前記登録コードを音声出力するよう前記携帯端末を制御する制御手段と、
前記登録指示が受け付けられた前記デバイスの識別情報と、前記携帯端末から音声出力された前記登録コードが音声入力された前記音声端末の識別情報と、を取得する取得手段と、
前記音声端末に音声入力された前記登録コードを用いて、前記取得手段により取得された前記デバイスの識別情報と前記音声端末の識別情報とを対応づけて登録する登録手段と、
を備えることを特徴とする音声制御システム。
A voice control system including a voice terminal, a device operable by a command input by voice at the voice terminal, a server, and a mobile terminal capable of voice output,
Issuing means for issuing a registration code for starting the registration when the device receives a registration instruction for registering the device and the audio terminal in association with each other,
Control means for controlling the portable terminal so as to output the registration code issued by the issuing means by voice,
Acquisition means for acquiring the identification information of the device for which the registration instruction has been received, and the identification information of the voice terminal to which the registration code voice-outputted from the mobile terminal is voice-input,
Using the registration code input by voice to the voice terminal, a registration unit that registers the device identification information and the voice terminal identification information acquired by the acquisition unit in association with each other,
A voice control system comprising:
前記登録コードを含む音声データを生成する生成手段、をさらに備え、
前記制御手段は、前記生成手段により生成された前記音声データに基づいて、前記登録コードを音声出力するよう前記携帯端末を制御する、
ことを特徴とする請求項1に記載の音声制御システム。
Generating means for generating audio data including the registration code,
The control unit controls the portable terminal to output the registration code by voice based on the voice data generated by the generation unit,
The voice control system according to claim 1, wherein:
前記登録コードを含む情報を前記デバイスに出力させる出力制御手段、をさらに備えることを特徴とする請求項2に記載の音声制御システム。   The voice control system according to claim 2, further comprising: output control means for outputting information including the registration code to the device. 前記出力制御手段は、前記情報を前記デバイスに印刷出力することを特徴とする請求項3に記載の音声制御システム。   The voice control system according to claim 3, wherein the output control unit prints out the information to the device. 前記出力制御手段は、前記情報を前記デバイスに表示出力することを特徴とする請求項3に記載の音声制御システム。   The voice control system according to claim 3, wherein the output control means displays and outputs the information to the device. 前記情報は、選択可能な複数の音声端末の情報を含むことを特徴とする請求項5に記載の音声制御システム。   The voice control system according to claim 5, wherein the information includes information on a plurality of selectable voice terminals. 前記情報は、音声出力するための言語の情報を含むことを特徴とする請求項5又は6に記載の音声制御システム。   The voice control system according to claim 5, wherein the information includes information of a language for voice output. 前記携帯端末の撮像手段が前記出力された前記情報を撮像すると、前記生成手段は、当該撮像の結果に基づいて前記音声データを生成する、
ことを特徴とする請求項3乃至7のいずれか1項に記載の音声制御システム。
When the imaging unit of the mobile terminal images the output information, the generation unit generates the audio data based on a result of the imaging.
The voice control system according to any one of claims 3 to 7, wherein:
前記サーバは、前記生成手段および前記制御手段を備えることを特徴とする請求項8に記載の音声制御システム。   The voice control system according to claim 8, wherein the server includes the generation unit and the control unit. 前記携帯端末は、前記生成手段および前記制御手段を備えることを特徴とする請求項8に記載の音声制御システム。   The voice control system according to claim 8, wherein the mobile terminal includes the generation unit and the control unit. 前記情報は、二次元コードであることを特徴とする請求項3乃至10のいずれか1項に記載の音声制御システム。   The voice control system according to any one of claims 3 to 10, wherein the information is a two-dimensional code. 前記発行手段により発行された前記登録コードと、前記取得手段により取得された前記デバイスの識別情報とを対応づけて記憶する記憶手段、をさらに備え、
前記登録手段は、前記音声端末に音声入力された登録コードに対応づけられた前記デバイスの識別情報を検索し、該検索された前記デバイスの識別情報と、前記取得手段により取得された前記音声端末の識別情報とを対応づけて登録する、
ことを特徴とする請求項1乃至11のいずれか1項に記載の音声制御システム。
A storage unit for storing the registration code issued by the issuing unit and the identification information of the device acquired by the acquiring unit in association with each other,
The registration unit searches for identification information of the device associated with a registration code input to the voice terminal by voice, and the identification information of the searched device and the voice terminal acquired by the acquisition unit. Register with the identification information of
The voice control system according to claim 1, wherein:
前記デバイスへの指示コマンドが前記音声端末で音声入力されると、当該音声端末の識別情報に対応づけて前記登録手段により登録された前記デバイスの識別情報を検索する検索手段と、
前記検索手段により検索された前記デバイスの識別情報に対応する前記デバイスに前記指示コマンドに対応する処理を実行させるデバイス制御手段と、
をさらに備えることを特徴とする請求項1乃至12のいずれか1項に記載の音声制御システム。
When an instruction command to the device is voice-inputted by the voice terminal, a search unit that searches for the identification information of the device registered by the registration unit in association with the identification information of the voice terminal;
Device control means for causing the device corresponding to the identification information of the device searched by the search means to execute processing corresponding to the instruction command;
The voice control system according to any one of claims 1 to 12, further comprising:
音声端末と、前記音声端末で音声入力されたコマンドにより動作可能なデバイスと、サーバと、音声出力可能な携帯端末とを含む音声制御システムにおいて実行される制御方法であって、
前記デバイスと前記音声端末とを対応づけて登録する登録指示を前記デバイスで受け付けると、前記登録を開始するための登録コードを発行する発行工程と、
前記発行工程において発行された前記登録コードを音声出力するよう前記携帯端末を制御する制御工程と、
前記登録指示が受け付けられた前記デバイスの識別情報と、前記携帯端末から音声出力された前記登録コードが音声入力された前記音声端末の識別情報と、を取得する取得工程と、
前記音声端末に音声入力された前記登録コードを用いて、前記取得工程において取得された前記デバイスの識別情報と前記音声端末の識別情報とを対応づけて登録する登録工程と、
を備えることを特徴とする制御方法。
A voice terminal, a device operable by a command input by voice at the voice terminal, a server, a control method executed in a voice control system including a mobile terminal capable of voice output,
When a registration instruction for registering the device and the voice terminal in association with each other is received by the device, an issuance step of issuing a registration code for starting the registration,
A control step of controlling the mobile terminal to output the registration code issued in the issuing step by voice,
An acquisition step of acquiring the identification information of the device for which the registration instruction has been received, and the identification information of the voice terminal to which the registration code voice-outputted from the mobile terminal is voice-input;
A registration step of registering the identification information of the device and the identification information of the audio terminal obtained in the obtaining step in association with each other using the registration code input by voice to the audio terminal,
A control method comprising:
音声端末で音声入力されたコマンドにより動作可能なデバイスと通信可能な情報処理装置であって、
前記デバイスと前記音声端末とを対応づけて登録する登録指示を前記デバイスから受信する受信手段と、
前記受信手段により前記登録指示を受信すると、前記登録を開始するための登録コードを発行する発行手段と、
前記発行手段により発行された前記登録コードを前記音声端末に音声入力させるために、当該登録コードを音声出力するよう前記携帯端末を制御する制御手段と、
を備えることを特徴とする情報処理装置。
An information processing apparatus capable of communicating with a device operable by a command input by voice at a voice terminal,
Receiving means for receiving from the device a registration instruction for registering the device and the audio terminal in association with each other,
Issuing means for issuing a registration code for starting the registration upon receiving the registration instruction by the receiving means,
Control means for controlling the portable terminal to output the registration code by voice in order to cause the voice terminal to input the registration code issued by the issuing means by voice,
An information processing apparatus comprising:
音声端末で音声入力されたコマンドにより動作可能なデバイスと通信可能な情報処理装置において実行される制御方法であって、
前記デバイスと前記音声端末とを対応づけて登録する登録指示を前記デバイスから受信する受信工程と、
前記受信工程において前記登録指示を受信すると、前記登録を開始するための登録コードを発行する発行工程と、
前記発行工程において発行された前記登録コードを前記音声端末に音声入力させるために、当該登録コードを音声出力するよう前記携帯端末を制御する制御工程と、
を備えることを特徴とする制御方法。
A control method executed in an information processing apparatus capable of communicating with a device operable by a command input by voice at a voice terminal,
A receiving step of receiving from the device a registration instruction for registering the device and the voice terminal in association with each other,
Upon receiving the registration instruction in the receiving step, an issuing step of issuing a registration code for starting the registration,
A control step of controlling the mobile terminal to output the registration code by voice in order to make the voice terminal input the voice of the registration code issued in the issuing step;
A control method comprising:
請求項15に記載の情報処理装置の各手段としてコンピュータを機能させるためのプログラム。   A program for causing a computer to function as each unit of the information processing apparatus according to claim 15.
JP2018144026A 2018-07-31 2018-07-31 Voice control system, information processing apparatus, control method, and program Pending JP2020020943A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018144026A JP2020020943A (en) 2018-07-31 2018-07-31 Voice control system, information processing apparatus, control method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018144026A JP2020020943A (en) 2018-07-31 2018-07-31 Voice control system, information processing apparatus, control method, and program

Publications (1)

Publication Number Publication Date
JP2020020943A true JP2020020943A (en) 2020-02-06

Family

ID=69589828

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018144026A Pending JP2020020943A (en) 2018-07-31 2018-07-31 Voice control system, information processing apparatus, control method, and program

Country Status (1)

Country Link
JP (1) JP2020020943A (en)

Similar Documents

Publication Publication Date Title
JP7571270B2 (en) SERVER SYSTEM, PRINTING APPARATUS, CONTROL METHOD, AND COMMUNICATION SYSTEM
US11211069B2 (en) Information processing system, information processing method, and non-transitory recording medium
US11006007B2 (en) Control system, server system, and control method
US11586866B2 (en) System including a controlling server for printing print data based on a first printing content and print data based on a second printing content
US9503602B2 (en) Image forming apparatus, image formation method, and recording medium that execute application
JP7173761B2 (en) PRINTING SYSTEM, CONTROL METHOD, SERVER SYSTEM
US8830492B2 (en) Data processing apparatus for sending a single job based on common document information
US11626111B2 (en) Information processing system, information processing method, and information processing apparatus
JP7532563B2 (en) System and method for control
JP2023007100A (en) Information processing system, management server and method for controlling the same, communication device, and program
US20230273968A1 (en) Information processing apparatus, information processing system, information processing method, and non-transitory recording medium
US20210006673A1 (en) Peripheral device management system, peripheral device management method, and printing apparatus control system
US11201975B2 (en) Server system having voice-controlled printing apparatus
US11816372B2 (en) Control system, server system, control method, and storage medium
JP2008211747A (en) Image processing apparatus, server apparatus, task processing method, storage medium, and program
JP2020020943A (en) Voice control system, information processing apparatus, control method, and program
JP2007280035A (en) Printing process system and method, and information processing apparatus and method
JP2020123905A (en) Image forming apparatus
JP5884853B2 (en) Form information processing system, form information processing method, and form information processing program
US11700338B2 (en) Information processing system that receives audio operations on multifunction peripheral, as well as image processing apparatus and control method therefor
US10735608B2 (en) Message conversion system, message conversion method, and message conversion program
JP2006318423A (en) Print system, mobile communication terminal device, and program and storage medium of mobile communication terminal device
JP2011039753A (en) Business form information processing system, business form information processing method and business form information processing program
JP2022156542A (en) communication unit
JP2006099253A (en) Information processor, its control method, control program, and system for forming expanded image

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113