JP2020021253A - Voice control system, information processing apparatus, registration method, and program - Google Patents
Voice control system, information processing apparatus, registration method, and program Download PDFInfo
- Publication number
- JP2020021253A JP2020021253A JP2018144027A JP2018144027A JP2020021253A JP 2020021253 A JP2020021253 A JP 2020021253A JP 2018144027 A JP2018144027 A JP 2018144027A JP 2018144027 A JP2018144027 A JP 2018144027A JP 2020021253 A JP2020021253 A JP 2020021253A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- registration
- input
- registration code
- voice terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
Description
本発明は、音声コマンドによりデバイスを制御可能な音声制御システム、情報処理装置、登録方法およびプログラムに関する。 The present invention relates to a voice control system capable of controlling a device by a voice command, an information processing apparatus, a registration method, and a program.
従来、操作対象の電子機器とは独立した音声端末が様々な電子機器を代表して音声入力を受け付け、受け付けた内容に応じてあらかじめ登録された電子機器に対して命令を届けるという技術が存在した(特許文献1)。 Conventionally, there has been a technology in which a voice terminal independent of an electronic device to be operated receives voice input on behalf of various electronic devices, and delivers a command to a pre-registered electronic device according to the received content. (Patent Document 1).
特許文献1のように音声端末が音声入力に対応する命令を登録されている電子機器に届けるためには、操作対象の電子機器(デバイス)と音声端末の対応付けを登録する必要がある。音声端末が普及するに従い、この登録のための操作の効率化が求められている。 In order for the voice terminal to send a command corresponding to voice input to a registered electronic device as in Patent Literature 1, it is necessary to register the correspondence between the operation target electronic device (device) and the voice terminal. As voice terminals become more widespread, there is a demand for more efficient operation for this registration.
本発明の目的は、音声端末とデバイスとの対応づけを効率的に行う音声制御システム、情報処理装置、登録方法およびプログラムを提供することを目的とする。 An object of the present invention is to provide a voice control system, an information processing apparatus, a registration method, and a program for efficiently associating a voice terminal with a device.
上記課題を解決するため、本発明に係る音声制御システムは、音声端末と、前記音声端末で音声入力されたコマンドにより動作可能なデバイスと、サーバと、を含む音声制御システムであって、前記デバイスと前記音声端末とを対応づけて登録するための登録コマンドが前記音声端末で音声入力されると、前記登録に関する登録コードを生成する生成手段と、前記生成手段により生成された前記登録コードを前記デバイスに対応する入力部を介して入力するようユーザに指示する第1指示手段と、前記登録コマンドの音声入力がされた前記音声端末の識別情報と、前記登録コードが入力された前記入力部に対応する前記デバイスの識別情報と、を取得する取得手段と、前記デバイスで入力された登録コードを用いて、前記取得手段により取得された前記音声端末の識別情報と前記デバイスの識別情報とを対応づけて登録する登録手段とを備えることを特徴とする。 In order to solve the above problem, a voice control system according to the present invention is a voice control system including a voice terminal, a device operable by a command input by voice at the voice terminal, and a server, wherein the device When a registration command for registering the voice terminal in association with the voice terminal is voice-inputted by the voice terminal, a generation unit that generates a registration code related to the registration, and the registration code generated by the generation unit. First instruction means for instructing the user to input via the input unit corresponding to the device, identification information of the voice terminal to which the voice of the registration command has been input, and the input unit to which the registration code has been input. Acquisition means for acquiring the identification information of the corresponding device, and acquisition by the acquisition means using a registration code input by the device. Characterized in that it comprises a registration means for registering in association with identification information of the audio terminal that the identification information of the device.
本発明によれば、音声端末とデバイスとの対応づけを効率的に行うことができる。 According to the present invention, it is possible to efficiently associate a voice terminal with a device.
以下、添付図面を参照して本発明の実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る本発明を限定するものでなく、また本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。なお、同一の構成要素には同一の参照番号を付して、説明を省略する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. The following embodiments do not limit the present invention according to the claims, and all combinations of features described in the present embodiments are not necessarily essential to the solution of the present invention. . The same components are denoted by the same reference numerals, and description thereof will be omitted.
<第1の実施形態>
本実施形態における音声端末、操作対象電子機器およびサーバ群を含む情報システム100の構成について、図1のブロック図を参照して説明する。情報システム100は、音声端末で入力された音声コマンドにより電子機器を制御可能な音声制御システムである。
<First embodiment>
The configuration of the
音声端末110は、音声入力部111、音声出力部112、ネットワーク通信部113を備え、自身を識別する識別情報である音声端末ID114をROMやハードディスク等の記憶部に保持する。音声端末110は、ネットワーク通信部113を用いることによりネットワーク150を介して音声端末管理サーバ120と相互に通信可能に接続されている。音声端末110は、音声入力部111を介してユーザからの音声入力を取得し、その音声データを音声端末管理サーバ120へ送信する。また、音声端末110は、音声端末管理サーバ120から受信した音声データに基づいて、音声出力部112を介してユーザに対する音声通知を出力する。
The
音声端末管理サーバ120は、音声処理部121、連携処理部122、連携サーバ管理データベース(DB)123およびネットワーク通信部124を備える。音声端末管理サーバ120は、ネットワーク通信部124を用いることによりネットワーク150を介して音声端末110および印刷装置管理サーバ140のそれぞれと相互に通信可能に接続されている。音声処理部121は、音声端末110から受信する音声データに基づいてユーザの発話内容を音声認識し、文字情報に変換する。連携処理部122は、認識された文字情報に基づいて音声操作対象の機器(デバイス)を管理する印刷装置管理サーバ140を特定し、文字情報の内、操作対象の機器に対する命令を印刷装置管理サーバ140へ送信する。連携サーバ管理DB123は、音声端末110による操作対象の機器をその種別ごとに管理する連携サーバを登録し、管理する。本実施形態では、例えば印刷装置130が操作対象の機器、印刷装置管理サーバ140が連携サーバに相当する。また、音声処理部121は、連携サーバから受信した文字情報に基づいてユーザへ音声出力するための音声データを生成する。ネットワーク通信部124が該生成された音声データを音声端末110へ送信する。
The voice
音声端末110と音声端末管理サーバ120は、情報システム100内で、ユーザからの音声入力に従って様々な機器に対して動作を指示し、また、必要に応じてユーザに対して音声による通知を行う音声対応システム160を形成する。
The
印刷装置130は、情報システム110における操作対象の機器であり、音声コマンドにより動作可能な機器である。印刷装置130は、入力部131、表示部132、印刷部133、ネットワーク通信部134を備え、自身を識別する識別情報である印刷装置ID135をROMやハードディスク等の記憶部に保持している。印刷装置130は、ネットワーク通信部134を用いることによりネットワーク150を介して印刷装置管理サーバ140と相互に通信可能に接続されている。入力部131は、キー群を備え、印刷装置130は、入力部131を介してユーザからの操作指示を取得する。表示部132は、液晶ディスプレイパネルを備え、印刷装置130の状態やユーザに対する通知、操作ガイド等のユーザインタフェース画面を表示する。ユーザは、入力部131、表示部132を用いて印刷装置130との対話的操作を行うことができる。
The
ネットワーク通信部134は、ネットワーク150を介して印刷装置管理サーバ140に対して常時ポーリング通信を行う。当該ポーリング通信によって、印刷装置130は、印刷装置130が印刷すべきコンテンツの有無を問い合わせ、当該コンテンツがある場合には印刷装置管理サーバ140からコンテンツとしての印刷データを受信する。印刷部133は、ネットワーク通信部134を用いて印刷装置管理サーバ140から受信した印刷データに基づいて、印刷装置130に供給された用紙等の記録媒体に対し画像の印刷を行う。印刷部はインクジェット記録方式、電子写真方式、熱転写方式等、どのような記録方式を用いるものであってもよい。
The
印刷装置管理サーバ140は、コマンド処理部141、登録部142、コンテンツ出力部143、登録コードDB144、印刷装置管理DB145およびネットワーク通信部146を備える。印刷装置管理サーバ140は、ネットワーク通信部146を用いることによりネットワーク150を介して音声端末管理サーバ120および印刷装置130のそれぞれと相互に通信可能に接続されている。コマンド処理部141は、ネットワーク通信部146で受信したコマンドを解釈し、後述の各部に動作指示をする。登録部142は、後述する処理により、音声端末110と印刷装置130との対応付けを行い、印刷装置管理DB145への登録を行う。コンテンツ出力部143は、後述する処理により、ユーザが音声端末110へ入力する操作指示に基づいて、印刷装置130で画像を印刷させるための印刷データを生成する。登録コードDB144は、後述する処理で用いる登録コードを音声端末110、印刷装置130あるいはそれらの組み合わせと対応付けて記録する。本実施形態では、登録コードがワンタイムトークンとして用いられる。
The printing
印刷装置管理DB145は、音声端末110と印刷装置130との対応付けを登録し、管理する。ネットワーク通信部146は、印刷装置130によるポーリング処理でコンテンツの有無問い合わせをコマンドとして受信する。この際に、コンテンツ出力部143が印刷装置130向けの印刷データを生成していた場合、印刷装置管理サーバ140は、ポーリングへの応答として、当該印刷データを印刷装置130へ送信する。また、ネットワーク通信部146は、音声端末管理サーバ120から印刷装置130に対する操作命令を示す文字情報をコマンドとして受信する。さらに、該文字情報をコマンド処理部141で処理した結果に応じて、音声端末110からユーザに対して音声出力する応答文言の文字列を音声端末管理サーバ120へ送信する。
The printing
ネットワーク150は、音声端末110、音声端末管理サーバ120、印刷装置管理サーバ140、印刷装置130を相互に通信可能に接続するコンピュータネットワークである。ネットワーク150は、LAN(Local Area Network)、インターネット等各種のネットワーク、またはそれらの組み合わせからなるものであってよい。ネットワーク150には、アクセスポイント、スイッチ、ルータなどを含んでいてもよい。また、ネットワーク150は、有線、無線等、いずれの媒体で構成されていても良い。
The
ここで、図1の各装置のハードウェア構成について説明する。 Here, the hardware configuration of each device in FIG. 1 will be described.
図13は、音声端末110のハードウェアブロック構成を示す図である。音声端末110は、スピーカ1301、CPU1302、ROM1303、マイクロフォン1304、RAM1305、外部記憶装置1306、通信部1307、近距離無線通信部1308を有する。なお、図13に示す各ブロックは、例えば内部バス1310を用いて相互に接続される。また、CPUはCentral Processing Unitを表し、ROMはRead Only Memoryを表し、RAMはRandom Access Memoryを表す。本実施形態における音声端末110の動作は、例えば、CPU1302がROM1303に記憶されたプログラムをRAM1305にロードして実行することにより実現される。
FIG. 13 is a diagram illustrating a hardware block configuration of the
スピーカ1301は、図1の音声出力部112に対応し、音声データに基づいて音声出力する。CPU1302は、例えばシステム制御基板上に構成され、音声端末110を統括的に制御する。ROM1303は、CPU1302が実行する制御プログラムやデータテーブル、組み込みOS(Operating System)プログラム等の固定データを記憶する。本実施形態では、ROM1303に記憶されている各制御プログラムは、ROM1303に記憶されている組み込みOSのソフトウェア実行制御の対象となる。ソフトウェア実行制御とは、例えば、スケジューリングやタスクスイッチ、割り込み処理である。マイクロフォン1304は、図1の音声入力部111に対応し、音声端末110の周囲の音声、例えば、ユーザが発した音声を受信する。
The
RAM1305は、例えば、バックアップ電源を必要とするSRAM(StaticRAM)等で構成される。なお、RAM1305は、不図示のデータバックアップ用の一次電池によってデータが保持されるので、プログラム制御変数等のデータを揮発させずに保持することができる。また、音声端末110の設定情報や管理データ等を記憶するメモリエリアもRAM1305に設けられている。また、RAM1305は、CPU1302の主メモリ及びワークメモリとしても用いられる。外部記憶装置1306は、アプリケーションソフトウェアを記憶する。
The
通信部1307は、所定の無線通信方式に従って通信を行うための回路やアンテナを含んで構成される。例えば、通信部1307は、外部のアクセスポイントに無線接続することができる。また、通信部1307は、一時的に自身がアクセスポイントとして動作することも可能である。つまり通信部1307がアクセスポイント機能を備えてもよい。本実施形態で使用される無線通信は、IEEE802.11規格シリーズに準拠した無線LANの無線通信方式に従って動作する能力を有しても良いし、他の無線通信方式に従って動作する能力を有しても良い。近距離無線通信部1308は、音声端末110と一定の近距離範囲内に存在する他の装置と近距離無線通信を行う。なお、近距離無線通信部1308は、通信部1307と異なる無線通信方式によって通信を行う。本実施形態では、近距離無線通信部1308は、Bluetooth(登録商標)規格に従って動作するものとする。通信部1307及び近距離無線通信部1308は、図1のネットワーク通信部113に対応する。
The
音声認識・音声出力部1309は、マイクロフォン1304を介して入力された音声を音声認識して音声データを生成し、また、外部から受信した音声データ若しくは予め保持しているメッセージデータを音声信号に変換してスピーカ1301から音声出力させる。
A voice recognition /
図14は、音声端末管理サーバ120および印刷装置管理サーバ140のブロック構成を示す図である。図14は、上記の2つの装置に共通の構成を示しているので、以下では、音声端末管理サーバ120として説明する。なお、本実施形態では、音声端末管理サーバ120および印刷装置管理サーバ140がそれぞれ1台のサーバ(情報処理装置)で構成されているが、複数台のサーバが連携して動作することで、音声端末管理サーバ120や印刷装置管理サーバ140に対応するサーバシステムが構築される形態であっても構わない。
FIG. 14 is a diagram showing a block configuration of the voice
CPU1401は、音声端末管理サーバ120を統括的に制御するための中央演算装置である。ディスク装置1402は、アプリケーションプログラム1412やデータベース1413やOSの他、各種ファイルやデータを記憶する。外部記憶媒体読取装置1403は、SDカードなどの外部記憶媒体に記憶されたファイルなどの情報を読み出すための装置である。メモリ1404は、RAMなどで構成され、CPU1401が必要に応じてデータの一時的格納やバッファリング等を行う際に用いられる。
The
表示部1405は、例えばLCDで構成され、各種の情報を表示する。また、操作部1406は、ユーザが各種の入力操作を行うためのキーボードやマウスなどを含み、ユーザからの指示や操作を受付可能である。ネットワーク通信部1407は、ネットワーク接続部1408を介してインターネット等のネットワークと接続され、各種の通信を行う。ネットワーク接続部1408は、有線LANや無線LANなどのネットワーク媒体に対応し、有線LAN対応の場合は、例えば、有線LANのケーブルを接続するためのコネクタであり、無線LAN対応の場合は、例えばアンテナである。なお、ネットワーク接続部1408が、有線LANおよび無線LANの両者に対応していても良い。USB通信部1410は、各種周辺装置とUSB接続部1411を介して接続され、各種通信を行う。
The
図14の各ブロックは、バス1409を介して相互に接続される。また、本実施形態における音声端末管理サーバ120(若しくは、印刷装置管理サーバ140)の動作は、例えば、CPU1401が処理に必要なプログラムをディスク装置1402からメモリ1404にロードして実行することで実現される。また、図13の音声認識・音声出力部1309の音声認識機能が、図14の構成に含まれていても良い。その場合は、図14の構成を含む装置は、例えば、音声端末110から送信される音声データを解析して、所定のワードを認識して抽出することができる。本実施形態では、音声端末管理サーバ120と印刷装置管理サーバ140とを別々のサーバ(情報処理装置)として説明するが、両者のサーバ機能が一体化されたサーバとして構成されても良い。
Each block in FIG. 14 is mutually connected via a
図1の音声処理部121、連携処理部122、コマンド処理部141、登録部142、コンテンツ出力部143は、例えば、CPU1401が実行するモジュールとして実現される。連携サーバ管理DB123、登録コードDB144、印刷装置管理DB145は、例えば、データベース1413に対応する。また、ネットワーク通信部124、146は、ネットワーク通信部1407に対応する。
The voice processing unit 121, the
図15は、印刷装置130のブロック構成を示す図である。なお、本実施形態では、印刷装置130として、例えば、複合機の他、画像処理装置、複写機、ファクシミリ、単機能の印刷装置等が用いられても良い。印刷装置130において、印刷機能はプリンタ部1501で実現され、スキャナ機能はスキャナ部1502で実現され、ストレージ機能はメモリカード装着部1503及びメモリカード1504で実現される。上述した各部は、バス1514で相互に接続される。
FIG. 15 is a diagram illustrating a block configuration of the
プリンタ部1501は、図1の印刷部133に対応し、外部から受信した画像データやメモリカード1504に記憶されている画像データなどを、インクジェット記録方式や電子写真方式などの記録方式によって印刷用紙等の記録媒体に記録する。また、プリンタ部1501は、消耗部材に関する情報、例えば、インク残量を含むインク情報や積載用紙の枚数等の用紙情報を管理している。
The
スキャナ部1502は、原稿台(不図示)にセットされた原稿を光学的に読み取って電子データに変換し、更に指定されたファイル形式に変換した画像データを、ネットワーク経由で外部装置に送信、或いはHDD1516等の記憶領域に格納する。コピーサービスでは、スキャナ部1502が原稿台に置かれた原稿をスキャナ部1502で読み取って生成した画像データをプリンタ部1501へ転送し、プリンタ部1501が印刷用紙等の記録媒体にその画像データに基づいて印刷を行うことで実現される。
The
メモリカード装着部1503に装着されたメモリカード1504には、各種ファイルデータが記憶される。このファイルデータは、ネットワークを介して外部装置から読み出されて編集される場合もある。また、外部装置からメモリカード1504にファイルデータが格納される場合もある。
Various file data are stored in the
更に、印刷装置130は、CPU1505、プログラムメモリ1506、ワークメモリ1507、表示部1508、操作部1509、ネットワーク通信部1510、ネットワーク接続部1511、フラッシュメモリ1512を有する。操作部1509は、図1の入力部131に対応する。表示部1508は、図1の表示部132に対応する。CPU1505は、印刷装置130内の各部を統括的に制御するための中央演算装置である。プログラムメモリ1506は、ROMなどで構成され、各種のプログラムコードや、外部のサーバと通信するためなどのアプリケーション1515が記憶されている。また、アプリケーション1515は、プリンタ部1501にアクセスしてインクや用紙などの消耗品情報を取得することも可能である。ワークメモリ1507は、RAMなどで構成され、各サービス実行時に画像データなどを一時格納したり、バッファリングしたりする。表示部1508は、例えばLCDで構成され、ユーザインタフェース画面等、各種の情報を表示する。また、操作部1509は、キーボードやマウス、スイッチ等を含み、ユーザからの指示や操作を受付可能である。ネットワーク通信部1510は、図1のネットワーク通信部134に対応し、ネットワーク接続部1511を介して印刷装置130をネットワークに接続して各種通信を行う。
Further, the
ネットワーク通信部1510が有線LAN対応の場合のネットワーク接続部1511は有線LANのケーブルを接続するためのコネクタであり、ネットワーク通信部1510が無線LAN対応の場合のネットワーク接続部1511はアンテナとなる。なお、ネットワーク接続部1511が、有線LANおよび無線LANの両者に対応していても良い。本実施形態では、ネットワーク通信部1510、ネットワーク接続部1511は、無線LANに対応しており、例えば、IEEE802.11規格シリーズに準拠した無線LANの無線通信方式に従ってアクセスポイントと接続可能である。なお、ネットワーク接続部1511は、一時的に自身がアクセスポイント(ネットワークを構築する親局)として動作することも可能である。つまりネットワーク接続部1511がアクセスポイントに対応する機能を備えてもよい。また、印刷装置130は、音声端末110と同様に近距離無線通信部(不図示)を備えていてもよい。
When the
フラッシュメモリ1512は、ネットワーク通信部1510が受信した画像データなどを格納するための不揮発性のメモリである。そして、上述した各部は、バス1513で相互に接続される。また、バス1514とバス1513との間でデータ変換を行うブロックがあっても良い。本実施形態における印刷装置130の動作は、例えば、CPU1505が処理に必要なプログラムをプログラムメモリ1506からワークメモリ1507に読み出して実行することで実現される。
The
図2(a)は、音声端末管理サーバ120に設けられた連携サーバ管理DB123の内容の一例を示す図である。呼び出し名201に基づいて、連携サーバのUniversal Resource Locator(URL)202を検索できるように構成されている。音声端末管理サーバ120は、後述の処理でユーザから音声端末110が取得した音声入力に基づく音声データを解析して、解析結果と連携サーバ管理DB123に基づいて、連携サーバのURLを特定する。
FIG. 2A is a diagram illustrating an example of the content of the cooperation
図2(b)は、印刷装置管理サーバ140に設けられた登録コードDB144の内容の一例を示す図である。音声端末ID301、登録コード302および当該登録コードの有効期限日時303を相互に対応付けて記憶する。登録コードDB144は、後述の処理で音声端末110と印刷装置130との対応付けを登録する際に用いられる。印刷装置管理サーバ140の登録部142は、定期的な処理により例えば一日に一度、有効期限日時303を過ぎた項目を登録コードDB144から削除する。
FIG. 2B is a diagram illustrating an example of the contents of a
図2(c)は、印刷装置管理サーバ140に設けられた印刷装置管理DB145の内容の一例を示す図である。印刷装置管理DB145は、後述の処理で音声端末110と印刷装置130の対応付けを登録する際には、それらを特定するための識別情報である音声端末ID401と印刷装置ID402とを対応付けて記憶する。
FIG. 2C is a diagram illustrating an example of the contents of the printing
図3は、音声端末110を介して音声による機器操作をする際の発話例を示す図である。図3の操作は、予め後述の処理により印刷装置管理DB145に音声端末110の音声端末ID114と印刷装置130の印刷装置ID135との対応付けが記憶された状態で行われる。
FIG. 3 is a diagram illustrating an utterance example when operating a device by voice via the
ユーザ511が音声端末110に対して操作指示として発話音声501を発話する。発話音声501の内、冒頭の語502は、音声端末110に対して話しかけていることを示す語である。話しかけていることを示す語502に続く発話音声は、呼び出し名503と、起動することを示す語504を含む。呼び出し名503は、音声端末110と連携するどのサーバで以後の操作指示を処理するかを指定する。起動することを示す語504は、呼び出し名503で指定された、音声端末110と連携するサーバへ操作指示を行うことを示す。呼び出し名503と起動することを示す語504の語順は、ユーザが利用する言語によって予め決められている。呼び出し名503と起動することを示す語504に続く発話音声505が、連携するサーバに対する指示コマンドとして使用される。これらに対して後述する処理が行われ、音声端末110は、ユーザ511に対する応答音声506を出力する。図3では、印刷が完了したことを示す応答音声506が出力されている。
The
図4は、音声端末110を介した音声による機器操作の処理動作を示すシーケンス図である。S101で、音声端末110のユーザ511は、音声端末110に向かって図3の操作指示を発話する。S102で、音声端末110は、音声入力部111で発話音声501を取得する。音声入力部111は、取得した発話音声501から話しかけていることを示す語502を検出し、発話音声501が音声端末110に対する入力であると判定する。S103で、音声端末110は、ネットワーク通信部113を用いて発話音声501の音声データを音声端末管理サーバ120へ送信する。また、音声端末110は、音声端末110を特定するデータとして音声端末ID114を合わせて音声端末管理サーバ120へ送信する。
FIG. 4 is a sequence diagram illustrating a processing operation of device operation by voice via the
S104で、音声端末管理サーバ120は、ネットワーク通信部124で発話音声501の音声データと音声端末ID114を受信する。さらに、音声端末管理サーバ120は、音声処理部121で発話音声501の音声データに対して音声認識を行って文字データに変換し、呼び出し名503とコマンド505にそれぞれ対応する文字データを取得する。S105で、音声端末管理サーバ120は、連携処理部122でコマンド505を処理する連携サーバを特定する。連携処理部122は、連携サーバ管理DB123にアクセスし、発話された呼び出し名503を登録済みの呼び出し名201の中から検索し、合致するものに対応付けられた連携サーバURL202を取得する。例えば、呼び出し名503「AAA社印刷」に対応付けられたURL「https://aaa.com/service/print」を取得する。ここでは、そのURLが印刷装置管理サーバ140の提供する音声端末連携サービスのURLであるとする。S106で、音声端末管理サーバ120は、ネットワーク通信部124を用いて、S105で取得した印刷装置管理サーバ140のURLを通信先として、コマンド505を元に変換した文字データと、音声端末ID114を送信する。
In S104, the voice
S107で、印刷装置管理サーバ140は、ネットワーク通信部146を用いて、S106で送信されたコマンド505に対応する文字データと音声端末ID114を受信し、コマンド処理部141で文字データの内容の解釈を行う。ここでは、コマンド505の文字列「今日のニュースを印刷して」を元に、今日のニュースを印刷物として出力する処理を開始する。S108で、印刷装置管理サーバ140は、コマンド処理部141で操作対象の印刷装置を特定する。コマンド処理部141は、印刷装置管理DB145へアクセスし、S107で受信した音声端末ID114を登録済みの音声端末ID401の中から検索し、合致するものに対応付けられた印刷装置ID402を取得する。ここでは、印刷装置IDが、印刷装置130の印刷装置ID135であるとする。この処理により、操作対象の機器として印刷装置130が特定される。S109で、印刷装置管理サーバ140は、S107で解釈したコマンドに従い、コンテンツ出力部143で、コマンド505で指示された「今日のニュース」の印刷コンテンツを生成する。さらに、印刷装置管理サーバ140は、コンテンツ出力部143で印刷装置ID135を有する印刷装置130が実行可能な印刷データに変換する。
In S107, the printing
S110で、印刷装置130は、ネットワーク通信部134を用いて印刷装置管理サーバ140に対して印刷装置ID135を送信してポーリング通信を行い、該印刷装置向けの印刷コンテンツの有無を問い合わせる。なお、例えば、印刷装置は、電源がONになった後、ポーリング通信を常時行うことでS110が実現される。
In step S110, the
S111で、印刷装置管理サーバ140は、S110で送信された問い合わせと印刷装置ID135をネットワーク通信部146によって受信する。コンテンツ出力部143は、当該印刷装置ID135に基づいて、S109で生成した印刷データを特定する。S112で、印刷装置管理サーバ140は、ネットワーク通信部146により印刷装置130に対して当該印刷データを送信する。
In S111, the printing
S113で、印刷装置130は、ネットワーク通信部134を用いて送信された印刷データを受信し、印刷部133によって印刷を行う。一方、印刷装置管理サーバ140は、音声端末110を介してユーザに対して返す応答音声506の文字データをS114でコマンド処理部141によって生成する。また、印刷装置管理サーバ140は、ネットワーク通信部146を用いて該生成した文字データを音声端末ID114とともに音声端末管理サーバ120へ送信する。
In step S113, the
S115で、音声端末管理サーバ120は、ネットワーク通信部124を用いて応答音声506の文字データと音声端末ID114を受信し、音声処理部121で応答音声506の音声データを生成する。S116で、音声端末管理サーバ120は、ネットワーク通信部124を用いて、生成した応答音声データを音声端末ID114で特定される音声端末110へ送信する。
In S115, the voice
S117で、音声端末110は、ネットワーク通信部113を用いて応答音声データを受信し、音声出力部112を用いてユーザへ向けて応答音声506を出力する。以上により、音声による機器操作の処理が行われる。
In step S117, the
続いて音声端末110と印刷装置130の対応付け方法について説明する。図5は、本実施形態における、音声によって音声端末110と印刷装置130の対応を登録する際の発話例を示す図である。ユーザ511は、音声端末110に対して操作指示として発話音声701を発話する。音声端末110に対して話しかけていることを示す語502、呼び出し名503、起動することを示す語504は、図5における同一番号の語の説明と同様である。音声端末110と印刷装置130の対応づけを登録する際には連携する印刷装置管理サーバ140に対する登録コマンド702の文字列「プリンタを登録して」を使用する。これらに対して後述する登録処理が行われ、音声端末110は、ユーザ511に対する応答音声703を出力する。応答音声703の内、登録コード部704には、後述の処理で用いる登録コードが組み込まれる。
Next, a method of associating the
図6は、本実施形態における音声端末110と印刷装置130の対応づけを登録する処理を示すシーケンス図である。S201で、音声端末110のユーザ511は、音声端末110に向かって図5の操作指示701を発話する。S202は、図4におけるS102の説明と同様である。S203で、音声端末110は、ネットワーク通信部113を用いて、発話音声701の音声データと音声端末ID114を音声端末管理サーバ120へ送信する。
FIG. 6 is a sequence diagram illustrating a process of registering the association between the
S204で、音声端末管理サーバ120は、ネットワーク通信部124で発話音声701の音声データと音声端末ID114を受信する。さらに、音声端末管理サーバ120は、音声処理部121で発話音声701の音声データに対して音声認識を行って文字データに変換し、呼び出し名503とコマンド702にそれぞれ対応する文字データを取得する。S205で、連携処理部122は、連携サーバ管理DB123にアクセスし、呼び出し名503に対応付けられた連携サーバURL202として印刷装置管理サーバ140の音声端末連携サービスのURLを取得する。S206で、音声端末管理サーバ120は、ネットワーク通信部124を用いて、S205で取得した印刷装置管理サーバ140のURLを通信先として、コマンド702に対応する文字データと音声端末ID114を送信する。
In S204, the voice
S207で、印刷装置管理サーバ140は、ネットワーク通信部146を用いて、S206で送信されたコマンド702に対応する文字データと音声端末ID114を受信し、コマンド処理部141で文字データの内容の解釈を行う。S208以降では印刷装置管理サーバ140は、コマンド702の文字列「プリンタを登録して」を解釈した結果に従い、音声端末ID114で特定される音声端末110と印刷装置130の対応づけを登録する処理を行う。
In S207, the printing
S208で、印刷装置管理サーバ140は、登録部142で登録コードを生成する。本実施形態では、該登録コードはワンタイムトークンであり、例えば8桁の数字列とする。登録部142は、登録コードDB144に記憶済みかつ現時点で有効期限日時303に達していない登録コード302のいずれとも一致しない新規登録コードを生成する。さらに、登録部142は、生成した登録コードに有効期限日時を設定する。有効期限日時は、例えば登録コード生成の30分後とする。そして、登録部142は、生成した登録コードをS207で受信した音声端末ID114、設定された有効期限日時と対応付けて登録コードDB144に記録する。
In S208, the printing
S209で、印刷装置管理サーバ140は、S208で生成した登録コードをユーザ511へ通知する応答音声の文言703に対応する文字データをコマンド処理部141により生成する。さらに、印刷装置管理サーバ140は、ネットワーク通信部146を用いて応答文言703に対応する文字データと音声端末ID114を音声端末管理サーバ120へ送信する。
In step S209, the printing
S210で、音声端末管理サーバ120は、ネットワーク通信部124を用いて、送信された応答音声の文言703に対応する文字データと音声端末ID114を受信する。そして、音声端末管理サーバ120は、音声処理部121で応答音声の文言703に対応する文字データを元に応答音声データを生成する。S211で、音声端末管理サーバ120は、ネットワーク通信部124を用いて、生成した応答音声データを音声端末ID114で特定される音声端末110へ送信する。
In S210, the voice
S212で、音声端末110は、ネットワーク通信部113を用いて応答音声データを受信し、音声出力部112を用いてユーザ511へ向けて応答音声703を出力する。この応答音声703によって音声端末110のユーザ511に対して、新規登録コードが伝達される。
In S212, the
S213で、応答音声703に応じてユーザ511は、登録コードを印刷装置130に対して入力部131のキー群を用いて入力する。S214で、印刷装置130は、入力部131によってユーザ511からの入力を入力コードとして取得する。該入力コードは、登録コードに対応する。続くS215で、印刷装置130は、ネットワーク通信部134を用いて印刷装置ID135と入力コードを印刷装置管理サーバ140へ送信する。
In step S213, the
S216で、印刷装置管理サーバ140は、ネットワーク通信部146を用いて、送信された印刷装置ID135と入力コードを受信する。S217で、登録部142は、登録コードDB144へアクセスし、有効期限日時303に達していない項目であって、登録コード302の値が受信した入力コード値に合致する項目を検索する。該検索により登録コード302に対応付けられた音声端末ID301の値である音声端末ID114を取得する。S218で、登録部142は、印刷装置管理DB145にアクセスする。登録部142は、入力コードに対応付けられた音声端末ID114の値と印刷装置ID135の値とを対応付けて印刷装置管理DB145の音声端末ID401、印刷装置ID402としてそれぞれ登録する。
In S216, the printing
以上の処理により音声端末110の音声端末ID114と印刷装置130の印刷装置ID135の対応付けが印刷装置管理サーバ140の印刷装置管理DB145に登録される。以後、音声端末110のユーザ511が図3の発話をした際に、図4の処理により印刷装置管理DB145が参照され、上記登録された対応付けを用いて、所望の印刷装置130で印刷を行うことができる。
By the above processing, the correspondence between the
以上の説明では、音声端末ID114、印刷装置ID135、登録コードについて、それぞれそのものの値を登録コードDB144、印刷装置管理DB145に記憶するものとした。しかしながら、各DBに記憶する値は、各IDおよび登録コードと照合が可能なデータであればそれらそのものの値である必要はなく、例えば各値を元に算出されたハッシュ値であっても良い。
In the above description, the values of the
本実施形態では、上記の発話音声501、506、701、703の音声データとそれらに対応する文字データの間の変換処理を音声端末管理サーバ120の音声処理部121で行う構成例について説明した。しかしながら、本変換処理は音声端末110内で完結するように行われても良いし、音声端末110と音声端末管理サーバ120で処理を分担するように構成してもよく、音声対応システム160内で行われればよい。
In the present embodiment, a configuration example has been described in which the voice processing unit 121 of the voice
登録コードDB144、印刷装置管理DB145にそれぞれ記憶する音声端末ID301、401の代わりとして、音声端末110のユーザ511に対してあらかじめユーザIDを発行しておき、該ユーザIDを用いるよう構成してもよい。この場合、音声端末ID114とユーザIDの間の変換は、音声端末110、音声端末管理サーバ120、印刷装置管理サーバ140のいずれで行ってもよく、これらと通信可能な他のサーバで行ってもよい。印刷管理装置DB145に記録する印刷装置ID402についても同様に、ユーザIDで代用するよう構成してもよい。印刷装置ID135とユーザIDの間の変換は、印刷装置130、印刷装置管理サーバ140のいずれで行ってもよく、これらと通信可能な他のサーバで行ってもよい。
Instead of the
上記の説明では、S214で印刷装置130がユーザ511からの入力コードを、キー群を備えた入力部131によって取得するものとした。一方、入力部131は表示部132と一体化されタッチパネルを用いたソフトウェアキー群を備えたものであってもよい。入力部131は、画像読取部と文字認識部を備え、ユーザ511が紙面に文字で記載した登録コードを画像読取部で読み取り、文字認識部で文字列に変換したものを入力コードとして取得するように構成してもよい。文字認識部も、印刷装置130に設ける代わりに印刷装置管理サーバ140、あるいはこれらと通信可能な他のサーバに設けるように構成しても良い。
In the above description, in S214, the
また、印刷装置130がWebサーバ機能を備え、ユーザ511が不図示の端末装置を用いてWebサーバにアクセス可能とするよう構成してもよい。この場合、端末装置上で動作するWebブラウザーが印刷装置130のネットワーク通信部134を経由してWebサーバにアクセスして、入力コードを入力するための画面を取得し、端末装置上のWebブラウザー内に表示する。ユーザ511が入力コードを入力するための画面に対して登録コードを入力すると、端末装置は、印刷装置130のネットワーク通信部134経由でWebサーバへ登録コードを入力コードとして送信する。Webサーバが端末装置上のWebブラウザーから送信された入力コードを受信するよう構成することにより、Webサーバが印刷装置130上の入力部131として機能する。
Further, the
以上では、音声端末110と対応付ける機器(デバイス)として印刷装置130を用いる例について説明したが、機器としてはネットワーク通信部を備えるデジタルカメラ、テレビジョン受像機、その他の家電機器を使用することが可能である。この場合も機器が備える操作パネルやリモートコントローラ、撮像部等が入力コードを取得する入力部として機能し、機器のネットワーク通信部を利用することにより同様に、音声端末との対応付けを行うことができる。
In the above, an example in which the
<第2の実施形態>
第1の実施形態では、印刷装置管理サーバ140が発番した登録コードをユーザ511が音声端末110から聞き取り、印刷装置130に対して入力する構成をとった。しかしながら、規則性のない番号等を多数桁記憶するのは、音声端末110から聞き取って印刷装置130に入力するまでの短時間であってもユーザにとっては負担がかかり、間違いを生じる可能性がある。本実施形態では、ユーザ自身が登録コードあるいはその一部を決められるようにし、ユーザの負担軽減を図ることができる。以下、第1の実施形態と異なる点について説明する。
<Second embodiment>
In the first embodiment, the configuration is adopted in which the
本実施形態における音声端末、操作対象機器及びサーバ群を含む情報システムの構成は、図1に示した第1の実施形態における情報システム110と同様であるため、説明を省略する。音声端末管理サーバ120に設けられた連携サーバ管理DB123の内容、印刷装置管理サーバ140に設けられた登録コードDB144および印刷装置管理DB145の内容も、それぞれ図2(a)、(b)、(c)に示した第1の実施形態における説明と同様である。音声端末110に対する音声による操作のしかた、音声による機器操作例のシーケンス図も、それぞれ図3、図4に示した第1の実施形態における説明と同様である。
The configuration of the information system including the voice terminal, the operation target device, and the server group in the present embodiment is the same as that of the
図7は、本実施形態における、音声によって音声端末110と印刷装置130の対応を登録する際の発話例を示す図である。ユーザ511は、音声端末110に対し、操作指示として発話音声701を発話する。発話音声701は、図5に示した第1の実施形態における説明と同様である。これらに対して後述する登録処理が行われ、音声端末110は、ユーザ511に対して仮登録コード要求音声901を出力する。仮登録コード要求音声901に対してユーザ511が仮登録コード911を発話すると、発話された仮登録コード911は一連の登録操作の一部とみなされる。この場合、音声端末管理サーバ120の連携処理部122は、引き続き印刷装置管理サーバ140を連携サーバとしてコマンドを送信し、処理を続行する。本続行される処理により、音声端末110は、ユーザ511に対する応答音声921を出力する。応答音声921の内、登録コード部922には後述の処理で用いる登録コードを音声出力するための文字列が組み込まれる。本登録コードは、後述する登録処理により、仮登録コード911に基づいて生成される。
FIG. 7 is a diagram illustrating an utterance example when registering the correspondence between the
図8は、本実施形態における音声端末110と印刷装置130の対応づけを登録する処理を示すシーケンス図である。S301からS307までの各処理は、図6に示した第1の実施形態におけるS201からS207までの説明と同様である。S308以降で印刷装置管理サーバ140は、S307でのコマンド解釈の結果に従い、S307で受信した音声端末ID114で特定される音声端末110と印刷装置130の対応を登録するための処理を行う。
FIG. 8 is a sequence diagram illustrating a process of registering the association between the
S308で、印刷装置管理サーバ140は、ユーザ511に対して仮登録コードの発話を促す応答音声の文言901に対応する文字データをコマンド処理部141により生成する。さらに、印刷装置管理サーバ140は、応答音声の文言901に対応する文字データを音声端末ID114とともにネットワーク通信部146を用いて音声端末管理サーバ120へ送信する。
In step S308, the printing
S309で、音声端末管理サーバ120は、ネットワーク通信部124を用いて、送信された応答の文言901に対応する文字データと音声端末ID114を受信し、音声処理部121で応答音声データを生成する。S310で、音声端末管理サーバ120は、ネットワーク通信部124を用いて、生成した応答音声データを音声端末ID114で特定される音声端末110へ送信する。
In step S309, the voice
S311で、音声端末110は、ネットワーク通信部113を用いて応答音声データを受信し、音声出力部112を用いてユーザ511へ向けて応答音声901として出力する。この応答音声901によって音声端末110のユーザ511に、仮登録コードの発話を促す。
In step S311, the
応答音声901に応じてS312で、ユーザ511が8桁の仮登録コード911を決め、発話する。S313で、音声端末110は、音声入力部111により発話音声911を取得する。S314で、音声端末110は、ネットワーク通信部113を用いて、発話された仮登録コード911の音声データと音声端末ID114を音声端末管理サーバ120へ送信する。
In step S312, the
S315で、音声端末管理サーバ120は、ネットワーク通信部124で仮登録コード911の音声データと音声端末ID114を受信する。さらに、音声端末管理サーバ120は、音声処理部121で仮登録コード911の音声データに対して音声認識を行い、文字データに変換する。S316で、音声端末管理サーバ120は、先にS305で特定されている印刷装置管理サーバ140のURLを通信先として、仮登録コード911の音声データを元に変換した文字データと音声端末ID114を送信する。
In S315, the voice
S317で、印刷装置管理サーバ140は、ネットワーク通信部146を用いて、S316で送信された仮登録コード911に対応する文字データと音声端末ID114を受信する。S318で、印刷装置管理サーバ140は、登録部142で、仮登録コード911の文字データを元に登録コードを生成する。本実施形態では、登録コードはワンタイムトークンであり、例えば8桁の数字列とする。登録コードには、仮登録コード911をそのまま用いることを基本とする。ただし、登録コードDB144に記憶済みかつ現時点で有効期限日時303に達していない登録コード302の中に仮登録コード911と一致するものが既に存在する場合は、仮登録コード911を元に新たな登録コードを生成する。具体的には、仮登録コード911の一桁以上を変更し、一致するものが存在しないような登録コードが生成される。また、仮登録コード911の桁数が登録コードの桁数である8桁に満たない場合は、登録コードDB144の有効期限内の項目に一致する登録コードが存在しないものとなるように文字を追加する。仮登録コード911の桁数が登録コードの桁数である8桁を超える場合は、8桁となるように末尾の文字を削除する。該削除の結果、登録コードDB144の有効期限内の項目に一致するものが存在していた場合には、一致する登録コードが存在しないものに変更する。さらに、登録部142は、生成した登録コードに有効期限日時を設定し、生成した登録コードとともに登録コードDB144に記憶する。有効期限日時は、例えば登録コード生成の30分後とする。
In S317, the printing
S319で、印刷装置管理サーバ140は、S318で生成した登録コードをユーザ511へ通知する応答音声の文言921に対応する文字データをコマンド処理部141により生成する。さらに、印刷装置管理サーバ140は、ネットワーク通信部146を用いて、応答文言921の文字データと音声端末ID114を音声端末管理サーバ120へ送信する。
In S319, the printing
S320で、音声端末管理サーバ120は、ネットワーク通信部124を用いて、送信された応答音声の文言921の文字データと音声端末ID114を受信し、音声処理部121で応答音声921の音声データを生成する。S321で、音声端末管理サーバ120は、ネットワーク通信部124を用いて、生成した応答音声データを音声端末ID114で特定される音声端末110へ送信する。
In step S320, the voice
S322で、音声端末110は、ネットワーク通信部113を用いて応答音声データを受信し、音声出力部112を用いてユーザ511へ向けて応答音声921を出力する。この応答音声921によって音声端末110のユーザ511に、新規登録コードが伝達される。
In step S322, the
以後、S323〜S328は、第1の実施形態の図8におけるS213〜S218の説明と同様である。本処理によって、音声端末110の音声端末ID114と印刷装置130の印刷装置ID135との対応付けが印刷装置管理サーバ140の印刷装置管理DB145に登録される。以後、音声端末110のユーザ511が図3の発話音声501を発話した際に、図4の処理により印刷装置管理DB145が参照され、上記登録された対応付けを用いて所望の印刷装置130で印刷を行うことができる。
Thereafter, S323 to S328 are the same as the description of S213 to S218 in FIG. 8 of the first embodiment. By this processing, the correspondence between the
本実施形態では、印刷装置管理サーバ140の登録部142は、ユーザ511が発話した仮登録コード911に基づいて登録コードを生成する。このことにより不規則に生成された登録コードを用いる場合に比べてワンタイムトークンを印刷装置130へ入力するユーザの負担を軽減することができる。
In the present embodiment, the
<第3の実施形態>
本実施形態では、印刷装置と音声端末の対応付けの際に、第1登録コード、第2登録コードの2種類の登録コードを用いる。印刷装置130から第1登録コードを出力してユーザに音声端末110へ音声入力させ、音声端末110から第2登録コードを音声出力してユーザに印刷装置130へ入力させる。このような手順を取ることにより、実際に音声端末110や印刷装置130を操作しているユーザ以外の者が無作為に多数の登録コードを入力するなどの方法により不正な対応付けが行われる危険性を低減することができる。以下、第1及び第2の実施形態と異なる点について説明する。
<Third embodiment>
In the present embodiment, two types of registration codes, a first registration code and a second registration code, are used when associating a printing device with a voice terminal. The first registration code is output from the
本実施形態における音声端末、操作対象の機器及びサーバ群を含む情報システム100の構成は図1に示した第1及び第2の実施形態におけるものと同様であるため説明を省略する。音声端末管理サーバ120に設けられた連携サーバ管理DB123の内容も図2に示した第1及び第2の実施形態におけるものと同様であり説明を省略する。
The configuration of the
本実施形態では、印刷装置管理サーバ140に設けられた登録コードDB144に、第1登録コードテーブル1101と第2登録コードテーブル1201を設ける。図9(a)は、第1登録コードテーブル1101の内容の一例を示す図である。図9(a)に示すように、印刷装置ID1111、第1登録コード1112および有効期限日時1113が相互に対応付けて記憶される。
In the present embodiment, a first registration code table 1101 and a second registration code table 1201 are provided in a
図9(b)は、第2登録コードテーブル1201の内容の一例を示す図である。図9(b)に示すように、印刷装置ID1211、音声端末ID1212、第2登録コード1213、有効期限日時1214が相互に対応付けて記憶される。第1登録コードテーブル1101、第2登録コードテーブル1201は、後述の処理で音声端末110と印刷装置130との対応付けを登録する際に用いられる。印刷装置管理サーバ140の登録部142は、定期的な処理により例えば一日に一度、登録コードDB144の第1登録コードテーブル1101、第2登録コードテーブル1201から、有効期限日時1113、1214が過ぎた項目をそれぞれ削除する。
FIG. 9B is a diagram showing an example of the contents of the second registration code table 1201. As shown in FIG. 9B, a
図9(c)は、印刷装置管理サーバ140に設けられた印刷装置管理DB145の内容の一例を示す図である。印刷装置管理DB145には、音声端末ID1301、印刷装置ID1302の対応付けと、個々の対応付けが完了しているか否かを示す登録完了フラグ1303とを記憶する。例えば、項目1311では、音声端末ID「V0000004」と印刷装置ID「P1000002」との対応付けが記憶されているが、後述の処理が完了しておらず対応付けはまだ無効であり、登録完了フラグ1303は無効を意味する「FALSE」となっている。一方、項目1312では、音声端末ID「V0000001」と印刷装置ID「P1000001」との対応付け処理が既に完了しており、登録完了フラグ1303が有効を意味する「TRUE」となっている。
FIG. 9C is a diagram illustrating an example of the contents of the printing
本実施形態における音声端末110を介して音声による機器操作をする際の発話例、音声による機器操作の処理動作を示すシーケンス図はそれぞれ図3、図4に示した第1及び第2の実施形態における説明と同様である。ただし、図4におけるS108の処理は、以下のようになる。印刷装置管理サーバ140のコマンド処理部141が印刷装置管理DB145へアクセスし、音声端末ID114に対応付けられた印刷装置ID135を取得する際、登録完了フラグ1303が「TRUE」であるものだけを対象に検索する。これにより登録処理が未完了である音声端末110と印刷装置130の組み合わせで機器操作が行われることを阻止することができる。
A sequence example showing an utterance example when operating a device by voice via the
図10は、本実施形態において、音声によって音声端末110と印刷装置130の対応づけを登録する際の発話例を示す図である。本実施形態では、第1登録コード、第2登録コードをユーザに対してそれぞれ登録番号、登録フレーズという語で表現する。ユーザ511は、後述する手順で印刷装置130を操作して第1登録コードである登録番号を取得する。その後、ユーザ511は、音声端末110に対して発話音声701によって操作指示を発話する。発話音声701は、図5に示した第1及び第2の実施形態におけるものと同様である。これらに対して後述する登録処理が行われ、音声端末110は、ユーザ511に対して第1登録コードである登録番号の発話を促す、第1登録コード要求音声1401を出力する。
FIG. 10 is a diagram illustrating an example of utterance when registering the association between the
第1登録コード要求音声1401に対してユーザ511が第1登録コードである登録番号1411を発話すると、本発話1411は一連の登録操作の一部とみなされる。引き続き、印刷装置管理サーバ140を連携サーバとしてコマンドを送信し、処理が続行される。本続行される処理により、音声端末110は、ユーザ511に対する応答音声1421を出力する。応答音声1421の内、第2登録コード部1422には後述の処理で用いる、第2登録コードである登録フレーズを音声出力するための文字列が組み込まれる。
When the
図11および図12は、本実施形態における音声端末110と印刷装置130の対応づけを登録する処理のシーケンス図であり、図12は図11の続きである。図11のS401で、音声端末110のユーザ511は、印刷装置130の入力部131に対して登録開始のための入力操作を行う。例えば、印刷装置130の表示部132に操作メニューを表示し、ユーザ511による入力部131の操作を受付け、操作メニューの中から音声端末との対応付けを開始するコマンドの選択を受け付ける。S402で、印刷装置130は、入力部131によってユーザ511からの入力を取得する。入力の取得を受け、S403で、印刷装置130は、ネットワーク通信部134を用いて、印刷装置を特定する情報である印刷装置ID135を印刷装置管理サーバ140へ送信する。
11 and 12 are sequence diagrams of a process for registering the association between the
S404で、印刷装置管理サーバ140は、ネットワーク通信部146を用いて、送信された印刷装置ID135を受信し、登録部142により第1登録コードである登録番号を生成する。本実施形態では、登録番号は第1のワンタイムトークンであり、例えば8桁の数字列とする。登録部142は、登録コードDB144の第1登録コードテーブル1101に記憶済みかつ現時点で有効期限日時1113に達していない第1登録コード1111のいずれとも一致しない新規第1登録コードを生成する。さらに、登録部142は、生成した登録コードに有効期限日時を設定し、生成した登録コードとともに登録コードDB144の第1登録コードテーブル1101に印刷装置ID135と対応付けて記憶する。有効期限日時は、例えば第1登録コード生成の30分後とする。S405で、印刷装置管理サーバ140は、ネットワーク通信部146を用いて、印刷装置130へ第1登録コードを送信する。
In S404, the printing
S406で、印刷装置130は、ネットワーク通信部134を用いて第1登録コードを受信する。S407で、印刷装置130は、印刷部133を用いて、受信した第1登録コードを記録媒体に印刷する。本実施形態では、この印刷によって音声端末110のユーザ511に、第1登録コードを通知する。なお、印刷に限らず例えば印刷装置130の表示部132に第1登録コードが表示されても良い。
In S406, the
S408で、ユーザ511が図10に示す発話音声701を音声端末110に対する操作指示として発話する。S409〜S414の各処理は、図6に示した第1の実施形態におけるS202からS207までの説明と同様である。S415以降で印刷装置管理サーバ140は、S414でのコマンド解釈の結果に従い、音声端末110と印刷装置130の対応づけを登録するための処理を行う。
In S408, the
S415で、印刷装置管理サーバ140は、ユーザ511に対して第1登録コードの発話を促す応答音声の文言1401に対応する文字データをコマンド処理部141により生成する。さらに、印刷装置管理サーバ140は、文言1401に対応する文字データを音声端末ID114とともにネットワーク通信部146を用いて音声端末管理サーバ120へ送信する。
In S415, the printing
S416で、音声端末管理サーバ120は、ネットワーク通信部124を用いて、送信された応答の文言1401に対応する文字データと音声端末ID114を受信し、音声処理部121で応答音声の音声データを生成する。S417で、音声端末管理サーバ120は、ネットワーク通信部124を用いて、生成した応答音声の音声データを音声端末ID114で特定される音声端末110へ送信する。
In step S416, the voice
S418で、音声端末110は、ネットワーク通信部113を用いて応答音声の音声データを受信し、音声出力部112を用いてユーザ511へ向けて応答音声1401を出力する。この応答音声1401によって音声端末110のユーザ511に、第1登録コードである登録番号の発話を促す。
In step S418, the
応答音声1401に応じて図12のS419で、ユーザ511が第1登録コードである登録番号1411を発話すると、S420で、音声端末110は、音声入力部111により発話音声1411を第1入力コードの発話音声として取得する。第1入力コードは、第1登録コードである登録番号が発話されるべきものである。続くS421で、音声端末110は、ネットワーク通信部113を用いて、発話された第1入力コード1411の音声データと音声端末ID114を音声端末管理サーバ120へ送信する。
When the
S422で、音声端末管理サーバ120は、ネットワーク通信部124で第1入力コード1411の音声データと音声端末ID114を受信する。さらに、音声端末管理サーバ120は、音声処理部121で第1入力コード1411の音声データに対して音声認識を行い文字データに変換する。S423で、音声端末管理サーバ120は、先にS412で特定されている印刷装置管理サーバ140のURLを通信先として、第1入力コード1411を元に変換した文字データと音声端末ID114を送信する。
In S422, the voice
S424で、印刷装置管理サーバ140は、ネットワーク通信部146を用いて、S423で送信された第1入力コード1411に対応する文字データと音声端末ID114を受信する。さらに、印刷装置管理サーバ140は、登録部142により登録コードDB144の第1登録コードテーブル1101へアクセスする。登録部142は、有効期限日時1113に達していない項目の中から受信した第1入力コード1411の値に一致する第1登録コード1112を含む項目を検索する。該検索により、第1入力コード1411の値に対応付けられた印刷装置ID1111の値として印刷装置ID135を取得する。S425で、印刷装置管理サーバ140は、登録部142により印刷装置管理DB145にアクセスする。第1登録コードに対応付けられた印刷装置ID135と受信した音声端末IDの値114とを対応付けてそれぞれ音声端末ID1301、印刷装置ID1302として記憶する。この時、登録完了フラグ1303は、未完了であることを示す「FALSE」とし、まだ音声端末110と印刷装置130との対応付けが完了していないことを示す。
In step S424, the printing
S426で、印刷装置管理サーバ140は、登録部142で、第2登録コードである登録フレーズの文字データを生成する。本実施形態では、登録フレーズは第2のワンタイムトークンであり、例えば6桁の英字列とする。登録部142は、登録コードDB144の第2登録コードテーブル1201に記憶済みかつ現時点で有効期限日時1214に達していない登録コード1213のいずれとも一致しない新規の第2登録コードを生成する。さらに登録部142は、生成した第2登録コードに有効期限日時を設定し、生成した第2登録コードとともに印刷装置ID135、音声端末ID114と対応付けて登録コードDB144の第2登録コードテーブル1201に記憶する。有効期限日時は、例えば第2登録コード生成の30分後とする。
In step S426, the printing
S427で、印刷装置管理サーバ140は、S426で生成した第2登録コードをユーザ511へ通知する応答音声の文言1421の文字データをコマンド処理部141により生成する。さらに、印刷装置管理サーバ140は、ネットワーク通信部146を用いて、応答文言1421の文字データと音声端末ID114を音声端末管理サーバ120へ送信する。
In S427, the printing
S428で、音声端末管理サーバ120は、ネットワーク通信部124を用いて、送信された応答音声の文言1421の文字データと音声端末ID114を受信し、音声処理部121で応答音声1421の音声データを生成する。S429で、音声端末管理サーバ120は、ネットワーク通信部124を用いて、生成した応答音声の音声データを音声端末ID114で特定される音声端末110へ送信する。
In step S428, the voice
S430で、音声端末110は、ネットワーク通信部113を用いて応答音声データを受信し、音声出力部112を用いてユーザ511へ向けて応答音声1421を出力する。この応答音声1421によって、音声端末110のユーザ511に、新規第2登録コードである登録フレーズが伝達される。
In S430, the
S431で、ユーザ511は、応答音声1421に応じて第2登録コードを印刷装置130の入力部131に対して入力する。S432で、印刷装置130は、入力部131を介したユーザ511からの入力を第2入力コードとして取得する。該第2入力コードは、第2登録コードに対応する。続くS433で、印刷装置130は、ネットワーク通信部134を用いて、印刷装置ID135と第2入力コードを印刷装置管理サーバ140へ送信する。
In S431, the
S434では、印刷装置管理サーバ140は、ネットワーク通信部146を用いて、送信された印刷装置ID135と第2入力コードを受信する。S434で、印刷装置管理サーバ140の登録部142は、登録コードDB144の第2登録コードテーブル1201へアクセスする。登録部142は、有効期限日時1214に達していない項目の第2登録コード1213の中から、受信した第2入力コードに合致する値を含む項目を検索する。該検索により第2入力コードに対応付けられた印刷装置ID1211の値である印刷装置ID135、音声端末ID1212の値である音声端末ID114を取得する。S436で、印刷装置管理サーバ140の登録部142は、印刷装置管理DB145にアクセスする。登録部142は、音声端末ID114と印刷装置ID135を含む項目を検索し、該項目の登録完了フラグ1303を更新し、登録完了を示す値「TRUE」とする。
In S434, the printing
以上の処理により、音声端末110の音声端末ID114と印刷装置130の印刷装置ID135の有効な対応付けが印刷装置管理サーバ140の印刷装置管理DB145に登録される。以後、音声端末110のユーザ511が図3の発話をした際に、図4の処理により印刷装置管理DB145が参照され、上記登録された対応付けを用いて所望の印刷装置で印刷を行うことができる。
Through the above processing, the effective association between the
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
(Other Examples)
The present invention supplies a program for realizing one or more functions of the above-described embodiments to a system or an apparatus via a network or a storage medium, and one or more processors in a computer of the system or the apparatus read and execute the program. This processing can be realized. Further, it can also be realized by a circuit (for example, an ASIC) that realizes one or more functions.
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROM、DVDなどを用いることができる。 As a storage medium for supplying the program code, for example, a flexible disk, hard disk, optical disk, magneto-optical disk, CD-ROM, CD-R, magnetic tape, nonvolatile memory card, ROM, DVD, or the like can be used. it can.
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施例の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOperating System(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施例の機能が実現される場合も含まれることは言うまでもない。 When the computer executes the readout program code, not only the functions of the above-described embodiments are realized, but also an Operating System (OS) running on the computer based on the instruction of the program code. It goes without saying that a part or all of the actual processing is performed and the function of the above-described embodiment is realized by the processing.
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書きこまれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。 Further, after the program code read from the storage medium is written into the memory provided on the function expansion board inserted into the computer or the function expansion unit connected to the computer, the function is executed based on the instruction of the program code. It goes without saying that the CPU included in the expansion board or the function expansion unit performs part or all of the actual processing, and the processing realizes the functions of the above-described embodiments.
110 音声端末: 120 音声端末管理サーバ: 130 印刷装置: 140 印刷装置管理サーバ 110 voice terminal: 120 voice terminal management server: 130 printing device: 140 printing device management server
Claims (17)
前記デバイスと前記音声端末とを対応づけて登録するための登録コマンドが前記音声端末で音声入力されると、前記登録に関する登録コードを生成する生成手段と、
前記生成手段により生成された前記登録コードを前記デバイスに対応する入力部を介して入力するようユーザに指示する第1指示手段と、
前記登録コマンドの音声入力がされた前記音声端末の識別情報と、前記登録コードが入力された前記入力部に対応する前記デバイスの識別情報と、を取得する取得手段と、
前記デバイスで入力された登録コードを用いて、前記取得手段により取得された前記音声端末の識別情報と前記デバイスの識別情報とを対応づけて登録する登録手段と、
を備えることを特徴とする音声制御システム。 A voice control system including a voice terminal, a device operable by a command input by voice at the voice terminal, and a server,
When a registration command for registering the device and the voice terminal in association with each other is voice-inputted by the voice terminal, generation means for generating a registration code related to the registration,
First instruction means for instructing a user to input the registration code generated by the generation means via an input unit corresponding to the device;
Acquisition means for acquiring the identification information of the voice terminal to which the voice of the registration command has been input, and the identification information of the device corresponding to the input unit to which the registration code has been input,
Using a registration code input by the device, a registration unit for registering the identification information of the voice terminal acquired by the acquisition unit and the identification information of the device in association with each other,
A voice control system comprising:
前記登録手段は、前記入力部で入力された登録コードに対応づけられた前記音声端末の識別情報を検索し、該検索された前記音声端末の識別情報と、前記取得手段により取得された前記デバイスの識別情報とを対応づけて登録する、
ことを特徴とする請求項1に記載の音声制御システム。 A storage unit that stores the registration code generated by the generation unit and the identification information of the voice terminal acquired by the acquisition unit in association with each other,
The registration unit searches for the identification information of the voice terminal associated with the registration code input by the input unit, and the identification information of the searched voice terminal and the device acquired by the acquisition unit. Register with the identification information of
The voice control system according to claim 1, wherein:
前記データは、前記第2指示手段による指示に従って音声入力された前記仮の登録コードに対応する、
ことを特徴とする請求項3に記載の音声制御システム。 Second instruction means for instructing the user to input a temporary registration code by voice using the voice terminal,
The data corresponds to the temporary registration code that is voice-input according to the instruction by the second instruction means.
The voice control system according to claim 3, wherein:
前記生成手段は、前記第3指示手段による指示に従って音声入力された前記第2登録コードに対応するデータに基づいて、前記登録コードを生成する、
ことを特徴とする請求項1に記載の音声制御システム。 Third instruction means for instructing the user to input a second registration code by voice on the voice terminal,
The generating unit generates the registration code based on data corresponding to the second registration code that is voice-input according to an instruction from the third instruction unit;
The voice control system according to claim 1, wherein:
前記第2登録コードを出力する出力手段、をさらに備え、
前記第3指示手段は、前記出力手段により出力された前記第2登録コードを読み上げて前記音声端末で音声入力するよう前記ユーザに指示する、
ことを特徴とする請求項8に記載の音声制御システム。 The device comprises:
Output means for outputting the second registration code,
The third instructing means instructs the user to read out the second registration code output by the output means and to input voice by the voice terminal,
The voice control system according to claim 8, wherein:
音声入力された前記登録コマンドに対応するデータを前記音声端末の識別情報とともに前記サーバに送信する第1送信手段、をさらに備え、
前記取得手段は、前記第1送信手段により送信された前記音声端末の識別情報を取得する、
ことを特徴とする請求項1乃至10のいずれか1項に記載の音声制御システム。 The voice terminal,
First transmitting means for transmitting data corresponding to the registration command input by voice to the server together with the identification information of the voice terminal,
The acquiring means acquires the identification information of the voice terminal transmitted by the first transmitting means,
The voice control system according to any one of claims 1 to 10, wherein:
入力された前記登録コードの情報を前記デバイスの識別情報とともに前記サーバに送信する第2送信手段、をさらに備え、
前記取得手段は、前記第2送信手段により送信された前記デバイスの識別情報を取得する、
ことを特徴とする請求項1乃至11のいずれか1項に記載の音声制御システム。 The device comprises:
Second transmission means for transmitting the information of the input registration code to the server together with the identification information of the device, further comprising:
The obtaining means obtains the identification information of the device transmitted by the second transmitting means,
The voice control system according to claim 1, wherein:
前記検索手段により検索された前記デバイスの識別情報に対応する前記デバイスに前記指示コマンドに対応する処理を実行させる制御手段と、
をさらに備えることを特徴とする請求項1乃至12のいずれか1項に記載の音声制御システム。 When an instruction command to the device is input by voice at the voice terminal, a search unit that searches for the identification information of the device registered by the registration unit in association with the identification information of the voice terminal;
Control means for causing the device corresponding to the identification information of the device searched by the search means to execute processing corresponding to the instruction command;
The voice control system according to any one of claims 1 to 12, further comprising:
前記デバイスと前記音声端末とを対応づけて登録するための登録コマンドが前記音声端末で音声入力されると、前記登録に関する登録コードを生成する生成工程と、
前記生成工程において生成された前記登録コードを前記デバイスに対応する入力部を介して入力するようユーザに指示する指示工程と、
前記登録コマンドの音声入力がされた前記音声端末の識別情報と、前記登録コードが入力された前記入力部に対応する前記デバイスの識別情報と、を取得する取得工程と、
前記デバイスで入力された登録コードを用いて、前記取得工程において取得された前記音声端末の識別情報と前記デバイスの識別情報とを対応づけて登録する登録工程と、
を有することを特徴とする登録方法。 A registration method executed in a voice control system including a voice terminal, a device operable by a command input by voice at the voice terminal, and a server,
When a registration command for registering the device and the voice terminal in association with each other is voice-inputted by the voice terminal, a generation step of generating a registration code related to the registration,
An instruction step of instructing a user to input the registration code generated in the generation step via an input unit corresponding to the device;
Acquisition step of acquiring the identification information of the voice terminal in which the voice of the registration command has been input, and the identification information of the device corresponding to the input unit in which the registration code has been input,
Using a registration code input by the device, a registration step of registering the identification information of the voice terminal acquired in the acquisition step and the identification information of the device in association with each other,
A registration method comprising:
前記デバイスと前記音声端末とを対応づけて登録するための登録コマンドが前記音声端末で音声入力されると、前記登録に関する登録コードを生成する生成手段と、
前記生成手段により生成された前記登録コードを前記デバイスに対応する入力部を介して入力させるよう前記音声端末を制御する制御手段と、
前記登録コマンドの音声入力がされた前記音声端末の識別情報と、前記登録コードが入力された前記入力部に対応する前記デバイスの識別情報と、を取得する取得手段と、
前記デバイスで入力された登録コードを用いて、前記取得手段により取得された前記音声端末の識別情報と前記デバイスの識別情報とを対応づけて登録する登録手段と、
を備えることを特徴とする情報処理装置。 An audio terminal and an information processing apparatus capable of communicating with a device operable by a command input by voice at the audio terminal,
When a registration command for registering the device and the voice terminal in association with each other is voice-inputted by the voice terminal, generation means for generating a registration code related to the registration,
Control means for controlling the voice terminal to input the registration code generated by the generation means via an input unit corresponding to the device;
Acquisition means for acquiring the identification information of the voice terminal to which the voice of the registration command has been input, and the identification information of the device corresponding to the input unit to which the registration code has been input,
Using a registration code input by the device, a registration unit for registering the identification information of the voice terminal acquired by the acquisition unit and the identification information of the device in association with each other,
An information processing apparatus comprising:
前記デバイスと前記音声端末とを対応づけて登録するための登録コマンドが前記音声端末で音声入力されると、前記登録に関する登録コードを生成する生成工程と、
前記生成工程において生成された前記登録コードを前記デバイスに対応する入力部を介して入力させるよう前記音声端末を制御する制御工程と、
前記登録コマンドの音声入力がされた前記音声端末の識別情報と、前記登録コードが入力された前記入力部に対応する前記デバイスの識別情報と、を取得する取得工程と、
前記デバイスで入力された登録コードを用いて、前記取得工程において取得された前記音声端末の識別情報と前記デバイスの識別情報とを対応づけて登録する登録工程と、
を有することを特徴とする登録方法。 A voice terminal and a registration method executed in an information processing apparatus capable of communicating with a device operable by a command input by voice at the voice terminal,
When a registration command for registering the device and the voice terminal in association with each other is voice-inputted by the voice terminal, a generation step of generating a registration code related to the registration,
A control step of controlling the voice terminal to input the registration code generated in the generation step via an input unit corresponding to the device;
Acquisition step of acquiring the identification information of the voice terminal in which the voice of the registration command has been input, and the identification information of the device corresponding to the input unit in which the registration code has been input,
Using a registration code input by the device, a registration step of registering the identification information of the voice terminal acquired in the acquisition step and the identification information of the device in association with each other,
A registration method comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018144027A JP2020021253A (en) | 2018-07-31 | 2018-07-31 | Voice control system, information processing apparatus, registration method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018144027A JP2020021253A (en) | 2018-07-31 | 2018-07-31 | Voice control system, information processing apparatus, registration method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020021253A true JP2020021253A (en) | 2020-02-06 |
Family
ID=69588545
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018144027A Pending JP2020021253A (en) | 2018-07-31 | 2018-07-31 | Voice control system, information processing apparatus, registration method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020021253A (en) |
-
2018
- 2018-07-31 JP JP2018144027A patent/JP2020021253A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4881915B2 (en) | Printing system, print management server, control method therefor, and program | |
JP7173761B2 (en) | PRINTING SYSTEM, CONTROL METHOD, SERVER SYSTEM | |
US11023790B2 (en) | System, method for controlling the same, and method for controlling server | |
US11006007B2 (en) | Control system, server system, and control method | |
JP2003051887A (en) | Control system and control method | |
US11140284B2 (en) | Image forming system equipped with interactive agent function, method of controlling same, and storage medium | |
JP2003244183A (en) | Network equipment and remote control relay server | |
JP2007128323A (en) | Information processor, authentication processing method and computer program | |
US11785150B2 (en) | Image processing system, image processing apparatus, and image processing method | |
JP2014115704A (en) | Mobile terminal, printing system, information processing method, print processing method, and program | |
US7010635B1 (en) | Method and apparatus for using a person digital assistant to interface with a communication station | |
JP2020021253A (en) | Voice control system, information processing apparatus, registration method, and program | |
US11588944B2 (en) | Communication system, server system, and communication apparatus, relating to permission to execute a newly added function | |
US11647129B2 (en) | Image forming system equipped with interactive agent function, method of controlling same, and storage medium | |
CN112181321B (en) | Communication system, control method, and non-transitory computer-readable storage medium | |
JP7361509B2 (en) | Peripheral device management system, printing device control system, control method, printing control device and program | |
US11106414B2 (en) | Printing system, printing method, information processing apparatus | |
JP2002236572A (en) | Print system | |
JP2023003642A (en) | Control system, server system, control method, and program | |
JP2020123905A (en) | Image forming apparatus | |
CN111708507B (en) | Sound information processing device and recording medium | |
EP4075256B1 (en) | Method, apparatus, and system for controlling voice print | |
JP2020020943A (en) | Voice control system, information processing apparatus, control method, and program | |
JP2020173666A (en) | Voice terminal, printer, system, and program | |
JP2022045258A (en) | Voice setting system, voice setting support device and voice setting support program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20210103 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210113 |