JP7192348B2

JP7192348B2 - 制御装置、制御システム及びプログラム

Info

Publication number: JP7192348B2
Application number: JP2018178334A
Authority: JP
Inventors: 弘一佐藤
Original assignee: Fuji Xerox Co Ltd; Fujifilm Business Innovation Corp
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2018-09-25
Filing date: 2018-09-25
Publication date: 2022-12-20
Anticipated expiration: 2038-09-25
Also published as: CN110941414A; US20200098365A1; US11373648B2; JP2020052485A

Description

本発明は、制御装置、制御システム及びプログラムに関する。

特許文献１は、制御対象となる機器と、空間内の複数箇所に配置され、使用者の音声を検出するマイクロホンと、各マイクロホンが検出した音声データを集める集音手段と、集音手段に入力された音声データの内容を解析する音声認識手段と、集音手段に入力された音声データの大きさから、使用者の発声方向を検出する分布分析手段と、音声認識手段によって解析された音声データの内容と、分布分析手段によって解析された使用者の発声方向に基づいて、制御対象となる機器と操作内容を決定する推論手段と、推論手段により決定された機器と操作内容に基づいて、制御対象となる機器に制御信号を発する機器制御手段と、を具えた音声制御システムを開示する。

特許文献２は、操作対象の複数機器と、前記複数機器の中の一つの機器に対応付けられたリモコンと、前記複数機器を音声操作する統合制御機器を備え、前記リモコンは、ユーザの音声を入力する収音部と、ユーザのリモコン操作情報を生成する操作情報生成部を備え、前記統合制御機器は、前記音声から機器名と操作名を認識結果として出力する音声認識部と、前記機器名と前記リモコン操作情報に基づいて、操作対象機器を特定する機器特定部と、前記操作名から前記特定された機器に対する操作内容を特定する操作特定部を備え、前記機器特定部は、前記認識結果において、前記機器名が抽出されなかった場合、前記リモコン操作情報を用いて操作対象機器を特定するようにした音声操作システムを開示する。

特開２００２－９１４９１号公報特開２０１５－２０１７３９号公報

ところで、ユーザが音声により機器を制御しようとする場合、制御の対象となり得る対象機器が複数あると、該複数の対象機器からユーザが使用すべき対象機器を特定する必要がある。

本発明は、ユーザが音声により対象機器を指定しない場合であっても対象機器を特定して制御することができる制御装置、制御システム及びプログラムを提供することを目的としている。

請求項１に係る本発明は、音声による又は音声から生成された操作指示を受け付ける第１の受付手段と、対象機器に対応して設けられた音声入力部に入力された前記音声の音量に関する情報を受け付ける第２の受付手段と、前記第２の受付手段により受け付けた音量に関する情報により対象機器を特定する対象機器特定手段と、前記対象機器特定手段により特定された対象機器に前記第１の受付手段により受け付けた操作指示に基づく操作命令を送信する送信手段と、を有する制御装置である。
である。

請求項２に係る本発明は、前記対象機器特定手段は、前記音声入力部に入力された音声の音量が最も大きい対象機器を特定する請求項１記載の制御装置である。

請求項３に係る本発明は、前記対象機器特定手段は、前記第２の受付手段により、予め定められた時間内に複数の対象機器の音声入力部から音声の音量に関する情報を受け付けた場合に、前記対象機器特定手段は前記音声入力部に入力された音声の音量が最も大きい対象機器を特定する請求項２記載の制御装置である。

請求項４に係る本発明は、前記第１の受付手段により受け付けられる操作指示に特定の語句が含まれる場合に、前記対象機器特定手段は前記音声入力部に入力された音声の音量が最も大きい対象機器を特定する請求項２記載の制御装置である。
なお、ここで、特定の語句とは、対象機器を一意的に特定する語句を除いて対象機器が任意であることを示す語句であり、例えば「どれでも」「適当」等が挙げられる。

請求項５に係る本発明は、前記第１の受付手段により受け付けられる操作指示に対象機器の指定が含まれない場合に、前記対象機器特定手段は、前記音声入力部に入力された音声の音量が最も大きい対象機器を特定する請求項２記載の制御装置である。

請求項６に係る本発明は、前記第１の受付手段により受け付けられる操作指示には距離に関する特定の語句が含まれ、前記対象機器特定手段は、前記距離に関する特定の語句と、前記第２の受付手段により受け付けた音量に関する情報とにより対象機器を特定する請求項１記載の制御装置である。
なお、ここで、距離に関する特定の語句とは、ユーザからの距離を示す概念的な語句である。ユーザから近い場合は、「この」「こちら」「これ」「近くの」等であり、これよりも遠い場合は、「その」「そちら」「それ」等である。さらに遠い場合は、「あの」「あちら」「あれ」「遠くの」等である。

請求項７に係る本発明は、前記特定の語句が近称の場合は、前記第２の受付手段により受け付けた音声の音量が他のものより大きい対象機器を特定する請求項６記載の制御装置である。
なお、ここで、近称とは、ユーザからの距離が近い物や場所を示す指示語であり、例えば「これ」「こちら」「これ」等である。

請求項８に係る本発明は、前記特定の語句が遠称の場合は、前記第２の受付手段により受け付けた音声の音量が他のものより小さい対象機器を特定する請求項６または７記載の制御装置ある。
なお、ここで、遠称とは、ユーザからの遠い物や場所を示す指示語であり、例えば「あれ」「あちら」「あの」等である。

請求項９に係る本発明は、前記第２の受付手段により受け付けた全ての対象機器に対応した音声の音量が予め定められた値よりも小さい場合は、前記対象機器特定手段はいずれの対象機器も特定しない請求項１記載の制御装置である。

請求項１０に係る本発明は、前記対象機器特定手段は、前記第１の受付手段が音声を受け付けた時刻から予め定められた時間内に前記音声入力部に入力された音声の音量に関する情報を取得した場合に対象機器を特定する請求項１から９のいずれか1項の記載の制御装置である。

請求項１１に係る本発明は、前記第１の受付手段が音声を受け付けた時刻から予め定められた時間内に前記音声入力部に入力された音声に関する情報を取得できない場合は、前記対象機器特定手段はいずれの対象機器も特定しない請求項１から１０いずれか記載の制御装置である。

請求項１２に係る本発明は、音声を受け付ける音声受付装置と、前記音声受付装置により受け付けられた音声に関する情報により対象機器を制御する制御装置と、を有し、制御装置は、前記音声受付装置からの音声による又は音声から生成された操作指示を受け付ける第１の受付手段と、前記対象機器に対応して設けられた音声入力部に入力された前記音声の音量に関する情報を受け付ける第２の受付手段と、前記第２の受付手段により受け付けた音量に関する情報により対象機器を特定する対象機器特定手段と、前記対象機器特定手段により特定された対象機器に前記第１の受付手段により受け付けた操作指示に基づく操作命令を送信する送信手段と、を有する制御システムである。

請求項１３に係る本発明は、前記音声受付装置は音声を出力する音声出力部をさらに有し、前記音声出力部は前記操作命令の送信先の対象機器を識別する識別情報を音声として出力する請求項１２に記載の制御システムである。

請求項１４に係る本発明は、音声による又は音声から生成された操作指示を受け付けるステップと、対象機器に対応して設けられた音声入力部に入力された前記音声の音量に関する情報を受け付けるステップと、受け付けた音量に関する情報により対象機器を特定するステップと、特定された対象機器に、受け付けた操作指示に基づく操作命令を送信するステップと、を有するコンピュータに実行させるためのプログラムである。

請求項１１２、１４いずれかに係る本発明によれば、ユーザが音声により対象機器を指定しない場合であっても対象機器を特定して制御することができる。

請求項２に係る本発明によれば、請求項１に係る本発明の効果に加えて、受け付けた音声の音量が最も大きい対象機器を特定することができる。

請求項３に係る本発明によれば、請求項２に係る本発明の効果に加えて、予め定められた時間内に受け付けた場合に対象機器を特定することができる。

請求項４に係る本発明によれば、請求項２に係る本発明の効果に加えて、ユーザにより特定の語句が発話された場合に対象機器を特定することができる。

請求項５に係る本発明によれば、請求項２に係る本発明の効果に加えて、ユーザによる対象機器の指定が無い場合に対象機器を特定することができる。

請求項６に係る本発明によれば、請求項１に係る本発明の効果に加えて、ユーザが発話する距離に関する特定の語句と音声の音量とにより対象機器を特定することができる。

請求項７に係る本発明によれば、請求項６に係る本発明の効果に加えて、ユーザが近称を発話した場合は、受け付けた音声の音量が最も大きい対象機器を特定することができる。

請求項８に係る本発明によれば、請求項６又は７に係る本発明の効果に加えて、ユーザが遠称を発話した場合は、音量が最も小さい対象機器を特定することができる。

請求項９に係る本発明によれば、請求項１に係る本発明の効果に加えて、入力されたあらゆる音量の音声により対象機器を特定する場合と比較して、対象機器の特定精度を向上させることができる。

請求項１０に係る本発明によれば、請求項１から９に係る本発明の効果に加えて、第１の受付手段により受け付ける操作指示と第２の受付手段により受け付けた音声の音量とを時間により紐付けることができる。

請求項１１に係る本発明によれば、請求項１から９に係る本発明の効果に加えて、第１の受付手段により受け付ける操作指示と第２の受付手段により受け付けた音声の音量とに時間的ずれがある場合、紐付けるのを禁止することができる。

請求項１３に係る本発明によれば、請求項１２に係る本発明の効果に加えて、ユーザが次回同じ対象機器を指定しようとする際に、当該対象機器の識別情報を用いて指定させることができる。

本発明の実施形態に係る制御システム全体を示す概略図である。本発明の実施形態に係る制御装置のハードウエアを示すブロック図である。本発明の実施形態に用いた画像形成装置の制御部のハードウエアを示すブロック図である。本発明の実施形態に係る制御システムの機能を示すブロック図である。本発明の実施形態に用いた画像形成装置において、操作対象機器を自動判定するための動作フローを示すフローチャートである。本発明の実施形態に係る制御装置の動作フローを示すフローチャートである。

次に、本発明の実施の形態について図面を参照して詳細に説明する。
図１は、本発明の実施形態に係る制御システム１０の全体を示す。

制御システム１０は、ユーザが発話する音声を受け付ける音声受付装置１２を有する。この音声受付装置１２は、例えばスマートスピーカであり、インターネットを介して外部サーバ１４に接続されている。
なお、スマートスピーカとは、ＡＩ（人口知能）アシスタント機能を持つスピーカである。

外部サーバ１４は、受け付けた音声をＡＩによって認識する。また、この外部サーバ１４には、自社で開発可能なＡＰＩ（アプリケーションプログラミングインタフェースのこと。ソフトウェアコンポーネントが互いにやりとりするのに使用するインターフェイスの仕様である。）が搭載されている。外部サーバ１４は、このＡＰＩを介して音声受付装置１２から受け付けた音声から機器を操作する操作指示を生成する。例えばユーザが「コピーを実行して」と発話した場合、外部サーバ１４は、コピー実行関数を呼び出すように操作指示を後述する制御サーバ１６に送信する。

例えば３台の画像形成装置１８ａ，１８ｂ，１８ｃは、プリント機能、ファクシミリ機能、コピー機能、スキャン機能等を有する、いわゆる複合機である。画像形成装置１８ａがユーザから最も近くに配置され、画像形成装置１８ｃがユーザから最も遠くに配置され、画像形成装置１８ｂが画像形成装置１８ａと画像形成装置１８ｃとの間に配置されている。これら画像形成装置１８ａ，１８ｂ，１８ｃに対応して音声入力部（マイクロホン）２０ａ，２０ｂ，２０ｃが設けられている。ユーザが音声を発すると、音声入力部２０ａ，２０ｂ，２０ｃではユーザに近い程に音声の音量が大きくなる。例えば音声入力部２０ａに受け付けられる音声の音量が６５デシベル、音声入力部２０ｂに受け付けられる音声の音量が４０デシベル、音声入力部２０ｃに受け付けられる音声の音量が３０デシベルとなる。
なお、音声入力部２０ａ，２０ｂ，２０ｃでは音声の音量を絶対値として検知する必要はなく、それぞれの音量の相対値が検知できるようにしてもよい。。

画像形成装置１８ａ，１８ｂ，１８ｃは、ネットワーク２２を介して制御サーバ１６に接続されている。ネットワーク２２は、ローカルネットワークでもよいし、インターネットであってもよい。

画像形成装置１８ａ，１８ｂ，１８ｃは、音声入力部２０ａ，２０ｂ，２０ｃからユーザが発話する音声を受け付けると、受け付けた音声の音量、現在の時刻及びＩＤ（識別情報の一例であり、画像形成装置を一意的に特定するデータ、例えばＭＡＣアドレスや名称）を制御サーバ１６へ送信する。以下、受け付けた音声の音量、現在の時刻及びＩＤをまとめて「発話情報」と呼ぶことがある。

なお、この実施形態においては、画像形成装置１８ａ，１８ｂ，１８ｃを介して音声入力部２０ａ，２０ｂ，２０ｃから音声の音量を制御サーバ１６へ送信するようにしているが、音声入力部２０ａ，２０ｂ，２０ｃから音声の音量を直接制御サーバ１６へ送るようにしてもよい。音声入力部２０ａ，２０ｂ，２０ｃは画像形成装置１８ａ，１８ｂ，１８ｃに対応して配置されていればよく、画像形成装置から離れて設けられていてもよい。また、音声の音量を抽出することなく、直接音声を制御サーバ１６へ送るようにして制御サーバ１６側で音量を抽出するようにしてもよい。

制御サーバ１６は、ここでは対象機器である画像形成装置１８ａ，１８ｂ，１８ｃを制御するための制御装置として構成されている。この制御サーバ１６には発話情報を管理する発話情報データベース２４が接続されている。この実施形態においては、制御サーバ１６は外部サーバ１４から呼び出された時刻と、画像形成装置１８ａ，１８ｂ，１８ｃからの発話情報を受け付けた時刻とを比較し、同時刻における音声の音量が最も大きい、即ち、ユーザから最も近い画像形成装置１８ａに対して操作命令を送信する。ここで操作命令は、制御サーバ１６から画像形成装置１８ａに操作指示に基づく操作を実行させるための命令（コマンド）である。

制御サーバ１６は、図２に示すように、ＣＰＵ２６、メモリ２８、記憶装置３０及びネットワークインターフェイス３２を有し、これらＣＰＵ２６、メモリ２８、記憶装置３０及びネットワークインターフェイス３２がバス３３を介して接続されている。

ＣＰＵ２６は、メモリ２８に格納された制御プログラムに基づいて予め定められた処理を実行する。記憶装置３０は、例えばハードディスクから構成され、必要とされるソフトウエアやデータが記憶されている。ネットワークインターフェイス３２は、前述したネットワーク２２を介してデータを入出力する。

前述した画像形成装置１８ａ，１８ｂ，１８ｃは、図３に示すように、制御サーバ１６と同様に、コンピュータ構成の制御部本体３４を有する。

即ち、制御部本体３４は、ＣＰＵ３６、メモリ３８、記憶装置４０、ネットワークインターフェイス４２、音声入力部インターフェイス４４及び機器制御部４６を有し、これらＣＰＵ３６、メモリ３８、記憶装置４０、ネットワークインターフェイス４２、音声入力部インターフェイス４４及び機器制御部４６がバス４７を介して接続されている。

ＣＰＵ３６は、メモリ３８に格納された制御プログラムに基づいて予め定められた処理を実行する。記憶装置４０は、例えばハードディスクから構成され、必要とされるソフトウエアやデータが記憶されている。ネットワークインターフェイス４２は、前述したネットワーク２２を介してデータを入出力する。音声入力部インターフェイス４４は、前述した音声入力部２０ａ，３０ｂ，２０ｃとの間で音声の入出力を行う。機器制御部４６は、画像形成装置１８ａ，１８ｂ，１８ｃ内の各機器を制御してプリント、ファクシミリ送受信、コピー、スキャン等を実行する。

図４は、制御システム１０の機能を示すブロック図である。
なお、図４においては、前述した外部サーバ１４は省略されている。

音声受付装置１２は、音声入力部４８、操作指示送信部５０、回答音声受信部５２及び音声出力部５４を有する。音声入力部４８は、ユーザの発話音声を入力する。操作指示送信部５０は、音声入力があった場合に操作指示を制御サーバ１６へ送信する。回答音声受信部５２は、操作指示に対応する回答音声情報を受信する。音声出力部５４は、回答音声受信部５２で受信した回答音声をユーザに対し出力する。

画像形成装置１８ａ，１８ｂ，１８ｃは、前述した音声入力部２０ａ，２０ｂ，２０ｃの他に、時刻取得部５６、発話情報送信部５８、操作情報受信部６０及び操作実行部６２を有する。時刻取得部５６は、現在時刻を取得する。発話情報送信部５８は、音声入力部２０ａ，２０ｂ，２０ｃから入力された音声の音量と、音声入力があった時刻及び画像形成装置１８ａ，１８ｂ，１８ｃのＩＤを制御サーバ１６へ送信する。操作命令受信部６０は、制御サーバ１６から操作命令を受信する。操作命令の受信は、画像形成装置１８ａ，１８ｂ，１８ｃから定期的に制御サーバ１６に操作命令が存在するかを確認し、制御サーバ１６に操作命令があれば制御サーバ１６から操作命令が送信される。

制御サーバ１６は、前述した発話情報データベース２４の他に、操作指示受信部６４、時刻取得部６６、発話情報検索部６８、回答音声情報送信部７０、発話情報受信部７２及び操作命令送信部７４を有する。操作指示受信部６４は、音声受付装置１２からの操作指示を受信する。時刻取得部６６は、現在の時刻を取得する。

発話情報検索部６８は、発話情報データベース２４を検索して、時刻取得部６６から取得した時刻と比較し、音声受付装置１２に向けてユーザが発話した時刻と同時刻の発話情報（時刻、音量、ＩＤ）を検索する。なお、ここで、同時刻とは、予め定められた範囲内の時間をいう。この発話情報検索部６８は、検索された発話情報の中で音量が最大のものを検索結果として返す。

回答音声情報送信部７０は、操作指示に対応する回答を音声受付装置１２に送信する。発話情報取得部７２は、画像形成装置１８ａ，１８ｂ，１８ｃから送信された発話情報（時刻、音量、ＩＤ）を受信する。操作命令送信部７４は、画像形成装置１８ａ，１８ｂ，１８ｃで実行させるための操作命令を画像形成装置１８ａ，１８ｂ，１８ｃに送信する。

次に画像形成装置１８ａ，１８ｂ，１８ｃにおいて、対象機器を自動判定するための動作フローについて説明する。

図５に示すように、画像形成装置１８ａ，１８ｂ，１８ｃは、まずステップＳ１０において、常時音声を録音する状態にする。次のステップＳ１２においては、音声入力があるか否かを判定する。このステップＳ１２において、音声入力が無いと判定された場合はステップＳ１０に戻り、音声入力があるまで待機する。ステップＳ１２において、音声入力があったと判定された場合は、ステップＳ１４に進み、現在時刻を取得する。次のステップＳ１６においては、ステップＳ１０で録音した音声から音量に関する情報を取得する。音量に関する情報とは、音量そのものであってもよいし、相対的な値であってもよい。このステップＳ１６において、音量に関する情報を取得すると、次のステップＳ１８に進み、発話情報（時刻、音量、ＩＤ）を制御サーバ１６へ送信し、さらにステップＳ１０に戻って上記動作を繰り返す。この発話情報は、制御サーバ１６の発話情報データベース２４に記憶される。

次に制御サーバ１６の動作フローについて説明する。

図６に示すように、制御サーバ１６は、まずステップＳ２０において、音声受付装置１２からの操作指示を受信できる状態にする。次のステップＳ２２においては、音声受付装置１２からの操作指示があるか否かを判定する。操作指示が無いと判定された場合はステップＳ２０に戻り、操作指示があるまで待機する。ステップＳ２２において、操作指示があったと判定された場合はステップＳ２４に進む。

ステップＳ２４においては、現在時刻を取得する。次のステップＳ２６においては、記憶されていた前回までの対象機器候補リストをクリアする。次のステップＳ２８においては、発話情報データベース２４に次の発話情報があるか否かを判定する。

このステップＳ２８において、発話情報データベース２４に次の発話情報があると判定された場合は、ステップＳ３０に進む。このステップＳ３０においては、発話情報データベース２４より発話情報１件を取得する。次のステップＳ３２においては、ステップＳ３０で取得した発話情報の時刻とステップＳ２４で取得した現在時刻（音声受付装置１２からの操作指示を受信した時刻）とを比較する。このステップＳ３２において、発話情報の時刻と現在時刻とが同一であると判定された場合はステップＳ３４に進み、発話情報の音量とＩＤを対象機器候補リストに追加する。ここで、発話情報の時刻と現在時刻とが同一とは、発話情報の時刻と現在時刻とが予め定められた時間内にあることを意味する。ステップＳ３２において、発話情報の時刻と現在時刻とが同一ではないと判定された場合、及びステップＳ３４の処理が終了した場合は、ステップＳ２８に戻り、発話情報データベース２４に次の発話情報があるか否かを判定する。

一方、ステップＳ２８において、発話情報データベース２４に次の発話情報が無いと判定された場合は、ステップＳ３６に進み、対象機器候補リストの項目数は１以上であるか否かを判定する。このステップＳ３６において、対象機器候補リストの項目数が１以上ではない（対象機器候補リストに対象機器候補が無い）と判定された場合は、ステップＳ３８に進み、画像形成装置を特定できなかった旨を音声受付装置１２に送信する。音声受付装置１２は、これを受けて画像形成装置を特定できなかった旨を音声出力部５４より音声で出力する。
なお、画像形成装置１８ａ，１８ｂ，１８ｃの音声入力部２０ａ，２０ｂ，２０ｃからの発話情報が得られなかった場合にステップＳ３６で対象機器候補が無いと判定されるが、音声入力部２０ａ，２０ｂ，２０ｃからの発話情報が得られたとしても音量が予め定められた値よりも小さい場合にも対象機器候補が無いと判定されるようにしてもよい。

ステップＳ３６において、対象機器候補リストの項目数が１以上であると判定された場合は、ステップＳ４０へ進む。このステップＳ４０においては、対象機器候補リストの中で音量が最大の発話情報を抽出する。次のステップＳ４２において、ステップＳ４０で抽出した最大の発話情報を有する画像形成装置へ操作命令を送信し、さらにステップＳ４４に進み、操作を実行した旨を応答するように音声受付装置１２に送信する。音声受付装置１２はこれを受けて、音声出力部５４よりユーザから最も近い画像形成装置に操作命令が送信された旨を音声で出力する。ステップ３８又はステップＳ４４の処理が終了すると、ステップＳ２０へ戻り、操作指示待ちとなる。

ステップＳ４０においては、音量が最大の発話情報を送信した画像形成装置へ操作命令を送信するようにしたが、ユーザが発話する音声に画像形成装置を一意的に特定する語句、例えば画像形成装置に付された名称等が含まれる場合は、名称に対応する画像形成装置へ操作命令を送信してもよい。
また、画像形成装置を一意に特定する語句ではなく、距離に関する特定の語句、例えば「この」「こちら」「これ」等の近称があれば、受け付けた音声の音量が最大の画像形成装置へ操作命令を送信し、「あの」「あちら」「あれ」等の遠称があれば、音量が最小の画像形成装置へ操作命令を送信し、「その」「そちら」「それ」等の中称があれば、音量が中間の画像形成装置へ操作命令を送信する。
なお、中称とは、ユーザからの距離が近称と遠称との間の距離の物や場所を示す指示語である。

また、距離に関する特定の語句が発話された場合に、予め定めた範囲の音量の音声を受け付けた画像形成装置へ操作命令を送信するようにしてもよい。例えば、ユーザが発話する音声に近称が含まれていれば６０デシベル以上、中称が含まれていれば４０デシベル以上６０デシベル未満、遠称が含まれていれば４０デシベル未満の音量の音声を受け付けた画像形成装置へ操作命令を送信するようにしてもよい。

また、ユーザが発話する音声に任意であることを示す特定の語句、例えば「どれでも」「適当」といった語句が含まれる場合に、音量が最大の発話情報を送信した画像形成装置へ操作命令を送信するようにしてもよい。この場合に、ユーザが発話する音声に特定の語句が含まれなければ、対象機器を特定しないようにしてもよい。

また、ステップＳ４４においては、単に画像形成装置に操作命令を送信した旨を音声受付装置１２に音声で出力させるようにしているが、さらに操作命令を送信した画像形成装置の名称やＩＤを音声で出力させるようにしてもよい。

なお、上記実施形態においては、外部サーバを介して制御サーバに操作指示を送信するようにしているが、音声受付装置から直接制御サーバに操作指示を送信するようにしてもよい。
また、上記実施形態においては、対象機器を画像形成装置としたが、これに限らず、対象機器には電気製品や自動車等が含まれる。

１０制御システム
１２音声受付装置
１４外部サーバ
１６制御サーバ
１８ａ，１８ｂ，１８ｃ画像形成装置
２０ａ，２０ｂ，２０ｃ音声入力部
２２ネットワーク
２４発話情報データベース
２６ＣＰＵ
２８メモリ
３０記憶装置
３２ネットワークインターフェイス
３３バス
３４制御部
３６ＣＰＵ
３８メモリ
４０記憶装置
４２ネットワークインターフェイス
４４音声入力部インターフェイス
４６機器制御部
４８音声入力部
５０操作指示送信部
５２回答音声受信部
５４音声出力部
５６時刻取得部
５８発話情報送信部
６０操作命令受信部
６２操作実行部
６４操作指示受信部
６６時刻取得部
６８発話情報検索部
７０回答音声情報送信部
７２発話情報受信部
７４操作命令送信部

Claims

音声による又は音声から生成された操作指示を受け付ける第１の受付手段と、
対象機器に対応して設けられた音声入力部に入力された前記音声の音量に関する情報を受け付ける第２の受付手段と、
前記第２の受付手段により受け付けた音量に関する情報により対象機器を特定する対象機器特定手段と、
前記対象機器特定手段により特定された対象機器に前記第１の受付手段により受け付けた操作指示に基づく操作命令を送信する送信手段と、
を有し、
前記第１の受付手段により受け付けられる操作指示には距離に関する特定の語句が含まれ、前記対象機器特定手段は、前記距離に関する特定の語句と、前記第２の受付手段により受け付けた音量に関する情報とにより対象機器を特定する制御装置。
前記対象機器特定手段は、前記音声入力部に入力された音声の音量が最も大きい対象機器を特定する請求項１記載の制御装置。
前記対象機器特定手段は、前記第２の受付手段により、予め定められた時間内に複数の対象機器の音声入力部から音声の音量に関する情報を受け付けた場合に、前記対象機器特定手段は前記音声入力部に入力された音声の音量が最も大きい対象機器を特定する請求項２記載の制御装置。
前記第１の受付手段により受け付けられる操作指示に特定の語句が含まれる場合に、前記対象機器特定手段は前記音声入力部に入力された音声の音量が最も大きい対象機器を特定する請求項２記載の制御装置。
前記第１の受付手段により受け付けられる操作指示に対象機器の指定が含まれない場合に、前記対象機器特定手段は、前記音声入力部に入力された音声の音量が最も大きい対象機器を特定する請求項２記載の制御装置。
前記対象機器特定手段は、前記第２の受付手段により複数の対象機器の音声入力部から音声の音量に関する情報を受け付けた場合に、前記距離に関する特定の語句が近称の場合は、前記第２の受付手段により受け付けた音声の音量が他のものより大きい対象機器を特定する請求項１記載の制御装置。
前記対象機器特定手段は、前記第２の受付手段により複数の対象機器の音声入力部から音声の音量に関する情報を受け付けた場合に、前記距離に関する特定の語句が遠称の場合は、前記第２の受付手段により受け付けた音声の音量が他のものより小さい対象機器を特定する請求項１または６記載の制御装置。
前記第２の受付手段により受け付けた全ての対象機器に対応した音声の音量が予め定められた値よりも小さい場合は、前記対象機器特定手段はいずれの対象機器も特定しない請求項１から７のいずれか１項に記載の制御装置。
前記対象機器特定手段は、前記第１の受付手段が操作指示を受け付けた時刻から予め定められた時間内に前記音声入力部に入力された音声の音量に関する情報を取得した場合に対象機器を特定する請求項１から８のいずれか１項に記載の制御装置。
前記第１の受付手段が操作指示を受け付けた時刻から予め定められた時間内に前記音声入力部に入力された音声の音量に関する情報を取得できない場合は、前記対象機器特定手段はいずれの対象機器も特定しない請求項１から９いずれか１項に記載の制御装置。
音声を受け付ける音声受付装置と、
前記音声受付装置により受け付けられた音声の音量に関する情報により対象機器を制御する制御装置と、
を有し、
制御装置は、
前記音声受付装置からの音声による又は音声から生成された操作指示を受け付ける第１の受付手段と、
前記対象機器に対応して設けられた音声入力部に入力された前記音声の音量に関する情報を受け付ける第２の受付手段と、
前記第２の受付手段により受け付けた音量に関する情報により対象機器を特定する対象機器特定手段と、
前記対象機器特定手段により特定された対象機器に前記第１の受付手段により受け付けた操作指示に基づく操作命令を送信する送信手段と、
を有し、
前記第１の受付手段により受け付けられる操作指示には距離に関する特定の語句が含まれ、前記対象機器特定手段は、前記距離に関する特定の語句と、前記第２の受付手段により受け付けた音量に関する情報とにより対象機器を特定する制御システム。
前記音声受付装置は音声を出力する音声出力部をさらに有し、前記音声出力部は前記操作命令の送信先の対象機器を識別する識別情報を音声として出力する請求項１１に記載の制御システム。
音声による又は音声から生成された操作指示を受け付けるステップと、
対象機器に対応して設けられた音声入力部に入力された前記音声の音量に関する情報を受け付けるステップと、
受け付けた音量に関する情報により対象機器を特定するステップと、
特定された対象機器に、受け付けた操作指示に基づく操作命令を送信するステップと、
をコンピュータに実行させるためのプログラムであって、
受け付けられる操作指示には距離に関する特定の語句が含まれ、前記距離に関する特定の語句と、受け付けた音量に関する情報とにより対象機器を特定するプログラム。