以下、本発明の実施の形態について図面を参照して詳細に説明する。
実施の形態1.
図1は、本発明の実施の形態1に係る音声操作支援システムを包含した音声操作システム1の全体構成を示す図である。音声操作システム1は、家屋Hに設置された家電機器2を音声操作により制御できるようにしたシステムであり、1又は複数の家電機器2と、音声入出力装置3と、ホームゲートウェイ4と、音声処理装置5と、機器制御装置6と、音声操作支援装置7とを備える。また、実施の形態1に係る音声操作支援システムは、ユーザによる音声操作を支援するためのシステムであり、音声入出力装置3と、ホームゲートウェイ4と、音声処理装置5と、音声操作支援装置7とにより構成される。
各家電機器2は、エアコン、テレビ、IH(Induction Heating)調理器等であり、家屋H(敷地も含む)内に設置される。各家電機器2は、いわゆるIoT(Internet of Things)機器、情報家電、ネット家電、スマート家電等と称され、ブロードバンドルータとしての機能を有するホームゲートウェイ4を介してインターネットに接続される。
音声入出力装置3は、本発明に係る音声入出力装置の一例である。音声入出力装置3は、ユーザの発話により入力された音声に基づいて様々なサービスを提供する装置であり、いわゆるAIスピーカ(スマートスピーカともいう。)である。音声入出力装置3は、図2に示すように、マイク30と、A/Dコンバータ31と、スピーカ32と、通信インタフェース33と、CPU(Central Processing Unit)34と、ROM(Read Only Memory)35と、RAM(Random Access Memory)36と、二次記憶装置37とを備える。これらの構成部は、バス38を介して相互に接続される。
マイク30は、ユーザが発した音声を入力し、入力した音声からアナログ音声信号を生成して、A/Dコンバータ31に出力する。A/Dコンバータ31は、マイク30から出力されたアナログ音声信号からノイズを除去し、デジタル音声信号を生成し、CPU34に供給する。スピーカ32は、CPU34から供給されたデジタル音声信号に対応する音声を出力する。
通信インタフェース33は、ホームゲートウェイ4と有線又は無線にて通信接続し、ホームゲートウェイ4を介して、インターネットに接続される音声処理装置5と通信するためのネットワークカードを備える。
CPU34は、当該音声入出力装置3を統括的に制御する。CPU34によって実現される音声入出力装置3の機能の詳細については後述する。ROM35は、複数のファームウェア及びこれらのファームウェアの実行時に使用されるデータを記憶する。RAM36は、CPU34の作業領域として使用される。
二次記憶装置37は、EEPROM(Electrically Erasable Programmable Read-Only Memory)、フラッシュメモリ等の読み書き可能な不揮発性の半導体メモリ又はHDD(Hard Disk Drive)を含んで構成される。二次記憶装置37は、音声入出力プログラムと、かかる音声入出力プログラムの実行時に使用されるデータとを記憶する。音声入出力プログラムは、ユーザの音声を入力し、入力した音声に基づく音声データを音声処理装置5に送信する処理と、音声処理装置5から音声データを受信し、受信した音声データに基づく音声を出力する処理とが記述されたプログラムである。
音声入出力装置3は、機能的には、図3に示すように、音声入力部300と、送信部301と、受信部302と、音声出力部303とを備える。これらの機能部は、CPU34が二次記憶装置37に記憶されている上記の音声入出力プログラムを実行することで実現される。
音声入力部300は、ユーザが発話した音声を入力し、入力した音声に基づく音声データを生成する。詳細には、音声入力部300は、ユーザの音声を示すアナログ音声信号にPCM(Pulse Code Modulation: パルス符号変調)を適用してデジタル音声信号に変換し、さらに非可逆圧縮を適用することにより音声データを生成する。
送信部301は、音声入力部300により生成された音声データをホームゲートウェイ4を介して音声処理装置5に送信する。
受信部302は、音声処理装置5から送信された音声データをホームゲートウェイ4を介して受信する。音声出力部303は、受信部302により受信された音声データに基づく音声を出力する。
図1に戻り、音声処理装置5は、本発明に係る音声処理装置の一例である。音声処理装置5は、音声入出力装置3のメーカ、販売会社等によって設置され、運用されるサーバコンピュータであり、インターネットに接続される。音声処理装置5は、音声入出力装置3及び後述する機器制御装置6と協調して、家電機器2に対する音声操作を実現する。また、音声処理装置5は、音声入出力装置3及び後述する音声操作支援装置7と協調して、音声操作を支援するサービスをユーザに提供する。音声処理装置5は、図4に示すように、通信インタフェース50と、CPU51と、ROM52と、RAM53と、二次記憶装置54とを備える。これらの構成部は、バス55を介して相互に接続される。
通信インタフェース50は、インターネットに接続して、ホームゲートウェイ4、機器制御装置6、音声操作支援装置7等の他の装置と通信するための装置である。CPU51は、当該音声処理装置5を統括的に制御する。CPU51によって実現される音声処理装置5の機能の詳細については後述する。
ROM52は、複数のファームウェアとこれらのファームウェアの実行時に使用されるデータを記憶する。RAM53は、CPU51の作業領域として使用される。
二次記憶装置54は、EEPROM、フラッシュメモリ等の読み書き可能な不揮発性の半導体メモリ又はHDDを含んで構成される大容量の記憶装置である。二次記憶装置54は、図5に示すように、音声処理プログラム540と、機器操作情報DB541と、顧客情報DB542と、顧客機器情報DB543とを記憶する。なお、この他にも、二次記憶装置54は、音声認識のためのデータベースである音声認識DB等を記憶する。
音声処理プログラム540は、音声操作サービスを実現するための音声処理に関するプログラムである。音声処理プログラム540には、音声データ解析処理、機器操作関連処理、操作支援関連処理等が記述されている。
音声データ解析処理には、音声入出力装置3から送信された音声データを上記の音声認識DBを使用して解析し、音声の内容を取得する処理が含まれる。機器操作関連処理には、取得した音声の内容に基づいて家電機器2に対する操作情報を生成し、機器制御装置6に送信する処理と、機器制御装置6からの結果情報に基づく音声データを音声入出力装置3に送信する処理とが含まれる。操作支援関連処理には、家電機器2の操作についてのユーザからの問い合わせに対する回答を要求するための要求情報を音声操作支援装置7に送信する処理と、音声操作支援装置7からの回答情報に基づく音声データを音声入出力装置3に送信する処理とが含まれる。
機器操作情報DB541は、家電機器2の機種毎に、当該機種に対応する全ての操作に関する情報が登録されたデータベースである。詳細には、図6に示すように、機器操作情報DB541には、家電機器2の機種毎に、操作番号5410、カテゴリ5411、操作名称5412、設定内容5413等の項目を含むレコードが登録されている。本実施の形態において、機種とは、当該家電機器2が備える本質的な機能に基づいた種類(例えば、エアコン、テレビ、IH調理器等)を意味する。
操作番号5410には、操作番号が格納される、操作番号とは、当該機種において、操作毎に一意に割り振られた番号である。カテゴリ5411には、操作番号5410に格納された操作番号に対応するカテゴリ名が格納される。カテゴリ名とは、当該機種における当該操作の性質上の分類を示す名称である。例えば、家電機器2の機種がエアコンの場合、カテゴリ5411には、“基本操作”、“省エネ操作”及び“見守り操作”の内の何れか1つが格納される。また、例えば、家電機器2の機種がテレビの場合、カテゴリ5411には、“基本操作”、“省エネ操作”及び“ダビング操作”の内の何れか1つが格納される。
なお、本実施の形態において、カテゴリ名が“基本操作”に該当する操作(例えば、エアコンでは、1:運転開始、2:運転終了)は、当該機種に属する家電機器2に対するメーカ間で共通の操作であることを意味する。つまり、“基本操作”に該当する操作については、当該音声操作サービスに協賛する全てのメーカの当該機種に属する全ての家電機器2で対応可能であることを意味する。
一方、カテゴリ名が“基本操作”以外に該当する操作(例えば、エアコンでは、3:スマートストップ、4:ハイブリッド運転設定、5:高温見守り、6:低温見守り、7:快眠見守り)は、上記の全てのメーカの内の何れか1つのメーカの当該機種に属する家電機器2で対応可能である、即ち、当該メーカの固有の操作であることを意味する。
操作名称5412には、操作名称が格納される。操作名称とは、操作番号5410に格納された操作番号に対応する操作の名称であり、ユーザが当該操作を行うために発話する音声の内容でもある。設定内容5413には、設定内容が格納される。設定内容とは、当該操作の際、当該家電機器2に対して設定が可能な内容である。機器操作情報DB541は、例えば、OAuth2.0により、音声処理装置5と機器制御装置6とが適宜連携動作することで、機器制御装置6が保持する機器操作情報DBとリンクされる。これにより、機器操作情報DB541の内容が更新される。
図5に戻り、顧客情報DB542は、音声操作サービスに加入している各顧客の個人情報が登録されたデータベースである。顧客情報DB542には、各顧客の氏名、住所、性別、生年月日、当該顧客宅(即ち、当該顧客の家屋H)に設置されている音声入出力装置3のIP(Internet Protocol)アドレス等の情報が登録されている。
顧客機器情報DB543は、各顧客宅に設置されている全ての家電機器2に関する情報が登録されたデータベースである。詳細には、図7に示すように、顧客機器情報DB543には、顧客毎に、機器ID5430、機種名称5431、型名5432、設置場所5433、対応操作5434等の項目を含むレコードが当該顧客宅に設置されている全ての家電機器2の台数分登録されている。
機器ID5430には、当該家電機器2の機器IDが格納される。機器IDとは、当該音声操作サービスにおいて、各家電機器2を識別するために割り振られたID(identification)である。機種名称5431には、当該家電機器2が属する機種の名称(例えば、“エアコン”、“テレビ”、“IH調理器”等)が格納される。型名5432には、当該家電機器2の型名(型番ともいう。)が格納される。設置場所5433には、当該家電機器2の設置場所を示す名称(例えば、“リビング”、“寝室”、“キッチン”等)が格納される。対応操作5434には、当該家電機器2に対して操作可能な全ての操作の操作番号が格納される。
顧客情報DB542及び顧客機器情報DB543は、例えば、OAuth2.0により、音声処理装置5と機器制御装置6とが適宜連携動作することで、機器制御装置6が保持する顧客情報DB及び顧客機器情報DBとリンクされる。これにより、顧客情報DB542及び顧客機器情報DB543の内容が更新される。
図1に戻り、機器制御装置6は、家電機器2のメーカ、販売会社等によって設置され、運用されるサーバコンピュータであり、インターネットに接続される。機器制御装置6は、音声処理装置5と協調して、家電機器2に対する音声操作を実現する。
機器制御装置6は、図8に示すように、通信インタフェース60と、CPU61と、ROM62と、RAM63と、二次記憶装置64とを備える。これらの構成部は、バス65を介して相互に接続される。
通信インタフェース60は、インターネットに接続して、ホームゲートウェイ4、音声処理装置5等の他の装置と通信するための装置である。CPU61は、当該機器制御装置6を統括的に制御する。CPU61によって実現される機器制御装置6の機能の詳細については後述する。
ROM62は、複数のファームウェアとこれらのファームウェアの実行時に使用されるデータを記憶する。RAM63は、CPU61の作業領域として使用される。
二次記憶装置64は、EEPROM、フラッシュメモリ等の読み書き可能な不揮発性の半導体メモリ又はHDDを含んで構成される大容量の記憶装置である。二次記憶装置64は、図9に示すように、機器制御プログラム640と、機器操作情報DB641と、顧客情報DB642と、顧客機器情報DB643とを記憶する。
機器制御プログラム640は、音声処理装置5と協調して家電機器2に対する音声操作を実現するためプログラムである。機器制御プログラム640には、音声処理装置5からの操作情報に基づいて、対応する家電機器2を制御する処理、当該家電機器2の制御結果を示す結果情報を音声処理装置5に送信する処理等が記述されている。
機器操作情報DB641は、自社の家電機器2の操作に関する情報が登録されたデータベースである。詳細には、図10に示すように、機器操作情報DB641には、家電機器2の機種毎に、型名6410、操作番号6411、操作名称6412、設定内容6413等の項目を含むレコードが登録されている。型名6410には、当該家電機器2の型名が格納される。操作番号6411には、操作番号が格納される。操作名称6412には、操作番号6411に格納された操作番号に対応する操作名称が格納される。設定内容6413には、当該操作に対応する設定内容が格納される。機器操作情報DB641の各レコードの内容は、例えば、図示しないDB構築部により、各機種の家電機器2の取扱説明書のデータから自動的に生成され、各レコードに設定されるようにしてもよい。
上述したように、例えば、OAuth2.0により、機器制御装置6と音声処理装置5とが適宜連携動作することで、機器制御装置6の機器操作情報DB641と、音声処理装置5の機器操作情報DB541とがリンクされる。これにより、音声処理装置5の機器操作情報DB541の内容が更新される。
図9に戻り、顧客情報DB642は、自社の家電機器2の購入者であって、当該音声操作サービスに加入している各顧客の個人情報が登録されたデータベースである。顧客情報DB642には、各顧客の氏名、住所、性別、生年月日等の情報が登録されている。
顧客機器情報DB643は、各顧客宅に設置されている自社の家電機器2に関する情報が登録されたデータベースである。詳細には、図11に示すように、顧客機器情報DB643には、顧客毎に、機器ID6430、機種名称6431、型名6432、設置場所6433、対応操作6434、通信アドレス6435等の項目を含むレコードが当該顧客宅に設置されている自社の家電機器2の台数分登録されている。
機器ID6430には、当該家電機器2に割り振られた機器IDが格納される。機種名称6431には、当該家電機器2が属する機種の名称が格納される。型名6432には、当該家電機器2の型名が格納される。設置場所6433には、当該家電機器2の設置場所を示す名称が格納される。対応操作6434には、当該家電機器2に対して操作可能な全ての操作の操作番号が格納される。通信アドレス6435には、当該家電機器2のIPアドレスが格納される。
家電機器2を購入したユーザは、スマートフォン、タブレット端末等に予めインストールされた音声操作サービスを利用するためのアプリケーションプログラム(以下、音声操作アプリという。)を起動し、自己の個人情報及び家電機器2に関する情報を機器制御装置6に登録するための予め定められた手続(以下、登録手続という。)を行う。これにより、当該ユーザの個人情報及び当該ユーザ宅の家電機器2に関する情報が、当該スマートフォン、タブレット端末等から機器制御装置6に送信される。上記の音声操作アプリは、機器制御装置6、その他のプログラム配布サーバ等から当該スマートフォン、タブレット端末等にダウンロードすることができる。
上記の登録手続において、機種の名称、型名及びIPアドレスは、上記の音声操作アプリを起動したスマートフォン、タブレット端末等によって、ホームゲートウェイ4を介した通信により当該家電機器2から取得される。
上述したように、例えば、OAuth2.0により、機器制御装置6と音声処理装置5とが適宜連携動作することで、機器制御装置6の顧客情報DB642及び顧客機器情報DB643と、音声処理装置5の顧客情報DB542及び顧客機器情報DB543とがリンクされる。これにより、音声処理装置5の顧客情報DB542及び顧客機器情報DB543の内容が更新される。
図1に戻り、音声操作支援装置7は、本発明に係る音声操作支援装置の一例である。音声操作支援装置7は、当該音声操作サービスに協賛する複数のメーカの共同によって、あるいは、第三者機関によって運用されるサーバコンピュータであり、インターネットに接続される。音声操作支援装置7は、音声入出力装置3及び音声処理装置5と協調して、音声操作支援サービスを実現する。音声操作支援装置7は、図12に示すように、通信インタフェース70と、CPU71と、ROM72と、RAM73と、二次記憶装置74とを備える。これらの構成部は、バス75を介して相互に接続される。
通信インタフェース70は、インターネットに接続して、音声処理装置5等の他の装置と通信するための装置である。CPU71は、当該音声操作支援装置7を統括的に制御する。CPU71によって実現される音声操作支援装置7の機能の詳細については後述する。ROM72は、複数のファームウェアとこれらのファームウェアの実行時に使用されるデータを記憶する。RAM73は、CPU71の作業領域として使用される。
二次記憶装置74は、EEPROM、フラッシュメモリ等の読み書き可能な不揮発性の半導体メモリ又はHDDを含んで構成される大容量の記憶装置である。二次記憶装置74は、図13に示すように、音声操作支援プログラム740と、操作説明情報DB741と、機器情報DB742とを記憶する。二次記憶装置74は、本発明に係る記憶装置の一例である。
音声操作支援プログラム740は、音声操作の支援に関する処理が記述されたプログラムである。操作説明情報DB741は、家電機器2の機種毎の各操作について、ユーザに説明するための情報が登録されたデータベースである。詳細には、図14,15に示すように、操作説明情報DB741には、家電機器2の機種毎に、操作番号7410、カテゴリ7411、操作名称7412、概略説明7413、詳細説明7414、注意事項7415等の項目を含むレコードが登録されている。操作説明情報DB741の各レコードの内容は、例えば、図示しないDB構築部により、各機種の家電機器2の取扱説明書のデータから自動的に生成され、各レコードに設定されるようにしてもよい。
操作番号7410には、操作番号が格納される。カテゴリ7411には、操作番号7410に格納された操作番号に対応するカテゴリ名が格納される。操作名称7412には、当該操作番号に対応する操作名称が格納される。概略説明7413には、当該操作についての簡易的な説明を示す情報が格納される。詳細説明7414には、当該操作についての詳細な説明を示す情報が格納される。注意事項7415には、当該操作について注意すべき事項を示す情報が格納される。
図13に戻り、機器情報DB742は、全ての顧客の家電機器2に関する情報が登録されたデータベースである。詳細には、図16に示すように、機器情報DB742には、機器ID7420と、機種名称7421、設置場所7422、対応操作7423等の項目を含むレコードが各顧客宅に設置されている全ての家電機器2の総台数分登録されている。
機器ID7420には、当該家電機器2に割り振られた機器IDが格納される。機種名称7421には、当該家電機器2が属する機種の名称が格納される。設置場所7422には、当該家電機器2の設置場所を示す名称が格納される。対応操作7423には、当該家電機器2に対して操作可能な全ての操作の操作番号が格納される。機器情報DB742は、例えば、OAuth2.0により、音声操作支援装置7と機器制御装置6とが適宜連携動作することで、機器制御装置6が保持する顧客機器情報DB643とリンクされる。これにより、機器情報DB742の内容が更新される。
続いて、音声処理装置5の機能について説明する。図17に示すように、音声処理装置5は、機能的には、音声データ受信部500と、音声データ解析部501と、操作情報生成部502と、操作情報送信部503と、要求情報生成部504と、要求情報送信部505と、結果情報受信部506と、音声データ生成部507と、音声データ送信部508と、回答情報受信部509とを備える。これらの機能部は、CPU51が二次記憶装置54に記憶されている音声処理プログラム540を実行することで実現される。
音声データ受信部500は、本発明に係る音声データ受信手段の一例である。音声データ受信部500は、音声入出力装置3からホームゲートウェイ4を介して送信された音声データを受信する。当該音声データは、本発明に係る第1音声データの一例である。音声データ解析部501は、音声データ受信部500により受信された音声データを解析して、ユーザの発話内容を示すテキストデータ(以下、音声内容データという。)を生成する。音声データ解析部501は、生成した音声内容データが家電機器2に対する操作を示す場合、当該音声内容データを操作情報生成部502に供給する。一方、生成した音声内容データが家電機器2の操作についての問合せを示す場合、音声データ解析部501は、当該音声内容データを要求情報生成部504に供給する。
操作情報生成部502は、音声データ解析部501から供給された音声内容データと、機器操作情報DB541と、顧客情報DB542と、顧客機器情報DB543とに基づいて操作情報を生成する。操作情報には、図18に示すように、機器ID5020、操作番号5021、設定内容5022等の項目が含まれている。機器ID5020には、対象となる家電機器2の機器IDが格納される。操作番号5021には、対象となる操作に対応する操作番号が格納される。設定内容5022には、当該操作においてユーザが指示した設定内容が格納される。
操作情報生成部502は、音声内容データに含まれる場所及び機種のそれぞれを示すキーワードから、当該顧客宅における当該音声操作の対象となる家電機器2を同定する。例えば、音声内容データに、“リビング”及び“エアコン”が含まれている場合、操作情報生成部502は、機器IDが“R111”の家電機器2を当該音声操作の対象の家電機器2として同定する。
また、操作情報生成部502は、同定した家電機器2の機器IDと、音声内容データに含まれる操作名称及び/又は設定内容を示すキーワード(例えば、“運転開始”、“運転終了”、“電源オン”、“電源オフ”、“高温見守りオン”等)とから、操作番号及び/又は設定内容を同定する。図19に、ユーザの発話内容と、生成される操作情報との対応関係の一例を示す。
操作情報送信部503は、操作情報生成部502により生成された操作情報を機器制御装置6に送信する。
要求情報生成部504は、音声データ解析部501から供給された音声内容データと、機器操作情報DB541と、顧客情報DB542と、顧客機器情報DB543とに基づいて要求情報を生成する。要求情報には、図20に示すように、機器ID5040、操作番号5041、カテゴリ5042、要求番号5043等の項目が含まれている。機器ID5040には、対象となる家電機器2の機器IDが格納される。操作番号5041には、対象となる操作に対応する操作番号が格納される。ただし、操作を指定しない問合せの場合、操作番号5041には、予め定めたダミーデータが格納される。
カテゴリ5042には、対象となるカテゴリ名が格納される。ただし、カテゴリを指定しない問合せの場合、カテゴリ5042には、予め定めたダミーデータが格納される。要求番号5043には、要求番号が格納される。要求番号とは、図21に示すように、要求内容毎に一意に割り振られた番号である。
要求情報生成部504は、音声内容データに含まれる場所及び機種のそれぞれを示すキーワードから、当該顧客宅における当該問合せの対象となる家電機器2を同定する。例えば、音声内容データに、“リビング”及び“エアコン”が含まれている場合、要求情報生成部504は、機器IDが“R111”の家電機器2を当該問合せの対象となる家電機器2として同定する。要求情報生成部504は、同定した機器IDを機器ID5040に格納する。
要求情報生成部504は、音声内容データに、操作名称又はカテゴリ名を示すキーワードが存在するか否かを判定する。何れのキーワードも存在しない場合、要求情報生成部504は、要求番号5043に“100”を格納する。また、要求情報生成部504は、操作番号5041及びカテゴリ5042のそれぞれにダミーデータを格納する。
音声内容データにカテゴリ名を示すキーワードが存在する場合、要求情報生成部504は、要求番号5043に“101”を格納する。また、要求情報生成部504は、操作番号5041にダミーデータを格納し、カテゴリ5042に当該カテゴリ名を示すキーワードを格納する。
音声内容データに操作名称を示すキーワードが存在する場合、要求情報生成部504は、同定した家電機器2の機器IDと、当該操作名称とに基づいて、操作番号を同定する。要求情報生成部504は、同定した操作番号を操作番号5041に格納する。要求情報生成部504は、音声内容データに“詳しく”又は“注意事項”が存在するか否かを判定する。何れも存在しない場合、要求情報生成部504は、要求番号5043に“102”を格納し、カテゴリ5042にダミーデータを格納する。
音声内容データに“詳しく”が存在する場合、要求情報生成部504は、要求番号5043に“103”を格納し、カテゴリ5042にダミーデータを格納する。音声内容データに“注意事項”が存在する場合、要求情報生成部504は、要求番号5043に“104”を格納し、カテゴリ5042にダミーデータを格納する。
以上のようにして要求情報生成部504は、ユーザの発話内容に応じた要求情報を生成する。図22に、ユーザの発話内容と、生成される要求情報との対応関係の一例を示す。
要求情報送信部505は、要求情報生成部504が生成した要求情報を音声操作支援装置7に送信する。要求情報生成部504及び要求情報送信部505は、本発明に係る回答要求手段の一例である。
結果情報受信部506は、機器制御装置6から結果情報を受信する。結果情報とは、先に送信した操作情報に従って、対象の家電機器2が正常に操作されたか否かを示す情報である。結果情報受信部506は、受信した結果情報を音声データ生成部507に供給する。音声データ生成部507は、結果情報受信部506から供給された結果情報に基づいて、公知の音声合成処理により音声データを生成し、生成した音声データを音声データ送信部508に供給する。当該音声データは、本発明に係る第2音声データの一例である。音声データ送信部508は、音声データ生成部507から供給された音声データを音声入出力装置3に送信する。音声データ送信部508は、本発明に係る音声データ送信手段の一例である。
回答情報受信部509は、音声操作支援装置7から回答情報を受信する。回答情報とは、先に送信した要求情報に応答して音声操作支援装置7が生成した情報であり、ユーザの問合せに対する回答を示す情報である。回答情報受信部509は、受信した回答情報を音声データ生成部507に供給する。音声データ生成部507は、回答情報受信部509から供給された回答情報に基づいて、公知の音声合成処理により音声データを生成し、生成した音声データを音声データ送信部508に供給する。音声データ送信部508は、音声データ生成部507から供給された音声データを音声入出力装置3に送信する。
図23は、音声処理装置5が実行する音声処理の手順を示すフローチャートである。音声入出力装置3から送信された音声データが音声データ受信部500により受信されると(ステップS101;YES)、音声データ解析部501は、当該音声データを解析して(ステップS102)、音声内容データを生成する。
音声データ解析部501が生成した音声内容データが、家電機器2に対する操作を示す場合(ステップS103;YES)、音声処理装置5は、操作情報生成処理を実行する(ステップS104)。一方、上記の音声内容データが、家電機器2に対する操作を示すものではない、即ち、家電機器2の操作についての問合せを示す場合(ステップS103;NO)、音声処理装置5は、要求情報生成処理を実行する(ステップS105)。
図24は、操作情報生成処理の手順を示すフローチャートである。操作情報生成部502は、音声データ解析部501が生成した音声内容データに、操作情報を生成する際に必要となる情報が不足しているか否かを判定する(ステップS201)。
例えば、音声内容データに、対象となる家電機器2の機種を示すキーワード及び設置場所を示すキーワードの内の何れかが含まれていない場合、操作情報生成部502は、必要となる情報が不足していると判定する。
必要な情報が不足していない場合(ステップS201;NO)、操作情報生成部502は、上述したようにして操作情報を生成する(ステップS202)。操作情報送信部503は、操作情報生成部502が生成した操作情報を機器制御装置6に送信する(ステップS203)。
結果情報受信部506は、機器制御装置6から結果情報を受信する(ステップS204)。音声データ生成部507は、結果情報受信部506が受信した結果情報に基づく音声データを生成する(ステップS205)。
一方、必要な情報が不足している場合(ステップS201;YES)、操作情報生成部502は、不足している情報に関し、ユーザに問い合わせるための問合せ情報を生成する(ステップS206)。例えば、問合せ情報には、“操作対象のエアコンは、リビングのエアコン、寝室のエアコンの内のどちらでしょうか?”等のテキストデータが含まれている。
音声データ生成部507は、操作情報生成部502が生成した問合せ情報に基づく音声データを生成する(ステップS207)。
音声データ送信部508は、音声データ生成部507が生成した音声データを音声入出力装置3に送信する(ステップS208)。その後、図23のフローチャートのステップS101に戻る。
なお、問合せ情報に基づく音声データを音声入出力装置3に送信した場合、ユーザから補足情報を示す回答が得られると、音声処理装置5は、当該補足情報と、先に生成した音声内容データとに基づいて操作情報を生成し、機器制御装置6に送信する。
図25は、要求情報生成処理の手順を示すフローチャートである。要求情報生成部504は、音声データ解析部501が生成した音声内容データに、要求情報を生成する際に必要となる情報が不足しているか否かを判定する(ステップS301)。
例えば、音声内容データに、対象となる家電機器2の機種を示すキーワード及び設置場所を示すキーワードの内の何れかが含まれていない場合、要求情報生成部504は、必要となる情報が不足していると判定する。
必要な情報が不足していない場合(ステップS301;NO)、要求情報生成部504は、上述したようにして要求情報を生成する(ステップS302)。要求情報送信部505は、要求情報生成部504が生成した要求情報を音声操作支援装置7に送信する(ステップS303)。
回答情報受信部509は、音声操作支援装置7から回答情報を受信する(ステップS304)。音声データ生成部507は、回答情報受信部509が受信した回答情報に基づく音声データを生成する(ステップS305)。
一方、必要な情報が不足している場合(ステップS301;YES)、要求情報生成部504は、不足している情報に関し、ユーザに問い合わせるための問合せ情報を生成する(ステップS306)。例えば、問合せ情報には、“お尋ねのエアコンは、リビングのエアコン、寝室のエアコンのうちのどちらでしょうか?”等のテキストデータが含まれている。
音声データ生成部507は、要求情報生成部504が生成した問合せ情報に基づく音声データを生成する(ステップS307)。
音声データ送信部508は、音声データ生成部507が生成した音声データを音声入出力装置3に送信する(ステップS308)。その後、図23のフローチャートのステップS101に戻る。
なお、問合せ情報に基づく音声データを音声入出力装置3に送信した場合、ユーザから補足情報を示す回答が得られると、音声処理装置5は、当該補足情報と、先に生成した音声内容データとに基づいて要求情報を生成し、音声操作支援装置7に送信する。
続いて、機器制御装置6の機能について説明する。図26に示すように、機器制御装置6は、機能的には、操作情報受信部600と、制御指令生成部601と、制御指令送信部602と、応答データ受信部603と、結果情報送信部604とを備える。これらの機能部は、CPU61が機器制御プログラム640を実行することで実現される。
操作情報受信部600は、音声処理装置5から送信された操作情報(図18参照)を受信する。制御指令生成部601は、操作情報受信部600が受信した操作情報と、機器操作情報DB641と、顧客機器情報DB643とに基づいて、対象の家電機器2を制御するための制御指令を生成する。制御指令送信部602は、制御指令生成部601が生成した制御指令を当該家電機器2に送信する。制御指令生成部601は、本発明に係る制御指令生成手段の一例であり、制御指令送信部602は、本発明に係る制御指令送信手段の一例である。
応答データ受信部603は、制御指令送信部602が制御指令を送信した後、送信先の家電機器2から送られてくる応答データを受信する。かかる応答データには、制御指令に従った動作を行ったか否かを示す情報が含まれている。応答データに、制御指令に従った動作を行ったことを示す情報が含まれている場合、応答データ受信部603は、当該家電機器2が正常に操作されたことを結果情報送信部604に通知する。
一方、応答データに、制御指令に従った動作を行っていないことを示す情報が含まれている場合、応答データ受信部603は、当該家電機器2が正常に操作されていないことを結果情報送信部604に通知する。また、応答データ受信部603は、制御指令が家電機器2に送信された後、予め定めた時間が経過しても当該家電機器2から応答データを受信できなかった場合、当該家電機器2が正常に操作されていないことを結果情報送信部604に通知する。
結果情報送信部604は、応答データ受信部603から通知された内容に従った結果情報を音声処理装置5に送信する。
続いて、音声操作支援装置7の機能について説明する。図27に示すように、音声操作支援装置7は、機能的には、要求情報受信部700と、要求情報解析部701と、回答情報生成部702と、回答情報送信部703とを備える。これらの機能部は、CPU71が音声操作支援プログラム740を実行することで実現される。
要求情報受信部700は、音声処理装置5から送信された要求情報(図20参照)を受信する。要求情報解析部701は、要求情報受信部700が受信した要求情報を操作説明情報DB741と、機器情報DB742とを参照して解析する。詳細には、要求情報解析部701は、要求情報の機器ID5040、操作番号5041、カテゴリ5042及び要求番号5043のそれぞれに格納されているデータを取り出す。また、要求情報解析部701は、機器情報DB742を参照して、機器ID5040に格納されている機器IDの家電機器2が対応する全ての操作番号を取得する。
要求情報解析部701は、取り出した各データ(ただし、ダミーデータは除く)と、取得した全ての操作番号とを含む解析結果情報を回答情報生成部702に供給する。また、要求情報解析部701は、当該要求情報で示される問合せ内容の正否をチェックし、チェック結果を回答情報生成部702に通知する。詳細には、操作番号5041に操作番号が格納されている場合、要求情報解析部701は、当該操作番号が、当該家電機器2に対応しているか否かをチェックする。当該操作番号が、当該家電機器2に対応している場合、要求情報解析部701は、問合せ内容が正しいことを示すチェック結果を回答情報生成部702に通知する。一方、当該操作番号が、当該家電機器2に対応していない場合、要求情報解析部701は、問合せ内容が不正であることを示すチェック結果を回答情報生成部702に通知する。
また、要求情報解析部701は、カテゴリ5042にカテゴリ名が格納されている場合、操作説明情報DB741を参照して、当該カテゴリ名が、当該家電機器2に対応しているか否かをチェックする。当該カテゴリ名が、当該家電機器2に対応している場合、要求情報解析部701は、問合せ内容が正しいことを示すチェック結果を回答情報生成部702に通知する。一方、当該カテゴリ名が、当該家電機器2に対応していない場合、要求情報解析部701は、問合せ内容が不正であることを示すチェック結果を回答情報生成部702に通知する。
また、要求情報解析部701は、操作番号5041及びカテゴリ5042の何れにもダミーデータが格納されている場合、要求番号5043に“100”が格納されているか否かをチェックする。要求番号5043に“100”が格納されている場合、即ち、要求内容が「全操作説明」である場合、要求情報解析部701は、問合せ内容が正しいことを示すチェック結果を回答情報生成部702に通知する。一方、要求番号5043に“100”以外の要求番号が格納されている場合、即ち、要求内容が「全操作説明」以外である場合、要求情報解析部701は、問合せ内容が不正であることを示すチェック結果を回答情報生成部702に通知する。
回答情報生成部702は、本発明に係る回答情報生成手段の一例である。回答情報生成部702は、要求情報解析部701から供給された解析結果情報と、要求情報解析部701から通知されたチェック結果と、操作説明情報DB741と、に基づいて、ユーザの問合せに対する回答を示す回答情報を生成する。図28に、要求情報と、生成される回答情報との対応関係の一例を示す。
回答情報送信部703は、回答情報生成部702が生成した回答情報を音声処理装置5に送信する。回答情報生成部702及び回答情報送信部703は、本発明に係る回答手段の一例である。
図29は、音声操作支援装置7が実行する音声操作支援処理の手順を示すフローチャートである。音声処理装置5から送信された要求情報が要求情報受信部700により受信されると(ステップS401;YES)、要求情報解析部701は、当該要求情報を解析する(ステップS402)。
要求情報解析部701は、当該要求情報から取り出したダミーデータを除く各データと、当該要求情報で示される家電機器2が対応する全ての操作番号とを含む解析結果情報を回答情報生成部702に供給する。また、要求情報解析部701は、当該要求情報で示される問合せ内容の正否を示すチェック結果を回答情報生成部702に通知する。
回答情報生成部702は、要求情報解析部701から供給された解析結果情報と、要求情報解析部701から通知されたチェック結果と、操作説明情報DB741とに基づいて、回答情報を生成する(ステップS403)。
回答情報送信部703は、回答情報生成部702が生成した回答情報を音声処理装置5に送信する(ステップS404)。
以上説明したように、実施の形態1に係る音声操作支援システムによれば、音声処理装置5は、家電機器2の機種毎に、当該機種に対応する全ての操作に関する情報が登録された機器操作情報DB541を保持する。このため、メーカの違い及び操作のカテゴリに依らず、機器制御装置6に対して送信する操作情報のフォーマットを共通化することができ、より多くのメーカの当該音声操作サービスへの参加が期待できる。
また、音声操作支援装置7は、家電機器2の機種毎の各操作について、ユーザに説明するための情報が登録された操作説明情報DB741を保持する。そして、音声操作支援装置7は、ユーザから当該ユーザの家屋Hに設置されている家電機器2の操作についての問合せを音声処理装置5を介して受けると、かかる問合せに対して、音声で回答するための回答情報を生成する。このため、ユーザはメーカ間で共通の基本操作のみならず、当該家電機器2のメーカの固有の操作を容易に行うことができる。その結果、ユーザは、保有する家電機器2を十分に活用することが可能となる。そして、このように家電機器2が十分に活用されるサービスを提供することで、当該家電機器2の販売促進も図れる。
なお、音声操作支援装置7を備えずに、音声処理装置5に、音声操作支援装置7と同等の機能が含まれるようにしてもよいし、あるいは、機器制御装置6に、音声操作支援装置7と同等の機能が含まれるようにしてもよい。
また、音声処理装置5、機器制御装置6及び音声操作支援装置7を1つの装置で実現してもよい。
実施の形態2.
続いて、本発明の実施の形態2について説明する。なお、以下の説明において、実施の形態1と共通する構成要素等については、同一の符号を付し、その説明を省略する。
図30は、本発明の実施の形態2に係る音声操作支援システムを包含した音声操作システム1Aの全体構成を示す図である。音声操作システム1Aは、1又は複数の家電機器2と、音声入出力装置3と、ホームゲートウェイ4と、音声処理装置5Aと、機器制御装置6と、音声操作支援装置7Aとを備える。また、実施の形態2に係る音声操作支援システムは、音声入出力装置3と、ホームゲートウェイ4と、音声処理装置5Aと、音声操作支援装置7Aとにより構成される。
音声処理装置5Aのハードウェア構成は、実施の形態1の音声処理装置5と同様である(図4参照)。音声処理装置5Aは、機能的には、図31に示すように、音声データ受信部500と、音声データ解析部501Aと、操作情報生成部502と、操作情報送信部503と、要求情報生成部504Aと、要求情報送信部505と、結果情報受信部506と、音声データ生成部507と、音声データ送信部508と、回答情報受信部509と、アドバイス情報受信部510とを備える。
音声データ解析部501Aは、実施の形態1の音声処理装置5の音声データ解析部501と同様の処理を実行する。即ち、音声データ解析部501Aは、音声データ受信部500により受信された音声データを解析して、ユーザの発話内容を示す音声内容データを生成する。音声データ解析部501Aは、生成した音声内容データが家電機器2に対する操作を示す場合、当該音声内容データを操作情報生成部502に供給する。
さらに、音声データ解析部501Aは、生成した音声内容データが、家電機器2の操作についての問合せを示す場合、又は、家電機器2の操作についてのアドバイスの要求を示す場合、当該音声内容データを要求情報生成部504Aに供給する。
音声データ解析部501Aから供給された音声内容データが家電機器2の操作についての問合せを示す場合、要求情報生成部504Aは、実施の形態1の音声処理装置5の要求情報生成部504と同様に、当該音声内容データと、機器操作情報DB541と、顧客情報DB542と、顧客機器情報DB543とに基づいて、当該問合せに対する回答を要求するための第1要求情報を生成する。この第1要求情報のフォーマットは、実施の形態1において要求情報生成部504が生成する要求情報と同様である(図20参照)。
さらに、要求情報生成部504Aは、音声データ解析部501Aから供給された音声内容データが家電機器2の操作についてのアドバイスの要求を示す場合、当該音声内容データに基づいて、当該ユーザ宅の家電機器2の操作についてのアドバイスを要求するための第2要求情報を生成する。第2要求情報には、図32に示すように、顧客ID5044、カテゴリ5045、要求番号5046等の項目が含まれている。顧客ID5044には、当該ユーザの顧客IDが格納される。顧客IDとは、当該音声操作サービスにおいて、各顧客を識別するために割り振られたIDである。
カテゴリ5045には、対象となるカテゴリ名が格納される。要求番号5046には、要求番号が格納される。本実施の形態における要求番号と要求内容との関係を図33に示す。また、図34に、ユーザの発話内容と、生成される第2要求情報との対応関係の一例を示す。要求情報送信部505は、要求情報生成部504Aが生成した第1要求情報又は第2要求情報を音声操作支援装置7Aに送信する。
アドバイス情報受信部510は、音声操作支援装置7Aからアドバイス情報を受信する。アドバイス情報とは、先に送信した第2要求情報に応答して音声操作支援装置7Aが生成した情報であり、ユーザが指定したカテゴリの操作についてのアドバイスを示す情報である。アドバイス情報受信部510は、受信したアドバイス情報を音声データ生成部507に供給する。音声データ生成部507は、アドバイス情報受信部510から供給されたアドバイス情報に基づいて、公知の音声合成処理により音声データを生成し、生成した音声データを音声データ送信部508に供給する。当該音声データは、本発明に係る第3音声データの一例である。音声データ送信部508は、音声データ生成部507から供給された音声データを音声入出力装置3に送信する。
続いて、音声操作支援装置7Aについて説明する。音声操作支援装置7Aのハードウェア構成は、実施の形態1の音声操作支援装置7と同様である(図12参照)。但し、音声操作支援装置7Aの二次記憶装置74には、図35に示すように、操作実績情報DB743がさらに記憶されている。操作実績情報DB743は、各顧客宅に設置されている各家電機器2の操作実績に関する情報が登録されたデータベースである。操作実績情報DB743は、図示しないDB構築部により、操作説明情報DB741と機器情報DB742とに基づいて構築される。
詳細には、図36に示すように、操作実績情報DB743には、顧客毎に、機器ID7430、機種名称7431、設置場所7432、操作番号7433、カテゴリ7434、操作名称7435、操作実績7436等の項目を含むレコードが当該顧客宅に設置されている全ての家電機器2の台数分登録されている。
機器ID7430には、当該家電機器2の機器IDが格納される。機種名称7431には、当該家電機器2が属する機種の名称が格納される。設置場所7432には、当該家電機器2の設置場所を示す名称が格納される。操作番号7433には、操作番号が格納される。カテゴリ7434には、操作番号7433に格納された操作番号に対応するカテゴリ名が格納される。操作名称7435には、操作番号7433に格納された操作番号に対応する操作名称が格納される。
操作実績7436には、当該操作の実績が格納される。詳細には、操作実績7436には、当該操作の過去1年の操作回数が格納される。例えば、音声処理装置5Aは、操作情報を機器制御装置6に送信する度に、当該操作情報に含まれる機器IDと操作番号とが格納された操作実績通知を音声操作支援装置7Aに送信する。音声操作支援装置7Aは、音声処理装置5Aから操作実績通知を受信すると、操作実績情報DB743における当該操作実績通知に対応するレコードの操作実績7436に格納されている操作回数をインクリメントする。あるいは、音声操作支援装置7Aは、機器制御装置6から上記の操作実績通知と同様の通知を受信することで操作実績情報DB743を更新してもよい。
音声操作支援装置7Aは、機能的には、図37に示すように、要求情報受信部700Aと、要求情報解析部701と、回答情報生成部702と、回答情報送信部703と、アドバイス情報生成部704と、アドバイス情報送信部705とを備える。
要求情報受信部700Aは、音声操作支援装置7Aから送信された第1要求情報(図20参照)又は第2要求情報(図32参照)を受信する。要求情報受信部700Aは、受信した第1要求情報を要求情報解析部701に供給し、受信した第2要求情報をアドバイス情報生成部704に供給する。
アドバイス情報生成部704は、本発明に係るアドバイス情報生成手段の一例である。アドバイス情報生成部704は、第2要求情報と、操作実績情報DB743とに基づいてアドバイス情報を生成する。詳細には、先ず、アドバイス情報生成部704は、当該顧客宅に設置されている各家電機器2について、指定されたカテゴリ名の操作の利用傾向を下記の式1により算出する。
利用傾向(%)=当該カテゴリ名の操作の平均の操作回数÷基本操作における操作番号が“1”の操作の操作回数 (式1)
図38は、“省エネ操作”の利用傾向の一例であり、図39は、“見守り操作”の利用傾向の一例である。
アドバイス情報生成部704は、算出した利用傾向からアドバイスの対象となる家電機器2(以下、アドバイス対象という。)を選定する。例えば、ユーザが指定したカテゴリ名が、“省エネ操作”の場合、アドバイス情報生成部704は、当該ユーザ宅の全家電機器2の内、“省エネ操作”の利用傾向が50%未満の家電機器2をアドバイス対象として選定する。
また、例えば、ユーザが指定したカテゴリ名が、“見守り操作”の場合、アドバイス情報生成部704は、当該ユーザ宅の全家電機器2の内、“見守り操作”の利用傾向が20%未満の家電機器2をアドバイス対象として選定する。
そして、アドバイス情報生成部704は、選定したアドバイス対象と、ユーザが指定したカテゴリ名とに基づいてアドバイス情報を生成する。図40に、第2要求情報と、生成されるアドバイス情報との対応関係の一例を示す。
以上説明したように、実施の形態2に係る音声操作支援システムによれば、音声操作支援装置7Aは、ユーザが指定したカテゴリの操作についてのアドバイスを音声で伝えるためのアドバイス情報を生成する。これにより、ユーザは、保有する家電機器2を十分に活用することが可能となる。
なお、上記の実施の形態では、音声操作支援装置7Aのアドバイス情報生成部704は、各家電機器2の各操作の過去1年の操作回数を管理することで、アドバイスの要否を判定していたが、管理する操作回数の期間は任意の設計事項である。
また、同一メーカの同種の異なる型名の家電機器2が、家屋Hに設置されている場合であって、基本操作以外のカテゴリの少なくとも一部の操作が共通している場合、アドバイス情報生成部704は、他の家電機器2における当該共通の操作の使用状況も勘案して、アドバイスの要否を判定してもよい。例えば、図36に示すように、機器IDがR111のリビングのエアコンと、機器IDがR112の寝室のエアコンとは、省エネ操作が共通している。しかし、リビングのエアコンでは過去1年において省エネ操作の実績があるものの、寝室のエアコンでは過去1年において省エネ操作の実績がない。
上記の場合、アドバイス情報生成部704は、寝室のエアコンの省エネ操作の使用状況にかかわらず、省エネ操作に関するアドバイス情報の生成を行わないことが好ましい。これは、リビングのエアコンの省エネ操作の使用実績から、ユーザが、エアコンの省エネ操作を関知していることが判るためである。このようにして,アドバイスの要否を判定することで、より適正なアドバイスをユーザに伝えることが可能となる。
なお、音声操作支援装置7Aを備えずに、音声処理装置5Aに、音声操作支援装置7Aと同等の機能が含まれるようにしてもよいし、あるいは、機器制御装置6に、音声操作支援装置7Aと同等の機能が含まれるようにしてもよい。
また、音声処理装置5A、機器制御装置6及び音声操作支援装置7Aを1つの装置で実現してもよい。
実施の形態3.
続いて、本発明の実施の形態3について説明する。なお、以下の説明において、実施の形態1と共通する構成要素等については、同一の符号を付し、その説明を省略する。
図41は、本発明の実施の形態3に係る音声操作支援システムを包含した音声操作システム1Bの全体構成を示す図である。音声操作システム1Bは、1又は複数の家電機器2と、音声入出力装置3と、ホームゲートウェイ4と、音声処理装置5Bと、機器制御装置6と、音声操作支援装置7とを備える。また、実施の形態3に係る音声操作支援システムは、音声入出力装置3と、ホームゲートウェイ4と、音声処理装置5Bと、音声操作支援装置7とにより構成される。
音声処理装置5Bのハードウェア構成は、実施の形態1の音声処理装置5と同様である(図4参照)。但し、音声処理装置5Bの二次記憶装置54には、図42に示すように、顧客機器情報DB543の替わりに顧客機器情報DB543Aが記憶され、さらに、操作履歴DB544と、操作シーケンスDB545とが記憶されている。
顧客機器情報DB543Aは、顧客機器情報DB543と同様、各顧客宅に設置されている全ての家電機器2に関する情報が登録されたデータベースである。顧客機器情報DB543Aに登録されるレコードには、顧客機器情報DB543と同様の項目に加え、さらに、図43に示すように、対応操作シーケンス5435が含まれている。
対応操作シーケンス5435には、対応する操作シーケンス情報に関する情報が格納される。操作シーケンス情報とは、1つの家電機器2に対する音声操作により、他の1又は複数の家電機器2に対する操作を自動的に順次実行できるようにするための情報であり、後述する操作シーケンスDB545に登録されている。対応操作シーケンス5435に格納される情報には、対応する操作シーケンス情報の登録番号、シーケンス番号等が格納される。登録番号、シーケンス番号については後述する。なお、対応する操作シーケンス情報が存在しない場合、対応操作シーケンス5435には、その旨を示す情報が格納される。
図42に戻り、操作履歴DB544は、各顧客宅における音声操作の履歴が登録されたデータベースである。詳細には、図44、図45に示すように、操作履歴DB544には、顧客毎に、日時5440、操作者5441、機器ID5442、機種名称5443、設置場所5444、操作番号5445、操作名称5446、設定内容5447、連続指標5448等の項目を含むレコードが予め定めた期間分保存されている。
日時5440には、当該操作が行われた日時(年/月/日/時刻)を示す情報が格納される。操作者5441には、当該操作を行った操作者の名称が格納される。機器ID5442には、操作された家電機器2の機器IDが格納される。機種名称5443には、当該家電機器2が属する機種の名称が格納される。設置場所5444には、当該家電機器2の設置場所を示す名称が格納される。操作番号5445には、当該操作の操作番号が格納される。操作名称5446には、当該操作の操作名称が格納される。設定内容5447には、当該操作において設定された設定内容が格納される。
連続指標5448には、連続指標が格納される.連続指標とは、1つ前の操作との連続性を示す指標である。連続指標の詳細については後述する。
図42に戻り、操作シーケンスDB545は、前述した操作シーケンス情報が登録されたデータベースである。操作シーケンス情報は、当該音声操作サービスを利用するユーザによって、上述した音声操作アプリを起動したスマートフォン、タブレット端末等を介した操作により、操作シーケンスDB545に登録される。あるいは、操作シーケンス情報は、音声処理装置5Bによって、各顧客の操作履歴DB544に基づいて生成され、操作シーケンスDB545に登録されるようにしてもよい。あるいは、操作シーケンス情報は、当該音声操作サービスの運営者により生成され、予め操作シーケンスDB545に登録されていてもよい。
図46に示すように、操作シーケンス情報DB545には、登録番号5450、時間帯5451、シーケンス番号5452、機種名称5453、設置場所5454、操作番号5455、操作名称5456、設定内容5457、説明5458等の項目を含むレコードが登録されている。1つの操作シーケンス情報は、複数のレコードで構成される。登録番号5450には、登録番号が格納される。登録番号は、当該操作シーケンス情報の操作シーケンス情報DB545への登録順番を示す。同じ操作シーケンス情報を構成するレコードに対しては、同一の登録番号が付与される。
時間帯5451には、当該操作シーケンス情報に基づく操作が有効となる時間帯を示す情報(以下、時間帯情報という。)が格納される。時間帯情報には、対象となる月と対象となる時刻の各々を示す情報が含まれる。同じシーケンス情報を構成する各レコードの時間帯5451には、同一の時間帯情報が格納される。
シーケンス番号5452には、シーケンス番号が格納される。シーケンス番号は、当該操作シーケンス情報における複数の操作において、当該操作が実行される順番を示す。機種名称5453には、当該操作の対象となる家電機器2の機種の名称が格納される。
設置場所5454には、当該家電機器2の設置場所を示す名称が格納される。操作番号5455には、当該操作の操作番号が格納される。操作名称5456には、当該操作の操作名称が格納される。設定内容5457には、当該操作において設定される設定内容が格納される。説明5458には、当該操作シーケンス情報についての説明を示す情報(以下、説明情報という。)が格納される。同じ操作シーケンス情報を構成する各レコードの説明5458には、同一の説明情報が格納される。
音声処理装置5Bは、機能的には、図47に示すように、音声データ受信部500と、音声データ解析部501Bと、操作情報生成部502Aと、操作情報送信部503と、要求情報生成部504と、要求情報送信部505と、結果情報受信部506と、音声データ生成部507と、音声データ送信部508と、回答情報受信部509と、連続操作検出部511と、類似シーケンス検索部512と、シーケンス設定提案部513とを備える。
音声データ解析部501Bは、実施の形態1の音声処理装置5の音声データ解析部501と同様の処理を実行する。即ち、音声データ解析部501Bは、音声データ受信部500により受信された音声データを解析して、ユーザの発話内容を示す音声内容データを生成する。音声データ解析部501Bは、生成した音声内容データが家電機器2に対する操作を示す場合、当該音声内容データを操作情報生成部502Aに供給する。さらに、音声データ解析部501Bは、顧客情報DB542を参照して、発話したユーザ(即ち、操作者)を同定し、同定した操作者の名称も操作情報生成部502Aに供給する。なお、顧客情報DB542には、各顧客宅における各ユーザの音声に関するデータが登録されているものとする。
また、音声データ解析部501Bは、生成した音声内容データが、操作シーケンス設定の提案に対する回答を示す場合、当該音声内容データをシーケンス設定提案部513に供給する。
操作情報生成部502Aは、音声データ解析部501Bから供給された音声内容データと、機器操作情報DB541と、顧客情報DB542と、顧客機器情報DB543Aと、操作シーケンスDB545とに基づいて操作情報を生成する。
さらに、操作情報生成部502Aは、当該操作の履歴を示すレコードを生成し、操作履歴DB544に登録する。その際、操作情報生成部502Aは、当該操作の連続指標を算出し、連続指標5448に格納する。連続指標は、下記の式2により算出される。
上記の式2の各パラメータにおいて、[インターバル]は、前回の操作からの経過時間(分)である。[操作者]は、今回の操作者と前回の操作者とが同一の場合は“1”となり、異なる場合は“0”となる。[機器]は、今回操作した家電機器2と前回操作した家電機器2とが同一の場合は、“1”となり、異なる場合は“0”となる。[機種]は、今回操作した家電機器2の機種と前回操作した家電機器2の機種とが同一の場合は、“1”となり、異なる場合は“0”となる。[設置場所]は、今回操作した家電機器2の設置場所と前回操作した家電機器2の設置場所とが同一の場合は、“1”となり、異なる場合は“0”となる。
例えば、図44で示される各操作において、上記の各パラメータの値は、図48に示すようになる。
上記の式2において、各パラメータに乗する重みは、操作の連続性における当該パラメータの影響を勘案して設定されている。本例では、[インターバル]に対応する重みが最も大きく“10”に設定され、[操作者]と[機種]に対応する重みが最も小さく、それぞれ“0.5”に設定されている。
なお、連続指標は、例えば、ディープラーニングのRNN(Recurrent Neural Network)を用いる等、様々な手法で導出することが可能である。
図47に戻り、連続操作検出部511は、予め定めたタイミングで(例えば、一定時間毎に)操作履歴DB544をチェックして、連続性が認められる複数の操作(以下、連続操作という。)を検出する。詳細には、連続操作検出部511は、連続指標が予め定めた基準値(例えば、10.00)以上の操作がある場合、当該操作の直前の操作と当該操作を連続操作として検出する。なお、連続指標が基準値以上の操作が連続する場合、連続操作には、3つ以上の操作が含まれることになる。
連続操作検出部511は、検出した連続操作に関する情報を図示しない連続操作テーブルに格納する。連続操作テーブルは、RAM53又は二次記憶装置54に展開される。連続操作テーブルの一例を図49に示す。
図47に戻り、類似シーケンス検索部512は、連続操作検出部511により検出された連続操作に包含される操作シーケンス情報を検索する。詳細には、類似シーケンス検索部512は、連続操作テーブルから順次、連続操作をピックアップし、ピックアップした連続操作に包含される操作シーケンス情報を操作シーケンスDB545から検索する。
例えば、図49で示される連続操作テーブルでは、番号が“1”,“4”,“6”の各連続操作に、操作シーケンスDB545(図46参照)の登録番号“1”の操作シーケンス情報が包含されている。
連続操作テーブルの各連続操作について、上記の検索を行った結果、同一の操作シーケンス情報が、規定回数(例えば、3回)以上出現した場合、類似シーケンス検索部512は、当該操作シーケンス情報の登録番号をシーケンス設定提案部513に通知する。
シーケンス設定提案部513は、本発明に係るシーケンス設定提案手段の一例である。シーケンス設定提案部513は、通知された登録番号の操作シーケンス情報で示される一連の操作の設定(以下、シーケンス設定という。)を提案するための提案情報を生成する。提案情報には、操作シーケンスDB545の当該登録番号に対応するレコードの説明5458から読み出した説明情報が含まれる。シーケンス設定提案部513は、生成した提案情報を音声データ生成部507に供給する。
音声データ生成部507は、シーケンス設定提案部513から供給された提案情報に基づいて、公知の音声合成処理により音声データを生成し、生成した音声データを音声データ送信部508に供給する。音声データ送信部508は、音声データ生成部507から供給された音声データを音声入出力装置3に送信する。
上記の提案に対して、ユーザから、“はい”、“OK”、“どうぞ”、“やって”等の肯定的回答が得られると、シーケンス設定提案部513は、当該顧客宅の当該複数の家電機器2について、シーケンス設定を行う。詳細には、シーケンス設定提案部513は、顧客機器情報DB543Aにおける当該シーケンス設定の対象となる家電機器2に対応するレコードの対応操作シーケンス5435に、当該操作シーケンス情報に関する情報(登録番号、シーケンス番号等)を格納する。
操作情報生成部502Aは、ユーザの音声操作に基づく音声内容データから操作情報を生成し、操作情報送信部503に供給すると、現在の日時と、顧客機器情報DB543Aと、操作シーケンスDB545とに基づいて、当該操作対象の家電機器2が、実行すべきシーケンス操作における最初の家電機器2に該当するか否かを判定する。例えば、現在の日時が、8月1日の午前6時であり、顧客機器情報DB543Aにおける当該家電機器2に対応するレコードの対応操作シーケンス5435に登録番号“1”、シーケンス番号“1”が格納されている場合、操作情報生成部502Aは、当該家電機器2が、実行すべきシーケンス操作における最初の家電機器2に該当すると判定する。
当該家電機器2が、実行すべきシーケンス操作における最初の家電機器2に該当すると判定すると、操作情報生成部502Aは、同じ登録番号の“2”以降のシーケンス番号が設定されている家電機器2に対する操作情報を、シーケンス番号が若い順に生成し、操作情報送信部503に順次供給する。これにより、当該ユーザ宅において、例えば、7~9月の午前5~8時に音声操作により寝室のエアコンの運転が停止されると、リビングのエアコンの運転が自動的に開始されることになる。
以上説明したように、実施の形態3に係る音声操作支援システムによれば、音声処理装置5Bは、ユーザの日常の家電機器2に対する操作傾向から、複数の家電機器2に対する連続的な操作の設定、即ち、シーケンス設定をユーザに提案する。そして、ユーザが承諾すると、音声処理装置5Bは、当該連続的な操作を実現するためのシーケンス設定を行う。これにより、ユーザは、1回の音声操作で、複数の家電機器2に対し、各々所望の動作を連続的に実行させることができる。したがってユーザの利便性が高まる。
なお、音声処理装置5Bは、操作シーケンスDB545を参照することなく、頻繁に連続操作される複数の家電機器2についてのシーケンス設定をユーザに提案してもよい。
また、音声処理装置5Bによるシーケンス設定の提案及び設定機能が、機器制御装置6又は音声操作支援装置7に含まれるようにしてもよい。
また、音声操作支援装置7を備えずに、音声処理装置5Bに、音声操作支援装置7と同等の機能が含まれるようにしてもよいし、あるいは、機器制御装置6に、音声操作支援装置7と同等の機能が含まれるようにしてもよい。
また、音声処理装置5B、機器制御装置6及び音声操作支援装置7を1つの装置で実現してもよい。
また、音声処理装置5Bによるシーケンス設定の提案及び設定機能が、実施の形態2の音声処理装置5Aに含まれるようにしてもよい。
本発明は、上記の各実施の形態に限定されず、本発明の要旨を逸脱しない範囲での種々の変更は勿論可能である。
上記の各実施の形態では、音声処理装置5,5A,5Bにおいて、CPU51によって二次記憶装置54に記憶されている音声処理プログラム540が実行されることで、音声処理装置5,5A,5Bの機能部(図17、図31、図47参照)が実現された。しかし、音声処理装置5,5A,5Bの機能部の全部又は一部が、専用のハードウェアで実現されるようにしてもよい。同様に、機器制御装置6の機能部(図26参照)の全部又は一部が、専用のハードウェアで実現されるようにしてもよいし、音声操作支援装置7,7Aの機能部(図27、図37)の全部又は一部が、専用のハードウェアで実現されるようにしてもよい。専用のハードウェアとは、例えば、単一回路、複合回路、プログラム化されたプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、又は、これらの組み合わせである。
また、音声処理プログラム540、機器制御プログラム640、音声操作支援プログラム740は、CD-ROM(Compact Disc Read Only Memory)、DVD(Digital Versatile Disc)、光磁気ディスク(Magneto-Optical Disc)、USB(Universal Serial Bus)メモリ、メモリカード、HDD等のコンピュータ読み取り可能な記録媒体に格納して配布することも可能である。そして、このように配布した音声処理プログラム540、機器制御プログラム640、音声操作支援プログラム740を特定の又は汎用のコンピュータにインストールすることによって、当該コンピュータを音声処理装置5,5A,5B、機器制御装置6、音声操作支援装置7,7Aとして機能させることも可能である。
また、音声処理プログラム540、機器制御プログラム640、音声操作支援プログラム740をインターネット上の図示しないサーバが有する記憶装置に格納しておき、当該サーバから音声処理装置5,5A,5B、機器制御装置6、音声操作支援装置7,7Aに音声処理プログラム540、機器制御プログラム640、音声操作支援プログラム740がダウンロードされるようにしてもよい。
本発明は、広義の精神と範囲を逸脱することなく、様々な実施の形態及び変形が可能である。また、上述した実施の形態は、本発明を説明するためのものであり、本発明の範囲を限定するものではない。つまり、本発明の範囲は、実施の形態ではなく、請求の範囲によって示される。そして、請求の範囲内及びそれと同等の発明の意義の範囲内で施される様々な変形が、本発明の範囲内とみなされる。