JP2001306199A - ネットワーク機器制御装置 - Google Patents
ネットワーク機器制御装置Info
- Publication number
- JP2001306199A JP2001306199A JP2000115703A JP2000115703A JP2001306199A JP 2001306199 A JP2001306199 A JP 2001306199A JP 2000115703 A JP2000115703 A JP 2000115703A JP 2000115703 A JP2000115703 A JP 2000115703A JP 2001306199 A JP2001306199 A JP 2001306199A
- Authority
- JP
- Japan
- Prior art keywords
- network
- information
- database
- user
- dialogue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
- Small-Scale Networks (AREA)
- Selective Calling Equipment (AREA)
- Telephonic Communication Services (AREA)
- Computer And Data Communications (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
(57)【要約】
【課題】 擬人化エージェントとの対話によりネットワ
ークに接続された複数の機器を統一的に制御することが
できるネットワーク機器制御装置を提供する。 【解決手段】 ホームゲートウェイ1は、電話網、イン
ターネット網等の各種ネットワーク、カメラ、マイクロ
フォン等の複数の入力のうち1系統を対話形式により選
択するマルチモーダルインターフェース2と、ネットワ
ークに接続されているネットワーク機器の情報、該機器
それぞれのコマンド情報、所有者情報などを格納する機
器制御用データベース20と、前記マルチモーダルイン
ターフェースの出力により前記複数のネットワーク機器
のうち少なくとも1つを制御する接続機器制御手段19
とからなる制御部3を備え、マルチモーダルインターフ
ェース2は、さらに音情報と意味理解手段14からの意
味理解情報に基づいて相槌を打つ、応答タイミングを決
定する等の対話を促す情報を生成する対話促進手段16
を備えて構成する。
ークに接続された複数の機器を統一的に制御することが
できるネットワーク機器制御装置を提供する。 【解決手段】 ホームゲートウェイ1は、電話網、イン
ターネット網等の各種ネットワーク、カメラ、マイクロ
フォン等の複数の入力のうち1系統を対話形式により選
択するマルチモーダルインターフェース2と、ネットワ
ークに接続されているネットワーク機器の情報、該機器
それぞれのコマンド情報、所有者情報などを格納する機
器制御用データベース20と、前記マルチモーダルイン
ターフェースの出力により前記複数のネットワーク機器
のうち少なくとも1つを制御する接続機器制御手段19
とからなる制御部3を備え、マルチモーダルインターフ
ェース2は、さらに音情報と意味理解手段14からの意
味理解情報に基づいて相槌を打つ、応答タイミングを決
定する等の対話を促す情報を生成する対話促進手段16
を備えて構成する。
Description
【0001】
【発明の属する技術分野】本発明は、ユーザと情報処理
機器との間で自然な対話を実現するマルチモーダルイン
タフェースを用いたネットワーク機器制御装置に関す
る。
機器との間で自然な対話を実現するマルチモーダルイン
タフェースを用いたネットワーク機器制御装置に関す
る。
【0002】
【従来の技術】近年、音声認識技術が発展し、テレビジ
ョン受像機、ラジオ受信機、車載ナビゲーション、携帯
電話、パーソナルコンピュータ(以下、PCという)等
の機器に搭載されつつある。音声認識装置は通常それぞ
れの機器の一部として内蔵されている。この音声認識装
置、手書き文字認識装置、マウス、ライトペン、タブレ
ット等のポインティングデバイスなど、複数の入力装置
をコンピュータに接続して、ユーザがその局面局面にお
いて自分にとって最も都合の良い入力装置を使って入力
できれば非常に使いやすいインタフェースとなる。この
ように複数の異なる入力モードから、ユーザが任意の入
力モードを選択し、組み合わせて自分の意図をシステム
に伝えることができるインタフェースのことをマルチモ
ーダルインタフェースという。
ョン受像機、ラジオ受信機、車載ナビゲーション、携帯
電話、パーソナルコンピュータ(以下、PCという)等
の機器に搭載されつつある。音声認識装置は通常それぞ
れの機器の一部として内蔵されている。この音声認識装
置、手書き文字認識装置、マウス、ライトペン、タブレ
ット等のポインティングデバイスなど、複数の入力装置
をコンピュータに接続して、ユーザがその局面局面にお
いて自分にとって最も都合の良い入力装置を使って入力
できれば非常に使いやすいインタフェースとなる。この
ように複数の異なる入力モードから、ユーザが任意の入
力モードを選択し、組み合わせて自分の意図をシステム
に伝えることができるインタフェースのことをマルチモ
ーダルインタフェースという。
【0003】また、前述の民生機器にはインターネット
の発達により、ネットワークに接続される機器も増大し
つつある。インターネットを利用するためのアクセス手
段が多様になり、ユーザがインターネットにアクセスす
るための端末やネットワークの選択肢が拡大している。
インターネットを構築するには、企業内にLAN(Loca
l Area Network)を構築し、次にインターネットとの接
続を行うという手順が一般的である。また、インターネ
ットに接続する場合の回線の種類や接続形態は、大きく
分けて、(1)自営専用線による接続、(2)公衆電話回線、
ISDN(Integrated Services Digital Network:サ
ービス総合デジタル網)デジタル通信モードを使用して
接続する回線交換による接続、(3)ITU(Internation
al Telecommunication Union:国際電気通信連合)−T
で規定しているパケット交換接続やISDNパケット交
換モードを使用するパケット交換接続がある。
の発達により、ネットワークに接続される機器も増大し
つつある。インターネットを利用するためのアクセス手
段が多様になり、ユーザがインターネットにアクセスす
るための端末やネットワークの選択肢が拡大している。
インターネットを構築するには、企業内にLAN(Loca
l Area Network)を構築し、次にインターネットとの接
続を行うという手順が一般的である。また、インターネ
ットに接続する場合の回線の種類や接続形態は、大きく
分けて、(1)自営専用線による接続、(2)公衆電話回線、
ISDN(Integrated Services Digital Network:サ
ービス総合デジタル網)デジタル通信モードを使用して
接続する回線交換による接続、(3)ITU(Internation
al Telecommunication Union:国際電気通信連合)−T
で規定しているパケット交換接続やISDNパケット交
換モードを使用するパケット交換接続がある。
【0004】
【発明が解決しようとする課題】このような従来のネッ
トワーク機器を制御する制御装置にあっては、以下のよ
うな問題点があった。例えば、特開平2−30267号
公報には、電話からの自動応答に応じて、対話入力形式
で番号・記号等を送信して機器の遠隔操作を行う遠隔操
作装置が開示されている。この方法は一般的ではあるが
入力が煩雑になる。また、家の中で使う際には別のイン
タフェースを用意する必要があり、統一的な制御ができ
ないという問題点がある。また、特開平11−3119
96号公報に記載された音声装置及び遠隔操作可能なネ
ットワーク機器は、音声認識の結果によりネットワーク
に接続された機器を制御するものである。この装置では
複数ユーザが使用することを前提としているが、認識結
果が他のユーザの命令と競合した場合にどうするかにつ
いてはまったく触れられていない。また、システムとの
やりとりも常に同じ応答の仕方をするため、ユーザはシ
ステムとのやり取りに飽きてしまい、使わなくなってし
まうという問題もある。また、状況によって機器に対す
るアクセス権を変化できるような仕組みが必要である。
トワーク機器を制御する制御装置にあっては、以下のよ
うな問題点があった。例えば、特開平2−30267号
公報には、電話からの自動応答に応じて、対話入力形式
で番号・記号等を送信して機器の遠隔操作を行う遠隔操
作装置が開示されている。この方法は一般的ではあるが
入力が煩雑になる。また、家の中で使う際には別のイン
タフェースを用意する必要があり、統一的な制御ができ
ないという問題点がある。また、特開平11−3119
96号公報に記載された音声装置及び遠隔操作可能なネ
ットワーク機器は、音声認識の結果によりネットワーク
に接続された機器を制御するものである。この装置では
複数ユーザが使用することを前提としているが、認識結
果が他のユーザの命令と競合した場合にどうするかにつ
いてはまったく触れられていない。また、システムとの
やりとりも常に同じ応答の仕方をするため、ユーザはシ
ステムとのやり取りに飽きてしまい、使わなくなってし
まうという問題もある。また、状況によって機器に対す
るアクセス権を変化できるような仕組みが必要である。
【0005】さらに、従来の電話だけでなく、マイク、
カメラを備えたPC、テレビ電話、インターネットな
ど、ネットワーク機器を制御するための入力デバイスも
多様化してきているが、入力デバイスごとにシステムを
構築する必要があった。本発明は、このような課題に鑑
みてなされたものであって、擬人化エージェントとの対
話によりネットワークに接続された複数の機器を統一的
に制御することができるネットワーク機器制御装置を提
供することを目的としている。
カメラを備えたPC、テレビ電話、インターネットな
ど、ネットワーク機器を制御するための入力デバイスも
多様化してきているが、入力デバイスごとにシステムを
構築する必要があった。本発明は、このような課題に鑑
みてなされたものであって、擬人化エージェントとの対
話によりネットワークに接続された複数の機器を統一的
に制御することができるネットワーク機器制御装置を提
供することを目的としている。
【0006】
【課題を解決するための手段】本発明のネットワーク機
器制御装置は、例えば各種ネットワーク、カメラ、マイ
クロフォン等の複数の入力のうち1系統を対話形式によ
り選択するマルチモーダルインターフェースと、ネット
ワークに接続されている複数のネットワーク機器の情
報、該機器それぞれのコマンド情報、所有者情報などを
格納する機器制御用データベースと、前記マルチモーダ
ルインターフェースの出力により前記複数のネットワー
ク機器のうち少なくとも1つを制御する接続機器制御手
段とを備え、前記マルチモーダルインターフェースは、
ユーザの身振り(ジェスチャ)や顔の表情等を認識する
画像認識、及び入力音声を認識する認識手段と、声の抑
揚、強さ、速さなどの音情報を獲得する音情報獲得手段
と、意味理解及びユーザごとの応答を変えるための情報
を格納する意味理解用データベースと、前記認識手段に
よる認識結果及び前記意味理解用データベースに格納さ
れたデータに基づいて意味理解を行う意味理解手段と、
前記音情報獲得手段により獲得した音情報と前記意味理
解手段からの意味理解情報に基づいて相槌を打つ、応答
タイミングを決定する等の対話を促す情報を生成する対
話促進手段と、前記意味理解手段からの応答文を音声合
成する音声合成手段と、対話相手となる擬人化エージェ
ントを合成して出力する画像生成手段と、を備えること
を特徴とする。
器制御装置は、例えば各種ネットワーク、カメラ、マイ
クロフォン等の複数の入力のうち1系統を対話形式によ
り選択するマルチモーダルインターフェースと、ネット
ワークに接続されている複数のネットワーク機器の情
報、該機器それぞれのコマンド情報、所有者情報などを
格納する機器制御用データベースと、前記マルチモーダ
ルインターフェースの出力により前記複数のネットワー
ク機器のうち少なくとも1つを制御する接続機器制御手
段とを備え、前記マルチモーダルインターフェースは、
ユーザの身振り(ジェスチャ)や顔の表情等を認識する
画像認識、及び入力音声を認識する認識手段と、声の抑
揚、強さ、速さなどの音情報を獲得する音情報獲得手段
と、意味理解及びユーザごとの応答を変えるための情報
を格納する意味理解用データベースと、前記認識手段に
よる認識結果及び前記意味理解用データベースに格納さ
れたデータに基づいて意味理解を行う意味理解手段と、
前記音情報獲得手段により獲得した音情報と前記意味理
解手段からの意味理解情報に基づいて相槌を打つ、応答
タイミングを決定する等の対話を促す情報を生成する対
話促進手段と、前記意味理解手段からの応答文を音声合
成する音声合成手段と、対話相手となる擬人化エージェ
ントを合成して出力する画像生成手段と、を備えること
を特徴とする。
【0007】このように構成された本発明のネットワー
ク機器制御装置は、自然言語による入力により、接続さ
れた機器を容易に遠隔繰作することができる。対話機能
による、認識できない部分のみを聞き返すことによりユ
ーザに不快感を与えることなく認識精度を向上させ、対
話を通じて同一ネットワーク上にある機器を操作するこ
とができる。また、意味理解手段に個人情報、時間情報
を持たせることでいろいろな対話応答が実現できる。接
続機器制御手段に個人情報に関するデータベースを接続
することで機器の選定、制御セキュリティ等を実現でき
る。インターネット等の回線を利用してネットワーク機
器のメーカー及びメンテナンス会社より該当機器の保守
を行うことができる。
ク機器制御装置は、自然言語による入力により、接続さ
れた機器を容易に遠隔繰作することができる。対話機能
による、認識できない部分のみを聞き返すことによりユ
ーザに不快感を与えることなく認識精度を向上させ、対
話を通じて同一ネットワーク上にある機器を操作するこ
とができる。また、意味理解手段に個人情報、時間情報
を持たせることでいろいろな対話応答が実現できる。接
続機器制御手段に個人情報に関するデータベースを接続
することで機器の選定、制御セキュリティ等を実現でき
る。インターネット等の回線を利用してネットワーク機
器のメーカー及びメンテナンス会社より該当機器の保守
を行うことができる。
【0008】また、前記対話促進手段は、音声の強弱、
音の高低の特徴、ユーザの身振り、音声認識の結果のう
ち少なくとも2つ以上を入力とし、音声としぐさで相槌
を打つ情報を生成することで、人間と同じような応答を
実現することが可能であり、スムーズな対話を実現する
ことができる。
音の高低の特徴、ユーザの身振り、音声認識の結果のう
ち少なくとも2つ以上を入力とし、音声としぐさで相槌
を打つ情報を生成することで、人間と同じような応答を
実現することが可能であり、スムーズな対話を実現する
ことができる。
【0009】また、前記意味理解用データベースは、ユ
ーザ別のアクセス方法、時間情報、ユーザ名のうち少な
くとも2つ以上を入力とし、該入力とは異なる応答情報
を出力することで、アクセス方法、時間情報、ユーザ名
などをキーとして異なった応答を生成することが可能で
あり、人間と話すようにストレスを感じない対話を実現
することができる。
ーザ別のアクセス方法、時間情報、ユーザ名のうち少な
くとも2つ以上を入力とし、該入力とは異なる応答情報
を出力することで、アクセス方法、時間情報、ユーザ名
などをキーとして異なった応答を生成することが可能で
あり、人間と話すようにストレスを感じない対話を実現
することができる。
【0010】また、前記機器制御用データベースは、例
えば同一のネットワーク上に接続された機器の操作コマ
ンド及び送信手順を格納しており、前記接続機器制御手
段は、ユーザとの対話の結果から前記操作コマンドを検
索し、前記接続機器に送信することで、処理手順を考え
ることなく接続機器を制御することが可能であり、音声
対話によりネットワーク機器を制御することができる。
えば同一のネットワーク上に接続された機器の操作コマ
ンド及び送信手順を格納しており、前記接続機器制御手
段は、ユーザとの対話の結果から前記操作コマンドを検
索し、前記接続機器に送信することで、処理手順を考え
ることなく接続機器を制御することが可能であり、音声
対話によりネットワーク機器を制御することができる。
【0011】また、前記機器制御用データベースは、例
えば同一のネットワーク上に接続された機器の使用制限
に関する情報を格納しており、前記接続機器制御手段
は、前記使用制限に関する情報に基づいて操作権限のな
い機器の操作を排除することで、操作権限のない機器の
操作を排除することが可能であり、安全性を確保するこ
とができる。
えば同一のネットワーク上に接続された機器の使用制限
に関する情報を格納しており、前記接続機器制御手段
は、前記使用制限に関する情報に基づいて操作権限のな
い機器の操作を排除することで、操作権限のない機器の
操作を排除することが可能であり、安全性を確保するこ
とができる。
【0012】また、前記機器制御用データベースは、同
一のネットワーク上に接続された機器の操作方法に関す
る情報を格納するようにし、前記接続機器制御手段は、
ユーザからの要求に応じてCG映像、ビデオ映像、合成
音声のうち2つ以上を使って教示するように構成すれ
ば、使用方法がわからないユーザにその方法を教示する
ことが可能であり、新しい機器を接続してもすぐに使え
るようになる。
一のネットワーク上に接続された機器の操作方法に関す
る情報を格納するようにし、前記接続機器制御手段は、
ユーザからの要求に応じてCG映像、ビデオ映像、合成
音声のうち2つ以上を使って教示するように構成すれ
ば、使用方法がわからないユーザにその方法を教示する
ことが可能であり、新しい機器を接続してもすぐに使え
るようになる。
【0013】
【発明の実施の形態】以下、添付図面を参照しながら本
発明の好適なネットワーク機器制御装置の実施の形態に
ついて詳細に説明する。図1は、本発明の実施の形態の
ネットワーク機器制御装置の構成を示すブロック図であ
る。ネットワーク機器制御装置として、マルチモータル
インタフェースを用いたネットワーク機器制御装置に適
用した例である。
発明の好適なネットワーク機器制御装置の実施の形態に
ついて詳細に説明する。図1は、本発明の実施の形態の
ネットワーク機器制御装置の構成を示すブロック図であ
る。ネットワーク機器制御装置として、マルチモータル
インタフェースを用いたネットワーク機器制御装置に適
用した例である。
【0014】図1において、1はホームゲートウェイ、
2はマルチモーダルインタフェース、3は制御部、4は
音声入力デバイスであるマイクロフォン、5はCCDカ
メラ等のカメラ、6はインターネット網、7はアナログ
電話網、8はISDN網、9は複数の接続機器である。
2はマルチモーダルインタフェース、3は制御部、4は
音声入力デバイスであるマイクロフォン、5はCCDカ
メラ等のカメラ、6はインターネット網、7はアナログ
電話網、8はISDN網、9は複数の接続機器である。
【0015】ホームゲートウェイ1は、例えば音声デー
タをLANのプロトコルであるIP(Internet Protoco
l)パケットに変換し、IPネットワークを経由した音
声通話を実現するものである。ホームゲートウェイ1
は、上記音声データのプロトコル変換等のIPゲートウ
ェイを行うもので、同時接続が可能なように複数のポー
トを有する。
タをLANのプロトコルであるIP(Internet Protoco
l)パケットに変換し、IPネットワークを経由した音
声通話を実現するものである。ホームゲートウェイ1
は、上記音声データのプロトコル変換等のIPゲートウ
ェイを行うもので、同時接続が可能なように複数のポー
トを有する。
【0016】特に、ホームゲートウェイ1は、個人認
証、操作機器及び操作内容の特定を行い、必要なコマン
ド体系に変換し、該当ネットワーク機器に送信する。マ
ルチモーダルインタフェース2は、インターネット網
6、アナログ電話網7、ISDN網8などのネットワー
ク網、CCDカメラ5、マイク4などの入力デバイスの
うち、接続要求のあった1系統を選択し、その系統から
の入力を受け付ける。
証、操作機器及び操作内容の特定を行い、必要なコマン
ド体系に変換し、該当ネットワーク機器に送信する。マ
ルチモーダルインタフェース2は、インターネット網
6、アナログ電話網7、ISDN網8などのネットワー
ク網、CCDカメラ5、マイク4などの入力デバイスの
うち、接続要求のあった1系統を選択し、その系統から
の入力を受け付ける。
【0017】図2は、ホームゲートウェイ1を構成する
マルチモーダルインタフェース2の構成を示す図であ
る。図2において、マルチモーダルインタフェース2
は、画像認識手段11、言語情報以外の音情報を認識す
る音声認識手段12、音情報獲得手段13、意味理解手
段14、意味理解及びユーザごとの応答を変えるための
情報を格納する対話用データベース(DB)15(意味
理解用データベース)、対話促進手段16、音声合成手
段17、及び画像生成手段18から構成される。
マルチモーダルインタフェース2の構成を示す図であ
る。図2において、マルチモーダルインタフェース2
は、画像認識手段11、言語情報以外の音情報を認識す
る音声認識手段12、音情報獲得手段13、意味理解手
段14、意味理解及びユーザごとの応答を変えるための
情報を格納する対話用データベース(DB)15(意味
理解用データベース)、対話促進手段16、音声合成手
段17、及び画像生成手段18から構成される。
【0018】画像認識手段11は、ユーザの身振り(ジ
ェスチャ)や画像による個人認証を行う。音声認識手段
12は、ユーザのしゃべった内容を音声認識により獲得
する。音声認識の手法としては、ヒドンマルコフモデル
(HMM:hidden Markov model)や連続DPマッチン
グによるキーワード認識などを用いる。音情報獲得手段
13は、声の抑揚、強さ、速さなどの音情報を獲得す
る。
ェスチャ)や画像による個人認証を行う。音声認識手段
12は、ユーザのしゃべった内容を音声認識により獲得
する。音声認識の手法としては、ヒドンマルコフモデル
(HMM:hidden Markov model)や連続DPマッチン
グによるキーワード認識などを用いる。音情報獲得手段
13は、声の抑揚、強さ、速さなどの音情報を獲得す
る。
【0019】意味理解手段14は、画像認識手段11と
音声認識手段12の認識結果に基づいて対話用データベ
ース15に格納した個別情報を用いて意味理解を行う。
対話促進手段16は、言語的意味のない情報を使い、相
槌をうつ、あるいは応答のタイミングを生成するととも
に、意味理解手段14からの応答文を音声合成手段17
及び画像生成手段18を使って出力する。音声合成手段
17は、意味理解手段14からの応答文を音声合成す
る。画像生成手段18は、対話相手となる擬人化エージ
ェントを合成して出力する。
音声認識手段12の認識結果に基づいて対話用データベ
ース15に格納した個別情報を用いて意味理解を行う。
対話促進手段16は、言語的意味のない情報を使い、相
槌をうつ、あるいは応答のタイミングを生成するととも
に、意味理解手段14からの応答文を音声合成手段17
及び画像生成手段18を使って出力する。音声合成手段
17は、意味理解手段14からの応答文を音声合成す
る。画像生成手段18は、対話相手となる擬人化エージ
ェントを合成して出力する。
【0020】図3は、ホームゲートウェイ1の制御部3
の構成を示す図である。図3において、制御部3は、マ
イクロコンピュータ等により構成され、さらに接続機器
制御手段19、及び複数の機器制御用データベース20
(機器制御用データベース手段)を備えて構成される。
接続機器制御手段19は、意味理解手段14からの認識
結果に基づいて機器制御用データベース20を用いて各
ネットワーク機器(接続機器9)の制御を行う。
の構成を示す図である。図3において、制御部3は、マ
イクロコンピュータ等により構成され、さらに接続機器
制御手段19、及び複数の機器制御用データベース20
(機器制御用データベース手段)を備えて構成される。
接続機器制御手段19は、意味理解手段14からの認識
結果に基づいて機器制御用データベース20を用いて各
ネットワーク機器(接続機器9)の制御を行う。
【0021】機器制御用データベース20は、機器の制
御コマンドを記録したデータベース、機器の処理手順を
記録したデータベース、接続された機器すべての稼動状
況を記録したデータベース、機器の使用優先度(プライ
オリティ)を記録したデータベース、前述のプライオリ
ティを自動的に変更するルールを記録したデータベー
ス、機器の使用制限に関する情報を記録したデータベー
ス、ユーザに対応した機器リストを記録したデータベー
スなどから構成される。
御コマンドを記録したデータベース、機器の処理手順を
記録したデータベース、接続された機器すべての稼動状
況を記録したデータベース、機器の使用優先度(プライ
オリティ)を記録したデータベース、前述のプライオリ
ティを自動的に変更するルールを記録したデータベー
ス、機器の使用制限に関する情報を記録したデータベー
ス、ユーザに対応した機器リストを記録したデータベー
スなどから構成される。
【0022】さらに、対話の際に用いる語彙、応答パタ
ーンを変えるためにデータベースを用いてもよい。この
データベースの内容は簡単に追加・削除・修正を行うこ
とができ、ユーザに合わせた応答を実現することができ
る。本実施の形態のネットワーク機器制御装置は、ユー
ザとのインタフェースにマルチモーダルインタフェース
2を用い、どのような入力デバイスからも対話形式によ
り入力できるようにしたことを特徴としている。
ーンを変えるためにデータベースを用いてもよい。この
データベースの内容は簡単に追加・削除・修正を行うこ
とができ、ユーザに合わせた応答を実現することができ
る。本実施の形態のネットワーク機器制御装置は、ユー
ザとのインタフェースにマルチモーダルインタフェース
2を用い、どのような入力デバイスからも対話形式によ
り入力できるようにしたことを特徴としている。
【0023】以下、上述のように構成されたネットワー
ク機器制御装置の動作を説明する。ここではホームゲー
トウェイ1を家庭内ネットワーク(家庭内LAN)と広
域ネットワークとの中継器と定義する。また、このホー
ムゲートウェイ1に接続しているネットワーク機器は、
パソコンなどのコンピュータ、AV機器のほかホームネ
ットワークに接続可能なすべての電子機器である。
ク機器制御装置の動作を説明する。ここではホームゲー
トウェイ1を家庭内ネットワーク(家庭内LAN)と広
域ネットワークとの中継器と定義する。また、このホー
ムゲートウェイ1に接続しているネットワーク機器は、
パソコンなどのコンピュータ、AV機器のほかホームネ
ットワークに接続可能なすべての電子機器である。
【0024】ユーザは、ホームゲートウェイ1に対し、
音声認識手段及や映像認識手段を用いて入力を行う。ホ
ームゲートウェイ1はインターネット網6、アナログ電
話網7、ISDN網8などのネットワーク網及びCCD
カメラ5、マイク4などの入力デバイスのうち1系統を
自動的に選択するマルチモーダルインタフェース2(入
力選択手段)を用いて、接続要求のあった一系統を選択
し、その系統からの入力を受け付ける。入力はすべてマ
ルチモーダルインタフェース2を使い、擬人化エージェ
ントとの対話形式で行う。ホームゲートウェイ1では、
個人認証、操作機器及び操作内容の特定を行い、必要な
コマンド体系に変換し、該当ネットワーク機器に送信す
る。
音声認識手段及や映像認識手段を用いて入力を行う。ホ
ームゲートウェイ1はインターネット網6、アナログ電
話網7、ISDN網8などのネットワーク網及びCCD
カメラ5、マイク4などの入力デバイスのうち1系統を
自動的に選択するマルチモーダルインタフェース2(入
力選択手段)を用いて、接続要求のあった一系統を選択
し、その系統からの入力を受け付ける。入力はすべてマ
ルチモーダルインタフェース2を使い、擬人化エージェ
ントとの対話形式で行う。ホームゲートウェイ1では、
個人認証、操作機器及び操作内容の特定を行い、必要な
コマンド体系に変換し、該当ネットワーク機器に送信す
る。
【0025】マルチモーダルインタフェース2の画像認
識手段11では、ユーザのジェスチャや画像による個人
認証を行う。画像認識手段11には、ユーザを識別する
ための顔の認識、身振り(ジェスチャ)の認識などが実
装される。音声認識手段12では、ユーザのしゃべった
内容を音声認識により獲得する。
識手段11では、ユーザのジェスチャや画像による個人
認証を行う。画像認識手段11には、ユーザを識別する
ための顔の認識、身振り(ジェスチャ)の認識などが実
装される。音声認識手段12では、ユーザのしゃべった
内容を音声認識により獲得する。
【0026】意味理解手段14では、画像認識手段11
と音声認識手段12の認識結果に基づいて意味理解を行
う。このとき、意味理解手段14は、ユーザ別の応答文
を作成したり、「僕の」が何を意味するのかなど対話用
データベース15に格納した個別情報を用いる。
と音声認識手段12の認識結果に基づいて意味理解を行
う。このとき、意味理解手段14は、ユーザ別の応答文
を作成したり、「僕の」が何を意味するのかなど対話用
データベース15に格納した個別情報を用いる。
【0027】また、音情報獲得手段13では、声の抑
揚、強さ、速さなどの情報を獲得する。これらの言語的
意味のない情報を使い、対話促進手段16において相槌
をうつ、あるいは応答のタイミングを生成する。同時
に、意味理解手段14からの応答文を音声合成手段17
及び画像生成手段18を使って出力する。画像生成手段
18では、対話相手となる擬人化エージェントを合成し
て出力する。
揚、強さ、速さなどの情報を獲得する。これらの言語的
意味のない情報を使い、対話促進手段16において相槌
をうつ、あるいは応答のタイミングを生成する。同時
に、意味理解手段14からの応答文を音声合成手段17
及び画像生成手段18を使って出力する。画像生成手段
18では、対話相手となる擬人化エージェントを合成し
て出力する。
【0028】音声認識の手法としては、ヒドンマルコフ
モデル(HMM)や連続DPマッチングによるキーワー
ド認識などによる既存技術のどの方法を用いてもかまわ
ない。上記画像認識手段11、音声認識手段12、音情
報獲得手段13及び意味理解手段14、対話用データベ
ース15及び対話促進手段16の動作について、さらに
具体的に説明する。
モデル(HMM)や連続DPマッチングによるキーワー
ド認識などによる既存技術のどの方法を用いてもかまわ
ない。上記画像認識手段11、音声認識手段12、音情
報獲得手段13及び意味理解手段14、対話用データベ
ース15及び対話促進手段16の動作について、さらに
具体的に説明する。
【0029】情報獲得手段13では、ユーザの対話リズ
ムを抽出し、適当なタイミングで相槌をいれるなど応答
制御に必要な情報を獲得する。ユーザが「僕の部屋のビ
デオ予約をしたいんだけど。」と発話した場合に、すべ
てのキーワードを認識できればシステムは「何時からで
すか?」とか「どの番組ですか?」と問い返すなど必要
な情報を獲得できるように誘導すればよい。一部又はす
べてのキーワードを認識できなかった場合には、「○○
さんの部屋の何を使うのですか?」とか「どのビデオを
使うのですか?」「何ですか?もう一度お願いしま
す。」のように聞き返せばよい。「今晩7時からの○○
を録画しといて」という発話に対し、意味理解手段14
と対話用データベース15及び対話促進手段16によっ
て録画可能かどうかを判断する。この場合には、インタ
ーネットテレビ番組表などを対話用データベース15に
ダウンロードしておき、ユーザの入力結果を使って検索
を行う。このとき、検索結果が0件の場合には検索条件
を緩めて候補が見つかるまで検索する。「今日、午後7
時、番組名○○」で検索し、見つからなければ時間情報
を緩める。例えば、「今、番組名○○」での検索で候補
が見つかれば、「○○は××からです。いいですか?」
と応答すればよい。見つからなければ「番組名○○」で
検索する。
ムを抽出し、適当なタイミングで相槌をいれるなど応答
制御に必要な情報を獲得する。ユーザが「僕の部屋のビ
デオ予約をしたいんだけど。」と発話した場合に、すべ
てのキーワードを認識できればシステムは「何時からで
すか?」とか「どの番組ですか?」と問い返すなど必要
な情報を獲得できるように誘導すればよい。一部又はす
べてのキーワードを認識できなかった場合には、「○○
さんの部屋の何を使うのですか?」とか「どのビデオを
使うのですか?」「何ですか?もう一度お願いしま
す。」のように聞き返せばよい。「今晩7時からの○○
を録画しといて」という発話に対し、意味理解手段14
と対話用データベース15及び対話促進手段16によっ
て録画可能かどうかを判断する。この場合には、インタ
ーネットテレビ番組表などを対話用データベース15に
ダウンロードしておき、ユーザの入力結果を使って検索
を行う。このとき、検索結果が0件の場合には検索条件
を緩めて候補が見つかるまで検索する。「今日、午後7
時、番組名○○」で検索し、見つからなければ時間情報
を緩める。例えば、「今、番組名○○」での検索で候補
が見つかれば、「○○は××からです。いいですか?」
と応答すればよい。見つからなければ「番組名○○」で
検索する。
【0030】このようにして間違いを訂正することがで
きる。すべての情報がそろった段階で、ユーザに対し確
認を行うことで確実にネットワーク機器を制御すること
ができる。意味理解手段14において、ネットワーク機
器の制御を行うことを認識した場合、その認識結果を制
御部3の接続機器制御手段19に送る。
きる。すべての情報がそろった段階で、ユーザに対し確
認を行うことで確実にネットワーク機器を制御すること
ができる。意味理解手段14において、ネットワーク機
器の制御を行うことを認識した場合、その認識結果を制
御部3の接続機器制御手段19に送る。
【0031】図3において、機器制御用データベース2
0は、機器の制御コマンドを記録したデータベース、機
器の処理手順を記録したデータベース、接続された機器
すべての稼動状況を記録したデータベース、機器の使用
優先度(プライオリティ)を記録したデータベース、前
述のプライオリティを自動的に変更するルールを記録し
たデータベース、機器の使用制限に関する情報を記録し
たデータベース、ユーザに対応した機器リストを記録し
たデータベースなどから構成され、接続機器制御手段1
9は、これらの機器制御用データベース20を用いて意
味理解手段14からの認識結果に基づいて接続機器9の
制御を行う。
0は、機器の制御コマンドを記録したデータベース、機
器の処理手順を記録したデータベース、接続された機器
すべての稼動状況を記録したデータベース、機器の使用
優先度(プライオリティ)を記録したデータベース、前
述のプライオリティを自動的に変更するルールを記録し
たデータベース、機器の使用制限に関する情報を記録し
たデータベース、ユーザに対応した機器リストを記録し
たデータベースなどから構成され、接続機器制御手段1
9は、これらの機器制御用データベース20を用いて意
味理解手段14からの認識結果に基づいて接続機器9の
制御を行う。
【0032】対話の際に用いる語彙、応答パターンを変
えるためにデータベースを用いてもよい。このデータベ
ースの内容は簡単に追加・削除・修正を行うことがで
き、ユーザに合わせた応答を実現することができる。応
答パターンを変える例を、図4のフローチャートを用い
て説明する。
えるためにデータベースを用いてもよい。このデータベ
ースの内容は簡単に追加・削除・修正を行うことがで
き、ユーザに合わせた応答を実現することができる。応
答パターンを変える例を、図4のフローチャートを用い
て説明する。
【0033】図4は、対話の応答パターンを変える動作
を示すフローチャートである。まず、ステップS1で、
本システムヘのアクセス開始時間を獲得する。これによ
り時間帯によって応答の方法を変えることができる。図
5は、対話応答パターンを記録したデータベースの一例
を示す図、図6は、交信履歴を格納するデータベースの
一例を示す図である。
を示すフローチャートである。まず、ステップS1で、
本システムヘのアクセス開始時間を獲得する。これによ
り時間帯によって応答の方法を変えることができる。図
5は、対話応答パターンを記録したデータベースの一例
を示す図、図6は、交信履歴を格納するデータベースの
一例を示す図である。
【0034】図5に示すデータベースの例では、アクセ
スしたユーザことに時間に応じて応答パターンを変える
ことができる。どの時間帯に誰がアクセスしても「こん
にちは」「どうしました?」のような特定の応答では不
自然である。特に、特定ユーザ以外の人がアクセスした
場合にも特定ユーザと同じ応答の仕方では対話としても
おかしい部分が発生する。また、ここで獲得した時間情
報はネットワーク機器の制御のためにも用いる。例え
ば、図6に示すように家族Bについて時間17:00に
なると、パターンCの応答をするとともに機器AをON
する動作を行う。次いで、ステップS2でアクセス者
(ユーザ)が誰であるのかを判別する。ユーザ別のデー
タベースを用いることにより応答パターンをユーザの好
みに変える、又はアクセス条件を変えることが実現され
る。
スしたユーザことに時間に応じて応答パターンを変える
ことができる。どの時間帯に誰がアクセスしても「こん
にちは」「どうしました?」のような特定の応答では不
自然である。特に、特定ユーザ以外の人がアクセスした
場合にも特定ユーザと同じ応答の仕方では対話としても
おかしい部分が発生する。また、ここで獲得した時間情
報はネットワーク機器の制御のためにも用いる。例え
ば、図6に示すように家族Bについて時間17:00に
なると、パターンCの応答をするとともに機器AをON
する動作を行う。次いで、ステップS2でアクセス者
(ユーザ)が誰であるのかを判別する。ユーザ別のデー
タベースを用いることにより応答パターンをユーザの好
みに変える、又はアクセス条件を変えることが実現され
る。
【0035】図7は、ユーザ認証に関するデータベース
の一例を示す図である。図7に示すデータベースの例で
は、アクセスに使った電話等の番号「090-4xxx-yyyy」
をキーにしてユーザを識別する。このとき、応答用の画
像パターン「Pattern A」、音声パターン「Pattern A」
を切り替えてもよい。また、画像認識や音声認識を使っ
てユーザを識別してもよい。
の一例を示す図である。図7に示すデータベースの例で
は、アクセスに使った電話等の番号「090-4xxx-yyyy」
をキーにしてユーザを識別する。このとき、応答用の画
像パターン「Pattern A」、音声パターン「Pattern A」
を切り替えてもよい。また、画像認識や音声認識を使っ
てユーザを識別してもよい。
【0036】次いで、ステップS3でネットワーク機器
へのアクセスを許された家族であるのかを判別する。ネ
ットワーク機器へのアクセスを許された家族であれば、
ステップS4以降でネットワーク機器の制御を行うため
の応答を行う。すなわち、ステップS4でユーザの要求
が何であるのかを認識し、ステップS5でネットワーク
機器の制御であるか否かを判別する。ネットワーク機器
の制御であるときは、ホームゲートウェイ1の制御部3
にその内容を送出する。制御部3では、対話の内容にあ
わせて家庭内の電子機器の操作を行う。例えば、伝言を
残したければ、留守番電話のように音声及び画像データ
を保存しておく。また、ビデオの録画を行いたければ、
対象機器の選定、コマンドの作成等を行い、送出すれば
よい。これらのタスクに関する操作は、制御部3により
行われる。
へのアクセスを許された家族であるのかを判別する。ネ
ットワーク機器へのアクセスを許された家族であれば、
ステップS4以降でネットワーク機器の制御を行うため
の応答を行う。すなわち、ステップS4でユーザの要求
が何であるのかを認識し、ステップS5でネットワーク
機器の制御であるか否かを判別する。ネットワーク機器
の制御であるときは、ホームゲートウェイ1の制御部3
にその内容を送出する。制御部3では、対話の内容にあ
わせて家庭内の電子機器の操作を行う。例えば、伝言を
残したければ、留守番電話のように音声及び画像データ
を保存しておく。また、ビデオの録画を行いたければ、
対象機器の選定、コマンドの作成等を行い、送出すれば
よい。これらのタスクに関する操作は、制御部3により
行われる。
【0037】一方、ネットワーク機器へのアクセスを許
された家族でなければ、ステップS6で登録されている
知人であるか否かを判別する。登録されている知人であ
れば、留守のときにはメッセージ録音を行ったり携帯電
話に転送してもよいと判断してステップS7で応答語彙
を選択し、ステップS8で応答制御を行う。応答語彙の
選択では、本システムが自動的に応答するための対話文
を作成し、ステップS8において応答を行うものであ
る。図5に示したデータベースを用いた場合、時間情報
に従った応答文を作り出すことができる。例えば、深夜
に未登録の人から電話があった場合には「今日はもう遅
いので明日にしてくれませんか?」などと応答する。
された家族でなければ、ステップS6で登録されている
知人であるか否かを判別する。登録されている知人であ
れば、留守のときにはメッセージ録音を行ったり携帯電
話に転送してもよいと判断してステップS7で応答語彙
を選択し、ステップS8で応答制御を行う。応答語彙の
選択では、本システムが自動的に応答するための対話文
を作成し、ステップS8において応答を行うものであ
る。図5に示したデータベースを用いた場合、時間情報
に従った応答文を作り出すことができる。例えば、深夜
に未登録の人から電話があった場合には「今日はもう遅
いので明日にしてくれませんか?」などと応答する。
【0038】ステップS6で登録されている知人でなけ
れば、まったく知らない第三者からの場合であると判断
してステップS9で切断処理を行って本フローを終了す
る。この切断処理では、留守であることを伝え、回線を
切断する。留守でなければ電話機接続させる。また、人
名を基に敬語を使うなど応対の仕方をかえてもよい。家
族の場合、対話の内容にあわせて家庭内の電子機器の操
作を行う。例えば、伝言を残したければ、留守番電話の
ように音声及び画像データを保存しておいてもよい。
れば、まったく知らない第三者からの場合であると判断
してステップS9で切断処理を行って本フローを終了す
る。この切断処理では、留守であることを伝え、回線を
切断する。留守でなければ電話機接続させる。また、人
名を基に敬語を使うなど応対の仕方をかえてもよい。家
族の場合、対話の内容にあわせて家庭内の電子機器の操
作を行う。例えば、伝言を残したければ、留守番電話の
ように音声及び画像データを保存しておいてもよい。
【0039】図8は、伝言内容を格納するデータベース
の一例を示す図である。図8に示すデータベースの例で
は、知人からの電話の内容を要約し、時間情報とともに
テキスト情報又は音声情報で蓄えることにした。図8で
は、ユーザ名「知人A」が相手先名「家族C」に時間2
0:03に伝言内容「○○に××で待っています。」と
いう電話内容が蓄えられている。また、ビデオの録画を
行いたければ、対象機器の選定、コマンドの作成等を行
い、送出すればよい。これらのタスクに関する操作は、
制御部3により行われる。この制御部3は、図3に示し
たように接続機器制御手段19と複数のデータベース2
0から構成されている。データベース20には、ネット
ワークに接続されている機器の情報、機器それぞれのコ
マンド情報、所有者情報などが格納されている。
の一例を示す図である。図8に示すデータベースの例で
は、知人からの電話の内容を要約し、時間情報とともに
テキスト情報又は音声情報で蓄えることにした。図8で
は、ユーザ名「知人A」が相手先名「家族C」に時間2
0:03に伝言内容「○○に××で待っています。」と
いう電話内容が蓄えられている。また、ビデオの録画を
行いたければ、対象機器の選定、コマンドの作成等を行
い、送出すればよい。これらのタスクに関する操作は、
制御部3により行われる。この制御部3は、図3に示し
たように接続機器制御手段19と複数のデータベース2
0から構成されている。データベース20には、ネット
ワークに接続されている機器の情報、機器それぞれのコ
マンド情報、所有者情報などが格納されている。
【0040】図9は、ネットワーク機器を制御するため
の動作を示すフローチャートである。まず、ステップS
11でユーザが誰であるのかユーザ名を検出する。この
ユーザ名を用いてネットワーク機器操作のプライオリテ
ィ、使用制限等を検索する。次いで、ステップS12で
制御の対象となる機器の機種名を検出し、ステップS1
3でその機器を制御できるか否かを判定する。このステ
ップS13の制御可否判定処理では、例えばテープの入
っていないビデオデッキでの録画予約はできないという
情報を検出すれば、ユーザにその情報を提示することが
できる。また、この検出結果をデータベースに逐次記録
しておけば、ユーザとの対話において時間をロスするこ
となく、ユーザに情報を提示することができる。ステッ
プS13で制御可能機器でないと判定したときはステッ
プS14の制御不能応答処理に進むが、これについて説
明する。
の動作を示すフローチャートである。まず、ステップS
11でユーザが誰であるのかユーザ名を検出する。この
ユーザ名を用いてネットワーク機器操作のプライオリテ
ィ、使用制限等を検索する。次いで、ステップS12で
制御の対象となる機器の機種名を検出し、ステップS1
3でその機器を制御できるか否かを判定する。このステ
ップS13の制御可否判定処理では、例えばテープの入
っていないビデオデッキでの録画予約はできないという
情報を検出すれば、ユーザにその情報を提示することが
できる。また、この検出結果をデータベースに逐次記録
しておけば、ユーザとの対話において時間をロスするこ
となく、ユーザに情報を提示することができる。ステッ
プS13で制御可能機器でないと判定したときはステッ
プS14の制御不能応答処理に進むが、これについて説
明する。
【0041】図10は、接続機器の稼動状況を格納した
データベースの一例を示す図である。図10に示す稼動
状況データベースは、機器の名称、固有のIPアドレ
ス、稼動状況から構成されている。例えば、機器の名称
「32C-PD1」については、固有のIPアドレス「1.233.2
51.10」、稼動状況「Power(off)」が格納されている。
それぞれの機器に制御信号を送信する前に機器の稼動状
況を格納したデータベースを検索し、機器の状態を把握
する必要がある。電源が入っていない、又はつながって
いないなど使用不可の状態の場合に制御コマンドを送信
してもエラーを起こすことは予期できる。この場合に
は、図9のステップS14で制御できない機器であるこ
とを伝えるための応答文を作成し、出力して本フローを
終了する。
データベースの一例を示す図である。図10に示す稼動
状況データベースは、機器の名称、固有のIPアドレ
ス、稼動状況から構成されている。例えば、機器の名称
「32C-PD1」については、固有のIPアドレス「1.233.2
51.10」、稼動状況「Power(off)」が格納されている。
それぞれの機器に制御信号を送信する前に機器の稼動状
況を格納したデータベースを検索し、機器の状態を把握
する必要がある。電源が入っていない、又はつながって
いないなど使用不可の状態の場合に制御コマンドを送信
してもエラーを起こすことは予期できる。この場合に
は、図9のステップS14で制御できない機器であるこ
とを伝えるための応答文を作成し、出力して本フローを
終了する。
【0042】また、待機状態の場合か稼動状態かによっ
ても処理の手順が異なってくる。このために稼動状況を
格納したデータベースが必要である。ステップS13で
制御可能機器であると判定したときは、ステップS15
で入力しようとしているコマンドがすでに入力されてい
る情報と競合するか否かを判定する。この場合、すでに
予約状態にあるなどの競合状況を確認の上、制御を行う
こととする。競合を解決する手段の1つとして、別に定
めたデータベースに従った優先順位による制御を行って
もよい。以下、このデータベースによる例について説明
する。
ても処理の手順が異なってくる。このために稼動状況を
格納したデータベースが必要である。ステップS13で
制御可能機器であると判定したときは、ステップS15
で入力しようとしているコマンドがすでに入力されてい
る情報と競合するか否かを判定する。この場合、すでに
予約状態にあるなどの競合状況を確認の上、制御を行う
こととする。競合を解決する手段の1つとして、別に定
めたデータベースに従った優先順位による制御を行って
もよい。以下、このデータベースによる例について説明
する。
【0043】図11は、接続機器の使用に関する優先度
を記載したデータベースの一例を示す図、図12は、接
続機器の使用に関する優先度を自動的に変更するルール
を記載したデータベースの一例を示す図である。図11
に示すデータベースの例では、ユーザごとに時間情報、
使用可能な機器の名称、制御コマンドリスト及び優先度
を格納しておき、状況に応じて優先順位を選択する。例
えば、ユーザ名「A」については、時間20:00−2
2:00では、機器名「32C-PD1」を制御名「Play」、
優先度「1.0」が与えられており、ユーザ名「B」に
ついては、時間18:00−19:00では、機器名
「32C-PD1」を制御名「Play」、優先度「1.0」が与
えられている。この例では、該当ユーザは該当する時間
の該当機器については他のユーザよりも優先的に使用す
ることができる。
を記載したデータベースの一例を示す図、図12は、接
続機器の使用に関する優先度を自動的に変更するルール
を記載したデータベースの一例を示す図である。図11
に示すデータベースの例では、ユーザごとに時間情報、
使用可能な機器の名称、制御コマンドリスト及び優先度
を格納しておき、状況に応じて優先順位を選択する。例
えば、ユーザ名「A」については、時間20:00−2
2:00では、機器名「32C-PD1」を制御名「Play」、
優先度「1.0」が与えられており、ユーザ名「B」に
ついては、時間18:00−19:00では、機器名
「32C-PD1」を制御名「Play」、優先度「1.0」が与
えられている。この例では、該当ユーザは該当する時間
の該当機器については他のユーザよりも優先的に使用す
ることができる。
【0044】また、図12に示すデータベースの例で
は、プライオリティを自動的に変動させるよう過去の履
歴を用いて優先順位を自動的に変えることができる。例
えば、ユーザ名「A」については、条件「使用頻度X>
閾値Y」の条件では、優先度Zは0.1減算され(Z-=
0.1)た変更値となり、前記条件を満たす毎に優先度は
変更され、優先順位は自動的に変更されることになる。
は、プライオリティを自動的に変動させるよう過去の履
歴を用いて優先順位を自動的に変えることができる。例
えば、ユーザ名「A」については、条件「使用頻度X>
閾値Y」の条件では、優先度Zは0.1減算され(Z-=
0.1)た変更値となり、前記条件を満たす毎に優先度は
変更され、優先順位は自動的に変更されることになる。
【0045】図11に示すプライオリティデータベース
や図12に示すプライオリティ変更ルールデータベース
は、ユーザの意向により変動するものであるため、簡単
に書き換えられる必要がある。このためには優先度及び
変更ルールを簡単に書き換えられるようデータベースと
して管理する必要がある。先順位の高い制御が予約され
ていている場合には、凝人化エージェントとの対話の段
階で拒絶してもよい。システムを使用しているユーザ間
だけで競合を解消できる場合にはユーザに支援を求める
手段を用いてそのユーザ(予約されている制御を指示し
たユーザ)を呼び出し、支援を求めてもよい。優先度の
高い制御予約を行ったユーザが屋外にいるような場合に
は、ユーザを呼び出す手段を用いてユーザを呼び出し、
支援を求めればよい。呼び出す手段としては明らかに屋
外にいるならば携帯電話等を用いるのが一般的である。
E−Mailを使って支援を求めてもよい。優先順位が
低い場合にも単純に上書きするのではなく、擬人化エー
ジェントが先の予約をしたユーザを呼び出し、上書きさ
れる旨を伝える必要がある。
や図12に示すプライオリティ変更ルールデータベース
は、ユーザの意向により変動するものであるため、簡単
に書き換えられる必要がある。このためには優先度及び
変更ルールを簡単に書き換えられるようデータベースと
して管理する必要がある。先順位の高い制御が予約され
ていている場合には、凝人化エージェントとの対話の段
階で拒絶してもよい。システムを使用しているユーザ間
だけで競合を解消できる場合にはユーザに支援を求める
手段を用いてそのユーザ(予約されている制御を指示し
たユーザ)を呼び出し、支援を求めてもよい。優先度の
高い制御予約を行ったユーザが屋外にいるような場合に
は、ユーザを呼び出す手段を用いてユーザを呼び出し、
支援を求めればよい。呼び出す手段としては明らかに屋
外にいるならば携帯電話等を用いるのが一般的である。
E−Mailを使って支援を求めてもよい。優先順位が
低い場合にも単純に上書きするのではなく、擬人化エー
ジェントが先の予約をしたユーザを呼び出し、上書きさ
れる旨を伝える必要がある。
【0046】図9に戻って、ステップS15で競合状況
あるときは、ステップS17でこれらの競合情報を提示
し、ステップS12に戻る。競合しない場合にはステッ
プS16で制御完了応答を実行し、その結果を出力して
本フローを終了する。この制御完了応答を制御を実行す
るためには、操作コマンドや送信手順を格納したデータ
ベースを参照し、適切な手順でコマンドを送信する必要
がある。以下、図13及び図14により説明する。
あるときは、ステップS17でこれらの競合情報を提示
し、ステップS12に戻る。競合しない場合にはステッ
プS16で制御完了応答を実行し、その結果を出力して
本フローを終了する。この制御完了応答を制御を実行す
るためには、操作コマンドや送信手順を格納したデータ
ベースを参照し、適切な手順でコマンドを送信する必要
がある。以下、図13及び図14により説明する。
【0047】図13は、接続機器に送信するコマンドを
格納したデータベースの一例を示す図、図14は、接続
機器にコマンドを送信する手順を記載したデータベース
の一例を示す図である。例えば、図13に示すように機
器ごとに異なる制御コマンドに変換して送出する必要が
ある。例えば、機器名(型番)「32C-PD1」について
は、固有のIPアドレス「1.233.251.10」、制御名「再
生」、制御コマンド「Send“Play”)」が格納されてい
る。送出の方法は有線でもよいし、赤外線での送信でも
よい。
格納したデータベースの一例を示す図、図14は、接続
機器にコマンドを送信する手順を記載したデータベース
の一例を示す図である。例えば、図13に示すように機
器ごとに異なる制御コマンドに変換して送出する必要が
ある。例えば、機器名(型番)「32C-PD1」について
は、固有のIPアドレス「1.233.251.10」、制御名「再
生」、制御コマンド「Send“Play”)」が格納されてい
る。送出の方法は有線でもよいし、赤外線での送信でも
よい。
【0048】また、図14のデータベースに示すように
複数のコマンドを同時に送信する必要がある場合も存在
する。例えば、電源が入っていない、又は待機状態であ
るテレビに対して特定チャンネルを表示させるためには
“電源を入れ”て、“チャンネルを合わせる”という手
順が必要である。このような処理手順を記録したデータ
ベースも必要である。この例として、図14では、機器
名(型番)「32C-PD1」については、固有のIPアドレ
ス「1.233.251.10」、制御手順「Play:-Power(ON),Chan
ge(Channel).」が格納されている。
複数のコマンドを同時に送信する必要がある場合も存在
する。例えば、電源が入っていない、又は待機状態であ
るテレビに対して特定チャンネルを表示させるためには
“電源を入れ”て、“チャンネルを合わせる”という手
順が必要である。このような処理手順を記録したデータ
ベースも必要である。この例として、図14では、機器
名(型番)「32C-PD1」については、固有のIPアドレ
ス「1.233.251.10」、制御手順「Play:-Power(ON),Chan
ge(Channel).」が格納されている。
【0049】また、最近では家庭内においても個人所有
の機器が増えているため、ユーザことに機器の使用制限
に関する情報を格納したデータベースを設けてもよい。
操作権限のない機器の操作を排除する手段を設けること
により、例えば火気関連機器については保護者監督のも
と以外での使用を制限することができるという利点もあ
る。さらに、同様の機能をもつ機器が複数ある場合にど
ちらを使うかの判断にもこの使用制限を使うことができ
る。「使っていい」か、「だめ」かだけでなく、条件に
よっては使ってもよいなどの使用制限を設けてもよい。
この条件には時間的な要素により場合わけをしてもよ
い。
の機器が増えているため、ユーザことに機器の使用制限
に関する情報を格納したデータベースを設けてもよい。
操作権限のない機器の操作を排除する手段を設けること
により、例えば火気関連機器については保護者監督のも
と以外での使用を制限することができるという利点もあ
る。さらに、同様の機能をもつ機器が複数ある場合にど
ちらを使うかの判断にもこの使用制限を使うことができ
る。「使っていい」か、「だめ」かだけでなく、条件に
よっては使ってもよいなどの使用制限を設けてもよい。
この条件には時間的な要素により場合わけをしてもよ
い。
【0050】ネットワーク機器のデバイスドライバーな
どのソフトウェアは、頻繁にそのバージョンが変わって
いるため、ソフトウェアのバージョンを管理する手段、
現在のソフトウェアよりも新しいバージョンのソフトウ
ェアを見つけた場合に自動的にダウンロードして、イン
ストールする手段を設けることで製品寿命を延ばすこと
ができる。ソフトウェアをダウンロードするタイミング
は、定期的にメーカーのインターネットサイトを検索し
に行く、あるいはメーカー側から各家庭に対して擬人化
エージェントによる配信を行い、音声対話により自動的
にドライバー等のソフトウェアを更新してもよい。
どのソフトウェアは、頻繁にそのバージョンが変わって
いるため、ソフトウェアのバージョンを管理する手段、
現在のソフトウェアよりも新しいバージョンのソフトウ
ェアを見つけた場合に自動的にダウンロードして、イン
ストールする手段を設けることで製品寿命を延ばすこと
ができる。ソフトウェアをダウンロードするタイミング
は、定期的にメーカーのインターネットサイトを検索し
に行く、あるいはメーカー側から各家庭に対して擬人化
エージェントによる配信を行い、音声対話により自動的
にドライバー等のソフトウェアを更新してもよい。
【0051】さらに、接続しているネットワーク機器が
故障した場合の対処方法を記録したデータベースも必要
である。稼動状況を記録したデータベースをユーザが見
れば故障かどうかは判断ができるが、常に監視すること
はできない。そこで故障診断を行う手段によりシステム
が故障と判断した時点で故障発生時対応ルールに従って
ユーザ及びメーカーに対して情報を通知する手段により
通知することで損害を最小限で防ぐことができる。
故障した場合の対処方法を記録したデータベースも必要
である。稼動状況を記録したデータベースをユーザが見
れば故障かどうかは判断ができるが、常に監視すること
はできない。そこで故障診断を行う手段によりシステム
が故障と判断した時点で故障発生時対応ルールに従って
ユーザ及びメーカーに対して情報を通知する手段により
通知することで損害を最小限で防ぐことができる。
【0052】図15は、故障発生時の対応ルールを格納
したデータベースの一例を示す図である。図15に示す
例では、故障検出の時間と機器名に従って対処方法を変
えている。昼間(ここでは10:00〜17:00)に
故障が発生した場合には、製造メーカーに故障発生を通
知(Call Maker)し、その対処を待てばよい。通知の方
法はE−Mailでもよいし、合成音による音声対話形
式でもよい。夜間(ここでは17:00〜24:00)
であれば製造メーカーの対応も遅れることが予想される
ため、E−Mail等で製造メーカーに連絡をとる(Ma
il to Maker)とともに、ユーザに対しても故障発生を
通知する必要がある。故障診断の結果を蓄積する手段を
設けることにより、故障機器を使うことなく、ユーザの
制御命令を実行することができる。
したデータベースの一例を示す図である。図15に示す
例では、故障検出の時間と機器名に従って対処方法を変
えている。昼間(ここでは10:00〜17:00)に
故障が発生した場合には、製造メーカーに故障発生を通
知(Call Maker)し、その対処を待てばよい。通知の方
法はE−Mailでもよいし、合成音による音声対話形
式でもよい。夜間(ここでは17:00〜24:00)
であれば製造メーカーの対応も遅れることが予想される
ため、E−Mail等で製造メーカーに連絡をとる(Ma
il to Maker)とともに、ユーザに対しても故障発生を
通知する必要がある。故障診断の結果を蓄積する手段を
設けることにより、故障機器を使うことなく、ユーザの
制御命令を実行することができる。
【0053】接続された機器の操作方法を格納したデー
タベースを設けることにより、機器を使うユーザを支援
することができる。例えば本実施の形態の制御方法を用
いずに機器単独での操作をユーザが試みる場合に使用方
法を教示することができる。教示の方法としては、CG
映像やビデオ映像、合成音声などを用いることができ
る。どのボタンを押したらいいか、わからない場合には
合成音声とCG映像を使うとわかりやすい。操作方法
は、インターネットを使ってダウンロードするか、ある
いは製品を購入した時点で、CD−ROM等のメディア
を使って登録してもよい。こうして、擬人化エージェン
トとの音声対話によるホームゲートウェイ1を使うこと
で、どのような入力方法を用いた場合でも同様の効果を
得ることができると同時にインターネットを利用したさ
まざまなサービスを受けることができる。
タベースを設けることにより、機器を使うユーザを支援
することができる。例えば本実施の形態の制御方法を用
いずに機器単独での操作をユーザが試みる場合に使用方
法を教示することができる。教示の方法としては、CG
映像やビデオ映像、合成音声などを用いることができ
る。どのボタンを押したらいいか、わからない場合には
合成音声とCG映像を使うとわかりやすい。操作方法
は、インターネットを使ってダウンロードするか、ある
いは製品を購入した時点で、CD−ROM等のメディア
を使って登録してもよい。こうして、擬人化エージェン
トとの音声対話によるホームゲートウェイ1を使うこと
で、どのような入力方法を用いた場合でも同様の効果を
得ることができると同時にインターネットを利用したさ
まざまなサービスを受けることができる。
【0054】以上のように、本実施の形態のホームゲー
トウェイ1は、電話網、インターネット網等の各種ネッ
トワーク、カメラ、マイクロフォン等の複数の入力のう
ち1系統を対話形式により選択するマルチモーダルイン
ターフェース2と、ネットワークに接続されているネッ
トワーク機器の情報、該機器それぞれのコマンド情報、
所有者情報などを格納する機器制御用データベース20
と、前記マルチモーダルインターフェースの出力により
前記複数のネットワーク機器のうち少なくとも1つを制
御する接続機器制御手段19とからなる制御部3を備
え、マルチモーダルインターフェース2は、さらに音情
報と意味理解手段14からの意味理解情報に基づいて相
槌を打つ、応答タイミングを決定する等の対話を促す情
報を生成する対話促進手段16を備えて構成したので、
ユーザは擬人化エージェントとの対話によりネットワー
クに接続された機器を統一的に制御することができる。
トウェイ1は、電話網、インターネット網等の各種ネッ
トワーク、カメラ、マイクロフォン等の複数の入力のう
ち1系統を対話形式により選択するマルチモーダルイン
ターフェース2と、ネットワークに接続されているネッ
トワーク機器の情報、該機器それぞれのコマンド情報、
所有者情報などを格納する機器制御用データベース20
と、前記マルチモーダルインターフェースの出力により
前記複数のネットワーク機器のうち少なくとも1つを制
御する接続機器制御手段19とからなる制御部3を備
え、マルチモーダルインターフェース2は、さらに音情
報と意味理解手段14からの意味理解情報に基づいて相
槌を打つ、応答タイミングを決定する等の対話を促す情
報を生成する対話促進手段16を備えて構成したので、
ユーザは擬人化エージェントとの対話によりネットワー
クに接続された機器を統一的に制御することができる。
【0055】また、対話機能による、認識できない部分
のみを聞き返すことによりユーザに不快感を与えること
なく認識精度を向上させ、対話を通じて同一ネットワー
ク上にある機器を操作することができる。また、意味理
解手段14に個人情報、時間情報を持たせることでいろ
いろな対話応答が実現できる。接続機器制御手段19に
個人情報に関する機器制御用データベース20を接続す
ることで機器の選定、制御セキュリティ等を実現するこ
とができる。また、インターネット等の回線を利用して
ネットワーク機器のメーカー及びメンテナンス会社より
該当機器の保守を行うことができる。
のみを聞き返すことによりユーザに不快感を与えること
なく認識精度を向上させ、対話を通じて同一ネットワー
ク上にある機器を操作することができる。また、意味理
解手段14に個人情報、時間情報を持たせることでいろ
いろな対話応答が実現できる。接続機器制御手段19に
個人情報に関する機器制御用データベース20を接続す
ることで機器の選定、制御セキュリティ等を実現するこ
とができる。また、インターネット等の回線を利用して
ネットワーク機器のメーカー及びメンテナンス会社より
該当機器の保守を行うことができる。
【0056】また、本実施の形態では、図9の処理にお
いて、制御情報に則った操作を行うことが可能かどうか
を検証するように制御しているので、不可能な場合には
実際に制御信号を発することなくその結果をユーザに提
示することが可能であり、不要な通信コストを下げるこ
とができる。また、図9の処理において、競合を解決す
るように制御したので、複数ユーザで同一システムを共
有することが可能であり、共有によって生じる競合を最
小限にとどめることができる。
いて、制御情報に則った操作を行うことが可能かどうか
を検証するように制御しているので、不可能な場合には
実際に制御信号を発することなくその結果をユーザに提
示することが可能であり、不要な通信コストを下げるこ
とができる。また、図9の処理において、競合を解決す
るように制御したので、複数ユーザで同一システムを共
有することが可能であり、共有によって生じる競合を最
小限にとどめることができる。
【0057】また、本実施の形態では、ユーザに支援を
求める手段を備えているので、システム自体で解決でき
ない競合の解決をユーザに求めることが可能であり、競
合を最小限にとどめることができる。さらに、ユーザを
呼び出す手段を設けているので、競合解消のためにネッ
トワークにログインしていないユーザを呼び出すことが
可能であり、ユーザ間の競合をスムーズに解消すること
ができる。
求める手段を備えているので、システム自体で解決でき
ない競合の解決をユーザに求めることが可能であり、競
合を最小限にとどめることができる。さらに、ユーザを
呼び出す手段を設けているので、競合解消のためにネッ
トワークにログインしていないユーザを呼び出すことが
可能であり、ユーザ間の競合をスムーズに解消すること
ができる。
【0058】また、本実施の形態では、図13及び図1
4に示すデータベースを用いて、接続された機器に対し
て故障診断を行う手段とその結果を蓄積する手段とを設
けるようにすれば、接続機器に故障が発生した場合でも
ユーザ及びメーカーに対し情報を通知することが可能で
あり、安定した運用を実現することができる。さらに、
図15に示すデータベースを用いて、接続された機器に
搭載されたソフトウェアのバージョンを管理する手段
と、最新のモジュールをダウンロードし、インストール
する手段を設けるようにすれば、接続機器のソフトウェ
アのバグを自動的に補正することが可能であり、安定し
た運用を実現することができる。
4に示すデータベースを用いて、接続された機器に対し
て故障診断を行う手段とその結果を蓄積する手段とを設
けるようにすれば、接続機器に故障が発生した場合でも
ユーザ及びメーカーに対し情報を通知することが可能で
あり、安定した運用を実現することができる。さらに、
図15に示すデータベースを用いて、接続された機器に
搭載されたソフトウェアのバージョンを管理する手段
と、最新のモジュールをダウンロードし、インストール
する手段を設けるようにすれば、接続機器のソフトウェ
アのバグを自動的に補正することが可能であり、安定し
た運用を実現することができる。
【0059】なお、本発明のマルチモーダルインタフェ
ースを用いたネットワーク機器制御装置は、上述の実施
の形態に限定されるものではなく、本発明の要旨を逸脱
しない範囲内において種々変更を加え得ることは勿論で
ある。例えば、上述したようなプロトコル変換等を行う
ホームゲートウェイに適用することもできるが、これに
は限定されず、全ての装置に適用可能である。
ースを用いたネットワーク機器制御装置は、上述の実施
の形態に限定されるものではなく、本発明の要旨を逸脱
しない範囲内において種々変更を加え得ることは勿論で
ある。例えば、上述したようなプロトコル変換等を行う
ホームゲートウェイに適用することもできるが、これに
は限定されず、全ての装置に適用可能である。
【0060】また、上記実施の形態で説明したマルチモ
ーダルインタフェースへ入力される複数の入力デバイス
の種類やマルチモーダルインタフェースにおける認識手
段や対話方法、さらには対話形式で制御されるネットワ
ーク機器の数、種類は一例であり、対話促進手段を有す
るマルチモーダルインタフェースであればどのようなも
のでもよく、同様な効果を得ることができる。さらに、
上記ネットワーク機器制御装置を構成する各回路部等の
種類、データベースなどは前述した実施形態に限られな
い。
ーダルインタフェースへ入力される複数の入力デバイス
の種類やマルチモーダルインタフェースにおける認識手
段や対話方法、さらには対話形式で制御されるネットワ
ーク機器の数、種類は一例であり、対話促進手段を有す
るマルチモーダルインタフェースであればどのようなも
のでもよく、同様な効果を得ることができる。さらに、
上記ネットワーク機器制御装置を構成する各回路部等の
種類、データベースなどは前述した実施形態に限られな
い。
【0061】
【発明の効果】以上、詳述したように、請求項1に記載
の発明によれば、擬人化エージェントとの対話によりネ
ットワークに接続された機器を統一的に制御することが
できる。また、問い返し、相槌などの応答をすることが
可能であり、その結果スムーズな対話により機器の制御
ができる。
の発明によれば、擬人化エージェントとの対話によりネ
ットワークに接続された機器を統一的に制御することが
できる。また、問い返し、相槌などの応答をすることが
可能であり、その結果スムーズな対話により機器の制御
ができる。
【0062】また、音声の強弱、音の高低の特徴、ユー
ザの身振り、音声認識の結果のうち少なくとも2つ以上
を入力とする対話促進手段を設けているので、人間と同
じような応答を実現することが可能であり、その結果ス
ムーズな対話を実現することができる。また、ユーザ別
のデータベース手段を設けているので、アクセス方法、
時間情報、ユーザ名などをキーとして異なった応答を生
成することが可能であり、人間と話すようにストレスを
感じない対話を実現することができる。
ザの身振り、音声認識の結果のうち少なくとも2つ以上
を入力とする対話促進手段を設けているので、人間と同
じような応答を実現することが可能であり、その結果ス
ムーズな対話を実現することができる。また、ユーザ別
のデータベース手段を設けているので、アクセス方法、
時間情報、ユーザ名などをキーとして異なった応答を生
成することが可能であり、人間と話すようにストレスを
感じない対話を実現することができる。
【0063】さらに、接続された機器の操作方法を格納
したデータベースとCG映像、ビデオ映像、合成音声の
うち2つ以上を使って教示する手段を設けているので、
使用方法がわからないユーザにその方法を教示すること
が可能であり、新しい機器を接続してもすぐに使えるよ
うになる。
したデータベースとCG映像、ビデオ映像、合成音声の
うち2つ以上を使って教示する手段を設けているので、
使用方法がわからないユーザにその方法を教示すること
が可能であり、新しい機器を接続してもすぐに使えるよ
うになる。
【0064】請求項2に記載の発明によれば、例えば同
一のネットワーク上に接続された機器の操作コマンド及
び送信手順を格納したデータベース手段を設けているの
で、処理手順を考えることなく接続機器を制御すること
可能であり、音声対話によりネットワーク機器を制御す
ることができる。請求項3に記載の発明によれば、機器
の使用制限に関する情報を格納したデータベース手段を
設けているので、操作権限のない機器の操作を排除する
ことが可能であり、安全性を確保することができる。
一のネットワーク上に接続された機器の操作コマンド及
び送信手順を格納したデータベース手段を設けているの
で、処理手順を考えることなく接続機器を制御すること
可能であり、音声対話によりネットワーク機器を制御す
ることができる。請求項3に記載の発明によれば、機器
の使用制限に関する情報を格納したデータベース手段を
設けているので、操作権限のない機器の操作を排除する
ことが可能であり、安全性を確保することができる。
【図1】本発明の実施の形態のネットワーク機器制御装
置の構成を示すブロック図である。
置の構成を示すブロック図である。
【図2】本発明の実施の形態のネットワーク機器制御装
置のホームゲートウェイを構成するマルチモーダルイン
タフェースの構成を示す図である。
置のホームゲートウェイを構成するマルチモーダルイン
タフェースの構成を示す図である。
【図3】本実施の形態のネットワーク機器制御装置のホ
ームゲートウェイの制御部の構成を示す図である。
ームゲートウェイの制御部の構成を示す図である。
【図4】本実施の形態のネットワーク機器制御装置の対
話の応答パターンを変える動作を示すフローチャートで
ある。
話の応答パターンを変える動作を示すフローチャートで
ある。
【図5】本実施の形態のネットワーク機器制御装置の対
話応答パターンを記録したデータベースの一例を示す図
である。
話応答パターンを記録したデータベースの一例を示す図
である。
【図6】本実施の形態のネットワーク機器制御装置の交
信履歴を格納するデータベースの一例を示す図である。
信履歴を格納するデータベースの一例を示す図である。
【図7】本実施の形態のネットワーク機器制御装置のユ
ーザ認証に関するデータベースの一例を示す図である。
ーザ認証に関するデータベースの一例を示す図である。
【図8】本実施の形態のネットワーク機器制御装置の伝
言内容を格納するデータベースの一例を示す図である。
言内容を格納するデータベースの一例を示す図である。
【図9】本実施の形態のネットワーク機器制御装置のネ
ットワーク機器を制御するための動作を示すフローチャ
ートである。
ットワーク機器を制御するための動作を示すフローチャ
ートである。
【図10】本実施の形態のネットワーク機器制御装置の
接続機器の稼動状況を格納したデータベースの一例を示
す図である。
接続機器の稼動状況を格納したデータベースの一例を示
す図である。
【図11】本実施の形態のネットワーク機器制御装置の
接続機器の使用に関する優先度を記載したデータベース
の一例を示す図である。
接続機器の使用に関する優先度を記載したデータベース
の一例を示す図である。
【図12】本実施の形態のネットワーク機器制御装置の
接続機器の使用に関する優先度を自動的に変更するルー
ルを記載したデータベースの一例を示す図である。
接続機器の使用に関する優先度を自動的に変更するルー
ルを記載したデータベースの一例を示す図である。
【図13】本実施の形態のネットワーク機器制御装置の
接続機器に送信するコマンドを格納したデータベースの
一例を示す図である。
接続機器に送信するコマンドを格納したデータベースの
一例を示す図である。
【図14】本実施の形態のネットワーク機器制御装置の
接続機器にコマンドを送信する手順を記載したデータベ
ースの一例を示す図である。
接続機器にコマンドを送信する手順を記載したデータベ
ースの一例を示す図である。
【図15】本実施の形態のネットワーク機器制御装置の
故障発生時の対応ルールを格納したデータベースの一例
を示す図である。
故障発生時の対応ルールを格納したデータベースの一例
を示す図である。
1 ホームゲートウェイ 2 マルチモーダルインタフェース 3 制御部 4 マイクロフォン 5 カメラ 6 インターネット網 7 アナログ電話網 8 ISDN網 9 接続機器 11 画像認識手段 12 音声認識手段 13 音情報獲得手段 14 意味理解手段 15 対話用データベース(意味理解用データベース手
段) 16 対話促進手段 17 音声合成手段 18 画像生成手段 19 接続機器制御手段 20 機器制御用データベース(機器制御用データベー
ス手段)
段) 16 対話促進手段 17 音声合成手段 18 画像生成手段 19 接続機器制御手段 20 機器制御用データベース(機器制御用データベー
ス手段)
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 3/16 330 G06F 3/16 330K 5K033 330C 5K048 13/00 357 13/00 357A 5K101 G10L 13/00 H04M 11/00 301 9A001 15/18 H04Q 9/00 301E 15/00 321E H04L 12/28 331A 12/24 G10L 3/00 Q 12/26 R H04M 11/00 301 537Z H04Q 9/00 301 551A 321 H04L 11/00 310Z 331 11/08 Fターム(参考) 5B089 GA31 GB08 JB03 JB05 KA01 KC44 KC53 KC54 KC58 KH15 KH16 5D015 AA05 KK02 LL06 5D045 AB26 5E501 AA13 AC15 AC25 AC42 BA05 CA08 CB15 CC11 EA21 FA14 FA32 FA43 5K030 GA15 GA17 HA08 HB01 HB02 HC01 HD03 JL09 KA07 KA20 LD20 LE11 MB09 5K033 AA05 BA08 BA14 DA06 DB18 5K048 AA04 BA02 BA12 BA13 CA08 DA02 DA05 DC04 DC07 EA11 EB14 EB15 FB10 FB12 FC01 HA01 HA02 HA05 HA07 5K101 KK11 LL01 LL03 LL05 NN06 NN08 NN16 NN21 NN34 NN37 PP03 TT06 UU19 9A001 BB04 CC07 DD11 HH17 HH18 HH22 HH28 JJ01 JJ12 JJ25 KK54 LL03
Claims (3)
- 【請求項1】 入力デバイスを対話形式により選択する
マルチモーダルインターフェースと、 ネットワークに接続される複数のネットワーク機器の情
報を格納する機器制御用データベース手段と、 前記マルチモーダルインターフェースの出力により前記
複数のネットワーク機器のうち少なくとも1つを制御す
る接続機器制御手段とを備え、 前記マルチモーダルインターフェースは、 画像又は音声を認識する認識手段と、 声の抑揚、強さ、速さなどの音情報を獲得する音情報獲
得手段と、 意味理解のための情報を格納する意味理解用データベー
ス手段と、 前記認識手段による認識結果及び前記意味理解用データ
ベース手段に格納されたデータに基づいて意味理解を行
う意味理解手段と、 前記音情報と前記意味理解情報に基づいて対話を促す情
報を生成する対話促進手段と、 前記対話促進手段からの出力を画像又は音声により合成
して出力する合成手段と、 を備えることを特徴とするネットワーク制御装置。 - 【請求項2】 前記機器制御用データベース手段は、前
記ネットワーク機器の操作コマンド及び送信手順を格納
しており、 前記接続機器制御手段は、ユーザとの対話の結果から前
記操作コマンドを検索し、前記ネットワーク機器に送信
することを特徴とする請求項1記載のネットワーク機器
制御装置。 - 【請求項3】 前記機器制御用データベースは、前記ネ
ットワーク機器の使用制限に関する情報を格納してお
り、 前記接続機器制御手段は、前記使用制限に関する情報に
基づいて操作権限のない機器の操作を排除することを特
徴とする請求項1記載のネットワーク機器制御装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000115703A JP2001306199A (ja) | 2000-04-17 | 2000-04-17 | ネットワーク機器制御装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000115703A JP2001306199A (ja) | 2000-04-17 | 2000-04-17 | ネットワーク機器制御装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001306199A true JP2001306199A (ja) | 2001-11-02 |
Family
ID=18627290
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000115703A Pending JP2001306199A (ja) | 2000-04-17 | 2000-04-17 | ネットワーク機器制御装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001306199A (ja) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005196134A (ja) * | 2003-12-12 | 2005-07-21 | Toyota Central Res & Dev Lab Inc | 音声対話システム及び方法並びに音声対話プログラム |
JP2007142588A (ja) * | 2005-11-15 | 2007-06-07 | Nec Corp | 電話通信システム |
JP2007213285A (ja) * | 2006-02-09 | 2007-08-23 | Kenwood Corp | 予約装置及びプログラム |
JP2008514983A (ja) * | 2004-09-27 | 2008-05-08 | ロバート ボッシュ コーポレーション | デバイスの認知的に過負荷なユーザのインタラクティブ会話型対話 |
US7584280B2 (en) | 2003-11-14 | 2009-09-01 | Electronics And Telecommunications Research Institute | System and method for multi-modal context-sensitive applications in home network environment |
KR101195928B1 (ko) | 2006-05-04 | 2012-10-30 | 삼성전자주식회사 | 사용자 인터페이스를 통한 이용 가능한 작업의 일반적이고탄력적인 접근을 위한 방법 및 시스템 |
JP2012238943A (ja) * | 2011-05-10 | 2012-12-06 | Nippon Telegr & Teleph Corp <Ntt> | ホームネットワークにおけるアクセス制御方法およびこれを用いるホームゲートウェイ装置 |
JP2016082336A (ja) * | 2014-10-14 | 2016-05-16 | シャープ株式会社 | 遠隔操作システムおよび電子機器 |
CN109729454A (zh) * | 2017-10-27 | 2019-05-07 | 北京金锐德路科技有限公司 | 用于脖戴式语音交互耳机的声麦处理装置 |
CN109729462A (zh) * | 2017-10-27 | 2019-05-07 | 北京金锐德路科技有限公司 | 用于脖戴式语音交互耳机的骨麦处理装置 |
WO2019235190A1 (ja) * | 2018-06-06 | 2019-12-12 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム及び対話システム |
CN112575501A (zh) * | 2019-09-12 | 2021-03-30 | 青岛海尔洗衣机有限公司 | 用于衣物处理设备的程序升级控制方法 |
WO2021140816A1 (ja) * | 2020-01-07 | 2021-07-15 | ソニーグループ株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
-
2000
- 2000-04-17 JP JP2000115703A patent/JP2001306199A/ja active Pending
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7584280B2 (en) | 2003-11-14 | 2009-09-01 | Electronics And Telecommunications Research Institute | System and method for multi-modal context-sensitive applications in home network environment |
JP2005196134A (ja) * | 2003-12-12 | 2005-07-21 | Toyota Central Res & Dev Lab Inc | 音声対話システム及び方法並びに音声対話プログラム |
JP4729902B2 (ja) * | 2003-12-12 | 2011-07-20 | 株式会社豊田中央研究所 | 音声対話システム |
JP2008514983A (ja) * | 2004-09-27 | 2008-05-08 | ロバート ボッシュ コーポレーション | デバイスの認知的に過負荷なユーザのインタラクティブ会話型対話 |
JP4586713B2 (ja) * | 2005-11-15 | 2010-11-24 | 日本電気株式会社 | 電話通信システム |
JP2007142588A (ja) * | 2005-11-15 | 2007-06-07 | Nec Corp | 電話通信システム |
JP2007213285A (ja) * | 2006-02-09 | 2007-08-23 | Kenwood Corp | 予約装置及びプログラム |
KR101195928B1 (ko) | 2006-05-04 | 2012-10-30 | 삼성전자주식회사 | 사용자 인터페이스를 통한 이용 가능한 작업의 일반적이고탄력적인 접근을 위한 방법 및 시스템 |
JP2012238943A (ja) * | 2011-05-10 | 2012-12-06 | Nippon Telegr & Teleph Corp <Ntt> | ホームネットワークにおけるアクセス制御方法およびこれを用いるホームゲートウェイ装置 |
JP2016082336A (ja) * | 2014-10-14 | 2016-05-16 | シャープ株式会社 | 遠隔操作システムおよび電子機器 |
CN109729454A (zh) * | 2017-10-27 | 2019-05-07 | 北京金锐德路科技有限公司 | 用于脖戴式语音交互耳机的声麦处理装置 |
CN109729462A (zh) * | 2017-10-27 | 2019-05-07 | 北京金锐德路科技有限公司 | 用于脖戴式语音交互耳机的骨麦处理装置 |
WO2019235190A1 (ja) * | 2018-06-06 | 2019-12-12 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム及び対話システム |
CN112575501A (zh) * | 2019-09-12 | 2021-03-30 | 青岛海尔洗衣机有限公司 | 用于衣物处理设备的程序升级控制方法 |
WO2021140816A1 (ja) * | 2020-01-07 | 2021-07-15 | ソニーグループ株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7146095B2 (en) | Information providing system, information providing apparatus and information providing method as well as data recording medium | |
US5752232A (en) | Voice activated device and method for providing access to remotely retrieved data | |
CN115713949A (zh) | 设备之间封装和同步状态的相互作用 | |
CN107134286A (zh) | 基于语音交互的无线音频播放方法、音乐播放器及存储介质 | |
JP2001306199A (ja) | ネットワーク機器制御装置 | |
JP2017009867A (ja) | 制御装置、その方法及びプログラム | |
US20020094067A1 (en) | Network provided information using text-to-speech and speech recognition and text or speech activated network control sequences for complimentary feature access | |
CN113766301A (zh) | 显示设备及交互控制方法 | |
CN104599669A (zh) | 一种语音控制方法和装置 | |
JP6619488B2 (ja) | 人工知能機器における連続会話機能 | |
CN107655154A (zh) | 终端控制方法、空调器及计算机可读存储介质 | |
US20060206823A1 (en) | Information providing system, information providing apparatus and information providing method as well as data recording medium | |
US20010041563A1 (en) | Remote control method and system, server, data processing device, and storage medium | |
US11721344B2 (en) | Automated audio-to-text transcription in multi-device teleconferences | |
JP2004214895A (ja) | 通信補助装置 | |
KR20190066401A (ko) | 외부 장치의 네트워크 셋업을 위한 전자 장치 및 그의 동작 방법 | |
KR20220078866A (ko) | 외부 장치의 음성 기반 제어를 위한 방법 및 그 전자 장치 | |
JP3519712B2 (ja) | 電気機器遠隔制御システム、その方法、そのプログラム及びそのプログラムが記録された記録媒体 | |
KR101889278B1 (ko) | 음성 명령에 기반하여 서비스를 제공하는 공용 단말 및 방법, 음성 명령에 기반하여 동작하는 캐릭터를 제공하는 공용 단말 | |
CN108494970A (zh) | 终端状态信息的处理方法、装置、存储介质及终端 | |
CN109195016B (zh) | 面向智能终端设备的视频弹幕的语音交互方法、终端系统及智能终端设备 | |
CN114299939A (zh) | 一种智能设备、智能家居的语音控制设备及控制方法 | |
KR20130125064A (ko) | 키워드 음성 인식을 통해 관련 어플리케이션을 실행시키는 음성 통화 처리 방법 및 이를 실행하는 모바일 단말 | |
CN111352501A (zh) | 业务交互方法及装置 | |
WO2022177103A1 (ko) | 사용자와 대화하는 인공 지능 에이전트 서비스를 지원하는 전자 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050301 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050719 |