JP2017076393A

JP2017076393A - 音声エージェントに基づく制御命令処理装置及び方法、並びにエージェント装置

Info

Publication number: JP2017076393A
Application number: JP2016199885A
Authority: JP
Inventors: 冑奕全; Joo Hyuk Jeon; 景久禹; Kyoung-Gu Woo
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2015-10-12
Filing date: 2016-10-11
Publication date: 2017-04-20
Also published as: KR20170043055A; EP3157007A1; US20170103755A1; US10607605B2; CN106571141B; EP3157007B1; CN106571141A; KR102429260B1

Abstract

【課題】音声エージェントに基づく制御命令処理装置及び方法、並びにエージェント装置を提供する。
【解決手段】音声エージェントに基づく電子装置の制御命令を処理する装置が開示される。一実施形態による電子装置の制御命令処理装置は、少なくとも１つの音声エージェントから、電子装置に対する少なくとも１つの制御命令を受信し、少なくとも１つの制御命令に追加情報をタギングし、複数の受信された制御命令に応答して、複数の制御命令のそれぞれにタギングされた追加情報に基づいて、複数の制御命令を統合し、該統合の結果に基づいて、電子装置を制御するプロセッサを含みうる。
【選択図】図１

Description

本発明は、音声エージェントに基づく制御命令処理装置及び方法に係り、音声エージェントから入力された電子装置の制御命令を処理する技術に関する。

一般的なスマートホーム、スマートオフィスシステム、知能型車両、モノのインターネット機器の制御システムを設定するとき、音声インターフェースを考慮しないか、音声命令が一回に１つずつ入力される場合のみを仮定する場合がほとんどであった。最近、音声エージェント機能を備えた端末を通じて、このようなシステムを制御するための命令語を入力して、システムに連結されている電子装置を制御しようとする試みがなされている。しかし、スマートホームまたはスマートオフィスのようなシステム周辺には、音声エージェント機能を備えた複数の端末が存在することがあり、電子装置を制御するための命令が重複することがある。

本発明が解決しようとする課題は、音声エージェントに基づく制御命令処理装置及び方法、並びにエージェント装置を提供することにある。

一実施形態による電子装置の制御命令処理装置は、少なくとも１つの音声エージェントから、電子装置に対する少なくとも１つの制御命令を受信し、少なくとも１つの制御命令に追加情報をタギングし、複数の前記受信された制御命令に応答して、複数の制御命令のそれぞれにタギングされた追加情報に基づいて、前記複数の制御命令を統合し、該統合の結果に基づいて、前記電子装置を制御するプロセッサを含みうる。

プロセッサは、少なくとも１つの音声エージェントから、電子装置に対する少なくとも１つの制御命令を受信し、少なくとも１つの制御命令に追加情報をタギングする命令タギング部と、複数の受信された制御命令を受信する命令タギング部に応答して、複数の制御命令のそれぞれにタギングされた追加情報に基づいて、複数の制御命令を統合し、該統合の結果に基づいて、電子装置を制御する命令実行部と、を含みうる。

ここで、受信された制御命令は、音声プロンプト（ｐｒｏｍｐｔ）であるか、音声認識技術を通じて音声プロンプトを変換したテキスト形式であり得る。

この際、追加情報は、ユーザが、少なくとも１つの制御命令に関する音声を発話した時間、少なくとも１つの音声エージェントから少なくとも１つの制御命令を受信した時間、少なくとも１つの制御命令に関する音声の認識の正確度、音声信号の強度、少なくとも１つの制御命令の長さ、制御命令から抽出されたハッシュ値、特性値、ユーザ情報、音声エージェント装置情報、及び電子装置情報のうちの１つ以上を含みうる。

命令実行部は、複数の制御命令のそれぞれにタギングされた追加情報に基づいて、複数の制御命令を１つ以上のクラスターに統合する命令統合部と、統合の結果に基づいて電子装置を制御する最終制御命令を決定する最終命令決定部と、を含みうる。

また、命令統合部は、複数の制御命令の相互間の類似度を算出し、該算出された類似度及びタギングされた追加情報に基づいて、複数の制御命令を１つ以上のクラスターに統合することができる。

また、命令統合部は、命令タギング部で時間間隔間に受信された制御命令に基づいて、１つ以上のクラスターに複数の制御命令を統合することができる。

最終命令決定部は、１つ以上のクラスターのそれぞれに対して、クラスターの重心（ｃｅｎｔｒｏｉｄ）に該当する制御命令を最終制御命令として決定することができる。

命令実行部は、１つ以上のクラスター内に重複命令が存在する場合、ユーザに対して重複命令の処理に関するクエリを行うインタラクション部をさらに含み、最終命令決定部は、クエリの遂行の結果に基づいて、最終制御命令を決定することができる。

また、命令実行部は、制御命令を伝達した音声エージェントが複数である場合、複数の音声エージェントの中から、ユーザとインタラクションを行う音声エージェントを選定するエージェント選定部をさらに含みうる。

エージェント選定部は、ユーザと音声エージェントとの距離、音声エージェントに対するユーザの選好度、音声エージェントの使用頻度、音声信号の強度、音声エージェントから受信された制御命令の音声認識の正確度のうちの何れか１つまたはこれらの組合せに基づいて、ユーザとインタラクションを行う音声エージェントを選定することができる。

一実施形態による電子装置の制御命令を処理する方法は、音声エージェントから制御命令を受信する段階と、受信された少なくとも１つの制御命令に追加情報をタギングする段階と、受信された制御命令が複数である場合、複数の制御命令のそれぞれにタギングされた追加情報に基づいて、複数の制御命令を統合する段階と、を含みうる。

制御命令を統合する段階は、受信された複数の制御命令にタギングされた追加情報に基づいて、複数の制御命令を１つ以上のクラスターに統合する段階と、統合の結果に基づいて電子装置を制御する最終制御命令を決定する段階と、を含みうる。

１つ以上のクラスターに統合する段階は、複数の制御命令の相互間の類似度を算出する段階を含み、算出された類似度及び追加情報に基づいて、複数の命令を統合することができる。

最終制御命令を決定する段階は、１つ以上のクラスターのそれぞれに対して、クラスターの重心に該当する命令を最終制御命令として決定することができる。

制御命令を統合する段階は、１つ以上のクラスター内に重複命令が存在する場合、ユーザに対して重複命令の処理に関するクエリを行う段階をさらに含み、最終制御命令を決定する段階は、クエリの遂行の結果に基づいて、最終制御命令を決定することができる。

また、制御命令を統合する段階は、制御命令を伝達した音声エージェントが複数である場合、複数の音声エージェントの中から、ユーザとインタラクションを行う音声エージェントを選定する段階をさらに含みうる。

プロセッサによって実行されると、プロセッサに、制御命令処理方法を実行させるコンピュータプログラムを含み、さらにコンピュータプログラムを保存するコンピュータ読取可能不揮発性記憶媒体を含みうる。

一実施形態による電子装置の制御命令処理装置は、少なくとも１つの音声エージェントから、電子装置に対する少なくとも１つの制御命令を受信し、該受信された少なくとも１つの制御命令に追加情報をタギングし、制御命令にタギングされた追加情報に基づいて、受信された少なくとも１つの制御命令と、電子装置に対して既に実行中の制御命令とを統合し、該統合の結果に基づいて、電子装置を制御するプロセッサを含みうる。

プロセッサは、少なくとも１つの音声エージェントから、電子装置に対する少なくとも１つの制御命令を受信し、該受信された少なくとも１つの制御命令に追加情報をタギングする命令タギング部と、少なくとも１つの制御命令にタギングされた追加情報に基づいて、受信された制御命令と、電子装置に対して既に実行中の制御命令とを統合し、該統合の結果に基づいて、電子装置を制御する命令実行部と、を含みうる。

命令実行部は、受信された制御命令と既に実行中の制御命令とが互いに矛盾するかどうかを判断する命令統合部と、判断の結果、制御命令が矛盾する場合、制御命令の中から、電子装置を制御する最終制御命令を決定する最終命令決定部と、を含みうる。

また、命令実行部は、電子装置別に既に実行中の制御命令を保存する命令ＤＢをさらに含み、命令統合部は、命令ＤＢから、電子装置に対して既に実行中の制御命令を検出することができる。

また、命令実行部は、判断の結果、制御命令が矛盾する場合、ユーザにたいして、矛盾した命令の処理に関するクエリを行うインタラクション部をさらに含み、最終命令決定部は、クエリの遂行の結果に基づいて、最終制御命令を決定することができる。

また、命令実行部は、音声エージェント選定のためのポリシーを保存するポリシーＤＢと、ポリシーＤＢを参照してユーザとインタラクションを行う音声エージェントを選定するエージェント選定部と、をさらに含みうる。

一実施形態によるエージェント装置は、ユーザから電子装置を制御するための音声形態の制御命令が入力されると、該入力された制御命令を命令タギング部に伝達する音声エージェントと、電子装置を制御する１つ以上の制御命令を統合するための追加情報を、伝達された制御命令にタギングする命令タギング部と、を含みうる。

この際、電子装置を制御する１つ以上の制御命令を統合処理する制御命令処理装置に、追加情報がタギングされた制御命令を伝送する通信部をさらに含みうる。

音声エージェントは、制御命令処理装置から制御命令の処理結果を受信すると、制御命令の処理結果を音声形態に変換して出力することができる。

制御命令の処理結果は、電子装置を制御する複数の重複命令の処理に関するクエリ及び制御命令の実行結果のうちの少なくとも１つを含みうる。

音声エージェントは、制御命令が入力されると、制御命令が発話された時間、音声信号の強度、ユーザ情報、音声認識の正確度のうちの少なくとも１つを収集し、該収集された情報を命令タギング部に伝達することができる。

一実施形態による制御命令処理装置のブロック図である。図１の命令実行部１２０の実施形態を示すブロック図である。図１の命令実行部１２０の実施形態を示すブロック図である。図１の命令実行部１２０の実施形態を示すブロック図である。図１の命令実行部１２０の実施形態を示すブロック図である。一実施形態による制御命令処理方法のフローチャートである。一実施形態による制御命令処理方法のフローチャートである。他の実施形態による制御命令処理方法のフローチャートである。制御命令処理技術が適用されたネットワーク制御装置の実施形態を示した図面である。制御命令処理技術が適用されたネットワーク制御装置の実施形態を示した図面である。制御命令処理技術が適用されたネットワーク制御装置の実施形態を示した図面である。制御命令処理技術が適用されたネットワーク制御装置の実施形態を示した図面である。制御命令処理技術が適用されたネットワーク制御装置の実施形態を示した図面である。制御命令処理技術が適用されたネットワーク制御装置の実施形態を示した図面である。

その他の実施形態の具体的な事項は、詳細な説明及び図面に含まれている。記載の技術の利点及び特徴、そして、それらを実装する方法は、図面と共に詳細に後述されている実施形態を参照すると、明確になる。明細書の全般に亘って同じ参照符号は、同じ構成要素を指す。

以下、図面を参照して音声エージェントに基づく電子装置の制御命令処理装置及び方法の実施形態を詳しく説明する。

図１は、一実施形態による制御命令処理装置のブロック図である。

一実施形態による制御命令処理装置１００は、音声エージェント（ｖｏｉｃｅａｇｅｎｔ）を通じて各種の電子装置を制御する制御システム（以下、“ネットワーク制御システム”と称する）に多様な方式で適用可能である。例えば、制御命令処理装置１００は、音声エージェントから伝達される命令が電子装置で重複して実行されることを防止することができる。ここで、電子装置は、ネットワーク制御システムでユーザの命令に基づいて最終的な動作を行う各種の装置であって、光学ディスク再生装置（ｏｐｔｉｃａｌｄｉｓｃｐｌａｙｅｒ）、ＤＶＤプレーヤー、ブルーレイプレーヤー、セットトップボックス、ロボット掃除機、ヘルスケアデバイス、モバイルロボット、家電器具、冷蔵庫、ＴＶ、コンテンツプレーヤー、通信システム、イメージ処理システム、グラフィック処理システム、ガス、食器洗浄機、ドアロック、火災感知器、防犯ＣＣＴＶ、エアコン、ボイラー、モバイルフォン、携帯電話、スマートフォン、ウェアラブルスマートデバイス（例：指輪、時計、メガネ、メガネ型装置、腕輪、ネックレス、イヤリング、ヘアバンド、ヘルメット、衣類に付着された装置）、パソコン、ラップトップ、ノート型パソコン、サブノート型パソコン、ネットブック、ウルトラモバイルＰＣ（ＵＭＰＣ）、タブレットＰＣ、ファブリック、ＭＩＤ、ＰＤＡ（ＰｅｒｓｏｎａｌＤｉｇｉｔａｌＡｓｓｉｓｔａｎｔ）、ＥＤＡ（ＥｎｔｅｒｐｒｉｓｅＤｉｇｉｔａｌＡｓｓｉｓｔａｎｔ）、デジタルカメラ、デジタルビデオカメラ、携帯用ゲームコンソール、ＭＰ３プレーヤー、ＰＭＰ（Ｐｏｒｔａｂｌｅ／ＰｅｒｓｏｎａｌＭｕｌｔｉｍｅｄｉａＰｌａｙｅｒ）、ＧＰＳ（ＧｌｏｂａｌＰｏｓｉｔｉｏｎｉｎｇＳｙｓｔｅｍ）ナビゲーション、ＰＮＤ（ＰｅｒｓｏｎａｌＮａｖｉｇａｔｉｏｎＤｅｖｉｃｅｏｒＰｏｒｔａｂｌｅＮａｖｉｇａｔｉｏｎＤｅｖｉｃｅ）、電子ブック、車両または灯のスマートホーム／オフィス機器、及びネットワークを通じて制御される多様な他のモノのインターネット機器を含みうる。

図１を参照すれば、制御命令処理装置１００は、命令タギング部１１０及び命令実行部１２０を含みうる。ここで、命令タギング部１１０と命令実行部１２０は、１つのモジュールとして具現可能であり、１つのハードウェアに搭載されうる。また、命令タギング部１１０と命令実行部１２０は、別途のハードウェアに搭載されることが可能であり、一例として、命令タギング部１１０は、音声エージェントを搭載しているエージェント装置に搭載され、命令実行部１２０は、別途の装置、電子装置を制御する制御装置又は電子装置内に搭載されうる。

命令タギング部１１０は、音声エージェントから電子装置を制御するための命令（以下、‘制御命令’と称する）を受信することができる。この際、音声エージェントは、スマートフォン、スマートパッド、タブレットＰＣ、ノート型パソコン、デスクトップＰＣ、ヘルスケア機器、モバイルロボット、ウェアラブル機器、及び前述したスマートホーム／オフィス装置などの多様なエージェント装置に搭載されうる。

音声エージェントは、ユーザが電子装置を制御するために音声を発話すると、ユーザの発話音声を受信して、その音声自体を制御命令として命令タギング部１１０に伝達することができる。あるいは、音声エージェントは、内蔵された音声認識技術を適用してユーザから受信された音声を認識し、その認識結果として出力されるテキストを、制御命令として命令タギング部１１０に伝達することができる。

命令タギング部１１０は、音声エージェントから制御命令を受信すると、該受信された制御命令に追加情報をタギングすることができる。この際、追加情報は、ユーザが音声を発話した時間、命令タギング部１１０が音声エージェントから制御命令を受信した時間、ユーザが発話した音声の認識の正確度、ユーザが発話した音声信号の強度、受信された制御命令データの長さ、受信された制御命令データから抽出されたハッシュ値、外部モジュールから獲得された特性値、音声を発話したユーザ情報、音声エージェントを搭載したエージェント装置情報、及び制御する電子装置情報などを含みうる。但し、これに限定されず、他の多様な情報が追加情報として活用されうる。

例えば、命令タギング部１１０は、音声エージェントから制御命令と共に追加情報を受信することができる。音声エージェントは、ユーザから音声を受信すると、音声受信時間、受信された音声信号の強度、音声を入力したユーザ情報及びエージェント装置の情報などを獲得することができる。また、音声エージェントは、受信された音声に対して音声認識を行った場合、その音声認識の正確度を獲得し、このように獲得された情報が、制御命令にタギングされる追加情報として活用されるように命令タギング部１１０に伝達することができる。

また、命令タギング部１１０は、音声エージェントから制御命令を受信すると、該受信された制御命令を用いて追加情報を獲得することができる。例えば、制御命令の受信時間を追加情報として獲得し、受信された制御命令がテキスト命令である場合、テキスト分析技法を用いて制御する電子装置情報、制御命令データの長さ、ハッシュ値などを抽出することができる。また、命令タギング部１１０は、他の外部モジュールを通じて特性ベクトル値（例：ｗｏｒｄｅｍｂｅｄｄｉｎｇ）を追加情報として獲得することができる。

命令タギング部１１０は、受信された制御命令についての追加情報を獲得すると、該獲得された追加情報を制御命令にタギングすることができる。

一方、命令タギング部１１０は、音声エージェントから複数の制御命令を受信することができる。一例として、音声エージェントの周辺に多数のユーザが存在する場合、多数のユーザが同時に音声を発話することができる。この際、音声エージェントは、その音声命令を受信して、各音声に対応する複数の制御命令を命令タギング部１１０に伝達することができる。他の例として、命令タギング部１１０が、複数の音声エージェントと連結される場合、いずれかのユーザが発話した音声を複数の音声エージェントが受信して、該受信された複数の音声に対する複数の制御命令を命令タギング部１１０に伝達することができる。

命令実行部１２０は、命令タギング部１１０が制御命令に追加情報をタギングすると、追加情報がタギングされた制御命令に基づいて、電子装置を制御することができる。

一例として、命令実行部１２０は、電子装置を制御する制御命令が複数である場合、複数の制御命令のそれぞれにタギングされている追加情報を用いて複数の制御命令を統合することができる。また、統合の結果を用いて電子装置を制御する最終制御命令を決定し、該決定された最終制御命令が電子装置で実行されるように制御することができる。

他の例として、命令実行部１２０は、電子装置に対して既に実行中の制御命令が存在する場合、受信された制御命令にタギングされた追加情報を用いて、既に実行中の制御命令と矛盾するかどうかを判断し、該判断の結果に従って適切な処理を行うことができる。

但し、命令実行部１２０の実施形態は、これに限定されず、図２Ａないし図２Ｄを参照して、より詳細に後述する。

図２Ａないし図２Ｄは、図１の命令実行部１２０の実施形態を示すブロック図である。図２Ａないし図２Ｄで、同じ参照符号を有する構成は、同じ構成を意味する。

図２Ａを参照すれば、一実施形態による命令実行部１２０ａは、命令統合部１２１及び最終命令決定部１２２を含みうる。

命令統合部１２１は、命令タギング部１１０から制御命令を受信すると、該受信された制御命令にタギングされている追加情報を確認し、該確認された追加情報を用いて制御命令を統合することができる。

例えば、命令統合部１２１は、命令タギング部１１０から受信された制御命令が複数である場合、各制御命令にタギングされている追加情報を用いてクラスター別に統合することができる。この際、命令統合部１２１は、多様なクラスタリング技法を活用して複数の命令を１つ以上のクラスターに分類して統合することができる。ここで、多様なクラスタリング技法は、Ｋ−平均アルゴリズム、Ｋ−中間点アルゴリズム、Ｋ−中央値アルゴリズム、パージＣ−平均アルゴリズムなどでありうるが、これらに限定されるものではない。命令統合部１２１は、分類された命令を統合することができる。

一例として、命令統合部１２１は、各制御命令にタギングされている追加情報のうちのユーザの発話時間を確認し、所定時間間隔（例：１秒）で命令をクラスタリングすることができる。他の例として、命令統合部１２１は、各制御命令の追加情報のうちのユーザ情報を確認して、所定時間内に入力された制御命令を、ユーザが入力した命令に基づいて互いに異なるクラスターに分類することができる。さらに他の例として、制御する電子装置別に分類するか、命令データの長さ情報などを用いて分類することができる。この際、２つ以上の追加情報を組み合わせて多数の制御命令をクラスタリングすることができる。さらに他の例として、命令統合部１２１は、編集距離（ｅｄｉｔｄｉｓｔａｎｃｅ）アルゴリズムのような類似度計算アルゴリズムを用いて、入力された制御命令間の類似度を算出し、該算出された類似度に基づいて制御命令をクラスタリングすることができる。

最終命令決定部１２２は、このように命令統合部１２１によってクラスター別に統合された制御命令の中から、電子装置を制御する最終制御命令を決定することができる。

例えば、最終命令決定部１２２は、クラスター別に複数の制御命令が存在する場合、その制御命令が重複命令であると判断し、複数の制御命令の中から、実際に電子装置を制御する何れか１つの命令のみを最終制御命令として決定することができる。

一例として、最終命令決定部１２２は、クラスター内で最終制御命令を決定するとき、そのクラスターがＫ−平均アルゴリズムを用いて分類される場合、そのクラスターの重心に該当する命令を最終制御命令として決定することができる。

他の例として、最終命令決定部１２２は、クラスター内で発話音声信号の強度が最も強い命令、音声認識の正確度が最も高い命令、ユーザが音声を発話した時間が最も遅い制御命令を、最終制御命令として決定することができる。但し、最終制御命令の決定基準において、例示されたものによって特に制限されるものではない。

また、最終命令決定部１２２は、決定された最終制御命令を制御装置に伝送して電子装置で実行させることによって、特定の電子装置に対して複数の制御命令が同時に伝達されて、重複実行されることを防止することができる。

例えば、ユーザが１９時に発話した“居間の温度を１℃上げる”という制御命令が、ユーザの周辺にあったスマートフォンとスマートウォッチの音声エージェントからそれぞれ１９時０２分３２秒、１９時０２分３３秒に命令タギング部に伝達されうる。このような制御情報の受信時間情報などが、命令タギング部によって各制御命令にタギングされると、命令統合部１２１は、その制御命令の受信時間が既定の時間間隔（例：１秒）内であるので、１つのクラスターに統合することができる。この際、最終命令決定部１２２は、クラスターに含まれた２つの制御命令が重複すると判断し、何れか１つの命令のみを最終制御命令として決定することができる。

図２Ｂを参照すれば、他の実施形態の命令実行部１２０ｂは、命令統合部１２１、最終命令決定部１２２及びインタラクション部１２３を含みうる。図２Ｂの説明に加えて、前述した図１ないし図２Ａの説明は、図２Ｂに適用可能であり、参考として使われる。命令統合部１２１及び最終命令決定部１２２は、前述したので、詳しい説明は省略する。

インタラクション部１２３は、制御命令の処理と関連してユーザと各種のインタラクションを行うことができる。

一例として、命令統合部１２１によって複数の制御命令が統合され、その結果、ある電子装置の制御命令が重複すると判断されると、インタラクション部１２３は、その重複の処理に関するクエリを生成してユーザに提示し、ユーザからそのクエリに対する応答を受信することができる。この際、最終命令決定部１２２は、ユーザの応答に基づいて最終制御命令を決定することができる。

他の例として、インタラクション部１２３は、決定された最終制御命令が電子装置で実行される過程で実行される各種の動作及び最終制御命令の実行結果をユーザに提供することができる。例えば、インタラクション部１２３は、決定された最終制御命令に対する通知、制御装置への伝送結果、電子装置で正常に実行されたかどうかについての情報、正常に実行されていない場合にはその原因についての情報をユーザに提供することができる。

図２Ｃを参照すれば、さらに他の実施形態の命令実行部１２０ｃは、命令統合部１２１、最終命令決定部１２２、インタラクション部１２３及びエージェント選定部１２４を含みうる。図２Ｃの説明に加えて、前述した図１ないし図２Ｂの説明は、図２Ｃに適用可能であり、参照されて説明される。例えば、命令統合部１２１、最終命令決定部１２２及びインタラクション部１２３は、前述したので、詳しい説明は省略する。

音声エージェントを用いて電子装置を制御するネットワーク制御システム環境で、ユーザの周辺に複数の音声エージェントが存在することがある。例えば、ユーザが、制御命令に対する音声を入力する時点で、音声エージェントを搭載したスマートフォン（ｓｍａｒｔｐｈｏｎｅ）、スマートパッド、スマートウォッチ（ｓｍａｒｔｗａｔｃｈ）、スマートグラス（ｓｍａｒｔｇｌａｓｓ）などの複数のエージェント装置がユーザの周辺で動作中であり得る。あるいは、何れか１つのエージェント装置に複数の音声エージェントが搭載されて同時に動作することもできる。

エージェント選定部１２４は、このようにユーザの周辺に複数の音声エージェントが存在する環境で、インタラクション部１２３は、ユーザとインタラクションを行うように何れか１つまたは２つ以上の音声エージェントを選定することができる。この際、エージェント選定部１２４は、ユーザとエージェント装置との距離、エージェント装置に対するユーザの選好度や利用頻度、エージェント装置から受信された各制御命令の音声信号の強度や音声認識の正確度などを考慮して、ユーザとインタラクションを行うエージェントを選定することができる。

一例によれば、エージェント選定部１２４は、複数のエージェント装置から制御命令が伝達される場合、命令統合部１２１によって制御命令が統合される前に、そのエージェント装置の中からインタラクションを行うエージェント装置を選定することができる。例えば、エージェント選定部１２４は、音声信号が最も強いエージェント装置または音声認識の正確度が最も高いエージェント装置を、インタラクションを行うエージェント装置として選定することができるが、これに限定されるものではない。この場合、命令統合部１２１は、選定されたエージェント装置から伝達された制御命令のみを統合することができる。

他の例によれば、エージェント選定部１２４は、複数のエージェント装置から伝達された複数の制御命令が命令統合部１２１によって統合された後、その統合の結果に基づいて、インタラクションを行うエージェント装置を選定することができる。例えば、エージェント選定部１２４は、統合の結果、重複する命令が存在する場合、ユーザとその重複命令の処理に関するクエリ及び応答を行うために、現在ユーザの位置と最も近い位置に存在するエージェント装置を選定することができる。

インタラクション部１２３は、エージェント選定部１２４によって選定されたエージェント装置を通じてユーザとインタラクションを行うことができる。

一方、図２Ｃの命令実行部１２０ｃは、図２Ｄに示したように、拡張されうる。図２Ｄを参照して説明すれば、図２Ｄの実施形態による命令実行部１２０ｄは、図２Ｃの各構成１２１、１２２、１２３、１２４以外に、各種の電子装置別に現在実行中であるか、実行予定である制御命令、例えば、周期的に実行される制御命令があらかじめ保存された命令データベース（ＤＢ）１２５、及び／またはエージェント選定部１２４が複数の音声エージェントの中からインタラクションを行うエージェントを選定する、各種の基準があらかじめ保存されたポリシーＤＢ１２６をさらに含みうる。

命令統合部１２１は、命令タギング部から制御命令を受信すると、命令ＤＢ１２５を参照して既に実行中の制御命令が存在するかどうかを確認することができる。この際、命令統合部１２１は、制御命令にタギングされている追加情報から、制御する電子装置、制御命令の受信時間、受信された制御命令の実行時間などを確認し、該確認された情報に基づいて、命令ＤＢ１２５内に、矛盾する制御命令が存在するかどうかを確認することができる。

例えば、“居間の温度を１℃上げる”という制御命令が、ユーザから１２時１０分に受信されると、命令統合部１２１は、追加情報を確認して制御する電子装置が“ボイラー”であることを確認し、ボイラーに対して現在実行中の制御命令が命令ＤＢ１２５内に存在するかどうかを確認することができる。この際、命令ＤＢ１２５に“午後１２：００から居間の温度を２０℃に保持する”という制御命令が保存されている場合、命令統合部１２１は、ユーザから入力された制御命令と命令ＤＢ１２５に保存されている命令とを統合して、互いに矛盾していると判断することができる。

この際、命令統合部１２１は、音声エージェントを通じて入力された制御命令が複数である場合、各制御命令と命令ＤＢ１２５に保存された命令とを統合し、各命令間の重複の有無及び矛盾の有無を判断することができる。

最終命令決定部１２２は、このように重複または矛盾した制御命令の中から、電子装置で実行する最終制御命令を決定することができる。この際、前述したように、インタラクション部１２３は、重複または矛盾する命令の処理について、ユーザとの間のクエリ及び応答を行うことができる。例えば、インタラクション部１２３は、“１２時以降は居間の温度を２０℃に保持中です。今度だけ２１℃に上げますか”のようにユーザにクエリし、最終命令決定部１２２は、ユーザ応答に基づいて、何れか１つの命令を最終制御命令として決定することができる。

一方、エージェント選定部１２４は、前述したように、インタラクション部１２３が、ユーザとインタラクションを行うエージェントを選定し、この際、ポリシーＤＢ１２６を参照することができる。この際、ポリシーＤＢ１２６には、日付別／時間帯別／場所別にユーザが好むか、よく用いるエージェント装置についての情報、ユーザの現在位置、現在時間、現在動作中であるエージェント装置の個数などの何れか１つまたは２つ以上の組合せによるエージェント装置の選定基準などが保存することができる。これに限定されず、それ以上の多様な基準が多様な状況に応じてあらかじめ設定しうる。

例えば、ポリシーＤＢ１２６において、ユーザの現在位置及び使用頻度を考慮してエージェントを選定するように基準が設定されており、ユーザが奥の部屋にいる場合、エージェント選定部１２４は、ユーザが奥の部屋で最もよく使うスマートフォンをエージェント装置として選定することができる。また、ポリシーＤＢ１２６において、ユーザの現在位置とエージェント装置との距離を基に選定するよう基準が設定されている場合、エージェント選定部１２４は、ユーザ及び各エージェント装置の現在位置を把握し、最も近接した距離にあるエージェント装置を選定することができる。

図３Ａは、一実施形態による音声エージェントに基づく電子装置の制御命令処理方法のフローチャートである。図３Ａに示された順序及び方法は、本実施形態の範囲を超えない範囲内で一部の動作が変更されるか、省略される。また、図３Ａに示された動作は、並列に、または同時に行われる。また、図３Ａの説明に追加して、前述した図１ないし図２Ｄの説明は、図３Ａに適用可能であり、同じ構成は、再び説明しない。

図３Ａを参照すれば、制御命令処理装置１００は、音声エージェントから制御命令を受信することができる（３１０）。この際、音声エージェントは、ユーザから入力された音声それ自体を制御命令として伝達し、音声認識技術を搭載している場合、その音声認識技術を通じてユーザの音声を認識して、その結果、出力されたテキストを制御命令として伝達することができる。

この際、制御命令処理装置１００が受信する制御命令は、複数であり得る。例えば、数人のユーザが同時に入力した音声を１つのエージェントが受信して伝達し、または、一人のユーザが入力した音声を周辺の多くの音声エージェントが受信して伝達することができる。

次いで、制御命令処理装置１００は、音声エージェントから制御命令を受信すると、該受信された制御命令に追加情報をタギングすることができる（３２０）。この際、追加情報は、前述したものと同じであり、制御命令処理装置１００は、音声エージェントまたは外部モジュールから必要な追加情報を獲得するか、制御命令を分析して必要な追加情報を抽出することができる。

次いで、制御命令処理装置１００は、制御命令が複数個存在する場合、それぞれの制御命令にタギングされている追加情報を用いて、複数の制御命令を統合することができる（３３０）。

図３Ｂは、図３Ａの命令統合段階（３３０）の一実施形態を示すフローチャートである。

図３Ｂに示された順序及び方法は、本実施形態の範囲を超えない範囲内で一部の動作が変更されるか、省略される。また、図３Ｂに示された動作は、並列に、または同時に行われる。また、図３Ｂの説明に追加して、前述した図１ないし図３Ａの説明は、図３Ｂに適用可能であり、同じ構成は、再び説明しない。

制御命令処理装置１００は、複数の制御命令のそれぞれにタギングされた追加情報を用いて複数の制御命令を分類して、１つ以上のクラスターに統合することができる（３３１）。次いで、制御命令処理装置１００は、統合の結果に基づいて電子装置で実行する最終制御命令を決定することができる（３３２）。この際、制御命令処理装置１００は、クラスタリング基準や追加情報を活用して最終制御命令を決定することができる。

一方、制御命令処理装置１００は、段階（３３１）の後に、統合の結果、複数の制御命令が重複すると判断されれば、ユーザとインタラクションを行って重複命令の処理に関するクエリを行い、ユーザからそのクエリに対する応答を受信することができる。この際、制御命令処理装置１００は、段階（３３２）でユーザの応答に基づいて最終制御命令を決定することができる。

また、前述したように、制御命令処理装置１００は、複数のエージェントが存在する場合、既定の多様な選定基準に基づいてユーザとインタラクションを行うエージェントを選定することができる。

図４は、他の実施形態による制御命令処理方法のフローチャートである。図４に示された順序及び方法は、本実施形態の範囲を超えない範囲内で一部の動作が変更されるか、省略される。また、図４に示された動作は、並列に、または同時に行われる。また、図４の説明に追加して、前述した図１ないし図３Ｂの説明は、図４に適用可能であり、同じ構成は、再び説明しない。

まず、制御命令処理装置１００は、音声エージェントから制御命令を受信することができる（４１０）。

次いで、制御命令処理装置１００は、音声エージェントから制御命令を受信すると、該受信された制御命令に追加情報をタギングすることができる（４２０）。

次いで、制御命令処理装置１００は、受信された制御命令と既に実行中の制御命令とを統合することができる（４３０）。例えば、制御命令処理装置１００は、制御命令を受信すると、制御命令にタギングされている追加情報を用いて、制御する電子装置及び制御時間などを確認し、該確認された情報を活用して、その電子装置で既に実行中の制御命令を命令ＤＢから抽出して、各制御命令を統合することができる。この際、統合された制御命令、すなわち、音声エージェントから受信された制御命令と既に実行中の制御命令とが矛盾していると判断される場合、何れか１つの命令のみを最終制御命令として決定して、電子装置で実行させうる。

この際、制御命令処理装置１００は、各種の電子装置上で既に実行中の制御命令を保存している命令ＤＢを参照して、受信された制御命令と既に実行中の制御命令との矛盾の有無を判断することができる。また、制御命令処理装置１００は、ユーザとインタラクションを通じてその矛盾の処理に関するクエリを行い、ユーザの応答に基づいて、何れか１つの制御命令を最終制御命令として決定することができる。また、制御命令処理装置１００は、複数の音声エージェントが存在する場合、ポリシーＤＢを参照してインタラクションを行うエージェントを選定することができる。

図５ないし図１０は、前述した制御命令処理装置が適用されたネットワーク制御装置の多様な実施形態を示した図面である。

図５ないし図１０を参照すれば、一実施形態によるネットワーク制御装置１、２、３、４、５、６は、多数のエージェント装置５００、制御装置７００及び電子装置８００を含みうる。多数のエージェント装置５００は、音声エージェント５１０をそれぞれ含みうる。制御装置７００は、エージェント装置５００から伝達された制御命令に基づいて電子装置８００を制御することができる。電子装置８００は、制御装置の制御に従って動作を行うことができる。また、ネットワーク制御装置１、２、３、４、５、６は、前述した制御命令処理装置１００を含み、この際、制御命令処理装置６００は、図５に示したように、他の装置５００、７００、８００とは別途のハードウェア装置に具現されるか、図６ないし図１０のように、制御命令処理装置６００の各構成６１０、６２０が、他の装置５００、７００、８００のうちの何れか１つに共に搭載されるか、２つ以上に分散されて搭載されうる。

図５を参照すれば、ネットワーク制御装置１内の制御命令処理装置６００は、多数のエージェント装置５００及び制御装置７００と有線又は無線ネットワークで連結されうる。この際、各装置５００、６００、７００、８００は、内部に無線ＬＡＮ（ＷｉＦｉ）、ブルートゥース（Ｂｌｕｅｔｏｏｔｈ）（登録商標）、ジグビー（登録商標）、ＮＦＣ（ＮｅａｒＦｉｅｌｄＣｏｍｍｕｎｉｃａｔｉｏｎ）などの近距離通信モジュール、移動通信モジュール、及びその他に多様なネットワーク通信モジュールを含み、その通信モジュールを制御して互いに連結されうる。

例えば、ユーザが、“居間の温度を１℃上げる”のようにボイラーの温度制御を要求する音声を入力する場合、ユーザの周辺にあるエージェント装置５００の音声エージェント５１０は、ユーザの音声を受信し、必要な処理を行うことができる。例えば、各エージェント装置５００に含まれる音声エージェント５１０が、音声認識技術を搭載している場合、音声認識を行って音声をテキストに変換し、テキスト形式の制御命令を制御命令処理装置６００に伝送しうる。また、音声認識技術を搭載していない場合、あるいはポリシーに従って、ユーザから入力された音声自体を、制御命令として制御命令処理装置６００に伝送することもできる。例えば、ポリシーは、あらかじめ設定されうる。

この際、音声エージェント５１０は、ユーザの音声を受信すると、該受信した音声信号の強度、ユーザ情報、ユーザ音声の受信時間などを獲得して、制御命令と共に制御命令処理装置６００に伝達することができる。また、音声エージェント５１０は、音声認識を行った場合、音声認識の正確度情報をさらに伝達することができる。

この際、エージェント装置５００は、内部に搭載された通信モジュールを制御して通信網に接続し、その通信網に接続されている制御命令処理装置６００と連結して、制御命令や獲得された情報を伝送しうる。

制御命令処理装置６００は、エージェント装置５００から伝達された制御命令を統合し、該統合の結果、何れか１つの制御命令を制御装置７００に伝送しうる。この際、制御命令処理装置６００は、命令タギング部６１０と命令実行部６２０とを含み、命令タギング部６１０は、受信された制御命令に追加情報をタギングし、命令実行部６２０は、タギングされた追加情報に基づいて複数の制御命令を統合して、重複していない何れか１つの制御命令のみが電子装置で実行されるように処理することができる。

また、命令実行部６２０は、制御しようとする電子装置で既に実行中の制御命令が存在する場合、その既に実行中の制御命令を共に考慮して統合することができる。

命令実行部６２０は、受信された制御命令間に重複が存在するか、既に実行中の制御命令と矛盾する場合、複数のエージェント装置５００の中から、インタラクションを行うエージェント装置５００を選定してユーザとインタラクションを行い、ユーザとのインタラクションの結果に基づいて、何れか１つの制御命令を最終制御命令として決定することができる。

制御装置７００は、制御命令処理装置６００から制御命令を受信すると、該受信された制御命令が電子装置８００で実行されるように制御することができる。この際、制御装置７００は、示したように、電子装置とは別途のハードウェア装置に具現され、必要に応じては、電子装置８００内にソフトウェアまたはハードウェアモジュールとして搭載されうる。

電子装置８００は、制御装置７００とペアリング連結を行い、制御装置７００から受信された制御命令に該当する動作を行うことができる。

この際、制御装置７００または電子装置８００は、制御命令の実行結果、例えば、“居間の温度が２０℃から２１℃になるように設定しました。”のような結果を制御命令処理装置６００に伝送し、制御命令処理装置６００の命令実行部６２０は、インタラクションするエージェント装置５００を通じてユーザに提供することができる。この際、インタラクションするエージェント装置５００の音声エージェント５１０は、受信された結果を音声に変換して音声としてユーザに出力することができる。他の例によれば、エージェント装置５００の音声エージェント５１０は、受信された結果をテキストに変換し、ユーザに表示することができる。

図６を参照して、他の実施形態のネットワーク制御装置２を説明する。図６の実施形態によれば、制御命令処理装置が、エージェント装置５００内に搭載されうる。前述したものと同様に、ネットワーク制御装置２は、１つ以上のエージェント装置５００、制御装置７００及び電子装置８００を含む。図５と同じ参照符号を有した構成は、同じ機能を行うので、詳しい説明は省略する。

エージェント装置５００は、ユーザから音声を受信する音声エージェント５１０及び通信部６２０、及び制御命令処理装置の構成である命令タギング部６１０と命令実行部６２０とを含みうる。
エージェント装置５００は、ユーザからマイクロホンなどを通じて音声が入力されれば、音声エージェント５１０を通じてユーザの音声に対して音声認識のような必要な作業を行った後、命令タギング部６１０及び命令実行部６２０を通じて何れか１つの最終制御命令を決定して、通信部５２０を通じて制御装置７００に伝送しうる。この際、特定のエージェント装置５００が、複数のユーザからほぼ同時に発話される複数の音声を受信する場合、そのエージェント装置５００に搭載された音声エージェント５１０は、受信された複数の音声のそれぞれを制御命令として命令タギング部６１０に伝達し、命令タギング部６１０及び命令実行部６２０は、受信された複数の制御命令間の重複や既に実行中の命令との矛盾を解決して、電子装置８００を制御させうる。

例えば、居間が寒いと感じたいずれかのユーザが、１９時１分に“居間の温度を１℃上げる”という音声を発話し、居間が暑いと感じた他のユーザが、１９時２分に“居間の温度を１℃下げる”と発話する場合、エージェント装置５００は、多様な基準によって何れか１つの命令のみを最終制御命令として決定して、制御装置７００に伝送しうる。ここで、多様な基準は、あらかじめ設定されうる。例えば、後で受信された制御命令を最終制御命令として決定し、あるいは音声エージェント５１０を通じて、或る命令を最終的に実行するかどうかをユーザにクエリし、ユーザが選択した命令を最終制御命令として決定して、制御装置７００に伝送しうる。通信部５２０は、命令実行部６２０の要求に応じて通信網に接続して制御装置７００と連結を試み、連結に成功すれば、決定された最終制御命令を制御装置７００に伝送しうる。

制御装置７００は、受信された制御命令を電子装置８００で実行されるように制御し、電子装置８００は、制御装置７００の制御によってユーザが要求する動作を行うことができる。

図７は、さらに他の実施形態のネットワーク制御装置３を示した図面である。図７の実施形態によれば、制御命令処理装置の構成６１０、６２０は、制御装置７００内に搭載されうる。同様に、ネットワーク制御装置３は、１つ以上のエージェント装置５００、制御装置７００及び電子装置８００を含み、図５及び図６の同じ参照符号を有する構成要素は、類似した機能を有するので、以下、詳しい説明は省略する。

エージェント装置５００は、音声エージェント５１０を含み、制御装置７００は、エージェント装置５００から制御命令を受信する制御命令受信部７１０、命令タギング部６１０、命令実行部６２０及び制御部７２０を含みうる。

制御装置７００は、制御命令受信部７１０を通じてエージェント装置５００から制御命令を受信すると、命令タギング部６１０と命令実行部６２０とを通じて複数の制御命令及び既に実行中の制御命令を統合して、電子装置８００で実行する最終制御命令を決定し、制御部７２０を通じて最終制御命令が電子装置８００で実行されるように制御することができる。

図８及び図９は、さらに他の実施形態のネットワーク制御装置４、５を示した図面である。図８及び図９の実施形態によるネットワーク制御装置４、５は、エージェント装置５００、制御装置７００、電子装置８００を含み、制御命令処理装置の各構成６１０、６２０は、それぞれ互いに異なる装置に分散して搭載されうる。図５ないし図７の同じ参照符号を有する構成要素は、類似した機能を有するので、以下、同じ構成の説明は省略する。

図８を参照すれば、ネットワーク制御装置４は、命令タギング部６１０がエージェント装置５００に、命令実行部６２０が制御装置７００に分散されて搭載されうる。この際、制御装置７００の制御命令受信部７１０は、エージェント装置５００の命令タギング部６１０によって追加情報がタギングされた制御命令を受信し、該受信された制御命令は、命令実行部６２０によって統合されて、制御部７２０を通じて電子装置８００で実行可能である。

また、図９を参照すれば、ネットワーク制御装置５は、命令タギング部６１０がエージェント装置５００、命令実行部６２０が電子装置８００に分散して搭載されうる。この際、制御装置７００が、エージェント装置５００からの追加情報がタギングされた複数の制御命令と、あらかじめ登録されている実行予定である制御命令を電子装置８００に伝送すれば、電子装置８００が、その制御命令を統合して何れか１つの命令のみを実行することができる。例えば、電子装置８００の通信部８１０は、ホームネットワーク通信網などに接続して制御装置７００と連結し、制御装置７００から制御命令を受信して命令実行部６２０に伝達することができる。この際、命令実行部６２０は、受信された命令を統合し、何れか１つの最終制御命令を決定して実行することができる。

また、これに図示されていないが、命令タギング部６１０は、エージェント装置５００に搭載され、命令実行部６２０は、別途の制御命令処理装置に搭載されることもできる。但し、命令タギング部、命令実行部、エージェント装置、制御部、制御命令処理装置及び電子装置は、本発明の範囲内で配置され、その適用において、特に限定されるものではない。

図１０は、さらに他の実施形態のネットワーク制御装置６を示した図面である。図１０の実施形態によれば、制御命令処理装置の各構成６１０、６２０は、電子装置８００に搭載されうる。ネットワーク制御装置６は、エージェント装置５００、制御装置７００及び電子装置８００を含み、電子装置８００は、通信部８１０、命令タギング部６１０、命令実行部６２０及び動作遂行部８２０を含みうる。電子装置８００の通信部８１０が、制御装置７００から複数の制御命令を受信すれば、命令タギング部６１０及び命令実行部６２０によって最終制御命令が決定され、該決定された最終制御命令が動作遂行部８２０によって行われる。以下、詳しい説明は省略する。

このように、音声エージェントを通じて電子装置を制御するネットワーク制御システムで、複数の制御命令の統合処理を行う制御命令処理技術が適用される多様な実施形態を説明した。しかし、前述した実施形態に限定されるものではなく、その他に多様に変形されて実施される。

また、本実施形態は、コンピュータで読取可能記憶媒体にコンピュータ読取可能コードとして具現することが可能である。コンピュータで読取可能記憶媒体は、コンピュータシステムによって読み取ることができるデータが保存される、あらゆる種類の記録装置を含む。

コンピュータ読取可能媒体の例としては、ＲＯＭ、ＲＡＭ、ＣＤ−ＲＯＭ、磁気テープ、フロッピーディスク、光データ保存装置などがあり、また、搬送波（例えば、インターネットを介した伝送）の形態で具現するものを含む。また、コンピュータ読取可能記憶媒体は、ネットワークで連結されたコンピュータシステムに分散されて、分散方式でコンピュータ読取可能コードとして保存されて実行されうる。そして、本実施形態を具現するための機能的な（ｆｕｎｃｔｉｏｎａｌ）プログラム、コード及びコードセグメントは、本発明が属する技術分野のプログラマーによって容易に推論されうる。

当業者ならば、開示された技術的思想や必須的な特徴を変更せずとも、他の具体的な形態で実施可能であることを理解できるであろう。したがって、前述した実施形態は、あらゆる面で例示的なものであり、限定的ではないということを理解せねばならない。

本発明は、音声エージェントに基づく制御命令処理装置及び方法と、エージェント装置関連の技術分野に適用可能である。

１１０命令タギング部
１２０命令実行部

Claims

電子装置の制御命令処理装置において、
少なくとも１つの音声エージェントから、電子装置に対する少なくとも１つの制御命令を受信し、前記少なくとも１つの制御命令に追加情報をタギングし、
複数の前記受信された制御命令に応答して、複数の制御命令のそれぞれにタギングされた追加情報に基づいて、前記複数の制御命令を統合し、該統合の結果に基づいて、前記電子装置を制御する
プロセッサを含む、制御命令処理装置。
前記プロセッサは、
前記少なくとも１つの音声エージェントから前記電子装置に対する少なくとも１つの制御命令を受信し、前記少なくとも１つの制御命令に追加情報をタギングする命令タギング部と、
前記命令タギング部が、複数の制御命令を受信したことに応答して、前記複数の制御命令のそれぞれにタギングされた追加情報に基づいて、前記複数の制御命令を統合し、該統合の結果に基づいて、前記電子装置を制御する命令実行部と、
を含む請求項１に記載の制御命令処理装置。
前記受信される制御命令は、音声プロンプトであるか、音声認識技術を通じて前記音声プロンプトが変換されたテキスト形式である
請求項２に記載の制御命令処理装置。
前記追加情報は、
ユーザが、前記少なくとも１つの制御命令に関する音声を発話した時間、前記少なくとも１つの音声エージェントから前記少なくとも１つの制御命令を受信した時間、前記少なくとも１つの制御命令に関する音声の認識の正確度、音声信号の強度、前記少なくとも１つの制御命令の長さ、前記少なくとも１つの制御命令から抽出されたハッシュ値、特性値、前記ユーザの情報、前記少なくとも１つの音声エージェントのエージェント装置情報、及び前記電子装置の情報のうちの１つ以上を含む
請求項２又は３に記載の制御命令処理装置。
前記命令実行部は、
前記複数の制御命令のそれぞれにタギングされた追加情報に基づいて、前記複数の制御命令を１つ以上のクラスターに統合する命令統合部と、
前記統合の結果に基づいて、前記電子装置を制御する最終制御命令を決定する最終命令決定部と、
を含む請求項２乃至４のいずれか一項に記載の制御命令処理装置。
前記命令統合部は、
前記複数の制御命令の相互間の類似度を算出し、該算出された類似度及び前記タギングされた追加情報に基づいて、前記複数の制御命令を１つ以上のクラスターに統合する
請求項５に記載の制御命令処理装置。
前記命令統合部は、
前記命令タギング部で時間間隔間に受信された制御命令に基づいて、前記複数の制御命令を１つ以上のクラスターに統合する
請求項５又は６に記載の制御命令処理装置。
前記最終命令決定部は、
前記１つ以上のクラスターのそれぞれについて、該クラスターの重心に該当する制御命令を、前記最終制御命令として決定する
請求項５乃至７のいずれか一項に記載の制御命令処理装置。
前記命令実行部は、
前記１つ以上のクラスター内に重複命令が存在する場合、ユーザに対して前記重複命令の処理に関するクエリを行うインタラクション部をさらに含み、
前記最終命令決定部は、
前記クエリの遂行の結果に基づいて、前記最終制御命令を決定する
請求項５乃至８のいずれか一項に記載の制御命令処理装置。
前記命令実行部は、
前記制御命令を伝達した音声エージェントが複数である場合、該複数の音声エージェントの中からユーザとインタラクションを行う音声エージェントを選定するエージェント選定部をさらに含む
請求項２乃至９のいずれか一項に記載の制御命令処理装置。
前記エージェント選定部は、
前記ユーザと前記音声エージェントとの距離、前記音声エージェントに対するユーザの選好度、前記音声エージェントの使用頻度、音声信号の強度、前記音声エージェントから受信された制御命令の音声認識の正確度のうちの何れか１つまたはこれらの組合せに基づいて、ユーザとインタラクションを行う音声エージェントを選定する
請求項１０に記載の制御命令処理装置。
電子装置の制御命令を処理する方法において、
音声エージェントから制御命令を受信する段階と、
前記受信された制御命令に追加情報をタギングする段階と、
前記受信された制御命令が複数である場合、該複数の制御命令のそれぞれにタギングされた追加情報に基づいて、前記複数の制御命令を統合する段階と、
を含む制御命令処理方法。
前記複数の制御命令を統合する段階は、
前記受信された複数の制御命令にタギングされた追加情報に基づいて、前記複数の制御命令を１つ以上のクラスターに統合する段階と、
前記統合の結果に基づいて前記電子装置を制御する最終制御命令を決定する段階と、
を含む請求項１２に記載の制御命令処理方法。
前記１つ以上のクラスターに統合する段階は、
前記複数の制御命令の相互間の類似度を算出する段階を含み、前記算出された類似度及び前記追加情報に基づいて、前記複数の制御命令を統合する
請求項１３に記載の制御命令処理方法。
前記最終制御命令を決定する段階は、
前記１つ以上のクラスターのそれぞれに対して、該クラスターの重心に該当する命令を前記最終制御命令として決定する
請求項１３又は１４に記載の制御命令処理方法。
前記複数の制御命令を統合する段階は、
前記１つ以上のクラスター内に重複命令が存在すれば、ユーザに対して前記重複命令の処理に関するクエリを行う段階をさらに含み、
前記最終制御命令を決定する段階は、
前記クエリの遂行の結果に基づいて、前記最終制御命令を決定する
請求項１３乃至１５のいずれか一項に記載の制御命令処理方法。
前記複数の制御命令を統合する段階は、
前記制御命令を伝達した音声エージェントが複数である場合、該複数の音声エージェントの中から、ユーザとインタラクションを行う音声エージェントを選定する段階をさらに含む
請求項１２乃至１６のいずれか一項に記載の制御命令処理方法。
プロセッサによって実行されると、前記プロセッサに、請求項１２乃至１７のいずれか一項に記載の制御命令処理方法を実行させる、コンピュータプログラム。
電子装置の制御命令処理装置において、
少なくとも１つの音声エージェントから、電子装置に対する少なくとも１つの制御命令を受信し、前記受信された少なくとも１つの制御命令に追加情報をタギングし、
前記制御命令にタギングされた追加情報に基づいて、前記受信された少なくとも１つの制御命令と、前記電子装置に対して既に実行中の制御命令とを統合し、
前記統合の結果に基づいて、前記電子装置を制御する
プロセッサを含む制御命令処理装置。
前記プロセッサは、
前記少なくとも１つの音声エージェントから、前記電子装置に対する前記少なくとも１つの制御命令を受信し、該受信された少なくとも１つの制御命令に追加情報をタギングする命令タギング部と、
前記少なくとも１つの制御命令にタギングされた追加情報に基づいて、前記受信された制御命令と前記電子装置に対して既に実行中の制御命令とを統合し、前記統合の結果に基づいて、前記電子装置を制御する命令実行部と、
を含む請求項１９に記載の制御命令処理装置。
前記命令実行部は、
前記受信された制御命令と前記既に実行中の制御命令とが互いに矛盾するかどうかを判断する命令統合部と、
前記判断の結果、前記制御命令が矛盾する場合、前記制御命令の中から、前記電子装置を制御する最終制御命令を決定する最終命令決定部と、
を含む請求項２０に記載の制御命令処理装置。
前記命令実行部は、
電子装置別に既に実行中の制御命令を保存する命令ＤＢをさらに含み、
前記命令統合部は、
前記命令ＤＢから、前記電子装置に対して既に実行中の制御命令を検出する
請求項２１に記載の制御命令処理装置。
前記命令実行部は、
前記判断の結果、前記制御命令が矛盾する場合、ユーザに矛盾した命令の処理に関するクエリを行うインタラクション部をさらに含み、
前記最終命令決定部は、
前記クエリの遂行の結果に基づいて、前記最終制御命令を決定する
請求項２１又は２２に記載の制御命令処理装置。
前記命令実行部は、
音声エージェントの選定のためのポリシーを保存するポリシーＤＢと、
前記ポリシーＤＢを参照してユーザとインタラクションを行う音声エージェントを選定するエージェント選定部と、
をさらに含む請求項２１乃至２３のいずれか一項に記載の制御命令処理装置。
ユーザから電子装置を制御するための音声形態の制御命令が入力されると、該入力された制御命令を命令タギング部に伝達する音声エージェントと、
前記電子装置を制御する１つ以上の制御命令を統合するための追加情報を、前記伝達された制御命令にタギングする命令タギング部と、
を含むエージェント装置。
前記電子装置を制御する１つ以上の制御命令を統合処理する制御命令処理装置に、前記追加情報がタギングされた前記制御命令を伝送する通信部をさらに含む
請求項２５に記載のエージェント装置。
前記音声エージェントは、
前記制御命令処理装置から前記制御命令の処理結果を受信すると、前記制御命令の処理結果を音声形態に変換して出力する
請求項２６に記載のエージェント装置。
前記制御命令の処理結果は、前記電子装置を制御する複数の重複命令の処理に関するクエリ及び前記制御命令の実行結果のうちの少なくとも１つを含む
請求項２６又は２７に記載のエージェント装置。
前記音声エージェントは、
前記制御命令が入力されると、前記制御命令が発話された時間、音声信号の強度、ユーザ情報、音声認識の正確度のうちの少なくとも１つを収集し、該収集された情報を前記命令タギング部に伝達する
請求項２５乃至２８のいずれか一項に記載のエージェント装置。