JP2005266192A5 - - Google Patents

Download PDF

Info

Publication number
JP2005266192A5
JP2005266192A5 JP2004077477A JP2004077477A JP2005266192A5 JP 2005266192 A5 JP2005266192 A5 JP 2005266192A5 JP 2004077477 A JP2004077477 A JP 2004077477A JP 2004077477 A JP2004077477 A JP 2004077477A JP 2005266192 A5 JP2005266192 A5 JP 2005266192A5
Authority
JP
Japan
Prior art keywords
recognition
information
home appliance
voice
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004077477A
Other languages
Japanese (ja)
Other versions
JP4581441B2 (en
JP2005266192A (en
Filing date
Publication date
Application filed filed Critical
Priority to JP2004077477A priority Critical patent/JP4581441B2/en
Priority claimed from JP2004077477A external-priority patent/JP4581441B2/en
Publication of JP2005266192A publication Critical patent/JP2005266192A/en
Publication of JP2005266192A5 publication Critical patent/JP2005266192A5/ja
Application granted granted Critical
Publication of JP4581441B2 publication Critical patent/JP4581441B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

家電機器システム、家電機器および音声認識方法Home appliance system, home appliance and voice recognition method

本発明は、特に複数の機器が連携し合う家電機器システム、家電機器および音声認識方法に関するものである。 The present invention relates to a home electric appliance system, a home electric appliance, and a voice recognition method , in which a plurality of devices cooperate with each other.

従来のこの種の音声認識装置は、特許文献1に示されるように、音声認識の処理を特徴抽出と音声認識の前後に分け、それぞれを異なるCPU(演算処理装置)で処理するものが知られている。
特開昭60−265505号公報
As this type of conventional speech recognition device, as disclosed in Patent Document 1, a speech recognition process is divided into before and after feature extraction and speech recognition, and each is processed by a different CPU (arithmetic processing device). ing.
JP 60-265505 A

しかしながら上記従来の音声認識装置では、音声認識処理に関わる前処理を第一のCPUで行い音声認識の認識処理に関わる処理を第二のCPUで行うとしたものである。そのため、機器に入力可能な表現が限られているにもかかわらず、ユーザはその受付可能な表現が分からないために、受付できない表現を発声してしまうという課題があった。   However the above-described conventional voice recognition device, is obtained by the performed processing related to the recognition process of the speech recognition performed pretreatment involved in speech recognition processing in the first CPU in the second CPU. For this reason, there is a problem in that although the expressions that can be input to the device are limited, the user does not know the expressions that can be accepted, and thus utters expressions that cannot be accepted.

人間の発声しうる単語や文のバリエーションは非常に多く、特に認識機器のリソースが限られている場合に、この機器が受付できない表現を発声してしまい、認識ができないという問題が生じる。   There are so many variations of words and sentences that humans can utter, especially when the resources of the recognition device are limited, a problem arises in that the device cannot utter an expression that cannot be accepted.

本発明は、このような課題を解決するためになされたもので、例えば、ネットワークに接続された複数の機器内の音声認識装置が連携し、協調し合うことによって、各機器の音声認識装置のもつ特徴を生かし、たとえある装置で認識できなかったとしても、他の機器の音声認識装置との連携により認識することができる家電機器システム、家電機器および音声認識方法を提供することを目的とする。 The present invention has been made to solve such a problem. For example, the voice recognition devices in a plurality of devices connected to the network cooperate with each other to cooperate with each other. An object of the present invention is to provide a home appliance system, a home appliance, and a voice recognition method capable of recognizing by cooperation with a voice recognition device of another device even if it cannot be recognized by a device using the features of the device. .

本発明の家電機器システムは、家電機器と、当該家電機器と通信可能に、音声認識機能を有する他の家電機器とを備えた家電機器システムであって、前記家電機器は、音声情報が入力される入力手段と、前記入力された音声情報の音声認識を行う認識手段と、少なくとも前記他の家電機器が有するキーワード情報を含むプロファイル情報を格納したプロファイル情報格納手段と、前記音声認識結果である単語が前記キーワード情報に含まれる場合には、前記単語をキーワード情報として有する他の家電機器に、前記音声認識結果を通知する通知手段とを備えている。  The household electrical appliance system of the present invention is a household electrical appliance system including a household electrical appliance and another household electrical appliance having a voice recognition function so as to be able to communicate with the household electrical appliance, and the household electrical appliance is input with voice information. Input means; recognition means for performing voice recognition of the input voice information; profile information storage means for storing profile information including at least keyword information of the other home appliances; and words that are the voice recognition results Is included in the keyword information, notification means for notifying the voice recognition result to other home appliances having the word as keyword information is provided.

また、本発明の家電機器システムは、前記家電機器が、前記認識手段での音声認識結果について、前記他の家電機器への前記音声情報の音声認識の依頼が必要かどうかを判定する判定手段と、前記判定手段において、音声認識の依頼が必要であると判定された場合、前記他の家電機器に、前記音声情報の音声認識の依頼を送信する送信手段と、前記認識手段の音声認識結果と、前記他の家電機器から送信された音声認識の結果とに基づいて、前記音声情報に対する音声認識結果を確定する確定手段とを備えている。  Further, the home appliance system according to the present invention includes a determination unit that determines whether or not the home appliance has a voice recognition request for the voice information to the other home appliance with respect to the voice recognition result of the recognition unit. When the determination unit determines that a request for voice recognition is necessary, a transmission unit that transmits a request for voice recognition of the voice information to the other home appliance, and a voice recognition result of the recognition unit And a confirming means for confirming a speech recognition result for the speech information based on a speech recognition result transmitted from the other home appliance.
また、本発明の家電機器システムは、前記プロファイル情報は、前記他の家電機器が音声認識に用いる辞書ファイルの辞書ファイル情報を含んでおり、前記送信手段は、前記他の家電機器の辞書ファイル情報を参照して、前記認識手段で音声認識に用いる辞書ファイルと言語モデルが近い辞書ファイルを有する他の家電機器に、前記音声情報の音声認識の依頼を送信することを特徴とする。  Further, in the home appliance system according to the present invention, the profile information includes dictionary file information of a dictionary file used for voice recognition by the other home appliance, and the transmission means includes dictionary file information of the other home appliance. The voice recognition request for the voice information is transmitted to another home appliance having a dictionary file whose language model is close to that of the dictionary file used for voice recognition by the recognition means.

また、本発明の家電機器システムは、前記家電機器は、前記他の家電機器からの音声認識の依頼に対して、前記音声情報の音声認識した結果を応答する応答手段を備えたことを特徴とする。  Further, the home appliance system of the present invention is characterized in that the home appliance includes response means for responding to a voice recognition result of the voice information in response to a voice recognition request from the other home appliance. To do.

また、本発明の家電機器システムは、前記家電機器は、前記入力された音声情報を蓄積する音声情報蓄積手段を有し、前記応答手段が、前記他の家電機器からの支援の依頼に対して、前記音声情報蓄積手段に蓄積された音声情報に基づいて、音声認識した結果を応答することを特徴とする。  Moreover, the household electric appliance system of this invention has the audio | voice information storage means in which the said household appliances accumulate | store the said input audio | voice information, and the said response means respond | corresponds with respect to the request of assistance from the said other household appliances The voice recognition result is returned based on the voice information stored in the voice information storage means.

また、本発明の家電機器システムは、前記家電機器は、前記音声情報蓄積手段が、前記他の家電機器に入力された音声情報を蓄積することを特徴とする。  Moreover, the household electrical appliance system according to the present invention is characterized in that in the household electrical appliance, the voice information storage means stores voice information input to the other household electrical appliance.

また、本発明の家電機器システムは、前記家電機器は、前記他の家電機器の音声認識に関する信頼度情報を格納する信頼度情報格納手段を有し、前記確定手段が、前記信頼度情報を参照して、前記信頼度が高い他の家電機器からの音声認識結果を優先して、認識結果を確定することを特徴とする。  Moreover, the household electrical appliance system according to the present invention includes a reliability information storage unit that stores reliability information related to voice recognition of the other household electrical appliance, and the determination unit refers to the reliability information. Then, the recognition result is determined with priority given to the voice recognition result from the other home appliances with high reliability.

また、本発明の家電機器システムは、前記家電機器は、少なくとも前記家電機器と前記他の家電機器との接続の状態又は、前記他の家電機器間の接続の状態を検出する検出手段を有し、前記接続の状態に変化があった場合、前記検出手段が、前記他の家電機器に前記接続の様態の変化を通知することを特徴とするム。  Moreover, the household electrical appliance system of this invention has a detection means in which the said household electrical appliance detects the state of the connection between the said household electrical appliance and the said other household electrical appliance, or the connection between the said other household electrical appliances at least. When the connection state is changed, the detection unit notifies the other home appliances of the change of the connection state.

また、本発明の家電機器システムは、前記家電機器は、記検出手段が、前記接続の状態の変化を検出した場合、前記プロファイル格納手段に格納されているプロファイル情報の接続状態を更新することを特徴とする。  Further, in the home appliance system according to the present invention, the home appliance updates the connection state of the profile information stored in the profile storage unit when the detection unit detects a change in the connection state. Features.

また、本発明の家電機器システムは、前記家電機器は、前記接続の状態の変化が、前記家電機器と前記他の家電機器との接続または離接、もしくは前記他の家電機器の電源の閉成または開放の少なくともいずれか一方であることを特徴とする。  Further, in the home appliance system according to the present invention, the change in the connection state of the home appliance may be connection or disconnection between the home appliance and the other home appliance, or closing of the power source of the other home appliance. It is characterized in that it is at least one of open.

また、本発明の家電機器システムは、前記家電機器は、前記認識手段が、前記音声情報の意味を理解する意味理解手段を有したことを特徴とする。  Moreover, the household electrical appliance system of the present invention is characterized in that the household electrical appliance has a meaning understanding means for the recognition means to understand the meaning of the voice information.

また、本発明の家電機器システムは、前記家電機器は、前記認識手段が、前記認識手段の利用に対して課金をする課金手段を有し、前記課金手段が、前記他の家電機器が前記認識手段に音声認識の依頼をする場合に課金することを特徴とする。  Further, in the home appliance system according to the present invention, the home appliance includes a billing unit in which the recognizing unit charges the use of the recognizing unit, and the billing unit recognizes the other home appliance. Charges are made when a voice recognition request is made to the means.

また、本発明の家電機器システムは、前記家電機器は、前記家電機器に接続された他の家電機器の少なくとも1つの機器が前記課金手段を有し、前記課金手段を有さない他の家電機器と前記課金手段を有する他の家電機器とが通信可能に接続されていることを特徴とする。  Further, the home appliance system according to the present invention is such that at least one of the other home appliances connected to the home appliance has the billing unit and the other home appliance does not have the billing unit. And other home appliances having the accounting means are connected to be communicable.

また、本発明の家電機器は、音声認識機能を有する他の家電機器と通信可能に接続された家電機器であって、前記家電機器は、音声情報が入力される入力手段と、前記入力された音声情報の音声認識を行う認識手段と、少なくとも前記他の家電機器が有するキーワード情報を含むプロファイル情報を格納したプロファイル情報格納手段と、前記音声認識結果である単語が前記キーワード情報に含まれる場合には、前記単語をキーワード情報として有する他の家電機器に、前記音声認識結果を通知する通知手段とを備えている。  Moreover, the household electrical appliance of the present invention is a household electrical appliance connected so as to be communicable with another household electrical appliance having a voice recognition function, and the household electrical appliance is input with voice input information and the input When the keyword information includes a recognition unit that performs voice recognition of voice information, a profile information storage unit that stores profile information including at least the keyword information of the other home appliances, and a word that is the voice recognition result Comprises a notification means for notifying other home appliances having the word as keyword information of the voice recognition result.

また、本発明の音声認識方法は、家電機器と、当該家電機器と通信可能に、音声認識機能を有する他の家電機器とを備えた家電機器システムにおける家電機器の音声認識方法であって、音声情報が入力される入力ステップと、認識手段が、前記入力された音声情報の音声認識を行う認識ステップと、通知手段が、少なくとも前記他の家電機器が有するキーワード情報を含むプロファイル情報を参照して、前記音声認識結果である単語が前記キーワード情報に含まれる場合には、前記単語をキーワード情報として有する他の家電機器に、前記音声認識結果を通知する通知ステップとを有する。  The speech recognition method of the present invention is a speech recognition method for a home appliance in a home appliance system including a home appliance and another home appliance having a voice recognition function so as to be able to communicate with the home appliance. An input step in which information is input, a recognition step in which recognition means performs voice recognition of the input voice information, and a notification means refer to profile information including at least keyword information possessed by the other home appliances When the word that is the voice recognition result is included in the keyword information, a notification step of notifying the other home electric appliance having the word as keyword information of the voice recognition result is included.

また、本発明の音声認識方法は、判定手段が、前記認識ステップでの音声認識結果について、前記他の家電機器への前記音声情報の音声認識の依頼が必要かどうかを判定する判定ステップと、前記判定ステップにおいて、音声認識の依頼が必要であると判定された場合、送信手段が、前記他の家電機器に、前記音声情報の音声認識の依頼を送信する送信ステップと、確定手段が、前記認識ステップの音声認識結果と、前記他の家電機器から送信された音声認識の結果とに基づいて、前記音声情報に対する音声認識結果を確定する確定ステップとを有する。  Further, in the speech recognition method of the present invention, the determination unit determines whether or not a request for speech recognition of the speech information to the other household electrical appliance is necessary for the speech recognition result in the recognition step; In the determination step, when it is determined that a request for voice recognition is necessary, a transmission unit transmits a request for voice recognition of the voice information to the other household electrical appliance, and a determination unit includes: A confirming step of confirming a speech recognition result for the speech information based on a speech recognition result of the recognition step and a speech recognition result transmitted from the other home appliance.

また、本発明の音声認識方法は、前記プロファイル情報は、前記他の家電機器が音声認識に用いる辞書ファイルの情報を含んでおり、前記送信ステップは、前記送信手段が、前記他の家電機器の辞書ファイルの情報を参照して、前記認識ステップで音声認識に用いる辞書ファイルと言語モデルが近い辞書ファイルを有する他の家電機器に、前記音声情報の依頼を送信することを特徴とする。  Further, in the voice recognition method of the present invention, the profile information includes information on a dictionary file used for voice recognition by the other home appliance, and the sending step includes the step of sending the other home appliance. The voice information request is transmitted to another home appliance having a dictionary file whose language model is similar to the dictionary file used for voice recognition in the recognition step with reference to the information of the dictionary file.

本発明の家電機器システム、家電機器によれば、音声情報が入力される入力手段と、入力された音声情報の音声認識を行う認識手段と、認識手段での認識結果について支援の依頼が必要かどうかを判定する判定手段と、判定手段から支援を依頼される他の機器が接続された回線手段と、他の機器から送られてくる支援の結果に基づいて認識結果を確定する確定手段と、確定された認識結果を出力する出力手段とを備え、単体の家電機器では受理できずに認識できない発話に対しても、複数の家電機器が連携し合って音声認識を行うことで、その発話に対する認識が可能になる。 According to the home appliance system and the home appliance of the present invention, is it necessary to request support for the input means for inputting voice information, the recognition means for performing voice recognition of the input voice information, and the recognition result of the recognition means? A determination means for determining whether or not, a line means to which another device requested for support from the determination means is connected, a confirmation means for confirming a recognition result based on a result of support sent from the other device, Output means that outputs the confirmed recognition result, and even for utterances that cannot be accepted and recognized by a single home appliance , multiple home appliances cooperate to perform voice recognition, Recognition is possible.

以下、本発明の実施の形態について、図面を参照しながら説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

(実施の形態1)
本発明の実施の形態1では、具体例として、それぞれ本実施の形態の家電機器が搭載された電子レンジ、冷蔵庫、パソコンがネットワークに接続されている場合を例に説明する。
(Embodiment 1)
In Embodiment 1 of the present invention, as a specific example, a case where a microwave oven, a refrigerator, and a personal computer each equipped with the home appliance of the present embodiment are connected to a network will be described as an example.

図1は、本実施の形態1に係る家電機器などを用いたシステムを示す構成図である。図1では、PC(パーソナルコンピュータ)1、電子レンジ2、冷蔵庫3がLAN4に接続され、各機器にはそれぞれが連携できる音声認識部101が搭載され、相互に音声認識の連携のための情報のやり取りが出来るようになっている。なお、本実施の形態も含めて、以下の実施例では、各機器の接続はLANで説明するが、一般にはLANでなくても、各種機器が接続されてデータなどの送受ができる回線であれば良い。 Figure 1 is a block diagram showing a system using such engagement Ru domestic appliances, in the first embodiment. In FIG. 1, a personal computer (PC) 1, a microwave oven 2, and a refrigerator 3 are connected to a LAN 4, and each device is equipped with a voice recognition unit 101 that can cooperate with each other. You can communicate. In the following examples, including this embodiment, the connection of each device will be explained using a LAN. However, in general, it is not a LAN, but a line that can send and receive data etc. by connecting various devices. It ’s fine.

図2は上記各機器に搭載されたお互いに連携する音声認識部101の構成を示す図である。   FIG. 2 is a diagram showing a configuration of the voice recognition units 101 that are mounted on the respective devices and cooperate with each other.

図2において、入力部201はマイクやファイルから音声情報の入力を受け付けることができる。出力部207は認識結果確定部204から送られる出力内容信号222をもとに最終的な音声認識の結果をディスプレイや各機器の制御系などへ出力する。認識部202は入力部201から送られる入力音声信号221の認識を行う。認識方式は単語認識、連続音声認識など、いずれも可能である。   In FIG. 2, an input unit 201 can accept input of audio information from a microphone or a file. The output unit 207 outputs on the basis of the output content signal 222 sent from the recognition result decision unit 204 to the final result of speech recognition to a display and control system of each device. The recognition unit 202 recognizes the input voice signal 221 sent from the input unit 201. The recognition method can be either word recognition or continuous speech recognition.

依頼判定部203は認識部202から認識結果信号241を受け、認識結果を元に他の機器にその内容確認の依頼をする(保証依頼)か、再度認識を依頼する(認識依頼)かの、いずれかの必要があるかどうかの判断を行う。依頼判定部203はその判断結果に基づき、回線手段としてのインターフェース部206に対して送信依頼内容信号231を送り、また認識結果確定部204に対して依頼内容の情報を付加した認識結果である認識結果依頼情報付き信号242を送信する。   The request determination unit 203 receives the recognition result signal 241 from the recognition unit 202, and requests another device to confirm the content based on the recognition result (guarantee request) or requests recognition again (recognition request). perform any necessary is whether the judgment. Based on the determination result, the request determination unit 203 sends a transmission request content signal 231 to the interface unit 206 as a line means, and also recognizes the recognition result as the recognition result with the request content information added to the recognition result determination unit 204. sending a result request information with signal 242.

認識結果確定部204は、依頼判定部203から送られてくる認識結果依頼情報付き信号242とインターフェース部206から送られてくる受入返答内容信号232をもとに認識結果の再判定を行ない、再判定の結果を出力内容信号222として出力部207に対して送信し、さらに、同様に依頼応答部205に対しても再判定の結果を認識結果格納信号243として送信する。   The recognition result determination unit 204 re-determines the recognition result based on the signal 242 with the recognition result request information sent from the request judgment unit 203 and the acceptance response content signal 232 sent from the interface unit 206. The determination result is transmitted as an output content signal 222 to the output unit 207, and similarly, the re-determination result is also transmitted to the request response unit 205 as a recognition result storage signal 243.

なお、認識結果確定部204は、上記のように、LANに接続された他の機器から送られ
てくる、保証依頼や認識依頼に対する返答である受入返答内容信号232と、自らの認識部202の認識結果である認識結果依頼情報付き信号242の両者に基づいて認識結果を確定しなくても、保証依頼や認識依頼に対する返答である受入返答内容信号232だけで認識結果を確定することも可能である。
The recognition result determination unit 204, as described above, receives an acceptance response content signal 232, which is a response to a guarantee request or a recognition request, sent from another device connected to the LAN, and the own recognition unit 202. Even if the recognition result is not determined based on both the recognition result request information-added signal 242 that is the recognition result, the recognition result can be determined only by the acceptance response content signal 232 that is a response to the guarantee request or the recognition request. is there.

インターフェース部206は、依頼判定部203から送られる送信依頼内容信号231をもとにネットワークに接続された他の機器へ保証や認識の依頼を行うための送信依頼メッセージ235をネットワークを通じて送信し、また、依頼の結果得られる依頼先から送られてくる保証結果や認識結果である受入応答メッセージ信号236を解釈し、その結果を認識結果確定部204に受入返答内容信号232として送信する。   The interface unit 206 transmits a transmission request message 235 for requesting guarantee or recognition to another device connected to the network based on the transmission request content signal 231 sent from the request determination unit 203, and The acceptance response message signal 236 that is a guarantee result or recognition result sent from the request destination obtained as a result of the request is interpreted, and the result is transmitted to the recognition result determination unit 204 as an acceptance response content signal 232.

さらに、インターフェース部206はネットワークに接続された他の機器から送られてくる受入依頼メッセージ信号238を解釈しその結果を受入依頼内容信号234として依頼応答部205に送信し、依頼応答部205から送られてくる他の機器からの依頼に対する結果を送信応答内容信号233として受け取り、その結果を送信応答メッセージ信号237としてネットワークを通じて依頼元に返信する。依頼応答部205は認識結果確定部204からの認識結果格納信号243を保持し、その情報をもとに他の機器からの保証依頼について応答したり、また認識依頼があった場合は、音声認識を行いその結果を回答する。   Further, the interface unit 206 transmits the request response unit 205 interprets the acceptance request message signal 238 sent from other devices connected to the network as a result acceptance request content signal 234, sent from the request responding unit 205 A result of the request from another device is received as a transmission response content signal 233, and the result is returned as a transmission response message signal 237 to the request source through the network. The request response unit 205 holds the recognition result storage signal 243 from the recognition result determination unit 204, responds to a guarantee request from another device based on the information, and if there is a recognition request, the voice recognition And answer the results.

以上のように構成された実施の形態1を用いて、電子レンジ2がPC1に認識結果の保証を依頼し、その結果を利用して音声認識を行うとした場合の動作をフローチャートを用いて説明する。ここで電子レンジ2には単語認識が、PC1には家庭内の発声を網羅した連続音声認識部101が搭載されているとする。   Using the first embodiment configured as described above, the operation when the microwave oven 2 requests the PC 1 to guarantee the recognition result and performs the speech recognition using the result will be described with reference to a flowchart. To do. Here the word recognized by the microwave oven 2, the PC1 and continuous speech recognition unit 101 that covers the utterance in the home are installed.

図3は、電子レンジ2の音声認識部101で認識結果をPC1に保証依頼する場合の、保証依頼する側である電子レンジ2のフローチャートである。   Figure 3 is a flow chart of a microwave oven 2 is the side to guarantee request if guarantee request recognition result to PC1 by the speech recognition unit 101 of the microwave oven 2.

処理がスタートする(S301)と、入力部201で入力された音声に対して認識部202で音声を検出し、この音声に対して音声認識を行う(S302)。依頼判定部203はその音声認識の結果を表す認識結果信号241を受け取ると、他の機器への保証依頼の必要があるかどうかを判定する(S303)。判定は、複数の音声認識候補が得られた場合、あるいは複数の音声認識結果の尤度が近い場合などの判定基準を用いて行うことができる。   And processing is started (S301), detects a voice recognition unit 202 to the audio input by the input unit 201, performs speech recognition on the voice (S302). Upon receiving the recognition result signal 241 representing the result of the speech recognition, the request determination unit 203 determines whether or not a guarantee request to another device is necessary (S303). The determination can be performed using a determination criterion such as when a plurality of speech recognition candidates are obtained or when the likelihood of a plurality of speech recognition results is close.

具体的には、音声認識の結果得られる尤度で候補を閾値判定したときに、閾値以下を認識候補と設定した場合に、閾値以下に候補が複数得られたとき、あるいは第一の候補と第二の候補の尤度の差がある閾値以下の場合に他の機器への保証が必要であると判断するなどの方法を採用すれば良い。   Specifically, when a candidate is threshold-determined with the likelihood obtained as a result of speech recognition, when a threshold or lower is set as a recognition candidate, when a plurality of candidates are obtained below the threshold, or the first candidate What is necessary is just to employ | adopt the method of judging that the guarantee to another apparatus is required when the difference of the likelihood of a 2nd candidate is below a certain threshold value.

依頼判定部203で判定の結果(S304)、保証の必要があると判断した場合はS305に、必要ないと判断した場合はS310に処理を分岐させる。インターフェース部206において送信依頼内容信号231をもとに他の機器へ依頼する送信依頼メッセージ信号235を作成し(S305)、上記メッセージ信号235をネットワークを通じて送信する(S306)。その後、他の機器から送られてくる保証依頼の結果を表す受入応答メッセージ信号236を受け取り(S307)、そのメッセージを解釈し受入応答内容信号232として認識結果確定部204に送信する(S308)。   As a result of the determination by the request determination unit 203 (S304), the process branches to S305 if it is determined that the guarantee is necessary, and to S310 if it is determined that the request is not necessary. The interface unit 206 creates a transmission request message signal 235 for requesting another device based on the transmission request content signal 231 (S305), and transmits the message signal 235 through the network (S306). Thereafter, an acceptance response message signal 236 representing the result of the guarantee request sent from another device is received (S307), the message is interpreted and transmitted to the recognition result determination unit 204 as an acceptance response content signal 232 (S308).

受入応答内容信号232と、依頼判定部203から送られる認識部202における認識結果のどの部分を保証依頼したかという情報を付与した認識結果依頼情報付き信号242をもとに音声認識の再評価を行い(S309)、その結果を出力内容信号222として出力部207に送信する。再判定後の認識結果である出力内容信号222をディスプレイあるいは機器の操作系へと出力し、また同様に依頼応答部205にその結果を認識結果格納信号243として出力し(S310)、認識処理に戻る(S302)。また、S304で保証の必要がないと判定された場合には、S302の認識結果信号241はそのまま認識結果確定部204を介して出力内容信号222として出力部207に出力する。   Based on the reception response content signal 232 and the signal 242 with the recognition result request information to which information indicating which part of the recognition result in the recognition unit 202 sent from the request determination unit 203 is requested to be guaranteed is re-evaluated. The result is transmitted to the output unit 207 as an output content signal 222 (S309). The output content signal 222 which is the recognition result after redetermination is output to the display or the operation system of the device, and the result is similarly output to the request response unit 205 as a recognition result storage signal 243 (S310) for the recognition process. Return (S302). If it is determined in S304 that there is no need for guarantee, the recognition result signal 241 in S302 is output to the output unit 207 as an output content signal 222 via the recognition result determination unit 204 as it is.

上記電子レンジ2の認識部241の動作において、PC1によって返信された受入応答メッセージ信号236に応じて行う認識結果の再判定処理は、例えば次のようにすればよい。ここでは電子レンジ2がPC1に「温め」という言葉の保証を依頼し、その結果返ってくる受入応答メッセージ信号236に応じた認識結果確定部204の動作を説明する。依頼先であるPC1によって「温め」の認識結果が保証された場合には、電子レンジ2だけでなくPC1でも認識されたことになるため、「温め」の認識結果をよりいっそう信頼してよいと考えることができる。そのため、保証された場合には「温め」の結果を採用すればよい。   In operation of the microwave oven 2 recognition unit 241, re-determination processing of the recognition result performed in response to receiving the response message signal 236 sent back by the PC1 may be, for example, as follows. Here, the operation of the recognition result determination unit 204 in response to the reception response message signal 236 returned from the microwave oven 2 asking the PC 1 to guarantee the word “warming” will be described. If the recognition result of "warm" by the request destination is a PC1 is guaranteed, because that would have been recognized even PC1 well microwaves 2, and may be more reliable the recognition result of "warm" Can think. Therefore, it is sufficient to adopt the results of the "warm" when that is guaranteed.

一方、保証されなかった場合、電子レンジ2側の他の認識候補を通知し保証をしてもらう。この操作をPC1の認識結果と合うまで、もしくは候補がなくなるまで続けることが出来る。もし、PC1の結果と電子レンジ2の結果が一致した場合、その結果を採用することでより尤もらしい結果を採用することが出来る。   On the other hand, if not guaranteed, other recognition candidates on the microwave oven 2 side are notified and guaranteed. This operation can be continued until it matches the recognition result of the PC 1 or until there are no candidates. If the result of the microwave oven 2 results in PC1 are matched, it is possible to adopt a more plausible result by employing the results.

ここでは、電子レンジ2がPC1に依頼するとして説明したが、一般には電子レンジ2が複数の機器に保証を依頼する構成をとることが出来る。その場合は、自機器である電子レンジ2での結果も含め多数決を用いて結果を採用するなどの方法も採用すればよい。   Here, the description has been made assuming that the microwave oven 2 requests the PC 1, but in general, the microwave oven 2 may request a plurality of devices for guarantee. In that case, it is sufficient to process adopted, such as employing the results by using the result including the majority of the microwave 2 is a self device.

なお、ここでは、電子レンジ2には単語認識が搭載されているとして説明したが、「ご飯を温めてください」などのような文形式の発声に対して認識を行う連続音声認識の結果についても本発明を適用することは可能である。例えば、音声認識の結果、複数の文候補が得られたとする。そのとき、第一候補と第二候補のある区間のみ異なっており、その区間の両候補の尤度(スコア)の差が小さいとしたとき、その区間のみを他の認識機に保証依頼をするといったことができる。   In addition, although demonstrated here that the word recognition was carried in the microwave oven 2, about the result of the continuous speech recognition which recognizes with respect to the utterance of sentence formats, such as "Please warm rice" It is possible to apply the present invention. For example, assume that a plurality of sentence candidates are obtained as a result of speech recognition. At that time, only a certain section of the first candidate and the second candidate are different, and when the difference in likelihood (score) between the two candidates in the section is small, a guarantee request is issued to another recognizer for only that section. It can be said.

また、S309における再判定処理に関しても、より連続音声認識に特化した方法も可能である。通常、連続音声認識では単語のつながり易さをモデル化したN−gramとい
う言語モデルを用いる。N−gramを用いることで、前後に出現する単語のコンテキストが決められ数万語という大規模な単語を対象にした文音声の音声認識が可能となる。
Further, regarding the redetermination process in S309, a method specialized in continuous speech recognition is also possible. Normally, continuous speech recognition uses a language model called N-gram that models the ease of word connection. By using N-gram, the context of words appearing before and after is determined, and speech recognition of sentence speech targeting a large-scale word of tens of thousands of words becomes possible.

ところで、一般に、音声認識は、数式1に示す単語系列を見つけることに相当する。   By the way, in general, speech recognition corresponds to finding the word sequence shown in Formula 1.

Figure 2005266192
Figure 2005266192

ここで、wは任意の単語系列、P(w)は言語の確率、p(x|w)は単語系列wの時に音の特徴xが出現する確率を表し、この確率p(x|w)*P(w)が最尤となる単語系列が認識結果となる。   Here, w is an arbitrary word sequence, P (w) is a language probability, and p (x | w) is a probability that a sound feature x appears in the word sequence w. This probability p (x | w) * The word sequence with the maximum likelihood of P (w) is the recognition result.

したがって、本実施の形態では、数式1を数式2のように変形することにより、本発明のように各機器の連携を使って再判定することが可能となる。   Therefore, in this embodiment, it is possible to re-determine using the cooperation of each device as in the present invention by transforming Equation 1 into Equation 2.

Figure 2005266192
Figure 2005266192

この数式2において、時刻tを始端とし時刻kを終端とする単語(下の数式2ではi番目に入力されている単語)として「温め」を固定し最尤候補を求めることになる。   In Equation 2, “warming” is fixed as a word starting at time t and ending at time k (the word inputted i-th in Equation 2 below), and the maximum likelihood candidate is obtained.

上記の数式2に示した方法では単語を固定したが、その単語の尤度の値をかさ上げし、最尤候補を求める方法も有効である。   In the method shown in Equation 2 above, a word is fixed, but it is also effective to increase the likelihood value of the word and obtain the maximum likelihood candidate.

次に、図4に、保証依頼を受けたPC1側のフローチャートを示す。処理がスタートすると(S401)、他の機器から受入依頼メッセージ信号238が入力されるまで待つ(S402)。入力があった場合は、受入依頼メッセージ信号238を受信し(S403)、受入依頼メッセージ信号238をインターフェース部206で解釈し、受入依頼内容信号234を依頼応答部205に入力する(S404)。   Next, FIG. 4 shows a flowchart on the PC 1 side that has received the guarantee request. When the process starts (S401), the process waits until an acceptance request message signal 238 is input from another device (S402). If there is input receives the acceptance request message signal 238 (S403), the acceptance request message signal 238 interpreted by the interface unit 206, and inputs the acceptance request content signal 234 to the request responding section 205 (S404).

受入依頼内容信号234をもとに依頼応答部205で保証の判定を行い、その結果を送信応答内容信号233としてインターフェース部206に出力する(S405)。ここで、ある時刻にある単語が入っているかどうかの判定は、単語が同じでかつ判定すべき単語の時間区間がある一定以上一致している、もしくは±200msecで一致するなどの基準を使えばよい。   The request response unit 205 determines the guarantee based on the acceptance request content signal 234, and outputs the result to the interface unit 206 as a transmission response content signal 233 (S405). Here, it is possible to determine whether or not a certain word is included at a certain time by using a criterion such that the word is the same and the time interval of the word to be determined coincides with a certain distance or matches within ± 200 msec. Good.

インターフェース部206は送信応答内容信号233をもとに送信応答メッセージ信号237を作成する(S406)。インターフェース部206は送信応答メッセージ信号237をネットワーク4を介して依頼元に返信する(S407)。   The interface unit 206 creates a transmission response message signal 237 based on the transmission response content signal 233 (S406). The interface unit 206 returns a transmission response message signal 237 to the request source via the network 4 (S407).

次に、電子レンジ2がPC1に認識の依頼を行うとした場合の動作をフローチャートを用いて説明する。   Next, an operation when the microwave oven 2 requests the PC 1 for recognition will be described using a flowchart.

図5は認識を依頼する側である電子レンジ2のフローチャートである。処理がスタートすると(S501)、入力部201で入力された音声に対して認識部202で音声を検出し、この音声に対して音声認識を行う(S502)。音声認識の結果を表す認識結果信号241に対して依頼判定部203で他の機器への保証の必要があるかどうかを判定する(S503)。   FIG. 5 is a flowchart of the microwave oven 2 on the side requesting recognition. When the process is started (S501), detects a voice recognition unit 202 to the audio input by the input unit 201, performs speech recognition on the voice (S502). In response to the recognition result signal 241 representing the result of speech recognition, the request determination unit 203 determines whether it is necessary to guarantee another device (S503).

判定は、入力音声が長い場合、言語の尤度が低い場合、複数の音声認識候補が得られた場合、あるいは複数の音声認識結果の尤度が近い場合などの判定基準を用いて行うことが出来る。本実施の形態では、入力音声がx秒以上であるならば、入力された音声が文であると考え連続音声認識を依頼する。   The determination may be performed using a determination criterion such as when the input speech is long, when the likelihood of the language is low, when a plurality of speech recognition candidates are obtained, or when the likelihood of a plurality of speech recognition results is close. I can do it. In this embodiment, if the input voice is longer than x seconds, the input voice is considered to be a sentence, and continuous voice recognition is requested.

具体的には、音声認識に言語モデルを用いている場合は、認識結果の言語の尤度が低いときに言語モデルのドメインが一致していない、あるいは認識すべき単語が辞書に入っていないなどの状況が考えられる。そこで、言語モデルの確率がある閾値以下の単語が認識結果から得られていた場合、依頼をすればよい。また、音声認識の結果得られる尤度(音響尤度、音響尤度+言語スコアの尤度)で候補を閾値判定したときに閾値以下に候補が複数得られたとき、あるいは第一の候補と第二候補との尤度差がある閾値以下の場合に他の機器への依頼が必要であると判断するなどの方法をとれば良い。   Specifically, if a language model is used for speech recognition, the domain of the language model does not match when the language likelihood of the recognition result is low, or the word to be recognized is not in the dictionary, etc. The situation can be considered. Therefore, if a word whose probability is less than a threshold is obtained from the recognition result, a request may be made. In addition, when a candidate is determined as a threshold by the likelihood (acoustic likelihood, acoustic likelihood + language score likelihood) obtained as a result of speech recognition, a plurality of candidates are obtained below the threshold, or the first candidate What is necessary is just to take a method of determining that a request to another device is necessary when the likelihood difference with the second candidate is equal to or less than a threshold value.

次に、判定結果に応じて処理を分岐させる(S504)。認識依頼の必要があると判断
した場合はS505に、必要ないと判断した場合はS510に処理を分岐させる。
Next, the process is branched according to the determination result (S504). If it is determined that a recognition request is necessary, the process branches to S505. If it is determined that a recognition request is not necessary, the process branches to S510.

認識依頼の必要がある場合、インターフェース部206において送信依頼内容信号231をもとに他の機器へ依頼する送信依頼メッセージ信号235を作成し(S505)、送信依頼メッセージ信号235をネットワーク4を通じて送信する(S506)。他の機器から送られてくる認識依頼の結果を表す受入応答メッセージ信号236を受け取り(S507)、そのメッセージを解釈し受入応答内容信号232として認識結果確定部204に送信する(S508)。受入応答内容信号232と依頼判定部203から送られる、認識部202における認識結果のどの部分を認識依頼したかという情報を付与した認識結果依頼情報付き信号242をもとに音声認識の再評価を行い、その結果を出力内容信号222として出力部207に送信する(S509)。   If there is a need for recognition request, it creates a transmission request message signal 235 for requesting to another apparatus based on the transmission request content signal 231 in the interface unit 206 (S505), the transmission request message signal 235 transmits via the network 4 (S506). Receiving an acceptance response message signal 236 representing the result of the recognition request sent from another device (S507), and transmits the recognition result decision unit 204 as receiving the response content signal 232 interprets the message (S508). The speech recognition is re-evaluated based on the reception response content signal 232 and the signal 242 with the recognition result request information to which information indicating which part of the recognition result in the recognition unit 202 is requested to be sent is sent from the request determination unit 203. The result is transmitted to the output unit 207 as an output content signal 222 (S509).

このときの認識結果確定部204の動作として、依頼先であるPC1の結果を優先する、もしくは仮に依頼先が複数あった場合にはそれらの返信の結果から多数決などの方法を用いて決める、もしくは自機器である電子レンジ2の結果と前記複数の機器からの返信の結果を用いて多数決などの方法を用いて決めることが出来る。   As the operation of the recognition result determination unit 204 at this time, priority is given to the result of the requesting PC 1, or if there are a plurality of requesting destinations, a decision such as a majority decision is made from the results of those responses, or It can be determined using a method such as majority vote using the result of the microwave oven 2 which is the device itself and the result of the reply from the plurality of devices.

上記再判定後の認識結果である出力内容信号222をディスプレイあるいは機器の操作系へと出力し、また同様に依頼応答部205にその結果を認識結果格納信号243として出力し(S510)、認識処理に戻る(S502)。   The output content signal 222, which is the recognition result after the re-determination, is output to the display or the operation system of the device, and the result is similarly output to the request response unit 205 as a recognition result storage signal 243 (S510). Return to (S502).

また、S504で認識依頼の必要がないと判定された場合には、認識結果信号241はそのまま出力内容信号222として認識結果確定部204からそのまま出力部207に出力される(S510)。   If it is determined in S504 that no recognition request is required, the recognition result signal 241 is output as it is from the recognition result determination unit 204 to the output unit 207 as it is as the output content signal 222 (S510).

図6に認識依頼を受けたPC1側のフローチャートを示す。処理がスタートすると(S601)。他の機器から受入依頼メッセージ信号238が入力されるまで待つ(S602)。入力があった場合は、受入依頼メッセージ238を受信し(S603)、受入依頼メッセージ信号238をインターフェース部206で解釈し受入依頼内容信号234が応答依頼部205に入力される(S604)。受入依頼内容信号234をもとに依頼応答部205で音声認識を行い、その結果を送信応答内容信号233としてインターフェース部206に出力する(S605)。インターフェース部206は上記送信応答内容信号233をもとに送信応答メッセージ信号237を作成する(S606)。インターフェース部206はこの送信応答メッセージ信号237をネットワーク4を介して依頼元に返信し(S607)、受入依頼メッセージ信号238が入力されるのを待つ(S602)。   FIG. 6 shows a flowchart on the PC 1 side that has received the recognition request. When the process starts (S601). Wait until an acceptance request message signal 238 is input from another device (S602). If there is input receives the acceptance request message 238 (S603), receiving request content signal 234 interprets the acceptance request message signal 238 in the interface unit 206 is input to the response requesting unit 205 (S604). Based on the acceptance request content signal 234, the request response unit 205 performs speech recognition, and outputs the result as a transmission response content signal 233 to the interface unit 206 (S605). The interface unit 206 creates a transmission response message signal 237 based on the transmission response content signal 233 (S606). The interface unit 206 returns the transmission response message signal 237 to the request source via the network 4 (S607), and waits for the reception request message signal 238 to be input (S602).

以上説明した認識依頼と認識保証の処理を同時に切り替えて行うことも可能である。以下では、両者を同時に行った場合の動作をフローチャートを用いて説明する。   It is also possible to switch the recognition request and recognition guarantee processing described above at the same time. The following description with reference to the flowchart of operation in the case of performing both simultaneously.

図7は認識を依頼する側である電子レンジ2のフローチャートである。処理がスタートすると(S701)、入力部201で入力された音声に対して認識部202で音声を検出し、この音声に対して音声認識を行う(S702)。音声認識の結果を表す認識結果信号241に対して依頼判定部203で他の機器への保証あるいは認識依頼の必要があるかどうかを判定する(S703)。判定は、音声の全体について正しいかどうかを依頼したい場合には認識依頼を、入力音声のうちの一部分だけの保証を求めたいときには保証依頼を依頼するように判断すれば良い。   FIG. 7 is a flowchart of the microwave oven 2 on the side requesting recognition. When the process starts (S701), the recognition unit 202 detects the voice input from the input unit 201 and performs voice recognition on the voice (S702). In response to the recognition result signal 241 representing the result of speech recognition, the request determination unit 203 determines whether or not a guarantee to another device or a recognition request is necessary (S703). The determination may be made so as to request a recognition request when requesting whether or not the entire voice is correct, and request a guarantee request when requesting a guarantee of only a part of the input voice.

より具体的には、例えば、入力音声がx秒以上の場合に入力音声が文であると考えて認識依頼を行い、x秒未満の時は単語であると考え保証依頼をする。またx秒以上であっても、ある特定の候補の区間のみ言語尤度がある決められた閾値よりも低い、もしくは第二候補との尤度差が小さい、音響尤度が低いなどの基準を用いることでその区間で認識されている単語候補の保証を依頼することができる。   More specifically, for example, the input speech is performed recognition request consider the input speech in the case of more than x seconds is a sentence, when less than x seconds to guarantee request considered a word. Further, even if it is x seconds or more, criteria such as a language likelihood lower than a predetermined threshold value only in a certain candidate section, a likelihood difference with a second candidate is small, or a sound likelihood is low. By using it, the guarantee of the word candidate recognized in the area can be requested.

前記判定結果に応じて処理を分岐させる(S704)。保証あるいは認識依頼の必要があると判断した場合はS705に、必要ないと判断した場合はS710に処理を分岐させる。   The process branches according to the determination result (S704). If it is determined that a guarantee or recognition request is necessary, the process branches to S705, and if it is determined that it is not necessary, the process branches to S710.

必要ありと判断した場合は、インターフェース部206において送信依頼内容信号231をもとに他の機器へ依頼する送信依頼メッセージ信号235を作成し(S705)、このメッセージをネットワーク4を通じて送信する(S706)。次に、他の機器から送られてくる認識依頼あるいは保証依頼の結果を表す受入応答メッセージ信号236を受け取り(S707)、そのメッセージを解釈し受入返答内容信号232として認識結果確定部204に送信する(S708)。   If it is determined that it is necessary, the interface unit 206 creates a transmission request message signal 235 for requesting another device based on the transmission request content signal 231 (S705), and transmits this message through the network 4 (S706). . Then, receiving the acceptance response message signal 236 representing the result of the recognition request or guarantee request sent from another device (S707), and transmits the recognition result decision unit 204 as receiving the reply signal 232 interprets the message (S708).

上記受入返答内容信号232と依頼判定部203から送られる認識部202における認識結果のどの部分を保証もしくは認識依頼したかという情報を付与した認識結果依頼情報付き信号242をもとに音声認識の再評価を行い、その結果を出力内容信号222として出力部207に送信する(S709)。再評価の方法は、保証なのか認識依頼なのかに応じて、前記各々の場合に応じた再評価方法を使えばよい。再判定後の認識結果である出力内容信号222をディスプレイあるいは機器の出力部207へと出力し、また同様に依頼応答部205にその結果を認識結果格納信号243として出力し(S710)、認識処理に戻る(S702)。また、S704で認識依頼および保証依頼が必要がないと判定された場合にはそのままS702の認識結果信号241をそのまま出力内容信号222として出力するように認識結果確定部はそのまま出力部207に出力する。   Based on the reception response content signal 232 and the signal 242 with the recognition result request information to which information indicating which part of the recognition result in the recognition unit 202 sent from the request determination unit 203 is guaranteed or requested to be recognized is reproduced. The evaluation is performed, and the result is transmitted to the output unit 207 as the output content signal 222 (S709). The re-evaluation method may be a re-evaluation method corresponding to each case, depending on whether it is a guarantee or a recognition request. The output content signal 222 that is the recognition result after redetermination is output to the output unit 207 of the display or device, and the result is similarly output to the request response unit 205 as a recognition result storage signal 243 (S710). Return to (S702). Further, to output as a recognition result signal 241 of S702 in the recognition result determination unit is directly output unit 207 to output as the output content signal 222 when it is determined that there is no need to recognize the request and guarantees request in S704 .

図8に認識依頼を受けたPC1側のフローチャートを示す。処理がスタートすると、他の機器から受入依頼メッセージ信号238が入力されるまで待つ(S801)。その後、入力があったかどうかを判断し(S802)、入力があった場合は、受入依頼メッセージ238を受信し(S803)、受入依頼メッセージ238をインターフェース部206で解釈し受入依頼内容信号234が応答依頼部205に入力される(S804)。この受入依頼内容信号234に応じて処理が分岐する(S805)。   FIG. 8 shows a flowchart on the PC 1 side that has received the recognition request. When the process starts, the process waits until an acceptance request message signal 238 is input from another device (S801). Thereafter, it is determined whether there is an input (S802), if there is an input receives the acceptance request message 238 (S803), a receiving request message 238 was interpreted by the interface unit 206 receiving request content signal 234 response request is input to the section 205 (S804). The process branches in accordance with the accepted request content signal 234 (S805).

保証依頼の場合には、受入依頼内容信号234をもとに依頼応答部205で保証の判定を行い、その結果を送信応答内容信号233としてインターフェース部206に出力する(S806)。認識依頼の場合には、受入依頼内容信号234をもとに依頼応答部205で音声認識を行い、その結果を送信応答内容信号233としてインターフェース部206に出力する(S807)。インターフェース部206は前記送信応答内容信号233をもとに送信応答メッセージ信号237を作成する(S808)。インターフェース部206は前記送信応答メッセージ信号237を依頼元に返信する(S809)。   In the case of a guarantee request, the request response unit 205 determines a guarantee based on the acceptance request content signal 234, and outputs the result to the interface unit 206 as a transmission response content signal 233 (S806). In the case of a recognition request, the request response unit 205 performs voice recognition based on the acceptance request content signal 234 and outputs the result to the interface unit 206 as a transmission response content signal 233 (S807). The interface unit 206 creates a transmission response message signal 237 based on the transmission response content signal 233 (S808). The interface unit 206 returns the transmission response message signal 237 to the requester (S809).

図9に各機器間でやり取りするメッセージの構成を示す。メッセージは、大きく分けて以下のような情報から構成することが望ましい。ただし、必要に応じてその一部を使うことも可能であるし、また必要に応じて項目を追加して構わない。
1.通信のための情報:送信か受信かどの機器にメッセージを送るか、どのメッセージへの返信かなどを表す。
2.機能情報:保証依頼、保証依頼返信などのメッセージの機能を表す情報。
3.内容情報:メッセージの機能が保証依頼ならば保証対象である単語情報の時間情報、単語情報、品詞や句などの文法情報、意味情報、尤度などからなり、メッセージの機能が認識依頼ならば音声情報もしくは認識すべき音声区間の時間情報など認識すべき音声区間が特定可能な情報で構成する。
4.結果情報:保証依頼結果、認識依頼結果などの情報。
5.コンテキスト情報:誰の音声かという話者情報(名前、性別、年齢、地域)や発声時の感情などの情報。
6.環境情報:機器の設置場所(台所、駅のホームなど)に関する情報や、周囲のノイズ環境に関する情報など。
7.システム情報:認識方式、語彙数、語彙ファイル、言語モデル、音響モデル、搭載メモリ、搭載チップ、サンプリング周波数、マイク特性など。
FIG. 9 shows the structure of messages exchanged between the devices. It is desirable that the message is roughly composed of the following information. However, some of them can be used as necessary, and items can be added as needed.
1. Information for communication: This indicates whether a message is sent to or received from a device, and to which message a reply is sent.
2. Function information: Information indicating the function of a message such as a warranty request or a warranty request reply.
3. Contents information: Consists of time information, word information, grammatical information such as parts of speech and phrases, meaning information, likelihood, etc. of the word information that is the guarantee target if the message function is a guarantee request, and voice if the message function is a recognition request It consists of information that can identify a speech section to be recognized, such as information or time information of the speech section to be recognized.
4). Result information: Information such as warranty request results and recognition request results.
5). Context information: Information such as speaker information (name, gender, age, region) and emotion when speaking.
6). Environmental information: Information on the installation location of the equipment (kitchen, station platform, etc.) and information on the surrounding noise environment.
7). System information: recognition method, number of vocabulary, vocabulary file, language model, acoustic model, on-board memory, on-chip, sampling frequency, microphone characteristics, etc.

図10は図9に示すメッセージの構成とXMLなどのタグ言語の対応を示す一例であって、図9のメッセージは、図10に示すタグ言語を使って表現すれば扱いやすい。   Figure 10 is an example showing the correspondence between the tag language such as configuration and XML message shown in FIG. 9, message of FIG. 9, manageable when expressed using a tag language shown in FIG. 10.

本実施の形態の具体例として、図11に、電子レンジ2が、2003年2月13日8時23分51秒から2003年2月13日8時23分53秒の間に単語「温め」が入力されたかどうかをPC1に保証依頼するためのメッセージの例を示す。ここで電子レンジ2のIPアドレスを192.168.0.1としたが、PC1のIPアドレスは電子レンジ2側からは分からないので、ここではTo_IPの値はブロードキャスト(broadcast)と設定する。ブロードキャストすることによって、ネットワーク4上のPC1と冷蔵庫3が電子レンジ2からのメッセージを受けることになるが、ブロードキャストを受付けるかどうかを各機器のインターフェース部206で設定しておく等の方法をとることで、PC1のみが依頼を受け付けるようにできる。   As a specific example of the present embodiment, FIG. 11 shows that the microwave oven 2 has the word “warming” between 8:23:51 on February 13, 2003 and 8:23:53 on February 13, 2003. An example of a message for requesting a guarantee from the PC 1 whether or not has been input will be shown. Here, the IP address of the microwave oven 2 is set to 192.168.0.1, but since the IP address of the PC 1 is not known from the microwave oven 2 side, the value of To_IP is set to broadcast here. By broadcasting, but PC1 and refrigerator 3 on the network 4 will receive a message from the microwave oven 2, whether accepting broadcast to employ a method such as is set by the interface unit 206 of each device in, it can be so that only PC1 accepts the request.

また、図12に示すようにIPアドレスと機器の対応表(以下、IPリスト)をインターフェース部206に接続されるIPリストテーブル格納部1201に持つことで、図13のように直接To_IPにPCのIPを192.168.0.2と指定することも可能となる。   Also, as shown in FIG. 12, the IP list table storage unit 1201 connected to the interface unit 206 has a correspondence table of IP addresses and devices (hereinafter referred to as IP list), so that it can be directly connected to To_IP as shown in FIG. It is also possible to specify the IP as 192.168.0.2.

図14にPC1でも「温め」が認識されていたとした場合に電子レンジ2に返信する確認メッセージ(受入応答メッセージ)を示す。この場合<func_ID>が“4”で<comfirm_info>が“1”と設定される。図15はPC1では「温め」が認識されていなかった場合に電子レンジ2に返信する確認メッセージ(受入応答メッセージ)を示す。この場合、<comfirm_info>が“0”となっている。図16は「温め」ではなく「炒め」が認識されていたことを返信する場合のメッセージを示す。この場合、<word rep>が“炒め”となっている。   When the even PC1 "warm" was to have been recognized in FIG. 14 shows a confirmation message back to the microwave oven 2 (accept response message). In this case at <func_id> is "4" <comfirm_info> is set to "1". FIG. 15 shows a confirmation message (acceptance response message) returned to the microwave oven 2 when “warming” is not recognized in the PC 1. In this case, and has a <comfirm_info> is set to "0". Figure 16 shows the message when replying that the "warm" rather than "fried" has been recognized. In this case, <word rep> is “fried”.

図17に認識を依頼するときのメッセージを示す。機能ID(<func_ID>)を“2”とし、さらに認識して欲しい音声データ<wave_data>を送信する。図18に認識依頼を受けたPC1からの返信メッセージの例を示す。この場合、<func_ID>が“7”であり<word_rep>が“温め”となっている。   Shows the message when requesting a recognition Figure 17. Function ID and (<func_ID>) "2", to send more I want voice data to recognize <wave_data>. An example of a reply message from PC1 that received the recognition request 18. In this case, <func_ID> is “7” and <word_rep> is “warmed”.

かかる構成によれば、ネットワーク4上に接続された音声認識装置において、保証依頼や認識依頼をするかどうかを判断する依頼判定部203と、他の音声認識器と通信を行うインターフェース部206と、他の機器の結果を利用し再度認識処理を行う認識結果確定部204とを有すことにより、例え限られたリソースの元で動作する音声認識装置であっても、他の機器に保証や認識の依頼をすることによって得られる保証結果および認識結果に基づいて認識結果を再考することができ、自機器の能力を超えた音声認識の性能を実現できるようになる。   According to such a configuration, in the speech recognition apparatus connected on the network 4, the request determination unit 203 that determines whether to perform a guarantee request or a recognition request, the interface unit 206 that communicates with other speech recognizers, By having the recognition result determination unit 204 that performs recognition processing again using the result of another device, even if the speech recognition device operates under limited resources, the other device is guaranteed and recognized. The recognition result can be reconsidered based on the guarantee result and the recognition result obtained by making the request, and the speech recognition performance exceeding the capability of the device itself can be realized.

すなわち、この構成により、他の機器によって認識結果を再考することができ、音声認識の誤りを訂正することや、単体の機器の音声認識装置では受理できない音声入力に対しても複数の音声認識装置が連携し合い認識を行うことで、その音声入力に対する認識が可能になり、したがって計算リソースの少ない機器であったとしてもリソースを十分備えた機器と同様に認識を行なうことができる。   That is, with this configuration, the recognition result can be reconsidered by other devices, and a plurality of speech recognition devices can be used for correcting speech recognition errors and for speech input that cannot be accepted by a speech recognition device of a single device. there by performing recognition working together, allows recognition of the voice input, thus can be performed similarly recognized sufficiently with equipment even the resource as was less equipment of computational resources.

さらに、本実施の形態によれば、他の機器からの音声認識結果の支援の依頼に対しても自らの認識手段によって他の機器の認識を支援することができる。   Furthermore, according to the present embodiment, it is possible to support the recognition of the other devices by its own recognition means with respect to requests for assistance of the speech recognition result from another device.

なお、他の機器からの依頼に答えるために依頼応答部205は、自機器が他機器からの依頼に応答する場合には必要であるが、自機器が他機器に依頼をするだけの場合は必要ない。
(実施の形態2)
実施の形態1では、PC1,電子レンジ2、冷蔵庫3の全ての構成を同じとした、しかし電子レンジ2や冷蔵庫3で利用可能な計算リソースは非常に限られていることが多い。そこで、電子レンジ2や冷蔵庫3上に搭載する連携型の音声認識部101は、他の機器からの要求にこたえる機能を省略することも可能である。そこで、電子レンジや冷蔵庫などのように、計算リソースの限られた機器上の音声認識は図19に示すように図2における依頼応答部205を省略することができる。一方、PC1や音声認識サーバーのような計算リソースに余裕のある機器上には、図2の構成をとればよい。なお、動作は図2に説明したものと同様であるので省略する。
In order to answer a request from another device, the request response unit 205 is necessary when the own device responds to a request from another device, but when the own device only requests a request from another device. unnecessary.
(Embodiment 2)
In the first embodiment, all the configurations of the PC 1, the microwave oven 2, and the refrigerator 3 are the same, but the calculation resources that can be used in the microwave oven 2 and the refrigerator 3 are often very limited. Therefore, the cooperative speech recognition unit 101 mounted on the microwave oven 2 or the refrigerator 3 can omit a function that responds to a request from another device. Therefore, as shown in FIG. 19, the request response unit 205 in FIG. 2 can be omitted for voice recognition on a device with limited calculation resources such as a microwave oven and a refrigerator. On the other hand, what is necessary is just to take the structure of FIG. 2 on apparatuses with sufficient calculation resources, such as PC1 and a speech recognition server. The operation is the same as that described in FIG.

このように機器連携型の音声認識部101を構成することで、各々の機器の性能に応じた認識器を搭載でき、また電子レンジ2のような十分な計算リソースを持たない機器においても、ネットワーク上のより強力なPC1やサーバーなどを利用することで、自機器の能力を超えた音声認識の性能を実現できるようになる。   By configuring the device cooperation type speech recognition unit 101 in this way, it is possible to mount a recognizer according to the performance of each device, and even in a device such as the microwave oven 2 that does not have sufficient calculation resources, by using such powerful PC1 and server than Ueno, it will be able to achieve the performance of speech recognition beyond the ability of the device itself.

すなわち、実施の形態1と同様に、この構成により、他の機器によって認識結果を再考することができ、音声認識の誤りを訂正することや、単体の機器の音声認識装置では受理できない音声入力に対しても複数の音声認識装置が連携し合い認識を行うことで、その音声入力に対する認識が可能になり、したがって計算リソースの少ない機器であったとしてもリソースを十分備えた機器と同様に認識を行なうことができる。   That is, as in the first embodiment, with this configuration, the recognition result can be reconsidered by other devices, and errors in speech recognition can be corrected, or voice input that cannot be accepted by the speech recognition device of a single device. On the other hand, multiple voice recognition devices work together to recognize each other, so that the voice input can be recognized. Therefore, even if it is a device with few calculation resources, it can be recognized in the same way as a device with sufficient resources. Can be done.

(実施の形態3)
図20は本発明の実施の形態3の連携型の音声認識101の構成図である。図2と同一構成については同一番号を付し、説明を省略する。インターフェース部206に接続された音声認識機器プロファイル格納部2001(以下SRSP:Speech Recognition System Profile)はネットワーク4に接続されている機器の情報や状態をプロファイル情報として格納する。辞書ファイル格納部2002にはテレビ用、チケット検索用、メール書き用など様々なドメインに対応した辞書ファイルが格納されている。言語モデル格納部2003にはテレビ用、チケット検索用、メール書き用など様々なドメインに対応した言語モデルが格納されている。音響モデル格納部2004には、話し言葉用、読み上げ音声用など様々な話し方や様々な環境下な対応可能な音響モデルが格納されている。これら辞書ファイル、言語モデル、音響モデルはあらかじめ用意しておいてもよいし、必要に応じてサーバーからダウンロードする形態をとることも可能である。認識結果蓄積部2005には認識結果が格納される。
(Embodiment 3)
FIG. 20 is a configuration diagram of cooperative voice recognition 101 according to the third embodiment of the present invention. The same components as those in FIG. 2 are denoted by the same reference numerals, and description thereof is omitted. A voice recognition device profile storage unit 2001 (hereinafter referred to as SRSP: Speech Recognition System Profile) connected to the interface unit 206 stores information and status of devices connected to the network 4 as profile information. The dictionary file storage unit 2002 stores dictionary files corresponding to various domains such as for TV, ticket search, and mail writing. The language model storage unit 2003 stores language models corresponding to various domains such as for TV, ticket search, and mail writing. The acoustic model storage unit 2004 stores acoustic models that can be used in various ways of speaking and various environments such as for spoken words and reading speech. These dictionary file, language model, and acoustic model may be prepared in advance, or may be downloaded from the server as necessary. The recognition result storage unit 2005 stores the recognition result.

図21、図22は音声認識機器プロファイル格納部2001を説明するための図で、図21に示すように、音声認識機器プロファイル格納部2001には、携帯電話、電子レンジ、パソコン、およびロボットの各プロファイル情報、並びにデフォルトのプロファイル情報を登録しておくことができる。各プロファイル情報には、図22に示すように機器固有のプロファイルのID、機器の状態としてON/OFF情報、機器の情報として、メーカー名、型番、プロセッサーの性能、マイク特性、IPアドレス、各々の機器にとって重要なキーワードや、その他各機器に搭載されている音声認識システムの特徴も格納しておくことができる。ここでいうキーワードとは、炊飯器における「炊飯」などのキーワードである。   21 and 22 are diagrams for explaining the voice recognition device profile storage unit 2001. As shown in FIG. 21, each of the voice recognition device profile storage unit 2001 includes a mobile phone, a microwave oven, a personal computer, and a robot. Profile information and default profile information can be registered. As shown in FIG. 22, each profile information includes a device-specific profile ID, device status ON / OFF information, device information, such as manufacturer name, model number, processor performance, microphone characteristics, IP address, Keywords that are important to the device and other features of the speech recognition system installed in each device can also be stored. The keyword here is a keyword such as "rice" in the rice cooker.

以上のように構成した実施の形態3の動作を図23、図24に示すフローチャートを用いて説明する。電子レンジ2がPC1に認識結果の保証または認識依頼を行うとして説明する。   The operation of the third embodiment configured as described above will be described with reference to the flowcharts shown in FIGS. Microwave 2 will be described as performing a recognition result of the guarantee or recognition request to PC1.

図23が保証/認識を依頼する側である電子レンジ2のフローチャートである。処理がスタートすると(S2301)、入力部201で入力された音声に対して認識部202で音声を検出し、音声に対して音声認識を行う(S2302)。音声認識の結果を表す認識結果信号241に対して依頼判定部203で他の機器への保証の必要があるかどうかを判定する(S2303)。判定は、例えば入力音声が長い場合、言語の尤度が低い場合などの判断基準を用いて入力された音声の全体について正しいかどうかを依頼したい場合には認識依頼を、入力音声のうちの一部分だけの保証を求めたいときには保証依頼を依頼するように判断すればいい。   It is a flow chart of a microwave oven 2 Figure 23 is a side to request the warranty / recognition. When the process is started (S2301), and detects the voice recognition unit 202 to the audio input by the input unit 201, performs speech recognition on the speech (S2302). In response to the recognition result signal 241 representing the result of speech recognition, the request determination unit 203 determines whether it is necessary to guarantee another device (S2303). For example, if the input speech is long, or the likelihood of the language is low, and if it is desired to request whether the entire speech input using the determination criteria is correct, a recognition request is issued, and a part of the input speech is determined. I if it is determined to request the guarantee request when you want to find the only guarantee.

より具体的には、例えば、入力音声がx秒以上の場合に入力音声が文であると考えて認識依頼を行い、x秒未満の時は単語であると考え保証依頼をする。またx秒以上であっても、ある特定の候補の区間のみ言語尤度がある決められた閾値よりも低い、もしくは第二候補との尤度差が小さい、音響尤度が低いなどの基準を用いることでその区間で認識されている単語候補の保証を依頼することができる。   More specifically, for example, the input speech is performed recognition request consider the input speech in the case of more than x seconds is a sentence, when less than x seconds to guarantee request considered a word. Further, even if it is x seconds or more, criteria such as a language likelihood lower than a predetermined threshold value only in a certain candidate section, a likelihood difference with a second candidate is small, or a sound likelihood is low. By using it, the guarantee of the word candidate recognized in the area can be requested.

前記判定結果に応じて処理を分岐させる(S2304)。保証もしくは認識依頼の必要があると判断した場合は、インターフェース部206において送信依頼内容信号231をもとに他の機器へ依頼する送信依頼メッセージ信号235を作成する(S2305)。   The process is branched according to the determination result (S2304). If it is determined that a guarantee or recognition request is necessary, the interface unit 206 creates a transmission request message signal 235 for requesting another device based on the transmission request content signal 231 (S2305).

このとき、音声認識機器プロファイル2001を参照し、性能の高い機器あるいは、自機器(電子レンジ)と発声される単語が似ている機器、あるいは場所的に近くにある機器に対してのみメッセージを送るようにメッセージを作成することが望ましい。性能の高い機器であることの判断は、プロファイル内のプロセッサー情報や音声認識の性能を見ることで判断できる。   At this time, referring to the voice recognition device profile 2001, a message is sent only to a high-performance device, a device similar to the utterance word of the device (microwave oven), or a device close to the place. It is desirable to create a message as follows. It can be determined that the device is a high-performance device by looking at the processor information in the profile and the speech recognition performance.

より具体的には、自機器プロセッサーの性能が良いもの(MHzで高いもの)であるとか自機器が単語認識であるなら文章入力を受け付ける連続音声認識に対してメッセージを送るといった指標を利用すればいい。   More specifically, if the performance of the processor of its own device is good (high in MHz) or if the device itself is word recognition, an indicator such as sending a message for continuous speech recognition that accepts text input can be used. Good.

また場所的に近いと言う指標として、マイク位置が近くにあるもののみに送るとして場所情報が同じ機器にのみ送るとか、発声される単語が似ている機器として、辞書ファイルを比較し包含関係から近さを図ることもできる。また言語モデル間の近さを相互情報量などの指標を用いて利用することも可能である。   In addition, as an indicator that it is close to the location, it is possible to send only to the device where the microphone position is close, only send the location information to the same device, or as a device with similar words spoken, compare dictionary files from the inclusion relationship It can also be close. It is also possible to use the proximity between language models using an index such as mutual information.

前記メッセージをネットワークを通じて送信する(S2306)。   Transmitting the message through the network (S2306).

次に、他の機器から送られてくる保証依頼結果もしくは認識依頼結果を表す受入応答メッセージ信号236を受け取り(S2307)、そのメッセージを解釈し受入応答内容信号232として認識結果確定部204に送信する(S2308)。前記受入応答内容信号232と依頼判定部203から送られる認識部202における認識結果の、どの部分を保証依頼もしくは認識依頼したかという情報を付与した認識結果依頼情報付き信号242をもとに音声認識の再評価を行い、その結果を出力内容信号222として出力部207に送信する(S2309)。前記再判定後の認識結果である出力内容信号222をディスプレイあるいは機器の出力部207へと出力し、また同様に依頼応答部2006にその結果を認識結果格納信号243として出力する(S2310)。その後、音声認識処理に戻る(S2302)。   Then, receiving the acceptance response message signal 236 representative of the incoming guarantee request results or recognition request result is sent from another device (S2307), and transmits the recognition result decision unit 204 as receiving the response content signal 232 interprets the message (S2308). Speech recognition based on the reception response content signal 232 and a signal 242 with recognition result request information to which information indicating which part of the recognition result in the recognition unit 202 sent from the request determination unit 203 is a guarantee request or a recognition request is given. Is re-evaluated, and the result is transmitted as an output content signal 222 to the output unit 207 (S2309). The output content signal 222, which is the recognition result after the re-determination, is output to the output unit 207 of the display or device, and similarly, the result is output to the request response unit 2006 as a recognition result storage signal 243 (S2310). Then, returning to the speech recognition processing (S2302).

また、S2304で保証依頼も認識依頼も必要ないと判断された場合は、S2302の認識結果信号241をそのまま出力内容信号222として認識結果確定部204から出力部207に出力する(S2310)。   Also, if it is determined that there is no need nor recognize the warranty request in S2304, to the output unit 207 from the recognition result decision unit 204 directly as the output content signal 222 a recognition result signal 241 of S2302 (S2310).

図24に認識依頼を受けたPC1側のフローチャートを示す。処理がスタートすると(S2401)、他の機器から受入依頼メッセージ信号238が入力されるまで待つ(S2402)。入力があった場合は、前記受入依頼メッセージ238を受信し(S2403)、前記受入依頼メッセージ238をインターフェース部206で解釈し受入依頼内容信号234が応答依頼部205に入力される(S2404)。S2405で前記受入依頼内容信号234に応じて処理が分岐する。保証依頼の場合には、受入依頼内容信号234をもとに依頼応答部2006で保証の判定を行い、その結果を送信応答内容信号233としてインターフェース部206に出力する(S2406)。保証判定は認識結果蓄積部2005に格納された認識履歴を使うことが可能である。   Indicating the PC1 side flow chart of which receives the recognition request to FIG. When the process starts (S2401), the process waits until an acceptance request message signal 238 is input from another device (S2402). If there is input receives the acceptance request message 238 (S2403), the acceptance request message 238 was interpreted by the interface unit 206 receiving request content signal 234 is input to the response requesting unit 205 (S2404). In S2405, the process branches according to the acceptance request content signal 234. In the case of a guarantee request, the request response unit 2006 determines the guarantee based on the acceptance request content signal 234, and the result is output to the interface unit 206 as a transmission response content signal 233 (S2406). The recognition determination can use the recognition history stored in the recognition result storage unit 2005.

また、受入依頼メッセージに音声が含まれている場合には、依頼メッセージに含まれる依頼元のシステム情報をもとに必要に応じて対応する辞書ファイル、言語モデルや音響モデルを辞書ファイル格納部2002、言語モデル格納部2003、音響モデル格納部2004から選択し、それらモデルをもとに前記音声を認識し、その結果を用いて保証の判定をすることも可能である。   If the reception request message includes a voice, the dictionary file storage unit 2002 stores the corresponding dictionary file, language model, and acoustic model as needed based on the system information of the request source included in the request message. It is also possible to select from the language model storage unit 2003 and the acoustic model storage unit 2004, recognize the speech based on these models, and determine the guarantee using the result.

一方、メッセージが認識依頼である場合には認識方法を設定し、前記受入依頼内容信号234をもとに依頼応答部2006で音声認識を行い、その結果を送信応答内容信号233としてインターフェース部206に出力する(S2407)。このとき、音声認識は入力された機器のプロファイルにあわせて行うほうが良い。そこで音声認識に用いる言語モデルや音響モデル、辞書ファイルを辞書ファイル格納部2002、言語モデル格納部2003、音響モデル格納部2004から選択し、それらモデルをもとに音声の認識を行う。認識対象の音声は、依頼メッセージと共に対象となる音声が電子レンジ2に送られてきた場合にはそれを対象に行う。インターフェース部206は前記送信応答内容信号233をもとに送信応答メッセージ信号を作成する(S2409)。インターフェース部206は前記送信応答メッセージ信号を依頼もとに返信する(S2410)。   On the other hand, if the message is a recognition request, a recognition method is set, the request response unit 2006 performs voice recognition based on the acceptance request content signal 234, and the result is sent to the interface unit 206 as a transmission response content signal 233. It outputs (S2407). At this time, it is better to perform voice recognition according to the profile of the input device. Therefore, language models, acoustic models, and dictionary files used for speech recognition are selected from the dictionary file storage unit 2002, language model storage unit 2003, and acoustic model storage unit 2004, and speech recognition is performed based on these models. Speech to be recognized is carried out subject to it when the voice of interest with request message is transmitted to the microwave oven 2. The interface unit 206 creates a transmission response message signal based on the transmission response content signal 233 (S2409). Interface unit 206 replies to the request based on the transmission response message signal (S2410).

かかる構成によれば、ネットワーク上に接続された音声認識において、保証依頼や認識依頼をするかどうかを判断する依頼判定部203と他の音声認識器と通信を行うインターフェース部206と他の機器の結果を利用し再度認識処理を行う認識結果確定部204と他の機器からの依頼に答えるために依頼応答部2006と機器のプロファイル情報を格納する音声認識機器プロファイル格納部2001を有すことにより、最適な音声認識のセッティングのもとでより計算リソースの高いPCなどの機器を用いて認識が可能となり、例え十分な性能を持たない機器であっても、自機器の能力を超えた音声認識の性能を実現できるようになる。性能の高い機器であっても、同等の性能の異なる特徴をもつ認識器により保証、認識依頼を行うことで自機器の能力を超えた音声認識の性能を実現できるようになる。   According to such a configuration, in the voice recognition connected on the network, the request determination unit 203 that determines whether to make a guarantee request or a recognition request, the interface unit 206 that communicates with another voice recognizer, and other devices. By including a recognition result determination unit 204 that performs recognition processing again using the result, a request response unit 2006 to answer requests from other devices, and a voice recognition device profile storage unit 2001 that stores device profile information. It is possible to recognize using a device such as a PC with higher computational resources under the optimal speech recognition settings. Even if the device does not have sufficient performance, it can perform speech recognition that exceeds the capabilities of the device itself. Performance can be realized. Even a high-performance device can achieve speech recognition performance that exceeds the capabilities of its own device by guaranteeing and requesting recognition using a recognizer having the same characteristics and different characteristics.

(実施の形態4)
図25に本発明の実施の形態4の構成図を示す。音声情報蓄積部2501は自機器の入力部201に入力された音声を蓄積する。他の構成は実施の形態3と同じであるので説明は省略する。このように、音声を常に蓄積しておく音声情報蓄積部2501を設けることで、受入依頼メッセージ信号238によって認識依頼を受けた際に、その蓄積された音声を用いて認識を行うことが出来るようになる。
(Embodiment 4)
FIG. 25 shows a configuration diagram of the fourth embodiment of the present invention. The voice information storage unit 2501 stores the voice input to the input unit 201 of the own device. Since other configurations are the same as those of the third embodiment, description thereof is omitted. In this manner, by providing the voice information storage unit 2501 that always stores voice, when a recognition request is received by the acceptance request message signal 238, the voice can be recognized using the stored voice. become.

これにより、自機器に近い機器には同じ音声が蓄積されるので、依頼メッセージとともに音声を送る必要がなくなり、また依頼元の機器のプロファイル情報に応じて音声の認識を行うことが出来るようになり、ネットワーク上の負荷を減らす事が出来るようになり、また依頼を受けた側の収音性能が高い場合には、より確実に音声の認識が出来るようになる。その結果、依頼元の認識器側では、より確実に保証や認識を依頼できるようになり自機器の能力を超えた音声認識の性能を実現できるようになる。さらに、ネットワーク上の負荷を減らすことが出来るようなるという効果も得られる。   As a result, the same sound is stored in the device close to the device itself, so there is no need to send the sound together with the request message, and the sound can be recognized according to the profile information of the requesting device. The load on the network can be reduced, and the voice can be recognized more reliably when the requesting side has high sound collection performance. As a result, the requesting recognizer can request for guarantee and recognition more reliably, and can realize speech recognition performance exceeding the capability of the device itself. Furthermore, there is also an effect that it becomes to be able to reduce the load on the network.

すなわち、この構成により、依頼を受けた側の収音性能が高い場合には、依頼元に比べて確実に音声の認識が可能であるので、依頼を受けた側の音声認識装置の音声情報蓄積手段に蓄積された音声情報に基づいて認識することにより、音声入力の音声認識の誤りを訂正することや、単体の音声認識では受理できない音声入力に対しても複数の音声認識装置が連携し合って認識することが可能になる。   In other words, with this configuration, when the sound collection performance of the requesting side is high, the voice can be recognized more reliably than the requesting source. By recognizing based on the voice information stored in the means, the voice recognition error of the voice input can be corrected, and multiple voice recognition devices can cooperate with each other even for voice input that cannot be accepted by a single voice recognition. Can be recognized.

(実施の形態5)
図26に本発明の実施の形態5の構成図を示す。音声情報蓄積部2501は自機器の入力部201およびネットワーク4を介して音声情報を蓄積する。他の構成は実施の形態3と同じであるので説明は省略する。このように、ネットワーク4につながれた機器に入力された音声を常に蓄積しておくように音声情報蓄積部2501を構成することで、受入依頼メッセージ信号238によって認識依頼を受けた際に、確実に一番近くで収集された音声を用いて認識を行うことが出来るようになる。
(Embodiment 5)
FIG. 26 shows a configuration diagram of the fifth embodiment of the present invention. The voice information storage unit 2501 stores voice information via the input unit 201 of the own device and the network 4. Since other configurations are the same as those of the third embodiment, description thereof is omitted. In this way, by configuring the audio information storage unit 2501 so as to always store the audio input to the device connected to the network 4, when receiving a recognition request by the acceptance request message signal 238, it is ensured. Recognition can be performed using the voice collected in the nearest place.

これにより、確実に最適な音声に対して、最適な音声認識のセッティングのもとで、より計算リソースの高いPCなどの機器を用いて認識が可能となる。したがって、依頼もとの認識器側では、より確実に保証や認識を依頼できるようになり自機器の能力を超えた音声認識の性能を実現できるようになる。   As a result, it is possible to reliably recognize the optimum voice using a device such as a PC having higher computational resources under the optimum voice recognition setting. Accordingly, the request original recognizer side, it becomes possible to realize the performance of speech recognition beyond the capability of the own device to be able to request more reliably ensured and recognition.

(実施の形態6)
図27に本発明の実施の形態6の構成図を示す。本実施の形態では、図2に示す実施の形態1に、音声認識機器プロファイル格納部2001と音声情報蓄積部2501と、さらに通知判定部3001を有している。
(Embodiment 6)
FIG. 27 shows a configuration diagram of the sixth embodiment of the present invention. In the present embodiment, a voice recognition device profile storage unit 2001, a voice information storage unit 2501, and a notification determination unit 3001 are provided in the first embodiment shown in FIG.

通知判定部3001は、認識結果を表す認識結果格納信号243と音声認識機器プロファイル信号2011に含まれる各機器のキーワード情報を元に、どの機械に通知を行うかを判定する。また、本実施の形態の通知機能付きインターフェース部3002は実施の形態1のインターフェース部206の機能に加えて、通知判定部3001の出力である通知メッセージ信号3012を出力する。   The notification determination unit 3001 determines which machine is notified based on the recognition result storage signal 243 representing the recognition result and the keyword information of each device included in the voice recognition device profile signal 2011. Further, in addition to the function of the interface unit 206 of the first embodiment, the interface unit 3002 with a notification function of this embodiment outputs a notification message signal 3012 that is an output of the notification determination unit 3001.

通知メッセージは、例えば図28のように構成できる。この通知メッセージは、IPアドレス192.168.0.1の機械からIPアドレス192.168.0.2の機械に対して、“時刻2003年2月13日8時23分51秒から時刻2003年2月13日8時23分53秒までの間に、「温め」という単語が入力された“ということを通知するメッセージを意味する。   The notification message can be configured as shown in FIG. 28, for example. This notification message is sent from the machine with the IP address 192.168.0.1 to the machine with the IP address 192.168.0.2 from “Time 2003 February 13, 8:23:51 to Time 2003. It means a message notifying that “the word“ warming ”has been input” between 8:23:53 on February 13.

図29に本実施の形態の通知機能を実現する動作のフローチャートを示す。S2301からS2310までは図23の説明と同じであるので省略する。S2310に続き、通知判定部3001は認識結果格納信号243と音声認識機器プロファイル信号2011に含まれる各機器のキーワード情報を元に、どの機械に通知を行うかを判定し、ネットワーク4を通じて該当機器に送信する(S3101)。判定方法は、認識結果の単語がキーワードに含まれているかどうかで判定する。   FIG. 29 shows a flowchart of an operation for realizing the notification function of the present embodiment. From S2301 to S2310 will be omitted because it is same as the description of Figure 23. Subsequent to S2310, the notification determination unit 3001 determines which machine is notified based on the keyword information of each device included in the recognition result storage signal 243 and the voice recognition device profile signal 2011, and notifies the corresponding device via the network 4. Transmit (S3101). Determination method determines word recognition result based on whether it contains the keyword.

かかる構成によれば、音声認識機器プロファイル格納部2001に格納されたキーワード情報に合わせ、他の機器がその重要なキーワードを認識した場合、その旨を該当機器に通知することができるようになる。これにより、たとえこのキーワードに該当する機器でキーワードの認識を失敗しても、他の機器にそれを通知してもらうことで、キーワードの入力があったことを逃さないようにすることができ、自機器の認識機の能力を超えた認識を実現できる。   According to such a configuration, when another device recognizes the important keyword in accordance with the keyword information stored in the voice recognition device profile storage unit 2001, it is possible to notify the corresponding device to that effect. As a result, even if the device that corresponds to this keyword fails to recognize the keyword, you can prevent other devices from notifying you that the keyword has been entered, It can be realized recognized beyond the ability of the recognizer apparatus own.

例えば、「録画」という単語はビデオなどの機器にとって重要なキーワードとなる。そこで、例えばビデオ以外のある機器が「録画」という単語を認識した場合は、その情報をビデオに送ることが出来る。このような連携動作により、ビデオに付属の認識が失敗していた場合でも逃さず認識が可能となる。   For example, the word “recording” is an important keyword for a device such as a video. Therefore, for example, when a device other than the video recognizes the word “recording”, the information can be sent to the video. Such work together, it is possible to recognize not miss even if the recognition that comes with the video has failed.

(実施の形態7)
図30は本発明の実施の形態7の連携型の音声認識部101の構成図である。本実施の形態では、図2に示す実施の形態に、音声認識機器プロファイル格納部2001と信頼度情報格納部2701を有している。信頼度情報格納部2701にはネットワーク4に接続されている機器から受ける受入応答メッセージ信号236に対する信頼度情報が格納される。
(Embodiment 7)
FIG. 30 is a configuration diagram of the cooperative speech recognition unit 101 according to the seventh embodiment of the present invention. In the present embodiment, a speech recognition device profile storage unit 2001 and a reliability information storage unit 2701 are provided in the embodiment shown in FIG. The reliability information storage unit 2701 stores reliability information for an acceptance response message signal 236 received from a device connected to the network 4.

図31に示すように、信頼度情報は送信元の機器情報が分かるようにIPアドレス等とともに予め格納される。以上のように構成した実施の形態7によれば、各機器からのメッセージに対して信頼度を考慮することで、より正確に認識を行うことが出来るようになる。その動作を図32のフローチャートをもとに説明する。   As shown in FIG. 31, the reliability information is stored in advance together with the IP address or the like so that the transmission source device information can be understood. According to the seventh embodiment constructed as described above, by considering the reliability for messages from each device, so that more accurate recognition can be performed. To explain the operation in the flowchart of FIG. 32.

図32は保証/認識を依頼する側である電子レンジ2のフローチャートである。処理がスタートすると(S2901)、音声を検出し音声認識を行う(S2902)。前記音声認識の結果を表す認識結果信号241に対して依頼判定部203で他の機器への保証や認識依頼の必要があるかどうかを判定する(S2903)。   Figure 32 is a flow chart of a microwave oven 2 is the side of requesting warranty / recognition. When the process starts (S2901), voice is detected and voice recognition is performed (S2902). Determining whether or not there is a need for assurance and recognition request in the request determination unit 203 with respect to the recognition result signal 241 representing the result of the speech recognition to other devices (S2903).

判定は、例えば入力音声が長い場合、言語の尤度が低い場合などの判断基準を用いて入力された音声の全体について正しいかどうかを依頼したい場合には認識依頼を、入力音声のうちの一部分だけの保証を求めたいときには保証依頼を依頼するように判断すればいい。より具体的には、例えば、入力音声がx秒以上の場合に入力音声が文であると考えて認識依頼を行い、x秒未満の時は単語であると考え保証依頼をする。またx秒以上であっても、ある特定の候補の区間のみ言語尤度が、特定の閾値よりも低い、もしくは第二候補との尤度差が小さい、音響尤度が低いなどの基準を用いることでその区間で認識されている単語候補の保証を依頼することができる。   For example, if the input speech is long, or the likelihood of the language is low, and if it is desired to request whether the entire speech input using the determination criteria is correct, a recognition request is issued, and a part of the input speech is determined. I if it is determined to request the guarantee request when you want to find the only guarantee. More specifically, for example, the input speech is performed recognition request consider the input speech in the case of more than x seconds is a sentence, when less than x seconds to guarantee request considered a word. In addition, even if it is x seconds or more, a criterion is used such that the language likelihood is lower than a specific threshold only in a specific candidate section, the likelihood difference with the second candidate is small, or the acoustic likelihood is low. Thus, it is possible to request the guarantee of the word candidates recognized in the section.

前記判定結果に応じて処理を分岐させる(S2904)。保証もしくは認識依頼の必要があると判断した場合は、インターフェース部206において送信依頼内容信号231をもとに他の機器へ依頼する送信依頼メッセージ信号235を作成する(S2905)。このとき、音声認識機器プロファイル2001を参照し、性能の高い機器あるいは、自機器(電子レンジ)と発声される単語が似ている機器、あるいは場所的に近くにある機器に対してのみメッセージを送るようにメッセージを作成することが望ましい。また、信頼度情報格納部2701からの信頼度情報信号2711を元に依頼先を決めることができる。   Processing is branched according to the determination result (S2904). If it is determined that a guarantee or recognition request is necessary, the interface unit 206 creates a transmission request message signal 235 for requesting another device based on the transmission request content signal 231 (S2905). At this time, referring to the voice recognition device profile 2001, a message is sent only to a high-performance device, a device similar to the utterance word of the device (microwave oven), or a device close to the place. It is desirable to create a message as follows. It is also possible to determine the request destination based on the reliability information signal 2711 from the reliability information storage unit 2701.

前記メッセージをネットワーク4を通じて送信する(S2906)。他の機器から送られてくる保証依頼もしくは認識結果を表す受入応答メッセージ信号を受け取り(S2907)、そのメッセージを解釈する(S2908)。信頼度情報信号2711を元に、受入応答内容信号232に信頼度を付与する(S2909)。他の機器からの保証結果あるいは認識結果を考慮し認識結果を再判定する(S2910)。このとき複数の認識器から結果が得られている場合は信頼度をもとに優先度を決め上位N個もしくは信頼度X以上の機器の結果を利用する。前記再判定後の認識結果である出力内容信号222をディスプレイあるいは機器の出力部7へと出力し、また同様に依頼応答部205にその結果を認識結果格納信号243として出力する(S2911)。そして、S2902の認識処理に戻る。また、S2904で保証あるいは認識依頼の必要がないと判定された場合には、S2902の認識結果信号241をそのまま出力部207に出力する(S2911)。   Transmitting the message through the network 4 (S2906). Receiving an acceptance response message signal representative of a coming guarantee request or the recognition result sent from another device (S2907), interpret the message (S2908). Based on the reliability information signal 2711, reliability is given to the acceptance response content signal 232 (S2909). The recognition result is re-determined in consideration of the guarantee result or recognition result from another device (S2910). In this case, if the result of a plurality of recognizers is obtained using the results of the top N or reliability X or more devices determines the priority based on the reliability. The output content signal 222 that is the recognition result after the re-determination is output to the output unit 7 of the display or device, and the result is similarly output to the request response unit 205 as a recognition result storage signal 243 (S2911). Then, back to the recognition process of S2902. Further, when it is determined that there is no need for assurance or recognition request in S2904 outputs a recognition result signal 241 of S2902 directly to the output unit 207 (S2911).

一方、依頼を受けたPC側の動作に関しては、図24で示した実施の形態3の動作と同じであるので省略する。   On the other hand, the operation on the PC side that has received the request is the same as the operation of the third embodiment shown in FIG.

かかる構成によれば、他の機器からのメッセージに対して信頼度情報をもとに重み付けをすることで、信頼度の高い機器からの保証や認識結果を利用でき、より確実に正しい認識結果を得ることが出来るようになる。   According to such a configuration, by weighting on the basis of reliability information to the message from another device, available guarantees and recognition results from reliable equipment, the more reliably correct recognition result You can get it.

(実施の形態8)
図33は本発明の実施の形態8の機器連携型の音声認識の構成図である。本実施の形態では、図2に示す実施の形態1に、音声認識機器プロファイル格納部2001と機器状態検出部3301がインターフェース部206に接続されている。機器状態検出部3301は、自機器がネットワーク4に接続されたかどうか、あるいは電源が入っているかどうかといった状態を検出する機能を有し、自機器がネットワークに接続された場合にPlug&Playで機器が使えるように自機器の設定を行う機能を有する。また電源が入ったとき、あるいは切れたときに自機器の設定を自動的に行う、さらにはネットワークの他の機器に電源が入っていないことを知らせることができる機能を有する。
(Embodiment 8)
FIG. 33 is a configuration diagram of device-linked speech recognition according to the eighth embodiment of the present invention. In the present embodiment, a voice recognition device profile storage unit 2001 and a device state detection unit 3301 are connected to the interface unit 206 in the first embodiment shown in FIG. The device state detection unit 3301 has a function of detecting a state such as whether the own device is connected to the network 4 or whether the power is turned on. When the own device is connected to the network, the device can be used with Plug & Play. As described above, it has a function of setting its own device. It also has a function of automatically setting its own device when the power is turned on or off, and informing other devices on the network that the power is not turned on.

以上のように構成した実施の形態8の動作を図34、図35を用いて説明する。図34は本実施の形態8に係る連携型の音声認識部101を備えた機器を用いたシステム構成図である。図1に加え、音声認識サーバー5が接続されており、このネットワーク4に洗濯機6がPlug&Playで接続されるとする。音声認識サーバー5は、SRSPを管理するサーバーとして機能するとする。   The operation of the eighth embodiment configured as described above will be described with reference to FIGS. FIG. 34 is a system configuration diagram using a device including the cooperative speech recognition unit 101 according to the eighth embodiment. In addition to Figure 1, it is connected to the voice recognition server 5, and a washing machine 6 are connected by Plug & Play this network 4. It is assumed that the voice recognition server 5 functions as a server that manages SRSP.

図35(a)〜(c)に示すフローチャートでその動作を説明する。   The operation will be described with reference to the flowcharts shown in FIGS.

図35(a)において、処理がスタートすると(S3501)、新たに追加される機器(洗濯機6)がネットワーク4に接続されたかどうかをチェックする(S3502)。S3503で分岐をし、接続された場合はS3504に、接続されていない場合はS3502に戻る。洗濯機6が接続された場合、洗濯機6は音声認識サーバー5を検索する(S3504)。サーバーが見つからなかった場合、SRSPをネットワーク4上にブロードキャストし(S3509)。一方サーバーが見つかった場合、サーバーにSRSPをアップロードする(S3506)。   In FIG. 35A, when the process starts (S3501), it is checked whether a newly added device (washing machine 6) is connected to the network 4 (S3502). The process branches at S3503, and if connected, returns to S3504, and if not connected, returns to S3502. When the washing machine 6 is connected, the washing machine 6 searches the voice recognition server 5 (S3504). If the server is not found, the SRSP is broadcast on the network 4 (S3509). On the other hand, if the server is found, the SRSP is uploaded to the server (S3506).

図35(b)において、音声認識サーバー5はアップロード情報を検出すると(S3514)、受け取ったSRSPを元にSRSPを更新し(S3510)、その結果をブロードキャストする(S3511)。   In FIG. 35B, when the speech recognition server 5 detects the upload information (S3514), the SRSP is updated based on the received SRSP (S3510), and the result is broadcast (S3511).

そして、図35(c)において、そのブロードキャストされた更新情報を各機器が検出すると(S3515)、各機器は更新情報を受け取り(S3512)、SRSPを更新する(S3513)。   In FIG. 35C, when each device detects the broadcast update information (S3515), each device receives the update information (S3512) and updates the SRSP (S3513).

このように動作することで、新たな機器が付け加わったとしても、その情報が各機器にまで行き渡り実施の形態1~5に示した動作を実現することが出来るようなる。また、ス
テップ3511でサーバー5は更新したSRSPをブロードキャストしたが、SRPSに登録されている機器に直接情報をアップロードすることも可能である。
By operating in this way, even when a new device is added, the information is distributed to each device and the operations described in the first to fifth embodiments can be realized. In step 3511, the server 5 broadcasts the updated SRSP, but it is also possible to upload information directly to a device registered in the SRPS.

次に電源を消したときの動作を説明する。電源を消すときには音声認識サーバー5にこれから電源がきれるという情報を送る。その情報をサーバー5がブロードキャストあるいはSRSPに登録された機器に直接おくることで、各機器におかれているSRSP内の当該機器の電源状態の状態をOFFに更新することが出来る。また逆に、電源をいれる際には、図35に示した機器のPlug&Playの設定と同じ操作を行うことで電源がONになったなどの情報を自動的に更新設定することが出来る。   Next will be described the operation when turned off the power. When the power is turned off, information indicating that the power can be turned off is sent to the voice recognition server 5. By sending the information directly to the device registered by the server 5 in the broadcast or SRSP, the power state of the device in the SRSP in each device can be updated to OFF. On the contrary, when the power is turned on, information such as the power being turned on can be automatically updated and set by performing the same operation as the plug & play setting of the device shown in FIG.

一方、サーバーの電源を切る場合には、ネットワークに置かれる機器に電源が切れる旨の情報をブロードキャスト、あるいはSRSPに登録された機器に送ることで、サーバー5のON/OFF情報を各機器が分かるようにSRSPの更新を行うことが出来るようになる。また、サーバー5の電源が切れる前に、第2のサーバーを指定することも出来る。このときサーバーは第2のサーバーにサーバー依頼信号を送ることで実現できる。この依頼を受けた第2のサーバーは自機器がサーバーになったことをブロードキャストあるいはSRSPに登録されている機器に送ることで全ての機器の情報を更新できる。   On the other hand, when the server is turned off, each device can know the ON / OFF information of the server 5 by broadcasting the information indicating that the power is turned off to the device placed on the network or sending it to the device registered in the SRSP. Thus, the SRSP can be updated. It is also possible to designate the second server before the server 5 is turned off. At this time, the server can be realized by sending a server request signal to the second server. Upon receiving this request, the second server can update the information of all the devices by broadcasting that it has become a server or sending it to the devices registered in the SRSP.

かかる構成によれば、本発明の機器連携型の音声認識装置を搭載した機器をネットワーク4に接続するだけで、SRSPをサーバーからダウンロードし、自動的にネットワーク上にある他の機器の認識器と連携し音声の認識が出来るようにすることが出来る。また既にネットワークに接続されている機器であっても、電源を入れた場合にはSRSPをダウンロードすることで電源が入っていなかったときのネットワークの状態を更新することができ、矛盾を起こすことが無くなるという効果をもたらす。また、電源を切る際にもその情報をネットワークに接続されている機器に知らせることでも、無駄な認識依頼、保証依頼を送らずにすむ、またサーバーの電源を落とす際に、第2のサーバーが自動的に立ち上がることで、たとえ第1のサーバーが立ち上がっていなくても、新たな機器の設定もPlug&Playのように自動的にできるという効果をもたらす。   According to such a configuration, the SRSP can be downloaded from the server and automatically connected to the recognizer of the other device on the network by simply connecting the device equipped with the device-coordinate voice recognition device of the present invention to the network 4. It is possible to make it possible to recognize the voice in cooperation. Even if the device is already connected to the network, when the power is turned on, the SRSP can be downloaded to update the network status when the power is not turned on, which may cause inconsistencies. It brings about the effect of disappearing. Further, also it is possible to indicate the device connected to the information network when power off, it is not necessary to send useless recognition request, warranty request, also when powering down the server, the second server By starting up automatically, even if the first server is not started up, a new device can be automatically set up like Plug & Play.

(実施の形態9)
図36は、本発明の音声認識装置の実施の形態9を示す構成図である。電子レンジ2には計算リソースの関係上、単語の認識を行える音声認識部3601が搭載されており、一方、PC1には文の認識が行える音声認識部3602が搭載されている。
(Embodiment 9)
FIG. 36 is a block diagram showing Embodiment 9 of the speech recognition apparatus of the present invention. The microwave oven 2 is equipped with a speech recognition unit 3601 capable of recognizing words due to computational resources, while the PC 1 is equipped with a speech recognition unit 3602 capable of recognizing sentences.

一般に電子レンジ2はユーザによる連続的な単語の発声である「冷凍、ご飯、温め」というような入力発声に対して、図37に示すように、各単語をスポッティング的に認識する。その結果、連続音声認識で用いるN−gramのような前後の単語の文脈情報を使うことはないため、多くの場合、音声認識誤りを起こすか、あるいは図37のように第一の候補と第二の候補の尤度差が小さくなり、確信をもって認識結果を信頼するには至らない。図37の場合、「温め」と「炒め」の両方が誤認識されている。   In general, the microwave oven 2 recognizes each word in a spotting manner as shown in FIG. 37 in response to an input utterance such as “frozen, rice, warm” which is a continuous utterance of a word by the user. As a result, the context information of the preceding and following words such as N-gram used in continuous speech recognition is not used, and in many cases, a speech recognition error occurs or the first candidate and the first candidate as shown in FIG. The likelihood difference between the two candidates is reduced, and the recognition result cannot be trusted with certainty. In the case of FIG. 37, both “warming” and “fried” are erroneously recognized.

そこで、本発明の音声認識装置を利用すると、電子レンジ2は、「温め」の認識が正しいかどうかをネットワーク4に接続されていたPC1に問い合わせをする。問い合わせは、ブロードキャストで行い図11に示した送信依頼メッセージをネットワーク4を通じて送信する。PC1はこの依頼メッセージを受け、依頼応答部205に格納された自機器での認識結果を参照し、その保証結果を返す。PC1に搭載された音声認識部3602では、入力される単語の前後文脈を考慮した言語モデルをもった認識部1202が搭載されているので、「冷凍ご飯炒め」ではなく「冷凍ご飯温め」の方がもっともらしいと、電子レンジ2に搭載された音声認識部3601に比べて認識することが可能である。そのため、電子レンジ2は、PC1に保証依頼を出すことにより、「温め」の方が信頼できる結果だということを保証してもらうことが可能になる。   Therefore, when the speech recognition apparatus of the present invention is used, the microwave oven 2 inquires of the PC 1 connected to the network 4 whether the recognition of “warming” is correct. The inquiry is made by broadcasting, and the transmission request message shown in FIG. The PC 1 receives this request message, refers to the recognition result of its own device stored in the request response unit 205, and returns the guarantee result. The speech recognition unit 3602 installed in the PC 1 has a recognition unit 1202 having a language model that takes into account the context before and after the input word, so that “frozen rice warming” instead of “frozen rice frying” If it is plausible, it can be recognized as compared with the voice recognition unit 3601 installed in the microwave oven 2. Therefore, the microwave oven 2 can be assured that “warming” is a more reliable result by sending a guarantee request to the PC 1.

図38は本実施の形態9の電子レンジ2の構成を示す図で、電子レンジに搭載された意味理解部3702は音声認識部3601の結果である認識結果信号3711をもとにユーザの意味を理解し、機器制御部3703は意味理解部3702の出力である意味理解結果3712を用いて各種機器の制御を行う。   FIG. 38 is a diagram illustrating the configuration of the microwave oven 2 according to the ninth embodiment. The meaning understanding unit 3702 installed in the microwave oven indicates the meaning of the user based on the recognition result signal 3711 that is a result of the voice recognition unit 3601. Under the understanding, the device control unit 3703 controls various devices using the meaning understanding result 3712 which is the output of the meaning understanding unit 3702.

以上の動作により、電子レンジ2の動作を「冷凍ご飯の温め」とすることが出来る。ここで意味理解方法として、認識結果信号3712をもとに、図39に示すように、電子レンジのフレーム表現を求めればよい。認識結果の各単語のフレームへの当てはめは、単語のもつ属性値をもとに簡単に求められる。フレーム表現は、電子レンジの動作によりあらかじめ作成しておくことが可能である。今回の電子レンジの動作は、図39に示すように、「どのような状態」(属性)の「何」(対象)を「どうするのか」(動作モード)という3つの属性のフレームを構成する属性スロットとして用意した。   With the above operation, the operation of the microwave oven 2 can be set to “warming frozen rice”. Here, as a meaning understanding method, a frame representation of a microwave oven may be obtained based on the recognition result signal 3712 as shown in FIG. The recognition result can be easily applied to the frame of each word based on the attribute value of the word. The frame representation can be created in advance by the operation of the microwave oven. As shown in FIG. 39, the operation of the microwave oven this time is an attribute that constitutes a frame with three attributes of “what” (object) of “what state” (attribute) and “what to do” (operation mode). Prepared as a slot.

以上のように、本発明の音声認識装置を利用することで、電子レンジ2のように計算リソースの少ない機器であっても、より高性能な音声認識を搭載したPC1から保証を得るように連携することにより、性能の高い認識を行うことが可能になる。   As described above, by using the speech recognition apparatus of the present invention, even a device such as the microwave oven 2 with a small amount of calculation resources can be linked to obtain a guarantee from the PC 1 equipped with higher performance speech recognition. By doing so, it becomes possible to perform recognition with high performance.

また、ここではネットワーク4に接続されている機器を電子レンジ2とPC1の2種類としたが、図34のように3種類以上の機器が接続していても構わない。このとき、実施の形態3で示したように、音声認識機器プロファイル2001に格納されたプロファイル情報をもとに保証依頼を行う機器を決定するように連携処理を行うことで、自機器よりも性能の高い機器に対して確実に保証依頼を行うことが出来るようになる。図34のように構成されたネットワーク4上の電子レンジ2についてはPC1や音声認識サーバー5に保証依頼を行うようにすればよい。   Here, although two types of devices connected to the network 4 are the microwave oven 2 and the PC 1, three or more types of devices may be connected as shown in FIG. At this time, as shown in the third embodiment, by performing cooperation processing so as to determine a device for which a guarantee request is made based on the profile information stored in the voice recognition device profile 2001, the performance is higher than that of the own device. It becomes possible to make a guarantee request for high-quality equipment. As for the microwave oven 2 on the network 4 configured as shown in FIG. 34, a guarantee request may be made to the PC 1 or the voice recognition server 5.

また、実施の形態4のように、PC1や音声認識サーバー5は、自機器のマイクを通して蓄積された音声に対して、電子レンジに関係する辞書ファイル、言語モデル、音響モデルを用いて、音声認識を行うように構成することが出来る。このように構成することで、電子レンジ2のドメインに合わせて連続音声認識を行い、その結果を用いて電子レンジ2からの依頼に対して保証結果を返すことが出来るようになる。   Further, as in the fourth embodiment, the PC 1 and the voice recognition server 5 recognize voice by using a dictionary file, a language model, and an acoustic model related to a microwave oven with respect to the voice accumulated through the microphone of its own device. Can be configured. With this configuration, continuous speech recognition is performed in accordance with the domain of the microwave oven 2, and a guarantee result can be returned in response to a request from the microwave oven 2 using the result.

また、実施の形態5のように、PC1や音声認識サーバー5はネットワーク4を通じて得られる各機器上で得られた音声に対して、電子レンジに関係する辞書ファイル、言語モデル、音響モデルを用いて、音声認識を行うように構成することが出来る。このように構成することで、電子レンジ2のドメインに合わせて連続音声認識を行い、その結果を用いて電子レンジ2からの依頼に対して保証結果を返すことが出来るようになる。これにより、たとえ発声者とPCや音声認識サーバーのようなより強力な機器の位置が離れていたとしても、認識することが可能となる効果をもつ。   Further, as in the fifth embodiment, the PC 1 and the voice recognition server 5 use a dictionary file, a language model, and an acoustic model related to the microwave for the voice obtained on each device obtained through the network 4. , it can be configured to perform speech recognition. With this configuration, continuous speech recognition is performed in accordance with the domain of the microwave oven 2, and a guarantee result can be returned in response to a request from the microwave oven 2 using the result. As a result, even if the position of a more powerful device such as a PC or a voice recognition server is separated from the speaker, there is an effect that it can be recognized.

また、実施の形態7のように、依頼先から得られる保証結果に対して信頼度を付与して重みをつけるように構成できる。例えば、ネットワーク4上に、保証依頼元であるA社製電子レンジ2、そして保証依頼先であるPC1、音声認識サーバー5、オーブン、B社製電子レンジ、そして炊飯器が接続されているとする。このとき、信頼できる依頼先として、PC1、音声認識サーバー5、そして同じドメインの認識機が載っているB社製の電子レンジが考えられ、保証結果に対する信頼度を1とする。またオーブンのように似たような操作系をもつ機器からの結果に対する信頼度を0.3、そして炊飯器からの返答に対する信頼度を0とすることで、ネットワーク上のリソースを有効に利用して認識が行えるように構成することが出来るようになる。   Further, as in the seventh embodiment, a reliability can be given to the guarantee result obtained from the request destination to give a weight. For example, it is assumed that a warranty request source A company microwave oven 2 and a warranty request destination PC 1, a speech recognition server 5, an oven, a company B microwave oven, and a rice cooker are connected to the network 4. . At this time, as a reliable request destination, a PC 1, a voice recognition server 5, and a microwave oven manufactured by B company on which a recognizer of the same domain is mounted are considered, and the reliability of the guarantee result is set to 1. Moreover, the reliability on the result from the equipment with the similar operation system like an oven is set to 0.3, and the reliability to the response from the rice cooker is set to 0, so that resources on the network can be used effectively. Can be configured to be recognized.

また、ここでは電子レンジに搭載の音声認識装置の機能として連続単語認識であるとしたが、PCと同じように連続音声認識が搭載されている場合でも利用できる。この場合でも、ユーザの認識を100%可能な音声認識は存在しないことからも分かるように、他の機器からの保証結果を利用する事でより信頼度の高い音声認識結果を得ることが出来るようになる。   Here, continuous word recognition is used as a function of the voice recognition device installed in the microwave oven, but it can be used even when continuous voice recognition is installed in the same manner as a PC. Even in this case, as can be seen from the fact that there is no voice recognition that allows 100% user recognition, a more reliable voice recognition result can be obtained by using the guarantee result from another device. become.

また、ここでは電子レンジ2を対象にして説明したが、炊飯器、冷蔵庫などの家電品、またステレオやカーナビゲーションなどのAV機器、ナビゲーション機器、さらにはPDA機器の操作やPDAやPC上のアプリケーション用の音声認識器が保証もとになっても使用可能である。   In addition, although the description has been made with respect to the microwave oven 2 here, home appliances such as rice cookers and refrigerators, AV devices such as stereo and car navigation, navigation devices, and operations on PDA devices and applications on PDAs and PCs It can be used even if a voice recognizer is used as a guarantee.

(実施の形態10)
図40は本発明の実施の形態10を示す構成図であって、電子レンジ4001には計算リソースの関係上、単語の認識が行える音声認識部4011が搭載されており、一方、PC4002の方には文の認識が行える音声認識部4012が搭載されている。また、PC4002にはネットワーク4に接続された機器に対するヘルプシステム、さらにはレシピ検索などのアプリケーションが搭載されている。そして電子レンジ4001は、PC4002上にダウンロードされたレシピ情報に記載されたプログラム情報により料理方法が逐次更新出来るようにされたネット家電型の電子レンジであるとする。
(Embodiment 10)
FIG. 40 is a block diagram showing Embodiment 10 of the present invention. A microwave recognition unit 4011 capable of recognizing words is mounted on the microwave oven 4001 because of computational resources. A voice recognition unit 4012 capable of recognizing a sentence is mounted. The PC 4002 is equipped with a help system for devices connected to the network 4 and an application such as recipe search. It is assumed that the microwave oven 4001 is an internet home appliance type microwave oven in which the cooking method can be sequentially updated by the program information described in the recipe information downloaded on the PC 4002.

以上のように構成された電子レンジ4001上で動作する音声認識機能は、実施の形態1で示したような連続単語発声によるコマンドタイプのものではなく、例えば、「今日のお勧めレシピは?」のように新たなレシピを確認するような発話や、「必要な材料は何?」といった検索を行う発話や、「牛乳200ml?」といった確認を行うような発話、さらには、「どうやってレシピダウンロードするんだっけ?」といったヘルプを要求する発話などが行われるため、新たなレシピにあわせた自由な発声に対応可能な音声認識機能が必要となる。しかし、電子レンジ4001上の音声認識部4011はリソースが限られているために、上記発声を認識できるような連続音声認識を搭載することはできない場合が多く、基本的には「冷凍、ご飯、温め」のような連続単語発声に対して対応可能な認識機がのる場合が多い。そこで、電子レンジ4001に搭載の機器連携型音声認識部4011は、ユーザの発声がx秒以上であるならば、入力された音声が文であると考えPCに対して音声認識を依頼する。また、例えば「ご飯」と「牛乳」など、意味的に合わない単語が同時に認識されているというような言語的な知識や、音響スコアが全体的に低いなどのような情報を用いて、文全体の認識を依頼する必要があるかどうかを判定する。   The voice recognition function that operates on the microwave oven 4001 configured as described above is not of the command type based on continuous word utterance as shown in the first embodiment. For example, “What is the recommended recipe today?” Like utterances that confirm new recipes, utterances that perform searches such as “What are the necessary ingredients?”, Utterances that perform confirmations such as “200 ml of milk?”, And “How to download recipes” Speeches that ask for help, such as “Is it? However, since the voice recognition unit 4011 on the microwave oven 4001 has limited resources, it cannot often be equipped with continuous voice recognition that can recognize the utterance. In many cases, a recognizer that can handle continuous word utterances such as “warm” is used. Therefore, if the user's utterance is x seconds or more, the device cooperation type speech recognition unit 4011 installed in the microwave oven 4001 considers the input speech to be a sentence and requests the PC for speech recognition. In addition, using linguistic knowledge that words that do not match semantically, such as “rice” and “milk” are recognized at the same time, or information such as an overall low acoustic score, It is determined whether it is necessary to request the whole recognition.

また、上記実施の形態では電子レンジ4001上の認識として連続単語認識を想定し説明したが、連続音声認識が搭載できたとした場合でも、新たなレシピ情報がダウンロードされてくるなど、認識すべき文の対象が前もって限定できない場合には、ユーザの発声を認識できない場合が多くなる。そこで、連続音声認識を用いている場合であっても、言語の尤度が低いなどの情報を用いて入力音声全体の信頼度を測り、その値を元に、他の機器に認識を依頼するように判断できる。   In the above embodiment, continuous word recognition is assumed as recognition on the microwave oven 4001. However, even if continuous speech recognition can be installed, a sentence to be recognized such as new recipe information being downloaded. If the target cannot be limited in advance, there are many cases where the user's speech cannot be recognized. Therefore, even if continuous speech recognition is used, the reliability of the entire input speech is measured using information such as low likelihood of language, and other devices are requested to recognize based on this value. Can be judged.

上記のような基準にもとづき、認識依頼が必要であると判断された場合、電子レンジ4001に搭載された音声認識部4011は、他の機器に対して図41に示すような認識依頼メッセージを送信する。依頼された機器は送信されてきた音声データをもとに、認識を行いその結果を電子レンジ4001に返信する。返信結果を受けた電子レンジ4001は、その結果を元に、認識の再判定を行い認識結果を求めることが出来る。再判定の方法としては、より高性能なPC4002に依頼を出していることから、返信の値を優先するとすることが出来る。   When it is determined that a recognition request is necessary based on the above criteria, the voice recognition unit 4011 mounted on the microwave oven 4001 transmits a recognition request message as shown in FIG. 41 to another device. To do. The requested device recognizes based on the transmitted voice data and returns the result to the microwave oven 4001. The microwave oven 4001 that has received the reply result can re-recognize the recognition based on the result and obtain the recognition result. As a re-determination method, since a request is sent to the higher-performance PC 4002, the return value can be given priority.

また、本実施例では、ネットワーク4上に接続されている機器として電子レンジ4001と、PC4002を想定していたが、それ以外にも、冷蔵庫、音声認識サーバーなど3
種類以上の機器が接続されている状況も考えてよい。その場合に、このとき、実施の形態3で示したように、音声認識機器プロファイル2001に格納されたプロファイル情報をもとに認識依頼を行う機器を決定するように連携処理を行うことで、自機器よりも性能の高い機器に対して確実に認識依頼を行うことが出来るようになる。図34のように構成されたネットワーク上の電子レンジについてはPCや音声認識サーバーに認識依頼を行うようにすればよい。
In this embodiment, the microwave oven 4001 and the PC 4002 are assumed as devices connected to the network 4, but in addition to this, a refrigerator, a voice recognition server, etc.
A situation where more than one type of device is connected may also be considered. In such a case, as shown in the third embodiment, by performing cooperation processing so as to determine a device that makes a recognition request based on the profile information stored in the voice recognition device profile 2001, A recognition request can be reliably made for a device having a higher performance than the device. As for the microwave oven on the network configured as shown in FIG. 34, a recognition request may be sent to a PC or a voice recognition server.

また、実施の形態4のように、PC1や音声認識サーバー5は、自機器のマイクを通して蓄積された音声に対して、電子レンジに関係する辞書ファイル、言語モデル、音響モデルを用いて、音声認識を行うように構成することが出来る。このように構成することで、電子レンジのドメインに合わせて連続音声認識を行い、その結果を返すことが出来るようになる。   Further, as in the fourth embodiment, the PC 1 and the voice recognition server 5 recognize voice by using a dictionary file, a language model, and an acoustic model related to a microwave oven with respect to the voice accumulated through the microphone of its own device. Can be configured. With this configuration, continuous speech recognition can be performed in accordance with the microwave oven domain, and the result can be returned.

また、実施の形態5のように、PC1や音声認識サーバー5はネットワーク4を通じて得られる各機器上で得られた音声に対して、電子レンジに関係する辞書ファイル、言語モデル、音響モデルを用いて、音声認識を行うように構成することが出来る。このように構成することで、電子レンジのドメインに合わせて連続音声認識を行い、その結果を用いて電子レンジからの依頼にたいして認識結果を返すことが出来るようになる。これにより、例え発声者とPCや音声認識サーバーのようなより強力な機器の位置が離れていたとしても、認識することが可能となる効果をもつ。   Further, as in the fifth embodiment, the PC 1 and the voice recognition server 5 use a dictionary file, a language model, and an acoustic model related to the microwave for the voice obtained on each device obtained through the network 4. , it can be configured to perform speech recognition. With this configuration, continuous speech recognition is performed in accordance with the domain of the microwave oven, and the recognition result can be returned in response to a request from the microwave oven using the result. Thereby, even if the position of a more powerful device such as a PC or a voice recognition server is separated from the speaker, there is an effect that it can be recognized.

また、実施の形態7のように、依頼先から得られる認識結果に対して信頼度を付与して重みをつけるように構成できる。例えば、ネットワーク上に、認識依頼元であるA社製電子レンジ、そして保証依頼先であるPC、音声認識サーバー、オーブン、B社製電子レンジ、そして炊飯器が接続されているとする。このとき、信頼できる依頼先として、PC、音声認識サーバーが考えられ、認識結果に対する信頼度を1とする。また同じドメインの認識機が載っているB社製の電子レンジ、オーブンのように似たような操作系をもつ機器からの結果に対する信頼度を0.3、そして炊飯器からの返答に対する信頼度を0とすることで、ネットワーク上のリソースを有効に利用して認識が行えるように構成することが出来るようになる。   Further, as in the seventh embodiment, the recognition result obtained from the request destination can be given a weight by giving the reliability. For example, it is assumed that a recognition request source A company microwave oven, a warranty request destination PC, a voice recognition server, an oven, a company B microwave oven, and a rice cooker are connected to the network. At this time, a PC or a voice recognition server can be considered as a reliable request destination, and the reliability for the recognition result is set to 1. In addition, the reliability of the result from the equipment with the similar operation system such as the microwave oven made by B company where the recognition machine of the same domain is mounted, and the reliability of the response from the rice cooker By setting 0 to 0, it is possible to configure so that recognition can be performed by effectively using resources on the network.

また、ここでは電子レンジを対象にして説明したが、炊飯器、冷蔵庫などの家電品、またステレオやカーナビゲーションなどのAV機器、ナビゲーション機器、さらにはPDA機器の操作やPDAやPC上のアプリケーション用の音声認識器が依頼元になっても使用可能である。   Although described here for microwave ovens, it is used for home appliances such as rice cookers and refrigerators, AV equipment such as stereo and car navigation systems, navigation equipment, and PDA equipment operations and applications on PDAs and PCs. It can be used even if the voice recognizer is the requester.

(実施の形態11)
図42に本発明の実施の形態11の構成図を示す。ネットワーク4上に複数の機器、例えば、PC4001、電子レンジ4202、冷蔵庫4203、洗濯機4204、音声認識サーバー4205が接続されている。各機器は家の中に分散して配置されている。ユーザは、部屋の中の任意の場所から各機器の動作を音声により指示できるようになっている。
(Embodiment 11)
FIG. 42 shows a configuration diagram of the eleventh embodiment of the present invention. A plurality of devices such as a PC 4001, a microwave oven 4202, a refrigerator 4203, a washing machine 4204, and a voice recognition server 4205 are connected to the network 4. Each device is distributed in the house. The user can instruct the operation of each device by voice from any place in the room.

部屋の中にいるユーザは電子レンジ4202に向けて「温め」という命令を発声する。しかし、今、ユーザは電子レンジ4202から離れており、その距離では電子レンジ4202に搭載の音声認識部101ではユーザの発声を上手く認識できない。その代わり、ユーザの近くPC4001がある。このような状況を考えると、電子レンジ4202の認識は失敗をしてしまうが、PC4001では電子レンジ4202にとって重要なキーワードである「温め」が認識できることになる。   A user in the room utters a command “warming” to the microwave oven 4202. However, the user is now away from the microwave oven 4202, and at that distance, the voice recognition unit 101 installed in the microwave oven 4202 cannot recognize the user's speech well. Instead, there are close to the user PC4001. Considering such a situation, recognition of the microwave oven 4202 fails, but the PC 4001 can recognize “warming” that is an important keyword for the microwave oven 4202.

すなわち、PC4001で認識された結果である「温め」を上手く使い電子レンジ4202でも認識結果を得ることが出来る。図43に示すように、PC4001は音声認識機器プロファイル格納部2001でネットワーク4に接続された機器にとって重要なキーワードをもとに、自身で認識した結果「温め」を、電子レンジ4202に通知する。電子レンジ4202は、この通知をうけ、他の機器(ここでは音声認識サーバー4205)に対して、その保証の問い合わせを行う。これにより、たとえ電子レンジ4202では認識が上手くいっていなかったとしても、他の機器からの通知、そして保証確認を使うことにより「温め」を認識することが出来るようになる。   That is, the recognition result can be obtained even in the microwave oven 4202 by successfully using “warming” which is the result recognized by the PC 4001. As shown in FIG. 43, the PC 4001 notifies the microwave oven 4202 of “warming” as a result of recognition by the PC 4001 based on keywords important for devices connected to the network 4 in the voice recognition device profile storage unit 2001. Upon receiving this notification, the microwave oven 4202 makes an inquiry about the guarantee to another device (here, the voice recognition server 4205). As a result, even if the microwave oven 4202 is not well recognized, “warming” can be recognized by using a notification from another device and using the warranty confirmation.

(実施の形態12)
図44は、本発明の実施の形態12を示すシステム構成と動作を示した図である。電子レンジ4202に搭載の音声認識部101は、認識に失敗したとする。そのとき、電子レンジ4202は、他の強力な音声認識サーバー4205に対して認識を依頼する。しかし、その音声認識サーバー4205でも、上記音声を認識するにあたってちょうど対応する言語モデルなどがないとする。その場合、前記音声認識サーバー4205は、また別途異なるサーバー(例えば、PC4001)に対して依頼を行う。このような連鎖を繰り返すことで音声の認識結果を、ユーザと機器との距離に応じずネットワーク4上に置かれた機器を用いて認識を行うことが出来るようになる。
(Embodiment 12)
FIG. 44 is a diagram showing the system configuration and operation showing the twelfth embodiment of the present invention. It is assumed that the voice recognition unit 101 mounted on the microwave oven 4202 has failed in recognition. At that time, the microwave oven 4202 requests recognition from another powerful voice recognition server 4205. However, it is assumed that the speech recognition server 4205 does not have a language model or the like corresponding to the speech recognition. In that case, the voice recognition server 4205 makes a request to a different server (for example, the PC 4001). By repeating such a chain, the speech recognition result can be recognized using a device placed on the network 4 regardless of the distance between the user and the device.

(実施の形態13)
図45は、本発明の実施の形態13における音声認識装置を用いたシステム構成図である。音声認識を行う音声認識サーバー4501は、例えば家庭内などに作られたローカルなネットワーク環境4とインターネットなどを介してつながっている。ユーザは音声認識による家電機器などのコントロールを家庭内に構築するのではなく、インターネット上のサービスサイトとして用意された音声認識サーバー4501を利用する。このようにすることで、ユーザはあらかじめ高価なサーバーを買う必要がなく、必要に応じて課金サーバー4502で課金されるようにシステムを構成できる。
(Embodiment 13)
FIG. 45 is a system configuration diagram using the speech recognition apparatus according to the thirteenth embodiment of the present invention. A voice recognition server 4501 that performs voice recognition is connected to a local network environment 4 created in a home, for example, via the Internet. The user uses a voice recognition server 4501 prepared as a service site on the Internet, instead of building home appliance control or the like by voice recognition in the home. In this way, the user does not need to purchase an expensive server in advance, and the system can be configured so that the billing server 4502 is charged as necessary.

また、音声認識サーバー4501にダウンロードサービスを持たせておくことも有効である。音声認識サーバー4501はユーザからの要求に応じて、辞書ファイル、言語モデル、音響モデルをダウンロードできるサービスももつ。ここで、ダウンロードごとに課金サーバー4502によって課金するように構成できる。   It is also effective to provide the voice recognition server 4501 with a download service. The voice recognition server 4501 also has a service that can download a dictionary file, a language model, and an acoustic model in response to a request from a user. Here, the charging server 4502 can be charged for each download.

本発明にかかる音声認識装置は、ネットワークに接続された音声認識装置が連携して協調し合うことで、各々の機器単体で認識出来る以上に、単語や文のバリエーションの認識が可能となるという効果を有し、ユビキタスコンピューティング、情報家電、カーナビゲーションなどの分野で有用である。   The speech recognition apparatus according to the present invention has the effect that it is possible to recognize variations of words and sentences more than the individual devices can recognize by the cooperation of the speech recognition apparatuses connected to the network. It is useful in fields such as ubiquitous computing, information appliances, and car navigation.

本発明の実施の形態1における音声認識装置を備えた機器を用いたシステム構成図1 is a system configuration diagram using a device including a voice recognition device according to Embodiment 1 of the present invention. 本発明の実施の形態1における音声認識部の構成を示す図The figure which shows the structure of the speech recognition part in Embodiment 1 of this invention. 本発明の実施の形態1における音声認識装置の保証依頼を行う機器(電子レンジ)のフローチャートThe flowchart of the apparatus (microwave oven) which performs the guarantee request | requirement of the speech recognition apparatus in Embodiment 1 of this invention. 本発明の実施の形態1における音声認識装置の保証依頼を受けた機器(PC)のフローチャートFlowchart of a device (PC) that has received a warranty request for the speech recognition apparatus in Embodiment 1 of the present invention 本発明の実施の形態1における音声認識装置の認識依頼を行う機器(電子レンジ)のフローチャートThe flowchart of the apparatus (microwave oven) which performs the recognition request of the speech recognition apparatus in Embodiment 1 of this invention. 本発明の実施の形態1における音声認識装置の認識依頼を受けた機器(PC)のフローチャートThe flowchart of the apparatus (PC) which received the recognition request of the speech recognition apparatus in Embodiment 1 of this invention. 本発明の実施の形態1における音声認識装置の保証依頼/認識依頼を同時に行なうときの依頼を行う側(電子レンジ)のフローチャートFlowchart of requesting side (microwave oven) when simultaneously performing guarantee request / recognition request of voice recognition apparatus in Embodiment 1 of the present invention 本発明の実施の形態1における音声認識装置の保証依頼/認識依頼を同時に行なうときの依頼を行う側(PC)のフローチャートFlowchart of requesting side (PC) when simultaneously performing guarantee request / recognition request of voice recognition apparatus in embodiment 1 of the present invention 本発明の実施の形態1における音声認識装置のメッセージの構成例を示す図The figure which shows the structural example of the message of the speech recognition apparatus in Embodiment 1 of this invention. 本発明の実施の形態1における音声認識装置のメッセージのタグ表現例を示す図The figure which shows the tag expression example of the message of the speech recognition apparatus in Embodiment 1 of this invention. 本発明の実施の形態1における音声認識装置の電子レンジのメッセージの例を示す図The figure which shows the example of the message of the microwave oven of the speech recognition apparatus in Embodiment 1 of this invention. 本発明の実施の形態1における音声認識装置の他の例を示すブロック図The block diagram which shows the other example of the speech recognition apparatus in Embodiment 1 of this invention. 本発明の実施の形態1における音声認識装置の他のメッセージの例を示す図The figure which shows the example of the other message of the speech recognition apparatus in Embodiment 1 of this invention. 本発明の実施の形態1における音声認識装置のPCから電子レンジへのメッセージの例を示す図The figure which shows the example of the message from PC of the speech recognition apparatus in Embodiment 1 of this invention to a microwave oven. 本発明の実施の形態1における音声認識装置のPCから電子レンジへの他のメッセージの例を示す図The figure which shows the example of the other message from PC of the speech recognition apparatus in Embodiment 1 of this invention to a microwave oven 本発明の実施の形態1における音声認識装置のPCから電子レンジへの更に他のメッセージの例を示す図The figure which shows the example of the other message from PC of the speech recognition apparatus in Embodiment 1 of this invention to a microwave oven. 本発明の実施の形態1における音声認識装置のPCから電子レンジに認識を依頼するメッセージの例を示す図The figure which shows the example of the message which requests | requires recognition from the PC of the speech recognition apparatus in Embodiment 1 of this invention to a microwave oven 本発明の実施の形態1における音声認識装置の認識依頼を受けたPCからの返信メッセージの例を示す図The figure which shows the example of the reply message from PC which received the recognition request of the speech recognition apparatus in Embodiment 1 of this invention. 本発明の実施の形態2における音声認識装置のブロック図Block diagram of the speech recognition device according to a second embodiment of the present invention 本発明の実施の形態3における音声認識装置のブロック図Block diagram of the speech recognition device in the third embodiment of the present invention 本発明の実施の形態3における音声認識装置の音声認識機器プロファイル格納部の概要説明図Outline explanatory drawing of voice recognition equipment profile storage part of voice recognition device in Embodiment 3 of the present invention 本発明の実施の形態3における音声認識装置の音声認識機器プロファイル格納部に記載された情報を示す図The figure which shows the information described in the speech recognition apparatus profile storage part of the speech recognition apparatus in Embodiment 3 of this invention. 本発明の実施の形態3における音声認識装置のフローチャートFlow chart of the speech recognition device in the third embodiment of the present invention 本発明の実施の形態3における音声認識装置の他のフローチャートAnother flowchart of the speech recognition apparatus according to the third embodiment of the present invention. 本発明の実施の形態4における音声認識装置のブロック図Block diagram of the speech recognition device in the fourth embodiment of the present invention 本発明の実施の形態5における音声認識装置のブロック図Block diagram of the speech recognition device in the fifth embodiment of the present invention 本発明の実施の形態6における音声認識装置のブロック図Block diagram of the speech recognition apparatus according to a sixth embodiment of the present invention 本発明の実施の形態6における音声認識装置のメッセージの例を示す図The figure which shows the example of the message of the speech recognition apparatus in Embodiment 6 of this invention. 本発明の実施の形態6における音声認識装置のフローチャートFlow chart of the speech recognition device in the sixth embodiment of the present invention 本発明の実施の形態7における音声認識装置のブロック図Block diagram of the speech recognition apparatus according to a seventh embodiment of the present invention 本発明の実施の形態7における音声認識装置の信頼度情報の例を示す図The figure which shows the example of the reliability information of the speech recognition apparatus in Embodiment 7 of this invention. 本発明の実施の形態7における音声認識装置のフローチャートFlowchart speech recognition apparatus according to the seventh embodiment of the present invention 本発明の実施の形態8における音声認識装置の構成図Configuration diagram of a speech recognition apparatus according to the eighth embodiment of the present invention 本発明の実施の形態8における音声認識装置のシステム構成図System configuration diagram of voice recognition apparatus according to Embodiment 8 of the present invention (a)本発明の実施の形態8における音声認識装置の追加機器のフローチャート(b)同実施の形態8における音声認識装置のサーバーのフローチャート(c)同実施の形態8における音声認識装置の各機器のフローチャート(A) Flow chart of additional device of speech recognition apparatus in embodiment 8 of the present invention (b) Flow chart of server of speech recognition apparatus in embodiment 8 (c) Each device of speech recognition apparatus in embodiment 8 Flowchart 本発明の実施の形態9における音声認識装置のシステム構成図The system block diagram of the speech recognition apparatus in Embodiment 9 of this invention 本発明の実施の形態9における音声認識装置の認識結果を示す図The figure which shows the recognition result of the speech recognition apparatus in Embodiment 9 of this invention. 本発明の実施の形態9における音声認識装置の構成図Configuration diagram of a speech recognition apparatus according to a ninth embodiment of the present invention 本発明の実施の形態9における音声認識装置の意味理解の表現を示す図The figure which shows the expression of the meaning understanding of the speech recognition apparatus in Embodiment 9 of this invention. 本発明の実施の形態10における音声認識装置のシステム構成図System configuration diagram of a speech recognition apparatus according to Embodiment 10 of the present invention. 本発明の実施の形態10における音声認識装置のメッセージの例を示す図The figure which shows the example of the message of the speech recognition apparatus in Embodiment 10 of this invention. 本発明の実施の形態11における音声認識装置のシステム構成図System configuration diagram of speech recognition apparatus according to Embodiment 11 of the present invention 本発明の実施の形態11における音声認識装置の動作説明図Operation explanatory diagram of the speech recognition apparatus according to the eleventh embodiment of the present invention. 本発明の実施の形態12における音声認識装置のシステム構成図The system block diagram of the speech recognition apparatus in Embodiment 12 of this invention. 本発明の実施の形態13における音声認識装置のシステム構成図The system block diagram of the speech recognition apparatus in Embodiment 13 of this invention.

符号の説明Explanation of symbols

1 PC
2 電子レンジ
3 冷蔵庫
4 洗濯機
5 音声認識サーバー
6 洗濯機
101 音声認識部
201 入力部
202 認識部
203 依頼判定部
204 認識結果確定部
205 依頼応答部
206 インターフェース部
207 出力部
221 入力音声信号
222 出力内容信号
231 送信依頼内容信号
232 受入返答内容信号
233 送信応答内容信号
234 入依頼内容信号
235 送信依頼メッセージ信号
236 受入応答メッセージ信号
237 送信応答メッセージ信号
238 受入依頼メッセージ信号
241 認識結果信号
242 認識結果依頼情報付き信号
243 認識結果格納信号
1201 IPリストテーブル格納部
1211 IPリストテーブル信号
2001 音声認識機器プロファイル格納部
2002 辞書ファイル格納部
2003 言語モデル格納部
2004 音響モデル格納部
2005 認識結果蓄積部
2011 音声認識機器プロファイル信号
2501 音声情報蓄積部
2511 蓄積音声信号
2701 信頼度情報格納部
2711 信頼度情報信号
3001 通知判定部
3002 通知機能付きインターフェース部
3011 通知内容信号
3012 通知メッセージ信号
3301 機器状態検出部
3311 機器状態検出信号
3312 機器状態通知メッセージ信号
3601、3602 音声認識部
3702 意味理解部
3703 機器制御部
4502 課金サーバー
1 PC
DESCRIPTION OF SYMBOLS 2 Microwave oven 3 Refrigerator 4 Washing machine 5 Voice recognition server 6 Washing machine 101 Voice recognition part 201 Input part 202 Recognition part 203 Request determination part 204 Recognition result determination part 205 Request response part 206 Interface part 207 Output part 221 Input voice signal 222 Output Content signal 231 Transmission request content signal 232 Acceptance response content signal 233 Transmission response content signal 234 Transmission request content signal 235 Transmission request message signal 236 Reception response message signal 237 Transmission response message signal 238 Reception request message signal 241 Recognition result signal 242 Recognition result request Signal with information 243 Recognition result storage signal 1201 IP list table storage unit 1211 IP list table signal 2001 Speech recognition device profile storage unit 2002 Dictionary file storage unit 2003 Language model Dell storage unit 2004 acoustic model storage unit 2005 recognition result storage unit 2011 speech recognition device profile signal 2501 speech information storage unit 2511 stored speech signal 2701 reliability information storage unit 2711 reliability information signal 3001 notification determination unit 3002 interface unit with notification function 3011 Notification content signal 3012 Notification message signal 3301 Device state detection unit 3311 Device state detection signal 3312 Device state notification message signal 3601, 3602 Speech recognition unit 3702 Meaning understanding unit 3703 Device control unit 4502 Accounting server

Claims (17)

家電機器と、当該家電機器と通信可能に接続された音声認識機能を有する他の家電機器とを備えた家電機器システムであって、A household electrical appliance system comprising a household electrical appliance and another household electrical appliance having a voice recognition function that is communicably connected to the household electrical appliance,
前記家電機器は、  The home appliance is
音声情報が入力される入力手段と、  An input means for inputting voice information;
前記入力された音声情報の音声認識を行う認識手段と、  Recognition means for performing speech recognition of the input speech information;
少なくとも前記他の家電機器が有するキーワード情報を含むプロファイル情報を格納したプロファイル情報格納手段と、  Profile information storage means storing profile information including keyword information possessed by at least the other home appliances;
前記音声認識結果である単語が前記キーワード情報に含まれる場合には、前記単語をキーワード情報として有する他の家電機器に、前記音声認識結果を通知する通知手段とを備えた家電機器システム。  When the word which is the said speech recognition result is contained in the said keyword information, the household appliance system provided with the notification means which notifies the said speech recognition result to the other household appliances which have the said word as keyword information.
前記家電機器は、The home appliance is
前記認識手段での音声認識結果について、前記他の家電機器への前記音声情報の音声認識の依頼が必要かどうかを判定する判定手段と、  Determination means for determining whether or not a request for voice recognition of the voice information to the other household electrical appliance is necessary for the voice recognition result in the recognition means;
前記判定手段において、音声認識の依頼が必要であると判定された場合、前記他の家電機器に、前記音声情報の音声認識の依頼を送信する送信手段と、  When the determination means determines that a request for voice recognition is necessary, a transmission means for transmitting a request for voice recognition of the voice information to the other home appliances;
前記認識手段の音声認識結果と、前記他の家電機器から送信された音声認識の結果とに基づいて、前記音声情報に対する音声認識結果を確定する確定手段とを備えた請求項1に記載の家電機器システム。  The household appliance of Claim 1 provided with the determination means which determines the voice recognition result with respect to the said audio | voice information based on the voice recognition result of the said recognition means, and the result of the voice recognition transmitted from the said other household appliances. Equipment system.
前記プロファイル情報は、前記他の家電機器が音声認識に用いる辞書ファイルの辞書ファイル情報を含んでおり、The profile information includes dictionary file information of a dictionary file used for voice recognition by the other home appliances,
前記送信手段は、前記他の家電機器の辞書ファイル情報を参照して、前記認識手段で音声認識に用いる辞書ファイルと言語モデルが近い辞書ファイルを有する他の家電機器に、前記音声情報の音声認識の依頼を送信することを特徴とする請求項2に記載の家電機器システム。  The transmission means refers to the dictionary file information of the other home appliance, and recognizes the voice information of the voice information to another home appliance having a dictionary file whose language model is similar to the dictionary file used for speech recognition by the recognition means. The home appliance system according to claim 2, wherein the request is transmitted.
前記家電機器は、The home appliance is
前記他の家電機器からの音声認識の依頼に対して、前記音声情報の音声認識した結果を応答する応答手段を備えたことを特徴とする請求項1に記載の家電機器システム。  The home electric appliance system according to claim 1, further comprising response means for responding to a voice recognition request from the other electric home appliance with a result of voice recognition of the voice information.
前記家電機器は、The home appliance is
前記入力された音声情報を蓄積する音声情報蓄積手段を有し、  Voice information storage means for storing the input voice information;
前記応答手段が、前記他の家電機器からの支援の依頼に対して、前記音声情報蓄積手段に蓄積された音声情報に基づいて、音声認識した結果を応答することを特徴とする請求項3に記載の家電機器システム。  4. The response means responds to a request for assistance from the other home appliance with a result of voice recognition based on voice information stored in the voice information storage means. The home appliance system described.
前記家電機器は、The home appliance is
前記音声情報蓄積手段が、前記他の家電機器に入力された音声情報を蓄積することを特徴とする請求項5に記載の家電機器システム。  6. The home appliance system according to claim 5, wherein the voice information storage unit stores voice information input to the other home appliance.
前記家電機器は、The home appliance is
前記他の家電機器の音声認識に関する信頼度情報を格納する信頼度情報格納手段を有し、  Having reliability information storage means for storing reliability information related to voice recognition of the other home appliances;
前記確定手段が、前記信頼度情報を参照して、前記信頼度が高い他の家電機器からの音声認識結果を優先して、認識結果を確定することを特徴とする請求項2から6のいずれかひとつに記載の家電機器システム。  The determination means prioritizes a voice recognition result from another household appliance with a high reliability with reference to the reliability information, and determines a recognition result. The household electrical appliance system as described in one.
前記家電機器は、The home appliance is
少なくとも前記家電機器と前記他の家電機器との接続の状態又は、前記他の家電機器間の接続の状態を検出する検出手段を有し、  At least a detecting means for detecting a connection state between the home appliance and the other home appliance, or a connection state between the other home appliances,
前記接続の状態に変化があった場合、前記検出手段が、前記他の家電機器に前記接続の様態の変化を通知することを特徴とする請求項1から7のいずれかひとつに記載の家電機器システム。  8. The home appliance according to claim 1, wherein, when there is a change in the connection state, the detection unit notifies the change in the connection state to the other home appliance. system.
前記家電機器は、The home appliance is
前記検出手段が、前記接続の状態の変化を検出した場合、前記プロファイル格納手段に格納されているプロファイル情報の接続状態を更新することを特徴とする請求項8に記載の家電機器システム。  9. The home appliance system according to claim 8, wherein, when the detection unit detects a change in the connection state, the connection state of the profile information stored in the profile storage unit is updated.
前記家電機器は、The home appliance is
前記接続の状態の変化が、前記家電機器と前記他の家電機器との接続または離接、もしくは前記他の家電機器の電源の閉成または開放の少なくともいずれか一方であることを特徴とする請求項8又は9に記載の家電機器システム。  The change in the connection state is at least one of connection or disconnection between the home appliance and the other home appliance, or closing or opening of a power source of the other home appliance. Item 10. The home appliance system according to Item 8 or 9.
前記家電機器は、The home appliance is
前記認識手段が、前記音声情報の意味を理解する意味理解手段を有したことを特徴とする請求項1から請求項10までのうちのいずれかに記載の家電機器システム。  11. The home appliance system according to claim 1, wherein the recognition unit includes a meaning understanding unit that understands the meaning of the audio information.
前記家電機器は、The home appliance is
前記認識手段が、前記認識手段の利用に対して課金をする課金手段を有し、  The recognizing means has a charging means for charging the use of the recognizing means;
前記課金手段が、前記他の家電機器が前記認識手段に音声認識の依頼をする場合に課金することを特徴とする請求項1から請求項11のいずれかひとつに記載の家電機器システム。  12. The home appliance system according to claim 1, wherein the billing unit charges when the other home appliance requests the recognition unit to perform voice recognition.
前記家電機器は、The home appliance is
前記家電機器に接続された他の家電機器の少なくとも1つの機器が前記課金手段を有し、  At least one of the other household electrical appliances connected to the household electrical appliance has the charging means,
前記課金手段を有さない他の家電機器と前記課金手段を有する他の家電機器とが通信可能に接続されていることを特徴とする請求項12に記載の家電機器システム。  13. The home electric appliance system according to claim 12, wherein another electric home appliance not having the charging unit and another electric home appliance having the charging unit are communicably connected.
音声認識機能を有する他の家電機器と通信可能に接続された家電機器であって、A household electrical appliance that is communicably connected to another household electrical appliance having a voice recognition function,
前記家電機器は、  The home appliance is
音声情報が入力される入力手段と、  An input means for inputting voice information;
前記入力された音声情報の音声認識を行う認識手段と、  Recognition means for performing speech recognition of the input speech information;
少なくとも前記他の家電機器が有するキーワード情報を含むプロファイル情報を格納したプロファイル情報格納手段と、  Profile information storage means storing profile information including keyword information possessed by at least the other home appliances;
前記音声認識結果である単語が前記キーワード情報に含まれる場合には、前記単語をキーワード情報として有する他の家電機器に、前記音声認識結果を通知する通知手段とを備えた家電機器。  A home appliance comprising a notification means for notifying another home appliance having the word as keyword information when the word that is the speech recognition result is included in the keyword information.
家電機器と、当該家電機器と通信可能に、音声認識機能を有する他の家電機器とを備えた家電機器システムにおける家電機器の音声認識方法であって、A speech recognition method for a home appliance in a home appliance system including a home appliance and another home appliance having a voice recognition function so as to communicate with the home appliance,
音声情報が入力される入力ステップと、  An input step in which audio information is input;
認識手段が、前記入力された音声情報の音声認識を行う認識ステップと、  A recognition step in which a recognition means performs voice recognition of the input voice information;
通知手段が、少なくとも前記他の家電機器が有するキーワード情報を含むプロファイル情報を参照して、前記音声認識結果である単語が前記キーワード情報に含まれる場合には、前記単語をキーワード情報として有する他の家電機器に、前記音声認識結果を通知する通知ステップとを有する音声認識方法。  The notification means refers to at least profile information including keyword information included in the other home appliances, and when the word that is the voice recognition result is included in the keyword information, A voice recognition method comprising: a notification step of notifying the home appliance of the voice recognition result.
判定手段が、前記認識ステップでの音声認識結果について、前記他の家電機器への前記音声情報の音声認識の依頼が必要かどうかを判定する判定ステップと、A determination step for determining whether or not a voice recognition request for the voice information to the other household electrical appliance is necessary for the voice recognition result in the recognition step;
前記判定ステップにおいて、音声認識の依頼が必要であると判定された場合、  In the determination step, if it is determined that a voice recognition request is required,
送信手段が、前記他の家電機器に、前記音声情報の音声認識の依頼を送信する送信ステップと、A transmitting step for transmitting a request for voice recognition of the voice information to the other home appliance;
確定手段が、前記認識ステップの音声認識結果と、前記他の家電機器から送信された音声認識の結果とに基づいて、前記音声情報に対する音声認識結果を確定する確定ステップとを有する請求項15に音声認識方法。  The confirmation unit includes a confirmation step of confirming a speech recognition result for the speech information based on a speech recognition result of the recognition step and a speech recognition result transmitted from the other home appliance. Speech recognition method.
前記プロファイル情報は、前記他の家電機器が音声認識に用いる辞書ファイルの情報を含んでおり、The profile information includes information on a dictionary file used for voice recognition by the other home appliances,
前記送信ステップは、前記送信手段が、前記他の家電機器の辞書ファイルの情報を参照して、前記認識ステップで音声認識に用いる辞書ファイルと言語モデルが近い辞書ファイルを有する他の家電機器に、前記音声情報の依頼を送信することを特徴とする請求項15に記載の音声認識方法。  In the transmission step, the transmission means refers to the information of the dictionary file of the other home appliance, and the other home appliance having a dictionary file whose language model is close to the dictionary file used for speech recognition in the recognition step. The voice recognition method according to claim 15, wherein the voice information request is transmitted.
JP2004077477A 2004-03-18 2004-03-18 Home appliance system, home appliance and voice recognition method Expired - Fee Related JP4581441B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004077477A JP4581441B2 (en) 2004-03-18 2004-03-18 Home appliance system, home appliance and voice recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004077477A JP4581441B2 (en) 2004-03-18 2004-03-18 Home appliance system, home appliance and voice recognition method

Publications (3)

Publication Number Publication Date
JP2005266192A JP2005266192A (en) 2005-09-29
JP2005266192A5 true JP2005266192A5 (en) 2007-05-10
JP4581441B2 JP4581441B2 (en) 2010-11-17

Family

ID=35090817

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004077477A Expired - Fee Related JP4581441B2 (en) 2004-03-18 2004-03-18 Home appliance system, home appliance and voice recognition method

Country Status (1)

Country Link
JP (1) JP4581441B2 (en)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5041934B2 (en) * 2006-09-13 2012-10-03 本田技研工業株式会社 robot
JP4962416B2 (en) * 2008-06-03 2012-06-27 日本電気株式会社 Speech recognition system
US8364481B2 (en) * 2008-07-02 2013-01-29 Google Inc. Speech recognition with parallel recognition tasks
JP2010130223A (en) * 2008-11-26 2010-06-10 Fujitsu Ten Ltd Voice activation system and voice activation method
JP2011232619A (en) * 2010-04-28 2011-11-17 Ntt Docomo Inc Voice recognition device and voice recognition method
CN102945672B (en) * 2012-09-29 2013-10-16 深圳市国华识别科技开发有限公司 Voice control system for multimedia equipment, and voice control method
JP6155592B2 (en) 2012-10-02 2017-07-05 株式会社デンソー Speech recognition system
USRE49014E1 (en) 2013-06-19 2022-04-05 Panasonic Intellectual Property Corporation Of America Voice interaction method, and device
US9311298B2 (en) 2013-06-21 2016-04-12 Microsoft Technology Licensing, Llc Building conversational understanding systems using a toolset
JP6355939B2 (en) * 2014-02-28 2018-07-11 シャープ株式会社 Voice server, control method therefor, and voice system
US9529794B2 (en) 2014-03-27 2016-12-27 Microsoft Technology Licensing, Llc Flexible schema for language model customization
WO2017095476A1 (en) * 2015-12-01 2017-06-08 Nuance Communications, Inc. Representing results from various speech services as a unified conceptual knowledge base
JP2017107333A (en) * 2015-12-08 2017-06-15 キヤノン株式会社 Communication apparatus and communication apparatus control method
CN107086949A (en) * 2016-02-15 2017-08-22 北京北信源软件股份有限公司 It is a kind of to be used for people and the auxiliary intelligent apparatus of smart machine interactive operation
CN107085463A (en) * 2016-02-15 2017-08-22 北京北信源软件股份有限公司 A kind of the smart machine control system and method for supporting natural language information to interact
KR102419374B1 (en) 2017-07-21 2022-07-11 삼성전자주식회사 Electronic apparatus for processing user utterance for controlling an external electronic apparatus and controlling method thereof
US11315553B2 (en) 2018-09-20 2022-04-26 Samsung Electronics Co., Ltd. Electronic device and method for providing or obtaining data for training thereof

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0911808B1 (en) * 1997-10-23 2002-05-08 Sony International (Europe) GmbH Speech interface in a home network environment
JP4201869B2 (en) * 1998-02-24 2008-12-24 クラリオン株式会社 CONTROL DEVICE AND METHOD BY VOICE RECOGNITION AND RECORDING MEDIUM CONTAINING CONTROL PROGRAM BY VOICE RECOGNITION
JP2000075887A (en) * 1998-08-31 2000-03-14 Sony Corp Device, method and system for pattern recognition
JP3477432B2 (en) * 2000-08-04 2003-12-10 旭化成株式会社 Speech recognition method and server and speech recognition system
JP3838029B2 (en) * 2000-12-18 2006-10-25 セイコーエプソン株式会社 Device control method using speech recognition and device control system using speech recognition
US6898567B2 (en) * 2001-12-29 2005-05-24 Motorola, Inc. Method and apparatus for multi-level distributed speech recognition
JP4086280B2 (en) * 2002-01-29 2008-05-14 株式会社東芝 Voice input system, voice input method, and voice input program
JP2003295893A (en) * 2002-04-01 2003-10-15 Omron Corp System, device, method, and program for speech recognition, and computer-readable recording medium where the speech recognizing program is recorded

Similar Documents

Publication Publication Date Title
JP4581441B2 (en) Home appliance system, home appliance and voice recognition method
JP2005266192A5 (en)
US9825773B2 (en) Device control by speech commands with microphone and camera to acquire line-of-sight information
US10455029B2 (en) Internet of things (IOT) device discovery platform
US7184960B2 (en) Speech recognition command via an intermediate mobile device
US20200135191A1 (en) Digital Voice Butler
WO2019101083A1 (en) Voice data processing method, voice-based interactive device, and storage medium
US20210241775A1 (en) Hybrid speech interface device
CN102792294B (en) The system and method for the hybrid processing in natural language speech service environment
US20180122366A1 (en) Information processing method and non-temporary storage medium for system to control at least one device through dialog with user
CN110489440A (en) Data query method and apparatus
CN111028839B (en) Smart home control method and device and electronic equipment
CN112913219A (en) Dynamic termination point communication channel
CN205508398U (en) Intelligent robot with high in clouds interactive function
CN112398723B (en) Cross-platform communication method, server device and electronic device
CN109285541B (en) Speech recognition system and speech recognition method
CN114830614A (en) Function as service cloud chat robot for two-way communication system
JP6920398B2 (en) Continuous conversation function in artificial intelligence equipment
US20180122375A1 (en) Information processing method and non-temporary storage medium for system to control at least one device through dialog with user
JP2020087352A (en) Dialogue control method, dialogue control program, dialogue control device, information presentation method, and information presentation device
JP2022523379A (en) Intent-driven contact center
US11862178B2 (en) Electronic device for supporting artificial intelligence agent services to talk to users
KR102599948B1 (en) ELECTRONIC APPARATUS AND WiFi CONNECTING METHOD THEREOF
CN111258529A (en) Electronic device and control method thereof
CN115658875B (en) Data processing method based on chat service and related products