JP6123121B2 - Voice control system and program - Google Patents
Voice control system and program Download PDFInfo
- Publication number
- JP6123121B2 JP6123121B2 JP2011227492A JP2011227492A JP6123121B2 JP 6123121 B2 JP6123121 B2 JP 6123121B2 JP 2011227492 A JP2011227492 A JP 2011227492A JP 2011227492 A JP2011227492 A JP 2011227492A JP 6123121 B2 JP6123121 B2 JP 6123121B2
- Authority
- JP
- Japan
- Prior art keywords
- command
- control
- conversion
- voice
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本発明は、自然文を音声で入力することにより、機器の動作を制御するシステムに関する。 The present invention relates to a system for controlling the operation of a device by inputting a natural sentence by voice.
この種の従来例として、特開2000−56944号公報が開示されている。この公報に開示された発明によると、段落0090に記載されているように、音声で自然文を入力することができ、例えば、段落0048に記載されているように「ビデオのチャンネルを1にして」という自然文を入力すると、段落0051に記載されているように、「電源をオンする」というコマンドと、「チャンネルを1にする」という複数のコマンドを連続して実行することが可能となっている。
As a conventional example of this type, Japanese Patent Laid-Open No. 2000-56944 is disclosed. According to the invention disclosed in this publication, a natural sentence can be input by voice as described in paragraph 0090. For example, as described in paragraph 0048, “video channel is set to 1”. ”Is entered, as described in paragraph 0051, a command“ turn on power ”and a plurality of commands“ set
しかし、この発明で解釈できる自然文は、「電源をオンする」「チャンネルを1にする」といった、従来のリモコンの個々のボタンに対応する要求に限られ、例えば、「ニュースを見たい」といった自然文の要求に対しては応えることができなかった。
However, natural sentences that can be interpreted by the present invention are limited to requests corresponding to individual buttons of a conventional remote controller, such as “turn on power” and “set
本発明は、1つの自然文によって複数のコマンドを実行可能とした音声制御システムにおいて、従来よりも幅広い表現の自然文を受け入れることを可能とし、ユーザの利便性を向上することを課題とする。 An object of the present invention is to improve a user's convenience by enabling a speech control system that can execute a plurality of commands by one natural sentence to accept a natural sentence having a wider expression than before.
この課題を解決するため、本発明は以下のように構成する。
1.音声入力された1つの自然文による希望に応じて当該希望に沿った動作を制御対象機器に指令する複数の連続する制御コマンドを生成し、当該複数の連続する制御コマンドを制御対象機器に出力する音声制御システムにおいて、
前記自然文から抽出される言葉と前記制御コマンドとを直接結びつけるコマンド変換辞書を記憶手段に備えると共に、前記制御コマンドに直接結びつかない言葉を前記制御コマンド生成用のパラメータに変換するための変換補助情報を記憶手段に記憶し、
前記制御コマンドに直接結びつかない言葉については前記変換補助情報を参照して前記制御コマンド生成用のパラメータに変換し、前記制御コマンドを生成するコマンド変換手段を備えた、音声制御システム。
In order to solve this problem, the present invention is configured as follows.
1. Generates a plurality of continuous control commands for instructing the device to be controlled to perform an action in accordance with the desire according to a request by one natural sentence inputted by voice, and outputs the plurality of continuous control commands to the device to be controlled. In the voice control system,
Conversion auxiliary information for converting a word that is not directly connected to the control command into a parameter for generating the control command, and having a command conversion dictionary that directly connects the word extracted from the natural sentence and the control command. Is stored in the storage means,
A voice control system comprising command conversion means for generating a control command by converting a word that is not directly connected to the control command into a parameter for generating the control command with reference to the conversion auxiliary information.
本発明によれば、1つの自然文によって複数のコマンドを実行可能とした音声制御システムにおいて、従来よりも幅広い表現の自然文を受け入れることを可能とし、ユーザの利便性を向上することができる。 According to the present invention, in a voice control system in which a plurality of commands can be executed by one natural sentence, it is possible to accept natural sentences with a wider expression than before, and it is possible to improve user convenience.
[第1実施形態] [First Embodiment]
以下に本発明の第1実施形態を説明する。図1は、本実施形態の構成図である。音声入力手段101は、マイクを備え、自然文の音声の入力を受け付ける。また、音声入力手段101は、入力された音声信号をデジタル変換し、音声認識手段102に入力する。音声認識手段102は、既知の音声認識処理に基づき、自然文の音声から複数の言葉を抽出し、コマンド変換手段103に入力する。音声認識処理により自然文から単語を抽出する従来例としては例えば、特許第3581044号公報などがある。コマンド変換手段103は、音声認識手段102において抽出された複数の言葉をコマンド変換辞書に照合し、当該言葉の元となる自然文に対応して実行すべき複数のコマンドを決定する。同変換辞書は、コマンド変換辞書記憶手段104に記憶されている。コマンド出力手段105は、コマンド変換手段103において実行を決定された複数のコマンドを、当該コマンドを表す信号に変換し、制御対象機器に宛てて出力する。
The first embodiment of the present invention will be described below. FIG. 1 is a configuration diagram of this embodiment. The voice input means 101 includes a microphone and receives an input of a natural sentence voice. The
また、コマンド変換手段103は、自然文に対応するコマンドを決定する際、変換補助情報を参照する。変換補助情報とは、コマンド変換辞書を参照しても制御対象機器用のコマンドに直接結び付けることのできない言葉を、制御対象機器用のコマンドに結びつけるための補助情報である。例えば、「ニュース」という言葉から現在ニュースを放送している放送チャンネルを導くための番組表の情報が含まれる。変換補助情報は、変換補助情報記憶手段106に記憶されている。
Further, the command conversion means 103 refers to conversion auxiliary information when determining a command corresponding to a natural sentence. The conversion auxiliary information is auxiliary information for linking a word that cannot be directly linked to the command for the control target device with reference to the command conversion dictionary to the command for the control target device. For example, information of a program guide for deriving a broadcast channel that is currently broadcasting news from the word “news” is included. The conversion auxiliary information is stored in the conversion auxiliary
また、コマンド変換手段103は、自然文に対応して実行するコマンドを決定するにあたり、補助信号入力手段107から入力される情報を参照する。補助信号入力手段107は、ユーザが発する音声以外の信号を取得するもので、当該信号の種別に応じた適切なセンサを備えている。例えば、補助信号入力手段107は、カメラを備え、ユーザの手の姿勢や動作を撮影する。また、補助信号入力手段107は、捉えた補助信号をデジタル変換し、補助信号認識手段108に入力する。補助信号認識手段108は、補助信号入力手段107から入力された情報のパターンを認識し、当該認識したパターンの種別をコマンド変換手段103に入力する。例えば、補助信号入力手段107のカメラが捉えたユーザの動作が所定のジェスチャーであることを認識し、当該認識結果をコマンド変換手段103に通知する。ユーザの動作をカメラで捉え、当該動作を認識し制御入力とする従来例としては、例えば、特許第4457983号公報がある。
In addition, the
コマンド変換手段103には、学習指示手段109が接続されている。学習指示手段109は、ユーザが操作可能な操作子を備えている。この操作子は、通常制御対象機器を制御するために用いる操作子であり、例えば、当該制御対象機器用のリモコンのボタンである。コマンド変換手段103は、音声認識手段102によって自然文から抽出された言葉を取得した後、学習指示手段109の操作子が操作されたことを検出すると、当該取得した言葉と、当該操作された操作子に対応するコマンドとを関連付け、コマンド変換辞書に登録する。
A
また、コマンド出力手段105には、出力先記憶手段110が接続されている。出力先記憶手段110には、コマンドをどの制御対象機器に出力すべきかを表す制御対象機器の識別子が設定されるようになっている。コマンド出力手段105は、出力先記憶手段に設定されている制御対象機器の識別子に応じて、コマンドを当該制御対象機器の解釈可能な赤外線などの信号に変換して出力する。コマンド出力手段105は、制御対象機器の仕様に対応したコマンド信号の出力デバイスを備えている。
The
この図1において、音声認識手段102、コマンド変換手段103、コマンド出力手段105および補助信号認識手段108は、それぞれ専用プロセッサにより構成されてもよいし、汎用プロセッサがプログラムを実行することにより、各手段を実現するように構成してもよい。また、各記憶手段104,106,110は、データを記憶できる記憶領域を備えていればよく、素子や媒体の種類は限定されない。 In FIG. 1, the voice recognition means 102, the command conversion means 103, the command output means 105, and the auxiliary signal recognition means 108 may each be constituted by a dedicated processor, or each means by a general-purpose processor executing a program. You may comprise so that. Moreover, each storage means 104, 106, and 110 should just be provided with the memory area which can memorize | store data, and the kind of element or medium is not limited.
図2は、コマンド変換辞書の一例である。コマンド変換辞書は、言葉と、コマンドとを関連付けている。また、コマンドには実行の優先順位が関連付けられている。また、コマンドには、対応する学習指示手段の操作子が関連付けられている。1つのコマンドには、複数の言葉を関連付けることができるようになっている。例えば、電源オンのコマンドに対応する言葉として、「つける」「オン」「Turn on」といった複数の言葉が関連付けられている。また、「見る」「Watch」という言葉に対し、「テレビ電源オン」というコマンドが関連付けられ、一つの動詞により、複数の制御対象機器の中から特定の制御対象機器(テレビ)を選択して電源を入れることが可能となっている。また、「ニュース」「音楽」「Music」といった、制御対象機器宛てのコマンドに直接結びつかない言葉に対しては、コマンド変換手段103が行う「チャンネル選択」プロセスの起動が紐付けられている。また、「テレビ」「ラジオ」「ビデオ」といった複数の制御対象機器のいずれかを表す言葉には、コマンド変換手段103が行う「機器選択」プロセスの起動が紐付けられている。
FIG. 2 is an example of a command conversion dictionary. The command conversion dictionary associates words with commands. In addition, execution priority is associated with the command. In addition, an operator of the corresponding learning instruction unit is associated with the command. A single command can be associated with a plurality of words. For example, a plurality of words such as “ON”, “ON”, and “Turn on” are associated as words corresponding to a power-on command. In addition, the words “TV” and “Watch” are associated with the command “TV power on”, and a single verb selects a specific control target device (TV) from a plurality of control target devices. It is possible to put. For words that are not directly related to the command addressed to the control target device, such as “news”, “music”, and “Music”, the activation of the “channel selection” process performed by the
各コマンド又はプロセスには優先順位が与えられ、機器選択は1番、電源オンは2番、チャンネル選択は3番となっている。また、電源オンのコマンドには、電源ボタンの操作子が関連付けられ、上述したように或る言葉が入力された後に電源ボタンが操作されると、当該言葉が新たにコマンド変換辞書に登録され、電源オンのコマンドに紐づけられる。同様に、テレビ電源オンのコマンドには、テレビ電源オンのボタンが紐付けられている。 Priorities are given to each command or process, device selection is No. 1, power-on is No. 2, and channel selection is No. 3. Further, the power button command is associated with the power button operator, and when a power button is operated after a word is input as described above, the word is newly registered in the command conversion dictionary, It is tied to the power-on command. Similarly, a TV power on button is associated with the TV power on command.
本システムを稼働状態に設定し、ユーザが音声入力手段101から自然文の音声を入力すると、音声認識手段102が、入力された自然文から言葉を抽出し、コマンド変換手段103に入力する。例えば、「テレビつけて」と発音すると、「テレビ」と「つける」の言葉が認識され、コマンド変換手段103に入力される。コマンド変換手段103は、コマンド変換辞書を参照し、「テレビ」の語に基づいて優先順位1番の機器選択プロセスを起動し、出力先記憶手段110に制御対象機器として特定のテレビを設定する。次いで、「つける」の語に基づき、優先順位2番として電源オンコマンドを発信するように、コマンド出力手段105に指示する。コマンド出力手段105は、出力先記憶手段110の設定に基づき、電源オンのコマンドを制御対象機器であるテレビが解釈可能な信号に変換し、当該制御対象機器に宛てて出力する。これにより、テレビの電源が入る。
When this system is set to the operating state and the user inputs a natural sentence voice from the
また、例えば「ニュースを見たい」と発音すると、「ニュース」と「見る」の言葉が認識され、コマンド変換手段103に入力される。コマンド変換手段103は、コマンド変換辞書を参照し、「見る」の語に基づき、優先順位2番のテレビ電源オンのコマンドを実行する。即ち、出力先記憶手段110に制御対象機器として特定のテレビを設定する。次いで、電源オンコマンドを発信するように、コマンド出力手段105に指示する。コマンド出力手段105は、出力先記憶手段110の設定に基づき、電源オンのコマンドを制御対象機器である特定のテレビが解釈可能な信号に変換し、当該制御対象機器に宛てて出力する。これにより、テレビの電源が入る。続いて、コマンド変換手段103は、「ニュース」の語に基づき、優先順位3番の「チャンネル選択」プロセスを実行する。
For example, when “pronounce news” is pronounced, the words “news” and “see” are recognized and input to the command conversion means 103. The command conversion means 103 refers to the command conversion dictionary and executes a TV power-on command with the second highest priority based on the word “view”. That is, a specific television is set as a control target device in the output
即ち、コマンド変換手段103は、まず、変換補助情報を参照し、変換補助情報として記憶されている現在時刻の情報を得る。次に、変換補助情報として記憶されている当日のテレビ番組表を参照し、現在の時刻にニュースが放送されているテレビチャンネルを判定する。番組表の各番組には、ニュース、映画、サッカーなどの番組の種別が予め埋め込まれているものとする。次いで、コマンド変換手段103は、ニュースを放送しているチャンネルにテレビのチャンネルを切り替えるためのコマンドをコマンド出力手段105に入力する。コマンド出力手段105は、出力先記憶手段110を参照し、当該コマンドを制御対象機器であるテレビが解釈可能な信号に変換し、当該制御対象機器宛てに出力する。これにより、テレビのチャンネルが切り替わり、ニュース番組が表示される。
That is, the
コマンド変換手段103は、補助信号入力手段107からの入力に基づいてコマンドの実行を決定してもよい。例えば、補助信号入力手段107から入力されたユーザのジェスチャーが所定のジェスチャーに一致する場合に限りコマンドを実行し、所定のジェスチャーが無い場合は、単に会話の音声を拾っただけで、制御対象機器を制御する意思は無いものと判断し、コマンドの実行を中止してもよい。また、例えば、音声から電源オンのコマンドを把握し、どの制御対象機器の電源をオンするかについては、補助信号入力手段107から入力されたジェスチャー等に基づいて判定するようにしてもよい。
The
コマンド出力手段105は、制御対象機器がウェブブラウザを実行している場合、コマンドを当該ウェブブラウザにおいて解釈可能なスクリプトに変換して出力する。この場合、連続して実行すべき複数のコマンドを1つのスクリプトの中に記述する。制御対象機器がコンピュータネットワーク上にある場合、コマンド出力手段105がLANに対応したネットワークアダプタを備える構成とする。
When the control target device is executing a web browser, the
本実施形態の音声制御システムは、制御対象機器用のリモコンに内蔵することができる。また、携帯端末装置に内蔵することができる。 The voice control system of the present embodiment can be built in a remote controller for a control target device. Further, it can be built in a portable terminal device.
以上説明した本実施形態によれば、音声による1つの自然文の発生により、例えば、テレビの電源を入れてニュースを放送中のチャンネルにあわせる、といった制御をおこなうことができる。よって、1つの自然文によって複数のコマンドを実行可能とした音声制御システムにおいて、従来よりも幅広い表現の自然文を受け入れることを可能とし、ユーザの利便性を向上することができる。 According to the present embodiment described above, it is possible to perform control such as turning on the television and adjusting the news to the channel being broadcast by the occurrence of one natural sentence by voice. Therefore, in a voice control system in which a plurality of commands can be executed by one natural sentence, it is possible to accept a natural sentence with a wider expression than before, and the convenience of the user can be improved.
[第2実施形態]
次に、本発明の第2実施形態を説明する。図3は、本実施形態の構成図である。本実施形態において、音声制御システムは、デバイス100と、サーバ200とによって構成される。デバイス100の基本構成は、第1実施形態とほぼ同一である。デバイス100が、サーバ200との通信手段111を備えている点と、コマンド変換手段103が、ローカルにおいて言葉からコマンドを決定できない場合に、サーバに処理を移譲する点が第1実施形態と異なっている。その他の各手段の動作は第1実施形態と同一である。
[Second Embodiment]
Next, a second embodiment of the present invention will be described. FIG. 3 is a configuration diagram of the present embodiment. In the present embodiment, the voice control system includes the
本実施形態において、デバイス100のコマンド変換手段103は、ローカルで言葉に対応するコマンドを決定できない場合、音声からコマンドへの変換をサーバ200に依頼する。例えば、コマンド変換辞書に登録されていない言葉が抽出された場合や、コマンド変換辞書に登録されていない他国の言語が抽出された場合である。この場合、コマンド変換手段103は、音声入力手段101に入力された自然文の音声を記録した音声ファイルを音声認識手段102から取得する。また、コマンド変換手段103は、補助信号入力手段107から入力された補助信号の情報を記録した情報ファイルを補助信号認識手段108から取得する。そして、コマンド変換手段103は、取得した自然文の音声ファイルと、補助信号の情報ファイルとを通信手段111を介してサーバ200に出力し、コマンドへの変換をサーバ200に依頼する。デバイスの通信手段111およびサーバの通信手段211は、IPネットワークに対応した通信デバイスを備えている。
In this embodiment, the command conversion means 103 of the
一方、サーバ200は、当該通信手段211と、コマンド変換手段203とを備えている。また、サーバ200は、コマンド変換辞書記憶手段204と、変換補助情報記憶手段206とを備えている。コマンド変換手段203は、デバイス100のコマンド変換手段103と同等の機能を備えるほか、音声認識手段102の機能と、補助信号認識手段108の機能も備えている。また、コマンド変換辞書記憶手段204および変換補助情報記憶手段206は、デバイス100が持っているコマンド変換辞書の情報および変換補助情報に加え、デバイス100が持っていない情報も大量に記憶している。
On the other hand, the
デバイス100において言葉および補助情報に基づくコマンドの決定ができなかった場合、デバイス100のコマンド変換手段103は、デバイス100において取得した音声ファイルと、補助情報の情報ファイルとを通信手段111を介してサーバ200に送信する。サーバ200は、デバイス100から送信された音声ファイルおよび補助情報の情報ファイルを通信手段211を介して受信し、記憶手段に蓄積する。サーバ200のコマンド変換手段203は、デバイス100よりも情報量の多いコマンド変換辞書および変換補助情報を参照し、デバイス100ではコマンドに変換することのできなかった音声および補助情報を適切なコマンドに変換する。そして、サーバ200において変換されたコマンドは、通信手段211を介して送信され、デバイス100の通信手段111に受信される。
When the
デバイス100のコマンド変換手段103は、サーバ200から受信したコマンドをコマンド出力手段105に渡す。コマンド出力手段105は、ローカルの出力先記憶手段110に設定されている出力先を参照し、サーバ200から受信したコマンドを当該出力先の制御対象機器の解釈可能なコマンド信号に変換し、当該制御対象機器に宛てて出力する。これにより、音声入力された自然文および補助信号に応じて制御対象機器の動作が制御される。
The
この第2実施形態によれば、第1実施形態の効果に加え、デバイス100単体ではコマンドに変換できない音声および補助情報をサーバのもつ豊富な情報量によってコマンドに変換することができる。また、コマンドを制御対象機器向けの信号に変換する処理はローカルで受け持つので、具体的にどのような機器を制御するのか、というプライベートな情報はサーバに対して隠すことができる。
According to the second embodiment, in addition to the effects of the first embodiment, voice and auxiliary information that cannot be converted into a command by the
以上の説明では、サーバ200で変換したコマンドを、当該コマンドの変換を依頼したデバイス100に戻すように構成しているが、サーバ200は、変換したコマンドをデバイス100以外の他のデバイスに宛てて送信するようにしてもよい。この場合、送信先のデバイスのIPアドレスをデバイス100からサーバ200に対して指示するように構成してもよい。
In the above description, the command converted by the
100 デバイス
101 音声入力手段
102 音声認識手段
103 コマンド変換手段
104 コマンド変換辞書記憶手段
105 コマンド出力手段
106 変換補助情報記憶手段
107 補助信号入力手段
108 補助信号認識手段
109 学習指示手段
110 出力先記憶手段
200 サーバ
203 コマンド変換手段
204 コマンド変換辞書記憶手段
206 変換補助情報記憶手段
211 通信手段
100
Claims (7)
前記自然文から抽出される言葉と前記制御コマンドとを直接結びつけるコマンド変換辞書を記憶手段に備えると共に、前記制御コマンドに直接結びつかない言葉を前記制御コマンド生成用のパラメータに変換するための変換補助情報を記憶手段に記憶し、
前記制御コマンドに直接結びつかない言葉については前記変換補助情報を参照して前記制御コマンド生成用のパラメータに変換し、前記制御コマンドを生成するコマンド変換手段を備え、
前記コマンド変換辞書は、前記複数の各制御コマンドに実行の優先順位を関連付けて登録しており、
前記コマンド変換手段は、前記1つの自然文に基づいて生成される前記複数の連続する制御コマンドを前記優先順位に従って出力するようにコマンド出力手段に指示する、音声制御システム。 In a voice control system for generating a plurality of continuous control commands for instructing a control target device to perform an action in accordance with one natural sentence inputted by voice, and outputting the plurality of continuous control commands to the control target device.
Conversion auxiliary information for converting a word that is not directly connected to the control command into a parameter for generating the control command, and having a command conversion dictionary that directly connects the word extracted from the natural sentence and the control command. Is stored in the storage means,
For words that are not directly linked to the control command, refer to the conversion auxiliary information, convert the control command to a parameter for generating the control command, comprising command conversion means for generating the control command,
The command conversion dictionary registers the plurality of control commands in association with execution priorities,
The voice conversion system, wherein the command conversion means instructs the command output means to output the plurality of consecutive control commands generated based on the one natural sentence according to the priority order.
ユーザが発する音声以外の補助信号を入力する補助信号入力手段を備え、前記コマンド変換手段は、前記言葉と前記補助信号とに基づいて前記制御コマンドを生成する、音声制御システム。 The voice control system according to claim 1.
A voice control system comprising auxiliary signal input means for inputting an auxiliary signal other than voice uttered by a user, wherein the command conversion means generates the control command based on the word and the auxiliary signal.
前記サーバは、前記デバイスが記憶する前記コマンド変換辞書の情報量を超える情報量のサーバ側コマンド変換辞書を記憶手段に記憶すると共に、前記デバイスが記憶する前記変換補助情報の情報量を超える情報量のサーバ側変換補助情報を記憶手段に記憶し、
前記デバイスは、当該デバイスに記憶する前記コマンド変換辞書又は変換補助情報により前記言葉に基づいて前記制御コマンドを生成できない場合、前記自然文の音声情報を前記サーバに送信し、
前記サーバは、前記デバイスから受信した前記自然文の音声情報に基づいて前記言葉を抽出し、当該言葉をサーバ側コマンド変換辞書及びサーバ側変換補助情報を参照して制御コマンドに変換し、前記デバイスに送信し、
前記デバイスは、前記サーバから受信した制御コマンドを制御対象機器に出力する、音声制御システム。 A voice control system according to claim 1 or 2 is provided as a device, and a server that communicates with the device is provided.
The server stores a server-side command conversion dictionary having an information amount exceeding the information amount of the command conversion dictionary stored in the device in the storage unit, and an information amount exceeding the information amount of the conversion auxiliary information stored in the device Server side conversion auxiliary information is stored in the storage means,
When the device cannot generate the control command based on the word by the command conversion dictionary or conversion auxiliary information stored in the device, the device transmits the natural sentence speech information to the server,
The server extracts the word based on the natural sentence audio information received from the device, converts the word into a control command with reference to a server side command conversion dictionary and server side conversion auxiliary information, and the device To
The voice control system, wherein the device outputs a control command received from the server to a control target device.
前記デバイスは、前記サーバに前記音声情報を送信する際に、前記補助信号入力手段から入力された補助信号に基づく情報も前記サーバに送信し、
前記サーバは、前記言葉と前記補助信号に基づく情報との双方に基づいて前記制御コマンドを生成する、音声制御システム。 The voice control system according to claim 3.
When the device transmits the audio information to the server, the device also transmits information based on the auxiliary signal input from the auxiliary signal input means to the server,
The voice control system, wherein the server generates the control command based on both the word and information based on the auxiliary signal.
前記デバイスは、前記サーバから制御コマンドを受信した後、当該制御コマンドを前記制御対象機器の解釈可能なコマンド信号に変換し、当該制御対象機器に出力する、音声制御システム。 The voice control system according to claim 3 or 4,
After receiving a control command from the server, the device converts the control command into a command signal interpretable by the control target device, and outputs the command signal to the control target device.
前記制御対象機器がスクリプトを実行する場合、前記複数の連続する制御コマンドを1つのスクリプトに記述して前記制御対象機器に出力する、音声制御システム。 The voice control system according to any one of claims 1 to 5,
When the control target device executes a script, the voice control system describes the plurality of continuous control commands in one script and outputs the script to the control target device.
前記自然文から抽出される言葉と前記制御コマンドとを直接結びつけるコマンド変換辞書を記憶手段に備えると共に、前記制御コマンドに直接結びつかない言葉を前記制御コマンド生成用のパラメータに変換するための変換補助情報を記憶手段に記憶し、
前記コマンド変換辞書は、前記複数の各制御コマンドに実行の優先順位を関連付けて登録しており、
前記制御コマンドに直接結びつかない言葉については前記変換補助情報を参照して前記制御コマンド生成用のパラメータに変換し、前記制御コマンドを生成する処理と、
前記1つの自然文に基づいて生成される前記複数の連続する制御コマンドを前記優先順位に従って出力するように指示する処理と、
をコンピュータに実行させる、音声制御プログラム。 In a voice control system for generating a plurality of continuous control commands for instructing a control target device to perform an action in accordance with one natural sentence inputted by voice, and outputting the plurality of continuous control commands to the control target device.
Conversion auxiliary information for converting a word that is not directly connected to the control command into a parameter for generating the control command, and having a command conversion dictionary that directly connects the word extracted from the natural sentence and the control command. Is stored in the storage means,
The command conversion dictionary registers the plurality of control commands in association with execution priorities,
For a word that is not directly linked to the control command, refer to the conversion auxiliary information, convert the control command to a parameter for generating the control command, and generate the control command;
A process of instructing to output the plurality of consecutive control commands generated based on the one natural sentence according to the priority order;
A voice control program that causes a computer to execute.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011227492A JP6123121B2 (en) | 2011-10-14 | 2011-10-14 | Voice control system and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011227492A JP6123121B2 (en) | 2011-10-14 | 2011-10-14 | Voice control system and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013088535A JP2013088535A (en) | 2013-05-13 |
JP6123121B2 true JP6123121B2 (en) | 2017-05-10 |
Family
ID=48532524
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011227492A Active JP6123121B2 (en) | 2011-10-14 | 2011-10-14 | Voice control system and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6123121B2 (en) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112014006409T5 (en) * | 2014-02-26 | 2016-12-08 | Mitsubishi Electric Corporation | Vehicle control device and vehicle control method |
JP2015200873A (en) * | 2014-04-04 | 2015-11-12 | 株式会社デンソー | Voice recognition system and voice recognition program |
US10170123B2 (en) * | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
JP6501217B2 (en) * | 2015-02-16 | 2019-04-17 | アルパイン株式会社 | Information terminal system |
US9953648B2 (en) | 2015-05-11 | 2018-04-24 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling the same |
JP6922178B2 (en) * | 2016-09-30 | 2021-08-18 | 株式会社リコー | Speech recognition system, information processing device, program |
JP6908461B2 (en) * | 2016-11-02 | 2021-07-28 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | Information processing method and program |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | Low-latency intelligent automated assistant |
JP6543676B2 (en) * | 2017-11-01 | 2019-07-10 | ソフトバンク株式会社 | Transmission control device and program |
JP6516938B1 (en) * | 2018-06-15 | 2019-05-22 | 三菱電機株式会社 | DEVICE CONTROL DEVICE, DEVICE CONTROL SYSTEM, DEVICE CONTROL METHOD, AND DEVICE CONTROL PROGRAM |
CN111048078A (en) * | 2018-10-15 | 2020-04-21 | 阿里巴巴集团控股有限公司 | Voice composite instruction processing method and system, voice processing device and medium |
CN109788360A (en) * | 2018-12-12 | 2019-05-21 | 百度在线网络技术(北京)有限公司 | Voice-based TV control method and device |
TWI752474B (en) * | 2020-04-22 | 2022-01-11 | 莊連豪 | An accessible and intelligent voice recognition system and the control method |
US20230260508A1 (en) * | 2020-07-01 | 2023-08-17 | Nippon Telegraph And Telephone Corporation | Voice operation device, voice operation method and voice operation program |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06266779A (en) * | 1993-03-15 | 1994-09-22 | Hitachi Ltd | Controller |
JP2006154926A (en) * | 2004-11-25 | 2006-06-15 | Denso Corp | Electronic equipment operation system using character display and electronic apparatuses |
JP2007033901A (en) * | 2005-07-27 | 2007-02-08 | Nec Corp | System, method, and program for speech recognition |
JP2009020423A (en) * | 2007-07-13 | 2009-01-29 | Fujitsu Ten Ltd | Speech recognition device and speech recognition method |
JP5430382B2 (en) * | 2009-12-16 | 2014-02-26 | キヤノン株式会社 | Input device and method |
-
2011
- 2011-10-14 JP JP2011227492A patent/JP6123121B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013088535A (en) | 2013-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6123121B2 (en) | Voice control system and program | |
EP3754997B1 (en) | Method for controlling electronic apparatus based on voice recognition and motion recognition, and electronic apparatus applying the same | |
US9479911B2 (en) | Method and system for supporting a translation-based communication service and terminal supporting the service | |
JP5746111B2 (en) | Electronic device and control method thereof | |
JP6111030B2 (en) | Electronic device and control method thereof | |
JP5535298B2 (en) | Electronic device and control method thereof | |
US20140267933A1 (en) | Electronic Device with Embedded Macro-Command Functionality | |
EP2986015A1 (en) | Method for controlling electronic apparatus based on voice recognition and motion recognition, and electronic apparatus applying the same | |
EP2555538A1 (en) | Method for controlling electronic apparatus based on voice recognition and motion recognition, and electronic apparatus applying the same | |
JP2014532933A (en) | Electronic device and control method thereof | |
CN105141998B (en) | A kind of intelligent television voice remote controller control method and system based on DLNA | |
JP2004110613A (en) | Controller, control program, objective device, and control system | |
US20220046310A1 (en) | Information processing device, information processing method, and computer program | |
US20160294892A1 (en) | Storage Medium Storing Program, Server Apparatus, and Method of Controlling Server Apparatus | |
CN103269445B (en) | Intelligent television system control method | |
JP2007324866A (en) | Electronic apparatus and television receiver | |
CN104423992A (en) | Speech recognition startup method for display | |
CN112905149A (en) | Processing method of voice instruction on display device, display device and server | |
US20200379731A1 (en) | Voice assistant | |
CN113079400A (en) | Display device, server and voice interaction method | |
CN112817556A (en) | Switching method of voice scheme on display equipment, display equipment and control device | |
WO2022193735A1 (en) | Display device and voice interaction method | |
WO2022237381A1 (en) | Method for saving conference record, terminal, and server | |
KR20130079096A (en) | Electronic apparatus and method for controlling electronic apparatus thereof | |
JP7186036B2 (en) | Robot operation device and robot operation program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141014 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151006 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20151207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160614 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20160815 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161013 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170316 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6123121 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |