JP2008040075A - Robot apparatus and control method of robot apparatus - Google Patents
Robot apparatus and control method of robot apparatus Download PDFInfo
- Publication number
- JP2008040075A JP2008040075A JP2006213195A JP2006213195A JP2008040075A JP 2008040075 A JP2008040075 A JP 2008040075A JP 2006213195 A JP2006213195 A JP 2006213195A JP 2006213195 A JP2006213195 A JP 2006213195A JP 2008040075 A JP2008040075 A JP 2008040075A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- priority
- voice input
- input means
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Toys (AREA)
- Manipulator (AREA)
Abstract
Description
本発明は、音声認識結果に基づき自律的に動作するロボット装置及びロボット装置の制御方法に関する。 The present invention relates to a robot apparatus that operates autonomously based on a voice recognition result and a method for controlling the robot apparatus.
従来、自律移動型のロボットに対し、教示信号として音声を使用し、ロボットに音声認識させ、音声認識結果に基づき移動等の動作をさせるものがある。しかし、現状の音声認識技術では、周囲の環境によっては音声認識精度が上がらず、音声を認識できない、又は誤認識する場合があるため、認識率を向上するため、背景ノイズを十分に抑える必要がある。そこで、マイクアレイなどを使用した信号処理によりノイズを抑制する手法も開発されているが、この場合であっても、マイクから数メートル離れただけで認識率が低下する。このように、環境に左右されず、ロボットに適切な指示を音声によって与えるためには、ロボットに内蔵したマイクだけで音声認識を行なうには限界がある。 2. Description of the Related Art Conventionally, some autonomously moving robots use speech as a teaching signal, cause the robot to recognize speech, and perform operations such as movement based on the speech recognition result. However, with the current speech recognition technology, depending on the surrounding environment, speech recognition accuracy may not be improved, and speech may not be recognized or may be erroneously recognized. Therefore, it is necessary to sufficiently suppress background noise in order to improve the recognition rate. is there. Therefore, a technique for suppressing noise by signal processing using a microphone array or the like has been developed, but even in this case, the recognition rate is lowered only by being several meters away from the microphone. Thus, in order to give an appropriate instruction to the robot by voice regardless of the environment, there is a limit to performing voice recognition using only the microphone built in the robot.
そこで、このようにロボット内蔵のマイクで認識できない場合には、ロボットの周囲に別途マイク(以下、外部マイクという。)を設置し、背景ノイズを収集したり、ロボットから離れた位置で集音することが考えられる。しかし、この場合、外部マイクの設置場所が固定されていると、ロボットの移動範囲が制限されてしまうため、オペレータの音声をロボットに対し無線で伝送することが行なわれている。 Therefore, if the robot's built-in microphone cannot recognize it, a separate microphone (hereinafter referred to as an external microphone) is installed around the robot to collect background noise or collect sound at a position away from the robot. It is possible. However, in this case, if the installation location of the external microphone is fixed, the movement range of the robot is limited, so that the operator's voice is wirelessly transmitted to the robot.
しかし、ロボットの音声指示がオペレータのみによって与えられるのであれば、オペレータの音声入力を無線等でロボットに直接入力すればよいが、この方式ではオペレータ以外の音声入力を受け付けることができなくなる。したがって、オペレータとロボットの近くにいる人との両方の音声を認識することができることが望ましいが、従来、ロボットに対し無線で伝送した音声信号と、内蔵マイクとの切替手段が確立しておらず、手動で切替が行なわれていた。 However, if the robot's voice instruction is given only by the operator, the operator's voice input may be directly input to the robot by radio or the like. However, this method cannot accept voice input from other than the operator. Therefore, it is desirable to be able to recognize the voice of both the operator and the person near the robot, but conventionally there has not been established a means for switching between the voice signal transmitted wirelessly to the robot and the built-in microphone. Switching was done manually.
これに対し、内蔵マイクからの入力と、無線通信を介して受信した音声情報とに基づき音声認識を行なうロボット装置が特許文献1に開示されている。この特許文献1に記載のロボット装置においては、無線通信を介して送信されるユーザの発話内容を受信する受信手段と、ロボット装置に組み込まれた内蔵マイク機器から入力した音声内容に代えて又は当該音声内容と共に、受信手段から受信した音声情報に基づく発話内容を認識する音声認識手段とを設ける。この構成により、ユーザとスムーズかつ自然にインタラクティブな対話をすることができるロボット装置を提供する。
しかしながら、特許文献1のロボット装置においては、複数の内蔵マイクを有する場合、どの内蔵マイクを使用して音声認識すればよいのか判断することができない。例えば、順次選択して、音声認識できればその内蔵マイクを使用する、などの選択の方法も考えられるものの、最適なマイクを判断して選択することができれば、音声認識率を向上させることができる。 However, in the robot apparatus of Patent Document 1, when there are a plurality of built-in microphones, it is impossible to determine which built-in microphone should be used for voice recognition. For example, a selection method such as sequentially selecting and using the built-in microphone if the voice can be recognized can be considered, but if the optimum microphone can be determined and selected, the voice recognition rate can be improved.
本発明は、このような事情に鑑みてなされたものであり、音声認識率を向上させることができるロボット装置及びその制御方法を提供することを目的とする。 The present invention has been made in view of such circumstances, and an object of the present invention is to provide a robot apparatus and a control method thereof that can improve a speech recognition rate.
本発明に係るロボット装置は、音声認識結果に基づき自律的に動作するロボット装置であって、優先度が設定された第1及び第2の音声入力手段と、前記優先度に基づき前記第1又は第2の音声入力手段からの入力を切替選択する音声信号切替手段と、前記音声信号切替手段により切替選択された前記第1又は第2の音声入力手段から入力された音声を認識する音声認識手段と、前記音声認識手段の音声認識結果に基づき行動選択する行動選択手段とを備え、前記音声信号切替手段は、前記音声入力手段からの音声の信号対雑音比が所定の閾値以上であるか否かの判定結果に基づき前記第1の音声入力手段及び/又は第2の音声入力手段の優先度を更新する。 The robot apparatus according to the present invention is a robot apparatus that operates autonomously based on a voice recognition result, wherein the first and second voice input means set with priority and the first or second based on the priority are set. Voice signal switching means for switching and selecting input from the second voice input means, and voice recognition means for recognizing voice input from the first or second voice input means switched and selected by the voice signal switching means And an action selection means for selecting an action based on the voice recognition result of the voice recognition means, wherein the voice signal switching means determines whether the signal-to-noise ratio of the voice from the voice input means is equal to or greater than a predetermined threshold value. Based on the determination result, the priority of the first voice input means and / or the second voice input means is updated.
本発明においては、信号対雑音比(S/N比)の良否に基づき音声入力手段を選択する優先度を更新するため、S/N比が良好な音声入力手段を自動的に選択することができる。 In the present invention, since the priority for selecting the voice input means is updated based on the signal-to-noise ratio (S / N ratio), it is possible to automatically select the voice input means having a good S / N ratio. it can.
本発明に係るロボット装置は、音声認識結果に基づき自律的に移動するロボット装置であって、優先度が設定された第1及び第2の音声入力手段と、前記優先度に基づき前記第1又は第2の音声入力手段からの入力を切替選択する音声信号切替手段と、前記音声信号切替手段により切替選択された前記第1又は第2の音声入力手段から入力された音声を認識する音声認識手段と、前記音声認識手段の音声認識結果に基づき行動選択する行動選択手段とを備え、前記音声信号切替手段は、前記音声入力手段からの音声の音声認識率が所定の閾値以上であるか否かの判定結果に基づき前記第1の音声入力手段及び/又は第2の音声入力手段の優先度を更新するものである。 The robot apparatus according to the present invention is a robot apparatus that autonomously moves based on a voice recognition result, wherein the first and second voice input means set with priority and the first or second based on the priority are set. Voice signal switching means for switching and selecting input from the second voice input means, and voice recognition means for recognizing voice input from the first or second voice input means switched and selected by the voice signal switching means And an action selection means for selecting an action based on a voice recognition result of the voice recognition means, wherein the voice signal switching means determines whether or not the voice recognition rate of the voice from the voice input means is equal to or higher than a predetermined threshold value. The priority of the first voice input means and / or the second voice input means is updated based on the determination result.
本発明においては、音声認識率の良否に基づき音声信号入力手段を選択する優先度を更新するため、音声認識率が良好な音声が入力される音声入力手段を自動的に選択することができる。 In the present invention, since the priority for selecting the voice signal input means is updated based on whether the voice recognition rate is good or not, it is possible to automatically select the voice input means to which the voice having a good voice recognition rate is input.
本発明に係るロボット装置は、音声認識結果に基づき自律的に移動するロボット装置であって、優先度が設定された第1及び第2の音声入力手段と、前記優先度に基づき前記第1又は第2の音声入力手段からの入力を切替選択する音声信号切替手段と、前記音声信号切替手段により切替選択された前記第1又は第2の音声入力手段から入力された音声を認識する音声認識手段と、前記音声認識手段の音声認識結果に基づき行動選択する行動選択手段と、前記音声入力手段からの音声の信号対雑音比が所定の閾値以上であるか否かを判定するS/N比判定手段と、前記音声入力手段からの音声の音声認識率が所定の閾値以上であるか否かを判定する認識率判定手段と、前記S/N比判定手段及び前記認識率判定手段の判定結果に基づき前記第1の音声入力手段及び/又は第2の音声入力手段の優先度を更新する優先度更新手段とを有するものである。 The robot apparatus according to the present invention is a robot apparatus that autonomously moves based on a voice recognition result, wherein the first and second voice input means set with priority and the first or second based on the priority are set. Voice signal switching means for switching and selecting input from the second voice input means, and voice recognition means for recognizing voice input from the first or second voice input means switched and selected by the voice signal switching means An action selection unit that selects an action based on a voice recognition result of the voice recognition unit; and an S / N ratio determination that determines whether a signal-to-noise ratio of a voice from the voice input unit is equal to or greater than a predetermined threshold value And a recognition rate determination unit that determines whether or not a voice recognition rate of the voice from the voice input unit is equal to or greater than a predetermined threshold, and a determination result of the S / N ratio determination unit and the recognition rate determination unit Based on the first Those having a priority updating means for updating the priority of the voice input means and / or second audio input means.
本発明においては、S/N比の良否や、音声認識率の良否に基づき、音声入力手段を選択する優先度を更新するため、音声認識率が高い音声入力手段を自動的に選択することができる。 In the present invention, since the priority for selecting the voice input means is updated based on the quality of the S / N ratio and the quality of the voice recognition rate, it is possible to automatically select a voice input means having a high voice recognition rate. it can.
また、前記優先度更新手段は、前記S/N比が所定の閾値未満である場合、及び前記音声認識率が所定の閾値未満である場合に、前記優先度を更新することができ、これにより、音声認識する確率が低い音声入力手段の優先順位を下げることができる。 Further, the priority update means can update the priority when the S / N ratio is less than a predetermined threshold and when the speech recognition rate is less than a predetermined threshold. It is possible to lower the priority of the voice input means having a low probability of voice recognition.
更に、前記第1の音声入力手段は、無線信号を受信する音声受信手段であり、前記第2の音声入力手段は、1又は複数のマイクロフォンであって、前記第1の音声入力手段の優先度の初期値が前記第2の音声入力手段の優先度の初期値より高く設定されるものとすることができる。これにより、初期設定時には、必ず無線信号による入力を選択させることができる。 Further, the first voice input means is a voice reception means for receiving a radio signal, and the second voice input means is one or a plurality of microphones, and the priority of the first voice input means. Is set higher than the initial value of the priority of the second voice input means. Thereby, at the time of initial setting, it is possible to always select an input by a radio signal.
更にまた、前記音声受信手段に設定された優先度は固定値であって、前記優先度更新手段は、前記複数のマイクロフォンから入力される音声信号の信号対雑音比及び/又は音声認識率に基づき、当該複数のマイクロフォンに設定された優先度を、前記固定値を上回らない範囲で更新することができる。これにより、入力があれば必ず選択される無線信号により、例えば重要な指示を送ることができる。 Furthermore, the priority set in the voice receiving means is a fixed value, and the priority update means is based on a signal-to-noise ratio and / or a voice recognition rate of voice signals input from the plurality of microphones. The priority set for the plurality of microphones can be updated within a range not exceeding the fixed value. Thus, for example, an important instruction can be sent by a radio signal that is always selected if there is an input.
また、前記音声入力手段に設定される優先度は、リセット信号の入力又は所定のタイミングで前記初期値にリセットされるものとすることができる。 The priority set in the voice input means can be reset to the initial value when a reset signal is input or at a predetermined timing.
本発明に係るロボット装置の制御方法は、音声認識結果に基づき自律的に移動するロボット装置の制御方法であって、第1及び第2の音声入力手段に設定される優先度に基づき当該第1又は第2の音声入力手段からの入力を切替選択する音声入力選択工程と、前記切替選択された前記第1又は第2の音声入力手段から入力された音声を認識する音声認識工程と、前記音声認識工程における音声認識結果に基づき行動選択する行動選択工程とを備え、前記音声入力選択工程は、前記音声入力手段からの音声の信号対雑音比が所定の閾値以上であるか否かを判定するS/N比判定工程、及び/又は前記音声入力手段からの音声の音声認識率が所定の閾値以上であるか否かを判定する認識率判定工程と、前記S/N比判定工程及び/又は認識率判定工程の判定結果に基づき前記第1の音声入力手段及び/又は第2の音声入力手段の優先度を更新する優先度更新工程とを有する。 A control method for a robotic device according to the present invention is a control method for a robotic device that moves autonomously based on a voice recognition result, and is based on the priority set in the first and second voice input means. Alternatively, a voice input selection step for switching and selecting an input from the second voice input means, a voice recognition step for recognizing a voice inputted from the first or second voice input means selected for switching, and the voice An action selection step of selecting an action based on a voice recognition result in the recognition step, wherein the voice input selection step determines whether or not the signal-to-noise ratio of the voice from the voice input means is greater than or equal to a predetermined threshold value. An S / N ratio determination step, and / or a recognition rate determination step of determining whether or not a voice recognition rate of the voice from the voice input means is equal to or higher than a predetermined threshold, and the S / N ratio determination step and / or Recognition rate judgment Based on the extent of the determination result and a priority updating step of updating the priority of the first audio input unit and / or second audio input means.
本発明においては、S/N比又は認識率に応じて、複数の音声入力手段のいずれかを選択する優先順位を変更することができ、S/N比や、認識率が良好なものを自動的に選択することができる。 In the present invention, the priority order for selecting one of a plurality of voice input means can be changed according to the S / N ratio or the recognition rate, and the one having a good S / N ratio or recognition rate is automatically selected. Can be selected.
本発明によれば、音声認識率を向上させることができるロボット装置及びその動作制御方法を提供することができる。 ADVANTAGE OF THE INVENTION According to this invention, the robot apparatus which can improve a speech recognition rate, and its operation | movement control method can be provided.
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。図1は、本発明の実施の形態にかかる2足歩行タイプのロボットを示す斜視図である。図1に示すように、ロボット1は、体幹部ユニット1cの所定の位置に頭部ユニット1a、左右2つの腕部ユニット1b、左右2つの脚部ユニット1dが連結されている。なお、本実施の形態においては、2足歩行タイプのロボットとして説明するが、4足歩行等であってもよく、又は脚部は、車輪等からなるものであってもよい。
Hereinafter, specific embodiments to which the present invention is applied will be described in detail with reference to the drawings. FIG. 1 is a perspective view showing a biped walking type robot according to an embodiment of the present invention. As shown in FIG. 1, in the robot 1, a
図2は、本実施の形態にかかるロボットを示すブロック図である。ロボット1は、制御部101、入出力部102、駆動部103、電源部104、及び外部記憶部105などを有している。
FIG. 2 is a block diagram showing the robot according to the present embodiment. The robot 1 includes a
入出力部102は、周囲の映像を取得するためのCCD(Charge Coupled Device)などからなるカメラ121、周囲の音を集音するための1又は複数の内蔵マイク122、音声を出力してユーザと対話等を行なうためのスピーカ123、ユーザへの応答や感情等を表現するためのLED124、タッチセンサなどからなるセンサ部125などを備える。
The input /
また、駆動部103は、モータ131及びモータを駆動するドライバ132などを有し、ユーザの指示などに従って脚部ユニット1dや腕部ユニット1bを動作させる。電源部104は、バッテリ141及びその放充電を制御するバッテリ制御部142を有し、各部に電源を供給する。
The
外部記憶部105は、着脱可能なHDD、光ディスク、光磁気ディスク等からなり、各種プログラムや制御パラメータなどを記憶し、そのプログラムやデータを必要に応じて制御部101内のメモリ(不図示)等に供給する。
The
制御部は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、無線通信用のインターフェースなどを有し、ロボット1の各種動作を制御する。そして、この制御部101は、例えばROMに格納された制御プログラムに従って音声認識を行なう音声認識モジュール12、認識結果に基づきユーザに発話動作をする音声発話モジュール13、カメラ121により取得した映像を解析する画像認識モジュール14、各種認識結果に基づきとるべき行動を選択する行動決定モジュール15などを有する。
The control unit includes a CPU (Central Processing Unit), a ROM (Read Only Memory), a RAM (Random Access Memory), a wireless communication interface, and the like, and controls various operations of the robot 1. And this
ここで、本実施の形態にかかるロボット1は、ユーザ又はオペレータの呼びかけ等の音声を認識し、音声認識結果に基づき動作するものである。次に、本実施の形態にかかるロボット1の動作制御方法について詳細に説明する。 Here, the robot 1 according to the present embodiment recognizes a voice such as a user or operator call and operates based on the voice recognition result. Next, the operation control method of the robot 1 according to the present embodiment will be described in detail.
図3は、本実施の形態にかかるロボットにおいて、音声認識にかかわる部分のみを抜き出して示すブロック図である。図3に示すように、ロボット1は、上述したように入出力部として複数の内蔵マイク及びスピーカからなる音声入出力経路を有する。すなわち、本実施の形態においては、正面内蔵マイク21及びスピーカ22を使用する音声入出力経路A2、左側内蔵マイク41及びスピーカを使用する音声入出力経路A3、並びに右側内蔵マイク51及びスピーカを使用する音声入出力経路A4の3つの音声入出力経路A2〜A4を有している。なお、音声入出力経路は3つに限るものではない。更に、本ロボット1は、無線LAN31を有し、オペレータによって外部から当該無線LAN31を介して音声入力が可能な音声入出力経路A1も有している。
FIG. 3 is a block diagram showing only a portion related to speech recognition in the robot according to the present embodiment. As shown in FIG. 3, the robot 1 has a voice input / output path including a plurality of built-in microphones and speakers as an input / output unit as described above. That is, in this embodiment, the voice input / output path A2 using the front built-in
さらに、ロボット1の制御部101は、これら音声入出力経路A1〜A4のいずれを使用するかを選択する音声信号切替器11を有している。音声信号切替器11は、音声入出力経路A1〜A4のいずれかを選択し、当該経路と音声認識モジュール12とを接続する。
Further, the
本実施の形態においては、内蔵マイク21、41、51から音声を入力するのが顧客であり、無線LAN31を介して音声入力するのがオペレータである場合について説明する。オペレータは、例えばマイク74、及びスピーカ75を有する遠隔操作用PC(Personal Computer)71を使用して無線LAN73を制御し、ロボット1に教示信号を入力する。例えば、オペレータは、遠隔操作用PC71に接続されたヘッドセットや、タイピンマイク及びイヤホンなどの入力手段を使用して音声情報を入力したり、又はキーボードなどの入力手段により文字情報を入力したりすることで、ロボット1に教示信号を入力することができる。一方で、ロボット1は、内蔵マイク21、41、51及びスピーカ22、42、52を使用して顧客と対話をすることができる。
In the present embodiment, a case will be described in which a customer inputs voice from the built-in
ロボット1内の音声信号切替器11は、音声入出力経路A1〜A4のいずれかを、各経路A1〜A4に設定された優先度に基づいて選択する。ここで、本実施の形態においては、無線LAN31を介して音声が入力される音声入出力経路A1の優先度を固定とし、かつ最も高い優先度とする。一方、内蔵マイクによる音声入出力経路A2〜A4の優先度は可変となっている。
The voice
図4は、音声信号切替器11及び音声認識モジュール12の詳細を示すブロック図である。図4に示すように、音声信号切替器11は、図4に示すように、優先度更新部201を有し、内蔵マイクにより構成される音声入出力経路A2〜A4の優先度を後述する方法により更新する。
FIG. 4 is a block diagram showing details of the voice
音声認識モジュール12は、S/N比判定部211及び音声認識率判定部212を有する。S/N比判定部211は、入力される音声のS/N比の良否を判定する。また、音声認識率判定部212は、入力される音声の認識率の良否を判定する。優先度更新部201は、S/N比判定部211のS/N比判定結果、音声認識率判定部212の音声認識率判定結果に基づき、音声入出力経路A2〜A4の優先度を更新する。
The
このように設定された優先度により、オペレータからの音声入力があると、同時に顧客からの音声入力があっても、常に優先度の高い音声入出力経路A1が選択されることとなる。一方、オペレータからの音声入力がなく、顧客がロボット1に話かけた場合には、音声入出力経路A2〜A4のうち、その時点で優先度が最も高い音声入出力経路が選択されることとなる。本例においては、初期設定としては、音声入出力経路A2の優先度>経路A3の優先度>経路A4の優先度とするものとする。 If there is a voice input from the operator according to the priority set in this way, the voice input / output path A1 having a high priority is always selected even if there is a voice input from the customer at the same time. On the other hand, when there is no voice input from the operator and the customer talks to the robot 1, the voice input / output path with the highest priority at that time is selected from the voice input / output paths A2 to A4. Become. In this example, as an initial setting, the priority of the voice input / output path A2> the priority of the path A3> the priority of the path A4.
次に、優先度の更新方法について説明する。先ず、第1の優先度更新方法として、音声の信号対雑音比(S/N比)が所定の値未満である場合、その優先度を下げる方法がある。S/N比が小さければ、音声を正確に認識できる確率が小さく、正確な音声指示を行なうことができない可能性があるからである。よって、音声認識モジュール12のS/N比判定部211により、入力された音声信号のS/N比が所定の閾値未満であるか否かを判定し、その結果を優先度更新部201に通知する。優先度更新部201は、この判定結果に基づき優先度を再設定する。
Next, a priority update method will be described. First, as a first priority update method, there is a method of lowering the priority when the audio signal-to-noise ratio (S / N ratio) is less than a predetermined value. This is because if the S / N ratio is small, the probability of correctly recognizing the voice is low and there is a possibility that an accurate voice instruction cannot be performed. Therefore, the S / N
また、第2の優先度更新方法として、音声認識の認識率が所定の閾値以下であった場合に、その優先度を下げる方法がある。音声認識手法としては、DP(Dynamic Programming)マッチングによる方法、HMM(隠れマルコフモデル:Hidden Markov Model)による方法等、公知の手法を利用することができる。そして、音声認識率としては、これらの確率モデルの結果算出される尤度を使用することができる。この場合、音声認識モジュール12の音声認識率判定部212により、音声認識率が所定の閾値未満であるか否かを判定し、その結果を優先度更新部201に通知する。優先度更新部201は、この判定結果に基づき優先度を再設定する。
Further, as a second priority update method, there is a method of lowering the priority when the recognition rate of voice recognition is equal to or lower than a predetermined threshold. As a speech recognition method, a known method such as a method using DP (Dynamic Programming) matching or a method using HMM (Hidden Markov Model) can be used. As the speech recognition rate, the likelihood calculated as a result of these probability models can be used. In this case, the speech recognition
なお、本実施の形態においては、音声信号切替器11内に優先度更新部201を有し、音声認識モジュール12がS/N比判定部211、音声認識率判定部212を有するものとして説明するが、優先度更新部、S/N比判定部、音声認識率判定部を別途設けるようにしてもよいことは言うまでもない。
In the present embodiment, it is assumed that the voice
次に、音声信号切替器11の優先度更新方法について図5を参照して詳細に説明する。図5は、本実施の形態にかかる優先度更新方法を示すフローチャートである。先ず、音声信号切替器11に、音声入出力経路A1〜A4の初期優先度を設定する(ステップS1)。このとき上述したように、同時に音声入力があった場合に音声入出力経路A1が優先的に選択されるよう優先度が設定されている。また、本実施の形態においては、内蔵マイクを使用する音声入出力経路が複数存在するため、これらの音声入出力経路の優先度は個別に設定される。
Next, the priority update method of the
そして、音声入力があれば(ステップS2:Yes)、このとき最も高い優先度の音声入力を、音声認識モジュール12に接続する(ステップS3)。本実施の形態においては、無線LAN31を介した音声入出力経路A1の優先度が常に最も高く、内蔵マイクを介した音声入出力経路A2〜A4の優先度は、音声入出力経路A1の優先度を上回らない範囲で更新される。よって、無線LAN31を介して音声入力があった場合には、内蔵マイク21等に音声入力があっても、無線LAN31による音声入出力経路A1からの入力が音声認識モジュール12へ供給される。すなわち、ロボット1と顧客が対話をしている場合であっても、オペレータがいつでも介入することができる。例えば、ロボット1と顧客の対話中に、ロボット1が顧客の指示を誤認識するなどして危険な動作を開始した場合には、オペレータが音声コマンドによりロボットに動作停止を命令することができる。また、ロボットと顧客の対話環境の背景ノイズが大きく音声認識に失敗してしまうような場合には、顧客に代わってオペレータが指示を出すことができる。
If there is a voice input (step S2: Yes), the voice input with the highest priority at this time is connected to the voice recognition module 12 (step S3). In the present embodiment, the priority of the voice input / output path A1 via the
音声入力があると、次にS/N比判定部211により、入力された音声情報のS/N比が所定の閾値以上であるか否かを判定する。この際、例えば、S/N比が所定の閾値未満である場合には、入力された音声認識を中止し、音声発話モジュール13により、再度命令してもらうよう発話する等してもよい。
When there is a voice input, the S / N
S/N比が所定の閾値以上ある場合には(ステップS4:Yes)、音声認識率が所定の閾値以上であるか否かを、音声認識率判定部212が判定する。音声認識率、例えば確率モデルの結果算出される尤度が所定の閾値以上である場合には、その音声認識結果に基づき、音声発話モジュール13により発話を行なったり、その他、手を振るなどの動作を発現したりする(ステップS6)。
When the S / N ratio is equal to or higher than the predetermined threshold (step S4: Yes), the voice recognition
一方、音声入力はないが(ステップS2:No)、リセット信号が入力された場合(ステップS7:Yes)、音声信号切替器11は、各音声入出力経路A1〜A4の優先度を初期値に再設定する。また、音声入力があった場合であって、S/N比が所定の閾値未満であった場合(ステップS:No)及び認識率が所定の閾値未満であった場合(ステップS5:No)は、当該音声入出力経路の優先度が可変であれば(ステップS9:Yes)、当該優先度を下げる。また、優先度が固定の場合には、ステップS2の処理に戻る。内蔵スピーカの音声入出力経路A2〜A4の優先度を可変にすることで、S/N比が良好になる顧客に最も近い側の内蔵マイクの入出力経路が自動的に選択される。また、顧客に取り囲まれてそれぞれが良好なS/N比でロボット1に問いかける場合には、確率モデルの尤度が高い、すなわち認識しやすい発音をしている顧客側の内蔵マイクの入出力経路が自動的に選択されることとなる。
On the other hand, if there is no voice input (step S2: No), but a reset signal is input (step S7: Yes), the
このように、音声信号切替器11の優先度更新部201は、入力音声のS/N比が小さかったり、認識率が悪かった場合にその入力ラインの優先度を下げることで、誤認識しやすい、質が低い音声入力を選択しないようにすることができる。なお、更新された優先度は、リセット信号の入力により初期値に戻されるものとしたが、所定時間音声入力がない場合に優先度を初期値にするよう制御することも可能である。
As described above, the
次に、本発明の実施の形態の変形例について説明する。図3に示すロボット1においては、オペレータが無線LANを使用して音声指示を送るものとして説明したが、携帯電話を使用して音声指示を送ることも可能である。 Next, a modification of the embodiment of the present invention will be described. In the robot 1 shown in FIG. 3, it has been described that the operator sends a voice instruction using a wireless LAN, but it is also possible to send a voice instruction using a mobile phone.
図6は、本実施の形態の変形例にかかるロボットの音声認識に関わる要部を抜き出して示すブロック図である。図6に示すように、ロボット1は、通信手段として電話機61を備える。その他の構成は、実施の形態1と同様であり、同一構成要素には同一の符号を付しその詳細な説明は省略する。
FIG. 6 is a block diagram showing a main part related to the voice recognition of the robot according to the modification of the present embodiment. As shown in FIG. 6, the robot 1 includes a
オペレータは、携帯電話機81を介してロボット1に音声信号を入力することができる。音声信号切替器11は、実施の形態1と同様に、優先度が固定の音声入出力経路A1として、電話機61を介したオペレータからの音声入力経路を有している。また、上述と同様、優先度が可変の内蔵マイク及びスピーカによる音声入出力経路A2〜A4を有しており、音声信号切替器11が音声認識モジュール12との接続を優先度に応じて切り替える。本変形例においても、電話機61から入力があった場合には、これを優先的に選択するよう、優先度が設定されるものとする。そして、音声信号切替器11は、S/N比の大きさや音声認識率に基づき、音声入出力経路A2〜A4の優先度を更新する。
The operator can input a voice signal to the robot 1 via the
本実施の形態においては、無線通信による音声入力の優先度を固定かつ最も高いものとし、複数の内蔵マイクの音声入力はその優先度に応じて適宜選択するものとしたので、例えば顧客の指示を誤って認識して誤動作した場合には、オペレータが無線通信による音声入力により、その動作を直ちに停止又は修正することができる。また、複数の内蔵マイクのうち、優先度に応じて良好なS/N比を有するもの、良好な認識率を示すものが自動的に選択されるので、認識率を向上させることができる。 In the present embodiment, the priority of voice input by wireless communication is fixed and highest, and the voice input of a plurality of built-in microphones is appropriately selected according to the priority. In the case of erroneous recognition and malfunction, the operation can be immediately stopped or corrected by voice input through wireless communication. Further, among the plurality of built-in microphones, those having a good S / N ratio and those showing a good recognition rate are automatically selected according to the priority, so that the recognition rate can be improved.
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。例えば、本実施の形態においては、各内蔵マイクに対応するスピーカを有するものとして説明したが、スピーカは1つであってもよい。また、正面内蔵マイク、右側内蔵マイク、左側内蔵マイクを複数設け、複数の正面内蔵マイク、右側内蔵マイク、左側内蔵マイクに対して優先度を設定・更新するようにしてもよい。更に、本実施の形態においては、無線通信を介して入力される音声信号の入出力経路の優先度を固定としたが可変としてもよい。 It should be noted that the present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the scope of the present invention. For example, although the present embodiment has been described as having a speaker corresponding to each built-in microphone, the number of speakers may be one. Further, a plurality of front built-in microphones, right built-in microphones, and left built-in microphones may be provided, and priority may be set and updated for a plurality of front built-in microphones, right built-in microphones, and left built-in microphones. Furthermore, in this embodiment, the priority of the input / output path of the audio signal input via wireless communication is fixed, but may be variable.
1 ロボット
1a 頭部ユニット
1b 腕部ユニット
1c 体幹部ユニット
1d 脚部ユニット
11 音声信号切替器
12 音声認識モジュール
13 音声発話モジュール
14 画像認識モジュール
15 行動決定モジュール
21、41、51 内蔵マイク
22、42、52、75 スピーカ
61 電話機
74 マイク
81 携帯電話機
101 制御部
102 入出力部
103 駆動部
104 電源部
105 外部記憶部
121 カメラ
122 内蔵マイク
125 センサ部
131 モータ
132 ドライバ
141 バッテリ
142 バッテリ制御部
201 優先度更新部
211 比判定部
212 音声認識率判定部
DESCRIPTION OF SYMBOLS 1
Claims (8)
優先度が設定された第1及び第2の音声入力手段と、
前記優先度に基づき前記第1又は第2の音声入力手段からの入力を切替選択する音声信号切替手段と、
前記音声信号切替手段により切替選択された前記第1又は第2の音声入力手段から入力された音声を認識する音声認識手段と、
前記音声認識手段の音声認識結果に基づき行動選択する行動選択手段とを備え、
前記音声信号切替手段は、前記音声入力手段からの音声の信号対雑音比が所定の閾値以上であるか否かの判定結果に基づき前記第1の音声入力手段及び/又は第2の音声入力手段の優先度を更新するロボット装置。 A robot device that operates autonomously based on a voice recognition result,
First and second voice input means set with priority;
Voice signal switching means for switching and selecting input from the first or second voice input means based on the priority;
Voice recognition means for recognizing the voice input from the first or second voice input means selected by the voice signal switching means;
Action selection means for selecting an action based on the voice recognition result of the voice recognition means,
The voice signal switching means is configured to determine whether the signal-to-noise ratio of the voice from the voice input means is equal to or higher than a predetermined threshold value, and the first voice input means and / or the second voice input means. Robot device that updates the priority of the.
優先度が設定された第1及び第2の音声入力手段と、
前記優先度に基づき前記第1又は第2の音声入力手段からの入力を切替選択する音声信号切替手段と、
前記音声信号切替手段により切替選択された前記第1又は第2の音声入力手段から入力された音声を認識する音声認識手段と、
前記音声認識手段の音声認識結果に基づき行動選択する行動選択手段とを備え、
前記音声信号切替手段は、前記音声入力手段からの音声の音声認識率が所定の閾値以上であるか否かの判定結果に基づき前記第1の音声入力手段及び/又は第2の音声入力手段の優先度を更新するロボット装置。 A robot device that moves autonomously based on a voice recognition result,
First and second voice input means set with priority;
Voice signal switching means for switching and selecting input from the first or second voice input means based on the priority;
Voice recognition means for recognizing the voice input from the first or second voice input means selected by the voice signal switching means;
Action selection means for selecting an action based on the voice recognition result of the voice recognition means,
The voice signal switching means is configured to determine whether the voice recognition rate of the voice from the voice input means is greater than or equal to a predetermined threshold value based on a determination result of the first voice input means and / or the second voice input means. Robot device that updates priority.
優先度が設定された第1及び第2の音声入力手段と、
前記優先度に基づき前記第1又は第2の音声入力手段からの入力を切替選択する音声信号切替手段と、
前記音声信号切替手段により切替選択された前記第1又は第2の音声入力手段から入力された音声を認識する音声認識手段と、
前記音声認識手段の音声認識結果に基づき行動選択する行動選択手段と、
前記音声入力手段からの音声の信号対雑音比が所定の閾値以上であるか否かを判定するS/N比判定手段と、
前記音声入力手段からの音声の音声認識率が所定の閾値以上であるか否かを判定する認識率判定手段と、
前記S/N比判定手段及び前記認識率判定手段の判定結果に基づき前記第1の音声入力手段及び/又は第2の音声入力手段の優先度を更新する優先度更新手段とを有するロボット装置。 A robot device that moves autonomously based on a voice recognition result,
First and second voice input means set with priority;
Voice signal switching means for switching and selecting input from the first or second voice input means based on the priority;
Voice recognition means for recognizing the voice input from the first or second voice input means selected by the voice signal switching means;
An action selection means for selecting an action based on a voice recognition result of the voice recognition means;
S / N ratio determination means for determining whether or not the signal-to-noise ratio of the voice from the voice input means is equal to or greater than a predetermined threshold;
A recognition rate determination unit that determines whether or not a voice recognition rate of the voice from the voice input unit is equal to or greater than a predetermined threshold;
A robot apparatus comprising: a priority update unit that updates the priority of the first voice input unit and / or the second voice input unit based on determination results of the S / N ratio determination unit and the recognition rate determination unit.
ことを特徴とする請求項3記載のロボット装置。 The priority update unit updates the priority when the S / N ratio is less than a predetermined threshold and when the speech recognition rate is less than a predetermined threshold. The robot apparatus described.
前記第1の音声入力手段の優先度の初期値が前記第2の音声入力手段の優先度の初期値より高く設定される
ことを特徴とする請求項1乃至4のいずれか1項記載のロボット装置。 The first voice input means is a voice reception means for receiving a radio signal, and the second voice input means is one or a plurality of microphones,
5. The robot according to claim 1, wherein an initial value of priority of the first voice input unit is set higher than an initial value of priority of the second voice input unit. apparatus.
前記優先度更新手段は、前記複数のマイクロフォンから入力される音声信号の信号対雑音比及び/又は音声認識率に基づき、当該複数のマイクロフォンに設定された優先度を、前記固定値を上回らない範囲で更新する
ことを特徴とする請求項5記載のロボット装置。 The priority set in the voice receiving means is a fixed value,
The priority update means is a range in which the priority set for the plurality of microphones does not exceed the fixed value based on the signal-to-noise ratio and / or the speech recognition rate of the audio signals input from the plurality of microphones. The robot apparatus according to claim 5, wherein the robot apparatus is updated by.
ことを特徴とする請求項5又は6記載のロボット装置。 The robot apparatus according to claim 5 or 6, wherein the priority set in the voice input unit is reset to the initial value when a reset signal is input or at a predetermined timing.
第1及び第2の音声入力手段に設定される優先度に基づき当該第1又は第2の音声入力手段からの入力を切替選択する音声入力選択工程と、
前記切替選択された前記第1又は第2の音声入力手段から入力された音声を認識する音声認識工程と、
前記音声認識工程における音声認識結果に基づき行動選択する行動選択工程とを備え、
前記音声入力選択工程は、
前記音声入力手段からの音声の信号対雑音比が所定の閾値以上であるか否かを判定するS/N比判定工程、及び/又は前記音声入力手段からの音声の音声認識率が所定の閾値以上であるか否かを判定する認識率判定工程と、
前記S/N比判定工程及び/又は認識率判定工程の判定結果に基づき前記第1の音声入力手段及び/又は第2の音声入力手段の優先度を更新する優先度更新工程とを有するロボット装置の制御方法。
A method for controlling a robot device that moves autonomously based on a speech recognition result,
A voice input selection step of switching and selecting the input from the first or second voice input means based on the priority set in the first and second voice input means;
A voice recognition step for recognizing a voice inputted from the first or second voice input means selected for switching;
An action selection step of selecting an action based on the voice recognition result in the voice recognition step,
The voice input selection step includes
S / N ratio determination step for determining whether or not the signal-to-noise ratio of the voice from the voice input means is equal to or greater than a predetermined threshold, and / or the voice recognition rate of the voice from the voice input means is a predetermined threshold A recognition rate determination step of determining whether or not
A priority update step of updating the priority of the first voice input means and / or the second voice input means based on the determination result of the S / N ratio determination step and / or the recognition rate determination step. Control method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006213195A JP4821489B2 (en) | 2006-08-04 | 2006-08-04 | Robot apparatus and control method of robot apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006213195A JP4821489B2 (en) | 2006-08-04 | 2006-08-04 | Robot apparatus and control method of robot apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008040075A true JP2008040075A (en) | 2008-02-21 |
JP4821489B2 JP4821489B2 (en) | 2011-11-24 |
Family
ID=39175164
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006213195A Expired - Fee Related JP4821489B2 (en) | 2006-08-04 | 2006-08-04 | Robot apparatus and control method of robot apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4821489B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018532151A (en) * | 2015-09-11 | 2018-11-01 | アマゾン テクノロジーズ インコーポレイテッド | Mediation between voice-enabled devices |
JP2018537700A (en) * | 2015-09-21 | 2018-12-20 | アマゾン テクノロジーズ インコーポレイテッド | Device selection to provide response |
JP2019015950A (en) * | 2017-07-05 | 2019-01-31 | パナソニックIpマネジメント株式会社 | Voice recognition method, program, voice recognition device, and robot |
US11875820B1 (en) | 2017-08-15 | 2024-01-16 | Amazon Technologies, Inc. | Context driven device arbitration |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04212600A (en) * | 1990-12-05 | 1992-08-04 | Oki Electric Ind Co Ltd | Voice input device |
JPH08314489A (en) * | 1995-05-16 | 1996-11-29 | Nec Robotics Eng Ltd | Voice recognition device |
JP2000310999A (en) * | 1999-04-26 | 2000-11-07 | Asahi Chem Ind Co Ltd | Facilities control system |
JP2002372991A (en) * | 2001-06-13 | 2002-12-26 | Olympus Optical Co Ltd | Voice control device |
JP2005202075A (en) * | 2004-01-14 | 2005-07-28 | Sony Corp | Speech communication control system and its method and robot apparatus |
-
2006
- 2006-08-04 JP JP2006213195A patent/JP4821489B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04212600A (en) * | 1990-12-05 | 1992-08-04 | Oki Electric Ind Co Ltd | Voice input device |
JPH08314489A (en) * | 1995-05-16 | 1996-11-29 | Nec Robotics Eng Ltd | Voice recognition device |
JP2000310999A (en) * | 1999-04-26 | 2000-11-07 | Asahi Chem Ind Co Ltd | Facilities control system |
JP2002372991A (en) * | 2001-06-13 | 2002-12-26 | Olympus Optical Co Ltd | Voice control device |
JP2005202075A (en) * | 2004-01-14 | 2005-07-28 | Sony Corp | Speech communication control system and its method and robot apparatus |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018532151A (en) * | 2015-09-11 | 2018-11-01 | アマゾン テクノロジーズ インコーポレイテッド | Mediation between voice-enabled devices |
JP2018537700A (en) * | 2015-09-21 | 2018-12-20 | アマゾン テクノロジーズ インコーポレイテッド | Device selection to provide response |
US11922095B2 (en) | 2015-09-21 | 2024-03-05 | Amazon Technologies, Inc. | Device selection for providing a response |
JP2019015950A (en) * | 2017-07-05 | 2019-01-31 | パナソニックIpマネジメント株式会社 | Voice recognition method, program, voice recognition device, and robot |
US11875820B1 (en) | 2017-08-15 | 2024-01-16 | Amazon Technologies, Inc. | Context driven device arbitration |
Also Published As
Publication number | Publication date |
---|---|
JP4821489B2 (en) | 2011-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4837917B2 (en) | Device control based on voice | |
KR101818980B1 (en) | Multi-speaker speech recognition correction system | |
JP4086280B2 (en) | Voice input system, voice input method, and voice input program | |
JP2005084253A (en) | Sound processing apparatus, method, program and storage medium | |
JP6844608B2 (en) | Voice processing device and voice processing method | |
JP2005529421A (en) | Movable unit and method for controlling movable unit | |
JP4622384B2 (en) | ROBOT, ROBOT CONTROL DEVICE, ROBOT CONTROL METHOD, AND ROBOT CONTROL PROGRAM | |
JP7476941B2 (en) | ROBOT, ROBOT CONTROL METHOD AND PROGRAM | |
CN108665907B (en) | Voice recognition device, voice recognition method, recording medium, and robot | |
JP4821489B2 (en) | Robot apparatus and control method of robot apparatus | |
JPWO2008001492A1 (en) | Robot, robot control method, and robot control program | |
JP2008168375A (en) | Body language robot, its controlling method and controlling program | |
WO2003107327A1 (en) | Controlling an apparatus based on speech | |
JP2006243555A (en) | Response determination system, robot, event output server, and response determining method | |
JP2007155986A (en) | Voice recognition device and robot equipped with the same | |
KR20140117771A (en) | Motion sensor-based portable automatic interpretation apparatus and controlling method thereof | |
WO2017051627A1 (en) | Speech production apparatus and speech production method | |
JP7435641B2 (en) | Control device, robot, control method and program | |
JP2001188551A (en) | Device and method for information processing and recording medium | |
JP2010188429A (en) | Guidance robot | |
JP2004283927A (en) | Robot control device, and method, recording medium and program | |
JP2005335001A (en) | Robot control device and method, recording medium, and program | |
JP6908636B2 (en) | Robots and robot voice processing methods | |
JP2004318026A (en) | Security pet robot and signal processing method related to the device | |
JP3846500B2 (en) | Speech recognition dialogue apparatus and speech recognition dialogue processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100928 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110419 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110517 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110809 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110822 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140916 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |