JPH11231896A - Speech startup system - Google Patents

Speech startup system

Info

Publication number
JPH11231896A
JPH11231896A JP10037374A JP3737498A JPH11231896A JP H11231896 A JPH11231896 A JP H11231896A JP 10037374 A JP10037374 A JP 10037374A JP 3737498 A JP3737498 A JP 3737498A JP H11231896 A JPH11231896 A JP H11231896A
Authority
JP
Japan
Prior art keywords
voice
keyword
input
activation system
predetermined value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10037374A
Other languages
Japanese (ja)
Other versions
JP3524370B2 (en
Inventor
Masahiro Kamiya
昌宏 神谷
Kazuhiro Sakiyama
和広 崎山
Hideki Kitao
英樹 北尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Original Assignee
Denso Ten Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd filed Critical Denso Ten Ltd
Priority to JP03737498A priority Critical patent/JP3524370B2/en
Publication of JPH11231896A publication Critical patent/JPH11231896A/en
Application granted granted Critical
Publication of JP3524370B2 publication Critical patent/JP3524370B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a speech startup system rather free from a concern about a mistake, regarding the startup control of a speech control device using a speech keyword. SOLUTION: Regarding a speech startup system having a keyword judgement means 7 for making judgement as to whether an entered speech is a registered speech keyword, and controlling the startup of a speech control device 8 on the basis of the result of the judgement. The keyword judgement means 7 is constituted so that a similarity value between the entered speech and the speech keyword is measured, and the entered speech is judged as the speech keyword when the measured similarity value is equal to or smaller than a specific value.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は音声起動システムに
関し、より詳細には、音声認識によって各種機器の操作
制御を行なう、いわゆる音声制御装置の音声起動システ
ムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice activation system, and more particularly, to a voice activation system of a so-called voice control device which controls the operation of various devices by voice recognition.

【0002】[0002]

【従来の技術】音声認識による機器制御は手を使わず
(ハンズフリー)、また視線移動を必要としない(アイ
ズフリー)ので、別の動作をしながらでも音声によって
機器の操作制御を行なうことができる。例えば、車両運
転中に、前方への視線を移動させたり、ハンドルから手
を離さずとも、機器の操作制御を行なうことができ、車
両運転中の安全性の確保が容易となる。
2. Description of the Related Art Since device control by voice recognition does not use hands (hands-free) and does not require movement of eyes (eyes-free), it is possible to control the operation of devices by voice while performing other operations. it can. For example, it is possible to control the operation of the device without moving the line of sight to the front or releasing the hand from the steering wheel while driving the vehicle, and it is easy to ensure safety during driving of the vehicle.

【0003】上記のような音声制御装置を使う場合、通
常の制御モード(音声認識による操作制御の可能でない
状態)から音声制御モード(音声認識による操作制御の
可能な状態)へ切り替わるのが普通であり、その切換方
法として、通常では音声キーワードが発声された否かと
いった音声認識方法が採用されている。
When the above-described voice control device is used, it is normal to switch from a normal control mode (a state in which operation control by voice recognition is not possible) to a voice control mode (a state in which operation control by voice recognition is possible). There is usually a voice recognition method such as whether or not a voice keyword is uttered as the switching method.

【0004】[0004]

【発明が解決しようとする課題】上記したように、音声
制御装置はその利点(ハンズフリー、アイズフリー)か
ら車両機器制御への利用に大変効果がある。しかしなが
ら、車両内では周囲の物音や、話し声等を登録されてい
る音声キーワードと誤認し、必要のないときに音声制御
モードへ切り替わってしまうといった不具合が生じやす
い状況にある。
As described above, the voice control device is very effective for use in controlling vehicle equipment because of its advantages (hands-free and eyes-free). However, in a vehicle, there is a situation in which a problem such as a surrounding sound, a voice of speech, and the like being mistaken for a registered voice keyword and switching to a voice control mode when unnecessary is likely to occur.

【0005】また、車載用ハンズフリー電話機と音声制
御装置とで音声入力手段、すなわちマイク等を共有する
システムを使用する場合、通話中における音声制御モー
ドへの切り替えは困難を極める。それは、通話中の話し
声を登録されている音声キーワードと誤認してしまう可
能性が極めて高いからである。
[0005] Further, when a system for sharing voice input means, ie, a microphone, is used between the in-vehicle hands-free telephone and the voice control device, it is extremely difficult to switch to the voice control mode during a call. This is because there is a very high possibility that a speech during a call is erroneously recognized as a registered voice keyword.

【0006】本発明は上記課題に鑑みなされたものであ
って、音声キーワードを用いた音声制御装置の起動制御
であったとしても、誤認を招くおそれの少ない音声起動
システムを提供することを目的としている。
SUMMARY OF THE INVENTION The present invention has been made in view of the above problems, and has as its object to provide a voice activation system which is less likely to cause erroneous recognition even if the activation control of a voice control device uses a voice keyword. I have.

【0007】[0007]

【課題を解決するための手段及びその効果】上記目的を
達成するために本発明に係る音声起動システム(1)
は、入力された音声が登録されている音声キーワードで
あるか否かを判断するキーワード判断手段を備えると共
に、その判断結果に基づいて音声制御装置の起動制御を
行なう音声起動システムにおいて、入力音声と音声キー
ワードとの類似値を計測し、計測された類似値が所定値
以下であれば、前記入力音声が前記音声キーワードであ
ると判断するように、前記キーワード判断手段が構成さ
れていることを特徴としている。
Means for Solving the Problems and Their Effects To achieve the above object, a voice activation system (1) according to the present invention.
Comprises a keyword determining means for determining whether or not the input voice is a registered voice keyword, and a voice activation system for performing activation control of the voice control device based on the determination result. The keyword determining means is configured to measure a similarity value with a voice keyword, and determine that the input voice is the voice keyword if the measured similarity value is equal to or less than a predetermined value. And

【0008】上記音声起動システム(1)によれば、入
力音声と登録されている音声キーワードとの類似度が低
ければ、前記音声制御装置を起動させないので、周囲の
物音や、話し声等で誤って前記音声制御装置が起動する
可能性、すなわち音声制御モードへ切り替わる可能性を
低減させることができる。従って、従来では通話中にお
いては誤認する可能性の高かった、車載用ハンズフリー
電話機と音声制御装置とでマイク等を共有させたシステ
ムであっても、上記音声起動システム(1)を採用する
ことによって、その誤認の可能性を大幅に低減させるこ
とができる。
According to the voice activation system (1), if the similarity between the input voice and the registered voice keyword is low, the voice control device is not activated. It is possible to reduce the possibility that the voice control device is activated, that is, the possibility of switching to the voice control mode. Therefore, even in a system in which a microphone or the like is shared between an in-vehicle hands-free telephone and a voice control device, which has conventionally been highly likely to be mistakenly recognized during a call, the voice activation system (1) is employed. Thereby, the possibility of the misidentification can be greatly reduced.

【0009】また、本発明に係る音声起動システム
(2)は、上記音声起動システム(1)において、入力
された音声パターンと予め記憶させておいた音素標準パ
ターンとから、パターンマッチング処理によって計測さ
れたパターン間距離に基づいて、前記類似値を決定する
ようになっていることを特徴としている。
In the voice activation system (2) according to the present invention, in the voice activation system (1), an input voice pattern and a phoneme standard pattern stored in advance are measured by a pattern matching process. The similarity value is determined based on the inter-pattern distance.

【0010】上記音声起動システム(2)によれば、パ
ターン間距離に基づいて決定された値を類似値として採
用するので、システムの信頼性を向上させることができ
る。
According to the voice activation system (2), the value determined based on the inter-pattern distance is adopted as the similar value, so that the reliability of the system can be improved.

【0011】また、本発明に係る音声起動システム
(3)は、上記音声起動システム(1)又は(2)にお
いて、入力された音声が音声キーワードであると判断さ
れた場合の過去の最大類似値に基づいて、所定値を設定
する第1の設定手段を備えていることを特徴としてい
る。
The voice activation system (3) according to the present invention is characterized in that in the voice activation system (1) or (2), the past maximum similarity value when the input voice is determined to be a voice keyword. And a first setting means for setting a predetermined value on the basis of the first setting value.

【0012】上記音声起動システム(3)によれば、過
去の判断実績(過去の最大類似値)に基づいて、所定値
を設定するので、より一層、誤認の可能性を低減させる
ことができる。例えば、入力音声が音声キーワードであ
ると判断された場合の類似値(過去の実績)が40、2
0、30、50、20、10である場合、過去の実績か
ら入力音声が音声キーワードであると判断する類似値は
50(最大類似値)以下で良いことが分かる。このとき
に設定されている所定値が200であれば50〜200
は不要であり、むしろ誤認の可能性を高めてしまう。そ
こで、誤認の可能性を低減させるためには、所定値を最
大類似値に基づいて設定し直すのが効果的である。例え
ば、所定値を70{=50(最大類似値)+20
(幅)}に設定する。これにより、特定の使用者に対し
て、通常の会話音や周囲の物音等で誤って音声制御モー
ドに切り替わることをほとんどなくすことができる。
According to the voice activation system (3), since the predetermined value is set based on the past judgment result (past maximum similarity value), the possibility of erroneous recognition can be further reduced. For example, when the similarity value (past performance) when it is determined that the input voice is a voice keyword is 40, 2,
In the case of 0, 30, 50, 20, and 10, it can be understood that the similarity value for determining that the input speech is a speech keyword is 50 or less (maximum similarity value) based on past results. If the predetermined value set at this time is 200, 50 to 200
Is unnecessary, but rather increases the possibility of misperception. Therefore, in order to reduce the possibility of erroneous recognition, it is effective to reset the predetermined value based on the maximum similarity value. For example, the predetermined value is set to 70 ° = 50 (maximum similar value) +20
(Width) Set to}. As a result, it is possible to almost completely prevent a specific user from erroneously switching to the voice control mode due to a normal conversation sound, a surrounding noise, or the like.

【0013】また、本発明に係る音声起動システム
(4)は、上記音声起動システム(3)において、前記
第1の設定手段により設定された所定値ではなく、予め
設定しておいた所定値に設定し直す第2の設定手段と、
該第2の設定手段を稼働させるための第1の入力手段と
を備えていることを特徴としている。
Further, the voice activation system (4) according to the present invention, in the voice activation system (3), does not use the predetermined value set by the first setting means but the predetermined value set in advance. Second setting means for resetting,
And a first input unit for operating the second setting unit.

【0014】特定の使用者にとって最適となるように設
定した所定値では、他の使用者にとって不具合が生じる
といった問題が考えられるが、上記音声起動システム
(3)を採用することによって、前記問題は解決され
る。
The predetermined value set so as to be optimal for a specific user may cause a problem for other users. However, by employing the voice activation system (3), the problem is solved. Will be resolved.

【0015】また、本発明に係る音声起動システム
(5)は、上記音声起動システム(1)〜(4)のいず
れかにおいて、所定値をより大きな値に設定し直す第3
の設定手段と、該第3の設定手段を稼働させるための第
2の入力手段とを備えていることを特徴としている。
Further, the voice activation system (5) according to the present invention is the third of the above voice activation systems (1) to (4), wherein the predetermined value is reset to a larger value.
And second input means for operating the third setting means.

【0016】上記音声起動システム(5)によれば、使
用者が前記第2の入力手段を用いて、所定値をより大き
な値に設定することができるので、音声キーワードを何
度発声しても音声制御モードに切り替わらないといった
場合に、大変有効である。
According to the voice activation system (5), the user can set the predetermined value to a larger value by using the second input means. This is very effective when the mode is not switched to the voice control mode.

【0017】また、本発明に係る音声起動システム
(6)は、上記音声起動システム(1)〜(5)のいず
れかにおいて、音声キーワードとの類似値が所定値以下
である入力音声の入力前後の所定時間が無音状態であっ
たか否かを判断する第1の無音状態判断手段を備えると
共に、前記所定時間が無音状態でなかったならば、前記
入力音声が前記音声キーワードでないと判断するよう
に、前記キーワード判断手段が構成されていることを特
徴としている。
Further, according to the voice activation system (6) of the present invention, in any one of the voice activation systems (1) to (5), before and after input of an input voice whose similarity value with the voice keyword is equal to or less than a predetermined value. A first silent state determining means for determining whether or not the predetermined time has been a silent state, and if the predetermined time has not been a silent state, determine that the input voice is not the voice keyword, It is characterized in that the keyword determining means is configured.

【0018】上記音声起動システム(6)によれば、入
力音声と登録されている音声キーワードとの類似値が所
定値以下であっても、前記入力音声における入力前後の
所定時間が無音状態でなければ、前記入力音声は通常の
会話中における音声等であるとみなして、音声制御モー
ドに切り替わらないようにすることができる。従って、
音声キーワード以外の発声音で誤って音声制御モードに
切り替わることをほとんどなくすことができる。
According to the voice activation system (6), even if the similarity value between the input voice and the registered voice keyword is equal to or less than the predetermined value, the predetermined time before and after the input in the input voice must be silent. For example, the input voice can be regarded as voice during a normal conversation or the like, so that the input voice is not switched to the voice control mode. Therefore,
The switch to the voice control mode by mistake due to the utterance sound other than the voice keyword can be almost eliminated.

【0019】また、本発明に係る音声起動システム
(7)は、上記音声起動システム(1)〜(6)のいず
れかにおいて、前記音声制御装置の起動後から引き続い
て所定時間、無音状態であったか否かを判断する第2の
無音状態判断手段を備えると共に、前記所定時間の間が
連続的に無音状態であれば、前記音声制御装置の起動を
解除するように制御する解除制御手段を備えていること
を特徴としている。
Further, the voice activation system (7) according to the present invention is the voice activation system according to any one of the voice activation systems (1) to (6), wherein the voice activation device has been in a silence state for a predetermined time after the activation of the voice control device. A second silent state determining unit for determining whether or not the sound control device is activated if the predetermined time period is a continuous silent state; It is characterized by having.

【0020】上記音声起動システム(7)によれば、前
記音声制御装置が起動したとしても、すなわち音声制御
モードに切り替わったとしても、切り替わった(起動)
後から前記所定時間の間が連続的に無音状態であれば、
前記起動は誤認によるものとみなして、前記音声制御装
置の起動を解除することができる。従って、音声キーワ
ード以外の発声音で誤って音声制御モードに切り替わっ
たとしても、自動的に通常の制御モードに戻すことがで
きる。
According to the voice activation system (7), the voice control device is switched (activated) even when the voice control device is activated, that is, when the voice control mode is switched.
If the predetermined time period is continuously silent afterwards,
The activation of the voice control device can be canceled by assuming that the activation is caused by misidentification. Therefore, even if the voice control mode is erroneously switched to the voice control mode by an utterance other than the voice keyword, the control mode can be automatically returned to the normal control mode.

【0021】また、本発明に係る音声起動システム
(8)は、上記音声起動システム(1)〜(7)のいず
れかにおいて、入力された音声と通話先からの音声とを
比較し、同一と判断すれば、前記入力音声を前記キーワ
ード判断手段に出力しないようにする比較手段を備えて
いることを特徴としている。
Further, the voice activation system (8) according to the present invention, in any one of the above-mentioned voice activation systems (1) to (7), compares the input voice with the voice from the called party and determines that they are the same. It is characterized in that a comparison means is provided for preventing the input voice from being output to the keyword judgment means when the judgment is made.

【0022】上記音声起動システム(8)によれば、通
話先からの音声によって誤って音声制御モードに切り替
わることをなくすことができる。
According to the voice activation system (8), it is possible to prevent the voice control mode from being erroneously switched to the voice control mode due to voice from the other party.

【0023】[0023]

【発明の実施の形態】以下、本発明に係る音声起動シス
テムの実施の形態を図面に基づいて説明する。図1は、
実施の形態に係る音声起動システム(1)の要部を概略
的に示したブロック図である。図中1はアンテナを示
し、アンテナ1は電話本体部2に接続されている。ま
た、スピーカ4、及び車載用ハンドフリー電話機と音声
制御装置9とで共有されるマイク5はアンプ3を介し
て、電話本体部2と音声認識手段6とにそれぞれ接続さ
れている。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of a voice activation system according to the present invention will be described below with reference to the drawings. FIG.
FIG. 2 is a block diagram schematically showing a main part of a voice activation system (1) according to the embodiment. In the figure, reference numeral 1 denotes an antenna, and the antenna 1 is connected to a telephone main body 2. The speaker 4 and the microphone 5 shared by the in-vehicle hands-free telephone and the voice control device 9 are connected to the telephone body 2 and the voice recognition means 6 via the amplifier 3.

【0024】キーワード判断手段7を含んで構成された
音声認識手段6は、音声制御装置9の起動制御を行なう
起動制御手段8に接続され、起動制御手段8は音声制御
装置9に接続されている。
The speech recognition means 6 including the keyword judgment means 7 is connected to the activation control means 8 for controlling the activation of the speech control device 9, and the activation control means 8 is connected to the speech control device 9. .

【0025】実施の形態に係る音声起動システム(1)
におけるキーワード判断手段7の動作を、図2に示した
フローチャートに基づいて説明する。まず、ステップ1
において、マイク5より入力された音声を取り込み、次
にステップ2において、入力音声と登録されている音声
キーワードとの類似値dを計測し、そしてステップ3に
移る。
Voice activation system (1) according to the embodiment
The operation of the keyword judging means 7 will be described based on the flowchart shown in FIG. First, step 1
At step 2, the voice input from the microphone 5 is fetched, and then at step 2, the similarity value d between the input voice and the registered voice keyword is measured.

【0026】類似値dの計測方法としては、音声が入力
されると、入力された音声パターン(以下、入力パター
ンと記す)と予め記憶させておいた音素標準パターンと
のパターン間距離(類似度)をDPマッチング法等のパ
ターンマッチングによって計測し、入力パターンが記憶
されている標準パターンのうちのどれに属するかを決定
し、そのときのパターン間距離を類似値dとする方法等
がある。また、パターン間距離としてはユークリッド距
離等が挙げられる。
As a method of measuring the similarity value d, when a voice is input, the inter-pattern distance (similarity degree) between the input voice pattern (hereinafter referred to as an input pattern) and a phoneme standard pattern stored in advance. ) Is measured by pattern matching such as the DP matching method, the input pattern is determined to which of the stored standard patterns, and the inter-pattern distance at that time is set as a similarity value d. The Euclidean distance or the like is used as the distance between patterns.

【0027】ステップ3では、類似値dが所定値t以下
であるか否かを判断し、所定値t以下であると判断すれ
ば、ステップ4に移って、音声制御装置9を起動させる
ように起動制御手段8に信号を出力し、一方、所定値t
以下でないと判断すれば、ステップ1に戻る。
In step 3, it is determined whether or not the similarity value d is equal to or less than a predetermined value t. If it is determined that the similarity value d is equal to or less than the predetermined value t, the process proceeds to step 4, where the voice control device 9 is activated. A signal is output to the activation control means 8, while a predetermined value t
If it is not, the procedure returns to step 1.

【0028】上記実施の形態に係る音声起動システム
(1)によれば、入力音声と登録されている音声キーワ
ードとの類似度が低ければ、音声制御装置9を起動させ
ないので、周囲の物音や、話し声等で誤って音声制御装
置9が起動する可能性、すなわち音声制御モードへ切り
替わる可能性を低減させることができる。従って、従来
では通話中においては誤認する可能性の高かった、車載
用ハンズフリー電話機と音声制御装置9とでマイク5を
共有させたシステムであっても、その誤認の可能性を大
幅に低減させることができる。
According to the voice activation system (1) according to the above-described embodiment, if the similarity between the input voice and the registered voice keyword is low, the voice control device 9 is not activated. It is possible to reduce the possibility that the voice control device 9 is erroneously activated by a voice or the like, that is, the possibility of switching to the voice control mode. Therefore, even in a system in which the microphone 5 is shared between the in-vehicle hands-free telephone and the voice control device 9 which has conventionally been highly likely to be erroneously recognized during a call, the possibility of erroneous recognition is greatly reduced. be able to.

【0029】図3は、実施の形態に係る音声起動システ
ム(2)の要部を概略的に示したブロック図である。こ
こでは、図1に示した音声起動システムと同様の構成に
ついては、その説明を省略する。
FIG. 3 is a block diagram schematically showing a main part of the voice activation system (2) according to the embodiment. Here, the description of the same configuration as the voice activation system shown in FIG. 1 is omitted.

【0030】キーワード判断手段7には、所定値tを設
定し直す第1の設定手段10、第2の設定手段11、及
び第3の設定手段13が接続され、また第2の設定手段
11、第3の設定手段13にはそれぞれ第1の入力手段
12、第2の入力手段14が接続されている。
A first setting means 10, a second setting means 11, and a third setting means 13 for resetting the predetermined value t are connected to the keyword judgment means 7, and the second setting means 11, The first input means 12 and the second input means 14 are connected to the third setting means 13, respectively.

【0031】実施の形態に係る音声起動システム(2)
における第1の設定手段10の動作を、図4に示したフ
ローチャートに基づいて説明する。まず、ステップ11
において、初期設定として最大類似値dMAX を0とし、
カウンタnを0とする。次にステップ12において、キ
ーワード判断手段7によって算出された類似値d(図2
のステップ2参照)を取り込み、そしてステップ13に
進む。
Voice activation system (2) according to the embodiment
The operation of the first setting means 10 will be described based on the flowchart shown in FIG. First, step 11
In the initial setting, the maximum similarity value d MAX is set to 0,
The counter n is set to 0. Next, at step 12, the similarity value d (FIG.
Step 2), and the process proceeds to step 13.

【0032】ステップ13では、類似値dが最大類似値
MAX よりも大であるか否かを判断し、大であると判断
すれば、ステップ14に移り、最大類似値dMAX を類似
値dとして、ステップ15に進む。一方、大でないと判
断すれば、ステップ14を飛ばしてそのままステップ1
5に進む。
[0032] At step 13, the similarity value d is determined whether is larger than the maximum similarity value d MAX, if it is determined that a large, moves to step 14, the similarity value d of the maximum similarity value d MAX And go to step 15. On the other hand, if it is determined that it is not large, step 14 is skipped and step 1 is left as it is.
Go to 5.

【0033】ステップ15では、カウンタnに1を加え
て、ステップ16に進み、ステップ16では、カウンタ
nが所定回数N以上であるか否かを判断する。所定回数
N以上であると判断すれば、ステップ17に移り、最大
類似値dMAX に所定幅αを加えたものを値t1 として、
ステップ18に進む。一方、所定回数N未満であると判
断すれば、ステップ12に戻る。ステップ18では、キ
ーワード判断手段7に設定されている所定値tを値t1
にして、ステップ12に戻る。
In step 15, 1 is added to the counter n, and the process proceeds to step 16. In step 16, it is determined whether or not the counter n is equal to or more than a predetermined number N. If it is determined that the number is equal to or more than the predetermined number N, the process proceeds to step 17, and a value obtained by adding a predetermined width α to the maximum similarity value d MAX is set as a value t 1 .
Proceed to step 18. On the other hand, if it is determined that the number is less than the predetermined number N, the process returns to step S12. In step 18, the predetermined value t set in the keyword determination means 7 is changed to a value t 1
Then, the process returns to step 12.

【0034】次に、第2の設定手段11を説明する。第
2の設定手段11は、第1の設定手段10により設定さ
れた所定値t1 を、予め設定しておいた所定値t0 に設
定し直すものであり、第1の入力手段12からの信号に
基づいて稼働するように構成されている。
Next, the second setting means 11 will be described. The second setting means 11 resets the predetermined value t 1 set by the first setting means 10 to a predetermined value t 0 set in advance. It is configured to operate based on a signal.

【0035】続いて、第3の設定手段13を説明する。
第3の設定手段13は、所定距離tをより大きな値に設
定するものであり、例えば、所定距離t0 を1.5倍し
たものを所定距離tとするものである。また、第2の入
力手段14からの信号に基づいて稼働するように構成さ
れている。
Next, the third setting means 13 will be described.
The third setting means 13 sets the predetermined distance t to a larger value, and for example, sets the predetermined distance t to 1.5 times the predetermined distance t 0 . Further, it is configured to operate based on a signal from the second input means 14.

【0036】上記実施の形態に係る音声起動システム
(2)によれば、過去の判断実績(過去の最大類似値d
MAX )に基づいて、所定値tを設定するので、より一
層、誤認の可能性を低減させることができる。例えば、
入力音声が音声キーワードであると判断された場合の類
似値が40、20、30、50、20、10である場
合、過去の実績から入力音声が音声キーワードであると
判断する類似値は50(最大類似値dMAX )以下で良い
ことが分かる。このときに設定されている所定値t0
200であれば50〜200は不要であり、むしろ誤認
の可能性を高めてしまう。そこで、誤認の可能性を低減
させるためには所定値t0 を最大類似値dMAX に基づい
て、設定し直すのが効果的である。例えば、所定値tを
70{=50(最大類似値dMAX )+20(幅α)}に
設定する。これにより、特定の使用者に対して、通常の
会話音や周囲の物音等で誤って音声制御モードに切り替
わることをほとんどなくすことができる。
According to the voice activation system (2) according to the above embodiment, the past judgment result (the past maximum similarity value d)
MAX ), the predetermined value t is set, so that the possibility of erroneous recognition can be further reduced. For example,
When the similarity value when the input voice is determined to be the voice keyword is 40, 20, 30, 50, 20, and 10, the similarity value for determining that the input voice is the voice keyword from the past results is 50 ( It can be seen that a value less than the maximum similarity value d MAX ) is good. If the predetermined value t 0 set at this time is 200, 50 to 200 are unnecessary, and the possibility of erroneous recognition is rather increased. Therefore, in order to reduce the possibility of erroneous recognition, it is effective to reset the predetermined value t 0 based on the maximum similarity value d MAX . For example, the predetermined value t is set to 70 {= 50 (maximum similar value d MAX ) +20 (width α)}. As a result, it is possible to almost completely prevent a specific user from erroneously switching to the voice control mode due to a normal conversation sound, a surrounding noise, or the like.

【0037】また、特定の使用者にとって最適となるよ
うに設定した所定値tでは、他の使用者にとって不具合
が生じるといった問題があるが、第2の設定手段11を
稼働させることによって、前記問題は解決される。
The predetermined value t set so as to be optimal for a specific user has a problem that another user may have a problem. However, the operation of the second setting means 11 causes the problem. Is resolved.

【0038】さらに、使用者が第2の入力手段14を用
いることによって、所定値tを大きく設定することがで
きるので、音声キーワードを何度発声しても、音声制御
装置9が起動しない場合に、すなわち音声制御モードに
切り替わらないといった場合に、大変有効である。
Further, since the user can set the predetermined value t to a large value by using the second input means 14, even if the voice control device 9 is not activated no matter how many times the voice keyword is uttered. That is, it is very effective when the mode is not switched to the voice control mode.

【0039】また、カウンタnが所定回数N以上である
か否かを判断する処理(ステップ15)を行なっている
のは、所定回数Nに満たない過去の実績からでは適切な
所定値tを設定することが困難であるからである。
The processing for determining whether or not the counter n is equal to or more than the predetermined number N (step 15) is performed because an appropriate predetermined value t is set based on past results less than the predetermined number N. It is difficult to do so.

【0040】図5は、実施の形態に係る音声起動システ
ム(3)の要部を概略的に示したブロック図である。こ
こでは、図1に示した音声起動システムと同様の構成に
ついては、その説明を省略する。
FIG. 5 is a block diagram schematically showing a main part of the voice activation system (3) according to the embodiment. Here, the description of the same configuration as the voice activation system shown in FIG. 1 is omitted.

【0041】第1の無音状態判断手段15はキーワード
判断手段7に接続され、キーワード判断手段7にて判断
対象となる音声の入力前後における音声情報を取り込ん
で、前記音声の入力前後の所定時間が無音状態であった
か否かを判断し、その判断結果をキーワード判断手段7
に出力するように構成されている。
The first silent state judging means 15 is connected to the keyword judging means 7 and fetches the speech information before and after the input of the sound to be judged by the keyword judging means 7 so that the predetermined time before and after the input of the sound is determined. It is determined whether or not there is a silent state, and the result of the determination is determined by the keyword determining means 7.
Is configured to be output.

【0042】実施の形態に係る音声起動システム(3)
におけるキーワード判断手段7の動作を、図6に示した
フローチャートに基づいて説明する。
Voice activation system (3) according to the embodiment
The operation of the keyword judging means 7 will be described with reference to the flowchart shown in FIG.

【0043】まず、ステップ21において、マイク5よ
り入力された音声を取り込み、次にステップ22におい
て、入力音声と登録されている音声キーワードとの類似
値dを算出し、そしてステップ23に移る。ステップ2
3では、類似値dが所定値t以下であるか否かを判断
し、所定値t以下であると判断すれば、ステップ24に
移り、一方、所定値t以下でないと判断すれば、ステッ
プ21に戻る。
First, in step 21, a voice input from the microphone 5 is fetched, and then in step 22, a similarity value d between the input voice and a registered voice keyword is calculated. Step 2
In 3, it is determined whether or not the similarity value d is equal to or less than a predetermined value t. If it is determined that the similarity value d is equal to or less than the predetermined value t, the process proceeds to step 24. Return to

【0044】ステップ24では、第1の無音状態判断手
段15における判断結果を取り込み、そしてステップ2
5に進み、取り込んだ判断結果が前記入力音声の入力前
後が無音状態であったことを示すものであれば、ステッ
プ26に移り、音声制御装置9を起動させるように起動
制御手段8に信号を出力し、一方、無音状態を示すもの
でなければ、ステップ21に戻る。
In step 24, the result of the judgment made by the first silent state judging means 15 is fetched, and in step 2
If the result of the determination indicates that there is no sound before and after the input of the input voice, the process proceeds to step 26 and a signal is sent to the activation control means 8 so as to activate the voice control device 9. If it does not indicate a silent state, the process returns to step 21.

【0045】上記実施の形態に係る音声起動システム
(3)によれば、入力音声と登録されている音声キーワ
ードとの類似値dが所定値t以下であっても、前記入力
音声における入力前後の所定時間が無音状態でなけれ
ば、前記入力音声は通常の会話中における音声等である
とみなして、音声制御装置9を起動させないように、す
なわち音声制御モードに切り替わらないようにすること
ができる。従って、音声キーワード以外の発声音で誤っ
て音声制御モードに切り替わることをほとんどなくすこ
とができる。
According to the voice activation system (3) according to the above-described embodiment, even if the similarity value d between the input voice and the registered voice keyword is equal to or less than the predetermined value t, the input voice before and after the input in the voice is not input. If the predetermined time is not a silent state, the input voice can be regarded as a voice during a normal conversation, and the voice control device 9 can be prevented from being activated, that is, not switched to the voice control mode. Therefore, it is possible to almost completely prevent the user from switching to the voice control mode by mistake due to the utterance sound other than the voice keyword.

【0046】図7は、実施の形態に係る音声起動システ
ム(4)の要部を概略的に示したブロック図である。こ
こでは、図1に示した音声起動システムと同様の構成に
ついては、その説明を省略する。図中16は、第2の無
音状態判断手段を示しており、第2の無音状態判断手段
16は音声認識手段6、及び起動制御手段8に接続され
ている。
FIG. 7 is a block diagram schematically showing a main part of the voice activation system (4) according to the embodiment. Here, the description of the same configuration as the voice activation system shown in FIG. 1 is omitted. In the figure, reference numeral 16 denotes a second silence state judging means. The second silence state judging means 16 is connected to the voice recognition means 6 and the activation control means 8.

【0047】実施の形態に係る音声起動システム(4)
における第2の無音状態判断手段16の動作を、図8に
示したフローチャートに基づいて説明する。まず、ステ
ップ31において、マイク5より入力された音声のう
ち、音声制御装置9の起動後から所定時間、音声情報を
取り込み、次にステップ32において、前記所定時間の
間が無音状態であったか否かを判断する。無音状態であ
ったと判断すれば、ステップ33に移って、音声制御装
置9の起動を解除するように起動制御手段8に信号を出
力し、一方、無音状態ではなかったと判断すれば、前記
動作は終了する。
Voice activation system (4) according to the embodiment
The operation of the second silent state judging means 16 will be described with reference to the flowchart shown in FIG. First, in step 31, voice information is fetched for a predetermined time after activation of the voice control device 9 from among the voices input from the microphone 5, and then in step 32, it is determined whether or not there is a silent state during the predetermined time. Judge. If it is determined that there is no sound, the process proceeds to step 33, where a signal is output to the activation control means 8 so as to release the activation of the voice control device 9. On the other hand, if it is determined that the sound is not silent, the above operation is performed. finish.

【0048】上記実施の形態に係る音声起動システム
(4)によれば、音声制御装置9が起動したとしても、
すなわち音声制御モードに切り替わったとしても、切り
替わった(起動)後から所定時間の間が連続的に無音状
態であれば、前記起動は誤認によるものとみなして、音
声制御装置9の起動を解除することができる。従って、
音声キーワード以外の発声音で誤って音声制御モードに
切り替わったとしても、自動的に通常の制御モードに戻
すことができる。
According to the voice activation system (4) according to the above embodiment, even if the voice control device 9 is activated,
In other words, even if the mode is switched to the voice control mode, if there is a continuous silent state for a predetermined time after the switching (startup), the activation is regarded as being caused by a false recognition, and the activation of the voice control device 9 is released. be able to. Therefore,
Even if the mode is switched to the voice control mode by mistake due to a utterance other than the voice keyword, the mode can be automatically returned to the normal control mode.

【0049】図9は、実施の形態に係る音声起動システ
ム(5)の要部を概略的に示したブロック図である。こ
こでは、図1に示した音声起動システムと同様の構成に
ついては、その説明を省略する。図中17は、比較手段
を示している。電話本体部2、及びアンプ3は比較手段
17に接続され、比較手段17は音声認識手段6に接続
されている。
FIG. 9 is a block diagram schematically showing a main part of the voice activation system (5) according to the embodiment. Here, the description of the same configuration as the voice activation system shown in FIG. 1 is omitted. In the figure, reference numeral 17 denotes a comparing means. The telephone main unit 2 and the amplifier 3 are connected to the comparing means 17, and the comparing means 17 is connected to the voice recognition means 6.

【0050】比較手段17は、通話先からの音声と、マ
イク5より入力された音声との相関係数を算出し、相関
係数が所定値以上であれば、マイク5より入力された音
声がスピーカ4より出力された通話先からの音声とみな
して、入力された音声を音声認識手段6に出力しないよ
うにするように構成されている。また、比較手段17と
しては、エコーキャンセル装置等が挙げられる。
The comparing means 17 calculates a correlation coefficient between the voice from the called party and the voice input from the microphone 5, and if the correlation coefficient is equal to or more than a predetermined value, the voice input from the microphone 5 is determined. It is configured such that the input voice is not output to the voice recognition unit 6 by regarding the voice output from the speaker 4 as the voice from the communication destination. In addition, examples of the comparing unit 17 include an echo canceling device.

【0051】上記実施の形態に係る音声起動システム
(5)によれば、通話先からの音声によって誤って音声
制御モードに切り替わることをなくすことができる。
According to the voice activation system (5) according to the above-described embodiment, it is possible to prevent the voice control mode from being erroneously switched to the voice control mode due to the voice from the called party.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態に係る音声起動システム
(1)の要部を概略的に示したブロック図である。
FIG. 1 is a block diagram schematically showing a main part of a voice activation system (1) according to an embodiment of the present invention.

【図2】実施の形態に係る音声起動システム(1)にお
けるキーワード判断手段の動作を示したフローチャート
である。
FIG. 2 is a flowchart showing an operation of a keyword determination unit in the voice activation system (1) according to the embodiment.

【図3】実施の形態に係る音声起動システム(2)の要
部を概略的に示したブロック図である。
FIG. 3 is a block diagram schematically showing a main part of a voice activation system (2) according to the embodiment.

【図4】実施の形態に係る音声起動システム(2)にお
ける第1の設定手段の動作を示したフローチャートであ
る。
FIG. 4 is a flowchart showing an operation of a first setting unit in the voice activation system (2) according to the embodiment.

【図5】実施の形態に係る音声起動システム(3)の要
部を概略的に示したブロック図である。
FIG. 5 is a block diagram schematically showing a main part of a voice activation system (3) according to the embodiment.

【図6】実施の形態に係る音声起動システム(3)にお
けるキーワード判断手段の動作を示したフローチャート
である。
FIG. 6 is a flowchart showing an operation of a keyword determination unit in the voice activation system (3) according to the embodiment.

【図7】実施の形態に係る音声起動システム(4)の要
部を概略的に示したブロック図である。
FIG. 7 is a block diagram schematically showing a main part of a voice activation system (4) according to the embodiment.

【図8】実施の形態に係る音声起動システム(4)にお
ける第2の無音状態判断手段の動作を示したフローチャ
ートである。
FIG. 8 is a flowchart showing an operation of a second silent state determination unit in the voice activation system (4) according to the embodiment.

【図9】実施の形態に係る音声起動システム(5)の要
部を概略的に示したブロック図である。
FIG. 9 is a block diagram schematically showing a main part of a voice activation system (5) according to the embodiment.

【符号の説明】[Explanation of symbols]

1 アンテナ 2 電話本体部 3 アンプ 4 スピーカ 5 マイク 6 音声認識手段 8 起動制御手段 DESCRIPTION OF SYMBOLS 1 Antenna 2 Telephone main body part 3 Amplifier 4 Speaker 5 Microphone 6 Voice recognition means 8 Activation control means

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 入力された音声が登録されている音声キ
ーワードであるか否かを判断するキーワード判断手段を
備えると共に、その判断結果に基づいて音声制御装置の
起動制御を行なう音声起動システムにおいて、 入力音声と音声キーワードとの類似値を計測し、計測さ
れた類似値が所定値以下であれば、前記入力音声が前記
音声キーワードであると判断するように、前記キーワー
ド判断手段が構成されていることを特徴とする音声起動
システム。
1. A voice activation system comprising: keyword determination means for determining whether an input voice is a registered voice keyword; and performing startup control of a voice control device based on the determination result. The keyword determination unit is configured to measure a similarity value between the input voice and the voice keyword, and determine that the input voice is the voice keyword if the measured similarity value is equal to or less than a predetermined value. A voice activation system, characterized in that:
【請求項2】 入力された音声パターンと予め記憶させ
ておいた音素標準パターンとから、パターンマッチング
処理によって計測されたパターン間距離に基づいて、前
記類似値を決定するようになっていることを特徴とする
請求項1記載の音声起動システム。
2. The method according to claim 1, wherein the similarity value is determined based on an inter-pattern distance measured by a pattern matching process from an input voice pattern and a phoneme standard pattern stored in advance. The voice activation system according to claim 1, wherein:
【請求項3】 入力された音声が音声キーワードである
と判断された場合の過去の最大類似値に基づいて、所定
値を設定する第1の設定手段を備えていることを特徴と
する請求項1又は請求項2記載の音声起動システム。
3. The apparatus according to claim 1, further comprising a first setting unit configured to set a predetermined value based on a past maximum similarity value when the input voice is determined to be a voice keyword. The voice activation system according to claim 1 or 2.
【請求項4】 前記第1の設定手段により設定された所
定値ではなく、予め設定しておいた所定値に設定し直す
第2の設定手段と、該第2の設定手段を稼働させるため
の第1の入力手段とを備えていることを特徴とする請求
項3記載の音声起動システム。
4. A second setting means for resetting a predetermined value, not a predetermined value set by said first setting means, to a predetermined value, and a second setting means for operating said second setting means. 4. The voice activation system according to claim 3, further comprising a first input unit.
【請求項5】 所定値をより大きな値に設定し直す第3
の設定手段と、該第3の設定手段を稼働させるための第
2の入力手段とを備えていることを特徴とする請求項1
〜4のいずれかの項に記載の音声起動システム。
5. A third method for resetting a predetermined value to a larger value.
And a second input means for operating the third setting means.
5. The voice activation system according to any one of Items 4 to 4.
【請求項6】 音声キーワードとの類似値が所定値以下
である入力音声の入力前後の所定時間が無音状態であっ
たか否かを判断する第1の無音状態判断手段を備えると
共に、前記所定時間が無音状態でなかったならば、前記
入力音声が前記音声キーワードでないと判断するよう
に、前記キーワード判断手段が構成されていることを特
徴とする請求項1〜5のいずれかの項に記載の音声起動
システム。
6. A first silent state judging means for judging whether or not a predetermined period of time before and after the input of an input sound whose similarity value with the voice keyword is equal to or less than a predetermined value is not included. The voice according to any one of claims 1 to 5, wherein the keyword determining means is configured to determine that the input voice is not the voice keyword if the voice is not in a silent state. Activation system.
【請求項7】 前記音声制御装置の起動後から引き続い
て所定時間、無音状態であったか否かを判断する第2の
無音状態判断手段を備えると共に、前記所定時間の間が
連続的に無音状態であれば、前記音声制御装置の起動を
解除するように制御する解除制御手段を備えていること
を特徴とする請求項1〜6のいずれかの項に記載の音声
起動システム。
7. A second silent state judging means for judging whether or not a silent state has continued for a predetermined time after the activation of the voice control device, and a continuous silent state during the predetermined time period. The voice activation system according to any one of claims 1 to 6, further comprising a release control unit configured to release the activation of the voice control device, if any.
【請求項8】 入力された音声と通話先からの音声とを
比較し、同一と判断すれば、前記入力音声を前記キーワ
ード判断手段に出力しないようにする比較手段を備えて
いることを特徴とする請求項1〜7のいずれかの項に記
載の音声起動システム。
8. A comparison means for comparing the input voice with the voice from the called party and determining that the input voice is not output to the keyword determining means if the voice is determined to be the same. The voice activation system according to claim 1.
JP03737498A 1998-02-19 1998-02-19 Voice activation system Expired - Fee Related JP3524370B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03737498A JP3524370B2 (en) 1998-02-19 1998-02-19 Voice activation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03737498A JP3524370B2 (en) 1998-02-19 1998-02-19 Voice activation system

Publications (2)

Publication Number Publication Date
JPH11231896A true JPH11231896A (en) 1999-08-27
JP3524370B2 JP3524370B2 (en) 2004-05-10

Family

ID=12495753

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03737498A Expired - Fee Related JP3524370B2 (en) 1998-02-19 1998-02-19 Voice activation system

Country Status (1)

Country Link
JP (1) JP3524370B2 (en)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015052745A (en) * 2013-09-09 2015-03-19 Necパーソナルコンピュータ株式会社 Information processor, control method and program
JP2015052744A (en) * 2013-09-09 2015-03-19 Necパーソナルコンピュータ株式会社 Information processor, control method and program
JP2015052743A (en) * 2013-09-09 2015-03-19 Necパーソナルコンピュータ株式会社 Information processor, method of controlling information processor and program
US9418653B2 (en) 2014-05-20 2016-08-16 Panasonic Intellectual Property Management Co., Ltd. Operation assisting method and operation assisting device
JP2017520008A (en) * 2014-10-09 2017-07-20 グーグル インコーポレイテッド Hotword detection on multiple devices
US9792914B2 (en) 2014-07-18 2017-10-17 Google Inc. Speaker verification using co-location information
US9972320B2 (en) 2016-08-24 2018-05-15 Google Llc Hotword detection on multiple devices
JP2018194844A (en) * 2017-05-19 2018-12-06 ネイバー コーポレーションNAVER Corporation Speech-controlling apparatus, method of operating the same, computer program, and recording medium
US10395650B2 (en) 2017-06-05 2019-08-27 Google Llc Recorded media hotword trigger suppression
US10497364B2 (en) 2017-04-20 2019-12-03 Google Llc Multi-user authentication on a device
US10692496B2 (en) 2018-05-22 2020-06-23 Google Llc Hotword suppression
US10867600B2 (en) 2016-11-07 2020-12-15 Google Llc Recorded media hotword trigger suppression
US11676608B2 (en) 2021-04-02 2023-06-13 Google Llc Speaker verification using co-location information
US11942095B2 (en) 2014-07-18 2024-03-26 Google Llc Speaker verification using co-location information

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015052744A (en) * 2013-09-09 2015-03-19 Necパーソナルコンピュータ株式会社 Information processor, control method and program
JP2015052743A (en) * 2013-09-09 2015-03-19 Necパーソナルコンピュータ株式会社 Information processor, method of controlling information processor and program
JP2015052745A (en) * 2013-09-09 2015-03-19 Necパーソナルコンピュータ株式会社 Information processor, control method and program
US9418653B2 (en) 2014-05-20 2016-08-16 Panasonic Intellectual Property Management Co., Ltd. Operation assisting method and operation assisting device
US10147429B2 (en) 2014-07-18 2018-12-04 Google Llc Speaker verification using co-location information
US10986498B2 (en) 2014-07-18 2021-04-20 Google Llc Speaker verification using co-location information
US9792914B2 (en) 2014-07-18 2017-10-17 Google Inc. Speaker verification using co-location information
US11942095B2 (en) 2014-07-18 2024-03-26 Google Llc Speaker verification using co-location information
US10593330B2 (en) 2014-10-09 2020-03-17 Google Llc Hotword detection on multiple devices
US10909987B2 (en) 2014-10-09 2021-02-02 Google Llc Hotword detection on multiple devices
US11915706B2 (en) 2014-10-09 2024-02-27 Google Llc Hotword detection on multiple devices
US11557299B2 (en) 2014-10-09 2023-01-17 Google Llc Hotword detection on multiple devices
US10134398B2 (en) 2014-10-09 2018-11-20 Google Llc Hotword detection on multiple devices
JP2017520008A (en) * 2014-10-09 2017-07-20 グーグル インコーポレイテッド Hotword detection on multiple devices
US10242676B2 (en) 2016-08-24 2019-03-26 Google Llc Hotword detection on multiple devices
US9972320B2 (en) 2016-08-24 2018-05-15 Google Llc Hotword detection on multiple devices
US11276406B2 (en) 2016-08-24 2022-03-15 Google Llc Hotword detection on multiple devices
US11887603B2 (en) 2016-08-24 2024-01-30 Google Llc Hotword detection on multiple devices
US10714093B2 (en) 2016-08-24 2020-07-14 Google Llc Hotword detection on multiple devices
US11798557B2 (en) 2016-11-07 2023-10-24 Google Llc Recorded media hotword trigger suppression
US10867600B2 (en) 2016-11-07 2020-12-15 Google Llc Recorded media hotword trigger suppression
US11257498B2 (en) 2016-11-07 2022-02-22 Google Llc Recorded media hotword trigger suppression
US10522137B2 (en) 2017-04-20 2019-12-31 Google Llc Multi-user authentication on a device
US11238848B2 (en) 2017-04-20 2022-02-01 Google Llc Multi-user authentication on a device
US11087743B2 (en) 2017-04-20 2021-08-10 Google Llc Multi-user authentication on a device
US11727918B2 (en) 2017-04-20 2023-08-15 Google Llc Multi-user authentication on a device
US10497364B2 (en) 2017-04-20 2019-12-03 Google Llc Multi-user authentication on a device
US11721326B2 (en) 2017-04-20 2023-08-08 Google Llc Multi-user authentication on a device
JP2018194844A (en) * 2017-05-19 2018-12-06 ネイバー コーポレーションNAVER Corporation Speech-controlling apparatus, method of operating the same, computer program, and recording medium
JP2022033258A (en) * 2017-05-19 2022-02-28 ネイバー コーポレーション Speech control apparatus, operation method and computer program
JP2019133182A (en) * 2017-05-19 2019-08-08 ネイバー コーポレーションNAVER Corporation Speech control apparatus, speech control method, computer program, and recording medium
US11798543B2 (en) 2017-06-05 2023-10-24 Google Llc Recorded media hotword trigger suppression
US11244674B2 (en) 2017-06-05 2022-02-08 Google Llc Recorded media HOTWORD trigger suppression
US10395650B2 (en) 2017-06-05 2019-08-27 Google Llc Recorded media hotword trigger suppression
US11373652B2 (en) 2018-05-22 2022-06-28 Google Llc Hotword suppression
US10692496B2 (en) 2018-05-22 2020-06-23 Google Llc Hotword suppression
US11967323B2 (en) 2018-05-22 2024-04-23 Google Llc Hotword suppression
US11676608B2 (en) 2021-04-02 2023-06-13 Google Llc Speaker verification using co-location information

Also Published As

Publication number Publication date
JP3524370B2 (en) 2004-05-10

Similar Documents

Publication Publication Date Title
US7050550B2 (en) Method for the training or adaptation of a speech recognition device
US6574601B1 (en) Acoustic speech recognizer system and method
JP3674990B2 (en) Speech recognition dialogue apparatus and speech recognition dialogue processing method
JPH11231896A (en) Speech startup system
US20050216271A1 (en) Speech dialogue system for controlling an electronic device
US9413864B2 (en) Controlling mute function on telephone
US20080249779A1 (en) Speech dialog system
JP2003202897A (en) Speech recognizing device for on-vehicle equipment
EP1747553A1 (en) Detection of end of utterance in speech recognition system
EP1494208A1 (en) Method for controlling a speech dialog system and speech dialog system
JP4520596B2 (en) Speech recognition method and speech recognition apparatus
US20070118380A1 (en) Method and device for controlling a speech dialog system
EP3654329B1 (en) In-vehicle device and speech recognition method
JP2008026463A (en) Voice interaction apparatus
JP6459330B2 (en) Speech recognition apparatus, speech recognition method, and speech recognition program
JPH1152976A (en) Voice recognition device
JPH11126092A (en) Voice recognition device and on-vehicle voice recognition device
JP2000322078A (en) On-vehicle voice recognition device
JP2001154694A (en) Voice recognition device and method
JP2000163098A (en) Voice recognition device
JP2002091489A (en) Voice recognition device
JPH1091184A (en) Sound detection device
JP2003255987A (en) Method, unit, and program for control over equipment using speech recognition
KR100194765B1 (en) Speech recognition system using echo cancellation and method
JP2754960B2 (en) Voice recognition device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040212

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080220

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090220

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090220

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100220

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees