JP3920097B2 - Voice recognition device for in-vehicle equipment - Google Patents

Voice recognition device for in-vehicle equipment Download PDF

Info

Publication number
JP3920097B2
JP3920097B2 JP2002001605A JP2002001605A JP3920097B2 JP 3920097 B2 JP3920097 B2 JP 3920097B2 JP 2002001605 A JP2002001605 A JP 2002001605A JP 2002001605 A JP2002001605 A JP 2002001605A JP 3920097 B2 JP3920097 B2 JP 3920097B2
Authority
JP
Japan
Prior art keywords
command
reliability threshold
reliability
important
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002001605A
Other languages
Japanese (ja)
Other versions
JP2003202897A (en
Inventor
史尚 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2002001605A priority Critical patent/JP3920097B2/en
Publication of JP2003202897A publication Critical patent/JP2003202897A/en
Application granted granted Critical
Publication of JP3920097B2 publication Critical patent/JP3920097B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
この発明は、車載情報機器(カーナビゲーション)または車両制御機器において、利用者によって音声入力されたコマンドを認識する車載機器用音声認識装置に関するものである。
【0002】
【従来の技術】
音声認識は、他のコマンドに誤認識したり、認識できない可能性がある。
特に、車載搭載環境では、走行騒音による影響から、より認識し難い環境であるため、特公平2−2158号公報では、走行/停車判定を行い、走行状態での認識率向上策が記載されている。
【0003】
【発明が解決しようとする課題】
従来の車載機器用音声認識装置は以上のように構成されているので、コマンドの重要度に応じて、認識確度を高めたり、逆に認識率を高めたりすることができなかった。
すなわち、コマンドによっては、誤認識した場合に、その操作を戻すことができない、戻すのに時間を要する、誤動作により利用者が混乱する等、コマンドの誤認識により安全性や操作性が著しく損なわれるため、認識確度を高めたい重要コマンドがある。逆にコマンドによっては、使用頻度が高かったり、騒音に対して認識しづらくなってしまう短いコマンドがあり、コマンドの誤認率の低下により利便性が損なわれるため、認識率を高めたい非重要コマンドがある。
しかしながら、従来の技術では、重要コマンドに対して認識確度を高めたり、逆に、非重要コマンドに対して認識率を高めたりすることができないなどの課題があった。
【0004】
この発明は上記のような課題を解決するためになされたもので、コマンドの重要度に応じて、認識確度を高めたり、逆に認識率を高めるように設定可能にし、安全性および利便性の両者を向上させる車載機器用音声認識装置を得るものである。
【0005】
【課題を解決するための手段】
この発明に係る車載機器用音声認識装置は、各命令に要求される認識確度に応じた信頼度閾値を保持した信頼度閾値保持手段と、音声入力手段から入力された音声情報が重要命令であるか否かを判定する重要命令設定手段と、音声認識処理手段によって認識された命令に対応する信頼度閾値を信頼度閾値保持手段から抽出し、その命令の信頼度が信頼度閾値以上である場合に、その命令が重要命令設定手段によって重要でないと判断された際は、信頼度閾値が小さくなるように変更して信頼度閾値保持手段に保持させるよう許可して実行する命令実行処理手段とを備えたものである。
【0006】
この発明に係る車載機器用音声認識装置は、命令実行処理手段において、音声認識処理手段によって認識された命令に対応する信頼度閾値を信頼度閾値保持手段から抽出し、その命令の信頼度がその信頼度閾値以上である場合に、その命令が重要命令設定手段によって重要であると判断された際は、信頼度閾値を変更せずに実行するようにしたものである
【0007】
この発明に係る車載機器用音声認識装置は、重要命令設定手段において、信頼度閾値保持手段に保持される各命令毎に重要命令であるか否かの設定に基づくようにしたものである。
【0008】
この発明に係る車載機器用音声認識装置は、命令実行処理手段において、信頼度閾値変更機能設定手段による設定に応じて信頼度閾値を小さくなるように変更する機能を有効または無効にするようにしたものである。
【0010】
【発明の実施の形態】
以下、この発明の実施の一形態を説明する。
実施の形態1.
図1はこの発明の実施の形態1による車載機器用音声認識装置を示す構成図であり、図において、1はカーナビゲーション等の車載情報機器である。
2は利用者によってコマンド(命令)等が音声入力されるマイク(音声入力手段)、3は利用者によって音声入力のタイミングに応じて操作される発話スイッチである。
4はマイク2からの音声信号を信号処理する音声入力回路(音声入力手段)、5は単語を基準音声データとして記憶した認識単語辞書データテーブル(基準音声情報記憶手段)、6は音声入力回路4によって信号処理された音声データと、認識単語辞書データテーブル5の基準音声データとを比較照合して、両者が類似する基準音声データに応じたコマンドを認識すると共に、その類似性に応じたスコア(信頼度)を生成する音声認識処理部(音声認識処理手段)である。
7は各種コマンドにそれぞれ対応して、各コマンドに要求される認識確度(認識されるコマンドの確からしさ)に応じたスコア閾値を保持したスコア閾値データテーブル(信頼度閾値保持手段)、8は音声認識処理部6によって認識されたコマンドに対応するスコア閾値をスコア閾値データテーブル7から抽出し、そのコマンドのスコアがそのスコア閾値以上であるか否かを判定する音声操作処理部(命令実行処理手段)、9は音声操作処理部8によってコマンドのスコアがスコア閾値未満であると判定された場合に、音声入力されたコマンドが認識できなかったことを表示し、コマンドのスコアがスコア閾値以上であると判定された場合に、音声入力されたコマンドが認識できたことを表示する音声操作応答処理表示部、10は音声操作処理部8によってコマンドのスコアがスコア閾値以上であると判定された場合に、そのコマンドに応じた処理を実行するアプリケーション処理部(命令実行処理手段)である。
図2はこの発明の実施の形態1による車載機器用音声認識装置の動作を示すフローチャートである。
【0011】
次に動作について説明する。
図において、発話スイッチ3が利用者によって押下されると、音声認識処理部6の認識処理が開始され、音声認識処理部6は待ち状態となる(ステップST1)。
マイク2から音声入力された音声信号は、音声入力回路4により信号増幅、帯域フィルタ処理、AD変換処理等を行い、最適な音声データとなるように処理される(ステップST2)。
音声認識処理部6は、音声入力回路4によって信号処理された音声データと、認識単語辞書データテーブル5として記憶された基準音声データとを比較照合して、近いパターンのものを候補として選択し、入力された音声データに類似する1つ以上のコマンドを認識する。また、その類似性に応じたスコアを生成する(ステップST3)。ここで、認識単語辞書データテーブル5は、単語毎に基準音声データとして記憶し、音声認識処理部6において、類似する単語から、または類似する単語の組み合せから入力されるコマンドを認識する。また、認識単語辞書データテーブル5は、コマンド毎に基準音声データとして記憶し、音声認識処理部6において、類似するコマンドから入力されるコマンドを認識するものであっても良い。
【0012】
音声操作処理部8は、音声認識処理部6からその認識結果であるコマンドと、そのコマンドに応じたスコアとを取得する(ステップST4)。
音声操作処理部8は、音声認識処理部6によって認識されたコマンドに対応するスコア閾値をスコア閾値データテーブル7から抽出し、そのコマンドのスコアがそのスコア閾値以上であるか否かを判定する(ステップST5)。
音声操作処理部8は、コマンドのスコアがスコア閾値未満であると判定した場合に、音声入力されたコマンドが認識できなかったことを音声操作応答処理表示部9に表示し、処理を終了する(ステップST6)。ここで、音声操作応答処理表示部9にコマンドが認識できなかったことを表示したが、コマンドが認識できなかったことを音声によって報知するようにしても良い。
音声操作処理部8は、コマンドのスコアがスコア閾値以上であると判定した場合に、音声入力されたコマンドが認識できたとみなした場合は、その認識したコマンドを音声操作応答処理表示部9に表示する。また、その認識したコマンドに応じた所定の動作を行うようにカーナビゲーション等のアプリケーション処理部10に処理を依頼し、それを受けたアプリケーション処理部10は、そのコマンドに応じた処理を実行する(ステップST7)。ここで、アプリケーション処理部10は、1つ以上設けられ、処理の実行は複数のアプリケーション処理部10で行うようにしても良い。
【0013】
スコア閾値データテーブル7では、全コマンド共通に一律のスコア閾値を保持したものではなく、各種コマンドにそれぞれ対応して、各コマンドに要求される認識確度に応じたスコア閾値を保持したものである。
具体的には、コマンドの誤認識した場合に、その操作を戻すことができない、戻すのに時間を要する、誤動作により利用者が混乱する等、コマンドの誤認識により安全性や操作性が著しく損なわれる重要コマンドについてはスコア閾値を予め大きく設定しておき、逆にコマンドによっては、使用頻度が高かったり、騒音に対して認識しづらくなってしまう短いコマンドがあるが、コマンドの誤認率の低下により利便性が損なわれる非重要コマンドについてはスコア閾値を予め小さく設定しておく。
このように、スコア閾値データテーブル7においてスコア閾値を設定しておけば、音声操作処理部8において、重要コマンドに対しては認識確度が向上し、非重要コマンドに対しては認識率、すなわち、コマンドを許可する率が向上し、トレードオフの関係にある認識確度と認識率とを調整し、安全性および利便性の両者を向上させることができる。
【0014】
また、音声操作処理部8は、ステップST7においてアプリケーション処理部10に処理依頼した後に、その認識したコマンドが重要コマンドであるか否かを判定する(ステップST8)。
ここで、コマンドに対応して重要コマンドであるか否かの設定手法としては、一例として、スコア閾値データテーブル7において、各コマンド毎に重要コマンドであるか否かを予め設定し保持しておき、音声操作処理部8において、スコア閾値データテーブル7に保持された内容から、認識されたコマンドに対応して重要コマンドが設定されているか否かを判定する手法がある。
また、別の例としては、マイク2からの音声入力時に、その音声入力が重要コマンドであるか否かが利用者の操作によって設定される操作スイッチ、あるいは、マイク2からの音声入力により重要コマンドであるか否かが判定される手段を設け、このような重要命令設定手段によって重要コマンドを設定して、音声操作処理部8において、認識されたコマンドに対応して重要命令設定手段によって重要コマンドが設定されているか否かを判定する手法がある。
音声操作処理部8は、ステップST8において、その認識したコマンドが重要コマンドであると判定した場合には、処理を終了する。
一方、ステップST8において、その認識したコマンドが重要コマンドでないと判定した場合には、スコア閾値データテーブル7から抽出され、ステップST5において判定に用いられたスコア閾値を、所定値あるいは所定率だけ小さくなるように変更して、その変更したスコア閾値をスコア閾値データテーブル7に保持させる(ステップST9)。ここで、重要コマンドではない同一のコマンドが認識される度に、スコア閾値は小さく設定されていくが、スコア閾値があまりにも小さく設定され、誤認識が増加してしまうことを防止するために、スコア閾値には下限値を設け、スコア閾値は下限値よりも小さく変更されないようにする。
このようにすることによって、コマンドが音声入力され、そのコマンドが許可される毎にスコア閾値が小さくなるように変更されるので、そのコマンドの使用頻度が増す毎に、認識率が向上し、利便性を向上させることができる。
また、使用頻度が多いコマンドであっても、認識確度が要求される重要コマンドに対してはスコア閾値を変更しないようにすることによって、重要コマンドの誤認識を防止し、安全性を維持することができる。
【0015】
さらに、音声操作処理部8によるスコア閾値を小さくなるように変更する機能を有効または無効に設定する操作スイッチ(信頼度閾値変更機能設定手段)を設け、音声操作処理部8では、その操作スイッチによる設定に応じて、スコア閾値を小さくなるように変更する機能を有効または無効にするようにしても良い。
【0016】
【発明の効果】
以上のように、この発明によれば、各命令に要求される認識確度に応じた信頼度閾値を保持した信頼度閾値保持手段と、音声入力手段から入力された音声情報が重要命令であるか否かを判定する重要命令設定手段と、音声認識処理手段によって認識された命令に対応する信頼度閾値を信頼度閾値保持手段から抽出し、その命令の信頼度が信頼度閾値以上である場合に、その命令が重要命令設定手段によって重要でないと判断された際は、信頼度閾値が小さくなるように変更して信頼度閾値保持手段に保持させるよう許可して実行する命令実行処理手段とを備えるように構成したので、信頼度閾値保持手段に予め設定される信頼度閾値を、命令の誤認識により安全性や操作性が著しく損なわれる重要命令については大きく設定し、逆に、使用頻度が高い命令や騒音に対して認識しずらくなってしまう非重要命令については小さく設定すれば、重要命令に対しては認識確度が向上し、非重要命令に対しては認識率、すなわち、命令を許可する率が向上し、安全性および利便性の両者を向上させることができる効果がある。
【0017】
この発明によれば、命令実行処理手段において、音声認識処理手段によって認識された命令に対応する信頼度閾値を信頼度閾値保持手段から抽出し、その命令の信頼度がその信頼度閾値以上である場合に、その命令が重要命令設定手段によって重要であると判断された際は、信頼度閾値を変更せずに実行するように構成したので、命令が音声情報として入力され、その命令を許可された場合でも、認識確度が要求される重要命令に対しては信頼度閾値を変更しないようにすることによって、重要命令の誤認識を防止し、安全性を維持することができる効果がある。
【0018】
この発明によれば、重要命令設定手段において、信頼度閾値保持手段に保持される各命令毎に重要命令であるか否かの設定に基づくように構成したので、各命令毎に認識確度と認識率とを調整し、安全性および利便性の両方を向上させることができる効果がある。
【0019】
この発明によれば、命令実行処理手段において、信頼度閾値変更機能設定手段による設定に応じて信頼度閾値を小さくなるように変更する機能を有効または無効にするように構成したので、命令の使用頻度が増す毎に認識率を向上させる機能を有効にするか、予め設定された信頼度閾値を固定にして認識確度および認識率を保持する機能を有効にするか、利用者が選択することができる効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1による車載機器用音声認識装置を示す構成図である。
【図2】 この発明の実施の形態1による車載機器用音声認識装置の動作を示すフローチャートである。
【符号の説明】
1 車載情報機器、2 マイク(音声入力手段)、3 発話スイッチ、4 音声入力回路(音声入力手段)、5 認識単語辞書データテーブル(基準音声情報記憶手段)、6 音声認識処理部(音声認識処理手段)、7 スコア閾値データテーブル(信頼度閾値保持手段)、8 音声操作処理部(命令実行処理手段)、9 音声操作応答処理表示部、10 アプリケーション処理部(命令実行処理手段)。
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a vehicle-mounted device voice recognition device that recognizes a command input by a user in a vehicle-mounted information device (car navigation) or a vehicle control device.
[0002]
[Prior art]
Voice recognition may be misrecognized or not recognized by other commands.
In particular, in the in-vehicle environment, because it is an environment that is more difficult to recognize due to the influence of traveling noise, Japanese Patent Publication No. 2-2158 discloses a traveling / stop determination and a measure for improving the recognition rate in a traveling state. Yes.
[0003]
[Problems to be solved by the invention]
Since the conventional voice recognition apparatus for in-vehicle devices is configured as described above, it has been impossible to increase the recognition accuracy or increase the recognition rate according to the importance of the command.
That is, depending on the command, if it is misrecognized, the operation cannot be restored, it takes time to restore, the user is confused by malfunction, etc., and the safety and operability are significantly impaired by the misrecognition of the command. Therefore, there is an important command for which recognition accuracy is desired to be increased. On the other hand, depending on the command, there are short commands that are frequently used or difficult to recognize against noise, and the convenience is lost due to a decrease in the misperception rate of the command. is there.
However, the conventional technique has a problem that it is not possible to increase the recognition accuracy for an important command or, conversely, increase the recognition rate for an unimportant command.
[0004]
The present invention has been made to solve the above-described problems, and can be set to increase the recognition accuracy or conversely increase the recognition rate in accordance with the importance of the command, thereby improving safety and convenience. A voice recognition device for in-vehicle equipment that improves both is obtained.
[0005]
[Means for Solving the Problems]
In the on-vehicle equipment voice recognition device according to the present invention, the reliability threshold holding means holding the reliability threshold corresponding to the recognition accuracy required for each command, and the voice information input from the voice input means are important commands. When the reliability threshold value corresponding to the command recognized by the important command setting unit and the voice recognition processing unit is extracted from the reliability threshold holding unit, and the reliability of the command is equal to or higher than the reliability threshold value In addition, when it is determined that the instruction is not important by the important instruction setting means, the instruction execution processing means is executed to allow the reliability threshold value to be changed and to be held in the reliability threshold value holding means. It is provided.
[0006]
In the in-vehicle device speech recognition apparatus according to the present invention, in the instruction execution processing unit, the reliability threshold corresponding to the instruction recognized by the speech recognition processing unit is extracted from the reliability threshold holding unit, and the reliability of the instruction is If it is determined that the instruction is important by the important instruction setting means when the reliability threshold is equal to or higher than the reliability threshold, the instruction is executed without changing the reliability threshold .
[0007]
The on-vehicle equipment speech recognition apparatus according to the present invention is based on the setting of whether or not each command held in the reliability threshold holding unit is an important command in the important command setting unit.
[0008]
The voice recognition device for on-vehicle equipment according to the present invention enables or disables the function of changing the reliability threshold value to be small in accordance with the setting by the reliability threshold value changing function setting unit in the instruction execution processing unit. Is.
[0010]
DETAILED DESCRIPTION OF THE INVENTION
An embodiment of the present invention will be described below.
Embodiment 1 FIG.
FIG. 1 is a block diagram showing an on-vehicle equipment speech recognition apparatus according to Embodiment 1 of the present invention. In the figure, 1 is an on-vehicle information equipment such as a car navigation system.
Reference numeral 2 denotes a microphone (voice input means) in which commands (commands) and the like are input by the user. Reference numeral 3 denotes an utterance switch operated by the user in accordance with the voice input timing.
4 is a voice input circuit (speech input means) for processing a voice signal from the microphone 2, 5 is a recognized word dictionary data table (reference voice information storage means) storing words as reference voice data, and 6 is a voice input circuit 4. Is compared with the reference voice data in the recognized word dictionary data table 5 to recognize a command corresponding to the reference voice data similar to each other, and a score corresponding to the similarity ( A speech recognition processing unit (speech recognition processing means) for generating (reliability).
7 is a score threshold data table (reliability threshold holding means) which holds score thresholds corresponding to various commands and corresponding to the recognition accuracy (probability of recognized commands) required for each command, and 8 is a voice A voice operation processing unit (command execution processing means) that extracts a score threshold corresponding to the command recognized by the recognition processing unit 6 from the score threshold data table 7 and determines whether the score of the command is equal to or higher than the score threshold. ), 9 indicates that when the voice operation processing unit 8 determines that the command score is less than the score threshold, the voice input command cannot be recognized, and the command score is greater than or equal to the score threshold. A voice operation response processing display unit 10 for displaying that the command inputted by voice has been recognized. The part 8 when the score command is determined to be equal to or greater than the score threshold, an application processing unit for executing processing corresponding to the command (the command execution means).
FIG. 2 is a flowchart showing the operation of the on-vehicle equipment speech recognition apparatus according to Embodiment 1 of the present invention.
[0011]
Next, the operation will be described.
In the figure, when the utterance switch 3 is pressed by the user, the recognition processing of the voice recognition processing unit 6 is started, and the voice recognition processing unit 6 enters a waiting state (step ST1).
The voice signal input from the microphone 2 is subjected to signal amplification, band-pass filter processing, AD conversion processing, and the like by the voice input circuit 4 and processed so as to become optimum voice data (step ST2).
The voice recognition processing unit 6 compares and collates the voice data signal-processed by the voice input circuit 4 with the reference voice data stored as the recognized word dictionary data table 5, and selects a similar pattern as a candidate, Recognize one or more commands similar to the input voice data. Further, a score corresponding to the similarity is generated (step ST3). Here, the recognized word dictionary data table 5 is stored as reference speech data for each word, and the speech recognition processing unit 6 recognizes a command input from a similar word or a combination of similar words. The recognition word dictionary data table 5 may be stored as reference voice data for each command, and the voice recognition processing unit 6 may recognize commands input from similar commands.
[0012]
The voice operation processing unit 8 obtains a command that is the recognition result and a score corresponding to the command from the voice recognition processing unit 6 (step ST4).
The voice operation processing unit 8 extracts a score threshold corresponding to the command recognized by the voice recognition processing unit 6 from the score threshold data table 7, and determines whether or not the score of the command is equal to or higher than the score threshold ( Step ST5).
When it is determined that the command score is less than the score threshold, the voice operation processing unit 8 displays on the voice operation response processing display unit 9 that the command input by voice has not been recognized, and ends the processing ( Step ST6). Here, the voice operation response processing display unit 9 displays that the command could not be recognized, but it may be notified by voice that the command could not be recognized.
If the voice operation processing unit 8 determines that the command score is equal to or greater than the score threshold and determines that the voice input command has been recognized, the voice operation processing unit 8 displays the recognized command on the voice operation response processing display unit 9. To do. In addition, the application processing unit 10 such as car navigation is requested to perform a predetermined operation according to the recognized command, and the application processing unit 10 receiving the request executes the processing according to the command ( Step ST7). Here, one or more application processing units 10 may be provided, and the processing may be performed by a plurality of application processing units 10.
[0013]
The score threshold data table 7 does not hold a uniform score threshold common to all commands, but holds score thresholds corresponding to various commands and corresponding to the recognition accuracy required for each command.
Specifically, when a command is misrecognized, the operation cannot be restored, it takes time to restore, the user is confused by malfunction, etc., and safety and operability are significantly impaired due to misrecognition of the command. For important commands, the score threshold is set large in advance, and conversely, depending on the command, there are short commands that are frequently used or difficult to recognize for noise, but due to a decrease in the misidentification rate of commands For non-important commands that impair convenience, the score threshold is set small in advance.
Thus, if the score threshold value is set in the score threshold data table 7, the voice operation processing unit 8 improves the recognition accuracy for the important command, and the recognition rate for the non-important command, that is, The rate at which commands are permitted is improved, and the recognition accuracy and the recognition rate that are in a trade-off relationship can be adjusted to improve both safety and convenience.
[0014]
Further, after making a processing request to the application processing unit 10 in step ST7, the voice operation processing unit 8 determines whether or not the recognized command is an important command (step ST8).
Here, as an example of a method for setting whether or not the command is an important command corresponding to the command, in the score threshold data table 7, whether or not the command is an important command is set and held in advance for each command. In the voice operation processing unit 8, there is a method of determining whether or not an important command is set corresponding to the recognized command from the contents held in the score threshold data table 7.
As another example, when a voice is input from the microphone 2, an operation switch in which whether or not the voice input is an important command is set by a user operation, or an important command is input by a voice input from the microphone 2. Means for determining whether or not the important command is set, and an important command is set by such an important command setting means, and the important command is set by the important command setting means in response to the recognized command in the voice operation processing unit 8. There is a method for determining whether or not is set.
Voice operation processing section 8, in step ST8, if it is determined that the recognized command is to be critical command, the process ends.
On the other hand, if it is determined in step ST8 that the recognized command is not an important command, the score threshold extracted from the score threshold data table 7 and used for determination in step ST5 is reduced by a predetermined value or a predetermined rate. The changed score threshold is stored in the score threshold data table 7 (step ST9). Here, every time the same command that is not an important command is recognized, the score threshold is set to be small, but in order to prevent the score threshold from being set too small and increasing the recognition error, A lower limit value is provided for the score threshold value so that the score threshold value is not changed smaller than the lower limit value.
By doing so, each time a command is input by voice and the score threshold is changed every time the command is permitted, the recognition rate improves and the convenience increases each time the command is used more frequently. Can be improved.
Even if the command is used frequently, it is possible to prevent misrecognition of important commands and maintain safety by not changing the score threshold for important commands that require recognition accuracy. Can do.
[0015]
Furthermore, an operation switch (reliability threshold value changing function setting means) for setting the function for changing the score threshold by the voice operation processing unit 8 to be small or invalid is provided, and the voice operation processing unit 8 uses the operation switch. Depending on the setting, the function of changing the score threshold to be small may be enabled or disabled.
[0016]
【The invention's effect】
As described above, according to the present invention, the reliability threshold value holding means for holding the reliability threshold value corresponding to the recognition accuracy required for each command, and whether the voice information input from the voice input means is an important command. If the reliability threshold value corresponding to the command recognized by the important command setting unit and the voice recognition processing unit is extracted from the reliability threshold holding unit, and the reliability of the command is equal to or higher than the reliability threshold value And an instruction execution processing means for permitting and executing the instruction so that the reliability threshold value is reduced and held in the reliability threshold value holding means when it is determined that the instruction is not important by the important instruction setting means. As a result, the reliability threshold value preset in the reliability threshold value holding means is set to be large for important commands whose safety and operability are significantly impaired due to misrecognition of commands. If it is set to a small value for non-important instructions that are difficult to recognize due to high instructions or noise, recognition accuracy improves for important instructions, and the recognition rate, that is, instructions for non-important instructions. The rate of permitting is improved, and both safety and convenience can be improved.
[0017]
According to this invention, the instruction execution processing means extracts the reliability threshold corresponding to the instruction recognized by the voice recognition processing means from the reliability threshold holding means, and the reliability of the instruction is equal to or higher than the reliability threshold. In this case, when the instruction is determined to be important by the important instruction setting means, the instruction is input as voice information and the instruction is permitted because the reliability threshold value is not changed. Even in such a case, it is possible to prevent erroneous recognition of important instructions and maintain safety by not changing the reliability threshold for important instructions that require recognition accuracy.
[0018]
According to the present invention, the important instruction setting means is configured to be based on the setting as to whether or not each instruction held in the reliability threshold holding means is an important instruction. The rate can be adjusted, and both safety and convenience can be improved.
[0019]
According to the present invention, the instruction execution processing unit is configured to enable or disable the function of changing the reliability threshold value to be small according to the setting by the reliability threshold value changing function setting unit. The user can select whether to enable the function to improve the recognition rate each time the frequency increases, or to enable the function to hold the recognition accuracy and the recognition rate by fixing a predetermined reliability threshold. There is an effect that can be done.
[Brief description of the drawings]
BRIEF DESCRIPTION OF DRAWINGS FIG. 1 is a configuration diagram showing an in-vehicle device speech recognition apparatus according to Embodiment 1 of the present invention;
FIG. 2 is a flowchart showing the operation of the on-vehicle equipment speech recognition apparatus according to Embodiment 1 of the present invention;
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 In-vehicle information device, 2 Microphone (voice input means), 3 Speech switch, 4 Voice input circuit (voice input means), 5 Recognition word dictionary data table (reference voice information storage means), 6 Voice recognition processing part (voice recognition processing) Means), 7 score threshold data table (reliability threshold holding means), 8 voice operation processing section (command execution processing means), 9 voice operation response processing display section, 10 application processing section (command execution processing means).

Claims (4)

単語あるいは命令単位の基準音声情報を記憶した基準音声情報記憶手段と、
音声入力手段から入力された音声情報と上記基準音声情報記憶手段に記憶された基準音声情報とを比較照合して、両者が類似する基準音声情報に応じた命令を認識すると共に、その類似性に応じた信頼度を生成する音声認識処理手段と、
各種命令にそれぞれ対応して、各命令に要求される認識確度に応じた信頼度閾値を保持した信頼度閾値保持手段と、
上記音声入力手段から入力された音声情報が重要命令であるか否かを判定する重要命令設定手段と、
上記音声認識処理手段によって認識された命令に対応する信頼度閾値を上記信頼度閾値保持手段から抽出し、その命令の信頼度がその信頼度閾値以上である場合に、その命令が上記重要命令設定手段によって重要でないと判断された際は、上記信頼度閾値が小さくなるように変更して上記信頼度閾値保持手段に保持させるよう実行する命令実行処理手段とを備えた車載機器用音声認識装置。
Reference voice information storage means for storing reference voice information in units of words or instructions;
The voice information input from the voice input means and the reference voice information stored in the reference voice information storage means are compared and collated to recognize a command corresponding to the reference voice information that is similar to both, and to the similarity Voice recognition processing means for generating a corresponding reliability,
A reliability threshold holding unit that holds a reliability threshold corresponding to the recognition accuracy required for each command, corresponding to each command,
Important command setting means for determining whether or not the voice information input from the voice input means is an important command;
When the reliability threshold corresponding to the instruction recognized by the voice recognition processing means is extracted from the reliability threshold holding means, and the reliability of the instruction is equal to or higher than the reliability threshold, the instruction is set to the important instruction setting. A voice recognition device for on-vehicle equipment, comprising: an instruction execution processing unit that executes a change so that the reliability threshold value is reduced and held in the reliability threshold value holding unit when it is determined that the reliability level is not important .
命令実行処理手段は、音声認識処理手段によって認識された命令に対応する信頼度閾値を信頼度閾値保持手段から抽出し、その命令の信頼度がその信頼度閾値以上である場合に、その命令が重要命令設定手段によって重要であると判断された際は、上記信頼度閾値を変更せずに実行することを特徴とする請求項1に記載の車載機器用音声認識装置。The instruction execution processing means extracts a reliability threshold corresponding to the instruction recognized by the speech recognition processing means from the reliability threshold holding means, and if the reliability of the instruction is equal to or higher than the reliability threshold, the instruction is The in-vehicle device voice recognition device according to claim 1, wherein when the importance command setting unit determines that the value is important, the reliability threshold value is executed without changing the reliability threshold value. 重要命令設定手段は、信頼度閾値保持手段に保持される各命令毎に重要命令であるか否かの設定に基づくことを特徴とする請求項1または請求項2に記載の車載機器用音声認識装置。The in-vehicle device voice recognition according to claim 1 or 2, wherein the important command setting means is based on a setting as to whether or not each command held in the reliability threshold value holding means is an important command. apparatus. 命令実行処理手段による信頼度閾値を小さくなるように変更する機能を有効または無効に設定する信頼度閾値変更機能設定手段とを備え、
上記命令実行処理手段は、上記信頼度閾値変更機能設定手段による設定に応じて信頼度閾値を小さくなるように変更する機能を有効または無効にすることを特徴とする請求項1乃至請求項3のいずれかに記載の車載機器用認識装置。
A reliability threshold change function setting means for setting the function for changing the reliability threshold by the instruction execution processing means to be small or invalid, and
4. The instruction execution processing unit enables or disables a function of changing the reliability threshold value to be small according to the setting by the reliability threshold value changing function setting unit. The recognition apparatus for vehicle equipment in any one .
JP2002001605A 2002-01-08 2002-01-08 Voice recognition device for in-vehicle equipment Expired - Fee Related JP3920097B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002001605A JP3920097B2 (en) 2002-01-08 2002-01-08 Voice recognition device for in-vehicle equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002001605A JP3920097B2 (en) 2002-01-08 2002-01-08 Voice recognition device for in-vehicle equipment

Publications (2)

Publication Number Publication Date
JP2003202897A JP2003202897A (en) 2003-07-18
JP3920097B2 true JP3920097B2 (en) 2007-05-30

Family

ID=27641685

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002001605A Expired - Fee Related JP3920097B2 (en) 2002-01-08 2002-01-08 Voice recognition device for in-vehicle equipment

Country Status (1)

Country Link
JP (1) JP3920097B2 (en)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005181386A (en) * 2003-12-16 2005-07-07 Mitsubishi Electric Corp Device, method, and program for speech interactive processing
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
JP5157596B2 (en) * 2008-04-01 2013-03-06 トヨタ自動車株式会社 Voice recognition device
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
JP2014081441A (en) * 2012-10-15 2014-05-08 Sharp Corp Command determination device, determination method thereof, and command determination program
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
TW201543361A (en) * 2014-05-07 2015-11-16 Giga Byte Tech Co Ltd Input system for rapidly activating macro function
US9715875B2 (en) * 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
JP6504808B2 (en) * 2014-12-22 2019-04-24 キヤノン株式会社 Imaging device, setting method of voice command function, computer program, and storage medium
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
KR102190856B1 (en) * 2016-03-14 2020-12-14 애플 인크. Identification of voice inputs that provide credentials
JP2017173530A (en) * 2016-03-23 2017-09-28 富士通株式会社 Voice input support program, head mounted display, voice input support method, and voice input support device
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. Far-field extension for digital assistant services
JP6983405B2 (en) * 2017-10-25 2021-12-17 株式会社パロマ Cooker

Also Published As

Publication number Publication date
JP2003202897A (en) 2003-07-18

Similar Documents

Publication Publication Date Title
JP3920097B2 (en) Voice recognition device for in-vehicle equipment
US20130253933A1 (en) Voice recognition device and navigation device
EP3654329B1 (en) In-vehicle device and speech recognition method
CN105609105B (en) Speech recognition system and speech recognition method
JP6459330B2 (en) Speech recognition apparatus, speech recognition method, and speech recognition program
US20160019891A1 (en) Audio command adaptive processing system and method
JP2006208486A (en) Voice inputting device
JP2001013994A (en) Device and method to voice control equipment for plural riders and vehicle
JP4770374B2 (en) Voice recognition device
JP2018116206A (en) Voice recognition device, voice recognition method and voice recognition system
US10468017B2 (en) System and method for understanding standard language and dialects
JP2005003997A (en) Device and method for speech recognition, and vehicle
JP2000163098A (en) Voice recognition device
JP7192858B2 (en) Equipment control device and control method for controlling equipment
JP5074759B2 (en) Dialog control apparatus, dialog control method, and dialog control program
JP6966374B2 (en) Speech recognition system and computer program
JPS59180600A (en) Voice recognition controller to be carried on vehicle
US20150039312A1 (en) Controlling speech dialog using an additional sensor
JP4281369B2 (en) Voice recognition device
US9858918B2 (en) Root cause analysis and recovery systems and methods
JP6824554B2 (en) Speech recognition system
JP6999236B2 (en) Speech recognition system
JP2002132290A (en) On-vehicle speech recognizer
JP2020091435A (en) Voice recognition system, notification method of voice recognition system, program, and mobile body mounted apparatus
JPH11109989A (en) Speech recognition device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040819

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061017

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070214

R150 Certificate of patent or registration of utility model

Ref document number: 3920097

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100223

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110223

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120223

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130223

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130223

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140223

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees