JP4201869B2 - 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体 - Google Patents

音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体 Download PDF

Info

Publication number
JP4201869B2
JP4201869B2 JP04149898A JP4149898A JP4201869B2 JP 4201869 B2 JP4201869 B2 JP 4201869B2 JP 04149898 A JP04149898 A JP 04149898A JP 4149898 A JP4149898 A JP 4149898A JP 4201869 B2 JP4201869 B2 JP 4201869B2
Authority
JP
Japan
Prior art keywords
devices
recognition
priority
voice recognition
changer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04149898A
Other languages
English (en)
Other versions
JPH11237892A (ja
Inventor
誠 木佐貫
正巳 前坂
光陽 柴崎
功一郎 福永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Faurecia Clarion Electronics Co Ltd
Original Assignee
Clarion Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Clarion Co Ltd filed Critical Clarion Co Ltd
Priority to JP04149898A priority Critical patent/JP4201869B2/ja
Publication of JPH11237892A publication Critical patent/JPH11237892A/ja
Application granted granted Critical
Publication of JP4201869B2 publication Critical patent/JP4201869B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、音声認識によってシステムを制御する技術の改良に関するもので、より具体的には、機器ごとに優先度を設定することによって、簡単な発語で効率的な制御を可能としたものである。
【0002】
【従来の技術】
音声認識は、認識しようとする単語ごとに、単語の波形や特徴を表すパラメータなどの認識用データを予めデータベースに記録しておき、発声された言葉をこれら認識用データとパターンマッチングすることによって、発声された単語を推定する技術である。
【0003】
このような音声認識をオーディオシステムなど各種システムの制御に用いる場合、単語ごとに予め意味を決めておく。そして、認識結果は、認識用データに対応した単語IDなどで得られ、制御用のアプリケーションプログラムがこの認識結果を受け取り、どの単語が認識されたか、すなわちユーザの発話内容に応じて決められた制御をシステムに対して行う。
【0004】
【発明が解決しようとする課題】
しかし、従来技術において、制御対象であるシステム上に同じ名称の機器が複数ある場合、それらの機器を音声認識によってそれぞれ別個に制御するためには、機器ごとに異なった名称を単語として用意し、単語ごとの認識用データを用意しておく必要があった。
【0005】
例えば、図7は、自動車に搭載するカーオーディオシステムの構成例を示すブロック図である。このシステムは、全体を制御するセンターユニット100、いわゆるカーナビゲーションに用いられるナビゲーションユニット101、3つのCDチェンジャ112〜114及び2つのMDチェンジャ115,116を有し、音声認識ユニット117でユーザの発声する単語を認識することによってこれら各機器を制御するものである。なお、各ユニット間の制御や信号の伝達はBUSライン108を通じて行われる。
【0006】
また、このシステムにおいて、音声認識による制御装置として用いられている音声認識ユニット117の構成を図8の機能ブロック図に示し、このシステムを音声認識で制御する処理手順を図9のフローチャートに示す。すなわち、これらの図に示すように、音声認識ユニット117では、認識しようとする各単語ごとの認識用データを認識辞書(認識対象語彙データベース)1に予め格納しておく(ステップ1)。そして、ユーザが機器を制御しようとするときは、所望の制御内容を表す単語を発声すると、マイクロホンに接続された音声入力部2がユーザの声をデジタル波形に変換する(ステップ2)。
【0007】
次に、パターンマッチング部3が、このデジタル波形を認識辞書1内の認識用データとマッチングし(ステップ3)、どの単語が発声されたかという認識結果を、単語ごとに割り付けられている固有のIDの形でコマンド入出力部4に渡す。このように認識結果を渡されたコマンド入出力部4は、認識された単語に基づいて、システムを制御する(ステップ4)。具体的には、コマンド入出力部4は、渡された認識結果に対応する内容の制御コマンドを、BUSライン108を通じて制御対象とする機器に送ることによって、ユーザが音声で命じた制御を実現する。
【0008】
上記のような従来技術において、1つのオーディオシステム上にCDチェンジャ(112〜114)やMDチェンジャ(115,116)が複数接続されている場合は、各機器ごとに異なった単語(発話語句)を予め認識対象語として定め、音声認識ユニット117の認識辞書1には、それら単語ごとに認識用データを用意していた。具体的には、同種の機器に共通する名称の後に番号を付けるなどして、例えば「しーでぃーちぇんじゃーいち」や「しーでぃーちぇんじゃーに」のように機器ごとに違う名称を定めていた。ここで、図10は、機器ごとに違う名称を登録した状態の認識辞書1の内容を例示する概念図である。
【0009】
この場合、ユーザが例えばCDチェンジャ112を選択して操作する際には「しーでぃーちぇんじゃーいち」、CDチェンジャ113を選択して操作する際には「しーでぃーちぇんじゃーに」という発話を行う。このように、従来では、同じ種類や名称の機器がシステム上に複数存在する場合、ユーザは、操作対象を他の同種の機器と区別するために、同種の機器でありながら相互に異なった単語を記憶して発話する必要があった。
【0010】
しかし、このような従来技術では、ユーザは機器ごとに異なった名称を覚えておく必要があり、また、識別用の番号などが加わった長い単語を使用するため、操作性が悪いという問題があった。特に、いくつかある同種の機器のなかでどれをよく使うかが決まっているような場合も、ユーザは、番号までついた長い名称を唱えて機器を指定しなければならなかったため、効率的な操作が困難であった。
【0011】
本発明は、上記のような従来技術の問題点を解決するために提案されたものであり、その目的は、簡単な発語で効率的な制御を行うことである。
【0012】
【課題を解決するための手段】
上記の目的を達成するため、請求項1の発明は、複数の機器を含むシステムを音声認識によって制御するための音声認識による制御装置において、前記複数の機器の共通の名称を表す機器名称を記憶する記憶手段と、前記複数の機器の各機器に付与されている番号を検出し、その番号に基づいて各機器に優先度を設定する手段と、前記複数の機器の各々を認識するための各単語が認識用データとして登録される認識辞書と、前記優先度を設定する手段によって設定された優先度が最高の機器に対する認識用データとして、前記記憶手段に記憶されている前記機器名称を前記認識辞書に登録する手段と、前記複数の機器の接続状態が変化したことを検出する変化検出手段と、前記変化検出手段によって、前記複数の機器の接続状態の変化を検出した場合、各機器の優先度を変更する変更手段と、を備えたことを特徴とする。請求項2の発明は、請求項1の発明を方法の観点から把握したもので、複数の機器を含むシステムを音声認識によって制御するための音声認識による制御方法において、前記複数の機器の各々を認識するための各単語が認識用データとして登録される認識辞書を備え、前記複数の機器の共通の名称を表す機器名称を記憶する記憶ステップと、前記複数の機器の各機器に付与されている番号を検出し、その番号に基づいて各機器に優先度を設定するステップと、前記優先度を設定するステップによって設定された優先度が最高の機器に対する認識用データとして、前記記憶ステップで記憶されている前記機器名称を前記認識辞書に登録するステップと、前記複数の機器の接続状態が変化したことを検出する変化検出ステップと、前記変化検出ステップによって、前記複数の機器の接続状態の変化を検出した場合、各機器の優先度を変更する変更ステップと、を実行することを特徴とする請求項3の発明は、請求項1の発明をコンピュータプログラムを記録した記録媒体の観点から把握したもので、コンピュータを用いて複数の機器を含むシステムを音声認識によって制御するための音声認識による制御用プログラムを記録した記録媒体において、前記複数の機器の各々を認識するための各単語が認識用データとして登録される認識辞書を備え、当該プログラムは、前記コンピュータに、前記複数の機器の共通の名称を表す機器名称を記憶させ、前記複数の機器の各機器に付与されている番号を検出し、その番号に基づいて各機器に優先度を設定させ、設定された優先度が最高の機器に対する認識用データとして、前記記憶ステップで記憶されている前記機器名称を前記認識辞書に登録させ、前記複数の機器の接続状態が変化したことを検出させ、前記複数の機器の接続状態の変化を検出した場合、各機器の優先度を変更させることを特徴とする。請求項1〜3の発明では、共通の名称に対応する同種の機器がシステム上に複数存在する場合、当該共通の名称を認識するための認識用データは、同種の機器のうち優先度が最高の機器を指すものとして認識辞書に登録される。そして、ユーザが、識別用の番号などを付けずに、親しみやすい共通の名称だけを発話した場合、複数の同種の機器のうち優先度が最高の機器を指すものと認識される。これによって、優先度が最高の機器は、番号などを省いた機器そのものの名称だけで容易に指定できるので、効率的な操作が可能となる。また、機器が取り外し又は追加されたり、ユーザが機器ごとの優先度を変更することによって優先度が変化した場合、変化後の構成や優先度に基づいて認識辞書が更新されるので、動作の確実性が向上する。そのため、個々のユーザに合った使い勝手を柔軟に実現することが可能となる。
【0013】
請求項2の発明は、請求項1記載の音声認識による制御装置において、前記複数の機器ごとの優先度を変更するための手段を備えたことを特徴とする。
請求項5の発明は、請求項2の発明を方法の観点から把握したもので、請求項4記載の音声認識による制御方法において、前記複数の機器ごとの優先度を変更するためのステップを含むことを特徴とする。
請求項2,5の発明では、個々のユーザが自分の判断で、よく使う機器に高い優先度を割り当てることができる。このため、個々のユーザに合った使い勝手を柔軟に実現することが可能となる。
【0014】
請求項3の発明は、請求項1又は2記載の音声認識による制御装置において、前記優先度の変化を検出した場合に前記登録する手段を起動する手段を備えたことを特徴とする。
請求項6の発明は、請求項3の発明を方法の観点から把握したもので、請求項4又は5記載の音声認識による制御方法において、前記優先度の変化を検出した場合に前記登録するステップを起動することを特徴とする。
請求項3,6の発明では、機器が取り外し又は追加されたり、ユーザが機器ごとの優先度を変更することによって優先度が変化した場合、変化後の構成や優先度に基づいて認識辞書が更新されるので、動作の確実性が向上する。
【0015】
【発明の実施の形態】
次に、本発明の実施の形態(以下「実施形態」という)について、図面を参照して説明する。
なお、本発明の各機能は、コンピュータを、ソフトウェアで制御することによって実現することが一般的と考えられる。この場合、コンピュータが備えるレジスタ、メモリ、外部記憶装置などの記憶装置が、いろいろな形式で、情報を一時的に保持したり永続的に保存する。そして、CPUが、前記ソフトウェアにしたがって、これらの情報に加工及び判断などの処理を加え、さらに、処理の順序を制御する。
【0016】
また、コンピュータを制御するソフトウェアは、各請求項及び明細書に記述する処理に対応した命令を組み合わせることによって作成され、作成されたソフトウェアは、コンパイルされた組み込みソフトウェアなどの形式で実行されることで、上記のようなハードウェア資源を活用する。
【0017】
但し、本発明を実現するための上記のような態様はいろいろ変更することができ、例えば、本発明を実現するソフトウェアを記録したROMチップやCD−ROMのような記録媒体は、それ単独でも、本発明の一態様である。また、本発明の機能の一部をLSIなどの物理的な電子回路で実現することも可能である。
【0018】
以上のように、コンピュータを使用して本発明を実現する態様はいろいろ変更できるので、以下では、本発明の各機能を実現する仮想的回路ブロックを用いることによって、実施形態を説明する。
【0019】
〔1.第1実施形態〕
〔1−1.構成〕
図1は、第1実施形態の全体構成を示す機能ブロック図である。この図に示す第1実施形態は、カーオーディオシステムに、本発明の音声認識による制御装置を音声認識ユニットとして組み込んだものである。このシステムは、図7と同様に、センターユニット100、ナビゲーションユニット101、3つのCDチェンジャ102〜104、2つのMDチェンジャ105,106に加え、音声認識ユニット107を、BUSライン108で接続したものである。このシステムでは、CDチェンジャ及びMDチェンジャの接続可能台数がそれぞれ4台ずつとし、共通の名称に対応し得る同種のユニットにはそれぞれ重複しない固有のIDが割り当てられる。
【0020】
例えば、全てのCDチェンジャは「しーでぃーちぇんじゃー」という共通の名称に対応付けることができる。この場合、CDチェンジャ102のIDは4、CDチェンジャ103のIDは2、CDチェンジャ104のIDは3であり、CDチェンジャ同士の間ではIDの重複はない。同様に、全てのMDチェンジャは「えむでぃーちぇんじゃー」という共通の名称に対応付けることができ、MDチェンジャ105のIDは3、MDチェンジャ106のIDは2であり、MDチェンジャ同士の間でIDの重複はない。
【0021】
また、図2は、第1実施形態における音声認識ユニット107の構成を示す機能ブロック図である。この図に示すように、音声認識ユニット107は、図8に示した構成に加え、「しーでぃーちぇんじゃー」のような共通の名称の認識用データを、この名称に対応し得る機器の各候補の中で優先度が最高の機器に対応付けて認識辞書1に単語として登録する登録手段5を備えている。
【0022】
なお、この実施例では、各CDチェンジャ102〜104及び各MDチェンジャ105,106が、自己のIDを表す接点を持ち、音声認識ユニット107はBUSライン108を介して各機器のIDを検出する。そして音声認識ユニット107が、内蔵するソフトウェアによって、どのようなIDを持つチェンジャにどのような優先度を割り当てるかを決定する。ここでは、各機器の優先度としては各機器のIDの数値をそのまま用い、IDが小さいほど優先度が高いものとする。また、個々の機器の側にロータリースイッチやディップスイッチなどを設け、機器の側でIDを変更できるものとする。
【0023】
また、音声認識ユニット107は、機器の優先度の変化を検出して登録手段5を起動する変化検出手段6を備えている。
【0024】
〔1−2.作用及び効果〕
上記のような構成を有する第1実施形態は、次のような作用を有する。なお、認識辞書の作成から認識結果の処理に至る処理手順の概略的な順序は図9に示した処理手順と同様である。
〔1−2−1.認識辞書への登録〕
本システムが最初に起動されると、音声認識ユニット107では、登録手段5が、「しーでぃーちぇんじゃー」のような共通の名称の認識用データを、この名称に対応し得る機器の各候補の中で優先度が最高の機器に対応付けて認識辞書1に単語として登録する(ステップ1)。
【0025】
ここで、共通の名称としてどのようなものがあり、それぞれの名称に対してどのような機器が対応し得る候補であり、対応し得る候補がシステム上に存在するときにどのような認識用データを認識辞書1に登録すべきかは、共通の名称に関するデータ8として予め用意しておく。
【0026】
例えば、共通の名称に関するデータ8の中に「しーでぃーちぇんじゃー」という共通の名称と、この名称の単語としての特徴を表す認識用データがあり、また、この名称に対応し得る機器の種類としてCDチェンジャが挙げられているものとする。この場合、登録手段5は、システム上に存在しているCDチェンジャの中で、最も小さいIDのものを検出し、「しーでぃーちぇんじゃー」という単語を認識する認識用データを、検出したCDチェンジャと対応付けて認識辞書1に登録する。
【0027】
ここで、図3は、共通の名称を認識辞書1に登録する手順を示すフローチャートである。なお、共通の名称を認識辞書1に登録しようとするとき、共通の名称に対応し得る候補として、システム上のどの範囲の機器を調べるかは、データ8を参照することによって確認する。
【0028】
そして、図3の手順では、まず、登録手段5はBUSライン108を経て、IDが1のCDチェンジャがシステム上に存在するかどうかを判断し(ステップ211)、存在する場合は、「しーでぃーちぇんじゃー」という名称の認識用データを、そのCDチェンジャに対応する発話語句(単語)として認識辞書1に追加する(ステップ212)。IDが1のCDチェンジャがシステム上に存在しない場合は、続いてIDが2のCDチェンジャがシステム上に存在するかどうかを判断し(ステップ213)、存在する場合は、認識用データを、そのCDチェンジャに対応する単語として認識辞書1に追加する(ステップ214)。このようにIDが小さいもの、すなわち優先度が高いものから順に、CDチェンジャが発見されるまで、IDが3のもの(ステップ215,216)、4のもの(ステップ217,218)、と判断を続ける。
【0029】
このように優先度の高いものから判断を続ける結果、最初に発見されたCDチェンジャは優先度が最高のものである。このため、発見されたCDチェンジャについて登録を行うと、それより優先度が大きいものについては判断せず、続いてMDチェンジャについて共通の名称を登録する手続きへ進む(ステップ221〜228)。なお、図3に示した手順を別の形で示すと図4のフローチャートとなる。
【0030】
以上のような手続きの結果、「しーでぃーちぇんじゃー」という単語はCDチェンジャ中で優先度が一番高いCDチェンジャ103に対応付けて登録され、また、「えむでぃーちぇんじゃー」という単語は、MDチェンジャ中で優先度が一番高いMDチェンジャ106に対応付けて登録される。
【0031】
ここで、図5は、認識辞書1について、これら共通の名称を登録した後の状態を示す概念図である。この例は、各機器に、機器ごとに異なる従来通りの名称を対応させるのと並行して、優先度が最高の機器には共通の名称を対応付けたものである。ここで、従来通りの名称につける「に」や「さん」といった番号の部分には、各機器のIDの数字を用いるものとする。
【0032】
例えば、優先度が最小(最高)の2であるCDチェンジャ103には、「しーでぃーちぇんじゃーに」という従来通りの単語のほか、「しーでぃーちぇんじゃー」という共通の名称も対応付けられている。また、優先度が最小(最高)の2であるMDチェンジャ106には、「えむでぃーちぇんじゃーに」という従来通りの単語のほか、「えむでぃーちぇんじゃー」という共通の名称も対応付けられている。なお、システム上に複数存在しうる機器が他にもある場合は、それらについても以上と同様の手続きが行われる。
【0033】
〔1−2−2.操作対象の認識〕
上記のような認識辞書1が用意された後、ユーザが所望の機器を音声で選択する場合、従来通り機器名の後に番号を付けて直接機器を指定することもできるが、同種の機器の中から最も優先度の高い機器を指定する場合は、機器名に番号を付けずに「しーでぃーちぇんじゃー」とだけ発話して済ませることができる。
【0034】
すなわち、ユーザが、例えば、スピーカを鳴らす音源(ソース)としてCDチェンジャ103を音声で選択する場合を考える。この場合、ユーザが番号を省略して「しーでぃーちぇんじゃー」とだけ発話した場合、最も優先度の高いCDチェンジャ103が選択される。
【0035】
すなわち、ユーザが「しーでぃーちぇんじゃー」と発話すると、この音声が音声入力部2から入力され(ステップ2)、音声認識ユニット107では、パターンマッチング部3が認識辞書1に基づいて「しーでぃーちぇんじゃー」という単語を認識する(ステップ3)。そして、この単語には優先度が最高のCDチェンジャ103が対応付けられているので、パターンマッチング部3はコマンド入出力部4に、認識結果がCDチェンジャ103であることを伝達する。
【0036】
この結果、コマンド入出力部4は、例えば、渡された制御対象であるCDチェンジャ103に対して再生開始のコマンドを送信し、一方、例えばアンプ機能があるセンターユニット100に対してオーディオ音源をCDチェンジャ103に切り替える命令を送信することによって、ユーザが音声で選択したとおり、スピーカを鳴らす音源がCDチェンジャ103に切り換えられる(ステップ4)。
【0037】
もちろん、従来通り、「しーでぃーちぇんじゃーに」などと機器名の後に番号を付けて発話した場合も、この単語にはCDチェンジャ103が対応付けられているので、CDチェンジャ103が選択される。
【0038】
また、MDチェンジャ106を選択する場合も、ユーザは同様に、番号を付けて「えむでぃーちぇんじゃーに」と発話してもよいし、番号を省略して共通の名称のみ「えむでぃーちぇんじゃー」とだけ発話してもよい。
【0039】
〔1−2−3.認識辞書の更新〕
なお、システム構成が変わったりユーザが優先度を変更すると、これによって優先度が変化し、認識辞書1の内容は変化に合わせて更新される。例えば、IDが2であるCDチェンジャ103がシステム上から取り外された場合には、次に小さいIDである3を持つCDチェンジャ104が優先度最高となる。この場合、変化検出手段6は、この変化を検出して登録手段5を起動する。
【0040】
起動された登録手段5は、変更後のシステム構成や各機器のIDに基づいて認識辞書1の内容を更新する。すなわち、IDが2であるCDチェンジャ103がシステム上から取り外された場合には、次に小さいIDである3を持つCDチェンジャ104が優先度最高となっている。このため、「しーでぃーちぇんじゃー」という単語の認識用データは、新たに優先度最高となったCDチェンジャ104に対応付けられて登録し直される。
【0041】
この結果、その後ユーザが単に「しーでぃーちぇんじゃー」とだけ発話した場合は、CDチェンジャ104が制御対象として選択されることになる。また逆に、例えば、IDが最小の1であるCDチェンジャが新たにシステムに接続された場合には、新たなCDチェンジャの優先度が最高となるので、ユーザが単に「しーでぃーちぇんじゃー」とだけ発話した場合は、この新たなCDチェンジャが選択されることになる。
【0042】
また、第1実施形態では、CDチェンジャやMDチェンジャなど個々の機器の優先度は、ユーザが、各機器に設けられたロータリースイッチやディップスイッチなどを用いて所望の順序に変更することができる。この場合、ユーザは、自分が頻繁に使用するチェンジャに高い優先度を割り当てることによって、自分個人にとって使いやすいシステムを構築することができる。
【0043】
具体的には、例えば自動車の運転席に近いチェンジャのIDを1とし、トランクルームなど他の場所に設置する同種のチェンジャにはそれより低いIDである2〜4を与えれば、単に「しーでぃーちぇんじゃー」とだけ発話した場合に、運転席に近いチェンジャが自動的に選択されることになる。
【0044】
〔1−2−4.効果〕
以上のように、第1実施形態では、共通の名称に対応する同種の機器がシステム上に複数存在する場合、当該共通の名称を認識するための認識用データは、同種の機器のうち優先度が最高の機器を指すものとして認識辞書に登録される。そして、ユーザが、識別用の番号などを付けずに、親しみやすい共通の名称だけを発話した場合、複数の同種の機器のうち優先度が最高の機器を指すものと認識される。これによって、優先度が最高の機器は、番号などを省いた機器そのものの名称だけで容易に指定できるので、効率的な操作が可能となる。
【0045】
また、第1実施形態では、機器が取り外し又は追加されたり、ユーザが機器ごとの優先度を変更することによって優先度が変化した場合、変化後の構成や優先度に基づいて認識辞書が更新されるので、動作の確実性が向上する。
【0046】
〔2.第2実施形態〕
第1実施形態では、ロータリースイッチやディップスイッチなどを機器ごとに設け、機器の側でIDを変更するようにしたが、機器の優先度を変更するためのスイッチなどは、優先度変更手段7として音声認識ユニット107の側に設けることもできる。
【0047】
図6は、このような第2実施形態の構成を示す機能ブロック図であり、第2実施形態における音声認識ユニット207には、図2に示した第1実施形態の構成に加え、各機器ごとの優先度を変更する優先度変更手段7が設けられている。この優先度変更手段7の具体例としては、例えば、所望の機器を選択した状態で、操作パネルの「優先」といったボタンを押すと、その機器の優先度が1つ上がり、それまで1つ上の優先度を持っていた機器と優先度が入れ替わる、といった例が考えられる。また、同様の操作を、「優先」といった特定の語句を用いることによって、音声認識によって行なってもよい。
【0048】
このようにユーザが優先度変更手段7から機器の優先度を変更した場合も、変化検出手段6が優先度の変化を検出し、登録手段5が起動され、変更後の優先度にしたがって再度単語の登録が行われる。
【0049】
このように、第2実施形態では、優先度変更手段7を用いて、個々のユーザが自分の判断で、よく使う機器に高い優先度を割り当てることができる。このため、個々のユーザに合った使い勝手を柔軟に実現することが可能となる。
【0050】
〔3.他の実施の形態〕
なお、本発明は上記実施の形態に限定されるものではなく、次に例示するような他の実施の形態も含むものである。例えば、図1,図2,図6に示した構成は一例に過ぎず、本発明は、カーオーディオシステム以外の他の種類のシステムを制御するのに用いることもできる。また、カーオーディオシステムと組み合わせる場合も、例えば、ナビゲーションユニット、CDチェンジャ、MDチェンジャなど具体的なユニットの種類は例示に過ぎず、他の種類の音源や他の機能を持つユニットに自由に置き換えることができる。
【0051】
例えば、本発明は、周辺機器を持つ一般的なコンピュータ自体を制御するために、当該コンピュータの機能として実現することもできる。具体的には、例えば、ハードディスクユニットなどの外部記憶装置が複数ドライブあったり、出力装置としてもプリンタが何台かあるような場合、情報の格納や出力をどの装置に行うかを本発明によって指定することが考えられる。
【0052】
また、図2に示した変化検出手段6は必須ではなく、優先度が変化するような場合はユーザが自分の判断で登録手段5を起動するようにしたり、機器ごとの優先度を固定とすることもできる。また、図5に示した各機器のID(優先度)は例示に過ぎず、IDは2,3,4といった続き番号である必要はなく、2と4という具合に間があいても差しつかえない。また、IDの表現形式を変更したり、CDチェンジャとMDチェンジャを一つのグループとして共通の名称に対応付け得る候補としてもよい。例えばユーザが「でぃすく」とだけ言った場合にこれらの中から特定のユニットが選択されるようにすることもできる。
【0053】
【発明の効果】
以上のように、本発明によれば、機器ごとに優先度を設定することによって、簡単な発語で効率的な制御を行うことができる。
【図面の簡単な説明】
【図1】本発明の第1実施形態におけるカーオーディオシステムの全体構成を示すブロック図。
【図2】本発明の第1実施形態における音声認識ユニットの構成を示す機能ブロック図。
【図3】本発明の第1実施形態において、共通の名称を認識辞書に登録する場合の処理手順を示すフローチャート。
【図4】本発明の第1実施形態において、共通の名称を認識辞書に登録する場合の処理手順を他の形式で示したフローチャート。
【図5】本発明の第1実施形態において、共通の名称が登録された状態の認識辞書の内容を例示する概念図。
【図6】本発明の第2実施形態におけるカーオーディオシステムの全体構成を示すブロック図。
【図7】従来技術による制御装置(音声認識ユニット)でカーオーディオシステムを制御する場合の全体構成例を示す図。
【図8】従来技術における音声認識ユニットの構成を示す機能ブロック図。
【図9】認識辞書の作成から認識結果の処理に至る手順を示すフローチャート。
【図10】従来技術における認識辞書の内容を示す概念図。
【符号の説明】
1…認識辞書
2…音声入力部
3…パターンマッチング部
4…コマンド入出力部
5…登録手段
6…変化検出手段
7…優先度変更手段
8…共通の名称に関するデータ
100…センターユニット
101…ナビゲーションユニット
102〜104…CDチェンジャ
105,106…MDチェンジャ
107,207…音声認識ユニット
108…BUSライン

Claims (3)

  1. 複数の機器を含むシステムを音声認識によって制御するための音声認識による制御装置において、
    前記複数の機器の共通の名称を表す機器名称を記憶する記憶手段と、
    前記複数の機器の各機器に付与されている番号を検出し、その番号に基づいて各機器に優先度を設定する手段と、
    前記複数の機器の各々を認識するための各単語が認識用データとして登録される認識辞書と、
    前記優先度を設定する手段によって設定された優先度が最高の機器に対する認識用データとして、前記記憶手段に記憶されている前記機器名称を前記認識辞書に登録する手段と、
    前記複数の機器の接続状態が変化したことを検出する変化検出手段と、
    前記変化検出手段によって、前記複数の機器の接続状態の変化を検出した場合、各機器の優先度を変更する変更手段と、
    を備えたことを特徴とする音声認識による制御装置。
  2. 複数の機器を含むシステムを音声認識によって制御するための音声認識による制御方法において、
    前記複数の機器の各々を認識するための各単語が認識用データとして登録される認識辞書を備え、
    前記複数の機器の共通の名称を表す機器名称を記憶する記憶ステップと、
    前記複数の機器の各機器に付与されている番号を検出し、その番号に基づいて各機器に優先度を設定するステップと、
    前記優先度を設定するステップによって設定された優先度が最高の機器に対する認識用データとして、前記記憶ステップで記憶されている前記機器名称を前記認識辞書に登録するステップと、
    前記複数の機器の接続状態が変化したことを検出する変化検出ステップと、
    前記変化検出ステップによって、前記複数の機器の接続状態の変化を検出した場合、各機器の優先度を変更する変更ステップと、
    を実行することを特徴とする音声認識による制御方法
  3. コンピュータを用いて複数の機器を含むシステムを音声認識によって制御するための音声認識による制御用プログラムを記録した記録媒体において、
    前記複数の機器の各々を認識するための各単語が認識用データとして登録される認識辞書を備え、
    当該プログラムは、前記コンピュータに、
    前記複数の機器の共通の名称を表す機器名称を記憶させ、
    前記複数の機器の各機器に付与されている番号を検出し、その番号に基づいて各機器に優先度を設定させ、
    設定された優先度が最高の機器に対する認識用データとして、前記記憶ステップで記憶されている前記機器名称を前記認識辞書に登録させ、
    前記複数の機器の接続状態が変化したことを検出させ、
    前記複数の機器の接続状態の変化を検出した場合、各機器の優先度を変更させることを特徴とする音声認識による制御用プログラムを記録した記録媒体。
JP04149898A 1998-02-24 1998-02-24 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体 Expired - Fee Related JP4201869B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04149898A JP4201869B2 (ja) 1998-02-24 1998-02-24 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04149898A JP4201869B2 (ja) 1998-02-24 1998-02-24 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JPH11237892A JPH11237892A (ja) 1999-08-31
JP4201869B2 true JP4201869B2 (ja) 2008-12-24

Family

ID=12610029

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04149898A Expired - Fee Related JP4201869B2 (ja) 1998-02-24 1998-02-24 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP4201869B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11978458B2 (en) 2019-07-15 2024-05-07 Samsung Electronics Co., Ltd. Electronic apparatus and method for recognizing speech thereof

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002116787A (ja) * 2000-07-10 2002-04-19 Matsushita Electric Ind Co Ltd 優先順位決定装置、優先順位決定方法及び優先順位決定プログラム
JP2002049403A (ja) * 2000-08-07 2002-02-15 Shin Caterpillar Mitsubishi Ltd 建設機械における音声機体制御装置
JP4581441B2 (ja) * 2004-03-18 2010-11-17 パナソニック株式会社 家電機器システム、家電機器および音声認識方法
JP5361781B2 (ja) * 2010-03-31 2013-12-04 アルパイン株式会社 車載用電子装置およびその音楽データの音声認識辞書生成方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3034872B2 (ja) * 1987-09-21 2000-04-17 株式会社東芝 音声命令認識装置及び音声命令認識方法
JPH06202688A (ja) * 1992-12-28 1994-07-22 Sony Corp 音声認識装置
JP2993826B2 (ja) * 1993-08-07 1999-12-27 アイシン・エィ・ダブリュ株式会社 ナビゲーション装置
JPH07162492A (ja) * 1993-12-09 1995-06-23 Canon Inc 音声認識制御システム
JPH08221408A (ja) * 1995-02-15 1996-08-30 Toshiba Corp 文字認識方法、仮名漢字変換方法及び情報処理装置
JPH08320697A (ja) * 1995-05-23 1996-12-03 Hitachi Ltd 音声認識装置
JPH0916191A (ja) * 1995-06-29 1997-01-17 Asahi Chem Ind Co Ltd ナビゲータ用音声認識装置および方法
JPH1063288A (ja) * 1996-08-23 1998-03-06 Aqueous Res:Kk 音声認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11978458B2 (en) 2019-07-15 2024-05-07 Samsung Electronics Co., Ltd. Electronic apparatus and method for recognizing speech thereof

Also Published As

Publication number Publication date
JPH11237892A (ja) 1999-08-31

Similar Documents

Publication Publication Date Title
US9092435B2 (en) System and method for extraction of meta data from a digital media storage device for media selection in a vehicle
JP5118280B2 (ja) 自然言語インターフェースコントロールシステム
US7870142B2 (en) Text to grammar enhancements for media files
EP1691343B1 (en) Audio device control device,audio device control method, and program
EP3472831B1 (en) Techniques for wake-up word recognition and related systems and methods
US10431221B2 (en) Apparatus for selecting at least one task based on voice command, vehicle including the same, and method thereof
US20080221891A1 (en) Interactive speech recognition system
US8484033B2 (en) Speech recognizer control system, speech recognizer control method, and speech recognizer control program
EP1300829A1 (en) Technique for active voice recognition grammar adaptation for dynamic multimedia application
US20050216271A1 (en) Speech dialogue system for controlling an electronic device
EP1739546A2 (en) Automobile interface
JPWO2000014723A1 (ja) 音声認識装置
JP4201869B2 (ja) 音声認識による制御装置及び方法並びに音声認識による制御用プログラムを記録した記録媒体
CN113160824B (zh) 信息处理系统
US20060206328A1 (en) Voice-controlled audio and video devices
JPH11317063A (ja) カーオーディオシステム及びその制御方法並びにカーオーディオシステム制御用プログラムを記録した記録媒体
JP7069730B2 (ja) 情報処理装置、方法、及びプログラム
JP2001013984A (ja) 音声操作装置
JP2008243146A (ja) 音声認識処理装置及びその制御方法
JP2001126458A (ja) 電子機器
JPH10510081A (ja) 装置及び機器の音声制御用装置
WO2002001550A1 (en) Method and system for controlling device
JP2003241789A (ja) 音声認識辞書作成装置および方法
JP2004515873A (ja) 音響情報の記憶方法、および該方法により記憶された情報の選択方法
HK40039137A (en) Techniques for wake-up word recognition and related systems and methods

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070417

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070618

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080916

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081008

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111017

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111017

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121017

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131017

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees