JP2004226698A - 音声認識装置 - Google Patents
音声認識装置 Download PDFInfo
- Publication number
- JP2004226698A JP2004226698A JP2003014519A JP2003014519A JP2004226698A JP 2004226698 A JP2004226698 A JP 2004226698A JP 2003014519 A JP2003014519 A JP 2003014519A JP 2003014519 A JP2003014519 A JP 2003014519A JP 2004226698 A JP2004226698 A JP 2004226698A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- voice command
- storage unit
- command
- recognition device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】音声コマンドの誤認識を低減するとともに、処理時間を短縮して、作業効率を著しく向上することができる音声認識装置を提供する。
【解決手段】ユーザの発声した音声を認識して、その認識結果に基づき所定の機能を実行する音声認識装置において、全ての音声コマンド群を記憶する第1記憶部と前記第1記憶部に登録された音声コマンド群の一部をコピーして記憶する第2記憶部を備える。また、前記音声コマンドに複数の識別コードを付して、前記第1記憶部に記憶された音声コマンド群から特定の識別コードを備えた音声コマンド群を抽出して前記第2記憶部に記憶する。また、前記第1記憶部あるいは前記第2記憶部に記憶される音声コマンド群に階層構造を与える。
【選択図】 図1
【解決手段】ユーザの発声した音声を認識して、その認識結果に基づき所定の機能を実行する音声認識装置において、全ての音声コマンド群を記憶する第1記憶部と前記第1記憶部に登録された音声コマンド群の一部をコピーして記憶する第2記憶部を備える。また、前記音声コマンドに複数の識別コードを付して、前記第1記憶部に記憶された音声コマンド群から特定の識別コードを備えた音声コマンド群を抽出して前記第2記憶部に記憶する。また、前記第1記憶部あるいは前記第2記憶部に記憶される音声コマンド群に階層構造を与える。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、音声コマンドに基づいて機器の動作制御を行なう音声認識装置に関するものである。
【0002】
【従来の技術】
音声識別装置とは、ユーザが発声する音声の中から、特定の音声コマンドを識別し、識別された音声コマンドに基づいて動作信号を機器に送り、ユーザの音声のみで機器を動作制御するシステムである。音声識別装置はハンドフリーで機器の動作を制御できる利点があるので、近年、産業分野、民生分野を問わず多くのの分野で利用されている。例えば、特許文献1には所定の音声コマンドを登録する登録手段を備え、入力音声が前記登録手段に登録された音声コマンドと一致したときに所定の機能を実行させる音声認識装置を備えたカーナビゲーション装置が開示されている。
【0003】
【特許文献1】
特開2003−5781号公報
【0004】
【発明が解決しようとする課題】
ところが、従来の音声認識装置は、記憶部に記憶した多数の音声コマンド群の中から、ユーザの発声する音声と一致する音声コマンドを検索するので、似たような発音のコマンドを入力した場合、誤認識が発生するという問題があった。音声コマンドの数を増やして、より複雑な制御を音声識別装置で実現しようとすると、誤認識の可能性はさらに大きくなる。
また、入力された音声と多数の音声コマンドの全てについて、一つづつ比較してたので、音声コマンドの数が増えるにつれて音声認識に時間を要するという問題があった。
そこで、本発明は音声コマンドの誤認識を低減するとともに、処理時間を短縮して、作業効率を著しく向上することができる音声認識装置を提供することを目的とする。
【0005】
【課題を解決するための手段】
上記の課題を解決するために、請求項1の発明は、ユーザの発声した音声を認識して、その認識結果に基づき所定の機能を実行する音声認識装置において、全ての音声コマンド群を記憶する第1記憶部と前記第1記憶部に登録された音声コマンド群の一部をコピーして記憶する第2記憶部を有するものである。
請求項2の発明は、前記音声コマンドに複数の識別コードを付して前記第1記憶部または前記第2記憶部に記憶するものである。
請求項3の発明は、前記第1記憶部に記憶された音声コマンド群から特定の識別コードを備えた音声コマンド群を抽出して前記第2記憶部に記憶するものである。
請求項4の発明は、前記第1記憶部あるいは前記第2記憶部に記憶される音声コマンド群が階層構造を有するものである。
請求項5の発明は、前記識別コードが前記音声コマンドの従属関係を示すコードとするものである。
請求項6の発明は、先に認識した音声コマンドに従属する音声コマンド群を前記第1記憶部から抽出して前記第2記憶部にコピーするものである。
請求項7の発明は、前記識別コードが、認識した音声コマンドを再確認するか否かの情報を示すコードとするものである。
請求項8の発明は、認識した音声コマンドに対して所定の応答メッセージを発声するものである。
【0006】
【発明の実施の形態】
以下、本発明の具体的実施例を図に基づいて説明する。
図1は、本発明の実施例を示す音声認識装置のブロック図である。図において、11は音声入力部であり、12は音声認識部であり、13は記憶制御部であり、14は第1記憶部であり、15は第2記憶部であり、16は結果提示部である。音声入力部11はユーザの発声する音声を取り込む装置であり、例えばマイクロフォンとアンプなどからなる。音声認識部12は音声入力部11において取り込んだ音声を予め登録された音声コマンドと照合して、その音声を音声コマンドとして認識する装置である。記憶制御部13は音声認識部11、第1記憶部14、第2記憶部15および結果提示部16の間における音声コマンドなどの情報の流れを制御する部分である。第1記憶部14は、認識対象となる全ての音声コマンドをその音声コマンドの属性を表す複数の識別コードとともに記憶する記憶装置である。第2記憶部15は第1記憶部14に記憶された音声コマンド群の一部をその識別コードとともにコピーして一時的に記憶する記憶装置である。結果提示部16は認識結果や記憶部に記憶した情報を音声で提示する装置である。
【0007】
図2は、図1に示した音声認識装置の処理の流れを示すフローチャートである。
以下、本発明による音声認識方法を図2を引用して説明する。
(Step21)ユーザが発声した音声を入力する。
(Step22)入力された音声を第2記憶部15に記憶された音声コマンド群と照合して、その音声と一致する音声コマンドを認識する。後述するように、第1記憶部14に記憶された音声コマンド群は階層構造をなして、最初の段階では、これらの内、最上層の音声コマンドが第1記憶部14から抽出されて、音声コマンドの属性を表す識別コードとともに第2記憶部15にコピーされている。
(Step23)Step22で認識された音声コマンドを結果提示部16から提示する。
(Step24)Step22で認識された音声コマンド(親コマンド)に従属する音声コマンド(子コマンド)を第1記憶部14から抽出して、第2記憶部15にコピーする。親コマンドが最下層のコマンドであって、対応する子コマンドが無い場合には最上層の音声コマンド群がコピーされる。
【0008】
図3は、第1記憶部14に記憶される音声コマンド群のデータの構造を示す図である。ここでは、ユーザの命令に従って案内、誘導あるいは室内の清掃等を行う移動型ロボットに適用する音声認識装置の例を取り上げた。
以下、第3図を引用して音声コマンド群のデータの構造を説明する。
固有IDは、その音声コマンドに固有の識別コードである。親IDは、音声コマンド(群)の従属関係を示す識別コードである。親IDの番号はその音声コマンドが同じ番号を固有IDとする音声コマンドに従属すること、つまり親コマンドと子コマンドの関係にあることを示している。例えば、親ID「001」を付された音声コマンドは固有ID「001」を付された音声コマンドに従属し、親ID「004」を付された音声コマンドは、固有ID「004」を付された音声コマンドに従属する。なお、親ID「000」を付された音声コマンドは最上層のコマンドなので、親コマンドを持たない。このように、第1記憶部14において音声コマンド群は階層構造を有している。
【0009】
先に説明したStep24の処理は、この階層構造を利用して行われる。例えば、音声コマンドの中で最上位の音声コマンドである「作業モード」(固有ID:001)を認識した場合、記憶制御部13は第1記憶部14の作業コマンド群から親ID=001に該当する音声コマンドを検索して抽出し、図4に示すように第2記憶部15に親ID「001」を付された音声コマンド群をコピーする。
「作業モード」に続く音声コマンドは、「お客さまのご案内」か「掃除」に限られ、これ以外の音声コマンドは受け付ける必要がないから、音声認識装置は次に入力される音声と図4に示された音声コマンド群を照合すればよいのである(これら以外の音声が入力されたら、「不正入力」として再度入力を促せばよい)。
ここで、ユーザが「おきゃくさまのごあんない」と発声すると、音声認識部12は「お客さまのご案内」(固有ID:004)を認識し、記憶制御部13は第1記憶部14から親ID=004に該当する音声コマンドを検索して抽出し、図5に示すような音声コマンド群を第2記憶部15にコピーして次の音声の入力を待つのである。
このように各コマンド間に親子関係を表す情報を有しているため、親コマンドに対する子コマンドを容易に特定できるとともに、音声認識時には親コマンドに対する子コマンドのみ必要最小限の音声コマンドに限定して認識対象とすることができるため、誤認識を著しく低減することができる。
【0010】
ここで、再び図3を参照する。
応答メッセージは音声コマンドを認識したときに、結果提示部16が発する音声であり、音声コマンドと1対1で対応している。確認コードは、その音声コマンドを認識したときに、音声認識装置が再確認をするかしないかを示す識別コードであり、「1」ならば「再確認する」であり、「0」ならば「再確認しない」である。例えば、音声コマンド「作業モード」の確認コードは「1」であるので、ユーザが「さぎょうもーど」と発声して、音声認識部12が「作業モード」を認識すると、記憶制御部13は結果提示部16を介して「コマンドは作業モードでよいですか」と確認メッセージを発して、ユーザに確認を促す。そこでユーザが「はい」と答えて、音声認識部12が「はい」を認識すると「再確認」が完了し、音声コマンド「作業モード」が確定し、結果提示部16から応答メッセージ「作業モードです」が音声で提示される。逆に、「いいえ」と発話した場合は、結果提示部16は「もう一度お願いします」と音声を発し、再入力を促す。このとき、第2記憶部の音声コマンド群は、保持されたままである。なお、「はい」や「いいえ」といった音声コマンドは、第2記憶部15に予め記憶されている。次にユーザが「おきゃくさまのごあんない」を発声すると、音声認識部12は、音声コマンド「お客様のご案内」を認識する。すると、記憶制御部13は「お客様のご案内」に対応する確認コードを参照する。この場合、確認コードは「0」なので、記憶制御部13は使用者に確認を促す応答を生成せずに直ちに音声認識結果として「お客様のご案内」と確定するとともに、結果提示部16を介して「どちらにご案内しますか」という応答メッセージを提示する。
なお、図3および図5に示した「$command$」や「$condition$」は、システムコマンドであり、「$command$」には音声コマンドの文字列が挿入され、「$condition$」は、システムの状態を結果提示部16へ提示する。例えば、音声コマンドが「受付」であれば、$command$=”受付”なので、応答コマンドは「受付(=$command$)へご案内します」となる。
このように識別情報として確認情報を有することで使用者は認識コマンドの再確認できるため、仮に誤認識した場合でも容易にコマンドの修正を行なうことができる。
【0011】
図6は、本発明の音声認識装置の音声コマンド編集画面であり、図3に示した音声コマンド群をツリー構造として表現している。
図に示すように、「作業モード」、「基本動作モード」および「システムモード」は最上層の階層のコマンドなので第1層目に配置される。「お客様のご案内」と「掃除」は「作業モード」に従属する子コマンドなので、「作業モード」の次の層に配置される。また、「受付」、「第1応接室」および「第2応接室」は「お客さまのご案内」に従属する子コマンド(「作業モード」から見れば孫コマンド)なので、「お客様のご案内」の次の層に配置される。
音声コマンドの編集時には、画面上にて変更したい音声コマンドを選択し、語句を変更することで第1記憶部14に記憶している音声コマンドも変更することが可能となっている。なお、このツリー構造で音声コマンドを表現した画面では、音声コマンドの編集のみではなく、それぞれの音声コマンドに付随した識別情報も編集したり、一つの音声コマンドの下層に音声コマンドを追加することも可能である。
このように記憶部に記憶した音声コマンドなどをツリー構造で表現し編集可能とすることで、使用者は直感的かつ容易に認識手順を作成することが可能となり、音声コマンドの登録や変更といった作業効率が著しく向上する。
【0012】
【発明の効果】
以上述べたように、本発明の音声認識装置によれば、音声コマンド群が階層構
造を有しているので、親コマンドが認識されると、その後に入力される子コマンド群が特定でき、その特定の子コマンド群とユーザの音声を照合すれば足りる。したがって、本発明の音声認識装置は高い精度で該当する音声コマンドを確定することができ、誤認識を低減することができるという効果がある。また、音声認識に要する処理時間を短縮する効果もある。
【図面の簡単な説明】
【図1】本発明の実施例を示す音声認識装置のブロック図である。
【図2】図1の音声認識装置の処理の流れを示すフローチャートである。
【図3】音声コマンドのデータの構造を示す図である。
【図4】音声コマンドのデータの構造を示す図である。
【図5】音声コマンドのデータの構造を示す図である。
【図6】本発明の実施例を音声コマンド編集画面である。
【符号の説明】
11 音声入力部、12 音声認識部、13 記憶制御部、14 第1記憶部
15 第2記憶部 16 結果提示部
【発明の属する技術分野】
本発明は、音声コマンドに基づいて機器の動作制御を行なう音声認識装置に関するものである。
【0002】
【従来の技術】
音声識別装置とは、ユーザが発声する音声の中から、特定の音声コマンドを識別し、識別された音声コマンドに基づいて動作信号を機器に送り、ユーザの音声のみで機器を動作制御するシステムである。音声識別装置はハンドフリーで機器の動作を制御できる利点があるので、近年、産業分野、民生分野を問わず多くのの分野で利用されている。例えば、特許文献1には所定の音声コマンドを登録する登録手段を備え、入力音声が前記登録手段に登録された音声コマンドと一致したときに所定の機能を実行させる音声認識装置を備えたカーナビゲーション装置が開示されている。
【0003】
【特許文献1】
特開2003−5781号公報
【0004】
【発明が解決しようとする課題】
ところが、従来の音声認識装置は、記憶部に記憶した多数の音声コマンド群の中から、ユーザの発声する音声と一致する音声コマンドを検索するので、似たような発音のコマンドを入力した場合、誤認識が発生するという問題があった。音声コマンドの数を増やして、より複雑な制御を音声識別装置で実現しようとすると、誤認識の可能性はさらに大きくなる。
また、入力された音声と多数の音声コマンドの全てについて、一つづつ比較してたので、音声コマンドの数が増えるにつれて音声認識に時間を要するという問題があった。
そこで、本発明は音声コマンドの誤認識を低減するとともに、処理時間を短縮して、作業効率を著しく向上することができる音声認識装置を提供することを目的とする。
【0005】
【課題を解決するための手段】
上記の課題を解決するために、請求項1の発明は、ユーザの発声した音声を認識して、その認識結果に基づき所定の機能を実行する音声認識装置において、全ての音声コマンド群を記憶する第1記憶部と前記第1記憶部に登録された音声コマンド群の一部をコピーして記憶する第2記憶部を有するものである。
請求項2の発明は、前記音声コマンドに複数の識別コードを付して前記第1記憶部または前記第2記憶部に記憶するものである。
請求項3の発明は、前記第1記憶部に記憶された音声コマンド群から特定の識別コードを備えた音声コマンド群を抽出して前記第2記憶部に記憶するものである。
請求項4の発明は、前記第1記憶部あるいは前記第2記憶部に記憶される音声コマンド群が階層構造を有するものである。
請求項5の発明は、前記識別コードが前記音声コマンドの従属関係を示すコードとするものである。
請求項6の発明は、先に認識した音声コマンドに従属する音声コマンド群を前記第1記憶部から抽出して前記第2記憶部にコピーするものである。
請求項7の発明は、前記識別コードが、認識した音声コマンドを再確認するか否かの情報を示すコードとするものである。
請求項8の発明は、認識した音声コマンドに対して所定の応答メッセージを発声するものである。
【0006】
【発明の実施の形態】
以下、本発明の具体的実施例を図に基づいて説明する。
図1は、本発明の実施例を示す音声認識装置のブロック図である。図において、11は音声入力部であり、12は音声認識部であり、13は記憶制御部であり、14は第1記憶部であり、15は第2記憶部であり、16は結果提示部である。音声入力部11はユーザの発声する音声を取り込む装置であり、例えばマイクロフォンとアンプなどからなる。音声認識部12は音声入力部11において取り込んだ音声を予め登録された音声コマンドと照合して、その音声を音声コマンドとして認識する装置である。記憶制御部13は音声認識部11、第1記憶部14、第2記憶部15および結果提示部16の間における音声コマンドなどの情報の流れを制御する部分である。第1記憶部14は、認識対象となる全ての音声コマンドをその音声コマンドの属性を表す複数の識別コードとともに記憶する記憶装置である。第2記憶部15は第1記憶部14に記憶された音声コマンド群の一部をその識別コードとともにコピーして一時的に記憶する記憶装置である。結果提示部16は認識結果や記憶部に記憶した情報を音声で提示する装置である。
【0007】
図2は、図1に示した音声認識装置の処理の流れを示すフローチャートである。
以下、本発明による音声認識方法を図2を引用して説明する。
(Step21)ユーザが発声した音声を入力する。
(Step22)入力された音声を第2記憶部15に記憶された音声コマンド群と照合して、その音声と一致する音声コマンドを認識する。後述するように、第1記憶部14に記憶された音声コマンド群は階層構造をなして、最初の段階では、これらの内、最上層の音声コマンドが第1記憶部14から抽出されて、音声コマンドの属性を表す識別コードとともに第2記憶部15にコピーされている。
(Step23)Step22で認識された音声コマンドを結果提示部16から提示する。
(Step24)Step22で認識された音声コマンド(親コマンド)に従属する音声コマンド(子コマンド)を第1記憶部14から抽出して、第2記憶部15にコピーする。親コマンドが最下層のコマンドであって、対応する子コマンドが無い場合には最上層の音声コマンド群がコピーされる。
【0008】
図3は、第1記憶部14に記憶される音声コマンド群のデータの構造を示す図である。ここでは、ユーザの命令に従って案内、誘導あるいは室内の清掃等を行う移動型ロボットに適用する音声認識装置の例を取り上げた。
以下、第3図を引用して音声コマンド群のデータの構造を説明する。
固有IDは、その音声コマンドに固有の識別コードである。親IDは、音声コマンド(群)の従属関係を示す識別コードである。親IDの番号はその音声コマンドが同じ番号を固有IDとする音声コマンドに従属すること、つまり親コマンドと子コマンドの関係にあることを示している。例えば、親ID「001」を付された音声コマンドは固有ID「001」を付された音声コマンドに従属し、親ID「004」を付された音声コマンドは、固有ID「004」を付された音声コマンドに従属する。なお、親ID「000」を付された音声コマンドは最上層のコマンドなので、親コマンドを持たない。このように、第1記憶部14において音声コマンド群は階層構造を有している。
【0009】
先に説明したStep24の処理は、この階層構造を利用して行われる。例えば、音声コマンドの中で最上位の音声コマンドである「作業モード」(固有ID:001)を認識した場合、記憶制御部13は第1記憶部14の作業コマンド群から親ID=001に該当する音声コマンドを検索して抽出し、図4に示すように第2記憶部15に親ID「001」を付された音声コマンド群をコピーする。
「作業モード」に続く音声コマンドは、「お客さまのご案内」か「掃除」に限られ、これ以外の音声コマンドは受け付ける必要がないから、音声認識装置は次に入力される音声と図4に示された音声コマンド群を照合すればよいのである(これら以外の音声が入力されたら、「不正入力」として再度入力を促せばよい)。
ここで、ユーザが「おきゃくさまのごあんない」と発声すると、音声認識部12は「お客さまのご案内」(固有ID:004)を認識し、記憶制御部13は第1記憶部14から親ID=004に該当する音声コマンドを検索して抽出し、図5に示すような音声コマンド群を第2記憶部15にコピーして次の音声の入力を待つのである。
このように各コマンド間に親子関係を表す情報を有しているため、親コマンドに対する子コマンドを容易に特定できるとともに、音声認識時には親コマンドに対する子コマンドのみ必要最小限の音声コマンドに限定して認識対象とすることができるため、誤認識を著しく低減することができる。
【0010】
ここで、再び図3を参照する。
応答メッセージは音声コマンドを認識したときに、結果提示部16が発する音声であり、音声コマンドと1対1で対応している。確認コードは、その音声コマンドを認識したときに、音声認識装置が再確認をするかしないかを示す識別コードであり、「1」ならば「再確認する」であり、「0」ならば「再確認しない」である。例えば、音声コマンド「作業モード」の確認コードは「1」であるので、ユーザが「さぎょうもーど」と発声して、音声認識部12が「作業モード」を認識すると、記憶制御部13は結果提示部16を介して「コマンドは作業モードでよいですか」と確認メッセージを発して、ユーザに確認を促す。そこでユーザが「はい」と答えて、音声認識部12が「はい」を認識すると「再確認」が完了し、音声コマンド「作業モード」が確定し、結果提示部16から応答メッセージ「作業モードです」が音声で提示される。逆に、「いいえ」と発話した場合は、結果提示部16は「もう一度お願いします」と音声を発し、再入力を促す。このとき、第2記憶部の音声コマンド群は、保持されたままである。なお、「はい」や「いいえ」といった音声コマンドは、第2記憶部15に予め記憶されている。次にユーザが「おきゃくさまのごあんない」を発声すると、音声認識部12は、音声コマンド「お客様のご案内」を認識する。すると、記憶制御部13は「お客様のご案内」に対応する確認コードを参照する。この場合、確認コードは「0」なので、記憶制御部13は使用者に確認を促す応答を生成せずに直ちに音声認識結果として「お客様のご案内」と確定するとともに、結果提示部16を介して「どちらにご案内しますか」という応答メッセージを提示する。
なお、図3および図5に示した「$command$」や「$condition$」は、システムコマンドであり、「$command$」には音声コマンドの文字列が挿入され、「$condition$」は、システムの状態を結果提示部16へ提示する。例えば、音声コマンドが「受付」であれば、$command$=”受付”なので、応答コマンドは「受付(=$command$)へご案内します」となる。
このように識別情報として確認情報を有することで使用者は認識コマンドの再確認できるため、仮に誤認識した場合でも容易にコマンドの修正を行なうことができる。
【0011】
図6は、本発明の音声認識装置の音声コマンド編集画面であり、図3に示した音声コマンド群をツリー構造として表現している。
図に示すように、「作業モード」、「基本動作モード」および「システムモード」は最上層の階層のコマンドなので第1層目に配置される。「お客様のご案内」と「掃除」は「作業モード」に従属する子コマンドなので、「作業モード」の次の層に配置される。また、「受付」、「第1応接室」および「第2応接室」は「お客さまのご案内」に従属する子コマンド(「作業モード」から見れば孫コマンド)なので、「お客様のご案内」の次の層に配置される。
音声コマンドの編集時には、画面上にて変更したい音声コマンドを選択し、語句を変更することで第1記憶部14に記憶している音声コマンドも変更することが可能となっている。なお、このツリー構造で音声コマンドを表現した画面では、音声コマンドの編集のみではなく、それぞれの音声コマンドに付随した識別情報も編集したり、一つの音声コマンドの下層に音声コマンドを追加することも可能である。
このように記憶部に記憶した音声コマンドなどをツリー構造で表現し編集可能とすることで、使用者は直感的かつ容易に認識手順を作成することが可能となり、音声コマンドの登録や変更といった作業効率が著しく向上する。
【0012】
【発明の効果】
以上述べたように、本発明の音声認識装置によれば、音声コマンド群が階層構
造を有しているので、親コマンドが認識されると、その後に入力される子コマンド群が特定でき、その特定の子コマンド群とユーザの音声を照合すれば足りる。したがって、本発明の音声認識装置は高い精度で該当する音声コマンドを確定することができ、誤認識を低減することができるという効果がある。また、音声認識に要する処理時間を短縮する効果もある。
【図面の簡単な説明】
【図1】本発明の実施例を示す音声認識装置のブロック図である。
【図2】図1の音声認識装置の処理の流れを示すフローチャートである。
【図3】音声コマンドのデータの構造を示す図である。
【図4】音声コマンドのデータの構造を示す図である。
【図5】音声コマンドのデータの構造を示す図である。
【図6】本発明の実施例を音声コマンド編集画面である。
【符号の説明】
11 音声入力部、12 音声認識部、13 記憶制御部、14 第1記憶部
15 第2記憶部 16 結果提示部
Claims (8)
- ユーザの発声した音声を認識して、その認識結果に基づき所定の機能を実行する音声認識装置において、
全ての音声コマンド群を記憶する第1記憶部と前記第1記憶部に登録された音声コマンド群の一部をコピーして記憶する第2記憶部を有することを特徴とする音声認識装置。 - 前記音声コマンドに複数の識別コードを付して前記第1記憶部または前記第2記憶部に記憶することを特徴とする請求項1に記載の音声認識装置。
- 前記第1記憶部に記憶された音声コマンド群から特定の識別コードを備えた音声コマンド群を抽出して前記第2記憶部に記憶することを特徴とする請求項2記載の音声認識装置。
- 前記第1記憶部あるいは前記第2記憶部に記憶される音声コマンド群が階層構造を有することを特徴とする請求項1ないし請求項3のいずれかに記載の音声認識装置。
- 前記識別コードが前記音声コマンドの従属関係を示すコードであることを特徴とする請求項2または請求項3に記載の音声認識装置。
- 先に認識した音声コマンドに従属する音声コマンド群を前記第1記憶部から抽出して前記第2記憶部にコピーすることを特徴とする請求項4または請求項5に記載の音声認識装置。
- 前記識別コードが、認識した音声コマンドを再確認するか否かの情報を示すコードであることを特徴とする請求項2に記載の音声認識装置。
- 認識した音声コマンドに対して所定の応答メッセージを発声すること特徴とする請求項1ないし請求項7のいずれかに記載の音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003014519A JP2004226698A (ja) | 2003-01-23 | 2003-01-23 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003014519A JP2004226698A (ja) | 2003-01-23 | 2003-01-23 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004226698A true JP2004226698A (ja) | 2004-08-12 |
Family
ID=32902548
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003014519A Pending JP2004226698A (ja) | 2003-01-23 | 2003-01-23 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004226698A (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007036148A1 (fr) * | 2005-09-29 | 2007-04-05 | Huawei Technologies Co., Ltd. | Dispositif, système et procédé d'auto-reconnaissance vocale dans une portée limitée |
JP2008003371A (ja) * | 2006-06-23 | 2008-01-10 | Alpine Electronics Inc | 車載用音声認識装置及び音声コマンド登録方法 |
JP2015501106A (ja) * | 2011-12-07 | 2015-01-08 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | デジタル化された音声ストリームを分析するための低電力集積回路 |
JP2016505897A (ja) * | 2013-01-04 | 2016-02-25 | コピン コーポレーション | 二分岐音声認識 |
JP2016109784A (ja) * | 2014-12-03 | 2016-06-20 | シャープ株式会社 | 情報処理装置、情報処理方法、対話システム、および制御プログラム |
JP2018060207A (ja) * | 2017-11-08 | 2018-04-12 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | デジタル化された音声ストリームを分析するための低電力集積回路 |
US9992745B2 (en) | 2011-11-01 | 2018-06-05 | Qualcomm Incorporated | Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate |
JP2020095394A (ja) * | 2018-12-11 | 2020-06-18 | 株式会社デンソー | 車両機能確認装置 |
JP2020098342A (ja) * | 2020-01-17 | 2020-06-25 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | デジタル化された音声ストリームを分析するための低電力集積回路 |
JP2023026072A (ja) * | 2021-08-12 | 2023-02-24 | Necパーソナルコンピュータ株式会社 | 音声コマンド認識システム、音声コマンド認識方法、及びプログラム |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61275898A (ja) * | 1985-05-31 | 1986-12-05 | 松下電器産業株式会社 | コンピユ−タシステム |
JPS63174118A (ja) * | 1987-01-14 | 1988-07-18 | Matsushita Graphic Commun Syst Inc | 情報処理装置 |
JPH04273299A (ja) * | 1991-02-28 | 1992-09-29 | Ricoh Co Ltd | 音声認識装置 |
JPH07219584A (ja) * | 1994-01-31 | 1995-08-18 | Canon Inc | 音声処理装置及び方法 |
JP2000088597A (ja) * | 1998-09-09 | 2000-03-31 | Equos Research Co Ltd | 目的地設定装置 |
JP2001166791A (ja) * | 1999-12-13 | 2001-06-22 | Ricoh Co Ltd | 音声認識リモコンシステム装置 |
JP2001249685A (ja) * | 2000-03-03 | 2001-09-14 | Alpine Electronics Inc | 音声対話装置 |
JP2002006881A (ja) * | 2000-06-20 | 2002-01-11 | Kenwood Corp | 音声認識による制御装置 |
JP2002073075A (ja) * | 2000-09-05 | 2002-03-12 | Pioneer Electronic Corp | 音声認識装置ならびにその方法 |
-
2003
- 2003-01-23 JP JP2003014519A patent/JP2004226698A/ja active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61275898A (ja) * | 1985-05-31 | 1986-12-05 | 松下電器産業株式会社 | コンピユ−タシステム |
JPS63174118A (ja) * | 1987-01-14 | 1988-07-18 | Matsushita Graphic Commun Syst Inc | 情報処理装置 |
JPH04273299A (ja) * | 1991-02-28 | 1992-09-29 | Ricoh Co Ltd | 音声認識装置 |
JPH07219584A (ja) * | 1994-01-31 | 1995-08-18 | Canon Inc | 音声処理装置及び方法 |
JP2000088597A (ja) * | 1998-09-09 | 2000-03-31 | Equos Research Co Ltd | 目的地設定装置 |
JP2001166791A (ja) * | 1999-12-13 | 2001-06-22 | Ricoh Co Ltd | 音声認識リモコンシステム装置 |
JP2001249685A (ja) * | 2000-03-03 | 2001-09-14 | Alpine Electronics Inc | 音声対話装置 |
JP2002006881A (ja) * | 2000-06-20 | 2002-01-11 | Kenwood Corp | 音声認識による制御装置 |
JP2002073075A (ja) * | 2000-09-05 | 2002-03-12 | Pioneer Electronic Corp | 音声認識装置ならびにその方法 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7643992B2 (en) | 2005-09-29 | 2010-01-05 | Huawei Technologies Co., Ltd. | Method, system and device for automatic recognition of limited speech |
WO2007036148A1 (fr) * | 2005-09-29 | 2007-04-05 | Huawei Technologies Co., Ltd. | Dispositif, système et procédé d'auto-reconnaissance vocale dans une portée limitée |
JP2008003371A (ja) * | 2006-06-23 | 2008-01-10 | Alpine Electronics Inc | 車載用音声認識装置及び音声コマンド登録方法 |
US9992745B2 (en) | 2011-11-01 | 2018-06-05 | Qualcomm Incorporated | Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate |
US11069360B2 (en) | 2011-12-07 | 2021-07-20 | Qualcomm Incorporated | Low power integrated circuit to analyze a digitized audio stream |
JP2015501106A (ja) * | 2011-12-07 | 2015-01-08 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | デジタル化された音声ストリームを分析するための低電力集積回路 |
US10381007B2 (en) | 2011-12-07 | 2019-08-13 | Qualcomm Incorporated | Low power integrated circuit to analyze a digitized audio stream |
US11810569B2 (en) | 2011-12-07 | 2023-11-07 | Qualcomm Incorporated | Low power integrated circuit to analyze a digitized audio stream |
JP2016505897A (ja) * | 2013-01-04 | 2016-02-25 | コピン コーポレーション | 二分岐音声認識 |
JP2016109784A (ja) * | 2014-12-03 | 2016-06-20 | シャープ株式会社 | 情報処理装置、情報処理方法、対話システム、および制御プログラム |
JP2018060207A (ja) * | 2017-11-08 | 2018-04-12 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | デジタル化された音声ストリームを分析するための低電力集積回路 |
JP2020095394A (ja) * | 2018-12-11 | 2020-06-18 | 株式会社デンソー | 車両機能確認装置 |
JP2020098342A (ja) * | 2020-01-17 | 2020-06-25 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | デジタル化された音声ストリームを分析するための低電力集積回路 |
JP2023026072A (ja) * | 2021-08-12 | 2023-02-24 | Necパーソナルコンピュータ株式会社 | 音声コマンド認識システム、音声コマンド認識方法、及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4728905B2 (ja) | 音声対話装置および音声対話プログラム | |
JP5334178B2 (ja) | 音声認識装置およびデータ更新方法 | |
JP5706384B2 (ja) | 音声認識装置、音声認識システム、音声認識方法および音声認識プログラム | |
US20080183468A1 (en) | Augmentation and calibration of output from non-deterministic text generators by modeling its characteristics in specific environments | |
US20060173680A1 (en) | Partial spelling in speech recognition | |
JP2008203559A (ja) | 対話装置及び方法 | |
JP2000315096A5 (ja) | ||
US8612231B2 (en) | Method and system for speech based document history tracking | |
WO2003025904A1 (en) | Correcting a text recognized by speech recognition through comparison of phonetic sequences in the recognized text with a phonetic transcription of a manually input correction word | |
US20170270923A1 (en) | Voice processing device and voice processing method | |
JP2008051895A (ja) | 音声認識装置および音声認識処理プログラム | |
WO2016136207A1 (ja) | 音声対話装置、音声対話システム、音声対話装置の制御方法、および、プログラム | |
JP2004226698A (ja) | 音声認識装置 | |
JP5326549B2 (ja) | 音声認識装置及び方法 | |
JP2014235356A (ja) | 音声認識を利用した候補選択装置および候補選択方法 | |
JP4639990B2 (ja) | 音声対話装置及び音声理解結果生成方法 | |
JP2003157095A (ja) | 音声認識装置及びその方法、プログラム | |
JPH1083195A (ja) | 入力言語認識装置及び入力言語認識方法 | |
JP2009025411A (ja) | 音声認識装置およびプログラム | |
JP2004029354A (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP4537755B2 (ja) | 音声対話システム | |
JP2004333703A (ja) | 音声認識システムおよび音声認識の訂正・学習方法 | |
JP5215512B2 (ja) | 発声内に含まれる会社名の自動認識方法 | |
JP2000330588A (ja) | 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体 | |
JP2005031260A (ja) | 情報処理方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080425 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080530 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20081002 |