JPH11202887A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH11202887A
JPH11202887A JP10004865A JP486598A JPH11202887A JP H11202887 A JPH11202887 A JP H11202887A JP 10004865 A JP10004865 A JP 10004865A JP 486598 A JP486598 A JP 486598A JP H11202887 A JPH11202887 A JP H11202887A
Authority
JP
Japan
Prior art keywords
voice
parameter
speech
speaker
voice parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10004865A
Other languages
English (en)
Inventor
Tetsuya Takahashi
哲也 高橋
Takayuki Hiekata
孝之 稗方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe Steel Ltd
Original Assignee
Kobe Steel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe Steel Ltd filed Critical Kobe Steel Ltd
Priority to JP10004865A priority Critical patent/JPH11202887A/ja
Publication of JPH11202887A publication Critical patent/JPH11202887A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】 【課題】 音声によって操作を行う例えばハンズフリー
電話等の従来の音声操作機能付装置では,特定話者の音
声パラメータに基づいて命令情報の認識行う場合に,全
ての機能について上記特定話者の音声パラメータの登録
を行う必要があり,多機能の場合登録作業が煩雑となっ
ていた。 【解決手段】 本発明は,ある命令情報に対して特定話
者の音声パラメータが登録されている場合には,特定話
者の音声パラメータを用いて音声認識を行い,特定話者
の音声パラメータが登録されていない場合には,標準話
者の音声パラメータを用いて音声認識を行うことによ
り,全ての機能に対して特定話者の音声パラメータを登
録する必要をなくし,ユーザの必要に応じて認識率を高
めうるようにすることを図ったものである。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,音声認識装置に係
り,例えばハンズフリー電話等,音声によって操作を行
うことが可能な音声認識装置に関するものである。
【0002】
【従来の技術】例えば車の運転中に,携帯電話やカース
テレオ等の機器操作をボタンの押下げ等により行うこと
は,視界が運転方向から離れたり,運転への集中力が削
がれるため,交通安全上好ましくない。このような場合
には,音声によって操作を行うことが可能な音声認識装
置が便利である。音声によって操作を行う装置として
は,例えばハンズフリー電話等が広く知られている。電
話機やオーディオ機器等をボタン操作の代わりに音声に
よって操作する場合,音声認識の方法としては一般に,
多くの人の平均的な音声パラメータを予め登録しておい
て入力音声との類似度が近いものを選択する不特定話者
音声認識を用いる方法と,実際に使う人が自分の音声を
入力して自分の音声パラメータを登録しておく特定話者
認識を用いる方法とがある。不特定話者認識の場合,予
め標準的な音声パラメータが登録されているとは言って
も,特定の個人にとっては最適ではない。また,使う環
境(部屋の反響特性や,空調等の騒音)によっても計算
される音声パラメータは変化するので,現実問題として
は,実際に機器が使用される環境やユーザに応じて音声
パラメータが登録される特定話者認識を用いる方が,認
識の性能は優れている。例えば特開昭63−11544
8号公報(参照文献1)や特開昭63−129765号
公報(参照文献2)には,複数の人の音声パラメータを
記憶し,なおかつ本体メモリを大きくしないために,複
数の特定話者の音声パラメータを外部メモリやカードに
登録しておく技術が記載されている。また,特開平2−
220545号公報(参照文献3)には,状況に応じて
容易に認識率を向上させ得るように,電話機毎に特定話
者認識と不特定話者認識とを切り替えることが可能な技
術が記載されている。
【0003】
【発明が解決しようとする課題】ところで,特定話者認
識による音声認識では,使用者が使う機能に対応する音
声パラメータが予め全て登録されている必要がある。し
かしながら,近年の多機能な機器では,全ての機能につ
いて特定話者の音声パラメータを登録する作業は,非常
に煩雑なものとなってしまう。上記参照文献1や参照文
献2に記載の技術では,外部メモリやカードを利用する
ことによって,本体に搭載されるメモリ容量を低減する
ことができるが,各機能について音声パラメータを登録
する必要がある問題は解消されない。また,参照文献3
に記載の技術についても,不特定話者認識が設定された
電話機では登録の必要がない代わりに認識率が低下して
しまう。また,電話機が特定話者認識に設定されている
場合には,やはり全ての機能に対応して音声パラメータ
を登録する必要がある。本発明は,このような従来の技
術における課題を解決するために,音声認識装置を改良
し,ある命令情報に対して特定話者の音声パラメータが
登録されている場合には,特定話者の音声パラメータを
用いて音声認識を行い,特定話者の音声パラメータが登
録されていない場合には,標準話者の音声パラメータを
用いて音声認識を行うことにより,全ての機能に対して
特定話者の音声パラメータを登録する必要をなくし,ユ
ーザの必要に応じて認識率を高めうるようにした音声認
識装置を提供することを目的とするものである。
【0004】
【課題を解決するための手段】上記目的を達成するため
に請求項1に記載の発明は,入力された音声信号の音声
パラメータを演算する音声パラメータ演算手段と,上記
音声パラメータ演算手段により演算された音声パラメー
タに基づいて上記音声信号に含まれる命令情報を認識す
る音声認識手段と,上記音声認識手段により認識された
命令情報に基づいて所定の動作を行う動作部とを具備し
てなる音声認識装置において,複数の命令情報の全てに
対応して予め登録されている標準話者の音声パラメータ
に加えて特定話者の音声パラメータが登録可能な音声パ
ラメータ登録手段を具備し,上記音声認識手段が,上記
音声パラメータ演算手段により演算された音声パラメー
タと,上記音声パラメータ登録手段に登録された標準話
者の音声パラメータ及び特定話者の音声パラメータとの
類似度を演算し,該類似度に基づいて選択された標準話
者の音声パラメータ又は特定話者の音声パラメータに対
応する命令情報を上記音声信号に含まれる命令情報とし
て認識してなることを特徴とする音声認識装置として構
成されている。また,請求項2に記載の発明は,上記請
求項1に記載の音声操作機能付装置において,上記音声
パラメータ登録手段に上記特定話者の音声パラメータが
登録された命令情報については,上記標準話者の音声パ
ラメータよりも上記特定話者の音声パラメータが優先し
て選択されてなることをその要旨とする。また,請求項
3に記載の発明は,上記請求項1又は2に記載の音声操
作機能付装置において,複数の上記命令情報に対応して
装置本体に複数のボタンが設けられてなることをその要
旨とする。また,請求項4に記載の発明は,上記請求項
3に記載の音声操作機能付装置において,上記複数のボ
タン中のあるボタンが所定時間以上押し下げられたとき
に,音声信号の入力が検出された場合には,入力された
音声信号の音声パラメータが,当該ボタンに対応した命
令情報に対して設定された特定話者の音声パラメータと
して上記音声パラメータ登録手段に登録されてなること
をその要旨とする。
【0005】また,請求項5に記載の発明は,上記請求
項3又は4に記載の音声操作機能付装置において,上記
複数のボタン中のあるボタンが所定時間以上押し下げら
れたときに,音声信号の入力が検出されなかった場合に
は,当該ボタンに対応した命令情報に対して設定された
特定話者の音声パラメータを上記音声パラメータ登録手
段から削除してなることをその要旨とする。また,上記
請求項6に記載の発明は,上記請求項1〜5のいずれか
1項に記載の音声操作機能付装置において,上記命令情
報に基づいた上記動作部による動作が,その実行前に取
り消されなかった場合に,上記音声パラメータ登録手段
に登録された特定話者の音声パラメータが,入力された
音声信号の音声パラメータに基づいて更新されてなるこ
とをその要旨とする。また,上記請求項7に記載の発明
は,上記請求項1〜6のいずれか1項に記載の音声操作
機能付装置において,上記命令情報に基づいた上記動作
部による動作が,その実行前に確認された場合に,上記
音声パラメータ登録手段に登録された特定話者の音声パ
ラメータが,入力された音声信号の音声パラメータに基
づいて更新されてなることをその要旨とする。上記請求
項1〜7のいずれか1項に記載の音声操作機能付装置に
よれば,ある命令情報に対して特定話者の音声パラメー
タが登録されている場合には,特定話者の音声パラメー
タを用いて音声認識が行われ,特定話者の音声パラメー
タが登録されていない場合には,標準話者の音声パラメ
ータを用いて音声認識が行われるため,全ての機能に対
して特定話者の音声パラメータを登録する必要がなくな
る。また,認識率を高めたい命令情報については簡単な
操作で特定話者の音声パラメータを登録することができ
る。また,取り消し操作や確認操作を利用して簡単に特
定話者の音声パラメータを更新することも可能である。
【0006】
【発明の実施の形態】以下,添付図面を参照して,本発
明の実施の形態につき説明し,本発明の理解に供する。
尚,以下の実施の形態は,本発明の具体的な一例であっ
て,本発明の技術的範囲を限定する性格のものではな
い。図1は,本発明を適用したハンズフリー電話の概略
構成を示す機能ブロック図である。図1に示すように,
上記ハンズフリー電話100は,マイクロフォン等の音
声入力端子101と,該音声入力端子101から入力さ
れた音声信号の有音部分を検出する音声検出器102
と,音声検出器102により検出された有音部分の音声
信号の音声パラメータを計算する音声パラメータ計算装
置103と,複数の命令情報の全てに対応して予め登録
されている標準話者の音声パラメータに加えて特定話者
の音声パラメータが登録可能な記憶メモリ104と,上
記音声パラメータ計算装置103により計算された音声
パラメータと上記記憶メモリ104に登録された標準話
者の音声パラメータ及び特定話者の音声パラメータとの
類似度を計算し,該類似度に基づいて選択された標準話
者の音声パラメータ又は特定話者の音声パラメータに対
応する命令情報を上記音声信号に含まれる命令情報とし
て認識する音声認識装置105と,音声認識装置105
により認識された命令情報に基づいてコマンド制御を行
うコマンド制御装置106と,コマンド制御装置106
からのコマンドに応じて合成音声を作成出力する音声合
成装置107と,本体に設けられたボタンの状態を検出
するボタン操作検出器108とを具備する。
【0007】上記ハンズフリー電話100では,上記マ
イクロフォン等の音声入力端子101及びスピーカ等の
音声出力端子109を用いて通話が行われる。この音声
出力端子109から音声入力端子101への音の回り込
みによるエコーを防止するため,適応フィルタによるエ
コーキャンセラや,ボイススイッチを用いた双方向通話
制限等による音響エコー防止装置110が設けられてい
る。また,例えばスペクトルサブトラクション法等によ
るノイズ除去装置111も設けられており,上記音声入
力端子101から入力された音声信号から周辺雑音が取
り除かれる。上記ノイズ除去装置111から出力された
音声信号は音声検出器102へ供給される。上記音声検
出器102は,音声が含まれている有声区間と背景雑音
のみの無声区間とを判別するためのものである。上記音
声検出器102では,例えば音声信号のパワーを常にモ
ニターすることによって,背景雑音のパワーレベルが推
定され,推定されたパワーレベルよりも大きくなった場
合に有声区間であるとの判別が行われる。もちろん,こ
れ以外の有声無声判別方法を用いることも可能で,例え
ば信号のゼロクロスをカウントしたり,信号の周期性を
求める等の各種の手法が知られている。上記音声パラメ
ータ計算装置103では,上記音声検出器102により
有声区間として判定された区間の音声信号について音声
パラメータの計算が行われる。ここで用いられる音声パ
ラメータは,例えばLPCケプストラムや,メルケプス
トラム等である。上記音声パラメータ計算装置103に
より計算された音声パラメータは,上記音声認識装置1
05において,上記記憶メモリ104に予め登録された
標準話者の音声パラメータ及び特定話者の音声パラメー
タと比較される。即ち,上記音声パラメータ計算装置1
03により計算された音声パラメータと,上記記憶メモ
リ104に予め登録された標準話者の音声パラメータ及
び特定話者の音声パラメータとの類似度が計算され,そ
の類似度が一定以上の場合,登録された各音声パラメー
タの中から類似度の最も高い音声パラメータが選択さ
れ,その音声パラメータに付加されたパターン番号等が
上記コマンド制御装置106へ出力される。また,音声
認識には,例えばHMM(隠れマフコフモデル)を用い
た方法やDPマッチングなどの手法を用いることが可能
である。上記コマンド制御装置106では,上記音声認
識装置105から供給された信号を基にコマンドを実行
して電話機の動作を制御する。また,必要に応じて音声
合成装置107で合成された合成音声信号がユーザに対
して出力される。また,ボタン検出装置108では,電
話機に設けられたボタンの状態が検出される。例えば上
記特定話者の音声パラメータの記憶メモリへの登録は,
このボタン検出装置108により,あるボタンが押され
ていると検出された場合に行われる。
【0008】次に,図2は,上記ハンズフリー電話に対
してユーザが音声により指示を入力した例を説明するた
めの図であり,ハンズフリー電話に設けられた指示ボタ
ンと登録音声(パラメータ)の対応を示す。図2に示す
ように,上記ハンズフリー電話は,ワンタッチボタン2
01,十進ボタン,「*」,「#」等の特殊記号ボタン
を含むダイヤルボタン202,スピーカ,再送,転送,
保留等の機能別に設けられた機能ボタン203を筐体表
面に有する。このボタンの状態は,上記ボタン検出器1
08により検出される。これらの全ての機能に対応して
記憶メモリ104には,標準話者の音声パラメータが予
め登録されている。また,これらの幾つかの機能につい
てユーザが設定した特定話者の音声パラメータも記憶メ
モリ104に記憶されている。また,音声認識装置10
5において,「田中さん」や「にい」等の特定話者の音
声(パラメータ)が記憶メモリ104に登録されている
機能については,ユーザが発した音声に対して,まずこ
の特定話者の音声パラメータとの類似度が優先的に計算
される。一方,特定話者の音声(パラメータ)が記憶メ
モリ104に登録されていない「1」ボタンや「保留」
ボタンに対応する機能については,全ての機能について
予め記憶メモリ104に登録されている標準話者の音声
パラメータとの類似度の計算が行われる。類似度の演算
がなされた上記特定話者の音声パラメータと標準話者の
音声パラメータのうち,入力音声の音声パラメータとの
類似度が最も大きい音声パラメータが選択され,その類
似度が所定のしきい値以上の値であるならば,当該音声
パラメータに対応するパターン番号がコマンド制御装置
107へ出力される。コマンド制御装置107では,こ
のパターン番号に基づいてコマンドを出力し,認識され
た音声パラメータに対応する機能の選択が確定する。ま
た,選択された音声パラメータの類似度が上記所定のし
きい値未満であるならば,入力音声の音声パラメータと
標準話者の音声パラメータとの類似度が計算される。そ
して,類似度の演算がなされた標準話者の音声パラメー
タのうち,その類似度が最大となる標準話者の音声パラ
メータが選択され,その類似度が所定のしきい値以上の
値であるならば,当該音声パラメータに対応するパター
ン番号がコマンド制御装置107へ出力される。コマン
ド制御装置107では,上記の場合と同様に,このパタ
ーン番号に基づいてコマンドを出力し,認識された音声
パラメータに対応する機能の選択が確定する。さらに,
いずれの場合にも最大の類似度がしきい値以上の値でな
いならば,例えば上記のように演算された全ての類似度
のうち最も大きい類似度を有する音声パラメータが選択
される。また,この場合,入力された音声は無意味や発
声であったと判断して無効にしてもよい。このような2
段の検索は,標準話者の音声と同じ音声を特定話者の音
声に用いる場合に有効である。また,このように,入力
音声の音声パラメータを,標準話者と特定話者の両方の
音声パラメータと比較することによって,特定話者の音
声パラメータが登録されていないユーザが使用する場合
でも,標準話者の音声パラメータにより音声操作を行う
ことが可能となる。例えば特定話者によって登録された
「手ぶら」という発声でなくとも,ユーザが「スピー
カ」と発声すれば,スピーカ機能をオンにすることがで
きる。また,各ボタンに対応する特定音声の登録は,当
該ボタンを一定時間以上押下し,その間に音声を入力す
ることによって行われる。ボタンの押し下げ状態の検出
は,上記ボタン検出装置108により行われる。この入
力音声の音声パラメータは音声パラメータ計算装置10
3により計算された後,記憶メモリ104に登録され
る。また,当該ボタンの押下中に,音声検出器102に
よって音声が検出されなかった場合には,そのボタンの
機能に対応し,既に記憶メモリ104に記憶されている
特定話者の音声パラメータがクリアされる。
【0009】また,本発明は,ハンズフリー電話に限ら
ず,例えば携帯してヘッドフォンで音楽を聴取する小型
音楽信号再生装置等の他の装置に適用することも可能で
ある。ここで,図3は,上記小型音楽信号再生装置に対
してユーザが音声により指示を入力した例を説明するた
めの図であり,小型音楽信号再生装置に設けられた指示
ボタンと登録音声の対応を示す。図3に示すように,上
記小型音楽信号再生装置には,終了,停止,再生,録
音,早送り,逆戻し等の機能別ボタン301が設けられ
ており,各ボタンに対応して記憶メモリ302に標準話
者の音声(パラメータ)と特定話者の音声(パラメー
タ)とが予め登録されている。例えば停止の機能に対応
する標準話者の音声は,「停止」であり,特定話者の音
声は「止まれ」と登録されている。また,登録音声の音
声パラメータは,上記ハンズフリー電話機の場合と同様
に,登録時に音声パラメータ計算装置等により計算され
る。この音声パラメータは,例えば登録音声から抽出し
たLPCケプストラムやメルケプストラムである。とこ
ろで,同じユーザが同じ発声を行ったとしても,その音
声パラメータは変動する場合がある。また,登録した時
と実際の使用時とでは,例えば車の走行中で騒音が加わ
る等環境が異なる場合もあり,登録した状況による差異
も生じやすい。そこで,実際に使用しながら,効率よく
登録されている特定話者の音声パラメータを学習・更新
することが必要である。例えば図1及び図2に示したハ
ンズフリー電話において,入力音声と「手ぶら」という
特定音声との類似度が最も大きい場合には,「スピーカ
をオンにします」という音声メッセージが音声合成装置
107により作成されユーザに対して出力される。この
とき,ユーザが自分が発声した内容と違った機能が選択
されたと判断した場合には,「取り消し」と発声する等
して当該機能の動作を中止させる。例えばこの「取り消
し」が行われなかった場合に,入力音声に対して計算さ
れた音声パラメータに基づいて,記憶メモリ104に登
録された特定話者の音声パラメータが更新・学習され
る。これにより,ユーザは特に学習・更新のための特別
な操作を行う必要なく,ユーザの声の変化や使用環境等
に適応した音声パラメータへ自動的に更新されることに
なる。また,誤った入力音声に基づいて音声パラメータ
の更新・学習を行うことが防止される。尚,上記音声合
成装置107による音声合成には,例えばLPC−10
等の使用メモリの少ない手法を用いることも可能である
し,広く知られたCELPやACPCM等の音声復号手
法を用いてもよい。また,他の例としては,上記「スピ
ーカをオンにします」という音声メッセージの代わりに
「スピーカをオンにしますが,よろしいですか」という
確認メッセージを音声合成装置107により作成しユー
ザに対して出力する。そして,ユーザが「はい」と発声
する等,ユーザが確認した場合にのみ,記憶メモリ10
4に登録された特定話者の音声パラメータが,その時に
入力された音声信号の音声パラメータに基づいて更新・
学習される。これらの更新・学習動作を行うために,入
力された音声信号を一時的に格納しておく記憶メモリを
別途設けるようにしてもよい。もちろん,この2つの動
作を状況や環境に応じてユーザが選択し得るようにして
もよい。このように本実施の形態に係る音声操作機能付
装置では,ある命令情報に対して特定話者の音声パラメ
ータが登録されている場合には,特定話者の音声パラメ
ータを用いて音声認識が行われ,特定話者の音声パラメ
ータが登録されていない場合には,標準話者の音声パラ
メータを用いて音声認識が行われるため,全ての機能に
対して特定話者の音声パラメータを登録する必要がなく
なる。また,認識率を高めたい命令情報については簡単
な操作で特定話者の音声パラメータを登録することがで
きる。また,メッセージを利用して簡単に特定話者の音
声パラメータを更新することも可能である。
【0010】
【発明の効果】上記のように請求項1〜7のいずれか1
項に記載の音声操作機能付装置によれば,ある命令情報
に対して特定話者の音声パラメータが登録されている場
合には,特定話者の音声パラメータを用いて音声認識が
行われ,特定話者の音声パラメータが登録されていない
場合には,標準話者の音声パラメータを用いて音声認識
が行われるため,全ての機能に対して特定話者の音声パ
ラメータを登録する必要がなくなる。また,認識率を高
めたい命令情報については簡単な操作で特定話者の音声
パラメータを登録することができる。また,取り消し操
作や確認操作を利用して簡単に特定話者の音声パラメー
タを更新することも可能である。
【図面の簡単な説明】
【図1】 本発明の一実施の形態に係るハンズフリー電
話の概略構成を示す機能ブロック図。
【図2】 上記ハンズフリー電話における音声操作を説
明するための図。
【図3】 本発明を適用した小型音声再生装置における
音声操作を説明するための図。
【符号の説明】 101…マイクロフォン(音声入力手段) 102…音声検出器 103…音声パラメータ計算装置(音声パラメータ演算
手段) 104…記憶メモリ(音声パラメータ登録手段) 105…音声認識装置(音声認識手段) 106…コマンド制御装置(動作部)
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI H04M 11/00 303 H04M 11/00 303

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声信号の音声パラメータを
    演算する音声パラメータ演算手段と,上記音声パラメー
    タ演算手段により演算された音声パラメータに基づいて
    上記音声信号に含まれる命令情報を認識する音声認識手
    段と,上記音声認識手段により認識された命令情報に基
    づいて所定の動作を行う動作部とを具備してなる音声認
    識装置において,複数の命令情報の全てに対応して予め
    登録されている標準話者の音声パラメータに加えて特定
    話者の音声パラメータが登録可能な音声パラメータ登録
    手段を具備し,上記音声認識手段が,上記音声パラメー
    タ演算手段により演算された音声パラメータと,上記音
    声パラメータ登録手段に登録された標準話者の音声パラ
    メータ及び特定話者の音声パラメータとの類似度を演算
    し,該類似度に基づいて選択された標準話者の音声パラ
    メータ又は特定話者の音声パラメータに対応する命令情
    報を上記音声信号に含まれる命令情報として認識してな
    ることを特徴とする音声認識装置。
  2. 【請求項2】 上記音声パラメータ登録手段に上記特定
    話者の音声パラメータが登録された命令情報について
    は,上記標準話者の音声パラメータよりも上記特定話者
    の音声パラメータが優先して選択されてなる請求項1に
    記載の音声認識装置。
  3. 【請求項3】 複数の上記命令情報に対応して装置本体
    に複数のボタンが設けられてなる請求項1又は2に記載
    の音声認識装置。
  4. 【請求項4】 上記複数のボタン中のあるボタンが所定
    時間以上押し下げられたときに,音声信号の入力が検出
    された場合には,入力された音声信号の音声パラメータ
    が,当該ボタンに対応した命令情報に対して設定された
    特定話者の音声パラメータとして上記音声パラメータ登
    録手段に登録されてなる請求項3に記載の音声認識装
    置。
  5. 【請求項5】 上記複数のボタン中のあるボタンが所定
    時間以上押し下げられたときに,音声信号の入力が検出
    されなかった場合には,当該ボタンに対応した命令情報
    に対して設定された特定話者の音声パラメータを上記音
    声パラメータ登録手段から削除してなる請求項3又は4
    に記載の音声認識装置。
  6. 【請求項6】 上記命令情報に基づいた上記動作部によ
    る動作が,その実行前に取り消されなかった場合に,上
    記音声パラメータ登録手段に登録された特定話者の音声
    パラメータが,入力された音声信号の音声パラメータに
    基づいて更新されてなる請求項1〜5のいずれか1項に
    記載の音声認識装置。
  7. 【請求項7】 上記命令情報に基づいた上記動作部によ
    る動作が,その実行前に確認された場合に,上記音声パ
    ラメータ登録手段に登録された特定話者の音声パラメー
    タが,入力された音声信号の音声パラメータに基づいて
    更新されてなる請求項1〜6のいずれか1項に記載の音
    声認識装置。
JP10004865A 1998-01-13 1998-01-13 音声認識装置 Pending JPH11202887A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10004865A JPH11202887A (ja) 1998-01-13 1998-01-13 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10004865A JPH11202887A (ja) 1998-01-13 1998-01-13 音声認識装置

Publications (1)

Publication Number Publication Date
JPH11202887A true JPH11202887A (ja) 1999-07-30

Family

ID=11595576

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10004865A Pending JPH11202887A (ja) 1998-01-13 1998-01-13 音声認識装置

Country Status (1)

Country Link
JP (1) JPH11202887A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150068003A (ko) * 2013-12-11 2015-06-19 삼성전자주식회사 대화형 시스템, 이의 제어 방법, 대화형 서버 및 이의 제어 방법
KR20210075040A (ko) * 2014-11-12 2021-06-22 삼성전자주식회사 질의 응답을 위한 디스플레이 장치 및 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150068003A (ko) * 2013-12-11 2015-06-19 삼성전자주식회사 대화형 시스템, 이의 제어 방법, 대화형 서버 및 이의 제어 방법
KR20210075040A (ko) * 2014-11-12 2021-06-22 삼성전자주식회사 질의 응답을 위한 디스플레이 장치 및 방법
KR20220130655A (ko) * 2014-11-12 2022-09-27 삼성전자주식회사 질의 응답을 위한 디스플레이 장치 및 방법
US11817013B2 (en) 2014-11-12 2023-11-14 Samsung Electronics Co., Ltd. Display apparatus and method for question and answer

Similar Documents

Publication Publication Date Title
JP4263614B2 (ja) リモートコントロール装置及び情報端末装置
JP3479691B2 (ja) 実時間作動での音声対話又は音声命令による1つ又は複数の機器の自動制御方法及びこの方法を実施する装置
EP1933303B1 (en) Speech dialog control based on signal pre-processing
US7826945B2 (en) Automobile speech-recognition interface
US20030130852A1 (en) Headset with radio communication function for speech processing system using speech recognition
WO2000058944A1 (en) Spoken user interface for speech-enabled devices
KR100321464B1 (ko) 음성 인식 시스템에서 특성을 추출하는 방법
JP4246703B2 (ja) 自動音声認識の方法
JPH07334184A (ja) 音響カテゴリ平均値計算装置及び適応化装置
EP1494208A1 (en) Method for controlling a speech dialog system and speech dialog system
ES2286014T3 (es) Esquema de rechazo de reconocimiento de voz.
JP6797338B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP3524370B2 (ja) 音声起動システム
WO2000010160A1 (fr) Dispositif et procede de reconnaissance vocale, dispositif de navigation, telephone portable et processeur d'informations
JP2006023773A (ja) 音声処理システム
Loh et al. Speech recognition interactive system for vehicle
JPH06236196A (ja) 音声認識方法および装置
JP2000172291A (ja) 音声認識装置
JPH11202887A (ja) 音声認識装置
JP2000029486A (ja) 音声認識システムおよび方法
JP2003177788A (ja) 音声対話システムおよびその方法
JP4093394B2 (ja) 音声認識装置
JP4408665B2 (ja) 音声認識用発話データ収集装置、音声認識用発話データ収集方法、及びコンピュータプログラム
JPH11109987A (ja) 音声認識装置
KR100280873B1 (ko) 음성인식 시스템