JP2000148181A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2000148181A
JP2000148181A JP10316607A JP31660798A JP2000148181A JP 2000148181 A JP2000148181 A JP 2000148181A JP 10316607 A JP10316607 A JP 10316607A JP 31660798 A JP31660798 A JP 31660798A JP 2000148181 A JP2000148181 A JP 2000148181A
Authority
JP
Japan
Prior art keywords
recognition
input
voice
speech
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10316607A
Other languages
English (en)
Inventor
Masakazu Hattori
雅一 服部
Takashi Sasai
崇司 笹井
Hiroshi Tsunoda
弘史 角田
Yasuhiko Kato
靖彦 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP10316607A priority Critical patent/JP2000148181A/ja
Publication of JP2000148181A publication Critical patent/JP2000148181A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 利用者に負担や煩わしさを与えることなく、
効率よく確実に音声認識される音声認識装置を実現す
る。 【解決手段】 利用者からの音声が入力され、その音声
認識結果が確信度不十分であるとき、ステップS104
で利用者へ更なる入力を求める表示を行う。ステップS
105で利用者がその表示に基づき再入力したならば、
ステップS106でその入力に対して音声認識処理を
し、再入力された音声が確信度十分であればその結果を
用いて再び最初の音声入力に対して音声認識処理を行
う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声認識装置に関
し、さらに詳しくは、自然言語によって利用者との対話
を行う音声認識装置に関する。
【0002】
【従来の技術】音声認識は100%の精度で行うことが
不可能であるため、音声認識を応用したシステムでは、
利用者に対して誤認識を訂正するための手段が提供され
ている。訂正方法の一つは、音響的に近いと推測される
他の候補の単語や文を提示して、利用者に正解を選んで
もらうことである。効率化のためには、数多くの候補を
一度に提示できるインターフェイスを使用すると良い
が、一方でそれは、数多くの誤認識結果を利用者に示す
ことになる。
【0003】また、他の訂正方法として利用者に言い直
してもらう方法は、音声認識しやすい言い方で1回目と
同じことを言ってもらい、再度認識処理にかける場合が
多い。しかし、入力が長い場合には面倒な上、入力の単
語や文によっては何度繰り返しても入力できなかったり
する、という問題点があった。
【0004】
【発明が解決しようとする課題】本発明は、利用者に負
担や煩わしさを与えることなく、効率よく確実に音声認
識される音声認識装置を実現することを課題とする。
【0005】
【課題を解決するための手段】上記課題を達成するため
に、請求項1の音声認識装置は、利用者からの音声を音
声信号に変換する音声入力部と、この音声信号を記憶す
る記憶部と、音声信号の認識候補を出力する音声認識部
と、利用者へ情報を出力する出力部と、音声認識部によ
り認識候補が一つに確定できなかったとき、最初の音声
と関連のある言葉及び最初の音声の一部言い直しの少な
くともいずれか一方の再入力を求める情報を、出力部へ
出力する再入力誘導部とを有し、音声認識部は、再入力
を求める情報に基づき音声入力部に再入力されたなら
ば、再入力された音声の認識結果を用いて、記憶部に記
憶されている最初の音声信号の認識候補を出力する機能
を有することを特徴とする。ここで関連のある言葉と
は、異音による言い換え、上位概念、特徴などをいうも
のである。
【0006】請求項2の音声認識装置は、再入力された
音声の認識候補と記憶部に記憶されている最初の音声信
号の認識候補との関連を持つ組み合わせを捜すことによ
り、最初の音声信号の認識候補を出力する機能を有する
ことを特徴とする。
【0007】上述した手段による作用としては、利用者
が入力した音声が認識されなかったとき、その入力と関
連ある言い換え、上位概念、特徴、一部言い直しを求め
ることにより、次の入力は最初の入力を認識する手助け
となる作用をする。その入力は最初の入力と音声が異な
るので、同じ音声を入力するのに比べて認識の確信度が
異なる。そのため同じ音声を入力することにより同じよ
うに認識できない、という問題が生じない。
【0008】最初の音声入力は記憶部に記憶されている
ので、利用者に言い直しを求めることなく、再入力され
た結果を使って最初の音声入力の認識候補を自動的に絞
り込むことができる。
【0009】また、再入力された音声の認識が不十分な
場合でも、その音声の認識候補は最初の音声入力の認識
候補と異なるので、認識候補同士で関連のある組み合わ
せを捜すことにより、最初の音声入力の認識候補を絞り
込むことができる。
【0010】
【発明の実施の形態】本発明の音声認識装置の実施の形
態例を図1ないし図7を参照して説明する。
【0011】図1に本発明の実施の形態例の音声認識装
置のハードウエア構成図を示す。音声入力部1はマイク
を備えており、マイクから取り込んだ利用者の入力音声
をA/D変換して音声データとし、音声認識部2に送
る。
【0012】音声認識部2は、送られてきた音声データ
に対して音声分析を行い、特徴量を抽出する。これを新
たなサンプリングデータが送られるたびに行う結果、特
徴量の系列が得られる。それを音声認識の対象に応じて
あらかじめROM(Read Only Memory)3に格納された
データと照合し、HMM(Hidden Markov Model )の手
法により、利用者が何と言った可能性が高いか確率計算
を行う。ROM3には統計的手法により計算された音素
の出現確率と、認識対象語の辞書(以下、「認識辞書」
という。)および文法が格納されている。
【0013】計算の結果、確率が高いものを認識候補と
してCPU4へ送る。また、確率に基づく値を認識スコ
アとしてCPU4へ送る。利用者の音声入力に対して計
算した特徴量や、各認識候補に対する認識スコアなど
は、不用になるまでRAM(Random Access Memory)5
に保存する。なお、RAM5の代わりに他の半導体記憶
素子、ディスク記録装置など他の記録媒体であってもか
まわない。
【0014】CPU4は、アプリケーションの実行部分
である。利用者によるキーやボタン、マウスの操作をキ
ー入力部6が検出した場合、音声認識部2で新たな認識
候補が出された場合に、それらがCPU4に知らされ
る。CPU4は、ROM7に格納された各種処理手順
と、利用者入力に従って、アプリケーションを実行す
る。結果は出力部8へ送り、利用者に知らせる。処理の
途中や終わりで保存したいデータはRAM9に保存す
る。出力部8はスピーカや表示画面などを備えており、
本装置はそれらを通じてアプリケーションの実行結果を
利用者に知らせる。
【0015】このハードウエアの動作を地図のアプリケ
ーションを例に説明する。図2は、地図のアプリケーシ
ョンの表示画面を示したもので、利用者が地名、観光ス
ポットなどの名前を言うと、その周辺地図を表示するも
のである。
【0016】利用者が詳細表示したい地名、観光スポッ
トなどを言うと、音声入力部1から音声認識部2へ送ら
れ、音声認識処理が行われて幾つかの認識候補が出され
る。さらに音声認識部2は、各認識候補に対する認識ス
コアを利用して、それぞれの認識結果に対する確信度を
出す。たとえば、正しく認識したときの認識スコアと誤
認識したときの認識スコアの分布を統計的手法により分
析し、その結果をテーブルデータとしてRAM5に保持
しておく。そして音声認識部2は、現在の認識候補に対
する認識スコアをテーブルデータと照合し、どの程度の
確度で認識結果が正しそうか調べる。
【0017】利用者が何と言ったか1つに絞れれば、C
PU4は、ただちに出力部8の表示画面を絞られた指定
の表示に切り替える。しかし1つに絞りきれない場合
は、CPU4は、「何県」の都市名か、「道路名」か、
「駅名」か、「山」、「海」の名前か、など関連のある
情報を出力部8の表示画面から表示をして、利用者に音
声で入力してもらう。音声認識部2はそれらの情報を交
えて、最初に利用者が言ったことに対して再度認識処理
をする。
【0018】最終的に認識候補を絞りきれなければ、C
PU4は、それらを全て出力部8の表示画面に提示す
る。利用者は提示された認識候補10から自分が言った
通りのものを、キー入力部6で選択する。
【0019】次に本発明の実施の形態例の利用者の音声
入力に対する処理手順を、この地図のアプリケーション
を例に、図3のフローチャートを参照して詳細に説明す
る。この手順の中には音声入力部1、音声認識部2、C
PU4の処理が含まれる。また、処理手順中の利用者入
力と認識候補の関係を図4に示す。
【0020】ステップS101で、利用者が「御宿(お
んじゅく)」と音声入力部1から音声入力すると、その
音声データが音声認識部2に送られ、RAM5に記憶さ
れる。
【0021】ステップS102で、音声認識部2でHM
Mを用いた単語音声認識の処理がされ、利用者が何と言
った可能性が高いか確率計算が行われる。そして、認識
候補と共に、確率に基づく値が認識スコアとして出され
る。次に、認識スコアを利用して各認識候補に対する認
識の確信度を求め、認識候補を1つに絞ろうとする。そ
の結果、図4で示すように、認識候補が「御宿」、「小
田原」、「御前崎」とあり、1つに絞れないものとす
る。
【0022】ステップS103で、確信度が十分である
かチェックする。確信度が十分であれば終了し、確信度
が十分でないか、認識候補を1つに絞れなければステッ
プS104へ移行する。認識候補が「御宿」「小田原」
「御前崎」とあり、1つに絞れないのでステップS10
4へ移行する。
【0023】ステップS104で、音声認識部2は音声
認識辞書を「場所の名前」から「場所の種類」に変更を
すると共に、CPU4は出力部8により利用者へ最初の
入力音声と関連のある更なる入力を求める表示を行う。
たとえば言い換え、上位概念、特徴などである。ステッ
プS105で、利用者が出力部8の表示に基づいて「海
水浴場(かいすいよくじょう)」と音声入力をすると、
その音声データが音声認識部2に送られ、RAM5に記
憶される。
【0024】ステップS106で、再び音声認識処理が
され、幾つかの認識候補が出されるる。その結果、図4
に示すように、認識候補が「海水浴場」、「買い物」、
「川」と出される。
【0025】ステップS107で、ステップS106の
認識候補が十分な確信度で認識されたならばステップS
108へ移行し、十分な確信度で認識されなかったなら
ばステップS109へ移行する。認識候補が「海水浴
場」に絞られたならばステップS108へ移行するが、
認識候補が「海水浴場」、「買い物」、「川」とあり、
1つに絞れないのであればステップS109へ移行す
る。
【0026】ステップS108は、ステップS107で
認識された言葉を元にして認識辞書を変更し、ステップ
S102へ戻る。したがって認識辞書を「海水浴場の名
前」に変更し、ステップS102へ戻る。
【0027】このときステップS102では、「海水浴
場の名前」の認識辞書に限定し、最初の利用者入力に対
する音声認識処理を行う。これにより認識候補を絞って
いく。なお、利用者が最初に入力した音声データはRA
M5に記憶されているので再入力の必要はない。
【0028】最初の認識候補で「御宿」、「小田原」、
「御前崎」の中で「海水浴場の名前」の認識辞書に「御
宿」しかなければ認識候補が一つとなり、ステップS1
03から終了する。「海水浴場の名前」の認識辞書に
「御宿」と「御前崎」があれば、確信度不十分としてス
テップS103からステップS104へ移行する。この
場合、更なる入力を求めることになり、入力が増えるに
したがって確信度が高まり、ステップS107またはス
テップS103で確信度十分となるまで上記ステップに
よる処理が続く。この処理は後述する。
【0029】ステップS109は、最初の入力と2回目
の入力の認識候補を比較し、互いに関連を持つ組み合わ
せを捜す。ROMに格納されている認識辞書は、音声認
識辞書の他に、単語ごとの関連を示すグループ分けのデ
ータを持っている。そのデータも参照して、最初の入力
の認識候補を絞る。
【0030】最初の入力の認識候補で「御宿」だけが
「海水浴場」としてROM3に入っていれば「御宿」が
確信度十分となる。もし「御宿」と「御前崎」は「海水
浴場」に属するという情報がROM3に入っているとす
ると、「御宿」と「御前崎」は確信度が高くなるが依然
として1つに絞りきれないので確信度不十分となる。
【0031】ステップS110は、確信度十分であるか
チェックする。関連を持つ組み合わせが1つしかなけれ
ば確信度十分と判断して終了する。関連を持つ組み合わ
せがないか、2つ以上あれば確信度不十分としてステッ
プS104へ戻る。
【0032】確信度不十分としてステップS104へ戻
った場合、更なる入力を求めることになり、入力が増え
るにしたがって確信度が高まり、ステップS107また
はステップS103で確信度十分となるまで上記ステッ
プによる処理が続く。この様子をさらに説明する。
【0033】ステップS104で、音声認識辞書を「場
所の種類」にして、CPU4は出力部8により利用者へ
更なる入力を求める表示を行う。ステップS105で、
利用者から「千葉県(ちばけん)」と音声入力があれ
ば、その音声データが音声認識部2に送られ、RAM5
に記憶され、ステップS106へ移る。
【0034】ステップS106で、音声認識処理がされ
る。その結果「千葉県」が十分な確信度で認識されたな
らば、ステップS107からステップS108へ移行
し、認識辞書を「千葉県内の場所の名前」に限定する。
【0035】ステップS102へ戻り、「千葉県内の場
所の名前」の認識辞書を使って、RAM5に保存されて
いるステップS101で入力された音声に対する音声認
識処理をする。ステップS101で入力された音声の認
識候補である「御宿」、「小田原」、「御前崎」の中で
「千葉県内の場所の名前」であるのは「御宿」しかない
ので「御宿」が確信度十分となる。その結果、ステップ
S103で「御宿」が確信度十分のため終了する。
【0036】もし、ステップS106で音声認識処理の
結果、図4に示すように認識候補が「千葉県」、「岩手
県」、「茨城県」となり、「千葉県」に十分な確信度が
なければ、ステップS107からステップS109へ移
る。
【0037】ステップS109で、最初の入力の認識候
補である「御宿」、「小田原」、「御前崎」、次の入力
の認識候補である「海水浴場」、「買い物」、「川」、
3番目の入力の認識候補である「千葉県」、「岩手
県」、「茨城県」を互いに比べて、関連を持つ組み合わ
せを捜す。すると「御宿」、「海水浴場」、「千葉県」
が唯一関連を持つ組み合わせであるので、最初の入力は
「御宿」が確信度十分となる。その結果、ステップS1
10で、「御宿」が確信度十分のため終了する。
【0038】次に、音声入力に対する処理手順を、文章
などの連続音声が入力される場合を例に、図5のフロー
チャートを参照して詳細に説明する。まず、最初に言い
たいことをまとめて一気に音声入力するが、それが認識
されなかったときに、キーワードだけ改めて入力し直す
例を説明する。また、処理手順中の利用者入力と認識候
補の関係を図6に示す。
【0039】ステップS201で、利用者が「佐藤君に
3000円貸した。25日過ぎたら返してもらう。」と
いう入力を行ったならば、その音声データが音声認識部
2に送られ、RAM5に記憶される。
【0040】ステップS202で、HMMを用いた連続
音声認識処理にかけられ、認識候補の文と認識スコアが
出される。そして、認識スコアを利用して各認識候補に
対する認識の確信度を求め、認識候補を1つに絞ろうと
する。その結果、図6に示すように認識候補として「加
藤君に3000年寝かした。15日過ぎたら介して森
を。」、「佐藤君に散々円貸した。25日杉戦えしても
らう。」、「台東区に3000円か下。25に来すぎた
ら返してもらう。」が出され、いずれも確信度が不十分
となったものとする。
【0041】ステップS203で、確信度十分であれば
終了するが、1つに絞れず確信度不十分であるのでステ
ップS204へ移る。ステップS204で、認識辞書を
変更する。次のステップでキーワードの入力を求めるの
で、HMMを用いた単語音声認識のための認識辞書と
し、認識候補文に含まれる単語、フレーズをリストアッ
プすることにより認識辞書として対応するHMMを作
る。
【0042】すなわち、「加藤、佐藤、台東区、300
0年、3000円、15日、25日、寝かした、貸し
た、介して、戦え」などを認識対象とする。そして、利
用者が最初に言った入力のキーワードを入力するように
誘導する表示を出力部8から行う。
【0043】ステップS205で、図6に示すように利
用者が「佐藤、3000円、25日」と音声入力する
と、その音声データが音声認識部2に送られ、RAM5
に記憶される。ステップS206で、認識処理にかけら
れる。最初の入力に比べて音声認識の対象が絞られるこ
と、また、一般に連続認識よりも単語認識の方が確度が
高いことから、キーワード入力の際には高い認識率で処
理を行うことができる。そのため十分な確信度で「佐
藤」、「3000円」、「25日」の3つの単語が得ら
れる。
【0044】ステップS207で、確信度がチェックさ
れ、十分な確信度であるのでステップS208へ移る。
なお、ステップS201での入力を録音で保存してお
き、キーワードのみを本処理の結果として残すような場
合は、これで終了できる。また、稀なケースであるが確
信度不十分となると、ステップS209へ移行し、CP
U4は認識候補を全て出力部8の表示画面に提示する。
利用者は提示された認識候補から自分が言った通りのも
のを、キー入力部6で選択する。そしてステップS20
8へ移行する。
【0045】ステップS208で、認識辞書を再び連続
音声認識のための認識辞書に変更し、ステップS202
へ移行する。ステップS202では、「佐藤」、「30
00円」、「25日」の3つのキーワードが現れる認識
候補の文が得られる。そして認識候補文の確信度を調べ
る。ここで、利用者が最初に入力した音声のデータはR
AM5に保存されているので再入力の必要はない。
【0046】今回は十分な確信度で「佐藤君に3000
円貸した。25日過ぎたら返してもらう。」に認識候補
が絞られる。ステップS203で、確信度十分として、
終了する。
【0047】次に、同じ例を用いて、最初に言いたいこ
とをまとめて一気に音声入力するが、それが認識されな
かったときに、最初の入力順にフレーズや単語の単位で
区切りながら入力し直す例を説明する。
【0048】ステップS203までは上述の例と同じで
ある。ステップS204からは、フレーズや単語の単位
で区切りながら利用者に入力する形態の処理を行う。
【0049】ステップS204で、認識辞書を変更す
る。HMMを用いた単語音声認識を行うために、認識候
補文に含まれるフレーズで文頭から始まるものをリスト
アップして認識辞書とし、対応するHMMを作る。これ
により「加藤君に、佐藤君に、台東区に、」などが認識
対象となる。そして、利用者へ最初に言った入力の最初
のフレーズを入力するように誘導する表示を出力部8か
ら行う。
【0050】ステップS205で、利用者が最初に言っ
た入力の最初のフレーズ「佐藤君に」を音声入力する
と、その音声データが音声認識部2に送られ、RAM5
に記憶される。ステップS206で、認識処理がされ
る。最初の入力に比べて音声認識の対象が絞られるこ
と、一般に連続認識よりも単語認識の方が確度が高いこ
とから、フレーズ入力の際には高い認識率で処理を行う
ことができる。そのため、十分な確信度で「佐藤君に」
のフレーズが得られる。
【0051】ステップS207で、確信度十分と判定さ
れ、ステップS208へ移行する。ステップS208
で、認識辞書を最初の連続音声の認識辞書に変更し、ス
テップS202へ移行する。ステップS202で、「佐
藤君に」のフレーズで始まる認識候補が出される。な
お、利用者が最初に入力した音声のデータはRAM5に
記憶されているので再入力の必要はない。
【0052】ステップS203で、ステップS202の
結果得られた認識候補文の確信度を調べる。十分な確信
度で1つの認識候補文に絞ることができないときはステ
ップS204へ移行する。ステップS204で、認識辞
書をHMMを用いた単語音声認識を行うために、認識候
補文から音響的に「佐藤君に」に続く単語またはフレー
ズをリストアップして認識辞書とし、対応するHMMを
つくる。「3000円、3000年、散々、」などが認
識対象となる。
【0053】ステップS205で、利用者から次のフレ
ーズ「3000円」を音声入力されたならば、その音声
データが音声認識部2に送られ、RAM5に記憶され
る。ステップS206で、認識処理がされ、十分な確信
度で「3000円」のフレーズが得られる。
【0054】ステップS207で、確信度十分と判断さ
れ、ステップS208へ移行する。ステップS208
で、認識辞書を最初の連続音声の認識辞書に変更し、ス
テップS202へ移行する。
【0055】このような処理手順により、ステップS2
03で十分な確信度で1つの認識候補文に絞れるまで繰
り返す。利用者にはステップS205のたびに、「貸し
た」、「25日」、「過ぎたら」、「返してもらう」と
いう続きのフレーズを、順に1フレーズずつ入力しても
らう。
【0056】この様子を利用者入力の手順で示したもの
が図7である。利用者は、最初の「佐藤君に3000円
貸した。25日過ぎたら返してもらう。」のあと、ステ
ップS203で確信度十分となるまで、順に「佐藤君
に」、「3000円」、「貸した」、「25日」、「過
ぎたら」、「返してもらう」のフレーズ入力を行う。
【0057】以上のように、単語のみならず文の音声入
力であっても確実に認識することが可能となり、音声を
入力する様々な装置に利用できる。
【0058】
【発明の効果】本発明の音声認識装置によれば、最初の
音声入力によっては十分な確信度が得られなかった場合
に、その結果に関連して次の入力を求め、その認識結果
に基づいて最初の音声認識候補を絞り込むので、効率的
且つ確実に音声認識が可能となる。そのため、何度同じ
言葉を言っても認識がされない、ということがなく、利
用者にやさしく能率のよい音声認識装置が実現できる。
【図面の簡単な説明】
【図1】 本発明の実施の形態例の音声認識装置のハー
ドウエア構成図である。
【図2】 地図のアプリケーションの表示画面を示した
図である。
【図3】 地図のアプリケーションによる処理手順を示
すフローチャートである。
【図4】 地図のアプリケーションでの利用者入力と認
識候補の関係を示した図である。
【図5】 連続音声が入力される場合の処理手順を示す
フローチャートである。
【図6】 連続音声が入力される場合の処理手順中の利
用者入力と認識候補の関係を示した図である。
【図7】 最初の入力順にフレーズや単語の単位で区切
りながら入力し直す例の利用者入力の手順を示した図で
ある。
【符号の説明】
1…音声入力部、2…音声認識部、3…ROM、4…C
PU、5…RAM、6…キー入力部、7…ROM、8…
出力部、9…RAM、10…認識候補
フロントページの続き (72)発明者 加藤 靖彦 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5D015 HH21 LL02 9A001 GZ05 HH17

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 利用者からの音声を音声信号に変換する
    音声入力部と、 前記音声信号を記憶する記憶部と、 前記音声信号の認識候補を出力する音声認識部と、 前記利用者へ情報を出力する出力部と、 前記音声認識部により前記認識候補が一つに確定できな
    かったとき、最初の音声と関連のある言葉及び最初の音
    声の一部言い直しの少なくともいずれか一方の再入力を
    求める情報を、前記出力部へ出力する再入力誘導部とを
    有し、 前記音声認識部は、前記再入力を求める情報に基づき前
    記音声入力部に再入力されたならば、再入力された音声
    の認識結果を用いて、前記記憶部に記憶されている最初
    の音声信号の認識候補を出力する機能を有することを特
    徴とする音声認識装置。
  2. 【請求項2】 前記音声認識部は、前記再入力された音
    声の認識候補と前記記憶部に記憶されている最初の音声
    信号の認識候補との関連を持つ組み合わせを捜すことに
    より、最初の音声信号の認識候補を出力する機能を有す
    ることを特徴とする請求項1に記載の音声認識装置。
JP10316607A 1998-11-06 1998-11-06 音声認識装置 Pending JP2000148181A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10316607A JP2000148181A (ja) 1998-11-06 1998-11-06 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10316607A JP2000148181A (ja) 1998-11-06 1998-11-06 音声認識装置

Publications (1)

Publication Number Publication Date
JP2000148181A true JP2000148181A (ja) 2000-05-26

Family

ID=18078962

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10316607A Pending JP2000148181A (ja) 1998-11-06 1998-11-06 音声認識装置

Country Status (1)

Country Link
JP (1) JP2000148181A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008003266A (ja) * 2006-06-22 2008-01-10 Alpine Electronics Inc 行き先設定装置及び行き先設定方法
JP2008134502A (ja) * 2006-11-29 2008-06-12 Nissan Motor Co Ltd 音声認識装置、および音声認識方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008003266A (ja) * 2006-06-22 2008-01-10 Alpine Electronics Inc 行き先設定装置及び行き先設定方法
JP2008134502A (ja) * 2006-11-29 2008-06-12 Nissan Motor Co Ltd 音声認識装置、および音声認識方法
US8108215B2 (en) 2006-11-29 2012-01-31 Nissan Motor Co., Ltd. Speech recognition apparatus and method

Similar Documents

Publication Publication Date Title
KR101537370B1 (ko) 녹취된 음성 데이터에 대한 핵심어 추출 기반 발화 내용 파악 시스템과, 이 시스템을 이용한 인덱싱 방법 및 발화 내용 파악 방법
CN109493850B (zh) 成长型对话装置
JP3454897B2 (ja) 音声対話システム
US10917758B1 (en) Voice-based messaging
US6192337B1 (en) Apparatus and methods for rejecting confusible words during training associated with a speech recognition system
US7162423B2 (en) Method and apparatus for generating and displaying N-Best alternatives in a speech recognition system
US20150073792A1 (en) Method and system for automatically detecting morphemes in a task classification system using lattices
US20020169600A1 (en) Multi-stage large vocabulary speech recognition system and method
US11295741B2 (en) Dynamic wakewords for speech-enabled devices
US20070094008A1 (en) Conversation control apparatus
US20020111803A1 (en) Method and system for semantic speech recognition
US20050033575A1 (en) Operating method for an automated language recognizer intended for the speaker-independent language recognition of words in different languages and automated language recognizer
JP5824829B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
US20060020471A1 (en) Method and apparatus for robustly locating user barge-ins in voice-activated command systems
CN103730115A (zh) 一种语音中检测关键词的方法和装置
US20050004799A1 (en) System and method for a spoken language interface to a large database of changing records
WO2017168637A1 (ja) 意図推定装置及び意図推定方法
US20170270923A1 (en) Voice processing device and voice processing method
JP2008216461A (ja) 音声認識・キーワード抽出・知識ベース検索連携装置
JP2000148181A (ja) 音声認識装置
CN108877781B (zh) 一种智能语音搜索影片的方法及系统
US10832675B2 (en) Speech recognition system with interactive spelling function
JP2003162524A (ja) 言語処理装置
JP2009282835A (ja) 音声検索装置及びその方法
JP4042435B2 (ja) 音声自動質問応答装置