JPH06175688A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH06175688A
JPH06175688A JP4328132A JP32813292A JPH06175688A JP H06175688 A JPH06175688 A JP H06175688A JP 4328132 A JP4328132 A JP 4328132A JP 32813292 A JP32813292 A JP 32813292A JP H06175688 A JPH06175688 A JP H06175688A
Authority
JP
Japan
Prior art keywords
recognition
candidate
candidates
user
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4328132A
Other languages
English (en)
Other versions
JP3340163B2 (ja
Inventor
Hiroshi Matsuura
博 松浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP32813292A priority Critical patent/JP3340163B2/ja
Publication of JPH06175688A publication Critical patent/JPH06175688A/ja
Application granted granted Critical
Publication of JP3340163B2 publication Critical patent/JP3340163B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】音声認識の結果により、その認識候補を外部出
力して利用者に選択させる場合に、極端に似ていない候
補が表示されることを防止できるようにする。 【構成】利用者が発声した音声はA/D変換器1により
量子化された後、分析・特徴抽出部2によるLPC分
析、連続マッチング部3による連続マッチング処理、そ
してHMM認識部5による認識処理が行われ、認識候補
が制御部10に渡される。制御部10は、第1位の認識
候補により候補表示制限部9を構成するテーブルを参照
し、その候補に対応して同テーブルに登録されていない
候補については、第1位の候補とは全く似ていないもの
として、HMM認識部5より渡された候補から除外し
て、利用者の選択対象とすべき候補を決定する。この決
定された選択候補は表示部7に表示され、利用者の選択
部8を用いた選択操作に供される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、人間の発声した音声を
認識して機器等を制御するのに好適な音声認識装置に関
する。
【0002】
【従来の技術】この種の音声認識装置では、利用者が発
声した音声を所定の認識方式により認識し、その認識結
果を例えば類似度の大きい順に例えば第3位までを選択
候補として表示することにより、利用者にいずれか1つ
を選択させるようになっている。
【0003】
【発明が解決しようとする課題】しかし従来は、特定の
認識方式による類似度順で選択候補を表示した場合、利
用者の感覚では似ても似つかない候補が併記されること
が度々発生し、非常な違和感を利用者にいだかせるとい
う問題があった。
【0004】本発明は上記事情に鑑みてなされたもので
その目的は、音声認識の結果により、その認識候補を外
部出力して利用者に選択させる場合に、極端に似ていな
い候補が表示されることを防止できる音声認識装置を提
供することにある。
【0005】
【課題を解決するための手段】本発明は、利用者が発声
した音声を入力するための音声入力手段と、入力された
音声を分析し、特徴量を抽出する分析・特徴抽出手段
と、抽出された特徴量を用いて音声を認識して1つまた
は複数の認識候補を求める認識手段とを備えた音声認識
装置において、認識手段により求められ得る認識候補の
うち、利用者にとって聞き誤りしやすい似通った候補同
士が予めグループ化されて登録されている登録手段と、
認識手段によって実際に求められた認識候補の中から、
利用者にとって似通っていないと判断される候補を登録
手段の登録内容をもとに除外して、利用者による選択対
象とすべき候補を決定する選択候補決定手段と、この選
択候補決定手段によって決定された選択候補を外部出力
して、利用者による候補選択に供する選択候補出力手段
とを設けたことを特徴とするものである。
【0006】
【作用】上記の構成において、利用者が発声した音声は
音声入力手段により入力されて、分析・特徴抽出手段に
より分析され、その特徴量が抽出され、しかる後、認識
手段によりその特徴量を用いた認識処理が行われ、認識
候補が求められる。選択候補決定手段は、認識手段によ
って求められた認識候補をもとに、登録手段を参照す
る。この登録手段には、認識手段により求められ得る認
識候補のうち、利用者にとって聞き誤りしやすい候補同
士が予めグループ化されて登録されている。この登録情
報は、複数の話者が1人ずつ発声する単語を複数の聞き
手が認識した結果を集計することにより、実験的に求め
ることが可能である。
【0007】そこで選択候補決定手段は、上記のように
登録手段を参照することにより、認識手段によって求め
られた認識候補の中から、利用者にとって似通っていな
いと判断される候補を除外して、利用者による選択対象
とすべき候補を決定する。この決定された選択候補は選
択候補出力手段により表示あるいは音声出力されて、利
用者による候補選択に供される。
【0008】このように上記の構成によれば、認識手段
により認識された候補を(例えば類似度の大きい順に)
そのまま表示あるいは音声出力して利用者に選択させる
のではなく、人間では聞き間違えるような候補のみ選ん
で利用者に選択させるため、利用者に違和感を与えな
い。
【0009】
【実施例】以下、本発明の一実施例について、駅の券売
機に用いる音声認識装置に適用した場合を例に、図面を
参照して説明する。図1は、同実施例における音声認識
装置の構成を概略的に示すブロック図である。
【0010】図1において、1は本装置に入力される音
声信号(入力音声)をA/D(アナログ/ディジタル)
変換するA/D変換器である。A/D変換器1は、入力
音声を、例えばサンプリング周波数12kHz,12ビ
ットで量子化する。
【0011】A/D変換器1により量子化された入力音
声は、その音声を分析して特徴量を抽出するための分析
・特徴抽出部2に与えられる。分析・特徴抽出部2は、
A/D変換器1によって量子化された入力音声の音声パ
ワ−の計算と、LPC(Linear Predictive Coding)分
析とを行う。このLPC分析は、例えばフレ−ム長16
msec、フレ−ム周期8msecで16次のLPCメルケプス
トラムを分析パラメ−タとして行われる。なお、分析・
特徴抽出部2での分析は、LPC分析に限るものではな
く、BPF(Band Pass Filter)分析等でもよい。
【0012】分析・特徴抽出部2で分析された特徴パラ
メ−タは連続マッチング部3に与えられる。この連続マ
ッチング部3は、音声セグメント(Phonetic Segment)
複合辞書部(以下、PS複合辞書部と称する)4に登録
されている所定のPS単位の認識辞書との間で時間軸方
向に連続的にマッチング処理して、第1位乃至第n位ま
でのラベル系列(PSラベル系列)とその類似度を求め
るためのものである。以上の音声セグメント(PS)に
ついては、例えば特願平2−306061号に詳述され
ている。なお、上記認識辞書は、各PS(PSラベル)
毎に複数の標準パタ−ンから作成された識別用辞書から
なる。連続マッチング部3でのPSによる連続マッチン
グ処理は、次式に示す複合LPCメルケプストラム類似
尺度を用いて行われる。
【0013】
【数1】
【0014】なお、(1)式において、CはLPCメル
ケプストラム、Wm (Ki),φm (ki)はそれぞれPS名K
i の固有値から求められる重みと固有ベクトルである。
また、( ・ )は内積を示し、‖ ‖はノルムを示し
ている。
【0015】連続マッチング部3で求められたPSラベ
ル系列のうち、第1位の系列が、HMM(hidden marco
v model ;隠れマルコフモデル)を用いた単語照合を行
うためのHMM認識部5に送られる。
【0016】このHMM認識部5における単語照合につ
き説明する。まず単語照合は、連続マッチング部3から
送られた第1位のPSラベル系列を単語毎(カテゴリ
毎)のHMMに通すことにより行われる。
【0017】ここで、HMMの一般的定式化について述
べる。HMMでは、N個の状態S1,S2 ,…,SN
持ち、初期状態がこれらN個の状態に確率的に分布して
いるとする。音声では、一定のフレ−ム周期毎に、ある
確率(遷移確率)で状態を遷移するモデルが使われる。
遷移の際には、ある確率(出力確率)でラベルを出力す
るが、ラベルを出力しないで状態を遷移するナル遷移を
導入することもある。出力ラベル系列が与えられても状
態遷移系列は一意には決らない。観測できるのは、ラベ
ル系列だけであることからhidden(隠れ)marcov model
(HMM)と呼ばれている。HMMのモデルMは次の6
つのパラメ−タから定義される。 N :状態数 (状態S1 ,S2 ,…,SN ) K :ラベル数 (ラベルR=1,2,…,K) pij :遷移確率 Si からSj に遷移する確率 qij(k) :Si からSj への遷移の際にラベルkを出力
する確率 mi :初期状態確率 初期状態がSi である確率 F :最終状態の集合
【0018】次に、モデルMに対して音声の特徴を反映
した遷移上の制限を加える。音声では、一般に状態Si
から以前に通過した状態(Si-1 ,Si-2 ,…)に戻る
ようなル−プの遷移は時間的前後関係を乱すため許され
ない。
【0019】HMMの評価は、モデルMが第1位のラベ
ル系列O1 =o11,o21,…,oT1を出力する確率Pr
(O/M)を求めることにより行われる。認識時には、
HMM認識部5で各モデルを仮定し、連続マッチング部
3から送られる第1位のラベル系列(PSラベル系列)
を用いて、まず確率Pr(O/M)が最大になるような
モデルM1 を探し、第1位の認識候補とする。同様に、
HMM認識部5は、次に確率が大きくなるモデルM2 を
第2位の認識候補とし、その次に確率が大きくなるモデ
ルM3 を第3位の認識候補とする。但し、確率が予め定
められた値より小さい時は、認識候補としない。このH
MM認識部5で仮定される各モデル(のパラメータ)
は、HMMの学習により求められるものであり、HMM
バッファ6に蓄積されている。以上のようにして、発声
された入力音声を認識処理することによって、その入力
音声、例えば行先の駅名を高精度に認識することが可能
となる。
【0020】さて、図1の音声認識装置は、以上のA/
D変換器1、分析・特徴抽出部2、連続マッチング部
3、PS複合辞書部4、HMM認識部5およびHMMバ
ッファ6の他に、表示部7、選択部8、候補表示制限部
9および制御部10を有している。
【0021】表示部7は、制御部10のもとで、例えば
行先駅名の発声勧誘のための表示(ここでは、文字列
「発声して下さい」の表示)、HMM認識部5での認識
結果(認識候補)の表示等を行う。この表示部7による
認識結果表示は、図3(a),(b)に示すように、第
1位の認識候補(ここでは「菰野」)のみを表示して
も、複数の候補、例えば図3(c)に示すように、第1
位の認識候補(ここでは「菰野」)と第2位の認識候補
(ここでは「駒野」)を表示しても構わない。
【0022】選択部8は、表示部7に表示された認識候
補を利用者が選択可能なように構成されたものである。
この選択部8と上記表示部7は、例えば液晶ディスプレ
イ(CRTディスプレイなどの表示モニタでも構わな
い)上に感圧型の透明タブレットを組合わせたタッチパ
ネルを用いて構成されている。
【0023】候補表示制限部9は、HMM認識部5で得
られた複数の認識候補を表示部7に表示する際に、例え
ば第2位以下の候補については、第1位の候補と極端に
似ていないものが表示されないように制限を加えるため
のものである。この候補表示制限部9は、図4に示すよ
うに、第1位の候補に対して、2位以下に表示すること
が許される候補、具体的には第1位の候補が発声された
場合に人間では誤って聞取りやすい単語を、第1位とな
り得る各候補毎に登録(蓄積)したテーブル(データベ
ース)である。このテーブルの登録情報は、複数の話者
が1人ずつ発声する単語(この例では駅名)を複数の聞
き手が認識した結果を集計することにより、実験的に求
めることが可能である。
【0024】制御部10は、表示部7に対する表示制御
をHMM認識部5の認識結果、候補表示制限部9の登録
内容等に従って行うと共に、選択部8からの選択指示情
報に従い外部機器(ここでは、券売機)を制御する。図
2は、図1の音声認識装置内の表示部7および選択部8
の構成を示す。
【0025】図2に示すように、表示部7は、液晶ディ
スプレイ71と、同ディスプレイ71に表示する表示情
報を格納するための表示メモリ72とから構成される。
この表示メモリ72内の表示情報は、図1に示す制御部
10により書込まれる。液晶ディスプレイ71に表示さ
れる内容には、上記した発声勧誘のための表示情報、認
識候補の表示情報の他に、表示された認識候補の確認
(第1位の候補だけの表示の場合)を勧誘するための表
示情報(文字列「確認して下さい」)、利用者による画
面上での確認操作に供される領域(キー領域)の表示情
報([確認]という項目キー)、(表示された認識候補
が誤りである場合、即ち利用者の意図した候補が表示さ
れていない場合に)利用者による再発声を受付けるため
の領域(キー領域)の表示情報([言い直し]という項
目キー)、認識結果の選択操作を勧誘するための表示情
報(文字列「選択して下さい」)等がある。
【0026】一方、選択部8は、表示部7の表示画面
上、即ち液晶ディスプレイ71上に積層されて、同ディ
スプレイ71と一体に形成された感圧シート型の透明タ
ブレット81と、透明タブレット81が利用者の指等に
より押圧された場合に、その透明タブレット81面上の
座標位置を検出するための指示座標検出部82と、指示
情報判定部83とから構成される。この指示情報判定部
83は、指示座標検出部82により検出された座標と表
示メモリ72の内容とから、画面上のいずれの項目キー
(表示情報)が利用者により選択指定されたかを判定
し、その判定結果を選択指示情報として制御部10に送
る。
【0027】このような構成において、制御部10の制
御による発声の勧誘に従って、利用者が行先駅名として
「こもの」と発声したのに対し、HMM認識部5にて、
その音声に対する認識処理が行われ、その認識結果とし
て複数の認識候補が制御部10に送られたものとする。
この認識結果には、第1位の認識候補「菰野」(こも
の)と第2位の認識候補「駒野」(こまの)が含まれて
いるものとする。
【0028】制御部10は、発声勧誘タイミングの一定
時間前から始まる、同タイミングを挟む一定期間(また
は、利用者による候補選択が行われるまでの期間)は、
HMM認識部5の認識結果を全て受取るように構成され
ている。このようにすることにより、利用者の発声のタ
イミングに対する制限が緩和される。なお、HMM認識
部5の認識結果に対する制御部10の受取り期間を設定
する代わりに、HMM認識部5の動作期間を設定するよ
うにしてもよい。また、認識の対象とする音声の入力期
間を設定するためのスイッチを設け、利用者がこのスイ
ッチをオンにしている期間だけ利用者の発声した音声が
本装置に入力され、その入力音声が全てHMM認識部5
での認識処理に供されて、その認識結果が制御部10で
受取られる構成とするようにしてもよい。
【0029】さて制御部10は、HMM認識部5から送
られた第1位の認識候補「菰野」を含む複数の認識候補
を受取り、表示部7(の液晶ディスプレイ71)の表示
画面上に、例えば図3(a)に示すように第1位の認識
候補「菰野」のみを表示させる。この画面上には、同時
に、例えば画面上方に「確認して下さいの」勧誘メッセ
ージが、画面右下に項目キー[確認]が、画面左下に項
目キー[言い直し]が、それぞれ表示される。
【0030】ここで、画面表示された認識候補「菰野」
が正しいならば、利用者は「確認して下さい」の要求に
従って、表示画面右下の[確認]の項目キー(の領域)
を、指により透明タブレット81上で触る。
【0031】すると、その[確認]の項目キーの座標が
指示座標検出部82により検出される。指示情報判定部
83は、指示座標検出部82により検出された座標と表
示メモリ72の内容とから、この検出座標位置に表示さ
れている表示情報の示す項目キーが選択されたこと、即
ち[確認]が選択されたことを判定し、その旨を示す選
択指示情報を制御部10に送る。これにより制御部10
は、第1位の候補「菰野」が確認されたものとして、外
部機器(券売機)を制御する。
【0032】なお、図3(a)に示すような[確認]の
項目キーを表示する代わりに、第3図(b)に示すよう
に第1位の認識候補自体に[確認]の項目キーの役割を
持たせ、「菰野」の表示領域を指で触って確認入力する
ことが可能な構成としてもよい。
【0033】また、利用者が「こもの」と発声したとき
に、例えば図3(c)に示すように、第1位の候補「菰
野」と第2位の候補「駒野」が、[確認]の項目キーの
役割を兼ねた形態で表示された場合には、「選択して下
さい」の要求に従って、利用者が「菰野」の表示領域を
指で触れば、指示情報判定部83により「菰野」が選択
され、その旨を示す選択指示情報が制御部10に送られ
る。もし、利用者が意図した候補が表示されなかった場
合には、利用者は、[言い直し]の項目キー(の領域)
を、指により透明タブレット81上で触る。
【0034】すると、前記した[確認]の項目キー(の
領域)が指で触られた場合と同様にして、選択部8内の
指示情報判定部83により、[言い直し]が選択された
ことが判定され、その旨を示す選択指示情報が制御部1
0に送られる。これにより制御部10は、[言い直し]
(再発声)が要求されたものと判断して、言い直しモー
ド(再発声モード)に設定し、再発声のための勧誘を例
えば“ピー”音等により行う。この勧誘に従い、利用者
は、正しく認識されなかった行き先駅名を再発声するこ
とができる。
【0035】さて本実施例において、図3(a)または
(b)に示すように第1位の候補だけを表示するか、図
3(c)に示すように第2位までの候補を表示するか
は、制御部10により決定される。この制御部10によ
る決定条件は2つある。
【0036】第1の条件は、第1位と第2位の類似度の
差が第1の所定値を超えているか否か、あるいは第2位
の類似度値が第2の所定値未満であるか否かである。ま
た、第2の条件は、第2位の候補が第1位の候補と対を
なして候補表示制限部9に登録されているか否かであ
る。
【0037】第1の条件が成立する場合には、第2の条
件の成立/不成立に無関係に、第1位の候補だけが表示
される。また第1の条件が不成立の場合には、第2の条
件が成立なら第2位までの候補が表示され、第2の条件
が不成立なら第1位の候補だけが表示される。
【0038】このように本実施例では、第2位の候補の
確からしさが低い場合には、第1位の候補だけを表示し
て、利用者が選択し易いようにしている。また、第2位
の候補の確からしさが高い場合でも、その第2位の候補
が第1位の候補と対をなして候補表示制限部9に登録さ
れていない場合には、その第2位の候補は第1位の候補
とは極端に似ていないものとして表示せず、利用者に違
和感を与えないようにしている。
【0039】ここで、上記第1の条件が不成立のため
に、第2の条件の成立/不成立に従って、第2位までの
候補を表示するか、あるいは第1位の候補だけを表示す
るかを決定する具体例について説明する。
【0040】図5は、ある利用者(話者)の発声入力に
対するHMM認識部5の認識結果の1位候補から3位候
補までを示したものである。但し、発声入力された単語
が1位候補にならなかった場合のみ示している。
【0041】図5において、例えば「二上」(にじょ
う)という発声入力に対する、認識候補の1位は「十
条」(じゅうじょう)、2位は「二上」、3位は「西の
京」である。一方、候補表示制限部9では、図4に示す
ように、1位候補「十条」に対しては、「新庄」と「二
上」だけが(第2位以下に)表示することが許されてい
る。したがって、上記第1の条件が不成立のために2位
候補まで表示しようとする場合には、1位候補「十条」
の他、2位候補「二上」も表示部7に表示される。
【0042】なお上記の例では、たとえ3位候補まで表
示しようとしても、1位候補が「十条」の場合には、3
位候補の「西の京」は、候補表示制限部9では表示する
ことが許されていないため、1位の「十条」と2位の
「二上」以外は表示されない。即ち本実施例では、利用
者にとって「十条」や「二上」とは全く似ていないと感
じられる3位候補「西の京」は、3位候補まで表示しよ
うとする場合でも表示されず、利用者に違和感をいだか
せない。
【0043】また、例えば「白木」(しらき)という発
声入力に対する、認識候補の1位は「白木」、2位は
「千代崎」(ちよざき)である。一方、候補表示制限部
9では、図4に示すように、1位候補「白木」に対し、
いずれの単語も表示することが許されていない。したが
って、上記第1の条件が不成立のために2位候補まで表
示しようとする場合であっても、1位候補「白木」しか
表示されず、利用者にとって「白木」とは全く似ていな
いと感じられる2位候補「千代崎」は表示されない。
【0044】なお、前記実施例では、候補表示制限部9
を構成するテーブル(データベース)には、第1位の候
補に対して2位以下に表示することが許される候補が、
第1位となり得る各候補毎に登録(蓄積)されているも
のとして説明したが、これに限るものではない。例え
ば、グループ単位で候補を登録し、そのグループ内のい
ずれかの候補が1位候補であれば、そのグループに含ま
れていない候補は、表示が許されない構成としても構わ
ない。
【0045】また、前記実施例では、選択候補を画面表
示する場合について説明したが、第1位の候補より順次
音声出力して利用者に提示する場合にも同様に適用可能
である。また、本発明は、駅の券売機に用いる音声認識
装置に限らず、音声認識装置全般に適用可能である。
【0046】
【発明の効果】以上説明したように本発明の音声認識装
置によれば、音声入力手段により入力されて認識手段に
より認識された音声の候補のうち、人間にとっては明ら
かに似ていないと判断されるような候補については除外
され、人間では聞き間違えるような似通った候補のみ選
択候補として表示あるいは音声出力されて、利用者によ
る候補選択操作に供される構成としたので、たとえ適用
する認識方式特有の誤りのために、認識手段により認識
された候補中に利用者の感覚では似ても似つかない候補
が含まれていたとしても、この種の候補が選択候補とさ
れることが防止され、利用者に違和感を与えずに済む。
【図面の簡単な説明】
【図1】本発明の一実施例に係る音声認識装置の基本構
成を示すブロック図。
【図2】図1中の表示部7および選択部8の構成を示す
ブロック図。
【図3】同実施例における動作を説明するための表示画
面例を示す図。
【図4】図1中の候補表示制限部9を構成するテーブル
の内容例を示す図。
【図5】ある利用者の発声入力に対する図1中のHMM
認識部5による認識結果の一例を示す図。
【符号の説明】
1…A/D変換器(音声入力手段)、2…分析・特徴抽
出部、3…連続マッチング部、4…PS複合辞書部、5
…HMM認識部、6…HMMバッファ、7…表示部、8
…選択部、9…候補表示制限部(登録手段)、10…制
御部(選択候補決定手段)、71…液晶ディスプレイ、
72…表示メモリ、81…透明タブレット、82…指示
座標検出部、83…指示情報判定部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 利用者が発声した音声を入力するための
    音声入力手段と、この音声入力手段によって入力された
    音声を分析し、特徴量を抽出する分析・特徴抽出手段
    と、この分析・特徴抽出手段によって抽出された特徴量
    を用いて音声を認識して1つまたは複数の認識候補を求
    める認識手段とを備えた音声認識装置において、 前記認識手段により求められ得る認識候補のうち、利用
    者にとって聞き誤りしやすい似通った候補同士が予めグ
    ループ化されて登録されている登録手段と、 前記認識手段によって求められた認識候補の中から、利
    用者にとって似通っていないと判断される候補を前記登
    録手段の登録内容をもとに除外して、利用者による選択
    対象とすべき候補を決定する選択候補決定手段と、 この選択候補決定手段によって決定された選択候補を外
    部出力する選択候補出力手段と、 この選択候補出力手段により外部出力された選択候補の
    中から利用者が望む候補を選択させるための手段と、 を具備することを特徴とする音声認識装置。
JP32813292A 1992-12-08 1992-12-08 音声認識装置 Expired - Fee Related JP3340163B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32813292A JP3340163B2 (ja) 1992-12-08 1992-12-08 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32813292A JP3340163B2 (ja) 1992-12-08 1992-12-08 音声認識装置

Publications (2)

Publication Number Publication Date
JPH06175688A true JPH06175688A (ja) 1994-06-24
JP3340163B2 JP3340163B2 (ja) 2002-11-05

Family

ID=18206853

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32813292A Expired - Fee Related JP3340163B2 (ja) 1992-12-08 1992-12-08 音声認識装置

Country Status (1)

Country Link
JP (1) JP3340163B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000305590A (ja) * 1999-04-16 2000-11-02 Alpine Electronics Inc 音声認識方法
KR100384330B1 (ko) * 2001-02-05 2003-05-16 정상모 오류범위 가변 및 사용자 선택이 가능한 음성인식 처리장치 및 방법
JP2003271192A (ja) * 2002-03-13 2003-09-25 Nissan Motor Co Ltd 音声認識装置
KR100467590B1 (ko) * 2002-06-28 2005-01-24 삼성전자주식회사 발음 사전 갱신 장치 및 방법
WO2011093025A1 (ja) * 2010-01-29 2011-08-04 日本電気株式会社 入力支援システム、方法、およびプログラム
JP2018532165A (ja) * 2016-02-03 2018-11-01 グーグル エルエルシー 個別化されたエンティティ発音の学習

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000305590A (ja) * 1999-04-16 2000-11-02 Alpine Electronics Inc 音声認識方法
KR100384330B1 (ko) * 2001-02-05 2003-05-16 정상모 오류범위 가변 및 사용자 선택이 가능한 음성인식 처리장치 및 방법
JP2003271192A (ja) * 2002-03-13 2003-09-25 Nissan Motor Co Ltd 音声認識装置
KR100467590B1 (ko) * 2002-06-28 2005-01-24 삼성전자주식회사 발음 사전 갱신 장치 및 방법
WO2011093025A1 (ja) * 2010-01-29 2011-08-04 日本電気株式会社 入力支援システム、方法、およびプログラム
JP2018532165A (ja) * 2016-02-03 2018-11-01 グーグル エルエルシー 個別化されたエンティティ発音の学習

Also Published As

Publication number Publication date
JP3340163B2 (ja) 2002-11-05

Similar Documents

Publication Publication Date Title
US6321196B1 (en) Phonetic spelling for speech recognition
US7650283B2 (en) Dialogue supporting apparatus
JP4416643B2 (ja) マルチモーダル入力方法
US7047195B2 (en) Speech translation device and computer readable medium
US8818816B2 (en) Voice recognition device
US20130282359A1 (en) Method and apparatus of translating language using voice recognition
EP1619661A2 (en) System and method for spelled text input recognition using speech and non-speech input
US20080215338A1 (en) Dialog supporting apparatus
US20060129409A1 (en) Dialog supporting apparatus
JP6966979B2 (ja) 対話システムの制御方法、対話システム及びプログラム
JP3476007B2 (ja) 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
US7769592B2 (en) Automatic selection of a disambiguation data field for a speech interface
JP3340163B2 (ja) 音声認識装置
US20050288933A1 (en) Information input method and apparatus
JP3285954B2 (ja) 音声認識装置
JP4498906B2 (ja) 音声認識装置
EP1895508B1 (en) Speech recognizing device, information processing device, speech recognizing method, program, and recording medium
JPH08190398A (ja) 音声認識装置
JP3762191B2 (ja) 情報入力方法、情報入力装置及び記憶媒体
JPH07311656A (ja) マルチモーダル文字入力装置
JP2000207166A (ja) 音声入力装置及び音声入力方法
JP2003140682A (ja) 音声認識装置及び音声辞書作成方法
JPH09274497A (ja) 音声認識装置
JPH09288493A (ja) 音声認識方法および音声認識装置、並びに情報処理方法および情報処理装置
JPS6126133A (ja) 音声認識入力装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070816

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080816

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090816

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees