JP3285954B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP3285954B2
JP3285954B2 JP25658892A JP25658892A JP3285954B2 JP 3285954 B2 JP3285954 B2 JP 3285954B2 JP 25658892 A JP25658892 A JP 25658892A JP 25658892 A JP25658892 A JP 25658892A JP 3285954 B2 JP3285954 B2 JP 3285954B2
Authority
JP
Japan
Prior art keywords
recognition
candidate
display
unit
displayed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP25658892A
Other languages
English (en)
Other versions
JPH06110495A (ja
Inventor
博 松浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP25658892A priority Critical patent/JP3285954B2/ja
Publication of JPH06110495A publication Critical patent/JPH06110495A/ja
Application granted granted Critical
Publication of JP3285954B2 publication Critical patent/JP3285954B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、人間の発声した音声を
認識して機器等を制御するのに好適な音声認識装置に関
する。
【0002】
【従来の技術】この種の音声認識装置では、音声が入力
可能な状態になると、利用者に発声を勧誘するための表
示(例えば、文字列「発声して下さい」等の表示)、あ
るいは音(例えば、“ピー”という音)や音声(例え
ば、「発声して下さい」等)の出力がなされる。その
後、利用者が発声すれば、その発声された音声は、音声
認識装置において認識され、例えば第1位および第2位
の認識候補が表示される。この表示された認識候補の中
に、利用者の発声した音声に対応する候補があれば、そ
の候補を利用者は選択する。
【0003】
【発明が解決しようとする課題】しかし、従来の音声認
識装置では、装置から発声の勧誘がなされる前に、利用
者が発声してしまうと、認識結果が出ないという問題が
あった。
【0004】また、従来の音声認識装置では、発声の勧
誘がなされてから発声しても、利用者が、装置の認識対
象とすべき音声を発声する前に、不適当な発声(例え
ば、「えー」とか「え、喋っていいの」など)をしてし
まうと、誤った認識結果が得られるという問題もあっ
た。この場合、表示される認識候補中に利用者の意図し
た候補は存在しないため、利用者は候補選択をあきらめ
て認識結果をキャンセルし、一連の操作を最初からやり
直さなければならなかった。
【0005】このように従来の音声認識装置では、利用
者は、装置の認識対象とすべき音声の発声タイミングを
意識しなければならず、認識対象とすべき音声の発声前
にうっかりと不適当な発声をしてしまうと、誤った認識
結果が得られて意図した候補が選択できないという問題
があった。
【0006】本発明は上記事情に鑑みてなされたもので
その目的は、利用者が発声のタイミングを取りやすいよ
うにした音声認識装置を提供することにある。
【0007】
【課題を解決するための手段】本発明は、利用者が発声
した音声を入力するための音声入力手段と、入力された
音声を分析し、特徴量を抽出する分析・特徴抽出手段
と、抽出された特徴量を用いて音声を認識する認識手段
と、この認識手段によって求められた認識候補を表示す
表示手段と、この表示手段に表示された認識候補の1
つを選択するための選択手段と、この選択手段による認
識候補の選択操作が行われる前に、再発声された入力音
声に対して上記認識手段によって求められた再認識候補
を、上記認識候補と合わせて表示手段に表示する制御を
行う表示制御手段とを備えたことを特徴とするものであ
る。
【0008】
【作用】上記の構成においては、利用者が発声した音声
は音声入力手段により入力されて、分析・特徴抽出手段
により分析され、その特徴量が抽出され、しかる後、認
識手段によりその特徴量を用いた認識処理が行われ、認
識候補が求められる。この認識候補は表示手段に表示さ
れる。
【0009】利用者は、選択手段を用いて、表示手段に
表示された候補から、自身が発声した音声に対応した候
補を選択するための操作を行う。もし、表示された候補
の中に発声した候補に対応するものが存在しない場合に
は、利用者は認識対象とすべき音声を再発声する。
【0010】利用者から再発声された音声は、上記と同
様にして認識手段により認識され、その候補(再認識候
補)が求められる。表示制御手段は、既に表示されてい
る認識候補の選択操作が行われる前に、利用者から再発
声された音声が認識手段により認識されて再認識候補が
求められた場合、発声勧誘のタイミングに無関係に、そ
再認識候補を、既に表示されている認識候補と合わせ
て、つまり既に表示されている認識候補に追加して表示
する。このとき、再認識候補と同じ候補が既に表示され
ているならば、表示制御手段は、この再認識補の表示を
しないか、あるいはブリンク等の強調表示を行うことに
より、無用な選択対象候補を減らす。
【0011】これにより利用者は、既に表示されている
候補と追加表示された候補のいずれからも、自身が発声
した音声に対応する候補を選択することができる。
【0012】このように上記の構成によれば、発声のタ
イミングおよび選択のタイミングに対する制限が大幅に
緩和され、使い勝手が向上する。
【0013】
【実施例】以下、本発明の一実施例について、駅の券売
機に用いる音声認識装置に適用した場合を例に、図面を
参照して説明する。
【0014】図1は、同実施例における音声認識装置の
構成を概略的に示すブロック図である。
【0015】図1において、1は本装置に入力される音
声信号(入力音声)をA/D(アナログ/ディジタル)
変換するA/D変換器である。A/D変換器1は、入力
音声を、例えばサンプリング周波数12kHz,12ビ
ットで量子化する。
【0016】A/D変換器1により量子化された入力音
声は、その音声を分析して特徴量を抽出するための分析
・特徴抽出部2に与えられる。分析・特徴抽出部2は、
A/D変換器1によって量子化された入力音声の音声パ
ワ−の計算と、LPC(Linear Predictive Coding)分
析とを行う。このLPC分析は、例えばフレ−ム長16
msec、フレ−ム周期8msecで16次のLPCメルケプス
トラムを分析パラメ−タとして行われる。なお、分析・
特徴抽出部2での分析は、LPC分析に限るものではな
く、BPF(Band Pass Filter)分析等でもよい。
【0017】分析・特徴抽出部2で分析された特徴パラ
メ−タは連続マッチング部3に与えられる。この連続マ
ッチング部3は、音声セグメント(Phonetic Segment)
複合辞書部(以下、PS辞書部と称する)4に登録され
ている所定のPS単位の認識辞書との間で時間軸方向に
連続的にマッチング処理して、第1位乃至第n位までの
ラベル系列(PSラベル系列)とその類似度を求めるた
めのものである。以上の音声セグメント(PS)につい
ては、例えば特願平2−306061号に詳述されてい
る。なお、上記認識辞書は、各PS(PSラベル)毎に
複数の標準パタ−ンから作成された識別用辞書からな
る。
【0018】連続マッチング部3でのPSによる連続マ
ッチング処理は、次式に示す複合LPCメルケプストラ
ム類似尺度を用いて行われる。
【0019】
【数1】
【0020】なお、(1)式において、CはLPCメル
ケプストラム、Wm (Ki),φm (ki)はそれぞれPS名K
i の固有値から求められる重みと固有ベクトルである。
また、( ・ )は内積を示し、‖ ‖はノルムを示し
ている。
【0021】連続マッチング部3で求められたPSラベ
ル系列のうち、第1位の系列が、HMM(hidden marco
v model ;隠れマルコフモデル)を用いた単語照合を行
うためのHMM認識部5に送られる。
【0022】このHMM認識部5における単語照合につ
き説明する。まず単語照合は、連続マッチング部3から
送られた第1位のPSラベル系列を単語毎(カテゴリ
毎)のHMMに通すことにより行われる。
【0023】ここで、HMMの一般的定式化について述
べる。HMMでは、N個の状態S1,S2 ,…,SN
持ち、初期状態がこれらN個の状態に確率的に分布して
いるとする。音声では、一定のフレ−ム周期毎に、ある
確率(遷移確率)で状態を遷移するモデルが使われる。
遷移の際には、ある確率(出力確率)でラベルを出力す
るが、ラベルを出力しないで状態を遷移するナル遷移を
導入することもある。出力ラベル系列が与えられても状
態遷移系列は一意には決らない。観測できるのは、ラベ
ル系列だけであることからhidden(隠れ)marcov model
(HMM)と呼ばれている。HMMのモデルMは次の6
つのパラメ−タから定義される。
【0024】 N :状態数 (状態S1 ,S2 ,…,SN ) K :ラベル数 (ラベルR=1,2,…,K) pij :遷移確率 Si からSj に遷移する確率 qij(k) :Si からSj への遷移の際にラベルkを出力
する確率 mi :初期状態確率 初期状態がSi である確率 F :最終状態の集合 次に、モデルMに対して音声の特徴を反映した遷移上の
制限を加える。音声では、一般に状態Si から以前に通
過した状態(Si-1 ,Si-2 ,…)に戻るようなル−プ
の遷移は時間的前後関係を乱すため許されない。
【0025】HMMの評価は、モデルMが第1位のラベ
ル系列O1 =o11,o21,…,oT1を出力する確率Pr
(O/M)を求めることにより行われる。認識時には、
HMM認識部5で各モデルを仮定し、連続マッチング部
3から送られる第1位のラベル系列(PSラベル系列)
を用いて、Pr(O/M)が最大になるようなモデルM
を探す。このHMM認識部5で仮定される各モデル(の
パラメータ)は、HMMの学習により求められるもので
あり、HMMバッファ6に蓄積されている。
【0026】以上のようにして、発声された入力音声を
認識処理することによって、その入力音声、例えば行先
の駅名を高精度に認識することが可能となる。
【0027】さて、図1の音声認識装置は、以上のA/
D変換器1、分析・特徴抽出部2、連続マッチング部
3、PS辞書部4、HMM認識部5およびHMMバッフ
ァ6の他に、表示部7、選択部8および制御部9を有し
ている。
【0028】表示部7は、制御部9のもとで、例えば行
先駅名の発声勧誘のための表示(ここでは、文字列「発
声して下さい」の表示)、HMM認識部5での認識結果
(認識候補)の表示等を行う。この表示部7による認識
結果表示は、図3(a),(b)に示すように、第1位
の認識候補のみを表示しても、複数の候補、例えば図3
(c)に示すように、第1位の認識候補(ここでは「大
崎」)と第2位の認識候補(ここでは「川崎」)を表示
しても構わない。
【0029】選択部8は、表示部7に表示された認識候
補を利用者が選択可能なように構成されたものである。
この選択部8と上記表示部7は、例えば液晶ディスプレ
イ(CRTディスプレイなどの表示モニタでも構わな
い)上に感圧型の透明タブレットを組合わせたタッチパ
ネルを用いて構成されている。
【0030】制御部9は、表示部7に対する表示制御を
HMM認識部5の認識結果等に従って行うと共に、選択
部8からの選択指示情報に従い外部の装置(ここでは、
券売機)を制御する。
【0031】図2は、図1の音声認識装置内の表示部7
および選択部8の構成を示す。
【0032】図2に示すように、表示部7は、液晶ディ
スプレイ71と、同ディスプレイ71に表示する表示情
報を格納するための表示メモリ72とから構成される。
この表示メモリ72内の表示情報は、図1に示す制御部
9により書込まれる。液晶ディスプレイ71に表示され
る内容には、上記した発声勧誘のための表示情報、認識
候補の表示情報の他に、表示された認識候補の確認(第
1位の候補だけの表示の場合)を勧誘するための表示情
報(文字列「確認して下さい」)、利用者による画面上
での確認操作に供される領域(キー領域)の表示情報
([確認]という項目キー)、(表示された認識候補が
誤りである場合、即ち利用者の意図した候補が表示され
ていない場合に)利用者による再発声を受付けるための
領域(キー領域)の表示情報([言い直し]という項目
キー)、認識結果の選択操作を勧誘するための表示情報
(文字列「選択して下さい」)等がある。
【0033】一方、選択部8は、表示部7の表示画面
上、即ち液晶ディスプレイ71上に積層されて、同ディ
スプレイ71と一体に形成された感圧シート型の透明タ
ブレット81と、透明タブレット81が利用者の指等に
より押圧された場合に、その透明タブレット81面上の
座標位置を検出するための指示座標検出部82と、指示
情報判定部83とから構成される。この指示情報判定部
83は、指示座標検出部82により検出された座標と表
示メモリ72の内容とから、画面上のいずれの項目キー
(表示情報)が利用者により選択指定されたかを判定
し、その判定結果を選択指示情報として制御部9に送
る。
【0034】このような構成において、制御部9の制御
による発声の勧誘に従って、利用者が行先駅名として
「おおさき」と発声したのに対し、HMM認識部5に
て、その音声に対する認識処理が行われ、その認識結果
として複数の認識候補が制御部9に送られたものとす
る。この認識結果には、第1位の認識候補「大崎」が含
まれているものとする。
【0035】制御部9は、発声勧誘タイミングの一定時
間前から始まる、同タイミングを挟む一定期間(また
は、利用者による候補選択が行われるまでの期間)は、
HMM認識部5の認識結果を全て受取るように構成され
ている。このようにすることにより、利用者の発声のタ
イミングに対する制限が緩和される。なお、HMM認識
部5の認識結果に対する制御部9の受取り期間を設定す
る代わりに、HMM認識部5の動作期間を設定するよう
にしてもよい。また、認識の対象とする音声の入力期間
を設定するためのスイッチを設け、利用者がこのスイッ
チをオンにしている期間だけ利用者の発声した音声が本
装置に入力され、その入力音声が全てHMM認識部5で
の認識処理に供されて、その認識結果が制御部9で受取
られる構成とするようにしてもよい。
【0036】さて制御部9は、HMM認識部5から送ら
れた第1位の認識候補「大崎」を含む複数の認識候補を
受取り、表示部7(の液晶ディスプレイ71)の表示画
面上に、例えば図3(a)に示すように第1位の認識候
補「大崎」を表示させる。この画面上には、同時に、例
えば画面上方に「確認して下さいの」勧誘メッセージ
が、画面右下に項目キー[確認]が、画面左下に項目キ
ー[言い直し]が、それぞれ表示される。
【0037】ここで、画面表示された認識候補「大崎」
が正しいならば、利用者は「確認して下さい」の要求に
従って、表示画面右下の[確認]の項目キー(の領域)
を、指により透明タブレット81上で触る。
【0038】すると、その[確認]の項目キーの座標が
指示座標検出部82により検出される。指示情報判定部
83は、指示座標検出部82により検出された座標と表
示メモリ72の内容とから、この検出座標位置に表示さ
れている表示情報の示す項目キーが選択されたこと、即
ち[確認]が選択されたことを判定し、その旨を示す選
択指示情報を制御部9に送る。これにより制御部9は、
第1位の候補「大崎」が確認されたものとして、券売機
を制御する。
【0039】なお、図3(a)に示すような[確認]の
項目キーを表示する代わりに、第3図(b)に示すよう
に第1位の認識候補自体に[確認]の項目キーの役割を
持たせ、「大崎」の表示領域を指で触って確認入力する
ことが可能な構成としてもよい。
【0040】また、利用者が「おおさき」と発声したと
きに、図3(c)に示すように、第1位の候補「大崎」
と第2位の候補「川崎」が、[確認]の項目キーの役割
を兼ねた形態で表示された場合には、利用者は「確認し
て下さい」の要求に従って、「大崎」の表示領域を指で
触れば、指示情報判定部83により「大崎」が選択さ
れ、その旨を示す選択指示情報が制御部9に送られる。
【0041】ここで、図3(a)または(b)に示すよ
うに第1位の候補だけを表示するか、図3(c)に示す
ように第2位までの候補(複数の候補)を表示するか
は、制御部9により決定される。この制御部9による決
定条件は、例えば第1位と第2位の類似度の差が第1の
所定値を超えているか否か、あるいは第2位の類似度値
が第2の所定値未満であるか否かである。また、認識誤
りをし易い単語(ここでは、駅名)をテーブルに用意し
ておき、同テーブルに第2位の候補が存在する場合に
は、第1位と第2位の候補を表示し、第2位の候補が存
在しない場合には第1位の候補だけを表示するようにし
てもよい。
【0042】このように本実施例では、第2位の候補の
確からしさが低い場合には、第1位の候補だけを表示し
て、利用者が選択し易いようにしている。
【0043】さて本実施例では、利用者が例えば「大
崎」と発声すべきところを、「えー」と発声してしまっ
たために、HMM認識部5により第1位の候補として
「上野」が、第2位の候補として「目白」が得られて、
図3(d)のような表示がなされた場合でも、以下に述
べるように容易に訂正の発声(再発声)が可能なように
なっている。
【0044】この場合、利用者は、[言い直し]の項目
キー(の領域)を、指により透明タブレット81上で触
る。
【0045】すると、前記した[確認]の項目キー(の
領域)が指で触られた場合と同様にして、選択部8内の
指示情報判定部83により、[言い直し]が選択された
ことが判定され、その旨を示す選択指示情報が制御部9
に送られる。これにより制御部9は、[言い直し](再
発声)が要求されたものと判断して、言い直しモード
(再発声モード)に設定し、再発声のための勧誘を例え
ば“ピー”音等により行う。
【0046】この再発声のための勧誘に従い、利用者が
「おおさき」と発声すると、前記したように、その音声
に対するHMM認識部5での認識処理が行われる。この
認識処理により、利用者の意図した「大崎」を第1位の
候補とする認識結果が得られたものとする。この第1位
の候補「大崎」の類似度は、第2位の候補の類似度より
第1の所定値以上であるものとする。
【0047】HMM認識部5での認識結果は制御部9に
送られる。制御部9は、言い直しモードにおいてHMM
認識部5から送られた認識結果を受取り、その認識結果
中の第1位の候補「大崎」を、既に表示部7(の液晶デ
ィスプレイ71)上に図3(d)に示すように表示され
ている候補「上野」、「目白」の次の位置に、(表示メ
モリ72を介して)図3(e)に示すように追加表示す
る。これにより利用者は、既に表示されている候補と追
加表示された候補のいずれからも、自身が発声した音声
に対応する候補を選択することができる。なお、第1位
の候補と第2位の候補の類似度の差が所定値以下である
など、前記したような第2位の候補の表示条件を満たす
場合には、第2位の候補も追加表示される。
【0048】以上は、利用者が[言い直し]の項目キー
を選択して、図1の装置(内の制御部9)に対して[言
い直し](再発声)を宣言することで、言い直しモード
とし、装置からの“ピー”音等に従うタイミングで、
「おおさき」を再発声する場合である。
【0049】しかし本実施例では、再発声のために、必
ずしも[言い直し]モードとする必要はない。これにつ
いて説明する。
【0050】まず本実施例では、前記したように、装置
からの発声勧誘タイミングを挟む一定期間(または候補
選択がなされる前)に発声された音声に対するHMM認
識部5での認識結果は全て制御部9で受取られる。した
がって、前記の例と同様に、利用者が「大崎」と発声す
べきところを「えー」と発声したために、図3(d)の
ような表示がなされた状態で、「おおさき」と正しく再
発声した場合であれば、第1位の候補「大崎」と第2位
の候補「川崎」を含む認識候補がHMM認識部5により
求められて、制御部9で受取られる。
【0051】制御部9は、表示部7(の液晶ディスプレ
イ71)に表示されている認識候補が選択部8により選
択される前であれば、前記した言い直しモードの場合と
同様に、HMM認識部5から新たに受取った認識候補の
うちの例えば第1位の候補「大崎」を、先に受取って表
示してある候補に対して図3(e)に示すように追加表
示させる。
【0052】このように本実施例によれば、利用者が再
発声のタイミングを意識せずに、音声を再発声しても、
その再発声した音声に対するHMM認識部5での認識結
果が制御部9で受取られ、その第1位の候補(または第
1位と第2位の候補)が既に表示されている候補に対し
て追加表示される。この場合、利用者は、既に表示され
ている候補と追加表示された候補のいずれからも、自身
が発声した音声に対応する候補を選択することができ
る。
【0053】したがって、利用者が再発声を意識せず
に、単に「えー、おおさき」と発声した場合も、まず
「えー」に対する認識候補(第1位の候補「上野」と第
2位の候補「目白」を含む認識候補)が得られてその候
補(例えば第1位と第2位の候補)が表示され、続いて
「えー」の次の「おおさき」に対する認識候補(第1位
の候補「大崎」と第2位の候補「川崎」を含む認識候
補)が得られてその候補(例えば第1位の候補)が追加
表示される。
【0054】ここで、既に表示されている候補の表示
(図3(e)の例では「上野」、「目白」)を消さない
理由について述べる。
【0055】まず本実施例では、上記したように(装置
からの発声勧誘タイミングを挟む一定期間内では)任意
のタイミングでの再発声が許される。このため、既に表
示されている候補の表示を消す方式を適用するならば、
もし利用者が正しく「おおさき」と発声した結果、図3
(a)または(b)のように「大崎」を第1位とする候
補が表示された状態で、利用者が誤って無関係な発声を
すると、あるいは雑音等が入ると、その候補が選択され
る前に表示が変わってしまうという不都合が発声する。
【0056】そこで本実施例では、このような不都合を
防止するために、既に表示されている候補の表示を消さ
ず、新たに認識された候補を追加表示する方式を適用し
ている。この方式によれば、利用者が正しく「おおさ
き」と発声した結果、図3(a)または(b)のように
「大崎」を第1位とする候補が表示された状態で、利用
者が誤って無関係な発声をしても、あるいは雑音等が入
っても、既に表示されている候補は残されるため、利用
者は正しい候補選択が行える。
【0057】なお、言い直しモードが設定された際に
は、その時点で表示されている候補の表示を消すように
しても構わない。また、追加表示しようとする候補に一
致する候補が既に表示されている場合には、その候補の
追加表示を行わないとか、その候補を所定の表示属性で
強調表示(例えばブリンク表示)することにより、無用
な選択候補の増加を防ぐようにすることも可能である。
【0058】以上は、駅の券売機に用いる音声認識装置
に適用した場合について説明したが、これに限るもので
はなく、本発明は音声認識装置全般に適用可能である。
【0059】
【発明の効果】以上説明したように本発明の音声認識装
置によれば、認識手段によって求められた認識候補を表
示する表示手段と、この表示手段に表示された認識候補
の1つを選択するための選択手段と、表示手段を制御す
表示制御手段とを設け、選択手段による認識候補の選
択操作が行われる前に、再発声された入力音声に対して
認識手段によって求められた再認識候補については、表
示制御手段の制御により、既に表示されている認識候補
と合わせて表示手段に表示される構成としたので、一旦
誤った認識結果が得られても、利用者が改めて認識対象
とすべき音声を発声すれば、その再発声された音声に対
する認識結果の候補(再認識候補)が先に得られている
認識候補に追加して表示され、正しい候補を選択するこ
とができる。
【0060】また本発明によれば、既に表示されている
候補中に正しい候補が存在し、且つその候補が選択され
る前に、利用者が誤って認識対象とすべきものとは無関
係な発声をして、あるいは雑音が入って、無関係な認識
がなされても、既に表示されている候補は消されないた
め、利用者は正しい候補を選択できる。
【0061】このように本発明によれば、発声のタイミ
ングおよび選択のタイミングに対する制限が大幅に緩和
されるため、使い勝手が向上する。
【図面の簡単な説明】
【図1】本発明の一実施例に係る音声認識装置の基本構
成を示すブロック図。
【図2】図1の音声認識装置内の表示部7および選択部
8の構成を示すブロック図。
【図3】同実施例における動作を説明するための表示画
面例を示す図。
【符号の説明】
1…A/D変換器(音声入力手段)、2…分析・特徴抽
出部、3…連続マッチング部、4…PS辞書部、5…H
MM認識部、6…HMMバッファ、7…表示部、8…選
択部、9…制御部、71…液晶ディスプレイ、72…表
示メモリ、81…透明タブレット、82…指示座標検出
部、83…指示情報判定部。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 15/22

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 利用者が発声した音声を入力するための
    音声入力手段と、 この音声入力手段によって入力された音声を分析し、特
    徴量を抽出する分析・特徴抽出手段と、 この分析・特徴抽出手段によって抽出された特徴量を用
    いて音声を認識して複数の認識候補を求める認識手段
    この認識手段によって求められた前記認識候補を表示す
    表示手段と、 この表示手段に表示された前記認識候補の1つを選択す
    るための選択手段と、この選択手段による認識候補の選択操作が行われる前
    に、再発声された入力音声に対して前記認識手段によっ
    て求められた再認識候補を、前記認識候補と合わせて前
    記表示手段に表示する制御を行う表示制御手段と を具備
    することを特徴とする音声認識装置。
  2. 【請求項2】 前記表示制御手段は、、前記認識候補と
    前記再認識候補を合わせて表示する際に、前記再認識候
    補の中に認識候補として既に表示されたものと一致する
    候補が存在する場合には、前記再認識候補の中の一致す
    る候補の表示を抑止、もしくは該一致する候補を所定の
    表示属性で強調表示させることを特徴とする請求項1記
    載の音声認識装置。
JP25658892A 1992-09-25 1992-09-25 音声認識装置 Expired - Fee Related JP3285954B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25658892A JP3285954B2 (ja) 1992-09-25 1992-09-25 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25658892A JP3285954B2 (ja) 1992-09-25 1992-09-25 音声認識装置

Publications (2)

Publication Number Publication Date
JPH06110495A JPH06110495A (ja) 1994-04-22
JP3285954B2 true JP3285954B2 (ja) 2002-05-27

Family

ID=17294718

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25658892A Expired - Fee Related JP3285954B2 (ja) 1992-09-25 1992-09-25 音声認識装置

Country Status (1)

Country Link
JP (1) JP3285954B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10133685A (ja) * 1996-10-31 1998-05-22 Microsoft Corp 連続音声認識中にフレーズを編集する方法及びシステム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1871638B (zh) * 2003-10-21 2012-01-25 皇家飞利浦电子股份有限公司 采用用户接口的智能语音识别
KR20080084625A (ko) 2007-03-13 2008-09-19 주식회사 베스트화성 생산효율이 향상된 칫솔모의 테이퍼 가공방법
KR100972388B1 (ko) 2009-07-31 2010-07-27 주식회사 베스트화성 침투력과 쇄소성이 향상된 침상모가 식모된 칫솔 및 그 제조방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10133685A (ja) * 1996-10-31 1998-05-22 Microsoft Corp 連続音声認識中にフレーズを編集する方法及びシステム

Also Published As

Publication number Publication date
JPH06110495A (ja) 1994-04-22

Similar Documents

Publication Publication Date Title
US7047195B2 (en) Speech translation device and computer readable medium
US8407039B2 (en) Method and apparatus of translating language using voice recognition
US6363347B1 (en) Method and system for displaying a variable number of alternative words during speech recognition
JP5121252B2 (ja) 原言語による音声を目的言語に翻訳する装置、方法およびプログラム
US8818816B2 (en) Voice recognition device
EP0376501B1 (en) Speech recognition system
EP0840288B1 (en) Method and system for editing phrases during continuous speech recognition
CN109791761B (zh) 使用校正的术语的声学模型训练
US20060190255A1 (en) Speech recognition method
EP1975923B1 (en) Multilingual non-native speech recognition
EP1016078A1 (en) Speech recognition computer input and device
JP3476007B2 (ja) 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
JP3285954B2 (ja) 音声認識装置
US20170301349A1 (en) Speech recognition system
JP3340163B2 (ja) 音声認識装置
JP2002350146A (ja) ナビゲーション装置
JP3911178B2 (ja) 音声認識辞書作成装置および音声認識辞書作成方法、音声認識装置、携帯端末器、音声認識システム、音声認識辞書作成プログラム、並びに、プログラム記録媒体
JP4498906B2 (ja) 音声認識装置
JP3296783B2 (ja) 車載用ナビゲーション装置および音声認識方法
JP2006039954A (ja) データベース検索装置、プログラム及びナビゲーション装置
JPH08160988A (ja) 音声認識装置
JP3870722B2 (ja) 翻訳装置、記録媒体
WO2009147745A1 (ja) 検索装置
WO2015102039A1 (ja) 音声認識装置
CN116543764A (zh) 一种动作机构的控制电路及车辆

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080308

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090308

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100308

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees