JPH1083195A - 入力言語認識装置及び入力言語認識方法 - Google Patents

入力言語認識装置及び入力言語認識方法

Info

Publication number
JPH1083195A
JPH1083195A JP8238025A JP23802596A JPH1083195A JP H1083195 A JPH1083195 A JP H1083195A JP 8238025 A JP8238025 A JP 8238025A JP 23802596 A JP23802596 A JP 23802596A JP H1083195 A JPH1083195 A JP H1083195A
Authority
JP
Japan
Prior art keywords
character
recognition
input
unit
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8238025A
Other languages
English (en)
Inventor
晃二 ▲高▼木
Koji Takagi
Satoshi Miyashita
聡 宮下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP8238025A priority Critical patent/JPH1083195A/ja
Publication of JPH1083195A publication Critical patent/JPH1083195A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 入力言語を確実に認識すると共に、認識文法
を用意せずに音声認識を可能にする。 【解決手段】 入力言語認識装置90を文字認識手段9
1と音声認識手段92と融合手段93とか構成する。文
字認識手段91は、タブレット101と文字認識部10
2と辞書部103とからなる。音声認識手段92はHM
Mネットワーク作成部105とマイク106と分析部1
07とHMM照合部108とからなる。融合手段93
は、文字認識手段91の文字認識部102からの出力情
報に基づいて認識文法を自動的に生成して、声認識手段
92のHMMネットワーク作成部105に出力する認識
文法自動生成部104からなる。これにより、文字認識
と音声認識を融合させ、これらの一方だけでは認識が困
難なときでも、確実に認識することができるようにな
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は音声入力と文字入
力を融合させた入力言語認識装置及び入力言語認識方法
に関するものである。
【0002】
【従来の技術】音声を認識する装置と文字を認識する装
置は一般に知られている。ここでは、音声認識としてH
MM音声認識を、文字認識としてオンライン手書き文字
認識を例に説明する。
【0003】(1)HMM音声認識 文献名:沖電気研究開発 1995年4月 第166号 vol.6
2,No.2,pp.7〜12 HMM(Hidden Marcov Model)音声認識は、音声を
確率的な遷移ネットワークとみなして、認識処理を行う
ものである。HMMは、その統計的性質から、音声パタ
ーンのような発声速度に伴う時間変動、発声の個人差や
調音結合などの揺らぎを含むパターンを適切に表現でき
るため、音声認識の分野で近年特に用いられている手法
である。このHMM音声認識装置のブロック図を図2に
示す。
【0004】図示するように、HMM音声認識は主に、
HMMネットワーク作成部201と分析部205とHM
M照合部209から構成されている。各部の説明を以下
に行う。
【0005】(1) HMMネットワーク作成部201 ユーザは認識文法を入力する。即ち、認識させようとす
るすべての単語について、その単語、その単語の読み、
単語と単語の接続規則を記述するルール等を、テキスト
データとして入力する。このユーザにより与えられた前
記認識文法とHMM音素辞書202とネットワークコン
パイラ203とによってHMMネットワーク204が作
成される。このHMMネットワーク204は、ユーザが
指定した認識文法に基づいて音声照合動作を制御するた
めの制御情報である。
【0006】(2) 分析部205 入力された音声情報に対して、音響分析206で分析窓
がかけられて特徴パラメータの抽出が行われる。次に、
雑音レベル逐次学習207で抽出された雑音区間のパラ
メータ値を基に音声区間検出208が行われる。
【0007】(3) HMM照合部209 切り出された音声区間の特徴パラメータを用いて、HM
Mネットワーク204を基に、ビタビビームサーチ21
0と呼ばれる照合が行われ、認識結果が出力される。
【0008】以上のように、HMM音声認識では、ユー
ザが予め認識文法を入力し、この認識文法に基づいて作
成されたHMMネットワーク204を基に、HMM照合
が行われる。
【0009】(2)オンライン手書き文字認識 オンライン手書き文字認識は、筆記された文字の軌跡を
タブレットにより一定時間ごとにx,y方向の座標とし
て抽出し、この座標列データを使って、ほぼ実時間で文
字を識別する技術である。オンライン手書き文字認識に
おいては、文字は部分パターンの集まりであり、さらに
部分パターンはストロークの集まりであると定義する。
これらの特徴値を使って認識を行う数値化大分類法によ
る文字認識装置のブロック図を図3に示す。
【0010】タブレット301から文字が入力される。
入力された文字は、前処理部303で部分パターンによ
る特徴値の抽出が行われる。次いで、照合部304にお
いて、前処理部303で抽出された特徴値と辞書305
に予め登録されていたパターンとのマッチングが行われ
る。このマッチングによって距離値の算出が行われ、そ
の距離値の小さい順に順位付けがされた複数の候補が認
識結果として特定される。なお、前処理部303と照合
部304とで文字認識部302が構成されている。
【0011】
【発明が解決しようとする課題】しかしながら、以上述
べたような音声認識処理及び文字認識処理をそれぞれ単
独で用いた場合には、以下に掲げるような問題点があ
る。
【0012】(1) いずれの場合も認識精度があまり
高くないので、丁寧な文字入力、丁寧な発声でなけれ
ば、高い確率で認識することができない。
【0013】(2) 劣悪な環境下、例えば騒音のある
場所やタブレット301が振動する場所では、音声、文
字の認識率が低下する。
【0014】(3) 音声認識の場合、用意する認識文
法によって発声内容が制限される。さらに、認識文法は
ユーザが個別に入力しなければならないため、多数の認
識文法を用意するのは煩雑である。
【0015】(4) 音声認識の場合、同音文字
(「橋」と「端」など)の区別がつかない。
【0016】(5) 文字認識の場合、同形文字
(「夕」と「タ」など)の区別がつかない。
【0017】
【課題を解決するための手段】前記課題を解決するため
に第1の発明に係る入力言語認識装置は、入力文字を認
識する文字認識手段と、入力音声を認識する音声認識手
段と、これら文字認識手段及び音声認識手段で個別に認
識された同じ意味の入力言語を融合させて入力言語を特
定する融合手段とを備えたことを特徴とする。
【0018】前記構成により、同じ意味の言語が文字認
識手段から文字情報として入力されると共に、音声認識
手段から音声情報として入力されて、各認識手段で個別
に認識される。そして、各認識手段で認識された入力言
語が融合手段で融合させて最終的に特定される。
【0019】これにより、振動等のために正確に文字を
入力することができない場合や、騒音等のために音声が
かき消されるような場合等にも、文字認識手段と音声認
識手段とが相互に補完し合って、入力言語の認識を正確
にかつ確実に行うことができるようになる。
【0020】第2の発明に係る入力言語認識装置は、文
字認識手段が、文字を入力する文字入力部と、予め文字
情報が登録された辞書部と、前記文字入力部から入力さ
れた文字情報と前記辞書部に登録された文字情報とを照
合して候補を選択する照合部とからなり、音声認識手段
が、音声を入力する音声入力部と、別途入力された認識
文法に基づいて制御情報を作成する制御情報作成部と、
この制御情報作成部で作成された制御情報に基づいて前
記音声入力部からの音声情報を照合して入力言語を特定
する照合部とからなり、融合手段が、前記文字認識手段
の照合部からの出力情報に基づいて前記認識文法を生成
して前記制御情報作成部に出力する認識文法生成部から
なること特徴とする。
【0021】前記構成により、文字認識手段において、
文字入力部からの入力文字情報と辞書部に登録された文
字情報とが、照合部で照合されて候補が1又は複数選択
される。融合手段である認識文法生成部では、前記照合
部からの1又は複数の候補に基づいて認識文法が生成さ
れ、制御情報作成部に出力される。
【0022】音声認識手段では、制御情報作成部におい
て、認識文法生成部からの認識文法に基づいて制御情報
が作成される。照合部では、前記制御情報に基づいて音
声入力部からの音声情報が照合されて入力言語が特定さ
れる。
【0023】これにより、振動等のために正確に文字を
入力することができない場合や、騒音等のために正確に
音声を入力することができない場合においても、文字認
識手段と音声認識手段とが相互に補完し合って、入力言
語の認識を正確にかつ確実に行うことができるようにな
る。
【0024】第3の発明に係る入力言語認識方法は、文
字を入力する文字入力工程と、入力された文字を認識し
て文字候補を選択する文字候補選択工程と、文字認識結
果として得られた文字候補に対応する読みを検索する検
索工程と、検索した読みをもとに音声認識用の認識文法
を生成する認識文法生成工程と、生成された認識文法に
基づいて音声照合処理用の制御情報を作成する制御情報
作成工程と、音声を入力する音声入力工程と、入力され
た音声情報に対して前記制御情報作成工程で作成された
制御情報を基に照合が行われて文字及び音声で入力され
た入力言語が特定される照合工程とからなることを特徴
とする。
【0025】この入力言語認識方法により、文字入力工
程及び音声入力工程でそれぞれ入力された文字及び音声
による入力言語の情報が、それぞれ照合工程での処理情
報として用いられて相互に補完し合う。これにより、入
力言語の認識を正確にかつ確実に行うことができるよう
になる。
【0026】
【発明の実施の形態】以下、本発明の実施形態を添付図
面に基づいて説明する。
【0027】[入力言語認識装置]図1は本実施形態に
係る入力言語認識装置90を示すブロック図である。こ
の入力言語認識装置90は、入力文字を認識する文字認
識手段91と、入力音声を認識する音声認識手段92
と、これら文字認識手段91及び音声認識手段92で個
別に認識された同じ意味の入力言語を融合させて入力言
語を特定する融合手段93とから構成されている。
【0028】文字認識手段91は、オンライン手書き文
字認識によるもので、文字を入力する文字入力部として
のタブレット101と、予め文字情報が登録された辞書
部103と、タブレット101より入力された文字情報
から抽出された特徴と辞書部103に登録された文字の
パターンとを照合して候補を選択する照合部としての文
字認識部102とから構成されている。
【0029】音声認識手段92は、音声を入力する音声
入力部としてのマイク106と、前述した従来の分析部
205と同様にして音声区間検出が行われる分析部10
7と、別途入力された認識文法に基づいてHMMネット
ワーク(HMM照合部108での照合処理に用いる制御
情報)を作成するHMMネットワーク作成部105と、
このHMMネットワーク作成部105で作成されたHM
Mネットワークに基づいて分析部107からの音声情報
をHMM照合して入力言語を特定するHMM照合部10
8とから構成されている。
【0030】融合手段93は、文字認識手段91の文字
認識部102からの出力情報に基づいて前記認識文法を
自動的に生成してHMMネットワーク作成部105に出
力する認識文法自動生成部104によって構成されてい
る。
【0031】なお、文字認識部102、HMMネットワ
ーク作成部105、分析部107およぴHMM照合部1
08の動作は、従来技術で説明した文字認識部302、
HMMネットワーク作成部201、分析部205、HM
M照合部209の動作と同様である。
【0032】[入力言語認識方法]次に、前記構成の入
力言語認識装置90を用いた入力言語認識方法について
説明する。
【0033】文字を入力する文字入力工程と、入力され
た文字を認識して文字候補を選択する文字候補選択工程
と、文字認識結果として得られた文字候補に対応する読
みを検索する検索工程と、検索した読みをもとに音声認
識用の認識文法を生成する認識文法生成工程とが、文字
認識手段91及び融合手段93において行われる。
【0034】具体的には、タブレット101に文字が入
力されると、文字認識部102で入力文字の特徴が抽出
され、辞書103に予め登録されていたパターンとの照
合が行われて、候補の文字が複数得られる。認識文法自
動生成部104では、文字認識部102で結果として得
られた候補を用いて、音声認識に必要な認識文法の自動
生成が行われる。
【0035】認識文法自動生成の手順を図4に示す。
【0036】ステップ401において、文字認識部10
2から文字入力があるか否かを判断する。文字入力があ
る場合には、ステップ402において、読みがな辞書4
03から、認識候補文字に対応する読みを検索する。次
いで、ステップ404において、その読みを音声認識候
補として認識文法を生成してHMMネットワーク作成部
105に出力する。
【0037】その後、ステップ401に戻って、さらに
文字入力がある場合には前記処理を繰り返す。ない場合
にはHMMネットワーク作成部105の処理に進む。
【0038】図5にオンライン文字認識の結果例を示
す。ここでは、「情報」という文字を入力した場合を例
に説明する。
【0039】入力文字「情」に対する文字認識部102
での文字認識の結果、候補として出力された文字は
「情」、「惜」、「等」、「惰」の4つである。出力さ
れた4つの候補に対して、それぞれに対応する読みが検
索される。これらの読みを、それぞれの側部にカッコ書
きで示す。
【0040】同様に、入力文字「報」に対する文字認識
部102での文字認識の結果、候補として出力された文
字は「報」、「鉦」、「鈍」、「鈴」の4つである。出
力された4つの候補に対して、それぞれに対応する読み
が検索される。これらの読みを、それぞれの側部にカッ
コ書きで示す。
【0041】認識文法自動生成部104では、この読み
を使って、発声単位、即ち対象となる音声認識の単位ご
とに、認識文法の自動生成が行われる。
【0042】図6に、入力文字「情報」を/jyo0h
o0/と発声する場合の認識文法の例を示す。
【0043】「情報」の場合は、「情報」の両側及び、
「情」と「報」の間にそれぞれノードが位置し、ノード
「START」が照合開始、ノード「END」が照合終了を表
す。ノード「START」から「END」の間と入力音声区間が
対応する。
【0044】音声が入力されると、ノード「START」と
ノード「S1」との間で入力文字「情」に対する候補群w
1から認識が行われ、ノード「S1」とノード「END」と
の間で入力文字「報」に対する候補群w2から認識が行
われる。
【0045】一方、認識文法を生成する際に、単独では
発声できない文字(例えば音を延ばす「ー」や直前の文
字と連結して小さく発声する「ゃ」等)に対しては、図
7に示す処理がなされる。
【0046】まず、ステップ701で、文字認識候補が
あるか否かを判断する。文字認識候補がない場合は終了
する。文字認識候補がある場合はステップ702で、そ
の文字認識候補が単独で発声することが可能か否かを判
断する。単独発声が可能な場合はステップ703で、そ
の文字をそのまま、単独の音声認識候補として認識文法
の生成を行う。単独発声が不可能な場合はステップ70
4で、単独発声不可能文字と前入力候補文字との連結を
行う。例えば、前入力候補文字が「き」、単独発声不可
能文字が「ゃ」の場合、これらを連結して「きゃ」とす
る。次に、ステップ705で、連結された文字「きゃ」
を音声認識候補として認識文法の生成を行う。具体的に
は、図8に示すようにして、「きゃ」の認識文法の生成
が行われる。また、音を延ばす記号「ー」に対しても、
前記同様にして、例えば「きー」等の連結文字が作成さ
れ、認識文法の生成が行われる。
【0047】なた、前記処理により自動生成された認識
文法に基づいて音声照合処理用の制御情報を作成する制
御情報作成工程は、HMMネットワーク作成部105に
おいて行われる。具体的には、HMMネットワーク作成
部105において、前記認識文法を用いてHMMネット
ワークの作成が行われる。このHMMネットワークの作
成は、前述した従来技術と同様である。
【0048】一方、音声を入力する音声入力工程は、マ
イク106及び分析部107において行われる。具体的
には、マイク106から音声が入力されると、分析部1
07で音声情報の特徴パラメータが抽出されて、前述し
た従来技術と同様の処理がなされる。
【0049】また、照合工程、即ち入力音声情報に対し
て、認識文法自動生成部104で自動生成された認識文
法を基に照合処理が行われて文字及び音声で入力された
同じ意味の入力言語が特定される照合工程は、HMM照
合部108において行われる。具体的には、切り出され
た音声区間の特徴パラメータを用いて、前述した従来技
術と同様の照合処理がなされ、認識結果が出力される。
【0050】[効果]以上のように、認識文法自動生成
部104を設けて、文字認識と音声認識を融合させたの
で、文字認識又は音声認識の一方だけでは認識が困難な
状況でも、文字又は音声により入力された言語を確実に
認識することができるようになる。即ち、小刻みな振動
や大きな揺れ等があって文字入力が困難な環境や、周囲
の騒音がひどくて音声入力が困難な環境等においても、
入力言語に対する認識率が大幅に向上する。
【0051】また、音声認識において認識文法をユーザ
が予め用意する必要がなくなり、自由な入力が可能とな
る。
【0052】[利用形態]以上の機能を有する入力言語
認識装置90の一例を図9に示す。図1に示した文字認
識手段91のタブレット101と音声認識手段92のマ
イク106以外の機能を、図9に示すパーソナルコンピ
ュータ901に格納している。即ち、パーソナルコンピ
ュータ901を主制御部として用いる。このパーソナル
コンピュータ901に、文字入力手段としてのタブレッ
ト902と、音声入カ手段としてのマイク903とを接
続している。利用方法として次の2例をあげる。
【0053】(1) 音声と手書き文字の同時入力 文字入力を行いながら発声を行う際の認識文法作成例を
図10に示す。文字を入力する場合は、1文字入力され
るごとにノードが追加されていく。入力文字「情報」に
対して、「情」と「報」の前後と中間にそれぞれノード
が位置する。
【0054】このため、発声箇所の制限はなく、「情」
を入力したところで/jyoO/と、「報」を入力した
ところで/hoO/と発声してもよい。また、「情報」
と入力した後に/jyoOhoO/と発声してもよい。
【0055】(2) 文字認識結果の修正 文字認識結果に対して修正を行う際の手順を図11に示
す。
【0056】(1) 文字認識結果に対して、間違い文字
を含んだ部分であって、発声しやすい文字の範囲(大阪
域)を選択する。
【0057】(2) 選択された文字に対して正解文字/
oOsakajyoO/を発声する。
【0058】(3) 音声認識手段92で認識された文字
(大阪城)が表示される。この修正結果の確認をする。
【0059】文字認識の修正として使う際の利点は、複
数文字を同時に修正できる点にある。
【0060】しかも、修正文字が連続して存在する必要
はなく、作業の効率は大幅にアッブする。
【0061】[変形例]前記実施形態では、手書き文字
認識にオンライン手書き文字認識を用いた場合を例に説
明したが、OCR文字認識(光学式文字読み取り装置に
よる文字認識)を用いてもよい。この場合にも、前記同
様の作用、効果を奏することができる。
【0062】また、音声認識にHMM音声認識を用いて
いるが、DPマッチング等、他のパターンマッチングを
用いてもよい。
【0063】
【発明の効果】以上、詳述したように、本発明の入力言
語認識装置及び入力言語認識方法によれば次のような効
果を奏することができる。
【0064】(1) 文字認識及び音声認識によって個
別に認識された同じ意味の入力言語を融合させて入力言
語を特定する融合手段を備えたので、文字認識又は音声
認識の一方だけでは入力言語を認識することが困難な状
況でも、入力言語を確実に認識することができるように
なる。
【0065】(2) 文字入力により認識文法を自動的
に生成するようにしたので、音声認識において認識文法
をユーザが予め用意する必要がなくなる。即ち、個々の
文字に対する認識文法を用意しなくても音声認識が可能
になり、音声入力に対する自由度が増す。
【図面の簡単な説明】
【図1】本発明に係る入力言語認識装置を示すブロック
図である。
【図2】従来のHMM音声認識装置のブロック図であ
る。
【図3】従来の文字認識装置のブロック図である。
【図4】認識文法自動生成の手順を示すフローチャート
である。
【図5】オンライン文字認識の結果例を示す表である。
【図6】入力文字「情報」を/jyo0ho0/と発声
する場合の認識文法の例を示す図である。
【図7】単独では発声できない文字の処理を示すフロー
チャートである。
【図8】「きゃ」の認識文法の例を示す図である。
【図9】入力言語認識装置の一例を示す構成図である。
【図10】音声と文字を同時に入力するときの認識文法
例を示す表である。
【図11】文字認識結果に対して修正を行う際の手順を
示す表である。
【符号の説明】 90:入力言語認識装置、91:文字認識手段、92:
音声認識手段、93:融合手段、101:タブレット、
102:文字認識部、103:辞書部、104:認識文
法自動生成部、105:HMMネットワーク作成部、1
06:マイク、107:分析部、108:HMM照合
部。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力文字を認識する文字認識手段と、 入力音声を認識する音声認識手段と、 これら文字認識手段及び音声認識手段で個別に認識され
    た同じ意味の入力言語を融合させて入力言語を特定する
    融合手段とを備えたことを特徴とする入力言語認識装
    置。
  2. 【請求項2】 請求項1に記載の入力言語認識装置にお
    いて、 前記文字認識手段が、文字を入力する文字入力部と、予
    め文字情報が登録された辞書部と、前記文字入力部から
    入力された文字情報と前記辞書部に登録された文字情報
    とを照合して候補を選択する照合部とからなり、 前記音声認識手段が、音声を入力する音声入力部と、別
    途入力された認識文法に基づいて制御情報を作成する制
    御情報作成部と、この制御情報作成部で作成された制御
    情報に基づいて前記音声入力部からの音声情報を照合し
    て入力言語を特定する照合部とからなり、 前記融合手段が、前記文字認識手段の照合部からの出力
    情報に基づいて前記認識文法を生成して前記制御情報作
    成部に出力する認識文法生成部からなること特徴とする
    入力言語認識装置。
  3. 【請求項3】 文字を入力する文字入力工程と、 入力された文字を認識して文字候補を選択する文字候補
    選択工程と、 文字認識結果として得られた文字候補に対応する読みを
    検索する検索工程と、 検索した読みをもとに音声認識用の認識文法を生成する
    認識文法生成工程と、 生成された認識文法に基づいて音声照合処理用の制御情
    報を作成する制御情報作成工程と、 音声を入力する音声入力工程と、 入力された音声情報に対して前記制御情報作成工程で作
    成された制御情報を基に照合処理が行われて文字及び音
    声で入力された入力言語が特定される照合工程とからな
    ることを特徴とする入力言語認識方法。
JP8238025A 1996-09-09 1996-09-09 入力言語認識装置及び入力言語認識方法 Pending JPH1083195A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8238025A JPH1083195A (ja) 1996-09-09 1996-09-09 入力言語認識装置及び入力言語認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8238025A JPH1083195A (ja) 1996-09-09 1996-09-09 入力言語認識装置及び入力言語認識方法

Publications (1)

Publication Number Publication Date
JPH1083195A true JPH1083195A (ja) 1998-03-31

Family

ID=17024053

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8238025A Pending JPH1083195A (ja) 1996-09-09 1996-09-09 入力言語認識装置及び入力言語認識方法

Country Status (1)

Country Link
JP (1) JPH1083195A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999060465A1 (en) * 1998-05-20 1999-11-25 Fonix Corporation Apparatus and method for processing handwritten and hand-drawn input and speech input
US6438523B1 (en) 1998-05-20 2002-08-20 John A. Oberteuffer Processing handwritten and hand-drawn input and speech input
WO2002091356A1 (fr) * 2001-05-02 2002-11-14 Sony Corporation Dispositif robot, appareil de reconnaissance de caracteres, procede de lecture de caracteres, programme de commande et support d'enregistrement
KR20030021395A (ko) * 2001-09-06 2003-03-15 정현열 에치엠엠 기반의 음성/문자 공용 인식 장치 및 그 방법
JP2007011358A (ja) * 2005-06-28 2007-01-18 Avaya Technology Corp 複合文字の音声認識によって支援された自動補完
US8249873B2 (en) 2005-08-12 2012-08-21 Avaya Inc. Tonal correction of speech
JP2014215578A (ja) * 2013-04-30 2014-11-17 日本電信電話株式会社 音響モデル選択装置とその方法とプログラム
CN109815483A (zh) * 2018-12-19 2019-05-28 东软集团股份有限公司 合成词识别方法、装置、可读存储介质及电子设备

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999060465A1 (en) * 1998-05-20 1999-11-25 Fonix Corporation Apparatus and method for processing handwritten and hand-drawn input and speech input
US6438523B1 (en) 1998-05-20 2002-08-20 John A. Oberteuffer Processing handwritten and hand-drawn input and speech input
WO2002091356A1 (fr) * 2001-05-02 2002-11-14 Sony Corporation Dispositif robot, appareil de reconnaissance de caracteres, procede de lecture de caracteres, programme de commande et support d'enregistrement
US7088853B2 (en) 2001-05-02 2006-08-08 Sony Corporation Robot apparatus, method and device for recognition of letters or characters, control program and recording medium
KR100940630B1 (ko) * 2001-05-02 2010-02-05 소니 주식회사 로봇 장치와, 문자 인식 장치 및 문자 인식 방법과, 제어프로그램 및 기록 매체
KR20030021395A (ko) * 2001-09-06 2003-03-15 정현열 에치엠엠 기반의 음성/문자 공용 인식 장치 및 그 방법
JP2007011358A (ja) * 2005-06-28 2007-01-18 Avaya Technology Corp 複合文字の音声認識によって支援された自動補完
US8249873B2 (en) 2005-08-12 2012-08-21 Avaya Inc. Tonal correction of speech
JP2014215578A (ja) * 2013-04-30 2014-11-17 日本電信電話株式会社 音響モデル選択装置とその方法とプログラム
CN109815483A (zh) * 2018-12-19 2019-05-28 东软集团股份有限公司 合成词识别方法、装置、可读存储介质及电子设备
CN109815483B (zh) * 2018-12-19 2023-08-08 东软集团股份有限公司 合成词识别方法、装置、可读存储介质及电子设备

Similar Documents

Publication Publication Date Title
US10074363B2 (en) Method and apparatus for keyword speech recognition
CN108305634B (zh) 解码方法、解码器及存储介质
US5855000A (en) Method and apparatus for correcting and repairing machine-transcribed input using independent or cross-modal secondary input
US7529678B2 (en) Using a spoken utterance for disambiguation of spelling inputs into a speech recognition system
JP4570176B2 (ja) ユーザにオーディオ・フィードバックを与える拡張可能音声認識システム
Klatt Review of the ARPA speech understanding project
US6839667B2 (en) Method of speech recognition by presenting N-best word candidates
US7996218B2 (en) User adaptive speech recognition method and apparatus
US5712957A (en) Locating and correcting erroneously recognized portions of utterances by rescoring based on two n-best lists
US20020173956A1 (en) Method and system for speech recognition using phonetically similar word alternatives
JP2010020102A (ja) 音声認識装置、音声認識方法及びコンピュータプログラム
JP3104661B2 (ja) 日本語文章作成装置
US7302381B2 (en) Specifying arbitrary words in rule-based grammars
JPH1083195A (ja) 入力言語認識装置及び入力言語認識方法
CN108806691B (zh) 语音识别方法及系统
JPH10274996A (ja) 音声認識装置
JP5257680B2 (ja) 音声認識装置
JP4595415B2 (ja) 音声検索システムおよび方法ならびにプログラム
JP4639990B2 (ja) 音声対話装置及び音声理解結果生成方法
JP4220151B2 (ja) 音声対話装置
JP2000056795A (ja) 音声認識装置
JP2004029354A (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP3378547B2 (ja) 音声認識方法及び装置
JP2003044085A (ja) コマンド入力機能つきディクテーション装置
JP2000330588A (ja) 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体