JP3908878B2 - Phoneme recognition performance measuring device for continuous speech recognition device - Google Patents
Phoneme recognition performance measuring device for continuous speech recognition device Download PDFInfo
- Publication number
- JP3908878B2 JP3908878B2 JP27332899A JP27332899A JP3908878B2 JP 3908878 B2 JP3908878 B2 JP 3908878B2 JP 27332899 A JP27332899 A JP 27332899A JP 27332899 A JP27332899 A JP 27332899A JP 3908878 B2 JP3908878 B2 JP 3908878B2
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- recognition
- continuous speech
- speech recognition
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【0001】
【発明の属する技術分野】
本発明は、音響モデルおよび言語モデルを使用して連続音声を認識する連続音声認識装置の音素認識性能測定装置に関する。
【0002】
【従来の技術】
従来、音響モデルおよび確率的言語モデルを使用して連続音声を認識する音声認識装置が知られている(「確率モデルによる音声認識」,中川聖一,電子情報通信学会)。従来のこの種の音声認識装置の機能構成を図1に示す。
【0003】
図1において、10は、入力音声を音素認識し、認識した音素(ラベル形態)とその尤度(尤もらしさ)を出力する音響モデルであり、たとえば、HMM(隠れマルコフモデル)などが有名である。11は言語モデルである言語モデルは、音素列の形態の単語および隣接する単語との接続確率をデータベースの形態で有する。12は音響モデル10から時系列的に出力される音素の系列および尤度と言語モデル11のデータベースに記載された各単語とおよびその接続確率を使用して入力した音素列に対して尤もらしさが最も高い、言語モデル中の単語を単語認識結果として出力する音響尤度計算部である。
【0004】
このような構成の連続音声認識装置では、連続音声が音響モデル10において、音素認識された後、音響尤度計算部12で単語認識されて、単語列すなわち、文が出力される。
【0005】
連続音声認識装置で使用される音響モデルの性能を測定することは松岡、大附,森、古井,白井著,電子情報通信学会論文集,1996年12月2125頁や松岡、大附,森、古井,白井著,日本音響学会講演論文集,1997年3月号2−6−11頁において提案されている。
【0006】
【発明が解決しようとする課題】
音響モデルの性能を測定するためには、あらかじめ音素の表記が判明している評価用の音声を音響モデルに入力し、音素認識結果として得られる音素列と、評価用の音声の表記とを比較することで、音素認識率を得ることができる。なお、ここでいう音素とは、母音や子音などの音韻あるいは音韻よりも短い音声の長さの音声部分を指す、音響モデルから出力される音素とは、音声認識された音素の識別名(ラベル)等を意味する。
【0007】
連続音声認識装置の音素認識性能を示す指標として音響モデルの音素認識率を使用するには以下の問題があった。
【0008】
音響モデル10では入力の音声から得られる音響的な特徴と音響モデル内にあらかじめ保有している音素の音響的な特徴との比較により音素認識を行う。
【0009】
音響モデル単体では、音素認識のみを実行し、単語認識は行わないので、言語上の文や単語のつながりではありえないような音素の誤認識結果が発生する。
【0010】
連続音声認識装置ではこのような誤認識結果は、音響尤度計算装置12の単語認識において、是正される。したがって、連続音声認識装置における音素認識性能測定値として音響モデル単体の音素認識率を使用すると、実際の性能よりも測定値が低くなるという傾向がある。
【0011】
以上の点に鑑みて、本発明の目的は、言語上の文法的接続関係(単語接続率)を排除した場合の連続音声認識装置の音素認識性能を正しく測定することができる連続音声認識装置の音素認識性能測定装置を提供することにある。
【0012】
【課題を解決するための手段】
このような目的を達成するために、言語モデルおよび音響モデルを使用して連続音声認識を行う連続音声認識装置の音素認識性能を測定する連続音声認識装置の音素認識性能測定装置において、評価用音声の音素列の表記を入力する入力手段と、前記連続音声認識装置に対して前記評価用音声を入力し、該評価用音声に対して前記音響モデルにより音素認識を行い、該音響モデルの音素認識結果に対して言語上存在する文字列をもとにした音素に拘束をかける音素処理手段と、該音素処理手段から出力される音素列と、前記入力手段から入力された評価用音声の音素列の表記とを比較して音素認識率を計算し、当該計算された音素認識率を音素認識性能の測定値として出力する性能測定手段とを具え、前記音素処理手段により音素に拘束をかけることにより言語上存在しない音素列を除外し、該言語上存在しない音素列を除外した前記音素処理手段の処理結果を前記性能測定手段の性能測定に使用することを特徴とする。
【0013】
請求項2の発明は、請求項1に記載の連続音声認識装置の音素認識性能測定装置において、前記言語上存在する文字列は単語であることを特徴とする。
【0016】
【発明の実施の形態】
以下、図面を参照して本発明の実施形態を詳細に説明する。
【0017】
図2は連続音声認識装置の中に設けた音素認識性能測定装置の基本構成を示す。図2において、図1の従来例と同様の個所には同一の符号を付し、詳細な説明を省略する。21は単語辞書21−1を有する音素列生成部であり、単語辞書21−1に記載された音素列形態の単語を順次に音響尤度計算部12に供給する。これにより音響尤度計算部12では、音響モデル10から一定時間の間出力された複数の音素、すなわち音素列と、音素列生成部21から供給された単語の音素列とを比較し、最も類似している単語(音素列形態)を単語認識結果として出力する。
【0018】
本実施形態では、単語の接続率が音響尤度計算部12に与えられないので、言語上の単語等の接続関係が考慮されておらず、言語上存在しうる単語の音素列を音声認識結果とする点に留意されたい。したがって、たとえば、「朝」という評価用音声に対して音響モデルの音素認識結果として「aaaskssaaa」というように言語上存在しない音素「k」が音素の認識結果の中に混在していても「音素列生成部」21から供給される単語の中に「朝」に対応する音素列が存在すると、音素認識結果中の上記音素「k」は是正されて単語認識結果として、「aaassssaaa」が出力される。このように言語上存在しない音素を排除する音素処理を行うことを本明細書では「音響モデルの音素認識結果に単語拘束をかける」と呼ぶことにする。本実施形態では、拘束をかける文字列長さを単語としているが、用途に応じて文節や文としてもよく、この場合には、音素列生成部21で使用する単語辞書21−1が対応の文字列長さの音素列を記述したものとなる。
【0019】
22は音素列比較部であり、評価用音声を入力したときに音響尤度計算部12から出力される音素列形態の単語認識結果と、評価用の音声の表記とを比較して、音素認識率を計算する。比較の方法としては、本実施形態では、動的計画法(DPやダイナミックプログラミングとも呼ばれる)を使用する。計算された認識率は不図示の表示器やプリンタにより可視出力される。
【0020】
このような音素認識性能測定装置を有する連続音声認識装置を実現するためのハードウェア構成の一例を図3に示す。連続音声認識装置は、連続音声認識用プログラムを汎用のコンピュータ、たとえば、パーソナルコンピュータに実装することで実現する。図3はパーソナルコンピュータ等の主要部分の構成を示す。
【0021】
図3において、CPU100は音声認識用プログラムを実行して,連続音声認識処理を行うと共に、後述の音素認識性能のためのプログラムを実行して連続音声認識装置の音素認識性能を測定する。
【0022】
システムメモリ110は、CPU100が行う情報処理に対する入出力データを一時記憶する。ハードディスク記憶装置(HDDと略記する)130は、連続音声認識プログラム、言語モデルのためのデータ、音響モデルで使用するデータ等、本発明に関わる単語辞書(図2の21−1に対応)および音素認識性能測定プログラムを保存記憶する。上述のプログラムは不図示のキーボードやマウス等の実行の指示で、HDD130からシステムメモリ110にローディングされた後、CPU100により指示されたプログラムが実行される。
【0023】
入力インターフェース(I/O)120は不図示のマイクロホンから入力された音声信号をA/D変換して、デジタル形態の音声信号を連続音声認識のためにCPU100に引き渡す。
【0024】
このような構成において、ユーザがキーボードまたはマウス等により音素認識性能測定プログラムの実行を指示すると、HDD130からシステムメモリ110に図4の音素認識性能測定プログラムがロードされ、CPU100により実行される。
【0025】
ユーザはあらかじめ評価用の音声の音素表記を文書ファイルの形態でHDD130に記憶しておくものとする。音素表記の文書ファイルは、パーソナルコンピュータのワープロソフトで作成してもよいし、フロッピー等を介して不図示のHDD130にオフライン転送してもよい。
【0026】
ユーザは不図示のマイクロホンから評価用音声を入力する。入力された音声はI/O120を介してCPU100に引き渡される。CPU100は従来と同様の連続音声認識プログラムの中の音響モデル部分(たとえば、サブルーチンや関数の形態)を使用して音素認識を行って、音素認識結果をシステムメモリ110内のワーク領域に順次に記憶していく。
【0027】
CPU100は音素認識結果に対して、最も類似している単語(音素列形態)を単語辞書21−1から取り出す。この処理が、図2の音素列生成部21および音響尤度計算部22の処理に対応する。より、具体的には、単語辞書21−1から順次に単語の音素列を読み出して、比較対照の音響モデル10の出力、すなわち、音素列と比較し、尤度を従来と同様の方法で計算する。以下、順次に単語辞書から単語を読み出して、比較対象の音素列と比較して尤度を計算する。最初に計算された尤度が仮の最高値としてその音素列および/または単語辞書21−1の記憶位置と共に一時記憶される。次に読み出された単語についての尤度と仮の最高値とが比較され、次回に読み出された尤度が仮の最高値よりも大きい場合にはその読み出された単語の音素列およびまたは単語の記憶位置、尤度がこれまでに一時記憶されていた仮の最高値および関連データと置換される。
【0028】
このようにして、単語辞書21−1に記載されている単語の音素列全てと、比較対照の音素列との比較,すなわち,尤度計算を行う。すると、システムメモリ110に記憶されている仮の最高値、対応する音素列(表記)、単語辞書の記憶位置が単語の認識結果として決定される。
【0029】
決定された音素列が、システムメモリ110の音声認識結果記憶領域に記憶される(図4のステップS10)。
【0030】
以上の処理を音声の入力終了まで一定時間間隔で繰り返すと(ステップS10〜S20のループ処理)、システムメモリ110の音声認識結果記憶領域には累積的に単語の認識結果が音素列の形態で累積的に記憶されていく。
【0031】
次に、入力された音声についての音声認識を終了すると、CPU100はHDD130から評価用音声の音素表記のファイルをHDD130からシステムメモリ110のワーク領域上に読み出す(入力する)。つづいて、CPU100はシステムメモリ110の単語認識結果記憶領域に一時記憶されている音素列と、ワーク領域に記憶されている評価用音声の音素表記とを使用して動的計画法、すなわち、DPマッチングの手法により音素認識率を計算する(図4のステップS30→S40)。
【0032】
計算された音素認識率が音素認識性能の測定値として、表示器やプリンタに出力される(図4のステップS50)。
【0033】
ユーザは出力された測定値を見て、連続音声認識プログラムで使用する単語拘束をかけた音素認識機能の音素認識性能を知ることができる。
【0034】
本実施形態の他に次の形態を実施できる。
【0035】
1)上述の実施形態では、連続音声認識プログラムと音素認識性能測定プログラムを別個としていたが、連続音声認識プログラムの中に、音素認識性能測定プロうグラムを組み込むこともできる。この場合は、キーボードあるいはマウスにより連続音声認識を行うか、音素認識性能を行うかのモード指示をユーザから受け付ける。連続音声認識が指示された場合には、連続音声プログラムの音響尤度計算部12が言語モデルを使用するように定義し、音素認識性能測定が指示された場合には音素列生成部に切り替えるようにするとよい(図5参照)。
【0036】
さらに、上記の形態では言語モデル11から出力される単語の接続確率は無視されるが、図6に示すように音素認識性能測定時には単語の接続確率として固定値を音響尤度計算部12に与えると、言語モデルが有する音素列形態の単語情報を音素認識性能の測定のために使用する単語辞書(21−1)の代わりに使用することもできる。
【0037】
2)上述の実施形態では、音声認識性能測定プログラムを記録する記録媒体はハードディスク記憶装置(HDD)であってもよいが、記録媒体はROMやRAM等のICメモリや、フロッピーディスクやCDROM等の携帯用記録媒体であってもよい。
【0038】
3)上述の実施形態では、音素認識率を音素認識性能の測定値としているが、音素認識率そのものの値を使用してもよいし、音素認識率をたとえば、よい、普通、悪いというように、段階的に表現するようにしてもよい。
【0039】
4)上述の実施形態は本発明を説明する一実施形態であって、特許請求の範囲の記載が示す技術思想にしたがって、上述の実施形態に対する上述以外の変形が可能である。また、このような変形形態は本願特許の権利範囲内にある。
【0040】
【発明の効果】
以上、説明したように、本発明によれば、たとえば、単語単位で、音響モデルの音素認識結果に対して拘束をかけること(単語等の文字列では言語上の存在しない音素を音素認識結果から排除すること)により連続音声認識装置の音素認識性能を正しく測定することができる。
【0041】
また、連続音声認識装置の音素認識性能の測定結果を連続音声認識装置全体としての認識性能を解析する際に、参考にすることで、効率よく連続音声認識装置の認識性能を解析することができる。
【図面の簡単な説明】
【図1】図1は従来の音声認識装置の代表的な構成を示すブロック図である。
【図2】図2は本発明実施形態の基本構成を示すブロック図である。
【図3】本発明実施形態のハードウェア構成を示すブロック図である。
【図4】CPUの音素認識性能測定処理手順を示すフローチャートである。
【図5】本発明実施形態の他の形態を示すブロック図である。
【図6】本発明実施形態のさらに他の形態を示すブロック図である。
【符号の説明】
10 音響モデル
11 言語モデル
12 音響尤度計算部
21 音素列生成部
21−1 単語辞書
100 CPU
110 システムメモリ
120 I/O
130 HDD[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a phoneme recognition performance measuring device for a continuous speech recognition device that recognizes continuous speech using an acoustic model and a language model.
[0002]
[Prior art]
Conventionally, a speech recognition apparatus that recognizes continuous speech using an acoustic model and a probabilistic language model is known (“speech recognition by a stochastic model”, Seiichi Nakagawa, IEICE). A functional configuration of this type of conventional speech recognition apparatus is shown in FIG.
[0003]
In FIG. 1,
[0004]
In the continuous speech recognition apparatus having such a configuration, after continuous speech is phoneme-recognized in the
[0005]
Measuring the performance of acoustic models used in continuous speech recognizers is Matsuoka, Otsuki, Mori, Furui, Shirai, The Institute of Electronics, Information and Communication Engineers, December 2125, Matsuoka, Otsuki, Mori, Furui, Proposed in Shirai, Acoustical Society of Japan, March 1997, pages 2-6-11.
[0006]
[Problems to be solved by the invention]
To measure the performance of the acoustic model, input the speech for evaluation whose phoneme notation is known in advance into the acoustic model, and compare the phoneme string obtained as a result of phoneme recognition with the notation of the speech for evaluation. By doing so, the phoneme recognition rate can be obtained. Here, the phoneme refers to a phoneme such as a vowel or a consonant, or a voice part having a shorter voice length than the phoneme. A phoneme output from the acoustic model is an identification name (label) of a phoneme recognized. ) Etc.
[0007]
The use of the phoneme recognition rate of the acoustic model as an index indicating the phoneme recognition performance of the continuous speech recognition apparatus has the following problems.
[0008]
In the
[0009]
Since the acoustic model alone performs only phoneme recognition and does not perform word recognition, a phoneme misrecognition result that cannot be a linguistic sentence or word connection occurs.
[0010]
In the continuous speech recognition apparatus, such a misrecognition result is corrected in the word recognition of the acoustic
[0011]
In view of the above points, an object of the present invention is to provide a continuous speech recognition apparatus capable of correctly measuring the phoneme recognition performance of a continuous speech recognition apparatus when a grammatical connection relationship (word connection rate) in a language is excluded. and to provide a phoneme recognition performance measurement equipment.
[0012]
[Means for Solving the Problems]
In order to achieve such an object, in the phoneme recognition performance measuring device of a continuous speech recognition device that measures the phoneme recognition performance of a continuous speech recognition device that performs continuous speech recognition using a language model and an acoustic model, An input means for inputting a notation of a phoneme string, and the evaluation speech is input to the continuous speech recognition device, phoneme recognition is performed on the evaluation speech by the acoustic model, and the phoneme recognition of the acoustic model is performed. Phoneme processing means for constraining phonemes based on character strings existing in the result, phoneme strings output from the phoneme processing means, and phoneme strings of evaluation speech input from the input means the phoneme recognition rate calculated by the comparison and representation, the calculated phoneme recognition rate comprises a performance measuring means for outputting a measure of phoneme recognition performance, or the phoneme restrained by the phoneme processing means Excludes the phoneme sequence that does not exist on the language by Rukoto, characterized by the use of processing results of the phoneme processing means excluding phoneme sequence which does not exist on該言words the performance measurement of the performance measurement means.
[0013]
According to a second aspect of the present invention, in the phoneme recognition performance measuring apparatus of the continuous speech recognition apparatus according to the first aspect, the character string existing in the language is a word.
[0016]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[0017]
FIG. 2 shows a basic configuration of a phoneme recognition performance measuring apparatus provided in the continuous speech recognition apparatus. 2, the same parts as those in the conventional example of FIG. 1 are denoted by the same reference numerals, and detailed description thereof is omitted. A phoneme
[0018]
In this embodiment, since the connection rate of words is not given to the acoustic
[0019]
A phoneme
[0020]
An example of a hardware configuration for realizing a continuous speech recognition apparatus having such a phoneme recognition performance measuring apparatus is shown in FIG. The continuous speech recognition apparatus is realized by mounting a continuous speech recognition program on a general-purpose computer such as a personal computer. FIG. 3 shows a configuration of main parts of a personal computer or the like.
[0021]
In FIG. 3, the
[0022]
The
[0023]
An input interface (I / O) 120 A / D converts an audio signal input from a microphone (not shown) and delivers the digital audio signal to the
[0024]
In such a configuration, when the user instructs execution of the phoneme recognition performance measurement program using a keyboard or a mouse, the phoneme recognition performance measurement program of FIG. 4 is loaded from the
[0025]
Assume that the user stores in advance the phonetic notation of the voice for evaluation in the
[0026]
The user inputs evaluation voice from a microphone (not shown). The input voice is delivered to the
[0027]
The
[0028]
In this way, all the phoneme strings of words described in the word dictionary 21-1 are compared with the comparison phoneme string, that is, the likelihood calculation is performed. Then, the provisional maximum value stored in the
[0029]
The determined phoneme string is stored in the speech recognition result storage area of the system memory 110 (step S10 in FIG. 4).
[0030]
When the above processing is repeated at regular time intervals until the end of speech input (loop processing in steps S10 to S20), the word recognition results are accumulated in the form of phoneme strings in the speech recognition result storage area of the
[0031]
Next, when the speech recognition for the input speech is completed, the
[0032]
The calculated phoneme recognition rate is output as a measurement value of the phoneme recognition performance to a display or a printer (step S50 in FIG. 4).
[0033]
The user can know the phoneme recognition performance of the phoneme recognition function with the word constraint used in the continuous speech recognition program by looking at the output measurement values.
[0034]
In addition to this embodiment, the following embodiment can be implemented.
[0035]
1) In the above-described embodiment, the continuous speech recognition program and the phoneme recognition performance measurement program are separated, but a phoneme recognition performance measurement program can be incorporated into the continuous speech recognition program. In this case, a mode instruction indicating whether to perform continuous speech recognition using the keyboard or mouse or to perform phoneme recognition performance is received from the user. When continuous speech recognition is instructed, the acoustic
[0036]
Furthermore, in the above embodiment, the word connection probability output from the
[0037]
2) In the above embodiment, the recording medium for recording the voice recognition performance measurement program may be a hard disk storage device (HDD), but the recording medium may be an IC memory such as a ROM or a RAM, a floppy disk or a CDROM, or the like. It may be a portable recording medium.
[0038]
3) In the above-described embodiment, the phoneme recognition rate is a measured value of the phoneme recognition performance, but the value of the phoneme recognition rate itself may be used, and the phoneme recognition rate may be, for example, good, normal, or bad. It may be expressed in stages.
[0039]
4) The above-described embodiment is an embodiment for explaining the present invention, and modifications other than the above can be made to the above-described embodiment in accordance with the technical idea indicated by the claims. Also, such variations are within the scope of the present patent.
[0040]
【The invention's effect】
As described above, according to the present invention, for example, the phoneme recognition result of the acoustic model is constrained in units of words (phonemes that do not exist in the language for character strings such as words are determined from the phoneme recognition result. This makes it possible to correctly measure the phoneme recognition performance of the continuous speech recognition apparatus.
[0041]
In addition, when analyzing the recognition performance of the continuous speech recognition device as a whole, the recognition performance of the continuous speech recognition device can be efficiently analyzed by referring to the measurement results of the phoneme recognition performance of the continuous speech recognition device. .
[Brief description of the drawings]
FIG. 1 is a block diagram showing a typical configuration of a conventional speech recognition apparatus.
FIG. 2 is a block diagram showing a basic configuration of the embodiment of the present invention.
FIG. 3 is a block diagram showing a hardware configuration of an embodiment of the present invention.
FIG. 4 is a flowchart showing a phoneme recognition performance measurement processing procedure of a CPU.
FIG. 5 is a block diagram showing another embodiment of the present invention.
FIG. 6 is a block diagram showing still another embodiment of the present invention.
[Explanation of symbols]
DESCRIPTION OF
110 System memory 120 I / O
130 HDD
Claims (2)
評価用音声の音素列の表記を入力する入力手段と、
前記連続音声認識装置に対して前記評価用音声を入力し、該評価用音声に対して前記音響モデルにより音素認識を行い、該音響モデルの音素認識結果に対して言語上存在する文字列をもとにした音素に拘束をかける音素処理手段と、
該音素処理手段から出力される音素列と、前記入力手段から入力された評価用音声の音素列の表記とを比較して音素認識率を計算し、当該計算された音素認識率を音素認識性能の測定値として出力する性能測定手段と
を具え、前記音素処理手段により音素に拘束をかけることにより言語上存在しない音素列を除外し、該言語上存在しない音素列を除外した前記音素処理手段の処理結果を前記性能測定手段の性能測定に使用することを特徴とする連続音声認識装置の音素認識性能測定装置。In the phoneme recognition performance measuring device of a continuous speech recognition device that measures the phoneme recognition performance of a continuous speech recognition device that performs continuous speech recognition using a language model and an acoustic model,
An input means for inputting a phoneme string notation of the evaluation voice;
The evaluation speech is input to the continuous speech recognition apparatus, phoneme recognition is performed on the evaluation speech by the acoustic model, and a language string is present for a phoneme recognition result of the acoustic model. Phoneme processing means for constraining the phoneme
A phoneme recognition rate is calculated by comparing the phoneme sequence output from the phoneme processing unit with the notation of the phoneme sequence of the evaluation speech input from the input unit, and the calculated phoneme recognition rate is used as a phoneme recognition performance. A phoneme processing means that excludes phoneme strings that do not exist in the language and excludes phoneme strings that do not exist in the language by constraining the phonemes by the phoneme processing means. A phoneme recognition performance measuring apparatus for a continuous speech recognition apparatus , wherein a processing result is used for performance measurement of the performance measuring means.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27332899A JP3908878B2 (en) | 1999-09-27 | 1999-09-27 | Phoneme recognition performance measuring device for continuous speech recognition device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27332899A JP3908878B2 (en) | 1999-09-27 | 1999-09-27 | Phoneme recognition performance measuring device for continuous speech recognition device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001100789A JP2001100789A (en) | 2001-04-13 |
JP3908878B2 true JP3908878B2 (en) | 2007-04-25 |
Family
ID=17526363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP27332899A Expired - Fee Related JP3908878B2 (en) | 1999-09-27 | 1999-09-27 | Phoneme recognition performance measuring device for continuous speech recognition device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3908878B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4825014B2 (en) * | 2006-01-24 | 2011-11-30 | 旭化成株式会社 | Evaluation data generation apparatus, recognition performance distribution information generation apparatus and system |
JP5576113B2 (en) * | 2006-04-03 | 2014-08-20 | ヴォコレクト・インコーポレーテッド | Method and system for fitting a model to a speech recognition system |
KR102380833B1 (en) * | 2014-12-02 | 2022-03-31 | 삼성전자주식회사 | Voice recognizing method and voice recognizing appratus |
-
1999
- 1999-09-27 JP JP27332899A patent/JP3908878B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2001100789A (en) | 2001-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3782943B2 (en) | Speech recognition apparatus, computer system, speech recognition method, program, and recording medium | |
US6839667B2 (en) | Method of speech recognition by presenting N-best word candidates | |
US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
JP4215418B2 (en) | Word prediction method, speech recognition method, speech recognition apparatus and program using the method | |
US7634401B2 (en) | Speech recognition method for determining missing speech | |
KR101590724B1 (en) | Method for modifying error of speech recognition and apparatus for performing the method | |
US8271282B2 (en) | Voice recognition apparatus, voice recognition method and recording medium | |
US7921014B2 (en) | System and method for supporting text-to-speech | |
JPH1063291A (en) | Speech recognition method using continuous density hidden markov model and apparatus therefor | |
JP3803029B2 (en) | Voice recognition device | |
JP2003308090A (en) | Device, method and program for recognizing speech | |
US6963834B2 (en) | Method of speech recognition using empirically determined word candidates | |
JP5753769B2 (en) | Voice data retrieval system and program therefor | |
JP2001092496A (en) | Continuous voice recognition device and recording medium | |
US20050038647A1 (en) | Program product, method and system for detecting reduced speech | |
JP3961780B2 (en) | Language model learning apparatus and speech recognition apparatus using the same | |
JP4089861B2 (en) | Voice recognition text input device | |
JPH05143093A (en) | Method and apparatus for forming model of uttered word | |
JP3908878B2 (en) | Phoneme recognition performance measuring device for continuous speech recognition device | |
JP3633254B2 (en) | Voice recognition system and recording medium recording the program | |
JP2001312293A (en) | Method and device for voice recognition, and computer- readable storage medium | |
JP4798606B2 (en) | Speech recognition apparatus and program | |
JP5028599B2 (en) | Audio processing apparatus and program | |
JP4962930B2 (en) | Pronunciation rating device and program | |
JP2008242059A (en) | Device for creating speech recognition dictionary, and speech recognition apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040422 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060530 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060602 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060801 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060801 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070112 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070119 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110126 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120126 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |