JPS634299A - Pattern matching - Google Patents

Pattern matching

Info

Publication number
JPS634299A
JPS634299A JP61148580A JP14858086A JPS634299A JP S634299 A JPS634299 A JP S634299A JP 61148580 A JP61148580 A JP 61148580A JP 14858086 A JP14858086 A JP 14858086A JP S634299 A JPS634299 A JP S634299A
Authority
JP
Japan
Prior art keywords
syllable
distance
matching
syllables
present
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61148580A
Other languages
Japanese (ja)
Other versions
JPH0577078B2 (en
Inventor
隆夫 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61148580A priority Critical patent/JPS634299A/en
Publication of JPS634299A publication Critical patent/JPS634299A/en
Publication of JPH0577078B2 publication Critical patent/JPH0577078B2/ja
Granted legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/12Improving ICE efficiencies

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明はパタンマッチング技術、特に音節を認識単位と
した音声認識におけるパタンマッチング技術の改良に関
する。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to pattern matching technology, particularly to improvement of pattern matching technology in speech recognition using syllables as recognition units.

(従来の技術) 音節のような音声学上の基本的な単位を用いて音声認識
を行う方法は、認識対象の各単語単位の標準パタンを必
要としないため大語業認識に適している。この場合認識
処理は、入力された音声を音節候補の系列へ変換する音
節認識処理と、この音節系列と音節表記された単語辞書
中の各単語とを照合する単語認識処理の2つの処理を含
んで構成される。後者の単語認識処理は音節を記号単位
とする記号系列間のパタンマッチングにより実現するこ
とが可能である。このようなパタンマツチング法として
「情報処理J第17巻No、7 pp、650−658
(1976年7月)に述べられている記号列間のマツチ
ング法は、代表的な方法である。
(Prior Art) A method of performing speech recognition using basic phonetic units such as syllables is suitable for large language word recognition because it does not require a standard pattern for each word to be recognized. In this case, the recognition process includes two processes: a syllable recognition process that converts the input speech into a series of syllable candidates, and a word recognition process that matches this syllable series with each word in the word dictionary expressed in syllables. Consists of. The latter word recognition process can be realized by pattern matching between symbol sequences using syllables as symbol units. As such a pattern matching method, "Information Processing J Vol. 17 No. 7 pp. 650-658
(July 1976) is a typical method for matching between symbol strings.

この方法においては、記号間の距離をあらかじめ定めて
おき、2つの記号列パタンを時間的に対応付けたときに
対応付けられる各々の記号間の距離をパタン全体にわた
って累積した累積距離量が最小となるように動的計画法
(Dynamic Programing)を利用して
マツチングを行っている。
In this method, the distance between symbols is determined in advance, and when two symbol string patterns are temporally associated, the distance between each associated symbol is determined so that the cumulative amount of distance accumulated over the entire pattern is the minimum. Matching is performed using dynamic programming to achieve this.

(発明が解決しようとする問題点) ここで記号間の距離は、言己号すなわち音節間の近さ、
あるいはある音節が認識結果として正解とおきかわって
別の音節として観測される確度を示すものと解決される
。音節候補系列に脱落や挿入が存在する場合には第1図
に示されるように1つの音節が複数個の音節に対応付け
られることになる。音節の脱落や挿入は、音韻固有の性
質によりある特定の音節のつながりで生じることが多い
(Problem to be solved by the invention) Here, the distance between symbols is the word self sign, that is, the closeness between syllables,
Alternatively, it is resolved to indicate the probability that a certain syllable will be observed as a different syllable instead of the correct answer as a recognition result. If there are omissions or insertions in the syllable candidate series, one syllable will be associated with a plurality of syllables as shown in FIG. Syllable dropouts and insertions often occur in specific syllable connections due to the inherent properties of phonemes.

このため音節間の距離を決定するにあたっては、コンテ
キスト(音節の前後のつながり)に依存した音韻論的な
変形を考慮することが重要である。
Therefore, when determining the distance between syllables, it is important to consider phonological transformations that depend on the context (connection before and after syllables).

しかしながら、上記の記号間距離によるマツチングでは
、音節間距離はコンテキストに無関係に与えられるため
このようなコンテキストに依存した変形が考慮されない
However, in the above-mentioned matching using the inter-symbol distance, since the inter-syllable distance is given without regard to the context, such context-dependent transformations are not taken into consideration.

例えば変形/kiyo/−/kyo/を考えよう。音節
/ki/と音節/kyo/間の゛°距離″、音節/yo
/と音節/kyo/間の゛距離″はいずれも小さくない
にもかかわらず、このような変形は典型的なものである
。しかしながら上記のマツチングでは音節列/kiyo
/と音節/kyo/とを対応させたときの距離は小さく
ならない。
For example, consider the transformation /kiyo/-/kyo/. ``distance'' between the syllable /ki/ and the syllable /kyo/, the syllable /yo
Such transformations are typical even though the "distance" between / and the syllable /kyo/ is not small. However, in the above matching, the syllable string /kiyo/
The distance when / and the syllable /kyo/ are made to correspond does not become small.

本発明は、音韻論的な変形規則をテーブル形式の距離に
よって記述することにより音節候補系列ないしネットワ
ーク上で音節の脱落、挿入等が存在する場合でも高い精
度でマツチングを行う手段を提供する。本発明はこれに
より認識精度の高い音声認識装置を実現することを目的
としている。
The present invention provides means for performing matching with high accuracy even when syllable dropouts, insertions, etc. exist in a syllable candidate series or network by describing phonological transformation rules using distances in a table format. An object of the present invention is to thereby realize a speech recognition device with high recognition accuracy.

(発明の構成) 本発明は、音節に関する系列ないしネットワークとして
表現された2つのパタンを照合するに際して、あるかし
め各音節の組み合わせ(X1、X2.X3)について与
えられた音節X1と音節列X2X3との間の距離d(X
x;X2、X3)を用いることを特徴とする。
(Structure of the Invention) When comparing two patterns expressed as a syllable series or network, the present invention provides the syllable X1 and the syllable sequence X2 The distance d(X
x; X2, X3).

また、本発明は音節に関する系列ないしネットワークと
して表現された2つのパタンを照合するに際して、音節
x1と音節列X2X3との間の距離dを用い、該距離d
は、各音節の組み合わせについてあらかじめ与えられた
2種の音節間距離dF(X1、X2)、dB(X1、X
s)を用いて草山されることを特徴とする。
Furthermore, the present invention uses the distance d between the syllable x1 and the syllable string X2X3 when comparing two patterns expressed as a syllable series or network, and
are the two types of inter-syllable distances dF(X1, X2) and dB(X1, X2) given in advance for each syllable combination.
s).

さらに、本発明は音節に関する系列ないしネットワーク
として表現された2つのパタンを照合するに際して、音
節x1と音節列X2X3との間の距離dを用い、該距離
dは各音節の組み合わせについてあらかじめ与えられた
3種の音節間距離dF(X1、X2)、dB(X1、X
a)、d’(X2.Xa)を用イテ算出すレルコとを特
徴とする。
Furthermore, the present invention uses the distance d between the syllable x1 and the syllable sequence Three types of inter-syllable distance dF (X1, X2), dB (X1,
a) and d' (X2.Xa).

(作用) 本発明の作用を2つのパタンがともに音節系列として表
わされている場合を例にとって説明する。
(Operation) The operation of the present invention will be explained by taking as an example the case where two patterns are both expressed as syllable sequences.

2つのパタンA、Bをそれぞれ A=(a(1)、・、a(i)、−、a(I))。Two patterns A and B respectively A=(a(1),·,a(i),−,a(I)).

B=(b(1)、・・・、bψ、・・・、b(J))と
する。ここでa(i)、b(j)は音節記号(具体的に
は番号)である。前掲の文献と類似の方法により、音節
8己号間距離dO(X1、X2)を導入することにより
パンA、Hのマツチングは次の通り動的計画法を利用し
て実現できる。
Let B=(b(1), . . . , bψ, . . . , b(J)). Here, a(i) and b(j) are syllable symbols (specifically, numbers). Using a method similar to the above-mentioned document, by introducing the distance dO (X1, X2) between syllables 8 and 8, matching of breads A and H can be realized using dynamic programming as follows.

初期条件:g(0,0)= O g(Oj)=co、j=1.・・・、J漸化式:  g
(i、j)=dO(a(i)、b(j))minlg(
i−1j)  ’1(1)・g(ij−1)  ’。
Initial conditions: g(0,0)=O g(Oj)=co, j=1. ..., J recurrence formula: g
(i,j)=dO(a(i),b(j))minlg(
i-1j) '1(1)・g(ij-1)'.

i=1.・・・、■ j=1.・・・、J 但しg(i、0) =■、i=1.・・・、■漸化式(
1)のマツチングパスは第2図(A)に示すようなもの
である。
i=1. ..., ■ j=1. ..., J However, g(i, 0) =■, i=1. ..., ■ Recurrence formula (
The matching path of 1) is as shown in FIG. 2(A).

次に音節X1と音節列X2X3との間の距離d(Xl;
Xs。
Next, the distance d(Xl;
Xs.

Xa)を定義する。この距離は音節X1が音節列X2X
3と置き換わって観測される確度を示すものとする。(
これと逆に音節列X2X3が音節X1と置き換わって観
測される確度を別に定義することができるが、以下の説
明では同じものとする)新たに定義された距離dに対し
ては第2図(B)に示されるようなりPの漸化式を用い
ることができる。
Define Xa). This distance is from syllable X1 to syllable string X2
3 to indicate the accuracy of observation. (
Conversely, the accuracy with which the syllable sequence X2X3 is observed replacing the syllable X1 can be defined separately, but in the following explanation it will be the same.) For the newly defined distance d, see Figure 2 ( A recurrence formula for P can be used as shown in B).

このような距離dの採用により音節系列間のマツチング
距離をコンチクストに依存した音節の変形のしやすさを
考慮したものとして求めることが可能となっている。
By employing such a distance d, it is possible to obtain a matching distance between syllable sequences that takes into account the ease with which syllables are deformed depending on the concatenation.

以上が本発明の第一の側面を述べたものであるが、上述
したように距離dは3次元配列データであるため、デー
タ量が大きい。日本語の音節数−100とすると100
3=106語の記憶容量を必要とする。本発明の第二、
第三の側面はこの記憶量の低減を意図するものである。
The first aspect of the present invention has been described above, and since the distance d is three-dimensional array data as described above, the amount of data is large. Number of syllables in Japanese - 100 = 100
Requires storage capacity of 3=106 words. Second of the present invention,
The third aspect is intended to reduce this amount of memory.

ここでは、音節X1と音節列X2X3の距離は次のよう
な近似的表現により記述される。
Here, the distance between the syllable X1 and the syllable string X2X3 is described by the following approximate expression.

d(Xl;Xs、Xs)ンdF(Xt、Xs) + d
B(XI、Xa)     (3)d(Xl;Xs、X
s)”dF(X1、Xs)+ dB(Xx 、Xs)+
d’(Xs、Xs)         (4)式(3)
ではdは、音節x1の前半部分と音節X2の距離dF(
X1、Xs)と音節x2の後半部分と音節X3の距離d
B(X1、Xs)の和として与えられる。このとき記憶
量は、1002X2:2X104であり、大巾な記憶容
量の低下となっている。
d(Xl;Xs,Xs) dF(Xt,Xs) + d
B(XI,Xa) (3)d(Xl;Xs,X
s)”dF(X1,Xs)+dB(Xx,Xs)+
d'(Xs, Xs) (4) Formula (3)
Then, d is the distance dF(
X1, Xs) and the distance d between the second half of syllable x2 and syllable X3
It is given as the sum of B(X1, Xs). At this time, the storage capacity is 1002X2:2X104, which is a significant decrease in storage capacity.

式(4)は式(3)に加え第3の項としてd’(Xs、
Xs)が付加されているが、これは音節列X2X3が1
音節として観測される確度を距離によって表現したもの
である。
Equation (4) has the third term d'(Xs,
Xs) is added, which means that the syllable string X2X3 is 1
The accuracy with which a syllable is observed is expressed by distance.

式(2)のdo、dあるいは式(3)、(4)のdF、
dB、dJは任意の方法によりあらかじめ与えられてい
ればよい。音韻論的な変形規則から求めることも実音声
がら求めることも可能である。
do and d in equation (2) or dF in equations (3) and (4),
dB and dJ may be given in advance by any method. It is possible to obtain it from phonological transformation rules or from real speech.

例えば次に示すような方法が考えられる。For example, the following methods can be considered.

(1)、音韻論的な変形規則によってd(Xl;Xs、
Xs)を求める。
(1), d(Xl;Xs,
Find Xs).

r [C]ya−[C]iya;[C] =任意の子音
1等の変形規則の集合を用意し、この集合にxl−X2
X3が含まれる場合にはd=1.0、その他の場合には
d=α($−1,0)とする。
r [C]ya-[C]iya; [C] = Prepare a set of transformation rules for any consonant 1, etc., and add xl-X2 to this set.
If X3 is included, d=1.0; otherwise, d=α($-1,0).

(2)、実音声を用いて音声バタン間のマツチングを実
際に行って(この場合、DP法による時間軸正規化マツ
チング法が利用できる)得られたマツチングスコアから
距離を求める。このような作業をすべての音節の組合せ
について実行することは効率的でないので、音韻論の観
点から変形の可能性かあ−る程度、考えられる組合せに
ついてのみ、実行することが実用的である。
(2) The distance is calculated from the matching score obtained by actually performing matching between the sound bangs using real speech (in this case, the time axis normalized matching method using the DP method can be used). Since it is not efficient to perform such an operation for all syllable combinations, it is practical to perform it only for combinations that have a certain degree of possibility of deformation from a phonological point of view.

(実施例) 本発明による一実施例を示すブロック図を第3図に示す
。図において、1,2はバタンバッファであり、それぞ
れバタン A=(a(1)、・・・、a(I)) B=(b(1)、・・・、b(J)) が格納されている。3は漸化式計算部であり、バッファ
1,2から順次記号a(i)、b(j)を読み出し漸化
式の計算を実行し、その結果しとて得られる積分量g(
ij)は積分量バッファ4に保持される。5は距離テー
ブルメモリであり、記号a(i)、b(i)等をアドレ
ス入力として受け、(2)式の距離値do及びdを出力
する。
(Embodiment) A block diagram showing an embodiment according to the present invention is shown in FIG. In the figure, 1 and 2 are the baton buffers, which store the batons A=(a(1),..., a(I)) B=(b(1),..., b(J)), respectively. has been done. 3 is a recurrence formula calculation unit, which sequentially reads symbols a(i) and b(j) from buffers 1 and 2, executes calculation of the recurrence formula, and calculates the integral amount g(
ij) is held in the integral amount buffer 4. A distance table memory 5 receives symbols a(i), b(i), etc. as address inputs, and outputs distance values do and d in equation (2).

距離テーブルメモリには、本発明の3つの側面に対応し
てそれぞれ次の内容が格納される。
The distance table memory stores the following contents corresponding to the three aspects of the present invention.

(i)3次元配列テーブルd(X1、Xs、Xs)及び
2次元配列テーブルd’(X1、Xs) (ii)  3つの3次元配列テーブルdF(X1、X
s)、dB(X1、Xs)。
(i) Three-dimensional array table d(X1, Xs, Xs) and two-dimensional array table d'(X1, Xs) (ii) Three three-dimensional array table dF(X1,
s), dB(X1, Xs).

do(X1、Xs) (iii) 4つの3次元配列テーブルdF(XI、X
s)、dB(XI、Xs)。
do(X1, Xs) (iii) Four three-dimensional array tables dF(XI,
s), dB(XI, Xs).

d’(X1、Xs)、do(X1、x2)漸化式計算部
2は(i)の場合には(2)式を実行するが(ii)、
(iii)の場合には(2)式に(3)、(4)式を代
入した次の式(2’ Xs“)をそれぞれ実行する。
d' (X1, Xs), do (X1, x2) The recurrence formula calculation unit 2 executes formula (2) in case (i),
In the case of (iii), the following equations (2'Xs") are executed by substituting equations (3) and (4) into equation (2).

最終的に1=Ij=Jで得られた積分量g(I、J)を
マツチング距離として出力する。
Finally, the integral amount g(I, J) obtained by 1=Ij=J is output as a matching distance.

以上本発明の原理を、パタンが音節系列として表わされ
ている場合を例にとって説明したが、本発明の原理は、
音節だけでなくその他の音声学的な単位に対してもその
まま適用可能である。このような単位としてはphon
eme(音素)、phone(音素よりさらに細かい単
位)、diphone(1ツのphoneから次のph
oneに至る区間を1つの単位としたもの)、demi
−syllable(1つの音節から次の音節に至る区
間を1つの単位としたもの)等が考えられる。
The principle of the present invention has been explained above using the case where the pattern is expressed as a syllable sequence, but the principle of the present invention is as follows.
It can be applied directly to not only syllables but also other phonetic units. Such a unit is phon
eme (phoneme), phone (a unit even finer than a phoneme), diphone (from one phone to the next ph)
one unit), demi
-syllable (one unit is an interval from one syllable to the next syllable), etc.

また本発明の原理はパタンが記号系列としてではなく記
号のネットワークとして表わされている場合にもそのま
ま適用可能である。
Further, the principles of the present invention can be directly applied even when a pattern is represented not as a symbol sequence but as a network of symbols.

例えば、2つのパタンA、BをそれぞれA=[(a(1
)、・、a(I));(t(i’ 、i))、i、i’
  =1.・、IIB=[(b(1)、・・・、b(J
));(S(j’  、j))jj’  =1.・・・
、Jlただし、I、Jはネットワークのノードの個数で
あり、t(i、i′)、5(jj′)はそれぞれノード
iからi′、ノードjからj′へのパスの存在の有無を
表わす。
For example, suppose two patterns A and B are respectively A=[(a(1
), ·, a(I)); (t(i', i)), i, i'
=1.・, IIB=[(b(1),...,b(J
)); (S(j', j))jj' = 1. ...
, Jl, where I and J are the number of nodes in the network, and t(i, i') and 5(jj') indicate the presence or absence of a path from node i to i' and from node j to j', respectively. represent.

t(i’ 、1)=1のときパスi’ −iが存在する
Q  II      II    Lないs(j’ 
=)=1のときパス了−jが存在するQ  n    
  n    シないこのとき (2)の漸化式のかわりに次の漸化式を用いることがで
きる。
When t(i', 1) = 1, path i' -i exists Q II II L not s(j'
When =)=1, there is a pass completion-j Q n
When n is not present, the following recurrence formula can be used instead of the recurrence formula (2).

(発明の効果) 以上述べたように、本発明によれば、音節の前後の環境
に依存した音節の変形を考慮した音節記号レベルでのマ
ツチングを行うことが可能となり、単語単位のパタンを
用意することなく高精度のマツチングを行う手段を大語
業音声認識の実現のために提供することが可能となる。
(Effects of the Invention) As described above, according to the present invention, it is possible to perform matching at the syllable symbol level, taking into account the deformation of syllables depending on the environment before and after the syllable, and to prepare patterns for each word. It becomes possible to provide a means for performing high-precision matching without having to perform a large amount of speech recognition.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は記号列のマツチングの一例を示す図、第2図(
A)、(B)はマツチングにおける漸化式の原理を説明
する図、第3図は本発明による一実施例を示すブロック
図である。 図中、 1.2・・・パタンバッファ 3・・・積分量バッファ 4・・・漸化式計算部 5・・・距離テーブルメモリ 抑へ キ  ゴ  ラ   カ・    (単語3半婁)i−
2j−/  メ
Figure 1 shows an example of matching symbol strings, Figure 2 (
A) and (B) are diagrams explaining the principle of recurrence formula in matching, and FIG. 3 is a block diagram showing an embodiment according to the present invention. In the figure, 1.2...Pattern buffer 3...Integral amount buffer 4...Recurrence formula calculation unit 5...Distance table memory storage (word 3 and a half) i-
2j-/Me

Claims (3)

【特許請求の範囲】[Claims] (1)、音節に関する系列ないしネットワークとして表
現された2つのパタンを照合するに際して、あらかじめ
各音節の組み合わせ(X_1、X_2、X_3)につい
て与えられた音節X_1と音節列X_2X_3との間の
距離d(X_1;X_2、X_3)を用いることを特徴
とするパタンマッチング方法。
(1) When comparing two patterns expressed as syllable sequences or networks, the distance d (d) between the syllable X_1 and the syllable sequence X_2 A pattern matching method characterized by using (X_1; X_2, X_3).
(2)、音節に関する系列ないしネットワークとして表
現された2つのパタンを照合するに際して、音節X_1
と音節列X_2X_3との間の距離dを用い、該距離d
は、各音節の組み合わせについてあらかじめ与えられた
2種の音節間距離d^F(X_1、X_2)、d^B(
X_1、X_3)を用いて算出されることを特徴とする
パタンマッチング方法。
(2) When matching two patterns expressed as sequences or networks regarding syllables, syllable X_1
and the syllable string X_2X_3, the distance d
is the two types of inter-syllable distances d^F(X_1, X_2) and d^B( given in advance for each syllable combination.
X_1, X_3).
(3)、音節に関する系列ないしネットワークとして表
現された2つのパタンを照合するに際して、音節X_1
と音節列X_2X_3との間の距離dを用い、該距離d
は各音節の組み合わせについてあらかじめ与えられた3
種の音節間距離d^F(X_1、X_2)、d^B(X
_1、X_3)、d^J(X_2、X_3)を用いて算
出されることを特徴とするパタンマッチング方法。
(3) When comparing two patterns expressed as sequences or networks regarding syllables, syllable X_1
and the syllable string X_2X_3, the distance d
is the 3 given in advance for each syllable combination.
Seed intersyllable distance d^F(X_1, X_2), d^B(X
_1, X_3), d^J(X_2, X_3).
JP61148580A 1986-06-24 1986-06-24 Pattern matching Granted JPS634299A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61148580A JPS634299A (en) 1986-06-24 1986-06-24 Pattern matching

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61148580A JPS634299A (en) 1986-06-24 1986-06-24 Pattern matching

Publications (2)

Publication Number Publication Date
JPS634299A true JPS634299A (en) 1988-01-09
JPH0577078B2 JPH0577078B2 (en) 1993-10-25

Family

ID=15455919

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61148580A Granted JPS634299A (en) 1986-06-24 1986-06-24 Pattern matching

Country Status (1)

Country Link
JP (1) JPS634299A (en)

Also Published As

Publication number Publication date
JPH0577078B2 (en) 1993-10-25

Similar Documents

Publication Publication Date Title
US5949961A (en) Word syllabification in speech synthesis system
EP0590925B1 (en) Method of speech modelling and a speech recognizer
JP3135233B2 (en) Robot hotel employee using voice recognition
EP0342630B1 (en) Speech recognition with speaker adaptation by learning
US4962535A (en) Voice recognition system
MXPA06003431A (en) Method for synthesizing speech.
EP0573553A1 (en) Method for recognizing speech using linguistically-motivated hidden markov models
WO1996023298A2 (en) System amd method for generating and using context dependent sub-syllable models to recognize a tonal language
Torkkola An efficient way to learn English grapheme-to-phoneme rules automatically
JPS6131477B2 (en)
JP2019159654A (en) Time-series information learning system, method, and neural network model
JP2841404B2 (en) Continuous speech recognition device
CN108846125A (en) Talk with generation method, device, terminal and computer readable storage medium
De Mori A descriptive technique for automatic speech recognition
JPS634299A (en) Pattern matching
Chowdhury et al. Bangla grapheme to phoneme conversion using conditional random fields
JP4125043B2 (en) Speech recognition apparatus, speech recognition method, and speech recognition program
EP0742546B1 (en) Speech recognizer
CN112786020A (en) Lyric time stamp generation method and storage medium
JPH0552506B2 (en)
Reddy Words into action II: A task-oriented system: Harpy is an experimental, continuous-speech recognition system that exploits a low-cost minicomputer
JPH01302295A (en) Word position detecting method and generating method for phoneme standard pattern
Mäntysalo et al. Handling Context-Dependencies in Speech by LVQ
JPH0414359B2 (en)
JPS60179799A (en) Voice recognition equipment