JPS59166999A - 音声過渡点検出方法 - Google Patents

音声過渡点検出方法

Info

Publication number
JPS59166999A
JPS59166999A JP58041203A JP4120383A JPS59166999A JP S59166999 A JPS59166999 A JP S59166999A JP 58041203 A JP58041203 A JP 58041203A JP 4120383 A JP4120383 A JP 4120383A JP S59166999 A JPS59166999 A JP S59166999A
Authority
JP
Japan
Prior art keywords
signal
parameter
circuit
detection
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58041203A
Other languages
English (en)
Other versions
JPH0552509B2 (ja
Inventor
曜一郎 佐古
雅男 渡
誠 赤羽
平岩 篤信
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP58041203A priority Critical patent/JPS59166999A/ja
Publication of JPS59166999A publication Critical patent/JPS59166999A/ja
Publication of JPH0552509B2 publication Critical patent/JPH0552509B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音声認識に使用して好適な音声過渡点検出方法
に関する。
背景技術とその問題点 音声認識においては、特定話者に対する単語認識による
ものがずでに実用化されている。これは認識対象とする
全ての単語につい一ζ特定話者にごれらを発音させ、バ
ンドパスフィルタバンク等によりその音響パラメータを
検出し−ζ記憶(登録)しておく。そして特定話者が発
声したときその音響パラメータを検出し、登録された各
単語の音響パラメータと比較し、これらが一致したとき
その単語であるとの認識を行う。
このような装置において、話者の発声の時間軸が登録時
と異なっている場合には、一定時間(5〜20m 5e
c)毎に抽出される音響パラメータの時系列を伸縮して
時間軸を整合させる。これによって発声速度の変動に対
処させるようにしている。
ところがこの装置の場合、認識対象とする全ての単語に
ついてその’R=%の全体の音響パラメータをあらかじ
め登録格納しておかなければならず、膨大な記憶容量と
演算を必要とする。このため認識語い数に限界があった
一方音韻(日本語でいえはローマ字表記したとき)A、
  I、 U、 E、 O,K、 S、 T等)あるい
は音節(KA、K 1.KU、等)単位での認識を行う
ことが提案されている。しかしこの場合に、母音等の準
定雷部を有する音韻の認識は容易であ、)でも、破裂音
(K、T、P等)のように音韻的特徴が非電に矩いもの
を音響パラメータのみで一つの音韻に特定することば極
めて困難である。
そごで従来は、各音節ごとに離散的に発音された音声を
登録し、離散的に発声された音声を単語認識と同様に時
間軸整合させて認識を行っており、特殊な発声を行うた
めに限定された用途でしか利用できなかった。
さらに不特定話者を認識対象とした場合には、音響パラ
メータに個人差による大きな分散かあり、−上述のよう
に時間軸の整合だけでは認識をIIうことかできない。
そごで例えば一つの単語について複数の音響パラメータ
を登録して近似の音響バラメークを認識する方法や、単
語全体を固定υ<7Gのパラメータに変換し、識別函数
によって判別よる方法が提案されているが、いづれも膨
大な記憔容量を必要としたり、演算量が多く、認識語い
数が極めて少くなってしまう。
これに対して本発明者は先に、不特定話者にス・[して
も、容易かつ確実に音声認識を行えるようにした新規な
音声認識方法を提案した。以1・にまずその−例につい
て説明しよう。
とごろで音韻の発声現象を観察すると、母音や摩擦音(
S、H等)等の音韻は長く伸して発声することができる
。例えば“はい゛という発声を考えた場合に、この音韻
は第1図Aに示すように、[無音→11→A→I−無音
」に変化する。これに対して同じ“はい′の発声を第1
図Bのように行つごともできる。ここでH,A、Iの準
定常部の長さは発声ことに変化し、これによって時間軸
の変動を生じる。ところがこの場合に、各音韻間の過渡
部(斜線でボず)は比鮫的時間軸の変動が少いことか判
明した。
そごで第2図において、マイクしIフォノ(11にイ共
給された音声信号がマイクアンプ(2)、5.5 kl
lzJJドのローパスフィルタ(3)を通し’(A −
D変換回路(4)に供給される。またクロック発生器(
5)からの12.5 KHz (80μsec間隔)の
サンプリングク1m+ 7りがA−D変換回路(4)に
供給され、ごのクィミングで音声信号がそれぞれ所定ビ
ット数(−1ワード)のデジタル信号に変換される。こ
の変換された音声信号が5×64ワードのレジスタ(6
)にイJ(給される。またクロック発生器(5)からの
5.12rn sec間隔のフレームクロックが5進カ
ウンタ(7)に供給され、このカウント値がレジスタ(
6)に供給され゛ζ音声信号が64ワードずつシフトさ
れ、シフ1〜された4×64ワードの信号がレジスタ(
6)から取り出される。
このレジスタ(6)から取り出された4 X 64−2
56ワードの信号が向速フーリエ変換(FFT)回路(
8)に供給される。ここでこのF F Tl路(8)に
おいて、例えばTの時間長に含まれるnflllIlの
ザンプリングデータによって表される波形函数をUnf
T(f)           町−il+としたとき
、ごれをフーリエ変換して、の信号が得られる。
さらにこのFFT回路(8)からの(1,y3−かパワ
ースペクトルの検出回ゼ8(9)に供給され、IU21
=Ui、、(f)+02n、(f)    、旧−・(
3)ツバワースベクトル信号が取り出される。ごごでフ
ーリエ変換された信号は周波数軸上で対称になっている
ので、フーリエ変換によって取り出されるrl (個の
データの半分は冗長データである。そこで半分のデータ
を排除して4− rr (個のデータが取り出される。
すなわち上述のF FTTlI8. [81に供給され
た 256ワートの信捗か変換されて 128ワードの
パワースペクトル信号が取り出される。
このパワースペクトル信号かエンファシス回路α0)に
供給されて聴感上の補止を行うだめの中み付げか行われ
る。ごごで止ミ付けとしζは、例えは周波数の面域成分
を増強する補iにが1rねれる。
この重み付けされた信−ぢが帯域分割回1?g、(11
)に供給され、聴感特性に合せた周波数メルスケールに
応して例えば32の帯域に分割される。ごごでパワース
ペクトルの分割点と異なる場合にはその信号が各帯域に
按分されてそれぞれの帯域の信号の量に応じた信号が取
り出される。これによって上述の128ワードのパワー
スペクトル信号が、音響的特徴を保存したまま32ワー
ドに圧縮される。
この信号が対数回路(12)に供給され、各信号の対数
値に変換される。これによって上述のエンファシス回路
αO)での重み付は等による冗長度が排除される。ここ
でこの対数パワースペクトル10g、 l Un x 
T (f) l        ・・・・・・(4)を
スペクトルパラメータx(++  (i = 0 、 
1−31)と称する。
このスペクトルパラメータx(1)力情11敗的フーリ
エ変換(DFT)回路(13)に供給される。ここでこ
のDFT回路(13)において、例えば分割された帯域
の数をMとすると、このM次元スペクトルパラメータx
a+  (i=o、1−M−1)を2M点の実数対称パ
ラメータとみなしてD F Tを行う。
i足っ゛で 2M m=o 、 1−−−2M−1 となる。さらにこのDFTを行う函数は遇函数とみなさ
れるため となり、これらより となる。このDFTによりスペクトルの包絡特性を表現
する音響パラメータが抽出される。
このようにしてDFTされたスペクトルパラメータX 
(i)について、0〜P−1(例えはP−8)次までの
P次元の値を取り出し、これをローカルパラメータL(
P)(p−0,1・・・P−1)とすると・・・・・・
(7) となり、ここでスペクトルパラメータが対称であること
を考慮して x(I)−’ x(2M−1−1)         
 ・・−・・(81とおくと、ローカルパラメータLω
)は但し、p=0.1・・・p−i となる。このようにして32ワードの信号がP(例えば
8)ワードに圧縮される。
このローカルパラメータL■がメモリ装置(14)に供
給される。このメモリ装置(14)は1行Pワードの記
憶部が例えば16行マトリクス状に配されたもので、ロ
ーカルパラメータLω)が各次元ごとに順次記憶される
と共に、上述のクロック発生器(5)からの5.12m
5ec間隔のフレームクロックが供給されて、各行のパ
ラメータが順次横方向ヘシフトされる。これによってメ
モリ装置(14)には5.12m5ec間隔のP次元の
ローカルパラメータL ’ (P)が16フレーム(、
81,92m sec )分記憶され、フレームクロッ
クごとに順次新しいパラメータに更新される。
さらに例えはエンファシス回路([l)からの信号が音
声過渡点検出回路(20)に供給されて音韻間の過渡点
が検出される。
この過渡点検出信号T (1)がメモリ装置(14)に
供給され、この検出信号のタイミンクに相当するローカ
ルパラメータLCP)が8番目の行にシフトされた時点
でメモリ装置(14)の読み出しが行われる。ここでメ
モリ装置(14)の読み出しは、各次7CPごとに16
フレ一ム分の信号か横方向に読み出される。そして読み
出された信号がD F T回路(15)に供給される。
このDFT回路(15)において上述と同様にDFTが
行われ、音響パラメータの字系列変化の包絡特性が抽出
される。このDFTされた信号の内から0−Q−1(例
えばQ=3)次までのQ次ノ乙の値を取り出す。このD
 F Tを各次元Pごとに行い、全体でPxQ(=24
)ワードの過渡点パラメータK(P、(1)(p=0.
1・・・P−1)(q=0゜1・・・Q−1)が形成さ
れる。ごごで、K (0,0)は定V!なので、p−0
のときにq=1−Qとしてもよい。
すなわち第3図において、第3図Aのような人力音声信
号(IAI)に対し゛ζζ第3已Bような過渡点が検出
されている場合に、この信号の全体のパワースペクトル
は第3図Cのようになっている。そして例えば1−H−
AJの過渡点のパワースペクトルが第3図りのようであ
ったとすると、この信号かエンファシスされて第3図E
のようになり、メルスケールで圧縮されて第3図Fのよ
っになる。この信号がD F Tされて第3図Gのよう
になり、第3図■1のように前後の16フレ一ム分がマ
トリックされ、この信号か順へ時間軸を方向にD F 
Tされて過渡点パラメータK O+、 Q)が形成され
る。
この過渡点パラメータK (P、 Q)かマハラノビス
距離算出回路(16)に供給されると共に、メモリ装置
(17)からのクラスタ糸数が回路(16)に供給され
て各クラスタ系数とのマハラノビス距離が算出される。
ここでクラスタ系数は複数の話者の発音から上述と同様
に過渡点パラメータを抽出し、これを音韻の内容に応じ
て分類し統計解析して得られたものである。
そしてこの算出されたマハラノビス距離が判定回路(1
8)に供給され、検出された過渡点が、何の音韻から何
の音韻への過渡点であるかが判定され、出力端子(19
)に取り出される。
ずなわぢ例えば“はい”いいえ”パ0 (ゼロ)〜“9
 (キュウ)”の12車語について、あらかじめ多数(
6Å以上)の話者の音声を前述の装置に供給し、過渡点
を検出し過渡点パラメータを抽出する。この過渡点パラ
メータを例えば第4図に示すようなテーブルに分類し、
この分類(クラスタ)ごとに統計解析する。図中*は無
音を示す。
これらの過渡点パラメータについて、任意のザ標で例え
ばa=lは*−+H,a=2はH→Aに対応する。nは
話゛者番号)として、共分散マトリクス Eはアンサンプル平均 を計数し、この逆マトリクス を求める。
ここで任意の過渡点パラメータKrとクラスタaとの距
離が、マハラノビスの距離 を求めて記憶しておくことにより、マハラノビス距離算
出回路(16)にて人力音声の過渡点パラメータとのマ
ハラノビス距離が算出される。
これによって回路(16)から人力音声の過渡点ごとに
各クラスタとの最小距離と過渡点の順位が取り出される
。これらが判定回!!t(18)に供給され、人力音声
が無声になった時点において認識判定を行う。例えば各
単語ごとに、各過渡点パラメータとクラスタとの最小距
離の平均値による単語距離を求める。なお過渡点の一部
脱落を考慮して各単語は脱落を想定した複数のタイプに
ついて単語距離を求める。ただし過渡点の順位関係がテ
ーブルと異なっているものはリジェクトする。そしてこ
の単語距離が最小になる単語を認識判定する。
従ってこの装置によれば音声の過渡点の音韻の変化を検
出しているので、時間軸の変動がなく、不特定話者につ
いて良好な認識を行うことができる。
また過渡点において上述のようなパラメータの抽出を行
ったことにより、一つの過渡点を例えば24次元で認識
することができ、認識を極めて容易かつロー確に行うこ
とができる。
なお上述の装置におい4120名の話者にて学習を行い
、この120名以外の話#にて上述12単語について実
験を行、った結果、98.2%の平均認識率が得られた
さらに上述の例で“はい゛のl H−A jと 8(ハ
ナ)”のf H−A Jは同しクラスタに分1+’i 
11J11シCある・従って認識すべき言倍の音韻数を
αとし゛(aPν(固のクラスタをあら力・し、めd1
労゛シ(=クラスタ係数をメモリ装置(17)に記憶さ
ゼご、1′、′GJは、種何1の単語の認識番こ通用で
き、多くの語いの認識を容易に行うことができる。
とごろで従来の過渡点検出としては例えば8饗パラメー
タ■、(ロ)の変化量の総和を用いる方法がある。すな
わちフレームごとにP次のバラメークが抽出されている
場合に、GフレームのパラメータをLω)(G)  (
p−0,1・・・P−1)としたときのような差分量の
絶対値の総和を利用して検出を行う。
ここでP1次元のときには、第5図A、13に示すよう
にパラメータL (P)  (G )の変化点において
パラメータT6つのピークが(2#らhる。ところが例
えばP=2次元の場合に、第5図C,DにンJM ’J
’0次、1次のパラメータ1.(+1)((ン) 、L
tl)(G)がF述と同様の変化であっても、それぞれ
の差分量の変化が第5図E、Fのようごあ、、た場合に
、パラメータT (Ijlのピークが2つになっ゛(過
渡点を一点に定めることができなくなってしまう。これ
は2次元以上のパラメータを取った場合に一般的に起こ
りうる。
また上述の説明ではtcp+CG)の変化は第5図Hの
ようになり、これから検出されたパラメータT(G)に
は第5図■に不すように多数の凹凸が生じてしまう。
このため上述の方法では、検出か不正確であると共に、
検出のレベルも不安定であるなど、種々の欠点があった
発明の目的 本発明はこのような点に鑑の、容易かつ安定な音声過渡
点検出方法を提供するものである。
発明の1llll要 本発明は人力音声信号を人間の聴覚特性に応じて等しく
重み付けして音響パラメータを抽出する手段と、この音
響パラメータのレベルに対して正規化を行う手段とを有
し、この正規化された音響パラメータを複数フレームに
亘って監視し、この複数フレームの平均値を求め、この
平均値よりのこの複数フレームの夫々の差を求めこれに
より、この音響バラメークのピークを検出するようにし
たもので、斯る本発明に依れば容易かつ安定な音声過渡
点を検出することができる。
実施例 以ドに図面を参照しながら本発明音声過渡点検出方法の
一実施例について説明しよう。
第6図において、第21図のエンファシス回路(Iωか
らの重め付けされた信号が帯域分割回路(2])に供給
され、上述と同様にメルスケールに応じてN(例えば2
0)の帯域に分割され、それぞれの帯域の信号の量に応
じた信号V(11) (n=0. 1・・・N−1)が
取り出される。この信号がバイアス付き対数回路(22
)に供給されて v’(n> −1og (V+n+ 十B )    
   −=uωが形成される。また信号V (n)が累
算回路(23)に供給されて が形成され、この信号Vaが対数回路(22)にイノ(
給されて V’a ”=  log(Va + B)      
−”’ (11)が形成される。そしてこれらの信号が
演算回路(24)に供給されて ■(〜−−VB −V(れ)       ・・・・・
・(工2)が形成される。
ここで上述のような信号V〔n)を用いるごとにより、
この信号は音韻から音韻への変化に対して各次(n−0
,1・・・N−1)の変化が同程度となり、音韻の種類
による変化量のばらつきを回避できる。
また対数をとり演算を行って正規化パラメータV (n
)を形成したことにより、人力音声のレベルの変化によ
るパラメータ■(旧の変動が排除される。さらにバイア
スBを加算して演算を行−2たことにより、仮りにB→
鈴とするとパラメータV+n)”Oとなることから明ら
かなように、入力音声の微少成分(ノイズ等)に対する
感度を士げるごとができる。
このパラメータV (n+がメモリ装置(25)に供給
されて2w+1 (、例えば9)フレーム分か記憶され
る。この記憶された信号が平均値を求める演算回路(2
6)に供給されて、平均値信号が形成され、この平均値
信号Yn、+とパラメータVθυが演算回路(27)に
供給されてイl、1.a:≧ 1 が形成される。このTcoが過渡点検出パラメータであ
って、ごのTり1)がピーク判別回路(28)に供給さ
れて、人力音声信号の音韻の過渡点が検出され、出力端
子(29)に取り出されて例えば第2図のメモリ装置(
14)の出力回路に供給される。
ここでパラメータT (+)が、フレームtを挾んで前
後Wフレームずつで定義されているので、不要な凹凸や
多極を生じるおそれがない。更に複数フレームの平均値
を求め、この平均値よりのこの複数フレームの夫々の巻
を求めこれより音響パラメータT (h+のピークを検
出するようにしているのでより安定し過渡点を検出でき
る。なお第7図は例えば″ゼロ″という発音を、ザンブ
リング周波数12.5 kllz、12ビツトデジタル
デークとし、5.12m5ecフレ一ム周期で256点
のF FTを行い、帯域数N−20、バイアスB−0、
検出フレーム数2W十1−9で上述の検出を行った場合
を示している。
第7図Aは音声波形、第7図Bは音韻、第7図工は検出
信号であって、[無音→ZJ  1−Z−+ElrE−
Rj  rR−OJ  r〇−無音」の各過渡部で顕著
なピークを発生ずる。ここで無音部にノイズによる多少
の凹凸が形成されるがこれはバイアスBを大きくするこ
とにより破線図不のように略0になる。
こうして音声過渡点が検出されるわけであるが、本発明
によれば音韻の種類や入力音声のレベルの変化による検
出パラメータの変動が少<、富に安定な検出を行うこと
ができる。
なお本発明は上述の新規な音声認識方法に限らず、検出
された過渡点と過渡点の間の定−71部を検出したり、
検出された過渡点を用い゛C定當部の時間軸を整合する
場合にも適用できる。また音声合成において、過渡点の
解析を行う場合などにも有効に利用できる。又本発明は
上述実施例に限らず本発明の要旨を逸脱することなくそ
の他種々の構成が取り得ることは勿論である。
発明の効果 本発明に依れば容易かつ安定に音声過渡点を検出するご
とができる利益がある。
【図面の簡単な説明】
第1図〜第4図は音声認識装置の例の説明に供する線図
、第5図は過渡点検出の説明に供する線図、第6図は本
発明音声過渡点検出方法の一例の系統図、第7図は本発
明の説明に供する線図である。 (1)はマイクロフォン、(3)はローパスフィルタ、
(4)はA−D変換回路、(5)はクロック発生器、(
6)はレジスタ、(7)はカウンタ、(8)は高速フー
リエ変換回路、(9)はパワースペクトル検出回路、G
o+はエンファシス回路、(21)は帯域分割回路、(
22)は対数回路、(23) 、  (24) 、  
(26) 、  (27)は演算回路、(25)はメモ
リ装置、(28)はピーク?lI別回路、(29)は出
力端子である。 手続補正書 (特許庁審判長            殿)■、小事
件表ンJく 昭和58年特許願第 41203  号2、発明の名称
  音声過渡点検出方法3、補正をする者 事件トノ関係4、’1’ :j’l出’!l!I’j 
人住所 東京部品用区北品用6’T I−17−if’
;35′弓名称(218)  ソニー株式会社 代表取締役 大 ’1)j−−1jlj、  力、11
4、代 理 人 東京都新宿区西Jli宿IT’ 1−
18番1号i′i山ヒル・TE++東!+’、’(03
)343 582+ 1代ノ、・(3388)  弁理
士 伊    藤    貞5、補止命令の1−]f・
]   昭111   年  月  116、袖正によ
り増加する発明の救 7、補 正 の ス・j 象  明細書の発明の詳細な
説明の’KAO(1)明細書中、第7頁15行〜第9頁
下から8行「を2M点の・・・・・・とがる。」とある
を次のように訂正する。 [を2M−1点の実数対称パラメータとみなして(2M
−2)点のDFTを行う。従ってm=o 、 1−’・
2M−3 となる。さらにこのDFTを−行う函数は通函数とみな
されるため Wm1= cos (M) 2M−22M−2 となり、これらより となる。このDFTによりスペクトルの包絡特性を表現
する音響パラメータが抽出される。 このようにしてDFTされたスペクトルパラメータX(
i)にライて、O−P’−1(例えハP =8)次まで
のP次元の値を取り出し、これをローカルパラメータL
(p)(p=o、1・・・P−1)とすると となり、ここでスペクトルパラメータが対称であること
を考慮して x(i)=x(2Nj−i−2)°°°°°(8)とお
くと、ローカルパラメータL(1)は) + x(M−1)ωS↓そ      ・・・・・(9
)但し、p=Q 、1・・・P−1 となる。」 (2)同、第10頁19行「字系列変化」とあるな「時
系列変化」に訂正する。 (3)同、第11頁5〜6行「定数なので」とあるな「
音声波形のパワーを表現しているのでパワー正規化のた
め」(コ訂正する。 (4)同、第12頁3行、4行及び5行に夫々「クラス
タ系数」とあるを夫々「クラスタ係数」に訂正する。 (5)同、第15頁9行「。LPz個」とあるを「C1
,P2個程度」に訂正する。 0 夫の差」に訂正する。 以   上

Claims (1)

    【特許請求の範囲】
  1. 入力音声信号を人間の聴覚特性に応じζ等しく重メ付け
    して音響パラメータを抽出する手段と、この音響パラメ
    ータのレベルに対して正規化を行う手段とを有し、この
    正規化された音響パラメータを複数フレームに亘って監
    視し、該複数フレームの平均値を求め、該平均値よりの
    上記複数フレームの夫々の差を求め、これにより上記音
    響パラメータのピークを検出するようにしたごとを特徴
    とする音声過渡点検出方法。
JP58041203A 1983-03-11 1983-03-11 音声過渡点検出方法 Granted JPS59166999A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58041203A JPS59166999A (ja) 1983-03-11 1983-03-11 音声過渡点検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58041203A JPS59166999A (ja) 1983-03-11 1983-03-11 音声過渡点検出方法

Publications (2)

Publication Number Publication Date
JPS59166999A true JPS59166999A (ja) 1984-09-20
JPH0552509B2 JPH0552509B2 (ja) 1993-08-05

Family

ID=12601854

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58041203A Granted JPS59166999A (ja) 1983-03-11 1983-03-11 音声過渡点検出方法

Country Status (1)

Country Link
JP (1) JPS59166999A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59170897A (ja) * 1983-03-17 1984-09-27 ソニー株式会社 音声過渡点検出方法
JPS59174899A (ja) * 1983-03-25 1984-10-03 ソニー株式会社 音声過渡点検出方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58145999A (ja) * 1982-02-25 1983-08-31 ソニー株式会社 音声認識方法
JPS58145998A (ja) * 1982-02-25 1983-08-31 ソニー株式会社 音声過渡点検出方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58145999A (ja) * 1982-02-25 1983-08-31 ソニー株式会社 音声認識方法
JPS58145998A (ja) * 1982-02-25 1983-08-31 ソニー株式会社 音声過渡点検出方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59170897A (ja) * 1983-03-17 1984-09-27 ソニー株式会社 音声過渡点検出方法
JPH0552510B2 (ja) * 1983-03-17 1993-08-05 Sony Corp
JPS59174899A (ja) * 1983-03-25 1984-10-03 ソニー株式会社 音声過渡点検出方法
JPH0552511B2 (ja) * 1983-03-25 1993-08-05 Sony Corp

Also Published As

Publication number Publication date
JPH0552509B2 (ja) 1993-08-05

Similar Documents

Publication Publication Date Title
KR910002198B1 (ko) 음성인식방법과 그 장치
Ranjan et al. Analysis of feature extraction techniques for speech recognition system
Chougule et al. Robust spectral features for automatic speaker recognition in mismatch condition
JPH0312319B2 (ja)
JPS59166999A (ja) 音声過渡点検出方法
Zhang et al. Advancements in whisper-island detection using the linear predictive residual
JPH0441357B2 (ja)
Saxena et al. Extricate Features Utilizing Mel Frequency Cepstral Coefficient in Automatic Speech Recognition System
Berjon et al. Frequency-centroid features for word recognition of non-native English speakers
Garg et al. Minimal Feature Analysis for Isolated Digit Recognition for varying encoding rates in noisy environments
Artimy et al. Automatic detection of acoustic sub-word boundaries for single digit recognition
JPH0552510B2 (ja)
JPS59172697A (ja) 音声過渡点検出方法
JPS59171999A (ja) 音声認識方法
JPS6069697A (ja) 音声認識装置
JPS6069696A (ja) 音声認識装置
JPH0552511B2 (ja)
JPH0546560B2 (ja)
JPS6086599A (ja) 音声認識装置
JPH0552512B2 (ja)
JPS5994800A (ja) 音声認識装置
JPS58146000A (ja) 音声認識方法
JPS59170896A (ja) 音声認識方法
JPH0552515B2 (ja)
JPS60115996A (ja) 音声認識装置