JPS59174899A - 音声過渡点検出方法 - Google Patents

音声過渡点検出方法

Info

Publication number
JPS59174899A
JPS59174899A JP58049766A JP4976683A JPS59174899A JP S59174899 A JPS59174899 A JP S59174899A JP 58049766 A JP58049766 A JP 58049766A JP 4976683 A JP4976683 A JP 4976683A JP S59174899 A JPS59174899 A JP S59174899A
Authority
JP
Japan
Prior art keywords
signal
circuit
supplied
transition point
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58049766A
Other languages
English (en)
Other versions
JPH0552511B2 (ja
Inventor
曜一郎 佐古
雅男 渡
誠 赤羽
平岩 篤信
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP58049766A priority Critical patent/JPS59174899A/ja
Publication of JPS59174899A publication Critical patent/JPS59174899A/ja
Publication of JPH0552511B2 publication Critical patent/JPH0552511B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音声認識に使用して好適な音声過渡点検出方法
に関する。
背景技術とその問題点 音声認識においては、特定話者に対する単語認識による
ものがすでに実用化されている。これは認識対象とする
全ての単語について特定話者にこれらを発音させ、パン
トノやスフィルタパンク等によりその音響・!ラメータ
を検出して記憶(登録)しておく。そして特定話者が発
声したときその音響・ぐラメータを検出し、登録された
各単語の音響・ぐラメータと比較し、これらが一致した
ときその単語であるとの、認識を行う。
このような装置において、話者の発声の時間軸が登録時
と異なっている場合には、一定時間(5〜20 m5e
c )毎に抽出される音響ノクラメータの時系列を伸縮
して時間軸を整合させる。これによって発声速度の変動
に対処させるようにしている。
ところがこの装置の場合、認識対象とする全ての単語に
ついてその単語の全体の音響・セラメータをあらかじめ
登録格納しておかなければならず、膨大な記憶容量と演
算を必要とする。このだめ認識語い数に限界があった。
一方音韻(日本語でいえばローマ字表記したときのA、
I 、U、E、0.に、S、T等)あるいは音節(KA
、KI 、KU等)単位での認識を行うことが提案され
ている。
しかし、各音節ごとに離散的に発音された音声を登録し
、離散的に発声された音声を単語認識と同様に時間軸整
合させて認識を行っておシ、特殊寿発声を行うために限
定された用途でしか利用できなかった。
さらに不特定話者を認識対象とし2だ場合には、音響・
ぐラメータに個人差による大きな分散があり、上述のよ
うに時間軸の整合だけでは認識を行うこ□とができない
。そこで例えば一つの単語について複数の音響・セラ′
メータを登録して近似の音響・ぞラメータを認識する方
法や、単語全体を固定次元の・ぞラメータに変換し、識
別函数によって判別する方法が提案されているが、いず
れも膨大な記憶容量を必要としたシ、演算量が多く、4
識語い数が極めて少くな゛らてしまう。
これに対して本願発明者は先に、不特定話者に対しても
、容易かつ確実に音声認識を行えるようにした新規な音
声認識方法を提案した。以下にまずその一例について説
明しよう。
ところで、音韻の発声現象を観察すると、母音や摩擦音
(8,H等)等の音韻は長く伸して発声することができ
る。例えば゛はい″という発声を「無音→H−+A→■
→無音」に変化する。これに対して同じ゛はい″の灸、
声を第1図Bのように行うこともできる。ここでH,A
、Iの準定常部の長さは発声ごとに変化し、これによっ
て時間軸の変動を生じる。ところがこの場合に、各音韻
間の過渡部(斜線で示す)は比較的時間軸の変動が少い
ことが判明した。
そこで第2図において、マイクロフォン(1)に供給さ
れた音声信号がマイクアンプ(235,5kHz以下の
ローパスフィルタ(3)を通じてAD変換回路(4)に
918給される。まだクロック発生器(5)からの12
.5kl−(z (80μsec間隔)のサンプリング
クロックがAI)変換回路(4)に供給され、このタイ
ミングで音声(j号がそれぞれ所定ビット数(=1ワー
ド)のデノタル信号に変換される。この変換された音声
信号が5×64ワードのレジスタ(6)に供給される。
1だクロック発生器(5)からの5.12 m5ec間
隔のフレームクロックが5進カウンタ(力に供給され、
このカウント値がレジスタ(6)に供給されて音声信号
が64ワードずつシフトされ、シフトされた4×64ワ
ードの信号がレジスタ(6)から取り出される。
このレジスタ(6)から取り出された4X64 = 2
56ワードの信号が高速フーリエ変換(FET)回路(
8)に供給される。ここでこのFET回路(8)におい
て、例えばTの時間長に含まれるn(個のサンブリング
データによって表される波形函数を U n (t(f)             ・・・
・・・・・・・・・・・・(1)としたとき、これをフ
ーリエ変換して、= U xn ft(f)十j Uz
n (t(f)    ・・・・・・・・・・・・・・
・(2)の信号が得られる。
さらにこのFB/T回路(8)からの信号がパワースペ
クトルの検出回路(9)に供給され、 l U 21 = ty?n ft(f) + Urn
 ft(f)    −−−−−−(3)のノセワース
ペクトル信号が取り出される。ここでフーリエ変換され
た信号は周波数軸上で対称になっているので、フーリエ
変換によって取シ出されるn(個のデータの半分は冗長
データである。そこで半分のデータを排除して−zn(
個のデータが取り出される。すなわち上述のFET回路
(8)K供給された256ワードの信号が変換されて1
28ワードの/4’ワースベクトル信号が取り出される
。  ゛この/4’ソースベクトル信号がエンファシス
回路(Iolに供給されて聴感上の補正を行うだめの重
み付けが行われる。ここで、重み付けとしては、例えば
周波数の高域成分を増強する補正が行われる。
この重み付けされた信号が帯域分割回路αN)に供給さ
れ、聴′感特性に合せた周波数メルスケールに応じて例
えば32の帯域に分割される。ここでツクワース被りト
ルの分割点と異なる場合にはその信号が各帯域に按分さ
れてそれぞれの帯域の信号の量に応じた信号が取シ出さ
れる。これによって上述の128ワードの・ぐワースベ
クトル信号が、音響的特徴を保存したまま32ワードに
圧縮される。
この信号が対数回路021に供給され、各信号の対数値
に変換される。これによって上述のエンファシス回路(
10)での重み付は等による冗長度が排除される。ここ
でこの対数/ぞワースベクトル”g I Unlr(f
) I           ・・・・・・・・・・・
・・・・(4)をスペクトルパラメータxに)(i=o
、t・・・31)と称する。
このスペクトルパラメータX(i)が離散的フーリエ変
換(DFT)回路(131に供給される。ここで、この
DFT回路0階において、例えば分割された帯域の数を
Mとすると、このM次元スペクトル・ぐラメータx(H
) (i = 0 、1−M−1)を2M点ノ′寿数対
称−8う7−タとみなしてDFTを行う。従って、但し
、釦Δ=e13“2019 M m = Q 、 l 、−・、 2M−1となる。さら
にこのDFTを行う函数は偶函数と仏なされるため W呪=邸(上枝り となシ、これらよシ となる。このD F Tにょ9スペクトルの包絡特性を
表現する音・讐パラメータが抽出される。
このようンcして1) F Tされたスペクトラム・?
ラメータX(i)について、0−P−1(例えばP−8
)次までのP次元の値を取シ出し、これをローカル・セ
ラメータL(p+−(p = o、 1.・・・、p−
1)とすると・・・・・・・・・・・・・・・(力 となシ、ここでスペクトルパラメータが対称であること
を考慮して X(i) ” X (2トi−1)         
・曲・曲回・(8)とおくと、ローカル・リメータLω
)はLω)=1蛋。X(i)(ax−□十−澄〜x、町
(9)但し、p=o、1.・・・、P−1 となる。このようKして32ワードの信号がP(例えば
8)ワードに圧縮される。
このローカルノ母うメータLω)がメモリ装置Oaに供
給される。このメモリ装置(I4)は1行Pワードの記
憶部が例えば16行マ) リクス状に配されたもので、
ローカル・リメータL(p)が各次元ごとに順次記憶さ
れると共に、上述のクロック発生器(5)からの5.1
2m s e c間隔のフレームクロックが供給されて
、各行のノやラメータが順次横方向ヘシフトされる。こ
れKよってメモリ装置(141には5.12 m5ec
間隔のP次元のローカルノやラメータL(p)が16フ
レーム(81,92m5e()分記憶され、フレームク
ロックごトK $ 次新しい・ぐラメータ例更新される
さらに例えばエン7アシス回路aOIがらの信号が音声
過渡点検出回路(イ)に供給されて音韻間の過渡点が検
出される。
この過渡点検出信号TI t)がメモリ装置(14)に
供給され、この検出信号のタイミングに相当するローカ
ルノeラメータL(1)が8番目の行にシフトされた時
点でメモリ装置ミルの読み出しが行われる。ζこでメモ
リ装置04)の読み出しは、各次元Pごとに16フレ一
ム分の信号が横方向に読み出される。そして読み出され
た信号がI) F’ T回路05)に供給される。
この回路(1つにおいて上述と同様にDFTが行われ、
音響パラメータの時系列変化の包絡特性が抽出される。
このDFTされた信号の内から0〜Q−1(例えばQ=
3)次までのQ次元の値を取り出す。このDFTを各次
元Pごとに行い、全体でPxQ(=24)ワードの過渡
点パラメータK(p、q) (p=o 、 1 。
・・・、P−t )(q=oe It・・・、Q−1)
が形成される。
ここで、K(0,0)は定数なので、p−0のときにq
=1〜Qとしてもよい。
すなわち第3図において、Aのような入力音声信号(I
AI)に対してBのような過渡点が検出されている場合
に、この信号の全体のノンワース被りトルはCのように
なっている。そして、例えば「H→A」の過渡点のパワ
ース被りトルがDのようであったとすると、この信号か
エンファシスされてEのようになり、メルスケールで圧
縮されてFのようになる。この信号がI) F Tされ
てGのようになシ、Hのように前後の16フレ一ム分が
マトリックされ、この信号が順次時間軸を方向にDFT
されて過渡点パラメータK(p、q)が形成される。
この過渡点ノセラメータK(p、q)がマノ・マノビス
距離算出回路0Qに供給されると共に、メモリ装置CD
からのクラスタ係数が回路(16)に供給されて各クラ
スタ係数とのマノ・マノビス距離が算出される。ここで
クラスタ係数は複数の話者の発音から上述と同様に過渡
点・ぐラメータを抽出し、これを音韻の内容に応じて分
類し統計解析して得られたものである。
そしてこの算出されたマノ・マノビス距離が判定回路α
砂に供給され、検出された過渡点が、何の音韻から何の
音韻への過渡点であるかが判定され、出力端子09に取
り出される。
すなわち例えば゛はい゛いいえ”0(ゼロ)”〜゛9(
キュウ)nの12単語について、あらかじめ多数(百Å
以上)の話者の音声を前述の装置に供給し、過渡点を検
出し過渡点・2ラメータを抽出する。この過渡点・やラ
メータを例えば第4図に示すようなテーブルに分類し、
この分類(クラスタ)ごとに統計解析する。図中*は無
音を示す。
これらの過渡点・ぞラメータについて、任意のす(a) ンゾルRr、。(r=1.1−124)(aはクラスタ
指標で例えばa = 1は* −+ I−1、a = 
2はH−+Aに対応する。nは話者番号)として、共分
散マトリクス Ar、5= E (Rr(?)n−研) (R,”、、
−p) −−−−−−== (151−回 但し、町 −E(ar(aln) Eはアンサンプル平均 を計数し、この逆マトリクス BrLプ’ −(At、u )r、S       ・
・・・・・・・・・・・・・・(16)を求める。
ここで任意の過渡点・セラメータに、とクラスタaとの
距離が、マハラノビスの距離 で求められる。
従って、メモリ装置07)に上述のBr、s及びpを(
ω 求めて記憶しておくことにより、マハラノビス距離算出
回路(IE9にて入力音声の過渡点・セラメータとのマ
ハラノビス距離が算出される。
これによって回路0Qから入力音声の過渡点ごとに各ク
ラスタとの最小距離と過渡点の11h位が取り出される
。これらが判定回路08)に供給され、入力音声が無声
になった時点において認識判定を行う。
例えば各単語ごとに、各過渡点パラメータとクラスタと
の最小距離の平方根の平均値による単語距離を求める。
なお過渡点の一部脱落を考慮して各単語は脱落を想定し
た複数のタイプについて単語距離を求める。ただし過渡
点の順位関係がテーブルと異なっているものはリジェク
トする。そしてこの単語距離が最小になる単語を認識判
定する。
従ってこの装置によれば音声の過渡点の音韻の変化を検
出しているので、時間軸の変動がなく、不特定話者につ
いて良好な認識を行うことができる。
また過渡点において上述のようなノセラメータの抽出を
行ったと、とにより、一つの過渡点を例えば24次元で
認識することができ、認識を極めて容易かつ正確に行う
ことができる。
なお上述の装置において120名の話者にて学習を行い
、この120名以外の話者にて上述12単語について実
験を行った結果、98.2%の平均認識率が得られた。
さらに上述の例で“はい”の「H−+AJと”8(ハチ
)#の「H→A」は同じクラスタに分類可能である。従
って、認識すべき言語の音韻数をαとしてαP2個のク
ラスタをあらかじめ計算してクラスタ係数をメモリ装置
(17)に記憶させておけば、種々の単語の認識に適用
でき、多くの語いの認識を容易に行うことができる。
本発明は、このような装置において、検出回路(1)に
使用して好適な音声過渡点検出方法に関する。
ところで、従来の過渡点検出としては例えば音響ノラメ
ータL(p)の変化量の総和を用いる方法がある。すな
わちフレームごとにP次の・2ラメータが抽出されてい
る場合に、GフレームのパラメータをL(p)(’l(
p=o 、 l・・・・・・P−1)としたときのよう
な差分量の絶対値の総和を利用して検出を行う。
ここで、例えばP=1次元のときには、第5図A、Bに
示すように・ぞラメータL(p)(G)の変化において
ノセラメータT(G)のピークが得られる。
尚、上述の説明ではL(1)◎を連続量としたが、実際
にはこの/4’ラメータL(p)0は離散量である。し
かし、−1このような音声捻識装置にあっては所定のM
フレームずつの分析で1次元・ぐラメータにおとしてお
υ急峻な変化にパラメータの値がついていけず、無音か
ら口腔内の閉鎖部に空気流を吹き付けて生ずる破裂性子
音への過渡点の検出はほとんど不可能であった。
発明の目的 本発明はかかる点に鑑み、無音から破裂性子音への過渡
点の検出を良好に行なえるようにした音声過渡点検出方
法を提供せんとするものである。
発明の概要 本発明音声過渡点検出方法は、入力音声信号を人間の聴
覚特性に応じて等しく重み付けして音響・セラメータを
抽出する手段と、この音響・セラメータのレベルに対し
て正規化を行う手段とを有し、この正規化された音卿・
セラメータを所定の検数フレームの組を複数組に亘って
監視し、上記音響・ぐラメータのピークを検出するよう
にしたもので、無音から破裂性子音への過渡点を良好に
検出できるようにしたものである。
実施例 以下、第6図を参照じ−で本発明音声認識装置の一実施
例について説明しよう。この第6図において、第2図に
対応する部分には同一符号を付しそれらの詳細な説明は
省略する。
第6図において、第2図のエンファシス回路lIC1)
からの重み付けされた信号が帯域分割回路t2υに供給
され、上述と同様にメルスクールに応じてN(例え〈2
0)の帯域に分割され、それぞれの帯域の信号の量に応
じた信号Vω)(n、=o、I・・・N−1)が取シ出
される。この信号がバイアス付き対数回路C2に供給さ
れて V’(n)= log (V(n)十B )     
   =・曲回面11(Jlが形成される。また信号V
(n)が累積回路(ハに供給されて て τ’a= log (V2+B )        ・
・・・・・・・・四・・0υが形成される。そして、・
これらの信号が演算回路0(イ)に供給されて υ(n) =τ′2−υ’(rl)         
    ・・・・・川・・・・・・・+12)が形成さ
れる。
ここで、上述のような信号V(。)を用いることにより
、この信号は音韻から音韻への変化に対して各法(n−
Or 1・・・・・・N−1)の変化が同程度となり、
音韻のr上類による変化量のばらつきを回避できる。
才だ対数をとり演算を行って正規化・2ラメータυ(n
)を形成したことによシ、入力音声のレベルの変化によ
るパラメータvo)の変動が排除される。さらにバイア
スBを加算して演算を行ったことにより、仮りにB−+
ωとするとノぐラメータτω)→0となることから明ら
かなように、入力音声の微少成分(ノイズ等)に対する
感度を下げることができる。
この・ξラメ−タラ(n)がメモリ装置(29に供給さ
れて2w+1 (w=4として、例えば9)フレーム分
が記憶される。この記憶された信号が演算回路(淘に供
給されて、 Yn、 t=  min  (t+(n) (I ) 
)     −−f13)6GFN 但し、GFN= (I ; −w+ t≦■≦w+t)
が形成され、この信号と・ぞラメータυ(n)が演算回
路(2′Dに供給されて、 が形成される。このTI(t)が、第1の過渡点検出・
ぞラメータであって、この第1の過渡点検出パラメータ
Tx(t)が第1のピーク検出回路(28)に供給され
て、入力音声信号の所定の音韻の過渡点の過渡魚信もが
加算回路に供給される。
また、・ぞラメータτω)がメモリ装置i?#、(25
’)にも供給されて2(w−a)+1(例えばO(a 
= 2として5)フレーム分が記憶される。この記憶−
された信号が演算回路(26’)に供給されて、 Yn、t=min(v(n)(I))    −=曲・
・−<13つ!(三〇FN 但し、GFN−(I ;−(w−a)十t≦■≦(w−
a)+t)が形成され、この信号と・セラメータυ(n
)が演算回路(27’)に供給されて、 ・・・−・・・・・・・・(14’) が形成される。こと・で、aの大きさは無音がら破裂性
子音への過渡点についても急峻に/セラメータの値が変
化して、・ぞラメータの値から過渡点が検出できるよう
な大きさとする。このT2(t)が、第2の赤渡点検出
・セラメータであって、このT2(t)が第2のピーク
検出回路(28’)に供給されて、入力音声信号の例え
ば無音から破裂音への急峻な変化に係る過渡点が検出さ
れて、スイッチ回路器がオンのときには加算回路側に過
渡点が検出されたことを伝達する過渡点信号を加算回路
[有]に供給するようにする。ここで、スイッチ回路(
291は、次なるとき”ON″となるようにする。即ち
、演算回路(27’)からの第2の過渡点検出・ぞラメ
ータT2(t)がレベル検出回F!613υにおいて設
定しである所定の閾値を越えタトキ、モノマルチバイブ
レータ(32よシ所定長(例えば5フレ一ム分の長さ)
の制御・千ルスを発生するようにし、この所定長の制御
ijルスがスイッチ回路(2!1に供給されている間ス
イッチ回路(2ωのスイッチをオンとするようにする。
そして、第2の過渡点検出パラメータT2(t)が所定
の閾値を越え、スイッチ回路器が−ON”となっている
間に第2のピーク検出回路(28’)から過渡点信号が
スイッチ回路(ハ)に供給されたときには、かかる過渡
点信号が加算回路■にそのまま供給されることになる。
それゆえ第1のピーク検出回路(2印から過渡点信隻が
通常良好に発生しない、無音から破裂性子音への過渡点
についても、第2のピーク検出回路(28’)からの過
渡点信号が加算回路□□□を経て出力端子間から取り出
されることになる。
尚、他の部分は第2図と同様の構成を採るものとする。
このように構成された本実施例に依れば、音響パラメー
タを所定の複数フレームの組に亘って複数組監視して、
第1及び第2の過渡点検出・2ラメータTI(t)及び
T2(t)を得だ上でそれらのレベルより過渡点信号を
得るようにしたので、無音から破裂性子音への過渡点に
ついては第2のピーク検出回路(28’)よシの過渡点
信号が出力端子(至)に供給され、無音から破裂性子音
への過渡点の検出を良好に行なえるようにできる利益が
ある。
尚、本発明は上述実施例に限らず本発明の要旨を逸脱す
ることなくその他種々の構成とできることは勿論である
発明の効果 以上述べたように本発明音声過渡点検出方法によれば、
音響・セラメータを所定の複数フレームの組に亘って複
数組監視するようにしたので無音から破裂性子音への過
渡点の検出を良好に行なえる利益がある。
【図面の簡単な説明】
第1図〜第4図は音声認識装置の訣明のだめの図、第5
図は過渡点検出の説明のための図、第6図は本発明音声
過渡点検出方法の一例の系統図である。 (1)はマイクロフオy、(31はローパスフィルタ、
(4)けAD変換回路、(5)はクロック発生器、(6
)はレジスタ、(7)はカウンタ、(8)は高速フーリ
エ変換回路、(9)は・ぞワースベクトル検出回路、0
■はエンファシス回路、、 (21+は帯域分割回路、
(2渇は対数回路、(231゜(2旬、いr 、 QT
、は演算回路、(25)はメモリ装置、C樽、(28つ
はピーク検出回路、(2湧はスイッチ回路、(:!Aは
加算回路、Gυはレベル検出回路、Gzはモノマルチ・
ぐイブレータ、(至)は出力端子である。 第4凶 手続補正書 昭和58年9 月 271:1 16′許庁長官若杉和夫殿 (午4−1)午ハ′審1男L(殿) 1、事f′1の表小 昭和58年特許願第 49766  号2°発明F) 
名称   音声過渡点検出方法3、袖−正をする名。 事件との関係   ’41’ i!’l出IMri 人
f、i、rすi 東京部品用区北品用6丁1,17番3
5号名称(2]8i  ソニー(末式会イj代表取締没
 大 賀 典 )11゜ 5、袖止命分の11イ・]   昭fIJ   年  
月  116、袖正により増加する発明の故 7、袖 止 の 月 撃  明細書の発明の詳細な説明
の欄。 !  I−IQ  O−、r  1 (II  明細書中、第7頁第9行から第10行Kかけ
て、「2M点の実数対称パラメータとみなしてDFTを
行う。」とあるをr2M−1点の実数対称パラメータと
みなして2M−2点のDFTを行う。」に訂正する。 (2)同、第7頁第11行において、 とあるを、 に訂正する。 (3)  同、第7頁第12行を削除する。 (4)同、第7頁第13行から第14行にかけて、m=
o、l、・−・、zM−1」 とあるな m=0.1.・h、2M−3J に訂正する。 (5)同、第8頁第1行ないし第2行において、とある
を、 に訂正する。 (6)同、第8頁第4行において、 とあるな、 に訂正する。 (7)同、第8頁第11行において、 とあるを、 に訂正する。 (8)同、第8頁第12行及び第13行を削除する。 (9)  同、第9頁第2行において、「x(1)= 
x (zM−i−t)   Jとあるを、「X(i)=
 X (2M−i−2)   Jに訂正する。 0■ 同、第9頁第4行において、 ・・・・・(9)」 とあるを、 π’p、、。 十X(M−1)CQS −−−(9r M−I      J に訂正する。 (ill  同、第10頁第17行において、「定数な
の匂−とあるな、「音声波形の〕(ワーを表現している
のでパワー正規化のため」に訂正する。 O2同、第11頁第7行から第8行にかけて、「マトリ
ックされ」とあるな、「マトリックスされ」に訂正する
。 (+31  同、第14頁第17行において、「αP2
個のクラスタ」とあるを、「αP2個程度のクラスタ」
に訂正する。 O41同、第19頁第1行において、 とあるを、 に訂正する。 09 同、第19頁第15行において、とあるを、 に訂正する。 以上

Claims (1)

    【特許請求の範囲】
  1. 入力音声信号を人間の聴覚特性に応じて等しく重み付け
    して音響・92メ一ぞを抽出する手段と、この音響パラ
    メータのレベルに対して正規化を行う手段とを有し、こ
    の正規化された音響・そラメータを所定の複数フレーム
    の組を複数組に亘って監視し、上記音響・ぐラメータの
    ピークを検出するようにした音声過渡点検出方法。
JP58049766A 1983-03-25 1983-03-25 音声過渡点検出方法 Granted JPS59174899A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58049766A JPS59174899A (ja) 1983-03-25 1983-03-25 音声過渡点検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58049766A JPS59174899A (ja) 1983-03-25 1983-03-25 音声過渡点検出方法

Publications (2)

Publication Number Publication Date
JPS59174899A true JPS59174899A (ja) 1984-10-03
JPH0552511B2 JPH0552511B2 (ja) 1993-08-05

Family

ID=12840292

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58049766A Granted JPS59174899A (ja) 1983-03-25 1983-03-25 音声過渡点検出方法

Country Status (1)

Country Link
JP (1) JPS59174899A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58145988A (ja) * 1982-02-25 1983-08-31 日本電気株式会社 陰極線管図形表示装置
JPS58145999A (ja) * 1982-02-25 1983-08-31 ソニー株式会社 音声認識方法
JPS59166999A (ja) * 1983-03-11 1984-09-20 ソニー株式会社 音声過渡点検出方法
JPS59170897A (ja) * 1983-03-17 1984-09-27 ソニー株式会社 音声過渡点検出方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58145988A (ja) * 1982-02-25 1983-08-31 日本電気株式会社 陰極線管図形表示装置
JPS58145999A (ja) * 1982-02-25 1983-08-31 ソニー株式会社 音声認識方法
JPS59166999A (ja) * 1983-03-11 1984-09-20 ソニー株式会社 音声過渡点検出方法
JPS59170897A (ja) * 1983-03-17 1984-09-27 ソニー株式会社 音声過渡点検出方法

Also Published As

Publication number Publication date
JPH0552511B2 (ja) 1993-08-05

Similar Documents

Publication Publication Date Title
KR910002198B1 (ko) 음성인식방법과 그 장치
Patil et al. Automatic Speech Recognition of isolated words in Hindi language using MFCC
JP2001166789A (ja) 初頭/末尾の音素類似度ベクトルによる中国語の音声認識方法及びその装置
Devi et al. A novel approach for speech feature extraction by cubic-log compression in MFCC
JPS61177494A (ja) 音声認識装置
Saksamudre et al. Isolated word recognition system for Hindi Language
JPS59174899A (ja) 音声過渡点検出方法
JPH0441357B2 (ja)
Koolagudi et al. Spectral features for emotion classification
Berjon et al. Frequency-centroid features for word recognition of non-native English speakers
Kanke et al. Enhanced Marathi Speech Recognition Using Double Delta MFCC and DTW
Kalaiarasi et al. Performance Analysis and Comparison of Speaker Independent Isolated Speech Recognition System
Garg et al. Minimal Feature Analysis for Isolated Digit Recognition for varying encoding rates in noisy environments
JPH0426479B2 (ja)
JPH0546559B2 (ja)
Dersch A decision logic for speech recognition
JPH0552509B2 (ja)
JPS6086599A (ja) 音声認識装置
JPH0546558B2 (ja)
JPH0552510B2 (ja)
JPS6069697A (ja) 音声認識装置
JPH0552512B2 (ja)
Fathoni et al. Optimization of Feature Extraction in Indonesian Speech Recognition Using PCA and SVM Classification
JPH0552515B2 (ja)
JPH0546560B2 (ja)