JPH0229232B2 - - Google Patents

Info

Publication number
JPH0229232B2
JPH0229232B2 JP59039148A JP3914884A JPH0229232B2 JP H0229232 B2 JPH0229232 B2 JP H0229232B2 JP 59039148 A JP59039148 A JP 59039148A JP 3914884 A JP3914884 A JP 3914884A JP H0229232 B2 JPH0229232 B2 JP H0229232B2
Authority
JP
Japan
Prior art keywords
threshold
speech
section
phoneme classification
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59039148A
Other languages
English (en)
Other versions
JPS60181798A (ja
Inventor
Hiroyuki Iwahashi
Tooru Ueda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP59039148A priority Critical patent/JPS60181798A/ja
Priority to DE8585301372T priority patent/DE3570784D1/de
Priority to EP85301372A priority patent/EP0157497B1/en
Priority to US06/706,528 priority patent/US4937869A/en
Publication of JPS60181798A publication Critical patent/JPS60181798A/ja
Publication of JPH0229232B2 publication Critical patent/JPH0229232B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

【発明の詳細な説明】
<発明の技術分野> 本発明は入力音声の波形情報に基づき、短時間
ごとに音韻分類を行つて記号化し、この記号化列
の情報から音声区間あるいはマツチング区間の検
出等を行う音声認識装置の改良に関し、更に詳細
には入力音声の短時間ごとの音韻分類の処理に改
良を加えたものである。 <発明の技術的背景とその問題点> 一般に音声認識装置における入力音声から音声
区間等を抽出する場合、パワーの情報によつて行
なわれている。しかし実用的な環境では種々の雑
音のため音声区間の正確な抽出が困難となる。ま
た直前に発声した音声による調音的な影響によつ
て音声区間の抽出が困難となる。 本出願人は上記従来の問題点を除去するため、
例えば音声区間の検出を単にパワーの情報によつ
てのみ行なうことなく、音声の短区間フレームご
との簡素な音韻分類を比較的簡単な手順で行なつ
て記号列を作成し、この記号列にもとづいて音声
区間の検出等を行い得るようにした音声認識方式
を先に特願昭57−216317号「音声認識方式」とし
て提案している。 本出願人が先に提案した音声認識方式において
は、音韻性を決定するのに、原波形のパワー、差
分波形パワー、2次線形予測の残差パワー、平均
レベル、相関係数、零交差数及び差分零交差数等
の各パラメータを用いて、一つの固定された閾値
セツトによつて分類していた。 <発明の目的> 本発明は上記従来の問題点を除去すると共に本
出願人が先に提案した音声認識方式を更に改良し
た音声認識装置を提供することを目的として成さ
れたものであり、この目的を達成するため、本発
明の音声認識装置は、 入力音声の波形情報に基づき、短時間ごとに音
韻分類を行つて記号化する音韻分類部を備えた音
声認識装置であつて、 前記音韻分類部は、 入力音声波形をA−D変換して音声データを得
るA−D変換部と、 前記音声データから所定の各種パラメータを抽
出するパラメータ抽出部と、 前記各種パラメータに対して設けられた閾値テ
ーブルと、 前記音声データの入力音量レベルに基づいて、
前記閾値テーブルの所定の閾値セツトを選択する
判定部と、 前記選択された前記閾値セツトと前記抽出され
た各種パラメータを比較判定して音韻分類を行う
論理判定部と、 を具備しており、このような構成によつて、本発
明は文章入力中の話者の入力音量レベルを検出
し、この検出した情報を各パラメータと比較され
る閾値にフイードバツクさせて、予め用意された
複数の閾値セツトを自動的に選択しながら音韻分
類を行なうことが可能となり、更に本発明の実施
例によれば、上記の検出された入力音声レベルを
話者へ報知するように成されている。 <発明の実施例> 以下、本発明を図面を参照して詳細に説明す
る。 第1図は本発明を実施した音声認識装置の一構
成例を示すブロツク図である。 第1図において、発声された入力音声はマイク
ロホン等の検出器1により電気信号に変換され
る。この検出器1は、人の可聴周波数である20Hz
〜15KHz程度の周波数を検出することが出来、特
に人の会話音声領域の周波数を歪なく検出し得る
ものが好ましい。この検出器1の出力側には増幅
器2が接続される。この増幅器2は前記の音声周
波数を歪なく増幅し得るものが好ましい。この増
幅器2の出力側に音響処理部10を構成している
音韻分類部3が接続されると共に特徴パラメータ
抽出部4が接続される。 特徴パラメータ抽出部4は例えば互に通過帯域
を異ならせた複数個の帯域フイルタと各帯域フイ
ルタの出力をホールドするサンプルホールド回路
と、このサンプルホールド回路の出力を順次10ミ
リ程度の間隔でサンプリングするアナログスイツ
チと、このアナログスイツチの出力を例えば12ビ
ツトのデジタル信号に変換して特徴パラメータを
出力するA/D変換器と、このA/D変換器の出
力を対数変換する対数化部より構成されている。 また上記特徴パラメータ抽出部4により抽出さ
れた対数変換された特徴パラメータが次段の時間
軸正規化部5を通つて正規化され、この正規化さ
れた特徴パラメータと標準パターンメモリ6に記
憶された標準特徴パラメータとがマツチング部7
により比較されて入力音声が認識され、その結果
が判定出力部8に出力されるように構成されてい
る。 上記音韻分類部3は後述する第2図に示す如
く、入力音声波形から求められた各パラメータを
用いて、音韻分類アルゴリズムに従つて音韻分類
記号系列を出力する。上記音韻分類部3から出力
される音韻分類記号系列は音声区間抽出部9に与
えられ、該音声区間抽出部9において、音韻分類
記号系列から音声区間が検出され、その出力が時
間軸正規化部5に与えられるように構成されてい
る。 また11は音韻分類部3において検出される話
者の入力音量レベルを外部報知するためのレベル
表示部であり、該レベル表示部11は音韻分類部
3に接続されている。 第2図は音韻分類部3の一構成例を示すブロツ
ク図である。 第2図において音韻分類部3はアンプ2から出
力される入力音声波形をA−D変換するA/D変
換器31と該A/D変換器31から出力される音
声デイジタル信号から各パラメータを算出するた
めの相関器32、各種パワー演算器33、零交差
数検出器34、差分零交差数検出器35、平均レ
ベル検出器36及び算出された各パラメータにも
とづいて短時間フレームごとに波形の特徴によつ
て分類して記号系列を出力する論理判定部37、
原波形のパワー情報PWにもとづいてトータルパ
ワー情報TPWを算出するTPW算出部38、母音
“V”の出現状況を計数するVcカウンタ39、Ti
値(i=0〜3)を記憶しているTi記憶部40、
TPW値とTi値を比較してセツト値Si(i=0〜
4)を出力する判定部41及び複数個の閾値セツ
トを記憶している閾値テーブルメモリ記憶部42
とから構成されている。 上記A/D変換器31は入力音声を例えば8〜
24kHzでサンプリングして6〜12ビツトのデジタ
ル信号Xiに変換する。 相関器32は例えばサンプル数N(=256)の区
間の1分析フレームごとの0次ないし2次までの
相関関数を算出するように構成されている。 1次の自己相関関数11Ni=1 Xi・Xi1 として演算し、また同様に2次の自己相関関数
22Ni=1 Xi・Xi+2 として演算する。 また0次の自己相関関数00Ni=1 Xi・Xi として演算し、これは原波形のパワーPWを表わ
すことになる。 また、これらの値から1次及び2次の相関係数
C1及びC2が C1=1/PW(=0) C2=2/PW(=0) として演算される。 パワー演算部33は原波形のパワーPW以外の
差分波形のパワーPWD及び2次線形予測の残差
パワーPWFを算出するように構成されている。 差分波形のパワーPWDは PWD=2×(1−C1)×PW によつて算出され、また2次線形予測の残差パワ
ーPWFは PWF=(1−C2)×(1−2C12+C2)/1−C12×PW に基づいて算出される。 零交差数検出器34は原波形{Xi}の分析フレ
ームごとの零交差数ZRCを算出するように構成
されており、零交差数ZRCは次式 ZRC=Ni=1 Fi Fi=1、SIGN(Xi)≠SIGN(Xi-1) 0、SIGN(Xi)=SIGN(Xi-1) (ただしSIGN(Xi)は波形Xiの符号を表わして
いる。) によつて求めるように構成されている。 差分零交差数検出器35は差分処理した差分波
形{Xi−Xi-1}の零交差数ZRCDを算出するよう
に構成されており、差分零交差数ZRCDは次式 ZRCD=Ni=1 FDi FDi=1、SIGN(Xi−Xi-1) ≠SIGN(Xi-1−Xi-2 0、SIGN(Xi−Xi-1) =SIGN(Xi−Xi-2) (ただしSIGN(Xi−Xi-1)は差分波形{Xi
Xi-1}の符号を表わしている。) によつて求めるように構成されている。 平均レベル検出器36は波形の絶対値{|Xi
|}の平均レベルPWAを算出するように構成さ
れており次式 によつて算出するように構成されている。 論理判定部37は上記各要素32〜36より作
成された情報PW,PWD,PWF,PWA,C1,
C2,ZRC,ZRCD及び閾値テーブル記憶部42
に記憶された閾値に基づいて、分析フレーム毎に
音韻分類を行うように構成されている。 音韻分類は各分析フレーム毎に{・,B,N,
V,F,C}の各記号を与えるものであり、“・”
は無音、“B”はバズ・バー部、“N”は鼻音性の
音、“V”は母音、“F”は摩擦性の子音部、“C”
は弱い摩擦性の子音に該当するものである。 上記論理判定部37における音韻分類の詳細動
作の説明を行なう前に、本発明の特徴である入力
音量レベルによつて、予め閾値テーブル記憶部4
2に複数個設定記憶している閾値セツトSi(i=
0〜4)を自動的に選択する動作について第3図
に示される動作フロー図に従つて説明する。 上記閾値テーブル記憶部42には、例えば第1
表に示すように原波形のパワーPWに対する閾値
PW0〜PW3、差分波形のパワーPWDに対する閾
値PWD0〜PWD3、2次線形予測の残差パワー
PWFに対する閾値PWF0〜PWF2、平均レベル
PWAに対する閾値PWA0〜PWA3、1次の相関
係数C1に対する閾値C10〜C15、2次の相関
係数C2に対する閾値C20〜C22、及び零交差
数ZRC及びZRCDに対する閾値ZRC0〜ZRC7がそ
れぞれセツト番号S0〜S4に対応して4個ずつ記憶
されている。なお第1表においてはセツト番号S2
に対する具体的な閾値のみが記入されている。
【表】
【表】 またTi記憶部40には例えばT0=5000、T1
8000、T2=10000、T3=12000の値が予め設定記
憶されている。 本発明においては、上記のように複数個の閾値
セツトSi(i=0〜4)が予め記憶部42に設定
記憶されており、これらの閾値セツトSiを選択し
て論理判定部37に所望の閾値を与える条件にト
ータルPW(TPW)及び母音カウンタ(Vc)の値
が用いられる。 以下に、第3図に示す動作フロー図に従つて、
この閾値セツトを自動的に選択する動作を説明す
る。 今、初期状態では母音カウンタ(Vc)39及
びTPW算出部38の内容は共に“0”にクリア
され、また閾値セツトはS0が選択されている(第
3図、ステツプn1)。 次にステツプn2に移行して、閾値セツトS0
各パラメータに対する各閾値によつて論理判定部
37で音韻分類が行なわれて、音韻性が判定され
る(なお、この音韻性の判定動作については後述
する。) ステツプn2における音韻分類の結果が母音、
即ち“V”と判断されたとき(ステツプn3)、
母音カウンタ(Vc)39はカウントアツプ(Vc
=Vc+1)され、同時にその時の原波形のパワ
ーPWの値がTPW算出部38においてトータル
PW(TPW)に加えられる演算(TPW=TPW+
PW)が実行される(ステツプn4)。一方、音
韻分類の結果が母音(“V”)以外のときは何も処
理もされない。音韻分類が何回か行なわれて行く
と、母音(“V”)と判断されたときのパワーPW
だけがTPW算出部38において累算される。 なお、音韻分類が母音(“V”)と判断されたと
きのみ、パワーPWを累算しているのは、母音部
分のパワーPWが安定しており、入力音量レベル
を知るには都合が良いためである。 ステツプn4からステツプn5に移行し、該ス
テツプn5においてVcの値がVcc(例えば64)に
なつたとき、ステツプn6に移行してTPW算出
部38において累算されたトータルパワーTPW
の値が判定部41に入力されてTi記憶部40に
予め記憶されているTi(i=0〜3)の値と比較
されてSiのうちのどのセツトを選ぶかが判定され
る。 即ち、ステツプn6に示すように TPW/256<T0(5000)であればS0が選択さ
れ、 T0≦TPW/256<T1(8000)であればS1が選択
され、 T1≦TPW/256<T2(10000)であればS2が選
択され、 T2≦TPW/256<T3(12000)であればS3が選
択され、 T3≦TPW/256であればS4が選択される。 今、例えばT0≦TPW/256<T1であつたとす
ると、閾値セツトがS1に選択され、閾値セツトが
S0からS1に切換えられることになる。この後論理
判定部37における音韻分類にS1が閾値セツトと
して用いられる。 また、上記のようにして算出されたトータルパ
ワーTPWの値はステツプn7においてTi値と比
較されて過大、適量、過小のいずれかが、例えば
発光ダイオードLEDを用いたレベル表示部11
において表示され、話者に知らせるように成され
ている。このレベル表示部11は話者へ「もう少
し大きい声で」、「もう少し小さく」の如く、装置
かこの応答の意味を持つたものとなる。 なお、このレベル表示部11の表示に際しては
過大、適量、過小を例えばCPUの出力ビツトに
対応させることが簡単に制御でき、表示のタイミ
ングは閾値の選択のときとなしている。 その後、ステツプn8に移行してカウンタ
(Vc)39がリセツトされると共にトータルパワ
ーTPWの値がa倍(例えば3/4倍)され、再
びステツプn2に戻つて、以下同様の動作が行な
われ、再びVc=Vccとなつたときに、トータル
パワーTPWの値によつて現在の閾値セツトS1
継続するか、あるいは他のセツトに換えるかが決
定がなされる。 このようにして、閾値セツトが入力音量レベル
に応じて動的に入れ換わることになり、より柔軟
な音韻分類が行なわれる。 次に論理判定部37において行なわれる音韻分
類の動作について、第4図に示される動作フロー
図にしたがつて説明する。 まず、ステツプn11において鼻音性の音
“N”の判定が、表2に示す判定条件の下に行な
われる。 即ち、原波形のパワーPWがある閾値以上、差
分波形のパワーPWD及び2次線形予測の残差パ
ワーPWFがそれぞれある閾値以下、1次の相関
係数C1がある閾値以上で、差分零交差数ZRCD
がある閾値以下であるか否かによつて鼻音性の音
“N”の判定が行なわれる。
【表】 ステツプn11において、鼻音性の音“N”と
判定されないものに対してはステツプn12に移
行してバズ・バー“B”の判定が表3に示す判定
条件の下に行なわれる。
【表】 次にステツプn12においてバズ・バー“B”
と判定されないものに対してはステツプn13に
移行して無音“・”の判定が表4に示す判定条件
の下に行なわれる。
【表】 次にステツプn13において無音“・”と判定
されないものに対してはステツプn14に移行し
て弱い摩擦性の子音“C”の判定が表5に示す判
定条件の下に行なわれる。
【表】 次にステツプn14において弱い摩擦性の子音
“C”と一応判定されたものに対してはステツプ
n15に移行して摩擦性の子音“F”であるか否
かの判定が表6に示す判定条件の下に行なわれ
て、摩擦性の子音“F”と弱い摩擦性の子音
“C”の区別判定が行なわれる。
【表】 また、上記ステツプn14において弱い摩擦性
の子音“C”と判定されないものに対してはステ
ツプn16に移行して母音“V”であるか否かの
判定が表7に示す判定条件の下に行なわれる。
【表】 次にステツプn16において母音“V”と判定
されないものに対してはステツプn17に移行し
て摩擦性の子音“F”であるか否かの判定が表8
に示す判定条件の下に行なわれる。
【表】 以上の判定は上位から行なわれ、判定条件が成
立した時点で一つの音韻分類の動作を終了する。
またステツプn11〜n14、n16及びn17
においていずれも“NO”と判定されたものにつ
いては母音“V”とされる。 上記判定においては表1に示した各閾値PW0
〜PW3,PWD0〜PW3,PWF0〜PWF2,PWA0
〜PWA3,C10〜C15,C20〜C22及びZRC0
〜ZRC7との比較によつて行なわれるが、この閾
値のセツトは上記したように入力音量レベルに応
じて動的に入れ換わり、より柔軟な音韻分類が行
なわれる。 例えば音節/NI/を発声して音韻分類した場
合の一例を第5図に示している。 第5図においてaは従来の方式によつて音節/
NI/を音韻分類したものであり、bは本発明方
式によつて音韻分類したものを示しているが、両
者の比較から明らかなように本発明方式によるb
の方が、音韻分類の性能が向上していることがわ
かる。 なお、上記した第1図及び第2図に示したブロ
ツク構成は、例えば第6図に示すようにマイクロ
コンピユータによつて実現しても良いことは言う
までもない。 第6図において、第1図と同一部分は同一符号
で示されており、1はマイクロホン等の検出器、
12は特徴抽出回路、13はCPU、14はメモ
リー部、6は標準パターンメモリ、7はマツチン
グ部、11はレベル表示部である。 <発明の効果> 以上の如く、本発明によれば、A−D変換され
た音声データから、相関関数、零交差数、差分さ
れた波形の零交差数及び波形の平均レベル等の各
パラメータをそれぞれ抽出し、予め設定記憶され
た複数の閾値セツトより入力音量レベルにもとづ
いて所定の閾値セツトを選択し、この選択された
閾値セツトと上記の抽出された各パラメータとを
比較判定して音韻分類を行なうように成している
ため、閾値セツトが入力音量レベルに応じて動的
に選択され、より柔軟な音韻分類が行なわれて、
例えば音声区間の検出を確実に行なうことが出来
る。
【図面の簡単な説明】
第1図は本発明を実施した音声認識装置の一実
施例の構成を示すブロツク図、第2図は音韻分類
部の構成例を示すブロツク図、第3図は本発明に
係る閾値セツトの動作フローを示す図、第4図は
音韻分類の動作フロー図、第5図は音韻分類の一
例を説明するための図、第6図は本発明を実施し
た音声認識装置の他の構成例を示すブロツク図で
ある。 3…音韻分類部、10…音響処理部、11…レ
ベル表示部、32…相関器、33…各種パワー演
算部、34…零交差器、35…差分零交差器、3
6…平均レベル検出器、37…論理判定部、38
…TPW算出部、39…Vc(母音)カウンタ、4
0…Ti記憶部、41…判定部、42…閾値テー
ブル記憶部、S0〜S4…閾値セツト。

Claims (1)

  1. 【特許請求の範囲】 1 入力音声の波形情報に基づき、短時間ごとに
    音韻分類を行つて記号化する音韻分類部を備えた
    音声認識装置であつて、 前記音韻分類部は、 入力音声波形をA−D変換して音声データを得
    るA−D変換部と、 前記音声データから所定の各種パラメータを抽
    出するパラメータ抽出部と、 前記各種パラメータに対して設けられた閾値セ
    ツトを複数保持する閾値テーブルと、 前記音声データの入力音量レベルに基づいて前
    記閾値テーブルの所定の閾値セツトを選択する判
    定部と、 前記選択された前記閾値セツトと前記抽出され
    た各種パラメータを比較判定して音韻分類を行う
    論理判定部と、 を具備すること特徴とする音声認識装置。
JP59039148A 1984-02-28 1984-02-28 音声認識装置 Granted JPS60181798A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP59039148A JPS60181798A (ja) 1984-02-28 1984-02-28 音声認識装置
DE8585301372T DE3570784D1 (en) 1984-02-28 1985-02-28 Improved phonemic classification in speech recognition system
EP85301372A EP0157497B1 (en) 1984-02-28 1985-02-28 Improved phonemic classification in speech recognition system
US06/706,528 US4937869A (en) 1984-02-28 1985-02-28 Phonemic classification in speech recognition system having accelerated response time

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59039148A JPS60181798A (ja) 1984-02-28 1984-02-28 音声認識装置

Publications (2)

Publication Number Publication Date
JPS60181798A JPS60181798A (ja) 1985-09-17
JPH0229232B2 true JPH0229232B2 (ja) 1990-06-28

Family

ID=12545018

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59039148A Granted JPS60181798A (ja) 1984-02-28 1984-02-28 音声認識装置

Country Status (4)

Country Link
US (1) US4937869A (ja)
EP (1) EP0157497B1 (ja)
JP (1) JPS60181798A (ja)
DE (1) DE3570784D1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62112261A (ja) * 1985-11-11 1987-05-23 Hitachi Ltd デイスククランプ装置
DE69128990T2 (de) * 1990-09-07 1998-08-27 Toshiba Kawasaki Kk Sprecherkennungsvorrichtung
JPH075898A (ja) * 1992-04-28 1995-01-10 Technol Res Assoc Of Medical & Welfare Apparatus 音声信号処理装置と破裂性抽出装置
JP3311467B2 (ja) * 1994-03-10 2002-08-05 富士通株式会社 音声認識システム
US5963899A (en) * 1996-08-07 1999-10-05 U S West, Inc. Method and system for region based filtering of speech
JP3702978B2 (ja) * 1996-12-26 2005-10-05 ソニー株式会社 認識装置および認識方法、並びに学習装置および学習方法
US5970447A (en) * 1998-01-20 1999-10-19 Advanced Micro Devices, Inc. Detection of tonal signals
TWI226600B (en) * 2003-03-12 2005-01-11 Leadtek Research Inc Nasal detection method and device thereof
US20070032259A1 (en) * 2005-08-05 2007-02-08 George Gounaris Method and apparatus for voice amplitude feedback in a communications device

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3466394A (en) * 1966-05-02 1969-09-09 Ibm Voice verification system
US3483941A (en) * 1968-01-26 1969-12-16 Bell Telephone Labor Inc Speech level measuring device
US3679830A (en) * 1970-05-11 1972-07-25 Malcolm R Uffelman Cohesive zone boundary detector
FR2150174A5 (ja) * 1971-08-18 1973-03-30 Dreyfus Jean
US3832491A (en) * 1973-02-13 1974-08-27 Communications Satellite Corp Digital voice switch with an adaptive digitally-controlled threshold
US3940565A (en) * 1973-07-27 1976-02-24 Klaus Wilhelm Lindenberg Time domain speech recognition system
US3881059A (en) * 1973-08-16 1975-04-29 Center For Communications Rese System for visual display of signal parameters such as the parameters of speech signals for speech training purposes
US4092493A (en) * 1976-11-30 1978-05-30 Bell Telephone Laboratories, Incorporated Speech recognition system
JPS597120B2 (ja) * 1978-11-24 1984-02-16 日本電気株式会社 音声分析装置
US4388495A (en) * 1981-05-01 1983-06-14 Interstate Electronics Corporation Speech recognition microcomputer
US4435617A (en) * 1981-08-13 1984-03-06 Griggs David T Speech-controlled phonetic typewriter or display device using two-tier approach
JPS5844500A (ja) * 1981-09-11 1983-03-15 シャープ株式会社 音声認識方式
US4509186A (en) * 1981-12-31 1985-04-02 Matsushita Electric Works, Ltd. Method and apparatus for speech message recognition
JPS5972496A (ja) * 1982-10-19 1984-04-24 株式会社東芝 単音識別装置

Also Published As

Publication number Publication date
US4937869A (en) 1990-06-26
EP0157497A1 (en) 1985-10-09
DE3570784D1 (en) 1989-07-06
EP0157497B1 (en) 1989-05-31
JPS60181798A (ja) 1985-09-17

Similar Documents

Publication Publication Date Title
JP3180655B2 (ja) パターンマッチングによる単語音声認識方法及びその方法を実施する装置
WO2011046474A2 (ru) Способ идентификации говорящего по фонограммам произвольной устной речи на основе формантного выравнивания
JPH09500223A (ja) 多言語音声認識システム
JPS6147440B2 (ja)
JPH0990974A (ja) 信号処理方法
WO2013002674A1 (ru) Система и способ распознавания речи
Villing et al. Automatic blind syllable segmentation for continuous speech
JPH0229232B2 (ja)
Zhao et al. A processing method for pitch smoothing based on autocorrelation and cepstral F0 detection approaches
Hasija et al. Recognition of Children Punjabi Speech using Tonal Non-Tonal Classifier
JPH0797279B2 (ja) 音声認識装置
JP3354252B2 (ja) 音声認識装置
JPS63165900A (ja) 会話音声認識方式
JPS5972500A (ja) 音声認識方式
JP2001083978A (ja) 音声認識装置
JP4890792B2 (ja) 音声認識方法
KR100345402B1 (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
Medhi et al. Different acoustic feature parameters ZCR, STE, LPC and MFCC analysis of Assamese vowel phonemes
KR20080065775A (ko) 구화 교육용 발성 시각화 시스템
JP2022025493A (ja) 発話トレーニングシステム
JP3049711B2 (ja) 音声処理装置
JP2006284907A (ja) 音素セグメンテーション方法及び装置
KR100322704B1 (ko) 음성신호의지속시간변경방법
JPS6331798B2 (ja)
JP4882152B2 (ja) 話速検出方法および音声信号処理装置