JPS58195895A - 単語音声認識装置 - Google Patents

単語音声認識装置

Info

Publication number
JPS58195895A
JPS58195895A JP57078565A JP7856582A JPS58195895A JP S58195895 A JPS58195895 A JP S58195895A JP 57078565 A JP57078565 A JP 57078565A JP 7856582 A JP7856582 A JP 7856582A JP S58195895 A JPS58195895 A JP S58195895A
Authority
JP
Japan
Prior art keywords
word
syllables
input
power
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57078565A
Other languages
English (en)
Inventor
康則 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57078565A priority Critical patent/JPS58195895A/ja
Publication of JPS58195895A publication Critical patent/JPS58195895A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 囚 発明の技術分野 本発明は単胎音Ps絽砿装置、特に、入力音声の音節数
を算出し、音節数によシ単飴音声の予備選択を行なった
後に、単一音声の標準パターンと照合するよう構成した
重鎖音声認識装置に関するものである。
(6)技術の背景 近年、オフィスコンビ凰−夕の急速な発展にともない、
各種入出力機鰺の機能向上が望まれておシ、%に音声認
識装置は情報の人力手段の一つとして鋭意研究開発が進
められている。
(Q 従来技術と問題点 従来、単一音声の認識においては、入力音声と単aaW
書とのマツチング方法は、ダイナミックプログラミング
(DP)マツチングのように、単語音声そのものの持つ
I!#徴をあまシ加味しない嚇なる距離計算であること
が多い。
このため、予期しない認識結果を生ずることがあった。
を友、単一音声のl1ll!!識は、入力された単一音
声と辞書内の単一音声との比較、すなわち、距離計算を
行うため膨大な計算舊となシ、計算時間が憂くなるとい
う欠点を有する。
0 発明の目的 本発明の目的は、前述の欠点に鑑みなされたものであっ
て、簡単な構成で良好な認識結果を得ることがで暑為単
語音声−m装置を提供することにある。
(ト)発明の構成 そして、この目的は本発明によれば、入力音声の音節数
を算出する音節数算出部、単語音声の標準パターンと音
節数が格納される辞書メモリ、駄辞書メ七りから絖み出
された単語音声の標準パターンと、入力音声に対応した
入カバターンとを照合する照合部と、を具備してなり、
該音節数算出部により入力音声の音節数を算出し、該音
節数によシ単語音声の標準パターンの予備選択を行なっ
た後に、該照合部によシ単飴音声の照合を行なうことを
特徴とする単語音声認識装置を提供することによシ達成
される。
■ 発明の実施例 以下、本発明の実施例を図面を用いて詳細に説明する。
第1図は、本発明にかかる単語音声認識装置の一実施例
を説明する丸めの概略構成図である。
図において、1はvP入力部であって、!イク等を介し
て単語音声が入力される。2はA/D変換器であって、
音声入力部1からのアナログデータをディジタルデータ
に変換する。このときのサンプリング周波数は8(KH
z)とする。 3はA/D変[Sr1によりディジタル
データ化された単語音声のパワーを計算するパワー計算
部で、このと自124m1を1フレームとする。4はパ
ワー計算部によ〉得られたパワーを正規化するパワー正
規化部、5はパワー正規化部4により得られたパワーの
微分値を算出するパワー値分値算出部であって、第2図
(a)、(b)に例えば、0NAJI(同じ)という単
語音声のパワーの時間変化とその微分波形を示す。6は
パワー微分値算出部5により得られた微分波層によシ単
語音声の音節数(入力された単語音声内の母音のwl)
を算出する音節数算出部、7は単語音声の標準パターン
が格納される辞書メモリであって、7−1は単峰音声の
標準パターンに対応する音節数が格納される1i節数メ
モリ、7−2は単語音声の標準パターンが格納される単
語音声メモリである。8は入力された単語音声と一1I
m算出部・によシ算出された旨節数に対応する音節数の
単語音声の標準パターンとを照合する照合部でありて、
例えばDPマツチング等を行なうことによシ入力された
単語音声の認識を行なう。
以上説明したような構成において、その動作について説
明する。
■ 単語音声が音声入力部lにより入力される。
■ 入力された単語音声はA/D変換器によシディジタ
ルデータに変換される。
■ パワー計算部3によシ1単語ごとにパワー計算を行
なう。
■ パワー正規化部4によシパワーの正規化を行なう。
■ 正規化されたパワーをパワー微分値算出部5によp
微分値を求める。
微分値を求める方法としては、ディジタルデータ化さi
またパワーの連続する5サンプルを一つの単位として、
最小自乗の意味で、直線近似し、その傾きを中心のサン
プルの微分値とする方法を用いる。
この演算をサンプルのII数をNとすれば、2ナンプル
目から(N−2)サンプルまで行なう。
(すなわち、最初と最後の2サンプルの傾きはゼロとす
る。)これを嬉2図伽)の実線で示す。
■ パワー微分値計算SSによシ算出した微分−−で値
がゼロになゐ点を検出する。(第2図で端破線と交わる
点)さらに、となシ合う破線で囲まれた区間において、
絶対値で微分値が最大になる点を検出する。第21伽)
において、Pse d1* pt+4鵞′0等を検出す
る。
となりあう(pt’* dt’)* (ds’s p雪
′)等を一つのピークまたはディップの存在する区間と
する。
(Pt*Ds・・・−[ ピークかディップかの判断は微分−−が極太から極小に
変化していれば、その区間にはピークがある、逆の場合
はディップがあるものとする。
このディタブは、いわゆる子音区間を表しているので鼻
音が母音の間にはさまれ穴場合等には明瞭龜ディップを
示すと社限らないが、ピーク区間は主として、母音の増
大を示していると考えられるので、このビータ区間がい
くつあるかを数えることにより、#th#よ確実に単語
音声の音節数を推定することができる。
■ このようにして得られ友音節数にもとづいて辞書メ
モリ7内の音節数メモIJ 7− I K対応する単語
音声メモリ7−2内の単語音声のパターンを読み出し、
照合部8により入力された単語音声と予備選択された単
@η音声のパターンとを照合する。
(Q 発明の効果 υ上mlと明したように本発明によれば、入力された単
語音声の音節数を算出し、該音節数に対応する単語音声
を予備選択した後に認識を行なうので良好なVW&結果
を得ることができ、認識に要する計31!菫、計算時間
を大幅に減少することができる。
【図面の簡単な説明】
’  M1図は本発明にかかる単語音声&[識装置の一
実施例を説明するための概略構成図、第2図は単語音声
のパワーの時間変化と、微分波形を示す図である。 図において、lは音声入力部、2はA/D変換器、3は
パワー計算部、4はパワー正規化部、5はパワー微分値
算出部、6は音節数算出部、7は辞書メモリ、8は照合
部である。 1も果 第 l 図 俤2図

Claims (1)

    【特許請求の範囲】
  1. 入力1声の音節数を算出する音節数算出部、単語音声の
    標準パターンと音節数が格納される辞書メモリ、該辞書
    メモリから読み出された単語音声の痺準パターンと入力
    fFに対応した入カバターンとを照合する照合部、とを
    具備してなり、該音節数算出部により入力音声の音節数
    を算出し、腋音節数によシ単i@音声の憾阜パターンの
    予備選択を行なっ九後に、該照合部より単一音声の照合
    を行なうことを特徴とする卑語音声認識装置。
JP57078565A 1982-05-11 1982-05-11 単語音声認識装置 Pending JPS58195895A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57078565A JPS58195895A (ja) 1982-05-11 1982-05-11 単語音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57078565A JPS58195895A (ja) 1982-05-11 1982-05-11 単語音声認識装置

Publications (1)

Publication Number Publication Date
JPS58195895A true JPS58195895A (ja) 1983-11-15

Family

ID=13665414

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57078565A Pending JPS58195895A (ja) 1982-05-11 1982-05-11 単語音声認識装置

Country Status (1)

Country Link
JP (1) JPS58195895A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59125800A (ja) * 1983-01-04 1984-07-20 日立電子エンジニアリング株式会社 音声認識装置
JPS60238895A (ja) * 1984-05-14 1985-11-27 沖電気工業株式会社 単音節入力用音声入力ワードプロセッサ

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59125800A (ja) * 1983-01-04 1984-07-20 日立電子エンジニアリング株式会社 音声認識装置
JPS60238895A (ja) * 1984-05-14 1985-11-27 沖電気工業株式会社 単音節入力用音声入力ワードプロセッサ

Similar Documents

Publication Publication Date Title
JP3162994B2 (ja) 音声のワードを認識する方法及び音声のワードを識別するシステム
JPS5972496A (ja) 単音識別装置
Rahman et al. Continuous bangla speech segmentation using short-term speech features extraction approaches
JPS63220298A (ja) 音声認識における単語候補削減装置
Mehra et al. Improving word recognition in speech transcriptions by decision-level fusion of stemming and two-way phoneme pruning
Ishihara et al. Automatic transformation of environmental sounds into sound-imitation words based on Japanese syllable structure.
JPS58195895A (ja) 単語音声認識装置
CN111429921B (zh) 声纹识别方法、系统、移动终端及存储介质
Gujarathi et al. Gaussian filter-based speech segmentation algorithm for Gujarati language
JP2813209B2 (ja) 大語彙音声認識装置
Reddy et al. Automatic pitch accent contour transcription for Indian languages
Shafieian Hidden Markov model and Persian speech recognition
CN115862603A (zh) 一种歌曲语音识别方法、系统、存储介质和电子设备
JPS6011898A (ja) 音声認識装置
Akila et al. WORD BASED TAMIL SPEECH RECOGNITION USING TEMPORAL FEATURE BASED SEGMENTATION.
JPS60164800A (ja) 音声認識装置
JPH0254560B2 (ja)
JPS6346499A (ja) 大語▲い▼単語音声認識方式
JPS61149997A (ja) 音声認識装置
JPS60158496A (ja) 音声認識装置
KR20030035286A (ko) 소용량 음성인식 시스템 및 그 방법
JPS61249099A (ja) 音声認識装置
JPS6193500A (ja) 音声認識装置
JPS6069694A (ja) 語頭子音のセグメンテ−ション法
JPS6242200A (ja) 音声認識装置