JPS58195895A - 単語音声認識装置 - Google Patents
単語音声認識装置Info
- Publication number
- JPS58195895A JPS58195895A JP57078565A JP7856582A JPS58195895A JP S58195895 A JPS58195895 A JP S58195895A JP 57078565 A JP57078565 A JP 57078565A JP 7856582 A JP7856582 A JP 7856582A JP S58195895 A JPS58195895 A JP S58195895A
- Authority
- JP
- Japan
- Prior art keywords
- word
- syllables
- input
- power
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
囚 発明の技術分野
本発明は単胎音Ps絽砿装置、特に、入力音声の音節数
を算出し、音節数によシ単飴音声の予備選択を行なった
後に、単一音声の標準パターンと照合するよう構成した
重鎖音声認識装置に関するものである。
を算出し、音節数によシ単飴音声の予備選択を行なった
後に、単一音声の標準パターンと照合するよう構成した
重鎖音声認識装置に関するものである。
(6)技術の背景
近年、オフィスコンビ凰−夕の急速な発展にともない、
各種入出力機鰺の機能向上が望まれておシ、%に音声認
識装置は情報の人力手段の一つとして鋭意研究開発が進
められている。
各種入出力機鰺の機能向上が望まれておシ、%に音声認
識装置は情報の人力手段の一つとして鋭意研究開発が進
められている。
(Q 従来技術と問題点
従来、単一音声の認識においては、入力音声と単aaW
書とのマツチング方法は、ダイナミックプログラミング
(DP)マツチングのように、単語音声そのものの持つ
I!#徴をあまシ加味しない嚇なる距離計算であること
が多い。
書とのマツチング方法は、ダイナミックプログラミング
(DP)マツチングのように、単語音声そのものの持つ
I!#徴をあまシ加味しない嚇なる距離計算であること
が多い。
このため、予期しない認識結果を生ずることがあった。
を友、単一音声のl1ll!!識は、入力された単一音
声と辞書内の単一音声との比較、すなわち、距離計算を
行うため膨大な計算舊となシ、計算時間が憂くなるとい
う欠点を有する。
声と辞書内の単一音声との比較、すなわち、距離計算を
行うため膨大な計算舊となシ、計算時間が憂くなるとい
う欠点を有する。
0 発明の目的
本発明の目的は、前述の欠点に鑑みなされたものであっ
て、簡単な構成で良好な認識結果を得ることがで暑為単
語音声−m装置を提供することにある。
て、簡単な構成で良好な認識結果を得ることがで暑為単
語音声−m装置を提供することにある。
(ト)発明の構成
そして、この目的は本発明によれば、入力音声の音節数
を算出する音節数算出部、単語音声の標準パターンと音
節数が格納される辞書メモリ、駄辞書メ七りから絖み出
された単語音声の標準パターンと、入力音声に対応した
入カバターンとを照合する照合部と、を具備してなり、
該音節数算出部により入力音声の音節数を算出し、該音
節数によシ単語音声の標準パターンの予備選択を行なっ
た後に、該照合部によシ単飴音声の照合を行なうことを
特徴とする単語音声認識装置を提供することによシ達成
される。
を算出する音節数算出部、単語音声の標準パターンと音
節数が格納される辞書メモリ、駄辞書メ七りから絖み出
された単語音声の標準パターンと、入力音声に対応した
入カバターンとを照合する照合部と、を具備してなり、
該音節数算出部により入力音声の音節数を算出し、該音
節数によシ単語音声の標準パターンの予備選択を行なっ
た後に、該照合部によシ単飴音声の照合を行なうことを
特徴とする単語音声認識装置を提供することによシ達成
される。
■ 発明の実施例
以下、本発明の実施例を図面を用いて詳細に説明する。
第1図は、本発明にかかる単語音声認識装置の一実施例
を説明する丸めの概略構成図である。
を説明する丸めの概略構成図である。
図において、1はvP入力部であって、!イク等を介し
て単語音声が入力される。2はA/D変換器であって、
音声入力部1からのアナログデータをディジタルデータ
に変換する。このときのサンプリング周波数は8(KH
z)とする。 3はA/D変[Sr1によりディジタル
データ化された単語音声のパワーを計算するパワー計算
部で、このと自124m1を1フレームとする。4はパ
ワー計算部によ〉得られたパワーを正規化するパワー正
規化部、5はパワー正規化部4により得られたパワーの
微分値を算出するパワー値分値算出部であって、第2図
(a)、(b)に例えば、0NAJI(同じ)という単
語音声のパワーの時間変化とその微分波形を示す。6は
パワー微分値算出部5により得られた微分波層によシ単
語音声の音節数(入力された単語音声内の母音のwl)
を算出する音節数算出部、7は単語音声の標準パターン
が格納される辞書メモリであって、7−1は単峰音声の
標準パターンに対応する音節数が格納される1i節数メ
モリ、7−2は単語音声の標準パターンが格納される単
語音声メモリである。8は入力された単語音声と一1I
m算出部・によシ算出された旨節数に対応する音節数の
単語音声の標準パターンとを照合する照合部でありて、
例えばDPマツチング等を行なうことによシ入力された
単語音声の認識を行なう。
て単語音声が入力される。2はA/D変換器であって、
音声入力部1からのアナログデータをディジタルデータ
に変換する。このときのサンプリング周波数は8(KH
z)とする。 3はA/D変[Sr1によりディジタル
データ化された単語音声のパワーを計算するパワー計算
部で、このと自124m1を1フレームとする。4はパ
ワー計算部によ〉得られたパワーを正規化するパワー正
規化部、5はパワー正規化部4により得られたパワーの
微分値を算出するパワー値分値算出部であって、第2図
(a)、(b)に例えば、0NAJI(同じ)という単
語音声のパワーの時間変化とその微分波形を示す。6は
パワー微分値算出部5により得られた微分波層によシ単
語音声の音節数(入力された単語音声内の母音のwl)
を算出する音節数算出部、7は単語音声の標準パターン
が格納される辞書メモリであって、7−1は単峰音声の
標準パターンに対応する音節数が格納される1i節数メ
モリ、7−2は単語音声の標準パターンが格納される単
語音声メモリである。8は入力された単語音声と一1I
m算出部・によシ算出された旨節数に対応する音節数の
単語音声の標準パターンとを照合する照合部でありて、
例えばDPマツチング等を行なうことによシ入力された
単語音声の認識を行なう。
以上説明したような構成において、その動作について説
明する。
明する。
■ 単語音声が音声入力部lにより入力される。
■ 入力された単語音声はA/D変換器によシディジタ
ルデータに変換される。
ルデータに変換される。
■ パワー計算部3によシ1単語ごとにパワー計算を行
なう。
なう。
■ パワー正規化部4によシパワーの正規化を行なう。
■ 正規化されたパワーをパワー微分値算出部5によp
微分値を求める。
微分値を求める。
微分値を求める方法としては、ディジタルデータ化さi
またパワーの連続する5サンプルを一つの単位として、
最小自乗の意味で、直線近似し、その傾きを中心のサン
プルの微分値とする方法を用いる。
またパワーの連続する5サンプルを一つの単位として、
最小自乗の意味で、直線近似し、その傾きを中心のサン
プルの微分値とする方法を用いる。
この演算をサンプルのII数をNとすれば、2ナンプル
目から(N−2)サンプルまで行なう。
目から(N−2)サンプルまで行なう。
(すなわち、最初と最後の2サンプルの傾きはゼロとす
る。)これを嬉2図伽)の実線で示す。
る。)これを嬉2図伽)の実線で示す。
■ パワー微分値計算SSによシ算出した微分−−で値
がゼロになゐ点を検出する。(第2図で端破線と交わる
点)さらに、となシ合う破線で囲まれた区間において、
絶対値で微分値が最大になる点を検出する。第21伽)
において、Pse d1* pt+4鵞′0等を検出す
る。
がゼロになゐ点を検出する。(第2図で端破線と交わる
点)さらに、となシ合う破線で囲まれた区間において、
絶対値で微分値が最大になる点を検出する。第21伽)
において、Pse d1* pt+4鵞′0等を検出す
る。
となりあう(pt’* dt’)* (ds’s p雪
′)等を一つのピークまたはディップの存在する区間と
する。
′)等を一つのピークまたはディップの存在する区間と
する。
(Pt*Ds・・・−[
ピークかディップかの判断は微分−−が極太から極小に
変化していれば、その区間にはピークがある、逆の場合
はディップがあるものとする。
変化していれば、その区間にはピークがある、逆の場合
はディップがあるものとする。
このディタブは、いわゆる子音区間を表しているので鼻
音が母音の間にはさまれ穴場合等には明瞭龜ディップを
示すと社限らないが、ピーク区間は主として、母音の増
大を示していると考えられるので、このビータ区間がい
くつあるかを数えることにより、#th#よ確実に単語
音声の音節数を推定することができる。
音が母音の間にはさまれ穴場合等には明瞭龜ディップを
示すと社限らないが、ピーク区間は主として、母音の増
大を示していると考えられるので、このビータ区間がい
くつあるかを数えることにより、#th#よ確実に単語
音声の音節数を推定することができる。
■ このようにして得られ友音節数にもとづいて辞書メ
モリ7内の音節数メモIJ 7− I K対応する単語
音声メモリ7−2内の単語音声のパターンを読み出し、
照合部8により入力された単語音声と予備選択された単
@η音声のパターンとを照合する。
モリ7内の音節数メモIJ 7− I K対応する単語
音声メモリ7−2内の単語音声のパターンを読み出し、
照合部8により入力された単語音声と予備選択された単
@η音声のパターンとを照合する。
(Q 発明の効果
υ上mlと明したように本発明によれば、入力された単
語音声の音節数を算出し、該音節数に対応する単語音声
を予備選択した後に認識を行なうので良好なVW&結果
を得ることができ、認識に要する計31!菫、計算時間
を大幅に減少することができる。
語音声の音節数を算出し、該音節数に対応する単語音声
を予備選択した後に認識を行なうので良好なVW&結果
を得ることができ、認識に要する計31!菫、計算時間
を大幅に減少することができる。
’ M1図は本発明にかかる単語音声&[識装置の一
実施例を説明するための概略構成図、第2図は単語音声
のパワーの時間変化と、微分波形を示す図である。 図において、lは音声入力部、2はA/D変換器、3は
パワー計算部、4はパワー正規化部、5はパワー微分値
算出部、6は音節数算出部、7は辞書メモリ、8は照合
部である。 1も果 第 l 図 俤2図
実施例を説明するための概略構成図、第2図は単語音声
のパワーの時間変化と、微分波形を示す図である。 図において、lは音声入力部、2はA/D変換器、3は
パワー計算部、4はパワー正規化部、5はパワー微分値
算出部、6は音節数算出部、7は辞書メモリ、8は照合
部である。 1も果 第 l 図 俤2図
Claims (1)
- 入力1声の音節数を算出する音節数算出部、単語音声の
標準パターンと音節数が格納される辞書メモリ、該辞書
メモリから読み出された単語音声の痺準パターンと入力
fFに対応した入カバターンとを照合する照合部、とを
具備してなり、該音節数算出部により入力音声の音節数
を算出し、腋音節数によシ単i@音声の憾阜パターンの
予備選択を行なっ九後に、該照合部より単一音声の照合
を行なうことを特徴とする卑語音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57078565A JPS58195895A (ja) | 1982-05-11 | 1982-05-11 | 単語音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57078565A JPS58195895A (ja) | 1982-05-11 | 1982-05-11 | 単語音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS58195895A true JPS58195895A (ja) | 1983-11-15 |
Family
ID=13665414
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57078565A Pending JPS58195895A (ja) | 1982-05-11 | 1982-05-11 | 単語音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58195895A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59125800A (ja) * | 1983-01-04 | 1984-07-20 | 日立電子エンジニアリング株式会社 | 音声認識装置 |
JPS60238895A (ja) * | 1984-05-14 | 1985-11-27 | 沖電気工業株式会社 | 単音節入力用音声入力ワードプロセッサ |
-
1982
- 1982-05-11 JP JP57078565A patent/JPS58195895A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59125800A (ja) * | 1983-01-04 | 1984-07-20 | 日立電子エンジニアリング株式会社 | 音声認識装置 |
JPS60238895A (ja) * | 1984-05-14 | 1985-11-27 | 沖電気工業株式会社 | 単音節入力用音声入力ワードプロセッサ |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3162994B2 (ja) | 音声のワードを認識する方法及び音声のワードを識別するシステム | |
JPS5972496A (ja) | 単音識別装置 | |
Rahman et al. | Continuous bangla speech segmentation using short-term speech features extraction approaches | |
JPS63220298A (ja) | 音声認識における単語候補削減装置 | |
Mehra et al. | Improving word recognition in speech transcriptions by decision-level fusion of stemming and two-way phoneme pruning | |
Ishihara et al. | Automatic transformation of environmental sounds into sound-imitation words based on Japanese syllable structure. | |
JPS58195895A (ja) | 単語音声認識装置 | |
CN111429921B (zh) | 声纹识别方法、系统、移动终端及存储介质 | |
Gujarathi et al. | Gaussian filter-based speech segmentation algorithm for Gujarati language | |
JP2813209B2 (ja) | 大語彙音声認識装置 | |
Reddy et al. | Automatic pitch accent contour transcription for Indian languages | |
Shafieian | Hidden Markov model and Persian speech recognition | |
CN115862603A (zh) | 一种歌曲语音识别方法、系统、存储介质和电子设备 | |
JPS6011898A (ja) | 音声認識装置 | |
Akila et al. | WORD BASED TAMIL SPEECH RECOGNITION USING TEMPORAL FEATURE BASED SEGMENTATION. | |
JPS60164800A (ja) | 音声認識装置 | |
JPH0254560B2 (ja) | ||
JPS6346499A (ja) | 大語▲い▼単語音声認識方式 | |
JPS61149997A (ja) | 音声認識装置 | |
JPS60158496A (ja) | 音声認識装置 | |
KR20030035286A (ko) | 소용량 음성인식 시스템 및 그 방법 | |
JPS61249099A (ja) | 音声認識装置 | |
JPS6193500A (ja) | 音声認識装置 | |
JPS6069694A (ja) | 語頭子音のセグメンテ−ション法 | |
JPS6242200A (ja) | 音声認識装置 |