JPS58224400A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPS58224400A
JPS58224400A JP57108743A JP10874382A JPS58224400A JP S58224400 A JPS58224400 A JP S58224400A JP 57108743 A JP57108743 A JP 57108743A JP 10874382 A JP10874382 A JP 10874382A JP S58224400 A JPS58224400 A JP S58224400A
Authority
JP
Japan
Prior art keywords
word
dictionary
divisions
waveform
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57108743A
Other languages
English (en)
Inventor
繁 佐々木
晋太 木村
奈良 泰弘
小林 敦仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57108743A priority Critical patent/JPS58224400A/ja
Publication of JPS58224400A publication Critical patent/JPS58224400A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 発明の技術分野 本発明は、単語単位の音声認識方式に関し、入力された
音声の分割数で辞書パターンを選択して、マツチング回
数の低減、認識率向上を図ろうとするものである。
従来技術と問題点 音声認識にはア、力、す、り・・・・・・入どの単音節
単位で認識する方式、およびワタクシワ、ニンゲン、・
・・・・・などの文節(助詞なども含めるので詳しくは
単語)単位で認識する方式があるが、本発明は後者に係
るものである。ところで従来の単語音声認識では、1単
語の発生長は長短様々であるから同じ長さに正規化して
から入力音声を辞書パターンと比較(マツチング)する
という方式をとっている。このため、(11認識可能単
語を多数にする(単語単位の認識では数千〜敵方の辞書
単語を用意しないと実用化にはほど遠い)とマツチング
回数が多くなる、(2)多数単語を用意すると認識率が
下がる、等の欠点がある。(2)は単音節の数がある程
度多い単語の方が少ない単語より認識率が高いという事
実に由来する。単語には単音節数の多いもの、少ないも
の種々あるのでこれを一律に扱わずに区別すれば、認識
処理つまり比較操作は少なくて済み、候補も絞られてい
るので認識率も上る。
発明の目的 本発明は、入力された音声と辞書パターンとのマッチン
グ処理回数を少数回で済むようにしてマツチング処理の
時間を減らし、比較的高速に多数の単語音声を確実にL
u i&する方式を提供しようとするものである。
発明の構成 本発明は、予め辞書に単語単位で発声登録しておく多数
の辞書パターンを各単語の分割数に従ってグループ分け
しておき、認識に当って入力される音声についてそのパ
ワー波形の立下りと該パワー波形の傾き波形の立上がり
との交点(ただし、パワーの最大値を1、最小値を0と
したとき、D〜0.5の範囲内の交点)を求めてその数
から分割数を求め、そして・該分割数によって前記辞書
の該当するグループだけを選択して該入力音声に対する
単語単位のマツチング処理を行うことを特徴とするが、
以下図面を参照しながらこれを詳細に説明する。
発明の実施例 一般に人力音声単語から正確に音韻(虫音節)単(ff
の切り出しを行うことは困幹であるため、本発明では音
声のパワー波形とその傾き波形の交点を分割点として音
声を分割する。第1図は本発明の一実施例を示す波形図
で、音声単語“同じ(ONAZi)  ”を例としたも
のである。発生された単語の音声はマイクロホンによっ
て電気信号(電圧値)に変換され、2乗することでパワ
ー波形が得られる。図中の実線曲線10は振幅を正規化
した該パワー波形で、その最大値(1)と最小値(0)
の中点(0,5)を傾き軸の中点(0)に一致させる。
1点鎖線20は傾き波形で、これはパワー波形10を微
分または差分することにより得られたものである。単音
節(この場合はOとNAとZi)の区切りはパワー波形
の谷11にあるが、ここを検出して切出したのでは特に
子音を含む単音節では遅過ぎることになる。また第1図
では波形を比較的滑らかに画いているが実際はぎざぎざ
の激しいものであるから、どれが谷か判然としない。そ
こで本発明ではパワー波形10の立ち下りと傾き波形2
0の立上りとの交点(ただし、正規化パワーの0〜0.
5の範囲内とする)30を分割点とする。この交点はは
一1点となり、しがも谷11の手前にあるので単音節切
出しにも有効に利用できるであろう。
第1図の例では交点3oが3個あることがら分割数−3
となる。この分割数で索引する辞書の各単語は第2図に
示すように予め上記要領で求めた分割数でグループ分け
しておく。第2図で、4゜は数千〜敵方の単語辞書パタ
ーン(単語音声信号を所要数のバンドパスフィルタに通
じて周波数分割し、それらを時間軸上でサンプリングし
デジタル化、圧縮処理等して時間軸と周波数軸のマトリ
クス上に表わしたもの)を記憶している辞書(メモリ)
で、41はそのうちの分割数が1の1.H辞書パターン
だけを集めたグループである。間様に42〜45は分割
数2.3.4そして5以上の単語辞書パターンを集めた
グループである。第1図の分割数3の単語はグループ4
3内の単語辞書パターンだけとマツチングされる。この
ため辞書40全体では敵方の単語が登録されていても、
実際のマツチングはグループ43内の数百〜数千のパタ
ーンについて行えばよいのでマツチング回数ハ著しく低
減され、マツチング時間は短縮される。
しかも、候補が絞られているので認識確度も高く、  
  ′勿論か\る認識のためにハードウェアを変更する
必要などは生じない。
発明の効果 以上述べた本発明の音声認識方式には次の利点がある。
(1)認識すべき単語数が増えた場合、音韻数の少ない
単語の認識率を低下させない。(2)認識すべき単語数
が増えても、マツチング量がそれほど増えないので、高
速にマツチング処理をすることができる。(3)従来の
辞書構成およびマツチング機構を変更する必要がない。
【図面の簡単な説明】
第1図および第2図は本発明の一実施例を示す波形図お
よび辞書構成の説明図である。 図中、10はパワー波形、2oはその傾き波形、30は
交点、40は辞書、41〜45は辞書グループである。 出 願 人  富 士 通 株式会社 代理人弁理士  青  柳    珍

Claims (1)

    【特許請求の範囲】
  1. 予め辞書に単語単位で発声登録しておく多数の辞書パタ
    ーンを各単語の分割数に従ってグループ分けしておき、
    認識に当って入力される音声についてそのパワー波形の
    立下りと該パワー波形の傾き波形の立上がりとの交点を
    求めてその数から分割数を求め、そして該分割数によっ
    て前記辞書の該当するグループだけを選択して該入力音
    声に対する単語単位のマツチング処理を行うことを特徴
    とする音声認識方式。
JP57108743A 1982-06-24 1982-06-24 音声認識方式 Pending JPS58224400A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57108743A JPS58224400A (ja) 1982-06-24 1982-06-24 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57108743A JPS58224400A (ja) 1982-06-24 1982-06-24 音声認識方式

Publications (1)

Publication Number Publication Date
JPS58224400A true JPS58224400A (ja) 1983-12-26

Family

ID=14492384

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57108743A Pending JPS58224400A (ja) 1982-06-24 1982-06-24 音声認識方式

Country Status (1)

Country Link
JP (1) JPS58224400A (ja)

Similar Documents

Publication Publication Date Title
JP3162994B2 (ja) 音声のワードを認識する方法及び音声のワードを識別するシステム
JPS5972496A (ja) 単音識別装置
Pols Real-time recognition of spoken words
EP0182989B1 (en) Normalization of speech signals
Christensen et al. A comparison of three methods of extracting resonance information from predictor-coefficient coded speech
JPS58224400A (ja) 音声認識方式
JPS58108590A (ja) 音声認識装置
Elghonemy et al. Speaker independent isolated Arabic word recognition system
JPS59185400A (ja) 単音節音声認識方式
Kobayashi et al. Word boundary detection by pitch contours in an artificial language
Lehiste et al. Some allophones of/l/in American English
JPH01158499A (ja) 定常雑音除去方式
JPS59219799A (ja) 音声認識装置
KR20030035286A (ko) 소용량 음성인식 시스템 및 그 방법
JPS6293000A (ja) 音声認識方法
JPS58116595A (ja) 単語音声認識装置
Lochbaum Segmentation of Speech into Voiced Sounds, Unvoiced Sounds, and Silence
JPS6011898A (ja) 音声認識装置
Peterson et al. Identification of Filtered Vowels
Foulkes Spectrographic technique for discerning formant frequencies
Zheng et al. A Chinese speech recognition system
JPS6069695A (ja) 語頭子音のセグメンテ−ション法
Barney et al. New artificial larynx
JPS63318600A (ja) 音声認識方式
Lehiste Acoustical clues to word boundaries