JPS599080B2 - 音声認識方法 - Google Patents

音声認識方法

Info

Publication number
JPS599080B2
JPS599080B2 JP50062210A JP6221075A JPS599080B2 JP S599080 B2 JPS599080 B2 JP S599080B2 JP 50062210 A JP50062210 A JP 50062210A JP 6221075 A JP6221075 A JP 6221075A JP S599080 B2 JPS599080 B2 JP S599080B2
Authority
JP
Japan
Prior art keywords
group
symbol string
phoneme
unit
vowel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP50062210A
Other languages
English (en)
Other versions
JPS51138104A (en
Inventor
泰雄 佐藤
満雄 村上
博也 藤崎
英一 白鳥
博 平川
好朗 野口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP50062210A priority Critical patent/JPS599080B2/ja
Publication of JPS51138104A publication Critical patent/JPS51138104A/ja
Publication of JPS599080B2 publication Critical patent/JPS599080B2/ja
Expired legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は、音声認識方法特に比較的高い信頼度で認識が
できる第1群の音素(例えば母音)を時系列に配列した
記号列を用いて、先ず音声認識処理を行ない、該記号列
のみでは区別できない複数の単語が存在する場合、それ
らの単語の第2群の音素(例えば子音)中の上記単語を
相互に区別するのに必要な認識限界音素について照合を
とるようにし、認識の信頼度の確保と処理時間の短縮を
はかるようにした音声認識方法に関するものである。
連続音声にみられるすべての変動要因に対処し得るよう
な音声認識の実現は現段階では困難であり、最近では、
特定の音素の組合わせ即ち限定された数の単語を認識の
対象とし、更に特定の話者の音声の認識に先立つてその
音声をあらかじめ登録することにより、変動要因の大部
分を回避して実用に耐える信頼度を得るようにしている
この種の特定話者の音声の登録を前提とした従来の限定
語業単語の認識方式は、登録単語と未知入力単語との照
合を、(i)連続的パラメータのレベルで行なう方式と
、(11)離散的記号列のレベルで行なうものとに大別
される。しかし前者(1)の方式の場合記憶容量と照合
時間の増大が問題となり、後閤11)の方式では認識率
の低下が問題となり一方それを補なおうとするとその処
理が複雑となる難点をそなえている。本発明は上記の点
を解決することを目的としており、単語中の音素を比較
的高い信頼度で認識できる第1群の音素例えば母音とそ
れ以外の第2群の音素例えば子音とに分離し、第1群の
音素については上暉11)の方式を採用して先ず未知入
力単語の認識を行ない、なお区別できない複数の単語が
存在する場合のみ上記第2群の音素について上記(1)
の方式を採用して照合を行なうようにし、高信頼度と処
理時間の短縮化とをはかるようにすることを目的として
いる。
そしてそのため、本発明の音声認識方法は音声信号の周
波数分析結果を利用して各音素に対応するパラメータを
抽出して音声認識を行なう音声認識方法において、当該
音声認識を行なう装置に、単語を予め定めた第1群の音
素区間とそれ以外の第2群の音素区間とに分離するセグ
メンテーシヨン部、上記第1群の音素を時系列に配列し
た記号列を抽出する第1群音素記号列抽出部、該抽出さ
れた第1群音素記号列を格納する第1群音素記号列辞書
部、上記第1群音素記号列のみでは区別し得ない複数の
単語が存在する場合、それらを相互に区別するに必要な
第2群音素中の認識限界音素のパラメータを当該単語に
対応して登録する第2群音素バラメータ登録部、未知入
力音声に対応した第1群音素記号列と上記辞書部の内容
とを照合する第1群音素記号列照合部、および未知入力
音声に対応した上記認識限界音素パラメータと上記登録
部の内容とを照合する第2群音素パラメータ照合部が夫
々もうけられ、未知入力音声に対応して上記第1群音素
記号列照合部による照合を行ない、該照合結果のみでは
区別できない複数の単語があるときは、上記第2群音素
パラメータ照合部による照合を行なうようにしたことを
特徴としている。以下図面を参照しつつ説明する。第1
図は本発明の音声認識方法の一実施例構成、第2図は単
語に対応して辞書部に格納される第1群音素記号列と登
録部に登録される第2群音素の認識限界音素とをテーブ
ルにまとめた説明図、第3図は第2図図示テーブルの内
容を訂正した場合の説明図を示す。
第1図において、1は前処理手段で音声を例えば14チ
ヤンネルの周波数信号に分解するもの、2はパラメータ
抽出部で各音素のセグメンテーシヨンと認識および照合
とに用いるべきパラメータを得るもの、3はセグメンテ
ーシヨン部で上記パラメータ抽出部2で抽出したパラメ
ータを第1群の音素(以下簡単のため母音と略称する)
の区間と第2群の音素(以下簡単のため子音と略称する
)の区間とに区切るもの、4は母音パラメータ格納部で
標準の母音1a1.1i1.1u1、1e1、101に
対応するパラメータを保持しておくもの、5は母音認識
部で上記セグメンテーシヨン部3によつて分離された母
音パラメータについて上記母音パラメータ格納部4の内
容と比較して対応する母音を決定するもの、6は母音記
号列抽出部で上記母音認識部5で決定された母音を時系
列に配列した母音記号列を抽出するもの、7は1次辞書
修整部で必要に応じて後述の辞書部に格納された内容を
例えば特定話者に応じて修整するもの、8は1次辞書部
で登録モードにおいて母音記号列を格納しておくもの、
9は登録子音部決定部で母音記号列のみでは互に区別で
きない複数の単語が存在する場合これら各単語を区別す
るに必要な子音即ち認識限界子音の区間を決定するもの
、10は子音パラメータ登録部で上記登録子音決定部に
よつて決定された認識限界子音のパラメータを登録して
おくもの、12は母音記号列照合部で単語認識モード時
未知入力音声の母音記号列と上記辞書部8の内容との照
合を行なうもの、11は母音記号列修整部で認識モード
時上記母音記号列照合部12による照合の結果、未知入
力音声の母音記号列と同一の記号列が前記辞書部8に存
在しない場合に、前記母音認識部5において得られる母
音認識結果を修整するもの、13は認識限界子音照合部
で単語認識モード時に後述のコントローラの指示に応じ
て未知入力音声中の認識限界子音パラメータと上述の登
録部10の内容との照合を行なうもの、14はコントロ
ーラ、15は出力部を夫々表わしている。
またSWl,SW,,SW,は夫々概念的に機械的スイ
ツチの形で表わしたデータ方向切替部で各モードに対応
して切替えられるものを表わす。なお上記登録子音部決
定部9において認識限界子間を決定する必要がある場合
、それら各単語がどんな単語であるかは後述する如く後
述の「単語登録モード」の際に知ることができるから、
それら単語間を識別し得る子音が選定されればよい。な
お図中の実線はデータ線を表わし、点線は信号線を表わ
す。本発明による音声認識方式は、大別して3つのモー
ド即ち、(7!標準母音パラメータ格納モード(以下格
納モードという)、(B)単語登録モード、およ轄Q単
語認識モードとをそなえている。
以下各モードについて順を追つて説明をつづける。囚
格納モード図示のデータ方向切替手段SWlを図示状態
からA側に切替えておく。
そして標準母音1a1、11.1u1.1e1J01を
発声し、該各母音の代表的な区間をセグメンテーシヨン
部によつて検出し、その区間の母音バラメータの平均値
を母音バラメータ格納部4に格納保持しておく。
(B)単語登録モード 図示のデータ方向切替手段SWl,SW2,SW3は夫
々B側に切替えておく。
今説明の都合上単語「ASI」「AZE]「KAZE」
「AKAI」「AKAMI」「AMAMI」を登録する
と仮定する。先ず予め全登録単語に関してその音素記号
列を入力しそれに基づき各単語中の母音記号列を抽出し
相互の母音記号列を比較し、同一の母音記号列を有する
単語に関してはそれぞれの認識限界子音を決定し第2図
に該略示される如く各単語の音素記号列とその母音記号
列及び認識限界子音の有無と、存在する場合にはその内
容とを併記した1次辞書を構成しておく。
例えば第1の単語「ASI」に対応して母音記号列「A
cI」を抽出する。
ここで「c」はその存在によつて「AcI」が母音連続
ではないことを示している。「AcI」は他の単語の母
音記号列と比較した結果同一の母音記号列が他の単語中
に存在しないため単語[ASI」は認識限界子音は存在
せず、母音記号列のみで認識可能となる。第2、第3の
単語「AZE」、「KAZE」について単語答録モード
で登録が行なわれる場合を考える。
この場合、両者は共に、母音記号列が[AcE」である
ため母音記号列のみでは両者と異なる単語として認識で
きず、両者の母音「A」の先行部分を認識限界子音とす
ることによつて両者を区別できる。すなわち単語「AZ
E」に関しては「φ(4)」、「KAZE」に関しては
「KCA)」を認識限界子音とし、母音記号列が[Ac
E」である単語に関しては母音「A」の前が「φ(A)
」であるか「K(A)」であるかによつてそれぞれ単語
「AZE」、VKA!ZE]と認識される。
なおここでφ(4)は母音「A」の前に子音が存在しな
いことを示している。同様にして単語「AKAI」は母
音記号列[AcAI」のみで認識可能であり、又単語「
AKAMl」、「AMAMI」は共に母音記号列が「A
cAcI」であるためそれぞれの認識限界子音は「CA
)K(AJ上「(A)M(A)」となる。このような1
次辞書の構成はオフ・ライン操作によつて、前もつて構
成することが可能である。
上記の手段によつて1次辞書を構成した後単語「ASI
」、[AMAMI」などを順次に発音したとすると、例
えば「ASI」なる発音に応じてセグメンテーシヨン部
3は母音区間[A」及び「I」と「A」に先行する区間
子音[S]に対応する区間及び[1」に後続する区間(
即ちφ(A)、CA)S(1)、(1)φ)を区切り、
その結果母音「A]及び「I」に対応する(バラメータ
抽出部2により抽出された)バラメータは母音認識部5
で、それぞれ母音「A」、「I」であると認識され、ま
た他の「φ(4)」「(A)S(1)」「(1)φ」に
対応するパラメータは登録子音決定部9に導かれ、一時
記憶される。母音記号列抽出部6では認識された母音[
A」「I」から第1の入力単語(即ち[ASI」)につ
いて「AcI」なる母音記号列を抽出し、それは1次辞
書修整部7に送られ、1次辞書部8中の「ASI」の母
音記号列と比較されその結果認識限界子音が指定される
「ASI」に関しては認識限界子音が存在しないため登
録子音決定部9に一時記憶されている上記パラメータは
子音パラメータ登録部10には送られない。第2の単語
「AZE」が発音された場合は、上記と同様にして母音
記号列「AcE」が抽出され、1次辞書部8中の認識限
界子音が「φ(A)」であるため、登録子音決定部9に
一時記憶されている「φ(A)]のパラメータはパラメ
ータ登録部10に送られる。
同様に「KAZE」に関しては「KCA)」のパラメー
タ登録部10に送られる。同様にして順次第6の単語「
AMAMI」まで発声され対応する認識限界子音10に
登録される。実際に発声された単語中の母音記号列はそ
の音響的特徴が種々の原因によつて変動するため1次辞
書部8中の母音記号列とは異なる場合がある。
その結果母音記号列が異なる場合は、1次辞書修整部7
によつて1次辞書を修整する。例えば第1の単語「AS
I」の母音記号列「AcE」となつた場合他の単語「A
ZE」、「KAZE」と同一の母音記号列を有するため
、認識限界子音をそれぞれの単語に対してφ(4)S(
P、φCA)Z[F]、K(4)ZDと1次辞書修整部
7において修整し、その結果、1次辞書は第2図に示さ
れるものから第3図に示されるものとなる。
同時に、登録子音部決定部9中の認識限界子音に対応す
るバラメータはバラメータ登録部10に登録される。な
お単語登録モードにおいて修整された1次辞書及び認識
限界子音のパラメータをあわせて以下2次辞書と呼ぶこ
とにする。
(O単語認識モード 図示のデータ方向切替手段SWlはB.C側におかれ、
SW2およびSW,はB側からC側に切替えておく。
この状態において今例えば未知入力音声として単語「A
KAI」が発声されたとする。この場合、上記単語登録
モード時と同様に母音記号列抽出部6は母音記号夕肝A
cAI」を抽出し、それを母音記号列照合部12に送出
する。一方上記辞書部8の内容は母音記号列照合部12
に導びかれ、上記未知入力音声は母音記号列のみから単
語「AKAI」であるものと認識される。この結果はコ
ントローラ14に通知され、出力部15側に導びかれる
。上記に対し今例えば未知入力音声として単語[AKA
MI」が発声されたとする。
この場合、母音記号列抽出部6は母音記号列「AcAc
I]σを抽出し、それは母音記号列照合部12によつて
は第5の単語か第6の単語かを区別できない。
このことはコントローラ14に通知され、上記発声され
た未知入力音声(即ち単語「AKAMIJ)の認識限界
子音のパラメータが認識限界子音照合部13において、
子音パラメータ登録部10に登録されている第5の単語
および第6の単語の認識限界子音のパラメータと照合を
とられる。この結果未知入力音声の認識限界子音は第5
の単語のそれと判定され、この旨はコントローラ14に
通知され該未知入力音声は第5の単語[AKAMl」と
認識される。なお入力音声の母音記号列と同一の母音記
号列が辞書部8に存在しない場合には、母音記号列修整
部11において母音記号列抽出部6によつて抽出された
母音記号列をそれと類似する母音記号列に変更すること
が可能である。
以上説明した如く本発明によれば、単語中の音素を2群
に分け、比較的高い信頼度の認識が確保される第1群の
音素に関しては離散的記号列のレベルによる認識を行な
いこの記号列を用いた辞書を使用することによつて大幅
な処理速度の増大と記憶容量の減少を実現し、記号列の
みによつて認識を行なうことが不可能な単語に関しては
その第2群の音素中の限界子音のみの連続パラメータ、
レペルでの照合を行なうことによつて高信頼度の認識の
確保と記憶容量の増大を最小限にとどめている。
【図面の簡単な説明】
第1図は本発明の音声認識方法の一実施例構成第2図は
単語に対応して辞書部に格納される第1群音素記号列と
登録部に登録される第2群音素の認識限界音素とを併記
した1次辞書説明図、第3図は登録モード時修整された
1次辞書の説明図を示す。 第1図中、2はバラメータ抽出部、3はセグメンテーシ
ヨン部、5は母音認識部、6は母音記号列抽出部、8は
辞書部、10は子音パラメータ登録部、12は母音記号
列照合部、13は認識限界子音照合部、14はコントロ
ーラを表わす。

Claims (1)

    【特許請求の範囲】
  1. 1 音声信号の周波数分析結果を利用して各音素に対応
    するパラメータを抽出して音声認識を行なう音声認識方
    法において、当該音声認識を行なう装置に、単語を予め
    定めた第1群の音素区間とそれ以外の第2群の音素区間
    とに分離するセグメンテーシヨン部、上記第1群の音素
    を時系列に配列した記号列を抽出する第1群音素記号列
    抽出部、該抽出された第1群音素記号列を格納する第1
    群音素記号列辞書部、上記第1群音素記号列のみでは区
    別し得ない複数の単語が存在する場合、それらを相互に
    区別するに必要な第2群音素中の認識限界音素のパラメ
    ータを当該単語に対応して登録する第2群音素パラメー
    タ登録部、未知入力音声に対応した第1群音素記号列と
    上記辞書部の内容とを照合する第1群音素記号列照合部
    、および未知入力音声に対応した上記認識限界音素パラ
    メータと上記登録部の内容とを照合する第2群音素パラ
    メータ照合部が夫々もうけられ、未知入力音声に対応し
    て上記第1群音素記号列照合部による照合を行ない、該
    照合結果のみでは区別できない複数の単語があるときは
    、上記第2群音素パラメータ照合部による照合を行なう
    ようにしたことを特徴とする音声認識方法。
JP50062210A 1975-05-23 1975-05-23 音声認識方法 Expired JPS599080B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP50062210A JPS599080B2 (ja) 1975-05-23 1975-05-23 音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP50062210A JPS599080B2 (ja) 1975-05-23 1975-05-23 音声認識方法

Publications (2)

Publication Number Publication Date
JPS51138104A JPS51138104A (en) 1976-11-29
JPS599080B2 true JPS599080B2 (ja) 1984-02-29

Family

ID=13193537

Family Applications (1)

Application Number Title Priority Date Filing Date
JP50062210A Expired JPS599080B2 (ja) 1975-05-23 1975-05-23 音声認識方法

Country Status (1)

Country Link
JP (1) JPS599080B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS637172U (ja) * 1986-06-27 1988-01-18

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5647100A (en) * 1979-09-25 1981-04-28 Nippon Electric Co Continuous singleeworddvoice identifier
JPS5713494A (en) * 1980-06-26 1982-01-23 Fujitsu Ltd Voice recognition processing system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS637172U (ja) * 1986-06-27 1988-01-18

Also Published As

Publication number Publication date
JPS51138104A (en) 1976-11-29

Similar Documents

Publication Publication Date Title
JP2739945B2 (ja) 音声認識方法
JPS599080B2 (ja) 音声認識方法
JPS6332394B2 (ja)
JPS5939760B2 (ja) 音声認識装置
EP3496092B1 (en) Voice processing apparatus, voice processing method and program
JP3039453B2 (ja) 音声認識装置
JPS5936759B2 (ja) 音声認識方法
JPS645320B2 (ja)
JPS6011897A (ja) 音声認識装置
JPS6239749B2 (ja)
JPH079598B2 (ja) 音声認識装置における標準パラメ−タの修正方法
JPS62165699A (ja) 音声認識装置における標準パラメ−タの修正方法
JPS63798B2 (ja)
JPS60147797A (ja) 音声認識装置
JPS58159591A (ja) 単音節音声認識方式
JPS6118758B2 (ja)
JPS59211098A (ja) 音声認識装置
JPH01154098A (ja) 音声認識装置
JPS5962900A (ja) 音声認識方式
JPH01290000A (ja) 音声認識方式
JPH06100919B2 (ja) 音声認識装置
JPS62111292A (ja) 音声認識装置
JPS6115440B2 (ja)
JPS5988798A (ja) 音声認識処理方式
JPH0575120B2 (ja)