JPS6148000A - 連続音声認識方式 - Google Patents

連続音声認識方式

Info

Publication number
JPS6148000A
JPS6148000A JP59169598A JP16959884A JPS6148000A JP S6148000 A JPS6148000 A JP S6148000A JP 59169598 A JP59169598 A JP 59169598A JP 16959884 A JP16959884 A JP 16959884A JP S6148000 A JPS6148000 A JP S6148000A
Authority
JP
Japan
Prior art keywords
vowel
pattern
standard pattern
matching
constant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59169598A
Other languages
English (en)
Inventor
佐藤 泰雄
教幸 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59169598A priority Critical patent/JPS6148000A/ja
Publication of JPS6148000A publication Critical patent/JPS6148000A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、連続音声認識方式、特に子音の認識率の向上
を図った連続音声認識方式に関するものである。
〔従来の技術〕
連続的に発声された音声を認識する方式としては翫2段
D P ’(Dynamic Programming
)、LB、(L−evel Building)法、C
WD P (Clockwised Dyna−mic
 P?ogramming)法等のDP法を用いた照合
方式が知られている。
第3図は、2段DPを用いた従来の連続音声認識方式を
示す図である。図において、1は前処理部、2はパラメ
ータ抽出部、3は切替部、4は登録部、5は2段DP照
合部である。
この従来の連続音声認識方式によれば、特定話者が単音
節単位に区切って発声した入力音声の個々の単音節音声
を、前処理部1において雑音を除くなどの前処理を行っ
た後に、パラメータ抽出部2において音声の特徴を表す
特徴パラメータを抽出する。特徴パラメータとしては、
例えば複数チャンネルの帯域フィルタの出力を一定周期
でサンプリングしたパラメータなどが用いられる。抽出
された特徴パラメータは、切替部3を経て登録部に送ら
れ標準パターンとして登録される。
以上のようにして特定話者の音声の標準パターンが登録
部4に登録された状態の下で認識処理が行なわれる。前
記特定話者により複数個の音節を連続的に発声した音声
が入力されると、この未知入力連続音声は、前処理部1
およびパラメータ抽出部2において前述したと同様の処
理がなされ、得られた入力パターンは切替部3を経て2
段DP照合部5に送られる。
2段DP照合部5では、連続音声を認識単位としての単
音節に区分(セグメンテーション)すると共に、登録部
4に予め登録しておいた標準パターンのあらゆる組合せ
に対してDP照合を行い距離の最も小さい(類似度が最
大の)標準パターン系列を認識結果として出力している
(発明が解決しようとする問題点〕 このような従来の連続音声認識方式では、2段DP照合
部5において、セグメンテーションが仮に正しく行われ
たとしても、DP照合は入力パターン全体にわたって行
われるため、DP照合にあたり母音部分に対する重みが
大きくなり、したがって子音部分の重みが小さくなる結
果、子音部分の細かい特1改の差がDP照合の距離に十
分反映されないため、子音の認識を誤りやすいという問
題があった。
第4図は、例えば音声人力が/kani/である場合の
入力パターンを示す。セグメンテーションにより、認識
単位である単音節/ k a /の部分と単音節/ n
 i /の部分とに区分されると共に、DP照合は入力
バクーン全体にわたる照合区間で行われる。このような
全体にわたるDP照合では、子音/に/および/n/の
重みよりも母音/a/および/i/の重みが大きいので
、DP照合の結果を例えば/ a i /、/ k a
 m i /等に誤る可能性が高くなる。
〔問題点を解決するための手段〕
本発明の目的は、連続音声の認識において、子音の認識
の誤りを軽減させた連続音声認識方式を提供することに
ある。
本発明の連続音声認識方式は、単音節単位に区切って発
声された単音節音声を分析して得られた音響的特徴を表
す標準パターンを予め登録しておく登録部と;複数個の
音節を連続的に発声した未知人力音声を分析して得られ
た音響的特徴を表す入力パターンを、認識単位としての
単音声の各部分に区分し、前記入力バター・ンの各部分
に前記登録部に登録されている単音節音声の標準パター
ンを所要の個数だけ整合させて、前記入力パターンとの
類似度が最大となる標準パターン系列を求める照合部と
;得られた標準パターン系列に対応する前記入力パター
ンの各部分の再照合を行うために、前記各部分の区間中
の母音定常部および前記標準パターンの母音定常部を抽
出する母音定常部抽出部と;前記各部分区間の始端から
前記母音定常部までを前記各部分の再照合対象区間とし
、個々の再照合対象区間に対して、照合区間を前記標準
パターンの始端から前記母音定常部までとした標準パタ
ーンと再照合する再照合部とを備えることを特徴とする
ものである。
〔作用〕
人力未知音声について、2段DP照合部でセグメンテー
ションが終了した後、区分された入力パターンの各部分
の母音定常部を求める。一方、登録部に登録されている
単音節音声の標準パターンについても母音定常部を求め
る。入力パターンの各部分については、各部分の区間の
始端から母音定常部までをDP照合区間とし、標準パタ
ーンについては標準パターンの始端から母音定常部まで
をDP照合区間として、入力パターンの各部分について
それぞれDP照合による再照合を行う。DP照合区間を
このように定めた場合におけるDP照合においては、母
音に対する重みが下がる結果、子音の誤りを下げること
が可能となる。
〔実施例〕
以下、図面を参照して本発明の実施例を詳細に説明する
第1図は、本発明の一実施例を示す図である。
本実施例は、第3図図示の従来の連続音声認識方式に、
さらに、母音定常部抽出部6と、DP照合部7とを付加
したものである。したがって、第3図の要素と同一の要
素には、同一の番号を付して示す。
本実施例によれば、未知入力連続音声は、切替部3を経
て2段DP照合部5に送られる。今、未知入力連続音声
が/ k a n i /であるものとすれば、2段D
P照合部では、セグメンテーションにより、認識単位と
しての単音節/ k a /と/ni/とに区分される
第2図は、本実施例の理解を助けるため、セグメンテー
ションが行われた未知入力音声/ k a ni/の入
力パターンを示す。この入力パターンは、セグメンテー
ションによって単音節/ k a /の部分と単音節/
 n i /の部分とに区分されている。
母音定常部抽出部6Lよ、区分された入力パターンの各
部分に対して定常部を抽出する。一般に入力パターンの
各部分は母音部分で安定するから、抽出された定常部は
母音定常部とみなすことができる。したがって、母音定
常部は母音の特徴を十分に表している部分である。本例
では各部分の母音定常部は/a/の母音部分および/i
/の母音部分にある。母音定常部抽出部6では、また、
登録部4に登録されている単音節音声の標準パターンの
母音定常部を抽出する。母音定常部が抽出された入力パ
ターンの各部分および標準パターンは、DP照合部7に
送られる。
DP照合部では、入カバクーンの各部分の母音定常部以
降のパターン部分(第2図において、斜線を施して示す
)を削除すると共に、標準パターンについても母音定常
部以降のパターン部分を削除する。そして、入力パター
ンの各部分について、それぞれ、標準パターンとのDP
照合を行う。したがって、単音節音声/ k a /お
よび/ n i /についてのDP照合区間は、第4図
に示す如(である。すなわち、入力パターンの各部分の
区間の始端から母音定常部までである。
このような入力パターンの各部分についての再照合によ
れば、母音定常部以降のパターン部分が削除されている
ので、DP照合における母音部分/a/および/i/の
重みが小さくなる結果、相対的に子音部分/に/および
/n/の重みが増すこととなる。したがって、DP照合
部7は、このような再照合により入力パターンの各部分
について、単音節音声/ k a /および/ n i
 /であると判定して認識結果を出力する可能性が高く
なる。
以上の実施例では、セグメンテーションを行うために2
段DPを用いたが、LB法あるいはCWDP法等を用い
ることができることは言うまでもない。
〔効果〕
以上説明したように、本発明によれば、未知入力連続音
声のセグメンテーションを行った後、区分された入力パ
ターンの各部分について母音定常部を抽出し、かつ、標
準パターンについても母音定常部を抽出し、再照合対象
区間を、入力パターンの各部分については各部分の区間
の始端より母音定常部までとし、標準パターンについて
は標準パターンの始端より母音定常部までとして、各部
分についてDP照合を行うので、母音部分の重みが下が
る結果、子音の認識を誤る率の少ない連続音声認識方式
を得ることが可能となる。
【図面の簡単な説明】
第1図は、本発明連続音声認識方式の一実施例を示すブ
ロック図、第2図は、第1図図示の実施例の動作を説明
するための入力パターンを示す図、第3図は、従来の連
続音声認識方式を示すブロック図、第4図は、入力パタ
ーンの一例を示す図である。 図中、1は前処理部、2はバラメーク抽出部、3は切替
部、4は登録部、5は2段DP照合部、6は母音定常部
抽出部、7はDP照合部をそれぞれ示す。 特許出願人   冨士通株式会社 代理人弁理士  森 1) 寛(外1名)口     
        ロ −J 六            ←

Claims (1)

    【特許請求の範囲】
  1. 単音節単位に区切って発声された単音節音声を分析して
    得られた音響的特徴を表す標準パターンを予め登録して
    おく登録部と;複数個の音節を連続的に発声した未知入
    力音声を分析して得られた音響的特徴を表す入力パター
    ンを、認識単位としての単音声の各部分に区分し、前記
    入力パターンの各部分に前記登録部に登録されている単
    音節音声の標準パターンを所要の個数だけ整合させて、
    前記入力パターンとの類似度が最大となる標準パターン
    系列を求める照合部と;得られた標準パターン系列に対
    応する前記入力パターンの各部分の再照合を行うために
    、前記各部分の区間中の母音定常部および前記標準パタ
    ーンの母音定常部を抽出する母音定常部抽出部と;前記
    各部分区間の始端から前記母音定常部までを前記各部分
    の再照合対象区間とし、個々の再照合対象区間に対して
    、照合区間を前記標準パターンの始端から前記母音定常
    部までとした標準パターンと再照合する再照合部とを備
    えることを特徴とする連続音声認識方式。
JP59169598A 1984-08-14 1984-08-14 連続音声認識方式 Pending JPS6148000A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59169598A JPS6148000A (ja) 1984-08-14 1984-08-14 連続音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59169598A JPS6148000A (ja) 1984-08-14 1984-08-14 連続音声認識方式

Publications (1)

Publication Number Publication Date
JPS6148000A true JPS6148000A (ja) 1986-03-08

Family

ID=15889456

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59169598A Pending JPS6148000A (ja) 1984-08-14 1984-08-14 連続音声認識方式

Country Status (1)

Country Link
JP (1) JPS6148000A (ja)

Similar Documents

Publication Publication Date Title
JPS62232691A (ja) 音声認識装置
Kamble et al. Emotion recognition for instantaneous Marathi spoken words
JPS6148000A (ja) 連続音声認識方式
JP2019101285A (ja) 音声処理装置、音声処理方法及びプログラム
JP2813209B2 (ja) 大語彙音声認識装置
JPS5887599A (ja) 音声単語認識装置
JP3808732B2 (ja) 音声認識方法及びそのシステム
JP2856429B2 (ja) 音声認識方式
JP2757356B2 (ja) 単語音声認識方法および装置
JP2000148187A (ja) 話者認識方法、その方法を用いた装置及びそのプログラム記録媒体
JPS5934595A (ja) 音声認識処理方式
JP2572753B2 (ja) 不特定話者子音識別装置
JPH0316038B2 (ja)
JP2655637B2 (ja) 音声パターン照合方式
JPS6053997A (ja) 音素判別法
JPS6147994A (ja) 音声認識方式
JPS62209498A (ja) 連続音声認識方法
JPS62119594A (ja) 単語音声認識装置
JPS58176699A (ja) 音声標準パタ−ン登録方式
JPS59124390A (ja) 候補削減音声認識方式
JPS63161500A (ja) 音声認識装置
JPH079598B2 (ja) 音声認識装置における標準パラメ−タの修正方法
JPS6147996A (ja) 音声認識方式
JPH06103439B2 (ja) 音声認識装置
JPH0711760B2 (ja) 音声認識装置における標準パラメ−タの修正方法