JPS59116700A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS59116700A
JPS59116700A JP57232514A JP23251482A JPS59116700A JP S59116700 A JPS59116700 A JP S59116700A JP 57232514 A JP57232514 A JP 57232514A JP 23251482 A JP23251482 A JP 23251482A JP S59116700 A JPS59116700 A JP S59116700A
Authority
JP
Japan
Prior art keywords
filter
speaker
section
input signal
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57232514A
Other languages
English (en)
Inventor
坂田 富生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP57232514A priority Critical patent/JPS59116700A/ja
Publication of JPS59116700A publication Critical patent/JPS59116700A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 この発明は、特定話者用の音声認識装置に関する。
〔発明の技術的背景とその問題点〕
近年、音声認識装置は、各分野に多用されるなど、極め
て有用な装置になりつつある。このよう麦音声認識装置
は、基本的には入力音声信号を分析して特徴パラメータ
(スペクトルパラメータ)を抽出する分析部、この分析
部からのスペクトルパラメータに正規化等の処理を行な
う前処理部および認識結果を出力する認識部とからなる
。すなわち、分析部で抽出されたスペクトルパラメータ
に基づいて、入力音声信号の音韻、音節、および単語等
の認識が行なわれることになる。
上記分析部は、音響分析装置からなシ、上記スペクトル
パラメータとして、チャネルフィルタによる周波数スペ
クトルが利用される。このチャネルフィルタは、例えば
デジタルフィルタで、対象周波数帯域を適当に分割する
ように周波数特性が設定されたものである。
ところで、音声認識装置は、特定の話者だけを特徴とす
る特定話者用と、不特定多数の話者を特徴とする特定話
者用とに大別される。この中で、特定話者用音声認識装
置では、話者は予め自分の声を標準パターンとして登録
しておく必要がある。これは、同一の音韻、単語であっ
ても、音響分析装置によシ得られる特徴パラメータから
なるパターンは、話者によって変動しまた同じ話者でも
その時々によって相当変動するからである。この変動は
、通常、発声者毎の発声器官形状の相違に起因する周波
数方向の変動、および発声の仕方の相違に起因する時間
軸方向の変動に大別できる。従来では、上記の変動の中
で時間軸方向の変動は、不等間隔サンプリング、ダイナ
ミックプログラミング等の手段により吸収されていた。
しかしながら、周波数軸方向の変動に対しては、これを
吸収するための効果的な手段がなかった。そのため、話
者毎に全ての標準パターンを登録する必要があり、認識
対象語数が増加した場合には標準パターンの登録が話者
にとって大きな負担になる。また、多くの話者の標準パ
ターンを登録しておくことになるため、標準パターンを
記憶するメモリは大容量のものが必要となる欠点があっ
た。
〔発明の目的〕
この発明は上記の事情に鑑みてなされたもので、その目
的は、特定話者用音声認識装置において、話者毎の周波
数軸方向の変動に影響されない音声の特徴パラメータを
抽出して、音声認識に必要な標準パターンの登録量を特
別に大きくすることなく、確実に音声認識を行なうこと
ができる音声認識装置を提供することにある。
〔発明の概要〕
この発明は、特定話者の音声入力信号に対して、例えは
デジタルフィルタであるチャネルフィルタにより音響分
析が行なわれる。この場合、周波数分析用であるチャネ
ルフィルタに対して、その構成太素である各BPF (
バンド・ぐスフィルタ)の周波数特性を話者毎の周波数
軸方向の変動を吸収するように可変設定する。そして、
チャネルフィルタから出力するスペクトルパラメータに
基づいて、音声認識が行なわれるものである。
〔発明の実施例〕
以下図面を参照してこの発明の一実施例について説明す
る。図はこの発明に係る音声認識装置の構成を示すブロ
ック図である。図中、10はアナログ・デジタル変換部
(以下A/D変換部と称する)で話者が発声するアナロ
グ音声入力信号Aを量子化されたサングル値のデジタル
信号系列りに変換する。デジタルフィルタ部IIは、上
記デジタル信号系列りが与えられ、フィルタパラメータ
Fに基づいて周波数分析を行なって、音声入力信号Aに
対応するスペクトル・ぞラメータ(特徴パラメータ)P
を抽出し出力する。フィルタパラメータFは、フィルタ
特性変換部12から出力する。このフィルタ特性変換部
I2は、予め標準母音スペクトルパラメータ系列を記憶
するメモリを備え、この標準母音スRりトルパラメータ
系列およ−びデジタルフィルタ;iSPのスペクトルパ
ラメータの両者に基づいて特定話者に適合するフィルタ
パラメータ(周波数特性)Fを出力する。前処理部13
は、デジタルフィルタ部11から与えられるスペクトル
パラメータPに正規化等の処理を行なって、認識処理に
必要なサングル・ぐターンSPを作成して出力する。そ
して、認識部14は、予め辞書メモリ15に格納される
標準・やターンBPおよび上記サンプルパターンSPに
基ついて、音声入力信号Aのカテゴリを決定し話者が発
声した単語、音韻、音節等を認識することになる。
このような構成において、その動作を説明する。この発
明では、学習モード(音響分析動作)および実行モード
(音声認識動作)の2種類の動作モードに分けられる。
まず、学習モードでは、特定話者は予め設定された数種
類の母音を発声する。この発声した音声入力信号Aは、
A/D変換部10で上記のようにデジタル信号りの時系
列として変換される。デ・ゾタルフィルタ部11は、n
チャネル分のバンドパスフィルタ(BPF )の機能を
有し、上記デノタル信号系列Dに対して各チャネルのB
PF出力を時分割で計模し、1フレーム毎にnチャネル
分の周波数スペクトルパラメータ系列P1〜Pnを出力
する。
フィルタ特性変換部12は、デジタルフィルタ部11で
抽出されたスペクトルパラメータ系列P1〜Pnおよび
上記のように予め記憶している標準母音スペクトルパラ
メータ系列の両者に基づいて、特定話者に適合したフィ
ルタ周波数特性(フィルタパラメータF)を決定し、デ
ジタルフィルタ部?’7にセットする。即ち、フィルタ
特性変換部12は、話者毎の発声器官形状の相違に起因
する周波数スペクトル・やターンの変動を吸収するよう
にデジタルフィルタ部11の周波数特性を設定すること
になる。
このようにして、デジタルフィルタ部11のフィルタパ
ラメータFがセットされると、実行モードの動作が行な
われる。即ち、特定話者が発声した音声入力信号Aから
、デジタルフィルタ部11によシス被りトルパラメータ
系列P1〜Pnが出力される。このスペクトルノやラメ
ータ系列P1〜Pnは、前処理部13に与えられる。
前処理部13では、所定の音声区間で切出されたスペク
トルパラメータ系列P1〜Pnを時間軸方向に正規化し
て、一定次元数のサンプルパターンベクトルS P (
hlT h2− fin l f211fmnとする)
を作成する。具体的には、前処理部13では、まず各フ
レームでの全帯域のエネルギー等の適轟なパラメータを
用いて、音声区間の始端、終端検出を行ない音声区間を
切出す。
この音声区間の始端、終端検出では、エネルギーが予め
定められた閾値を予め決められたフレーム数だけ連続し
て越えているときに、最初に閾値を越えたフレームを始
端とする。さらに、始端以降で、エネルギーが予め定め
られた閾値を予め決められたフレーム数だけ連続して下
まわるとき、最初に閾値を下まわったフレームの直前の
フレームを終端とするような一般的な方式で行なわれる
とする。
次に、認識部14では、前処理部13から出力されたサ
ンプルパターンベクトルSPおよび辞書メモリ15に格
納されている標準パターン(t)。
ベクトルBP(ψ・・、l=1〜N、j=1〜M1コ とする)とから、音声入力信号Aのカテゴリを決定する
。具体的には、例えば複合類似度法による認識処理が行
なわれる。即ち、サンプル/4’ターンベクトルをfi
1〜fmn N カテゴリLの標準・リーンベクトルを
綱とする。この場合、カテゴリtの辞書に対する複合類
似度S(4は、となる。ここで、λjは辞書作成用デー
タセットから作成した共分散行列の固有値でλ1〉λ2
〉・・・〉λMとしである。そして、上記式(1)で全
カテゴリの辞書に対する計算を行なって、類似度が最大
になる標準パターンのカテゴリを認識結果とする。但し
、最大類似度をSmax、2番目の類似度を5next
 とするとき、Smax )θ ・・・・・・・・・(
2)Smax −5naxt )Δθ  ・・・曲・・
(3)θ、Δθ:予め定められた閾値の条件を満足され
ないときは認識不能とする。
このようにして、特定話者が発声した音声信号を確実に
認識できる。しかも、この発明では、話者が予め数種類
の母音を発声するだけで、話者に適合したフィルタ周波
数特性(フィルタパラメータF)を決定しデジタルフィ
ルタ部11にセットできる。したがって、話者毎の発声
器官形状の相違に起因する音声の周波数特性の話者間変
動を、音声分析処理の段階で吸収することができる。こ
れにより、話者が変更する度に音声認識用の辞書メモリ
15の内容(標準パターン)を登録し直したシ、または
多数の話者用の標準パターンを全て登録することは不必
要となる。
なお、上記実施例において、デジタルフィルタ部11の
周波数特性を話者毎に適応化させる手段として、チャネ
ルフィルタ(デジタルフィルタ部22)を構成する個々
のBPFの周波数特性を固定したまま、チャネルフィル
タの出力に適当な係数マトリクスを掛けることによシ、
総合的な周波数特性を変化させる方式でもよい。
また、上記デジタルフィルタ部11の代シに、クロック
周波数により周波数特性の可変なスッチトキャパシタフ
ィルタを用いてもよい。
〔発明の効果〕
以上詳述したようにこの発明によれば、特定話者用音声
認識装置において、簡単な構成で話者毎に適合した周波
数特性を設定し、安定な音声の特徴パラメータを抽出で
きる。したがって、音声認識に必要な標準パターンの登
録量を特別に大きくすることなく、確実に音声認識を行
なうことができるものである。
【図面の簡単な説明】
図はこの発明の一実施例に係る音声認識装置の構成を示
すブロック図である。 11・・・デジタルフィルタ部、I2・・・フィ/L’
り特性変換部、I4・・・認識部、15・・・辞1メモ
リ。

Claims (1)

    【特許請求の範囲】
  1. フィルタパラメータの設定により周波数が可変され音声
    入力信号に対応するスペクトルパラメータを抽出するチ
    ャネルフィルタ手段と、予め記憶する標準母音スペクト
    ルパラメータおよび予め特定話者が発声した母音から上
    記チャネルフィルタ手段で抽出されるスペクトルパラメ
    ータの両者に基づいて特定話者に適合した所定の上記フ
    ィルクツ4ラメータを上記チャネルフィルタ手段に設定
    するフィルタ特性変換手段と、上記チャネルフィルタ手
    段から抽出されたスペクトルパラメータに基づいて上記
    特定話者の音声入力信号を認識する認識手段とを具備し
    たことを特徴とする音声認識装置。
JP57232514A 1982-12-23 1982-12-23 音声認識装置 Pending JPS59116700A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57232514A JPS59116700A (ja) 1982-12-23 1982-12-23 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57232514A JPS59116700A (ja) 1982-12-23 1982-12-23 音声認識装置

Publications (1)

Publication Number Publication Date
JPS59116700A true JPS59116700A (ja) 1984-07-05

Family

ID=16940519

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57232514A Pending JPS59116700A (ja) 1982-12-23 1982-12-23 音声認識装置

Country Status (1)

Country Link
JP (1) JPS59116700A (ja)

Similar Documents

Publication Publication Date Title
US5907826A (en) Speaker-independent speech recognition using vowel/consonant segmentation based on pitch intensity values
JPS5972496A (ja) 単音識別装置
US5144672A (en) Speech recognition apparatus including speaker-independent dictionary and speaker-dependent
JPS5844500A (ja) 音声認識方式
US4833714A (en) Speech recognition apparatus
KR20200045976A (ko) 음악 구간 검출 장치 및 방법
JPS59116700A (ja) 音声認識装置
EP1102240A1 (en) Interval normalization device for voice recognition input voice
JPS58149099A (ja) パタ−ン認識方式
JPH02173699A (ja) 音声認識装置
JPS6227798A (ja) 音声認識装置
KR100721558B1 (ko) 신호 처리 방법과, 그를 이용한 성대신호 특징추출 장치 및그 방법
JPH0469800B2 (ja)
JPH0323920B2 (ja)
JPS6229798B2 (ja)
JPH03120434A (ja) 音声認識装置
JPS61143800A (ja) 音声認識装置
JPS59124390A (ja) 候補削減音声認識方式
Blomberg et al. A device for automatic speech recognition
JPS60115996A (ja) 音声認識装置
JPS6329280B2 (ja)
JPH0546558B2 (ja)
JPH10177393A (ja) 音声認識装置
JPH0341839B2 (ja)
JPH02118698A (ja) 音声認識装置