JPH0451840B2 - - Google Patents

Info

Publication number
JPH0451840B2
JPH0451840B2 JP27374185A JP27374185A JPH0451840B2 JP H0451840 B2 JPH0451840 B2 JP H0451840B2 JP 27374185 A JP27374185 A JP 27374185A JP 27374185 A JP27374185 A JP 27374185A JP H0451840 B2 JPH0451840 B2 JP H0451840B2
Authority
JP
Japan
Prior art keywords
speech
word
unit
distance
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP27374185A
Other languages
English (en)
Other versions
JPS62133499A (ja
Inventor
Satoshi Fujii
Katsuyuki Futayada
Taisuke Watanabe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP27374185A priority Critical patent/JPS62133499A/ja
Priority to US06/920,785 priority patent/US4885791A/en
Publication of JPS62133499A publication Critical patent/JPS62133499A/ja
Publication of JPH0451840B2 publication Critical patent/JPH0451840B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 産業上の利用分野 本発明は音声の内容を自動的に認識するための
音声認識装置に関するものである。
従来の技術 音声認識の従来例としては千葉他:「音声認識
システム」大型プロジエクトパターン情報処理シ
ステム研究開発成果発表会論文集(1980)に述べ
られてあり、電話音声の十数単語を対象に認識装
置として実用化されている。
従来の認識装置の構成及び処理の手順を第7図
にて説明する。音声が入力されると音声分析部5
0にて音声分析を行なう。分析法としては1次系
のフイルタを用いた適応等化と自己相関分析を行
い、20次元の分析パラメータをK−L変換によつ
て7次元の特徴ベクトルに圧縮する方法をとつて
いる。次に音声区間検出部51にて音声の振幅情
報によつて音声区間検出を行い、1組の音声区間
を得る。次に、時間圧縮部52にて時間圧縮を行
なう。これは発声速度の変動を正規化するための
もので、単語テーブル53上にあらかじめその単
語の音素構造を代表する時点を抽出できるような
抽出手順を与える情報をあらかじめ用意してお
き、この単語別に与えられた情報を参照しながら
抽出点を決定することにより安定な抽出点を得る
ことができる。抽出点の個数は共通に15個として
いるが線形伸縮できない。
次に、凸面上写像部54にて凸面上写像を行な
う。カテゴリの分離を改善するために、時間圧縮
部52より得られたパターンベクトルを凸面上へ
写像し、その後各カテゴリそれぞれにつき識別関
数値を識別関数値計算部57にて計算する。識別
関数部56は、凸面上写像部54での処理の後、
あらかじめ多数の音声サンプルで区分的線形識別
関数値計算部55により識別関数値計算を行うこ
とによつて求めておく。なお、識別関数値計算は
多段階法により行つている。これは行列規模が大
きくなると線形計画の反複過程が著しく増加する
ので、少数のサンプルを用いた識別関数の計算を
何段階かくり返し最終的に厳密にサンプルを分離
する識別関数を得る方法である。各段階で得られ
た区分識別関数をCijl(X)で表わすと、パター
ンベクトルXのクラスlに対する識別関数数値は
次式で与えられる。
gl(X)= min j( max i Cijl(X)) (1) ここでiは識別関数の断片を、jは段階を表わ
す。
発明が解決しようとする問題点 以上述べた従来例の方法では次の問題点を有し
ていた。
(1) ノイズの混入や電話回線の変動等による音声
区間の検出誤りで誤認識をおこしやすい。
(2) 時間圧縮による抽出点の個数が全てのカテゴ
リに共通であるため、判別に貢献しない抽出点
が含まれて判別の尖鋭度を低下させる。
(3) 判別に識別関数を用いており、話者の違いに
よる音韻のいずれに対して統計的距離尺度より
弱いと考えられる。
(4) 音声区間検出を規則の組合せとし行うため、
性能向上をはかると組合せが複数になる欠点が
ある。
本発明は上記問題点を解決するもので、ノイズ
の混入等による誤認識を軽減し、かつ判別精度の
向上をはかつた、不特定話者、少数語を対象とし
た音声認識装置を提供することを目的とするもの
である。
問題点を解決するための手段 本発明は、パラメータを抽出するための音声分
析部と、前記パラメータを用いて統計的距離尺度
に基づき単語標準パターンとの距離を計算し、距
離の最小値と音声区間(音声の始端と終端)を組
にして求めるパターンマツチング部と、前記音声
区間に対して単語毎の音素構成を表わす特徴点を
検出し特徴点の有無によつて前記単語候補に対す
る類似度を計算し単語の判定を行なう構造解析部
とを具備することにより、上記目的を達成するも
のである。
作 用 本発明は、入力音声に対して時間軸上で連続的
に線形伸縮とパターンマツチングをくり返し、距
離を求めると同時に音声の始端、終端を求めるこ
とにより、従来の音声区間検出作業を不要として
おり、またパターンマツチング部で統計的距離尺
度に基づき距離計算することにより、話者の違い
による音韻のずれに対処することができ、さらに
構造解析部で、単語毎に設けた解析手順に基づき
特徴点の有無を解析し、単語間の判定に貢献する
特徴点を絞つて判定することにより判別の精度を
高めることができる。
実施例 以下に本発明の実施例を図面を用いて詳細に説
明する。
第1図は本発明の一実施例における音声認識装
置の主要機能ブロツク図であり、これを用いて本
実施例の概要を述べる。音声が入力されると音声
分析部11にて分析を行い、以後の処理に必要な
パラメータの抽出を行なう。第1のパラメータは
帯域フイルタ分析により求めた帯域パワーであ
り、第2のパラメータは線形予測分析により求め
たLPCケプストラム係数である。パターンマツ
チング部1入力では、まず第1のパラメータを用
いて音声スイツチ部(後述する)を働かせ、距離
計算を開始する。距離計算は標準パターンと第2
のパラメータを用いて行い、距離値が条件を満足
した時点で音声スイツチ部をオフし、処理を終わ
る。この時点で単語毎の最小距離と音声区間の組
が作成され、出力される。構造解析部13はこの
出力を用いて単語候補の絞り込みを行つた後、音
声区間の候補の中で音声の構造を調べる。第1の
パラメータを使用し、どの単語に最も似ているか
を計算し、結果を1つの単語名として出力する。
パターンマツチング法が音声全体の概形をとら
えるのに対し、構造解析法は音声の局部的な特徴
をとらえることができ、両者を組合せることで互
いの欠点を補い安定した認識性能を得ることが可
能である。
第2図にてパターンマツチング部の詳細を述べ
る。パラメータが入力されると、まず第1のパラ
メータにて音声スイツチ部21を動作させる。第
1のパラメータである帯域パワーの大きさがある
閾値を越えた時点で距離計算部23に処理の開始
指令(イ)を与える。その間、前処理部22は後述す
る線形伸縮と部分積計算をくり返し、計算結果を
保持している。部分積計算には標準パターン格納
部24の内容を参照する。距離計算部23におけ
る距離計算は、前記部分積の値と、標準パターン
格納部24の内容を用いて行う、。音声スイツチ
部21は距離計算部23の結果(ロ)を受けとり、過
去の最小距離値と現在の距離値又は最小距離点か
らの経過時間が条件を満足した時点で終了指令(ハ)
を出し、距離計算部23は距離計算を終了する。
最後に、距離計算部23に記憶された各単語毎の
最小距離と音声区間を組にして出力する。
次に、線形伸縮の方法について述べる、入力音
声に対して任意に過程した音声区間のフレーム長
をJとし、これを標準パターンのフレーム長Iに
そろえて長さの正規化を行う。入力のフレーム番
号をjとし、iを求めるフレーム番号とすると、
(2)式にてiを求めることができる。
i=[I−1/J−1j+J−I/J−1+0.5](
2) 上記式で得たフレームiのLPCケプストラム係
数0〜5次を時系別に並べてベクトルXとする。
次に、距離計算の方法について述べる。入力X
の単語kに計する距離は次式で求まる。
Lk=Bkk t・〓 (3) Ak、Bkは単語kの標準パターンに相当し、次式
で求まる。
k=2(〓k t・〓-1−〓e t・〓-1) (4) Bk=〓k t・〓-1・〓k−〓e t・〓-1e (5) ここでμkは単語kの平均ベクトル、μeは周囲情
報の平均ベクトルである。またWは全単語および
周囲情報に対する共通の共分散行列であり、次式
で求まる。
〓=(〓1+〓2+…+〓k+…+〓k+〓e)/
(K+1) (6) ただし〓kは単語kの共分散行列であり、kは単
語の数、〓eは周囲情報の共分散行列である。周
囲情報の標準パターンは全サンプルを用いて音声
信号の全区間(音声区間、騒音区間を含む)に対
して、パラメータの時系列を1フレームずつシフ
トさせながら移動平均と共分散行列を求めること
によつて作成する。
次に、部分積について述べる。(3)式は、部分積を
最初に求めておくことによつて効率良く計算でき
る。入力ベクトル〓における各フレームのパラメ
ータベクトルを〓i(i=1,2,…,I)とす
ると、 〓=(〓1、〓2,…,〓i、…,〓I) (7) 〓i=(x1

Claims (1)

  1. 【特許請求の範囲】 1 音声の識別に用いるパラメータを抽出するた
    めの音声分析部と、前記パラメータを用いて統計
    的距離尺度に基づき単語標準パターンとの距離を
    計算すると同時に距離の最小値、音声の始端と終
    端とからなる音声区間を組にして求めるパターン
    マツチング部と、前記音声区間において単語毎の
    音素構造を表わす特徴点を検出し特徴点の有無に
    よつて前記単語候補に対する類似度を計算し単語
    の判定を行なう構造解析部とを少なくとも有する
    ことを特徴とする音声認識装置。 2 パターンマツチング部が、音声分析部で得た
    パラメータを用いて距離計算の開始指令を与え、
    かつ距離計算で求めた距離値を用いて距離計算の
    終了指令をする音声スイツチ部と、あらかじめ作
    成した単語音声標準パターンを格納した標準パタ
    ーン格納部と、音声分析部で得たパラメータを時
    間軸上で線形伸縮により変換した後、前記標準パ
    ターン格納部の内容を用いて統計的距離尺度に基
    づく距離値の部分積を求める前処理部と、前記部
    分積と前記標準パターン格納部の内容を用いて距
    離計算し、最小距離に相当する音声区間を逐次更
    新して保持する機能を持つ距離計算部とから少な
    くとも構成されることを特徴とする特許請求の範
    囲第1項記載の音声認識装置。 3 構造解析部が、単語毎の音素構造を表わす特
    徴点を抽出する手順を示した解析手順部と、その
    解析手順に従つて特徴点を抽出する特徴点抽出部
    と、あらかじめ前記特徴点の付加、脱落率を求め
    ることによつて作成した付加・脱落率テーブル
    と、単語間の判別に用いる特徴点の種類を示した
    評価テーブルと、類似度計算部と、判定部とによ
    つて少なくとも構成され、単語候補に対して、前
    記解析手順部に従つた特徴点抽出を特徴点抽出部
    で行ない、前記付加・脱落率テーブルと評価テー
    ブルを用いて候補単語に対する類似度を類似度計
    算部で求め、前記類似度を用いて判定部にて単語
    の判別を行うことを特徴とする特許請求の範囲第
    1項記載の音声認識装置。
JP27374185A 1985-10-18 1985-12-05 音声認識装置 Granted JPS62133499A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP27374185A JPS62133499A (ja) 1985-12-05 1985-12-05 音声認識装置
US06/920,785 US4885791A (en) 1985-10-18 1986-10-20 Apparatus for speech recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27374185A JPS62133499A (ja) 1985-12-05 1985-12-05 音声認識装置

Publications (2)

Publication Number Publication Date
JPS62133499A JPS62133499A (ja) 1987-06-16
JPH0451840B2 true JPH0451840B2 (ja) 1992-08-20

Family

ID=17531922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27374185A Granted JPS62133499A (ja) 1985-10-18 1985-12-05 音声認識装置

Country Status (1)

Country Link
JP (1) JPS62133499A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62134699A (ja) * 1985-12-06 1987-06-17 松下電器産業株式会社 音声認識方法
JPH0293695A (ja) * 1988-09-30 1990-04-04 Sanyo Electric Co Ltd 音声認識装置

Also Published As

Publication number Publication date
JPS62133499A (ja) 1987-06-16

Similar Documents

Publication Publication Date Title
JPS58130393A (ja) 音声認識装置
JPS62217295A (ja) 音声認識方式
CN111462758A (zh) 智能会议角色分类的方法、装置、设备及存储介质
JP3298858B2 (ja) 低複雑性スピーチ認識器の区分ベースの類似性方法
JPS6128998B2 (ja)
EP0474496B1 (en) Speech recognition apparatus
JPH0451840B2 (ja)
JP2502880B2 (ja) 音声認識方法
JPH04261591A (ja) 自動採譜装置
JPH01255000A (ja) 音声認識システムに使用されるテンプレートに雑音を選択的に付加するための装置及び方法
JP2664136B2 (ja) 音声認識装置
JPS63213899A (ja) 話者照合方式
KR960007132B1 (ko) 음성인식장치 및 그 방법
Kim et al. A study on the improvement of speaker recognition system by voiced detection
JPS6336678B2 (ja)
JP2744622B2 (ja) 破裂子音識別方式
JPH0554678B2 (ja)
JPH0221598B2 (ja)
JPH0752355B2 (ja) 音声認識装置
JPS6292999A (ja) 音声認識装置
JPS63223696A (ja) 音声パタ−ン作成方式
JPS6136797A (ja) 音声セグメンテ−シヨン法
JPS63136097A (ja) 音声認識方式
JPS62119596A (ja) 音声認識装置
JPH054679B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees