JPS6375800A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS6375800A
JPS6375800A JP22120686A JP22120686A JPS6375800A JP S6375800 A JPS6375800 A JP S6375800A JP 22120686 A JP22120686 A JP 22120686A JP 22120686 A JP22120686 A JP 22120686A JP S6375800 A JPS6375800 A JP S6375800A
Authority
JP
Japan
Prior art keywords
syllable
sound
section
cut out
syllables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP22120686A
Other languages
English (en)
Other versions
JPH0458638B2 (ja
Inventor
充宏 斗谷
岩橋 弘幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP22120686A priority Critical patent/JPS6375800A/ja
Publication of JPS6375800A publication Critical patent/JPS6375800A/ja
Publication of JPH0458638B2 publication Critical patent/JPH0458638B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業」−の利用分野〉 この発明は、日本語等の音声を音節単位に認識して、外
部装置に出力する音声認識装置に関する。
〈従来の技術〉 従来、音声認識装置では入力された音声を音韻分類する
ことによって音節区間の判定を行い、その判定結果に基
づいて上記音節を切出し、上記切出された音節単位で認
識を行っている。
〈発明が解決しようとする問題点〉 ところが、上記従来の音声認識装置においては、撥音(
「ん」)は音声スペクトルの継続時間が比較的長く、ま
たパワーも小さいために、第3図に示すように、1つの
撥音音節区間であるにもかかわらず、その音節区間内に
バズバーと判定されるフレーム(第3図中Aで示した音
韻分類ラベルBのフレーム)が生じ、上記バズバーと判
定されたフレームを境界にして前後2つの音節として分
類して切出されろという問題がある。
ここで、上記バズバーは有声破裂音の音節発声の萌に先
行して声帯の振動によって発声される音であり、非常に
低周波成分の強い音であるため、人間には殆ど聞こえな
い。また上記フレームは、入力された音声の音声スペク
トルを分析するために、上記音声スペクトルをl 6’
ms程度に分けたその1区間である。
そこで、この発明の目的は、1つの音節の撥音であるに
もかかわらず、その撥音を誤って2つの音節として分離
して認識することのない音声認識装置を提供することに
ある。
く問題点を解決するための手段〉 上記目的を達成するために、この発明の音声認識装置は
、入力された音声から音節区間を切出し、この切出され
た音節の特徴パターンと、メモリに予め記憶している複
数種類の音節の特徴標準パターンとの類似度計算を行っ
て、入力された音声を音節単位で認識する音声認識装置
において、上記切出された音節の認識結果が撥音か否か
を判別する撥音判別部と、上記切出された音節の特徴を
表わす特徴情報を抽出する特徴抽出部と、上記撥音判別
部によって上記切出された音節が撥音と認識された場合
、上記特徴抽出部によって抽出された特徴情報と所定の
値とを比較した結果と、予め記憶されている上記切出さ
れた音節の直前の音節が撥音か否かを表わす識別結果と
に基づいて、上記撥音が1音節であるにもかかわらず、
誤って2音節として分離して認識された撥音か否かを判
断する判断部と、上記判断部の判断結果に基づいて、2
音節の撥音と誤認された2音節の一方を棄却する撥音棄
却部とを設けたことを特徴としている。
〈作用〉 入力された音声から切出された音節は音節単位で認識さ
れ、撥音判別部において上記認識結果が撥音であるか否
かが判別される。
その結果、撥音であると判別されると、特徴抽出部によ
って抽出された特徴情報と所定の値とを比較した結果と
、予め記憶されている上記切出された音節の直前の音節
が撥音か否かを表わす識別結果とに基づいて、判断部に
よって、上記撥音が1音節であるにもかかわらず誤って
2音節として分離して認識された撥音か否かが判断され
る。
そして、上記判断部の判断結果に基づいて、2音節の撥
音と誤認された2音節の一方が、撥音棄却部によって棄
却されることによって、誤って2音節に分離した撥音と
して認識されることなく、正確に1音節の撥音として認
識される。
〈実施例〉 以下、この発明を図示の実施例により詳細に説明する。
第1図において、1はアナログ入力部であり、連続して
入力された音声を増幅する増幅器(AMP)11とAM
PIIの出力をディジタル信号に変換するA/D変換器
I2とからなる。2は音声分析部であり、ディジタル信
号化された入力音声を16m5程度のフレームに分けて
スペクトル分析を行い、8ms程度の間隔で音節区間抽
出部3に上記入力音声の特徴パターンと音節区間の切出
しに必要な情報(例えばパワー、零交差数等)とを転送
する。上記音節区間抽出部3は、上記音声分析部2から
転送される上記音節区間の切出に必要な情報を基に、上
記音声分析部2から転送される特徴パターンから音節を
切出して、この切出した音節の特徴パターン(1音節分
)をCPU5を介して特徴パターンメモリ6N、:格納
すると共に、さらに、特徴抽出部を含み、上記CPU5
とデータを交換しながら、上記切出した音節から特徴情
報を抽出して上記特徴パターンメモリ61に格納して、
入力された音声の音節切出しが完了したことをCPU5
に伝達する。なお、上記特徴情報としては、切出した音
節の長さ、切出した音節と直前の音節との間の無音時間
長、切出した音節と直前の音節との境界における音声ス
ペクトルの変化量を用いる。
パターンメモリ6は、上記音節区間抽出部3によって切
出された音節の一個分の特徴パターン、および上記音節
の特徴情報が記憶されている前述の特徴パターンメモリ
61と、複数の音節の特徴漂悟パターンが記憶されてい
る標学パターンメモリ62とを有している。単音節認識
部9は、上記CPU5からの命令により、上記パターン
メモリ6内の特徴パターンメモリ61に記憶されている
上記特徴パターンと、標窄パターンメモリ62に記憶さ
れている上記複数の特徴標準パターンとの間で類似度計
算の一例である距離計算を行うことによって、入力され
た音声を認識する。そして、得られた認識結果は上記C
PU5に戻され、さらにインターフェース(I/F)部
10を介して外部装置に送出される。それと共に、認識
結果格納メモリ11に記憶される。
次に、第2図に示すl音節の認識処理のフローチャート
により、上記音声認識装置の動作を説明する。
ステップS、で、入力された音声の音節が、上記音節区
間抽出部3によって切出されたか否かを判断する。上記
音節区間抽出部3で音節切出しが完了していればステッ
プS、に進み、完了していなければ、ステップS1に戻
る。
ステップS、で、上記CPU5は上記単音節認識部9に
類似度計算を指示する。上記単音節認識部9は上記パタ
ーンメモリ6内の特徴パターンメモリ61に記憶されて
いる、入力された音声から切出された音節(以下、現音
節と言う)1個の特徴パターンと、標準パターンメモリ
62に記憶されている複数音節の特徴標準パターンとの
間で類似度計算を行い、上記現音節の認識結果を得る。
ステップS3で、上記現音節の認識か終了したか否かを
判別する。その結果終了していればステップS4に進み
、終了していなければステップS3へ戻る。
ステップS、で、上記ステップS・2で認識した上記現
音節の音声認識結果が、撥音であるか否かを判別する。
その結果撥音でなければステップSIQに進み、撥音で
あればステップS、に進む。
ステップS5で、上記現音節の長さく上記パターンメモ
リ6内の特徴パターンメモリ61に記憶されている、切
出された音節の特徴情報の一つ)と設定値L】とを比較
する。上記設定値L1よすら大きければ比較した現音節
は独立した音節であると見なしステップS toに進み
、設定値L1以下であればステップSRに進む。
ステップS、で上記現音節と直前の音節との間の無音時
間長(もしくはバズバーと判定された時間長)を設定値
L 2と比較する。その結果上記設定値L 2以上であ
れば比較した現音節は独立した音節であると見なしステ
ップS 10に進み、設定値より小さければステップS
7に進む、 ステップS7で、上記現音節と直前の音節との境界にお
ける音声スペクトルの変化量を設定値Vと比較する。こ
れは1音節の撥音が分離して認識されるのは、第3図の
ように撥音音節部の音声スペクトルのパワー変動によっ
て一部のフレームがバズバーとしてチェ5ツクされるこ
とが主であり、上記音声スペクトルの変化を伴うことは
ないことを利用しており、上記設定値Vより大であれば
比較された現音節は独立した音節であると見なしてステ
ップSIOに進み、設定値V以下であればステップS6
に進む。
ステップS、で、上記認識結果格納メモリIIに記憶さ
れている、上記ステップS7で比較されr母二記現音節
の直前の音節の音声認識結果が撥音であるか否かを判別
する。その結果撥音でなければ現音節は独立した音節で
あると見なしステップSIOに進み、撥音であれば現音
節は直前の撥音音節と共に本来はl音節として認識され
るへきものが2音節として誤認されたうちの一方である
と判断して、ステップS、に進む。
ステップS、で2音節として誤認されrこうちの現音節
をリジェクトし、1音節、)認識処理は終了する。
ステップS、。で、上記ステップS、で認識された上記
現音節の音節認識結果を上記認識結果格納メモリ11に
記憶すると共に、上記I/F部lOを介して図示しない
外部装置に送出し、1音節の認識処理は終了する。ここ
で、上記ステップS4は撥音判別部を構成し、上記ステ
ップ85〜ステツプS8は判断部を構成することになる
したがって、上述の手順により、l音節であるにしかか
わらず誤って分離して認識された撥音に対して、1つの
認識結果のみを出力することができる。
〈発明の効果〉 以上より明らかなように、この発明の音声認識装置は、
現音節の認識結果が撥音か否かを判別する撥音判別部と
、上記現音節の特徴を表わす特徴情報を抽出する特徴抽
出部と、上記撥音判別部によって現音節か撥音と判別さ
れたとき、上記特徴抽出部によって抽出された特徴情報
と所定の値とを比較した結果と、予め記憶されている上
記現音節の直前の音節の識別結果とを用いて、上記撥音
がl音節であるにもかかわらず2音節と誤認された撥音
のうちの一方か否かを判断する判断部と、上記判断部の
判断結果に基づいて、2音節の撥音と誤認された2音節
の一方を棄却する撥音棄却部とを設けたので、1音節で
あるjこらかかわらず2音節の撥音と誤認することがな
く、撥音に対する認識性能が向上する。
【図面の簡単な説明】
第1図はこの発明の音声認識装置のブロック図、第2図
はこの発明の音声認識装置における1音節の認識処理フ
ローチャート、第3図は誤って分離して認識された撥音
の一例を示す図。 ■・・・アナログ入力部、2・・・音声分析部、3・・
・音節区間抽出部、 5・・・CPU、6・・・パター
ンメモリ、 9・・・単音節認識部、11・・・認識結
果格納メモリ。

Claims (2)

    【特許請求の範囲】
  1. (1)入力された音声から音節区間を切出し、この切出
    された音節の特徴パターンと、メモリに予め記憶してい
    る複数種類の音節の特徴標準パターンとの類似度計算を
    行って、入力された音声を音節単位で認識する音声認識
    装置において、 上記切出された音節の認識結果が撥音か否かを判別する
    撥音判別部と、 上記切出された音節の特徴を表わす特徴情報を抽出する
    特徴抽出部と、 上記撥音判別部によって上記切出された音節が撥音と認
    識された場合、上記特徴抽出部によって抽出された特徴
    情報と所定の値とを比較した結果と、予め記憶されてい
    る上記切出された音節の直前の音節が撥音か否かを表わ
    す識別結果とに基づいて、上記撥音が1音節であるにも
    かかわらず誤って2音節として分離して認識された撥音
    か否かを判断する判断部と、 上記判断部の判断結果に基づいて、2音節の撥音と誤認
    された2音節の一方を棄却する撥音棄却部とを設けたこ
    とを特徴とする音声認識装置。
  2. (2)上記判断部が判断するための音節の特徴情報とし
    て、上記切出された音節の長さ、上記切出された音節と
    直前の音節との間の無音時間長、上記切出された音節と
    直前の音節との境界における音声スペクトルの変化量の
    いずれかまたはそれらの複数の組合せを用いる特許請求
    の範囲第1項記載の音声認識装置。
JP22120686A 1986-09-18 1986-09-18 音声認識装置 Granted JPS6375800A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP22120686A JPS6375800A (ja) 1986-09-18 1986-09-18 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22120686A JPS6375800A (ja) 1986-09-18 1986-09-18 音声認識装置

Publications (2)

Publication Number Publication Date
JPS6375800A true JPS6375800A (ja) 1988-04-06
JPH0458638B2 JPH0458638B2 (ja) 1992-09-18

Family

ID=16763127

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22120686A Granted JPS6375800A (ja) 1986-09-18 1986-09-18 音声認識装置

Country Status (1)

Country Link
JP (1) JPS6375800A (ja)

Also Published As

Publication number Publication date
JPH0458638B2 (ja) 1992-09-18

Similar Documents

Publication Publication Date Title
EP0128755A1 (en) Apparatus for speech recognition
JPS58130393A (ja) 音声認識装置
JPS5972496A (ja) 単音識別装置
KR20170073113A (ko) 음성의 톤, 템포 정보를 이용한 감정인식 방법 및 그 장치
JPS6375800A (ja) 音声認識装置
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
JP3049711B2 (ja) 音声処理装置
JPS6391700A (ja) 音声認識装置
JPS59170894A (ja) 音声区間の切り出し方式
JPS63217399A (ja) 音声区間検出装置
JPS6346499A (ja) 大語▲い▼単語音声認識方式
JPS63798B2 (ja)
JPH01158499A (ja) 定常雑音除去方式
JPS59223500A (ja) 音声認識方法
JPS62166400A (ja) 音声ワ−ドプロセツサ装置
JPS63191199A (ja) 有声破裂子音識別装置
JPS6180298A (ja) 音声認識装置
JPS62218997A (ja) 単語音声認識装置
JPS61180300A (ja) 音声認識装置
JPS607493A (ja) 単音節音声認識方式
JPS6240497A (ja) 音声パタ−ン分類方式
JPS6287993A (ja) 音声認識装置
JPS5936299A (ja) 音声認識装置
JPS62115498A (ja) 無声破裂子音識別方式
JPS6069694A (ja) 語頭子音のセグメンテ−ション法