JPH02116899A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH02116899A
JPH02116899A JP63269432A JP26943288A JPH02116899A JP H02116899 A JPH02116899 A JP H02116899A JP 63269432 A JP63269432 A JP 63269432A JP 26943288 A JP26943288 A JP 26943288A JP H02116899 A JPH02116899 A JP H02116899A
Authority
JP
Japan
Prior art keywords
syllable
phoneme
recognition
label
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63269432A
Other languages
English (en)
Inventor
Sakae Fujimaki
栄 藤巻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asahi Chemical Industry Co Ltd
Original Assignee
Asahi Chemical Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asahi Chemical Industry Co Ltd filed Critical Asahi Chemical Industry Co Ltd
Priority to JP63269432A priority Critical patent/JPH02116899A/ja
Publication of JPH02116899A publication Critical patent/JPH02116899A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野) 本発明は、連続音声を認識する音声認識装置に関する。
〔従来の技術〕
従来の音声認識装置は連続音声中の音節(例えば子音と
母音とからなる音声長さの一単位)と次の音節の境界部
分で音声の特徴パターンが変化してしまうので、音節認
識の際の障害となっていた。
この点について詳しく説明する。
第5図は音声をアナログ信号に変換したときの模式的な
波形を示す。
第5図(A)に示すように音声信号は時間の経過に応じ
て電圧レベルが変化する。音声認識においては、この音
声信号の発生に応じて固有の特徴を持つことに着目して
、所定時間内の音声信号を周波数分析し、周波数帯毎の
強さ(パワースペクトル)を求めておき、得られるパワ
ースペクトラム分布と、対応する認識コードを標準パタ
ーン(標準特徴パラメータ)として予め音声認識装置に
記憶している。
次に、音声識別対象者が音声認識装置に音声を入力する
と、音声認識装置は上述のように入力音声の周波数分析
を行って、音声を特徴パラメータ化し、この入力特徴パ
ラメータと各標準特徴パラメータを比較(距離計算)す
る。音声認識装置はこの計算結果に基き、最も入力音声
に近い特徴パラメータを持つ識別コードを抽出し、音声
認識結果とする。
標準特徴パラメータは音声の認識目的によって、音声の
音素区間から抽出されたり、母音や子音の音韻区間、長
いものでは母音と子音からなる音節区間から取り出され
た音声信号により作成される。第5図CB)〜(C)に
はその音声パターンを模式的に示している。
音声認識装置の音素認識において例えば“力”という発
声は“ににににAAAA”と音素単位での記号別で認識
され、音韻の認識においては“K””A ”と音韻単位
の記号列で認識され、音節の認識においては“KA“と
音節単位の記号で識別される。
ここで各標準特徴パラメータの利点欠点を述べておく。
音素の標準特徴パラメータは、音素ラベル列で識別結果
を表わすので音韻と音韻の区切れが判別しにくいが音声
の中の最もよく特徴を表わす音素から作成するので、識
別結果の音素ラベル列の中に必らず正しい認識ラベルを
含み、その距離計算結果は1つの音iliの中の音素識
別ラベル列中で部分的に一番高い類似性を示す。
音韻の標準特徴パラメータは上述の音素認識結果を用い
て音韻認識を行うよりも認識確率が高い。
音節の標準特徴パラメータは、音素認識結果や音韻認識
結果を用いて音節認識を行う場合よりも音節の認識確率
が高く、誤認識が生じても類似性において第2番目、第
3番目の認識結果の中に入力音声と対応する正しい識別
結果が含まれる。
また、拗音(例えばキヤという発声)と直音(拗音以外
の通常の音節)との区別が音素認識および音韻認識に比
べて容易である。
〔発明が解決しようとする課題〕
しかしながら、例えば“アカサカ”というように複数の
音節からなる音声を認識しようとする場合、例えば音節
“力”から次の音節“す”に穆る箇所では上述の特徴パ
ラメータが単独音節°°力”とは異ってしまうので、音
声認識装置は音素、音韻、音節のどの標準特徴パラメー
タを用いても誤認識を生じるという問題点があった。
音素単位の標準特徴パラメータを用いた誤認識例では上
述の発声“力”に対して“K■にUUIIAA ”とな
る。音韻単位の標準特徴パラメータを用いた誤認識は“
K”、“U”となり、音節単位での標準特徴パラメータ
を用いた誤認識は”にU”となる。そこで、本発明の目
的は、上述の各種の特徴パラメータの利点を生かし、連
続音声に対する認識確率の高い音声認識装置を提供する
ことにある。
〔課題を解決するための手段〕
このような目的を達成するために、本発明は、音声を入
力する入力手段と、複数の音節ラベルおよび、当該ラベ
ルに各々対応する音節長さからなる複数の第1漂準特徴
パラメータをあらかじめ記憶する第1記憶手段と、複数
の音韻ラベルおよび、当該ラベルに各々対応する音韻長
さまたは音素長さからなる複数の第2標準特徴パラメー
タをあらかじめ記憶する第2記憶手段と、第1記憶手段
に記憶された第1標準特徴パラメータを参照することに
より、複数の音節ラベルの中から入力音声について其の
類似度が上位の音節ラベルを音節認識候補として所定個
数抽出する第1抽出手段と、第2記憶手段に記憶された
第2標準特徴パラメータを参照することにより、複数の
音韻ラベルの中から入力音声について其の類似度が最上
位の音韻ラベルを抽出する第2抽出手段と、第1抽出手
段により抽出された音節認識候補の音節ラベルの中から
第2抽出手段により抽出された音韻ラベルを含む音節ラ
ベルを音節認識結果として抽出する第3抽出手段とを具
えたことを特徴とする。
(作用) 本発明は、音節長さの標準特徴パラメータを用いた連続
音声の誤認識結果を分析した結果、音節単位での入力音
声の特徴パラメータと標準特徴パラメータの類似性にお
いて、第1番目の認識ラベルが発声と異っていても、正
しい認識ラベルは類似性において2番目や3番目に位置
することがあることに着目し、第1位から所定順位まで
の認識候補を第1抽出手段により抽出し、第2抽出手段
により抽出された音素または音@単位での音声に対する
認識結果を含む音節ラベルを音節認識結果とする。連続
音声のように音節と次の音声との境界部分で特徴パラメ
ータが変化して音節認識に際して誤認識が生じても音韻
や音素単位での認識結果との照合が行なわれるので、正
しい認識候補が検出される。
〔実施例〕
以下、図面を参照して本発明実施例を詳細に説明する。
第1図は本発明実施例の基本構成を示す。
第1図において、50は音声を入力する入力手段である
。100は複数の音節ラベルおよび、当該ラベルに各々
対応する音節長さからなる複数の第1標準特徴パラメー
タをあらかじめ記憶する第1記憶手段である。
200は複数の音韻ラベルおよび、当該ラベルに各々対
応する音韻長さまたは音素長さからなる複数の第2標準
特徴パラメータをあらかじめ記憶する第2記憶手段であ
る。
300は前記第1記憶手段に記憶された前記第1標準特
徴パラメータを参照することにより、複数の音節ラベル
の中から入力音声について其の類似度が上位の音節ラベ
ルを音節認識候補として所定個数抽出する第1抽出手段
である。
400は前記第2記憶手段に配子、@された前記第2標
準特徴パラメータを参照することにより、複数の音韻ラ
ベルの中から入力音声について其の類似度が最上位の音
韻ラベルを抽出する第2抽出手段である。
500は前記第1抽出手段により抽出された前記音節認
識候補の音節ラベルの中から前記第2抽出手段により抽
出された音韻ラベルを含む前記音節ラベルを音節認識結
果として抽出する第3抽出手段である。
第2図は本発明実施例の具体的な回路構成を示す。
第2図において、1は音声入力をアナログ信号に変換出
力するマイクロホンである。2はマイクロホン1の信号
出力をアナログ−デジタル(A/D)変換するへ/D変
換器である。
3はフーリエ変換器であり、デジタル変換された音声信
号を音素単位の時間間隔で周波数分析を行い、音声信号
を特徴パラメータに変換する。
4は装置全体の制御を司どる中央演算処理装置(cps
)である。CPU4は本発明に関わる処理としては、フ
ーリエ変換器3から入力される音声の特徴パラメータを
順次、後述のデュアルポートRAM6に書き込む処理、
および第2 CPU7により音声認識された結果をデュ
アルポートRAM8から読み出してプリンタ8に出力す
る処理を行う。
5はリードオンリメモリ(ROM)であり、第2CPI
I7が実行する本発明に関わる制御手順(第3図示)を
予記憶している。またROM5には予め音声登録者の音
声から抽出した音素長さ毎の標準特徴パラメータおよび
音節長さ毎の標準パラメータを、対応する認識コードと
共にテーブル5−1.5−2として記憶している。した
がって、ROM5が本発明の第1記憶手段、第2記憶手
段に相当する。
6は入出力ボート二つを有するランダムアクセスメモリ
(デュアルポートRAMと一般に呼ばれる)であり、第
1 CpH4および第2 CpH7による情報の読み書
き処理を並行して行うことが可能なメモリである。
デュアルポートRへM6には音声信号から順次抽出され
た特徴パラメータを記憶すると共に、第2CPU7によ
り音声認識された音素および音韻それぞれの認識コート
を記憶する。
7は第2 CPUであり、デュアルポートRAM6に記
憶された音声の特徴パラメータとROM5に記憶された
標準特徴パラメータに基き、本発明に関わる音声認識処
理を行う。CPU7が本発明の第1〜第3抽出手段に相
当する。
第3図は第2図に示す第20PU7が実行する制御手順
を示す。
第3図を参照しながら本発明の音声認識動作を説明する
マイクロホンiから入力された音声はA/D変換器2を
介してフーリエ変換器3により特徴パラメータに変換さ
れる。 CpH4は時系列的に変換された特徴パラメー
タBl、82を、第4図に示すように音素長さ間隔毎に
時刻Tl、T2.・・・・・・でデュアルポートRへM
6に書き込む。ここまでの処理は従来から行なわれてい
る処理である。
次に、第26PU7は、音節(例えば子音と母音とから
なる音声)の認識処理を行う。具体的には、時刻71〜
丁12までの各音素の特徴パラメータな周波数毎に合計
し、音節の特徴パラメータを作製する(ステップSl)
次に、第2 CPU7は、入力音声の特徴パラメータを
音節長さの標準特徴パラメータテーブル5−2と照合し
、類似する音節の識別ラベルを検索する(ステップS3
)。距離計算の結果、例えば“力“という発声に対して
第1〜3位候補が“にU”“XA”、“gA”が得られ
るものとする。
第2 CPU7はこれらの識別結果をデュアルポートR
AM6に一時記憶する(ステップS3)。
次に第2 CPU7は種々の手法に依り音節を構成する
音韻の識別処理を行う。具体的には、たとえば、まず時
刻T7〜TI2までの間の入力特徴パラメータ87〜B
12の各々と標準特徴パラメータの各々との類似度が最
も高い組み合わせを第2CPυ7が探す。この結果、例
えばB9の特徴パラメータと母音ラベルAの標準特徴パ
ラメータが最も類似しているとき(距離計算結果が小さ
いとき)に時刻T7〜T12の入力音声として“A”と
識別する。
なお、87〜812の音素ラベルの内で多数を占める音
素ラベルを音Oiラベルとしてもよい。
以下、同様の手順で、時刻Tl−76の入力特徴パラメ
ータ(第4図参照)に基いて、音韻ラベル“K”を第2
 CPII7が識別し、得られた各音韻ラベル’K” 
、  ”A” ヲテュ?ル’;F?  )RAM8ニ記
憶シておく(ステップS4>。
この段階でデュアルボー1− RAM6には時刻71〜
丁12までの音節の認識候補として“にu゛。
“に^”、 gA”と、音韻毎の認識結果として“K”
、“A ”が記憶されている。
次に第2 CPU7は音節の中の最後の音韻、すなわち
“A”を含む音節候補を取り出す。ここで音節候補“に
A”、  gA”が抽出される(ステップS5)。
次に、第20PIJ7はここで抽出された音節1iの中
から次の識別音韻“に”が含まれている候補を検索する
この検索結果、認識すべき音節として“KA”が得られ
ることになる(ステップ56〜S8)。
水制御手順中音節候補の中に音韻識別結果が含まれてい
ない場合は認識順位第1の音節候補を認識結果とする(
ステップS5→510)。
このように本発明では音節単位での音声認識候補中から
音韻認識結果を含む音節を抽出するようにしたので、従
来の音節単位でのみ音声認識よりも認識確率が高くなる
。また従来の音韻単位での音声認識と比べると、本発明
では音節単位での音声認識と照合しているので、音声認
識がより明確となる。
本発明の応用形態としては次のことが考えられる。
(1)本実施例では、入力音声に対する音韻の認識を入
力音声と並行して順次行っているが、音節単位での音声
認識を行った後、音節の最後の音韻(母音)からラベル
変換し、認識候補が一つになるまで、順次に、先頭の音
韻に向ってラベルを変換するようにすれば、第2 CP
U7の処理を減じることができる。
(2)本実施例では音節の最後の音韻ラベルから音節候
補に対する照合を行っているが、処理目的によっては先
頭の音韻ラベルから行ってもよい。但し、音節の最後の
音韻は母音となることが多く、また子音と母音とでは母
音の認識確率が高くなるので、本実施例のように音節最
後の音韻ラベルから上記照合を行った方が認識確率は高
くなる。
(3)本実施例では、音節候補の中に音韻認識結果が含
まれていないときは、音節候補の第1位を認識結果とし
ているが、認識不可能の旨を印刷すれば誤認識を行なわ
なくても済む。さらに、音節認識結果と音韻認識結果の
二つが合致したときのみその認識結果を印刷するように
すれば、誤認識が大幅に低下する。
(4)本実施例では音声を音節単位で認識したが、音節
以上の音声長さ、例えば単語認識を行うときは、単語単
位の標準特徴パラメータに基いて上位の音声認識候補を
抽出した後、各音韻単位の認識結果を一番多く含む単語
を音声の認識結果とすればよいことは勿論である。
〔発明の効果〕
以上、説明したように、本発明によれば、音節長さの標
準特徴パラメータを用いた音節認識結果と、音韻または
音素長さの標準特徴パラメータを用いた音韻認識結果に
基いて正しい音節候補を抽出するようにしたので、音声
中の音節の境界部分が標準特徴パラメータの音声パター
ンと異なっても、音節としては正しく認識される。また
本発明は、上記従来例の記述で述べた二つの標準パラメ
ータの持つ音声認識の利点を併わせ持つことになるので
、音声認識確率が向上する。
【図面の簡単な説明】
第1図は本発明実施例の基本構成を示すブロック図、 第2図は本発明実施例の具体的な回路構成を示す回路図
、 第3図は第2図に示す第2 CPU7が実行する制御手
順を示すフローチャート、 第4図は本発明実施例の音声認識手順を示す説明図、 第5図は従来例の音声認識手順を示す説明図である。 1・・・マイクロホン、 2・・・へ/D変換器、 3・・・フーリエ変換器、 4・・・cpu 。 5・・・ROM 。 5−1・・・音素長さの標準特徴パラメータテーブル、 5−2・・・音節長さの標準特徴パラメータテーブル、 6・・・デュアルポートRAM、 7・・・第2CPIJ。 8・・・プリンタ、 9・・・キーボード。

Claims (1)

  1. 【特許請求の範囲】 音声を入力する入力手段と、 複数の音節ラベルおよび、当該ラベルに各々対応する音
    節長さからなる複数の第1標準特徴パラメータをあらか
    じめ記憶する第1記憶手段と、複数の音韻ラベルおよび
    、当該ラベルに各々対応する音韻長さまたは音素長さか
    らなる複数の第2標準特徴パラメータをあらかじめ記憶
    する第2記憶手段と、 前記第1記憶手段に記憶された前記第1標準特徴パラメ
    ータを参照することにより、複数の音節ラベルの中から
    入力音声について其の類似度が上位の音節ラベルを音節
    認識候補として所定個数抽出する第1抽出手段と、 前記第2記憶手段に記憶された前記第2標準特徴パラメ
    ータを参照することにより、複数の音韻ラベルの中から
    入力音声について其の類似度が最上位の音韻ラベルを抽
    出する第2抽出手段と、前記第1抽出手段により抽出さ
    れた前記音節認識候補の前記音節ラベルの中から前記第
    2抽出手段により抽出された音韻ラベルを含む前記音節
    ラベルを音節認識結果として抽出する第3抽出手段と を具えたことを特徴とする音声認識装置。
JP63269432A 1988-10-27 1988-10-27 音声認識装置 Pending JPH02116899A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63269432A JPH02116899A (ja) 1988-10-27 1988-10-27 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63269432A JPH02116899A (ja) 1988-10-27 1988-10-27 音声認識装置

Publications (1)

Publication Number Publication Date
JPH02116899A true JPH02116899A (ja) 1990-05-01

Family

ID=17472352

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63269432A Pending JPH02116899A (ja) 1988-10-27 1988-10-27 音声認識装置

Country Status (1)

Country Link
JP (1) JPH02116899A (ja)

Similar Documents

Publication Publication Date Title
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
US5680510A (en) System and method for generating and using context dependent sub-syllable models to recognize a tonal language
JP2559998B2 (ja) 音声認識装置及びラベル生成方法
KR100277694B1 (ko) 음성인식시스템에서의 발음사전 자동생성 방법
US6553342B1 (en) Tone based speech recognition
CN101785051A (zh) 语音识别装置和语音识别方法
JPH07219579A (ja) 音声認識装置
JP3378547B2 (ja) 音声認識方法及び装置
JPH02116899A (ja) 音声認識装置
JPH0338699A (ja) 音声認識装置
JP2001005483A (ja) 単語音声認識方法及び単語音声認識装置
JPH08314490A (ja) ワードスポッティング型音声認識方法と装置
JP2647234B2 (ja) 音声認識装置
JPS6180298A (ja) 音声認識装置
JPH0384600A (ja) 音声認識装置
JPH04271397A (ja) 音声認識装置
JPH07146696A (ja) 音声認識における単語テンプレートの自動作成方法
JP2707552B2 (ja) 単語音声認識装置
JP2001013983A (ja) 音声合成を用いた音声認識装置および音声認識方法
JPS61121167A (ja) 区切り発声に基づく音声ワ−ドプロセツサ
JPH08110797A (ja) パターンマッチング装置
JPH04251300A (ja) 音声認識装置
JPS6312000A (ja) 音声認識装置
JPH0372991B2 (ja)
JPH08202393A (ja) 音声認識方法及びその装置