JP2615643B2 - 単語音声認識装置 - Google Patents

単語音声認識装置

Info

Publication number
JP2615643B2
JP2615643B2 JP62195989A JP19598987A JP2615643B2 JP 2615643 B2 JP2615643 B2 JP 2615643B2 JP 62195989 A JP62195989 A JP 62195989A JP 19598987 A JP19598987 A JP 19598987A JP 2615643 B2 JP2615643 B2 JP 2615643B2
Authority
JP
Japan
Prior art keywords
pattern
syllable
unit
word
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62195989A
Other languages
English (en)
Other versions
JPS6438798A (en
Inventor
教幸 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62195989A priority Critical patent/JP2615643B2/ja
Publication of JPS6438798A publication Critical patent/JPS6438798A/ja
Application granted granted Critical
Publication of JP2615643B2 publication Critical patent/JP2615643B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔概 要〕 本発明は、「が行」鼻音化音節をもつ単語の音声パタ
ーンを作成して記憶し、入力音声の単語認識を行う単語
音声認識装置に関し、 「が行」鼻音化音節を有する単語パターンを合成して
単語音声認識の高い単語音声認識装置を提供するを目的
とし、 音声認識装置において、音節テンプレート辞書部に記
憶された「な行」単音節パターンの子音区間を抽出する
子音区間抽出部と、該子音区間抽出部で抽出した該子音
区間のパターンを基に鼻音パターンを作成する手段と、
該鼻音パターンを「が行」単音節パターンの先頭に付加
して形成した「が行」鼻音化音節パターンを記憶する
「が行」鼻音化音節パターン辞書部を付設し、且つ前記
合成パターン作成部に音節結合によって生じる「が行」
鼻音化の規則を記憶する「が行」鼻音化規則部を付設し
て、前記単語辞書部に記憶された単語を前記「が行」鼻
音化規則部に照合して抽出し、抽出した単語を前記音節
テンプレート辞書部に記憶した単音節パターンと前記
「が行」鼻音化音節パターン辞書部が記憶する「が行」
鼻音化音節パターンを併用して、前記合成パターン作成
部で合成パターンを作成することを特徴とする。
〔産業上の利用分野〕
本発明は、「が行」鼻音化音節をもつ単語の音声パタ
ーンを作成して記憶し、入力音声の単語認識を行う単語
音声認識装置に関するものである。
単語音声認識装置はオペレータの発声の単音節をパタ
ーン化して、この単音節パターンから単語の合成パター
ンを生成しておき、オペレータが入力する音声の単語を
認識する装置である。
しかし、単語が実際に発音されるとき、その単語を構
成する単音節通りの発音がされず、異なる音節で発音さ
れる場合がある。
「が行」音を含む単語では、鼻音化して発音される場
合がある。
これらの単語は認識率が低くなるので、この認識率を
向上させる方法が要望されている。
〔従来の技術〕
第4図は従来例の単語音声認識装置の構成を説明する
図である。
先ず、音節パターンが登録される手順を説明する。
第4図において、入力部1に入力した音声はパラメー
タ抽出回路11で音声パラメータが抽出される。
即ち、一定時間ごとのクロックに応じて入力音声の周
波数成分、スペクトル強度等の成分が特徴量として抽出
される。
次いで、区間検出回路12で入力音声の発声による単音
節区間の長短を弁別して、単音節それぞれの区間を検出
し、単音節に分離する。
分離された単音節は、パターン化され単音節パターン
として音節テンプレート辞書部2に登録される。
一方、この認識装置が認識すべき単語を平仮名、片仮
名、アルファベット、あるいは発音記号等のコードの記
号列で表記して単語辞書部3に記憶させる。
合成パターン作成部4は、音節テンプレート辞書部2
に登録された単音節パターンを結合して、単語辞書部3
に記憶された単語それぞれの合成パターンを作成する。
そして、単語ごとに作成された単語の合成パターンは
合成パターン辞書部5に記憶される。
次いで、入力音声の認識手順を説明する。
音声入力は、入力部1でパターン化され、パターン照
合部6に入力して合成パターン辞書部5が記憶する単語
パターンと逐一照合され、合致したパターンの単語が認
識結果として出力される。
具体的に説明すると、例えば、第3図の例1のよう
に、単語辞書部3に認識すべき単語として、「がいこ
く」が登録されると、予めオペレータの音声で登録され
た単音節パターンの中から「が」、「い」、「こ」、
「く」が抽出されて、合成作成部4で単語パターン「が
いこく」が合成されて合成パターン辞書部5に登録され
る。
音声入力「がいこく」が入力されると、入力部1でパ
ターン化されて、パターン照合部6で、合成パターン辞
書部5に記憶された単語の合成パターンと照合され、こ
の例では、「がいこく」とのパターンの照合がとれて認
識結果として出力される。
〔発明が解決しようとする問題点〕
単語の中には発声時にその単語を構成する単音節通り
の発音がされず、異なる音節で発音される場合がある。
例えば、単語「かがみ」の「が」のように、通常の発
声では鼻音化して発声される。
このような単語は、単語の仮名表記に音節パターンを
当てはめて合成しても、実際の発声から得られた単語の
合成パターンと異なり、上記した従来の方式による音声
認識装置では単語認識が不可能な場合、あるいは誤認識
する場合がある。
本発明はこのような点に鑑みて創作されたものであっ
て「が行」鼻音化音節、即ち「が」「ぎ」「ぐ」「げ」
「ご」「ぎゃ」「ぎゅ」「ぎょ」を有する単語パターン
を合成して単語音声認識の高い単語音声認識装置を提供
することを目的としている。
〔問題点を解決するための手段〕
上記した目的を達成するため音声認識装置に、「な
行」単音節パターンの子音区間を抽出する子音区間抽出
部と、鼻音パターンを作成する手段と、「が行」鼻音化
した単音節パターンを記憶する「が行」鼻音化音節パタ
ーン辞書部と、合成パターン作成部に音節結合によって
生じる「が行」鼻音化の規則を記憶する「が行」鼻音化
規則部を付設する。
〔作 用〕
単語辞書部に記憶された単語の中で、「が行」鼻音化
規則部に記憶された規則に適合する単語を抽出して合成
パターン作成部で単語パターンを作成する際に、「が
行」鼻音化規則で通常「が行」鼻音化して発声される音
節パターンを鼻音化した特殊単音節パターンを用いて作
成する。
そのために、音節テンプレート辞書部に登録された
「な行」音節パターンの子音区間を子音区間抽出部で抽
出し、抽出した子音区間のパターンを基に鼻音パターン
を作成し、「が行」音節パターンの先頭に付加して「が
行」鼻音化音節の単音節パターンとする。
そして、作成された「が行」鼻音化音節パターンを、
「が行」鼻音化規則に適合した単語を合成する場合の単
音節パターンとして「が行」鼻音化音節パターン辞書部
に記憶しておく。
このようにして「が行」鼻音化規則に則って作成され
た単語パターンは、他の単語パターンとともに合成パタ
ーン記憶部に記憶される。
従って、合成パターン記憶部には発声単語に近い単語
の合成パターンが記憶されることになり、パターン照合
部で照合して認識する入力単語の認識率が向上すること
になる。
〔実施例〕
以下、図面を参照して本発明の単語音声入力装置の実
施例を説明する。
第1図は本発明の一実施例の構成ブロック図、 第2図は抽出期間を説明する図、 第3図は「が行」鼻音化音節の例を示す図である。
なお、全図を通じて同一符号は同一対象物を示す。
先ず、オペレータの音声登録に際して、オペレータの
音声が入力部1でパターン化され、単音節に分離されて
音節テンプレート辞書部2に音節パターンとして記憶さ
れる。
記憶された音節パターンで、第2図のように、子音区
間抽出部7が単音節パターン内で隣接フレーム間パラメ
ータの変動量が最大となる点を子音と母音の過渡部分の
中心として、単音節パターンの始端から過渡点までの区
間を抽出する。
即ち、通常単音節パターンで発音始端と子音と母音と
過渡点、発音の終端で隣接フレーム間パラメータの変動
量のピークを生じる。
従って、発声始点から第1のピークと第2のピーク間
を子音の抽出区間とする。
そして、平均値算出部8で単音節「な」「に」「ぬ」
「ね」「の」の子音抽出区間で子音特徴の顕著な所定の
区間(通常、前半区間)における特徴量の全体の平均値
が算出される。
この場合、上記5単音節に、「にゃ」「にゅ」「に
ょ」の3単音節を加えた8単音節を用いることがある。
このように「な行」子音区間から抽出された特徴量の
平均値をもち、所定の継続時間、例えば、10mSの区間を
鼻音パターンとして「が行」単音節パターンの先頭に付
加し、「が行」鼻音化音節パターンを形成して「が行」
鼻音化音節パターン辞書部9に記憶される。
一方、発声される単語の「が行」音は2つの場合があ
る。即ち、 (1)「がいこく」の「が」のように、破裂音で発声さ
れる場合、 (2)「かがみ」の「が」のように、鼻音化する場合、 がある。、 従って、(1)の場合は音節パターン「が」を用い
て、(2)の場合は鼻音化した「が」鼻音を用いた単語
の合成パターンを合成パターン作成部4で作成し、合成
パターン辞書部5に記憶する。
以上「が行」音節パターン「が」の場合を具体的に述
べたが、一般的な「が行」鼻音化法則として、 法則1 語頭の「が行」音は鼻音にならず、破裂音の発
音記号「g」で発音される。
法則2 語頭以外の「が行」音は、原則として、鼻音の
発音記号 で発音される。
〔NHK編 日本語発音アクセント辞典参照〕
このような法則を「が行」鼻音化規則部10に記憶し、
単語辞書部3に登録される単語が合成パターン作成部4
で単語パターンが作成される時に適用される。
その結果、合成パターン辞書部6には発声音に類似度
の高い単語の合成パターンが用意されることになり、従
って、認識時のパターン照合部6における入力音声との
照合確率が高くなる。
なお、鼻音化した「が行」音節パターンの語頭に付加
される「な行」音節パターンの子音区間の平均値を所定
時間継続したパターンを独立した音節パターン、即ち鼻
音パターンとして、「が行」鼻音化音節パターン辞書部
9に記憶され、単語パターン作成時に「が行」音節パタ
ーンに付加して「が行」鼻音を生成してもよいことは云
うまでもない。
また、「が行」鼻音化規則部10に記憶する規則は上記
した一般的法則に限定されることなく、派生した細則を
記憶して、さらに類似度の高い単語パターンを作成する
ことができる。
また、合成パターン辞書部5はすべての合成パターン
を常時保有することなく、一パターン分の領域だけを有
し、照合時に順次合成パターン作成部4で作成されたパ
ターンを置換するようにしてもよい。
こうすることによって、メモリ容量は大幅に節減する
ことができる。
また、「が行」鼻音化音節パターンには、「な行」子
音区間から抽出した平均値を用いたが、「な行」子音区
間から得られる特定値を用いて作成することができる。
〔発明の効果〕
以上述べてきたように、本発明によれば、「が行」鼻
音化音節パターンを「な行」音節パターンの子音抽出区
間の特徴量の平均値を用いて作成することによって、実
際の音声の単語発音に近似した単語の合成パターンが記
憶されるので単語音声認識の認識率が向上し、実用的に
は極めて有用である。
【図面の簡単な説明】
第1図は本発明の単語音声認識装置の構成ブロック図、 第2図は抽出区間を説明する図、 第3図は「が行」鼻音化音節の例を示す図、 第4図は従来例の構成を説明する図である。 図において、 1は入力部、 2は音節テンプレート辞書部、 3は単語辞書部、 4は合成パターン作成部、 5は合成パターン辞書部、 6はパターン照合部、 7は子音区間抽出部、 8は平均値算出部、 9は「が行」鼻音化音節パターン辞書部、 10は「が行」鼻音化規則部である。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力する音声から特徴量を抽出し、パター
    ン化する入力部(1)と、音声の音節ごとにパターン化
    した単音節パターンを記憶する音節テンプレート辞書部
    (2)と、記号列で表記した単語を記憶する単語辞書部
    (3)と、該単語辞書部(3)の単語を前記音節テンプ
    レート辞書部(2)に記憶された単音節パターンを用い
    て該単語の合成パターンを作成する合成パターン作成部
    (4)と、該合成パターン作成部(4)で作成された単
    語の合成パターンを記憶する合成パターン辞書部(5)
    と、該合成パターン辞書部(5)に記憶された合成パタ
    ーンと前記入力部(1)に入力した音声パターンとを照
    合するパターン照合部(6)とを備えて構成され、前記
    入力部(1)に入力する音声の単音節パターンを前記音
    節テンプレート辞書部(2)に記憶しておき、前記入力
    部(1)に入力する未知単語音声を認識する音声認識装
    置の前記音節テンプレート辞書部(2)に記憶された
    「な行」単音節パターンの子音区間を抽出する子音区間
    抽出部(7)と、該子音区間抽出部(7)で抽出した該
    子音区間のパターンを基に鼻音パターンを作成する手段
    (8)と、該鼻音パターンを「が行」単音節パターンの
    先頭に付加して形成した「が行」鼻音化音節パターンを
    記憶する「が行」鼻音化音節パターン辞書部(9)を付
    設し、且つ前記合成パターン作成部(4)に音節結合に
    よって生じる「が行」鼻音化の規則を記憶する「が行」
    鼻音化規則部(10)を付設して、前記単語辞書部(3)
    に記憶された単語を前記「が行」鼻音化規則部(10)に
    照合して抽出し、抽出した単語を前記音節テンプレート
    辞書部(2)に記憶した単音節パターンと前記「が行」
    鼻音化音節パターン辞書部(9)が記憶する「が行」鼻
    音化音節パターンを併用して、前記合成パターン作成部
    (4)で合成パターンを作成することを特徴とする単語
    音声認識装置。
JP62195989A 1987-08-04 1987-08-04 単語音声認識装置 Expired - Lifetime JP2615643B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62195989A JP2615643B2 (ja) 1987-08-04 1987-08-04 単語音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62195989A JP2615643B2 (ja) 1987-08-04 1987-08-04 単語音声認識装置

Publications (2)

Publication Number Publication Date
JPS6438798A JPS6438798A (en) 1989-02-09
JP2615643B2 true JP2615643B2 (ja) 1997-06-04

Family

ID=16350365

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62195989A Expired - Lifetime JP2615643B2 (ja) 1987-08-04 1987-08-04 単語音声認識装置

Country Status (1)

Country Link
JP (1) JP2615643B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5158657A (en) * 1990-03-22 1992-10-27 Canon Kabushiki Kaisha Circuit substrate and process for its production

Also Published As

Publication number Publication date
JPS6438798A (en) 1989-02-09

Similar Documents

Publication Publication Date Title
KR20060049290A (ko) 혼성-언어 텍스트의 음성 변환 방법
JPS63220298A (ja) 音声認識における単語候補削減装置
JPH0352058A (ja) 音声入力の文書処理装置
JP2615643B2 (ja) 単語音声認識装置
JPS6050600A (ja) 規則合成方式
JPS6316766B2 (ja)
JP2615649B2 (ja) 単語音声認識装置
JP2820093B2 (ja) 単音節認識装置
JP2737122B2 (ja) 音声辞書作成装置
JP2707552B2 (ja) 単語音声認識装置
JPH0632019B2 (ja) 音声コ−ド作成方法
JPH1130994A (ja) 音声認識方法および装置ならびに音声認識プログラムを記録した記録媒体
JPS62116999A (ja) 音節単位音声認識装置
JP3522005B2 (ja) 音声合成装置
JP2001324995A (ja) 音声認識方法
JPS6180298A (ja) 音声認識装置
JPH03179498A (ja) 音声日本語変換方式
JPS60182499A (ja) 音声認識装置
JPS6373298A (ja) 文―音声変換装置に用いる複合語処理装置
JPH0635494A (ja) 音声認識装置
JPH11175087A (ja) 単語音声認識の文字列マッチング法
JPS62218997A (ja) 単語音声認識装置
JPH05241592A (ja) 連続単語認識装置
JPS6033599A (ja) 音声認識装置
JPS61121167A (ja) 区切り発声に基づく音声ワ−ドプロセツサ