JP2707552B2 - 単語音声認識装置 - Google Patents

単語音声認識装置

Info

Publication number
JP2707552B2
JP2707552B2 JP62213611A JP21361187A JP2707552B2 JP 2707552 B2 JP2707552 B2 JP 2707552B2 JP 62213611 A JP62213611 A JP 62213611A JP 21361187 A JP21361187 A JP 21361187A JP 2707552 B2 JP2707552 B2 JP 2707552B2
Authority
JP
Japan
Prior art keywords
pattern
unit
word
syllable
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62213611A
Other languages
English (en)
Other versions
JPS6455595A (en
Inventor
教幸 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62213611A priority Critical patent/JP2707552B2/ja
Publication of JPS6455595A publication Critical patent/JPS6455595A/ja
Application granted granted Critical
Publication of JP2707552B2 publication Critical patent/JP2707552B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔概 要〕 本発明は、音節パターンから促音パターンを生成し、
促音をもつ単語の音声パターンを作成して記憶し、入力
音声の単語認識を行う単語音声認識装置に関し、 促音音節を有する単語の単語音声認識率の高い単語音
声認識装置を提供するを目的とし、 入力音声の特徴量を抽出してパターン化する単語音声
特徴量抽出部と、該単語音声特徴量の音節区間を検出す
る音声区間検出回路とからなる入力部と、 前記単語音声の特徴量のパターンから抽出した音節パ
ターンを記憶する音節テンプレート辞書部と、該音節パ
ターンのうち子音区間を特定する子音区間抽出部と、該
子音区間内の特徴量パターンの平均値を算出する平均値
算出部と、該平均値を促音パターンの振幅として記憶す
る促音パターン辞書部と、 音声を単語として予め記憶しておく単語辞書部と、促
音のもつ規則性を記憶しておく促音パターン選択規則部
と、 前記音節テンプレート辞書部と、前記促音パターン辞
書部と、前記単語辞書部と、前記促音パターン選択規則
部とからの出力を総合して、促音を含む単語のパターン
を作成する合成パターン作成部と、該合成パターンを記
憶しておく合成パターン辞書部と、 パターン照合部とを有し、 音声登録を行うに際しては、前記入力部の出力が前記
音節テンプレート辞書部に切り換えられて、前記入力音
声が前記合成パターン辞書部に記憶され、 音声認識に際しては、前記入力部の出力が前記パター
ン照合辞書部に切り換えられて、前記被認識入力音声と
前記合成パターンとが照合されるように単語音声認識装
置を構成する。 〔産業上の利用分野〕 本発明は、音節パターンから促音パターンを生成し、
促音をもつ単語の音声パターンを作成して記憶し、入力
音声の単語認識を行う単語音声認識装置に関するもので
ある。 単語音声認識装置は、オペレータの発声の単音節をパ
ターン化して、この単音節パターンから単語の合成パタ
ーンを生成しておき、オペレータが入力する音声の単語
を認識する装置である。 しかし、単語が実際に発音されるとき、その単語を構
成する促音音節はある場合は無音となり、ある場合は複
数種類のパターンで発音される。 従って、促音「っ」を含む単語は単純な合成方式では
認識率が低くなるので、特に促音「っ」を含む単語の認
識率を向上させる方法が要望されている。 〔従来の技術〕 第4図は、従来例の単語音声認識装置の構成を説明す
る図である。 先ず、音節パターンが登録される手順を説明する。 第4図において、入力部1に入力した音声の特徴量の
抽出とパターン化が特徴量抽出部11によって行われる。 即ち、一定時間ごとのクロックに応じて入力音声の周
波数成分、スペクトル強度等の成分が特徴量として抽出
される。 次いで、区間検出回路12で入力音声の発声による単音
節区間の長短を弁別して、単音節それぞれの区間を検出
し、単音節に分離する。 分離された単音節はパターン化され、単音節パターン
として音節テンプレート辞書部2に登録される。 一方、この認識装置が認識すべき単語を平仮名、片仮
名、アルファベット、あるいは発音記号等のコードの記
号列で表記して単語辞書部3に記憶させる。 合成パターン作成部4は、音節テンプレート辞書部2
に登録された単音節パターンを結合して、単語辞書部3
に記憶された単語それぞれの合成パターンを作成する。 そして、単語ごとに作成された単語の合成パターンは
合成パターン辞書部5に記憶される。 次いで、入力音声の認識手順を説明する。 音声入力は、入力部1でパターン化され、パターン照
合部6に入力して合成パターン辞書部5が記憶する単語
パターンと逐一照合され、合致したパターンの単語が認
識結果として出力される。 具体的に説明すると、例えば単語辞書部3に認識すべ
き単語として、「むろらん」が登録されると、予めオペ
レータの音声で登録された単音節パターンの中から
「む」、「ろ」、「ら」、「ん」が抽出されて、合成作
成部4で単語パターン「むろらん」が合成されて、合成
パターン辞書部5に登録される。 被認識音声入力「むろらん」が入力されると、入力部
1でパターン化されて、パターン照合部6で、合成パタ
ーン辞書部5に記憶された単語の合成パターンと照合さ
れ、この例では、「むろらん」とのパターンの照合がと
れて認識結果として出力される。 〔発明が解決しようとする問題点〕 単語が実際に発音されるとき、単語中の促音はある場
合は無音となり、ある場合は複数種類のパターンで発音
される。 例えば、単語「さっぽろ」の促音「っ」は無音となる
ため圧縮されて「さぽろ」と発音されるので、「っ」を
省略して合成パターンを「さぽろ」と登録して照合がと
れる。 しかし、単語「いっしん」の促音「っ」を省略する
と、実際の発音は有音部分があるので、照合がとれなく
なる。 しかも、この場合の促音「っ」は後続の子音に影響さ
れ、1つのパターンでは照合がとれない。 このような単語は、単語の表記によって機械的圧縮、
あるいは、1つのパターンを当てはめて合成パターンを
作成しても単語認識が不可能な場合、あるいは誤認識す
る場合がある。 本発明はこのような点に鑑みて創作されたものであっ
て、促音「っ」を含む単語の合成パターンを複数の音節
パターンの子音区間から作成し、適用規則によって促音
「っ」のパターンを選択して単語パターンを合成し、単
語音声認識の高い単語音声認識装置を提供することを目
的としている。 〔問題点を解決するための手段〕 上記した目的は、入力音声の特徴量を抽出するパラメ
ータ抽出部と、抽出された前記特徴量の音節区間を検出
する音節区間検出回路とからなり、入力音声の単語パタ
ーンまたは単音節パターンを出力する入力部と、 前記単音節パターンを記憶する音節テンプレート辞書
部と、 前記音節テンプレート辞書部に記憶されている前記単
音節パターンのうち子音区間を抽出する子音区間抽出部
と、 前記子音区間内の特徴量の平均値を算出する平均値算
出部と、 前記平均算出部からの出力を促音パターンとして記憶
する促音パターン辞書部と、 単語の発音を予め記憶しておく単語辞書部と、 促音のもつ規則を記憶しておく促音パターン選択規則
部と、 前記音節プレート辞書部と、前記促音パターン辞書部
と、前記単語辞書部と、前記促音パターン選択規則部と
の出力から、促音を含む単語の合成パターンを作成する
合成パターン作成部と、 前記合成パターンを記憶しておく合成パターン辞書部
と、 前記入力回路から出力された被認識の単音節パターン
と、前記合成パターン作成部からの出力を照合するパタ
ーン照合部とを有し、 音声単語登録の際には、前記入力部の出力が前記音節
テンプレート辞書部に切り換えられ、入力された前記音
声単語が前記合成パターン辞書部に記録され、 音声認識の際には、前記入力部の出力が前記パターン
照合部に切り換えられ、前記被認識の単音節パターンと
前記合成パターン辞書部の出力とが照合されるように構
成された単語音声認識装置によって解決される。 〔作 用〕 単語辞書部に記憶された単語の中で、促音パターン選
択規則部に記憶された規則に適合する単語を抽出して、
合成パターン作成部で単語パターンを作成する際に、促
音パターン選択規則に照らして促音を含む単語パターン
の促音パターンを選択使用して単語パターンを作成す
る。 そのために、音節テンプレート辞書部に登録された複
数の音節パターンの子音区間を子音区間抽出部で抽出
し、特徴抽出部でその音節パターンの子音部の特徴量パ
ターンを抽出して平均値を求め、該平均値を促音の音節
パターンとする。 有声子音の発声に際して子音に先行して生ずるバズ音
区間において、同様な方式でバズ音パターンも促音の音
節パターンの1つとする。 そして、作成された促音パターンを用いて促音パター
ン選択規則に適合した単語を合成する場合の単音節パタ
ーンとして、促音パターン辞書部に記憶しておく。 この無音を含む複数の促音パターンが促音パターン選
択規則に則って選択適用された単語パターンは、他の単
語パターンとともに合成パターン記憶部に記憶される。 従って、合成パターン記憶部には発音単語に近い単語
の合成パターンが記憶されることになり、パターン照合
部で照合して認識する入力単語の認識率が向上すること
になる。 〔実施例〕 以下、図面を参照して本発明の単語音声認識装置の実
施例を説明する。 第1図は本発明の一実施例の構成図、 第2図は音節の構成を説明する図、 第3図は促音音節の例を示す図である。 なお、全図を通じて同一符号は同一対象物を示す。 先ず、オペレータの音声登録に際して、オペレータの
音声が入力部1でパターン化され、単音節に分離されて
音節テンプレート辞書部2に音節パターンとして記憶さ
れる。 記憶された音節パターンで、第2図のように、子音区
間抽出部7が単音節パターン内で隣接フレーム間パター
ンの変動量が最大となる点を子音と母音の過渡部分の中
心として、単音節パターンの始端から過渡点までの区間
を抽出する。 即ち、通常、単音節パターンで発音始端と子音と母音
の過渡点、発音の終端で隣接フレーム間パラメータの変
動量のピークを生じる。 従って、発声始点から第1のピークと第2のピーク間
を子音の抽出区間とする。 また、有声子音では子音発音に先行してバズ音を生
じ、第1ピークと第2のピーク間をバズ音抽出区間と
し、第2ピークと第3のピーク間を子音の抽出区間とす
る。 そして、平均値算出部8で、バズ音および子音抽出区
間の中で、特にバズ音あるいは子音特徴の顕著な所定の
区間(通常、前半区間)における特徴量の全体の平均値
が算出される。 このように子音の特徴量の平均値をもち、所定の継続
時間をもつパターンを促音の音節パターンとして、促音
パターン辞書部9に記憶される。 さらに、具体的には、例えば、 音節パターン「さ」「す」「せ」「そ」から子音
〔s〕の平均特徴量「*さ」、 「し」から子音〔∫〕の平均特徴量「*し」、 「た」「て」「と」から子音〔t〕の平均特徴量「*
た」、 「ち」から子音〔t∫〕の平均特徴量「*ち」、 「つ」から子音〔ts〕の平均特徴量「*つ」等、ある
いは濁音「ば」等の有声子音のバズ音の平均特徴量
「#」を特徴量とし、所定の継続時間をもつパターンを
促音パターンとして促音パターン辞書部9に記憶する。 一方、発声される単語の促音は次のような場合があっ
て、それらの場合に対応して規則として、促音パターン
選択規則部10に記憶される。 即ち、 (1)促音直後の音節の子音が〔p〕〔t〕〔k〕の場
合は無音とする。 (2)促音直後の音節の子音が〔s〕〔∫〕の場合には
「さ行」の単音節から上記手段によって作成された促音
パターンを用いる。 (3)促音直後の音節の子音が〔h〕〔f〕の場合には
「は行」の単音節から上記手段によって作成された促音
パターンを用いる。 (4)促音直後の音節の子音が、(1),(2),
(3)以外の場合にはバズ音を抽出して促音パターンと
する。 そして、このような法則(1)〜(4)を促音パター
ン選択規則部10に記憶し、単語辞書部3に登録される単
語が合成パターン作成部4で単語パターンとして作成さ
れる時に適用される。 第3図は単語パターンを上記した規則に則って合成さ
れた例を示す。 このようにして、合成パターン辞書部6には発声音に
類似度の高い単語の合成パターンが用意されることにな
り、従って、認識時のパターン照合部6における入力音
声との照合確率が高くなる。 なお、合成パターン辞書部5はすべての合成パターン
を常時保有することなく、一パターン分の領域だけを有
し、照合時に順次合成パターン作成部で作成されたパタ
ーンを置換するようにしてもよく、こうすることによっ
て、メモリ容量は大幅に節減することができる。 また、促音パターンには、単音節パターンのそれぞれ
の子音区間、あるいはバズ音区間から抽出した平均値を
用いたが、単音節パターンの子音区間、あるいはバズ音
区間から得られる特定値を用いて作成することができ
る。 〔発明の効果〕 以上述べてきたように、本発明によれば、促音「っ」
の音節パターンを単音節パターンの子音区間、あるいは
バズ音区間から作成し、接続される音節パターンによっ
て選択して用い、実際の音声の単語発音に近似した単語
の合成パターンが記憶されるので単語音声認識の認識率
が向上し、実用的には極めて有用である。
【図面の簡単な説明】 第1図は本発明の単語音声認識装置の構成ブロック図、 第2図は抽出区間を説明する図、 第3図は促音音節の例を示す図、 第4図は従来例の構成を説明する図である。 図において、 1は入力部、 2は音節テンプレート辞書部、 3は単語辞書部、 4は合成パターン作成部、 5は合成パターン辞書部、 6はパターン照合部、 7は子音区間抽出部、 8は平均値算出部、 9は促音パターン辞書部、 10は促音パターン選択規則部、 11は特徴量抽出部、 12は区間検出回路である。

Claims (1)

  1. (57)【特許請求の範囲】 1.入力音声の特徴量を抽出するパラメータ抽出部と、
    抽出された前記特徴量の音節区間を検出する音節区間検
    出回路とからなり、入力音声の単語パターンまたは単音
    節パターンを出力する入力部と、 前記単音節パターンを記憶する音節テンプレート辞書部
    と、 前記音節テンプレート辞書部に記憶されている前記単音
    節パターンのうち子音区間を抽出する子音区間抽出部
    と、 前記子音区間内の特徴量の平均値を算出する平均値算出
    部と、 前記平均算出部からの出力を促音パターンとして記憶す
    る促音パターン辞書部と、 単語の発音を予め記憶しておく単語辞書部と、 促音のもつ規則を記憶しておく促音パターン選択規則部
    と、 前記音節プレート辞書部と、前記促音パターン辞書部
    と、前記単語辞書部と、前記促音パターン選択規則部と
    の出力から、促音を含む単語の合成パターンを作成する
    合成パターン作成部と、 前記合成パターンを記憶しておく合成パターン辞書部
    と、 前記入力回路から出力された被認識の単音節パターン
    と、前記合成パターン作成部からの出力を照合するパタ
    ーン照合部とを有し、 音声単語登録の際には、前記入力部の出力が前記音節テ
    ンプレート辞書部に切り換えられ、入力された前記音声
    単語が前記合成パターン辞書部に記録され、 音声認識の際には、前記入力部の出力が前記パターン照
    合部に切り換えられ、前記被認識の単音節パターンと前
    記合成パターン辞書部の出力とが照合される ことを特徴とする単語音声認識装置。
JP62213611A 1987-08-26 1987-08-26 単語音声認識装置 Expired - Fee Related JP2707552B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62213611A JP2707552B2 (ja) 1987-08-26 1987-08-26 単語音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62213611A JP2707552B2 (ja) 1987-08-26 1987-08-26 単語音声認識装置

Publications (2)

Publication Number Publication Date
JPS6455595A JPS6455595A (en) 1989-03-02
JP2707552B2 true JP2707552B2 (ja) 1998-01-28

Family

ID=16642046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62213611A Expired - Fee Related JP2707552B2 (ja) 1987-08-26 1987-08-26 単語音声認識装置

Country Status (1)

Country Link
JP (1) JP2707552B2 (ja)

Also Published As

Publication number Publication date
JPS6455595A (en) 1989-03-02

Similar Documents

Publication Publication Date Title
US4994983A (en) Automatic speech recognition system using seed templates
JPS6147440B2 (ja)
JPS597998A (ja) 連続音声認識装置
JPH11231895A (ja) 音声認識方法及びその装置
JP2707552B2 (ja) 単語音声認識装置
JP2820093B2 (ja) 単音節認識装置
JP2737122B2 (ja) 音声辞書作成装置
JPH0283593A (ja) ノイズ適応形音声認識装置
JP2615649B2 (ja) 単語音声認識装置
JP2615643B2 (ja) 単語音声認識装置
JP3503862B2 (ja) 音声認識方法及び音声認識プログラムを格納した記録媒体
JPH1130994A (ja) 音声認識方法および装置ならびに音声認識プログラムを記録した記録媒体
JP2001324995A (ja) 音声認識方法
JPS6126678B2 (ja)
JPS63157199A (ja) 話者照合装置
JP2864511B2 (ja) 話者識別方式と装置
JP2507374B2 (ja) 音声合成装置
JPH09244692A (ja) 発声単語認証方法およびこの方法を実施する装置
JPS6180298A (ja) 音声認識装置
JPS6027433B2 (ja) 日本語情報入力装置
JPH02116899A (ja) 音声認識装置
JPS62116999A (ja) 音節単位音声認識装置
JPS62217297A (ja) 単語音声認識装置
JPS6317498A (ja) 単語音声認識方式
JPH045697A (ja) 単語アクセント登録方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees