JPS6317498A - 単語音声認識方式 - Google Patents

単語音声認識方式

Info

Publication number
JPS6317498A
JPS6317498A JP61161021A JP16102186A JPS6317498A JP S6317498 A JPS6317498 A JP S6317498A JP 61161021 A JP61161021 A JP 61161021A JP 16102186 A JP16102186 A JP 16102186A JP S6317498 A JPS6317498 A JP S6317498A
Authority
JP
Japan
Prior art keywords
word
pattern
pseudo
patterns
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61161021A
Other languages
English (en)
Inventor
教幸 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP61161021A priority Critical patent/JPS6317498A/ja
Publication of JPS6317498A publication Critical patent/JPS6317498A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 予め、単音節、若しくは音素のパタンを登録しておき、
単語音声を認識するときには、未知の人力単語音声パタ
ンと、上記登録単音節、若しくは音素パタンを連結した
擬像単語パタン群とのパタン間距離を求め、その最小距
離を与える凝似単語パタンの単語を認識結果とする単語
音声認識方式において、該擬偵単語パタンとして、認識
対象の単語に含まれる音節の中で、無声化等によって脱
落が予想される音節を除いた擬似単語パタンを用意して
、単語音声を認識するようにしたものである。
〔産業上の利用分野〕
本発明は、予め、単音節、若しくは音素のパタンを登録
しておき、単語音声を認識するときには、未知の入力単
語音声パタンと、上記登録単音節。
若しくは音素パタンを連結した擬似単語パタン群とのパ
タン間距離を求め、その最小距離を与える擬似単語パタ
ンの単語を認識結果とする単語音声認識方式に係り、特
に未知入力単語音声を区間検出したときに生じる音節の
脱落に対処する単語音声認識方式に関する。
一般に、複数個の標準音声パタンと、未知の入力音声パ
タンとを比較照合して、最も似ているパタンを認識結果
とする音声認識装置は、例えば、仕分は作業等の分野に
おいて、発声項目が増加すると、標準音声パタンを生成
、登録する作業が膨大となってくることから、最近では
、複数個の単音節、若しくは音素のパタンを持ち、認識
時には未知入力単語音声パタンと、上記登録単音節、若
しくは音素パタンを連結した擬似単語パタン群とのパタ
ン間距離を求め、最小距離を与える擬似単語パタンの単
語を認識結果とする単語音声認識方式が考えられるよう
になってきた。
然し、この方式においては、一般に、該単音節。
又は音素の組み合わせによって擬似単語パタンを生成す
る為、単音節の無声化とか、該単語の中の単音節のパタ
ンか変形して、未知単語音声に対する認識率が低下する
問題があり、高い認識率の得られる単語音声認識方式が
待たれるようになってきた。
〔従来の技術〕
第3図は従来の音声認識処理方式を説明する図である。
先ず、マイクから入力された音声は、パラメータ抽出部
1において、該音声パタンの特徴を表す認識パラメータ
を抽出する。
この認識パラメータの抽出においては、例えば、帯域通
過フィルタ群を使用したBPF分析や、線形予測分析(
LPG)等の方法が知られている。
上Ha BPF分析においては、マイクから入力された
音声を、特定の標本化周期(例えば、18m5)でサン
プリングした音声エネルギーのスペクトラム強度をディ
ジタル化したものを認識パラメータとする。
該抽出された認識パラメータは、次の音声区間検出部2
において、真に音声が存在する区間を検出し、その部分
の認識パラメータを、ノ々タンマ・ノチングを行う為の
データとする。
具体的には、例えば、上記パラメータ抽出部で作成した
入力音声の認識パラメータに基づいて、音声パワーを計
算し、該音声パワーを、ある特定の闇値でチェックし、
該闇値より大きい部分を音声存在区間と判定するように
する。
一方、擬似単語パタン生成部41においては、予め登録
されている単語辞書42から、文字列表記された単語を
読み出し、該単語を構成している単音節、若しくは音素
に対する認識パタンを、単音節パタン群43から検索し
て、上記単語に対すに格納されている複数個の単語につ
いての擬似単語パタン群4を作成する。
照合部3においては、擬似単語パタン群4から、各単語
の音声パタンを順次取り出し、前述の区間検出部から出
力される入力音声の認識パラメータとを、例えば、パタ
ンマツチング法によって照合し、パタン間距離を求め、
最小距離を与える擬似単語パタンの単語を認識結果(例
えば、単語寛)としていた。
〔発明が解決しようとする問題点〕
一般に、日本語を発声する場合、例えば、(キ)(り)
(シ)(ス)(チ)(ツ)(ヒ)())(ビ)(プ)(
シュ)等、(k) (g) (t) (h) (p)の
子音を持つ音節(拍)の次に(i) (u)の母音が続
く場合、該母音の口構えだけで、実際に(i) (u)
が有声にひびかない現象があり、「母音の無声化」と呼
ばれている。
(「日本語発声アクセント辞典J NIIK 編参照)
このような、無声化し易い音節が、単語中の先頭、若し
くは語尾にある場合、従来方式の音声認識処理において
実行されている音声区間検出処理で、該無声化部分が脱
落することが多く、該脱落が予想される音節を除いた擬
似単語パタンを用意していない、従来方式の音声認識処
理においては、該区間検出において該無声化部分に脱落
が生じた場合、殆どが棄却されるか、或いは誤認識され
ると云う問題があった。
本発明は上記従来の欠点に鑑み、反位単語パタンとして
、単語の音節系列に対応したものと、無声化による脱落
を予想した擬似単語パタンの両方を使用して、擬似単語
パタン群を構成し、未知入力音声に対する認識率を向上
させる方法を提供することを目的とするものである。
〔問題点を解決するための手段〕
第1図は、本発明の擬似単語パタン群生成方式の原理ブ
ロック図である。
本発明においては、予め、単音節、若しくは音素のパタ
ンを登録しておき、単語音声を認識するときには、未知
の入力単語音声パタンと、上記登録単音節、若しくは音
素パタンを連結した反位単語パタン群とのパタン間距離
を求め、その最小距離を与える擬似単語パタンの単語を
認識結果とする単語音声認識方式であって、 上記擬似単語パタンとして、上記認識対象の単語毎に、
該単語に含まれる音節の中で発生ずる脱落音節を除いた
擬似単語パタンを生成する手段41〜45を設けるよう
に構成する。
〔作用〕
即ち、本発明によれば、予め、単音節、若しくは音素の
パタンを登録しておき、単語音声を認識するときには、
未知の入力単語音声パタンと、上記登録単音節、若しく
は音素パタンを連結した反位単語パタン群とのパタン間
距離を求め、その最小距離を与える擬似単語パタンの単
語を認識結果とする単語音声認識方式において、該擬似
単語パタンとして、認識対象の単語に含まれる音節の中
で、無声化等によって脱落が予想される音節を除いた擬
似単語パタンを用意して、単語音声を認識するようにし
たものであるので、単語音声認識において実行する区間
検出で生じることのある単語中の音節の脱落による誤認
識を防ぎ、未知の入力単語音声に対する認識性能を向上
させる効果がある。
〔実施例〕
以下本発明の実施例を図面によって詳述する。
第2図は本発明の一実施例をブロック図で示したか図で
あり、第1図、第2図において示した、脱落規則44を
用いて生成した規則適用単語辞書45に基づいて、擬似
単語パタン群を生成する手段41〜43が本発明を実施
するのに必要な手段である。
尚、企図を通して同じ符号は同じ対象物を示している。
以下、第1図、第2図を用いて、本発明の単語音声認識
方式を説明する。
本発明を実施しても、単語音声認識方式の基本的な動作
は従来と変わることはないので省略し、ここでは、本発
明の主眼である擬似単語パタン群4°の生成方式を中心
にして説明する。
例えば、マイクより入力された音声に「hukaket
su (不可欠)」と云う単語が含まれていた場合、対
応する擬似単語パタンとして、次の4種類を考える。
(a) hu  ka  ke  tsu(b)   
ka  ke  tsu (c) hu  ka  ke (d)   ka  ke こうすることにより、上記「hukaketsU(不可
欠)」と云う単語が人力された場合、前述のように区間
検出部2において、rhuJ 、若しくはrtsuJが
脱落しても、正しく認識できることになる。
例えば、rhuJが脱落した場合には(b)のパタンと
の照合距離が一番短くなり、認識結果として「不可欠」
と云う単語を得ることができる。
但し、例えば、「kake (賭)」と云う単語も、同
時に認識対象に含まれている場合には、上記擬似単語パ
タン群4゛の中から、該(d)を除去した方が良い。然
し、このような一致は余程大語党の認識でない限りあま
り発生することはないので、現実的には問題は少ない。
又・例えば、未知の入力音声から、上記区間検出部2に
おいて、単語中の無音区間と判定された部分をつめて照
合部3で照合するような場合・該単語中の無声化音節の
脱落が生じるので、上記単語音声認識方式を適用して認
識率を上げることができる。
この例として、認識対象の単語に「akita(秋田)
」と云う単語が含まれていた場合を見ると、対応する擬
似単語パタンとしては、次の2種類が考えられる。
(a)  a  ki  ta (b)a     ta こうすることにより、「akita (秋田)」と云う
単語が入力された場合、無音区間として判定された“k
1″の区間がつめられて照合されても、正しく認識する
ことができる。
このような擬似単語パタン群4′を生成する手順につい
て、以下に説明する。
先ず、文字列表記された単語辞書42から、特定の単語
、例えば、上記「hukaketsu(不可欠)」を読
み出す。
ここで、当該単語に関して、前述の「母音の無声化」規
則44に従って、脱落音節を含む単語、例えば、 (b)   ka  ke  tsu (c) hu  ka  ke (d)   ka  ke を付加して、規則適用単語辞書45に格納する。
この単語を構成している単音節に対して、前述の単音節
パタン群43から、単音節パタンを抽出し、当該単語に
関する擬像単語パタンを生成して、擬似単語パタン群4
”とする。
以下、同じ操作を、単語辞書42に格納されている全て
の単語について実行し、それぞれの単語に脱落音節を含
む単語を付加する。
上記、「母音の無声化」規則には、例えば、前述の「日
本語発音アクセント辞典J NIIK kJA、  “
共通語の発音で注意すべきことがら”第1章、第2節“
共通語の母音の無声化”に法則1〜■があげられている
上記(b)〜(d)のパタンは、事前に、上記「母音の
無声化」規則に基づいて、人手によって生成し、当該音
声認識装置の、上記規則適用単語辞書45に入力しても
良いし、該無声化規則を元に、自動生成するようにして
も良いことは云う迄もないことである。
この場合、認識対象の単語が、最初から決まっていて変
更が無い、もしくは変更が少ない場合には、上記自動生
成の必要性は少ないが、変更の多い場合には、該無声化
規則等を使用して、自動生成するのが効果的である。
この規則適用単語辞書45.及び続く擬似単語パタン群
4゛を自動生成することにより、該無声化規則を知らな
い者でも、本発明の音声認識装置を構築することができ
る。
このように、本発明は、単語音声認識方式において、未
知の入力音声を区間検出したときに生じる脱落単語のパ
タンを、擬似単語パタン群に用意することにより、該脱
落による誤認識を防ぎ、棄却率の低減を図るようにした
所に特徴がある。
〔発明の効果〕
以上、詳細に説明したように、本発明の単語音声認識方
式は、予め、単音節、若しくは音素のパタンを登録して
おき、単語音声を認識するときには、未知の入力単語音
声パタンと、上記登録単音節、若しくは音素パタンを連
結した反位単語パタン群とのパタン間距離を求め、その
最小距離を与える擬似単語パタンの単語を認識結果とす
る単語音声認識方式において、該擬似単語パタンとして
、認識対象の単語に含まれる音節の中で、無声化等によ
って脱落が予想される音節を除いた擬似単語パタンを用
意して、単語音声を認識するようにしたものであるので
、単語音声認識において実行する区間検出で生じること
のある単語中の音節の脱落による誤認識を防ぎ、未知の
入力単語音声に対する認識性能を向上させる効果がある
【図面の簡単な説明】
第1図は本発明の擬偵単語パタン群生成方式の原理ブロ
ック図。 第2図は本発明の一実施例をブロック図で示した図。 第3図は従来の音声認識処理方式を説明する図。 である。 図面において、 1はパラメータ抽出部、2は区間検出部。 3は照合部、4,4°は擬像単語パタン群。 41は擬似単語パタン性成部。 42は単語辞書、43は単音節パタン群。 44は脱落規則、45は規則適用単語辞書。 をそれぞれ示す。 第  1  図 第  2  図

Claims (3)

    【特許請求の範囲】
  1. (1)予め、単音節、若しくは音素のパタンを登録して
    おき、単語音声を認識するときには、未知の入力単語音
    声パタンと、上記登録単音節、若しくは音素パタンを連
    結した擬似単語パタン群とのパタン間距離を求め、その
    最小距離を与える擬似単語パタンの単語を認識結果とす
    る単語音声認識方式であって、 上記擬似単語パタンとして、上記認識対象の単語毎に、
    該単語に含まれる音節の中で発生する脱落音節を除いた
    擬似単語パタンを生成(41〜45)して、該擬似単語
    パタン群4′の中に含めることを特徴とする単語音声認
    識方式。
  2. (2)上記擬似単語パタン群(4′)を生成する際に、
    特定の脱落規則(44)により、脱落パタンを自動生成
    することを特徴とする特許請求の範囲第1項に記載の単
    語音声認識方式。
  3. (3)上記自動生成された擬似単語パタンが、他の自動
    生成された擬似単語パタンと、一致若しくは似ている場
    合には、当該擬似単語のパタン群(4′)に登録しない
    ことを特徴とする特許請求の範囲第2項に記載の単語音
    声認識方式。
JP61161021A 1986-07-09 1986-07-09 単語音声認識方式 Pending JPS6317498A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61161021A JPS6317498A (ja) 1986-07-09 1986-07-09 単語音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61161021A JPS6317498A (ja) 1986-07-09 1986-07-09 単語音声認識方式

Publications (1)

Publication Number Publication Date
JPS6317498A true JPS6317498A (ja) 1988-01-25

Family

ID=15727078

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61161021A Pending JPS6317498A (ja) 1986-07-09 1986-07-09 単語音声認識方式

Country Status (1)

Country Link
JP (1) JPS6317498A (ja)

Similar Documents

Publication Publication Date Title
JPS63220298A (ja) 音声認識における単語候補削減装置
JPS62232691A (ja) 音声認識装置
JPS6383799A (ja) 連続音声認識方式
KR20160061071A (ko) 발음 변이를 적용시킨 음성 인식 방법
JPH0558553B2 (ja)
JPS63165900A (ja) 会話音声認識方式
JP3378547B2 (ja) 音声認識方法及び装置
JPS6317498A (ja) 単語音声認識方式
JPS58108590A (ja) 音声認識装置
Ahmed et al. Non-native accent pronunciation modeling in automatic speech recognition
JP2615643B2 (ja) 単語音声認識装置
JP2737122B2 (ja) 音声辞書作成装置
JPS6180298A (ja) 音声認識装置
JP2615649B2 (ja) 単語音声認識装置
JP2707552B2 (ja) 単語音声認識装置
JPH0534679B2 (ja)
JPH07146696A (ja) 音声認識における単語テンプレートの自動作成方法
JPS58195895A (ja) 単語音声認識装置
JPS6312000A (ja) 音声認識装置
JPS6346499A (ja) 大語▲い▼単語音声認識方式
JPS60182499A (ja) 音声認識装置
JPS6011898A (ja) 音声認識装置
JPS62160499A (ja) 音声認識装置
JPH02116899A (ja) 音声認識装置
JPH03120434A (ja) 音声認識装置