JPH01173000A - 促音化音声の登録方式 - Google Patents

促音化音声の登録方式

Info

Publication number
JPH01173000A
JPH01173000A JP62332154A JP33215487A JPH01173000A JP H01173000 A JPH01173000 A JP H01173000A JP 62332154 A JP62332154 A JP 62332154A JP 33215487 A JP33215487 A JP 33215487A JP H01173000 A JPH01173000 A JP H01173000A
Authority
JP
Japan
Prior art keywords
words
word
pattern
consonant
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62332154A
Other languages
English (en)
Inventor
Kazuo Takeshima
武島 和男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62332154A priority Critical patent/JPH01173000A/ja
Publication of JPH01173000A publication Critical patent/JPH01173000A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 特定話者・限定単語・連続発声方式の音声認識装置で、
連続発声した単語が促音化した時誤認識しないように、
連続発声により促音化した音声パターンを登録する促音
化音声の登録方式に関し、効率的に促音化した単語の音
声パターンを登録することを目的とし、 特定話者により限定された単語を離散発声させ、該単語
の音声パターンを登録した後、該特定話者に該限定され
た単語を連続発声させ、該登録済みの音声パターンと照
合して、該連続発声させた単語を認識する音声認識装置
において、連続発声することで促音化する単語の組合わ
せの発声により得られた音声パターンについて、登録済
みの単語の音声パターンの始端と終端を検出することに
より、促音化した単語の音声パターンの始端と終端を検
出し、この検出された始端と終端の間の音声パターンを
促音化した単語の音声パターンとして登録する音声照合
部を設けて構成する。
〔産業上の利用分野〕
本発明は特定話者・限定単語・連続発声方式の音声認識
装置に係り、特に連続発声された単語が促音化した場合
に誤認識しないように、辞書に連続発声により促音化し
た音声パターンを登録する促音化音声の登録方式に関す
る。
特定話者・限定単語・連続発声方式の音声認識装置は、
特定話者に限定された単語を離散発声させ、この単語の
音声パターンから登録パターンを作成して、これを辞書
に登録しておき、該特定話者が限定された単語を連続発
声した時、この連続発声された単語から得られた音声パ
ターンと登録パターンとを照合して、連続発声された単
語を認識している。
従って、連続発声した音声中の単語の音声パターンと、
登録された単語の音声パターンがほぼ同じであれば、誤
認識しにくいが、単語の組合わせによっては、連続発声
した時促音化して、音声パターンが変化していることが
あり、誤認識の原因となる。 このため、連続発声する
ことで促音化される単語の音声パターンは、辞書に登録
されていることが必要である。
〔従来の技術〕
第6図は従来の技術を説明する図である。
横軸に時間を縦軸に音声パワーレベルをとると、第6図
(alは「1」という単語を離散発声した場合の音声パ
ターンを示す。即ち、イチと発声された場合であり、第
6図(k+)は「点」をテンと離散発声した場合の音声
パターンを示す。
この「1点」を連続発声する場合、イチテンと発声され
た時の音声パターンは促音化されていないため、第6図
(C1に示す如く、離散発声して登録した音声パターン
の第6図(a)と山)の音声パターンと照合することで
認識し得る。しかし、イッテンと発声された時の音声パ
ターンは促音化されているため、第6図(d)に示す如
く、離散発声して登録した音声パターンの第6図(a)
と(b)の音声パターンと照合しても、イツと発声され
た単語は認識することが出来ない。
〔発明が解決しようとする問題点〕
特定話者に限定した単語を離散発声させて音声パターン
を登録し、この限定した単語を連続発声させて認識する
場合、単語の組合わせによっては、上記の如く、連続発
声した時に促音化される単語がある。このような促音化
された単語は認識することが出来ないため、連続発声し
た時に促音化される単語については、促音化された音声
パターンを辞書に登録しておく必要がある。
しかし、連続発声すると促音化し易い単語を、離散発声
時に促音化して発声することは馴れないと難しい。又、
連続発声することで必ず促音化されるとは限らず、確率
的な事象であるため、促音化した音声パターンを効率的
に取り出すことは難しい。
従って、従来は連続発声することで促音化する単語が辞
書に登録されていないため、連続発声時に促音化した場
合は誤認識されるという問題がある。
本発明はこのような問題点に鑑み、連続発声すると促音
化し易い単語の組合わせを、予め限定された単語の中か
ら抽出し、この組合わせた単語の読み方を特定話者に通
知して発声させ、促音化した単語を切り出して、その音
声パターンを登録することで、効率的に促音化した単語
の音声パターンを登録することを目的としている。
〔問題点を解決するための手段〕
第1図は本発明の原理ブロック図である。
特定話者が離散発声により限定された単語を順次発声す
ると、音声入力部1は一つの単語の音声パターンを切り
出して、辞書3に順次格納する。
制御部4は音声パターンの登録完了を通知されると、促
音化判定部5に指示して、連続発声すると促音化し易い
単語を含む単語列を、例えばスピーカ6に送出させ、こ
の単語列を特定話者が発声するように指示する。
特定話者が指示された単語列を連続発声した時、制御部
4は音声入力部1に指示して、この単語列の音声パター
ンを音声照合部2に送出させる。音声照合部2はダイナ
ミックプログラミング法による照合(以後DP照合と略
す)により、この単語列の音声パターンから、辞書3に
登録済みの単語の音声パターンの始端と終端を検出する
ことを繰り返し、最終的に促音化した単語の音声パター
ンの始端と終端を検出して、促音化した単語の音声パタ
ーンを抽出する。
第2図は第1図の動作を説明する図である。
横軸に時間を縦軸に音声パワーレベルをとると、連続発
声された単語の音声パターンは、図示の如くに連続して
音声人力部lから音声照合部2に送出される。
例えば、促音化し易い単語の組合わせをX、 Yとする
と、単語Xが促音化する。即ち、「1点」という単語の
組合わせならば、Xは「1」であり、Yは「点」である
。この単語X、Yの前に、単語A0〜A8を、後に単語
B0〜B、を付加したものを単語列とする。この単語A
o””Anと80〜BNは付加してもしなくても良いが
、一般にこれらの単語を付加した方が、一つの単語光た
りの語長が連続発声した場合の語長に近くなるため、連
続単語を認識する上で有利である。
但し、促音化した単語Xを除き、他の単語は総て既に辞
書に音声パターンが登録済みであることが必要である。
音声照合部2は、第2図に示す如き音声パターンが人力
すると、■に示す音声パターンの始端と、辞書3から読
出した単語A(1の音声パターンの始端とを対応させ、
片端点フリーDP照合を行って、単語A0の音声パター
ンの終端■を検出する。
次に単語Aoの音声パターンの終端■と、単語A、の音
声パターンの始端とを対応させて、片端点フリーDP照
合を行って、単語A+の音声パターンの終端■を検出す
る。このようにして、単語AMの音声パターンの終端■
を検出する。この終端■は単語Xの音声パターンの始端
である。
ここで、音声照合部2は単語Xの終端を検出するが、始
端■より後に、無音又は音声パワーレベルが闇値より小
さい時間が、所定の時間継続した場合、即ち、単語の切
れ目を示した場合は、音声パワーレベルが再び闇値より
大きくなった■の位置を単語Xの終端とするが、このよ
うな条件が満たされない場合は、音声パターンの始端検
出処理とは逆に、音声パターンの終端■から、辞書3か
ら読出した単語BHの音声パターンの終端とを対応させ
、始端方向に片端点フリーDP照合を行って、単語B、
の音声パターンの始端を検出する。
次に、単語B8−3の音声パターンの始端を検出するが
、このような動作を繰り返し、単語Yの音声パターンの
始端■を検出する。この単語Yの音声パターンの始端■
は単語Xの音声パターンの終端である。
従って、音声照合部2は促音化した単語Xの音声パター
ンの始端と終端が検出出来たため、この始端と終端の間
の音声パターンを抽出し、辞書3に促音化された単語の
音声パターンとして格納する。
〔作用〕
上記の如く構成することにより、制御部4は特定話者の
限定された単語の登録が完了した通知に基づき、促音化
判定部5に指示して、促音化判定部5が予め記憶してい
る連続発声すると促音化し易い単語の組合わせを含む単
語列の発声を、スピーカ6を経て特定話者に指示させる
ため、音声照合部2は、音声入力部lを経て入力する指
定した単語列の音声パターンを、辞書3に登録済みの単
語の音声パターンとDP照合することで、促音化した単
語の音声パターンを抽出し、辞書3に登録するこ・とが
出来る。
〔実施例〕
第3図は本発明の一実施例を示す回路のブロック図で、
第4図は第3図の動作を説明するフローチャートで、第
5図は第3図の動作を説明する図である。
特定話者はキーボード9を経て制御部4に対し、音声パ
ターンの登録を通知し、制御部4はこの通知に基づき、
切替回路7を点線のように接続させる。ここで、特定話
者はマイクロホン11に対し限定された単語を離散発声
する。
音声入力部1は第4図に示す如く、この離散発声された
単語の音声パターンを切り出して、該音声パターンの特
徴パラメータを抽出し、辞書3に該音声パターンに対応
して記憶させ、音声パターンの登録を行う。
限定された単語の登録が完了すると、特定話者はキーボ
ード9から制御部4に単語の登録完了を通知する。制御
部4はこの通知に基づき、第4図に示す如く、促音化単
語の組合わせが有るか調べる。これは認識する単語が限
定されているため、予め連続発声すれば促音化し易い単
語の組合わせがあるか否かを知ることが可能で、例えば
制御部4に予め促音化し易い単語の組合わせ数をセット
しておくことにより、制御部4が認識する。
制御部4は、促音化単語の組合わせが有れば、促音化し
た音声パターンの登録が完了したか調べ、完了していな
ければ、促音化し易い単語の組合わせ数を一つ減算し、
促音化し易い単語の組合わせを含む単語列の発声を指示
するため、促音化判定部5に指示して、予め連続発声す
ると促音化し易い単語の組合わせを含む単語列の送出を
1旨示する。
このような単語列を予め用意することは、認識する単語
が限定されているため可能である。
促音化判定部5は制御部4の指示により、音声出力部8
と制御部4に、予め設定されているメツセージと共に、
予め設定されている単語列を読出して送出する。例えば
、第5図(a)に示す如く、単語列として、イチイッテ
ンと発声させるものとすると、メツセージとして、「促
音化し易い単語の組合わせが有ります。次の単語列を発
声して下さい。」を送出し、続いて単語列として「イチ
イ、ツテン」を送出する。
音声出力部8はスピーカ6に対し、メツセージを送出し
て、スピーカ6から音声でメツセージを出力させ、続い
て、単語列の読み方を「イチイッテン」と出力させる。
又、制御部4は表示部10にメツセージを表示させると
共に、単語列の読み方「イチイッテン」を表示させる。
同時に制御部4は切替回路7を実線で示す如く接続させ
る。従って、特定話者が指示された単語列を連続発声し
た音声が、マイクロホン11により音声信号に変換され
て音声入力部1に入力すると、音声入力部1は、この音
声信号を音声パターンとして、音声照合部2に送出する
音声照合部2は制御部4の指示により、この音声パター
ンを図示省略したメモリに記憶した後続出し、第4図に
示す如く、促音化した音声パターンの始端を検出する。
即ち、第5図(a)に示す如く、「イチイッテン」と発
声された音声パターンの始端■と、第5図(b)に示す
辞書3から読出した単語「イチ」の音声パターンの始点
■とを対応させ、矢印で示す照合方向に片端点フリーD
P照合を行って、「イチ」と発声された単語の音声パタ
ーンの終端を検出する。
即ち、第5図(C)に示す如く、1フレーム当たりの照
合距離が最小となるフレーム■(単語「イチ」の音声パ
ターンの終端)を検出する。そして、その次のフレーム
を促音化された単語「イン」の音声パターンの始端とす
る。
続いて、音声照合部2は第4図に示す如く、促音化した
音声パターンの終端を検出する。即ち、第5図(d)に
示す如く、「イチイッテン」と発声された音声パターン
の終端[相]と、第5図(e)に示す辞書3から読出し
た単語「テン」の音声パターンの終端■とを対応させ、
矢印で示す照合方向に片端点フリーDP照合を行い、第
5図(f)に示す如く、■フレーム当たりの照合距離が
最小となるフレーム0(単語「テン」の音声パターンの
始端)を検出し、その次のフレームを促音化された単語
「イソ」の音声パターンの終端とする。
ここで、音声照合部8は第4図に示す如く、促音化した
単語「イツ」の音声パターンの始端から終端迄を辞書3
に登録する。制御部4は促音化した音声パターンの登録
が完了したか調べるルーチンに戻り、セットされた促音
化し易い単語の組合わせ数が零となって、登録が完了し
たことを示していれば動作を終了する。
〔発明の効果〕
以上説明した如く、本発明は連続発声することで促音化
し易い単語の組合わせがある場合、その単語の読み方を
指示するため、効率的に促音化した単語の音声パターン
を辞書に登録することが可能となり、この促音化した単
語の音声パターンを登録することで、特定話者による単
語の連続発声における認識誤りを防止出来る。
【図面の簡単な説明】
第1図は本発明の原理ブロック図、 第2図は第1図の動作を説明する図、 第3図は本発明の一実施例を示す回路のブロック図、 第4図は第3図の動作を説明するフローチャート、第5
図は第3図の動作を説明する図、 第6図は従来の技術を説明する図である。 図において、 ■は音声入力部、  2は音声照合部、3は辞書、  
   4は制御部、 5は促音化判定部、 6はスピーカ、 7は切替回路、   8は音声出力部、9はキーボード
、  10は表示部である。 本発明f)原理ブ七、ツク圀 察 1  図 竿 1  し]のΦかイ’ga占で一■可13 し4算
 2 図 木発日可の一賞力伝イダ・Sεホ1回惨の70ツク閤第
3 図 猶3図/l動か仕εにぐ、冒Hイ3フローチャート寥4
日 二       二

Claims (1)

  1. 【特許請求の範囲】 1)特定話者により限定された単語を離散発声させ、該
    単語の音声パターンを登録した後、該特定話者に該限定
    された単語を連続発声させ、該登録済みの音声パターン
    と照合して、該連続発声させた単語を認識する音声認識
    装置において、 連続発声することで促音化する単語の組合わせの発声に
    より得られた音声パターンについて、登録済みの単語の
    音声パターンの始端と終端を検出することにより、促音
    化した単語の音声パターンの始端と終端を検出し、この
    検出された始端と終端の間の音声パターンを促音化した
    単語の音声パターンとして登録する音声照合部(2)を
    設けたことを特徴とする促音化音声の登録方式。 2)上記連続発声することで促音化する単語の組合わせ
    の発声は、前記限定された単語の中から連続発声すると
    促音化し易い単語の組合わせを抽出して、予め記憶させ
    た促音判定部(5)が送出する促音化し易い単語の組合
    わせの発声要求に基づくことを特徴とする特許請求の範
    囲第1項記載の促音化音声の登録方式。
JP62332154A 1987-12-28 1987-12-28 促音化音声の登録方式 Pending JPH01173000A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62332154A JPH01173000A (ja) 1987-12-28 1987-12-28 促音化音声の登録方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62332154A JPH01173000A (ja) 1987-12-28 1987-12-28 促音化音声の登録方式

Publications (1)

Publication Number Publication Date
JPH01173000A true JPH01173000A (ja) 1989-07-07

Family

ID=18251754

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62332154A Pending JPH01173000A (ja) 1987-12-28 1987-12-28 促音化音声の登録方式

Country Status (1)

Country Link
JP (1) JPH01173000A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5847100A (ja) * 1981-09-01 1983-03-18 ユニリ−バ−・ナ−ムロ−ゼ・ベンノ−トシヤ−プ ビルト液体洗剤組成物

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5847100A (ja) * 1981-09-01 1983-03-18 ユニリ−バ−・ナ−ムロ−ゼ・ベンノ−トシヤ−プ ビルト液体洗剤組成物

Similar Documents

Publication Publication Date Title
EP2048655B1 (en) Context sensitive multi-stage speech recognition
US7013276B2 (en) Method of assessing degree of acoustic confusability, and system therefor
US8972243B1 (en) Parse information encoding in a finite state transducer
NO309750B1 (no) Talegjenkjenning
US20070136060A1 (en) Recognizing entries in lexical lists
US20040015357A1 (en) Method and apparatus for rejection of speech recognition results in accordance with confidence level
Hirschberg et al. Generalizing prosodic prediction of speech recognition errors
JP2745562B2 (ja) ノイズ適応形音声認識装置
JP3277579B2 (ja) 音声認識方法および装置
JPH01173000A (ja) 促音化音声の登録方式
JP3110025B2 (ja) 発声変形検出装置
JP3039453B2 (ja) 音声認識装置
JP2664785B2 (ja) 音声認識装置
JP6517417B1 (ja) 評価システム、音声認識装置、評価プログラム、及び音声認識プログラム
JP3357752B2 (ja) パターンマッチング装置
JPH08110790A (ja) 音声認識装置
JPS6126678B2 (ja)
JPH0736481A (ja) 補完音声認識装置
JP2528105B2 (ja) 音声認識装置
JP2578771B2 (ja) 音声認識装置
JP2004309654A (ja) 音声認識装置
JPS63217399A (ja) 音声区間検出装置
JPS58186836A (ja) 音声入力デ−タ処理装置
JPH0640274B2 (ja) 音声認識装置
JPS6180298A (ja) 音声認識装置