JPS6344698A - 単語検出方式 - Google Patents

単語検出方式

Info

Publication number
JPS6344698A
JPS6344698A JP61190261A JP19026186A JPS6344698A JP S6344698 A JPS6344698 A JP S6344698A JP 61190261 A JP61190261 A JP 61190261A JP 19026186 A JP19026186 A JP 19026186A JP S6344698 A JPS6344698 A JP S6344698A
Authority
JP
Japan
Prior art keywords
category
syllable
candidate
word
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61190261A
Other languages
English (en)
Other versions
JPH0656559B2 (ja
Inventor
畑崎 香一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61190261A priority Critical patent/JPH0656559B2/ja
Publication of JPS6344698A publication Critical patent/JPS6344698A/ja
Publication of JPH0656559B2 publication Critical patent/JPH0656559B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声認識装置、音声入力装置等において用いら
れ、入力音声中に含まれる単語とその単語の音声中での
位置とを検出する単語検出方式に関する。
(従来の技術) 音声認識装置、音声入力装置等において入力音声中の単
語とその位置を検出する方法に、音節、音素、音素クラ
ス等のカテゴリの列である入力音声から各カテゴリとそ
れらの入力音声中での位置情報とを抽出し、抽出された
カテゴリから作成したカテゴリ列がある単語のカテゴリ
洒に対応すれば、その単語と入力音声中でのカテゴリ列
の位置とを検出結果として出力する方法がある。
一般に上述のカテゴリは、その時間長が短かく、また類
似するカテゴリが存在することなどから、入力音声中の
カテゴリを完全に誤りなく抽出することは困難である。
このため、従来は、入力音声中の各カテゴリの区間に対
して複数個のカテゴリ候補を抽出しておき、入力音声の
端から順にカテゴリ候補を用いて、部分的なカテゴリ候
補列を生成しては単語のカテゴリ列との照合を行なうと
いう処理を繰り返すことによって、その単語に対応する
カテゴリ候補タリを見つけていた。この方法の詳細は、
例えば、文献1r特願昭58−214544号、バタン
認識装置」に述べられているので、ここでは省略する。
また、入力音声中のカテゴリ抽出の段諧において、発声
のなまけや隣接するカテゴリ(例えば音節)どうしの調
音結合などの原因によって、入力音声には含まれないカ
テゴリが検出され、その結果、隣接すべきカテゴリ候補
の間に他のカテゴリ候補が出現することがある。この現
象を以後、カテゴリ挿入誤りと呼ぶ。
カテゴリ挿入誤りに対処するために、従来は次の方法を
用いていた。1−なわら、どのようなカテゴリの芝びの
とぎにカテゴリ挿入誤りが起こりやすいかということ奢
あらかじめ調査し、その結果から比・咬的頻度の高いカ
テゴリ挿入誤りについてカテゴリ列訂正規則を用意する
。カテゴリ列訂正規則は、カテゴリ挿入誤りの起こって
いるカテゴリタフに適用された場合、挿入されたカテゴ
リを削除する。この規則を、単語検出時に、カテゴリ候
補列に適用することによって、比較的類度の高いカテゴ
リ挿入誤りは、訂正することができる。この方法は、例
えば文献2″松永昭−5好田正紀’ Branch &
 Bourid法の効果とBottom −IJp音1
0識を利用した9補選択”、日本前り学会音声研究会資
料S 85−79.1986年1月」の616頁右側1
5行から18行目に述べられている。また、訂正規則の
例は同文#、617頁、表4に示されている。
(発明が解決しようとしている問題点)上記従来の方法
では、入力音声から抽出されたカテゴリ候補を用いてカ
テゴリ候補列を生成したのちに、R語のカテゴリ列との
照合を行なっていたために、最終的に無駄になるカテゴ
リ候補列が多数生成されてしまい、そのために多大な計
算量を必要としていた。
また、検出すべき単語の区間が入力音声の一部分しか占
めない場合でも、従来は、その単語の存在しない区間を
含め、入力音声の端からすべてのカテゴリ候補について
等しく単語中のカテゴリとの照合を行なわねばならず、
無駄な計算時間を必要とし、単語の検出まで長い時間を
必要としていた。
きらに、前記のカテゴリ列訂正規則は、カテゴリ挿入誤
りの起こ−)でいるカテゴリ候補列だけではなくて、起
こっていないカテゴリ候補列にも等しく通用される。ま
た、一つのカテゴリ候補列に対し−Cは、多くの場合複
数個の訂正規則が個別に適用される。このため、一つの
カテゴリ候補列から多くのカテゴリ候補7gが生成され
てしまい、単語のカテゴリタフとの照合を行なうべきカ
テゴリ候補列の数が増加する。しがもそのカテゴリ候補
列のほとんどは、検出すべき単語のカテゴリ列とは−7
一致しないために拒絶されるものである。
また、訂正規則で訂正できるカテゴリ挿入誤りは比較的
8繁に起こるものに限られ、まれに起こる誤りを訂正す
ることはできない。訂正できる誤りの種類を増やすため
には訂正規則の数を増加いせなければならないが、この
結果、生成されるカテゴリ候補夕+lはまrま1増加す
る。
例えば、「オンセイニンシキワ(音声認識は)、と発声
された音声が入力され、その中の音節候補を抽出した場
合、音節“ン”と“シ”のそれぞれの音節候補の間に音
節“二゛が誤って挿入される場合がある。この場合、他
の音節に対して正しい音WJ侯補が得られた場合でも、
抽出された音節候補から生成される音@候補夕11は“
オンセイニンニシキワ”となり、この中には正しい単Z
5候補1認識」の音節例゛ニンシキ”に一致する部分が
ないため、単語rで識」を検出することはできない、し
かも、このような音節の挿入誤りは比較的まれな種類の
ものであり、この誤りを訂正する規則が用意さg−rい
、にとは少ない。
本発明の目的は、無駄なカテゴリ候補列を生成せず、ま
た、検出すべき単語の区間が入力音声全体のごく一部で
ある場合や、さらに入力音声中のカテゴリ候補検出時に
いくつかのカテゴリ候補が誤って挿入された場合でも、
効率よく入力音声から正しい単語とその位置とを検出す
ることを可能にする単語検出方式を提供することにある
(問題点を解決するための手段) 前述の問題点を解決し上記目的を達成するために本発明
が提供する手段は、音節、音素、音素クラス等のカテゴ
リの列である入力音声から抽出した複数個のカテゴリ候
補とそれらの位置情報とを用いて、単語のカテゴリ列に
対応するカテゴリ候補列を生成することによって、入力
音声中の単語とその出現位置を検出する単語検出方式で
あって、入力音声から得た複数詞のカテゴリ候補のそれ
ぞれをそのカテゴリ名で分類して記憶し、単語中のカテ
ゴリの並びの順に従って各カテゴリに対応するカテゴリ
候補をそのカテゴリと同じ名前に分類きれて記憶されて
いるカテゴリ候補の中から選ぶとともに、単語中の黛接
する2個のカテゴリのそれぞれが、入力音声中の連続す
る3個のカテゴリ候補の並びの両端のカテゴリ候補に対
応するときには、その2個のカテゴリの並びと3個のカ
テゴリ候補の並びとを対応許せて、カテゴリ候補列の生
成を行なうことを特徴とする。
(作用) 本発明の方式では、入力音声から抽出諮れたカテゴリ候
補のうち、検出すべき単語に含まれるカテゴリと同じ名
前のカテゴリ候補だけを用いて、かつ単語中のカテゴリ
の並びを辿りながら対応するカテゴリ候補列を生成する
。このことによって、単語のカテゴリ列あるいはその部
分列に対応するカテゴリ候補列だけが生成されることに
なり、無駄なカテゴリ列を生成することを避けることが
可能となる。
また、入力音声中のカテゴリ候補のうち、単語中のカテ
ゴリに対応するカテゴリ候補からカテゴリ候補列を生成
してゆくために、検出すべき単語の区間が入力音声の全
体のごく一部の場合であっても、また、その区間が入力
音声中のどの位置にあっても、素早くその単語を検出す
ることが可能となる。
また、カテゴリの挿入誤りが生じた場合でも以下の原理
で単語を検出することが可能となる。いま、カテゴリ列
がc 、、、、 C、、C、、、、Crである単語Wが
含まれる入力音声中のカテゴリ候補を抽出した結果、カ
テゴリC,,、C,それぞれのカテコ゛り候補に、、、
に、の間に誤ってカテゴリ候補Kxが挿入されたとする
。すなわち、入力音声中での単MWに対応する部分のカ
テゴリ候補列はK 18. 、 K + −r K x
 K I、 、、 K rとなる。そこで、検出すべき
単語中のカテゴリの並びを辿りながら、そのi語に対応
するカテゴリ候補列を生成するときに、カテゴリC5−
エに対応するカテゴリ候補(K、、)とカテゴリCIに
対応するカテゴリ候補(K、)とがそれぞれ、入力音声
中での連続する3個のカテゴリ候補の並びの両端のカテ
ゴリ候補であるなら、その3個のカテゴリ候補の並びを
単語中のカテゴリ列C1−、C、に対応きせる。このこ
とによって、カテゴリ候補に8が挿入されたとしても、
カテゴリ候補列とカテゴリ列との正しい対応をとること
が可能になる。また、単語のカテゴリ列に対応するカテ
ゴリ候補列だけが生成されることになるため、無駄なカ
テゴリ候補列の生成を避けることができる。
(実施例) 以下、図面を参照しつつ、実施例に従って本発明を一層
詳細に説明する。
第1図は本発明の一実施例を示すブロック図である。
本実施例では日本語の音声の入力がきれるものとし、ま
たカテゴリとして音節を用いる。音節抽出部101は入
力音声中の音節候補を検出し、その候補を音節候補記憶
部102に記憶する。
音節抽出部101の一例をブロック図で第2図に示す、
第2図において、入力音声は音声バッファ201に一旦
格納きれる。まず、母音候補検出部202が、音声バッ
ファ201に格納された音声中のD前候補を検出し、N
音候補記憶部203に格納する。
母音候補の検出は母音バタン記憶部204にあらかじめ
格納されている各母音の音声標準バタンと入力音声の各
区間とを照合することによって行なわれる。母音の音声
信号は比較的定常であるので検出は容易である。各母音
候補は少なくとも母音名、入力音声中での位置の情報を
保持している。母音候補の検出が終了した後、子音候補
検出部205によって子音候補が次に述べるようにして
検出される。日本語においては、音節は子音(C)−母
音(V)の組である。従って入力音声中では、2個の母
音に挾まれた区間のうちのある時間長以下の区間(これ
を■CV区間)および入力音声の始端からある時間長以
内にある母音までの区間(これをCv区間)のそれぞれ
に、1個の子音が存在すると言える。子音候補検出部2
04は母音候補記憶部203に記憶されている母音候補
から作られるすべての707区問およびCV区間のそれ
ぞれに対して、あらかじめ子音バタン記憶部206に記
憶されている■C■およびCv標準音声バタンとの照合
を行ない、類似度の高い複数個の音声バタンの名前を子
音民補とする0以上で決定されたバl音候補と子音候補
とを組み合わせて音節候補とし、入力音声中での位置と
共に音節候補記憶部102(こ二己士意ずろ。
例として、“オンセイニンシキワ″(音声認識は)とい
う音声が入力されたとすると、音節認識の結果として例
えば第3図に示されるような音節候補が抽出゛される。
第3図において、矢印の線が各音節候補の区間であり、
各区間に複数個の音節候補が抽出されている。これらの
音節候補は、音節名で分類されて、音節候補記憶部10
2に記憶される。この結果、音節候補記憶部102の内
容は第4図に示されるようになる。この図では、各音節
候補を“音節名/始端時刻:終端時刻”の形式で表現し
ている。
単語記憶部103には検出すべさ単語の音節夕lが記憶
されている。その中の1個の単語を、!を語バッファ1
04に取り出した後、入力音声にこの単語が含まれるか
どうかが調べられる。今、単語バッファ104には単語
「認識、の音節列“ニンシキ”が記憶されているとする
音節候補列生成部105は単語バッファ104に記憶さ
れている一a語中の音節の並びの順に、音節候補記憶部
102中の音節候補から音節候補列を作成し、その結果
の音節候補列と対応する音節列とを音節候補列記憶部1
06に記憶する。本実施例では、単語の先頭の音節から
順に音節列を作成してゆく。
まず、単語バッファ104先頭の音節は“二”であるか
ら、音節候補列生成部105は音節候補記憶部102中
で“二”に分類されて記憶されている音節候補を取り出
し、それぞれを長さ1の音節候補列として、音節“二”
とともに音節候補列記憶部106に記憶する。この結果
、音節候補列記憶部106には、 ■二10:2  (ニ) ■二/2:4(ニ) ■−二/10 :  12   (二 )■二/14 
: 16  (ニ) の4個の音節候補列が記憶部れる。ここで、括ユの中が
対応する音節列である。
次に、音節候補列生成部105は単語バッファ104中
の次の音節“ン”に注目し、音節候補記憶部102中で
“ン”に分類されて記憶されている音節候補のそれぞれ
について、音節候補列記憶部106中のいずれかの音節
候補列の最後尾の音節候補の直後にか、あるいは他の1
個の他の音節候補を介して、入力音声中で後続している
かどうかを調べる。そのように後続している音節候補が
あれば、その音節候補を音節候補列の最後尾に連結して
新たな音節候補列を生成し音節候補列記憶部106に記
憶する。音節候補Aが他の音節候補Bに後続L7ている
かどうかは音節候補Aの終端時刻と音wJ侯補Bの始端
時刻とを比較することによって判定することができる。
ここでは、それらの時刻の差がプラスマイナス1以下の
ときに後続すると判定する。今の場合は、“ン”に分類
されて記憶されている音節候補は、ン/2:4、ン/1
2 : 14の3個である。そこで、音節候補ン/2:
4が音節候補列■の最後尾の音節候補二10:2の直後
に後続することから、音節候補列■に音節吸補二10:
2を連結して音節列“ニン”とする。同様に、音節候補
ン/12:14を音節候補列■に連結して音節列″ニン
”とする、また、それまで音節候補列記憶部106に記
憶されていた音節候補列は削除する。この結果、音節候
補列記憶部106の中には、 ■二10:2−ン/2:4にン) ■二/10 : 12−ン/12:14  にン)の2
個の音節候補列が残る。
統いて、音節“シ”についての処理に進む。音節候補記
憶部102中で、“シ”に分類されて記憶されている音
節候補は、シ/4ニアとシ/16:18の2個である。
このそれぞれについて音節候補列■と■の最後尾の音節
候補に、直接かあるいは他の1個の他の音節候補を介し
て、入力音声中で後続しているかどうかを調べる。この
結果、シ/4ニアが音節候補列■に連結される。また、
シ/16 : 1Bは音節候補列■の最後尾の音節候補
ン/12:14に音節候補二/14:16またはイ/1
4:16を介して接読しているため、音節侯補シ/16
:18が音節候補列■に連結される。従って、音節候補
列記憶部106の内容は ■二10:2−ン/2:4−シ/4ニアにンシ) ■二/10:12−ン、/12:14−シ/16:18
にンシ) となる。
ここで、単語バッファ104の中の最後の音節“キ”に
ついての処理に進む。音節候補記憶部102中で、“キ
”に分類されて記憶されている音節候補は、キ/18:
19の1個である。この音節候補について音節候補タリ
■と■の最後子の音節候補に、直接かあるいは他の1個
の他の音節候補を介して、入力音声中で後続しているか
どうかを調べる。この場合、音節候補列■の最後尾の音
節候補シ/14:16の直後に後続している。このこと
から、音節候補キ/18:1(lが音節候補列■に連結
きれ、次の音節候補列■が音節候補列に記憶される。
■二/10:12−ン/12:14−シ/16 : 1
8−キ/18 : 19  にンシキ) ここで、単語バッファ104の最後の音節に達している
ため、音節候補列生成部105は、単語「認識」が入力
音声中の時刻10から時刻19に至る区間に存在すると
いうことを出力する。
以上、本発明の一実施例を説明した。なお、カテゴリの
挿入誤りは、連続しないかぎり、1個の単語中に複数細
土じていてもよい。
(発明の効果) 以上説明したように、本発明によれば、入力音声からの
音節候補抽出の段階で、いくつかの余分な音節候補が誤
って挿入きれた場合でも、その単語の存在と入力音声中
での位置を検出することが可能となり、しかも検出処理
の途中で生成される音節候補列の数が極めて少なくて、
効率の良い単語検出を行なうことが可能となる、単語検
出方式を提供することができる。
【図面の簡単な説明】 第1図は本発明の一実施例を示すブロック図、第2図は
第1図実施例における音節抽出部の具体例を示すブロッ
ク図、第3図は第1図実施例における入力音声と抽出さ
れた音節候補の一例を示す図、第4図は第1図実施例に
おける音節候補記憶部の内容の一例を示す図である。 101・・・音節抽出部、102・・・音節候補記憶部
、103・・・単語記憶部、104・・・単語バッファ
、105・・・音節列生成部、106・・・音節列記憶
部、201・・・音声バッファ、202・・・母音候補
検出部、203・・・母音候補記憶部、204・・・母
音バタン記憶部、205・・・子音候補検出部、206
・・・子音バタン記憶部。

Claims (1)

    【特許請求の範囲】
  1. 音節、音素、音素クラス等のカテゴリの列である入力音
    声から抽出した複数個のカテゴリ候補とそれらの位置情
    報とを用いて、単語のカテゴリ列に対応するカテゴリ候
    補列を生成することによって、入力音声中の単語とその
    出現位置を検出する単語検出方式において、入力音声か
    ら得た複数個のカテゴリ候補のそれぞれをそのカテゴリ
    名で分類して記憶し、単語中のカテゴリの並びの順に従
    って各カテゴリに対応するカテゴリ候補をそのカテゴリ
    と同じ名前に分類されて記憶されているカテゴリ候補の
    中から選ぶとともに、単語中の隣接する2個のカテゴリ
    のそれぞれが、入力音声中の連続する3個のカテゴリ候
    補の並びの両端のカテゴリ候補に対応するときには、そ
    の2個のカテゴリの並びと3個のカテゴリ候補の並びと
    を対応させて、カテゴリ候補列の生成を行なうことを特
    徴とする単語検出方式。
JP61190261A 1986-08-12 1986-08-12 単語検出方式 Expired - Lifetime JPH0656559B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61190261A JPH0656559B2 (ja) 1986-08-12 1986-08-12 単語検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61190261A JPH0656559B2 (ja) 1986-08-12 1986-08-12 単語検出方式

Publications (2)

Publication Number Publication Date
JPS6344698A true JPS6344698A (ja) 1988-02-25
JPH0656559B2 JPH0656559B2 (ja) 1994-07-27

Family

ID=16255201

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61190261A Expired - Lifetime JPH0656559B2 (ja) 1986-08-12 1986-08-12 単語検出方式

Country Status (1)

Country Link
JP (1) JPH0656559B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02217333A (ja) * 1989-02-15 1990-08-30 Toshiba Glass Co Ltd 近赤外線カットフィルタガラス

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02217333A (ja) * 1989-02-15 1990-08-30 Toshiba Glass Co Ltd 近赤外線カットフィルタガラス
JPH0476938B2 (ja) * 1989-02-15 1992-12-07 Toshiba Glass Kk

Also Published As

Publication number Publication date
JPH0656559B2 (ja) 1994-07-27

Similar Documents

Publication Publication Date Title
US6094633A (en) Grapheme to phoneme module for synthesizing speech alternately using pairs of four related data bases
US6876967B2 (en) Speech complementing apparatus, method and recording medium
JPS6344698A (ja) 単語検出方式
CN108959163B (zh) 有声电子书的字幕显示方法、电子设备及计算机存储介质
JPS6344700A (ja) 単語検出方式
JPS6344697A (ja) 単語検出方式
JPS6344696A (ja) 単語検出方式
JPS5958493A (ja) 認識装置
JPS63158599A (ja) 単語検出方式
JPS646514B2 (ja)
JPS62206597A (ja) 音声認識用単語予備選択方式
JPS62208125A (ja) 文章読上げ装置
JP2839515B2 (ja) 文字読取システム
JPH0632014B2 (ja) 単語検出方式
JPS636599A (ja) 単語予備選択方式
JPS63158600A (ja) 単語検出装置
JPS6146995A (ja) 音声認識システム
JPS6312000A (ja) 音声認識装置
JPS6311998A (ja) 音声認識におけるマツチング方法
JPS62209600A (ja) 音声合成装置
JPH0792675B2 (ja) 音声認識装置
JPS62108300A (ja) 音声合成方式
JPS62147492A (ja) 音声認識装置における標準パラメ−タの修正方法
JPH0744188A (ja) 音声認識装置
JPS5926800A (ja) 音声認識装置