JPS63158597A - 単語検出方式 - Google Patents

単語検出方式

Info

Publication number
JPS63158597A
JPS63158597A JP61307047A JP30704786A JPS63158597A JP S63158597 A JPS63158597 A JP S63158597A JP 61307047 A JP61307047 A JP 61307047A JP 30704786 A JP30704786 A JP 30704786A JP S63158597 A JPS63158597 A JP S63158597A
Authority
JP
Japan
Prior art keywords
category
word
syllable
candidate
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61307047A
Other languages
English (en)
Other versions
JPH0632014B2 (ja
Inventor
畑崎 香一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61307047A priority Critical patent/JPH0632014B2/ja
Publication of JPS63158597A publication Critical patent/JPS63158597A/ja
Publication of JPH0632014B2 publication Critical patent/JPH0632014B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は単語検出装置に関し、特に音声認識、音声入力
装置等において入力音声中に含まれる単語を検出する単
語検出装置に関する。
(従来の技術) 音声認識装置、音声入力装置等においては、入力音声中
の単語全検出する方法のひとつとして、入力音声を音節
、音素、音素クラス等のカテゴリの列と見なし、入力音
声から検出したカテゴIJ e用いて作成したカテゴリ
列が単語辞書に記憶されている単語のカテゴリ列に対応
すればその単語を検出結果とするという方法がある。
一般に、上述したカテゴリは、その発声時間長が短いこ
とや類似するカテゴリが存在することなどから、入力音
声中から正しいカテゴリだけを誤りなく検出することが
困難である。そこで従来から、入力音声中の各カテゴリ
区間に対して複数個のカテゴリ候補を検出したのち、単
語辞書を参照して単語に対応するカテゴリ候補列を見つ
りるという方法を用いている。しかしながらこの場合に
も、発声のなまけや隣接するカテゴリ例えば音節どうし
の調音結合等の原因によって、あるカテゴリ区間の存在
が検出できなかったり、あるいはカテゴリ区間に正しい
カテゴリ候補が検出できない場合がある。
そこで、特願昭61−190258 、190259 
190260.190261の「単語検出方式」に述べ
られている方式のように、入力音声中のカテゴリ候it
検出したのち単語辞書中の単語のカテゴリの並びに従っ
てカテゴリ候補を選択するとともに1単語中のあるカテ
ゴリが検出されなかった場合にはその前後のカテゴリに
対応するカテゴリ候補を手掛かりにして単語のカテゴリ
列に対応するカテゴリ候補列を見つけている。また、対
応するカテゴリ候補列が見つかった単語については、そ
のカテゴリ候補列のスコアを計算して単語のスコアとす
るという手段をとっている。
一方、多数の単語のうちからスコアの良い単語を選択す
る場合には、それぞれの単語について個別に上述の方法
で対応するカテゴリ候補列及びスコアを求めるとすると
、特に単語辞書中の単語数が多い場合には多大な計′X
量を必要とし現実的でない。
そこで、スコアの良いカテゴリ候補列を優先して求める
ことにより、すべての単語について対応するカテゴリ候
補列を求めることなく、スコアの良い単語ヲ求めるよう
にしている。すなわち、単語のカテゴリ列をその始端か
ら辿ってその途中までの一部分に対応するカテゴリ候補
列を求めたうえそこまでのカテゴリ候補列のスコアを求
める。
そして、各時点でもっともスコアの良いカテゴリ候補列
を選び、それに対応するカテゴリ列をさらに先に辿る。
この処理を繰り返しつつある単語の終端に達したときに
その単語を結果として出力する。この結果、スコアの良
いカテゴリ候補列に対応する単語が優先して求められる
ことになる。
ここで、カテゴリ候補列のスコアとしてはそのカテゴリ
候補列を構成するカテゴリ候補のスコアの平均値が与え
られることが常である。
(発明が解決しようとする問題点) 上述のように、カテゴリ列の始端から途中までに対応す
るカテゴリ候補列のスコアをそのカテゴリ候補列を構成
するカテゴリ候補のスコアの平均値から求めた場合、正
しい単語のカテゴリ列の始端に近いカテゴリに対応する
候補のスコアが他の候補に比べて大幅に悪いときにはそ
の単語がなかなか検出さnないことが多いという欠点が
ある。
第3図は入力音声から抽出された音声候補の一例を示す
説明図1である。例えば、カテゴリとして音節を用い、
「ザイセイ」という音声が入力されたときにその各音節
に対して第3図に示さnるような音節候補が得られたと
する。ここで、各音節候補に記されている数字はその音
節候補のスコアで、その値が小さいほど良い、すなわち
より信頼できるとする。このとき、単語[セイゲン(制
限)1、「ザイゲン(財源Ll、rゼイセイ(税制)1
、「ザイセイ(財政)」の各単語に対応する音節候補列
を第3図の音節候補を用いて作成するとそのスコアは、 セイゲン: (3+7+8+4)/4=5.5ザイゲン
: (8+7+8+4)/4=6.75ゼイセイ: (
12+7+1+1 )/4=5.25サイセイ: (8
+7+1+1 )/4=4.25となり、正しい単語で
ある「サイセイ−1のスコアが最も小さく、従って最も
良いスコアとなる。ところが、これらの各単語の音節列
の始端から途中までの、長さがn (n=1 +2 +
3 +4 )の部分音節列に対応する音節候補列のスコ
アを、同じく各音節候補のスコアの平均値として求める
と、次のようになる。
セ      :  3/1            
  =3セイ   : (3+7 )/2      
=5セイゲ :(3+7+8)/3   =6セイケン
:(3+7+8+4)/4  =5.5ザ    : 
8/1            =88サイ  : (
8+7 )/2      =7.5ザイゲ :(8+
7+8)/3   =7.66ザイゲン:(8+7+8
+4)/4  =6.75ゼ     :12/1  
         =12ゼイ   ニ(12+7)/
2     =9.5ゼイセ :(12+7+1)/3
  =6.66ゼイセイ: (12+7+1+1 )/
4=5.25ザ    : 8/1         
   =88サイ  : (8+7 )/2     
 =7.5ザイセ :(8+7+1)/3   =5.
33ザイセイ:(8+7+1+1)/4  =4.25
従って、上述のようにスコアの最も良い音節候補列を選
びながら音節列を辿るとすると、上の4単語の音節列は
次の順序で辿られることになる。
ここで、コロン(=)右側に記す数字はその音節列に対
応する音節候補列のスコアである。
まず、この4単飴の各々の先頭の音節に対応する音節候
補列を求める。
■セ   : 3 ■ザ   :“ 8 ■ザ   : 8 ■ゼ   :12 次に、この中でスコアのもっとも良い(小さい)音節候
補列を選び先に辿るという処理を#XIV返す。
すると、以下の順序で音節候補列が作成される。
■セイ   =  5 ■セイゲ : 6 ■セイゲン:5.5 ■サイ   ニア、5 ■ザイゲ ニア、66 [相]ザイゲン:6.75 ■サイ   ニア、5 @ザイセ :5.33 ■ザイセイ:4.25 このように、単語「セイケン」、「ザイゲン」の音節列
を辿り終えてから、初めて単語「ザイセイ」の音節列を
辿ることになり、誤った単語「制限」、「財源−1が正
しい単語「財政」よジも先に検出されてしまう。こnは
、「ザイセイ」の先頭の「ザ」に対応する音節候補のス
コアが8と悪いために、8よりも良いスコアの音節候補
列がなくなるまで「ザイゲン」の「ザ」が選ばれないこ
とに起因する。
本発明の目的は、上述した欠点を除去し、このように正
しい単語のカテゴリ列の始端に近いカテゴリに対応する
候補のスコアが他の候補に比べて大幅に悪いときKも正
しい単語をより先にかつ少ない処理量で検出することを
可能にする単語検出方式を提供することにある。
(問題点を解決するための手段) 本発明の単語検出方式は、音節、音素、音素クラス等の
カテゴリの列である入力音声から複数個のカテゴリ候補
およびこれらカテゴリ候補の検出評価における信頼度の
尺度としてのスコアと位置情報とを抽出するとともに単
語辞書に記憶されている単語のカテゴリ列を辿りながら
単語のカテゴリ列に対応するカテゴリ候補列を求めるこ
とによって入力音声中の単語を検出する単語検出方式に
おいて、n個のカテゴリ候補からなるカテゴリ候補列の
スコアをnがあらかじめ定めた数N以上のときにはn個
のカテゴリ候補のスコアの平均値を用いてq、出しnが
N未満のときにはn個のカテゴリ候補にnおよびNに依
存しあらかじめ設定する関数としての個数m個の仮想的
なカテゴリ候補【加えた(n+m)個のカテゴリ候補の
スコアの平均値を用いて算出して常にこのスコアが最も
良いカテゴリ候補列を求めるように前記単語辞書中の単
語のカテゴリ列を辿る手段を備えて構成さ扛ろ。
(作用) 上述の例においては、音節列「ザイセイ」に対応する音
節候補列のスコアは425と他の単語のスコアよりも良
いのにもかかわらず、その先頭の音節「ザ」に対応する
音節候補のスコアが8と悪い。一方、音節列[セイゲン
−1に対応する音節候補列のスコアは5.5と単語[ザ
イセイ1よりも悪いが、その先頭の音節「セ」に対応す
る音節候補のスコアは3と単語「ザイセイ」の先頭の音
節候補のスコアよりも良くなっている。
このように、単語全体のカテゴリ列に対応するカテゴリ
候補列から算出したスコアとしてはその単語の信頼性を
正しく評価しているが、従来技術では単語の一部分のカ
テゴリ列に対応するカテゴリ候補列だけから算出したス
コアを単語のスコアとして扱っているために、その一部
分に偶然悪いスコアのカテゴリ候補が含まれている場合
にその単語のスコアが悪くなってしまう。
一方、単語の一部分のカテゴリ列にしか対応するカテゴ
リ候補列が定まっていない段階では、単語全体のカテゴ
リ列に対応するカテゴ1JiN補動のスコアを用いるこ
とはできない。
そこで本発明の方法では、単語のカテゴリ列中のカテゴ
リのうち、まだ対応するカテゴリ候補が定まっていない
カテゴリに対しでは、ある平均的なスコアを持つカテゴ
リ候補を仮想する。すなわち、カテゴリ候補列のスコア
を求める際に、その長さnがあらかじめ定めた長さNよ
りも短い場合には、そのカテゴリ候補列は単語の一部分
のカテゴリ列に対応するものであると判断し、n及びN
に依存するしあらかじめ設定する関数としての個数のカ
テゴリ候補を仮想する。この結果、対応するカテゴリ候
補列の一部分に悪いスコアのカテゴリ候補が含まれてい
た場合にも、仮想されたカテゴリ候補列のスコアによっ
て平均化されることにより、単語のスコアはそれほど悪
くならない。従って、その単語に対応するカテゴリ候補
列をすばやく求めることができる。
(実施例) 次に図面を参照して本発明の詳細な説明する。
第1図は本発明の一実施例を示すブロック図である。第
1図に示す実施例では日本語の音声が入力されるものと
し、またカテゴリとしては音節を用いている。
音節候補抽出部101は入力音声中の音節候補を検出し
、その候補をそのスコアと入力音声中での位置とともに
音節候補記憶部102に記憶する。
第2図は音節候補抽出部101の一例を示すプロ、り図
である。第2図において、入力音声は音声バッファ20
1に一旦格納される。まず、母音候補検出部202が音
声バッファ201に格納された音声中の母音候補を検出
し母音候補記憶部203に格納する。母音候補の検出は
母音バタン記憶部204にあらかじめ格納されている各
母音の音声標準バタンと入力音声の各区間とを照合する
ことによって行わnる。母音の音声信号は比較的定常で
あるので検出は容易である。各母音は少なくとも母音名
のほか、入力音声中での位置の情報を保持している。
母音候補の検出が終了した後、子音候補検出部205に
よって子音候補が次に述べるようにして検出される。日
本語においては、音節は子音(C)−母音(V)の組で
ある。従って入力音声中では、2個の母音に挾まれた区
間のうちのある時間長以下の区間(以下これをvC■区
間と叶ぶ)及び入力音声の始端からある時間長以内にあ
る区間(以下これをCv区間と呼ぶ)までの各に1個の
子音が存在するといえる。子音候補検出部204は母音
候補記憶部203に記憶されている母音候補から作られ
るすべての■C■区間及びC■区間の各々に対して、あ
らかじめ子音バタン記憶部206に記憶されている■C
■及びCV欅準音声バタンとの照合を行い、類似度の高
い複数個の音声バタンの名前を子音候補とする。以上で
決定された母音候補と子音候補とを組み合わせて音節候
補とし、入力音声中での位置と共に音節候補記憶部10
2に記憶する。
例として、「ザイセイ(財政)」という音声が入力され
たとする。この場合、音節認識結果として例えば第3図
に示されるような音節候補が抽出される。第3図におい
ては、各音節区間に複数個の音節候補が抽出さnており
、各音節候補に記されている数字がその候補のスコアで
ある。
単語記憶部103には検出すべき単語の音節列が記憶さ
れている。いま、単語記憶部103には「セイケン(制
限)−!、rザイゲン(財源)」、「ゼイセイ(税制)
」、「ザイセイ(財政)」の4単語が記憶されていると
する。
音節候補列生成部104は、まず、単語記憶部103の
各単語の先頭の音節に対応する音節候補を音節候補記憶
部102に記憶されている音節候補から選択し、各々を
長さlの音節候補列とする。
次にスコア計算部105によってそれぞれの音節候補列
のスコアを計算する。本実施例では、N=4とし、nお
よびNに依存してあらかじめ設定する関数としてのmは
、m=N−nを利用し、仮想する音節候補のスコアはl
としている。
例えば、単語[セイゲン]の先頭の音節「セ」に対応す
る音節候補上「3」だけからなる音節候補列のスコアは
、この音節候補と3個のスコア1の仮想的な音節候補の
計4個の音節候補のスコアの平均値であるから、(3+
1+1+1 )/4=1.5となる。
これらの音節候補列は、そのスコアと対応する単語と共
に、音節候補列記憶部106に記憶される。この結果、
音節候補列記憶部106には、■セ   :1.5rセ
イゲン−1 ■ザ   :2.75rザイゲンI ■ゼ   :3.7srゼイセイ」 ■ザ   :2−75rザイセイ1 の4個の音節候補列が記憶されている。ここで、「 」
の中は対応する単語である。
次に、音節候補列選択部107は、音節候補列記憶部1
06中の音節候補列のうち、もっともスコアの良い、即
ちその値の小さい音節候補列を取シ出し、その音節候補
列及び単語を音節候補列生成部104に送る。音節列候
補列生成部104は受は取った音節候補列を、単語の音
節列に従って更に延長し、改めてそのスコアをスコア計
算部105で計算した後、音節候補列記憶部106に記
憶する。
いまの場合、 ■セ   :1.5rセイゲン」 が取り出され、新たに、 ■セイ  :3  「セイゲン」 が音節列記憶部106に記憶される。この結果、音節候
補列記憶部106には、 ■ザ   :2.75[ザイゲンI ■ゼ   :3.75rゼイセイ1 ■ザ   :2.75rザイセイ」 ■セイ  =3  [セイゲン1 が記憶されている。従って次に、この中でもつとも良い
スコアを持つ音節候補列である、■ザ   :2.75
rザイゲン−1 が取り出さ扛る。
以上の処理を繰り返すと、次に示す音節候補列が作られ
ていく。
■ザイ   ニ4.25rザイゲン」 ■ザイ   :4.25rザイセイ」 ■セイゲ :4.75rセイゲ1 ■ザイゲ :6  「ザイゲン」 [相]ザイセ :4.25rザイセイ1■ザイセイ:4
.25rザイセイ 1 ここで、音節候補列■は単語[ザイセイ1の終端に達し
ているので、音節候補列選択部107はこの単語を検出
結果として出力する。
このように、正しい単語「ザイセイ」が最初に検出され
る。しかも、従来の方法では前述のように13個の音節
候補を作成した段階で「ザイセイ」が検出されたのに対
して、本発明の方法では11個の音節候補列を作成した
段階で検出さ扛ている。
以上、本発明の一実施例を説明した。この実施例では説
明を簡単にするために音節認識の段階で音節認識誤りが
起こらなかった場合、すなわち入力されたすべての音節
に対して少なくとも正しい音節候補が抽出された場合に
ついて述べたが、音節認識誤りが生じた場合にも、前述
した特願昭61190258 + 190259.19
02b0.190261の「単語検出方式」に述べられ
ている方式を用いることによって、上記実施例と同様に
効率よく正しい単語を検出することができる。
なお、検出対象の単語が多数存在するときには、それら
の単語を木構造形式で表現することにより、すなわち音
節を節点とし、根節点から葉節点までの節点列が各の単
語の音節列を表わすことが一般的であるが、その場合に
も各の音節列についてみれば、本発明の方法を適用する
と上記の実施例と同様の結果となる。
(発明の効果) 以上説明したように本発明によれば、正しい単語のカテ
ゴリ列の始端に近いカテゴリに対応する候補のスコアが
他の候補に比べて大幅に悪いときにも、正しい単語を他
の単語よりも先に検出し、しかも生成されるカテゴリ候
補列の数が少なく、効率の良い単語検出を行うことが可
能となる単語検出方式が実現できるという効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
第1図の実施例における音節候補抽出部の一例を示すブ
ロック図、第3部は入力音声から抽出された音節候補の
一例を示す説明図である。 101・・・・・・音節候補抽出部、102・・・・・
・音節候補記憶部、103・・・・・・単語記憶部、1
04・・・・・・音節候補列生成部、105・・・・・
・スコア計算部、106・・・・・・音節候補列記憶部
、107・・・・・・音節候補列選択部、201・・・
・・・音声バッファ、202・・・・・・母音候補検出
部、203・・・・・・母音候補記憶部、204・・・
・・・母音バタン記憶部、205・・・・・・子音候補
検出部、206・・・・・・子音バタン記憶部。 躬?図 6、補正の対象 手続ネ市正書(方式) %式% 1、事件の表示 昭和61年特許願第307047号2
、発明の名称 単語検出方式 3、補正をする者 事件との関係       出 願 天性 所    
東京都港区芝五丁目33番1号名 称    (42B
>  日本電気株式会社4、代理人 住 所 〒108東京都港区芝五丁目37番8号住友三
田ビル (連絡先 日本電気株式会社 特許部)5 補正命令の
日付 昭和62年 3月31日く発送日) 7、補正の内容 明′m書第19頁13行目の「第3部」を[第3図Jと
訂正する。

Claims (1)

  1. 【特許請求の範囲】 音節、音素、音素クラス等のカテゴリの列である入力音
    声から複数個のカテゴリ候補およびこれらカテゴリ候補
    の検出評価における信頼度の尺度としてのスコアと位置
    情報とを抽出するとともに単語辞書に記憶されている単
    語のカテゴリ列を辿りながら単語のカテゴリ列に対応す
    るカテゴリ候補列を求めることによって入力音声中の単
    語を検出する単語検出方式において、 n個のカテゴリ候補からなるカテゴリ候補列のスコアを
    nがあらかじめ定めた数N以上のときにはn個のカテゴ
    リ候補のスコアの平均値を用いて算出しnがN未満のと
    きにはn個のカテゴリ候補にnおよびNに依存しあらか
    じめ設定する関数としての個数m個の仮想的なカテゴリ
    候補を加えた(n+m)個のカテゴリ候補のスコアの平
    均値を用いて算出して常にこのスコアが最も良いカテゴ
    リ候補列を求めるように前記単語辞書中の単語のカテゴ
    リ列を辿る手段を備えて成ることを特徴とする単語検出
    方式。
JP61307047A 1986-12-22 1986-12-22 単語検出方式 Expired - Lifetime JPH0632014B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61307047A JPH0632014B2 (ja) 1986-12-22 1986-12-22 単語検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61307047A JPH0632014B2 (ja) 1986-12-22 1986-12-22 単語検出方式

Publications (2)

Publication Number Publication Date
JPS63158597A true JPS63158597A (ja) 1988-07-01
JPH0632014B2 JPH0632014B2 (ja) 1994-04-27

Family

ID=17964406

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61307047A Expired - Lifetime JPH0632014B2 (ja) 1986-12-22 1986-12-22 単語検出方式

Country Status (1)

Country Link
JP (1) JPH0632014B2 (ja)

Also Published As

Publication number Publication date
JPH0632014B2 (ja) 1994-04-27

Similar Documents

Publication Publication Date Title
CN108305634B (zh) 解码方法、解码器及存储介质
Jelinek Continuous speech recognition by statistical methods
US4962535A (en) Voice recognition system
JPS63259697A (ja) 音声認識方法
US20020007275A1 (en) Speech complementing apparatus, method and recording medium
JP4733436B2 (ja) 単語・意味表現組データベースの作成方法、音声理解方法、単語・意味表現組データベース作成装置、音声理解装置、プログラムおよび記憶媒体
JP3371761B2 (ja) 氏名読み音声合成装置
JPS63158597A (ja) 単語検出方式
JP3440840B2 (ja) 音声認識方法及びその装置
KR101777141B1 (ko) 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법
JP2867695B2 (ja) 連続音声認識装置
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JPS63158598A (ja) 単語検出装置
JPS63158599A (ja) 単語検出方式
JPS60164800A (ja) 音声認識装置
KR100212448B1 (ko) 무제한 음성 명령어 인식기의 인식 성능 및 처리 속도 개선 방법
JPH0552507B2 (ja)
JPS63158600A (ja) 単語検出装置
JPS6335996B2 (ja)
JPS60150098A (ja) 音声認識装置
JPS6344698A (ja) 単語検出方式
JPS6073697A (ja) 音韻辞書の作成方法
JPS6342279B2 (ja)
JPS63208096A (ja) 情報入力装置
JPS60118895A (ja) 音声入力装置