JPS63158599A - 単語検出方式 - Google Patents

単語検出方式

Info

Publication number
JPS63158599A
JPS63158599A JP30705086A JP30705086A JPS63158599A JP S63158599 A JPS63158599 A JP S63158599A JP 30705086 A JP30705086 A JP 30705086A JP 30705086 A JP30705086 A JP 30705086A JP S63158599 A JPS63158599 A JP S63158599A
Authority
JP
Japan
Prior art keywords
word
category
syllable
candidate
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP30705086A
Other languages
English (en)
Inventor
畑崎 香一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP30705086A priority Critical patent/JPS63158599A/ja
Publication of JPS63158599A publication Critical patent/JPS63158599A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は単語検出方式に関し、特に音声認識、音声入力
装置等において入力音声中に含ま扛る単語を検出する単
語検出方式に関する。
(従来の技術) 音声認識装置や音声入力装置等における入力音声中の単
語を検出する方法のひとつとして、入力音声全音節、音
素、音素クラス等のカテゴリの列と見なし、入力音声か
ら検出したカテゴリを用いて作成したカテゴリ列が単語
辞書に記憶されている単語のカテゴリ列に対応すれば、
その単語全検出結果とするという方法がある。
一般に上述したカテゴリは、その発声時間長が短いこと
や類似するカテゴリが存在することなどから、入力音声
中から正しいカテゴリだけヲ誤りなく検出することは困
難である。そこで従来から、入力音声中の各カテゴリ区
間に対して複数個のカテゴリ候補を検出したのち、単語
辞書を参照して単語に対応するカテゴリ候補列を見つけ
るという方法を用いている。しかしながらこの場合でも
、発声のなまけや隣接するカテゴリ例えば音節どうしの
聴音結合等の原因によって、あるカテゴリ区間の存在が
検出できなかったり、あるカテゴリ区間に正しいカテゴ
リ候補が検出できない場合がある。
そこで、特願昭61−190258.190259゜1
90260.190261の各「単語検出方式」に述べ
られている方式のように、入力音声中のカテゴリ候補を
検出したのち単語辞書中の単語のカテゴリの並びに従っ
てカテゴリ候補を選択するとともに、単語中のあるカテ
ゴリが検出さnなかった場合にはその前後のカテゴリに
対応するカテゴリ候補を手掛かりにして、単語のカテゴ
リ列に対応するカテゴリ候補列をyつけ、また、対応す
るカテゴリ候補列が艶つかった単語についてはそのカテ
ゴリ候補列のスコアを計算して単語のスコアとしている
一方、多数の単語のうちからスコアの良い単語を選択す
る場合には、そnぞれの単語について個別に上述の方法
で対応するカテゴリ候補列及びスコアを求めるとすると
、特に単語辞書中の単語数が多い場合には多大な計算量
を必要とし現実的でない。
そこで、スコアの良いカテゴリ候補列を優先して求める
ことにより、すべての単語について対応するカテゴリ候
補列を求めることなくスコアの良い単語を求めるように
している。すなわち、単語のカテゴリ列をその始端から
辿ってその途中までの一部分に対応するカテゴリ候補列
を求めては、そこまでのカテゴリ候補列のスコアを求め
る。そして、各時点でもっともスコアの良いカテゴリ候
補列を選び、それに対応するカテゴリ列をさらに先に辿
る。この処理を繰り返し、ある単語の終端に達したとき
にその単語を結果として出力する。
この結果、スコアの良いカテゴリ候補列に対応する単語
が優先して求められることになる。
ここで、カテゴリ候補列のスコアとしてはそのカテゴリ
候補列を構成するカテゴリ候補のスコアの平均値が与え
らlしることが常である。
(発明が解決しようとする問題点) 一般に、単語辞書中には、「国家(コツ力)」と「国会
(コツカイ)」のようにある単語のカテゴリ列、この場
合は音節が他の単語の先頭からの一部分のカテゴリ列に
含まれる場合がある。このとき、「国会が」という入力
音声から「コツカイ」という音節候補列が得られた場合
、従来方法ではスコアの良い音節候補列を優先して求め
てゆくために、単語「国会」の音節列が1コツカ1のと
ころまで辿られる時点と、単語「国家」の音節列が終点
まで辿られる時点とは同時点であり、その時点で単語「
国家1が検出さ扛る。このように、単語「国会」が先に
検出されるべきであるのに、それ以前に単語「国家」が
検出結果として出力されてしまう。
一方、かな漢字変換等において文字列に含まれる単語を
単語辞書から選ぶ必要があるときには、入力文字列に最
も長く一致する単語を選ぶという方法(最長一致法)が
有効であることが分かっている。上記の例においても、
最長一致法を用いれば、単語「国会」のほうが「国家」
よりも長いことから、「国会」を先に検出結果として出
力することはできる。
ところが、上記の例で入力音声が「国家に」の場合に、
音節認識の結果「国家(こつか)」の部分に対してはそ
れぞれ第1位の音節候補として「コ」、「ッ」、「力」
が得られたが、「に」の部分に対しては第1候補が[ニ
ー1、第2候補が「イ」となったとする。この場合に正
しくは、単語「国家」と単語「に」が先に検出されるべ
きである。しかしながら、音節[に1に対する第2候補
を用いると前記音節候補からは音節候補列「コアカイ」
が生成され得るために、最畏一致法を用いると単語「国
会」が[国家1よりも先に検出されてしまう。
すなわち、音声からの単語検出の場合には入力音声中の
各々のカテゴリに対して複数個のカテゴリ候補が得ら扛
るために、より長く一致するというからといってその単
語を無条件に選択することはできないという欠点かある
本発明の目的は上述した欠点を除去し、適当な場合にの
み最長一致法の考え方を用いることによってより信頼性
の高い単語を結果として出力することを可能にする単語
検出方式を提供することにある。
(問題点を解決するための手段) 本発明の単語検出方式は、音節、音素、音素クラス等の
カテゴリの列である入力音声から複数個のカテゴリ候補
およびこれらカテゴリ候補の検出計価における信頼度の
尺度としてのスコアと位置情報とを抽出するとともに単
語辞書に記憶されている単語のカテゴリ列を辿りながら
単語のカテゴリ列に対応するカテゴリ候補列を求めスコ
アの最も良いカテゴリ候補列に対応する単語を結果とし
て出力する単語検出方式において、単語に対応するカテ
ゴリ候補列が求まったときに前記単語のカテゴリ列長に
対応する大きさのペナルティを前記カテゴリ候補列のス
コアを付与する手段を備えて構成される。
(作用) 上記の例において、入力音声「国会に」の中の音節「に
」に対する音節候補「二」、「イ、jのうちどちらが正
しいかは一般には不明である。そこで従来は、そのカテ
ゴリ列の単語が存在する限り、よりスコアの良い、すな
わちより第1位に近いカテゴリ候補を用いて構成される
カテゴリ候補列を優先している。しかしながら、入力音
声中のカテゴリの認識は正しく行なわれるとは限らない
から、スコアの良いほうの良いカテゴリ候補が実際に正
しい音節候補であるとは限らない。一方、最長一致法の
考え方からすれば、より長く単語に一致するカテゴリ候
補列のほうが信頼できると言える。
そこで、本発明の方式では、単語に対応するカテゴリ候
補列が得られた時点ではその単語音すぐに検出結果とし
て出力せずに、そのカテゴリ候補列のスコアにその単語
長に応じた大きさのペナルティを与えた結果をそのカテ
ゴリ候補列の新たなスコアとする。すなわちそのカテゴ
リ列のスコアはペナルティの大きさだけ悪くなる。この
結果、そのカテゴリ候補列に対応する単語は、そのカテ
ゴリ候補列のスコアよりも良いカテゴリ候補列が他に無
くなった場合に初めて検出結果として出力される。この
ペナルティの大きさは、最長一致法の考え方から、単語
長が長いほど小さな値としておく。従って、単語長に関
してはより長い単語が優先して出力されるという最長一
致法が実現される。また、カテゴリ候補列の本来のスコ
アhそれを構成するカテゴリ候補のスコアから計算され
る。
このため、あるカテゴリ候補列がいかに長い単語と一致
していたとしても、その中にスコアの悪いカテゴリ候補
が含まれている場合にはそのカテゴリ候補列のスコアは
悪くなるため、その単語が検出結果として誤って出力さ
nることはない。
このように、カテゴリ候補のスコアの大きさに応じて適
切に最長一致法の考え方を用いることによって、よシ信
頼性の高い単語を検出結果として出力することができる
(実施例) 次に図面を参照して本発明の詳細な説明する。
第1図は本発明の一実施例を示すブロック図である。本
実施例では日本語の音声が入力さ扛るものとし、またカ
テゴリとして音節を用いている。
音節候補抽出部101は入力音声中の音節候補を検出し
、その候補をそのスコアと入力音声中での位置とともに
音節候補記憶部102に記憶する。
第2図は第1図の音節候補抽出部101の一例を示すブ
ロック図である。第2図において、入力音声は音声バッ
ファ201に一旦格納さnる。1ず、母音候補検出部2
02が音声バッファ201に格納された音声中の母音候
補を検出し母音候補記憶部203に格納する。母音候補
の検出は母音バタン記憶部204にあらかじめ格納され
ている各母音の音声標準バタンと入力音声の各区間とを
照合することによって行われる。母音の音声信号は比較
的定常であるので検出は容易である。各母音は少なくと
も母音名、入力音声中での位置の情報?保持している。
母音候補の検出が終了した後、子音候補検出部205に
よって子音候補が次に述べるようにして検出される、1
日本語においては、音節は子音(C)−母音(V)の組
である。従って入力音声中では、2個の母音に挾まれた
区間のうちのある時間長以下の区間(以後これを■Cv
区閤と呼ぶ)及び入力音声の始端からある時間長以内に
ある区間まで(以後こg(i−CV区間と呼ぶ)の各に
、1個の子音が存在するといえる。子音候補検出部20
4は母音候補記憶部203に記憶されている母音候補か
ら作られるすべてのvCv区間及びC■区間の各に対し
て、あらかじめ子音バタン記憶部206に記憶されてい
るvCv及びCv標準音声バタンとの照合を行い、類似
度の高い複数個の音声パタンの名前を子音候補とする。
以上で決定された母音候補と子音候補と全組み合わせて
音節候補とし、入力音声中での位置と共に音節候補記憶
部102に記憶する。
単語記憶部103には検出すべき単語の音節列が記憶さ
nている。ここでは説明を簡単にするために、単語配憶
部103に「国家(コツ力)」、「国会(コツカイ)」
の2単語が記憶されているとする。実際には単語記憶部
103には多数の単語が記憶されておシ、その場合にも
以下の説明とまったく同様に本発明の方式を適用できる
いま例として、「国会が(コツ力イガ)」という音声が
入力さnたとする。この場合、音節認識結果として各音
節に対して次のような音節候補が抽出されたとする。こ
こで()の中の数字は音節候補のスコアであシ、この値
が小さいほど信頼できる音節候補列である。
入力音節  第1付合節候補 第2付合節候補「コ」 
  ゴ(5)    コ(7)「ツ」   ツ(2) 「力」   力(3)   バ(1o)「イ」   二
(3)   イ(4) 「ガ」   ガ(2)   力(6) 音節候補列生成部104は、まず、単語記憶部103の
各単語の先頭の音節に対応する音節候補を音節候補記憶
部102に記憶されている音節候補から選択し、各を長
さ1の音節候補列とする。
次にスコア計算部105によってそれぞれの音節候補列
のスコアを計算する。本実施例では、音節候補列のスコ
アTを次式で求める。
ここで、Nは音節候補列の長さ、S (n)は先頭から
n:iff目の音節候補のスコアである。
例えば、単語「コツ力」の先頭の音節「コ」に対応する
音節候補コ(7)たけからなる音節候補列のスコアは、
(7+ 1 +1 +1 )/4=2.5となる。
これらの音節候補列は、そのスコアと対応する単語と共
に音節候補列記憶部106に記憶される。
この結果、音節候補列記憶部106には、■コ  : 
 (7+1+1+1)/4=2.5[国家J ■コ  :  (7+1+1+1)/4=2.5「国会
」 の2個の音節候補列が記憶されている。ここで、:の右
の数字にその音節候補列のスコア、「 」の中は対応す
る単語である。
次に、音節候補列選択部107は、音節候補列記憶部1
06中の音節候補列のうち、もっともスコアの良い、即
ちその値の小さい音節候補列を取り出し、その音節候補
列及び単語を音節候補列生成部104に送る。音節列候
補列生成部104は受は取った音節候補列を単語の音節
列に従って更に延長し、改めてそのスコアをスコア計算
部405で計算した後、音節候補列記憶部106に記憶
する。
いまの場合、 ■コ  :  (7+l+1+1)/4=2.5「国家
1 が取り出され、新たに、 ■コツ :  (7+2+l+1)/4=2.75「国
家1 が音節候補列記憶部106に記憶される。、この結果、
音節候補列記憶部106には、 ■コ  :  (7+1+1+1)/4=2.5「国会
」 ■コツ :  (7+2+1+1)/4=475「国家
」 が記憶されていることになる。同様に処理を進めると、
音節候補列記憶部106の内容は次のように変化してゆ
く。まず、音節候補列■から音節候補列■が生成される
■コツ  :  (7+2+1+1)/4=2−75「
国家」 ■コツ :  (7+2+1+1)/4=2.75「国
会」 次に、音節候補列■から音節候補列■が生成される。
■コツ :  (7+2+1+1)/4=2.75「国
会」 ■コツカニ  (7+2+3+1)/4=3.25[国
家1 ここで、音節候補列■は単語「国家」の終端に達してい
ることから、ペナルティが加算される。ここではペナル
ティP−i次式で計算する。
P =max (5−L+ 1 ) ここで、Lは単語長である。従って音節候補列■にはペ
ナルティmax (5−3+ 1 )=2が加算される
。この結果音節候補列記td部106の内容は次のよう
になる。
■コツ :  (7+2+1+1)/4=2.75「国
会」 ■コツカニ  (7+2+3+1)/4+2=5.25
「国家」 従って、続いて音節候補列■から音節候補列■が生成さ
れる。
■コツカニ  (7+2+3+1)/4+2=5.25
「国家」 ■コツカニ  (7+2+3+1)/4=3.25[国
会1 次に、音節候補列■から音節候補列■が生成さする。
■コツ力 : (7+2+3+1 )/4+2=5.2
5「国家」 ■コツカイ: (7+2+3+4)/4=4「国会」 ここで、音節候補列■は単語「国会」の終端に達してい
るためにペナルティmax(5−4,1)=1が加算さ
れる。この結果、 ■コツ力 : (7+2+3+1 )/4+2=5.2
5「国家」 ■コツカイ: (7+2+3+4 )/4+1=5「国
会」 従って次には音節候補列■が選択され、すでにペナルテ
ィが与えられているために、今回は単語検出結果として
出力される。このように最長−教法の考え方によって、
正しい単語[国会1が先に出力さ牡ることになる。
次に、入力音声が「国家に(コツ力=)Jであった場合
全零える。この時には、音節認識結果として各音節に対
して次のような音節候補が抽出さfLる。
入力音節  第1位置節候補 第2位置節候補「コ」 
  ゴ(5)    コ(7)「ッ」    ッ(2) [力1   カ(3)   パ(10)「二」   二
(3)   イ(6) この例では3番目の音節「に」に対して第1候補が「二
」、第2候補が「イ」となっているが、この第2候補は
本来誤った候補であるためにそのスコアは6と先の例で
の音節「い」に対する第2候補の「イ」のスコアよりも
悪くなっている。この結果、前述のように処理を進めて
ゆくと、ある時点で音節候補列記憶部106の内容は、
■コツ力 : (7+2+3+1 )/4+2=5.2
5「国家」 ■コブカイ: (7+2+3+6)/4+1=5.51
国会、1 となる。この結果、今度は音節候補列■の単語「国家」
が検出結果として先に出力さnる。
以上、本発明の一実施例全説明した。この実施例では説
明を簡単にするために、音節認識の段階で音節認識誤り
が起こらなかった場合、すなわち入力されたすべての音
節に対して少なくとも正しい音節候補が抽出さtした場
合について述べたが、音節認識誤シが生じた場合にも、
前述した特願昭61−190258.190259.1
90260.190261の各「単語検出方式」に述べ
られている方式を用いることによって上記実施例と同様
に正しい単語を検出することができる。
なお、検出対象の単語が多数存在するときには、それら
の単語を木構造形式で表現することにより、すなわち音
節を節点とし、根節点から葉節点までの節点列が各々の
単語の音節列を表わすことが一般的であるが、その場合
にも各の音節列についてみれは本発明の方法を適用する
と上記の実施例と同様の結果となることも明らかである
(発明の効果) 以上説明したように本発明によれば、最長−教法の考え
方を適切に用いることができ、その結果、より信頼性の
高い単語を結果として出力することが可能となる単語検
出方式を提供することができるという効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
第1図の実施例における音節候補抽出部の具体的−例を
示すブロック図である。 101・・・・・・音節候補抽出部、102・・・・・
・音節候補記憶部、103・・・・・・単語記憶部、1
04・・・・・・音節候補列生成部、105 °°・・
・スコア計算部、106・・・・・・音節候補列記憶部
、107・・・・・・音節候補列選択部、201・・・
・・・音声バッファ、202・・・・・・母音候補検出
部、203・・・・・・母音候補記憶部、204・・・
・・・母音バタン記憶部、205・・・・・・子音候補
検出部、206・・・・・・子音バタン記憶部・代理人
弁理士内原  晋、・1  ′:゛++−・・ 入力音声 第 / 図

Claims (1)

    【特許請求の範囲】
  1. 音節、音素、音素クラス等のカテゴリの列である入力音
    声から複数個のカテゴリ候補およびこれらカテゴリ候補
    の検出評価における信頼度の尺度としてのスコアと位置
    情報とを抽出するとともに単語辞書に記憶されている単
    語のカテゴリ列を辿りながら単語のカテゴリ列に対応す
    るカテゴリ候補列を求めスコアの最も良いカテゴリ候補
    列に対応する単語を結果として出力する単語検出方式に
    おいて、単語に対応するカテゴリ候補列が求まったとき
    に前記単語のカテゴリ列長に対応する大きさのペナルテ
    ィを前記カテゴリ候補列のスコアに付与する手段を備え
    て成ることを特徴とする単語検出方式。
JP30705086A 1986-12-22 1986-12-22 単語検出方式 Pending JPS63158599A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30705086A JPS63158599A (ja) 1986-12-22 1986-12-22 単語検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30705086A JPS63158599A (ja) 1986-12-22 1986-12-22 単語検出方式

Publications (1)

Publication Number Publication Date
JPS63158599A true JPS63158599A (ja) 1988-07-01

Family

ID=17964444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30705086A Pending JPS63158599A (ja) 1986-12-22 1986-12-22 単語検出方式

Country Status (1)

Country Link
JP (1) JPS63158599A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011164192A (ja) * 2010-02-05 2011-08-25 Kddi Corp 音声認識装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59116837A (ja) * 1982-12-23 1984-07-05 Comput Basic Mach Technol Res Assoc 音声入力式日本語文書処理装置
JPS61219100A (ja) * 1985-03-25 1986-09-29 日本電気株式会社 特定話者用音声入力装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59116837A (ja) * 1982-12-23 1984-07-05 Comput Basic Mach Technol Res Assoc 音声入力式日本語文書処理装置
JPS61219100A (ja) * 1985-03-25 1986-09-29 日本電気株式会社 特定話者用音声入力装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011164192A (ja) * 2010-02-05 2011-08-25 Kddi Corp 音声認識装置

Similar Documents

Publication Publication Date Title
JPS62235998A (ja) 音節識別方式
CN109979257B (zh) 一种基于英语朗读自动打分进行分拆运算精准矫正的方法
US20020007275A1 (en) Speech complementing apparatus, method and recording medium
JP4738847B2 (ja) データ検索装置および方法
JP2004094257A (ja) 音声処理のためのデシジョン・ツリーの質問を生成するための方法および装置
JP2002278579A (ja) 音声データ検索装置
San et al. Automated speech tools for helping communities process restricted-access corpora for language revival efforts
JPS63158599A (ja) 単語検出方式
Kashyap et al. Recognition of spoken words and phrases in multitalker environment using syntactic methods
JP2966002B2 (ja) 音声認識装置
Hoste et al. Using rule-induction techniques to model pronunciation variation in Dutch
JP2001188556A (ja) 音声認識方法及び装置
JPH0210957B2 (ja)
JPS63158600A (ja) 単語検出装置
JPH0736481A (ja) 補完音声認識装置
JPH0552507B2 (ja)
JP3001334B2 (ja) 認識用言語処理装置
JPS63158597A (ja) 単語検出方式
KR20000026814A (ko) 연속 음성인식을 위한 어절 분리방법 및 그를 이용한 음성 인식방법
JPS6126096A (ja) 音声認識単語の事前評価システム
JPS63158598A (ja) 単語検出装置
JPS6344698A (ja) 単語検出方式
JPH04127199A (ja) 外国語単語の日本語発音決定方法
JPH0713587A (ja) 隠れマルコフモデル連結学習方法
JPH10333692A (ja) 音韻テーブルと音声認識方法及び音声認識プログラムを格納した記録媒体