JPS61252599A - 音声認識方式 - Google Patents
音声認識方式Info
- Publication number
- JPS61252599A JPS61252599A JP60094145A JP9414585A JPS61252599A JP S61252599 A JPS61252599 A JP S61252599A JP 60094145 A JP60094145 A JP 60094145A JP 9414585 A JP9414585 A JP 9414585A JP S61252599 A JPS61252599 A JP S61252599A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- voiced
- unvoiced
- detecting
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
■兎分更
本発明は、音声認識方式、より詳細には、音節単位以上
、主として、単語単位を対象とする音声認識方式に関す
る。
、主として、単語単位を対象とする音声認識方式に関す
る。
丈米艮亙
音声認識においては、一般に、予備選択をして対象候補
を絞ってから本選択により入力音声を判別する方法が採
られる。この場合、本選択を短時間に選択精度を上げて
認識処理する必要があるが、一般には1時間による窓か
け(入力語長の0.7〜1.3程度)をして更に候補を
絞った上で本選択をしている。しかし、これでもまだか
なりの時間を要し実用上問題となることが多い。
を絞ってから本選択により入力音声を判別する方法が採
られる。この場合、本選択を短時間に選択精度を上げて
認識処理する必要があるが、一般には1時間による窓か
け(入力語長の0.7〜1.3程度)をして更に候補を
絞った上で本選択をしている。しかし、これでもまだか
なりの時間を要し実用上問題となることが多い。
l−一般
本発明は、上述のごとき実情に鑑みてなされ・たちので
、特に、音声認識方式において、音声入力の有声無声区
間を検出して有声無声系列を作成し。
、特に、音声認識方式において、音声入力の有声無声区
間を検出して有声無声系列を作成し。
この有声無声系列との照会を行うことにより、入力音声
の判別候補を絞ることを目的としてなされたものである
。
の判別候補を絞ることを目的としてなされたものである
。
1−−一戒2
本発明は、上記目的を達成するため、入力未知音声の語
尾を検出して認識処理を行なう音声認識方式において、
入力音声の有声無声検出手段を有し、これから有声無声
系列を予め辞書に格納しておき、認識時に未知音声の有
声無声系列を検出して辞書の系列と照合して対象候補を
絞ること、或いは、入力音声の無音区間の個数を検出す
る手段を有し、無音区間の個数を予め辞書に格納してお
き、認識時に未知音声の無音個数を検出して辞書と照合
して対象候補を絞ること、或いは、入力音声の有声無声
系列を検出する手段と、入力音声の無音区間の個数を検
出する手段とを有し、有声無声系列に無音区間の個数を
付加しておき、無音区間の個数と有声無声系列の論理和
又は論理積条件で照合して対象候補を絞ることを特徴と
したものである。以下1本発明の実施例に基づいて説明
する。
尾を検出して認識処理を行なう音声認識方式において、
入力音声の有声無声検出手段を有し、これから有声無声
系列を予め辞書に格納しておき、認識時に未知音声の有
声無声系列を検出して辞書の系列と照合して対象候補を
絞ること、或いは、入力音声の無音区間の個数を検出す
る手段を有し、無音区間の個数を予め辞書に格納してお
き、認識時に未知音声の無音個数を検出して辞書と照合
して対象候補を絞ること、或いは、入力音声の有声無声
系列を検出する手段と、入力音声の無音区間の個数を検
出する手段とを有し、有声無声系列に無音区間の個数を
付加しておき、無音区間の個数と有声無声系列の論理和
又は論理積条件で照合して対象候補を絞ることを特徴と
したものである。以下1本発明の実施例に基づいて説明
する。
本発明は、入力音声の語尾を検出して本選択を実施する
認識装置において、類似度(距離)計算をするに先立っ
て有声無声系列情報による選択により対象候補を絞った
上で、上記計算をすることを特徴とするものである。な
お1本発明は、特に予備選択をすることを条件としない
が、以下、予備選択をする場合を例として説明する。
認識装置において、類似度(距離)計算をするに先立っ
て有声無声系列情報による選択により対象候補を絞った
上で、上記計算をすることを特徴とするものである。な
お1本発明は、特に予備選択をすることを条件としない
が、以下、予備選択をする場合を例として説明する。
第1図は1本発明の一実施例を説明するための図で、(
0)は音声区間、(b)は認識プロセスを示し、Aは冒
頭nフレーム、Bは予備選択、Cは本選択、Dは結果を
示すが、線形伸縮マツチングを用いる認識方法では語尾
から認識処理を実施するため処理時間を要するので、こ
の低減策として語頭のnフレームを用いて予備選択をし
て対象候補を予め絞り込む手段を採用している。この対
象候補に対し、語尾の検出と同時に入力語長に対する窓
かけ(通常は0.7〜1.3程度)を実施した上で、類
似度肝゛算をして入力音声を判別するようにしている1
本発明は、この本選択の絞り込みを更に精度を上げて時
間を短縮することを狙ったもので、類似度の計算精度を
上げるために、フレームごとの特徴量の一つに有声/無
声の判別情報を付加するようにしている。有声/無声の
判別法は一般にはスペクトルの傾き(例えば最小自乗近
似値直線の傾き)とか低域と高域のスペクトル分布の差
から検出する方法がとられる。
0)は音声区間、(b)は認識プロセスを示し、Aは冒
頭nフレーム、Bは予備選択、Cは本選択、Dは結果を
示すが、線形伸縮マツチングを用いる認識方法では語尾
から認識処理を実施するため処理時間を要するので、こ
の低減策として語頭のnフレームを用いて予備選択をし
て対象候補を予め絞り込む手段を採用している。この対
象候補に対し、語尾の検出と同時に入力語長に対する窓
かけ(通常は0.7〜1.3程度)を実施した上で、類
似度肝゛算をして入力音声を判別するようにしている1
本発明は、この本選択の絞り込みを更に精度を上げて時
間を短縮することを狙ったもので、類似度の計算精度を
上げるために、フレームごとの特徴量の一つに有声/無
声の判別情報を付加するようにしている。有声/無声の
判別法は一般にはスペクトルの傾き(例えば最小自乗近
似値直線の傾き)とか低域と高域のスペクトル分布の差
から検出する方法がとられる。
第2図(a)は、“新聞”(/S/、/i/。
/N/、/b/、/u/、/N/)の例を示しており、
同図(b)に有声部は“1”、無声部は“O”で有声無
声区間が示しである。これから有声無声のつながりを示
す有声無声系列辞書(例えば0101(新聞)、101
(音声)・・・・・・)を作成して格納しておく(第2
図(c)参照)、認識の際には、第3図(b)にEにて
示すように語尾の検出を待つてそれまで検出されている
有声無声系列信号から有声無声系列を作成して対象候補
の中から同じ有声無声系列の候補を選択する。この絞ら
れた候補について類似度を求めて入力音声を判別する。
同図(b)に有声部は“1”、無声部は“O”で有声無
声区間が示しである。これから有声無声のつながりを示
す有声無声系列辞書(例えば0101(新聞)、101
(音声)・・・・・・)を作成して格納しておく(第2
図(c)参照)、認識の際には、第3図(b)にEにて
示すように語尾の検出を待つてそれまで検出されている
有声無声系列信号から有声無声系列を作成して対象候補
の中から同じ有声無声系列の候補を選択する。この絞ら
れた候補について類似度を求めて入力音声を判別する。
この場合、無声区間には無音区間も含まれているが、一
般に無音区間には促音や破裂子音の無声化(特に/ p
/ −/ b / e / t /の始端)も含まれ
るが、この情報も非常に重要であり、この情報も対象候
補を絞るのに有効である。このとき第2図(d)の無音
有声無声系列の如く、先頭ビットに無音区間の個数を挿
入しておき(図示例の場合上)、無音区間の個数と有声
無声系列を照合して論理和又は論理積条件で対象候補を
選択すれば更に精度良く候補を絞ることが可能である。
般に無音区間には促音や破裂子音の無声化(特に/ p
/ −/ b / e / t /の始端)も含まれ
るが、この情報も非常に重要であり、この情報も対象候
補を絞るのに有効である。このとき第2図(d)の無音
有声無声系列の如く、先頭ビットに無音区間の個数を挿
入しておき(図示例の場合上)、無音区間の個数と有声
無声系列を照合して論理和又は論理積条件で対象候補を
選択すれば更に精度良く候補を絞ることが可能である。
更にもっと精度を上げるためには無音区間がどの無声区
間に存在するか120101と2番目の無声区間と位置
情報を挿入して照合すれば良い結果が得られる。
間に存在するか120101と2番目の無声区間と位置
情報を挿入して照合すれば良い結果が得られる。
羞−一果
・以上の説明から明らかなように、本発明によれば有声
無声系列信号の照合により類似度計算以前に精度の良い
対象候補の絞り込みが可能となり。
無声系列信号の照合により類似度計算以前に精度の良い
対象候補の絞り込みが可能となり。
結果として認識率の向上と処理時間の短縮を図ることが
できる。
できる。
第1図乃至第3図は9本発明の詳細な説明するためのア
ルゴリズムである。 第 1rl!J W&2図 (1)) OO’l + 1000000
1 100も (C) OI O+(d
) I OI Ol第3図
ルゴリズムである。 第 1rl!J W&2図 (1)) OO’l + 1000000
1 100も (C) OI O+(d
) I OI Ol第3図
Claims (3)
- (1)、入力未知音声の語尾を検出して認識処理を行な
う音声認識方式において、入力音声の有声無声検出手段
を有し、これから有声無声系列を予め辞書に格納してお
き、認識時に未知音声の有声無声系列を検出して辞書の
系列と照合して対象候補を絞ることを特徴とする音声認
識方式。 - (2)、入力未知音声の語尾を検出して認識処理を行な
う音声認識方式において、入力音声の無音区間の個数を
検出する手段を有し、無音区間の個数を予め辞書に格納
しておき、認識時に未知音声の無音個数を検出して辞書
と照合して対象候補を絞ることを特徴とする音声認識方
式。 - (3)、入力未知音声の語尾を検出して認識処理を行な
う音声認識方式において、入力音声の有声無声系列を検
出する手段と、入力音声の無音区間の個数を検出する手
段とを有し、有声無声系列に無音区間の個数を付加して
おき、無音区間の個数と有声無声系列の論理和又は論理
積条件で照合して対象候補を絞ることを特徴とする音声
認識方式.(4)、無音区間がどの無声区間に存在する
かの情報を付加して照合することにより対象候補を絞る
ことを特徴とする特許請求の範囲第(3)項に記載の音
声認識方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60094145A JPS61252599A (ja) | 1985-05-01 | 1985-05-01 | 音声認識方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60094145A JPS61252599A (ja) | 1985-05-01 | 1985-05-01 | 音声認識方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61252599A true JPS61252599A (ja) | 1986-11-10 |
Family
ID=14102211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60094145A Pending JPS61252599A (ja) | 1985-05-01 | 1985-05-01 | 音声認識方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61252599A (ja) |
-
1985
- 1985-05-01 JP JP60094145A patent/JPS61252599A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dubnowski et al. | Real-time digital hardware pitch detector | |
JPS62217295A (ja) | 音声認識方式 | |
US6314392B1 (en) | Method and apparatus for clustering-based signal segmentation | |
US5806031A (en) | Method and recognizer for recognizing tonal acoustic sound signals | |
JPS61252599A (ja) | 音声認識方式 | |
Niederjohn et al. | Computer recognition of the continuant phonemes in connected English speech | |
JP2583854B2 (ja) | 有声無声判定方法 | |
JPS5936759B2 (ja) | 音声認識方法 | |
JPS6147999A (ja) | 音声認識装置 | |
JP3031081B2 (ja) | 音声認識装置 | |
JP2948060B2 (ja) | 韻律境界の自動的ラベリング法 | |
JPS60198596A (ja) | 音声入力装置 | |
JPS59149400A (ja) | 音声入力装置 | |
JPH0464077B2 (ja) | ||
JPS6069694A (ja) | 語頭子音のセグメンテ−ション法 | |
JPH0682275B2 (ja) | 音声認識装置 | |
JPS6365499A (ja) | 構文認識方式 | |
JPS61118800A (ja) | 音声分析装置 | |
JPS63173100A (ja) | キ−ワ−ド抽出装置 | |
JPH0640274B2 (ja) | 音声認識装置 | |
JPS5882300A (ja) | 音声認識方式 | |
JPS6069695A (ja) | 語頭子音のセグメンテ−ション法 | |
JPS6234198A (ja) | パタンマッチング装置 | |
JPS60159798A (ja) | 音声認識装置 | |
JPS6195399A (ja) | 音声パターン照合方法 |