JPH1069291A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH1069291A
JPH1069291A JP22506696A JP22506696A JPH1069291A JP H1069291 A JPH1069291 A JP H1069291A JP 22506696 A JP22506696 A JP 22506696A JP 22506696 A JP22506696 A JP 22506696A JP H1069291 A JPH1069291 A JP H1069291A
Authority
JP
Japan
Prior art keywords
word
recognized
beginning
degree
coincidence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP22506696A
Other languages
English (en)
Other versions
JP3588929B2 (ja
Inventor
Takeshi Ono
健 大野
Norimasa Kishi
則政 岸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nissan Motor Co Ltd
Original Assignee
Nissan Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nissan Motor Co Ltd filed Critical Nissan Motor Co Ltd
Priority to JP22506696A priority Critical patent/JP3588929B2/ja
Publication of JPH1069291A publication Critical patent/JPH1069291A/ja
Application granted granted Critical
Publication of JP3588929B2 publication Critical patent/JP3588929B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】簡単な構成で、騒音時における認識率の低下を
抑制することの出来る音声認識装置を提供する。 【解決手段】入力信号波の音声区間を検出する音声区間
検出手段と、認識対象となる単語を記録してある音声辞
書と、前記入力信号波の音声区間と前記音声辞書中の単
語との一致度を演算し、最も一致度の高い単語を認識結
果として出力する音声認識装置において、前記認識対象
となる単語(音声辞書内の単語)の語頭の半音節を省略
した単語を認識対象の単語として、検出した音声区間と
の一致度を演算する構成、すなわち、騒音によって比較
的欠落しやすい語頭の半音節を省いた単語を認識対象の
単語として、一致度を演算するように構成しているの
で、複雑な単語辞書を用いることなしに、騒音時におけ
る認識率の低下を抑制することが出来る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、騒音下等における
認識率低下を抑制することの出来る音声認識装置に関す
る。
【0002】
【従来の技術】音声認識装置における音声区間(音響入
力中の音声部分)の検出において、とくに騒音下の場合
などでは語頭の子音、母音が検出されない場合が多い。
その結果、認識率が低下してしまう。このような問題点
を解決した従来の音声認識装置としては、特開昭62−
217298号公報に記載されたものがある。前記従来
の音声認識装置においては、マイクから入力された音声
の特徴量を抽出する手段と、音声区間を検出する手段
と、一単語内の有音区間と無音区間を切り分ける手段
と、その無音区間に基づいてブロック単位で加算辞書を
登録する手段と、無音区間に基づいて認識処理を行う手
段とを具備した音声認識装置において、辞書作成時に、
比較的欠落しやすい子音ブロック等を有する単語をあら
かじめ指定しておき、認識時に、入力パターンに対して
そのブロックが欠落した場合とそうでない場合の両方の
類似度を算出し、高い方をその単語の類似度とすること
を特徴としたものである。
【0003】
【発明が解決しようとする課題】しかしながら、このよ
うな音声認識装置においては、辞書作成時に、比較的欠
落しやすい子音ブロック等を有する単語をあらかじめ指
定しておかなければならない。つまり、単語辞書の作成
に非常に手間がかかるという問題があった。
【0004】本発明は、前記のごとき問題を解決するた
めになされたものであり、簡単な構成で、騒音時におけ
る認識率の低下を抑制することの出来る音声認識装置を
提供することを目的とする。
【0005】
【課題を解決するための手段】前記の目的を達成するた
め、本発明においては、特許請求の範囲に記載するよう
に構成している。すなわち、請求項1に記載の発明にお
いては、入力信号波の音声区間を検出する音声区間検出
手段と、認識対象となる単語を記録してある音声辞書
と、前記入力信号波の音声区間と前記音声辞書中の単語
との一致度を演算し、最も一致度の高い単語を認識結果
として出力する音声認識装置において、前記認識対象と
なる単語(音声辞書に記憶してある単語)の語頭の半音
節を省略した単語を認識対象の単語として前記入力信号
波の音声区間との一致度を演算するように構成してい
る。
【0006】前記のように請求項1に記載の発明におい
ては、認識対象となる単語の語頭の比較的欠落しやすい
半音節を省いた単語を認識対象の単語として、一致度を
演算するように構成しているので、複雑な単語辞書を用
いることなしに、騒音時における認識率の低下を抑制す
ることが出来る。
【0007】前記単語の語頭の半音節が欠落しやすい場
合としては、請求項2に記載のように、語頭に無声子音
がある場合、請求項3に記載のように、語頭に/p/あ
るいは/t/あるいは/k/あるいは/s/あるいは/
h/あるいは/f/あるいは/m/あるいは/n/の半
音節がある場合があり、このような場合に前記単語の語
頭の半音節を省略した単語を認識対象の単語として、前
記入力信号波の音声区間との一致度を演算する。
【0008】次に、請求項4に記載の発明においては、
単語の語頭の単音節がイ行、またはウ行である場合に、
前記単語の語頭の単音節を省略した単語を認識対象の単
語として、前記入力信号波の音声区間との一致度を演算
するように構成している。前記のように請求項4に記載
の発明においては、前記請求項1のように半音節を省略
するのではなく、単音節を省略するものであり、このよ
うに構成したことにより、語頭の単音節が欠落しやすい
単語の場合でも、騒音時における認識率の低下を抑制す
ることが出来る。
【0009】前記単語の語頭の単音節が欠落しやすい場
合としては、請求項5に記載のように、語頭の単音節が
イ行またはウ行であり、それに当該語頭の発語の強さを
押さえる子音が続く場合、請求項6に記載のように、語
頭の単音節がイ行、またはウ行であり、それに破裂音が
続く場合、請求項7に記載のように、語頭の単音節がイ
行、またはウ行であり、それに促音が続く場合、請求項
8に記載のように、語頭の単音節がイ行、またはウ行で
あり、それに/p/あるいは/t/あるいは/k/ある
いは/s/あるいは/h/あるいは/c/あるいは/g
/あるいは/j/あるいは/z/が続く場合等がある。
【0010】次に、請求項9に記載の発明においては、
騒音が所定値以上のときにのみ、前記単語の語頭を省い
た単語を認識対象の単語として、前記入力信号波の音声
区間との一致度を演算するように構成している。前記の
ように構成することにより、実際に語頭の半音節や単音
節が欠落しやすい状態の場合にのみ、半音節や単音節を
省く処理を行ない、低騒音の場合には前記処理を行なわ
ないで単語全体で一致判断を行なうので、認識率を向上
させることが出来る。
【0011】また、請求項10に記載の発明において
は、騒音が第1の所定値以上で第2の所定値未満のとき
に、前記認識対象となる単語の語頭の半音節を省略した
単語を認識対象の単語とし、騒音が前記第2の所定値以
上のときには前記単語の語頭の単音節を省いた単語を認
識対象の単語として、前記入力信号波の音声区間との一
致度を演算するように構成している。前記のように、騒
音の大きさによって半音節の省略と単音節の省略とを区
別して行なうことにより、騒音の大きさと欠落しやすい
音節とを適合させることができ、より一層、騒音時にお
ける認識率の低下を抑制することが出来るとともに、通
常の低騒音の場合には前記処理を行なわないで単語全体
で一致判断を行なうので、認識率を向上させることが出
来る。
【0012】
【発明の効果】請求項1〜請求項3に記載の発明におい
ては、語頭の比較的欠落しやすい半音節を省いた単語を
認識対象の単語として、検出された音声区間との一致度
を演算するように構成しているので、複雑な単語辞書を
用いることなしに、騒音時における認識率の低下を抑制
することが出来る。
【0013】また、請求項4〜請求項8に記載の発明に
おいては、語頭の比較的欠落しやすい単音節を省略する
ように構成したことにより、語頭の単音節が欠落しやす
い単語の場合でも、騒音時における認識率の低下を抑制
することが出来る。
【0014】また、請求項9に記載の発明においては、
騒音が所定値以上であって実際に語頭の半音節や単音節
が欠落しやすい状態の場合にのみ、半音節や単音節を省
く処理を行ない、低騒音の場合には前記処理を行なわな
いで単語全体で一致判断を行なうので、認識率を向上さ
せることが出来る。
【0015】また、請求項10に記載の発明において
は、騒音の大きさによって半音節の省略と単音節の省略
とを区別して行なうことにより、騒音の大きさと欠落し
やすい音節とを適合させることができ、より一層、騒音
時における認識率の低下を抑制することが出来るととも
に、低騒音の場合には前記処理を行なわないで単語全体
で一致判断を行なうので、認識率を向上させることが出
来る、等の効果が得られる。
【0016】
【発明の実施の形態】以下、この発明を図面に基づいて
説明する。図1〜図4は、本発明の第1の実施の形態を
示す図であり、図1は構成を示すブロック図、図2は全
体の演算処理を示すフローチャート、図3は音声辞書の
内容の一部を示す図、図4は一致度演算のサブフローチ
ャートである。
【0017】まず、図1において、音声認識装置は、音
声を入力するマイクロフォン101と、フィルタ102
と、入力信号をデジタル信号に変換するA/Dコンバー
タ103と、認識処理を行い、認識結果を出力する信号
処理装置104からなる。この信号処理装置104は、
CPU104a、および処理に必要なプログラム、デー
タ、単語辞書、語頭の半音節あるいは単音節を省略する
かどうかの判別の条件を記憶するメモリ104bからな
る。
【0018】次に作用を説明する。まず、図2に示すフ
ローチャートにおいて、各ステップの内容は次のとおり
である。ステップ201…信号処理装置104は、マイ
クロフォン101、フィルタ102、A/Dコンバータ
103を通して入力信号をメモリ104b内に記憶す
る。フィルタ102の帯域は人の音声の周波数帯域に合
わせて100Hz〜7kHz程度に設定する。
【0019】ステップ202…信号処理装置104は入
力信号に対し、音声区間の切り出しを行う。切り出され
た音声区間はメモリ104b内に記憶される。なお、音
声区間の切り出し方法は、例えば次のごとき方法によっ
て行なうことが出来る。すなわち、発話された音声をマ
イクロフォン101から入力し、電気信号に変化された
音声信号波の振幅(パワーでもよい)、スペクトル等を
検出して音声の検出を行なう。具体的には、振幅レベル
が或る閾値を越えた点および下回った点をそれぞれ音声
区間の始点および終点としたり、或いは前記の点の近傍
でスペクトルが急激に変化した点を始点および終点とし
て、音声区間を切り出す。
【0020】ステップ203…信号処理装置104は、
前記の切り出された音声区間に対して音声辞書内の単語
との一致度を演算する(詳細後述)。信号処理装置10
4はメモリ104b内に音声辞書を有しており、CPU
104aは、前記音声辞書内の単語全てと、前記音声区
間との一致度を演算する。図3に前記音声辞書の内容の
一部を示す。
【0021】ステップ204…信号処理装置は一致度の
もっとも高い単語を出力する。
【0022】以下、ステップ203における一致度の演
算内容を、図4に示すサブフローを用いて説明する。こ
こでは単語「fujisawa」との一致度を演算する
場合を考える。
【0023】図4において、各ステップの処理内容は次
のとおりである。ステップ401…CPU104aは、
語頭の半音節を省略するかどうかを判別する。この場
合、信号処理装置104のメモリ104b内には、語頭
に/p/あるいは/t/あるいは/k/あるいは/s/
あるいは/h/あるいは/f/あるいは/m/あるいは
/n/がある場合に、その半音節を省略するという条件
を記憶している。この条件を参照すると、「fujis
awa」が語頭を省略する単語であると判別される。
【0024】ステップ402…「fujisawa」の
語頭の半音節「f」を省略し、「ujisawa」に変
換する。ステップ403…上記の「ujisawa」と
検出した音声区間との一致度を演算する。この演算に
は、例えば音声処理技術において一般的に用いられてい
るHMM(Hidden Markov Model)を用いる。
【0025】前記のように、第1の実施の形態において
は、認識対象となる単語の語頭の比較的欠落しやすい半
音節を自動的に判別し、その半音節を省いた単語を認識
対象の単語として検出した音声区間との一致度を演算す
るので、複雑な単語辞書を用いることなしに、騒音時で
語頭の子音、母音が検出されない場合でも認識率の低下
を抑制することが出来る。次に、図5〜図7は、本発明
の第2の実施の形態を示す図であり、図5は構成を示す
ブロック図、図6は全体の演算処理を示すフローチャー
ト、図7は一致度演算のサブフローチャートである。ま
ず、図5の構成は、前記図1の構成における信号処理装
置104を信号処理装置504に入れ替えたものであ
る。信号処理装置504はCPU504a、メモリ50
4bを備えている。
【0026】次に、作用を説明する。図6のフローチャ
ートは、前記図2に示したフローチャートのステップ2
03をステップ603に入れ替えたものである。図7は
このステップ603を示すサブフローである。以下、図
7に基づいて、単語「fujisawa」との一致度を
演算する場合を説明する。
【0027】ステップ701…CPU504aは、語頭
の単音節を省略するかどうかを判別する。信号処理装置
504のメモリ504b内には、語頭の単音節がイ行ま
たはウ行である場合に、前記単語の語頭の単音節を省略
するという条件を持っている。この条件を参照すると、
「fujisawa」が語頭を省略する単語であると判
別される。
【0028】ステップ702…「fujisawa」の
語頭の単音節「fu」を省略し、「jisawa」に変
換する。ステップ703…前記の「jisawa」と検
出された音声区間との一致度を演算する。この演算には
例えば前記と同様にHMMを用いる。
【0029】前記のように、第2の実施の形態において
は、認識対象となる単語の語頭の比較的欠落しやすい単
音節を自動的に判別し、その単音節を省いた単語を認識
対象の単語として一致度を演算するので、複雑な単語辞
書を用いることなしに、騒音時で語頭の子音、母音が検
出されない場合でも認識率の低下を抑制することが出来
る。
【0030】なお、上記の単音節を省略する条件とし
て、単語の語頭の単音節がイ行、またはウ行であり、そ
れに前記語頭の単音節の発語の強さを押さえる子音が続
く場合、語頭の単音節がイ行、またはウ行であり、それ
に破裂音が続く場合、語頭の単音節がイ行、またはウ行
であり、それに/p/あるいは/t/あるいは/k/あ
るいは/s/あるいは/h/あるいは/c/あるいは/
g/あるいは/j/あるいは/z/のような促音が続く
場合、に単音節を省略するとした条件でもよい。
【0031】次に、図8〜図10は、本発明の第3の実
施の形態を示す図であり、図8は構成を示すブロック
図、図9は全体の演算処理を示すフローチャート、図1
0は一致度演算のサブフローチャートである。
【0032】まず、図8の構成は、前記図5の信号処理
装置504を信号処理装置804に入れ替え、更に騒音
入力用のマイクロフォン805、フィルタ806、A/
Dコンバータ807を付加したものである。騒音入力用
のマイクロフォンは音声が入りにくい位置(例えば話し
手の口から遠い位置)に置かれる。信号処理装置804
はCPU804aとメモリ804bを備えている。
【0033】次に、作用を説明する。図9のフローチャ
ートは前記図6に示したフローチャートのステップ60
3をステップ903に入れ替えたものである。そして図
10はステップ903の詳細を示すサブフローチャート
である。以下、図10を用いて、単語「fujisaw
a」との一致度を演算する場合を説明する。
【0034】CPU804aは、語頭の単音節を省略す
るかどうかをステップ1001、1002において判別
する。 ステップ1001…CPU804aはマイクロフォン8
05、フィルタ806、A/Dコンバータ807を介し
て話し手の周辺の騒音を取り込み、そのパワーを演算す
る。演算結果が所定値以上の場合はステップ1002に
移る。演算結果が所定値未満の場合には、直接に100
4へ行く。
【0035】ステップ1002…信号処理装置804の
メモリ804b内には、語頭の単音節がイ行、またはウ
行であり、それに/p/あるいは/t/あるいは/k/
あるいは/s/あるいは/h/あるいは/c/あるいは
/g/あるいは/j/あるいは/z/の促音が続く場合
に、前記単語の語頭の単音節を省略するという条件を持
っている。この条件を参照すると、「fujisaw
a」が語頭を省略する単語であると判別される。
【0036】ステップ1003…「fujisawa」
の語頭の「fu」を省略して「jisawa」に変換す
る。 ステップ1004…前記の「jisawa」と検出され
た音声区間との一致度を演算する。この演算には前記と
同様にHMMを用いる。
【0037】前記のように、第3の実施の形態において
は、周囲の騒音レベルが所定値以上で語頭の単音節が欠
落しやすい状態にある場合にのみ、認識対象となる単語
の語頭の比較的欠落しやすい単音節を自動的に判別し、
その単音節を省いた単語を認識対象の単語として一致度
を演算するので、複雑な単語辞書を用いることなしに、
騒音時で語頭の子音、母音が検出されない場合でも認識
率の低下を抑制することが出来る。また、実際に語頭の
単音節が欠落しやすい状態の場合にのみ、単音節を省く
処理を行ない、通常の低騒音の場合には前記処理を行な
わないで単語全体で一致判断を行なうので、認識率を向
上させることが出来る。
【0038】なお、第3の実施の形態においては、第2
の実施の形態に前記騒音レベル判別の構成を付加した場
合を例示したが、前記第1の実施の形態(半音節を省略
するもの)に付加することも当然可能である。
【0039】次に、図11〜図13は、本発明の第4の
実施の形態を示す図であり、図11は構成を示すブロッ
ク図、図12は全体の演算処理を示すフローチャート、
図13は一致度演算のサブフローチャートである。
【0040】まず、図11の構成は、図8の信号処理装
置804を信号処理装置1104に入れ替えたものであ
る。信号処理装置1104はCPU1104aと110
4bとを有している。
【0041】次に、作用を説明する。図12に示すフロ
ーチャートは、図9に示したフローチャートのステップ
903をステップ1203に入れ替えたものである。そ
してステップ1203の詳細は図13のサブフローチャ
ートに示されている。以下、図13に基づいて、単語
「fujisawa」との一致を演算する場合を説明す
る。
【0042】CPU1104aは、語頭の単音節を省略
するかどうかをステップ1301、1302、1304
で判別する。 ステップ1301…信号処理装置1104はマイクロフ
ォン1105、フィルタ1106、A/Dコンバータ1
107をとおして、周囲の騒音を取り込み、そのパワー
を演算する。その演算結果Piを、k1<k2である2
つの閾値k1、k2と比較する。そしてk1≦Pi<k
2ならばステップ1302へ、k2≦Piならばステッ
プ1303へ移る。また、Pi<k1であれば直接にス
テップ1306へ行く。なお、k1、k2の値は実験に
基づいて決定される。
【0043】ステップ1302…CPU1104aは、
語頭の半音節を省略するかどうかを判別する。信号処理
装置1104のメモリ1104b内には、語頭に/p/
あるいは/t/あるいは/k/あるいは/s/あるいは
/h/あるいは/f/あるいは/m/あるいは/n/が
ある時に、その半音節を省略するという条件を持ってい
る。この条件を参照すると、「fujisawa」が語
頭を省略する単語であると判別される。
【0044】ステップ1303…「fujisawa」
の語頭の半音節「f」を省略して「ujisawa」に
変換する。 ステップ1304…信号処理装置1104のメモリ11
04b内には、語頭の単音節がイ行、またはウ行であ
り、それに/p/あるいは/t/あるいは/k/あるい
は/s/あるいは/h/あるいは/c/あるいは/g/
あるいは/j/あるいは/z/のような促音が続く場合
に、前記単語の語頭の単音節を省略するという条件を持
っている。この条件を参照すると、「fujisaw
a」が語頭を省略する単語であると判別される。
【0045】ステップ1305…「fujisawa」
の語頭の単音節「fu」を省略して「jisawa」に
変換する。 ステップ1306…一致度を演算する。この演算には前
記と同様にHMMを用いる。
【0046】前記のように第4の実施の形態において
は、騒音が第1の所定値k1以上で第2の所定値k2未
満のときに、認識対象となる単語の語頭の半音節を省略
した単語を認識対象の単語とし、騒音が第2の所定値以
上のときには単語の語頭の単音節を省いた単語を認識対
象の単語として、音声辞書中の単語との一致度を演算す
るように構成している。
【0047】前記のように、騒音の大きさによって半音
節の省略と単音節の省略とを区別して行なうことによ
り、騒音の大きさと欠落しやすい音節とを適合させるこ
とができ、より一層、騒音時における認識率の低下を抑
制することが出来るとともに、通常の低騒音の場合には
前記処理を行なわないで単語全体で一致判断を行なうの
で、認識率を向上させることが出来る。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態の構成を示すブロッ
ク図。
【図2】図1の実施の形態における全体の演算処理を示
すフローチャート。
【図3】図1の実施の形態における音声辞書の内容の一
部を示す図。
【図4】図2のフローチャート内の一致度演算の詳細を
示すサブフローチャート。
【図5】本発明の第2の実施の形態の構成を示すブロッ
ク図。
【図6】図5の実施の形態における全体の演算処理を示
すフローチャート。
【図7】図6のフローチャート内の一致度演算の詳細を
示すサブフローチャート。
【図8】本発明の第3の実施の形態の構成を示すブロッ
ク図。
【図9】図8の実施の形態における全体の演算処理を示
すフローチャート。
【図10】図9のフローチャート内の一致度演算の詳細
を示すサブフローチャート。
【図11】本発明の第4の実施の形態の構成を示すブロ
ック図。
【図12】図11の実施の形態における全体の演算処理
を示すフローチャート。
【図13】図12のフローチャート内の一致度演算の詳
細を示すサブフローチャート。
【符号の説明】
101…マイクロフォン 804…信号処
理装置 102…フィルタ 804a…CPU 103…A/Dコンバータ 804b…メモリ 104…信号処理装置 805…マイク
ロフォン 104a…CPU 806…フィ
ルタ 104b…メモリ 807…A/
Dコンバータ 504…信号処理装置 1104…信号処
理装置 504a…CPU 1104a…CP
U 504b…メモリ 1104b…メモ

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】入力信号波の音声区間を検出する音声区間
    検出手段と、認識対象となる単語を記録してある音声辞
    書と、前記入力信号波の音声区間と前記音声辞書中の単
    語との一致度を演算し、最も一致度の高い単語を認識結
    果として出力する音声認識装置において、 前記認識対象となる単語の語頭の半音節を省略した単語
    を認識対象の単語として、前記入力信号波の音声区間と
    の一致度を演算することを特徴とする音声認識装置。
  2. 【請求項2】前記認識対象となる単語の語頭に無声子音
    がある場合に、語頭の半音節を省略した単語を認識対象
    の単語として、前記入力信号波の音声区間との一致度を
    演算することを特徴とする請求項1に記載の音声認識装
    置。
  3. 【請求項3】前記認識対象となる単語の語頭に、/p/
    あるいは/t/あるいは/k/あるいは/s/あるいは
    /h/あるいは/f/あるいは/m/あるいは/n/の
    半音節がある場合に、語頭の半音節を省略した単語を認
    識対象の単語として、前記前記入力信号波の音声区間と
    の一致度を演算することを特徴とする請求項1に記載の
    音声認識装置。
  4. 【請求項4】入力信号波の音声区間を検出する音声区間
    検出手段と、認識対象となる単語を記録してある音声辞
    書と、前記入力信号波の音声区間と前記音声辞書中の単
    語との一致度を演算し、最も一致度の高い単語を認識結
    果として出力する音声認識装置において、 前記認識対象となる単語の語頭の単音節がイ行、または
    ウ行であるときに、前記単語の語頭の単音節を省略した
    単語を認識対象の単語として、前記入力信号波の音声区
    間との一致度を演算することを特徴とする音声認識装
    置。
  5. 【請求項5】前記認識対象となる単語の語頭の単音節が
    イ行、またはウ行であり、それに前記語頭の単音節の発
    語の強さを押さえる子音が続く場合に、前記単語の語頭
    の単音節を省略した単語を認識対象の単語として、前記
    入力信号波の音声区間との一致度を演算することを特徴
    とする請求項4に記載の音声認識装置。
  6. 【請求項6】前記認識対象となる単語の語頭の単音節が
    イ行、またはウ行であり、それに破裂音が続く場合に、
    前記単語の語頭の単音節を省略した単語を認識対象の単
    語として、前記入力信号波の音声区間との一致度を演算
    することを特徴とする請求項4に記載の音声認識装置。
  7. 【請求項7】前記認識対象となる単語の語頭の単音節が
    イ行、またはウ行であり、それに促音が続く場合に、前
    記単語の語頭の単音節を省略した単語を認識対象の単語
    として、前記入力信号波の音声区間との一致度を演算す
    ることを特徴とする請求項4に記載の音声認識装置。
  8. 【請求項8】前記認識対象となる単語の語頭の単音節が
    イ行、またはウ行であり、それに/p/あるいは/t/
    あるいは/k/あるいは/s/あるいは/h/あるいは
    /c/あるいは/g/あるいは/j/あるいは/z/が
    続く場合に、前記単語の語頭の単音節を省略した単語を
    認識対象の単語として、前記入力信号波の音声区間との
    一致度を演算することを特徴とする請求項4に記載の音
    声認識装置。
  9. 【請求項9】騒音検出手段を備え、騒音が所定値以上の
    ときにのみ、前記単語の語頭を省いた単語を認識対象の
    単語として、前記入力信号波の音声区間との一致度を演
    算することを特徴とする請求項1乃至請求項8の何れか
    に記載の音声認識装置。
  10. 【請求項10】騒音検出手段を備え、騒音が第1の所定
    値以上で第2の所定値未満のときに、前記認識対象とな
    る単語の語頭の半音節を省略した単語を認識対象の単語
    とし、騒音が前記第2の所定値以上のときには前記単語
    の語頭の単音節を省いた単語を認識対象の単語として、
    前記入力信号波の音声区間との一致度を演算することを
    特徴とする請求項1乃至請求項8の何れかに記載の音声
    認識装置。
JP22506696A 1996-08-27 1996-08-27 音声認識装置 Expired - Fee Related JP3588929B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP22506696A JP3588929B2 (ja) 1996-08-27 1996-08-27 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22506696A JP3588929B2 (ja) 1996-08-27 1996-08-27 音声認識装置

Publications (2)

Publication Number Publication Date
JPH1069291A true JPH1069291A (ja) 1998-03-10
JP3588929B2 JP3588929B2 (ja) 2004-11-17

Family

ID=16823510

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22506696A Expired - Fee Related JP3588929B2 (ja) 1996-08-27 1996-08-27 音声認識装置

Country Status (1)

Country Link
JP (1) JP3588929B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001083983A (ja) * 1999-09-09 2001-03-30 Xanavi Informatics Corp 音声認識装置、音声認識のためのデータを記録した記録媒体、および、音声認識ナビゲーション装置
JP2003044079A (ja) * 2001-08-01 2003-02-14 Sony Corp 音声認識装置および方法、記録媒体、並びにプログラム
JP2007322757A (ja) * 2006-06-01 2007-12-13 Nissan Motor Co Ltd 音声対話装置
US7634401B2 (en) 2005-03-09 2009-12-15 Canon Kabushiki Kaisha Speech recognition method for determining missing speech

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001083983A (ja) * 1999-09-09 2001-03-30 Xanavi Informatics Corp 音声認識装置、音声認識のためのデータを記録した記録媒体、および、音声認識ナビゲーション装置
JP2003044079A (ja) * 2001-08-01 2003-02-14 Sony Corp 音声認識装置および方法、記録媒体、並びにプログラム
US7634401B2 (en) 2005-03-09 2009-12-15 Canon Kabushiki Kaisha Speech recognition method for determining missing speech
JP2007322757A (ja) * 2006-06-01 2007-12-13 Nissan Motor Co Ltd 音声対話装置

Also Published As

Publication number Publication date
JP3588929B2 (ja) 2004-11-17

Similar Documents

Publication Publication Date Title
JP2012032557A (ja) 音声に含まれる吸気音を検出する装置、方法、及びプログラム
JP3069531B2 (ja) 音声認識方法
JP3588929B2 (ja) 音声認識装置
JP2006039382A (ja) 音声認識装置
JPH0950288A (ja) 音声認識装置及び音声認識方法
JP3106543B2 (ja) 音声信号処理装置
JP3114757B2 (ja) 音声認識装置
JPH07225593A (ja) 音処理装置
JP3285704B2 (ja) 音声対話のための音声認識方法及び装置
JP2006010739A (ja) 音声認識装置
JP2001042889A (ja) 音声認識入力音声の音程正規化装置
JPH07295588A (ja) 発話速度推定方法
KR20040082756A (ko) 비음성 제거에 의한 음성 추출 방법
JP2975542B2 (ja) 音声認識装置
JPH03114100A (ja) 音声区間検出装置
JP3125928B2 (ja) 音声認識装置
JP2664785B2 (ja) 音声認識装置
JP3020999B2 (ja) パターン登録方法
JP2010008768A (ja) 音声認識装置及び音声認識方法
JP2594916B2 (ja) 音声認識装置
Fukuda et al. Breath-Detection-Based Telephony Speech Phrasing.
KR20080061901A (ko) 로봇의 입출력 장치에 의한 효율적인 음성인식 방법 및시스템
STEJSKAL1a et al. Non-speech activity pause detection in noisy and clean speech conditions
JP2000155600A (ja) 音声認識システムおよび入力音声レベル警告方法
JPH06318098A (ja) 話者認識装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040301

A131 Notification of reasons for refusal

Effective date: 20040309

Free format text: JAPANESE INTERMEDIATE CODE: A131

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040319

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Effective date: 20040727

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Effective date: 20040809

Free format text: JAPANESE INTERMEDIATE CODE: A61

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 4

Free format text: PAYMENT UNTIL: 20080827

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080827

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090827

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees