JP3458285B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP3458285B2
JP3458285B2 JP14417694A JP14417694A JP3458285B2 JP 3458285 B2 JP3458285 B2 JP 3458285B2 JP 14417694 A JP14417694 A JP 14417694A JP 14417694 A JP14417694 A JP 14417694A JP 3458285 B2 JP3458285 B2 JP 3458285B2
Authority
JP
Japan
Prior art keywords
voice
feature data
utterance
input
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP14417694A
Other languages
English (en)
Other versions
JPH0816186A (ja
Inventor
肇道 徳田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP14417694A priority Critical patent/JP3458285B2/ja
Publication of JPH0816186A publication Critical patent/JPH0816186A/ja
Application granted granted Critical
Publication of JP3458285B2 publication Critical patent/JP3458285B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、特定話者を対象とした
音声認識装置に関する。
【0002】
【従来の技術】近年、音声認識装置が注目されている
が、その認識精度と音声登録の煩わしさが課題である。
【0003】以下、従来の音声認識装置について説明す
る。特定話者を対象とする一般的な音声認識装置は、あ
らかじめ認識させる単語の音声を話者が数回発声して登
録し、認識時にはこの登録された音声の特徴パラメータ
と話者の発声する音声の特徴パラメータとを比較するパ
ターンマッチングにより音声認識を行う。この場合、認
識させる単語音声の登録時には信号パワーレベルやゼロ
クロス数、および音声に特有の信号パターン、たとえば
音声ピッチなどを用いて音声区間が検出される。
【0004】
【発明が解決しようとする課題】このような従来の音声
認識装置では、装置に単語音声を登録するとき、周囲の
雑音や不用な音声が付加された場合には、正確な音声区
間を決定出来ない場合があった。また、そのような音声
を誤って登録することにより、音声認識の精度が低下す
る場合があった。また、1単語ごとに音声の登録操作を
繰り返す必要があるため、手間と時間がかかっていた。
【0005】本発明は上記の課題を解決するもので、登
録した単語音声の音声特徴データの音声区間が正確にな
って認識精度がよく、また、音声登録の操作が簡単な音
声認識装置を提供することを目的とする。
【0006】
【課題を解決するための手段】請求項1に係わる本発明
は、特定話者が発声する単語音声を認識する音声認識装
置において、音声信号を入力してディジタル信号に変換
する音声入力部と、前記音声入力部で入力した音声信号
音声特徴データを抽出する音声信号特徴抽出部と、抽
出した音声特徴データを記憶する音声特徴データ記憶部
と、2つの音声特徴データの時系列の間のベクトル距離
を算出する単語間距離算出部と、音声入力部から入力し
た単語について前記音声特徴データの登録処理を行う音
声信号登録制御部と、任意に入力した音声を前記音声特
徴データ記憶部に記憶した音声特徴データと比較して音
声認識する音声認識処理部とを備え、前記音声信号登録
制御部は、認識する単語について1回目の発声をさせ、
その1回目の発声の音声特徴データを前記音声信号特徴
抽出部により抽出して前記音声特徴データ記憶部に一旦
記憶し、つぎに2回目に同じ単語について発声した音声
について前記音声信号特徴抽出部により音声特徴データ
を抽出し、前記単語間距離算出部によって1回目の発声
の音声特徴データと2回目の発声の音声特徴データとの
単語間距離の計算を計算の始点をずらしながら実行し
単語間距離が所定の値以下となる音声区間をその単語の
音声区間として切り出すとともに、その区間の音声特徴
データをその単語の音声特徴データとして前記音声特徴
データ記憶部に登録し、算出した前記単語間距離が所定
の値を越える場合には不良発声と判断して再度の発声入
を促すようにした音声認識装置であり、また、請求項
2に係わる本発明は、特定話者が発声する単語音声を認
識する音声認識装置において、音声信号を入力してディ
ジタル信号に変換する音声入力部と、前記音声入力部で
入力した音声信号の音声特徴データを抽出する音声信号
特徴抽出部と、抽出した音声特徴データを記憶する音声
特徴データ記憶部と、2つの音声特徴データの時系列の
間のベクトル距離を算出する単語間距離算出部と、音声
入力部から入力した単語について前記音声特徴データの
登録処理を行う音声信号登録制御部と、任意に入力した
音声を前記音声特徴データ記憶部に記憶した音声特徴デ
ータと比較して音声認識する音声認識処理部とを備え、
前記音声信号登録制御部は、認識対象の全単語について
1回目の発声入力を順次連続的に行うとともに、順次そ
れらの音声特徴データを抽出して音声特徴データ記憶部
に一旦記憶し、つぎに2回目の発声を全単語について1
回目の発声順序で続けて発声入力させ、それらの音声特
徴データを抽出して前記音声特徴データ記憶部に一旦記
憶し、1回目の発声の音声特徴データと2回目の発声の
音声特徴データとの単語間距離の計算を計算の始点をず
らしながら実行することにより2回目発声の音声特徴デ
ータの所定値以下の単語間距離となる音声区間の切り出
しと登録処理、および不良発声の判定を順次に発声順序
で処理し、単語間距離が所定値を越える発声入力につい
ては再度の発声入力を促すようにした音声認識装置であ
り、また、請求項3に係わる本発明は、特定話者が発声
する単語音声を認識する音声認識装置において、音声信
号を入力してディジタル信号に変換する音声入力部と、
前記音声入力部で入力した音声信号の音声特徴データを
抽出する音声信号特徴抽出部と、抽出した音声特徴デー
タを記憶する音声特徴データ記憶部と、2つの音声特徴
データの時系列の間のベクトル距離を算出する単語間距
離算出部と、音声入力部から入力した単語について前記
音声特徴データの登録処理を行う音声信号登録制御部
と、任意に入力した音声を前記音声特徴データ記憶部に
記憶した音声特徴データと比較して音声認識する音声認
処理部とを備えるとともに、あらかじめ単語の標準の
音声特徴データを内蔵して備え、前記音声信号登録制御
部は、認識対象の全単語について順次連続的に1回目の
発声入力を実行させ、それらの音声特徴データを前記音
声特徴データ記憶部に一旦記憶し、つぎに前記標準の音
声特徴データとの単語間距離の算出により1回目の発声
入力について音声区間の切り出しと不良発声を判定し、
つぎに2回目の発声入力をすべての単語について連続的
に行い、それらの音声特徴データを抽出して前記音声特
徴データ記憶部に一旦記憶し、1回目の発声の音声特徴
データと2回目の発声の音声特徴データとの単語間距離
の計算を計算の始点をずらしながら実行することによ
単語間距離が所定値以下となる音声区間の切り出し
と登録処理および不良発声の判定とを1回目の発声入力
の順序で順次に行い、単語間距離が所定値を越える発声
入力については再度の発声入力から登録までの処理を繰
り返す処理を行なうようにした音声認識装置である。
【0007】
【作用】請求項1に係わる本発明において、音声信号登
録制御部は、1回目入力の発声入力の音声特徴データと
2回目発声入力の音声特徴データとの単語間距離が所定
値以下となる音声区間を切り出してその音声特徴データ
を登録し、この処理を認識対象の単語ごとに繰り返して
全対象単語について登録処理を行う。単語間距離が所定
値を越える発声入力については再度発声入力して同じ処
理を行う。また、請求項2に係わる本発明において、音
声信号登録制御部は、1回目の発声入力を認識対象の全
単語について連続的に行い、2回目の発声入力を1回目
の順序で行い、各単語について順次単語間距離による音
声区間の切り出しと不良発声の判定を行う。単語ごとの
発声入力と登録処理よりも話者の手間と時間が省ける。
また、請求項3に係わる本発明において、装置はあらか
じめ単語の標準的な音声特徴データを内蔵しており、請
求項2に係わる本発明と同様に1回目の発声入力の連続
処理とともに、1回目の発声入力について標準の音声特
徴データとの単語間距離による音声区間の切り出しと不
良発声の判定を行って精度を向上させる。2回目の発声
入力との単語間距離による音声区間の切り出しと不良発
声の判定および登録処理は請求項2に係わる処理と同じ
である。
【0008】
【実施例】(実施例1) 以下、請求項1に係わる本発明の音声認識装置の一実施
例について図面を参照しながら説明する。図1は本実施
例の構成を示すブロック図である。図において、1−1
は音声を入力してデジタル信号に変換する音声入力部、
1−2は装置に認識させる単語音声の登録処理を行う音
声信号登録制御部、1−3は音声信号からその音声特徴
データを算出する音声信号特徴抽出部、1−4は2つの
音声特徴データの時系列の間のベクトル距離を算出する
単語間距離算出部、1−5は算出された音声特徴データ
を記憶する音声特徴データ記憶部、1−6は音声特徴デ
ータ記憶部1−5に登録された音声特徴データを用いて
音声認識処理を行う音声認識処理部である。
【0009】図2は本実施例における音声認識処理部の
回路構成を示すブロック図である。図において、2−1
はマイクロホン(以下、マイクと称す)、2−2は中央
処理装置(以下、CPUと称す)、2−3は読み出し専
用メモリ(以下、ROMと称す)、2−4は書き込み可
能メモリ(RAM)、2−5は出力装置である。図1に
おける音声入力部1−1は、マイク2−1とCPU2−
2により実現され、また、音声信号登録制御部1−2と
音声信号特徴抽出部1−3と単語間距離算出部1−4と
音声認識処理部1−6は、CPU2−2がROM2−3
に書かれたプログラムを実行し、RAM2−4にアクセ
スすることにより実現される。
【0010】上記構成においてその動作を説明する。図
3は単語音声登録時の動作を示すフローチャートであ
る。なお、登録する単語名はあらかじめデータとして装
置に入力されており、話者はそれらの単語の音声データ
を2回つ登録するものとする。ステップ1において、
話者が登録開始キーを押すと、最初に登録する単語名が
表示される。ステップ2において、話者は録音開始キー
を押し、表示された単語を発声する。ステップ3におい
て、録音開始キーが押されてから一定時間の間、マイク
に入った音声が音声入力部1−1に入力され、A/D変
換によりサンプリング周波数8KHz のデジタル信号に変
換される。ステップ4において、入力された音声のパワ
ーレベルが所定の値を越えた時点を音声区間の始点とみ
なし、パワーレベルが所定の値より小さい状態がある程
度続いた時点を音声区間の終点と見なし、始点から終点
までの音声信号を音声信号特徴抽出部に送る。すなわ
ち、音声パワーによる音声の切り出しを行う。
【0011】ステップ5において、音声信号特徴抽出部
1−3は、入力した音声信号を256ポイントのフレー
ムに分割する。このとき、各フレームは128ポイン
ト、すなわち半フレームつ互いに重複しているものと
する。つぎに、ステップ6において、フレーム分割した
音声データに対して10次のLPCメルケプストラム係
数の時系列を音声特徴データとして算出する。ステップ
7において、算出された音声特徴データを音声特徴デー
タ記憶部1−5に記憶する。以上の処理により1単語の
1回目の登録が終了する。つぎに、ステップ8におい
て、同じ単語の2回目の発声を促す表示が出され、2回
目の登録が開始される。ステップ9において、話者は録
音開始キーを押し、1回目と同じ単語を発声する。ステ
ップ10において、1回目と同様に音声が音声入力部に
入力されてデジタル信号に変換され、ステップ11にお
いて、音声信号は音声区間を切り出さないまま音声信号
特徴抽出部1−3に送られ、1回目の発声と同様にフレ
ーム分割される。
【0012】ステップ12において、各フレームの10
次のLPCメルケプストラム係数が音声特徴データとし
て算出される。ステップ13において、各フレームの音
声特徴データが単語間距離算出部1−4に送られ、単語
間距離算出部1−4は、1回目の発声の音声特徴データ
を音声特徴データ記憶部1−5からロードし、2回目の
発声の音声特徴データとの単語間距離を下記に示すDP
マッチング法により算出する。
【0013】まず、1回目の発声の時間長Aに±20%
の長さの変動を考慮した時間長A×80%を設定し、2
回目に発声したデータからこの時間長の区間を始点Xを
ずらしながら切り出し、この区間と1回目の発声の音声
特徴データとの間で端点フリーのDPマッチング法によ
る単語間距離の計算を行う。図4はこの場合の始点と切
り出し区間とを示す模式図である。まず、マッチングを
行う始点をX1 とする。始点X1 から始まり、1回目の
発声時間長の80%の長さの区間分のフレームと、1回
目の発声の全フレームの音声特徴データを用いてDPマ
ッチング法による距離計算を行う。つぎに、X1 から始
まり、区間の終点を1フレームつ後ろにずらしなが
ら、1回目の発声時間長の120%の長さの区間になる
までDPマッチング計算を行い、各区間における単語間
距離を記録する。つぎに、マッチングを行う始点をX1
からX2 へ後ろに1つずらし、前回と同様に、終点を1
フレームつ後ろにずらしながら、1回目の発声時間長
の±20%の変動を与えた範囲でDPマッチング計算を
行う。以上の処理を、始点を後方に1つずつずらしなが
ら、マッチングの最小区間長の後端がデータの最終フレ
ームに到達するまで繰り返す。
【0014】ステップ14において、上記のマッチング
計算を全区間について終了したのち、各区間における単
語間距離を比較し、そのなかで最も小さい距離を得た区
間を求める。つぎに、ステップ15に移行して、得られ
た最小の単語間距離が既定値より小さいか否かをチェッ
クする。最小の単語間距離が既定値より小さい場合は、
ステップ17において、2回目の発声データ上でその値
を得た区間を単語音声区間と見なして切り出し、それら
のフレームの音声特徴データを2回目発声分のデータと
して音声特徴データ記憶部1−5に記憶し、ステップ1
7に移行する。また、ステップ15において最小の単語
間距離が既定値より大きい場合はステップ16に移行
し、音声データにノイズや不要な言葉が付加したものと
見なし、話者に発声のやり直しを促してステップ9に戻
り、発声をやり直す。
【0015】そののちステップ10〜ステップ14を経
由し、ステップ15において再び既定値以下の単語間距
離が得られなければ、ステップ16において1回目の発
声データが不良であったと見なし、ステップ1に戻って
1回目の発声の登録からやり直す。以降、ステップ1か
らステップ17までを既定値以下の単語間距離が得られ
るまで繰り返す。ステップ18において、全ての単語が
登録されたか否かをチェックし、未完了であれば、1単
語の登録が済むごとにステップ1に戻ってつぎの単語の
登録に移行し、全単語の登録が終了するまでステップ1
からステップ17までの処理を繰り返す。以上の処理に
より、単語音声区間の正確な切り出しと不良な発声の判
定が可能になり、音声認識精度が向上する。
【0016】以上のように、本実施例の音声認識装置に
よれば、同じ単語を2度発声して、その間の単語間距離
が最も小さい区間をその単語の音声区間として登録する
ようにし、また、単語間距離が既定値より大きい場合に
は不良な発声として再度の発声により登録するようにし
たことにより、不良な発声を判定しながら単語音声区間
を正確に切り出して登録できるので、その音声特徴デー
タを用いた音声認識の精度が向上する。
【0017】(実施例2)以下、請求項2に係わる本発
明の音声認識装置の一実施例について説明する。なお、
本実施例の構成をブロック図に示すと図1および図2と
同じになり、詳細な説明を省略する。本実施例が実施例
1と異なる点は、登録動作にある。実施例1において
は、1単語ごとに1回目の発声と2回目の発声による登
録とを行ったが、本実施例においては、話者は登録する
全単語の1回目の発声を最初に全単語について行い、そ
れらのパワーによる音声区間の切り出しとフレーム分
割、音声特徴データの算出を実行し、音声特徴データ記
憶部1−5に記憶する。つぎに、2回目の発声では全登
録単語を1回目の発声と同じ順番で1呼吸をおいて連続
発声する。音声信号登録制御部1−2は、連続発声され
たデータから音声パワーを用いて音声区間の粗い切り出
しを行い、それぞれの音声区間に対して実施例1と同じ
方法で単語間距離の計算を行う。このとき、1回目の発
声の音声特徴データを登録順に用いて順次に単語間距離
を計算することにより、同じ単語間でマッチングを行う
ようにする。この単語間距離計算で規定値以下の距離が
得られなかった単語については、話者にそれらの一覧を
示し、再度の発声を促して発声入力させる。既定値を越
える単語間距離の単語が無くなるまで登録処理を繰り返
す。
【0018】以上の処理により、1単語ごとに登録開始
キーを押して登録する手間が省け、登録に要する時間を
短縮することができる。
【0019】(実施例3)以下、請求項3に係わる本発
明の音声認識装置の一実施例について説明する。なお、
本実施例の構成をブロック図で示すと図1および図2と
同じになり、詳細な説明を省略する。本実施例が実施例
1および実施例2と異なる点は、その登録処理にある。
実施例1および実施例2においては、1回目の発声につ
いて不良発声の判断を行わなかったが、本実施例におい
ては、数値など特定の単語のみを対象とした音声認識の
場合、認識する全単語の音声について標準的な音声特徴
データ記憶部にあらかじめ内蔵しておき、1回目の発声
データの登録時から実施例2の場合と同様に、話者は全
単語を連続して発声し、標準音声のデータを用いて音声
区間の連続切り出しと不良発声の判定を行う。また、2
回目以降の発声の登録時には1回目の発声の音声特徴デ
ータを用いて連続切り出しと不良発声の判定を行う。
【0020】以上の処理により、実施例2と同様に1回
目の発声から連続発声による登録を行って登録時間の短
縮を図るとともに、1回目の発声についても標準的な音
声特徴データによる切り出しを行うことにより、さらに
正確な単語音声区間の切り出しと不良発声の判定ができ
るため、登録音声全体の精度の向上が図れ、実施例2よ
りも精度の向上と音声登録に要する手間と時間の短縮が
できる。
【0021】
【発明の効果】以上の説明から明らかなように、請求項
1に係わる本発明は、特定話者が発声する単語音声を認
識する音声認識装置において、音声信号を入力してディ
ジタル信号に変換する音声入力部と、前記音声入力部で
入力した音声信号の音声特徴データを抽出する音声信号
特徴抽出部と、抽出した音声特徴データを記憶する音声
特徴データ記憶部と、2つの音声特徴データの時系列の
間のベクトル距離を算出する単語間距離算出部と、音声
入力部から入力した単語について前記音声特徴データの
登録処理を行う音声信号登録制御部と、任意に入力した
音声を前記音声特徴データ記憶部に記憶した音声特徴デ
ータと比較して音声認識する音声認識処理部とを備え、
前記音声信号登録制御部は、認識する単語について1回
目の発声をさせ、その1回目の発声の音声特徴データを
前記音声信号特徴抽出部により抽出して前記音声特徴デ
ータ記憶部に一旦記憶し、つぎに2回目に同じ単語につ
いて発声した音声について前記音声信号特徴抽出部によ
り音声特徴データを抽出し、前記単語間距離算出部によ
って1回目の発声の音声特徴データと2回目の発声の音
声特徴データとの単語間距離の計算を計算の始点をずら
しながら実行し、単語間距離が所定の値以下となる音声
区間をその単語の音声区間として切り出すとともに、そ
の区間の音声特徴データをその単語の音声特徴データと
して前記音声特徴データ記憶部に登録し、算出した前記
単語間距離が所定の値を越える場合には不良発声と判断
して再度の発声入力を促すようにしたことにより、ま
た、請求項2に係わる本発明は、特定話者が発声する単
語音声を認識する音声認識装置において、音声信号を入
力してディジタル信号に変換する音声入力部と、前記音
声入力部で入力した音声信号の音声特徴データを抽出す
る音声信号特徴抽出部と、抽出した音声特徴データを記
憶する音声特徴データ記憶部と、2つの音声特徴データ
の時系列の間のベクトル距離を算出する単語間距離算出
部と、音声入力部から入力した単語について前記音声特
徴データの登録処理を行う音声信号登録制御部と、任意
に入力した音声を前記音声特徴データ記憶部に記憶した
音声特徴データと比較して音声認識する音声認識処理
とを備え、前記音声信号登録制御部は、認識対象の全単
語について1回目の発声入力を順次連続的に行うととも
に、順次それらの音声特徴データを抽出して音声特徴デ
ータ記憶部に一旦記憶し、つぎに2回目の発声を全単語
について1回目の発声順序で続けて発声入力させ、それ
らの音声特徴データを抽出して前記音声特徴データ記憶
部に一旦記憶し、1回目の発声の音声特徴データと2回
目の発声の音声特徴データとの単語間距離の計算を計算
の始点をずらしながら実行することにより2回目発声の
音声特徴データの所定値以下の単語間距離となる音声区
間の切り出しと登録処理、および不良発声の判定を順次
に発声順序で処理し、単語間距離が所定値を越える発声
入力については再度の発声を促すようにしたことによ
り、また、請求項3に係わる本発明は、特定話者が発声
する単語音声を認識する音声認識装置において、音声信
号を入力してディジタル信号に変換する音声入力部と、
前記音声入力部で入力した音声信号の音声特徴データを
抽出する音声信号特徴抽出部と、抽出した音声特徴デー
タを記憶する音声特徴データ記憶部と、2つの音声特徴
データの時系列の間のベクトル距離を算出する単語間距
離算出部と、音声入力部から入力した単語について前記
音声特徴データの登録処理を行う音声信号登録制御部
と、任意に入力した音声を前記音声特徴データ記憶部に
記憶した音声特徴データと比較して音声認識する音声認
処理部とを備えるとともに、あらかじめ単語の標準の
音声特徴データを内蔵して備え、前記音声信号登録制御
部は、認識対象の全単語について順次連続的に1回目の
発声入力を実行させ、それらの音声特徴データを前記音
声特徴データ記憶部に一旦記憶し、つぎに前記標準の音
声特徴データとの単語間距離の算出により1回目の発声
入力について音声区間の切り出しと不良発声を判定し、
つぎに2回目の発声入力をすべての単語について連続的
に行い、それらの音声特徴データを抽出して前記音声特
徴データ記憶部に一旦記憶し、1回目の発声の音声特徴
データと2回目の発声の音声特徴データとの単語間距離
の計算を計算の始点をずらしながら実行することによ
単語間距離が所定値以下となる音声区間の切り出し
と登録処理および不良発声の判定とを1回目の発声入力
の順序で順次に行い、単語間距離が所定値を越える発声
入力については再度の発声入力から登録までの処理を繰
り返す処理を行なうようにしたことにより、いずれの発
明においても登録した音声特徴データの精度が向上し、
また、請求項2および請求項3に係わる本発明において
は、発声話者の登録の手間と時間が大いに省ける効果が
ある。
【図面の簡単な説明】
【図1】請求項1に係わる本発明の音声認識装置の一実
施例の構成を示すブロック図
【図2】同実施例の構成を示す回路ブロック図
【図3】同実施例の単語登録時の動作を示す部分フロー
チャート
【図4】同実施例の単語登録時の動作を示し、図3に続
く部分フローチャート
【符号の説明】
1−1 音声入力部 1−2 音声信号登録制御部 1−3 音声信号特徴抽出部 1−4 単語間距離算出部 1−5 音声特徴データ記憶部 1−6 音声認識処理部

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 特定話者が発声する単語音声を認識する
    音声認識装置において、音声信号を入力してディジタル
    信号に変換する音声入力部と、前記音声入力部で入力し
    た音声信号の音声特徴データを抽出する音声信号特徴抽
    出部と、抽出した音声特徴データを記憶する音声特徴デ
    ータ記憶部と、2つの音声特徴データの時系列の間のベ
    クトル距離を算出する単語間距離算出部と、音声入力部
    から入力した単語について前記音声特徴データの登録処
    理を行う音声信号登録制御部と、任意に入力した音声を
    前記音声特徴データ記憶部に記憶した音声特徴データと
    比較して音声認識する音声認識処理部とを備え、前記音
    声信号登録制御部は、認識する単語について1回目の発
    声をさせ、その1回目の発声の音声特徴データを前記音
    声信号特徴抽出部により抽出して前記音声特徴データ記
    憶部に一旦記憶し、つぎに2回目に同じ単語について発
    声した音声について前記音声信号特徴抽出部により音声
    特徴データを抽出し、前記単語間距離算出部によって1
    回目の発声の音声特徴データと2回目の発声の音声特徴
    データとの単語間距離の計算を計算の始点をずらしなが
    ら実行し、単語間距離が所定の値以下となる音声区間を
    その単語の音声区間として切り出すとともに、その区間
    の音声特徴データをその単語の音声特徴データとして前
    記音声特徴データ記憶部に登録し、算出した前記単語間
    距離が所定の値を越える場合には不良発声と判断して再
    度の発声入力を促すようにした音声認識装置。
  2. 【請求項2】 特定話者が発声する単語音声を認識する
    音声認識装置において、音声信号を入力してディジタル
    信号に変換する音声入力部と、前記音声入力部で入力し
    た音声信号の音声特徴データを抽出する音声信号特徴抽
    出部と、抽出した音声特徴データを記憶する音声特徴デ
    ータ記憶部と、2つの音声特徴データの時系列の間のベ
    クトル距離を算出する単語間距離算出部と、音声入力部
    から入力した単語について前記音声特徴データの登録処
    理を行う音声信号登録制御部と、任意に入力した音声を
    前記音声特徴データ記憶部に記憶した音声特徴データと
    比較して音声認識する音声認識処理部とを備え、前記音
    声信号登録制御部は、認識対象の全単語について1回目
    の発声入力を順次連続的に行うとともに、順次それらの
    音声特徴データを抽出して音声特徴データ記憶部に一旦
    記憶し、つぎに2回目の発声を全単語について1回目の
    発声順序で続けて発声入力させ、それらの音声特徴デー
    タを抽出して前記音声特徴データ記憶部に一旦記憶し、
    1回目の発声の音声特徴データと2回目の発声の音声特
    徴データとの単語間距離の計算を計算の始点をずらしな
    がら実行することにより2回目発声の音声特徴データの
    所定値以下の単語間距離となる音声区間の切り出しと登
    録処理、および不良発声の判定を順次に発声順序で処理
    し、単語間距離が所定値を越える発声入力については再
    度の発声入力を促すようにした音声認識装置。
  3. 【請求項3】 特定話者が発声する単語音声を認識する
    音声認識装置において、音声信号を入力してディジタル
    信号に変換する音声入力部と、前記音声入力部で入力し
    た音声信号の音声特徴データを抽出する音声信号特徴抽
    出部と、抽出した音声特徴データを記憶する音声特徴デ
    ータ記憶部と、2つの音声特徴データの時系列の間のベ
    クトル距離を算出する単語間距離算出部と、音声入力部
    から入力した単語について前記音声特徴データの登録処
    理を行う音声信号登録制御部と、任意に入力した音声を
    前記音声特徴データ記憶部に記憶した音声特徴データと
    比較して音声認識する音声認識処理部とを備えるととも
    に、あらかじめ単語の標準の音声特徴データを内蔵して
    備え、前記音声信号登録制御部は、認識対象の全単語に
    ついて順次連続的に1回目の発声入力を実行させ、それ
    らの音声特徴データを前記音声特徴データ記憶部に一旦
    記憶し、つぎに前記標準の音声特徴データとの単語間距
    離の算出により1回目の発声入力について音声区間の切
    り出しと不良発声を判定し、つぎに2回目の発声入力を
    すべての単語について連続的に行い、それらの音声特徴
    データを抽出して前記音声特徴データ記憶部に一旦記憶
    し、1回目の発声の音声特徴データと2回目の発声の音
    声特徴データとの単語間距離の計算を計算の始点をずら
    しながら実行することにより単語間距離が所定値以下
    となる音声区間の切り出しと登録処理および不良発声の
    判定とを1回目の発声入力の順序で順次に行い、単語
    距離が所定値を越える発声入力については再度の発声入
    力から登録までの処理を繰り返す処理を行なうようにし
    た音声認識装置。
JP14417694A 1994-06-27 1994-06-27 音声認識装置 Expired - Fee Related JP3458285B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14417694A JP3458285B2 (ja) 1994-06-27 1994-06-27 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14417694A JP3458285B2 (ja) 1994-06-27 1994-06-27 音声認識装置

Publications (2)

Publication Number Publication Date
JPH0816186A JPH0816186A (ja) 1996-01-19
JP3458285B2 true JP3458285B2 (ja) 2003-10-20

Family

ID=15355979

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14417694A Expired - Fee Related JP3458285B2 (ja) 1994-06-27 1994-06-27 音声認識装置

Country Status (1)

Country Link
JP (1) JP3458285B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4798606B2 (ja) * 2005-11-02 2011-10-19 株式会社国際電気通信基礎技術研究所 音声認識装置、およびプログラム
US9837068B2 (en) * 2014-10-22 2017-12-05 Qualcomm Incorporated Sound sample verification for generating sound detection model

Also Published As

Publication number Publication date
JPH0816186A (ja) 1996-01-19

Similar Documents

Publication Publication Date Title
US6751595B2 (en) Multi-stage large vocabulary speech recognition system and method
US7974843B2 (en) Operating method for an automated language recognizer intended for the speaker-independent language recognition of words in different languages and automated language recognizer
JP2955297B2 (ja) 音声認識システム
JP3458285B2 (ja) 音声認識装置
CN112820281B (zh) 一种语音识别方法、装置及设备
JP2001255887A (ja) 音声認識装置、音声認識方法及び音声認識方法を記録した媒体
JP3477751B2 (ja) 連続単語音声認識装置
JP2880436B2 (ja) 音声認識装置
JP3061292B2 (ja) アクセント句境界検出装置
JP2905686B2 (ja) 音声認識装置
JPH08314490A (ja) ワードスポッティング型音声認識方法と装置
JPH0997095A (ja) 音声認識装置
JP3063855B2 (ja) 音声認識におけるマッチング距離値の極小値探索方法
JP3207378B2 (ja) 音声認識方法
JP3007357B2 (ja) 音声認識装置の辞書更新方式
JP3357752B2 (ja) パターンマッチング装置
JPH0211919B2 (ja)
KR100506662B1 (ko) 온라인 음성검증 기반의 음성 데이터베이스 구축방법
JP2003150189A (ja) 音声認識装置
JPH10143190A (ja) 音声認識装置
JPH096387A (ja) 音声認識装置
JPH06324696A (ja) 音声認識装置及び方法
CN112562657A (zh) 一种基于深度神经网络的个性语言离线学习方法
JP2005017620A (ja) 言語特定方法、言語特定用プログラム及び言語特定方法を用いた機械翻訳システム
JP2002006883A (ja) 音声認識装置および音声認識方法、並びに、プログラム記録媒体

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees