JPS60260096A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS60260096A
JPS60260096A JP59116002A JP11600284A JPS60260096A JP S60260096 A JPS60260096 A JP S60260096A JP 59116002 A JP59116002 A JP 59116002A JP 11600284 A JP11600284 A JP 11600284A JP S60260096 A JPS60260096 A JP S60260096A
Authority
JP
Japan
Prior art keywords
voice
speech
series
data
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59116002A
Other languages
English (en)
Inventor
小笠原 芳朗
竹内 亜紀彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59116002A priority Critical patent/JPS60260096A/ja
Publication of JPS60260096A publication Critical patent/JPS60260096A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、データ入力などに使用する音声認識装置にお
ける音声区間検出しきい値の補正方式に関する。
データ入力などに使用する音声認識装置は音声入力装置
と呼ばれ、比較的限定された単語の入力音声を認識して
データ入力とするものである。一般に、不特定の話者の
音声を対象とする場合には、その単語に特有であって、
総ての人について共通なあらゆる特徴を抽出して認識し
、誤認識を減少させなければならないが、これは認識処
理そのものだけではなく、その前段階の処理である音声
区間検出処理などにおいても、同様にいえることである
[従来の技術] 第2図は、データ入力などに使用する音声認識装置の代
表的な構成ブロック図である。図において、1は前処理
部、2はパラメータ抽出部、3は音声区間抽出部、4は
照合部、5は認識辞書、6は判定部をそれぞれ示す。
入力された音声信号は、前処理部1においてアナログ/
ディジタル変換され、パラメータ抽出部2において1フ
レーム(例えば15+ns )ごとにケプストラム・デ
ータその他のパラメータの抽出が行われる。
次いで、音声区間抽出部3において、音声パワーを一定
に設定されたしきい値と比較し゛て、これを越えたとき
に音声区間として抽出して、照合部4に特徴データを送
り、照合部4においてはその特徴データと認識辞書5と
の比較、照合を行い、判定部6において音声の判定を行
い出力する。
従来の装置においては、音声区間検出しきい値は、最初
に設定されると終了まで一定のものであった。
[発明が解決しようとする問題点] 一般にi系の単語(例えば「イチ」 「二J)は他の単
語(例えばrサン」「コンJ)に比べて音声パワーが低
く、音声区間検出しきい値が一定である従来装置におい
ては、i系単語については音声区間検出しきい値が高す
ぎる状態とな、す、欠落などを生じて誤認識となること
が多かった。
[問題点を解決するための手段] 上記問題点は、i系の音声入力があったとき、i系の単
語であることを判断する手段を設け、i系の単語と判断
したときは、音声区間検出しきい値のレベルを下げて音
声認識を行うよう構成した本発明によって達成される。
また、i系判断手段としては、音声パワーが最大である
フレームのケプストラム・データにおいて、2次/3次
/4次のデータの合計値を指定した一定値と比較し、こ
れを越えたことによってi系単語と判断するものである
これは本発明者が、ケプストラム・データにおける、2
次73次/4次データの合計値を調べた結果、i系の音
声においては他の音声に比べて格段に大きいことを確認
したことによってなされたものである。
[作用コ 上記手段によって、音声パワーの低いi系の音声が入力
されたときは、i系判断手段によって、i系の単語であ
ることを判断して、音声区間検出しきい値を下げて音声
認識処理を行うことによって、誤認識を減少することが
可能となる。
[実施例] 以下第1図に示す実施例によって、本発明の要旨を具体
的に説明する。図において、符号1〜6は前記第2図と
同一の対象物を示し、7はi系判定部、8はしきい値操
作部を示す。
入力された音声信号は、前処理部1においてアナログ/
ディジタル変換され、パラメータ抽出部2において1フ
レームごとにケプストラム・データその他のパラメータ
の抽出が行われる。
次いで、i系判定部7においては入力音声の最大パワー
であるフレームを検出すると、ケプストラムの2次/3
次/4次データの合計値を予め設定した基準値と比較す
ることによって、i系であるか否かを判定し、i系であ
った場合は、しきい値操作部8に信号を送り、しきい値
操作部8がらの操作によって、音声区間検出部3の音声
区間検出しきい値を、予め設定した基準に基づいて下げ
る。
音声区間抽出部3においては下げられた音声区間検出し
きい値によって音声区間を判定し、音声区間と判定した
とき、照合部4に特徴データを送り、照合部4において
はその特徴データと認識辞書5との比較、照合を行い、
判定部6において音声の判定を行い出力する。
[発明の効果] 以上説明したように、本発明によって、音声パワーの低
いi系の音声が入力されたときも、高い認識率で認識処
理を行うことができ、その工業的効果は大きい。
【図面の簡単な説明】
第1図は本発明による音声認識装置の回路構成ブロック
図、 第2図は従来の代表的な音声認識装置の回路構成ブロッ
ク図である。 図面において、 1は前処理部、 2はパラメータ抽出部、3は音声区間
抽出部 4は照合部、 5は認識辞書、 6は判定部、 7はi系判定部、 8はしきい値操作部をそれぞれ示す
。 牟 1 図 る 芽 2 目

Claims (2)

    【特許請求の範囲】
  1. (1)音声認識装置において、母音イを含む音声(以下
    i系と略称する)入力があったとき、i系の単語である
    ことを判断する手段を設け、i系の単語と判断したとき
    は、音声区間検出しきい値のレヘルを下げて音声認識を
    行うよう構成したことを特徴とする音声認識における音
    声区間検出しきい値の補正方式。
  2. (2)上記のi系の単語であると判断する手段が、音声
    パワーが最大であるフレーム(音声信号処理の単位時間
    )のケプストラム(音声パワー・スペクトルの対数の逆
    フーリエ変換)・データにおいて2次/3次/4次のデ
    ータの合計値が一定値以上であることをもって判断する
    ことを特徴とする特許請求の範囲第1項記載の音声認識
    における音声区間検出しきい値の補正方式。
JP59116002A 1984-06-06 1984-06-06 音声認識装置 Pending JPS60260096A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59116002A JPS60260096A (ja) 1984-06-06 1984-06-06 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59116002A JPS60260096A (ja) 1984-06-06 1984-06-06 音声認識装置

Publications (1)

Publication Number Publication Date
JPS60260096A true JPS60260096A (ja) 1985-12-23

Family

ID=14676404

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59116002A Pending JPS60260096A (ja) 1984-06-06 1984-06-06 音声認識装置

Country Status (1)

Country Link
JP (1) JPS60260096A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06507507A (ja) * 1992-02-28 1994-08-25 ジュンカ、ジャン、クロード 音声信号中の独立単語境界決定方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06507507A (ja) * 1992-02-28 1994-08-25 ジュンカ、ジャン、クロード 音声信号中の独立単語境界決定方法

Similar Documents

Publication Publication Date Title
JPS58130393A (ja) 音声認識装置
JPS62217295A (ja) 音声認識方式
JPS62232691A (ja) 音声認識装置
US4856067A (en) Speech recognition system wherein the consonantal characteristics of input utterances are extracted
JPS60260096A (ja) 音声認識装置
JPS584198A (ja) 音声認識装置における標準パタ−ン登録方式
JPH021317B2 (ja)
JPS61180297A (ja) 話者照合装置
JPH0754434B2 (ja) 音声認識装置
JPS63306499A (ja) 不特定話者音声認識装置
JPS5936299A (ja) 音声認識装置
KR950009328B1 (ko) 단음절단위의 음성인식방법
JPH0376471B2 (ja)
JPS59105697A (ja) 音声認識装置
JP2891259B2 (ja) 音声区間検出装置
JPH0316038B2 (ja)
JPH0567039B2 (ja)
JPS6285300A (ja) 単語音声認識装置
JPH0443277B2 (ja)
JP2901976B2 (ja) パターン照合予備選択方式
JPS6173200A (ja) 音声認識装置
JPS59211098A (ja) 音声認識装置
JPS62255999A (ja) 単語音声認識装置
JPS61113099A (ja) 音声認識装置における音声区間検出方式
JPS58159598A (ja) 単音節音声認識方式