JP2644494B2 - 不特定話者音声認識装置 - Google Patents

不特定話者音声認識装置

Info

Publication number
JP2644494B2
JP2644494B2 JP62143665A JP14366587A JP2644494B2 JP 2644494 B2 JP2644494 B2 JP 2644494B2 JP 62143665 A JP62143665 A JP 62143665A JP 14366587 A JP14366587 A JP 14366587A JP 2644494 B2 JP2644494 B2 JP 2644494B2
Authority
JP
Japan
Prior art keywords
similarity
speaker
reject
threshold
average value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62143665A
Other languages
English (en)
Other versions
JPS63306499A (ja
Inventor
章次 栗木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP62143665A priority Critical patent/JP2644494B2/ja
Publication of JPS63306499A publication Critical patent/JPS63306499A/ja
Application granted granted Critical
Publication of JP2644494B2 publication Critical patent/JP2644494B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 技術分野 本発明は、不特定話者音声認識装置に関する。
従来技術 従来、不特定話者音声認識装置のリジェクト閾値はス
イッチやソフトウェア等により変化することができた。
しかし、話者がどの位の閾値にすれば良いかという具体
的な方法は無く、経験的に行なわれてきた。しかも不特
定話者の場合、特定話者に比べて話者による類似度の違
いが大きく、話者が自分でリジェクト閾値を決めること
は困難であった。
目的 本発明は、上述のごとき実情に鑑みてなされたもの
で、特に、不特定話者音声認識装置のリジェクト出力に
おいて、話者毎に最適なリジェクト閾値を設定すること
を目的としてなされたものである。
構成 本発明は、上記目的を達成するために、入力された音
声をあるサンプル周期で特徴抽出する手段と、音声パワ
ーより音声区間を検出する手段と、辞書と比較して類似
度を求める手段と、その得点の最大となる単語を認識結
果の候補とする手段と、その類似度があるリジェクト閾
値より大なる場合は認識結果として出力する手段と、小
なる場合にはリジェクトする手段を有する不特定話者音
声認識装置において、あらかじめ決められた単語を話者
に発声させ、その類似度の平均値を求め、話者に適応し
たリジェクト閾値を、話者が発声した単語の類似度の平
均値にデータベースのリジェクト閾値を乗し、データベ
ースの単語の類似度の平均で除すことにより求めること
を特徴としたものである。以下、本発明の実施例に基づ
いて説明する。
一般に、音声認識において、音声認識のための照合を
行なって得られた最大得点の単語の類似度は、第2図に
示すように、ある平均値Aに集中する。これらのうち、
類似度の低い単語は誤認識(斜線部)である場合が多
い。リジェクトは正答率を上げるために、リジェクト値
Rを決定し、それ以下の認識単語をリジェクトして誤認
識をさけるようにしている。通常は、数10人のデータベ
ースより得点と誤認識の関係を求め、それに基づいてリ
ジェクト閾値を決定している。しかし、話者によっては
全体的に類似度の低い人がおり、その場合は、第3図の
ようになる。この状態では正解である単語も多くリジェ
クトするため認識動作に支障をきたす。それ故、不特定
話者辞書の場合、メーカーが認識対象単語を把握できる
ため、平均値の近くの単語をピックアップすることによ
り、話者に対して全単語発声させなくともピックアップ
した単語のみを発声させることにより話者の平均値を求
めることができる。この話者の平均値が求まれば、以下
の式により話者に適応したリジェクト閾値が定められ
る。
第1図は、本発明を実現するための一実施例を示す構
成図で、図中、1はマイクロフォン、2はアンプ、3は
特徴抽出部、4は音声区間検出部、5は入力パターン
部、6は類似度計算部、7は辞書、8は平均値検出部、
9はリジェクト値決定部、10はリジェクト部で、マイク
1より入力された音声は特徴抽出部3、音声区間検出部
4に入力され、入力音声パターンを得る。これと辞書7
と比較して最大類似度を求め、この得点を平均値検出部
8に格納する。決められたリジェクト閾値調整用単語の
発声が終了後、単語の類似度の平均値を求め、この値よ
りリジェクト値決定部9により、話者毎に適応したリジ
ェクト閾値が求められる。このリジェクト閾値は、辞書
7に、予め決められたリジェクト閾値調整用単語の類似
度の平均値及びそのリジェクト閾値がデータベースとし
て格納されており、このデータベースの類似度の平均値
及びリジェクト閾値を用い、前述のごとくして求めた話
者の類似度の平均値より、前記式を用いて求める。この
適応リジェクト閾値を用いて、認識動作中はリジェクト
を行なうことにより、効率的なリジェクトが可能とな
る。
効果 以上の説明から明らかなように、本発明によると、話
者毎に適応したリジェクト値が決定されるために、効率
の良い認識動作を行うことができる。
【図面の簡単な説明】
第1図は、本発明を実現するための一実施例を示す構成
図、第2図及び第3図は、照合単語の単語数と得点の関
係を説明するための図である。 1……マイクロフォン,2……アンプ,3……特徴抽出部,4
……音声区間検出部,5……入力パターン部,6……類似度
計算部,7……辞書,8……平均値検出部,9……リジェクト
値決定部,10……リジェクト部。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された音声をあるサンプル周期で特徴
    抽出する手段と、音声パワーより音声区間を検出する手
    段と、辞書と比較して類似度を求める手段と、その得点
    の最大となる単語を認識結果の候補とする手段と、その
    類似度があるリジェクト閾値より大なる場合は認識結果
    として出力する手段と、小なる場合にはリジェクトする
    手段を有する不特定話者音声認識装置において、あらか
    じめ決められた単語を話者に発声させ、その類似度の平
    均値を求める手段と、話者に適応したリジェクト閾値
    を、話者が発声した単語の類似度の平均値にデータベー
    スのリジェクト閾値を乗し、データベースの単語の類似
    度の平均で除す手段とを有することを特徴とする不特定
    話者音声認識装置。
JP62143665A 1987-06-08 1987-06-08 不特定話者音声認識装置 Expired - Lifetime JP2644494B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62143665A JP2644494B2 (ja) 1987-06-08 1987-06-08 不特定話者音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62143665A JP2644494B2 (ja) 1987-06-08 1987-06-08 不特定話者音声認識装置

Publications (2)

Publication Number Publication Date
JPS63306499A JPS63306499A (ja) 1988-12-14
JP2644494B2 true JP2644494B2 (ja) 1997-08-25

Family

ID=15344086

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62143665A Expired - Lifetime JP2644494B2 (ja) 1987-06-08 1987-06-08 不特定話者音声認識装置

Country Status (1)

Country Link
JP (1) JP2644494B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2180392C (en) * 1995-07-31 2001-02-13 Paul Wesley Cohrs User selectable multiple threshold criteria for voice recognition
JP2005181439A (ja) * 2003-12-16 2005-07-07 Nissan Motor Co Ltd 音声認識装置
CN111583907B (zh) * 2020-04-15 2023-08-15 北京小米松果电子有限公司 信息处理方法、装置及存储介质

Also Published As

Publication number Publication date
JPS63306499A (ja) 1988-12-14

Similar Documents

Publication Publication Date Title
TWI466101B (zh) 語音識別方法及系統
EP0411290A2 (en) Method and apparatus for extracting information-bearing portions of a signal for recognizing varying instances of similar patterns
US20200135211A1 (en) Information processing method, information processing device, and recording medium
US20220383880A1 (en) Speaker identification apparatus, speaker identification method, and recording medium
CN111179919B (zh) 一种确定失语类型的方法及装置
JP2002536691A5 (ja)
JP2644494B2 (ja) 不特定話者音声認識装置
JP2829014B2 (ja) 音声認識装置及び方法
JP2996019B2 (ja) 音声認識装置
EP3496092B1 (en) Voice processing apparatus, voice processing method and program
JP2502880B2 (ja) 音声認識方法
JP2011081324A (ja) ピッチ・クラスター・マップを用いた音声認識方法
JPS61180297A (ja) 話者照合装置
Pinheiro et al. Type-2 fuzzy GMMs for robust text-independent speaker verification in noisy environments
JP2658104B2 (ja) 音声認識装置
JPH0997095A (ja) 音声認識装置
JPS6336678B2 (ja)
JP3704080B2 (ja) 音声認識方法及び音声認識装置並びに音声認識プログラム
JPH02300800A (ja) 音声認識装置
JPH10214096A (ja) 話者認識装置
JPH06100918B2 (ja) 音声認識装置
JPS59189398A (ja) 連続音声認識方式
JPH0316038B2 (ja)
JPS59124394A (ja) 単音節音声認識方式
JPH0816186A (ja) 音声認識装置