JPS6265088A - 不特定話者用音声認識装置 - Google Patents

不特定話者用音声認識装置

Info

Publication number
JPS6265088A
JPS6265088A JP60204916A JP20491685A JPS6265088A JP S6265088 A JPS6265088 A JP S6265088A JP 60204916 A JP60204916 A JP 60204916A JP 20491685 A JP20491685 A JP 20491685A JP S6265088 A JPS6265088 A JP S6265088A
Authority
JP
Japan
Prior art keywords
speech
dictionary
recognition
input speech
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60204916A
Other languages
English (en)
Inventor
章次 栗木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP60204916A priority Critical patent/JPS6265088A/ja
Publication of JPS6265088A publication Critical patent/JPS6265088A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 1孟分立 本発明は、不特定話者用の音声認識装置に関する。
従IL逝 一般に、不特定話者用の辞書はメーカーがユーザーに提
供する場合が多いが、この場合、辞書登録時と実際にユ
ーザーが使用する場合の認識時では環境が異なり、特に
、騒音レベルの違いは音声区間検出の違いとなるため誤
認識の大きな原因となる。
旦迫 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、不特定話者用音声認識装置において、辞書登録時
と認識時の環境の差を少なくし、もって、認識率の向上
を図ることを目的としてなされたものである。
1基 本発明は、上記目的を達成するため、入力された音声を
あるサンプル周期で特徴抽出し、あらかじめ登録されて
いる辞書データと認識処理を行い、最も高い類似度を持
つ単語をその結果として出力する手段と、入力音声のパ
ワー成分より音声区間′を検出する手段とを有する不特
定話者用音声認識装置において、各単語に対し認識時の
環境を想定した数種のノイズレベルを加えた入力音声で
辞書登録を行い、認識時にはノイズレベルが異なったマ
ルチテンプレート辞書として認識処理を行う事、或いは
、各単語に対し!?!1111時の環境を想定した数種
類のノイズレベルを加えた入力音声で辞書登録を行い、
認識時にはノイズレベルが等しい単語を同一クラスタと
して、ノイズレベルによってクラスタ分けを行い、使用
者の指示により、ある特定のクラスタ内のみで認識処理
を行う事を特徴としたものである。以下、本発明の実施
例に基づいて説明する。
第2図は、音声区間検出部の一例を示す図で(a)は音
声パワー、 (b)は特徴データを示すが、一般に、騒
音が太き(なると音声切り出し闇値が上昇する様な可変
闇値構成が用いられている。
そのため、第2図に示す様に辞書登録時の闇値T。
と認識時の闇値下Rがそれぞれの環境の騒音が異なる事
により違っていた場合、図示のように、音声区間に差が
できる。すなわち、第2図(b)の斜線の部分が認識時
には特徴データが無い事となる。そのため、線形伸縮や
DPのような非線形伸縮を行っても本来の辞書の内容と
合わないため誤認識が起こりやすい、実際の騒音レベル
をみると、雑音の少ない所と通常のオフィスで約20d
B、また、オフィスと倉庫とでは20dB程のレベルの
差がある。そのため、大まかに環境を分けて、本実施例
では3種類の環境を想定している。
第3図は、不特定話者用の辞書を作成する場合の一例を
示す図で、図中、lはテープデツキ又はマイク、2はピ
ンクノイズジェネレータ、3はミキサ、4は特徴抽出部
、5は音声区間検出部、6は辞書登録部、7は辞書で、
マンクlからの良い環境での音声にピンクノイズジェネ
レータ2からの騒音の代わりとしてピンクノイズをミキ
サ3で付加する。このピンクノイズのレベルは上記オフ
ィス、倉庫の騒音レベルに合わせて設定する。この雑音
を付加された音声で辞書登録を行う。
第4図は、上述のごとくして作成された辞書の一例を示
す図で、図中、Aは特徴データ部、Bはクラスタ部で、
図示例の場合、1つの単語に対してaft!類の辞書が
作成され、各単語についてはθ〜2までのクラスタ番号
が付けられ、同一クラスタ番号は同一ノイズレベルを付
加した単語辞書となっている。
本発明は、上述のようにしてあらかじめ認識時の騒音を
想定してノイズを加えた辞書を用意し、この辞書を用い
て音声認識をして認識率を向上させようとするものであ
る。
第1図は、本発明の一実施例を説明するための電気的ブ
ロック線図で、図中、11はマイク、 12はアンプ、
13は特徴抽出部、14は音声区間検出部、15は認識
部、16は結果出力部、17は辞書、18は切り換え部
で、音声認識に際して、以下に説明するような2つの方
法が考えられる。
その1つは、クラスタの内容を無視して入力音声との認
識をおこなうもので、認識時の環境が変化しても1つの
単語で3種類の辞書があるため、最も環境に近い辞書が
類似度が高くなり、選び出される。本実施例では3種類
の辞書を持ったマルチテンプレートとなる。他のひとつ
は認識時に使用者に自分の環境によって切り換え部18
のSWIを選ばせるもので、これによって例えばオフィ
スを選んだ場合には、その環境を想定した辞書のクラス
タ番号の同じものとしか認識をしない。そのため前記の
方法に比べて認識対照辞書が1/3となり処理スピード
が向上する。実際に使用者の環境はそれ程度化しないの
で、十分対応する事ができる。
立来 以上の説明から明らかなように、本発明によると、不特
定話者用辞書に対する環境の変化による適応性を上げ、
認識率を向上することができる。
【図面の簡単な説明】
第1図は、本発明の一実施例を説明するための電気的ブ
ロック線図、第2図は、音声区間検出法の一例を説明す
るための図、第3図は、不特定話者用辞書作成法の一例
を示す図、第41!lは、不特定話者用辞書の一例を示
す図である。 11・・・マイク、12・・・アンプ、13・・・特徴
抽出部。 14・・・音声区間検出部、15・・・認識部、16・
・・結果出力部、17・・・辞書、18・・・切り換え
部。

Claims (2)

    【特許請求の範囲】
  1. (1)、入力された音声をあるサンプル周期で特徴抽出
    し、あらかじめ登録されている辞書データと認識処理を
    行い、最も高い類似度を持つ単語をその結果として出力
    する手段と、入力音声のパワー成分より音声区間を検出
    する手段とを有する不特定話者用音声認識装置において
    、各単語に対し認識時の環境を想定した数種のノイズレ
    ベルを加えた入力音声で辞書登録を行い、認識時にはノ
    イズレベルが異なったマルチテンプレート辞書として認
    識処理を行う事を特徴とする不特定話者用音声認識装置
  2. (2)、入力された音声をあるサンプル周期で特徴抽出
    し、あらかじめ登録されている辞書データと認識処理を
    行い、最も高い類似度を持つ単語をその結果として出力
    する手段と、入力音声のパワー成分より音声区間を検出
    する手段とを有する不特定話者用音声認識装置において
    、各単語に対し認識時の環境を想定した数種類のノイズ
    レベルを加えた入力音声で辞書登録を行い、認識時には
    ノイズレベルが等しい単語を同一クラスタとして、ノイ
    ズレベルによってクラスタ分けを行い、使用者の指示に
    より、ある特定のクラスタ内のみで認識処理を行う事を
    特徴とする不特定話者用音声認識装置。
JP60204916A 1985-09-17 1985-09-17 不特定話者用音声認識装置 Pending JPS6265088A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60204916A JPS6265088A (ja) 1985-09-17 1985-09-17 不特定話者用音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60204916A JPS6265088A (ja) 1985-09-17 1985-09-17 不特定話者用音声認識装置

Publications (1)

Publication Number Publication Date
JPS6265088A true JPS6265088A (ja) 1987-03-24

Family

ID=16498500

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60204916A Pending JPS6265088A (ja) 1985-09-17 1985-09-17 不特定話者用音声認識装置

Country Status (1)

Country Link
JP (1) JPS6265088A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01319099A (ja) * 1988-06-17 1989-12-25 Matsushita Electric Ind Co Ltd 音声認識装置
JPH02118699A (ja) * 1988-10-28 1990-05-02 Matsushita Electric Ind Co Ltd 音声認識装置
JPH03110599A (ja) * 1989-09-26 1991-05-10 Matsushita Electric Ind Co Ltd 音声認識方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01319099A (ja) * 1988-06-17 1989-12-25 Matsushita Electric Ind Co Ltd 音声認識装置
JPH02118699A (ja) * 1988-10-28 1990-05-02 Matsushita Electric Ind Co Ltd 音声認識装置
JPH03110599A (ja) * 1989-09-26 1991-05-10 Matsushita Electric Ind Co Ltd 音声認識方法

Similar Documents

Publication Publication Date Title
CN110767233A (zh) 一种语音转换系统及方法
JPS62115199A (ja) 音声応答装置
JPS6265088A (ja) 不特定話者用音声認識装置
JPS59137999A (ja) 音声認識装置
US20030046084A1 (en) Method and apparatus for providing location-specific responses in an automated voice response system
JPS6265087A (ja) 不特定話者用音声認識装置
JPS613241A (ja) 音声確認方式
JP2975808B2 (ja) 音声認識装置
EP0886854A4 (en) USER-INDEPENDENT REAL-TIME VOICE RECOGNITION SYSTEM AND METHOD
JPS61228498A (ja) 音声認識装置
JPS6235120Y2 (ja)
JPS61261798A (ja) 音声認識装置
JPS61183699A (ja) 音声認識装置
JPS62164097A (ja) 音声判別方式
JPH04276799A (ja) 音声認識システム
JPH0535440A (ja) 文書自動作成装置
JPS5872994A (ja) 信号入力装置
JPS62102296A (ja) 音声編集装置
JPS6165298A (ja) 音声認識装置
JPH01158499A (ja) 定常雑音除去方式
JPS61239359A (ja) 音声入力式文章作成装置
JPH04275600A (ja) 音声認識装置
JPS6078489A (ja) 辞書更新方式
JPH0261847A (ja) テープデッキ装置
JPS60169696U (ja) 音声入力による移調装置