JPS62124599A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS62124599A
JPS62124599A JP60265502A JP26550285A JPS62124599A JP S62124599 A JPS62124599 A JP S62124599A JP 60265502 A JP60265502 A JP 60265502A JP 26550285 A JP26550285 A JP 26550285A JP S62124599 A JPS62124599 A JP S62124599A
Authority
JP
Japan
Prior art keywords
voice
input
recognition
speech
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60265502A
Other languages
English (en)
Other versions
JPH0556519B2 (ja
Inventor
久下 亨
孝明 石井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP60265502A priority Critical patent/JPS62124599A/ja
Priority to US06/933,213 priority patent/US4873714A/en
Priority to DE8686116299T priority patent/DE3687450T2/de
Priority to EP86116299A priority patent/EP0225538B1/en
Priority to CA000523744A priority patent/CA1298662C/en
Priority to KR1019860009994A priority patent/KR900009169B1/ko
Publication of JPS62124599A publication Critical patent/JPS62124599A/ja
Priority to US07/398,939 priority patent/US4949374A/en
Priority to US07/825,421 priority patent/US5182765A/en
Publication of JPH0556519B2 publication Critical patent/JPH0556519B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、特定話者の音声を認識する音声認識装置の改
良に関する。
〔発明の技術的背景〕
近年、情報入力手段の一つとして音声認識方式が使用さ
れ始めているが、従来の音声認識装置は、例えば第3図
に示す如く入力音声を予め記憶しである登録音声と比較
する音声認識回路1と、この音声認識回路1に対し登録
音声および入力音声を入力するためのマイクロホン2と
、上記音声認識回路1の比較結果から音声認識のための
所定の処理を行なう処理回路(CPtl)3とから構成
される。尚、4は音声認識回路1およびCPU3に対し
音声登録モードか音声認識モードかを指定するためのモ
ード指定スイッチである。この様な装置を使用するには
、先ずモード指定スイッチ4により音声登録モードを指
定し、この状態で話者がマイクロホン2より音声を単語
または文節単位で入カし、この音声を音声認識回路1内
のRAMに記憶させる。そしてモード指定スイッチ4を
音声認識モード側に切換え、音声認識モードを設定する
しかして、この状態で話者がマイクロホン2により音声
を入力すると、この音声は音声認識回路1で上記RAM
に記憶されている登録音声と比較され、その結果がCP
U3に導かれてこのCPU3で認識処理がなされる。こ
のような装置であれば、オペレータは手足を使わずに情
報入力や指示を与えることができるので、例えば自動車
電話のダイヤル番号入力手段に適用すると極めて有用で
ある。
〔背景技術の問題点〕
ところが、この様な従来の装置は、各単語または文節毎
にそれを表わす1種類の音声を登録し、入力音声との比
較を行なっているため、例えば同じ話者であってもその
発声方法が異なったり周囲雑音があると、入力音声の特
性が登録音声の特性と微妙に異なって認識されないこと
があり、認識確率が低かった。特に自動車電話の入力手
段として使用した場合は、密閉された狭窄間である車内
で使用するため音質が変化し易く、また走行雑音等によ
り音声の特性が変化し易いため、認識確率を高めること
が非常に難しかった。
〔発明の目的〕
本発明は、話者の音声がその発声方法や周囲雑音等の影
響により変化しても確実に認識できるようにし、これに
より認識率の向上を図り得る音声認識装置を提供するこ
とを目的とする。
〔発明の概要〕
本発明は、上記目的を達成するために、音声毎に作成さ
れた互いに特性の異なる複数の変形音声をそれぞれ登録
音声として記憶した複数の音声認識手段を設け、話者か
ら入力された音声を前記各音声認識手段にそれぞれ導い
て前記変形音声と比較し、その各比較結果から前記入力
音声の認識を行なうようにしたものである。
〔発明の実施例〕
第1図は本発明の一実施例における音声認識装置の構成
を示すブロック図で、前記第3図と同一部分には同一符
号を付しである。この装置は、音声認識手段として、複
数の音声認識回路11〜1nおよびこれらの音声認識回
路11〜1nに対応して設けられた複数の特性可変回路
51〜5nを有している。先ず各音声認識回路11〜1
nは、それぞれ内蔵された音声登録用のRAMに、各単
語または文節毎にそれを表わす音声の複数の変形パター
ンを各々記憶したものである。ここで、上記音声の変形
パターンとしては、例えば音量の大小や音の長短が異な
るもの、音程の変化やかすれやこもり等が生じて音質が
変化したもの等、音声の特性が個々に異なるものが用意
される。一方上記各特性可変回路51〜5nは、それぞ
れ増幅度や帯域通過特性が異なる増幅器(または抵抗減
衰器)およびフィルタから構成され、音声登録モード時
にそれぞれマイクロホン2から入力された音声の変形パ
ターンを作成して、この変形パターンを対応する音声認
識回路11〜1nに登録させるものである。
この様な構成であるから、先ず音声登録を行なう場合は
、モード指定スイッチ4を音声登録モード側に設定して
特性可変回路51〜5nおよび音声認識回路11〜1n
を音声登録モードに設定する。そしてこの状態で、話者
がマイクロホン2から認識対象である所望の単語の音声
を入力する。
そうすると、この音声信号は分岐されて各特性可変回路
51〜5nにそれぞれ導入され、これらの特性可変回路
51〜5nでその増幅度および帯域通過特性に応じた音
声変形が施される。例えば、“On e ”という単語
の音声を入力したとすれば、この°゛○n e ”につ
いて音量や音の長さ、音程、音質等の特性が各々異なる
変形処理が施される。
すなわち、各特性可変回路51〜5 nでは、1個の音
声について特性を故意に変化させた各々異なるn種類の
変形音声が作成される。そうして作成された各変形音声
信号は、それぞれ対応する音声認識回路11〜1nに導
かれ、これらの回路の音声登録用のRAMに記憶される
。かくして、1つの単語の音声登録がなされる。以下、
他の単語や文節についても全く同様の動作によりそれぞ
れ登録が行なわれる。
さて、この様な装置において音声認識を行なわせる場合
は、モード指定スイッチを音声認識モード側に設定する
。そして、この状態で話者がマイクロホン2から音声を
入力すると、この音声信号は分岐されたのち各特性可変
回路51〜5nをそれぞれそのまま通過して各音声認識
回路11〜1nに導入される。そうすると、これらの音
声認識回路11〜1nではそれぞれ上記入力音声とRA
 Mに記憶しである登録音声との音声パターンの比較が
行なわれ、その比較結果がそれぞれデータバス30aを
介してCPU30に導かれる。そしてCPU30で、上
記各音声認識回路11〜1nの比較結果に基づいて音声
の認識処理が行なわれる。例えば、各比較結果のうちに
一つでも音声パターンが一致したことを表わす認識デー
タがあれば、このデータから入力音声を認識する。
このように本実施例であれば、複数の音声認識回路11
〜1nを設けて、これらの音声認識回路11〜1nに、
一つの音声について特性を個々に異ならせた複数の変形
音声をそれぞれ登録して入力音声の比較を行なうように
したので、例えば話者の音声が風邪等により変化した場
合や周囲雑音の影響により変化した場合でも、音声を高
確率で認識することができ、これにより認識率を大幅に
高めることができる。したがって、音声の音質等が変化
し易い1例えば自動車内で使用する場合でも、車内の音
響特性や走行雑音等の影響を低減して確率の高い音声認
識が可能となる。また、本実施例であれば、音声認識回
路11〜1nに対応して変形音声作成用の特性可変回路
51〜5nを設けたことによって、音声登録時に話者は
、従来通り各単語や文節について1回ずつ音声入力を行
なえばよく、この結果音声登録操作を極めて簡単に行な
うことができる。
尚、本発明は上記実施例に限定されるものではない。例
えば、上記実施例では音声認識回路11〜1n毎に特性
可変回路51〜5nを設けて複数の変形音声を作成し登
録するようにしたが、第2図に示す如く特性可変回路を
設けずに話者が直接各変形音声をマイクロホン2から入
力することにより登録するようにしてもよい。その他、
変形音声の数や種類、変形音声の登録手段、音声の認識
手段等についても、本発明の要旨を逸脱しない範囲で種
々変形して実施できる。
〔発明の効果〕
以上詳述したように本発明によれば、音声毎に作成され
た互いに特性の異なる複数の変形音声をそれぞれ登録音
声として記憶した複数の音声認識回路段を設け、話者か
ら入力された音声を前記各音声認識手段にそれぞれ導い
て前記変形音声と比較し、その各比較結果から前記入力
音声の認識を行なうようにしたことによって、話者の音
声がその発声方法や周囲雑音等の影響により変化しても
確実に認識することができ、これにより認識率の向上を
図り1qる音声認識装置を提供することができる。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識装置の構成
を示すブロック図、第2図は本発明の他の実施例におけ
る音声認識装置の構成を示すブロック図、第3図は従来
の音声認識装置の構成を示すブロック図である。 2・・・マイクロホン、4・・・モード指定スイッチ、
11〜1n・・・音声認識回路、30・・・CPU、3
0a・・・データバス、51〜5n・・・特性可変回路
。 出願人代理人 弁理士 鈴江武彦 第1図 第3図

Claims (2)

    【特許請求の範囲】
  1. (1)話者の音声を登録音声として予め登録しておき、
    上記話者から音声が入力されたときこの音声を上記登録
    音声と比較することにより上記入力音声の認識を行なう
    音声認識装置において、音声毎に作成された互いに特性
    の異なる複数の変形音声をそれぞれ登録音声として記憶
    した複数の音声認識手段を設け、話者から入力された音
    声を前記各音声認識手段にそれぞれ導いて前記変形音声
    と比較し、その各比較結果から前記入力音声の認識を行
    なうようにしたことを特徴とする音声認識装置。
  2. (2)複数の音声認識手段は、それぞれ通過特性の異な
    る特性可変回路を備え、音声登録時に入力音声を上記特
    性可変回路に供給して特性を変化させ、この特性の変化
    した音声を登録音声として記憶部に記憶するようにした
    ものである特許請求の範囲第(1)項記載の音声認識装
    置。
JP60265502A 1985-11-26 1985-11-26 音声認識装置 Granted JPS62124599A (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
JP60265502A JPS62124599A (ja) 1985-11-26 1985-11-26 音声認識装置
US06/933,213 US4873714A (en) 1985-11-26 1986-11-21 Speech recognition system with an accurate recognition function
DE8686116299T DE3687450T2 (de) 1985-11-26 1986-11-24 Spracherkennungssystem mit genauem erkennungsfunktionieren.
EP86116299A EP0225538B1 (en) 1985-11-26 1986-11-24 Speech recognition system with an accurate recognition function
CA000523744A CA1298662C (en) 1985-11-26 1986-11-25 Speech recognition system with an accurate recognition function
KR1019860009994A KR900009169B1 (ko) 1985-11-26 1986-11-26 적절한 인식기능을 갖춘 음성인식시스템
US07/398,939 US4949374A (en) 1985-11-26 1989-08-28 Speech recognition system with an accurate recognition function
US07/825,421 US5182765A (en) 1985-11-26 1992-01-24 Speech recognition system with an accurate recognition function

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60265502A JPS62124599A (ja) 1985-11-26 1985-11-26 音声認識装置

Publications (2)

Publication Number Publication Date
JPS62124599A true JPS62124599A (ja) 1987-06-05
JPH0556519B2 JPH0556519B2 (ja) 1993-08-19

Family

ID=17418059

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60265502A Granted JPS62124599A (ja) 1985-11-26 1985-11-26 音声認識装置

Country Status (1)

Country Link
JP (1) JPS62124599A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0199093A (ja) * 1987-10-12 1989-04-17 Nec Corp 音声認識用標準パターン作成装置
JPH03203794A (ja) * 1989-12-29 1991-09-05 Pioneer Electron Corp 音声リモートコントロール装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4843787B2 (ja) * 2006-05-11 2011-12-21 国立大学法人 筑波大学 被写体追尾方法及び装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0199093A (ja) * 1987-10-12 1989-04-17 Nec Corp 音声認識用標準パターン作成装置
JPH03203794A (ja) * 1989-12-29 1991-09-05 Pioneer Electron Corp 音声リモートコントロール装置

Also Published As

Publication number Publication date
JPH0556519B2 (ja) 1993-08-19

Similar Documents

Publication Publication Date Title
JPS62232691A (ja) 音声認識装置
JPS62124599A (ja) 音声認識装置
JPS63149699A (ja) 音声入出力装置
JPH05100693A (ja) 音声認識用コンピユータ・システム
JPS59137999A (ja) 音声認識装置
KR100280873B1 (ko) 음성인식 시스템
EP1426924A1 (en) Speaker recognition for rejecting background speakers
JPS6126678B2 (ja)
JPS61239358A (ja) 音声入力による文書作成方式
JP2975808B2 (ja) 音声認識装置
JPS63157199A (ja) 話者照合装置
CN116798408A (zh) 语音识别方法、终端设备及计算机可读存储介质
JPS59185400A (ja) 単音節音声認識方式
JPS6120996A (ja) 音声認識装置
JPS59176791A (ja) 音声登録方式
JPS59124398A (ja) 音声登録方法
JPS60115996A (ja) 音声認識装置
JPS62217297A (ja) 単語音声認識装置
JPS61281298A (ja) 音声認識装置
JPS6287994A (ja) 音声認識辞書更新方式
JPH04301695A (ja) 音声認識装置の辞書制御方式
JPH0322169A (ja) 中国語入力方式
JPS60241096A (ja) 音声情報入出力装置
JPS6167897A (ja) 音声認識装置
JPS63281196A (ja) 音声認識装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term