JPH0556519B2 - - Google Patents

Info

Publication number
JPH0556519B2
JPH0556519B2 JP60265502A JP26550285A JPH0556519B2 JP H0556519 B2 JPH0556519 B2 JP H0556519B2 JP 60265502 A JP60265502 A JP 60265502A JP 26550285 A JP26550285 A JP 26550285A JP H0556519 B2 JPH0556519 B2 JP H0556519B2
Authority
JP
Japan
Prior art keywords
voice
input
speaker
registered
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60265502A
Other languages
English (en)
Other versions
JPS62124599A (ja
Inventor
Takaaki Ishii
Toru Kuge
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP60265502A priority Critical patent/JPS62124599A/ja
Priority to US06/933,213 priority patent/US4873714A/en
Priority to DE8686116299T priority patent/DE3687450T2/de
Priority to EP86116299A priority patent/EP0225538B1/en
Priority to CA000523744A priority patent/CA1298662C/en
Priority to KR1019860009994A priority patent/KR900009169B1/ko
Publication of JPS62124599A publication Critical patent/JPS62124599A/ja
Priority to US07/398,939 priority patent/US4949374A/en
Priority to US07/825,421 priority patent/US5182765A/en
Publication of JPH0556519B2 publication Critical patent/JPH0556519B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、特定話者の音声を認識する音声認識
装置の改良に関する。
〔発明の技術的背景〕
近年、情報入力手段の一つとして音声認識方式
が使用され始めているが、従来の音声認識装置
は、例えば第3図に示す如く入力音声を予め記憶
してある登録音声と比較する音声認識回路1と、
この音声認識回路1に対し登録音声および入力音
声を入力するためのマイクロホン2と、上記音声
認識回路1の比較結果から音声認識のための所定
の処理を行なう処理回路(CPU)3とから構成
される。尚、4は音声認識回路1およびCPU3
に対し音声登録モードか音声認識モードかを指定
するためのモード指定スイツチである。この様な
装置を使用するには、先ずモード指定スイチチ4
により音声登録モードを指定し、この状態で話者
がマイクロホン2より音声を単語または文節単位
で入力し、この音声を音声認識回路1内のRAM
に記憶させる。そしてモード指定スイツチ4を音
声認識モード側に切換え、音声認識モードを設定
する。しかして、この状態で話者がマイクロホン
2により音声を入力すると、この音声は音声認識
回路1で上記RAMに記憶されている登録音声と
比較され、その結果がCPU3に導かれてこの
CPU3で認識処理がなされる。このような装置
であれば、オペレータは手足を使わずに情報入力
や指示を与えることができるので、例えば自動車
電話のダイヤル番号入力手段に適用すると極めて
有用である。
〔背景技術の問題点〕
ところが、この様な従来の装置は、各単語また
は文節毎にそれを表わす1種類の音声を登録し、
入力音声との比較を行なつているため、例えば同
じ話者であつてもその発声方法が異なつたり周囲
雑音があると、入力音声の特性が登録音声の特性
と微妙に異なつて認識されないことがあり、認識
確率が低かつた。特に自動車電話の入力手段とし
て使用した場合は、密閉された狭空間である車内
で使用するため音質が変化し易く、また走行雑音
等により音声の特性が変化し易いため、認識確率
を高めることが非常に難しかつた。
〔発明の目的〕
本発明は、話者の音声がその発声方法や周囲雑
音等の影響により変化しても確実に認識できるよ
うにし、これにより認識率の向上を図り得る音声
認識装置を提供することを目的とする。
〔発明の概要〕
本発明は、上記目的を達成するために、音声登
録時に話者から入力される音声に対して、それぞ
れ通過特性の異なる特性可変回路を介しそれぞれ
特性の異なる複数の変形音声を生成し、これら複
数の変形音声を登録音声として記憶しておき、話
者から入力された入力音声を上述の登録音声とし
て記憶された複数の変形音声と比較することによ
り入力音声の認識を行うようにしたものである。
〔発明の実施例〕
第1図は本発明の一実施例における音声認識装
置の構成を示すブロツク図で、前記第3図と同一
部分には同一符号を付してある。この装置は、音
声認識手段として、複数の音声認識回路11〜1
nおよびこれらの音声認識回路11〜1nに対応
して設けられた複数の特性可変回路51〜5nを
有している。先ず各音声認識回路11〜1nは、
それぞれ内蔵された音声登録用のRAMに、各単
語または文節毎にそれを表わす音声の複数の変形
パターンを各々記憶したものである。ここで、上
記音声の変形パターンとしては、例えば音量の大
小や音の長短が異なるもの、音程の変化やかすれ
やこもり等が生じて音質が変化したもの等、音声
の特性が個々に異なるものが用意される。一方上
記各特性可変回路51〜5nは、それぞれ増幅度
や帯域通過特性が異なる増幅器(または抵抗減衰
器)およびフイルタから構成され、音声登録モー
ド時にそれぞれマイクロホン2から入力された音
声の変形パターンを作成して、この変形パターン
を対応する音声認識回路11〜1nに登録させる
ものである。
この様な構成であるから、先ず音声登録を行な
う場合は、モード指定スイツチ4を音声登録モー
ド側に設定して特性可変回路51〜5nおよび音
声認識回路11〜1nを音声登録モードに設定す
る。そしてこの状態で、話者がマイクロホン2か
ら認識対象である所望の単語の音声を入力する。
そうすると、この音声信号は分岐されて各特性可
変回路51〜5nにそれぞれ導入され、これらの
特性可変回路51〜5nでその増幅度および帯域
通過特性に応じた音声変形が施される。例えば、
“One”という単語の音声を入力したとすれば、
この“One”について音量や音の長さ、音程、音
質等の特性が各々異なる変形処理が施される。す
なわち、各特性可変回路51〜5nでは、1個の
音声について特性を故意に変化させた各々異なる
n種類の変形音声が作成される。そうして作成さ
れた各変形音声信号は、それぞれ対応する音声認
識回路11〜1nに導かれ、これらの回路の音声
登録用のRAMに記憶される。かくして、1つの
単語の音声登録がなされる。以下、他の単語や文
節についても全く同様の動作によりそれぞれ登録
が行なわれる。
さて、この様な装置において音声認識を行なわ
せる場合は、モード指定スイツチを音声認識モー
ド側に設定する。そして、この状態で話者がマイ
クロホン2から音声を入力すると、この音声信号
は分岐されたのち各特性可変回路51〜5nをそ
れぞれそのまま通過して各音声認識回路11〜1
nに導入される。そうすると、これらの音声認識
回路11〜1nではそれぞれ上記入力音声と
RAMに記憶してある登録音声との音声パターン
の比較が行なわれ、その比較結果がそれぞれデー
タバス30aを介してCPU30に導かれる。そ
してCPU30で、上記各音声認識回路11〜1
nの比較結果に基づいて音声の認識処理が行なわ
れる。例えば、各比較結果のうちに一つでも音声
パターンが一致したことを表わす認識データがあ
れば、このデータから入力音声を認識する。
このように本実施例であれば、複数の音声認識
回路11〜1nを設けて、これらの音声認識回路
11〜1nに、一つの音声について特性を個々に
異ならせた複数の変形音声をそれぞれ登録して入
力音声の比較を行なうようにしたので、例えば話
者の音声が風邪等により変化した場合や周囲雑音
の影響により変化した場合でも、音声を高確率で
認識することができ、これにより認識率を大幅に
高めることができる。したがつて、音声の音質等
が変化し易い、例えば自動車内で使用する場合で
も、車内の音響特性や走行雑音等の影響を低減し
て確率の高い音声認識が可能となる。また、本実
施例であれば、音声認識回路11〜1nに対応し
て変形音声作成用の特性可変回路51〜5nを設
けたことによつて、音声登録時に話者は、従来通
り各単語や文節について1回ずつ音声入力を行な
えばよく、この結果、音声認識を実行するための
登録音声も簡単にセツトすることができ、音声認
識の利用を簡単にできるなど、使い勝手の点でも
飛躍的な向上を図ることができる。
尚、本発明は上記実施例に限定されるものでな
い。例えば、上記実施例では音声認識回路11〜
1n毎に特性可変回路51〜5nを設けて複数の
変形音声を作成し登録するようにしたが、第2図
に示す如く特性可変回路を設けずに話者が直接各
変形音声をマイクロホン2から入力することによ
り登録するようにしてもよい。その他、変形音声
の数や種類、変形音声の登録手段、音声の認識手
段等についても、本発明の要旨を逸脱しない範囲
で種々変形して実施できる。
〔発明の効果〕
以上詳述したように本発明によれば、音声登録
時に話者から入力される音声に対して、それぞれ
通過特性の異なる特性可変回路を介しそれぞれ特
性の異なる複数の変形音声を生成し、これら複数
の変形音声を登録音声として記憶しておき、話者
から入力された入力音声を上述の登録音声として
記憶された複数の変形音声と比較することにより
入力音声の認識を行うようにしたことによつて、
音声登録時に話者から入力される音声に対して、
それぞれ通過特性の異なる特性可変回路を介し
て、例えば音量の大小や音の長短が異なるもの、
音程の変化やかすれやこもりなどが生じて音質が
変化したものなど、それぞれ特性の異なる複数の
変形音声を生成し、これらを登録音声として記憶
することができるとともに、これら登録音声に基
づいて話者から入力された入力音声の認識を行う
ことにより、話者の音声がその発声方法や周囲雑
音等の影響により変化しても確実な音声認識を行
うことができ、これにより認識率の向上を図るこ
とができる。また、音声登録の際の登録音声は、
話者から入力される音声を、通過特性の異なる各
特性可変回路を通過させるだけで、それぞれ特性
の異なる複数の変形音声を登録音声として生成す
ることができるので、音声認識を実行するための
登録音声も簡単にセツトすることができ、音声認
識の利用を簡単にできるなど、使い勝手の点でも
飛躍的な向上を図ることができる。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識装
置の構成を示すブロツク図、第2図は本発明の他
の実施例における音声認識装置の構成を示すブロ
ツク図、第3図は従来の音声認識装置の構成を示
すブロツク図である。 2……マイクロホン、4……モード指定スイツ
チ、11〜1n……音声認識回路、30……
CPU、30a……データバス、51〜5n……
特性可変回路。

Claims (1)

  1. 【特許請求の範囲】 1 話者の音声を登録音声として予め登録してお
    き、上記話者から音声が入力されたときこの音声
    を上記登録音声と比較することにより上記入力音
    声の認識を行う音声認識装置において、 それぞれ通過特性の異なる特性可変回路を有し
    音声登録時に前記話者から入力される音声に対し
    前記特性可変回路を介してそれぞれ特性の異なる
    複数の変形音声を出力する変形音声出力手段と、 この変形音声出力手段より出力される複数の変
    形音声をそれぞれ登録音声として記憶するととも
    に前記話者から入力された音声を前記複数の変形
    音声と比較することにより前記入力音声の認識を
    行う複数の音声認識手段とを具備したことを特徴
    とする音声認識装置。
JP60265502A 1985-11-26 1985-11-26 音声認識装置 Granted JPS62124599A (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
JP60265502A JPS62124599A (ja) 1985-11-26 1985-11-26 音声認識装置
US06/933,213 US4873714A (en) 1985-11-26 1986-11-21 Speech recognition system with an accurate recognition function
DE8686116299T DE3687450T2 (de) 1985-11-26 1986-11-24 Spracherkennungssystem mit genauem erkennungsfunktionieren.
EP86116299A EP0225538B1 (en) 1985-11-26 1986-11-24 Speech recognition system with an accurate recognition function
CA000523744A CA1298662C (en) 1985-11-26 1986-11-25 Speech recognition system with an accurate recognition function
KR1019860009994A KR900009169B1 (ko) 1985-11-26 1986-11-26 적절한 인식기능을 갖춘 음성인식시스템
US07/398,939 US4949374A (en) 1985-11-26 1989-08-28 Speech recognition system with an accurate recognition function
US07/825,421 US5182765A (en) 1985-11-26 1992-01-24 Speech recognition system with an accurate recognition function

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60265502A JPS62124599A (ja) 1985-11-26 1985-11-26 音声認識装置

Publications (2)

Publication Number Publication Date
JPS62124599A JPS62124599A (ja) 1987-06-05
JPH0556519B2 true JPH0556519B2 (ja) 1993-08-19

Family

ID=17418059

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60265502A Granted JPS62124599A (ja) 1985-11-26 1985-11-26 音声認識装置

Country Status (1)

Country Link
JP (1) JPS62124599A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007304852A (ja) * 2006-05-11 2007-11-22 Univ Of Tsukuba 被写体追尾方法及び装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0199093A (ja) * 1987-10-12 1989-04-17 Nec Corp 音声認識用標準パターン作成装置
JPH03203794A (ja) * 1989-12-29 1991-09-05 Pioneer Electron Corp 音声リモートコントロール装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007304852A (ja) * 2006-05-11 2007-11-22 Univ Of Tsukuba 被写体追尾方法及び装置

Also Published As

Publication number Publication date
JPS62124599A (ja) 1987-06-05

Similar Documents

Publication Publication Date Title
EP0799471B1 (en) Information processing system
JPS62232691A (ja) 音声認識装置
JPH0556519B2 (ja)
JPS597998A (ja) 連続音声認識装置
JP2003163951A (ja) 音信号認識システムおよび音信号認識方法並びに当該音信号認識システムを用いた対話制御システムおよび対話制御方法
JPH0225517B2 (ja)
JPH05100693A (ja) 音声認識用コンピユータ・システム
JPS63149699A (ja) 音声入出力装置
JPS6312312B2 (ja)
JPS6126678B2 (ja)
US20020016709A1 (en) Method for generating a statistic for phone lengths and method for determining the length of individual phones for speech synthesis
CN116229987B (zh) 一种校园语音识别的方法、装置及存储介质
JP2975808B2 (ja) 音声認識装置
JPS5914769B2 (ja) 音声機器
JPH06250687A (ja) 不特定話者用音声認識装置
JPS59176791A (ja) 音声登録方式
JPH01179198A (ja) リジェクト方式
CN115132169A (zh) 一种语音转换方法、装置及终端设备
JPS60241096A (ja) 音声情報入出力装置
JPS62217297A (ja) 単語音声認識装置
JPS6032098A (ja) 音声情報入力装置
JPS6120996A (ja) 音声認識装置
JPS60115996A (ja) 音声認識装置
JPS60140396A (ja) 音声ガイダンス方式
Paul Voice-controlled computer software in emergency medicine

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term