JPH0225517B2 - - Google Patents

Info

Publication number
JPH0225517B2
JPH0225517B2 JP55180865A JP18086580A JPH0225517B2 JP H0225517 B2 JPH0225517 B2 JP H0225517B2 JP 55180865 A JP55180865 A JP 55180865A JP 18086580 A JP18086580 A JP 18086580A JP H0225517 B2 JPH0225517 B2 JP H0225517B2
Authority
JP
Japan
Prior art keywords
pattern
speaker
input
register
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP55180865A
Other languages
English (en)
Other versions
JPS57104193A (en
Inventor
Hidekazu Yabuchi
Hidefumi Ooga
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP55180865A priority Critical patent/JPS57104193A/ja
Publication of JPS57104193A publication Critical patent/JPS57104193A/ja
Publication of JPH0225517B2 publication Critical patent/JPH0225517B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は複数話者の音声に対して認識を行なう
音声認識装置に関するもので、その目的とすると
ころは音声認識装置に話者が誰であるかを音声に
より指定する機能を保有させ、認識時には指定さ
れた話者の標準パタンとのみパタンマツチングを
行なつて計算量を減少させることと、随時に話者
変更を許すことにより同時に複数の話者が音声認
識装置を使用することを可能にしようとするもの
である。
従来から音声認識の手法としては、各種のもの
があるが、一般に特定話者タイプと不特定話者タ
イプに2分される。
本発明は特定話者タイプに属するので、以下こ
れにつき説明する。特定話者タイプの音声認識で
は予め話者の音声を標準パタンとして記憶させ、
後から入力される音声の特徴パタンがどの標準パ
タンに最も類似しているかをパタンマツチング手
法により決定することが一般に行なわれている。
この手法における最大の問題点は話者が変わる毎
に標準パタンを変更しなければならず、それに要
する手間が大きいことであつた。これを解決する
一手法としては装置を使用するすべての話者の標
準パタンを記憶しておき、入力パタンとすべての
標準パタンのパタンマツチングを行なつて最も類
似度の大きいものを探し出すことが考えられる
が、この方法ではパタンマツチングの計算量が話
者数にほぼ比例して増加するという欠点を有す
る。
本発明は上記のような欠点を解消したもので、
以下一実施例として示した図を用いて構成を説明
する。
第1図において1は入力音声、2は音声から特
徴パタンを抽出する分析部、3は分析部2の出力
する特徴パタンを保持する入力パタンレジスタ、
4は切換スイツチである。5,6,7はそれぞれ
異なる話者A,B,Cの発声した単語のパタンを
保持する話者パタン部である。8はパタン選択部
で、選択信号12に従つて話者パタン部5,6,
7の中から特定のパタンを選択して、標準パタン
レジスタ9に出力する。10は入力パタンレジス
タ3の内容と標準パタンレジスタ9の内容を入力
とし両者の類似度を計算する類似度計算部、11
は類似度計算部10が出力する類似度から入力音
声1の認識結果13と選択信号12を出力する判
定部である。
第2図は話者Aパタン部の構成を示し、21は
その先頭に格納された話者同定用パタン、22,
23,24はそれぞれ話者Aの単語パタンa,b
…wである。
以下、その動作を説明する。動作は登録モード
と認識モードに2分される。
登録モードでは、例えば切換スイツチ4で入力
パタンレジスタ3と話者Aパタン部5を接続する
ことにより、話者Aが順次発声する単語音声が分
析部2でパタン化され、入力パタンレジスタ3を
経由して話者Aパタン部5に記憶される。話者同
定用パタン21は話者Aのみが発声する単語のパ
タンであり、例えば各人の名前等のように話者に
とつて最も発声し易い単語のパタンが記憶され
る。単語パタン22…24は話者が同定された後
に認識される単語に対応するもので、話者毎に登
録させたい単語のパタンが記憶される。同様に話
者Bはスイツチ4で入力パタンレジスタ3と話者
Bパタン部6を接続することにより、又話者Cは
スイツチ4で入力パタンレジスタ3と話者Cパタ
ン部7を接続することにより各々話者同定用パタ
ンと単語パタンの登録が行なえる。
認識モードでは、次の手順で認識が行なわれ
る。但し例として話者パタン部には話者同定単語
として話者Aに対して「YAMADA」、話者Bに
対して「TANAKA」、話者Cに対して「SAT
O」というローマ字表現に応じた各自の音声パタ
ンがそれぞれ記憶され、それに続いて「ICHI」
「NI」、「SAN」、「OWARI」というローマ字表現
に応じた音声パタンが第3図に示す31…35,
41…45,51…55のように既に記憶されて
いるとする。スイツチ4により入力パタンレジス
タ3を類似度計算部10に接続しておく。認識モ
ードでは先ず話者は自分の話者同定単語を発声す
る。この入力音声が入力パタンレジスタ3に取り
込まれた後、判定部11はそれがどの話者同定パ
タンに最も類似しているかを判断する。即ち選択
信号12により話者同定パタン31を指定して話
者パタン部5から読み出し標準パタンレジスタ9
に保持させる。この後入力パタンレジスタ3の内
容と標準パタンレジスタ9の内容との類似度が類
似度計算部10により計算される。判定部11は
この類似度とその時の選択信号の情報を記憶して
おく。次に判定部11は話者同定パタン41を指
定して前記と同様の処理を行なう。入力パタンレ
ジスタ3の内容と話者同定パタン41の内容の類
似度が計算されるとこの類似度は記憶された前回
の類似度と比較される。新しい類似度が古い類似
度より大である場合は判定部は新しい類似度とそ
の時の選択信号の情報を記憶し、前回の情報を捨
てる。そうでない場合は判定部は前回の情報を保
持する。この処理が話者同定パタン51について
も行なわれ最終的に判定部11は最も大なる類似
度とそれに対応する選択信号の情報を保持する。
判定部11は入力音声が最も大なる類似度に対応
する話者パタンに属するとみなす。この話者同定
が終つた後入力される音声は同定された話者パタ
ン部内の各単語パタンとのみパタンマツチングが
行なわれ、その結果どのパタンに属するのかを示
す情報が認識結果13として出力される。
例えば話者Bが「TANAKA」に相当する音声
を発声すると、その入力パタンは話者同定パタン
31,41,51とのパタンマツチングが行なわ
れ、ほとんどの場合は話者同定パタン41に属す
るとみなされる。あるいは話者同定パタン31,
51と誤認識される場合には誤認識が少なくなる
ように話者同定パタンを登録しなおせばよい。同
定が正しい場合にはその後話者Bが発声する音声
は単語パタン42…45とのパタンマツチングが
行なわれる。そのパタンマツチングの方法は前記
の話者同定単語の場合と同様であるので省略す
る。話者が音声認識装置の使用を中止する時には
最後に「OWARI」に相当する音声を発声する。
この単語がパタン45として認識される時には判
定部11によりそれまでの話者指定が解除され、
判定部11は新たな話者同定単語の入力待ちとな
る。従つてこの時点で話者Aが「YAMADA」
に相当する音声を発声するとこの入力パタンが再
び話者同定パタン31,41,51と比較され前
記と同様の処理を受ける。
上記のように本発明では複数の話者の音声パタ
ンを登録した音声認識装置において話者同定を行
なうことにより、パタンマツチング時には同定さ
れた話者の登録パタンと入力パタンとの間でのみ
類似度計算を行なうために計算量が少なくて済
み、認識結果を得るまでの応答時間が早くなる効
果を生じ、音声入力の高速化に寄与する。さら
に、随時に話者変更ができるので、複数の話者が
音声認識装置を使用することが可能になる。また
本発明は標準パタン群の中に話者指定解除を行な
うための音声パタン(OWARI)を入れているの
で、音声入力のみで確実に本装置の使用を中止す
ることができる。これは本装置を電話からの音声
入力装置に利用した場合に、「TANAKA」さん
についての処理が終了後、「YAMADA」さんに
変わる場合、その電話を一端切つてまたかけなお
すというような手間をかけることなく
「YAMADA」さんに装置を切変えることができ
る等その効果は大きい。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロツク図、
第2図は話者パタン部の構成図、第3図は話者
A,B,Cの話者パタン部の内容例を示す構成
図。 1……入力音声、2……分析部、3……入力パ
タンレジスタ、5,6,7……話者パタン部、8
……パタン選択部、9……標準パタンレジスタ、
10……類似度計算部、11……判定部、12…
…選択信号、13……認識結果。

Claims (1)

    【特許請求の範囲】
  1. 1 入力された音声の特徴値を抽出する分析部
    と、前記分析部の出力を保持する入力パタンレジ
    スタと、話者同定を行なうための音声パタンおよ
    び話者指定解除を行なうための音声パタンを含む
    標準パタン群を話者毎に保持する話者パタン部
    と、前記話者パタン部から選択した標準パタンを
    標準パタンレジスタに送出するパタン選択部と、
    前記入力パタンレジスタの内容と前記標準パタン
    レジスタの内容の類似度を計算する類似度計算部
    と、前記類似度計算部の出力に基いて前記パタン
    選択部へ選択信号を出力するとともに認識結果を
    出力する判定部とからなり、パタンマツチングに
    先立ち話者同定によるパタン選択をするようにし
    たことを特徴とする音声認識装置。
JP55180865A 1980-12-19 1980-12-19 Voice recognizer Granted JPS57104193A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55180865A JPS57104193A (en) 1980-12-19 1980-12-19 Voice recognizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55180865A JPS57104193A (en) 1980-12-19 1980-12-19 Voice recognizer

Publications (2)

Publication Number Publication Date
JPS57104193A JPS57104193A (en) 1982-06-29
JPH0225517B2 true JPH0225517B2 (ja) 1990-06-04

Family

ID=16090701

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55180865A Granted JPS57104193A (en) 1980-12-19 1980-12-19 Voice recognizer

Country Status (1)

Country Link
JP (1) JPS57104193A (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS593494A (ja) * 1982-06-30 1984-01-10 富士通株式会社 音声入力認識装置
JPS602998A (ja) * 1983-06-20 1985-01-09 富士通株式会社 音声認識装置
JPS60129795A (ja) * 1983-12-16 1985-07-11 沖電気工業株式会社 音声認識方式
JPS6135494A (ja) * 1984-07-27 1986-02-19 日本電気株式会社 音声認識処理装置
JPS61130999A (ja) * 1984-11-30 1986-06-18 株式会社神戸製鋼所 音声認識装置
JPS61138999A (ja) * 1984-12-12 1986-06-26 株式会社神戸製鋼所 音声認識装置
JPS61147299A (ja) * 1984-12-20 1986-07-04 松下電器産業株式会社 音声認識装置
US5893057A (en) * 1995-10-24 1999-04-06 Ricoh Company Ltd. Voice-based verification and identification methods and systems
JP3886024B2 (ja) * 1997-11-19 2007-02-28 富士通株式会社 音声認識装置及びそれを用いた情報処理装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4963310A (ja) * 1972-10-19 1974-06-19
JPS51136208A (en) * 1975-05-21 1976-11-25 Fujitsu Ltd Voice recognition device for limited words
JPS5220706A (en) * 1975-08-09 1977-02-16 Fuji Xerox Co Ltd Identification discriminating system by password recitation
JPS5379343A (en) * 1976-12-24 1978-07-13 Hitachi Ltd Speaker identification system
JPS56119199A (en) * 1980-02-26 1981-09-18 Sanyo Electric Co Voice identifying device

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4963310A (ja) * 1972-10-19 1974-06-19
JPS51136208A (en) * 1975-05-21 1976-11-25 Fujitsu Ltd Voice recognition device for limited words
JPS5220706A (en) * 1975-08-09 1977-02-16 Fuji Xerox Co Ltd Identification discriminating system by password recitation
JPS5379343A (en) * 1976-12-24 1978-07-13 Hitachi Ltd Speaker identification system
JPS56119199A (en) * 1980-02-26 1981-09-18 Sanyo Electric Co Voice identifying device

Also Published As

Publication number Publication date
JPS57104193A (en) 1982-06-29

Similar Documents

Publication Publication Date Title
JP4867804B2 (ja) 音声認識装置及び会議システム
US20040098259A1 (en) Method for recognition verbal utterances by a non-mother tongue speaker in a speech processing system
JPH0225517B2 (ja)
US5278911A (en) Speech recognition using a neural net
US20010056345A1 (en) Method and system for speech recognition of the alphabet
JPH0518118B2 (ja)
JP2838848B2 (ja) 標準パターン登録方式
JPH05100693A (ja) 音声認識用コンピユータ・システム
JPS645320B2 (ja)
JPS5934595A (ja) 音声認識処理方式
JPH0194398A (ja) 音声標準パターンの作成方法
JP2000148187A (ja) 話者認識方法、その方法を用いた装置及びそのプログラム記録媒体
JPH0556519B2 (ja)
JPS63229496A (ja) 音声認識用パタ−ン更新方式
WO2021064886A1 (ja) 情報処理装置、プログラム及び情報処理方法
JPS61143798A (ja) 音声ダイヤル装置
JPS6239899A (ja) 会話音声理解方法
JPH04301695A (ja) 音声認識装置の辞書制御方式
JPS59195299A (ja) 特定話者音声認識装置
KR19990081664A (ko) 음성 인식 전화기의 음성 인식 방법
JPS6130280B2 (ja)
JPS61121093A (ja) 音声認識装置
JPH0217038B2 (ja)
JPS5993500A (ja) 音声認識装置
JPS5917597A (ja) 音声認識方式