JPH01191200A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH01191200A
JPH01191200A JP63015560A JP1556088A JPH01191200A JP H01191200 A JPH01191200 A JP H01191200A JP 63015560 A JP63015560 A JP 63015560A JP 1556088 A JP1556088 A JP 1556088A JP H01191200 A JPH01191200 A JP H01191200A
Authority
JP
Japan
Prior art keywords
fingerprint
registered
pattern
voice
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63015560A
Other languages
English (en)
Inventor
Masateru Akaha
正照 赤羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP63015560A priority Critical patent/JPH01191200A/ja
Publication of JPH01191200A publication Critical patent/JPH01191200A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Collating Specific Patterns (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、音声認識装置に関する。
〔発明の概要〕
この発明は、話者の個人特有のものである指紋の判別を
行なって、その話者が、音声登録ならびに指紋登録がな
された登録話者であるか否かを判別し、その話者が登録
話者の場合には、その登録話者が登録した音声パターン
と入力音声パターンとのパターンマツチングを行ない音
声認識を行なうようにし、話者が登録話者であるか否か
の判別を容易に、そして確実にできるようにしたもので
、その登録話者の音声認識の応答性を良くするとともに
その登録話者が登録した秘密情報の専用使用の保持に好
適なものである。
(従来の技術〕 音声は時間軸に沿って変化する現象で、スペクトラム・
パターンが刻々と変化するように音声を発声することに
よって、開存の単語や言葉が生まれる。この人間が発声
する単語や言葉を自動認識する技術が音声認識であるが
、人間の聴覚機能に匹敵するような音声認識を実現する
ことは現在のところ至難のことである。このため、現在
使用されている音声認識の殆んどは、一定の使用条件の
下で、認識対象単語の標準パターンと入カバターンとの
パターンマツチングを行なうことによりなす方法である
第5図はこの音声認識装置の概要を説明するための図で
、マイクロホン(1)よりの音声入力が音響分析回路(
2)に供給される。この音響分析回路偉)では入力音声
パターンの特徴を表わす音響パラメータが抽出される。
そして、この音響分析回路(2)よりの音響パラメータ
は、例えばスイッチからなる切換回路(3)に供給され
る。この回路(3)のスイッチが端子A側に切り換えら
れるときは登録時で、音響パラメータが認識パラメータ
として、標準音声パターンメモ1月4)にストアされる
。つまり、音声認識に先だって話者の音声パターンが標
準パターンとして、このメモ1月4)に記憶される。
一方、切換回路(3)のスイッチが端子B側に切り換え
られるときは認識時である。そして、この認識時は、音
響分析回路(2)からのそのときの入力音声の音響パラ
メータが入力音声パターンメモ1月5)に供給されて一
時スドアされる。そして、この入力音声の音響パラメー
タと、標準音声パターンメモ1月4)から読み出された
複数の認識対象単語の標準音声パターンの音響パラメー
タとが、パターンマツチング回路(6)で比較される。
そして、このパターンマツチング回路(6)にて、入力
音声の音声パターンに最もよく似た標準音声パターンが
検出されろ。
さて、同じ言葉であっても、それを発音した場合、話し
方の違いや発声器官の違いのため、音声の音響的性質は
発声者によって、大きく異なる。
したがって、上述した音声認識装置の標準音声パターン
メモ1月4)に、ある話者の音声パターンを標準パター
ンとして登録した場合、その話者個人専用となり、複数
の話者、つまり不特定話者に対しては、単語の判別が困
難となる。
そこで、一つの単語に対して、複数の話者の音声パター
ンを標準パターンとしてメモリに記憶させ、そして、こ
の標準パターンと入力音声パターンとを比較することに
よって、話者方向の判別度下げ、登録単語方向の判別度
を上げて、単語登録していない話者にも、対応できるよ
うにして、複数の話者を対象とした音声認識が行なわれ
ている。
〔発明が解決しようとする課題〕
ところで、上述したように、一つの単語に対して、複数
の話者の音声パターンを標準パターンとして記憶させ、
話者方向の判別度を下げれば、複数の話者つまり不特定
話者に対する登録単語の判別度は高くなるが、話者の判
別はうまくできなくなってしまう。この場合、例えば、
ある特定の者が機密情報を音声認識装置に記憶したとす
ると、その者の音声であるかどうかが判別できないので
、その機密情報が、他の者にも使用されてしまう危険性
がある。
この危険性を避けるためには、例えば暗号を設定し、こ
の暗号を音声にて、音声認識装置に入力することが考え
られる。しかし、この暗号の発声時には、暗号が他人に
聞きとられる可能性が高く、秘密性の点で適切ではない
。また、例えば暗証番号等をキーにて、音声認識装置に
入力することも考えられるが、これも、秘書性の点で、
確実なものではなく、また、キー人力の煩しさも伴ない
、不適当である。
〔課題を解決するための手段〕
この発明は、標準音声パターンメモリ(9)と、パター
ンマツチング手段(6)と、指紋読取手段(7)と、指
紋登録手段(2)と、指紋判別手段(8)とを備える。
〔作 用〕
複数の話者による共通の複数個の特定単語と、各話者独
自の単語とが標準音声パターンメモリ(9)に登録され
る。そして、単語登録を行なった話者の指紋が指紋登録
手段(2)に登録される。指紋読取手段(7)で読み取
られた指紋が、上記指紋登録手段(ロ)に登録された指
紋であるか否かが、指紋判別手段(8)によって判別さ
れ、登録された指紋であれば、この指紋を有する話者の
音声パターンのみが、バターンマツチング手段(6)に
供給される。
〔実施例〕
第1図は、この発明の一実施例のブロック図であり、例
えば電話機の例である。なお、図において、第5図例と
同等なものには同一符号を付しである。
図において、0旧よハンドセットの送話器のマイクロホ
ン、(7)は指紋読取手段、(8)は指紋判別手段、(
2)は指紋登録メモリ、(9)は標準音声パターンメモ
リ、αのはそのアドレス制御回路、αυはコントローラ
である。
標準音声パターンメモ月9)は、例えば第2図に示すよ
うに、話者r、n、m毎の単語A、B、Cの音声パター
ンが登録された共通パターンメモリ(9A)と、話者、
I、  II、 III毎の秘密情報である独自の単語
x、y、zの音声パターンが登録された専用パターンメ
モリ(9B)とからなる、なお、共通パターンメモリ(
9A)には、秘密ではないが、各話者独自の単語が登録
してあってもよい。この標準音声パターンメモリ(9)
に音声を登録する場合の動作を以下に説明する。
第3図は、音声登録の動作のフローチャートを示す図で
ある。
同図において、ステップ(201)にて、共通パターン
メモリ(9A)への登録か、それとも専用パターンメモ
リ(9B)への登録かが判断される。共通パターンメモ
リ(9A)への登録であれば、ステップ(202)にて
、例えば、ハンドセットに設けられた指紋読取手段(7
)によって指紋認識が行なわれ、第1図に示す指紋登録
メモリ亜にその指紋が登録される。
そしてステップ(205)にて、入力音声パターンが共
通パターンメモリ(9A)に記憶される。また、専用パ
ターンメモリ(9B)への登録であれば、ステップ(2
03)にて、指紋の認識が行なわれ、第1図に示す指紋
登録メモリ(2)にその指紋が登録される。
そして、ステップ(204)にて、入力音声パターンが
専用パターンメモリ(9B)に記憶される。
次に、音声を認識する場合の動作を以下に説明する。
第1図において、まず、話者が電話機のハンドセット(
図示せず)を取り上げる。すると、このハンドセントに
は、指紋読取手段(7)が備えられており、話者がハン
ドセットを握ることによって、この話者の指紋が指紋読
取手段(7)に読取られ、そして、−時的に指紋を示す
信号がこの指紋読取手段(7)に記憶される。そして、
話者が共通モードを示す音声、例えば「キツウツウ」を
マイクロホンα尋に向かって発声すると、音響分析回路
(2)そして、切換回路(3)を介して、発声された音
声に対応した信号が入力音声パターンメモ1月5)に供
給され、−時この入力音声パターンメモリ(5)に記憶
される。
そして、共通パターンメモリ(9A)から読み出された
音声パターンと、入力音声パターンとがパターンマツチ
ング回路(6)に供給され、入力された単語、すなわち
「キツウツウ」が認識される。そして、この認識された
単語に対応した信号がコントローラaυに供給される。
すると、コントローラαυは指紋読取手段(7)および
指紋判別手段(8)に共通モードであることを示す信号
を供給する。すると、指紋読取手段(7)に−時的に記
憶された、話者の指紋を示す信号がこの指紋読取手段(
7)から指紋判別手段(8)に供給される。すると、こ
の指紋判別手段(8)は供給された指紋を示す信号が指
紋登録メモリ(2)に指紋が登録され、そして標準音声
パターンメモリ(9)に音声パターンが登録された登録
話者の指紋を示すものかどうかを判別する。そして、指
紋判別手段(8)は、供給された指紋を示す信号が上記
登録話者を示すものであれば、共通モードであることを
示し、そしてその登録話者を示す信号をアドレス制御回
路α〔に供給する。すると、このアドレス制御回路α〔
は、その登録話者の音声パターンが登録されたアドレス
を示す信号を共通パターンメモリ(9A)に供給する。
すると、この共通パターンメモリ(9A)に登録された
、その登録話者のみの音声パターンが選択される。つま
り、例えば、第2図に示す、共通パターンメモリ(9A
)の例えば、登録話者Iの単語A、B、Cの音声パター
ン、IA。
IB、ICが選択され、これらが、パターンマツチング
回路(6)に供給されるように制御される。また、もし
、指紋判別手段(8)に供給された、指紋を示す信号が
、指紋登録された登録話者のものでなければ、例えば話
者Iの音声パターンだけでなく、共通パターンメモリ(
9A)に登録された話者全ての音声パターンが、例えば
、第2図の共通パターンメモリ(9^)の話者I、  
I[、I[[の音声パターンがパターンマツチング回路
(6)に供給されるように制御される。
そして、次にマイクロホン(11に、例えば「ツウワ」
という音声が供給されると、この「ツウワ」を示す音声
パターンと、共通パターンメモリ(9A)からの音声パ
ターンとが、パターンマツチング回路(6)にて比較さ
れる。そして、このパターンマツチング回路(6)で、
例えば上述した「ツウワ」という単語が認識される。す
ると、この「ツウワ」という単語に対応した信号が、パ
ターンマツチング回路(6)から、コントローラαυに
供給される。すると、このコントローラαDは、電話機
が通話可能な状態となるように、電話機を11aする。
そして、次に、話者が音声等によって例えば相手先電話
番号を指示するとコントローラαυは、その相手先に回
線を継なぐように電話機を制御する。そして、通話が開
始される。なお、この通話の終了時には、音声にて、[
ツウワシュウリ四つ」と発声するか、もしくは、ハンド
セットを取り上げる前の状態に戻せば終了となるように
なされている。
また、話者が、電話機のハンドセントを取り上げ、専用
モードを示す音声、例えば「センヨウ」を、マイクロホ
ン(1)に向かって発声すると、上述した「キョウツウ
」と発声した場合と同様にして、パターンマツチング回
路(6)で「センヨウ」という単語が認識される。そし
て、この認識された単語に対応した信号がコントローラ
Q11に供給される。
すると、コントローラαυは、専用モードであることを
示す信号を、指紋読取手段(7)および指紋判別手段(
8)に供給する。すると、上述した場合と同様にして、
話者の指紋を示す信号が、指紋読取手段(7)から指紋
判別手段(8)に供給される。そして、その指紋を示す
信号が登録話者の指紋を示すものであるかどうかが、指
紋判別手段(8)で判別される。
判別された結果、指紋を示す信号が登録話者を示すもの
であれば、その登録話者を示す信号をアドレス制御回路
αlを介して専用パターンメモリ(9B)ならびに共通
パターンメモリ(9A)に供給する。
そして、例えば、第2図に示す共通パターンメモリ(9
A)ならびに専用パターンメモリ(9B)の例えば、登
録話者■の単語A、B、Cの音声パターンIIA。
11B、nc、そして、登録話者独自の単語X、 Y。
Z(例えば、機密である相手先の電話番号を示す暗号)
の音声パターンax、my、nzが選択され、これらが
、パターンマツチング回路(6)に供給されるように制
御される。そして、上述した場合と同様にして、次にマ
イクロホン(1)に供給された音声の音声パターンと、
標準パターンメモリ(9)から選択された音声パターン
とが、パターンマツチング回路(6)で比較される。そ
して、音声が!!識され、その音声に対応した制御がコ
ントローラαυにて行なわれる。
もし、指紋読取手段(7)から供給された指紋を示す信
号が、登録話者の指紋を示すものではないと、指紋判別
手段(8)にて判別されると、指紋判別手段(8)は、
それを表す信号をコントローラαυに供給する。すると
、コントローラαυは、音声の受付を停止し、そして、
表示装置(図示せず)等に、例えば「センヨウ不可」と
いう表示がなされるようにする。
第4図は、この発明の他の実施例の動作のフローチャー
トを示す図であり、第1図例と異なる点は、専用モード
時のみ指紋を判別するところである。
図において、ステップ(101)にて、話者がハンドセ
ットを握る。そして、ステップ(102)にて、話者が
発した音声を受は付ける。この音声が、共通モードを示
すものか、専用モードを示すものかが、ステップ(10
3)にて、判別される。もし、専用モードでなければ、
ステップ(109)にて不特定話者モードと判別され、
第1図例に示した、共通パターンメモリ(9A)のみに
記憶された音声パターンが選択される。ステップ(10
3)で専用モードと判別されると、ステップ(104)
にて、話者の指紋が検出される。そして、ステップ(1
05)にて検出された指紋が登録話者のものであるかが
判別され、登録話者のものでなければ、ステップ(11
0)にて、音声の受は付けが不可とされる。指紋が登録
話者のものであれば、ステップ(106)にて、次にそ
の話者が発声した音声を受は付ける。そして、ステップ
(107)にて、登録話者の音声認識が、第1図例と同
様にして行なわれる。そして、認識された音声に対応し
た動作がステップ(108)にて行なわれる。
なお、上述した例では、予じめ指紋登録していない話者
であっても、電話機を使用できるようになっているが、
指紋登録を行なった話者のみが電話機を使用できるよう
にしてもよい。
なお、指紋登録を行なった話者のみが電話機を使用でき
るようにした場合には、指紋登録を行なったのみで、音
声登録を行なっていない者でも電話機を使用できるよう
にしてもよい、この場合、指紋登録のみを行なった話者
に対しては、不特定話者モードの音声認識が行なわれる
ものである。
なお、上述した例において、指紋読取手段は、ハンドセ
ントに備えられているが、その他の部分、例えば、ファ
ンクションキーな、どが備えられている場合には、その
キーに、指紋読取手段が設けられていてもよいし、また
、マイクロホンを用いる場合には、そのマイクロホンの
握りの部分に指紋読取手段が設けられていてもよい。
なお、上述した例において、モード判別を行なった後に
、指紋の判別が行なわれているが、モード判別を行なう
前に、指紋判別を行なうようにしてもよい。
なお上述した実施例は、電話機の場合の例であるが、こ
の発明は電話機だけではなく、例えば、ファクシミリ装
置等、音声認識を用いて制御されるものであれば、その
他種々のものにも適用することが可能である。
〔発明の効果〕
この発明によれば、話者の個大特をのものである指紋の
判別を行ない、その話者が音声パターンならびに指紋を
登録した登録話者であると判別するようにしたので、登
録話者の判別が確実にできる。そして、話者判別をした
ときはこの登録話者が登録した音声パターンと入力音声
パターンとのパターンマツチングを行なうようにしたの
で、話者が登録話者である場合の音声認識の応答が速く
なる。しかも、登録話者が登録した秘密情報を他人に勝
手に使用されないようにすることができるという効果が
ある。
【図面の簡単な説明】
第1図はこの発明の一実施例のブロック図、第2図は音
声パターンメモリの一例を示す図、第3図は音声登録の
フローチャートを示す図、第4図はこの発明の他の実施
例の動作のフローチャートを示す図、第5図は音声認識
の基本的構成のブロック図である。 (6)はパターンマツチング手段、(7)は指紋読取手
段、(8)は指紋判別手段、(9)は標準音声パターン
メモリ、亜は指紋登録手段である。 実 万芭 イ勾 第1図

Claims (1)

  1. 【特許請求の範囲】 複数の話者による共通の複数個の特定単語と、各話者独
    自の単語とが登録される標準音声パターンメモリと、 標準音声パターンと入力音声パターンとのマッチングを
    行なうパターンマッチング手段と、指紋読取手段と、 上記標準音声パターンメモリに単語登録を行なった話者
    の指紋が登録される手段と、 上記指紋読取手段によって読み取られた指紋が上記指紋
    登録手段に登録された指紋であることを判別したら、こ
    の読み取られた指紋を有する話者により登録された標準
    音声パターンのみを上記標準音声パターンメモリから、
    上記パターンマッチング手段に供給する手段とを備えた
    音声認識装置。
JP63015560A 1988-01-26 1988-01-26 音声認識装置 Pending JPH01191200A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63015560A JPH01191200A (ja) 1988-01-26 1988-01-26 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63015560A JPH01191200A (ja) 1988-01-26 1988-01-26 音声認識装置

Publications (1)

Publication Number Publication Date
JPH01191200A true JPH01191200A (ja) 1989-08-01

Family

ID=11892140

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63015560A Pending JPH01191200A (ja) 1988-01-26 1988-01-26 音声認識装置

Country Status (1)

Country Link
JP (1) JPH01191200A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7084734B2 (en) 2003-08-07 2006-08-01 Georgia Tech Research Corporation Secure authentication of a user to a system and secure operation thereafter
KR100891058B1 (ko) * 2000-09-06 2009-03-31 가부시키가이샤 히타치세이사쿠쇼 개인 인증 시스템

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100891058B1 (ko) * 2000-09-06 2009-03-31 가부시키가이샤 히타치세이사쿠쇼 개인 인증 시스템
US7084734B2 (en) 2003-08-07 2006-08-01 Georgia Tech Research Corporation Secure authentication of a user to a system and secure operation thereafter

Similar Documents

Publication Publication Date Title
US5594784A (en) Apparatus and method for transparent telephony utilizing speech-based signaling for initiating and handling calls
US5719921A (en) Methods and apparatus for activating telephone services in response to speech
JP3168033B2 (ja) 音声テレフォン・ダイヤリング
US6584439B1 (en) Method and apparatus for controlling voice controlled devices
US20030074201A1 (en) Continuous authentication of the identity of a speaker
US7246061B2 (en) Method for the voice-operated identification of the user of a telecommunications line in a telecommunications network in the course of a dialog with a voice-operated dialog system
US20010056345A1 (en) Method and system for speech recognition of the alphabet
JP2004053825A (ja) 言語識別装置、言語識別方法および言語識別プログラム
JPH01191200A (ja) 音声認識装置
JP2000349865A (ja) 音声通信装置
JPH0595329A (ja) 携帯電話装置
JP2003029776A (ja) 音声認識装置
CA2130211A1 (en) System and method for passive voice verification in a telephone network
JP5728456B2 (ja) 通信端末
JPS63236456A (ja) 電話端末着信制御装置
JP2002252705A (ja) 話者id検出方法及び装置
JPH03157696A (ja) 音声応答認識方式
JPS61157053A (ja) 電話装置
JPH09127975A (ja) 話者認識システムおよび情報管理方法
JPS6052440B2 (ja) 音声認識装置
JPH0197044A (ja) 音声ダイヤル装置
Hunt New commercial applications of telephone-network-based speech recognition and speaker verification
JPH03150927A (ja) 音声通信装置
JPS61231629A (ja) 音声入力装置
KR20010069650A (ko) 숫자로 구성된 어휘를 인식하고 동시에 발성화자를인증하는 방법 및 그 시스템