JPS63213897A - 話者認識装置における辞書更新方式 - Google Patents

話者認識装置における辞書更新方式

Info

Publication number
JPS63213897A
JPS63213897A JP62048558A JP4855887A JPS63213897A JP S63213897 A JPS63213897 A JP S63213897A JP 62048558 A JP62048558 A JP 62048558A JP 4855887 A JP4855887 A JP 4855887A JP S63213897 A JPS63213897 A JP S63213897A
Authority
JP
Japan
Prior art keywords
dictionary
patterns
speaker
pattern
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62048558A
Other languages
English (en)
Inventor
博喜 内山
博雄 北川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP62048558A priority Critical patent/JPS63213897A/ja
Publication of JPS63213897A publication Critical patent/JPS63213897A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 五東光髭 本発明は、音声により話者の同定を行う話者照合装置の
辞書更新方式に関するものであり、例えば、バンキング
サービス、個人情報へのアクセス。
機密保管場所への入室管理等の音声キー(key)。
玩具等の応答装置の検出等における辞書パタンの自動更
新等に適用して好適なものである。
灸來技権 音声を用いた話者照合は、音声信号が音韻情報。
個人性情報、感情情報より形成されていることに着目し
、特に個人性の情報に着目して話者の同定を行うもので
ある。従来より個人性の情報(声道特性、音源特性など
)は、時間の経過に伴って変化するとされており、特に
話者照合においては音声認識以上に認識率が低下するこ
とが確認されている。そこで、話者認識においては照合
時に使う個人の辞書パタン(標準パタン)を音声の経時
的変化に対して強くすることが必要である。このため、
声道特性の逆フイルタリング処理を施した音声信号を使
用したり、辞書パタンを照合時に更新したりすることが
行われている。このうち辞書パタンを更新する方式では
、従来、照合時に話者のものであると確認された音声パ
タンのみを用いて辞書の更新が行われているため、′I
R繁に辞書の更新を行う場合には経時的変化に追従でき
るが、照合を行う時間間隔が長い場合には、辞書更新に
よるパタンの変化はわずかであるので、その効果が薄く
、認識率を低下させていた。
且−一枚 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、音声信号に含まれる個人性の情報を抽出すること
により話者を同定する話者照合装置において、音声の経
時的変化に対応した辞書の更新を自動的に行うことを目
的としてなされたものである 遭−一」叉 本発明は、上記目的を達成するために、登録話者によっ
て登録された音声パタンと未知話者によって入力された
音声パタンとを比較し、その類似度があるしきい値を越
えた時に上記未知話者を上記登録話者と同一であると判
断すると同時に、その判定結果に基づいて上記の入力音
声パタンを用いて個人辞書パタンを学習修正する話者照
合装置において、照合時に、入力された全ての音声パタ
ンを一時的に記憶する手段を有し、未知話者が登録話者
と同一であると判断されたときには、その照合時におい
て棄却された音声パタンをも利用して、辞書の更新を行
うことを特徴としたものである。以下5本発明の実施例
に基いて説明する。
第1図は1本発明の一実施例を説明するための構成図で
、図中、1はマイクロフォン、2はローパスフィルタ(
LPF)、3はアナログ−デジタル変換回路、4は音声
区間検出部、5は音声波形分析部、6は照合部、7は判
断部、8は閾値部、9は蓄積部、10は更新部、11は
辞書部、12は登録部で、マイクから入力された音声信
号は、ローパスフィルター(L P F)によってサン
プリング周波数の1/2以上の成分をカットされたのち
A/D変換器によって離散的な信号列に量子化される。
このようにして離散化された信号は、音声区間切り出し
装置によって音声区間のみが切り出され、音声波形分析
器において各種の特徴パラメータに変換される。
このようにして得られた特徴パラメータは、登録時には
辞書登録部によって辞書パタンとして格納される。登録
時の発声回数は、辞書構成方法および識別のアルゴリズ
ムにあわせて自由に設定してよい。なお、辞書イ2餘部
には、標準パタンとして適切でないパタンをリジェクト
する機能を付加しても良い。辞書形式としては、加算平
均パタンと発声回数とを記憶しても良いし、所定数の入
力パタンをそのまま集合として記憶するようにしても良
い。
照合時には、未知話者の特徴ベクトルのパタンと登録話
者の辞書パターンとのベクトル間の距離が計算され、判
断部において、予め各話者毎に設定されているしきい値
と上記計算によって得られた距離とを比較することで話
者の判定が行われる。
照合時には、例えば、話者のキーワード(key  w
ord)を指定することで、話者本人の辞書に対して照
合を行う。未知話者のm回目の発声で受理されなかった
場合には、所定の回数照合が行えるようにしておく。
音声蓄積部では1話者に許可された発声回数以内で、入
力パタンが受理されるまでのパタンを一時的に記憶する
0例えば5回の照合回数が許されている場合に、4回目
の発声での音声パタンか受理されたときには、1回目か
ら3回目の棄却された音声パタンと4回目の受理された
音声パタンか蓄積されている。辞書更新部は、判定部か
らの受理信号を受は取って、音声蓄積部に記憶されてい
る音声パタンと辞書パタンとを用いて辞書の更新をおこ
なう。
第2図は、辞書更新法の一例を示す図で、この例におい
ては辞書パタンの添字(n)は、現在までの辞書更新に
関わった音声パタンの個数を示している。このときの辞
書パタンを(X (n)  1 、 X (n)2・・
・x(n)p)と表す、いま、m回目の発声での音声パ
タンが受理されたときには、1回目からm−1回目の棄
却された音声パタンとm回[1の受理された音声パタン
とを用いて新たな辞書パタンを第2図(7)、、I;’
+ニ(X(n ” m) l 、 X(n ” rn)
 2・・・X(n + m) p)として作成する。こ
こで、新たな辞書としては、現在までの辞書パタンとm
回の音声パタンの荷重平均などを用いる。また、辞書作
成の際には、1回目からm回目までの全ての音声パタン
を用いても良いが、その一部を選択して用いることも考
えられる。辞書更新にm回の音声パタンのどれを採用す
るかは5m回の音声パタンの平均2分散等の統計的分析
の結果をもちいて決定する。
第3図は、辞書更新法の他の例をを示す図で。
この例は、複数個のパタンによって形成される辞書を用
いて、照合時に入力された全ての音声パタンと辞書中の
全てのパタンから新たな辞書パタンを選択して更新する
辞書パタン更新方式を示している。辞書パタンは、K個
の辞書パタンより構成されている。いま1m回目の発声
での音声パタンか受理されたときには、1回目からm−
1回目の棄却された音声パタンとm回目の受理された音
声パタンとに個の辞書パタンとを用いて、k個の新たな
辞書パタンの集合を作成する。
第3図の例の場合は、8番目の辞書パタンか捨てられ新
たにこの照合時に入力された2番目の音声パタンか採用
されたことを示している。ここで。
k個の新たな音声パタンを選択する場合には、はじめの
に個の辞書パタンにおいて、音声パタン入力時の日時を
記録する項目を設け、時間的に偏りを持たないように音
声パタンの集合を選択する更新方式をとってもよいし、
複数個の音声パタンによって形成される辞書において、
話者の識別空間に偏りを持たないように音声パタンの集
合を選択するように辞書パタン更新方式をおこなっても
よい。また、辞書の更新にともなって判断に用いる閾値
を変更しても良い。
紘−一釆 以上の説明から明らかなように、本発明によると、経時
的変化を伴う音声に対して効果的に辞書の自動更新を行
うことが可能となり、この方式を採用することにより、
ある程度長時間経過した後の音声に対しても高い認識率
を保持する話者認識装置が実現できる。
【図面の簡単な説明】
第1図は、本発明による辞書更新方式の実施に使用して
好的な電気回路の一例を示すブロック線図、第2図及び
第3図は、それぞれ辞書更新法の例を説明するための図
である。 1・・・マイクロフォン、2・・・ローパスフィルタ(
LPF)、3・・・アナログ−デジタル変換回路、4・
・・音声区間検出部、5・・・音声波形分析部、6・・
・照合部、7・・・判断部、8・・・閾値部、9・・・
蓄積部、10・・・更新部、11・・・辞書部、12・
・・登録部。

Claims (7)

    【特許請求の範囲】
  1. (1)、登録話者によって登録された音声パタンと未知
    話者によって入力された音声パタンとを比較し、その類
    似度があるしきい値を越えた時に上記未知話者を上記登
    録話者と同一であると判断すると同時に、その判定結果
    に基づいて上記の入力音声パタンを用いて個人辞書パタ
    ンを学習修正する話者照合装置において、照合時に、入
    力された全ての音声パタンを一時的に記憶する手段を有
    し、未知話者が登録話者と同一であると判断されたとき
    には、その照合時において棄却された音声パタンをも利
    用して辞書の更新を行うことを特徴とする話者認識装置
    における辞書更新方式。
  2. (2)、登録および更新に用いたパタン総数が記録でき
    るようにした辞書を用いて、照合時に入力された全ての
    音声パタンとの荷重平均を計算し、これを新たな辞書パ
    タンとすると同時に、更新に用いたパタンの個数を辞書
    中のパタン総数に加算することを特徴とする特許請求範
    囲第(1)項記載の話者認識装置における辞書更新方式
  3. (3)、登録および更新に用いたパタン総数が記録でき
    るようにした辞書を用いて、照合時に入力された全ての
    音声パタンから、辞書更新に適切であるパタンを選択し
    て、これらのパタンと辞書パタンの荷重平均を計算し、
    これを新たな辞書パタンとすると同時に更新に用いたパ
    タンの個数を辞書中のパタン総数に加算することを特徴
    とする特許請求範囲第(1)項記載の話者認識装置にお
    ける辞書更新方式。
  4. (4)、複数個の音声パタンによって形成される辞書を
    用いて、照合時に入力された全ての音声パタンと辞書中
    の全てのパタンから新たな辞書パタンを選択して更新す
    ることを特徴とする特許請求範囲第(1)項記載の話者
    認識装置における辞書更新方式。
  5. (5)、複数個の音声パタンによって形成される辞書に
    おいて、パタン入力時の日時を記録する項目を設け、時
    間的に偏りを持たないように音声パタンの集合を選択す
    ることを特徴とする特許請求範囲第(4)項記載の話者
    認識装置における辞書更新方式。
  6. (6)、複数個の音声パタンによって形成される辞書に
    おいて、話者の識別空間に偏りを持たないように音声パ
    タンの集合を選択することを特徴とする特許請求範囲第
    (4)項記載の話者認識装置における辞書更新方式。
  7. (7)、未知話者と登録話者が同一であると判断される
    までの未知話者に許される発声回数を限定することを特
    徴とする特許請求範囲第(1)項記載の話者認識装置に
    おける辞書更新方式。
JP62048558A 1987-03-02 1987-03-02 話者認識装置における辞書更新方式 Pending JPS63213897A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62048558A JPS63213897A (ja) 1987-03-02 1987-03-02 話者認識装置における辞書更新方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62048558A JPS63213897A (ja) 1987-03-02 1987-03-02 話者認識装置における辞書更新方式

Publications (1)

Publication Number Publication Date
JPS63213897A true JPS63213897A (ja) 1988-09-06

Family

ID=12806710

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62048558A Pending JPS63213897A (ja) 1987-03-02 1987-03-02 話者認識装置における辞書更新方式

Country Status (1)

Country Link
JP (1) JPS63213897A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008064928A (ja) * 2006-09-06 2008-03-21 Yamaha Corp 生体認証装置、生体認証方法およびプログラム
JPWO2006109515A1 (ja) * 2005-03-31 2008-10-23 パイオニア株式会社 操作者認識装置、操作者認識方法、および、操作者認識プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2006109515A1 (ja) * 2005-03-31 2008-10-23 パイオニア株式会社 操作者認識装置、操作者認識方法、および、操作者認識プログラム
JP2008064928A (ja) * 2006-09-06 2008-03-21 Yamaha Corp 生体認証装置、生体認証方法およびプログラム

Similar Documents

Publication Publication Date Title
US20090076814A1 (en) Apparatus and method for determining speech signal
JP2002514318A (ja) 録音された音声を検出するシステムおよび方法
KR101888058B1 (ko) 발화된 단어에 기초하여 화자를 식별하기 위한 방법 및 그 장치
CN108831456B (zh) 一种通过语音识别对视频标记的方法、装置及系统
Ayoub et al. Gammatone frequency cepstral coefficients for speaker identification over VoIP networks
KR102098956B1 (ko) 음성인식장치 및 음성인식방법
JP2996019B2 (ja) 音声認識装置
JP6480124B2 (ja) 生体検知装置、生体検知方法及びプログラム
JPH04318900A (ja) 多方向同時収音式音声認識方法
JPS63213897A (ja) 話者認識装置における辞書更新方式
Jayanna et al. Fuzzy vector quantization for speaker recognition under limited data conditions
US7085718B2 (en) Method for speaker-identification using application speech
US7454337B1 (en) Method of modeling single data class from multi-class data
JP2001350494A (ja) 照合装置及び照合方法
Mishra A vector quantization approach to speaker recognition
Kabari et al. Speaker recognition system using signal processing tool in MATLAB
Higgins et al. A multi-spectral data-fusion approach to speaker recognition
JPS63213899A (ja) 話者照合方式
JP2000148187A (ja) 話者認識方法、その方法を用いた装置及びそのプログラム記録媒体
JPS61278896A (ja) 話者照合装置
JP3357752B2 (ja) パターンマッチング装置
JP2891259B2 (ja) 音声区間検出装置
Adetoyi Text Independent Speaker Identification System for Access Control
JPS63306499A (ja) 不特定話者音声認識装置
JPS61138296A (ja) 音声認識装置