JPS6075897A - 不特定話者用音声認識方式 - Google Patents

不特定話者用音声認識方式

Info

Publication number
JPS6075897A
JPS6075897A JP18378683A JP18378683A JPS6075897A JP S6075897 A JPS6075897 A JP S6075897A JP 18378683 A JP18378683 A JP 18378683A JP 18378683 A JP18378683 A JP 18378683A JP S6075897 A JPS6075897 A JP S6075897A
Authority
JP
Japan
Prior art keywords
pattern
dictionary
patterns
speakers
broad
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP18378683A
Other languages
English (en)
Inventor
米山 正秀
博 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP18378683A priority Critical patent/JPS6075897A/ja
Publication of JPS6075897A publication Critical patent/JPS6075897A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技1蔓υ頭 本発明は、パターンマツチング技術を用いた音声認識方
式に関する。
従来技術 単語音声を認識するための新しいパターンマツチング方
式として、本出願人は、先に、周波数と時間を変数とす
るスペクトルグラフを基本として2種類の2次元パター
ン(ローカルピークの軌跡を表わす細線化パターンと2
値化されたブロードパターン)の重なり具合を用いて類
似度を算出する方式について種々提案した。
更に詳、?コに説明すると、単語の音声認識を目的とし
て、マイクロホンから取り入れた単語の音声信号を特徴
抽出部に導き、何らかの方法によって数m rm ”C
〜数+m5ec程度の時間間隔で周波数分析し、音声信
号の短時間パワースペクトルをめ、こ]tを特徴量とし
た場合、これ等の特徴量を周波数と時間を2軸として2
次元平面上に表示したパターンは音声のタイムスペクト
ルパターンとして知られている。本発明は、このタイム
スペクトルパターンを基本として、そのローカルピーク
を連ねた細線化パターン(第1図)と、ある閾値を設け
、これによって2値化したブロードパターン(第2図)
との2種類のパターンの重畳比較により類似度を算出し
、認識をおこなう方式に係わるものである。面して、上
記2種類のパターンのマツチング処理をおこなう場合、
上記2種類のパターンの内いづれか一方を標準パターン
として予め登録しておくのが一般的である。これを辞書
パターンと称し、マツチングに際しては、入力のパター
ンをこの辞書パターンと照合する処理をおこなう。しか
しながら辞書パターンを登録した話者と認識時において
入力音声の発話者が異る場合には、声道特性の個人的バ
ラツキにより」二記タイムスペク1へルパターンの周波
数方向にヅレを生し、そのままマツチングをおこなって
も辞書パターンとの整合性が悪く認識率が劣化すること
ばすでに明らかである。
目 的 本発明は、上記欠点を解決するためになされたもので、
特に、数人〜数十人程度の限られた話者を対象に適用可
能な音声認識方式を提供することを目的としてなされた
ものである。
璽−一處 本発明の構成について、以下、実施例に基づいて説明す
る。
第3図は1本発明の一実施例を説明するための電気的ブ
ロック線図で、図中、1はマイク、2は特徴抽出部、3
はローカルピーク抽出(2値化)部、4はマツチング回
路、5はブロードパターン抽出(2値化)部、6は加重
平均辞書部、7は認識結果表示部で、まず、スイッチS
を辞書側にして、2“種のパターンの内、2値化された
ブロードパターンを辞書パターンとして用いることにし
て予め標準パターンを登録する。この場合、同一単語に
対して使用を予想される話者全員の音声の2値TSPの
ブロードパターンを線形伸縮等により時間軸の長さを揃
えて加算し、その結果のパターンを標準パターンとして
辞書に登録する。この場合N人の話者髪考えると、N個
の2値ブロードパターンを加算することになり、その結
果得られたパターンはN段階のレベルを有することにな
る。
この辞書パターンは話者が異なっても変動しにくい部分
は大きな値を持つのに対して話者毎に変動しやすい部分
は小さな値となり周波数方向に且つて重み付けされたパ
ターンとなる。この場合、入カバターンとしてはローカ
ルピークの軌跡である細線化パターンを用いるので1周
波数方向に幅を持って重みイ]けされた辞書パターンと
マツチングをおこなった場合、タイムスペクトルパター
ン上で話者変動に対してスペクトル変質が少ない部分で
は大きなマツチングスコアーが得られ、一方、話者変動
に対してスペクトル変動の大きな部分ではマツチングス
コアーは小さくなる。したがって。
本発明による方式に基づいて作成された辞書を用いると
、n書作成に関与した複数人(数人〜数十人)の不特定
な話者に対して十分良好な認識率を得ることが出来る。
〔例1〕 入カバターン(ローカルピークの軌跡)とN%WW荷重
平均辞書のマツチング処理の際の類似度計算を次式によ
って行う方式。
但し、■−は類似度、Poは入力と辞書のパターンの交
叉ポイント総数、Pdは辞書パターンの総ポイント数、
Piは入力、PO2は入力と辞書パターンの交叉回数。
〔例2〕 荷重平均辞書作成の方法として、N人の2値ブロードパ
ターンを加算する以外に1例えば、通常の振幅レベルを
持ったタイムスペクトルパターンをN大分加算した後、
適当な段階に複数のスレシホールドを設けて、適当な数
のM段階に量子化して辞書を作成する方式。
〔例3〕 ローカルピークの軌跡の代りに2値のブロードパターン
を用いて入カバターンと荷重辞書とのマツチングをおこ
なう方式。
〔例4〕 辞書パターンとして細線化パターン(ローカルピークの
軌跡)を複数人の話者に対して加算してN段階に重み付
けされた辞書パターンとし、入カバターンとしては2値
ブロードパターンを用いる方式。なお、この場合の辞書
パターンの一例を次に示すが、該パターン内の数字は荷
重値を示す。
0500003001031201 0500001002031202 1400002013012214 1400001003022205 3200001013013215 4100001013013215 41.00001013003215 4100001013002215 4110001023001225 3210002013001225 3200001013001225 3200002013001225 3200003012000325 320000303LOOO145 2210003031000145 122000504’0000235 1120003120000225 0230002122000235 0050004000000235 0050004000000235 0050013000000235 0050022000000225 0050013000000235 0040003000000215 0030031010000225 0030031000000225 003]、031000000215 001 1041000000215 0011041010000205 0011131010000205 0001 1 310000002050001121
010001205 0000041000001215 0010041000001215 0011031010001215 o01103101000]215 000]、0310’3000] 215000013
1020001215 0001121020001215 00011.21020001215 oooox4oo+6oo122s 0001 121020001225 0000 1 3 1020001 225〔例5〕 例4の場合において、入カバターンにローカルピーク軌
跡を表わす2値細線化パターンを用いる方式。
紘−一果 以上の説明から明らかなように1本発明によると、話者
がかわった場合に声道特性の個人的バラツキによって生
じるタイムスペクトルパターンの周波数方向の変動が荷
重辞書を用いることにより吸収でき、良好な認識率を得
ることができる。
【図面の簡単な説明】
第1図は、細線化パターンの一例を示す図、第2図は、
ブロードパターンの一例を示す図、第3図は、本発明の
実施に使用する電気的ブロック線図の一例を示す図であ
る。 ■・・マイク、2・・特徴抽出部、3・・・ローカル−
ピーク油出(2値化)部、4・・・マツチング回路、5
・・・ブロードパターン抽出(2値化)部、6・・・加
重平均辞書部、7・・・認識結果表示部。 第 1 図 第 2 @ 第3図 つ

Claims (1)

  1. 【特許請求の範囲】 周波数と時間を変数とする2次元平面上で表わせるタイ
    ムスペクトルパターンを基本として、辞書および入力の
    タイムスペクトルパターンをそれぞれ2倍またはそれ以
    上のレベルに分割した後。 これら2種の2次元パターンの重なり具合を用いて類似
    度を算出する単語音声認識方式において、辞書作成の際
    に複数人の話者のタイムスペクトルパターンを加算して
    得た重み付けされたパターンを辞書パターンとして用い
    ることを特徴とする不特定話者用音声認識方式。
JP18378683A 1983-09-30 1983-09-30 不特定話者用音声認識方式 Pending JPS6075897A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP18378683A JPS6075897A (ja) 1983-09-30 1983-09-30 不特定話者用音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18378683A JPS6075897A (ja) 1983-09-30 1983-09-30 不特定話者用音声認識方式

Publications (1)

Publication Number Publication Date
JPS6075897A true JPS6075897A (ja) 1985-04-30

Family

ID=16141905

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18378683A Pending JPS6075897A (ja) 1983-09-30 1983-09-30 不特定話者用音声認識方式

Country Status (1)

Country Link
JP (1) JPS6075897A (ja)

Similar Documents

Publication Publication Date Title
JPS6184694A (ja) 認識用辞書学習方法
JPS5972496A (ja) 単音識別装置
JPS6075897A (ja) 不特定話者用音声認識方式
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
JPS6061800A (ja) 音声認識方式
JPS61233791A (ja) 音声認識装置における音声区間検出方式
JPS5915993A (ja) 音声認識装置
JP2557497B2 (ja) 男女声の識別方法
JP2655637B2 (ja) 音声パターン照合方式
JPS60198598A (ja) 音声認識方式
JPS6059394A (ja) 音声認識装置
JPS61203498A (ja) 音声認識装置の予備選択方式
JPS6147994A (ja) 音声認識方式
JPS62115498A (ja) 無声破裂子音識別方式
JPS61252595A (ja) 音声認識処理方式
JPS61261798A (ja) 音声認識装置
JPS62217298A (ja) 音声認識装置
JPH0554118B2 (ja)
JPS58190999A (ja) 音声認識装置
JPS63148299A (ja) 単語音声認識方法および装置
JPS59204897A (ja) 音声認識辞書登録方式
JPS58189695A (ja) 連続数字音声認識方式
JPS60217399A (ja) 音声認識方式
JPS59219800A (ja) 音声パターン比較方法
JPS60220400A (ja) 音声パタ−ン作成法