JPS5944640B2 - 音声情報サンプリング装置 - Google Patents
音声情報サンプリング装置Info
- Publication number
- JPS5944640B2 JPS5944640B2 JP52082584A JP8258477A JPS5944640B2 JP S5944640 B2 JPS5944640 B2 JP S5944640B2 JP 52082584 A JP52082584 A JP 52082584A JP 8258477 A JP8258477 A JP 8258477A JP S5944640 B2 JPS5944640 B2 JP S5944640B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- speech
- sampling
- information
- points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Description
【発明の詳細な説明】
本発明は、音声認識装置に関し特に単語音声パターンか
らその単語の音韻構造を代表するような点を抽出する音
声情報サンプリング装置に関する。
らその単語の音韻構造を代表するような点を抽出する音
声情報サンプリング装置に関する。
音声パターンには発声速度の変動に対応した時間軸上の
パターンの変動があり、しかも音韻情報のみに着目した
場合には多くの冗長度を持つており、音声パターンを一
定間隔(10mS程度)でサンプリングしたものを直接
音声認識等の目的に使用することは適当ではなかつた。
これに対処する方法としては、例えば音声パターンのう
ち相対的に定常的な点(準定常点)のみを代表的な点と
して抽出する方法(特願昭48−45550号明細書)
がある。この方法によれば多くの場合、単語中の各音素
に対応して各1点が抽出されて理想的な時間変動の正規
化及び情報圧縮が行なわれるが、比較的局所的な操作に
より抽出が行なわれるため、音声パターンの個人差によ
る変動等により抽出もれ、2重抽出等の不安定な動作が
みられることも少な<なかつた。本発明の目的は単語音
声パターンからその単語の音韻・構造を代表する点を抽
出し、音声パターンの時間軸に関する変動の正規化と情
報圧縮を同時にかつ安定に行なう音声情報サンプリング
装置を提供することにある。
パターンの変動があり、しかも音韻情報のみに着目した
場合には多くの冗長度を持つており、音声パターンを一
定間隔(10mS程度)でサンプリングしたものを直接
音声認識等の目的に使用することは適当ではなかつた。
これに対処する方法としては、例えば音声パターンのう
ち相対的に定常的な点(準定常点)のみを代表的な点と
して抽出する方法(特願昭48−45550号明細書)
がある。この方法によれば多くの場合、単語中の各音素
に対応して各1点が抽出されて理想的な時間変動の正規
化及び情報圧縮が行なわれるが、比較的局所的な操作に
より抽出が行なわれるため、音声パターンの個人差によ
る変動等により抽出もれ、2重抽出等の不安定な動作が
みられることも少な<なかつた。本発明の目的は単語音
声パターンからその単語の音韻・構造を代表する点を抽
出し、音声パターンの時間軸に関する変動の正規化と情
報圧縮を同時にかつ安定に行なう音声情報サンプリング
装置を提供することにある。
本発明の装置によれば対象とする語のそれぞれの単語(
あるいは類似の単語を一まとめにした単語群)に対して
、その単語を他から特徴づけるような代表的な時点を、
話者の個人差の影響を受けにくいパラメータ(例えば振
幅パターンなど)を利用して大域的な処理により決定・
抽出することにより、音声パターンの時間変動の正規化
および時間軸に関する情報圧縮(時間圧縮)を極めて安
定に実現することが可能になる。
あるいは類似の単語を一まとめにした単語群)に対して
、その単語を他から特徴づけるような代表的な時点を、
話者の個人差の影響を受けにくいパラメータ(例えば振
幅パターンなど)を利用して大域的な処理により決定・
抽出することにより、音声パターンの時間変動の正規化
および時間軸に関する情報圧縮(時間圧縮)を極めて安
定に実現することが可能になる。
本発明を以下に述べる実施例によつてさらに詳フ 細に
説明する。
説明する。
第1図は本発明の音声情報サンプリング装置の一実施例
の構成を示すブロック図である。
の構成を示すブロック図である。
第1図において参照数字1は音声パターンから音韻構造
に対応した音声パラメータを抽出する音声パラメ5−タ
抽出部であり、音声波形を観測し周波数分析処理を行な
い音声パラメータをベクトルの時系列として出力する。
こゝで周波数分析処理としては公知の方法である短時間
自己相関関数による分析処理を用いている。参照数字2
は入力された1単語分のベクトルの時系列を格納するバ
ツフアを示す。また参照数字3は時間軸上でのサンプリ
ング点とその抽出手順を示す情報、すなわち単語サンプ
リング情報対象語の各単語別に記述した単語テーブルを
格納するバツフアを示す。こ\で単語テーブルに記述さ
れるサンプリング点とその抽出手順は対象語の各単詔の
音韻構造を代表し、その単語とそれ以外の単語との相違
を強調するように与えられている。処理部4はバツフア
3に格納されている単語テーブルに記述された抽出手順
に従つてバツフア2に格納されているベクトルの時系列
からサンプリング点を抽出し、抽出されたサンプリング
点に対応するベクトルを出力する。出力されたベクトル
は参照数字5によつて示されるバツフアへ格納される。
参照数字6はコントローラを示し、サンプリング点を決
定する際に用いる単語テーブルのアドレスを制御し、ま
た1単語分の時間圧縮の処理が完了する毎にバツフア2
の内容をクリアし同時にバツフア5の内容をパターンベ
クトルとして出力した後クリアする。第2図は単語「サ
ン」の音声の振幅パターンの概形を示したものである。
に対応した音声パラメータを抽出する音声パラメ5−タ
抽出部であり、音声波形を観測し周波数分析処理を行な
い音声パラメータをベクトルの時系列として出力する。
こゝで周波数分析処理としては公知の方法である短時間
自己相関関数による分析処理を用いている。参照数字2
は入力された1単語分のベクトルの時系列を格納するバ
ツフアを示す。また参照数字3は時間軸上でのサンプリ
ング点とその抽出手順を示す情報、すなわち単語サンプ
リング情報対象語の各単語別に記述した単語テーブルを
格納するバツフアを示す。こ\で単語テーブルに記述さ
れるサンプリング点とその抽出手順は対象語の各単詔の
音韻構造を代表し、その単語とそれ以外の単語との相違
を強調するように与えられている。処理部4はバツフア
3に格納されている単語テーブルに記述された抽出手順
に従つてバツフア2に格納されているベクトルの時系列
からサンプリング点を抽出し、抽出されたサンプリング
点に対応するベクトルを出力する。出力されたベクトル
は参照数字5によつて示されるバツフアへ格納される。
参照数字6はコントローラを示し、サンプリング点を決
定する際に用いる単語テーブルのアドレスを制御し、ま
た1単語分の時間圧縮の処理が完了する毎にバツフア2
の内容をクリアし同時にバツフア5の内容をパターンベ
クトルとして出力した後クリアする。第2図は単語「サ
ン」の音声の振幅パターンの概形を示したものである。
以下、第2図の場合を例にサンプリング点の抽出される
過程を示す。単語「サン」は単語を代表する3つの音韻
/S/,/a/,/n/を含んでおり、単語テーブルに
はこの3つの音韻に対応する点を抽出の行ないやすい順
にまず最初に音韻/a/に対応する点を抽出し、次に音
韻/S/及び/n/に対応する点を抽出するように手順
が記述されている。単語テーブルには更に抽出すべき点
の大体の位置を示すための区間パラメータ及びその区間
で抽出点を決定するために参照する情報の種類が記述さ
れている。処理部4はこれらの手順に従つてサンプリン
グ点を順次決定する。サンプリング点の決定はまず先に
抽出されたサンプリング点の位置をもとに次に抽出すべ
き点の大体の位置を区間として決定した後、その区間で
振幅値やベクトルの時系列のフレーム間距離の情報を参
照してサンプリング点を決定することによつてなされる
。第2図に即して説明するとまず単語テーブルの区間パ
ラメータにより与えられた区間S,内で音韻/a/に対
応する点P1を抽出し次いで点P1と単語テーブルの区
間パラメータにより決定される区間S2S2においてそ
れぞれ音韻/S/,/n/に対応する点P2P3を抽出
する。さらに[サン」以外の単語との相違を強調するた
め必要に応じて点PlP2P3の間の点を内挿によりサ
ンプリングする。
過程を示す。単語「サン」は単語を代表する3つの音韻
/S/,/a/,/n/を含んでおり、単語テーブルに
はこの3つの音韻に対応する点を抽出の行ないやすい順
にまず最初に音韻/a/に対応する点を抽出し、次に音
韻/S/及び/n/に対応する点を抽出するように手順
が記述されている。単語テーブルには更に抽出すべき点
の大体の位置を示すための区間パラメータ及びその区間
で抽出点を決定するために参照する情報の種類が記述さ
れている。処理部4はこれらの手順に従つてサンプリン
グ点を順次決定する。サンプリング点の決定はまず先に
抽出されたサンプリング点の位置をもとに次に抽出すべ
き点の大体の位置を区間として決定した後、その区間で
振幅値やベクトルの時系列のフレーム間距離の情報を参
照してサンプリング点を決定することによつてなされる
。第2図に即して説明するとまず単語テーブルの区間パ
ラメータにより与えられた区間S,内で音韻/a/に対
応する点P1を抽出し次いで点P1と単語テーブルの区
間パラメータにより決定される区間S2S2においてそ
れぞれ音韻/S/,/n/に対応する点P2P3を抽出
する。さらに[サン」以外の単語との相違を強調するた
め必要に応じて点PlP2P3の間の点を内挿によりサ
ンプリングする。
第1図は本発明の音声情報サンプリング装置の一実施例
の構成を示すプロツク図、第2図は本発明によるサンプ
リング点の抽出過程の例を示す図である。 図において参照数字1は音声パラメータ抽出部、参照数
字2は入力音声パラメータ用バツフア、参照数字3は単
語テーブルバツフア、参照数字4はサンプリング点抽出
部、及び参照数字5は出力音声パラメータ用バツフア、
記号SlS2S3は抽出区間、記号PlP2P3は抽出
点である。
の構成を示すプロツク図、第2図は本発明によるサンプ
リング点の抽出過程の例を示す図である。 図において参照数字1は音声パラメータ抽出部、参照数
字2は入力音声パラメータ用バツフア、参照数字3は単
語テーブルバツフア、参照数字4はサンプリング点抽出
部、及び参照数字5は出力音声パラメータ用バツフア、
記号SlS2S3は抽出区間、記号PlP2P3は抽出
点である。
Claims (1)
- 1 音声パターンから音韻構造に対応した音声パラメー
タを抽出する機能を有する音声パラメータ抽出部と、対
象語の各単語の音韻構造を代表し、その単語とそれ以外
の単語との弁別を容易ならしむるサンプリング点とその
抽出手順を示す情報(単語サンプリング情報)を保持す
る機能を有する単語テーブル記憶部と、上記単語サンプ
リング情報で示された手順に従つて音声パターンのサン
プリング点を順次決定、抽出するサンプリング点抽出部
よりなり、単語音声の時間圧縮を各単語に対応してそれ
ぞれ別個にサンプリングすることにより行なうことを特
徴とする音声情報サンプリング装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP52082584A JPS5944640B2 (ja) | 1977-07-12 | 1977-07-12 | 音声情報サンプリング装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP52082584A JPS5944640B2 (ja) | 1977-07-12 | 1977-07-12 | 音声情報サンプリング装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5418203A JPS5418203A (en) | 1979-02-10 |
JPS5944640B2 true JPS5944640B2 (ja) | 1984-10-31 |
Family
ID=13778520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP52082584A Expired JPS5944640B2 (ja) | 1977-07-12 | 1977-07-12 | 音声情報サンプリング装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5944640B2 (ja) |
-
1977
- 1977-07-12 JP JP52082584A patent/JPS5944640B2/ja not_active Expired
Also Published As
Publication number | Publication date |
---|---|
JPS5418203A (en) | 1979-02-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS58130393A (ja) | 音声認識装置 | |
JPS6128998B2 (ja) | ||
JPS60158498A (ja) | パターン照合装置 | |
JPS6312312B2 (ja) | ||
JPS5944640B2 (ja) | 音声情報サンプリング装置 | |
JPS6129518B2 (ja) | ||
JPS63502304A (ja) | 高雑音環境における言語認識のためのフレ−ム比較法 | |
JPH021317B2 (ja) | ||
JPS61180297A (ja) | 話者照合装置 | |
JPS6131880B2 (ja) | ||
JPS599080B2 (ja) | 音声認識方法 | |
JP2707577B2 (ja) | ホルマント抽出装置 | |
JPS6115440B2 (ja) | ||
JPS6344239B2 (ja) | ||
JPS58176699A (ja) | 音声標準パタ−ン登録方式 | |
JPS63223696A (ja) | 音声パタ−ン作成方式 | |
JPS61273599A (ja) | 音声認識装置 | |
JPH0316038B2 (ja) | ||
JPS59195300A (ja) | 音声認識装置 | |
JPS5995597A (ja) | 音声特徴パラメ−タ作成方式 | |
JPS59204099A (ja) | 音声認識方式 | |
JPH01319099A (ja) | 音声認識装置 | |
JPS62133499A (ja) | 音声認識装置 | |
JPS6157995A (ja) | 音声認識装置 | |
JPH0784590A (ja) | パターン追加登録装置 |