JPS5944640B2 - 音声情報サンプリング装置 - Google Patents

音声情報サンプリング装置

Info

Publication number
JPS5944640B2
JPS5944640B2 JP52082584A JP8258477A JPS5944640B2 JP S5944640 B2 JPS5944640 B2 JP S5944640B2 JP 52082584 A JP52082584 A JP 52082584A JP 8258477 A JP8258477 A JP 8258477A JP S5944640 B2 JPS5944640 B2 JP S5944640B2
Authority
JP
Japan
Prior art keywords
word
speech
sampling
information
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP52082584A
Other languages
English (en)
Other versions
JPS5418203A (en
Inventor
成美 千葉
隆夫 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
Agency of Industrial Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency of Industrial Science and Technology filed Critical Agency of Industrial Science and Technology
Priority to JP52082584A priority Critical patent/JPS5944640B2/ja
Publication of JPS5418203A publication Critical patent/JPS5418203A/ja
Publication of JPS5944640B2 publication Critical patent/JPS5944640B2/ja
Expired legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は、音声認識装置に関し特に単語音声パターンか
らその単語の音韻構造を代表するような点を抽出する音
声情報サンプリング装置に関する。
音声パターンには発声速度の変動に対応した時間軸上の
パターンの変動があり、しかも音韻情報のみに着目した
場合には多くの冗長度を持つており、音声パターンを一
定間隔(10mS程度)でサンプリングしたものを直接
音声認識等の目的に使用することは適当ではなかつた。
これに対処する方法としては、例えば音声パターンのう
ち相対的に定常的な点(準定常点)のみを代表的な点と
して抽出する方法(特願昭48−45550号明細書)
がある。この方法によれば多くの場合、単語中の各音素
に対応して各1点が抽出されて理想的な時間変動の正規
化及び情報圧縮が行なわれるが、比較的局所的な操作に
より抽出が行なわれるため、音声パターンの個人差によ
る変動等により抽出もれ、2重抽出等の不安定な動作が
みられることも少な<なかつた。本発明の目的は単語音
声パターンからその単語の音韻・構造を代表する点を抽
出し、音声パターンの時間軸に関する変動の正規化と情
報圧縮を同時にかつ安定に行なう音声情報サンプリング
装置を提供することにある。
本発明の装置によれば対象とする語のそれぞれの単語(
あるいは類似の単語を一まとめにした単語群)に対して
、その単語を他から特徴づけるような代表的な時点を、
話者の個人差の影響を受けにくいパラメータ(例えば振
幅パターンなど)を利用して大域的な処理により決定・
抽出することにより、音声パターンの時間変動の正規化
および時間軸に関する情報圧縮(時間圧縮)を極めて安
定に実現することが可能になる。
本発明を以下に述べる実施例によつてさらに詳フ 細に
説明する。
第1図は本発明の音声情報サンプリング装置の一実施例
の構成を示すブロック図である。
第1図において参照数字1は音声パターンから音韻構造
に対応した音声パラメータを抽出する音声パラメ5−タ
抽出部であり、音声波形を観測し周波数分析処理を行な
い音声パラメータをベクトルの時系列として出力する。
こゝで周波数分析処理としては公知の方法である短時間
自己相関関数による分析処理を用いている。参照数字2
は入力された1単語分のベクトルの時系列を格納するバ
ツフアを示す。また参照数字3は時間軸上でのサンプリ
ング点とその抽出手順を示す情報、すなわち単語サンプ
リング情報対象語の各単語別に記述した単語テーブルを
格納するバツフアを示す。こ\で単語テーブルに記述さ
れるサンプリング点とその抽出手順は対象語の各単詔の
音韻構造を代表し、その単語とそれ以外の単語との相違
を強調するように与えられている。処理部4はバツフア
3に格納されている単語テーブルに記述された抽出手順
に従つてバツフア2に格納されているベクトルの時系列
からサンプリング点を抽出し、抽出されたサンプリング
点に対応するベクトルを出力する。出力されたベクトル
は参照数字5によつて示されるバツフアへ格納される。
参照数字6はコントローラを示し、サンプリング点を決
定する際に用いる単語テーブルのアドレスを制御し、ま
た1単語分の時間圧縮の処理が完了する毎にバツフア2
の内容をクリアし同時にバツフア5の内容をパターンベ
クトルとして出力した後クリアする。第2図は単語「サ
ン」の音声の振幅パターンの概形を示したものである。
以下、第2図の場合を例にサンプリング点の抽出される
過程を示す。単語「サン」は単語を代表する3つの音韻
/S/,/a/,/n/を含んでおり、単語テーブルに
はこの3つの音韻に対応する点を抽出の行ないやすい順
にまず最初に音韻/a/に対応する点を抽出し、次に音
韻/S/及び/n/に対応する点を抽出するように手順
が記述されている。単語テーブルには更に抽出すべき点
の大体の位置を示すための区間パラメータ及びその区間
で抽出点を決定するために参照する情報の種類が記述さ
れている。処理部4はこれらの手順に従つてサンプリン
グ点を順次決定する。サンプリング点の決定はまず先に
抽出されたサンプリング点の位置をもとに次に抽出すべ
き点の大体の位置を区間として決定した後、その区間で
振幅値やベクトルの時系列のフレーム間距離の情報を参
照してサンプリング点を決定することによつてなされる
。第2図に即して説明するとまず単語テーブルの区間パ
ラメータにより与えられた区間S,内で音韻/a/に対
応する点P1を抽出し次いで点P1と単語テーブルの区
間パラメータにより決定される区間S2S2においてそ
れぞれ音韻/S/,/n/に対応する点P2P3を抽出
する。さらに[サン」以外の単語との相違を強調するた
め必要に応じて点PlP2P3の間の点を内挿によりサ
ンプリングする。
【図面の簡単な説明】
第1図は本発明の音声情報サンプリング装置の一実施例
の構成を示すプロツク図、第2図は本発明によるサンプ
リング点の抽出過程の例を示す図である。 図において参照数字1は音声パラメータ抽出部、参照数
字2は入力音声パラメータ用バツフア、参照数字3は単
語テーブルバツフア、参照数字4はサンプリング点抽出
部、及び参照数字5は出力音声パラメータ用バツフア、
記号SlS2S3は抽出区間、記号PlP2P3は抽出
点である。

Claims (1)

    【特許請求の範囲】
  1. 1 音声パターンから音韻構造に対応した音声パラメー
    タを抽出する機能を有する音声パラメータ抽出部と、対
    象語の各単語の音韻構造を代表し、その単語とそれ以外
    の単語との弁別を容易ならしむるサンプリング点とその
    抽出手順を示す情報(単語サンプリング情報)を保持す
    る機能を有する単語テーブル記憶部と、上記単語サンプ
    リング情報で示された手順に従つて音声パターンのサン
    プリング点を順次決定、抽出するサンプリング点抽出部
    よりなり、単語音声の時間圧縮を各単語に対応してそれ
    ぞれ別個にサンプリングすることにより行なうことを特
    徴とする音声情報サンプリング装置。
JP52082584A 1977-07-12 1977-07-12 音声情報サンプリング装置 Expired JPS5944640B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP52082584A JPS5944640B2 (ja) 1977-07-12 1977-07-12 音声情報サンプリング装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP52082584A JPS5944640B2 (ja) 1977-07-12 1977-07-12 音声情報サンプリング装置

Publications (2)

Publication Number Publication Date
JPS5418203A JPS5418203A (en) 1979-02-10
JPS5944640B2 true JPS5944640B2 (ja) 1984-10-31

Family

ID=13778520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP52082584A Expired JPS5944640B2 (ja) 1977-07-12 1977-07-12 音声情報サンプリング装置

Country Status (1)

Country Link
JP (1) JPS5944640B2 (ja)

Also Published As

Publication number Publication date
JPS5418203A (en) 1979-02-10

Similar Documents

Publication Publication Date Title
JPS58130393A (ja) 音声認識装置
JPS6128998B2 (ja)
JPS60158498A (ja) パターン照合装置
JPS6312312B2 (ja)
JPS5944640B2 (ja) 音声情報サンプリング装置
JPS6129518B2 (ja)
JPS63502304A (ja) 高雑音環境における言語認識のためのフレ−ム比較法
JPH021317B2 (ja)
JPS61180297A (ja) 話者照合装置
JPS6131880B2 (ja)
JPS599080B2 (ja) 音声認識方法
JP2707577B2 (ja) ホルマント抽出装置
JPS6115440B2 (ja)
JPS6344239B2 (ja)
JPS58176699A (ja) 音声標準パタ−ン登録方式
JPS63223696A (ja) 音声パタ−ン作成方式
JPS61273599A (ja) 音声認識装置
JPH0316038B2 (ja)
JPS59195300A (ja) 音声認識装置
JPS5995597A (ja) 音声特徴パラメ−タ作成方式
JPS59204099A (ja) 音声認識方式
JPH01319099A (ja) 音声認識装置
JPS62133499A (ja) 音声認識装置
JPS6157995A (ja) 音声認識装置
JPH0784590A (ja) パターン追加登録装置