JP3411074B2 - 母音区間検出装置及び母音区間検出方法 - Google Patents

母音区間検出装置及び母音区間検出方法

Info

Publication number
JP3411074B2
JP3411074B2 JP32382293A JP32382293A JP3411074B2 JP 3411074 B2 JP3411074 B2 JP 3411074B2 JP 32382293 A JP32382293 A JP 32382293A JP 32382293 A JP32382293 A JP 32382293A JP 3411074 B2 JP3411074 B2 JP 3411074B2
Authority
JP
Japan
Prior art keywords
vowel
section
frame
feature vector
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP32382293A
Other languages
English (en)
Other versions
JPH07181993A (ja
Inventor
修司 久保田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP32382293A priority Critical patent/JP3411074B2/ja
Publication of JPH07181993A publication Critical patent/JPH07181993A/ja
Application granted granted Critical
Publication of JP3411074B2 publication Critical patent/JP3411074B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音節を単位として音声
を認識する日本語音声認識における母音区間検出を行う
母音区間検出装置及び母音区間検出方法に関する。
【0002】
【従来の技術とその課題】一般に日本語における5つの
母音はパワー、周波数スペクトルが安定した特徴を有
し、音声からの母音区間の検出に関する発明は数多く提
案されている。これらは、例えば、音声波形の包絡線安
定区間情報、ピッチ周波数情報、パワー情報、スペクト
ル特徴ベクトル情報、LPCケプストラム情報等の音声
情報を母音区間検出に利用するものである。しかしこれ
らの情報を利用する母音区間検出方法は単独では一長一
短があり、これらの複数の情報を併用して母音区間を検
出するのが一般的である。又、従来の母音区間検出方法
では、入力音声の母音の変化が緩やかな場合には安定し
た母音区間検出が行えないという問題点もあった。本発
明はこのような問題点を解決するためになされたもの
で、パワーの大小に影響されずに母音区間検出が行える
母音区間検出装置及び母音区間検出方法を提供すること
を目的とする。
【0003】
【課題を解決するための手段】本発明の母音区間検出装
置は、入力音声信号を周波数スペクトルの時系列パター
ンに変換する特徴量抽出手段と、上記特徴量抽出手段の
出力側に接続され上記入力音声信号から有音区間を検出
する有音区間検出手段と、上記有音区間検出手段の出力
側に接続され上記有音区間における上記特徴量からホル
マント近傍のスペクトル情報を抽出する特徴ベクトル変
換手段と、上記特徴ベクトル変換手段にて抽出されたス
ペクトル情報である時系列特徴ベクトルの各フレームの
フレーム間距離値に基づき母音区間境界を検出する母音
区間境界検出手段と、を備えた母音区間検出装置であっ
て、入力側が上記特徴ベクトル変換手段の出力側に接続
され出力側が上記母音区間境界検出手段の入力側に接続
され上記フレーム間距離値を上記時系列特徴ベクトルの
内積計算にて求めたフレーム間距離値を比較するフレー
ム間ベクトル比較手段と、を備え、上記母音区間境界検
出手段は、上記フレーム間距離値が所定数フレームにわ
たり連続して第1しきい値以上となるフレーム区間を第
1母音候補区間とし、該第1母音候補区間に連続する第
1母音候補区間以後のフレームに対しては上記第1しき
い値よりも低い値である第2しきい値以上の上記フレー
ム間距離値を連続して有するフレーム区間を第2母音候
補区間とし、上記第1母音候補区間と上記第2母音候補
区間との和を母音区間とする、ことを特徴とする。
【0004】
【作用】このように構成することで、フレーム間ベクト
ル比較手段は、時系列特徴ベクトルの各フレーム間にお
けるフレーム間距離値を上記時系列特徴ベクトルの内積
計算を行うことで求めることから、パワーの大小に影響
されずに母音区間検出を行い得るように作用する。
【0005】
【実施例】本発明の母音区間検出装置の一実施例につい
て図を参照しながら以下に説明する。図1に示すよう
に、本実施例の母音区間検出装置は、前処理部2、特徴
抽出部3、有音区間検出部4及び母音区間検出部5を設
け、母音区間検出部5は図2に示すように時系列特徴ベ
クトル変換部6、フレーム間ベクトル比較部7、母音境
界検出部8を設けている。
【0006】図1において、前処理部2にはマイクロフ
ォン1が接続され、前処理部2はマイクロフォン1を介
して供給される入力音声信号のゲインコントロール、高
域強調等の動作を行う。前処理部2の出力側に接続され
る特徴抽出部3は、上記入力音声信号から音声の周波数
スペクトル情報を抽出する動作を行うもので、例えば2
50〜6350Hzの範囲にて例えば中心周波数を1/
3オクターブ毎に配置した15チャンネルのバンドパス
フィルタ群を用いることができる。又、特徴抽出部3
は、フレーム周期を例えば10msecに設定すること
で時系列のスペクトル情報を得ることができる。特徴抽
出部3の出力側に接続される有音区間検出部4は、特徴
抽出部3にて得られたスペクトル情報及び入力音声信号
におけるパワー情報等を用いて有音区間を検出する動作
を行う。
【0007】有音区間検出部4の出力側は母音区間検出
部5に接続される。母音区間検出部5は、有音区間とし
て検出された音声スペクトル情報から母音区間を検出す
るものである。時系列特徴ベクトル変換部6は、上記1
5チャンネルのバンドパスフィルタから得られたスペク
トル情報をローカルピーク情報近傍の安定した時系列特
徴ベクトルに変換する。これは、上記15チャンネルの
バンドパスフィルタから得られたスペクトル情報には、
安定している母音区間にあっても騒音や発生変動等の不
安定要素が存在するからである。尚、上記時系列特徴ベ
クトルへの変換は、図3の(a)に示すように時間スペ
クトルからLSFL( Least Square Fit Line :最小自
乗法によるグラフ)を用いて行い、ホルマント近傍の安
定したスペクトルを得る。このようにして図3の(b)
に示すような時系列特徴ベクトル情報が得られる。尚、
このようにして得られた時系列特徴ベクトル情報の数フ
レーム分の状態を図4の(a)に示す。又、図4の
(b)は、上述した各バンドパスフィルタから得られた
時系列スペクトル情報を時系列特徴ベクトルに変換した
後の値を示したものである。
【0008】情報特徴ベクトル変換部6の出力側に接続
されるフレーム間ベクトル比較部7は、今回得られた上
記時系列特徴ベクトルと、一つ前のフレームにおける時
系列特徴ベクトルとを各フレーム毎に比較する。この比
較動作においては、従来一般的にフレーム間距離が使用
されるが、パワーの大小に応じて時系列特徴ベクトルの
大きさが変化し影響を与えるため、本実施例では時系列
特徴ベクトル間の角度に着目し時系列特徴ベクトル間の
内積をフレーム間距離とする。フレーム間ベクトル比較
部7は、例えば下記の数1に示すベクトル内積計算方法
に従い内積を計算しフレーム間距離を算出する。
【0009】
【数1】
【0010】フレーム間ベクトル比較部7の出力側に接
続される母音境界検出部8は、算出されたフレーム間距
離の大きさとしきい値との比較を行い、図5に示すよう
に、フレーム間距離の大きさが所定数αフレームにわた
り連続して第1しきい値th1以上となる場合にはこれ
らのフレーム区間を安定フレームとみなす。尚、上記所
定数αとしては2以上である。又、上記安定フレームの
区間を母音候補区間とすることもできる。さらに又、こ
のような安定フレームが検出された場合には、この区間
を第1母音候補区間とし、微小な発声変動による影響を
抑えるため、上記第1母音候補区間に連続するフレーム
についてはしきい値レベルを第1しきい値th1より値
を下げた第2しきい値th2を設定し該第2しきい値以
上の大きさを有するフレーム間距離のフレームを第2母
音候補区間とし、これらの第1母音候補区間と第2母音
候補区間との和を母音区間とみなすようにすることもで
きる。そしてフレーム間ベクトル比較部7は、このよう
にして母音候補区間を検出し、この母音候補区間におい
てさらにパワー値があるしきい値以上である区間を母音
と判別する。このようにして図5に示すように、本実施
例の母音区間検出装置は母音区間の境界を検出する。
【0011】尚、図6には本実施例における母音区間検
出装置の動作のフローチャートを示す。ステップ(図内
ではSにて示す)1ないしステップ4にて、上述した前
処理動作、特徴抽出、有音区間検出及び時系列特徴ベク
トル変換の各動作が行われる。ステップ5において、フ
レーム間距離が時系列特徴ベクトル間の内積を計算する
ことで算出される。ステップ6では、上記内積計算にて
求まったフレーム間距離の大きさとしきい値との比較に
基づき母音境界を検出する。
【0012】このように本実施例では、時系列特徴ベク
トル間の角度に着目し時系列特徴ベクトル間の内積をフ
レーム間距離とし、該フレーム間距離に基づいて母音区
間を検出するようにしたので、パワーの大小に影響され
ず母音検出を行うことができる。又、上述したように第
1しきい値、第2しきい値を設定することで、入力音声
の母音の変化が緩やかな場合であっても安定した母音区
間検出を行うことができる。
【0013】
【発明の効果】以上詳述したように本発明によれば、各
フレーム間におけるフレーム間距離値を上記時系列特徴
ベクトルの内積計算によって求めることから、パワーの
大小に影響されずに母音区間検出を行うことができる。
【図面の簡単な説明】
【図1】 本発明の母音区間検出装置の一実施例におけ
る構成を示すブロック図である。
【図2】 図1に示す、母音区間検出部の構成例を示す
ブロック図である。
【図3】 図2に示す、時系列特徴ベクトル変換部の動
作を説明するための図である。
【図4】 図2に示す、時系列特徴ベクトル変換部にて
得られる時系列特徴ベクトル情報を示す図である。
【図5】 本実施例の母音区間検出装置にて検出される
母音区間を示す図である。
【図6】 本実施例の母音区間検出装置の動作を示すフ
ローチャートである。
【符号の説明】
2…前処理部、3…特徴抽出部、4…有音区間検出部、
5…母音区間検出部、6…時系列特徴ベクトル変換部、
7…フレーム間ベクトル比較部、8…母音境界検出部。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭60−43697(JP,A) 特開 昭61−292699(JP,A) 特開 昭62−286097(JP,A) 特開 平4−293095(JP,A) 特開 平3−236100(JP,A) 特開 昭61−36798(JP,A) 特開 昭63−221396(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 11/02 G10L 11/06 G10L 15/02 G10L 15/04

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力音声信号を周波数スペクトルの時系
    列パターンに変換する特徴量抽出手段と、上記特徴量抽
    出手段の出力側に接続され上記入力音声信号から有音区
    間を検出する有音区間検出手段と、上記有音区間検出手
    段の出力側に接続され上記有音区間における上記特徴量
    からホルマント近傍のスペクトル情報を抽出する特徴ベ
    クトル変換手段と、上記特徴ベクトル変換手段にて抽出
    されたスペクトル情報である時系列特徴ベクトルの各フ
    レームのフレーム間距離値に基づき母音区間境界を検出
    する母音区間境界検出手段と、を備えた母音区間検出装
    置であって、 入力側が上記特徴ベクトル変換手段の出力側に接続され
    出力側が上記母音区間境界検出手段の入力側に接続され
    上記フレーム間距離値を上記時系列特徴ベクトルの内積
    計算にて求めたフレーム間距離値を比較するフレーム間
    ベクトル比較手段と、を備え、 上記母音区間境界検出手段は、上記フレーム間距離値が
    所定数フレームにわたり連続して第1しきい値以上とな
    るフレーム区間を第1母音候補区間とし、該第1母音候
    補区間に連続する第1母音候補区間以後のフレームに対
    しては上記第1しきい値よりも低い値である第2しきい
    値以上の上記フレーム間距離値を連続して有するフレー
    ム区間を第2母音候補区間とし、上記第1母音候補区間
    と上記第2母音候補区間との和を母音区間とする、 ことを特徴とする母音区間検出装置。
  2. 【請求項2】 入力音声信号を周波数スペクトルの時系
    列パターンに変換する特徴量抽出工程と、上記特徴量抽
    出工程の次工程であり上記入力音声信号から有音区間を
    検出する有音区間検出工程と、上記有音区間検出工程の
    次工程であり上記有音区間における上記特徴量からホル
    マント近傍のスペクトル情報を抽出する特徴ベクトル変
    換工程と、上記特徴ベクトル変換工程にて抽出されたス
    ペクトル情報である時系列特徴ベクトルの各フレームの
    フレーム間距離値に基づき母音区間境界を検出する母音
    区間境界検出工程と、を備えた母音区間検出方法であっ
    て、 上記特徴ベクトル変換工程の次工程であり上記母音区間
    境界検出工程の後工程に設けられ上記フレーム間距離値
    を上記時系列特徴ベクトルの内積計算にて求めたフレー
    ム間距離値を比較するフレーム間ベクトル比較工程と、 を備え、 上記母音区間境界検出工程は、上記フレーム間距離値が
    所定数フレームにわたり連続して第1しきい値以上とな
    るフレーム区間を第1母音候補区間とし、該第1母音候
    補区間に連続する第1母音候補区間以後のフレームに対
    しては上記第1しきい値よりも低い値である第2しきい
    値以上の上記フレーム間距離値を連続して有するフレー
    ム区間を第2母音候補区間とし、上記第1母音候補区間
    と上記第2母音候補区間との和を母音区間とする、 ことを特徴とする母音区間検出方法。
JP32382293A 1993-12-22 1993-12-22 母音区間検出装置及び母音区間検出方法 Expired - Fee Related JP3411074B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32382293A JP3411074B2 (ja) 1993-12-22 1993-12-22 母音区間検出装置及び母音区間検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32382293A JP3411074B2 (ja) 1993-12-22 1993-12-22 母音区間検出装置及び母音区間検出方法

Publications (2)

Publication Number Publication Date
JPH07181993A JPH07181993A (ja) 1995-07-21
JP3411074B2 true JP3411074B2 (ja) 2003-05-26

Family

ID=18158992

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32382293A Expired - Fee Related JP3411074B2 (ja) 1993-12-22 1993-12-22 母音区間検出装置及び母音区間検出方法

Country Status (1)

Country Link
JP (1) JP3411074B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580577B (zh) * 2020-12-28 2023-06-30 出门问问(苏州)信息科技有限公司 一种基于面部关键点生成说话人图像的训练方法及装置

Also Published As

Publication number Publication date
JPH07181993A (ja) 1995-07-21

Similar Documents

Publication Publication Date Title
US4933973A (en) Apparatus and methods for the selective addition of noise to templates employed in automatic speech recognition systems
US5025471A (en) Method and apparatus for extracting information-bearing portions of a signal for recognizing varying instances of similar patterns
JP3451146B2 (ja) スペクトルサブトラクションを用いた雑音除去システムおよび方法
CN108986844B (zh) 一种基于说话人语音特征的语音端点检测方法
US4885791A (en) Apparatus for speech recognition
JP3411074B2 (ja) 母音区間検出装置及び母音区間検出方法
JP3354252B2 (ja) 音声認識装置
JP2816163B2 (ja) 話者照合方式
JPH0449952B2 (ja)
JP3046029B2 (ja) 音声認識システムに使用されるテンプレートに雑音を選択的に付加するための装置及び方法
JPH0430040B2 (ja)
JPH03114100A (ja) 音声区間検出装置
JPH1097269A (ja) 音声検出装置及び方法
JP2989231B2 (ja) 音声認識装置
JPS6039695A (ja) 自動音声アクチビテイ検出方法および装置
JPH034918B2 (ja)
KR19980037190A (ko) 유성음 구간에서 프레임별 피치 검출 방법
JP2951333B2 (ja) 音声信号の区間判別方法
JPH0731506B2 (ja) 音声認識方法
JPH0311478B2 (ja)
JPS63223696A (ja) 音声パタ−ン作成方式
JP3008404B2 (ja) 音声認識装置
JPS62113197A (ja) 音声認識装置
JPH07104675B2 (ja) 音声認識方法
JPH0534678B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees