JPH045198B2 - - Google Patents

Info

Publication number
JPH045198B2
JPH045198B2 JP57227708A JP22770882A JPH045198B2 JP H045198 B2 JPH045198 B2 JP H045198B2 JP 57227708 A JP57227708 A JP 57227708A JP 22770882 A JP22770882 A JP 22770882A JP H045198 B2 JPH045198 B2 JP H045198B2
Authority
JP
Japan
Prior art keywords
speech
section
input signal
voice
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP57227708A
Other languages
English (en)
Other versions
JPS59121099A (ja
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to JP57227708A priority Critical patent/JPS59121099A/ja
Publication of JPS59121099A publication Critical patent/JPS59121099A/ja
Publication of JPH045198B2 publication Critical patent/JPH045198B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は連続発声される入力音声信号の音声区
間を所謂舌うち音や息もれの影響を受けることな
しに確実に検出することのできる音声区間検出装
置に関する。
〔発明の技術的背景とその問題点〕
連続的に発声入力される音声を認識するに際し
て、音声区間を正確に検出することが非常に重要
である。しかして従来、この音声区間検出は、大
別して次のようにして行われている。即ち、第1
の方式は、入力信号のパワーに着目して2つの閾
値を利用し、一方の閾値にて確実に音声が存在す
る区間を検出したのち他方の閾値を用いて正確な
音声区間を求めるものである。然し乍ら、このよ
うな方式によると、パワーの大きいパルス性の雑
音までも音声として誤判定してしまうと云う問題
があつた。
これに対して第2の方式として、入力信号の零
交差回数やそのスペクトル概形が背景雑音と異る
ことを利用して、雑音と区別可能な特徴パラメー
タを用いて音声区間を判定するものがある。とこ
ろが、この方式にあつては、有声音や無声音を含
んで種々変化する音声を決定的に特徴ずけるパラ
メータが見出されていない為、前述した第1の方
式に比較して若干の改良が認められるに過ぎな
い。
そこで最近では、入力音声の周波数的特徴パラ
メータを利用して音韻分類を行い、入力信号のパ
ワー情報とを併用して音声区間検出を行うことが
検討されている。つまり、音韻の周波数構造を予
め知識として装置に登録しておき、雑音の周波数
構造が音韻のそれと似ていないことを利用するも
ので、例れば入力信号のパワー情報から求められ
る音声候補区間について音韻分類を行い、これに
よつて求められた音韻ラベルの時系列に基づいて
音声区間であるか否かを判定するものである。
ところが、この音韻分類は音響分析における或
る時刻の周波数構造を調べるだけのものであるか
ら、例えば音韻/t∫/や/s/と似た周波数構造
を持つ所謂舌うち音や、音韻/h/と同様な周波
数構造の息漏れを雑音を誤判定して、誤つた音韻
ラベル付けが行われる等の不具合があつた。この
ようにして音韻ラベル付けにおいて誤りが混入す
ると、その後の処理において音韻ラベルの時間的
構造を調べても、雑音を除去することができなく
なると云う問題が生じた。このような、従来にあ
つては、連続的に入力される音声信号の音声区間
を正しく判定検出することが非常に困難であつ
た。
〔発明の目的〕
本発明はこのように事情を考慮してなされたも
ので、その目的とするところは、舌うち音や息も
れ等の雑音に左右されることなしに入力信号中の
音声区間を正しく、しかも安定に検出することの
できる音声区間検出装置を提供することにある。
〔発明の概要〕
本発明は、音声区間の開始時点および終了時点
をそれぞれ含む部分区間における特徴パラメータ
の時間構造を標準パターンとして予め登録してお
き、入力信号を分析して求められる特徴パラメー
タの時系列と上記標準パターンとの類似度をそれ
ぞれ計算して、その類似度値に従つて入力信号の
音声区間の始端点とをそれぞれ判定検出するよう
にしたものである。
〔発明の効果〕
かくして本発明によれば、音声区間の始端点お
よび終端点の周波数的特徴構造のみならず、その
時間的な構造も特徴パラメータレベルとして標準
パターンとして与えられるので、音声とは周波数
的構造が似ているが、時間的構造を異にする舌う
ち音や息もれ等の雑音を高精度に除外して、その
音声区間の始端点および終端点をそれぞれ正確
に、しかも安定に判定して入力信号中の音声区間
を検出することが可能となる。故に、正しく検出
された音声区間に従つて、その音声認識を確実に
行わしめることが可能となる等の実用上絶大なる
効果が奏せられる。
〔発明の実施例〕
以下、図面を参照して本発明の一実施例につき
説明する。
第1図は実施例装置の概略構成図であり、1は
音響分析部である。この音響分析部1は、例えば
音声帯域を2〜8程度に分けた複数の帯域通過フ
イルターからなる周知のフイルターバンクからな
り、入力信号をスペクトラム分析して一時時間毎
に周波数に対応した特徴パラメータを求めてこれ
を保持している。この音響分析部1を介して求め
られた入力信号の特徴パラメータ時系列が類似度
計算部2に与えられ、標準パターン記憶部3に予
め登録された標準パターンとの類似度が計算され
る。しかして、上記記憶部3に予め登録される標
準パターンは、標準音声の音声区間の開始時点お
よび終了時点をそれぞれ含む部分区間の、特徴パ
ラメータの時系列として与えられるものである。
尚、この標準パターンを為す特徴パラメータの時
間的サンプル法は、所定の分析時間に対して連続
的に取出しても良いが、不連続に決定されたもの
であつても良く、要はその端点位置が部分区間の
時間方向の中央に位置付けられるようにすればよ
い。
しかして、始端点に着目すれば、日本語音声の
場合には約100音節が異なる音声パターンを持つ
が、前述した帯域分割による周波数的特徴を抽出
したとき、前舌母音内と後舌母音内とを特に区別
する必要がなくなる。従つてこの場合には、約数
十種類程度の標準パターンを準備すれば、日本語
入力音声の始端点検出を十分確実に行うことが可
能となる。また、装置が取扱う語彙が予め定つて
いるような場合には、各単語に応じた標準パター
ンを準備しておくだけで、その目的が達成され
る。一方、終端点を含む部分区間における標準パ
ターンについては、音声の終端側はその構造から
して母音であること、また無声化の場合には区別
を要しない母音もあることから、数種の標準パタ
ーンのみを準備するだけでよい。
類似度計算部3は、このようにして定められた
各標準パターンに対して、或る時刻における入力
信号の特徴パラメータ時系列との類似度を計算す
るものである。この類似度計算は、例れば複合類
似度計算法を用いる等して、パターンマツチング
的に行われる。しかして、類似度計算部3は、こ
の類似度計算を入力信号の分析時間毎に、複数の
標準パターンに対してそれぞれ行つており、これ
によつて各標準パターンに対する類似度の時系列
が求められている。判定部4は、このような類似
度の時系列を入力し、各標準パターン毎に予め定
められている閾値を越え、且つ極大値をとる類似
度値が得られる時点を音声区間の端点、つまり始
端点または終端点として判定検出している。この
始端点または終端点は、それぞれ始端点を含む部
分区間の標準パターン、および終端点を含む部分
区間の標準パターンによつて相互に独立に求めら
れることは云うまでもない。このようにして音声
の始端点と終端点とが検出され、これらによつて
入力信号中の音声区間が示されることになる。
尚、始端点および終端点が複数個存在する場合に
は、その組合せによつて音声区間が示されること
になる。
第2図は、上述した一連の区間検出処理を示す
制御フローで、音声信号の入力が行われている期
間順次所定の分析時間毎に入力信号の特徴パラメ
ータを抽出する(ステツプ11)。そして或る時間
毎に上記特徴パラメータの時系列の抽出し(ステ
ツプ12)、その時系列と標準パターンとの類似度
を計算する(ステツプ13)。その後、この類似度
値に従つて音声区間の始端点と終端点をそれぞれ
判定すればよい(ステツプ14)。つまり、第3図
に示すように入力信号の時系列に対して部分区間
毎に、それが始端点であるか終端点であるか、更
にはそれ以外であるかを、標準パターンとのマツ
チングによつて判定検出すればよい。
尚、本発明は上記実施例に限定されるものでは
ない。例えば端点が部分区間の時間方向中心から
ずれた標準パターンを用いる場合には、端点検出
した部分区間から、上記ずれの分を補正して端点
位置を求めなければならないことは勿論である。
また入力信号のパワーから、明らかに無音区間で
ある部分を検出し、この検出無音区間を除く部分
を音声候補区間として取出し、この区間について
のみ前述した類似度計算を行うようにすれば、計
算量を少なくすることができる。その他、本発明
はその要旨を逸脱しない範囲で種々変形して実施
することができる。
以上説明したように本発明によれば、端点を含
む部分区間の特徴パラメータの時間構造を標準パ
ターンとして備え、入力信号の特徴パラメータ時
系列とのパターンマツチングを行い、その類似度
から音声区間の始端点とを検出するので、舌うち
音や息漏れ等の雑音に左右されることなく、その
時間的構造から正しく音声区間を検出することが
でき、その検出精度も高くて安定である。これ
故、連続発声されて入力される音声の存在区間を
正しく判定して、その認識処理を効果的に行うこ
とが可能となり、実用上絶大なる効果が奏せられ
る。
【図面の簡単な説明】
第1図は本発明の一実施例装置の概略構成図、
第2図は実施例に係る音声区間検出処理の流れを
示す図、第3図は入力信号と部分区間との関係を
示す図である。 1……音響分析部、2……類似度計算部、3…
…特徴パラメータ記憶部、4……判定部。

Claims (1)

  1. 【特許請求の範囲】 1 入力信号を一定時間毎に分析してその特徴パ
    ラメータを求める音響分析部と、音声区間の開始
    時点および終了時点を含む部分区間における特徴
    パラメータの時間構造を標準パターンとして記憶
    した記憶部と、この標準パターンと前記入力信号
    の特徴パラメータ時系列との類似度をそれぞれ計
    算する手段と、計算された類似度値から前記入力
    信号の音声区間の始端点と終端点とをそれぞれ判
    定検出する手段とを具備したことを特徴とする音
    声区間検出装置。 2 類似度計算は入力信号のパワーから判定され
    る音声候補区間の特徴パラメータ時系列に対して
    行われるものである特許請求の範囲第1項記載の
    音声区間検出装置。 3 特徴パラメータの時間構造は、音声の始端点
    および終端点を含む部分区間における音声の周波
    数・時間構造として音声パターンを表わしたもの
    である特許請求の範囲第1項記載の音声区間検出
    装置。
JP57227708A 1982-12-28 1982-12-28 音声区間検出装置 Granted JPS59121099A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57227708A JPS59121099A (ja) 1982-12-28 1982-12-28 音声区間検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57227708A JPS59121099A (ja) 1982-12-28 1982-12-28 音声区間検出装置

Publications (2)

Publication Number Publication Date
JPS59121099A JPS59121099A (ja) 1984-07-12
JPH045198B2 true JPH045198B2 (ja) 1992-01-30

Family

ID=16865103

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57227708A Granted JPS59121099A (ja) 1982-12-28 1982-12-28 音声区間検出装置

Country Status (1)

Country Link
JP (1) JPS59121099A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011142844A2 (en) 2010-02-16 2011-11-17 The Boeing Company Aerodynamic structure having a ridged solar panel and an associated method
EP2589771A2 (en) 2011-11-02 2013-05-08 Honda Motor Co., Ltd. Outboard engine unit

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60225197A (ja) * 1984-04-20 1985-11-09 三洋電機株式会社 音声認識装置
JPH0297998A (ja) * 1988-10-05 1990-04-10 Sekisui Chem Co Ltd 音声判定方式
JP4557919B2 (ja) 2006-03-29 2010-10-06 株式会社東芝 音声処理装置、音声処理方法および音声処理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011142844A2 (en) 2010-02-16 2011-11-17 The Boeing Company Aerodynamic structure having a ridged solar panel and an associated method
EP2589771A2 (en) 2011-11-02 2013-05-08 Honda Motor Co., Ltd. Outboard engine unit

Also Published As

Publication number Publication date
JPS59121099A (ja) 1984-07-12

Similar Documents

Publication Publication Date Title
EP0237934B1 (en) Speech recognition system
US4078154A (en) Voice recognition system using locus of centroid of vocal frequency spectra
EP0200347A1 (en) Knowledge-guided automatic speech recognition apparatus and method
US4885791A (en) Apparatus for speech recognition
JPH045198B2 (ja)
Glass et al. Detection and recognition of nasal consonants in American English
JPH0558553B2 (ja)
Ghaemmaghami et al. Noise robust voice activity detection using normal probability testing and time-domain histogram analysis
JPS58108590A (ja) 音声認識装置
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
JPH0682275B2 (ja) 音声認識装置
JPS63226691A (ja) 標準パターン作成方式
JP2882791B2 (ja) パターン比較方式
JPS5885495A (ja) 音声認識装置
JPH0376471B2 (ja)
JP2892004B2 (ja) 単語音声認識装置
JP2901976B2 (ja) パターン照合予備選択方式
JPS5936300A (ja) 音声認識装置
JP2844592B2 (ja) 離散単語音声認識装置
JPS63249198A (ja) 基準データの登録用の検査機構を持った音声制御認識方式
JPH0640274B2 (ja) 音声認識装置
JPS60115996A (ja) 音声認識装置
JPH02232698A (ja) 音声認識装置
JPS6136798A (ja) 音声セグメンテ−シヨン法
JPS6317499A (ja) 単語音声認識方式