JPS5961900A - 音声入力装置 - Google Patents

音声入力装置

Info

Publication number
JPS5961900A
JPS5961900A JP57172898A JP17289882A JPS5961900A JP S5961900 A JPS5961900 A JP S5961900A JP 57172898 A JP57172898 A JP 57172898A JP 17289882 A JP17289882 A JP 17289882A JP S5961900 A JPS5961900 A JP S5961900A
Authority
JP
Japan
Prior art keywords
silent
section
speech
input
length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57172898A
Other languages
English (en)
Other versions
JPS63799B2 (ja
Inventor
伸 神谷
厚夫 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP57172898A priority Critical patent/JPS5961900A/ja
Publication of JPS5961900A publication Critical patent/JPS5961900A/ja
Publication of JPS63799B2 publication Critical patent/JPS63799B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は音声入力装置に関し、更に詳しくは、入力音声
の発声速度に応じて文節境界の判定基準を変更し得る音
声入力装置に関する。
一般に、音声入力装置おいては、入力音声の認識を行う
ために文節の境界を検出する必要があるが、この文節の
境界は、通常、文節と文節との間に存在する無音区間(
ポーズ)を検出することによって行われる。ところで、
音声中に現れる無音区間を大別すれば、上述の文節間無
音区間の他に、破裂音の前に存在する無音区間と、促音
を発声する際に生じる無音区間とがある。これらの無音
区間の長さは、文節間無音区間が最も長く、次いで促音
発声時無音区間、そして破裂音曲無音区間が最も短い。
従来の音声入力装置においては、無音区間を検出したと
き、その長さが一定のしきい値未満てあれば促音発声時
無音区間又は破裂音曲無音区間と判定し、しきい値以上
なら文節間無音区間として文節境界とみなしていた。と
ころが、入力音声の発声速度が異なれば、上述の各無音
区間の長さも当然界なり、一定のしきい値によゲで文節
間無音区間を判別するには限度があゲζ、音声認識の誤
り等の原因となっていた。
本発明は上記に鑑みなされたもので、入力音声の発声速
度に適応して文節間無音区間検出の為のしきい値を変化
し得る音声入力装置の提供を目的としている。
本発明の特徴とするところは、入力音声に含まれる母音
の継続時間長からその入力音声の発声速度を推定して、
その推定に基づいて文節間無音区間長のしきい値を算出
することにある。
以下、図面に基づいて本発明実施例の説明を行う。
第1図は本発明実施例の音声入力装置の全体構成を示す
ブロック図、第2図はその文節境界の検出に係る部分の
詳細構成を示すブロック図である。
第1図において、入力された音声は、まず音声分析部1
において、入力時刻むに関して、パワーPft)、スペ
クトルy(1)、スペクトル変化)” (11等の特徴
パラメータが抽出される。次いで発声速度検出部2にお
いて、その特徴パラメータから後述する如(平均発声速
度が推定され、文節境界検出部3ではその推定発声速度
に基づいて算出されるしきい値θと入力音声内の無音区
間長とを比較して、無音区間長がしきい値θを越えてい
る場合に限り、その無音区間を文節境界とみなしてその
旨を出力する。そして文節毎に区切られた音声ば音節区
間検出部4、音節認識部5を経て認識され、認識結果が
出力される。
第2図において、音声分析部1て抽出されたスペクトル
y (tlおよびスペクトル変化y ’ (gは、発声
速度検出部2の定常部検出部21に入力され、定常部検
出部21においては、所定の時間中W内の中心時刻tQ
におけるスベクi・ル変化y’  (to)がその時間
[1]W内での時刻1(、を除(他のスペクトル変化y
′(1)の最小値よりも小さい場合においてのみ、その
時刻toを入力音声定常部の中心点として検出し、その
定常部の中心点として検出された時刻LQにおけるスペ
クトルy(tu)とのスペクトル間距離が所定の値未;
苗である連続した音声区間の始点tbと終点teを検出
して、その区間を定常部と判定してその区間CL(tu
)=te−tbを出力して、toにおりるスペクトルy
(to)とともにマツチング部22に供給する。
マツチング部22では、定常部中心点として検出さhた
to、t)、・・・l  tnl ・・・の各時刻にお
りるスペクトルy (to)、y (L+)、・・・、
y(tn)、・・・を日本語の5母音標準パターン24
のスペクトルと比較し、そのスペクトル間距離が所定の
値未満であるときに限り、その定常部が母音の定常部で
あると判定し、その継続時間長L(tn)を出力する。
発声速度推定部23は、入力音声内の母音の継続時間長
とみなされた各L(tn)を入力して平均化して入力音
声内の母音の平均継続時間長τを算出し、あらかじめ人
力されて記1.aシている第3図に示す母音継続時間長
−発声速度対応表25を用いて、母音平均継続時間長り
を平均発声速度Vに換算して出力する。一方、音声分析
部1で抽出されたパワーP (tlは、文節境界検出部
3の無音区間検出部31に導入され、入力音声の無音区
間が検出される。無音区間検出部31は、検出した無音
区間の始点時刻tpとその無音区間の継続時間長I!p
を出力する。文節境界判定部32は、上述の入力音声の
平均発声速度Vを入力して、次の式によって文節間無音
区間のしきい値θを算出し、無音区間検出部3Iから出
力された無音区間継続時間長IV、pと比較する。
θ−に/V  (ただしkは定数) そして、Ap>θが成立すれば、その無音区間は文節間
無音区間であると判定し、その無音区間の中心点時刻t
p+lp/2を文節境界として出力する。
以上説明したように、本発明によれば、入力された音声
の母音継続時間長を検出することによって、その人力音
声の発声速度を推定し、その発声速度に基づいて文節間
無音区間長のしきい値が最適な値に設定される為、入力
音声の発声速度の相違に拘わらず、正確に文節境界を検
出することができる。
【図面の簡単な説明】
第1図は本発明実施例の全体構成を示すブロック図、第
2図はその要部詳細構成を示すブロック図、第3図はそ
の発声速度推定部に記憶された母音継続時間長−発声速
度対応表を示すグラフである。 ■・・・音声分析部、  2・・・音声速度検出部、3
・・・文節境界検出部、4・・・音節区間検出部、5・
・・音節認識部、  21・・・定常部検出部、22・
・・マツチング部、 23・・・発声速度推定1部、3
1・・・無音区間検出部、32・・・文節境界判定部。 特許出願人  シャープ株式会社 代 理 人  弁理士  西1) 新

Claims (1)

    【特許請求の範囲】
  1. 入力された音声中に含まれる母音の継続時間長を検出す
    る手段と、その母音継続時間長より入力音声の発声速度
    を推定する手段と、その発声速度に基づいて入力音声の
    文節間無音区間長のしきい値を算出する手段と、入力音
    声の無音区間を検出する手段を備え、検出された無音区
    間の長さが上記しきい値を越えたとき、その無音区間を
    文節境界と判定するよう構成された音声入力装置。
JP57172898A 1982-09-30 1982-09-30 音声入力装置 Granted JPS5961900A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57172898A JPS5961900A (ja) 1982-09-30 1982-09-30 音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57172898A JPS5961900A (ja) 1982-09-30 1982-09-30 音声入力装置

Publications (2)

Publication Number Publication Date
JPS5961900A true JPS5961900A (ja) 1984-04-09
JPS63799B2 JPS63799B2 (ja) 1988-01-08

Family

ID=15950378

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57172898A Granted JPS5961900A (ja) 1982-09-30 1982-09-30 音声入力装置

Country Status (1)

Country Link
JP (1) JPS5961900A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6472198A (en) * 1987-09-11 1989-03-17 Nippon Telegraph & Telephone Voice data storage
WO2018016143A1 (ja) * 2016-07-22 2018-01-25 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6472198A (en) * 1987-09-11 1989-03-17 Nippon Telegraph & Telephone Voice data storage
WO2018016143A1 (ja) * 2016-07-22 2018-01-25 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JPWO2018016143A1 (ja) * 2016-07-22 2019-06-27 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Also Published As

Publication number Publication date
JPS63799B2 (ja) 1988-01-08

Similar Documents

Publication Publication Date Title
US8140330B2 (en) System and method for detecting repeated patterns in dialog systems
JPS5961900A (ja) 音声入力装置
JP3588929B2 (ja) 音声認識装置
JP2006010739A (ja) 音声認識装置
KR100350003B1 (ko) 음성신호로부터워드를결정하는시스템
JPS59149400A (ja) 音声入力装置
JPH03114100A (ja) 音声区間検出装置
JPH04115299A (ja) 音声有音無音判定方法および装置
JP2001042889A (ja) 音声認識入力音声の音程正規化装置
JP3049711B2 (ja) 音声処理装置
JPS60129796A (ja) 音声入力装置
JP3519852B2 (ja) 文音声変換方法ならびに文音声変換装置における息継ぎ位置決定方法
KR100345402B1 (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
JPS5936759B2 (ja) 音声認識方法
JPS60198596A (ja) 音声入力装置
JPS63217399A (ja) 音声区間検出装置
JPS5969798A (ja) ピツチ抽出方法
JPH0413719B2 (ja)
JPS5925240B2 (ja) 音声区間の語頭検出方式
JPH0558552B2 (ja)
JPS62280800A (ja) 破裂子音識別方式
JPS63191199A (ja) 有声破裂子音識別装置
JPS6039699A (ja) 音声認識方法
JPS63155199A (ja) 無声音検出方法
JPH01158499A (ja) 定常雑音除去方式