JPS6377095A - 音声区間の始端検出装置 - Google Patents

音声区間の始端検出装置

Info

Publication number
JPS6377095A
JPS6377095A JP61223147A JP22314786A JPS6377095A JP S6377095 A JPS6377095 A JP S6377095A JP 61223147 A JP61223147 A JP 61223147A JP 22314786 A JP22314786 A JP 22314786A JP S6377095 A JPS6377095 A JP S6377095A
Authority
JP
Japan
Prior art keywords
voice
section
maximum
speech
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61223147A
Other languages
English (en)
Other versions
JP2625682B2 (ja
Inventor
北野 正明
正宏 浜田
博之 直野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61223147A priority Critical patent/JP2625682B2/ja
Publication of JPS6377095A publication Critical patent/JPS6377095A/ja
Application granted granted Critical
Publication of JP2625682B2 publication Critical patent/JP2625682B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、音声認識装置へ音声を入力するたに用いられ
る音声区間検出装置に関するものである。
従来の技術 近年、音声認識等の音声情報処理、およびLSIの技術
の発達に伴い、音声認識装置は民生機器、産業機器等に
利用され始め、この音声認識装置への入力に用いられる
音声区間検出装置も種々研究されてきた(例えば、特公
昭558−120297号公報)。
以下図面を参照しながら、上述した従来の音声区間検出
装置の一例について説明する。
第3図は従来の音声区間検出装置の一例のブロック図を
示すものである。
第3図において、2は入力音声の始端を検出する始端判
定部、3は入力音声の終端を検出する終端判定部である
以上のように構成された音声区間検出装置について、以
下その動作を説明する。
まず、始端判定部2は入力音声のエネルギーをあらかじ
め与えられた閾値と比較して、始端を決定する。次に終
端判定部3は入力音声のエネルギーをあらかじめ与えら
れた閾値と比較して、終端を決定する。
発明が解決しようとする問題点 しかしながら、上記のような構成では、入力音声のレベ
ルのばらつきに対して検出された始端。
終端にも、ばらつきがあり、高品質の音声認識装置を実
現する障害になるという問題点を有していた。
本発明は上記問題点に鑑み、入力音声のレベルのばらつ
きによる区間検出のばらつきを補正して、高品質の音声
区間検出装置を提供するものである。
問題点を解決するための手段 上記問題点を解決するために本発明の音声区間検出装置
は、入力音声を常時蓄えるメモリバッファと、入力音声
の最大エネルギーを検出する最大音声検出部と、入力音
声の最大エネルギーによって音声検出の閾値を設定する
閾値設定部と、設定された閾値により音声の始端、終端
を検出する始端判定部、終端判定部とを備えた構成とな
っている。
作  用 本発明は上記した構成によって、まず入力音声データを
全てメモリバッファに蓄える。一方、同時に始端判定部
は音声区間の始端を、終端判定部は紙端を判定する。ま
た最大音声検出部は、入力音声をこれまでの最大値かつ
極大値だと判定すると閾値設定部は、新しい音声検出の
閾値を設定し、また以前に判定された始端から現時点ま
で、新しい音声検出の閾値によって始端の判定を行ない
直し、および終端の判定を行う。
実施例 以下本発明の一実施例の音声区間検出装置について、図
面を参照しながら説明する。
第1図は本発明の一実施例音声区間検出装置のブロック
図、第2図は同動作を示すフローチャートである。
第1図において、1はメモリバッファであり、入力音声
を常時記憶する。なお、メモリバッファ1は、ループ状
になっており、メモリサイズは、認識装置の認識対象単
語長の最大のものが格納できる大きさである。終端が検
出されるまで、このメモリバッフ11に入力音声は記憶
され続けられる。2は始端判定部であり、入力音声のエ
ネルギー、あるいは―メモリバッファ1に蓄えられてい
る音声のエネルギーを閾値と比較して入力音声の始端を
決定する。3は終端判定部であり、入力音声のエネルギ
ー、あるいはメモリバッファに蓄えられている音声のエ
ネルギーを閾値と比較して終端を決定し、メモリバッフ
ァ1から、始端から終端までの音声データを出力させる
。4は最大音声検出部であり、入力音声のその時点まで
の最大かつ極大エネルギー全検出して、閾値設定部5へ
最大エネルギーを送り、始端判定部2.終端判定部3で
は、新しく設定された閾値により、以前に始端判定部2
で決められた始端以降、現時点までの音声エネルギーを
バック7メモリ1より読み込み始端検出あるいは終端検
出を行う。
以上のように構成された音声区間検出装置について、以
下第1図および第2図を用いてその動作を説明する。
尚、第2図においては、ステップ番号(以下Sという)
を用いて説明する。
1フレーム音声入力があると(S11)、この入力音声
をメモリバッファ1に書き込む(S12)。
また同時にこの入力音声の音声エネルギーを最大音声検
出部4で判定して(Sl 3 )、入力音声エネルギー
が最大であれば、閾値設定部6で閾値の設定を行う(3
15)。そして、始端判定部2、終端判定部3では始端
、終端の判定を行ない(S1e)、終端であれば、音声
区間検出は終了し、終端でない場合は(S11)に戻り
1次のフレームの入力を待つ(317)。
一方、入力音声の音声エネルギーを最大音声検出部4で
判定して(S13)、入力音声エネルギーが最大でない
場合、さらに最大音声検出部4で最大の次のフレームを
判定する(S14)。ここで最大の次のフレームと判定
された場合、以前に決定された始点から現時点まで(S
19)、メモリバッファ1から音声エネルギーを読み出
しく31s)、始端判定部2.終端判定部3により、始
端の判定を行ない直し、および終端の設定を行なう(S
20)。最大音声検出部4で最大音量の次のフレームと
判定されなかった場合、始端判定部2.終端判定部3に
より、始端、終端の判定を行なう(S1e)。
以上のように本実施例によれば、入力音声をメモリバッ
ファ1に蓄え、最大音声検出部4で検出された音声最大
エネルギーを閾値設定部5により音声検出の閾値を設定
して音声区間を検出することにより、高品質の音声区間
検出を行なうことができる。さらに最大音声検出部4で
は音声エネルギーの最大かつ極大を検出次第、始端判定
部2゜終端判定部3によりメモリバッファ1に格納され
ている音声エネルギーの判定を行なうので、リアルタイ
ムで音声区間検出を行なうことができる。
またメモリバッファ1は、ループ状に入力音声を記憶す
るため、メモリの容量が音声認識装置の認識対象単語の
なかで最長のものが格納できる大きさですみ、小さい容
量のメモリで良い。
発明の効果 本発明は、入力音声をメモリバッファに蓄え、最大音声
検出部で検出された音声最大エネルギーを閾値設定部に
より音声区間検出の閾値を設定して音声区間を検出する
ことにより、高品質の音声区間検出を行なうことができ
る。また最大音声検出部では、始端判定部、終端判定部
により、メモリバッフ1に格納されている音声エネルギ
ーの判定を行なうので、リアルタイムで音声区間検出を
行なうことができる。さらに本発明のメモリバッファは
、ループ状に入力音声を記憶するためメモリの容量が音
声認識装置の認識対象単語のなかで最長のものが格納で
きる大きさですむ等、数々の優れた効果を得ることので
きる音声区間検出装置を実現できるものである。
【図面の簡単な説明】
第1図は本発明の一実施例における音声区間検出装置の
ブロック図、第2図は本発明の一実施例における音声区
間検出装置の動作を示すフローチャート、第3図は従来
の音声区間検出装置のブロック図である。 1・・・・・・メモリバッファ、2・・・・・・始端判
定部、3・・・・・・終端判定部、4・・・・・・最大
音声検出部、5・・・・・・閾値設定部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第 2 図 第3図

Claims (4)

    【特許請求の範囲】
  1. (1)入力音声を常時蓄えるメモリバッファと、前記入
    力音声の最大エネルギーを検出する最大音声検出部と、
    前記入力音声の最大エネルギーによって音声検出の閾値
    を設定する閾値設定部と、設定された閾値により音声の
    始端、終端を判定する始端判定部、終端判定部とを備え
    たことを特徴とする音声区間検出装置。
  2. (2)メモリバッファは、ループ状に入力音声を記憶す
    ることを特徴とする特許請求の範囲第1項記載の音声区
    間検出装置。
  3. (3)メモリバッファは、そのメモリの容量を音声認識
    装置の認識対象単語のなかで最長のものが格納できる大
    きさであることを特徴とする特許請求の範囲第1項記載
    の音声区間検出装置。
  4. (4)始端判定部および終端判定部は、入力されてくる
    音声の始端、終端を判定すると同時に、前記最大音声検
    出部が、入力されてきた音声中において、これまでの最
    大値かつ極大値を検出した時点で、閾値設定部によって
    新しく設定された閾値を用いて、以前に判定された始端
    から現時点までの範囲で、新たな始端および終端の判定
    を行ない直すことを特徴とする特許請求の範囲第1項記
    載の音声区間検出装置。
JP61223147A 1986-09-19 1986-09-19 音声区間の始端検出装置 Expired - Lifetime JP2625682B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61223147A JP2625682B2 (ja) 1986-09-19 1986-09-19 音声区間の始端検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61223147A JP2625682B2 (ja) 1986-09-19 1986-09-19 音声区間の始端検出装置

Publications (2)

Publication Number Publication Date
JPS6377095A true JPS6377095A (ja) 1988-04-07
JP2625682B2 JP2625682B2 (ja) 1997-07-02

Family

ID=16793520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61223147A Expired - Lifetime JP2625682B2 (ja) 1986-09-19 1986-09-19 音声区間の始端検出装置

Country Status (1)

Country Link
JP (1) JP2625682B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0374437A (ja) * 1989-08-14 1991-03-29 Idemitsu Kosan Co Ltd 易滑性フィルム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101636784B (zh) 2007-03-20 2011-12-28 富士通株式会社 语音识别系统及语音识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5797599A (en) * 1980-12-10 1982-06-17 Matsushita Electric Ind Co Ltd System of detecting final end of each voice section
JPS59111697A (ja) * 1982-12-17 1984-06-27 株式会社日立製作所 音声認識方式
JPS60499A (ja) * 1983-06-17 1985-01-05 カシオ計算機株式会社 音声認識装置におけるしきい値設定方式
JPS6039691A (ja) * 1983-08-13 1985-03-01 電子計算機基本技術研究組合 音声認識方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5797599A (en) * 1980-12-10 1982-06-17 Matsushita Electric Ind Co Ltd System of detecting final end of each voice section
JPS59111697A (ja) * 1982-12-17 1984-06-27 株式会社日立製作所 音声認識方式
JPS60499A (ja) * 1983-06-17 1985-01-05 カシオ計算機株式会社 音声認識装置におけるしきい値設定方式
JPS6039691A (ja) * 1983-08-13 1985-03-01 電子計算機基本技術研究組合 音声認識方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0374437A (ja) * 1989-08-14 1991-03-29 Idemitsu Kosan Co Ltd 易滑性フィルム

Also Published As

Publication number Publication date
JP2625682B2 (ja) 1997-07-02

Similar Documents

Publication Publication Date Title
JPS6377095A (ja) 音声区間の始端検出装置
JP3024447B2 (ja) 音声圧縮装置
JPS62150295A (ja) 音声認識方法
JP2002073061A (ja) 音声認識装置及びその方法
JPS60499A (ja) 音声認識装置におけるしきい値設定方式
JP3385094B2 (ja) 携帯型情報端末
JPS6332596A (ja) 音声認識装置
JP3031081B2 (ja) 音声認識装置
JPS60159899A (ja) 学習機能付音声認識装置
JPS59124399A (ja) 音声認識装置
CN112837680A (zh) 音频关键词检索方法、智能外呼方法及相关装置
JPS62173496A (ja) 標準パタン登録回路
JP2999479B2 (ja) 音声認識装置の辞書更新方式
JPS63285595A (ja) 音声検出装置
JPS6057897A (ja) 音声区間検出用閾値の設定方法
JPS62102296A (ja) 音声編集装置
JPH1153163A (ja) 音声伝言メモ装置
JPS61105597A (ja) 連続音声認識装置
JPS6078491A (ja) 辞書更新方式
JPH04371032A (ja) デジタルデータ処理回路
JPS61261798A (ja) 音声認識装置
JPS58105200A (ja) 音声区間検出装置
JPS58116595A (ja) 単語音声認識装置
JPS59219798A (ja) 音声認識装置
JPS60185998A (ja) 音声認識装置における辞書更新方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term